正态分布(高斯分布)
简介
正态分布(也称为高斯分布)是一种非常重要的概率分布,它描述了许多自然和人为现象的数据分布情况。正态分布的形状呈钟形,其峰值位于平均值处,两侧对称降落。
特征
正态分布可以用两个参数来完全描述:
均值(μ):表现数据的平均值,分布的峰值位于 μ 处。
尺度差(σ):表现数据的离散程度,数值越大,分布越平坦。
天生正态分布数据
NumPy 提供了 random.normal() 函数来天生服从正态分布的随机数。该函数接受以下参数:
loc:正态分布的均值,默认为 0。
scale:正态分布的尺度差,默认为 1。
size:输出数组的形状。
示例:天生 100 个服从正态分布的随机数,均值为 5,尺度差为 2:- import numpy as np
- data = np.random.normal(loc=5, scale=2, size=100)
- print(data)
复制代码 可视化正态分布
Seaborn 库提供了便捷的函数来可视化分布,包罗正态分布。
示例:绘礼服从正态分布的数据的分布图:- import seaborn as sns
- import numpy as np
- data = np.random.normal(size=1000)
- sns.distplot(data)
- plt.show()
复制代码 应用
正态分布在许多范畴都有应用,比方:
统计学:用于推断总体参数,进行假设检验等。
呆板学习:用于数据预处理,特征工程等。
金融:用于建模股票价格、汇率等金融数据。
工程:用于控制质量、可靠性分析等。
训练
- 天生 500 个服从正态分布的随机数,均值为 10,尺度差为 3,并绘制它们的分布图。
- 比较差异尺度差下正态分布形状的变化。
- 使用正态分布来模拟一次考试结果,并计算平均分和尺度分。
解决方案
- import seaborn as sns
- import numpy as np
- import matplotlib.pyplot as plt
- # 1. 生成服从正态分布的随机数并绘制分布图
- data = np.random.normal(loc=10, scale=3, size=500)
- sns.distplot(data)
- plt.show()
- # 2. 比较不同标准差下正态分布形状的变化
- sns.distplot(np.random.normal(size=1000, scale=1), label="σ=1")
- sns.distplot(np.random.normal(size=1000, scale=2), label="σ=2")
- sns.distplot(np.random.normal(size=1000, scale=3), label="σ=3")
- plt.legend()
- plt.show()
- # 3. 模拟考试成绩并计算平均分和标准分
- scores = np.random.normal(loc=80, scale=10, size=100)
- print("平均分:", scores.mean())
- print("标准分:", (scores - scores.mean()) / scores.std())
复制代码 表明:
在第一个训练中,我们天生了 500 个服从正态分布的随机数,均值为 10,尺度差为 3,并使用 Seaborn 的 distplot() 函数绘制了它们的分布图。
在第二个训练中,我们天生了三个服从正态分布的数据集,分别设置尺度差为 1、2 和 3,并使用 Seaborn 的 distplot() 函数绘制了它们的分布图。我们可以观察到,随着尺度差的增加,分布变得更加平坦,两侧的尾巴更加显着。
在第三个训练中,我们模拟了一次考试结果,假设结果服从正态分布,均值为 80,尺度差为 10。然后,我们计算了考试结果的平均分和尺度分。
最后
为了方便其他设备平静台的小伙伴观看往期文章:
微信公众号搜索:Let us Coding,关注后即可获取最新文章推送
看完如果觉得有帮助,欢迎点赞、收藏、关注
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |