CDA数据分析师一级经典错题知识点总结(5)
1、数值型缺失值用中位数增补,分类数据用众数增补。2、偏态系数>1就是高度偏,0.5到1是中度。
3、分布和查验
在 t查验之前举行 F查验的目标是确保 t查验的方差齐性假设创建。如果 F查验结果体现方差不相当,则必要切换到调解后的 t 查验(Welch t查验),以得到更准确的分析结果。
分布范例 常用查验方法 实用场景 正态分布 正态性查验 判定数据分布情势,作为后续分析条件 卡方分布 卡方查验、方差查验 分析分类数据的独立性或分布拟合优度 t分布 t查验 小样本均值比力,数据需服从正态分布 F分布 方差分析(ANOVA)、回归方程的显着性查验 多组数据均值比力,数据需服从正态分布 均值:
t查验是样本均值查验,比力均值差异。
z查验用于大样本(样本量 > 30)或已知总体尺度差的情况。比方,比力都会住民的匀称收入是否到达天下匀称程度。
方差:
F查验,比力两个样本的方差是否相当、是用于判定t查验的条件,以是F在t前。
方差分析查验,用于比力三个及以上组的均值是否相当。比方,差异都会对某商品满足度的差异。
Pearson相干性查验:
[*]用于查验两个变量是否呈线性相干,实用于正态分布的数据。
Spearman秩相干性查验:
[*]替换Pearson相干性查验,用于非正态分布数据或品级数据。
分布:
卡方分布查验:
用于离散型数据,查验实际分布与理论分布是否划一。比方,查验某观察数据与预期比例的符合程度。
分类:
卡方查验(Chi-square test):
[*]查验分类变量之间的独立性。比方,分析性别与购物偏好是否相干。
4、箱线图 从小到大分列
Q1代表1/4分位点,Q3代表3/4分位点,Q1<Q3。
中位数在Q1和Q3之间,Q3-Q1=1QR,此中Q1-1.5(1QR) 为下限
Q3
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]