最常用的描述变量分布:均值和标准差 |
您所在的位置:网站首页 › 怎样理解二项分布的平均数和标准差的概念 › 最常用的描述变量分布:均值和标准差 |
目录0 导言:描述中心和幅度的两种方式
1均值(Mean)
2标准差(Standard Deviation)和方差(Variance)
3案例:计算均值和标准差
4标准差高低的图示
5 均值和标准差适用于描述对称分布
参考文献0 导言:描述中心和幅度的两种方式 描述一组数的中心(center)和幅度(spread)通常有两种方式: (1)五数概括法 (2)均值和标准差 五数概括适用于大多数场景,特别是非对称分布。而均值和标准差适用于对称分布。 1 均值(Mean)均值:对观察值取平均数,例如一组数,2,2,3,5,5,7,8的均值为4.57 标准差:观察值和均值(mean)之间的平均距离。 计算公式如下: n-样本个数 Xi-每个数据的值 X-样本的均值 注意:样本标准差和总体标准差的分母不同,样本标准差是N-1,总体标准差为N 方差(Variance) 方差是标准差的平方。 3 案例:计算均值和标准差有一组数据,人名和年龄,年龄分别为21,29,24,18,16,15,请计算这组数据的均值和标准差。 均值=(21+29+24+18+16+15)/6=20.5 样本标准差= 5.32,函数为STDEV.S(),意为Standard Deviation. Sample 总体标准差=4.86,函数为STDEV.P(), 意为Standard Deviation. Population 用EXCEL函数计算如下图所示 如下图所示。 标准差高表明,一组数据分布幅度比较大,比如 1,5,10,15,20,25,30,35,39 标准差低表明,每一个数和均值的距离比较近,幅度小,数据整体分布靠近中心。比如16,17,18,19,20,21,22,23,24 均值和标准差都会因为异常值受到很大影响。(想想首富和打工人工资平均后的数值~) 而对于对称分布而言,平均数=中位数。对于偏斜分布而言,均值更偏向长尾方向。 参考文献1 Ex: Calculate the Sample Standard Deviation - Work Motivation (motivatorkerja.com) 2 Excel标准差计算的6个函数的用法及区别,含用Stdev/Stdev.S/StdevA/StdevP等求样本与总体标准差 3 Standard Deviation | A Step by Step Guide with Formulas (scribbr.com) |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |