Python课程 统计 1

您所在的位置:网站首页 python输出值的方法 Python课程 统计 1

Python课程 统计 1

2023-04-04 08:48| 来源: 网络整理| 查看: 265

制作人:曾凡

我们已经知道,describe()方法可以对某一个数据框或者某一个序列的数值进行描述性统计操作。但是,describe方法的描述性统计是固定的,难以自定义的。另外,还有一些统计量describe方法里并不提供,但我们在做计量经济学的描述性统计的时候一般是要计算的。例如序列的偏度、峰度,以及用来检验序列是否服从正态分布的Jarque-Bera统计量。

我们先来看一下偏度的公式。序列偏度衡量序列分布围绕其均值的非对称性。设序列每一项记为y_i,则偏度的计算公式如PPT中所示。

偏度是由两个乘数相乘所得的结果。第一个乘数,是序列值的个数的倒数,第二个乘数,是一系列数值的和。这些数值是什么呢?是序列的每一项减去序列所有各项的均值之差,除以序列标准差有偏估计,也就是σ尖的商。第二个乘数就是这些商的三次方的和。

为什么说这个σ尖是序列标准差的有偏估计呢?大家回忆一下统计学的相关知识,真正意义上的序列标准差的无偏估计s尖,在算方差的时候,除数应该是观测值数量减1。然而在我们计算序列标准差的有偏估计σ尖时,其除数是观测值数量。

那么偏度的数值代表了什么呢?一般而言,如果序列的分布是对称的,偏度值为;正的偏度值意味着序列分布有长的右拖尾,负的偏度值意味着序列分布有长的左拖尾。

看完了偏度计算公式以后,我们再来看一下峰度的公式。序列峰度衡量序列分布的凸起或平坦程度。设某个序列为y,序列每一项记为y_i,则峰度的计算公式如PPT中所示。

峰度的计算公式和偏度的计算公式非常类似,也是由两个乘数相乘所得的结果。第一个乘数,也是序列值的个数的倒数,第二个乘数,也是一系列数值的和。这些数值是什么呢?是序列的每一项减去序列所有各项的均值之差,除以序列标准差有偏估计,也就是σ尖的商。第二个乘数就是这些商的四次方的和。我们看到,峰度公式和偏度公式唯一的差别,就是第二个乘数是这些商的四次方之和,而偏度公式中,第二个乘数是这些商的三次方之和。

那么峰度的数值代表了什么呢?我们以正态分布作为标准来对峰度值进行考察。一般而言,正态分布的K值为3。如果K值大于3,分布的凸起程度大于正态分布;如果K值小于3,序列分布相对于正态分布是平坦的。

在明确峰度、偏度的定义以后,我们一起来看一下Jarque-Bera统计量。Jarque-Bera统计量衡量的是序列是否服从正态分布。J-B统计量的计算公式如PPT中所示。

我们看到,J-B统计量是在偏度S,峰度K的基础上计算的。它也是两个数相乘所得到的积。第一个乘数是六分之N减k,这个N就是我们序列中所有元素的数量,小k是序列估计式中参数的个数。如果针对的是已经确定的序列计算J-B统计量,则k取。

另一个乘数则是偏度平方和峰度减去3之后的差,平方后与1/4的积。因为正态分布是对称的,所以如果序列的所有项都是严格遵循正态分布的,那么偏度S=0,峰度K=3,其JB统计量为。

在正态分布的原假设下,J-B统计量是自由度为2的卡方分布。J-B统计量所对应的卡方分布概率值(P值)是J-B统计量符合原假设下的观测值的概率。

换而言之,如果该P值很小,则拒绝原假设,也就是序列不服从于正态分布。

在之前的关卡题中,我们曾经尝试过使用列表切片的方法来抽取describe的部分结果,但其实效果并不尽如人意。例如,有的同学可能比较在意一个序列的数据是否符合正态分布,那么她们可能要计算这个数据的加可贝拉统计量,这时候就要用到这个序列的偏度和峰度。但是describe方法并没有给我们这个选项。那么我们应该怎么办呢?

我们在之前的课件中有谈到,有一种叫做mean()的方法,可以用来求dataframe数据框或groupby分组对象每一组的平均值。那么接下来,老师将再给大家介绍几个方法,这些方法可以帮助我们提取数据框对象的其他计量描述性统计结果。

这些方法分别是平均值mean,标准差std,最大值max,最小值min,方差var,偏度skew,峰度Kurt和计数方法count。因为这些方法的英文名称和它们的意义比较类似,所以相信对大家而言都不是太难。但要请大家注意,峰度kurt方法并不适用与分类groupby对象。

接下来,请大家用Spyder进行测试,并思考以下问题。

请大家设置一个字典x,其“项目”键的值为“均值”、“标准差”、“偏度”、“峰度”、“计数”这五个字符串组成的列表。其“数值”键的值为数据框adult的age列的上述这5种值。

最后,将x转换为DataFrame数据框agedes。

请大家完成这道思考题了以后,将答案按照以下格式发布在群里。

1、我的代码是……

好,请大家开始,谢谢大家。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3