统计

您所在的位置：网站首页 › 如何求p值 › 统计

2024-07-15 07:28| 来源: 网络整理| 查看: 265

p值的计算，R语言和python的实现

今天来说说频率中假设检验要依赖的评估指标：p值，对，你也许很清楚的知道它表达的意思，但是它是怎么算得的呢？不知道你是否知道呢？这次将介绍几种分布计算p值的方法（套路）。

这里以两样本均值的假设检验为例来说明。要介绍的分布有：

正态分布

t分布

设两样本分别为 X 和Y，基于中心极限定理，无论 X 和Y属于什么分布，只要样本量足够大，它们的均值服从正态分布。由于两者是独立样本，故而它们均值之也服从正态分布。

1、大样本情况下设样本 X 为x1、x2、⋯、xn，样本 Y 为y1、y2、⋯、ym，它们的均值分布为: x¯、y¯ ，方差为 S2xn、S2ym 。

那么对应的统计量为：

Z=x¯−y¯S2xn+S2ym−−−−−−−√∼N(0,1)

假设检验的介绍看博客：http://blog.csdn.net/xxzhangx/article/details/67640775

p值是说在原假设成立的条件下，原假设发生的概率，若是p值小于0.05，发生概率小于0.05时，认为是小概率发生了，即是差异性显著，拒绝原假设。

公式：双边假设的p值：

p=P(z x y sx sy nx ny z p = 2*pnorm(-abs(z)) > p

结果： [1] 1.608277e-05

2、小样本情况下：

方差相等方差不等

方差相等时，

方差不等时：

> m1 m2 sd1 sd2 num1 num2 se t 2*pt(-abs(t),df=pmin(num1,num2)-1)

结果： [1] 4.280554e-13

【本文地址】

今日新闻