十二、非参数检验:使用python进行两样本Wilcoxon秩和检验法和Mann

您所在的位置:网站首页 秩和检验如何排序 十二、非参数检验:使用python进行两样本Wilcoxon秩和检验法和Mann

十二、非参数检验:使用python进行两样本Wilcoxon秩和检验法和Mann

2024-06-09 18:48| 来源: 网络整理| 查看: 265

除了使用Wilcoxon进行单样本位置检验外,其实也可以使用wilcoxon进行两样本位置检验,基本原理与单样本中心位置检验一样:将来组容量相等的样本值做差,然后分别计算差值中为负数的秩和(R−R^-R−)和为正的秩和(R+R^+R+), 接下来的处理于单样本一样就可以了。这里需要注意的是在python中使用Wilcoxon秩和检验对单样本和双样本时,对应参数的差异,函数原型如下: stats.wilcoxon(x, y=None, zero_method='wilcox', correction=False)

做单样本位置检验时,x为样本向量与对称点的差 做双样本检验时,x,yx, yx,y就是两个样本向量。 那么当两个样本容量不同时,如何进行检验呢?其实wilcoxon对这样的问题也进行了深入研究,并且编制了概率表。 1. 双样本Wilcoxon秩和检验的原理

设X1,X2,...,XmX_1, X_2, ..., X_mX1​,X2​,...,Xm​为来自连续型总体X的容量为m的样本,Y1,Y2,...,YnY_1,Y_2,...,Y_nY1​,Y2​,...,Yn​为来自连续型总体Y的容量为n的样本,且两样本相互独立. 记MxM_xMx​为总体X的中位数, MyM_yMy​为总体Y的中位数。 考虑假设检验问题: H0:Mx=MyH1:Mx≠MyH_0: M_x = M_y \quad H_1: M_x \neq M_yH0​:Mx​=My​H1​:Mx​​=My​ 构造检验统计量的基本思想是:把样本X1,X2,...,XmX_1, X_2, ..., X_mX1​,X2​,...,Xm​和Y1,Y2,...,YnY_1, Y_2,..., Y_nY1​,Y2​,...,Yn​混合起来,并把这N=(m+n)N=(m+n)N=(m+n)个观测值从小到大排列,这样每一个Y的观测值在混合排列中都有自己的秩. 令RiR_iRi​为YiY_iYi​在这N个树种的秩,则这些秩的和为Wy=∑i=1nRiW_y = \sum_{i=1}^nR_iWy​=∑i=1n​Ri​. 同样地由X的样本也可得到WxW_xWx​, 称WxW_xWx​或WyW_yWy​为Wilcoxon秩和统计量。

2. Mann-Whitney U检验

与Wilcoxon秩和统计量等价的有Mann-Whitney U统计量。令XxyX_{xy}Xxy​为把所有的X的观测值和Y的观测值做比较之后,Y的观测值大于X的观测值的个数,则称WxyW_{xy}Wxy​为Mann-Whitney U统计量。它与Wilcoxon秩和统计量的关系如下: Wy=Wxy+n(n+1)2,Wx=Wyx+m(m+1)2W_y=W_{xy} + \frac{n(n+1)}{2}, \quad W_x = W_{yx} +\frac{m(m+1)}{2}Wy​=Wxy​+2n(n+1)​,Wx​=Wyx​+2m(m+1)​ 实际上,检验统计量W(Wilcoxon)和U等价,二者之间只是一个线性变换关系。所有一般将其统称为Wilcoxon-Mann-Whitney统计量。 在很多统计软件中,Wilcoxon秩和检验使用的就是Mann-Whitney U检验. 但是在python中这两种检验方法是单列了。那么在实际中如何使用呢,这里有一个简单的原则:

当两样本容量相等时,这两个检验方法都可以使用 当两样本容量不等时,使用Mann-Whitney U方法 3. 实例

例如: 有糖尿病的和正常的老鼠重量为(单位:克) 糖尿病鼠:42, 44, 38, 52, 48, 46, 34, 44, 38; 正常老鼠:34, 43, 35, 33, 34, 26, 30, 31, 31, 27, 28, 27, 30, 37, 32. 检验这两组的体重是否有显著不同?(α=0.05\alpha=0.05α=0.05) 解:使用python计算如下:

from scipy import stats data1=[42,44,38,52,48,46,34,44,38] data2=[34,43,35,33,34,26,30,31,31,27,28,27,30,27,32] stats.mannwhitneyu(data1,data2,alternative='two-sided') # 结果: MannwhitneyuResult(statistic=129.0, pvalue=0.00026546111724004096)

因为pvalue



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3