第四章 多个样本均数比较的方差分析

您所在的位置:网站首页 食品召回的意义与作用 第四章 多个样本均数比较的方差分析

第四章 多个样本均数比较的方差分析

2024-07-03 08:14| 来源: 网络整理| 查看: 265

第四章 多个样本均数比较的方差分析

日期: 2020-11-18 作者:wxhyihuan

T检验只能比较两组样本均值,对于多组的样本处理就需要用方差分析(Analysis of variance. ANOVA)。

在进行科学研究时,有时要按实验(对人称为试验)设计将所研究的对象分为多个处理组施加不同的干预(比如治疗某种疾病的方式),施加的干预为处理, 处理因素(Treatment,如用药处理,手术处理,药品剂量等)至少有两个水平(Level,比如药物种类有A,B,C三种,即为3个水平)。这类科研资料的统计分析, 是通过所获得的样本信息来推断各处理组均数 间的差别是否有统计学意义,即处理有无效果。常采用 的统计分析方法为方差分析,由英国统计学家R. A. Fisher 首创, 为纪念 Fisher.以F命名,故方差分析又称F检验,也称为 “变异数分析”。

F检验与前面的t检验或者Z检验类似,也有自己的概率分布基础,即方差分析是依靠F-分布为概率分布的依据, 利用离均差平方和(Sum of square of deviations from mean,SS)与自由度(Degree of freedom, df)所计算的组间与组内均方(Mean of square,MS)估计出F值和P值,结合检验水准\(\alpha=0.05\)判断检验结果。 若有统计学意义(\(P值\le0.05\)),则拒绝原假设\(H_0(μ_0=μ_1=μ_2=μ_3=\cdots)\),接受\(H_1\)(\(μ\)不完全相等),即各样本不是来自不完全相同的总体; 反之,若没有统计学意义(\(P值>0.05\)),则不拒绝原假设\(H_0(μ_0=μ_1=μ_2=μ_3=\cdots)\),即还不能确定各样本是来自不完全相同的总体;

4.1 F分布

F分布定义是设\(X\)、\(Y\)为两个独立的随机变量,\(X\)服从自由度为k1的卡方分布, \(Y\)服从自由度为k2的卡方分布,这两个独立的卡方分布除以各自的自由度后的比率这一统计量的分布,即服从F-分布(F-distribution), 即: \[F=\frac{U_1/d_1}{U_2/d_2}\] \(U_1\)和\(U_2\)分别是自由度(Degree of freedom, df)为d1和d2的卡方分布,\(U_1=\sum_{i=0}^nX_i^2\),\(U_2=\sum_{i=0}^nY_i^2\);或者 \[\frac{S_1^2/d_1}{\sigma_1^2}\div\frac{S_2^2/d_2}{\sigma_2^2}\] \(S_1^2\)为正态分布\(N(0,\sigma_1^2)\)的\(d_1\)个随机变量的平方和,\(S_2^2\)为正态分布\(N(0,\sigma_2^2)\)的\(d_2\)个随机变量的平方和。

F-分布对应的概率密度函数是: \[\begin{aligned} f(x,d_1,d_2) &= \frac{\sqrt{\frac{(d_{1}x)^{d_1} d_2^{d_2}}{(d_{1}x+d_2)^{d_1+d2}}}}{xB\left(d_{1}/2,d_{2}/2\right)}\\ &= \frac{1}{B\left(d_{1}/2,d_{2}/2\right)}\left(\frac{d_1}{d_2}\right)^{\frac{d_1}{2}}x^{\frac{d_1}{2}-1}\left(1+\frac{d_1}{d_2}x\right)^{-\frac{d_1+d_2}{2}} \end{aligned}\]

在R语言中。F-分布也有几个与Z分布,t分布基本函数类似的工具函数,分别是df(),pf(),qf()和rf()。

f_val = 2.2 df1 = 10 df2 = 20 q_seq 1

这个情况说明,至少有一个分布相对其他分布较远,且每个分布都非常集中,即每个分组的分布方差差别较小。所以,我们不能得出三个分布都有相同的均值, 于是拒绝\(H_0:μ_0=μ_1=μ_2=μ_3\)。

Figure 4.4: MSb>>MSw示例

C. \(MS_b0.1,方差齐性检验的通常按照α=-。1 设置,因此不拒绝\(H_0\),即不拒绝各组之间的方向都相等。

#DescTools包中的LeveneTest() library(DescTools) #Levene's是均值(mean),center = "mean" LeveneTest(rdl_df$LDL_C,rdl_df$GROUP,center = "mean") ## ## Levene's Test for Homogeneity of Variance (center = "mean") ## Df F value Pr(>F) ## group 3 1.6224 0.188 ## 116 #Brown–Forsythe 是中位数(median),center = "median" LeveneTest(rdl_df$LDL_C,rdl_df$GROUP,center = "median") ## ## Levene's Test for Homogeneity of Variance (center = "median") ## Df F value Pr(>F) ## group 3 1.493 0.2201 ## 116


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3