8小时整理!t检验原理!R语言实现!一文彻底搞定t检验(上)

您所在的位置:网站首页 单样本t检验自由度计算 8小时整理!t检验原理!R语言实现!一文彻底搞定t检验(上)

8小时整理!t检验原理!R语言实现!一文彻底搞定t检验(上)

2024-05-30 09:21| 来源: 网络整理| 查看: 265

本文中会加一些注解,是对于一些常用混淆概念得解释。主要内容包括t检验适用范围、实际案例以及R语言的实现。

因文章内容过长,所以分为上下两篇

t检验(t test)亦称 Student's t检验,以t分布为基础,是定量资料分析中最常用的假设检验方法。(显著性检验的一种,以此来判定数据的差异是由于误差导致的还是真的有差异

t检验的应用条件为:①在单样本t检验中,总体标准差 \sigma 未知且样本含量较小(n < 30/50)时,要求样本来自正态分布总体;②两小样本均数比较时.要求两样本均来自正态分布总体,且两样本总体方差相等若两样本总体方差不相等,则用 t's 检验③对两大样本( n1、n2 均大于30/50)的均数比较,可用Z检验。但在实际应用时,与上述条件略有偏差,只要其分布为单峰且近似对称分布,一般影响不是太大。

第一节:样本均数与总体均数的比较

样本与总体均数比较的检验亦称为单样本t检验,该种检验就是样本均数代表的未知总体均数 \mu 已知总体均数 \mu_{0} (一般为理论值或标准值)的比较。

在 H_{0}:\mu=\mu_{0} 成立的条件下,检验统计量的计算公式如下:

t=\frac{\bar{X}-\mu}{S_{\bar{X}}}=\frac{\bar{X}-\mu}{S/\sqrt{n}},\nu=n-1 (8.1)

注:实际上就是在做标准化和中心化,减去均值中心化,除以标准误标准化(平均值的标准差=标准误),这样才能给符合标准t分布,才能进行查表。

例8.1 已知某地新生儿出生体重均数为3.36 kg 。从该地农村随机抽取40名新生儿,测得其平均体重为3.27 kg,标准差为0.44kg,问该地农村新生儿出生体重是否与该地新生儿平均出生体重不同。

(1)建立检验假设,确定检验水准

H_{0}:\mu=3.36 ,该地农村新生儿体重与该地新生儿平均出生体重相同

H_{1}:\mu\ne3.36 ,该地农村新生儿体重与该地新生儿平均出生体重不同

\alpha=0.05

注: H_{0} 是原假设, H_{1} 为备择假设,如果差异不是由误差引起的,那么就否定原假设,同意备择假设。 \alpha 是显著性水平

(2)计算统计量,由式(8.1),得

t=\frac{\bar{X}-\mu}{S_{\bar{X}}}=\frac{\bar{X}-\mu}{S/\sqrt{n}}=\frac{3.27-3.36}{0.44/\sqrt{40}}=-1.294

\nu=n-1=40-1=39

注:关于自由度 \nu ,因为平均值已知,所以只有39个值的取值可以是随便取得,另外一个根据其余39个都可以知道。

(3)确定P值,作出统计推断 根据自由度39和t=-1.294的绝对值查t界值表,得0.2< P<0.4,则按\alpha=0.05的检验水准,不拒绝 H_{0} ,差别无统计学意义,尚不能认为该地农村新生儿体重与该地新生儿平均出生体重不同。

t界值表R语言实现

这里我们任意构建6个数据作为演示

#构建数据集合 mydata


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3