t检验 |
您所在的位置:网站首页 › 单样本T检验的自由度是多少 › t检验 |
在上一篇我们简单了解了t检验是干吗用的,现在就开始讲解t检验下的单样本t检验。 基本思想: t检验的本质就是看两总体分布是否有差异,单样本t检验也是同样。比如我们想知道A和B两个总体是否不同,但B总体我们是已知的,A却未知,此时我们从A总体中随机抽取部分C作为样本,此时用样本C和总体B去比较的方法就是单样本t检验,“单样本"说的就是C。 使用条件: 一、单组样本必须是连续型变量 二、观测值之间相互独立 三、连续变量不存在明显的异常值 四、该连续变量服从或近似服从正态分布 既然我们要使用t检验,那使用条件一定要符合。 一、比如人的血压、身高、生化指标、考试分数等都是连续变量,它在刻度值上都能找到 二、相互独立主要取决于研究者对自己数据的了解程度,研究的A和B它们之间必须是独立的,A的变化并不影响B的变化,反之亦然;在实际中,如果不了解A和B的关系,可以先做一个散点图,看一下相关性,不相关就是独立。 三、样本数据要稳定,数据越少越要稳定,异常值的存在会严重干扰最终的结果。在实际中,数据不多时可以自行浏览查看;数据多,或者对数据不了解,可以做一个箱式图,如果存在异常值,不要直接删除,先去数据库中定位到异常值,检查原因。如果因为操作或者失误导致,在不能恢复的前提下建议直接删除;但如果是专业上认为该值正常的情况下,则不能轻易删除,否则会丢失样本的重要信息。 四、正态分布是很重要的一个前提条件,t检验只有在正态分布的限制条件下才是适用的,否则结果和真实情况是由差别的。但t检验也具有一定耐受性,在近似正态分布的情况下同样可以使用,检验效率依旧比非参数检验要高。 案例演示: 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问,从事铅作业男性工人的血红蛋白含量均数是否不等于正常成年男性的均数140g/L?(选自第4版医学统计学 例3-5) 案例解析: 一、小样本(36名铅作业男性工人的血红蛋白含量)和总体(正常成年男性的血红蛋白含量)比较。√ 二、人体血红蛋白含量属于连续变量。√ 三、铅作业男性工人的血红蛋白含量变化不影响正常成年男性的血红蛋白含量,他们是两个不同的总体。√ 四、有无异常值和是否服从正态分布得先检查了再说。? 初步来看,符合单样本t检验的使用条件,具体行不行看具体检查。 实际操作: 一、异常值检查 结果显示并无异常值,继续操作。(如果不会看箱图,建议百度,如果有精力的话我会单独做一篇讲解) 二、检验正态性 检验正态性的方法有好几种,此处只选择我经常使用的,关于其他方法的使用我会单独做写一篇。 具体的参数设置和解释,会单独说,在此只看结果。由于样本量小,我们只看S-W检验结果,P<0.05,正态性检验的H0是服从正态分布,H1是不服从,所以拒绝了H0,说明数据不服从正态分布。但通过直方图和正态Q-Q图,发现总体近似服从正态分布,此处仍然可以使用单样本t检验。 (此处我个人的经验是,只要数据不是偏态的厉害,都尽量使用t检验,这样结果的可靠性较高,非参数检验不是不好,主要是得谨慎使用,因为有可能会得到相反的结果) 三、单样本t检验 由图一可知,P<0.05,H0是两者血红蛋白含量一致,H1是两者血红蛋白含量存在差异,那拒绝H0接受H1。具体谁高谁低,通过统计描述得出铅作业者均值=130.83<正常成人140,所以最后结论是铅作业男性工人的血红蛋白含量与正常成年男性的血红蛋白含量有差异,主要表现为低于正常成年男性。 OK,单样本t检验就讲完了,操作很简单,之所以讲的细致,主要是为了照顾零基础的同学。为了避免啰嗦,之后会省略部分讲过的内容,方便大家把握重点,拜拜。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |