学习笔记403 |
您所在的位置:网站首页 › 对比两份excel不同的 › 学习笔记403 |
一:背景 这几天重新复习了一下以前经典的假设检验方法。包括之前使用excel来做一些简单的统计分析。 假设检验(hypothesis test)亦称显著性检验(significant test),是统计推断的另一重要内容, 其目的是比较总体参数之间有无差别。假设检验的实质是判断观察到的“差别”是由抽样误差引起还是总体上的不同, 目的是评价两种不同处理引起效应不同的证据有多强,这种证据的强度用概率P来度量和表示。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。 二:假设检验步骤 假设任意给定两组数据,比如从两个样本抽样的一个特征。 想知道这两个样本的分布是否不同,有没有差别。 问题通常有两种解法,一个是参数检验,一个非参数检验。 如果数据的分布比较符合某些正态分布或经典三大分布(t分布,f分布,卡方分布)的条件,采用第一种办法效果比较好,分为以下几个步骤 1.建立假设2.求抽样分布3.选择显著性水平和否定域4.计算检验统计量5.判定 正态分布,用以构建Z统计量,主要用来作为以下几种情形的检验分布, 1:(单个总体参数)当总体方差已知,大样本的情况下,判断样本均值(比例)和总体均值(比例)是否有差异。例如已知一个城市2018年人均收入是1万元,2019年随机抽样了100个人,计算均值为10100元,问两年的人均收入是否有显著差异。 2:(单个总体参数)当总体方差已知,小样本的情况下,判断样本均值(比例)和总体均值(比例)是否有差异。 3:(两个总体参数)当总体方差已知或未知,大样本的情况下,比如随机抽100名18岁高中生,比较男女的身高是否有差异 T分布,用以构建t统计量,又称厚尾分布 1:(单个总体参数)当总体方差未知,小样本的情况下,判断样本均值(比例)和总体均值(比例)是否有差异。 2:(两个总体参数)当总体方差未知,小样本的情况下,比如随机抽20名18岁高中生,比较男女的身高是否有差异 卡方分布,用以构建x2统计量, 1:(单个总体参数)比较和总体方差是否存在差异,比如生产一种零件,要求误差不超过1mm,随机抽取了20个,分别进行测定,求卡方值做检验 2:拟合优度检验,比较两个总体比例是否有显著差异,具体参考问题3 3:独立性检验,两个分类变量之间是否存在联系,比如产品的质量与产地是否有关 F分布,用以构建f统计量 1:(两个总体参数)比较两总体的方差是否相等,方差齐,可以通过两个方差之比等于1来进行, 如果不满足正态,独立,方差齐等前提,也不知道分布形式,可以采用非参检验。 当然满足参数检验条件的两组数据也可以使用非参检验,但是效果不如参数检验好。 三:参数检验方法示例 1:T检验 通过两个样本之差的分布去推断,两个样本数据应满足正态分布条件,方差齐,还要相互独立,之所以叫t检验,是因为构建的统计量是t统计量,t统计量服从n1+n2-2个自由度的t分布, 小样本的情况下(n |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |