显著性检验与p值 |
您所在的位置:网站首页 › 显著性为0002是显著还是不显著 › 显著性检验与p值 |
1.显著性检验
无论从事何种领域的科学研究还是统计调查,显著性检验作为判断两个乃至多个数据集之间是否存在差异的方法,一直被广泛应用。笔者并非统计学专业出身,一直以来对显著性检验的原理及应用困惑不解。 (1)什么是显著性检验? “显著性检验”的英文名称是“significance test”。在统计学中,显著性检验是“统计假设检验”(Statistical hypothesis tesing)的一种,显著性检验是检测科学实验中的实验组与对照组之间是否存在差异以及差异是否显著的办法。“统计假设检验”指出了“显著性检验”的前提条件是“统计假设”,换言之“无假设,不检验”。任何人在使用显著性检验之前必须知道假设是什么。一般而言,把要检验的假设称之为原假设,记为H0,把与H0相对应的假设称之为备择假设,记为H1。
如果原假设为真,而检验的结论却劝你放弃原假设,此时,我们把这种错误称之为第一类错误。通常把第一类错误出现的概率记为 因为我们想要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。 2.卡方检验卡方检验(Chi-Square Test)在大数据技术场景中,通常用来检验某个变量或特征是不是和应变量有显著关系。 举例,我们要观察性别和在线买不买生鲜食品有没有关系。通过在线上生鲜市场收集数据,得到下面的表格: 观察到的现象: 男 女 总计 线上不买生鲜 527 72 599 线上购买生鲜 206 102 308 总计 733 174 907通过上表我们发现有66%(599/907)的人不在线上购买生鲜,34%的人线上购买生鲜,根据这一比例,我们可以得到男女不同性别是否线上购买生鲜的理论分布数据: 男 女 总计 线上不买生鲜 484 115 599 线上购买生鲜 249 59 308 总计 733 174 907卡方的计算公式:
假设检验是推断统计中的一项重要内容,在假设检验中长常见到P值(P-value,Pr),P值是进行检验决策的一个重要依据。 P值即概率,是反映某一事件发生的可能性大小。在统计学中根据显著性检验得到的P值,一般以P |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |