《六西格玛管理统计指南》第五章假设检验

您所在的位置:网站首页 西格玛计算公式三个参数怎么算 《六西格玛管理统计指南》第五章假设检验

《六西格玛管理统计指南》第五章假设检验

2024-07-12 06:20| 来源: 网络整理| 查看: 265

本文是第五章最后一部分内容“5.8 样本量的计算”,这一部分极为重要,而统计分析和实际工作中经常被忽略。

我自己就发现,工作中经常随便(很主观的)定一个抽样量,比如觉得抽样三个就够了吧?(之后单独写一篇文章,说说工作中的实践) 抽样量,是一个平衡(balance)问题。在六西格玛中可以通过公式计算出”合适“的抽样量。抽样量太多费时费力,抽样量太少则统计功效不足。所以本文要弄清楚的核心问题就是——究竟要多大的样本量才能得到我们所需要判断的结论?

为什么要关注抽样量 第二类错误和抽样量的关系是什么? 如何确定合适的抽样量 怎么才算“合适”? 太多和太少的影响是什么?f

在实际工作中,如果为了讨论有关平均值的问题,样本量应该超过15;如果是为了讨论有关方差问题,样本量应该超过30. (一个大概的经验结论,具体抽样量还取决于总体的分布标准差等)

抽样量的背景知识总结

关键内容: 统计功效,第二类错误(纳伪概率),抽样量和什么有关?

为什么抽样量越多越好?

抽样量越多越好? 并不一定,见下面介绍第二类错误引用的文章。 并非“样本量越大p值越低”,但是假如没有抽样误差,样本量越多,p值越小,样本的标准差变小,

要”比较“两个样本是否具有区别,书中的下图最直观,抽样少时重叠多,难以说明谁大谁小,抽样量增加,一目了然。样本量太多当然也无效,样本量增多可能波动又增加,不说这些特殊情况了。 IMG_0585-六西格玛-抽样量的确定

第一类错误和第二类错误: 第一类错误是拒真概率,零假设实际是正确的,但我们有5%的概率(看具体的p值)拒绝了零假设。这个是比较好理解的,因为我们用说95%显著性水平,说的就是第一类错误! 第二类错误是纳伪概率,这个比较难理解,我看蓝皮书之前还真不知这个错误。零假设实际是错误的,但假设检验“无法拒绝零假设”(比如计算得到的p值=0.3,无法拒绝),因为“拒绝是有说服力的,无法拒绝是没有说服力的”(见part 3),此时我们接受了错误的零假设的概率就是第二类错误! 所以第二类错误是建立在“无法拒绝零假设”的情况下,并不能通过置信水平避免。——这是我的理解 2020.6.20

继续参考以下文章,好好理解第二类错误,这样才能更好明白为什么要关注抽样量!

假设检验通常会存在两种错误:弃真错误(α错误,有的书上也称第一类错误)和取伪错误(β错误,有的书上称第二类错误)。弃真错误是原假设为真,假设检验结果为拒绝原假设的错误,在这里的表现就是原假设为真,p0.05。 玩转假设检验,拯救那些被p值拉低的智商!——探秘样本量和p值的关系以及两类风险 第一类错误和第二类错误 假设检验中最难理解的知识点之一就是样本量和p值的关系。 为什么不是样本量越大p值越小呢?【这是本文要重点回答的问题,此处不展开介绍】】

如果完全没有抽样误差,那么样本均值恒定,样本标准差恒定,样本量越大,显然是p值越小。

统计功效的定义,统计功效与第二类错误的关系,和抽样量的原则

书中的定义,直接复制过来。

下面的问题是,如果知道两总体确有差别,那么又该如何确定其样本量保证达到这种分辨开两总体的效果呢?【见上面的图片】 首先引入检验功效的概念。检验功效指的是“在原假设不成立-𝛃的条件下,拒绝原假设的概率”。换言之,由于我们知道,在原假设不成立的条件下,不拒绝原假设的概率”就是犯第二类错误的概率𝛃,因此“原假设不成立的条件下,拒绝原假设的概率”就应该是1-𝛃。总之,在原假设不成立的条件下,能够拒绝原假设,也就是能够分辨出原假设与备择假设的差别,这就是检验能力的表现,其概率值当然越大越好。我们将侦测到两总体间这种差别的能力称为检验功效,即1-β。 前几节的内容我们知道,利用抽取的样本情况对总体进行估计或检验时都可能会犯两类错误,样本量的大小取决于决策错误的风险、总体标准差大小、拟检查的差异大小这三方面的因素。 通常,如果希望降低犯错误的风险,那么必须增大样本量;随着总体变异性的增大,即总体标准差变大,为了保持原有的风险,样本量必须增大;随着拟检查之差异的变小,样本量必须增大。 上述关于样本量的原则,在所有的统计分析问题中都是有体现的具体说来,对于假设检验问题、估计参数问题及计算统计容忍区间所需样本量都需要仔细分析。本节将分三小节分别讨论。5.8.1节讨论用于假设检验所需的样本量,5.8.2节讨论用于参数估计所需的样本量,5.8.3节讨论计算统计容忍区间需要的样本量,5.8.4节讨论计算在等价检验中需要的样本量。

具体的例子,见之前的一篇博客: DOE篇:配对t检验的一个应用举例

如何确定抽样量?

抽样量的原则,见上 具体计算:用mintab或其他软件!都有具体的公式,这个就不能手算了。 重要的是意识到,工作中的抽样量是否可以给出准确的判断,而不是一个统计功效只有50%左右的结果,那就没有意义了。

具体到以下四种情况,可以直接通过Mintab软件给出抽样量和统计功效的关系,这儿先不举例了。

1. 假设检验的抽样量 2.参数估计 3. 等效检验 4. 统计容忍区间

2020.6.15 这一部分很重要,所以独立成一篇读书笔记。 地铁上简单梳理框架。 2020.6.20 周六,看书重新梳理最重要的背景知识,发表,之后拿工作中的几个例子在Mintab测试版上实践实践。 这样《六西格玛管理统计指南》第五章“假设检验”算是学完了,后面的重点是最近工作中要用的MSA和DOE。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3