《六西格玛管理统计指南》第五章假设检验

您所在的位置：网站首页 › 西格玛计算公式三个参数怎么算 › 《六西格玛管理统计指南》第五章假设检验

《六西格玛管理统计指南》第五章假设检验

2024-07-12 06:20| 来源: 网络整理| 查看: 265

本文是第五章最后一部分内容“5.8 样本量的计算”，这一部分极为重要，而统计分析和实际工作中经常被忽略。

我自己就发现，工作中经常随便（很主观的）定一个抽样量，比如觉得抽样三个就够了吧？（之后单独写一篇文章，说说工作中的实践）抽样量，是一个平衡（balance）问题。在六西格玛中可以通过公式计算出”合适“的抽样量。抽样量太多费时费力，抽样量太少则统计功效不足。所以本文要弄清楚的核心问题就是——究竟要多大的样本量才能得到我们所需要判断的结论？

为什么要关注抽样量第二类错误和抽样量的关系是什么？如何确定合适的抽样量怎么才算“合适”？太多和太少的影响是什么？f

在实际工作中，如果为了讨论有关平均值的问题，样本量应该超过15；如果是为了讨论有关方差问题，样本量应该超过30. （一个大概的经验结论，具体抽样量还取决于总体的分布标准差等）

抽样量的背景知识总结

关键内容：统计功效，第二类错误（纳伪概率），抽样量和什么有关？

为什么抽样量越多越好？

抽样量越多越好？并不一定，见下面介绍第二类错误引用的文章。并非“样本量越大p值越低”，但是假如没有抽样误差，样本量越多，p值越小，样本的标准差变小，

要”比较“两个样本是否具有区别，书中的下图最直观，抽样少时重叠多，难以说明谁大谁小，抽样量增加，一目了然。样本量太多当然也无效，样本量增多可能波动又增加，不说这些特殊情况了。 IMG_0585-六西格玛-抽样量的确定

第一类错误和第二类错误：第一类错误是拒真概率，零假设实际是正确的，但我们有5%的概率（看具体的p值）拒绝了零假设。这个是比较好理解的，因为我们用说95%显著性水平，说的就是第一类错误！第二类错误是纳伪概率，这个比较难理解，我看蓝皮书之前还真不知这个错误。零假设实际是错误的，但假设检验“无法拒绝零假设”（比如计算得到的p值=0.3，无法拒绝），因为“拒绝是有说服力的，无法拒绝是没有说服力的”（见part 3），此时我们接受了错误的零假设的概率就是第二类错误！所以第二类错误是建立在“无法拒绝零假设”的情况下，并不能通过置信水平避免。——这是我的理解 2020.6.20

继续参考以下文章，好好理解第二类错误，这样才能更好明白为什么要关注抽样量！

假设检验通常会存在两种错误:弃真错误(α错误，有的书上也称第一类错误)和取伪错误(β错误，有的书上称第二类错误)。弃真错误是原假设为真，假设检验结果为拒绝原假设的错误，在这里的表现就是原假设为真，p0.05。玩转假设检验，拯救那些被p值拉低的智商！——探秘样本量和p值的关系以及两类风险第一类错误和第二类错误假设检验中最难理解的知识点之一就是样本量和p值的关系。为什么不是样本量越大p值越小呢？【这是本文要重点回答的问题，此处不展开介绍】】

如果完全没有抽样误差，那么样本均值恒定，样本标准差恒定，样本量越大，显然是p值越小。

统计功效的定义，统计功效与第二类错误的关系，和抽样量的原则

书中的定义，直接复制过来。

下面的问题是，如果知道两总体确有差别，那么又该如何确定其样本量保证达到这种分辨开两总体的效果呢？【见上面的图片】首先引入检验功效的概念。检验功效指的是“在原假设不成立-𝛃的条件下，拒绝原假设的概率”。换言之，由于我们知道，在原假设不成立的条件下，不拒绝原假设的概率”就是犯第二类错误的概率𝛃，因此“原假设不成立的条件下，拒绝原假设的概率”就应该是1-𝛃。总之，在原假设不成立的条件下，能够拒绝原假设，也就是能够分辨出原假设与备择假设的差别，这就是检验能力的表现，其概率值当然越大越好。我们将侦测到两总体间这种差别的能力称为检验功效，即1-β。前几节的内容我们知道，利用抽取的样本情况对总体进行估计或检验时都可能会犯两类错误，样本量的大小取决于决策错误的风险、总体标准差大小、拟检查的差异大小这三方面的因素。通常，如果希望降低犯错误的风险，那么必须增大样本量；随着总体变异性的增大，即总体标准差变大，为了保持原有的风险，样本量必须增大；随着拟检查之差异的变小，样本量必须增大。上述关于样本量的原则，在所有的统计分析问题中都是有体现的具体说来，对于假设检验问题、估计参数问题及计算统计容忍区间所需样本量都需要仔细分析。本节将分三小节分别讨论。5.8.1节讨论用于假设检验所需的样本量，5.8.2节讨论用于参数估计所需的样本量，5.8.3节讨论计算统计容忍区间需要的样本量，5.8.4节讨论计算在等价检验中需要的样本量。

具体的例子，见之前的一篇博客： DOE篇：配对t检验的一个应用举例

如何确定抽样量？

抽样量的原则，见上具体计算：用mintab或其他软件！都有具体的公式，这个就不能手算了。重要的是意识到，工作中的抽样量是否可以给出准确的判断，而不是一个统计功效只有50%左右的结果，那就没有意义了。

具体到以下四种情况，可以直接通过Mintab软件给出抽样量和统计功效的关系，这儿先不举例了。

1. 假设检验的抽样量 2.参数估计 3. 等效检验 4. 统计容忍区间

2020.6.15 这一部分很重要，所以独立成一篇读书笔记。地铁上简单梳理框架。 2020.6.20 周六，看书重新梳理最重要的背景知识，发表，之后拿工作中的几个例子在Mintab测试版上实践实践。这样《六西格玛管理统计指南》第五章“假设检验”算是学完了，后面的重点是最近工作中要用的MSA和DOE。

【本文地址】

《六西格玛管理统计指南》第五章假设检验

《六西格玛管理统计指南》第五章假设检验

今日新闻

推荐新闻