整理总结:深入浅出统计学

您所在的位置:网站首页 T分布的推导 整理总结:深入浅出统计学

整理总结:深入浅出统计学

2024-07-11 15:07| 来源: 网络整理| 查看: 265

参考资料:电子工业出版社的《深入浅出统计学》 前言

我们的确可以使用点估计量来估计总体均值、方差或一定比例的精确值,但是我们始终无法确定我们使用的样本一定是无偏样本,因此我们考虑使用置信区间的方法来估计总体统计量,因为它是考虑了不确定性的方法。

本篇目录 参考资料:电子工业出版社的《深入浅出统计学》前言具体内容一、置信区间的求解 —— 总体正态、样本正态1、选择总体统计量2、求出其抽样分布3、决定置信水平4、求出置信上下限 二、置信区间的简便算法1、统计量的抽样分布符合正态分布时2、统计量的抽样分布符合T分布时 三、特殊情况 —— 总体正态、样本T分布1、选择总体统计量2、求 X ‾ \overline X X的概率分布3、决定置信水平4、求出 μ \mu μ的置信上下限

具体内容

糖果公司用一个包含100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,于是便在电视节目黄金时段宣布其公司糖球口味的平均持续时间为62.7分钟,但有人自行做了测试,得出了不同的结果,威胁要起诉糖果公司。 此时,我们应该制定的是总体均值的估计值的区间范围,而不是一个精确值,因为这样的话会给予我们更大的误差空间,就不容易被人起诉了。

一、置信区间的求解 —— 总体正态、样本正态 1、选择总体统计量

在问题中,需要为糖球口味持续时间的均值来构建区间,于是需要为总体均值 μ \mu μ来构建一个置信区间。

2、求出其抽样分布

为了求出总体均值的抽样分布,我们需要先计算出 X ‾ \overline X X的期望、方差和分布。而这些在上一节中已经计算过了。在这里插入图片描述 此时一个问题是我们现在并不知道总体的方差是多少,但是我们可以借用点估计法 μ ^ \hat{\mu} μ^​ 或 s 2 s^2 s2 来近似替代,因为这已经是我们目前所具有的数据中可以得到的最近似的值了。公式进一步推导成如下形式。在这里插入图片描述 对于样本均值的分布,我们可以根据"若X符合正态分布,那么 X ‾ \overline X X也符合正态分布"的定理来得知,其应符合正态分布。在本题中即是 X ‾ ∼ N ( μ , s 2 n ) \overline X \thicksim N(\mu,\frac{s^2}{n}) X∼N(μ,ns2​)。

3、决定置信水平

置信水平表明你希望自己对于“总体统计量落入置信区间”的这一说法有多大的把握,比如我们希望总体均值的执行水平为95%,这表明总体均值处于置信区间的概率为0.95,当然可以更高如99%,这样糖果公司就可以更有信心在广告宣称“总体均值位于这个置信区间”这一说法。 值得注意的是,置信水平越高,区间越宽,也就是确定的概率越大,范围越广,也越对说法有把握。 为了防止说法几乎毫无意义,我们需要确定一个合适的置信水平,确保范围小而可靠,对此,我们一般采用95%作为常用置信水平。在这里插入图片描述

4、求出置信上下限

根据抽样分布和选择好的置信水平来求出置信上下限,从而确定置信区间的范围。在这里插入图片描述 此时我们再将 X ‾ \overline X X进行标准化,从而利用正态分布表来查出其对应的区间值。 在这里插入图片描述 此时我们将括号里面的不等式进行展开,即可确定置信区间范围,其中 X ‾ \overline X X可以通过样本 x ‾ \overline x x来计算。 在这里插入图片描述 得出最后结果。 在这里插入图片描述

二、置信区间的简便算法 1、统计量的抽样分布符合正态分布时

在这里插入图片描述在这里插入图片描述

2、统计量的抽样分布符合T分布时

在这里插入图片描述

三、特殊情况 —— 总体正态、样本T分布

糖果公司想求出糖球重量的置信区间,但只抽取了少量的样本,比如抽取了一个具有代表性的样本,共10颗,然后称了每一粒糖球的重量,计算出这个样本的 X ‾ \overline X X=0.5, s 2 s^2 s2=0.09,此时该如何求出其置信区间。

1、选择总体统计量

我们需要为糖球重量均值构建一个置信区间,也就是要为总体均值 μ \mu μ构建置信区间。

2、求 X ‾ \overline X X的概率分布

当总体符合正态分布, δ 2 \delta^2 δ2未知,且可供支配的样本很小时, X ‾ \overline X X符合T分布。而当样本数量为n个时,T分布的形式为 T ∼ t ( n − 1 ) T\thicksim t(n-1) T∼t(n−1),而 T = X ‾ − u s / n T=\frac{\overline X - u}{s/\sqrt{n}} T=s/n ​X−u​,也就是说在这道题中 T = X ‾ − u s / n ∼ t ( 9 ) T=\frac{\overline X - u}{s/\sqrt{n}} \thicksim t(9) T=s/n ​X−u​∼t(9)。在这里插入图片描述

3、决定置信水平

一般设置为95%。

4、求出 μ \mu μ的置信上下限

在这里插入图片描述 再利用T分布概率表可求出 P ( T > t ) = p P(T>t)=p P(T>t)=p中的t值,在这道题中p=0.025。 在这里插入图片描述



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3