整理总结:深入浅出统计学 |
您所在的位置:网站首页 › T分布的推导 › 整理总结:深入浅出统计学 |
参考资料:电子工业出版社的《深入浅出统计学》
前言
我们的确可以使用点估计量来估计总体均值、方差或一定比例的精确值,但是我们始终无法确定我们使用的样本一定是无偏样本,因此我们考虑使用置信区间的方法来估计总体统计量,因为它是考虑了不确定性的方法。 本篇目录 参考资料:电子工业出版社的《深入浅出统计学》前言具体内容一、置信区间的求解 —— 总体正态、样本正态1、选择总体统计量2、求出其抽样分布3、决定置信水平4、求出置信上下限 二、置信区间的简便算法1、统计量的抽样分布符合正态分布时2、统计量的抽样分布符合T分布时 三、特殊情况 —— 总体正态、样本T分布1、选择总体统计量2、求 X ‾ \overline X X的概率分布3、决定置信水平4、求出 μ \mu μ的置信上下限 具体内容糖果公司用一个包含100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,于是便在电视节目黄金时段宣布其公司糖球口味的平均持续时间为62.7分钟,但有人自行做了测试,得出了不同的结果,威胁要起诉糖果公司。 此时,我们应该制定的是总体均值的估计值的区间范围,而不是一个精确值,因为这样的话会给予我们更大的误差空间,就不容易被人起诉了。 一、置信区间的求解 —— 总体正态、样本正态 1、选择总体统计量在问题中,需要为糖球口味持续时间的均值来构建区间,于是需要为总体均值 μ \mu μ来构建一个置信区间。 2、求出其抽样分布为了求出总体均值的抽样分布,我们需要先计算出
X
‾
\overline X
X的期望、方差和分布。而这些在上一节中已经计算过了。 置信水平表明你希望自己对于“总体统计量落入置信区间”的这一说法有多大的把握,比如我们希望总体均值的执行水平为95%,这表明总体均值处于置信区间的概率为0.95,当然可以更高如99%,这样糖果公司就可以更有信心在广告宣称“总体均值位于这个置信区间”这一说法。 值得注意的是,置信水平越高,区间越宽,也就是确定的概率越大,范围越广,也越对说法有把握。 为了防止说法几乎毫无意义,我们需要确定一个合适的置信水平,确保范围小而可靠,对此,我们一般采用95%作为常用置信水平。 根据抽样分布和选择好的置信水平来求出置信上下限,从而确定置信区间的范围。 糖果公司想求出糖球重量的置信区间,但只抽取了少量的样本,比如抽取了一个具有代表性的样本,共10颗,然后称了每一粒糖球的重量,计算出这个样本的 X ‾ \overline X X=0.5, s 2 s^2 s2=0.09,此时该如何求出其置信区间。 1、选择总体统计量我们需要为糖球重量均值构建一个置信区间,也就是要为总体均值 μ \mu μ构建置信区间。 2、求 X ‾ \overline X X的概率分布当总体符合正态分布,
δ
2
\delta^2
δ2未知,且可供支配的样本很小时,
X
‾
\overline X
X符合T分布。而当样本数量为n个时,T分布的形式为
T
∼
t
(
n
−
1
)
T\thicksim t(n-1)
T∼t(n−1),而
T
=
X
‾
−
u
s
/
n
T=\frac{\overline X - u}{s/\sqrt{n}}
T=s/n
X−u,也就是说在这道题中
T
=
X
‾
−
u
s
/
n
∼
t
(
9
)
T=\frac{\overline X - u}{s/\sqrt{n}} \thicksim t(9)
T=s/n
X−u∼t(9)。 一般设置为95%。 4、求出 μ \mu μ的置信上下限
|
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |