16.第六章 非参数假设检验(2)

您所在的位置:网站首页 独立性检验的临界值表要背吗 16.第六章 非参数假设检验(2)

16.第六章 非参数假设检验(2)

2024-03-05 20:13| 来源: 网络整理| 查看: 265

第六章 非参数假设检验(2) 1.拟合优度检验

拟合优度,即利用总体 X X X中抽取的样本 X 1 , ⋯   , X n X_1,\cdots,X_n X1​,⋯,Xn​,来检验 H 0 : r.v.  X 的 分 布 为 F H_0:\text{r.v. }X的分布为F H0​:r.v. X的分布为F这一假设。然而,对于总体分布,用符号、不符合这种说法未免过于绝对,因此通常是提出一个介于0到1之间的数值来衡量拟合的优劣程度,称作拟合优度。

拟合优度一般如此定义: p ( d 0 ) = P ( D ≥ d 0 ∣ H 0 ) p(d_0)=P(D\ge d_0|H_0) p(d0​)=P(D≥d0​∣H0​),这里 D D D是一种样本之于给定分布的偏差,是一个统计量,有许多的定义方式; d 0 d_0 d0​就是统计量 D D D对于给定样本的观测值。

当理论分布完全已知的时候,可以采用Pearson χ 2 \chi^2 χ2检验,它又分为几种类型。

随机变量 X X X为离散型,且只取有限个值 a 1 , ⋯   , a r a_1,\cdots,a_r a1​,⋯,ar​的情形。

设 X 1 , ⋯   , X n X_1,\cdots,X_n X1​,⋯,Xn​为从总体 X X X中抽取的简单样本,理论分布为 F : ( a 1 a 2 ⋯ a r p 1 p 2 ⋯ p r ) F:\left( \begin{array}{c} a_1&a_2&\cdots&a_r\\ p_1&p_2&\cdots&p_r \end{array} \right) F:(a1​p1​​a2​p2​​⋯⋯​ar​pr​​) 且 p 1 , ⋯   , p r p_1,\cdots,p_r p1​,⋯,pr​已知, ∑ i = 1 r p i = 1 \sum_{i=1}^r p_i=1 ∑i=1r​pi​=1,检验的问题表示为 H 0 : P ( X = a i ) = p i , i = 1 , ⋯   , r H_0:P(X=a_i)=p_i,\quad i=1,\cdots,r H0​:P(X=ai​)=pi​,i=1,⋯,r 设 X 1 , ⋯   , X n X_1,\cdots,X_n X1​,⋯,Xn​中,等于 a i a_i ai​的个数为 ν i \nu_i νi​(观察频数),按照分布 F F F的理想情况,每一个 a i a_i ai​对应的理论频数应该是 n p i np_i npi​,当 n n n充分大的时候观察频数应该趋近于理论频数,因此取检验统计量为 ∑ i = 1 r c i ( ν i / n − p i ) 2 \sum_{i=1}^rc_i(\nu_i/n-p_i)^2 ∑i=1r​ci​(νi​/n−pi​)2,特别地,取 c i = n / p i c_i=n/p_i ci​=n/pi​,得到 K n = ∑ i = 1 r ( ν i − n p i ) 2 n p i ⟶ L χ r − 1 2 K_n=\sum_{i=1}^r \frac{(\nu_i-np_i)^2}{np_i}\stackrel{\mathscr L}{\longrightarrow }\chi^2_{r-1} Kn​=i=1∑r​npi​(νi​−npi​)2​⟶L​χr−12​ 这样,当 K n K_n Kn​过大,具体地说就是 K n > χ r − 1 2 ( α ) K_n>\chi^2_{r-1}(\alpha) Kn​>χr−12​(α)时拒绝 H 0 H_0 H0​。按照前面的方式定义拟合优度,就是 p ( k 0 ) = P ( K n ≥ k 0 ∣ H 0 ) ≈ P ( χ r − 1 2 ≥ k 0 ) p(k_0)=\mathbf P(K_n\ge k_0|H_0)\approx\mathbf P(\chi^2_{r-1}\ge k_0) p(k0​)=P(Kn​≥k0​∣H0​)≈P(χr−12​≥k0​)

理论分布为任一确定分布的情形。

此时,取 r − 1 r-1 r−1个常数 a 0 = − ∞ < a 1 < ⋯ < a r = ∞ a_0=-\inftyχ(r−1)(s−1)2​(α)则否定假设,否则接受。检验的拟合优度是 p ( k 0 ) = P ( K n ∗ ≥ k 0 ∣ H 0 ) ≈ P ( χ ( r − 1 ) ( s − 1 ) 2 ≥ k 0 ) p(k_0)=\mathbf P(K_n^*\ge k_0|H_0)\approx\mathbf P(\chi^2_{(r-1)(s-1)}\ge k_0) p(k0​)=P(Kn∗​≥k0​∣H0​)≈P(χ(r−1)(s−1)2​≥k0​) 特别地当 r = s = 2 r=s=2 r=s=2时, K n ∗ = n ( n 11 n 22 − n 12 n 21 ) 2 n 1 ⋅ n 2 ⋅ n ⋅ 1 n ⋅ 2 ⟶ L χ 1 2 K_n^*=\frac{n(n_{11}n_{22}-n_{12}n_{21})^2}{n_{1\cdot}n_{2\cdot}n_{\cdot1}n_{\cdot 2}}\stackrel{\mathscr L}{\longrightarrow }\chi^2_1 Kn∗​=n1⋅​n2⋅​n⋅1​n⋅2​n(n11​n22​−n12​n21​)2​⟶L​χ12​

3.列联表中的齐一性检验

设有 r r r个生产同一产品的工厂,生产 s s s个不同等级的产品,第 i i i个工厂的 j j j等品率为 p i ( j ) p_i(j) pi​(j),现在从第 i i i个工厂取出 n i ⋅ n_{i\cdot} ni⋅​个产品,记录 j j j等品 n i j n_{ij} nij​个。齐一性检验检验的是 r r r个工厂产品质量相同,即 H 0 : p 1 ( j ) = p 2 ( j ) = ⋯ = p r ( j ) , j = 1 , 2 , ⋯   , s H_0:p_1(j)=p_2(j)=\cdots=p_r(j),j=1,2,\cdots,s H0​:p1​(j)=p2​(j)=⋯=pr​(j),j=1,2,⋯,s 如果分布是完全已知的,即 p 1 ( j ) = ⋯ p r ( j ) = p j 0 p_1(j)=\cdots p_r(j)=p_j^0 p1​(j)=⋯pr​(j)=pj0​,且 p 1 0 , ⋯   , p s 0 p_1^0,\cdots,p_s^0 p10​,⋯,ps0​均已知且和为1,此时 K = K n = ∑ i = 1 r ∑ j = 1 s ( n i j − n i ⋅ p j 0 ) 2 n i ⋅ p j 0 K=K_n=\sum_{i=1}^r\sum_{j=1}^s\frac{(n_{ij}-n_{i\cdot }p_j^0)^2}{n_{i\cdot }p_j^0} K=Kn​=i=1∑r​j=1∑s​ni⋅​pj0​(nij​−ni⋅​pj0​)2​ 当 H 0 H_0 H0​成立时,有 K n ⟶ L χ ( s − 1 ) r 2 K_n\stackrel{\mathscr L}{\longrightarrow }\chi^2_{(s-1)r} Kn​⟶L​χ(s−1)r2​。

如果分布未知,则 K n ∗ = n ( ∑ i = 1 r ∑ j = 1 s n i j 2 n i ⋅ n ⋅ j − 1 ) ⟶ L χ ( r − 1 ) ( s − 1 ) 2 K_n^*=n\left( \sum_{i=1}^r\sum_{j=1}^s\frac{n_{ij}^2}{n_{i\cdot}n_{\cdot j}}-1 \right)\stackrel{\mathscr L}{\longrightarrow }\chi^2_{(r-1)(s-1)} Kn∗​=n(i=1∑r​j=1∑s​ni⋅​n⋅j​nij2​​−1)⟶L​χ(r−1)(s−1)2​ 齐一性检验与独立性检验的区别,就在于 n i ⋅ n_{i\cdot} ni⋅​是事先给定的,没有随机性;而独立性检验中 n i ⋅ n_{i\cdot} ni⋅​是随机变量。但在独立性检验中成立的结论在齐一性检验中依然适用。

4.柯尔莫哥洛夫检验

对于拟合优度检验,Pearson χ 2 \chi^2 χ2检验虽然适用于任何总体分布,但当理论分布是连续分布时,柯尔莫哥洛夫检验效果更好。

要检验如下假设 H 0 : F ( x ) = F 0 ( x ) H_0:F(x)=F_0(x) H0​:F(x)=F0​(x),则从样本出发得到经验分布函数记作 F n ( x ) F_n(x) Fn​(x),定义柯氏距离 D n = sup ⁡ − ∞ < x < + ∞ ∣ F n ( x ) − F 0 ( x ) ∣ D_n=\sup_{-\infty



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3