16.第六章 非参数假设检验(2) |
您所在的位置:网站首页 › 独立性检验的临界值表要背吗 › 16.第六章 非参数假设检验(2) |
第六章 非参数假设检验(2)
1.拟合优度检验
拟合优度,即利用总体 X X X中抽取的样本 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn,来检验 H 0 : r.v. X 的 分 布 为 F H_0:\text{r.v. }X的分布为F H0:r.v. X的分布为F这一假设。然而,对于总体分布,用符号、不符合这种说法未免过于绝对,因此通常是提出一个介于0到1之间的数值来衡量拟合的优劣程度,称作拟合优度。 拟合优度一般如此定义: p ( d 0 ) = P ( D ≥ d 0 ∣ H 0 ) p(d_0)=P(D\ge d_0|H_0) p(d0)=P(D≥d0∣H0),这里 D D D是一种样本之于给定分布的偏差,是一个统计量,有许多的定义方式; d 0 d_0 d0就是统计量 D D D对于给定样本的观测值。 当理论分布完全已知的时候,可以采用Pearson χ 2 \chi^2 χ2检验,它又分为几种类型。 随机变量 X X X为离散型,且只取有限个值 a 1 , ⋯ , a r a_1,\cdots,a_r a1,⋯,ar的情形。 设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn为从总体 X X X中抽取的简单样本,理论分布为 F : ( a 1 a 2 ⋯ a r p 1 p 2 ⋯ p r ) F:\left( \begin{array}{c} a_1&a_2&\cdots&a_r\\ p_1&p_2&\cdots&p_r \end{array} \right) F:(a1p1a2p2⋯⋯arpr) 且 p 1 , ⋯ , p r p_1,\cdots,p_r p1,⋯,pr已知, ∑ i = 1 r p i = 1 \sum_{i=1}^r p_i=1 ∑i=1rpi=1,检验的问题表示为 H 0 : P ( X = a i ) = p i , i = 1 , ⋯ , r H_0:P(X=a_i)=p_i,\quad i=1,\cdots,r H0:P(X=ai)=pi,i=1,⋯,r 设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn中,等于 a i a_i ai的个数为 ν i \nu_i νi(观察频数),按照分布 F F F的理想情况,每一个 a i a_i ai对应的理论频数应该是 n p i np_i npi,当 n n n充分大的时候观察频数应该趋近于理论频数,因此取检验统计量为 ∑ i = 1 r c i ( ν i / n − p i ) 2 \sum_{i=1}^rc_i(\nu_i/n-p_i)^2 ∑i=1rci(νi/n−pi)2,特别地,取 c i = n / p i c_i=n/p_i ci=n/pi,得到 K n = ∑ i = 1 r ( ν i − n p i ) 2 n p i ⟶ L χ r − 1 2 K_n=\sum_{i=1}^r \frac{(\nu_i-np_i)^2}{np_i}\stackrel{\mathscr L}{\longrightarrow }\chi^2_{r-1} Kn=i=1∑rnpi(νi−npi)2⟶Lχr−12 这样,当 K n K_n Kn过大,具体地说就是 K n > χ r − 1 2 ( α ) K_n>\chi^2_{r-1}(\alpha) Kn>χr−12(α)时拒绝 H 0 H_0 H0。按照前面的方式定义拟合优度,就是 p ( k 0 ) = P ( K n ≥ k 0 ∣ H 0 ) ≈ P ( χ r − 1 2 ≥ k 0 ) p(k_0)=\mathbf P(K_n\ge k_0|H_0)\approx\mathbf P(\chi^2_{r-1}\ge k_0) p(k0)=P(Kn≥k0∣H0)≈P(χr−12≥k0) 理论分布为任一确定分布的情形。 此时,取 r − 1 r-1 r−1个常数 a 0 = − ∞ < a 1 < ⋯ < a r = ∞ a_0=-\inftyχ(r−1)(s−1)2(α)则否定假设,否则接受。检验的拟合优度是 p ( k 0 ) = P ( K n ∗ ≥ k 0 ∣ H 0 ) ≈ P ( χ ( r − 1 ) ( s − 1 ) 2 ≥ k 0 ) p(k_0)=\mathbf P(K_n^*\ge k_0|H_0)\approx\mathbf P(\chi^2_{(r-1)(s-1)}\ge k_0) p(k0)=P(Kn∗≥k0∣H0)≈P(χ(r−1)(s−1)2≥k0) 特别地当 r = s = 2 r=s=2 r=s=2时, K n ∗ = n ( n 11 n 22 − n 12 n 21 ) 2 n 1 ⋅ n 2 ⋅ n ⋅ 1 n ⋅ 2 ⟶ L χ 1 2 K_n^*=\frac{n(n_{11}n_{22}-n_{12}n_{21})^2}{n_{1\cdot}n_{2\cdot}n_{\cdot1}n_{\cdot 2}}\stackrel{\mathscr L}{\longrightarrow }\chi^2_1 Kn∗=n1⋅n2⋅n⋅1n⋅2n(n11n22−n12n21)2⟶Lχ12 3.列联表中的齐一性检验设有 r r r个生产同一产品的工厂,生产 s s s个不同等级的产品,第 i i i个工厂的 j j j等品率为 p i ( j ) p_i(j) pi(j),现在从第 i i i个工厂取出 n i ⋅ n_{i\cdot} ni⋅个产品,记录 j j j等品 n i j n_{ij} nij个。齐一性检验检验的是 r r r个工厂产品质量相同,即 H 0 : p 1 ( j ) = p 2 ( j ) = ⋯ = p r ( j ) , j = 1 , 2 , ⋯ , s H_0:p_1(j)=p_2(j)=\cdots=p_r(j),j=1,2,\cdots,s H0:p1(j)=p2(j)=⋯=pr(j),j=1,2,⋯,s 如果分布是完全已知的,即 p 1 ( j ) = ⋯ p r ( j ) = p j 0 p_1(j)=\cdots p_r(j)=p_j^0 p1(j)=⋯pr(j)=pj0,且 p 1 0 , ⋯ , p s 0 p_1^0,\cdots,p_s^0 p10,⋯,ps0均已知且和为1,此时 K = K n = ∑ i = 1 r ∑ j = 1 s ( n i j − n i ⋅ p j 0 ) 2 n i ⋅ p j 0 K=K_n=\sum_{i=1}^r\sum_{j=1}^s\frac{(n_{ij}-n_{i\cdot }p_j^0)^2}{n_{i\cdot }p_j^0} K=Kn=i=1∑rj=1∑sni⋅pj0(nij−ni⋅pj0)2 当 H 0 H_0 H0成立时,有 K n ⟶ L χ ( s − 1 ) r 2 K_n\stackrel{\mathscr L}{\longrightarrow }\chi^2_{(s-1)r} Kn⟶Lχ(s−1)r2。 如果分布未知,则 K n ∗ = n ( ∑ i = 1 r ∑ j = 1 s n i j 2 n i ⋅ n ⋅ j − 1 ) ⟶ L χ ( r − 1 ) ( s − 1 ) 2 K_n^*=n\left( \sum_{i=1}^r\sum_{j=1}^s\frac{n_{ij}^2}{n_{i\cdot}n_{\cdot j}}-1 \right)\stackrel{\mathscr L}{\longrightarrow }\chi^2_{(r-1)(s-1)} Kn∗=n(i=1∑rj=1∑sni⋅n⋅jnij2−1)⟶Lχ(r−1)(s−1)2 齐一性检验与独立性检验的区别,就在于 n i ⋅ n_{i\cdot} ni⋅是事先给定的,没有随机性;而独立性检验中 n i ⋅ n_{i\cdot} ni⋅是随机变量。但在独立性检验中成立的结论在齐一性检验中依然适用。 4.柯尔莫哥洛夫检验对于拟合优度检验,Pearson χ 2 \chi^2 χ2检验虽然适用于任何总体分布,但当理论分布是连续分布时,柯尔莫哥洛夫检验效果更好。 要检验如下假设 H 0 : F ( x ) = F 0 ( x ) H_0:F(x)=F_0(x) H0:F(x)=F0(x),则从样本出发得到经验分布函数记作 F n ( x ) F_n(x) Fn(x),定义柯氏距离 D n = sup − ∞ < x < + ∞ ∣ F n ( x ) − F 0 ( x ) ∣ D_n=\sup_{-\infty |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |