【统计学习系列】多元线性回归模型(五)

您所在的位置:网站首页 显著性检验如果t值小于2 【统计学习系列】多元线性回归模型(五)

【统计学习系列】多元线性回归模型(五)

2024-07-02 14:50| 来源: 网络整理| 查看: 265

文章目录 1. 前文回顾 2. 单参数显著性检验——t检验 2.1 问题的提出 2.2 检验统计量——t统计量的构造 2.3 拒绝域的构造 2.4 浅谈p值 3. 回归方程显著性检验——F检验 3.1 问题的提出 3.2 F检验统计量的构造 3.3 拒绝域的构造 4. 总结 参考文献 写在最后

【更新日志】 5/1/2020 对文章中公式与措辞中存在的问题进行修正(感谢评论区小伙伴的指正!)

1. 前文回顾

在上一篇文章中,我们分别研究了最小二乘估计量 β^OLS 和 σ^OLS 的相关性质,证明了 β^OLS 是 β 的一个最优线性无偏估计量(BLUE), σ^2OLS 是 σ2 的一个无偏估计量,并得到了其在正态性误差假设下所对应的分布: β ^ O L S ∼ N ( β , σ 2 ( X T X ) − 1 ) \bm{\hat\beta}_{OLS} \thicksim N(\bm\beta, \sigma^2 ( \bm{X}^T \bm{X} )^{-1} ) β^​OLS​∼N(β,σ2(XTX)−1) σ ^ O L S 2 σ 2 ∼ χ N − p − 1 2 \frac {\hat \sigma _{OLS}^2} {\sigma^2} \thicksim \chi^2_{N-p-1} σ2σ^OLS2​​∼χN−p−12​

(详情请见:【统计学习系列】多元线性回归模型(三)——参数估计量的性质)。

通过最小二乘法拟合好模型的参数后,一个重要的问题就是:这个模型真的“好"吗?满足什么条件、什么性质的模型可以称作一个“好模型”呢?

2. 单参数显著性检验——t检验 2.1 问题的提出

首先,我们应该想到的问题是,在一个多元回归模型中,是不是每一个引入的自变量对因变量都有实实在在的影响呢?这样的影响是显著的吗?我们应不应该在模型中保留这一变量呢?

在回答这些问题之前,我们先回顾一下总体模型: Y = β 0 + ∑ i = 1 p X i β i + ϵ Y= \beta_0 + \sum_{i=1}^{p} X_{i} \beta_i + \epsilon Y=β0​+i=1∑p​Xi​βi​+ϵ其中: ϵ ∼ N ( 0 , σ 2 ) \epsilon \thicksim N(0,\sigma^2) ϵ∼N(0,σ2) 让我们聚焦众多参数中的一个:βi 。βi 的意义是什么呢?当其他变量保持不变,而只有 Xi 变动时,每变动一个单位的 Xi,就会让 Y 平均变动 βi 个单位。而若 Xi 的变动能够确确实实引起 Y 的变动, 那么 βi 应该不等于0。换句话说,若可以验证 βi 不为0,那么就可以证明Xi 与 Y 存在线性相关关系。

【注1】 这里的关系是线性的。二次即更高阶的相关性并不能由 βi 是否等于0体现; 【注2】 Xi 与 Y 存在相关关系,并不能证明二者之间存在 因果关系(Causality)。

然而,我们现在只有 βi 的估计量 β^OLS,i ,而估计量与参数的真实值有一定的误差。由于 β^OLS,i 是一个统计量,因此只要我们在统计意义下验证 βi 是否等于零就可以了。

至此,我们就可以构造一个如下的假设检验问题:

H 0 : β i = 0 H 1 : β i ≠ 0 H_0: \beta_i=0 \\ H_1: \beta_i\ne0 H0​:βi​=0H1​:βi​​=0

2.2 检验统计量——t统计量的构造

若想构造检验统计量,我们需要先对 β^OLS,i 进行变型。

记矩阵 (XTX)-1 的对角线元素:

diag ( X T X ) − 1 = ( v i , i ) p + 1 \text{diag}(\bm{X}^T \bm{X} )^{-1} = (v_{i,i})_{p+1} diag(XTX)−1=(vi,i​)p+1​

由第一部分中 β^OLS 服从的分布,我们可以得到 β^OLS,i 的分布:

β ^ O L S , i ∼ N ( β i , σ 2 v i , i ) ,   i = 0 , 1 , . . . , p \hat\beta_{OLS, i} \thicksim N(\beta_i, \sigma^2 v_{i,i}) , \ i=0, 1,...,p β^​OLS,i​∼N(βi​,σ2vi,i​), i=0,1,...,p

将 β^OLS 标准化,有: β ^ O L S , i − β i σ v i , i ∼ N ( 0 , 1 ) ,   i = 0 , 1 , . . . , p \frac {\hat\beta_{OLS,i} - \beta_i}{ \sigma \sqrt{v_{i,i}} } \thicksim N(0, 1) , \ i=0, 1,...,p σv



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3