6.3 多个自变量的多重线性回归分析(1)

您所在的位置:网站首页 spss进行线性回归分析过程 6.3 多个自变量的多重线性回归分析(1)

6.3 多个自变量的多重线性回归分析(1)

2024-07-16 15:51| 来源: 网络整理| 查看: 265

6.3 多个自变量的多重线性回归分析(1) 最后更新:2024-06-20

多重线性回归分析(multiple linear regression,MLR),是研究一个应变量与多个自变量间线性因果关系的统计方法,是两变量线性回归的简单扩展,模型估计方法、解释、评价及诊断等均与之基本相同。

应用场景:

1个应变量为计量资料,多个自变量(计量、计数等不限数据类型),研究这些因(自变量)对果(应变量)的影响,或者在控制某些因素的情况下,研究特定的因->果关系。

前提条件:

与简单线性回归的LINE假设相似,但主要是从残差角度进行假定:

L(inear Function): 应变量均值$E(Y_i)$与自变量$(x_{1i}, x_{2i},...)$向量之间存在线性关系; I(ndependent): 残差($\epsilon_i$)相互独立. N(ormally Distributed): 在向量 $(x_{1i}, x_{2i},...)$ 条件下的残差($\epsilon_i$)服从正态分布; E(qual variances): 在向量 $(x_{1i}, x_{2i},...)$ 条件下的残差($\epsilon_i$)等方差($ \sigma_i $);

还有一条,自变量之间的相互性不能太强,否则会产生多重共性线问题(此时模型的估计将出现偏差)。

【例】子代身高与父母身高的线性关系

Francis Galton (弗朗西斯 高尔顿)在1886年发表了论文 Regression Towards Mediocrity in Hereditary Stature,首次将统计学应用于生物学研究,开生物统计之先河。

感谢 James A. Hanley 为我们整理了Galton 论文中的原始数据(204个家庭父母及子女的身高数据,原论文中为205家庭);我们就以这些开创了一个新学科的数据为例,探究一下100多年前的英国,成年子女身高与父母身高之间的线性关系。

利用统计程序,我们从上述204个家庭中,每个家庭随机抽取1名成年子女(不限男女,当然若仅有1名子女则100%抽中),共有204名不同性别的子女及其父母的身高数据进入数据集,如下:

(注:原身高数据单位为英寸,框中身高数据已变换为厘米单位,性别的编码为1-male,2-female,当然也可用0、1编码等不同方式)

对于本例数据,我们先进行线性模型的估计和检验,再进行模型的诊断。

1. 多重线性回归分析操作

在SPSS中,多重线性回归分析与简单线性回归分析使用同一个对话框,操作几乎完全一样,不同之处就是有多个待选的自变量时,可进行自变量的筛选。

选择分析菜单【Analyze】中回归分析【Regression】项下的【Linear】,设置子女身高为应变量,父亲、母亲及子女的性别为自变量(3个自变量):

上图中Method为自变量的筛选方法,先保持默认的Enter,即所有放入Independents列表中的变量均进入回归模型。

设置好以后点击上图中的【OK】即可输出统计结果。

2. 结果解读

本例共输出4个统计表,因使用Enter模式,全部自变量进入模型,故忽略第1个表,按照回归分析的内容,分述如下:

2.1 多重线性回归方程的估计

由Coefficients表,

可得如下的多重线性回归方程: $$ \hat{y} = 75.363 + 0.350 \cdot x_1 + 0.324 \cdot x_2 - 13.260 \cdot x_3 $$

式中$y$为子女身高,$x_1$为父亲身高,$x_2$为母亲身高,$x_3$为子女性别。

2.2 多重线性回归模型的检验

ANOVA表是针对模型整体进行检验的结果:

$F=115.29, p



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3