6.3 多个自变量的多重线性回归分析(1) |
您所在的位置:网站首页 › spss进行线性回归分析过程 › 6.3 多个自变量的多重线性回归分析(1) |
6.3 多个自变量的多重线性回归分析(1)
最后更新:2024-06-20
多重线性回归分析(multiple linear regression,MLR),是研究一个应变量与多个自变量间线性因果关系的统计方法,是两变量线性回归的简单扩展,模型估计方法、解释、评价及诊断等均与之基本相同。 应用场景:1个应变量为计量资料,多个自变量(计量、计数等不限数据类型),研究这些因(自变量)对果(应变量)的影响,或者在控制某些因素的情况下,研究特定的因->果关系。 前提条件:与简单线性回归的LINE假设相似,但主要是从残差角度进行假定: L(inear Function): 应变量均值$E(Y_i)$与自变量$(x_{1i}, x_{2i},...)$向量之间存在线性关系; I(ndependent): 残差($\epsilon_i$)相互独立. N(ormally Distributed): 在向量 $(x_{1i}, x_{2i},...)$ 条件下的残差($\epsilon_i$)服从正态分布; E(qual variances): 在向量 $(x_{1i}, x_{2i},...)$ 条件下的残差($\epsilon_i$)等方差($ \sigma_i $);还有一条,自变量之间的相互性不能太强,否则会产生多重共性线问题(此时模型的估计将出现偏差)。 【例】子代身高与父母身高的线性关系Francis Galton (弗朗西斯 高尔顿)在1886年发表了论文 Regression Towards Mediocrity in Hereditary Stature,首次将统计学应用于生物学研究,开生物统计之先河。 感谢 James A. Hanley 为我们整理了Galton 论文中的原始数据(204个家庭父母及子女的身高数据,原论文中为205家庭);我们就以这些开创了一个新学科的数据为例,探究一下100多年前的英国,成年子女身高与父母身高之间的线性关系。 利用统计程序,我们从上述204个家庭中,每个家庭随机抽取1名成年子女(不限男女,当然若仅有1名子女则100%抽中),共有204名不同性别的子女及其父母的身高数据进入数据集,如下: (注:原身高数据单位为英寸,框中身高数据已变换为厘米单位,性别的编码为1-male,2-female,当然也可用0、1编码等不同方式) 对于本例数据,我们先进行线性模型的估计和检验,再进行模型的诊断。 1. 多重线性回归分析操作在SPSS中,多重线性回归分析与简单线性回归分析使用同一个对话框,操作几乎完全一样,不同之处就是有多个待选的自变量时,可进行自变量的筛选。 选择分析菜单【Analyze】中回归分析【Regression】项下的【Linear】,设置子女身高为应变量,父亲、母亲及子女的性别为自变量(3个自变量): 上图中Method为自变量的筛选方法,先保持默认的Enter,即所有放入Independents列表中的变量均进入回归模型。 设置好以后点击上图中的【OK】即可输出统计结果。 2. 结果解读本例共输出4个统计表,因使用Enter模式,全部自变量进入模型,故忽略第1个表,按照回归分析的内容,分述如下: 2.1 多重线性回归方程的估计由Coefficients表, 可得如下的多重线性回归方程: $$ \hat{y} = 75.363 + 0.350 \cdot x_1 + 0.324 \cdot x_2 - 13.260 \cdot x_3 $$ 式中$y$为子女身高,$x_1$为父亲身高,$x_2$为母亲身高,$x_3$为子女性别。 2.2 多重线性回归模型的检验ANOVA表是针对模型整体进行检验的结果: $F=115.29, p |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |