基于spss的分段回归模型
一、简介二、模型分析三、基于spss的案例分析(一)图像分析(二)回归分析
参考文章:
一、简介
分段线性回归是指当y对x的回归在x的某一范围的服从某种线性关系,在其他范围内又服从斜率不同的线性关系时适用的一种回归估计方法。这种方法使用指示变量对各段(即不同范围的)数据同时拟合统—的回归模型 。 某些变量之间的关系非常有趣,不是恒久的线性或非线性关系,可能其中一段表现为线性,而另一段表现为非线性。例如,我们举一个每个人都有切身体会的例子,人的身高和年龄的关系,在3岁到10岁期间,它们基本是线性相关,而高中以后,身高基本定型,不再随年龄的增加而增长。对于这样的变量关系,在3到10岁期间,我们可以用一个线性方程来拟合年龄和身高的关系,而高中以后则需要换另一个方程,可以是线性的,也可以是非线性的,需要根据数据情况来选择。这就是分段回归模型的分析思路。 通常的做法是对每个部分进行单独拟合,但是这样做参数较多,且样本被人为分开,当样本量较小时会导致分析结果的准确性很差。 SPSS的非线性回归模块完美的解决了这个问题,可直接对分段函数进行直接拟合,以充分利用信息,提高模型的预测精度。由于原理简单,我们下面用一个具体的案例来介绍如何利用SPSS进行分段回归模型拟合。
二、模型分析
分段线性回归模型由两条直线组成,但在折点处曲线仍是连续的。考虑以下的基本模型:
Y
i
=
β
0
+
β
1
X
t
+
u
t
Y_{i}=\beta_{0}+\beta_{1}X_{t}+u_{t}
Yi=β0+β1Xt+ut 假定因变量
Y
Y
Y和解释变量
X
X
X均呈现随时间稳定增长的趋势,在时间
t
=
t
0
t=t_{0}
t=t0处反映两者之间关系的曲线出现转折,使得两段曲线的截距和斜率都发生变化,但
Y
Y
Y的变化具有连续性。我们设定以下形式的虚拟变量:
D
t
=
{
0
,
(
t
<
t
0
)
1
,
(
t
≥
t
0
)
D_{t}=\left\{\begin{matrix} 0,\: \: (t |