一元线性回归模型

您所在的位置:网站首页 一元线性回归预测模型 一元线性回归模型

一元线性回归模型

2023-04-07 09:31| 来源: 网络整理| 查看: 265

以身高体重数据为例进行说明,因变量是体重,自变量是身高。如图是在散点图的基础上,又加了一条穿过这些点的中心的直线,这些观测点基本上都在直线附近,可以认为二者大体上呈现了线性关系。这条直线的斜率是正的,也就是说,身高更高的人体重会更重,身高低的人体重更轻。这条直线如果越陡,代表身高的单位变化所导致的体重的差异更大。直线的陡峭程度由它的斜率来度量,所以如果可以获得直线的斜率,就知道了身高每增加一公分,体重平均会增加多少公斤。如果还可以得到直线的截距项,也就是说当时候,这条直线与轴相交的点,那么这条直线就可以用方程表示出来。本例中的这条直线的斜率和截距项分别为1.3和-160,那么这条直线的方程为

 

体重 = -160 + 1.3×身高

 

其中,斜率1.3的含义是如果两个人身高相差1公分,那么平均体重相差1.3公斤。这样的一条直线就是回归直线,这个直线的方程就是回归方程,它用很简洁的方式总结了两个变量的关系。如果擦去原有的观测点只保留这条直线,仍然可以很清楚的了解体重和身高的相关性。所以,相关分析中只能得到相关系数,也就是两个变量的相关程度,而回归直线具体描述了因变量是如何随一个或多个自变量的变化而变化的。

 

 

 身体体重数据散点图(包含回归直线)

 

从图中可以发现,这些点落在直线附近但又不完全在一条直线上,说明和并非确定性的函数关系。事实上影响体重的因素除了身高之外还有很多其他因素,如遗传基因、营养摄入、收入等会对体重产生影响,把除了之外的所有影响的因素记为,可以建立如下的一元线性回归模型:

 

 

其中,和为回归系数;为随机误差项,表示除去之外的其他一切被忽略的、没有考虑到的因素引起的的变化。由于误差项的存在,观测值不可能刚好在这条直线上,但是如果这个模型能够将和的关系描述的比较好的话,这些观测值不会离这条直线太远。对随机误差项需要做如下三个基本假定:

 

(1),的期望为0。

 

(2),即对于所有的而言具有同方差性。

 

(3)服从正态分布,且相互独立。

 

对一元线性回归模型两边求数学期望得:

 

 

从平均意义上表达了变量与的统计规律性,这一点在应用上是非常重要的,因为我们经常关心的正是这个平均值。

 

理论回归模型中的参数是未知的,回归分析的主要任务就是通过样本观测值对进行估计,在此用 分别表示的估计值:

 

 

称上式为估计的线性回归方程。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3