误差分解; 拆分格式:
∑
i
=
1
n
(
y
i
−
y
ˉ
)
2
=
∑
i
=
1
n
(
y
^
i
−
y
ˉ
)
2
+
∑
i
=
1
n
(
y
i
−
y
^
)
2
\sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}=\sum_{i=1}^{n}\left(\hat{y}_{i}-\bar{y}\right)^{2}+\sum_{i=1}^{n}\left(y_{i}-\hat{y}\right)^{2}
∑i=1n(yi−yˉ)2=∑i=1n(y^i−yˉ)2+∑i=1n(yi−y^)2 (1)总平方和SST=
∑
i
=
1
n
(
y
i
−
y
ˉ
)
2
\sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}
∑i=1n(yi−yˉ)2;反映因变量的 n 个观察值与其均值的总误差 (2)回归平方和SSR=
∑
i
=
1
n
(
y
^
i
−
y
ˉ
)
2
\sum_{i=1}^{n}\left(\hat{y}_{i}-\bar{y}\right)^{2}
∑i=1n(y^i−yˉ)2;反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 (3)残差平方和SSE=
∑
i
=
1
n
(
y
i
−
y
^
)
2
\sum_{i=1}^{n}\left(y_{i}-\hat{y}\right)^{2}
∑i=1n(yi−y^)2。反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 判定系数
R
2
R^2
R2的计算 (1)计算公式:
R
2
=
S
S
R
S
S
T
=
∑
i
=
1
n
(
y
^
i
−
y
ˉ
)
2
∑
i
=
1
n
(
y
i
−
y
ˉ
)
2
=
1
−
∑
i
=
1
n
(
y
i
−
y
^
)
2
∑
i
=
1
n
(
y
^
i
−
y
ˉ
)
2
R^{2}=\frac{S S R}{S S T}=\frac{\sum_{i=1}^{n}\left(\hat{y}_{i}-\bar{y}\right)^{2}}{\sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}=1-\frac{\sum_{i=1}^{n}\left(y_{i}-\hat{y}\right)^{2}}{\sum_{i=1}^{n}\left(\hat{y}_{i}-\bar{y}\right)^{2}}
R2=SSTSSR=∑i=1n(yi−yˉ)2∑i=1n(y^i−yˉ)2=1−∑i=1n(y^i−yˉ)2∑i=1n(yi−y^)2; (2)反映回归直线的拟合程度; (3)取值范围在 [ 0 , 1 ] 之间; (4)判定系数等于相关系数的平方,即
R
2
=
r
2
R^2=r^2
R2=r2 标椎估计误差的计算: (1)计算公式:
s
e
=
∑
i
=
1
n
(
y
i
−
y
^
i
)
2
n
−
2
=
S
S
E
n
−
2
=
M
S
E
s_{e}=\sqrt{\frac{\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}{n-2}}=\sqrt{\frac{S S E}{n-2}}=\sqrt{M S E}
se=n−2∑i=1n(yi−y^i)2
=n−2SSE
=MSE
; (2)实际观察值与回归估计值误差平方和的均方根; (3)对误差项
ε
\varepsilon
ε的标准差σ2 的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量。
|