选择性能指标 在回归问题中,经常使用均方根误差(RMSE)来衡量,它是预测错误的标准差,公式如下:
R
M
S
E
(
X
,
h
)
=
1
m
∑
i
=
1
m
(
h
(
x
(
i
)
−
y
(
i
)
)
2
{\rm{RMSE}}(X,h) = \sqrt {{1 \over m}\sum\limits_{i = 1}^m {(h({x^{(i)}}} - {y^{(i)}}{)^2}}
RMSE(X,h)=m1i=1∑m(h(x(i)−y(i))2
当有很多离群区域时,可以使用平均绝对误差。公式如下:
M
A
E
(
X
,
h
)
=
1
m
∑
i
=
1
m
∣
(
h
(
x
(
i
)
−
y
(
i
)
)
∣
{\rm{MAE}}(X,h) = {1 \over m}\sum\limits_{i = 1}^m {|(h({x^{(i)}}} - {y^{(i)}})|
MAE(X,h)=m1i=1∑m∣(h(x(i)−y(i))∣ 方根误差和平均误差都是测量两个向量的距离:预测向量和目标值向量。距离或者范数的测度:
计算平方根的和(RMSE)对应欧几里得范数:l2范数。计算绝对值的总和(MAE)对应l1范数。 包含n个元素Vk的范数可以定义为:
∣
∣
V
k
∣
∣
=
(
∣
v
0
∣
k
+
∣
v
1
∣
k
+
.
.
.
+
∣
v
n
∣
k
)
1
k
.
l
0
||{V_k}|| = {(|{v_0}{|^k} + |{v_1}{|^k} + ... + |{v_n}{|^k})^{{1 \over k}}}.{l_0}
∣∣Vk∣∣=(∣v0∣k+∣v1∣k+...+∣vn∣k)k1.l0 l0给出了向量基数,loo给出了向量中的最大绝对值。范数指数越高,越关注大的价值,RMSE比MAE对异常值更敏感。 提供给机器 学习系统的信息称为信号,需要提高信噪比。 对于正态分布:大约68%的值落在1σ内,95%落 在2σ内,99.7%落在3σ内。
|