常见回归评估指标

您所在的位置:网站首页 lof函数解释 常见回归评估指标

常见回归评估指标

2024-01-23 10:30| 来源: 网络整理| 查看: 265

1 . 解释方差分(explained_variance_score)

explained_variance_score:解释方差分,这个指标用来衡量我们模型对数据集波动的解释程度,如果取值为1时,模型就完美,越小效果就越差.

e x p l a i n e d _ v a r i a n c e ( y , y ^ ) = 1 − V a r { y − y ^ } V a r { y } explained\_variance(y,\hat{y}) = 1 - \frac{Var\{y - \hat{y}\}}{Var\{y\}} explained_variance(y,y^​)=1−Var{y}Var{y−y^​}​

其中y是真实值, y ^ \hat{y} y^​是预测值, var是方差

from sklearn.metrics import explained_variance_score y_true = [3, -0.5, 2, 7] y_pred = [2.5, 0, 2, 8] explained_variance_score(y_true, y_pred) # 多维的y值可以通过multioutput控制输出的得分维度. y_true = np.array([[0.5, 1], [-1, 1], [7, -6]]) y_pred = np.array([[0, 2], [-1, 2], [8, -5]]) # 原始维度一个维度算一个得分 explained_variance_score(y_true, y_pred, multioutput='raw_values') # 最终得分的比例 explained_variance_score(y_true, y_pred, multioutput=[0.3, 0.7]) 2. Mean absolute error(平均绝对误差)

M A E ( y , y ^ ) = 1 n s a m p l e s ∑ i = 0 n s a m p l e s − 1 ∣ y i − y i ^ ∣ MAE(y, \hat{y}) = \frac{1}{n_{samples}}\sum^{n_{samples-1}}_{i=0}|y_{i} - \hat{y_{i}}| MAE(y,y^​)=nsamples​1​i=0∑nsamples−1​​∣yi​−yi​^​∣

其中y是真实值, y ^ \hat{y} y^​是预测值

给定数据点的平均绝对误差,一般来说取值越小,模型的拟合效果就越好。

sklearn中的使用方法和解释方差分一样.

MAE是L1损失的期望.

3. Mean squared error(均方误差)

M S E ( y , y ^ ) = 1 n s a m p l e s ∑ i = 0 n s a m p l e s − 1 ( y i − y i ^ ) 2 MSE(y, \hat{y}) = \frac{1}{n_{samples}}\sum^{n_{samples-1}}_{i=0}(y_{i} - \hat{y_{i}})^2 MSE(y,y^​)=nsamples​1​i=0∑nsamples−1​​(yi​−yi​^​)2

MSE是回归任务最常用的性能度量之一.

sklearn中的使用方法类似.

4. Mean squared logarithmic error(均方对数误差)

M S L E ( y , y ^ ) = 1 n s a m p l e s ∑ i = 0 n s a m p l e s − 1 ( log ⁡ ( 1 + y i ) − log ⁡ ( 1 + y i ^ ) ) 2 MSLE(y, \hat{y}) = \frac{1}{n_{samples}}\sum^{n_{samples-1}}_{i=0}(\log(1 + y_i) - \log(1 + \hat{y_i}))^2 MSLE(y,y^​)=nsamples​1​i=0∑nsamples−1​​(log(1+yi​)−log(1+yi​^​))2

当目标实现指数增长时,例如人口数量、一种商品在几年时间内的平均销量等,这个指标最适合使用。

y值存在负数的话,这个指标不能用.

5. Median absolute error(中位数绝对误差)

M e d A E ( y , y ^ ) = m e d i a n ( ∣ y 1 − y 1 ^ ∣ , . . . , ∣ y n − y n ^ ∣ ) MedAE(y, \hat{y}) = median(|y_1 - \hat{y_1}|, ...,|y_n - \hat{y_n}|) MedAE(y,y^​)=median(∣y1​−y1​^​∣,...,∣yn​−yn​^​∣)

中位数绝对误差适用于包含异常值的数据的衡量.

6. R² score(决定系数、R方)

R 2 ( y , y ^ ) = 1 − ∑ i = 1 n ( y i − y i ^ ) 2 ∑ i = 1 n ( y i − y i ˉ ) 2 R^2(y, \hat{y}) = 1 - \frac{\sum^{n}_{i=1}(y_i - \hat{y_i})^2}{\sum^{n}_{i=1}(y_i - \bar{y_i})^2} R2(y,y^​)=1−∑i=1n​(yi​−yi​ˉ​)2∑i=1n​(yi​−yi​^​)2​

其中 y ˉ \bar{y} yˉ​是y的平均值

R方是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程中拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。 R越接近1,表明回归平方和占总平方和的比例越大,回归线与各观测点越接近,用x的变化来解释y值变差的部分就越多,回归的拟合程度就越好。

一般来说,增加自变量的个数,回归平方和会增加,残差平方和会减少,所以R方会增大;反之,减少自变量的个数,回归平方和减少,残差平方和增加。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3