如何评估模型的好坏?

您所在的位置:网站首页 误差一般不超过多少 如何评估模型的好坏?

如何评估模型的好坏?

2024-07-06 14:13| 来源: 网络整理| 查看: 265

判定系数R-Squared

判定系数(coefficientof determination),常用R^2表示,用专业的说法是,用来度量因变量的总变差(变量波动大小)中可由自变量解释部分所占的比例。即预测值的总变差与真实值的总变差的比值。

简单地理解,判定系数就是专门用来衡量回归模型的拟合程度,亦即用来评估模型的质量的。

对于一元回归,判定系数R方的公式如下:

对于多元回归,此时应该使用调整R方,其公式如下:

一般来说,增加自变量的个数p时,调整R方会增大;反之,R方会减小。

所以,判定系数R^2的取值范围是[0, 1],越靠近1,说明拟合程度越高,即模型的质量也就越好。

平均绝对误差MAE

平均绝对误差MAE(MeanAbsolute Error),即误差绝对值的平均值,可以准确反映实际预测误差的大小。

其公式如下:

MAE评估的是真实值和预测值的偏离程度,即预测误差的实际大小。

MAE值越小,说明模型质量越好,预测越准确。

均方误差MSE

均方误差MSE(Mean SquareError),误差平方的平均值。

其公式如下:

一般情况下,MSE比较少单独使用,因为不好理解,多数用在方差分析和参数估计等中。

显然,MSE越小,说明模型质量越好,预测越准确。

均方根误差RMSE

均误差平方根RMSE(Root MSE),也称标准误差,是均方误差的算术平方根。

其公式如下:

相比MSE,指标RMSE这个指标与原始数据的量纲是一样的,容易理解,反映真实值与预测值的偏离程度。

RMSE越小,说明模型质量越好,预测越准确。

平均误差率MAPE

平均误差率MAPE(MeanAbsolute Percentage Error),误差百分率的绝对值的平均值。

其公式如下:

MAPE采用百分率来估计误差的大小,容易理解。

MAPE是相对值,不是绝对值。MAPE越小,说明模型质量越好。

该公式的缺点是,当有真实值为0时,公式不可用(除零错误)。

指标对比

这五个指标都可以衡量模型的好坏。严格地说,R^2主要用来衡量模型的拟合程度(模型质量好坏);其它四个指标主要用来评估预测值的准确程度。

这些指标,到底用哪个好呢,目前并没有固定的标准。

MAE和RMSE一样,衡量的是真实值与预测值的偏离的绝对大小情况;而MAPE衡量的是偏离的相对大小(即百分率)。

相对来说,MAE和MAPE不容易受极端值的影响;而MSE/RMSE采用误差的平方,会放大预测误差,所以对于离群数据更敏感,可以突出影响较大的误差值。

相对其它指标,MAPE使用百分率来衡量偏离的大小,容易理解和解读。而MAE/RMSE需要结合真实值的量纲才能判断差异。

在实际的应用中,我用得最多的是R^2和MAPE。用R^2来判断模型的拟合程度,然后用MAPE来判断预测值的误差。

一般情况下,如果R^2超过0.8,或者MAPE低于5%(月预测),应该就是较好的模型了。

但不管用哪个指标,评估模型的好坏都不能够脱离具体的应用场景和具体的数据集。单纯地评判哪个模型好坏,是基本上没有意义的。

扫码听课返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3