什么是过拟合？

2024-07-11 05:51| 来源: 网络整理| 查看: 265

您可以通过多样化和扩展训练数据集或者使用其他一些数据科学策略（如下文所述）防止过拟合。提前停止在机器学习模型学习数据中的噪音之前，提前停止会暂停训练阶段。但是，正确的时间至关重要；否则模型仍然无法提供准确的结果。修剪在构建模型时，您可能会确定影响最终预测的几个特征或参数。特征选择（或修剪）可识别训练集中最重要的特征，并消除不相关的特征。例如，要预测的图像是动物还是人类，您可以查看各种输入参数，例如脸型、耳朵位置、体型等。您可以优先考虑脸型，而忽略眼型。正则化正则化指旨在减少过拟合的训练/优化技术的集合。这些方法尝试根据重要性对特征进行评分，从而消除不会影响预测结果的因素。例如，数学计算会将惩罚值应用于影响最小的特征。考虑一个统计模型，该模型尝试预测 20 年后城市的房价。正则化为人口增长和平均年收入等特征设置较低的惩罚值，但为城市年平均气温设置较高的惩罚值。集成集成会结合来自几种独立机器学习算法的预测。某些模型被称为弱学习器，因为它们的结果通常不准确。集成方法会结合所有弱学习器，从而获得更准确的结果。这些方法使用多个模型来分析样本数据并挑选最准确的结果。有两种主要的集成方法：装袋方法和提升方法。提升方法会依次训练不同的机器学习模型以获得最终结果，而装袋方法则并行训练这些模型。数据增强数据增强是一种机器学习技术，可在模型每次处理样本数据时略微更改样本数据。您可以通过小幅更改输入数据来实现此目的。当应用于审核时，数据增强会使训练集与模型唯一匹配，并防止模型学习其特征。例如，对输入图像应用转换，例如平移、翻转和旋转。

【本文地址】

什么是过拟合？

什么是过拟合？

今日新闻

推荐新闻