标准化和归一化的区别、应用场景？

您所在的位置：网站首页 › 归一化偏差en值 › 标准化和归一化的区别、应用场景？

标准化和归一化的区别、应用场景？

2023-03-08 13:01| 来源: 网络整理| 查看: 265

归一化和标准化本质上都是一种线性变换。线性变换保持线性组合与线性关系式不变，这保证了特定模型不会失效。

归一化和标准化的区别：

归一化和标准化的本质都是缩放和平移，他们的区别直观的说就是归一化的缩放是 “拍扁” 统一到区间（0-1），而标准化的缩放是更加 “弹性” 和 “动态” 的，和整体样本的分布有很大的关系。

常见的归一化方法：xi-min(xi)/(max(xi)-min(xi))

常见的标准化方法：xi-mean(xi)/sd(xi)

从输出范围角度来看，归一化的输出结果必须在 0-1 间。而标准化的输出范围不受限制，通常情况下比归一化更广。

标准化与归一化的应用场景：

一般情况下，如果对输出结果范围有要求，用归一化。如果数据较为稳定，不存在极端的最大最小值，用归一化。如果数据存在异常值和较多噪音，用标准化，可以间接通过中心化避免异常值和极端值的影响。

在机器学习中，标准化是更常用的手段，归一化的应用场景是有限的。其原因就在于二者的区别：

1、标准化更好保持了样本间距。当样本中有异常点时，归一化有可能将正常的样本“挤”到一起去。比如三个样本，某个特征的值为1,2,10000，假设10000这个值是异常值，用归一化的方法后，正常的1,2就会被“挤”到一起去。如果不幸的是1和2的分类标签还是相反的，那么，当我们用梯度下降来做分类模型训练时，模型会需要更长的时间收敛，因为将样本分开需要更大的努力！而标准化在这方面就做得很好，至少它不会将样本“挤到一起”。

2、标准化更符合统计学假。对一个数值特征来说，很大可能它是服从正态分布的。标准化其实是基于这个隐含假设，只不过是略施小技，将这个正态分布调整为均值为0，方差为1的标准正态分布而已。

【本文地址】

标准化和归一化的区别、应用场景？

标准化和归一化的区别、应用场景？

今日新闻

推荐新闻