四种常用的数据标准化方法

您所在的位置:网站首页 数据新闻分析方法哪四种 四种常用的数据标准化方法

四种常用的数据标准化方法

2024-07-10 06:28| 来源: 网络整理| 查看: 265

四种常用的数据标准化方法 数据标准化什么是数据标准化?为什么要数据标准化?数据标准化的作用常用四种数据标准化方法1.最小-最大标准化2.Z分数标准化3.小数定标标准化4.总和归一标准化

数据标准化 什么是数据标准化?

数据标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

为什么要数据标准化?

在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。

数据标准化的作用

数据标准化不但能提高模型的收敛速度,也能提升模型的精度。比如聚类分析中对象之间距离的计算,归一化可抑制指标值较大的变量对结果的影响,保证各特征对结果贡献相同。消除量纲则主要解决数据的可比性,使它们在对模型的贡献上具有平衡的影响。

常用四种数据标准化方法 1.最小-最大标准化

最小-最大标准化(Min-Max标准化),也称为离差标准化,基于原始数据线性化方法,将原始数据按照[min,max]映射到[0,1]之间,归一化公式为: 在这里插入图片描述 如果希望将数据映射到[-1,1]上,可以将原始数据减去均值 再除以极差: 在这里插入图片描述

2.Z分数标准化

Z分数标准化又称为“标准差标准化”、“零均值标准化”,Z-score标准化方法使用表较简单,使用范围较离差标准化更为广泛。它将原始数据变换为均值为0和方差为1的新数据。如果原始数据符合非标准正态分布,则标准化数据符合标准正态分布X~N(0,1)。

这种标准化方法适用于总体数据的最小/最大值未知,或样本数据含有离群值的情况。计算方法为对每列数据计算均值 和标准差 ,然后将原始数据减去均值,再除以标准差,计算公式为: 在这里插入图片描述 标准化后的数据如果大于0表示高于平均水平,否则表示低于平均水平。Z-Score标准化后的数据并不在落在[0,1]区间上,而是标准化后数据的均值为0,方差为1。

3.小数定标标准化

小数定标标准化按照原始数据中绝对值最大的那个数值,将所有数据的小数点移动指定位数来缩放数据到[-1,1]区间上: 在这里插入图片描述

4.总和归一标准化

如果指标数据都大于零,可将所有指标数据总和归一,所有数据除以它变换到[0,1]之间。因此,总和归一标准化变换会将整个变量的总和压缩到1,其映射公式为: 在这里插入图片描述



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3