数据处理

您所在的位置:网站首页 spss数据一致化处理 数据处理

数据处理

2024-03-17 00:53| 来源: 网络整理| 查看: 265

数据处理——常见标准化方法总结 毕业论文 https://www.spsspro.com/ · 3937浏览 · 2022-04-01 07:22 举报 为了消除不同评价指标之间存在的差异,统一比较的标准,就需要对数据进行标准化处理 一、为什么要做数据的标准化处理?

通常我们分析的数据指标不是单一的,往往是由多个评价指标构成的,而这些评价指标往往具有不同的属性、数量级和单位,这导致我们无法对不同的指标进行比较、加权、求和等种种后续操作。

假设各个指标之间的水平相差很大,此时直接使用原始指标进行分析时,数值较大的指标,在评价模型中的绝对作用就会显得较为突出和重要,而数值较小的指标,其作用则可能就会显得微不足道。

因此,为了消除不同评价指标之间存在的差异,统一比较的标准,就需要对数据进行标准化处理,消除不同指标之间因属性不同而带来的影响,从而使结果更具有可比性。

二、什么是数据的标准化?

通过一定的数学变换方式,将原始数据按照一定的比例进行转换,使之落入到一个小的特定区间内,例如[0,1]或[-1,1]的区间内,消除不同变量之间性质、量纲、数量级等特征属性的差异,将其转化为一个无量纲的相对数值,也就是标准化数值,使各指标的数值都处于同一个数量级别上,从而便于不同单位或数量级的指标能够进行综合分析和比较。

三、常用的数据标准化方法

1、min-max标准化

image.png

对原始数据进行线性变换,无论原始数据是正值还是负值,结果都会落到[0,1]区间。并且正负指标均可转化为正向指标,作用方向一致。但是如果有新数据加入,就可能会导致最大值和最小值发生变化,就需要进行重新定义,并重新计算。

2、z-score 标准化

image.png

适用于当某个指标的最大值和最小值未知时,或者有超出取值范围的离群数值时。

处理后的数据符合均值为0,标准差为1的标准正态分布,围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。

3、归一化

image.png

对正数进行变换,使结果落到[0,1]区间,其将数值的绝对值变成相对值关系

4、中心化

image.png

让数据变成平均值为0的一组数据

四、工具实现

以上提到的几种数据标准化处理的方法,在spsspro中的【数据处理】->【数据标准化】都有提供,如图所示:

image.png

0 人收藏 0 人喜欢 分享至:

相关推荐

默认标签 数据分析达人 SPSSPRO数据分析课程强势上线!学完可拿证

数据分析师认证学习与考核方案

会员专题 SPSSPRO · 65浏览 · 03-14 04:19 2024年第三届全国大学生数据分析科普竞赛纸质证书免费领

无需邀请好友,全国大学生数据分析知识科普竞赛纸质证书免费包邮寄送! 撰写小红书及知乎文章,推广第二届全国大学生数据分析科

知识竞赛 原创 · 1042浏览 · 03-06 03:28 2024年第三届全国大学生数据分析科普竞赛系列活动——协办单位招募

-

知识竞赛 原创 · 652浏览 · 03-01 08:39 0 条评论 某人 好友 可输入 255 字


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3