R语言 如何对数据进行标准化和规范化

您所在的位置:网站首页 如何用excel进行标准化处理 R语言 如何对数据进行标准化和规范化

R语言 如何对数据进行标准化和规范化

2024-07-10 03:43| 来源: 网络整理| 查看: 265

R语言 如何对数据进行标准化和规范化

在这篇文章中,我们将研究在R编程语言中对数据进行标准化、最小-最大标准化、Z-分数标准化和对数转换的各种技术。

加载所需的软件包和数据集

让我们安装并加载所需的软件包。同时创建一个数据帧作为样本数据集。

# load packages and data install.packages("caret") library(caret)   # creating a dataset data = data.frame(var1=c(120, 345, 145, 122, 596, 285, 211),                   var2=c(10, 15, 45, 22, 53, 28, 12),                   var3=c(-34, 0.05, 0.15, 0.12, -6, 0.85, 0.11))   data

输出 :

如何在R语言中对数据进行标准化和规范化?

数据摘要

让我们看看缩放之前的数据摘要。从输出中我们可以看到,每个变量/特征都有不同的取值范围(可以从最小值和最大值中推断出来),因此需要进行缩放以使数值在一个固定范围内。

# import the library library(caret)   # creating the dataset data = data.frame(var1 = c(120,345,145,122,596,285,211),            var2 = c(10,15,45,22,53,28,12),            var3 = c(-34,0.05,0.15,0.12,-6,0.85,0.11))   # summary of data summary(data)

输出:

如何在R语言中对数据进行标准化和规范化?

归一化 方法1:最小-最大归一化

这种技术将数值重新划分为0和1之间的范围。同时,数据最终具有较小的标准偏差,这可以抑制异常值的影响。

示例 :让我们写一个自定义函数来实现最小-最大归一化。

如何在R语言中对数据进行标准化和规范化?

最小-最大归一化

这就是最小-最大归一化的公式。让我们使用这个公式并创建一个自定义的用户定义的函数,minMax,它一次接收一个值并计算缩放值,使其位于0和1之间。这里new_max(A)是1,new_min(A)是0,因为我们试图在[0,1]范围内缩小/增加值。

这有助于很好地处理异常值,并在整体上抑制它们。

# import the library library(caret)   # dataset data = data.frame(var1 = c(120,345,145,122,596,285,211),            var2 = c(10,15,45,22,53,28,12),            var3 = c(-34,0.05,0.15,0.12,-6,0.85,0.11))   # custom function to implement min max scaling minMax


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3