R语言 如何对数据进行标准化和规范化 |
您所在的位置:网站首页 › 如何用excel进行标准化处理 › R语言 如何对数据进行标准化和规范化 |
R语言 如何对数据进行标准化和规范化
在这篇文章中,我们将研究在R编程语言中对数据进行标准化、最小-最大标准化、Z-分数标准化和对数转换的各种技术。 加载所需的软件包和数据集让我们安装并加载所需的软件包。同时创建一个数据帧作为样本数据集。 # load packages and data install.packages("caret") library(caret) # creating a dataset data = data.frame(var1=c(120, 345, 145, 122, 596, 285, 211), var2=c(10, 15, 45, 22, 53, 28, 12), var3=c(-34, 0.05, 0.15, 0.12, -6, 0.85, 0.11)) data输出 : 让我们看看缩放之前的数据摘要。从输出中我们可以看到,每个变量/特征都有不同的取值范围(可以从最小值和最大值中推断出来),因此需要进行缩放以使数值在一个固定范围内。 # import the library library(caret) # creating the dataset data = data.frame(var1 = c(120,345,145,122,596,285,211), var2 = c(10,15,45,22,53,28,12), var3 = c(-34,0.05,0.15,0.12,-6,0.85,0.11)) # summary of data summary(data)输出: 这种技术将数值重新划分为0和1之间的范围。同时,数据最终具有较小的标准偏差,这可以抑制异常值的影响。 示例 :让我们写一个自定义函数来实现最小-最大归一化。 最小-最大归一化 这就是最小-最大归一化的公式。让我们使用这个公式并创建一个自定义的用户定义的函数,minMax,它一次接收一个值并计算缩放值,使其位于0和1之间。这里new_max(A)是1,new_min(A)是0,因为我们试图在[0,1]范围内缩小/增加值。 这有助于很好地处理异常值,并在整体上抑制它们。 # import the library library(caret) # dataset data = data.frame(var1 = c(120,345,145,122,596,285,211), var2 = c(10,15,45,22,53,28,12), var3 = c(-34,0.05,0.15,0.12,-6,0.85,0.11)) # custom function to implement min max scaling minMax |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |