R语言dplyr包：高效数据处理函数arrange、sample

您所在的位置：网站首页 › arrange函数功能 › R语言dplyr包：高效数据处理函数arrange、sample

R语言dplyr包：高效数据处理函数arrange、sample

2022-12-28 20:35| 来源: 网络整理| 查看: 265

今天是个特别的日子，小编在这里祝大家情人节快乐！本篇文章继续之前文章提到的关于dplyr包数据处理的函数。错了，小编是准备那天发的，忘发了

R语言在数据整理、分析上面的方法是很多的，并且通俗易懂，相信热衷于用R语言处理数据的同仁也深有体会。

1、数据排序函数

arrange()函数其实和大家经常用的EXCEL中的降序、升序相似，但该函数的功能肯定更便捷、强大，可以按照多列（有序的列）进行排序，函数的基本形式为arrange(data,var1,var2,var3,...)，函数默认排序为升序，若需要按照某列降序排序，那么可以在变量名前加desc。

另外当变量众多的时候可以采用延伸的函数arrange_all(data)

下面以R中自带的数据集mtcars、iris为例：

arrange(mtcars,cyl,mpg) arrange(iris,Sepal.Length,Sepal.Width)

2、样本（随机）选取函数

sample_n((tbl, size, replace = FALSE)

参数说明：tbl数据，size选取的数据行数，replace=true/false是否替换样本（主要参数）

sample_n(iris,8,replace=FALSE)

3、计算向量唯一值数量函数

n_distinct(...,na.rm=FALSE)函数是更快且简洁，等同于unique

参数说明：na.rm=FALSE缺失值不会计入

n_distinct(iris$Sepal.Length,na.rm=FALSE)

4、数据选取函数select

select(.data,...)函数按照名称选择变量，同时select中可以使用的函数有starts_with(), ends_with(), contains(),matches(),num_range(),one_of(),everything()；rename(.data,...)函数重命名变量

select(mtcars,cyl:drat) select(mtcars,starts_with("c")) select(mtcars,contains("m"))

此外还有一些延伸的函数，也很实用select_all(), select_if() and select_at()) and rename_all(), rename_if(), rename_at()

当你越来越熟悉这些函数后，你会发现其实和SQL里面的操作同理，而dplyr包对于sql里面的功能很多都可以实现，在有时候更加高效，你也可以下载dplyr包的原文档，里面还有许多有意思的函数。

下一篇预告：tidyr包中的有趣函数，来一起修行啊

【本文地址】

R语言dplyr包：高效数据处理函数arrange、sample

R语言dplyr包：高效数据处理函数arrange、sample

今日新闻

推荐新闻