R语言调整列顺序 r语言改变列的顺序

您所在的位置：网站首页 › python改变列名的顺序 › R语言调整列顺序 r语言改变列的顺序

R语言调整列顺序 r语言改变列的顺序

2024-02-17 09:51| 来源: 网络整理| 查看: 265

dplyr有五个核心函数：

函数

功能

filter()

对值筛选观测

arrange()

对行进行重新排列

select()

按名称选取变量

mutate()

使用现有变量的函数创建变量

summarize()

对多这个值总结为一个摘要统计量

group_by()

可以改变以上每个函数的作用范围

步骤：第一个参数数据框→输入变量名（描述数据要进行的操作）→输出数据框

filter()和arrange()函数还挺像的。filter函数，可以筛选值。而arrange函数可以改变行的顺序。

filter结合表达式用超棒！

arrange可以改变行的顺序。而且还可以结合一些函数使用，比如desc()，实现按列降序排列，desc的位置要在arrange函数里面哦

相比于前两个函数，select函数就是arrange的升级版，arrange函数即使实现了改变行的顺序的功能，但是如果没有被指定改变的，还会在输出的时候看到。但select不一样，select函数选择几列就是几列。可以指定几列，也可以从几列到几列，用"：",甚至还可以反着选。select搭配一些函数使用起来也是非常棒的。

辅助函数

功能

starts_with("abc")

匹配以"abc"开头的名称

ends_with("abc")

匹配以"abc"结尾的名称

contains("abc")

匹配包含"abc"的名称

matches("(.)\\1")

匹配正则表达式变量

num_range("x",1:3)

匹配x1,x2,x3

select还有一个更妙的地方，它可以和everything()结合使用，可以实现将几个变量移动到数据框的开头。

mutate函数也挺有意思儿的。它的主要功能是实现添加新的列的功能，可以在原有的列上进行计算。添加的新列往往都在最后面。如果只想显示添加的新列，可以选择用transmute！既不影响原来列的数据显示，还可以进行计算。

summarize()可以将数据框折叠成一行，这个函数要和group_by合着用，group_by可以将整个数据集更改为单个分组！之后再使用dplyr函数，定义的那些会应用到group_by的每个分组上。这个用法不太好理解，我把代码写在这里：

summarize(flights,delay = mean(dep_delay,na.rm=TRUE))

summarize的直接用法，是对dep_delay变量进行计算，mean取均值

by_day % summarize( count=n(), dist = mean(distance,rm = TRUE), arr_delay = mean(arr_delay,rm = TRUE) )%>% filter(count>20,dest != "HNL")

解读一下：先分组，然后摘要统计，然后筛选。

【本文地址】

R语言调整列顺序 r语言改变列的顺序

R语言调整列顺序 r语言改变列的顺序

今日新闻

推荐新闻