R语言调整列顺序 r语言改变列的顺序

您所在的位置:网站首页 python改变列名的顺序 R语言调整列顺序 r语言改变列的顺序

R语言调整列顺序 r语言改变列的顺序

2024-02-17 09:51| 来源: 网络整理| 查看: 265

dplyr有五个核心函数:

函数 

功能

filter()

对值筛选观测

arrange() 

对行进行重新排列

select()

按名称选取变量

mutate()

使用现有变量的函数创建变量

summarize()

对多这个值总结为一个摘要统计量

group_by()

可以改变以上每个函数的作用范围

步骤:第一个参数数据框→输入变量名(描述数据要进行的操作)→输出数据框

filter()和arrange()函数还挺像的。filter函数,可以筛选值。而arrange函数可以改变行的顺序。

filter结合表达式用超棒!

arrange可以改变行的顺序。而且还可以结合一些函数使用,比如desc(),实现按列降序排列,desc的位置要在arrange函数里面哦

相比于前两个函数,select函数就是arrange的升级版,arrange函数即使实现了改变行的顺序的功能,但是如果没有被指定改变的,还会在输出的时候看到。但select不一样,select函数选择几列就是几列。可以指定几列,也可以从几列到几列,用":",甚至还可以反着选。select搭配一些函数使用起来也是非常棒的。

辅助函数

功能

starts_with("abc")

匹配以"abc"开头的名称

ends_with("abc")

匹配以"abc"结尾的名称

contains("abc")

匹配包含"abc"的名称

matches("(.)\\1")

匹配正则表达式变量

num_range("x",1:3)

匹配x1,x2,x3

select还有一个更妙的地方,它可以和everything()结合使用,可以实现将几个变量移动到数据框的开头。

mutate函数也挺有意思儿的。它的主要功能是实现添加新的列的功能,可以在原有的列上进行计算。添加的新列往往都在最后面。如果只想显示添加的新列,可以选择用transmute!既不影响原来列的数据显示,还可以进行计算。

summarize()可以将数据框折叠成一行,这个函数要和group_by合着用,group_by可以将整个数据集更改为单个分组!之后再使用dplyr函数,定义的那些会应用到group_by的每个分组上。这个用法不太好理解,我把代码写在这里:

summarize(flights,delay = mean(dep_delay,na.rm=TRUE))

summarize的直接用法,是对dep_delay变量进行计算,mean取均值

by_day % summarize( count=n(), dist = mean(distance,rm = TRUE), arr_delay = mean(arr_delay,rm = TRUE) )%>% filter(count>20,dest != "HNL")

解读一下:先分组,然后摘要统计,然后筛选。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3