R语言调整列顺序 r语言改变列的顺序 |
您所在的位置:网站首页 › python改变列名的顺序 › R语言调整列顺序 r语言改变列的顺序 |
dplyr有五个核心函数: 函数 功能 filter() 对值筛选观测 arrange() 对行进行重新排列 select() 按名称选取变量 mutate() 使用现有变量的函数创建变量 summarize() 对多这个值总结为一个摘要统计量 group_by() 可以改变以上每个函数的作用范围 步骤:第一个参数数据框→输入变量名(描述数据要进行的操作)→输出数据框 filter()和arrange()函数还挺像的。filter函数,可以筛选值。而arrange函数可以改变行的顺序。 filter结合表达式用超棒! arrange可以改变行的顺序。而且还可以结合一些函数使用,比如desc(),实现按列降序排列,desc的位置要在arrange函数里面哦 相比于前两个函数,select函数就是arrange的升级版,arrange函数即使实现了改变行的顺序的功能,但是如果没有被指定改变的,还会在输出的时候看到。但select不一样,select函数选择几列就是几列。可以指定几列,也可以从几列到几列,用":",甚至还可以反着选。select搭配一些函数使用起来也是非常棒的。 辅助函数 功能 starts_with("abc") 匹配以"abc"开头的名称 ends_with("abc") 匹配以"abc"结尾的名称 contains("abc") 匹配包含"abc"的名称 matches("(.)\\1") 匹配正则表达式变量 num_range("x",1:3) 匹配x1,x2,x3 select还有一个更妙的地方,它可以和everything()结合使用,可以实现将几个变量移动到数据框的开头。 mutate函数也挺有意思儿的。它的主要功能是实现添加新的列的功能,可以在原有的列上进行计算。添加的新列往往都在最后面。如果只想显示添加的新列,可以选择用transmute!既不影响原来列的数据显示,还可以进行计算。 summarize()可以将数据框折叠成一行,这个函数要和group_by合着用,group_by可以将整个数据集更改为单个分组!之后再使用dplyr函数,定义的那些会应用到group_by的每个分组上。这个用法不太好理解,我把代码写在这里: summarize(flights,delay = mean(dep_delay,na.rm=TRUE))summarize的直接用法,是对dep_delay变量进行计算,mean取均值 by_day % summarize( count=n(), dist = mean(distance,rm = TRUE), arr_delay = mean(arr_delay,rm = TRUE) )%>% filter(count>20,dest != "HNL")解读一下:先分组,然后摘要统计,然后筛选。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |