第 12 章 数据处理 |
您所在的位置:网站首页 › r语言dbl改成int类型 › 第 12 章 数据处理 |
第 12 章 数据处理
我们用一个应用场景,复习上两章讲的数据类型和数据结构等概念。比如,这里有一个表格 如果构建学生们的成绩,需要用到是向量,一列就可以了。 如果构建学生的各科成绩,需要用到是矩阵,因为此时需要多列,不同的列对应不同的科目。 如果构建学生综合信息(性别,年龄,各科成绩,是否喜欢R),需要用到的是列表,因为除了各科成绩列,还需要其它数据类型的列。 当然,构建学生综合信息的表格,最好还是用数据框,因为这些信息是等长的,而且符合人的理解习惯, 所以,我们会经常和数据框打交道。数据框的特性很丰富,在于: 第一,它是列表的特殊形式,可以存储不同类型的数据。 第二,它要求每个元素长度必须一致,因此长的像矩阵。 第三,它的每个元素就是一个是向量,而R语言有个优良特性,就是向量化操作,因此,使用函数非常方便。本章我们介绍tidyverse里被誉为“瑞士军刀”的数据处理的工具dplyr宏包。首先,我们加载该宏包 library(dplyr)dplyr 定义了数据处理的规范语法,其中主要包含以下10个主要的函数。 mutate(), select(), rename() , filter() summarise(), group_by(), arrange() left_join(), right_join(), full_join()我们用一个案例依次讲解这些函数的功能。假定这里有三位同学的英语和数学成绩 df |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |