第 12 章 数据处理

您所在的位置:网站首页 r语言dbl改成int类型 第 12 章 数据处理

第 12 章 数据处理

2023-08-05 11:38| 来源: 网络整理| 查看: 265

第 12 章 数据处理

我们用一个应用场景,复习上两章讲的数据类型和数据结构等概念。比如,这里有一个表格

如果构建学生们的成绩,需要用到是向量,一列就可以了。 如果构建学生的各科成绩,需要用到是矩阵,因为此时需要多列,不同的列对应不同的科目。 如果构建学生综合信息(性别,年龄,各科成绩,是否喜欢R),需要用到的是列表,因为除了各科成绩列,还需要其它数据类型的列。 当然,构建学生综合信息的表格,最好还是用数据框,因为这些信息是等长的,而且符合人的理解习惯, 所以,我们会经常和数据框打交道。

数据框的特性很丰富,在于:

第一,它是列表的特殊形式,可以存储不同类型的数据。 第二,它要求每个元素长度必须一致,因此长的像矩阵。 第三,它的每个元素就是一个是向量,而R语言有个优良特性,就是向量化操作,因此,使用函数非常方便。

本章我们介绍tidyverse里被誉为“瑞士军刀”的数据处理的工具dplyr宏包。首先,我们加载该宏包

library(dplyr)

dplyr 定义了数据处理的规范语法,其中主要包含以下10个主要的函数。

mutate(), select(), rename() , filter() summarise(), group_by(), arrange() left_join(), right_join(), full_join()

我们用一个案例依次讲解这些函数的功能。假定这里有三位同学的英语和数学成绩

df


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3