R语言中字符串的处理(1/3)

您所在的位置:网站首页 字符串长度怎么算 R语言中字符串的处理(1/3)

R语言中字符串的处理(1/3)

2023-07-14 16:48| 来源: 网络整理| 查看: 265

本文转自微信公众号: 一遇之见 的 大作 R中字符串处理:函数实现 。原文太长了,分三次学习、消化。

本文主要介绍如何通过R语言的基础函数和stringr包中的函数实现字符串的常见处理。特别注意的的是R中的基础函数和stringr包函数有两个很大的不同。

书写方式不同。大多数基础函数处理规则多作为第一参数,而被处理对象放在第二位置;stringr包中的函数被处理对象为第一参数,而处理规则作为第二参数。

grep(pattern, x, ...) str_detect(string, pattern, ...)

执行的原理不一致。有很多基础函数的处理规则往往是针对单元素的,即使强制用多元素能成功执行,但结果也往往只执行第一个元素;而stringr包中的函数通常可对多元素执行操作,执行操作时将短的字符串重复,长度一致后在相同位置执行。

字符串的常见的计算包括:字符串长度计算,大小写转化,排序,空格去除,复制,拼接,分割,提取,替换,匹配查询(这里只介绍函数的实现效果,而不介绍正则表达式原则)。

字符串长度计算 字符向量长度计算函数:length 其返回字符向量的长度,而非字符串中字符的长度。 name = c("Li Bai","Du Fu", "Shakespeare") length(name) ##[1] 3 字符串长度计算函数: nchar,str_length和str_count均可计算字符串的长度。由于R通常是向量化操作,所以nchar,str_length和str_count对于字符向量可以返回字符向量中每个元素的长度。 library(stringr) nchar(name) ## [1] 2 2 11 str_length(name) ## [1] 2 2 11 str_count(name) ## [1] 2 2 11

尽管函数str_count可以现实字符向量中字符串长度的计算,但是更多的时候用来计算特定字符串出现的次数,其计算的原理前面已经提到过:串短的字符串重复,长度一致后在相同位置特定字符串个数的统计。

fruit


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3