R 包初学者指南

您所在的位置:网站首页 rain该怎么用 R 包初学者指南

R 包初学者指南

2024-05-30 10:16| 来源: 网络整理| 查看: 265

R 包是由社区开发(developed by the community)的功能(functions)和数据集(data sets)的集合。 它们通过改进现有的基本 R 功能或通过添加新功能来提升 R 的效率。 例如,如果您经常使用数据框,可能您会听说 dplyr 或 data.table 这两个最流行的 R 包。

但是想象一下,您想要对韩文的文本进行一些自然语言处理,从网络中提取天气数据,甚至使用地表能量平衡模型(land surface energy balance models)估算实际蒸散量,R 包都可以帮到您! 截止最近,R 的官方存储库(CRAN)已经发布的包就接近了 10,000 个,除此以外还有更多通过互联网公开发布的其他 R 包。

如果您刚开始使用 R,今天的文章将介绍 R 软件包的基础知识以及如何使用它们。 您将涵盖以下主题和 11 个常见问题用户问题:

R 软件包的基础知识:什么是软件包,为什么要将它们用于您的 R 体验? 你在哪里可以找到包裹?安装和使用:如何从 CRAN,CRAN镜像,Bioconductor 或 Github 安装软件包? 有哪些与 install.packages() 相关的函数以及可用于更新,删除,......包的函数? 如何使用用户界面安装软件包? 你如何加载 R 包? R 中的包和库有什么区别? 如何同时加载多个包? 如何卸载 R 包?文档:除了 DESCRIPTION 文件之外,是否还有其他文档来源以及如何使用它们?在 R 包之间进行选择:您如何找到适合您的分析的包?

如果您是一位经验丰富的用户,您可以随时学习新内容(例如我在前一段中提到的三个软件包的名称)。 无论如何,欢迎阅读 R 包的介绍以及如何使用它们!

1. 什么是包

让我们从一些定义开始。 包是用于组织您自己工作的一种合适方式(a suitable way),如果您愿意,也可以与他人分享。 通常,包将包含代码(不仅仅 是 R 代码!),包及内部函数相关的文档,一些以检查一切是否正常工作的测试(some tests to check everything works as it should),以及数据集。

DESCRIPTION 文件 提供了有关包的基本信息,您可以在其中找到包的功能,作者是谁,文档所属的版本,日期,使用的许可类型以及包依赖性。

请注意,您也可以单击 此处 查看 DESCRIPTION 文件。

除了查找诸如 http://cran.r-project.org 或 stat.ethz.ch 之类的 DESCRIPTION 文件之外,您还可以使用命令 packageDescription("package") 通过包帮助文档访问 R 中的描述文件 help(package = "package"),或在线访问存储库(repository)中 R 包。

例如,对于 "stats" 包,这些方法将是:

packageDescription("stats") help(package = "stats")2. 什么是存储库

存储库(repository)是包所在的位置,因此您可以从存储库中安装 R 包。 虽然您或您的组织可能拥有本地存储库,但通常它们是在线并且可供所有人访问的。 R 软件包最受欢迎的三个存储库是:

CRAN:官方存储库,它是一个由全球 R 社区维护的 ftp 和 Web 服务器网络。 它是由 R 基金会协调的,对于要在此发布的包,它需要通过几个测试,以确保包遵循 CRAN 策略。 你可以在 这里 找到更多细节。 Bioconductor:这是一个专题库,用于生物信息学的开源软件。 作为 CRAN,它有自己的 提交和审核流程,其社区非常活跃,每年举行多次会议。 Github:虽然这不是 R 特有的,但 github 可能是开源项目中最受欢迎的存储库。 它的受欢迎程度来自于开源的无限空间,与 git 的集成,版本控制软件以及与其他人共享和协作的便利性


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3