新版TCGA数据库学习:批量下载新版TCGA数据

您所在的位置:网站首页 临床数据下载 新版TCGA数据库学习:批量下载新版TCGA数据

新版TCGA数据库学习:批量下载新版TCGA数据

2024-07-16 12:12| 来源: 网络整理| 查看: 265

众所周知,TCGA数据库改版了!!改的比之前更好用了!

对于常规转录组数据,主要是以下几点改变:

下载一次即可获得counts、TPM、FPKM三种类型的表达矩阵,再也不用单独下载了自带gene symbol,不用自己找各种方法转换了自带基因类型,可以直接区分mRNA和lncRNA了

TCGAbiolinks不仅是数据下载,它能访问、下载全部的TCGA数据(除了受限制的),用它下载的数据是最新最全的!这和直接去GDC官网,使用网页下载的方式是一样的。

除了常规的转录组数据,还包括甲基化数据、SNP数据、突变数据、临床数据等多种数据类型,还能进行数据分析,比如差异分析、生存分析、聚类等,除此之外,它也具有强大的绘图功能,可以直接绘制突变瀑布图等多种图形,是一个全面的TCGA包。

作为官方唯一推荐的专用下载及分析可视化一体的R包:TCGAbiolinks,也进行了相应的更新。

而xena的数据并不会及时更新,最新的数据还停留在2019年。

因为网络问题一直没怎么学习过这个强大的R包,最近数据更新了,学习下。

安装

需要安装版本在2.25.1以上的版本!

# 经典2选1 if (!requireNamespace("BiocManager", quietly=TRUE)) install.packages("BiocManager") BiocManager::install("TCGAbiolinks") if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data") BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")

注意:目前bioconductor上面的TCGAbiolinks还停留在2.24.3版本,你需要安装开发版本哦~

如果你安装不成功,可以下载到本地安装,如果你不会本地安装,请翻看b站视频:可能是最适合小白的R包安装教程

使用

对网络有要求!

如果这一步都不成功,建议下面的就别运行了,因为很可能也不会成功。

# 查看TCGA中33种癌症的简称 library(TCGAbiolinks) projects


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3