此次案例我们是要比较ARID1A这个基因突变与不突变两亚类肝癌病人哪些基因的表达存在差异(寻找差异基因)。 在之前的三篇TCGA的数据采集文章中,我们已经采集到了所需要的所有数据,具体见下: 那么接下来我们就要对这些数据进行差异分析,采用的工具为R语言,所需要的包有limma、edgeR。
运用limma对基因进行差异分析
第一部分:安装及加载edgeR、limma包第二部分:导入数据,设置分组,构建DGEList对象第三部分:过滤低表达的基因,进行标准化处理第四部分:估算离散值第五部分:差异分析获取代码
第一部分:安装及加载edgeR、limma包
edgeR的安装我们可以用先前的方法用Bioconductor进行安装。由于edgeR和limma互为依赖关系,所以limma也会在同时安装:
BiocManager::install(“edgeR”)
library(limma)
library(edgeR)
library(statmod)
第二部分:导入数据,设置分组,构建DGEList对象
此次样本数据中我们选择了83个肝癌病人的数据,其中56个属于未突变组,27个属于突变组。
targets |