手把手教学差异表达基因分析 |
您所在的位置:网站首页 › 语言表达分析模型是什么 › 手把手教学差异表达基因分析 |
文章目录
引言安装并导入DESeq2包数据要求制作dds对象,进行差异分析筛选差异基因完整代码其他问题
引言
对于组学分析来说,常常会寻找组间的差异,例如差异基因(转录组)、差异菌(宏基因组)以及差异通路(宏基因组),而转录组分析上最为经典的DESeq2包对于以上分析也都适用 DESeq最早在2010年发表在Genome Biology上,2014年上更新版本DESeq2。DESeq2是基于负二项广义线性模型估算样本间基因差异表达概率,既适于有生物学重复的也适于没有生物学重复的样本,同时除了在转录组学,在宏基因组上使用DESeq2计算差异菌的也有报道 安装并导入DESeq2包DESeq2包目前需要依赖BiocManager包,该包用于管理bioconductor项目中的所有包,因此首先安装该包 # 1.判断是否有BiocManager包,若不存在则安装 options(repos=structure(c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))) #设置清华镜像,加速下载 if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") if (!requireNamespace("DESeq2", quietly = TRUE)) BiocManager::install('DESeq2') #通过BiocManager安装DESeq2 library(DESeq2) #加载library由于DESeq2包较大,安装时间较长,当导入后没有任何报错即为安装成功 数据要求 1.基因表达矩阵 行为基因,列为样本,需要注意表达数据为原始reads count,DESeq2内部会根据样本大小对counts进行调整,自带标准化过程,不要使用标准化后的FPKM或TPM 2.样本分组信息 样品信息,第一列是样品名称,第二列是样品的处理情况(对照还是处理等),即condition,condition的类型是一个factor,第三列可添加其他信息(可选)。需要自己根据临床/实验分组信息单独建立 制作dds对象,进行差异分析想要进行差异分析,首先需要生成DESeq2必须的数据类型,即dds类型数据,DESeq2包使用DESeqDataSet(dds)作为存放count数据及分析结果的对象,每个DESeqDataSet(dds)对象都必须由以下三者: countData,存放counts matrix的对象colData,存放分组信息和处理信息的对象design公式,对应sample的分组信息,需要以~ 波浪字符进行连接,而不同的信息之间需要以+连接,示例:design=~variable_1 + variable_2 这些分组信息会被用来估算离散度和估算Log2 fold change的模型 注意,为了方便起见,在默认参数下,用户应该把感兴趣的分组信息放在formula的最后,并且确认control组的level是第一个(因子的level,见R语言基础视频) ## 制作dds对象,构建差异基因分析所需的数据格式 dds |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |