转录组差异分析FPKM与count处理差别大吗 |
您所在的位置:网站首页 › 23565r18与23555r20区别大吗 › 转录组差异分析FPKM与count处理差别大吗 |
缘起 这些天来,我们一般都是处理上游定量好的count数据,然后进行下游的转录组分析。但是,我们查看GEO数据集时,会发现有些数据集并没有提供count数据,而仅仅提供了FPKM或者RPKM等格式的数据。那当数据集提供的是FPKM数据集时,我们还能处理吗。前面曾老师分享的推文中描述了FPKM的处理方式,具体见RNAseq数据,下载GEO中的FPKM文件后该怎么下游分析,评论区中有小伙伴谈到limma包的作者不推荐用limma处理FPKM数据,最好用原始数据进行分析。那用count与用FPKM去处理获得的差异基因具有巨大的差别吗?曾老师前两天提出了这个疑问,于是便有了今天的推文。接下来,我们就探索一下用count与用FPKM去处理获得的差异基因是否具有巨大差别吧? 探究今天,我们使用标题为 LncRNA-directed Antigenicity Loss Suppresses Immunosurveillance 的数据集 GSE113143 进行探究,数据集的介绍链接如下https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc= GSE113143 ,感兴趣的小伙伴可以点进去看看作者的总体设计。在此,我们对文章进行简单归纳,作者通过转录组测序探究了小鼠乳腺癌组织和乳腺组织的表达谱。。 转录组数据集介绍GSE113143 数据集的样本分组如下,两个分组三个重复样本: ![]() 处理数据的话,作者仅仅提供了「FPKM矩阵」。因为我们要比较FPKM与count分别进行差异分析的区别,所以我们需要自身对于上游转录组数据进行定量,去获得「Ensenmble count矩阵」。之后,我们就可以直接走Ensenmble矩阵的差异分析流程进行分析了,链接见https://mp.weixin.qq.com/s/BHt_7WFCtKXIZwQYqhO8jA。 以下为作者提供的FPKM矩阵下载链接:https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE113143&format=file&file=GSE113143%5FNormal%5FTumor%5FExpression%2Etab%2Egz;感兴趣的小伙伴可以下载试试。 正式分析1.利用fpkm值进行差异分析FPKM处理代码援引自泥人吴老师的RNAseq数据,下载GEO中的FPKM文件后该怎么下游分析,其中也有一些很好的描述,感兴趣的小伙伴可以看看。FPKM处理关键是要将FPKM值转换为TPM值,然后用Limma进行后续的差异分析。 # 1.下载GSE113143数据集 a=read.table('GSE113143_Normal_Tumor_Expression.tab.gz',sep='\t',quote = "",fill = T, comment.char = "!",header = T) # 提取表达矩阵 rownames(a)=a[,1] a |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |