转录组差异分析FPKM与count处理差别大吗

您所在的位置:网站首页 23565r18与23555r20区别大吗 转录组差异分析FPKM与count处理差别大吗

转录组差异分析FPKM与count处理差别大吗

2024-02-17 14:27| 来源: 网络整理| 查看: 265

缘起

这些天来,我们一般都是处理上游定量好的count数据,然后进行下游的转录组分析。但是,我们查看GEO数据集时,会发现有些数据集并没有提供count数据,而仅仅提供了FPKM或者RPKM等格式的数据。那当数据集提供的是FPKM数据集时,我们还能处理吗。前面曾老师分享的推文中描述了FPKM的处理方式,具体见RNAseq数据,下载GEO中的FPKM文件后该怎么下游分析,评论区中有小伙伴谈到limma包的作者不推荐用limma处理FPKM数据,最好用原始数据进行分析。那用count与用FPKM去处理获得的差异基因具有巨大的差别吗?曾老师前两天提出了这个疑问,于是便有了今天的推文。接下来,我们就探索一下用count与用FPKM去处理获得的差异基因是否具有巨大差别吧?

探究

今天,我们使用标题为 LncRNA-directed Antigenicity Loss Suppresses Immunosurveillance 的数据集 GSE113143 进行探究,数据集的介绍链接如下https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc= GSE113143 ,感兴趣的小伙伴可以点进去看看作者的总体设计。在此,我们对文章进行简单归纳,作者通过转录组测序探究了小鼠乳腺癌组织和乳腺组织的表达谱。。

转录组数据集介绍

GSE113143 数据集的样本分组如下,两个分组三个重复样本:

处理数据的话,作者仅仅提供了「FPKM矩阵」。因为我们要比较FPKM与count分别进行差异分析的区别,所以我们需要自身对于上游转录组数据进行定量,去获得「Ensenmble count矩阵」。之后,我们就可以直接走Ensenmble矩阵的差异分析流程进行分析了,链接见https://mp.weixin.qq.com/s/BHt_7WFCtKXIZwQYqhO8jA。

以下为作者提供的FPKM矩阵下载链接:https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE113143&format=file&file=GSE113143%5FNormal%5FTumor%5FExpression%2Etab%2Egz;感兴趣的小伙伴可以下载试试。

正式分析1.利用fpkm值进行差异分析

FPKM处理代码援引自泥人吴老师的RNAseq数据,下载GEO中的FPKM文件后该怎么下游分析,其中也有一些很好的描述,感兴趣的小伙伴可以看看。FPKM处理关键是要将FPKM值转换为TPM值,然后用Limma进行后续的差异分析。

# 1.下载GSE113143数据集 a=read.table('GSE113143_Normal_Tumor_Expression.tab.gz',sep='\t',quote = "",fill = T, comment.char = "!",header = T) # 提取表达矩阵 rownames(a)=a[,1] a


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3