震惊!小伙竟用Excel做差异分析! |
您所在的位置:网站首页 › 测序后如何筛选差异表达基因 › 震惊!小伙竟用Excel做差异分析! |
3、 用每个基因的表达量减去对应的均值,即2-7列的数据依次减去第8列的数据 4、 按样品取中位数 5、 因为计算的第一步取了对数,所以现在将中位数利用指数函数转换回去,记为sizefactor 6、 回到原始的read count表格,用每一个数值除以对应样品的sizefactor,得到均一化的表达量 7、 按照分组方式计算平均数,记为basemean(这里为了展示方便保留了两位小数) 自此我们已经得出了A组与B组每个基因的basemean,接下来通过两个basemean相除,我们就可以得到差异倍数foldchange,再通过负二项分布检验,我们就得到了代表显著性的P值和padj值。这样一张差异表达分析表是不是就初见雏形了呢! “太长不看总结版” 从DESeq的basemean的计算原理我们可以知道: NO.1 basemean不是通过fpkm计算的,也不是直接求平均数算的,是先用read count除以sizefactor进行均一化,再用均一化之后的read count按分组方式计算平均数。所以我们说basemean是基因表达量的“均一化”结果,而不能直接说是fpkm的平均数。 NO.2 “牵一发而动全身”:计算sizefactor时先通过横向(样品)计算Δ值,再通过纵向(基因)找出Δ值的中位数,因此一旦改变任何一个样品或一个基因,所有的sizefactor都会跟着发生变化,也就会导致basemean变化。理解了这一点,我们就可以解决这样的问题了:“A VS C和A VS B两个DESeq表,A组没有变啊,为什么两个表里同一个基因的basemeanA是不同的?” 郑重申明:本文对于basemean的计算仅用于展示软件分析原理,实际结果请以派森诺提供的差异分析结果为准。返回搜狐,查看更多 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |