震惊！小伙竟用Excel做差异分析！

您所在的位置：网站首页 › 测序后如何筛选差异表达基因 › 震惊！小伙竟用Excel做差异分析！

震惊！小伙竟用Excel做差异分析！

#震惊！小伙竟用Excel做差异分析！| 来源: 网络整理| 查看: 265

3、用每个基因的表达量减去对应的均值，即2-7列的数据依次减去第8列的数据

4、按样品取中位数

5、因为计算的第一步取了对数，所以现在将中位数利用指数函数转换回去，记为sizefactor

6、回到原始的read count表格，用每一个数值除以对应样品的sizefactor，得到均一化的表达量

7、按照分组方式计算平均数，记为basemean（这里为了展示方便保留了两位小数）

自此我们已经得出了A组与B组每个基因的basemean，接下来通过两个basemean相除，我们就可以得到差异倍数foldchange，再通过负二项分布检验，我们就得到了代表显著性的P值和padj值。这样一张差异表达分析表是不是就初见雏形了呢！

“太长不看总结版”

从DESeq的basemean的计算原理我们可以知道：

NO.1 basemean不是通过fpkm计算的，也不是直接求平均数算的，是先用read count除以sizefactor进行均一化，再用均一化之后的read count按分组方式计算平均数。所以我们说basemean是基因表达量的“均一化”结果，而不能直接说是fpkm的平均数。

NO.2 “牵一发而动全身”：计算sizefactor时先通过横向（样品）计算Δ值，再通过纵向（基因）找出Δ值的中位数，因此一旦改变任何一个样品或一个基因，所有的sizefactor都会跟着发生变化，也就会导致basemean变化。理解了这一点，我们就可以解决这样的问题了：“A VS C和A VS B两个DESeq表，A组没有变啊，为什么两个表里同一个基因的basemeanA是不同的？”

郑重申明：本文对于basemean的计算仅用于展示软件分析原理，实际结果请以派森诺提供的差异分析结果为准。返回搜狐，查看更多

【本文地址】

震惊！小伙竟用Excel做差异分析！

震惊！小伙竟用Excel做差异分析！

今日新闻

推荐新闻