震惊!小伙竟用Excel做差异分析!

您所在的位置:网站首页 测序后如何筛选差异表达基因 震惊!小伙竟用Excel做差异分析!

震惊!小伙竟用Excel做差异分析!

#震惊!小伙竟用Excel做差异分析!| 来源: 网络整理| 查看: 265

3、 用每个基因的表达量减去对应的均值,即2-7列的数据依次减去第8列的数据

4、 按样品取中位数

5、 因为计算的第一步取了对数,所以现在将中位数利用指数函数转换回去,记为sizefactor

6、 回到原始的read count表格,用每一个数值除以对应样品的sizefactor,得到均一化的表达量

7、 按照分组方式计算平均数,记为basemean(这里为了展示方便保留了两位小数)

自此我们已经得出了A组与B组每个基因的basemean,接下来通过两个basemean相除,我们就可以得到差异倍数foldchange,再通过负二项分布检验,我们就得到了代表显著性的P值和padj值。这样一张差异表达分析表是不是就初见雏形了呢!

“太长不看总结版”

从DESeq的basemean的计算原理我们可以知道:

NO.1 basemean不是通过fpkm计算的,也不是直接求平均数算的,是先用read count除以sizefactor进行均一化,再用均一化之后的read count按分组方式计算平均数。所以我们说basemean是基因表达量的“均一化”结果,而不能直接说是fpkm的平均数。

NO.2 “牵一发而动全身”:计算sizefactor时先通过横向(样品)计算Δ值,再通过纵向(基因)找出Δ值的中位数,因此一旦改变任何一个样品或一个基因,所有的sizefactor都会跟着发生变化,也就会导致basemean变化。理解了这一点,我们就可以解决这样的问题了:“A VS C和A VS B两个DESeq表,A组没有变啊,为什么两个表里同一个基因的basemeanA是不同的?”

郑重申明:本文对于basemean的计算仅用于展示软件分析原理,实际结果请以派森诺提供的差异分析结果为准。返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3