微生物差异丰度分析方法ANCOM

您所在的位置:网站首页 随机采样方法不包括 微生物差异丰度分析方法ANCOM

微生物差异丰度分析方法ANCOM

2023-06-06 12:01| 来源: 网络整理| 查看: 265

ANCOM-BC(Analysis of Compositions of Microbiomes with Bias Correction)

用户教程参考:https://github.com/FrederickHuangLin/ANCOM-BC-Code-Archive

R语言包ANCOMBC: https://github.com/FrederickHuangLin/ANCOMBC

Mandal S, Van Treuren W, White R A, et al. Analysis of composition of microbiomes: a novel method for studying microbial composition[J]. Microbial ecology in health and disease, 2015, 26(1): 27663. https://www.tandfonline.com/doi/abs/10.3402/mehd.v26.27663 [ANCOM, 引用超1300次。]

Morton J T, Marotz C, Washburne A, et al. Establishing microbial composition measurement standards with reference frames[J]. Nature communications, 2019, 10(1): 1-11. https://www.nature.com/articles/s41467-019-10656-5。【The Differential Ranking (DR) methodology, 引用超过300次】

摘要: 由于数据的复杂性,微生物组数据的差异丰度 (DA) 分析仍然是一个具有挑战性的问题。在本文中,我们定义了“抽样分数”的概念,并证明了对微生物组数据进行 DA 分析的主要障碍是样本间抽样分数的差异所引入的偏差。我们介绍了一种称为“带偏差校正的微生物组成分分析”的方法 ( ANCOM-BC, Analysis of Compositions of Microbiomes with Bias Correction), 它估计未知的抽样分数并纠正由它们在样本之间的差异引起的偏差。绝对丰度数据使用线性回归框架建模。该公式在该领域取得了根本性的进步,因为与现有方法不同,它 (a) 提供具有适当 p 值的统计有效检验,(b) 为每个分类单元的差异丰度提供置信区间,© 控制错误发现速率 (FDR),(d) 保持足够的功率,并且 (e) 在计算上易于实现。

ANCOMBC包包括微生物的差异丰度分析和关联分析:

Analysis of Compositions of Microbiomes with Bias Correction 2 (ANCOM-BC2, manuscript in preparation)Analysis of Compositions of Microbiomes with Bias Correction (ANCOM-BC)Analysis of Composition of Microbiomes (ANCOM ) for DA analysisSparse Estimation of Correlations among Microbiomes (SECOM) for correlation analysis.

绝对丰度和相对丰度的区别: 单个物种的绝对丰度变化,会改变所有物种的相对丰度。

Sampling fraction (采样率) is defined as the ratio of the expected absolute abundance of a taxon in a random sample (e.g., a stool sample) to its absolute abundance in a unit volume of the ecosystem (e.g., a unit volume of gut) where the sample was derived from.

请注意,并不是所有样本都有相同的采样率,采样率被定义为随机样本(例如,粪便样本)中分类单元的预期绝对丰度与其在生态系统单位体积(例如,一个单位肠道体积)样本来源。因此,观察到的计数在样本之间不可比。因此,所有差异丰度分析方法都需要对计数进行适当的归一化,以解决样本间抽样分数的差异。采样分数受两个因素的影响,即生态系统单位体积中的微生物负荷和相应样本的文库大小(例如,从受试者的粪便样本中测序的物种总丰度)。因此,将样本库大小标准化是不够的,因为需要考虑微生物载量的差异。考虑图2中的玩具示例,假设受试者A和B的肠道仅由两个类群组成,即红色和绿色。显然,与受试者A的生态系统相比,受试者B的生态系统中每个分类单元的真实绝对丰度高出50%。但是,他们在各自样本中都具有相同的文库大小(每个6个)。此外,样品相对丰度以及样品的绝对丰度在两个样品中是相同的。如果归一化方法仅基于样本文库大小,而忽略了抽样分数,则两个样本将被视为归一化。因此,研究人员会错误地得出结论,认为了两个生态系统中没有一个类群存在差异丰度。如果人们认识到我们从A系统中获得的样本比从B系统的抽样比例高( 3 9 v s 2 9 \frac{3}{9} vs \frac{2}{9} 93​vs92​), 这个错误的结论是可以避免的。

image-20221213100526428

与ANCOM和DR一样,拟定的ANCOM-BC方法假设观察到的样本是生态系统体积的未知比例,并且采样比例因样本而异。ANCOM-BC通过在线性回归框架中引入特定样本的偏移项来计算采样比例,该偏移项是根据观察到的数据估计的。偏移项用作偏差校正,对数尺度的线性回归框架类似于对数比例转换来处理微生物组数据的组成性。"方法"部分也讨论了零计数的情况。这种方法与DR(The Differential Ranking (DR) methodology)。

image-20221212223214428



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3