快速上手

您所在的位置:网站首页 arket国内首店 快速上手

快速上手

#快速上手 | 来源: 网络整理| 查看: 265

宏基因组一直以来是诺米代谢主推产品之一,上篇内容带各位老师一起了解了宏基因组学质控+物种组成分析的内容,诺米后台也得到了老师们积极的反馈。接下来,我们一起看下对于差异物种和功能水平的结果怎样分析,如何快速读懂和选择我们需要的内容~

方案咨询

丨第三步:物种差异分析

当我们探究了微生物群落组成上的差异,我们还需要知道这些差异主要是由哪些物种的差异分布所导致的,此时可借助多种方法进行分析,比如物种韦恩图,聚类热图,曼哈顿图,LEfSe分析等,对于一些队列样本还可以使用随机森林分析。

首先【Venn 图】可以直观地呈现各样本(组)所共有和独有的物种数量。利于我们在分析时快速地确定组与组间的差异物种信息。但Venn 图所呈现的信息往往比较宽泛,并不能快速地定位到某一具体差异物种及其变化情况。

【聚类热图】根据分类单元的丰度分布或样本间的相似程度加以聚类,并依据聚类结果对分类单元和样本分别排序,可以直观地将丰度数据值通过颜色呈现。红色:相对丰度较高;蓝色:相对丰度较低。聚类热图直观的展示了相对丰度的变化,但仍然缺少差异评价信息。

而通过归一化每个样本各分类水平的组成丰度,可以逐一比较每个分类单元在样本组之间的丰度差异,并使用统计检验评价差异是否显著。典型的如曼哈顿分析和LEfSe分析。

【曼哈顿图】一般以两两比较的方式进行分析,以一定的阈值(种水平数据在分组A或B出现频次大于等于0.3以及-log10(adj-Pvalue)值)为筛选条件,得到差异物种信息,分为A组上调和B组上调(即A组下调)的两张图展示,通过该图,我们可以找出各分组显著上调的种水平分类单元,以及上调较多的门和目。

曼哈顿分析一般由两张图同时展示用以说明组内物种差异,且仅能实现两两比较。而【LEfSe分析】是一种差异分析方法,可以直接对所有分类水平同时进行差异分析,并在一张图中实现多组间的比较。它的一大特点是,不局限于对不同样本分组中的群落组成差异进行分析,更可以深入到不同的子分组(Subgroup)中,挑取在不同子分组中表现一致的标志微生物类群。所以LEfSe也是差异物种分析中最常应用的方法。

LEfSe的分析结果包括两部分,分别是【显著差异物种LDA值分布柱状图】,用以展示每个组内显著富集的物种(注意不显示显著下调的)及其重要性程度;【物种分类学分枝图】,用以展示在各组样品中标志物种的分类学层次分布。通过下图让我们具体解析一下LEfSe分析所提供的具体信息:

以上就是宏基因组结果中有关于物种水平分析的全部重点内容。在分析时,我们基于三步走分析方法,从物种组成—多样性分析—差异物种分析,层层递进,全面分析,其中重中之重的几张分析图包括【不同分类水平物种组成柱状图】,【PCoA图】,【差异物种聚类热图】,【LEfSe物种柱状图】,着重掌握好这四张图,针对于在写文章对物种水平上的分析可以说是事半功倍。

功能水平分析——同样三步走

除了物种水平上的分析,宏基因组的另一个重头戏就是功能水平的分析。功能注释是将测序得到的基因序列在多个功能数据库中进行注释,例如KEGG数据库(京都基因与基因组百科全书),GO数据库(基因本体论联合会建立的数据库),eggNOG数据库(直系同源蛋白分组比对),CAZy数据库(碳水化合物活性酶数据库)等几大常用数据库。基于报告结果本身而言,功能水平分析的图表形式与分析形式与物种水平是相似的,如柱状图、热图、多样性分析、LEfSe分析等等。因此以下不再做详细介绍,仅对图片和分析内容进行展示。

Tips:各数据库组成情况

▫KEGG分为4个等级(第一等级为生物代谢通路,第二等级为代谢通路的子功能,第三等级即对应代谢通路图,而第四等级为KO编号,对应代谢通路上各个KO的具体注释信息);

▫GO涵盖三个方面,分别描述基因的分子功能MF(MolecularFunction)、细胞的组件作用CC(CellularComponent)、参与的生物学过程BP(BiologicalProcess),基本单元是Term;

▫eggNOG分为2个等级(第一等级对应25个功能大类,第二层为eggNOG编号);

▫CAZy分为2个等级(第一等级为6大蛋白功能模块,第二等级为对应的蛋白家族)。

1)功能与代谢通路组成分析

功能与代谢通路组成分析默认对KEGG, eggNOG, CAZy三种数据库注释的功能或代谢通路组成进行分析,以下均以KEGG数据库的分析结果为例。

2)Beta多样性分析

功能Beta多样性分析默认对三种数据库注释的功能单元(即KO,eggNOG,CAZymodules)进行分析,主要以四种形式呈现:【PCA主成分分析】、【PCoA主坐标分析】、【NMDS分析】、【UPGMA聚类分析】。以ko为例,图片如下:

3)功能—物种一致性分析

通过上述多样性分析,我们从功能丰度谱和物种组成谱两个层面分别考察了样本(组)间的差异大小。在此基础上,我们需要进一步评估样本(组)在功能和物种两个层面的差异模式是否具有一致的共性,并且通过关联分析,量化两者之间一致性的高低。

我们第一可以通过 Procrustes 分析,将功能丰度谱和物种组成谱的PCoA排序结果相互关联。

另一方面,我们也对功能和物种两个层面的Alpha多样性指数,进行Pearson关联分析,从而评估菌群宏基因组在两个层面的多样性是否具有统计学意义的一致性。结果如下:

4)功能差异分析

与物种水平差异分析类似,功能差异分析包含【共有功能类群分析】、【聚类分析】、【LEfSe分析等】。除此之外,还增加有【差异KO的代谢通路映射图】及【富集分析】。

【差异KO的代谢通路映射图】:我们根据功能单元KO的组间差异分析的结果,以及预测到的KEGG代谢通路的情况,将KO映射到KEGG的“代谢通路图(KEGGPathwayMaps)”上,通过指定上调和下调的KO的颜色,从而在代谢通路图上直观地展示样本(组)间的功能组成差异。

【富集分析】基于基因丰度表,以及这些基因通过各数据库注释获得的KO/GOTerm信息,可以通过富集分析找出处理组间发生了富集的代谢通路,并通过统计检验评价其是否显著。以点状图(KEGG为例)与网络图(GO为例)两种形式展示。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3