宏基因组分析

您所在的位置:网站首页 宏基因组组装 宏基因组分析

宏基因组分析

2024-07-12 22:25| 来源: 网络整理| 查看: 265

一、介绍

宏基因组 ( Metagenome) 指特定环境下所有生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因。一般从环境样品中提取基因组DNA, 进行高通量测序,从而分析微生物多样性、种群结构、功能信息、与环境之间的关系等。

宏基因组的分析目前主要包括三种方法:基于组装分析、基于reads分析、基于bin分析。

下面我们介绍基于组装的分析方法。

二、分析流程介绍

数据分析从下机原始序列开始,首先对原始序列进行去接头、 质量剪切以及去除污染等优化处理。然后使用优质序列进行拼接组装和基因预测,将各样本预测得到的基因集合并在一起去冗余,得到非冗余基因集;对得到的非冗余基因集进行物种和功能上的注释,并使用BWA软件将优化序列比对到非冗余基因集,计算得到各基因在各样品中的丰度信息(RPKM); 对物种和功能注释结果进行统计分析。

 

三、详细流程 使用fastp软件使用划框方法去除低质量碱基,同时去除接头序列;如果样品来源于宿主(比如人或动物的粪便),而且该宿主本身的基因组已被发表, 则通过软件Bowtie2将reads比对宿主DNA序列,并去除比对相似性高的污染reads; MEGAHIT是一个二代测序从头组装工具,尤其在土壤等复杂环境样本组装、大量样本混合组装方面优势明显,同时提供更好的完整性和连续性,为行业的主流组装软件。使用Megahit软件通过设置不同kmer参数,对优化序列进行组装得到Contigs;可以通过N50判断组装结果的质量。

样品名称

序列数(条)

碱基数(bp)

Mean(bp)

Max(bp)

N50(bp)

N70(bp)

N90(bp)

Sample1



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3