基于比较基因组学揭示不同植物乳杆菌的遗传特征及菌株差异

您所在的位置:网站首页 cac奶h基因突变 基于比较基因组学揭示不同植物乳杆菌的遗传特征及菌株差异

基于比较基因组学揭示不同植物乳杆菌的遗传特征及菌株差异

2023-11-07 10:08| 来源: 网络整理| 查看: 265

植物乳杆菌(Lactobacillus plantarum,L. plantarum)是一种兼性异型的乳酸菌(lactic acid bacterial,LAB),其广泛存在于碳水化合物高的环境中,如乳制品、发酵肉制品和植物基质等多种环境[1]。L. plantarum作为人体肠道土著菌群具有很高的安全性,是益生菌开发的潜力贮备[2]。Nguyen等[3]研究发现部分L. plantarum有平衡肠道菌群、缓解炎症和降低血胆固醇等作用。Kim Eiseul等[4]发现L. plantarum可产生植物乳杆菌素,对革兰氏阴性菌和阳性菌均有抗菌活性。由于L. plantarum特性优良使得它无论在发酵食品、医药领域和工业乳酸发酵都有广泛应用。

随着高通量技术不断发展,测序成本和时间很大程度降低,越来越多的菌株完成了全基因组测序[5]。比较基因组学(comparative genomics)是以相关物种基因组的相似性为基础,根据测序和基因组图谱,通过基因组信息推测基因数目、功能及表达机制的研究[6]。利用比较基因组学来构建物种核心基因集(core genome)和泛基因集(pan genome),通过讨论物种的直系同源序列从而分析其群体遗传和表型演化[5]。L. plantarum作为乳酸菌组成的重要菌株,通过比较基因组学方法揭示其丰富的基因组信息,对食品工业发酵、医疗保健和农业生产至关重要。

本团队前期通过对121株食物来源的L. plantarum筛选到1株L. plantarum P9,其可在大鼠肠道内定殖、排泄有机磷农药和缓解肠道炎症[7]。本团队于2004年从新疆酸马奶中分离得到L. plantarum Lp-6,后续实验发现该菌可对有害菌、致病菌具有一定抑菌特性。本研究对L. plantarum Lp-6和L. plantarum P9进行PacBio SMRT全基因组测序,并从NCBI Refseq数据库下载了110株植物乳杆菌全基因组序列和1株模式菌株L. plantarum ATCC 14917T基因组序列。以113株L. plantarum为研究对象,采用比较基因组的方法从全基因组水平探究不同菌株之间基因组的差异,解析不同L. plantarum菌株遗传异质性,为L. plantarum应用奠定遗传学基础。

1 材料和方法 1.1 实验菌株

本研究测定的2株L. plantarum菌株来自内蒙古农业大学乳酸菌菌种资源库(lactic acid bacteria collection center,LABCC),L. plantarum P9分离自内蒙古自治区自然发酵酸粥,L. plantarum Lp-6分离自新疆维吾尔族自治区酸马奶。

截止7月10日为止,将NCBI (national coalition building institute, https://www.ncbi.nlm.nih.gov/) Refseq数据库112株L. plantarum基因组完成图全部下载,同时下载模式菌株L. plantarum ATCC 14917T。计算平均核苷酸一致性(average nucleotide identity,ANI)后,去掉2株与模式菌株ANI值小于95%菌株。

1.2 主要试剂和仪器

Wizard® Genomic DNA Purification Kit (美国普洛麦格生物技术有限公司);MRS培养基(Oxoid公司);SMRT建库试剂盒(DNA Template Prep Kit 1.0)和测序试剂(DNA/Polymerase Bingding Kit P6 v2和DNA Sequencing Bundle 4.0) (美国太平洋生物科学公司);电热恒温培养箱(北京一恒科技有限公司);超微量紫外分光光度计(NanoDrop公司);Qubit 2.0荧光计(美国Life Technologies);PicBio SMRT RS Ⅱ测序平台(美国Pacific Biosciences公司)。

1.3 菌株培养与基因组DNA的提取、测序

本实验所用菌株L. plantarum P9和L. plantarum LP-6,具体步骤如下:(1) 将其分别接种至5 mL的MRS液体培养基中,37 ℃,无氧条件培养24 h;(2) 以2%的接种量到50 mL的MRS液体培养基中,在37 ℃的厌氧工作站扩培24 h;(3) 扩培到第三代的菌液以3000 g/min离心10 min收集菌泥;(4) 用PBS缓冲液将菌泥清洗2遍后,准备进行全基因组DNA的提取。全基因组DNA提取流程参考本实验室钟智等[8]的方法。

对于提取后的DNA具体处理如下:(1) 使用NanoDrop微量紫外分光光度计及0.6%的琼脂糖凝胶电泳对所提取的DNA进行浓度、纯度和片段完整度进行检测;(2) 将符合要求的DNA合并到2 mL离心管中,加入0.46×磁珠进行吸附;(3) 将废液吸出,并且用75%乙醇对吸附DNA的磁珠快速洗涤两遍;(4) 用回溶液将纯化后的DNA从磁珠上回溶,用Qubit检测纯化后DNA的质量浓度。通过回溶后DNA体积与浓度相乘获得DNA的最终质量,要求DNA质量大于7 µg且体积小于150 µL。将符合要求的高质量L. plantarum DNA按照PacBio SMRT建库流程对提取的全基因组DNA建立10 kb文库,建库后根据上机流程采用PacBio SMRT RS Ⅱ测序平台进行全基因组测序。每株菌使用一个PacBio SMRT cell,平均可测得高于150倍的原始数据。

1.4 基因组测序和组装

将获取的原始数据进行质量评估,经过低质量reads的过滤、去除接头和引物后,获得高质量的reads序列,通过SMRT® Portal (V2.7)软件的方案RS_HGAP_Assembly.3进行质控和菌株基因组组装。使用circlator (V1.5.5)[9]对下机数据进行环化得到基因组完成图。

1.5 比较基因组学分析

1.5.1 平均核算一致性(average nucleotide identity,ANI)和总核酸一致性(total nucleotide identity,TNI)值的计算:

本研究中L. plantarum的ANI和TNI值的计算参考Goris等[10]和Chen等[11]方法,用自制Perl脚本进行计算。

1.5.2 全基因组圈图和功能基因组分析:

将上述组装好的L. plantarum P9和L. plantarum Lp-6的核酸序列文件分别上传至RAST (repaid annotion using subsystem technology;http://rast.nmpdr.org/rast.cgi)进行注释,并下载对应的基因功能注释文件。将L. plantarum P9和L. plantarum Lp-6染色体与质粒拆分,与功能基因注释文件分别对应上传至CGView Server (http://stothard.afns.ualberta.ca/cgview_server/)。统计基因组基本信息采用自制perl脚本完成。

1.5.3 构建核心基因集、附属基因集:

核心基因基于Prokka[12]软件对菌株基因组进行基因预测后,采用Roary[13]软件识别核心基因集和附属基因集(accessory gene),其中以编码蛋白氨基酸相似性大于95%的原则识别核心基因,核心基因是存在于所有菌株基因组中共有的基因;其中仅在一个菌株中出现的基因称为特有基因,所有菌株特有基因相加为特有基因之和。

1.5.4 系统发育树和共线性分析:

利用Roary得到的核心基因序列使用treebest软件利用邻接法(neighbor-joining,NJ)构建邻接树,探究L. plantarum的系统发育关系。使用Mauve软件[14]对L. plantarum P9、L. plantarum Lp-6和L. plantarum WCSF1的基因组序列进行共线性分析。

1.5.5 数据作图:

使用R (V3.5.0)软件中的“pheatmap”程序包绘制热图。

1.6 菌株核酸登录号

L. plantarum P9和L. plantarum Lp-6基因组序列已提交至GeneBank数据库,序列号为PRJNA655563。

2 结果和分析 2.1 植物乳杆菌基因组信息

对于测序样品L. plantarum P9和L. plantarum Lp-6进行数据评估和序列组装,得到基因组组装结果(表 1)和基因组基本特征(表 2),将组装完成的序列拼接成基因组圈图(图 1)。结果显示,L. plantarum P9基因组序列在组装后有1条环状染色体和9个质粒;全基因组长度为3314.2 kb,其中环状染色体大小为3067 kb,GC含量(%)为44.11%,其中包含了3147个蛋白质编码序列(protein-coding sequence,CDS)。L. plantarum Lp-6基因组序列组装后由1条环状染色体和8个质粒组成;全基因组长度为3482.5 kb,其中环状染色体长度为3101.3 kb,GC含量(%)为44.82%,其中包含了3436个蛋白质编码序列CDS。

表 1. 植物乳杆菌P9和LP-6的基因组组装结果统计 Table 1. Statistics of assembly results of Lactobacillus plantarum P9, LP-6 genome Strains Features Number of scaffolds Full length/bp GC content/% Strains Features Number of scaffolds Full length/bp GC content/% Lactobacillus plantarum P9 Chromosome 1 3067028 44.11 Lactobacillus plantarum Lp-6 Chromosome 1 3101304 44.82 Plasmid1 1 13709 44.62 Plasmid1 1 22072 40.45 Plasmid2 1 91545 39.38 Plasmid2 1 49865 40.15 Plasmid3 1 71514 38.64 Plasmid3 1 40043 41.22 Plasmid4 1 52855 38.38 Plasmid4 1 104731 41.20 Plasmid5 1 8884 35.21 Plasmid5 1 62199 41.01 Plasmid6 1 39853 36.04 Plasmid6 1 62394 41.68 Plasmid7 1 13703 37.36 Plasmid7 1 24406 36.86 Plasmid8 1 6603 33.77 Plasmid8 1 15509 40.69 Plasmid9 1 2206 40.34 表选项 表 2. 植物乳杆菌P9、LP-6基因组基本特征 Table 2. General features of Lactobacillus plantarum P9, LP-6 genomes Features Lactobacillus plantarum P9 Lactobacillus plantarum Lp-6 Number of contigs 10 9 Bases/kb 3314.2 3482.5 Number of CDS 3147 3436 Number of tRNA 94 71 Number of tmRNA 1 1 表选项 图 1 Lactobacillus plantarum P9 (A)、LP-6 (B)的基因组圆形图谱 Figure 1 Circular map of Lactobacillus plantarum P9 (A), LP-6 (B) genome. 图选项

L. plantarum是乳酸菌中基因组最大的菌种之一,全基因组长度一般在3.2 Mb至3.4 Mb之间[15]。由基因组特征结果可知,L. plantarum P9和Lp-6两株菌基因组特征具有一定差异,全基因组长度分别为3314.2 kb和3482.5 kb。L. plantarum P9有9个质粒,平均GC含量(%)为38.19%,其中GC含量(%)最高为44.62%,最低为33.77%;L. plantarum Lp-6含有8个质粒,其平均GC含量(%)为40.41%,GC含量(%)最低为36.86%,最高为41.22%。

2.2 ANI和TNI分析

ANI是基因组的同源序列进行比对来判断菌株是否为同一种或亚种,TNI是计算基因组之间核酸匹配比例,为基因组数据集提供更高的区分能力[16]。在比较基因组学分析过程中,ANI可评估基因组间多态性的程度,也可判断基因组之间的相似性,一般认为ANI大于等于95%为同一种[17]。

Zhong等[18]通过计算161株粪肠球菌ANI值发现不同菌株之间存在遗传差异。本研究对113株L. plantarum全基因组序列进行ANI和TNI分析,并绘制了热图(图 2)。结果显示全部菌株之间ANI均大于97.0%,TNI大于78.0%。L. plantarum P9和L. plantarum Lp-6之间ANI为98.5%,TNI为85.4%;L. plantarum P9和模式菌株L. plantarum ATCC 14917T间ANI为99.0%,L. plantarum Lp-6和L. plantarum ATCC 14917T的ANI为98.7%。L. plantarum P9和L. plantarum ATCC 14917T碱基和核酸匹配度更高,不同L. plantarum基因组存在差异。

图 2 111株植物乳杆菌的ANI (A)及TNI (B)结果 Figure 2 Heatmap of ANI (A) and TNI (B) based on the sequences of 111 L. plantarum. 图选项 2.3 共线性分析

共线性分析是研究物种基因组间相关性,基因组相关性越高其亲缘关系越近,会出现共线性,代表基因序列部分或全部保守[19]。L. plantarum WCSF1是从人类唾液中分离且于2001年完成首次测序,在2012年完成了重新测序和重新注释[20]。本实验中将该L. plantarum WCSF1菌株全基因组序列作为参考,通过Mauve软件分析L. plantarum Lp-6和L. plantarum P9 (图 3)。结果表明,L. plantarum Lp-6和L. plantarum P9突变重组位置较少,与L. plantarum WCSF1共线性及相似度较好,L. plantarum Lp-6和L. plantarum P9局部的插入、缺失和倒位发生在局部共线块上。

图 3 植物乳杆菌共线性分析 Figure 3 Synteny analysis of L. plantarum using the genome of strain WCSF1 as the reference. 图选项

以L. plantarum WCFS1为参考,观察到22.0 kb含有xerS、acm和xre等基因的片段在L. plantarum Lp-6发生了倒位现象,而L. plantarum P9染色体上缺失该基因组片段,这些基因主要涉及到转录调控、酪氨酸重组和溶菌酶合成等功能;L. plantarum Lp-6染色体上发现13.0 kb特有基因组片段,包含tagF、ssbB和dnaC等基因,可能与磷酸转移、DNA合成和重组有关;L. plantarum P9染色体上14.4 kb基因片段观察到有gpmA、pstA和pstC等特有基因,这些基因均与磷酸盐代谢转运功能有关。

两株L. plantarum发生一定的基因组插入或缺失等现象。短基因片段的插入和倒位提示菌株在进化过程中可能发生了基因重组和转移现象[21],基因组的插入或缺失可能与开放性基因组的形成有关[16]。L. plantarum Lp-6、L. plantarum P9与参考菌株基因组差异表明了基因组在进化过程中发生了重组和转移,但该现象是否会导致L. plantarum形成开放性基因组仍有待研究。

2.4 泛-核心(pan-core)基因集的构建

为比较不同菌株间的基因差异,通过Prokka和Roary软件进行分析,以大于90%的氨基酸一致性为标准,统计核心基因和泛基因个数。113株L. plantarum的泛基因集包括了15473个基因,其中核心基因1482个,特有基因5773个。由图 4可知,随着基因组数量的增加,核心基因的个数逐渐趋于稳定,而泛基因个数仍然呈现增长的趋势。

图 4 泛基因集和核心基因集曲线 Figure 4 Pan-core gene family curve. The abscissa represents the number of strains, and the ordinate represents the number of genes. 图选项

研究表明,开放基因组特点为随着基因组数量的增加,核心基因趋于稳定,泛基因呈上升状态的曲线,则该基因组具有较高的遗传多样性[22]。开放式基因组特点与本文L. plantarum的相同,表明L. plantarum为开放式基因组,故推测L. plantarum具有较高遗传异质性。

2.5 核心基因(core genome)系统发育分析

系统发育树可以直观地表现出同一个群体内不同个体间的遗传距离与进化关系,构建系统发育树是研究种群结构和物种进化的必要前提[17]。为了进一步了解L. plantarum P9、L. plantarum Lp-6和其余111株植物乳杆菌的群体结构,本研究基于1482个核心基因的核酸序列,将近缘物种的L. plantarum subsp. argentoratensis DSM16365T作为外群,通过邻接法(neighbor-joining)构建了系统发育树,bootstrap值为1000 (图 5)。113株L. plantarum其中包括75株食品分离源、21株动物肠道分离源、10株其他分离源、4株果蝇分离源及3株植物分离源。113株L. plantarum在进化过程中由于其遗传多样性造成菌株之间的差异,由图 5可知,其中分为3个主要分支,集中在一个分支表明亲缘关系更近。L. plantarum Lp-6所在分支更靠近外群根部;L. plantarum ATCC14917T 在距离根部最远的H3分支,该分支包括63株L. plantarum菌株,主要由4株果蝇分离株(占果蝇分离株100%)、16株动物肠道分离株(占动物肠道分离株76%)和37株食品分离株(占食品分离株49%);L. plantarum P9在H2分支,有15株L. plantarum,其中12株分离自食品源。L. plantarum Lp-6所在H3群体,可能是L. plantarum P9和L. plantarum ATCC14917T的祖先群体。果蝇分离株和动物肠道分离株呈现明显的聚集性。本实验室前期刘亚华[23]研究发现果蝇分离株由于分离环境特殊,细菌基因组会对环境适应或进化累积该环境相关的遗传变异信息,从而导致菌株间遗传信息具有差异。宋宇琴[17]通过对200株不同地区的德式乳杆菌保加利亚亚种研究发现,不同地理环境生存的菌株为应对环境压力,发生了适应性进化。但本文中分离自果蝇的植物乳杆菌较少,是否由于适应性进化产生环境特异性基因仍有待研究。

图 5 基于核心基因序列的系统发育树 Figure 5 Phylogenetic tree based on core gene sequences. 图选项 2.6 基于全基因组测序对植物乳杆菌菌株水平的鉴定

2.6.1 113株植物乳杆菌菌株水平鉴定:

在L. plantarum菌株基因组水平上,对113株L. plantarum菌株通过Excel随机抽样函数随机挑选6株L. plantarum。通过比较基因组学分析发现不同菌株基因组大小、质粒数和GC含量(%)均有不同(表 3);计算核酸一致性(ANI和TNI)显示出6株L. plantarum与模式菌株L. plantarum ATCC 14917T核酸匹配度各有差异;以核心基因构建系统发育树结果显示6株L. plantarum亲缘关系远近不同而分布在不同分支;对113株L. plantarum菌株核心基因泛基因组进行分析,其中6株菌为例,不同菌株特有基因个数和基因注释功能各有差异,其中表 3中特有基因数量仅为Prokka注释到功能的基因。综上所述,本研究发现可通过比较基因组学的方法,发现不同的菌株基因组上存在的差异,最终从基因组特征、核酸一致性、系统发育树和特有基因等角度实现L. plantarum菌株水平的鉴定,为工业和生产上L. plantarum的应用奠定遗传学基础。

表 3. 部分植物乳杆菌菌株基因组信息 Table 3. Genomic information of some Lactobacillus plantarum strains Strain names Plasmids Genome size GC Content/% Branches The reference is L. plantarum ANI/% ATCC 14917T TNI/% Number of specific genes dm 1 3325676 44.52 H1 99.26 92.53 1 SK151 1 3231249 44.56 H1 99.25 91.30 0 NCIMB700965.EF.A 6 3217131 44.53 H3 98.48 79.21 1 TMW 1.277 11 3400131 44.22 H1 99.38 87.92 3 SN35N 5 3415192 44.27 H2 98.98 86.40 3 SRCM103300 5 3388332 44.35 H3 98.82 85.86 8 表选项

2.6.2 植物乳杆菌P9和Lp-6差异分析:

L. plantarum P9和L. plantarum Lp-6为本实验室前期研究筛选出的菌株,前期研究发现可能具有益生特性。本文以L. plantarum P9和L. plantarum Lp-6为例,通过比较基因组学发现,在基因组水平上L. plantarum P9比L. plantarum Lp-6基因组GC含量(%)小,但质粒数更多;从核酸一致性角度,L. plantarum P9和L. plantarum Lp-6之间ANI为98.5%,TNI为85.4%,表明二者均为L. plantarum菌株,但其核酸一致性存在一定差异,可能是在进化过程中不同分离源所导致;系统发育树结果显示,113株L. plantarum可分为3个分支,L. plantarum P9和L. plantarum Lp-6在不同分支,显示其亲缘关系较远,但与作为外群的菌株L. plantarum subsp. argentoratensis DSM16365T距离较远,表明L. plantarum P9和L. plantarum Lp-6均为L. plantarum subsp. plantarum。113株L. plantarum菌株核心基因泛基因组分析结果显示,其中通过Prokka注释到功能的基因,L. plantarum P9有lysS和hslO为代表的14个特有基因,L. plantarum Lp-6有iap和nadC等13个特有基因(表 4)。在染色体结构上,通过共线性分析发现L. plantarum P9和L. plantarum Lp-6染色体中各自有部分基因片段发生基因重组和转移。

表 4. Prokka注释植物乳杆菌P9和Lp-6特有基因 Table 4. The unique genes of L. plantarum P9 and L. plantarum Lp-6 annotated by Prokka L. plantarum P9 Number L. plantarum Lp-6 Number rep 1 ydiI 1 nfrA 2 wbbI 1 murG 1 puuP 1 melR 1 pucI 1 lysS 3 plaP 1 ltaS 2 nadC 2 hslO 3 menE 1 hmoB 1 menB 1 hcaR 1 iap 4 gmuC 1 hepT 1 dusC 1 gadB 2 drrA 1 emrB 1 codB 1 alx 1 clpC 1 表选项

为进一步了解L. plantarum P9和L. plantarum Lp-6基因组的差异,通过Prokka注释结果发现,L. plantarum P9注释到3093个基因,特有基因为112个,其中注释到功能相关的基因有14个,L. plantarum Lp-6注释到3355个基因,特有基因259个,有13个功能相关的基因,其中二者与功能有关的特有基因在表中(表 4)列出,L. plantarum P9特有基因14个,主要参与DNA复制重组、NADPH氧化还原酶、赖氨酸合成及其他生物合成及代谢途径;L. plantarum Lp-6包括13个特有基因,涉及膜转运功能、胺类、肽酶和酯酶的合成以及多种物质代谢功能调控,其中有4个拷贝的iap基因参与肽链内切酶合成。蛋白酶和肽酶可降解肽类和氨基酸,构成蛋白质水解系统[24]。不同分离源的菌株在适应环境的过程中,可能会获得有利于其在该环境下生存的环境特异性基因[23]。两株菌特有基因功能具有较大差异,但L. plantarum Lp-6注释到较多与蛋白水解相关的特有功能基因,故推测L. plantarum Lp-6有更强的蛋白水解能力,但还需进一步研究验证。

3 结论

随着测序技术不断发展以及生物信息学的不断进步,越来越多L. plantarum基因组组装得到基因组完成图。本研究通过PacBio SMRT得到L. plantarum Lp-6和L. plantarum P9基因组完成图,结合比较基因组学方法发现L. plantarum Lp-6和L. plantarum P9基因组大小、质粒数量和染色体结构均存在差异。L. plantarum基因组特征除GC含量(%)外,基因组大小、质粒数均有差异。系统发育树结果显示L. plantarum P9与L. plantarum ATCC 14917T遗传距离更近,L. plantarum Lp-6更接近祖先群体分支。与参考菌株L. plantarum WCFS1相比,L. plantarum Lp-6约22.0 kb的基因片段发生倒位,该片段在L. plantarum P9发生缺失,主要包含有xerS、acm和xre等基因;L. plantarum Lp-6缺失了大小约13.0 kb基因组片段,L. plantarum P9基因组缺失约14.4 kb,包含ssbB、dnaC和gpmA等基因。L. plantarum基因组特征除GC含量(%)外,其他基因组特征均有差异。本文通过比较基因组学分析发现不同L. plantarum菌株存在差异,以期为之后L. plantarum比较分析及其生产应用奠定一定遗传学基础。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3