顶刊综述

您所在的位置:网站首页 细菌基因组的提取结果分析与讨论 顶刊综述

顶刊综述

2024-07-11 12:27| 来源: 网络整理| 查看: 265

生科云网址:https://www.bioincloud.tech

编译:微科盟鼻涕,编辑:微科盟茗溪、江舜尧。

微科盟原创微文,欢迎转发转载,转载须注明来源《微生态》公众号。

导读  

水平基因转移(HGT)可能是细菌进化中最显著的特征。在大多数细菌基因组中都发现了HGT的证据。虽然HGT可以一定程度地改变细菌基因组,但并非所有的转移事件都可能具有生物学意义,而是代表了一个不断进化过程的结果,该过程偶尔是有益的。当适应性转移发生时,HGT和正向选择可能导致基因组中特异性的、可检测的特征,如基因特异性移动或与生态相关的基因的转移率增加。该综述首先讨论了HGT发生的各种机制、遗传特征如何塑造基因组变异的模式以及不同的生物信息学算法如何开发来检测这些模式。接着讨论了HGT和细菌中的正向选择背后的进化理论,还讨论了在过去十年中发展起来的可能涉及到适应新环境的检测转移DNA的方法。

论文ID

原名:Horizontal gene transfer and adaptive evolution in bacteria

译名:细菌的水平基因转移与适应性进化

期刊:Nature Reviews Microbiology 

IF:60.633

发表时间:2021.11.12

通讯作者:Brian J. Arnold;William P. Hanage

通讯作者单位:美国普林斯顿大学;美国哈佛大学陈曾熙公共卫生学院

DOI号:10.1038/s41579-021-00650-4     

综述目录

1 引言

2 DNA转移和基因组整合

    2.1 进入一个新的细胞

    2.2 进入一个新的基因组

3 结构的影响

4 水平基因转移及筛选

    4.1 产生适应性等位基因多样性

    4.2 基因特异性移动

    4.3 多位点分子标记选择

    4.4 关注适应性基因转移

4.4.1 适应性与非适应性基因转移  

4.4.2 其他的基因组信息来推断选择  

4.4.3 结合生态学和更广泛的细菌群落  

4.4.4 实验验证  

5 结论及未来发展方向

主要内容

1 引言

伟大的进化生物学家约翰·梅纳德·史密斯曾经说过:“对于所有相信自然物种存在的哲学家,所有相信系统发育分类的普遍有效性的遗传分类学家,以及所有的表型学家,无论他们相信什么,研究一个分类单元的遗传和表型变异(如Neisseria)都应该是必须的”。这样的劝告是由于出现的证据表明的,在Neisseria属中(包括重要的病原菌Neisseria meningitidis和Neisseria gonorrhoeae),遗传物质的水平遗传是很常见的。这意味着细胞不仅可以垂直地在分裂时遗传DNA,还可以从其他更遥远的血统,甚至在已命名的物种之间遗传。尽管水平基因组交换在有性繁殖的真核生物中发生的频率与遗传交换不同,但随着时间的推移,这个过程仍然产生了来自许多不同血统的等位基因的嵌合基因组。在梅纳德·史密斯的评论发表20年后,得益于现代基因组学,我们对显著的水平基因转移(HGT)的程度有了更多的了解,我们认为,他的建议不仅仍然适用,而且值得更广泛的受众。

HGT涉及从一个细胞到另一个细胞的所有遗传物质转移,但在本综述中,我们重点关注整合到受体染色体的转移。HGT与突变、遗传漂变、选择和扩散一起,是细菌进化的支柱。它可以通过多种机制发生,其中一些转移约300 bp的小DNA片段,另一些则一次转移多个基因。由于这些机制及其使多样性民主化的能力,HGT对细菌基因组产生了多种后果,从改变基因之间的系统发育信号,到通过少量重组事件促进适应进化到新的生态位。

HGT的早期研究集中在管家基因的变异上,并量化了物种内部(而不仅仅是物种之间)重组的显著变异。在过去十年的基因组时代,人们不仅致力于检测重组,还致力于了解HGT和选择之间的相互作用,以及这种相互作用如何在细菌基因组中留下可检测的适应特征。越来越多的人不仅致力于检测重组,还致力于理解HGT和选择之间的相互作用,以及这种相互作用如何在细菌基因组中留下可检测的适应特征。这些努力包括基因组学,以确定对环境有益的特定水平转移基因,或确定选择是否是塑造物种整个泛基因组的主导力量。理解和识别适应性HGT的这些特征是反向生态学方法的一个组成部分。

在这篇综述中,我们首先简要地探讨了DNA在细胞间转移并整合到基因组中的机制。然后,我们讨论了在细菌基因组中检测HGT的多种方法,以及用于推断作用于转移DNA的选择力的方法和基础理论。我们讨论的大部分内容也适用于古细菌基因组的研究,但我们的回顾和例子主要集中在细菌上。

2 DNA转移和基因组整合

2.1 进入一个新的细胞

考虑到DNA从一个细菌基因组进入另一个细菌基因组的途径有很多,无性繁殖曾被认为是细菌复制的精确写照,这一点可能被认为是值得注意的。三种经典的机制是转化、转导和结合(图1)。转化是指从环境中吸收DNA,转导依赖于噬菌体,而接合是通过直接接触转移,典型的例子是质粒通过接合菌毛转移。只有少数物种(约80种)已知在实验室条件下具有自然转化能力,但在自然条件下,这种转化可能更为常见。事实上,在大多数细菌中都发现了与能力相关的蛋白质。同样,大约30%的公共微生物基因组(细菌和古菌)含有病毒序列(尽管考虑到人类肠道中培养的细菌,这一比例为74%),大约50%的拟杆菌门基因组包含接合系统。然而,由于很难准确检测参与HGT的基因,这些数字可能被严重低估,并可能作为下限。

除了这三种经典的机制外,DNA还有其他在细菌间转移的途径,正如最近发现它可以通过一种被称为“纳米管”或噬菌体样的微小菌毛结构膜泡在细胞间传播。这些机制被描述为“非规范的”,因为它们并不适合上述三个主要机制。然而,在我们考虑这些替代方案之前,规范中就已经充斥着各种各样的变化和例外。转化导致了质粒在大肠杆菌中摄取(不同于接合)是构成因素还是依赖于特定的线索,比如DNA损伤或饥饿;并且能够优先靶向来自同一物种的DNA,要么通过溶解来自同一物种的细胞,要么通过对含有特定序列的环境DNA的偏吸收。与噬菌体一样,噬菌体的转导也是多种多样的,接合不仅限于质粒,还包括整合性接合元件和转座子,它们可以整合到细菌染色体中。此外,噬菌体和质粒都可能引起类似元件的移动,这些元件已经失去了自我动员的能力,或者可以作为转座元件的载体(例如,转座子或插入序列),这些转座元件无法进行细胞间运输,只能在细胞内复制粘贴。事实上,细菌HGT最引人注目的方面之一是它发生的绝对数量的不同方式。

83591645486168192

图1. DNA摄取与整合机制的概述。从一个细菌到另一个细菌的水平基因转移首先需要DNA的摄取。DNA以多种方式穿过受体的细胞膜,其中三种典型的机制是转化、转导和接合。转化的定义是从环境中摄取DNA;转导依赖于噬菌体介导的DNA转移,这些DNA可以复制并重新包装成噬菌体颗粒或整合到宿主染色体上;接合通常通过接合菌毛直接接触传递质粒和其他接合元素。此外,DNA(包括质粒)可以通过所谓的非典型机制在细胞间传播,包括膜囊泡、称为“纳米管”的微小绒毛状结构或噬菌体样基因转移剂(GTAs)。外源DNA一旦进入细胞内,就可以通过重组的方式整合到染色体中,重组的方式也可以有不同的同源性要求。DNA如何整合到染色体(虚线)通常与它如何穿过细胞膜有关。转化后的整合机制涉及到外源DNA与RecA蛋白的结合,这有助于在受体基因组中寻找同源性。在摄取后,整合也可以在没有RecA的情况下进行,包括非同源DNA片段在复制过程中与单链基因组DNA杂交,非同源DNA片段在断裂端连接,或通过重组酶进行位点特异性整合等过程。质粒可能作为染色体外元件存在于细胞质中,但整合性接合元件(ICEs)缺乏复制起点(小橙色框),必须重组到宿主染色体中(如位点特异性重组)进行复制。虽然我们强调了一些DNA摄取和整合的常见途径,但也存在例外。

2.2 进入一个新的基因组

一旦DNA进入受体细胞,它可能会重组到细菌基因组中,并与之一起复制。在很大程度上,外来DNA重组成基因组的确切方式很大程度上与它穿过细胞膜的方式有关(图1)。

整合可能是通过无处不在的蛋白质RecA来完成的,它介导了一种通用的DNA交换机制,需要在两个区域接近完整的序列识别。RecA介导的对同一基因或基因组区域等位基因的置换被称为“同源重组”,以反映被置换的内容。然而,RecA对两侧DNA物理交换区域之间的序列是“盲目的”,可能整合来自不同物种或完全非同源基因的不同等位基因。一个简单的例子是肺炎链球菌(Streptococcus pneumoniae)荚膜位点的转移。这种多样化的操纵子编码围绕细胞的多糖并决定细胞的血清型,它包含不同血清型的不同基因,其中许多基因与其他荚膜基因座中的基因不同源。然而,通过同源重组的荚膜转移已被经常观察到。因此,我们区分了导致等位基因转移(AT)的重组,即一个等位基因被另一个替换并且染色体 DNA 没有获得或丢失,以及基因转移(GT),即基因组中基因的数量或类型被改变。

除了RecA介导的重组外,移动遗传元件(MGEs),如整合性接合元件或噬菌体可能使用位点特异性重组酶或转座将自身插入细菌染色体。一些重组酶或转座需要供体和受体在一个4-12-bp的基序上具有序列一致性,随后MGE将自身插入其中。例如,铜绿假单胞菌(Pseudomonas aeruginosa)中ISPa11插入序列的转座酶专门针对一个12 bp的基序,每个基因组中大约有三分之一的位点被一个MGE所占据。其他重组酶和许多转座酶具有很少或没有序列特异性,因此可能插入不同的位置。或者,如果染色体中已经存在相似的序列,MGEs可能通过RecA介导的重组整合到细菌染色体中,这是一个经常观察到的过程。因此,尽管在供体和受体中存在基序或短相似序列有助于外源DNA整合到新基因组中,但HGT仍可能转移对细菌基因组具有不同结构影响的分化等位基因或新基因。

3 结构的影响

当DNA穿过细胞膜并重新结合到细菌基因组中时,它的存在可以通过取样基因组中留下的几个可预测的特征之一来检测(图2),这些标记取决于DNA转移的机制。开发了许多方法来检测和量化AT(BOX1)或GT(BOX2),重组的遗传特征在很大程度上取决于供体DNA是来自同一群体还是来自分化群体,是否与受体同源位点长度相同,是否为MGE。

如果重组涉及到AT和来自同一群体的供体DNA,它可以通过将突变转移到不同的遗传背景上来打破突变之间的联系(图2a),特别是在基因组中距离足够远的突变之间,因此没有转移到同一DNA片段上。如果这个供体DNA来自一个已经积累了许多差异的遥远种群 (或物种),AT可能通过引入新的突变簇来增加联系(图2b)。例如,N. gonorrhoeae的mtr外排泵操纵子含有最近与几个近亲重组而产生的分化的大环内酯抗性(macrolide­resistance)等位基因。随着时间的推移,新引入的单核苷酸多态性(SNPs)之间的强联系可能会被随后在群体中的AT打破。因此,较老的SNP通常以更高的频率出现在样本中并出现在谱系的内部分支上,通常会比年轻的SNP表现出更少的连锁,因为重组有更多的时间将它们转移到不同的遗传背景上。或者,年轻的 SNP 在样本中通常很少见,并且出现在谱系的顶端。

由于其复制-粘贴式的机制,细菌重组可能在群体中产生由短片段相同的等位基因组成的单倍型结构。这些片段相同是特别短暂的,代表了进化上最近的转移,因为随后的突变或重组将引入变异,并将较长的单倍型打破为较短的单倍型。因此,表现出强烈倾向于片段相同的细菌样本可能代表了目前交换DNA的生态种群;该信号检测了三个模型系统(Vibrio、Sulfolobus和Prochlorococcus)的种群结构,这些模型系统此前已通过环境、生理和基因组信息显示正在经历物种形成。

如果供体DNA的序列与受体基因组中的某个位点同源,但长度不同,则可以插入新的供体DNA或删除受体DNA(图2c)。GT的这个过程可以包括整个基因的获取或删除,并塑造副基因组的大小和变异,其中包括仅存在于一小部分采样分离株中的基因(该物种的全部基因称为“泛基因组”)。为了在受体中获得基因,必须导入整个基因序列。然而,长片段的DNA可能在运输过程中不能保持完整,变成碎片,特别是在转化过程中暴露在恶劣的细胞外环境中。这种倾向于较短的供体DNA片段的倾向会增加重组导致缺失的可能性,例如自身的MGEs被切除(图2e)这可能会导致细菌中众所周知的缺失偏倚。

或者,MGEs可能在插入时引入基因(图2d)。这些片段可能包括一些编码特定功能的基因(例如selfish operons),使未来的基因移动或积极影响接收者的适应性。此外,盒式基因可能包括DNA片段,以减轻插入受体基因组的影响,以避免破坏局部基因功能(例如,DNA片段包含新的启动子或基因的5 '开始或3 '结束序列)。例如,Vibrio splendidus中的一个MGE插入基因mutS中,但包含了一个新的翻译起始序列和保留mutS功能的启动子。尽管如此,一些MGE的插入确实会破坏基因,它们将自己插入基因组的位置和方式不仅取决于插入序列,还取决于选择,这两者都决定了HGT热点的位置。转座因子(Transposable element)是一种特殊的MGE,它在序列的两端都有反向重复序列,可以在基因组中增殖,通过重复之间的重组催化大规模的重排或删除,特别是在最近的宿主限制物种,比如琵琶鱼的生物发光细菌共生体。综上所述,HGT可以通过重塑连锁模式和改变基因内容对细菌基因组结构产生重大影响,这些影响为自然选择提供了原料。

91021645486168434

图2. 等位基因转移和基因转移对基因组变异的影响。 a. 等位基因转移(AT)在来自同一群体的密切相关的细胞间转移,将突变转移到不同的遗传背景上,并打破多态性之间的联系。b. 来自远缘种群或其他物种的AT可能通过引入附近的突变簇来建立联系。c. 同源重组可以转移整个基因,如果供体包含一个新基因,旁边是在受体中发现的同源序列。d. 基因组岛通常通过转导或接合转移,留下已知参与这些过程的基因(移动基因)。e. 考虑一个最近插入的基因,它在种群中的存在是多态的。如果含有这种绿色基因的细胞被裂解,它的DNA被释放出来供其他受体细胞摄取(左图),降解将使DNA减少到更小的片段,从而减少整个基因以及两侧同源序列被重组的机会(表示为双向灰色箭头)。然而,更短的DNA序列有更高的机会存活下来,并保持完整。因此,如果DNA从缺少最近插入的基因但包含其侧面短同源序列的细胞中被释放和降解(右),这些短片段更有可能用于重组,导致含有绿色基因的受体基因缺失。与插入相比,这种对用于转化的短DNA序列的偏爱有利于基因缺失。在a-d部分中,受体基因组仅在水平基因转移后显示,而在e部分中,受体基因组在水平基因转移之前和之后都显示。实心水平线表示排列整齐的DNA片段,而虚线表示缺乏序列或空白。红点代表多态性位置,其中序列相对于某些参考等位基因有突变差异,彩色矩形表示开放阅读框(ORF)。

Box 1. 检测和量化等位基因转移。

当近亲之间发生重组时,等位基因会在不同的遗传背景中被打乱,基因组中一对单核苷酸多态性(SNPs)之间的联系被打破,这样一个位点上的等位基因与另一个位点上的等位基因之间的相关性就会降低。连接可以使用各种度量(例如,r2, D′或成对同质性)来量化,并通过比较观察到的连锁水平与模拟水平或使用快速解析公式来估计群体重组率ρ=2Nr。除了估计全基因组重组率,这些指标可以在基因内计算,以确定高度重组位点。

当在远亲之间发生重组时,许多连锁SNPs被引入,局部SNP密度增加。许多方法已经发展到检测这个信号;在过去十年内开发的软件一览表载于补充表S1。其中一些方法需要一个“克隆框架”(即基因组的很大一部分没有重组)来识别具有明显的系统发育信号和SNP密度增加的区域。广泛重组的细菌可能不存在这样的克隆框架,尽管这取决于取样策略(例如,最近一次几乎相同的分离菌株爆发将显示较少的重组证据)。这些方法也可能会错过重组事件,因为重组要么在近亲之间转移了非常短的片段,要么转移了DNA,而这些重组事件并不会大大增加局部SNP密度。有趣的是,最近开发的一种算法融合了来自近亲和远亲的重组信息,也可能用于宏基因组。

另一种量化等位基因转移和基因组间单倍型共享的策略是使用染色体着色,尽管这种方法主要用于识别重组热点。

Box 2. 检测和定量基因转移和非同源重组。

为了检测基因转移,人们可以简单地识别出一小部分样本中的DNA,并将这种变异分为基因获取或缺失。这种分类需要事先了解基因的原始状态(存在或不存在),这可以通过比较存在或不存在的模式与样本潜在的克隆系统发育推断出来。然后,基因获取可以与通过简约性来区分的缺失,或者通过一个基因在整个系统发育过程中的可变存在是否更简单地用较少的基因缺失或较少的水平基因转移(HGT)事件来解释。如果样本由不同物种组成,则通常使用缓慢进化的核糖体RNA序列(例如,16s,很少重组)重建克隆系统发育。这种方法将检测更早的和更近的HGT事件,但这种技术的变体被开发用于通过扫描遥远物种的基因组(具有不同的16s核糖体RNA等位基因)来特异地检测进化中最近的基因获取,以获得高度相似的移动基因副本,并观察这些基因是否存在于一个物种的多种背景中。

或者,如果一个样本由密切相关的物种组成,16s序列可能不能表现出足够的变异来重建克隆系统发育和可靠地区分物种。因此,人们也可以使用进化更快的基因组变异(例如,核心基因组),但需要注意的是,这种变异本身可能会受到重组的影响,可能会导致高估HGT。

转移的其他证据可能来自于这些具有非典型G+C含量、密码子使用模式或与全基因组平均水平不同的k-mer标记的基因,但并非所有转移都将显示这些特征。

‘基因组岛’是由超过10 kb的DNA组成的大型基因簇,也可能整合到细菌基因组中,这一过程通常是由接合或转导介导的。检测这些基因组岛涉及到识别序列组成的局部畸变或跨多个基因的系统发育信号,各种算法也扫描这些岛屿,以发现已知的有助于动员的基因,如与整合结合元件或噬菌体相关的基因。最近的一项综述比较了许多用于检测基因组岛的工具,并研究了它们检测转移的相对能力。

4 水平基因转移及筛选

HGT的存在可能是由于其对基因组变异模式的影响。这些影响包括与遗传距离联系的衰减或新基因的插入,可能被已知的有助于移动的基因(如来自噬菌体的基因)所包围。然而,推断HGT事件是否经历了选择是一个完全不同的挑战,而不仅仅是量化HGT。选择和HGT可能以多种方式相互作用,产生独特的特征,如特定基因的多样性减少,远距离SNPs之间意想不到的高连锁不平衡,在特定的基因功能类别中对重组事件的过度描述,或者在注释的基础上对与生态相关的基因的转移率增加(所有这些都将在后面讨论)。了解这些相互作用和它们产生的信号有助于利用基因组数据来理解微生物的生物学,例如,通过识别获得的DNA在受体中具有有益的目的。其中一个例子涉及到通过在人类肠道内细菌和古生菌之间转移碳水化合物活性基因的趋同进化。诸如此类的生物信息分析对于研究在实验室中很难重建其自然栖息地的许多细菌(以及它们所经历的选择压力)尤为重要,因此无法严格推断基因型和适应度之间的关系,以确认HGT导致了适应性。

选择可以解释我们所观察到的大部分HGT变异,特别是在有效种群规模(Ne)很大的细菌中。然而,对于观察到的HGT事件的适应度效应,以及大多数HGT事件是否对受体细胞有益、中性或甚至有害,仍有许多争论,尚未被选择性淘汰。这种争论以不同的形式,从分子群体遗传学的开端就一直在进行。尽管如此,在过去的十年中,由于基因组数据集的丰富,以及新的群体遗传理论,已经有了许多进展,为重组和积极选择如何相互作用形成细菌基因组提供了诱人的线索。在接下来的章节中,我们将讨论选择和重组背后的进化直觉,以及它们如何一起在细菌基因组中留下可检测的特征。虽然我们讨论的大多数概念可能同时适用于AT和GT,但我们将重点讨论GT,GT最近取得了许多进展,与SNPs或AT重组相比,它可能对适应度有更大的影响(积极和消极的影响)。

4.1 产生适应性等位基因多样性

AT重组可以通过重组群体内的突变或引入其他群体的突变来产生新的等位基因(图2)。当一个基因中存在多个有益突变,但发生在不同的遗传背景中,AT可以通过将这些有益突变合并到相同的遗传背景中,从而产生更适合的等位基因。如果参与的有益突变具有积极的强性相互作用,重组等位基因的适应度增强可能尤其明显。从模拟和大肠杆菌的实验室实验中,人们早就知道这种有益突变之间联系的打破有助于细菌适应。当这些适应性重组等位基因在自然界中出现时,它们会在人群中传播,更有可能被取样。因此,我们可能会认为,与基因组中的其他位点相比,一些快速进化的基因表现出更多的重组证据,即使它们不一定有更高的重组率。的确,在N. gonorrhoeae中,具有高度多样性和积极选择特征的基因也显示出了重组的一些最强有力的证据,其中一些重组是从近亲物种转移过来的。而且,对病原体的广泛调查显示,重组热点在基因功能类别中并不均匀分布,而且经常重叠编码与环境相互作用的细胞表面蛋白(如抗原或孔蛋白)的基因。重组和表面蛋白之间的这种关系可能是由有利于重组的波动选择压力驱动的。

4.2 基因特异性移动

虽然基因内重组可能产生新的等位基因,并通过选择传播,但它也可能影响整个基因组的多样性模式。根据简单群体遗传模型,重组率与突变选择系数的比值(r/s)决定了积极选择对全基因组多样性的影响。如果出现了一个非常有益的突变,并且选择比重组强得多(r/s≪1),选择进行得如此之快,以至于所有与有益等位基因相关的变异也会传播开来,减少整个基因组的多样性。或者,如果重组率非常高(r/s≫1),那么随着有益突变的传播,在选择下的有益等位基因与其余基因组的连接断开,就会发生HGT。这将定向选择减少多样性的影响限制在一个特定的位点上,并产生基因特异性移动。

十多年前,对几个管家基因重组的经验估计表明,在许多细菌物种中,重组的频率太低,不足以阻止哪怕是适度的选择也能清除整个基因组的多样性。然而,随着常规全基因组测序和更广泛的采样的出现,基因特异性移动已经常被观察到重组细菌,包括海洋、土壤和致病物种。这可能表明,相对于选择的强度,重组的速率(从全基因组数据中测量)是非常高的,因为当有益的等位基因在种群中扫过时,重组需要足够频繁地发生。然而,这也可能表明细菌进化往往不能用简单的群体遗传模型来描述,而细菌生态学和进化的其他特征可能会给重组提供更多的机会,在定向选择之前或过程中转移等位基因。

例如,基因组中的多个其他位点可能正在经历选择,它们之间的竞争可能会减缓任何特定的有益等位基因的传播。这一现象在细菌中的一个重要例子可能是经历强烈负频率依赖性选择(NFDS)的其他位点,在这种选择中,突变的影响随其在群体中的频率而变化,在较高的频率下变得有害,但在较低的频率下变得有益。在这种情况下,一个新的有益的等位基因在基因组的其他地方传播到整个种群的唯一方式是,它重新组合到这些由NFDS(图3a)维持的其他遗传背景上。目前还不清楚细菌中NFDS动态发生的频率有多高,但这可能是一种普遍的进化力量塑造了基因组,因为许多位点的功能注释表明它们可能会经历强大的NFDS,包括与噬菌体捕食有关的基因。在实验室中,在大肠杆菌的各种情况下,NFDS动态也会自发地出现。这包括一个长期的进化实验,它包括一个单一的物种和一个单一的培养基,以及更复杂的情况,如抗生素处理的老鼠肠道。

基因组中其他位点经历选择的另一个例子来自具有相应生态型的多个生态位的存在。在这种情况下,我们使用的“生态位”是哈金森意义(Hutchinsonian sense)上的,它将微生物遇到的环境因素(非生物和生物),如生长速率等种群动态映射到环境因素,因此,生态位可能出现在不同的物理位置,或者可能完全重叠,例如在一个空间中存在多个可溶解的资源。如果一个特定的等位基因或基因在一个新的生态位中受到青睐,殖民者仍然可以获得祖先生态位的DNA(也就是说,“万物无所不在”),小生境之间的重组将恢复少数适应殖民者基因组的多样性,然而,选择将消除任何转移不适应的等位基因的重组(或者,由于HGT,适应的等位基因或基因已经存在于祖先的多个遗传背景中,可能会发生新生态位的反复再定植)。这将导致等位基因的共存,这些等位基因以特定的基因扫过小生境的方式出现(图3b,有色三角形),特别是当生态位之间的重组率与选择强度相比很小时。这种进化模式的一个例子包括中根瘤菌菌株(Mesorhizobium),根据适应度测定,它们适应了土壤中镍的空间变化水平。与适应表型有关的候选基因通过GT传播,并在不同的遗传背景中被发现。与上述NFDS模型一样,在一个位点维持两个等位基因可能会减缓一个无条件有益等位基因在另一个位点的传播(图3b,黄圈),因为这种等位基因需要重组到其他遗传背景上,而这些遗传背景是由环境选择维持的,以传播到整个种群中。

在上述两种情况下,新的有益等位基因产生的第一个遗传背景不能在整个物种中传播,因为基因组中其他位点的强烈选择。这两种情况都可以被认为是“全球适应,局部行动”模式的案例,在这种模式中,菌株之间的适应性差异保持在一个无条件的有益等位基因在物种中频率的增加,重新组合成各种生态型。这两种情况之间的唯一区别是基因中其他位点的选择机制,促进等位基因的共存要么是通过单个群体(即NFDS)中等位基因频率和适应度之间的相互作用,要么是通过分散的、长期共存的, 生态上截然不同的种群重新组合在一起。

随着强选择作用于基因组中的其他位点,时间变量选择也可能促进基因特异性交换。例如,接近中性或轻微有害的突变可能在种群中持续足够长的进化时间,从而重组到多个遗传背景中。如果环境条件突然改变,有利于这些突变,多重遗传背景将增加频率,并导致基因特异性移动(图3c)。这是在实验中观察到的,对抗生素敏感的幽门螺杆菌(Helicobacter pylori)种群在没有抗生素的培养基中繁殖,但暴露于含有耐药等位基因的供体DNA后,转移到含有抗生素的培养基中。

77531645486168554

图3. 促进基因特异性扫描的进化动力学。a 一个群体中的细菌具有一种特征(例如,膜蛋白),它有两个变种,这些变种由强负频率依赖选择(NFDS)维持。这种情况被表示为从种群中采样的DNA在时间上的对齐,实水平线代表在经历NFDS的位点上不同的对齐序列(分别代表棕色或绿色三角形,背景1和背景2)。黑色圆圈代表中性突变。一个细胞获得无条件的有益突变(黄色圈),在NFDS下通过背景2传播。为了使这种有益的突变在整个种群中传播,水平基因转移(HGT)必须首先将其转移到背景1;由于这需要时间,HGT可能在整个基因组中预先发生,在背景中再生多样性2。b 一个物种通过突变在每个生态位(棕色或绿色三角形、生态位1和生态位2)中获得优势,从而适应了两个生态位。一个无条件的有益变异(黄色圈)最近横扫了生态位2,但没有通过部分孤立的生态位1。尽管如此,生态位之间的接近和偶尔的细胞迁移使HGT从一个生态位转移到另一个生态位(黑色虚线箭头),这将中性变异转移到全基因组,最终使有益的变异横扫生态位1。生态位可能在空间上不同,也可能涉及在给定空间内存在不同的资源。c 一个变种(黄色圆圈)出现在一个几乎是中性的生态位中,当它在频率上漂移时,它重新结合到其他基因组上。当生态位突然有利于这种变异时,选择传播了所有携带有益变异的背景,并没有消除不相关的变异(黑圈)。对所有部分来说,时间从左到右。

4.3 多位点分子标记选择

如果对生态位的适应涉及单个位点,那么如果生态位之间发生重组,而选择保持了环境间的适应性差异,则可能出现生态位内的基因特异性移动(图3b)。如果适应涉及到两个位点,从两个微环境中取样的细菌基因组(研究者可能不知道)可能比随机位点更经常地揭示基因组中共存的成对等位基因或基因。然而,由于许多细菌物种具有高水平的全基因组连锁,在细菌中检测这些具有生物学意义的共发生位点可能是困难的,使得区分有意义的生物信号和噪声是困难的。然而,新的多位点分析旨在通过设计创造性的方法来控制细菌中连锁的背景水平,来检测这些共同进化的突变对或基因。例如,研究人员使用基因座之间的相互信息(另一种量化连锁的方法)移动肺炎链球菌(S. pneumoniae)基因组,寻找协同进化的基因座,并发现了三个青霉素结合蛋白之间的显著相关性,所有这些蛋白都需要修饰以实现对β -内酰胺抗生素的高水平耐药性。重要的是,这些方法主要用于检测重组细菌中的协同进化位点。对于高度克隆的物种,与随机选择的位点对相比,共同进化位点可能表现出相似的连锁水平。

4.4 关注适应性基因转移

4.4.1 适应性与非适应性基因转移

虽然已经描述了许多自适应GT的例子(见下文),但对于附件基因组本身的所有内容是否主要是自适应的、近乎中性的或有害的,仍存在相当大的争论。许多转移的等位基因或辅助基因可能对含有它们的细胞提供很少或没有益处。的确,实验将其他物种的大量DNA片段转移到肠道沙门氏菌亚种血清伤寒肠菌(Salmonella enterica subsp. enterica serovar Typhimurium)没有显著的适应度效应。除了完全独立的MGEs外,附属基因在某些细菌中可能存在有益的目的,以维持它们在更广泛的细菌群落中的存在。然而,如果细菌经常从环境中吸收基因而不考虑其功能,这种益处是否在特定物种或环境中提供尚不清楚。虽然DNA摄取机制不筛选与生态相关的基因(然而,在摄取序列的情况下,它可能偏向于来自同一物种的DNA),但环境DNA很可能在对该环境有益的基因中富集。这方面的一个例子是入侵的大肠杆菌菌株(E. coli)在小鼠肠道的实验性定植。通过噬菌体介导的GT与已经存在于肠道中的驻留大肠杆菌菌株(E. coli),该入侵者迅速获得了参与肠道特定碳源代谢的有益基因。

最终,积极选择决定了在漫长的进化过程中,哪些被转移的基因被保留在一个特定的物种内,但是,根据模拟研究,那些不能给物种带来好处的基因可能仍然存在很短的时间尺度,并在基因组样本中作为稀有基因(甚至中频)出现。对于最近获得的那些危害性不大的基因来说,这可能是正确的,因为细菌,甚至是具有大Ne的物种,已知存在着弱危害性的突变(例如,非同义SNPs),这些突变尚未通过选择去除。就像非适应性非同义SNPs的动力学一样,在许多细菌物种中已经观察到稀有基因的快速获取、短期持续和缺失的过程。这些模式并没有排除HGT的适应潜力,而是暗示了许多转移事件,就像许多突变一样,可能在很大程度上对个体适应性无关紧要。

然而,利用群体遗传理论,研究人员在解释辅助基因的U型频率分布时,对选择在辅助基因组形成中的整体作用得出了不同的结论(图4),在解释基因组大小和Ne相关性(同义SNP多样性或净化选择的强度,两者都随着Ne的增加)之间的关系时,这可能也与中性或选择相容。然而,准确估计细菌中的Ne是一个挑战。用于量化Ne的基因组信号可能是由除遗传漂变之外的许多因素塑造的,一个样本内的多态性水平可能不能衡量种群内的多样性,而是衡量研究人员可能没有意识到的生态上不同的种群之间的差异。选择的信号也很大程度上取决于细菌多样性的采样方式,因为这决定了分离序列的进化时间尺度(Box 3)。

这些研究强调,除了简单的群体遗传序列数据总结之外,还需要更多的信息来解开中性和选择的作用。蒸馏复杂的细菌基因组到基因是否存在直方图结果损失的信息(例如,多样性基因或基因之间的联系),这可能会导致数据的可识别性问题没有足够的信息使研究人员能够区分进化的场景。例如,在中性模型和选择模型下,如果考虑具有明显选择压力的多个生态位,可以观察到辅助基因组的U型分布。

22241645486168920

 图4. 在细菌物种的成员中,基因频率通常呈U形分布。图中显示了6个物种的基因频率。在这些样本中,许多基因只存在于一个基因组中(罕见的辅助基因;每个图中最左边的条)或所有基因组(核心基因;图中最右边的条),中频辅助基因较少。

Box 3. 选择信号取决于序列的采样方式

由于采样策略的不同,相对于负选择和遗传漂变,正选择对基因组变异形成模式的影响在不同数据集之间可能存在很大差异。随着一对序列的分化,它们之间的差异进一步暴露在自然选择中,是生存偏差的结果。图中显示了三个样本的系统发育情况,其中两个样本来自同一物种,分支长度与进化时间成正比。差异分辨近缘样本仅包含近期突变或基因含量变化(图中红点),而差异分辨远缘样本则包含较早前发生的突变或基因含量变化(图中黄点)。然而,由于弱有害的改变不会立即从种群中移除,并且可能在与~1/s成比例的时间尺度上持续存在,其中s是改变的选择系数,与很久以前出现的基因多样性相比,最近出现的突变或基因插入或缺失将包含更高比例的有害事件。

14291645486169214

因此,当研究由许多密切相关的分离物组成的样本时, 等位基因转移(AT)重组会留下不同的特征。 在这些情况下,检测到的AT事件通常会从未采样的、更分散的谱系中引入新的突变簇(见图2b)。 已经观察到,与全基因组平均水平相比,这些转移的等位基因包含更多的同义突变(和更少的有害非同义 突变),也与在包含不同谱系的样本中检测到的AT相比。 因此,在泛基因组研究的背景下,很难直接比较使用从同一物种收集的样本评估选择影响的研究和使用从近缘物种收集的序列的研究,因为它们关注的是不同的进化时间尺度。

4.4.2 其他的基因组信息来推断选择

为了确定选择在塑造HGT结果中的作用,使用了各种其他基因组方法来开发额外的信息片段,包括数据的时间序列结构,非同义和同义突变的模式,以及连锁模式,所有这些都受到选择的影响。例如,在不同的时间点采集的样本可能显示出快速的变化,如重组(AT或GT)诱导选择性扫过人类肠道菌群。一系列的样本也可能显示出出乎意料的稳定性,如肺炎链球菌(S. pneumoniae)中所见,尽管针对特定谱系的疫苗的进化受到干扰,但NFDS仍以特定的频率维持基因。此外,研究人员对垂直遗传噬菌体的多样性进行了研究,结果表明,在大肠杆菌(E. coli)和肠链球菌(S. enterica)中,许多噬菌体(占所有插入事件的28%)没有显示中性突变降解的证据,而是显示了纯化选择的证据,这表明它们的序列被保持以造福宿主细胞。在另一项研究中,研究人员利用了这样一个事实,即选择传播基因或等位基因的速度如此之快,以至于产生了单倍体结构,在单倍体结构中,分离株共享几乎相同的DNA片段,这一信号类似于基因特异性移动。该研究的作者使用这种方法来识别候选活泼瘤胃球菌(Ruminococcus gnavus)的选择性移动,这可能使这种物种适应健康的人类宿主或患有克罗恩病的个体。其他创造性的方法或细菌基因组数据的总结仍有待发现,以推断积极选择的作用。

除了这些分析基因组数据的新方法外,理论还表明,基因组流线化(基因组流线化是细菌的一种常见现象,它抑制了中性或有害DNA的积累)也可能丰富有益基因的辅助基因组。自然选择很可能有助于基因组流线化,因为许多细菌物种都有较大的Ne,这增加了选择的效力,并使有额外DNA的细胞处于竞争劣势,特别是如果这种DNA是弱有害的。然而,最近的理论表明,HGT本身的机制可能会阻碍DNA积累和加剧缺失偏置。如前所述(图2e),可用于重组的DNA的长度分布偏向于较短的片段,这可能是由于环境退化或限制修饰系统。数学模型表明,与保持完整并可能被转移的较短序列相比,这种偏倚可能会降低整个基因(或任何较大的DNA片段)重组的机会,从而阻碍新的附属基因的传播;肺炎链球菌(S. pneumoniae)的体外实验证实了这种转化介导的缺失偏误。因为这些动态可能会促进辅助基因的快速移除,那些保留下来的可能会有抵消这种缺失偏倚的有益影响。

4.4.3 结合生态学和更广泛的细菌群落

 另一种研究辅助基因进化的方法不是在单个物种中,而是在细菌群落中,这代表了一个个体物种可能获得新基因的更广泛的库。在这个尺度上,附属基因在共享一个环境的不同物种之间频繁转移的观察表明,在共同的选择压力下,这些基因在不同物种中的共存不能用地理或进化史解释(因为相关物种通常有相似的基因)。假设地理坐标是细菌细胞之间物理距离的合理度量,但环境类型(例如,哺乳动物肠道与土壤)可能在很大程度上决定一个特定细菌群落的细胞是否彼此靠近,这是HGT的必要条件。因此,尽管这个群落中的物种肯定会拥有并交换使它们能够适应共享环境的基因,但它们继续与其他物种共存将促进全基因组的HGT,包括那些与共享环境无关的基因。

虽然物理上的接近可能部分解释了观察到的这些转移基因与特定环境之间的关联,但对于GT事件的选择性好处,诱人的证据来自于对物理距离的仔细控制,以及这些基因反映已知环境压力的功能。虽然他们没有提供HGT的明确基因组证据,但研究人员通过控制与同一宿主的其他身体部位的物理距离,发现了在人类肠道中特别富集的基因。如果没有这种控制,肠道内物种间普遍存在的基因可能只是与那些促进传播或适应许多不同环境的基因相对应(例如,与休眠和产孢有关的基因)。从肠道中特异性分离出来的厚壁菌门成员在胆汁酸7α -脱水酶中富集,而胆汁酸是脊椎动物胆固醇代谢的产物,在肠道环境之外不太可能遇到。  另一组同样研究了人类肠道微生物群,并提供了证据,证明肠道中遇到的独特的选择压力塑造了细菌群落的移动基因库。有趣的是,他们发现大多数肠道样本中的移动基因(~99%)是几乎从未在同一个人的唾液样本中发现。总之,在群落水平上通过功能基因集合的趋同来进行选择的证据,可能会阐明辅助基因对该群落中的特定物种的益处。

4.4.4 实验验证

本文中详细介绍的生物信息学方法可能为适应性水平转移提供诱人的证据,另外的线索可能来自这些转移基因的现有功能注释,这些注释表明,它们编码的表型预计将在已知的细菌环境下被选择(例如,一种与经常遇到抗生素的物种的抗生素耐药性有关的基因)。然而,证明转移的等位基因或基因具有适应性的“金标准”将是通过实验测定直接建立基因型和适应度之间的关系,表明基因型的差异导致适应度的差异。理想情况下,这种实验策略将使用与采集细菌的环境相同的环境,因为基因型和适应度之间的关系会随着环境的改变而改变,但在许多情况下,这是困难的,从人类病原体到那些在热液喷口定植的病原体。

一种更实际的方法是模拟被选择的环境条件,期望在野生环境中驱动适应,在这些条件下生长的细菌的转录组测序可能显示出与对照相比,候选基因上调,因此可能在相关环境中有用。然而,由于转录组学方法有局限性,另一种连接基因型和适应度的有前途的方法是转座子插入测序方法,它使研究人员能够研究在实验室条件下如何干扰基因影响适应度。这些方法尤其适用于研究插入或删除基因的HGT效应。例如,一个小组通过使用一个单独的转座子插入测序屏幕的结果,发现了特定基因和人类肠道之间适应性关联的进一步证据,表明具有中断的肠道相关基因的拟杆菌菌株在小鼠肠道中处于竞争劣势 。此外,针对在五种感染相关条件下生长的9株铜绿假单胞菌构建的转座子测序文库显示了数百个对生存至关重要的辅助基因。

结论及未来研究方向

通过在细菌中不断的发现新的HGT的机制,推动新算法的不断发展、检测和量化特定类型的重组以及创新的理论和计算方法,从而研究其进化过程。数据集规模的不断扩大必然会给算法带来计算障碍。然而,最大的挑战将涉及提取额外的基因组信息,以确定哪些生态和进化因素驱动HGT事件。例如,我们并不完全了解观察到的HGT在多大程度上有助于物种之间、物种内部或物种之间的基因组之间的适应性差异。我们也不明白为什么观察到的重组率差异如此之大(甚至在细菌物种内部),以及这些差异是否由积极选择驱动。HGT无疑为适应性提供了原材料,逆向生态学方法依赖于选择特征的知识来识别生态相关的基因,准确理解重组和选择之间的相互作用如何产生可检测到的基因组特征对于在逆向生态学方法中使用这些数据至关重要。

新的及更便宜的测序技术会帮助我们从基因组中收集更多的信息,使常规的宏基因组样品深度测序能够为众多共存物种建立接近完整的基因组,包括那些不能在实验室培养的物种。这些数据将提供发生HGT的微生物群落的快照,揭示复杂生态位结构下的生物因素,为HGT的生态学和进化的理论模型提供更普遍的经验证据。

对于可能在实验室培养的物种,更便宜的测序也将促进高通量实验技术的发展,以研究基因在多种环境条件下的适应度效应,例如基因敲除文库的产生(例如转座子插入测序)。这些研究对于发现基因-环境相互作用对辅助基因在特定物种内持久性的影响是非常重要的。这些实验研究也将有助于揭示存在于所有基因组中的许多假设蛋白质的功能,而基因注释为旨在识别生态相关基因转移的研究提供了关键信息。

然而,我们将继续依靠突破性的新方法来解释重组物种的基因组数据,以及新的理论,或旧理论的创造性应用,为细菌量身定制来指导问题和分析。当我们思考HGT的研究将在未来揭示什么时,我们应该清楚,需要做好惊讶的准备。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3