第三代测序技术的研究进展与临床应用

您所在的位置:网站首页 二代测序技术应用范围 第三代测序技术的研究进展与临床应用

第三代测序技术的研究进展与临床应用

2023-09-26 23:23| 来源: 网络整理| 查看: 265

经过40多年的发展,解析DNA遗传信息的测序技术已发展至第三代,测序规模也从几千个碱基上升到数百万个基因组;基因测序对科学技术发展的推动作用及影响力可媲美显微镜技术[1],在遗传学、免疫学、肿瘤学、微生物学等多个领域取得突出表现[2-4]。

20世纪70年代,基于双脱氧链终止法为原理的第一代测序技术出现,将DNA聚合酶合成片段、同位素标记核苷酸和凝胶电泳识别核苷酸相结合[5],至今仍是测序技术的金标准并运用于临床诊断[6],其代表性平台有ABI Prism 3700[7]。20世纪90年代,第二代测序技术(又称下一代测序) 出现,其代表性平台有Roche 454、ABI SoliD、IonTorrent、Illumina[8]、华大基因,目前二代测序技术在市场上占据主导地位,但二代测序需要对测序片段进行扩增且测序读长短,易引入扩增偏差且无法对复杂重复区域进行解析,在临床应用上常需与其他方法结合使用[9]。

2008年,第三代测序技术(又称单分子测序) 出现,具有读长长及可实现单分子与实时测序等优势[10]。相比第二代测序的短读长、无法完整解析复杂重复序列,第三代测序能达到1 Mb量级的碱基测序读长,且当检测到复杂区域时,如GC富集区、大量串联重复区等,测序结果仍具有重要的参考价值[11-13]。三代测序用时可压缩至数小时之内,结合其长读长优势,已被相关研究者优先选择用于未知基因组从头测序组装[14]。因尚处在技术发展期,其碱基识别准确度仍存在较高错误率(< 13%) 且成本相对较高,限制了现阶段其在临床上的大规模应用[12]。代表性第三代测序技术有HeliScope单分子测序技术(HeliScope single molecule sequencing)、实时单分子测序技术(single-molecule real-time sequencing, SMRT)、纳米孔测序技术(Oxford nanopore sequencing) 以及Geno Care单分子测序技术。检索Pubmed数据库近21年基于第二代、第三代测序技术的研究,相关研究数量都呈逐年增加趋势;虽然目前的研究与应用仍以二代测序技术为主,但基于三代测序的研究数量已经与5年前基于二代测序的研究数量持平(图 1)。

图 1 近21年基于第二代与三代测序技术的研究数量数据来源于Pubmed数据库 Fig. 1 Quantitative studies based on the second-generation and third-generation sequencing techniques over the last 21 years (data from Pubmed http://pubmed.ncbi.nlm.nih.gov). a: search the Pubmed website for the number of articles related to "the second-generation sequencing techniques"; b: search the Pubmed website for the number of articles related to "the third-generation sequencing techniques". 图选项 1 HeliScope单分子测序技术 1.1 测序原理

2003年,Helicos单分子测序技术被报道,相比于二代测序的短读长,它可以将长序列片段化后再进行测序[15-16]。该技术的测序原理与主要流程如下(图 2):(1) 将DNA大片段剪切成小片段后加上poly(A) 尾;(2) 剪切后的片段通过poly(A) 尾与测序芯片中测序单元(flow cell) 上带有荧光标记的poly(T) 寡核苷酸进行原位杂交完成装载;(3) 逐一加入荧光标记的单色核苷酸和聚合酶孵育,使得DNA模板链延伸,发生延伸反应的序列片段发出荧光;(4) 荧光被共聚焦显微镜识别并拍摄图像转化为相应的核苷酸信息;(5) 清洗荧光染料;(6) 洗涤后,已延伸的DNA片段上的荧光物质被移除,再重复以上步骤识别下一轮单个碱基直至片段测序完成;(7) 数据系统整理成序列图像[8, 17-18]。整个测序过程无需进行基因扩增即可直接读取基因序列,避免了扩增步骤带来的测序误差[19]。对比后续研发的三代测序平台,HeliScope技术与二代测序技术具有一定的相似性,如带有荧光标记的反应体系反复添加、结合、识别、清洗的过程耗时长,且单次测序读长偏短[10]。HeliScope测序作为第三代测序技术的开端,实现了“一次一个碱基”的单分子测序,但其并未解决第二代测序短读长的技术短板[20]。

图 2 HeliScope测序平台工作流程示意图 Fig. 2 Overview of the HeliScope sequencing process. 图选项 1.2 临床应用

HeliScope平台在病毒基因组测序、人类基因组拷贝数变异检测、人类转录组谱整合等方面显示了良好的应用前景[21-23]。如Yu等将HeliScope测序与二代测序结合,分析22个临床组织样本的总体基因表达情况,结果显示两种测序方法数据集高度相关,且当两种测序方法检测单个组织时,该组织75%基因高度一致,17%基因数据集显示高表达基因异质性。该研究揭示HeliScope测序在改进基因表达模型注释与补充组织转录组生物信息方面可与二代测序互补,对更全面认识人体不同组织转录组谱的正常状态及识别临床疾病相关组织标志物具有重要应用价值[23]。

2 实时单分子测序技术 2.1 测序原理

实时单分子测序技术(SMRT) 为目前三代测序技术中使用率较高的测序技术,其代表性平台有Pacific Biosciences (PacBio) 科技公司研发的各类产品[24]。该平台测序原理与主要的测序流程如下(图 3):(1) 将DNA模板与发夹接头序列连接形成闭合环状单链DNA模板作为测序单位用以建立SMRT模板库;(2) 组装好的测序单位会加载到具有零模波导(zero- mode waveguide, ZMW) 的SMRT芯片单元上并与ZMW底部的DNA聚合酶结合进行测序;(3) 测序反应时,聚合酶围绕SMRT模板工作,利用带有荧光的dNTP延长DNA片段;(4) 在延长过程中,与模板碱基配对后的dNTPs荧光基团会被ZMW底部发射的激光激发捕获,同时配对碱基与游离碱基停留时间有所差异,以此来确定碱基信息[25-26]。PacBio测序产品主要有RS Ⅱb、Sequel、Sequel Ⅱ,其中Sequel Ⅱ平台提供高精度(circular consensus sequencing, CCS) 和长读长(continuous long reads, CLR) 读两种测序模式以供选择,不同产品及其不同模式的读长、精确率、数据读取量等参数存在一定的差异,可适用不同应用场景[12]。SMRT的测序平台能对GC重复区、碱基修饰区识别保持高精确率,还能完整检测基因亚型、新基因等,但其精准率受聚合酶有效工作时间影响较大,而通过增加测序次数能有效降低测序过程中的随机误差[27-29]。

图 3 实时单分子测序平台工作流程示意图 Fig. 3 Overview of the single-molecule real-time sequencing process. 图选项 2.2 临床应用

由于具备长读长的优势,实时单分子测序在肿瘤学、免疫学、遗传学、生殖医学等领域展开了新的应用前景,也使得临床中对患者进行基因测序、发现等位致病基因并开发新的治疗策略等有了更多的技术方法[30]。

在肿瘤学方面,Vasan等[31]通过PacBio平台对多名乳腺癌患者进行基因测序发现多发pik3ca基因突变,其中95%的突变是同一等位基因上顺式排列的双突变;多发双突变导致了乳腺癌相关磷酸肌醇-3激酶活性增加,加速了肿瘤细胞的增殖和肿瘤的生长,且与单突变相比,双突变对激酶抑制剂的敏感性增加,有助于完善临床肿瘤治疗用药方案;而仅有SMRT测序技术的长读长模式才能对所有位于不同蛋白质结构域的pik3ca的双突变进行分析,对明确肿瘤患者的分子病因并精准治疗具有重要意义。

在免疫学方面,由于自然杀伤细胞的免疫球蛋白受体(killer immunoglobulin-like receptors, KIR) 区域内的重组、变异和重复元件使得通过二代测序技术无法完整解析单倍型DNA,Roe等[32]提出了一种将PacBio长读测序与探针相结合有效捕获并组装二倍体人类KIR单倍型的方法;该方法仅使用18个探针就覆盖了KIR标准参考序列的97%,精准率达99.97%,首次对人类二倍体KIR单倍型进行完全测序与分析,可快速应用于临床诊疗。

在遗传学方面,Mizuguchi等[33]通过PacBio长读长测序模式对患有智力障碍综合征的双胞胎进行了外显子基因组测序,精确识别了来自母系的12 kb染色体倒转;倒转直接破坏了cpne9和brpf1两个基因的正常表达,而brpf1异常是常染色体显性畸形面相及遗传性智力发育障碍的重要致病机理,与患者临床表征一致;该病例充分说明长读长测序对探索罕见遗传疾病中的亚显微性结构突变的优越性。

在生殖医学方面,SMRT长读长模式有助于直接检测致病基因的亲本来源,为临床预测其在后代的发生频率提供依据。Wilbe等[34]使用SMRT测序技术对一对夫妇多次因超声诊断结构异常而反复终止妊娠的流产组织进行基因分析,鉴定出了与小儿先天性侏儒痴呆综合征相关的ptpn11基因突变,并确定了ptpn11突变等位基因的亲本来源及发生频率,对该夫妇新一轮胚胎植入具有指导意义。Xu等[35]通过SMRT测序技术对地中海贫血相关基因hba1/2和hbb进行全长测序,揭示了第二代测序技术难以解析的基因完整变异信息,有望弥补传统测序技术漏检与分型困难的缺憾。

3 纳米孔测序技术 3.1 测序原理

1995年,Kasianowicz等[36]提出了纳米孔可作为传感器用于生物学研究,2014年,作为重点技术攻关对象,纳米孔测序商业化便携式设备研发成功[37]。纳米孔测序技术无需聚合酶参与的合成环节,可直接对解链后的DNA单链进行测序。基于纳米孔测序在技术领域的重大突破,部分学者也将其称之为第四代测序技术[38]。纳米孔测序技术的主要原理与测序流程如下(图 4):(1) 将DNA分子连接到带有运动蛋白的测序接头上;(2) 带有接头的DNA及混合物加载至带有纳米孔的流动池中;(3) 测序开始时,动力蛋白解开DNA双链,并与电场力一起驱动带有负电荷的单链DNA以受控速率穿过纳米孔;(4) 不同碱基经过纳米孔产生不同电信号被捕捉从而确定碱基信息[39]。纳米孔测序无需成像系统与相关设备,极具便携性,因此可以把其测序设备带至任何需要测序的地点[40]。测序结果可通过USB接口输出及手机小程序分析使得实时测序可为临床服务。同时,纳米孔测序前无需DNA合成及扩增,这样既对读长无明显限制(> 4 kb) 又简化了测序步骤,还能对特殊结构(如碱基甲基化修饰等) 进行直接检测[41]。但在测序过程中,碱基前进速度等带有随机性,间隔太短时碱基识别易错失,导致存在较高错误率,限制了纳米孔测序结果价值。近年来,不少学者在优化测序体系与开发分析算法等方面着手,对纳米孔测序结果进行校正,如利用最新Bonito CRF分析算法能显著提高单序列读长准确度[42-44]。国内自主研发纳米孔测序仪QNome系列同样在读长、通量、准确读等方面具备一定优势,助力国内单分子测序临床端与科研端的应用(www.qitantech.com)。

图 4 纳米孔测序平台工作流程示意图 Fig. 4 Overview of the nanopore sequencing process. 图选项 3.2 临床应用

由于便捷性与高效性并存,纳米孔测序应用广泛[45]。在传染病学方面,Zhu等[46]收集新型冠状肺炎患者支气管肺泡灌洗液样本,通过纳米孔测序技术对其进行了病原微生物测序,分析了新型冠状病毒在内的23种病原体基因序列。埃博拉疫情防控中,Quick等[47]通过纳米孔技术对142个埃博拉病毒样本进行基因组测序,仅在1 h内通过20–25×测序深度就明确了样本的病毒基因型,为在复杂的疫情防控环境中实时监测病毒基因组变异提供了参考方法。

在肿瘤学方面,基于DNA甲基化是神经系统肿瘤分类的重要依据,Euskirchen等[48]探索纳米孔全基因组测序在神经系统肿瘤的分子诊断潜力,高效建立了全基因组甲基胞嘧啶图谱,通过该图谱的参考数据精准识别原发脑肿瘤,且在临床背景下依然具备分子诊断的稳健性与特异性。在慢性粒细胞白血病患者及部分急性淋巴细胞性白血病患者对一线药物酪氨酸激酶抑制剂产生耐药的情况下,Minervini等[49]通过纳米孔测序技术对耐药患者的肿瘤基因组进行测序,揭示其中约有25%–50%患者bcr-abl1激酶结构域突变,且在疾病的加速进展期及复发期突变频率增加,可见纳米孔测序有望用于评估疾病进展并为耐药肿瘤治疗提供新思路。

在遗传学方面,微单倍型作为一种新型遗传标记,极具应用潜力。Wang等[50]利用国内自主研发的纳米孔测序平台QNome-9604进行了不同批次不同个体的微单倍型测序分析,总体分型准确率达到99.83%,并与MinION测序平台平行对比,结果充分显示了QNome-9604在微型单倍体分型研究领域的优势与潜力,且开发的生信分析软件提高了自动识别分型的效率,为未来大规模应用于遗传学、临床医学领域奠定基础。

4 Geno Care单分子测序技术 4.1 测序原理

Geno Care单分子测序技术是以全内反射光学为原理,与HeliScope的测序原理仅有部分不同:(1) 序列3′末端添加的是polyA/T双链接头,提高效率;(2) 同时每个测序循环添加两种dNTP (www.genemind.com)。其代表性单分子基因测序仪Geno Care 1600无需扩增,且样本制备只需3步就可直接读取测序芯片上的DNA分子,简化了建库流程,降低了前期样本投入量的要求,保证了样本的高利用率。该测序技术自带内嵌式生物信息分析系统可自动化生成测序结果,如:无创产前、拷贝数变异、胚胎植入前以及其他定制化生物信息分析系统,检测周期缩至24 h内,为临床使用提供了高效便捷的解决方案[51]。

4.2 临床应用

Li等利用Geno Care单分子测序技术对患有Phelan-McDermid综合征的异卵双胞胎及其父母进行基因检测,结果显示两名患儿有一段完全相同的6 Mb杂合缺失,与父母基因检测结果相比这是一个新发突变,且在这6 Mb的缺失区域中,包含了45个蛋白编码基因但却不包括shank3基因,打破了传统观点认为shank3是该病最密切相关的致病基因,两名患儿的染色体异常均源于胚胎,通过传统的方法无法很好地进行产前诊断,而更高精度的检测技术能在产前实现胚胎的染色体疾病检测,有效防控出生缺陷[52]。

5 总结与展望

随着分子生物学的发展与“精准医疗”概念的提出,第三代测序技术已历经多代次更迭,性能也趋于优化与稳定。面对二代测序短读长、操作复杂、耗时长等特点,三代测序利用现代光学、纳米技术等手段捕获序列碱基信息力求弥补缺陷,但提升准确度、降低测序成本还是主要挑战,近年来,已有公布的应用软件为三代测序的比对、纠错、数据模拟等提供方案。第三代测序技术各平台部分技术参数总结见表 1。相较于早期研发的Helicos单分子测序,实时单分子测序、纳米孔测序、Geno Care单分子测序在有效测序读长与单位时间内测序通量等方面进一步提高。

表 1 第三代平台间的部分参数比较 Table 1 Partial parameter comparison between the third-generation sequencing techniques Sequencing technology Platform Read length Time spent(h) Throughput per flow cell Read accuracy References Helicos HeliScope 25–55 bp > 48 28.0 Gb > 99% [8] Pacific Biosciences RSII > 60 bp > 6 2.0 Gb 87%–92% [12] Sequel > 100 bp > 20 20.0 Gb 87%–92% Sequel II > 200 bp > 30 160.0 Gb 87%–92% Oxford Nanopore Flongle > 2 Mb > 16 2.0 Gb 87.0%–98.3% [12] MinION > 1 500 kb > 48 30.0 Gb 87.0%–98.3% https://nanoporetech.com)]]> GridION > 1 500 kb > 48 150.0 Gb 87.0%–98.3% PromethION > 1 000 kb > 72 8.6 Tb 98.3% QNome QNome9604 150 kb >8 1.5 Gb 99.8% https://qitantech.com)]]> Geno Care Geno Care1600 < 50 kb < 24 16.0 Gb > 99.0% http://www.genemind.com)]]> 表选项

以三代测序技术平台为基础的临床应用是分子诊断领域的重要方向,也逐步展示其优势与应用前景,便携的检测设备与缩短的测序时长使其有望用于床旁或特定环境快速检测;可直接覆盖复杂区域的长读长与简化的实验操作有望突破现有的测序应用瓶颈,直接转化成对肿瘤、罕见遗传疾病等的诊疗潜能,提高精准诊疗水平,推动人类个体化医疗发展[53]。

在未来的一段时间里,三代测序将与一代、二代测序共存互补,而单分子测序商业产品的不断创新研发,也预示未来低成本、高效率的三代测序工具将应用更加广泛。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3