设为首页 加入收藏

Bioprocess
Vol.2 No.1(2012), Article ID:544,6 pages DOI:10.4236/bp.2012.21001

Advance in Sequence Chemistry of High-Throughput DNA Sequencing by Synthesis*

Jing Chen1, Pengfeng Xiao2

State Key Laboratory of Bioelectronics, School of Biological Science and Medical Engineering, Southeast University, Nanjing

Email: xiaopf@seu.edu.cn

Received: Nov. 9th, 2011; revised: Nov. 21st, 2011; accepted: Dec. 5th, 2011

ABSTRACT:

High-throughput DNA sequencing, a revolutionized technology, greatly accelerated mining data from genomes rapidly and cost-efficiently, thus have a profound impact on life sciences. Sequencing chemistry is a pivotal part of high-throughput DNA sequencing, and has been developed dramatically in recently years; a number of ingenious methods of novel sequencing chemistry by synthesis have been reported. In this paper, the development of highthroughput DNA sequencing chemistry by synthesis is reviewed.

Keywords: Biochemistry; High-Throughput DNA Sequencing; DNA Sequencing-by-Synthesis; Sequencing Chemistry

高通量DNA合成测序化学研究进展*

陈  婧1,肖鹏峰2

东南大学生物科学与医学工程学院,生物电子学国家重点实验室,南京

Email: xiaopf@seu.edu.cn

摘 要:

高通量DNA测序是近年来发展起来的革命性技术,大大推动了快速、廉价获取基因组信息的能力,进而对生命科学产生深刻的影响。测序化学是高通量DNA测序的重要内容,且发展十分迅速;一些构思巧妙的新颖测序化学方法被相继报道,本文综述了高通量DNA测序化学的最新研究进展。

收稿日期:2011年11月9日;修回日期:2011年11月21日;录用日期:2011年12月5日

关键词:生物化学;高通量DNA测序;合成测序;测序化学

1. 引言

高通量DNA合成法测序(DNA sequencing-bysynthesis (SBS))技术代表全基因组测序的巨大潜力[1],其测序化学的一个共同的策略是通过聚合酶反应,即DNA复制过程来实现的[2]。DNA合成法测序技术中最关键的步骤是如何实现有效的每次合成反应、以及反应中对参与合成核苷酸类型的有效判读[3]:当核苷酸完成有效合成后,要么通过反应实时释放出可识别的分子(为了防止释放出可识别分子的相互干扰,每个反应需要独立“反应池”),或者标记可识别的分子从而检测确定每个合成延伸过程中核苷酸掺入的情况(标记可识别的分子掺入“固定”的合成链中,不造成扩散,所有反应可在同一“反应池”完成)。合成测序法可以分为单分子和多(拷贝)分子模板的方式。前者称为单分子测序[4],而后者是在同一区域[5]或者同一微球上[6]扩增相同的模板,以获得数目众多的相同DNA片段作为合成测序的模板。检测可以是同步控制的,即用以“停止–启动”相间隔的模式下促进识别过程,这可以通过可逆封闭核苷酸底物或者简单地每次只加一种核苷酸的方法来实现,或者是实时的,即跟踪核苷酸的合成反应,快速识别合成过程中掺入的核苷酸。前者最著名的例子是454的焦磷酸测序技术,而后者则为Solexa测序技术最为典型。本文综述了近年来高通量DNA测序化学的研究进展,尤其对一些构思巧妙的新颖测序化学方法进行了重点介绍。

2. 基于独立“反应池”的高通量测序化学

2.1. 焦磷酸测序技术

最早实现高通量DNA测序的报道是2005年454公司[7]采用焦磷酸测序化学技术[8]的Genome SequencerTM系统,该技术利用焦磷酸测序化学的优点,即非标记的核苷酸允许原始DNA的合成,掺入后无需化学去除步骤。因此,测序过程相对较快,且能实现较长的读长,其阅读能力从最初只有100 bp,目前平均已达到了400 bp,很快能接近桑格技术目前的水平,且第400个碱基的准确率能达到99%。一次运行所需时间为10小时,能获得4~6亿个碱基的序列信息。目前,Genome SequencerTM系统已在生命科学研究领域得到广泛应用,世界上几乎所有从事基因组测序和相关结构功能研究的顶级实验室均配备了该类设备。然而,圣路易斯市华盛顿大学医学院基因组测序中心的负责人Elaine Mardis表示,454公司的基因测序机器也有缺点。例如,在读取冗长的重复信息时会出现准确性方面的问题[9]。最近Wu 等人报道了一种单个碱基延伸的焦磷酸测序技术来解决相同碱基的重复片段问题的尝试研究[10]。他们首先合成了一套3’端羟基封闭的dNTP单体(图1)。这种单体在焦磷酸测序体系中发生延伸反应后,由于3’端羟基封闭而不再进行后续碱基的延伸。而当该次碱基测定后,采用化学或者光化学的方法将3’端羟基的封闭基团切除,再进行下一个碱基的序列测定,由于该方法每次只延伸一个碱基,即使相同碱基的均聚物片段,每个碱基也只对应一个清晰的峰信号(图1)。通过这个方法得到了比传统焦磷酸测序技术更清晰的序列。这种改良的焦磷酸测序技术适合于芯片形式的高通量序列测定模式,无疑是一种有益的尝试。

2.2. 离子半导体测序技术

dNTP在DNA聚合酶催化下发生聚合酶链式反应,每合成一个dNTP便会产生相同摩尔数的焦磷酸盐(PPi),焦磷酸盐水解产生质子(H+)[11],导致体系pH

Figure 1. Comparison of reversible terminator pyrosequencing using 3’-O-(2-nitrobenzyl)-dNTPs with conventional pyrosequencing using natural nucleotides

图1. 3’-O-烯丙基-dNTPs的可逆终止焦磷酸测序法和使用常规dNTPs的传统焦磷酸测序法的结果比较。在可逆终止焦磷酸测序法(a)中,均聚物的每个碱基均对应一个清晰的峰信号;而在的传统焦磷酸测序法(b)中,每个均聚物只产生一个峰信号,很难准确判断碱基数目的个数;(c) 3’-O-烯丙基-dNTPs或者3’-O-(2-硝基苯)-dNTP的结构

值发生变化,且pH值变化的程度产生焦磷酸盐的数目相关,即与参加dNTP合成的个数相关。因此,通过检测延伸反应发生前后H+的变化,同样可以跟踪延伸反应的情况。Life Technologies公司利用该原理发展了离子半导体(Ion Torrent)测序技术[6,12],即是通过pH敏感场效应晶体管阵列芯片检测DNA聚合过程中产生氢离子而实现DNA序列的测定。Ion Torrent测序平台的核心是一块创新的半导体芯片,其中包含了数百万个孔(反应池)和专有的大规模并行芯片传感器(每个反应池对应一个检测器)。通过限制加入dNTPs的数量,即每次只加入单一的dNTP来实施测序反应:四个非修饰核苷酸(dATP,dGTP,dGTP,dTTP)按排定的顺序,每次只加入一个,当加入的dNTP与模板互补时,以单链DNA为模版的测序引物在DNA polymerase作用下发生合成反应,检测具有与参与合成的dNTP数量具有定量关系的H+浓度(图2)。通过使用由大约1.68 μm × 1.3 μm的微孔反应池构成的阵列,每个反应池固定含DNA模板直径为1 μm的微珠,且底部有独立的传感器和电极,用来跟踪检测反应池中的测序反应类型:当dNTP流经反应池时,如加入的dNTP与模板互补,杂交在单链DNA模版的测序引物便在DNA polymerase作用下发生合成反应,并随之产生具有定量关系的H+,从而改变反应池中的pH值,而pH值的变化(∆pH)将导致反应池底部金属–氧化物–传感层表面电势的变化,同时进一步引起底部场效应晶体管终端的电压(∆V)的变化。与焦测序技术相比,同样采用无修饰的核苷酸,且测序化学原理更简单真实,能够在2小时内获取从10 Mb到1 Gb以上的高准确序列。

Figure 2. Ion Torrent platform sequencing principle in single reaction cell

图2. Ion Torrent测序平台单个反应池延伸反应及其测序检测原理:当dNTP流经反应池并发生延伸反应,产生的H+,从而改变反应池中的pH值(∆pH),并将导致反应池底部金属–氧化物–传感层表面电势的变化,同时进一步引起低部场效应晶体管终端的电压(∆V)的变化。如果本次加入dNTP发生1个碱基的延伸,则终端电压(∆V)的改变数值有一个确定数值(左);如果本次加入dNTP发生2个核苷的合成,则终端电压(∆V)的改变数值是发生是1个核苷合成改变值的2倍(右)。依照四个碱基单体(dATP,dGTP,dGTP,dTTP)每次加入一个单体的顺序不断循环,便实现了每个反应池中模板序列的测序碱基不断增加

2.3. 荧光焦磷酸测序技术

2011年哈佛大学化学与化学生物学系将末端磷酸标记的荧光核苷酸与可重复密封的微反应器相结合,开发出一种并行边合成边测序的新技术,其测序原理见图3[13]。该技术利用焦磷酸测序和半导体测序中的优点,且克服了瞬时发光或电化学信号的检测需要持续监控而限制通量,且往往不如荧光检测灵敏这些不足。这种方法使用末端磷酸标记的荧光核苷(TPLFNs)和焦磷酸测序流程,综合了可扩展性和快速运行时间的特点。此外,微反应器流动室平台的试剂消耗少,也很容易整合到传统微流体设备中进行样品制备。他们使用的反应池是直径约5 μm的“微孔”反应池阵列,固定DNA模板的微珠为直径平均为2.8 μm,以保证每个反应池中只有一个(或者没有)微珠,使其模板的唯一性得到保证。在微反应器中,依次加入四个标记末端磷酸标记的荧光核苷中的一个,然后密封微反应器:在DNA模板指导下,测序引物延伸后的荧光图像被记录。他们证实了在10分钟的循环测序时间内,读长达30个碱基,且原始准确率约为99%。

Figure 3. The structure of terminal phosphate-labeled fluorogenic nucleotides (TPLFNs) and the fluorogenic pyrosequencing chemistry

图3. 末端磷酸标记的荧光核苷(TPLFNs)结构与测序原理:在DNA聚合酶的作用下,延伸引物以非荧光、四磷酸标记荧光核苷为底物进行延伸合成反应,释放非荧光、荧光标记的焦磷酸盐,后者在磷酸化酶的降解作用下产生荧光产物

这种荧光焦磷酸测序既保持了焦磷酸测序的好处,如快速周转、单色检测等,又具有并行化的检测灵敏度和简便性。值得称道的是该测序平台不需要像焦磷酸测序和离子半导体测序平台中对每个“反应器”构件对应的检测器,而是用一个成像设备完成所有“反应器”测序反应的检测,因而更具有价格优势。

3. 基于平面平台的高通量测序化学

当同一时间只有一种类型的dNTP被合成上去,由于被加入的dNTP类型可以事先知道,那么仅仅通过相对简单的单色荧光检测就能判断合成是否发生。但其不足包括下述二个因素:一是这种核苷酸3’端的羟基往往是活性的,并不能限制测序引物链每次只进行一个核苷酸的合成。因此,荧光光学法检测就不仅需要判断合成是否进行,还需要建立合成核苷个数与信号强度的定量关系;第二,每次只加入一种类型核苷酸的合成反应,容易引起需要其它三种类型核苷因为底物的缺失而造成的非特异合成,产生测序错误[14-16]。代表合成测序巨大潜力的方法应该是:四种类型的核苷酸同时加入反应中进行合成反应,以保障所有的测序引物都有反应底物,降低错误合成的几率;此外,每次合成还要求只延伸一个核苷酸,即测定一个核苷序列,以避免需要建立复杂、有时甚至是模糊不清的核苷合成个数与荧光强度的定量关系。图4给出了循环终止测序法使用的核苷酸单体结构,其分子特征为:核苷酸单体的3’端羟基被保护基团临时封闭,每种单体在相应的碱基位置连接一个对应的荧光基团;通过温和的反应可以将相应的基团切割,清除荧光基团、活化3’端羟基,以进行下一个核苷的测序反应。循环终止测序法的好处法在于:1) 四个核苷酸可以同时参与合成反应;2) 可以大规模并行进行;3) 不需要独立的“反应池”,具有更高的通量;4) 相同碱基的重复片段可以通过终止法一个一个地进行阅读。这类方法实施面临的重大挑战是:更为复杂的3端羟基临时封闭的标识核苷酸分子需要具有快速,有效的脱保护动力学,在DNA聚合酶的作用下显示出有效的合成动力学,以及标记物所具有的特性(如荧光基团具有良好的荧光特性等)。因为测序长度受控于“整个”循环合成反应的效率(包括聚合反应和去封闭反应的效率)。此外,其封闭基团在它掺入到延伸引物后,还必须在温和条件下得以切除,否则可能很不幸

Figure 4. The structure of 3’-blocked reversible terminators- 2’-deoxythymine triphosphate (T) labelled with a removable fluorophore (Each of the four nucleotides have an equivalent structure to the one shown here, except for the different base and a corresponding base-specific fluor)

图4. 3’端羟基可逆封闭、修饰可切割荧光的2’-胸腺嘧啶三磷酸(T)核糖位置核苷的结构(不同碱基标记相应的荧光基团)

地干扰DNA聚合酶,核苷,寡核苷酸杂交的模板,或者固相载体而影响循环测序反应的进行。目前主要有三类3’端羟基可脱保护的封闭基团:即3’-O-烯丙基基团,3’-O-叠氮甲基和3’-O-氰乙基基团,且这三类封闭基团均能通过化学反应将3’临时保护基团和荧光基团清除。

3.1. 3’-O-烯丙基保护的标记荧光核苷酸合成测序

Ju等人第一个报道了荧光标记的3’-O-烯丙基修饰的dNTP合成方法[17-19],并合成出一套测序反应单体试剂。四个单体可以同时进行延伸测序反应,并在本次测序完成之后,需要两个脱保护步骤来活化3’端的羟基和清除荧光基团:用紫外光裂解荧光基团和钯催化反应切割烯丙基团以恢复3’端的羟基。前面提到,利用355 nm的激光下辐射10秒后荧光基团将被裂解;Na2PdCl4的三苯基膦三磺酸盐溶液在70℃下处理30~90秒,则3’端的烯丙基基团被切除,从而进行下一个循环的测序反应。他们测定了14个碱基的长度。值得注意的是烯丙基基团的切割条件相对苛刻,很难适合延伸引物非固定的合成测序模式。

3.2. 3’-O-叠氮甲基修饰核苷的合成测序

哥伦比亚大学的Ju研究组[20,21]报道了一种非荧光标记的3’-O-叠氮甲基封闭的脱氧核苷配合可切割荧光基团标记的双脱氧核苷进行合成法测序列。该方法很像传统的Sanger测序法中的延伸过程,被荧光标记ddNTPs合成的引物被永远终止继续延伸,而被合成的3’-O-叠氮甲基封闭的脱氧核苷在3’端封闭基团被脱保护后可以继续延伸:用100 mM的三(2-羰基乙基)磷盐酸盐(TCEP,pH 9.0)充满反应腔,并维持65℃反应10分钟将参加延伸反应的荧光标记ddNTPs中的荧光基团和3’-O-叠氮甲基封闭的脱氧核苷中的保护基团切割,以进行循环合成测序列,其序列测定长度达到30多个碱基。在上述3’-O-叠氮甲基基团封闭的脱氧核苷、配合可切割荧光基团标记的双脱氧核苷进行合成法序列测定中,荧光基团标记的双脱氧核苷完成该次测序后,其测序引物即被终止,换句话说,也就是测序模板在不断减少,因而后续提供的测序信号的强度也在不断减少,这将导致测序长度受到限制。

Solexa公司集上述两组核苷优点于一身,开发出的3’-O-叠氮甲基-2’脱氧核苷三磷酸(dNTPs)已成功用于商业化测序仪[5]。这类核苷的结构如图5所示:核苷3’端的羟基被可脱保护的叠氮甲基封闭,同时的在连接荧光基团的连接臂上同样有一个可以被切割的叠氮甲基基团。很明显,这类核苷延伸后的切割产物均能够参与下一个碱基序的测定,无疑对增加测序序列长度有好处。这样的结构设计将四个核苷同时进行合成反应,避免了单个核苷反应可能引起的测序错误。由于3’-O-叠氮甲基-2’脱氧核苷三磷酸与非修饰的核苷相比,其结构更为复杂,使用普通的聚合酶可能影响其合成效率,而当这类标记核苷酸的合成效率较低,将导致非同步延伸现象的累积越来越严重,进而影响测序长度。他们使用9˚N DNA聚合酶来进行该类核苷的延伸反应,以提高其合成效率,增加测序长度。当用四色荧光标记的这类核苷完成一个测序反应,利用三(2-羰基乙基)膦移除荧光基团,同时活化出3端的羟基基团和切割荧光基团,以进行下一个循环的延伸测序反应,目前以这套试剂为测序化学的Illumina genome analyzer能够将序列长度达到100 bp。

3.3. 3’-O-氰乙基保护的标记荧光核苷合成序列

2011年Knapp等人报道了一类与3’-O-叠氮甲基具有同样功能的3’-O-氰乙基可脱保护标记荧光核苷的合成[22]。文章详细介绍了该类核苷的合成方法,其最终产物的核苷结构如图6所示:核苷3’端的羟基被可脱保护的氰乙基封闭,同时的在连接荧光基团的连接臂上同样有一个可以被切割的氰乙基基团:当用四色荧光标记的这类核苷完成一个测序反应,并成像确定各个模板对应的该次碱基信息后,同时活化出3’的羟基基团和切割荧光基团,以进行下一个循环的延伸测序反应。他们使用1:1的四丁基氟化铵/四氢呋喃

Figure 5. Structure of the reversible terminator 3’-O-azidomethyl 2’-deoxythymine triphosphate (T) labelled with a removable fluorophore and the removal of the fluorophore and terminator group

图5. 荧光标记的3’-O-叠氮甲基-2’-胸腺嘧啶三磷酸(T)用三(2-羰基乙基)膦处理脱去荧光基团和解除3’封闭基团。除了每个碱基和对应标记的荧光基团不同外,其余三个核苷(A、G、C)具有类似结构

Figure 6. Structure of the reversible terminator 3’-O-(2-cyano-ethyl)-2’-deoxythymine triphosphate (T) labelled with a removable fluorophore and the removal of the fluorophore and terminator group

图6. 荧光标记的3’-O-氰乙基-2’-胸腺嘧啶三磷酸(T)用四丁基氟化铵/四氢呋喃和无水二甲亚砜的混合物脱去荧光基团和解除3’封闭基团。除了每个碱基和对应标记的荧光基团不同外,其余三个核苷(A、G、C)具有类似结构

和无水二甲亚砜的混合物在45℃处理15分钟完成了对荧光基团和3’-O-2-氰乙基基团的切割,同时顺利完成了下一个该类核苷的延伸反应。

4. 结论

高通量DNA测序技术是国际上近几年发展起来的,已经成为生物和医学领域中发展最快、影响最大、应用最为广泛的前沿高技术研究领域。高通量DNA测序技术平台的核心是测序化学,新的测序化学方法有可能催生成本更低、测序速度更快、准确度更高、或者测序长度更长等特征的高通量DNA测序技术平台。本文综述了高通量DNA合成测序化学的近年来的最新研究进展,对理解和进一步深入研究高通量DNA测序技术提供借鉴。

5. 致谢

本实验由国家自然科学基金(60971018),江苏省自然科学基金项目资助。特此感谢。

参考文献 (References)

[1]       J. Shendure, H. L. Ji. Next-generation DNA sequencing. Nature Biotechnology, 2008, 26(10): 1135-1145.

[2]       F. Sanger, S. Nicklen and A. R. Coulson. DNA sequencing with chain-terminating inhibitors. Proceeding of the National Academy of Sciences USA, 1977, 74: 5463-5467.

[3]       E. Mardis. Next-generation DNA sequencing methods. Annual Review of Genomics and Human Genetics, 2008, 9: 387-402.

[4]       J. Korlach, P. J. Marks, R. L. Cicero, et al. Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures. Proceeding of the National Academy of Sciences USA, 2008, 105: 1176-1181.

[5]       D. R. Bentley, S. Balasubramanian, H. P. Swerdlow, et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature, 2008, 456: 53-59.

[6]       M. Ronaghi, M. Uhlen, et al. A sequencing method based on real-time pyrophosphate. Science, 1998, 281(5375): 363-365.

[7]       M. Margulies, M. Egholm, W. E. Altman, et al. Genome sequencing in microfabricated high-density picolitre reactors. Nature, 2005, 437(7057): 376-380.

[8]       J. M. Rothberg, W. Hinz, T. D. Rearick, et al. An integrated semiconductor device enabling non-optical genome sequencing. Nature, 2011, 475: 348-352.

[9]       E. Check. Fast sequencing comes to light. Nature, 2005, Nature News.

[10]    J. Wu, S. Zhang, Q. Meng, et al. 3’-O-modified nucleotides as reversible terminators for pyrosequencing. Proceeding of the National Academy of Sciences USA, 2007, 104: 16462-16467.

[11]    C. Toumazou, C. Purushothaman. Sensing apparatus and method. US Patent, 7686929b2, 2010.

[12]    N. Rusk. Torrents of sequence. Nature Methods, 2011, 8(1): 444.

[13]    P. A. Sims, W. J. Greenleaf, H. Duan, et al. Fluorogenic DNA sequencing in PDMS microreactors. Nature Methods, 2011, 8: 575-580.

[14]    G. Giller, T. Tasara, B. Angerer, et al. Incorporation of reporter molecule-labeled nucleotides by DNA polymerases. I. Chemical synthesis of various reporter group-labeled 2'-deoxyri-bonucleoside-5'-triphosphates. Nucleic Acids Research, 2003, 31(10): 2630-2635.

[15]    E. K. Lewis, W. C. Haaland, F. Nguyen, et al. Color-blind fluorescence detection for four-color DNA sequencing. Proceeding of the National Academy of Sciences USA, 2005, 102(15): 5346- 5351.

[16]    G. Turcatti, A. Romieu, M. Fedurco, et al. A new class of cleavable fluorescent nucleotides: Synthesis and optimization as reversible terminators for DNA sequencing by synthesis. Nucleic Acids Research, 2008, 36(4): e25.

[17]    J. Y. Ju, D. H. Kim, L. R. Bi, et al. Four-color DNA sequencing by synthesis usingcleavable fluorescent nucleotidereversible terminators. Proceeding of the National Academy of Sciences USA, 2006, 103(52): 19635-19640.

[18]    H. Ruparel, L. R. Bi, Z. M. Li, et al. Design and synthesis of a 3’-O-allyl photocleavable fluorescent nucleotide as a reversible terminatorfor DNA sequencing by synthesis. Proceeding of the National Academy of Sciences USA, 2005, 102(17): 5932-5937.

[19]    T. S. Kim, D. R. Kim, H. C. Ahn, et al. Novel 3’-O-Fluorescently modified nucleotides for reversible termination of DNA synthesis. Chembiochem, 2009, 11: 75-78.

[20]    J. Guo, N. Xu, Z. M. Li, et al. Four-color DNA sequencing with 3’-O-modified nucleotide reversible terminators and chemically cleavable fluorescent dideoxynucleotides. Proceeding of the National Academy of Sciences USA, 2008, 105(27): 9145-9150.

[21]    J. Guo, L. Yu, N. J. Turro, et al. An integrated system for DNA sequencing by synthesis using novel nucleotide analogues. Accounts of Chemical Research, 2010, 43: 551-563.

[22]    D. C. Knapp, S. Serva, J. D’Onofrio, et al. Fluoride-cleavable, fluorescently labelled reversible terminators: Synthesis and use in primer extension. Chemistry—A European Journal, 2011, 17(10): 2903-2915.

NOTES

*基金项目:国家自然科学基金资助项目(60971018);江苏省自然科学基金资助项目(BK2009273)。

期刊菜单