CN114641581A - Dna接头寡核苷酸 - Google Patents

Dna接头寡核苷酸 Download PDF

Info

Publication number
CN114641581A
CN114641581A CN202080075206.4A CN202080075206A CN114641581A CN 114641581 A CN114641581 A CN 114641581A CN 202080075206 A CN202080075206 A CN 202080075206A CN 114641581 A CN114641581 A CN 114641581A
Authority
CN
China
Prior art keywords
sequence
oligonucleotides
strand
stapler
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080075206.4A
Other languages
English (en)
Inventor
马修·卡洛
陈怜夙
斯尼泽纳·德尔马纳茨
拉多吉·德尔马纳茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MGI Tech Co Ltd
Original Assignee
MGI Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MGI Tech Co Ltd filed Critical MGI Tech Co Ltd
Publication of CN114641581A publication Critical patent/CN114641581A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了与稳定用于测序的DNB,特别是使DNB片段损失最小化有关的方法和组合物。

Description

DNA接头寡核苷酸
相关申请的交叉引用
本申请要求2019年10月28日提交的美国临时申请号62/927,060的优先权并享有其权益,该美国临时申请通过引用以其整体并入本文以用于所有目的。
序列表
本申请包含序列表,该序列表已以ASCII格式电子提交,并在此通过引用以其整体并入。所述ASCII副本创建于2020年10月16日,名为092171-1215354_(5078-WOCN)_SL.txt,大小为2,923字节。
技术领域
本发明涉及DNA测序、基因组学和分子生物学领域。
背景技术
DNB(DNA纳米球)可用于许多应用,包括DNA测序。化学交联在这些应用中已用于稳定DNB。然而,现有的方法可以降低信号的整体强度并抑制第二链产生。稳定DNB的方法的改进是有价值的。
发明内容
在一些实施方案中,本公开提供了一种制备用于核酸分析的稳定化DNA模板的方法,该方法包含:将多个第一链接头寡核苷酸与DNA模板杂交,其中DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,其中每个第一链接头寡核苷酸包含与DNA模板的衔接子序列互补并杂交的序列,并且其中与DNA模板杂交的多个第一链接头寡核苷酸的至少两个第一链接头寡核苷酸彼此连接。在一些实施方案中,与DNA模板的衔接子序列互补并杂交的序列可以是包含可延伸3'端的引物序列。
在一些实施方案中,该方法进一步包含通过一种或多种DNA聚合酶延伸至少两个第一链接头寡核苷酸以生成至少两个第二链,其中至少两个第一链接头寡核苷酸彼此连接并且与DNA模板杂交,从而产生其5'末端连接的至少两个第二链。
在一些实施方案中,至少两个第一链接头寡核苷酸通过DNA杂交、共价键或两者连接。在一些实施方案中,至少两个第一链接头寡核苷酸各自包含订书机序列(staplersequence),其中至少两个第一链接头寡核苷酸通过相应的订书机序列的杂交而连接。
在一些实施方案中,接头寡核苷酸包含切割位点,其中切割接头寡核苷酸释放订书机序列。
在一些实施方案中,两个订书机序列与共享支架的不同区域杂交,从而连接至少两个第一链接头寡核苷酸。
在一些实施方案中,在引物序列与DNA模板结合之后,至少两个第一链接头寡核苷酸的订书机序列彼此结合。
在一些实施方案中,该方法包含:1)在反应中将阻断剂寡核苷酸与至少两个第一链接头寡核苷酸的订书机序列杂交,以产生部分双链的第一链接头寡核苷酸,其包含由阻断剂寡核苷酸和订书机序列组成的双链区域,从而防止第一链接头寡核苷酸的订书机序列彼此杂交,2)将DNA模板添加到与第一链接头寡核苷酸的反应中,其中部分双链的第一链接头寡核苷酸的引物序列与DNA模板结合,3)将阻断剂寡核苷酸与DNA模板解离,4)洗涤以去除阻断剂寡核苷酸,以及5)降低温度以允许第一链接头寡核苷酸的订书机序列彼此杂交。在实施方案中,通过以下一项或多项实现解离:升高反应温度以使阻断剂寡核苷酸与DNA模板解离、使阻断剂寡核苷酸酶促降解和使阻断剂寡核苷酸化学降解。
在一些实施方案中,在引物序列与DNA模板结合之前,至少两个第一链接头寡核苷酸的订书机序列彼此结合以形成连接的第一链接头寡核苷酸。
在一些实施方案中,该方法包含使用浓度低于预定阈值的连接的第一链接头寡核苷酸,使得连接对中的两个第一链接头寡核苷酸与相同的DNB结合。
在一些实施方案中,订书机序列是回文订书机序列(palindromic staplersequence)。在一些实施方案中,回文订书机序列在至少两个第一链接头寡核苷酸中的每一个上的引物序列的5'端。
在一些实施方案中,至少两个第一链接头寡核苷酸包含两个互补的非回文订书机序列,每个第一链接头寡核苷酸上一个;并且其中至少两个第一链接头寡核苷酸通过两个互补的非回文订书机序列的杂交而连接。
在一些实施方案中,至少两个第一链接头寡核苷酸各自包含非回文订书机序列和回文订书机序列。在一些实施方案中,回文接头***在至少两个第一链接头寡核苷酸中的每一个上的非回文订书机序列和引物序列之间。
在一些实施方案中,至少两个第一链接头寡核苷酸各自包含***在两个引物序列之间的订书机序列,其中至少两个第一链接头寡核苷酸上的订书机序列彼此杂交。在一些实施方案中,订书机序列的长度在8至50个核苷酸的范围内。在一些实施方案中,引物序列的长度为15至70个核苷酸。
在一些实施方案中,本文提供了制备用于核酸分析的稳定化DNA模板的方法,该方法包括将多个第一链接头寡核苷酸与DNA模板杂交,其中DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,其中每个第一链接头寡核苷酸包含与DNA模板的衔接子序列互补并杂交的引物序列,其中至少一个第一链接头寡核苷酸包含在引物序列的3'端的阻断基团以防止延伸,并且其中与DNA模板杂交的多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
在一些实施方案中,阻断基团是可逆阻断基团,其中该方法进一步包含从至少一个第一链接头寡核苷酸去除阻断基团,并延伸至少一个第一链接头寡核苷酸以生成至少一个第二链。
在一些实施方案中,第一链接头寡核苷酸可以在位于订书机序列或引物序列中的位点处被切割。
在一些实施方案中,该方法进一步包含在杂交步骤之后去除未结合的第一链接头寡核苷酸和/或将包含DNA模板和第一链接头寡核苷酸的反应混合物加热至例如50-65℃。
在一些实施方案中,该方法进一步包含:1)通过非置换DNA聚合酶延伸多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸以生成至少两个部分延伸的第二链,其包括部分延伸的上游第二链和部分延伸的下游第二链,其中至少两个部分延伸的第二链与DNA模板完全杂交,以及2)用链置换DNA聚合酶延伸完全杂交的上游和下游第二链,其中延伸上游第二链部分地置换下游第二链,从而产生部分杂交的下游第二链。
本文还公开了包含DNA模板和多个第一链接头寡核苷酸的DNA复合物,其中DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,其中每个第一链接头寡核苷酸包含与DNA模板的衔接子序列互补并杂交的引物序列,其中引物序列包括可延伸的3'端,并且其中与DNA模板杂交的多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
本文还提供了包含DNA模板、两个或更多个第二链的DNA复合物,其中每个第二链包含悬伸区域和与DNA模板杂交的杂交区域,其中两个或更多个第二链是与DNA模板互补的,并且其中至少两个第二链在它们相应的5'端处连接。
在一些实施方案中,DNA复合物进一步包含与两个或更多个第二链杂交的两个或更多个第二链接头寡核苷酸,每个第二链接头寡核苷酸包含第二订书机序列,并且至少两个第二链接头寡核苷酸通过相应的第二订书机序列的杂交连接。
本文还提供了DNA阵列,其包含本文公开的DNA复合物中的任意多个。
本文还提供了接头寡核苷酸,每个接头寡核苷酸包含订书机序列和引物序列,并且订书机序列在引物序列的5'端,其中两个接头寡核苷酸上的订书机序列彼此互补,并且其中两个接头寡核苷酸经由相应的订书机序列彼此杂交。
在一些实施方案中,两个接头寡核苷酸的订书机序列是回文序列。在一些实施方案中,两个接头寡核苷酸的引物序列相同。在一些实施方案中,每个接头寡核苷酸包含额外的非回文订书机序列,并且额外的非回文订书机序列位于订书机序列的5'端。在一些实施方案中,两个接头寡核苷酸之一中的额外的非回文订书机序列与第三接头寡核苷酸中的订书机序列杂交。在一些实施方案中,至少一种接头寡核苷酸具有选自由SEQ ID NO:1-10组成的群组的序列。
在一些实施方案中,本公开提供一种制备用于核酸分析的DNA模板的方法,该方法包含将DNA模板固定在阵列上,其中DNA模板是包含多个单体的DNA多联体,并且每个单体包含衔接子序列和DNA靶标序列。多个第一链接头寡核苷酸与DNA模板杂交,并且每个第一链接头寡核苷酸包含与DNA模板的衔接子序列互补并杂交的序列。与DNA模板杂交的多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
附图说明
图1A和1B示出了使用“Z接头”订书机作为引物的DNB亚基。
图2示出了使用“X接头”和可能的接头结构的DNB亚基。
图3示出了在多个测序循环中添加X接头对信号强度的影响。
图4A和4B示出了X接头对映射率和错误率的影响。
图5A和5B示出了Z接头对读数的前50个碱基和后50个碱基之间的映射率和错误率的影响。
图6A至图6E显示了由本文公开的接头寡核苷酸通过杂交形成的各种接头构型。B和b是彼此互补的订书机序列。“bB”表示回文订书机序列。A表示可以与DNA模板杂交的引物序列。
图7A至图7B示出了额外的连接构型。A表示引物序列。B、C、D和E表示可以具有相同或不同序列的订书机序列。图7A表示连接多个接头寡核苷酸的线性支架。图7B显示了连接多个接头寡核苷酸的环形支架。图7C显示了两个接头寡核苷酸经由化学键连接的实施方案。
具体实施方式
1.概述
本公开中描述的接头寡核苷酸可用于以可预测的方式与长核酸分子杂交以交联长核酸分子的不同区域。在某些情况下,交联将核酸中空间上较远的区域变为预定义的形状和结构。在一些情况下,核酸是包含多个单体的DNA多联体,并且接头寡核苷酸各自包含与多联体的不同单体结合的引物序列。连接引物消除了在衔接子中结合非引物连接寡核苷酸的结合位点的需要,这允许衔接子相对较短。较短的衔接子具有多个优点,例如为给定的DNB大小提供具有更多数量的衔接子副本的DNB。连接的引物还允许大多数变性引物重新杂交而不会被冲走。接头寡核苷酸中的至少两个被连接,使得多联体的不同单体也被连接。除了引物再杂交外,笼子很可能防止机械制动和去除DNB片段,但不会由于其他类型的DNA切割而丢失较小的DNB片段。可以改变dsDNA部分和ssDNA部分两者的接头长度,以使不同测序条件下(例如,切割化学、反应温度、时间和pH、聚合酶特性等)的信号保存益处最大化。
DNA多联体中的连接单体可以稳定其结构。测序反应可导致DNA多联体的切割和其片段的丢失。随着更多的测序循环发生,更多的DNA多联体的切割将累积,并且更多的DNA片段丢失将发生。通过连接两个或更多个单体,DNA多联体的两个切口/切割导致DNA损失的可能性将降低,从而使DNB质量损失最小化。此外,由于强加的结构,具有连接引物的DNB可具有较少的机械切割。对于连接的寡核苷酸,通常需要4次或更多次特异性切割才能丢失DNB的片段。通常,提供的连接越多,丢失DNB片段所需的切割就越多。为了最大限度地保留DNB质量,将连接引物与通过使用过的试剂(调节温度、时间、浓度、避免杂质、没有内切核酸酶活性的特纯酶、接近零微生物污染)减少的DNA切口/切割相结合,确保每10、29、30、50、100或更多个测序循环少于4次切割。此外,连接两个或更多个亚基还减少了体积并允许大量DNA多联体沉积在底物上。最后,连接还可以提供其他优势,例如保护DNB免受降解。
与通常抑制DNA模板的反向互补链的产生并抑制引物延伸的测序的化学交联不同,作为交联手段的接头寡核苷酸不抑制反向互补或引物延伸的产生。相反,接头寡核苷酸包含可以延伸以形成反向互补链的一个或多个引物序列。此外,由于引物序列成为第二链的5'末端序列,接头寡核苷酸的连接导致第二链也在5'端处连接。第二链的连接进一步稳定DNA模板(如单链DNA多联体)。
因此,本文所述的组合物和方法可用于稳定DNA模板并使DNB质量的结构损失最小化。使用这些组合物和方法的测序技术延长了读数长度(测序循环数量),降低了错误率并提高了测序期间的映射率。
2.DNA模板多核苷酸:多联体和DNB
在一些实施方案中,用于本发明的DNA模板是DNA多联体。如本文所用,术语“多联体”是指包含相同DNA序列(串联连接的“单体”或“亚基”)的多个拷贝的连续DNA分子。“DNA多联体”可以包含至少两个、至少三个、至少四个、至少10个、至少25个单体、至少50个单体、至少200个单体或至少500个单体。在一些实施方案中,DNA多联体包含25-1000个单体,例如50-800个单体或300-600个单体)。本发明方法中使用的DNA多联体可以是DNA纳米球,或“DNB”。无意以任何方式限制本发明,DNA纳米球被描述于Drmanac等人“Methods andcompositions for long fragment read sequencing”美国专利号8,592,150(2013年11月26日)中,其全部内容通过引用并入本文。“DNA纳米球”或“DNB”是单链DNA多联体,其长度足以形成在溶液中填充大致球形体积的随机线圈(例如,室温下的SSC缓冲液)。在一些实施方案中,DNA纳米球通常具有约100至300nm的直径。通常,每个单体包含至少一个靶标DNA序列。
DNA纳米球是串联成线性DNA结构的DNA序列的单链拷贝。通常,DNB是通过在称为滚环复制的过程中,使用链置换聚合酶(例如phi29聚合酶或Bst聚合酶)复制单链环状DNA来产生的。聚合酶开始延伸与单链环杂交的引物并创建与该环杂交的反向互补链。一旦围绕该环进行了一次完整的延伸,聚合酶就通过将新形成的链置换到行进方向之前来继续延伸。随着聚合酶继续围绕该环延伸链,创建了多个反向互补拷贝,以线性方式彼此连接。该策略创建了一个具有许多探针或引物结合位点的靶标。
DNA多联体(包括DNA纳米球)可以通过任何合适的方法产生。在一种方法中,使用单个基因组片段来生成单链环状DNA,其中衔接子散布在基因组中相邻或紧靠的靶标序列之间。
在一个实施方案中,多联体的单体包含一个衔接子序列和一个靶标DNA序列。因为单体是串联连接的,所以靶标DNA序列的侧翼将有两个衔接子序列。在一些方法中,单体中的靶标DNA序列的侧翼是两个“半衔接子”序列,使得串联体中串联连接的每个靶标序列的侧翼是两个衔接子。在一些方法中,单体单元包含一个、两个、三个或四个或更多个衔接子。在一些实施方案中,单体(和多联体)的所有衔接子具有相同的序列。在其他实施方案中,衔接子可以具有不同的序列,例如两种、三种或四种不同的序列。将认识到单个单体可以包含多于一种的DNA模板序列。例如,单体可以包含结构A1-T1-A2-T2,其中T1和T2是具有相同或不同序列的DNA模板,而A1和A2是具有相同或不同序列的衔接子。可以使用的DNA多联体的各种构型在美国专利号10,227,647中公开,其相关公开内容通过引用以其整体并入本文。相应的多联体将具有结构A1-T1-A2-T2-A1-T1-A2-T2-A1-T1-A2-T2...。在相关实施方案中,单体可以包含结构A1-T1-A2-T2-A3,其中T1和T2是具有相同或不同序列的DNA模板,A2是衔接子,而A1和A3是“半衔接子”。相应的多联体将包括结构A2-T2-A3 A1-T1-A2-T2-A3 A1-T1-A2-T2-A3A1...,其中A3 A1半衔接子一起用作一个衔接子。为了说明而非限制,表1示出了示例性多联体结构。在表1中,N大于1。通常N至少为3(至少3个单体),通常为至少4、至少10、至少25、至少50、至少200或至少500。在一些实施方案中,N在25-1000(例如50-800,或300-600)的范围内。在DNA模板多核苷酸是DNA纳米球的情况下,N至少为25,通常至少为50,并且通常在50-800或300-600的范围内。
表1示例性多联体结构
Figure BDA0003618326700000091
3.靶标DNA序列
如上所述,DNA模板(如多联体)可以包含靶标DNA。靶标DNA可以来自任何来源,包括天然存在的序列[例如基因组DNA、cDNA、线粒体DNA、游离DNA(cell free DNA)等]、人工序列(如合成序列、基因改组或分子进化的产物等)或其组合。靶标DNA可以源自诸如生物体或细胞(如来自植物、动物、病毒、细菌、真菌、人类、哺乳动物、昆虫)、法医来源等来源。靶标DNA序列可以来自生物群体,例如肠道细菌群体。靶标DNA序列可以直接从样本中获得,或者可以是扩增反应、片段化反应等的产物。
靶标DNA可以具有特定大小范围内的长度,例如50至600个核苷酸的长度。其他示例性大小范围包括长度为25至2000、50至1000、100至600、50-100、50-300、100-300和100-400个核苷酸。在具有两种或更多种不同靶标DNA的DNA模板多核苷酸中,靶标DNA可以是相同长度或不同长度。在DNA模板多核苷酸文库中,文库的成员在一些实施方案中可以具有相似的长度(例如,全部在25至2000个核苷酸的范围内,或另一个范围内)。
在一种方法中,可以通过将较大的源DNA(例如,基因组DNA)片段化以产生所需大小范围的片段来制备靶标DNA。在一些方法中,使用大小选择步骤来获得特定大小范围内的片段池。
4.衔接子
如在本文公开的方法中使用的DNA模板或DNA模板多核苷酸包括两个或更多个衔接子序列。如本文所用,衔接子序列是指衔接子的核酸序列。衔接子可以包含用于将DNA模板多核苷酸固定在底物上的元件、用于结合用于序列测定的寡核苷酸的元件(例如,用于在边合成边测序的方法中延伸的引物的结合位点和/或用于基于cPAL或其他连接的测序方法的探针等),或用于固定和测序的两种元件。衔接子可包括额外的特征,例如但不限于限制性内切核酸酶识别位点、延伸引物杂交位点(用于分析)、条形码序列、唯一分子标识符序列和聚合酶识别序列。
衔接子序列可以具有适于特定测序平台和预期用途的长度、结构和其他特性。例如,衔接子可以是单链的、双链的或部分双链的,并且可以具有适于预期用途的长度。例如,衔接子可具有在10-200个核苷酸、20-100个核苷酸、40-100个核苷酸或50-80个核苷酸范围内的长度。在一些实施方案中,衔接子可以包含一种或多种修饰的核苷酸,其含有对碱基、糖和/或磷酸酯部分的修饰。
本领域技术人员将理解,文库的不同成员将通常含有共同的衔接子序列,尽管文库中的不同物种或亚属可具有独特的特征,例如亚属特异性条形码。
单一衔接子序列可以包括多个功能不同的子序列。例如,如本公开中详细讨论的,单个衔接子序列可以含有两个以上的引物订书机序列(其可以被不同的互补引物或探针识别)。衔接子内功能不同的序列可以是重叠的或不重叠的。为了说明,给定40个碱基长的衔接子,在一个实施方案中,碱基1-20是第一引物结合位点并且碱基21-40是第二引物结合位点。在不同的实施方案中,碱基1-15是第一引物结合位点并且碱基21-40是第二引物结合位点。在不同的实施方案中,碱基5-25是第一引物结合位点并且碱基15-35是第二引物结合位点。同样,给定40个碱基长的衔接子,碱基1-20可以是固定序列并且碱基21-40可以是引物结合位点。衔接子(或DNA模板多核苷酸的不同衔接子)中的不同引物订书机序列可以具有相同或不同的长度。
衔接子(例如,第一衔接子、第二衔接子、第三衔接子等)可以包含一个、两个或多于两个的引物订书机序列。引物订书机序列在功能上定义为引物(或寡核苷酸)特异性结合的位点或序列。例如,具有两个引物订书机序列的衔接子可以被两个不同的引物特异性结合。在一种方法中,相同衔接子中的两个引物订书机序列是重叠的,即共享部分核苷酸序列。在一些实施方案中,重叠区域为两个重叠引物订书机序列中任一者的不超过50%、或40%、或30%、或20%、或10%或5%。在一种方法中,不止一个引物订书机序列是不重叠的。在一些实施方案中,不重叠的引物订书机序列彼此紧邻;在一些其他实施方案中,不重叠的引物订书机序列被1-10、10-20、30-40或40-50个核苷酸分开。
显然,在给定的DNA模板多核苷酸内,不同的衔接子可以具有相同的序列或不同的序列,并且可以具有相同的引物订书机序列或不同的引物订书机序列。参见,例如,下文第7节。尽管提供了某些附图来说明本发明,但不应将使用类似交叉影线等的衔接子表示构造为指示序列的同一性。
5.接头寡核苷酸
“接头寡核苷酸”是可以经由共价或共价方式连接到另一个寡核苷酸的寡核苷酸。在一些实施方案中,接头寡核苷酸是与第一链杂交的“第一链接头寡核苷酸”。在一些实施方案中,接头寡核苷酸是与第二链杂交的“第二链接头寡核苷酸”,如下文进一步描述。
接头寡核苷酸可以包含具有可延伸3'端的引物序列,所述引物序列与DNA模板的衔接子序列互补并且能够与DNA模板杂交。可以连接至少两个接头寡核苷酸。术语“连接”是指非共价和共价两种相互作用,两个核酸分子通过所述相互作用结合在一起。在某些情况下,这种连接通过DNA杂交、化学键或两者进行。这些接头寡核苷酸可以连接DNA多联体的相邻或非相邻单体,从而稳定DNA多联体。示例性接头寡核苷酸显示在图6A-6E以及下表2中,按从5'到3'的方向。b和B表示订书机序列并且A表示引物序列。
Figure BDA0003618326700000121
图6A-6E示出了上述接头寡核苷酸可以通过杂交形成的各种接头构型。B和b是彼此互补的订书机序列。“bB”表示回文订书机序列。“A”表示可与DNA模板杂交的引物序列。D和d是彼此互补的。下面进一步详细描述每个成分。
图7A示出了连接构型的额外实施方案。A表示引物序列,而B、C、D和E表示订书机序列。B、C、D和E可以具有相同或不同的序列。图7A显示了连接多个接头寡核苷酸的线性支架。图7B显示了连接多个接头寡核苷酸的环形支架。图7C显示了其中两个接头寡核苷酸经由化学键(即共价键)连接的实施方案。
A.引物序列
本文公开的接头寡核苷酸包含至少一个引物序列和至少一个订书机序列。在一些实施方案中,至少一个引物序列位于订书机序列的3'。在一些实施方案中,接头寡核苷酸与单链DNA杂交,并且接头寡核苷酸的引物序列包含可延伸的3'末端,由此产生与单链DNA反向互补的DNA链。如本文所用,通过延伸第一链接头寡核苷酸生成的DNA链称为第二链;并且通过延伸第二链接头寡核苷酸生成的DNA链称为第三链。
每个接头寡核苷酸的引物序列数量可以变化。在一些实施方案中,接头寡核苷酸包含一个引物序列。在一些实施方案中,寡核苷酸包含两个引物序列。
接头寡核苷酸的引物序列将具有足够的长度以允许引物杂交,其中精确长度和序列取决于引物的预期功能(例如,延伸引物、连接底物、索引序列等)。与DNB结合的引物序列通常将在整个测序运行中使用的所有温度、盐和pH条件下都是稳定的。单个寡核苷酸或其区域的解离和重新缔合通常是不期望的,因为可能会创建异相读数或丢失延伸引物。例如,寡核苷酸的引物序列的长度和Tm应该足够,使得接头寡核苷酸在整个测定过程中使用的温度、盐和pH条件下保持杂交。引物序列的长度通常为至少10、至少12、至少15或至少18个碱基。在一些实施方案中,引物序列的长度范围为8至60个核苷酸,例如,10至25个核苷酸,或40至60个核苷酸长。
B.连接接头寡核苷酸
接头寡核苷酸经由各种方式连接。在一些实施方案中,它们经由化学键连接。在一些情况下,用于连接本文所述接头寡核苷酸的化学键是非特异性的,通过使用诸如氮芥或氯乙基亚硝基脲(CENU)衍生物之类的化学物质形成。在一些实施方案中,用于本文公开的方法和组合物的化学键是寡核苷酸的靶向交联,这可以用例如硫代核碱基来实现(Beilstein J.Org.Chem.2014,10,2293–2306)。一般而言,任何允许寡核苷酸附着(attachment)到表面的修饰都可以被修饰以允许寡核苷酸与寡核苷酸附着,并且这些修饰可以用于连接接头寡核苷酸。例如,NHS(N-羟基琥珀酰亚胺)基团可以与第二分子的胺基反应(也允许与蛋白质交联)。点击化学(Click chemistry),例如叠氮修饰的寡核苷酸和炔烃修饰的寡核苷酸之间的缀合,也可用于将两个寡核苷酸缀合在一起(Acc.Chem.Res.20124581258-1267)。
在一些实施方案中,接头寡核苷酸经由DNA杂交连接。在一些实施方案中,接头寡核苷酸经由位于每个接头寡核苷酸上的订书机序列的杂交而连接。例如,接头寡核苷酸Seq1中的订书机序列(“A”)与另一个接头寡核苷酸Seq 2中的订书机序列(“a”)互补并且可以与其杂交。在一些实施方案中,订书机序列是回文序列。在一些实施方案中,订书机序列是非回文序列。
回文序列是指序列的一半与另一半互补的序列。例如,表2中的接头寡核苷酸,其包含序列“b”,其后是序列“B”,其中b与B互补。一种示例性回文序列是GGAACCATGGTTCC(SEQID NO:8)。具有回文序列的接头寡核苷酸可以形成具有内部互补性的发夹(即,形成分子内发夹)或可以与另一个具有相同序列的接头寡核苷酸上的订书机序列互补(即,形成分子间杂交体)。当第一接头寡核苷酸的回文序列GGAACCATGGTTCC(SEQ ID NO:8)与相同序列的第二寡核苷酸上的回文序列杂交时,接头寡核苷酸对经由回文序列连接。参见图2(两个接头寡核苷酸“寡核苷酸接头1”经由回文序列“Bb”彼此杂交以形成第一接头寡核苷酸对,两个接头寡核苷酸“寡核苷酸接头2”经由回文序列“Cc”彼此杂交以形成第二接头寡核苷酸对)。另一个说明性示例在图6B中,其中序列“bB”是自我互补的并且允许与第二寡核苷酸杂交。
在一个示例性示例中,具有序列5’GGAACCATGGTTCCAAGTCGGAGGCCAAGCGGTCTUAGGA-3’(SEQ ID NO:1)(属于接头寡核苷酸3或Seq 3的类别)的接头寡核苷酸包含回文序列GGAACCATGGTTCC(SEQ ID NO:8)。SEQ ID NO:1进一步包含AAGTCGGAGGCCAAGCGGTCTUAGGA(SEQ ID NO:10)的序列,其可以作为识别DNB衔接子的一部分的引物序列。
Seq 3中的回文序列在适当条件下将是自我互补的并且可以形成具有内部互补性的发夹;替代地,回文序列可以与相同序列的第二寡核苷酸互补。在较高的温度(例如50℃到65℃)下,内部发夹结构不稳定并且较长的分子间杂交体将保持杂化。因此,升高温度将有利于在内部发夹上形成分子间杂交体(其是稳定各种测序应用中使用的DNA模板所需要的)。因此,在一些实施方案中,包含回文订书机序列的接头寡核苷酸与固体支撑物上的DNA模板杂交。杂交在10-30℃的温度下进行。然后洗涤固体支撑物以去除未结合的引物,然后将温度升高到50至65℃以减少分子内杂交体的形成。
订书机序列的长度可以变化。订书机序列的长度选择成使得订书机序列的Tm在50℃和72℃之间。这确保了接头寡核苷酸可以在整个测定程序中保持杂交。在一些实施方案中,订书机序列的长度可以在20至150个核苷酸(例如40至120个核苷酸、50至100个核苷酸)的范围内。
接头寡核苷酸中的订书机序列和模板杂交序列(例如,引物序列)的相对位置可以变化。在一些实施方案中,订书机序列相对于引物序列(例如,表2中的接头寡核苷酸1至3)位于5'。在一些实施方案中,在接头寡核苷酸中的两个模板杂交序列(例如,两个引物序列)之间***订书机序列,并且订书机序列相对于第一引物序列位于3'并且相对于第二引物序列位于5'。说明性示例显示在表2(例如,接头寡核苷酸4至6)和图6C和6D中。
C.替代连接选项--支架
如本文所用,支架是指个体寡核苷酸通过其彼此缔合的分子结构。在一些实施方案中,两个或更多个接头寡核苷酸(例如,三个、四个或五个接头寡核苷酸)通过与支架中的序列杂交而连接,该序列与接头寡核苷酸的订书机序列互补。在一些实施方案中,通过支架连接的这些接头寡核苷酸的订书机序列是不同的。在一些实施方案中,订书机序列是非回文的。在一些实施方案中,两个或更多个接头寡核苷酸之间的订书机序列是相同的。
本文的方法和组合物中使用的支架可以以多种形式存在。在一些实施方案中,支架是线性支架。在一些实施方案中,支架是圆形支架。在一些实施方案中,支架是树枝状聚合物支架。支架可以是线性的或圆形的或树枝状聚合物。在一些实施方案中,在接头寡核苷酸经由引物序列与DNA模板(例如,DNA多联体)杂交后,添加支架并且接头寡核苷酸与支架杂交。图7A显示线性支架的一个说明性示例,其中接头寡核苷酸BA、CA、DA与线性支架杂交。图7B显示了圆形支架的说明性示例,其中接头寡核苷酸BA、CA、DA和EA与圆形支架杂交。在这两个示例中,A表示与DNA模板互补的引物序列,而B、C、D和E是订书机序列。支架通常以相对低的浓度(例如,低于反应中接头寡核苷酸浓度的浓度)使用,与支架的更长杂交时间将提供更多连接的引物。
本文公开的支架可由任何材料或底物(例如,蛋白质或核酸)制成。在一些实施方案中,支架是蛋白质支架。在一些实施方案中,支架是核酸支架。核酸支架的非限制性示例包括DNA、RNA和肽核酸(PNA)。支架可以共价或非共价地附着到接头寡核苷酸的订书机序列。在一些实施方案中,支架是包含与订书机序列互补的序列的两个或更多个拷贝的核酸,使得接头寡核苷酸通过杂交锚定到支架上。在一些实施方案中,使用多个支架分子,每个连接多个接头寡核苷酸。
本文公开的支架可以生成为线性重复或包含多个重复的圆形结构。在一些实施方案中,支架是核酸多联体(例如,DNB)。在某些情况下,期望控制支架的杂交速率以确保每个接头寡核苷酸本身不与独立的支架分子杂交(“独立的单一杂交事件”),而是与连接其他接头寡核苷酸的相同支架分子杂交(“桥接事件”)。促进桥接事件而不是独立的单一杂交事件可以通过例如保持支架的浓度相对较低来实现。在一些实施方案中,接头寡核苷酸与支架的摩尔比率可以在2至50(例如3至25、3至15或4至10)的范围内。用于此目的的支架的合适浓度可以凭经验确定。例如,对于同一支架,具有多个(例如,3至4或4至6个)不同的订书机序列增加了可以连接远距离的单个DNA模板(例如,DNB)的机会。
D.不使用支架的特定连接引物构型
在一些实施方案中,两个接头寡核苷酸连接并形成接头。接头和接头寡核苷酸可以采用不同的形式并且可以以不同的方式分类。例如,基于接头可以结合的DNA多联体中的亚基数量,接头可分为2臂接头或4臂接头。根据接头本身的相对序列成分,它们可分为Z-接头或X接头。Z接头可以是2臂接头或4臂接头。X接头通常是2臂接头。
2臂接头对比4臂接头
在一些实施方案中,每个接头寡核苷酸仅含有一个引物序列,因此两个寡核苷酸可以连接DNA多联体的两个亚基(“2臂接头”)。作为说明性示例,两个接头寡核苷酸Seq 1和Seq 2各自都含有用于与DNB的一个(或多个)亚基杂交的引物序列(A)。Seq 1还含有订书机序列(b)并且Seq2含有订书机序列(B),其中(b)与(B)互补。参见图6。为了形成功能性接头,将Seq 1和Seq 2添加到包含模板DNA(例如DNA多联体)的反应中。
在一些实施方案中,一单个接头寡核苷酸,由于具有与DNA多联体的衔接子序列互补的两个引物序列,可以连接多联体的2个亚基。例如,图6中的Seq4或Seq 5属于此类接头寡核苷酸。
在一些实施方案中,每个接头寡核苷酸具有两个引物序列,在其间***一个订书机序列。每个接头寡核苷酸可以与DNB的两个亚基杂交。这种构型允许两个连接的接头寡核苷酸与DNA模板的四个单个序列结合,因此被称为“4臂接头”。在一些实施方案中,4臂接头的两个接头寡核苷酸的订书机序列不相同,例如图6中的Seq4和Seq 5。在一些实施方案中,4臂接头的两个接头寡核苷酸的订书机序列相同且为回文,这允许相同序列的两个接头寡核苷酸杂交。
在一些实施方案中,连接两个接头寡核苷酸以形成Z接头。Z接头中的每个接头寡核苷酸包含与DNA模板互补并可以与其杂交的引物序列,例如DNA多联体的接头。在一些实施方案中,每个引物序列包含可延伸的3'末端并且可以用作引物以基于DNA模板制造第二链。Z接头的每个接头寡核苷酸还包含与另一个接头寡核苷酸的订书机序列互补的订书机序列,两个订书机序列的杂交导致在两个接头寡核苷酸之间形成部分杂交体。在一些实施方案中,接头寡核苷酸的订书机序列是回文的,并且Z接头的两个接头寡核苷酸具有相同的序列。在一些实施方案中,接头寡核苷酸的订书机序列是非回文的并且两个接头寡核苷酸具有不同的序列。
每个接头寡核苷酸的3'可以延伸以形成第二链。如此形成的两个第二链经由Z接头在5'末端连接。
图1A显示了由一对接头寡核苷酸组成的Z接头的说明性示例,每个接头寡核苷酸包含订书机序列和引物序列,其中订书机序列位于引物序列的5'。这对接头寡核苷酸的订书机序列是互补的,并且其退火将5'末端处的接头寡核苷酸连接起来并形成2臂Z接头。引物序列与DNB模板(例如第一链)杂交,并且每个接头寡核苷酸延伸以形成第二链,这导致两个第二链在5'端连接(右下小图)。在这种情况下,延伸通过链置换DNA聚合酶进行,这形成分支结构,其中每个第二链与DNA模板部分杂交。
E.控制交联的程度
在一个实施方案中,接头寡核苷酸可以在限定的位置被切割以允许去除3引发块,从而形成用于聚合的引物。
在一些实施方案中,接头寡核苷酸可以例如通过酶(例如磷酸酶或酯酶)、化学反应、热、光等被切割。对于需要多联体亚基之间交联程度较低的应用,切割可以实现交联结构的释放。也就是说,多联体的亚基之间的连接可以被反转或转换,使得可以执行次要功能。例如,由于在切割位点形成新的3'羟基,可以生成一个新的引发位点,从而允许通过聚合酶进行延伸。切割位点可以位于接头寡核苷酸上的任何位置处。在一些实施方案中,两个接头寡核苷酸中的至少一个包含位于订书机序列侧翼的两个切割位点,并且这些位点上的切割导致订书机序列的释放。在一些实施方案中,切割位点在至少两个接头寡核苷酸的订书机序列上,并且切割释放接头寡核苷酸-接头寡核苷酸杂交体或释放接头-DNB杂交体。在一些实施方案中,切割位点在接头寡核苷酸的引物序列上,并且位点上的切割创建较短的不稳定杂交体并导致交联结构的释放。
切割可以通过核苷酸碱基和/或无碱基位点的酶促识别,或通过修饰磷酸二酯键以创建位点特异性断裂来实现。例如,可以通过在寡核苷酸合成期间掺入3'磷酸基团来设计接头寡核苷酸的3'块,并且可以通过激酶或磷酸酶切割3'磷酸基团。
在一些实施方案中,切割位点包含尿嘧啶核苷酸碱基,其允许用尿嘧啶DNA糖基化酶(UDG)和核酸内切酶切割碱基和磷酸二酯键。在一些实施方案中,核酸内切酶是在切割位点切割后可以生成3'羟基的酶,例如APE1。尿嘧啶核苷酸碱基处磷酸二酯骨架的切割导致订书机序列的释放。这对于需要去交联的情况很有用。
在一些实施方案中,接头寡核苷酸是A-bB-A。A表示引物序列,而bB是回文订书机序列。用两个引物序列的核酸内切酶在dU碱基处切割和糖切除允许释放订书机序列和第二杂交区域。所得结构将是两种形式之一。在一个示例中,第一序列是序列11.4,具有序列AAGTCGGAGGCCAAGCGGTCT(SEQ ID NO:2),如果选择合适的核酸内切酶,该序列可以保持与DNB杂交并且可以具有3'羟基。第二序列(Seq11.5)AGGAGGAACCATGGTTCCAAGTCGGAGGCCAAGCGGTCT(SEQ ID NO:3)也可以保持与DNB杂交,并且可以具有允许通过聚合酶进行延伸的3'羟基。Seq 11.5仍将具有5'尾序列,该尾序列可以保持与第二寡核苷酸的第二5'尾序列杂交。
如上所述的剩余切割的寡核苷酸序列Seq 11.4和Seq 11.5然后可以用作随后的聚合酶延伸(例如用链置换聚合酶生成第二链)的引物。dU切割步骤是任选的;如在某些情况下,通过将引物与DNB的替代区域结合,仍然可以发生后续的第二链生成。引物可以通过链置换聚合酶而延伸以形成第二链,并且所述延伸可以置换下游的第二链,例如,通过延伸如本文公开的接头寡核苷酸形成的一个。
F.控制交联的时间
阻断剂寡核苷酸
在一些情况下,为了使DNA模板的交联效率最大化,需要确保接头寡核苷酸在它们彼此杂交之前与DNA模板杂交。实现此目的的一种方法是在该过程期间当接头寡核苷酸与DNA模板接触并杂交时首先阻断接头寡核苷酸之间的杂交。在接头寡核苷酸与DNA模板的杂交完成之后,并且在从反应中去除过量接头寡核苷酸的任选步骤之后,逆转阻断以允许接头寡核苷酸之间的杂交。在一些情况下,在与DNA模板杂交之前阻止寡核苷酸接头的杂交可以通过使用阻断剂寡核苷酸来实现。所述阻断剂寡核苷酸与接头寡核苷酸的订书机序列互补,但与引物序列不互补。阻断剂寡核苷酸的长度也可以与订书机序列的长度相似。因此,将阻断剂寡核苷酸与接头寡核苷酸一起温育形成双链订书机区域,但使引物序列保持单链。允许部分双链接头寡核苷酸与DNA模板接触,其中引物序列与DNA模板中的互补序列结合。在与DNA模板杂交后,然后去除阻断序列,以便接头寡核苷酸可以通过互补的订书机序列彼此杂交。
阻断剂寡核苷酸可以经由多种方式去除。在一些情况下,阻断剂寡核苷酸被设计为具有与接头寡核苷酸的订书机序列杂交以形成双链杂交体的序列,并且双链杂交体的解链温度低于DNA模板和接头寡核苷酸之间形成的双链杂交体的解链温度。在那些情况下,可以通过提高反应温度使得阻断剂寡核苷酸与接头寡核苷酸解离来实现阻断剂寡核苷酸的去除,而DNA模板保持与接头寡核苷酸杂交。在一些情况下,阻断剂寡核苷酸可以通过酶切割(例如尿嘧啶-糖基化酶/核酸内切酶IV或UDG/APEI)去除。在一些情况下,阻断剂寡核苷酸中不同位置的磷酸二酯键可以被可化学切割的键(例如二硫化物、叠氮基)替换,使得阻断剂寡核苷酸可以被切割和去除。
在一些实施方案中,该方法包含:1)在反应中将阻断剂寡核苷酸与至少两个接头寡核苷酸的订书钉序列杂交,以产生包含双链区域的部分双链的接头寡核苷酸,该双链区域由阻断剂寡核苷酸和订书机序列组成,从而防止接头寡核苷酸的订书机序列彼此杂交,2)将DNA模板添加到与接头寡核苷酸的反应中,从而接头寡核苷酸的部分双链引物序列与DNA模板结合,3)通过以下一种或多种方式去除阻断剂寡核苷酸:升高反应温度使得阻断剂寡核苷酸或多个寡核苷酸与接头寡核苷酸解离,阻断剂寡核苷酸进行酶促或化学降解,4)洗涤以去除阻断剂寡核苷酸,以及5)降低温度以允许接头寡核苷酸的订书机序列彼此杂交。
在一些实施方案中,在引物序列与DNA模板结合之前,至少两个接头寡核苷酸的订书机序列彼此结合以形成连接对。一般而言,在一些实施方案中,来自相同连接对的两个接头寡核苷酸与单个DNB结合的事件发生率高于来自不同连接对的两个接头寡核苷酸与单个DNB结合的速率。因此,在一些实施方案中,接头寡核苷酸的连接对(或接头寡核苷酸)以合适的浓度使用,使得连接对中的两个接头寡核苷酸与相同的DNB结合,而不是来自不同连接对的两个接头寡核苷酸与相同的DNB结合。为此目的合适的浓度可以根据经验确定。
亚基的连接可以在DNB沉积在载玻片上之后发生或在将DNB加载到表面上之前在溶液中发生。溶液中的连接可以最大限度地减少跨多个表面结合位点的DNB***。表面上的连接可以使连接多个DNB的风险最小化。
G.具体构型
在一些实施方案中,两个接头寡核苷酸连接并形成接头。如本文所用,接头是指由通过共价或非共价方式连接的两个或更多个接头寡核苷酸组成的复合物。接头和接头寡核苷酸可以采用不同的形式。例如,基于接头可以结合的DNA多联体中的亚基数量,接头可分为2臂接头或4臂接头。基于接头本身的相对序列成分,它们可以分为Z接头或X接头。
2臂接头和4臂接头
在一些实施方案中,每个接头寡核苷酸仅含有一个引物序列,因此两个寡核苷酸可以连接DNA多联体的两个亚基(“2臂接头”)。作为说明性示例,两个接头寡核苷酸Seq 1和Seq 2各自含有用于与DNB的一个(或多个)亚基杂交的引物序列(A)。Seq 1还含有订书机序列(b),Seq 2含有订书机序列(B),其中(b)与(B)互补。参见图6A。为了形成功能性接头,将Seq 1和Seq 2添加到包含DNA模板(例如DNA多联体)的反应中。在一些实施方案中,2臂接头中的每一个都包含回文序列,参见图6B。
在一些实施方案中,一单个接头寡核苷酸,由于具有与DNA多联体的衔接子序列互补的两个引物序列,可以连接多联体的两个亚基。例如图6C中的Seq4或Seq 5。
在一些实施方案中,每个接头寡核苷酸具有两个引物序列,在其间***一个订书机序列。每个接头寡核苷酸可以与DNB的两个亚基杂交。这种构型允许两个连接的接头寡核苷酸与DNA模板的四个单个序列结合,因此被称为“4臂接头”。在一些实施方案中,4臂接头的两个接头寡核苷酸的订书机序列不相同,例如图6C中的Seq 4和Seq 5。在一些实施方案中,4臂接头的两个接头寡核苷酸的订书机序列相同且为回文,这允许相同序列的两个接头寡核苷酸杂交。参见,例如图6D中的Seq 6和图6E中的Seq 7和Seq 8。
Z接头和X接头
在一些实施方案中,连接两个接头寡核苷酸以形成Z接头。Z接头中的每个接头寡核苷酸包含与DNA模板互补并可以与其杂交的引物序列,例如DNA多联体的接头。在一些实施方案中,每个引物序列包含可延伸的3'末端并且可以用作引物以基于DNA模板制造第二链。Z接头的每个接头寡核苷酸还包含与另一个接头寡核苷酸的衔接子序列互补的订书机序列,使得两个订书机序列的杂交导致在两个接头寡核苷酸之间形成部分杂交体。在一些实施方案中,接头寡核苷酸的订书机序列是回文的,并且Z接头的两个接头寡核苷酸具有相同的序列。在一些实施方案中,接头寡核苷酸的订书机序列是非回文的并且两个接头寡核苷酸是不同的。
接头寡核苷酸的3'末端可以延伸以形成第二链。在某些情况下,如此形成的两个第二链经由Z接头在5'末端连接。
图1A显示了由一对接头寡核苷酸组成的Z接头的说明性示例,每个接头寡核苷酸包含订书机序列和引物序列,其中订书机序列位于引物序列的5'。这对接头寡核苷酸的订书机序列是互补的,并且其退火将5'末端的接头寡核苷酸连接起来并形成2臂Z接头。引物序列与DNB模板(例如,第一链)杂交,并且每个接头寡核苷酸延伸以形成第二链,这导致在5'处连接两个第二链(右下小图)。在这种情况下,延伸通过链置换DNA聚合酶进行,这形成分支结构,其中每个第二链与DNA模板部分杂交。
在一些实施方案中,接头寡核苷酸形成X接头,其中两个序列相同的接头寡核苷酸通过回文序列连接,并且每个接头寡核苷酸在5'末端具有可与另一个具有非回文订书机序列的接头寡核苷酸杂交的额外的序列。每个接头寡核苷酸还包含与DNA模板互补并且可以与其杂交的引物序列(例如,DNA多联体的衔接子)。因此,这种X接头结构允许多个(可能四个或更多)3'可延伸引物序列。
例如,如图2所示,X接头可包含一对D-Bb-A接头寡核苷酸(“寡核苷酸接头1”)和一对d-cC-A接头寡核苷酸(“寡核苷酸接头2”)。两个D-Bb-A接头寡核苷酸经由回文订书机序列Bb彼此杂交,并且两个d-cC-A接头寡核苷酸经由回文订书机序列cC彼此杂交。每个D-Bb-A接头寡核苷酸还经由互补的订书机序列D和d与d-cC-A接头寡核苷酸之一杂交。这产生了一种具有四个可以与DNA模板杂交的引物序列的结构(“结构1”,如图2中左下小图所示)。四个引物序列中的每一个都包含一个可延伸的3'末端,并且可以延伸以产生第二链,它是DNA模板的反向互补体。
X接头也可以采用如“结构2”(图2的右下小图)中所示的形式。两个D-Bb-A接头寡核苷酸与四个d-cC-A接头寡核苷酸退火,其产生具有多个引物序列(A)和多余单链臂(例如“D”或“d”)的结构。这些多余链臂允许作为随机网络而进行持续结构增长。例如,“D”很容易与任何“d”区域互补,并且能够退火到“d”以扩展任何形式的结构。
示例性序列如下所示。单个下划线序列是引物序列(A);粗体是回文订书机序列(Bb);并且双下划线序列是非回文订书机序列(D或d)。
Figure BDA0003618326700000231
以及
Figure BDA0003618326700000232
第二链接头寡核苷酸
在一些情况下,该方法进一步包含将接头寡核苷酸与第二链杂交(这些接头寡核苷酸称为第二接头寡核苷酸)。第二接头寡核苷酸可以包含以如上所述的任何构型排列的任何成分,即它们还可以包含订书机序列和具有可延伸3'末端的引物序列。在某些情况下,第二接头寡核苷酸是测序引物并且用于生成第二链的序列读数。如下所述,可以将第二链的序列读数与第一链的序列读数组合以构建靶标DNA的序列信息。参见图1B。
下面的Seq 12是第二链接头寡核苷酸的一个实施方案的示例。Seq 12由子序列Seq 12.1、Seq 12.2和Seq 12.3组成。
GTCTCCAGTCGAAGCCCGATCGGAACCATGGTTCCGTCTCCAGTCGAAGCCCGATC,3’blocked(SEQ ID NO:6)
Seq 12.1
GTCTCCAGTCGAAGCCCGATC(SEQ ID NO:7)
Seq 12.2
GGAACCATGGTTCC(SEQ ID NO:8)
Seq 12.3
GTCTCCAGTCGAAGCCCGATC(SEQ ID NO:9)
Seq 12.1(SEQ ID NO:7)和Seq 12.3(SEQ ID NO:9)是与DNB(原始DNB的反向互补链)的第二链(也称为第二链支线)的区域杂交的相同重复序列。Seq12.2是具有内部互补性的区域,其允许2个寡核苷酸分子聚集在一起并杂交以形成4臂结构。
6.通过延伸接头寡核苷酸产生部分置换的第二链
如上所述,本发明的接头寡核苷酸可包含具有可延伸3'末端的引物序列,因此,接头寡核苷酸可用作引物。如上所述,接头寡核苷酸可具有3'-羟基化学基团,其允许作为引物用一种或多种DNA聚合酶进行延伸。在一些实施方案中,接头寡核苷酸包含可逆的3'阻断基团,其可被切割以产生可延伸的3'末端。因此,在一些实施方案中,至少两个接头寡核苷酸被延伸以产生两个第二链,即具有与DNA模板反向互补的序列的链。根据两个第二链的相对位置,位于另一链5'的链称为上游链,而另一链称为下游链。例如,图1A显示通过延伸两个连接的接头寡核苷酸(在图1A中表示为“连接的第二链支线”)产生的两个第二链。左侧显示的链位于右侧链的5'端;在这种构型中,左侧的链是上游链,而右侧的链是下游链。
可以延伸多个接头寡核苷酸以生成一系列第二链。该系列中的任何单个第二链可以被视为下游第二链(相对于上游第二链)以及上游第二链(相对于下游第二链)。举例来说,延伸接头寡核苷酸产生一系列第二链,包括第二链#1、第二链#2、第二链#3。#1、#2和#3与DNA模板杂交或部分杂交,并按从5'到3'的顺序存在。#2是相对于#3的上游第二链;同时,#2也是相对于第二链#1的下游第二链。
在一些实施方案中,生产第二链涉及至少两个步骤。第一步骤包括通过DNA聚合酶(例如,非链置换聚合酶或链置换聚合酶)延伸至少两个第一链接头寡核苷酸以生成至少两个部分延伸的第二链、部分延伸的上游第二链以及部分延伸的下游第二链。两个链都与DNA模板完全杂交。
第二步骤包括用链置换聚合酶进一步延伸两个部分延伸的第二链,在此期间延伸部分延伸的上游部分置换部分延伸的下游第二链,从而产生部分杂交的下游第二链。
这些引物可以是“延伸引物”或“测序寡核苷酸”,“延伸引物”用于引物延伸反应以生成上述第二链。因此,延伸引物是DNA聚合酶的底物并且可以通过添加核苷酸来延伸。
在本公开的指导下,选择或设计用于本发明的引物和探针(例如,众所周知的能够在测序测定条件下延伸或连接的引物)将完全在本领域普通技术人员的能力范围内。无意限制本发明,延伸引物的长度通常在10-100个核苷酸(通常为12-80个核苷酸,并且通常为15-80个核苷酸)的范围内。
应当理解,引物和探针可以与其所杂交的衔接子中的订书机序列完全或部分互补。例如,引物可以与其所杂交的序列具有至少85%、90%、95%或100%的同一性。
引物还可以在引物的5'末端含有与接头中的引物结合序列(即,引物结合位点的序列)不互补的额外序列。引物的非互补部分的长度可以不干扰引物与其引物订书机序列之间的杂交。通常,非互补部分的长度为1至100个核苷酸。在一些实施方案中,非互补部分的长度为4至8个核苷酸。引物可以包含DNA和/或RNA部分,并且在一些方法中,用于本发明的引物可以具有一种或多种修饰的核苷酸,其包含有对碱基、糖和/或磷酸酯部分的修饰。
“测序寡核苷酸”可以是用于边合成边测序(也称为“延伸测序”)反应中的延伸引物。“测序寡核苷酸”可以是在连接测序方法中使用的寡核苷酸,该方法例如美国专利公布20140213461中描述的“组合探针-锚定连接反应”(cPAL)(包括单一、双重和多重cPAL),该美国专利通过引用并入本文用于所有目。简而言之,cPAL包括以下步骤的循环:首先,“测序寡核苷酸”(或“锚”)与上述第二DNA链的衔接子中的互补序列杂交。然后进行锚与完全简并的探针(例如用荧光染料标记的8-mer探针)群的酶促连接反应。探针可包含例如约6至约20个碱基长度,约7至约12个碱基长度。在任何给定的循环中,所使用的8-mer探针群的结构使得其一个或多个位置的身份与附着到其上的荧光团的身份相关,例如8-mer探针。在本领域公知的基本cPAL的变体(例如多重cPAL)中,部分或完全简并的二级锚被用于增加可读序列。
在一些实施方案中,链置换聚合酶用于产生部分置换的第二链(后续片段),其中悬伸(overhang)和双链体部分两者均附着于DNA模板多核苷酸(例如,DNB DNA链)。可以控制延伸反应以避免第二链(即“后续链”或“后续片段”)的完全置换并产生具有适于测序的悬伸长度的第二链。这可以通过选择具有合适聚合速率或其他特性的一种(或多种)聚合酶来控制反应进程,并通过使用包括(但不限于)反应温度、反应持续时间、引物组成、DNA聚合酶、引物和凹痕浓度(dents concentration)、添加剂和缓冲液组成的各种反应参数来实现。最佳条件可以根据经验确定。
6.1 DNA聚合酶
一种控制延伸-置换反应的方法是使用具有合适链置换活性的DNA聚合酶来产生第二链。具有链置换活性的DNA聚合酶包括但不限于Phi29、BstDNA聚合酶、DNA聚合酶I的Klenow片段和Deep-VentRDNA聚合酶(NEB#M0258)。已知这些DNA聚合酶具有不同强度的链置换活性。参见Kornberg和Baker(1992,DNA Replication,第二版,第113-225页,纽约州弗里曼)。在本公开的指导下,本领域普通技术人员能够选择适于实施该方法的DNA聚合酶。
6.2聚合酶、引物和dNTP浓度
控制延伸-置换反应的另一种方法是使用合适浓度的具有链置换活性的DNA聚合酶,或控制dNTP浓度,或用作引物的接头寡核苷酸的浓度。
6.3添加剂
在一些实施方案中,通过在反应缓冲液中包括影响延伸引物和DNA模板之间的双链体形成的试剂来控制延伸反应速率,例如DMSO(例如1%-2%)、甜菜碱(例如0.5M)、甘油(例如10%-20%)、T4 G32 SSB(例如10-20ng/μl)和体积排阻剂。
6.4温度
还可以控制反应温度以允许适当速度的聚合和链置换。更高的温度通常导致更大程度的链置换。在一些实施方案中,反应温度保持在20℃-37℃的范围内,例如32℃、33℃、34℃、35℃、36℃或37℃,以便避免完全置换。
在一些方法中,通过使用常规(可延伸的)引物和不可延伸的引物(即3'末端阻断的引物)的混合物来控制延伸反应。不可延伸的引物经由例如阻止通过DNA聚合酶进行的聚合的化学阻断基团来阻断伸长。通过以不同比率混合这两种不同的引物,可以控制新合成的互补DNA链(后续片段)的双链体(杂交)部分的长度。例如,在一种方法中,使用第一引物的混合物,其中50-70%是不可延伸的(“阻断的”),而30-50%是可延伸的(“未阻断的”)。许多类型的不可延伸引物在本领域中是已知的并且将适于本发明。
6.5反应时间
在一些实施方案中,通过在达到所需长度的第二链的特定时段后终止反应来控制延伸-置换反应。在一些实施方案中,反应在开始后5分钟、10分钟、20分钟、30分钟、40分钟或60分钟后终止。终止反应的方法是本领域公知的,例如通过掺入ddNTP或通过添加化学溶液(例如含有1.5MNaCl的Tris缓冲液)。在一个实施方案中,通过在向反应中添加含有1.5MNaCl的Tris缓冲液之后掺入ddNTP来实现终止。
7.序列测定
在一些实施方案中,所要求保护的发明提供了测定如上所述生产的第二链的序列的方法。该方法包含将测序寡核苷酸与第二链中与DNA模板(例如DNA多联体)的至少一部分衔接子互补的序列杂交,并测定与靶标DNA序列互补的至少一部分序列的核苷酸序列。可以使用边合成边测序方法或使用连接测序方法或两者进行序列测定。
在一些实施方案中,如上所述的任何接头寡核苷酸可用作测序寡核苷酸。
在一个实施方案中,通过延伸与单体衔接子的互补序列杂交的引物(例如,第二链接头寡核苷酸)对第二链的悬伸进行测序,例如,如图1B所示。
在另一个实施方案中,还使用与单体衔接子杂交的引物对DNA模板链进行测序。来自第二链的序列信息与由DNA模板测序生成的序列配对以测定整个靶标DNA序列。
对读者来说显而易见的是,可以使用本文概述的特定实施方案的变体。在一种方法中,延伸引物(例如,第一链接头寡核苷酸)和测序寡核苷酸(例如,第二链寡核苷酸)结合衔接子序列的不同部分。在一种方法中,延伸引物和测序寡核苷酸与衔接子序列的相同部分(例如,用于延伸的衔接子序列的一部分与用于测序的衔接子序列的相同部分的互补体)结合。
可以使用任何合适的序列测定方法(例如,SBS、焦磷酸测序、连接测序等)来测定悬伸的序列。在一些实施方案中,使用不止一种测序方法。例如,可以使用一种方法(例如,cPAL)对DNA模板链进行测序,并使用不同的方法(例如,SBS)对第二链进行测序。
边合成边测序(SBS)可依赖DNA聚合酶活性在测序反应步骤期间进行链延伸。SBS在本领域中是公知的。参见,例如美国专利号6,787,308和US8241573B2以及Shendure等人,2005,Science,309:1728-1739。DNA纳米球的测序可以通过多种过程进行。在一种方法中,用于生成DNB的环是用已知序列的DNA区域(衔接子)和待测定的未知身份的相邻序列制备的。衔接子的一个功能是提供引物杂交位点,使得引物的延伸将导致核苷酸添加到“未知”或“待测定”区域。核苷酸如果在3'位置被可逆阻断则每次添加在一个位置并与DNB中的碱基位置互补。去除3'阻断基团后,可以在下一个循环中读取一个额外的位置。碱基类型的荧光部分特征用于检测掺入的碱基,因此揭示了DNB中该位置处的碱基。
替代地,可以使用连接测序。可以通过连接延伸到未知序列中的荧光寡核苷酸来延伸引物或锚。在该测序方法中,具有简并碱基的荧光寡核苷酸与起始锚连接,然而寡核苷酸的一个碱基被限定,并且与荧光部分相关联。寡核苷酸探针与锚的连接在洗涤过量探针后创建了稳定的荧光,并且取决于对与DNB相同位置处的碱基互补的限定碱基的识别。例如,连接测序被描述于例如Shendure等人,2005,Science,309:1728-1739中。
也可以使用其他测序方法,例如焦磷酸测序(参见,例如Ronaghi等人,Anal.Biochem.(1996)242:84–89)和杂交测序(参见,例如Drmanac等人,Advances inBiochemical Engineering/Biotechnology(2002)77:75-101)。
添加引物的顺序
延伸引物(例如,第一接头寡核苷酸和第二接头寡核苷酸)的添加顺序可以变化。例如,在一些实施方案中,添加第一接头寡核苷酸和聚合酶,并且在添加第二接头寡核苷酸之前(至少部分地)进行第二链的合成。在另一种方法中,大约同时添加第一和第二接头寡核苷酸。例如,它们可以在相同的组合物中一起添加,或者可以在彼此相隔约1分钟内或彼此相隔约5分钟内单独添加。可以以任何顺序添加第一和第二延伸引物。
在使用不具有链置换活性的DNA聚合酶产生第二链同时使用具有链置换活性的DNA聚合酶产生该第二链的方法中可能需要按次序添加引物。
应当认识到,单个寡核苷酸可以用作用于产生第二链和用于测序的延伸引物。
将进一步认识到多个不同的引物和/或多个不同的测序寡核苷酸可用于相同的测序反应。
用于第二链的一种(或多种)测序寡核苷酸通常在使用本文公开的方法终止第二链的延伸-置换之后添加。
在一些实施方案中,第二链接头寡核苷酸用作与第二链的悬伸杂交的测序寡核苷酸。在一些实施方案中,测序寡核苷酸具有与第二链内的已知序列互补并因此与该已知序列杂交的序列。在一些实施方案中,测序寡核苷酸与第二链中的与DNA多联体中至少一部分衔接子互补的序列杂交。在一些实施方案中,测序寡核苷酸与第一链接头寡核苷酸部分或完全互补。
8.DNA聚合酶
本发明的方法可以使用分子生物学和MPS测序领域的普通技术人员公知的方法、工具和试剂进行,包括核酸聚合酶(RNA聚合酶、DNA聚合酶、逆转录酶)、磷酸酶和磷酸化酶、DNA连接酶等。特别地,某些引物延伸步骤可以使用一种或多种DNA聚合酶进行。使用具有链置换活性的DNA聚合酶进行某些延伸步骤。
在一些实施方案中,本文公开的方法使用一种或多种DNA聚合酶和一种(或多种)DNA聚合酶的链置换活性来生成与DNA模板互补的DNA链。在一种方法中,本发明使用具有强5'→3'链置换活性的DNA聚合酶。优选地,聚合酶不具有5'→3'外切核酸酶活性。然而,当活性不妨碍本发明方法的实施(例如,通过使用抑制核酸外切酶活性的反应条件)时,可以使用具有5'-3'核酸外切酶活性的DNA聚合酶。
术语“链置换活性”描述了聚合酶置换在合成期间遇到的下游DNA的能力。链置换活性在美国专利号20120115145(通过引用并入本文)中描述于如下:“链置换活性”指生物、化学或物理试剂(例如DNA聚合酶)导致配对核酸与其互补链按从5到3的方向解离的现象,其结合并接近于模板依赖性核酸合成。链置换从配对核酸序列的5'端处开始,因此酶在置换位点5'立即进行核酸合成。新合成的核酸和置换的核酸通常具有与模板核酸链互补的相同的核苷酸序列。链置换活性可以位于与赋予核酸合成(特别是DNA合成)活性的分子相同的分子上,或者它可以是单独且独立的活性。DNA聚合酶(例如大肠杆菌DNA聚合酶I、DNA聚合酶I的Klenow片段、T7或T5噬菌体DNA聚合酶和HIV病毒逆转录酶)是兼具聚合酶活性和链置换活性的酶。诸如解旋酶之类的试剂可以与不具有链置换活性的诱导剂结合使用以便产生链置换效应,也就是说,与合成相同序列的核酸偶联的核酸置换。同样,来自大肠杆菌或其他生物体的诸如Rec A或单链结合蛋白之类的蛋白质可与其他诱导剂结合用于产生或促进链置换(Kornberg和Baker,1992,DNA Replication,第二版,第113-225页,纽约州弗里曼)。
在一种方法中,聚合酶是Phi29聚合酶。Phi29聚合酶在中等温度(例如20-37℃)下具有很强的置换活性。
在一种方法中,使用Bst DNA聚合酶大片段(NEB#M0275)。BstDNA聚合酶在高温(~65℃)下具有活性。
在一种方法中,聚合酶是Deep-VentR DNA聚合酶(NEB#M0258)(Hommelsheim等人,ScientificReports 4:5052(2014))。
9.底物和隔间
在一些应用中,DNA模板多核苷酸被固定在底物上。通常,固定发生在上文讨论的第二链的合成之前。示例性底物可以是基本上平面的(例如,载玻片)或非平面的和单一的或由多个不同的单元(例如,珠子)形成。示例性材料包括玻璃、陶瓷、二氧化硅、硅、金属、弹性体(例如硅酮)、聚丙烯酰胺(例如聚丙烯酰胺水凝胶;参见WO 2005/065814)。在一些实施方案中,底物包含固定位点或孔的有序或无序阵列。在一些方法中,将靶标DNA多核苷酸固定在基本平面的底物(例如包含固定位点或孔的有序或无序阵列的底物)上。在一些方法中,靶标DNA多核苷酸被固定在珠子上。
可以通过多种技术将多核苷酸固定在底物上,包括共价和非共价附着。可以通过多种技术将多核苷酸固定到底物上。在一个实施方案中,表面可以包括与多核苷酸分子(例如衔接子寡核苷酸)的组分形成复合物(例如双链的双链体)的捕获探针。在另一个实施方案中,表面可以具有与多核苷酸分子上的互补官能团反应以形成共价键的反应性官能团。长DNA分子,例如几个核苷酸或更大,也可以有效地附着于疏水表面,例如具有低浓度的各种反应性官能团(例如—OH基团)的干净玻璃表面。在又一个实施方案中,多核苷酸分子可以通过与表面的非特异性相互作用或通过诸如氢键、范德华力等的非共价相互作用吸附到表面。
例如,DNA纳米球可以固定到离散的间隔开的区域,如Drmanac等人的美国专利号8,609,335中所述。在一种方法中,通过与固定的探针序列杂交将DNB固定在底物上,并且使用固相核酸扩增方法来产生包含DNA模板多核苷酸的克隆簇。参见例如WO 98/44151和WO00/18957。
在一些实施方案中,DNA模板多核苷酸在引物延伸步骤之前在乳液、液滴、珠子上和/或微孔中分隔(Margulies等人."Genome sequencing in microfabricated high-density picolitre reactors."Nature 437:7057(2005);Shendure等人.“Accuratemultiplex polony sequencing of an evolved bacterial genome”Science 309,1728–1732(2005))。
通常,DNA纳米球以有序或随机阵列排列在底物上。在许多应用中,对底物的吸附是通过底物-蛋白质-DNA相互作用介导的。此外,为了通过测序循环实现稳定的纳米球阵列,蛋白质层的附着后沉积可以改善DNA阵列的稳定性,参见WO2013066975A1,其全部公开内容通过引用并入本文。
10.DNA复合物的阵列
在一个方面,本发明包括DNA复合物的阵列。在一个方面,阵列是包含离散区域阵列的支撑物,其中多个区域包含(a)单链DNA模板的克隆簇和多个接头寡核苷酸,其中DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,其中每个接头寡核苷酸包含与DNA模板的衔接子序列互补并杂交的引物序列,其中引物序列包括可延伸的3'末端,并且其中与DNA模板杂交的多个接头寡核苷酸中的至少两个接头寡核苷酸彼此连接。
在一方面,本发明包括DNA复合物,其包含DNA模板、两个或更多个第二链,其中每个第二链包含悬伸区域和与DNA模板杂交的杂交区域,其中两个或更多个第二链与DNA模板互补,并且其中至少两个第二链在它们相应的5'端处连接。
在一些实施方案中,多个第二接头寡核苷酸用作引物延伸(例如,边合成边测序反应)的引物,或者是此类引物的延伸产物,或者是能够用作锚以进行连接测序的寡核苷酸,或者是此类寡核苷酸和标记的探针(例如,标记的cPAL探针)的连接产物。在一种方法中,第二接头寡核苷酸包含与衔接子序列互补的部分并且可以延伸以对第二链进行测序。
应当理解,阵列的DNA复合物可以包含本文所述的或根据本文所述的方法制备的复合物的任何性质。此外,复合物可以具有以下一种或多种特征的任意组合:(i)阵列包含至少106个离散区域,(ii)其中DNA是单链的,(iii)其中第二接头寡核苷酸包含衔接子序列的至少10个碱基,优选至少12个碱基,任选地至少15个碱基,以及(iv)第二接头寡核苷酸与其所杂交的第二DNA链完全互补。
10.组合物
在一个方面,本公开提供了一种组合物,其包含如上文第9节所述的阵列和选自DNA连接酶和DNA聚合酶的酶。在一些情况下,该组合物包含两种DNA聚合酶,一种具有链置换活性而一种没有链置换活性。在一些实施方案中,该组合物进一步包含荧光标记的dNTP(例如,dNTP类似物)和/或带标签的寡核苷酸探针池。
11.实施例
11.1实施例1:Z接头对RhoA[腺苷(“A”)碱基强度]下降、映射率和
错误率的影响
使用包含人类基因组DNA片段的单链环文库通过滚环扩增产生DNB。DNB被固定在DNB阵列芯片上,并使用BGIseq500进行测序。测序通过使用DNA聚合酶并添加可逆阻断的荧光终止子的边合成边测序的循环进行。在50℃至60℃的温度下发生掺入和去阻断。标准引物,例如,不包括订书机序列且不连接DNB的多个亚基的引物,或具有Seq 6(A-bB-A)构型的接头寡核苷酸,用作测序寡核苷酸。两个Seq 6接头寡核苷酸彼此杂交并形成Z接头。根据
Figure BDA0003618326700000341
-500软件提供的指示,从单个读数确定映射率和错误率。
测序寡核苷酸(1μM)与DNB杂交,并且SBS在20℃至57℃的温度下进行175个循环。在每个测序循环期间掺入用4种不同荧光染料标记的可逆终止核苷酸(RT)。此外,未标记的核苷酸被掺入每个测序循环中,以在每个测序循环期间进一步掺入每个DNB的每个亚基。成像后,在下一次掺入事件之前,用膦试剂去除3'阻断基团。
图3显示Z接头对多个测序循环(例如,超过175个循环)强度降低的影响。Y轴表示一个碱基组(A碱基)的强度测量值(称为“Rho”)。根据BGIseq500软件对Rho进行处理以指示分配到碱基组后DNB的平均强度。与泳道2(A L2)(即,使用Z接头测序的信号)相比,泳道1(AL1)(即,使用标准引物测序的信号)在170个测序循环内显示出下降得更快的强度值。不受任何理论的束缚,随着测序循环的进行,信号的下降可具有多种潜在原因,例如DNB剪切或DNB质量的结构损失、延伸链的损失、核苷酸的不可逆终止、DNB内的异相碱基读取。使用Z接头测序的信号下降较慢表明DNB损失较少。
稳定DNB的结构可以帮助保持DNB强度远高于背景,这导致更低的错误率和更高的映射率。图4A显示,对于前66个碱基,具有接头寡核苷酸的流动池泳道具有比具有标准引物的泳道(81.2%)略高的映射率(82%)。对于后66个碱基,使用接头寡核苷酸测序的映射率为82%,其显著高于使用标准引物测序显示的72%映射率。
如图4B所示,Z接头寡核苷酸的错误率通常低于标准引物。
例如,对于后66个碱基,当包括接头寡核苷酸时,错误率约为一半——其中接头寡核苷酸的错误率为0.57%,而标准引物的错误率为1.17%。
11.2实施例2:另一Z接头对映射率和错误率的影响
如实施例1中所述产生DNB并进行测序,不同之处在于,接头寡核苷酸是Seq3(bB-A),其包含回文订书机序列bB和引物序列A。两个接头寡核苷酸3的杂交形成Z接头。
测定了读数的第一链50个碱基和读数的第二链50个碱基的映射和不一致。如图5A所示,对于第一链50个碱基,带有Z接头订书机序列的流通池泳道的映射率(94%)略高于带有标准引物的泳道(93%)。对于第二链50个碱基,用Z接头的测序反应的映射率为91%,其显著高于用标准引物的测序反应的83%映射率。
如图5B所示,使用Z接头的测序反应的错误率通常低于使用标准引物的错误率。例如,对于第二链50个碱基,用Z接头的测序反应的错误率为0.31%,是用标准引物的测序反应的错误率(约为0.63%)的仅一半。
本发明的说明性实施方案
以下是本发明的非限制性实施方案。
实施方案1.一种制备用于核酸分析的DNA模板的方法,该方法包含将多个第一链接头寡核苷酸与DNA模板杂交,
其中DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,
其中每个第一链接头寡核苷酸包含模板杂交序列,其中模板杂交序列与DNA模板的衔接子序列互补并杂交,并且
其中与DNA模板杂交的多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
实施方案2.如实施方案1所述的方法,其中模板杂交序列是引物序列,并且其中引物序列包括可延伸的3'末端。
实施方案3.如实施方案1所述的方法,其中该方法进一步包含延伸至少两个第一链接头寡核苷酸以通过一种或多种DNA聚合酶生成至少两个第二链,
其中至少两个第一链接头寡核苷酸彼此连接并且与DNA模板杂交,
由此产生至少两个第二链,每个链具有5'末端,其中两个第二链的5'末端连接。
实施方案4.如实施方案1、2或3所述的方法,其中至少两个第一链接头寡核苷酸通过DNA杂交、共价键或两者连接。
实施方案5.如实施方案1、2或3所述的方法,其中至少两个第一链接头寡核苷酸各自包含订书机序列,其中至少两个第一链接头寡核苷酸通过相应的订书机序列的杂交而连接。
实施方案6.如实施方案1-3中任一项所述的方法,其中至少两个第一链接头寡核苷酸通过共享支架连接。
实施方案7.如实施方案5所述的方法,其中第一链接头寡核苷酸中的至少一个包含在订书机序列侧翼的两个切割位点,其中在切割位点处切割释放订书机序列。
实施方案8.如实施方案5所述的方法,其中至少两个第一链接头寡核苷酸的订书机序列与共享支架的不同区域杂交,由此连接至少两个第一链接头寡核苷酸。
实施方案9.如实施方案5所述的方法,其中至少两个第一链接头寡核苷酸在它们经由相应的订书机序列彼此结合之前结合至DNA模板。
实施方案10.如实施方案9所述的方法,其中该方法包含:
1)在反应中将阻断剂寡核苷酸与至少两个第一链接头寡核苷酸的订书机序列杂交,由此形成部分双链的第一链接头寡核苷酸,
其中每个部分双链的第一链接头寡核苷酸包含i)由阻断剂寡核苷酸和订书机序列组成的双链区域,由此防止第一链接头寡核苷酸的订书机序列彼此杂交,和ii)包含作为模板杂交序列的序列的单链区域,
2)向与第一链接头寡核苷酸的反应中加入DNA模板,其中部分双链的第一链接头寡核苷酸的引物序列与DNA模板结合,
3)通过以下一项或多项去除阻断剂寡核苷酸:升高反应温使得阻断剂寡核苷酸与DNA模板解离,使阻断剂寡核苷酸酶促或化学降解,
4)洗涤以去除阻断剂寡核苷酸,以及
5)调节温度以允许第一链接头寡核苷酸的订书机序列彼此杂交。
实施方案11.如实施方案5所述的方法,其中在引物序列与DNA模板结合之前,至少两个第一链接头寡核苷酸的订书机序列彼此结合以形成连接的第一链接头寡核苷酸。
实施方案12.如实施方案11所述的方法,其中该方法包含使用浓度低于预定阈值的连接的第一链接头寡核苷酸,使得两个第一链接头寡核苷酸与单个DNA模板分子结合。
实施方案13.如实施方案5所述的方法,其中订书机序列是回文订书机序列,并且
其中对于至少两个第一链接头寡核苷酸中的每一个,回文订书机序列在模板杂交序列的5'端。
实施方案14.如实施方案5所述的方法,其中至少两个第一链接头寡核苷酸包含两个互补的非回文订书机序列,每个第一链接头寡核苷酸上有一个;并且
其中至少两个第一链接头寡核苷酸通过两个互补的非回文订书机序列的杂交而连接。
实施方案15.如实施方案5所述的方法,其中至少两个第一链接头寡核苷酸各自包含非回文订书机序列和回文订书机序列。
实施方案16.如实施方案15所述的方法,其中对于至少两个第一链接头寡核苷酸中的每一个,回文订书机序列***在非回文订书机序列和模板杂交序列之间。
实施方案17.如实施方案5所述的方法,其中至少两个第一链接头寡核苷酸各自包含***两个引物序列之间的订书机序列,其中至少两个第一链接头寡核苷酸上的订书机序列彼此杂交。
实施方案18.如实施方案5所述的方法,其中订书机序列具有范围在8和50个核苷酸之间的长度。
实施方案19.如实施方案5所述的方法,其中模板杂交序列具有范围从15到70个核苷酸的长度。
实施方案20.一种制备用于核酸分析的DNA模板的方法,该方法包含将多个第一链接头寡核苷酸与反应混合物中的DNA模板杂交,
其中DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,
其中每个第一链接头寡核苷酸包含与DNA模板的衔接子序列互补并杂交的引物序列,
其中至少一个第一链接头寡核苷酸在引物序列的3'端包含阻断基团以防止延伸,并且
其中与DNA模板杂交的多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
实施方案21.如实施方案20所述的方法,其中阻断基团是可逆阻断基团,其中该方法进一步包含:
从至少一个第一链接头寡核苷酸去除阻断基团,以及
延伸至少一个第一链接头寡核苷酸以生成至少一个第二链。
实施方案22.如实施方案5所述的方法,其中第一链接头寡核苷酸可以在位于订书机序列或模板杂交序列中的位点处进行切割。
实施方案23.如实施方案20所述的方法,其中该方法进一步包含从来自DNA模板的反应混合物中去除未结合的第一链接头寡核苷酸。
实施方案24.如实施方案1所述的方法,其中该方法进一步包含
1)通过非置换DNA聚合酶延伸多个第一链接头寡核苷酸中的至少两个以生成与DNA模板完全杂交的至少两个部分延伸的第二链,
其中至少两个完全杂交的第二链包括上游第二链和下游第二链,并且
2)将部分延伸的上游第二链和下游第二链进一步延伸,其中将部分延伸的上游第二链延伸是部分地置换部分延伸的下游第二链,由此产生部分杂交的下游第二链。
实施方案25.一种DNA复合物,其包含DNA模板和多个第一链接头寡核苷酸,其中DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,
其中每个第一链接头寡核苷酸包含模板杂交序列,
其中模板杂交序列与DNA模板的衔接子序列互补并杂交,并且
其中与DNA模板杂交的多个第一链接头寡核苷酸中的至少两个彼此连接。
实施方案26.如实施方案25所述的DNA复合物,其中模板杂交序列是引物序列,并且其中引物序列包括可延伸的3'末端。
实施方案27.一种DNA复合物,其包含DNA模板、两个或更多个第二链,其中每个第二链包含悬伸区域和与DNA模板杂交的杂交区域,
其中两个或更多个第二链与DNA模板互补,并且
其中至少两个第二链的5'末端连接。
实施方案28.如实施方案27所述的DNA复合物,其中DNA复合物进一步包含与两个或更多个第二链杂交的两个或更多个第二链接头寡核苷酸,
包含第二订书机序列的每个第二链接头寡核苷酸和至少两个第二链接头寡核苷酸通过相应的第二订书机序列的杂交而连接。
实施方案29.包含如实施方案25-28中任一项所述的DNA复合物的DNA阵列。
实施方案30.两个接头寡核苷酸,每个接头寡核苷酸包含订书机序列和引物序列,并且订书机序列在引物序列的5'端,
其中两个接头寡核苷酸中的订书机序列彼此互补并彼此杂交,从而得到彼此杂交的两个接头寡核苷酸。
实施方案31.如实施方案30所述的两个接头寡核苷酸,其中订书机序列是回文序列。
实施方案32.如实施方案30的两个接头寡核苷酸,其中两个接头寡核苷酸上的引物序列具有相同的序列。
实施方案33.如实施方案30所述的两个接头寡核苷酸,其中每个寡核苷酸包含作为非回文订书机序列的额外订书机序列,并且其中额外非回文订书机序列在订书机序列的5'端。
实施方案34.如实施方案33所述的两个接头寡核苷酸,其中两个接头寡核苷酸之一中的额外非回文订书机序列与第三接头寡核苷酸中的订书机序列杂交。
实施方案35.如实施方案30所述的两个接头寡核苷酸,其中至少一个包含选自由SEQ ID NO:1-10组成的群组的序列。
实施方案36.一种制备用于核酸分析的DNA模板的方法,该方法包含将DNA模板固定在阵列上,其中DNA模板是包含多个单体的DNA多联体,其中每个单体包含衔接子序列和DNA靶标序列,
将多个第一链接头寡核苷酸与DNA模板杂交,其中每个第一链接头寡核苷酸包含模板杂交序列,
其中模板杂交序列与DNA模板的衔接子序列互补并杂交,并且其中与DNA模板杂交的多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
实施方案37.如实施方案36所述的方法,其中模板杂交序列是引物序列,并且其中引物序列包括可延伸的3'末端。
***
本文引用的所有出版物和专利文件通过引用并入本文,就好像每个此类出版物或文件被具体和单独地指示通过引用并入本文一样。尽管主要参考具体实施方案描述了本发明,但还可以设想到的是,其他实施方案在阅读本公开后对于本领域技术人员将变得显而易见,并且其旨在将此类实施方案包含在本发明的方法中。
序列表
<110> 深圳华大智造科技股份有限公司
<120> DNA接头寡核苷酸
<130> 092171-1215354 (5078-WOCN)
<140>
<141>
<150> 62/927,060
<151> 2019-10-28
<160> 10
<170> PatentIn版本3.5
<210> 1
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<223> 组合DNA/RNA分子的描述:合成的寡核苷酸
<400> 1
ggaaccatgg ttccaagtcg gaggccaagc ggtctuagga 40
<210> 2
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 2
aagtcggagg ccaagcggtc t 21
<210> 3
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 3
aggaggaacc atggttccaa gtcggaggcc aagcggtct 39
<210> 4
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 4
cgccgacgca cagggtgcct cgaccgcatg gcgcggaacc atggttccgc gccaactcct 60
tggctcacag aacgacatgg ctacgatccg actt 94
<210> 5
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 5
catgcggtcg aggcaccctg tgcgtcggcg ggctgcatgc cggcatgcag cccaactcct 60
tggctcacag aacgacatgg ctacgatccg actt 94
<210> 6
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 6
gtctccagtc gaagcccgat cggaaccatg gttccgtctc cagtcgaagc ccgatc 56
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 7
gtctccagtc gaagcccgat c 21
<210> 8
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 8
ggaaccatgg ttcc 14
<210> 9
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 9
gtctccagtc gaagcccgat c 21
<210> 10
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<223> 组合DNA/RNA分子的描述:合成的寡核苷酸
<400> 10
aagtcggagg ccaagcggtc tuagga 26

Claims (37)

1.一种制备用于核酸分析的DNA模板的方法,所述方法包括将多个第一链接头寡核苷酸与所述DNA模板杂交,
其中所述DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,
其中每个第一链接头寡核苷酸包含模板杂交序列,其中所述模板杂交序列与所述DNA模板的衔接子序列互补并杂交,并且
其中与所述DNA模板杂交的所述多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
2.如权利要求1所述的方法,其中所述模板杂交序列是引物序列,并且其中所述引物序列包括可延伸的3'末端。
3.如权利要求1所述的方法,其中所述方法进一步包括通过一种或多种DNA聚合酶延伸所述至少两个第一链接头寡核苷酸以生成至少两个第二链,
其中所述至少两个第一链接头寡核苷酸彼此连接并且与所述DNA模板杂交,
由此产生至少两个第二链,每个链具有5'末端,其中两个第二链的5'末端连接。
4.如权利要求1、2或3所述的方法,其中所述至少两个第一链接头寡核苷酸通过DNA杂交、共价键或两者连接。
5.如权利要求1、2或3所述的方法,其中所述至少两个第一链接头寡核苷酸各自包含订书机序列,其中所述至少两个第一链接头寡核苷酸通过相应的订书机序列的杂交而连接。
6.如权利要求1-3中任一项所述的方法,其中所述至少两个第一链接头寡核苷酸通过共享支架连接。
7.如权利要求5所述的方法,其中所述第一链接头寡核苷酸中的至少一个包含位于所述订书机序列侧翼的两个切割位点,其中在所述切割位点处切割释放所述订书机序列。
8.如权利要求5所述的方法,其中所述至少两个第一链接头寡核苷酸的所述订书机序列与共享支架的不同区域杂交,由此连接所述至少两个第一链接头寡核苷酸。
9.如权利要求5所述的方法,其中所述至少两个第一链接头寡核苷酸在它们经由所述相应的订书机序列彼此结合之前与所述DNA模板结合。
10.如权利要求9所述的方法,其中所述方法包含:
1)在反应中将阻断剂寡核苷酸与所述至少两个第一链接头寡核苷酸的所述订书机序列杂交,由此形成部分双链的第一链接头寡核苷酸,
其中所述部分双链的第一链接头寡核苷酸中的每个包含i)双链区域,所述双链区域由所述阻断剂寡核苷酸和所述订书机序列组成,由此防止所述第一链接头寡核苷酸的订书机序列彼此杂交,以及ii)包含作为模板杂交序列的序列的单链区域,
2)向与所述第一链接头寡核苷酸的所述反应中加入DNA模板,其中所述部分双链的第一链接头寡核苷酸的所述引物序列与所述DNA模板结合,
3)通过以下一项或多项去除所述阻断剂寡核苷酸:升高所述反应的温度使得所述阻断剂寡核苷酸与所述DNA模板解离,使所述阻断剂寡核苷酸酶促或化学降解,
4)洗涤以去除所述阻断剂寡核苷酸,以及
5)调节所述温度以允许所述第一链接头寡核苷酸的所述订书机序列彼此杂交。
11.如权利要求5所述的方法,其中在所述引物序列与所述DNA模板结合之前,所述至少两个第一链接头寡核苷酸的所述订书机序列彼此结合以形成连接的第一链接头寡核苷酸。
12.如权利要求11所述的方法,其中所述方法包含使用浓度低于预定阈值的所述连接的第一链接头寡核苷酸,使得所述两个第一链接头寡核苷酸与单个DNA模板分子结合。
13.如权利要求5所述的方法,其中所述订书机序列是回文订书机序列,并且
其中对于所述至少两个第一链接头寡核苷酸中的每一个,所述回文订书机序列在所述模板杂交序列的5'端。
14.如权利要求5所述的方法,其中所述至少两个第一链接头寡核苷酸包含两个互补的非回文订书机序列,每个第一链接头寡核苷酸上有一个;并且
其中至少两个第一链接头寡核苷酸通过所述两个互补的非回文订书机序列的杂交而连接。
15.如权利要求5所述的方法,其中所述至少两个第一链接头寡核苷酸各自包含非回文订书机序列和回文订书机序列。
16.如权利要求15所述的方法,其中对于所述至少两个第一链接头寡核苷酸中的每一个,所述回文订书机序列***在所述非回文订书机序列和所述模板杂交序列之间。
17.如权利要求5所述的方法,其中所述至少两个第一链接头寡核苷酸各自包含***两个引物序列之间的订书机序列,其中所述至少两个第一链接头寡核苷酸上的订书机序列彼此杂交。
18.如权利要求5所述的方法,其中所述订书机序列具有范围在8到50个核苷酸之间的长度。
19.如权利要求5所述的方法,其中所述模板杂交序列具有范围从15到70个核苷酸的长度。
20.一种制备用于核酸分析的DNA模板的方法,所述方法包括将多个第一链接头寡核苷酸与反应混合物中的所述DNA模板杂交,
其中所述DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,
其中每个第一链接头寡核苷酸包含与所述DNA模板的衔接子序列互补并杂交的引物序列,
其中至少一个第一链接头寡核苷酸在所述引物序列的3'端包含阻断基团以防止延伸,并且
其中与所述DNA模板杂交的所述多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
21.如权利要求20所述的方法,其中所述阻断基团是可逆阻断基团,其中所述方法进一步包含:
从所述至少一个第一链接头寡核苷酸去除所述阻断基团,以及
延伸所述至少一个第一链接头寡核苷酸以生成至少一个第二链。
22.如权利要求5所述的方法,其中所述第一链接头寡核苷酸能够在位于所述订书机序列或所述模板杂交序列中的位点处进行切割。
23.如权利要求20所述的方法,其中所述方法进一步包含从所述DNA模板的所述反应混合物中去除未结合的第一链接头寡核苷酸。
24.如权利要求1所述的方法,其中所述方法进一步包含:
1)通过非置换DNA聚合酶延伸所述多个第一链接头寡核苷酸中的至少两个以生成与所述DNA模板完全杂交的至少两个部分延伸的第二链,
其中所述至少两个完全杂交的第二链包括上游第二链和下游第二链,以及
2)使部分延伸的上游第二链和下游第二链进一步延伸,其中使所述部分延伸的上游第二链延伸是部分地置换所述部分延伸的下游第二链,由此产生部分杂交的下游第二链。
25.一种DNA复合物,其包含DNA模板和多个第一链接头寡核苷酸,其中所述DNA模板是包含多个单体的单链多联体,其中每个单体包含衔接子序列和DNA靶标序列,
其中每个第一链接头寡核苷酸包含模板杂交序列,
其中所述模板杂交序列与所述DNA模板的衔接子序列互补并杂交,并且
其中与所述DNA模板杂交的所述多个第一链接头寡核苷酸中的至少两个彼此连接。
26.如权利要求25所述的DNA复合物,其中所述模板杂交序列是引物序列,并且其中所述引物序列包括可延伸的3'末端。
27.一种DNA复合物,其包含DNA模板、两个或更多个第二链,其中每个第二链包含悬伸区域和与所述DNA模板杂交的杂交区域,
其中所述两个或更多个第二链与所述DNA模板互补,并且
其中所述至少两个第二链的5'末端连接。
28.如权利要求27所述的DNA复合物,其中所述DNA复合物进一步包含与两个或更多个第二链杂交的两个或更多个第二链接头寡核苷酸,
包含第二订书机序列的每个第二链接头寡核苷酸和至少两个第二链接头寡核苷酸通过相应的第二订书机序列的杂交而连接。
29.一种DNA阵列,其包含如权利要求25-28中任一项所述的DNA复合物。
30.两个接头寡核苷酸,每个接头寡核苷酸包含一个订书机序列和一个引物序列,并且所述订书机序列在所述引物序列的5'端,
其中所述两个接头寡核苷酸中的所述订书机序列彼此互补并彼此杂交,从而得到彼此杂交的两个接头寡核苷酸。
31.如权利要求30所述的两个接头寡核苷酸,其中所述订书机序列是回文序列。
32.如权利要求30所述的两个接头寡核苷酸,其中两个接头寡核苷酸上的所述引物序列具有相同的序列。
33.如权利要求30所述的两个接头寡核苷酸,其中每个寡核苷酸包含为非回文订书机序列的额外订书机序列,并且其中额外非回文订书机序列在所述订书机序列的5'端。
34.如权利要求33所述的两个接头寡核苷酸,其中所述两个接头寡核苷酸之一中的所述额外非回文订书机序列与第三接头寡核苷酸中的订书机序列杂交。
35.如权利要求30所述的两个接头寡核苷酸,其中至少一个包含选自由SEQ ID NO:1-10组成的群组的序列。
36.一种制备用于核酸分析的DNA模板的方法,所述方法包含将所述DNA模板固定在阵列上,其中所述DNA模板是包含多个单体的DNA多联体,其中每个单体包含衔接子序列和DNA靶标序列,
将多个第一链接头寡核苷酸与所述DNA模板杂交,其中每个第一链接头寡核苷酸包含模板杂交序列,
其中所述模板杂交序列与所述DNA模板的衔接子序列互补并杂交,并且其中与所述DNA模板杂交的所述多个第一链接头寡核苷酸中的至少两个第一链接头寡核苷酸彼此连接。
37.如权利要求36所述的方法,其中所述模板杂交序列是引物序列,并且其中所述引物序列包括可延伸的3'末端。
CN202080075206.4A 2019-10-28 2020-10-28 Dna接头寡核苷酸 Pending CN114641581A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962927060P 2019-10-28 2019-10-28
US62/927,060 2019-10-28
PCT/CN2020/124338 WO2021083195A1 (en) 2019-10-28 2020-10-28 Dna linker oligonucleotides

Publications (1)

Publication Number Publication Date
CN114641581A true CN114641581A (zh) 2022-06-17

Family

ID=75714576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080075206.4A Pending CN114641581A (zh) 2019-10-28 2020-10-28 Dna接头寡核苷酸

Country Status (2)

Country Link
CN (1) CN114641581A (zh)
WO (1) WO2021083195A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101580829B (zh) * 2009-02-27 2011-05-18 深圳大学 一种基因定点多位点突变的方法
CA2950295C (en) * 2014-06-06 2023-10-17 Cornell University Method for identification and enumeration of nucleic acid sequence, expression, copy, or dna methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions
US10227647B2 (en) * 2015-02-17 2019-03-12 Complete Genomics, Inc. DNA sequencing using controlled strand displacement
EP4239079A3 (en) * 2016-02-17 2023-10-04 President And Fellows Of Harvard College Molecular programming tools
CN108070642B (zh) * 2016-11-17 2020-10-27 深圳华大智造科技股份有限公司 提高dnb双末端测序质量的方法和dnb双末端测序方法和试剂盒

Also Published As

Publication number Publication date
WO2021083195A1 (en) 2021-05-06

Similar Documents

Publication Publication Date Title
US10876158B2 (en) Method for sequencing a polynucleotide template
US11319588B2 (en) DNA sequencing using controlled strand displacement
EP3564394B1 (en) Method of preparing libraries of template polynucleotides
EP2191011B1 (en) Method for sequencing a polynucleotide template
US20100167954A1 (en) Method of library preparation avoiding the formation of adaptor dimers
KR20140065448A (ko) 핵산 전사 방법
WO2021128441A1 (en) Controlled strand-displacement for paired-end sequencing
WO2021083195A1 (en) Dna linker oligonucleotides
CN107937389B (zh) 阵列上连接组装
CA3220708A1 (en) Oligo-modified nucleotide analogues for nucleic acid preparation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination