CN115516104A - 用于对双链核酸进行测序的方法和组合物 - Google Patents

用于对双链核酸进行测序的方法和组合物 Download PDF

Info

Publication number
CN115516104A
CN115516104A CN202180032682.2A CN202180032682A CN115516104A CN 115516104 A CN115516104 A CN 115516104A CN 202180032682 A CN202180032682 A CN 202180032682A CN 115516104 A CN115516104 A CN 115516104A
Authority
CN
China
Prior art keywords
primer
primers
strand
composition
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180032682.2A
Other languages
English (en)
Inventor
库尔特·帕特森
哈里·K·K·苏布拉马尼安
布列塔尼·A·罗曼
法比安·布洛克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pacific Biosciences of California Inc
Original Assignee
Pacific Biosciences of California Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pacific Biosciences of California Inc filed Critical Pacific Biosciences of California Inc
Publication of CN115516104A publication Critical patent/CN115516104A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种用于从核酸的有义链和反义链确定序列的方法,包括(a)提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和反义链,串联体包含序列单元的多于一个拷贝,序列单元包含靶序列和引物结合位点;(b)将引物与反义链中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)将第二引物与有义链中的引物结合位点杂交;以及(e)沿着有义链延伸第二引物以从有义链中靶序列的至少一部分确定序列。

Description

用于对双链核酸进行测序的方法和组合物
相关申请
本申请要求于2020年3月3日提交的美国临时申请第62/984,438号的优先权,其内容通过引用以其整体并入本文。
对序列表的引用
本申请包含电子格式的序列表。序列表被提供为题为Sequence_Listing_42HB-328033-WO的文件,该文件创建于2021年2月26日,大小是3千字节。电子格式的序列表的信息通过引用以其整体并入本文。
背景
本公开内容总体涉及从核酸获得序列信息并且对核酸的双链或配对末端测序具有特定的适用性。
许多核酸测序方法涉及引物沿靶核酸模板的延伸。可以通过以模板依赖性方式连续掺入核苷酸来延伸引物(通常使用聚合酶),并且观察掺入的核苷酸的身份和顺序以确定靶核酸的序列。当进行核酸测序时,经常需要对靶核酸的多于一个区域进行测序。例如,在相反的方向上对靶核酸的相反链进行测序可以提供信息。这种双链测序可以提供增加可从给定靶核酸获得的序列信息总量的优点,特别是当靶的长度超过通常可以从所采用的测序方法获得的读段长度时。在测序方法的读段长度与模板长度具有同一数量级的情况中,双向测序可以提供优点,诸如,通过将“有义”链读段与相应的“反义”读段进行比较而得到的序列信息的独立验证。已经提出了各种双链或配对末端测序方法,但与单链测序方法相比,这些方法增加了时间和费用。例如,合成互补链和/或去除两个测序读段之间的链的要求可能是麻烦的、耗时的和昂贵的,并且如果用于第二读段测序的链是从已进行测序的链产生的,则可能会在序列结果中引入错误。
因此,对于对靶核酸的多于一个区域进行测序的有效方法存在需求。本发明满足了这种需要并且还提供了相关的优点。
简要概述
本公开内容提供了一种用于从核酸的有义链和反义链确定序列的方法。所述方法可以包括以下步骤:(a)提供附接到固体支持物的核酸簇,其中所述核酸簇包含串联体的有义链和串联体的反义链,其中所述串联体包含串联连接的序列单元的多于一个拷贝,其中所述序列单元包含靶序列和引物结合位点;(b)将引物与所述簇中所述反义链的序列单元中的引物结合位点杂交;(c)沿着所述反义链延伸所述引物以从所述反义链中所述靶序列的至少一部分确定序列;(d)将第二引物与所述有义链的序列单元中的引物结合位点杂交;和(e)沿着所述有义链延伸所述第二引物以从所述有义链中的所述靶序列的至少一部分确定序列。任选地,在步骤(c)之后和步骤(d)之前,可以在沿着反义链延伸的引物中掺入加帽部分或封闭部分,使得该引物在步骤(e)期间当第二引物沿着有义链延伸时不会进一步延伸。
本文还提供了一种组合物,所述组合物包含固体支持物,所述固体支持物附接有核酸簇,所述核酸簇包含串联体的有义链和所述串联体的反义链,其中所述串联体包含串联连接的序列单元的多于一个拷贝,其中所述序列单元包含靶序列和引物结合位点,任选地其中所述有义链共价附接到所述固体支持物,并且任选地其中所述反义链共价附接到所述固体支持物。
附图简述
图1A示出了用于产生与固定的核酸引物(例如,捕获引物)杂交的环状模板核酸的方法的示意图。图1B示出了通过滚环扩增沿着环状模板核酸延伸固定的引物以产生具有固定的单串联体链的簇的示意图。图1C示出了沿着串联体的固定的有义链延伸多于一个引物(例如,扩增引物)以产生具有与串联体的多于一条反义链杂交的固定的有义链的簇的示意图。图1D示出了通过滚环扩增沿着环状模板核酸延伸固定的引物(例如,捕获引物)以产生串联体的固定的有义链,以及在同一反应中沿着固定的有义链延伸多于一个引物(例如,捕获引物)以产生具有与多于一条反义链杂交的固定的有义链的簇的示意图。本公开内容的引物(诸如,捕获引物或扩增引物)可以是任何核酸,诸如RNA、DNA、DNA/RNA嵌合物、能够与另一核酸杂交的其他分子(例如,模板核酸、有义链或反义链)。图1E示出了沿着串联体的固定的有义链延伸多于一个引物(例如,扩增引物)以产生具有与串联体的多于一条反义链杂交的固定的有义链的簇的示意图,其中多于一条反义链中的一条、一条或更多条或每条包含一个或更多个可以标记反义链或靶向反义链以进行降解的核苷酸或碱基。例如,反义链可以包含一个或更多个为尿苷单磷酸的核苷酸。作为另一个实例,反义链可以包含一个或更多个为脱氧核糖假尿苷单磷酸的核苷酸。例如,反义链可以包含一个或更多个为尿嘧啶的碱基。作为另一个实例,反义链可以包含一个或更多个修饰的碱基或一个或更多个修饰的核苷酸。作为另一实例,反义链可以包含一个或更多个为非典型碱基的碱基或一个或更多个非典型核苷酸。
图2A示出了用于处理核酸簇以对第二链(例如,反义链)的3’末端进行封闭或加帽,以及然后对簇中的第二链进行测序的方法的示意图。图2B示出了用于在对簇中的第二链(例如,反义链)测序后处理核酸簇以对引物延伸产物的3’末端进行封闭或加帽,以及然后在簇中存在第二链的情况下对第一链(例如,有义链)测序的方法的示意图。图2C示出了用于在对簇中的第二链测序之后处理核酸簇以去除第二链(例如,反义链)和引物延伸产物,以及然后在簇中不存在第二链和引物延伸产物的情况下对第一链(例如,有义链)测序的方法的示意图。图2D示出了用于在对簇中的第二链测序之后处理核酸簇以消化第二链(例如,反义链)和引物延伸产物,以及然后在簇中不存在第二链和引物延伸产物的情况下对第一链(例如,有义链)测序的方法的示意图。
图3A-图3F示出了用于从核酸的第一链和第二链(例如,有义链和反义链)确定序列的方法的非限制性示例性说明。图3A示出了聚类以生成第一链。图3B示出了对第一链测序。图3C示出了测序引物的延伸产物用链置换聚合酶进一步延伸。图3D示出了来自对第一链测序的延伸产物的进一步延伸产生第二链鳞片(scales)。图3E示出了封闭第二链的3’末端。图3F示出了对第二链鳞片进行引发和测序。在图3A-图3F中,第一链以虚线说明,并且第二链以实线说明。
图4A-图4F示出了用于从核酸的有义链和反义链确定序列的方法的非限制性示例性说明。图4A示出了附接到表面的两个表面引物。图4B示出了文库在夹板(splint)上杂交并被连接。图4C示出了聚合酶在第一链上进行RCA。图4D示出了与第一链杂交的第二表面引物。图4E示出了通过聚合酶在同一RCA反应中发生的鳞片形成(scaling)(为了简单起见没有显示)。RCA和MDA可以同时进行或顺序进行。例如,在RCA期间扩增引物的3’末端可包含加帽部分,使得RCA和MDA顺序发生。图4F示出了用测序引物引发置换的鳞片。
图5示出了聚集的提取信号强度,这些信号强度从对来自阵列中的多于一个核酸位点处的两条链中的每一个的25个核苷酸进行测序获得。
图6示出了聚集的提取信号强度,这些信号强度从对来自阵列中的多于一个核酸位点处的两条链中的每一个的100个核苷酸进行测序获得。
图7示出了片段长度的分布,该片段长度从对来自阵列中多于一个核酸位点处的两条链中的每一个的100个核苷酸进行测序的配对末端读段确定。对100个核苷酸进行测序的聚集的提取信号强度在图6中说明。
图8A-图8B示出了本公开内容的用附接到固体支持物的捕获引物和扩增引物使用RCA和MDA进行的测序方法不偏好于特定尺寸的靶序列,并且可以产生高质量的读段。
图9A示出了对使用滚环扩增和附接到固体支持物的捕获引物从核酸模板产生的第一链进行测序的高质量的信号密度。图9B示出了对使用多重置换扩增和附接到固体支持物的扩增引物从第一链产生的第二链进行测序的高质量信号密度,其中第一链使用滚动环扩增和附接到固体支持物的捕获引物从核酸模板产生。
详细描述
已开发了多种方法来确定核酸模板的两个不同部分的序列。在许多情况下,这些方法被配置为确定核酸模板相对末端的序列,并且因此被称为“配对末端”测序。通常,通过沿着核酸模板的第一链延伸第一引物来确定第一末端的序列,以及然后通过沿着核酸模板的第二链延伸第二引物来确定第二末端的序列。由于核苷酸在一条链上的方向与它们在另一条链上的方向相反(这两条链被称为“反平行”),第一引物和第二引物在相反的方向上并朝向彼此延伸。尤其是,因为这种方向,其他配对末端测序方法要求在不存在其他链的情况下对每一条链进行测序。因此,配对末端方法通常需要在两个测序读段之间去除链或合成链的步骤。本公开内容提供了在存在靶核酸的反义链的情况下对靶核酸的有义链进行测序的方法。图2A-图2B说明了在存在靶核酸的反义链的情况下对靶核酸的有义链进行测序的非限制性示例性方法。
本文的方法和组合物涉及串联体文库模板的配对读段测序。引物被退火到串联体并延伸(通常使用链置换聚合酶),以产生具有连续的串联体链的多聚的、部分双链的分子和一系列不同的延伸产物,这些产物在其3’末端被退火到串联体链。它们的5’末端是单链的并且暴露用于测序,例如使用与它们复制的串联体重复中的保守区域退火的引物。在对这些模板进行测序后,它们任选地被去除或降解,从而使多聚的、部分双链的分子暴露并且可以使用与例如串联体重复中的保守区域退火的引物进行测序。在替代实施方案中,在产生该系列不同的延伸产物之前对串联体重复链进行测序。类似地,在又另外的实施方案中,与产生该系列不同的延伸产物同时对串联体重复链进行测序,使得延伸产物是测序的结果。
在本文的组合物和方法的更详细描述中,从线性核酸,诸如具有不同的5’和3’衔接子的文库组成部分开始。将线性核酸退火到具有与线性核酸的不同的5’和3’衔接子互补的区域的引导寡核苷酸,诸如表面结合的寡核苷酸,并定向为使线性核酸的5’和3’末端定位在紧密接近的位置。参见图1A。连接线性核酸的5’末端和3’末端以使线性核酸环化。
然后,通过滚环扩增对引导寡核苷酸进行延伸反应,以便在其3’末端添加原始线性核酸的多于一个单体单元。结果是原始线性核酸的多聚体的串联体通过引导寡核苷酸被拴系到表面,如图1B中所见。该反应可以通过聚合酶的热失活或通过单独或与化学失活组合的洗涤来终止。
本文的方法和组合物涉及本文中的一个或更多个步骤,使得本文公开内容的实践可以包括本文公开的一些或全部步骤。一些方法在本文所述的过程的中途有效地“开始”。因此,例如,在图1D,人们看到的过程始于具有相邻的第一和第二衔接子区域的环化文库组成部分,而不是具有5’和3’衔接子的线性核酸。人们看到,随后步骤的过程仍然非常相似。
多于一个置换扩增寡核苷酸与串联体接触并延伸,从而形成一系列不同的延伸产物,这些产物在其3’末端退火到串联体链,如图1C中所见。在一些实施方案中,这些延伸反应也是测序反应,如参考图3B-图3D所描述的。可选地,在一些情况下,这些延伸反应在没有测序的情况下进行,从而通过避免在成像过程或测序反应的其他步骤中经常发生的核酸损伤来保持模板和延伸链的完整性。寡核苷酸以溶液提供,或者可选地被栓系到表面。在寡核苷酸被栓系到表面的情况下,结果是栓系有多于一个串联体核酸分子的表面,其中串联体核酸分子包含多于一个单体单元,并且其中核酸分子局部地、部分地杂交以形成与置换的单链区段相邻的局部双链区段。例如,一条有义链可以局部地、部分地与多条反义链杂交。在一些实施方案中,在反义链局部地、部分地与有义链杂交时对反义链进行测序,和/或在有义链局部地、部分地与反义链杂交时对有义链进行测序。可选地或另外地,通过例如热变性将反义链和有义链分开,使得当对反义链(或有义链)测序时,反义链和有义链没有局部地、部分地杂交。
由MDA寡核苷酸引发的延伸反应任选地例如通过引入3’封闭的核苷酸终止。参见图2A。在一些情况下,3’核苷酸结合到尺寸或形状足以抑制三元复合物形成的部分,使得聚合酶不会结合到由此终止的链的3’末端,即使它结合到模板链。当在随后的测序反应中使用结合测序(sequencing by binding)时,这具有降低背景信号的益处,如本文其他地方所述。
然后,将在其3’末端退火到串联体链的一系列不同延伸产物的暴露的单链区段用作测序反应的模板,任选地由与串联体的保守区域(例如最初用于环化线性核酸文库组成部分的区域)退火或共线的引物引发。同样参见图2A。
任选地使用与上面使用的那些相同、相似或不同的终止子部分终止测序反应。同样,在一些情况下,使用阻止三元复合物形成的部分终止是有益处的,这样它们就不会在随后进行的结合测序反应中产生背景信号。在可选的情况下,这些分子在互补链的随后测序之前被去除或降解。
通常,这些测序反应在测序完成后不允许继续延伸,从而不会根据测序形成串联体核酸的完整单体。而是,它们被终止,要么通过封闭部分的掺入,要么通过测序试剂的去除,或二者。可选地,允许一些测序反应延伸,从而形成它们对其中一部分进行测序的完整单体的拷贝。
配对读段的第二链通过多种方法中的任何一种进行测序。例如,在一些情况下,引物在单链串联体的3’末端与单体单元退火,该单链串联体未与MDA寡核苷酸或MDA寡核苷酸延伸产物退火,如图2B中所示。可选地或组合地,在其3’末端与串联体链退火的一系列不同的延伸产物通常与与其退火的测序反应产物一起被去除或降解,从而暴露单链串联体模板。可以通过将分子解链、使得分子不再通过其碱基配对保持在一起并且部分双链核酸产物从串联体模板脱落来实现去除。可选地,MDA引发的延伸产物可以掺入可裂解部分或裂解引导部分,诸如作为尿嘧啶碱基掺入的dUTP,其可用于对延伸产物加标签以进行降解。裂解引导部分促进部分双链核酸产物的降解,使得它们在一些情况下降解,同时仍然附接到单链串联体,并且同时反向互补测序引物保持杂交。
测序引物,诸如先前使用的MDA引物或在串联体的单体单元中退火的其他引物,然后用于引发一系列测序反应。这些测序反应相对于前一轮测序反应在相反的链上并在相反的方向上运行,并产生可与前一轮的测序读段配对的读段,以产生模板的两个不同区域(诸如用于产生串联体分子的原始线性模板的两个末端)的测序数据。
相对于本领域中的方法或测序中使用的方法,这些方法传达了许多益处。首先,测序模板通常不超过2、3或4个复制步骤就从线性或环状核酸诸如图1A中所描绘的文库组成部分中去除。即,在本文的技术的一些情况下,根据集落形成和测序,没有文库组成部分经历超过2、3或4轮的复制。复制可能发生在集落形成之前,并产生许多超过2、3或4个拷贝,但在一些情况下,没有一个集落的测序产物是从起始文库材料中去除的超过2、3或4个复制反应。可选地,在一些情况下,文库组成部分经历超过2、3或4个复制循环,诸如5、6、7、8、9、10或超过10个复制循环。因此,通过依赖于使用聚合酶产物作为后续扩增的模板的重扩增过程(amplification-heavy processes)诸如桥式扩增引入的误差不被引入本文公开的配对读段方法。因此,反应可能比依赖于其他扩增方法的反应表现出明显更高的准确性。
起始线性核酸分子诸如文库组成部分相对不受长度的限制。尽管桥式扩增对于相对于在簇上定位寡核苷酸太小或太大的文库组成部分或其复制需要很长时间或有聚合酶脱落和未完成延伸的风险的文库组成部分效率较低,但本文的方法对于起始核酸长度是中性的,并且可以适应长度小于50个碱基、45个碱基、40个碱基、35个碱基、30个碱基、25个碱基、20个碱基或小于20个碱基的文库组成部分,或者可选地至少300个碱基、400个碱基、500个碱基、600个碱基、700个碱基、800个碱基、900个碱基、1000个碱基、2000个碱基、3000个碱基或大于3000个碱基的文库组成部分。
本文的一些方法不需要热循环,并且可以在具有可以等温完成的一些步骤或所有步骤的环境中进行。本文的一些方法除了RCA和/或MDA反应的酶的热失活之外不需要热循环,并且可以在具有可以等温完成的一些步骤或所有步骤的环境中进行。可选地,失活通过化学灭活或去除(诸如通过洗涤)来完成。即,滚环扩增、MDA引物退火、测序和降解(诸如尿嘧啶掺入介导的降解),在一些情况下都在单一温度进行,或者该过程的特定子步骤都在单一温度进行,使得热循环不依赖到它在桥式扩增介导的测序反应中的程度。例如,在一些情况下,串联体形成等温发生,MDA引发的第二链合成等温发生,并且第二链和第一链的测序等温发生,其中本公开内容的这些部分中的第一部分、第二部分和第三部分可以在相同的温度发生,或者在相对于彼此不同的温度发生。
在一些情况下,本文的方法不依赖于测序反应产物作为第二链测序反应的模板。即,在一些情况下,所有模板都在进行任何测序反应之前产生。模板形成与测序的这种分离促进了等温反应并降低了测序装置上的热应力,因为所有模板形成可以在单一温度发生,任选地在等温条件下发生,而所有测序随后并在适于测序的温度(诸如等温温度)发生。将模板生成与测序分离允许减少温度变化,并允许每组步骤在其自己的温度模式下进行。
因此,本文的方法和组合物产生配对序列数据,其中配对序列数据中的没有任何一个序列从文库模板复制超过四轮产生。即,在本文的技术的一些情况下,根据菌落形成和测序,没有文库组成部分经历超过2、3或4轮复制。复制可能发生在集落形成之前,并产生许多超过2、3或4个拷贝,但在一些情况下,没有一个集落的测序产物是超过2、3或4个复制反应从起始文库材料中去除的。可选地,在一些情况下,文库组成部分经历超过2、3或4个复制循环,诸如5、6、7、8、9、10或超过10个复制循环。复制循环的数量可以是以下、是约以下、是至少约以下、是至多以下或是至多约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100或这些值中任何两个之间的数量或范围。在一些情况下,配对测序读段在测序期间无需热循环地产生,或者在扩增期间无需热循环地产生,或者等温产生。除了通过加热的酶失活外,本文的一些方法不需要热循环,并且可以在具有可以等温完成的一些步骤或所有步骤的环境中进行。可选地,酶失活通过化学失活或洗涤来完成。在许多情况下,配对序列读段从模板产生,这些模板不是从经受测序反应条件的先前模板产生的。即,所有模板都是在任何测序反应之前产生的,从而产生更干净的模板和更高效的测序工作流程。可选地,在一些情况下,在合成链的反向互补物之前对链进行测序,反向互补物随后将被测序(参见图3A-图3F的实例)。
本文阐述的方法可以容易地多路复用,使得可以并行地从多于一个靶核酸获取配对末端序列数据。例如,多于一个靶序列可以分布在核酸阵列的位点上。每个位点可以包含具有特定靶核酸的有义链和靶的反义链的簇,并且当进行测序时,两条链都可以存在于每个簇中。本领域技术人员将认识到,该方法还可配置为通过对来自多于一个靶核酸的靶核酸进行串行处理(serial processing)来从多于一个靶核酸获取配对末端序列数据。
本公开内容提供了制备具有靶核酸的有义链和反义链二者的核酸簇的方法。在特定的配置中,通过对环状模板核酸的滚环扩增(RCA)以形成串联体的有义链和多重置换扩增(MDA)以形成串联体的一条或更多条反义链的组合来形成簇。有义链可以附接到固体支持物,例如,凭借在RCA反应期间通过延伸固体支持物固定的引物而产生。反义链可以附接到固体支持物,例如,凭借在MDA反应期间通过延伸固体支持物固定的引物而产生。RCA和MDA反应可以同时进行(例如,通过在有义链引物和反义链引物都存在的情况下进行扩增)。图1D说明了同时进行RCA和MDA反应的非限制性示例性方法。可选地,RCA和MDA反应可以顺序进行(例如,通过在不存在反义链引物的情况下进行RCA以产生有义链,并且然后递送反义链引物以通过MDA产生反义链)。图1A-图1C说明了顺序进行RCA和MDA反应的非限制性示例性方法。令人惊讶的是,反义链不需要由固定的引物产生以保留在簇中用于双链测序。而是,由于反义链与有义链或与簇的其他固定部分的非共价相互作用,由固定引物RCA和可溶性引物MDA的组合产生的反义链可以保留在簇中。
对于在还包含其他链的簇中采用一条链的测序的一些实施方案,在测序之前修饰其他链中的3’末端可以是有用的。本文阐述的方法可以采用适合所采用的特定测序方法的引物修饰过程。例如,不期望的3’末端可以被修饰以掺入3’封闭部分。该封闭部分可用于防止不想要的背景信号。不想要的背景信号可能来自,例如,Sequencing By BindingTM(SBBTM)(结合测序)或合成测序(SBS)反应。在SBS过程期间,不期望的3’末端延伸会导致不想要的背景。特别有用的封闭部分是不可逆的(例如双脱氧核苷酸)或对被SBS过程中使用的试剂去除是惰性的(例如封闭部分是与SBS过程中使用的可逆终止子正交的可逆终止子)。可选地或组合地,其他链中的3’末端可以被修饰以掺入3’加帽部分。加帽部分可用于防止在SBBTM过程期间在3’末端形成稳定化的三元复合物而导致的不想要的背景信号。通常,加帽部分将是不可逆的,或者至少对被SBBTM过程中使用的试剂去除是惰性的。如果需要,加帽部分可以是可逆的,例如,能够通过变性、接头裂解等去除。
除非另有说明,否则本文使用的术语将被理解为具有它们在相关领域中的普通含义。本文使用的若干术语及其含义如下阐述。
如本文所用,术语“约”一个数量或范围是指跨越该数量的+/-10%的范围,或先前所述范围限值的+/-10%。
如本文所用,术语“阵列”是指附接到一个或更多个固体支持物使得分子可以彼此区分的分子群体。阵列可以包含各自位于固体支持物上的不同可寻址位点的不同分子。阵列可以包括各自用作承载不同分子的位点的单独的固体支持物,其中可以根据固体支持物所附接的表面上的固体支持物的位置,或者根据固体支持物在诸如流体流的液体中的位置来识别不同分子。阵列的分子可以是,例如,核苷酸、核酸引物、核酸模板或核酸酶(诸如聚合酶、连接酶、外切核酸酶或其组合)。
如本文所用,短语A、B和C(按任何顺序)“中的至少一个”指的是可以包括A、或可以包括A和B、或可以包括A、B和C(单独或与其他未列出的元素组合)的集合。
如本文所用,术语“附接”是指两个物体相互连接(joined)、紧固、粘附、连接(connected)或结合的状态。例如,反应组分,诸如引发的模板核酸或聚合酶,可以通过共价键或非共价键附接到固相组分。共价键的特征在于原子之间共享电子对。非共价键是不涉及共享电子对的化学键并且可以包括例如氢键、离子键、范德华力、亲水相互作用和疏水相互作用。
如本文所用,术语“封闭部分”在用于提及核苷酸时,意指在核酸聚合反应期间抑制或阻止核苷酸的3’氧与下一个正确的核苷酸形成共价键的核苷酸部分。“可逆终止”核苷酸的封闭部分可以从核苷酸类似物中去除,或以其他方式修饰,以允许核苷酸的3’-氧共价连接到下一个正确的核苷酸。这样的封闭部分在本文称为“可逆终止子部分”。示例性可逆终止子部分阐述于美国专利第7,427,673号;第7,414,116号;第7,057,026号;第7,544,794号或第8,034,923号;或PCT公布WO 91/06678或WO 07/123744,其中的每一个通过引用并入本文。具有封闭部分或可逆终止子部分的核苷酸可以位于核酸(诸如引物)的3’末端,或者该核苷酸可以是不共价附接到核酸的单体。封闭部分不需要阻碍或排除在与封闭部分附接的核酸3’末端的三元复合物的形成。特别有用的封闭部分将存在于参与三元复合物形成的核酸的3’末端。
如本文所用,术语“加帽部分”,当用于提及核酸时,意指当存在于核酸中时,阻碍或阻止核酸的3’末端与聚合酶和下一个正确的核苷酸结合以形成三元复合物的部分。产生阻碍三元复合物形成的空间阻碍物(steric block)的部分特别有用,并且包含,例如,将引物延伸到与引物杂交的模板末端的聚合或连接产物。空间阻碍物的另一个实例是错配的核苷酸。加帽部分可以具有阻碍或防止三元复合物形成的正电荷或负电荷。加帽部分可以包含与受体结合以阻碍或防止三元复合物形成的配体,诸如与链霉抗生物素蛋白(或其类似物)结合的生物素(或其类似物)、与抗体(或其功能片段)结合的表位、与凝集素结合的碳水化合物等。因此,三元复合物抑制剂可以是抑制三元复合物形成的配体-受体复合物。可用于三元复合物抑制剂的部分的另外的实例包含描述于以下中的碱基修饰和核苷酸类似物:美国专利申请公布第2020/0032322A1号或Turcatti等人Nucl.Acids.Res.36(4)e25(2008),其中的每一个通过引用并入本文。
如本文所用,术语“环状”,当用于提及核酸链时,意指该链没有末端(即,该链缺少3’末端和5’末端)。因此,环状链中每个核苷酸单体的3’氧和5’磷酸部分共价附接到链中相邻的核苷酸单体。环状DNA链可以作为通过滚环扩增(RCA)产生串联体扩增子的模板,其中串联体扩增子的每个序列单元是环状核酸链的反向互补物。环状核酸可以是双链的。双链核酸中的一条链或两条链可以缺少3’末端和5’末端。双链核酸中的一条链可以具有缺口(相对于另一条链不存在至少一个核苷酸单体)或切口(两个核苷酸单体之间不存在磷酸二酯键),只要另一条链是环状的。
如本文所用,术语“簇”,当用于提及核酸时,指附接到固体支持物的核酸群体,例如,在固体支持物上的位点阵列中的位点处。术语“克隆群体”指相对于特定核酸序列是同种(homogeneous)的核酸群体。同种序列通常至少10个核苷酸长,但可以甚至更长,包括例如至少50个、100个、500个、1000个或2500个核苷酸长。克隆群体可以源自单个模板核酸。克隆群体可以包括特定核酸序列的至少2个、10个、100个、1000个或更多的拷贝。拷贝可以存在于单个核酸分子中,例如,作为串联体,或者拷贝可以存在于单独的核酸分子上。通常,簇中的所有核酸将具有相同的核苷酸序列。应当理解,在不脱离明显克隆性的情况下,可以在簇中出现数量可忽略不计的污染核酸或突变(例如,由于扩增伪影)。簇可以是至少80%、90%、95%或99%克隆的。任选地,簇可以是100%克隆的。
如本文所用,术语“共同序列”意指对两个或更多个核酸分子相同的核苷酸序列。两个或更多个核酸共同的序列可以包括正在被比较的核酸的全部或部分。共同序列可以具有至少5个、10个、25个、50个、100个、250个、500个、1000个或更多个核苷酸的长度。可选地或另外地,长度可以为至多1000个、500个、250个、100个、50个、25个、10个或5个核苷酸。核酸分子群体可以包括具有个体之间的共同序列区域(例如“通用引物”或“通用引物结合位点”)和从一个个体到另一个个体不同的可变序列区域(例如“靶区域”)的个体分子。
如本文所用,术语“串联体”,当用于提及核酸分子时,意指包含串联连接的共同序列的多于一个拷贝的连续核酸分子。类似地,术语“串联体”,当用于提及核苷酸序列时,意指包含串联的共同序列的多于一个拷贝的连续核苷酸序列。序列的每个拷贝可以称为串联体的“序列单元”。序列单元可以具有至少10个碱基、50个碱基、100个碱基、250个碱基、500个碱基或更多碱基的长度。串联体可包含至少2个、5个、10个、50个、100个或更多个序列单元。序列单元可以包含具有多种功能中的任一种的子区域,诸如引物结合区、靶序列区、标签区、独特分子标识符(UMI)等。
术语“包含”在本文中预期是开放式的,不仅包括提及的要素,而且还包括任何另外的要素。
如本文所用,术语“循环”,当用于提及测序程序时,指重复到以指示核苷酸的存在的测序运行的部分。通常,循环包括若干步骤,诸如用于递送试剂的步骤、洗去未反应的试剂的步骤和检测指示响应于添加的试剂而发生的变化的信号的步骤。
如本文所用,术语“解封闭”意指去除或修饰核苷酸的可逆终止子部分以使核苷酸可延伸。例如,核苷酸可以存在于引物的3’末端,使得解封闭使引物可延伸。示例性解封闭试剂和方法阐述于美国专利第7,427,673号;第7,414,116号;第7,057,026号;第7,544,794号或第8,034,923号;或PCT公布WO 91/06678或WO 07/123744,其中的每一个通过引用并入本文。
如本文所用,术语“外源”,当用于提及分子的部分时,意指不存在于分子的天然类似物中的化学部分。例如,核苷酸的外源标记是天然存在的核苷酸上不存在的标记。类似地,存在于聚合酶上的外源标记在其天然环境中的聚合酶上未发现。
如本文所用,术语“延伸”,当用于提及核酸时,意指将至少一个核苷酸添加到核酸的3’末端的过程。术语“聚合酶延伸”,当用于提及核酸时,是指将至少一个核苷酸添加到核酸的3’末端的聚合酶催化的过程。通过延伸添加到核酸的核苷酸或寡核苷酸被称为掺入到核酸中。因此,术语“掺入”可用于指通过形成磷酸二酯键将核苷酸或寡核苷酸连接到核酸3’末端的过程。
如本文所用,术语“可延伸的”,当用于提及核苷酸时,意指该核苷酸在3’位置具有氧或羟基部分,并且能够与下一个正确的核苷酸形成共价连接。可延伸的核苷酸可以位于聚合核酸的3’位置,也可以是单体核苷酸。可延伸的核苷酸将缺少封闭部分,诸如可逆终止子部分。
如本文所用,术语“固定的”,当用于提及分子时,指分子直接或间接、共价或非共价附接到固体支持物。在一些配置中,共价附接可以是优选的,但通常所需的是在意图使用支持物的条件下,例如当对固定到阵列的位点或另一固体支持物的核酸进行测序时,分子(例如核酸)保持固定或附接到支持物。
如本文所用,术语“标记”是指提供可检测特征的分子或其部分。可检测的特征可以是,例如,光学信号诸如辐射的吸光度、荧光发射、发光发射、荧光寿命、荧光偏振等;瑞利和/或米氏散射;对配体或受体的结合亲和力;磁性性质;电性质;电荷;质量;放射性等。示例性标记包括但不限于荧光团、发光团、生色团、纳米颗粒(例如金、银、碳纳米管)、重原子、放射性同位素、质量标记、电荷标记、自旋标记、受体、配体等。
如本文所用,术语“下一个正确的核苷酸”是指将结合和/或掺入在引物3’末端以与引物所杂交的模板链中的碱基互补的核苷酸或核苷酸类型。模板链中的碱基被称为“下一个碱基”,并且是模板中与引物3’末端杂交的碱基5’紧邻的。下一个正确的核苷酸可以称为下一个碱基的“同源物(cognate)”,并且反之亦然。在三元复合物或双链核酸中彼此相互作用的同源核苷酸(cognate nucleotides)被称为相互“配对”。具有与下一个模板碱基不互补的碱基的核苷酸被称为“不正确”、“错配”或“非同源”核苷酸。
如本文所用,术语“非催化金属离子”是指当聚合酶存在时,不促进将核苷酸化学掺入引物所需的磷酸二酯键形成的金属离子。非催化金属离子可以与聚合酶相互作用,例如通过与催化金属离子相比的竞争性结合。因此,非催化金属离子可以充当抑制性金属离子。“二价非催化金属离子”是具有二价的非催化金属离子。二价非催化金属离子的实例包括但不限于Ca2+、Zn2+、Co2+、Ni2+和Sr2+。三价Eu3+和Tb3+离子是具有三价的非催化金属离子。
如本文所用,术语“核苷酸”可用于指天然核苷酸或其类似物。实例包括但不限于核苷一磷酸、核苷二磷酸和核苷三磷酸(NTP)诸如核糖核苷三磷酸(rNTP)、脱氧核糖核苷三磷酸(dNTP)或其非天然类似物诸如双脱氧核苷三磷酸(ddNTP)或可逆终止的核苷三磷酸(rtNTP)。
如本文所用,术语“聚合酶”可用于指合成核酸的酶,包括但不限于DNA聚合酶、RNA聚合酶、逆转录酶、引物酶和转移酶。通常,聚合酶具有一个或更多个活性位点,在该位点可以发生核苷酸结合和/或核苷酸聚合的催化。聚合酶可催化核苷酸聚合到双链核酸分子的第一链的3’末端。例如,聚合酶催化下一个正确的核苷酸通过磷酸二酯键添加到双链核酸分子的第一链的3’氧基团,从而将核苷酸共价掺入到双链核酸分子的第一链。任选地,聚合酶不需要能够在本文阐述的方法中使用的一种或更多种条件下进行核苷酸掺入。例如,突变聚合酶可以能够形成三元复合物,但不能催化核苷酸掺入。聚合酶可以具有链置换活性,诸如Phi29。聚合酶可以缺乏链置换活性。聚合酶可以具有5’→3’外切核酸酶活性。聚合酶可以缺乏5’→3’外切核酸酶活性。
如本文所用,术语“引物”是指具有在模板序列处或靠近模板序列处与核酸结合的序列的核酸。通常,引物以允许例如经由引物的聚合酶延伸复制模板的构型结合。引物可以是核酸分子的第一部分,该第一部分与所述核酸分子的第二部分结合,第一部分是引物序列且第二部分是引物结合序列(例如,发夹引物)。可选地,引物可以是第一核酸分子,所述第一核酸分子与具有模板序列的第二核酸分子结合。引物可以包括或可以是DNA、RNA或其类似物。引物可以具有可延伸的3’末端、被封闭而不能进行引物延伸的3’末端或被加帽以阻碍或排除三元复合物形成的3’末端。在一些实施方案中,引物可以包含不在5’末端和3’末端的核苷酸修饰。可选地或另外地,引物可以在5’末端包含修饰的核苷酸。
如本文所用,术语“引物-模板核酸杂合体”或“引物-模板杂合体”是指具有双链区的核酸,使得一条链是引物而另一条链是模板。两条链可以是连续核酸分子(例如发夹结构)的一部分,或者两条链可以是彼此不共价附接的可分离分子。
术语“有义”和“反义”在本文中用于区分一对互补核酸分子或序列的成员。这些术语旨在作为上下文特定的标识符。根据它们在分子生物学领域的使用,这些术语是可互换的。因此,在一个上下文中被识别为“有义链”的链在第二上下文中可以被称为“反义”链。这与第一上下文与第二上下文相比有多相似或不同无关。
如本文所用,术语“位点”,当用于提及阵列时,意指阵列中存在特定分子的位置。位点可包含仅单个分子或其可包含相同种类的若干分子的群体(分子的系综)。可选地,位点可以包含不同种类的分子群体(例如具有不同模板序列的三元复合物群体)。阵列的位点通常是离散的。离散的位点可以是邻接的或它们彼此之间可具有间隙距离。可用于本文的阵列可以具有例如间隔小于100微米、50微米、10微米、5微米、1微米或0.5微米的位点。可选地或另外地,阵列可以具有间隔大于0.5微米、1微米、5微米、10微米、50微米或100微米的位点。这些位点各自可以具有小于1平方毫米、500平方微米、100平方微米、25平方微米、1平方微米或更小的面积。位点也可以称为阵列的“特征”。
如本文所用,术语“固体支持物”是指不溶于水性液体的刚性基底。基底可以是无孔的或多孔的。基底可以任选地能够吸收液体(例如由于孔隙率),但通常具有足够的刚性,使得基底在吸收液体时基本不溶胀,并且在通过干燥去除液体时基本不收缩。无孔固体支持物通常是液体或气体不可渗透的。示例性的固体支持物包括但不限于玻璃和改性或官能化的玻璃、塑料(包含丙烯酸类、聚苯乙烯以及苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM、环烯烃、聚酰亚胺等)、尼龙、陶瓷、树脂、Zeonor、二氧化硅或基于二氧化硅的材料(包含硅和改性硅)、碳、金属、无机玻璃、光纤束和聚合物。
如本文所用,术语“模板”意指这样的核酸或其部分,所述核酸或其部分具有的核苷酸碱基序列充当用于产生该序列的互补拷贝的引导。可以通过延伸与模板杂交或邻近模板的引物来复制模板。延伸可由聚合酶或连接酶介导。模板可以包括或可以是DNA、RNA或其类似物。
如本文所用,术语“三元复合物”是指聚合酶、双链核酸和核苷酸之间的分子间缔合。通常,聚合酶促进下一个正确的核苷酸和引发的核酸的模板链之间的相互作用。下一个正确的核苷酸可以通过沃森-克里克氢键与模板链相互作用。术语“稳定化的三元复合物”意指具有促进或延长的存在的三元复合物,或其破坏已被抑制的三元复合物。通常,三元复合物的稳定化防止三元复合物的核苷酸组分共价掺入到三元复合物的引发的核酸组分中。
可以根据以上定义理解下文示出的以及在权利要求中引述的实施方案。
本公开内容提供了一种用于从核酸的有义链和反义链确定序列的方法。例如,有义链和反义链可以分别是第一链和第二链。该方法可以包括以下步骤:(a)提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)将第二引物与有义链的序列单元中的引物结合位点杂交;和(e)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列。
用于本文方法或组合物中的核酸可以是DNA,诸如基因组DNA、合成DNA、扩增的DNA、互补DNA(cDNA)等。还可以使用RNA,诸如mRNA、核糖体RNA、tRNA等。核酸类似物也可用于本公开内容的方法或组合物中。例如,核酸类似物可用作本文阐述的扩增或测序过程的模板。本文所用的核酸,例如,作为产生核酸簇的模板或作为测序的靶,可以来源于生物来源、合成来源或扩增产物。本文使用的引物可以包括或可以是DNA、RNA或其类似物。
经受本公开内容的测序方法的包含靶序列的核酸模板可以来源于或产生自样品。样品包含一种或更多种生物体。核酸模板可以在不进行聚合酶链式反应的情况下从样品获得或衍生。核酸模板可以通过进行几个循环的聚合酶链式反应从样品中获得或衍生,诸如至多一个循环、两个循环、三个循环、四个循环、五个循环、六个循环、七个循环、八个循环、九个循环,或者十个循环或多于十个循环。
本文设想了不同长度的核酸模板(或靶序列)。核酸模板的长度可以是以下、是约以下、是至少以下、是至少约以下、是至多以下、是至多约以下的核苷酸:50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或这些值中任何两个之间的数量或范围。
可从其衍生核酸的示例性生物体包括例如,哺乳动物诸如啮齿类动物、小鼠、大鼠、兔、豚鼠、有蹄类动物、马、绵羊、猪、山羊、牛、猫、狗、灵长类动物、人类或非人类灵长类动物;植物诸如拟南芥(Arabidopsis thaliana)、玉米、高粱、燕麦、小麦、稻、油菜或大豆;藻类诸如莱茵衣藻(Chlamydomonas reinhardtii);线虫诸如秀丽隐杆线虫(Caenorhabditis elegans);昆虫诸如黑腹果蝇(Drosophila melanogaster)、蚊子、果蝇、蜜蜂或蜘蛛;鱼诸如斑马鱼;爬行动物;两栖动物诸如蛙类动物或非洲爪蟾(Xenopuslaevis);盘基网柄菌(dictyostelium discoideum);真菌诸如卡氏肺孢子虫(pneumocystis carinii)、红鳍东方鲀(Takifugu rubripes)、酵母、酿酒酵母(Saccharamoyces cerevisiae)或粟酒裂殖酵母(Schizosaccharomyces pombe);或恶性疟原虫(plasmodium falciparum)。核酸还可来源于原核生物,诸如细菌大肠埃希氏菌(Escherichia coli)、葡萄球菌(Staphylococci)或肺炎支原体(Mycoplasmapneumoniae);古菌;病毒诸如丙型肝炎病毒或人类免疫缺陷病毒;或类病毒。核酸可来源于以上生物体的同质培养物或群体,或可选地来源于例如一个群落或生态***中数种不同生物体的集合。可以使用本领域已知的方法分离核酸,包括例如在以下中描述的方法:Sambrook等人,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring HarborLaboratory,New York(2001)或在Ausubel等人,Current Protocols in MolecularBiology,John Wiley and Sons,Baltimore,Md.(1998),其中的每一个通过引用并入本文。
核酸可以从制备方法(诸如基因组、转录组或其他核酸分离,基因组片段化,基因克隆和/或扩增)获得。一种或更多种核酸可以从诸如聚合酶链式反应(PCR)、乳液PCR、随机引发扩增、滚环扩增(RCA)、多重置换扩增(MDA)等的扩增技术获得。RCA和MDA可特别适用于生产串联体产物。用于分离、扩增和片段化核酸以产生用于在阵列上分析的模板的示例性方法在以下中阐述:美国专利第6,355,431号或第9,045,796号,其中的每一个通过引用并入本文。也可以使用在以下中阐述的方法进行扩增:Sambrook等人,Molecular Cloning:ALaboratory Manual,第三版,Cold SpringHarbor Laboratory,New York(2001)或在Ausubel等人,Current Protocols in Molecular Biology,John Wiley and Sons,Baltimore,Md.(1998),其中的每一个通过引用并入本文。
核酸簇可以包含一条或更多条核酸串联体链。例如,簇可以只包含单条核酸串联体链。单条串联体链可以通过RCA反应产生,例如如在图1B中所图解的。可选地,核酸簇可以包含作为串联体的第一链(例如,有义链)以及一条或更多条与第一链互补的第二链(例如,反义链)。例如,可以通过对串联体模板进行多重置换扩增(MDA)来产生一条或更多条第二链。参见例如由在图1C或图1D中所图解的方法产生的双链簇。为了便于参考,根据分子生物学领域中使用的惯例,两条互补链中的一条可被称为“有义”链,并且有义链的互补物可被称为“反义”链。
簇中的串联体链可以包含串联连接的序列单元的多于一个拷贝。例如,串联体链可包含至少2个、10个、25个、100个或更多个序列单元。串联体链中序列单元的数量可以是,例如,至多100个、25个、10个或2个序列单元。由RCA产生的串联体中序列单元的数量将随聚合酶在复制期间绕环状模板完成一圈的次数而变化。RCA产生的每个序列单元的内容将是被复制的环状模板内容的反向互补物。例如,如在图1B中显示的,环状模板包含两个衔接子区域(由空心矩形和交叉阴影矩形指示)和一个靶区域(由虚线指示)。衔接子区域可以具有多种功能中的任何一种,包括但不限于提供与捕获探针(例如,附接到固体支持物的捕获探针)互补的结合位点、提供用于复制环状模板的引物结合位点、提供用于复制环状模板的互补物的引物结合位点、提供与靶区域缔合的标签(例如,指示靶区域来源的标签或用于识别在靶区域扩增期间引入的错误的标签等)。衔接子区域或其部分可以是环状模板群体或串联体群体所共有的。无论衔接子区域是否具有共同序列,环状模板群体中的靶区域或串联体群体中的靶区域都可以具有不同的序列。因此,当比较两个或更多个串联体之间或两个或更多个环状模板之间的序列单元时,序列单元可以具有共同的序列区域(例如,通用引物结合位点或通用捕获探针结合位点)和/或序列单元可以具有不同序列的区域(例如,不同的靶序列)。
串联体中序列单元的长度或环状模板的长度可被选择为适合本文阐述方法的特定应用。例如,长度可以是至少约50个、100个、250个、500个、1000个、1x104个、1x105个或者更多个核苷酸。可选地或另外地,长度可以是不超过1x105个、1x104个、1000个、500个、250个、100个或50个核苷酸。应当理解,上述长度范围可应用于序列单元的靶区域或环状模板的靶区域,不包括也可能存在于序列单元中的衔接子序列(例如,共同或通用衔接子序列)。例如,长度范围可以描绘用于产生簇或以其他方式存在于簇中的基因组片段或其他核酸片段的尺寸。
簇可以包含一条或更多条串联体链。在一些配置中,簇包含不超过一条串联体链。可选地,簇可以包含多于一条串联体链,例如,包含串联体的至少2条、4条、10条、50条、100条或更多条有义链。可选地或另外地,簇中串联体链的数量可以是例如包含串联体的至多100条、50条、10条、4条、2条或1条有义链。在一些实施方案中,串联体链的数量可以是以下、是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:1条、2条、3条、4条、5条、6条、7条、8条、9条、10条、20条、30条、40条、50条、60条、70条、80条、90条、100条、200条、300条、400条、500条、600条、700条、800条、900条、1000条、2000条、3000条、4000条、5000条、6000条、7000条、8000条、9000条、10000条、20000条、30000条、40000条、50000条、60000条、70000条、80000条、90000条、100000条、200000条、300000条、400000条、500000条、600000条、700000条、800000条、900000条、1000000条,或这些值中任何两个之间的数量或范围。特定簇中的串联体链可以具有相同的靶序列,例如,为同一串联体的有义链。可选地,簇可以具有多于一条不同的串联体链,这样的簇是非克隆的。
包含串联体的至少一条有义链的簇还可以包含串联体的至少一条反义链。例如,包含串联体的一条或更多条有义链的簇还可以包含多于一条反义链。多于一条反义链可以包括特定串联体的至少2条、4条、10条、50条、100条或更多条反义链。可选地或另外地,簇中反义链的数量可以是,例如,特定串联体的至多100条、50条、10条、4条、2条或1条反义链。在一些实施方案中,反义链的数量可以是以下、是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:1条、2条、3条、4条、5条、6条、7条、8条、9条、10条、20条、30条、40条、50条、60条、70条、80条、90条、100条、200条、300条、400条、500条、600条、700条、800条、900条、1000条、2000条、3000条、4000条、5000条、6000条、7000条、8000条、9000条、10000条、20000条、30000条、40000条、50000条、60000条、70000条、80000条、90000条、100000条、200000条、300000条、400000条、500000条、600000条、700000条、800000条、900000条、1000000条,或这些值中任何两个之间的数量或范围。在特定的配置中,簇可以包含单条有义串联体链(不超过一条有义链)和单条反义串联体链(不超过一条反义链)。可选地,簇可以包含串联体的至少一条有义链和串联体的多于一条反义链。簇中反义链的数量可以超过簇中的有义链的数量。可选地,簇中有义链的数量可以超过簇中的反义链的数量。注意,串联体的反义链不需要与有义链是相同长度。例如,反义链可以比有义链具有更多的序列单元,或者反义链可以比有义链具有更少的序列单元。反义链中序列单元的数量可以落在本文为串联体的有义链阐述的范围内。串联体的反义链不需要具有多于一个序列单元。事实上,反义链不需要具有完整的序列单元。
包含串联体的至少一条有义链的簇还可以包含该串联体的通过沃森-克里克碱基配对与有义链杂交的至少一条反义链。例如,特定串联体的有义链可以与该特定串联体的至少2条、4条、10条、50条、100条或更多条反义链杂交。可选地或另外地,特定串联体的有义链可以与该特定串联体的例如至多100条、50条、10条、4条、2条或1条反义链杂交。
核酸簇可以附接到固体支持物。固体支持物可以由用于分析生物化学的多种材料中的任何一种制成。合适的材料可以包括,例如,玻璃、聚合物材料、硅、石英(熔融二氧化硅)、borofloat玻璃、二氧化硅、基于二氧化硅的材料、碳、金属、光纤或光纤束、蓝宝石或塑料材料。可以基于特定用途所需的特性来选择材料。例如,对所需的辐射波长透明的材料对于利用该波长辐射的分析技术是有用的。相反,可能期望选择不使某一波长辐射通过的材料(例如,不透明、吸收或反射)。可以通过或不通过特定材料的波长区域包括例如UV、VIS(例如红、黄、绿或蓝)或IR。可以利用的材料的其他特性是对下游过程中使用的某些试剂(诸如本文阐述的那些)的惰性或反应性,或易于操作,或制造成本低。
特别有用的固体支持物是颗粒,诸如珠或微球。珠的群体可用于核酸群体的附接。在一些实施方案中,使用每个珠具有单个靶序列的配置可能是有用的。单个珠可以具有带有靶序列的单个核酸分子,或可选地,单个珠可以具有多于一个核酸分子,所述分子中的每一个都具有靶序列。在一些配置中,珠可以附接到核酸串联体,其中靶序列的多于一个拷贝存在于单个核酸分子中。珠群体中的珠可以具有彼此不同的靶序列。当相互比较时,珠群体中的珠可以具有共同的核酸序列。例如,珠群体可以附接到通用引物,使得相同的引物序列存在于群体中的多于一个珠上。
珠的组成可以变化,例如取决于要使用的形式、化学和/或附接方法。示例性珠组合物包括固体支持物,任选地包括在蛋白和核酸捕获方法中使用的化学官能度(chemicalfunctionalities)。这些组合物包括,诸如,塑料、陶瓷、玻璃、聚苯乙烯、三聚氰胺、甲基苯乙烯、丙烯酸聚合物、顺磁材料、二氧化钍溶胶、碳石墨、二氧化钛、乳胶或交联葡聚糖诸如SepharoseTM、纤维素、尼龙、交联胶束和TeflonTM,以及来自Bangs Laboratories,FishersInd.的“Microsphere Detection Guide”(其通过引用并入本文)中阐述的其他材料。
颗粒的几何形状,如珠或微球,也可以对应于各种不同的形式和形状。例如,颗粒可以是对称的形状(例如球形或圆柱形)或不规则的形状(例如受控孔玻璃)。此外,颗粒可以是多孔的,因此增加了可用于捕获三元复合物或其组分的表面积。本文中使用的珠的示例性尺寸可以在从纳米至毫米或从约10nm至约1mm的范围内。
在特定实施方案中,珠可以被排列或以其他方式在空间上区分。可以使用的示例性基于珠的阵列包括但不限于从Illumina,Inc.(San Diego,CA)可得的BeadChipTM或诸如在以下中描述的那些的阵列:美国专利第6,266,459号;第6,355,431号;第6,770,441号;第6,859,570号;或第7,622,294号或PCT公布第WO 00/63437号,其中的每一个通过引用并入本文。珠可以位于固相支持物上的离散位置,诸如孔,由此每个位置容纳单个珠。可选地,珠所驻留的离散位置可以各自包括多于一个珠,例如在以下中描述的:美国专利申请公布第2004/0263923A1号、第2004/0233485A1号、第2004/0132205A1号或第2004/0125424A1号,其中的每一个通过引用并入本文。
如将从上述珠阵列实施方案中认识到的,本公开内容的方法可以以多重形式进行,由此使用本文阐述方法的一个或更多个步骤并行检测多于一种不同类型的核酸。可以使用其他类型的阵列来代替珠阵列,包括例如下面进一步详细阐述的那些。尽管使用本文阐述方法的一个或更多个步骤来依次处理不同类型的核酸也是可能的,但并行处理可以提供成本节约、时间节约和条件一致性。本公开内容的阵列或方法可以被配置为包括至少2、10、100、1x103、1x104、1x105、1x106、1x109,或者更多不同的核酸。可选地或另外地,本公开内容的阵列或方法可被配置为包括至多1x109、1x106、1x105、1x104、1x103、100、10、2或更少不同的核酸。核酸可以附接到阵列的不同位点。因此,阵列中位点的数量可以在这里举例说明的不同核酸的范围内。此外,本文阐述的各种试剂或产物(例如引物-模板核酸杂合体或稳定化的三元复合物)可以多路复用以具有在这些范围内的不同的类型或种类。
可用于本文阐述的方法或组合物中的商购可得的阵列的另外的实例包括通过核酸的光刻合成制成的阵列,例如Affymetrix GeneChipTM阵列。根据一些实施方案,点制阵列也可用于将预合成核酸附接到阵列位点。示例性的点制阵列是从Amersham Biosciences可得的CodeLinkTM阵列。另一个有用的阵列是使用喷墨打印方法制造的阵列,所述喷墨打印技术诸如从Agilent Technologies可得的SurePrintTM技术。用于将核酸探针附接到这些阵列的方法可以被修改为附接核酸引物,用于对与引物杂交的靶核酸进行扩增(例如通过RCA)和/或测序。
其他有用的阵列包括在核酸测序应用中使用的那些。例如,用于附接基因组片段(通常称为簇)的扩增子以形成阵列的方法和组合物可以特别有用。实例描述于Bentley等人,Nature 456:53-59(2008),PCT公布第WO91/06678号;第WO 04/018497号或第WO 07/123744号;美国专利第7,057,026号;第7,211,414号;第7,315,019号;第7,329,492号或第7,405,281号;或者美国专利申请公布第2008/0108082号,其中的每一个通过引用并入本文。
核酸可以通过共价键或非共价键附接到固体支持物(例如阵列的位点)。例如,固体支持物可以共价或非共价附接在或靠近串联体核酸的5’末端。例如,当串联体已经由通过延伸在或靠近其5’末端处附接到固体支持物的引物来进行的RCA产生时,可能会产生这种配置。核酸与固体支持物的附接可以通过多种表面化学中的任何一种来介导,诸如固体支物上的羧酸酯部分或琥珀酰亚胺酯部分与胺修饰的核酸的反应、固体支持物上的烷基化试剂(例如碘乙酰胺或马来酰亚胺)与硫醇修饰的核酸反应、环氧硅烷或异硫氰酸酯修饰的固体支持物与胺修饰的核酸的反应、氨基苯基或氨基丙基修饰的固体支持物与琥珀酰化核酸的反应、醛或环氧化物修饰的固体支持物与酰肼修饰的核酸的反应或硫醇修饰的固体支持物与硫醇修饰的核酸的反应。前述反应对的成员可以根据存在于固体支持物或核酸上的情况进行切换。点击化学可用于将核酸附接到固体支持物。用于点击化学的示例性试剂和方法在以下中阐述:美国专利第6,737,236号;第7,375,234号;第7,427,678号和第7,763,736号,其中的每一个通过引用并入本文。
在特定的实施方案中,稳定化的三元复合物、聚合酶、引物、模板、引物-模板核酸杂合体或核苷酸附接到流通池表面或附接到流通池中的固体支持物。一个或更多个核酸簇可以附接到流通池表面或附接到流通池中的固体支持物。流通池通过将溶液送入和送出与支持物结合的分析物接触的流体室来允许方便的流体操作。流通池还提供对流体操纵组件的检测。可以定位检测器以检测来自固体支持物的信号,诸如来自在测序过程中例如由于稳定化的三元复合物的形成而被募集到固体支持物的标记的信号。例如,可使用的示例性流通池描述于美国专利申请公布第2010/0111768A1号、WO 05/065814或美国专利申请公布第2012/0270305A1号,其中的每一个通过引用并入本文。
在特定的配置中,核酸簇可以通过将一条或两条链与固体支持物的共价附接而附接到固体支持物。核酸可以是单链或双链的。在一些配置中,双链核酸的第一链共价附接到固体支持物,并且第二链不共价附接到固体支持物。例如,第二链可以由于与第一链的沃森-克里克碱基配对保留在簇中。通过串联体的有义链与固体支持物的共价附接而形成的簇可以由于有效地起作用使簇中的链缠结的多于一个碱基配对区域保留一条或更多条反义链。
核酸簇可以在本文阐述方法之前或作为本文阐述方法的一部分制备。在特定配置中,核酸簇可以包含核酸串联体。簇可以由串联体的单条链组成。簇不需要包含该串联体的反义链,也不需要包含该串联体链的任何区域的反义链。可选地,簇可以包含串联体有义链和至少一条与全部或部分有义链互补的反义链。
在固体支持物上产生串联体核酸的一种有用的方法是滚环扩增(RCA)。通常,方法包括聚合酶延伸退火到环状模板的引物,使得聚合酶绕环状模板多于一圈产生包含多于一个串联重复的串联体单链DNA,每个重复与环状模板互补。在一种配置中,RCA最初可以在存在低浓度的聚合物诸如树枝状大分子(例如聚酰胺胺(PAMAM))的情况下进行,并且随后在存在聚合物的情况下进行。在一种配置中,通过使聚合酶变性来停止RCA反应,例如,通过在60℃、65℃、70℃、75℃、80℃或更高温度加热样品。在一种配置中,通过去除RCA的一种或更多种组分,诸如聚合酶和dNTP来停止RCA反应。RCA的组分可以通过例如洗涤去除。任选地,一条或更多条反义链可以通过复制串联体有义链来制造,例如,使用多重置换扩增(MDA)。RCA和MDA方法可以等温进行。通常,用于RCA或MDA的聚合酶是链置换聚合酶。可用于RCA、MDA或其一些组合的方法和试剂被阐述在例如以下中:Lizardi等人,Nat.Genet.19:225-232(1998),美国专利第6,830,884号;第6,797,474号;第6,670,126号;第6,576,448号;第6,323,009号;第6,280,949号或US 2007/0099208 A1,其中的每一个通过引用并入本文。
图1A-图1D提供了用于在固体支持物上产生固定的串联体核酸簇的方法的示意图。如在图1A中显示的,核酸引物(由空心和带线的矩形指示)通过接头(由灰色线指示)附接到固体支持物(由虚线矩形指示)。引物可用于通过与引物互补的引物结合位点捕获靶核酸。在图1A中显示的一种配置中,固定的引物可以与存在于靶序列相对末端的引物结合位点的部分杂交(分别地,靶序列由虚线指示,并且侧翼引物结合位点区域由空心和带线的矩形指示)。因此,固定的引物起到将靶核酸的两末端聚集在一起的夹板的作用。两个末端可以在与夹板核酸杂交的同时连接以形成靶核酸的环状形式。在图1A中显示的另一个配置中,靶核酸在与固体支持物上固定的引物杂交之前被环化。例如,线性靶核酸可以在与溶液中的夹板寡核苷酸杂交的同时连接,或者在与在除了用于RCA的固体支持物之外的固体支持物上的夹板寡核苷酸杂交的同时连接。可选地,当例如使用CircligaseTM(Epicenter,Madison WI)或其他能够无夹板连接核酸末端的酶时,不需要使用夹板来连接末端。同样,固定可以由于固定引物和环状模板中的引物结合位点之间的互补性而发生。
图1B提供了通过与固定的引物杂交的引发的环状模板的滚环扩增产生单链串联体的示意图。引物以3’末端可用于聚合酶延伸的方式固定(例如,引物可以在或靠近5’末端处附接)。第一个子步骤的产物显示为已经进展到产生了环状模板的两个拷贝(两个序列单元),并且环状模板与正在复制的第三拷贝(第三序列单元)的一部分杂交的程度。每个序列单元包含与靶序列互补的区域(由黑色实线指示)和与引物互补的区域(由空心和带线的矩形指示)。第二个子步骤的产物已经进展到产生了环状模板的近六个拷贝的程度。图1B示出了在第三个子步骤中环状模板不存在(例如,已被去除)后RCA反应的最终产物。为了说明目的,示出了最终产物的两个区域:描绘了序列单元(指示有义链的串联体一级结构)的区域,和没有指定序列单元的数量和构象(指示整个簇的动态和可变二级结构)的区域。图1A-图1D中图解并且在以上阐述的步骤可以多路进行,使得图解的步骤发生在阵列中的多于一个单独位点处。
在特定的配置中,核酸簇可以通过以下来制备:(i)在固体支持物上提供串联体的有义链,和(ii)使用与有义链中的引物结合位点结合的扩增引物合成反义链。
因此,本公开内容提供了一种用于从核酸的有义链和反义链确定序列的方法,包括以下步骤:(a)(i)在固体支持物上提供串联体的有义链,和(ii)使用与有义链的序列单元中的引物结合位点结合的扩增引物合成串联体的反义链,从而提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)将第二引物与有义链的序列单元中的引物结合位点杂交;以及(e)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列。
可以产生一条或更多条反义链,如在图1C中阐述的。扩增可以从通过接头(由灰线指示)固定在固体支持物(由点填充的矩形指示)上的串联体有义链(由黑线指示)开始。串联体的有义链包含序列单元,每个序列单元包含引物结合位点。与全部或部分引物结合位点互补的扩增引物可以与串联体的有义链杂交,并在MDA反应中延伸以产生反义链(显示为至少部分地与有义链退火的灰色线)。为了说明目的,显示了MDA产物的一部分以指示延伸方向(见箭头),并指示具有多种长度和退火模式的串联体反义链的一级结构。MDA产物的另一部分以较少的结构特异性显示,以指示簇作为一个整体的动态和可变二级结构。
核酸簇可以在本文阐述方法之前或作为本文阐述方法的一部分制备,例如通过(i)提供具有捕获引物的固体支持物,(ii)将环状核酸模板与引物杂交,(iii)通过滚环扩增沿着环状核酸模板延伸捕获引物来合成串联体的有义链,以及(iv)通过延伸与有义链的序列单元中的引物结合位点结合的扩增引物来合成串联体的反义链。
因此,本公开内容提供了一种用于从核酸的有义链和反义链确定序列的方法,包括以下步骤:(a)(i)提供具有捕获引物的固体支持物,(ii)将环状核酸模板与引物杂交,(iii)通过滚环扩增将捕获引物沿着环状核酸模板延伸来合成串联体的有义链,以及(iv)通过延伸与有义链的序列单元中的引物结合位点结合的扩增引物合成串联体的反义链,从而提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)将第二引物与有义链的序列单元中的引物结合位点杂交;以及(e)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列。
串联体的有义链和反义链可以如图1D所阐述产生。任选地,环状模板可以捕获在固体支持物上,如在图1A中图解的。无论是否使用图解的捕获方法,引物都可以以3’末端可用于聚合酶延伸的方式固定(例如,引物可以在或靠近5’末端附接)。图1D示出了组合的RCA/MDA反应,其中第一个子步骤的产物显示为已经进展到有义链包含环状模板的两个拷贝(两个序列单元),并且环状模板与正在复制的第三拷贝(第三序列单元)的一部分杂交的程度。有义链中的每个序列单元包含与靶序列互补的区域(由黑色实线指示)和与引物互补的区域(由空心和带线的矩形指示)。
因为图1D的反应包括与有义链中的引物结合位点互补的扩增引物,第一子步骤的产物还包括显示在延伸的各种阶段的三条反义链。反义链中的每个序列单元包含作为靶序列拷贝的区域(用灰色实线指示)和与引物互补的区域(用空心和带线的矩形指示)。图1D中第二个子步骤的产物已经进展到产生了显示在延伸的各种阶段的环状模板的近六个拷贝和五条反义链的程度。图1D示出了在第三个子步骤中环状模板不存在(例如,已被去除)后组合的RCA/MDA反应的最终产物。示出了最终产物的两个区域,包括描绘序列单元以说明串联体的一级结构的区域和没有指定序列单元的数量和构象(指示整个簇的动态和可变二级结构)的区域。图1D中图解并在以上阐述的步骤可以多路进行,使得图解的步骤发生在阵列中的多于一个单独位点处。
MDA方法,诸如在图1C或图1D的上下文中例示的那些方法,可用于产生一条或更多条与串联体的至少一部分互补的反义链。扩增引物可以在溶液中,如图所示。可选地,扩增引物可以附接到固体支持物,例如,使用本文阐述的用于核酸的共价或非共价附接化学。图4A-图4F说明了使用附接到固体支持物的扩增引物的非限制性示例性MDA方法。由共价固定的引物延伸产生的串联体的反义链将共价附接到固体支持物。扩增引物不需要共价附接到固体支持物,而是通过与有义链杂交附接到簇。由不共价附接到固体支持物的引物延伸而产生的串联体的反义链可以通过与有义链的杂交或由于与簇中其他部分的非共价键而附接到簇。
如图1C所示例,串联体的有义链和反义链可以在单独的反应中产生。例如,有义串联体链可以通过RCA反应产生,并且然后该有义串联体链可以用作后续MDA反应的模板。因此,可以进行RCA以产生附接到固体支持物的有义串联体链,然后可以将用于RCA的试剂从与固体支持物的接触中去除,并且然后可以将用于MDA的试剂(例如,与有义链中的引物结合位点互补的引物)与固体支持物接触。可选地,串联体的有义和反义链可以在“单锅”反应中产生,使得RCA试剂不与MDA试剂分离。例如,用于通过RCA扩增环状模板的第一引物可以与用于通过MDA扩增串联体的第二引物一起存在。参见,例如,图1D。第一引物和第二引物可以在彼此存在的情况下被延伸。如果需要,串联体的有义链和反义链可以同时产生,例如,通过同时进行RCA和MDA反应。
一条或更多条反义链可以如在图1E中阐述的产生。扩增可以从通过接头(由灰线指示)固定在固体支持物(由点填充的矩形指示)上的串联体有义链(由黑线指示)开始。串联体的有义链包含序列单元,每个序列单元包含引物结合位点。与全部或部分引物结合位点互补的扩增引物可以与串联体的有义链杂交,并在MDA反应中延伸以产生反义链(显示为至少部分地与有义链退火的灰线)。为了说明目的,显示了MDA产物的一部分以指示延伸方向(见箭头),并指示具有多种长度和退火模式的串联体反义链的一级结构。MDA产物的另一部分以较少的结构特异性显示,以指示簇作为一个整体的动态和可变二级结构。
MDA反应可以在存在脱氧核糖腺苷三磷酸(dATP)、脱氧核糖胸苷三磷酸(dTTP)、脱氧核糖鸟苷三磷酸(dGTP)和脱氧核糖胞苷三磷酸(dCTP)(或其类似物)的情况下进行。产生的反义链可以包含腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶碱基。MDA反应可以在存在脱氧核糖尿苷三磷酸(dUTP)(或其类似物)的情况下进行。当MDA反应在除dATP、dTTP、dGTP和dCTP之外还存在dUTP的情况下进行时,产生的反义链可以除了腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶碱基之外,还包含尿嘧啶碱基(在反义链中由“星号”指示)。反义链中尿嘧啶碱基的位置不是预先确定的。如下文参考图2D进一步详细描述的,具有尿苷碱基的反义链可以在反义链被测序后被消化。尽管本申请描述了MDA反应可以在存在dUTP(或其类似物)的情况下进行,使得产生的反义链包含尿嘧啶碱基,但这仅用于说明,并且也考虑了实现类似结果的可选方案。例如,MDA反应可以在存在具有修饰的碱基或非典型碱基的脱氧核糖核苷酸三磷酸的情况下进行,使得产生的反义链包含一个或更多个修饰的或非典型碱基。这样的修饰的碱基或非典型碱基可以靶向反义链以进行降解,诸如参考图2D如下文所述的酶消化。作为另一个实例,MDA反应可以在存在修饰的或非典型脱氧核糖核苷酸三磷酸(例如,脱氧假尿苷三磷酸)的情况下进行,使得产生的反义链包含一个或更多个修饰的或非典型核苷酸(例如,脱氧核糖假尿苷单磷酸)。这样的修饰的核苷酸或非典型核苷酸可以靶向反义链以进行降解,诸如下文参考图2D所述的酶消化。
反义链中的碱基是胸腺嘧啶还是尿嘧啶(当有义链中相应的碱基是腺嘌呤时)取决于MDA反应中dTTP和dUTP的相对浓度。MDA反应中dUTP(或具有修饰碱基或非典型碱基的脱氧核糖核苷酸三磷酸,或修饰的或非典型的脱氧核糖核苷酸三磷酸)的浓度可低于MDA反应中另一脱氧核糖核苷酸三磷酸的浓度,使得反义链中存在的尿嘧啶碱基(或修饰的碱基或非典型碱基,或者修饰的或非典型的核苷酸)的百分比低。尿嘧啶碱基(或修饰的碱基或非典型碱基,或者修饰的或非典型核苷酸)可以随机分布并以低百分比存在,使得两条反义链(任何两条反义链)在不同位置包含尿嘧啶碱基(或修饰的碱基或非典型碱基,或者修饰的或非典型核苷酸)。
MDA反应中脱氧核糖核苷酸三磷酸(例如,dATP、dTTP、dGTP或dCTP)的浓度,或者所有脱氧核糖核苷酸三磷酸的浓度,可以是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:0.1mM、0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9mM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、14mM、15mM、16mM、17mM、18mM、19mM、20mM、25mM、30mM、35mM、40mM、45mM、50mM、55mM、60mM、65mM、70mM、75mM、80mM、85mM、90mM、95mM、100mM,或这些数值中任何两个之间的数量或范围。MDA反应中dUTP的浓度可以是以下、是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:0.001mM、0.002mM、0.003mM、0.004mM、0.005mM、0.006mM、0.007mM、0.008mM、0.009mM、0.01mM、0.02mM、0.03mM、0.04mM、0.05mM、0.06mM、0.07mM、0.08mM、0.09mM、0.1mM、0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9mM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、14mM、15mM、16mM、17mM、18mM、19mM、20mM,或这些值中任何两个之间的数量或范围。dUTP(或具有修饰的碱基或非典型碱基的脱氧核糖核苷酸三磷酸,或者修饰的或非典型脱氧核糖核苷酸三磷酸)的浓度相对于dTTP的浓度(或者另一种脱氧核糖核苷酸三磷酸的浓度或除dUTP、或具有修饰的碱基或非典型碱基的脱氧核糖核苷酸三磷酸、或修饰的或非典型脱氧核糖核苷酸三磷酸以外的脱氧核糖核苷酸三磷酸的总浓度)的比值可以是以下、是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:1:100、1:99、1:98、1:97、1:96、1:95、1:94、1:93、1:92、1:91、1:90、1:89、1:88、1:87、1:86、1:85、1:84、1:83、1:82、1:81、1:80、1:79、1:78、1:77、1:76、1:75、1:74、1:73、1:72、1:71、1:70、1:69、1:68、1:67、1:66、1:65、1:64、1:63、1:62、1:61、1:60、1:59、1:58、1:57、1:56、1:55、1:54、1:53、1:52、1:51、1:50、1:49、1:48、1:47、1:46、1:45、1:44、1:43、1:42、1:41、1:40、1:39、1:38、1:37、1:36、1:35、1:34、1:33、1:32、1:31、1:30、1:29、1:28、1:27、1:26、1:25、1:24、1:23、1:22、1:21、1:20、1:19、1:18、1:17、1:16、1:15、1:14、1:13、1:12、1:11、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2,或这些值中任何两个之间的数或范围。MDA反应中为dUTP(或具有修饰的碱基或非典型碱基的脱氧核糖核苷酸三磷酸,或者修饰的或非典型脱氧核糖核苷酸三磷酸)的脱氧核糖核苷酸三磷酸的百分比可以是以下、是约以下、是至少约以下、是至多以下或是至多约以下:0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%,或这些值中任何两个之间的数量或范围。
MDA反应中dUTP(或具有修饰的碱基或非典型碱基的脱氧核糖核苷酸三磷酸,或者修饰的或非典型脱氧核糖核苷酸三磷酸)相对于另一脱氧核糖核苷酸三磷酸诸如dTTP的浓度可以低,使得反义链中存在的尿嘧啶碱基(或修饰的碱基或非典型碱基,或者修饰的或非典型脱氧核糖核苷酸)的百分比低。核苷酸的碱基为尿嘧啶(或修饰的碱基或非典型碱基或者修饰的或非典型核苷酸)相对于碱基为胸腺嘧啶(或另一种碱基,或所有不是尿嘧啶的碱基)的比值可以是以下、是约以下、是至少以下、是至少约以下、是至多以下、或是至多约以下:1:10000、1:9000、1:8000、1:7000、1:6000、1:5000、1:6000、1:5000、1:4000、1:3000、1:2000、1:1000、1:900、1:800、1:700、1:600、1:500、1:400、1:300、1:200、1:100、1:99、1:98、1:97、1:96、1:95、1:94、1:93、1:92、1:91、1:90、1:89、1:88、1:87、1:86、1:85、1:84、1:83、1:82、1:81、1:80、1:79、1:78、1:77、1:76、1:75、1:74、1:73、1:72、1:71、1:70、1:69、1:68、1:67、1:66、1:65、1:64、1:63、1:62、1:61、1:60、1:59、1:58、1:57、1:56、1:55、1:54、1:53、1:52、1:51、1:50、1:49、1:48、1:47、1:46、1:45、1:44、1:43、1:42、1:41、1:40、1:39、1:38、1:37、1:36、1:35、1:34、1:33、1:32、1:31、1:30、1:29、1:28、1:27、1:26、1:25、1:24、1:23、1:22、1:21、1:20、1:19、1:18、1:17、1:16、1:15、1:14、1:13、1:12、1:11、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2,或这些值中任何两个之间的数或范围。反义链中为尿嘧啶的碱基的百分比可以是以下、是约以下、是至少约以下、是至多以下或是至多约以下:0.001%、0.002%、0.003%、0.004%、0.005%、0.006%、0.007%、0.008%、0.009%、0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%,或这些值中任何两个之间的数量或范围。
核酸簇可以在本文阐述方法之前或作为本文阐述方法的一部分制备,例如通过(i)提供具有捕获引物的固体支持物,(ii)将环状核酸模板与引物杂交,(iii)通过滚环扩增沿着环状核酸模板延伸捕获引物来合成串联体的有义链,以及(iv)通过延伸与有义链的序列单元中的引物结合位点结合的扩增引物来合成串联体的反义链,其中反义链包含一个或更多个为尿嘧啶的碱基。
因此,本公开内容提供了一种用于从核酸的有义链和反义链确定序列的方法,包括以下步骤:(a)(i)提供具有捕获引物的固体支持物,(ii)将环状核酸模板与引物杂交,(iii)通过滚环扩增沿着环状核酸模板延伸捕获引物来合成串联体的有义链,以及(iv)通过延伸与有义链的序列单元中的引物结合位点结合的扩增引物合成串联体的反义链,其中反义链包含一个或更多个为尿嘧啶的碱基,从而提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)将第二引物与有义链的序列单元中的引物结合位点杂交;以及(e)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列。
本文公开的从核酸的有义链和反义链确定序列的方法可用于从样品中核酸的有义链和反义链确定序列。有利地,该方法可以对某些尺寸的核酸没有或有最小的偏向或偏好,使得被测序的样品中核酸的尺寸分布与实际测序的靶序列的尺寸分布相同、相似或相当。被测序的样品中核酸的尺寸分布与从对第一链和/或第二链测序产生的读段的尺寸分布相同或相似或相当。该分布可以是,例如,正态分布。
可在本文阐述方法中进行的特别有用的测序过程是采用重复的试剂递送循环的循环过程。每个循环可以包括一个步骤或多于一个步骤。例如,每个循环可以包括检测模板核酸中单个核苷酸位置所需的所有步骤。一些测序过程采用循环可逆终止子(CRT)化学,其中每个循环包括以下步骤:(i)添加单个可逆终止的核苷酸,以将新生引物增加到待检测的核苷酸位置;(ii)在单核苷酸位置检测核苷酸,和(iii)使新生引物解封闭以允许返回步骤(i)以开始后续循环。
用于从核酸的有义链和反义链确定序列的方法可以包括以下步骤:(a)提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)将第二引物与有义链的序列单元中的引物结合位点杂交;和(e)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列。任选地,步骤(e)中的延伸第二引物包括(i)向第二引物添加可逆终止的核苷酸和(ii)使第二引物上的可逆终止的核苷酸解封闭的重复的循环。作为另外或替代选择,步骤(c)中的延伸引物可以包括(i)向引物添加可逆终止的核苷酸和(ii)使引物上的可逆终止的核苷酸解封闭的重复的循环。
无论步骤(c)和步骤(e)中的一个或两个包括如上阐述的重复步骤(i)和步骤(ii),步骤(c)和/或步骤(e)中的重复循环可以任选地包括(iii)检测稳定化的三元复合物,该三元复合物包含聚合酶、下一个正确的核苷酸和分别与反义链或有义链杂交的第二引物。作为另一选择,下一个正确的核苷酸或聚合酶可以具有在步骤(c)和/或步骤(e)中被检测以产生信号的标记,该信号用于分别从反义链或有义链中的靶序列的至少部分确定序列。
有用的CRT核酸测序过程的一个具体实例是Sequencing By BindingTM(SBBTM)反应,例如,如在以下中描述的:共同拥有的美国专利申请公布第2017/0022553A1号;第2018/0044727A1号;第2019/0169688A1号;第2019/0345544A1号;第2019/0367974A1号,其中的每一个通过引用并入本文。通常,用于确定模板核酸分子序列的SBBTM方法可以基于在特定条件下形成稳定化的三元复合物(在聚合酶、引发的核酸和同源核苷酸之间)。该方法可以包括检查阶段和核苷酸掺入阶段。
可以对用引物、聚合酶和至少一种核苷酸类型引发的至少一种模板核酸分子进行SBBTM过程的检查阶段。在核苷酸未共价添加到引物的条件下,可以观察到聚合酶和核苷酸与引发的模板核酸分子的相互作用;并且可以基于观察到的相互作用来识别每个模板核酸中的下一个碱基。例如,核苷酸可以包含可检测的标记。在一些实施方案中,聚合酶可以被标记。在检查阶段期间,多种条件和试剂可用于稳定三元复合物。例如,引物可以包含阻止核苷酸共价附接的可逆封闭部分;和/或可以不存在延伸所需的聚合酶辅因子,诸如二价金属离子;和/或可以存在抑制基于聚合酶的引物延伸的抑制性二价阳离子;和/或存在于检查阶段的聚合酶可以具有抑制引物延伸的化学修饰和/或突变;和/或核苷酸可以具有抑制掺入的化学修饰。在特定的实施方案中,三元复合物通过Li+、甜菜碱或二者的存在而稳定。例如,可以使用阐述在美国专利第10,400,272号(其通过引用并入本文)中的试剂和技术。
应当理解,本文阐述的用于稳定三元复合物的选项不必相互排斥,而是可以以各种组合使用。例如,三元复合物可以通过一种或多种方法的组合来稳定,这些方法包括但不限于聚合酶结构域的交联、聚合酶与核酸的交联、稳定三元复合物的聚合酶突变、小分子的变构抑制、反竞争性抑制剂、竞争性抑制剂、非竞争性抑制剂、催化金属离子的不存在、引物上封闭部分的存在以及本文阐述的其他方法。
通常,检测可以在检查步骤中通过感知三元复合物或与其附接的标记部分的固有特性的方法来实现。检测可基于的示例性特性包括但不限于质量、电导率、能量吸收、发光等。可以使用本领域中已知的核酸阵列有关的方法来进行发光的检测。可以基于多种发光特性中的任何一种来检测发光团,这些发光特性包括例如发射波长、激发波长、荧光共振能量转移(FRET)、猝灭、各向异性或寿命。可用于本文阐述方法的其他检测技术包括,例如,可用于感知质量的质谱;表面等离子体共振,可用于感知聚合酶或其他分析物在表面的结合;吸光度,可以用于感知标记吸收的能量的波长;量热法,可用于感知由于标记的存在而引起的温度变化;电导或阻抗,可用于感知标记的电特性,或其他已知的分析技术。
延伸阶段可以通过创造其中核苷酸可以添加到与模板核酸分子杂交的引物的条件来进行。在一些实施方案中,这涉及去除检查阶段中使用的试剂,并用促进延伸的试剂替换它们。例如,检查试剂可以用聚合酶和可逆终止的核苷酸代替。
参与稳定化三元复合物的核苷酸类似物,或通过聚合酶催化添加到引物中的核苷酸类似物,可以包含终止子部分,该终止子部分在类似物掺入引物后可逆地防止随后的核苷酸掺入到引物的3’末端。例如,美国专利7,544,794和美国专利8,034,923(这些专利的公开内容通过引用并入本文)描述了可逆终止子部分,其中3’-OH基团被3’-ONH2部分代替。另一类型的可逆终止子部分连接到核苷酸的含氮碱基,例如如在美国专利8,808,989(其公开内容通过引用并入本文)中阐述的。可类似地结合本文所述方法使用的其他可逆终止子部分包括在本文其他地方引用的参考文献中或在美国专利7,956,171、美国专利8,071,755和美国专利9,399,798(这些美国专利的公开内容通过引用并入本文)中描述的那些。在某些实施方案中,可逆终止子部分可以在称为“解封闭”的过程中被修饰或从引物中去除,从而允许随后的核苷酸掺入。
当包括在本文阐述的方法中时,解封闭过程可以促进引物-模板核酸杂合体的测序。解封闭过程可用于将可逆终止的引物转换为可延伸的引物。然后,引物延伸可用于将三元复合物形成的位点沿着模板核酸移动到不同的位置。延伸、检查和解封闭的重复循环可以用于揭示模板核酸的序列。每个循环揭示模板核酸中随后的碱基。示例性可逆终止子部分、用于将它们掺入到引物中的方法和用于修饰引物以进一步延伸(通常称为“解封闭”)的方法在美国专利第7,427,673号;第7,414,116号;第7,544,794号;第7,956,171号;第8,034,923号;第8,071,755号;第8,808,989号;或第9,399,798号中阐述。另外的实例阐述在以下中:Bentley等人,Nature456:53-59(2008)、WO 04/018497;美国专利第7,057,026号;WO 91/06678;WO 07/123744;美国专利第7,329,492号;美国专利第7,211,414号;美国专利第7,315,019号;美国专利第7,405,281号和US 2008/0108082,其中的每一个通过引用并入本文。
在特定的实施方案中,在与引物-模板杂合体形成稳定化的三元复合物的步骤之前,去除在引物修饰步骤期间使用的试剂(例如,通过添加核苷酸来延伸引物或通过添加三元复合物抑制剂部分来加帽引物)以避免与引物-模板杂合体的接触。例如,当混合物中的一种或更多种类型的核苷酸会干扰随后检查步骤中三元复合物的形成或检测时,可能期望去除用于延伸步骤的核苷酸混合物。类似地,可能期望去除在引物修饰步骤中使用的聚合酶或辅因子,以便在随后的检查步骤中防止不想要的催化活性。然而,如果需要,可以去除来自延伸步骤的核苷酸,而来自延伸步骤的聚合酶被保留并进行到形成三元复合物的步骤。参见,例如,美国专利申请公布第2020/0032317A1号,其通过引用并入本文。因此,在检查步骤中检测到的三元复合物可以包含在先前引物延伸步骤中使用的聚合酶分子。去除反应组分后可进行洗涤步骤,其中惰性流体用于清除用于引物修饰的试剂混合物的残留组分中的引物-模板杂合体。
另一个有用的CRT测序过程是合成测序(SBS)。SBS通常包括通过针对与引物杂交的模板链迭代添加核苷酸来对新生引物进行酶促延伸。简言之,SBS可以通过使已引发的靶核酸与一种或更多种标记的核苷酸、DNA聚合酶等接触来启动。引物将掺入可以检测的标记的核苷酸。标记的核苷酸中的标记可被去除。在标记的核苷酸中的标记被去除后,分子疤痕可能会保留。相比之下,在延伸阶段掺入引发的模板中的核苷酸可以是未标记的核苷酸,诸如天然核苷酸。因此,不需要从掺入的核苷酸去除标记。任选地,标记的核苷酸还可以包含可逆终止子部分。因此,将单个可逆终止的核苷酸添加到引物中,使得随后的延伸不会发生,直到递送解封闭剂以从引物中去除可逆终止子部分。SBS循环可以进行n次以将引物延伸n个核苷酸,从而检测长度为n的序列。可以容易地适用于本文的***或设备的示例性SBS程序、试剂和检测组件被描述于例如Bentley等人,Nature456:53-59(2008)、WO 04/018497;WO 91/06678;WO 07/123744;美国专利第7,057,026号;7,329,492号;第7,211,414号;第7,315,019号或第7,405,281号,和美国专利申请公布第2008/0108082A1号,其中的每一个通过引用并入本文。也有用的是从Illumina,Inc.(San Diego,CA)商购可得的SBS方法。
因此,用于从核酸的有义链和反义链确定序列的方法可以包括以下步骤:(a)提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)将第二引物与有义链的序列单元中的引物结合位点杂交;和(e)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列。任选地,步骤(e)中的延伸第二引物包括(i)向第二引物添加可逆终止的核苷酸和(ii)使第二引物上的可逆终止的核苷酸解封闭的重复的循环。作为另外或替代选择,步骤(c)中的延伸引物可以包括(i)向引物添加可逆终止的核苷酸和(ii)使引物上的可逆终止的核苷酸解封闭的重复的循环。
无论步骤(c)和步骤(e)中的一个或两个包括如上阐述的重复步骤(i)和步骤(ii),在步骤(c)或步骤(e)中添加到引物中的可逆终止的核苷酸可任选地具有被检测以产生信号的标记,该信号用于分别从反义链或有义链中的靶序列的至少部分确定序列。作为另一选择,步骤(c)和步骤(e)中的一个或两个中的重复循环还可以包括(iii)在标记被检测之后去除标记。
一些SBS实施方案是循环的,但不需要使用可逆终止子核苷酸。一种特别有用的方法包括检测在将核苷酸掺入到延伸产物中时释放的质子。例如,基于释放质子检测的测序可以使用从Thermo Fisher(Waltham,MA)商购可得或在以下中描述的试剂和电检测器:美国专利申请公布第2009/0026082 A1号;第2009/0127589 A1号;第2010/0137143 A1号;或第2010/0282617 A1号,其中的每一个通过引用并入本文。另一个不需要使用可逆终止子核苷酸的循环测序过程是焦磷酸测序。焦磷酸测序检测当核苷酸掺入到与模板核酸链杂交的新生引物中时无机焦磷酸(PPi)的释放(Ronaghi,等人,Analytical Biochemistry 242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11(2001);Ronaghi等人Science 281(5375),363(1998);美国专利第6,210,891号;第6,258,568号和第6,274,320号,其中的每一个通过引用并入本文)。
连接测序反应也是有用的,包括,例如,在以下中描述的那些:Shendure等人Science 309:1728-1732(2005);美国专利第5,599,675号;或美国专利第5,750,341号,其中的每一个通过引用并入本文。杂交测序程序可以如,例如,在以下中描述的使用:Bains等人,Journal of Theoretical Biology 135(3),303-7(1988);Drmanac等人,NatureBiotechnology 16,54-58(1998);Fodor等人,Science 251(4995),767-773(1995);或WO1989/10977,其中的每一个通过引用并入本文。在连接测序和杂交测序二者的程序中,与核酸模板杂交的引物通过寡核苷酸连接,例如使用荧光标记的寡核苷酸进行重复的延伸循环。
试剂去除或洗涤程序可以在本文阐述的多种步骤中的任何步骤之间进行。这些程序可用于去除反应容器中或固体支持物上存在的一种或更多种试剂。例如,试剂去除或洗涤步骤可用于将引物-模板杂合体与在三元复合物稳定条件下与引物-模板杂合体接触的其他试剂分离。在特定的实施方案中,通过将感兴趣的试剂,诸如引物-模板杂合体,附接到固体支持物并去除与固体支持物接触的流体来促进试剂的分离。根据需要,本文阐述的一种或更多种试剂可以附接到固体支持物或在溶液中提供,以适合本文阐述的方法或设备的特定用途。
测序方法可以包括本文阐述的循环或循环内的步骤的多于一次重复。例如,检查和引物修饰步骤可以重复多于一次,以及在各种步骤之间对引物进行解封闭或洗去不想要的反应物或产物的任选步骤也可以重复多于一次。因此,核酸可以经历本文阐述的测序方法的至少2个、5个、10个、25个、50个、100个、150个、200个或更多个重复的循环。当需要更短的读段长度时,可以进行更少的循环。因此,核酸可以经历本文阐述的测序方法的至多200个、150个、100个、50个、25个、10个、5个或2个循环。上述循环数范围可适用于本文阐述的任何循环可逆终止子过程。在一些实施方案中,测序方法可以进行预定数量的重复的循环。可选地,循环可以重复,直到达到特定的经验观察状态。例如,只要信号高于可观察阈值、噪声低于可观察阈值或信噪比高于可观察阈值,就可以重复循环。
可用于本文阐述方法中的测序方法的其他实例包括在由IlluminaTM,Inc.(例如HiSeqTM、MiSeqTM、NextSeqTM或NovaSeqTM***)、Life TechnologiesTM(例如ABI PRISMTM或SOLiDTM***)、Pacific Biosciences(例如,使用SMRTTM Technology的***诸如SequelTM或RS IITM***)、MGI Tech(DNBSEQ-T7、MGISEQ-2000、MGISEQ-200或BGISEQ-500)、或Qiagen(例如GenereaderTM***)商业化的平台上采用的方法。
本文阐述的用于确定核酸的有义链和反义链的序列的方法可以在反义链存在而有义链被测序的条件下进行(参见图2B的实例)。在该方法的可选配置中,在有义链的测序期间,反义链可以不存在(参见图2C和图2D的实例)。
本文阐述的用于确定核酸的有义链和反义链的序列的方法可以在有义链存在而反义链被测序的条件下进行(参见图2A的实例)。在该方法的可选配置中,在反义链的测序期间,有义链可以不存在。
本文阐述的用于确定核酸的有义链和反义链的序列的方法可以在有义链存在而反义链被测序,以及其中反义链存在而有义链被测序的条件下进行(参见图2A和图2B的实例)。在该方法的可选配置中,在反义链的测序期间有义链可以不存在,并且在有义链的测序期间反义链可以不存在。
本文阐述的用于确定核酸的有义链和反义链的序列的方法可以在其中当有义链被测序时,反义链与引物(例如,通过对反义链进行测序而产生的非延伸的引物或延伸的引物)杂交的条件下进行(参见图2B的实例)。在该方法的可选配置中,在反义链测序期间延伸的测序引物在有义链测序期间可以不存在(参见图2C和图2D的实例)。
本文阐述的用于确定核酸的有义链和反义链的序列的方法可以在其中当反义链被测序时,有义链与引物(例如,通过对有义链进行测序而产生的非延伸的引物或延伸的引物)杂交的条件下进行。在该方法的可选配置中,在有义链测序期间延伸的测序引物在反义链测序期间可以不存在。
本文阐述的用于确定核酸的有义链和反义链的序列的方法可以在以下条件下进行:当反义链被测序时,有义链与引物(例如,通过对有义链进行测序而产生的非延伸的引物或延伸的引物)杂交,以及其中当有义链被测序时,反义链与引物(例如,通过对反义链进行测序而产生的非延伸的引物或延伸的引物)杂交。在该方法的可选配置中,在有义链测序期间延伸的测序引物在反义链测序期间可以不存在,并且在反义链测序期间延伸的测序引物在有义链测序期间可以不存在。
在确定有义链序列的步骤和合成反义链的步骤同时发生的情况下,可以进行本文阐述的用于确定核酸的有义链和反义链序列的方法。例如,在确定有义链序列的步骤期间,合成部分反义链。图3A-图3F说明了确定核酸的有义链和反义链的序列的非限制性示例性方法,其中合成的反义链包括来自对有义链进行测序的延伸产物。
因此,本公开内容提供了一种用于从核酸的有义链和反义链确定序列的方法。方法可以包括以下步骤:(a)提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)从簇中去除反义链;(e)在反义链去除后,将第二引物与有义链的序列单元中的引物结合位点杂交;和(f)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列。
可选地,本公开内容提供了一种用于从核酸的有义链和反义链确定序列的方法。该方法可以包括以下步骤:(a)提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)将第二引物与有义链的序列单元中的引物结合位点杂交;和(e)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列,其中步骤(d)和步骤(e)在反义链存在于簇中时进行。应当理解,步骤(d)和步骤(e)可以根据需要在步骤(b)和步骤(c)之前或之后进行。
本公开内容提供了在双链核酸的另一链存在的情况下对双链核酸的一条链进行测序的方法。在一些配置中,测序将包括在与另一条链杂交的第二引物存在的情况下沿着双链核酸的一条链延伸第一引物。可以向第二引物中添加封闭部分或加帽部分,从而允许第一引物在第二引物存在的情况下选择性地延伸。图2A和图2B的图中提供了一个实例。方法的起点,如图2A所示,是具有串联体有义链(指示为黑线,其具有由空心和带线矩形指示的引物结合位点)和串联体反义链(指示为灰线,其具有由空心和带线矩形指示的引物结合位点)的簇。存在于有义链上的多于一条反义链在本文称为反义链鳞片。簇中可延伸的3’末端,诸如反义链的3’末端(由灰线上的箭头指示)可以任选地用封闭部分或加帽部分来修饰。然后,可以使用第一组测序引物(以空心箭头指示)和核苷酸(以灰色菱形指示)对反义链进行测序。继续到图2B,然后可以用封闭部分或加帽部分修饰延伸的引物。然后,可以使用第二组测序引物(以带线箭头指示)和核苷酸(以黑色菱形指示)对有义链进行测序。有义链的测序可以在来自反义链测序的延伸产物存在的情况下进行,因为在有义链测序期间,延伸产物已经被封闭或加帽以防止延伸产物产生背景信号。
应当理解,核酸簇可以具有多种3’末端中的任何一个,这些末端在旨在延伸感兴趣的引物的条件下可能会被不期望地延伸。这些3’末端不仅可能存在于第二引物上,而且可能存在于簇中的有义链或反义链的末端。簇中不想要的3’末端的存在会产生由这些3’末端的延伸引起的背景信号,并且这些背景信号会阻碍解析由第一引物的基于测序的延伸引起的所需信号的能力。如图2A中的第一步骤所示,在本文阐述的方法中,可以通过修饰这些3’末端以掺入阻止修饰的3’末端的聚合酶延伸的封闭部分或掺入抑制在修饰的3’末端形成三元复合物的加帽部分来避免这种伪影。
在另一个实例中,阵列位点可以包含有义链和反义链,并且其中一条链可以被加帽,使得可以选择性地对另一条链进行测序,而不受来自加帽链的背景干扰。选择性引物加帽可用于对更大核酸分子的配对区域进行测序,以确定基因组中两个区域之间的结构关系。选择性引物加帽还可以允许靶序列和相关标签序列的单独测序。示例性标签包括但不限于附加到靶序列以识别靶序列来源的核酸序列(特定标签序列独特地附加到从特定细胞、组织或其他样品收获的靶核酸)。标签也可以用来区分生物学(例如临床)有兴趣的突变或多态性与样品提取和制备程序期间引入的错误。这种标签通常被称为独特分子标识符(UMI)。
封闭部分可以以本文阐述的多种方式中的任何一种添加到引物或其他核酸中。例如,具有封闭部分的核苷酸可以通过聚合酶催化添加到引物或其他核酸的3’末端。可选地,在与核酸分子或簇杂交之前,可以对引物进行化学修饰以掺入封闭部分。关于CRT测序过程的封闭和解封闭步骤,本文阐述了用于封闭3’末端的示例性方法。在一些实施方案中,引物或其他核酸可以用可逆终止子部分修饰。在这样的配置中,可逆终止子可以被去除或修饰以将引物或其他核酸解封闭以用于随后的延伸。
加帽部分可以以本文阐述的多种方式中的任何一种添加到引物或其他核酸中。例如,可以在将引物与模板杂交之前将加帽部分添加到引物中。在另一个实例中,可以通过合成技术添加加帽部分。可选地,可以将引物与模板杂交,并且随后可以修饰引物以包含加帽部分。任选地,引物可以延伸以掺入包含配体的核苷酸,并且然后该配体可以结合到充当三元复合物形成抑制剂的受体。用于将核酸加帽的有用试剂和方法阐述于美国专利申请公布第2019/0367974 A1号,其通过引用并入本文。
在另一个实例中,引物可以具有与另一试剂反应以形成加帽部分的化学可修饰部分。引物可以在与模板杂交之前具有化学可修饰部分,或可选地,在引物与模板杂交之后,引物可以延伸以掺入具有化学可修饰部分的核苷酸。随后,化学可修饰部分可共价反应以将三元复合物抑制剂附接到引物。合适的化学可修饰部分可以包括诸如以下的官能团:氨基基团、羧基基团、马来酰亚胺基团、氧代基团或硫醇基团。本文在将核酸附接到固体支持物的上下文中举例说明的官能团,诸如点击化学,也可以是有用的。
本公开内容的方法可以包括引物修饰过程,由此将核苷酸或其他部分添加到引物中。引物修饰过程可用于制备用于测序过程或用于核酸分析(诸如测序分析)期间使用的检查过程的引物-模板核酸杂合体。例如,引物修饰可以在核酸的3’末端添加可逆终止子部分,以防止核酸在扩增或测序过程中被延伸。可选地或另外地,引物修饰可以向核酸添加帽部分,以防止在核酸的3’末端形成三元复合物。
因此,本公开内容提供了一种用于从核酸的有义链和反义链确定序列的方法。该方法可以包括以下步骤:(a)提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)将引物与簇中反义链的序列单元中的引物结合位点杂交;(c)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(d)向延伸的引物中添加封闭部分或加帽部分;(e)将第二引物与有义链的序列单元中的引物结合位点杂交;和(f)沿着有义链延伸第二引物以从有义链中靶序列的至少一部分确定序列,其中封闭部分阻止延伸的引物的进一步延伸,或者其中加帽部分阻止聚合酶结合延伸的引物的3’末端。
本公开内容还提供了一种用于从核酸的有义链和反义链确定序列的方法,包括以下步骤:(a)提供附接到固体支持物的核酸簇,其中核酸簇包含串联体的有义链和串联体的反义链,其中串联体包含串联连接的序列单元的多于一个拷贝,其中序列单元包含靶序列和引物结合位点;(b)在附接到固体支持物的核酸簇的3’末端添加封闭部分或加帽部分;(c)将引物与簇中反义链的序列单元中的引物结合位点杂交;(d)沿着反义链延伸引物以从反义链中靶序列的至少一部分确定序列;(e)将第二引物与有义链的序列单元中的引物结合位点杂交;和(f)沿着有义链延伸第二引物以从有义链中的靶序列的至少一部分确定序列。任选地,该方法还可以包括在步骤(d)之前,向延伸的引物添加封闭部分,从而防止延伸的引物在步骤(f)期间的进一步延伸。作为可选或另外的选择,该方法还可包括在步骤(d)之前向延伸的引物添加加帽部分,从而防止聚合酶在步骤(f)期间结合延伸的引物的3’末端。
特别有用的加帽化学将是对引物或其他核酸的3’末端具有选择性的。加帽化学可以是对核酸3’末端的氧或羟基部分具有选择性的。例如,加帽化学可以对非封闭引物的3’末端是反应性的,而对修饰封闭的引物是惰性的。使用对引物天然3’末端特异的酶的化学特别有用,包括例如连接酶和聚合酶。与封闭的引物相比,在修饰天然3’引物末端时更有效的加帽程序对许多应用是有益的。
在特定的实施方案中,三元复合物抑制剂用于对引物加帽。可以向引物中添加多种部分中的任何一种,以阻碍或防止随后在引物的3’末端形成三元复合物。任选地,由于连接酶催化的寡核苷酸的5’末端与引物的3’末端的附接,或者由于聚合酶催化的一系列核苷酸对引物的延伸,引物可以附接到寡核苷酸部分。连接酶、聚合酶和其他修饰引物的酶可以是有用的。然而,化学技术也可用于在本文阐述的方法中修饰引物。附接到引物的寡核苷酸部分可以包含一个或更多个非天然核苷酸类似物。这些类似物可以因其与模板形成碱基对的能力而被选择,但也可以使用不与模板配对的类似物。类似地,天然核苷酸可以存在于寡核苷酸部分中形成破坏寡核苷酸和模板之间碱基配对的错配的一个或更多个位置。对于错配或非天然核苷酸类似物特别有用的位置是在或靠近寡核苷酸部分的3’末端,在那里它可以起到抑制随后三元复合物形成的作用。
可以添加到引物中以阻碍或防止随后在引物3’末端形成三元复合物的有用部分的另一个实例是单个核苷酸(例如,天然核苷酸或非天然核苷酸类似物)。例如,错配的核苷酸可以附接在引物的3’末端,以防止三元复合物形成。特别有用的错配和其识别错配的能力受到影响的聚合酶阐述于Kwok等人,Nucleic Acids Res.18(4):999–1005(1990),其通过引用并入本文。错配的核苷酸可以存在于引物的3’末端,其通过添加到引物中的寡核苷酸部分引入。在一些实施方案中,一系列两个或更多个错配核苷酸可以在或靠近引物的3’末端存在,以实现对三元复合物形成的抑制。
无论添加到引物3’末端的核苷酸是否与模板匹配,该核苷酸都可以包含起三元复合物抑制剂的作用的外源部分。外源部分可以具有空间阻碍效应,从而阻碍聚合酶、核苷酸或二者形成三元复合物。该部分可对三元复合物形成具有其他影响,包括但不限于聚合酶或同源核苷酸的电荷排斥、引物-模板核酸杂合体结构的扰动、排斥聚合酶或同源核苷酸的极性等。外源部分可以通过接头附接到核苷酸,例如附接到引物3’末端的核苷酸。特别有用的接头具有相对较短的长度,使得三元复合物抑制发生在引物3’末端的近端。例如,接头可以具有从单个共价键到多达2个、5个、10个或15个共价键的长度。可选地或另外地,接头可以具有短于20个、15个、10个或5个共价键的长度。因此,接头可以保持核苷酸上的附接点与三元复合物抑制剂上的附接点之间的距离为至多例如
Figure BDA0003922747110000471
Figure BDA0003922747110000472
或更小。相对缺乏柔韧性可以是接头的一个有用特征,同样,使得抑制剂部分将靠近引物的3’末端。因此,具有酰胺、酯、碳-碳双键、碳-碳三键、环结构和其他旋转约束键结构的接头可以是有用的。
特别有用的可附接到核苷酸的外源部分包括但不限于可以阻碍或防止三元复合物形成的生物素或其他配体,由于它们在3’末端的存在或由于它们与抗生物素蛋白、链霉抗生物素蛋白或其他受体的相互作用,继而防止三元复合物形成。可使用的示例性生物素类似物包括但不限于生物素碳酸酯5或生物素氨基甲酸酯6(参见Yamamoto Chem AsianJ.10:1071-1078(2015),其通过引用并入本文)、2-亚氨基生物素、二氨基生物素或脱硫生物素。当在不使抗生物素蛋白或链霉抗生物素蛋白变性的相对温和的条件下去除帽时,与抗生物素蛋白或链霉抗生物素蛋白可逆地结合的生物素类似物可以特别有用。对链霉抗生物素蛋白或抗生物素蛋白有亲和力的肽也可以是有用的,诸如用于SBP-标签***的肽(参见Keefe等人Protein Expression and Purification 23:440-446(2001),其通过引用并入本文)。
可用于形成三元复合物抑制剂的其他配体-受体对包括但不限于抗体(或其功能片段,诸如Fab或ScFv)和表位;碳水化合物和凝集素;或核酸(或其类似物)及其互补核酸(或其类似物)。可以使用多种功能性抗体片段中的任何一种,包括,例如,单价种类诸如Fab或scFv,或者其他单价种类或其工程化变体诸如F(ab’)2、双链抗体、三链抗体、微型抗体或单域抗体(参见Holliger和Hudson,Nat.Biotechnol.23:1126-1136(2005),其通过引用并入本文)。另一类特别有用的配体-受体对是在与重组蛋白融合时通常用作纯化标签的肽及其结合配偶体。示例性肽包括但不限于与二价阳离子诸如Ni2+结合的多组氨酸(6个或更多个组氨酸的多肽序列)、与谷胱甘肽结合的谷胱甘肽-S-转移酶(GST)、结合抗myc抗体(从Developmental Studies Hybridoma Bank at the University of Iowa可得)的myc-标签(例如具有序列:EQKLISEEDL(SEQ ID NO:1)的多肽);结合钙调蛋白的钙调蛋白结合肽(CBP,例如具有序列KRRWKKNFIAVSAANRFKKISSSGAL(SEQ ID NO:2)的多肽);与抗FLAG抗体结合的FLAG标签(例如具有肽序列:DYKDDDD(SEQ ID NO:3)或DYKDDDDK(SEQ ID NO:4)或DYKDDDK(SEQ ID NO:5));或与直链淀粉或麦芽糖结合的麦芽糖结合蛋白。应当理解,当使用上述纯化标签***时,肽或其结合的分子可以与核苷酸或引物共价连接。通常,优选通过接头将较小的配偶体与核苷酸附接,并且然后将其与较大的配偶体结合以形成三元复合物抑制剂。
使用配体-受体作为加帽部分的优点是配体不需要抑制三元复合物的形成,直到它与受体结合。例如,附接到配体的核苷酸可以与聚合酶和引物-模板核酸结合形成三元复合物,并且核苷酸可以掺入到引物中以将配体定位在引物的3’末端。然后,该受体可以与引物3’末端的配体结合,以抑制在引物3’末端形成三元复合物。
在本文阐述方法中添加到引物中的封闭核苷酸不需要具有外源标记。这是因为在本文阐述的方法中不需要检测延伸的引物。然而,如果需要,可以例如通过附接到核苷酸的外源标记来检测用于本文阐述方法中的一种或更多种类型的可逆终止核苷酸。示例性可逆终止子部分、用于将它们掺入到引物中的方法以及用于修饰引物以进一步延伸(通常称为“解封闭”)的方法在本文的其他地方和本文引用的参考文献中阐述。
类似地,在本文阐述方法中添加到引物中的三元复合物抑制剂或其他引物帽不需要具有外源标记。这是因为在本文阐述的方法中不需要检测包含加帽部分的引物-模板核酸杂合体。然而,如果需要,在本文阐述方法中使用的一种或更多种类型的加帽部分可以例如通过附接到帽或三元复合物抑制剂的外源标记来检测。
本公开内容提供了用于在存在另一核酸链的情况下对一条核酸链进行测序,然后去除被测序的链,并且然后对另一链进行测序的方法。实例在图2A、图2C和图2D的图中提供。方法的起点,如图2A所示,是具有串联体有义链(指示为黑线,其具有由空心和带线矩形指示的引物结合位点)和串联体反义链(指示为灰线,其具有由空心和带线矩形指示的引物结合位点)的簇。簇中可延伸的3’末端,诸如反义链的3’末端(由灰线上的箭头指示)可以任选地用封闭部分或加帽部分来修饰。然后,可以使用第一组测序引物(以空心箭头指示)和核苷酸(以灰色菱形指示)对反义链进行测序。继续到图2C,然后,反义链和延伸的引物可以从簇中去除,例如通过变性、降解或其他方法。参考图2D,然后,反义链和延伸的引物可以通过酶消化从簇中去除。例如,反义链可以包含为尿嘧啶的碱基(在反义链中由“星号”指示),如参考图1E所述。尿嘧啶DNA糖基化酶(UDG)可用于催化反义链中尿嘧啶碱基的切除,形成脱碱基(无嘧啶)位点,同时保持反义链的磷酸二酯主链完整。然后,可以使用内切核酸酶VIII的裂解酶活性来破坏脱碱基位点3’和5’侧的磷酸二酯主链,从而释放脱碱基位点剩余的无碱基脱氧核糖部分,导致反义链上的切口。然后可以使用消化双链DNA的核酸酶来消化掉剩余的反义链和延伸的引物。例如,双链特异性并且具有5’至3’外切核酸酶活性的外切核酸酶(诸如T7外切核酸酶)可用于从5’末端(反义链和延伸的引物的5’末端,以及反义链切口处的5’末端)消化剩余的反义链和延伸的引物。尽管本申请参考图1E描述了MDA反应可以在存在dUTP(或其类似物)的情况下进行,使得产生的反义链包含尿嘧啶碱基,这仅用于说明,并不旨在限制。例如,MDA反应可以在存在具有修饰的碱基或非典型碱基的脱氧核糖核苷酸三磷酸的情况下进行,使得产生的反义链包含一个或更多个修饰的或非典型碱基。这样的修饰的碱基或非典型碱基可以靶向反义链以进行降解,诸如参考图2D所描述的酶消化。作为另一个实例,MDA反应可以在存在修饰的或非典型脱氧核糖核苷酸三磷酸(例如,脱氧核糖假尿苷三磷酸)的情况下进行,使得产生的反义链包含一个或更多个修饰的或非典型核苷酸(例如,脱氧核糖假尿苷单磷酸)。这样的修饰的核苷酸或非典型核苷酸可以靶向反义链以进行降解,诸如参考图2D所描述的酶消化。
参考图2C和图2D,然后,可以使用第二组测序引物(以带线箭头指示)和核苷酸(以黑色菱形指示)对有义链进行测序。可以在不存在反义链和来自反义链测序的延伸产物的情况下进行有义链的测序。
图3A-图3F提供用于从核酸的第一链和第二链确定序列的方法的示意图。在图3A-图3F中,第一链以虚线说明,并且第二链以实线说明。如在图3A中所示,核酸捕获引物302通过接头附接到固体支持物304。引物可用于通过与引物互补的引物结合位点306A、306P捕获靶核酸306。在图3A中示出的一种配置中,固定的引物可以与存在于靶序列306T相对末端的引物结合位点306A、306P的部分杂交。因此,固定的引物起到将靶核酸的两末端聚集在一起的夹板的作用。两个末端可以在与夹板核酸杂交的同时连接以形成靶核酸的环状形式306c。单链308是由聚合酶(诸如Phi29)通过与固定的引物杂交的引发的环状模板的等温扩增(诸如滚环扩增)而产生的。合成的单链可以是串联体。从核酸引物合成的单链串联体在本文可称为串联体的第一链(或串联体的有义链)。该单链可以包含环状模板的多于一个拷贝,并且是序列单元的串联体。第一链可以在未进行聚合酶链式反应的情况下从核酸模板产生。引物和合成的单链在图3A中以虚线示出。在图3A中,已经产生了环状模板的两个拷贝(两个序列单元),并且环状模板与正在复制的第三拷贝(第三序列单元)的一部分杂交。图3B示出了不存在环状模板的RCA反应的最终产物。在RCA反应后的方法的随后步骤期间,RCA反应的最终产物可以不与环状模板杂交。在一些实施方案中,RCA反应的最终产物在RCA反应之后的方法的一个或更多个随后步骤期间与环状模板杂交。
参考图3B-图3D,使用测序引物310确定第一链序列的步骤和使用扩增引物合成第二链(例如,反义链)的步骤可以同时发生。例如,测序引物可以引发第一链。可以延伸测序引物以产生延伸产物312,以使用例如聚合酶(未示出)来确定第一链的序列。本公开内容的任何测序方法,诸如SBBTM或SBS,可用于确定第一链的序列并产生第二链。用于确定第一链序列的测序引物的延伸产物可以用MDA进一步延伸,以产生串联体的第二链314(参见图3D的实例)。聚合酶,诸如具有链置换活性的聚合酶,可用于用MDA进一步延伸测序延伸产物以产生第二链。合成的第二链包括来自使用测序引物对第一链进行测序的延伸产物。测序引物、测序引物的延伸产物和产生的第二链在图中以实线示出。图中所示的与第一链结合的测序引物的数量、测序引物的延伸产物的数量和产生的第二链的数量仅用于说明而不是旨在限制。通过进一步延伸测序引物的延伸产物而产生的多于一条第二链在图3D-图3F中以鳞片出现,并在本文称为第二链鳞片(或反义链鳞片)。
参考图3E,第二链的3’末端可以通过掺入3’封闭或加帽部分316来加帽,以防止进一步延伸和/或在对第二链进行测序时阻碍或排除三元复合物的形成。可以使用本公开内容中其他地方描述的许多3’封闭或加帽部分。第二链可以用测序引物318引发,并通过延伸测序引物来测序以产生在图3F中说明的延伸的测序引物320。
图4A-图4F提供了用于从核酸的第一链和第二链确定序列的方法的示意图,其中第一链和第二链附接到固体支持物。在图4A-图4F中,捕获引物和第一链以虚线说明,并且靶核酸、扩增引物和第二链以实线说明。对应区域以双线(例如,捕获引物的结合位点406AC和扩增引物的结合位点406AA,以及捕获引物和扩增引物上的对应序列)或单线(例如,靶序列406T及第一链和第二链上的对应序列,以及测序引物的结合位点406P’及测序引物上的对应序列)示出。
如在图4A中所示,核酸捕获引物402通过接头附接到固体支持物404,并且核酸扩增引物422通过接头附接到固体支持物。捕获引物可用于通过与捕获引物互补的引物结合位点406A、406P’捕获靶核酸406。在图4B中示出的一种配置中,固定的捕获引物可以与存在于靶序列406T相对末端的引物结合位点406A、406P’的部分杂交。因此,固定的捕获引物起到将靶核酸的两末端聚集在一起的夹板的作用。两个末端可以在与夹板核酸杂交的同时使用例如T4连接酶连接以形成靶核酸的环状形式406c。激酶,诸如T4多核苷酸激酶,可以在靶核酸的连接之前使靶核酸的5’末端磷酸化以形成环状靶核酸。参考图4C-图4D,单链408由聚合酶(诸如Phi29)通过与固定的引物杂交的引发的环状模板的等温扩增(诸如滚环扩增)而产生。合成的单链可以是串联体。从核酸引物合成的单链在本文可称为串联体的第一链(或串联体的有义链)。该单链可以包含环状模板的多于一个拷贝,并且是序列单元的串联体。第一链可以在未进行聚合酶链式反应的情况下从核酸模板产生。引物和合成的单链在图中以虚线示出。图4D示出了仅用于说明目的而产生的环状模板的三个拷贝(三个序列单元),并且不旨在限制。图4D示出了环状模板去除后RCA反应的最终产物。
图4A-图4F中说明的方法可以包括使用附接到固体支持物的扩增引物合成第二链(例如,作为反义链)的步骤。参考图4D,扩增引物422可以引发第一链408。扩增引物可以用MDA延伸以产生在图4E中说明的串联体的第二链414。串联体的第二链可以包含一个或更多个序列单元。图4E说明了一条第二链,其中一个序列单元已经产生了并且第二序列单元开始产生。图4E说明了第二序列单元的产生接近完成的另一条第二链。聚合酶,诸如具有链置换活性的聚合酶,可用于产生第二链,诸如通过MDA。产生的第二链在图中以实线示出。产生的多于一条第二链在图4E中以鳞片出现,并且在本文称为第二链鳞片(或反义链鳞片)。在一种配置中,使用扩增引物合成第二链的步骤和使用测序引物确定第一链的序列的步骤可以同时发生,如参考图3A-图3F描述的。在这种配置中,扩增引物是测序引物。
参考图4A中的插图,结合核酸406的捕获引物402可以包含引物结合位点406A的部分序列的互补序列。用RCA,得到的第一链408可以包含整个引物位点406A的互补序列。用于从第一链408产生多于一条第二链的扩增引物422可以包含引物结合位点的部分序列。捕获引物402和扩增引物422上的引物结合位点的部分序列可以不重叠,如在图4A中的插图中说明的。引物结合位点406A被说明为具有两个区域,与捕获引物402结合的一个区域406AC(示出为具有两条等粗线的双线)和与扩增引物422结合的另一个区域406AA(示出为具有两条不等粗线的双线)。
表面结合的寡核苷酸可以退火到第一链串联体的衔接子位点。可选地,在一些情况下,表面结合的寡核苷酸退火到第一链串联体的相邻或其他不同区域。这些区域通常来源于原始文库衔接子5’或3’末端,尽管也可以设想靶向原始文库或从其衍生的串联体的内部区域的寡核苷酸。
参考图4F,可以使用测序引物418对第二链进行引发和测序。在一种配置中,第二链的3’末端可以通过掺入3’封闭或加帽部分来加帽,以防止第二链的3’末端进一步延伸和/或阻碍或排除在第二链的3’末端形成三元复合物。可以使用本公开内容中其他地方描述的许多3’封闭或加帽部分。第二链可以在第一链被引发或测序之前被引发和测序。可选地,第二链可以在第一链被引发或测序之后被引发和测序。
固体支持物可以包含两种(或更多种,诸如三种、四种、五种、六种、七种、八种、九种、十种或更多种)类型或群体的引物。两种或更多种类型的引物可以,例如,作为多于一种捕获引物和多于一种扩增引物。可选地或另外地,引物类型可以包括多于一种捕获引物和用于测序的多于一种测序引物(例如,通过延伸捕获引物产生的第一链)。固体支持物上的引物的一种类型或群体(例如捕获引物)的密度可以高于固体支持物上的引物的另一种类型或群体(例如扩增引物)的密度。固体支持物上的引物的一种类型或群体的密度可以与固体支持物上的引物的另一种类型或群体的密度相同。引物(或所有引物)的类型或群体的密度可以变化。固体支持物上的引物(或所有引物)的类型或群体的密度可以是以下、是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010、9x1010、1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011、9x1011、1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012、9x1012、1x1013、2x1013、3x1013、4x1013、5x1013、6x1013、7x1013、8x1013、9x1013、1x1014、2x1014、3x1014、4x1014、5x1014、6x1014、7x1014、8x1014、9x1014、1x1015、2x1015、3x1015、4x1015、5x1015、6x1015、7x1015、8x1015、9x1015、1x1016、2x1016、3x1016、4x1016、5x1016、6x1016、7x1016、8x1016、9x1016个引物/m2或这些值中任何两个之间的数量或范围。
本文设想了相同类型或群体(或两个不同类型或群体)的两条相邻引物之间的各种分离距离或平均分离距离。相同类型或群体(或两个不同类型或群体)的两个相邻引物之间的分离距离或平均分离距离可以是以下、是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:10nm、11nm、12nm、13nm、14nm、15nm、16nm、17nm、18nm、19nm、20nm、21nm、22nm、23nm、24nm、25nm、26nm、27nm、28nm、29nm、30nm、31nm、32nm、33nm、34nm、35nm、36nm、37nm、38nm、39nm、40nm、41nm、42nm、43nm、44nm、45nm、46nm、47nm、48nm、49nm、50nm、51nm、52nm、53nm、54nm、55nm、56nm、57nm、58nm、59nm、60nm、61nm、62nm、63nm、64nm、65nm、66nm、67nm、68nm、69nm、70nm、71nm、72nm、73nm、74nm、75nm、76nm、77nm、78nm、79nm、80nm、81nm、82nm、83nm、84nm、85nm、86nm、87nm、88nm、89nm、90nm、91nm、92nm、93nm、94nm、95nm、96nm、97nm、98nm、99nm、100nm、110nm、120nm、130nm、140nm、150nm、160nm、170nm、180nm、190nm、200nm、210nm、220nm、230nm、240nm、250nm、260nm、270nm、280nm、290nm、300nm、310nm、320nm、330nm、340nm、350nm、360nm、370nm、380nm、390nm、400nm、410nm、420nm、430nm、440nm、450nm、460nm、470nm、480nm、490nm、500nm、510nm、520nm、530nm、540nm、550nm、560nm、570nm、580nm、590nm、600nm、610nm、620nm、630nm、640nm、650nm、660nm、670nm、680nm、690nm、700nm、710nm、720nm、730nm、740nm、750nm、760nm、770nm、780nm、790nm、800nm、810nm、820nm、830nm、840nm、850nm、860nm、870nm、880nm、890nm、900nm、910nm、920nm、930nm、940nm、950nm、960nm、970nm、980nm、990nm、1000nm,或这些值中任何两个之间的数量或范围。
本公开内容设想了引物的一种类型或群体的数量与引物的另一种类型或群体的数量的各种比例。引物的一种类型或群体的数量与引物的另一种类型或群体的数量的比例可以是以下、是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:1:100、1:99、1:98、1:97、1:96、1:95、1:94、1:93、1:92、1:91、1:90、1:89、1:88、1:87、1:86、1:85、1:84、1:83、1:82、1:81、1:80、1:79、1:78、1:77、1:76、1:75、1:74、1:73、1:72、1:71、1:70、1:69、1:68、1:67、1:66、1:65、1:64、1:63、1:62、1:61、1:60、1:59、1:58、1:57、1:56、1:55、1:54、1:53、1:52、1:51、1:50、1:49、1:48、1:47、1:46、1:45、1:44、1:43、1:42、1:41、1:40、1:39、1:38、1:37、1:36、1:35、1:34、1:33、1:32、1:31、1:30、1:29、1:28、1:27、1:26、1:25、1:24、1:23、1:22、1:21、1:20、1:19、1:18、1:17、1:16、1:15、1:14、1:13、1:12、1:11、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1,或这些值中任何两个之间的数量或范围。
一个类型或群体的两个相邻引物(或任何两个相邻引物)能够彼此形成接触。一个类型或群体的两个相邻引物(或任何两个相邻引物)不能彼此形成接触。不同类型或群体的两个相邻引物(或任何两个相邻引物)能够彼此形成接触。不同类型或群体的两个相邻引物(或任何两个相邻引物)不能彼此形成接触。两个相邻或最近的捕获引物附接在固体支持物上的位置之间的平均距离可以大于(或小于或等于)两个捕获引物中的一个的长度、两个捕获引物的长度、两个捕获引物的平均长度或两个捕获引物的总长度(或长度的0.1x、0.2x、0.3x、0.4x、0.5x、0.6x、0.7x、08x、0.9x)。多于一个扩增引物中两个相邻或最近的扩增引物附接在固体支持物上的位置之间的平均距离可以大于(或小于或等于)两个扩增引物中的一个的长度、两个扩增引物的长度、两个扩增引物的平均长度、或两个扩增引物的总长度(或任何长度的0.1x、0.2x、0.3x、0.4x、0.5x、0.6x、0.7x、08x、0.9x、1.1x、1.2x、1.3x、1.4x、1.5x、1.6x、1.7x、1.8x、1.9x、2x、3x、4x、5x、6x、7x、8x、9x、10x)。
一个类型或群体的两个引物(或每个引物)(例如,捕获引物)可以具有相同的长度。一个类型或群体的两个引物(或每个引物)(例如,捕获引物)可以具有不同的长度。引物(或一个类型或群体的两个或更多个引物,或一个类型或群体的每个引物)的长度可以是以下、是约以下、是至少以下、是至少约以下、是至多以下、是至多约以下:10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、300个、400个、500个、600个、700个、800个、900个、1000个核苷酸。引物(或一个类型或群体的两个或更多个引物,或一个类型或群体的每个引物)的长度可以是以下、是约以下、是至少以下、是至少约以下、是至多以下、是至多约以下:
Figure BDA0003922747110000561
Figure BDA0003922747110000562
Figure BDA0003922747110000563
0.2μm、0.3μm、0.4μm、0.5μm、0.6μm、0.7μm、0.8μm、0.9μm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm或这些值中任何两个之间的数值或范围。
一种类型或群体的引物(例如捕获引物)的长度与相同类型或群体的引物(例如捕获引物)的长度的比例,或一种类型或群体的引物(例如捕获引物)的长度与另一种类型或群体的引物(例如扩增引物)的长度的比例可以变化。一种类型或群体的两个引物的长度的比例,或者不同类型或群体的两个引物长度的比例可以是以下、是约以下、是至少以下、是至少约以下、是至多以下或是至多约以下:1:100、1:99、1:98、1:97、1:96、1:95、1:94、1:93、1:92、1:91、1:90、1:89、1:88、1:87、1:86、1:85、1:84、1:83、1:82、1:81、1:80、1:79、1:78、1:77、1:76、1:75、1:74、1:73、1:72、1:71、1:70、1:69、1:68、1:67、1:66、1:65、1:64、1:63、1:62、1:61、1:60、1:59、1:58、1:57、1:56、1:55、1:54、1:53、1:52、1:51、1:50、1:49、1:48、1:47、1:46、1:45、1:44、1:43、1:42、1:41、1:40、1:39、1:38、1:37、1:36、1:35、1:34、1:33、1:32、1:31、1:30、1:29、1:28、1:27、1:26、1:25、1:24、1:23、1:22、1:21、1:20、1:19、1:18、1:17、1:16、1:15、1:14、1:13、1:12、1:11、1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1,或这些值中任何两个之间的数量或范围。
各种聚合酶中的任何一种可用于本文阐述的方法或设备中,例如,以复制核酸模板、形成稳定化的三元复合物或以进行引物修饰。可使用的聚合酶包括天然存在的聚合酶及其修饰变体,包括但不限于突变体、重组体、融合体、遗传修饰体、化学修饰体、合成物和类似物。天然存在的聚合酶及其修饰变体不限于具有催化聚合反应能力的聚合酶。任选地,天然存在的和/或其修饰的变体具有在至少一种在稳定化的三元复合物的形成或检查过程中不使用的条件下催化聚合反应的能力。任选地,参与稳定化的三元复合物的天然存在的和/或修饰的变体具有修饰的特性,例如,增强的对核酸的结合亲和力、降低的对核酸的结合亲和力、增强的对核苷酸的结合亲和力、降低的对核苷酸的结合亲和力、增强的对下一个正确的核苷酸的特异性、降低的对下一个正确的核苷酸的特异性、降低的催化速率、无催化活性等。突变体聚合酶包括,例如,其中一个或更多个氨基酸被其他氨基酸代替的聚合酶,或一个或更多个氨基酸***或缺失的聚合酶。可用于形成稳定化的三元复合物的示例性聚合酶突变体包括,例如,在以下中阐述的那些:美国专利申请序列第15/866,353号,作为美国专利申请公布第2018/0155698 A1号公布;美国专利申请公布第2017/0314072号或美国专利申请序列第16/567,476号,其中的每一个通过引用并入本文。
修饰的聚合酶包括包含外源标记部分(例如,外源荧光团)的聚合酶,该标记部分可用于检测聚合酶。任选地,标记部分可以在使用蛋白质分离技术至少部分纯化聚合酶后附接。例如,可以使用聚合酶的游离巯基或游离胺部分将外源标记部分共价连接至聚合酶。这可以包括通过半胱氨酸残基的侧链或通过N-末端的游离氨基基团与聚合酶的共价连接。外源标记部分也可以通过蛋白融合附接到聚合酶。可通过蛋白融合附接的示例性标记部分包括例如绿色荧光蛋白(GFP)、藻胆蛋白(例如藻蓝蛋白和藻红蛋白)或者GFP或藻胆蛋白的波长移位变体(wavelength-shifted variants)。在一些实施方案中,聚合酶上的外源标记可以作为FRET对的成员发挥作用。FRET对的另一个成员可以是附接在稳定化的三元复合物中与聚合酶结合的核苷酸的外源标记。因此,稳定化的三元复合物可以通过FRET检测或识别。
可选地,参与稳定化的三元复合物的聚合酶,或用于延伸或修饰引物的聚合酶不需要附接到外源标记。例如,聚合酶不需要共价附接到外源标记。而是,聚合酶可以缺少任何标记,直到它与标记的核苷酸和/或标记的核酸(例如标记的引物和/或标记的模板)缔合。
聚合酶的不同活性可以在本文阐述的方法中利用。聚合酶可用于例如模板扩增过程、引物修饰过程(诸如引物延伸步骤或引物加帽步骤)、检查步骤或其组合。不同的活性可以是结构不同(例如通过自然活性、突变或化学修饰)的结果。然而,聚合酶可以从多种已知来源获得,并根据本文阐述的教导和聚合酶的公认活性应用。有用的DNA聚合酶包括但不限于细菌DNA聚合酶、真核生物DNA聚合酶、古菌DNA聚合酶、病毒DNA聚合酶和噬菌体DNA聚合酶。细菌DNA聚合酶包括大肠杆菌(E.coli)DNA聚合酶I、II和III、IV和V,大肠杆菌DNA聚合酶的Klenow片段,粪堆梭菌(Clostridium stercorarium)(Cst)DNA聚合酶,热纤梭菌(Clostridium thermocellum)(Cth)DNA聚合酶和硫磺矿硫化叶菌(Sulfolobussolfataricus)(Sso)DNA聚合酶。真核生物DNA聚合酶包括DNA聚合酶α、β、γ、δ、€、η、ζ、λ、σ、μ和k,以及Revl聚合酶(末端脱氧胞苷转移酶)和末端脱氧核苷酸转移酶(TdT)。病毒DNA聚合酶包括T4 DNA聚合酶、phi-29DNA聚合酶、GA-l、phi-29样DNA聚合酶、PZA DNA聚合酶、phi-15DNA聚合酶、Cpl DNA聚合酶、Cp7 DNA聚合酶、T7 DNA聚合酶和T4聚合酶。其他有用的DNA聚合酶包括热稳定DNA聚合酶和/或嗜热DNA聚合酶,诸如水生栖热菌(Thermusaquaticus)(Taq)DNA聚合酶、丝状栖热菌(Thermus filiformis)(Tfi)DNA聚合酶、兹氏热球菌(Thermococcus zilligi)(Tzi)DNA聚合酶、嗜热栖热菌(Thermus thermophilus)(Tth)DNA聚合酶、黄栖热菌(Thermus flavusu)(Tfl)DNA聚合酶、沃氏火球菌(Pyrococcuswoesei)(Pwo)DNA聚合酶、激烈火球菌(Pyrococcus furiosus)(Pfu)DNA聚合酶和TurboPfu DNA聚合酶、滨海嗜热球菌(Thermococcus litoralis)(Tli)DNA聚合酶、火球菌属物种(Pyrococcus sp.)GB-D聚合酶、海栖热袍菌(Thermotoga maritima)(Tma)DNA聚合酶、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)(Bst)DNA聚合酶、超嗜热火球菌(Pyrococcus Kodakaraensis)(KOD)DNA聚合酶、Pfx DNA聚合酶、热球菌属物种(Thermococcus sp.)JDF-3(JDF-3)DNA聚合酶、高氏热球菌(Thermococcus gorgonarius)(Tgo)DNA聚合酶、嗜酸热球菌(Thermococcus acidophilium)DNA聚合酶;嗜酸热硫化叶菌(Sulfolobus acidocaldarius)DNA聚合酶;热球菌属物种9°(Thermococcus sp.9°)N-7DNA聚合酶;隐蔽热网菌(Pyrodictium occultum)DNA聚合酶;沃氏甲烷球菌(Methanococcusvoltae)DNA聚合酶;热自养甲烷杆菌(Methanococcus thermoautotrophicum)DNA聚合酶;詹氏甲烷球菌(Methanococcus jannaschii)DNA聚合酶;硫还原球菌属(Desulfurococcus)菌株TOK DNA聚合酶(D.Tok Pol);深海火球菌(Pyrococcus abyssi)DNA聚合酶;堀越火球菌(Pyrococcus horikoshii)DNA聚合酶;海岛火球菌(Pyrococcus islandicum)DNA聚合酶;烟生热球菌(Thermococcus fumicolans)DNA聚合酶;敏捷气热菌(Aeropyrum pernix)DNA聚合酶;和异二聚体DNA聚合酶DP1/DP2。工程化的和修饰的聚合酶也可用于所公开的技术。例如,可以使用极端嗜热的海洋古菌热球菌属物种9°N(例如,来自New EnglandBioLabs Inc.;Ipswich,MA的Therminator DNA聚合酶)的改良版本。另外的其他有用的DNA聚合酶(包括3PDX聚合酶)公开于美国专利8,703,461,其公开内容通过引用并入本文。
有用的RNA聚合酶包含,但不限于,病毒RNA聚合酶诸如T7 RNA聚合酶、T3聚合酶、SP6聚合酶和Kll聚合酶;真核生物RNA聚合酶,诸如RNA聚合酶I、RNA聚合酶II、RNA聚合酶III、RNA聚合酶IV、和RNA聚合酶V;以及古菌RNA聚合酶。
另一种有用的聚合酶是逆转录酶。示例性逆转录酶包括但不限于来自人类免疫缺陷病毒1型(PDB1HMV)的HIV-1逆转录酶、来自人类免疫缺陷病毒2型的HIV-2逆转录酶、来自Moloney鼠白血病病毒的M-MLV逆转录酶、来自禽成髓细胞血症病毒的AMV逆转录酶和维持真核染色体端粒的端粒酶逆转录酶。
具有固有的3’-5’的校正外切核酸酶活性的聚合酶对于一些实施方案可以是有用的。实质上缺少3’-5’校正外切核酸酶活性的聚合酶在一些实施方案例如在大多数基因型分型和测序的实施方案中也是有用的。外切核酸酶活性的缺失可以是野生型特征或由变体或工程化的聚合酶结构赋予的特征。例如,exo minus Klenow片段是突变形式的Klenow片段,其缺少3’-5’校正外切核酸酶活性。Klenow片段和其exo minus变体在本文阐述的方法或组合物中可以是有用的。
可以进行用于从靶核酸的有义链和反义链确定序列的方法以确定靶核酸序列的全部或部分。在一些配置中,有义链和反义链全长的大部分或全部被测序。因此,为两条链确定的序列将完全或几乎完全重叠。在一些情况下,从反义链确定的序列将与从有义链确定的序列的全长互补,并且从有义链确定的序列将与从反义链确定的序列的全长互补。从两条链确定的序列之间的重叠越完全,测序结果就越准确,因为可以比较两条序列来识别错误。在一些情况下,一条链的序列可以用来校正另一条链的序列。例如,如果在两条链之间发现差异,则可以通过丢弃(或统计降级)在具有已知在测序方法中容易出错的序列基序的链中进行的判定来解决差异。
在用于从靶核酸的有义链和反义链确定序列的方法的其他配置中,从反义链确定靶序列的第一部分,并且从有义链确定靶序列的第二部分。根据靶序列的长度和两个序列读段的长度,第一部分和第二部分可以部分重叠。因此,第一部分与靶序列的第二部分部分互补。在一些情况下,从反义链确定的序列可以与从有义链确定的序列的全长互补。在一些情况下,从有义链确定的序列可以与从反义链确定的序列的全长互补。
在本文阐述方法的一些应用中,当两个部分被认为与完整靶序列对齐时,缺口可能出现在这些部分之间。缺口的长度可以是至少1个、10个、100个、1000个或更多个碱基。可选地或另外地,缺口的长度可以是至多1000个、100个、10个或1个碱基。两个序列以相反方向取向的知识以及两个序列之间缺口尺寸的知识对于与参考基因组的比对可能是有利的。与两个序列的相对取向有关的信息不仅通过与参考基因组比对来改进基因组的重建,而且该信息还允许识别基因组中的结构变异。配对末端读段的两个末端之间的预期基因组比对的偏差可以指示跟与读段比对的参考序列相比,被测序的样品的结构变异。
本公开内容提供了被配置为进行本文阐述方法的***。例如,***可以被配置为在存在核苷酸的情况下产生和检测聚合酶和引物-模板核酸杂合体之间形成的三元复合物,以识别模板核酸序列中的一个或更多个碱基。本公开内容的***可包括用于进行核酸扩增和/或核酸检测的方法的容器、固体支持物或其他设备。例如,该***可以包含阵列、流通池、多孔板或其他方便的设备。设备可以是可拆卸的,从而允许将其放置到***中或从***中去除。因此,***可以被配置为顺序地或并行地处理多于一个设备(例如容器或固体支持物)。该***可以包含具有用于容纳本文阐述的一种或更多种试剂(例如聚合酶、引物、模板核酸、用于三元复合物形成的核苷酸、用于引物延伸的核苷酸、解封闭试剂、三元复合物抑制剂或这些组分的混合物)的储存器的流体组件。流体***可以被配置为例如通过通道或液滴转移设备(例如电润湿设备)将试剂递送到容器或固体支持物。多种检测设备中的任何一种都可以被配置为检测其中试剂相互作用的容器或固体支持物。实例包括发光检测器、表面等离子体共振检测器和本领域已知的其他检测器。具有可以容易地修饰以用于本文的***的流体和检测组件的示例性***包括但不限于以下阐述的那些:美国专利申请公布第2018/0280975A1号,其要求美国专利申请序列第62/481,289号的优先权;美国专利第8,241,573号;第7,329,860号或第8,039,817号;或者美国专利申请公布第2009/0272914A1号或第2012/0270305A1号,其中的每一个通过引用并入本文。
任选地,本公开内容的***还包含计算***或计算***的组件。计算***可以包含被配置为操作***组件的计算机处理单元(CPU)。CPU可以包含一个或更多个处理器或处理单元。相同或不同的CPU可以与***交互以获取、存储和处理信号(例如,在本文阐述的方法中检测到的信号)。在特定的实施方案中,CPU可用于从信号确定存在于模板核酸中特定位置的核苷酸的身份。在一些情况下,CPU将从检测到的信号识别模板的核苷酸序列。
计算***可以是个人计算机***、服务器计算机***、瘦客户机、胖客户机、手持或膝上型装置、多处理器***、基于微处理器的***、机顶盒、可编程消费电子产品、网络PC、小型计算机***、大型计算机***、智能电话和包含任何上述***或装置的分布式云计算环境等。计算***可以包括存储器架构,该架构可以包括RAM和非易失性存储器。存储器架构还可以包括可移除/不可移除、易失性/非易失性计算机***存储介质。此外,存储器架构可以包括一个或更多个读取器,用于从不可移除的、非易失性磁介质读取和写入,诸如硬盘驱动器,用于从可移除的、非易失性磁盘读取和写入的磁盘驱动器,和/或用于从可移除的、非易失性光盘读取或写入的光盘驱动器,诸如CD-ROM或DVD-ROM。计算***还可以包含多种计算机***可读介质。这样的介质可以是云计算环境可访问的任何可用介质,诸如易失性和非易失性介质,以及可移除和不可移除介质。
存储器架构可以包括至少一个具有至少一个程序模块的程序产品,该程序模块被实现为可执行被配置为进行本文阐述方法的一个或更多个步骤的指令。例如,可执行指令可以包括操作***、一个或更多个应用程序、其他程序模块和程序数据。通常,程序模块可包括进行本文阐述特定任务的例程、程序、对象、组件、逻辑、数据结构等。
CPU的组件可以通过内部总线耦合,该内部总线可以实现为任何若干类型总线结构中的一种或更多种,包括存储器总线或存储器控制器、***总线、加速图形端口以及使用多种总线架构中的任何一种的处理器或局部总线。通过实例的方式而非限制,这样的架构包括工业标准架构(ISA)总线、微通道架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)本地总线和***组件互连(PCI)总线。
CPU可以任选地与一个或更多个外部装置通信,诸如键盘、指向装置(例如鼠标)、显示器(诸如图形用户界面(GUI))或促进用户与核酸检测***的交互的其他装置。类似地,CPU可以与其他装置通信(例如,通过网卡、调制解调器等)。这种通信可以通过I/O接口发生。此外,本文中***的CPU可以经由适当的网络适配器与诸如局域网(LAN)、通用广域网(WAN)和/或公共网络(例如,因特网)的一个或更多个网络通信。
实施例I
通过两次22循环运行(PE2x22)的配对末端测序
本实施例描述了一种用于产生具有有义链和反义链的簇的同时RCA和MDA方法,如本文参考图1D所描述的。本实施例展示了在配对末端测序方法中两条链的测序。此外,本实施例表明可以对两条链都进行测序,而不需要去除一条链来对另一条链进行测序。
材料和方法
包含引发的模板核酸的流通池制备如下。通过点击化学将一层SHARK248引物(5’-CGCCGTATCATTCAAGCAGAAGAC*G*G-3’,其中星号表示硫代磷酸酯键;SEQ ID NO:6)附接到流通池的内表面。模板环通过与SHARK248引物互补的通用衔接子与SHARK248引物杂交,并且使用含有33mM Tris-HCl pH 8.0(Sigma-Aldrich,St.Louis,MO)、30mM MgCl2(Invitrogen,Carlsbad,CA)、10mM DTT(Sigma-Aldrich,St.Louis,MO)、90mM KCl(Teknova,Hollister,CA)、2%蔗糖(Sigma-Aldrich,St.Louis,MO)、0.5M甜菜碱(Sigma-Aldrich,St.Louis,MO)、0.2% Tween-80(Sigma-Aldrich,St.Louis,MO)、0.8mM dNTP(NewEngland Biolabs,Ipswich,MA)和0.1μM鳞片形成引物(scaling primer)SHARK291(5’-ATCTCGTATGCCGTCTTCTGCTT*G-3’,其中星号表示硫代磷酸酯键;SEQ ID NO:7)的Phi29 DNA聚合酶(Thermo Fisher Waltham,MA)Scientific混合物延伸引物。RCA/MDA反应在37℃进行4.5小时,每15分钟补充一次Phi29 DNA聚合酶。延伸后,通过热变性去除Phi29,并在含有40mM Tris-HCl pH 8.0、110mM KCl、0.02mM EDTA(Sigma-Aldrich,St.Louis,MO)和0.1%Tween-80的缓冲液中洗涤。
然后处理上述方法产生的簇以在簇中的任何可延伸的3’末端添加加帽部分。加帽试剂制备为包含50mM三甲基甘氨酸(Sigma-Aldrich,St.Louis,MO)、美国专利申请公布第2020/0032322A1号(其通过引用并入本文)的图5中所示的四种生物素化双脱氧核苷酸中的每种2μM、0.1mM生物素(Sigma-Aldrich,St.Louis,MO)、50mM KCl(Teknova,Hollister,CA)、0.1%Tween-80(Sigma-Aldrich,St.Louis,MO)、5mM MgCl2(Invitrogen,Carlsbad,CA)、40U/ml M15 DNA聚合酶(参见美国专利申请序列第16/567,476号,其通过引用并入本文)和0.1mM EDTA(Invitrogen,Carlsbad,CA)。将加帽试剂引入流通池,并允许加帽反应在55℃进行2分钟。去除加帽试剂,并用高盐洗涤流通池以去除任何结合的DNA聚合酶。加帽过程的下一步是生物素化引物延伸产物与链霉抗生物素蛋白的孵育。链霉抗生物素蛋白混合物包含50mM三甲基甘氨酸(Sigma-Aldrich,St.Louis,MO)、0.076mg/ml链霉抗生物素蛋白(New England Biolabs,Ipswich,MA)、50mM KCl(Teknova,Hollister,CA)、0.1% Tween-80(Sigma-Aldrich,St.Louis,MO)、5mM MgCl2(Invitrogen,Carlsbad,CA)和0.1mM EDTA(Invitrogen,Carlsbad,CA)。将链霉抗生物素蛋白混合物引入流通池,并允许结合在55℃进行2分钟。在接下来的测序步骤之前,用甲酰胺处理簇以使任何双链区域变性。
将多于一个SHARK231引物(5’-GTGACTGGAGTTCAGACGTGTGCTCTTC-3’;SEQ ID NO:8)与簇中反义链衔接子区域的互补引物结合位点杂交。用循环进行的Sequencing ByBindingTM(SBBTM)方法对簇的反义链进行测序,其中每个循环包括以下步骤:(i)延伸:将可逆终止的核苷酸添加到固定的引物-模板杂合体的引物中;(ii)检查:在可逆终止的固定的引物-模板杂合体上形成和检测稳定化的三元复合物;和(iii)激活:从延伸的引物裂解可逆终止子。每个循环导致单个核苷酸的添加和随后的核苷酸位置的检测。
通过在固定的引物模板杂合体的引物3’末端掺入可逆终止子核苷酸起始测序循环。这通过延伸步骤来完成,在该延伸步骤中流通池在存在M15聚合酶(描述于美国专利申请序列第16/567,476号,其通过引用并入本文)的情况下与未标记的可逆终止核苷酸(dATP、dGTP、dCTP和dTTP的类似物)接触。在本说明性程序中使用的可逆终止子核苷酸包括3’-ONH2可逆终止子部分。这种可逆终止子核苷酸的描述可以在美国专利第7,544,794号(其通过引用并入本文)中找到。
接下来,进行洗涤步骤以从流通池中去除dNTP。洗涤溶液含有异丙醇、Tween-80、羟胺和EDTA。洗涤步骤保留了M15聚合酶(描述于美国专利申请序列第16/518,321号,其通过引用并入本文)。
该循环随后继续进行检查子程序,其中四种不同的核苷酸中的每一种被单独递送到流通池(Cy5标记的dTTP、Cy5标记的dATP、Cy5标记的dCTP和Cy5标记的dGTP),***暂停流体流动以允许三元复合物的形成,通过成像流体的递送将游离核苷酸从流通池中去除,并且然后检查流通池在固定的引物-模板杂合体处的三元复合物形成。成像流体包含LiCl、甜菜碱、Tween-80、KCl、硫酸铵、羟胺和EDTA,它们在去除游离核苷酸后稳定了三元复合物(参见美国专利第10,400,272号,其通过引用并入本文)。通过荧光显微术对流通池进行成像,以检测包含标记的核苷酸的三元复合物,标记的核苷酸是每个模板核酸中下一个正确的核苷酸的同源物。在三元复合物的形成和检测步骤期间,引物链3’核苷酸上的可逆终止子部分排除了核苷酸的掺入。
在检查子程序之后,用洗涤液冲洗流通池,以清除流通池中来自检查子程序的核苷酸。然后,测序循环继续进行裂解步骤,在该步骤中,使用乙酸钠和亚硝酸钠从引物中去除可逆终止子部分,如在美国专利第7,544,794号(其通过引用并入本文)中阐述的。然后去除裂解试剂,并用成像流体洗涤流通池以去除来自检查步骤的残余聚合酶。然后,通过返回下一个测序循环的第一步,测序过程进行到下一个核苷酸位置。
在进行上述SBBTM方法的27个循环后(前五个循环为对照循环),用本实施例前面阐述的加帽试剂和方法对测序反应产生的延伸的引物进行加帽。
加帽后,进行上述SBBTM方法的5个循环作为对照,以展示加帽过程的有效性。
在5个对照循环后,将多于一个SHARK276引物(5’-CGGCGACCACCGAGATCGGCGACCACCGAGATCTACACTCTTTCC CTACACGACGCTCTTCCGATCT-3’;SEQ ID NO:9)与簇中有义链衔接子区域的互补引物结合位点杂交。使用用于反义链的SBBTM方法对簇的有义链进行测序。
结果
来自上述测序过程的结果分析如下。追踪“开”强度(在给定的检查步骤中从给定簇获得的最亮的核苷酸信号强度)以监测三元复合物的形成。图5示出了在y轴上的归一化“开”强度的第50百分位值和x轴上的循环数的图。来自四种核苷酸类型中的每一种的数据分别绘制为单独的线。前五个循环(对照循环)的数据点在“开”和“关”图中都显得充满噪音,因为前五个核苷酸在所有评价的簇之间是共同的。随后循环的数据点对测序期间实现的信噪比水平有更多的信息,因为每个数据点是包括跨越多于一个不同模板的所有四种核苷酸类型的平均值。
图5的结果展示反义链测序(图中的循环6-27)在“开”和“关”信号之间实现了出色的分离。这些结果指示,簇中第二链的存在对第一链的测序没有明显的不利影响。此外,第一链测序期间的信号衰减与之前在每个位点只有一条链的阵列上进行的SBBTM观察到的信号衰减相当。
图5示出了在5个对照循环(循环28-32)期间只检测到忽略不计的“开”信号。这指示了在反义链测序后对存在的延伸的引物和其他链进行了有效的3’加帽。
图5的结果展示有义链测序(图中的循环33-54)在“开”和“关”信号之间实现了出色的分离。事实上,与第一读段相比,第二读段的“开”信号平均更高,而“关”信号在两个读段之间是相当的。这些结果指示,簇中反义链的存在对有义链的测序没有明显的不利影响。此外,在第一链序列读段期间的信号衰减与从第二链序列读段观察到的信号衰减相当。
使用Bowtie2(Langmead B,Salzberg S.Fast gapped-read alignment withBowtie 2.Nature Methods,9:357-359(2012),其通过引用并入本文)对测序的簇的子集进行配对末端比对分析。对于该分析,评价了574个读段。其中574个(100.00%)是配对的;7个(1.22%)一致对齐0次;567个(98.78%)一致对齐恰恰1次,并且0个(0.00%)一致对齐多于一次。共7个读段对一致对齐0次;其中4个(57.14%)不一致对齐1次。共3个读段对一致或不一致对齐0次;其中6个伴侣组成了对;2个(33.33%)对齐0次;3个(50.00%)对齐恰恰1次;并且1个(16.67%)对齐多于1次。总的来说,98.7%的配对末端读段一致对齐,展示了从单个簇中准确地进行了有义和反义测序。
实施例II
通过两次100循环运行(PE2x100)的配对末端测序
本实施例确认并延伸了实施例I的结果,展示每个簇可以读取两条链,每条链至少100个循环。结果证实,可以对两条链都进行测序,而不需要去除一条链来对另一条链进行测序。
材料和方法
使用实施例I中阐述的同时RCA和MDA方法制备簇。反义链和有义链如实施例I中阐述的进行测序,除了每条链测序100个循环外。
结果
测序结果如实施例I阐述进行分析。图6的结果展示反义链测序(图中的循环1-100)在“开”和“关”信号之间实现了出色的分离,并进一步证实了第一链测序(反义链测序)期间的信号衰减与之前在每个位点仅具有单条链的阵列上进行的SBBTM观察到的信号衰减相当。5个对照循环(图中的循环101-105)的结果指示,在第一测序读段后,簇中3’末端的有效加帽。有义链测序(图中的循环106-205)的结果展示了“开”和“关”信号之间的出色分离。这些结果指示,簇中反义链的存在对有义链的测序没有明显的不利影响。此外,在第一链序列读段期间的信号衰减与从第二链序列读段观察到的信号衰减相当。
表1:独立地对链进行的分析
反义链 有义链
簇计数 28437 30835
对齐的簇的百分比 90.03 91.8
Q得分 32.9 33.4
Bowtie 2与Omniome测序软件结合使用以评价配对末端的100循环运行。当独立分析每条链时,超过90%的读段与参考基因组对齐(表1)。观察到反义链和有义链的表观Q得分分别为32.9和33.4(表1)。此外,使用Bowtie 2分析作为伴侣对的配对末端读段。在这种情况下,81.9%的读段对与参考基因组一致映射(表2)。将通过Bowtie 2计算的伴侣对距离绘制为分布,以与一致读段对的数量一起进一步展示,在每个簇内引发和测序DNA的两条链的特异性。参见图7,其证明了这些簇是从文库片段的相对末端测序的。伴侣对距离被映射,并与已测序的文库期望的原始片段尺寸一致。
表2:Bowtie 2分析
占总数的%
一致对齐的读段对 81.92%
不一致对齐的读段 0.65%
一对中的一个伴侣对齐 3.79%
总对齐 84.46%
使用Bowtie 2对测序的簇的子集进行配对末端比对分析。对于该分析,评价了21418个读段。其中21418个(100.00%)是配对的;3873个(18.08%)一致对齐0次;17545个(81.92%)一致对齐恰恰1次,并且0个(0.00%)一致对齐多于1次。在一致对齐0次的3873对中,138对(3.56%)不一致对齐1次。在读段中,3735对一致或不一致地对齐0次;7470对伴侣组成了对;6657个(89.12%)对齐0次;813个(10.88%)对齐恰恰1次;并且0个(0.00%)对齐多于1次。
实施例III
在对第一链进行测序前对第二链和引物延伸产物的酶消化
用RCA和MDA产生包含靶序列(***物)的串联体的第一链和第二链,如本文参考图1E描述的,使得第二链包含为尿嘧啶的碱基。反义链3’末端包含生物素缀合的核苷酸。反义链的3’末端用与生物素缀合的核苷酸结合的链霉抗生物素蛋白封闭。在用测序引物引发第二链并使用延伸的测序引物对第二链进行测序后,酶消化第二链和延伸的测序引物,如本文参考图2D描述的。尿嘧啶DNA糖基化酶(UDG)和内切核酸酶VIII用于在第二链中产生切口。使用T7外切核酸酶从5’末端(反义链和延伸的引物的5’末端,以及反义链切口处的5’末端)消化剩余的反义链和延伸的引物。使用配对末端读段确定靶序列的尺寸。图8A是一个直方图,示出了该方法没有对特定尺寸的靶序列的偏好。配对读段的测序荧光强度在图8B中呈现。对中的每个反应运行50个循环。看到第二读段信号强度与第一读段信号强度相当,展示了本文方法在产生适合配对读段测序的群体方面的有效性。
实施例IV
用附接到固体表面的捕获引物和扩增引物进行的滚环扩增和多重置换扩增
图9A示出了对从核酸模板产生的第一链进行测序的高质量的信号密度,该链使用用附接到固体支持物的捕获引物的滚环扩增产生。图9B示出了对从第一链产生的第二链进行测序的高质量信号密度,该第二链使用用附接到固体支持物的扩增引物的多重置换扩增产生,其中第一链使用用附接到固体支持物的捕获引物的滚环扩增从核酸模板产生。
遍及本申请已参考多个出版物、专利和/或专利申请。这些文件的公开内容通过引用以其整体特此并入本申请。
在至少一些先前描述的实施方案中,在一种实施方案中使用的一个或更多个要素可以互换地用于另一种实施方案中,除非这种替换在技术上不可行。本领域技术人员将理解,在不脱离所要求保护的主题的范围的情况下,可以对上述方法和结构进行各种其他的省略、添加和修改。所有此类修改和改变都旨在落在由所附权利要求书限定的主题的范围内。
关于本文中基本上任何复数和/或单数术语的使用,在对于上下文和/或应用适当的情况下,本领域技术人员可以从复数转换为单数和/或从单数转换为复数。为了清楚起见,可以在本文明确阐述各种单数/复数排列。如本说明书和所附权利要求书中使用的,单数形式“一(a)”、“一(an)”和“所述/该(the)”包括复数指代物,除非上下文另外明确指示。除非另外说明,否则在本文中对“或”的任何提及旨在涵盖“和/或”。
本领域技术人员将理解,通常,本文使用的术语,并且特别是所附权利要求书(例如,所附权利要求书的主体)中的术语,通常旨在作为“开放性的”术语(例如,术语“包括/包含(including)”应解释为“包括但不限于(including but not limited to)”,术语“具有(having)”应解释为“具有至少(having at least)”,术语“包括/包含(includes)”应解释为“包括但不限于(includes but is not limited to)”等)。本领域技术人员将进一步理解,如果意图所介绍的权利要求陈述中的特定数字,则这样的意图将明确地陈述于权利要求中,并且在这种陈述不存在的情况下,不存在这种意图。例如,作为对理解的帮助,以下所附权利要求书可以包含介绍性措辞“至少一种”和“一种或更多种”的使用,以介绍权利要求陈述。然而,此类措辞的使用不应解读为意味着由不定冠词“一(a)”或“一(an)”介绍权利要求陈述会将任何包含此类介绍的权利要求陈述的具体权利要求限制到包含仅一种此类陈述的实施方案,甚至当同一权利要求包括介绍性措辞“一种或更多种”或“至少一种”以及不定冠词诸如“一(a)”或“一(an)”时也是如此(例如,“一(a)”和/或“一(an)”应解释为意指“至少一种”或“一种或更多种”);这对于使用定冠词来介绍权利要求陈述同样适用。此外,即使明确地陈述了介绍的权利要求陈述的特定数字,本领域技术人员将认识到,此类陈述应解释为意指至少所陈述的数字(例如,仅陈述“两种陈述”而没有其他修饰词意指至少两种陈述或两种或更多种陈述)。此外,在使用类似于“A、B和C等中的至少一种”的惯例的那些情况下,通常这种句法结构意图为本领域技术人员将理解该惯例的意义(例如,“具有A、B和C中的至少一种的***”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的***)。在使用类似于“A、B或C等中的至少一种”的惯例的那些情况下,通常这种句法结构意图为本领域技术人员将理解该惯例的意义(例如,“具有A、B或C中的至少一种的***”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的***)。本领域技术人员将进一步理解,实际上,无论在说明书、权利要求书还是在附图中,呈现两个或更多个替代术语的任何分离性词语和/或措辞应被理解为考虑到包括术语之一、任一术语或两个术语的可能性。例如,短语“A或B”应被理解为包括“A”或“B”或“A和B”的可能性。
此外,当本公开内容的特征或方面以马库什组(Markush group)描述时,本领域技术人员将意识到本公开内容还由此以马库什组的任何个体成员或成员子组描述。
如本领域技术人员将理解的,为了任何和所有目的,诸如在提供书面描述方面,本文公开的所有范围还包括该范围的任何和所有可能的子范围和子范围的组合。任何列举的范围可以被容易地认为充分地描述了并且使得相同范围能够被分成至少相等的二分之一、三分之一、四分之一、五分之一、十分之一等。作为非限制性实例,本文讨论的每个范围可以被容易地分成下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,所有语言文字诸如“多达(up to)”、“至少”、“大于”、“少于”等包括所引述的数字并且指随后可以被分成如以上讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包括每个个体的成员。因此,例如,具有1-3个物品的组是指具有1个、2个或3个物品的组。类似地,具有1-5个物品的组是指具有1个、2个、3个、4个或5个物品的组,等等。
尽管本文已经公开了各种方面和实施方案,但其他方面和实施方案对本领域技术人员将是明显的。本文公开的各种方面和实施方案用于说明的目的而并不旨在限制,且实际范围和精神由以下权利要求指出。
已经描述了许多实施方案。然而,应当理解的是,可以进行各种修改。因此,其他实施方案在所附权利要求书的范围之内。
序列表
<110> 加利福尼亚太平洋生物科学股份有限公司
哈里·K·K·苏布拉马尼安
亚伦·W·费尔德曼
志-远·陈
D·马利舍夫
格雷格·里奇蒙
<120> 用于对双链核酸进行测序的方法和组合物
<130> 42HB-328033-WO
<150> 62/984,438
<151> 2020-03-03
<160> 9
<170> PatentIn version 3.5
<210> 1
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的多肽
<400> 1
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210> 2
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的多肽
<400> 2
Lys Arg Arg Trp Lys Lys Asn Phe Ile Ala Val Ser Ala Ala Asn Arg
1 5 10 15
Phe Lys Lys Ile Ser Ser Ser Gly Ala Leu
20 25
<210> 3
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的多肽
<400> 3
Asp Tyr Lys Asp Asp Asp Asp
1 5
<210> 4
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的多肽
<400> 4
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 5
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的多肽
<400> 5
Asp Tyr Lys Asp Asp Asp Lys
1 5
<210> 6
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的寡核苷酸
<220>
<221> misc_feature
<222> (24)..(25)
<223> 硫代磷酸酯键
<220>
<221> misc_feature
<222> (25)..(26)
<223> 硫代磷酸酯键
<400> 6
cgccgtatca ttcaagcaga agacgg 26
<210> 7
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的寡核苷酸
<220>
<221> misc_feature
<222> (23)..(24)
<223> 硫代磷酸酯键
<400> 7
atctcgtatg ccgtcttctg cttg 24
<210> 8
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的寡核苷酸
<400> 8
gtgactggag ttcagacgtg tgctcttc 28
<210> 9
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的寡核苷酸
<400> 9
cggcgaccac cgagatcggc gaccaccgag atctacactc tttccctaca cgacgctctt 60
ccgatct 67

Claims (154)

1.一种组合物,包含
固体支持物,所述固体支持物附接有核酸簇,所述核酸簇包含串联体的有义链和所述串联体的反义链,其中所述串联体包含串联连接的序列单元的多于一个拷贝,其中所述序列单元包含靶序列和引物结合位点,任选地其中所述有义链共价附接到所述固体支持物,并且任选地其中所述反义链共价附接到所述固体支持物。
2.根据权利要求70所述的组合物,还包含与所述反义链的序列单元中的引物结合位点杂交的引物。
3.根据权利要求70所述的组合物,还包含与所述反义链的序列单元中的引物结合位点杂交的延伸的引物。
4.根据权利要求3所述的组合物,其中所述延伸的引物包含含有标记的可逆终止的核苷酸。
5.根据权利要求4所述的组合物,其中所述可逆终止的核苷酸共价附接到所述延伸的引物。
6.根据权利要求4所述的组合物,其中所述可逆终止的核苷酸被解封闭。
7.根据权利要求4所述的组合物,其中所述标记被去除。
8.根据权利要求3所述的组合物,其中所述延伸的引物包含封闭部分。
9.根据权利要求3所述的组合物,其中所述延伸的引物包含加帽部分。
10.根据权利要求3所述的组合物,其中所述引物结合位点连同与其杂交的引物、聚合酶和核苷酸形成三元复合物。
11.根据权利要求3所述的组合物,其中所述延伸的引物比所述引物长至少100个核苷酸。
12.根据权利要求70所述的组合物,还包含与所述有义链的序列单元中的引物结合位点杂交的第二引物。
13.根据权利要求70所述的组合物,还包含与所述有义链的序列单元中的引物结合位点杂交的延伸的第二引物。
14.根据权利要求13所述的组合物,其中所述延伸的第二引物包含含有标记的可逆终止的核苷酸。
15.根据权利要求14所述的组合物,其中所述可逆终止的核苷酸共价附接到所述延伸的引物。
16.根据权利要求14所述的组合物,其中所述可逆终止的核苷酸被解封闭。
17.根据权利要求14所述的组合物,其中所述标记被去除。
18.根据权利要求13所述的组合物,其中所述延伸的引物包含封闭部分。
19.根据权利要求13所述的组合物,其中所述延伸的引物包含加帽部分。
20.根据权利要求13所述的组合物,其中所述引物结合位点连同与其杂交的第二引物、聚合酶和核苷酸形成三元复合物。
21.根据权利要求13所述的组合物,其中所述延伸的引物比所述引物长至少100个核苷酸。
22.根据前述权利要求中任一项所述的组合物,其中所述有义链在固体支持物上,并且其中所述反义链使用结合到所述有义链的序列单元中的引物结合位点的扩增引物从所述有义链合成。
23.根据权利要求22所述的组合物,其中所述扩增引物共价附接到所述固体支持物。
24.根据权利要求22所述的组合物,其中所述扩增引物不共价附接到所述固体支持物。
25.根据权利要求70-21中任一项所述的组合物,其中所述固体支持物包含捕获引物,其中所述有义链通过经由滚环扩增沿着核酸模板延伸与所述核酸模板杂交的捕获引物来合成,并且其中所述反义链通过延伸与所述有义链的序列单元中的引物结合位点结合的扩增引物来合成。
26.根据权利要求25所述的组合物,其中所述核酸模板是环状核酸模板。
27.根据权利要求25所述的组合物,其中所述核酸模板是从线性核酸模板环化的。
28.根据权利要求25所述的组合物,其中所述捕获引物和所述扩增引物使用链置换聚合酶延伸。
29.根据权利要求25所述的组合物,其中所述扩增引物共价附接到所述固体支持物。
30.根据权利要求25所述的组合物,其中所述扩增引物不共价附接到所述固体支持物。
31.根据前述权利要求中任一项所述的组合物,其中所述簇包含所述串联体的多于一条反义链。
32.根据权利要求31所述的组合物,其中所述多于一条反义链在数量上超过所述簇中的所述有义链。
33.根据权利要求31所述的组合物,其中所述簇包含所述串联体的多于一条有义链。
34.根据权利要求31所述的组合物,其中所述多于一条有义链在数量上超过所述簇中的所述多于一条反义链。
35.根据前述权利要求中任一项所述的组合物,其中所述串联体的所述反义链比所述有义链具有更少拷贝的序列单元。
36.根据前述权利要求中任一项所述的组合物,其中所述核酸簇通过所述有义链与所述固体支持物的共价附接而附接到所述固体支持物。
37.根据权利要求36所述的组合物,其中所述反义链通过与所述有义链的沃森-克里克碱基配对附接到所述簇。
38.根据权利要求36所述的组合物,其中所述反义链不具有与所述固体支持物的共价键。
39.根据前述权利要求中任一项所述的组合物,其中所述反义链包含所述靶序列的第一部分或其反向互补物,并且其中所述有义链包含所述靶序列的第二部分或其反向互补物。
40.根据权利要求39所述的组合物,其中所述靶序列在所述靶序列的第一部分和所述靶序列的第二部分之间包含缺口。
41.根据权利要求39所述的组合物,其中所述靶序列的第一部分与所述靶序列的第二部分部分地互补。
42.根据权利要求39所述的组合物,其中所述靶序列的第一部分与所述靶序列的第二部分的全长互补。
43.根据权利要求39所述的组合物,其中所述靶序列的第二部分与所述靶序列的第一部分的全长互补。
44.根据前述权利要求中任一项所述的组合物,其中所述靶序列包含至少100个碱基对。
45.根据权利要求70-44中任一项所述的组合物,其中所述有义链通过等温扩增从核酸模板产生,任选地,其中所述等温扩增是滚环扩增。
46.根据权利要求70-44中任一项所述的组合物,其中所述有义链是在未进行聚合酶链式反应的情况下从核酸模板产生的。
47.根据权利要求45-46中任一项所述的组合物,其中核酸模板是在不进行聚合酶链式反应的情况下从样品衍生或产生的。
48.根据权利要求45-46中任一项所述的组合物,其中核酸模板通过进行至多五个循环的聚合酶链式反应从样品衍生或产生。
49.根据权利要求70-48中任一项所述的组合物,其中所述有义链通过延伸与固体支持物共价附接并与核酸模板的引物结合位点杂交的多于一个捕获引物中的捕获引物来合成,并且其中所述反义链通过延伸与所述固体支持物共价附接并与所述有义链的序列单元中的引物结合位点杂交的多于一个扩增引物中的扩增引物来合成。
50.根据权利要求49所述的组合物,其中所述固体支持物上的所述多于一个捕获引物的密度高于所述固体支持物上的所述多于一个扩增引物的密度。
51.根据权利要求49所述的组合物,其中所述固体支持物上的所述多于一个捕获引物的密度低于所述固体支持物上的所述多于一个扩增引物的密度。
52.根据权利要求49所述的组合物,其中所述固体支持物上的所述多于一个捕获引物的密度和/或所述固体支持物上的所述多于一个扩增引物的密度为约1012/m2至约1016/m2
53.根据权利要求49所述的组合物,其中所述多于一个捕获引物和所述多于一个扩增引物的比例为约100:1至约1:100。
54.根据权利要求49所述的组合物,其中所述多于一个捕获引物中的捕获引物之间的平均距离为约10nm至约1μm,和/或其中所述多于一个扩增引物中的扩增引物之间的平均距离为约10nm至约1mm。
55.根据权利要求49所述的组合物,其中所述多于一个捕获引物中最接近的两个捕获引物附接在所述固体支持物上的位置之间的平均距离大于所述两个捕获引物中的一个的长度、所述两个捕获引物的长度、所述两个捕获引物的平均长度或所述两个捕获引物的长度之和,和/或其中所述多于一个扩增引物中最接近的两个扩增引物附接在所述固体支持物上的位置之间的平均距离大于所述两个扩增引物中的一个的长度、所述两个扩增引物的长度、所述两个扩增引物的平均长度或所述两个扩增引物的长度之和。
56.根据权利要求49所述的组合物,其中所述多于一个捕获引物中的任何两个捕获引物不能彼此形成接触,和/或所述多于一个扩增引物中的任何两个扩增引物不能彼此形成接触。
57.根据权利要求49所述的组合物,其中所述多于一个捕获引物中最接近的两个捕获引物附接在所述固体支持物上的位置之间的平均距离小于所述两个捕获引物中的一个的长度、所述两个捕获引物的长度、所述两个捕获引物的平均长度或所述两个捕获引物的长度之和,和/或其中所述多于一个扩增引物中最接近的两个扩增引物附接在所述固体支持物上的位置之间的平均距离小于所述两个扩增引物中的一个的长度、所述两个扩增引物的长度、所述两个扩增引物的平均长度或所述两个扩增引物的长度之和。
58.根据权利要求49所述的组合物,其中所述多于一个捕获引物中的任何两个捕获引物能够彼此形成接触,和/或所述多于一个扩增引物中的任何两个扩增引物能够彼此形成接触。
59.根据权利要求132所述的组合物,其中所述多于一个捕获引物中的两个或每一个具有相同的长度,和/或其中所述多于一个扩增引物中的两个或每一个具有相同的长度。
60.根据权利要求132所述的组合物,其中所述多于一个捕获引物中的两个或每一个具有不同的长度,和/或其中所述多于一个扩增引物中的两个或每一个具有不同的长度。
61.根据权利要求132所述的组合物,其中所述捕获引物和/或所述多于一个捕获引物中的一个或每一个长度为约30个核苷酸至100个核苷酸,和/或其中所述扩增引物和/或所述多于一个捕获引物中的一个或每一个长度为约30个核苷酸至100个核苷酸。
62.根据权利要求132所述的组合物,其中所述捕获引物和/或所述多于一个捕获引物中的一个或每一个长度为至少
Figure FDA0003922747100000061
和/或其中所述扩增引物和/或所述多于一个捕获引物中的一个或每一个长度为至少
Figure FDA0003922747100000062
63.根据权利要求132所述的组合物,其中所述捕获引物的长度与所述扩增引物的长度的比例为约100:1至约1:100。
64.根据前述权利要求中任一项所述的组合物,其中所述反义链包含一个或更多个修饰的或非典型的核苷酸和/或一个或更多个具有修饰的或非典型的碱基的核苷酸,任选地其中所述碱基是尿嘧啶。
65.根据权利要求64所述的组合物,其中所述反义链中为尿嘧啶的碱基数量与为胸腺嘧啶或非尿嘧啶的碱基数量之比为从1:1000至1:10。
66.根据权利要求64所述的组合物,其中所述反义链中为尿嘧啶的碱基的百分比为约0.001%至约1%。
67.根据前述权利要求中任一项所述的组合物,其中所述反义链通过在存在包含dATP、dTTP、dGTP、dCTP和dUTP的脱氧核糖核苷酸三磷酸的情况下延伸扩增引物而合成。
68.根据权利要求67所述的组合物,其中dUTP与另一种脱氧核糖核苷酸三磷酸或所有其他脱氧核糖核苷酸三磷酸的比例为约1:1000至约1:10。
69.根据权利要求67所述的组合物,其中所述dUTP的浓度为从约0.01mM至约1mM。
70.一种用于从核酸的有义链和反义链确定序列的方法,包括
(a)提供附接到固体支持物的核酸簇,其中所述核酸簇包含串联体的有义链和所述串联体的反义链,其中所述串联体包含串联连接的序列单元的多于一个拷贝,其中所述序列单元包含靶序列和引物结合位点;
(b)将引物与所述簇中所述反义链的序列单元中的引物结合位点杂交;
(c)沿着所述反义链延伸所述引物以从所述反义链中所述靶序列的至少一部分确定序列;
(d)将第二引物与所述有义链的序列单元中的引物结合位点杂交;和
(e)沿着所述有义链延伸所述第二引物以从所述有义链中所述靶序列的至少一部分确定序列。
71.根据权利要求70所述的方法,还包括在步骤(d)之前,向所述延伸的引物添加封闭部分,从而防止所述延伸的引物在步骤(e)期间进一步延伸。
72.根据权利要求70所述的方法,还包括在步骤(d)之前,向所述延伸的引物添加加帽部分,从而防止聚合酶在步骤(e)期间结合所述延伸的引物的3’末端。
73.根据前述权利要求中任一项所述的方法,其中步骤(c)中的所述延伸所述引物包括(i)向所述引物添加可逆终止的核苷酸和(ii)使所述引物上的所述可逆终止的核苷酸解封闭的重复的循环。
74.根据权利要求73所述的方法,其中所述可逆终止的核苷酸包含被检测以产生信号的标记,所述信号用于从所述反义链中所述靶序列的所述至少一部分确定序列。
75.根据权利要求74所述的方法,其中所述重复的循环还包括(iii)在检测到所述标记之后去除所述标记。
76.根据权利要求73所述的方法,其中所述重复的循环还包括(iii)检测稳定化的三元复合物,所述三元复合物包含聚合酶、下一个正确的核苷酸和与所述反义链杂交的所述引物。
77.根据权利要求76所述的方法,其中所述下一个正确的核苷酸或所述聚合酶包含被检测以产生信号的标记,所述信号用于从所述反义链中所述靶序列的至少所述部分确定序列。
78.根据权利要求76所述的方法,其中在步骤(c)(iii)期间,所述可逆终止的核苷酸被共价附接到所述引物。
79.根据权利要求73所述的方法,其中步骤(c)中的所述延伸所述引物包括至少100个重复循环,以从所述反义链中所述靶序列的至少100个碱基确定序列。
80.根据前述权利要求中任一项所述的方法,其中步骤(e)中的所述延伸所述第二引物包括(i)向所述第二引物添加可逆终止的核苷酸和(ii)使所述第二引物上的所述可逆终止的核苷酸解封闭的重复的循环。
81.根据权利要求80所述的方法,其中所述可逆终止的核苷酸包含被检测以产生信号的标记,所述信号用于从所述有义链中所述靶序列的至少所述部分确定序列。
82.根据权利要求81所述的方法,其中所述重复的循环还包括(iii)在检测到所述标记之后去除所述标记。
83.根据权利要求80所述的方法,其中所述重复的循环包括(iii)检测稳定化的三元复合物,所述三元复合物包含聚合酶、下一个正确的核苷酸和与所述有义链杂交的所述第二引物。
84.根据权利要求83所述的方法,其中所述下一个正确的核苷酸或所述聚合酶包含被检测以产生信号的标记,所述信号用于从所述有义链中所述靶序列的至少所述部分确定序列。
85.根据权利要求83所述的方法,其中在步骤(e)(iii)期间,所述可逆终止的核苷酸共价附接到所述第二引物。
86.根据权利要求80所述的方法,其中步骤(e)中的所述延伸所述第二引物包括至少100个重复循环,以从所述有义链中所述靶序列的至少100个碱基确定序列。
87.根据前述权利要求中任一项所述的方法,其中步骤(a)包括
(i)在所述固体支持物上提供所述串联体的所述有义链,以及
(ii)使用扩增引物合成所述反义链,所述扩增引物结合到所述有义链的序列单元中的所述引物结合位点。
88.根据权利要求87所述的方法,其中所述扩增引物共价附接到所述固体支持物。
89.根据权利要求87所述的方法,其中所述扩增引物不共价附接到所述固体支持物。
90.根据权利要求70至86中任一项所述的方法,其中步骤(a)包括
(i)提供包含捕获引物的固体支持物,
(ii)将核酸模板与所述引物杂交,
(iii)通过经由滚环扩增使所述捕获引物沿着所述环状核酸模板延伸来合成所述有义链,以及
(iv)通过延伸扩增引物合成所述反义链,所述扩增引物结合到所述有义链的序列单元中的所述引物结合位点。
91.根据权利要求90所述的方法,其中所述核酸模板是环状核酸模板。
92.根据权利要求90所述的方法,还包括在步骤(a)(ii)之前使所述核酸模板环化。
93.根据权利要求90所述的方法,还包括在步骤(a)(ii)之后和步骤(a)(iii)之前使所述核酸模板环化。
94.根据权利要求90所述的方法,其中所述延伸所述捕获引物和所述延伸所述扩增引物同时发生。
95.根据权利要求90所述的方法,其中在步骤(a)(iii)期间,所述捕获引物与所述有义链的序列单元中的所述引物结合位点杂交。
96.根据权利要求90所述的方法,其中所述延伸所述捕获引物和所述延伸所述扩增引物使用链置换聚合酶进行。
97.根据权利要求90所述的方法,其中所述扩增引物共价附接到所述固体支持物。
98.根据权利要求90所述的方法,其中所述扩增引物不共价附接到所述固体支持物。
99.根据前述权利要求中任一项所述的方法,还包括在步骤(b)之前,向附接到所述固体支持物的所述核酸簇的3’末端添加封闭部分。
100.根据前述权利要求中任一项所述的方法,还包括在步骤(b)之前,向附接在所述固体支持物的所述核酸簇的3’末端添加加帽部分。
101.根据前述权利要求中任一项所述的方法,其中所述簇包含所述串联体的多于一条反义链。
102.根据权利要求101所述的方法,其中所述多于一条反义链在数量上超过所述簇中的所述有义链。
103.根据权利要求101所述的方法,其中步骤(d)和步骤(e)在步骤(b)和步骤(c)之前进行。
104.根据权利要求101所述的方法,其中所述簇包含所述串联体的多于一条有义链。
105.根据权利要求104所述的方法,其中所述多于一条有义链在数量上超过所述簇中的所述多于一条反义链。
106.根据权利要求105所述的方法,其中步骤(d)和步骤(e)在步骤(b)和步骤(c)之前进行。
107.根据前述权利要求中任一项所述的方法,其中测序等温进行。
108.根据前述权利要求中任一项所述的方法,其中串联体生成等温进行。
109.根据前述权利要求中任一项所述的方法,其中在任何测序反应之前产生所有序列模板。
110.根据前述权利要求中任一项所述的方法,其中在进行第一测序反应之前产生第一测序反应模板和第二测序反应模板。
111.根据前述权利要求中任一项所述的方法,其中在进行测序反应对的第一测序反应和第二测序反应之前产生第一测序反应模板和第二测序反应模板。
112.根据前述权利要求中任一项所述的方法,其中所述串联体的所述反义链比所述有义链具有更少拷贝的序列单元。
113.根据权利要求112所述的方法,其中步骤(d)和步骤(e)在步骤(b)和步骤(c)之前进行。
114.根据前述权利要求中任一项所述的方法,其中所述核酸簇通过所述有义链与所述固体支持物的共价附接而附接到所述固体支持物。
115.根据权利要求114所述的方法,其中所述反义链通过与所述有义链的沃森-克里克碱基配对附接到所述簇。
116.根据权利要求115所述的方法,其中所述反义链不具有与所述固体支持物的共价键。
117.根据权利要求114所述的方法,其中步骤(d)和步骤(e)在步骤(b)和步骤(c)之前进行。
118.根据权利要求103、106、114和117中任一项所述的方法,其中步骤(d)和步骤(e)产生所述串联体的所述反义链。
119.根据前述权利要求中任一项所述的方法,其中,从所述反义链确定所述靶序列的第一部分,并且从所述有义链确定所述靶序列的第二部分。
120.根据权利要求119所述的方法,其中所述靶序列在所述靶序列的所述第一部分和所述靶序列的所述第二部分之间包含缺口。
121.根据权利要求119所述的方法,其中所述靶序列的所述第一部分与所述靶序列的所述第二部分部分地互补。
122.根据权利要求70至117中任一项所述的方法,其中从所述反义链确定的序列与从所述有义链确定的序列的全长互补。
123.根据权利要求70至117中任一项所述的方法,其中从所述有义链确定的序列与从所述反义链确定的序列的全长互补。
124.根据权利要求70至117中任一项所述的方法,其中从所述反义链确定的序列与从所述有义链确定的序列的全长互补,并且其中从所述有义链确定的序列与从所述反义链确定的序列的全长互补。
125.根据前述权利要求中任一项所述的方法,其中所述靶序列包含至少100个碱基对。
126.根据前述权利要求中任一项所述的方法,还包括在步骤(d)和步骤(e)之前从所述簇去除所述反义链。
127.根据权利要求70至125中任一项所述的方法,其中当所述反义链存在于所述簇中时进行步骤(d)和步骤(e)。
128.根据权利要求70-127中任一项所述的方法,其中所述有义链通过等温扩增从核酸模板产生,任选地,其中所述等温扩增是滚环扩增。
129.根据权利要求70-127中任一项所述的方法,其中所述有义链是在未进行聚合酶链式反应的情况下从核酸模板产生的。
130.根据权利要求128-129中任一项所述的方法,其中核酸模板是在未进行聚合酶链式反应的情况下从样品衍生或产生的。
131.根据权利要求128-129中任一项所述的方法,其中核酸模板通过进行至多五个循环的聚合酶链式反应从样品衍生或产生。
132.根据权利要求70-150中任一项所述的方法,其中所述有义链通过延伸与固体支持物共价附接并与核酸模板的引物结合位点杂交的多于一个捕获引物中的捕获引物来合成,并且其中所述反义链通过延伸与所述固体支持物共价附接并与所述有义链的序列单元中的所述引物结合位点杂交的多于一个扩增引物中的扩增引物来合成。
133.根据权利要求132所述的方法,其中所述固体支持物上的所述多于一个捕获引物的密度高于所述固体支持物上的所述多于一个扩增引物的密度。
134.根据权利要求132所述的方法,其中所述固体支持物上的所述多于一个捕获引物的密度低于所述固体支持物上的所述多于一个扩增引物的密度。
135.根据权利要求132所述的方法,其中所述固体支持物上的所述多于一个捕获引物的密度和/或所述固体支持物上的所述多于一个扩增引物的密度为约1012/m2至约1016/m2
136.根据权利要求132所述的方法,其中所述多于一个捕获引物和所述多于一个扩增引物的比例为约100:1至约1:100。
137.根据权利要求132所述的方法,其中所述多于一个捕获引物中的捕获引物之间的平均距离为约10nm至约1μm,和/或其中所述多于一个扩增引物中的扩增引物之间的平均距离为约10nm至约1mm。
138.根据权利要求132所述的方法,其中所述多于一个捕获引物中最接近的两个捕获引物附接在所述固体支持物上的位置之间的平均距离大于所述两个捕获引物中的一个的长度、所述两个捕获引物的长度、所述两个捕获引物的平均长度或所述两个捕获引物的长度之和,和/或其中所述多于一个扩增引物中最接近的两个扩增引物附接在所述固体支持物上的位置之间的平均距离大于所述两个扩增引物中的一个的长度、所述两个扩增引物的长度、所述两个扩增引物的平均长度或所述两个扩增引物的长度之和。
139.根据权利要求132所述的方法,其中所述多于一个捕获引物中的任何两个捕获引物不能彼此形成接触,和/或所述多于一个扩增引物中的任何两个扩增引物不能彼此形成接触。
140.根据权利要求132所述的方法,其中所述多于一个捕获引物中最接近的两个捕获引物附接在所述固体支持物上的位置之间的平均距离小于所述两个捕获引物中的一个的长度、所述两个捕获引物的长度、所述两个捕获引物的平均长度或所述两个捕获引物的长度之和,和/或其中所述多于一个扩增引物中最接近的两个扩增引物附接在所述固体支持物上的位置之间的平均距离小于所述两个扩增引物中的一个的长度、所述两个扩增引物的长度、所述两个扩增引物的平均长度或所述两个扩增引物的长度之和。
141.根据权利要求132所述的方法,其中所述多于一个捕获引物中的任何两个捕获引物能够彼此形成接触,和/或所述多于一个扩增引物中的任何两个扩增引物能够彼此形成接触。
142.根据权利要求132所述的方法,其中所述多于一个捕获引物中的两个或每一个具有相同的长度,和/或其中所述多于一个扩增引物中的两个或每一个具有相同的长度。
143.根据权利要求132所述的方法,其中所述多于一个捕获引物中的两个或每一个具有不同的长度,和/或其中所述多于一个扩增引物中的两个或每一个具有不同的长度。
144.根据权利要求132所述的方法,其中所述捕获引物和/或所述多于一个捕获引物中的一个或每一个长度为约30个核苷酸至100个核苷酸,和/或其中所述扩增引物和/或所述多于一个捕获引物中的一个或每一个长度为约30个核苷酸至100个核苷酸。
145.根据权利要求132所述的方法,其中所述捕获引物和/或所述多于一个捕获引物中的一个或每一个长度为至少
Figure FDA0003922747100000141
和/或其中所述扩增引物和/或所述多于一个捕获引物中的一个或每一个长度为至少
Figure FDA0003922747100000142
146.根据权利要求132所述的方法,其中所述捕获引物的长度与所述扩增引物的长度的比例为约100:1至约1:100。
147.根据前述权利要求中任一项所述的方法,其中所述反义链包含一个或更多个修饰的或非典型的核苷酸和/或一个或更多个具有修饰的或非典型的碱基的核苷酸,任选地其中所述碱基是尿嘧啶。
148.根据权利要求147所述的方法,其中所述反义链中为尿嘧啶的碱基数量与为胸腺嘧啶或非尿嘧啶的碱基数量之比为从1:1000至1:10。
149.根据权利要求147所述的方法,其中所述反义链中为尿嘧啶的碱基的百分比为约0.001%至约1%。
150.根据前述权利要求中任一项所述的方法,其中所述反义链通过在存在包含dATP、dTTP、dGTP、dCTP和修饰的或非典型脱氧核糖核苷酸三磷酸的脱氧核糖核苷酸三磷酸的情况下延伸扩增引物来合成,任选地其中所述非典型脱氧核糖核苷酸三磷酸是dUTP。
151.根据权利要求150所述的方法,其中dUTP与另一种脱氧核糖核苷酸三磷酸或所有其他脱氧核糖核苷酸三磷酸的比例为约1:1000至约1:10。
152.根据权利要求150所述的方法,其中所述dUTP的浓度为从约0.01mM至约1mM。
153.根据权利要求150-152中任一项所述的方法,还包括消化所述反义链和所述延伸的第二引物。
154.根据权利要求153所述的方法,其中所述消化包括使用尿嘧啶DNA糖基化酶(UDG)、内切核酸酶VIII和T7外切核酸酶消化所述反义链和所述延伸的第二引物。
CN202180032682.2A 2020-03-03 2021-03-03 用于对双链核酸进行测序的方法和组合物 Pending CN115516104A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062984438P 2020-03-03 2020-03-03
US62/984,438 2020-03-03
PCT/US2021/020564 WO2021178467A1 (en) 2020-03-03 2021-03-03 Methods and compositions for sequencing double stranded nucleic acids

Publications (1)

Publication Number Publication Date
CN115516104A true CN115516104A (zh) 2022-12-23

Family

ID=75173467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180032682.2A Pending CN115516104A (zh) 2020-03-03 2021-03-03 用于对双链核酸进行测序的方法和组合物

Country Status (6)

Country Link
US (2) US11608528B2 (zh)
EP (1) EP4114966A1 (zh)
CN (1) CN115516104A (zh)
AU (1) AU2021230282A1 (zh)
CA (1) CA3173798A1 (zh)
WO (1) WO2021178467A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2613480B (en) * 2018-11-15 2023-11-22 Element Biosciences Inc Methods for generating circular nucleic acid molecules
US20210189483A1 (en) * 2019-12-23 2021-06-24 Mgi Tech Co. Ltd. Controlled strand-displacement for paired end sequencing
US20230279382A1 (en) * 2022-03-04 2023-09-07 Element Biosciences, Inc. Single-stranded splint strands and methods of use
WO2022087485A1 (en) * 2020-10-22 2022-04-28 Singular Genomics Systems, Inc. Nucleic acid circularization and amplification on a surface
WO2022240764A1 (en) * 2021-05-10 2022-11-17 Pacific Biosciences Of California, Inc. Single-molecule seeding and amplification on a surface

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
US5552278A (en) 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP2319854B1 (en) 1997-01-08 2016-11-30 Sigma-Aldrich Co. LLC Bioconjugation Of Macromolecules
US6023540A (en) 1997-03-14 2000-02-08 Trustees Of Tufts College Fiber optic sensor with encoded microspheres
US7622294B2 (en) 1997-03-14 2009-11-24 Trustees Of Tufts College Methods for detecting target analytes and enzymatic reactions
US6327410B1 (en) 1997-03-14 2001-12-04 The Trustees Of Tufts College Target analyte sensors utilizing Microspheres
US6124120A (en) 1997-10-08 2000-09-26 Yale University Multiple displacement amplification
US7427678B2 (en) 1998-01-08 2008-09-23 Sigma-Aldrich Co. Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method
US6235502B1 (en) 1998-09-18 2001-05-22 Molecular Staging Inc. Methods for selectively isolating DNA using rolling circle amplification
US6830884B1 (en) 1998-12-15 2004-12-14 Molecular Staging Inc. Method of amplification
EP1923471B1 (en) 1999-04-20 2012-12-19 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US6770441B2 (en) 2000-02-10 2004-08-03 Illumina, Inc. Array compositions and methods of making same
EP1280928B1 (en) 2000-05-10 2016-11-30 Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College Resistance to acetohydroxyacid synthase-inhibiting herbicides
US6291187B1 (en) 2000-05-12 2001-09-18 Molecular Staging, Inc. Poly-primed amplification of nucleic acid sequences
US6323009B1 (en) 2000-06-28 2001-11-27 Molecular Staging, Inc. Multiply-primed amplification of nucleic acid sequences
CN100462433C (zh) 2000-07-07 2009-02-18 维西根生物技术公司 实时序列测定
WO2002044425A2 (en) 2000-12-01 2002-06-06 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US20040002090A1 (en) 2002-03-05 2004-01-01 Pascal Mayer Methods for detecting genome-wide sequence variations associated with a phenotype
ATE469135T1 (de) 2002-05-30 2010-06-15 Scripps Research Inst Kupferkatalysierte ligierung von aziden und acetylenen
US7164533B2 (en) 2003-01-22 2007-01-16 Cyvera Corporation Hybrid random bead/chip based microarray
AU2003265583C1 (en) 2002-08-20 2009-05-21 Cyvera Corporation Diffraction grating-based optical identification element
WO2004018497A2 (en) 2002-08-23 2004-03-04 Solexa Limited Modified nucleotides for polynucleotide sequencing
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
WO2004025563A1 (en) 2002-09-12 2004-03-25 Cyvera Corporation Diffraction grating-based encoded micro-particles for multiplexed experiments
CA2498933C (en) 2002-09-12 2012-08-28 Cyvera Corporation Method and apparatus for aligning elongated microbeads in order to interrogate the same
US20040185481A1 (en) 2003-02-06 2004-09-23 Canon Kabushiki Kaisha Testing method using DNA microarray
WO2005003304A2 (en) 2003-06-20 2005-01-13 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
US20050074804A1 (en) 2003-09-26 2005-04-07 Youxiang Wang Amplification of polynucleotide sequences by rolling circle amplification
JP2007525571A (ja) 2004-01-07 2007-09-06 ソレクサ リミテッド 修飾分子アレイ
US8071755B2 (en) 2004-05-25 2011-12-06 Helicos Biosciences Corporation Nucleotide analogs
US20060024711A1 (en) 2004-07-02 2006-02-02 Helicos Biosciences Corporation Methods for nucleic acid amplification and sequence determination
CN101914620B (zh) 2004-09-17 2014-02-12 加利福尼亚太平洋生命科学公司 核酸测序的方法
US7544794B1 (en) 2005-03-11 2009-06-09 Steven Albert Benner Method for sequencing DNA and RNA by synthesis
EP3257949A1 (en) 2005-06-15 2017-12-20 Complete Genomics Inc. Nucleic acid analysis by random mixtures of non-overlapping fragments
GB0514910D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Method for sequencing a polynucleotide template
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
WO2007120208A2 (en) 2005-11-14 2007-10-25 President And Fellows Of Harvard College Nanogrid rolling circle dna sequencing
US7329860B2 (en) 2005-11-23 2008-02-12 Illumina, Inc. Confocal imaging methods and apparatus
US8192930B2 (en) 2006-02-08 2012-06-05 Illumina Cambridge Limited Method for sequencing a polynucleotide template
EP2018622B1 (en) 2006-03-31 2018-04-25 Illumina, Inc. Systems for sequence by synthesis analysis
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US7910302B2 (en) 2006-10-27 2011-03-22 Complete Genomics, Inc. Efficient arrays of amplified polynucleotides
US20080108804A1 (en) 2006-11-02 2008-05-08 Kabushiki Kaisha Dnaform Method for modifying RNAS and preparing DNAS from RNAS
EP2653861B1 (en) 2006-12-14 2014-08-13 Life Technologies Corporation Method for sequencing a nucleic acid using large-scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US7678894B2 (en) 2007-05-18 2010-03-16 Helicos Biosciences Corporation Nucleotide analogs
US7901889B2 (en) 2007-07-26 2011-03-08 Pacific Biosciences Of California, Inc. Molecular redundant sequencing
US7767400B2 (en) 2008-02-03 2010-08-03 Helicos Biosciences Corporation Paired-end reads in sequencing by synthesis
BRPI0909212A2 (pt) 2008-03-28 2015-08-18 Pacific Biosciences California Composições e método para sequeciamento de ácido nucléico
US8039817B2 (en) 2008-05-05 2011-10-18 Illumina, Inc. Compensator for multiple surface imaging
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
EP2379748A4 (en) 2008-12-23 2012-08-29 Illumina Inc MULTIBASE RELEASE FOR LONG READINGS IN SEQUENCING BY SYNTHESIS PROTOCOLS
US8034923B1 (en) 2009-03-27 2011-10-11 Steven Albert Benner Reagents for reversibly terminating primer extension
WO2010127304A2 (en) 2009-05-01 2010-11-04 Illumina, Inc. Sequencing methods
US8632975B2 (en) 2009-06-05 2014-01-21 Life Technologies Corporation Nucleotide transient binding for sequencing methods
EP2633069B1 (en) 2010-10-26 2015-07-01 Illumina, Inc. Sequencing methods
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
WO2013014451A1 (en) 2011-07-25 2013-01-31 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
KR102048274B1 (ko) 2011-09-13 2019-11-25 애질런트 테크놀로지스, 인크. 핵산 시퀀싱을 위하여 5-메톡시, 3'-oh 차단안된, 신속하게 광절단가능한 종료 뉴클레오티드 및 핵산 시퀀싱 방법
US10837879B2 (en) 2011-11-02 2020-11-17 Complete Genomics, Inc. Treatment for stabilizing nucleic acid arrays
HUE051845T2 (hu) 2012-03-20 2021-03-29 Univ Washington Through Its Center For Commercialization Módszerek a tömegesen párhuzamos DNS-szekvenálás hibaarányának csökkentésére duplex konszenzus szekvenálással
WO2013184754A2 (en) 2012-06-05 2013-12-12 President And Fellows Of Harvard College Spatial sequencing of nucleic acids using dna origami probes
US8808989B1 (en) 2013-04-02 2014-08-19 Molecular Assemblies, Inc. Methods and apparatus for synthesizing nucleic acids
US10407722B2 (en) * 2014-06-06 2019-09-10 Cornell University Method for identification and enumeration of nucleic acid sequence, expression, copy, or DNA methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions
GB201416106D0 (en) * 2014-09-11 2014-10-29 Illumina Cambridge Ltd Paired-end sequencing by attachment of the complementary strand
WO2016077313A1 (en) 2014-11-11 2016-05-19 Bgi Shenzhen Multi-pass sequencing
EP3259372B1 (en) 2015-02-17 2020-11-18 MGI Tech Co., Ltd. Dna sequencing using controlled strand displacement
CN107532205B (zh) * 2015-03-31 2021-06-08 伊卢米纳剑桥有限公司 模板的表面连环化
US11085073B2 (en) * 2015-04-24 2021-08-10 Qiagen Gmbh Method for immobilizing a nucleic acid molecule on a solid support
US10077470B2 (en) 2015-07-21 2018-09-18 Omniome, Inc. Nucleic acid sequencing methods and systems
CN109154024B (zh) 2016-04-29 2022-03-04 欧姆尼欧美公司 核酸序列测定方法
US10597643B2 (en) 2016-04-29 2020-03-24 Omniome, Inc. Polymerases engineered to reduce nucleotide-independent DNA binding
AU2017313718B2 (en) 2016-08-15 2023-09-14 Pacific Biosciences Of California, Inc. Method and system for sequencing nucleic acids
WO2018187013A1 (en) 2017-04-04 2018-10-11 Omniome, Inc. Fluidic apparatus and methods useful for chemical and biological reactions
US10161003B2 (en) 2017-04-25 2018-12-25 Omniome, Inc. Methods and apparatus that increase sequencing-by-binding efficiency
CN111148847B (zh) 2017-10-11 2024-05-07 深圳华大智造科技有限公司 用于改善核酸装载和稳定性的方法
WO2019156910A1 (en) 2018-02-06 2019-08-15 Omniome, Inc. Compositions and techniques for nucleic acid primer extension
US20210189460A1 (en) * 2018-04-25 2021-06-24 Qiagen Sciences Llc Sequential paired-end sequencing
EP4234718A3 (en) 2018-04-26 2023-11-29 Pacific Biosciences Of California, Inc. Methods and compositions for stabilizing nucleic acid-nucleotide-polymerase complexes
EP3802874A1 (en) 2018-05-31 2021-04-14 Omniome, Inc. Increased signal to noise in nucleic acid sequencing
US11180794B2 (en) 2018-05-31 2021-11-23 Omniome, Inc. Methods and compositions for capping nucleic acids
EP3827097A1 (en) 2018-07-24 2021-06-02 Omniome, Inc. Serial formation of ternary complex species
US11242512B2 (en) 2018-09-17 2022-02-08 Omniome, Inc. Engineered polymerases for improved sequencing
US20210189483A1 (en) 2019-12-23 2021-06-24 Mgi Tech Co. Ltd. Controlled strand-displacement for paired end sequencing
US20210332430A1 (en) 2020-01-17 2021-10-28 Element Biosciences, Inc. High performance fluorescence imaging module for genomic testing assay
AU2021275128A1 (en) 2020-05-20 2023-01-19 Element Biosciences, Inc. Methods for paired-end sequencing library preparation
US11535892B1 (en) 2021-06-17 2022-12-27 Element Biosciences, Inc. Compositions and methods for pairwise sequencing

Also Published As

Publication number Publication date
US11608528B2 (en) 2023-03-21
AU2021230282A1 (en) 2022-09-22
EP4114966A1 (en) 2023-01-11
CA3173798A1 (en) 2021-09-10
WO2021178467A1 (en) 2021-09-10
US20230357844A1 (en) 2023-11-09
US20220349002A1 (en) 2022-11-03

Similar Documents

Publication Publication Date Title
CN115516104A (zh) 用于对双链核酸进行测序的方法和组合物
EP4234718A2 (en) Methods and compositions for stabilizing nucleic acid-nucleotide-polymerase complexes
US11339428B2 (en) Increased signal to noise in nucleic acid sequencing
US11180749B2 (en) Allele-specific capture of nucleic acids
US20220106628A1 (en) Methods and compositions for capping nucleic acids
US11492666B2 (en) Distinguishing sequences by detecting polymerase dissociation
US20220356519A1 (en) Single-molecule seeding and amplification on a surface
US11499189B2 (en) Mitigating adverse impacts of detection systems on nucleic acids and other biological analytes
CN117813392A (zh) 表面上的单分子接种和扩增
US20220356515A1 (en) Dna amplification buffer replenishment during rolling circle amplification
CN114599795A (zh) 用于对核酸加帽的方法和组合物
US20230357843A1 (en) Nucleic acid circularization and amplification on a surface
US20220235410A1 (en) Nucleic acid amplification methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination