CN106715715A - 多功能寡核苷酸 - Google Patents

多功能寡核苷酸 Download PDF

Info

Publication number
CN106715715A
CN106715715A CN201580043570.1A CN201580043570A CN106715715A CN 106715715 A CN106715715 A CN 106715715A CN 201580043570 A CN201580043570 A CN 201580043570A CN 106715715 A CN106715715 A CN 106715715A
Authority
CN
China
Prior art keywords
sequence
hairpin oligonucleotide
amplicon
self
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580043570.1A
Other languages
English (en)
Inventor
D.H.金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abbott Laboratories
Abbott Molecular Inc
Original Assignee
Abbott Laboratories
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abbott Laboratories filed Critical Abbott Laboratories
Publication of CN106715715A publication Critical patent/CN106715715A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供了涉及核酸的操作和表征的技术,并且特别地、但非排他地,涉及用于扩增、定量和测序核酸的寡核苷酸引物和探针相关的方法和组合物。

Description

多功能寡核苷酸
相关申请的交叉引用
本申请主张于2014年8月14日提交的美国临时申请序列号62/037,331的优先权,所述申请的全部内容通过引用并入本文。
领域
本文提供了涉及核酸的操作和表征的技术,并且特别地、但非排他地,涉及用于扩增、定量和测序核酸的寡核苷酸引物和探针相关的方法和组合物。
背景
使用DNA测序的分子诊断是医学研究和临床实践的重要元素。将DNA测序引入医疗护理主要由下一代测序(NGS)技术的发展所驱动,其提供了用于测定核酸序列的低成本和高通量手段。例如,序列数据已经在癌症、传染病、伴随药物和遗传病况的诊断中使用。已变得显而易见的是,NGS在医学中具有广泛应用,并且紧急提供个性化医疗护理将增加在所有规模(例如,从SNP至基因、染色体和整个基因组)的测序的需求。
大多数NGS平台需要测序文库作为输入物。尽管每个特定NGS平台对于测序文库具有其自己的特定要求,但用于从核酸样品产生测序文库的流程通常包括用于定量核酸样品和向样品中的核酸末端添加平台特异性适配子的步骤。适配子是将文库引入NGS流程的先决条件。具体而言,所述适配子提供了用共同的平台特异性引物起始测序单个核酸的位点。测序文库的精确定量对于在NGS流程中提供浓度均一化文库以产生高质量序列数据是至关重要的。
具体而言,一种现有方法首先使用常规PCR和典型的线性引物产生扩增子,随后将包含平台依赖性(例如“通用”)序列的适配子酶促连接至扩增子。一些其它现有技术涉及使用“融合引物”,其具有在5'侧侧接平台依赖性(例如“通用”)序列的扩增子特异性引发序列。
这些当前NGS流程涉及多个步骤和/或反应以制备测序文库。例如,现有的基于扩增的流程并入分开的扩增、定量和接头连接步骤,其中在每个步骤之间经常进行纯化、质量控制和定量步骤。进行这些多个DNA片段处理、纯化和质量控制程序需要大量的操作时间、延长的流程时间、增加的试剂使用和更多的使用者错误的机会。因此,这些因素有助于限制样品制备通量,并且就试剂成本和实验室人员时间和努力而言增加每个样品制备的成本。最终,增加了DNA序列读数的每个碱基成本。此外,总体数据输出是次佳的,因为序列输出不受仪器的测序能力的限制,而是受提供用于分析的样品的限制。
此外,包括使用“融合”引物的现有技术将脱靶扩增子引入扩增子合并物,因此影响文库产生的效率和可靠性。具体而言,在样品后处理、制备和热循环的所有阶段期间暴露平台依赖性序列(例如,“通用”序列)。因此,当使用融合引物进行扩增时,产生包含在扩增子的末端掺入的通用序列的扩增子,并且随后的复杂杂交相互作用(例如,扩增子 - 扩增子和扩增子 - 融合引物)产生不需要的扩增产物。一个结果是非靶序列的产生。另一个问题是这些低效率限制了现有技术在用于文库产生和测序的多重方案中的可扩展性和用途。
概述
因此,在一些实施方案中,本文提供了与操作核酸相关的技术。在一些实施方案中,本技术涉及产生NGS测序文库。本技术为NGS提供了有效的扩增子文库的“一步/一管”产生和定量。操作时间小于现有技术,例如,因为本技术与进行更少步骤相关。例如,在一些实施方案中,与本技术相关的操作时间限于准备单个PCR反应,其可以在约15分钟内完成。此外,一般总体流程与组装和热循环单个扩增反应和随后的产物纯化步骤(它们一起花费约2小时或更少时间)相关。本技术提供了多重化能力,其与额外降低试剂成本和提高样品制备通量相关。此外,由于比现有技术明显更简化的流程,整个流程适合于自动化。与现有技术相比,一些实施方案是可行的,具有较不复杂和较便宜的自动化***。
用于基于NGS扩增子的文库产生的现有流程是复杂、昂贵且耗时的,因此在临床和/或诊断实验室设置中具有有限的适用性。相比之下,本文提供的技术可用于临床和/或诊断实验室设置中,因为其是易于进行、具有低成本并产生具有快速周转率的结果的技术。本技术提供了在单个管中稳健产生多扩增子文库。所述文库易于用于输入NGS***流程中,其具有最少的操作时间且具有总体流程时间和成本的显著降低。本技术易于自动化,其提供了效率的额外增加。
具体而言,本技术涉及设计和使用形成“发夹”或“茎-环(step-loop)”结构的寡核苷酸。在一些实施方案中,本技术提供了寡核苷酸,其包含通过分子内相互作用形成双链元件的部分和保留为单链形式的部分,例如,用于与互补(例如靶)序列杂交,例如,充当用于扩增的引物。在具体实施方案中,所述寡核苷酸包含第一自身互补区域和第二自身互补区域,其与彼此杂交(例如,通过分子内相互作用)以形成双链元件。
在一些实施方案中,所述寡核苷酸包含单链环区域(例如,在第一自身互补区域和第二自身互补区域之间),一个或多个荧光部分(例如,荧光部分和/或猝灭部分) ,和/或抗降解(例如,通过酶诸如核酸外切酶,例如5'至3'核酸外切酶,或包含核酸外切酶例如5'至3'核酸外切酶活性的酶(例如,聚合酶))的部分。在一些实施方案中,所述单链环区域包含PEG(聚乙二醇)接头。此外,在一些实施方案中,PEG接头连接第一自身互补区域和第二自身互补区域。
在一些实施方案中,所述寡核苷酸包含荧光部分和猝灭剂部分。荧光部分和猝灭剂部分可以位于寡核苷酸上的各个位置,但不限于此。例如,实施方案提供了第一自身互补区域包含荧光部分,且第二自身互补区域包含猝灭部分。实施方案提供了第二自身互补区域包含荧光部分,且第一自身互补区域包含猝灭部分。
在一些优选实施方案中,荧光部分和猝灭部分存在于双链元件的相同自身互补区域上(例如,荧光部分和猝灭部分都在发夹双链体的相同链上,例如,第一自身互补区域包含荧光部分和猝灭部分,或第二自身互补区域包含荧光部分和猝灭部分)。
在一些实施方案中,根据本技术的寡核苷酸包含荧光部分和猝灭剂部分,其适当地位于空间中,使得猝灭剂部分猝灭荧光部分的荧光(例如,当激发荧光部分时,例如通过将荧光部分暴露于适当(例如,激发)波长的电磁辐射)。在一些实施方案中,第一自身互补区域的降解或第二自身互补区域的降解将猝灭剂部分与荧光部分分离,使得猝灭剂部分不猝灭荧光部分的荧光(例如,当激发荧光部分时,例如通过将荧光部分暴露于适当(例如,激发)波长的电磁辐射)。例如,一些实施方案包括使用聚合酶(例如,Taq聚合酶)和本文提供的寡核苷酸引物用于PCR。当聚合酶(例如,Taq聚合酶)合成新生链并遇到双链区域的5'末端时,聚合酶的5'至3'核酸外切酶活性降解第一自身互补区域或第二自身互补区域。第一自身互补区域或第二自身互补区域的降解从其释放荧光团和/或猝灭剂,并且破坏荧光部分与猝灭剂的紧密接近,因此减轻猝灭效应并促进荧光部分发荧光。在一些实施方案中,在定量PCR热循环仪中检测到的荧光与释放的荧光部分和存在于PCR中的靶DNA(例如,扩增子和/或模板)的量成正比。
在一些实施方案中,所述寡核苷酸包含阻断剂(例如,核酸酶抗性)部分,其对例如酶(例如,具有核酸外切酶活性的酶(例如,核酸外切酶或包含核酸外切酶活性的聚合酶))的降解有抗性。在一些实施方案中,所述单链环区域包含阻断剂部分。在一些实施方案中,第一自身互补区域或第二自身互补区域包含阻断剂部分。在一些实施方案中,阻断剂部分限定单链环区域和第一自身互补区域之间或单链环区域和第二自身互补区域之间的连接。在一些实施方案中,阻断剂部分是硫代磷酸酯键或核苷酸类似物。在一些实施方案中,阻断剂部分阻断具有5'至3'核酸外切酶活性的酶(例如,聚合酶)的进展。在一些实施方案中,阻断具有5'至3'核酸外切酶活性的酶(例如聚合酶)的进展限定了已知的末端序列或提供了核酸的限定的末端序列,所述核酸诸如根据本技术产生的扩增子,例如,包含使用者定义的适配子(例如,包含例如标签(例如,包含接头、索引、捕获序列、限制性位点、引物结合位点、抗原和/或其它功能位点)和/或通用序列(例如,平台特异性序列)的适配子)的扩增子。在与使用包含3'核酸外切酶活性、但缺乏5'核酸外切酶活性的校正聚合酶(例如,高保真聚合酶)相关的一些实施方案中,所述寡核苷酸包含PEG接头且PEG-DNA连接终止聚合酶延伸。
在一些实施方案中,所述寡核苷酸可用于核酸的扩增。例如,在一些实施方案中,所述寡核苷酸可用于聚合酶链式反应(PCR)以产生扩增产物。在一些实施方案中,所述寡核苷酸可用于产生包含两个部分的扩增产物(例如,扩增子):
1) 包含、衍生自和/或互补于靶模板的第一部分;和
2) 包含使用者定义的适配子(例如,包含标签(例如,包含接头、索引、捕获序列、限制性位点、引物结合位点、抗原和/或其它功能位点的标签)和/或包含通用序列(例如,包含平台依赖性序列)的适配子)的第二部分。
也就是说,本技术的实施方案产生包含连接至使用者定义的功能序列诸如如本文所述的适配子的靶序列的扩增子。
此外,本技术提供了扩增产物的实时相对定量。在一些实施方案中,所述扩增产物的实时相对定量在没有单独的标记探针的情况下发生,例如,如在包含水解探针(例如,Taqman探针)的实时定量PCR中使用。因此,当在PCR中用作引物时,本技术(例如,寡核苷酸和使用它们的方法)提供了包含靶序列和使用者定义的适配子的扩增子的定量“一步”生成。本技术简化了NGS测序文库生成的流程。
因此,本文提供了发夹寡核苷酸的实施方案。在一些实施方案中,所述发夹寡核苷酸含有包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段);和包含使用者定义的适配子的第二部分。
在一些实施方案中,所述发夹寡核苷酸含有包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段);和包含使用者定义的包含标签的适配子的第二部分。
在一些实施方案中,所述发夹寡核苷酸含有包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段);和包含使用者定义的包含通用序列(例如,包含平台依赖性序列)的适配子的第二部分。
在一些实施方案中,所述发夹寡核苷酸含有包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段);和包含使用者定义的包含标签(例如,包含接头、索引、捕获序列、限制性位点、引物结合位点、抗原和/或其它功能位点的标签)和/或包含通用序列(例如,包含平台依赖性序列)的适配子的第二部分。
在一些实施方案中,所述发夹寡核苷酸含有包含扩增子特异性引发区段的单链区域和包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域。
在一些实施方案中,所述发夹寡核苷酸含有包含扩增子特异性引发区段的单链区域;包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;和单链环区域。
在一些实施方案中,所述发夹寡核苷酸含有包含扩增子特异性引发区段的单链区域;包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;和PEG接头。
在一些实施方案中,所述发夹寡核苷酸含有包含扩增子特异性引发区段的单链区域;包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;单链环区域;阻断剂部分;荧光部分;和猝灭部分,其中所述第二自身互补区域包含荧光部分和猝灭部分。
在一些实施方案中,所述发夹寡核苷酸含有包含扩增子特异性引发区段的单链区域;包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;单链环区域;和阻断剂部分。
在各个实施方案中,本文所述的发夹寡核苷酸包含为发夹寡核苷酸提供所需特征的区段、元件、特征和/或序列。例如,在一些实施方案中,所述发夹寡核苷酸包含适配子。在一些实施方案中,所述适配子进而包含标签;在一些实施方案中,所述标签包含接头、索引、捕获序列、限制性位点、引物结合位点、抗原和/或其它功能位点。在一些实施方案中,所述接头包含通用序列(例如,平台依赖性序列)。
本技术不限于放置标签。在一些具体实施方案中,所述标签位于扩增子特异性引发区段和双链区域之间(参见例如,图1)。然而,所述标签可以位于发夹寡核苷酸的一级结构内的各个位置。在一些实施方案中,所述标签序列在发夹寡核苷酸的一个或多个其它区段、元件、特征和/或序列内和/或与之重叠。例如,在一些实施方案中,所述单链环区域包含标签。
所述发夹寡核苷酸的实施方案包含对核酸酶活性有抗性的阻断剂部分。例如,在一些实施方案中,所述阻断剂部分是核酸外切酶抗性的,例如对5'至3'核酸外切酶活性有抗性。本技术不限于阻断剂部分的类型、结构或组成,条件是所述阻断剂部分是核酸酶抗性的。示例性阻断剂部分提供了核酸中的相邻核苷酸之间的核酸酶抗性键,例如在一些实施方案中,所述阻断剂部分是硫代磷酸酯键。在一些实施方案中,所述阻断剂部分是肽-核酸键。在一些实施方案中,所述阻断剂部分位于或接近单链环区域和双链双链体区域的连接处。
本技术不限于荧光部分的类型、结构或组成。荧光部分的非限制性实例包括可以合成或商业获得的染料(例如,Operon Biotechnologies, Huntsville, Alabama)。大量染料(大于50种)可用于应用于荧光激发应用。这些染料包括来自荧光素、罗丹明、AlexaFluor、Bodipy、香豆素和花菁染料家族的染料。荧光团的具体实例包括但不限于FAM、TET、HEX、Cy3、TMR、ROX、VIC(例如,来自Life Technologies)、德克萨斯红、LC红640、Cy5和LC红705。在一些实施方案中,具有410 nm(例如,级联蓝)至775 nm(例如,Alexa Fluor750)的发射最大值的染料是可得的并且可以使用。当然,本领域普通技术人员将认识到同样可以使用具有这些范围之外的发射最大值的染料。在一些情况下,范围在500nm至700nm之间的染料具有在可见光谱中的优点并且可以使用现有的光电倍增管来检测。在一些实施方案中,宽范围的可用染料允许选择具有散布在检测范围上的发射波长的染料组。能够区分许多染料的检测***是本领域已知的。
此外,本技术不限于猝灭部分的类型、结构或组成。示例性猝灭部分包括黑洞猝灭剂、爱荷华黑猝灭剂及其衍生物、修饰物和相关部分。示例性猝灭部分包括BHQ-0、BHQ-1、BHQ-2和BHQ-3。
所述发夹寡核苷酸的双链区域可以包含完全互补或不完全互补的杂交片段,条件是双链体在如本文所述的所需温度和反应条件下形成。因此,一些具体实施方案提供了所述双链双链区包含至少一个错配(例如,错配,例如1、2、3、4、5、6、7、8、9、10或更多个错配)。
所述发夹寡核苷酸可以呈现不同的构象。例如,在一些实施方案中,第一自身互补区域和第二自身互补区域在扩增反应中在等于或高于变性温度(例如,高于89、90、91、92、93、94、95、96或97 ℃)下不杂交。在一些实施方案中,第一自身互补区域和第二自身互补区域在扩增反应中在低于变性温度(例如,在约65至80℃,例如,65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80℃)下杂交。参见例如,图2。
本技术的实施方案涉及包含本文所述的发夹寡核苷酸的反应混合物。例如,一些实施方案提供了包含本文所述的发夹寡核苷酸和模板的反应混合物,其中所述单链区域(例如,引物区域)与模板杂交,并且第一自身互补区域与第二自身互补区域杂交。
还考虑从本文提供的发夹寡核苷酸产生的扩增子。具体实施方案提供了扩增子,其含有包含、衍生自和/或互补于靶模板的第一部分和包含使用者定义的适配子的第二部分。
一些实施方案涉及包含标签(例如,包含接头、索引、捕获序列、限制性位点、引物结合位点、抗原和/或其它功能位点)和/或通用序列(例如,平台依赖性序列)的扩增子。在一些实施方案中,在扩增子的发夹寡核苷酸衍生部分的一部分已经被核酸酶活性(例如,聚合酶的核酸外切酶活性)水解后,扩增子包含标签。例如,一些实施方案提供了扩增子,其含有包含、衍生自和/或互补于靶模板的序列;标签;和衍生自如本文所述的发夹寡核苷酸的第一自身互补序列,但其中所述扩增子缺乏:衍生自所述发夹寡核苷酸的第二自身互补序列;荧光部分;和猝灭剂部分(参见例如,图3中步骤4后的扩增子)。由于将荧光部分释放至溶液中的核酸酶活性,此类扩增子不包含荧光部分。因此,实施方案提供了反应混合物,其包含如上所述的扩增子(例如,含有包含、衍生自和/或互补于靶模板的序列的扩增子;标签;和衍生自如本文所述发夹寡核苷酸的第一自身互补序列)和游离荧光部分。在一些实施方案中,此类反应混合物进一步含有包含核酸外切酶活性(例如,5'至3'核酸外切酶活性)的聚合酶,或包含校对活性、3'核酸外切酶活性和/或链置换活性、但缺乏5'核酸外切酶活性的聚合酶(例如,高保真聚合酶)。相关实施方案进一步包含dNTP(例如,dATP、dCTP、dGTP和dTTP单体)。额外实施方案进一步包含第二引物,例如作为包含含有扩增子特异性引发区段的单链区域的发夹寡核苷酸的第二引物;包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;单链环区域;和阻断剂部分。
本文还描述了方法诸如用于产生测序文库的方法的实施方案。示例性方法涉及产生包含扩增子的测序文库,所述方法包括提供包含如本文所述的发夹寡核苷酸和待测序的核酸的反应混合物;和将所述反应混合物暴露于适于产生扩增子(例如如本文所述的扩增子)的条件。在一些实施方案中,所述反应混合物含有包含核酸外切酶活性的聚合酶。方法的实施方案包括监测荧光部分的发射波长处的荧光信号(例如,实时扩增方法,例如,实时PCR方法,例如,实时定量PCR方法)。在一些实施方案中,所述方法包括提供第二引物,其中所述第二引物是包含含有扩增子特异性引发区段的单链区域的发夹寡核苷酸;包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;单链环区域;和阻断剂部分。方法实施方案涉及提供测序文库用于输入测序平台或***中,例如用于输入NGS***或平台的流程中。在一些实施方案中,所述方法包括将扩增子测序以产生核苷酸序列,其中所述核苷酸序列包含来自核酸的序列和索引序列(例如,来自标签)。索引序列提供了可用于以比现有技术更高的效率测定多个序列的多重化和去多重化能力。多重测序文库包含多个核酸,例如来自多个样品、受试者、等位基因等。因此,在一些实施方案中,所述方法包括混合第一扩增子和第二扩增子以产生多重测序文库。因此,一些实施方案进一步包括将核苷酸序列与样品关联(例如,去多重化)。额外实施方案包括定量扩增子的量以提供于测序文库中。
因此,一些实施方案涉及用于输入NGS测序平台或***中的(例如,根据本文提供的方法的实施方案产生的)NGS测序文库。一些实施方案涉及组合物,其包含用于输入NGS测序平台或***中的(例如,根据本文提供的方法的实施方案产生的)NGS测序文库。
一些实施方案涉及用于多重测序的方法,所述方法包括提供包含第一核苷酸序列的第一扩增子,所述第一核苷酸序列包含第一靶序列和衍生自发夹寡核苷酸的标签,其中所述标签包含第一索引(索引序列);提供包含第二核苷酸序列的第二扩增子,所述第二核苷酸序列包含第二靶序列和衍生自发夹寡核苷酸的第二标签,其中第二标签包含第二索引序列;和混合所述第一扩增子和所述第二扩增子以产生多重测序文库。用于多重测序的方法的一些实施方案包括将多重测序文库测序以产生包含第一核苷酸序列和第二核苷酸序列的一组核苷酸序列。用于多重测序的一些实施方案包括通过将与第一索引序列关联的第一核苷酸序列分配至第一样品且将与第二索引序列关联的第二核苷酸序列分配至第二样品来将核苷酸序列组去多重化。与多重测序相关的额外实施方案包括在单个反应室中将多个扩增子测序以产生多个核酸序列,其中所述扩增子由两个或更多个不同样品产生;和基于所述多个核酸序列中的每个序列中含有的索引序列鉴定产生每个所述核酸序列的样品,其中每个索引序列由本文所述的发夹寡核苷酸提供。
额外实施方案涉及用于产生测序文库的试剂盒,所述测序文库包含如本文所述的扩增子(例如,如本文所述的扩增子,例如,含有包含、衍生自和/或互补于靶模板的第一部分和包含使用者定义的适配子的第二部分;例如,包含衍生自靶核酸的核苷酸序列和衍生自如本文所述的发夹寡核苷酸的序列的扩增子),所述试剂盒包含多个如本文所述的发夹寡核苷酸,其中所述多个发夹寡核苷酸各自包含多个索引序列中的至少一个;和包含核酸外切酶活性的聚合酶。
进一步实施方案提供了用于产生核苷酸序列的***,所述***含有包含扩增子的测序文库,其中所述扩增子包含衍生自靶核酸的核苷酸序列和衍生自如本文所述的发夹寡核苷酸的序列;热循环仪装置;和用于分析核苷酸序列和将多个核苷酸序列去多重化的计算机。在一些实施方案中,***包含荧光检测器。
一些实施方案提供了发夹寡核苷酸,其包含单链区域(例如,包含扩增子特异性引发区域和标签);包含与第二自身互补区域杂交的第一自身互补区域(例如,具有完全互补性或包含一个或多个(例如,1、2、3、4、4、6、7、8、9、10或更多个)错配)的双链双链体区域;单链环区域(例如,在一些实施方案中包含PEG接头);阻断剂部分(例如,核酸酶抗性部分,诸如例如,硫代磷酸酯或肽核酸键,例如位于单链环区域和双链双链体区域的连接附近);荧光部分(例如,呫吨、荧光素、罗丹明、BODIPY、花菁、香豆素、芘、酞菁、FAM、JOE、Cy3、Cy5、Cy3.5、Cy5.5、TAMRA、ROX、HEX或藻胆蛋白);和猝灭部分(例如,爱荷华黑猝灭剂或黑洞猝灭剂,诸如例如BHQ-0、BHQ-1、BHQ-2和BHQ-3),其中所述第二自身互补区域包含荧光部分和猝灭部分,其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在等于或高于变性温度下不杂交,且其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在低于变性温度下杂交。
一些实施方案提供了发夹寡核苷酸,其包含单链区域(例如,包含扩增子特异性引发区域和标签);包含与第二自身互补区域杂交的第一自身互补区域(例如,具有完全互补性或包含一个或多个(例如,1、2、3、4、4、6、7、8、9、10或更多个)错配)的双链双链体区域;单链环区域(例如,在一些实施方案中包含PEG接头);阻断剂部分(例如,核酸酶抗性部分,诸如例如,硫代磷酸酯或肽核酸键,例如位于单链环区域和双链双链体区域的连接附近),其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在等于或高于变性温度下不杂交,且其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在低于变性温度下杂交。
一些实施方案提供了发夹寡核苷酸,其包含单链区域(例如,包含扩增子特异性引发区域);包含与第二自身互补区域杂交的第一自身互补区域(例如,具有完全互补性或包含一个或多个(例如,1、2、3、4、4、6、7、8、9、10或更多个)错配)的双链双链体区域;单链环区域(例如,在一些实施方案中包含PEG接头);阻断剂部分(例如,核酸酶抗性部分,诸如例如,硫代磷酸酯或肽核酸键,例如位于单链环区域和双链双链体区域的连接附近);荧光部分(例如,呫吨、荧光素、罗丹明、BODIPY、花菁、香豆素、芘、酞菁、FAM、JOE、Cy3、Cy5、Cy3.5、Cy5.5、TAMRA、ROX、HEX或藻胆蛋白);和猝灭部分(例如,爱荷华黑猝灭剂或黑洞猝灭剂,诸如例如BHQ-0、BHQ-1、BHQ-2和BHQ-3),其中所述第二自身互补区域包含荧光部分和猝灭部分,其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在等于或高于变性温度下不杂交,且其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在低于变性温度下杂交。
一些实施方案提供了发夹寡核苷酸,其包含单链区域(例如,包含扩增子特异性引发区域);包含与第二自身互补区域杂交的第一自身互补区域(例如,具有完全互补性或包含一个或多个(例如,1、2、3、4、4、6、7、8、9、10或更多个)错配)的双链双链体区域;单链环区域(例如,在一些实施方案中包含PEG接头);阻断剂部分(例如,核酸酶抗性部分,诸如例如,硫代磷酸酯或肽核酸键,例如位于单链环区域和双链双链体区域的连接附近),其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在等于或高于变性温度下不杂交,且其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在低于变性温度下杂交。
一些实施方案提供了发夹寡核苷酸,其包含单链区域(例如,包含扩增子特异性引发区域和标签);包含与第二自身互补区域杂交的第一自身互补区域(例如,具有完全互补性或包含一个或多个(例如,1、2、3、4、4、6、7、8、9、10或更多个)错配)的双链双链体区域;和连接所述第一自身互补区域和所述第二自身互补区域的PEG接头,其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在等于或高于变性温度下不杂交,且其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在低于变性温度下杂交。
一些实施方案提供了发夹寡核苷酸,其包含单链区域(例如,包含扩增子特异性引发区域);包含与第二自身互补区域杂交的第一自身互补区域(例如,具有完全互补性或包含一个或多个(例如,1、2、3、4、4、6、7、8、9、10或更多个)错配)的双链双链体区域;和连接所述第一自身互补区域和所述第二自身互补区域的PEG接头,其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在等于或高于变性温度下不杂交,且其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在低于变性温度下杂交。
额外实施方案涉及用于将核酸测序的方法,所述方法包括提供反应混合物,其包含一种或多种如本文所述的发夹寡核苷酸、一种或多种待测序的核酸和包含核酸外切酶活性的聚合酶;将所述反应混合物暴露于适于产生一种或多种扩增子的条件;监测所述荧光部分的发射波长处的荧光信号;定量一种或多种扩增子的一种或多种量或浓度用于提供于测序文库中;将所述一个或多个扩增子测序以产生一种或多种核苷酸序列,其中所述一种或多种核苷酸序列中每一种包含来自所述核酸的序列和索引序列;和将所述一种或多种核苷酸序列中每一种与一种或多种样品中每一种关联(例如,使用一种或多种索引序列将包含所述一种或多种核苷酸序列的核苷酸序列组去多重化)。
本文提供的技术提供了相对于现有技术的几个优点。首先,一些现有技术在第一PCR反应中使用发夹引物,随后为第二PCR反应,其中融合引物从发夹的茎部分引发。与其中需要两个单独的PCR以产生具有侧接适配子(例如,包含“通用”)序列的扩增子的该方法相反,本文提供的技术基于单个扩增反应以产生包含与NGS***相容的适配子的扩增子。第二,一些现有技术使用这样的发夹引物变体,其仅设计用于产生具有最少副产物的DNA产物,用于用作第二PCR的输入模板。相比之下,本文所述的技术提供了具有多种功能性以控制片段大小;定量和/或监测扩增产物;和/或添加适配子序列的寡核苷酸。这些相对于现有技术的基本差异最终导致产生NGS扩增子文库所涉及的操作时间量、总体流程时间和成本的显著改进。
基于本文含有的教导,额外实施方案对于相关领域的技术人员将是显而易见的。
附图简述
考虑下列附图,本技术的这些和其它特征、方面和优点将变得更好地理解:
图1显示根据本文提供的技术的发夹引物的实施方案。图1A是发夹引物的一个实施方案100的示意图,所述发夹引物包含扩增子特异性引发序列101、标签102、单链环区域104、荧光部分108、猝灭剂部分107和阻断剂(例如,核酸外切酶抗性)部分106。图1B是发夹引物的第二个实施方案200的示意图,所述发夹引物包含扩增子特异性引发序列201、标签202、单链环区域204和阻断剂(例如,核酸酶抗性)部分206。图1C是发夹引物的一个实施方案110的示意图,所述发夹引物包含扩增子特异性引发序列111、单链环区域114、荧光部分118、猝灭剂部分117和阻断剂(例如,核酸外切酶抗性)部分116。图1D是发夹引物的一个实施方案210的示意图,所述发夹引物包含扩增子特异性引发序列211、单链环区域214和阻断剂(例如,核酸外切酶抗性)部分216。图1E是发夹引物的一个实施方案220的示意图,所述发夹引物包含扩增子特异性引发序列221、标签222和PEG接头224。图1F是发夹引物的一个实施方案230的示意图,所述发夹引物包含扩增子特异性引发序列231和PEG接头234。白色区段(白色实心和具有阴影的白色实心)103、105、203、205、113、115、213、215、223、225、233和235代表双链(双链体)元件(例如,包含第一自身互补区域和第二自身互补区域)的组分;黑色区段(黑色实心和具有阴影的黑色实心)101、102、104、201、202、204、111、114、211、214、221、222和231代表单链元件;灰色区段224和234代表PEG接头。添加至文库核酸的适配子序列包含102、103和104;202、203和204;113和114;213和214;222和223;或233。
图2显示发夹引物100的一个实施方案的多种(三种)不同状态。图2A显示发夹引物100在变性温度(例如,大于或等于约95℃的温度,在该温度下,发夹引物100是线性的并且不包含分子内二级结构)下的一个实施方案;图2B显示发夹引物100在中间温度(例如,约75℃的温度,在该温度下形成分子内二级结构(例如,包含双链元件的发夹茎 - 环))下的一个实施方案;图2C显示发夹引物100在退火温度(例如,小于或等于约60℃,在该温度下,发夹引物包含分子内二级结构,并且扩增子特异性引发区域101与靶模板300上的其互补序列杂交)下的一个实施方案。
图3是显示使用包含荧光部分(星形)的发夹引物100的一个实施方案的核酸扩增的实施方案的阶段的示意图。在图3中,发夹引物100与靶模板300上的其互补序列杂交,聚合酶(例如,包含5'至3'核酸外切酶活性)400(大灰色圆形)结合经引发的模板(步骤1)并延伸发夹引物的3'末端(例如,从扩增子特异性引发区域),以形成包含猝灭状态的荧光部分的核酸500(步骤2)。通过聚合酶的第二链合成产生核酸600(步骤3)。当聚合酶遇到核酸500的双链(例如,发夹)区域的5’末端时,聚合酶的核酸外切酶活性从发夹的5’末端降解双链结构,释放荧光部分(星形)和猝灭部分(五边形)(步骤4)。荧光部分108和猝灭部分107的空间中的分离(例如,当荧光部分和猝灭部分在反应混合物中彼此远离扩散时)允许荧光部分108发荧光(多次概述的(例如,“闪耀”)星形)。聚合酶的核酸外切酶对双链体区域的降解被阻断剂(核酸外切酶抗性)部分(小暗色圆形)在限定位置处阻断,留下限定末端。双链体区域的降解暴露适配子序列(阴影区域),并且聚合酶继续合成至模板的末端,其由阻断剂(例如,核酸酶抗性)部分限定(步骤5)。所得扩增子包含靶序列(黑色实心区段)和适配子序列(具有阴影的黑色实心区域)。
图4显示使用软件(UNAfold, Rensselaer Polytechnic Institute)将发夹引物结构建模的结果。针对引物F_egfr_trP1 (图4A)、R_egfr_b1_A (图4B)、F_Chr1_trP1 (图4C)和R_Chr1_b1_A (图4D)提供在70℃、62℃和55℃下发夹形成的预测结构和自由能。
图5显示在EGFR(图5A)和染色体1(图5B)靶标的双重扩增中使用引物F_egfr_trP1、R_egfr_b1_A、F_Chr1_trP1和R_Chr1_b1_A(参见表1)和探针(参见表3)的实时扩增反应的图。该图显示作为循环数的函数的任意单位(Rn)的乘积累积。
图6显示在EGFR和染色体1靶标的双重扩增中使用引物F_egfr_trP1、R_egfr_b1_A、F_Chr1_trP1和R_Chr1_b1_A(参见表1)的扩增反应的扩增产物的测量大小(图6A)和预测的扩增产物结构(图6B)。图6A是显示在约5至500个碱基对的大小范围内的扩增产物的实验测量相对量的图。图6B是显示在EGFR和染色体1靶标的双重扩增中使用引物F_egfr_trP1、R_egfr_b1_A、F_Chr1_trP1和R_Chr1_b1_A(参见表1)的扩增反应的示例性(例如,优势的)中间产物和/或终点产物的预测结构的示意图。荧光部分、猝灭剂部分和阻断剂(例如,核酸外切酶抗性)部分分别作为星形、五边形和圆形显示于图6B中。罗马数字用于标记扩增的各种预测产物。
图7显示在EGFR和染色体1靶标的双重扩增中使用引物F_egfr_trP1、R_egfr_b1_A、F_Chr1_trP1和R_Chr1_b1_A(参见表1)的扩增反应的用λ核酸外切酶和Klenow DNA聚合酶酶促处理后的扩增产物的测量大小(图7A)和用λ核酸外切酶和Klenow DNA聚合酶处理后扩增产物的预测结构(图7B)。图7A是显示用λ核酸外切酶和Klenow DNA聚合酶处理后在约5至300 bp的大小范围内的扩增产物的实验测量相对量的图。图7B是显示用λ核酸外切酶和Klenow DNA聚合酶处理后的示例性扩增产物的预测结构的示意图。阻断剂(例如,核酸外切酶抗性)部分作为圆形显示于图7B中。
图8是显示使用标准融合引物(“运行1”、“运行2”、“运行3”和“运行4”)、使用标准适配子连接至片段化文库(“运行5”)和使用如本文提供的发夹引物技术(“运行6”、“运行7”和“运行8”)产生的序列的映射效率的图。对于使用这些技术的8次测序运行,显示总读数(三角形和线形图)和可以映射(每个柱的黑色部分和每个柱上由下方数字表示的百分比)和未映射(每个柱的较浅(灰色)部分和每个柱上由上方数字表示的百分比)的总读数的百分比。
图9是显示用于制备扩增子文库和测序的方法的示例性实施方案的流程图。OS-引物是指“一步引物”,例如如本文提供的发夹引物。
图10是显示根据本文提供的技术的实施方案的测序的映射效率的图。柱1显示样品B1-356的运行1和运行2的映射和未映射读数,柱2显示样品B3-384的运行1和运行2的映射和未映射读数,柱3显示样品B1-356的运行1和运行2的映射和未映射读数,且柱4显示样品B3-384的运行1和运行2的映射和未映射读数。
图11是显示基于使用条形码(例如,条形码B1或条形码B3)将读数分配至样品的映射的EGFR测序读数(每对条的左侧黑色条)和染色体1测序读数(每对条的右侧对角线阴影条)的图。将来自EGFR或来自染色体1的特定序列读数进行计数并均一化以评价EGFR相比于充当对照的染色体1的拷贝数的相对拷贝数状态。图11还显示基于使用来自样品356的序列计数数据作为参照和样品384的均一化EGFR拷贝数的EGFR和染色体1的相对拷贝数。
图12显示包含PEG接头的本技术的实施方案。图12A显示具有类似结构、但具有PEG环(下方寡核苷酸“OS-s-引物(PEG环)”)和具有常规核苷酸和硫代磷酸酯键(“*”)(上方寡核苷酸“OS引物(DNA环)”)的发夹寡核苷酸的实施方案的结构。图12B显示包含n个重复单元的PEG接头的结构,其中n等于1至40,例如n等于1、2、3、4、5、6、7、8、9、10、11、12、13、14、1516、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40。
图13是显示使用图12中描述的发夹寡核苷酸的扩增反应的以皮克计的扩增子量的图。左侧柱显示使用具有常规核苷酸和硫代磷酸酯键(“*”)的发夹寡核苷酸(“OS-引物”)的扩增反应的扩增子量。右侧柱显示使用具有PEG环的发夹寡核苷酸(“OS-s-引物”)的扩增反应的扩增子量。
应理解的是,图不一定按比例绘制,图中的物体也不一定彼此成比例绘制。图为意在带来对本文公开的装置、***和方法的各个实施方案的清楚和理解的描绘。只要有可能,相同的参考数字将在整个附图中用于指相同或相似的部分。此外,应理解的是附图不意在以任何方式限制本教导的范围。
详述
本文提供了涉及核酸的操作和表征的技术,并且特别地、但非排他地,涉及用于扩增、定量和测序核酸的寡核苷酸引物和探针的方法和组合物。
在各个实施方案的该详述中,本文所用的节段标题仅用于组织的目的,而不应理解为以任何方式限制描述的主题。为了解释目的,描述了很多具体的细节以提供对所公开实施方案的透彻理解。本领域技术人员会理解,本文描述的各个实施方案可用或不用这些具体细节来实践。在其它情况下,结构和装置以框图形式显示。此外,本领域技术人员可容易地理解,呈现和实施方法的具体顺序为说明性的并且考虑顺序可进行改变,但仍在本文所公开的各个实施方案的精神和范围内。
对于任何目的,本申请中引用的所有文献和相似材料,包括但不限于,专利、专利申请、文章、书籍、论文和因特网网页通过引用以其整体清楚地通过引用并入。除非另有定义,本文使用的所有技术和科学术语具有与本文所述的各个实施方案所属领域的普通技术人员通常理解的相同的含义。当并入参考文献中的术语的定义似乎与本教导中提供的定义不同时,应以本教导中提供的定义为准。
定义
为了便于理解本术语,下面定义许多术语和短语。额外定义记载于整个详述中。
在整个说明书和权利要求中,下列术语采用本文明确相关的含义,除非上下文另有清楚指示。如本文所用的短语“在一个实施方案中”不一定指相同的实施方案,尽管其可能指相同的实施方案。此外,如本文所用的短语“在另一个实施方案中”不一定指不同的实施方案,尽管其可能指不同的实施方案。因此,如下文所描述,可容易地组合本发明的各个实施方案,而不脱离本发明的范围或精神。
另外,如本文所用,术语“或”是包括性的“或”操作符并且与术语“和/或”等同,除非上下文另有清楚指示。术语“基于”不是排他的并且允许基于额外的未描述的因素,除非上下文另有清楚指示。另外,在整个说明书中,“一个”、“一种”和“该”的含义包括复数对象。“在…中”的含义包括“在..中”和“在…上”。
如本文所用,“核酸”应意指任何核酸分子,包括,但不限于,DNA、RNA及其杂合体。形成核酸分子的核酸碱基可为碱基A、C、G、T和U,以及其衍生物。这些碱基的衍生物是本领域众所周知的。该术语应理解为包括,作为等价物,由核苷类似物制成的DNA或RNA的类似物。如本文所用的该术语还包括互补的cDNA,其为例如通过逆转录酶的作用从RNA模板产生的拷贝DNA。
如本文所用,“核酸测序数据”、“核酸测序信息”、“核酸序列”、“基因组序列”、“基因序列”、“片段序列”或“核酸测序读数”表示任何指示DNA或RNA分子(例如,全基因组、全转录子组、外显子组、寡核苷酸、多核苷酸、片段,等)中的核苷酸碱基(例如,腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶/尿嘧啶)的顺序的信息或数据。
应理解本教导考虑使用所有可用的技术、平台或技术种类获得的序列信息,所述技术包括,但不限于:毛细管电泳、微阵列、基于连接的***、基于聚合酶的***、基于杂交的***、直接或间接核苷酸鉴定***、焦磷酸测序、基于离子或pH的检测***、基于电子签名的***,等。
对碱基、核苷酸或另一种分子的提及可为单数或复数。即,“一个碱基”可指,例如,溶液中的该碱基的单个分子或多个该碱基。
“多核苷酸”、“核酸”或“寡核苷酸”是指通过核苷间键接合的核苷(包括脱氧核糖核苷、核糖核苷或其类似物)的线性聚合物。通常,多核苷酸包含至少三个核苷。通常,寡核苷酸大小范围从几个单体单元,例如3-4,至几百个单体单元。每当多核苷酸诸如寡核苷酸用字母序列、诸如“ATGCCTG”表示时,应理解的是,核苷酸为从左至右5'-3'的顺序并且“A”或“a”是指脱氧腺苷,“C”或“c”是指脱氧胞苷,“G”或“g”是指脱氧鸟苷且“T”是指胸腺嘧啶,除非另外注明。字母A、C、G和T可用于指碱基本身、核苷或包含碱基的核苷酸,如本领域中的标准。
在一些实施方案中,核酸包含通用或修饰的碱基,诸如脱氧肌苷、肌苷、7-脱氮-2'-脱氧肌苷、2-氮杂-2'-脱氧肌苷、2'-O-Me肌苷、2'-F肌苷、脱氧3-硝基吡咯、3-硝基吡咯、2'-O-Me 3-硝基吡咯、2'-F 3-硝基吡咯、1-(2′-脱氧-β-D-呋喃核糖基)-3-硝基吡咯、脱氧5-硝基吲哚、5-硝基吲哚、2'-O-Me 5-硝基吲哚、2'-F 5-硝基吲哚、脱氧4-硝基苯并咪唑、4-硝基苯并咪唑、脱氧4-氨基苯并咪唑、4-氨基苯并咪唑、脱氧水粉蕈素、2'-F水粉蕈素、2′-F 4-硝基苯并咪唑、PNA-5-内吲哚、PNA-水粉蕈素、PNA-肌苷、PNA-4-硝基苯并咪唑、PNA-3-硝基吡咯、吗啉代-5-硝基吲哚、吗啉代-水粉蕈素、吗啉代-肌苷、吗啉代-4-硝基苯并咪唑、吗啉代-3-硝基吡咯、氨基磷酸酯-5-硝基吲哚、氨基磷酸酯-水粉蕈素、氨基磷酸酯-肌苷、氨基磷酸酯-4-硝基苯并咪唑、氨基磷酸酯-3-硝基吡咯、2'-O-甲氧基乙基肌苷、2′-O-甲氧基乙基水粉蕈素、2'-O-甲氧基乙基5-硝基吲哚、2'-O-甲氧基乙基4-硝基苯并咪唑、2'-O-甲氧基乙基3-硝基吡咯及其组合。
如本文所用,术语“靶核酸”或“靶核苷酸序列”是指其操作以任何理由被本领域普通技术人员认为是期望的任何核苷酸序列(例如,RNA或DNA)。在一些实施方案中,“靶核酸”是指其核苷酸序列待测定或期望被测定的核苷酸序列。在一些实施方案中,术语“靶核苷酸序列”是指产生与其部分或完全互补的引物或探针的序列。
如本文所用,“目标区域”是指(例如,使用本文所述的组合物、***或方法之一)分析的核酸。在一些实施方案中,目标区域是基因组的或基因组DNA区域的一部分(例如,包含一个或多个染色体或一个或多个基因)。在一些实施方案中,分析从目标区域表达的mRNA。
如本文所用,术语“对应于”或“对应”针对连续核酸或核苷酸序列(例如,子序列)使用,所述连续核酸或核苷酸序列与全部或部分靶核酸序列互补并且因此与其“对应”。
如本文所用,“互补物”通常是指双螺旋以形成规范的Watson-Crick碱基对的特定核苷酸,如本领域技术人员所理解。然而,互补物还包括能够与A、T、G或C核苷酸通用碱基配对的核苷酸类似物的碱基配对和增强双链体的热稳定性的锁定核酸。本领域技术人员将认识到杂交严格性为杂交所形成的双链体中匹配或错配程度的决定因素。
如本文所用,“部分”是指可以将某物分成的两个或更多个部分之一,诸如,例如寡核苷酸、分子、化学基团、结构域、探针等的各个部分。
如本文所用,术语“文库”是指多个核酸,例如,多个不同核酸。在一些实施方案中,“文库”是“文库组”或“扩增子文库组”。如本文所用,“扩增子文库组”是与以下相关的扩增子的集合:例如,疾病(例如,多基因病)、疾病进展、发育缺陷、体质病(例如,具有取决于遗传因素的病因的状态,例如,可遗传的(非肿瘤)异常或疾病)、代谢通路、药物基因组学特征、性状、生物体(例如,用于物种鉴别)、生物体的组、地理位置、器官、组织、样品、环境(例如,用于宏基因组学和/或核糖体RNA(例如核糖体小亚基(SSU)、核糖体大亚基(LSU)、5S、16S、18S、23S、28S、内转录序列(ITS)rRNA)的研究)、基因、染色体等。例如,癌症扩增子组可含有与癌症相关的包含数百、数千或更多个基因座、区域、基因、单核苷酸多态性、等位基因、标记物等的扩增子的集合。在一些实施方案中,扩增子文库组提供了高度多重化的且靶向的重测序,例如,以检测与疾病相关的突变。在一些实施方案中,“文库”包含多个“文库片段”(例如,集合);“文库片段”是核酸。在一些实施方案中,文库片段通过将较大核酸片段化来产生,例如,通过物理(例如,剪切)、酶促(例如,通过核酸酶)和/或化学处理。在一些实施方案中,文库片段通过扩增(例如,PCR)产生,并因此是对应于和/或衍生自核酸(例如,待测序的核酸)的扩增子。
例如,癌症组的实施方案包含已经建立与特定癌症表型的相关性的特定基因或基因中的突变(例如,ABL1、AKT1、AKT2、ATM、PDGFRA、EGFR、FGFR (例如,FGFR1、FGFR2、FGFR3)、BRAF (例如,包含V600处的突变,例如,V600E突变)、RUNX1、TET2、CBL、EGFR、FLT3、JAK2、JAK3、KIT、RAS (例如,KRAS (例如,包含G12、G13或A146处的突变,例如,G12A、G12S、G12C、G12D、G13D或A146T突变)、HRAS (例如,包含G12处的突变,例如,G12V突变)、NRAS (例如,包含Q61处的突变,例如,Q61R或Q61K突变))、MET、PIK3CA (例如,包含H1047处的突变,例如,H1047L、H1047L或H1047R突变)、PTEN、TP53 (例如,包含R248、Y126、G245或A159处的突变,例如,R248W、G245S或A159D突变)、VEGFA、BRCA、RET、PTPN11、HNHF1A、RB1、CDH1、ERBB2、ERBB4、SMAD4、SKT11 (例如,包含Q37处的突变)、ALK、IDH1、IDH2、SRC、GNAS、SMARCB1、VHL、MLH1、CTNNB1、KDR、FBXW7、APC、CSF1R、NPM1、MPL、SMO、CDKN2A、NOTCH1、CDK4、CEBPA、CREBBP、DNMT3A、FES、FOXL2、GATA1、GNA11、GNAQ、HIF1A、IKBKB、MEN1、NF2、PAX5、PIK3R1、PTCH1、STK11等中的一种或多种)。一些扩增子组涉及特定“癌症热点”,即,含有与癌症进展和治疗抗性相关的已知突变的基因组区域。
在一些实施方案中,单个基因的扩增子组包括基因外显子(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个外显子)的扩增子。在一些实施方案中,用于物种(或菌株、亚种、类型、亚型、属或其它分类水平和/或基于***发生间距的量度的操作分类单位(OTU))鉴定的扩增子组可以包括对应于一系列基因或基因座的扩增子,其共同提供一个或多个物种(或菌株、亚种、类型、亚型、属或其它分类水平)相对于其它物种(或菌株、亚种、类型、亚型、属或其它分类水平)(例如,对于细菌(例如,MRSA)、病毒(例如,HIV、HCV、HBV、呼吸道病毒等))的特定鉴定或用于确定药物抗性和/或敏感性(例如,对于细菌(例如,MRSA)、病毒(例如,HIV、HCV、HBV、呼吸道病毒等))。
所述组的扩增子通常包含100至1000个碱基对,例如,在一些实施方案中,所述组的扩增子包含约100、125、150、175、200、225、250、275、300、325、350、375、400、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975或1000个碱基对。在一些实施方案中,扩增子组包含跨越基因组的扩增子集合,例如以提供基因组序列。
所述扩增子组通常通过使用扩增寡核苷酸(例如,从样品产生扩增子组),和/或用于将疾病相关基因测序的寡核苷酸探针来产生,例如,以评估基因组中特定突变和/或等位基因的存在。在一些实施方案中,靶向10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、1000或更多个基因、基因座、区域等,以产生,例如10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、1000或更多个扩增子。在一些实施方案中,所述扩增子在高度多重、单管扩增反应中产生。在一些实施方案中,所述扩增子在单路扩增反应的集合(例如,10至100、100至1000或1000或更多个反应)中产生。在一些实施方案中,合并多个单路扩增反应。在一些实施方案中,平行进行单路扩增反应。
如本文所用,核苷酸序列的“子序列”是指该核苷酸序列内含有的任何核苷酸序列,包括具有单个碱基大小的任何子序列直至比核苷酸序列短一个碱基的子序列。
短语“测序运行”是指进行以测定与至少一个生物分子(例如,核酸分子)相关的一些信息的测序实验的任何步骤或部分。
如本文所用,短语“dNTP”意指脱氧核苷酸三磷酸,其中所述核苷酸包含核苷酸碱基,例如,A、T、C、G或U。
如本文所用的术语“单体”意指可通过给定聚合酶掺入正在生长的分子链内的任何化合物。此类单体包括,但不限于,天然存在的核苷酸(例如,ATP、GTP、TTP、UTP、CTP、dATP、dGTP、dTTP、dUTP、dCTP、合成的类似物)、各核苷酸的前体、非天然存在的核苷酸及其前体或可通过给定聚合酶掺入正在生长的聚合物链内的任何其它分子。
“聚合酶”是通常用于连接3′-OH 5′-三磷酸核苷酸、寡聚物及其类似物的酶。聚合酶包括,但不限于,DNA-依赖性DNA聚合酶、DNA-依赖性RNA聚合酶、RNA-依赖性DNA聚合酶、RNA-依赖性RNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、Klenow片段、水生嗜热链球菌(Thermophilus aquaticus)(Taq) DNA聚合酶、嗜热栖热菌(Thermus thermophilus)(Tth) DNA聚合酶、Vent DNA聚合酶(New England Biolabs)、Deep Vent DNA聚合酶(New England Biolabs)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)(Bst) DNA聚合酶、DNA聚合酶大片段、Stoeffel片段、9°N DNA聚合酶、9°Nm聚合酶、激烈热球菌(Pyrococcus furiosis)(Pfu)DNA聚合酶、丝状栖热菌(Thermus filiformis)(Tfl) DNA聚合酶、RepliPHI Phi29聚合酶、嗜热高温球菌(Thermococcus litoralis)(Tli) DNA聚合酶、真核DNA聚合酶β、端粒酶、Therminator 聚合酶(New England Biolabs)、KOD HiFi. DNA聚合酶(Novagen)、KOD1 DNA聚合酶、Q-β复制酶、末端转移酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、生物勘探和/或分子进化发现的新型聚合酶和美国专利申请公开号2007/0048748和美国专利号6,329,178;6,602,695;和6,395,524中引用的聚合酶。这些聚合酶包括野生型、突变体同种型和基因工程改造的变体诸如exo聚合酶、具有最小的、不可检测的和/或降低的3'→ 5' 校对核酸外切酶活性的聚合酶和其它突变体,例如耐受标记的核苷酸并将其掺入核酸链中的突变体。在一些实施方案中,聚合酶被设计为用于,例如,实时PCR、高保真PCR、下一代DNA测序、快速PCR、热启动PCR、粗样品PCR、稳健PCR和/或分子诊断中。此类酶可得自许多供应商,例如,Kapa Enzymes、Finnzymes、Promega、Invitrogen、LifeTechnologies、Thermo Scientific、Qiagen、Roche等。在一些实施方案中,所述聚合酶具有5'→3'核酸外切酶活性,并且因此除了催化从核酸的3'-OH(例如,从引物,例如,发夹引物)合成核酸之外,可以从5’末端降解核酸。在一些实施方案中,所述聚合酶(例如,高保真聚合酶)包含校对活性、3'核酸外切酶活性和/或链置换活性,但缺乏5'核酸外切酶活性。
术语“引物”是指当置于诱导与核酸链互补的引物延伸产物合成的条件下时(例如,在核苷酸和诱导剂诸如DNA聚合酶的存在下以及在合适的温度和pH下)能够充当合成起始点的寡核苷酸,无论是在纯化的限制酶消化产物中天然存在的还是合成产生的。为了在扩增中达到最大效率,所述引物优选为单链的,但可替代地为双链的。如果是双链,首先处理引物以分开其两条链,然后用于制备延伸产物。优选地,所述引物为寡脱氧核糖核苷酸。所述引物必须足够长以便在诱导剂存在下引发延伸产物合成。所述引物的确切长度将取决于多个因素,包括温度、引物来源和方法的使用。如本文所用,发夹引物的单链(例如,扩增子特异性)部分可用于引发核酸的合成。
如本文使用的术语“退火”或“引发”是指寡脱氧核苷酸或核酸与模板核酸的并置,由此所述并置使得聚合酶能够将核苷酸聚合成与模板核酸或其部分互补的核酸分子。如本文所用的术语“杂交”是指由互补单链核酸形成双链核酸。术语“退火”和“杂交”之间没有预期的区别,并且这些术语将可互换使用。引物序列可以包含一些错配,只要它们可以与模板杂交并充当引物。术语“基本上互补的”在本文中用于表示引物足够互补以在指定的退火条件或严格条件下与模板核酸序列选择性杂交,使得退火的引物可以通过聚合酶延伸以形成模板的互补拷贝。
如本文所用,“***”表示一套真实的或抽象的组分,包含其中每个组分与整体内的至少一种其它组分相互作用或相关的整体。各种核酸测序平台、核酸组装和/或核酸映射***(例如,计算机软件和/或硬件)描述于,例如,美国专利申请公开号2011/0270533,所述申请通过引用并入本文中。
如本文所用,术语“分离”意指所讨论的材料存在于这样的物理环境中,所述物理环境与所讨论的材料在自然中所存在的环境不同和/或已经完全或部分地从其它核酸分子分开、分离或纯化。
如本文所用,“索引”通常应当是指独特的或标识标记或特征,例如,用于标记DNA片段(例如,扩增子)和/或文库(例如,扩增子文库)和用于构建多重文库的虚拟或已知的核苷酸序列。文库包括但不限于基因组DNA文库、cDNA文库、扩增子文库和ChIP文库。可以将多个DNA(其中每一个分别用索引标记)合并在一起以形成用于同时进行测序的多重索引的文库,其中每个索引与相同构建体中的侧接DNA一起测序,因此充当用于由索引标记的DNA片段和/或文库的索引。在一些实施方案中,用长度上具有1、2、3、4、5、6、7、8、9、10或更多个核苷酸的特定核苷酸序列进行索引。索引的长度可以随着测序仪的最大测序长度一起增加。术语索引可与术语“条形码”和“条形码序列”互换。
如本文所用,“虚拟”通常应当意味着不是实际形式,但存在或导致效果。
如本文所用,“限制性酶识别位点”和“限制性酶结合位点”是可互换的。
术语“样品”以其最广泛的含义使用。在一种意义上其可指动物细胞或组织。在另一种意义上,其意味着包括从任何来源获得的样本或培养物,以及生物和环境样品。生物样品可从植物或动物(包括人类)获得并且涵盖液体、固体、组织和气体。环境样品包括环境材料诸如表面材料、土壤、水和工业样品。这些实例不解释为限制适用于本发明的样品类型。
如本文所用,“多重”是指使用多个扩增引物(例如,多个发夹寡核苷酸,例如,其中每个发夹寡核苷酸包含不同的标签或索引序列)以扩增相同的核酸合并物。如本文所用,“多重测序”是指合并多个扩增子(例如,来自多个受试者、样品等)和在单次测序运行中将合并物测序。
如本文所用,“去多重化”是指将核苷酸序列分配至受试者或样品,且“去多重化的”是指已经分配至受试者或样品的核苷酸序列。例如,在多重化测序中,每个扩增子包含对应于从中分离或衍生产生扩增子的核酸的受试者或样品的索引。将多个扩增子混合在一起并测序后,所述索引用于鉴定属于每个受试者或样品的核苷酸序列。
如本文所用,“n重”检测(例如,双重、三重、四重等)是这样的检测,其中在同一检测反应(例如,扩增反应,例如,聚合酶链式反应)中(例如,在一些实施方案中同时)检测到n个(例如,2、3、4个等)靶标。因此,如本文所用,“重化”检测、测定等是其中在一个反应中测定多种分析物、靶标等的检测、测定等。
描述
本技术通常涉及寡核苷酸和使用“发夹”或“茎 - 环”寡核苷酸以产生用于下一代测序的核酸文库的方法。
通常,本技术提供了包含通过分子内折叠形成的双链(例如,双链体)部分和单链部分的寡核苷酸。单链部分自由地与另一核酸(例如,靶模板)的互补序列杂交,其中寡核苷酸在扩增反应(例如,聚合酶链式反应)中充当引物以产生扩增子。所得扩增子包含对应于(例如,包含、衍生自和/或互补于)靶模板的第一部分和包含由发夹引物提供的序列的第二部分(例如,适配子,例如,包含标签的适配子)。寡核苷酸中的核苷酸之间的特定核苷酸或化学键的修饰(例如,诸如掺入核酸酶抗性部分(例如,硫代磷酸酯键和/或PEG接头))提供了在扩增子末端的适配子序列的大小和含量(例如,序列)的精确控制。此外,在一些实施方案中,所述发夹寡核苷酸包含荧光部分,和在一些实施方案中,猝灭部分,其通过荧光测量(例如,通过实时定量扩增反应(例如,PCR))监测和/或定量扩增子产生。
本技术为NGS提供了扩增子文库的有效的“一步/一管”产生和定量。具体而言,这些优点涉及具有以下独特组分组合的新引物设计:首先,在关键PCR温度范围期间,NGS平台依赖性适配子(例如,“通用”)序列被茎 - 环结构保持“隐藏”,因此尽可能降低或消除各种模板和引物之间的复杂杂交。结果,尽可能降低或消除了脱靶扩增子形成,其最终增加了PCR(例如,多重PCR)的效率,而具有最少副产物。第二,将“阻断剂”核酸酶抗性部分(例如,硫代磷酸酯键)置于引物内的关键位置,以控制通过聚合酶核酸酶活性的引物水解的程度,因此产生具有限定末端的产物。第三,连接在适当位置的荧光和猝灭部分提供扩增期间的扩增产物监测和定量。因此,本技术提供容易输入NGS***中的多扩增子文库的稳健单管产生,并且具有最少操作时间,容易整合至自动化流程中,以及显著减少总体流程时间和成本。
发夹寡核苷酸
在一些实施方案中,本技术提供了发夹(例如,“茎 - 环”)寡核苷酸(参见例如,图1)。在一些实施方案中,所述发夹寡核苷酸包含荧光和猝灭剂部分(参见例如,图1A和图1C)。在一些实施方案中,所述发夹寡核苷酸不包含荧光和猝灭剂部分(参见例如,图1B、图1D、图1E和图1F)。
例如,发夹寡核苷酸100的实施方案包含单链区域(例如,黑色区段101和102)、双链双链体区域(例如,与互补白色实心区段105杂交的白色阴影区段103)和单链环区域(例如,黑色阴影区段104)。另外,在一些实施方案中,所述寡核苷酸100包含几个区段,包括包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段)101,标签102,第一自身互补区域103,单链环区域104,第二自身互补区域105,阻断剂(例如,核酸酶抗性(例如,核酸外切酶抗性(例如,5'至3'核酸外切酶抗性)))部分106 ,猝灭剂部分107和荧光部分108(图1A)。
发夹寡核苷酸200的另一个实施方案包含单链区域(例如,黑色区段201和202)、双链双链体区域(例如,与互补白色实心区段205杂交的白色阴影区段203)和单链环区域(例如,黑色阴影区段204)。另外,在一些实施方案中,所述寡核苷酸200包含几个区段,包括包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段)201,标签202,第一自身互补区域203,单链环区域204,第二自身互补区域205和阻断剂(例如,核酸酶抗性(例如,核酸外切酶抗性(例如,5'至3'核酸外切酶抗性)))部分206(图1B)。
发夹寡核苷酸110的第三个实施方案包含单链区域(例如,黑色区段111)、双链双链体区域(例如,与互补白色实心区段115杂交的白色阴影区段113)和单链环区域(例如,黑色阴影区段114)。另外,在一些实施方案中,所述寡核苷酸110包含几个区段,包括包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段)111,第一自身互补区域113,单链环区域114,第二自身互补区域115,阻断剂(例如,核酸酶抗性(例如,核酸外切酶抗性(例如,5'至3'核酸外切酶抗性)))部分116,猝灭剂部分117和荧光部分118(图1C)。
发夹寡核苷酸210的第四个实施方案包含单链区域(例如,黑色区段211)、双链双链体区域(例如,与互补白色实心区段215杂交的白色阴影区段213)和单链环区域(例如,黑色阴影区段214)。另外,在一些实施方案中,所述寡核苷酸210包含几个区段,包括包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段)211,第一自身互补区域213,单链环区域214,第二自身互补区域215和阻断剂(例如,核酸酶抗性(例如,核酸外切酶抗性(例如,5'至3'核酸外切酶抗性)))部分206(图1B)。
发夹寡核苷酸220的第五个实施方案包含单链区域(例如,黑色区段221)、标签222、双链双链体区域(例如,与互补白色实心区段225杂交的白色阴影区段223)和PEG接头(例如,灰色区段224)。另外,在一些实施方案中,所述寡核苷酸220包含几个区段,包括包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段)221,第一自身互补区域223,PEG接头224和第二自身互补区域225(图1E)。
发夹寡核苷酸230的第六个实施方案包含单链区域(例如,黑色区段231)、双链双链体区域(例如,与互补白色实心区段235杂交的白色阴影区段233)和PEG接头(例如,灰色区段234)。另外,在一些实施方案中,所述寡核苷酸230包含几个区段,包括包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段)231,第一自身互补区域233,PEG接头234和第二自身互补区域235(图1F)。
尽管描述是指寡核苷酸(例如,100和200)的特定示例性实施方案以描述各种组分和区段的关系、功能、结构等,但本领域普通技术人员理解,涉及这些示例性实施方案的结构和功能的概念同样适用于其它实施方案。例如,本领域普通技术人员理解,在图1中表示为100的实施方案中的第一自身互补区域103和第二自身互补区域105的讨论也适用于其它实施方案中的第一自身互补区域和第二自身互补区域,并且因此本领域普通技术人员理解,各个实施方案中描述的各个区段和特征被认为是等同的。同样适用于单链区域;双链区域;包含、衍生自和/或互补于靶模板的部分(例如,扩增子特异性引发区段);标签;适配子;和本文所述的其它组分和区段。
因此,发夹寡核苷酸110(图1C)在结构和功能上与发夹寡核苷酸100(图1A)相似,尽管发夹寡核苷酸110缺少标签(例如,发夹寡核苷酸110是无标签的)。同样,发夹寡核苷酸210(图1D)在结构和功能上与发夹寡核苷酸200(图1B)相似,尽管发夹寡核苷酸210缺少标签(例如,发夹寡核苷酸210是无标签的)。发夹寡核苷酸220(图1E)在结构和功能上与发夹寡核苷酸200(图1B)相似,尽管发夹寡核苷酸220缺少阻断剂(发夹寡核苷酸220是无阻断剂的)并且具有PEG接头而不是单链环区段。发夹寡核苷酸230(图1F)在结构和功能上与发夹寡核苷酸220(图1E)相似,尽管发夹寡核苷酸230缺少标签(发夹寡核苷酸230是无标签的)。或者另外,发夹寡核苷酸230(图1F)在结构和功能上与发夹寡核苷酸210(图1E)相似,尽管发夹寡核苷酸230缺少阻断剂(发夹寡核苷酸230是无阻断剂的)并且具有PEG接头而不是单链环区段。
因此,在示例性实施方案中,所述发夹寡核苷酸含有包含、衍生自和/或互补于靶模板的第一部分101(例如,扩增子特异性引发区段);和包含使用者定义的适配子(例如,包含标签102(例如,包含接头、索引、捕获序列、限制性位点、引物结合位点、抗原和/或其它功能位点的标签)和/或包含通用序列(例如,包含平台依赖性序列)的适配子)的第二部分。
第一自身互补区域103和第二自身互补区域105具有足够互补的核苷酸序列,使得它们分子内杂交以形成双链区域(例如,在适当的热力学、动力学和/或溶液和反应条件下)。具体而言,在一些实施方案中,第一自身互补区域103和第二自身互补区域105是完全互补的;在一些实施方案中,第一自身互补区域103和第二自身互补区域105不是完全互补的。在适当的溶液条件下,当第一自身互补区域103和第二自身互补区域105完全互补时,或者另外,当第一自身互补区域103和第二自身互补区域105不是完全互补、但足够互补以杂交(例如,形成包含多个错配的双链体)时,将由第一自身互补区域103和第二自身互补区域105形成双链双链体。参见,例如,图2B和图4。
在一些实施方案中,发夹寡核苷酸100包含扩增子特异性区段101,其包含与待扩增的靶标互补和/或与侧接待扩增的靶标的区域互补的序列。扩增子特异性区段101包含这样的序列,其与靶标或侧接靶标的区域足够互补,使得寡核苷酸100与模板杂交以形成包含双链区域的引物 - 模板杂合体(例如,在适当的热力学、动力学和/或溶液和反应条件下)。参见图3。
在一些实施方案中,扩增子特异性区段101和靶标或侧接靶标的区域是完全互补的;在一些实施方案中,扩增子特异性区段101和靶标或侧接靶标的区域不是完全互补的。在适当的溶液条件下,当扩增子特异性区段101和靶标或侧接靶标的区域完全互补时,或者另外,当扩增子特异性区段101和靶标或侧接靶标的区域不完全互补、但足够互补以杂交(例如,形成包含多个错配的双链体)时,将由扩增子特异性区段101和靶标或侧接靶标的区域形成双链双链体。引物 - 模板杂合体提供被聚合酶识别且由其起始核酸合成(例如,从扩增子特异性序列的3'末端)的底物。以这种方式,扩增子特异性区段在扩增反应中充当引物。参见图3,例如,步骤1和2。
在一些实施方案中,发夹寡核苷酸100或200包含附接至由其中使用寡核苷酸100或200的扩增反应产生的扩增子的适配子序列(例如,NGS平台特异性适配子序列)。在一些实施方案中,适配子提供用于将扩增子文库整合至NGS***流程中的功能性(例如,通用序列)。在一些实施方案中,适配子还提供了用于操作、分离和/或表征作为集合的扩增子的功能性(例如,标签)。
由包含适配子的寡核苷酸产生的扩增子因此包含衍生自模板的部分(例如,其可具有未知序列)和由本技术的使用者定义的部分(例如,其可具有已知序列)。因此,在一些实施方案中,本技术产生扩增子,所述扩增子包含衍生自模板(例如,扩增子文库)的不同序列且包含由NGS平台识别的相同适配子序列(例如,包含通用序列)和/或用于操作、分离和/或表征(例如,鉴定(索引))扩增子的标签。例如,在一些实施方案中,适配子包含在多个不同适配子或不同适配子的子集之间共享的一个或多个通用序列和/或一个或多个标签。也就是说,无论任一个扩增子的扩增的靶标衍生的序列的独特性,适配子提供了用于操作、分离和/或表征(例如,鉴定(例如,通过一个或多个索引))扩增子(例如,不必知道靶标衍生部分的序列)的一种或多种共同的功能。
因此,在一些实施方案中,发夹寡核苷酸100或200含有包含附接至由其中使用寡核苷酸100或200的扩增反应产生的扩增子的“通用”序列(例如,NGS平台特异性序列)的适配子(例如,在一些实施方案中,适配子包含通用序列)。
在一些实施方案中,发夹寡核苷酸100或200包含“标签”(例如,在一些实施方案中,适配子包含标签)。通常,标签序列不衍生自或互补于待扩增的靶标(或不衍生自或互补于侧接待扩增的靶标的区域)。标签序列通常由本技术的使用者定义以向由扩增反应产生的扩增子添加功能特征。
例如,在一些实施方案中,标签包含附接至由其中使用寡核苷酸的扩增反应产生的扩增子的限制性酶识别序列。附接至由其中使用寡核苷酸的扩增反应产生的扩增子的标签组分(例如,序列)的其它实例包括接头、索引、捕获序列、引物结合位点、抗原、多聚A尾、表位、用于分离和/或纯化扩增子的由捕获探针(例如,与固体支持物连接的捕获探针)识别的序列等。也就是说,在一些实施方案中,标签包含接头、索引、捕获序列、引物结合位点、抗原、多聚A尾、表位、由捕获探针(例如,与固体支持物连接的捕获探针)识别的序列等。
在一些实施方案中,标签包含索引(例如,条形码核苷酸序列)。
因此,标签(和因此,适配子)可以含有多种序列元件中的一种或多种,包括但不限于一个或多个扩增引物退火序列或其互补序列、一个或多个测序引物退火序列或其互补序列、一个或多个索引序列、一个或多个限制性酶识别位点、与一个或多个靶多核苷酸突出端互补的一个或多个突出端、一个或多个探针结合位点(例如,用于附接至测序平台,诸如用于诸如由Illumina, Inc.开发的大规模平行测序的流动室)及其组合。两个或更多个序列元件可以与彼此不相邻(例如,由一个或多个核苷酸分开),与彼此相邻,部分重叠或完全重叠。例如,扩增引物退火序列也可以充当测序引物退火序列。序列元件可以位于3'末端处或附近,5'末端处或附近,或标签或适配子的内部。
在一些实施方案中,具有不同索引序列的多个标签序列中的第一标签序列包含多个中的所有第一标签序列中共同的序列元件。在一些实施方案中,第二标签序列包含在所有第二标签序列中共同的序列元件,其不同于由第一标签序列共享的共同序列元件。序列元件的差异可以是任何这样的差异,其使得不同标签序列的至少一部分不完全对齐,例如,这是由于序列长度的变化,一个或多个核苷酸的缺失或***,或在一个或多个核苷酸位置的核苷酸组成的变化(诸如碱基变化或碱基修饰)。
在一些实施方案中,标签包含分子结合位点识别元件以促进鉴定和/或分离靶核酸(例如一个或多个扩增子)用于下游应用。作为亲和力机制的分子结合允许两个分子之间的相互作用以产生稳定的缔合复合物。可以参与分子结合反应的分子包括蛋白、核酸、碳水化合物、脂质和小有机分子,诸如配体、肽或药物。
当核酸分子结合位点用作标签片段的一部分时,其可用于采用选择性杂交来分离靶序列(例如,一个或多个扩增子)。选择性杂交可以限制与含有具有分子结合位点的标签序列的靶核酸的实质性杂交和捕获与分子结合位点足够互补的核酸。因此,通过“选择性杂交”,技术人员可以检测含有许多核酸合并物的样品中靶多核苷酸的存在。选择性杂交分离***的实例包括具有一个或多个捕获寡核苷酸(例如“捕获探针”)的***,所述捕获寡核苷酸包含与分子结合识别元件互补的序列,并且任选地固定化至固体支持物。在其它实施方案中,捕获寡核苷酸与靶序列本身或包含在标签内的索引或其它独特序列互补。捕获寡核苷酸可以固定化至各种固体支持物,诸如板的孔内,单分散的球体或珠粒(例如,磁性(例如,顺磁性)珠粒),微阵列或本领域已知的任何其它合适的支持物表面。
可以通过洗去不期望的非结合核酸、留下期望的靶核酸来分离附接在固体支持物上的杂交核酸。如果将互补的捕获寡核苷酸分子固定至顺磁球或类似的珠粒技术用于分离,则可以将球体与包含标签序列的靶核酸一起在管中混合。当标签序列已经与固定至球体的互补序列杂交时,可以洗去不期望的分子,同时用磁体或类似试剂将球体保持在管中。随后可以通过升高温度、改变pH或通过使用本领域已知的任何其它合适的洗脱方法来释放期望的靶核酸。
在图1A中所示的示例性实施方案中,发夹寡核苷酸100包含区段103和/或区段104中的适配子序列。在图1B中所示的示例性实施方案中,发夹寡核苷酸200包含区段203和/或区段204中的适配子序列。在一些实施方案中,适配子还可以包括标签区域102或202。
在一些实施方案中,发夹寡核苷酸100或200的茎 - 环结构封闭适配子的通用序列进行分子间杂交。例如,在一些实施方案中,发夹寡核苷酸100或200的茎 - 环结构在反应中封闭通用序列与游离(例如,未掺入的)发夹寡核苷酸的分子间杂交和/或封闭通用序列与包含通用序列的扩增产物的分子杂交。
在图1A中描述为发夹寡核苷酸100的实施方案中,将荧光部分108和猝灭剂部分107选择并置于寡核苷酸中,使得当发夹寡核苷酸包含荧光部分108和猝灭剂部分107时,猝灭剂部分猝灭荧光部分108的荧光。在一些实施方案中,荧光部分108和猝灭剂部分107与寡核苷酸的核苷酸连接(例如,附接、连接、接合等)。
在另一个实施方案中,本技术提供了不包含荧光和猝灭剂部分的发夹(例如“茎 -环”)寡核苷酸(参见例如,图1B)。发夹寡核苷酸200包含单链区域(例如,黑色区段201和202)、双链双链体区域(例如,与互补白色实心区段205杂交的白色阴影区段203)和单链环区域(例如,黑色阴影区段204)。另外,在一些实施方案中,寡核苷酸200包含几个区段,包括包含、衍生自和/或互补于靶模板的第一部分(例如,扩增子特异性引发区段)201,标签202,第一自身互补区域203,单链环区域204,第二自身互补区域205和阻断剂(例如,核酸酶抗性(例如,核酸外切酶抗性(例如,5'至3'核酸外切酶抗性)))部分206。
因此,在一些实施方案中,发夹寡核苷酸200含有包含、衍生自和/或互补于靶模板的第一部分201(例如,扩增子特异性引发区段);和包含使用者定义的适配子(例如,包含标签202(例如,包含接头、索引、捕获序列、限制性位点、引物结合位点、抗原和/或其它功能位点的标签)和/或包含通用序列(例如,包含平台依赖性序列)的适配子)的第二部分。
第一自身互补区域203和第二自身互补区域205具有足够互补的核苷酸序列,使得它们分子内杂交以形成双链区域(例如,在适当的热力学、动力学和/或反应条件下)。具体而言,在一些实施方案中,第一自身互补区域203和第二自身互补区域205是完全互补的;在一些实施方案中,第一自身互补区域203和第二自身互补区域205不是完全互补的。在适当的溶液条件下,当第一自身互补区域203和第二自身互补区域205完全互补时,或者另外,当第一自身互补区域203和第二自身互补区域205不是完全互补、但足够互补以杂交(例如,形成包含多个错配的双链体)时,将由第一自身互补区域203和第二自身互补区域205形成双链双链体。
发夹寡核苷酸被设计为响应于热力学变量(例如,温度、压力、体积)、动力学参数(例如,结合(例如,结合和解离)速率)和溶液条件(例如,盐浓度、水活性、pH、其它溶液组分等)呈现几种状态。参见,例如,图2和图4。在一些条件下(例如,在标准PCR反应混合物中的变性或解链温度下,例如,在约94℃至95℃或更高温度下),发夹寡核苷酸呈现线性构象(参见例如,图2A)。在该构象中,第一自身互补区域103和第二自身互补区域105不杂交,且寡核苷酸不含有包含第一自身互补区域103和第二自身互补区域105的双链双链体。
在不同条件下,例如在较低温度下(例如,在PCR延伸温度下,例如在为约68℃至70℃至75℃的温度下),分子内动力学速率因子和热力学稳定性有利于形成发夹结构(参见例如,图2B)。在该发夹构象中,第一自身互补区域103和第二自身互补区域105杂交以形成包含第一自身互补区域103和第二自身互补区域105的双链双链体。适配子的通用序列“隐藏”而不与反应混合物中的互补序列杂交。扩增子特异性区段101和标签102(如果存在)是单链的。
然后,在其它不同条件下,例如在仍更低的温度下(例如,在作为PCR引物结合温度的温度下,例如在约55℃至65℃下),动力学速率因子和热力学稳定性有利于扩增子特异性区段101与其在模板300上的互补靶序列的杂交。在该构象中,寡核苷酸包含双链双链体结构,其包含第一自身互补区域103和第二自身互补区域105,并且扩增子特异性区段101提供了3'末端(例如,3'OH),聚合酶由该3'末端合成与模板核酸300互补的链。
图1B中描绘为发夹寡核苷酸200的发夹寡核苷酸与发夹寡核苷酸100类似地设计,以响应于热力学和动力学参数(诸如温度、溶液组分和结合速率)而呈现这些状态(参见例如,图2)。因此,发夹寡核苷酸200的201、202、203、204和205区段的相互作用和特征以与发夹寡核苷酸100的101、102、103、104和105区段类似的方式表现。图1C至1F中所示的发夹寡核苷酸的实施方案包括类似的特征,并且设计成与图1A和图1B中所示的实施方案100和200类似地表现。
设计寡核苷酸,使得随着温度降低,分子内杂交事件(例如,双链双链体的形成;参见图2B)在分子间杂交事件(例如,寡核苷酸的单链部分与其互补序列杂交以形成引物 -模板杂合体;参见图2C)之前发生。例如,在一些实施方案中,设计发夹的茎部分(例如,双链体区域)以便当与其组分杂交时具有比单链部分更高的解链温度(Tm)。影响分子内Tm(对于双链体结构)和分子间Tm(对于与其靶标杂交的扩增子特异性片段)的设计参数包括例如:双链体区域的长度;引物 - 模板杂合体的长度(当GC含量相似时,通常较长的序列具有较高的Tm);双链体区域内的碱基对数目和/或错配数目;引物 - 模板杂合体内的碱基对数目和/或错配数目;和/或掺入形成双链体和/或引物 - 模板杂合体的部分内的寡核苷酸的修饰(例如,在核苷酸、碱基或核苷酸之间的键中)的数目。
这些设计参数提供了对寡核苷酸行为的控制,例如提供在典型的PCR温度概况期间首先形成发夹双链体并随后形成引物 - 模板杂合体的寡核苷酸(参见例如,图2A、2B和2C) 。
荧光部分
在一些实施方案中,所述发夹引物包含荧光部分(例如,荧光染料,也称为“荧光团”或“荧光团(fluor)”)。各种各样荧光部分是本领域已知的,并且已知在将核苷酸掺入寡核苷酸中之前将荧光部分与核苷酸连接以及在合成寡核苷酸之后向寡核苷酸添加荧光部分的方法。
可用作荧光部分的化合物的实例包括但不限于呫吨、蒽、花菁、卟啉和香豆素染料。可用于所述技术的呫吨染料的实例包括但不限于荧光素、6-羧基荧光素(6-FAM)、5-羧基荧光素(5-FAM)、5-或6-羧基-4,7,2',7'-四氯荧光素(TET)、5-或6-羧基-4',5',2',4',5',7'-六氯荧光素(HEX)、5'或6'-羧基-4',5'-二氯-2,'7'-二甲氧基荧光素(JOE)、5-羧基-2',4',5',7'-四氯荧光素(ZOE)、对甲氨基酚(rhodol)、罗丹明、四甲基罗丹明(TAMRA)、4,7-二氯四甲基罗丹明(DTAMRA)、罗丹明X (ROX)和德克萨斯红。可用于本发明的花菁染料的实例包括但不限于Cy 3、Cy 3.5、Cy 5、Cy 5.5、Cy 7和Cy 7.5。可用于本技术的其它荧光部分和/或染料包括但不限于能量转移染料、复合染料和其它产生荧光信号的芳香族化合物。在一些实施方案中,荧光部分包含量子点。
因此,根据所述技术,可用的示例性的荧光团和染料包括,但不限于,荧光染料和/或猝灭荧光染料的荧光的分子。荧光染料包括,但不限于,d-罗丹明受体染料(包括Cy5、二氯[R110]、二氯[R6G]、二氯[TAMRA]、二氯[ROX]等)、荧光素供体染料(包括荧光素、6-FAM、5-FAM等);吖啶(包括吖啶橙、吖啶黄、原黄素、pH 7等);芳香烃(包括2-甲基苯并噁唑、对二甲氨基苯甲酸乙酯、苯酚、吡咯、苯、甲苯等);芳基次甲基染料(包括金胺O、结晶紫、结晶紫-甘油、孔雀石绿等);香豆素染料(包括7-甲氧基香豆素-4-乙酸、香豆素1、香豆素30、香豆素314、香豆素343、香豆素6等);花菁染料(包括1,1'-二乙基-2,2'-花菁碘化物、隐花菁、吲哚羰花菁(C3)染料、吲哚二羰花菁(C5)染料、吲哚三羰花菁(C7)染料、氧羰花菁(C3)染料、氧二羰花菁(C5)染料、氧三羰花菁(C7)染料、碘化频那氰醇、全染色剂、硫羰花菁(C3)染料-乙醇、硫羰花菁(C3)染料-正丙醇、硫二羰花菁(C5)染料、硫三羰花菁(C7)染料等);二吡咯甲烯(Dipyrrin)染料(包括N,N'-二氟硼基-1,9-二甲基-5-(4-碘苯基)-二吡咯甲烯、N,N'-二氟硼基-1,9-二甲基-5-[(4-(2-三甲基硅烷基乙炔基)、N,N'-二氟硼基-1,9-二甲基-5-苯基二吡咯甲烯等);部花菁(包括4-(二氰亚甲基)-2-甲基-6-(对二甲氨基苯乙烯基)-4H-吡喃(DCM)-乙腈、4-(二氰亚甲基)-2-甲基-6-(对二甲氨基苯乙烯基)-4H-吡喃(DCM)-甲醇、4-二甲氨基-4'-硝基芪、部花菁540等);杂染料(包括4',6-二脒基-2-苯基吲哚(DAPI)-二甲基亚砜、7-苄氨基-4-硝基苯并-2-氧杂-1,3-二唑、丹磺酰甘氨酸、丹磺酰甘氨酸-二氧六环、Hoechst 33258-DMF、Hoechst 33258、荧光黄CH、吡罗昔康、硫酸奎宁、硫酸奎宁、方酸箐染料III等);寡苯撑类(包括2,5-二苯基噁唑(PPO)、联苯、POPOP、对四联苯、对三联苯等);噁嗪类(包括甲酚紫高氯酸盐、尼罗蓝-甲醇、尼罗红-乙醇、噁嗪1、噁嗪170等);多环芳香烃(包括9,10-双(苯乙炔基)蒽、9,10-二苯基蒽、蒽、萘、二萘嵌苯、芘等);多烯/聚炔类(包括1,2-二苯基乙炔、1,4-二苯基丁二烯、1,4-二苯基丁二炔、1,6-二苯基己三烯、β-胡萝卜素、茋类等);氧化还原活性的发色团类(包括蒽醌、偶氮苯、苯醌、二茂铁、核黄素、三(2,2'-联吡啶)钌络合物(II)、四吡咯、胆红素、叶绿素a-***、叶绿素a-甲醇、叶绿素b、二质子化-四苯基卟啉、血色素、八乙基卟啉镁、八乙基卟啉镁(MgOEP)、酞菁镁(MgPc)-PrOH、酞菁镁(MgPc)-吡啶、四-三甲苯基卟啉镁(MgTMP)、四苯基卟啉镁(MgTPP)、八乙基卟啉、酞菁(Pc)、卟吩、ROX、TAMRA、四叔丁基氮杂卟吩、四叔丁基萘酞菁、四(2,6-二氯苯基)卟啉、四(邻氨基苯基)卟啉、四-三甲苯基卟啉(TMP)、四苯基卟啉(TPP)、维生素B12、八乙基卟啉锌(ZnOEP)、酞菁锌(ZnPc)-吡啶、四-三甲苯基卟啉锌(ZnTMP)、四-三甲苯基卟啉锌自由基阳离子、四苯基卟啉锌(ZnTPP)等);呫吨类(包括曙红Y、荧光素-碱性乙醇、荧光素-乙醇、罗丹明123、罗丹明6G、罗丹明B、孟加拉玫瑰红、磺酰罗丹明101等)或其混合物或组合或其合成衍生物。
已知几类适于本技术的具体实施方案的荧光染料和特定化合物:呫吨衍生物(诸如荧光素、罗丹明、俄勒冈绿、伊红和德克萨斯红);花菁衍生物(诸如花菁、吲哚菁、含氧碳菁(oxacarbocyanine)、硫杂三羰花菁(thiacarbocyanine)和部花菁);萘衍生物(丹磺酰和普罗丹衍生物);香豆素衍生物;噁二唑衍生物(诸如吡啶基噁唑、硝基苯噁二唑和苯并噁二唑);芘衍生物(诸如级联蓝);噁嗪衍生物(诸如尼罗红、尼罗蓝、甲酚紫和噁嗪170);吖啶衍生物(诸如原黄素、吖啶橙和吖啶黄);芳基亚甲基衍生物(诸如金胺、结晶紫和孔雀绿);和四吡咯衍生物(诸如卟吩、酞菁和胆红素)。在一些实施方案中,所述荧光部分染料是呫吨、荧光素、罗丹明、BODIPY、花菁、香豆素、芘、酞菁、藻胆蛋白、ALEXA FLUOR® 350, ALEXAFLUOR® 405、ALEXA FLUOR® 430、ALEXA FLUOR® 488、ALEXA FLUOR® 514、ALEXA FLUOR® 532、ALEXA FLUOR® 546、ALEXA FLUOR® 555、ALEXA FLUOR® 568、ALEXA FLUOR®568、ALEXA FLUOR® 594、ALEXA FLUOR® 610、ALEXA FLUOR® 633、ALEXA FLUOR® 647、ALEXA FLUOR® 660、ALEXA FLUOR® 680、ALEXA FLUOR® 700、ALEXA FLUOR® 750或方酸菁染料。在一些实施方案中,所述标记物是如例如Haugland (2005年9月) MOLECULARPROBES HANDBOOK OF FLUORESCENT PROBES AND RESEARCH CHEMICALS(第10版)(其以其整体通过引用并入本文)中所述的荧光可检测的部分。
在一些实施方案中,所述标记物(例如,荧光可检测标记物)是可得自ATTO-TECGmbH (Am Eichenhang 50, 57076 Siegen, Germany)的标记物,例如,如美国专利申请公开号20110223677、20110190486、20110172420、20060179585和20030003486;和美国专利号7,935,822(其中所有都通过引用并入本文)中所述的标记物。
本领域普通技术人员将认识到同样可以使用具有这些范围之外的发射最大值的染料。在一些情况下,范围在500nm至700nm之间的染料具有在可见光谱中的优点并且可以使用现有的光电倍增管来检测。在一些实施方案中,宽范围的可用染料允许选择具有散布在检测范围上的发射波长的染料组。能够区分许多染料的检测***是本领域已知的。
猝灭剂部分
在一些实施方案中,所述发夹引物包含猝灭剂部分。各种各样的猝灭剂部分是本领域已知的。例如,在一些实施方案中,寡核苷酸包含猝灭剂,所述猝灭剂为黑洞猝灭剂(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Dabcyl、爱荷华黑猝灭剂(例如,爱荷华黑FQ、爱荷华黑RQ)、Eclipse猝灭剂。
在一些实施方案中,BHQ-1与具有约500-600 nm的发射波长的荧光部分一起使用。在一些实施方案中,BHQ-2与具有约550-675 nm的发射波长的荧光部分一起使用。在一些实施方案中,FRET对为提供猝灭的荧光团-猝灭剂对。
一些示例性的荧光团-猝灭剂对包括FAM和BHQ-1、TET和BHQ-1、JOE和BHQ-1、HEX和BHQ-1、Cy3和BHQ-2、TAMRA和BHQ-2、ROX和BHQ-2、Cy5和BHQ-3、Cy5.5和BHQ-3、FAM和BHQ-1、TET和BHQ-1、JOE和3'-BHQ-1、HEX和BHQ-1、Cy3和BHQ-2、TAMRA和BHQ-2、ROX和BHQ-2、Cy5和BHQ-3、Cy5.5和BHQ-3或可从其它商业实体诸如Biosearch Technologies, Inc. ofNovato, Calif获得的相似荧光团-猝灭剂对。
阻断剂部分
所述发夹寡核苷酸包含天然存在的dNMP (例如,dAMP、dGMP、dCMP和dTMP)、修饰的核苷酸和/或非天然核苷酸。在一些实施方案中,所述发夹寡核苷酸包含阻断剂(例如,核酸酶抗性)部分,其对例如酶(例如,具有核酸外切酶活性的酶(例如,核酸外切酶或包含核酸外切酶活性的聚合酶))的降解有抗性。在一些实施方案中,所述阻断剂部分包含修饰的核苷酸和/或非天然核苷酸。在一些实施方案中,所述阻断剂部分包含核苷酸之间的修饰的磷酸二酯连接和/或核苷酸之间的非天然磷酸二酯连接。在一些实施方案中,所述发夹寡核苷酸包含核糖核苷酸。
此外,在一些实施方案中,本技术中使用的发夹寡核苷酸可以包括具有骨架修饰诸如以提供肽核酸(PNA)的核苷酸(Egholm等人(1993) Nature, 365:566–568),硫代磷酸酯DNA,二硫代磷酸酯DNA ,氨基磷酸酯DNA,酰胺连接的DNA,MMI连接的DNA,2'-O-甲基RNA,α-DNA和甲基膦酸酯DNA,具有糖修饰的核苷酸,诸如2'-O-甲基RNA,2'-氟RNA,2'-氨基RNA,2'-O-烷基DNA,2'-O-烯丙基DNA,2'-O-炔基DNA,己糖DNA,吡喃糖基RNA和脱水己糖醇DNA,和具有碱基修饰诸如C-5取代的嘧啶类(取代基包括氟-、溴-、氯-、碘-、甲基-、乙基-、乙烯基-、甲酰基-、乙炔基-、丙炔基-、炔基-、噻唑基-、咪唑基-和吡啶基-)、具有C-7取代基的7-去氮嘌呤(取代基包括氟-、溴-、氯-、碘-、甲基-、乙基-、乙烯基-、甲酰基-、炔基-、烯基-、噻唑基-、咪唑基-和吡啶基-)、肌苷和二氨基嘌呤的核苷酸。
PEG接头
在一些实施方案中,所述发夹寡核苷酸包含聚乙二醇(PEG)接头。参见,例如,图1E和图1F。在一些实施方案中,包含PEG接头的寡核苷酸可用于使用聚合酶(例如,高保真聚合酶)的扩增反应(例如,如本文所述),所述聚合酶包含校对活性、3'核酸外切酶活性和/或链置换活性,但缺乏5'核酸外切酶活性。在这些设计中,所述发夹寡核苷酸的环部分(例如,224或234)包含PEG接头,而不是包含连接的核苷酸的单链(核酸)区段(图1E、图1F、图12)。因此,在一些实施方案中,DNA-PEG连接终止聚合酶延伸。
聚乙二醇也称为聚环氧乙烷(PEO)或聚氧乙烯(POE)。PEG是具有结构H-(O-CH2-CH2)n-OH的聚合物,其中括号中的单元重复(例如,重复n次,例如其中n等于1-40,例如n等于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40)。当并入本文所述的发夹寡核苷酸的实施方案中时,所述PEG接头具有根据图12B的结构。在一些实施方案中,图12B中的n等于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40。
扩增反应
在一些实施方案中,本技术涉及包含本文所述的发夹寡核苷酸(例如,发夹寡核苷酸100或200)的反应混合物。例如,一些实施方案涉及包含一种或多种本文所述的发夹寡核苷酸(例如,发夹寡核苷酸100或200)、聚合酶、核苷酸单体(例如,dNTP)和模板的扩增反应混合物。在一些实施方案中,本技术涉及进一步包含典型扩增引物的反应混合物。
在图3中所示的一个示例性实施方案中,发夹寡核苷酸100用于扩增靶核酸300的区域。发夹引物100与其在靶模板300上的互补序列杂交,以形成具有游离3'末端(例如,用于延伸核酸的3'OH底物)的引物-模板杂合体。发夹引物100在发夹(茎 - 环状态)中,并且包含猝灭状态的荧光部分(星形)。具体而言,荧光部分(星形)和猝灭剂部分(五边形)位于空间中,使得猝灭剂部分尽可能减少或消除来自荧光部分的荧光的检测。
在一些实施方案中,反应混合物包含聚合酶(例如,包含5'至3'核酸外切酶活性的聚合酶)。如图3中所示,聚合酶400结合引物 - 模板杂合体(步骤1),并通过核酸合成延伸发夹引物的3'末端(例如,从扩增子特异性引发区域),以形成包含在其5'末端的发夹结构和猝灭状态的荧光部分的核酸500(步骤2)。包含模板链300和核酸500的杂交双链体的变性(例如,“解链”)导致模板链300与反应混合物中的核酸500分离。核酸500在其5’末端包含单链区域和发夹结构。
接下来,在一些实施方案中,引物(例如,典型的扩增引物、发夹寡核苷酸或提供用于通过聚合酶延伸的底物的其它引物)结合核酸500的单链部分,因此提供用于与核酸500互补的核酸600的聚合和合成的底物(步骤3)。
在一些实施方案中,所述聚合酶在核酸600的合成期间遇到核酸500的双链(例如,发夹)区域的5’末端。发夹结构的5’末端提供了聚合酶的5'至3'核酸外切酶活性的底物。因此,所述聚合酶从发夹的5’末端降解双链发夹结构,释放荧光部分108(星形)和猝灭部分107(五边形)(步骤4)。游离荧光部分108和游离猝灭部分107的空间中的分离(例如,当荧光部分和猝灭部分在反应混合物中彼此远离扩散时)允许荧光部分108发荧光(参见图3,多次概述的(例如,“闪耀”)星形)。从荧光部分检测的信号与由反应产生的扩增子的量相关,因此提供了成功扩增的定性指示和/或扩增子浓度或量的定量量度(例如,提供实时定量扩增方法) 。
聚合酶的核酸外切酶对双链体区域的降解被阻断剂(核酸外切酶抗性)部分(圆形)阻断在限定位置处,因此为核酸留下限定末端。此外,核酸外切酶对双链体区域的降解暴露适配子(例如,包含通用(例如,NGS平台依赖性)区段)(具有阴影的黑色实心区域)和任选标签(当存在时)(具有阴影的黑色实心区域),并且聚合酶继续合成至模板的末端,其由阻断剂(例如,核酸酶抗性)部分限定(步骤5)。所得扩增子包含来自靶标的区段(例如,包含靶序列)(黑色实心区段)和适配子(例如,包含通用(例如,NGS平台依赖性)区段)(具有阴影的黑色实心区域)和任选标签(当存在时)(具有阴影的黑色实心区域)。在多个扩增循环之后,产生线性双链扩增子产物的主要群体,其中每个扩增子在一端或两端包含适配子。
在与包含PEG接头的发夹寡核苷酸相关的一些实施方案中,聚合酶(例如高保真聚合酶)包含校对活性,3'核酸外切酶活性和/或链置换活性,但缺乏5'核酸外切酶活性,并且PEG-DNA连接阻断聚合酶以向扩增子提供确定的末端。
样品
在一些实施方案中,核酸(例如,DNA或RNA)分离自含有各种其它组分诸如蛋白、脂质和非模板核酸的生物样品。核酸模板分子可获得自任何材料(例如,细胞材料(活的或死的)、胞外材料、病毒材料、环境样品(例如,宏基因组样品)、合成材料(例如,扩增子诸如PCR或其它扩增技术所提供的)),可获得自动物、植物、细菌、古细菌、真菌或任何其它生物体。用于本技术中的生物样品包括病毒颗粒或其制备物。核酸分子可直接获得自生物体或获得自生物体的生物样品,例如,血液、尿液、脑脊液、***、唾液、痰、粪便、毛发、汗液、泪液、皮肤和组织。示例性样品包括,但不限于,全血、淋巴液、血清、血浆、口腔细胞、汗液、泪液、唾液、痰、头发、皮肤、活组织检查、脑脊液(CSF)、羊水、***、***分泌物、浆液、滑液、心包液、腹膜液、胸膜液、渗出液、渗出物、囊液、胆汁、尿液、胃液、肠液、粪便样品和拭子、抽出物(例如,骨髓、细针抽出物等)、洗涤物(例如,口腔、鼻咽、支气管、支气管肺泡、眼、直肠、肠、***、表皮等)和/或其它样本。
任何组织或体液样本均可用作本技术中使用的核酸的来源,包括法医样本、存档样本、保存样本和/或长时间储存的样本,例如,新鲜-冷冻、甲醇/乙酸固定或甲醛固定石蜡包埋(FFPE)的样本和样品。核酸模板分子还可分离自培养细胞,诸如原代细胞培养物或细胞系。可用病毒或其它胞内病原体感染获得模板核酸的细胞或组织。样品还可以是从生物样本提取的总RNA、cDNA文库、病毒或基因组DNA。样品还可以是来自非细胞来源的分离的DNA,例如,在冰箱中储存的扩增/分离的DNA。
核酸模板分子可以,例如,通过从生物样品,例如通过多种技术诸如Maniatis等人(1982) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, N.Y.描述的那些(参见例如,第280–281页)提取来获得。
在一些实施方案中,本技术提供核酸的大小选择,例如以去除非常短的片段或非常长的片段。在各个实施方案中,大小限于0.5、1、2、3、4、5、7、10、12、15、20、25、30、50、100kb或更长。
在各个实施方案中,扩增核酸。可使用本领域已知的任何扩增方法。可以使用的扩增技术的实例包括,但不限于,PCR、定量PCR、定量荧光PCR (QF-PCR)、多重荧光PCR (MF-PCR)、实时PCR (RT-PCR)、单细胞PCR、限制片段长度多态性PCR (PCR-RFLP)、热启动PCR、巢氏PCR、原位群落PCR、原位滚环扩增(RCA)、桥式PCR、皮微量(picotiter)PCR和乳液PCR。其它合适的扩增方法包括连接酶链式反应(LCR)、转录扩增、自我保持的序列复制、目标多核苷酸序列的选择性扩增、保守序列起始的聚合酶链式反应(CP-PCR)、随机起始的聚合酶链式反应(AP-PCR)、简并寡核苷酸起始的PCR(DOP-PCR)和基于核酸的序列扩增(NABSA)。本文可以使用的其它扩增方法包括美国专利号5,242,794;5,494,810;4,988,617和6,582,938中描述的那些。
在一些实施方案中,本技术可用于制备扩增子组,例如,扩增子组文库,用于测序。扩增子组是与以下相关的扩增子的集合:例如,疾病(例如,多基因病)、疾病进展、发育缺陷、体质病(例如,具有取决于遗传因素的病因的状态,例如,可遗传的(非肿瘤)异常或疾病)、代谢通路、药物基因组学特征、性状、生物体(例如,用于物种鉴别)、生物体的组、地理位置、器官、组织、样品、环境(例如,用于宏基因组学和/或核糖体RNA(例如核糖体小亚基(SSU)、核糖体大亚基(LSU)、5S、16S、18S、23S、28S、内转录序列(ITS)rRNA)的研究)、基因、染色体等。例如,癌症组包含已经建立与特定癌症表型的相关性的特定基因或基因中的突变(例如,ABL1、AKT1、AKT2、ATM、PDGFRA、EGFR、FGFR (例如,FGFR1、FGFR2、FGFR3)、BRAF (例如,包含V600处的突变,例如,V600E突变)、RUNX1、TET2、CBL、EGFR、FLT3、JAK2、JAK3、KIT、RAS (例如,KRAS (例如,包含G12、G13或A146处的突变,例如,G12A、G12S、G12C、G12D、G13D或A146T突变)、HRAS (例如,包含G12处的突变,例如,G12V突变)、NRAS (例如,包含Q61处的突变,例如,Q61R或Q61K突变))、MET、PIK3CA (例如,包含H1047处的突变,例如,H1047L、H1047L或H1047R突变)、PTEN、TP53 (例如,包含R248、Y126、G245或A159处的突变,例如,R248W、G245S或A159D突变)、VEGFA、BRCA、RET、PTPN11、HNHF1A、RB1、CDH1、ERBB2、ERBB4、SMAD4、SKT11 (例如,包含Q37处的突变)、ALK、IDH1、IDH2、SRC、GNAS、SMARCB1、VHL、MLH1、CTNNB1、KDR、FBXW7、APC、CSF1R、NPM1、MPL、SMO、CDKN2A、NOTCH1、CDK4、CEBPA、CREBBP、DNMT3A、FES、FOXL2、GATA1、GNA11、GNAQ、HIF1A、IKBKB、MEN1、NF2、PAX5、PIK3R1、PTCH1、STK11等中的一种或多种)。一些扩增子组涉及特定“癌症热点”,即,含有与癌症进展和治疗抗性相关的已知突变的基因组区域。
在一些实施方案中,单个基因的扩增子组包括基因外显子(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个外显子)的扩增子。在一些实施方案中,用于物种(或菌株、亚种、类型、亚型、属或其它分类水平)鉴定的扩增子组可以包括对应于一系列基因或基因座的扩增子,其共同提供一个或多个物种(或菌株、亚种、类型、亚型、属或其它分类水平)相对于其它物种(或菌株、亚种、类型、亚型、属或其它分类水平)(例如,对于细菌(例如,MRSA)、病毒(例如,HIV、HCV、HBV、呼吸道病毒等))的特定鉴定或用于确定药物抗性和/或敏感性(例如,对于细菌(例如,MRSA)、病毒(例如,HIV、HCV、HBV、呼吸道病毒等))。
所述组的扩增子通常包含100至1000个碱基对,例如,在一些实施方案中,所述组的扩增子包含约100、125、150、175、200、225、250、275、300、325、350、375、400、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975或1000个碱基对。在一些实施方案中,扩增子组包含跨越基因组的扩增子集合,例如以提供基因组序列。
所述扩增子组通常通过使用扩增寡核苷酸(例如,诸如本文提供的发夹寡核苷酸)产生,例如以从样品产生扩增子组,用于测序疾病相关基因,例如以评价基因组中的特定突变和/或等位基因的存在。在一些实施方案中,靶向10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、1000或更多个基因、基因座、区域等,以产生,例如10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、1000或更多个扩增子。在一些实施方案中,所述扩增子在高度多重、单管扩增反应中产生。在一些实施方案中,所述扩增子在单路扩增反应的集合(例如,10至100、100至1000或1000或更多个反应)中产生。在一些实施方案中,合并多个单路扩增反应(例如,单路扩增反应的集合)。在一些实施方案中,平行进行单路扩增反应。
扩增子组的产生通常与下游的下一代测序相关联,以获得所述组的扩增子的序列。即,使用扩增来靶向基因组,并提供用于NGS的选择的目标区域。该靶向富集聚焦于对基因组的特定区域的测序努力,因此提供对整个基因组测序的更有成本效益的替代方案,并提供对目标区域的覆盖度的增加深度(例如,用于对罕见变异和/或低比率的假阴性和/或假阳性的改善检测)。另外,NGS提供了用于在单一测试中靶向多个扩增子的技术。
方法
本技术还提供了用于扩增核酸,例如向NGS平台提供输入物(例如,NGS测序文库;扩增子文库)的方法的实施方案。所述方法的一些实施方案包括提供包含待测序的多核苷酸的样品。在某些示例性实施方案中,多核苷酸(例如,目标核酸序列,例如,靶序列,例如,模板序列)长度为至少约1,000;1,500;2,000;2,500;3,000;3,500;4,000;4,500;5,000;5,500;6,000;6,500;7,000;7,500;8,000;8,500;9,000;9,500;1,000,000;2,000,000;3,000,000;4,000,000;5,000,000;6,000,000;7,000,000;8,000,000;9,000,000;10,000,000;15,000,000;20,000,000;25,000,000;30,000,000;35,000,000;40,000,000;45,000,000;50,000,000或更多个核苷酸。在某些方面,目的核酸序列是DNA序列,诸如,例如调节元件(例如,启动子区域、增强子区域、编码区域、非编码区域等),基因,基因组,基因组缺口,参与途径(例如,代谢途径(例如,核苷酸代谢、碳水化合物代谢、氨基酸代谢、脂质代谢、辅因子代谢、维生素代谢、能量代谢等)的DNA序列,参与信号传导途径的DNA序列,参与生物合成途径的DNA序列,参与免疫途径、发育途径的DNA序列等),等。在其它方面,目标核酸序列是基因的长度,例如,长度为约500个核苷酸至5,000个核苷酸。在其它方面,目标核酸序列是基因组(例如,噬菌体基因组、病毒基因组、细菌基因组、真菌基因组、植物基因组、动物基因组(例如,人类基因组)等)的长度。
在一些实施方案中,将核酸片段化以提供待测序的多核苷酸。在一些实施方案中,将核酸片段化包括例如通过超声处理(例如,超声处理)包含核酸的样品(例如,包含待测序的核酸的样品)来剪切样品中的核酸。在一些实施方案中,将核酸片段化包括用酶(例如,限制性酶)消化,雾化和/或水动力学剪切。
在一些实施方案中,根据大小选择包含核酸的样品(例如,包含一种或多种多核苷酸的样品),例如以提供优选、限定的大小或在优选、限定的大小范围内的多核苷酸。
在一些实施方案中,所述方法包括用本文所述的发夹寡核苷酸(例如,包含扩增子特异性引发序列和适配子(例如,包含通用序列(例如,包含平台依赖性序列)的适配子)的发夹寡核苷酸;例如,包含环区域、荧光部分、猝灭剂部分和阻断剂(例如,核酸外切酶抗性)部分的发夹寡核苷酸)扩增待用测序的多核苷酸。示例性实施方案包括提供本文所述的发夹寡核苷酸,聚合酶(例如,DNA聚合酶(例如,包含核酸外切酶活性的聚合酶,例如,包含5'至3'核酸酶活性的聚合酶或包含校对活性、3'核酸外切酶活性和/或链置换活性、但缺乏5'核酸外切酶活性的聚合酶(例如,高保真聚合酶))),核苷酸单体(dNTP)和合适的反应缓冲液;混合发夹寡核苷酸、聚合酶、核苷酸单体和反应缓冲液以提供扩增反应混合物;将扩增反应混合物热循环以产生一个或多个扩增子(例如,测序文库或扩增子组文库);和将一个或多个扩增子(例如,测序文库)作为输入物提供至NGS平台或***。一些实施方案包括提供如本文所述的第二发夹引物(例如,包含扩增子特异性引发序列和适配子(例如,包含通用序列(例如,包含平台依赖性序列)的适配子)的发夹引物;例如,包含环区域、荧光部分、猝灭剂部分和阻断剂(例如,核酸外切酶抗性)部分)的发夹寡核苷酸)。第一和/或第二引物任选地包含标签(例如,包含接头、索引、捕获序列、限制性位点、引物结合位点、抗原和/或本文所述的其它功能位点的标签)。
在一些实施方案中,所述方法包括例如使用NGS平台或***对核酸测序。一些实施方案包括在扩增期间监测信号(例如,荧光信号),例如,在一些实施方案中,所述方法包括实时定量扩增,例如在一些实施方案中,所述方法包括定量扩增子,例如以测量扩增子的大小(例如,最大大小、最小大小、平均大小、大小范围等)和/或以测量扩增子的浓度、数量或质量。在一些实施方案中,例如通过监测荧光信号来评价文库的质量。因此,在一些实施方案中,本文提供的方法从单个靶序列产生测序数据。在一些实施方案中,稀释包含扩增子的样品。
在一些实施方案中,将多种(例如,2或更多种,例如3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多种)扩增反应混合物的产物组合(例如,混合)以提供多重文库。在一些实施方案中,将多个文库(例如,来自多个受试者、样品、来源、BAC等)混合以提供合并的多重文库。因此,本文提供的方法包括合并多个、可独特鉴定的样品文库,其在测序后在计算机芯片上去多重化(例如,在一些实施方案中,所述方法包括将序列数据去多重化,例如使用索引序列的序列将序列与其来源(例如,与受试者、样品、BAC等)相关联。因此,一些实施方案包括从不同样品产生测序文库,合并来自不同样品的测序文库,以及在同一测序运行中将合并的文库进行测序。所述索引区段包含对于每个样品不同的特征性序列。
在一些实施方案中,将样品纯化以除去来自先前反应的可能抑制所述方法的后续步骤的污染物或组分(例如,盐、酶)。
核酸测序平台
在本技术的一些实施方案中,产生核酸序列数据。核酸测序平台(例如,核酸测序仪)的多个实施方案包括如下所述的组件。根据多个实施方案,测序仪器包括流体递送和控制单元、样品处理单元、信号检测单元以及数据采集、分析和控制单元。所述仪器的多个实施方案提供用于平行和/或基本上同时从多个序列收集序列信息的自动化测序。
在一些实施方案中,流体递送和控制单元包括试剂递送***。所述试剂递送***包括用于储存多种试剂的试剂储库。所述试剂可包括基于RNA的引物、正向/反向DNA引物、用于边合成边测序的核苷酸混合物(例如,包含本文所提供的核苷酸类似物的组合物)、缓冲液、洗涤试剂、封闭试剂、剥离试剂等。另外,试剂递送***可包括连接样品处理单元与试剂储库的移液***或连续流动***。
在一些实施方案中,样品处理单元包括样品室诸如流动室、基底、微阵列、多孔托盘等。样品处理单元可包括多个泳道、多个通道、多个孔或基本上同时处理多个样品集的其它装置。另外,样品处理单元可包括多个样品室以使得能够同时处理多个运行。在具体的实施方案中,所述***可在一个样品室进行信号检测同时基本上同时处理另一个样品室。另外,样品处理单元可包括用于移动或操纵样品室的自动***。在一些实施方案中,信号检测单元可包括成像或检测传感器。例如,成像或检测传感器(例如,荧光检测器或电子检测器)可包括CCD、CMOS、离子传感器诸如覆盖CMOS的离子敏感层、检流器等。信号检测单元可包括激发***以引起探针,诸如,荧光染料,发射信号。检测***可包括照明源,诸如弧光灯、激光、发光二极管(LED)等。在具体的实施方案中,信号检测单元包括用于从照明源向样品或从样品向成像或检测传感器传输光的光学器件。或者,信号检测单元可不包括照明源,诸如例如,当信号由于测序反应自发产生时。例如,信号可通过释放部分的相互作用,诸如释放的离子与离子敏感层相互作用,或焦磷酸与酶或其它催化剂反应以产生化学发光信号。在另一个实例中,可检测电流、电压或电阻的变化而不需照明源。
在一些实施方案中,数据采集分析和控制单元监测多个***参数。所述***参数可包括仪器多个部分诸如样品处理单元或试剂储库的温度、多种试剂的体积、多个***亚组件诸如机械手、步进电机、泵等的状态,或其任何组合。
本领域技术人员将理解的是所述仪器和***的多个实施方案用于实践测序方法诸如边合成边测序、单分子方法和其它测序技术。边合成边测序可包括掺入染料标记的核苷酸、链终止、离子/质子测序、焦磷酸测序等。单分子技术可包括交错测序,其中暂停测序反应以确定所掺入核苷酸的同一性。
在一些实施方案中,测序仪器测定核酸,诸如多核苷酸或寡核苷酸的序列。核酸可包括DNA或RNA,并且可为单链的,诸如ssDNA和RNA,或双链的,诸如dsDNA或RNA/cDNA对。在一些实施方案中,核酸可包括或衍生自片段文库、配对文库、ChIP片段等。在一些实施方案中,核酸可包括或衍生自根据本文提供的技术产生的扩增子文库。在具体的实施方案中,测序仪器可从单个核酸分子或从基本上同一的核酸分子群获得序列信息。
在一些实施方案中,测序仪器可以以多种不同的输出数据文件类型/格式输出核酸测序阅读数据,包括,但不限于:*.txt、*.fasta、*.csfasta、*seq.txt、*qseq.txt、*.fastq、*.sff、*prb.txt、*.sms、*srs和/或*.qv。
下一代测序技术
示例性NGS平台和***包括但不限于单分子方法和边合成边测序方法。本技术所考虑的具体测序技术为下一代测序(NGS)方法,其共享大规模平行、高通量策略的共同特征,并以与旧测序方法相比更低的成本为目标(参见,例如,Voelkerding等人, Clinical Chem.,55: 641-658, 2009; MacLean等人, Nature Rev. Microbiol., 7: 287-296; 各自通过引用以其整体并入本文)。NGS方法可广泛分为通常使用模板扩增的那些和不使用的那些。需要扩增的方法包括作为454技术平台(例如,GS 20和GS FLX)由Roche商业化的焦磷酸测序、由Illumina商业化的Solexa平台和由Applied Biosystems商业化的支持的寡核苷酸连接和检测(Supported Oligonucleotide Ligation and Detection (SOLiD))平台。非-扩增方法,也称为单分子测序,通过由Helicos BioSciences商业化的HeliScope平台和分别由VisiGen、Oxford Nanopore Technologies Ltd.、Life Technologies/Ion Torrent和Pacific Biosciences商业化的新兴平台例举。
在焦磷酸测序中(Voelkerding等人, Clinical Chem., 55: 641-658, 2009;MacLean等人, Nature Rev. Microbiol., 7: 287-296; 美国专利号6,210,891; 美国专利号6,258,568; 各自通过引用以其整体并入本文),通过用携带与适配子互补的寡核苷酸的珠粒捕获单个模板分子原位克隆扩增NGS片段文库。将每个携带单个模板类型的珠粒划分入油包水微泡中,并使用称作乳液PCR的技术克隆扩增模板。扩增后将乳液打破并将珠粒放置在测序反应期间充当流动室的皮微量(picotitre)板的单个孔。在测序酶和发光报告分子诸如荧光素酶存在下,在流动室中发生4种dNTP试剂每个的有序反复引入。如果适当的dNTP被加至测序引物的3’末端,所得ATP产生导致孔内发光的爆发,这使用CCD照相机记录。达到大于或等于400碱基的阅读长度是可能的,并且可达到106个序列读数,导致多达500个百万碱基对(Mb)的序列。
在Solexa/Illumina平台中(Voelkerding等人, Clinical Chem., 55: 641-658,2009; MacLean等人, Nature Rev. Microbiol., 7: 287-296; 美国专利号6,833,246;美国专利号7,115,400; 美国专利号6,969,488; 各自通过引用以其整体并入本文),测序数据以较短长度读数的形式产生。在该方法中,将NGS片段文库的片段捕获在布满寡核苷酸锚的流动室表面。所述锚用作PCR引物,但由于模板的长度以及其与其它附近锚寡核苷酸的接近,PCR延伸导致该分子“拱悬”与邻近锚寡核苷酸杂交以在流动室表面上形成桥状结构。将这些DNA环变性和切割。然后用可逆染料终止剂将正向链测序。掺入核苷酸的序列通过检测掺入后荧光测定,去除各荧光剂和阻断剂,然后进行下一个dNTP添加循环。序列阅读长度范围为36个核苷酸至超过100个核苷酸,每个分析运行的总体输出超过十亿个核苷酸对。
使用SOLiD技术测序核酸分子(Voelkerding等人, Clinical Chem., 55: 641-658, 2009; MacLean等人, Nature Rev. Microbiol., 7: 287-296; 美国专利号5,912,148; 美国专利号6,130,073; 各自通过引用以其整体并入本文)也涉及通过乳液PCR克隆扩增NGS片段。这之后,将携带模板的珠粒固定化在玻璃流动室的衍生化表面,并将与适配子寡核苷酸互补的引物退火。然而,不是利用该引物进行3′延伸,而是用于提供5′磷酸基团与包含两个探针-特异性碱基接着6个简并碱基和4种荧光标记之一的询问探针(interrogation probe)连接。在SOLiD***中,询问探针在每个探针的3′末端具有16种可能的两个碱基组合并且在5′末端具有4种荧光剂之一。荧光剂颜色,以及因此各个探针的鉴定,与指定的颜色-空间编码方案对应。多轮(通常7)探针退火、连接和荧光剂检测之后为变性,然后使用相对于最初的引物1个碱基偏移的引物第二轮测序。以这种方式,可计算重构模板序列,并且模板碱基被询问两次,导致增加的准确度。序列阅读长度平均为35个核苷酸,并且每次测序运行的总体输出超过40亿碱基。
在某些实施方案中,使用Helicos BioSciences的HeliScope (Voelkerding等人,Clinical Chem., 55: 641-658, 2009; MacLean等人, Nature Rev. Microbiol., 7:287-296; 美国专利号7,169,560; 美国专利号7,282,337; 美国专利号7,482,120; 美国专利号7,501,245; 美国专利号6,818,395; 美国专利号6,911,345; 美国专利号7,501,245; 各自通过引用以其整体并入本文)。测序通过添加聚合酶和系列添加荧光标记的dNTP试剂完成。掺入事件导致与dNTP对应的荧光剂信号,并且在每轮dNTP添加前用CCD照相机捕获信号。序列阅读长度范围为25-50个核苷酸,每次分析运行的总体输出超过10亿核苷酸对。
在一些实施方案中,使用Roche的454测序(Margulies等人(2005) Nature 437:376–380)。454测序包括两个步骤。在第一步中,将DNA剪切为约300-800碱基对的片段并将片段平末端化。然后将寡核苷酸适配子连接至片段的末端。适配子充当用于片段扩增和测序的引物。片段可使用,例如,包含5′-生物素标签的适配子附着至DNA捕获珠粒上,例如链霉亲和素-包被的珠粒上。在油-水乳液的微滴内PCR扩增附着至珠粒上的片段。结果为每个珠粒上克隆扩增的DNA片段的多个拷贝。在第二步中,将珠粒捕获在孔(皮升大小)中。在每个DNA片段上平行进行焦磷酸测序。一个或多个核苷酸的添加产生光信号,其由测序仪器中的CCD照相机记录。信号强度与掺入核苷酸的数目成正比。焦磷酸测序利用核苷酸添加后释放的焦磷酸(PPi)。PPi在腺苷5'磷酸硫酸酐的存在下被ATP硫酸化酶转化为ATP。荧光素酶使用ATP以将荧光素转化为氧荧光素,该反应产生被检测和分析的光。
Ion Torrent技术为基于对DNA聚合期间所释放氢离子的检测的DNA测序方法(参见,例如,Science 327(5970): 1190 (2010); 美国专利申请公开号20090026082、20090127589、20100301398、20100197507、20100188073和20100137143,对于所有目的通过引用以其整体并入)。微孔含有待测序的NGS片段文库的片段。微孔层之下为高灵敏度的ISFET离子传感器。所有层均被包含在CMOS半导体芯片内,与电子工业中所使用的类似。当dNTP掺入正在生长的互补链中时,释放氢离子,其触发高灵敏度的离子传感器。如果模板序列中存在均聚物重复,将多个dNTP分子掺入单个循环中。这导致相应数目的氢释放以及按比例更高的电子信号。该技术与其它测序技术的不同之处在于不使用修饰的核苷酸或光学器件。对于50碱基读数,Ion Torrent测序仪每个碱基的准确度为~99.6%,其中每次运行产生~100 Mb。阅读长度为100碱基对。5个重复长度的均聚物重复的准确度为~98%。离子半导体测序的益处为快的测序速度以及低前期和运行成本。然而,排除样品制备装置和用于数据分析的服务器,获得pH-介导的测序仪的成本为约$50,000。
Stratos Genomics, Inc.开发了经调整可用于本技术的另一种示例性核酸测序方法并且涉及Xpandomers的使用。该测序方法通常包括提供由模板-定向合成产生的子链。所述子链通常在与所有或部分靶核酸的连续核苷酸序列所对应的序列中包含多个偶联的亚基,其中单个亚基含有系链、至少一个探针或核苷碱基残基以及至少一个可选择性切割的键。可选择性切割的键被切割以产生长度长于子链的多个亚基的Xpandomer。Xpandomer通常在与全部或部分靶核酸的连续核苷酸序列所对应的序列中含有系链和用于解析遗传信息的报告分子元件。然后检测Xpandomer的报告分子元件。关于基于Xpandomer的方法的更多细节在,例如,2008年6月19日提交的标题为“HIGH THROUGHPUT NUCLEIC ACIDSEQUENCING BY EXPANSION (通过扩展的高通量核酸测序)”的美国专利公开号20090035777中描述,所述专利以其整体并入本文。
其它单分子测序方法包括使用VisiGen平台的实时边合成边测序(Voelkerding等人, Clinical Chem., 55: 641–58, 2009; 美国专利号7,329,492; 美国专利申请序列号11/671956; 美国专利申请序列号11/781166; 各自通过引用以其整体并入本文),其中将NGS片段文库的片段固定化、引发,然后经受使用荧光修饰的聚合酶和荧光受体分子的链延伸,导致核苷酸添加后可检测的荧光共振能量转移(FRET)。
Pacific Biosciences开发的另一个实时单分子测序***(Voelkerding等人,Clinical Chem., 55: 641-658, 2009; MacLean等人, Nature Rev. Microbiol., 7:287-296; 美国专利号7,170,050; 美国专利号7,302,146; 美国专利号7,313,308; 美国专利号7,476,503; 其所有均通过引用并入本文)利用直径50-100 nm并包含约20仄升(10–21 L)的反应体积的反应孔。测序反应使用固定化模板、修饰的phi29 DNA聚合酶和高局部浓度的荧光标记dNTPs进行。高局部浓度和连续反应条件允许通过使用激光激发、光波导和CCD照相机检测荧光信号实时捕获掺入事件。
在某些实施方案中,利用Pacific Biosciences开发的使用零模式波导(ZMW)的单分子实时(SMRT) DNA测序方法,或相似的方法。用该技术,DNA测序在SMRT芯片上进行,每个芯片包含数千个零模式波导(ZMWs)。ZMW为直径数十纳米的孔,在二氧化硅基底上放置的100 nm金属膜中制造。每个ZMW成为提供仅20仄升(10–21 L)检测体积的纳米光子可视化室。在该体积,可在数千个标记核苷的背景中检测单分子的活性。由于ZMW进行边合成边测序,其提供用于观察DNA聚合酶的窗口。在每个室内,单个DNA聚合酶分子附着在底部表面上,使得其永久存在于检测体积中。然后将磷酸连接的核苷酸(各个类型用不同颜色的荧光团标记)以促进酶速度、准确度和持续合成能力的高浓度引入反应溶液中。由于ZMW的小尺寸,即使在这些高、生物学相关浓度时,核苷酸仅占据检测体积一小部分时间。另外,访问检测体积迅速,仅持续几个微秒,因为扩散需要携带核酸的距离非常小。结果是非常低的背景。
在一些实施方案中,使用纳米孔测序(Soni G V和Meller A. (2007) Clin Chem53: 1996-2001)。纳米孔为直径1纳米级的小孔。将纳米孔浸在电导液中并在其两端施加电势导致轻微电流,这是因为离子传导通过纳米孔。流过的电流的量对纳米孔的大小敏感。随着DNA分子通过纳米孔,DNA分子上的每个核苷酸以不同的程度堵塞纳米孔。因此,随着DNA分子通过纳米孔通过纳米孔的电流的变化代表对DNA序列的阅读。
在一些实施方案中,测序技术使用化学-敏感场效应晶体管(chemFET)阵列测序DNA (例如,如美国专利申请公开号20090026082中所描述的)。在该技术的一个实例中,将DNA分子放置在反应室中并使模板分子与结合聚合酶的测序引物杂交。一个或多个三磷酸在测序引物的3'末端向新核酸链中的掺入可通过chemFET经由电流变化检测。阵列可具有多个chemFET传感器。在另一个实例中,可将单个核酸附着在珠粒上,核酸可在珠粒上扩增,并且可将单个珠粒转移至chemFET阵列上的单个反应室,每个反应室具有一个chemFET传感器,并且可测序核酸。
在一些实施方案中,测序技术使用电子显微镜(Moudrianakis E. N.和Beer M.Proc Natl Acad Sci USA. 1965 March; 53:564-71)。在该技术的一个实例中,使用可使用电子显微镜区分的金属标记标记个体DNA分子。然后将这些分子在平面上拉伸并使用电子显微镜测量序列。
在一些实施方案中,使用如Turro等人 PNAS 103: 19635–40 (2006)中所描述的“使用可切割的荧光核苷酸可逆终止剂的四色边合成边测序”,例如Intelligent Bio-Systems所商业化的。该技术在美国专利申请公开号2010/0323350、2010/0063743、2010/0159531、20100035253、20100152050中描述,对于所有目的所述申请通过引用并入本文。
对于此类经调整可使用本技术的实时测序的过程和***描述于,例如,2008年7月29日颁予Xu等人的标题为“Fluorescent nucleotide analogs and uses therefor”的美国专利号7,405,281;2008年1月1日颁予Turner等人的标题为“Arrays of opticalconfinements and uses thereof ”的7,315,019;2007年12月25日颁予Turner等人的标题为“Optical analysis of molecules ”的7,313,308;2007年11月27日颁予Turner等人的标题为“Apparatus and method for analysis of molecules”的7,302,146以及2007年1月30日颁予Turner等人的标题为“Apparatus and methods for optical analysis ofmolecules”的7,170,050,以及Lundquist等人2007年10月26日提交的标题为“Methods andsystems for simultaneous real-time monitoring of optical signals frommultiple sources”的美国专利公开号20080212960;Williams等人2007年10月26日提交的标题为“Flowcell system for single molecule detection”的20080206764;Hanzel等人2007年10月26日提交的标题为“Active surface coupled polymerases”的20080199932;Otto等人2008年2月11日提交的标题为“CONTROLLABLE STRAND SCISSION OF MINI CIRCLEDNA”的20080199874;Rank等人2007年10月26日提交的标题为“Articles havinglocalized molecules disposed thereon and methods of producing same”的20080176769;Eid等人2007年10月31日提交的标题为“Mitigation of photodamage inanalytical reactions”的20080176316;Eid等人2007年10月31日提交的标题为“Mitigation of photodamage in analytical reactions”的20080176241;Lundquist等人2007年10月26日提交的标题为“Methods and systems for simultaneous real-timemonitoring of optical signals from multiple sources”的20080165346;Korlach2007年10月31日提交的标题为“Uniform surfaces for hybrid material substratesand methods for making and using same”的20080160531;Lundquist等人2007年10月26日提交的标题为“Methods and systems for simultaneous real-time monitoring ofoptical signals from multiple sources”的20080157005;Rank等人2007年10月31日提交的标题为“Articles having localized molecules disposed thereon and methodsof producing same”的20080153100;Williams等人2007年10月26日提交的标题为“CHARGESWITCH NUCLEOTIDES”的20080153095;Lundquist等人2007年10月31日提交的标题为“Substrates, systems and methods for analyzing materials”的20080152281;Lundquist等人2007年10月31日提交的标题为“Substrates, systems and methods foranalyzing materials”的20080152280;Korlach 2007年10月31日提交的标题为“Uniformsurfaces for hybrid material substrates and methods for making and usingsame”的20080145278;Lundquist等人2007年8月31日提交的标题为“SUBSTRATES, SYSTEMSAND METHODS FOR ANALYZING MATERIALS”的20080128627;Rank等人2007年10月22日提交的标题为“Polymerase enzymes and reagents for enhanced nucleic acidsequencing”的20080108082;Foquet等人2007年6月11日提交的标题为“SUBSTRATES FORPERFORMING ANALYTICAL REACTIONS”的20080095488;Dixon等人2007年9月27日提交的标题为“MODULAR OPTICAL COMPONENTS AND SYSTEMS INCORPORATING SAME”的20080080059;Korlach等人2007年8月14日提交的标题为“Articles having localized moleculesdisposed thereon and methods of producing and using same”的20080050747;Rank等人2007年3月29日提交的标题为“Articles having localized molecules disposedthereon and methods of producing same”的20080032301;Lundquist等人2007年2月9日提交的标题为“Methods and systems for simultaneous real-time monitoring ofoptical signals from multiple sources”的20080030628;Lyle等人2007年6月15日提交的标题为“CONTROLLED INITIATION OF PRIMER EXTENSION”的20080009007;Rank等人2006年3月30日提交的标题为“Articles having localized molecules disposed thereonand methods of producing same”的20070238679;Korlach等人2006年3月31日提交的标题为“Methods, systems and compositions for monitoring enzyme activity andapplications thereof”的20070231804;Lundquist等人2007年2月9日提交的标题为“Methods and systems for simultaneous real-time monitoring of optical signalsfrom multiple sources”的20070206187;Hanzel等人2006年12月21日提交的标题为“Polymerases for nucleotide analog incorporation”的20070196846;Lundquist等人2006年7月7日提交的标题为“Methods and systems for simultaneous real-timemonitoring of optical signals from multiple sources”的20070188750;Eid等人2006年12月1日提交的标题为“MITIGATION OF PHOTODAMAGE IN ANALYTICAL REACTIONS”的20070161017;Turner等人2006年11月3日提交的标题为“Nucleotide Compositions andUses Thereof”的20070141598;Korlach 2006年11月27日提交的标题为“Uniformsurfaces for hybrid material substrate and methods for making and using same”的20070134128;Eid等人2005年12月2日提交的标题为“Mitigation of photodamage inanalytical reactions”的20070128133;Roitman等人2005年9月30日提交的标题为“Reactive surfaces, substrates and methods of producing same”的20070077564;Xu等人2005年9月29日提交的标题为“Fluorescent nucleotide analogs and usestherefore”的20070072196和Lundquist等人2005年8月11日提交的标题为“Methods andsystems for monitoring multiple optical signals from a single source”的20070036511,以及Korlach等人(2008) “Selective aluminum passivation fortargeted immobilization of single DNA polymerase molecules in zero-modewaveguide nanostructures” PNAS 105(4): 1176–81,其所有均通过引用以其整体并入本文。
在一些实施方案中,由下一代测序平台所产生数据的质量取决于载入测序仪流程上的克隆扩增步骤的DNA(例如,扩增子组文库)的浓度。例如,载入低于最小阈值的浓度可导致低的或次佳的测序仪输出,而载入高于最大阈值的浓度可导致低质量的测序或无测序仪输出。因此,本文提供的技术可用于制备具有用于测序的适宜浓度的样品,例如,使得作为输出的测序数据具有所需质量。
核酸序列分析
在一些实施方案中,使用基于计算机的分析程序为最终使用者(例如,医务人员)将检测测定所产生的原始数据(例如,测序读数)翻译为预测值数据。使用者可使用任何合适的方法访问预测数据。因此,在一些优选的实施方案中,本技术提供使用者(不太可能进行遗传学或分子生物学训练)不需理解原始数据这一进一步的益处。数据以有用形式直接呈现给最终使用者。然后使用者能够立即利用该信息以确定(例如,在医学诊断、研究或筛查中的)有用信息。
一些实施方案提供用于重构核酸序列的***。所述***可包括核酸测序仪、样品序列数据存储器、参考序列数据存储器和分析计算装置/服务器/节点。在一些实施方案中,分析计算装置/服务器/节点可为工作站、主机计算机、个人计算机、移动装置等。核酸测序仪可配置为利用所有可用的技术、平台或工艺分析(例如,询问)核酸片段(例如,单一片段、配对片段、末端配对片段等)以获得核酸序列信息,特别是本文所述使用本文所提供的组合物的方法。在一些实施方案中,核酸测序仪与样品序列数据存储器直接经由数据电缆(例如,串行电缆、直接电缆连接,等)或总线连接或,替代地,通过网络连接(例如,因特网、LAN、WAN、VPN,等)通信。在一些实施方案中,网络连接可为硬线物理连接。例如,核酸序列可与数据服务器(经由Category 5 (CAT5)、光纤或等效电缆)通信连接,数据服务器通过因特网(经由CAT5、光纤或等效电缆)与样品序列数据存储器通信连接。在一些实施方案中,网络连接为例如,利用802.11 a/b/g/n或等效传输形式的无线网络连接(例如,Wi-Fi、WLAN等)。在实践中,所利用的网络连接取决于***的具体需求。在一些实施方案中,样品序列数据存储器为核酸测序仪的整合部分。
在一些实施方案中,样品序列数据存储器为配置为组织和储存核酸测序仪产生的核酸序列阅读数据以便数据可(例如,由数据库管理员/客户端操作员)手动或经由计算机程序、应用或软件脚本自动搜寻和检索的任何数据库存储装置、***或仪器(例如,数据存储分区,等)。在一些实施方案中,参考数据存储器可为配置为组织和储存参考序列(例如,全或部分基因组、全或部分外显子组、SNP、基因等)以便数据可(例如,由数据库管理员/客户端操作员)手动或经由计算机程序、应用或软件脚本自动搜寻和检索的任何数据库装置、存储***或仪器(例如,数据存储分区,等)。在一些实施方案中,样品核酸测序阅读数据可以以多种不同的数据文件类型/格式储存在样品序列数据存储器和/或参考数据存储器上,包括,但不限于:*.txt、*.fasta、*.csfasta、*seq.txt、*qseq.txt、*.fastq、*.sff、*prb.txt、*.sms、*srs和/或*.qv。
在一些实施方案中,样品序列数据存储器和参考数据存储器为互不依赖的独立装置/***或在不同装置上实现。在一些实施方案中,样品序列数据存储器和参考数据存储器在同一装置/***上实现。在一些实施方案中,样品序列数据存储器和/或参考数据存储器可在分析计算装置/服务器/节点上实现。分析计算装置/服务器/节点与样品序列数据存储器和参考数据存储器直接经由数据电缆(例如,串行电缆、直接电缆连接,等)或总线连接,或,替代地,通过网络连接(例如,因特网、LAN、WAN、VPN,等)通信。在一些实施方案中,分析计算装置/服务器/节点可宿有(host)参考映射引擎、重新映射模块和/或第三分析引擎。在一些实施方案中,参考映射引擎可配置为从样品数据存储器获得样品核酸序列阅读并将其对从参考数据存储器获得的一个或多个参考序列映射以使用所有种类的参考/比对技术和方法将阅读汇编成与参考序列相似但不一定同一的序列。重汇编的序列然后可通过一个或多个任选的第三分析引擎进一步分析以鉴定可导致体格特征(表型)的很大差异的个体基因构成(基因型)、基因表达或表观遗传状态差异。例如,在一些实施方案中,第三分析引擎可配置为鉴定由突变、重组/交叉或遗传漂变引起的(汇编序列中的)各种基因组变体。基因组变体类型的实例包括,但不限于:单核苷酸多态性(SNPs)、拷贝数变异(CNVs)、***/缺失(Indels)、倒位,等。任选的重新映射模块可配置为将来自样品数据存储器的样品核酸序列阅读汇编成新的和先前未知的序列。然而,应理解的是,分析计算装置/服务器/节点上宿有的各种引擎和模块可组合或塌缩为单个引擎或模块,取决于具体应用或***体系结构的需求。此外,在一些实施方案中,所述分析计算装置/服务器/节点可宿有具体应用或***体系结构所需要的额外的引擎或模块。
在一些实施方案中,映射和/或第三分析引擎配置为在彩色空间处理核酸和/或参考序列阅读。在一些实施方案中,映射和/或第三分析引擎配置为在基础空间处理核酸和/或参考序列阅读。然而,应理解的是,本文所公开的映射和/或第三分析引擎可处理或分析任何图式或格式的核酸序列数据,只要该图式或格式可传输核酸序列的碱基同一性和位置。
在一些实施方案中,样品核酸测序阅读和参考序列数据可以以多种不同的输入数据文件类型/格式向分析计算装置/服务器/节点提供,包括,但不限于:*.txt、*.fasta、*.csfasta、*seq.txt、*qseq.txt、*.fastq、*.sff、*prb.txt、*.sms、*srs和/或*.qv。
此外,客户端可为瘦客户端或胖客户端计算装置。在一些实施方案中,客户端可具有可用于控制参考映射引擎、重新映射模块和/或第三分析引擎的操作的网络浏览器。即,客户端可使用浏览器访问参考映射引擎、重新映射模块和/或第三分析引擎以控制其功能。例如,根据具体应用的需求,客户端可用于配置多个引擎的操作参数(例如,错配约束、质量值阈值,等)。相似地,客户端还可显示参考映射引擎、重新映射模块和/或第三分析引擎所进行分析的结果。
本技术还包括能够向进行测定的实验室、信息提供者、医务人员和受试者以及从进行测定的实验室、信息提供者、医务人员和受试者接收、处理和传递信息的任何方法。
试剂盒
一些实施方案提供了用于产生测序文库(例如,扩增子文库)的试剂盒。例如,试剂盒实施方案包含组分,诸如一种或多种本文所述的发夹寡核苷酸,dNTP单体(例如,dATP、dCTP、dGTP和dTTP),聚合酶(例如,包含核酸外切酶(例如,5′至3′核酸外切酶活性)活性的DNA聚合酶或包含校对活性、3'核酸外切酶活性和/或链置换活性、但缺乏5'核酸外切酶活性的聚合酶(例如,高保真聚合酶)),对照模板,反应缓冲液,其以任何组合包装。在一些实施方案中,一个或多个发夹寡核苷酸的个别发夹寡核苷酸包含适配子(例如,包含标签(例如,包含索引)和/或包含通用、平台依赖性序列)和扩增子特异性(例如,靶标特异性)序列。在一些实施方案中,以即用型形式、作为冻干形式、以待稀释使用的浓缩形式等提供组分。
***
本技术包括包含***的实施方案,所述***包含各种组分,诸如,例如包含一种或多种发夹寡核苷酸的反应混合物,例如如本文所述,热循环装置和基于计算机的分析程序,例如如本文所述。一些***的实施方案包含荧光检测器,例如以监测扩增反应的进展和/或定量扩增反应。***的实施方案以各种组合包括(例如,具有一些或全部)一种或多种发夹寡核苷酸(在双链双链体的相同链上包含荧光部分和猝灭部分),扩增子文库,(例如,多重扩增子文库, 例如,如本文所述),NGS测序装置(包括与NGS测序流程相关的组件)以及用于向使用者提供使用者可读和/或计算机可读格式的信息(例如,序列数据)的一种或多种报告功能性。
尽管本文的公开内容是指某些说明性的实施方案,但应理解的是这些实施方案通过举例的方式而非通过限制的方式呈现。
实施例
实施例1-寡核苷酸的设计
在开发本文提供的技术的实施方案期间,设计发夹寡核苷酸以扩增人染色体7的区域(表皮生长因子受体(EGFR)基因)和人染色体1的区域(染色体1的非编码区) (表格1)。表1中命名为“F_egfr_trP1” (SEQ ID NO: 1)和“R_egfr_b1_A” (SEQ ID NO: 2)的寡核苷酸靶向染色体7(在EGFR基因处);表1中命名为“F_chr1_trP1” (SEQ ID NO:3)和“R_chr1_b1_A” (SEQ ID NO:4)的寡核苷酸靶向染色体1。
表1-寡核苷酸序列和结构
在表1中,粗体字型和大写字母的序列代表靶标特异性引发序列;非粗体大写字母的序列代表在用于克隆扩增(例如,用于测序)的PCR之后的“通用”序列。在反向引物中加下划线的序列(例如,名称以“R_”开始)代表条形码/索引序列;小写字母的序列代表作为分子内杂交的结果形成的环区域。在表1中,星号(“*”)指示硫代磷酸酯键,且“p”指示磷酸酯基(例如,来自典型的寡核苷酸合成的磷酸酯基)。
使用软件(UNAFold和mFOLD, Rensselaer Polytechnic Institute)将F_egfr_trP1、R_egfr_b1_A、F_chr1_trP1和R_chr1_b1_A寡核苷酸的二级结构建模(分别是图4A、图4B、图4C和图4D)。建模表明所述寡核苷酸形成茎-环(“发夹”)结构(图4A、图4B、图4C和图4D)。
此外,预测这些结构的形成在70℃、62℃和55℃的指示温度下是热力学有利的(例如,具有形成的负自由能(ΔG))。使用60 mM的Na离子(Na+)浓度、4 mM的Mg离子(Mg++)浓度且在55℃、62℃和70℃的温度下从模型计算热力学自由能(ΔG,以kcal/mol计(图4;表2)。
表2-双链体形成的自由能
实施例2-在实时扩增中使用寡核苷酸
在开发本文提供的技术的实施方案期间,进行实验以测试根据本文所述的技术设计的示例性发夹寡核苷酸。具体地,使用荧光标记的检测探针(表3)在双重(two-plex)(例如,在相同反应中同时检测两个靶标)扩增中测试实施例1中描述的示例性发夹寡核苷酸。
表3-用于荧光检测的探针
EGFR探针用在其5'末端的荧光部分(FAM)、在其3'末端的猝灭剂部分(BHQ1)标记;
类似地,Chr1探针用在其5'末端的荧光部分(VIC)和在其3'末端的猝灭剂部分(BHQ1)标记。
扩增混合物在50-µL最终反应体积中含有1× PCR缓冲液、52.5 mM Tris-HCl、4mM MgCl2、0.8 mM dNTP、0.5 µM的每种寡核苷酸引物(F_egfr_trP1、R_egfr_b1_A、F_chr1_trP1和R_chr1_b1_A)、0.2 µM的每种探针(EGFR探针和Chr1探针)、0.6μM的ROX染料和11单位的Taq聚合酶(Taq gold)。使用20 ng纯化的基因组DNA作为模板的样品输入。
使用如下的温度循环曲线进行实时PCR循环:94℃持续10分钟;4个循环的92℃持续30秒,60℃持续30秒;46个循环的92℃持续30秒,62℃持续30秒,58℃持续40秒。在46个循环中的每一个之后,用适当的能量源激发样品,并获得荧光发射信号。从实时扩增收集的数据(图5)显示,靶向染色体7(图5A)和染色体1(图5B)的两组寡核苷酸引物产生预期在扩增期间在反应中积累的靶标特异性的产物(例如,扩增子) 。
实施例3-核酸片段大小分析
在开发本文提供的技术期间,使用发夹寡核苷酸引物(例如,如实施例1中所述)进行扩增(例如,PCR),并且分析扩增产物以确定其大小分布(例如,使用Bioanalyzer 2100***(Agilent Technologies))。如实施例2中所述进行扩增,除了反应混合物不含实时PCR组分、探针和ROX染料。使用Agilent高灵敏度DNA芯片测定产生的扩增产物的大小。
在多个扩增循环之后,预期扩增产生具有不同大小的异质产物群体。对于本实施例中使用的特定寡核苷酸引物和模板,对于EGFR(染色体7)扩增预期约176 bp(参见例如,图6B,形式I和II)、200 bp(参见例如,图6B,形式III)、203 bp(参见例如,图6B,形式IV)和227 bp(参见例如,图6B,形式V)的示例性(例如,优势的)中间产物和/或终点产物,并且对于染色体1扩增预期约191 bp(参见例如,图6B,形式I和II)、215 bp(参见例如,图6B,形式III)、218 bp(参见例如,图6B,形式IV)和242 bp (参见例如,图6,形式V)的产物。将预期产物的预测大小与约183 bp、194 bp、202 bp和214 bp的实验测量的大小进行比较(图6A)。实验测量的片段大小(图6A)与反应将包含具有各种大小的产物的异质群体(图6B)的预期一致。
扩增之后,用酶处理扩增产物以将异质扩增子群体(参见例如,图6)转化(例如,填入单链区域、去除未分辨的发夹结构等)为更均质的产物群体(比较,例如,图7B与图6B)。酶促处理后的EGFR和染色体1产物的预测大小(例如,参见图7B)分别为176 bp和191 bp。扩增产物用λ核酸外切酶和Klenow DNA聚合酶在37℃下处理20分钟。处理之后,对产物进行片段分析。收集的数据显示,对于双重反应中的每种靶标,酶促处理将EGFR和染色体1扩增的异质扩增产物转化为最终单一扩增子形式(图7A)。转化后,样品包含主要分别为176-bp和191-bp形式的EGFR和染色体1扩增产物(图7A)。这些形式是具有限定末端的双链线性形式,如图7B的示意图所示。
实施例4-NGS扩增子文库的产生
在开发本文提供的技术的实施方案期间,进行实验以将如本文所述的发夹寡核苷酸引物与用于产生NGS扩增子文库的现有融合寡核苷酸技术进行比较。设计并合成如本文所述的发夹寡核苷酸引物(F_egfr_trP1、R_egfr_b1_A、R_egfr_trP1和F_egfr_b1_A)(表4)。
此外,设计并合成标准融合寡核苷酸引物(Ion Torrent融合引物)(表5)以扩增与所述发夹寡核苷酸相同的靶区域。两种类型的寡核苷酸引物用于产生NGS的扩增子(例如,使用Life Technologies Ion Torrent PGM测序仪)。
表4-用于NGS扩增子文库的寡核苷酸
在表4中,星号(“*”)指示硫代磷酸酯键,且“p”指示磷酸酯基(例如,来自典型的寡核苷酸合成的磷酸酯基)。
表5-用于NGS扩增子文库的标准寡核苷酸
为了比较如由本文所述的技术提供的发夹寡核苷酸引物与标准寡核苷酸融合引物,使用所述发夹寡核苷酸引物(表4)进行四重扩增反应。将扩增反应混合物与以下组分混合,所述组分在此作为反应混合物中的最终浓度提供:1× PCR缓冲液、52.5 mM Tris-HCl、4 mM MgCl2、0.8 mM dNTP、0.25 µM的每种发夹寡核苷酸引物和15单位的Taq聚合酶(例如,Taq gold),在50-μL最终反应体积中。使用20 ng纯化的基因组DNA作为模板的样品输入。使用以下温度循环概况进行扩增反应循环:95℃持续10分钟;40个循环的95℃持续20秒,70℃持续5秒,57℃持续45秒,62℃持续45秒。扩增之后,扩增产物用λ核酸外切酶和Klenow DNA聚合酶在37℃下处理20分钟。
使用标准融合寡核苷酸引物(Ion Torrent融合引物)进行平行四重扩增反应。使用标准融合寡核苷酸引物的这些反应使用与上面针对发夹寡核苷酸引物所述相同的反应条件,除了如下温度循环的微小变化:94℃持续10分钟;4个循环的92℃持续30秒,60℃持续30秒;23个循环的92℃持续30秒,62℃持续30秒,58℃持续40秒。发夹寡核苷酸引物和标准融合寡核苷酸引物NGS文库均在珠粒上克隆扩增(例如,使用Life Technologies One-Touch机器(ePCR)),随后富集(例如,在富集工作站上),然后测序(例如,在Ion TorrentPGM测序仪上)。在测序仪上处理代表在不同文库生成条件下产生的文库的多个运行,并且通过比较序列映射效率评价文库生成的性能(图8)。收集的数据表明,用标准融合引物(图8,标记为“离子融合引物”的柱)产生的扩增子文库导致比用发夹寡核苷酸引物(图8,标记为“AM OS引物”的柱)或用标准适配子连接方法(图8,标记为“Ion frag. Lib. (适配连接)”的柱)产生的文库更高数量的未映射读数。具体而言,从融合引物方法产生的文库产生具有66.6/33.4、34.2/65.8、42.0/58.0和88.4/11.6的映射/未映射读数(以百分数计)的序列;通过适配子连接方法产生的文库产生具有96.4/3.6的映射/未映射读数(以百分数计)的序列;并且从如本文所述的发夹引物和相关方法产生的文库产生具有99.0/1.0、98.7/1.3和98.6/1.4的映射/未映射读数(以百分数计)的序列(图8)。
实施例5 - 拷贝数变异的检测
在开发本文提供的技术期间,进行实验,其中本技术用于测定测试样品中的拷贝数变异(CNV)。测试样品是源自胶质母细胞瘤肿瘤组织的两个纯化的基因组DNA样品(样品384和样品356),其具有通过EGFR基因的荧光原位杂交预先确定的DNA拷贝数状态。样品384具有EGFR基因的大于5×扩增,且样品356没有EGFR基因的扩增。
设计并合成发夹寡核苷酸引物以产生用于双向DNA测序(例如,使用LifeTechnologies Ion Torrent PGM测序仪装置)的NGS扩增子文库。引入条形码序列以实现两个样品的多重测序和随后的来自多重测序的序列读数数据的解复用或解卷积。在表6中,b1表示包含条形码序列号1(“条形码1”)的寡核苷酸,b3表示包含条形码序列号3(“条形码3”)的寡核苷酸。
为了制备扩增子文库,平行制备两个扩增反应,然后混合(参见例如,图9)。在第一反应中,使用包含第一条形码(条形码1)的发夹寡核苷酸引物从样品384制备第一扩增子文库。在第二反应中,使用包含第二条形码(条形码3)的发夹寡核苷酸引物从样品356制备第二扩增子文库。40个温度循环用于两个扩增反应(花费约110分钟的时间)。将这两个扩增的产物组合以提供包含扩增产物的组合合并物的样品。将组合的扩增产物用λ核酸外切酶和Klenow DNA聚合酶在37℃下处理20分钟,然后清洁(例如,用Ampure珠粒)以除去未并入的核苷酸、引物等。评价经清洁的样品(例如,使用Bioanalyzer 2100 (AgilentTechnologies))的质量和片段大小分布,然后在将样品引入用于珠粒上克隆扩增的测序流程(例如,使用Life Technologies One-Touch机器(ePCR))。将发夹寡核苷酸引物扩增子文库克隆扩增(例如,在珠粒上使用Life Technologies One-Touch仪器(ePCR)),随后富集(例如,在富集工作站上),然后测序(例如,在Ion Torrent PGM测序仪上)。
表6 - 用于分析CNV的发夹寡核苷酸
测试从不同文库生成条件制备的两个多重运行。具体而言,将单管多重扩增(“运行1”)与多个单独的单路扩增(“运行2”)的合并进行比较。首先通过比较序列映射效率评价文库产生的性能。数据表明,对于所有运行,大于98.5%的原始读数被映射至参考序列(图10)。在图10中,柱1显示样品B1-356的运行1和运行2的映射和未映射读数,柱2显示样品B3-384的运行1和运行2的映射和未映射读数,柱3显示样品B1-356的运行1和运行2的映射和未映射读数,且柱4显示样品B3-384的运行1和运行2的映射和未映射读数。
然后使用条形码信息将序列读数与制备其的样品(样品384或样品356)相关联。将来自EGFR或来自染色体1的特定序列读数进行计数并均一化以评价EGFR相比于充当对照的染色体1的拷贝数的相对拷贝数状态(图11)。
此外,将来自样品356的序列计数数据用作参照,以确定EGFR和染色体1的相对拷贝数。然后使用该相对拷贝数来提供用于将样品384的EGFR拷贝数均一化的调整因子。
对于两次运行,样品384的均一化的拷贝数分别为33.6个拷贝和35.7个拷贝(图11)。
实施例6 - 包含PEG的发夹引物
在开发本文提供的技术期间,设计(图12)并测试(图13)包含聚乙二醇(PEG)接头的发夹寡核苷酸。考虑包含PEG接头的发夹寡核苷酸可用于使用聚合酶(例如,高保真聚合酶)的扩增反应(例如,如本文所述),所述聚合酶包含校对活性、3'核酸外切酶活性和/或链置换活性,但缺乏5'核酸外切酶活性。
在这些设计中,发夹寡核苷酸引物的环部分包含PEG接头,而不是连接的核苷酸(图12)。DNA-PEG连接终止聚合酶延伸。在一些实施方案中,发夹寡核苷酸包含尿嘧啶残基,其提供使用酶诸如尿嘧啶-DNA糖基化酶(UDG)和核酸内切酶VIII在适当的扩增阶段切除发夹寡核苷酸引物的部分,以除去最终扩增子中的PEG部分。
进行实验,表明基于PEG的环增加了扩增反应的部分期间的杂交和/或反应动力学,这导致产生扩增子的效率增加(图13)。为了比较使用具有PEG环的发夹引物(图12,“OS-s-引物(PEG环)”)的扩增和无PEG环的发夹引物(图12,“OS-引物(DNA环)”)的扩增,设计引物,并在扩增反应中测试。两种类型的发夹引物包含相同的单链引发区域和相同的双链体区域,除了PEG环引物在双链体中包含尿嘧啶残基“U”。PEG环发夹引物还包含靠近或邻近环区域的尿嘧啶(“U”)(参见图12)。使用PEG发夹引物的扩增比不包含PEG环的等同发夹引物多产生约5000-10,000个扩增子(如通过以pg计的质量所测量)(图13)。
对于所有目的,上述说明书中提及的所有出版物和专利通过引用以其整体并入本文。所述技术的所述组合物、方法和用途的多种修饰和变更将对本领域技术人员显而易见而不脱离所述技术的范围和精神。尽管所述技术已结合具体的示例性实施方案进行描述,但应理解的是所要求保护的本发明不应被过度地限制于这些具体的实施方案。实际上,对本领域技术人员显而易见的所述用于实施本发明的方式的多种修饰意在落入所附权利要求书的范围内。

Claims (59)

1.发夹寡核苷酸,其包含:
a) 包含扩增子特异性引发区段的单链区域;
b) 包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;
c) 环区域;
d) 阻断剂部分;
e) 荧光部分;和
f) 猝灭部分,
其中所述第二自身互补区域包含所述荧光部分和所述猝灭部分。
2.权利要求1的发夹寡核苷酸,其中所述阻断剂部分位于或接近所述单链环区域和所述双链双链体区域的连接处。
3.权利要求1的发夹寡核苷酸,其包含标签。
4.权利要求1的发夹寡核苷酸,其包含适配子序列。
5.权利要求1的发夹寡核苷酸,其包含通用序列。
6.权利要求3的发夹寡核苷酸,其中所述标签包含接头、索引、捕获序列、限制性位点、引物结合位点或抗原。
7.权利要求1的发夹寡核苷酸,其中所述环区域包含单链环区域或聚乙二醇接头。
8.权利要求1的发夹寡核苷酸,其包含索引序列。
9.权利要求1的发夹寡核苷酸,其中所述阻断剂部分是核酸外切酶抗性的。
10.权利要求1的发夹寡核苷酸,其中所述阻断剂部分是硫代磷酸酯键。
11.权利要求1的发夹寡核苷酸,其中所述阻断剂部分是肽-核酸键。
12.权利要求1的发夹寡核苷酸,其中所述荧光部分选自呫吨、荧光素、罗丹明、BODIPY、花菁、香豆素、芘、酞菁、FAM、VIC、JOE、Cy3、Cy5、Cy3.5、Cy5.5、TAMRA、ROX、HEX或藻胆蛋白。
13.权利要求1的发夹寡核苷酸,其中所述猝灭部分是黑洞猝灭剂或爱荷华黑猝灭剂。
14.权利要求1的发夹寡核苷酸,其中所述猝灭部分选自BHQ-0、BHQ-1、BHQ-2和BHQ-3。
15.权利要求1的发夹寡核苷酸,其中所述双链双链体区域包含错配。
16.权利要求1的发夹寡核苷酸,其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在等于或高于变性温度下不杂交。
17.权利要求1的发夹寡核苷酸,其中所述第一自身互补区域和所述第二自身互补区域在扩增反应中在低于变性温度下杂交。
18.反应混合物,其包含根据权利要求1所述的发夹寡核苷酸和模板,其中所述单链区域与所述模板杂交,且所述第一自身互补区域与所述第二自身互补区域杂交。
19.扩增子,其包含衍生自模板的序列和衍生自根据权利要求1所述的发夹寡核苷酸的适配子。
20.扩增子,其包含:
1) 衍生自模板的序列;和
2) 衍生自根据权利要求1所述的发夹寡核苷酸的适配子;
且缺乏:
3) 衍生自所述发夹寡核苷酸的第二自身互补序列;
4) 荧光部分;和
5) 猝灭剂部分。
21.权利要求20的扩增子,其进一步包含标签。
22.权利要求20的扩增子,其进一步包含索引序列。
23.反应混合物,其包含权利要求20的扩增子和游离荧光部分。
24.权利要求18的反应混合物,其进一步含有包含核酸外切酶活性的聚合酶。
25.权利要求18的反应混合物,其进一步包含dATP、dCTP、dGTP和dTTP单体。
26.权利要求18的反应混合物,其进一步包含第二引物。
27.权利要求18的反应混合物,其进一步包含第二引物,其中所述第二引物是发夹寡核苷酸,其包含:
a) 包含扩增子特异性引发区段的单链区域;
b) 包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;
c) 单链环区域;和
d) 阻断剂部分。
28.用于产生包含扩增子的测序文库的方法,所述方法包括:
a) 提供包含根据权利要求1所述的发夹寡核苷酸和待测序的核酸的反应混合物;和
b) 将所述反应混合物暴露于适于产生扩增子的条件。
29.根据权利要求28所述的方法,其中所述反应混合物进一步含有包含核酸外切酶活性的聚合酶。
30.根据权利要求28所述的方法,其进一步包括监测所述荧光部分的发射波长处的荧光信号。
31.根据权利要求28所述的方法,其进一步包括提供第二引物,其中所述第二引物是发夹寡核苷酸,其包含:
a) 包含扩增子特异性引发区段的单链区域;
b) 包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;
c) 单链环区域;和
d) 阻断剂部分。
32.根据权利要求28所述的方法,其进一步包括将所述扩增子测序以产生核苷酸序列,其中所述核苷酸序列包含来自所述核酸的序列和索引序列。
33.根据权利要求32所述的方法,其进一步包括将所述核苷酸序列与样品相关联。
34.根据权利要求28所述的方法,其进一步包括混合第一扩增子和第二扩增子以产生多重测序文库。
35.根据权利要求28所述的方法,其进一步包括定量扩增子的量以提供于测序文库中。
36.用于多重测序的方法,所述方法包括:
a) 提供包含第一核苷酸序列的第一扩增子,所述第一核苷酸序列包含第一靶序列和衍生自发夹寡核苷酸的标签,其中所述标签包含第一索引序列;
b) 提供包含第二核苷酸序列的第二扩增子,所述第二核苷酸序列包含第二靶序列和衍生自发夹寡核苷酸的标签,其中所述标签包含第二索引序列;和
c) 混合所述第一扩增子和所述第二扩增子以产生多重测序文库。
37.根据权利要求36所述的方法,其进一步包括将多重测序文库测序以产生包含第一核苷酸序列和第二核苷酸序列的一组核苷酸序列。
38.根据权利要求37所述的方法,其进一步包括通过将与所述第一索引序列关联的第一核苷酸序列分配至第一样品且将与第二索引序列关联的第二核苷酸序列分配至第二样品来将核苷酸序列组去多重化。
39.用于多重测序的方法,其包括:
a) 在单个反应室中将多个扩增子测序以产生多个核酸序列,其中所述扩增子由两个或更多个不同样品产生;和
b) 基于所述多个核酸序列中的每个序列中含有的索引序列鉴定产生每个所述核酸序列的样品,其中每个索引序列由根据权利要求1所述的发夹寡核苷酸提供。
40.用于产生包含适配子标记的扩增子的测序文库的试剂盒,所述试剂盒包含:
a) 多个根据权利要求1所述的发夹寡核苷酸,其中所述多个发夹寡核苷酸中每一个包含多个索引序列中的至少一个;
b) 包含核酸外切酶活性的聚合酶。
41.用于产生核苷酸序列的***,所述***包含:
a) 包含扩增子的测序文库,其中所述扩增子包含衍生自靶核酸的核苷酸序列和衍生自根据权利要求1所述的发夹寡核苷酸的序列;
b) 热循环仪装置;和
c) 用于分析核苷酸序列和将多个核苷酸序列去多重化的计算机。
42.根据权利要求42所述的***,其进一步包含荧光检测器。
43.用于下一代测序的文库,其包含多个核酸,每个核酸包含衍生自靶核酸的核苷酸序列和衍生自根据权利要求1所述的发夹寡核苷酸的序列。
44.通过根据权利要求28的方法制备的用于下一代测序的文库。
45.发夹寡核苷酸,其包含:
a) 包含扩增子特异性引发区段的单链区域;
b) 包含与第二自身互补区域杂交的第一自身互补区域的双链双链体区域;和
c) 单链环区域和阻断剂部分或PEG接头。
46.权利要求46的发夹寡核苷酸,其包含标签。
47.权利要求46的发夹寡核苷酸,其包含适配子序列。
48.权利要求46的发夹寡核苷酸,其包含通用序列。
49.权利要求47的发夹寡核苷酸,其中所述标签包含接头、索引、捕获序列、限制性位点、引物结合位点或抗原。
50.权利要求46的发夹寡核苷酸,其包含索引序列。
51.权利要求46的发夹寡核苷酸,其中所述阻断剂部分是核酸外切酶抗性的。
52.权利要求46的发夹寡核苷酸,其中所述阻断剂部分是硫代磷酸酯键。
53.权利要求46的发夹寡核苷酸,其中所述阻断剂部分是肽-核酸键。
54.权利要求46的发夹寡核苷酸,其包含荧光部分。
55.权利要求46的发夹寡核苷酸,其包含选自呫吨、荧光素、罗丹明、BODIPY、花菁、香豆素、芘、酞菁、FAM、VIC、JOE、Cy3、Cy5、Cy3.5、Cy5.5、TAMRA、ROX、HEX或藻胆蛋白的荧光部分。
56.权利要求46的发夹寡核苷酸,其包含猝灭剂部分。
57.权利要求46的发夹寡核苷酸,其包含猝灭部分,所述猝灭部分是黑洞猝灭剂或爱荷华黑猝灭剂。
58.权利要求46的发夹寡核苷酸,其包含选自BHQ-0、BHQ-1、BHQ-2和BHQ-3的猝灭部分。
59.权利要求46的发夹寡核苷酸,其中所述双链双链体区域包含错配。
CN201580043570.1A 2014-08-14 2015-08-14 多功能寡核苷酸 Pending CN106715715A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462037331P 2014-08-14 2014-08-14
US62/037331 2014-08-14
PCT/US2015/045345 WO2016025878A1 (en) 2014-08-14 2015-08-14 Multifunctional oligonucleotides

Publications (1)

Publication Number Publication Date
CN106715715A true CN106715715A (zh) 2017-05-24

Family

ID=55304684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580043570.1A Pending CN106715715A (zh) 2014-08-14 2015-08-14 多功能寡核苷酸

Country Status (5)

Country Link
US (1) US20160115473A1 (zh)
EP (1) EP3180448A4 (zh)
CN (1) CN106715715A (zh)
CA (1) CA2955967A1 (zh)
WO (1) WO2016025878A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110770356A (zh) * 2017-06-20 2020-02-07 生物辐射实验室股份有限公司 使用珠寡核苷酸的mda
CN112175940A (zh) * 2019-07-03 2021-01-05 华大青兰生物科技(无锡)有限公司 一种基于外切酶的寡核苷酸纯化方法
CN110770356B (zh) * 2017-06-20 2024-06-07 生物辐射实验室股份有限公司 使用珠寡核苷酸的mda

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101947138B1 (ko) * 2017-05-02 2019-02-12 김성현 멀티플렉스 pcr에 유용한 고온 활성 프라이머 및 이를 이용한 핵산 증폭 방법
US20210156048A1 (en) * 2018-04-05 2021-05-27 Massachusetts Eye And Ear Infirmary Methods of making and using combinatorial barcoded nucleic acid libraries having defined variation
CN113767178A (zh) * 2019-03-11 2021-12-07 10X基因组学有限公司 用于处理光学标签化珠粒的***和方法
CA3188197A1 (en) * 2020-09-11 2022-03-17 Andrew Slatter Methods of enriching a target sequence from a sequencing library using hairpin adaptors
WO2022060982A1 (en) * 2020-09-17 2022-03-24 Nuprobe Usa, Inc. Occlusion primers and occlusion probes

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998002499A1 (fr) * 1996-07-15 1998-01-22 Rhodia Chimie Fluide comprenant des nanofibrilles de cellulose et son application pour l'exploitation de gisements petroliers
US20090325169A1 (en) * 2008-04-30 2009-12-31 Integrated Dna Technologies, Inc. Rnase h-based assays utilizing modified rna monomers
US20110212846A1 (en) * 2010-02-09 2011-09-01 UniTag Bio Methods and compositions for universal detection of nucleic acids
CN103890245A (zh) * 2011-05-20 2014-06-25 富鲁达公司 核酸编码反应

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6117635A (en) * 1996-07-16 2000-09-12 Intergen Company Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon
WO2004068112A2 (en) * 2003-01-28 2004-08-12 Gorilla Genomics, Inc. Hairpin primer amplification
WO2007067151A1 (en) * 2005-12-05 2007-06-14 Temasek Life Sciences Laboratory Limited Fluorescent primer system for detection of nucleic acids (q priming)

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998002499A1 (fr) * 1996-07-15 1998-01-22 Rhodia Chimie Fluide comprenant des nanofibrilles de cellulose et son application pour l'exploitation de gisements petroliers
US20090325169A1 (en) * 2008-04-30 2009-12-31 Integrated Dna Technologies, Inc. Rnase h-based assays utilizing modified rna monomers
US20110212846A1 (en) * 2010-02-09 2011-09-01 UniTag Bio Methods and compositions for universal detection of nucleic acids
CN103890245A (zh) * 2011-05-20 2014-06-25 富鲁达公司 核酸编码反应

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110770356A (zh) * 2017-06-20 2020-02-07 生物辐射实验室股份有限公司 使用珠寡核苷酸的mda
CN110770356B (zh) * 2017-06-20 2024-06-07 生物辐射实验室股份有限公司 使用珠寡核苷酸的mda
CN112175940A (zh) * 2019-07-03 2021-01-05 华大青兰生物科技(无锡)有限公司 一种基于外切酶的寡核苷酸纯化方法

Also Published As

Publication number Publication date
WO2016025878A1 (en) 2016-02-18
CA2955967A1 (en) 2016-02-18
EP3180448A4 (en) 2018-01-17
EP3180448A1 (en) 2017-06-21
US20160115473A1 (en) 2016-04-28

Similar Documents

Publication Publication Date Title
US20210062186A1 (en) Next-generation sequencing libraries
US9249460B2 (en) Methods for obtaining a sequence
CN106715715A (zh) 多功能寡核苷酸
ES2626058T3 (es) Cebadores y métodos de amplificación
US20130184165A1 (en) Genotyping by next-generation sequencing
KR102592367B1 (ko) 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법
CN105934523A (zh) 核酸的多重检测
CN110914449B (zh) 构建测序文库
US7303867B2 (en) Method for detecting target nucleotide sequences
CN107614704A (zh) 采样测序
JP2023518217A (ja) 標的核酸を検出するためのループプライマー及びループ・デ・ループ方法
US20220145287A1 (en) Methods and compositions for next generation sequencing (ngs) library preparation
CN109477139A (zh) 使用长ssDNA多核苷酸作为PCR测定中的引物的方法
Thaenkham et al. PCR and DNA Sequencing: Guidelines for PCR, Primer Design, and Sequencing for Molecular Systematics and Identification
Rushton Enzymatic DNA modifications for genetic diagnostics
Wood Mitochondrial Haplogrouping and Short Tandem Repeat Analyses in Anthropological Research using Next-Generation Sequencing Technologies
In SARS-CoV-2 Molecular Tests: From PCR to LAMP with a Dash of CRISPR

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170524

WD01 Invention patent application deemed withdrawn after publication