CN110777195A - 采用一组snp的人身份识别 - Google Patents

采用一组snp的人身份识别 Download PDF

Info

Publication number
CN110777195A
CN110777195A CN201911020094.8A CN201911020094A CN110777195A CN 110777195 A CN110777195 A CN 110777195A CN 201911020094 A CN201911020094 A CN 201911020094A CN 110777195 A CN110777195 A CN 110777195A
Authority
CN
China
Prior art keywords
target
primer
nucleic acid
amplification
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911020094.8A
Other languages
English (en)
Inventor
R·拉伽斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Inc
Life Technologies Corp
Original Assignee
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Inc filed Critical Life Technologies Inc
Publication of CN110777195A publication Critical patent/CN110777195A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/531Glycosylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/131Modifications characterised by incorporating a restriction site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了对一个或多个核酸的多重PCR有用的方法、组合物、试剂盒、***和设备,所述一个或多个核酸属于用于识别人身份的一组单核苷酸多态性(SNPs)。具体地,提供了允许选择性扩增该组中的一个或多个靶序列的各种靶特异性引物。在一些方面,采用所公开的方法、试剂盒、***和设备获得的扩增的靶序列可以被用于包括核酸测序的各种下游过程并可以被用于识别人身份。

Description

采用一组SNP的人身份识别
本申请是申请日为2013年7月15日、申请号为201380046949.9、发明名称为“采用一组SNP的人身份识别”的发明专利申请的分案申请。
相关申请的交叉参考
本申请引入发明人为John Leamon、Mark Andersen和Michael Thornton的、标题为“用于多重PCR的方法和组合物”、于2012年4月27日提交的美国申请序列号13/458,739的全文作为参考。
技术领域
在一些实施方案中,本公开内容一般性涉及扩增含有多个靶序列的样品内的一个或多个靶序列以识别人身份的方法、组合物、***、设备和试剂盒。任选地,多个靶序列(例如,至少10、20、30、40、50、60、70、80、90、100、110、120、130或更多个序列)在单个扩增反应内进行扩增。在一些实施方案中,本公开内容一般性涉及用于从单个来源(如基因组DNA、***固定石蜡包埋(FFPE)DNA或法医样品)扩增一个或多个靶序列的方法、组合物、***、设备和试剂盒。具体地,公开了有效用于采用具有可切割基团的引物扩增一个或多个靶序列的方法、试剂盒、***、设备和组合物。
发明背景
几种生物学应用设计在群体内选择性扩增核酸分子。例如,下一代测序方法可设计在大群核酸分子内选定靶标的分析。对于这样的应用,增加在单个扩增反应内从群体选择性扩增的靶标的总数可能是有用的。这样的选择性扩增典型地通过能够与特定靶核酸分子选择性杂交或选择性促进其扩增的一个或多个引物的使用来实现。这样的选择性扩增可能由于扩增假体(art ifact)的形成(如引物二聚体等)而变得复杂。这样的扩增假体的形成(本文也称为非特异性扩增产物)可以消耗关键扩增试剂,例如,核苷酸、聚合酶、引物等。另外,这样的假体可相对于预期产物频繁具有更短的长度,在这样的情况下可比预期产物更有效地扩增并支配反应输出。选择性扩增还可能由于‘超级扩增子’的形成(即延长的扩增子的形成)而变得复杂,其可以在第一引物的延伸通过相邻的靶核酸序列延长时发生,从而创造长的非特异性扩增产物,其可以作为与第二引物延伸的模板。在扩增反应中这样的假体的形成,即使当仅采用单个引物对时,可以使得下游应用(如qPCR、克隆、基因表达分析和用于下一代测序的样品制备)复杂化。因为该假体会在二次扩增过程中被进一步放大,所以在一些下游应用中,包括几种下一代测序方法,这样的问题会由于要求进行二次扩增步骤而被加重。例如,下游测序应用可以涉及克隆扩增的核酸群体的产生,其被分别附着到分离的支持物(如珠),采用乳液PCR(“emPCR”)和通过阳性选择所进行的针对克隆扩增子的富集。在这样的应用中,该假体可以通过文库产生过程一路被带到emPCR阶段,产生包括非特异性扩增产物的DNA捕获珠。用含有模板的珠在富集过程中可以选择这些含有假体的珠,但它们是遗传上无信息的。
在多重PCR反应中扩增的核酸分子可以在有或者没有进一步纯化或操作的情况下被用于多个下游分析或测定。例如,以足够的产率获得的多重PCR反应的产物(扩增子)可以被用于单核苷酸多态性(SNP)分析、基因分型、拷贝数变异分析、表观遗传分析、基因表达分析、杂交阵列、基因突变的分析(包括但不限于疾病状态的检测、预后和/或诊断)、稀有或低频等位基因突变的检测和分析、核酸测序(包括但不限于从头(de novo)测序或靶向重新测序)等。
示例性下一代测序***包括Ion Torrent PGMTM测序仪(Life Technologies)和Ion Torrent ProtonTM测序仪(Life Technologies),其为基于离子的测序***,其通过检测作为核苷酸掺入的副产物所产生的离子来对核酸模板进行测序。典型地,氢离子是作为在通过聚合酶进行模板依赖性核酸合成过程中发生的核苷酸掺入的副产物而释放的。IonTorrent PGMTM测序仪和离子质子TM测序仪通过检测核苷酸掺入的氢离子副产物来检测核苷酸掺入。Ion Torrent PGMTM测序仪和离子质子TM测序仪包括要被测序的多个核酸模板,每个模板位于阵列中各自测序反应孔内。阵列的每个孔偶联了至少一个离子传感器,其能够检测作为核苷酸掺入的副产物所产生的H+离子的释放或溶液pH的变化。离子传感器包含场效应晶体管(FET),其被偶联至能够感知H+离子的存在或溶液pH的变化的离子敏感性检测层。该离子传感器提供指示核苷酸掺入的输出信号,其可表示为幅度与各自孔或反应室中的H+离子浓度相关的电压变化。不同类型的核苷酸被连续流入该反应室,并且通过聚合酶以由模板的序列所确定的顺序被掺入延伸的引物(或聚合位点)。每个核苷酸掺入伴随反应孔中H+离子的释放,以及伴随的局部pH的变化。H+离子的释放由传感器的FET记录,其产生指示核苷酸掺入的发生的信号。在特定的核苷酸流的过程中没有被掺入的核苷酸不会产生信号。来自FET的信号的振幅还可以与掺入延伸的还是分子的特定类型的核苷酸数目相关,从而运行均聚物区域要被解析。因此,在测序仪运行过程中,与跨多个孔或反应室的掺入监测一起,进入反应室的多个核苷酸流允许仪器同时解析多个核酸模板的序列。关于IonTorrent PGMTM测序仪的组成、设计和操作的进一步的细节可以见于例如美国专利申请序列号12/002781(现在以美国专利公开号2009/0026082公开)、美国专利申请序列号12/474897(现在以美国专利公开号2010/0137143公开)和美国专利申请序列号12/492844(现在以美国专利公开号2010/0282617公开),所有这些申请全文作为参考引入。在一些实施方案中,扩增子可以通过桥扩增或emPCR***作或扩增以产生多个克隆模板,其适于各种下游过程(process)(包括核酸测序)。在一个实施方案中,要被采用Ion Torrent PGMTM或IonTorrent ProtonTM***测序的核酸模板可以采用本文所述的靶特异性扩增技术中的一个或多个从核酸分子群体进行制备。任选地,接着靶特异性扩增,可以进行二次和/或三级扩增过程包括但不限于文库扩增步骤和/或克隆扩增步骤(如emPCR)。
当所期望的(desired)在样品核酸群体内扩增的核酸靶标的数量增加时,选择性扩增这些靶标同时避免不期望的扩增假体的挑战会相应增加。例如,包括引物二聚体和超级扩增子的假体的形成在针对多个靶标的PCR引物被合并在单个反应管中并且共扩增的多重PCR反应中会是更大的问题。在多重PCR中,以相对于模板DNA提高的浓度的另外的引物对的存在使得引物-引物发生相互作用,并且更容易形成引物二聚体和其它假体。
目前在核酸扩增过程中用于避免或减少假体(如引物二聚体)形成的方法以包围引物设计过程为中心,并经常利用专门的软件包(例如,DNA软件的可视OMP、MultiPLX、ABI's Primer Express等)来设计引物对,其被预测为在扩增过程中在池(pool)中显示与其它引物之间最小的相互作用。通过使用这样的软件,引物可以被设计为尽可能地靶特异性或扩增子特异性,并经常被分组成子集以尽量减少引物-引物相互作用、引物二聚体形成和超级扩增子。但是,严格的设计参数限制了可被同时共扩增的扩增子的数量,并且在一些情况下可能干脆阻止一些扩增子的扩增。目前的其它方法需要使用多个PCR引物池以将引物分隔成不重叠的池以尽量减少或阻止扩增步骤过程中的引物假体。其它方法包括使用多个引物池或单个复杂反应来增强每个反应的扩增产物的总产率。在多重PCR反应中,每个引物对在扩增反应中与另外的引物对争夺有限量的dNTPs、聚合酶和其它试剂。因此,需要改善的方法、组合物、***、设备和试剂盒,其允许在核酸分子群体内选择性扩增多个靶核酸分子,同时避免或尽量减少假体(也称作非特异性扩增产物)(包括引物二聚体)的形成。还需要改善的方法、组合物、***、设备和试剂盒,其允许从单个核酸样品(如基因组DNA和/或)***固定石蜡包埋(FFPE)DNA选择性扩增多个靶核酸分子,同时避免或尽量减少假体的形成。本领域还需要改善的方法、组合物、***和试剂盒,其允许在单个反应中同时扩增成千上万的靶特异性核酸分子,其可以被用于任何可适用的下游测定或分析。
除非另外指出,否则本主题的实施可以采用有机化学、分子生物学(包括重组技术)、细胞生物学和生物化学的常规技术和说明,其是在本领域的技术范围内的。这样的常规技术包括但不限于合成多核苷酸的制备、聚合技术、聚合物颗粒的化学和物理分析、核酸文库的制备、核酸测序和分析等。合适的技术的具体说明参考本文所提供的例子进行使用。也可以使用其它等效的常规操作。这样的常规技术和说明可见于标准实验室手册,如Genome Analysis:A Laboratory Manual Series(Vols.I-IV)、PCR Primer:A LaboratoryManual,and Molecular Cloning:A Laboratory Manual(均来自Cold Spring HarborLaboratory Press)、Hermanson,Bioconjugate Techniques,Second Edition(AcademicPress,2008);Merkus,Particle Size Measurements(Springer,2009);Rubinstein andColby,Polymer Physics(Oxford University Press,2003)等。
除非另有定义,否则本文所使用的所有技术和科学术语具有本发明所属技术领域普通技术人员通常所理解的相同的含义。本文所引用的所有专利、专利申请、公开的申请、论文和其它出版物(上文和下文),全文都作为参考引入。如果本文所述的定义和/或说明与本文作为参考引入的专利、专利申请、公开的申请和其它出版物所述任何定义相反或以其它方式不一致,本文所述的定义和/或说明优先于作为参考引入的定义。
如本文所用,术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有(has)”、“具有(having)”或其任何其它变体,旨在涵盖非排他性的包括。例如,包含一系列特征的过程、方法、物品或设备不必仅限制于那些特征但可以包括这样的过程、方法、物品或设备的未明确列出或固有的其它特征。另外,除非明确有相反的说明,否则“或(or)”是指包含性的或而不是排他性的或。例如,条件A或B由以下任意一种情况满足:A是真(或存在)且B是假(或不存在)、A是假(或不存在)且B是真(或存在)和A和B均是真(或存在)。
本文所用的章节标题仅用于组织性目的,并且不应当被解释为以任何方式限制所述主题。
发明概述
在本发明的一个方面,提供了被配置为与人基因组的一组SNP区域特异性杂交的多个引物对,其中所述SPN区域的组选自表1的SNP区域,并且其中至少一个引物对中的至少一个引物包含可切割的核苷酸。在一些实施方案中,所述多个引物对被配置为与表1的条目1-136的一组SNPs杂交。在其它实施方案中,所述多个引物对被配置为与表1的条目1-103的一组SNPs杂交。在又一些其它实施方案中,所述至少一个引物对中的至少一个引物包含可切割的尿嘧啶核苷酸。
在本发明的另一个方面,提供了用于扩增样品内的多个不同靶序列的方法,其包括以下步骤:在单个扩增反应混合物内从包括多个不同靶序列的样品扩增所述多个不同靶序列,其中所述扩增包括在扩增条件下将所述样品中的至少一些部分接触多个靶特异性引物和聚合酶,从而产生扩增的多个靶序列,其中不同扩增的靶序列中的至少两个是彼此小于50%互补的,并且其中所述多个靶特异性引物中的至少一个和所述扩增的靶序列中的至少一个包括可切割的基团;切割所扩增的多个靶序列中的至少一个扩增的靶序列的可切割的基团;在平端连接反应中将至少一个接头连接至至少一个扩增的靶序列,从而产生一个或多个接头连接的扩增的靶序列,以及再扩增所述接头连接的扩增的靶序列中的至少一个。
在一些实施方案中,所述至少一个接头中的一个或多个基本上不与至少一个扩增的靶序列互补。在其它实施方案中,所述再扩增包括在扩增条件下将所述至少一个接头连接的扩增的靶序列与包括与所述接头或它们的互补序列中的至少一个互补的序列的一个或多个引物和聚合酶接触,从而产生至少一个再扩增的接头连接的扩增的靶序列。在又一些其它实施方案中,所述一个或多个接头或它们的互补序列中的至少一个基本上不与至少一个扩增的靶序列互补。本发明还提供了基本上与所述样品中的相应靶序列的至少一部分基本上互补的至少一个靶特异性引物。在其它实施方案中,被连接至所述扩增的靶序列中的至少一个的接头易受核酸外切酶消化。在又一些其它实施方案中,被连接至所述扩增的靶序列中的至少一个的接头不包括保护性基团。在又一些其它实施方案中,所述连接步骤包括在连接条件下将具有3'端和5'端的至少一个扩增的靶序列与包括一个或多个接头和连接酶的连接反应混合物接触,其中,在所述连接之前,所述连接反应混合物中的所述接头没有一个包括靶特异性序列。本发明还提供了所述连接步骤包括在连接条件下将至少一个扩增的靶序列与包括一个或多个接头和连接酶的连接反应混合物接触,其中,在将所述一个或多个接头连接到至少一个扩增的靶序列之前,所述连接反应混合物不包括一个或多个另外的寡核苷酸接头。在其它实施方案中,所述扩增步骤在所述连接步骤之前进一步包括消化步骤,从而产生多个具有5'磷酸基团的平端扩增的靶序列。
在一些实施方案中,本公开内容一般性涉及用于进行核酸的多重扩增的方法、组合物、***、设备和试剂盒。在一些实施方案中,所述方法包括扩增包括两个或更多个靶序列的样品内的多个靶序列。任选地,来自样品的感兴趣的多个靶序列可以在扩增条件下在聚合酶的存在下采用一个或多个靶特异性引物进行扩增以产生多个扩增的靶序列。所述扩增任选地包括在扩增条件下将包括至少一个靶序列的核酸分子与一个或多个靶特异性引物和至少一种聚合酶接触。所述接触可以产生一个或多个扩增的靶序列。
在一些实施方案中,本公开内容一般性涉及包含长度大约15个核苷酸至大约40个核苷酸的多个靶特异性引物的组合物,具有以下至少两个或更多个标准:位于基本上所有多个引物的3'端的可切割的基团、位于基本上所有多个引物的中央核苷酸附近或接近位置处的可切割的基团、基本上所有多个引物的5'端仅包括非可切割的核苷酸、最小的对多个引物中基本上所有引物的交叉杂交、最小的对样品中存在的非特异性序列的交叉杂交、最小的自身互补和最小的多个引物中基本上所有引物的3'端或5'端的核苷酸序列重叠。在一些实施方案中,所述组合物可以包括上述标准中的任意3、4、5、6或7个。
在一些实施方案中,本公开内容一般性涉及包含长度大约15个核苷酸至大约40个核苷酸的多个至少2种靶特异性引物的组合物,具有以下至少两个或更多个标准:位于基本上所有多个引物的中央核苷酸附近或接近位置处的可切割的基团、基本上所有多个引物的5'端仅包括非可切割的核苷酸、基本上所有多个引物具有跨引物全长的小于20%的核苷酸包含可切割的基团、至少一个引物具有跨其全长与样品中存在的靶序列互补的核酸序列、最小的对多个引物中基本上所有引物的交叉杂交、最小的对样品中存在的非特异性序列的交叉杂交和最小的多个引物中基本上所有引物的的3'端或5'端的核苷酸序列重叠。在一些实施方案中,所述组合物可以包括上述标准中的任意3、4、5、6或7个。
在一些实施方案中,本公开内容一般性涉及由用本文所公开的一个或多个靶特异性引物或采用本文所公开的引物选择标准所设计的一个或多个靶特异性引物扩增样品中存在的至少一个靶序列所产生的扩增产物。在一些实施方案中,本公开内容一般性涉及在扩增条件下将样品中至少一个靶序列与本文所公开的一个或多个靶特异性引物或采用本文所公开的引物选择标准所设计的一个或多个靶特异性引物接触所产生的扩增产物。在一些实施方案中,所述扩增产物可以包括与癌症或遗传性疾病相关的一个或多个突变。例如,疑似含有与至少一种癌症相关的一个或多个突变的样品可以进行本文所公开的所述扩增方法中的任意一个。从所选择的扩增方法所获得的扩增产物可以任选地与正常的或相对于所述至少一种癌症已知为非癌的匹配的样品进行比较,并因此可以被用作参考样品。在一些实施方案中,通过本文所公开的方法所获得的扩增产物可以任选地采用任何合适的核酸测序平台进行测序以确定扩增产物的核酸序列,并任选地与来自正常的或非癌的样品的测序信息进行比较。在一些实施方案中,扩增产物可以包括与抗生素抗性、致病性或遗传修饰相关的一个或多个标志物。在一些实施方案中,通过在扩增条件下将至少一个靶序列与至少一个靶特异性引物接触所获得的一个或多个扩增产物的核酸序列可以被用于确定在所述一个或多个扩增产物内遗传变体的存在或不存在。
在一些实施方案中,本公开内容一般性涉及用于进行核酸扩增和核酸合成的组合物(以及采用所公开的组合物的相关试剂盒、方法、***和设备)。在一些实施方案中,所述组合物包括多个靶特异性引物对,至少一个靶特异性引物对包括靶特异性正向引物和靶特异性反向引物。在一些实施方案中,所述组合物包括至少100、200、500、750、1000、2500、5000、7500、10000、12000、15000、17500、20000或50000个不同引物对,其中一些或所有均可以是靶特异性的。任选地,不同的靶特异性引物对中的至少两个针对(即,特异性针对)不同的靶序列。
在一些实施方案中,所述组合物包括能够特异性针对至少一个扩增的靶序列的至少一个靶特异性引物对。在一些实施方案中,所述组合物包括多个靶特异性引物对,至少两个靶特异性引物对特异性针对不同的扩增的靶序列。在一些实施方案中,所述组合物包括靶特异性引物对,其中引物对的每个成员包括能够与第一扩增的序列或其互补序列的至少一部分杂交的靶特异性引物,并且所述引物与样品中的任何其它的扩增的序列的3'端或5'端基本上不互补。在一些实施方案中,所述组合物包括与样品中的任何其它的核酸分子的部分可基本上不互补的至少一个靶特异性引物对。在一些实施方案中,所述组合物包括在靶特异性引物对内一个或多个位置包括一个或多个可切割的基团的多个靶特异性引物对。
在一些实施方案中,所述组合物包括能够扩增核苷酸多态性或其部分的一个或多个靶特异性引物对。例如,多个靶特异性引物对可以均匀地扩增一个基因、外显子、编码区、外显子组或其部分。在一些实施方案中,所述组合物包括靶特异性引物对,其被设计为尽量减少采用一个或多个靶特异性引物对所扩增的核苷酸序列的重叠。在一些实施方案中,在一个或多个靶特异性引物之间的核苷酸序列重叠可以在3'端、5'端或两端被尽量减少。在一些实施方案中,多个靶特异性引物中的至少一个引物在3'端、5'端或两端包括小于5个核苷酸的核苷酸序列重叠。在一些实施方案中,多个靶特异性引物的至少一个靶特异性引物包括与所述多个靶特异性引物相比至少一个核苷酸的核苷酸序列缺口。在一些实施方案中,所述组合物包括被设计为大量扩增一个或多个基因或外显子的一个或多个靶特异性引物对。例如,多个靶特异性引物对可以被设计为在单个基因或外显子中均匀地扩增(即,提供所有核苷酸的100%代表性)。
在一些实施方案中,本公开内容一般性涉及用于进行多重核酸扩增或多重核酸合成的试剂盒。在一些实施方案中,所述试剂盒包含多个靶特异性引物。在一些实施方案中,所述试剂盒可以进一步包括聚合酶、至少一个接头和/或切割试剂。在一些实施方案中,所述试剂盒还可以包括dATP、dCTP、dGTP、dTTP和/或抗体。一些实施方案中,所述切割试剂是能够在一个或多个靶特异性引物中切割一个或多个切割基团的任何试剂。一些实施方案中,所述切割试剂可以包括酶或化学试剂。一些实施方案中,所述切割试剂可以包括对无嘌呤碱基具有亲和力的酶。一些实施方案中,所述切割试剂可以包括对第一可切割的基团具有亲和力的第一酶并且可以进一步包括对第二可切割的基团具有亲和力的第二酶。在一些实施方案中,所述试剂盒可以进一步包括对无碱基位点具有亲和力的酶。在一些实施方案中,所述聚合酶是热稳定的聚合酶。在一些实施方案中,所述试剂盒可以包括一种或多种防腐剂、佐剂或核酸测序条形码(barcode)。
附图简述
附图(其被引入并形成说明书的一部分)示出了一个或多个示例性实施方案并用于解释各种示例性实施方案的原理。附图是示例性的并且仅仅是说明性的并且不应当被解释为任何方式的限制或约束。
图1是根据本公开内容采用可降解的扩增引物的方法的示例性实施方案的示意图。
图2是根据本公开内容获得靶特异性扩增子文库的方法的示例性实施方案的示意图。
图3示出了根据示例性实施方案用于设计引物或测定的***。
图4示出了根据示例性实施方案用于设计引物或测定的***。
图5示出了包括由根据示例性实施方案所设计的引物对包围的***序列的扩增子序列。
图6示出了包括由根据示例性实施方案所设计的引物对包围的***序列的扩增子序列(其可被本文称为“tile”)的PCR扩增。
图7示出了用于根据示例性实施方案的tiling和pooling的针对给定靶区域的一组候选扩增子(每个包括由引物对包围的***物)。
图8示出了根据示例性实施方案的方法。
发明详述
下面各种示例性实施方案的说明是示例性的并且仅仅是说明性的并且不应当被解释为任何方式的限制或约束。从说明书和附图和从权利要求书将可以明显看到本教导的其它实施方案、特征、目的和优点。
如本文所用,“扩增(amplify)”、“扩增(amplifying)”或“扩增反应”及其衍生词,通常是指任何动作或过程,由此核酸分子(称为模板核酸分子)的至少部分被复制或拷贝入至少一个另外的核酸分子。所述另外的核酸分子任选地包括与所述模板核酸分子的至少某些部分基本上相同或基本上互补的序列。所述模板核酸分子可以是单链或双链的,所述另外的核酸分子可以独立地为单链或双链的。在一些实施方案中,扩增包括用于生产所述核酸分子的至少某些部分的至少一个拷贝或生产与所述核酸分子的至少某些部分互补的核酸序列的至少一个拷贝的模板依赖性的体外酶催化反应。扩增任选地包括核酸分子的线性或指数复制。在一些实施方案中,采用等温条件进行这样的扩增;在其它实施方案中,这样的扩增可以包括热循环。在一些实施方案中,所述扩增是在单个扩增反应中包括多个靶序列的同时扩增的多重扩增。至少一些所述靶序列可以在所述单个扩增反应中位于同一核酸分子或不同靶核酸分子上。在一些实施方案中,“扩增”包括基于DNA和RNA的核酸的至少某些部分单独或组合的扩增。所述扩增反应可以包括单链或双链核酸底物并可以进一步包括任何本领域普通技术人员已知的扩增过程。在一些实施方案中,所述扩增反应包括聚合酶链式反应(PCR)。
如本文所用,“扩增条件”及其衍生词,通常是指适合扩增一个或多个核酸序列的条件。这样的扩增可以是线性的或指数的。在一些实施方案中,所述扩增条件可以包括等温条件或备选地可以包括热循环条件或等温和热循环条件的组合。在一些实施方案中,适合扩增一个或多个核酸序列的条件包括聚合酶链式反应(PCR)条件。典型地,所述扩增条件是指足以扩增核酸(如一个或多个靶序列)或扩增被连接至一个或多个接头的扩增的靶序列(例如,接头连接的扩增的靶序列)的反应混合物。通常,所述扩增条件包括用于扩增或用于核酸合成的催化剂(例如,聚合酶)、与要被扩增的所述核酸具有某种程度的互补性的引物和促进一旦与所述核酸杂交的引物的延伸的核苷酸(如脱氧核糖核苷酸三磷酸(dNTPs))。所述扩增条件可以需要引物与核酸的杂交或退火、所述引物的延伸和其中所延伸的引物与经历扩增的核酸序列分离的变性步骤。典型地,但不是必须的,扩增条件可以包括热循环;在一些实施方案中,扩增条件包括多个循环,其中退火、延伸和分离步骤被重复。典型地,所述扩增条件包括阳离子(如Mg++或Mn++(例如,MgCl2等))并且还可以包括离子强度的各种改性剂。
如本文所用,“靶序列”或“感兴趣的靶序列”及其衍生词,通常是指可根据本公开内容被扩增或合成的任何单链或双链核酸序列,包括疑似或预期存在于样品中的任何核酸序列。在一些实施方案中,所述靶序列以双链形式存在并且在加入靶特异性引物或所附接头之前包括要被扩增或合成的特定核苷酸序列的至少部分或其互补序列。靶序列可包括在扩增或合成反应中有用的引物可以在延伸之前通过聚合酶与其杂交的核酸。在一些实施方案中,该术语是指其序列同一性、核苷酸的排序或位置由本公开内容的一种或多种方法确定的核酸序列。
如本文所用,“样品”及其衍生词,以其最广泛的含义使用并包括疑似包括靶标的任意标本、培养物等。在一些实施方案中,所述样品包含DNA、RNA、PNA、LNA、嵌合、杂交或多元形式的核酸。所述样品可以包括含有一个或多个核酸的任何基于生物学的、临床的、外科的、农学的、大气的或水生的标本。该术语还包括任意分离的核酸样品,如基因组DNA、新鲜冷冻或***固定石蜡包埋的核酸标本。
如本文所用,“接触(contacting)”及其衍生词,当用于参考两个或更多个组分时,通常是指任何过程,由此促进或实现所参考的组分的接近(approach)、靠近(proximity)、混合(mixture)或合并(commingling)而无需这样的组分的物理接触,并且包括将含有所参考的组分的任意一个或多个的溶液互相混合。所参考的组分可以任意特定的顺序或组合被接触并且所述组分的特定顺序是非限制性的。例如,“将A与B和C接触”涵盖其中A首先与B然后与C接触的实施方案,以及其中C与A然后与B接触的实施方案,以及其中A和C的化合物与B接触的实施方案等。另外,这样的接触并不要求接触过程的最终结果是包括所有所参考的组分的化合物,只要在某个点在接触过程期间所有所参考的组分同时存在或同时包括于同一混合物或溶液中。例如,“将A与B和C接触”可以包括其中C首先与A接触形成第一混合物,然后所述第一混合物与B接触形成第二混合物,接着所述C被从所述第二混合物中去除;任选地,A然后也可以被去除,只剩下B。其中要被接触的一个或多个所参考的组分包括多个(例如,“将靶序列与多个靶特异性引物和聚合酶接触”),然后,多个的每个成员可以被视为所述接触过程的个体组分,使得所述接触可以包括将所述多个的任意一个或多个成员与所述多个的任意其它成员和/或与任意其它所参考的组分(例如,所述多个靶特异性引物中的一些但不是所有引物可以与靶序列接触,然后聚合酶,并且然后与所述多个靶特异性引物的其它成员)以任何顺序或组合进行接触。
如本文所用,术语“引物”及其衍生词通常是指能够与感兴趣的靶序列杂交的任意多核苷酸。在一些实施方案中,所述引物也可以用来引发(prime)核酸合成。典型地,所述引物作为核苷酸可以通过聚合酶被聚合到其上的底物发挥功能;但是,在一些实施方案中,所述引物可以变成掺入所合成的核酸链并提供另一个引物可以与其杂交的位点以引发与所合成的核酸分子互补的新链的合成。所述引物包括核苷酸或其类似物的任意组合,其可以任选地被连接形成任意合适长度的线性聚合物。(对于本公开内容的目的来说,术语“多核苷酸”和“寡核苷酸”在本文中互换使用并无需表明两种之间长度上的任何差异)。在一些实施方案中,所述引物是单链的但它还可以是双链的。所述引物任选天然存在的,如在纯化的限制性酶消化物中,或可以被合成产生。在一些实施方案中,当被暴露于扩增或合成条件时所述引物作为扩增或合成起始的点;这样的扩增或合成可以以模板依赖性形式发生并任选地导致与所述靶序列的至少部分互补的引物延伸产物的形成。示例性的扩增或合成条件可以包括在合适的温度和pH下将所述引物与多核苷酸模板(例如,包括靶序列的模板)、核苷酸和诱导剂(如聚合酶)接触以诱导核苷酸聚合至所述靶特异性引物的末端上。如果是双链的,所述引物可以任选地在被用于准备引物延伸产物之前被处理以分离其链。在一些实施方案中,所述引物是寡脱氧核糖核苷酸或寡核糖核苷酸。在一些实施方案中,所述引物可以包括一个或多个核苷酸类似物。所述靶特异性引物的确切长度和/或组成(包括序列)可以影响多个性质,包括解链温度(Tm)、GC含量、二级结构的形成、重复的核苷酸基序、所预测的引物延伸产物的长度、跨感兴趣的核酸分子的覆盖程度、在单个扩增或合成反应中存在的引物的数目、在所述引物内核苷酸类似物或修饰的核苷酸的存在等。在一些实施方案中,引物可以与扩增或合成反应内相容性的引物配对以形成由正向引物和反向引物组成的引物对。在一些实施方案中,所述引物对的正向引物包括基本上与核酸分子链的至少部分互补的序列,并且所述引物对的反向引物包括基本上与该链的至少部分相同的序列。在一些实施方案中,所述正向引物和所述反向引物能够与核酸双链体的相反的链杂交。任选地,所述正向引物引发第一核酸链的合成,并且所述反向引物引发第二核酸链的合成,其中所述第一和第二链基本上互相互补,或能够杂交形成双链核酸分子。在一些实施方案中,扩增或合成产物的一端通过所述正向引物进行定义并且所述扩增或合成产物的另一端通过所述反向引物进行定义。在一些实施方案中,其中要求冗长引物延伸产物的扩增或合成(如扩增外显子、编码区或基因),可以创建几个引物对跨越所期望的长度以能够足够扩增该区域。在一些实施方案中,引物可以包括一个或多个可切割的基团。在一些实施方案中,引物长度在长度为大约10个至大约60个核苷酸、大约12个至大约50个核苷酸和大约15个至大约40个核苷酸的范围内。典型地,当被暴露于扩增条件时,引物能够在dNTPS和聚合酶的存在下与相应的靶序列杂交并进行引物延伸。在一些情况下,所述特定核苷酸序列或所述引物的部分已知在扩增反应开始时或可以通过本文所公开的一种或多种方法来确定。在一些实施方案中,所述引物在引物内的一个或多个位置包括一个或多个可切割的基团。
如本文所用,“靶特异性引物”及其衍生词,通常是指单链或双链多核苷酸,典型地是寡核苷酸,其包括与包括靶序列的核酸分子的至少部分至少50%互补、典型地至少75%互补或至少85%互补、更典型地至少90%互补、更典型地至少95%互补、更典型地至少98%或99%互补或相同的至少一个序列。在这样的情况下,所述靶特异性引物和靶序列被描述为“相应”于彼此。在一些实施方案中,所述靶特异性引物能够与其相应的靶序列(或与所述靶序列的互补序列)的至少部分进行杂交;这样的杂交可以任选地在标准杂交条件下或在严格杂交条件下进行。在一些实施方案中,所述靶特异性引物不能与所述靶序列或与其互补序列杂交,但能够与包括所述靶序列的核酸链的部分或其互补序列进行杂交。在一些实施方案中,所述靶特异性引物包括与所述靶序列自身的至少部分至少75%互补、典型地至少85%互补、更典型地至少90%互补、更典型地95%互补、更典型地至少98%互补或更典型地至少99%互补的至少一个序列;在其它实施方案中,所述靶特异性引物包括与除靶序列之外的所述核酸分子的至少部分至少75%互补、典型地至少85%互补、更典型地至少90%互补、更典型地95%互补、更典型地至少98%互补或更典型地至少99%互补的至少一个序列。在一些实施方案中,所述靶特异性引物与样品中存在的其它靶序列基本上是不互补的;任选地,所述靶特异性引物与与样品中存在的其它核酸分子基本上是不互补的。在一些实施方案中,不包括或相应于靶序列(或所述靶序列的互补序列)的存在于样品中的核酸分子称为“非特异性”序列或“非特异性核酸”。在一些实施方案中,所述靶特异性引物被设计为包括基本上与其相应靶序列的至少部分互补的核苷酸序列。在一些实施方案中,靶特异性引物跨其全长与包括其相应靶序列的核酸分子的至少部分至少95%互补或至少99%互补或相同。在一些实施方案中,靶特异性引物可以跨其全长与其相应靶序列的至少部分至少90%、至少95%互补、至少98%互补或至少99%互补或相同。在一些实施方案中,正向靶特异性引物和反向靶特异性引物定义可被用于通过模板依赖性的引物延伸扩增所述靶序列的靶特异性引物对。典型地,靶特异性引物的每个引物包括与核酸分子的至少部分基本上互补的至少一个序列,所述核酸分子包括相应的靶序列但与样品中至少一个其它靶序列小于50%互补。在一些实施方案中,扩增可以在单个扩增反应中采用多个靶特异性引物对进行,其中每个引物对包括正向靶特异性引物和反向靶特异性引物,每个包括与样品中相应的靶序列基本上互补或基本上相同的至少一个序列,并且每个引物对具有不同的相应的靶序列。在一些实施方案中,所述靶特异性引物可以在其3'端或其5'端与扩增反应中存在的任意其它靶特异性引物基本上不互补。在一些实施方案中,所述靶特异性引物可以包括与所述扩增反应中其它靶特异性引物最小的交叉杂交。在一些实施方案中,靶特异性引物包括与所述扩增反应混合物中非特异性序列最小的交叉杂交。在一些实施方案中,所述靶特异性引物包括最小的自身互补。在一些实施方案中,所述靶特异性引物可以包括位于3'端的一个或多个可切割的基团。在一些实施方案中,所述靶特异性引物可以包括位于接近或大约所述靶特异性引物的中央核苷酸的一个或多个可切割的基团。在一些实施方案中,一个或多个靶特异性引物包括仅位于所述靶特异性引物的5'端的非可切割的基团。在一些实施方案中,靶特异性引物包括最小的与一个或多个不同靶特异性引物相比所述引物的3'端或5'端的核苷酸序列重叠,任选地在同一扩增反应中。在一些实施方案1、2、3、4、5、6、7、8、9、10个或更多个实施方案中,在单个反应混合物中的靶特异性引物包括一个或多个上述实施方案。在一些实施方案中,在单个反应混合物中的多个靶特异性引物的基本上所有引物包括一个或多个上述实施方案。
如本文所用,“聚合酶”及其衍生词,通常是指能够催化核苷酸(包括其类似物)成为核酸链的聚合的任何酶。典型地但不是必须的,这样的核苷酸聚合可以模板依赖性的形式发生。这样的聚合酶可以包括但不限于天然存在的聚合酶及其保留催化这样的聚合的能力的任何亚基和截短形式、突变体聚合酶、变体聚合酶、重组体、融合或其它方式工程化的聚合酶、化学修饰的聚合酶、合成分子或组装体(assembly)及其任何类似物、衍生物或片段。任选地,所述聚合酶可以是包含一个或多个突变的突变体聚合酶,所述突变涉及一个或多个氨基酸置换为其它氨基酸、聚合酶的一个或多个氨基酸的***或缺失(deletion)、或两个或更多个聚合酶的部分的连接(linkage)。典型地,所述聚合酶包含一个或多个活性位点,其中核苷酸结合和/或核苷酸聚合的催化可以发生。一些示例性的聚合酶包括但不限于DNA聚合酶和RNA聚合酶。如本文所用,术语“聚合酶”及其变体,也是指包含互相连接的至少两部分的融合蛋白,其中第一部分包含可以催化核苷酸称为核酸链的聚合的肽并且与包括报告酶或增强持续合成能力的结构域的第二部分连接。任选地,所述聚合酶可以具有5'外切酶活性或末端转移酶活性。在一些实施方案中,所述聚合酶可以任选地被再活化,例如通过使用热、化学品或向反应混合物加入新的量的聚合酶。在一些实施方案中,所述聚合酶可以包括热启动聚合酶或基于适体(aptamer)的聚合酶,其任选地可以被再活化。
如本文所用,术语“核苷酸”及其变体包含任何化合物,包括但不限于任何天然存在的核苷酸或其类似物,其能够选择性结合或能被聚合酶聚合。典型地,但不是必须的,所述核苷酸与所述聚合酶的选择性结合接着通过所述聚合酶将所述核苷酸聚合为核酸链;但是偶尔所述核苷酸可以从所述聚合酶解离而不成为掺入所述核酸链,其为本文称为“非生产性”事件的事件。这样的核苷酸不仅包括天然存在的核苷酸还包括不管它们的结构只要能够选择性结合或能被聚合酶聚合的任何类似物。尽管天然存在的核苷酸典型地包含碱基、糖和磷酸部分(moiety),本公开内容的所述核苷酸可以包括缺少任意一个、一些或所有的这样的部分的化合物。在一些实施方案中,所述核苷酸可以任选地包括包含三、四、五、六、七、八、九、十个或更多个磷原子的磷原子链。在一些实施方案中,磷链可以被连接到糖环的任意碳,如5'碳。所述磷链可以被连接到具有间插的O或S的糖。在一个实施方案中,链中的一个或多个磷原子可以是具有P和O的磷酸基团的一部分。在另一个实施方案中,链中的磷原子可以与间插的O、NH、S、亚甲基、取代的亚甲基、亚乙基、取代的亚乙基、CNH2、C(O)、C(CH2)、CH2CH2或C(OH)CH2R(其中R可以是4-吡啶或1-咪唑)连接在一起。在一个实施方案中,链中的磷原子可以具有具有O、BH3或S的侧基。在磷链中,具有除了O之外的侧基的磷原子可以是取代的磷酸基团。在磷链中,具有除了O之外的间插原子的磷原子可以是取代的磷酸基团。核苷酸类似物的一些例子如Xu的美国专利号7,405,281中所述。在一些实施方案中,所述核苷酸包含标记(label)并在本文中称为“标记的核苷酸”;所述标记的核苷酸的标记在本文中称为“核苷酸标记”。在一些实施方案中,所述标记可以是以被连接到末端磷酸基团的荧光染料的形式,即离糖最远的磷酸基团。能够被用于所公开的方法和组合物的核苷酸的一些例子包括但不限于核糖核苷酸、脱氧核糖核苷酸、修饰的核糖核苷酸、修饰的脱氧核糖核苷酸、核糖核苷酸多磷酸、脱氧核糖核苷酸多磷酸、修饰的核糖核苷酸多磷酸、修饰的脱氧核糖核苷酸多磷酸、肽核苷酸、修饰的肽核苷酸、金属核苷酸、核苷膦酸盐和修饰的磷酸-糖主链核苷酸、前述化合物的类似物、衍生物或变体等。在一些实施方案中,所述核苷酸可以包含非氧部分,例如硫代或硼烷(borano)部分,代替氧部分桥接所述核苷酸的α磷酸和糖,或所述核苷酸的α和β磷酸,或所述核苷酸的β和γ磷酸,或在所述核苷酸的其它两个磷酸之间,或其任意组合。“核苷酸5'-三磷酸”是指在5'位置具有三磷酸酯基团的核苷酸,并有时被表示为“NTP”或“dNTP”和“ddNTP”以特别指出核糖的结构特征。所述三磷酸酯基团包括取代各种氧的硫,例如,α-硫代核苷酸5'-三磷酸。对于核酸化学的综述,参见:Shabarova,Z.and Bogdanov,A.Advanced Organic Chemistry of Nucleic Acids,VCH,New York,1994。
如本文所用,术语“延伸”及其变体,当用于参考给定的引物时,包含给定聚合酶的任何体内或体外酶活特征,所述聚合酶涉及一个或多个核苷酸聚合至现有核酸分子的端部上。典型地但不是必须的,这样的引物延伸以模板依赖性形式发生;在模板依赖性延伸过程中,碱基的顺序和选择由建立的碱基配对规则(其可以包括沃森-克里克型的碱基配对规则)或备选地(并且特别是在设计核苷酸类似物的延伸反应的情况下)由某些其它类型的碱基配对范例(paradigm)所驱动。在一个非限制性的例子中,通过聚合酶将核苷酸聚合至核酸分子的3'OH端上发生延伸。
如本文所用,术语“部分(portion)”及其变体,当用于参考给定核酸分子时(例如,引物或模板核酸分子),在所述核酸分子长度内包含任意数量的连续核苷酸,包括所述核酸分子的部分或全长。
如本文所用,术语“同一性(identity)”和“相同(identical)”及其变体,当用于参考两个或更多个核酸序列时,是指这两个或更多个序列(例如,核苷酸或多肽序列)序列上的相似性。在两个或更多个同源序列的背景下,所述序列或其子序列的同一性或同源性百分比是指相同的(same)所有单体单元的百分比(即,大约70%同一性,优选75%、80%、85%、90%、95%、98%或99%同一性)。当采用BLAST或BLAST 2.0序列比较算法以下面所述的默认参数或通过手动比对和目视检查在比较窗口或指定(designated)区域上针对最大对应性进行比较和比对时,所述同一性百分比可以在指定(specified)区域上。当在氨基酸水平或核苷酸水平存在至少85%同一性时,序列被认为“基本上相同”。优选地,所述同一性存在于至少一个所比较的序列的长度为至少大约25、50或100个残基或跨全长的区域上。确定序列同一性和序列相似性百分比的典型的算法是BLAST和BLAST 2.0算法,其被描述于Altschul et al,Nuc.Acids Res.25:3389-3402(1977)中。其它方法包括Smith&Waterman,Adv.Appl.Math.2:482(1981),and Needleman&Wunsch,J.Mol.Biol.48:443(1970)等的算法。另一个表明两个核酸序列基本上相同的指示是这两个分子或它们的互补序列在严格杂交条件下互相杂交。
如本文所用,术语“互补(complementary)”和“互补序列(complement)”及其变体,是指如在杂交双链体中可以在反向平行方向在两个或更多个个体相应位置进行累积碱基配对的任意两个或更多个核酸序列(例如,模板核酸分子、靶序列和/或引物的部分或全长)。这样的碱基配对可以根据任意一组建立的规则进行,例如根据沃森-克里克碱基配对规则或根据某个其它的碱基配对范例。任选地,在第一和第二核酸序列之间可以存在“完全(complete)”或“全(total)”互补性,其中所述第一核酸序列的每个核苷酸可以与所述第二核酸序列上的相应反向平行位置中的核苷酸进行稳定的碱基配对相互作用。“部分(partial)”互补性描述核酸序列,其中一个核酸序列至少20%但小于100%的残基与另一个核酸序列的残基互补。在一些实施方案中,一个核酸序列至少50%但小于100%的残基与另一个核酸序列的残基互补。在一些实施方案中,一个核酸序列至少70%、80%、90%、95%或98%但小于100%的残基与另一个核酸序列的残基互补。当一个核酸序列至少85%的残基与另一个核酸序列的残基互补时序列被认为“基本上互补”。在一些实施方案中,两个互补或基本上互补的序列能够在标准或严格杂交条件下互相杂交。“非互补”描述核酸序列,其中一个核酸序列小于20%的残基与另一个核酸序列的残基互补。当一个核酸序列小于15%的残基与另一个核酸序列的残基互补时序列被认为“基本上非互补”。在一些实施方案中,两个非互补或基本上非互补的序列不能在标准或严格杂交条件下互相杂交。“错配”存在于不互补的两个相对核苷酸中的任意位置。互补的核苷酸包括在生理条件下在DNA复制过程中由DNA聚合酶有效掺入的互相相对的核苷酸。在典型的实施方案中,互补的核苷酸可以在核苷酸和/或多核苷酸的核碱基之间在互相反向平行的位置中互相形成碱基对,如通过特异性的沃森-克里克型氢键形成的A-T/U和G-C碱基对,或通过某个其它类型的碱基配对范例形成的碱基对。其它人工碱基对的互补性可以是基于其它类型的氢键和/或碱基的疏水性和/或碱基之间形状互补性。
如本文所用,“扩增的靶序列”及其衍生词,通常是指采用本文所提供的靶特异性引物和方法通过扩增靶序列所产生的核酸序列。所述扩增的靶序列可以相对于所述靶序列或者属于相同的有义(在第二循环(round)和后续偶数循环扩增中产生的正链)或者反义(即,在第一和后续奇数循环扩增中产生的负链)。对于本公开内容的目的来说,所述扩增的靶序列通常与在该反应中的另一个扩增的靶序列的任意部分小于50%互补。
如本文作用,术语“连接(ligating)”、“连接(ligation)”及其衍生词通常是指用于将两个或更多个分子共价连接在一起的动作或过程,例如将两个或更多个核酸分子互相共价连接。在一些实施方案中,连接包括接合(join)核酸的相邻核苷酸之间的切口。在一些实施方案中,连接包括形成第一核酸分子的端部和第二核酸分子的端部之间的共价键。在一些实施方案中,例如其中要被连接的核酸分子包括常规核苷酸残基的实施方案,连接可以包括形成一个核酸的5'磷酸基团和第二核酸的3'羟基基团之间的共价键从而形成连接的核酸分子。在一些实施方案中,可以采用用于接合切口或键合相邻核苷酸之间的5'磷酸至3'羟基的任何手段(means)。在一个示例性的实施方案中,可以采用酶(如连接酶)。通常对于本公开内容的目的来说,扩增的靶序列可以被连接至接头以产生接头连接的扩增的靶序列。
如本文所用,“连接酶”及其衍生词,通常是指能够催化两个底物分子的连接的任何剂。在一些实施方案中,所述连接酶包括能够催化核酸的相邻核苷酸之间的切口的接合的酶。在一些实施方案中,所述连接酶包括能够催化形成一个核酸分子的5'磷酸至另一个核酸分子的3'羟基之间的共价键从而形成连接的核酸分子。合适的连接酶可以包括但不限于T4DNA连接酶、T4RNA连接酶和大肠杆菌DNA连接酶。
如本文所用,“连接条件”及其衍生词,通常是指适合将两个分子互相连接的条件。在一些实施方案中,所述连接条件适合封闭核酸之间的切口或缺口。如本文所定义,“切口”或“缺口”是指在核酸序列的内部核苷酸内缺乏单核苷酸戊糖环的5'磷酸至相邻的单核苷酸戊糖环的3'羟基的直接结合的核酸分子。如本文所用,术语切口或缺口与本领域中该术语的使用一致。典型地,切口或缺口可以在酶(如连接酶)的存在下在合适的温度和pH下被连接。在一些实施方案中,T4DNA连接酶可以在大约70-72℃的温度下接合核酸之间的切口。
如本文所用,“平端连接”及其衍生词,通常是指两个平端双链核酸分子彼此连接。“平端”是指双链核酸分子的端部,其中在所述核酸分子的一条链的端部中的基本上所有的核苷酸与同一核酸分子的另一条链中相对的核苷酸是碱基配对的。如果核酸分子具有包括长度大于两个核苷酸的单链部分的端部,则它不是平端的,在本文中称为“悬垂(overhang)”。在一些实施方案中,核酸分子的所述端部并不包括任何单链部分,使得端部的一条链中的每个核苷酸与同一核酸分子的另一条链中相对的核苷酸是碱基配对的。在一些实施方案中,变成互相连接的两个平端核酸分子的端部不包括任何悬垂、共享的或互补的序列。典型地,平端连接排除使用另外的寡核苷酸接头以协助双链扩增的靶序列连接至双链接头,这样的补丁寡核苷酸如2010年5月27日公开的Mitra和Varley的US2010/0129874中所述。在一些实施方案中,平端连接包括切口平移(nick translation)反应以密封在连接过程期间所创建的切口。
如本文所用,术语“接头”或“接头及其互补序列”及其衍生词,通常是指能够被连接至本公开内容的核酸分子的任意线性寡核苷酸。任选地,所述接头包括与样品内至少一个靶序列的3'端或5'端基本上不互补的核酸序列。在一些实施方案中,所述接头与样品中存在的任何靶序列的3'端或5'端基本上是非互补的。在一些实施方案中,所述接头包括任何单链或双链线性寡核苷酸,其与扩增的靶序列基本上不互补。在一些实施方案中,所述接头与样品的至少一个、一些或所有的核酸分子基本上是非互补的。在一些实施方案中,合适的接头长度在长度为大约10-100个核苷酸、大约12-60个核苷酸和大约15-50个核苷酸的范围内。通常,所述接头可以包括核苷酸和/或核酸的任意组合。在一些方面,所述接头可以包括在一个或多个位置的一个或多个可切割的基团。在另一个方面,所述接头可以包括与引物(例如,通用引物)的至少部分基本上相同、或基本上互补的序列。在一些实施方案中,所述接头可以包括条形码或标签(tag)以协助下游编目、鉴定或测序。在一些实施方案中,当被连接至扩增的靶序列时,单链接头可以作为扩增底物,特别是在聚合酶和dNTPs的存在下在合适的温度和pH下。
如本文所用,“再扩增(reamplifying)”或“再扩增(reamplification)”及其衍生词通常是指任何过程,由此扩增的核酸分子的至少部分被通过任何合适的扩增过程(在一些实施方案中称为“二次”扩增或“再扩增”)被进一步扩增,从而产生再扩增的核酸分子。二次扩增不必与产生所述扩增的核酸分子的原始扩增过程相同;所述再扩增的核酸分子也不必与所述扩增的核酸分子完全相同或完全互补;所需要的是,所述再扩增的核酸分子包括所述扩增的核酸分子或其互补序列的至少部分。例如,所述再扩增可以涉及采用不同扩增条件和/或不同引物(包括与初始扩增不同的靶特异性引物)。
如本文所定义,“可切割的基团”通常是指一旦被掺入核酸能够在适当的条件下被切割的任何部分(moiety)。例如,可切割的具体可以被掺入样品的靶特异性引物、扩增的序列、接头或核酸分子。在示例性的实施方案中,靶特异性引物可以包括可切割的基团,其变成掺入所扩增的产物并随后在扩增之后被切割,从而从所扩增的产物去除所述靶特异性引物的部分或所有。所述可切割的基团可以通过任何可接受的手段从样品的靶特异性引物、扩增的序列、接头或核酸分子上被切割或以其他方式被去除。例如,可切割的基团可以通过酶、热、光氧化或化学处理从样品的靶特异性引物、扩增的序列、接头或核酸分子上被去除。在一个方面,可切割的基团可以包括不是天然存在的核碱基。例如,寡脱氧核糖核苷酸可以包括一个或多个RNA核碱基,如可通过尿嘧啶糖基化酶被去除的尿嘧啶。在一些实施方案中,可切割的基团可以包括一个或多个修饰的核碱基(如7-甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶或5-甲基胞嘧啶)或一个或多个修饰的核苷(即,7-甲基鸟苷、8-氧代-脱氧鸟苷、黄苷、肌苷、二氢尿苷或5-甲基胞苷)。所述修饰的核碱基或核苷可以通过酶、化学或热的手段从所述核酸被去除。在一个实施方案中,可切割的基团可以包括扩增(或合成)之后一旦暴露于紫外光即可从引物被去除的部分(即,溴脱氧尿苷)。在另一个实施方案中,可切割的基团可以包括甲基化胞嘧啶。典型地,甲基化胞嘧啶可以例如在扩增(或合成)的诱导之后,一旦用亚硫酸氢钠处理从引物被切割。在一些实施方案中,可切割的部分可以包括限制性酶切位点。例如,引物或靶序列可以包括特异性针对一种或多种限制性酶的核酸序列,并且扩展(或合成)之后,所述引物或靶序列可以用一种或多种限制性酶进行处理使得所述可切割的基团被去除。典型地,一个或多个可切割的基团可以被包含于样品的靶特异性引物、扩增的序列、接头或核酸分子的一个或多个位置。
如本文所用,“切割步骤”及其衍生词,通常是指可切割的基团通过其从样品的靶特异性引物、扩增的序列、接头或核酸分子被切割或以其它方式被去除的任何过程。在一些实施方案中,所示切割步骤涉及化学、热、光氧化或消化过程。
如本文所用,术语“杂交(hybridization)”与其在本领域中的使用一致,通常是指这样的过程,由此两个核酸分子进行碱基配对相互作用。当一个核酸分子的任何部分与另一个核酸分子的任何部分碱基配对时,两个核酸分子被认为是杂交的;并不要求所述两个核酸分子跨其各自全长杂交,并且在一些实施方案中,所述核酸分子的至少一个可以包括与另一个核酸分子没有杂交的部分。术语“在严格条件下杂交”及其变体通常是指这样的条件,在这样的条件下靶特异性引物与靶序列的杂交在高杂交稳定和低离子强度的存在下发生。在一个示例性的实施方案中,严格杂交条件包括大约60-68℃下含有大约30mM硫酸镁、pH 8.9的大约300mM Tris-硫酸盐和大约90mM硫酸铵的水性环境,或其等价条件。如本文所用,术语“标准杂交条件”及其变体通常是指这样的条件,在这样的条件下引物与寡核苷酸(即,靶序列)的杂交在低杂交温度和高离子强度的存在下发生。再一个示例性的实施方案中,标准杂交条件包括大约50-55℃下含有大约100mM硫酸镁、pH 8.9的大约500mM Tris-硫酸盐和大约200mM硫酸铵的水性环境,或其等价条件。
如本文所用,“三核苷酸基序”及其衍生词,通常是指在三个核苷酸上连续重复的任何核苷酸序列,例如,AAA或CCC。通常,三核苷酸基序在本公开内容的靶特异性引物(或接头)中重复不超过五次。
如本文所用,“ACA核苷酸基序”及其衍生词,通常是指所述核苷酸序列“ACA”。通常,该基序在本公开内容的靶特异性引物(或接头)中重复不超过三次或更多次。
如本文所用,“均聚物”及其衍生词,通常是指八个核苷酸或长度更长的任何重复核苷酸序列,例如,AAAAAAAA或CCCCCCCC。通常,如本文所定义的均聚物不存在于本公开内容的靶特异性引物(或接头)中。
如本文所用,“GC含量”及其衍生词,通常是指核酸分子的胞嘧啶和鸟嘌呤的含量。通常,本公开内容的靶特异性引物(或接头)的GC含量为85%或更低。更典型地,本公开内容的靶特异性引物或接头的GC含量为15-85%之间。
如本文所用,术语“端部(end)”及其变体,当用于指核酸分子时(例如,靶序列或扩增的靶序列),可以包括所述核酸分子的末端30个核苷酸、末端20个和甚至更典型地末端15个核苷酸。典型地,由系列连接的连续核苷酸组成的线性核酸分子包括至少两个端部。在一些实施方案中,所述核酸分子的一个端部可以包括3'羟基基团或其等价基团,并可称为“3'端”及其衍生词。任选地,所述3'端包括没有被连接至单核苷酸戊糖环的5'磷酸基团的3'羟基基团。典型地,所述3'端包括邻近于包括未连接的3'羟基基团的核苷酸的一个或多个5'连接的核苷酸,典型地邻近于所述3'羟基的30个核苷酸,典型地末端20个并且甚至更典型地末端15个核苷酸。通常,所述一个或多个连接的核苷酸可以被表示为所述寡核苷酸中存在的核苷酸的百分比,或者可以被提供为邻近所述未连接的3'羟基的多个连接的核苷酸。例如,所述3'端可以包括所述寡核苷酸的小于50%的核苷酸长度。在一些实施方案中,所述3'端不包括任何未连接的3'羟基基团而是可以包括能够通过引物延伸和/或核苷酸聚合作为核苷酸附着的位点的任何部分。在一些实施方案中,所述术语“3'端”,例如当指靶特异性引物时,可以包括3'端的末端10个核苷酸、末端5个核苷酸、末端4、3、2个或更少的核苷酸。在一些实施方案中,所述术语“3'端”当指靶特异性引物时可以包括位于离所述3'末端的核苷酸位置10或更少的核苷酸。
如本文所用,“5'端”及其衍生词,通常是指核酸分子(例如,靶序列或扩增的靶序列)的端部,其包括游离的5'磷酸基团或其等价基团。在一些实施方案中,所述5'端包括没有被连接至相邻的单核苷酸戊糖环的3'羟基的5'磷酸基团。典型地,所述5'端包括邻近于所述5'磷酸基团的一个或多个连接的核苷酸,典型地邻近于包括所述5'磷酸基团的所述核苷酸的30个核苷酸,典型地末端20个并且甚至更典型地末端15个核苷酸。通常,所述一个或多个连接的核苷酸可以被表示为所述寡核苷酸中存在的核苷酸的百分比,或者可以被提供为邻近所述5'磷酸的多个连接的核苷酸。例如,所述5'端可以是小于50%的所述核苷酸长度的寡核苷酸。在另一个示例性的实施方案中,所述5'端可以包括与包括所述末端5'磷酸的核苷酸相邻的大约15个核苷酸。在一些实施方案中,所述5'端不包括任何未连接的5'磷酸基团而是可以包括能够作为3'羟基基团或另一个核酸分子的3'端的附着位点的任何部分。在一些实施方案中,所述术语“5'端”,例如当指靶特异性引物时,可以包括5'端的末端10个核苷酸、末端5个核苷酸、末端4、3、2个或更少的核苷酸。在一些实施方案中,所述术语“5'端”当指靶特异性引物时可以包括位于离所述5'端的核苷酸位置10或更少的核苷酸。在一些实施方案中,靶特异性引物的5'端可以仅包括非可切割的核苷酸,例如,不含有如本文所公开的一个或多个可切割的基团,或如可以由本领域普通技术人员很容易地确定的可切割的核苷酸。
如本文所用,“保护基团”及其衍生词,通常是指能够被掺入接头或靶特异性引物的任何部分,其赋予化学选择性或保护所述靶特异性引物或接头不被消化或化学降解。典型地,但不是必须的,保护基团可以包括在所述靶特异性引物或接头中的现有官能团的修饰以实现化学选择性。合适类型的保护基团包括醇、胺、磷酸、羰基或羧酸保护基团。在示例性的实施方案中,所述保护基团可以包括具有碳原子链的间隔(spacer)化合物。
如本文所用,“DNA条形码”或“DNA标签序列”及其衍生词,通常是指接头内的独特的短(6-14个核苷酸)核酸序列,其可以作为样品内区分或分离多个扩增的靶序列的‘钥匙(key)’。对于本公开内容的目的来说,DNA条形码或DNA标签序列可以被掺入接头的核苷酸序列。
如本文所用,短语“两个循环的靶特异性杂交”或“两个循环的靶特异性选择”及其衍生词通常是指任何过程,由此相同的靶序列进行连续两个循环的基于杂交的靶特异性选择,其中靶序列与靶特异性序列杂交。基于杂交的靶特异性选择的每个循环可以包括与靶特异性序列的至少一些部分的多个靶特异性杂交。在一个示例性的实施方案中,靶特异性选择的循环包括涉及所述靶序列的第一区域的第一靶特异性杂交和涉及所述靶序列的第二区域的第二靶特异性杂交。所述第一和第二区域可以是相同的或不同的。在一些实施方案中,基于杂交的靶特异性选择的每个循环可以包括使用两个靶特异性寡核苷酸(例如,正向靶特异性引物和反向靶特异性引物),使得每个循环的寻找包括两个靶特异性杂交。
如本文所用,“可比最高最低解链温度”及其衍生词,通常是指所述可切割的基团切割之后每个核酸片段针对单个接头或靶特异性引物的解链温度(Tm)。比较由单个接头或靶特异性引物所产生的每个核酸片段的杂交温度来确定阻止任何核酸片段与所述靶特异性引物或接头至所述靶序列的杂交所需要的最高最低温度。一旦知晓最高杂交温度,则可以操纵(manipulate)所述接头或靶特异性引物(例如通过沿着引物长度移动可切割的基团的位置)来实现针对每个核酸片段的可比最高最低解链温度。
如本文所用,“仅添加(addition only)”及其衍生词,通常是指一系列步骤,其中试剂和组分被加入第一或单个反应混合物。典型地,为了完成所述一系列步骤,所述一系列步骤排除从第一容器取出所述反应混合物至第二容器。通常,仅添加过程排除在含有所述反应混合物的容器之外操作所述反应混合物。典型地,仅添加过程适于自动化和高通量。
如本文所用,“合成(synthesizing)”及其衍生词,通常是指涉及通过聚合酶的核苷酸聚合的反应,任选地以模板依赖性的形式。聚合酶通过将核苷单磷酸从核苷三磷酸(NTP)、脱氧核苷三磷酸(dNTP)或双脱氧核苷三磷酸(ddNTP)转移至延伸的寡核苷酸链的3'羟基来合成寡核苷酸。对于本公开内容的目的来说,合成包括通过来自脱氧核苷三磷酸的核苷单磷酸的转移的杂交的接头或靶特异性引物的系列延伸(serial extension)。
如本文所用,“聚合条件”及其衍生词,通常是指适合核苷酸聚合的条件。在典型的实施方案中,这样的核苷酸聚合是由聚合酶催化的。在一些实施方案中,聚合条件包括用于引物延伸的条件,任选地以模板依赖性的形式,导致合成的核酸序列的产生。在一些实施方案中,所述聚合条件包括聚合酶链式反应(PCR)。典型地,所述聚合条件包括足以合成核酸并且包括聚合酶和核苷酸的反应混合物的使用。所述聚合条件可以包括用于在聚合酶的存在下靶特异性引物与靶序列的退火和以模板依赖性的形式的引物的延伸的条件。在一些实施方案中,聚合条件可以采用热循环进行。另外,聚合条件可以包括多个循环,其中重复两条核酸链的退火、延伸和分离步骤。典型地,所述聚合条件包括阳离子(如MgCl2)。通常,一个或多个核苷酸形成核酸链的聚合包括所述核苷酸被通过磷酸二酯键互相连接,但是,替代的连接可存在于特定核苷酸类似物的背景中。
如本文所用,术语“核酸”是指天然核酸、人工核酸、其类似物或其组合,包括多核苷酸和寡核苷酸。如本文所用,术语“多核苷酸”和“寡核苷酸”在本文中互换使用并意味着核苷酸的单链和双链聚合物,包括但不限于由核苷酸间的磷酸二酯键(例如3'-5'和2'-5')、反向键(例如3'-3'和5'-5')、支链结构连接的2'-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA),或核酸类似物。多核苷酸具有相关联的抗衡离子(counter ion),如H+、NH4 +、三烷基铵、Mg2+、Na+等。寡核苷酸可以完全由脱氧核糖核苷酸、完全由核糖核苷酸或其嵌合混合物组成。寡核苷酸可以由核碱基和糖类似物组成。多核苷酸大小典型地在从几个单体单元(例如5-40个)(当它们在现有技术中被更普遍经常称为寡核苷酸)到几千个单体核苷酸单元(当它们在现有技术中被更普遍称为多核苷酸)的范围内;但是,对于本公开内容的目的来说,寡核苷酸和多核苷酸二者均可以是任何合适的长度。除非另外表示,否则每当表示寡核苷酸序列时,应理解的是所述核苷酸是以从左到右5'到3'的顺序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷、“T”表示胸苷以及“U”表示脱氧尿苷。寡核苷酸之所以被认为具有“5'端”和“3'端”是因为单核苷酸典型地通过一个核苷酸的5'磷酸或等价基团被连接至它的相邻核苷酸的3'羟基或等价基团而反应形成寡核苷酸,任选地通过磷酸二酯键或其它合适的键。
如本文所用,术语“切口平移”及其变体包含核酸链内的一个或多个切口或缺口沿着所述核酸链向新位置的易位(translocation)。在一些实施方案中,当双链接头被连接至双链扩增的靶序列时可以形成切口。在一个例子中,所述引物可以包括在其5'端,能够连接至所述双链扩增的靶序列的磷酸基团,留下在互补链中所述接头和所述扩增的靶序列之间的切口。在一些实施方案中,切口平移导致所述切口向所述核酸链的3'端的移动。在一些实施方案中,移动所述切口可以包括在所述接头连接的扩增的靶序列上进行切口平移反应。在一些实施方案中,所述切口平移反应可以被偶联5'到3'DNA聚合/降解反应,或被偶联至5'到3'DNA聚合/链置换反应。在一些实施方案中,移动所述切口可以包括在所述切口位点进行DNA链延伸反应。在一些实施方案中,移动所述切口可以包括在所述切口上进行单链外切酶反应以形成所述接头连接的扩增的靶序列的单链部分和在所述接头连接的扩增的靶序列的单链部分上进行DNA链延伸反应以形成新的位置。在一些实施方案中,在连接位点相对的核酸链中形成切口。
如本文所用,术语“聚合酶链式反应”(“PCR”)是指K.B.Mullis的美国专利号4,683,195和4,683,202(其作为参考引入)的方法,其描述了用于在未经克隆或纯化的基因组DNA混合物中提高感兴趣的多核苷酸的片段的浓度的方法。用于扩增所述感兴趣的多核苷酸的该过程包括向含有感兴趣的所期望的多核苷酸的DNA混合物中引入大量过量的两种寡核苷酸引物,接着在DNA聚合酶存在下精确序列的热循环。两个引物与感兴趣的双链多核苷酸的各自链互补。为了有效扩增,所述混合物被变性,然后所述引物与感兴趣的多核苷酸分子内的互补序列退火。退火之后,所述引物用聚合酶延伸以形成新的一对互补链。变性、引物退火和聚合酶延伸的步骤可以被重复许多次(即,变性、退火和延伸组成一个“循环(cycle)”;可以有许多“循环”)以获得感兴趣的所期望的多核苷酸的高浓度的扩增片段。感兴趣的所期望的多核苷酸的扩增片段(扩增子)的长度由引物相对于彼此的相对位置确定,并因此,该长度是可控参数。凭借着重复该过程,所述方法被称为“聚合酶链式反应”(下文中称为“PCR”)。由于感兴趣的所述多核苷酸的所期望的扩增片段在混合物中成为主要核酸序列(在浓度方面),它们被认为是“PCR扩增”。如本文所定义,包括多个靶核酸分子的样品内的靶核酸分子通过PCR被扩增。在上述方法的变形例中,所述靶核酸分子可以采用多个不同的引物对进行PCR扩增,在一些情况下,每个感兴趣的靶核酸分子一个或多个引物对,从而形成多重PCR反应。采用多重PCR,能够从样品同时扩增多个感兴趣的核酸分子以形成扩增的靶序列。还能够通过几种不同的方法(例如,用生物分析仪或qPCR定量,用标记的探针杂交;掺入生物素标记的引物接着抗生物素蛋白-酶缀合检测;向所扩增的靶序列掺入32P标记的脱氧核苷三磷酸,如dCTP或dATP)检测所扩增的靶序列。用合适的引物组可以扩增任何寡核苷酸序列,从而允许从基因组DNA、cDNA、***固定石蜡包埋DNA、细针活检和各种其它来源扩增靶核酸分子。特别是,通过如本文所公开的多重PCR过程所创建的扩增的靶序列,其自身是用于后续PCR扩增或各种下游测定或操作的有效底物。
如本文所定义,“多重扩增”是指采用至少一个靶特异性引物在样品内两个或更多个靶序列的选择性和非随机扩增。在一些实施方案中,多重扩增是这样进行的,使得一些或所有的靶序列在单个反应容器内被扩增。给定多重扩增的“丛(plexy)”或“丛(plex)”通常是指在该单个多重扩增过程中扩增的不同靶特异性序列的数量。在一些实施方案中,所述丛(plexy)可以是大约12-丛(plex)、24-丛、48-丛、96-丛、100-丛、130-丛、192-丛、384-丛、768-丛、1536-丛、3072-丛、6144-丛或更高。
用于人身份识别(human identification)的SNP组。本文公开了单核苷酸多态性(SNP)区域的组(panel),其对于特异性识别人身份尤其有用,因为每组(set)显示出高的平均杂合度和总的低群体变异性(Rst)。采用用来识别人身份的这些组的任意一个提供了针对个体识别的匹配概率而无需显著依赖于其祖先。这些组可以提供同时常染色体、Y染色体、X染色体和表型SNPs的覆盖,特别是当在高度多路复用下一代测序应用(如Ion TorrentPGMTM或Ion Torrent ProtonTM(Life Technologies))中进行分析时。如接下来的章节所述,多个引物可以被设计为证明引物对适于选择性杂交到SNPs组中的每个SNP区域,并掺入这些下一代测序仪工作流程所需要的设计特征。
在一些实施方案中,本公开内容通常涉及用于避免或减少在核酸分子群体中一个或多个靶核酸分子的选择性扩增过程中扩增假体(例如引物二聚体)的形成的方法、组合物、***、设备和试剂盒。
在一些实施方案中,本公开内容通常涉及从核酸分子群体扩增多个靶特异性序列。在一些实施方案中,所述方法包括将一个或多个靶特异性引物对杂交至所述靶序列,延伸所述引物对的第一引物,从所述核酸分子群体变性所延伸的第一引物产物,将所述延伸的第一引物产物与所述引物对的第二引物杂交,延伸所述第二引物以形成双链产物,以及从所述双链产物消化掉所述靶特异性引物对以产生多个扩增的靶序列。在一些实施方案中,所述消化包括从所扩增的靶序列的一个或多个所述靶特异性引物的部分消化。在一些实施方案中,所述扩增的靶序列可以被连接至一个或多个接头。在一些实施方案中,所述接头可以包括一个或多个DNA条形码或标签序列。在一些实施方案中,一旦被连接至接头,所述扩增的靶序列可以进行切口平移反应和/或进一步的扩增以产生接头连接的扩增的靶序列的文库。
在一些实施方案中,本公开内容通常涉及多个靶特异性扩增子的制备和形成。在一些实施方案中,所述方法包括将一个或多个靶特异性引物对杂交至核酸分子,延伸所述引物对的第一引物,从所述核酸分子变性所延伸的第一引物,将所述延伸的第一引物产物与所述引物对的第二引物杂交并延伸所述第二引物,消化所述靶特异性引物对以产生多个靶特异性扩增子。在一些实施方案中,在进行切口平移反应之前接头可以被连接至所述靶特异性扩增子的末端以产生适于核酸测序的多个靶特异性扩增子。在一些实施方案中,所述一个或多个靶特异性扩增子可以采用桥扩增或emPCR被扩增以产生适用于核酸测序的多个克隆模板。在一些实施方案中,本公开内容通常涉及用于准备靶特异性扩增子文库的方法,用于各种下游过程或测定(如核酸测序或克隆扩增)。在一些实施方案中,本公开内容涉及采用具有可切割的基团的引物,对具有多个靶序列的核酸样品进行靶特异性多重PCR的方法。
在一个实施方案中,要被采用Ion Torrent PGMTM或Ion Torrent ProtonTM***测序的核酸模板可以采用本文所述的靶特异性扩增技术从核酸分子群体进行制备。任选地,在靶特异性扩增之后可以进行二级和/或三级扩增过程包括但不限于文库扩增步骤和/或克隆扩增步骤(如emPCR)。
在一些实施方案中,本公开内容涉及包含多个靶特异性引物对的组合物,每个含有正向引物和反向引物,其具有位于a)3'端或5'端,和/或b)所述靶特异性引物的大约中央核苷酸的位置的至少一个可切割的基团,并且其中所述靶特异性引物对可以与所述组合物中的其它引物对基本上非互补。在一些实施方案中,所述组合物包含至少10、20、30、40、50、60、70、80、90、100、110、120、130个或更多个靶特异性引物对。在一些实施方案中,所述靶特异性引物对包含长度为大约15个核苷酸到大约40个核苷酸,其中至少一个核苷酸被替换为可切割的基团。在一些实施方案中,所述可切割的基团可以是尿苷核苷酸。在一些实施方案中,所述靶特异性引物组被设计为扩增多于一个单核苷酸多态性(SNP),并且在一些实施方案中,所述靶特异性引物组被设计为扩增一组SNPs。在一些实施方案中,当如本文所述与靶序列杂交并扩增时,所述靶特异性引物对能够产生长度大约100个至大约500个碱基对的接头连接的扩增的靶序列的文库。在一些实施方案中,与所述文库中剩余的接头连接的扩增的靶序列相比,没有一个接头连接的扩增的靶序列在所述文库中被过表达大于30%。在一些实施方案中,所述接头连接的扩增的靶序列文库就GC含量、扩增的靶序列长度或解链温度(Tm)而言基本上是均匀的(homogenous)。
在一些实施方案中,本公开内容通常涉及用于进行多重PCR的试剂盒,其包含具有可切割的基团的多个靶特异性引物、DNA聚合酶、接头、dATP、dCTP、dGTP和dTTP。在一些实施方案中,所述可切割的基团可以是尿嘧啶核苷酸。所述试剂盒可以进一步包括一种或多种抗体、核酸条形码、纯化溶液或柱。
在一些实施方案中,本公开内容通常涉及用于产生靶特异性扩增子文库的试剂盒,其包含具有可切割的基团的多个靶特异性引物、DNA聚合酶、接头、dATP、dCTP、dGTP、dTTP和切割试剂。在一些实施方案中,所述试剂盒可以进一步包括一种或多种抗体、核酸条形码、纯化溶液或柱。
在一个实施方案中,本公开内容通常涉及从单个核酸来源或样品的多个靶特异性序列的扩增。在另一个实施方案中,本公开内容通常涉及从两个或更多个核酸来源、样品或物质的两个或更多个靶序列的靶特异性扩增。例如,可以由本公开内容想到的是,单个核酸样品可以包括基因组DNA或***固定石蜡包埋(FFPE)DNA。还可以想到的是,所述样品可以来自单个个体、来自遗传相关成员的核酸样品的集合、来自遗传不相关的成员的多个核酸样品、来自单个个体的多个核酸样品(匹配的)(如肿瘤样品和正常组织样品)、来自含有两个不同形式的遗传物质的单个来源的遗传物质(如从母体受试者获得的母体和胎儿DNA)、或含有植物或动物DNA的样品中污染的细菌DNA的存在。在一些实施方案中,所述核酸物质来源可以包括从新生儿获得的核酸,例如如典型地作为用于新生儿筛查的血液样品所获得的。
所述核酸样品可以包括高分子量物质(如基因组DNA或cDNA)。所述样品可以包括低分子量物质(如从FFPE或存档的DNA样品获得的核酸分子)。在另一个实施方案中,低分子量物质包括酶法或机械剪切的DNA。所述样品可以包括无细胞的循环DNA(如从母体受试者获得的物质)。在一些实施方案中,所述样品可以包括从活检、肿瘤、刮片、拭子、血液、粘液、尿液、血浆、***、毛发、激光捕获显微切片、手术切除物和其它临床或实验室获得的样品获得的核酸分子。在一些实施方案中,所述样品可以包括法医样品。
在一些实施方案中,所述样品可以包括从人类来源所获得的核酸分子。在其它实施方案中,所述样品可以具有从人获得的核酸分子并还含有来自植物、细菌、病毒、真菌或非人动物的污染核酸。在一些实施方案中,所述核酸分子来源可以是存档的或灭绝的样品或物种。
在一些实施方案中,本公开内容通常涉及来自组织、活检、核(core)、肿瘤、流体、法医或其它生物样品的至少一种靶序列的选择性扩增。在一些实施方案中,本公开内容通常涉及样品中至少一种靶序列的选择性扩增和突变的检测和/或识别。在一些实施方案中,所述样品可以包括全基因组DNA、***固定石蜡包埋组织(FFPE)、剪切的或酶法处理的DNA。在一些实施方案中,本公开内容涉及至少一种靶序列的选择性扩增和临床可操作的突变的检测和/或识别。在一些实施方案中,本公开内容涉及与药物抗性或药物敏感性相关的突变的检测和/或识别。在一些实施方案中,本公开内容通常涉及与器官移植或器官排斥相关遗传标志物的识别和/或定量。
在一些实施方案中,本公开内容通常涉及无细胞的循环DNA中至少一种靶序列的选择性扩增。在一些实施方案中,样品中所述至少一种靶序列的选择性扩增包括不同核酸分子的混合物。所述选择性扩增可以任选地伴随着循环DNA中所观察到的突变的检测和/或识别。在一些实施方案中,所述选择性扩增可以任选地伴随着与癌症或遗传性疾病(如代谢、神经肌肉、发育、心血管、自身免疫性或其它遗传疾病)相关的突变的检测和/或识别。
在一些实施方案中,所述靶特异性引物和引物对是能够扩增核酸分子的特定区域的靶特异性序列。在一些实施方案中,所述靶特异性引物可以扩增基因组DNA或cDNA。在一些实施方案中,所述靶特异性引物可以扩增哺乳动物DNA,如人类DNA。在一些实施方案中,选择性扩增所需要的DNA的量可以从大约1ng到1微克。在一些实施方案中,一种或多种靶序列的选择性扩增所需的DNA的量可以是大约1ng、大约5ng或大约10ng。在一些实施方案中,靶序列的选择性扩增所需要的DNA的量是大约10ng至大约200ng。
在一些实施方案中,至少一种靶序列的选择性扩增进一步包括扩增的靶序列的核酸测序。任选地,所述方法进一步包括通过扩增的靶序列的核酸测序识别的样品中存在的突变的检测和/或识别。在一个实施方案中,所述突变可以包括取代、***、倒位、点突变、缺失、错配和易位。在一个实施方案中,所述突变可以包括在拷贝数上的变异。在一个实施方案中,所述突变可以包括生殖系或体细胞突变。
在一些实施方案中,靶特异性引物采用本文所公开的引物标准进行设计。
在一些实施方案中,靶序列或扩增的靶序列涉及从法医样品获得的核酸。在一个实施方案中,法医样品可以包括从犯罪现场获得的核酸、从失踪人员DNA数据库获得的核酸、从与法医调查相关的实验室获得的核酸或包括通过执法机构、一个或多个军事部门或任何这样的部门获得的法医样品。在一些实施方案中,靶序列可以存在于一种或多种体液中,包括但不限于血液、痰液、血浆、***、尿液和血清。在一些实施方案中,靶序列可以从受害者的毛发、皮肤、组织样品、尸检或遗体获得。在一些实施方案中,包括一种或多种靶序列的核酸可以从死亡的动物或人获得。在一些实施方案中,靶序列可以包括从非人DNA(如微生物、植物或昆虫DNA)获得的核酸。在一些实施方案中,靶序列或扩增的靶序列涉及人身份识别(human identification)的目的。在一些实施方案中,本公开内容通常涉及用于识别来自动物(包括人)的核酸样品的方法。在一些实施方案中,本公开内容通常涉及用于识别法医样品的特征的方法。在一些实施方案中,本公开内容通常涉及采用本文所公开的一种或多种靶特异性引物或采用本文所述引物标准制备的一种或多种靶特异性引物的身份识别方法。
在一个实施方案中,含有至少一种靶序列的法医或人身份识别样品可以使用采用本文所述的引物标准所设计的任意一种或多种靶特异性引物进行扩增。在一些实施方案中,含有一种或多种靶序列的法医或人身份识别样品可以通过用被设计为扩增如表1所示的与单核苷酸多态性相关染色体的一个或多个区域的任意一种或多种靶特异性引物扩增所示至少一种或多种靶序列进行识别。至于每个所公开的SNP的参考SNP簇记录(rs#)、NCBI参考序列或上传者的参考号(GenBank登录号)和所述SNP的染色***置(万维网网址ncbi.nlm.nih.gov/projects/SNP/),请参见表A。
表1.含有身份识别有用的SNPs的区域。
Figure BDA0002246933060000371
Figure BDA0002246933060000381
Figure BDA0002246933060000401
Figure BDA0002246933060000411
可以在Ion Torrent PGMTM或者Ion Torrent ProtonTM工作流程中起作用的设计引物的一个方法是通过使用AmpliSeqTM Designer,描述于在下文的进一步详述中和在美国申请序列号13/458,739中。
在一些实施方案中,来自表1中所公开的所有SNP区域的靶序列(条目1-136)被扩增。在其它实施方案中,来自表1中所公开的SNP区域的子集的靶序列被扩增。在一些实施方案中,包括于多重扩增中的SNP区域的组是位于以下位置的SNP区域:rs1004357、rs10092491、rs1019029、rs10500617、rs1058083、rs10768550、rs10773760、rs10776839、rs12480506、rs12997453、rs13134862、rs13182883、rs13218440、rs1358856、rs1410059、rs1478829、rs1490413、rs1498553、rs1523537、rs1554472、rs159606、rs1736442、rs1821380、rs1872575、rs2073383、rs214955、rs2175957、rs2255301、rs2269355、rs2270529、rs2272998、rs2291395、rs2292972、rs2342747、rs2567608、rs2811231、rs2833736、rs321198、rs338882、rs3744163、rs3780962、rs4288409、rs430046、rs4530059、rs4606077、rs464663、rs4789798、rs521861、rs560681、rs576261、rs590162、rs6444724、rs6591147、rs6811238、rs689512、rs6955448、rs7041158、rs7229946、rs740598、rs7520386、rs7704770、rs8070085、rs891700、rs901398、rs9546538、rs9606186、rs985492、rs9866013、rs987640、rs9951171、rs1005533、rs1024116、rs1028528、rs1029047、rs10495407、rs1355366、rs1357617、rs1382387、rs1413212、rs1454361、rs1463729、rs1493232、rs1886510、rs1979255、rs2040411、rs2056277、rs2107612、rs2111980、rs251934、rs354439、rs717302、rs719366、rs722098、rs727811、rs729172、rs733164、rs735155、rs737681、rs873196、rs876724、rs914165、rs917118和rs964681(表1中的条目1-103)。在又一个实施方案中,一组SNP区域是条目1-70。进一步的实施方案提供了其为条目71-103的一组SNP区域。
在一个实施方案中,含有一个或多个靶序列的样品可以采用针对如本文所公开的特定染色体的SNP承载区域的任何一个或多个所述靶特异性引物进行扩增。在另一个实施方案中,采用本文所公开的方法(及相关组合物、***、设备和试剂盒)扩增的靶序列可以与下游过程(如但不限于核酸测序)偶联。例如,一旦扩增的靶序列的核酸序列已知,所述核酸序列可以与一个或多个参考样品(如Hg19基因组)进行比较。所述Hg19基因组通常被用于基因组学领域作为人的参考基因组样品。在一些实施方案中,疑似含有一个或多个SNPs的样品可以通过用针对特定染色体的SNP承载区域的任何一个或多个所述靶特异性引物扩增所述疑似含有所述SNP的样品来进行识别。因此,来自扩增操作的输出可以任选地例如通过核酸测序进行分析来确定基于所述靶特异性引物的预期扩增产物是否存在于所述扩增输出中。合适的SNP或STR扩增产物的识别可以在一些情况下提供关于所述样品的来源或其特征的额外信息(例如,男性或女性样品或特定祖先起源的样品)。
可以想到的是,无需过度实验,本领域的普通技术人员可以容易地使用本文所公开的引物标准制备一种或多种靶特异性引物。
在一些实施方案中,与人身份识别相关的至少一种所述靶特异性引物在3'端包括非可切割的核苷酸。在一些实施方案中,在3'端的所述非可切割的核苷酸包括末端3'核苷酸。
在一些实施方案中,本公开内容通常涉及用于减少多重PCR中扩增假体的形成的方法(及相关组合物、***、设备和试剂盒)。在一些实施方案中,与现有技术的标准多重PCR相比,获得更低的数量或产率的引物二聚体或非特异性扩增产物。在一些实施方案中,扩增假体的减少部分地由所述多重PCR反应中靶特异性引物对的使用决定。在一个实施方案中,所述多重PCR反应中靶特异性引物对的数量可以大于1000、3000、5000、10000、12000个或更多个。在一些实施方案中,本公开内容通常涉及用于采用含有可切割的基团的靶特异性引物进行多重PCR的方法(及相关组合物、***、设备和试剂盒)。在一个实施方案中,含有可切割的基团的靶特异性引物可以包括一个或多个可切割的部分/每个引物对的引物。在一些实施方案中,含有可切割的基团的靶特异性引物包括既不正常存在于非疾病的样品中的也不是天然存在于进行多重PCR的核酸群体中的核苷酸。例如,靶特异性引物可以包括一种或多种非天然的核酸分子,例如但不限于胸腺嘧啶二聚体、8-氧代-2'-脱氧鸟苷、肌苷、脱氧尿苷、溴脱氧尿苷、无嘌呤核苷酸等。
在一些实施方案中,所公开的方法(及相关组合物、***等)涉及从核酸群体进行靶序列的初级扩增,任选地采用靶特异性引物。在一些实施方案中,所公开的方法涉及采用靶特异性正向和反向引物对扩增靶序列。所述靶特异性正向和反向引物对可以任选地包括一个或多个内含子特异性和/或外显子特异性正向和反向引物对。在一些实施方案中,每个引物对针对单个或离散(discrete)的外显子。在一些实施方案中,所公开的方法涉及采用含有至少一个可切割的基团的外显子特异性正向和反向引物对扩增靶序列。在一些实施方案中,所述靶特异性正向和反向引物对含有作为所述一个或多个可切割的基团的尿嘧啶核苷酸。在一个实施方案中,靶特异性引物对可以在每个引物对的所述正向和反向引物的每一个引物中包括尿嘧啶核苷酸。在一个实施方案中,靶特异性正向或反向引物含有一个、两个、三个或更多个尿嘧啶核苷酸。在一些实施方案中,所公开的方法涉及从具有多个靶序列的核酸群体中采用含有至少两个尿嘧啶核苷酸的靶特异性正向和反向引物对扩增至少10、20、30、40、50、60、70、80、90、100、110、120、130种或更多种靶序列。
在一些实施方案中,靶特异性引物(包括但不限于内含子特异性和外显子特异性引物,其可以是正向和/或反向引物)可以采用根据指定的设计标准产生寡核苷酸序列的算法从头(de novo)设计。例如,可以根据本文所指定的任意一个或多个标准选择所述引物。在一些实施方案中,一个或多个所述的靶特异性引物被选择或被设计以满足任意一个或多个以下的标准:(1)在所述引物序列内包括两个或更多个修饰的核苷酸,其中至少之一被包括于接近或在所述引物的末端并且其中至少之一被包括在或大约所述引物序列的中央核苷酸的位置;(2)引物长度长大约15个至大约40个碱基;(3)从大约60℃至大约70℃的Tm;(4)与所述靶基因组或感兴趣的样品中存在的非靶序列低的交叉反应性;(5)对于给定反应中的每个引物,至少前四个核苷酸(从3'到5'的方向)的序列与同一反应中存在的任何其它引物内的任何序列不互补;以及(6)没有扩增子包括与任何其它扩增子内的任何序列互补的至少5个核苷酸的任何连续串。
在一些实施方案中,所述靶特异性引物包括被设计为从所述样品扩增靶序列的一个或多个引物对,其长为大约100个碱基对至大约500个碱基对。在一些实施方案中,所述靶特异性引物包括被设计为扩增靶序列的多个引物对,其中所扩增的靶序列被预测为长度彼此差异不超过50%,典型地不超过25%,甚至更典型地不超过10%,或5%。例如,如果一个靶特异性引物对被选择为或预测为扩增长100个核苷酸的产物,那么其它引物对被选择为或预测为扩增长度在50-150个核苷酸之间的产物,典型地长度在75-125个核苷酸之间,甚至更典型地长度在90-110个核苷酸、或95-105个核苷酸、或99-101个核苷酸之间。
在一些实施方案中,在所述扩增反应中的至少一个引物对不是根据任何预先确定的选择标准从头(de novo)设计。例如,至少一个引物对可以是随机选择或产生或者是之前针对其它应用选择或产生的寡核苷酸序列。在一个示例性的实施方案中,所述扩增反应可以包括从
Figure BDA0002246933060000451
探针试剂(Roche Molecular Systems)选择的至少一个引物对。所述
Figure BDA0002246933060000452
试剂包括标记的探针,并且可以特别是针对测量所述样品中存在的靶序列的量是有效的,任选地以实时的方式。TaqMan技术的一些例子被公开于美国专利号5,210,015、5,487,972、5,804,375、6,214,979、7,141,377和7,445,900,其全文作为参考引入。
在一些实施方案中,在所述扩增反应内的至少一个引物可以是被标记的(例如用光学可检测的标记)以促进特定的感兴趣的应用。例如,标记可以促进靶模板和/或扩增产物的定量、所述靶模板和/或扩增产物的分离等。
在一些实施方案中,所述靶特异性引物可以作为单个扩增容器中的靶特异性引物对的组被提供。在一些实施方案中,所述靶特异性引物可以一个或多个等份的靶特异性引物对的方式被提供,所述引物对可以在进行所述PCR反应之前被汇集于单个扩增容器或反应室中。在一个实施方案中,所述靶特异性引物可以作为靶特异性正向引物池和靶特异性反向引物的单独池被提供。在另一个实施方案中,靶特异性引物对可以被汇集成子集,如非重叠的靶特异性引物对。在一些实施方案中,所述靶特异性引物对池可以被提供于单个反应室或微孔中(例如在PCR板上)以采用热循环仪进行多重PCR。在一些实施方案中,所述靶特异性正向和反向引物对可以与所述靶序列基本上互补。
在一些实施方案中,所述进行多重PCR扩增的方法包括将具有正向和反向引物的多个靶特异性引物对与靶序列群体接触以形成多个模板/引物双链体;向所述多个模板/引物双链体加入DNA聚合酶和dNTPs混合物持续足够的时间并于足够的温度通过模板依赖性的合成延伸每个靶特异性引物对中的正向引物或者反向引物(或二者),从而产生多个延伸的引物产物/模板双链体;变性所述延伸的引物产物/模板双链体;将所述延伸的引物产物与来自所述靶特异性引物对的互补引物进行退火;并在DNA聚合酶和dNTPs存在下延伸所退火的引物以形成多个靶特异性双链核酸分子。在一些实施方案中,所述扩增PCR方法的步骤可以任何顺序进行。在一些情况下,本文所公开的方法可以进一步被优化以去除一个或多个步骤并仍然获得足够扩增的靶序列用于各种下游过程。例如,可以修改纯化或清理步骤的数量以包括比本文所公开的更多或更少的步骤,只要所扩增的靶序列以足够的产率产生即可。
在一些实施方案中,所述靶特异性引物对在所述引物的3'端或5'端不含有常见延伸(尾)。在另一个实施方案中,所述靶特异性引物不含有标签或通用序列。在一些实施方案中,所述靶特异性引物对被设计为消除或减少促进非特异性扩增形成的相互作用。
在一个实施方案中,所述靶特异性引物对包含至少一个可切割的基团/正向和反向靶特异性引物。在一个实施方案中,所述可切割的基团可以是尿嘧啶核苷酸。在一个实施方案中,所述靶特异性引物对在所述扩增的靶序列产生之后被部分地或基本上去除。在一个实施方案中,所述去除可以包括作为所述扩增的靶序列的部分的所述靶特异性引物对的酶、热或碱处理。在一些实施方案中,所述扩增的靶序列被进一步处理以形成平端扩增产物(在本文中称为平端扩增的靶序列)。
在一些实施方案中,所述方法、组合物、试剂盒、***和设备中所公开的所述靶特异性引物的任意一个或多个可以采用以下引物选择标准进行设计。
根据体现在本申请中的教导和原则,提供了新的方法、计算机可读介质和***,其识别或设计产物或试剂盒,其采用PCR富集一个或多个基因组区域或感兴趣的靶标用于后续测序和/或其包括在最小化一个或多个偏离靶标的杂交的同时最大化覆盖一个或多个基因组区域或感兴趣的靶标的引物或测定、若干引物和若干引物池。
图3示出了根据示例性的实施方案用于设计引物或测定的***。所述***包括数据接收模块1701、引物提供模块1702、评分(计算机模拟(in silico)PCR)模块1703、评分(SNP重叠)模块1704、过滤模块1705、汇集(pooling)模块1706和报告模块1707。所述***还包括数据库1708,其可以包括关于遗传注释的数据、SNP相关数据或其它遗传信息(如重复、染色体、位置、方向等的识别)或其它可能与感兴趣的基因组区域或靶标相关的任何其它类型的信息,以及数据库1709,其可以包括引物相关的数据(如解链温度(Tm)、染色体、位置、方向和SNP重叠信息等)或其它可能与引物相关的任何其它类型的信息。所述***可以在使用一个或多个软件组件的一个或多个计算机和/或服务器中运行或使用其来运行,所述软件组件可能是订购可使用这样的***设计的订制引物或测定的客户所不能访问的或者该软件组件不被发布给所述客户。客户可以至少部分地通过提供任何合适的形式的一个或多个感兴趣的基因组区域或靶标通过网络可访问的数据门户网站订购定制引物或测定。在一个示例性的实施方案中,提供了进行包括与模块1701-1707和数据库1708和1709相关的一般步骤的步骤的方法(例如,接收数据,提供引物,对引物和/或扩增子进行评分,过滤引物和/或扩增子,汇集引物和/或扩增子,报告结果,以及查询数据库)。
图4示出了根据示例性的实施方案用于设计引物或测定的***。所述***包括靶标生成器模块,其可以产生一个或多个基于坐标的感兴趣的基因组区域或靶标并且其可以查询注释数据库和/或从注释数据库接收信息(其可以包括关于遗传注释的数据、SNP相关数据或其它遗传数据(如重复、染色体、位置、方向等的识别)以及关于引物的信息或其它可能与感兴趣的基因组区域或靶标相关的任何其它类型的信息);设计模块,其可以设计一个或多个引物或测定并确定和/或应用针对所述引物或测定的各种评分和过滤操作并且可以进行各种质量控制操作;加载器模块,其可以将所述引物或测定和/或相关信息(如质量控制结果)加载至引物数据库(其可以与所述注释数据库进行通信或包含于所述注释数据库内并且其可以包括引物相关数据(如解链温度(Tm)、染色体、位置、方向和SNP重叠信息等)或其它可能与引物相关的任何其它类型的信息);SNP重叠/重复重叠模块;驱动器模块;tiler模块,其可以确定使感兴趣的基因组区域或靶标的覆盖最大化的扩增子或tile的子集;汇集模块,其可以确定所述扩增子或tile汇集成一个或多个扩增子池;以及报告生成器模块。所述***可以在使用一个或多个软件组件的一个或多个计算机和/或服务器中运行或使用其来运行,所述软件组件可能是订购可使用这样的***设计的定制引物或测定的客户所不能访问的或者该软件组件不被发布给所述客户。客户可以至少部分地通过提供任何合适的形式的一个或多个感兴趣的基因组区域或靶标通过网络可访问的数据门户网站订购定制引物或测定。在一个示例性的实施方案中,提供了进行包括与这些模块和数据库相关的一般步骤的步骤的方法。
图5示出了包括由根据示例性实施方案所设计的引物对包围的***序列的扩增子序列。所述扩增子可以包括包围所述***序列的正向引物和反向引物。两个引物可以一起形成测定,其可以被定制和订购。扩增子的引物组分可以是掺入式(spiked-in)引物(而不是内在的样品)和可选择一个或多个掺入物以覆盖靶标。
图6示出了包括由根据示例性实施方案所设计的引物对包围的***序列的扩增子序列(其可被本文称为“tile”)的PCR扩增。图中所示的是最终导致所述扩增子的指数增长的变性、退火和延伸的步骤。
图7示出了用于根据示例性实施方案的tiling和汇集的针对给定靶区域的一组候选扩增子(每个包括由引物对包围的***物)。虚线表示靶区域的边界(在该例子中在染色体19上)。覆盖该例子中的所述靶区域的有112个候选扩增子,但是候选扩增子的数量当然可以是不同的,包括低得多的或高得多的,并且可以通过考虑计算资源、所述靶区域的长度和任何其它相关因素来进行选择。
根据各种示例性实施方案,提供了采用设计流水线(pipeline)用于设计引物的方法,所述设计流水线允许跨感兴趣的基因组区域设计寡核苷酸引物,同时结合包括扩增子大小、引物组成、潜在的偏离靶标的杂交和所述引物的SNP重叠的各种设计标准和考虑。在一个实施方案中,所述设计流水线包括如接下来讨论的可以顺序执行的几个功能模块。
在一个实施方案中,序列检索(retrieval)模块可以被配置为针对客户所期望的最终产物基于操作者的指令检索序列。所述操作者可以要求针对基因组区域的引物对的设计,所述基因组区域可以由染色体和基因组的坐标或通过基因符号标志(gene symboldesignator)来指定。在后者的情况下,所述序列检索模块可以基于外显子坐标检索所述序列。所述操作者还可以指定是否包括5'UTR序列(非编码序列)。
本发明还可以提供被配置为采用设计引擎设计引物对的测定设计模块,所述设计引擎可以例如公共工具(如Primer3或是能够由所述序列检索模块跨完整的序列区域检索而产生引物对的另一个引物设计软件)。所述引物对可以被选择成密集地跨所述核苷酸序列进行tile。所述引物设计可以基于各种参数,包括:(1)所述引物的解链温度(其可以通过John SantaLucia,Jr.,“A unified view of polymer,dumbbell,and oligonucleotideDNA nearest-neighbor thermodynamics,”Proc.Natl.Acad.Sci.USA,vol.95,1460-1465(1998)(其内容的全文作为参考引入本文)中所述的最近邻(nearest neighbor)算法进行计算),(2)所述引物的组成(例如,核苷酸组成(如GC含量)可以通过该软件确定和过滤并进行罚分,如可以是引物发夹的形成,引物3'端中GC含量的组成,以及可以被评估的具体的参数是均聚核苷酸的延伸(stretch)、发夹形成、GC含量和扩增子大小),(3)正向引物、反向引物和扩增子的分数(所述分数可以被加起来获得探针组分数,并且所述分数可以反映所述扩增子确认与预期参数是如何接近),以及(4)T's到U's的某种转换(可以放置T使得引物由T分隔的片段的预测的Tm具有最小的平均Tm)。
在一个实施方案中,引物作图(mapping)模块可以被配置为采用作图软件(例如,e-PCR(NCBI),参见Rotmistrovsky et al.,“A web server for performing electronicPCR,”Nucleic Acids Research,vol.32,W108-W112(2004)和Schuler,“Sequence Mappingby Electronic PCR,”Genome Research,vol.7,541-550(1997),二者全文作为参考引入本文,或其它类似软件)将引物作图(map)至基因组。所述引物作图可以采用错配矩阵进行评分。在一个实施方案中,完美匹配可以得到0分,并且错配的引物可以得到大于0的得分。所述错配矩阵考虑所述错配的位置和错配的性质。例如,错配矩阵可以将错配得分分配给具有特定位置(例如,3'端的碱基,5'端的碱基以及其之间的位置)的特定基序的每个组合(例如,AA、AC、AG、CA、CC、CT、GA、GG、GT、TC、TG、TT、A-、C-、G-、T-、-A、-C、-G和-T,其中‘-’表示不明确的碱基或缺口),其可以根据经验得出并且可以被选择成反映更接近3'端的错配比更接近5'端的错配更倾向于使PCR反应更差并因此通常更大。具有不明确的碱基或缺口的基序的错配得分可以分配为与其相一致的其它基序的平均得分(例如,A-可以被分配为AA、AC和AG的平均得分)。基于具有一定分数阈值的命中的数量,可以计算扩增子的成本。
在另一个实施方案中,SNP模块可以被配置为确定基础的(underlying)SNPs和重复区域:SNPs可以被作图至所述引物并基于SNP离3'端的距离,引物可以被过滤为潜在的候选者。类似地,如果引物与重复区域重叠至一定程度,所述引物可以被过滤。
另外,在一个实施方案中,汇集模块可以被配置为采用防止扩增子重叠的汇集算法并确保池中引物的平均数不偏离超过预定值。
图8示出了根据示例性实施方案的方法。在步骤2201中,模块或其它硬件和/或软件组件接收一个或多个感兴趣的基因组区域或序列。在步骤2202中,模块或其它硬件和/或软件组件针对所接收的一个或多个感兴趣的基因组区域或序列确定一个或多个靶序列。在步骤2203中,模块或其它硬件和/或软件组件针对所确定的一个或多个靶序列的每一个提供一个或多个引物对。在步骤2204中,模块或其它硬件和/或软件组件对所述一个或多个引物对进行评分,其中所述评分包括基于针对所述一个或多个引物对进行计算机模拟(insilico)PCR的罚分,并且其中所述评分还包括针对所述一个或多个引物对的SNP重叠的分析。在步骤2205中,模块或其它硬件和/或软件组件基于多个因素(其包括至少所述罚分和所述SNP重叠分析)过滤所述一个或多个引物对以针对所述一个或多个感兴趣的基因组区域或序列识别相应于一个或多个候选扩增子序列的一组过滤的引物对。
根据示例性的实施方案,提供了一种方法,其包括:(1)接收一个或多个感兴趣的基因组区域或序列;(2)针对所接收的一个或多个感兴趣的基因组区域或序列确定一个或多个靶序列;(3)针对所确定的一个或多个靶序列的每一个提供一个或多个引物对;(4)对所述一个或多个引物对进行评分,其中所述评分包括基于针对所述一个或多个引物对进行计算机模拟(in silico)PCR的罚分,并且其中所述评分还包括针对所述一个或多个引物对的SNP重叠的分析;以及(5)基于多个因素(其包括至少所述罚分和所述SNP重叠分析)过滤所述一个或多个引物对以针对所述一个或多个感兴趣的基因组区域或序列识别相应于一个或多个候选扩增子序列的一组过滤的引物对。
在各种实施方案中,接收一个或多个感兴趣的基因组区域或序列可以包括接收一个或多个基因符号或标志(identifier)的列表。接收一个或多个感兴趣的基因组区域或序列可以包括接收一个或多个基因组坐标或其它基因组位置标志(identifier)的列表。接收一个或多个感兴趣的基因组区域或序列可以包括接收一个或多个BED坐标的列表。
在各种实施方案中,确定一个或多个靶序列可以包括确定相应于所述一个或多个感兴趣的基因组区域或序列的一个或多个外显子或编码区域。确定一个或多个靶序列可以包括查询扩增子或其它基因组序列数据中所述一个或多个感兴趣的基因组区域或序列及其相关信息的存在。
在各种实施方案中,提供一个或多个引物对可以包括设计一个或多个引物对。提供一个或多个引物对可以包括包括查询扩增子或其它基因组序列数据中所述一个或多个感兴趣的基因组区域或序列或者所述一个或多个引物对及其相关信息的存在。
在各种实施方案中,进行计算机模拟(in silico)PCR可以包括对任何物种的参考或之前测序过的基因组进行计算机模拟(in silico)PCR。进行计算机模拟(in silico)PCR可以包括对hg19参考基因组进行计算机模拟(in silico)PCR。对参考基因组进行计算机模拟(in silico)PCR可以包括针对所述一个或多个引物对的每一个确定若干偏离靶标的杂交。对参考基因组进行计算机模拟(in silico)PCR可以包括针对所述一个或多个引物对的每一个确定最差情况下的属性(attribute)或得分。进行计算机模拟(in silico)PCR可以包括针对所述一个或多个引物对的每一个确定一个或多个基因组坐标。进行计算机模拟(in silico)PCR可以包括针对所述一个或多个引物对的每一个确定一个或多个预测的扩增子序列。进行计算机模拟(in silico)PCR可以包括查询扩增子或其它基因组序列数据中所述一个或多个感兴趣的基因组区域或序列或者针对所述一个或多个引物对的计算机模拟(in silico)PCR结果及其相关信息的存在。
在各种实施方案中,所述SNP重叠分析可以包括针对所述一个或多个引物对的每一个确定SNP分类。所述SNP重叠分析可以包括包括查询扩增子或其它基因组序列数据中所述一个或多个感兴趣的基因组区域或序列或者针对所述一个或多个引物对的SNP重叠结果及其相关信息的存在。
在各种实施方案中,所述多个因素包括指示正向SNP重叠、指示反向SNP重叠、指示正向重复的频率、指示反向重复的频率、指示所述一个或多个引物对的每一个的偏离靶标的杂交和所述一个或多个引物对的每一个的组成中的一个或多个。所述多个因素可以包括正向三重(triplet)因子、反向三重因子、正向A运行(run)因子、反向A运行因子、正向C运行因子、反向C运行因子、正向G运行因子、反向G运行因子、正向T运行因子和反向T运行因子中的一个或多个。所述多个因素可以包括一个或多个所述一个或多个引物对的每一个包括一个或多个均聚物所达到的程度的指示。所述多个因素可以包括一个或多个所述一个或多个引物对的每一个包括一个或多个重复序列所达到的程度的指示。所述多个因素可以包括所述一个或多个引物对的长度,其中所述一个或多个引物对的得分随着所述长度比最小长度阈值变得更短而降低,并且随着所述长度比最大长度阈值变得更长而降低。所述多个因素可以包括在所述一个或多个引物对中给定碱基的最大数量,其中所述一个或多个引物对的得分随着所述给定碱基的情况中的数量超过最大碱基包含(inclusion)阈值而降低。所述多个因素可以包括给定碱基的连续情况的最大数量,其中所述一个或多个引物对的得分随着所述给定碱基的连续情况中的数量超过最大连续碱基包含(inclusion)阈值而降低。
所述多个因素可以包括一组两个给定碱基的最大百分比,其中所述一个或多个引物对的得分随着所述两个给定碱基的百分比提高而降低。所述多个因素可以包括G和C碱基的最大百分比,其中所述一个或多个引物对的得分随着所述G和C碱基的百分比提高而降低。所述多个因素可以包括所述一个或多个引物对的预测的解链温度相对于最小和最大解链温度阈值的偏差。所述多个因素可以包括所述一个或多个引物对的若干引物二聚体夹杂物(inclusion)。所述多个因素可以包括所述一个或多个引物对的局部互补的水平。所述多个因素可以包括所述一个或多个引物对的每一个的复杂水平的指示。所述多个因素可以包括所述一个或多个引物的每一个的SNP重叠的指示。
在各种实施方案中,所述方法可以包括选择基本上覆盖所述一个或多个感兴趣的基因组区域或序列同时最小化与所述候选扩增子序列相关的成本功能(cost function)的所述一个或多个候选扩增子序列的子集。最小化所述成本功能可以包括产生包含源顶点、一个或多个扩增子顶点和sink顶点的重叠图。
在各种实施方案中,所述方法可以包括将与所选择的所述一个或多个候选扩增子序列的子集一致的所述的一组过滤的引物对中的引物对组装成多个单独的引物对池。组装所述引物对可以包括将与所选择的所述一个或多个候选扩增子序列的子集一致的所述的一组过滤的引物对中的一个或多个引物对的包含(inclusion)至少基于给定池中扩增子序列之间的最小阈值距离限制入所述给定池。所述最小阈值距离可以例如在大约5个碱基对到大约100个碱基对之间、或在大约15个碱基对到大约90个碱基对之间、或在大约25个碱基对到大约75个碱基对之间、或在大约40个碱基对到大约60个碱基对之间。在一些实施方案中,在扩增子之间的所述最小阈值距离可以包括任何整数,包括负整数。例如,0的值可以意味着任意两个扩增子被允许“触碰(touch)”,并且-8的值可以意味着任意两个扩增子可以重叠多达(up to)8个碱基。
在各种实施方案中,将所述的一组过滤的引物对组装成多个单独的引物对池可以包括拆分管间的引物对以防止任何给定管内的扩增子重叠。组装所述引物对可以包括将与所选择的所述一个或多个候选扩增子序列的子集一致的所述的一组过滤的引物对中的一个或多个引物对的包含(inclusion)至少基于给定池预先确定的扩增子容量(capacity)限制入所述给定池。组装所述引物对可以包括将与所选择的所述一个或多个候选扩增子序列的子集一致的所述的一组过滤的引物对中的一个或多个引物对的包含(inclusion)至少基于具有在所述单独池的平衡因子和大小的最大值之间的产物的给定池的大小相关的不均(inequality)限制入所述给定池。
在各种实施方案中,所述方法可以包括提供报告由所述接收、提供、评分、过滤、选择和组装步骤的任何一个或多个所使用或所产生的数据信息的任何一个或多个元素(element)的报告。
根据示例性的实施方案,提供了包含当由处理器执行时使得所述处理器执行方法的指令的非临时性机器可读存储介质,其包括:(1)接收一个或多个感兴趣的基因组区域或序列;(2)针对所接收的一个或多个感兴趣的基因组区域或序列确定一个或多个靶序列;(3)针对所确定的一个或多个靶序列的每一个提供一个或多个引物对;(4)对所述一个或多个引物对进行评分,其中所述评分包括包括基于针对所述一个或多个引物对进行计算机模拟(in silico)PCR的罚分,并且其中所述评分还包括针对所述一个或多个引物对的SNP重叠的分析;以及(5)基于多个因素(其包括至少所述罚分和所述SNP重叠分析)过滤所述一个或多个引物对以针对所述一个或多个感兴趣的基因组区域或序列识别相应于一个或多个候选扩增子序列的一组过滤的引物对。
在各种实施方案中,这样的非临时性机器可读存储介质可以包含当由处理器执行时使得所述处理器执行方法的指令,其还包括:(6)选择基本上覆盖所述一个或多个感兴趣的基因组区域或序列同时最小化与所述候选扩增子序列相关的成本功能的所述一个或多个候选扩增子序列的子集;以及(7)将与所选择的所述一个或多个候选扩增子序列的子集一致的所述的一组过滤的引物对中的引物对组装成多个单独的引物对池。
根据示例性的实施方案,提供了***,其包括:(1)机器可读存储器;以及(2)处理器,其被配置为执行机器可读指令,所述指令(当所述处理器执行时)使得所述***进行以下步骤,包括:(a)接收一个或多个感兴趣的基因组区域或序列;(b)针对所接收的一个或多个感兴趣的基因组区域或序列确定一个或多个靶序列;(c)针对所确定的一个或多个靶序列的每一个提供一个或多个引物对;(d)对所述一个或多个引物对进行评分,其中所述评分包括包括基于针对所述一个或多个引物对进行计算机模拟(in silico)PCR的罚分,并且其中所述评分还包括针对所述一个或多个引物对的SNP重叠的分析;以及(e)基于多个因素(其包括至少所述罚分和所述SNP重叠分析)过滤所述一个或多个引物对以针对所述一个或多个感兴趣的基因组区域或序列识别相应于一个或多个候选扩增子序列的一组过滤的引物对。
在各种实施方案中,这样的***的所述处理器还可以被配置为执行机器可读指令,其(当所述处理器执行时)使得所述***进行以下步骤,包括:(f)选择基本上覆盖所述一个或多个感兴趣的基因组区域或序列同时最小化与所述候选扩增子序列相关的成本功能的所述一个或多个候选扩增子序列的子集;以及(g)将与所选择的所述一个或多个候选扩增子序列的子集一致的所述的一组过滤的引物对中的引物对组装成多个单独的引物对池。
根据各种示例性实施方案,各种参数或标准可以被用于选择引物和/或扩增子。
在一个实施方案中,如果在所述正向引物的给定碱基对长度(例如4)内没有SNP,那么正向SNP得分可以被使用和被给予1的数值属性/得分,或者如果在4碱基对的长度内有一个或多个SNPs,那么所述得分为0的数值属性。在一个实施方案中,如果在从所述正向引物的3'端的给定碱基对长度内没有SNP,那么正向SNP得分可以被给予1的数值属性/得分。在一些实施方案中,SNP可以包括在UCSC的基因组浏览器网页上发现的一个或多个SNPs,包括但不限于被称为“常见dbSNP132(dbSNP132common)”的SNP参考表。1的属性/得分可以是最小属性/得分,使得不能实现该属性/得分会导致被取消资格。针对所述属性/得分确定的碱基长度阈值可以低于或高于4,并且可以是例如5、6、7、8、9、10、15、20,或更通常地是任何大于4的正整数。所述属性/得分可以不是二元的(other than binary)并且可以是所述给定碱基对长度内SNPs数量的更复杂的线性或非线性函数。
在一个实施方案中,如果在所述反向引物的给定碱基对长度(例如4)内没有SNP,那么反向SNP得分可以被使用和被给予1的数值属性/得分,或者如果在4碱基对的长度内有一个或多个SNPs,那么所述得分为0的数值属性。在一个实施方案中,如果在从所述反向引物的3'端的给定碱基对长度内没有SNP,那么反向SNP得分可以被给予1的数值属性/得分。在一些实施方案中,SNP可以包括在UCSC的基因组浏览器网页上发现的一个或多个SNPs,包括但不限于被称为“常见dbSNP132(dbSNP132common)”的SNP参考表。1的属性/得分可以是最小属性/得分,使得不能实现该属性/得分会导致被取消资格。针对所述属性/得分确定的碱基长度阈值可以低于或高于4,并且可以是例如5、6、7、8、9、10、15、20,或更通常地是任何大于4的正整数。所述属性/得分可以不是二元的(other than binary)并且可以是所述给定碱基对长度内SNPs数量的更复杂的线性或非线性函数。
在一个实施方案中,如果在所述正向引物的给定碱基对长度(例如4)内没有重复,那么正向重复得分可以被使用和被给予1的数值属性/得分,或者如果在4碱基对的长度内有一个或多个重复,那么所述得分为0的数值属性。在一个实施方案中,如果所述正向引物与已知重复有小于30%的重叠,那么正向重复得分可以被给予1的数值属性/得分。在一些实施方案中,已知重复可以包括由UCSC的基因组浏览器所报告的一个或多个重复,例如由来自UCSC的所述重复掩蔽(masked)的hg19基因组所提供的重复区域。1的属性/得分可以是最小属性/得分,使得不能实现该属性/得分会导致被取消资格。针对所述属性/得分确定的碱基长度阈值可以低于或高于4,并且可以是例如5、6、7、8、9、10、15、20,或更通常地是任何大于4的正整数。所述属性/得分可以不是二元的(other than binary)并且可以是所述给定碱基对长度内SNPs数量的更复杂的线性或非线性函数。
在一个实施方案中,如果在所述反向引物的给定碱基对长度(例如4)内没有重复,那么反向重复得分可以被使用和被给予1的数值属性/得分,或者如果在4碱基对的长度内有一个或多个重复,那么所述得分为0的数值属性。在一个实施方案中,如果所述反向引物与已知重复有小于30%的重叠,那么反向重复得分可以被给予1的数值属性/得分。在一些实施方案中,已知重复可以包括由UCSC的基因组浏览器所报告的一个或多个重复,例如由来自UCSC的所述重复掩蔽(masked)的hg19基因组所提供的重复区域。1的属性/得分可以是最小属性/得分,使得不能实现该属性/得分会导致被取消资格。针对所述属性/得分确定的碱基长度阈值可以低于或高于4,并且可以是例如5、6、7、8、9、10、15、20,或更通常地是任何大于4的正整数。所述属性/得分可以不是二元的(other than binary)并且可以是所述给定碱基对长度内SNPs数量的更复杂的线性或非线性函数。
在各种实施方案中,正向三重(triplet)得分、反向三重得分、正向A运行(run)得分、反向A运行得分、正向C运行得分、反向C运行得分、正向G运行得分、反向G运行得分、正向T运行得分和反向T运行得分中的一个或多个可以被使用和被给予在完整引物内等于正向三重(triplet)、反向三重、正向A运行(run)、反向A运行、正向C运行、反向C运行、正向G运行、反向G运行、正向T运行和反向T运行的数量的数值属性/得分。3的属性/得分可以是针对所述三重的最大属性/得分,使得不能保持或低于该属性/得分会导致被取消资格。5的属性/得分可以是针对所述运行的最大属性/得分,使得不能保持或低于该属性/得分会导致被取消资格。所述属性/得分可以不是二元的(other than binary)并且可以是所述三重/运行的数量的更复杂的线性或非线性函数。
在一个实施方案中,所述引物的长度可以被最小引物长度阈值和最大引物长度所限制,并且针对所述引物的长度得分可以被设定,使得所述得分随着所述长度比最小引物长度阈值变得更短而降低,并且随着所述长度比最大引物长度阈值变得更长而降低。在一个实施方案中,所述最小引物长度阈值可以是16。在其它的实施方案中,所述最小引物长度阈值可以是例如15、14、13、12、11、10、9、8、7、6或5,并且还可以是例如17、18、19、20、21、22、23和24。在一个实施方案中,所述最大引物长度阈值可以是28。在其它的实施方案中,所述最大引物长度阈值可以是例如29、30、31、32、33、34、35、36、37、38、39和40,并且还可以是例如27、26、25、24、23、22、21和20。在一个实施方案中,例如如果所述长度阈值被满足所述引物长度标准可以被给予1.0的得分,并且该得分可以随着所述引物长度背离(diverge)所述最小或最大长度阈值而降低至0.0。例如,如果所述最大引物长度阈值被设定为28,那么如果所述长度不超过28则所述得分可以被设定为1.0,如果所述长度是29则为0.7,如果所述长度是30则为0.6,如果所述长度是31则为0.5,如果所述长度是32则为0.3,如果所述长度是33则为0.1,并且如果所述长度是34或更长则为0.0。当然,所述属性/得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分在相对于所述阈值的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离长度阈值的引物的得分的增加。
在一个实施方案中,所述引物中G碱基的(或A、C或T碱基的)数量可以被最大阈值限制,并且针对所述引物的相应得分可以被设定,使得所述得分随着所述G碱基的(或A、C或T碱基的)数量超过所述最大阈值而降低。在一个实施方案中,所述最大阈值可以是3。在其它实施方案中,所述最大阈值可以是例如2、4、5、6、7、8、9和10。在一个实施方案中,例如如果所述最大阈值被满足所述G碱基的(或A、C或T碱基的)数量标准可以被给予1.0的得分,并且该得分可以随着所述G碱基的(或A、C或T碱基的)数量背离(diverge)所述最大阈值而降低至0.0。例如,如果所述最大阈值被设定为4,那么如果所述G碱基的(或A、C或T碱基的)数量不超过4则所述得分可以被设定为1.0,如果所述数量是5则为0.9,如果所述数量是6则为0.8,如果所述数量是7则为0.6,如果所述数量是8则为0.4,如果所述数量是9则为0.2,并且如果所述数量是10或更多则为0.0。当然,所述得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分在所述G碱基的(或A、C或T碱基的)数量和所述最大阈值之间的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离所述最大阈值的引物的得分的增加。
在一个实施方案中,所述引物中的环(例如,发夹)中连续和总匹配的数量可以被最大阈值限制,并且针对所述引物的相应得分可以被设定,使得所述得分随着所述环中连续和总匹配的数量超过所述最大阈值而降低。在一个实施方案中,针对连续匹配的所述最大阈值可以是3并且针对总匹配的所述最大阈值可以是5。在其它实施方案中,针对连续匹配的所述最大阈值可以是例如2、4、5、6、7、8、9和10,并且针对总匹配的所述最大阈值可以是例如3、4、6、7、8、9、10、11、12、13、14和15。在一个实施方案中,例如如果所述最大阈值被满足所述环中连续和总匹配的数量标注可以被给予1.0的得分,并且该得分可以随着所述环中连续和总匹配的数量背离相应最大阈值而降低至0.0。例如,如果针对连续匹配的所述最大阈值被设定为3,那么如果所述连续匹配的数量不超过3则所述得分可以被设定为1.0,如果所述数量是4则为0.9,如果所述数量是5则为0.7,如果所述数量是6则为0.4,如果所述数量是7则为0.2,如果所述数量是8则为0.1,并且如果所述数量是9或更多则为0.0。例如,如果针对总匹配的所述最大阈值被设定为5,那么如果所述总匹配的数量不超过5则所述得分可以被设定为1.0,如果所述数量是6则为0.9,如果所述数量是7则为0.8,如果所述数量是8则为0.6,如果所述数量是9则为0.4,如果所述数量是10则为0.2,如果所述数量是11则为0.1,并且如果所述数量是12或更多则为0.0。当然,所述得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分在所述连续/总匹配的数量和所述相应最大阈值之间的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离所述最大阈值的引物的得分的增加。
在一个实施方案中,所述引物的最后五个碱基中G和C碱基的(或A、C、G或T碱基中的任意两个的)数量可以被最大阈值限制,并且针对所述引物的相应得分可以被设定,使得所述得分随着所述G和C碱基的(或A、C、G或T碱基中的任意两个的)数量超过所述最大阈值而降低。在一个实施方案中,所述最大阈值可以是2。在其它实施方案中,所述最大阈值可以是例如3、4和5。在一个实施方案中,例如如果所述最大阈值被满足所述G和C碱基的(或A、C、G或T碱基中的任意两个的)数量标准可以被给予1.0的得分,并且该得分可以随着所述G和C碱基的(或A、C、G或T碱基中的任意两个的)数量背离所述最大阈值而降低至0.0。例如,如果所述最大阈值被设定为2,那么如果所述G和C碱基的(或A、C、G或T碱基中的任意两个的)数量不超过2则所述得分可以被设定为1.0,如果所述数量是3则为0.8,如果所述数量是4则为0.4,并且如果所述数量是5则为0.1。当然,所述得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分在所述G和C碱基的(或A、C、G或T碱基中的任意两个的)数量和所述最大阈值之间的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离所述最大阈值的引物的得分的增加。在其它实施方案中,该标准可以考虑在更大的碱基窗口(例如在最后六个碱基、最后七个碱基、最后八个碱基等)中的所述G和C碱基的(或A、C、G或T碱基中的任意两个的)数量。
在一个实施方案中,所述引物中G和C碱基的(或A、C、G或T碱基中的任意两个的)百分比可以被最小和最大阈值限制,并且针对所述引物的相应得分可以被设定,使得所述得分随着所述G和C碱基的(或A、C、G或T碱基中的任意两个的)百分比背离所述最小或最大阈值而降低。在一个实施方案中,所述最小阈值可以是0.2(20%)并且所述最大阈值可以是0.8(80%)。在其它实施方案中,例如,所述最小阈值可以是在大约0.2(20%)到大约0.5(50%)之间的任意百分比,并且所述最大阈值可以是在大约0.8(80%)到大约0.5(50%)之间的任意百分比。在一个实施方案中,例如如果所述最小和最大阈值被满足所述G和C碱基的(或A、C、G或T碱基中的任意两个的)百分比标准可以被给予1.0的得分,并且如果所述阈值任一个均不被满足则该得分可以降低至0.0。当然,所述得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分在所述G和C碱基的(或A、C、G或T碱基中的任意两个的)百分比和所述最小或最大阈值之间的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离所述最小或最大阈值的引物的得分的增加。
在一个实施方案中,所述引物的解链温度(Tm)可以被最小和最大阈值限制,并且针对所述引物的相应得分可以被设定,使得所述得分随着所述解链温度背离所述最小或最大阈值而降低。在一个实施方案中,所述最小阈值可以是60并且所述最大阈值可以是具有62的靶标解链温度的67。在其它实施方案中,例如,所述最小阈值可以是在大约55到大约65之间的值,并且所述最大阈值可以是在大约62到大约72之间的值。在一个实施方案中,例如如果所述最小和最大阈值被满足所述解链温度标准可以被给予1.0的得分,并且如果所述阈值任一个均不被满足则该得分可以降低至0.0。当然,所述得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分在所述解链温度和所述最小或最大阈值之间的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离所述最小或最大阈值的引物的得分的增加。所述引物的解链温度可以通过采用如John SantaLucia,Jr.,“A unified view of polymer,dumbbell,and oligonucleotideDNA nearest-neighbor thermodynamics,”Proc.Natl.Acad.Sci.USA,vol.95,1460-1465(1998)(其内容的全文作为参考引入本文)中所述的教导进行计算。
在一个实施方案中,所述引物中引物二聚体的倾向可以被所述3'端的连续引物二聚体的最大阈值和所述全长上总连续匹配的最大阈值限制,并且针对所述引物的相应得分可以被设定,使得所述得分随着所述引物中引物二聚体的倾向背离所述最大阈值而降低。在一个实施方案中,所述3'端的连续引物二聚体的最大阈值可以是4,并且所述全长上总连续匹配的最大阈值可以是8。在其它实施方案中,例如,所述3'端的连续引物二聚体的最大阈值可以是在大约2到大约6之间的值,并且所述全长上总连续匹配的最大阈值可以是在大约4到大约10之间的值。在一个实施方案中,例如如果所述阈值被满足所述引物二聚体的倾向标准可以被给予1.0的得分,并且如果所述阈值不被满足则该得分可以而降低至0.0。当然,所述得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分在所述引物二聚体的倾向和所述最大阈值之间的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离所述最大阈值的引物的得分的增加。
在一个实施方案中,扩增子序列中G和C碱基的(或A、C、G或T碱基中的任意两个的)百分比可以被最小和最大阈值限制,并且针对所述引物的相应得分可以被设定,使得所述得分随着所述G和C碱基的(或A、C、G或T碱基中的任意两个的)百分比背离所述最小或最大阈值而降低。在一个实施方案中,所述最小阈值可以是0.0(0%)并且所述最大阈值可以是1.0(100%)。在其它实施方案中,例如,所述最小阈值可以是在大约0.1(10%)到大约0.25(25%)之间的任意百分比,并且所述最大阈值可以是在大约0.75(75%)到大约0.9(90%)之间的任意百分比。在一个实施方案中,例如如果所述最小和最大阈值被满足所述G和C碱基的(或A、C、G或T碱基中的任意两个的)百分比标准可以被给予1.0的得分,并且如果所述阈值任一个均不被满足则该得分可以而降低至0.0。当然,所述得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分在所述G和C碱基的(或A、C、G或T碱基中的任意两个的)百分比和所述最小或最大阈值之间的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离所述最小或最大阈值的引物的得分的增加。
在一个实施方案中,所述扩增子的长度可以被最小扩增子长度阈值和最大扩增子长度限制,并且针对所述扩增子的长度得分可以被设定,使得所述得分随着所述长度比所述最小扩增子长度阈值变得更短而降低,并且所述得分随着所述长度比所述最大扩增子长度阈值变得更长而降低。在一个实施方案中,所述最小扩增子长度阈值可以是110。在其它实施方案中,例如,所述最小引物长度阈值可以是在大约80到大约140之间的值。在一个实施方案中,所述最大扩增子长度阈值可以是240。在其它实施方案中,例如,所述最大扩增子长度阈值可以是在大约200到大约280之间的值。在一个实施方案中,例如如果所述长度阈值被满足所述扩增子长度标准可以被给予1.0的得分,并且如果任一个均不被满足则该得分为0.0。在另一个实施方案中,该得分可以随着所述扩增子长度背离所述最小或最大长度阈值而降低至0.0。例如,如果所述最大扩增子长度阈值被设定为240,那么如果所述长度不超过240则所述得分可以被设定为1.0,如果所述长度是至少250则为0.8,如果所述长度是至少260则为0.6,如果所述长度是至少270则为0.4,如果所述长度是至少280则为0.1,并且如果所述长度是至少290则为0.0。当然,所述属性/得分在除了0.0和1.0的值之间可以是成比例的,并且定义所述得分相对于所述阈值的增加的差异如何变化的所述函数可以是任何其它或更复杂的线性或非线性函数,其并不导致针对进一步背离所述长度阈值的引物的得分的增加。
根据示例性的实施方案,提供了用于为了覆盖一个或多个特异性期望的(desired)(例如,定制的)基因组区域或靶标采用一个或多个扩增子池从多个候选扩增子选择扩增子(其在本文中被称为“tile”)的子集(其在本文中被称为“tiling”)。用于tiling和pooling的所述方法被进一步详细描述于发明人John Leamon、Mark Andersen和MichaelThornton于2012年4月27日递交的标题为“用于多重PCR的方法和组合物”的美国申请序列号13/458,739(其全文作为参考引入本文)中。
根据各种示例性的实施方案,上述教导和/或示例性实施方案的任意一个或多个中的一个或多个特征可以采用适当配置和/或编程的硬件和/或软件元件(element)被完成(performed)或实现。确定实施方案是否采用硬件和/或软件元件被实现可以基于任何数量的因素,如所期望的计算速率、功率水平、耐热性、处理周期预算、输入数据速率、输出数据速率、存储器资源、数据总线速度等和其它设计或性能约束。
硬件元件的例子可以包括处理器、微处理器、通过本地接口电路通信偶联的输入和/或输出(I/O)装置(device)(或周边)、电路元件(例如,晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑器件(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体器件、芯片、微芯片、芯片组等。例如,所述本地接口可以包括一个或多个总线或其它有线或无线连接、控制器、缓冲器(缓存)、驱动器、中继器和接收器等以允许硬件组件之间适当的通信。处理器是用于执行软件(特别是存储于存储器中的软件)的硬件装置。所述处理器可以任何定制的或市售的处理器、中央处理单元(CPU)、与计算机相关的几个处理器中的辅助处理器、基于半导体的微处理器(例如,以微芯片或芯片组的形式)、宏处理器或通常用于执行软件指令的任何装置。处理器还可以代表分布式处理架构。所述I/O装置可以包括输入装置,例如,键盘、鼠标、扫描仪、麦克风、触摸屏、用于各种医疗装置和/或实验室仪器的接口、条形码阅读器、手写笔、激光阅读器、射频装置阅读器等。另外,所述I/O装置还可以包括输出装置,例如,打印机、条形码打印机、显示器等。最后,所述I/O装置还可以包括作为输入和输出通信的装置,例如,调制器/解调器(调制解调器;用于访问另一装置、***或网络)、射频(RF)或其它收发器、电话接口、桥接器、路由器等。
软件的例子可以包括软件组件、程序、应用、计算机程序、应用程序、***程序、机器程序、操作***软件、中间件(middleware)、固件、软件模块、例程(routine)、子例程、函数、方法、操作(procedure)、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、词(word)、值、符合或其任意组合。存储器中的软件可以包括一个或多个单独的程序,其可以包括用于实现逻辑功能的可执行指令的顺序列表。所述存储器中的软件可以包括根据本发明的教导和任何合适的定制或市售操作***(O/S)用于识别数据流的***,其可以控制其它计算机程序(如所述***)的执行,并提供调度(scheduling)、输入-输出控制、文件和数据管理、存储器管理、通信控制等。
根据各种示例性的实施方案,上述教导和/或示例性实施方案的任意一个或多个中的一个或多个特征可以采用适当配置和/或编程的可以存储指令或指令集的非临时性机器可读介质或物品(article)被完成或实现,所述指令或指令集(如果被机器执行)可以使得所述机器进行根据所述示例性的实施方案的方法和/或操作。例如,这样的机器可以包括任何合适的处理平台、计算平台、计算装置、处理装置、计算***、处理***、计算机、处理器、科学或实验室仪器等并可以采用任何合适的硬件和/或软件的组合被实现。例如,所述机器可读介质或物品可以包括任何合适类型的存储器单元、存储器装置、存储器物品、存储器介质、存储装置、存储物品、存储介质和/或存储单元,例如,存储器、可移动或不可移动介质、可擦除或不可擦除介质、可写或可重写介质、数字或模拟介质、硬盘、软片、只读存储器压缩盘(CD-ROM)、可记录压缩盘(CD-R)、可重写压缩盘(CD-RW)、光盘、磁性介质、磁光介质、可移动存储卡或盘、各种类型的数字多功能盘(DVD)、磁带、盒式磁带等,包括任何适用于计算机的介质。存储器可以包括易失性存储器元件(例如,随机存取存储器(RAM,如DRAM、SRAM、SDRAM等))和非易失性存储器元件(例如,ROM、EPROM、EEROM、闪存、硬盘驱动器、磁带、CDROM等)的任何一种或组合。此外,存储器可以包含电子、磁性、光学和/或其他类型的存储介质。存储器可以具有分布式架构,其中各种组件相互远离放置(situated),但仍然是由所述处理器访问。所述指令可以包括任何合适类型的代码,如源代码、编译代码、解释代码、可执行代码、静态代码、动态代码、加密代码等,采用任何合适的高级、低级、面向对象、可视、编译和/或解释编程语言进行实现。
根据各种示例性的实施方案,上述教导和/或示例性实施方案的任意一个或多个中的一个或多个特征可以至少部分地采用分布式、集群、远程或云计算资源被完成或实现。
根据各种示例性的实施方案,上述教导和/或示例性实施方案的任意一个或多个中的一个或多个特征可以采用源程序、可执行程序(对象代码)、脚本或包含要进行的指令集的任何其它实体被完成或实现。当源程序的情况下,所述程序可以通过编译器、汇编器(assembler)、解释器等(其可以或可以不被包括于所述存储器内)进行转换以与所述O/S有关进行正确操作。所述指令可以采用(a)面向对象的编程语言(其具有数据和方法的类),或(b)过程编程语言(其具有例程、子例程和/或函数)进行编写,其可以包括例如C、C++、Pascal、Basic、Fortran、Cobol、Perl、Java和Ada。
根据各种示例性的实施方案,上述示例性实施方案的一个或多个可以包括传送、显示、存储、打印或输出到用户接口装置、计算机可读存储介质、本地计算机***或远程计算机***、与由这样的示例性的实施方案已经产生、访问或使用的任何信息、信号、数据和/或中间或最终结果的信息。例如,这样传送、显示、存储、打印或输出的信息可以采取运行和报告、图片、数据表格(table)、统计图表(chart)、曲线图(graph)、电子表格(spreadsheet)、相关性、序列及其组合的可检索的和/或可过滤的列表的形式。
可以通过重复、添加或取代上述示例性的实施方案的一个或多个中所列的任何一般性或具体描述的特征和/或组件和/或物质和/或步骤和/或操作添加来衍生出各种另外的示例性的实施方案。此外,应当理解的是,除非另外特别说明,否则步骤的顺序或执行某些动作的顺序是不重要的,只要所述步骤或动作的目标仍然是可以实现的。另外,除非另外特别说明,否则可以同时进行两个或更多个步骤或动作,只要所述步骤或动作的目标仍然是可以实现的。此外,除非另外特别说明,否则上述示例性的实施方案之一中提到的任何一个或多个特征、组件、方面、步骤或其他特征可以被考虑为任何其它的所述示例性的实施方案的潜在的任选的特征、组件、方面、步骤或其他特征,只要这样任何其它的所述示例性的实施方案的目标仍然是可以实现的。
可以将公开于2008年9月18日的美国专利申请公开号2008/0228589A1和公开于2004年9月9日的美国专利申请公开号2004/0175733A1(其二者内容的全文作为参考引入本文)中所述的一个或多个特征引入上述示例性的实施方案来衍生出各种另外的示例性的实施方案。
在一些实施方案中,本公开方法的所述扩增的靶序列可以在有或者没有进一步纯化或操作的情况下被用于多个下游分析或测定。例如,所述扩增的靶序列可以通过本领域已知的技术(如桥扩增或emPCR)被克隆扩增以产生能够被用于下一代测序的模板文库。在一些实施方案中,本公开方法的所述扩增的靶序列或所得到的模板文库可以被用于多核苷酸多态性(SNP)分析、基因分型或表观遗传分析、拷贝数变异分析、基因表达分析、基因突变的分析(包括但不限于检测、预后和/或诊断)、稀有或低频等位基因突变的检测和分析、核酸测序(包括但不限于从头(de novo)测序或靶向重新测序)和合成组装分析。在一个实施方案中,扩增的靶序列可以被用于检测小于5%等位基因频率的突变。在一些实施方案中,本文所公开的方法可以被用于在小于4%、3%、2%或大约1%位基因频率的核酸群体中检测突变。在另一个实施方案中,如本文所述所制备的扩增的靶序列可以被测序以从核酸分子群体检测和/或识别生殖系或体细胞突变。
在一些实施方案中,在所述靶特异性引物对中的所述正向和/或反向靶特异性引物可以与所述核酸分子群体“互补”或“基本上互补”。如本文所称为的“与所述核酸分子群体基本上互补”是指在所述引物和所述引物要杂交的所述核酸分子之间的互补性百分比。通常,如本文所使用的术语“基本上互补”是指至少70%的互补性。因此,基本上互补是指在所述引物和所述核酸分子之间至少70%但小于100%互补性的互补性范围。互补引物是与所示核酸分子具有100%的互补性的引物。在一个实施方案中,每个靶特异性引物对被设计为在同一多重PCR反应中最小化与另一个引物(或引物对)的交叉杂交(即,减少引物二聚体的形成。在另一个实施方案中,每个靶特异性引物对被设计为最小化与所示核酸分子群体中非特异性核酸序列的交叉杂交(即,最小化偏离靶标的杂交)。在一个实施方案中,每个靶特异性引物被设计为最小化自身互补、发夹结构或其它二级结构的形成。
在一些实施方案中,通过聚合酶链式反应形成所述扩增的靶序列。靶特异性引物的延伸可以采用一种或多种DNA聚合酶完成。在一个实施方案中,所述聚合酶可以是任何家族A DNA聚合酶(也称为pol I家族)或任何家族B DNA聚合酶。在一些实施方案中,所述DNA聚合酶可以是与非重组DNA聚合酶相比能够以超高的精度和产率延伸靶特异性引物的重组形式。例如,所述聚合酶可以包括高保真的聚合酶或热稳定的聚合酶。在一些实施方案中,用于靶特异性引物的延伸的条件可以包括‘热启动’的条件,例如热启动聚合酶,如AmpliTaq
Figure BDA0002246933060000696
DNA聚合酶(Applied Biosciences)、
Figure BDA0002246933060000697
Taq DNA高保真DNA聚合酶(Invitrogen)或KOD热启动DNA聚合酶(EMD Biosciences)。通常,‘热启动’聚合酶包括热稳定的聚合酶和抑制室温(ambient temperature)条件下的DNA聚合酶和3'-5'外切酶活性的一个或多个抗体。在一些情况下,‘热启动’条件可以包括适体。
在一些实施方案中,所述聚合酶可以是以下的酶,如Taq聚合酶(来自Thermusaquaticus)、Tfi聚合酶(来自Thermus filiformis)、Bst聚合酶(来自Bacillusstearothermophilus)、Pfu聚合酶(来自Pyrococcus furiosus)、Tth聚合酶(来自Thermusthermophilus)、Pow聚合酶(来自Pyrococcus woesei)、Tli聚合酶(来自Thermococcuslitoralis)、Ultima聚合酶(来自Thermotoga maritima)、KOD聚合酶(来自Thermococcuskodakaraensis)、Pol I和II聚合酶(来自Pyrococcus abyssi)和Pab(来自Pyrococcusabyssi)。在一些实施方案中,所述DNA聚合酶可以包括以下至少一种聚合酶,如AmpliTaq
Figure BDA0002246933060000691
DNA聚合酶(Applied Biosciences)、
Figure BDA0002246933060000692
DNA聚合酶的Stoffel片段(Roche)、KOD聚合酶(EMD Biosciences)、KOD热启动聚合酶(EMD Biosciences)、DeepVentTM DNA聚合酶(New England Biolabs)、Phusion聚合酶(New England Biolabs)、Klentaq1聚合酶(DNA Polymerase Technology,Inc.)、Klentaq Long Accuracy聚合酶(DNA Polymerase Technology,Inc.)、Omni KlenTaqTM DNA聚合酶(DNA PolymeraseTechnology,Inc.)、Omni KlenTaqTM LA DNA聚合酶(DNA Polymerase Technology,Inc.)、
Figure BDA0002246933060000693
Taq DNA聚合酶(Invitrogen)、Hemo KlentaqTM(New England Biolabs)、
Figure BDA0002246933060000694
Taq DNA高保真聚合酶(Invitrogen)、
Figure BDA0002246933060000695
Pfx(Invitrogen)、AccuprimeTM Pfx(Invitrogen)或AccuprimeTM Taq DNA高保真聚合酶(Invitrogen)。
在一些实施方案中,所述DNA聚合酶可以是热稳定的DNA聚合酶。在一些实施方案中,dNTPs的化合物可以被同时或顺序以随机或定义的顺序应用。在一些实施方案中,在所述多重反应中存在的DNA聚合酶的量显著高于相应的单个丛(single plex)PCR反应中所用的DNA聚合酶的量。如本文所定义,术语“显著高于”是指与相应的单个丛(single plex)PCR反应相比在所述多重PCR反应中存在至少3被更高浓度的DNA聚合酶。
在一些实施方案中,所述扩增反应并不包括例如如滚环扩增所公开的扩增产物的环化。
在一些实施方案中,本公开内容的所述方法包括在含有多个核苷酸分子的样品中选择性扩增靶序列并将所扩增的靶序列与至少一个接头和/或条形码连接。用于分子生物学文库制备技术的接头和条形码是本领域技术人员公知的。如本文所用的接头和条形码的定义与本领域中所用术语一致。例如,条形码的使用允许每个多重反应中多个样品、来源、组织或核酸分子群体的检测和分析。加条形码和扩增的靶序列含有独特的核酸序列,典型地短的6-15个核苷酸序列,其从另一个扩增的核酸分子识别和区分一个扩增的核酸分子,甚至是当两个核酸分子减去所述条形码含有相同的核酸序列的情况下。接头的使用允许以均匀(uniformed)的形式的每个扩增的核酸分子的扩增并有助于降低链偏差(strandbias)。接头可以包括通用接头或适当(propriety)接头,二者可以被下游使用以执行一个或多个不同的功能。例如,由本文所公开的方法所制备的扩增的靶序列可以被连接至可以被下游用作用于克隆扩增的平台的接头。所述接头可以用作用于后续采用第二组引物的后续扩增的模板链,并因此允许所述接头连接的扩增的靶序列的通用扩增。在一些实施方案中,产生扩增子池的靶核酸的选择性扩增可以进一步包括将一个或多个条形码和/或接头连接至扩增的靶序列。引入条形码的能力增强样品高通量并允许多个样品或物质源的同时分析。在一个例子中,由所公开的方法制备的扩增的靶核酸分子可以被连接至IonTorrent TM测序接头(A和PI接头,作为Ion Fragment Library Kit的组分出售,LifeTechnologies,Part No.4466464)或Ion Torrent TMDNA条形码(Life Technologies,PartNo.4468654)。
本文所公开的方法涉及通过聚合酶链式反应(PCR)的多个靶序列的扩增。在一些实施方案中,所述多重PCR包括将一个或多个靶特异性引物对与核酸分子杂交,通过在DNA聚合酶和dNTPs存在下模板依赖性合成延伸所述靶特异性引物对的引物;重复所述杂交和延伸步骤持续足够的时间和足够的温度从而产生多个扩增的靶序列。在一些实施方案中,所述多重扩增反应方法的步骤可以任何顺序进行。
成功多重扩增所需要的核酸物质的量可以是大约1ng。在一些实施方案中,所述核酸物质的量可以是大约10ng至大约50ng、大约10ng至大约100ng或大约1ng至大约200ng的核酸物质。可以使用更高量的输入物质,但是本公开内容的一个方面是从低(ng)量的起始物质选择性扩增多个靶序列。
本文所公开的所述多重PCR扩增反应可以包括典型地在热循环仪上进行的多个“循环(cycle)”。通常,每个循环包括至少一个退火步骤和至少一个延伸步骤。在一个实施方案中,进行多重PCR扩增反应,其中靶特异性引物对与靶序列杂交;延伸所杂交的引物产生延伸的引物产物/核酸双链体;变性所延伸的引物产物/核酸双链体允许所述互补引物与所述延伸的引物产物杂交,其中延伸所述互补引物产生多个扩增的靶序列。在一个实施方案中,本文所公开的方法具有每个预扩增反应大约5个至大约18个循环。每个循环的所述退火温度和/或退火持续时间可以相同;可以包括增量的增加或减少,或二者的组合。每个循环的所述延伸温度和/或延伸持续时间可以相同;可以包括增量的增加或减少,或二者的组合。例如,所述退火温度或延伸温度可以每个循环保持恒定。在一些实施方案中,所述退火温度可以每个循环保持恒定,所述延伸持续时间可以每个循环增量地增加。在一些实施方案中,持续时间的增加或减少可以15秒、30秒、1分钟、2分钟或4分钟的增量发生。在一些实施方案中,温度的升高或降低可以0.5、1、2、3或4摄氏度的偏差发生。在一些实施方案中,所述扩增反应可以采用热启动PCR技术进行。这些技术包括在聚合开始之前采用加热步骤(>60℃)以减少不期望的PCR产物的形成。其它技术,如所述反应的一个或多个关键时机的可逆失活或物理分离,例如镁或DNA聚合酶可以在蜡珠中被隔离,其随着变性步骤过程中所述反应被加热而融化,仅在较高的温度释放所述试剂。DNA聚合酶还可以通过结合至适体或抗体而被保持于活性状态。该结合在较高的温度被破坏,释放可不受阻碍地进行所述PCR的功能性DNA聚合酶。
在一些实施方案中,所公开的方法可以任选地包括破坏一个或多个含有引物的扩增假体,例如引物二聚体、二聚体-二聚体或超级扩增子。在一些实施方案中,所述破坏可以任选地包括处理所述引物和/或扩增产物,以便切割存在于所述引物和/或扩增产物中的特异性的可切割的基团。在一些实施方案中,所述处理可以包括一个或多个靶特异性引物的部分或完全消耗。在一个实施方案中,所述处理可以包括从所述扩增产物去除至少40%的所述靶特异性引物。所述可切割的处理可以包括酶、酸、碱、热、光或化学活性。所述可切割的处理可以引起所述引物的一个或多个核苷酸之间或者所述扩增产物的一个或多个核苷酸之间的连接(linkage)的切割或其它破坏。所述引物和/或所述扩增产物可以任选地包括一个或多个修饰的核苷酸或核碱基。在一些实施方案中,所述切割可以选择性地在这些位点或与所示修饰的核苷酸或核碱基相邻的位点发生。在一些实施方案中,所述扩增的靶序列的切割或处理可以导致磷酸化的扩增的靶序列的形成。在一些实施方案中,所述扩增的靶序列在5'末端被磷酸化。
在一些实施方案中,所述模板、引物和/或扩增产物包括能够被特定的酶识别的核苷酸或核碱基。在一些实施方案中,所述核苷酸或核碱基可以被特定的酶结合。任选地,所述特定的酶还可以在一个或多个位点切割所述模板、引物和/或扩增产物。在一些实施方案中,这样的切割可以在所述模板、引物和/或扩增产物内的特定核苷酸处发生。例如,所述模板、引物和/或扩增产物可以包括一个或多个核苷酸或包括尿嘧啶的核碱基,其可以被酶识别和/或切割,如尿嘧啶DNA糖基化酶(UDG,也称为UNG)或甲酰胺基嘧啶DNA糖基化酶(Fpg)。所述模板、引物和/或扩增产物可以包括一个或多个核苷酸或包括RNA特异性碱基的核碱基,其可以被酶(如RNAseH)识别和/或切割。在一些实施方案中,所述模板、引物和/或扩增产物可以包括一个或多个脱碱基(abasic)位点,其可以采用各种校正聚合酶或腺苷三磷酸双磷酸酶(apyrase)处理被识别和/或切割。在一些实施方案中,所述模板、引物和/或扩增产物可以包括7,8-二氢-8-氧代鸟嘌呤(8-oxoG)核碱基,其可以被酶(如Fpg)识别或切割。在一些实施方案中,一个或多个扩增的靶序列可以被FuPa试剂部分地消化。
在一些实施方案中,所述引物和/或扩增产物包括一个或多个修饰的核苷酸,其包括通过化学键与其它核苷酸(例如在互补的核酸链中的核苷酸)结合(例如碱基配对)的碱基。在一些实施方案中,所述化学键受到特定化学攻击,其选择性切割所述修饰的核苷酸(或选择性切割所述引物和/或扩增产物内所述修饰的核苷酸和相邻的核苷酸之间的一个或多个共价键)但保留其它核苷酸不受影响。例如,在一些实施方案中,修饰的核苷酸可以形成与互补链中的其它核苷酸的二硫键(disulfite linkage)。这样的二硫键可以通过合适的处理被氧化。类似地,某些修饰的核苷酸可以通过能够由碱处理选择性破坏的键与互补核酸链中的其它核苷酸碱基配对。在一些实施方案中,所述引物和/或扩增产物包括一个或多个修饰的核苷酸,其通过相对于天然碱基之间形成的典型的碱基配对键展示降低的热稳定性的键结合(例如碱基配对)互补核酸链中的其它核苷酸。这样的热稳定性降低的键能够通过在扩增之后将所述引物和/或扩增产物暴露于提高的温度而被选择性破坏。
示例性的实施方案被描绘于图1中,其描绘了可降解的扩增引物的示意图。所述扩增引物在设计中为亚硫酸氢盐化的(bisulfite),具有或者5'通用正向扩增序列被连接至3'靶特异性正向引物,或者5'通用反向扩增序列被连接至3'靶特异性反向引物。两个引物含有修饰的核苷酸。
在一些实施方案中,引物被合成,其与核酸模板链的离散的段互补并能够与其杂交,包括:能与所述模板的5'区域杂交的引物,其涵盖与或者正向或者反向扩增引物互补的序列。在一些实施方案中,所述正向引物、反向引物或二者不共享共同的核酸序列,使得它们与不同的核酸序列杂交。例如,靶特异性正向和反向引物可以被制备成不与引物池内的其它引物对竞争以扩增相同的核酸序列。在该例子中,不与引物池内的其它引物对竞争的引物对协助减少非特异性或假扩增产物。在一些实施方案中,每个引物对的所述正向和反向引物是独特的,因为每个引物的核苷酸序列与所述引物对中的另一个引物是非互补的并且不相同的。在一些实施方案中,所述引物对可以不同,具有至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%或至少90%的核苷酸同一性。在一些实施方案中,每个引物对中的所述正向和反向引物与所述引物池或多重反应中的其它引物对是非互补的并且不相同的。例如,引物池或多重反应内的所述引物对可以不同,与所述引物池或多重反应内的其它引物对具有至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%或至少70%的核苷酸同一性。通常,引物被设计为最小化引物二聚体、二聚体-二聚体或其它非特异性扩增产物的形成。典型地,引物被优化为在所述扩增反应过程中降低GC偏差和低解链温度(Tm)。在一些实施方案中,引物池的所述引物可以具有大约55℃至大约72℃4465884的Tm。在一些实施方案中,引物池的所述引物可以具有大约59℃至大约70℃、60℃至大约68℃或60℃至大约65℃的Tm。在一些实施方案中,所述引物池可以具有偏差(deviate)不超过5℃的Tm。
在一些实施方案中,所述靶特异性引物不含有碳-间隔(carbon-spacer)或末端接头(terminal linker)。在一些实施方案中,所述靶特异性引物或扩增的靶序列不含有酶、磁性、光学或荧光标记。
所述模板可以包括含有针对围绕感兴趣的特定基因或区域的或者上游或者下游区域的序列的3'区域,使得所述感兴趣的区域由正向扩增/上游基因特异性融合和反向扩增/下游感兴趣的区域的融合引物所包括(bracketed)。在一些实施方案中,内部分隔(separator)序列可以分隔能够与所述扩增和基因特异性引物杂交的所述模板区域,并且这可以作为用于后续下游应用(如测序等)钥匙或条形码。在一些实施方案中,条形码或者钥匙可以被引入所述扩增产物的每一个以协助数据分析和例如编目(cataloging)。在一些实施方案中,所述条形码可以是Ion Torrent TMDNA条形码(Life Technologies)。
在一些实施方案中,所述引物包括足够量的修饰的核苷酸以允许通过切割处理的所述引物的功能性完全降解,但不是那么多以致在这样的切割处理之前(例如在所述扩增反应中)干扰所述引物的特异性或功能性。在一些实施方案中,所述引物包括至少一个修饰的核苷酸,但是所述引物的不高于75%的核苷酸是被修饰的。
在一些实施方案中,包括至少一个修饰的核苷酸的多个不同引物可以被用于单个扩增反应中。例如,包括修饰的核苷酸的多重引物可以被加至所述扩增反应混合物,其中每个引物(或引物集)选择性杂交至并促进所述核酸群体内不同靶核酸分子的扩增。在一些实施方案中,不同引物组合可以在至少大约24、96、384、768、1000、2000、3000、6000或10000或更多丛(plexy)被加至所述扩增反应(其中“丛(plexy)”表示理论上在所述扩增反应中以序列特异性的方式被扩增的不同靶标的总数)。在一些实施方案中,所述修饰的引物在接近或位于所述引物的末端含有至少一个修饰的核苷酸。在一些实施方案中,所述修饰的引物在所述引物序列内含有两个或更多个修饰的核酸。在一个示例性的实施方案中,所述引物序列含有接近或位于所述引物的末端的尿嘧啶。对于本公开内容的目的来说,所述引物序列的“接近”或“位于所述末端”是指离所述引物序列末端多达10个核苷酸。在一些实施方案中,所述引物序列含有位于或大约所述引物序列的中央核苷酸位置的尿嘧啶。对于本公开内容的目的来说,“位于或大约所述引物序列的中央核苷酸位置”是指在所述引物序列的中央核苷酸处或在八个核苷酸内、以或者3'或者5'方向侧接所述中央核苷酸的尿嘧啶部分的引入。在一个实施方案中,所述靶特异性引物序列可以在或大约所述中央核苷酸的位置含有修饰的核碱基,并且在3'和/或5'末端含有修饰的核碱基。在一些实施方案中,所述正向或反向引物序列的长度可以长大约15个到大约40个碱基。在一些实施方案中,所述多重反应中所使用的引物序列的Tm可以是大约55℃至大约72℃。在一些实施方案中,所述引物对被设计为扩增来自所述靶核酸分子或扩增子的长为大约100个碱基对至500个碱基对的序列。
在一些实施方案中,所述扩增反应在单个反应阶段内以平行方式进行(例如,在单个管内的同一扩增反应内)。参见图2。在一些情况下,扩增反应可以产生包括期望的扩增子产物以及不期望的、不想要的、非特异性扩增子假体(如引物二聚体)二者的产物的混合物。扩增之后,所述反应然后被用任何合适剂进行处理,其可以选择性切割或以其它方式选择性破坏在过量未掺入的引物内所述修饰的核苷酸的核苷酸键和所述扩增假体而不切割或破坏所述规范扩增产物。例如,所述引物可以包括含有尿嘧啶的核碱基,其可以采用UNG/UDG被选择性切割(任选地用热和/或碱)。在一些实施方案中,所述引物可以包括含有尿嘧啶的核碱基,其可以采用UNG和Fpg被选择性切割。在一些实施方案中,所述切割处理包括暴露于用于二硫醇的选择性切割的氧化性条件、采用用于包括RNA特异性部分(例如核糖等)的修饰的核苷酸的选择性切割的RNAseH处理等。这种切割处理能够有效片段化所述原始扩增引物和非特异性扩增产物为每个包括相对少的核苷酸的小的核酸片段。这样的片段典型地不能在提高的温度下促进进一步扩增。这样的片段还能相对简单地通过本领域已知的各种扩增后清理操作被从所述反应池去除(例如,离心柱、乙醇沉淀等)。
在一些实施方案中,所述修饰的核苷酸的核苷酸键的切割或其它选择性的破坏之后的扩增产物任选地被处理以产生在5'末端具有磷酸的扩增产物。在一些实施方案中,所述磷酸化处理包括酶操作以产生5'磷酸化的扩增产物。在一个实施方案中,酶(如聚合酶)可以被用于产生5'磷酸化的扩增产物。例如,T4聚合酶可以被用于制备5'磷酸化的扩增产物。Klenow可以被用于与一种或多种其它酶结合使用以产生带有5'磷酸的扩增产物。在一些实施方案中,本领域已知的其它酶可以被用于制备带有5'磷酸基团的扩增产物。例如,含有扩增产物的尿嘧啶核苷酸与所述酶UDG、Fpg和T4聚合酶的孵育可以被用于产生在5'末端具有磷酸的扩增产物。对于本领域技术人员来说明显的是,其它技术(除了本文所具体描述的那些)可以被应用于产生磷酸化的扩增子。应当理解的是,被应用于实施本文所公开的所述方法、***、试剂盒、组合物和设备的这样的变化和修饰,在不诉诸过度实验的情况下被认为是在本公开内容的保护范围内。
在一些实施方案中,引物被掺入所述期望的(特定的)扩增产物,这些引物被类似地切割或破坏,导致所述特定的扩增产物内“粘性末端”(例如,5'或3'悬垂)的形成。这样的“粘性末端”可以几种方式进行解决。例如,如果所述特定的扩增产物要被克隆,所述悬垂区域可以被设计成被引入所述克隆载体的互补悬垂,从而能够进行比平端连接更快速和有效的粘性末端连接。备选地,所述悬垂可以需要被修补(如用几种下一代测序方法)。这样的修补可以或者通过二次扩增反应采用仅由天然碱基组成的仅正向和反向扩增引物(在如图1所示的实施方案中,这相应于A和P1引物)完成。以这种方式,后续扩增循环用具有引物破坏之前的原始链的完整序列的新生拷贝重建所述双链模板。备选地,所述粘性末端可以采用一些形式的填充和连接处理来被去除,其中所述正向和反向引物与模板退火。然后聚合酶可被用于延伸所述引物,并且然后连接酶(任选地热稳定的连接酶)可以被用于连接所得到的核酸链。这也可以明显地通过各种其它反应途径(如循环延伸连接(cyclical extend-ligation)等)完成。在一些实施方案中,可以采用一种或多种DNA连接酶进行所述连接步骤。
所述扩增反应可以包括增加核酸分子的拷贝数的任何反应,任选地以循环的方式,并且可以包括但不限于等温扩增(例如,滚环扩增或如美国临时申请号61/424,599、61/445,324和61/451,919(其全文作为参考引入)中所述的等温扩增)、采用热循环的扩增等。
在一些实施方案中,本公开内容通常涉及用于单管(sigle-tube)多重PCR的方法。在一些实施方案中,所述用于单管多重PCR的方法可以包括靶特异性或外显子特异性引物。在一些实施方案中,所述外显子特异性或靶特异性引物可以包括至少一个尿嘧啶核苷酸。在一些实施方案中,单管多重PCR可以包括采用靶特异性或外显子特异性基于尿嘧啶的引物至少1000、2000、3000、4000、5000、6000或更多个靶核酸分子的选择性扩增。
在一些实施方案中,本公开内容通常涉及用于产生靶特异性或外显子特异性扩增子文库的方法。在一些实施方案中,采用靶特异性或外显子特异性引物产生所述扩增子文库可以与人癌症的突变相关。在一些实施方案中,所述突变可以在KRAS、BRAF和/或EGFR基因中。在一些实施方案中,所述扩增子文库可以被从基因组DNA或***固定石蜡包埋(FFPE)组织产生。在一些实施方案中,采用本文所公开的方法制备的所述扩增子文库的所述扩增子可以长大约100个至大约300个碱基对、长大约100个至大约250个碱基对、长大约120个至大约220个碱基对或长大约135个至大约205个碱基对。在一些实施方案中,所述扩增子文库可以采用靶向癌症特异性突变的引物对进行制备。在一些实施方案中,所述引物对可以涉及非癌症相关突变,如遗传性疾病,例如囊性纤维化等。在一些实施方案中,所述引物对可以被用于产生扩增子,其一旦被任何测序平台(包括半导体测序技术)测序,其可以被用于以拷贝数检查遗传突变(倒位、缺失、点突变和变异)。
在一些实施方案中,被用于产生扩增子文库的所述引物对可以引起靶特异性核酸分子的扩增,所述核酸分子具有以下一个或多个指标(metric):如果标准化至100x平均覆盖深度在20x的大于97%的靶标覆盖度;大于97%的碱基具有大于0.2x的平均(mean);大于90%的碱基没有链偏差;在靶标上大于95%的所有读出;大于99%的碱基基友大于0.01x的平均以及每个碱基大于99.5%的精确度。
在一些实施方案中,所述扩增子文库可以被用于在样品中检查和/或识别已知突变或从头(de novo)突变。
在一些实施方案中,采用靶特异性引物对所制备的所述扩增子文库可以被用于下游富集应用(如乳液PCR或桥PCR)。在一些实施方案中,所述扩增子文库可以被用于富集应用和测序应用。例如,扩增子文库可以采用任何合适的DNA测序平台进行测序。在一些实施方案中,扩增子文库可以采用Ion Torrent PGM测序仪(Life Technologies)进行测序。在一些实施方案中,PGM测序仪可以被偶联至服务器,其应用参数或软件确定所扩增的靶核酸分子的序列。在一些实施方案中,所述扩增子文库可以在小于24小时中被制备、被富集并被测序。在一些实施方案中,所述扩增子文库可以在大约9小时中被制备、被富集并被测序。在一些实施方案中,扩增子文库可以是配对的文库,即,含有来自肿瘤样品的扩增子和来自非疾病的样品的扩增子的文库。每对可以被比对,以检测和/或识别在所述靶核酸分子中存在的突变。
在一些实施方案中,用于产生扩增子文库的方法可以包括:采用外显子特异性或靶特异性引物扩增基因组DNA以产生扩增子;从输入DNA和引物纯化所述扩增子;磷酸化所述扩增子;将接头连接至所述磷酸化的扩增子(图2中所示的步骤);纯化所述连接的扩增子;切口平移所述扩增的扩增子;以及纯化切口平移的扩增子以产生所述扩增子文库。在一些实施方案中,接着基因组DNA靶标扩增产生所述扩增子的步骤可以进行另外的扩增子文库操作。在一些实施方案中,可以任何顺序进行任何另外的反应的组合,并且可以包括:纯化;磷酸化;连接接头;切口平移;扩增和/或测序。在一些实施方案中,这些反应中的任何一个可以被省略或可以被重复。对本领域技术人员来说将是明显的是,所述方法可以重复或省略任何一个或多个以上步骤。对本领域技术人员来说也将是明显的是,步骤的顺序和组合可以被修改而产生所需要的扩增子文库,并且并不因此局限于所提供的示例性方法。
磷酸化的扩增子可以被连接(joined)至接头以进行切口平移反应、后续下游扩增(例如,模板制备)或用于附着至颗粒(例如,珠),或是二者皆有。例如,被连接至磷酸化的扩增子的接头可以与被附着至颗粒的寡核苷酸捕获引物退火,并且可以进行引物延伸反应以产生被附着至所述颗粒或表面的所述扩增子的互补拷贝,从而将扩增子附着至表面或颗粒。接头-接头(Adapters-Adapters)可以具有一个或多个扩增引物杂交位点、测序引物杂交位点、条形码序列及其组合。在一些实施方案中,由本文所公开的方法制备的扩增子可以被连接至一个或多个Ion TorrentTM相容性接头-接头以构建扩增子文库。由这样的方法所产生的扩增子可以被连接至一个或多个用于文库构建的接头-接头以与下一代测序平台相容。例如,由本公开内容的教导所生产的扩增子可以被附着至Ion Fragment Library Kit(Life Technologies,Catalog No.4466464)中所提供的接头。
在一些实施方案中,可以采用2x AmpliSeq Hi Fi Master Mix进行基因组DNA靶标(如高分子量DNA)或FFPE样品的扩增。在一些实施方案中,所述AmpliSeq Hi Fi MasterMix可以包括甘油、dNTPs和DNA聚合酶(如
Figure BDA0002246933060000802
Taq高保真DNA聚合酶)。在一些实施方案中,所述2x AmpliSeq Hi Fi Master Mix还可以包括至少以下一种:防腐剂、硫酸镁、三硫酸盐和/或硫酸铵。
在一些实施方案中,可以采用5x离子AmpliSeq Hi Fi Master Mix进行基因组DNA靶标(如高分子量DNA)或FFPE样品的扩增。在一些实施方案中,所述5x离子AmpliSeq Hi FiMaster Mix可以包括甘油、dNTPs和DNA聚合酶(如
Figure BDA0002246933060000801
Taq高保真DNA聚合酶)。在一些实施方案中,所述5x离子AmpliSeq Hi Fi Master Mix还可以包括至少以下一种:防腐剂、氯化镁、硫酸镁、三硫酸盐和/或硫酸铵。
在一些实施方案中,可以采用FuP试剂进行所述扩增子的磷酸化。在一些实施方案中,所述FuP试剂可以包括DNA聚合酶、DNA连接酶、至少一种尿嘧啶切割或修饰酶和/或存储缓冲液。在一些实施方案中,所述FuP试剂可以进一步包括至少以下一种:防腐剂和/或去污剂。
在一些实施方案中,可以采用FuPa试剂进行所述扩增子的磷酸化。在一些实施方案中,所述FuPa试剂可以包括DNA聚合酶、至少一种尿嘧啶切割或修饰酶、抗体和/或存储缓冲液。在一些实施方案中,所述FuPa试剂可以进一步包括至少以下一种:防腐剂和/或去污剂。在一些实施方案中,提供所述抗体以抑制室温下所述DNA聚合酶和3'-5'外切酶活性。
在一些实施方案中,由本公开内容的教导所生产的所述扩增子文库产率足以被用于各种下游应用,包括采用Ion Torrent TMPGM***的离子XpressTM模板试剂盒(例如,PCR介导的将所述核酸片段文库添加至Ion SphereTM颗粒上)(Life Technologies,PartNo.4467389)。例如,从所述扩增子文库制备模板文库的说明可以见于离子Xpress模板试剂盒用户指南(Life Technologies,Part No.4465884),其全文作为参考引入。将所述候选模板文库装载至Ion Torrent TM芯片用于核酸测序的说明被描述于离子测序用户指南(PartNo.4467391)(其全文作为参考引入)中。在一些实施方案中,由本公开内容的教导所生产的所述扩增子文库可以被用于配对端部测序(例如,在Ion Torrent TMPGM***上的配对端部测序)(Life Technologies,Part No.MAN0006191)(其全文作为参考引入)。
对本领域技术人员来说将是明显的是,许多用于克隆扩增的其他技术、平台或方法(如野火(wildfire)PCR和桥扩增)可以被与本公开内容的所述扩增的靶序列结合使用。还可以想到的是,本领域技术人员在本文所提供的条件的进一步细化或优化的基础上可以直接进行核酸测序(例如采用Ion Torrent PGMTM或质子TM测序仪,Life Technologies)而无需进行克隆扩增步骤。
在一些实施方案中,至少一个要被克隆扩增的所述扩增的靶序列可以被附着至支持物或颗粒。所述支持物可以由任何合适的物质组成并具有任何合适的形状,包括例如平面、球状体或微粒。在一些实施方案中,所述支持物是如美国公开申请号20100304982(其全文作为参考引入)中所述的支架聚合物颗粒。
在一些实施方案中,由本公开内容的教导所生产的所述扩增的靶序列的核酸测序包括从头(de novo)测序或靶向重新测序。在一些实施方案中,核酸测序进一步包括将所述扩增的靶序列的核酸测序结果与参考核酸样品进行比较。在一些实施方案中,所述参考样品可以是正常组织或有据可查的肿瘤样品。在一些实施方案中,所述扩增的靶序列的核酸测序还包括确定所述核酸序列内突变的存在或不存在。在一些实施方案中,所述方法还包括将突变的存在于药物敏感性、治疗的预后和/或器官排斥相关联。在一些实施方案中,核酸测序包括与癌症和/或遗传性疾病有关的遗传标记的识别。在一些实施方案中,核酸测序包括在调查样品中拷贝数变异的识别。
在一些实施方案中,提供了用于在单个反应中从核酸分子群体扩增多个靶序列的试剂盒。在一些实施方案中,所述试剂盒包括含有一个或多个可切割的基团的多个靶特异性引物对、一种或多种DNA聚合酶、dNTPs的混合物和至少一种切割试剂。在一个实施方案中,所述可切割的基团可以是8-氧代脱氧鸟苷、脱氧尿苷或溴脱氧尿苷。在一些实施方案中,所述至少一种切割试剂包括RNaseH、尿嘧啶DNA糖基化酶、Fpg或碱。在一个实施方案中,所述切割试剂可以是尿嘧啶DNA糖基化酶。在一些实施方案中,所述试剂盒被提供于在单个反应室或容器中进行多重PCR。在一些实施方案中,所述试剂盒包括至少一种DNA聚合酶,其可以是热稳定的DNA聚合酶。在一些实施方案中,所述一种或多种DNA聚合酶的浓度是与单个PCR反应相比以3倍过量存在的。在一些实施方案中,每个靶特异性引物对的最终浓度可以低于常规单个丛(plex)PCR反应的50%的浓度存在。在一些实施方案中,所述试剂盒提供在单个反应室中从核酸分子群体扩增至少100、500、1000、3000、6000、10000、12000或更多个靶序列。
在一些实施方案中,所述试剂盒进一步包含一个或多个接头、条形码和/或抗体。
以下各种示例性的实施方案的描述仅是示例性的和解释性的,并不应被解释为以任何方式限制或约束。本发明教导的其它实施方案、特征、目的和优点将可以明显地从说明书和附图,和从权利要求书中看出。
尽管本发明的说明书详细描述了某些示例性的实施方案,其它实施方案也是可能的并且在本发明的保护范围之内。对于本领域技术人员明显的是,从本发明的说明书和附图以及本发明说明书和附图以及权利要求书所述的教导的实践得出相应的变化和修改。
实施例
实施例1.文库制备
PCR扩增基因组DNA靶标
对基因组DNA样品进行多重聚合酶链式反应以扩增136个个体扩增子。正向和反向引物池被设计为扩增表1的靶区域。该引物池中的每个引物对被设计为在靠近每个正向和反向引物的末端含有至少一个尿嘧啶核苷酸。每个引物对也被设计为与表1的SNP组的特异性靶区域选择性杂交并促进其扩增。
向96孔PCR板的单个孔加入5微升含有TE中浓度为15μM的正向和反向引物的引物池、10-50ng基因组DNA和10微升可包括甘油、dNTPs和
Figure BDA0002246933060000831
Taq高保真DNA聚合酶(Invitrogen,Catalog No.11304)的扩增反应混合物(2x AmpliSeq HiFi Master Mix)并补加无DNase/RNase的水(Life Technologies,CA,Part No.600004)至终体积为20微升。
密封该PCR板并放入热循环仪(
Figure BDA0002246933060000832
PCR***9700双96孔热循环仪(LifeTechnologies,CA,Part No.N8050200和4314445))并按照以下温度配置运行以生成预扩增的扩增子文库。
初始保持阶段在98℃进行2分钟,接着16个循环的98℃变性15秒和60℃退火和延伸阶段4分钟。循环后,预扩增的扩增子文库保持于4℃直到进行下文所述的纯化步骤。示例性文库扩增过程的示意图示于图2中。
从输入DNA和引物纯化扩增子
建立两轮0.6x和1.2x体积比的
Figure BDA0002246933060000841
XP试剂(BeckmanCoulter,CA)结合、洗涤和洗脱以去除基因组DNA和未结合的或过量的引物。本文所述的扩增和纯化步骤产生长大约100bp至600bp的扩增子。
在1.5mL LoBind管(Eppendorf,Part No.022431021)中,预扩增的扩增子文库(20微升)与12微升(0.6x体积)的
Figure BDA0002246933060000842
Figure BDA0002246933060000843
XP试剂(Beckman Coulter,CA)结合。珠悬液用移液管来回吹吸以充分将珠悬液与预扩增的扩增子文库混合。然后,将样品脉冲自旋并在室温孵育5分钟。
含有样品的管被置于磁架(如DynaMagTM-2自旋磁体(Life Technologies,CA,PartNo.123-21D))上2分钟以捕获珠。一旦溶液澄清了,上清被转移至新管中,其中向上清加入24微升(1.2x体积)的
Figure BDA0002246933060000844
XP珠(Beckman Coulter,CA)。混合物用移液管吹吸以确保珠悬液与预扩增的扩增子文库混合。然后,将样品脉冲自旋并在室温孵育5分钟。含有样品的管被置于磁架上2分钟以捕获珠。一旦溶液澄清了,上清被小心弃去而不干扰珠沉淀。所期望的预扩增的扩增子文库现在与珠结合。无需从磁架上取出管,向样品引入200微升新鲜制备的70%乙醇。样品孵育30秒同时轻轻旋转磁架上的管。溶液澄清了之后,上清被弃去而不干扰珠沉淀。进行第二次乙醇洗涤并弃去上清。通过脉冲自旋管去除任何剩下的乙醇并且小心去除残留的乙醇而不干扰沉淀。沉淀在室温空气干燥大约5分钟。
一旦管干燥了,从磁架上取出管并且加入20微升的无DNase/RNase的水(LifeTechnologies,CA,Part No.600004)。将管涡旋振荡并用移液管吹吸以确保样品被充分混合。样品脉冲自旋并被置于磁架上两分钟。溶液澄清了之后,含有洗脱的DNA的上清被转移至新管。
磷酸化扩增子
向洗脱的DNA(~20微升)加入3微升的DNA连接酶缓冲液(Invitrogen,CatalogNo.15224041)、2微升dNTP混合物和2微升的FuP试剂。充分混合反应混合物以确保均匀,37℃孵育10分钟。
将接头连接至扩增子并纯化连接的扩增子
孵育之后,反应混合物直接进行连接步骤。在此,现在含有磷酸化的扩增子文库的反应混合物与1微升的A/P1Adapters-Adapters(每种20μm)(作为Ion Fragment LibraryKit的组分出售,Life Technologies,Part No.4466464)和1微升的DNA连接酶(作为IonFragment Library Kit的组分出售,Life Technologies,Part No.4466464)结合,并在室温孵育30分钟。
孵育步骤之后,向连接的DNA加入52微升(1.8x样品体积)的
Figure BDA0002246933060000851
试剂(Beckman Coulter,CA)。混合物用移液管充分吹吸以将珠悬液与连接的DNA混合。混合物脉冲自旋并在室温孵育5分钟。样品进行另一个脉冲自旋并被置于磁架(如DynaMagTM-2自旋磁体(Life Technologies,CA,Part No.123-21D))上两分钟。溶液澄清了之后,弃去上清。无需从磁架上取出管,向样品引入200微升新鲜制备的70%乙醇。样品孵育30秒同时轻轻旋转磁架上的管。溶液澄清了之后,上清被弃去而不干扰珠沉淀。进行第二次乙醇洗涤并弃去上清。通过脉冲自旋管去除任何剩下的乙醇并且小心去除残留的乙醇而不干扰沉淀。沉淀室温空气干燥大约5分钟。
沉淀被重悬于20微升的无DNase/RNase的水(Life Technologies,CA,PartNo.600004)并涡旋振荡以确保样品被充分混合。样品脉冲自旋并被置于磁架上两分钟。溶液澄清了之后,含有连接的DNA的上清被转移至新Lobind管(Eppendorf,PartNo.022431021)。
切口平移和扩增扩增子文库并纯化该文库
将连接的DNA(~20微升)与76微升的
Figure BDA0002246933060000852
PCR高保真超级混合物(LifeTechnologies,CA,Part No.12532-016,作为Ion Fragment Library Kit的组分出售,LifeTechnologies,Part No.4466464)和4微升的文库扩增引物混合物(每种5μm)(LifeTechnologies,CA,Part No.602-1068-01,作为Ion Fragment Library Kit的组分出售,Life Technologies,Part No.4466464)结合,混合物被用移液管充分吹吸以确保均匀的溶液。溶液被施加到96孔PCR板的单个孔中并密封。板被放入热循环仪(
Figure BDA0002246933060000861
PCR***9700双96孔热循环仪(Life Technologies,CA,Part No.N8050200和4314445))并按照以下温度配置运行以生成最终扩增子文库。
在72℃进行1分钟的切口平移,接着98℃2分钟的酶活化阶段,接着5-10个循环的98℃变性15秒和60℃退火和延伸阶段1分钟。循环后,最终扩增子文库保持于4℃直到进行下文所述的最终纯化步骤。
在1.5ml LoBind管(Eppendorf,Part No.022431021)中,最终扩增子文库(~100微升)与180微升(1.8x样品体积)的
Figure BDA0002246933060000862
Figure BDA0002246933060000863
XP试剂(Beckman Coulter,CA)结合。珠悬液被用移液管来回吹吸以充分将珠悬液与最终扩增子文库混合。然后,将样品脉冲自旋并在室温孵育5分钟。
含有最终扩增子文库的管被置于磁架(如DynaMagTM-2自旋磁体(LifeTechnologies,CA,Part No.123-21D))上2分钟以捕获珠。一旦溶液澄清了,上清被小心弃去而不干扰珠沉淀。无需从磁架上取出管,向样品引入400微升新鲜制备的70%乙醇。样品孵育30秒同时轻轻旋转磁架上的管。溶液澄清了之后,上清被弃去而不干扰珠沉淀。进行第二次乙醇洗涤并弃去上清。通过脉冲自旋管去除任何剩下的乙醇并且小心去除残留的乙醇而不干扰沉淀。沉淀室温空气干燥大约5分钟。
一旦管干燥了,从磁架上取出管并且加入20微升的Low TE(Life Technologies,CA,Part No.602-1066-01)。将管用移液管吹吸并涡旋振荡以确保样品被充分混合。样品脉冲自旋并被置于磁架上两分钟。溶液澄清了之后,含有最终扩增子文库的上清被转移至新Lobind管(Eppendorf,Part No.022431021)。
评估文库大小分布并确定模板稀释因子
最终扩增子文库被定量以确定文库稀释度(模板稀释因子),其导致在用于模板制备的优化的靶范围内的浓度(例如,PCR介导的文库分子加到Ion SphereTM颗粒上)。通常采用Ion Library Quantitation Kit(qPCR)(Life Technologies,Part No.4468802)和/或BioanalyzerTM(Agilent Technologies,Agilent 2100 Bioanalyzer)对最终扩增子文库针对下游模板制备操作进行定量以确定扩增子文库的摩尔浓度,由其计算模板稀释因子。例如,通过实时定量PCR(qPCR)确定模板稀释因子的说明可以在Ion Library QuantitationKit用户指南(Life Technologies,Part No.4468986)中找到,其全文作为参考引入。
在该实施例中,1微升的最终扩增子文库制备物用Agilent High SensitivityDNA Kit(Agilent Technologies,Part No.5067-4626)在2100BioanalyzerTM上进行分析以产生在135-205bp大小范围的峰和在大约5x109拷贝/微升的浓度。
进行模板制备
一等份的最终文库被用于制备DNA模板,其被采用乳液PCR(emPCR)在Ion SphereTM颗粒上克隆扩增。在本实施例中模板的制备是采用Ion Xpress Template Kit(LifeTechnologies,Part No.4466457)根据制造商的说明书(其全文作为参考引入)制备。一旦模板阳性Ion Sphere颗粒被富集,一等份的该Ion Sphere被加入Ion 314TM芯片(LifeTechnologies,Part No.4462923),如离子测序用户指南(Part No.4467391)(其全文作为参考引入)所述,并如Ion Torrent PGM测序仪指南(Life Technologies,PartNo.4462917)(其全文引入)所述进行分析和测序。
表A
Figure BDA0002246933060000871
Figure BDA0002246933060000881
Figure BDA0002246933060000891
Figure BDA0002246933060000911
本发明的一些实施方案如下:
1.用于扩增样品内的多个不同靶序列的方法,其包括:
在单个扩增反应混合物内从包括多个不同靶序列的样品扩增所述多个不同靶序列,其中所述扩增包括在扩增条件下将所述样品的至少一些部分接触多个靶特异性引物和聚合酶,从而产生扩增的多个靶序列,其中不同扩增的靶序列中的至少两个是彼此小于50%互补的,并且其中所述多个靶特异性引物中的至少一个和所述扩增的靶序列中的至少一个包括可切割的基团;
切割所扩增的多个靶序列中的至少一个扩增的靶序列的可切割的基团;
在平端连接反应中将至少一个接头连接至至少一个扩增的靶序列,从而产生一个或多个接头连接的扩增的靶序列,以及
再扩增所述接头连接的扩增的靶序列中的至少一个。
2.如实施方案1所述的方法,其中所述至少一个接头中的一个或多个基本上不与至少一个扩增的靶序列互补。
3.如实施方案1所述的方法,其中所述再扩增包括在扩增条件下将所述至少一个接头连接的扩增的靶序列与包括与所述接头或它们的互补序列中的至少一个互补的序列的一个或多个引物和聚合酶接触,从而产生至少一个再扩增的接头连接的扩增的靶序列。
4.如实施方案3所述的方法,其中所述一个或多个接头或它们的互补序列中的至少一个基本上不与至少一个扩增的靶序列互补。
5.如实施方案1所述的方法,其中至少一个靶特异性引物与所述样品中的相应靶序列的至少一部分基本上互补。
6.如实施方案1所述的方法,其中连接至所述扩增的靶序列中的至少一个的接头易受核酸外切酶消化。
7.如实施方案1所述的方法,其中连接至所述扩增的靶序列中的至少一个的接头不包括保护性基团。
8.如实施方案1所述的方法,其中所述连接包括在连接条件下将具有3'端和5'端的至少一个扩增的靶序列与包括一个或多个接头和连接酶的连接反应混合物接触,其中,在所述连接之前,所述连接反应混合物中的所述接头没有一个包括靶特异性序列。
9.如实施方案8所述的方法,其中所述连接包括在连接条件下将至少一个扩增的靶序列与包括一个或多个接头和连接酶的连接反应混合物接触,其中,在将所述一个或多个接头连接至至少一个扩增的靶序列之前,所述连接反应混合物不包括一个或多个另外的寡核苷酸接头。
10.如实施方案1所述的方法,其中所述扩增在所述连接之前进一步包括消化步骤,从而产生多个具有5'磷酸基团的平端扩增的靶序列。
11.配置为与人基因组的一组SNP区域特异性杂交的多个引物对,其中所述一组SNP区域选自表1的SNP区域,并且其中至少一个引物对中的至少一个引物包含可切割的核苷酸。
12.多个引物对,其中一组SNP包含表1的条目1-136。
13.多个引物对,其中一组SNP包含表1的条目1-103。

Claims (10)

1.用于扩增样品内的多个不同靶序列的方法,其包括:
在单个扩增反应混合物内从包括多个不同靶序列的样品扩增所述多个不同靶序列,其中所述扩增包括在扩增条件下将所述样品的至少一些部分接触多个靶特异性引物和聚合酶,从而产生扩增的多个靶序列,其中不同扩增的靶序列中的至少两个是彼此小于50%互补的,并且其中所述多个靶特异性引物中的至少一个和所述扩增的靶序列中的至少一个包括可切割的基团;
切割所扩增的多个靶序列中的至少一个扩增的靶序列的可切割的基团;
在平端连接反应中将至少一个接头连接至至少一个扩增的靶序列,从而产生一个或多个接头连接的扩增的靶序列,以及
再扩增所述接头连接的扩增的靶序列中的至少一个。
2.如权利要求1所述的方法,其中所述至少一个接头中的一个或多个基本上不与至少一个扩增的靶序列互补。
3.如权利要求1所述的方法,其中所述再扩增包括在扩增条件下将所述至少一个接头连接的扩增的靶序列与包括与所述接头或它们的互补序列中的至少一个互补的序列的一个或多个引物和聚合酶接触,从而产生至少一个再扩增的接头连接的扩增的靶序列。
4.如权利要求3所述的方法,其中所述一个或多个接头或它们的互补序列中的至少一个基本上不与至少一个扩增的靶序列互补。
5.如权利要求1所述的方法,其中至少一个靶特异性引物与所述样品中的相应靶序列的至少一部分基本上互补。
6.如权利要求1所述的方法,其中连接至所述扩增的靶序列中的至少一个的接头易受核酸外切酶消化。
7.如权利要求1所述的方法,其中连接至所述扩增的靶序列中的至少一个的接头不包括保护性基团。
8.如权利要求1所述的方法,其中所述连接包括在连接条件下将具有3'端和5'端的至少一个扩增的靶序列与包括一个或多个接头和连接酶的连接反应混合物接触,其中,在所述连接之前,所述连接反应混合物中的所述接头没有一个包括靶特异性序列。
9.如权利要求8所述的方法,其中所述连接包括在连接条件下将至少一个扩增的靶序列与包括一个或多个接头和连接酶的连接反应混合物接触,其中,在将所述一个或多个接头连接至至少一个扩增的靶序列之前,所述连接反应混合物不包括一个或多个另外的寡核苷酸接头。
10.如权利要求1所述的方法,其中所述扩增在所述连接之前进一步包括消化步骤,从而产生多个具有5'磷酸基团的平端扩增的靶序列。
CN201911020094.8A 2012-07-13 2013-07-15 采用一组snp的人身份识别 Pending CN110777195A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261671618P 2012-07-13 2012-07-13
US61/671,618 2012-07-13
CN201380046949.9A CN104619863A (zh) 2012-07-13 2013-07-15 采用一组snp的人身份识别

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380046949.9A Division CN104619863A (zh) 2012-07-13 2013-07-15 采用一组snp的人身份识别

Publications (1)

Publication Number Publication Date
CN110777195A true CN110777195A (zh) 2020-02-11

Family

ID=48874550

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380046949.9A Pending CN104619863A (zh) 2012-07-13 2013-07-15 采用一组snp的人身份识别
CN201911020094.8A Pending CN110777195A (zh) 2012-07-13 2013-07-15 采用一组snp的人身份识别

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201380046949.9A Pending CN104619863A (zh) 2012-07-13 2013-07-15 采用一组snp的人身份识别

Country Status (4)

Country Link
US (2) US20150167068A1 (zh)
EP (2) EP3388533A1 (zh)
CN (2) CN104619863A (zh)
WO (1) WO2014012107A2 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6114694B2 (ja) 2010-10-04 2017-04-12 ジナプシス インコーポレイテッド 自動化された再使用可能な並行生物反応のための系および方法
US9399217B2 (en) 2010-10-04 2016-07-26 Genapsys, Inc. Chamber free nanoreactor system
US20130059762A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
US20130059738A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
EP3495497B1 (en) 2011-04-28 2021-03-24 Life Technologies Corporation Methods and compositions for multiplex pcr
US9926596B2 (en) 2011-05-27 2018-03-27 Genapsys, Inc. Systems and methods for genetic and biological analysis
CN104105797B (zh) 2011-12-01 2016-08-31 吉纳普赛斯股份有限公司 用于高效电子测序与检测的***和方法
US9809852B2 (en) 2013-03-15 2017-11-07 Genapsys, Inc. Systems and methods for biological analysis
EP3792921A1 (en) 2013-12-11 2021-03-17 Genapsys, Inc. Systems and methods for biological analysis and computation
EP3102699B1 (en) 2014-02-07 2018-10-31 Qiagen Sciences, LLC Pcr primers
EP3556864B1 (en) 2014-04-18 2020-12-09 Genapsys, Inc. Methods and systems for nucleic acid amplification
CN107002123A (zh) * 2014-08-14 2017-08-01 生命技术公司 多重转录组分析
AU2016321204B2 (en) 2015-09-08 2022-12-01 Cold Spring Harbor Laboratory Genetic copy number determination using high throughput multiplex sequencing of smashed nucleotides
US10822647B2 (en) * 2016-07-12 2020-11-03 Biodynamics S.R.L. Methods for using long ssDNA polynucleotides as primers (superprimers) in PCR assays
WO2018017884A1 (en) 2016-07-20 2018-01-25 Genapsys, Inc. Systems and methods for nucleic acid sequencing
US10787699B2 (en) * 2017-02-08 2020-09-29 Microsoft Technology Licensing, Llc Generating pluralities of primer and payload designs for retrieval of stored nucleotides
KR101940900B1 (ko) * 2017-02-20 2019-04-10 주식회사 셀레믹스 표적 핵산 분자를 생성하는 방법 및 조성물
CN111566224A (zh) 2017-09-21 2020-08-21 吉纳普赛斯股份有限公司 用于核酸测序的***和方法
CN108694304B (zh) * 2018-05-21 2020-03-24 广州金域医学检验中心有限公司 一种身份关系鉴定方法、装置、设备及存储介质
CN109321646A (zh) * 2018-09-12 2019-02-12 山东省农作物种质资源中心 基于ngs读段与参考序列比对的虚拟pcr方法
CN110592078A (zh) * 2019-09-03 2019-12-20 北京康普森生物技术有限公司 一种用于牛性状扩增子测序的引物组
CN112592981B (zh) * 2020-12-01 2023-06-20 广州精科医学检验所有限公司 用于dna档案建库的引物组、试剂盒和方法
CN114645082A (zh) * 2020-12-17 2022-06-21 厦门大学 一种识别生物个体或对生物个体进行亲缘鉴定的方法和试剂盒

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007149789A2 (en) * 2006-06-22 2007-12-27 Applera Corporation Conversion of target specific amplification to universal sequencing
CN104053786A (zh) * 2011-11-29 2014-09-17 生命技术公司 用于多重pcr 的方法和组合物

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
AU2264197A (en) * 1996-02-09 1997-08-28 Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The Restriction display (rd-pcr) of differentially expressed mrnas
US6258533B1 (en) * 1996-11-01 2001-07-10 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method
AU2001255518A1 (en) * 2000-06-07 2001-12-17 Baylor College Of Medicine Compositions and methods for array-based nucleic acid hybridization
JP2005516300A (ja) 2002-01-25 2005-06-02 アプレラ コーポレイション 製品およびサービスに対する注文を発注し、受理し、および充足する方法
US7135310B2 (en) * 2002-04-24 2006-11-14 The Regents Of The University Of California Method to amplify variable sequences without imposing primer sequences
EP3000899A1 (en) 2002-12-04 2016-03-30 Applied Biosystems, LLC Multiplex amplification of polynucleotides
FR2852605B1 (fr) * 2003-03-18 2012-11-30 Commissariat Energie Atomique Procede de preparation de fragments d'adn et ses applications
FR2853907B1 (fr) * 2003-04-18 2007-08-03 Commissariat Energie Atomique Procede de preparation de fragments d'adn par fragmentation selective d'acides nucleiques et ses applications
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US20070172839A1 (en) * 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
WO2007111937A1 (en) * 2006-03-23 2007-10-04 Applera Corporation Directed enrichment of genomic dna for high-throughput sequencing
US7754429B2 (en) * 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8518640B2 (en) * 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
US8586310B2 (en) 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
WO2011057094A1 (en) * 2009-11-05 2011-05-12 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
EP3495497B1 (en) * 2011-04-28 2021-03-24 Life Technologies Corporation Methods and compositions for multiplex pcr

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007149789A2 (en) * 2006-06-22 2007-12-27 Applera Corporation Conversion of target specific amplification to universal sequencing
CN104053786A (zh) * 2011-11-29 2014-09-17 生命技术公司 用于多重pcr 的方法和组合物

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANDREW J. PAKSTIS ET AL.: "SNPs for a universal individual identification panel", vol. 127, pages 315 - 324, XP019781746 *
傅继华 等: "《分子生物学研究方法》", vol. 1, 山东科学技术出版社, pages: 139 *
李莉 等: "31个SNP位点多重PCR扩增和芯片分型技术的建立及其法医学应用", vol. 21, no. 21, pages 90 - 95 *

Also Published As

Publication number Publication date
EP3388533A1 (en) 2018-10-17
US20170253922A1 (en) 2017-09-07
WO2014012107A3 (en) 2014-03-27
US20210246498A9 (en) 2021-08-12
EP2872650A2 (en) 2015-05-20
US20150167068A1 (en) 2015-06-18
WO2014012107A2 (en) 2014-01-16
CN104619863A (zh) 2015-05-13

Similar Documents

Publication Publication Date Title
US20210246498A9 (en) Human identification using a panel of snps
US20220267845A1 (en) Selective Amplfication of Nucleic Acid Sequences
CN107922970B (zh) 通过单探针引物延伸的靶标富集
CN106912197B (zh) 用于多重pcr的方法和组合物
US10266881B2 (en) Methods and compositions for multiplex PCR
US9938570B2 (en) Methods and compositions for universal detection of nucleic acids
JP6525473B2 (ja) 複製物配列決定リードを同定するための組成物および方法
EP2785860B1 (en) Methods and compositions for multiplex pcr
WO2020056381A9 (en) PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
AU2018214075A1 (en) Systems and methods for prenatal genetic analysis
CN116064748A (zh) 用于变体检测的方法
AU2015315103A1 (en) Methods and compositions for rapid nucleic acid library preparation
CN115927547A (zh) 用于形成连接产物的方法和组合物
MX2013003349A (es) Captura directa, amplificacion y secuenciacion de objetivo adn usando cebadores inmovilizados.
WO2013081864A1 (en) Methods and compositions for multiplex pcr
WO2016181128A1 (en) Methods, compositions, and kits for preparing sequencing library
JP2017509324A (ja) エラーのないdnaシークエンシング
JP2019517250A (ja) トランスポザーゼランダムプライミング法によるdna試料の調製
US20230101896A1 (en) Enhanced Detection of Target Nucleic Acids by Removal of DNA-RNA Cross Contamination
US20210395799A1 (en) Methods for variant detection
KR20230124636A (ko) 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법
JP2022546485A (ja) 腫瘍高精度アッセイのための組成物および方法
US11680293B1 (en) Methods and compositions for amplifying DNA and generating DNA sequencing results from target-enriched DNA molecules
US20230323451A1 (en) Selective amplification of molecularly identifiable nucleic 5 acid sequences
Song et al. Unexpected Mechanism and Inhibition Effect for Nonspecific Amplification Involving Dynamic Binding of Primers with Background DNA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination