CN104053786B - 用于多重pcr的方法和组合物 - Google Patents

用于多重pcr的方法和组合物 Download PDF

Info

Publication number
CN104053786B
CN104053786B CN201280066951.8A CN201280066951A CN104053786B CN 104053786 B CN104053786 B CN 104053786B CN 201280066951 A CN201280066951 A CN 201280066951A CN 104053786 B CN104053786 B CN 104053786B
Authority
CN
China
Prior art keywords
amplification
target sequence
target
primer
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280066951.8A
Other languages
English (en)
Other versions
CN104053786A (zh
Inventor
J·利蒙
M·安德森
M·桑顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Inc
Original Assignee
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/458,739 external-priority patent/US9957558B2/en
Application filed by Life Technologies Inc filed Critical Life Technologies Inc
Publication of CN104053786A publication Critical patent/CN104053786A/zh
Application granted granted Critical
Publication of CN104053786B publication Critical patent/CN104053786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification

Abstract

本发明提供了用于确定存在于样品中的一个或多个核酸的拷贝数变异的方法、组合物、试剂盒、***和装置。在一些实施方式中,本方法包括允许选择性扩增样品中的一个或多个靶核酸的多种靶标特异性引物。在另一个方面,本发明涉及就样品中的核酸的基因或染色体的代表情况确定拷贝数变异。在一些实施方式中,使用公开的方法、试剂盒、***和装置确定样品中的不同靶核酸的拷贝数变异的方法可用于多种下游过程,包括针对、预测性治疗方案或其它治疗目的。

Description

用于多重PCR的方法和组合物
相关申请的交叉参考
本申请是2012年9月14日提交的美国非临时申请号13/618,805的部分继续申请,也是2012年9月14日提交的美国非临时申请号13/619,815的部分继续申请,也是2012年9月14日提交的美国非临时申请号13/619,178的部分继续申请,其为2012年4月27日提交的国际申请号PCT/US2012/035612的继续申请,也是2012年4月27日提交的美国非临时申请号13/458,739的继续申请,其在35U.S.C.§119(e)下要求2011年4月28日提交的美国临时申请号61/479,952、2011年9月6日提交的美国临时申请号61/531,583、2011年9月6日提交的美国临时申请号61/531,574、2011年9月22日提交的美国临时申请号61/538,079、2011年11月29日提交的美国临时申请号61/564,763、2011年12月20日提交的美国临时申请号61/578,192、2012年2月2日提交的美国临时申请号61/594,160、2012年2月14日提交的美国临时申请号61/598,881、2012年2月14日提交的美国临时申请号61/598,892、2012年4月17日提交的美国临时申请号61/625,596和2012年4月26日提交的标题为“用于多重PCR的方法和组合物”的美国临时申请号61/639,017的优先权,将所述美国临时申请的公开内容通过引用整体并入本文。
序列表
本申请在此通过引用并入随同提交的电子序列表的材料。将电子序列表的材料作为2012年4月25日创建的标题为“2012_04_25LT00503US_ST25.txt”的文本(.txt)文件提交,其具有18943KB的文件大小,并且在本文中通过引用整体并入本文。
技术领域
在一些实施方案中,本公开内容总地来说涉及用于确定包含多个靶序列的样品内的拷贝数变异(copy number variation)的方法、组合物、***、装置和试剂盒。任选地,在单个扩增反应中扩增多个靶序列,例如至少10、50、100、500、1000、2500、5000、7500、10000、25000、50000或100000个靶序列。在一些实施方案中,本公开内容总地来说涉及用于从一个或多个来源例如基因组DNA和/或***固定的石蜡包埋的(FFPE)DNA确定拷贝数变异的方法、组合物、***、装置和试剂盒。具体地,公开了用于使用靶标特异性引物来评价染色体丢失、染色体重复、和/或基因重复的方法、试剂盒、***、装置和组合物。在一些实施方案中,本公开内容总地来说涉及用于从新(de novo)评价样品内的拷贝数变异的方法、组合物、***、装置和试剂盒。
背景
几个生物学应用牵涉选择性扩增群体内的核酸分子。例如,下一代测序法可涉及分析一大群核酸分子内的选择的靶。对于这样的应用,增加可在单个扩增反应内从群体选择性扩增的靶的总数将是有用的。这样的选择性扩增通常通过使用一个或多个能选择性与特定靶核酸分子杂交或选择性促进其扩增的引物来实现。这样的选择性扩增可因扩增假象例如引物二聚体等的形成而复杂化。这样的扩增假象(在本文中也称为非特异性扩增产物)的形成可消耗关键扩增试剂例如核苷酸、聚合酶、引物等。此外,此类假象相对于期望的产物通常可具有更短的长度,在该情况下可比期望的产物更高效地扩增并且占据反应输出的主体。选择性扩增还可因“超级扩增子”的形成即延长的扩增子的形成而复杂化,当第一引物的延伸延伸通过相邻靶核酸序列时,这会发生,从而产生长的非特异性扩增产物,其可用作利用第二引物进行延伸的模板。此类假象在扩增反应中的形成,即使当仅使用单对引物时,亦可使下游应用例如qPCR、克隆、基因表达分析和下一代测序的样品制备复杂化。在一些下游应用(包括几个下一代测序方法)中,该 问题可被实施第二扩增步骤的需要复杂化,因为在第二扩增过程中假象可被进一步放大。例如,下游测序应用可涉及使用乳液PCR(“emPCR”)产生克隆地扩增的核酸群体(所述核酸群体被单个地连接至单独的支持载体例如珠粒)和通过阳性选择进行的克隆的扩增子的富集。在这样的应用中,假象可在从文库产生过程至emPCR阶段一直存在,产生包含非特异性扩增产物的DNA捕获珠粒。这些含假象珠粒可在使用含模板的珠粒富集过程中被选择但在遗传上是无信息的。
可将多重PCR反应中扩增的核酸分子用于许多需要或不需要进一步纯化或操作的下游分析或测定。例如,当以充足的产率获得时,多重PCR反应的产物(扩增子)可用于单核苷酸多态性(SNP)分析、基因分型、拷贝数变异分析、表观遗传学分析、基因表达分析、杂交测定、基因突变(包括但不限于缺失)的分析、疾病状态的预后和/或诊断、罕见或低频率等位基因突变的检测和分析、核酸测序(包括但不限于从头测序或靶向再测序)等。
示例性下一代测序***包括Ion Torrent PGMTM测序仪(Life Technologies)和Ion Torrent ProtonTM测序仪(Life Technologies),所述测序***是基于离子的测序***,其通过检测作为核苷酸掺入的副产品产生的离子来测定核酸模板的序列。通常地,氢离子作为在利用聚合酶的模板依赖性核酸合成过程中发生的核苷酸掺入的副产品释放。IonTorrent PGMTM测序仪和Ion ProtonTM测序仪通过检测核苷酸掺入的氢离子副产品来检测核苷酸掺入。Ion Torrent PGMTM测序仪和Ion Torrent ProtonTM测序仪包括多个待测序的核酸模板,每一个模板被置于阵列的各个测序反应孔内。阵列的孔各自被偶联至至少一个可检测作为核苷酸掺入的副产品产生的H+离子的释放或溶液pH的变化的离子传感器。离子传感器包括偶联至可感知H+离子的存在或溶液pH的变化的离子敏感性检测层的场效应晶体管(FET)。离子传感器提供表征核苷酸掺入的输出信号,所述信号可表示为电压变化值,其辐度与各孔或反应室中的H+离子浓度相关。不同的核苷酸类型连续流 入反应室,并且被聚合酶按照由模板序列决定的顺序掺入正在延伸的引物(或聚合位点)。每一个核苷酸掺入伴随着H+离子在反应孔中的释放,连同局部pH的伴随变化。H+离子的释放被传感器的FET记录,这产生了表征核苷酸掺入发生的信号。在特定核苷酸流动过程中未被掺入的核苷酸将不产生信号。来自FET的信号的大小还可与掺入正在延伸的核酸分子的特定类型的核苷酸的数目相关,从而允许分辨同聚物区域。因此,在测序仪运行过程中,至反应室中的多个核苷酸流动连同跨多个孔或反应室的掺入监控允许仪器同时分辨许多核酸模板的序列。关于Ion Torrent PGMTM测序仪的组成、设计和操作的更详细内容可见于例如美国专利申请系列号12/002781,现公布为美国专利申请号2009/0026082;美国专利申请系列号12/474897,现公布为美国专利公布号2010/0137143;和美国专利申请系列号12/492844,现公布为美国专利公布号2010/0282617,将所述申请全部通过引用整体并入本文。在一些实施方案中,扩增子可经操作或通过桥式扩增或emPCR被扩增来产生多个适合用于多种下游过程(包括核酸测序)的克隆模板。在一个实施方案中,可使用本文中概述的靶特异性扩增技术的一个或多个技术从核酸分子的群体制备待使用Ion Torrent PGMTM或Ion Torrent ProtonTM***测序的核酸模板。任选地,在靶特异性扩增后,可进行第二和/或第三扩增过程,包括但不限于文库扩增步骤和/或克隆扩增步骤例如emPCR。
随着样品核酸群体内期望被扩增的核酸靶数目增加,选择性扩增这些靶同时避免不期望的扩增假象形成的挑战会相应地增加。例如,假象(包括引物二聚体和超级扩增子)的形成在多重PCR反应(其中将用于多个靶的PCR引物对组合在单个反应管中并且共扩增)中可能是个更大的问题。在多重PCR中,额外的引物对以相对于模板DNA升高的浓度存在更可能产生引物间相互作用,以及引物二聚体和其它假象的形成。
用于在核酸扩增过程中避免或减少假象例如引物二聚体的形成的当前方法专注于引物设计过程,并且通常使用专门的软件包(例如, DNAsoftwares的Visual OMP,MultiPLX,ABI的Primer Express等)来设计引物对,所述引物对经预测在扩增过程中显示最小的与池中其它引物的相互作用。通过使用这样的软件,可将引物尽可能设计为靶特异性的或扩增子特异性的,并且引物通常被分组为子集以使引物间相互作用、引物二聚体形成和超级扩增子减少至最低程度。然而,严格的设计参数限制了可被同时共扩增的扩增子的数目,并且在一些情况下可阻止一些扩增子一起扩增。其它目前的方法需要使用多个PCR引物池来将引物分离至非重叠池中以在扩增步骤中使引物假象减少至最少或阻止引物假象形成。其它方法包括使用多个引物池或单重反应来增加每反应扩增产物的总体产率。在多重PCR反应中,每一个引物对在扩增反应中与另外的引物对竞争有限量的dNTP、聚合酶和其它试剂。因此存在对改进的方法、组合物、***、装置和试剂盒的需要,以允许选择性扩增一群核酸分子内的多个靶核酸分子,同时避免假象(也称为非特异性扩增产物)(包括引物二聚体)的形成或使其减少至最低程度。还存在对改进的方法、组合物、***、装置和试剂盒的需要,其允许选择性扩增来自单个核酸样品例如基因组DNA和/或***固定的石蜡包埋的(FFPE)DNA的多个靶核酸分子,同时避免假象的形成或使其减少至最低程度。本领域还存在对改进的方法、组合物、***和试剂盒的需要,以允许在单个反应中同时扩增数千个靶特异性核酸分子,可用于任何适用的下游测定或分析。还需要能够评价核酸样品中的拷贝数变异的改进的方法、组合物、***、装置和试剂盒,特别是用于从新评价拷贝数变异的改进的方法。还需要在基因水平或染色体水平上确定来自样品例如基因组DNA和/或***固定的石蜡包埋的(FFPE)DNA的拷贝数变异的改进的方法、组合物、***、装置和试剂盒,同时避免假象的形成或使其减少至最低程度。本领域还需要能够同时确定来自多个样品(包括正常或疾病样品)的拷贝数变异的改进的方法、组合物、***和试剂盒。
除非另有所指,否则本发明主题的实践可使用有机化学、分子生物学(包括重组技术)、细胞生物学和生物化学的常规技术和说明,这 在本领域技术人员的能力之内。这样的常规技术包括但不限于合成多核苷酸的制备、聚合技术、聚合物颗粒的化学和物理分析、核酸文库的制备、核酸测序和分析等。可参考本文中提供的实施例使用适当技术的具体举例说明。还可使用其它等同的常规方法。这样的常规技术和说明可见于标准实验室手册例如Genome Analysis:A Laboratory Manual Series(第I-IV卷),PCR Primer:A LaboratoryManual,and Molecular Cloning:A Laboratory Manual(全部来自Cold Spring HarborLaboratory Press),Hermanson,Bioconjugate Techniques,第二版(Academic Press,2008);Merkus,Particle Size Measurements(Springer,2009);Rubinstein和Colby,Polymer Physics(Oxford University Press,2003)等。
除非另有所指,否则本文中使用的全部技术和科学术语具有与这些发明所属的领域内的技术人员通常理解的含义相同的含义。本文(上文和下文)中提及的所有专利、专利申请、公布的申请、论文和其它出版物通过引用整体并入本文。如果本文中所示的定义和/或说明与本文中通过引用并入的专利、专利申请、公布的申请和其它出版物中所示的任何定义矛盾或不一致,则以本文中所示的定义和/或说明而非通过引用并入的定义为准。
如本文中所述,术语“包含”、“包括”、“具有”或其任何其它变型意欲包括非排除性包含。例如,包括一系列特性的过程、方法、物品或装置不一定仅受那些特性限制,而是还可包括未明确列出的或这类过程、方法、物品或装置所固有的其它性质。此外,除非明确地指出是相反的,否则“或”是指包含在内的或而非排除性的或。例如,下列方面的任一方面都满足条件“A或B”:A是真的(或存在)并且B是假的(或不存在),A是假的(或不存在)并且B是真的(或不存在),以及A和B都是真的(或存在)。
附图概述
被包括并且形成本说明书的一部分的附图举例说明了一个或多个 示例性实施方案并且用于解释不同示例性实施方案的原理。附图仅仅是示例性和解释性的并且不被稀释为以任何方式限定和限制。
图1A-图1E2是概述利用根据本公开内容的可降解扩增引物的方法的示例性实施方案的图示。
图2是概述获得根据本公开内容的靶特异性扩增子文库的方法的示例性实施方案的图示。
图3A-图3B显示示例性未修饰和修饰引物池的洗脱图谱的实例。图3A显示当使用示例组的标准多重引物时引物二聚体的显著性和优势产生。图3B显示当使用示例组的修饰的多重引物(如由本申请例举的)时引物二聚体的减少和预期的扩增子产物(104bp)的总体增加。
图4A-图4H显示示例性94重和示例性380重反应中增加扩增子GC含量的作用。
图5显示使用引物组HSMv12对基因组DNA进行的示例性多重反应的丰度和重现性的定量。将数据对在Ion Torrent PGMTM测序仪(Life Technologies)上进行的3个个别运行进行平均。每扩增子覆盖度的水平提供为计数的对数。
图6A-6B显示当使用Ion Torrent PGMTM测序仪(Life Technologies)分析时,对基因组DNA进行的示例性多重反应的丰度和重现性的定量。数据显示对于引物池中的正向(图6A)和反向引物(图6B)每扩增子读取数目。
图7显示在Ion Torrent PGMTM测序仪(Life Technologies)上进行的7个个别运行的对基因组DNA进行的示例性384重反应的丰度和重现性的定量。每扩增子读取的平均数目为400。
图8显示在Ion Torrent PGMTM测序仪(Life Technologies)上进行的7个个别运行的对基因组DNA的示例性411重PCR的丰度和重现性的定量。每扩增子的读取的平均数目为400。
图9显示在根据示例性实施方案对FFPE样品进行多重PCR和文库扩增后,显现示例性扩增产物(泳道2和4)的琼脂糖凝胶电泳的图像。
图10显示在使用Ion Torrent PGMTM测序仪(Life Technologies) 获得的示例性384重PCR中从FFPE DNA样品(10ng)获得的数据的丰度和重现性的定量。每扩增子的读取的平均数目为400。
图11A-11B显示在示例性94重反应后从FFPE DNA样品(10ng)获得的数据的丰度和重现性的定量。数据显示对于引物池中正向引物(图11A)和反向引物(图11B)每扩增读取的数目。
图12显示:通过在Ion Torrent PGMTM测序仪(Life Technologies)上进行对照DNA的多重PCR和文库扩增以及测序获得的KRAS基因的密码子12和密码子13的突变的检测。
图13(第1部分)-图13(第3部分)显示当使用根据本公开内容的示例性修饰多重引物和示例性文库扩增法时,鉴定样品中的囊性纤维化(CFTR)基因的6个突变的测序比对数据。
图14显示对于几个包含已知拷贝数变异的DNA样品中的CLTCL1基因的区域获得的12个不同扩增子的频率。按照本公开内容的示例性实施方案获得扩增子。
图15显示对于几个包含已知拷贝数变异的DNA样品中的IKZF1基因的区域获得的4个不同扩增子的频率。按照本公开内容的多重PCR法的示例性实施方案获得扩增子。
图17举例说明用于根据示例性实施方案设计引物或测定的***。
图18举例说明用于根据示例性实施方案设计引物或测定的***。
图19举例说明包括被根据示例性实施方案设计的一对引物包围的***序列的扩增子序列。
图20举例说明包括被根据示例性实施方案的设计的一对引物包围的***物的扩增子序列(其在本文中可称为“tile”)的PCR扩增。
图21(第1部分)-图21(第3部分)举例说明用于给定的靶区域的一组候选扩增子,每一个包括被一对引物包围的***物,用于根据示例性实施方案的拼接(tiling)和汇合。
图22举例说明根据示例性实施方案的方法。
图23举例说明用于根据示例性实施方案拼接一个或多个给定的靶的多个扩增子的方法。
图24举例说明用于根据示例性实施方案确定一个或多个给定的靶和候选扩增子的拼接的方法。
图25A举例说明一组用于覆盖给定的靶区域的候选扩增子,每一个扩增子包括被一对引物包围的***物,用于根据示例性实施方案的拼接和混合。
图25B举例说明根据示例性实施方案用于产生图的一组顶点(vertices)。
图26A举例说明图25A的15个候选扩增子,除3个在它们的***物与靶区域的起始点之间具有至少一些重叠的“初始”扩增子被突出显示外。
图26B举例说明源顶点通过边缘与对应于图25A的初始扩增子的3个顶点的连接。
图27A举例说明图25A的15个候选扩增子,除在它们的***物与靶区域的末端之间具有至少一些重叠的3个“末端”扩增子被突出显示外。
图27B举例说明汇点(sink)顶点通过边缘至对应于图26A的末端扩增子的3个顶点的连接。
图28A举例说明图25A的15个候选扩增子,除各种用于建立内边缘的扩增子被突出显示外。
图28B举例说明根据示例性实施方案的一些扩增子***物顶点至随后的适当的重叠的连接。
图29A举例说明根据示例性实施方案的另外的扩增子***物顶点至随后的适当的重叠的连接。
图29B举例说明图25A的15个候选扩增子,以及根据示例性实施方案的图29A显示的缺口的基础。
图30A举例说明可从源至汇点用于在根据示例性实施方案的实例中拼接靶的3个可能的另外的边缘。
图30B举例说明根据示例性实施方案将成本分配至图的连接扩增子顶点的边缘的每一个的边缘成本函数的示例性定义。
图30C举例说明根据示例性实施方案的图30B的实例中从源至汇点的最低成本通路。
图31举例说明图25A的15个候选扩增子,除突出显示对应于形成图30C中显示的最低成本通路的顶点的5个扩增子外。
图32举例说明按照示例性实施方案分配至第一池的3个扩增子和分配至第二池的2个扩增子。
图33A举例说明根据示例性实施方案的扩增子之间的最短距离。
图33B-D举例说明几个问题,包括引物“竞态条件”、子扩增子的优先扩增和可通过使用图33A中举例说明的最短距离来减少的超级扩增子。
图34举例说明用于根据示例性实施方案将多个池的扩增子汇合的方法。
图35举例说明根据示例性实施方案的方法。
图36A显示了使用Comprehensive Cancer PanelTM(Life Technologies,CA)在跨基因组的染色***置上作图的一式两份正常DNA样品的log2比率的代表性数据。
图36B显示了使用Comprehensive Cancer PanelTM(Life Technologies,CA)在跨基因组的染色***置上作图的一式两份肿瘤DNA样品的log2比率的代表性数据。
图36C显示了使用Comprehensive Cancer PanelTM(Life Technologies,CA)在跨基因组的染色***置上作图的正常DNA样品和肿瘤DNA样品的log2比率的代表性数据。
图36D显示了使用Comprehensive Cancer PanelTM(Life Technologies,CA)在跨基因组的染色***置上作图的正常DNA样品和肿瘤DNA样品的log2比率的代表性数据。
图37A显示了使用Comprehensive Cancer PanelTM(Life Technologies,CA)在跨基因组的染色***置上作图的两个三体性DNA样品(XO DNA样品和XXY DNA样品)的log2比率的代表性数据。
图37B显示了使用Comprehensive Cancer PanelTM(Life Technologies,CA)在跨基因组的染色***置上作图的两个三体性DNA样品(XO DNA样品和XXXXY DNA样品)的log2比率的代表性数据。
图38A显示了使用Comprehensive Cancer PanelTM(Life Technologies,CA)在跨基因组的染色***置上作图的三体性21DNA样品(儿子)和正常(母方)DNA样品的log2比率的代表性数据。
图38B是来自图38A的代表性数据的展开图,聚焦于染色体21和性染色体。
图38C是来自图38A的代表性数据的展开图,聚焦于染色体2。
图39A显示了来自结肠DNA FFPE样品的染色体17内的扩增子的过度代表的代表性数据。
图39B显示了来自结肠DNA FFPE样品的染色体17内的来自图39A的代表性数据的图示。
图40A和图40B显示了使用本文公开的确定拷贝数变异的方法获得的跨域NUP98基因的18个扩增子的频率。图40A显示:相对于预期的扩增子频率,发现1个样品具有2倍的扩增子代表。图40B提供了跨NUP98基因的相对于来自其它扩增子的数据的过度代表的扩增子的盒式图。
概述
在一些实施方式中,本公开内容总地来说涉及确定一个或多个样品的拷贝数变异的方法。在一些实施方式中,本方法包括确定存在于样品中的一个或多个基因的拷贝数变异。在一些实施方式中,本方法包括通过确定基因丢失和/或基因重复来确定一个或多个基因的拷贝数变异。在一些实施方式中,本方法包括确定存在于样品中的一个或多个染色体的拷贝数变异。在一些实施方式中,本方法包括确定相同样品中的一个或多个基因的拷贝数变异和一个或多个染色体的拷贝数变异。在一些实施方式中,确定拷贝数变异的方法可包括鉴定一个或多个样品中的染色体丢失、染色体***和/或染色体重复。在一些实施 方式中,拷贝数变异包括确定样品中非整倍性的存在。在一些实施方式中,拷贝数变异包括鉴定样品的杂合性的丢失。在一些实施方式中,确定拷贝数变异的方法可以包括同时确定一个或多个样品的拷贝数变异。在一些实施方式中,本方法包括使用基于ISFET的测序方法确定一个或多个样品的拷贝数变异。在一些实施方式中,本方法包括同时确定一个或多个样品中的一个或多个染色体的染色体丢失、染色体***和/或染色体重复。
在一些实施方式中,确定拷贝数变异的方法包括通过下列步骤扩增样品中的多个不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割所述可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列产生一个或多个接头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列;对至少一个扩增的接头连接的靶序列进行测序;计算所述至少一个扩增的接头连接的靶序列的测序读取(sequencing read)的数目;和确定所述至少一个扩增的接头连接的靶序列的拷贝数变异。
在一些实施方式中,本方法包括通过下列步骤扩增两个或更多个样品中的多个不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割所述可切割基团;通过将至少一个不同的条码接头连接至来自每个样品的至少一个扩增的靶序列产生一个或多个条码接头连接的扩增的靶序列;使用引物再扩增来自每个样品的所述至少一个条码接头连接的扩增的靶序列;对来自每个样品的至少 一个扩增的接头连接的扩增的靶序列进行测序;计算来自每个样品的所述至少一个扩增的接头连接的靶序列的测序读取的数目;和确定每个样品的所述至少一个扩增的接头连接的靶序列的拷贝数变异。
在一些实施方式中,确定染色体拷贝数变异的方法包括通过下列步骤扩增样品中的多个不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割所述可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列产生一个或多个接头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列;对至少一个扩增的接头连接的靶序列进行测序;计算所述至少一个扩增的接头连接的靶序列的测序读取的数目;和确定所述至少一个扩增的接头连接的靶序列的染色体拷贝数变异。
在一些实施方式中,计算一个或多个扩增的接头连接的靶序列的测序读取的数目可以包括本领域普通技术人员已知的任何方法。通常而言,每个扩增的接头连接的靶序列的测序读取的数目被报告为:每个扩增的接头连接的靶序列的总的映射的测序读取的数目。在一些实施方式中,本方法可包括计算测序运行中的每个扩增的接头连接的靶序列的测序读取的数目。在一些实施方式中,本方法可包括计算一组选择的扩增的接头连接的靶序列的测序读取的数目,例如与特异性基因组坐标或基因相关的映射的测序读取的数目。在一些实施方式中,本方法可包括计算来自一个或多个样品的一个或多个扩增的接头连接的靶序列的测序读取的数目,例如配对的遗传样品;来自不同来源的样品,例如水来源和食品来源;或来自不同个体或动物的样品,例如亲代样品和子代样品。通常而言,样品包含足够的遗传材料,以进行所述一个或多个不同靶序列的扩增。在一些实施方式中,所述样品可包括单个细胞,从单个细胞提取的DNA,或分离自循环的肿瘤细胞的 DNA。例如,根结本文的方法,可以在测定例如Ion Torrent Hotspot Mutation PanelTM(Life Technologies,CA,Catalog No.4471262),the Comprehensive Cancer PanelTM(Life Technologies,CA,Catalog No.4477685),or the Inherited Disease Panel(Life Technologies,CA,Catalog No.447686)中使用基因组DNA或***固定的石蜡包埋的(FFPE)DNA,在进行了扩增和接头连接步骤之后,在测序平台例如Ion Torrent ProtonTM或PGMTM platform(LifeTechnologies,CA,Catalog No.4462917)上对文库进行测序。然而,在本文公开的方法中可以使用任何能够计算每个扩增子的映射的读取数目的测序平台。
测序平台的数据输出可以任选地以这样的方式来过滤以使操作者能够选择一个或多个扩增的接头连接的靶序列来进行拷贝数测定。在一些实施方式中,测序平台的数据输出可以任选地被过滤以选择一个或多个扩增的接头连接的靶序列以进行拷贝数测定,这通过计算每个选择的扩增的接头连接的靶序列的测序读取的数目来进行。在一些实施方式中,跨多个样品提供选择的扩增的接头连接的靶序列的测序读取的数目,例如通过使用多个条码化的文库。在一些实施方式中,选择的扩增的接头连接的靶序列与一个或多个目标基因相关。在其它实施方式中,测序平台的数据输出可以任选地被过滤以计算与已知的病症或疾病相关的一个或多个扩增的接头连接的靶序列的测序读取的数目。在一些实施方式中,测序平台的数据输出可以被过滤以计算与癌症或遗传疾病相关的基因的测序读取的数目,例如通过使用Ion AmpliseqTM Inherited Disease Panel(Life Technologies,CA,Catalog No.4477686)或Ion AmpliseqTM Comprehensive Cancer Panel(LifeTechnologies,CA,Catalog No.4477685)和Ion Torrent Suite软件。在一些实施方式中,输出可以任选地被配置为计算跨基因组的一个或多个扩增的接头连接的靶序列(通过例如染色体坐标或基因坐标作图的)的测序读取的数目。
在一些实施方式中,本公开内容的扩增的接头连接的靶序列对应于与一个或多个基因或染色体相关的扩增子。在一些实施方式中,为 每个目标基因或染色体制备多个扩增子。在一些实施方式中,扩增子跨基因的编码区和/或UTR区。在一些实施方式中,扩增的接头连接的靶序列被设计为沿着基因或遍及基因的长度在交错的或常规相间的间隔发生。在一些实施方式中,扩增的接头连接的靶序列被设计为跨基因组的每个染色体的间隔发生。在一些实施方式中,扩增的接头连接的靶序列被设计为与相同样品中的另一个扩增的接头连接的靶序列不重叠。在一些实施方式中,扩增的接头连接的靶序列被设计为扩增与肿瘤相关的基因。用于本公开的方法的靶标特异性引物的实例包括来自Hotspot MutationPanelTM,Inherited Disease PanelTM和Comprehensive Cancer PanelTM的引物库,都可从Life Technologies,CA商购获得。
在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:确定扩增的接头连接的靶序列的总的映射的测序读取的数目。在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:确定相对于同一个测序运行中获得的总的映射的测序读取的数目,扩增的接头连接的靶序列的总的映射的测序读取的数目。在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:将扩增的接头连接的靶序列的总的映射的测序读取除以测序运行中获得的总的映射的测序读取,乘以100,以获得“百分率频率”。例如,相对于单一测序运行中等于100的总的映射测序读取(包括扩增子A、B、C、D和E),单个扩增的接头连接的靶序列的等于1的总的映射的测序读取(扩增子A)将对应于1%的频率。在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:确定在指定阈值之上的对于扩增的接头连接的靶序列获得的测序读取的数目。在一些情况下,所述阈值可以包括人工阈值,例如大于40个总的映射的读取/扩增的接头连接的靶序列,或大于0.5百分率频率。
在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:一个样品中的扩增的接头连接的靶序列的总的映射的 测序读取的数目除以第二样品中的相同的扩增的接头连接的靶序列的总的映射的测序读取的数目,以产生“百分率比率”。
在一些实施方式中,样品之一是参考样品,其不含拷贝数变异(即,是正常DNA样品)。在一些实施方式中,样品之一是参考样品,其不含基因或染色体拷贝数变异。在一些实施方式中,第二样品是目标样品,其基因拷贝数变异或染色体拷贝数变异是待确定的。在一些实施方式中,每个样品可以是目标样品,其基因拷贝数变异或染色体拷贝数变异是待测的(在不存在参考样品的情况下)。例如,已知基因ERBB2在一些形式的结肠癌中是高度重复的。含有高水平的ERBB2重复的样品可以使用本文的方法被鉴定为具有拷贝数变异(见图39A和图39B)。在该情况下,发现位于ERBB2内的几个扩增的接头连接的靶序列的总的映射的测序读取的数目相对于同一测序运行中位于ERBB2邻近位置的其它基因显著较高(高20倍)。因此,无需参考样品,操作者能够直接从测序输出确定哪些扩增的接头连接的靶序列显著升高(或降低)。在一些实施方式中,本公开内容的用于确定样品中一个或多个核酸的拷贝数变异的方法可用于鉴定含有拷贝数变异的样品中的核酸。在一些实施方式中,选择性鉴定那些含有拷贝数变异的核酸在遗传疾病分析和治疗中是特别有用的。使用上述选择性方法,操作者能够鉴定特定基因的拷贝数变异或大的基因组重复或缺失的拷贝数变异,其通常表征为致病性突变。检测这些拷贝数变异可用于治疗或预后目的。例如,含有部分缺失的基因相对于全长基因可能对于某些药物敏感。肿瘤通常含有缺失或重复的一个或多个外显子,本文公开的用于确定拷贝数变异的方法可以与预后治疗性目的偶联。在一些实施方式中,本文公开的方法可用于监控样品中拷贝数变异的时间进程。例如,可以监控具有发生结肠癌风险的个体在几年的时间内的拷贝数变异(他们的DNA中的),如果观察到拷贝数变异的变化,并且则该拷贝数变异与结肠癌中发现的基因过度代表或基因代表不足相关,则肿瘤学家可能希望考虑与进行拷贝数变异测试的个体的结肠癌谱匹配的治疗方案。
在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目还可以包括:确定一个或多个扩增的接头连接的靶序列的百分率比率的以2为底的对数比率。一般地,为了确定扩增的接头连接的靶序列的以2为底的对数比率,将第一样品中的扩增的接头连接的靶序列的映射的测序读取的总数目与第二样品中相同的扩增的接头连接的靶序列的映射的测序读取的总数目进行比较,以获得百分率比率。然后使用已经确定的百分率比率计算每个扩增的接头连接的靶序列的以2为底的对数比率(log2比率)。例如,将来自样品1的扩增的接头连接的靶序列(扩增子A)的映射的测序读取的总数目与来自不同样品(样品2)的相同的扩增的接头连接的靶序列(扩增子A)的映射的测序读取的总数目进行比较以计算百分率比率。然后使用每个扩增的接头连接的靶序列的百分率比率计算以2为底的对数。在一些实施方式中,可以将log2比率跨一个或多个基因、跨染色体和/或跨基因组作图。在该实施方式中,每个log2比率对应于每个扩增的接头连接的靶序列相对于来自另一个样品的对应的扩增的接头连接的靶序列的标准化。当比较肿瘤样品的测序数据与匹配的正常组织样品的测序数据时,或者当比较遗传上相关个体例如祖父母、父母和/或子女时,或者当比较来自不同细胞系的细胞时,log2比率的图是特别有用的可视化工具,因为它提供了容易的可视形式,通过它鉴定无关项,因此,鉴定哪些扩增的接头连接的靶序列在目标样品中是过度代表的或代表不足的。
在一些实施方式中,百分率频率可用于确定目标样品中一个或多个基因和/或染色体的拷贝数变异。例如,一旦计算了百分率频率,其可用于确定任意扩增的接头连接的靶序列是否实质上偏离样品中的任何其它扩增的接头连接的靶序列,或是否实质上偏离参考样品或对应的目标基因或染色体的预期的百分率频率。例如,百分率频率降低0.5或更多可能指示扩增的接头连接的靶序列内的缺失。相反,百分率频率升高1.0或更多可能指示扩增的接头连接的靶序列内的重复(见图40A和图40B)。
在一些实施方式中,log2比率可用于确定目标样品中一个或多个 基因和/或染色体的拷贝数变异。例如,一旦计算了log2比率,其可用于确定任意扩增的接头连接的靶序列是否实质上偏离样品中的任何其它扩增的接头连接的靶序列,或是否实质上偏离参考样品或对应的目标基因或染色体的预期的百分率频率。例如,log2比率降低0.5或更多可能指示扩增的接头连接的靶序列内的缺失(见图38A)。相反,log2比率升高1.0或更多可能指示扩增的接头连接的靶序列内的重复(见图37B)。
在一些实施方式中,倍数增加可用于确定目标样品中一个或多个基因和/或染色体的拷贝数变异。例如,使用本文公开的方法,可以计算一个或多个目标样品的百分率比率。一旦计算了百分率比率,其可用于确定样品相对于参考或对照样品的倍数增加。如果倍数增加与零实质上不同,则差异可以与目标样品中遗传材料的丢失或重复相关联。例如,发现20倍的倍数增加与染色体17中扩增的接头连接的靶序列的重复相关联(见图39A)。
在一些实施方式中,确定至少一个扩增的接头连接的靶序列的拷贝数变异不需要使用参考或对照样品。在一些情况下,使用本文公开的方法扩增目标样品产生具有实质上偏离水平的过度代表或代表不足的测序数据。基于这样的测序结果,可以直接确定哪些扩增的接头连接的靶序列在样品是过度代表的或代表不足的。本文中提供的确定拷贝数变异的实例是代表性的而非穷举性的或限制性的。考虑到其它的用于确定拷贝数变异的适当方法可以替代上述步骤。
在一些实施方案中,本公开内容总的来说涉及用于进行核酸的多重扩增的方法、组合物、***、装置和试剂盒。在一些实施方案中,所述方法包括扩增包括两个或更多个靶序列的样品中的多个靶序列。任选地,可在扩增条件下,在聚合酶存在的情况下,使用一个或多个靶特异性引物扩增来自样品的多个目的靶序列以产生多个扩增的靶序列。扩增任选地包括在扩增条件下将包含至少一个靶序列的核酸分子与一个或多个靶特异性引物和至少一种聚合酶接触。接触可产生一个或多个扩增的靶序列。
在一些实施方案中,公开的方法(和相关组合物、***、装置和试剂盒)可包括将至少一个接头连接至扩增的靶序列的至少一个来产生一个或多个接头连接的扩增的靶序列。接头可包括至少一个基本上不与靶序列、不与扩增的靶序列和/或不与核酸分子互补的序列。
在一些实施方案中,扩增可产生至少两个彼此互补低于50%的扩增的靶序列。在一些实施方案中,至少一个扩增的靶序列基本上不与样品中的另一个靶序列互补。在一些实施方案中,扩增的靶序列可以基本上不与不包括靶序列的样品中的任一种或多种核酸分子互补。
在一些实施方案中,公开的方法(以及相关组合物、***、装置和试剂盒)可涉及再扩增至少一个扩增的靶序列。例如,可再扩增接头连接的扩增的靶序列以产生至少一个再扩增的接头连接的扩增的靶序列。在一些实施方案中,可将接头连接的扩增的靶序列中的至少一个与一个或多个接头或它们的互补序列以及聚合酶在扩增条件下接触,以产生至少一个再扩增的接头连接的扩增的靶序列。在一些实施方案中,至少一个接头或其互补序列基本上不与至少一个扩增的靶序列互补。
在一些实施方案中,本公开内容总的来说涉及组合物(以及使用这样的组合物的相关方法、试剂盒、装置和***),其包含一个或多个用于与样品中的至少一个靶序列杂交,和任选地扩增所述靶序列的靶特异性引物。在一些实施方案中,组合物可包括多个用于扩增样品中的1、2或更多个靶序列的靶特异性引物。组合物还可包括一个或多个接头。
在一些实施方案中,靶序列包括一个或多个突变热点、单核苷酸多态性(SNP)、短串联重复(STR)、编码区、外显子和基因。在一些实施方案中,在单个反应中,使用本文中公开的组合物(和相关试剂盒、装置和***)通过一个或多个方法扩增的靶序列的数目可以是数十、数百或数千个靶序列。在一些实施方案中,在单个多重扩增中扩增的不同靶的数目可以为至少100、300、500、750、1000、2500、5000、7500、10000、12500、15000或更多。
在一些实施方案中,靶特异性引物、接头、扩增的靶序列或核酸分子可包括一个或多个可切割的部分。在本文中也称为可切割基团。任选地,方法还可包括切割靶特异性引物、接头、扩增的靶序列或核酸分子的至少一个可切割基团。可在公开的方法的任何其它步骤之前或之后进行切割。在一些实施方案中,切割步骤在扩增后和连接之前进行。在一个实施方案中,切割包括在连接之前切割至少一个扩增的靶序列。可切割的部分可存在于修饰的核苷酸、核苷或核碱基中。在一些实施方案中,可切割部分可包括在目标靶序列中非天然存在的核碱基。在一些实施方案中,可将尿嘧啶或尿苷掺入基于DNA的核酸中作为可切割基团。在一个示例性实施方案中,尿嘧啶DNA糖基化酶可用于从核酸切割可切割基团。在另一个实施方案中,可将肌苷掺入基于DNA的核酸中作为可切割基团。在一个示例性实施方案中,EndoV可用于在肌苷残基附近切割,其它酶例如Klenow可用于产生能够平末端连接的平末端片段。在另一个示例性实施方案中,酶hAAG可用于从核酸切割肌苷残基,从而产生可通过一个或多个酶例如Klenow进一步加工(以产生能够平末端连接的平末端片段)的无碱基位点。
在一些实施方案中,本文中公开的方法(以及相关试剂盒、组合物、装置和***)可包括扩增样品的至少两个彼此不同的靶序列(例如,第一靶序列和第二靶序列)。在一些实施方案中,本文中公开的方法(以及相关试剂盒、组合物、装置和***)包括同时扩增彼此互补不足50%的第一靶序列和第二靶序列。在一些实施方案中,第一靶序列和第二靶序列彼此基本上不互补。
在一些实施方案中,本文中公开的方法(以及相关试剂盒、组合物、装置和***)可包括使用至少两个彼此不同的靶特异性引物(例如,第一靶特异性引物和第二靶特异性引物)进行扩增。在一些实施方案中,第一靶特异性引物可与第一靶序列的至少一些部分具有至少50%的互补性。在一些实施方案中,第一靶特异性引物可与样品中的另一个靶序列基本上不互补。例如,第一靶特异性引物可与第二靶序列基本 上不互补。任选地,第一靶特异性引物可与样品中的第一靶序列基本上互补,并且可与样品中除第一靶序列外的任何其它核酸分子的任何部分基本上不互补。
任选地,本文中公开的多重扩增的方法包括使用至少一个靶特异性引物扩增样品中的靶序列的至少一部分,所述引物与包含对应靶序列的核酸分子的至少一些部分基本上互补。在一些实施方案中,至少一个靶特异性引物与对应的靶序列的至少一些部分基本上互补。在一些实施方案中,扩增可包括使用包括靶特异性正向引物和靶特异性反向引物的引物对。在一些实施方案中,靶特异性引物可包括至少一个与包含对应靶序列或其互补序列的核酸分子的至少一些部分基本上互补或基本上同一的序列。任选地,靶特异性引物基本上不与存在于样品中的任何其它核酸分子互补。在一些实施方案中,靶特异性引物可包括至少一个与对应的靶序列或其互补序列的至少一些部分基本上互补或基本上同一的序列。在一些实施方案中,靶特异性引物可包括至少一个与对应的靶序列或其互补序列的至少一些部分互补或同一的序列。在一些实施方案中,靶特异性引物不包括任何这样的核酸序列:所述核酸序列在长度上为至少5个连续核苷酸、8个核苷酸、10个连续核苷酸或15个连续核苷酸,并且与其对应靶序列的至少一些部分基本上不互补。在一些实施方案中,靶特异性引物可在严格条件下与样品中对应的靶序列的至少一些部分杂交。在一些实施方案中,靶特异性引物的至少一个基本上不与除其对应靶序列外的存在于样品中的任何核酸序列互补。
在一些实施方案中,一个或多个靶特异性引物可被设计来排除一个或多个序列基序。例如,靶特异性引物的至少一个可被设计为不包括在靶特异性引物中重复5次或更多次的三联体核苷酸基序。任选地,靶特异性引物的至少一个可被设计为不包括重复3次或更多次的核苷酸序列“ACA”。此外,靶特异性引物的至少一个可被设计为不包括在长度上大于8个核苷酸的同聚体。任选地,本文中公开的方法的靶特异性引物的至少一个可被设计为具有低于85%的GC含量。
在一些实施方案中,本文中公开的一个或多个扩增法包括进行靶特异性扩增。进行靶特异性扩增可包括使用一个或多个专有靶特异性引物(即不包括任何共有或通用序列基序的引物)扩增一个或多个靶序列。通常地,靶特异性引物的一个或多个与它们的对应靶序列的至少一些部分基本上互补,或与包含对应靶序列的核酸分子的一些部分基本上互补。在一些实施方案中,一个、一些或全部靶特异性引物在它们的(即,引物的)整个长度上与它们的对应靶序列的至少一些部分基本上互补,或与包含对应靶序列的核酸分子的一些部分基本上互补。
在一些实施方案中,样品中的核酸分子、扩增的靶序列、接头或靶特异性引物包括5’末端和3’末端。5’末端可包括游离5’磷酸基团或其等同物;3’末端可包括游离3’羟基或其等同物。任选地,扩增的靶序列的末端可基本上不与另一个扩增的靶序列的末端互补。在一些实施方案中,3’末端从3’羟基可包括约30个核苷酸或约15个核苷酸。在一些实施方案中,5’末端从5’磷酸基团可包括约30个核苷酸或约15个核苷酸,在一些实施方案中,任一个具有3’末端和5’末端的扩增的靶序列可基本上不与任何其它扩增的靶序列的任何部分互补。
任选地,公开的方法还可包括将一个或多个包含通用引发序列的接头连接至作为这样的靶特异性扩增的结果形成的扩增产物。例如,在一些实施方案中,可将一个或多个接头连接至扩增的靶序列。任选地,连接至扩增的靶序列的接头易被外切核酸酶降解。在一些实施方案中,可将对外切核酸酶降解易感的接头连接至扩增的靶序列的3’末端。在一些实施方案中,连接至扩增的靶序列的接头不包括保护基团。在一些实施方案中,接头不包括保可在降解或消化条件下阻止核酸降解或消化的保护基团。在不包含保护基团的核酸存在的情况下接头连接的扩增的靶序列的随后的酶促消化提供了选择性消化未保护的核酸的方法。在一些实施方案中,接头可包括DNA条形码或标签序列。
在一些实施方案中,本文中公开的方法(以及相关试剂盒、***、装置和组合物)可包括将具有3’末端和5’末端的扩增的靶序列与连接反应混合物接触。在一些实施方案中连接反应混合物可包含一个或多 个接头和连接酶来产生至少一个接头连接的扩增的靶序列。在一些实施方案中,在连接之前,连接混合物中没有一个接头包含靶特异性序列。在一些实施方案中,在连接之前,连接混合物中没有一个接头包含与扩增的靶序列的3’末端或5’末端基本上互补的序列。任选地,扩增的靶序列的3’末端或5’末端包括约30个核苷酸,并且在一些情况下是指距离扩增的靶序列的3’末端或5’末端的约15个核苷酸。在一些实施方案中,在连接之前,连接混合物中没有一个接头可在高度严格度下与扩增的靶序列的一些部分杂交。在一些实施方案中,连接可包括一个或多个接头至一个或多个扩增的靶序列的直接连接。在一个实施方案中,连接可包括进行平末端连接。例如,平末端连接的过程可包括将基本上平末端双链扩增的靶序列连接至基本上平末端双链接头。在一些实施方案中,连接不包括在将接头连接至扩增的靶序列之前一个或多个另外的寡核苷酸接头。
在一些实施方案中,本公开内容总地来说涉及用于进行靶序列的扩增的方法(以及使用公开的方法的相关组合物、***、装置和试剂盒),并且可包括消化步骤。在一些实施方案中,方法还包括连接步骤,并且在连接步骤之前进行消化步骤。在一些实施方案中,可部分消化扩增的靶序列,然后进行连接步骤。例如,可通过酶促、热或化学方法消化扩增的靶序列。在一些实施方案中,可消化扩增的靶序列,随后进行连接,以产生平末端扩增的靶序列。在一些实施方案中,平末端扩增的靶序列可在消化的扩增的靶序列的5’末端包含5’磷酸基团。
在一些实施方案中,本公开内容总地来说涉及用于进行多重核酸扩增的方法、组合物、***、装置和试剂盒。在一些实施方案中,方法(以及使用这样的方法的相关组合物、试剂盒、装置和***)包括在扩增条件下,在聚合酶存在的情况下使用一个或多个靶特异性引物扩增一个或多个靶序列来产生扩增的靶序列,以及将接头连接至扩增的靶序列。此外,方法可包括再扩增接头连接的扩增的靶序列以形成再扩增的接头连接的扩增的靶序列。在一些实施方案中,再扩增的接头连接的扩增的靶序列可使用不超过两轮靶特异性选择来产生。
在一些实施方案中,一个或多个靶特异性引物、靶序列或接头可包括可切割基团。此外,可切割基团可位于靶特异性引物、靶序列或接头的末端上或末端附近的核苷酸位置。在一些实施方案中,可切割基团可位于具有可切割基团的核酸的3’末端或5’末端的15个核苷酸内。在一些实施方案中,可切割基团可位于靶特异性引物的中央核苷酸或在其附近。在一些实施方案中,一个或多个可切割基团可存在于靶特异性引物或接头中。在一些实施方案中,靶特异性引物或接头中的一个或多个可切割基团的切割可产生多个具有不同熔解温度的核酸片段。在一个实施方案中,一个或多个可切割基团在靶特异性引物或接头中的放置可通过在切割可切割基团后,测定每一个核酸片段的可比较的最高的最低熔解温度来调节或操作。在一些实施方案中,可切割基团可以是尿嘧啶或尿苷部分。在一些实施方案中,可切割基团可以是肌苷部分。在一些实施方案中,至少50%的靶特异性引物可包括至少一个可切割基团。在一些实施方案中,每一个靶特异性引物包括至少一个可切割基团。
在一个实施方案中,本文中公开了多重核酸扩增法,所述方法包括a)在聚合酶存在的情况下使用一个或多个靶特异性引物扩增一个或多个靶序列以产生扩增的靶序列,和b)将接头连接至扩增的靶序列以形成接头连接的扩增的靶序列。在一些实施方案中,可在溶液中进行扩增以便扩增的靶序列或靶特异性引物不连接至固体载体或表面。在一些实施方案中,可在溶液中进行连接以便扩增的靶序列或接头不连接至固体载体或表面。在另一个实施方案中,可在溶液中进行扩增和连接以便扩增的靶序列、靶特异性引物或接头不连接至固体支持物或表面。
在一些实施方案中,本公开内容总地来说涉及用于合成样品中的两个或更多个靶序列的方法、组合物、***、装置和试剂盒。在一个实施方案中,合成方法包括a)在聚合条件下,在聚合酶存在的情况下使用多个靶特异性引物合成两个或更多个靶序列以产生多个合成的靶序列。在一些实施方案中,方法还包括将一个或多个接头连接至合成 的靶序列。在一些实施方案中,目标靶序列包括一个或多个突变热点、单核苷酸多态性(SNP)、短串联重复(STR)、编码区、外显子和基因。在一些实施方案中,可使用本文中公开的组合物(和相关方法、试剂盒、装置和***)在多重反应中合成的靶序列的数目在单个样品中可以为数十、数百或数千个靶序列。任选地,在聚合条件下,在聚合酶存在的情况下,使用一个或多个靶特异性引物可合成来自样品的多个目标靶序列,以产生多个合成的靶序列。在一些实施方案中,合成的靶序列与另一个合成的靶序列的互补性可低于50%。在一些实施方案中,合成的靶序列可基本上不与样品中的另一个靶序列互补。在一些实施方案中,合成的靶序列可基本上不与样品中不为目标靶序列的任何一个或多个核酸分子互补。在一些实施方案中,合成靶序列可包括将接头连接至合成的靶序列,从而产生接头连接的合成的靶序列。
在一些实施方案中,本公开内容总地来说涉及从多个靶序列合成靶序列。例如,合成的方法可包括在聚合条件下,在聚合酶存在的情况下使用多个靶特异性引物合成靶序列,以产生多个合成的靶序列。合成还可包括再合成至少一个接头连接的合成的靶序列。在一些实施方案中,再合成可包括在聚合条件下将至少一个接头连接的合成的靶序列与至少一个接头或其互补序列和聚合酶接触,以产生多个再合成的接头连接的合成的靶序列。在一些实施方案中,再合成的接头连接的合成的靶序列可使用不超过两轮靶特异性选择来产生。
在一些实施方案中,用于合成靶序列的方法可包括合成和连接步骤。在一些实施方案中,连接不包括与合成的靶序列的部分基本上互补的接头。在一些实施方案中,接头基本上不与来自合成的靶序列的3’末端或5’末端的约30个连续核苷酸或约20个连续核苷酸互补。在一些实施方案中,接头可包括至少一个与通用引物的至少一部分基本上互补或与其基本上同一的序列。
在一些实施方案中,本公开内容总地来说涉及用于进行多重核酸扩增的方法、组合物、***、装置和试剂盒。在一个实施方案中,方法包括在扩增条件下在聚合酶存在的情况下,使用一个或多个靶特异 性引物扩增一个或多个靶序列;将接头连接至扩增的靶序列;和再扩增至少一个接头连接的扩增的靶序列。在一些实施方案中,再扩增包括在扩增条件下将接头连接的扩增的靶序列与一个或多个接头(或它们的互补序列)和聚合酶接触,以产生至少一个再扩增的接头连接的扩增的靶序列。在一些实施方案中,扩增的靶序列与另一个扩增的靶序列的互补性可低于50%。在一些实施方案中,扩增的靶序列可基本上不与样品中的另一个靶序列互补。在一些实施方案中,扩增的靶序列可基本上不与样品中的不为目标靶序列的任一个或多个核酸分子互补。在一些实施方案中,扩增的靶序列可连接至至少一个接头或它们的互补序列,以产生一个或多个接头连接的扩增的靶序列。在一些实施方案中,接头连接的扩增的靶序列可被再扩增以产生至少一个再扩增的接头连接的扩增的靶序列。在一些实施方案中,接头或它们的互补序列基本上不与样品中任何其它核酸分子的任何部分互补。在一些实施方案中,接头或它们的互补序列基本上不与至少一个扩增的靶序列互补。在一个实施方案中,在再扩增步骤过程中一个或多个接头或它们的互补序列可以是通用引物。在一个实施方案中,连接步骤还可包括将DNA条形码或DNA标签序列连接至扩增的靶序列,随后将接头连接至扩增的靶序列。
在一些实施方案中,可按“仅添加(addition-only)”法进行本公开内容的扩增和合成方法。在一些实施方案中,仅添加法不包括为了在扩增或合成步骤中进一步操作而除去第一反应混合物(包含扩增或合成组合物)的全部或部分。在一些实施方案中,可将仅添加法自动化例如以用于高通量处理。
在一些实施方案中,本公开内容总地来说涉及用于进行核酸扩增和核酸合成的组合物(以及使用公开的组合物的相关试剂盒、方法、***和装置)。在一些实施方案中,本文中公开的组合物的一种或多种(以及相关方法、试剂盒、***和装置)可包括至少一个靶特异性引物和/或至少一个接头。在一些实施方案中,组合物包括多个在长度上为约15至约40个核苷酸的靶特异性引物或接头。在一些实施方案中,组 合物包括一个或多个包含一个或多个可切割基团的靶特异性引物或接头。在一些实施方案中,可将一个或多个类型的可切割基团掺入靶特异性引物或接头。在一些实施方案中,可切割基团可位于靶特异性引物或接头的3’末端或其附近。在一些实施方案中,可切割基团可位于末端核苷酸、倒数第二个核苷酸,或对应于短于靶特异性引物或接头的核苷酸长度的50%的任何位置。在一些实施方案中,可将可切割基团掺入位于靶特异性引物或接头中央的残基或其附近。例如,具有40个碱基的靶特异性引物可在核苷酸位置15-25上包含切割基团。因此,靶特异性引物或接头可在其3’末端、其5’末端内或中央位置上包含多个可切割基团。在一些实施方案中,靶特异性引物的5’末端仅包含非可切割的核苷酸。在一些实施方案中,可切割基团可包括修饰的核碱基或修饰的核苷酸。在一些实施方案中,可切割基团可包括在对应的核酸中非天然存在的核苷酸或核碱基。例如,DNA核酸可包括RNA核苷酸或核碱基。在一个实例中,基于DNA的核酸可包括尿嘧啶或尿苷。在另一个实例中,基于DNA的核酸可包括肌苷。在一些实施方案中,可切割基团可包括可通过酶促、化学或热方法从靶特异性引物或接头切割的部分。在一些实施方案中,可使用尿嘧啶DNA糖基化酶从靶特异性引物或接头切割尿嘧啶或尿苷部分。在一些实施方案中,可使用hAAG或EndoV从靶特异性引物或接头切割肌苷部分。
在一些实施方案中,本公开内容总体上涉及包括长度为约15至约40个核苷酸的靶特异性引物的组合物,所述引物具有位于靶特异性引物的末端附近的可切割基团,与双链靶序列的第一链杂交。在一些实施方案中,引物基本上与双链靶序列的第一链互补。在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含长度为约15至约40个核苷酸的靶特异性引物(所述引物具有位于靶特异性引物的末端附近的可切割基团,与双链靶序列的第一链杂交)和长度为约15至约40个核苷酸的第二靶特异性引物(所述引物具有位于第二靶特异性引物的末端附近的可切割基团,与双链靶序列的第二链杂交)。在一些实施方案中,第二靶特异性引物基本上与双链靶序列的第二链互补。
在一些实施方案中,本公开内容总地来说涉及用于进行核酸扩增和核酸合成的组合物(以及使用公开的组合物的相关试剂盒、方法、***和装置)。在一些实施方案中,组合物包含长度为约15至约40个核苷酸的靶特异性引物,其具有位于靶特异性引物末端附近的尿嘧啶核苷酸和位于靶特异性引物的中央核苷酸附近的第二尿嘧啶核苷酸。在一些实施方案中,本公开内容总地来说涉及用于进行核酸扩增和核酸合成的组合物(以及使用公开的组合物的相关试剂盒、方法、***和装置)。在一些实施方案中,组合物包含长度为约15至约40个核苷酸的靶特异性引物,其具有位于靶特异性引物的3’末端附近的肌苷核苷酸和位于靶特异性引物的中央核苷酸附近的至少第二肌苷核苷酸。
在一些实施方案中,本公开内容总地来说涉及包含至少一个靶特异性引物或至少一个靶特异性引物引对的组合物。在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物。任选地,组合物可包含至少100,200,300,500,750,1000,1250,1500,1750,2000,2500,3000,4000,5000,7500或10,000个靶特异性引物或靶特异性引物对。在一些实施方案中,包含多个靶特异性引物的组合物包括本文中公开的靶特异性引物的至少一个。在一些实施方案中,包含多个靶特异性引物的组合物包含至少一个与本文或同时提交的序列表中提供的核酸序列之任一具有至少90%的同一性的靶特异性引物。在一些实施方案中,包含多个靶特异性引物的组合物包括本文中公开的一个或多个靶特异性引物对,或一个或多个与本文中提供的引物对核酸序列之任一具有至少90%的同一性的引物对。在一些实施方案中,包含多个靶特异性引物的组合物可与本文或同时提交的序列表中公开的核酸序列的任一个或多个具有至少91%,92%,93%,94%,95%,96%,97%,98%或99%的同一性的百分比同一性。在一些实施方案中,包含多个靶特异性引物的组合物可包含选自表2,3,13,14,15,17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的任一个或多个靶特异性引物。在一些实施方案中,包含多个靶特异性引物的组合物可包含选自表2,3,13,14,15,17和 19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的任一个或多个靶特异性引物对。在一些实施方案中,包含多个靶特异性引物的组合物总地来说涉及选自SEQ ID NO:1-103、143的任一个或多个核酸序列,或包括来自选自SEQ ID NO:1-103、143的任一个核酸序列的至少15个连续核苷酸。在一些实施方案中,组合物总地来说涉及由SEQ ID NO:1-103、143中所示的核酸序列的任一个或多个组成的分离的核酸序列。
在一些实施方案中,本公开内容总地来说涉及包含长度为约15个核苷酸至约40个核苷酸的靶特异性引物的组合物。在一些实施方案中,本公开内容总地来说涉及包含多个至少2种靶特异性引物(长度为约15个核苷酸至约40个核苷酸)的组合物。在一些实施方案中,组合物包含多个使用本文中概述的引物选择标准或引物选择法设计的长度为约15个核苷酸至约40个核苷酸的靶特异性引物对。
在一些实施方案中,组合物包括至少一个在其整个长度上基本上与样品中的至少一个靶序列互补的靶特异性引物。在一些实施方案中,组合物包括多个靶特异性引物,其中基本上所有的所述多个多个靶特异性引物包括在它们的整个引物长度上与样品中的一个或多个靶序列互补的核酸序列。在一些实施方案中,组合物包括至少一个在其整个长度上与样品中至少一个靶序列互补的靶特异性引物。在一些实施方案中,组合物包括多个靶特异性引物,其中基本上所有的所述多个多个靶特异性引物包括在它们的整个引物长度上与样品中的一个或多个靶序列互补的核酸序列。
在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物,所述引物具有位于所述多个靶特异性引物的至少一个的3’末端的可切割基团。在一些实施方案中,组合物包括位于基本上所有的所述多个靶特异性引物的3’末端的可切割基团。在一些实施方案中,可切割基团可包括尿嘧啶核碱基、肌苷核苷或其类似物。在一些实施方案中,一个或多个靶特异性引物的3’末端可包括超过一个可切割基团和/或超过一种可切割基团。例如,具有位于一个靶特异性引 物的3’末端的可切割基团的组合物可在相同靶特异性引物的3’末端包括一个尿嘧啶部分和肌苷部分。在一些实施方案中,组合物可包括至少一个在3’末端核苷酸上包括非可切割部分的靶特异性引物。例如,靶特异性引物可在除靶特异性引物的3’末端的末端核苷酸外的靶特异性引物的3’末端包括可切割基团。在一些实施方案中,组合物可包括多个靶特异性引物,其中基本上所有靶特异性引物在除末端核苷酸位置外的3’末端包括可切割基团。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含多个具有位于靶特异性引物的至少一个的中央核苷酸附近或周围的可切割基团的靶特异性引物。在一些实施方案中,组合物包括位于基本上所有的所述多个靶特异性引物的中央核苷酸的附近或周围的可切割基团。例如,在具有40个核苷酸的靶特异性引物中,可切割基团可位于中央核苷酸附近,例如位于第15个核苷酸至第25个核苷酸。在一些情况下,中央核苷酸“附近”可以指整个靶特异性引物的长度的百分比。例如在40个核苷酸的靶特异性引物中,中央可切割基团的位置可包括从靶特异性引物的长度的约40%至约60%的任何位置。在一些实施方案中,具有奇数个核苷酸的靶特异性引物的中央核苷酸包括靶特异性引物的中央核苷酸。在具有偶数个核苷酸的靶特异性引物中,中央核苷酸可包括在中央核苷酸位置的任一侧的一个核苷酸。例如,在20个核苷酸的靶特异性引物中,中央核苷酸可包括核苷酸位置10、核苷酸位置11或两者。
在一些实施方案中,本公开内容总地来说涉及包含多个在5’末端仅具有非可切割的核苷酸的靶特异性引物的组合物。在一些实施方案中,组合物可包括基本上所有的所述多个的在5’末端仅具有非可切割核苷酸的靶特异性引物。在一些实施方案中,仅具有非可切割核苷酸的所述多个靶特异性引物的5’末端从5’末端可包括不足10个核苷酸。在一些实施方案中,5’末端从5’末端可包括不足8,7,6,5,4,3或2个核苷酸。在一些实施方案中,具有非可切割核苷酸的5’末端可包括少于50%的靶特异性引物的长度,少于40%的靶特异性引物的长度, 少于30%的靶特异性引物的长度,少于20%的靶特异性引物的长度,或少于10%的靶特异性引物的长度(从5’末端)。
在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物,所述靶特异性引物的至少一个在引物的整个长度上包括少于20%的包含可切割基团的核苷酸。在一些实施方案中,组合物包含多个靶特异性引物,其中基本上所有靶特异性引物在每一个引物的整个长度上包含少于20%的含有可切割基团的核苷酸。例如,长度为20个核苷酸的靶特异性引物可包括4个或更少的切割基团。在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物,其中靶特异性引物的至少一个在引物的整个长度上包含少于10%的含有可切割基团的核苷酸。在一些实施方案中,组合物包含多个靶特异性引物,其中基本上所有靶特异性引物在每一个引物的整个长度上包含少于10%的含有可切割基团的核苷酸。例如,长度为20个核苷酸的靶特异性引物可包含2个或更少的切割基团。
在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物,所述引物具有最少的对所述多个引物中的靶特异性引物的至少一个的交叉杂交。在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物,所述引物具有最少的对所述多个引物的中的基本上所有靶特异性引物的交叉杂交。在一些实施方案中,对所述多个引物中的一个或多个靶特异性引物的最少交叉杂交可通过引物二聚体或二聚体-二聚体的形成来评价。在一些实施方案中,组合物可在多重PCR扩增反应中包括相较于在相应的扩增条件下现有技术的多重PCR扩增反应更少的引物二聚体。
在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物,其中靶特异性引物的至少一个包括最少的对存在于样品中的非特异性序列的交叉杂交。在一些实施方案中,组合物包含多个靶特异性引物,其中基本上所有靶特异性引物包括最少的对存在于样品中的非特异性序列的交叉杂交。在一些实施方案中,最少的对存在于样品中的非特异性序列的交叉杂交可通过“脱靶读取的百分比” 的存在或“在靶读取的百分比”的减少来评价。在一些实施方案中,本文中公开的组合物可在多重PCR扩增反应中提供相较于在对应扩增条件下现有技术的多重PCR扩增反应更少的“脱靶读取的百分比”或“在靶读取的百分比”的增加。给定的多重扩增的“重”通常是指在根据本公开内容的单个多重扩增期间扩增的不同靶特异性序列的数目。在一些实施方案中,重可以为约12重、24重、48重、96重、192重、384重、768重、1536重、3072重、6144重或更高。在一些实施方案中,最少的对存在于样品中的非特异性序列的交叉杂交可包括低于15%、低于12%或少于10%的脱靶读取。在一些实施方案中,每多重扩增的在靶读取的百分率可大于85%、88%、90%、92%、94%、95%、96%、97%、98%或更多。
在一些实施方案中,本公开内容总地来说涉及包含多个具有最小自我互补的靶特异性引物的组合物。在一些实施方案中,组合物包括至少一个不形成二级结构例如环或发夹的靶特异性引物。在一些实施方案中,组合物包括多个靶特异性引物,其中大部分(即,超过50%)或基本上所有的所述多个靶特异性引物不能形成二级结构。给定的多重扩增的“重”通常是指在根据本公开内容的单个多重扩增期间扩增的不同靶特异性序列的数目。在一些实施方案中,重可以为约12重、24重、48重、96重、192重、384重、768重、1536重、3072重、6144重或更高。在一些实施方案中,最小自我互补性可包括少于10%,少于8%,少于5%或少于3%的具有允许靶特异性引物形成二级结构的自我互补性的所述多个靶特异性引物。
在一些实施方案中,本公开内容总地来说涉及包含多个在3’末端或5’末端具有最小核苷酸序列重叠的靶特异性引物的组合物。在一些实施方案中,组合物可在至少一个靶特异性引物的3’末端中包括最小核苷酸序列重叠。在一些实施方案中,组合物可在基本上所有的所述多个靶特异性引物的3’末端中包括最小核苷酸序列重叠。在一些实施方案中,组合物可在至少一个靶特异性引物的5’末端包括最小核苷酸序列重叠。在一些实施方案中,组合物可在基本上所有的所述多个靶 特异性引物的5’末端中包括最小核苷酸序列重叠。在一些实施方案中,组合物可在至少一个靶特异性引物的3’末端和5’末端中包括最小核苷酸序列重叠。在一些实施方案中,组合物可在基本上所有的所述多个靶特异性引物的3’末端和5’末端包括最小核苷酸序列重叠。在一些实施方案中,一个或多个靶特异性引物之间的核苷酸序列重叠的量少于8个核苷酸。在一些实施方案中,一个或多个靶特异性引物之间的核苷酸序列重叠的量少于5个核苷酸。在一些实施方案中,所述多个引物的一个或多个靶特异性引物之间的核苷酸序列重叠的量少于8,7,6,5,4,3,2或1个核苷酸。在一些实施方案中,组合物可包括多个包含一个或多个核苷酸的核苷酸序列缺口的靶特异性引物。在一些实施方案中,组合物可在所述多个靶特异性引物的两个或更多个引物之间包括1,2,3,4,5,10,15,20或更多个核苷酸的核苷酸序列缺口。在一些实施方案中,组合物可在所述多个靶特异性引物的两个或更多个靶特异性引物之间包括约50个核苷酸的核苷酸序列缺口。在一些实施方案中,组合物可在所述多个靶特异性引物的基本上所有靶特异性引物之间包括约10、20、30、40或50个核苷酸的核苷酸序列缺口。
在一些实施方案中,本公开内容总地来说涉及包含多个长度为约15个核苷酸至约40个核苷酸的靶特异性引物的组合物,所述引物具有至少两个或更多个下列标准:位于基本上所有的所述多个引物的3’末端的可切割基团、位于基本上所有的所述多个引物的中央核苷酸的附近或周围的可切割基团、基本上所有的所述多个引物在5’末端仅包括非可切割部分、最少的对所述多个引物中的基本上所有引物的交叉杂交、最少的对存在于样品中的非特异性序列的交叉杂交、最小的自我互补性以及所述多个引物中基本上所有引物的3’末端或5’末端上的最小核苷酸序列重叠。在一些实施方案中,组合物可包括上述标准的任意3、4、5、6或7项。
在一些实施方案中,本公开内容总地来说涉及包含多个长度为约15个核苷酸至约40个核苷酸的至少2种靶特异性引物的组合物,所述引物具有下列标准的两个或更多个:位于基本上所有的所述多个引 物的中央核苷酸的附近或周围的可切割基团、基本上所有的所述多个引物在5’末端仅包括非可切割核苷酸、基本上所有的所述多个引物在引物的整个长度上具有少于20%的包含可切割基团的核苷酸、至少一个引物具有在其整个长度上与存在于样品中的靶序列互补的核酸序列、最少的对所述多个引物中基本上所有引物的交叉杂交、最少的对存在于样品中的非特异性序列的交叉杂交,以及所述多个引物中基本上所有引物的3’末端或5’末端上的最小核苷酸序列重叠。在一些实施方案中,组合物可包括上述标准的任意3、4、5、6或7项。
在一些实施方案中,本公开内容总地来说涉及包含多个按照本文公开的标准设计的靶特异性引物或包括本文中公开的靶特异性引物的任一个或多个的组合物,其中所述多个靶特异性引物的至少一个在其整个长度上与选自如下基因的一个或多个基因的至少一部分基本上互补:ABI1;ABL1;ABL2;ACSL3;ACSL6;AFF1;AFF3;AFF4;AKAP9;AKT1;AKT2;ALK;APC;ARHGAP26;ARHGEF12;ARID1A;ARNT;ASPSCR1;ASXL1;ATF1;ATIC;ATM;AXIN2;BAP1;BARD1;BCAR3;BCL10;BCL11A;BCL11B;BCL2;BCL3;BCL6;BCL7A;BCL9;BCR;BIRC3;BLM;BMPR1A;BRAF;BRCA1;BRCA2;BRD3;BRD4;BRIP1;BUB1B;CARD11;CARS;CASC5;CBFA2T3;CBFB;CBL;CBLB;CBLC;CCDC6;CCNB1IP1;CCND1;CCND2;CD74;CD79A;CDC73;CDH1;CDH11;CDK4;CDK6;CDKN2A;CDKN2B;CDKN2C;CDX2;CEBPA;CEP110;CHEK1;CHEK2;CHIC2;CHN1;CIC;CIITA;CLP1;CLTC;CLTCL1;COL1A1;CREB1;CREB3L2;CREBBP;CRTC1;CRTC3;CSF1R;CTNNB1;CXCR7;CYLD;CYTSB;DCLK3;DDB2;DDIT3;DDR2;DDX10;DDX5;DDX6;DEK;DGKG;DICER1;DNMT3A;EGFR;EIF4A2;ELF4;ELL;ELN;EML4;EP300;EPS15;ERBB2;ERBB4;ERC1;ERCC2;ERCC3;ERCC4;ERCC5;ERG;ETV1;ETV4;ETV5;ETV6;EWSR1;EXT1;EXT2;EZH2;FAM123B;FANCA;FANCC;FANCD2;FANCE;FANCF;FANCG; FAS;FBXW7;FCRL4;FGFR1;FGFR1OP;FGFR2;FGFR3;FH;FIP1L1;FLCN;FLI1;FLT1;FLT3;FNBP1;FOXL2;FOXO1;FOXO3;FOXO4;FOXP1;FUS;GAS7;GATA1;GATA2;GATA3;GMPS;GNAQ;GNAS;GOLGA5;GOPC;GPC3;GPHNGPR124;HIP1;HIST1H4I;HLF;HNF1A;HNRNPA2B1;HOOK3;HOXA11;HOXA13;HOXA9;HOXC11;HOXC13;HOXD13;HRAS;HSP90AA1;HSP90AB1;IDH1;IDH2;IKZF1;IL2;IL21R;IL6ST;IRF4;ITGA10;ITGA9;ITK;JAK1;JAK2;JAK3;KDM5A;KDM5C;KDM6A;KDR;KDSR;KIAA1549;KIT;KLF6;KLK2;KRAS;KTN1;LASP1;LCK;LCP1;LHFP;LIFR;LMO2;LPP;MAF;MALT1;MAML2;MAP2K1;MAP2K4;MDM2;MDM4;MECOM;MEN1;MET;MITF;MKL1;MLH1;MLL;MLLT1;MLLT10;MLLT3;MLLT4;MLLT6;MN1;MPL;MRE11A;MSH2;MSH6;MSI2;MSN;MTCP1;MTOR;MUC1;MYB;MYC;MYCL1;MYCN;MYH11;MYH9;MYST3;MYST4;NACA;NBN;NCOA1;NCOA2;NCOA4;NEK9;NF1;NF2;NFE2L2;NFKB2;NIN;NKX2-1;NLRP1;NONO;NOTCH1;NOTCH2;NPM1;NR4A3;NRAS;NSD1;NTRK1;NTRK3;NUMA1;NUP214;NUP98;OLIG2;OMD;PAFAH1B2;PALB2;PATZ1;PAX3;PAX5;PAX7;PAX8;PBRM1;PBX1;PCM1;PDE4DIP;PDGFB;PDGFRA;PDGFRB;PER1;PHOX2B;PICALM;PIK3CA;PIK3R1;PIM1;PLAG1;PML;PMS1;PMS2;POU2AF1;POU5F1;PPARG;PPP2R1A;PRCC;PRDM16;PRF1;PRKAR1A;PRRX1;PSIP1;PTCH1;PTEN;PTPN11;RABEP1;RAD50;RAD51L1;RAF1;RANBP17;RAP1GDS1;RARA;RB1;RBM15;RECQL4;REL;RET;RHOH;RNF213;ROS1;RPN1;RPS6KA2;RUNX1;RUNX1T1;SBDS;SDHAF2;SDHB;SETD2;SFPQ;SFRS3;SH3GL1;SLC45A3;SMAD4;SMARCA4;SMARCB1;SMO;SOCS1;SRC;SRGAP3;SS18;SS18L1;STIL;STK11;STK36;SUFU;SYK;TAF15;TAF1L; TAL1;TAL2;TCF12;TCF3;TCL1A;TET1;TET2;TEX14;TFE3;TFEB;TFG;TFRC;THRAP3;TLX1;TLX3;TMPRSS2;TNFAIP3;TOP1;TP53;TPM3;TPM4;TPR;TRIM27;TRIM33;TRIP11;TSC1;TSC2;TSHR;USP6;VHL;WAS;WHSC1L1;WRN;WT1;XPA;XPC;ZBTB16;ZMYM2;ZNF331;ZNF384和ZNF521。
在一些实施方案中,本公开内容总地来说涉及包含多个按照本文公开的标准设计的靶特异性引物或包括本文中公开的靶特异性引物的任一个或多个的组合物,其中所述多个靶特异性引物的至少一个在其整个长度上与选自如下基因的一个或多个基因的至少一部分基本上互补:ABL1;AKT1;ALK;APC;ATM;BRAF;CDH1;CDKN2A;CSF1R;CTNNB1;EGFR;ERBB2;ERBB4;FBXW7;FGFR1;FGFR2;FGFR3;FLT3;GNAS;HNF1A;HRAS;IDH1;JAK2;JAK3;KDR;KIT;KRAS;MET;MLH1;MPL;NOTCH1;NPM1;NRAS;PDGFRA;PIK3CA;PTEN;PTPN11;RB1;RET;SMAD4;SMARCB1;SMO;SRC;STK11;TP53和VHL。
在一些实施方案中,本公开内容总地来说涉及包含多个按照本文公开的标准设计的靶特异性引物或包括本文中公开的靶特异性引物的任一个或多个的组合物,其中所述多个靶特异性引物的至少一个在其整个长度上与选自如下基因的一个或多个基因的至少一部分基本上互补:ABCA4;ABCC8;ABCD1;ACADVL;ACTA2;ACTC;ACTC1;ACVRL1;ADA;AIPL1;AIRE;ALK1;ALPL;AMT;APC;APP;APTX;AR;ARL6;ARSA;ASL;ASPA;ASS;ASS1;ATL;ATM;ATP2A2;ATP7A;ATP7B;ATXN1;ATXN2;ATXN3;ATXN7;BBS6;BCKDHA;BCKDHB;BEST1;BMPR1A;BRCA1;BRCA2;BRIP1;BTD;BTK;C2或f25;CA4;CALR3;CAPN3;CAV3;CCDC39;CCDC40;CDH23;CEP290;CERKL;CFTR;CHAT;CHD7;CHEK2;CHM;CHRNA1;CHRNB1;CHRND;CHRNE;CLCN1;CNBP;CNGB1;COH1;COL11A1;COL11A2;COL1A1; COL1A2;COL2A1;COL3A1;COL4A5;COL5A1;COL5A2;COL7A1;COL9A1;CRB1;CRX;CTDP1;CTNS;CYP21A2;CYP27A1;DAX1;DBT;DCX;DES;DHCR7;DJ1;DKC1;DLD;DMD;DMPK;DNAAF1;DNAAF2;DNAH11;DNAH5;DNAI1;DNAI2;DNAL1;DNM2;DOK7;DSC2;DSG2;DSP;DYSF;DYT1;EMD;ENG;EYA1;EYS;F8;F9;FANCA;FANCC;FANCF;FANCG;FANCJ;FANDC2;FBN1;FBXO7;FGFR1;FGFR3;FMO3;FMR1;FOXL2;FRG1;FRMD7;FSCN2;FXN;GAA;GALT;GBA;GBE1;GCSH;GDF5;GJB2;GJB3;GJB6;GLA;GLDC;GNE;GNPTAB;GPC3;GPR143;GUCY2D;HBA1;HBA2;HBB;HD;HERG;HEXA;HFE;HHF;HIBCH;HLA-B27;HMBS;HPLH1;HPRP3;HR;HTNB;HTT;IKBKAP;IKBKG;IL2RG;IMPDH1;ITGB4;JAG1;JPH3;KCNE1;KCNE2;KCNH2;KCNQ1;KCNQ4;KIAA0196;KLHL7;KRAS;KRT14;KRT5;L1CAM;LAMB3;LAMP2;LDB3;LMNA;LMX18;LRAT;LRRK2;MAPT;MC1R;MECP2;MED12;MEN1;MERTK;MFN2;MKKS;MLH1;MMAA;MMAB;MMACHC;MMADHC;MPZ;MSH2;MTM1;MTND5;MTTG;MTTI;MTTK;MTTL1;MTTQ;MUT;MYBPC3;MYH11;MYH6;MYH7;MYL2;MYL3;MYLK2;MYO7A;ND5;ND6;NEMO;NF1;NF2;NIPBL;NR0B1;NR2E3;NRAS;NSD1;OCA2;OCRL;OPA1;OTC;PABPN1;PAFAH1B1;PAH;PARK2;PARK7;PARKIN;PAX3;PAX6;PCDH15;PEX1;PEX2;PEX10;PEX13;PEX14;PEX19;PEX26;PEX3;PEX5;PINK1;PKD1;PKD2;PKD3;PKHD1;PKP2;PLEC1;PLOD1;PMM2;PMP22;POLG;PPT1;PRCD;PRKAG2;PRNP;PROM1;PRPF3;PRPF8;PRPH2;PRPN;PSEN1;PSEN2;PTCH1;PTPN11;RAB7A;RAF1;RAI1;RAPSN;RB1;RDH12;RDS;RECQL3;RET;RHO;ROR2;RP1;RP2;RP9;RPE65;RPGR;RPGRIP1;RPL11;RPL35A;RPS10;RPS17;RPS19;RPS24;RPS26;RPS6KA3;RPS7;RPSL5; RS1;RSPH4A;RSPH9;RYR1;RYR2;SALL4;SCA3;SCN5A;SCN9A;SEMA4A;SERPINA1;SERPING1;SGCD;SH3BP2;SHOX;SIX1;SIX5;SLC25A13;SLC25A4;SLC26A4;SMAD4;SMN1;SNCA;SNRNP200;SOD1;SOS1;SOX9;SP110;SPAST;SPATA7;SPG3A;SPG4;SPG7;TAF1;TBX5;TCOF1;TGFBR1;TGFBR2;TNFRSC13C;TNNC1;TNNI3;TNNT1;TNNT2;TNXB;TOPORS;TOR1A;TP53;TPM1;TRNG;TRNI;TRNK;TRNL1;TRNQ;TSC1;TSC2;TTN;TTPA;TTR;TULP1;TWIST1;TXNDC3;TYR;USH1C;USH1H;USH2A;VCL;VHL;VPS13B;WAS;WRN;WT1和ZNF9。
在一些实施方案中,本公开内容总地来说涉及包含多个按照本文公开的标准设计的靶特异性引物或包括本文中公开的靶特异性引物的任一个或多个的组合物,其中所述多个靶特异性引物的至少一个在其整个长度上与选自如下基因的一个或多个与乳腺癌相关的基因的至少一部分基本上互补:AIM1、AR、ATM、BARD1、BCAS1、BRIP1、CCND1、CCND2、CCNE1、CDH1、CDK3、CDK4、CDKN2A、CDKN2B、CAMK1D、CHEK2、DIRAS3、EGFR、ERBB2、EPHA3、ERBB4、ETV6、GNRH1、KCTD9、CDCA2、EBF2、EMSY、BNIP3L、PNMA2、DPYSL2、ADRA1A、STMN4、TRIM35、PAK1、AQP11、CLSN1A、RSF1、KCTD14、THRSP、NDUFC2、ALG8、KCTD21、USP35、GAB2、DNAH9、ZNF18、MYOCD、STK11、TP53、JAK1、JAK2、MET、PDGFRA、PML、PTEN、RET、TMPRSS2、WNK1、FGFR1、IGF1R、PPP1R12B、PTPRT、GSTM1、IPO8、MYC、ZNF703、MDM1、MDM2、MDM4、MKK4、P14KB、NCOR1、NBN、PALB2、RAD50、RAD51、PAK1、RSF1、INTS4、ZMIZ1、SEPHS1、FOXM1、SDCCAG1、IGF1R、TSHZ2、RPSK6K1、PPP2R2A、MTAP、MAP2K4、AURKB、BCL2、BUB1、CDCA3、CDCA4、CDC20、CDC45、CHEK1、FOXM1、HDAC2、IGF1R、KIF2C、KIFC1、KRAS、RB1、SMAD4、NCOR1、UTX、MTHDFD1L、RAD51AP1、TTK和UBE2C。
在一些实施方案中,本公开内容总地来说涉及多核苷酸的组合,其中多核苷酸的组合包括至少一个选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的多核苷酸,以及一个或多个另外的不依赖于本文中公开的多核苷酸的多核苷酸。在一些实施方案中,本公开内容总地来说涉及多核苷酸的组合,其中多核苷酸的组合包括与选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的一个或多个多核苷酸具有至少90%的同一性的多核苷酸。在一些实施方案中,本公开内容涉及选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000或更多个多核苷酸。
在一些实施方案中,本公开内容总地来说涉及多核苷酸的组合,其中多核苷酸的组合包括至少一个选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的多核苷酸,以及一个或多个另外的不依赖于本文中公开的多核苷酸的多核苷酸。在一些实施方案中,本公开内容总地来说涉及多核苷酸的组合,其中多核苷酸的组合包括至少一个与选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的一个或多个多核苷酸具有至少90%的同一性的多核苷酸。在一些实施方案中,本公开内容涉及选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000或更多个多核苷酸或一个或多个与其具有至少90%的同一性的多核苷酸。
在一些实施方案中,本公开内容总地来说涉及一对多核苷酸,其与选自EGFR、BRAF或KRAS的至少一个基因的部分特异性退火。在一个实施方案中,一对与EGFR基因的一部分特异性退火的多核苷酸包括下列扩增子ID的任一个或多个:229910389、227801665、229055506、230397881、230175199、230195609、228630698、230632980、227722022、232978808、231616816、230481741、231198336、229919273、227816834、228030652、230679876、229747025、228741519、228636601、230635054、230738160、232984355、228941652、230495367、231212482、229608278、230461276、228035285、230683371、230173849、330137554、228857751、230742871、232237229、228956984、228732632、231222418、231493149、229630617、229052979、230392156、230683680、230187475、228709018、230628101、227716821、227830783、232260099、230075336、231314233和231239581。在一个实施方案中,一对与BRAF基因的一部分特异性退火的多核苷酸包括下列扩增子ID的任一个或多个:222636793、223460541、223967627、326913823、223739184、223944056、224404546、222922922、224119138、223519358、223465859、223971374、222680486、223741661、223950351、224410546、222935598、224119999、222629880、223175118、223719489、225222024、222684242、223700378、222258987、222895407、223103332、222635553、223177865、223960162、326889377、223588249、223708886、222259284、222903910和223104608。在一个实施方案中,一对与KRAS基因的一部分特异性退火的多核苷酸包括下列扩增子ID的任一个或多个:233361228、234355242、234355242、233466735、233466735、231132733、231132733、234764991、234764991、233467720、233467720、231133990、231133990、233356818、326772204和326772204。
在一些实施方案中,本公开内容总体上涉及用于扩增样品中的一个或多个靶序列的试剂盒(以及使用这样的试剂盒的相关组合物、方法、装置和***)。在一些实施方案中,用于扩增样品中的一个或多个靶序列的试剂盒包括至少一个可扩增样品中的至少一个靶序列的靶特 异性引物。在一些实施方案中,试剂盒可包括至少两个可扩增样品中的至少一个靶序列的靶特异性引物。在另一个实施方案中,试剂盒可包括多个用于扩增样品中的至少两个靶序列的靶特异性引物,其中试剂盒包括a)与选自SEQ ID NO:1-103、143的核酸序列具有至少90%的同一性的第一靶特异性引物,其在有义方向上与第一靶序列基本上互补;b)与选自SEQ ID NO:1-103、143的核酸序列具有至少90%的同一性的第二靶特异性引物,其在反义方向上与第一靶序列基本上互补;c)与选自SEQ ID NO:1-103、143的核酸序列具有至少90%的同一性的第三靶特异性引物,其在有义方向上与第二靶序列基本上互补;和d)与选自SEQ ID NO:1-103、143的核酸序列具有至少90%的同一性的第四靶特异性引物,其在反义方向上与第二靶序列基本上互补。在一些实施方案中,样品可以是包含环境、水、微生物学、昆虫学、植物、真菌、动物或哺乳动物核酸的样品。在一些实施方案中,样品可包括临床、手术、医生、法医或实验室获得的核酸样品。
在一些实施方案中,本公开内容总地来说涉及用于扩增样品中的多个靶序列的方法,包括在扩增条件下将样品的至少一些部分与至少一个本文中公开或使用本文中公开的引物选择标准设计的靶特异性引物和聚合酶接触,从而产生至少一个扩增的靶序列。在一些实施方案中,方法还包括将至少一个接头连接至至少一个扩增的靶序列,从而产生至少一个接头连接的扩增的靶序列。在一些实施方案中,方法包括表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的靶特异性引物的任一个或多个或与表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的靶特异性引物的任一个或多个具有至少90%的同一性的任何核酸序列。
在一些实施方案中,本公开内容总地来说涉及通过用一个或多个本文中公开的靶特异性引物或使用本文中公开的引物选择标准设计的一个或多个靶特异性引物扩增存在于样品中的至少一个靶序列产生的 扩增产物。在一些实施方案中,本公开内容总地来说涉及通过在扩增条件下,将样品中的至少一个靶序列与本文中公开的一个或多个靶特异性引物或使用本文中公开的引物选择标准设计的一个或多个靶特异性引物接触产生的扩增产物。在一些实施方案中,扩增产物可包括与癌症或遗传病相关的一个或多个突变。例如,可将怀疑包含一个或多个与至少一种癌症相关的突变的样品进行本文中公开的扩增法的任一个。可任选地将从选择的扩增法获得的扩增产物与已知在所述至少一种癌症方面是非癌性、从而可用作参照样品的正常样品或匹配样品相比较。在一些实施方案中,通过本文中公开的方法获得的扩增产物可任选地使用任何适当的核酸测序平台来进行测序,以测定扩增产物的核酸序列,和任选地将其与来自正常或非癌性样品的测序信息相比较。在一些实施方案中,扩增产物可包括一个或多个与抗生素抗性、致病性或遗传修饰相关的标志。在一些实施方案中,可将通过在扩增条件下将至少一个靶序列与至少一个靶特异性引物接触获得的一种或多种扩增产物的核酸序列用于测定遗传变体在一个或多个扩增产物中的存在或不存在。
在一些实施方案中,本公开内容总地来说涉及用于进行核酸扩增和核酸合成的组合物(以及使用公开的组合物的相关试剂盒、方法、***和装置)。在一些实施方案中,组合物包含多个靶特异性引物对,至少一个靶特异性引物对包括靶特异性正向引物和靶特异性反向引物。在一些实施方案中,组合物包括至少100、200、500、750、1000、2500、5000、7500、10000、12000、15000、17500、20000或50000个不同的引物对,所述引物对的一些或全部可以是靶特异性的。任选地,不同靶特异性引物对的至少两个针对(即,特异于)不同的靶序列。
在一些实施方案中,组合物包含至少一个可特异于至少一个扩增的靶序列的靶特异性引物对。在一些实施方案中,组合物包含多个靶特异性引物对,至少两个靶特异性引物对特异于不同的扩增的靶序列。在一些实施方案中,组合物包含靶特异性引物对,所述引物对的每一个成员包括靶特异性引物,所述引物可与第一扩增的序列的至少一部 分或其互补序列杂交并且基本上不与样品中的任何其它扩增的序列的3’末端或5’末端互补。在一些实施方案中,组合物包含至少一个可基本上不与样品中任何其它核酸分子的部分互补的靶特异性引物对。在一些实施方案中,组合物包含多个靶特异性引物对,所述引物对在靶特异性引物对内的一个或多个位置上包括一个或多个可切割基团。
在一些实施方案中,组合物包含一个或多个靶特异性引物对,所述引物对可扩增短的串联重复、单核苷酸多态性、基因、外显子、编码区、外显子组、或其部分。例如,多个靶特异性引物对可一致地扩增一个基因、外显子、编码区、外显子组、或其部分。在一些实施方案中,组合物包含靶特异性引物对,所述引物对被设计为使得使用所述一个或多个靶特异性引物对扩增的核苷酸序列的重叠最小化。在一些实施方案中,可在3’末端、5’末端或两端使一个或多个靶特异性引物之间的核苷酸序列重叠最小化。在一些实施方案中,多个靶特异性引物中的至少一个引物在3’末端、5’末端或二者上包含少于5个核苷酸的核苷酸序列重叠。在一些实施方案中,多个靶特异性引物的至少一个靶特异性引物相较于所述多个靶特异性引物包括至少一个核苷酸的核苷酸序列缺口。在一些实施方案中,组合物包含一个或多个靶特异性引物对,所述引物对被设计用来完全扩增一个或多个基因或外显子。例如,多个靶特异性引物对可被设计用来一致地扩增(即,提供所有核苷酸的100%的代表)单个基因或外显子。
在一些实施方案中,至少两对靶特异性引物能够与模板核酸上的位置杂交和用作利用聚合酶的模板依赖性引物延伸的底物。在一些实施方案中,模板依赖性引物延伸可包括位于至少两对引物的引物的杂交位点之间的模板的区域的扩增,从而导致扩增区域或“扩增子”的形成。通常地,扩增子的序列包括位于引物的杂交位点之间的模板的序列,以及至少部分引物自身的序列。在一些实施方案中,扩增反应可包括至少约5、10、25、50、100、150、200、250、400、500、750、1000、1200、1250、1500、1750、2000、2250、2500、2750、3000、5000、7500或10,000个不同的引物对。在一些实施方案中,扩增反应 可导致产生至少约5、10、25、50、100、150、200、250、400、500、750、1000、1200、1250、1500、1750、2000、2250、2500、2750、3000、5000、7500或10,000个不同的扩增子。在一些实施方案中,使至少约75%、80%、90%、95%、97%或99%的在扩增反应过程中产生的扩增子具有相似的大小,例如,扩增子在大小上彼此相异不超过5、10、25、50、75、100、500、1000或2000个核苷酸。在一些实施方案中,任意两个扩增子之间在长度上的差异不超过1%、5%或10%的扩增反应混合物的平均扩增子长度。任选地,平均扩增子长度为约50、60、70、80、90、100、110、120、130、140、150、200、250、500、1000、2000、10,000个核苷酸或更大。在一些实施方案中,混合物中扩增子间在长度的标准差不大于0.1、0.25、0.4、0.5、0.75、1、1.5、2.0、2.4或3.0。
在一些实施方案中,组合物包含靶特异性引物对,所述引物对被设计来产生与相邻的扩增的靶序列重叠单个核苷酸的扩增的靶序列。在一些实施方案中,组合物包含靶特异性引物对,所述引物对被设计来产生不与相邻的扩增的靶序列重叠的扩增的靶序列。例如,靶特异性引物对可被设计来产生间隔一个或多个核苷酸的扩增的靶序列。在一些实施方案中,组合物包含被设计来使扩增的靶序列间隔约50个核苷酸的靶特异性引物对。
在一些实施方案中,组合物包含多个外显子特异性或基因特异性靶特异性引物对,所述引物对可基本上与单个外显子或基因互补。在一些实施方案中,组合物包含多个可基本上与一个或多个外显子或基因互补的外显子特异性或基因特异性靶特异性引物对。在一些实施方案中,组合物包含多个基本上互补的外显子特异性或基因特异性靶特异性引物对并且没有两个引物对扩增超过10%的相同靶序列。在一些实施方案中,没有两个靶特异性引物对扩增相同的外显子或基因。在一些实施方案中,靶特异性引物对扩增靶序列的约100至约600个核苷酸。在一些实施方案中,靶特异性引物对可用于扩增约25%至100%的外显子、基因或编码区。在一些实施方案中,组合物包含多个靶特 异性引物对来产生多个扩增的靶序列,并且没有单个扩增的靶序列相较于其它扩增的靶序列过表达超过50%。在一些实施方案中,组合物包含多个靶特异性引物对,所述引物对被设计来产生多个基本上同质(即,在GC含量、熔解温度或扩增的靶序列的长度上是均一的)的扩增的靶序列。在一些实施方案中,所述多个靶特异性引物对在序列上重叠不超过5个核苷酸。
在一些实施方案中,本公开内容总地来说涉及用于在多重PCR反应中防止或消除非特异性扩增产物的方法。在一些实施方案中,方法包括(以及使用公开的方法所使用的相关组合物、试剂盒、***和装置)将一个或多个靶特异性引物对与具有多个靶序列的样品中的靶序列杂交,延伸杂交的靶特异性引物以形成多个扩增的靶序列,使扩增的靶序列变性和退火以形成多个双链的扩增的靶序列,以及对含有双链的扩增的靶序列的样品进行消化步骤以消除非特异性扩增产物。在一些实施方案中,方法包括在一个或多个靶特异性引物对的一个或多个位置上包括一个或多个可切割基团。在一些实施方案中,每一个靶特异性引物对包括至少一个可切割基团。在一些实施方案中,引物对的每一个靶特异性引物包括可切割基团。在一些实施方案中,消化是酶促或化学消化。在一些实施方案中,消化步骤包括部分消化扩增的靶序列的靶特异性引物。在一些实施方案中,方法包括热稳定性聚合酶。在一些实施方案中,热稳定性聚合酶可任选地通过热或化学处理来再活化。
在一些实施方案中,组合物包含多个针对一种或多种疾病或障碍的靶特异性引物对。在一些实施方案中,靶特异性引物对可基本上互补于与一种或多种癌症关联或相关的靶序列。在一些实施方案中,靶特异性引物对可基本上互补于与一种或多种先天性或遗传性障碍关联或相关的靶序列。在一些实施方案中,一个或多个靶特异性引物对可与一种或多种神经性、代谢性、神经肌肉性、发育性、心血管性或自身免疫性障碍相关。在一些实施方案中,一个或多个靶特异性引物对可与一个或多个与一种或多种神经性、代谢性、神经肌肉性、发育性、 心血管性或自身免疫性障碍相关的基因或外显子相关。在一些实施方案中,所述多个靶特异性引物可包括与哺乳动物的肿瘤发生相关的基因或基因片段。
在一些实施方案中,本公开内容总地来说涉及组合物(以及使用公开的组合物的相关试剂盒、方法、***和装置),所述组合物包含本文中公开的、包含在实施例中以及相关附录、补充资料和附于其的序列表中,并包括2012年4月27日提交的美国申请号13/458,739(通过引用方式全文并入本文)中的所有表格中的引物的任何引物、一些引物或所有引物。在一些实施方案中,本公开内容总地来说涉及组合物(以及使用公开的组合物的相关试剂盒、方法、***和装置),所述组合物包含实施例中使用的引物池的任何引物池或其任何亚组。例如,在一些实施方案中,本公开内容总地来说涉及包含一个或多个靶特异性引物的组合物,所述引物选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中所列的引物,所述引物包括成组的使用本公开内容的设计方法和选择标准设计和选择的引物,并且已被用于进行根据本文中公开的方法的高度多重的扩增。本领域技术人员可容易理解的是,还可预期表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中所示的每一个引物组的任何亚组支持多重扩增,因为已显示每一个表(例如2012年4月27日提交的美国申请号13/458,739中的表格,该文献通过引用方式全文并入本文)的完整组的引物支持这样的多重扩增,并且预期从池中除去特定引物对不会显著改变剩余引物为了进行多重扩增的目的的性能。在一些实施方案中,本公开内容总地来说涉及包含任意1、2、5、10、25、50、100、250、500、750、1000、2500、5000、7500、10000、12500、50000、100000或更多个表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中所示的不同的靶特异性引物对的组合物。在一些实施方案中,本公开内容涉及包含至少1、2、5、10、25、50、100、250、500、750、 1000、2500、5000、7500、10000、12500、50000、100000或更多个选自2、3、13、14、15,17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物或它们的互补序列的组合物。在一些实施方案中,本公开内容涉及包含至少1、2、5、10、25、50、100、250、500、750、1000、2500、5000、7500、10000、12500、50000、100000或更多个与表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的任何引物具有至少85%的同一性或互补性的引物的组合物。在一些实施方案中,组合物包含至少一个1、2、5、10、25、50、100、250、500、750、1000、2500、5000、7500、10000、12500、50000、100000或更多个选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物或其互补序列,其中至少一个引物包含至少一个核苷酸置换。核苷酸置换包括用任何其它核苷酸或核碱基对任意引物的任意核苷酸残基或核碱基的替代,并且可包含例如嘌呤对嘌呤的置换、嘧啶对嘧啶的置换、嘌呤对嘧啶的置换以及嘧啶对嘌呤的置换。在一些实施方案中,组合物的至少一个引物可包含任意1、2、3、4、或更多个核苷酸置换。在一些实施方案中,组合物的至少一个引物包括至少一个这样的引物:其中引物的含尿嘧啶核苷酸残基或核碱基的任一个、一些或全部被含胸腺嘧啶的核苷酸残基或核碱替代。在一些实施方案中,组合物的至少一个引物包括至少一个这样的引物:其中引物的含尿嘧啶核苷酸残基或核碱基的任1个、2个、3个、4个、5个或更多个被含胸腺嘧啶的核苷酸残基或核碱替代。
在一些实施方案中,靶特异性引物对可包括包含体细胞突变或种系突变的核酸序列。在一些实施方案中,种系或体细胞突变可发现于表1,4,16或18(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的基因的任一个或多个中。在一些实施方案中,靶特异性引物对可用于扩增可用于检测具有小于5%的等位基因频率的突变的存在的靶序列。在一些实施方案中,所述多个 靶特异性引物包括至少500,至少1000,至少3000,至少6000,至少10000,至少12000或更多个靶特异性引物对。
在一些实施方案中,本公开内容总地来说涉及用于进行多重核酸扩增或多重核酸合成的试剂盒。在一些实施方案中,试剂盒包括多个靶特异性引物。在一些实施方案中,试剂盒还可包括聚合酶、至少一个接头和/或切割试剂。在一些实施方案中,试剂盒还可包括dATP,dCTP,dGTP,dTTP和/或抗体。在一些实施方案中,切割试剂是可切割存在于一个或多个靶特异性引物中的一个或多个切割基团的任何试剂。在一些实施方案中,切割试剂可包括酶或化学试剂。在一些实施方案中,切割试剂可包括具有对于无嘌呤碱基的亲和力的酶。在一些实施方案中,切割试剂可包括具有对于第一可切割基团的亲和力的第一酶,并且还可包括具有对于第二可切割基团的亲和力的第二酶。在一些实施方案中,试剂盒还可包括具有对于无碱基位点的亲和力的酶。在一些实施方案中,聚合酶是热稳定性聚合酶。在一些实施方案中,试剂盒可包括一种或多种防腐剂、佐剂或核苷酸测序条形码。
在一些实施方案中,本公开内容总地来说涉及用于测定拷贝数变异的方法(以及相关组合物、***、试剂盒和装置),包括进行本文中公开的扩增法的任何扩增法。
详述
下列不同示例性实施方案的说明仅仅是示例性和解释性的,并且不被解释为以任何方式进行限定或限制。根据说明书和附图以及根据权利要求,本教导的其它实施方案、特性、目标和有利方面将是显然的。
如本文中所述,“扩增”或“扩增反应”及它们的变型通常是指籍以复制核酸分子(称为模板核酸分子)的至少一部分或将其拷贝进入至少一个另外的核酸分子的任何作用或过程。另外的核酸分子任选地包括与模板核酸分子的至少一些部分基本上同一或基本上互补的序列。模板核酸分子可以是单链或双链的,并且另外的核酸分子可独立地是单 链或双链的。在一些实施方案中,扩增包括用于产生至少一个拷贝的核酸分子的至少一些部分或产生至少一个拷贝的与核酸分子的至少一些部分互补的核酸序列的模板依赖性体外酶催化的反应。扩增任选地包括核酸分子的线性或指数复制。在一些实施方案中,使用等温条件进行这样的扩增;在其它实施方案中,这样的扩增可包括热循环。在一些实施方案中,扩增是在单个扩增反应中包括多个靶序列的同时扩增的多重扩增。靶序列的至少一些可位于单个扩增反应中包含的相同核酸分子上或不同靶核酸分子上。在一些实施方案中,“扩增”包括单独的或组合的基于DNA和RNA的核酸的至少一些部分的扩增。扩增反应可包括单链或双链核酸底物并且还可包括本领域技术人员已知的扩增过程的任何扩增过程。在一些实施方案中,扩增反应包括聚合酶链式反应(PCR)。
如本文中所述,“扩增条件”及其衍生词,通常是指适合用于扩增一个或多个核酸序列的条件。这样的扩增可以是线性的或指数的。在一些实施方案中,扩增条件可包括等温条件或可选择地可包括热循环条件,或等温与热循环条件的组合。在一些实施方案中,适合用于扩增一个或多个核酸序列的条件包括聚合酶链式反应(PCR)条件。通常地,扩增条件是指足以扩增核酸例如一个或多个靶序列,或扩增连接至一个或多个接头的扩增的靶序列例如接头连接的扩增的靶序列的反应混合物。一般而言,扩增条件包括用于扩增或用于核酸合成的催化剂例如聚合酶;对待扩增的核酸具有一定程度的互补性的引物;和一旦与核酸杂交便促进引物延伸的核苷酸,例如脱氧核糖核苷酸三磷酸(dNTP)。扩增条件可能需要引物与核酸的杂交或退火,引物的延伸和其中将延伸的引物与正在经历扩增的核酸序列分离的变性步骤。通常地,但非必需地,扩增条件可包括热循环;在一些实施方案中,扩增条件包括多个循环:其中退火、延伸和分离的步骤被重复。通常地,扩增条件包括阳离子例如Mg++或Mn++(例如,MgCl2等)并且还可包括具有离子强度的多种改性剂。
如本文中所述,“靶序列”或“目标靶序列”及其衍生词,通常是指 可按照本公开内容扩增或合成的任何单链或双链核酸序列,包括怀疑或预期存在于样品中的任何核酸序列。在一些实施方案中,靶序列以双链形式存在,并且在添加靶特异性引物或附加的接头之前,包含待扩增或合成的特定核苷酸序列的至少一部分或其互补序列。靶序列可包括在利用聚合酶进行延伸之前与用于扩增或合成反应的引物杂交的核酸。在一些实施方案中,该术语是指这样的核酸序列:其序列同一性、核苷酸的顺序或位置通过本公开内容的一个或多个方法来确定。
如本文中所定义,“样品”及其衍生词以其最广含义使用,包括怀疑包含靶的任何样本、培养物等。在一些实施方案中,样品包含DNA,RNA,PNA,LNA,核酸的嵌合、杂交或多重形式。样品可包括任何含有一个或多个核酸的生物、临床、手术、农业、大气或基于水的样本。该术语还包括任何分离的核酸样品例如基因组DNA、新鲜冷冻的或***固定的石蜡包埋的核酸样本。考虑到任何可用的遗传样品可用于确定拷贝数变异。在一些实施方式中,样品可包括DNA样品。在一些实施方式中,DNA样品可获自组织样品、血液抽取、血浆、肿瘤样品、活检样品、唾液、尿液、毛发、***、痰、卵等。在一些实施方式中,DNA样品可获自细胞培养物或细胞系。在一些实施方式中,DNA是基因组DNA、片段化的基因组DNA或***固定的石蜡包埋(FFPE)的DNA。在一些实施方式中,样品的量等于单个细胞中的DNA的量,或比其更多。在一些实施方式中,样品的量包括约3pg DNA或更多。
如本文中所述,“接触”及其衍生词,当用于指两个或更多个组分时,通常是指籍以促进或实现提及的组分的靠近、接近、混合或掺和而不一定需要此类组分的物理接触的任何过程,以及包括将含有提及的组分的任一种或多种的溶液彼此混合。可以以任何特定顺序或组合接触提及的组分,并且组分的引述的特定顺序不是限定性的。例如,“将A与B和C接触”包括其中首先将A与B接触,随后与C接触的实施方案,和其中将C与A接触,随后与B接触的实施方案,以及其中将A和C的混合物与B接触的实施方案等。此外,这样的接触不一 定需要接触过程的最终结果是包含所有提及的组分的混合物,只要在接触过程中在一些点上所有提及的组分同时存在或同时包含在相同混合物或溶液中。例如,“将A与B和C接触”可包括其中首先将C与A接触以形成第一混合物,随后将第一混合物与B接触以形成第二混合物,之后从第二混合物除去C的实施方案;任选地随后还可除去A,仅留下B。当待接触的提及的组分的一个或多个包括所述多个(例如,“将靶序列与多个靶特异性引物和聚合酶接触”)时,则所述多个的每一个成员可被视为接触过程的单个组分,以便接触可包括以任何顺序或组合将所述多个的任一个或多个成员与所述多个的任何其它成员和/或与任何其它提及的组分接触(例如,可将所述多个靶特异性引物的一些但非全部与靶序列接触,随后与聚合酶接触,随后与所述多个靶特异性引物的其它成员接触)。
如本文中所述,术语“引物”及其衍生物通常是指可与目标靶序列杂交的任何多核苷酸。在一些实施方案中,引物还可用于引发核酸合成。通常地,引物用作可利用聚合酶将核苷酸聚合至其上的底物;然而,在一些实施方案中,引物可被掺入合成的核酸链并且提供另一个引物可与其杂交以引发与合成的核酸分子互补的新链的合成的位点。引物可由核苷酸或其类似物的任意组合组成,所述核苷酸或类似物可被任选地连接以形成具有任何适当长度的线性聚合物。在一些实施方案中,引物是单链寡核苷酸或多核苷酸(为了本公开内容的目的,术语“多核苷酸”和“寡核苷酸”在本文中可互换使用,并且不一定表明两者之间长度上的任何差异)。在一些实施方案中,引物是单链的但其也可以是双链的。引物任选地天然产生,如在纯化的限制性消化物中,或可合成产生。在一些实施方案中,当暴露于扩增或合成条件时,引物用作用于扩增或合成的起始点;这样的扩增或合成可以以模板依赖性的方式发生,并且任选地导致与靶序列的至少一部分互补的引物延伸产物的形成。示例性的扩增或合成条件可包括将引物与多核苷酸模板(例如,包含靶序列的模板)、核苷酸和诱导剂例如聚合酶在适当的温度和pH下接触以诱导核苷酸至靶特异性引物的末端上的聚合。如果 是双链,可任选地在被用于制备引物延伸产物之前,处理引物以分开其链。在一些实施方案中,引物是寡脱氧核糖核苷酸或寡核糖核苷酸。在一些实施方案中,引物可包含一个或多个核苷酸类似物。靶特异性引物的确切长度和/或组成(包括序列)可影响许多性质,包括熔解温度(Tm)、GC含量、二级结构的形成、重复核苷酸基序、预测的引物延伸产物的长度、跨目标核酸分子的覆盖程度、存在于单个扩增或合成反应中的引物的数目、核苷酸类似物或修饰的核苷酸在引物中的存在等。在一些实施方案中,可将引物与扩增或合成反应中的相容性引物配对以形成由正向引物和反向引物组成的引物对。在一些实施方案中,引物对的正向引物包含与核酸分子的链的至少一部分基本上互补的序列,引物对的反向引物包含与所述链的至少一部分基本上同一的序列。在一些实施方案中,正向引物和反向引物能够与核酸双链体的相对链杂交。任选地,正向引物引发第一核酸链的合成,并且反向引物引发第二核酸链的合成,其中第一和第二链基本上彼此互补,或可杂交形成双链核酸分子。在一些实施方案中,扩增或合成产物的一个末端由正向引物确定并且扩增或合成产物的另一个末端由反向引物确定。在一些实施方案中,当需要长的引物延伸产物的扩增或合成,例如扩增外显子、编码区或基因时,可产生几个覆盖期望的长度以使得能够充分扩增所述区域的引物对。在一些实施方案中,引物可包括一个或多个可切割基团。在一些实施方案中,引物长度在长度上在约10至约60个核苷酸,约12至约50个核苷酸和约15至约40个核苷酸的范围内。通常地,引物能够与对应的靶序列杂交并且当在dNTP和聚合酶存在的情况下暴露于扩增条件时经历引物延伸。在一些情况下,特定核苷酸序列或引物的一部分在扩增反应开始时是已知的,或可通过本文中描述的方法的一个或多个方法来测定。在一些实施方案中,引物在引物中的一个或多个位置上包括一个或多个可切割基团。
如本文中所述,“靶特异性引物”及其衍生词,通常是指单链或双链多核苷酸,通常寡核苷酸,其包括至少一个与包含靶序列的核酸分子的至少一部分具有至少50%的互补性,通常至少75%的互补性或至 少85%的互补性,更常见地至少90%的互补性,更常见地至少95%的互补性,更常见地至少98%或至少99%的互补性或同一性的序列。在这样的情况下,靶特异性引物与靶序列被描述为彼此“对应”。在一些实施方案中,靶特异性引物能够与对应的靶序列(或与靶序列的互补序列)的至少一部分杂交;这样的杂交可任选地在标准杂交条件下或在严格杂交条件下进行。在一些实施方案中,靶特异性引物不能与靶序列,或与其互补序列杂交,但能够与包含靶序列的核酸链的一部分或其互补序列杂交。在一些实施方案中,靶特异性引物包括至少一个与靶序列自身的至少一部分具有至少75%的互补性,通常地至少85%的互补性,更常见地至少90%的互补性,更常见地至少95%的互补性,更常见地至少98%的互补性,或更常见地至少99%的互补性的序列;在其它实施方案中,靶特异性引物包括至少一个与除靶序列外的核酸分子的至少一部分具有至少75%的互补性,通常地至少85%的互补性,更常见地至少90%的互补性,更常见地至少95%的互补性,更常见地至少98%的互补性,或更常见地至少99%的互补性的序列。在一些实施方案中,靶特异性引物基本上不与存在于样品中的其它靶序列互补;任选地,靶特异性引物基本上不与存在于样品中的其它核酸分子互补。在一些实施方案中,存在于样品中的不包括或对应于靶序列(或靶序列的互补序列)的核酸分子被称为“非特异性”序列或“非特异性核酸”。在一些实施方案中,靶特异性引物被设计来包括与其对应靶序列的至少一部分基本上互补的核苷酸序列。在一些实施方案中,靶特异性引物在其整个长度上与包括其对应靶序列的核酸分子的至少一部分具有至少95%的互补性,或至少99%的互补性或同一性。在一些实施方案中,靶特异性引物可在其整个长度上与其对应靶序列的至少一部分具有至少90%、至少95%的互补性、至少98%的互补性或至少99%的互补性或同一性。在一些实施方案中,正向靶特异性引物和反向靶特异性引物定义了可用于通过模板依赖性引物延伸扩增靶序列的靶特异性引物对。通常地,靶特异性引物对的每一个引物包括至少一个与包括对应靶序列的核酸分子的至少一部分基本上互补但与样品 的至少一个其它靶序列具有低于50%的互补性的序列。在一些实施方案中,可在单个扩增反应中使用多个靶特异性引物对进行扩增,其中每一个引物对包括正向靶特异性引物和反向靶特异性引物,每一个引物包括至少一个与样品中的对应靶序列基本上互补或基本上同一的序列,并且每一个引物对具有不同的对应靶序列。在一些实施方案中,靶特异性引物可在其3’末端或其5’末端与存在于扩增反应中的任何其它靶特异性引物基本上不互补。在一些实施方案中,靶特异性引物可包括最小的对存在于扩增反应中的其它靶特异性引物的交叉杂交。在一些实施方案中,靶特异性引物包括最小的对扩增反应混合物中的非特异性序列的交叉杂交。在一些实施方案中,靶特异性引物包括最小的自我互补性。在一些实施方案中,靶特异性引物可包括一个或多个位于3’末端的可切割基团。在一些实施方案中,靶特异性引物可包括一个或多个位于靶特异性引物的中央核苷酸附近或周围的可切割基团。在一些实施方案中,一个或多个靶特异性引物在靶特异性引物的5’末端仅包括非可切割核苷酸。在一些实施方案中,靶特异性引物相较于一个或多个不同的靶特异性引物在引物的3’末端或5’末端包括最小的核苷酸序列重叠,任选地在相同扩增反应中。在一些实施方案中,单个反应混合物中的1,2,3,4,5,6,7,8,9,10或更多个靶特异性引物包括上述实施方案的一个或多个实施方案。在一些实施方案中,单个反应混合物中基本上所有的所述多个靶特异性引物包括上述实施方案的一个或多个实施方案。
如本文中所述,“聚合酶”及其衍生词通常是指可催化核苷酸(包括其类似物)至核酸链中的聚合的任何酶。通常地但非必需地,这样的核苷酸聚合可以以模板依赖性方式存在。这样的聚合酶可包括但不限于天然存在的聚合酶及其任何亚基和截短形式、突变型聚合酶、变体聚合酶、重组、融合或工程化的聚合酶、化学修饰的聚合酶、合成的分子或装配体以及保留催化这样的聚合的能力的其任何类似物、衍生物或片段。任选地,聚合酶可以是包含一个或多个突变(包括用其它氨基酸对一个或多个氨基酸的替代、一个或多个氨基酸从聚合酶的***或 缺失、或两个或更多个聚合酶的部分的连接)的突变型聚合酶。通常地,聚合酶包含一个或多个活性部位,在该部位上可发生核苷酸结合和/或核苷酸聚合的催化作用。一些示例性聚合酶包括但不限于DNA聚合酶和RNA聚合酶。如本文中所述,术语“聚合酶”及其变体还指包含彼此连接的至少两个部分的融合蛋白,其中第一部分包含可催化核苷酸至核酸链中的聚合并且连接至包含第二多肽的第二部分的肽。在一些实施方案中,第二多肽可包括报告酶或持续合成能力增强性结构域。任选地,聚合酶可具有5’外切核酸酶活性或末端转移酶活性。在一些实施方案中,聚合酶可任选地例如通过使用热、化学品或新的量的聚合酶至反应混合物中的再添加来再活化。在一些实施方案中,聚合酶可包括任选地可再活化的热启动聚合酶或基于适体的聚合酶。
如本文中所述,术语“核苷酸”及其变体包括可选择地性结合至聚合酶,或可通过聚合酶聚合的任何化合物,包括但不限于任何天然存在的核苷酸或其类似物。通常地,但非必需的,在核苷酸与聚合酶的选择性结合后,核苷酸通过聚合酶被聚合至核酸链中;然而偶尔地核苷酸可从聚合酶解离而不被掺入核酸链(在本文中称为“非生产性”事件的事件)。这样的核苷酸不仅包括天然存在的核苷酸而且还包括任何类似物,无论其结构如何,其可选择性结合聚合酶或可通过聚合酶进行聚合。虽然天然存在的核苷酸通常包括碱基、糖和磷酸部分,但本公开内容的核苷酸可包括不存在此类部分之任一、一些或全部的化合物。在一些实施方案中,核苷酸可任选地包括含有3、4、5、6、7、8、9、10或更多个磷原子的磷原子的链。在一些实施方案中,可将磷原子链连接至糖环的任意碳,例如5’碳。磷链可通过间插O或S连接至糖。在一个实施方案中,链中的一个或多个磷原子可以是具有P和O的磷酸基团的部分。在另一个实施方案中,链中的磷原子可通过间插O、NH、S、亚甲基、取代的亚甲基、亚乙基、取代的亚乙基、CNH2、C(O)、C(CH2)、CH2CH2或C(OH)CH2R(其中R可以是4-吡啶或1-咪唑)连接在一起。在一个实施方案中,链中的磷原子可具有含有O、BH3或S的侧基。在磷原子链中,具有除O外的侧基的磷原子可以是 取代的磷酸基团。在磷原子链中,具有除O外的间插原子的磷原子可以是取代的磷酸基团。核苷酸类似物的一些实例描述于Xu,美国专利号7,405,281中。在一些实施方案中,核苷酸包含标记并且在本文中称为“标记的核苷酸”;标记核苷酸的标记在本文中称为“核苷酸标记”。在一些实施方案中,标记可以以连接至末端磷酸基团(即离糖最远的磷酸基团)的荧光染料的形式存在。可用于公开的方法和组合物的核苷酸的一些实例包括但不限于核糖核苷酸、脱氧核糖核苷酸、修饰的核糖核苷酸、修饰的脱氧核糖核苷酸、核糖核苷酸多磷酸、脱氧核糖核苷酸多磷酸、修饰的核糖核苷酸多磷酸、修饰的脱氧核糖核苷酸多磷酸、肽核苷酸、修饰的肽核苷酸、金属核苷、核苷膦酸酯以及修饰的磷酸-糖主链核苷酸、前述化合物的类似物、衍生物或变体等。在一些实施方案中,核苷酸可包含非氧部分例如硫-或硼-部分来替代桥连核苷酸的α磷酸与糖或核苷酸的α与β磷酸或核苷酸的β与γ磷酸、或核苷酸的任意其它两个磷酸之间或其任何组合的氧部分。“核苷酸5’-三磷酸”是指在5’位置上具有三磷酸酯基团的核苷酸,有时称为“NTP”或“dNTP”和“ddNTP”来特别地指出核糖的结构特征。三磷酸酯基团可包括对不同氧的硫置换,例如α-硫-核苷酸5’-三磷酸。关于核酸化学的综述,参见:Shabarova,Z.和Bogdanov,A.Advanced OrganicChemistry of Nucleic Acids,VCH,New York,1994。
如本文中所述,术语“延伸”及其变体,当用于指称给定的引物时,包括给定的聚合酶的任何体内或体外酶促活性特征,所述特征与一个或多个核苷酸至已有的核酸分子的末端的聚合相关。通常地但非必需的,这样的引物延伸以模板依赖性方式发生;在模板依赖性延伸过程中,碱基的顺序和选择通过已建立的碱基配对法则来驱动,所述法则可包括Watson-Crick型碱基配对法则,或可选择地(和特别地在牵涉核苷酸类似物的延伸反应的情况下)通过一些其它类型的碱基配对范型来驱动。在一个非限定性实例中,延伸通过聚合酶将核苷酸聚合在核酸分子的3’OH末端上来发生。
如本文中所述,术语“部分”及其变型,当用于指称给定的核酸分 子例如引物或模板核酸分子时,包括核酸分子长度(包括核酸分子的部分或整个长度)内的任何数目的连续核苷酸。
如本文中所述,术语“同一性”和“同一的”及其变型,当用于指两个或更多个核酸序列时,是指在两个或更多个序列(例如,核苷酸或多肽序列)在序列上的相似性。在两个或更多个同源序列的背景中,序列或其子序列的百分比同一性或同源性表示所有为相同的单体单位(例如,核苷酸或氨基酸)的百分比(即,约70%的同一性,优选75%、80%、85%、90%、95%、98%或99%的同一性)。当在比较窗口或指定的区域内就最大对应性比较和对齐(如使用BLAST或BLAST2.0序列比较算法,利用下面描述的缺省参数测量的,或通过手工比对和目测检测测量的)时,百分比同一性可以是在指定的区域范围内。当在氨基酸水平上或核苷酸水平上存在至少85%的同一性时,序列被认为是“基本上同一的”。优选地,同一性在长度为至少约25、50或100个核苷酸,或横跨至少一个比较的序列的整个长度的区域范围内存在。用于测定百分比序列同一性和序列相似性的典型算法是BLAST和BLAST2.0算法,所述算法描述于Altschul等人,Nuc.Acids Res.25:3389-3402(1977)中。其它方法包括Smith&Waterman,Adv.Appl.Math.2:482(1981)和Needleman&Wunsch,J.Mol.Biol.48:443(1970)等的算法。两个核酸序列基本上同一的另一个指标是两个分子或其互补序列在严格杂交条件下彼此杂交。
如本文中使用的术语“互补性”和“互补”及其变型是指可以以反向平行方向(如在杂交的双链体中)在两个或更多个单个的对应位置上进行累积碱基配对的任意两个或更多个核酸序列(例如,模板核酸分子、靶序列和/或引物的部分或全部)。这样的碱基配对可按照任何一套已建立的法则,例如按照Watson-Crick碱基配对法则或按照一些其它碱基配对范式来进行。任选地,在第一与第二核酸序列之间可存在“完全”或“完整”互补性,其中第一核酸序列中的每一个核苷酸可与第二核酸序列上的对应反向平行位置中的核苷酸进行稳定碱基配对相互作用。“部分”互补性描述了其中至少20%但少于100%的一个核酸序列的残 基与另一个核酸序列中的残基互补。在一些实施方案中,至少50%但少于100%的一个核酸序列的残基与另一个核酸序列中的残基互补。在一些实施方案中,至少70%,80%,90%,95%或98%但少于100%的一个核酸序列的残基与另一个核酸序列中的残基互补。当至少85%的一个核酸序列的残基与另一个核酸序列中的残基互补时,序列被认为是“基本上互补的”。在一些实施方案中,两个互补或基本上互补的序列能够在标准或严格杂交条件下彼此杂交。“非互补的”描述其中少于20%的一个核酸序列的残基与另一个核酸序列中的残基互补的核酸序列。当少于15%的一个核酸序列的残基与另一个核酸序列中的残基互补时,序列被认为是“基本上不互补的”。在一些实施方案中,两个非互补或基本上非互补的序列不能在标准或严格杂交条件下彼此杂交。"错配"可在任何位置存在于两个不互补的相对核苷酸中。互补核苷酸包括在生理条件下在DNA复制过程中被NDA聚合酶高效地彼此相对地掺入的核苷酸。在通常的实施方案中,互补核苷酸可在彼此反向平行的位置中的核苷酸和/或多核苷酸的核碱基之间彼此形成碱基对,例如通过特异性Watson-Crick型氢键形成的A-T/U和G-C碱基对,或通过一些其它类型的碱基配对范式形成的碱基对。其它人工碱基对的互补性可基于其它类型的氢键合/或碱基的疏水性和/或两个碱基之间的形状互补性。
如本文中所述,“扩增的靶序列”及其衍生词,通常是指通过靶序列的扩增,使用本文中提供的靶特异性引物和方法扩增靶序列产生的核酸序列。扩增的靶序列相对于靶序列可以是相同的有义序列(在第二轮和随后偶数计数轮的扩增中产生的正链)或反义序列(即,在第一轮和随后的奇数计数轮的扩增中产生的负链)。为了本公开内容的目的,扩增的靶序列与反应中的另一个扩增的靶序列的任意部分具有少于50%的互补性。
如本文中所述,术语“连接”及其衍生词通常是指用于将两个或更多个分子共价地连接在一起,例如将两个或更多个核苷酸彼此共价连接的作用或过程。在一些实施方案中,连接包括连接核酸的相邻核苷 酸之间的切口。在一些实施方案中,连接包括在第一核酸分子的末端与第二核酸分子的末端之间形成共价键。在一些实施方案例如其中待连接的核酸分子包括常规核苷酸残基的实施方案中,连接可包括在一个核酸的5’磷酸基团与第二核酸的3’羟基之间形成共价键,从而形成连接的核酸分子。在一些实施方案中,可使用用于连接切口或在相邻核苷酸之间将5’磷酸键合至3’羟基的任何方法。在示例性实施方案中,可使用酶例如连接酶。通常为了本公开内容的目的,可将扩增的靶序列连接至接头以产生接头连接的扩增的靶序列。
如本文中所述,“连接酶”及其衍生词,通常是指能够催化两个底物分子的连接的任何试剂。在一些实施方案中,连接酶包括能够催化核酸的相邻核苷酸之间的切口连接的酶。在一些实施方案中,连接酶包括能够催化一个核酸分子的5’磷酸与另一个核酸分子的3’羟基之间的共价键形成,从而形成连接的核酸分子的酶。适当的连接酶可包括但不限于T4DNA连接酶、T4RNA连接酶和大肠杆菌DNA连接酶。
如本文中所述,“连接条件”及其衍生词,通常是指适合于将两个分子彼此连接的条件。在一些实施方案中,连接条件适合于封闭核酸之间的切口或缺口。如本文中所定义,“切口”或“缺口”是指在核酸序列的内部核苷酸内缺乏单核苷酸戊糖环的5’磷酸至相邻单核苷酸戊糖环的3’羟基的直接结合的核酸分子。如本文中所述,术语切口或缺口与该术语在本领域中的使用一致。通常地,可在适当的温度和pH下,在酶例如连接酶存在的情况下将切口或缺口连接。在一些实施方案中,T4DNA连接酶可在约70-72℃的温度连接核酸之间的切口。
如本文中所述,“平末端连接”及其衍生词,通常是指两个平末端双链核酸分子彼此的连接。“平末端”是指其中核酸分子的一条链的末端中的基本上所有核苷酸与相同核酸分子的另一条链中的相对核苷酸碱基配对的双链核酸分子的末端。如果核酸分子具有包含在长度上超过2个核苷酸的单链部分(在本文中称为“悬突”),则其不是平末端的。在一些实施方案中,核酸分子的末端不包含任何单链部分,以便末端的一条链中的每一个核苷酸与相同核酸分子的另一条链中的相对核苷 酸碱基配对。在一些实施方案中,彼此连接的两个平末端核酸分子的末端不包含任何重叠、共有或互补的序列。通常地,平末端连接不包括使用另外的寡核苷酸接头来帮助双链的扩增的靶序列与双链接头,例如Mitra和Varley,US2010/0129874(2010年5月27日公布的)中描述的补丁寡核苷酸(patcholigonucleotide)连接。在一些实施方案中,平末端连接包括切口平移反应来封闭在连接过程中产生的切口。
如本文中所述,术语“接头”或“接头及其互补序列”及其衍生物,通常是指可连接至本公开内容的核酸分子的任意线性寡核苷酸。任选地,接头包括基本上不与样品内的至少一个靶序列的3’末端或5’末端互补的核酸序列。在一些实施方案中,接头基本上不与存在于样品中的任何靶序列的3’末端或5’末端互补。在一些实施方案中,接头包括基本上不与扩增的靶序列互补的任何单链或双链线性寡核苷酸。在一些实施方案中,接头基本上不与样品的至少一个、一些或全部核酸分子互补。在一些实施方案中,适当的接头长度在长度上在约10-100个核苷酸,约12-60个核苷酸和约15-50个核苷酸的范围内。一般地,接头可包括核苷酸和/或核酸的任意组合。在一些方面,接头可在一个或多个位置上包含一个或多个可切割基团。在另一个方面中,接头可包括与引物例如通用引物的至少一部分基本上同一的,或基本上互补的序列。在一些实施方案中,接头可包含条形码或标签来帮助下游编目、鉴定或测序。在一些实施方案中,当在适当的温度和pH下,特别地在聚合酶和dNTP存在的情况下连接至扩增的靶序列时,单链接头可用作用于扩增的底物。
如本文中所述,“再扩增”及其衍生词通常指籍以将扩增的核酸分子的至少一部分通过任何适当的扩增法(在一些实施方案中称为“第二”扩增或“再扩增”)进一步扩增,从而产生再扩增的核酸分子的任何过程。第二扩增无需与籍以产生扩增的核酸分子的原始扩增法相同;再扩增的核酸分子也不需要与扩增的核酸分子完全相同或完全互补;所需的是再扩增的核酸分子包含扩增的核酸分子的至少一部分或其互补序列。例如,再扩增可包括使用不同的扩增条件和/或不同的引物, 包括与初始扩增不同的靶特异性引物。
如本文中所定义,“可切割基团”通常是指在掺入核酸后可在适当的条件下被切割的任何部分。例如,可将可切割基团掺入靶特异性引物、扩增的序列、接头或样品的核酸分子。在示例性实施方案中,靶特异性引物可包含可切割基团,所述切割基团被掺入扩增的产物并且随后在扩增后被切割,从而从扩增的产物除去靶特异性引物的部分或全部。可通过可接受的方法从靶特异性引物、扩增的序列、接头或样品的核酸分子切割或除去可切割基团。例如,可通过酶促、热、光氧化或化学处理从靶特异性引物、扩增的序列、接头或样品的核酸分子除去可切割基团。在一个方面,可切割基团可包含非天然存在的核碱基,例如,寡脱氧核糖核苷酸可包含一个或多个RNA核碱基,例如可通过尿嘧啶糖基化酶除去的尿嘧啶。在一些实施方案中,可切割基团可包括一个或多个修饰的核碱基(例如7-甲基鸟嘌呤,8-氧-鸟嘌呤,黄嘌呤,次黄嘌呤,5,6-二氢尿嘧啶或5-甲基胞嘧啶)或一个或多个修饰的核苷(即,7-甲基鸟苷,8-氧-脱氧鸟苷,黄苷,肌苷,二氢尿苷或5-甲基胞苷)。修饰的核碱基或核苷酸可通过酶促、化学或热的方式从核酸除去。在一个实施方案中,可切割基团可包括可在扩增(或合成)后,在暴露于紫外光后从引物除去的部分(即,溴脱氧尿苷)。在另一个实施方案中,可切割基团可包括甲基化胞嘧啶。通常地,甲基化胞嘧啶可以例如在扩增(或合成)诱导后,在亚硫酸氢钠处理后从引物切割。在一些实施方案中,可切割部分可包括限制性位点。例如,引物或靶序列可包括特异于一种或多种限制酶的核酸序列,并且在扩增(或合成)后,可用一种或多种限制性酶处理引物或靶序列,以便除去切割基团。通常地,对于靶特异性引物、扩增的序列、接头或样品的核酸分子,可在一个或多个位置上包含一个或多个可切割基团。
如本文中所述,“切割步骤”及其衍生词,通常是指籍以从靶特异性引物、扩增的序列、接头或样品的核酸分子切割或除去可切割基因的任何过程。在一些实施方案中,切割步骤包括化学、热、光氧化或消化过程。
如本文中所述,术语“杂交”与其在本领域中的应用一致,通常是指两个核酸分子经历碱基配对相互作用的过程。当一个核酸分子的任何部分是与另一个核酸分子的任何部分碱基配对时,两个核酸分子被称作是杂交;不一定需要两个核酸分子在它们各自整个的长度上杂交,在一些实施方案中,核酸分子的至少一个可包括不与另一个核酸分子杂交的部分。短语“严格条件下的杂交”及其变型通常是指在其下靶特异性引物与靶序列的杂交在高杂交温度和低离子强度存在的情况下发生的条件。在一个示例性实施方案中,严格杂交条件包括在约60-68℃含有约30mM硫酸镁、约300mM Tris-硫酸盐,pH8.9和约90mM硫酸铵的含水环境,或其等同物。如本文中所述,短语“标准杂交条件”及其变型通常是指在其下引物与寡核苷酸(即,靶序列)的杂交在低杂交温度和高离子强度存在的情况下发生的条件。在一个示例性实施方案中,标准杂交条件包括在约50-55℃含有约100mM硫酸镁、约500mMTris-硫酸盐,pH8.9和约200mM硫酸铵的含水环境或其等同物。
如本文中所述,“三重核苷酸基序”及其衍生词,通常是指连续在3个核苷酸上重复的任何核苷酸序列例如AAA或CCC。通常地,三重核苷酸基序在本公开内容的靶特异性引物(或接头)中不会重复超过5次。
如本文中所述,“ACA核苷酸基序”及其衍生词,通常是指核苷酸序列“ACA”。一般而言,该基序在本公开内容的靶特异性引物(或接头)中不会重复3次或更多次。
如本文中所述,“同聚物”及其衍生词,通常是指在长度上为8个核苷酸或更多核苷酸的任何重复核苷酸序列,例如AAAAAAAA或CCCCCCCC。一般而言,如本文中所定义,同聚物不存在于本公开内容的靶特异性引物(或接头)中。
如本文中所述,“GC含量”及其衍生词,通常是指核酸分子的胞嘧啶和鸟嘌呤的含量。一般而言,本公开内容的靶特异性引物(或接头)的GC含量为85%或更低。更常见地,本公开内容的靶特异性引物或接头的GC含量为15-85%。
如本文中所述,术语“末端”及其变型,当用于指核酸分子例如靶序列或扩增的靶序列时,可包括核酸分子的末端30个核苷酸、末端20个核苷酸,甚至更常见地末端15个核苷酸。由连接的系列连续核苷酸组成的线性核酸分子通常包括至少两个末端。在一些实施方案中,核酸分子的一个末端可包括3’羟基或其等同物,并且可称为“3’末端”及其衍生词。任选地,3’末端包括未连接至单核苷酸戊糖环的5’磷酸基团的3’羟基。通常地,3’末端包括一个或多个与包含未连接的3’羟基的核苷酸相邻的5’连接的核苷酸,通常地30个与3’羟基相邻的核苷酸,通常地末端20个,更常见地末端15个核苷酸。一般而言,一个或多个连接的核苷酸可表示为存在于寡核苷酸中的核苷酸的百分比,或可提供为许多与未连接的3’羟基相邻的连接的核苷酸。例如,3’末端可包括短于50%的寡核苷酸的核苷酸长度。在一些实施方案中,3’末端不包括任何未连接的3’羟基,但可包括能够用作核苷酸通过引物延伸和/或核苷酸聚合连接的位点。在一些实施方案中,术语“3’末端”例如,当指靶特异性引物时,可在3’末端包含末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少的核苷酸。在一些实施方案中,术语“3’末端”,当指靶特异性引物时,可包括位于3’末端第10个(或更少)核苷酸位置的核苷酸。
如本文中所述,“5’末端”及其衍生词,通常是指核酸分子例如靶序列或扩增的靶序列的末端,其包括游离5’磷酸基团或其等同物。在一些实施方案中,5’末端包括未与相邻的单核苷酸戊糖环的3’羟基连接的5’磷酸基团。通常地,5’末端包括一个或多个与5’磷酸相邻的连接的核苷酸,通常地30个与包含5’磷酸基团的核苷酸相邻的核苷酸,通常地末端20个,更常见地末端15个核苷酸。一般而言,一个或多个连接的核苷酸可表示为存在于寡核苷酸中的核苷酸的百分比或可提供为许多与5’磷酸相邻的连接的核苷酸。例如,5’末端可短于50%的寡核苷酸的核苷酸长度。在另一个示例性实施方案中,5’末端可包括约15个与包含末端5’磷酸的核苷酸相邻的核苷酸。在一些实施方案中,5’末端不包括任何未连接的5’磷酸基团但可包括能够用作至3’羟 基或另一个核酸分子的3’末端的附着的位点的任何部分。在一些实施方案中,术语“5’末端”例如当指靶特异性引物时,可在5’末端上包含末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少的核苷酸。在一些实施方案中,术语“5’末端”,当指靶特异性引物时,可包含位于距离5’末端10个(或更少)位置上的核苷酸。在一些实施方案中,靶特异性引物的5’末端可仅包括非可切割的核苷酸(例如不包含一个或多个本文中公开的可切割基团的核苷酸),或可切割核苷酸,这可由本领域技术人员来容易的确定。
如本文中所述,“保护基团”及其衍生语,通常是指可被掺入接头或靶特异性引物、赋予靶特异性引物或接头化学选择性或保护其免受消化或化学降解的任何部分。通常地,但不是必需地,保护基团可在靶特异性引物或接头中包含现有官能团的修饰,以实现化学选择性。适当类型的保护基团包括醇、胺、磷酸、羰基或羧酸保护基团。在示例性实施方案中,保护基团可包括具有碳原子的链的间隔子化合物。
如本文中所述,“DNA条形码”或“DNA标签序列”及其衍生词,通常是指接头内的独特的短的(6-14个核苷酸)核酸序列,其可用作区分或分离样品中的多个扩增的靶序列的‘钥匙’。为了本公开内容的目的,可将DNA条形码或DNA标签序列掺入接头的核苷酸序列。
如本文中所述,短语“两轮靶特异性杂交”或“两轮靶特异性选择”及其衍生词通常是指籍以将相同靶序列经历两轮连续的基于杂交的靶特异性选择的任何过程,其中靶序列与靶特异性序列杂交。每一轮基于杂交的靶特异性选择可包括多个与靶特异性序列的至少一些部分的靶特异性杂交。在一个示例性实施方案中,一轮靶特异性选择包括牵涉靶序列的第一区域的第一靶特异性杂交和牵涉靶序列的第二区域的第二靶特异性杂交。第一与第二区域可以相同或不同。在一些实施方案中,每一轮基于杂交的靶特异性选择可包括两个靶特异性寡核苷酸(例如,正向靶特异性引物和反向靶特异性引物)的使用,以便每一轮选择包括两个靶特异性杂交。
如本文中所述,“可比较的最大最低熔解温度”及其衍生词,通常 是指在切割可切割基团后,每一个核酸片段针对单个接头或靶特异性引物的熔解温度(Tm)。比较通过单个接头或靶特异性引物产生的每一个核酸片段的杂交温度以确定阻止来自靶特异性引物或接头的任何核酸片段与靶序列的杂交所需的最大最低温度。一旦已知最大杂交温度,则可能例如通过沿着引物的长度移动可切割基团的位置操作接头或靶特异性引物,来获得针对每一个核酸片段的可比较的最大最低熔解温度。
如本文中所述,“仅添加”及其衍生词,通常是指一系列步骤,其中将试剂和组分添加至第一或单个反应混合物中。通常地,系列步骤不包括将反应混合物从第一容器移至第二容器以完成系列步骤。一般而言,仅添加法不包括在包含反应混合物的容器外操作反应混合物。通常地,仅添加法易于进行自动化和高通量。
如本文中所述,“合成”及其衍生词,通常指包括利用聚合酶,任选地以模板依赖性方式进行核苷酸聚合的反应。聚合酶通过来自核苷三磷酸(NTP)、脱氧核苷三磷酸(dNTP)或双脱氧核苷三磷酸(ddNTP)的核苷单磷酸至正在延伸的寡核苷酸链的3′羟基的转移来合成寡核苷酸。为了本公开内容的目的,合成包括杂交的接头或靶特异性引物通过来自脱氧核苷三磷酸的核苷单磷酸的转移进行的系列延伸。
如本文中所述,“聚合条件”及其衍生词,通常是指适合于核苷酸聚合的条件。在通常的实施方案中,这样的核苷酸聚合通过聚合酶来催化。在一些实施方案中,聚合条件包括用于引物延伸(任选地以模板依赖性的方式),从而导致合成核酸序列产生的条件。在一些实施方案中,聚合条件包括聚合酶链式反应(PCR)。通常地,聚合条件包括使用足以合成核酸并且包含聚合酶和核苷酸的反应混合物。聚合条件可包括用于靶特异性引物与靶序列的退火以及引物在聚合酶的存在下以模板依赖性的方式进行的延伸的条件。在一些实施方案中,聚合条件可使用热循环来实施。此外,聚合条件可包括多个循环,其中,重复退火、延伸和分离两个核酸链的步骤。通常地,聚合条件包括阳离子例如MgCl2。一般而言,一个或多个核苷酸形成核酸链的聚合包括将 核苷酸通过磷酸二酯键彼此连接,然而,在特定核苷酸类似物的背景中替代性连接可以是可能的。
如本文中所述,术语“核酸”是指天然核酸、人造核酸、其类似物或其组合,包括多核苷酸和寡核苷酸。如本文中所述,术语“多核苷酸”和“寡核苷酸”可互换使用,并且意指核苷酸的单链和双链聚合物,包括但不限于通过核苷酸间磷酸二酯键连接(例如,3’-5’和2’-5’、反向连接例如3’-3’和5’-5’)的2’-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA)、分支结构或核酸类似物。多核苷酸具有伴随的抗衡离子例如H+、NH4 +、三烷基铵、Mg2+、Na+等。寡核苷酸可完全由脱氧核糖核苷酸,完全由核糖核苷酸组成或为其嵌合混合物。寡核苷酸可由核碱基和糖类似物组成。多核苷酸通常在大小上从少数单体单位例如(5-40)(此时它们在本领域中更常见地被称为寡核苷酸)变化至几千个单体核苷酸单位(此时它们在本领域更常见地被称为多核苷酸);然而,为了本发明的目的,寡核苷酸和多核苷酸都可具有任何适当的长度。除非另有所指,否则无论何时显示寡核苷酸序列,应当理解核苷酸以5’至3’的顺序从左至右显示,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,“T”表示胸苷,“U’表示尿苷。寡核苷酸被认为具有“5’末端”和“3’末端”,因为单核苷酸通常通过一个核苷酸的5’磷酸或等同基团至其相邻核苷酸的3’羟基或等同基团的连接(任选地通过磷酸二酯键或其它适当的连接)进行反应而形成寡核苷酸。
如本文中所述,术语“切口平移”及其变型包括将核酸链内的一个或多个切口或缺口沿着核酸平移至新位置。在一些实施方案中,当双链接头被连接至双链扩增的靶序列时,切口可形成。在一个实例中,引物可在其5’末端包含可连接至双链扩增的靶序列、从而在互补链中在接头与扩增的靶序列之间留下切口的磷酸基团。在一些实施方案中,切口平移导致切口至核酸链的3’末端的移动。在一些实施方案中,移动切口可包括接头连接的扩增的靶序列进行切口平移反应。在一些实施方案中,切口平移反应可以是偶联的5’至3’DNA聚合/降解反应,或被偶联至5’至3’DNA聚合/链置换反应。在一些实施方案中,移动 切口可包括在切口位置进行DNA链延伸反应。在一些实施方案中,移动切口可包括对切口进行单链外切核酸酶反应以形成接头连接的扩增的靶序列的单链部分,和对接头连接的扩增的靶序列的单链部分进行DNA链延伸反应至新的位置。在一些实施方案中,切口在与连接的位置相对的核酸链中形成。
如本文中所述,术语“聚合酶链式反应”(“PCR”)是指K.B.Mullis美国专利号4,683,195和4,683,202(通过引用并入本文)的方法,其描述了用于在基因组DNA的混合物中增加目标多核苷酸的区段的浓度而无需克隆或纯化的方法。该用于扩增目标多核苷酸的方法由如下步骤组成:将大量过量的两个寡核苷酸引物引入包含期望的目标多核苷酸的DNA混合物,随后在DNA聚合酶存在的情况下进行精确的一系列热循环。两个引物与目标双链多核苷酸的其各自的单链互补。为了进行扩增,将混合物变性,随后使引物与目标多核苷酸分子内的其互补序列退火。退火后,引物通过聚合酶延伸以形成新的一对互补链。可多次重复变性、引物退火和聚合酶延伸的步骤(即,变性、退火和延伸组成一个“循环”;可存在许多“循环”)来获得高浓度的期望的目标多核苷酸的扩增区段。期望的目标多核苷酸的扩增区段(扩增子)的长度可通过引物彼此相对的相对位置来确定,因此,该长度是个可控制参数。由于重复该过程的原因,该方法称为“聚合酶链式反应”(下文中称为“PCR”)。因为目标多核苷酸的期望的扩增区段在混合物中成为主要核酸序列(在浓度上),因此它们被称作“PCR扩增的”。如本文中所定义,包含多个靶核酸分子的样品内的靶核酸分子是通过PCR扩增的。在对上述方法的改进中,可使用多个不同的引物对(在一些情况下,每目标靶核酸分子一个或多个引物对,从而形成多重PCR反应)来PCR扩增靶核酸分子。通过使用多重PCR,可能从样品同进扩增多个目标核酸分子来形成扩增的靶序列。还可能通过几个不同的方法(例如,利用生物分析仪或qPCR定量,利用标记探针杂交;掺入生物素化引物,随后进行抗生物素蛋白-酶缀合物检测;将32P-标记的脱氧核苷酸三磷酸例如dCTP或dATP掺入扩增的靶序列)来检测扩增的靶序列。可利用 适当的引物组扩增任何寡核苷酸序列,从而允许从基因组DNA、cDNA、***固定的石蜡包埋的DNA、细针活检组织和各种其它来源扩增靶核酸分子。具体地,通过本文中公开的多重PCR产生的扩增的靶序列自身是用于随后的PCR扩增或各种下游测定或操作的高效底物。
如本文中所定义,“多重扩增”是指使用至少一个靶特异性引物进行的样品内两个或更多个靶序列的选择性和非随机扩增。在一些实施方案中,进行多重扩增,以便在单个反应容器中扩增一些或所有靶序列。给定的多重扩增的“重数(plexy)”或“重(plex)”通常是指在该单个多重扩增过程中扩增的不同的靶特异性序列的数目。在一些实施方案中,重可以是约12-重、24-重、48-重、96-重、192-重、384-重、768-重、1536-重、3072-重、6144-重或更多重。
在一些实施方式中,本公开内容总地来说涉及确定一个或多个样品的拷贝数变异的方法。在一些实施方式中,本方法包括确定存在于样品中的一个或多个基因的拷贝数变异。在一些实施方式中,本方法包括通过确定基因丢失和/或基因重复来确定一个或多个基因的拷贝数变异。在一些实施方式中,本方法包括确定存在于样品中的一个或多个染色体的拷贝数变异。在一些实施方式中,本方法包括确定相同样品中的一个或多个基因的拷贝数变异和一个或多个染色体的拷贝数变异。在一些实施方式中,确定拷贝数变异的方法可包括鉴定一个或多个样品中的染色体丢失、染色体***和/或染色体重复。在一些实施方式中,拷贝数变异包括确定样品中非整倍性的存在。在一些实施方式中,拷贝数变异包括鉴定样品的杂合性的丢失。在一些实施方式中,确定拷贝数变异的方法可以包括同时确定一个或多个样品的拷贝数变异。在一些实施方式中,本方法包括使用基于ISFET的测序方法确定一个或多个样品的拷贝数变异。在一些实施方式中,本方法包括同时确定一个或多个样品中的一个或多个染色体的染色体丢失、染色体***和/或染色体重复。
在一些实施方式中,确定拷贝数变异的方法包括通过下列步骤扩 增样品中的多个不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割所述可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列产生一个或多个接头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列;对至少一个扩增的接头连接的靶序列进行测序;计算所述至少一个扩增的接头连接的靶序列的测序读取(sequencing read)的数目;和确定所述至少一个扩增的接头连接的靶序列的拷贝数变异。
在一些实施方式中,本方法包括通过下列步骤扩增两个或更多个样品中的多个不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割所述可切割基团;通过将至少一个不同的条码接头连接至来自每个样品的至少一个扩增的靶序列产生一个或多个条码接头连接的扩增的靶序列;使用引物再扩增来自每个样品的所述至少一个条码接头连接的扩增的靶序列;对来自每个样品的至少一个扩增的接头连接的扩增的靶序列进行测序;计算来自每个样品的所述至少一个扩增的接头连接的靶序列的测序读取的数目;和确定每个样品的所述至少一个扩增的接头连接的靶序列的拷贝数变异。
在一些实施方式中,确定染色体拷贝数变异的方法包括通过下列步骤扩增样品中的多个不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述 扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割所述可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列产生一个或多个接头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列;对至少一个扩增的接头连接的靶序列进行测序;计算所述至少一个扩增的接头连接的靶序列的测序读取的数目;和确定所述至少一个扩增的接头连接的靶序列的染色体拷贝数变异。
一般地,确定拷贝数变异的方法包括从样品扩增多个不同的靶序列。在一些实施方式中,不同的靶序列包括侧翼于单核苷酸多态性(SNP)的一个或多个核酸序列。从而,侧翼于SNP的靶序列的扩增导致对应于SNP的核酸序列的扩增,因此导致测序步骤中SNP的鉴定。因此,在一些实施方式中,本方法包括从一个或多个样品鉴定一个或多个单核苷酸多态性。
因此,鉴定样品中的一个或多个SNP的方法包括通过下列步骤扩增样品中的侧翼于一个或多个SNP的多个不同的靶序列:在单一扩增反应混合物中产生侧翼于一个或多个SNP的多个不同的扩增的靶序列,将侧翼于一个或多个SNP的多个不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物的至少一个和扩增的靶序列的至少一个包括可切割基团和对应于一个或多个SNP的核酸序列,并且其中所述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列而产生一个或多个接头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列;对至少一个扩增的接头连接的靶序列进行测序;计算至少一个扩增的接头连接的靶序列的测序读取的数目;和确定一个或多个SNP在一个或多个扩增的接头连接的靶序列中的存在。
在一些实施方式中,一个或多个扩增的接头连接的靶序列的测序包括本领域普通技术人员已知的任何适用的方法或平台。在一些实施 方式中,测序可以包括ISFET,基于离子的或基于桥式PCR的测序。在一些实施方式中,测序可以包括测序平台,例如Ion TorrentProtonTM或PGMTM平台(Life Technologies,CA,Catalog No.4462917)。在一些实施方式中,测序平台可以任选地包括进行本方法的另外的步骤的软件,例如计算测序读取的数目和/或确定拷贝数变异。
在一些实施方式中,计算一个或多个扩增的接头连接的靶序列的测序读取的数目可以包括本领域普通技术人员已知的任何方法。通常而言,每个扩增的接头连接的靶序列的测序读取的数目被报告为:每个扩增的接头连接的靶序列的总的映射的测序读取的数目。在一些实施方式中,本方法可包括计算测序运行中的每个扩增的接头连接的靶序列的测序读取的数目。在一些实施方式中,本方法可包括计算一组选择的扩增的接头连接的靶序列的测序读取的数目,例如与特异性基因组坐标或基因相关的映射的测序读取的数目。在一些实施方式中,本方法可包括计算来自一个或多个样品的一个或多个扩增的接头连接的靶序列的测序读取的数目,例如配对的遗传样品;来自不同来源的样品,例如水来源和食品来源;或来自不同个体或动物的样品,例如亲代样品和子代样品。通常而言,样品包含足够的遗传材料,以进行所述一个或多个不同靶序列的扩增。在一些实施方式中,所述样品可包括单个细胞,从单个细胞提取的DNA,或分离自循环的肿瘤细胞的DNA。例如,根结本文的方法,可以在测定例如Ion Torrent Hotspot Mutation PanelTM(Life Technologies,CA,Catalog No.4471262),the Comprehensive Cancer PanelTM(Life Technologies,CA,Catalog No.4477685),or the Inherited Disease Panel(Life Technologies,CA,Catalog No.447686)中使用基因组DNA或***固定的石蜡包埋的(FFPE)DNA,在进行了扩增和接头连接步骤之后,在测序平台例如Ion Torrent ProtonTM或PGMTMplatform(LifeTechnologies,CA,Catalog No.4462917)上对文库进行测序。然而,在本文公开的方法中可以使用任何能够计算每个扩增子的映射的读取数目的测序平台。
测序平台的数据输出可以任选地以这样的方式来过滤以使操作者能够选择一个或多个扩增的接头连接的靶序列来进行拷贝数测定。在一些实施方式中,测序平台的数据输出可以任选地被过滤以选择一个或多个扩增的接头连接的靶序列以进行拷贝数测定,这通过计算每个选择的扩增的接头连接的靶序列的测序读取的数目来进行。在一些实施方式中,跨多个样品提供选择的扩增的接头连接的靶序列的测序读取的数目,例如通过使用多个条码化的文库。在一些实施方式中,选择的扩增的接头连接的靶序列与一个或多个目标基因相关。在其它实施方式中,测序平台的数据输出可以任选地被过滤以计算与已知的病症或疾病相关的一个或多个扩增的接头连接的靶序列的测序读取的数目。在一些实施方式中,测序平台的数据输出可以被过滤以计算与癌症或遗传疾病相关的基因的测序读取的数目,例如通过使用Ion AmpliseqTM Inherited Disease Panel(Life Technologies,CA,Catalog No.4477686)或Ion AmpliseqTM Comprehensive Cancer Panel(LifeTechnologies,CA,Catalog No.4477685)和Ion Torrent Suite软件。在一些实施方式中,输出可以任选地被配置为计算跨基因组的一个或多个扩增的接头连接的靶序列(通过例如染色体坐标或基因坐标作图的)的测序读取的数目。
在一些实施方式中,本公开内容的扩增的接头连接的靶序列对应于与一个或多个基因或染色体相关的扩增子。在一些实施方式中,为每个目标基因或染色体制备多个扩增子。在一些实施方式中,扩增子跨基因的编码区和/或UTR区。在一些实施方式中,扩增的接头连接的靶序列被设计为沿着基因或遍及基因的长度在交错的或常规相间的间隔发生。在一些实施方式中,扩增的接头连接的靶序列被设计为跨基因组的每个染色体的间隔发生。在一些实施方式中,扩增的接头连接的靶序列被设计为与相同样品中的另一个扩增的接头连接的靶序列不重叠。在一些实施方式中,扩增的接头连接的靶序列被设计为扩增与肿瘤相关的基因。用于本公开的方法的靶标特异性引物的实例包括来自Hotspot MutationPanelTM,Inherited Disease PanelTM和 Comprehensive Cancer PanelTM的引物库,都可从Life Technologies,CA商购获得。
在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:确定扩增的接头连接的靶序列的总的映射的测序读取的数目。在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:确定相对于同一个测序运行中获得的总的映射的测序读取的数目,扩增的接头连接的靶序列的总的映射的测序读取的数目。在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:将扩增的接头连接的靶序列的总的映射的测序读取除以测序运行中获得的总的映射的测序读取,乘以100,以获得“百分率频率”。例如,相对于单一测序运行中等于100的总的映射测序读取(包括扩增子A、B、C、D和E),单个扩增的接头连接的靶序列的等于1的总的映射的测序读取(扩增子A)将对应于1%的频率。在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:确定在指定阈值之上的对于扩增的接头连接的靶序列获得的测序读取的数目。在一些情况下,所述阈值可以包括人工阈值,例如大于40个总的映射的读取/扩增的接头连接的靶序列,或大于0.5百分率频率。
在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:一个样品中的扩增的接头连接的靶序列的总的映射的测序读取的数目除以第二样品中的相同的扩增的接头连接的靶序列的总的映射的测序读取的数目,以产生“百分率比率”。
在一些实施方式中,样品之一是参考样品,其不含拷贝数变异(即,是正常DNA样品)。在一些实施方式中,样品之一是参考样品,其不含基因或染色体拷贝数变异。在一些实施方式中,第二样品是目标样品,其基因拷贝数变异或染色体拷贝数变异是待确定的。在一些实施方式中,每个样品可以是目标样品,其基因拷贝数变异或染色体拷贝数变异是待测的(在不存在参考样品的情况下)。例如,已知基因ERBB2在一些形式的结肠癌中是高度重复的。含有高水平的ERBB2重复的 样品可以使用本文的方法被鉴定为具有拷贝数变异(见图39A和图39B)。在该情况下,发现位于ERBB2内的几个扩增的接头连接的靶序列的总的映射的测序读取的数目相对于同一测序运行中位于ERBB2邻近位置的其它基因显著较高(高20倍)。因此,无需参考样品,操作者能够直接从测序输出确定哪些扩增的接头连接的靶序列显著升高(或降低)。
在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目还可以包括:确定一个或多个扩增的接头连接的靶序列的百分率比率的以2为底的对数比率。一般地,为了确定扩增的接头连接的靶序列的以2为底的对数比率,将第一样品中的扩增的接头连接的靶序列的映射的测序读取的总数目与第二样品中相同的扩增的接头连接的靶序列的映射的测序读取的总数目进行比较,以获得百分率比率。然后使用已经确定的百分率比率计算每个扩增的接头连接的靶序列的以2为底的对数比率(log2比率)。例如,将来自样品1的扩增的接头连接的靶序列(扩增子A)的映射的测序读取的总数目与来自不同样品(样品2)的相同的扩增的接头连接的靶序列(扩增子A)的映射的测序读取的总数目进行比较以计算百分率比率。然后使用每个扩增的接头连接的靶序列的百分率比率计算以2为底的对数。在一些实施方式中,可以将log2比率跨一个或多个基因、跨染色体和/或跨基因组作图。在该实施方式中,每个log2比率对应于每个扩增的接头连接的靶序列相对于来自另一个样品的对应的扩增的接头连接的靶序列的标准化。当比较肿瘤样品的测序数据与匹配的正常组织样品的测序数据时,或者当比较遗传上相关个体例如祖父母、父母和/或子女时,或者当比较来自不同细胞系的细胞时,log2比率的图是特别有用的可视化工具,因为它提供了容易的可视形式,通过它鉴定无关项,因此,鉴定哪些扩增的接头连接的靶序列在目标样品中是过度代表的或代表不足的。
在一些实施方式中,可以使用本文公开的方法测定样品的拷贝数变异。在一些实施方式中,拷贝数变异可以包括染色体变异和/或等位基因变异,使用本文公开的一个或多个方法。在一些实施方式中,可 以使用公开的方法对一个或多个样品进行核型分型。在一些实施方式中,可以使用公开的方法测定两个或更多个样品的拷贝数变异,染色体变异和/或等位基因变异。在一些实施方式中,可以使用公开的方法测定样品的杂合性的丢失。在一些实施方式中,两个样品可以包括:(a)1个参考样品和1个目标样品;(b)2个参考样品;(c)2个目标样品;或(d)单个样品的一式两份。在其它实施方式中,可以同时测定三个或更多个样品的拷贝数变异、染色体变异和/或等位基因变异。任选地,样品之一可以包括参考样品。在一些实施方式中,参考样品可以包括已知的遗传内容,或包括含有正常拷贝数的一个或多个基因或染色体的对照样品。在一些实施方式中,对照样品可以包括一个或多个基因或染色体的正常拷贝数,因此,可用于与一个或多个目标样品进行对比。此处,如果目标样品产生与正常的对照样品实质上相似的log2比率或百分率频率,则可以得出结论:目标样品含有正常拷贝数的存在于对照样品中的该一个或多个基因和/或染色体。
在一些实施方式中,对照样品可以包括异常拷贝数的一个或多个目标基因或染色体,并且可用于与目标样品进行比较。在该情况下,如果目标样品产生与异常的对照样品实质上相似的log2比率或百分率频率,则可以得出结论:目标样品含有异常拷贝数的存在于该异常对照样品中的该一个或多个基因和/或染色体。
在一些实施方式中,异常对照样品可以包括一种或多种形式的非整倍性。在一些实施方式中,异常对照样品可以包括三体性,例如三体性8,三体性9,三体性13,三体性16,三体性18,三体性21和/或三体性22。在一些实施方式中,异常对照样品可以包括性染色体的非整倍性,例如XO(Turner氏综合征),XXX(三X综合征);XXXX(四X综合征),XXXXX(五X综合征),XXY(klinefelter氏综合征),XXYY,XXXY,XXYYY,XXXYY,XXXXY,XYY(XYY综合征),XYYY和/或XYYYY。
在一些实施方式中,目标样品可以包括一种或多种形式的非整倍性。在一些实施方式中,目标样品可以包括三体性,例如三体性8, 三体性9,三体性13,三体性16,三体性18,三体性21和/或三体性22。在一些实施方式中,目标样品可以包括性染色体的非整倍性,例如XO(Turner氏综合征),XXX(三X综合征);XXXX(四X综合征),XXXXX(五X综合征),XXY(klinefelter氏综合征),XXYY,XXXY,XXYYY,XXXYY,XXXXY,XYY(XYY综合征),XYYY和/或XYYYY。在一些实施方式中,目标样品可以包括杂合性的丢失。在一些实施方式中,目标样品可以包括来自相关或不相关的遗传来源的多个DNA样品。
在一些实施方案中,本公开内容总地来说涉及用于在一群核酸分子中的一个或多个靶核酸分子的选择性扩增中,避免或减少扩增假象(例如,引物二聚体)的形成的方法、组合物、***、装置和试剂盒。
在一些实施方案中,本公开内容总地来说涉及从一群核酸分子扩增多个靶特异性序列。在一些实施方案中,方法包括使一个或多个靶特异性引物对与靶序列杂交,延伸引物对的第一引物,使来自一群核酸分子的延伸的第一引物产物变性,将延伸的第一引物产物与引物对的第二引物杂交,延伸第二引物以形成双链产物,将靶特异性引物对从双链产物消化掉以产生多个扩增的靶序列。在一些实施方案中,消化包括从扩增的靶序列部分消化一个或多个靶特异性引物。在一些实施方案中,可将扩增的靶序列连接至一个或多个接头。在一些实施方案中,接头可包含一个或多个DNA条形码或标签序列。在一些实施方案中,扩增的靶序列一旦被连接至接头,就可经历切口平移反应和/或再次扩增以产生接头连接的扩增的靶序列的文库。
在一些实施方案中,本公开内容总地来说涉及多个靶特异性扩增子的制备和形成。在一些实施方案中,方法包括将一个或多个靶特异性引物对与核酸分子杂交,延伸引物对的第一引物,将延伸的第一引物与核酸分子变性,将引物对的第二引物与延伸的第一引物产物杂交,延伸第二引物,消化靶特异性引物对以产生多个靶特异性扩增子。在一些实施方案中,可将接头连接至靶特异性扩增子的末端,随后进行切口平移反应以产生多个适合用于核酸测序的靶特异性扩增子。在一 些实施方案中,可使用桥式扩增或emPCR来扩增一个或多个靶特异性扩增子,以产生多个适合用于核酸测序的克隆性模板。在一些实施方案中,本公开内容总地来说涉及用于制备靶特异性扩增子文库,用于多种下游处理或测定例如核酸测序或克隆性扩增的方法。在一个实施方案中,本公开内容涉及使用具有可切割基团的引物在具有多个靶序列的核酸样品上进行靶特异性多重PCR的方法。
在一个实施方案中,可使用本文中概述的靶特异性扩增技术,从一群核酸分子制备待使用Ion Torrent PGMTM或Ion Torrent ProtonTM***测序的核酸模板。任选地,在靶特异性扩增后,可进行第二和/或第三扩增法,包括但不限于文库扩增步骤和/或克隆性扩增步骤例如emPCR。
在一些实施方案中,本公开内容涉及包含多个靶特异性引物对的组合物,每一个引物对包含具有至少一个可切割基团的正向引物和反向引物,所述可切割基团位于a)3’末端或5’末端,和/或b)位于靶特异性引物的中央核苷酸位置周围,并且其中靶特异性引物对可基本上不与组合物中的其它引物对互补。在一些实施方案中,组合物包含至少1000,2000,3000,4000,6000,9000,12000或更多个靶特异性引物对。在一些实施方案中,靶特异性引物对在长度上包含约15个核苷酸至约40个核苷酸,其中至少一个核苷酸被可切割基团替代。在一些实施方案中,可切割基团可以是尿苷核苷酸。在一些实施方案中,靶特异性引物组被设计来扩增与临床或病理病况相关的外显子、基因、外显子组或基因组的区域,例如,与癌症例如结肠癌相关的一个或多个单核苷酸突变(SNP)的扩增,或与遗传病例如囊性纤维化相关的突变的扩增。在一些实施方案中,靶特异性引物对,当与靶序列杂交和如本文中所述扩增时,可产生在长度上为约100至约500个碱基的接头连接的扩增的靶序列的文库。在一些实施方案中,没有一个接头连接的扩增的靶序列在文库中过表达超过30%(相较于文库中的其余接头连接的扩增的靶序列)。在一些实施方案中,接头连接的扩增的靶序列文库在GC含量、扩增的靶序列长度或熔解温度(Tm)上基本上是同质的。
在一些实施方案中,本公开内容总地来说涉及用于进行多重PCR的试剂盒,其包括多个具有可切割基团的靶特异性引物、DNA聚合物、接头、dATP、dCTP、dGTP和dTTP。在一些实施方案中,可切割基团可以是尿嘧啶核苷酸。试剂盒还可包括一种或多种抗体、核酸条形码、纯化溶液或柱子。
在一些实施方案中,本公开内容涉及用于产生靶特异性扩增子文库的试剂盒,其包括多个具有可切割基团的靶特异性引物、DNA聚合酶、接头,dATP,dCTP,dGTP,dTTP和切割试剂。在一些实施方案中,试剂盒还包括一种或多种抗体、核酸条形码、纯化溶液或柱子。
在一个实施方案中,本公开内容总地来说涉及从单个核酸来源或样品扩增多个靶特异性序列。在另一个实施方案中,本公开内容总地来说涉及从两个或更多个核酸来源、样品或物种靶特异性扩增两个或更多个靶序列。例如,根据本公开内容预期单个核酸样品可包括基因组DNA或***固定的石蜡包埋的(FFPE)DNA。还预期样品可来自单个个体、来自遗传上相关的成员的核酸样品的集合、来自遗传上无关的成员的多个核酸样品、来自单个个体的多个核酸样品(匹配的)例如肿瘤样品和正常组织样品,或来自单个来源(其包含两种不同形式的遗传物质例如获自母亲受试者的母亲和胎儿DNA)的遗传物质,或在包含植物或动物DNA的样品中的存在污染性细菌DNA。在一些实施方案中,核酸物质的来源可包括获自新生儿的核酸,例如通常作为新生儿筛查的血液样品获得的。在一些实施方式中,核酸材料的来源可以包括单个细胞,因此基因组的单一拷贝。
核酸样品可包括高分子量材料例如基因组DNA或cDNA。样品可包括低分子量材料例如获自FFPE或存档的DNA样品的核酸分子。在另一个实施方案中,低分子量材料包括酶促或机械剪切的DNA。样品可包括无细胞的循环DNA例如获自母亲受试者的材料。在一些实施方案中,样品可包括获自生物活检组织、肿瘤、刮片、拭子、血液、粘液、尿、血浆、***、头发、激光捕获显微切割、手术切除以及其它临床或实验室获得的样品的核酸分子。在一些实施方案中,样品可 以是流行病学、农业、法医或病原性样品。
在一些实施方案中,样品可包括获自动物例如人或哺乳动物来源的核酸分子。在另一个实施方案中,样品可包括获自非哺乳动物来源例如植物、细菌、病毒或真菌的核酸分子。在一些实施方案中,核酸分子的来源可以是存档的或灭绝的样品或物种。
在一些实施方案中,本公开内容总地来说涉及正常或患病组织、活检组织、核心、肿瘤或其它样品的至少一个靶序列的选择性扩增。在一些实施方案中,本公开内容总地来说涉及至少一个靶序列的选择性扩增以及患病组织、核心、活检组织或肿瘤样品中的突变的检测和/或鉴定。在一些实施方案中,患病或正常样品可包括完整基因组DNA、***固定的石蜡包埋的组织(FFPE)、剪切的或酶促处理的DNA。在一些实施方案中,本公开内容涉及至少一个靶序列的选择性扩增和临床上可控告的突变的检测和/或鉴定。在一些实施方案中,本公开内容涉及与药物抗性或药物敏感性相关的突变的检测和/或鉴定。在一些实施方案中,本公开内容总地来说涉及与器官移植或器官排斥相关的遗传标志的鉴定和/或定量。
在一些实施方案中,本公开内容总地来说涉及无细胞的循环DNA中的至少一个靶序列的选择性扩增。在一些实施方案中,样品中至少一个靶序列的选择性扩增包括不同核酸分子的混合物。选择性扩增可任选地伴随在循环DNA中观察到的突变的检测和/或鉴定。在一些实施方案中,选择性扩增可任选地伴随与癌症或遗传病例如代谢性、神经肌肉性、发育性、心血管性、自身免疫性或其它遗传性障碍相关的突变的检测和/或鉴定。
在一些实施方案中,靶特异性引物和引物对是能扩增核酸分子的特定区域的靶特异性序列。在一些实施方案中,靶特异性引物可扩增基因组DNA或cDNA。在一些实施方案中,靶特异性引物可扩增哺乳动物DNA例如人DNA。在一些实施方案中,选择性扩增所需的DNA的量可以为约1ng至1微克。在一些实施方案中,一个或多个靶序列的选择性扩增所需的DNA的量可以为约1ng、约5ng或约10ng。 在一些实施方案中,靶序列的选择性扩增所需的DNA的量是约10ng至约200ng。
在一些实施方案中,至少一个靶序列的选择性扩增还包括扩增的靶序列的核酸测序。任选地,方法还包括检测和/或鉴定存在于样品中的通过扩增的靶序列的核酸测序鉴定的突变。
在一些实施方案中,靶序列或扩增的靶序列针对与癌症相关的突变。在一些实施方案中,靶序列或扩增的靶序列针对与一种或多种选自如下癌症的癌症相关的突变:头颈癌、脑癌、乳腺癌、卵巢癌、***、结直肠癌、子宫内膜癌、胆囊癌、胃癌、膀胱癌、***癌、睾丸癌、肝癌、肺癌、肾(肾细胞)癌、食管癌、胰腺癌、甲状腺癌、胆管癌、垂体瘤、肾母细胞瘤、卡波西肉瘤、骨肉瘤、胸腺癌、皮肤癌、心脏癌、口癌和喉癌、白血病、神经母细胞瘤和非何杰金氏淋巴瘤。在一个实施方案中,突变可包括置换、***、倒位、点突变、缺失、错配和易位。在一个实施方案中,突变可包括拷贝数的变化。在一个实施方案中,突变可包括种系或体细胞突变。在一个实施方案中,与癌症相关的突变位于的表1或4(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的或美国申请号61/598,881(通过引用整体并入本文)的表7中提供的基因的至少一个中。在一些实施方案中,突变可以是表18(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的或美国申请61/598,881(通过引用整体并入本文)的表7中提供的基因组坐标中任一项。在一些实施方案中,针对与癌症相关的突变的靶序列可包括表10(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的突变的任一个或多个。在一些实施方案中,突变可发现于表16或表18(二者见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的基因组坐标的任一个或多个内。
在一些实施方案中,与癌症相关的突变位于选自如下基因的基因的至少一个中:ABI1;ABL1;ABL2;ACSL3;ACSL6;AFF1;AFF3; AFF4;AKAP9;AKT1;AKT2;ALK;APC;ARHGAP26;ARHGEF12;ARID1A;ARNT;ASPSCR1;ASXL1;ATF1;ATIC;ATM;AXIN2;BAP1;BARD1;BCAR3;BCL10;BCL11A;BCL11B;BCL2;BCL3;BCL6;BCL7A;BCL9;BCR;BIRC3;BLM;BMPR1A;BRAF;BRCA1;BRCA2;BRD3;BRD4;BRIP1;BUB1B;CARD11;CARS;CASC5;CBFA2T3;CBFB;CBL;CBLB;CBLC;CCDC6;CCNB1IP1;CCND1;CCND2;CD74;CD79A;CDC73;CDH1;CDH11;CDK4;CDK6;CDKN2A;CDKN2B;CDKN2C;CDX2;CEBPA;CEP110;CHEK1;CHEK2;CHIC2;CHN1;CIC;CIITA;CLP1;CLTC;CLTCL1;COL1A1;CREB1;CREB3L2;CREBBP;CRTC1;CRTC3;CSF1R;CTNNB1;CXCR7;CYLD;CYTSB;DCLK3;DDB2;DDIT3;DDR2;DDX10;DDX5;DDX6;DEK;DGKG;DICER1;DNMT3A;EGFR;EIF4A2;ELF4;ELL;ELN;EML4;EP300;EPS15;ERBB2;ERBB4;ERC1;ERCC2;ERCC3;ERCC4;ERCC5;ERG;ETV1;ETV4;ETV5;ETV6;EWSR1;EXT1;EXT2;EZH2;FAM123B;FANCA;FANCC;FANCD2;FANCE;FANCF;FANCG;FAS;FBXW7;FCRL4;FGFR1;FGFR1OP;FGFR2;FGFR3;FH;FIP1L1;FLCN;FLI1;FLT1;FLT3;FNBP1;FOXL2;FOXO1;FOXO3;FOXO4;FOXP1;FUS;GAS7;GATA1;GATA2;GATA3;GMPS;GNAQ;GNAS;GOLGA5;GOPC;GPC3;GPHNGPR124;HIP1;HIST1H4I;HLF;HNF1A;HNRNPA2B1;HOOK3;HOXA11;HOXA13;HOXA9;HOXC11;HOXC13;HOXD13;HRAS;HSP90AA1;HSP90AB1;IDH1;IDH2;IKZF1;IL2;IL21R;IL6ST;IRF4;ITGA10;ITGA9;ITK;JAK1;JAK2;JAK3;KDM5A;KDM5C;KDM6A;KDR;KDSR;KIAA1549;KIT;KLF6;KLK2;KRAS;KTN1;LASP1;LCK;LCP1;LHFP;LIFR;LMO2;LPP;MAF;MALT1;MAML2;MAP2K1;MAP2K4;MDM2;MDM4;MECOM;MEN1;MET;MITF;MKL1;MLH1;MLL;MLLT1;MLLT10;MLLT3;MLLT4;MLLT6;MN1;MPL;MRE11A; MSH2;MSH6;MSI2;MSN;MTCP1;MTOR;MUC1;MYB;MYC;MYCL1;MYCN;MYH11;MYH9;MYST3;MYST4;NACA;NBN;NCOA1;NCOA2;NCOA4;NEK9;NF1;NF2;NFE2L2;NFKB2;NIN;NKX2-1;NLRP1;NONO;NOTCH1;NOTCH2;NPM1;NR4A3;NRAS;NSD1;NTRK1;NTRK3;NUMA1;NUP214;NUP98;OLIG2;OMD;PAFAH1B2;PALB2;PATZ1;PAX3;PAX5;PAX7;PAX8;PBRM1;PBX1;PCM1;PDE4DIP;PDGFB;PDGFRA;PDGFRB;PER1;PHOX2B;PICALM;PIK3CA;PIK3R1;PIM1;PLAG1;PML;PMS1;PMS2;POU2AF1;POU5F1;PPARG;PPP2R1A;PRCC;PRDM16;PRF1;PRKAR1A;PRRX1;PSIP1;PTCH1;PTEN;PTPN11;RABEP1;RAD50;RAD51L1;RAF1;RANBP17;RAP1GDS1;RARA;RB1;RBM15;RECQL4;REL;RET;RHOH;RNF213;ROS1;RPN1;RPS6KA2;RUNX1;RUNX1T1;SBDS;SDHAF2;SDHB;SETD2;SFPQ;SFRS3;SH3GL1;SLC45A3;SMAD4;SMARCA4;SMARCB1;SMO;SOCS1;SRC;SRGAP3;SS18;SS18L1;STIL;STK11;STK36;SUFU;SYK;TAF15;TAF1L;TAL1;TAL2;TCF12;TCF3;TCL1A;TET1;TET2;TEX14;TFE3;TFEB;TFG;TFRC;THRAP3;TLX1;TLX3;TMPRSS2;TNFAIP3;TOP1;TP53;TPM3;TPM4;TPR;TRIM27;TRIM33;TRIP11;TSC1;TSC2;TSHR;USP6;VHL;WAS;WHSC1L1;WRN;WT1;XPA;XPC;ZBTB16;ZMYM2;ZNF331;ZNF384和ZNF521。
在一些实施方案中,与癌症相关的突变位于选自如下基因的至少一个基因中:ABL1;AKT1;ALK;APC;ATM;BRAF;CDH1;CDKN2A;CSF1R;CTNNB1;EGFR;ERBB2;ERBB4;FBXW7;FGFR1;FGFR2;FGFR3;FLT3;GNAS;HNF1A;HRAS;IDH1;JAK2;JAK3;KDR;KIT;KRAS;MET;MLH1;MPL;NOTCH1;NPM1;NRAS;PDGFRA;PIK3CA;PTEN;PTPN11;RB1;RET;SMAD4;SMARCB1;SMO;SRC;STK11;TP53和VHL。
在一些实施方案中,扩增的靶序列针对表18(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的基因组坐标的任一个或多个。在一些实施方案中,表2、3或17(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的癌症靶特异性引物的任一个或多个可用于扩增存在于样品中的通过本文中描述的方法公开的靶序列。
在一些实施方案中,来自表2、3或17(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的癌症靶特异性引物可包括2,3,4,5,6,7,8,9,10,20,40,60,80,100,150,200,400,500,800,1000,2000,3000,4000,5000,6000,7000,8000,9000,10,000,11,000,12,000,13,000或更多个靶特异性引物。在一些实施方案中,扩增的靶序列可包括在表10或18(二者见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的基因组坐标上产生(使用扩增子ID靶特异性引物)的扩增的靶序列的任一个或多个。在一些实施方案中,与癌症相关的靶特异性引物的至少一个与至少一个选自SEQ ID NO:1-103、143的核酸序列具有90%的同一性。在一些实施方案中,与癌症相关的靶特异性引物的至少一个在其整个长度上与样品中的至少一个靶序列互补。在一些实施方案中,与癌症相关的靶特异性引物的至少一个在3’末端包含非可切割核苷酸。在一些实施方案中,在3’末端上的非可切割核苷酸包括末端3’核苷酸。在一个实施方案中,扩增的靶序列针对具有与癌症相关的突变的单个外显子。在一些实施方案中,本公开内容总地来说涉及样品中超过一个靶序列的选择性扩增和与癌症相关的突变的检测和/或鉴定。在一些实施方案中,扩增的靶序列包含表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的两个或更多个核苷酸序列。在一些实施方案中,扩增的靶序列可包含使用表18(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的或美国申请61/598,881(通过引用整体并入本文)的表7中提供的扩增子ID靶特异性引物在基因组坐标上产生的任一个或多 个扩增的靶序列。在一个实施方案中,扩增的靶序列包括来自美国申请61/598,881(通过引用整体并入本文)的表1-5或表6和7的100,200,500,1000,2000,3000,6000,8000,10,000,12,000或更多个扩增子,另见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文。在一些实施方案中,本公开内容总地来说涉及临床上可控告的突变的检测和任选地鉴定。如本文中所述,术语“临床上可控告的突变”包括本领域技术人员已知的或可与(但不限于)癌症治疗的预后相关的突变。在一个实施方案中,癌症治疗的预后包括鉴定与癌症对药物、药物组合或治疗方案的应答或无应答相关的突变。在一个实施方案中,本公开内容总地来说涉及从一群核酸分子扩增多个与癌症的发作、进展或好转关联或相关的靶序列。
在一些实施方案中,使用本文中公开的引物标准设计靶特异性引物。在一些实施方案中,使用本文中公开的引物标准设计靶特异性引物,并且所述引物针对与乳腺癌相关的一个或多个基因。在一些实施方案中,与乳腺癌相关的靶特异性引物包括至少一个选自一个或多个基因的靶特异性引物,所述基因选自:AIM1、AR、ATM、BARD1、BCAS1、BRIP1、CCND1、CCND2、CCNE1、CDH1、CDK3,CDK4,CDKN2A、CDKN2B、CAMK1D、CHEK2、DIRAS3、EGFR、ERBB2、EPHA3、ERBB4、ETV6、GNRH1、KCTD9、CDCA2、EBF2、EMSY、BNIP3L、PNMA2、DPYSL2、ADRA1A、STMN4、TRIM35、PAK1、AQP11、CLSN1A、RSF1、KCTD14、THRSP、NDUFC2、ALG8、KCTD21、USP35、GAB2、DNAH9、ZNF18、MYOCD、STK11、TP53、JAK1、JAK2、MET、PDGFRA、PML、PTEN、RET、TMPRSS2、WNK1、FGFR1、IGF1R、PPP1R12B、PTPRT、GSTM1、IPO8、MYC、ZNF703、MDM1、MDM2、MDM4,MKK4、P14KB、NCOR1、NBN、PALB2、RAD50、RAD51、PAK1,RSF1、INTS4、ZMIZ1、SEPHS1、FOXM1、SDCCAG1、IGF1R、TSHZ2、RPSK6K1、PPP2R2A、MTAP、MAP2K4、AURKB、BCL2、BUB1、CDCA3、CDCA4、CDC20、CDC45、CHEK1、FOXM1、 HDAC2、IGF1R、KIF2C、KIFC1、KRAS、RB1、SMAD4、NCOR1、UTX、MTHDFD1L、RAD51AP1、TTK和UBE2C。
在一些实施方案中,本公开内容总地来说涉及针对与先天性疾病或遗传病相关的突变的靶序列的扩增。在一些实施方案中,本公开内容可包括针对体细胞或种系突变的靶序列的扩增。在一些实施方案中,突变可以是常染色体显性的或常染色体隐性的。在一个实施方案中,与先天性疾病或遗传病相关的突变位于表4(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的基因或疾病的至少一个中。在一些实施方案中,本公开内容涉及扩增样品中与一个或多个遗传疾病相关的靶序列,所述遗传病选自:腺苷氨基水解酶缺乏症(ADA);丙种球蛋白缺乏血症,X染色体伴性遗传1型;Alagille综合征;所有肥大和扩张型心肌病;先天性普秃(ALUNC);阿尔佩斯综合征;甲抗胰蛋白酶缺乏症;α地中海贫血-东南亚;肌萎缩侧索硬化-卢·格里格病;雄激素不敏感综合征;无虹膜;强直性脊柱炎;家族性腺瘤性息肉病;精氨酸琥珀酸裂合酶缺乏症;致心律失常性右室发育异常/心肌病;共济失调伴眼动失用症2型;共济失调伴维生素E缺乏症;共济失调性毛细血管扩张;自体免疫多内分泌症;β-羟异丁酰基CoA脱酰酶缺乏(HIBCH缺乏);生物素酶缺乏;睑裂狭小、倒转型内眦赘皮和上睑下垂;Bloom综合征;短指畸形;短指畸形-高血压综合征;短指畸形B1型;腮-耳-肾障碍;BRCA1;躯干发育异常;Canavan;脑腱性黄瘤症;Ceroid-lipofuscinoses-Batton;行性神经性腓骨肌萎缩2B型;进行性神经性腓骨肌萎缩1B型;神经性腓骨肌萎缩2A2型;charge综合征;巨颌症;无脉络膜;维生素P缺乏;瓜胺酸血症第I型;Coffin-Lowry综合征;科恩综合征;Collagen4A5;普通易变免疫缺陷病;先天性肾上腺皮质增生症;先天性白内障,面部畸形和神经病;成人先天性Ia型糖基化障碍;先天性肌无力综合征;德朗热综合征;囊性纤维化;胱氨酸病;毛囊角化病;结蛋白沉积性肌病;非综合征型耳聋;先天性纯红细胞再生障碍性贫血;双皮质综合征;Duane综合征;迪谢纳/贝克尔肌营养不良症; Dysferlinopathy;先天性角化不良;早发性阿尔茨海默病;早发性张力障碍(DYT1);Ehlers Danlos;Ehlers-Danlos综合征,经典类型;Ehlers-Danlos综合征,运动过强型;Ehlers-Danlos综合征,脊柱后侧凸形式;X染色体伴性遗传埃-德二氏肌营养不良;单纯型大疱性表皮松解症;法布里病;面肩胛肱型肌营养不良症;家族性自主神经功能异常(HSAN III);家族性高胰岛素血症(FHI);家族性肥厚性心肌病;家族性转甲状腺素蛋白淀粉样变性;范可尼贫血;脆性X染色体;Friedreich共济失调;FRMD7-相关幼儿眼球震颤;弗赖恩斯综合征;Galactosemia;戈谢病;甘氨酸脑病;糖原贮积病VI型;噬血细胞性淋巴组织细胞增多症;血友病A;血友病B;具有免疫缺乏的肝静脉闭塞性疾病与免疫机能;遗传性出血性毛细血管扩张症;遗传性压迫易感性神经病;遗传性非息肉病性结肠癌;糖胺酶A缺乏症;HFE相关遗传性血色素沉着病;Holt-Oram综合征;亨廷顿病;羟甲基后胆色素原合酶(HMBS)缺乏症;低磷酸酯酶症;包涵体肌病2;色素失调症;幼年性息肉病综合征;卡尔曼综合征;先天性黑蒙症;利伯先天性黑矇10;李-佛美尼综合症;肢带型肌营养不良2A型;LIS1-相关无脑回畸形;长Q-T间期综合征;眼脑肾综合征;恶性过热易感;枫糖尿病;MAPT-相关障碍;麦-考二氏综合征;MECP2-Rett综合征;Menkes;异染性脑白质营养不良;甲基丙二酸血症;黏脂症第二型;多发性内分泌瘤病1型;多发性内分泌瘤病2型;先天性肌强直;强直性肌营养不良1型;2型肌强直性营养障碍;甲髌骨综合征;线形体肌病;神经纤维瘤病1型;神经纤维瘤病2型;努南综合症;眼白化病,X染色体伴性遗传;眼皮肤白化病1型;2型眼皮肤白化病;眼咽肌营养不良;视觉萎缩1型;鸟氨酸氨甲酰基转移酶缺乏症;成骨不全;帕金森病;彭德莱综合征;过氧化物酶体生物发生紊乱,Zellweger;苯丙酮尿症;多囊肾疾病;庞皮病-GSD II;原发性纤毛运动障碍;色素性视网膜炎;视网膜母细胞瘤;Saethre-Chotzen综合征;SCN9A-相关遗传性红斑性肢痛病;SHOX-相关单倍剂量不足;镰状细胞病;Smith-Lemli-Opitz综合征;Smith-Magenis综合症;小 儿巨脑畸形综合征;痉挛性截瘫3A;痉挛性截瘫7;痉挛性截瘫8;痉挛性截瘫1型;痉挛性截瘫4型;脊髓性肌萎缩;脊髓小脑共济失调2;脊髓小脑共济失调3;脊髓小脑共济失调7;脊髓小脑运动失调症1型;Stickler综合征;致死性发育不良;胸主动脉瘤和主动脉夹层;特雷彻-柯林斯综合征;三甲基胺尿症;结节性硬化;Udd远端型肌营养不良症;Usher综合征1型;极长链酰基CoA脱氢酶缺乏症;希佩尔-林道综合征;Waardenburg综合征1型;Werner综合征;肾母细胞瘤;肝豆状核变性;Wiskott-Aldrich;X染色体伴性遗传先天性肾上腺发育不良;X染色体伴性遗传肾上腺脑白质营养不良;X染色体伴性遗传张力障碍帕金森综合征;X染色体伴性遗传年性视网膜劈裂症;X染色体伴性遗传肌小管性肌病;X染色体伴性遗传SCIDS和Zellweger综合征。
在一个实施方案中,与先天性疾病或遗传病相关的突变可包括置换、***、倒位、点突变、缺失、错配和易位。在一些实施方案中,与遗传病或先天性疾病相关的突变包括拷贝数变化。在一些实施方案中,本公开内容总地来说涉及至少一个靶序列的选择性扩增和与遗传病相关的突变的检测和/或鉴定。在一些实施方案中,与先天性疾病或遗传病相关的突变可位于选自如下基因的基因的一个或多个中:ABCA4;ABCC8;ABCD1;ACADVL;ACTA2;ACTC;ACTC1;ACVRL1;ADA;AIPL1;AIRE;ALK1;ALPL;AMT;APC;APP;APTX;AR;ARL6;ARSA;ASL;ASPA;ASS;ASS1;ATL;ATM;ATP2A2;ATP7A;ATP7B;ATXN1;ATXN2;ATXN3;ATXN7;BBS6;BCKDHA;BCKDHB;BEST1;BMPR1A;BRCA1;BRCA2;BRIP1;BTD;BTK;C2或f25;CA4;CALR3;CAPN3;CAV3;CCDC39;CCDC40;CDH23;CEP290;CERKL;CFTR;CHAT;CHD7;CHEK2;CHM;CHRNA1;CHRNB1;CHRND;CHRNE;CLCN1;CNBP;CNGB1;COH1;COL11A1;COL11A2;COL1A1;COL1A2;COL2A1;COL3A1;COL4A5;COL5A1;COL5A2;COL7A1;COL9A1;CRB1;CRX;CTDP1;CTNS;CYP21A2;CYP27A1;DAX1;DBT;DCX;DES;DHCR7;DJ1;DKC1;DLD;DMD;DMPK;DNAAF1;DNAAF2;DNAH11;DNAH5;DNAI1;DNAI2;DNAL1;DNM2;DOK7;DSC2;DSG2;DSP;DYSF;DYT1;EMD;ENG;EYA1;EYS;F8;F9;FANCA;FANCC;FANCF;FANCG;FANCJ;FANDC2;FBN1;FBXO7;FGFR1;FGFR3;FMO3;FMR1;FOXL2;FRG1;FRMD7;FSCN2;FXN;GAA;GALT;GBA;GBE1;GCSH;GDF5;GJB2;GJB3;GJB6;GLA;GLDC;GNE;GNPTAB;GPC3;GPR143;GUCY2D;HBA1;HBA2;HBB;HD;HERG;HEXA;HFE;HHF;HIBCH;HLA-B27;HMBS;HPLH1;HPRP3;HR;HTNB;HTT;IKBKAP;IKBKG;IL2RG;IMPDH1;ITGB4;JAG1;JPH3;KCNE1;KCNE2;KCNH2;KCNQ1;KCNQ4;KIAA0196;KLHL7;KRAS;KRT14;KRT5;L1CAM;LAMB3;LAMP2;LDB3;LMNA;LMX18;LRAT;LRRK2;MAPT;MC1R;MECP2;MED12;MEN1;MERTK;MFN2;MKKS;MLH1;MMAA;MMAB;MMACHC;MMADHC;MPZ;MSH2;MTM1;MTND5;MTTG;MTTI;MTTK;MTTL1;MTTQ;MUT;MYBPC3;MYH11;MYH6;MYH7;MYL2;MYL3;MYLK2;MYO7A;ND5;ND6;NEMO;NF1;NF2;NIPBL;NR0B1;NR2E3;NRAS;NSD1;OCA2;OCRL;OPA1;OTC;PABPN1;PAFAH1B1;PAH;PARK2;PARK7;PARKIN;PAX3;PAX6;PCDH15;PEX1;PEX2;PEX10;PEX13;PEX14;PEX19;PEX26;PEX3;PEX5;PINK1;PKD1;PKD2;PKD3;PKHD1;PKP2;PLEC1;PLOD1;PMM2;PMP22;POLG;PPT1;PRCD;PRKAG2;PRNP;PROM1;PRPF3;PRPF8;PRPH2;PRPN;PSEN1;PSEN2;PTCH1;PTPN11;RAB7A;RAF1;RAI1;RAPSN;RB1;RDH12;RDS;RECQL3;RET;RHO;ROR2;RP1;RP2;RP9;RPE65;RPGR;RPGRIP1;RPL11;RPL35A;RPS10;RPS17;RPS19;RPS24;RPS26;RPS6KA3;RPS7;RPSL5;RS1;RSPH4A;RSPH9;RYR1;RYR2;SALL4;SCA3;SCN5A;SCN9A;SEMA4A;SERPINA1;SERPING1;SGCD;SH3BP2;SHOX; SIX1;SIX5;SLC25A13;SLC25A4;SLC26A4;SMAD4;SMN1;SNCA;SNRNP200;SOD1;SOS1;SOX9;SP110;SPAST;SPATA7;SPG3A;SPG4;SPG7;TAF1;TBX5;TCOF1;TGFBR1;TGFBR2;TNFRSC13C;TNNC1;TNNI3;TNNT1;TNNT2;TNXB;TOPORS;TOR1A;TP53;TPM1;TRNG;TRNI;TRNK;TRNL1;TRNQ;TSC1;TSC2;TTN;TTPA;TTR;TULP1;TWIST1;TXNDC3;TYR;USH1C;USH1H;USH2A;VCL;VHL;VPS13B;WAS;WRN;WT1和ZNF9。
在一些实施方案中,针对一种或多种遗传病或先天性疾病的靶特异性引物可选自表15(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的靶特异性引物的任一个或多个。在一些实施方案中,来自表15(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的靶特异性引物可包括2,3,4,5,6,7,8,9,10,20,40,60,80,100,150,200,400,500,800,1000,2000,3000,4000,5000,6000,7000,8000,9000,10,000,11,000,12,000,13,000或更多个靶特异性引物。在一些实施方案中,扩增的靶序列可包括在表16(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的基因组坐标上产生(使用扩增子ID靶特异性引物)的扩增的靶序列的一个或多个。在一些实施方案中,与先天性疾病或障碍相关的靶特异性引物的至少一个与至少一个选自SEQ ID NO:1-103、143的核酸序列具有至少90%的同一性。在一些实施方案中,与先天性疾病或障碍相关的靶特异性引物的至少一个在其整个长度上与样品中的至少一个靶序列互补。在一些实施方案中,与先天性疾病或障碍相关的靶特异性引物的至少一个在3’末端包含非可切割的核苷酸。在一些实施方案中,3’末端上的非可切割的核苷酸包括末端3’核苷酸。在一个实施方案中,靶序列或所得的扩增的靶序列针对具有与遗传病相关的突变的外显子。在一些实施方案中,先天性疾病或遗传病扩增的靶序列可包括表15(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文) 或美国申请61/598,881(通过引用整体并入本文)的表8中提供的两个或更多个靶特异性引物。在一些实施方案中,扩增的靶序列可包括使用表16(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)或美国申请61/598,881(通过引用整体并入本文)的表9中提供的扩增子ID靶特异性引物在基因组坐标上产生的扩增的靶序列的任一个或多个。在一些实施方案中,先天性疾病或遗传病扩增的靶序列可包括表15(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的两个或更多个靶特异性引物。在一些实施方案中,扩增的靶序列可包括使用表16(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的扩增子ID靶特异性引物在基因组坐标上产生的扩增的靶序列的任一个或多个。在一个实施方案中,先天性疾病或遗传病靶特异性引物可包括美国申请61/598,881(通过引用整体并入本文)的表8中提供的靶特异性引物的任一个或多个。在一些实施方案中,根据本文中概述的靶特异性引物选择标准来设计任一个或多个靶特异性引物。在一些实施方案中,本公开内容总地来说涉及样品中超过一个靶序列的选择性扩增和与先天性疾病或遗传病相关的突变的检测和/或鉴定。在一个实施方案中,本公开内容总地来说涉及多个与先天性疾病或遗传病关联的或相关的靶序列的扩增。
在一些实施方案中,靶特异性引物被制备来扩增与先天性疾病或遗传病相关的人基因组的区域或片段。在一些实施方案中,靶特异性引物可被制备来扩增与如下障碍相关的人基因组的区域:遗传障碍例如囊性纤维化、Alagille综合征、阿尔佩斯综合征、α地中海贫血、肌萎缩侧索硬化、强直性脊柱炎、共济失调性毛细血管扩张、先天性肌无力综合征、达里埃病、先天性再生障碍性贫血、早发性阿尔茨海默病、Ehlers-Danlos综合征、单纯大疱性表皮松解、家族性肥大性心肌病、范可尼贫血、甘氨酸脑病、遗传性出血性毛细血管扩张症、亨廷顿病、幼年性息肉病综合征、莱伯氏先天性黑蒙、QT延长综合征、枫糖尿病、马凡综合征、线粒体脑肌病、甲基丙二酸血症、多发性内 分泌瘤病2型、努南综合征、帕金森病、过氧化物生物合成障碍、Primary Cilary Dyskineasia、网膜色素变性、Stickler综合征、胸主动脉瘤和主动脉夹层、复合性结节性硬化病、Usher综合征、Werner综合征、Werner病和Zellweger综合征。在一些实施方案中,可从表4(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的基因的任一个或多个来制备靶特异性引物。
在一些实施方案中,本公开内容总地来说涉及检测与一个或多个新生儿障碍相关的靶序列或扩增的靶序列的存在。在一些实施方案中,本公开内容总地来说涉及检测通过用一个或多个本文中公开的靶特异性引物扩增样品(所述样品包含至少一个与新生儿障碍相关的靶序列)获得的扩增的靶序列的存在。在一些实施方案中,本公开内容总地来说涉及检测通过用根据本文中提供的引物标准设计的靶特异性引物扩增样品(所述样品包含至少一个与新生儿障碍相关的靶序列)获得的扩增的靶序列的存在。
在一些实施方案中,一个或多个新儿障碍可包括2-甲基-3-羟丁酸尿症(2M3HBA);2-甲基丁酰-辅酶A脱氢酶缺乏症(2MBG);3-甲基戊烯二酸尿症(3MGA);精氨酸血症(ARG);生物喋呤辅因子合成缺陷(BIOPT-BS);生物喋呤辅酶再生的缺陷(BIOPT-REG);肉碱酰基转移酶(CACT);甲基丙二酸血症(CBL-C,D);瓜胺酸血症第II型(CIT-II);肉碱棕榈酰转移酶-I(CPT-Ia);肉碱棕榈酰转移酶II(CPT-II);二烯酰辅酶A还原酶(De-Red);戊二酸尿症Ⅱ型(GA-II);半乳糖表异构酶(GALE);半乳糖激酶(GALK);良性高苯丙氨酸血(H-PHE);异丁酰辅酶A脱氢酶(IBG);中短链L-3-羟基酰辅酶A脱氢酶(M/SCHAD);丙二酸血症(MAL);中链酮脂酰辅酶A硫解酶(MCKAT);高蛋氨酸血症(MET);短链酰基辅酶A脱氢酶(SCAD);酪氨酸血症Ⅱ型(TYR-II);酪氨酸血症III型(TYR-III);生物素酶(BIO);囊性纤维化(CF);转移酶缺乏性半乳糖血症(GALT);Sickle–C病(HB S/C);先天性肾上腺增生(CAH);先天性甲状腺功能减退症(CH);镰状细胞性贫血(HB S/S);S-βeta地中海贫血(HB S/A);重症 联合免疫缺陷(SCID);5-羟脯氨酸尿(5-OXO);6-磷酸葡萄糖脱氢酶(G6PD);非酮性高甘氨酸血症(NKH);氨甲酰磷酸合成酶(CPS);高氨血症/鸟氨酸血症/瓜氨酸血症(鸟氨酸转运缺陷)(HHH);脯氨酸血症(PRO);乙基丙二酸脑病变(EMA);人免疫缺陷病毒(HIV);弓形虫病(TOXO);3-甲基巴豆辅酶A羧化酶(3-MCC);肉碱摄取缺陷(CUD);长链3-羟酰基-辅酶A脱氢酶(LCHAD);苯丙酮尿症/高苯丙氨酸血症(PKU);精氨酸琥珀酸尿症(ASA);戊二酸血症1型(GA-1);中链脂酰基辅酶A脱氢酶(MCAD);丙酸血症(丙酰辅酶A羧化酶)(PROP);β酮硫解酶(线粒体乙酰乙酰辅酶A硫解酶;短链酮脂酰硫解酶;T2)(BKT);高胱氨酸尿(胱硫醚β合酶)(HCY);多羧酶缺乏(羧化全酶合成酶)(MCD);三功能蛋白缺乏症(TFP);甲基丙二酸血症(维生素B12障碍)(CBLA,B);3-羟基-3-甲基戊二酸尿症(3-羟基-3-甲戊二酰-CoA裂合酶)(HMG);枫糖尿病(支链酮酸脱氢酶)(MSUD);酪氨酸血症1型(TYR-1);瓜氨酸血症I型(精氨琥珀酸盐合成酶)(CITI);异戊酸血症(异戊烯辅酶A脱氢酶)(IVA);甲基丙二酸血症(甲基丙二酰CoA变位酶)(MUT)和极长链酰基辅酶A脱氢酶(VLCAD)。
在一些实施方案中,本公开内容总地来说涉及用于检测新生儿筛查障碍的靶特异性引物。在一些实施方案中,针对新生儿障碍(包括上文中提供的障碍)的靶特异性引物可使用本文中公开的引物标准来制备。在一些实施方案中,本公开内容总地来说涉及通过如下步骤检测新生儿障碍:将可能包含一个或多个针对一个或多个新生儿障碍的靶序列的样品接触,扩增样品中的一个或多个靶序列,从而获得至少一个扩增的与至少一个新生儿障碍相关的靶序列。在一些实施方案中,多个靶特异性引物可被设计来从样品扩增多个靶序列,从而提供任选地在单个方法或过程中检测多个新生儿障碍的方法。在一些实施方案中,可将被设计来扩增多个与一个或多个新生儿障碍相关的扩增的靶序列的靶特异性引物混合,以新生儿筛查小组的形式提供。
在一些实施方案中,靶序列或扩增的靶序列针对从法医样品获得的核酸。在一个实施方案中,法医样品可包含获自罪案现扬的核酸, 获自失踪人士DNA数据库的核酸,获自与法医研究相关的实验室的核酸,或包括通过法律实施机构、一个或多个军事服务或任何这样的人员获得的法医样品。在一些实施方案中,靶核酸可存在于一种或多种体液包括但不限于血液、痰、血浆、***、尿和血清中。在一些实施方案中,靶序列可获自头发、皮肤、组织样品、尸体剖检或受害者的遗物。在一些实施方案中,核酸包括一个或多个可获自患病动物或人的靶序列。在一些实施方案中,靶序列可包括获自非人DNA例如微生物、植物或昆虫DNA的核酸。在一些实施方案中,靶序列或扩增的靶序列针对人鉴定的目的。在一些实施方案中,本公开内容总地来说涉及用于鉴定来自动物包括人的核酸样品的方法。在一些实施方案中,本公开内容总地来说涉及用于鉴定法医样品的特征的方法。在一些实施方案中,本公开内容总地来说涉及使用一个或多个本文中公开的靶特异性引物或一个或多个使用本文中概述的引物标准制备的靶特异性引物的人鉴定法。
在一个实施方案中,包含至少一个靶序列的法医或人鉴定样品可使用本文中公开的靶特异性引物的任一个或多个或使用本文中概述的引物标准来进行扩增。在一些实施方案中,包含一个或多个靶序列的法医或人鉴定样品可通过用表13和14(二者见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的任一个或多个靶特异性引物扩增至少一个或多个靶序列来鉴定。表13(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供了以引物对的形式提供的多个针对与人鉴定相关的单核苷酸多态性(SNP)的靶特异性引物。表14(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供了以引物对的形式提供的多个针对与人鉴定相关的短串联重复(STR)的靶特异性引物。个体遗传了一个拷贝的来自每一个亲代的STR,所述STR可具有或可以不具有相似的重复序列大小。STR标志中的重复序列的数目在个体间可以是高度可变的,这使得STR能有效地用于人鉴定的目的。在一些实施方案中,靶特异性引物例如表14(见2012年4月27 日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的那些引物或如本文中公开的制备的靶特异性引物(所述引物针对基因牙釉蛋白(AMG))可用于确定提供样品的个体的性别。例如,针对牙釉蛋白基因的引物可使用本文中公开的对于例如内含子1是特异性的标准来制备。当使用这样的靶特异性引物扩增样品后,来自男性样品相对女性样品的扩增产物将通常导致在长度上相异数个核苷酸的扩增产物(扩增的靶序列),从而提供了确定提供样品的个体的性别的简单方法。
在一个实施方案中,包含一个或多个靶序列的样品可使用本文中公开的靶特异性引物的任一个或多个来进行扩增。在另一个实施方案中,可将使用本文中公开的方法(和相关组合物、***、装置和试剂盒)获得的扩增的靶序列偶联至下游处理,例如但不限于核酸测序。例如,一旦知道扩增的靶序列的核酸序列,就可将核酸序列与一个或多个参照样品例如Hg19基因组相比较。Hg19基因组通常在基因组学领域中用作人的参照基因组样品。在一些实施方案中,怀疑包含一个或多个SNP和/或STR的样品可通过用表13和14(二者见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的靶特异性引物的任一个或多个扩增怀疑包含SNP或STR的样品来鉴定。因此,来自扩增过程的输出可任选例如通过核酸测序进行分析,以确定预期的基于靶特异性引物的扩增产物是否存在于扩增输出中。适当的SNP或STR扩增产物的鉴定可在一些情况下提供关于样品来源或其特征(例如,男性或女性样品或具有特定祖先来源的样品)的额外信息。
预期本领域技术人员可容易地使用本文中公开的引物标准制备一个或多个靶特异性引物而无需过度实验。还预期本领域技术人员可使用本文中公开的标准容易地制备一个或多个靶特异性引物,以鉴定至少一个医学上相关的多态性。在一些情况下,医学上相关的多态性可用于法医或人鉴定目的。一般而言,医学上相关的多态性包括与多个群体(例如,欧洲高加索人群)中的至少一个疾病状态相关的多态性。 在一些实施方案中,医学上相关的多态性包括下文概述的多态性的任一个或多个。
在一些实施方案中,医学上相关的多态性可存在于相应疾病相关基因的单个外显子中。在一些实施方案中,本公开内容总地来说涉及样品中至少一个靶序列的选择性扩增和医学上相关的多态性的检测和/或鉴定。在一些实施方案中,本公开内容总地来说涉及样品中至少一个靶序列的选择性扩增和SNP或STR的检测和/或鉴定。在一些实施方案中,扩增的靶序列可通过用表13或14(二者见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的一个或多个靶特异性引物扩增样品来产生。在一些实施方案中,扩增的靶序列可包括在上述多态性表中提供的基因坐标上产生的扩增的靶序列的任一个或多个。在一个实施方案中,扩增的靶序列可使用来自表13或14(二者见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的靶特异性引物的一个或多个来制备。在一些实施方案中,任一个或多个对应于SEQ ID NO:50354-50451的靶特异性 引物可用于选择性扩增存在于样品中的至少一个靶序列。在一些实施方案中,为了法医或人鉴定的目的,至少一个选自SEQ ID NO:50354-50451的靶特异性引物可用于从样品扩增靶序列。
在一些实施方案中,用于人鉴定的靶特异性引物可选自表13或14(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供的靶特异性引物的任一个或多个。在一些实施方案中,来自表13或14(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的靶特异性引物可包括1,2,3,4,5,6,7,8,9,10,15,20,22,25,27,30,35,38,40,42,45或更多个靶特异性引物。在一些实施方案中,与人鉴定相关的靶特异性引物的至少一个与表13或14(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的靶特异性引物的至少一个具有至少90%的同一性。在一些实施方案中,与人鉴定相关的靶特异性引物的至少一个在其整个长度上与样品中的至少一个靶序列互补。在一些实施方案中,与人鉴定相关的靶特异性引物的至少一个在3’末端包含非可切割的核苷酸。在一些实施方案中,3’末端上的非可切割的核苷酸包括末端3’核苷酸。
在一些实施方案中,本公开内容总地来说涉及用于在多重PCR中减少扩增假象的形成的方法(和相关组合物、***、装置和试剂盒)。在一些实施方案中,相较于现有技术的标准多重PCR,以更少的数目或产率获得引物二聚体或非特异性扩增产物。在一些实施方案中,扩增假象的减少部分地通过在多重PCR反应中使用靶特异性引物对来控制。在一个实施方案中,多重PCR反应中靶特异性引物对的数目可超过1000,3000,5000,10000,12000或更多个。在一些实施方案中,本公开内容总地来说涉及用于使用包含可切割基团的靶特异性引物进行多重PCR的方法(和相关组合物、***、装置和试剂盒)。在一个实施方案中,包含可切割基团的靶特异性引物可包含:对于每一个引物对的每个引物,一个或多个可切割的部分。在一些实施方案中,包含可切割基团的靶特异性引物包含既非正常存在于非患病样品中也非对于 正在经历多重PCR的核酸的群体是天然的核苷酸。例如,靶特异性引物可包括一个或多个非天然核酸分子例如,但不限于胸腺嘧啶二聚体、8-氧-2’-脱氧鸟嘌呤、肌苷、脱氧尿苷、溴脱氧尿苷、无嘌呤核苷酸等。
在一些实施方案中,公开的方法(和相关组合物、***等)包括任选地使用靶特异性引物,从核酸群体初始扩增靶序列。在一些实施方案中,公开的方法包括使用靶特异性正向和反向引物对扩增靶序列。靶特异性正向和反向引物对可任选地包括一个或多个内含子特异性和/或外显子特异性正向和反向引物对。在一些实施方案中,每一个引物对针对单个或分散的外显子。在一些实施方案中,公开的方法包括使用包含至少一个可切割基团的外显子特异性正向和反向引物对扩增靶序列。在一些实施方案中,靶特异性正向和反向引物对包含尿嘧啶核苷酸作为一个或多个可切割基团。在一个实施方案中,靶特异性引物对可在每一个引物对的正向和反向引物的每一个中包含尿嘧啶核苷酸。在一个实施方案中,靶特异性正向或反向引物包含1、2、3或更多个尿嘧啶核苷酸。在一些实施方案中,公开的方法包括使用包含至少两个尿嘧啶核苷酸的靶特异性正向和反向引物对从一群具有多个靶序列的核酸扩增至少10,50,100,200,500,1000,2000,3000,5000,6000,8000,10000,12000或更多个靶序列。
在一些实施方案中,靶特异性引物(包括但不限于内含子特异性和外显子特异性引物,所述引物可以是正向和/或反向引物)可使用根据指定的设计标准产生寡核苷酸序列的算法从新设计。例如,引物可按照本文中指定的标准的任一个或多个来选择。在一些实施方案中,靶特异性引物的一个或多个被选择或设计为满足下列标准的任一个或多个:(1)在引物序列内包含两个或更多个修饰的核苷酸,其中至少一个包含在引物的末端附近或末端上并且其中至少一个包含在引物序列的中央核苷酸位置上或其附近;(2)在长度上为约15至约40个碱基的引物长度;(3)约60℃至约70℃的Tm;(4)与存在于目标靶基因组或样品中的非靶序列的低交叉反应性;(5)对于给定的反应中的每一个引 物,至少前4个核苷酸(从3’至5’方向进行)的序列不与存在于相同反应中的任何其它引物内的任何序列互补;和(6)扩增子都不包含与任何其它扩增子内的任何序列互补的具有至少5个核苷酸的任何连续区段。
在一些实施方案中,靶特异性引物包括一个或多个被设计来从样品扩增长度为约100个碱基对至约500个碱基对的靶序列的引物。在一些实施方案中,靶特异性引物包括多个被设计来扩增靶序列的引物对,其中预测扩增的靶序列彼此在长度上变化不超过50%,通常不超过25%,更常见地不超过10%或5%。例如,如果一个靶特异性引物对被选择或被预测来扩增长度为100个核苷酸的产物,则其它引物对被选择或预测来扩增长度为50-150个核苷酸,通常地长度为75-125个核苷酸,更常见地长度为90-110个核苷酸或95-105个核苷酸或99-101个核苷酸的产物。
在一些实施方案中,扩增反应中的至少一个引物对不是按照任何预定的选择标准来从头设计。例如,至少一个引物对可以是随机选择或产生的,或先前选择或产生来用于其它应用的寡核苷酸序列。在一个示例性实施方案中,扩增反应可包含至少一个选自探针试剂(Roche Molecular Systems)的引物对。试剂包括标记的探针并且可用于,除其它以外,任选地实时测量存在于样品中的靶序列的量。TaqMan技术的一些实例公开于美国专利号5,210,015、5,487,972、5,804,375、6,214,979、7,141,377和7,445,900(通过引用整体并入本文)。
在一些实施方案中,可以例如利用光学可检测标记物标记扩增反应中的至少一个引物以有促进特定目标应用。例如,标记可促进靶模板和/或扩增产物的定量,靶模板和/或扩增产物的分离等。
在一些实施方案中,扩增反应中的引物的一个或多个可用于核酸样品的基因分型。
在一些实施方案中,靶特异性引物可以以一组靶特异性引物对的形式提供于单个扩增容器中。在一些实施方案中,可以以靶特异性引 物对的一个或多个等分提供靶特异性引物,在进行多重PCR反应之前可将其在单个扩增容器或反应室中混合。在一个实施方案中,靶特异性引物可以以靶特异性正向引物的池和靶特异性反向引物的单独的池的形式提供。在另一个实施方案中,可将靶特异性引物对混合成亚组例如非重叠靶特异性引物对。在一些实施方案中,可在例如PCR板上的单个反应室或微孔中提供靶特异性引物对的池,以使用热循环仪进行多重PCR。在一些实施方案中,靶特异性正向和反向引物对可与靶序列基本上互补。
在一些实施方案中,进行多重PCR扩增的方法包括将多个具有正向和反向引物的靶特异性引物对与一群靶序列接触以形成多个模板/引物双链体;将DNA聚合酶和dNTP的混合物添加至所述多个模板/引物双链体,以在充足的温度进行充足的时间来通过模板依赖性合成延伸每一个靶特异性引物对的任一(或两个)正向或反向引物,从而产生多个延伸的引物产物/模板双链体;使延伸的引物产物/模板双链体变性;使延伸的引物产物与来自靶特异性引物对的互补引物退火;和在DNA聚合酶和dNTP存在的情况下延伸退火的引物以形成多个靶特异性双链核酸分子。在一些实施方案中,可以以任何顺序进行扩增PCR法的步骤。在一些情况下,可进一步最优化本文中公开的方法以除去一个或多个步骤,并且仍然获得充足的待用于多种下游处理的扩增的靶序列。例如,纯化或提纯步骤的数目可被改变来包括比本文中公开的更多或更少的步骤,只要扩增的靶序列以充足的产率产生。
在一些实施方案中,靶特异性引物对在引物的3’或5’末端不包含常见的延伸(尾)。在另一个实施方案中,靶特异性引物不包含标签或通用序列。在一些实施方案中,靶特异性引物对被设计来消除或减少促进非特异性扩增的形成的相互作用。
在一个实施方案中,靶特异性引物对包含:每正向和反向靶特异性引物至少一个可切割基团。在一个实施方案中,可切割基团可以是尿嘧啶核苷酸。在一个实施方案中,靶特异性引物对在扩增的靶序列产生后被部分或基本上除去。在一个实施方案中,去除可包括靶特异 性引物对的酶促、热或碱处理,作为扩增的靶序列的部分。在一些实施方案中,进一步处理扩增的靶序列以形成平末端扩增产物,在本文中称为平末端扩增的靶序列。
在一些实施方案中,方法、组合物、试剂盒、***和装置中公开的靶特异性引物的任一个或多个可使用下列引物选择标准来设计。
存在对于用于鉴定或设计产物的新方法、计算机可读介质和***或试剂盒的需要,其使用PCR富集一个或多个目的基因组区域(其可以是例如1kb至1Mb的累积区域)以用于随后测序。
存在对于用于鉴定或设计产物的新方法、计算机可读介质和***或试剂盒的需要,其包括使一个或多个目标基因组区域或靶的覆盖度最大化同时使脱靶杂交、引物的数目和引物池的数目的一项或多项最小化的引物和测定。
根据本申请中体现的教导和原理,提供了鉴定或设计产物的新方法、计算机可读介质和***,或试剂盒,其使用PCR富集一个或多个目的基因组区域以用于随后测序,和/或包括使一个或多个目标基因组区域或靶的覆盖度最大化同时使脱靶杂交、引物的数目和引物池的数目的一项或多项最小化的引物和测定。
图17举例说明用于按照示例性实施方案设计引物或测定的***。***包括数据接收模块1701、引物提供模拟1702、评分(芯片PCR)模块1703、评分(SNP重叠)模块1704、滤过模块1705、混合模块1706和报告模块1707。***还包括数据库1708,其可包括关于遗传注释的数据、SNP相关数据或其它遗传数据例如重复序列、染色体、位置、方向等的鉴定,例如,或任何其它类型的与目标基因组区域或靶相关的信息,以及数据库1709,其可包括引物相关数据例如熔解温度(Tm)、染色体、位置、方向和SNP重叠信息等,例如,或任何其它类型的可与引物相关的信息。***可使用一个或多个软件构件于一个或多个计算中或使用一个或多个计算执行,所述软件构件对于可能正在定购可使用这样的***设计的订制引物或测定的用户可能是不可获得的或释放的。用户可至少部分地通过网络可访问数据通道,通过以任何适当 的格式提供一个或多个目标基因组区域或靶,订购订制的引物或测定。在示例性实施方案中,提供了进行步骤(包括与模块1701-1707和数据库1708及1709)相关的一般步骤(例如,接收数据,提供引物,对引物和/或扩增子评分,滤过引物和/或扩增子,混合引物和/或扩增子,报告结果和查询数据库)的方法。
图18举例说明用于按照示例性实施方案设计引物或测定的***。该***包括靶产生器模块,其可产生一个或多个基于坐标的目标基因组区域或靶并且可从注释数据库(其可包括关于基因注释的数据、SNP相关数据或其它基因数据例如重复、染色体、位置、方向等的鉴定,例如,以及关于引物的信息或任何其它类型的可与目标基因组区域或靶相关的信息)查询和/或接收信息;设计模块,其可设计一个或多个引物或测定和,以及确定和/或应用用于引物或测定的各种评分和滤过程序,并且可进行各种质量控制程序;加载模块,其可将引物或测定和/或相关信息(例如质量控制结果,例如)加载至引物数据库(其可与注释数据库交流或包含在注释数据库内,以及其可包括引物相关数据例如熔解温度(Tm)、染色体、位置、方向和SNP重叠信息等,例如,或任何其它类型的可与引物相关的信息);SNP重叠/重复序列重叠模块;驱动模块;拼接模块(tiler module),其可确定使目标基因组区域或靶的覆盖度最大化的一个亚组的扩增子或小区;混合器模块,其可将扩增子或小区的混合物确定为一个或多个扩增子的池;和报告产生器模块。可使用一个或多个软件构件在一个或多个计算机和/或服务器中或使用所述计算机和/或服务器执行***,所述软件构件对于可能正在定购可使用这样的***设计的订制引物或测定的用户可能是不可获得的或释放的。用户可至少部分地通过网络可访问数据通道,通过以任何适当的格式提供一个或多个目标基因组区域或靶,订购订制的引物或测定。在示例性实施方案中,提供了进行步骤(包括与这些模块和数据库相关的一般步骤)的方法。
图19举例说明包含被一对根据示例性实施方案设计的引物包围的***序列的扩增子序列。扩增子可包含包围绕***序列的正向引物 和反向引物。两个引物可一起形成测定,其可订制和订购。扩增子的引物组分可以是一个拷贝的掺入引物,而非潜在样品,并且一个或多个***物可被选择来覆盖靶。
图20举例说明包含被根据示例性实施方案设计的一对引物包围的***物的扩增子序列(其在本文中可称为“小区”)的PCR扩增。显示了变性、退火和延伸步骤,最终导致扩增子的指数增长。
图21(第1部分-第3部分)举例说明给定的靶区域的一组候选扩增子,每一个扩增子包含被一对引物包围的***物,以用于根据示例性实施方案的拼接和混合。点线表示靶区域(在本实施例中在染色体19上)的边界。在本实施例中有112个候选扩增子用于覆盖靶区域,但候选扩增子的数目当然是不同的(包括低得多或高得多的),并且可通过考虑计算资源、靶区域的长度和任何其它相关因子来选择。
根据不同的示例性实施方案,提供了使用设计管道(design pipeline)来设计引物的方法,其允许设计横跨目标基因组区域的寡核苷酸引物,同时结合各种设计标准和考虑(包括扩增子大小、引物组成、潜在的脱靶杂交和引物的SNP重叠)的寡核苷酸引物。在实施方案中,设计管道(design pipeline)包括几个可如接下来所述连续执行的功能模块。
第一,在实施方案中,序列检索模块可被构造来基于关于用户所期望的终产物的操作者说明书检索序列。操作者可索取由染色体和基因组坐标指定的或由基因符号指定器指定的基因组区域的引物对的设计。在后一种情况下,序列检索模块可基于外显子坐标检索序列。操作者还可指定是否包括5’UTR序列(非翻译序列)。
第二,在实施方案中,测定设计模块可被构造来使用设计引擎设计引物对,其可以例如是公共工具例如Primer3或另一种引物设计软件,所述软件可产生横跨通过序列检索模块检索的整个序列区域的引物对。引物对可被选择来在整个核苷酸序列上致密地拼接。引物设计可基于各种参数,包括:(1)引物的熔解温度(其可使用John SantaLucia,Jr.,“Aunified view of polymer,dumbbell,and oligonucleotide DNA nearest-neighborthermodynamics,”Proc.Natl.Acad.Sci.USA,第95卷,1460-1465(1998)(将其内容通过引用整体并入本文)中所示的最邻近算法来计算),(2)引物组成(例如,核苷酸组成例如GC含量可利用软件来测定和滤过以及罚分,对于引物发夹形成、引物的3’末端的GC含量的组成亦如此,并且可被评价的特定参数是成段的同聚体核苷酸、发夹形成、GC含量和扩增子大小),(3)正向引物、反向引物和扩增子的评分(可将评分加起来以获得探针组评分,评分可反映扩增子确认与期望的参数之间的密切程度),和(4)一些T至U的转换(可这样放置T:引物的T界定的片段的预测的Tm具有最小平均Tm)。
第三,在实施方案中,引物定位图模块可被构造来使用定位图软件(例如,e-PCR(NCBI),参见Rotmistrovsky等人,“A web server for performing electronic PCR,”Nucleic Acids Research,第32卷,W108-W112(2004),和Schuler,“Sequence Mapping byElectronic PCR,”Genome Research,第7卷,541-550(1997)(将这两篇文献通过引用整体并入本文)或其它相似软件)来将引物定位至基因组。引物定位可使用错配矩阵来评分。在实施方案中,完全匹配可接收为0的评分,错配引物可接收大于0的评分。错配矩阵考虑了错配的位置和错配的性质。例如,错配矩阵可将错配评分赋予特定基序(例如,AA,AC,AG,CA,CC,CT,GA,GG,GT,TC,TG,TT,A-,C-,G-,T-,-A,-C,-G和–T,其中‘-’表示不确定的碱基或缺口)与特定位置(例如,3’末端上的碱基、距离3’末端的第二碱基、距离3’末端的第三碱基、距离5’末端的第三碱基、距离5’末端的第二碱基、5’末端上的碱基和其间的位置)的每一个组合,这可凭经验来获得,可被选择来反映更接近3’末端的错配相较于更接近5’末端的错配倾向于更弱的PCR反应,从而通常可更大。具有不确定的碱基或缺口的基序的错配评分可被赋予与其一致的其它基序的评分的平均值(例如,A-可被赋予AA、AC和AG的评分的平均值)。对于特定评分阈值,基于命中数目,可计算扩增子成本。
第四,在实施方案中,SNP模块可被构造来测定潜在的SNP和重 复区域:SNP可被定位至引物并且基于SNP离3’末端的距离,可将引物作为潜在候选者进行滤过。类似地,如果引物与重复区域重叠至特定百分比,则引物可能被滤过。
第五,在实施方案中,拼接器模块可被构造来基于扩增子成本(参见引物定位)和选择一组覆盖靶同时确保靶的拼接引物的选择不依赖于可存在于用户索取中的其它靶(以便无论用户仅索取该靶还是另外的靶以及无论扩增子将帮助覆盖该靶还是另外的靶,相同组的靶的引物都将被选择)所必需的引物数目来使用功能。
第六,在实施方案中,混合器模块可被构造来使用混合算法,该算法防止扩增子重叠并且确保池中引物的平均数目偏离不超过预设值。
图22举例说明根据示例性实施方案的方法。在步骤2201中,模块或其它硬件和/或软件构件接收一个或多个目标基因组区域或序列。在步骤2202中,模块或其它硬件和/或软件构件确定接收的一个或多个目标基因组区域或序列的一个或多个靶序列。在步骤2203中,模块或其它硬件和/或软件构件为测定的一个或多个靶序列中的每一个提供一个或多个引物对。在步骤2204中,模块或其它硬件和/或软件构件对一个或多个引物对进行评分,其中评分包括基于一个或多个引物对的芯片PCR的性能的罚分,并且其中评分还包括对于一个或多个引物对的SNP重叠的分析。在步骤2205中,模块或其它硬件和/或软件构件基于多个因素(包括至少罚分和SNP重叠的分析)滤过一个或多个引物对,以鉴定对应于一个或多个目标基因组区域或序列的一个或多个候选扩增子序列的一组滤过的引物对。
根据示例性实施方案,提供了方法,包括:(1)接收一个或多个目标基因组区域或序列;(2)确定接收的一个或多个目标基因组区域或序列的一个或多个靶序列;(3)为确定的一个或多个靶序列的每一个提供一个或多个引物对;(4)对一个或多个引物对评分,其中评分包括基于一个或多个引物对的芯片PCR的性能的罚分,并且其中评分还包括对于一个或多个引物对的SNP重叠的分析;(5)基于多个因素(包括至少 罚分和SNP重叠的分析)滤过一个或多个引物对,以鉴定对应于一个或多个目标基因组区域或序列的一个或多个候选扩增子序列的一组滤过的引物对。
在不同的实施方案中,接收一个或多个目标基因组区域或序列可包括接收一组一个或多个基因符号或标识符。接收一个或多个目标基因组区域或序列可包括接收一组一个或多个基因组坐标或其它基因组位置标识符。接收一个或多个目标基因组区域或序列可包括接收一组一个或多个BED坐标。
在不同的实施方案中,测定一个或多个靶序列可包括测定一个或多个外显子或编码区,所述外显子或编码区对应于一个或多个目标基因组区域或序列的每一个。测定一个或多个靶序列可包括就一个或多个目标基因组区域或序列在其中的存在和与其相关的信息查询扩增子或其它基因组序列数据库。
在不同的实施方案中,提供一个或多个引物对可包括设计一个或多个引物对。提供一个或多个引物对可包括就一个或多个目标基因组区域或序列或一个或多个引物对在其中的存在和与其相关的信息查询扩增子或其它基因组序列数据库。
在不同的实施方案中,芯片PCR的性能可包括针对任何物种的参照或先前测序的基因组进行芯片PCR。芯片PCR的性能可包括针对hg19参照基因组进行芯片PCR。针对参照基因组的芯片PCR的性能可包括测定一个或多个引物对的每一个的多个脱靶杂交。针对参照基因组的芯片PCR的性能可包括测定一个或多个引物对的每一个的最坏情况下的属性或评分。芯片PCR的性能可包括测定一个或多个引物对的每一个的一个或多个基因组坐标。芯片PCR的性能可包括测定一个或多个引物对的每一个的一个或多个预测的扩增子序列。芯片PCR的性能可包括就一个或多个目标基因组区域或序列或一个或多个引物对的芯片PCR结果在其中的存在和与其相关的信息查询扩增子或其它基因组序列数据库。
在不同的实施方案中,SNP重叠的分析可包括确定一个或多个引 物对的每一个的SNP种类。SNP重叠的分析可包括就一个或多个目标基因组区域或序列或一个或多个引物对的SNP重叠结果在其中的存在和与其相关的信息查询扩增子或其它基因组序列数据库。
在不同的实施方案中,所述多个因素可包括下列一个或多个:正向SNP重叠的指示、反向SNP重叠的指示、正向重复的频率的指示、反向重复的频率的指示、一个或多个引物对的每一个的脱靶杂交的指示以及一个或多个引物对的每一个的组成。所述多个因素可包括下列一个或多个:正向三联体因子、反向三联体因子、正向A run因子、反向A run因子、正向C run因子、反向C run因子、正向G run因子、反向G run因子、正向T run因子和反向Trun因子。所述多个因素可包括下列一个或多个:一个或多个引物对的每一个包括一个或多个同聚物所达到的程度的指示。所述多个因素可包括一个或多个引物对的每一个包括一个或多个重复序列所达到的程度的指示。所述多个因素可包括一个或多个引物对的长度,其中一个或多个引物对的评分随长度变得比最小长度阈值短而减小,以及随长度变得比最大长度阈值长而减小。所述多个因素可在一个或多个引物对中包括最大数目的给定的碱基,其中一个或多个引物对的评分随给定的碱基的数目超过最大碱基包含阈值而减小。所述多个因素可包括给定的碱基的连续事件的最大数目,其中一个或多个引物对的评分随给定的碱基的连续事件的数目超过最大连续碱基包含阈值而减小。
所述多个因素可包括一组两个给定的碱基最大百分比,其中一个或多个引物对的评分随两个给定的碱基的百分比增加而减小。所述多个因素可包括G和C碱基的最大百分比,其中一个或多个引物对的评分随G和C碱基的百分比的增加而减小。所述多个因素可包括一个或多个引物对的预测的熔解温度相对于最小和最大熔解温度阈值的偏差。所述多个因素可包括一个或多个引物对的引物二聚体包含的数目。所述多个因素可包括一个或多个引物对的局部互补性的水平。所述多个因素可包括一个或多个引物对的每一个的复杂度水平的指示。所述多个因素可包括一个或多个引物的每一个的SNP重叠的指示。
在不同的实施方案中,方法可包括选择一个亚组的一个或多个候选扩增子序列,所述序列基本上覆盖一个或多个目标基因组区域或序列,同时将与候选扩增子序列相关的成本函数降至最低。将成本函数降至最低可包括产生包含源顶点、一个或多个扩增子顶点和汇点顶点的重叠图。
在不同的实施方案中,方法可包括将引物对的滤过组中与一个或多个候选扩增子序列的选择的亚组对应的引物对装配成多个单独的引物对的池。装配引物对可包括至少基于给定的池中的扩增子序列之间的最小阈值距离将引物对的滤过组中与一个或多个候选扩增子序列的选择的亚组对应的一个或多个引物对的包含限制于给定的池中。最小阈值距离可以为例如约5个碱基对至约100个碱基对,或约15个碱基对至约90个碱基对,或约25个碱基对至约75个碱基对,或约40个碱基对至约60个碱基对。在一些实施方案中,扩增子之间的最小阈值距离可包括任何整数,包括负整数。例如为0的值可表示任何两个扩增子被允许“接触”,为-8的值表示任何两个扩增子可重叠达到8个碱基。
在不同的实施方案中,将引物对的滤过组装配进引物对的多个单独池可包括分开管之间的引物对,以防止扩增子在任何给定的管内重叠。装配引物对可包括至少基于给定的池的预定扩增子容量将引物对的滤过组中与一个或多个候选扩增子序列的选择的亚组对应的一个或多个引物对的包含限制于给定的池中。装配引物对可包括至少基于使给定的池的大小与平衡因子与单独的池的大小的最大值之间的产物相关的不等式,将引物对的滤过组中与一个或多个候选扩增子序列的选择的亚组对应的一个或多个引物对的包含限制于给定的池中。
在不同的实施方案中,方法可包括提供报告数据的信息的任一个或多个组件的报告,所述数据通过接收、提供、评分、滤过、选择和装配步骤中的任一个或多个而使用或产生。
根据示例性实施方案,提供了包含指令的非短暂性机器可读存储介质,所述指令,当被处理器执行时,使得处理器进行下列方法,所 述方法包括:(1)接收一个或多个目标基因组区域或序列;(2)确定接收的一个或多个目标基因组区域或序列的一个或多个靶序列;(3)为确定的一个或多个靶序列的每一个提供一个或多个引物对;(4)对一个或多个引物对进行评分,其中评分包括基于一个或多个引物对的芯片PCR的性能的罚分,并且其中评分还包括一个或多个引物对的SNP重叠的分析;和(5)基于多个因素(包括至少罚分和SNP重叠的分析)滤过一个或多个引物对,以鉴定对应于一个或多个目标基因组区域或序列的一个或多个候选扩增子序列的一组滤过的引物对。
在不同的实施方案中,这样的非短暂性机器可读存储介质可包含指令,所述指令,当被处理器执行时,使得处理器进行下列方法,所述方法还包括:(6)选择基本上覆盖一个或多个目标基因组区域或序列同时使得与候选扩增子序列相关的成本函数减小至最小的一个亚组的一个或多个候选扩增子序列;和(7)将引物对的滤过组中与一个或多个候选扩增子序列的选择的亚组对应的引物对装配进入引物对的多个单独的池。
根据示例性实施方案,提供了***,其包括:(1)机器可读内存;和(2)被构造来执行机器可读指令的处理器,所述指令,当被处理器执行时,使得***进行步骤,包括:(a)接收一个或多个目标基因组区域或序列;(b)确定接收的一个或多个目标基因组区域或序列的一个或多个靶序列;(c)为确定的一个或多个靶序列的每一个提供一个或多个引物对;(d)对一个或多个引物对进行评分,其中评分包括基于一个或多个引物对的芯片PCR的性能的罚分,并且其中评分还包括一个或多个引物对的SNP重叠的分析;和(e)基于多个因素(包括至少罚分和SNP重叠的分析)滤过一个或多个引物对,以鉴定对应于一个或多个目标基因组区域或序列的一个或多个候选扩增子序列的一组滤过的引物对。
在不同的实施方案中,这样的***的处理器还可被构造来执行机器可读指令,所述指令,当被处理器执行时,使得***进行步骤,包括:(f)选择基本上覆盖一个或多个目标基因组区域或序列同时使得与候选扩增子序列相关的成本函数减小至最小的的一个亚组的一个或多 个候选扩增子序列;和(g)将引物对的滤过组中与一个或多个候选扩增子序列的选择的亚组对应的引物对装配进入引物对的多个单独的池。
根据不同的示例性实施方案,可将不同的参数或标准用于选择引物和/或扩增子。
在实施方案中,可使用正向SNP评分,如果在正向引物的碱基对的给定长度(例如4,例如)内不存在SNP,所述评分可被赋予为1的数字属性/评分,或者如果在4个碱基对的长度内存在1个或多个SNP,则被赋予为0的数字属性。在一个实施方案中,如果在来自正向引物的3’末端的碱基对的给定长度内不存在SNP,则正向SNP评分可被赋予为1的数字属性/评分。在一些实施方案中,SNP可包括在UCSC的Genome Browser网页上发现的一个或多个SNP,包括但不限于称为“dbSNP132common”的SNP参考表。为1的属性/评分可以是最小属性/评分,以便未达到该属性/评分将导致不合格。属性/评分测定的碱基长度阈值可比4更低或更高,可以为例如5,6,7,8,9,10,15,20,或更一般地大于4的任何正整数。属性/评分可以不是二元的,其可以是在碱基对的给定长度内SNP的数目的更复杂的线性或非线性函数。
在实施方案中,可使用反向SNP评分,如果在反向引物的碱基对的给定长度(例如4,例如)内不存在SNP,所述评分可被赋予为1的数字属性/评分,或者如果在4个碱基对的长度内存在1个或多个SNP,则被赋予为0的数字属性。在一个实施方案中,如果在来自反向引物的3’末端的碱基对的给定长度内不存在SNP,则反向SNP评分可被赋予为1的数字属性/评分。在一些实施方案中,SNP可包括在UCSC的Genome Browser网页上发现的一个或多个SNP,包括但不限于称为“dbSNP132common”的SNP参考表。为1的属性/评分可以是最小属性/评分,以便未达到该属性/评分可导致不合格。属性/评分测定的碱基长度阈值可比4更低或更高,可以为例如5,6,7,8,9,10,15,20,或更一般地大于4的任何正整数。属性/评分可以不是二元的,其可以是在碱基对的给定长度内SNP的数目的更复杂的线性或非线性 函数。
在实施方案中,可使用正向重复序列评分,如果在正向引物的碱基对的给定长度(例如4,例如)内不存在重复序列,所述评分可被赋予为1的数字属性/评分,或者如果在4个碱基对的长度内存在1个或多个重复序列,则被赋予为0的数字属性。在一个实施方案中,如果正向引物与已知的重复序列存在少于30%的重叠,则正向重复评分可被赋予为1的数字属性/评分。在一些实施方案中,已知的重复序列可包括一个或多个UCSC的Genome Browser报导的重复序列,例如由来自UCSC的屏蔽重复序列的hg19基因组提供的重复序列区域。为1的属性/评分可以是最小属性/评分,以便未达到该属性/评分可导致不合格。属性/评分测定的碱基长度阈值可比4更低或更高,可以为例如5,6,7,8,9,10,15,20,或更一般地大于4的任何正整数。属性/评分可以不是二元的,其可以是在碱基对的给定长度内重复序列的数目的更复杂的线性或非线性函数。
在实施方案中,可使用反向重复序列评分,如果在反向引物的碱基对的给定长度(例如4,例如)内不存在重复序列,所述评分可被赋予为1的数字属性/评分,或者如果在4个碱基对的长度内存在1个或多个重复序列,则被赋予为0的数字属性。在一个实施方案中,如果反向引物与已知的重复序列存在少于30%的重叠,则反向重复评分可被赋予为1的数字属性/评分。在一些实施方案中,已知的重复序列可包括一个或多个UCSC的Genome Browser报导的重复序列,例如由来自UCSC的屏蔽重复序列的hg19基因组提供的重复序列区域。为1的属性/评分可以是最小属性/评分,以便未达到该属性/评分可导致不合格。属性/评分测定的碱基长度阈值可比4更低或更高,可以为例如5,6,7,8,9,10,15,20,或更一般地大于4的任何正整数。属性/评分可以不是二元的,其可以是在碱基对的给定长度内重复序列的数目的更复杂的线性或非线性函数。
在不同的实施方案中,可使用正向三联体评分、反向三联体评分、正向A run评分、反向A run评分、正向C run评分、反向C run 评分、正向G run评分、反向G run评分、正向Trun评分和反向Trun评分的一个或多个,其可被赋予等于整个引物内的正向三联体、反向三联体、正向A run、反向A run、正向C run、反向C run、正向G run、反向G run、正向T run和反向T run的数目的数字属性/评分。为3的属性/评分可以是三联体的最大属性/评分,以便未能保持在该属性/评分或未能低于该属性/评分可导致不合格。为5的属性/评分可以是run的最大属性/评分,以便未能保持在该属性/评分或未能低于该属性/评分可导致不合格。属性/评分可以不是二元的,其可以是三联体/run的数目的更复杂的线性或非线性函数。
在实施方案中,引物的长度可受到最小引物长度阈值和最大引物长度的限制,并且可设置引物的长度评分以使其随长度变得比最小引物长度阈值短而减小,以及随长度变得比最大引物长度阈值长而减小。在实施方案中,最小引物长度阈值可以为16。在其它实施方案中,最小引物长度阈值可以为例如15,14,13,12,11,10,9,8,7,6或5,并且还可以为例如17,18,19,20,21,22,23和24。在实施方案中,最大引物长度阈值可以为28。在其它实施方案中,最大引物长度阈值可以为例如29,30,31,32,33,34,35,36,37,38,39和40,以及还可为例如27,26,25,24,23,22,21和20。在实施方案中,例如,如果长度阈值得以满足,则引物长度标准可被赋予为1.0的评分,并且随着引物长度偏离最小或最大长度阈值,该评分可下降至0.0。例如,如果最大引物长度阈值被设置至28,则如果长度不超过28,评分可被设置至1.0,如果长度为29,则评分可被设置至0.7,如果长度为30,则评分可被设置至0.6,如果长度为31,则评分可被设置至0.5,如果长度为32,则评分可被设置至0.3,如果长度为33,则评分可被设置至0.1,以及如果长度为34或更长,则评分可被设置至0.0。当然,可使属性/评分在除0.0和1.0外的值之间的范围内,确定评分如何随相对于阈值增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与长度阈值进一步偏离的引物的评分的增加。
在实施方案中,引物中的G碱基的(或A、C或T碱基)的数目受 到最大阈值的限制,并且设置引物的相应评分以使其随着G碱基(或A、C或T碱基)的数目超过最大阈值而减小。在实施方案中,最大阈值可以为3。在其它实施方案中,最大阈值可以为例如2,4,5,6,7,8,9和10。在实施方案中,例如,如果最大阈值得以满足,则G碱基(或A、C或T碱基)的数目标准可被赋予1.0的评分,并且该评分随着G碱基(或A、C或T碱基)的数目偏离最大阈值可下降至0.0。例如,如果最大阈值被设置至4,则如果G碱基(或A、C或T碱基)的数目不超过4,评分可被设置至1.0,如果数目为5,则评分可被设置至0.9,如果数目为6,则评分可被设置至0.8,如果数目为7,则评分可被设置至0.6,如果数目为8,则评分可被设置至0.4,如果数目为9,则评分可被设置至0.2,以及如果数目为10或更多,则评分可被设置至0.0。当然,可使评分在除0.0和1.0外的值之间的范围内,确定评分如何随G碱基(或A、C或T碱基)的数目与最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与最大阈值进一步偏离的引物的评分的增加。
在实施方案中,引物中的环(例如,发夹)中的连续的和总的匹配的数目可受到最大阈值的限制,并且设置引物的相应评分以使其随环中连续的和总的匹配的数目超过最大阈值而减小。在实施方案中,连续匹配的最大阈值可为3,以及总的匹配的最大阈值可为5。在其它实施方案中,连续匹配的最大阈值可以为例如2,4,5,6,7,8,9和10,总的匹配的最大阈值可为例如3,4,6,7,8,9,10,11,12,13,14和15。在实施方案中,例如,如果最大阈值得以满足,则环标准中连续和总的匹配的数目可被赋予1.0的评分,并且该评分可随环中连续的和总的匹配的数目偏离相应的最大阈值下降至0.0。例如,如果连续匹配的最大阈值被设置至3,则如果连续匹配的数目不超过3,评分可被设置至1.0,如果数目为4,则评分可被设置至0.9,如果数目为5,则评分可被设置至0.7,如果数目为6,则评分可被设置至0.4,如果数目为7,则评分可被设置至0.2,如果数目为8,则评分可被设置至0.1,以及以及如果数目为9或更多,则评分可被设置至0.0。例如,如果总的匹 配的最大阈值被设置至5,则如果总的匹配的数目不超过5,评分可被设置至1.0,如果数目为6,则评分可被设置至0.9,如果数目为7,则评分可被设置至0.8,如果数目为8,则评分可被设置至0.6,如果数目为9,则评分可被设置至0.4,如果数目为10,则评分可被设置至0.2,如果数目为11,则评分可被设置至0.1,以及如果数目为12或更多,则评分可被设置至0.0。当然,可使评分在除0.0和1.0外的值之间的范围内,确定评分如何随连续/总的匹配的数目与相应的最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与最大阈值进一步偏离的引物的评分的增加。
在实施方案中,引物的最后5个碱基的G和C碱基(或A、C、G和T碱基的任意两个)的数目可受到最大阈值的限制,并且可设置相应的引物的评分以使其随G和C碱基(或A、C、G和T碱基的任意两个)的数目超过最大阈值而减小。在实施方案中,最大阈值可以为2。在其它实施方案中,最大阈值可以为例如3、4和5。在实施方案中,例如,如果最大阈值得以满足,则G和C碱基(或A、C、G和T碱基的任意两个)的数目标准可被赋予1.0的评分,例如,随着G和C碱基(或A、C、G和T碱基的任意两个)的数目偏离最大阈值,则该评分可下降至0.0。例如,如果最大阈值被设置至2,则如果G和C碱基(或A、C、G和T碱基的任意两个)的数目不超过2,那么评分可被设置至1.0,如果数目为3,则评分可被设置至0.8,如果数目为4,则评分可被设置至0.4,以及如果数目为5,则评分可被设置至0.1。当然,可使评分在除0.0和1.0外的值之间的范围内,确定评分如何随G和C碱基(或A、C、G和T碱基的任意两个)的数目与相应的最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与最大阈值进一步偏离的引物的评分的增加。在其它实施方案中,例如,该标准考虑了更大的碱基窗口中,例如在最后6个碱基,最后7个碱基,最后8个碱基等等中的G和C碱基(或A、C、G和T碱基的任意两个)的数目。
在实施方案中,引物中G和C碱基(或A、C、G和T碱基的任 意两个)的百分比可受到最小和最大阈值的限制,并且可设置相应的引物的评分以使其随G和C碱基(或A、C、G和T碱基的任意两个)的百分比偏离最小或最大阈值而减小。在实施方案中,例如,最小阈值可以为0.2(20%),最大阈值可为0.8(80%)。在其它实施方案中,例如,最小阈值可为约0.2(20%)与约0.5(50%)之间的任意百分比,最大阈值可以为约0.8(80%)与0.5(50%)之间的任意百分比。在实施方案中,例如,如果最小和最大阈值得以满足,则G和C碱基(或A、C、G和T碱基的任意两个)的百分比标准可被赋予1.0的评分,并且如果任一阈值未得以满足,则该值可下降至0.0。当然,可使评分在除0.0和1.0外的值之间的范围内,确定评分如何随G和C碱基(或A、C、G和T碱基的任意两个)的百分比与最小或最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与最小或最大阈值进一步偏离的引物的评分的增加。
在实施方案中,引物的熔解温度(Tm)可受最小和最大阈值的限制,并且可设置相应的引物的评分以使其随熔解温度偏离最小或最大阈值而减小。在实施方案中,例如,最小阈值可以为60,最大阈值可为67,靶熔解温度为62。在其它实施方案中,例如,最小阈值可为约55与约65之间的值,最大阈值可以为约62与约72之间的值。在实施方案中,例如,如果最小和最大阈值得以满足,则熔解温度标准可被赋予1.0的评分,并且如果任一阈值未得以满足,则评分可下降至0.0。当然,可使评分在除0.0和1.0外的值之间的范围内,确定评分如何随熔解温度与最小或最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与最小或最大阈值进一步偏离的引物的评分的增加。引物的熔解温度可使用John SantaLucia,Jr.,“A unified view of polymer,dumbbell,and oligonucleotide DNA nearest-neighbor thermodynamics,”Proc.Natl.Acad.Sci.USA,第95卷,1460-1465(1998)(将其公开内容通过引用整体并入本文)中所示的教导来计算。
在实施方案中,引物中的引物二聚体倾向性可受到3’末端上的连 续引物二聚体的最大阈值和整个长度上的总的连续匹配的最大阈值限制,并且可设置相应的引物的评分以使其随引物二聚体倾向性偏离最大阈值而减小。在实施方案中,3’末端上的连续引物二聚体的最大阈值可以为4,整个长度上的总的连续匹配的最大阈值可以为8。在其它实施方案中,例如,3’末端上的连续引物二聚体的最大阈值可以为约2至约6之间的值,整个长度上的总的连续匹配的最大阈值可以为约4至10之间的值。在实施方案中,例如,如果阈值得以满足,则引物二聚体倾向性标准可被赋予为1.0的评分,如果阈值未得到满足,则该评分可下降至0.0。当然,可使评分在除0.0和1.0外的值之间的范围内,确定评分如何随引物二聚体倾向性与最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与最大阈值进一步偏离的引物的评分的增加。
在实施方案中,扩增子序列中的G和C碱基(或A、C、G和T碱基的任意两个)的百分比可受到最小和最大阈值的限制,并且可设置相应的扩增子的评分以使其随G和C碱基(或A、C、G和T碱基的任意两个)的百分比偏离最小或最大阈值而减小。在实施方案中,最小阈值可为0.0(0%),最大阈值可为1.0(100%)。在其它实施方案中,例如最小阈值可为约0.1(10%)与约0.25(25%)之间的任意百分比,最大阈值可为约0.75(75%)与0.9(90%)之间的任意百分比。在实施方案中,例如,如果最小和最大阈值得以满足,则G和C碱基(或A、C、G和T碱基的任意两个)的百分比标准可被赋予为1.0的评分,如果任一阈值未得到满足,则评分可下降至0.0。当然,可使评分在除0.0和1.0外的值之间的范围内,确定评分如何随G和C碱基(或A、C、G和T碱基的任意两个)的百分比与最小或最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与最小或最大阈值进一步偏离的扩增子的评分的增加。
在实施方案中,扩增子序列的长度可受到最小扩增子长度阈值和最大扩增子长度的限制,并且可设置相应的扩增子的长度评分以使其随长度变得比最小扩增子长度阈值短时而减小,以及随长度变得比最 大扩增子长度阈值长而减小。在实施方案中,最小扩增子长度阈值可为110。在其它实施方案中,例如,最小引物长度阈值可为约80与约140之间的值。在实施方案中,最大扩增子长度阈值可为240。在其它实施方案中,例如,最大扩增子长度阈值可为约200与约280之间的值。在实施方案中,如果长度阈值得以满足,则扩增子长度标准可被赋予为1.0的评分,如果任一标准未得以满足,则扩增子长度标准可被赋予为0.0的评分。在另一个实施方案中,随着扩增子长度偏离最小或最大长度阈值,该评分可下降至0.0。例如,如果最大扩增子长度阈值被设置至240,则如果长度不超过240,评分可被设置至1.0,如果长度为至少250,则评分可被设置至0.8,如果长度为至少260,评分可被设置至0.6,如果长度为至少270,评分可被设置至0.4,如果长度为至少280,评分可被设置至0.1,以及如果长度为至少290,则评分可被设置至0.0。当然,可使评分在除0.0和1.0外的值之间的范围内,确定评分如何随相对于阈值的增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与长度阈值进一步偏离的扩增子的评分的增加。
根据示例性实施方案,提供了用于使用一个或多个扩增子的池从多个候选扩增子选择一个亚组(其在本文中可称为“拼接”)的扩增子(其在本文中可称为“小区”)以覆盖一个或多个特定的期望的(例如,订制的)基因组区域或靶的方法。方法可包括接收一组一个或多个靶和一组候选扩增子作为输入,并且可包括输出一个亚组的候选扩增子以及亚组中的每一个扩增子至池(其中该扩增子可被多重化)中的分配作为输出。可使用具有任何适当的大小的扩增子。在实施方案中,例如,测定或引物设计可适应200bp扩增子和150bp扩增子,例如,其对于某些挑战性样品例如FFPE可以是特别有用的。在实施方案中,测定或引物设计可经改造适合于与一个或多个特定文库试剂盒例如Ion AmpliSeqTM Library试剂盒2.0相容。
根据示例性实施方案,提供了用于拼接和混合的方法,包括(1)从一组输入扩增子选择一个亚组的扩增子(这在本文中可称为“拼接”), 以便该亚组的扩增子(i)覆盖与输入扩增子的组中的扩增子所覆盖的同样多的靶,(ii)具有很多比输入扩增子的组小的扩增子,和(iii)使扩增子的质量最大化;和(2)将扩增子的该亚组中的每一个扩增子或小区分配或拼接至池中以允许每一个池被多重化。
图23举例说明用于根据示例性实施方案拼接一个或多个给定的靶的多个扩增子的方法。在步骤2301中,模块或其它硬件和/或软件构件根据它们的起始位点分选一个或多个给定的靶(或当提供为输入时,确保已以这样的方式对给定的靶进行了预分选)。在步骤2302中,模块或其它硬件和/或软件构件根据***物起始位点分选扩增子(或当作为输入提供时,确保已以这样的方式对扩增子进行了预分选)。在步骤2303中,模块或其它硬件和/或软件构件合并存在于分选的一个或多个靶中的重叠靶。在步骤2304中,对于每一个合并的重叠靶,模块或其它硬件和/或软件构件(i)确定什么扩增子具有与靶重叠的***物以及将这样的扩增子鉴定为候选扩增子,和(ii)使用一个或多个给定的靶和候选扩增子的函数确定小区。在步骤2305中,模块或其它硬件和/或软件构件输出确定的小区。在一些实施方案中,可在或可以不在聚集任何靶扩增子之前合并靶,可聚集扩增子以用于未合并的靶,并且,如果两个靶共有至少一个扩增子,这样的两个靶可被合并在一起(并且两个靶中的一个可以已代表一组合并的输入扩增子)。
根据示例性实施方案,提供了用于拼接一个或多个给定的靶的多个扩增子的方法,包括:(1)根据它们的起始位点分选一个或多个给定的靶,或当作为输入提供时,确保给定的靶已以这样的方式进行了预分选;(2)根据***物的起始位点分选扩增子,或当作为输入提供时,确保扩增子已以这样的方式进行了预分选;(3)合并存在于分选的一个或多个靶中的重叠靶;(4)对于每一个合并的重叠靶,(i)确定什么扩增子具有与靶重叠的***物以及将这样的扩增子鉴定为候选扩增子,和(ii)使用一个或多个给定的靶和候选扩增子的函数确定小区;和(5)输出小区。
图24举例说明根据示例性实施方式的用于确定一个或多个给定 的靶和候选扩增子的小区的方法。在步骤2401中,模块或其它硬件和/或软件构件产生候选***物的重叠图,该图包括源顶点、一个或多个扩增子顶点和沿着一个或多个连接顶点的边的汇点顶点。在步骤2402中,模块或其它硬件和/或软件构件确定了边成本函数或使用已确定的边成本函数。在步骤2403中,模块或其它硬件和/或软件构件从源顶点至汇点顶点发现这样的的边成本函数的最低成本路径。在步骤2404中,模块或其它硬件和/或软件构件从源至汇点的最低成本路径提取小区。在步骤2405中,模块或其它硬件和/或软件构件返回提取的小区。
根据示例性实施方案,提供了用于确定一个或多个给定的靶和候选扩增子的小区的方法,包括:(1)产生候选***物的重叠图,重叠图包括一组顶点V和一组边E(例如,图G=(V,E)),这样产生包括(i)使V等于候选扩增子的组(其每一个被赋予相应的顶点)与由源组件和汇点组件组成的组的合并(例如,V={扩增子}U{源,汇点}),(ii)将源顶点与所有初始顶点连接并且将汇点顶点连接至所有末端顶点,(iii)将每一个扩增子顶点连接至所有随后的适当的重叠,和(iv)将缺口左边上的最右边的顶点连接至该缺口的右边上的最左边的顶点;(2)确定边成本函数或使用已确定的边成本函数;(3)从源顶点至每个顶点发现这样的边成本函数的最低成本路径;(4)从源至汇点的最低成本路径提取小区;和(5)返回提取的小区。
图25A举例说明一组用于覆盖组定的靶区域的候选扩增子,每一个包含被一对引物包围的***物,用于根据示例性实施方案的拼接和混合。点线表示靶区域(在本实施例中在染色体19上)的边界。
图25B举例说明一组用于产生图的顶点。顶点V包括对应于图25A中举例说明的15个候选扩增子的15个扩增子顶点(白色)以及源顶点(浅灰色或绿色,左)和汇点顶点(深灰色或红色,右)。
图26A举例说明图25A的15个候选扩增子,除3个在它们的***物与靶区域的起始位点之间具有至少一定重叠的“初始”扩增子被突出显示外。
图26B举例说明利用边将源顶点连接至对应于图26A的初始扩增 子的3个顶点。
图27A举例说明图25A的15个候选扩增子,除3个在它们的***物与靶区域的末端之间具有至少一些重叠的“末端”扩增子被突出显示外。
图27B举例说明利用边将汇点顶点连接至对应于图27A的末端扩增子的3个顶点。
图28A举例说明图25A的15个候选扩增子,除用于构建内边的各种扩增子被突出显示外。
图28B举例说明根据示例性实施方案进行的一些扩增子***物顶点至随后的适当的重叠的连接。显示了连接9767127扩增子顶点与9767463和9767519扩增子顶点(其***物与9767127扩增子顶点的***物重叠)的箭头,以及连接9767610扩增子顶点与9767780和9767756扩增子顶点(其***物与9767610扩增子顶点的***物重叠)的箭头。
图29A举例说明根据示例性实施方案进行的另外的扩增子***物顶点至随后的适当的重叠的连接。还显示了当候选扩增子不完全覆盖靶时可产生的断开或缺口。
图29B举例说明图25A的15个候选扩增子以及根据示例性实施方案的图29A中显示的缺口的基础。
图30A举例说明可用于根据示例性实施方案从源至汇点拼接本实例中的靶的3个可能的另外的边。在实施方案中,在可能的路径中,可选择具有最低成本的路径。
图30B举例说明根据示例性实施方案将成本赋予图的连接扩增子顶点的边的每一个的边成本函数的示例性定义。
图30C举例说明根据示例性实施方案的图30B的实例中的从源至汇点的最低成本通路。
图31举例说明图25A的15个候选扩增子,除对应于形成图30C中显示的最低成本通路的顶点的5个扩增子被突出显示外。
根据示例性实施方案,可使用O(|V|+|E|)算法确定最低成本通路。最低成本通路可如下确定:(1)对于每一个顶点v,(i)从源顶点至v初 始化D[v]至无穷大(过程的到目前为止的最低成本)以及将D[源]初始化为0,和(ii)将Pred[v]初始化为空(从源顶点至v的最低成本路径中的v的前任);和(2)对于拓扑排序中的每一个顶点u,对于adj[u]中的每一个顶点v,如果D[u]+成本(u,v)<D[v],则使D[v]=D[u]+成本(u,v)以及Pred[v]=u。关于用于在图上构建路径的算法的更多信息可见于Dijkstra,“A Note on Two Problems inConnexion with Graphs,”Numerische Mathematik,第1卷,269-271(1959)和Sniedovich,“Dijkstra’s algorithm revisited:the dynamic programming connexion,”Controland Cybernetics,第35卷,599-620(2006)(将所述两篇文献通过引用整体并入本文)中。
根据示例性实施方案,路径的成本(例如,扩增子+“联合”冗余性)可以是形成路径的边的和。在实施方案中,路径的成本可使用下面的公式1来确定:
公式1:
根据示例性实施方案,形成路径的边的成本可以是使用被选择来混合两个成本的因子α(例如0≤α≤1)加权的扩增子成本与重叠成本之和。在实施方案中,形成路径的边的成本可使用下面的公式2来确定:
公式2:成本(u,v)=α成本(v.扩增子)+(1-α)成本(重叠(u,v))
根据示例性实施方案,提供了用于测定与扩增子的拼接或亚组相关的成本的方法。在实施方案中,拼接的成本可以是拼接中的每一个扩增子的成本+任一个或多个***物重叠的成本的和。扩增子的成本可被赋予在任何适当的预定的值范围内的任何适当值,以便低值赋予低成本,高值赋予高成本,以处罚各种不期的特征例如,脱靶扩增、引物二聚体倾向性等。例如,扩增子的成本可被赋予1至10的值,以便更高/更低的成本与不期望的特征的更高/更低水平相关(例如,使用任何适当的关系,其可以是线性/成比例的或非线性)。***物重叠的成本也可被类似地赋予在任何适当的预定的值范围内的任何适当的值,例如,以便低值赋予低成本,高值赋予高成本,以处罚各种不期 的特征例如,通过重叠***物引入的冗余性。例如,***物重叠的成本也可被赋予1至10的值。在实施方案中,可选择从一组候选扩增子选择最低成本拼接。在实施方案中,***物重叠的成本可使用下面的公式3,基于通过重叠***物引入的冗余性来测定:
公式3:
根据示例性实施方案,扩增子和特异性的成本可通过拼接物的拼接硬件或软件构件来用于计算边的成本。在实施方案中,可使用允许进行拼接物中的顶点的刻度化成本计算的成本***。扩增子的成本可以是扩增子成本和特异性成本的复合体。扩增子成本可反映PCR扩增的质量,特异性成本可反映扩增子扩增脱靶核苷酸的倾向性。
在实施方案中,扩增子的成本可如下进行测定:最初,可将阈值用于滤过允许潜在脱靶扩增的引物。可基于程序例如e-PCR2(NCBI)(参见Rotmistrovsky等人,“A web serverfor performing electronic PCR,”Nucleic Acids Research,第32卷,W108-W112(2004)和Schuler,“Sequence Mapping by Electronic PCR,”Genome Research,第7卷,541-550(1997)(将所述两篇文献通过引用并入本文))或能够用于滤过引物的其它类似程序使用滤过器。各种分选策略可用于滤过。在不同的实施方案中,可滤过正向和反向引物的评分之和小于某一最小评分阈值(例如,150)或显示超过50次评分小于某些阈值(例如,200)的命中的测定。当然,数值截断值可以不同并且可根据使用的软件而变化。在不同的实施方案中,可使用转换表(例如下文中例举的)将用于滤过的评分转换成成本:
在该示例性表中,第一栏代表sp_评分,其是特异性评分;第二栏代表sp_命中,其是彼此相对的正向和反向引物的匹配数;第三栏是对应的成本。第一完全匹配是免费的,因为其自我匹配的。在实施方案中,Acost是基于合并sp_评分值的成本,Bcost是基于sp_命中值的成本,扩增子成本可使用公式来计算:扩增子成本=0.9*Acost+0.1*Bcost。
图32举例说明根据示例性实施方案分配至第一池的3个扩增子和分配至第二池的2个扩增子。点线表示靶区域(在本实例中在染色体19上)的边界。如所举例说明的,第一和第二池中的扩增子基本上覆盖靶区域,缺口除外。
根据示例性实施方案,提供了用于将扩增子混合至一个或多个扩增子的池中的方法。在实施方案中,方法可使用一个或多个混合标准混合扩增子,所述标准至少部分地与池的大小相关。在实施方案中,池的数目可受到池的预定最大数目的限制,例如,其可以是10个池,或例如其可以是50,40,30,20,9,8,7,6,5,4,3,2或1个,或任何其它正整数。在实施方案中,每一个池的容量(例如,池的最大大小)还可受限于预定最大值,其可以是任何固定数目的扩增子,其可以为约10,000、约7,500、约5,000、约2,500、约2,000、约1,500、约1,000和约500,或例如,这些实例之间的任何值,例如,其可以是最大768或1,536个扩增子。在实施方案中,可使用平衡因子,其可以是例如约60%至100%,或约65%至95%,或约70%至90%,或约90%的百分比。在实施方案中,池的大小p可受到下面公式4中所示的不等式的限制:
公式4:
根据示例性实施方案,池内距离可受到最小阈值距离的限制,其可以是例如碱基对的整数数目(例如,50个碱对,或5,10,15,20等,或任何预定的碱基对数目)。
图33A举例说明根据示例性实施方案的扩增子之间的最小距离。图33B-D举例说明可通过使用图33A中举例说明的最小距离改进的几个问题,包括引物“竞态条件”(参见图33B)、亚扩增子的优先扩增(参见图33C)和超级扩增子(参见图33D)。在实施方案中,例如,距离可使用公式5来测定。这样的方法可防止或减少“竞态条件”、亚扩增子的优先扩增和超级扩增子。
公式5:距离(a,b)=max(a.起始,b.起始)–min(a.末端,b.末端)–1
根据示例性实施方案,扩增子在某些情况下失去被添加至池中的资格。例如,如果下列标准的一个或多个得以满足,不可将扩增子amp添加至池p:(1)池p的大小等于或超过池容量限制;(2)池p的大小等于最大池的大小(例如,尺寸(p)=尺寸(最大池))并且最小池的大小小于(i)池p的大小+1与(ii)平衡因子(例如,大小(最小池)<最低((大小(p)+1)平衡因子))之积的最低(四舍五入)值;和(3)amp与已存在于池中的任何其它扩增子之间的距离小于最小的扩增子间隔阈值(例如,该距离可使用例如公式5来测定)。
图34举例说明用于根据示例性实施方案将扩增子在多个池间混合的方法。在步骤3401中,模块或其它硬件和/或软件构件通过减小优先权分选扩增子。在步骤3402中,模块或其它硬件和/或软件构件起始第一可获得的池。在步骤3403中,模块或其它硬件和/或软件构件清空所有可获得的池。在步骤3404中,对于分选的扩增子中的每一个扩增子,模块或其它硬件和/或软件构件,(i)确定一组其中可将扩增子多重化的相容性池,(ii)如果存在至少一个相容性池,则将扩增子置于使扩增子与相容性池中的任何其它扩增子之间的最小距离最大化的第一相容性池中,(iii)如果不存在相容性池,则如果可添加新池,就添加新池并且返回至步骤3403,和(iv)如果不存在相容性池并且无池可添加,则将扩增子置于扩增子的溢流(未混合的))列表中。在步骤3405中,模块或其它硬件和/或软件构件输出池。
根据示例性实施方案,用于在多个池间混合扩增子的方法包括:(1)通过减小优先权分选扩增子;(2)起始第一可获得的池;(3)清空所有可获得的池;(4)对于分选的扩增子中的每一个扩增子,(i)确定一组其中可将扩增子多重化的相容性池,(ii)如果存在至少一个相容性池,则将扩增子置于使扩增子与相容性池中的任何其它扩增子之间的最小距离最大化的第一相容性池中,(iii)如果不存在相容性池,则如果可添加新池,就添加新池并且返回至步骤(3),和(iv)如果不存在相容性池并且无池可添加,则将扩增子置于扩增子的溢流(未混合的)列表中。该方法还可包括输出扩增子池。
这样的方法可帮助确保PCR池覆盖与作为输入提供的候选扩增子所覆盖的靶一样多的靶。其可产生少量PCR池(例如,2、4个等)。池中的引物将不会相互作用,这可帮助避免不期望的优先扩增、引物杂交的“竞态条件”竞争、和超级扩增子。此外,这样的方法可极快地进行,并且仅使用合理量的内存。
图35举例说明用于按照示例性实施方案拼接的方法。在步骤3501中,模块或其它硬件和/或软件构件接收或提供基因组靶区域和基因组靶区域的一组候选扩增子作为输入。在步骤3502中,模块或其它硬件和/或软件构件产生包含源顶点、一组与候选扩增子的组一致地排列的扩增子顶点和汇点顶点的图。在步骤3503中,模块或其它硬件和/或软件构件确定与整个图上从源顶点经扩增子顶点至汇点顶点的一个或多个路径相关的成本。在步骤3504中,模块或其它硬件和/或软件构件从整个图上具有与其相关的最低成本的一个或多个路径之一提取扩增子顶点。在一些实施方案中,这样的方法可被扩展至用于通过使用对应于提取的顶点的扩增子作为输入在多个池间混合扩增子的方法。例如,可对对应于提取的顶点的扩增子进行例如图33中描述的不同步骤以混合扩增子。
根据示例性实施方案,提供了方法,包括:(1)接收或提供基因组靶区域和基因组靶区域的一组候选扩增子作为输入;(2)产生包含源顶点、一组与候选扩增子的组一致地排列的扩增子顶点和汇点顶点的图; (3)确定整个图上与从源顶点经扩增子顶点至汇点顶点的一个或多个路径相关的成本;和(4)从整个图上具有与其相关的最低成本的一个或多个路径之一提取扩增子顶点。
在不同的实施方案中,一个或多个路径可包括一系列扩增子,其中扩增子的系列中第一扩增子的***物的末端部分与扩增子系列中第二扩增子的***物的起始部分重叠。扩增子的系列中第二扩增子的***物的末端部分可与扩增子系列中第三扩增子的***物的起始部分重叠。扩增子的系列中第三扩增子的***物的末端部分可与扩增子系列中第四扩增子的***物的起始部分重叠。
在不同的实施方案中,一个或多个路径可包含N个扩增子的系列,N是正整数,其中扩增子的系列中的扩增子amp的***物的末端部分与扩增子序列中扩增子amp+1的***物的起始部分重叠,其中amp是采用值1,...,N-1的整数。一个或多个路径可包含一系列L=N+M个扩增子,N和M是正整数,其中扩增子的系列中的扩增子amp的***物的末端部分与扩增子序列中扩增子amp+1的***物的起始部分重叠(其可包括仅仅接触),其中amp是采用1,...,N-1的整数;其中扩增子的系列中的扩增子amp的***物的末端部分与扩增子序列中扩增子amp+1的***物的起始部分重叠(其可包括仅仅接触),其中amp是采用值N+1,...,N+M-1的整数;其中在扩增子amp=N的***物的末端部分与扩增子amp=N+1的***物的起始部分之间存在缺口。
在不同的实施方案中,与一个或多个路径的每一个相关的成本可以是连接两个扩增子顶点的路径的每一条边的成本之和。与连接两个扩增子顶点的路径的每一条边相关的成本可以是与边的终点扩增子顶点的成本相关的第一项和与边的终点扩增子的***物与边的起始扩增子的***物之间的重叠的成本相关的第二项之和。第一项和第二项可通过混合因子(blending factor)加权,以便第一项可通过混合因子或其函数多重化,第二项通过1减去混合因子或其函数来多重化。扩增子顶点的成本可以是代表更低水平的一个或多个不期望的特征(选自至 少一定水平的脱靶扩增和一定水平的引物二聚体倾向性)的第一值与代表更高水平的一个或多个不期望的特征的第二值之间的等级的数值。边的终点扩增子的***物与边的起始扩增子的***物之间的重叠的成本可基于通过重叠***物引入的冗余性来确定。边的终点扩增子的***物与边的起始扩增子的***物之间的重叠的成本,可以是边的终点扩增子的***物与边的起始扩增子的***物之间的重叠中的碱基对数目与边的终点扩增子的***物与边的起始扩增子的***物的联合中的碱基对数目之商的函数。
在不同的实施方案中,这样的方法还可包括确定对应于提取的扩增子的扩增子至一个或多个扩增子的池内的混合。确定扩增子的混合可包括限制扩增子池的数目和每一个扩增子池的容量。确定扩增子的混合可包括将扩增子池的数目限制于约2至约5的阈值数目,以及例如将每一个扩增子池的容量限制于约500个扩增子至约2,500个扩增子的阈值容量。确定扩增子的混合可包括基于其它池的最大大小限制一个或多个池的任一个的大小。
在不同的实施方案中,确定扩增子的混合可包括至少基于给定的池中的扩增子序列之间的最小阈值距离来限制一个或多个扩增子至给定的池中的包含。例如,最小阈值距离可以为约5个碱基对至约100个碱基对。
根据示例性实施方案,提供了包含指令的非暂时性机器可读存储介质,所述指令,当通过处理器执行时,使处理器进行下列方法,包括:(1)接收或提供基因组靶区域和基因组靶区域的一组候选扩增子作为输入;(2)产生包含源顶点、一组与候选扩增子的组一致地排列的扩增子顶点和汇点顶点的图;(3)测定整个图上与从源顶点经扩增子顶点至汇点顶点的一个或多个路径相关的成本;和(4)从整个图上具有与其相关的最低成本的一个或多个路径之一提取扩增子顶点。在一些实施方案中,这样的方法可被扩展至用于通过使用对应于提取的顶点的扩增子作为输入在多个池间混合扩增子的方法。例如,可对对应于提取的顶点的扩增子进行例如图33中描述的不同步骤以混合扩增子。
在不同的实施方案中,这样的非暂时性机器可读介质可包含指令,所述指令,当被处理器执行时,使处理器进行还包括确定对应于提取的扩增子的扩增子至一个或多个扩增子的池中的混合的方法。
根据示例性实施方案,提供了***,其包括:(1)机器可读内存;和(2)被构造来执行机器可读指令的处理器,所述指令,当被处理器执行时,使***进行步骤,包括:(a)接收或提供基因组靶区域和基因组靶区域的一组候选扩增子作为输入;(b)产生包含源顶点、一组与候选扩增子的组一致地排列的扩增子顶点和汇点顶点的图;(c)测定整个图上与从源顶点经扩增子顶点至汇点顶点的一个或多个路径相关的成本;和(d)从整个图上具有与其相关的最低成本的一个或多个路径之一提取扩增子顶点。在一些实施方案中,这样的***可被扩展至用于通过使用对应于提取的顶点的扩增子作为输入在多个池间混合扩增子的***。例如,可对对应于提取的顶点的扩增子进行例如图33中描述的不同步骤以混合扩增子。
在不同的实施方案中,这样的***的处理器还可被构造来执行机器可读指令,所述指令,当通过处理器执行时,使***进行步骤,包括确定对应于提取的扩增子的扩增子至一个或多个扩增子的池中的混合。
根据不同的示例性实施方案,上述教导和/或示例性实施方案的任一个或多个的一个或多个特性可使用适当构造和/或编程的硬件和/或软件组件来进行或执行。确定实施方案是否使用硬件和/或软件组件来执行可基于许多因素,例如期望的计算速度、功率水平、耐热性、处理周期预算、输入数据速度、输出数据速度、内存资源、数据总线速度等以及其它设计或性能限制。
硬件组件的实例可包括处理器、微处理器、输入和/或输出(I/O)设备(或***设备),其可通过局部接口电路、电路元件(例如,晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑器件(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体器件、芯片、微型芯片、集成电路 片等以通信方式偶联。局部接口可包括例如一个或多个总线或其它有线或无线连接、控制器、缓冲器(高速缓冲存储器)、驱动器、中继器和接收器等,以允许硬件组件之间的适当通信。处理器是用于执行软件,特别是内存中存储的软件的硬件设备。处理器可以是任何订制的或商购可得的处理器、中央处理器(CPU)、与计算机相关的几个处理器中的辅助处理器、基于半导体的微处理器(例如,以微型芯片或集成电路片的形式存在)、宏处理器或通常用于执行软件指令的任何装置。处理器还可代表分布式处理体系。I/O设备可包括输入设备例如,键盘、鼠标、扫描仪、麦克风、触摸屏、各种医学装置和/或实验室仪器的接口、条形码阅读器、输入笔、激光阅读器、射频装置阅读器等。此外,I/O设备还可包括输出设备例如,打印机、条形码打印机、显示器等。最后I/O设备还可包括输入和输出时通信的设备例如调节器/解调器(调制解调器;用于访问另一个设备、***或网络)、射频(RF)或其它收发器、电话接口、电桥、路由器等。
软件的实例可包括软件构件、程序、应用、计算机程序、应用程序、***程序、机器程序、操作***软件、中间件、固件、软件模块、例行程序、子例程、函数、方法、过程、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、字段、值、符号或其任意组合。内存中的软件可包括一个或多个单独的程序,所述程序可包括有序的可执行指令表来执行逻辑功能。内存中的软件可包括用于按照本教导鉴定数据流的***和任何适当的用户订制的或商购可得的操作***(O/S),所述***可控制其它计算机程序例如***的执行,并且提供计划安排、输入-输出控制、文件和数据管理、存储管理、通信控制等。
根据各种示例性实施方案,可使用适当地构造的和/或编程的非暂时性机器可读介质或物品来进行或执行上述教导和/或示例性实施方案的任一个或多个的一个或多个特性,所述介质或物品可存储指令或一组指令,所述指令,如果通过机器执行,可使机器按照示例性实施方案进行方法和/或操作。这样的机器可包括例如,任何适当的处理平 台、计算平台、计算设备、处理设备、计算***、处理***、计算机、处理器、科学或实验室仪器等,并且可使用硬件和/或软件的任意适当的组合来执行。机器可读介质或物品可包括例如,任何适当类型的存储单元、存储设备、存储物品、存储介质、贮存设备、贮存物品、贮存介质和/或贮存单元例如内存、移动或非移动介质、可擦除或非可擦除介质、可写入或可再写入介质、数字或模拟介质、硬盘、软盘、只读存储光盘(CD-ROM)、可读光盘(CD-R)、可再写入光盘(CD-RW)、光盘、磁介质、磁光介质、移动存储卡或盘、各种类型的数字多功能光碟(DVD)、磁带、盒式磁带等,包括适用于计算机的任何介质。内存可包括易失性存储器元件(例如,随机存取存储器(RAM,例如DRAM、SRAM、SDRAM等))和非易失性存储器元件(例如,ROM、EPROM、EEROM、闪速存储器、硬驱、磁带、CDROM等)的任一种或组合。此外,内存可整合电子、磁性、光学和/或其它类型的存储介质。内存可具有分布式结构,其中可将不同组件彼此远距离放置,但仍可被处理器访问。指令可包括任何适当类型的使用任何适当的高水平、低水平、面向对象、可视、汇编和/或解释性编程语言来执行的代码例如源代码、汇编代码、解释代码、可执行代码、静态代码、动态代码、加密代码等。
根据各种示例性实施方案,上述教导和/或示例性实施方案的任一个或多个的一个或多个特性可至少部分地使用分布式、集簇式、远程或云计算资源来进行或执行。
根据各种示例性实施方案,上述教导和/或示例性实施方案的任一个或多个的一个或多个特性可使用源程序、可执行程序(目标代码)、脚本或任何其它包含一组待执行的指令的实体来进行或执行。当使用源程序时,程序可通过编译器、汇编程序、解释器等来翻译,其可以包含或可以不包含在内存中,以结合O/S正确地运行。指令可以是使用(a)面向对象的程序设计语言(其具有数据和方法的类),或(b)过程程序设计语言(其具有例程、子例程和/或函数,包括例如C、C++、Pascal、Basic、Fortran、Cobol、Perl、Java和Ada)来书写。
根据各种示例性实施方案,上述示例性实施方案的一个或多个可包括向用户界面设备、计算机可读存储介质、本地计算机***或远程计算机***传递、显示、存储、打印或输出与可通过这样的示例性方案产生的、访问的或使用的任何信息、信号、数据和/或中间或最终结果相关的信息。这样传递的、显示的、存储的、打印的或输出的信息可以例如采用可检索的和/或可滤过的运行和报告的列表、图、表、图表、照片、表格、关系、序列及其组合的形式。
各种另外的示例性实施方案可通过重复、添加或替代任何一般性或特别地描述的特性和/或组件和/或物质和/或步骤和/或操作条件(上述示例性实施方案的一个或多个中所示的)来产生。此外,应当理解,除非明确地另有所指,否则步骤的顺序或进行某些作用的顺序是非实质性的,只要步骤或作用的目的仍然是可实现的。此外,除非明确地另有所指,否则可同时进行两个或更多个步骤或作用,只要步骤或作用的目的仍然是可实现的。此外,除非明确地另有所述,否则上述示例性实施方案之一中提及的任一个或多个特性、组分、方面、步骤或其它特征可被认为是上述示例性实施方案的其他任何一个的潜在任选的特性、组件、方面、步骤或其它特征,只要上述示例性实施方案的这样的其他任何一个的目的仍然是可实现的。
各种另外的示例性实施方案可通过在上述示例性实施方案中并入一个或多个特性来衍生,所述特性描述于2008年9月18日公布的美国专利申请公布号2008/0228589A1和2004年9月9日公布的美国专利申请公布号2004/0175733A1(将这两个美国专利申请公布的内容通过引用整体并入本文)中。
在一些实施方案中,通过本文中公开的方法产生的扩增的靶序列代表至少60%、70%、80%、90%或更多的从多个靶序列扩增的一个或多个外显子。在一个实施方案中,本发明的扩增的靶序列在长度上为约90至约140个碱基对,在长度上为约100至约200个碱基对,在长度上为约100至约300个碱基对,或在长度上为约100至约400个碱基对。在一个实施方案中,扩增的靶序列包括每一个引物对的正向 引物的长度和互补反向引物的长度。在另一个实施方案中,扩增的靶序列长度包括反向引物的长度和互补的正向引物的长度。在一些实施方案中,减去正向和反向引物长度的扩增的靶序列的长度为约40个碱基对至约350个碱基对。在一些实施方案中,多重PCR反应中产生的扩增的靶序列的长度基本上相同。如本文中所定义的,关于通过本文中公开的方法产生的扩增的靶序列的长度“基本上相同”是指在扩增的靶序列的总数上不超过30%的核苷酸长度的偏差。在一个实施方案中,扩增子的百分比GC含量低于85%、低于75%、低于65%、低于60%或低于50%。在一个实施方案中,反应中基本上全部扩增的靶序列包含30%至低于85%的GC含量。在一个实施方案中,当从存档的或FFPE DNA样品获得核酸分子时,扩增的靶序列的长度通常在长度上为约100至约200个碱基对。在一个实施方案中,如果核酸样品衍生自或获自基因组DNA,则扩增的靶序列的长度在长度上可以为约100至约500个碱基对。
在一些实施方案中,公开的方法的扩增的靶序列可在或可以不在进一步纯化或操作的情况下用于各种下游分析和测定。例如,扩增的靶序列可通过本领域已知的技术例如桥式扩增或emPCR进行克隆性扩增,来产生可用于下一代测序的模板文库。在一些实施方案中,公开的方法的扩增的靶序列或所得的模板文库可用于单核苷酸多态性(SNP)分析、基因分型或表观遗传学分析、拷贝数变异分析、基因表达分析、基因突变的分析包括但不限于检测、预后和/或诊断、罕见或低频率等位基因突变的检测和分析、核酸测序(包括但不限于从头测序、靶向测序)和合成装配分析。在一个实施方案中,扩增的靶序列可用于检测等位基因频率低于5%的突变。在一些实施方案中,本文中公开的方法可用于检测在一群核酸中等位基因频率低于4%、3%、2%或为约1%的突变。另一个实施方案中,可对如本文中所述制备的扩增的靶序列进行测序以从一群核酸分子检测和/或鉴定种系或体细胞突变。
在一些实施方案中,靶特异性引物对中的正向和/或反向靶特异性 引物可与核酸分子的群体“互补”或“基本上互补”。如本文中所述,“与核酸分子的群体基本上互补”是指引物与引物将对其杂交的核酸分子之间的百分比互补性。一般而言,如本文中所用,术语“基本上互补”是指至少70%的互补性。因此,基本上互补是指引物与核酸分子之间至少70%但小于100%的互补性的互补性范围。互补性引物是与核酸分子具有100%互补性的引物。在一个实施方案中,每一个靶特异性引物对被设计用来使对相同多重PCR反应中的另一个引物(或引物对)的交叉杂交降至最少(即,减少引物二聚体的普遍性)。在另一个实施方案中,每一个靶特异性引物对被设计用来使对核酸分子群体中的非特异性核酸序列的交叉杂交降至最少(即,使脱靶杂交降至最少)。在一个实施方案中,每一个靶特异性引物被设计用来使自我互补性、发夹结构或其它二级结构的形成降至最少。
在一些实施方案中,扩增的靶序列通过聚合酶链式反应形成。靶特异性引物的延伸可使用一种或多种DNA聚合酶来实现。在一个实施方案中,聚合酶可以是任意家族A DNA聚合酶(也称为pol I家族)或任何家族B DNA聚合酶。在一些实施方案中,DNA聚合酶可以是能够以更优的准确性和产率(相较于非重组DNA聚合酶)延伸靶特异性引物的重组形式。例如,聚合酶可包括高保真聚合酶或热稳定性聚合酶。在一些实施方案中,用于靶特异性引物延伸的条件可包括‘热启动’条件,例如热启动聚合酶,例如AmplitaqDNA聚合酶(Applied Biosciences)、Taq DNA Polymerase High Fidelity(Invitrogen)或KOD Hot Start DNA聚合酶(EMD Biosciences)。一般而言,‘热启动’聚合酶包含热稳定性聚合酶和一种或多种在环境温度抑制DNA聚合酶和3’-5’外切核酸酶活性的抗体。在一些情况下,‘热启动’条件可包括适体。
在一些实施方案中,聚合酶可以是酶例如Taq聚合酶(来自水生栖热菌(Thermusaquaticus))、Tfi聚合酶(来自丝状栖热菌(Thermus filiformis))、Bst聚合酶(来自嗜热脂肪芽孢杆菌(Bacillus stearothermophilus))、Pfu聚合酶(来自超嗜热菌(Pyrococcusfuriosus)))、Tth聚合酶(来自极端嗜热菌(Thermus thermophilus))、Pow聚合酶(来自乌兹炽热球菌(Pyrococcus woesei))、Tli聚合酶(来自嗜热高温球菌(Thermococcuslitoralis))、Ultima聚合酶(来自喜温海洋杆菌(Thermotoga maritima))、KOD聚合酶(来自鹿儿岛高温球菌(Thermococcus kodakaraensis))、Pol I和II聚合酶(来自Pyrococcusabyssi)和Pab(来自Pyrococcus abyssi)。在一些实施方案中,DNA聚合酶可包括至少一种聚合酶例如AmplitaqDNA聚合酶(Applied Biosciences)、DNA聚合酶的Stoffel片段(Roche)、KOD聚合酶(EMD Biosciences)、KOD热启动聚合酶(EMDBiosciences)、Deep VentTM DNA聚合酶(New England Biolabs)、Phusion聚合酶(NewEngland Biolabs)、Klentaq1聚合酶(DNA Polymerase Technology,Inc)、Klentaq LongAccuracy聚合酶(DNA Polymerase Technology,Inc)、Omni KlenTaqTM DNA聚合酶(DNAPolymerase Technology,Inc)、Omni KlenTaqTM LA DNA聚合酶(DNA PolymeraseTechnology,Inc)、Taq DNA聚合酶(Invitrogen)、Hemo KlentaqTM(NewEngland Biolabs)、Taq DNA Polymerase High Fidelity(Invitrogen)、Pfx(Invitrogen)、AccuprimeTM Pfx(Invitrogen)、或AccuprimeTM Taq DNAPolymerase High Fidelity(Invitrogen)。
在一些实施方案中,DNA聚合酶可以是热稳定性DNA聚合酶。在一些实施方案中,可同时或以随机或确定的顺序相继地使用dNTP的混合物。在一些实施方案中,存在于多重反应中的DNA聚合酶的量比用于相应的单重PCR反应的DNA聚合酶的量显著更高。如本文中所用,术语“显著更高”是指存在于多重PCR反应中的DNA聚合酶的浓度为存在于对应的单重PCR反应中的至少3倍。
在一些实施方案中,扩增反应不包括扩增产物的环化,例如如通过滚环扩增公开的。
在一些实施方案中,本公开内容的方法包括选择性扩增含有多个核酸分子的样品中的靶序列,和将扩增的靶序列连接至至少一个接头 和/或条形码。分子生物学文库制备技术中使用的接头和条形码对于本领域技术人员来说是公知的。本文中使用的接头和条形码的定义与本领域使用的术语一致。例如,条形码的使用允许每多重反应检测和分析多个核酸分子的样品、来源、组织或群体。加条形码的和扩增的靶序列包含独特的核酸序列,通常是短的6-15个核苷酸的序列,所述序列鉴定扩增的核酸分子和将所述核酸分子与另一种扩增的核酸分子相区别,即使当两种除去条形码的核酸分子都包含相同的核酸序列。接头的使用允许以一致的方式扩增每一个扩增的核酸分子并且帮助减少链偏爱性。接头可包括通用接头或适当接头(propriety adapter),这两者都可在下游用于进行一个或多个不同的功能。例如,可将通过本文中公开的方法制备的扩增的靶序列连接至可用于在下游用作进行克隆性扩增的平台的接头。接头可用作使用第二组引物的随后扩增的模板链,从而允许接头连接的扩增的靶序列的通用扩增。在一些实施方案中,选择性扩增靶核酸以产生扩增子池还可包括将一个或多个条形码和/或接头连接至扩增的靶序列。掺入条形码的能力增加了样品通量,从而允许同时分析多个样品或材料来源。在一个实例中,可将通过本公开的方法制备的扩增的靶核酸分子连接至Ion TorrentTM Sequencing Adapters(A和P1接头,作为Ion Fragment Library试剂盒,Life Technologies,Part No.4466464的组分销售的)或Ion TorrentTM DNA条形码(Life Technologies,Part No.4468654)。
本文中公开的方法涉及通过聚合酶链式反应(PCR)扩增多个靶序列。在一些实施方案中,多重PCR包括将一个或多个靶特异性引物对与核酸分子杂交,在DNA聚合酶和dNTP存在的情况下通过模板依赖性合成延伸靶特异性引物对的引物;重复杂交和延伸步骤,进行充足的时间和充足的温度,从而产生产生多个扩增的靶序列。在一些实施方案中,多重扩增反应方法的步骤可以以任意顺序进行。
成功的多重扩增所需的核酸物质的量可以为约1ng。在一些实施方案中,核酸物质的量可以为约10ng至约50ng、约10ng至约100ng或约1ng至约200ng的核酸物质。可使用更大量的输入物质,然而, 本公开内容的一个方面是从低(ng)量的起始材料选择性扩增多个靶序列。
本文中公开的多重PCR扩增反应可包括通常在热循环仪上进行的多个“循环”。一般而言,每一个循环包括至少一个退火步骤和至少一个延伸步骤。在一个实施方案中,进行其中将靶特异性引物对与靶序列杂交的多重PCR扩增反应;延伸杂交的引物,从而产生延伸的引物产物/核酸双链体;使延伸的引物产物/核酸双链体变性,从而允许互补性引物与延伸的引物产物杂交,其中延伸互补性引物以产生多个扩增的靶序列。在一个实施方案中,本文中公开的方法具有每扩增反应约5至约18个循环。每循环退火温度和/或退火持续时间可以是相同的;可包括递增或递减,或两者的组合。每循环延伸温度和/或延伸持续时间可以是相同的;可包括递增或递减,或两者的组合。例如,退火温度或延伸温度可保持每循环恒定。在一些实施方案中,退火温度可以保持每一个循环恒定,而延伸持续时间可每循环递增。在一些实施方案中,持续时间的增加或减少可以以15秒、30秒、1分钟、2分钟或4分钟的增量发生。在一些实施方案中,温度的升高或降低可以0.5、1、2、3或4℃的离差发生。在一些实施方案中,扩增反应可使用热启动PCR技术来进行。这些技术包括在聚合开始之前使用加热步骤(>60℃)以减少不期望的PCR产物形成。其它技术例如反应的一种或多种关键试剂的可逆灭活或物理隔离,例如可将镁或DNA聚合酶隔离在石蜡珠粒中,所述珠粒随着反应在变性步骤中被加热而熔化,从而仅在更高温度下释放试剂。还可通过结合至适体或抗体来使DNA聚合酶保持活性状态。该结合在更高的温度下被破坏,从而释放可无阻碍地进行PCR的功能性DNA聚合酶。
在一些实施方案中,公开的方法可任选地包括破坏一个或多个含引物的扩增假象例如引物二聚体、二聚体-二聚体或超级扩增子。在一些实施方案中,破坏可任选地包括处理引物和/或扩增产物以切割存在于引物和/或扩增产物中的特定可切割基团。在一些实施方案中,处理可包括一个或多个靶特异性引物的部分或完全消化。在一个实施方案 中,处理可包括从扩增产物除去至少40%的靶特异性引物。可切割处理可包括酶促、酸、碱、热、光或化学活性。可切割处理可导致引物的一个或多个核苷酸间或扩增产物的一个或多个核苷酸间的连接的切割或其它破坏。引物和/或扩增产物可任选地包括一个或多个修饰的核苷酸或核碱基。在一些实施方案中,切割可以在这些位点上,或在修饰的核苷酸或核碱基附近选择性发生。在一些实施方案中,扩增的靶序列的切割或处理可导致磷酸化的扩增的靶序列形成。在一些实施方案中,扩增的靶序列在5’末端被磷酸化。
在一些实施方案中,模板、引物和/或扩增产物包括可被特定酶识别的核苷酸或核碱基。在一些实施方案中,核苷酸或核碱基可被特定酶结合。任选地,特定酶还可在一个或多个位点上切割模板、引物和/或扩增产物。在一些实施方案中,这样的切割可在模板、引物和/或扩增产物内的特定核苷酸上发生。例如,模板、引物和/或扩增产物可包含一个或多个核苷酸或核碱基(包括尿嘧啶),其可被酶例如尿嘧啶DNA糖基化酶(UDG,也称为UNG)或DNA-甲酰氨嘧啶糖基化酶(Fpg)识别和/或切割。模板、引物和/或扩增产物可包括一个或多个核苷酸或核碱基(包括RNA特异性碱基),其可被酶例如RNAseH识别和/或切割。在一些实施方案中,模板、引物和/或扩增产物可包含一个或多个无碱基位点,其可使用各种校对聚合酶或三磷酸腺苷双磷酸酶处理来识别和/或切割。在一些实施方案中,模板、引物和/或扩增产物可包含7,8-二氢-8-氧鸟嘌呤(8-oxoG)核碱基,其可被酶例如Fpg识别或切割。在一些实施方案中,一个或多个扩增的靶序列可被FuPa试剂部分消化。
在一些实施方案中,引物和/或扩增产物包含一个或多个修饰的核苷酸(包括碱基),其通过化学连接与其它核苷酸例如互补核酸链中的核苷酸结合(例如,碱基配对)。在一些实施方案中,化学连接遭受特殊化学攻击,所述化学攻击选择性切割修饰的核苷酸(或选择性切割引物和/或扩增产物中的修饰的核苷酸与相邻核苷酸之间的一个或多个共价连接)但使其它核苷酸不受影响。例如,在一些实施方案中,修饰 的核苷酸可与互补链中的其它核苷酸形成二硫键。这样的二硫键可通过适当的处理被氧化。类似地,某些修饰的核苷酸可通过连接(所述连接可通过碱处理选择性破坏)与互补核酸链中的其它核苷酸碱基配对。在一些实施方案中,引物和/或扩增产物包含一个或多个修饰的核苷酸,所述修饰的核苷酸通过连接(所述连接显示相对于天然碱基之间形成的典型碱基配对连接减小的热稳定性)与互补核酸链中的其它核苷酸结合(例如碱基配对)。这样的热稳定性减小的连接可通过在扩增后将引物和/或扩增产物暴露于升高的温度来选择性破坏。
示例性实施方案描述于图1中,所述图描述了可降解扩增引物的示意图。扩增引物在设计上是亚硫酸氢盐,5’通用正向扩增序列连接至3’靶特异性正向引物,或5’通用反向扩增序列连接至3’靶特异性反向引物。两个引物都包含修饰的核苷酸。
在一些实施方案中,合成引物,所述引物与核酸模板链的离散的区段互补并且可与其杂交,包括:可与模板的5'区杂交的引物,其包含与正向或反向扩增引物互补的序列。在一些实施方案中,正向引物、反向引物或两者无共同核酸序列,以便它们与不同的核酸序列杂交。例如,可制备不与引物池内其它引物对竞争扩增相同核酸序列的靶特异性正向和反向引物。在本实例中,不与引物池中其它引物对竞争的引物对帮助减少非特异性或假扩增产物。在一些实施方案中,每一个引物对的正向和反向引物是独特的,即每一个引物的核苷酸序列与引物对中的另一个引物无互补性和无同一性。在一些实施方案中,引物对可相异至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%或至少90%的核苷酸同一性。在一些实施方案中,每一个引物对中的正向和反向引物与引物池或多重反应中的其它引物对无互补性或无同一性。例如,引物池或多重反应中的引物对可与引物池或多重反应中的其它引物对相异至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%或至少70%的核苷酸同一性。一般而言,引物被设计来使引物二聚体、二聚体-二聚体或其它非特异性扩增产物的形成降至 最少。通常地,最优化引物以在扩增过程中减小GC偏爱性和降低熔解温度(Tm)。在一些实施方案中,引物被设计来具有约55℃至约72℃的Tm。在一些实施方案中,引物池的引物可具有约59℃至约70℃、60℃至约68℃或60℃至约65℃的Tm。在一些实施方案中,引物池可具有偏差不超过5℃的Tm
在一些实施方案中,靶特异性引物不包含碳间隔子或末端连接体。在一些实施方案中,靶特异性引物或扩增的靶序列不包含酶促、磁性、光学或荧光标记。
模板可包含3'区域,所述区域包含围绕特定目标基因或区域的上游或下游区域的序列,以便目标区域被正向扩增/上游基因特异性融合引物和反向扩增/目标区域下游融合引物包围。在一些实施方案中,内部间隔序列可分隔可与扩增子和基因特异性引物杂交的模板区域,并且这可用作进行随后的下游应用例如测序等的钥匙或条形码。在一些实施方案中,条形码或钥匙可被掺入每一个扩增产物以帮助数据分析和例如编目。在一些实施方案中,条形码可以是Ion TorrentTM DNA条形码(Life Technologies)。
在一些实施方案中,引物包括充足数目的修饰的核苷酸来允许通过切割处理进行引物的功能性完全降解,但不会多至在这样的切割处理之前,例如在扩增反应中干扰引物的特异性或功能性。在一些实施方案中,引物包含至少一个修饰的核苷酸,但不超过75%的引物的核苷酸被修饰。
在一些实施方案中,可将多个不同的包含至少一个修饰的核苷酸的引物用于单个扩增反应中。例如,可将包含修饰的核苷酸的多重引物添加至扩增反应混合物,其中每一个引物(或引物的组)选择性与核酸群体中的不同靶核酸分子杂交,并且促进其扩增。在一些实施方案中,可将不同的引物组合以至少约24,96,384,768,1000,2000,3000,6000或10000重或更多重添加至扩增反应中(其中“重”表示理论上可在扩增反应中以序列特异性方式扩增的不同靶的总数)。在一些实施方案中,修饰的引物在引物的末端附近或末端上包含至少一个修饰的核 苷酸。在一些实施方案中,修饰的引物在引物序列内部包含两个或更多个修饰的核苷酸。在示例性实施方案中,引物序列在引物序列的末端附近或其上包含尿嘧啶。为了本公开内容的目的,引物序列的“末端附近”或“在末端上”是指距离引物序列的末端至多10个核苷酸。在一些实施方案中,引物序列包含位于引物序列的中央核苷酸位置上或其附近的尿嘧啶。为了本公开内容的目的,“在引物序列的中央核苷酸位置上,或其附近”是指尿嘧啶部分在引物的中央核苷酸或在以3’或5’方向侧翼连接该中央核苷酸的8个核苷酸内的掺入。在一个实施方案中,靶特异性引物序列可在中央核苷酸位置上或附近包含修饰的核碱基和在3’和/或5’末端上包含修饰的核碱基。在一些实施方案中,正向或反向引物序列的长度在长度上可以为约15至约40个碱基。在一些实施方案中,多重反应中使用的引物序列的Tm可以为约55℃至约72℃。在一些实施方案中,引物对被设计来从靶核酸分子或扩增子扩增在长度为约100个碱基对至约500个碱基对的序列。
在一些实施方案中,在单个反应相(例如,在单管内同一个扩增反应混合物中)中并行地进行扩增反应。在一些情况下,扩增反应可产生包含期望的扩增子产物以及不期望的、不想要的、非特异性扩增假象例如引物二聚体的产物混合物。扩增后,用任意适当的试剂处理反应,所述试剂将选择性切割或选择性破坏过量的未掺入的引物和扩增假象内的修饰的核苷酸的核苷酸连接而不切割或破坏特异性扩增产物。例如,引物可包括含尿嘧啶的核碱基,所述核碱基可使用UNG/UDG(任选地通过加热和/或碱)来选择性切割。在一些实施方案中,引物可包括含尿嘧啶的核苷酸,其可使用UNG和Fpg来选择性切割。在一些实施方案中,切割处理包括至氧化条件的暴露(以选择性切割二硫醇)、利用RNA酶H的处理(以选择性切割修饰的核苷酸包括RNA特异性部分(例如,核糖等)等。该切割处理可有效地将原始扩增引物和非特异性扩增产物片段化成各自包含相对少的核苷酸的小核酸片段。这样的片段通常不能在升高的温度下促进进一步扩增。还可通过本领域已知的各种扩增后清除法(例如,旋转柱、NaEtOH沉淀等)相对容易地 从反应池中除去这样的片段。
在一些实施方案中,任选地在修饰的核苷酸的核苷酸连接的切割或其它选择性破坏后处理扩增产物以产生在5’末端具有磷酸的扩增产物。在一些实施方案中,磷酸化处理包括酶促操作以产生5’磷酸化扩增产物。在一个实施方案中,可将酶例如聚合酶用于产生5’磷酸化扩增产物。例如,T4聚合酶可用于制备5’磷酸化扩增产物。可将Klenow与一种或多种其它酶结合用于产生具有5’磷酸的扩增产物。在一些实施方案中,本领域已知的其它酶可用于制备具有5’磷酸基团的扩增产物。例如,用酶UDG、Fpg和T4聚合酶温育含尿嘧啶核苷酸的扩增产物可用于产生在5’末端具有磷酸的扩增产物。对于本领域技术人员很显然的是除本文中明确描述的那些技术外的其它技术可用于产生磷酸化扩增子。应理解,用于无需借助过度的实验来实践本文中公开的方法、***、试剂盒、组合物和装置的这样的变化和修饰被认为在本公开内容的范围内。
在一些实施方案中,被掺入期望的(特异性)扩增产物的引物,这些引物被类似地切割或破坏,导致在特异性扩增产物内形成“粘性末端”(例如,5’或3'悬突)。这样的“粘性末端”可以以几种方式解决。例如,如果将要克隆特异性扩增产物,悬突区域可被设计来互补引入克隆性载体的悬突,从而使得能够进行粘性末端连接,该连接比平末端连接更快更高效。或者,悬突可能需要被修复(与几个下一代测序方法一样)。这样的修复可通过仅使用仅由天然碱基组成的正向和反向扩增引物(在图1显示的实施方案中,这对应于A和P1引物)的第二扩增反应来实现。这样,后续轮的扩增重建了双链模板,初生拷贝的扩增子在引物破坏之前具有原始链的完整序列。或者,可使用一些形式的填充和连接加工除去粘性末端,其中使正向和反向引物与模板退火。随后可将聚合酶用于延伸引物,随后可将连接酶,任选地热稳定性连接酶,用于连接所得的核酸链。这可明显地也通过各种其它反应途径例如循环延伸-连接等来实现。在一些实施方案中,可使用一种或多种DNA连接酶来进行连接步骤。
扩增反应可包括任选地以循环形式增加核酸分子的拷贝数的任何反应,可包括但不限于等温扩增(例如,如美国临时申请号61/424,599、61/445,324和61/451,919(通过引用整体并入本文)中描述的滚环扩增或等温扩增)、使用热循环的扩增等。
在一些实施方案中,本公开内容总地来说涉及用于单管多重PCR的方法。在一些实施方案中,用于单管多重PCR的方法可包括靶特异性或外显子特异性引物。在一些实施方案中,外显子特异性或靶特异性引物可包含至少一个尿嘧啶核苷酸。在一些实施方案中,单管多重PCR可包括使用靶特异性或外显子特异性的基于尿嘧啶的引物选择性扩增至少1000,2000,3000,4000,5000,6000或更多个靶核酸分子。
在一些实施方案中,本公开内容总地来说涉及用于产生靶特异性或外显子特异性扩增子文库的方法。在一些实施方案中,可将使用靶特异性或外显子特异性引物产生的扩增子文库与人癌症突变关联。在一些实施方案中,突变可存在于KRAS、BRAF和/或EGFR基因中。在一些实施方案中,可从基因组DNA或***固定的石蜡包埋的(FFPE)组织产生扩增子文库。在一些实施方案中,使用本文中公开的方法制备的扩增子文库的扩增子在长度上可以为约100至约300个碱基对,在长度上为约100至约250个碱基对,在长度上为约120至约220个碱基对或在长度上为约135至约205个碱基对。在一些实施方案中,可使用被靶向癌症特异性突变的引物对制备扩增子文库。在一些实施方案中,引物对可针对非癌症相关突变,例如遗传病,例如囊性纤维化等。在一些实施方案中,引物对可用于产生扩增子,所述扩增子在通过任何测序平台(包括半导体测序技术)测序后,可用于检测基因突变例如倒位、缺失、点突变和拷贝数变异。
在一些实施方案中,用于产生扩增子文库的引物对可导致具有下列标准的一个或多个的靶特异性核酸分子的扩增:如果针对100x平均覆盖深度进行标准化,则在20x上具有大于97%的靶覆盖度;大于97%的碱基具有大于0.2x平均值;大于90%的碱基无链偏爱性;大于95%的所有靶上读取;大于99%的碱基具有大于0.01x平均值;和 每碱基准确性大于99.5%。
在一些实施方案中,扩增子文库可用于检测和/或鉴定样品中的已知突变或新生突变。
在一些实施方案中,可将使用靶特异性引物对制备的扩增子文库用于下游富集应用例如乳液PCR或桥式PCR。在一些实施方案中,扩增子文库可用于富集应用和测序应用。例如,可使用任何适当的DNA测序平台对扩增子文库进行测序。在一些实施方案中,可使用IonTorrent PGM测序仪(Life Technologies)对扩增子文库进行测序。在一些实施方案中,可将PGM测序仪偶联至服务器,所述服务器使用参数或软件来测定扩增的靶核酸分子的序列。在一些实施方案中,可在24小时以内制备扩增子文库,富集所述文库,对其进行测序。在一些实施方案中,可在约9小时内制备扩增子文库,富集所述文库,以及对其进行测序。在一些实施方案中,扩增子文库可以是成对文库,即包含来自肿瘤样品的扩增子和来自非患病组织的扩增子的文库。可将每一对进行比对来检测和/或鉴定存在于靶核酸分子中的突变。
在一些实施方案中,用于产生扩增子文库的方法可包括:使用外显子特异性或靶特异性引物扩增基因组DNA靶以产生扩增子;从输入DNA和引物纯化扩增子;磷酸化扩增子;将接头连接至磷酸化扩增子;纯化连接的扩增子;切口平移扩增的扩增子;和纯化切口平移的扩增子以产生扩增子文库。在一些实施方案中,可在扩增基因组DNA靶以产生扩增子的步骤后进行另外的扩增子文库操作。在一些实施方案中,可以以任意顺序进行另外的反应的任意组合,可包括:纯化;磷酸化;连接接头;切口平移;扩增和/或测序。在一些实施方案中,这些反应的任一种可被省略或可被重复。对于本领域技术人员显然易见地是方法可重复或省略上述步骤的任一个或多个。对于本领域技术人员人员来说同样显然的是可改变步骤的顺序和组合来产生所需的扩增子文库,从而所述改变不限定于提供的示例性方法。
可将磷酸化的扩增子连接至接头以进行切口平移反应,随后的下游扩增(例如,模板制备)或用于至颗粒(例如,珠粒)的连接或两者。例 如,连接至磷酸化的扩增子的接头可与连接至颗粒的寡核苷酸捕获引物退火,可进行引物延伸反应以产生互补拷贝的连接至颗粒或表面的扩增子,从而将扩增子连接至表面或颗粒。接头可具有一个或多个扩增引物杂交位点、测序引物杂交位点、条形码序列及其组合。在一些实施方案中,可将通过本文中公开的方法制备的扩增子连接至一个或多个Ion TorrentTM相容性接头来构建扩增子文库。可将通过这样的方法产生的扩增子连接至一个或多个接头以用于与下一代测序平台相容的文库构建。例如,可将通过本公开内容的教导产生的扩增子连接至Ion Fragment Library试剂盒(Life Technologies,Catalog No.4466464)中提供的接头。
在一些实施方案中,可使用2x AmpliSeq Hi Fi预混合物进行基因组DNA靶(例如高分子量DNA)或FFPE样品的扩增。在一些实施方案中,AmpliSeq Hi Fi预混合物可包含甘油、dNTP和DNA聚合酶,例如Taq DNA Polymerase High Fidelity。在一些实施方案中,2x AmpliSeq Hi Fi预混合物还可包括下列物质的至少一种:防腐剂、硫酸镁、tris-硫酸盐和/或硫酸铵。
在一些实施方案中,可使用5x Ion AmpliSeq Hi Fi预混合物进行基因组DNA靶(例如高分子量DNA)或FFPE样品的扩增。在一些实施方案中,5x Ion AmpliSeq Hi Fi预混合物可包含甘油、dNTP和DNA聚合酶例如Taq DNA Polymerase HighFidelity。在一些实施方案中,5x Ion AmpliSeq Hi Fi预混合物还可包括下列物质的至少一种:防腐剂、氯化镁、硫酸镁、tris-硫酸盐和/或硫酸铵。
在一些实施方案中,可使用FuP试剂磷酸化扩增子。在一些实施方案中,FuP试剂可包含DNA聚合酶、DNA连接酶、至少一种尿嘧啶切割或修饰酶和/或贮存缓冲液。在一些实施方案中,FuP试剂还可包含下列物质的至少一种:防腐剂和/或去垢剂。
在一些实施方案中,可使用FuPa试剂磷酸化扩增子。在一些实施方案中,FuPa试剂可包含DNA聚合酶、至少一种尿嘧啶切割或修饰酶、抗体和/或贮存缓冲液。在一些实施方案中,FuPa试剂还可包 含下列物质的至少一种:防腐剂和/或去垢剂。在一些实施方案中,抗体被提供来在环境温度抑制DNA聚合酶和3’-5’外切核酸酶活性。
在一些实施方案中,按照本公开内容的教导产生扩增子文库在产率上足以用于多种下游应用,包括使用Ion TorrentTM PGM***的Ion XpressTM Template试剂盒(LifeTechnologies,Part No.4467389)(例如,核酸片段文库至Ion SphereTM颗粒的PCR介导的添加)。例如,从扩增子文库制备模板文库的说明书可见于Ion Xpress Template试剂盒用户指南(Life Technologies,Part No.4465884)(通过引用整体并入本文)中。用于将随后的模板文库加载至用于核酸测序的Ion TorrentTM芯片上的说明书描述于Ion Sequencing用户指南(Part No.4467391)(通过引用整体并入本文)中。在一些实施方案中,按照本公开内容的教导产生的扩增子文库可用于配对端测序(例如,Ion TorrentTM PGM***(LifeTechnologies,Part No.MAN0006191)(通过引用整体并入本文)上的配对端测序)。
对于本领域技术人员来说显而易见是:可将许多用于克隆性扩增的其它技术、平台或方法例如wildfire PCR和桥式扩增与本公开内容的扩增的靶序列结合使用。还预期本领域技术人员在进一步改进或优化本文中提供的条件后,可直接进行核酸测序(例如使用Ion Torrent PGMTM或ProtonTM测序仪,Life Technologies)而无需进行克隆性扩增步骤。
在一些实施方案中,可将待克隆性扩增的扩增的靶序列的至少一个连接至支持载体或颗粒。支持载体可由任何适当的材料组成并且具有任何适当的形状,包括例如扁平状、球状或颗粒状。在一些实施方案中,支持载体是美国公开申请号20100304982(通过引用整体并入本文)中描述的支架聚合物颗粒。
在一些实施方案中,根据本公开内容的教导产生的扩增的靶序列的核酸测序包括从头测序或靶向再测序。在一些实施方案中,核酸测序还包括将扩增的靶序列的核酸测序结果与参照核酸样品相比较。在一些实施方案中,参照样品可以是正常组织或良好记录的肿瘤样品。 在一些实施方案中,扩增的靶序列的核酸测序还包括测定突变在核酸序列中的存在或不存在。在一些实施方案中,方法还包括将突变的存在与药物易感性、治疗的预后和/或器官排斥进行关联。在一些实施方案中,核酸测序包括与癌症和/或遗传病相关的遗传标志的鉴定。在一些实施方案中,核酸测序包括研究中的样品的拷贝数变异的鉴定。
在一些实施方案中,试剂盒被提供用来在单个反应中从一群核酸分子扩增多个靶序列。在一些实施方案中,试剂盒包括多个含一个或多个可切割基团的靶特异性引物对、一种或多种DNA聚合酶、dNTP的混合物和至少一种切割试剂。在一个实施方案中,可切割基团可以是8-氧-脱氧鸟苷、脱氧尿苷或溴脱氧尿苷。在一些实施方案中,至少一种切割试剂包括RNA酶H、尿嘧啶DNA糖基化酶、Fpg或碱。在一个实施方案中,切割试剂可以是尿嘧啶DNA糖基化酶。在一些实施方案中,试剂盒被提供来在单个反应室或容器中进行多重PCR。在一些实施方案中,试剂盒包括至少一种DNA聚合酶,其可以是热稳定性DNA聚合酶。在一些实施方案中,一种或多种DNA聚合酶的浓度相较于单个PCR反应以3倍过量的量存在。在一些实施方案中,每一个靶特异性引物对的终浓度为约25nM至约50nM。在一个实施方案中,每一个靶特异性引物对的终浓度可以以低于常规单重PCR反应50%的浓度存在。在一些实施方案中,试剂盒在单个反应室中提供了至少100,500,1000,3000,6000,10000,12000或更多个靶序列从一群核酸分子的扩增。
在一些实施方案中,试剂盒还包括一种或多种接头、条形码和/或抗体。
各种示例性实施方案的下列描述仅仅是示例性和解释性的,并且不被解释为以任何方式限定或限制。根据描述和附图以及根据权利要求,本教导的其它实施方案、特性、目的和有利方面是显然的。
虽然本说明书详细描述了某些示例性实施方案,但其它实施方案也是可能的并且在本发明的范围内。根据说明书和附图以及说明书和附图以及权利要求中描述的教导的实践,变化和修饰对于本领域技术 人员来说是显然的。
实施例
实施例1.文库制备
PCR扩增基因组DNA靶
进行多重聚合酶链式反应以扩增横跨整个基因组DNA样品的384个单独的扩增子。最初产生了覆盖超过300个基因的超过32,000个引物的池。被包括以用于研究同时合成初始引物池的基因的代表性列表提供于表1(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中。一个亚组的称为“HSMv12”的引物池用于产生图5中所示的数据(来自HSMv12的引物示于表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中)。引物池中的每一个引物被设计来在每一个正向和反向引物的末端附近包含至少一个尿嘧啶核苷酸。每一个引物对也被设计来选择性地与基因组DNA样品的特定基因或基因片段杂交并且促进其扩增。
向96孔PCR板的单个孔中添加5微升的HSMv12引物池(以15μM的浓度(于TE中)包含384个引物对)、10-50ng基因组DNA和10微升包可含甘油、dNTP和Taq HighFidelity DNA聚合酶(Invitrogen,Catalog No.11304)的扩增反应混合物(2x AmpliSeqHiFi预混合物),用不含DNA酶/RNA酶的水(Life Technologies,CA,Part No.600004)调至20微升的终体积。
将PCR板密封并且加载至热循环仪中(PCR system9700Dual96孔热循环仪(Life Technologies,CA,Part No.N8050200和4314445)),并且按照下列温度谱运行以产生预扩增的扩增子文库。
在98℃进行初始保持阶段,进行2分钟,随后进行16个循环:在98℃变性15秒,和在60℃退火和延伸,进行4分钟。循环后,将预扩增的扩增子文库保持在4℃直至进行下文中概述的纯化步骤。示例性文库扩增法的示意图示于图2中。
从输入DNA和引物纯化扩增子
进行两轮 XP试剂(Beckman Coulter,CA)结合、洗涤和洗脱(以0.6x和1.2x的体积比)以除去基因组DNA和未结合的或过量的引物。本文中概述的扩增和纯化步骤产生长度约100bp至约600bp的扩增子。
在1.5ml LoBind管(Eppendorf,Part No.022431021)中,将预扩增的扩增子文库(20微升)与12微升(0.6x体积)的 XP试剂(Beckman Coulter,CA)组合。用移液器上下吸打珠粒悬浮液以将珠粒悬浮液与预扩增的扩增子文库充分混合。随后对样品进行脉冲旋转(pulse-spin),在室温温育5分钟。
将包含样品的管置于磁架例如DynaMagTM-2旋转磁铁(Life Technologies,CA,Part No.123-21D)上2分钟,以捕获珠粒。待溶液澄清后,将上清液转移至新管,在新管中向上清液添加24微升(1.2x体积)的 XP珠粒(BeckmanCoulter,CA)。用移液器吸打混合物以确保珠粒悬浮液与预扩增的扩增子文库混合。随后对样品进行脉冲旋转,在室温温育5分钟。将包含样品的管置于磁架上进行2分钟,以捕获珠粒。待溶液澄清后,小心地弃去上清液而不搅动珠粒沉淀。期望的预扩增的扩增子文库现结合至珠粒。不从磁架上移走管,将200微升新鲜配制的70%乙醇加入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
在管干燥后,将管从磁架取出,添加20微升不含DNA酶/RNA酶的水(LifeTechnologies,CA,Part No.600004)。将管涡旋,用移液器吸打以确保样品被充分混合。对样品进行脉冲旋转,将其置于磁架上2分钟。待溶液澄清后,将包含洗脱的DNA的上清液转移至新管。
磷酸化扩增子
向洗脱的DNA(~20微升)中添加3微升DNA连接酶缓冲液(Invitrogen,CatalogNo.15224041)、2微升dNTP混合物和2微升FuP试剂。将反应混合物充分混合以确保均匀,在37℃温育10分钟。
将接头连接至扩增子以及纯化连接的扩增子
温育后,将反应混合物直接进行连接步骤。在此,将现包含磷酸化的扩增子文库的反应混合物与1微升的A/P1接头(各自20μm)(作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)和1微升的DNA连接酶(作为Ion FragmentLibrary试剂盒,Life Technologies,Part No.4466464的组分销售)组合,在室温温育30分钟。
在温育步骤后,将52微升(1.8x样品体积)的 试剂(Beckman Coulter,CA)添加至连接的DNA。用移液器充分吸打混合物以将珠粒悬浮液与连接的DNA混合。对混合物进行脉冲旋转,在室温温育5分钟。将样品再经历一次脉冲旋转,置于磁架例如DynaMagTM-2旋转磁铁(Life Technologies,CA,Part No.123-21D)上2分钟。待溶液已澄清后,弃去上清液。不从磁架上移走管,将200微升新鲜配制的70%乙醇加入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
将沉淀重悬浮于20微升的不含DNA酶/RNA酶的水(Life Technologies,CA,PartNo.600004)中,涡旋以确保样品被充分混合。对样品进行脉冲旋转,置于磁架上2分钟。待溶液澄清后,将包含连接的DNA的上清液转移至新的Lobind管(Eppendorf,PartNo.022431021)。
切口平移和扩增扩增子文库以及纯化文库
将连接的DNA(~20微升)与76微升PCR SuperMix High Fidelity(Life Technologies,CA,Part No.12532-016,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)和4微升文库扩增引物混合物(各自5μM)(Life Technologies,CA,Part No.602-1068-01,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)组合,用移液器充分吸打混合物以确保匀化的溶液。将溶液加至96孔PCR板的单个孔中,然后密封。将板加载至热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,PartNo.N8050200和4314445)),按下列温度谱运行以产生终扩增子文库。
在72℃进行切口平移1分钟,随后在98℃进行酶活化阶段2分钟,然后进行5-10个循环:在98℃变性15秒,和在60℃退火和延伸阶段,进行1分钟。循环后,将终扩增子文库保持在4℃直至进行下文中概述的终纯化步骤。
在1.5ml LoBind管(Eppendorf,Part No.022431021)中,将终扩增子文库(~100微升)与180微升(1.8x样品体积)的 XP试剂(BeckmanCoulter,CA)组合。用移液器上下吸打珠粒悬浮液以将珠粒悬浮液与终扩增子文库充分混合。随后对样品进行脉冲旋转,在室温温育5分钟。
将包含终扩增子文库的管置于磁架例如DynaMagTM-2旋转磁铁(LifeTechnologies,CA,Part No.123-21D)上2分钟以捕获珠粒。待溶液澄清后,小心地弃去上清液而不搅动珠粒沉淀。不从磁架上移走管,将400微升新鲜配制的70%乙醇引入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
在管干燥后,将管从磁架取出,添加20微升Low TE(Life Technologies,CA,PartNo.602-1066-01)。用移液器吸打管,涡旋,以 确保样品被充分混合。对样品进行脉冲旋转,将其置于磁架上2分钟。待溶液澄清后,将包含终扩增子文库的上清液转移至新的Lobind管(Eppendorf,Part No.022431021)。
评估文库大小分布和测定模板稀释因子
定量终扩增子文库以测定产生在用于进行模板制备(例如,文库分子至IonSphereTM Particles的PCR介导的添加)的最优化靶范围内的浓度的文库稀释度(模板稀释因子)。通常使用测定从其计算模板稀释因子的扩增子文库的摩尔浓度的Ion LibraryQuantitation试剂盒(qPCR)(Life Technologies,Part No.4468802)和/或BioanalyzerTM(Agilent Technologies,Agilent2100Bioanalyzer)定量终扩增子文库以用于下游模板制备程序。例如,利用定量实时PCR(qPCR)测定模板稀释因子的说明书可见于Ion LibraryQuantitation试剂盒用户指南(Life Technologies,Part No.4468986)(通过引用整体并入本文)。
在本实施例中,在2100BioanalyzerTM上利用Agilent High Sensitivity DNA试剂盒(Agilent Technologies,Part No.5067-4626)分析1微升的终扩增子文库制剂以在135-205bp大小范围内和以约5x109个拷贝/微升的浓度产生峰。
进行模板制备
将终文库的等份用于制备DNA模板,使用乳液PCR(emPCR)在Ion SphereTM颗粒上克隆性扩增所述模板。在本实施例中按照制造商的说明书(通过引用整体并入本文),使用IonXpress Template试剂盒(Life Technologies,Part No.4466457)制备模板的制剂。在富集模板阳性Ion Sphere颗粒后,如Ion Sequencing用户指南(Part No.4467391)(通过引用整体并入本文)所述,将等份的Ion Spheres装载至Ion314TM芯片(Life Technologies,PartNo.4462923),如Ion Torrent PGM测序仪用户指南(Life Technologies,PartNo.4462917)(通过引用 整体并入本文)中所述,进行分析和测序。从本实施例获得的数据提供于图5中。
实施例2.最优化多重反应以使GC偏爱最小化
本实施例显示在实施例1中描述的示例性文库扩增法的指导下进行的最优化多重PCR反应帮助使GC偏爱性最小化。
在本实施例中,从整个人基因组制备包含靶特异性引物的94个引物对的低重样品和包含靶特异性引物的380个引物对的高重样品。将每一个低重和高重样品经历实施例1中描述的文库扩增。扩增子产物的熔解温度经观察与扩增子测定的GC含量相关(图4A-4H)。观察到具有高GC含量(即80%)的高重(384重)样品具有比对应的94重样品更高的熔解温度(图4A-4H)。此外,观察到具有最高GC含量(75%和80%)的高重样品具有单个优势峰,扩增子产物(通过点线连接至X轴),与其它非特异性扩增产物(观察为跨X轴的另外的峰和噪声)相反。发现包含最高GC含量(75%和80%)的低重样品沿着X轴形成多个峰,这表明除了期望的的扩增子外形成显著量的非特异性扩增产物。本实施例显示高-多重PCR反应(394重)可以被成功地最优化(例如通过引物设计)来增加期望的扩增子产物的熔解温度,增加产生的扩增子特异性产物的量和减少扩增假象的形成。
实施例3.最优化引物设计以减少非特异性扩增
本实施例显示包含修饰的核苷酸的靶特异性引物产生比对应的非修饰引物池显著更少的引物二聚体。在本实施例中,使用常规方法制备一群非修饰引物对,如实施例1中所述,将其经历文库扩增法。如实施例1中所述制备和扩增对应的包含修饰的核苷酸的引物组。比较针对每一个引物池产生的扩增子产物和非特异性扩增产物的量。发现非修饰引物池中观察到的引物二聚体的量远超对应的修饰引物池中的引物二聚体的量(图3A和3B)。扩增假象的产生可在下游扩增事件(例如通常用于下一代测序测定中的那些事件)中引起明显(如果不是永久 性的)的扩增问题。本文中公开的修饰的引物的使用可用于缓解这些问题并且减少每多重反应扩增假象的输出。
附录A公开了用于常规多重PCR法的当前一般技术水平,并且突出显示了这些方法的一些不利方面。附录A还公开了一些最初评价为HSM(热点突变组)的高优先级基因。附录A提供了概述本文中公开的多重PCR法的工作流程的示意图。附录还提供了显示使用根据本公开内容的方法和靶特异性引物相较于标准多重引物(无可切割基团)产生的非特异性扩增产物的减少的图。附录A还描述了用于例如使用Epicentre Quick Extract方案从FFPE样品获得DNA的示例性方法。通过使用Ion Torrent314、316和318芯片,使用本文中公开的示例性方法和靶特异性引物进行的研究,产生的顺从每一个芯片类型的关于读取数目、覆盖度和扩增子总数目的示例性数据提供于附录A中。
实施例4.384重(多重)PCR反应的产生
在本实施例中,进行多重聚合酶链式反应以在整个基因组DNA上扩增384个扩增子。利用基因组DNA循环包含修饰的正向和反向引物对的引物池,将其经历实施例1中所述的文库扩增。将从3个单独的在Ion Torrent PGMTM测序仪上进行的运行获得的数据取平均值,然后示于图5中。数据显示每扩增子1000个平均读取率。
实施例5.正向和反向引物对384重多重PCR反应的覆盖度的影响
在本实施例中,进行多重聚合酶链式反应以在整个基因组DNA上扩增411个扩增子。用于扩增反应的引物池包含修饰的正向和反向引物,将其经历实施例1中所述的文库扩增。从在Ion Torrent PGMTM测序仪上进行的单个运行获得的数据显示针对反向和正向修饰的引物(图6A和6B)的约400的平均读取率。
实施例6.384-多重反应的重现性
在本实施例中,进行多重聚合酶链式反应以在整个基因组DNA上扩增384个扩增子。引物池包含修饰的正向和反向引物对,将其经历实施例1中所述的文库扩增。将从在IonTorrent PGMTM测序仪上 进行的7个单独的运行获得的数据取平均值,然后示于图7。数据显示每扩增子约400的平均读取率。
实施例7.411-多重反应的重现性
在本实施例中,进行多重聚合酶链式反应以在整个基因组DNA上扩增411个扩增子。引物池包含修饰的正向和反向引物对,将其经历实施例1中所述的文库扩增。将从在IonTorrent PGMTM测序仪上进行的7个单独的运行获得的数据取平均值,然后示于图8。数据显示每扩增子约400的平均读取率。
实施例8.作为低多重PCR的顺从底物的FFPE样品
在本实施例中,进行多重聚合酶链式反应以从新鲜冷冻的石蜡包埋的(FFPE)样品扩增96个扩增子。新鲜冷冻和FFPE样品通常因可从这样的样品提取的DNA量少而对于扩增过程是有问题的。此外,由于保存这些样品所需的严苛的化学处理,因此从这样的样品提取的DNA的质量通常极差。从FFPE样品提取DNA,将其加载至琼脂糖凝胶上以进行显现(泳道1和3)或经历实施例1中所述的多重PCR和文库扩增,随后加载至琼脂糖凝胶上进行显现(泳道2和4)。如实施例1中所述,对10ng的FFPE DNA进行96重PCR反应和文库扩增。图9显示在进行实施例1所述的文库扩增之前和之后包含FFPE DNA的琼脂糖电泳凝胶的照片。
实施例9.作为高重PCR的顺从底物的FFPE样品
在本实施例中,进行多重聚合酶链式反应以从新鲜冷冻的石蜡包埋的(FFPE)样品扩增384个扩增子。如实施例8中所述,新鲜冷冻和FFPE样品因较低的提取DNA数量和质量而对扩增通常是有问题的。在本实施例中,从FFPE样品提取10ng DNA,如实施例1所述,将其经历384重PCR反应和文库扩增。将从Ion Torrent PGMTM测序仪获得的数据取平均值,随后示于图10。数据显示每扩增子约400的平均读取率。用于384重反应的一些修饰的正向和反向引物对的读取率的进一步分析示于图11A和11B中。
实施例10.KRAS密码子12和密码子13突变体的对照混合物中的变体的检测
在本实施例中,将包含掺入量的KRAS基因在密码子12和密码子13上的突变的DNA的样品提供为盲测样品。使用开发用于KRAS基因的靶特异性修饰的引物对扩增样品。如实施例1中所述,扩增引物池和样品。将扩增的文库制备为模板并且进行富集。将富集的模板用于Ion314TM芯片,如实施例1中所述,使用Ion Torrent PGMTM测序仪进行分析。将来自3个单独的运行的数据取平均值,随后提供于图12中。在文库扩增过程中产生的扩增子产物对应于存在于对照DNA样品中的KRAS基因在密码子12和密码子13上的突变的预期水平。
实施例11.对囊性纤维化跨膜传导调节因子(CFTR)基因编码区重测序
CFTR蛋白由CFTR基因编码,所述基因为约200kbp,覆盖27个外显子。CFTR是将氯化物和硫氰酸根离子转运穿过上皮细胞膜的ABC转运蛋白类离子通道。CFTR基因的突变影响这些细胞膜中的氯离子通道的功能,从而导致囊性纤维化和输精管先天性缺失。因此,CFTR基因突变的男性携带者可能是不育的,因此该缺陷的检测在IVD考虑中是至关重要的。
在本实施例中,获得包含CFTR基因的突变的基因组DNA(gDNA)。制备gDNA以用于文库扩增、模板制备并应用于Ion Torrent314TM芯片,如实施例1中所描述的。在多重PCR反应中扩增了超过8947个碱基。所得的扩增子文库包含34个扩增子,平均扩增子长度为104bp。针对CFTR基因序列参照NCBI gi|287325315|ref|NG_016465.1|,195703bp进行扩增子文库的序列分析。
将产生的扩增子文库用于评价样品中CFTR基因突变的检测。发现文库扩增法以低覆盖度(4,001次读取)检测和鉴定了5个点突变和1个***/缺失(图13第1部分-第3部分)。6个突变的命名***如下:
命名***:CFMD(UMD)
c.869+11C>T(1001+11C/T)
c.1408A>G(M470V)
c.2562T>G(2694T/G)
c.4389G>A(4521G/A)
c.1-8G>C(125G/C)
c.1521_1523delCTT(ΔF508)
大多数测序测定是基于超过100bp的扩增子。本实施例显示实施例1中例举的文库扩增法的适用性和顺从性,产生了具有重测序测定所必须的长度的扩增子。本实施例还显示了Ion Torrent PGMTM测序仪正确地鉴定给定的样品中的点突变和***/缺失的准确性。
实施例12.靶特异性引物的产生
表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供了靶特异性正向和反向含尿嘧啶引物的列表,所述引物在上述实施例中用于扩增从样品例如FFPE样品提取的gDNA或DNA的靶特异性区域。表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供了每一个引物对的染色***置、每一个引物对的每一个正向和反向引物的核苷酸序列。表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)还提供了上游/正向引物的5’末端的坐标、每一个扩增子的长度、对应扩增子的核苷酸序列、每一个正向和反向引物的长度以及每一个正向或反向引物的Tm。表3a-3d(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)还提供了不同的靶特异性正向和反向引物对的列表,其在实施例13中用于从FFPE样品提取的gDNA或DNA中扩增来自表1(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的与癌症相关的基因的靶特异性区域。还包括下列引物对以覆盖AKT1基因的突变(c.49G>A)。正向引物:GCCGCCAGGUCTTGATGUA和反向引物:GCACAUCTGTCCUGGCACA。
实施例13.替代性文库方案
PCR扩增基因组DNA靶
在本实施例中,进行多重聚合酶链式反应以在整个基因组DNA样品或FFPE样品上扩增多个单独的扩增子。表1(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供了代表性的与癌症相关的基因的列表,所述基因被包括来进行研究同时合成引物池。引物池中的每一个引物对被设计来在每一个正向和反向引物中包含至少一个尿嘧啶核苷酸(表3a-3d(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文))。每一个引物对也被设计来与基因组DNA样品的特定基因或基因片段选择性杂交,并且促进其扩增以减少非特异性扩增产物的形成。
向96孔PCR板的每一个孔中添加4微升的浓度各自为250nm(于TE中)的5X引物池(包含引物对)、10ng基因组DNA和10微升可包含甘油、dNTP和DNA聚合酶的Stoffel片段(Invitrogen,Catalog No.N8080038)的扩增反应混合物(2x Stoffel HiFi预混合物),利用不含核酸酶的水(Life Technologies,CA,Part No.600004)调至20微升的终体积。
密封PCR板,将其载入热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,Part No.N8050200和4314445)),按照下列温度谱进行试验以产生预扩增的扩增子文库。基于研究中的反应混合物的总重数改变循环次数。例如,将48-96重运行17个循环;将97-192重运行16个循环;将193-384重运行15个循环;将385-768重运行14个循环;将769-1536重运行13个循环。此外,对于包含条形码的反应混合物或混合的反应混合物,使循环次数减少1个或多个另外的循环。例如,每样品2-3个条形码被消减1个循环;每样品4-8个条形码被削减2个循环,9-16条形码被削减3个循环。在99℃进行初始保温阶段,进行2分钟,随后进行X个循环(如上文中确定的):在99℃变性15秒,在60℃进行退火和延伸阶段,进行4分钟。循环后,将预扩增的扩增子文库保持在4℃直至进行下文中概述的消化和磷酸化步骤。
消化/磷酸化/热杀死扩增子
向预扩增的文库(~20微升)中添加2微升FuPa试剂。通常地,FuPa试剂包含一种或多种尿嘧啶可降解酶例如UDG、FPG等、DNA聚合酶例如Pol I、T4PNK、Klenow等,以及抗体例如抗-Taq抗体。在本实施例中,FuPa试剂中每一种酶促组分的相对量为1:1:1:1,但可根据需要的循环数、温度谱的变化而变化,这可由本领域技术人员来确定。密封PCR板,将其加载至热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,Part No.N8050200和4314445)),按照下列温度谱运行。在37℃进行初始保温阶段,进行5分钟,随后在55℃进行10分钟,然后在60℃进行20分钟。在循环后,将预扩增的扩增子文库保持在4℃直至进行下述连接/切口平移步骤。
将接头连接至扩增子和切口平移
磷酸化后,将扩增子预扩增文库(~22μl)直接进行连接步骤。在本实施例中,将现包含磷酸化的扩增子文库的预扩增文库与1微升的A/P1接头(各自20μm)(作为IonFragment Library试剂盒,Life Technologies,Part No.4466464的组分销售)、2微升10x连接缓冲液和1微升的DNA连接酶(作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)组合。密封PCR板,将其加载至热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,PartNo.N8050200和4314445)),按照下列温度谱运行。在22℃进行初始保温阶段,进行30分钟,随后在65℃进行10分钟,随后保持在4℃直至进行下一步骤。
如果扩增子文库包含条形码(例如Ion DNA Barcoding1-16试剂盒,LifeTechnologies,Part No.4468654,通过引用整体并入本文),可在进行下一步骤之前,基本上按照制造商的说明书,在该步骤将条形码添加至PCR板。
1.8x AMPure XP的纯化
将1.8x样品体积的 试剂(Beckman Coulter,CA)添加至连接的DNA。将混合物混合,在室温温育5分钟。待溶液已澄清后,弃去上清液。进行乙醇洗涤,随后弃去上清液。除去任何剩余的乙醇,将沉淀在室温风干约5分钟。将沉淀重悬于20微升不含DNA酶/RNA酶的水(Life Technologies,CA,Part No.600004)中。在一些情况下,如下文中概述的,可对扩增子文库进行任选的文库扩增步骤。
切口平移和扩增扩增子文库以及纯化文库
将连接的DNA(~20微升)与78微升PCR SuperMix High Fidelity(Life Technologies,CA,Part No.12532-016,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)和4微升文库扩增引物混合物(各自5μM)(Life Technologies,CA,Part No.602-1068-01,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)组合。将溶液加至96孔PCR板的单个孔中并且进行密封。将板加载至热循环仪(PCR system9700Dual96孔热循环仪(LifeTechnologies,CA,Part No.N8050200和4314445)),按照下列温度谱运行以产生终扩增子文库。
在72℃进行切口平移1分钟,随后在98℃进行酶活化阶段,进行2分钟,然后进行7个循环:在98℃变性15秒,和在60℃进行退火和延伸阶段,进行1分钟。循环后,将终扩增子文库保持在4℃直至进行下文中概述的终纯化步骤。
将终扩增子文库(~100微升)与1.8x样品体积的 XP试剂(Beckman Coulter,CA)组合。随后将混合物在室温温育5分钟。将包含终扩增子文库的PCR板用70%乙醇进行洗涤,弃去上清液。除去任何剩余的乙醇,在室温风干约5分钟。风干后,将文库重悬浮于20微升的Low TE(Life Technologies,CA,Part No. 602-1066-01)中。
评估文库大小分布和测定模板稀释因子
对终扩增子文库进行定量以测定产生在用于模板制备(例如,文库分子至IonSphereTM颗粒上的PCR介导的添加)的最优化靶范围内的浓度的文库稀释度(模板稀释因子)。通常使用测定从其计算模板稀释因子的扩增子文库的摩尔浓度的Ion LibraryQuantitation试剂盒(qPCR)(Life Technologies,Part No.4468802)和/或BioanalyzerTM(Agilent Technologies,Agilent2100Bioanalyzer)定量终扩增子文库,以用于下游模板制备程序。例如,利用定量实时PCR(qPCR)测定模板稀释因子的说明书可见于Ion LibraryQuantitation试剂盒用户指南(Life Technologies,Part No.4468986)(通过引用整体并入本文)。
在本实施例中,在2100BioanalyzerTM上利用Agilent High Sensitivity DNA试剂盒(Agilent Technologies,Part No.5067-4626)分析1微升的终扩增子文库制剂以在135-205bp大小范围内和以约5x109个拷贝/微升的浓度产生峰。
进行模板制备
将终文库的等份用于制备DNA模板,使用乳液PCR(emPCR)在Ion SphereTM颗粒上克隆性扩增所述模板。在本实施例中按照制造商的说明书(通过引用整体并入本文),使用IonXpress Template试剂盒(Life Technologies,Part No.4466457)制备模板的制剂。在富集模板阳性Ion Sphere颗粒后,如Ion Sequencing用户指南(Part No.4467391)(通过引用整体并入本文)所述,将Ion Spheres的等份装载至Ion314TM芯片(Life Technologies,PartNo.4462923),如Ion Torrent PGM测序仪用户指南(Life Technologies,PartNo.4462917)(通过引用整体并入本文)中所述,进行分析和测序。
实施例14.替代性文库方案
PCR扩增基因组DNA靶
在本实施例中,进行多重聚合酶链式反应以在整个基因组DNA样品上扩增多个单独的扩增子。表1(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供了代表性的与癌症相关的基因的列表,所述基因被包括来进行研究同时合成引物池。引物池中的每一个引物对被设计来在每一个正向和反向引物中包含至少一个尿嘧啶核苷酸(表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文))。每一个引物对也被设计来与基因组DNA样品的特定基因或基因片段选择性杂交,并且促进其扩增以减少非特异性扩增产物的形成。
向96孔PCR板的每一个孔中添加5微升的浓度各自为250nm(于TE中)的4X HSM引物池(包含表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物对)、50ng基因组DNA和10微升可包含甘油、dNTP和DNA聚合酶(例如Taq DNA聚合酶,Invitrogen,Catalog No.N8080038)的扩增反应混合物(2x PreAmp HiFi预混合物),利用不含核酸酶的水(Life Technologies,CA,Part No.600004)调至20微升的终体积。
密封PCR板,将其载入热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,Part No.N8050200和4314445)),按照下列温度谱进行试验以产生预扩增的扩增子文库。在98℃进行初始保温阶段,进行2分钟,随后进行16个循环:在98℃变性15秒,和在60℃退火和延伸,进行4分钟。循环后,将预扩增的扩增子文库保持在4℃直至进行下文中概述的纯化步骤。
从输入DNA和引物纯化扩增子
进行两轮 XP试剂(Beckman Coulter,CA)结合、洗涤和洗脱(以0.6x和1.2x的体积比)以除去基因组DNA和未结合的或过量的引物。在1.5mlLoBind管(Eppendorf,Part No.022431021)中,将预扩增的扩增子文库(20微升)与12微升(0.6x体积)的 XP试剂(Beckman Coulter,CA)组合。用移 液器上下吸打珠粒悬浮液以将珠粒悬浮液与预扩增的扩增子文库充分混合。随后对样品进行脉冲旋转,在室温温育5分钟。
将包含样品的管置于磁架例如DynaMagTM-2旋转磁铁(Life Technologies,CA,Part No.123-21D)上进行2分钟,以捕获珠粒。待溶液澄清后,将上清液转移至新管,在新管中向上清液添加24微升(1.2x体积)的 XP珠粒(BeckmanCoulter,CA)。用移液器吸打混合物以确保珠粒悬浮液与预扩增的扩增子文库混合。随后对样品进行脉冲旋转,在室温温育5分钟。将包含样品的管置于磁架上进行2分钟,以捕获珠粒。待溶液澄清后,小心地弃去上清液而不搅动珠粒沉淀。期望的预扩增的扩增子文库现结合至珠粒。不从磁架上移走管,将200微升新鲜配制的70%乙醇引入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
在管干燥后,将管从磁架取出,添加20微升不含DNA酶/RNA酶的水(LifeTechnologies,CA,Part No.600004)。将管涡旋,用移液器吸打以确保样品被充分混合。对样品进行脉冲旋转,将其置于磁架上进行2分钟。待溶液澄清后,将包含洗脱的DNA的上清液转移至新管。
磷酸化扩增子
向洗脱的DNA(~20微升)中添加3微升DNA连接酶缓冲液(Invitrogen,CatalogNo.15224041)、2微升dNTP混合物(10mm)和2微升FuP试剂。将反应混合物充分混合以确保均匀,在37℃温育10分钟。
将接头连接至扩增子以及纯化连接的扩增子
温育后,将反应混合物直接进行连接步骤。在此处,将现包含磷酸化的扩增子文库的反应混合物与1微升的A/P1接头(各自20μm)(作 为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)和1微升的DNA连接酶(作为Ion FragmentLibrary试剂盒,Life Technologies,Part No.4466464的组分销售)组合,在室温温育30分钟。
在温育步骤后,将52微升(1.8x样品体积)的 试剂(Beckman Coulter,CA)添加至连接的DNA。用移液器充分吸打混合物以将珠粒悬浮液与连接的DNA混合。对混合物进行脉冲旋转,在室温温育5分钟。将样品再经历一次脉冲旋转,置于磁架例如DynaMagTM-2旋转磁铁(Life Technologies,CA,Part No.123-21D)上进行2分钟。待溶液已澄清后,弃去上清液。不从磁架上移走管,将200微升新鲜配制的70%乙醇引入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
将沉淀重悬浮于20微升的不含DNA酶/RNA酶的水(Life Technologies,CA,PartNo.600004)中,涡旋以确保样品被充分混合。对样品进行脉冲旋转,置于磁架上进行2分钟。待溶液澄清后,将包含连接的DNA的上清液转移至新的Lobind管(Eppendorf,PartNo.022431021)。
切口平移和扩增扩增子文库以及纯化文库
将连接的DNA(~20微升)与76微升PCR SuperMix High Fidelity(Life Technologies,CA,Part No.12532-016,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)和4微升文库扩增引物混合物(各自5μM)(Life Technologies,CA,Part No.602-1068-01,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)组合,用移液器充分吸打混合物以确保匀化的溶液。将溶液加至96孔PCR板的单个孔中,然后进行密封。将板加载至热循环仪(PCR system9700Dual 96孔热循环仪(Life Technologies,CA,PartNo.N8050200和4314445)),按下列温度谱运行以产生终扩增子文库。
在72℃进行切口平移1分钟,随后在98℃进行酶活化阶段,进行2分钟,然后进行6个循环:在98℃变性15秒,和在60℃进行退火和延伸阶段,进行1分钟。循环后,将终扩增子文库保持在4℃直至进行下文中概述的终纯化步骤。
在1.5ml LoBind管(Eppendorf,Part No.022431021)中,将终扩增子文库(~100微升)与180微升(1.8x样品体积)的 XP试剂(BeckmanCoulter,CA)组合。用移液器上下吸打珠粒悬浮液以将珠粒悬浮液与终扩增子文库充分混合。随后对样品进行脉冲旋转,在室温温育5分钟。
将包含终扩增子文库的管置于磁架例如DynaMagTM-2旋转磁铁(LifeTechnologies,CA,Part No.123-21D)进行2分钟以捕获珠粒。待溶液澄清后,小心地弃去上清液而不搅动珠粒沉淀。不从磁架上移走管,将400微升新鲜配制的70%乙醇引入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
在管干燥后,将管从磁架取出,添加20微升Low TE(Life Technologies,CA,PartNo.602-1066-01)。用移液器吸打管,涡旋,以确保样品被充分混合。对样品进行脉冲旋转,将其置于磁架上进行2分钟。待溶液澄清后,将包含终扩增子文库的上清液转移至新的Lobind管(Eppendorf,Part No.022431021)。
评估文库大小分布和测定模板稀释因子
对终扩增子文库进行定量以测定产生在用于模板制备(例如,文库分子至IonSphereTM颗粒上的PCR介导的添加)的最优化靶范围内的浓度的文库稀释度(模板稀释因子)。通常使用测定从其计算模板稀释 因子的扩增子文库的摩尔浓度的Ion LibraryQuantitation试剂盒(qPCR)(Life Technologies,Part No.4468802)和/或BioanalyzerTM(Agilent Technologies,Agilent2100Bioanalyzer)定量终扩增子文库,以用于下游模板制备程序。例如,利用定量实时PCR(qPCR)测定模板稀释因子的说明书可见于Ion LibraryQuantitation试剂盒用户指南(Life Technologies,Part No.4468986)(通过引用整体并入本文)。
本实施例中,在2100BioanalyzerTM上利用Agilent High Sensitivity DNA试剂盒(Agilent Technologies,Part No.5067-4626)分析1微升的终扩增子文库制剂。
进行模板制备
将终文库的等份用于制备DNA模板,使用乳液PCR(emPCR)在Ion SphereTM颗粒上克隆性扩增所述模板。在本实施例中按照制造商的说明书(通过引用整体并入本文),使用IonXpress Template试剂盒(Life Technologies,Part No.4466457)制备模板的制剂。在富集模板阳性Ion Sphere颗粒后,如Ion Sequencing用户指南(Part No.4467391)(通过引用整体并入本文)所述,将Ion Spheres的等份装载至Ion314TM芯片(Life Technologies,PartNo.4462923),如Ion Torrent PGM测序仪用户指南(Life Technologies,PartNo.4462917)(通过引用整体并入本文)中所述,进行分析和测序。
实施例15.替代性文库方案
PCR扩增基因组DNA靶
在本实施例中,进行多重聚合酶链式反应以在整个基因组DNA样品上扩增多个单独的扩增子。表1(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供了代表性的与癌症相关的基因的列表,所述基因被包括来进行研究同时合成引物池。引物池中的每一个引物对被设计来在每一个正向和反向引物中包含至少一个尿嘧啶核苷酸(表2(见2012年4月27日提交的美国申请号 13/458,739,通过引用方式全文并入本文))。每一个引物对也被设计来与基因组DNA样品的特定基因或基因片段选择性杂交,并且促进其扩增以减少非特异性扩增产物的形成。
向96孔PCR板的每一个孔中添加10微升的浓度各自为250nm的2X引物池(包含表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物对)、10ng基因组DNA和4微升可包含甘油、dNTP和DNA聚合酶(例如,DNA聚合酶的Stoffel片段(Invitrogen Catalog No.N8080038))的扩增反应混合物(5x IonAmpliseq预混合物),利用不含核酸酶的水(Life Technologies,CA,Part No.600004)调至20微升的终体积。
密封PCR板,将其载入热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,Part No.N8050200和4314445)),按照下列温度谱进行试验以产生预扩增的扩增子文库。基于研究中的反应混合物的总重数改变循环次数。例如,将48-96重运行17个循环;将97-192重运行16个循环;将193-384重运行15个循环;将385-768重运行14个循环;将769-1536重运行13个循环。此外,对于包含条形码的反应混合物或混合的反应混合物,使循环次数减少1个或多个另外的循环。例如,每样品2-3个条形码被消减1个循环;每样品4-8个条形码被削减2个循环,9-16条形码被削减3个循环。对于包含片段化DNA例如酶促消化的DNA的样品,可使循环次数增加至多3个循环。为了使用1ng或更少DNA的起始输入的一个或多个DNA样品的选择扩增,使循环数增加另外3个循环。在99℃进行初始保温阶段,进行2分钟,随后进行X个循环(如上文中确定的):在99℃变性15秒和在60℃进行退火和延伸阶段,进行4分钟。循环后,将预扩增的扩增子文库保持在4℃直至进行下文中概述的纯化步骤。
消化/磷酸化/热杀死扩增子
向预扩增的文库(~20微升)中添加2微升FuPa试剂。通常地, FuPa试剂包含一种或多种尿嘧啶可降解酶例如UDG、FPG等、DNA聚合酶例如Klenow片段,以及抗体例如抗-Taq抗体。在本实施例中,FuPa试剂中每一种酶促组分的相对量为1:1:1:2,但可根据需要的循环数、温度谱的变化而变化,这可由本领域技术人员来确定。密封PCR板,将其加载至热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,PartNo.N8050200和4314445)),按照下列温度谱运行。在37℃进行初始保温阶段,进行10分钟,随后在55℃进行10分钟,然后在60℃进行20分钟。在循环后,将预扩增的扩增子文库保持在4℃直至进行下述连接/切口平移步骤。
将接头连接至扩增子以及切口平移
磷酸化后,将扩增子预扩增文库(~22μl)直接进行连接步骤。在本实施例中,将现包含磷酸化的扩增子文库的预扩增文库与2微升的A/P1接头(各自5μm)(作为Ion FragmentLibrary试剂盒,Life Technologies,Part No.4466464的组分销售的)、4微升7.5x连接缓冲液和2微升的T4DNA连接酶(5u/μl)组合。密封PCR板,将其加载至热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,PartNo.N8050200和4314445)),按照下列温度谱运行。在22℃进行初始保温阶段,进行30分钟,随后在60℃进行5分钟,随后保持在4℃直至进行下一步骤。
如果扩增子文库包含条形码(例如Ion DNA Barcoding1-16试剂盒,LifeTechnologies,Part No.4468654,通过引用整体并入本文),可在进行下一步骤之前,基本上按照制造商的说明书,在该步骤将条形码添加至PCR板。任选地,可在该步骤将所有样品或条形码混合于单个管中。
1.6x AMPure XP纯化
将1.6x样品体积的 试剂(Beckman Coulter,CA)添加至连接的DNA。将混合物混合,在室温温育5分钟。 进行乙醇洗涤,随后弃去上清液。除去任何剩余的乙醇,将沉淀在室温风干约5分钟。将包含文库的干燥管重悬浮于20微升不含核酸酶的水(Life Technologies,CA,Part No.600004)中。在一些情况下,如下文中概述的,可对扩增子文库进行任选的切口平移/文库扩增步骤。
切口平移和扩增扩增子文库以及纯化文库
将连接的DNA(~20微升)与78微升PCR SuperMix High Fidelity(Life Technologies,CA,Part No.12532-016,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)和4微升文库扩增引物混合物(各自5μM)(Life Technologies,CA,Part No.602-1068-01,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)组合。将溶液加入96孔PCR板的单个孔中并且进行密封。将板加载至热循环仪(PCR system9700Dual96孔热循环仪(LifeTechnologies,CA,Part No.N8050200和4314445)),按照下列温度谱运行以产生终扩增子文库。
在72℃进行切口平移1分钟,随后在98℃进行酶活化阶段,进行2分钟,然后进行7个循环:在98℃变性15秒,和在60℃进行退火和延伸阶段,进行1分钟。循环后,将终扩增子文库保持在4℃直至进行下文中概述的终纯化步骤。
将终扩增子文库(~100微升)与1.8x样品体积的 XP试剂(Beckman Coulter,CA)组合。随后将混合物在室温温育5分钟。用70%乙醇洗涤终扩增子文库,弃去上清液。除去任何剩余的乙醇,在室温风干约5分钟。风干后,将文库重悬浮于20微升的Low TE(Life Technologies,CA,Part No.602-1066-01)中。在本实施例中,在2100BioanalyzerTM上用Agilent High Sensitivity DNA试剂盒(Agilent Technologies,Part No.5067-4626)分析1微升的终扩增子文库制剂。
实施例16
在本实施例中,使用2946个靶特异性引物对制备扩增子文库。从 表1和18(二者见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的基因列表制备引物对。每一个引物对被设计来与选择的靶区域选择性杂交并且促进其扩增。除将引物池混合于单个PCR管中,蒸发和重悬浮于Low TE中,在与DNA和扩增反应混合物一起温育之前补充以0.25mM氯化镁外,按照实施例14制备文库。在本实施例中,将高分子量DNA或机械剪切的DNA用作输入DNA(10ng输入)。该测序实验的结果提供于下表中,并且显示约91-98%的所有读取在靶上,当针对100x进行标准化时,在1x上具有大于99%的靶覆盖度,以及具有大于98%的碱基准确性。
预扩增的复杂度 2946 2946
靶DNA 剪切的 HMW
每碱基大于0.01的平均读取的百分比 99.40% 99.29%
每碱基大于0.1的平均读取的百分比 96.33% 95.16%
每碱基大于0.2的平均读取的百分比 92.26% 89.40%
所有扩增子的无链偏爱性的百分比 71.15% 72.98%
大于100次读取的所有扩增子的无链偏爱性的百分比 73.31% 77.12%
靶上读取的端对端读取的百分比 -1.00% -1.00%
每碱基准确性 98.34% 98.59%
定位在靶上的总的读取的百分比 99.10% 99.14%
具有读取的孔的百分比 35.94% 31.23%
总的读取数目 2277968 1979529
定位的读取的数目 2257427 1962501
靶的数目 2946 2946
靶上读取的数目 2094328 1941916
所有靶上读取的百分比 91.94% 98.10%
靶上定位的读取的百分比 92.78% 98.95%
脱靶读取的百分比 7.16% 1.04%
未定位的读取的百分比 0.90% 0.86%
靶向参照中的碱基 327815 327815
覆盖的碱基(至少1x) 326642 326656
靶上总的碱基读取 220235195 206585756
平均碱基覆盖深度 671.83 630.19
最大碱基读取深度 3070 2520
平均碱基读取深度 674.23 632.43
碱基读取深度标准差 431.42 466.91
在1x时的靶覆盖度 99.64% 99.65%
在10x时的靶覆盖度 99.23% 99.12%
在20x时的靶覆盖度 98.77% 98.42%
在1x针对100标准化时的靶覆盖度 99.40% 99.29%
在10x针对100标准化时的靶覆盖度 96.33% 95.16%
在20x针对100标准化时的靶覆盖度 92.26% 89.40%
靶上读取的端对端读取的百分比 -1.00% -1.00%
靶上读取的正向端对端读取的百分比 -1.00% -1.00%
靶上读取的反向端对端读取的百分比 -1.00% -1.00%
99百分位的碱基具有至少1x覆盖度所需的覆盖度 52.2 48.96
98百分位的碱基具有至少10x覆盖度所需的覆盖度 207.65 247.24
95百分位的碱基具有至少20x覆盖度所需的覆盖度 145.33 203.58
实施例17
在本实施例中,使用6110个靶特异性引物对制备扩增子文库。文库对应于约450个癌基因。根据表1和18(二者见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中的基因列表制备引物对。设计每一个引物对来与使用本文中概述的靶特异性选择标准选择的靶区域选择性杂交并且促进其扩增。除将引物池制备于两个管中(3188重和2946重)和补充以0.5mM氯化镁外,按照实施例14制备文库。还对PCR预扩增循环步骤进行改进以将变性温度升高至99℃,使其包括:在60℃退火步骤后,于72℃进行5分钟的延伸步骤,该步骤也可延长至10分钟。循环后,将每一个包含扩增子文库的管组合至单个乳液中以进行乳液PCR富集。将扩增子文库用于制备DNA模板,使用乳液PCR(emPCR)在IonSphereTM颗粒上克隆性扩增所述模板。在本实施方案中,按照制造商的说明书(通过引用整体并入本文),使用Ion Xpress Template试剂盒(Life Technologies,Part No.4466457)制备模板的制剂。在富集模板阳性Ion Sphere颗粒后,如Ion Sequencing用户指南(PartNo.4467391)(通过引用整体并入本文)所述,将Ion Spheres的等份装载至Ion316TM芯片(Life Technologies,Part No.4466616),随后如Ion Torrent PGM测序仪用户指南(LifeTechnologies,Part No.4462917)(通过引用整体并入本文)中所述,进行分析和测序。
在本实施例中,将高分子量DNA用作输入DNA(10ng)。该实验的结果提供于下表中,并且显示约95%的所有读取在靶上,约95%的 所有读取(大于100个读取)未显示链偏爱性,以及具有大于97%的碱基准确性。
每碱基大于0.01的平均读取的百分比 81.58%
每碱基大于0.1的平均读取的百分比 75.40%
每碱基大于0.2的平均读取的百分比 69.73%
所有碱基的无链偏爱性的百分比 92.16%
所有扩增子的无链偏爱性的百分比 72.16%
大于100次读取的所有扩增子的无链偏爱性的百分比 95.06%
靶上读取的端对端读取的百分比 -1.00%
每碱基准确性 97.78%
定位至hg19上的总的读取的百分比 98.05%
具有读取的孔的百分比 34.51%
总的读取数目 2190638
定位的读取的数目 2147835
靶的数目 6110
靶上读取的数目 2098176
所有靶上读取的百分比 95.78%
在靶上定位的读取的百分比 97.69%
脱靶读取的百分比 2.27%
未定位的读取的百分比 1.95%
靶向参照的碱基 677270
覆盖的碱基(至少1x) 556880
靶上总的碱基读取 243058082
平均碱基覆盖深度 358.88
最大碱基读取深度 2402
平均碱基读取深度 436.45
碱基读取深度标准差 371.45
在1x时的靶覆盖度 82.22%
在10x时的靶覆盖度 80.45%
在20x时的靶覆盖度 78.41%
在100x时的靶覆盖度 66.15%
在500x时的靶覆盖度 29.11%
在1x针对100标准化时的靶覆盖度 81.58%
在10x针对100标准化时的靶覆盖度 75.40%
在20x针对100标准化时的靶覆盖度 69.73%
在100x针对100标准化时的靶覆盖度 40.40%
在500x针对100标准化时的靶覆盖度 0.34%
靶上读取的端对端读取的百分比 -1.00%
靶上读取的正向端对端读取的百分比 -1.00%
靶上读取的反向端对端读取的百分比 -1.00%
99百分位的碱基具有至少1x覆盖度所需的覆盖度 865.36
98百分位的碱基具有至少20x覆盖度所需的覆盖度 8653.57
95百分位的碱基具有至少350x覆盖度所需的覆盖度 60574.98
覆盖的优先级1设计的百分比 0
覆盖的优先级9设计的百分比 0
实施例18
在本实施例中,使用约1500个靶特异性引物对制备扩增子文库。从表1(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的基因制备引物对。使用本文中概述的靶特异性引物选择标准设计每一个引物对,以使其与选择的靶区域选择性杂交并且促进其扩增。按照实施例15制备文库,除如下修正预扩增PCR循环的数目外:重数:12-24=18个循环;25-48=17个循环;48-96=16个循环;97-192=15个循环;193-384=14个循环;385-768=13个循环;769-1536=12个循环;1537-3072=11个循环。当使用片段化的DNA时,将最多2个额外的循环添加至预扩增PCR法。此外,当使用1537+重时,可使退火温度(60℃)从4分钟增加至8分钟。
在切口平移和文库扩增步骤中,必要时,可以例如将PCR循环数增加至约10。
扩增子文库用于制备DNA模板,使用乳液PCR(emPCR)在Ion SphereTM颗粒上克隆性扩增所述模板。在本实施方案中,按照制造商的说明书(通过引用整体并入本文),使用IonXpress Template试剂盒(Life Technologies,Part No.4466457)制备模板的制剂。在富集模板阳性Ion Sphere颗粒后,如Ion Sequencing用户指南(Part No.4467391)(通过引用整体并入本文)所述,将Ion Spheres的等份装载至Ion316TM芯片(Life Technologies,PartNo.4466616),随后如Ion Torrent PGM测序仪用户指南(Life Technologies,PartNo.4462917)(通过引用整体并入本文)中所述,进行分析和测序。
在本实施例中,将10ng FFPE DNA用作输入DNA。该实验的结果提供于下表中,并且显示约94%的碱基显示无链偏爱性,每碱基准确性大于98%,并且当将平均覆盖度针对100x进行标准化时,99%的碱基具有大于20x的覆盖度。
实施例19.利用12,500个靶特异性引物的多重PCR
在本实施例中,使用约12,000个靶特异性引物对在单个反应中制备几个扩增子文库。从表18(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中提供的与癌症相关的基因制备靶特异性引物对。使用本文中概述的引物选择标准来设计靶特异性引物。在本实施方案中,将来自美国申请61/598,881(通过引用整体并入本文)的表6的引物用作反应的靶特异性引物。每一个靶特异性引物对被设计来促进表18(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中概述的期望的靶序列的扩增。按照实施例13的标题为“PCR扩增基因组DNA靶”的部分制备每一个扩增子文库,除将引物池中的靶特异性引物的浓度修正至25nM并且靶特异性引物的数目为约12,000外。此外,如下修正预扩增PCR循环:在99℃进行2分钟的初始保温阶段,随后在进行11个循环:在99℃进行15秒的变性;在60℃进行10分钟的第一退火阶段;在63℃进行5分钟的第二退火阶段;在66℃进行5分钟的第三退火阶段;在69℃进行5分钟的第四退火阶段;以及在72℃进行5分钟的延伸阶段;随后进行5个循环:在99℃退火15秒;在60℃进行10分钟的第一退火阶段;在63℃进行6分钟的第二退火阶段;在66℃进行6分钟的第三退火阶段;在69℃进行6分钟的第四退火阶段;和在72℃进行6分钟的延伸阶段。循环后,将预扩增的扩增子文库保持在4℃直至进行下文中概述的下一步骤。
从输入DNA和引物纯化扩增子
进行一轮的 XP试剂(Beckman Coulter,CA)结合、洗涤和洗脱(以1.2x的体积比)以除去基因组DNA和未结合的或过量的引物。
在1.5ml LoBind管(Eppendorf,Part No.022431021)中,将预扩增的扩增子文库(20微升)与24微升(1.2x体积)的 XP试剂(Beckman Coulter,CA)组合。用移液器上下吸打珠粒悬浮液以将珠粒悬浮液与预扩增的扩增子文库充分混合。随后对样品进行脉冲旋转,在室温温育5分钟。
将包含样品的管置于磁架例如DynaMagTM-2旋转磁铁(Life Technologies,CA,Part No.123-21D)上进行2分钟,以捕获珠粒。待溶液澄清后,将上清液转移至新管,在新管中向上清液添加13.3ul无核酸酶的水。随后,将48微升的 XP珠粒(Beckman Coulter,CA)添加至稀释的上清液。用移液器吸打混合物以确保珠粒悬浮液与预扩增的扩增子文库混合。随后对样品进行脉冲旋转,在室温温育5分钟。将包含样品的管置于磁架上进行2分钟,以捕获珠粒。待溶液澄清后,小心地弃去上清液而不搅动珠粒沉淀。期望的预扩增的扩增子文库现结合至珠粒。不从磁架上移走管,将200微升新鲜配制的70%乙醇引入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
在管干燥后,将管从磁架取出,添加20微升不含DNA酶/RNA酶的水(LifeTechnologies,CA,Part No.600004)。将管涡旋,用移液器吸打以确保样品被充分混合。对样品进行脉冲旋转,将其置于磁架上进行2分钟。待溶液澄清后,将包含洗脱的DNA的上清液转移至新管。
磷酸化扩增子
向洗脱的DNA(~20微升)中添加3微升DNA连接酶缓冲液(Invitrogen,CatalogNo.15224041)、2微升dNTP混合物和2微升FuP试剂。将反应混合物充分混合以确保均匀,在37℃温育13分钟。
将接头连接至扩增子以及纯化连接的扩增子
温育后,将反应混合物直接进行连接步骤。在此处,将现包含磷酸化的扩增子文库的反应混合物与1.5微升的A/P1接头(各自20μm)(作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)和1微升的DNA连接酶(作为Ion FragmentLibrary试剂盒,Life Technologies,Part No.4466464的组分销售)组合,在室温温育30分钟。
在温育步骤后,将52微升(1.8x样品体积)的 试剂(Beckman Coulter,CA)添加至连接的DNA。用移液器充分吸打混合物以将珠粒悬浮液与连接的DNA混合。对混合物进行脉冲旋转,在室温温育5分钟。将样品再经历一次脉冲旋转,置于磁架例如DynaMagTM-2旋转磁铁(Life Technologies,CA,Part No.123-21D)上进行2分钟。待溶液已澄清后,弃去上清液。不从磁架上移走管,将200微升新鲜配制的70%乙醇引入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
将沉淀重悬浮于20微升的不含DNA酶/RNA酶的水(Life Technologies,CA,PartNo.600004)中,涡旋以确保样品被充分混合。对样品进行脉冲旋转,置于磁架上进行2分钟。待溶液澄清后,将包含连接的DNA的上清液转移至新的Lobind管(Eppendorf,PartNo.022431021)。
切口平移和扩增扩增子文库以及纯化文库
将连接的DNA(~20微升)与76微升PCR SuperMix High Fidelity(Life Technologies,CA,Part No.12532-016,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)和4微升文库扩增引物混合物(各自5μM)(Life Technologies,CA,Part No.602-1068-01,作为Ion Fragment Library试剂盒,LifeTechnologies,Part No.4466464的组分销售)组合,用移液器充分吸打混合物以确保匀化的溶液。将溶液加入96孔PCR板的单个孔中,然后进行密封。将板加载至热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,PartNo.N8050200和4314445)),按下列温度谱运行以产生终扩增子文库。
在72℃进行切口平移1分钟,随后在98℃进行酶活化阶段,进行2分钟,然后进行6个循环:在98℃变性15秒,和在60℃进行退火和延伸阶段,进行1分钟。循环后,将终扩增子文库保持在4℃直至进行下文中概述的终纯化步骤。
在1.5ml LoBind管(Eppendorf,Part No.022431021)中,将终扩增子文库(~100微升)与180微升(1.8x样品体积)的 XP试剂(BeckmanCoulter,CA)组合。用移液器上下吸打珠粒悬浮液以将珠粒悬浮液与终扩增子文库充分混合。随后对样品进行脉冲旋转,在室温温育5分钟。
将包含终扩增子文库的管置于磁架例如DynaMagTM-2旋转磁铁(LifeTechnologies,CA,Part No.123-21D)进行2分钟以捕获珠粒。待溶液澄清后,小心地弃去上清液而不搅动珠粒沉淀。不从磁架上移走管,将400微升新鲜配制的70%乙醇引入样品。在将管在磁架上轻轻旋转的情况下将样品温育30秒。待溶液澄清后,弃去上清液而不搅动沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管并且小心地除去残留的乙醇而不搅动沉淀来除去任何剩余的乙醇。将沉淀在室温风干约5分钟。
在管干燥后,将管从磁架取出,添加20微升Low TE(Life Technologies,CA,PartNo.602-1066-01)。用移液器吸打管,涡旋,以 确保样品被充分混合。对样品进行脉冲旋转,将其置于磁架上进行2分钟。待溶液澄清后,将包含终扩增子文库的上清液转移至新的Lobind管(Eppendorf,Part No.022431021)。
评估文库大小分布和测定模板稀释因子
定量终扩增子文库以测定产生在用于进行模板制备(例如,文库分子至IonSphereTM Particles上的PCR介导的添加)的最优化靶范围内的浓度的文库稀释度(模板稀释因子)。通常使用测定从其计算模板稀释因子的扩增子文库的摩尔浓度的Ion LibraryQuantitation试剂盒(qPCR)(Life Technologies,Part No.4468802)和/或BioanalyzerTM(Agilent Technologies,Agilent2100Bioanalyzer)定量终扩增子文库,以用于下游模板制备程序。例如,利用定量实时PCR(qPCR)测定模板稀释因子的说明书可见于Ion LibraryQuantitation试剂盒用户指南(Life Technologies,Part No.4468986)(通过引用整体并入本文)。
在本实施例中,在2100BioanalyzerTM上利用Agilent High Sensitivity DNA试剂盒(Agilent Technologies,Part No.5067-4626)分析1微升的终扩增子文库制剂以在135-205bp大小范围内和以约5x109个拷贝/微升的浓度产生峰。
进行模板制备
将终文库的等份用于制备DNA模板,使用乳液PCR(emPCR)在Ion SphereTM颗粒上克隆性扩增所述模板。在本实施例中按照制造商的说明书(通过引用整体并入本文),使用IonXpress Template试剂盒(Life Technologies,Part No.4466457)制备模板的制剂。在富集模板阳性Ion Sphere颗粒后,如Ion Sequencing用户指南(Part No.4467391)(通过引用整体并入本文)所述,将Ion Spheres的等份装载至Ion314TM芯片(Life Technologies,PartNo.4462923),随后如Ion Torrent PGM测序仪用户指南(Life Technologies,Part No.4462917)(通过引用整体并入本文)中所述,进行分析和测序。从本实施例获得的数据提供于下表中。
实施例20.相对拷贝数变化(CNV)的评估
在本实施例中,使用3000个靶特异性引物对扩增几个DNA样品。使用本文中概述的靶特异性引物选择标准设计靶特异性引物。用于本实验的选择的靶特异性引物的序列可见于表17(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)(或美国申请61/598,881(通过引用整体并入本文)的表6)。在文库扩增过程中给DNA样品加条形码(如实施例人13中概述的)。在本实施例中,DNA样品获自商业来源(Coriell DNA)并且包含已知的拷贝数变异,来证明本文中公开的多重扩增法可用于评估拷贝数变异。
4个DNA样品购自Coriell DNA,其包含染色体22上与DiGeorge综合征相关的3Mb缺失。另外的DNA样品购自Coriell DNA,其包含染色体7上与Grieg头多趾综合征(GCPS)相关的16Mb缺失。制备每一个DNA样品(为了区分一个DNA样品与另一个DNA样品,包含条形码)的扩增子文库。按照实施例15概述的方法制备每一个扩增子文库,除在本实施例中,将3000个靶特异性引物对用于单个预扩增反应外。从表18(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的基因制备靶特异性引物对。使用来自起始材料的10ng DNA制备每一个扩增子文库。按照实施例15制备文库,除如下修正预扩增PCR循环数外:重数:12-24=18个循环;25-48=17 个循环;48-96=16个循环;97-192=15个循环;193-384=14个循环;385-768=13个循环;769-1536=12个循环;1537-3072=11个循环。当使用片段化DNA(例如,FFPE DNA样品),可将最多2个额外的循环添加至预扩增PCR法中。此外,如果需要更高的产率,当使用1537+重时,可使退火温度(60℃)从4分钟增加至8分钟。
必要时,在切口平移和文库扩增步骤中,可以例如将PCR循环数增加至约10个循环。
扩增子文库用于制备DNA模板,使用乳液PCR(emPCR)在Ion SphereTM颗粒上克隆性扩增所述模板。在本实施方案中,按照制造商的说明书(通过引用整体并入本文),使用IonXpress Template试剂盒(Life Technologies,Part No.4466457)制备模板的制剂。在富集模板阳性Ion Sphere颗粒后,如Ion Sequencing用户指南(Part No.4467391)(通过引用整体并入本文)所述,将Ion Spheres的等份装载至Ion316TM芯片(Life Technologies,PartNo.4466616),随后如Ion Torrent PGM测序仪用户指南(Life Technologies,PartNo.4462917)(通过引用整体并入本文)中所述,进行分析和测序。
在本实施例中,将10ng DNA用作输入DNA。该实验的结果提供于图14-15中。
图14显示本文中公开的多重扩增PCR法可用于评估拷贝数变异。图14显示覆盖与DiGeorge综合征相关的基因CLTCL1的关键区域的部分的12个扩增子的扩增子频率数据。在频率0上标绘的圆圈代表通过多重扩增法扩增的CLTCL1的每一个扩增子。红色(单独)圆圈是来自从Coriell DNA获得的单个DiGeorge综合征DNA样品的数据点。在该实验中测试了4个DiGeorge综合征DNA样品,将针对DiGeorge样品相较于对照滤过的总读取百分比的平均比率标绘为具有误差条的圆圈。频率1.0处的点线是对于正常样品(即,不包含拷贝数变异的样品)预期的频率。如图14中显示的,测试的DiGeorge综合征样品的频率为约0.5,表明CLTCL1基因内的缺失已发生,并且可使用本文中公开的扩增法观察和检测。
图15显示本文中公开的多重扩增法可用于评估不同染色体中的拷贝数变异。图15显示覆盖与Greig头多趾综合征(GCPS)相关的基因IKZF1的部分的4个扩增子的扩增子的频率数据。在频率0上标绘的圆圈代表在本实施例中概述的多重PCR扩增法中扩增的IKZF1的4个扩增的子的每一个。获得了单个GCPS样品相对于4个对照样品的比率,并且它们的频率描绘于图15中。GCPS DNA仅具有1个拷贝的GCPS基因,然而正常(或对照)DNA样品包含两个拷贝的基因。如图15中指出的,对照样品对于拷贝数相较于预期的频率显示2x(点线)。如图15所显示的,可使用本文中公开的多重PCR扩增法来测定拷贝数变异。
实施例21.利用肌苷可切割基团的多重扩增
在本实施方案中,按照本文中公开的引物选择标准制备包含一个或多个以肌苷提供的可切割基团的靶特异性引物。在将引物对针对提出的靶序列进行初始芯片上评价后,从Integrated DNA Technologies(IDT)(Coravilla,IA)订购已评价的靶特异性引物(表19(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中公开的)。从IDT接收含肌苷的引物,将其经历多重扩增,除下列例外外,按照实施例15的方法进行。用含肌苷的引物(表19(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)中公开的,对应于SEQ ID NO:103122-103143)替换2x引物池(含有表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物)。此外,在进行基因组DNA靶的PCR扩增后,将样品用EndoV和FuPa进行消化。
在本实施例中,将终文库的等份用于制备DNA模板,使用乳液PCR(emPCR)在IonSphereTM颗粒上克隆性扩增所述模板。在本实施例中按照制造商的说明书(通过引用整体并入本文),使用Ion Xpress Template试剂盒(Life Technologies,Part No.4466457)制备模板的制剂。在富集模板阳性Ion Sphere颗粒后,如Ion Sequencing用户指南(PartNo.4467391)(通过引用整体并入本文)所述,将Ion Spheres的等 份装载至Ion314TM芯片(Life Technologies,Part No.4462923),如Ion Torrent PGM测序仪用户指南(LifeTechnologies,Part No.4462917)(通过引用整体并入本文)中所述,进行分析和测序。获自本实施例的数据包括97.17%的每碱基准确性百分比,靶上读取的百分比经观察为96.83%。
实施例22.替代性多重PCR方案
在本实施例中,提供出了对于各种先前的多重PCR法的一个或多个的替代性实施方案。
PCR扩增基因组DNA靶
在本实施例中,进行多重聚合酶链式反应以在整个基因组DNA样品或FFPE样品上扩增多个单独的扩增子(靶序列)。表1和4(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)提供了代表性的与癌症和遗传病相关的基因的列表,所述基因被包括来进行研究同时合成引物池。引物池中的每一个引物对被设计来在每一个正向和反向引物(表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文))中包含至少一个尿嘧啶核苷酸或被设计来在在每一个正向和反向引物(表19(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文))中包含至少一个肌苷。每一个引物对也被设计来与基因组DNA或FFPE样品的特定基因或基因片段选择性杂交,并且促进其扩增以减少非特异性扩增产物的形成。
以各自200nm的浓度(对于96重以下)或以50nm的浓度(对于96重以上)向96孔PCR板的单个孔中加入10微升的2x引物池(包含表2(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物对)、4微升的5x癌症引物池(包含表17(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物对)、4微升的5x IDP引物池(包含表15(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物对)或10微升的2x HID引物池(包含表13和14(见2012年4月27日 提交的美国申请号13/458,739,通过引用方式全文并入本文)的引物对)。添加10ng的基因组DNA或FFPE DNA和4微升的扩增反应混合物(5x Ion Ampliseq HiFi预混合物),用不含核酸酶的水(Life Technologies,CA,Part No.600004)调至20微升的终体积。
密封PCR板,将其载入热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,Part No.N8050200和4314445)),按照下列温度谱进行试验以产生预扩增的扩增子文库。基于研究中的反应混合物的总重数改变循环次数。例如,将12-24重运行20个循环;将25-48重运行19个循环;将48-96重运行18个循环;将97-192重运行17个循环;将193-384重运行16个循环;将385-768重运行15个循环;将769-1536重运行14个循环;将1537-3072重运行13个循环;将3073-6144重运行12个循环;此外,对于包含条形码的反应混合物或混合的反应混合物,使循环数减少1个或多个另外的循环。例如,每样品2-3个条形码被消减1个循环;每样品4-8个条形码被削减2个循环,9-16条形码被削减3个循环。对于包含片段化的DNA例如FFPE或酶促消化的DNA的样品,可使循环数增加最多3个循环。
在99℃进行初始保温阶段,进行2分钟,随后进行X个循环(如上文中确定的):在99℃变性15秒和在60℃进行退火和延伸阶段,进行4分钟。对于高于1536的重数,使退火和延伸阶段在60℃增加至8分钟。循环后,将预扩增的扩增子文库保持在10℃直至进行下文中概述的纯化步骤。
消化/磷酸化/热杀死扩增子
向预扩增的文库(~20微升)中添加2微升FuPa试剂。密封PCR板,将其加载至热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,PartNo.N8050200和4314445)),按照下列温度谱运行。在50℃进行初始保温阶段,进行10分钟,随后在55℃进行10分钟,然后在60℃进行20分钟。在循环后,将预扩增的扩增子文库保持在10℃直至进行下述连接/切口平移步骤。
将接头连接至扩增子以及切口平移
磷酸化后,将扩增子预扩增文库(~22μl)直接进行连接步骤。在本实施例中,将现包含磷酸化的扩增子文库的预扩增文库与2微升的A/P1接头(各自5μm)(作为Ion FragmentLibrary试剂盒,Life Technologies,Part No.4466464的组分销售)、4微升的Switch溶液和2微升的DNA连接酶(5u/μl)组合。密封PCR板,将其加载至热循环仪(PCRsystem9700Dual96孔热循环仪(Life Technologies,CA,Part No.N8050200和4314445)),按照下列温度谱运行。在22℃进行初始保温阶段,进行30分钟,随后在72℃进行10分钟,随后保持在10℃直至进行下一步骤。
如果扩增子文库包含条形码(例如Ion DNA Barcoding1-16试剂盒,LifeTechnologies,Part No.4468654,通过引用整体并入本文),可在进行下一步骤之前,基本上按照制造商的说明书,在该步骤将条形码添加至PCR板。任选地,可在该步骤将所有样品或条形码混合于单个管中。
1.5x AMPure XP纯化
将1.5x样品体积(45微升)的 试剂(BeckmanCoulter,CA)添加至连接的DNA。将混合物混合,在室温温育5分钟,随后转移至磁板。将样品在磁板上温育2分钟,弃去上清液。进行乙醇洗涤,弃去上清液。除去任何剩余的乙醇,在室温风干约5分钟。将包含文库的干燥的管重悬浮于20微升的不含核酸酶的水(LifeTechnologies,CA,Part No.600004)或低Tris-EDTA缓冲液中。在一些情况下,可如下所述,对扩增子文库进行任选的切口平移/文库扩增步骤。
切品平移和扩增扩增子文库以及纯化文库
将连接的DNA(~20微升)与50微升的PCR SuperMix 高保真(LifeTechnologies,CA,Part No.12532-016,作为Ion Fragment Library试剂盒的组分销售,Life Technologies,Part No.4466464)组合,在磁板上放置2分钟。将48ul的PCR supermix中的洗脱的扩增子转移至96孔板的新孔中,向所述孔中添加2微升的文库扩增引物混合物(Life Technologies,CA,Part No.602-1068-01,作为Ion Fragment Library试剂盒的组分销售,Life Technologies,Part No.4466464)。密封PCR板,将其加载至热循环仪(PCR system9700Dual96孔热循环仪(Life Technologies,CA,PartNo.N8050200和4314445)),按照下列温度谱运行以产生终扩增子文库。
在98℃进行酶活化阶段,进行2分钟,然后进行5个循环:在98℃变性15秒,和在60℃进行退火和延伸阶段,进行1分钟。循环后,将终扩增子文库保持在4℃直至进行下文中概述的终纯化步骤。
将终扩增子文库(~100微升)与0.5x样品体积的 XP试剂(Beckman Coulter,CA)组合。随后将混合物在室温温育5分钟。将样品转移至磁板进行2分钟,将上清液(~75微升)移至新的孔中。添加1.2x体积的 XP试剂(Beckman Coulter,CA,在室温温育5分钟。随后将样品置于磁板上进行2分钟,弃去上清液。用70%乙醇洗涤终扩增子文库,弃去上清液。除去任何剩余的乙醇,在室温风干约5分钟。风干后,将文库重悬浮于20微升的Low TE(Life Technologies,CA,Part No.602-1066-01)中。在本实施例中,在2100BioanalyzerTM上用Agilent High Sensitivity DNA试剂盒(Agilent Technologies,Part No.5067-4626),或在Qubit机上使用DSDNA HS Assay试剂盒(Part number Q32851)分析1微升的终扩增子文库制剂。
实施例23.相对拷贝数变异(CNV)的测定
在该实施例中,使用Ion AmpliseqTM Comprehensive Cancer Panel(CatalogNo.4477685,Life Technologies,CA)(其包含16,000个靶标特异性引物对,被设计为提供通常与癌症相关的409个基因的外显子覆盖)扩增了两个DNA样品(1个正常组织样品和1个肿瘤样 品)(一式两份)。使用美国专利申请61/598,881(通过引用方式并入本文)中记载的靶标特异性引物选择标准来设计靶标特异性引物。
在该实施例中,2个DNA样品获自商业来源,肿瘤样品含有已知的拷贝数变异,以证明本文公开的多重扩增方法可用于测定拷贝数变异。
在接头连接步骤中将2个DNA样品条码化(一式两份)(根据Ion AmpliseqTMLibrary Kit2.0(Catalog No.4475345,Life Technologies,CA)中提供的生产商的说明书,通过引用方式并入本文)。为每个DNA样品制备了扩增子文库,以一式两份来制备,为了将每个样品(或重复样品)彼此区分,使用了条码。
根据Ion AmpliseqTM Library Kit2.0(Catalog No.4475345,LifeTechnologies,CA)制备每个扩增子文库。使用来自起始材料的10ng DNA制备每个扩增子文库。当使用片段化的DNA(例如,FFPE DNA样品时),可以向预扩增PCR过程中加入至多2个另外的PCR循环。另外,当使用1537重以上时,如果需要更高的产率,可以在4至8分钟内将退火温度(60℃)升高。
扩增子文库用于制备使用乳液PCR(emPCR)在Ion SphereTM Particles上克隆性扩增的DNA模板。该实施例中模板的制备是根据Ion Xpress Template Kit(LifeTechnologies,Part No.4466457)的生产商的说明书,通过引用方式全文并入本文。一旦模板阳性的Ion Sphere Particles被富集之后,即按照Ion Sequencing User Guide(PartNo.4467391)(通过引用方式并入本文)中的描述将Ion Spheres的等份载入Ion316TM Chip(Life Technologies,Part No.4466616),并根据Ion Torrent PGM Sequencer UserGuide(Life Technologies,Part No.4462917)中的描述(通过引用方式并入本文)进行分析和测序。
测序完成之后,计算每个样品的总的映射的测序读取/扩增子,按照染色***置以信号的log2比率(百分率读取)作图。正常样品的预期的频率是0(即,样品不含拷贝数变异)。来自该实验的结果提供于图36A至36D。
图36A显示了一式两份的正常组织样品的结果。其中,如上文所述按照一式两份制备了来自正常DNA样品的10ng输入DNA。将每个样品的总的映射的测序读取/扩增子(作为百分率读取)按照染色***置在基因组上作图。
图36B显示了一式两份的肿瘤组织样品的结果。其中,如上文所述按照一式两份制备了来自肿瘤DNA样品的10ng输入DNA。将每个样品的总的映射的测序读取/扩增子(作为百分率读取)按照染色***置在基因组上作图。
图36C显示了第一个正常DNA样品相对于第一个肿瘤组织样品的结果。其中,如上文制备了来自正常和肿瘤DNA的10ng输入DNA。将每个样品的总的映射的测序读取/扩增子(作为百分率读取)按照染色***置在基因组上作图。可以看出,在基因组的几个位置处,log2比率实质上偏离,包括染色体6,染色体9,染色体10,染色体13和染色体22。
图36D显示了第一个正常DNA样品相对于第一个肿瘤组织样品的结果。其中,如上文制备了来自正常和肿瘤DNA的10ng输入DNA。将每个样品的总的映射的测序读取/扩增子(作为百分率读取)按照染色***置在基因组上作图。如果预期,图36D的数据与图36C中获得的数据是一致的。可以看出,在基因组的几个位置处,log2比率实质上偏离,包括染色体6,染色体9,染色体10,染色体13和染色体22。
实施例24.性染色体的相对拷贝数变异的测定
在该实施例中,使用Ion AmpliseqTM Comprehensive Cancer Panel(CatalogNo.4477685,Life Technologies,CA),根据Ion AmpliseqTM Library Kit2.0(CatalogNo.4475345,Life Technologies,CA)中提供的说明书,扩增了两个DNA样品(1个XXY样品和1个XO样品)。使用根据实施例23制备每个扩增子文库。使用来自起始材料的10ng DNA制备每个扩增子文库。
扩增子文库用于制备使用乳液PCR(emPCR)在Ion SphereTM Particles上克隆性扩增的DNA模板。该实施例中模板的制备是根据 Ion Xpress Template Kit(LifeTechnologies,Part No.4466457)的生产商的说明书,通过引用方式全文并入本文。一旦模板阳性的Ion Sphere Particles被富集之后,即按照Ion Sequencing User Guide(PartNo.4467391)(通过引用方式并入本文)中的描述将Ion Spheres的等份载入Ion316TM Chip(Life Technologies,Part No.4466616),并根据Ion Torrent PGM Sequencer UserGuide(Life Technologies,Part No.4462917)中的描述(通过引用方式并入本文)进行分析和测序。
测序完成之后,计算每个样品的总的映射的测序读取/扩增子,按照染色***置以信号的log2比率(百分率读取)作图。正常样品的预期的频率是0(即,样品不含拷贝数变异)。来自该实验的结果提供于图37A。
图37A显示了XXY/XO的log2比率。其中,如实施例23所述制备了来自两种DNA样品的10ng输入DNA。将每个样品的总的映射的测序读取/扩增子(作为百分率读取)按照染色***置在基因组上作图。根据以2为底的对数的分析,XO样品可能实际上含有X和一半(通过“X”扩增子的升高的频率所观察的)。
实施例25.性染色体的相对拷贝数变异的测定
在该实施例中,使用Ion AmpliseqTM Comprehensive Cancer Panel(CatalogNo.4477685,Life Technologies,CA),根据Ion AmpliseqTM Library Kit2.0(CatalogNo.4475345,Life Technologies,CA)中提供的说明书,扩增了两个DNA样品(1个XXXXY样品和1个XO样品)。使用根据实施例23制备每个扩增子文库。使用来自起始材料的10ng DNA制备每个扩增子文库。
扩增子文库用于制备使用乳液PCR(emPCR)在Ion SphereTM Particles上克隆性扩增的DNA模板。该实施例中模板的制备是根据Ion Xpress Template Kit(LifeTechnologies,Part No.4466457)的生产商的说明书,通过引用方式全文并入本文。一旦模板阳性的Ion Sphere Particles被富集之后,即按照Ion Sequencing User Guide(PartNo.4467391)(通过引用方式并入本文)中的描述将Ion Spheres的等份载入 Ion316TM Chip(Life Technologies,Part No.4466616),并根据Ion Torrent PGM Sequencer UserGuide(Life Technologies,Part No.4462917)中的描述(通过引用方式并入本文)进行分析和测序。
测序完成之后,计算每个样品的总的映射的测序读取/扩增子,按照染色***置以信号的log2比率(百分率读取)作图。正常样品的预期的频率是0(即,样品不含拷贝数变异)。来自该实验的结果提供于图37B。
图37B显示了XXXXY/XO的log2比率。其中,如实施例23所述制备了来自两种DNA样品的10ng输入DNA。将每个样品的总的映射的测序读取/扩增子(作为百分率读取)按照染色***置在基因组上作图。根据以2为底的对数的分析,XO样品可能实际上含有X和一半(通过“X”扩增子的升高的频率所观察的)。
实施例26.三体性21的相对拷贝数变异的测定
在该实施例中,使用Ion AmpliseqTM Comprehensive Cancer Panel(CatalogNo.4477685,Life Technologies,CA),根据Ion AmpliseqTM Library Kit2.0(CatalogNo.4475345,Life Technologies,CA)中提供的说明书,扩增了两个DNA样品(1个XY三体性21样品和1个母体正常DNA样品)。使用根据实施例23制备每个扩增子文库。使用来自起始材料的10ng DNA制备每个扩增子文库。
扩增子文库用于制备使用乳液PCR(emPCR)在Ion SphereTM Particles上克隆性扩增的DNA模板。该实施例中模板的制备是根据Ion Xpress Template Kit(LifeTechnologies,Part No.4466457)的生产商的说明书,通过引用方式全文并入本文。一旦模板阳性的Ion Sphere Particles被富集之后,即按照Ion Sequencing User Guide(PartNo.4467391)(通过引用方式并入本文)中的描述将Ion Spheres的等份载入Ion316TM Chip(Life Technologies,Part No.4466616),并根据Ion Torrent PGM Sequencer UserGuide(Life Technologies,Part No.4462917)中的描述(通过引用方式并入本文)进行分析和测序。
测序完成之后,计算每个样品的总的映射的测序读取/扩增子,按 照染色***置以信号的log2比率(百分率读取)作图。正常样品的预期的频率是0(即,样品不含拷贝数变异)。来自该实验的结果提供于图38A至38C。
图38A显示了XY三体性21/母体正常DNA的log2比率。其中,如实施例23所述制备了来自两种DNA样品的10ng输入DNA。将每个样品的总的映射的测序读取/扩增子(作为百分率读取)按照染色***置在基因组上作图。
图38A显示XY三体性21样品在染色体2中含有未报告的缺失(通过染色体2内的log2比率的降低所观察的)。
图38B显示了染色体20-22、X和Y上的相同数据的放大图。图38B显示了染色体21含有增多了约1.5倍的扩增子。
图38C显示了染色体2上的相同数据的放大图。图38C显示XY三体性21样品在染色体2内具有缺失(通过log2比率的降低所观察的)。
如本文提供的代表性数据所例示,可以使用本文公开的方法确定拷贝数变异。
实施例27.结肠肿瘤FFPE样品的拷贝数变异的测定
在该实施例中,使用Ion AmpliseqTM Comprehensive Cancer Panel(CatalogNo.4477685,Life Technologies,CA),根据Ion AmpliseqTM Library Kit2.0(CatalogNo.4475345,Life Technologies,CA)中提供的说明书,扩增了结肠肿瘤FFPE DNA样品。使用根据实施例23制备每个扩增子文库。使用来自起始材料的10ng DNA制备每个扩增子文库。
扩增子文库用于制备使用乳液PCR(emPCR)在Ion SphereTM Particles上克隆性扩增的DNA模板。该实施例中模板的制备是根据Ion Xpress Template Kit(LifeTechnologies,Part No.4466457)的生产商的说明书,通过引用方式全文并入本文。一旦模板阳性的Ion Sphere Particles被富集之后,即按照Ion Sequencing User Guide(PartNo.4467391)(通过引用方式并入本文)中的描述将Ion Spheres的等份载入 Ion318TM Chip(Life Technologies,Part No.4466617),并根据Ion Torrent PGM Sequencer UserGuide(Life Technologies,Part No.4462917)中的描述(通过引用方式并入本文)进行分析和测序。
测序完成之后,通过将各扩增子的百分率总的映射的测序读取除以所有扩增子的中位数来计算拷贝数。正常样品的预期的频率是0(即,样品不含拷贝数变异)。来自该实验的结果提供于图39A至39B。
图39A显示了来自结肠肿瘤样品的染色体17中的LASP1和ERBB2基因的倍数增加。LASP1和ERBB2都含有比周围的扩增子过度代表10倍或更多倍的几个扩增子。
图39B显示了染色体17内的相同数据的放大图。LASP1和ERBB2都含有比周围的扩增子过度代表20倍或更多倍的几个扩增子。之前已经报道了(Nathanson et al.,Int.J.Cancer:105,796-802(2003))ERBB2在结肠癌中升高44倍,这得到使用该FFPE结肠肿瘤样品的来自染色体17的数据的支持。如本文提供的代表性数据所例示,可以使用本文公开的方法确定拷贝数变异。
实施例28.从新确定拷贝数变异
在该实施例中,使用Ion AmpliseqTM Cancer Panel Primer Pool (CatalogNo.4471262,Life Technologies,CA),根据Ion AmpliseqTM Library Kit2.0(CatalogNo.4475345,Life Technologies,CA)中提供的说明书,扩增了几个不同的DNA样品。使用根据实施例23制备每个扩增子文库。使用来自起始材料的10ng DNA制备每个扩增子文库。
扩增子文库用于制备使用乳液PCR(emPCR)在Ion SphereTM Particles上克隆性扩增的DNA模板。该实施例中模板的制备是根据Ion Xpress Template Kit(LifeTechnologies,Part No.4466457)的生产商的说明书,通过引用方式全文并入本文。一旦模板阳性的Ion Sphere Particles被富集之后,即按照Ion Sequencing User Guide(PartNo.4467391)(通过引用方式并入本文)中的描述将Ion Spheres的等份载入Ion316TM Chip(Life Technologies,Part No.4466616),并根据Ion Torrent PGM Sequencer UserGuide(Life Technologies,Part No. 4462917)中的描述(通过引用方式并入本文)进行分析和测序。
测序完成之后,通过将各扩增子的百分率总的映射的测序读取除以所有扩增子的中位数来计算拷贝数。正常样品的预期的频率是1(即,样品不含拷贝数变异)。来自该实验的结果提供于图40A和40B。
图40A和图40B显示了本文公开的拷贝数变异方法可用于从新测定DNA样品内的拷贝数变化。图40A显示了跨基因NUP98的几个扩增子的扩增子频率数据。频率0处的圆圈代表通过本文公开的拷贝数变异方法扩增的NUP98的每个扩增子。红色(单独的)圆圈是来自获自Coriell DNA的单一DNA样品的数据点,其显示了覆盖NUP98的扩增子中的一个扩增子内的等位基因缺失。根据实施例23制备了4个DiGeorge综合征DNA样品,只不过使用的是Cancer Primer Pool,并且与不含拷贝数变异的DNA对照样品比较(图40B)。4个DiGeorge综合征DNA样品显示了一个等位基因上的未曾报道过的扩增子代表的2倍增加(扩增子26504803)。在所有4个DiGeorge综合征样品中都观察到该模式,如评价百分率比率所示(频率2.5处的误差条)。基于这些发现可以得出结论:所测试的DiGeorge综合征样品都包含覆盖基因NUP98的一个扩增子的等位基因缺失。因此,本文公开的拷贝数变异方法不仅可用于检测样品中的拷贝数变异,而且可用于从新测定样品中的拷贝数变异。

Claims (16)

1.用于确定拷贝数变异的非诊断目的的方法,包括扩增样品中的多个不同的靶序列,包括:
a)在单一扩增反应混合物中产生多个不同的扩增的靶序列,其是通过:将多个不同的靶序列与多个不同的靶标特异性引物对和聚合酶在扩增条件下接触,其中所述每一个引物对的靶标特异性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择,其中所述可切割基团是尿嘧啶或肌苷;
b)从扩增的靶序列切割可切割基团;
c)通过将至少一个接头连接至至少一个扩增的靶序列产生一个或多个接头连接的扩增的靶序列;
d)使用引物再扩增至少一个接头连接的扩增的靶序列;
e)对扩增的接头连接的靶序列进行测序;
f)计算至少一个扩增的接头连接的靶序列的测序读取的数目;和
g)确定至少一个扩增的接头连接的靶序列的拷贝数变异。
2.权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括染色体或基因重复。
3.权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括染色体或基因缺失。
4.权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括杂合性的丢失。
5.权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括与癌症相关的拷贝数变异。
6.权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括与遗传疾病相关的拷贝数变异。
7.权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括与非整倍性相关的拷贝数变异。
8.权利要求7的方法,其中所述非整倍性是性染色体非整倍性。
9.权利要求8的方法,其中所述非整倍性选自XO,XXX,XXXX,XXXXX,XXY,XXYY,XXXY,XXYYY,XXXYY,XXXXY,XYY,XYYY或XYYYY。
10.用于确定拷贝数变异的非诊断目的的方法,包括扩增两个或更多个样品中的多个不同的靶序列,包括:
a)在单一扩增反应混合物中产生多个不同的扩增的靶序列,其是通过:将多个不同的靶序列与多个不同的靶标特异性引物对和聚合酶在扩增条件下接触,其中所述每一个引物对的靶标特异性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择,其中所述可切割基团是尿嘧啶或肌苷;
b)从扩增的靶序列切割可切割基团;
c)通过将至少一个不同的条码接头连接至来自每个样品的至少一个扩增的靶序列产生一个或多个条码接头连接的扩增的靶序列;
d)使用引物再扩增来自每个样品的至少一个条码接头连接的扩增的靶序列;
e)对来自每个样品的扩增的接头连接的靶序列进行测序;
f)计算来自每个样品的至少一个扩增的接头连接的靶序列的测序读取的数目;和
g)确定每个样品的至少一个扩增的接头连接的靶序列的拷贝数变异。
11.权利要求10的方法,其中计算包括确定扩增的接头连接的靶序列的映射的测序读取的总数目除以映射的测序读取的总数目。
12.权利要求10的方法,其中计算包括确定扩增的接头连接的靶序列的百分率比率。
13.权利要求10的方法,其中计算包括确定扩增的接头连接的靶序列的百分率频率。
14.权利要求10的方法,其中计算包括确定扩增的接头连接的靶序列的log2比率。
15.权利要求10的方法,其中确定拷贝数变异包括与病症或疾病相关的至少一个扩增的接头连接的靶序列的过度代表。
16.权利要求10的方法,其中确定拷贝数变异包括与病症或疾病相关的至少一个扩增的接头连接的靶序列的不足代表。
CN201280066951.8A 2011-11-29 2012-10-29 用于多重pcr的方法和组合物 Active CN104053786B (zh)

Applications Claiming Priority (25)

Application Number Priority Date Filing Date Title
US201161564763P 2011-11-29 2011-11-29
US61/564,763 2011-11-29
US201161578192P 2011-12-20 2011-12-20
US61/578,192 2011-12-20
US201261594160P 2012-02-02 2012-02-02
US61/594,160 2012-02-02
US201261598881P 2012-02-14 2012-02-14
US201261598892P 2012-02-14 2012-02-14
US61/598,892 2012-02-14
US61/598,881 2012-02-14
US201261625596P 2012-04-17 2012-04-17
US61/625,596 2012-04-17
US201261639017P 2012-04-26 2012-04-26
US61/639,017 2012-04-26
US13/458,739 US9957558B2 (en) 2011-04-28 2012-04-27 Methods and compositions for multiplex PCR
PCT/US2012/035612 WO2012149438A1 (en) 2011-04-28 2012-04-27 Methods and compositions for multiplex pcr
USPCT/US2012/035612 2012-04-27
US13/458,739 2012-04-27
US13/618,805 2012-09-14
US13/618,805 US8673560B2 (en) 2011-04-28 2012-09-14 Methods and compositions for multiplex PCR
US13/619,178 US8728736B2 (en) 2011-04-28 2012-09-14 Methods and compositions for multiplex PCR
US13/619,815 2012-09-14
US13/619,815 US8728728B2 (en) 2011-04-28 2012-09-14 Methods and compositions for multiplex PCR
US13/619,178 2012-09-14
PCT/US2012/062494 WO2013081755A1 (en) 2011-11-29 2012-10-29 Methods and compositions for multiplex pcr

Publications (2)

Publication Number Publication Date
CN104053786A CN104053786A (zh) 2014-09-17
CN104053786B true CN104053786B (zh) 2017-06-06

Family

ID=48535938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280066951.8A Active CN104053786B (zh) 2011-11-29 2012-10-29 用于多重pcr的方法和组合物

Country Status (3)

Country Link
EP (2) EP2785860B1 (zh)
CN (1) CN104053786B (zh)
WO (1) WO2013081755A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2872650A2 (en) * 2012-07-13 2015-05-20 Life Technologies Corporation Human identifiation using a panel of snps
EP3052651B1 (en) * 2013-10-01 2019-11-27 Life Technologies Corporation Systems and methods for detecting structural variants
WO2015117040A1 (en) 2014-01-31 2015-08-06 Swift Biosciences, Inc. Improved methods for processing dna substrates
WO2015120177A1 (en) * 2014-02-07 2015-08-13 Qiagen Sciences Llc Pcr primers
GB201410693D0 (en) 2014-06-16 2014-07-30 Univ Southampton Splicing modulation
US20160083724A1 (en) 2014-09-24 2016-03-24 University Of Southern California Methods for sample preparation
CA2963288A1 (en) 2014-10-03 2016-04-07 Cold Spring Harbor Laboratory Targeted augmentation of nuclear gene output
US10221448B2 (en) 2015-03-06 2019-03-05 Pillar Biosciences Inc. Selective amplification of overlapping amplicons
WO2017060731A1 (en) 2015-10-09 2017-04-13 University Of Southampton Modulation of gene expression and screening for deregulated protein expression
EP3390636B1 (en) 2015-12-14 2021-05-19 Cold Spring Harbor Laboratory Antisense oligomers for treatment of dravet syndrome
US11096956B2 (en) 2015-12-14 2021-08-24 Stoke Therapeutics, Inc. Antisense oligomers and uses thereof
CN106957901A (zh) * 2016-01-12 2017-07-18 首都医科大学附属北京地坛医院 一种同时检测多种遗传代谢性肝病的试剂盒
JP6685138B2 (ja) * 2016-01-27 2020-04-22 シスメックス株式会社 核酸増幅の精度管理方法、精度管理用試薬およびその試薬キット
WO2018005983A1 (en) * 2016-07-01 2018-01-04 Natera, Inc. Compositions and methods for detection of nucleic acid mutations
CN109890983A (zh) * 2016-09-23 2019-06-14 生命技术公司 用于评估免疫应答的组合物和方法
EP3562958B1 (en) * 2016-12-29 2021-11-03 Seegene, Inc. Method for reducing primer dimer formation and increasing amplification efficiency
PT3673080T (pt) 2017-08-25 2023-12-06 Stoke Therapeutics Inc Oligómeros anti-sentido para o tratamento de estados patológicos e outras doenças
US11963774B2 (en) 2017-12-12 2024-04-23 International Business Machines Corporation Method probe with high density electrodes, and a formation thereof
US11495325B2 (en) * 2018-07-13 2022-11-08 Illumina, Inc. Systems and methods for multiplex PCR primer selection
WO2020015959A1 (en) * 2018-07-19 2020-01-23 Stichting Katholieke Universiteit Antisense oligonucleotides rescue aberrant splicing of abca4.
US20220098640A1 (en) * 2018-09-11 2022-03-31 The Board Of Trustees Of The Leland Stanford Junior University Methods and Systems for Multiplex Gene Amplification from Ultra-Low DNA Input Amounts and Uses Thereof
US20220213478A1 (en) * 2019-04-18 2022-07-07 Proqr Therapeutics Ii B.V. Antisense oligonucleotides for the treatment of usher syndrome
US11739324B2 (en) 2019-06-25 2023-08-29 Stichting Katholieke Universiteit Antisense oligonucleotides rescue aberrant splicing of ABCA4
CN110438220A (zh) * 2019-08-16 2019-11-12 深圳市人民医院 纤毛不动综合症基因面板试剂盒及其应用
IL298063A (en) 2020-05-11 2023-01-01 Stoke Therapeutics Inc opa1 antisense oligomers for the treatment of conditions and diseases

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070231823A1 (en) * 2006-03-23 2007-10-04 Mckernan Kevin J Directed enrichment of genomic DNA for high-throughput sequencing

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US20040063109A2 (en) 2002-01-25 2004-04-01 Applera Corporation Single-tube, ready-to-use assay kits, and methods using same
JP2006508662A (ja) 2002-12-04 2006-03-16 アプレラ コーポレイション ポリヌクレオチドの多重増幅
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US20080293589A1 (en) * 2007-05-24 2008-11-27 Affymetrix, Inc. Multiplex locus specific amplification
US8586310B2 (en) * 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070231823A1 (en) * 2006-03-23 2007-10-04 Mckernan Kevin J Directed enrichment of genomic DNA for high-throughput sequencing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Whole-Genome Comparison Reveals Novel Genetic Elements That Characterize the Genome of Industrial Strains of Saccharomyces cerevisiae;Anthony R. Borneman et al.;《PLoS Genetics》;20110203;e1001287 *

Also Published As

Publication number Publication date
WO2013081755A1 (en) 2013-06-06
CN104053786A (zh) 2014-09-17
EP2785860A1 (en) 2014-10-08
EP2785860B1 (en) 2015-06-03
EP2966180A1 (en) 2016-01-13
EP2966180B1 (en) 2017-08-16

Similar Documents

Publication Publication Date Title
CN104053786B (zh) 用于多重pcr的方法和组合物
US11851703B2 (en) Methods and compositions for multiplex PCR
US10100354B2 (en) Methods and compositions for multiplex PCR
US10266881B2 (en) Methods and compositions for multiplex PCR
US20170247756A1 (en) Genetic sequence verification compositions, methods and kits
WO2013081864A1 (en) Methods and compositions for multiplex pcr

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant