CN114450420A

CN114450420A - 用于肿瘤学精确测定的组合物和方法

Info

Publication number: CN114450420A
Application number: CN202080060767.7A
Authority: CN
Inventors: D·池; A·厄文; 李娜; Z·罗; A·马尔科维茨
Original assignee: Life Technologies Corp
Current assignee: Life Technologies Corp
Priority date: 2019-08-30
Filing date: 2020-08-28
Publication date: 2022-05-06
Also published as: JP2022546485A; US11447832B2; EP4022092A1; WO2021042131A1; US20230112730A1; US20210062271A1

Abstract

提供了用于制备靶核酸序列文库的方法和组合物，所述方法和组合物可用于评估基因突变以对样品进行肿瘤学生物标志物谱分析。具体地，提供了靶特异性引物组，所述靶特异性引物组允许选择性扩增样品中的肿瘤学生物标志物靶序列。一方面，本发明涉及靶特异性引物，所述靶特异性引物可用于选择性扩增一种或多种与来自两种或更多种样品类型的肿瘤学生物标志物相关的靶序列。在一些方面，使用所公开的方法获得的经扩增的靶序列以及组合物可以用于各种过程，包含核酸测序，并且用于检测与肿瘤学相关的一种或多种靶向序列的遗传变体的存在。

Description

用于肿瘤学精确测定的组合物和方法

相关申请的交叉引用

本申请要求了2019年8月30日提交的美国临时申请第62/894,576号的优先权和权益，所述美国临时申请通过引用以其整体并入本文。

序列表

本申请在此以引用的方式并入有与此同时提交的电子序列表材料。电子序列表中的材料以2020年8月27日创建的标题为“LT01496_STX.txt”的文本(.txt)文档形式提交，其文件大小是550KB并且以全文引用的方式并入本文中。

技术领域

本发明涉及制备靶核酸序列文库的组合物和方法和其用途。

背景技术

癌症疗法的进展已经开始在肿瘤学中提供有希望的结果。与常规化学疗法相比，靶向疗法、免疫检查点抑制剂、癌症疫苗和T细胞疗法在应答性群体中示出可持续的结果。然而，有效识别应答性候选者和/或监测响应已证明具有挑战性。迫切需要更好地了解肿瘤微环境、肿瘤进化和药物应答生物标志物。可以有效地且高效地检测各种样品类型中的多种相关生物标志物的高通量、***化和标准化的测定解决方案是期望的。

发明内容

在本发明的一方面，提供用于对样品中的可执行肿瘤学生物标志物进行单流多重测定的组合物。在一些实施例中，组合物由多种引物试剂组成，所述多种引物试剂针对多个靶序列以快速地且高效地检测样品中的低水平靶标。所提供的组合物靶向肿瘤学基因序列，其中多个基因序列选自DNA热点突变基因、拷贝数变异(CNV)基因、基因间融合基因和基因内融合基因中的靶标。所提供的组合物在集成和自动化的工作流程中，在一天内最大限度地检测来自各种样品(例如，FFPE组织、血浆)的关键生物标志物，例如EGFR、ALK、BRAF、ROS1、HER2、MET、NTRK和RET。

在一些实施例中，样品中的多个可执行靶基因确定所述样品中指示潜在的诊断、预后、候选治疗方案和/或不良事件的肿瘤学活性的变化。在特定实施例中，所提供的组合物包含多种选自表A的引物试剂。在一些实施例中，提供了包括本发明的组合物的多重测定。在一些实施例中，提供了包括本发明的组合物的测试试剂盒。

在本发明的另一方面，提供了用于确定生物样品中的可执行肿瘤学生物标志物的方法。此类方法包括对来自含有靶序列的生物样品的多个靶序列进行多重扩增。扩增包括在存在聚合酶的情况下在扩增条件下使用多个靶特异性引物接触包括多个所关注靶序列的样品的至少一部分，以产生多个经扩增的靶序列。所述方法进一步包括检测所述多个靶肿瘤学序列中的每个靶序列的存在，其中与对照样品相比，一种或多种可执行肿瘤学生物标志物的检测确定了所述样品中指示潜在的诊断、预后、候选治疗方案和/或不良事件的肿瘤学活性的变化。本文描述的方法使用本文提供的本发明的组合物。在一些实施例中，靶基因选自由以下组成的组：DNA热点突变基因、拷贝数变异(CNV)基因、基因间融合基因和基因内融合基因。在某些实施例中，靶基因选自表1的基因。在特定实施例中，所述靶基因由表1的基因组成。

此外，使用所提供的组合物和包括所提供的组合物的试剂盒分析核酸文库的序列是本发明的其它方面。在一些实施例中，提供了对所得文库的序列的分析能够检测低频等位基因、改进基因融合和新型融合的检测和/或检测所关注样品和/或所关注的多个样品中的基因突变。在某些实施例中，考虑所提供的组合物和方法的手动、部分自动化和全自动化实施方案。在特定实施例中，提供组合物的用途在用于样品遗传分析的完全集成的文库制备、模板化和测序***中实施。在某些实施例中，所提供的本发明的组合物和方法的用途为研究和临床应用提供了益处，包含组织和/或血浆样本的一线测试以及对样本的持续监测以用于生物标志物的复发和/或耐药性检测。

本说明书中所提及的所有公开、专利和专利申请都在本文中通过引用并入，程度如同每一单独的公开、专利或专利申请被专门并且单独地指示以引用的方式并入一般。

对于各种核酸分析，期望用于从复杂样品中产生涵盖可执行肿瘤学生物标志物的目标文库的有效方法。本发明尤其提供制备靶核酸序列的文库的方法，允许快速产生高度多重化的目标文库，包含独特的标签序列；并且所得文库组合物可用于多种应用，包含测序应用。所提供的组合物设计用于检测组织和血浆衍生样品中的突变、拷贝数变异(CNV)和基因融合。所提供的组合物包括用于高通量样品的靶向引物组和试剂，以产生用于遗传分析的下一代工作流程。在特定实施例中，在完全集成的样品到分析***上实施用途。本发明的新型特征在附属权利要求中具体阐述；并且通过参考阐述了说明性实施例的以下详细描述，将获得对本发明的这些特征和优势的完整理解，在所述说明性实施例中利用了本发明的原理。

具体实施方式

本文中使用的章节标题仅用于组织目的并且不应理解为以任何方式限制所描述的主题。本申请案中所引用的所有文献和类似材料，包含(但不限于)专利案、专利申请案、论文、书籍、专著和互联网网页，都以全文引用的方式明确地併入以用于任何目的。当并入的参考文献中的术语的定义呈现为与本发明教示中提供的定义不同时，应以本发明教示中提供的定义为准。应了解，在本发明教示中论述的温度、浓度、时间等之前存在暗示的“约”，使得微小并且非实质的偏差在本文中的本发明教示的范围内。在本申请案中，除非另外明确陈述，否则单数的使用包含复数。应注意，除非明确地并且肯定地限于一个指示物，否则如本说明书中所使用的单数形式“一(a/an)”和“所述”和任何词的单数用途包含多个指示物。此外，“包含(comprise/comprises/comprising)”、“含有(contain/contains/containing)”以及“包括(include/includes/including)”的使用并不打算是限制性的。应理解，一般说明仅是例示性和解释性的，并且不限制本发明。

除非另外定义，否则结合本文中所述的本发明使用的科学和技术术语应具有所属领域的技术人员通常理解的含义。此外，除非上下文另外要求，单数术语应该包含复数含义并且复数术语应该包括单数含义。一般来说，本文中所使用的与细胞和组织培养、分子生物学以及蛋白质和寡核苷酸或聚核苷酸化学和杂交结合使用的命名法是所属领域中众所周知并且常用的命名法。除非另外指出，否则本主题的实践可采用在所属领域的技能内的有机化学、分子生物学(包含重组技术)、细胞生物学和生物化学的常规技术和描述。此类常规技术包含但不限于合成多核苷酸的制备、聚合技术、聚合物粒子的化学和物理分析、核酸文库的制备、核酸测序和分析等。合适技术的具体说明可参考本文提供的实例使用。也可以使用其它等效的常规程序。此类常规技术和说明可以在以下标准实验室手册中找到：如《基因组分析：实验室手册系列(Genome Analysis:A Laboratory Manual Series)》(第I-IV卷)，《PCR引物：实验室手册(PCR Primer:A Laboratory Manual)》和《分子克隆：实验指南(Molecular Cloning:A Laboratory Manual)》(均来自冷泉港实验室出版社(Cold SpringHarbor Laboratory Press)),Hermanson,《生物结合技术(Bioconjugate Techniques)》,第二版(学术出版社(Academic Press),2008)；Merkus,《粒度测量(Particle SizeMeasurements)》(斯普林格出版社(Springer),2009)；Rubinstein和Colby，《聚合物物理学(Polymer Physics)》(牛津大学出版社,2003)；等。如根据本文中提供的实施例所用，除非另外指示，否则以下术语应理解为具有以下含义：

如本文中所使用，“扩增”或“扩增反应”和其衍生物通常指用于将核酸分子(称为模板核酸分子)的至少一部分复写或复制到至少一个其它核酸分子中的作用或过程。其它核酸分子任选地包含与模板核酸分子的至少一些部分基本上一致或基本上互补的序列。模板目标核酸分子可以是单链或双链的。其它所得复制的核酸分子可以独立地是单链或双链的。在一些实施例中，扩增包含模板依赖性活体外酶催化反应，其用于产生目标核酸分子的至少某一部分的至少一个拷贝，或产生与目标核酸分子的至少某一部分互补的目标核酸序列的至少一个拷贝。扩增任选地包含核酸分子的线性或指数复制。在一些实施例中，使用等温条件进行这类扩增；在其它实施例中，这类扩增可以包含热循环。在一些实施例中，扩增是多重扩增，其包含在单次扩增反应中同时扩增多个目标序列。至少一些目标序列可以位于单次扩增反应中所包含的相同核酸分子或不同目标核酸分子上。在一些实施例中，“扩增”包含基于DNA和/或RNA的核酸(单独或呈组合形式)的至少某一部分的扩增。扩增反应可以包含单链或双链核酸衬底并且可以进一步包括所属领域的一般技术人员已知的任何扩增方法。在一些实施例中，扩增反应包含聚合酶链反应(PCR)。在一些实施例中，扩增反应包含等温扩增。

如本文中所使用，“扩增条件”和衍生词(例如用于扩增的条件等)通常指适用于扩增一个或多个核酸序列的条件。扩增可以是线性或指数的。在一些实施例中，扩增条件包含等温条件或可以包括热循环条件，或等温和热循环条件的组合。在一些实施例中，适用于扩增一个或多个目标核酸序列的条件包含聚合酶链反应(PCR)条件。通常，扩增条件是指足以扩增如一个或多个靶序列的核酸或扩增接合到一个或多个衔接子的经扩增的靶序列(例如，衔接子接合的经扩增的靶序列)的反应混合物。通常，扩增条件包含用于扩增或核酸合成的催化剂，例如聚合酶；与待扩增的核酸具有一定程度的互补性的引物；以及用于促进与核酸杂交后引物的延伸的核苷酸，如三磷酸脱氧核苷(dNTP)。扩增条件需要引物与核酸的杂交或粘接，引物的延伸和变性步骤，其中经延伸的引物与经历扩增的核酸序列分离。通常但非必须，扩增条件可以包含热循环。在一些实施例中，扩增条件包含多个循环，其中重复粘接、延伸和分离的步骤。通常，扩增条件包含阳离子，如Mg⁺⁺或Mn⁺⁺(例如MgCl₂等)，并且还可以任选地包括各种离子强度调节剂。

如本文中所使用，“目标序列”、“目标核酸序列”或“相关目标序列”和其衍生物通常指可以根据本公开扩增或合成的任何单链或双链核酸序列，包含怀疑或预期样品中存在的任何核酸序列。在一些实施例中，在添加靶特异性引物或附接的衔接子之前，目标序列以双链形式存在并且包含待扩增或合成的具体核苷酸序列的至少一部分或其补体。目标序列可以包含可与适用于扩增或合成反应的引物在聚合酶延伸之前杂交的核酸。在一些实施例中，所述术语指核酸序列，其序列一致性、核苷酸的次序或位置由本公开的方法中的一种或多种测定。

如本文中所使用，术语“部分”和其变化形式在关于既定核酸分子(例如引物或模板核酸分子)使用时，包含核酸分子的长度(包括核酸分子的部分或整个长度)内的任何数目的相邻核苷酸。

如本文中所使用，当关于两种或更多种组分使用时，“接触”和其派生词通常是指用于促进或实现参考组分的接近、靠近、混合物或共混而未必需要这类组分的物理接触的任何过程，并且包含含有所述参考组分中的任一种或多种的溶液的彼此混合。参考组分可以任何具体顺序或组合接触并且组分的具体引述顺序不受限制。例如，“使A与B和C接触”涵盖其中A首先与B接触，然后与C接触的实施例，以及其中C与A接触，然后与B接触的实施例，以及其中A和C的混合物与B接触的实施例等。此外，这类接触未必需要接触过程的最终结果是包含所有参考组分的混合物，只要在接触过程期间的某一点，所有参考组分同时存在或同时包含于相同混合物或溶液中即可。举例来说，“使A与B和C接触”可以包含其中C首先与A接触以形成第一混合物，所述第一混合物接着与B接触以形成第二混合物，接着从第二混合物去除C的实施例；任选地，接着也可以去除A，仅留下B。当待接触的参考组分中的一个或多个包括多个物质时(例如，“使目标序列与多个靶特异性引物和聚合酶接触”)，那么多个物质中的每个成员可以被视为接触过程中的单独组分，使得接触可以包含使多个物质中的任一个或多个成员与所述多个物质中的任何其它成员和/或任何其它参考组分以任何顺序或组合接触(例如，一些但非全部所述多个靶特异性引物可以与目标序列接触，接着与聚合酶接触，并且接着与所述多个靶特异性引物中的其它成员接触)。

如本文中所使用，术语“引物”和其派生词通常指可与相关目标序列杂交的任何聚核苷酸。在一些实施例中，引物也可以用于引发核酸合成。典型地，引物充当衬底，其上可由聚合酶聚合核苷酸；然而，在一些实施例中，引物可以变成并入合成的核酸链中并且提供另一引物可杂交的位点以引发与所合成的核酸分子互补的新链的合成。引物可以包含核苷酸或其类似物的任何组合，其可以任选地连接以形成任何合适长度的线形聚合物。在一些实施例中，引物是单链寡核苷酸或聚核苷酸。(出于本公开的目的，术语“聚核苷酸”和“寡核苷酸”在本文中可以互换地使用并且未必指示两个核苷酸之间长度的任何差异)。在一些实施例中，引物是双链的。如果是双链的，那么在用于制备延伸产物之前，首先处理引物以分离其各链。优选的是，引物是寡脱氧核苷酸。引物必须足够长以引发延伸产物的合成。引物的长度将取决于许多因素，包含温度、引物的来源以及使用方法。在一些实施例中，当暴露于扩增或合成条件时，引物充当用于扩增或合成的起始点；这类扩增或合成可以模板依赖性方式进行并且任选地形成与至少一部分目标序列互补的引物延伸产物。例示性扩增或合成条件可以包括使引物与聚核苷酸模板(例如包含目标序列的模板)、核苷酸和诱导剂(如聚合酶)在合适的温度和pH值下接触，以诱导靶特异性引物的末端上核苷酸的聚合。如果为双链，那么在用于制备引物延伸产物之前，可任选地处理引物以分离其链。在一些实施例中，引物为寡脱氧核苷酸或寡核糖核苷酸。在一些实施例中，引物可包含一个或多个核苷酸类似物。靶特异性引物的精确长度和/或组成(包含序列)可影响许多特性，包含熔融温度(Tm)、GC含量、次要结构的形成、重复核苷酸主结构、预测的引物延伸产物的长度、跨越相关核酸分子的覆盖度的程度、在单次扩增或合成反应中的引物数目、在引物内是否存在核苷酸类似物或修饰的核苷酸等。在一些实施例中，引物可在扩增或合成反应内与相容的引物配对以形成由正向引物和反向引物组成的引物对。在一些实施例中，引物对的正向引物包含基本上与核酸分子的一个链的至少一部分互补的序列，并且引物对引物的反向引物包含基本上与所述链的至少一部分一致的序列。在一些实施例中，正向引物和反向引物能够与核酸双螺旋的相对链杂交。任选地，正向引物引发第一核酸链的合成，并且反向引物引发第二核酸链的合成，其中第一和第二链基本上彼此互补，或可杂交以形成双链核酸分子。在一些实施例中，扩增或合成产物的一端由正向引物定义并且扩增或合成产物的另一端由反向引物定义。在一些实施例中，当需要扩增或合成冗长引物延伸产物(如扩增外显子、编码区或基因)时，可产生若干引物对而非跨越所需长度以实现所述区的足够扩增。在一些实施例中，引物可以包含一个或多个可切割基团。在一些实施例中，引物长度在约10到约60个核苷酸、约12到约50个核苷酸和约15到约40个核苷酸长度范围内。典型地，当在存在dNTP和聚合酶的情况下暴露于扩增条件时，引物能够与相应的目标序列杂交并且进行引物延伸。在一些情况下，具体核苷酸序列或引物的一部分在扩增反应开始时是已知的或可以通过本文中所公开的方法中的一种或多种测定。在一些实施例中，引物在引物内的一个或多个位置包含一个或多个可裂解基团。

如本文所用，“靶特异性引物”和其衍生词通常指单链或双链聚核苷酸，通常为寡核苷酸，其包含至少一个与包含靶序列的核酸分子的至少一部分至少50％互补，通常至少75％互补或至少85％互补，更通常至少90％互补，更通常至少95％互补，更通常至少98％或至少99％互补或一致的序列。在这类情况下，靶特异性引物和目标序列描述成彼此“相对应”。在一些实施例中，靶特异性引物能够与其对应靶序列的至少一部分(或靶序列的补体)杂交；此类杂交可任选地在标准杂交条件下或在严格杂交条件下进行。在一些实施例中，靶特异性引物不能与靶序列或其补体杂交，但能够与包含靶序列的核酸链的一部分或其补体杂交。在一些实施例中，靶特异性引物包含至少一个与靶序列本身的至少一部分至少75％互补，通常至少85％互补，更通常至少90％互补，更通常至少95％互补，更通常至少98％互补或更通常至少99％互补的序列；在其它实施例中，靶特异性引物包含至少一个与除靶序列以外的核酸分子的至少一部分至少75％互补，通常至少85％互补，更通常至少90％互补，更通常至少95％互补，更通常至少98％互补或更通常至少99％互补的序列。在一些实施例中，靶特异性引物基本上不与存在于样品中的其它靶序列互补；任选地，靶特异性引物基本上不与存在于样品中的其它核酸分子互补。在一些实施例中，存在于样品中的不包含或对应于靶序列(或靶序列的补体)的核酸分子称为“非特异性”序列或“非特异性核酸”。在一些实施例中，靶特异性引物被设计成包含基本上与其对应靶序列的至少一部分互补的核苷酸序列。在一些实施例中，靶特异性引物与包含其相应目标序列的核酸分子的至少一部分至少95％互补或至少99％互补或一致(跨越其整个长度)。在一些实施例中，靶特异性引物可与其相应目标序列的至少一部分至少90％、至少95％互补、至少98％互补或至少99％互补或一致(跨越其整个长度)。在一些实施例中，正向靶特异性引物和反向靶特异性引物定义靶特异性引物对，其可以用于经由模板依赖性引物延伸来扩增目标序列。通常，靶特异性引物对中的每个引物包含至少一个与包含相应靶序列的核酸分子的至少一部分基本上互补，但与样品中的至少一个其它靶序列小于50％互补的序列。在一些实施例中，扩增可在单次扩增反应中使用多个靶特异性引物对进行，其中每个引物对包含正向靶特异性引物和反向靶特异性引物，各自包括至少一个与样品中的相应目标序列基本上互补或基本上一致的序列，并且每个引物对具有不同的相应目标序列。在一些实施例中，靶特异性引物可以在其3'端或其5'端与扩增反应中的任何其它靶特异性引物是基本上非互补的。在一些实施例中，靶特异性引物可以包含在扩增反应中与其它靶特异性引物的最小交叉杂交。在一些实施例中，靶特异性引物包含在扩增反应混合物中与非特异性序列的最小交叉杂交。在一些实施例中，靶特异性引物包含最小自身互补。在一些实施例中，靶特异性引物可以包含位于3'端的一个或多个可切割基团。在一些实施例中，靶特异性引物可以包含位于靶特异性引物的中心核苷酸附近或周围的一个或多个可切割基团。在一些实施例中，更多个靶特异性引物之一仅包含在靶特异性引物的5'端处的不可裂解核苷酸。在一些实施例中，任选地在相同扩增反应中，与一个或多个不同靶特异性引物相比，靶特异性引物包含引物的3'端或5'端处的最小核苷酸序列重叠。在一些实施例中，在单一反应混合物中的1、2、3、4、5、6、7、8、9、10种或更多种靶特异性引物包含以上实施例中的一个或多个。在一些实施例中，单一反应混合物中基本上所有的多种靶特异性引物包含以上实施例中的一个或多个。

如本文中所使用，术语“衔接子”表示可以用于相关聚核苷酸的操作的核酸分子。在一些实施例中，衔接子用于一个或多个目标核酸的扩增。在一些实施例中，衔接子用于测序反应中。在一些实施例中，衔接子具有一个或多个不具有5'磷酸残基的末端。在一些实施例中，衔接子包括至少一个引发位点、由至少一个引发位点组成或主要由至少一个引发位点组成。这类含有衔接子的引发位点可以称为“引物”衔接子。在一些实施例中，衔接子引发位点可以适用于PCR过程。在一些实施例中，衔接子包含与样品内的至少一个目标序列(本文中称为基因特异性目标序列、目标特异性序列或靶特异性引物)的3'端或5'端基本上互补的核酸序列。在一些实施例中，衔接子包含与样品中存在的任何目标序列的3'端或5'端基本上不互补的核酸序列。在一些实施例中，衔接子包含与目标核酸序列基本上不互补的单链或双链线形寡核苷酸。在一些实施例中，衔接子包含基本上与样品中的至少一个并且优选一些或全部核酸分子不互补的核酸序列。在一些实施例中，合适的衔接子长度在约10-75个核苷酸、约12-50个核苷酸和约15-40个核苷酸长度范围内。通常，衔接子可以包含核苷酸和/或核酸的任何组合。在一些方面中，衔接子在一个或多个位置处包含一个或多个可裂解基团。在一些实施例中，衔接子包含与引物(例如通用引物)的至少一部分基本上一致性或基本上互补的序列。在一些实施例中，衔接子包含标签序列以帮助分类、鉴别或测序。在一些实施例中，衔接子充当用于目标序列的扩增的底物，尤其在合适的温度和pH值下，在存在聚合酶和dNTP的情况下。

如本文中所使用，“聚合酶”和其派生词通常指可以催化核苷酸(包含其类似物)聚合成核酸链的任何酶。典型地但未必，这类核苷酸聚合可以模板依赖性方式进行。这类聚合酶可以包含(但不限于)天然存在的聚合酶和其任何子单元和截短物、突变型聚合酶、变异型聚合酶、重组、融合或以其它方式工程改造的聚合酶、经化学修饰的聚合酶、合成分子或组件以及保留催化这类聚合的能力的任何类似物、衍生物或其片段。任选地，聚合酶可以是包括一个或多个突变的突变型聚合酶，所述突变涉及用其它氨基酸置换一个或多个氨基酸，来自聚合酶的一个或多个氨基酸的***或缺失或两个或更多个聚合酶的部分的连接。典型地，聚合酶包括可以进行核苷酸结合和/或核苷酸聚合催化的一个或多个活性位点。一些示例性聚合酶包含但不限于DNA聚合酶和RNA聚合酶。如本文所用，术语“聚合酶”和其变化形式还指包括至少两个彼此连接的部分的融合蛋白质，其中第一部分包括可催化核苷酸聚合成核酸链的肽并且所述第一部分连接到包括第二多肽的第二部分。在一些实施例中，第二多肽可以包含报导子酶或增强持续合成能力的结构域。任选地，聚合酶可以具有5'核酸外切酶活性或末端转移酶活性。在一些实施例中，聚合酶可以任选地再活化，例如通过使用热、化学物质或将新的量的聚合酶再添加到反应混合物中。在一些实施例中，聚合酶可以包含可任选地再活化的热起始聚合酶和/或基于适体的聚合酶。

如本文中所使用，术语“一致性”和“一致”和其变化形式，当关于两种或更多种核酸序列使用时，是指两种或更多种序列(例如，核苷酸或多肽序列)的序列类似性。在两种或更多种同源序列的情况下，序列或其子序列的一致性或同源性百分比指示相同(即，约70％一致性，优选地75％、80％、85％、90％、95％、98％或99％一致性)的全部单体单元(例如，核苷酸或氨基酸)的百分比。一致性百分比可在规定区内，当出于比较窗内的最大对应而比较和比对时，或在指定区内，如使用BLAST或BLAST 2.0序列比较算法用下文所描述的默认参数或通过手动比对和目视检查所测量。当氨基酸水平或核苷酸水平存在至少85％一致性时，序列被称为“基本上一致”。优选地，一致性存在于至少约25、50或100个残基长的区内或至少一个所比较的序列的整个长度上。用于确定序列一致性百分比和序列类似性的典型算法为BLAST和BLAST 2.0算法，其描述于Altschul等人,《核算研究(Nuc.Acids Res.)》25:3389-3402(1977)中。其它方法包含Smith和Waterman,《应用数学进展(Adv.Appl.Math.)》2:482(1981)以及Needleman和Wunsch,《分子生物学杂志(J.Mol.Biol.)》48:443(1970)描述的算法等。两个核酸序列基本上一致的另一个指示是，两个分子或其互补序列在严格杂交条件下彼此杂交。

如本文中所使用，术语“互补”和“补体”以及其派生词指可在反平行定向中(如在杂交双螺旋中)的两个或更多个独立相应位置经历累积碱基配对的任何两个或更多个核酸序列(例如部分或全部模板核酸分子、目标序列和/或引物)。此类碱基配对可根据任何现有规则集合进行，例如根据沃森-克里克碱基配对规则或根据一些其它碱基配对范例。任选地，在第一与第二核酸序列之间可存在“完全”或“总体”互补，其中在第一核酸序列中的每个核苷酸可进行与第二核酸序列上的对应的反平行位置中的核苷酸的稳定化碱基配对相互作用。“部分”互补描述一个核酸序列的至少20％但少于100％的残基与在另一个核酸序列中的残基互补的核酸序列。在一些实施例中，一个核酸序列的至少50％但少于100％的残基与在另一个核酸序列中的残基互补。在一些实施例中，一个核酸序列的至少70％、80％、90％、95％或98％但少于100％的残基与在另一个核酸序列中的残基互补。当一个核酸序列中的至少85％的残基与另一个核酸序列中的残基互补时，序列被称为“基本上互补”。在一些实施例中，两个互补或基本上互补序列能够在标准或严格杂交条件下彼此杂交。“不互补”描述其中一个核酸序列的少于20％的残基与在另一个核酸序列中的残基互补的核酸序列。当一个核酸序列中的少于15％的残基与在另一个核酸序列中的残基互补时，序列被称为“基本上不互补”。在一些实施例中，两个不互补或基本上不互补序列无法在标准或严格杂交条件下彼此杂交。“错配”存在于不互补的两个相对核苷酸中的任何位置。互补核苷酸包含在生理条件下，在DNA复制期间通过彼此相对的DNA聚合酶有效并入的核苷酸。在典型的实施例中，在彼此位于反平行位置的核苷酸和/或多核苷酸的核碱基之间，互补核苷酸可彼此形成碱基对，如通过特异性沃森-克里克型氢键形成的A-T/U和G-C碱基对，或通过某种其它类型的碱基配对范例形成的碱基对。其它人工碱基对的互补性可以是基于其它类型的氢键和/或碱基的疏水性和/或碱基之间的形状互补性。

如本文中所使用，“经扩增的目标序列”和其衍生物通常是指使用靶特异性引物和本文所提供的方法进行目标序列的扩增/扩增目标序列而产生的核酸序列。经扩增的目标序列相对于目标序列可以是同义(第二轮和后续偶数轮扩增中产生的正链)或反义(即，在第一轮和后续奇数轮扩增期间产生的负链)中的任一种。出于本公开的目的，经扩增的目标序列通常与反应中另一个经扩增的目标序列的任何部分小于50％互补。

如本文中所使用，术语“接合”和其派生词通常指用于将两个或更多个分子共价连接在一起(例如使两个或更多个核酸分子彼此共价连接)的动作或方法。在一些实施例中，接合包含核酸的相邻核苷酸之间的结合口。在一些实施例中，接合包含形成在第一核酸分子的端与第二核酸分子的端之间的共价键。在一些实施例中，例如其中待接合的核酸分子包含常规核苷酸残基的实施例，接合可以包含形成在一个核酸的5'磷酸基和第二核酸的3'羟基之间的共价键，从而形成接合的核酸分子。在一些实施例中，可以使用任何用于在相邻核苷酸之间使5'磷酸与3'羟基接合或结合的方法。在例示性实施例中，可以使用酶，如连接酶。

如本文中所使用，“连接酶”和其派生词通常指任何能够催化两个衬底分子的接合的试剂。在一些实施例中，连接酶包含能够催化核酸的相邻核苷酸之间的接口的接合的酶。在一些实施例中，连接酶包含能够催化一个核酸分子的5'磷酸与另一个核酸分子的3'羟基之间形成共价键，从而形成经接合的核酸分子的酶。合适的连接酶可以包含(但不限于)T4DNA连接酶；T7 DNA连结酶；Taq DNA连接酶，以及大肠杆菌(E.coli)DNA连接酶。

如本文中所定义，“可裂解基团”通常指在并入核酸后可以在适当条件下裂解的任何部分。举例来说，可以将可裂解基团并入靶特异性引物、经扩增的序列、衔接子或样品的核酸分子中。在例示性实施例中，靶特异性引物可以包含可裂解基团，其变成并入经扩增的产物中并且接着在扩增之后裂解，从而从经扩增的产物去除一部分或所有靶特异性引物。可以使可裂解基团裂解或通过任何可接受的手段以其它方式从靶特异性引物、经扩增的序列、衔接子或样品的核酸分子去除。举例来说，可以通过酶促、热学、光氧化或化学处理从靶特异性引物、经扩增的序列、衔接子或样品的核酸分子去除可裂解基团。在一个方面中，可裂解基团可以包含非天然存在的核碱基。举例来说，寡脱氧核苷酸可包含一个或多个RNA核碱基，如可通过尿嘧啶糖基化酶去除的尿嘧啶。在一些实施例中，可切割基团可以包含一个或多个修饰的核碱基(如7-甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶或5-甲基胞嘧啶)或一个或多个修饰的核苷(即，7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷或5-甲基胞啶)。可通过酶促、化学或热学手段从核酸去除修饰的核碱基或核苷酸。在一个实施例中，可切割基团可以包含在暴露于紫外光(即，溴脱氧尿苷)时，可在扩增(或合成)之后从引物去除的部分。在另一个实施例中，可切割基团可以包含甲基化胞嘧啶。通常，甲基化胞嘧啶可由引物裂解，例如在诱导扩增(或合成)之后、在亚硫酸氢钠处理时。在一些实施例中，可裂解部分可以包含限制位点。举例来说，引物或目标序列可以包含对一种或多种限制酶具有特异性的核酸序列，并且在扩增(或合成)之后，引物或目标序列可以用一种或多种限制酶处理使得去除可裂解基团。通常，可以在一个或多个位置包含一个或多个可裂解基团以及靶特异性引物、经扩增的序列、衔接子或样品的核酸分子。

如本文中所使用，“消化”、“消化步骤”和其派生词通常指用于使可裂解基团裂解或以其它方式从靶特异性引物、经扩增的序列、衔接子或样品的核酸分子去除的任何方法。在一些实施例中，消化步骤涉及化学、热、光氧化或消化过程。

如本文中所使用，术语“杂交”符合其在所属领域中的用途，并且通常指用于使两个核酸分子经历碱基配对相互作用的方法。当一个核酸分子的任何部分与另一个核酸分子的任何部分碱基配对时，两个核酸分子分子称为杂交；未必需要两个核酸分子跨越其整个各别长度杂交并且在一些实施例中，至少一个核酸分子可包含不与另一个核酸分子杂交的部分。短语“在严格条件下杂交”和其派生词通常指可在存在高杂交温度和低离子强度的条件下进行靶特异性引物与目标序列的杂交的条件。如本文中所使用，短语“标准杂交条件”和其派生词通常指可在存在低杂交温度和高离子强度的情况下进行引物与寡核苷酸(即，目标序列)的杂交的条件。在一个例示性实施例中，标准杂交条件包含在约50-55℃下，含有约100mm硫酸镁、约500mM Tris-硫酸盐(pH 8.9)和约200mM硫酸铵的水性环境或其等效物。

如本文中所使用，当关于核酸分子(例如目标序列或经扩增的目标序列)使用时，术语“末端”和其派生词可以包含核酸分子的末端30个核苷酸、末端20和甚至更通常末端15个核苷酸。包含一连串相邻核苷酸的线形核酸分子通常包括至少两个末端。在一些实施例中，核酸分子的一端可以包含3'羟基或其等效物，并且可以称为“3'端”和其派生词。任选地，3'端包含未连接到单核苷酸戊糖环的5'磷酸基的3'羟基。典型地，3'端包括经定位与包含未连接的3'羟基的核苷酸相邻的一个或多个5'连接的核苷酸，通常经定位与3'羟基相邻的30个核苷酸，通常末端20个并且甚至更通常末端15个核苷酸。通常，一个或多个连接的核苷酸可以表示成寡核苷酸中存在的核苷酸的百分比，或可以与未连接的3'羟基相邻的许多连接的核苷酸形式提供。举例来说，3'端可以包含寡核苷酸的核苷酸长度的小于50％。在一些实施例中，3'端不包含任何未连接的3'羟基，但可以包含任何能够充当核苷酸经由引物延伸和/或核苷酸聚合进行的连接的位点的部分。在一些实施例中，例如当参考靶特异性引物时，术语“3'端”可以包含在3'端处的末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少个核苷酸。在一些实施例中，当参考靶特异性引物时，术语“3'端”可以包含位于核苷酸位置10的核苷酸或更少的来自3'端的核苷酸。如本文中所使用，“5'端”和其派生词通常指核酸分子(例如目标序列或经扩增的目标序列)的末端，其包含自由5'磷酸基或其等效物。在一些实施例中，5'端包含未连接到相邻单核苷酸戊糖环的3'羟基的5'磷酸基。通常，5'端包含经定位与5'磷酸相邻的一个或多个连接的核苷酸，通常经定位与包括5'磷酸基的核苷酸相邻的30个核苷酸，通常末端20个并且甚至更通常末端15个核苷酸。通常，一个或多个连接的核苷酸可以表示成寡核苷酸中存在的核苷酸的百分比，或可以与5'磷酸相邻的许多连接的核苷酸形式提供。举例来说，5'端可以小于寡核苷酸的核苷酸长度的50％。在另一个示例性实施例中，5'端可以包含与包含末端5'磷酸的核苷酸相邻的约15个核苷酸。在一些实施例中，5'端不包含任何未连接的5'磷酸基，但可以包含任何能够充当与3'羟基或另一个核酸分子的3'端的连接位点的部分。在一些实施例中，例如当参考靶特异性引物时，术语“5'端”可以包含5'端处的末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少个核苷酸。在一些实施例中，当参考靶特异性引物时，术语“5'端”可以包含定位在位置10处的核苷酸或更少的来自5'端的核苷酸。在一些实施例中，靶特异性引物的5'端可以仅包含不可裂解核苷酸，例如不含如本文中所公开的一个或多个可裂解基团的核苷酸，或可由所属领域的一般技术人员容易地测定的可裂解核苷酸。聚核苷酸的“第一末端”和“第二末端”是指聚核苷酸的5'端或3'端。聚核苷酸的第一末端或第二末端可以是聚核苷酸的5'端或3'端；术语“第一”和“第二”不意图表示所述末端具体是5'端或3'端。

如本文中所使用，“标签”、“条形码”、“独特标签”或“标签序列”和其派生词通常是指衔接子内的独特短(6-14个核苷酸)核酸序列或可以充当用于区分或分离样品中的多个经扩增的目标序列的‘钥匙’的引物。出于本公开的目的，将条形码或独特标签序列并入衔接子或引物的核苷酸序列。如本文中所使用，“条形码序列”表示核酸固定的序列，其足以实现鉴别相关核酸序列的样品或来源。条形码序列可以但未必是可以用于实现鉴别的原始核酸序列的小区段。在一些实施例中，条形码的长度是5-20个核酸。在一些实施例中，条形码包含类似核苷酸，如L-DNA、LNA、PNA等。如本文中所使用，“独特标签序列”表示具有至少一个随机序列和至少一个固定序列的核酸序列。独特标签序列(单独或与第二独特标签序列结合)足以实现样品中单一目标核酸分子的鉴别。独特标签序列可以但未必包括原始目标核酸序列的小区段。在一些实施例中，独特标签序列的长度是2-50个核苷酸或碱基对，或2-25个核苷酸或碱基对，或2-10个核苷酸或基座对。独特标签序列可以包括至少一个穿插有固定序列的随机序列。

如本文中所使用，“可比较的最大最小熔融温度”和其派生词通常是指在可裂解基团的消化之后，单一衔接子或靶特异性引物的每个核酸片段的熔融温度(Tm)。比较由衔接子或靶特异性引物产生的每个核酸片段的杂交温度以测定防止来自靶特异性引物或衔接子的核酸序列或其片段或部分与各别目标序列杂交所需的最大最小温度。在已知最大杂交温度之后，有可能操作衔接子或靶特异性引物，例如通过使一个或多个可裂解基团的位置沿引物的长度移动，以相对于每个核酸片段获得可比较的最大最小熔融温度，从而最佳化文库制备的消化和修复步骤。

如本文中所使用，“仅添加”和其派生词通常是指其中向第一或单一反应混合物中添加试剂和组分的一系列步骤。通常，所述系列步骤不包括将反应混合物从第一容器移动到第二容器以完成所述系列步骤。通常，仅添加方法不包括在含有反应混合物的容器外部操作反应混合物。通常，仅添加方法适合自动和高通量。

如本文中所使用，“聚合条件”和其派生词通常是指适用于核苷酸聚合的条件。在典型实施例中，这类核苷酸聚合是由聚合酶催化。在一些实施例中，聚合条件包含用于引物延伸(任选地以模板依赖性方式)，引起产生合成核酸序列的条件。在一些实施例中，聚合条件包含聚合酶链反应(PCR)。通常，聚合条件包含使用反应混合物，其足以合成核酸并且包含聚合酶和核苷酸。聚合条件可以包含用于使靶特异性引物粘接到目标序列和引物在存在聚合酶之情况下以模板依赖性方式延伸的条件。在一些实施例中，聚合条件可以使用热循环实施。此外，聚合条件可以包含多个循环，其中重复粘接、延伸和分离两个核酸链的步骤。通常，聚合条件包含阳离子如MgCl₂。通常，一个或多个核苷酸聚合以形成核酸链包含核苷酸经由磷酸二酯键彼此连接，然而，在具体核苷酸类似物的情形下，有可能存在其它连接。

如本文中所使用，术语“核酸”是指天然核酸、人工核酸、其类似物或其组合，包含聚核苷酸和寡核苷酸。本文所用的术语“多核苷酸”和“寡核苷酸”可互换使用并且意指核苷酸的单链和双链聚合物，包含但不限于通过核苷酸间磷酸二酯键接例如3'-5'和2'-5'、反向连接例如3'-3'和5'-5'、支链结构或类似物核酸连接的2'-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA)。多核苷酸具有相关的抗衡离子，例如H⁺、NH₄ ⁺、三烷基铵、Mg²⁺、Na⁺等。寡核苷酸可以完全由脱氧核糖核苷酸构成，完全由核糖核苷酸构成，或由其嵌合混合物构成。寡核苷酸可以包含核碱基和糖类似物。聚核苷酸的尺寸通常在几个，例如5-40个单体单元(当其在所属领域中更普遍被称为寡核苷酸时)到数千个单体核苷酸单元(当其在所属领域中更普遍被称为聚核苷酸时)范围内；然而，出于本公开的目的，寡核苷酸和聚核苷酸都可以具有任何合适的长度。除非另外表示，否则每当表示寡核苷酸序列时，应理解，核苷酸从左到右呈5'到3'顺序，并且“A”表示脱氧腺苷，“C”表示脱氧胞苷，“G”表示脱氧鸟苷，“T”表示胸苷，并且“U”表示脱氧尿苷。如本文中所论述和所属领域中已知，因为单核苷酸通常经由一个核苷酸的5'磷酸或等效基团连接到其相邻核苷酸的3'羟基或等效基团(任选地经由磷酸二酯或其它合适的连接)而反应以形成寡核苷酸，因此寡核苷酸和聚核苷酸被称为具有“5'端”和“3'端”。

如本文中所使用，术语“聚合酶链反应”(“PCR”)是指以引用的方式并入的K.B.Mullis的美国专利案第4,683,195号和第4,683,202号的方法，所述专利描述一种用于在不克隆或纯化的情况下增加基因组DNA混合物中的相关聚核苷酸的片段的浓度的方法。这种用于扩增相关聚核苷酸的方法由以下组成：将大量过量的两种寡核苷酸引物引入含有所需相关聚核苷酸的DNA混合物，接着在存在DNA聚合酶的情况下进行精确的热循环序列。两种引物与相关双链多核苷酸的其相应链互补。为了实现扩增，使混合物变性，并且接着使引物粘接到相关多核苷酸分子内的其互补序列。在粘接之后，用聚合酶使引物延伸以形成一对新的互补链。变性、引物粘接和聚合酶延伸的步骤可重复多次(即，变性、粘接和延伸构成一个“循环”；可存在许多“循环”)以获得高浓度的经扩增的所需目标多核苷酸的片段。所需目标聚核苷酸的经扩增的片段(扩增子)的长度通过引物相对于彼此的相对位置确定，并且因此此长度为可控参数。借助于重复所述过程，所述方法被称为“聚合酶链反应”(在下文中称为“PCR”)。因为目标聚核苷酸的所需经扩增的片段变成混合物中的主要核酸序列(就浓度来说)，所以其被称为“PCR扩增的”。如本文中所定义，包含多个目标核酸分子的样品内的目标核酸分子是经由PCR扩增。在上文所论述的方法的一个改进中，目标核酸分子可以使用多个不同引物对，在一些情况下，每个相关目标核酸分子一个或多个引物对进行PCR扩增，由此形成多重PCR反应。使用多重PCR，有可能同时从样品扩增多种相关核酸分子以形成经扩增的目标序列。还可能通过若干种不同方法(例如，用生物分析仪或qPCR定量，用经标记的探针杂交；并入生物素化的引物，接着进行抗生物素蛋白-酶结合物检测；将经³²P标记的脱氧核苷酸三磷酸酯(如dCTP或dATP)并入经扩增的目标序列)检测经扩增的目标序列。任何寡核苷酸序列可以用合适的引物集合扩增，从而实现目标核酸分子从基因组DNA、cDNA、***固定的石蜡包埋型DNA、细针穿刺活检(fine-needle biopsies)和多种其它来源的扩增。具体来说，由如本文中所公开的多重PCR方法产生的经扩增的目标序列本身是用于后续PCR扩增或多种下游分析法或操作的有效衬底。

如本文中所定义，“多重扩增”是指使用至少一种靶特异性引物进行的样品内的两个或更多个靶序列的选择性和非随机扩增。在一些实施例中，进行多重扩增，使得一些或全部目标序列在单一反应容器内扩增。既定多重扩增的“重数”或“重”通常是指在所述单一多重扩增期间扩增的不同目标特异性序列的数目。在一些实施例中，重数可以是约12重、24重、48重、96重、192重、384重、768重、1536重、3072重、6144重或更多重。

组合物

开发了一种单流多重下一代测序工作流程，用于确定样品中的可执行肿瘤学肿瘤生物标志物，以便确定样品中的肿瘤学状态。本发明的肿瘤学精确测定组合物和方法为生物标志物筛选提供了特异性和稳健的解决方案，以了解与肿瘤免疫应答有关的机制。因此，提供了用于多重文库制备和与下一代测序技术和工作流程解决方案(例如，Ion Torrent^TMNGS工作流程)(手动或自动化)结合使用的组合物，以评估各种样品类型中低水平生物标志物靶标，以评价肿瘤学状态。

因此，提供了用于对样品中的可执行肿瘤学生物标志物进行单流多重测定的组合物。在一些实施例中，组合物由多组引物对试剂组成，所述多组引物对试剂针对多个靶序列以检测所述样品中的低水平靶标，其中靶基因选自由以下功能组成的肿瘤学应答基因：DNA热点突变基因、拷贝数变异(CNV)基因、基因间融合基因和基因内融合基因。在一些实施例中，靶基因选自由表1的一种或多种功能组成的肿瘤学基因。在一些实施例中，靶基因选自样品中的一个或多个可执行靶基因，其确定所述样品中指示潜在的诊断、预后、候选治疗方案和/或不良事件可能性的肿瘤学活性的变化。总之，包括本发明的所提供的多重组的基因的各种功能提供了推荐癌症疗法的可执行方法的综合图景。

在某些实施例中，靶肿瘤学序列针对具有与癌症相关的突变的序列。在一些实施例中，靶序列或经扩增的靶序列针对具有与一种或多种实体瘤癌相关的突变的序列，所述实体瘤癌选自由以下组成的组：头颈癌(例如，HNSCC、鼻咽、唾液腺)、脑癌(例如，胶质母细胞瘤、神经胶质瘤、胶质肉瘤、多形性胶质母细胞瘤、神经母细胞瘤)、乳腺癌(例如，TNBC、曲妥珠单抗耐药的HER2+乳腺癌、ER+/HER-乳腺癌)、妇科(例如，子宫、卵巢癌、***、子宫内膜癌、输卵管癌)、结肠直肠癌、胆囊癌、食道癌、胃肠癌、胃癌、膀胱癌、***癌、睾丸癌、尿路上皮癌，肝癌(例如，肝细胞癌、HCC)、肺癌(例如，非小细胞肺、小细胞肺)、肾(肾细胞)癌、胰腺癌(例如，腺癌、导管)、甲状腺癌、胆管癌、垂体瘤，维尔姆斯肿瘤(wilms tumor)、卡波西肉瘤(kaposi sarcoma)、毛细胞癌、骨肉瘤、胸腺癌、皮肤癌、黑色素瘤、心脏癌、口腔癌和喉癌、神经母细胞瘤、间皮瘤和其它实体瘤(胸腺、骨、软组织、口腔SCC、骨髓纤维化、滑膜肉瘤)。在一个实施例中，突变可包含取代、***、反转、点突变、缺失、错配和易位。在一些实施例中，靶序列或经扩增的靶序列针对具有与一种或多种血液/血液癌相关的突变的序列，所述血液/血液癌选自多发性骨髓瘤，弥漫性大B细胞淋巴瘤(DLBCL)，淋巴瘤，霍奇金淋巴瘤，非霍奇金淋巴瘤，滤泡性淋巴瘤，白血病，急性髓性白血病(AML)，慢性淋巴细胞白血病(CLL)，骨髓增生异常综合征。在一个实施例中，与癌症相关的突变生物标志物定位于表1中提供的基因中的至少一个基因中。

在一些实施例中，一种或多种突变肿瘤学序列定位于选自表1的基因中的至少一个基因。在一些实施例中，一个或多个突变序列指示癌症活性。

在一些实施例中，一个或多个突变序列指示患者对治疗剂有应答的可能性。在一些实施例中，一个或多个突变肿瘤学生物标志物序列指示患者对治疗剂没有应答的可能性。在某些实施例中，相关的治疗剂可以是肿瘤学疗法，包含但不限于激酶抑制剂、细胞信号传导抑制剂、检查点阻断剂、T细胞疗法和治疗性疫苗。

在一些实施例中，靶序列或突变靶序列针对与癌症相关的突变。在一些实施例中，靶序列或突变靶序列针对与一种或多种实体瘤癌相关的突变，所述实体瘤癌选自由以下组成的组：头颈癌(例如，HNSCC、鼻咽、唾液腺)、脑癌(例如，胶质母细胞瘤、神经胶质瘤、胶质肉瘤、多形性胶质母细胞瘤、神经母细胞瘤)、乳腺癌(例如，TNBC、曲妥珠单抗耐药的HER2+乳腺癌、ER+/HER-乳腺癌)、妇科(例如，子宫、卵巢癌、***、子宫内膜癌、输卵管癌)、结肠直肠癌、胆囊癌、食道癌、胃肠癌、胃癌、膀胱癌、***癌、睾丸癌、尿路上皮癌，肝癌(例如，肝细胞癌、HCC)、肺癌(例如，非小细胞肺、小细胞肺)、肾(肾细胞)癌、胰腺癌(例如，腺癌、导管)、甲状腺癌、胆管癌、垂体瘤，维尔姆斯肿瘤、卡波西肉瘤、毛细胞癌、骨肉瘤、胸腺癌、皮肤癌、黑色素瘤、心脏癌、口腔癌和喉癌、神经母细胞瘤、间皮瘤和其它实体瘤(胸腺、骨、软组织、口腔SCC、骨髓纤维化、滑膜肉瘤)。在一个实施例中，突变可包含取代、***、反转、点突变、缺失、错配和易位。在一个实施例中，突变可包含拷贝数的变化。在一个实施例中，突变可包含生殖系或体细胞突变。在一些实施例中，靶序列或经扩增的靶序列针对具有与一种或多种血液/血液癌相关的突变的序列，所述血液/血液癌选自多发性骨髓瘤，弥漫性大B细胞淋巴瘤(DLBCL)，淋巴瘤，霍奇金淋巴瘤，非霍奇金淋巴瘤，滤泡性淋巴瘤，白血病，急性髓性白血病(AML)，慢性淋巴细胞白血病(CLL)，骨髓增生异常综合征。

在一个实施例中，与癌症相关的突变位于表1中提供的至少一种基因中。在一些实施例中，突变靶序列针对表1中提供的基因中的任何一种或多种基因。在一些实施例中，突变靶序列包括表1中提供的基因的任何一种或多种扩增子序列。在一些实施例中，突变靶序列由表1中提供的基因的任何一种或多种扩增子序列组成。在一些实施例中，突变靶序列包含表1中提供的基因中的每个基因的扩增子序列。

在一些实施例中，组合物包括表A中提供的肿瘤学靶特异性引物对中的任何一种或多种。在一些实施例中，组合物包括表A中提供的所有肿瘤学靶特异性引物对。在一些实施例中，表A中提供的肿瘤学靶特异性引物对中的任何一种或多种可以用于扩增样品中存在的靶序列，如本文所描述的方法所公开的。

在一些实施例中，来自表A的肿瘤学靶特异性引物包含2、3、4、5、6、7、8、9、10、20、40、60、80、100、150、200、250、300、350、400、450、500、550、600或更多个靶特异性引物对。在一些实施例中，经扩增的靶序列可以包含使用表A中提供的靶特异性引物产生的经扩增的靶序列中的任何一种或多种。在一些实施例中，与癌症相关的靶特异性引物中的至少一种与使用选自SEQ ID NO:1-1563的靶特异性引物产生的至少一种核酸序列具有至少90％的同一性。在一些实施例中，与肿瘤学相关的靶特异性引物中的至少一种在其整个长度上与样品中的至少一种靶序列互补。在一些实施例中，与免疫反应相关的靶特异性引物中的至少一个包含3'端处的非可裂解核苷酸。在一些实施例中，3'端处的非可裂解核苷酸包含末端3'核苷酸。在一个实施例中，经扩增的靶序列针对一个或多个具有与癌症相关的突变的单个外显子。在一个实施例中，经扩增的靶序列针对具有与癌症相关的突变的个别外显子。

方法

本发明提供的方法包括实现适用于下游分析的高度多重化的文库的快速制备的有效程序。所述方法任选地允许并入一种或多种独特的标签序列。某些方法包括实现极快速的文库产生的流线型、仅添加程序。

本文提供了用于确定样品中的肿瘤学活性的方法。在一些实施例中，所述方法包括对来自生物样品的多个靶肿瘤学序列进行多重扩增，其中扩增包括使样品的至少一部分与针对多个靶序列的多组引物对试剂和聚合酶在扩增条件下接触，从而产生经扩增的靶表达序列。所述方法进一步包括检测样品中一个或多个靶序列的突变的存在，其中与对照相比，一个或多个肿瘤学标志物的突变确定了样品中肿瘤学活性的变化。在一些实施例中，所述方法的肿瘤学序列选自由以下功能组成的肿瘤学应答基因：DNA热点突变基因、拷贝数变异(CNV)基因、基因间融合基因和基因内融合基因。在一些实施例中，靶基因选自由表1的一种或多种功能组成的肿瘤学基因。在一些实施例中，靶基因选自样品中的一个或多个可执行靶基因，其确定所述样品中指示潜在的诊断、预后、候选治疗方案和/或不良事件可能性的肿瘤学活性的变化。总之，包括本发明的所提供的多重组的基因的各种功能提供了推荐癌症疗法的可执行方法的综合图景。

在某些实施例中，所述方法的靶肿瘤学序列针对具有与癌症相关的突变的序列。在一些实施例中，靶序列或经扩增的靶序列针对具有与一种或多种实体瘤癌相关的突变的序列，所述实体瘤癌选自由以下组成的组：头颈癌(例如，HNSCC、鼻咽、唾液腺)、脑癌(例如，胶质母细胞瘤、神经胶质瘤、胶质肉瘤、多形性胶质母细胞瘤、神经母细胞瘤)、乳腺癌(例如，TNBC、曲妥珠单抗耐药的HER2+乳腺癌、ER+/HER-乳腺癌)、妇科(例如，子宫、卵巢癌、***、子宫内膜癌、输卵管癌)、结肠直肠癌、胆囊癌、食道癌、胃肠癌、胃癌、膀胱癌、***癌、睾丸癌、尿路上皮癌，肝癌(例如，肝细胞癌、HCC)、肺癌(例如，非小细胞肺、小细胞肺)、肾(肾细胞)癌、胰腺癌(例如，腺癌、导管)、甲状腺癌、胆管癌、垂体瘤，维尔姆斯肿瘤、卡波西肉瘤、毛细胞癌、骨肉瘤、胸腺癌、皮肤癌、黑色素瘤、心脏癌、口腔癌和喉癌、神经母细胞瘤、间皮瘤和其它实体瘤(胸腺、骨、软组织、口腔SCC、骨髓纤维化、滑膜肉瘤)。在一个实施例中，突变可包含取代、***、反转、点突变、缺失、错配和易位。在一些实施例中，靶序列或经扩增的靶序列针对具有与一种或多种血液/血液癌相关的突变的序列，所述血液/血液癌选自多发性骨髓瘤，弥漫性大B细胞淋巴瘤(DLBCL)，淋巴瘤，霍奇金淋巴瘤，非霍奇金淋巴瘤，滤泡性淋巴瘤，白血病，急性髓性白血病(AML)，慢性淋巴细胞白血病(CLL)，骨髓增生异常综合征。在一个实施例中，与癌症相关的突变生物标志物定位于表1中提供的基因中的至少一个基因中。

在一些实施例中，所述方法的一种或多种突变肿瘤学序列定位于选自表1的基因中的至少一个基因。在一些实施例中，一个或多个突变序列指示癌症活性。

在一些实施例中，所述方法的一个或多个突变序列指示患者对治疗剂有应答的可能性。在一些实施例中，一个或多个突变肿瘤学生物标志物序列指示患者对治疗剂没有应答的可能性。在某些实施例中，相关的治疗剂可以是肿瘤学疗法，包含但不限于激酶抑制剂、细胞信号传导抑制剂、检查点阻断剂、T细胞疗法和治疗性疫苗。

在一些实施例中，所述方法的靶序列或突变靶序列针对与癌症相关的突变。在一些实施例中，所述方法的靶序列或突变靶序列针对与一种或多种实体瘤癌相关的突变，所述实体瘤癌选自由以下组成的组：头颈癌(例如，HNSCC、鼻咽、唾液腺)、脑癌(例如，胶质母细胞瘤、神经胶质瘤、胶质肉瘤、多形性胶质母细胞瘤、神经母细胞瘤)、乳腺癌(例如，TNBC、曲妥珠单抗耐药的HER2+乳腺癌、ER+/HER-乳腺癌)、妇科(例如，子宫、卵巢癌、***、子宫内膜癌、输卵管癌)、结肠直肠癌、胆囊癌、食道癌、胃肠癌、胃癌、膀胱癌、***癌、睾丸癌、尿路上皮癌，肝癌(例如，肝细胞癌、HCC)、肺癌(例如，非小细胞肺、小细胞肺)、肾(肾细胞)癌、胰腺癌(例如，腺癌、导管)、甲状腺癌、胆管癌、垂体瘤，维尔姆斯肿瘤、卡波西肉瘤、毛细胞癌、骨肉瘤、胸腺癌、皮肤癌、黑色素瘤、心脏癌、口腔癌和喉癌、神经母细胞瘤、间皮瘤和其它实体瘤(胸腺、骨、软组织、口腔SCC、骨髓纤维化、滑膜肉瘤)。在一个实施例中，突变可包含取代、***、反转、点突变、缺失、错配和易位。在一个实施例中，突变可包含拷贝数的变化。在一个实施例中，突变可包含生殖系或体细胞突变。在一些实施例中，靶序列或经扩增的靶序列针对具有与一种或多种血液/血液癌相关的突变的序列，所述血液/血液癌选自多发性骨髓瘤，弥漫性大B细胞淋巴瘤(DLBCL)，淋巴瘤，霍奇金淋巴瘤，非霍奇金淋巴瘤，滤泡性淋巴瘤，白血病，急性髓性白血病(AML)，慢性淋巴细胞白血病(CLL)，骨髓增生异常综合征。

在一些实施例中，方法包括使用表A中提供的肿瘤学靶特异性引物对中的任何一种或多种。在一些实施例中，方法包括使用表A中提供的所有肿瘤学靶特异性引物对。在一些实施例中，使用表A中提供的肿瘤学靶特异性引物对中的任何一种或多种可以用于扩增样品中存在的靶序列，如本文所描述的方法所公开的。

在一些实施例中，方法包括使用来自表A的肿瘤学靶特异性引物包含2、3、4、5、6、7、8、9、10、20、40、60、80、100、150、200、250、300、350、400、450、500、550、600或更多个靶特异性引物对。在一些实施例中，包括检测经扩增的靶序列的方法可以包含使用表A中提供的靶特异性引物产生的经扩增的靶序列中的任何一种或多种。在一些实施例中，方法包括使用与癌症相关的靶特异性引物中的至少一种，与使用选自SEQ ID NO:1-1563的靶特异性引物产生的至少一种核酸序列具有至少90％的同一性。在一些实施例中，与肿瘤学相关的靶特异性引物中的至少一种在其整个长度上与样品中的至少一种靶序列互补。在一些实施例中，与免疫反应相关的靶特异性引物中的至少一个包含3'端处的非可裂解核苷酸。在一些实施例中，3'端处的非可裂解核苷酸包含末端3'核苷酸。在一个实施例中，经扩增的靶序列针对一个或多个具有与癌症相关的突变的单个外显子。在一个实施例中，经扩增的靶序列是针对具有与癌症相关的突变的单个外显子的方法。

在一些实施例中，方法包括检测和任选地鉴定临床上可行标志物。如本文中所定义，术语“临床上可行标志物”包含已知的或可由所属领域的一般技术人员与(但不限于)癌症治疗的预后相关联的临床上可行的突变和/或临床上可行的表达模式。在一个实施例中，癌症治疗的预后包含与癌症对药物、药物组合或治疗方案起反应或不起反应相关的突变和/或表达模式的鉴别。在一个实施例中，方法包括多个靶序列从与癌症的发作、进展或缓解有关或相关的核酸分子群体的扩增。在一些实施例中，提供的方法包括样品中超过一个靶序列的选择性扩增和与癌症相关的突变的检测和/或鉴别。在一些实施例中，经扩增的靶序列包含表1中提供的基因的两个或多个核苷酸序列。在一些实施例中，经扩增的靶序列可以包含使用表A中提供的靶特异性引物产生的任何一个或多个经扩增的靶序列。在一个实施例中，经扩增的靶序列包含10、50、100、150、200、250、300、350、400、450、500、550、600或更多个来自表1的基因的扩增子。

在本发明的一个方面中，提供用于制备目标核酸序列的文库的方法。在一些实施例中，方法包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复部分消化的目标扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分并且通用柄序列不包含可裂解部分。在其中至少一个衔接子包含任选的标签序列的一些实施例中，侧接标签序列的任一个末端的衔接子序列中包含可裂解部分。

在本发明的一个方面中，提供用于制备目标核酸序列的经标记的文库的方法。在一些实施例中，方法包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复部分消化的目标扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分，通用柄序列不包含可裂解部分，并且包含可裂解部分侧接标签序列的任一个末端。

在某些实施例中，每个通用序列的可比较的最大最小熔融温度高于衔接子中存在的每个目标核酸序列和每个标签序列的可比较的最大最小熔融温度。

在一些实施例中，每个衔接子包括如本文中进一步描述的独特标签序列，并且各自进一步包括侧接每个衔接子中的标签序列的任一个末端的可裂解基团。在其中使用独特taq序列的一些实施例中，每个所产生的目标特异性扩增子序列包含至少1个不同序列和高达10⁷个不同序列。在某些实施例中，多个衔接子的每个目标特异性对包括高达16,777,216个包含不同标签序列的不同衔接子组合。

在一些实施例中，方法包括使多个有间隙的聚核苷酸产物同时与消化和修复试剂接触。在一些实施例中，方法包括使多个有间隙的聚核苷酸产物依序与消化试剂和修复试剂接触。

适用于本文中所提供的方法中的消化试剂包含任何能够使衔接子中的可裂解位点裂解的试剂，并且在一些实施例中，包括(但不限于)以下中的一个或组合：尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人类DNA聚合酶β。

适用于本文中所提供的方法中的修复试剂包括任何能够修复有间隙的扩增子的试剂，并且在一些实施例中，包含(但不限于)以下中的一个或组合：Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人类DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。

因此，在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人类DNA聚合酶β中的一个或组合；以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人类DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或组合。在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。

在一些实施例中，方法包括在单个步骤中进行消化和修复步骤。在其它实施例中，方法包括在不同温度下，以短暂分开的方式进行消化和修复步骤。

在一些实施例中，进行本发明的方法，其中方法的一个或多个步骤是以手动模式进行。在特定实施例中，进行本发明的方法，其中方法的每个步骤是以手动方式进行。在一些实施例中，进行本发明的方法，其中方法的一个或多个步骤是以自动模式进行。在特定实施例中，进行本发明的方法，其中方法的每个步骤是自动进行。在一些实施例中，进行本发明的方法，其中方法的一个或多个步骤是以手动和自动模式的组合方式进行。

在一些实施例中，本发明的方法包括至少一个纯化步骤。举例来说，在某些实施例中，仅在经修复的扩增子的第二扩增之后进行纯化步骤。在一些实施例中，利用两个纯化步骤，其中在消化和修复之后进行第一纯化步骤，并且在经修复的扩增子的第二扩增之后进行第二纯化步骤。

在一些实施例中，纯化步骤包括进行固相粘附反应、固相固定反应或凝胶电泳。在某些实施例中，纯化步骤包括使用固相可逆固定(SPRI)珠粒进行的分离。在特定实施例中，纯化步骤包括使用SPRI珠粒进行的分离，其中SPRI珠粒包含顺磁珠。

在一些实施例中，方法包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复经部分消化的目标扩增子，接着纯化经修复的扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库；并且接着纯化所得文库。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分并且通用柄序列不包含可裂解部分。在其中至少一个衔接子包含任选的标签序列的一些实施例中，侧接标签序列的任一个末端的衔接子序列中包含可裂解部分。

在一些实施例中，方法包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复经部分消化的目标扩增子，并且纯化经修复的扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库；并且接着纯化所得文库。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分，通用柄序列不包含可裂解部分，并且可裂解部分包含在侧接标签序列的任一个末端。

在一些实施例中，方法包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复经部分消化的目标扩增子，接着纯化经修复的扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库；并且接着纯化所得文库。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分并且通用柄序列不包含可裂解部分。在其中至少一个衔接子包含任选的标签序列的一些实施例中，侧接标签序列的任一个末端的衔接子序列中包含可裂解部分。在一些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人类DNA聚合酶β中的一个或组合；以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人类DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或组合。在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。

在一些实施例中，方法包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复经部分消化的目标扩增子，并且纯化经修复的扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库；并且接着纯化所得文库。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分，通用柄序列不包含可裂解部分，并且可裂解部分侧接标签序列的任一个末端。在一些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人类DNA聚合酶β中的一个或组合；以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人类DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或组合。在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。

在某些实施例中，在单一、仅添加工作流程反应中进行本发明的方法，实现高度多重化的目标文库的快速产生。举例来说，在一个实施例中，用于制备目标核酸序列的文库的方法包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复经部分消化的目标扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库，以及纯化所得文库。在某些实施例中，纯化包括在第二扩增之后产生文库后进行的单个或重复的分离步骤；并且其中在单一反应容器中进行方法的其它步骤而无需将步骤中产生的任何产物的一部分(等分试样)转移到另一个反应容器中。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分并且通用柄序列不包含可裂解部分。在其中至少一个衔接子包含任选的标签序列的一些实施例中，侧接标签序列的任一个末端的衔接子序列中包含可裂解部分。

在另一实施例中，提供用于制备目标核酸序列的经标记的文库的方法，其包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复经部分消化的目标扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库，以及纯化所得文库。在某些实施例中，纯化包括单个或重复分离步骤；并且其中任选地在单一反应容器中进行方法的其它步骤而无需将步骤中产生的任何产物的一部分转移到另一个反应容器中。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分，通用柄序列不包含可裂解部分，并且包含可裂解部分侧接标签序列的任一个末端。

在一个实施例中，用于制备目标核酸序列的文库的方法包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复经部分消化的目标扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库，以及纯化所得文库。

在一些实施例中，消化试剂包括以下中的任一个或任何组合：尿嘧啶DNA糖基化酶(UDG)。AP核酸内切酶(APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶、Taq DNA聚合酶、DNA聚合酶I和/或人类DNA聚合酶β。在某些实施例中，消化试剂包括以下中的任一个或任何组合：尿嘧啶DNA糖基化酶(UDG)。AP核酸内切酶(APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶、Taq DNA聚合酶、DNA聚合酶I和/或人类DNA聚合酶β，其中消化试剂不含甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)。

在一些实施例中，消化试剂包括以5'-3'方向降解之单链DNA核酸外切酶。在一些实施例中，裂解试剂包括使无碱基位点降解的单链DNA核酸外切酶。在本文中的一些实施例中，消化试剂包括RecJf核酸外切酶。在特定实施例中，消化试剂包括APE1和RecJf，其中裂解试剂包含脱嘌呤/脱嘧啶核酸内切酶。在某些实施例中，消化试剂包括AP核酸内切酶(APE1)。

在一些实施例中，修复试剂包括至少一种DNA聚合酶；其中间隙填充试剂包括：以下中的任一个或任何组合：Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人类DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶和/或SuperFi UDNA聚合酶。在一些实施例中，修复试剂进一步包括多个核苷酸。

在一些实施例中，修复试剂包括ATP依赖性或ATP独立性连接酶；其中修复试剂包括以下中的任一个或任何组合：大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶、9°N DNA连接酶。

在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人类DNA聚合酶β中的一个或组合；以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人类DNA聚合酶β、T4 DNA聚合酶和/或T7DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或组合。在特定实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中，纯化包括在第二扩增之后产生文库后进行的单个或重复的分离步骤；并且其中在单一反应容器中进行方法的步骤而无需将步骤中产生的任何产物的一部分转移到另一个反应容器中直到第一纯化。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分并且通用柄序列不包含可裂解部分。在其中至少一个衔接子包含任选的标签序列的一些实施例中，侧接标签序列的任一个末端的衔接子序列中包含可裂解部分。

在另一实施例中，提供用于制备目标核酸序列的经标记的文库的方法，其包括使核酸样品与多个衔接子接触，所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列；消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子，由此产生有间隙的双链扩增子。所述方法进一步包括修复经部分消化的目标扩增子；接着，使用通用引物在第二扩增中扩增经修复的目标扩增子，由此产生目标核酸序列的文库，以及纯化所得文库。在某些实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人类DNA聚合酶β中的一个或组合；以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人类DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或组合。在特定实施例中，消化和修复试剂包括以下中的任一个或其组合：尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中，纯化包括在第二扩增之后产生文库后进行的单个或重复的分离步骤；并且其中在单一反应容器中进行步骤其它方法步骤而无需将步骤中产生的任何产物的一部分(等分试样)转移到另一个反应容器中。本文中的方法中使用的多个衔接子中的每一个包括通用柄序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包含至少两个并且高达十万个目标特异性衔接子对，其中每个衔接子的目标核酸序列包含至少一个可裂解部分，通用柄序列不包含可裂解部分，并且包含可裂解部分侧接标签序列的任一个末端。

在一些实施例中，基本上从所得文库去除由方法中的第一扩增步骤产生的衔接子-二聚体副产物。在某些实施例中，经扩增的目标核酸的富集体含有数量减少的衔接子-二聚体副产物。在特定实施例中，消除衔接子二聚体副产物。

在一些实施例中，在少于4小时内制备文库。在一些实施例中，在少于3小时内制备、富集和测序文库。在一些实施例中，在2到3小时内制备、富集和测序文库。在一些实施例中，在约2.5小时内制备文库。在一些实施例中，在约2.75小时内制备文库。在一些实施例中，在约3小时内制备文库。

组合物

本发明的其它方面包含组合物，其包括多个核酸衔接子，以及根据本发明的方法制备的文库组合物。所提供的组合物适合与本文中所描述的方法结合使用以及用于所属领域中已知的其它分析和应用。

因此，提供包括多个核酸衔接子的组合物，其中多个衔接子中的每一个包括5'通用柄序列、任选的一个或多个标签序列以及3'目标核酸序列，其中每个衔接子包括可裂解部分，其中衔接子的目标核酸序列包括至少一个可裂解部分，并且当存在标签序列时，包含可裂解部分侧接标签序列的任一个末端，并且其中通用柄序列不包括可裂解部分。所提供的组合物中包含至少两个并且高达十万个目标特异性衔接子对。所提供的组合物实现高度多重化的目标文库的快速产生。

在一些实施例中，所提供的组合物包含多个核酸衔接子，其中多个衔接子中的每一个包含5'通用柄序列、一个或多个标签序列以及3'目标核酸序列，其中每个衔接子包含可裂解部分；其中衔接子的目标核酸序列包括至少一个可裂解部分，包含可裂解部分侧接标签序列的任一个末端并且通用柄序列不包括可裂解部分。所提供的组合物中包含至少两个并且高达十万个目标特异性衔接子对。所提供的组合物实现高度多重化、经标记的目标文库的快速产生。

引物/衔接子组合物可以是单链或双链的。在一些实施例中，衔接子组合物包括单链衔接子。在一些实施例中，衔接子组合物包括双链衔接子。在一些实施例中，衔接子组合物包括单链和双链衔接子的混合物。

在一些实施例中，组合物包含多个能够扩增一个或多个目标核酸序列的衔接子，其包括能够扩增至少两个不同目标核酸序列的多个衔接子对，其中靶特异性引物序列与组合物中的其它靶特异性引物序列基本上不互补。在一些实施例中，组合物包括至少25、50、75、100、150、200、250、300、350、400、450、500、750、1000、1250、1500、1750、2000、2250、2500、2750、3000、3250、3500、3750、4000、4500、5000、5500、6000、7000、8000、9000、10000、11000或12000个或更多个目标特异性衔接子对。在一些实施例中，目标特异性对的长度包括约15个核苷酸到约40个核苷酸，其中至少一个核苷酸由可裂解基团置换。在一些实施例中，可裂解基团是尿苷核苷酸。在一些实施例中，目标特异性衔接子对被设计成扩增与临床或病理学病状相关联的基因组的外显子、基因、外显子组或区域，例如扩增包括一种或多种与癌症(例如肺癌、结肠癌、乳癌等)相关联的突变(例如驱动突变)的一个或多个位点，或扩增与遗传性疾病(例如囊肿性纤维化、肌营养不良等)相关联的突变。在一些实施例中，当与目标序列杂交并且如本文中所提供的扩增时，目标特异性衔接子对产生长度为约100到约600个碱基对的衔接子接合的经扩增的目标序列的文库。在一些实施例中，与文库中的其它衔接子接合的经扩增的目标序列的其余部分相比，没有一个衔接子接合的经扩增的目标序列在文库中过表达超过30％。在一些实施例中，在GC含量、经扩增的目标序列长度或各别目标序列的熔融温度(Tm)方面，衔接子接合的经扩增的目标序列文库是基本上同源的。

在一些实施例中，本发明的组合物中的衔接子对的靶特异性引物序列是目标特异性序列，其可以扩增核酸分子的特异性区域。在一些实施例中，目标特异性衔接子可以扩增基因组DNA或cDNA。在一些实施例中，目标特异性衔接子可以扩增哺乳动物核酸，如(但不限于)人类DNA或RNA、鼠类DNA或RNA、牛DNA或RNA、犬科动物DNA或RNA、马DNA或RNA或任何其它相关哺乳动物。在其它实施例中，目标特异性衔接子包含与扩增相关植物核酸相关的序列。在其它实施例中，目标特异性衔接子包含与扩增传染剂(例如细菌和/或病毒核酸)相关的序列。在一些实施例中，选择性扩增所需的核酸的量是约1ng到1微克。在一些实施例中，选择性扩增一个或多个目标序列所需的核酸的量是约1ng、约5ng或约10ng。在一些实施例中，选择性扩增目标序列所需的核酸的量是约10ng到约200ng。

如本文中所描述，多个衔接子中的每一个包括5'通用柄序列。在一些实施例中，通用柄序列包括扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在一些实施例中，每个衔接子通用柄序列的可比较的最大最小熔融温度高于同一个衔接子中存在的每个目标核酸序列和每个标签序列的可比较的最大最小熔融温度。优选地，所提供的衔接子的通用柄序列与相关的独特标签序列和/或目标核酸序列的任何部分不呈现显著互补性和/或杂交。在一些实施例中，第一通用柄序列包括扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在一些实施例中，第二通用柄序列包括扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在某些实施例中，第一和第二通用柄序列对应于正向和反向通用柄序列并且在某些实施例中，多个目标特异性衔接子对中的每一个包含相同的第一和第二通用柄序列。在根据本发明的方法的文库产生中，靶向这类正向和反向通用柄序列以及通用引物以进行经修复的扩增子的第二扩增。在某些实施例中，第一5'通用柄序列包括两个通用柄序列(例如扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列的组合)；并且第二5'通用序列包括两个通用柄序列(例如扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列的组合)，其中5'第一和第二通用柄序列与相关目标核酸序列的任何部分不呈现显著杂交。

通用扩增引物或通用引物的结构和特性是所属领域的技术人员众所周知的，并且可以实施以与所提供的方法和组合物一起使用以适合特异性分析平台。相应地调整本文中提供的衔接子的通用柄序列以适应优选的通用引物序列。举例来说，如本文中所描述，在所属领域中已描述具有任选的条形码序列的通用P1和A引物并且用于Ion Torrent测序平台(Ion Xpress^TM Adapters，Thermo Fisher Scientific)上的测序。类似地，所属领域中描述和已知的另外和其它通用衔接子/引物序列(例如可以在例如以下中发现的Illumina通用衔接子/引物序列：https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf；可以在例如以下中发现的PacBio通用衔接子/引物序列：https://s3.amazonaws.com/files.pacb.com/pdf/Guide_Pacific_Biosciences_Template_Preparation_and_Sequencing.pdf；等)可以与本文提供的方法和组合物结合使用。可以使用标准自动核酸合成仪器和所属领域中常用的试剂容易地制备适合与本发明的衔接子一起使用的核苷酸序列的合适的通用引物。包含一种单一类型的通用引物或单独类型的两种不同通用引物(或甚至混合物)(例如适用于第二扩增中的经修复的扩增子的扩增的一对通用扩增引物)用于本发明的方法中。通用引物任选地包含不同标签(条形码)序列，其中标签(条形码)序列不与衔接子杂交。在第二通用扩增中并入扩增子的条形码序列可例如用于样品源的有效鉴别。

在一些实施例中，衔接子进一步包括位于5'第一通用柄序列与3'目标特异性序列之间的独特标签序列，并且其中独特标签序列不呈现与相关独特标签序列和/或目标核酸序列的任何部分的显著互补性和/或杂交。在一些实施例中，多个引物衔接子对具有10⁴-10⁹个不同标签序列组合。因此，在某些实施例中，每个所产生的目标特异性衔接子对包括10⁴-10⁹个不同标签序列。在一些实施例中，多个引物衔接子包括每个目标特异性衔接子，其包含至少1个不同的独特标签序列并且高达10⁵个不同的独特标签序列。在一些实施例中，多个引物衔接子包括每个目标特异性衔接子，其包含至少1个不同的独特标签序列并且高达10⁵个不同的独特标签序列。在某些实施例中，每个所产生的目标特异性扩增子包括至少两个并且高达10⁹个包括不同标签序列的不同衔接子组合，其各自具有两个不同的独特标签序列。在一些实施例中，多个引物衔接子包括每个目标特异性衔接子，其包含4096个不同标签序列。在某些实施例中，每个所产生的目标特异性扩增子包括高达16,777,216个包括不同标签序列的不同衔接子组合，其各自具有两个不同的独特标签序列。

在一些实施例中，多个衔接子中的单独引物衔接子包括独特标签序列(例如包含于标签衔接子中)，其包含与固定标签序列相间的不同随机标签序列。在一些实施例中，至少一个独特标签序列包括至少一个随机序列和至少一个固定序列，或包括在两侧上由固定序列侧接的随机序列，或包括在两侧上由随机序列侧接的固定序列。在一些实施例中，独特标签序列包含固定序列，其长度是2-2000个核苷酸或碱基对。在一些实施例中，独特标签序列包含随机序列，其长度是2-2000个核苷酸或碱基对。

在一些实施例中，独特标签序列包含具有至少一个穿插有固定序列的随机序列的序列。在一些实施例中，多个独特标签中的单独标签具有结构(N)_n(X)_x(M)_m(Y)_y，其中“N”表示由A、G、C、T、U或I产生的随机标签序列，并且其中“n”是2-10，其表示“N”随机标签序列的核苷酸长度；其中“X”表示固定标签序列，并且其中“x”是2-10，其表示“X”随机标签序列的核苷酸长度；其中“M”表示由A、G、C、T、U或I产生的随机标签序列，其中随机标签序列“M”与随机标签序列“N”不同或相同，并且其中“m”是2-10，其表示“M”随机标签序列的核苷酸长度；并且其中“Y”表示固定标签序列，其中“Y”的固定标签序列与“X”的固定标签序列相同或不同，且其中“y”是2-10，其表示“Y”随机标签序列的核苷酸长度。在一些实施例中，固定标签序列“X”在多个标签中相同。在一些实施例中，固定标签序列“X”在多个标签中不同。在一些实施例中，固定标签序列“Y”在多个标签中相同。在一些实施例中，固定标签序列“Y”在多个标签中不同。在一些实施例中，多个单链衔接子内的固定标签序列“(X)_x”和“(Y)_y”是序列比对锚。

在一些实施例中，独特标签序列内的随机序列由“N”表示，且固定序列由“X”表示。因此，独特标签序列由N₁N₂N₃X₁X₂X₃或N₁N₂N₃X₁X₂X₃N₄N₅N₆X₄X₅X₆表示。任选地，独特标签序列可以具有随机序列，其中一些或全部核苷酸位置随机地选自由以下组成的组：A、G、C、T、U和I。举例来说，随机序列内的各位置处的核苷酸独立地选自A、G、C、T、U或I中的任一个，或选自这六种不同类型的核苷酸的子集。任选地，随机序列内的各位置处的核苷酸独立地选自A、G、C或T中的任一个。在一些实施例中，第一固定标签序列“X₁X₂X₃”是多个标签中的相同或不同序列。在一些实施例中，第二固定标签序列“X₄X₅X₆”是多个标签中的相同或不同序列。在一些实施例中，多个衔接子内的第一固定标签序列“X₁X₂X₃”和第二固定标签序列“X₄X₅X₆”是序列比对锚。

在一些实施例中，独特标签序列包括序列5'-NNNACTNNNTGA-3'，其中“N”表示由A、G、C或T随机产生的随机序列内的位置，计算为4⁶(或4^6)的有可能的不同随机标签的数目是约4096，并且两个独特标签的有可能的不同组合是4¹²(或4^12)的数目是约1678万。在一些实施例中，5'-NNNACTNNNTGA-3'中的带下划线的部分是序列比对锚。

在一些实施例中，独特标签序列内的固定序列是可以用于产生错误校正测序资料的序列比对锚。在一些实施例中，独特标签序列内的固定序列是可以用于产生错误校正测序读段家族的序列比对锚。

本文中提供的衔接子包括至少一个可裂解部分。在一些实施例中，可裂解部分在3'目标特异性序列内。在一些实施例中，可裂解部分位于5'第一通用柄序列与3'目标特异性序列之间的接合点处或其附近。在一些实施例中，可裂解部分位于5'第一通用柄序列与独特标签序列之间的接合点处或其附近，和位于独特标签序列与3'目标特异性序列之间的接合点处或其附近。可裂解部分可以存在于经修饰的核苷酸、核苷或核碱基中。在一些实施例中，可裂解部分可以包含不在相关目标序列中天然存在的核碱基。

在一些实施例中，多个衔接子中的至少一个可裂解部分是尿嘧啶碱基、尿苷或脱氧尿苷核苷酸。在一些实施例中，可裂解部分在3'目标特异性序列内并且位于5'通用柄序列与独特标签序列和/或3'目标特异性序列之间的接面处，其中多个衔接子中的至少一个可裂解部分可由尿嘧啶DNA糖基化酶(UDG)裂解。在一些实施例中，可裂解部***解，产生敏感无碱基位点，其中至少一个能够在无碱基位点上反应的酶产生包括可延伸的3'端的间隙。在某些实施例中，所得间隙包括5'-脱氧核糖磷酸基。在某些实施例中，所得间隙包括可延伸的3'端和5'可接合磷酸基。

在另一实施例中，肌苷可以并入基于DNA的核酸中作为可裂解基团。在一个例示性实施例中，EndoV可用于在肌苷残基附近裂解。在另一个例示性实施例中，酶hAAG可用于裂解来自产生无碱基位点的核酸的肌苷残基。

当存在可裂解部分时，衔接子中至少一个可裂解部分的位置不显著改变多个双链衔接子中的任何既定双链衔接子的熔融温度(Tm)。来自多个双链衔接子的任何两个既定双链衔接子的熔融温度(Tm)基本上相同，其中任何两个既定双链衔接子的熔融温度(Tm)彼此相差不超过10℃。然而，在多个衔接子中的每一个内，序列区域的熔融温度不同，使得例如通用柄序列的可比较的最大最小熔融温度高于任何衔接子的独特标签序列和/或目标特异性序列的可比较的最大最小熔融温度。可以调节可比较的最大最小熔融温度的这种局部差异以最佳化扩增子的消化和修复，并且最终改良本文中所提供的方法的有效性。

还提供包括由本发明的方法产生的核酸文库的组合物。因此，提供包括多个经扩增的目标核酸扩增子的组合物，其中多个扩增子中的每一个包括5'通用柄序列、任选的第一独特标签序列、中间目标核酸序列、任选的第二独特标签序列以及3'通用柄序列。所提供的组合物中包含至少两个并且高达十万个目标特异性扩增子。所提供的组合物包含高度多重化的目标文库。在一些实施例中，所提供的组合物包括多个核酸扩增子，其中多个扩增子中的每一个包括5'通用柄序列、第一独特标签序列、中间目标核酸序列、第二独特标签序列以及3'通用柄序列。所提供的组合物中包含至少两个并且高达十万个目标特异性经标记的扩增子。所提供的组合物包含高度多重化的经标记的目标文库。

在一些实施例中，文库组合物包括多个目标特异性扩增子，其包含至少两个不同目标核酸序列的多重物。在一些实施例中，组合物包括至少25、50、75、100、150、200、250、300、350、400、450、500、750、1000、1250、1500、1750、2000、2250、2500、2750、3000、3250、3500、3750、4000、4500、5000、5500、6000、7000、8000、9000、10000、11000或12000个或更多个目标特异性扩增子。在一些实施例中，目标特异性扩增子包括与临床或病理学病状相关联的基因组的一个或多个外显子、基因、外显子组或区域，例如包含一个或多个位点的扩增子，所述位点包含与癌症(例如肺癌、结肠癌、乳癌等)相关联的一个或多个突变(例如驱动突变)，或包含与遗传性疾病(例如囊肿性纤维化、肌营养不良等)相关联的突变的扩增子。在一些实施例中，目标特异性扩增子包含衔接子接合的扩增子目标序列的文库，其长度是约100到约750个碱基对。

如本文中所描述，多个扩增子中的每一个包括5'通用柄序列。在一些实施例中，通用柄序列包括扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。优选地，所提供的衔接子的通用柄序列与相关的独特标签序列和/或目标核酸序列的任何部分不呈现显著互补性和/或杂交。在一些实施例中，第一通用柄序列包括扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在一些实施例中，第二通用柄序列包括扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在某些实施例中，第一和第二通用柄序列对应于正向和反向通用柄序列并且在某些实施例中，多个目标特异性扩增子中的每一个包含相同的第一和第二通用柄序列。在根据本发明的方法的产生所得扩增产物时，靶向这类正向和反向通用柄序列以及通用引物以进行初级文库组合物的第二扩增。在某些实施例中，第一5'通用柄序列包括两个通用柄序列(例如扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列的组合)；并且第二5'通用序列包括两个通用柄序列(例如扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列的组合)，其中5'第一和第二通用柄序列与相关目标核酸序列的任何部分不呈现显著杂交。

通用扩增引物或通用引物的结构和特性是所属领域的技术人员众所周知的，并且可以实施以与所提供的方法和组合物一起使用以适合特异性分析平台。相应地调整本文中提供的衔接子和扩增子的通用柄序列以适应优选的通用引物序列。举例来说，如本文中所描述，在所属领域中已描述具有任选的条形码序列的通用P1和A引物并且用于Ion Torrent测序平台(Ion Xpress^TM Adapters，Thermo Fisher Scientific)上的测序。类似地，所属领域中描述和已知的另外和其它通用衔接子/引物序列(例如可以在例如以下中发现的Illumina通用衔接子/引物序列：https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf；可以在例如以下中发现的PacBio通用衔接子/引物序列：https://s3.amazonaws.com/files.pacb.com/pdf/Guide_Pacific_Biosciences_Template_Preparation_and_Sequencing.pdf；等)可以与本文提供的方法和组合物结合使用。可以使用标准自动核酸合成仪器和所属领域中常用的试剂容易地制备适合与本发明的文库一起使用的核苷酸序列的合适的通用引物。一种单一类型或单独类型的两个不同通用引物(或甚至混合物)(例如一对适用于扩增初级文库的通用扩增引物)可用于产生本发明的文库。通用引物任选地包含标签(条形码)序列，其中标签(条形码)序列不与衔接子序列或目标核酸序列杂交。在第二通用扩增中并入扩增子的条形码序列可以例如用于有效鉴别样品源，由此产生带条形码的文库。因此，所提供的组合物包含高度多重化的带条形码的目标文库。所提供的组合物还包含高度多重化的带条形码的经标记的目标文库。

在一些实施例中，扩增子文库包括位于5'第一通用柄序列与3'目标特异性序列之间的独特标签序列，并且其中独特标签序列不呈现与独特标签序列和/或目标核酸序列的任何部分的显著互补性和/或杂交。在一些实施例中，多个扩增子具有10⁴-10⁹个不同标签序列组合。因此，在某些实施例中，文库中的多个扩增子中的每一个包括10⁴-10⁹个不同标签序列。在一些实施例中，文库中的多个扩增子中的每一个包括至少1个不同独特标签序列和高达10⁵个不同独特标签序列。在某些实施例中，文库中的每个目标特异性扩增子包括至少两个并且高达10⁹个包括不同标签序列的不同组合，其各自具有两个不同的独特标签序列。在一些实施例中，文库中的多个扩增子中的每一个包括标签序列，其包含4096个不同标签序列。在某些实施例中，文库中的每个目标特异性扩增子包括高达16,777,216个包括不同标签序列的不同组合，其各自具有两个不同独特标签序列。

在一些实施例中，文库中的多个扩增子中的单独扩增子包括独特标签序列(例如包含于标签衔接子序列中)，其包含与固定标签序列相间的不同随机标签序列。在一些实施例中，至少一个独特标签序列包括至少一个随机序列和至少一个固定序列，或包括在两侧上由固定序列侧接的随机序列，或包括在两侧上由随机序列侧接的固定序列。在一些实施例中，独特标签序列包含固定序列，其长度是2-2000个核苷酸或碱基对。在一些实施例中，独特标签序列包含随机序列，其长度是2-2000个核苷酸或碱基对。

在一些实施例中，独特标签序列包含具有至少一个穿插有固定序列的随机序列的序列。在一些实施例中，多个独特标签中的单独标签具有结构(N)_n(X)_x(M)_m(Y)_y，其中“N”表示由A、G、C、T、U或I产生的随机标签序列，并且其中“n”是2-10，其表示“N”随机标签序列的核苷酸长度；其中“X”表示固定标签序列，并且其中“x”是2-10，其表示“X”随机标签序列的核苷酸长度；其中“M”表示由A、G、C、T、U或I产生的随机标签序列，其中随机标签序列“M”与随机标签序列“N”不同或相同，并且其中“m”是2-10，其表示“M”随机标签序列的核苷酸长度；并且其中“Y”表示固定标签序列，其中“Y”的固定标签序列与“X”的固定标签序列相同或不同，且其中“y”是2-10，其表示“Y”随机标签序列的核苷酸长度。在一些实施例中，固定标签序列“X”在多个标签中相同。在一些实施例中，固定标签序列“X”在多个标签中不同。在一些实施例中，固定标签序列“Y”在多个标签中相同。在一些实施例中，固定标签序列“Y”在多个标签中不同。在一些实施例中，多个扩增子内的固定标签序列“(X)_x”和“(Y)_y”是序列比对锚。

在一些实施例中，独特标签序列内的随机序列由“N”表示，且固定序列由“X”表示。因此，独特标签序列由N₁N₂N₃X₁X₂X₃或N₁N₂N₃X₁X₂X₃N₄N₅N₆X₄X₅X₆表示。任选地，独特标签序列可以具有随机序列，其中一些或全部核苷酸位置随机地选自由以下组成的组：A、G、C、T、U和I。举例来说，随机序列内的各位置处的核苷酸独立地选自A、G、C、T、U或I中的任一个，或选自这六种不同类型的核苷酸的子集。任选地，随机序列内的各位置处的核苷酸独立地选自A、G、C或T中的任一个。在一些实施例中，第一固定标签序列“X₁X₂X₃”是多个标签中的相同或不同序列。在一些实施例中，第二固定标签序列“X₄X₅X₆”是多个标签中的相同或不同序列。在一些实施例中，多个扩增子内的第一固定标签序列“X₁X₂X₃”和第二固定标签序列“X₄X₅X₆”是序列比对锚。

试剂盒、***

本文中还提供用于使用本发明的第一或第二方面的方法制备目标核酸的文库的试剂盒。试剂盒的实施例包含能够产生第一扩增产物的如本文中所定义的至少一对目标特异性衔接子的供应源，以及任选的至少一对能够粘接到衔接子的通用柄并且引发扩增产物的合成的通用扩增引物的供应源，所述扩增产物将包括接合到通用序列的相关目标序列。衔接子和/或引物可以提供于准备好使用的试剂盒中，或更优选地以在使用之前需要稀释的浓缩物形式，或甚至呈需要在使用之前复原的冻干或干燥形式。在某些实施例中，试剂盒进一步包含用于稀释或复原组分的合适的稀释剂的供应源。任选地，试剂盒进一步包括用于在产生如本文所提供的文库时进行扩增、消化、修复和/或纯化的试剂、缓冲液、酶、dNTP等的供应源。这类试剂的非限制性实例描述于随附范例的材料和方法部分中。试剂盒中任选地供应的其它组分包含适用于纯化使用所提供的方法制备的文库的组分。在一些实施例中，提供用于产生目标特异性文库的试剂盒，其包括多个具有5'通用柄序列、3'目标特异性序列和可裂解基团的目标特异性衔接子；DNA聚合酶；衔接子；dATP；dCTP；dGTP；dTTP以及消化试剂。在一些实施例中，试剂盒进一步包括一种或多种抗体、修复试剂、任选地包含核酸条形码的通用引物、纯化溶液或柱。

包含在试剂盒中的衔接子的具体特征在本文中关于本发明的其它方面的地方描述。通用扩增引物的结构和特性是所属领域的技术人员众所周知的，并且可以实施以与所提供的方法和组合物一起使用以适应特异性分析平台(例如本文中所描述，已在所属领域中描述通用P1和A引物并且用于Ion Torrent测序平台上的测序)。类似地，所属领域中描述和已知的额外和其它通用衔接子/引物序列(例如Illumina通用衔接子/引物序列、PacBio通用衔接子/引物序列等)可以与本文中提供的方法和组合物结合使用。可以使用标准自动核酸合成仪器和所属领域中常用的试剂容易地制备适合与试剂盒中所包含的衔接子一起使用的核苷酸序列的合适的引物。试剂盒可以包含一种单一类型的通用引物或单独类型的两个不同通用引物(或甚至混合物)(例如一对适用于在第一扩增中扩增经衔接子修饰的模板的扩增引物)的供应源。试剂盒可以包括至少一对用于根据本发明的方法的相关样品的第一扩增的衔接子，加至少两个不同的扩增引物，其任选地携带不同标签(条形码)序列，其中标签(条形码)序列不与衔接子杂交。试剂盒可以用于扩增至少两个不同样品，其中分别根据本发明的方法扩增每个样品并且第二扩增包括使用具有条形码的单一通用引物，且接着在文库制备之后合并所制备的样品文库。在一些实施例中，试剂盒包含用于本文中所描述的第二扩增步骤的不同的通用引物对。在此情形中，‘通用’引物对可以具有基本上一致的核苷酸序列，但在某一其它特征或修饰方面不同。

还提供***，例如用于实践本文所提供的方法和/或包括本文中提供的组合物的***。在一些实施例中，***有助于以自动模式进行的方法。在某些实施例中，***有助于高通量模式。在某些实施例中，***包含例如流体操作元件、流体容纳元件、用于实现和保持所需反应温度的热源和/或散热器，和/或能够视需要将***的组件从一个位置移动到另一个位置的机器人元件(例如多孔盘操作元件)。

样品

如本文中所定义，“样品”和其衍生物以其最广泛含义使用并且包含疑似包含目标核酸的任何样本、培养物和/或类似物。在一些实施例中，样品包括DNA、RNA、TNA、嵌合核酸、杂合核酸、核酸的多重形式或上述两种或更多种的任何组合。在一些实施例中，适合与本发明的方法一起使用的样品包含任何含有一个或多个相关目标核酸的生物学、临床、手术、农业、基于大气或水生的样本。在一些实施例中，样品包含从动物(如人类或哺乳动物来源)获得的核酸分子。在另一实施例中，样品包含从非哺乳动物来源(如植物、细菌、病毒或真菌)获得的核酸分子。在一些实施例中，核酸分子的来源可以是存档或灭绝的样品或物种。在一些实施例中，样品包含例如从如基因组DNA、RNA TNA等来源制备的分离的核酸样品或制备的样品如新鲜冷冻或***固定的石蜡包埋(FFPE)核酸样本。还设想来自单一个体的样品；来自遗传相关成员的核酸样品的集合；来自非遗传相关成员的多个核酸样品；来自单一个体的多个核酸样品(匹配)，如肿瘤样品和正常组织样品；或来自单一来源的遗传物质，其含有两种不同形式的遗传物质，如从母体个体获得的母体和胎儿DNA，或在含有植物或动物DNA的样品中存在污染性细菌DNA。在一些实施例中，核酸材料的来源包含从新生儿获得的核酸(例如用于初生儿筛检的血液样品)。在一些实施例中，所提供的方法包括来自单一核酸样品的多个目标特异性序列的扩增。在一些实施例中，所提供的方法包括来自两个或更多个核酸样品或物种的两个或更多个目标序列的目标特异性扩增。在某些实施例中，所提供的方法包括来自单一样品的高度多重化的目标核酸序列的扩增。在特定实施例中，所提供的方法包括来自超过一个样品(各自来自相同来源生物体)的高度多重化的目标核酸序列的扩增。

在一些实施例中，样品包括目标核酸和非目标核酸的混合物。在某些实施例中，样品包含多个初始聚核苷酸，其包含一个或多个目标核酸的混合物并且可以包括一个或多个非目标核酸。在某些实施例中，包括多个聚核苷酸的样品包括原始样品的一部分或等分试样；在一些实施例中，样品包括多个聚核苷酸，其是整个原始样品。在一些实施例中，样品包括在不同时间点从相同来源或相同个体分离的多个初始聚核苷酸。

在一些实施例中，核酸样品包含来自生物体液的不含细胞的核酸、来自组织的核酸、来自活检组织的核酸、来自针刺活检的核酸、来自单一细胞的核酸或来自两个或更多个细胞的核酸。在某些实施例中，单一反应混合物含有1-100ng多个初始聚核苷酸。在一些实施例中，多个初始多核苷酸包括***固定石蜡包埋(FFPE)样品；基因组DNA；RNA；TNA；无细胞DNA或RNA或TNA；循环肿瘤DNA或RNA或TNA；新鲜冷冻样品或上述两种或更多种的混合物；并且在一些实施例中，多个初始多核苷酸包括核酸参考标准。在一些实施例中，样品包含从活检体、肿瘤、刮片、拭子、血液、粘液、尿液、血浆、***、毛发、激光捕获显微解剖、手术切除和其它临床或实验室获得的样品获得的核酸分子。在一些实施例中，样品是流行病学、农业、法医或病原性样品。在某些实施例中，样品包含参考物。在一些实施例中，样品是正常组织或有据可查的肿瘤样品。在某些实施例中，参考物是标准核酸序列(例如Hg19)。

靶核酸序列分析

本发明的所提供的方法和组合物尤其适用于扩增、任选地标记和制备目标序列以用于后续分析。因此，在一些实施例中，本文中所提供的方法包含分析所得文库制备物。举例来说，方法包括分析目标核酸的聚核苷酸序列并且在合适时，分析添加到目标核酸中的任何标签序列。在其中扩增多个目标核酸区域的一些实施例中，所提供的方法包含测定多个目标核酸的聚核苷酸序列。所提供的方法进一步任选地包含使用第二标签序列(例如条形码序列)鉴别目标序列的来源(或提供其它关于样品源的信息)。在某些实施例中，提供所制备的文库组合物的用途，其用于分析核酸文库的序列。

在特定实施例中，提供所制备的经标记的文库组合物的用途，其用于进一步分析目标核酸文库的序列。在一些实施例中，序列测定包括测定样品中至少一个目标序列的丰度。在一些实施例中，测定核酸文库的序列包含测定样品中的低频率出现的等位基因。在某些实施例中，测定核酸文库的序列包含测定多个聚核苷酸中是否存在突变型目标核酸。在一些实施例中，测定是否存在突变型目标核酸包括侦测多个聚核苷酸中至少一个突变型目标核酸的丰度水平。举例来说，这类测定包括侦测至少一个突变型目标核酸占样品中原始多个聚核苷酸的0.05％到1％、侦测至少一个突变型目标核酸占样品中聚核苷酸的约1％到约5％和/或侦测样品中至少85％-100％的目标核酸。在一些实施例中，测定是否存在突变型目标核酸包括侦测和鉴别样品中的拷贝数目变化和/或遗传融合序列。

在一些实施例中，借助于本公开的教示内容产生的经扩增的目标序列的核酸测序包含重新测序或靶向再测序。在一些实施例中，核酸测序进一步包含针对参考核酸序列比较经扩增的目标序列的核酸测序结果。在一些实施例中，目标文库序列的核酸测序进一步包含测定核酸序列内存在或不存在突变。在一些实施例中，核酸测序包含鉴别与疾病(例如癌症和/或遗传性疾病)相关联的遗传标记。

在一些实施例中，所制备的所公开的方法的目标序列的文库用于具有或不具有进一步纯化或操作的各种下游分析或分析法中。在一些实施例中，分析包括通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。在某些实施例中，通过高通量下一代测序进行分析。在特定实施例中，以双向方式进行测序，由此产生任何既定扩增子的正向和反向链中的序列读段。

在一些实施例中，接着进一步操作根据本文中所提供的方法制备的文库以用于其它分析。举例来说，\所制备的文库序列用于所属领域中已知的下游富集技术中，如桥式扩增或emPCR以产生模板文库，其接着用于下一代测序中。在一些实施例中，目标核酸文库用于富集应用和测序应用中。举例来说，使用任何合适的DNA测序平台实现所提供的目标核酸文库的序列测定。在一些实施例中，所公开的方法的文库序列或随后制备的模板文库用于单核苷酸多形现象(SNP)分析、基因分型或表观遗传分析、拷贝数目变化分析、基因表达分析、基因突变分析(包含(但不限于)检测、预后和/或诊断)、罕见或低频率出现的等位基因突变的检测和分析、核酸测序(包含(但不限于)重新测序、靶向重测序)以及合成组装分析。在一个实施例中，所制备的文库序列用于检测等位基因出现率小于5％的突变。在一些实施例中，本文中所公开的方法用于检测核酸群体中的等位基因出现率小于4％、3％、2％或为约1％的突变。在另一实施例中，对如本文中所描述制备的文库进行测序以检测和/或鉴别来自核酸分子群体的生殖系或体细胞突变。在某些实施例中，使测序衔接子接合到所制备的文库的末端，产生适用于核酸测序的多个文库。

在一些实施例中，提供用于制备目标特异性扩增子文库的方法，以用于多种下游过程或分析法，如核酸测序或克隆扩增。在一些实施例中，使用桥式扩增或emPCR来扩增文库以产生适用于核酸测序的多个克隆模板。举例来说，任选地在目标特异性扩增之后进行二级和/或三级扩增过程，包含(但不限于)文库扩增步骤和/或克隆扩增步骤。“克隆扩增”是指产生单个分子的多个拷贝。使用所属领域中已知的各种方法进行克隆扩增。举例来说，乳液PCR是一种方法，并且涉及在油相内，在水性气泡中分离单独DNA分子和涂有引物的珠粒。接着，聚合酶链反应(PCR)用所分离的文库分子的克隆拷贝涂布各珠粒，并且接着固定这些珠粒以用于后续测序。乳液PCR用于由Marguilis等人以及Shendure和Porreca等人公开的方法(也称为“聚合酶克隆测序”，由Agencourt商业化并且最近由Applied Biosystems获得)中。Margulies等人,(2005)《自然(Nature)》437:376-380；Shendure等人,《科学(Science)》309(5741):1728-1732。另一用于克隆扩增的方法是“桥式PCR”，其中在引物连接到固体表面时扩增片段。这些方法以及其它克隆扩增方法都产生许多实体上分离的位置，其各自含有来源于单一分子聚核苷酸片段的多个拷贝。因此，在一些实施例中，使用例如桥式扩增或emPCR来扩增一个或多个目标特异性扩增子以产生适用于核酸测序的多个克隆模板。

在一些实施例中，至少一个待克隆扩增的文库序列连接到负载物或粒子。负载物可以包含任何合适的材料并且具有任何合适的形状，包括例如平坦、球形或颗粒。在一些实施例中，负载物是如美国公开申请案第20100304982号中所描述的支架聚合粒子，其以全文引用的方式并入本文中。在某些实施例中，方法包括在负载物(例如测序负载物)上沉积至少一部分文库序列的富集体，其中负载物包含测序反应位点的阵列。在一些实施例中，文库序列的富集体连接到负载物上的测序反应位点，其中负载物包括10²–10¹⁰个测序反应位点的阵列。

序列测定意指测定与核酸序列相关的信息并且可以包含鉴别或测定核酸的部分和全部序列信息。可以在不同程度的统计可靠性或置信度下测定序列信息。在一些实施例中，序列分析包含高通量、低深度检测，如通过qPCR、rtPCR和/或所属领域中已知的阵列杂交检测方法进行。在一些实施例中，测序分析包含深度序列评估的测定，如通过桑格测序(Sanger sequencing)或其它高通量下一代测序方法进行。下一代测序意指使用以本质上大规模平行方式(例如其中以例如平行方式读取许多序列)测定许多(通常数千到数十亿个)核酸序列的方法或使用本身可以平行化的超高通量连续方法进行序列测定。因此，在某些实施例中，本发明的方法包括测序分析，其包含大规模平行测序。此类方法包含(但不限于)焦磷酸测序(例如由454康涅狄格州布兰福德的生命科学公司(Life Sciences,Inc.,Branford,Conn.)商业化)；接合测序(例如，如在SOLiD^TM技术中商业化，加利福尼亚州卡尔斯巴德的生命科学公司)；使用经修饰的核苷酸进行的合成测序(如在以下中的商业化：加利福尼亚州圣地亚哥的Illumina公司(Illumina,Inc.,San Diego,Calif.)的TruSeq^TM和HiSeg^TM和MiSeq^TM和/或NovaSeq^TM技术；马萨诸塞州剑桥Helicos生物科学公司(HelicosBiosciences Corporation,Cambridge,Mass.)的HeliScope^TM；以及加利福尼亚州门洛帕克的加利福尼亚太平洋生物科学公司(Pacific Biosciences of California,Inc.,MenloPark,Calif.)的PacBio

或RS***)；通过离子检测技术进行的测序(例如，IonTorrent^TM技术，加利福尼亚州卡尔斯巴德的生命科学公司)；DNA纳米球的测序(加利福尼亚山景城Complete Genomics公司(Complete Genomics,Inc.,Mountain View,Calif.))；基于纳米孔的测序技术(例如，如由英国牛津的牛津纳米孔科技有限公司(Oxford NanoporeTechnologies,LTD,Oxford,UK)开发的)和类似的高度平行化测序方法。

举例来说，在某些实施例中，借助于本公开的教示内容产生的文库的产率足以用于多种下游应用，包含使用Ion Torrent^TMPGM***(例如PCR介导的核酸片段文库添加到IonSphere^TM粒子上)(Life Technologies，产品号4467389)或Ion Torrent Proton^TM***的Ion Xpress^TM模板试剂盒。举例来说，用于从扩增子文库制备模板文库的说明可以见于IonXpress模板试剂盒用户指南(Life Technologies，产品号4465884)中，其以全文引用的方式并入本文中。用于将后续模板文库装载到Ion Torrent^TMChip上以用于核酸测序的说明描述于离子测序用户指南(Ion Sequencing User Guide，产品号4467391)中，其以全文引用的方式并入本文中。

可以通过将测序引物粘接到固相扩增反应的产物来提供测序反应的起始点。在这方面，在模板文库形成期间添加的一个或两个衔接子可以包含核苷酸序列，其实现测序引物粘接到由完全基因组或模板文库的固相扩增衍生的经扩增的产物。取决于本发明的实施例的实施方式，可以在来自单一测序引物的单一读段中或在来自两个不同测序引物的多个读段中测定标签序列和/或目标核酸序列。在来自两个测序引物的两个读段的情况下，以任一种顺序进行‘标签读段’和‘目标序列读段’，并且进行合适的变性步骤以在完成第一测序读段之后去除所粘接的引物。

在一些实施例中，测序仪与应用参数或软件的服务器耦合，以测定经扩增的目标核酸分子的序列。在某些实施例中，测序仪与应用参数或软件的服务器耦合，以测定样品中是否存在低频率出现的突变等位基因。

范例

实例1：材料和方法

逆转录(RT)反应方法(21uL反应)可以在样品中进行，其中分析RNA和DNA，例如FFPE RNA和cfTNA：

1.在室温下解冻5x URT缓冲液至少5分钟。(注意：检查管中是否有白色沉淀。根据需要涡旋混合)

2.在MicroAmp EnduraPlate 96孔板中，通过添加以下组分来设置RT反应。

(5-15ng RNA或DNA//5-40ng cfTNA)

3.通过涡旋或移液混合全部内容物。短暂旋转向下。

4.在每个反应混合物的顶部添加20μl Parol 40C油。

5.将板装载入热循环仪(例如，SimpliAmp Thermocycler)，并且运行以下程序：

低循环标记PCR(38uL反应体积+20uL油)：

在96孔PCR板孔中组装标记PCR反应：

仅FFPE DNA样品

1.通过将以下组分添加到MicroAmp EnduraPlate 96孔板来组装反应：

a.制备UDG混合物：1ul+5ul 5x URT缓冲液

b.将6ul稀释的UDG添加到15μl FFPE DNA样品中。

c.通过涡旋混合。短暂旋转向下以收集孔底部处的反应。

d.在每个样品的顶部添加20μL Parol 40C油。

e.进行如下反应：

2.制备扩增主混合物：

3.将17μL PCR主混合物添加到21μL UDG处理的FFPE DNA样品中。

将移液器设置为20μL体积。通过上下移液20次来混合油下方的反应，以确保反应充分混合而不会干扰油相。将所述板短暂旋转向下。

仅FFPE RNA和cfTNA样品

1.将组分直接添加到上述RT步骤的RT反应中：

2.将移液器设置为20μL体积。通过上下移液20次来混合油下方的反应，以确保反应充分混合而不会干扰油相。将所述板短暂旋转向下。

3.在SimpliAmp上使用以下循环条件执行3-循环标记PCR：

对于FFPE DNA和RNA文库：

对于cfTNA文库，

消化-填充-接合(45.6μL反应体积+20μL油)：

1.将7.6μL SUPA添加到上述PCR反应孔中。将SUPA直接添加到油层下方的样品中。

2.将移液器设置为25μL。通过上下移液20次来混合油层下方的反应。将所述板短暂旋转向下。

3.将板装载入热循环仪，并且运行以下程序：

阶段	温度	时间
			阶段1	30℃	15分钟
阶段2	50℃	15分钟
			阶段3	55℃	15分钟
阶段4	25℃	10分钟
			阶段5	98℃	2分钟
保持	4℃	∞

文库扩增(～51μL反应体积+20μL油)

1.小心地将30μL上述消化-填充-接合后反应转移到AmpliSeq HD双条形码。通过上下移液20次进行充分混合。将所有反应转移回油层下的原孔。

2.将移液器设置为30μL。通过上下移液20次来混合油下方的整个反应。将所述板短暂旋转向下。

3.将板装载入热循环仪，并且运行以下程序：

2轮AmpureXP文库纯化

根据制造商说明，使用36.8ul

珠粒(贝克曼库尔特公司(BeckmanCoulter,Inc.))对所得修复样品进行两轮纯化。简要地：

将油层下方的46μL文库反应转移到PCR板上新的清洁孔中。

将36.8μl Agencourt^TMAMPure^TMXP试剂添加到每个样品中，并且通过移液混合，然后在室温下温育5分钟。

将板放置在磁铁上，直到孔中的溶液变得澄清。

小心取出上清液；然后去除残余的上清液。

将150uL 80％乙醇添加到10mM pH 8Tris-HCl中。不要干扰珠粒团粒。

以5秒的间隔在磁铁上拨动板3次；去除上清液；再重复一次洗涤步骤。使用移液器去除孔中的残余缓冲液。

将孔在室温下干燥5分钟。

将30uL低TE缓冲液添加到孔中，并且进行移液以重悬珠粒。

将溶液在室温下温育5分钟，将板放置在磁铁上直到获得澄清溶液。

将30uL洗脱液转移到板上的干净孔中。

将30μL(1x体积)AmpureXP珠粒添加到上述孔中；在孔中进行移液以进行混合。

重复上述步骤，使用40uL低TE缓冲液在第二次纯化后洗脱。

将40uL文库转移到新的干净孔中。

通过独立均衡器的文库标准化

首先，将Ion Library Equalizer^TM套件中的所有试剂温热到室温。将所有试剂涡旋和离心。清洗Equalizer^TM珠粒(如果先前执行过，跳至添加Equalizer^TM珠粒并且洗涤)。

1.对于每4次反应，将12μL珠粒添加到干净的1.5-mL试管和24μL/反应Equalizer^TM洗涤缓冲液中。

2.将试管放置于磁架中，持续3分钟或直到溶液完全澄清。

3.在不干扰团粒的情况下，小心取出并且丢弃上清液。

4.从磁铁中取出，每个反应Equalizer^TM洗涤缓冲液添加24μL，并且重悬。

扩增文库

5.从磁铁中取出具有纯化文库的板，然后添加10μL 5X DV-Amp混合物和2μLEqualizer^TM引物(均衡器套件中的粉红色盖子)。总体积＝52μL

6.混合。

7.轻轻将20μL Parol 40C油添加到样品顶部上。

8.在热循环仪上运行以下程序：

98C，持续2分钟

FFPE DNA/RNA的9-循环扩增或cfTNA的6-循环扩增：

98C，持续15秒

64C，持续1分钟

然后

保持在4C下，持续无限时间

9.(任选的)热循环后，将板离心以收集任何液滴。

将Equalizer^TM捕获添加到经扩增的文库中

10.将10μL均衡器捕获添加到油层下方的每个文库扩增反应中。

11.上下混合10x。

12.在室温下温育5分钟。

添加Equalizer^TM珠粒并且洗涤

13.将油层下方的60μL经扩增的文库样品转移到带有洗涤珠粒的孔中。

14.充分混合。

15.在室温下温育5分钟。

16.将板放置在磁铁中，然后温育2分钟或直到溶液澄清。

17.取出上清液。

18.将150μL Equalizer^TM洗涤缓冲液添加到每个反应中。

19.在板仍在磁铁中的情况下，取出并且丢弃上清液。

20.重复珠粒洗涤，洗脱均衡文库。

洗脱均衡文库

21.从磁铁上取下板，将100μL Equalizer^TM洗脱缓冲液添加到每个团粒中。

22.用50ul体积5x移液混合物。

23.通过在热循环仪上在32℃下温育5分钟来洗脱文库。

24.立即取出，将板放置入磁铁中，待溶液澄清后，立即移动到新孔中。

25.执行qPCR，并且调整池@100pM以进行模板化和测序。

实例2：组合物和方法

所提供的方法的第一步骤包括数轮扩增，例如三到六轮扩增，并且在某些实例中，使用针对每个基因特异性目标序列的正向和反向衔接子进行的三轮扩增。每个衔接子含有5'通用序列和3'基因特异性目标序列。在一些实施例中，衔接子任选地包括位于5'通用与3'基因特异性目标序列与之间的独特标签序列。

在其中利用独特标签序列的特定实施例中，每个基因特异性目标衔接子对在每个衔接子中包含多个不同的独特标签序列。举例来说，每个基因特异性目标衔接子包括高达4096个TAG。因此，每个目标特异性衔接子对包括至少四个且高达16,777,216个可能的组合。

每个所提供的衔接子在正向和反向衔接子序列中的特定位置处包括代替胸腺嘧啶的可裂解尿嘧啶。对于所有具有独特标签序列的正向和反向衔接子来说，尿嘧啶的位置是一致的，其中尿嘧啶(U)(当存在时)侧接独特标签序列的5'和3'端；并且U存在于每个基因特异性目标序列区域中，但每个基因特异性目标序列的位置将不可避免地不同。设计侧接每个独特标签序列(UT)并且在基因特异性序列区域中的尿嘧啶且计算这类序列的Tm，以促进在低于通用柄序列的熔融温度的温度下的片段解离，所述通用柄序列被设计成在所选择的温度下保持杂交。有可能存在UT区域的侧接序列中的U中的变化，然而，设计保持熔融温度低于每个正向和反向衔接子上的通用柄序列的熔融温度。例示性衔接子序列结构包括：

正向衔接子：

------A柄----- ------*UT*------ --基因特异性--

TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-XXXXXXXXXXXXXXXX SEQ ID NO:1564

反向衔接子

TGACAAGGCGTAGTCACGG-U-NNNACTNNNTGA-U-XXXXXXXXXXXXXXXX SEQ ID NO:1565

-----B柄------- ------UT------- -------基因特异性-------

其中，每个N是选自A、C、G或T的碱基并且使用UT区域的恒定区段作为锚序列以确保可变(N)部分的正确鉴别。UT的恒定和可变区可以经显著修饰(例如替代性恒定序列，>3N/区段)，只要UT区域的Tm保持低于通用柄区域的Tm即可。重要的是，每个正向(例如，TCTGTACGGTGACAAGGCG(SEQ ID NO:1566)和反向(例如，TGACAAGGCGTAGTCACGG(SEQ ID NO:1567)通用手柄序列)通用柄序列中不存在可裂解尿嘧啶。在本发明实施例中，通用序列已被设计成适应ION Torrent平台上的后续扩增和测序序列添加，然而，本领域技术人员将理解，此类通用序列可适用于使用其它通用序列，所述其它通用序列更适合替代性测序平台(例如，ILLUMINA测序***、QIAGEN测序***、PACBIO测序***、BGI测序***或其它)。

所提供的组合物的使用方法包括通过AmpliSeq HD技术及其轻微变型并且使用可从赛默飞世尔科技公司获得的试剂和试剂盒制备文库。SuperFiU DNA包括尿嘧啶结合袋(例如AA36)和B族聚合酶催化域(例如AA 762)中的修饰。SuperFiU在2017年6月26日提交的美国临时专利申请第62/524,730号中进行了描述，所述美国临时专利申请通过引用并入本文。聚合酶利用尿嘧啶和/或任何包含于衔接子序列中的替代性可裂解残基(例如肌苷等)的能力可能有限。在某些实施例中，可能宜使用聚合酶的混合物以减少酶特异性PCR误差。

方法的第二步骤涉及所得扩增子以及任何未使用的含有尿嘧啶的衔接子的部分消化。举例来说，当并入尿嘧啶作为可裂解位点时，消化和修复包含来自所得引物、引物二聚体和扩增子的尿苷单磷酸的酶促裂解，和熔融DNA片段，接着通过聚合酶填充和接合来修复有间隙的扩增子。这一步骤减少并且可能消除多重PCR中的引物-二聚体产物。在一些情况下，在单一步骤中进行消化和修复。在某些情况下，可能需要短暂分开消化和修复步骤。举例来说，热不稳定聚合酶抑制剂可以与方法结合使用，使得在较低温度(25-40℃)下进行消化，接着通过升高温度足以破坏聚合酶-抑制剂相互相用(例如聚合酶-Ab)，但未高到足以熔融通用柄序列来启动修复。

尿嘧啶-DNA糖基化酶(UDG)可以用于去除尿嘧啶，留下无碱基位点，其可以通过若干酶或酶组合起作用，包含(但不限于)：APE 1-脱嘌呤/脱嘧啶核酸内切酶；FPG-甲酰胺基嘧啶[fapy]-DNA糖基化酶；Nth-核酸内切酶III；Endo VIII-核酸内切酶VIII；PNK-聚核苷酸激酶；Taq-水生栖热菌(Thermus aquaticus)DNA聚合酶；DNA pol I-DNA聚合酶I；Polβ-人类DNA聚合酶β。在具体实施方案中，所述方法使用人类脱嘌呤/脱嘧啶核酸内切酶，APE1。APE1活性留下3'-OH和5'脱氧核糖-磷酸(5'-dRP)。可以通过多种酶实现去除5'-dRP，包含recJ、聚合酶β、Taq、DNA pol I或任何具有5'-3'核酸外切酶活性的DNA聚合酶。通过这些酶中的任一种去除5'-dRP可以产生可接合的5'-磷酸端。在另一种实施方案中，UDG活性去除尿嘧啶并且留下无碱基位点，其由FPG去除，留下3'和5'-磷酸。接着，由T4 PNK去除3'-磷酸，留下聚合酶可延伸的3'-OH。接着，可以由聚合酶β、fpg、Nth、Endo VIII、Taq、DNA pol I或任何其它具有5'-3'核酸外切酶活性的DNA聚合酶去除5'-脱氧核糖磷酸。在具体实施方案中，利用Taq DNA聚合酶。

修复填充方法可以由几乎任何聚合酶实现，可能是用于步骤1中的扩增的扩增聚合酶或步骤2中添加的任何聚合酶，包含(但不限于)：Phusion DNA聚合酶；Phusion U DNA聚合酶；SuperFi DNA聚合酶；SuperFi U DNA聚合酶；TAQ；Polβ；T4 DNA聚合酶；以及T7DNA聚合酶。扩增子的接合修复可以由多种连接酶进行，包含(但不限于)：T4 DNA连结酶；T7DNA连结酶；Taq DNA连结酶。在所述方法的具体实施方案中，利用Taq DNA聚合酶并且由T7DNA连接酶实现接合修复。

文库制备的最后一个步骤涉及使用通用引物通过标准PCR方案扩增经修复的扩增子，所述通用引物含有与所制备的扩增子的5'和3'端上的通用柄序列互补的序列。举例来说，A-通用引物和P1通用引物(Ion Express Adaptor Kit(Thermo Fisher Scientific,Inc.)的每个部分)可以任选地含有样品特异性条形码。最后一个文库扩增步骤可以由多种聚合酶进行，包含(但不限于)：Phusion DNA聚合酶；Phusion U DNA聚合酶；SuperFi DNA聚合酶；SuperFi U DNA聚合酶；Taq DNA聚合酶；Veraseq Ultra DNA聚合酶。

实例3：测定内容物和方法

使用针对表1中对靶标具有特异性的靶序列的引物，衔接子各自包括每个基因特异性靶序列的4096个独特标签序列，从而估计每个基因特异性靶序列对有16,777,216个不同的独特标签组合。

根据上文所描述的方法进行文库制备。将用于模板化的制备的文库进行制备，并且测序和分析。测序可以通过多种已知方法进行，包含(但不限于)合成测序、接合测序和/或杂交测序。已使用Ion Torrent平台(赛默飞世尔科技公司)在本文中的实例中进行测序，然而，文库可以使用任何其它平台，例如Illumina、凯杰(Qiagen)、PacBio等制备和被调适成用于分析，例如测序。可以使用多个度量分析结果以评价性能，例如：

○家族数量(捕获的输入DNA，ng)。家族的数量是映射到单独目标的家族数量的测量值。在这种情况下，每个独特分子标签是一个家族。

○均匀性是由至少0.2倍平均读段深度覆盖的目标碱基的百分比的测量值。使用这一度量确保技术不会选择性地使某些目标扩增不足。

○阳性/阴性：当具有已知突变的对照样品用于分析时(例如AcrometrixOncology Hotspot Control DNA，Thermo Fisher Scientific,Inc.)，可以追踪真阳性的数目。

■真阳性：存在并且正确鉴别的关于突变数目的真阳性通知的数目。

■假阳性(FP)：(热点和完全目标)测定存在，但已知在样品中不存在的关于突变数目的假阳性通知的数目。

■假阴性(FN)(如果使用acrometrix穿刺)：存在，但未鉴别的关于突变数目的假阴性通知的数目。

○命中目标/脱靶是在目标区域中对准/未对准的定位读段的百分比。使用这一度量确保技术主要扩增面板设计所针对的目标。

○追踪低质量以确保数据值得分析。这一度量是总***度量并且不与这种技术直接相关。

表1：按变体类别的精确测定基因含量

临床证据被定义为基因/变体组合出现在药物标签、指南和/或临床试验中的实例数量。表2和表3描绘了与所提供的测定相关的靠前的基因/变体和适应症，如临床证据所支持。

表2：前5个测定基因/变体类型表3：前5个适应症

具有最多的临床证据具有最多的临床证据

药物标签和/或指南(NCCN和ESMO)上提供的测定涵盖至多29种基因和变体组合

表4：按临床证据排序的癌症适应症

实例4：结果

使用本文提供的组合物设计方法设计引物，并且使用如上文表1中所描述的组靶基因的那些靶向肿瘤学基因，其中文库扩增步骤利用两个引物对(将两个通用序列放在扩增子的每一端上，例如，每一端上一个A-通用柄和一个P1-通用柄)以实现如本文所描述的双向测序。使用Ion Gene Studio模板化/和测序试剂盒和仪器(赛默飞世尔科技公司)和/或新的完全集成的文库制备、模板化和测序***对制备的文库进行测序。即时组的性能指示所述技术能够按预期适当地检测靶向突变、拷贝数变异和融合。

4A.NSCLC FFPE样品中各种ALK和ROS异构体的融合检测能力

如上所描述的制备文库并且对其进行测序。各种融合异构体检测如预期所示：

HIP1-ALK.H21A20 KIF5B-ALK.K17A20 EML4-ALK.E20A20

读段计数：373 读段计数：602 读段计数：671

分子计数：3 分子计数：10 分子计数：12

CD74-ROS1.C6R34. SLC34A2-ROS1.S13R32

读段计数：1947 读段计数：2518

分子计数：82 分子计数：82

4B：使用GeneStudio S5和新测序仪在匹配样品中检测突变

GeneStudio S5 新***

如上文所描述，使用ION GeneStudio S5上的手动制备和测序以及自动化和集成的文库制备、模板化和测序***，对匹配样品中的突变检测进行文库制备、测序和分析。与自动化***相比，使用GeneStudio S5及手动工作流程的精确测定表明，在匹配的组织和血浆样品中，PIK3CA和KRAS突变检测是一致的。

4C：跨各种癌症适应症的DNA变体检测

如上文所描述，使用ION GeneStudio S5上的手动制备和测序以及自动化和集成的文库制备、模板化和测序***，对各种不同样品类型中的突变检测进行文库制备、测序和分析。精确测定表明检测到不同癌症适应症样品类型的各种驱动突变。

4D：使用一组匹配的FFPE和血浆样品进行检测

进行文库制备、测序和分析以评估所述测定在检测一组匹配的FFPE和血浆样品中的变体方面的性能。所述测定表明检测到不同癌症适应症样品类型的各种驱动突变。在一组匹配的FFPE和血浆样品上使用测定，8个中有4个具有一致的PIK3CA(1)和KRAS(3)突变；而8个中有1个检测到一致的NO变体

4E：检测具有已知变体的FFPE癌症样品中的变体

进行文库制备、测序和分析以评估所述测定在检测16个FFPE样品(NSCLC、乳腺和CRC)中的变体方面的性能，其中先前使用ONCOMINE cfDNA测定确认了已知突变。使用集成***上的测定在单次运行(芯片)内测试样品。8个样品先前使用Oncomine cfDNA测定进行了表征。在此组中，本发明测定检测到EGFR、ERBB4、IDH1、KRAS、MET、PIK3CA和TP53内的17个突变。另外，检测到EGFR、ERBB2和FGFR1中的3个扩增。最后，还检测到3个与FGFR2和RSPO3驱动基因的融合。所述测定能够检测到一组FFPE样品中的许多变体，包含SNV突变、CNV扩增和融合。

4F：来自FFPE的多种癌症类型的SNV和CNV检测

所述测定用于检测不同癌症适应症的各种驱动突变。所有结果都与先前使用不同测定和***的表征一致：

4G：检测跨ALK、ROS1、RET、NTRK1、NTRK2和NTRK3驱动基因的融合。

进行文库制备、测序和分析以评估所述测定在检测融合变体方面的性能。所述测定能够使用靶向异构体检测重复检测表示6个驱动基因(ALK、BRAF FGFR3、NTRK1、NTRK3、RET和ROS1)的11种融合异构体，以及表示3个驱动基因(NTRK1、NTRK2和NTRK3)的15种NTRK融合异构体。

4H：检测对照材料中的EGFR和KRAS变体

进行文库制备、测序和分析以评估所述测定在使用水平EGFR基因特异性多重参考标准5％和1％FFPE对照检测EGFR变体；以及使用水平KRAS基因特异性多重参考标准5％FFPE在检测RAS的融合变体方面的性能。所述测定能够使用水平FFPE对照以5％等位基因频率检测所有EGFR变体。在1％等位基因频率(低于典型LOD)下，所述测定在2个复制中选取了8个实例中的7个实例：所述测定能够使用水平对照重复检测6个RAS突变。

4I：使用cfDNA对照检测KRAS、BRAF、KIT、EGFR突变

进行文库制备、测序和分析以评估所述测定在使用cfDNA对照SeraCare SeraseqctDNA参考材料v2 AF 0.125％或水平多重I cfDNA参考标准组(1％和0.1％)检测KRAS、BRAF、KIT、EGFR突变方面的性能。所述测定能够使用cfDNA对照检测低至0.1％等位基因频率的突变。

4J：MET和PTEN拷贝数变型的检测

进行文库制备、测序和分析以评估所述测定在使用对照和细胞系检测MET拷贝增加和PTEN拷贝丢失方面的性能。结构多重FFPE参考标准(水平)用于检测MET，并且PTEN细胞系(ATCC)用于检测PTEN拷贝数变型。所述测定能够分别使用对照和细胞系检测MET拷贝数增加和PTEN拷贝数丢失。

4K：检测细胞系中的NTRK1、FGFR3、RET融合。

进行文库制备、测序和分析以评估所述测定在检测NTRK1、FGFR3、RET融合细胞系方面的性能。KM12细胞系(ATCC)；SW780细胞系(ATCC)；LC-2/ad细胞系(西格玛奥德里奇公司(Sigma Aldrich))用于核酸制备和评估。所述测定能够使用所述测定的靶向异构体和失衡测定方法检测TPM3-NTRK1融合异构体。所述测定能够使用所述测定的靶向异构体和失衡测定方法检测FGFR3-BAIAP2L1融合异构体。有趣的是，在此细胞系中也检测到了ALK失衡；正在进行研究以进一步了解这些结果。所述测定能够使用靶向异构体和失衡测定方法检测CCDC6-RET融合异构体。

4L：检测FFPE样品中的ALK和ROS1融合

进行文库制备、测序和分析以评估所述测定在检测FFPE样品中ALK和ROS1融合方面的性能。所述测定能够使用靶向异构体和失衡测定方法检测ALK融合，并且使用FFPE样品的靶向异构体方法检测ROS1融合。

虽然已经在本文示出并描述了本发明的优选实施例，但是对本领域的普通技术人员而言应该显而易见是这样的实施例仅以举例方式提供。在不脱离本发明的情况下，所属领域的技术人员现在将意识到许多变型、变化和替代物。应理解，本文所描述的本发明的实施例的各个替代方案都可以用于实践本发明。预期的是以下权利要求书限定了本发明的范围以及由此覆盖在这些权利要求和它们的等效物的范围内的方法和结构。

表A肿瘤学精确测定、FWD池和REV池的引物序列

每个N独立地为A、C、G或T。