CN109563541A

CN109563541A - 用于制备无细胞dna/rna定序库的rna差异性标记方法

Info

Publication number: CN109563541A
Application number: CN201780049600.9A
Authority: CN
Inventors: 马修·拉森; 约翰·H·金; 尼克·艾托克; 阿拉什·詹姆席狄
Original assignee: Grill Co
Current assignee: Grill Co
Priority date: 2016-06-30
Filing date: 2017-06-29
Publication date: 2019-04-02
Also published as: AU2017290237A1; AU2021200391B2; US10144962B2; EP3478856A1; US20190062831A1; EP4257701A2; CA3024984A1; US20180002749A1; EP4257701A3; AU2021200391A1; WO2018005811A1; AU2017290237B2; EP3831958A1; CA3024984C; EP3478856B1; WO2018005811A8; AU2023251444A1; EP3831958B1; US11180801B2; US20220010372A1

Abstract

在各个方面，本发明提供了用于对来自单一来源样品的RNA和DNA进行定序的方法、组合物、反应混合物、套件组和***。在一些实施例中，RNA被处理以便将RNA序列与衍生自相同样品的DNA序列区分开。在一些实施例中，RNA和DNA是无细胞的多核苷酸。

Description

用于制备无细胞DNA/RNA定序库的RNA差异性标记方法

相关申请案

参考以下临时申请案，其通过引用方式以其整体并入本文中：(1)2016年7月28日提交的美国临时申请案No.62/368,025；(2)2016年6月30日提交的美国临时申请案No.62/357,281。

背景技术

使用下一代定序(next generation sequencing,NGS)分析核酸被认为是有价值的方法，例如循环的无细胞核酸(circulating cell-free nucleic acids，或循环的称细胞游离核酸)，例如无细胞DNA(cell-free DNA，cfDNA)和无细胞RNA(cell-free RNA，cfRNA)。例如，这种分析可用作检测和诊断癌症的诊断工具。用于从无细胞核酸样品(例如血浆样品)制备定序文库的现有方案通常涉及将单一核酸群组分离(即cfDNA或cfRNA)以制备用于分析的一定序文库。因为在这样的方案中仅分离单一核酸群组用于分析，所以浪费了无珍贵的无细胞核酸材料并且可能丢失有价值的信息。

发明内容

鉴于前述内容，需要制备核酸定序文库的新方法，所述核酸定序文库获取来自相同样品的RNA和DNA群体(例如cfRNA群体和cfDNA群体)，用于序列分析。本公开解决了这种需要，并且还提供了额外的益处。在一些实施方案中，本公开内容的方法在突变(例如稀有序列变体)的鉴别中提高定序方法的灵敏度和/或碱基调用准确度。

在一方面本发明提供一种区分一样品中多个RNA和DNA序列的方法。在一些实施例中，所述方法包括：步骤a：获得包括RNA和DNA的样品；步骤b：反转录所述RNA以产生多个cDNA/RNA杂合分子；步骤c：降解所述多个杂合分子的所述RNA以产生单链cDNA；步骤d：在包括一单链DNA连接酶的一反应中，优先将包括一标签序列的一标签寡核苷酸与所述单链cDNA连接,以产生一被标记的cDNA；以及步骤e：定序所述DNA和所述被标记的cDNA；其中所述反转录、优先连接和定序皆是在所述DNA存在下进行。在一些实施例中，所述RNA和DNA是无细胞核酸。核酸(包括无细胞核酸)可以从多种来源中分离，例如血液、血液成分(例如血清或血浆)，尿液和其他体液。在一些实施例中，所述反转录包括延伸多个引物，所述引物包括一随机序列(例如，在一或多个位置从一组两个或更多个不同核苷酸中随机选择一或多个核苷酸，其中在包含所述随机序列的一寡核苷酸库中所表示的一或多个位置处，选择所述不同的核苷酸的各者)。在一些实施例中，所述反转录包括沿一模板转换寡核苷酸(template-switch oligonucleotide(TSO))延伸所述杂合分子的cDNA，所述模板转换寡核苷酸包括一通用转换引物序列(universal switch primer sequence)。在一些实施例中，所述标签寡核苷酸与所述单链cDNA的一3'端连接。在一些实施例中，所述标签寡核苷酸包括一引物结合序列。在一些实施例中，所述定序包括扩增所述被标记的cDNA，以产生一双链被标记的cDNA。在一些实施例中，扩增所述被标记的cDNA包括延伸与所述引物结合序列杂交的一引物。在一些实施例中，所述定序包括将多个定序衔接子(adaptor)连接到所述被标记的cDNA和所述DNA。在一些实施例中，所述标签寡核苷酸包括一独特的分子标识物(unique molecular identifier(UMI))，其中根据所述独特的分子标识物，多个被标记的cDNA分子中的各者与所述多个被标记的cDNA分子中的其他者可相互区别(例如，由UMI的序列决定，并且可选地与cDNA的序列结合)。在一些实施例中，所述样品是血液、血液成分、血浆，、血清、唾液、痰液、尿液、***、经***液、脑脊髓液或粪便。在一些实施例中，所述样品是血液或血液成分(例如血清或血浆)。在一些实施例中，所述方法进一步包括使用一处理器，根据所述标签序列或所述标签序列的一互补序列的存在或不存在与否，将多个RNA衍生的序列与多个DNA衍生的序列分开。在一些实施例中，所述方法还包括根据所述多个RNA衍生的序列和所述多个DNA衍生的序列，辨识一对象的一病症(例如癌症)的存在或不存在。在一些实施例中，所述方法进一步包括根据所述多个RNA衍生的序列和所述多个DNA衍生的序列来治疗所述对象。

在一方面，本发明提供一种区分一样品中多个RNA和DNA序列的方法。所述方法包括：步骤a：获得包括RNA和DNA的一样品；步骤b：在包括一RNA连接酶的一反应中，将包括一标签序列的一标签寡核苷酸与所述RNA连接以产生被标记的RNA；步骤c：反转录所述被标记的RNA，以产生一被标记的cDNA；以及步骤d：定序所述DNA和所述被标记的cDNA；其中所述反转录、连接和定序皆是在所述DNA存在下进行。在一些实施例中，所述RNA和DNA是无细胞核酸。在一些实施例中，所述方法进一步包括在连接所述标签序列之前，使RNA片段化，以产生片一段化的RNA。在一些实施例中，所述片段化的RNA具有在一预定范围内的一平均大小(例如长度为约10至约1,000个核苷酸的平均长度或中间值长度，例如10至800、10至500、50至500、90至200或50至150个核苷酸；或平均或中值长度为小于1500、1000、750、500、400、300、250或更少的核苷酸的长度)。在一些实施例中，使所述RNA片段化包括使RNA和DNA经受优先使所述RNA片段化的多个条件。在一些实施例中，使所述RNA片段化包括超声处理、化学片段化或加热。在一些实施例中，所述方法还包括使片段化的RNA的多个3'端去磷酸化。在一些实施例中，所述标签寡核苷酸与所述RNA的一3'端连接。在一些实施例中，所述标签寡核苷酸包括一引物结合序列。在一些实施例中，所述反转录包括延伸与所述引物结合序列杂交的一引物。在一些实施例中，所述反转录包括沿一模板转换寡核苷酸(template-switcholigonucleotide(TSO)延伸所述被标示的cDNA。在一些实施例中，所述模板转换寡核苷酸包括一通用转换引物序列(universal switch primer sequence)。在一些实施例中，所述定序包括扩增所述被标记的cDNA，以产生双链被标记的cDNA。在一些实施例中，所述定序包括将多个定序衔接子(adaptor)连接到所述被标记的cDNA和所述DNA。在一些实施例中，所述标签寡核苷酸包括一独特的分子标识物(unique molecular identifier(UMI)，其中根据所述独特的分子标识物，多个被标记的cDNA分子中的各者与所述多个被标记的cDNA分子中的其他者可相互区别(例如，由UMI的序列决定，并且可选地与cDNA的序列结合)。在一些实施例中，所述样品是血液、一血液成分，血浆、血清、唾液、痰液、尿液、***、经***液、脑脊髓液或粪便。在一些实施例中，所述样品是血液或一血液成分。在一些实施例中，所述反转录包括延伸多个引物，所述引物包括一随机序列。在一些实施例中，所述方法进一步包括使用一处理器，根据所述标签序列或所述标签序列的一互补序列的存在或不存在与否，将多个RNA衍生的序列与多个DNA衍生的序列分开。在一些实施例中，所述方法还包括根据所述多个RNA衍生的序列和所述多个DNA衍生的序列，辨识一对象的一病症(例如癌症)的存在或不存在。在一些实施例中，所述方法进一步包括根据所述多个RNA衍生的序列和所述多个DNA衍生的序列来治疗所述对象。

在一方面，本发明提供一种定序来自单一生物样品的无细胞核酸的方法，所述无细胞核酸包括DNA和RNA。在一些实施例中，所述方法包括：步骤a：获得包括所述无细胞核酸的一样品；步骤b：通过延伸一引物反转录RNA，以产生多个cDNA/RNA杂合分子，其中所述引物通过一切割位点与一结合对的一第一成分共价连接；步骤c：通过将所述结合对的所述第一成分与包括所述结合对的一第二成分的一基质结合，将所述cDNA与所述DNA分离；步骤d：切割所述切割位点；以及步骤e：在所述分离的步骤后，对所述cDNA和所述DNA进行定序。在一些实施例中，所述反转录包括扩增所述cDNA，以产生一双链的被标记的cDNA。在一些实施例中，所述扩增包括降解所述多个杂合分子的所述RNA以产生一单链cDNA。在一些实施例中，所述定序包括扩增所述cDNA，以产生一双链的被标记的cDNA。在一些实施例中，所述引物包括一随机序列。在一些实施例中，所述结合对由所述第一部分和所述第二部分组成，其中所述第一部分和所述第二部分彼此具有特异性结合亲和力(例如，所述结合对可包含抗原和抗体)。在一些实施例中，所述结合对包括生物素和链霉抗生物素蛋白。在一些实施例中，所述结合对的所述第一成分是生物素，并且所述结合对的所述第二成员是链霉抗生物素蛋白。在一些实施例中，所述切割位点包括尿嘧啶(uracil)，并且切割所述切割位点包括将所述切割位点暴露于一尿嘧啶DNA糖基化酶(uracil DNA glycosylase)和一DNA糖基化酶-裂解酶内切核酸酶(DNA glycosylase-lyase endonuclease)。在一些实施例中，所述反转录包括沿一模板转换寡核苷酸(template-switch oligo-nucleotide(TSO)延伸cDNA。在一些实施例中，所述模板转换寡核苷酸包括一通用转换引物序列。在一些实施例中，所述定序包括将多个定序衔接子(adaptor)连接到所述被标记的cDNA和所述DNA。在一些实施例中，所述样品是血液、一血液成分，血浆、血清、唾液、痰液、尿液、***、经***液、脑脊髓液或粪便。在一些实施例中，所述样品是血液或一血液成分。在一些实施例中，所述方法还包括根据所述多个RNA衍生的序列和所述多个DNA衍生的序列，辨识一对象的一病症(如癌症)的存在或不存在。在一些实施例中，所述病症是。在一些实施例中，所述方法进一步包括根据所述多个RNA衍生的序列和所述多个DNA衍生的序列来治疗所述对象。

在一方面，本发明提供一种反应混和物，用于执行本文所述的任何方法。所述反应混合物包括一种或多种如本文所描述的各式组成分，相应于所述各种方法的任一者。所述反应混合物包括用于扩增和/或定序核酸的试剂。试剂的非限制性实例包括多种寡核苷酸(例如引物、探针和衔接子(adaptor))、酶(例如聚合酶、反转录酶、核糖核酸酶和连接酶(polymerases,reverse transcriptases,ribonucleases,ligases))和缓冲液(例如碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液)。

在一方面，本发明提供一种反应套件组(kit)，用于执行本文所述的任何方法。所述反应套件组包括一种或多种如本文所描述的各式组成分，相应于所述各种方法的任一者。所述反应套件组包括用于扩增和/或定序核酸的试剂。试剂的非限制性实例包括多种寡核苷酸(例如引物、探针和衔接子(adaptor))、酶(例如聚合酶、反转录酶、核糖核酸酶和连接酶(polymerases,reverse transcriptases,ribonucleases,ligases))和缓冲液(例如碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液)。所述套件组可以进一步包括用于执行本文所描述的一种或多种方法的指示，其关于各个方面的任一者。

在一方面，本发明提供用于执行本文所公开的方法或其部分的***。在一些实施例中，所述***包括用于执行所述方法的一或多个步骤的各种模块。在一些实施例中，所述***是一计算机***。

在一方面，本发明提供了计算机可读介质，包括可被一或多个处理器执行的指令，以执行本文所公开的方法或其部分。

附图说明

图1显示制备无细胞核酸文库的示例性方法的流程图，其使用单链DNA(ssDNA)连接(ligation)，以标记在无细胞核酸样品中从cfRNA反转录而成的cDNA。

图2A和图2B显示根据图1的方法的图示示例步骤。

图3显示制备无细胞核酸文库的示例性方法的流程图，其使用单链RNA(ssRNA)连接(ligation)，以标记在无细胞核酸样品中的cfRNA。

图4A和图4B显示根据图3的方法的图示示例步骤。

图5A和图5B分别显示了通用连接衔接子(adaptor)(universal ligationadapter)和模板转换寡核苷酸(template switch oligonucleotide)的示例性构型的示意图，其可用于连接(ligation)和反转录步骤，例如图4A和图4B中所示的步骤。

图6说明制备无细胞核酸文库的示例性方法的流程图，其使用生物素标记的随机六聚体引物，以标记在无细胞核酸样品中从cfRNA逆转录的cDNA。

图7A和图7B显示根据图6的方法的图示示例步骤。

具体实施方式

除非另有说明，否则本文公开的一些实施方案的某些步骤的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术，这些技术在本领域的技术范围内。参见例如Sambrook和Green所著,分子克隆：实验手册第四版Molecular Cloning:A Laboratory Manual,4th Edition(2012)；分子生物学当前议定书系列the series Current Protocols in Molecular Biology(F.M.Ausubel等人所著)；酵素学中的方法系列the series Methods In Enzymology(Academic Press,Inc.),PCR2实用方法PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor所著.(1995)),Harlow和Lane,所著(1988)抗体、实验手册以及动物细胞培养：一基础技术和专业应用首次第六版Antibodies,A Laboratory Manual,and Culture of Animal Cells:AManual of Basic Technique and Specialized Applications,6th Edition(R.I.Freshney,ed.(2010)).

如说明书和权利要求书中所用，单数形式“一(a，an)”和“所述(the)”包括复数指代，除非上下文另有明确说明。

术语“约(about)”或“近似(approximately)”意指在本领域普通技术人员确定的特定值的可接受误差范围内，这将部分取决于如何测量或确定所述值，即测量***的限制。例如根据本领域的实践，“约”可以表示在1或大于1的标准偏差内。或者“约”可表示给定值的最多20％、最多10％、最多5％或最多1％的范围。或者，特别是对于生物***或过程，所述术语可以表示数值的一数量级，优选地在5倍内，更优选地在2倍内。在申请和权利要求中描述了特定值的情况下，除非另有说明，否则应当假设术语“约”意味着在特定值的可接受误差范围内。

术语“多核苷酸(polynucleotide)”，“核苷酸(nucleotide)”，“核酸(nucleicacid)”和“寡核苷酸(oligonucleotide)”可互换使用。它们是指任何长度的聚合形式的核苷酸、脱氧核糖核苷酸(deoxyribonucleotides)或核糖核苷酸(ribonucleotides)，或其类似物。多核苷酸可以具有任何三维结构，并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例：基因或基因片段的编码区或非编码区，由连锁分析定义的基因座(locus,loci)、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核醣体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶，cDNA、重组多核苷酸、支链多核苷酸、质粒(plasmid)、载体(vector)、任何序列的分离的DNA、任何序列的分离的RNA序列、核酸探针(nucleic acid probes)和引物(primers)。多核苷酸可包含一种或多种修饰的核苷酸，例如甲基化的核苷酸和核苷酸类似物。如果存在，可以在聚合物组装之前或之后赋予对核苷酸结构的修饰。核苷酸序列可被非核苷酸组分中断。聚合后可以进一步修饰多核苷酸，例如通过使用标记组分进行偶联(conjugation)。

如本文所用，术语“扩增(amplify,amplifies,amplified,amplification)通常是指一种或多种一次或多次复制一目标多核苷酸或其部分组成的任何过程。可获得多种扩增多核苷酸(例如DNA和/或RNA)的方法，其一些实例在本文中描述。扩增可以是线性的，指数的，或同时涉及线性和指数相的多相扩增过程。扩增方法可以涉及温度的变化，例如热变性步骤，或者可以是不需要热变性的等温过程。

在一些各种实施方案中，一些多核苷酸被“优先(preferntially)”被处理，例如优先操纵包含RNA和DNA的样品中的RNA。在本文中，“优先”是指影响更大比例的所示类型的多核苷酸的处理。在一些实施方案中，优先处理RNA表明受所述处理所影响的多核苷酸中的至少75％，80％，85％，90％，95％，96％，97％，98％，99％或更多的受影响的多核苷酸是RNA分子。在一些实施方案中，优先处理RNA是指使用本领域已知的特定处理或试剂，相比于DNA，其对RNA具有一定程度的特异性。例如，反转录酶是通常用于反转录反应以将RNA转录成cDNA的酶，并且已知其具有使用RNA而不是DNA作为模板的特异性。作为另一个实例，可以使用与通常在RNA而不是DNA中所发现的元素(例如存在核糖骨架或尿嘧啶(uracil))反应的试剂，来优先处理RNA。在一些实施方案中，RNA的优先处理包括使用非对RNA具有特异性的酶，但其活性优先针对在一或多个先前步骤中衍生自RNA(例如cDNA)的多核苷酸。例如，单链DNA连接酶(single-stranded DNA ligases)可优先将寡核苷酸连接到产生cDNA的样品中的cDNA，并且cDNA在主要为双链的其他DNA种类存在下呈单链。

通常，术语“无细胞(cell-free)”、“循环(circulating)”以及“细胞外(extracellular)”应用于多核苷酸，(例如“无细胞DNA”和“无细胞RNA”)并可互换使用，是指在来自受试者或其部分的样品中存在多核苷酸，其可以分离或以其他方式操作，而无需对最初收集的样品施加裂解步骤(例如，如从细胞或病毒中提取)。因此，即使在收集受试者的样品之前，无细胞的多核苷酸未被包封或者是“游离(free)”出它们所起源的细胞或病毒。无细胞多核苷酸可以作为细胞死亡(例如细胞雕亡(apoptosis)或坏死(necrosis))或细胞脱落的副产物产生，将多核苷酸释放到周围的体液中或循环中。因此无细胞的多核苷酸可以从血液的非细胞成分(例如血清或血浆)、其他体液(例如尿液)或其他类型样品的非细胞成分中分离。

如本文所用的术语“标签寡核苷酸(tag oligonucleotide)”或“条码寡核苷酸(barcode oligonucleotide)”可互换使用，是指包含一段序列(“标签”序列或“条码”)的多核苷酸，所述序列鉴别包含标签序列或其互补序列的多核苷酸的来源。通常，标签寡核苷酸包含一确定的核酸序列。然而，在标签的存在可以被其他方式识别的情况下，标签寡核苷酸也可不需要具有确定的序列，例如当与标签寡核苷酸相邻的序列是已知的并且标签序列表示相对于所述标签位置处的参考序列的偏差。标签序列的存在识别了包含标签序列的序列来源的特征，例如特定样品或其部分，或源多核苷酸的类型。在一些实施方案中，标签序列的存在识别了包含标签序列的核酸序列，所述标签序列源自于所述对象的样品的RNA，例如来自cfRNA。在一些实施方案中，标签寡核苷酸包括额外的序列元件，其实例在本文中描述。

“杂交、杂合(Hybridization)”是指一种反应，其中一种或多种多核苷酸反应形成复合物，所述复合物通过核苷酸残基的碱基之间的氢键而被稳定。氢键可以通过WatsonCrick碱基配对、Hoogstein结合或根据碱基互补性以任何其他序列特异性方式发生。复合物可包含形成双链结构的两条链，形成多链复合物的三条或更多条链，单一自体杂交链或这些的任何组合。杂交反应可以构成更广泛过程中的步骤，例如PCR的启动，或内切核酸酶(endonuclease)对多核苷酸的酶促切割。与第一序列完全互补的第二序列，或使用第一序列作为模板通过聚合酶聚合的第二序列称为第一序列的“互补序列”。应用于多核苷酸的术语“可杂交的(hybridizable)”是指多核苷酸形成复合物的能力，所述复合物通过杂交反应中核苷酸残基的碱基之间的氢键而被稳定。

“互补性”是指核酸通过传统的Watson-Crick碱基配对或其他非传统类型与另一核酸序列形成氢键的能力。百分比互补性(percent complementarity)表示核酸分子中可以与第二核酸序列(例如10个中的5、6、7、8、9或10个分别为50％，60％，70％，80％，90％和100％互补)的残基形成氢键(例如，Watson-Crick碱基配对)的百分比。“完全互补”是指核酸序列的所有连续残基将与一第二核酸序列中相同数量的连续残基以氢键结合。序列同一性(sequence identity)，例如用于评估互补百分比的目的，可以通过任何合适的对比演算法(alignment algorithm)来测量，包括但不限于Needleman-Wunsch算法(例如参见可在www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html获得的EMBOSS Needlealigner，可选择使用默认设置)，BLAST演算法(例如参见blast.ncbi.nlm.nih.gov/Blast.cgi上的BLAST对比工具，可选择默认设置)或Smith-Waterman演算法(例如参见可在www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html上获得的EMBOSS Wateraligner，可选择使用默认设置)。可以使用所选的演算法的任何合适参数(包括默认参数)来评估最佳对比。

如本文所用，“对象(subject)”可以是哺乳动物，例如非灵长类动物(例如，牛、猪、马、猫、狗、大鼠等)或灵长类动物(例如猴和人)。在具体的实施方案中，所述对象是人。在一实施方案中，受试者是患有或可能患有本文所述的病症、病况(disorder,condition)的哺乳动物(例如人)。在另一实施方案中，所述对象是一哺乳动物(例如人)，处于患有本文所述疾病或病症风险。

在各个方面，本公开内容提供了区分样品中RNA和DNA序列的方法。在一些实施方案中，从单一样品分析RNA和DNA提供了比单独分析任一者还多的的额外信息。例如，不影响编码序列的DNA突变(例如调节序列中的突变、指示基因间区域中染色体重排的连接点、和复制数的变异)通常不会在单独的RNA分析中检测到。同样地，RNA表达水平的变化(例如通过与一参考相比，一或多种转录物的比例增加所表示)和各种剪接变体(splice variants，例如融合转录物)通常不会仅从DNA的分析中检测到。此外，对于可以在DNA和RNA中检测到的突变，分析两种类型的多核苷酸可允许在一者中检测到的突变通过另一者中的检测来确认，并且/或者增加分析的灵敏度，以检测这样的突变，其由于可能含有这些突变的多核苷酸的数量增加所造成。通常，将RNA与DNA区分开涉及了对一者或两者进行差异处理(例如标记RNA而不是DNA，标记DNA而不是RNA，或以不同标签来标记DNA和RNA)。在一些实施例中，通过对样品中RNA的差异性处理使RNA与DNA区分开。例如，差异处理可以包括特异性地掺入标记，所述标记有助于RNA与DNA的物理分离。作为另一个实例，差异性处理可以包括标签序列与样品的RNA特异性结合，或者特别是与样品中RNA所衍生的分子(例如cDNA)结合。在一些实施方案中，RNA(或由其衍生的cDNA)的差异性处理在来自样品的DNA的存在下发生。下面描述了各种具体实施例，其中许多具有某些共同特征。因此，除非上下文另有明确说明，否则任何一特定实施例的变型被认为适用于其他实施例。

在一些实施例中，本发明提供了一种方法，包括：步骤a：获得包括RNA和DNA的样品；步骤b：反转录所述RNA以产生多个cDNA/RNA杂合分子；步骤c：降解所述多个杂合分子的所述RNA以产生单链cDNA；步骤d：在包括一单链DNA连接酶的一反应中，优先将包括一标签序列的一标签寡核苷酸与所述单链cDNA连接以产生被标记的cDNA；以及步骤e：定序所述DNA和所述被标记的cDNA；其中所述反转录、优先连接和定序皆是在所述DNA存在下进行。

在一些实施例中，本发明提供了一种方法，包括：步骤a：获得包括RNA和DNA的样品；步骤b：在包括一RNA连接酶的一反应中，将包括一标签序列的一标签寡核苷酸与所述RNA连接以产生被标记的RNA；步骤c：反转录所述被标记的RNA，以产生被标记的cDNA；步骤d：定序所述DNA和所述被标记的cDNA；以及其中所述反转录、连接和定序皆是在所述DNA存在下进行。

任何各种样品都可以用作为包含RNA和DNA的样品。在一些实施例中，所述样品是生物样品。所述生物样品的非限制性实例包括组织(例如皮肤、心脏、肺、肾、骨髓、乳腺、胰腺、肝、肌肉、平滑肌、膀胱、胆囊、结肠、肠、脑、***、食道和甲状腺)体液(如血液、血液成分、血清、血浆、唾液、尿液、母乳、胃和消化液、眼泪、***、***液、来自肿瘤组织的间质液、眼液、汗液、粘液、油、腺体分泌物、脊髓液、脑脊髓液、胎盘液、羊水、脐带血、强力液、腔液、痰液、脓液)粪便、拭子(swab)或洗液(如鼻拭子、咽喉拭子和鼻咽液)、活体组织切片(biopsy)和其他***物或身体组织。在一些实施例中，样品是指血液、血液成分、血浆、血清、唾液、痰液，尿液、***、经***液，脑脊髓液或粪便。在一些实施例中，所述样品是血液，例如全血或血液成分(例如血清或血浆)。

在一些实施例中，获得包含DNA和RNA的样品的步骤包括从样品中提取(extracting)和/或分离DNA和RNA。在使用提取方法的情况下，所选择的方法可部分地取决于待处理的样品的类型。有多种提取方法可供选择。例如，核酸可以通过用苯酚、苯酚/氯仿/异戊醇(phenol/chloroform/isoamyl alcohol)或类似制剂(包括TRIzol和TriReagent)进行有机萃取来纯化。提取技术的其他非限制性实例包括：(1)有机提取，然后乙醇沉淀，例如使用酚/氯仿有机试剂(Ausubel等人所著，1993)，使用或不使用自动核酸提取器；(2)固定相吸附方法(例如参见美国专利号5,234,809)；(3)盐诱导的核酸沉淀方法，这种沉淀方法通常被称为“盐析(salting-out)”方法。核酸分离和/或纯化的另一实例包括使用核酸可以特异性或非特异性结合的磁性颗粒(magnetic particles)，然后使用一磁体来分离所述珠子，并从所述珠子中洗涤和洗脱核酸(例如参见美国专利号5,705,628)。在一些实施例中，上述分离方法之前可以进行酶消化步骤以帮助从样品中除去不需要的蛋白质，例如用蛋白酶K或其他类似蛋白酶进行消化(参见例如美国专利号7,001,724)。如果需要，可以在提取之前或之后将RNA酶抑制剂添加到样品中。对于某些细胞或样品类型，可能需要在方案中添加蛋白质变性/消化步骤。当在提取过程期间或之后将DNA和RNA一起分离时，可以采用进一步的步骤来将一者或两者从另一者分开地纯化。还可以产生述被提取的核酸的亚成分，例如通过大小、序列或其他物理或化学特征进行纯化。除了初始核酸分离步骤之外，核酸的纯化可以在后续操作之后进行，例如以除去过量或不需要的试剂、反应物或产物。

在一些实施例中，采用一或多种方法来富集(enrich)一或多种目标RNA种类(例如mRNA)和/或从样品中消耗不需要的RNA种类(例如rRNA、tRNA等)(例如体液样本)。例如，可以从样品中富集poly A尾端的RNA(例如mRNA)分子。Poly A尾端RNA可以使用常规方法分离，例如通过使用用聚(T)寡核苷酸功能化的磁珠(magnetic beads functionalized withpoly(T)oligonucleotides)，因此可以捕获poly A尾端的RNA。从poly A尾端的RNA制备定序资料库的优点在于，不会从总体RNA中回收不携带poly A尾端的RNA种类，例如rRNA，因此不会将其带入定序反应中。因此，从使用poly A尾端RNA产生的定序资料库获得的大多数序列对应于蛋白质编码mRNA，而其携带polyA尾端。在一些实施例中，使用本领域已知的方法(例如，使用末端转移酶(terminal transferase(，New England BioLabs，Ipswich，MA))将样品中的总体RNA加上poly A尾端，并使用本领域已知的一或多种方法，从样品中纯化。在一些实施例中，根据大小分离polyA尾RNA种类(例如，使用尺寸排阻色谱(size exclusionchromatography)，磁珠大小选择(例如，SPRIselect beads(Beckman Coulter))，或使用凝胶电泳)以将一RNA种类(例如mRNA)从其他RNA种类(例如rRNA和/或tRNA)分离。在一些实施例中，使用硫氰酸胍-苯酚-氯仿(guanidinium thiocyanate-phenol-chloroform，TRIzol，Thermo Fisher Scientific)或使用苯酚(phenol)提取和TCA/丙酮(TCA/acetone)沉淀提取总体RNA，随后使用尺寸排阻色谱法进行分离。

在一些实施例中，从样品中去除(deplete)一或多种目标核酸(例如rRNA)。通过“去除(deplete)”一目标核酸，意指相对于总核酸降低样品中不需要的核酸类型(例如，核醣体RNA(rRNA)或其一或多种特定亚型)的百分比。在一些实施例中，在去除目标核酸后，与样品中目标核酸的初始量相比，目标核酸的剩余百分比是20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更少，包括0.5％、0.1％、0.01％或更低。通过去除样品中的目标核酸，可以富集期望类型的核酸(例如，信使RNA(mRNA)、微RNA(miRNA)和/或任何其他期望类型的核酸)。根据某些实施例中，在目标核酸已被去除的样品中，富集所需类型的核酸，使得所需类型的核酸相对于样品中总核酸的量增加5％以上、10％以上、25％以上、30％以上、40％以上、50％以上、60％以上、70％以上、包括80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、和99.5％或更多。去除的目标核酸可以是由本发明方法的实施者所选择的任何目标核酸。在一些实施例中，目标核酸是核糖核酸(RNA)。去除的目标RNA可以是任何类型的RNA(或其亚型)，包括但不限于核醣体RNA(rRNA)、微RNA(miRNA)、信使RNA(mRNA)、转移RNA(tRNA)、小核仁RNA(small nucleolar RNA，snoRNA)、小核RNA(small nucleolar RNA，snRNA)、长非编码RNA(long non-coding RNA，lncRNA)、非编码RNA(non-coding RNA，ncRNA)、小干扰RNA(small interfering RNA，siRNA)、交易小干扰RNA(transacting small interfering RNA，ta-siRNA)、天然小干扰RNA(natural small interfering RNA，nat-siRNA)、转移信使RNA(transfer-messengerRNA，tmRNA)、前体信使RNA(precursor messenger RNA，pre-mRNA)、小Cajal体特异性RNA(small Cajal body-specific，scaRNA)、piwi相互作用RNA(piwi-interacting RNA，piRNA)、内切核糖核酸酶制备的siRNA(endoribonuclease-prepared siRNA，esiRNA)、小暂时RNA(small temporal RNA，stRNA)、信号识别RNA(signal recognition RNA)、端粒RNA(telomere RNA)、核酶(ribozyme)，及其RNA类型或其亚型的任何组合。通常，本领域已知的任何合适的方法可用于去除目标RNA(例如rRNA)。例如，一种市售产品是RiboZero(Illumina，San Diego，CA)，其使用rRNA的长链的生物素化转录物(long biotinylatedtranscripts of rRNA)作为探针，其与初始RNA组合物中存在的rRNA杂交。使用链霉抗生物素(streptavidin beads)蛋白珠除去所得杂合分子。由此，获得rRNA去除的样品。在一些实施例中，使用NEBNext Ultra(New England BioLabs，Ipswich，MA)去除rRNA。在一些实施例中，使用***依赖性衔接子切割(Insert Dependent Adapter Cleavage，InDA-C)或AnyDeplete(NuGEN，San Carlos，CA)去除一或多种目标核酸(例如rRNA)。在一些实施例中，使用ZapR(Clontech，Mountain View，CA)去除一种或多种目标核酸(例如rRNA)。

在一些实施例中，本文所述的方法涉及在没有细胞提取的情况下从一对象的样品中操纵多核苷酸(例如，没有裂解细胞、病毒和/或包含核酸的其他囊体的步骤)，所述多核苷酸也被称为作为“无细胞(Cell-free)”多核苷酸(例如无细胞DNA(cfDNA)和无细胞RNA(cfRNA))。在一些实施例中，DNA和RNA在收集时直接在生物样品中操作。在一些实施例中，将无细胞多核苷酸与样品的其他组分(例如细胞和/或蛋白质)分离，而不进行释放可能存在于样品细胞所包含的多核苷酸的处理。对于包含细胞的样品，可以处理样品以从样品中分离细胞。在一些实施例中，对样品进行离心，并分离包含无细胞多核苷酸的上清液，用于进一步处理(例如，将多核苷酸与其他组分分离，或对多核苷酸进行其他操作)。在一些实施例中，从初始样品的其他组分(例如细胞和/或蛋白质)中纯化无细胞多核苷酸。可以使用多种用于分离多核苷酸而不进行细胞提取的方法，例如通过沉淀或非特异性结合至一基质(substrate)，然后洗涤基质(substrate)以释放所结合的多核苷酸。

在一些实施例中，一标签寡核苷酸与样品的RNA或由其衍生的多核苷酸(例如cDNA)连接。在一些实施例中，标签寡核苷酸与样品的DNA和RNA分子或由其衍生的多核苷酸(例如cDNA)连接。在一些实施例中，标签寡核苷酸是约，或至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100或更多的核苷酸长度，或任何介于这些之间的长度。在一些实施例中，标签寡核苷酸的长度小于约100、90、80、70、60、50、40、30、20、15或更少的核苷酸长度。标签寡核苷酸可以是单链或双链的。在一些实施例中，所述标签寡核苷酸是单链的。通常，标签寡核苷酸包含一标签序列(也称为“条码(barcode)”)，其鉴别包含标签序列或其互补序列的多核苷酸的来源(或来源特征)。例如，标签序列的存在可以识别样品来源的对象、细分的样品的特定部分、多个反应中的特定反应、在相连的多核苷酸序列所衍生的样品中核酸类型(例如从DNA中区分RNA)、或任何或所有上述的组合。在一些实施例中，标签序列的长度为约，或至少约3、4、5、6、7、8、9、10、11、12、13、14、15或更多个核苷酸长度，或者藉于其之间的任何长度。在一些实施例中，标签序列的长度小于约15、14、13、12、11、10、9、8、7、6、5或更少的核苷酸。根据一实施例的标签寡核苷酸的实例说明(在一些实施例中称为“通用连接衔接子(universal ligation adapter)”)显示于图5A中。

在一些情况下，例如将一标签寡核苷酸添加到来自于样品的RNA(或其衍生物，例如cDNA)但不添加到来自于样品的DNA(或其衍生物，例如扩增产物)的情况下，仅仅存在足以鉴别核酸类型的标签序列。在这种情况下，所述序列标签的精确序列不需要是已知的，并且可以是随机的或部分随机的(例如，在一或多个位置从一组的两个或更多个不同核苷酸中随机选择一或多个核苷酸，其中在包含所述随机序列的一寡核苷酸库中所表示的一或多个位置处，选择所述不同的核苷酸的各者)。如果所述标签序列包含一随机序列，则可以通过分析与标签序列相连的序列的一或多个附加特征来检测标签序列的存在(例如可以存在于标签寡核苷酸中的其他元件的序列、部分随机序列的固定位置、或在定序读数结束时，与一参考序列比对，鉴别预期长度在预期近似位置的序列偏差)。

在一些实施例中，标签序列是一预定序列。在根据标签序列的存在所确定唯一特征是多核苷酸类型(例如，其中存在表明序列对应于来自样品的RNA的序列)的情况下，包含相同标签序列的标签寡核苷酸可以结合至来自多个不同的样品、部分或反应的多核苷酸。如果根据标签序列来区分两种或更多种不同的样品、部分或反应，则标签序列优选地在两种或更多种不同的样品、部分或反应之间是不同的。在一些实施例中，标签序列具有足够的长度并且包含足够不同的序列以允许根据与其相连的标签序列鉴别样品。在一些实施例中，多个标签序列中的各个标签序列与各个其他标签序列在多个(至少三个)的核苷酸位置上不同，例如至少3、4、5、6、7、8、9、10或更多核苷酸位置。多个标签序列可以在样品库中表示，每个样品包含多核苷酸，所述多核苷酸包含一或多个标签序列，所述标签序列与源自其他样品库的多核苷酸所包含的条码不同。在一些实施例中，本文的方法还包括根据所述目标多核苷酸所连接的标签序列，来鉴别多核苷酸所来自的样品。标签序列也可以包括在本文所述的其他多核苷酸中，例如扩增引物，以协助与来自多个不同样品的核酸的多重定序反应。

在一些实施例中，标签寡核苷酸除标签序列外还包含一个或多个序列元件。额外的元件的非限制性实例包括一或多个扩增引物粘合(annealing)序列或其互补序列、一或多个定序引物粘合(annealing)序列或其互补序列、在多个不同标签寡核苷酸或不同标签寡核苷酸的子集之间共享的一或多个共同序列(也称为作为“通用(universal)”序列)、一或多个限制酶识别位点、与一或多个目标多核苷酸突出端互补的一或多个突出端(overhangs)、一或多个探针结合位点(例如用于连接到定序平台，例如用于大规模平行定序的流动池(flow cell)，例如由Illumina，Inc开发的流动池)、一或多种独特的分子标识物(unique molecular identifier,UMI)、一或多种随机或近似随机的序列(例如，在一或多个位置从一组的两个或更多个不同核苷酸中随机选择一或多个核苷酸，其中在包含所述随机序列的一寡核苷酸库中所表示的一或多个位置处，选择所述不同的核苷酸的各者)及其组合。两个或更多个序列元件可以彼此不相邻(例如被一或多个核苷酸隔开)、彼此相邻、部分重迭或完全重迭。例如，扩增引物粘合序列也可以用作为定序引物黏合序列，并且/或者可以是存在于多种不同标签寡核苷酸中的共同序列。序列元件可位于3'端处或附近、5'端处或附近、或标签寡核苷酸内部。在一些实施例中，序列元件的长度为约或小于约3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个核苷酸。在一些实施例中，不同序列元件的长度彼此独立地选择，并且可以具有或不具有相同的长度。在一些实施例中，标签寡核苷酸包含1、2、3、4、5或更多个额外的序列元件。

在一些实施方案中，标签寡核苷酸包含独特的分子标识物。通常，独特的分子标识物是应用于多核苷酸或在多核苷酸中被识别的核苷酸序列，其可用于区别在初始反应中存在的各个核酸分子。由于独特的分子标识物用于区分不同的来源核酸分子，因此其被称为独特的分子标识物。在DNA定序反应中，独特的分子标识物可以与它们相连的DNA分子一起定序，以确定读取序列是否是一种来源核酸分子或另一种来源核酸分子。术语“独特的分子标识物(UMI)”在本文中用于指多核苷酸的序列信息和包含所述序列信息的物理性多核苷酸。通常，对单一来源分子的多个例子进行定序。在通过合成定序使用Ilumina定序技术的情况下，可以在递送至一流动池之前对来源分子进行PCR扩增。无论PCR是否扩增，应用于流动池的各个DNA分子可以被桥式(bridege)扩增或ExAmp扩增以产生一丛集。一丛集中的各个分子衍生自相同的来源核酸分子，但是分别定序。为了校正和其他目的，确定来自单一丛集的所有读数被识别为源自相同的源分子可能是有帮助的。独特的分子标识物允许这种分组。通过扩增或以其他方式复制以产生相应DNA分子的多个实例的核酸分子称为一来源核酸分子。通过将具有相同独特的分子标识物的序列彼此比较以产生共同序列，和/或通过比较具有不同独特的分子标识物的重迭序列，可以降低定序错误率。例如，相对于参考序列，与独特的分子标识物一同存在于部分读数中，但不是大多数或所有读数中的突变可以被忽略，因为其不是源核酸分子的真实表示。也可以通过要求在一或多个具有不同独特的分子标识物的定序读数中观察到以一UMI进行的定序读数中的任何明显突变，来增加确认真正突变的准确性，以便被接受为对应于来源核酸中存在的实际突变。通过组合方法可以进一步提高准确度，例如在UMI内部和之间进行比较，和/或在多个不同的UMI之间进行比较，UMI的其他实例及其用途在例如US20160319345中提供，其通过引用并入本文。

通常，本文所用的术语“连接(joining,ligation)”涉及两种多核苷酸，例如标签寡核苷酸和目标多核苷酸(例如来自样品的RNA，或相应的cDNA)，指两个独立多核苷酸的共价连接以产生具有连续骨架的单一更长的多核苷酸。可以使用多种连接两种多核苷酸的方法，包括但不限于酶促和非酶促(例如化学)方法。非酶促的连接反应的实例包括美国专利号5,780,613和5,476,930中描述的非酶促连接技术，在此引入作为参考。在一些实施例中，标签寡核苷酸通过连接酶(ligase，例如DNA连接酶或RNA连接酶)与目标多核苷酸连接。多个连接酶，各自具有表征的反应条件，是本领域已知的，包括但不限于NAD+依赖性连接酶(NAD+-dependent ligases)，包括tRNA连接酶、Taq DNA连接酶、Thermus filiformis DNA连接酶、大肠杆菌DNA连接酶、Tth DNA连接酶、Thermus scotoductus DNA连接酶(I和II)、热稳定连接酶、Ampligase thermostable DNA连接酶、VanC型连接酶、9°N DNA连接酶、TspDNA连接酶和通过生物勘探发现的新型连接酶；ATP依赖性连接酶包括：T4 RNA连接酶、T4 DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、Pfu DNA连接酶、DNA连接酶I、DNA连接酶III、DNA连接酶IV和通过生物勘探发现的新型连接酶；和野生型、突变体同种型及其基因工程变体。在一些实施例中，连接酶是一RNA连接酶。RNA连接酶的实例包括但不限于T4 RNA连接酶、T4RNA连接酶2、TS2126RNA连接酶1和热自养甲烷杆菌RNA连接酶1(Methanobacteriumthermoautotrophicum RNA ligase 1，Mth RNA连接酶)。在一些实施例中，连接包括使用adapase(Swift Biosciences)或Thermostable 5'App DNA/RNA连接酶(New EnglandBioLabs)。在一些实施例中，连接反应优选使用单链DNA连接酶将标签寡核苷酸连接至单链cDNA。单链DNA连接酶的实例包括但不限于TS2126 RNA连接酶、T4 DNA连接酶、T3 DNA连接酶和Mth RNA连接酶。在一些实施例中，单链DNA连接酶是经历有利于连接至单链cDNA的反应条件的任何DNA连接酶。例如，可以使用具有已知5'端序列的引物在反转录反应中产生cDNA，然后在cDNA和标签寡核苷酸之间连接，其中两者之间的连接是通过包含第一序列的一桥接寡核苷酸进行桥接，所述第一序列与所述引物的5'端序列互补，所述引物的5'端序列与一第二序列相邻，所述第二序列与标签寡核苷酸的3'端互补。因此，所述桥寡核苷酸在两个单链多核苷酸的连接处产生双链DNA的一局部区域。

在一些实施例中，连接在具有可杂交序列的多核苷酸之间，例如互补突出端(overhang)。在一些实施例中，连接在两个平端(blunt ends)之间。在一些实施例中，优选地连接在标签寡核苷酸和RNA之间，或在标签寡核苷酸和单链cDNA之间。通常，在连接反应中使用5'磷酸。5'磷酸可以由目标多核苷酸、标签寡核苷酸或两者提供(例如，如在目标多核苷酸的两端连接的情况)。根据需要，可以将5'磷酸加入到待连接的多核苷酸中或从中除去。添加或除去5'磷酸的方法是本领域已知的，包括但不限于酶促和化学过程。可用于添加和/或去除5'磷酸的酶包括激酶(kinase)、磷酸酶(phosphatases)和聚合酶(polymerase)。在一些实施例中，在连接之前除去5'磷酸。在一些实施例中，在连接之前除去3'磷酸。在一些实施例中，将标签寡核苷酸添加至目标多核苷酸的两端，其中每个末端的一或两条链与一或多个衔接子寡核苷酸连接。在一些实施例中，使用包含针对各个样品的至少一种不同标签序列的不同标签寡核苷酸，对不同样品进行分离的连接反应，使得标签序列不与多于一待并行分析的样品的目标多核苷酸连接。

在一些实施例中，例如在将标签寡核苷酸连接至RNA之前，或在反转录之前，使RNA进行片段化。在一些实施例中，所述片段具有小于预定义的长度或在预定义的长度范围内的平均长度，中间值长度或长度分数分布(例如占至少50％、60％、70％、80％、90％或更多)。在一些实施例中，预定长度为约1500、1000、800、600、500、300、200或100个核苷酸长度或小于约1500、1000、800、600、500、300、200或100个核苷酸。在一些实施例中，预定义的长度范围是10至1000、10至800、10至500、50至500、90至200或50至150个核苷酸长度的范围。在一些实施例中，片段化的RNA具有在预定范围内的平均大小(例如，长度为约10至约1,000个核苷酸的平均或中间值长度，例如10至800、10至500、50至500、90至200或50至150个核苷酸；或平均或中间值长度小于1500、1000、750、500、400、300、250或更少的核苷酸长度)。在一些实施例中，使RNA片段化包括使RNA和DNA经受优先使RNA片段化的条件，例如其中RNA被片段化但DNA为稳定的碱性条件。在一些实施例中，使RNA片段化包括超声处理、化学片段化或加热。在一些实施例中，RNA种类是样品中最长的多核苷酸种类，由于较长种类发生片段化事件的可能性较高，尽管如此可能会使较长DNA***的条件优先使RNA片段化。

可获得各种片段化方法，本文提供了其非限制性实例。在一些实施例中，使用碱性条件将完整RNA片段化，例如在升高的温度(例如55℃)下在NaOH(例如50毫摩尔浓度NaOH)中温育的一段合适的时间(例如10-30分钟)，如Liu等人所述(应用与环境微生物学Appliedand Environmental Microbiology，2007 73：73-82)。在一些实施例中，所述片段化是金属离子催化的，因此完整的RNA与金属离子一起温育，例如镧系(lanthanide series)元素离子或二价金属离子，如Mg²⁺或Zn²⁺(例如浓度为5至200毫摩尔浓度)在升高的温度(例如在50℃至95℃的范围内)持续一段合适的时间(例如1分钟至1小时)，如例Brown等人所著(美国化学会志J.Am.Chem.Soc.2002 124：7950-7962)。例如Liu所述，通过在25毫摩尔浓度的Tris-HCl(pH 7.4)中与10毫摩尔浓度硫酸锌(ZnSO₄)或氯化锌(ZnCl₂)在60℃下孵育30分钟可以使RNA片段化，如上所述。在一些实施例中，将RNA与10毫摩尔浓度ZnCl₂在10毫摩尔浓度Tris-HCl(pH＝7)中以70℃温育15分钟，以产生长度为60至200个碱基的片段。在一些实施例中，RNA在40毫摩尔浓度Tris-乙酸盐(pH＝8.1)中与100毫摩尔浓度KOAc和30毫摩尔浓度MgOAc以75℃温育20至30分钟。如Mehlmann等人所述，可以获得长度通常在38和150个碱基之间的片段(分析生物化学Analytical Biochemistry 2005 347：316-323)。可以根据需要改变温育期和/或试剂浓度以增加或减少所获得的片段的长度。

由于使用上述方法的片段化非特异性地发生在整个RNA的大致随机位置，并且因为较长的RNA分子含有更多可能发生片段化的位点，所以在每个分子基础上更长的RNA中更常发生片段化。例如，将RNA片段化成为长度为60至200个碱基片段的片段化条件平均应该在大约15至50个位点处将长度为3kb的RNA分子片段化，而对于大约18至30个核苷酸长度的小RNA则没有太多片段化。因此将含有长RNA分子和短多核苷酸(例如RNA和/或DNA分子)的RNA样品片段化产生片段化的样品，其包含：a)长的RNA分子的片段和b)基本上完整的短的多核苷酸。因此，片段化可以在寡核苷酸存在下进行，寡核苷酸足够短，在片段化过程中不会被片段化。还可以调节条件以产生特定大小范围内的片段，其没有将低于特定长度(例如小于长度约为500,400,300,200,100或更少的核苷酸)的多核苷酸片段化或基本上没有片段化(例如小于20％、10％、5％、1％或更少的片段化)。

在一些实施例中，所述方法还包括使被片段化的RNA的3'端去磷酸化。在一些实施例中，所述标签寡核苷酸与RNA的3'端连接。

在一些实施例中，RNA在反转录(RT)反应中被反转录。在一些实施例中，反转录在连接标签寡核苷酸的步骤之前进行，例如将标签寡核苷酸连接到cDNA或其扩增产物。在一些实施例中，在连接标签寡核苷酸的步骤之后进行反转录。通常，反转录包括通过RNA依赖性DNA聚合酶(RNA-dependent DNA polymerase，也称为“反转录酶(reversetranscriptase)”来延伸与目标RNA杂交的寡核苷酸引物，使用目标RNA分子作为模板以产生互补DNA(cDNA)。反转录酶的实例包括但不限于反转录病毒反转录酶(例如Moloney鼠白血病病毒(Moloney Murine Leukemia Virus，M-MLV)、禽成髓细胞病病毒(AvianMyeloblastosis Virus，AMV)或劳氏肉瘤病毒(Rous Sarcoma Virus，RSV)反转录酶)、Superscript ITM、Superscript IITM、Superscript III TM、反转录转座子逆转录酶(retrotransposon reverse transcriptase)、乙型肝炎逆转录酶(hepatitis B reversetranscriptase)、花椰菜花叶病毒逆转录酶(cauliflower mosaic virus reversetranscriptase)、细菌反转录酶及其突变体、变体或衍生物。在一些实施例中，反转录酶是热启动反转录酶。

用于反转录反应的寡核苷酸引物在本文中称为“RT引物”。在一些实施例中，RT引物为约或至少约10、15、20、25、30、35、40、45、50。长度为55、60、65、70、75、80、90、100或更多个核苷酸，或者任何这些之间的长度。在一些实施例中，RT引物的长度小于约100、90、80、70、60、50、40、30、20、15或更少的核苷酸。在一些实施例中，RT引物的长度为5至50、10至35或15至25个核苷酸。RT引物通过RNA与RT引物中的互补序列之间的碱基互补性与RNA反向转录。在一些实施例中，RT反应包含一或多个RT引物，其中互补序列是预定义的，例如当想侦测特定目标(例如一或多个基因)或特定类别的目标(例如mRNA，通过互补性以poly-A尾端为目标时)。在一些实施例中，多个不同的RT引物(每个具有不同的预定义互补序列)存在于单一反应中，使得多个相应的RNA目标分子被反转录。例如RT反应可包含约或至少约2、5、10、15、20、25、30、40、50、75、100、150、200、300、400、500或更多种不同的RT引物。在一些实施例中，互补序列包含随机或部分随机序列(例如，在一或多个位置从一组的两个或更多个不同核苷酸中随机选择一或多个核苷酸，其中在包含所述随机序列的一寡核苷酸库中所表示的一或多个位置处，选择所述不同的核苷酸的各者)。在一些实施例中，RT引物的互补序列长度为约，或至少约3、4、5、6、7、8、9、10、11、12、13、14、15或更多个核苷酸，或其中任何一者之间的长度。在一些实施例中，互补序列的长度小于约15、14、13、12、11、10、9、8、7、6、5或更少的核苷酸。在一些实施例中，互补序列是随机六聚体或随机九聚体。

在一些实施例中，RT引物除互补序列外还包含一或多个序列元件。其他元件的非限制性实例包括一或多个扩增引物粘合(annealing)序列或其互补序列、一或多个定序引物粘合(annealing)序列或其互补序列、在多个不同标签寡核苷酸或不同标签寡核苷酸的子集之间共享的一或多个共同序列(也称为作为“通用(universal)”序列)、一或多个限制酶识别位点、与一或多个目标多核苷酸突出端互补的一或多个突出端(overhangs)、一或多个探针结合位点(例如用于连接到定序平台，例如用于大规模平行定序的流动池(flowcell)，例如由Illumina，Inc开发的流动池)、一或多种独特的分子标识物(uniquemolecular identifier,UMI)、一或多种随机或近似随机的序列及其组合。两个或更多个序列元件可以彼此不相邻(例如被一或多个核苷酸隔开)、彼此相邻、部分重迭或完全重迭。例如，扩增引物粘合序列也可以用作为定序引物粘合序列，并且/或者可以是存在于多种不同标签寡核苷酸中的共同序列。序列元件可位于3'端处或附近、5'端处或附近、或标签寡核苷酸内部。在一些实施例中，序列元件的长度为约或小于约3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个核苷酸。在一些实施例中，不同序列元件的长度彼此独立地选择，并且可以具有或不具有相同的长度。在一些实施例中，标签寡核苷酸包含1、2、3、4、5或更多个额外的序列元件。在一些实施例中，RT引物包含一或多种化学修饰、一或多种标记、或这些的组合。例如，标记可以包含通过一切割位点与所述RT引物连接的一结合对的成分。

在一些实施例中，RT反应包含模板转换寡核苷酸(template switcholigonucleotide，TSO)。通常TSO是寡核苷酸，其用为一第二模板用以延伸一多核苷酸，所述多核苷酸首先沿第一模板(例如RT反应中的RNA模板)延伸。在一些实施例中，TSO在延伸反应沿第一模板完成延伸之前替换所述第一模板。在一些实施例中，沿着所述第一模板的延伸到达第一模板的5'端之后，继续进行沿着TSO的延伸。在一些实施例中，TSO为约或至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100或更多个核苷酸长度，或任何这些之间的长度。在一些实施例中，TSO的长度小于约100,90,80,70,60,50,40,30,20,15或更少的核苷酸。为了作为第二模板，通过待延伸的多核苷酸和TSO中的互补序列之间的碱基互补性，TSO与待延伸的多核苷酸杂交。在一些实施例中，TSO互补序列包含确定的序列，例如与一确定序列互补的序列，所述确定序列在沿第一模板延伸的多核苷酸的3'端(为了达到这个例子的目的，称为“初始延伸产物(initial extension product)”。初始延伸产物可包含一确定序列，由所涉及的聚合酶的末端转移酶活性所产生。例如，RT反应可以包含具有末端转移酶活性的反转录酶(例如M-MLVRT)，使得一同源核苷酸延伸(例如一同源三核苷酸(homo-trinucleotide)，例如CCC)被添加到初始延伸产物的3'端。TSO的互补序列包括一同源核苷酸段(例如一同源三核苷酸，例如GGG)，其与通过末端转移酶活性所添加的同源核苷酸段互补。作为另一实例，可以操纵具有确定的5'端(例如5'帽结构)的RNA种类，以在5'端添加确定的序列，其可以用作为一确定序列，而一确定的TSO互补序列杂交于所述确定序列。在一些实施例中，TSO互补序列是被称为“通用转换引物(universal switch primer)”的确定序列，并且与一序列互补，所述序列对于多种不同RNA是共同的(例如通过末端转移酶活性添加的共同序列)。在一些实施例中，TSO互补序列的长度为约，或小于约3、4、5、6、7、8、9、10、15、20或更多个核苷酸，或任何这些之间的长度。在一些实施例中，TSO包含3'端，其在其作为延伸模板的条件下不能被延伸。

在一些实施例中，所述TSO除互补序列外还包含一或多个序列元件。其他元件的非限制性实例包括一或多个扩增引物粘合(annealing)序列或其互补序列、一或多个定序引物粘合(annealing)序列或其互补序列、在多个不同标签寡核苷酸或不同标签寡核苷酸的子集之间共享的一或多个共同序列(也称为作为“通用(universal)”序列)、一或多个限制酶识别位点、与一或多个目标多核苷酸突出端互补的一或多个突出端(overhangs)、一或多个探针结合位点(例如用于连接到定序平台，例如用于大规模平行定序的流动池(flowcell)，例如由Illumina，Inc开发的流动池)、一或多种独特的分子标识物(uniquemolecular identifier,UMI)、一或多种随机或近似随机的序列及其组合。两个或更多个序列元件可以彼此不相邻(例如被一或多个核苷酸隔开)、彼此相邻、部分重迭或完全重迭。例如，扩增引物粘合序列也可以用作为定序引物粘合序列，并且/或者可以是存在于多种不同标签寡核苷酸中的共同序列。序列元件可位于3'端处或附近、5'端处或附近、或标签寡核苷酸内部。在一些实施例中，序列元件的长度为约或小于约3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个核苷酸。在一些实施例中，不同序列元件的长度彼此独立地选择，并且可以具有或不具有相同的长度。在一些实施例中，标签寡核苷酸包含1、2、3、4、5或更多个额外的序列元件。有关TSO和包含TSO的反应的一般示例，请参阅例如美国专利号9,410,173。TSO的一示例图示是根据图5B的实施例显示。

典型的RT反应的直接产物是RNA-DNA杂合分子，其包含模板RNA(和可选择的TSO)，其与由引物延伸产生的cDNA杂交。在一些实施例中，使所述RNA-DNA杂合体变性，并且/或者作为RT反应的一部分或者在RT反应之后，降解RNA模板。例如，可以在降解RNA的酶(例如RNase A)存在下使RNA-DNA杂合体变性。在一些实施例中，通过使用具有这种活性的酶(例如RNase H)使RNA-DNA杂合分子的RNA降解，而不使复合物变性。在一些实施例中，RT反应中的反转录酶包含RNA酶H活性。

在一些实施例中，本文提供的方法包括扩增DNA(例如来自样品的DNA和/或来自样品的RNA的cDNA)。在一些实施例中，扩增反应是制备定序资料库的过程的一部分。有多种扩增方法可供选择，其选择可能取决于诸如所用定序平台类型等因素。扩增反应的实例包括热循环反应和等温反应。通常，扩增反应包括引物延伸反应。一般用于目标多核苷酸的引物引导扩增方法在本领域是已知的，并且包括但不限于根据聚合酶链锁反应(PCR)的方法。通常有利于以PCR扩增目标序列的条件已经更表征了，并且可以在所述过程的各个步骤中进行优化，以及可以取决于反应中元素的特征，例如目标类型、目标浓度、待扩增的序列长度、目标序列以及/或者一或多个引物的序列、引物长度、引物浓度、使用的聚合酶、反应体积、一或多种元素与一或多种其他元素的比例，其中部分或全部可以被改变。通常PCR涉及使待扩增的目标(如果是双链)变性的步骤、一或多种引物与目标模板杂交的步骤，以及通过DNA聚合酶延伸引物的步骤。可以重复(或“循环”)这些步骤以进一步扩增目标序列。可以针对各种结果优化所述过程中的步骤，例如提高产率，减少假产物的形成，以及/或者增加或降低引物黏合(annealing)的特异性。优化的示例性方法包括但不限于对扩增反应中元素的类型或量的调整和/或对所述过程中特定步骤的条件的调整，例如特定步骤的温度、特定步骤的持续时间和/或循环次数。在一些实施例中，扩增反应包括单一引物延伸步骤。在一些实施例中，扩增反应包含至少5、10、15、20、25、30、35、50或更多个循环。在一些实施例中，扩增反应包含不超过5、10、15、20、25、35、50或更多个循环。循环可包含任何合适数量的步骤，例如1、2、3、4、5、6、7、8、9、10或更多步骤。步骤可包括适合于实现给定步骤目的的任何温度或温度梯度，包括但不限于链的变性、引物粘合和引物延伸。步骤可以是任何合适的持续时间，包括但不限于约，或小于约1、5、10、15、20、25、30、35、40、45、50、55、60、70、80、90、100、120、180、240、300、360、420、480、540、600或更多秒，包括无限时间直到手动中断。

DNA也可以贝等温扩增。SPIA是一线性等温扩增方法的一实例，其示例性描述可以在美国专利号6,251,639中找到，所专利通过引用结合在此。通常所述方法包括将嵌合RNA/DNA扩增引物与探针或目标杂交。探针的DNA部分是以3'端至RNA。在引物与模板杂交后，用DNA聚合酶延伸引物。随后，用酵素，从复合引物上将RNA切下，所述酵素从RNA/DNA杂合分子切割RNA。随后将额外的RNA/DNA嵌合引物与模板杂交，使得所述第一延伸引物从目标探针被置换。重复延伸反应，由此产生多个复制的探针序列。

用于DNA扩增反应的寡核苷酸引物在本文中通常称为“扩增引物”或简称为“引物”。在一些实施例中，扩增反应中的所有引物具有相同的序列，使得仅有一种类型引物参与反应。在一些实施例中，特别是在指数扩增的情况下，扩增反应包含一对或多对引物，其中所述对的一引物进行杂交，沿着一初始模板延伸，并且第二引物进行杂交并沿着所述初始模板的互补炼延伸以及/或者沿着所述对中第一引物的延伸产物延伸。在一些实施例中，引物为约或至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、150或更多核苷酸的长度，或任何这些之间的长度。在一些实施例中，引物的长度小于约150、100、90、80、70、60、50、40、30、20、15或更少的核苷酸。在一些实施例中，引物的长度为5至100、10至75或15至50个核苷酸。引物通过模板DNA和引物中的互补序列之间的碱基互补性与待扩增的DNA模板杂交。在一些实施例中，扩增反应包含一或多个引物，其中互补序列是预定义的，例如当期望扩增特定目标(例如一或多个基因)或特定类别的目标(例如包含所定义的序列元件的DNA和/或cDNA，例如包含在标签寡核苷酸，RT引物，TSO或定序衔接子中的序列元件)时。在一些实施例中，多个不同的引物，每个具有不同的预定义互补序列，存在于单一反应中，使得多个相应的RNA目标分子被反转录。例如，扩增反应可包含约或至少约2、5、10、15、20、25、30、40、50、75、100、150、200、300、400、500或更多种不同的引物。在一些实施例中，互补序列包含随机或部分随机序列(例如，在一或多个位置从一组的两个或更多个不同核苷酸中随机选择一或多个核苷酸，其中在包含所述随机序列的一寡核苷酸库中所表示的一或多个位置处，选择所述不同的核苷酸的各者)。在一些实施例中，引物的互补序列是约，或至少约3、4、5、6、7、8、9、10、11、12、13、14、15、20、25或更多个核苷酸长度，或任何这些之间的长度。在一些实施例中，互补序列的长度小于约20、15、14、13、12、11、10、9、8、7、6、5或更少的核苷酸。在一些实施例中，互补序列通过与标签寡核苷酸和/或RT引物(例如引物黏合序列(primer annealing sequence))连接而与待扩增的模板中存在的序列元件互补。

在一些实施例中，一扩增引物除互补序列外还包含一个或多个序列元件。额外的元件的非限制性实例包括一或多个扩增引物粘合(annealing)序列或其互补序列、一或多个定序引物粘合(annealing)序列或其互补序列、在多个不同标签寡核苷酸或不同标签寡核苷酸的子集之间共享的一或多个共同序列(也称为作为“通用(universal)”序列)、一或多个限制酶识别位点、与一或多个目标多核苷酸突出端互补的一或多个突出端(overhangs)、一或多个探针结合位点(例如用于连接到定序平台，例如用于大规模平行定序的流动池(flow cell)，例如由Illumina，Inc开发的流动池)、一或多种独特的分子标识物(unique molecular identifier,UMI)、一或多种随机或近似随机的序列(例如，在一或多个位置从一组的两个或更多个不同核苷酸中随机选择一或多个核苷酸，其中在包含所述随机序列的一寡核苷酸库中所表示的一或多个位置处，选择所述不同的核苷酸的各者)及其组合。两个或更多个序列元件可以彼此不相邻(例如被一或多个核苷酸隔开)、彼此相邻、部分重迭或完全重迭。例如，扩增引物粘合序列也可以用作为定序引物粘合序列，并且/或者可以是存在于多种不同标签寡核苷酸中的共同序列。序列元件可位于3'端处或附近、5'端处或附近、或标签寡核苷酸内部。在一些实施例中，序列元件的长度为约或小于约3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个核苷酸。在一些实施例中，不同序列元件的长度彼此独立地选择，并且可以具有或不具有相同的长度。通常，在反应之前由DNA扩增反应产生的DNA(无论是单链还是双链)在反应后是双链的，除非随后使双链扩增产物变性。

在一些实施例中，对来自样品的DNA，来自样品的RNA和/或任何这些的扩增产物的cDNA进行定序，以产生定序读数，其鉴别定序的多核苷酸或其互补序列中存在的核苷酸的顺序。有多种合适的定序技术可供选择。在一些实施例中，定序包括对大约或至少大约10000、100000、500000、1000000或更多个DNA分子进行大规模平行定序，其使用合成过程的高通量定序，例如Illumina的合成定序和基于可逆终止子(reversible terminator-based)的定序化学(例如，如Bentley等所著，于自然期刊Nature 6：53-59(2009)中所述)。在一些实施例中，特别是当cfDNA包括在待定序的多核苷酸中时，DNA在定序之前未被片段化。通常，Illumina的定序过程包括将模板DNA附着到平面的光学透明表面上，寡核苷酸锚定在所述表面上。模板DNA被末端修复(end-repaired)以产生5'-磷酸化的钝端，并且Klenow片段的聚合酶活性用于将单一A碱基添加到钝端磷酸化的DNA的3'端。此添加过程制备了DNA，用于与寡核苷酸衔接子连接，所述寡核苷酸衔接子任选地在其3'端具有单一T碱基的突出端以提高连接效率。所述衔接子寡核苷酸与流动池(flow cell)锚定寡核苷酸互补。在限制性稀释条件下，将衔接子修饰的单链模板DNA添加到流动池中并通过与锚定寡聚物杂交而被固定。附着的DNA片段被延伸，并桥接扩增以产生具有数亿个丛集(cluster)的超高密度定序流动池，每个丛集包含模板的约1,000个相同复制。在一实施例中，模板DNA在进行丛集扩增之前使用PCR扩增，例如在上述方法中。在一些应用中，使用健全的四色DNA合成定序技术对模板进行定序，所述技术采用具有可去除荧光染料的可逆终止子。使用激光激发和全内反射光学器件实现高灵敏度荧光检测。将约数十至数百个碱基对的短序列读数与参考基因组比对，并使用专门开发的数据分析管道软件，来鉴别短序列读数与参考基因组的独特映射(unique mapping)。在完成第一次读取之后，可以原位(in situ)再生模板，以使得能够从片段的相对端进行第二次读取。因此，可以使用DNA片段的单端或成对末端定序。

另一非限制性示例性定序方法是Helicos True Single Molecule Sequencing(tSMS)技术的单分子定序技术(例如，如Harris T.D.等人所著，科学期刊Science 320：106-109(2008)中所述)。在一典型的tSMS过程中，将DNA样品切割成或以其他方式提供为约100至200个核苷酸的链，并将polyA序列添加至每条DNA链的3'端。通过添加荧光标记的腺苷核苷酸(adenosine nucleotide)标记每条链。然后将DNA链与流动池杂交，所述流动池含有数百万个固定在流动池表面的寡聚-T(Oligo-T)捕获位点。在一些实施例中，模板的密度为约1亿个模板/平方公分。然后将流动池加载到仪器中，例如HeliScope TM定序仪，并且激光照射流动池的表面，揭示每个模板的位置。CCD相机可以映射(mapping)流动池表面上模板的位置。然后将模板荧光标记切割并洗去。通过引入DNA聚合酶和荧光标记的核苷酸开始定序反应。寡聚-T(Oligo-T)核酸作为引物。聚合酶以一模板引导的方式，将标记的核苷酸掺入引物中。去除聚合酶和未掺入的核苷酸。通过对流动池表面成像，来识别已经被引导掺入荧光标记的核苷酸模板。成像后，一切割步骤除去了荧光标记，并用其他荧光标记的核苷酸重复所述过程，直到达到所需的读取长度。使用每个核苷酸添加步骤来收集序列信息。通常通过单分子定序技术的全基因组定序，来排除或免于在定序文库的制备中基于PCR的扩增。

另一说明性但非限制性的定序方法是焦磷酸定序(pyrosequencing)，例如在454定序平台(Roche)中(例如Margulies,M等人所著，在期刊Nature 437：376-380(2005)中所述)。454定序通常涉及两个步骤。在第一步中，将DNA剪切成(或以其他方式提供，例如作为天然存在的cfDNA分子，或来自天然短的RNA分子的cDNA)为具有大约300至800个碱基对大小的DNA，并且所述多核苷酸是钝端的。然后将寡核苷酸衔接子连接到DNA的末端。衔接子作为DNA的扩增和定序的引物。例如可以使用衔接子B将DNA连接到捕获珠子上，衔接子B含有5'-生物素标签，例如炼霉抗生物素蛋白包被的珠子(streptavidin-coated beads)。附着在珠子上的DNA在油-水乳液的液滴中进行PCR扩增。结果是每个珠子上克隆扩增的DNA分子的多个复制。在第二步中，将珠子捕获在孔中(例如，皮升(picoliter)大小的孔)。对每个DNA分子平行进行焦磷酸定序。添加一或多个核苷酸产生了光信号，所述信号由CCD照相机在定序仪器中记录。信号强度与掺入的核苷酸数成比例。焦磷酸定序利用焦磷酸(pyrophosphate，PPi)，其在核苷酸添加时释放。在腺苷5'磷酸硫酸盐(adenosine 5’phosphosulfate)存在下，PPi被ATP硫酸化酶(ATP sulfurylas)转化为ATP。荧光素酶(luciferase)使用ATP将荧光素转化为氧化荧光素(oxyluciferin)，并且所述反应产生测量和分析的光。

进一步的高通量定序过程是可用的。非限制性实例包括通过连接(ligation)技术定序(例如Applied Biosystems的SOLiDTM定序)、单分子实时定序(例如，利用零模式波检测器的Pacific Biosciences定序平台)、纳米孔定序(例如，如Soni GV和Meller A.在临床化学期刊中所述Clin Chem 53：1996-2001(2007))、使用化学敏感场效应晶体管(例如，如美国专利申请公开号20090026082中所述)、Ion Torrent的定序平台(将半导体技术与定序化学配对，将化学编码信息(A，C，G，T)直接转换成半导体芯片上的数字信息(0,1)，以及通过杂交定序。关于定序技术的其他说明性细节可以在例如美国专利申请公开号2016/0319345中找到，其通过引用并入本文。

在使用UMI的一些实施例中，折叠(collapse)具有相同UMI的多个序列读数以获得一或多个共有序列(consensus sequence)，然后将其用于确定来源DNA或cDNA分子的序列。可以从相同来源DNA分子的不同实例产生多个不同的读数，并且可以比较这些读数以产生共有序列。可以通过在定序之前扩增来源DNA分子来产生实例，使得对不同的扩增产物进行不同的定序操作，每个扩增产物共享来源DNA分子的序列。当然，扩增可能引入错误，使得不同的扩增产物的序列具有差异。在本文的一些定序技术中，例如Illumina的合成定序的实施例，来源DNA分子或其扩增产物形成了与流动池区域连接的DNA分子丛集。所述丛集的多个分子共同提供一读数。通常，需要至少两次读数以提供共有序列。定序深度100,1000和10,000是在所公开的实施例中实用的定序深度的实例，用于产生低等位基因(allele)频率的共有读数(例如，约1％或更低)。在一些实施例中，在共有序列中包括在共享UMI或UMI组合的100％读数上一致的多个核苷酸。在一些实施例中，一致性标准(consensuscriterion)可低于100％。例如可以使用90％一致性标准，这意味着存在于所述组中90％或更多读数的碱基对包括在共有序列中。在一些实施例中，一致性标准可以设定为约，或大于约30％、约40％、约50％、约60％、约70％、约80％、约90％、约95％或约100％。

在一些实施例中，如果标签序列(或其互补序列)形成序列读数的一部分(任选地，在预期位置，以及/或者与其他预期序列元件相邻的其他物质)，则定序读数(或其共有序列consensus sequence)被鉴别为源自来源样品中的RNA分子，如果不存在标签序列(或其互补序列)，则鉴别为源自来源样品中的DNA分子。以这种方式，RNA定序读数和DNA定序读数可以在单一定序反应中产生，但是分开分析，并任选地彼此比较。在一些实施例中，使用处理器将RNA衍生的序列与DNA衍生的序列分开。例如，在一些实施例中，一突变相对于内部参考序列(例如重迭读数)或外部参考序列(例如参考基因组)，如果相同的突变在对应于另一种类型的原始分子(例如样品的一RNA分子)的一或多个读数中被鉴别，则所述突变仅被指定为准确地代表原始分子(例如样品的一DNA分子)。这对于在不使用UMI的情况下提高定序准确度特别有用，并且当与UMI组合使用时可以进一步提高定序准确度。在一些实施例中，为了定序读数之间和/或定序读数与参考序列之间的比对，在计算上忽略一或多个序列，所述一或多个序列对应于已知不存在于来源多核苷酸中的特征(例如已知源自标签寡核苷酸、RT引物、TSO或扩增引物的序列)(例如，在比对之前从读数中过滤掉)。

在一些实施例中，通过将读数与已知参考基因组比对来定位(localize或映射mapping)定序读数(或其共有序列)。在一些实施例中，通过k聚体共享(k-mer sharing)和读数与读比对来实现定位。在一些实施例中，参考基因组序列是NCBI36/hg18序列，其可在互联网上在网址genome.ucsc.edu/cgi-bin/hgGateway？org＝Human&db＝hg18&hgsid＝166260105中获得。在一些实施例中，参考基因组序列是GRCh37/hg19或GRCh38，其可在互联网上在网址genome.ucsc.edu/cgi-bin/hgGateway中获得。公开的序列信息的其他来源包括GenBank、dbEST、dbSTS、EMBL(欧洲分子生物学实验室)和DDBJ(日本的DNA数据库)。许多计算机演算法可用于比对序列，包括但不限于BLAST(Altschul等，1990)、BLITZ(MPsrch)(Sturrock&Collins，1993)、FASTA(Person&Lipman，1988)、BOWTIE(Langmead等，GenomeBiology 10：R25.1-R25.10[2009])或ELAND(Illumina，Inc.，San Diego，CA，USA)。在一些实施例中，对血浆多核苷酸分子(或其扩增产物)的克隆扩增复制的一端进行定序，并通过Illumina基因组分析仪(Genome Analyzer)的生物信息学比对分析进行处理，基因组分析仪(Genome Analyzer)使用核苷酸数据库的高效大规模比对(Efficient Large-ScaleAlignment of Nucleotide Databases，ELAND)软件。通过将读数与参考基因组比对，可以相对于参考序列，鉴别出突变的基因组位置。在一些情况下，比对将有助于推断突变的作用和/或其起源的细胞的性质。例如，如果突变在肿瘤抑制基因中产生未成熟的终止密码子(premature stop coden)，则可以推断来源多核苷酸源自癌细胞，特别是如果在定序读数中检测到统计学上显着数量的癌症相关标志物(markers)。

在一方面，本发明内容提供了对无细胞核酸进行定序的方法，所述无细胞来自包含单一生物样品的DNA和RNA。在一些实施例中，所述方法包括：步骤a：获得包括所述无细胞核酸的一样品；步骤b：通过延伸一引物反转录RNA，以产生多个cDNA/RNA杂合分子，其中所述引物通过一切割位点与一结合对的一第一成分共价连接；步骤c：通过将所述结合对的所述第一成分与包括所述结合对的一第二成分的一基质结合，将所述cDNA与所述DNA分离；步骤d：切割所述切割位点；并且步骤e：在所述分离步骤后，对所述cDNA和所述DNA进行定序。所述方法不同于在单一定序反应中将RNA衍生序列与DNA衍生序列区分的方面，因为RNA衍生物质(cDNA)在定序之前与源自样品的DNA分子物理分离。然而，这些不同方面在其他方面可以是类似的。例如，涉及本发明的其他方面的公开关于样品来源、多核苷酸来源(例如无细胞多核苷酸)、提取方法、分离或以其他方式操作无细胞多核苷酸的方法、标签寡核苷酸、UMI、连接多核苷酸的方法和组合物、片段化、逆转录、RT引物、TSO、DNA和cDNA的扩增、扩增引物、定序方法和用于分析定序读数的方法对于本发明的所术方面的各种实施例在此处也可应用。在一些实施例中，在反转录之前进行cDNA与DNA的分离。在一些实施案中，在反转录后进行cDNA与DNA的分离。

在一些实施例中，完全通过定序分开处理DNA和cDNA。在一些实施例中，cDNA和DNA在分离后以不同方式处理，使得它们可以在定序之前的某些点混合在一起，但仍然将定序读数区分为源自cDNA或源自样品DNA。例如在分离后，标签寡核苷酸可以与cDNA或DNA连接，或者将不同的标签寡核苷酸加到两者上，使得可以如上所述使用标签寡核苷酸(特别是标签序列)来区分RNA衍生序列和来自DNA衍生序列。

多种结合对(binding pairs)可用于将cDNA从源自样品的DNA中分离。通常，结合对由第一部分和第二部分组成，其中第一部分和第二部分彼此具有特异性结合亲和力。合适的结合对包括，但不限于，抗原/抗体(例如，地高辛/抗洋地黄毒苷(digoxigenin/anti-digoxigenin)、二硝基苯基(DNP)/抗DNP(dinitrophenyl(DNP)/anti-DNP)、丹磺酰基-X/抗丹酰(dansyl-X/anti-dansyl)、荧光素/抗荧光素(fluorescein/anti-fluorescein)、荧光黄/抗荧光黄(lucifer yellow/anti-lucifer yellow)、罗丹明/抗罗丹明(rhodamine/anti-rhodamine)、生物素/抗生物素蛋白((biotin/avidin)或生物素/链霉抗生物素蛋白(biotin/streptavidin))、钙调蛋白结合蛋白(CBP)/钙调蛋白(calmodulin bindingprotein(CBP)/calmodulin)、激素/激素受体(hormone/hormone receptor)、外源凝集素/碳水化合物(lectin/carbohydrate)、肽/细胞膜受体(peptide/cell membranereceptor)、蛋白A/蛋白A抗体(protein A/protein A antibody)、半抗原/抗半抗原(hapten/antihapten)、酶/辅因子(enzyme/cofactor)、和酶/底物(enzyme/substrate)。为了促进cDNA的物理分离，其包含一结合对的第一成份，结合对的第二成份通常与基质连接(例如通过共价键)。可能的基质包括但不限于玻璃、改性或功能化玻璃、塑料(包括丙烯酸树脂(acrylics)、聚苯乙烯(polystyrene)、苯乙烯(styrene)和其他材料的共聚物、聚丙烯(polypropylene)、聚乙烯(polyethylene)、聚丁烯(polybutylene)、聚氨酯(polyurethanes)、Teflon^TM等)、多醣(polysaccharides)、尼龙(nylon)、硝化纤维素(nitrocellulose)、陶瓷(ceramics)、树脂(resins)、二氧化硅(silica)、二氧化硅基材料(如硅(silicon)和改性硅)、碳、金属、无机玻璃、塑料、光纤束和各种其他聚合物。在一些实施例中，基质为珠子或其他小的离散颗粒的形式，其任选地为磁性或顺磁性(paramagnetic)，以通过施加磁场促进分离。

切割位点被切割的过程将取决于切割位点的性质。在一些实施例中，切割位点包含可用已知限制酶切割的限制性位点。在一些实施例中，切割位点包含尿嘧啶(uracil)核苷酸，在这种情况下，链可以在尿嘧啶碱基使用酶尿嘧啶DNA糖基化酶(UDG)被切割，其去除核苷酸碱基，并且内切核酸酶VIII切除的无碱基核苷酸。所述酶组合可从New EnglandBiolabs(NEB部件号M5505)以USER ^TM获得。切割位点的另一例子是8-氧鸟嘌呤核苷酸(8-oxoguanine nucleotide)，然后可被酶FPG(NEB部件号M0240，也称为8-氧鸟嘌呤DNA糖基化酶(8-oxoguanine DNA glycosylase))切割。在一些实施例中，切割位点是化学修饰的，例如具有二硫修饰或二醇修饰，其允许在切割位点处的化学切割。在一些实施例中，切割位点是RNA碱基，其是RNA酶H的切割基质。在一些实施例中，处理RNA-DNA杂合分子以降解RNA组分，例如通过变性和降解，或通过酵素降解，其特异性降解RNA-DNA杂合体中的RNA的酶降解(例如RNA酶H)，其实例在本文中描述，例如关于本发明的其他方面。

本文所述的任何方面涉及从样品的DNA和RNA获得定序信息，无论是通过区分RNA衍生序列与DNA衍生序列，或是分离cDNA与DNA、还是两者的某种组合，皆提供有价值的定序信息，所定序信息可用于确定衍生出多核苷酸的样品的一或多种特征。分析DNA和RNA增加了检测稀有突变的检测灵敏度。在一些实施例中，通过本文描述的方法检测的罕见突变是在原始样品中的多核苷酸中以约或小于约5％、4％、3％、2％、1.5％、1％、0.75％、0.5％、0.25％、0.1％、0.075％、0.05％、0.04％、0.03％、0.02％、0.01％、0.005％、0.001％或更低的频率表示的序列变体。在一些实施例中，序列变体以约0.1％或低于约0.1％的频率发生。在一些实施例中，序列变体以小于约0.05％的频率发生。突变或序列变体可以是关于一参考序列的任何变异。序列变异可以由单一核苷酸或多个核苷酸(例如2、3、4、5、6、7、8、9、10或更多个核苷酸)的改变化、***或缺失所组成。当序列变体包含两个或更多个核苷酸差异时，不同的核苷酸可以彼此邻接，或者是不连续的。序列变体类型的非限制性实例包括单核苷酸多态性(single nucleotide polymorphisms，SNP)、缺失/***多态性(eletion/insertion polymorphisms，DIP)、拷贝数变异体(copy number variants，CNV)、短串联重复序列(short tandem repeats，STR)、简单序列重复序列(simple sequence repeats，SSR)、可变数目的串联重复序列(variable number of tandem repeats，VNTR)、扩增片段长度多态性(amplified fragment length polymorphisms，AFLP)、基于反转录转座子的***多态性(retrotransposon-based insertion polymorphisms)、序列特异性扩增多态性(sequence specific amplified polymorphism)，以及表观遗传标记的差异(epigeneticmarks)，其可以被检测为序列变体(例如甲基化差异)。在一些实施例中，增加检定序列变体的的灵敏度有助于鉴别样品来源(例如，环境样品来自的地方)，污染物的存在(例如，食物或水样品中的微生物污染)或与一状况的存在或不存在相关遗传变体的存在(例如，一病况，例如癌症)。在一些实施例中，通过组合来自RNA衍生序列和DNA衍生序列的不同类型的信息来促进类似的检测确定。例如，以下两点的组合：(1)统计学上显着偏离参考表达水平的特定基因表达水平，和(2)当与这些信息中的任何一条相比，表达受影响的基因附近的染色体重排(gene rearrangement)可以增加所述来源目标受一特别状况(病况condition)影响的可能性。因此，来自分析样品的DNA序列和RNA序列的信息包括但不限于鉴别序列变体。

在一些实施例中，在任何各个方面，本发明的方法包括基于RNA衍生序列和DNA衍生序列，鉴别所述对象的病况的存在或不存在。通常，如果将这两种定序结果用于进行鉴别，则认为对象病况的鉴别是“基于”RNA衍生序列和DNA衍生的序列。例如，RNA衍生序列中的突变用于验证DNA衍生序列中的突变，并且所述突变的存在表示病状存在。如上所述，也可以使用除突变之外的考虑因素(例如与另一者组合，或与一突变的鉴别组合)。非突变考虑因素的非限制性实例包括表达水平和表观遗传修饰(epigenetic modifications)。因此，可以通过本发明的方法鉴别具有一遗传组分(并且不一定是突变的结果)的多种病况中的任何一种。

在一些实施例中，通过本发明的方法所检测的突变是与疾病相关的序列变体。一般而言，具有与疾病或性状相关的统计学、生物学和/或功能性证据的序列变体被称为“致病性遗传变体(causal genetic variants)”。单一致病性遗传变体可与多种疾病或性状相关联。在一些实施例中，致病性遗传变体可以与孟德尔性状、非孟德尔性状或两者相关联。致病性遗传变体可以表现为多核苷酸的变异，例如1、2、3、4、5、6、7、8、9、10、20、50或更多序列差异(例如在包含致病性遗传变体的多核苷酸与在相同的相对基因组位置上缺乏致病性遗传变体的多核苷酸之间)。可能与致病性遗传变异体相关的疾病和基因目标的实例包括但不限于21-羟化酶缺乏症(21-Hydroxylase Deficiency)、ABCC8相关的高胰岛素血症(ABCC8-Related Hyperinsulinism)、ARSACS、软骨发育不全(Achondroplasia)、全色盲(Achromatopsia)、腺苷一磷酸脱氨酶1(Adenosine Monophosphate Deaminase 1)、胼胝体伴随神经病变的发育不全(Agenesis of Corpus Callosum with Neuronopathy)、尿黑酸尿(Alkaptonuria)、Alpha-1-抗胰蛋白酶缺乏症(Alpha-1-Antitrypsin Deficiency)、Alpha-甘露糖症(Alpha-Mannosidosis)、Alpha-肌聚糖病(Alpha-Sarcoglycanopathy)、Alpha-Thalassemia(Alpha-地中海贫血)、阿兹海默症(Alzheimers)、血管紧张素II受体(Angiotensin II Receptor)I型(Type I)、载脂蛋白E基因分型(Apolipoprotein EGenotyping)、精胺丁二酸酵素缺乏(Argininosccicicaciduria)、天冬氨酰氨基尿酸症(Aspartylglycosaminuria)、共济失调与维生素E缺乏(Ataxia with Vitamin EDeficiency)、共济失调-毛细血管扩张(Ataxia-Telangiectasia)、自身免疫多发性内分泌综合征1型(Autoimmune Polyendocrinopathy Syndrome Type 1)、BRCA1遗传性乳腺癌/卵巢癌(BRCA1Hereditary Breast/Ovarian Cancer)、BRCA2遗传性乳腺癌/卵巢癌(BRCA2Hereditary Breast/Ovarian Cancer)、一种或多种其他类型的癌症(one or moreother types of cancer)、Bardet-Biedl综合征(Bardet-Biedl Syndrome)、最佳卵黄样神经营养不良(Best Vitelliform Macular Dystrophy)、β-肌聚糖病(Beta-Sarcoglycanopathy)、β-地中海贫血(Beta-Thalassemia)、生物素酶缺乏症(BiotinidaseDeficiency)、Blau综合征(Blau Syndrome)、Bloom综合征(Bloom Syndrome)、CFTR相关疾病(CFTR-Related Disorders)、CLN3相关神经元蜡样脂褐质沉积症(CLN3-RelatedNeuronal Ceroid-Lipofuscinosis)、CLN5相关神经元蜡样脂褐质沉积症(CLN5-RelatedNeuronal Ceroid-Lipofuscinosis)、CLN8相关神经元蜡样脂褐质沉积症(CLN8-RelatedNeuronal Ceroid-Lipofuscinosis)、天门冬氨酸酰基转移酶缺乏症(Canavan disease)、肉碱棕榈酰转移酶IA缺乏(Carnitine Palmitoyltransferase IA Deficiency)、肉碱棕榈酰转移酶II缺乏(Carnitine Palmitoyltransferase II Deficiency)、软骨-毛发发育不全(Cartilage-Hair Hypoplasia)、脑海绵状血管畸形(Cerebral CavernousMalformation)、无脉络脉畸型(Choroideremia)、Cohen综合征(Cohen Syndrome)、先天性白内障(Congenital Cataracts)、面部变形和神经病(Facial Dysmorphism Neuropathy)、先天性糖基化障碍(Congenital Disorder of Glycosylationla)、先天性糖基化障碍Ib(Congenital Disorder of Glycosylation Ib)、先天性芬兰肾病(Congenital FinnishNephrosis)、克罗恩病(Crohn’s Disease)、胱氨酸病(Cystinosis)、DFNA9(COCH)、糖尿病和听力丧失(Diabetes and Hearing Loss)、早发性原发性肌张力障碍(DYTI)(Early-Onset Primary Dystonia(DYTI))、大疱性表皮松解症Herlitz-Pearson型(EpidermolysisBullosa Junctional，Herlitz-Pearson Type)、FANCC-相关Fanconi贫血(FANCC-RelatedFanconi Anemia)、FGFR1相关的颅缝早闭(FGFR1-Related Craniosynostosis)、FGFR2相关的颅缝早闭(FGFR2-Related Craniosynostosis)、FGFR3相关的颅缝早闭(FGFR3-RelatedCraniosynostosis)、因子V Leiden血栓形成(Factor V Leiden Thrombophilia)、因子VR2突变血栓形成(Factor V R2Mutation Thrombophilia)、因子XI缺乏(Factor XIDeficiency)、因子XIII缺乏(Factor XIII Deficiency)、家族性腺瘤性息肉病(FamilialAdenomatous Polyposis)、家族性自主神经衰弱(Familial Dysautonomia)、家族性高胆固醇血症B型(Familial Hypercholesterolemia Type B)、家族性地中海热(FamilialMediterranean Fever)、游离唾液酸储存障碍(Free Sialic Acid Storage Disorders)、具有帕金森病的额颞叶痴呆-17(Frontotemporal Dementia with Parkinsonism-17)、富马酸酶缺乏症(Fumarase deficiency)、GJB2相关DFNA3非综合征性听力丧失和耳聋(GJB2-Related DFNA3Nonsyndromic Hearing Loss and Deafness)、GJB2相关DFNB 1非综合征性听力丧失和耳聋(GJB2-Related DFNB 1Nonsyndromic Hearing Loss and Deafness)、GNE相关性肌病(GNE-Related Myopathies)、半乳糖血症(Galactosemia)、戈谢病(GaucherDisease)、葡萄糖-6-磷酸脱氢酶缺乏(Glucose-6-Phosphate DehydrogenaseDeficiency)、1型谷氨酸血症(Glutaricacidemia Type 1)、1a型糖原贮积病(GlycogenStorage Disease Type1a)、1b型糖原贮积病(Glycogen Storage Disease Type 1b)、II型糖原贮积病(Glycogen Storage Disease Type II)、III型糖原贮积病(Glycogen StorageDisease Type III)、V型糖原贮积病(Glycogen Storage Disease Type V)、Gracile综合征(Gracile Syndrome)、HFE相关遗传性血色素沉着症(HFE-Associated HereditaryHemochromatosis)、Halder AIM、血红蛋白Sβ-地中海贫血(Hemoglobin S Beta-Thalassemia)、遗传性果糖不耐症(Hereditary Fructose Intolerance)、遗传性胰腺炎(Hereditary Pancreatitis)、遗传性胸腺嘧啶尿嘧啶(Hereditary Thymine-Uraciluria)、氨基己糖苷酶A缺乏症(Hexosaminidase A Deficiency)、Hidrotic外胚层发育不良2(Hidrotic Ectodermal Dysplasia 2)、由胱硫醚β-合成酶缺乏引起的高胱氨酸尿症(Homocystinuria Caused by Cystathionine Beta-Synthase Deficiency)、高钾血症周期性麻痹1型(Hyperkalemic Periodic Paralysis Type 1)、高氨酸血症-高氨血症-同型半胱氨酸尿症综合征(Hyperornithinemia-Hyperammonemia-HomocitrullinuriaSyndrome)、高尿酸尿症原发性1型(Hyperoxaluria,Primary,Type 1)、高尿酸尿症原发性2型(Hyperoxaluria Primary,Type 2)、软骨发育不全(Hypochondroplasia)、低钾型周期性麻痹1型(Hypokalemic Periodic Paralysis Type 1)、低钾性周期性麻痹2型(Hypokalemic Periodic Paralysis Type 2)、低磷酸盐血症(Hypophosphatasia)、婴儿肌病和乳酸性酸中毒(致命和非致命形式)(Infantile Myopathy and Lactic Acidosis(Fatal and Non-Fatal Forms))、异戊二烯酸类(Isovaleric Acidemias)、克拉伯病(Krabbe Disease)、LGMD2I、Leber遗传性视神经病变(Leber Hereditary OpticNeuropathy)、Leigh综合征法国-加拿大型(Leigh Syndrome French-Canadian Type)、长链3-羟基酰基辅酶A脱氢酶缺乏症(Long Chain 3-Hydroxyacyl-CoA DehydrogenaseDeficiency)、MELAS、MERRF()、MTHFR缺乏症(MELAS,MERRF,MTHFR Deficiency)、MTHFR不耐热变异体(MTHFR Thermolabile Variant)、MTRNR1相关听力丧失和耳聋(MTRNR1-Related Hearing Loss and Deafness)、MTTS1相关听力丧失和耳聋(MTTS1-RelatedHearing Loss and Deafness)、MYH相关息肉病(MYH-Associated Polyposis)、枫糖浆尿病1A型(Maple Syrup Urine Disease Type 1A)、枫糖浆型1B型(Maple Syrup UrineDisease Type 1B)、McCune-Albright综合征(McCune-Albright Syndrome)、中链酰基辅酶AD ehydrogenase缺陷(Medium Chain Acyl-Coenzyme A Dehydrogenase Deficiency)、脑皮质白质脑病伴皮层下囊肿(Megalencephalic Leukoencephalopathy with SubcorticalCysts)、异染性脑白质营养不良(Metachromatic Leukodystrophy)、线粒体心肌病(Mitochondrial Cardiomyopathy)、线粒体DNA相关Leigh综合征和NARP(MitochondrialDNA-Associated Leigh Syndrome and NARP)、Mucolipidosis IV(Mucolipidosis IV)、粘多醣贮积病I型(Mucopolysaccharidosis Type I)、粘多醣贮积病IIIA型(Mucopolysaccharidosis Type IIIA)、粘多醣贮积病VII型(MucopolysaccharidosisType VII)、多发性内分泌肿瘤2型(Multiple Endocrine Neoplasia Type 2)、肌肉眼脑疾病(Muscle-Eye-Brain Disease)、Nemaline肌病(Nemaline Myopathy)、神经学表型(Neurological phenotype)、由于鞘磷脂酶缺乏导致的Niemann-Pick病(Niemann-PickDisease Due to Sphingomyelinase Deficiency)、C1型Niemann-Pick病、奈梅亨破裂综合症(Nijmegen Breakage Syndrome)、PPT1相关神经元蜡样脂褐质沉积症(PPT1-RelatedNeuronal Ceroid-Lipofuscinosis)、PROP1相关垂体hormome缺陷(PROP1-relatedpituitary hormome deficiency)、Pallister-Hall综合征(Pallister-HallSyndrome)、先天性先天性副肌强直(Paramyotonia Congenita)、百综合症(PendredSyndrome)、过氧化物酶体双功能酶缺乏症(Peroxisomal Bifunctional EnzymeDeficiency)、广泛性发育障碍(Pervasive Developmental Disorders)、苯丙氨酸羟化酶缺乏症(Phenylalanine Hydroxylase Deficiency)、纤溶酶原激活物抑制剂I(Plasminogen Activator Inhibitor I)、多囊肾病(Polycystic Kidney Disease)、常染色体隐性遗传(Autosomal Recessive)、凝血酶原G20210A血栓形成倾向(ProthrombinG20210A Thrombophilia)、假性维生素D缺乏性佝偻病(Pseudovitamin D DeficiencyRickets)、皮肤改善症(Pycnodysostosis)、色素性视网膜炎(Retinitis Pigmentosa)、常染色体隐性Bothnia型(Autosomal Recessive,Bothnia Type)、Rett综合征(RettSyndrome)、Rhizomelic软骨发育不良1型(Rhizomelic Chondrodysplasia Punctata Type1)、短链酰基辅酶A脱氢酶缺乏症(Short Chain Acyl-CoA Dehydrogenase Deficiency)、Shwachman-Diamond综合征(Shwachman-Diamond Syndrome)、Sjogren-Larsson综合征(Sjogren-Larsson Syndrome)、Smith-Lemli-Opitz综合征(Smith-Lemli-OpitzSyndrome)、痉挛性截瘫13(Spastic Paraplegia 13)、硫酸盐转运相关的骨软骨发育不良(Sulfate Transporter-Related Osteochondrodysplasia)、TFR2相关的遗传性血色素沉着症(TFR2-Related Hereditary Hemochromatosis)、TPP1相关的神经元蜡样脂褐质沉积症(TPP1-Related Neuronal Ceroid-Lipofuscinosis)、致死性发育不良(ThanatophoricDysplasia)、运甲状腺素蛋白淀粉样变性(Transthyretin Amyloidosis)、三功能蛋白缺乏症(Trifunctional Protein Deficiency)、酪氨酸羟化酶缺乏性DRD I型酪氨酸血症(Tyrosine Hydroxylase-Deficient DRD Tyrosinemia Type I)、Wilson病(WilsonDisease)、X-连锁青少年视网膜劈裂症(X-Linked Juvenile Retinoschisis)和Zellweger综合征谱(Zellweger Syndrome Spectrum)。

在一些实施例中，在PIK3CA基因的全部或部分中鉴别一或多种序列变体。PIK3CA中的体细胞突变经常在各种类型的癌症中发现，例如，在10至30％的结肠直肠癌中(例如参见Samuels等人所著2004于科学期刊中Science.2004Apr.23；304(5670)：554。)。这些突变最常位于外显子9(螺旋结构域(helical domain))和外显子20(激酶结构域(kinasedomain))内的两个“热点”区域内，其可以作为特异性目标，用以检定序列变体的扩增和/或分析。位置3140也可以作为特异性目标。

在一些实施例中，在全部或部分BRAF基因中鉴别一种或多种序列变体。据报导，近50％的所有恶性黑素瘤在BRAF中具有体细胞突变(参见例如Maldonado等人所著，国家癌症研究基构期刊J Natl Cancer Inst.2003Dec.17；95(24)：1878-90)。BRAF突变存在于所有黑色素瘤亚型中，但在来自皮肤的黑素瘤中最常见，而没有慢性太阳诱导的损伤。在黑色素瘤中最常见的BRAF突变是错义突变(missense mutations)V600E，其在600的位置上，以缬氨酸(valine)取代谷氨酰胺(glutamine)。BRAF V600E突变与BRAF抑制剂治疗的临床益处相关。检测BRAF突变可用于黑素瘤治疗选择以及目标治疗的抗性研究。

在一些实施例中，在全部或部分EGFR基因中鉴别一或多种序列变体。EGFR突变通常与非小细胞肺癌(Non-Small Cell Lung Cancer)相关(在美国约为10％，在东亚约为35％；参见例如Pao等，美国国家科学院院刊Proc Natl Acad Sci USA.2004年9月7日；101(36)：13306-11)。这些突变通常发生在EGFR外显子18至21内，并且通常是杂合子的。这些突变中大约90％是外显子19缺失或外显子21L858R的点突变。

在一些实施例中，在全部或部分KIT基因中鉴别一或多种序列变体。据报导，近85％的胃肠道间质瘤(Gastrointestinal Stromal Tumor，GIST)具有KIT突变(参见例如Heinrich等人所著，2003临床肿瘤学期刊J Clin Oncol。2003年12月1日；21(23)：4342-9)。大多数KIT突变发现于近膜结构域(外显子11，70％)、细胞外二聚化形状(外显子9，10至15％)、酪氨酸激酶1(tyrosine kinase 1，TK1)结构域(外显子13，1至3％)和酪氨酸激酶2(tyrosine kinase 2，TK2)结构域和激活环(外显子17，1至3％)。在标靶治疗伊马替尼(imatinib)后以及患者对治疗产生抗性后，通常会发现继发性KIT突变。

根据本文描述的方法，与癌症相关的基因的其他非限制性实例(其全部或一部分可以用于序列变体以及/或者衍生自这些癌细胞的DNA和RNA的其他特征的分析)包括，但是不限于PTEN；ATM；ATR；EGFR；ERBB2；ERBB3；ERBB4；Notch1；Notch2；Notch3；Notch4；AKT；AKT2；AKT3；HIF；HIF1A；HIF3a；Met；HRG；BCL2；PPAR alpha；PPAR gamma；WT1(WilmsTumor)；FGF受体家族成员(5名成员：1、2、3、4、5)；CDKN2A；APC；RB(retinoblastoma，视网膜母细胞瘤)；MEN1；VHL；BRCA1；BRCA2；AR(Androgen receptor雄激素受体)；TSG101；IGF；IGF受体；Igf1(4种变体)；Igf2(3种变体)；Igf 1受体；Igf 2受体；Bax蛋白；BCL2；caspases家族(9名成员：1、2、3、4、6、7、8、9、12)；Kras；和Apc。其他实例在本文其他地方提供。

在一些实施例中，基于RNA衍生序列和DNA衍生序列诊断癌症。癌症的例子包括但不限于棘皮瘤(Acanthoma)、腺泡细胞癌(Acinic cell carcinoma)、听神经瘤(Acousticneuroma)、肢端黑色素瘤(Acral lentiginous melanoma)、色素性汗腺顶端汗腺瘤(Acrospiroma)、急性嗜酸细胞白血病(Acute eosinophilic leukemia)、急性淋巴细胞白血病(Acute lymphoblastic leukemia)、急性巨核细胞白血病(Acute megakaryoblasticleukemia)、急性单核细胞白血病(Acute monocytic leukemia)、成熟急性髓细胞白血病(Acute myeloblastic leukemia with maturation)、急性髓系树突状细胞白血病(Acutemyeloid dendritic cellleukemia)、急性髓细胞白血病(Acute myeloid leukemia)、急性早幼粒细胞白血病(Acute promyelocytic leukemia)、造釉细胞瘤(Adamantinoma)、腺癌(Adenocarcinoma)、腺样囊性癌(Adenoid cystic carcinoma)、腺瘤(Adenoma)、腺瘤样牙源性肿瘤(Adenomatoid odontogenic tumor)、肾上腺皮质癌(Adrenocorticalcarcinoma)、成人T细胞白血病(Adult T-cell leukemia)、侵袭性NK细胞白血病(Aggressive NK-cell leukemia)、AIDS相关癌症(AIDS-Related Cancers)、AIDS相关淋巴瘤(AIDS-related lymphoma)、肺泡软组织肉瘤(Alveolar soft part sarcoma)、成釉细胞纤维瘤(Ameloblastic fibroma)、***癌(Anal cancer)、间变性大细胞淋巴瘤(Anaplastic large cell lymphoma)、甲状腺未分化癌(Anaplastic thyroid cancer)、血管免疫母细胞性T细胞淋巴瘤(Angioimmunoblastic T-cell lymphoma)、血管平滑肌脂肪瘤(Angiomyolipoma)、血管肉瘤(Angiosarcoma)、阑尾癌(Appendix cancer)、星形细胞瘤(Astrocytoma)、非典型畸胎瘤性横纹肌样瘤(Atypical teratoid rhabdoid tumor)、基底细胞癌(Basal cell carcinoma)、基底样癌(Basal-like carcinoma)、B细胞白血病(B-cell leukemia)、B细胞淋巴瘤(B-cell lymphoma)、Bellini导管癌Bellini ductcarcinoma)、胆道癌(Biliary tract cancer)、膀胱癌(Bladder cancer)、母细胞瘤(Blastoma)、骨癌(Bone Cancer)、骨肿瘤(Bone tumor)、脑干性胶质瘤(Brain StemGlioma)、脑肿瘤(Brain Tumor)、乳腺癌(Breast Cancer)、布伦内罗氏瘤(Brennertumor)、支气管肿瘤(Bronchial Tumor)、细支气管肺泡癌(Bronchioloalveolarcarcinoma)、棕色肿瘤(Brown tumor)、伯基特淋巴瘤(Burkitt's lymphoma)、未知原发癌(Cancer of Unknown Primary Site)、癌类肿瘤(Carcinoid Tumor)、癌(Carcinoma)、原位癌(Carcinoma in situ)、***癌(Carcinoma of the penis)、未知原发癌(Carcinoma ofUnknown Primary Site)、癌肉瘤(Carcinosarcoma)、Castleman氏病(Castleman'sDisease)、中枢神经***胚胎肿瘤(Central Nervous System Embryonal Tumor)、小脑星形细胞瘤(Cerebellar Astrocytoma)、脑星形细胞瘤(Cerebral Astrocytoma)、***(Cervical Cancer)、胆管癌(Cholangiocarcinoma)、软骨瘤(Chondroma)、软骨肉瘤(Chondrosarcoma)、脊索瘤(Chordoma)、绒毛膜癌(Choriocarcinoma)、脉络丛***状瘤(Choroid plexus papilloma)、慢性淋巴细胞白血病(Chronic Lymphocytic Leukemia)、慢性单核细胞白血病(Chronic monocytic leukemia)、慢性粒细胞白血病(Chronicmyelogenous leukemia)、慢性骨髓增生性疾病(Chronic MyeloproliferativeDisorder)、慢性中性粒细胞白血病(Chronic neutrophilic leukemia)、透明细胞瘤(Clear-cell tumor)、结肠癌(Colon Cancer)、结肠直肠癌(Colorectal cancer)、颅咽管瘤(Craniopharyngioma)、皮肤T细胞淋巴瘤(Cutaneous T-cell lymphoma)、德戈斯病(Degos disease)、皮肤纤维肉瘤(Dermatofibrosarcoma protuberans)、皮样囊肿(Dermoid cyst)、增生性小圆细胞瘤(Desmoplastic small round cell tumor)、弥漫性大B细胞淋巴瘤(Diffuse large B cell lymphoma)、胚胎发育不良性神经上皮肿瘤(Dysembryoplastic neuroepithelial tumor)、胚胎癌(Embryonal carcinoma)、内胚窦瘤(Endodermal sinus tumor)、子宫内膜癌(Endometrial cancer)、子宫内膜子宫癌(Endometrial Uterine Cancer)、子宫内膜样肿瘤(Endometrioid tumor)、肠病相关T细胞淋巴瘤(Enteropathy-associated T-cell lymphoma)、室管膜母细胞瘤(Ependymoblastoma)、室管膜瘤(Ependymoma)、上皮样肉瘤(Epithelioid sarcoma)、红白血病(Erythroleukemia)、食道癌(Esophageal cancer)、***母细胞瘤(Esthesioneuroblastoma)、尤文氏肿瘤家族(Ewing Family of Tumor)、尤文氏家族肉瘤(Ewing Family Sarcoma)、尤文氏肉瘤(Ewing's sarcoma)、颅外生殖细胞肿瘤(Extracranial Germ Cell Tumor)、外源性胚芽细胞肿瘤(Extragonadal Germ CellTumor)、肝外胆管癌(Extrahepatic Bile Duct Cancer)、***外Paget病(ExtramammaryPaget's disease)、输卵管癌(Fallopian tube cancer)、畸胎瘤(Fetus in fetu)、纤维瘤(Fibroma)、纤维肉瘤(Fibrosarcoma)、滤泡性淋巴瘤(Follicular lymphoma)、滤泡性甲状腺癌(Follicular thyroid cancer)、胆囊癌(Gallbladder Cancer)、胆囊癌(Gallbladdercancer)、神经胶质瘤(Ganglioglioma)、神经节细胞瘤(Ganglioneuroma)、胃癌(GastricCancer)、胃淋巴瘤(Gastric lymphoma)、胃肠道癌(Gastrointestinal cancer)、胃肠道类癌肿瘤(Gastrointestinal Carcinoid Tumor)、胃肠道间质瘤(GastrointestinalStromal Tumor)、胃肠道间质瘤(Gastrointestinal stromal tumor)、生殖细胞肿瘤(Germcell tumor)、生殖细胞瘤(Germinoma)、妊娠绒毛膜癌(Gestational choriocarcinoma)、妊娠滋养细胞肿瘤(Gestational Trophoblastic Tumor)、骨巨细胞瘤(Giant cell tumorof bone)、多形性胶质母细胞瘤(Glioblastoma multiforme)、胶质瘤(Glioma)、脑胶质瘤病(Gliomatosis cerebri)、球状瘤(Glomus tumor)、胰高血糖素瘤(Glucagonoma)、促性腺细胞瘤(Gonadoblastoma)、颗粒细胞瘤(Granulosa cell tumor)、毛细胞白血病(HairyCell Leukemia)、毛细胞白血病(Hairy cell leukemia)、头颈癌(,Head and NeckCancer)、头颈癌(Head and neck cancer)、心脏癌(Heart cancer)、血管母细胞瘤(Hemangioblastoma)、血管外皮细胞瘤(Hemangiopericytoma)、血管肉瘤(Hemangiosarcoma)、血液***恶性肿瘤(Hematological malignancy)、肝细胞癌(Hepatocellular carcinoma)、肝脾T细胞淋巴瘤(Hepatosplenic T-cell lymphoma)、遗传性乳腺癌(Hereditary breast-ovarian cancer syndrome)、霍奇金淋巴瘤(HodgkinLymphoma)、霍奇金淋巴瘤(Hodgkin's lymphoma)、下咽癌(Hypopharyngeal Cancer)、下丘脑神经胶质瘤(Hypothalamic Glioma)、炎症性乳腺癌(Inflammatory breast cancer)、眼内黑色素瘤(Intraocular Melanoma)、胰岛细胞癌(Islet cell carcinoma)、胰岛细胞瘤(Islet Cell Tumor)、青少年髓单核细胞白血病(Juvenile myelomonocytic leukemia)、卡波西肉瘤(Kaposi Sarcoma)、卡波西氏肉瘤(Kaposi's sarcoma)、肾癌(KidneyCancer)、Klatskin肿瘤(Klatskin tumor)、Krukenberg肿瘤(Krukenberg tumor)、喉癌(Laryngeal Cancer)、喉癌(Laryngeal cancer)、恶性黑色素瘤(Lentigo malignamelanoma)、白血病(Leukemia)、白血病(Leukemia)、唇和口腔癌(Lip and Oral CavityCancer)、脂肪肉瘤(Liposarcoma)、肺癌(Lung cancer)、黄体瘤(Luteoma)、***瘤(Lymphangioma)、***肉瘤(Lymphangiosarcoma)、淋巴上皮瘤(Lymphoepithelioma)、淋巴样白血病(Lymphoid leukemia)、淋巴瘤(Lymphoma)、巨球蛋白血症(Macroglobulinemia)、恶性纤维组织细胞瘤(Malignant Fibrous Histiocytoma)、恶性纤维组织细胞瘤(Malignant fibrous histiocytoma)、骨恶性纤维组织细胞瘤(MalignantFibrous Histiocytoma of Bone)、恶性胶质瘤(Malignant Glioma)、恶性间皮瘤(Malignant Mesothelioma)、恶性外周神经鞘瘤(Malignant peripheral nerve sheathtumor)、恶性横纹肌样瘤(Malignant rhabdoid tumor)、恶性氚核肿瘤(Malignant tritontumor)、MALT淋巴瘤(MALT lymphoma)、地幔细胞淋巴瘤(Mantle cell lymphoma)、肥大细胞白血病(Mast cell leukemia)、纵隔生殖细胞瘤(Mediastinal germ cell tumor)、纵隔肿瘤(Mediastinal tumor)、甲状腺髓样癌(Medullary thyroid cancer)、成神经管细胞瘤(Medulloblastoma)、成神经管细胞瘤(Medulloblastoma)、髓母细胞瘤(Medulloepithelioma)、黑色素瘤(Melanoma)、黑色素瘤(Melanoma)、脑膜瘤(Meningioma,)、Merkel细胞癌(Merkel Cell Carcinoma)、间皮瘤(Mesothelioma)、间皮瘤(Mesothelioma)、转移性鳞状细胞癌隐匿性原发性(Metastatic Squamous Neck Cancerwith Occult Primary)、转移性尿路上皮癌(Metastatic urothelial carcinoma)、混合性缪勒肿瘤(Mixed Mullerian tumor)、单核细胞白血病(Monocytic leukemia)、口腔癌(Mouth Cancer)、粘液瘤(Mucinous tumor)、多发性内分泌肿瘤综合征(MultipleEndocrine Neoplasia Syndrome)、多发性骨髓瘤(Multiple Myeloma)、多发性骨髓瘤(Multiple myeloma)、蕈样真菌病(Mycosis Fungoides)、蕈样真菌病(Mycosisfungoides)、骨髓增生异常疾病(Myelodysplastic Disease)、骨髓增生异常综合征(Myelodysplastic Syndromes)、骨髓性白血病(Myeloid leukemia)、骨髓性肉瘤(Myeloidsarcoma)、骨髓增生性疾病(Myeloproliferative Disease)、粘液瘤(Myxoma)、鼻腔癌(Nasal Cavity Cancer)、鼻咽癌(Nasopharyngeal Cancer)、鼻咽癌(Nasopharyngealcarcinoma)、肿瘤(Neoplasm)、神经瘤(Neurinoma)、神经母细胞瘤(Neuroblastoma)、神经母细胞瘤(Neuroblastoma)、神经纤维瘤(Neurofibroma)、神经瘤(Neuroma)、结节性黑色素瘤(Nodular melanoma)、非霍奇金淋巴瘤(Non-Hodgkin Lymphoma)、非霍奇金淋巴瘤(Non-Hodgkin lymphoma)、非黑色素瘤皮肤癌(Nonmelanoma Skin Cancer)、非小细胞肺癌(Non-Small Cell Lung Cancer)、眼肿瘤(Ocular oncology)、寡星状胶质瘤(Oligoastrocytoma)、少突胶质细胞瘤(Oligodendroglioma)、嗜酸细胞瘤(Oncocytoma)、视神经鞘膜瘤(Optic nerve sheath meningioma)、口腔癌(Oral Cancer)、口腔癌(OralCancer)、口咽癌(Oropharyngeal Cancer)、骨肉瘤(Osteosarcoma)、骨肉瘤(Osteosarcoma)、卵巢癌(Ovarian Cancer)、卵巢癌(Ovarian cancer)、卵巢上皮癌(Ovarian Epithelial Cancer)、卵巢生殖细胞肿瘤(Ovarian Germ Cell Tumor)、卵巢低恶性潜能肿瘤(Ovarian Low Malignant Potential Tumor)、乳腺Paget病(Paget'sdisease of the breast)、胰腺瘤(Pancoast tumor)、胰腺癌(Pancreatic Cancer)、胰腺癌(Pancreatic Cancer)、***状甲状腺癌(Papillary thyroid cancer)、***状瘤病(Papillomatosis)、副神经节瘤(Paraganglioma)、副鼻窦癌(Paranasal Sinus Cancer)、甲状旁腺癌(Parathyroid Cancer)、***癌(Penile Cancer)、血管周围上皮样细胞瘤(Perivascular epithelioid cell tumor)、咽癌(Pharyngeal Cancer)、嗜铬细胞瘤(Pheochromocytoma)、中间分化的松果体实质肿瘤(Pineal Parenchymal Tumor ofIntermediate Differentiation)、松果体细胞瘤(Pineoblastoma)、垂体腺瘤(Pituicytoma)、垂体腺瘤(Pituitary adenoma)、垂体瘤(Pituitary tumor)、浆细胞肿瘤(Plasma Cell Neoplasm)、胸膜肺母细胞瘤(Pleuropulmonary blastoma)、多胚胎瘤(Polyembryoma)、前体T淋巴母细胞淋巴瘤(Precursor T-lymphoblastic lymphoma)、原发性中枢神经***淋巴瘤(Primary central nervous system lymphoma)、原发性积液淋巴瘤(Primary effusion lymphoma)、原发性肝细胞癌(Primary Hepatocellular Cancer)、原发性肝癌(Primary Liver Cancer)、原发性腹膜癌(Primary peritoneal cancer)、原始神经外胚层肿瘤(Primitive neuroectodermal tumor)、***癌症(Prostate cancer,)、腹膜假性粘液瘤(Pseudomyxoma peritonei)、直肠癌(Rectal Cancer)、肾细胞癌(Renalcell carcinoma)、15号染色体上涉及NUT基因的呼吸道癌(Respiratory Tract CarcinomaInvolving the NUT Gene on Chromosome 15)、视网膜母细胞瘤(Retinoblastoma)、横纹肌瘤(Rhabdomyoma)、横纹肌肉瘤(Rhabdomyosarcoma)、里氏转化(Richter'stransformation)、骶尾部畸胎瘤(Sacrococcygeal teratoma)、唾液腺癌(Salivary GlandCancer)、肉瘤(Sarcoma)、神经鞘瘤病(Schwannomatosis)、皮脂腺癌(Sebaceous glandcarcinoma)、继发性肿瘤(Secondary neoplasm)、***瘤(Seminoma)、浆液性肿瘤(Serous tumor)、Sertoli-Leydig细胞瘤(Sertoli-Leydig cell tumor)、性索间质瘤(Sexcord-stromal tumor)、Sezary综合征(Sezary Syndrome)、印戒细胞癌(Signet ring cellcarcinoma)、皮肤癌(Skin Cancer)、小蓝圆细胞瘤(Small blue round cell tumor)、小细胞癌(Small cell carcinoma)、小细胞肺癌(Small Cell Lung Cancer)、小细胞淋巴瘤(Small cell lymphoma)、小肠癌(Small intestine cancer)、软组织肉瘤(Soft tissuesarcoma)、体抑素瘤(somatostatinoma)、烟尘疣(Soot wart)、脊柱肿瘤(Spinal CordTumor)、脊柱肿瘤(Spinal tumor)、脾边缘区淋巴瘤(Splenic marginal zone lymphoma)、鳞状细胞癌(Squamous cell carcinoma)、胃癌(Stomach cancer)、浅表性扩散黑素瘤(Superficial spreading melanoma)、幕上原始神经外胚层肿瘤(SupratentorialPrimitive Neuroectodermal Tumor)、表面上皮-间质瘤(Surface epithelial-stromaltumor)、滑膜肉瘤(Synovial sarcoma)、T细胞急性淋巴细胞白血病(T-cell acutelymphoblastic leukemia)、T细胞大颗粒淋巴细胞白血病(T-cell large granularlymphocyte leukemia)、T细胞白血病(T-cell lymphoma)、T细胞淋巴瘤(T-celllymphoma)、T细胞幼淋巴细胞白血病(T-cell prolymphocytic leukemia)、畸胎瘤(Teratoma)、晚期淋巴癌(Terminal lymphatic cancer)、睾丸癌(Testicular cancer)、肿瘤(Thecoma)、喉癌(Throat Cancer)、胸腺癌(Thymic Carcinoma)、胸腺瘤(Thymoma)、甲状腺癌(Thyroid cancer)、肾盂和输尿管移行细胞癌(Transitional Cell Cancer of RenalPelvis and Ureter)、移行细胞癌(Transitional cell carcinoma)、脐尿管癌(Urachalcancer)、尿道癌(Urethral cancer)、泌尿生殖系肿瘤(Urogenital neoplasm)、子宫肉瘤(Uterine sarcoma)、葡萄膜黑色素瘤(Uveal melanoma)、***癌(Vaginal Cancer)、Verner Morrison综合征(Verner Morrison syndrome)、疣状癌(Verrucous carcinoma)、视觉通路胶质瘤(Visual Pathway Glioma)、外阴癌(Vulvar Cancer)、瓦尔登斯特伦巨球蛋白血症(Waldenstrom's macroglobulinemia)、Warthin氏肿瘤(Warthin's tumor)、威尔姆斯氏肿瘤(Wilms'tumor)及其组合。癌症和其他病况的其他实例以及与病况相关的突变描述于例如美国专利申请公开号2016/0304954(参见例如表4-6)中，其通过引用并入本文。

在一些实施例中，一或多种致病性遗传变体是与癌症的特定类型或阶段相关的序列变体，或具有特定特征(例如转移潜能、耐药性、药物反应性)的癌症。在一些实施例中，本公开内容提供了用于确定预后的方法，例如当已知某些突变或其他遗传特征与患者结果相关。例如，循环肿瘤DNA(ctDNA)已被证明是比传统癌抗原53(CA-53)和循环肿瘤细胞计数更好的乳腺癌预后生物标志物(参见例如Dawson等人所著，新英格兰医学期刊N Engl J Med368：1199(2013))。

在一些实施例中，本公开内容的方法包括基于来自一对象的样品中检测到的RNA衍生序列和DNA衍生序列治疗所述对象。作为非限制性实例，本文公开的方法可用于制定治疗决策、指导和监测，以及癌症疗法的开发和临床试验。例如，可以通过比较样品中的患者DNA和RNA来监测治疗功效，所述样品是来自于特定疗法(例如分子标靶疗法(单克隆药物)、化学治疗药物、放射方案等)或这些治疗组合之前、期间和之后。在一些实施例中，在比追踪传统患者症状的监测方法所提供的更短的时间内，监测无细胞多核苷酸，以观察DNA或RNA的某些突变、表达水平或其他特征是否增加或减少，或者在治疗后是否出现新的突变，这可以允许医生改变治疗(例如继续、停止或改变治疗)。在一些实施例中，所述方法还包括基于RNA衍生序列和DNA衍生序列诊断一对象的步骤，例如诊断具有与被检测的序列变体相关的特定阶段或类型的癌症的对象，或报告出患者患有或将会患上此类癌症的可能性。

在一方面，本发明内容提供了用于本文所述方法或由本文所述方法所制备的组合物，包括关于本发明内容的任何各种其他方面。本发明的组合物可包含本文所述的任何一种或多种元件。在一些实施例中，组合物包括以下一或多种：一或多种固体支持物，其包含与其连接的寡核苷酸、一或多种用于连接至固体支持物的寡核苷酸、一或多种标签寡核苷酸、一或多种RT引物、一或多种TSO、一或多种扩增引物、一或多种寡核苷酸引物，其包含结合对的第一成份、一或多种定序衔接子、一或多种固体表面(例如珠子)，其包含结合对的第二成份，一或多种定序引物，一或多种酶(例如聚合酶、反转录酶、连接酶(ligase)、核糖核酸酶(ribonuclease)和糖基化酶(glycosylase)中的一或多种)，一或多种缓冲液(例如碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液)、用于利用这些元件中的任何一者的试剂、包含任何这些元件的反应混合物、以及使用这些元件中的任何一者的说明书。

在一方面，本发明提供了用于本文所述方法或由本文所述方法制备的反应混合物，包括关于本发明内容的任何各种其他方面。在一些实施例中，反应混合物包含一或多种本文所述的组合物。

在一方面，本发明提供了用于本文描述的任何方法的套件组，包括关于本发明的任何各种其他方面。在一些实施例中，所述套件组包含一或多种本文所述的组合物。可以以任何数量和/或组合(例如在相同的套件组或相同的容器中)进一步提供套件组的元件，但不限于此。在一些实施例中，套件组包含根据本发明方法使用的其他试剂。套件组元件可以在任何合适的容器中提供，包括但不限于试管、小瓶(vials)、烧瓶(flasks)、瓶子(bottles)、安瓿(ampules)、注射器(syringes)等。所述试剂可以以可直接用于本发明方法的形式提供，或者以在使用前需要制备的形式提供，例如在冻干剂的重构中。可以以等分试样(aliquots)提供试剂，以供一次性使用，或者可以获得为多次使用的的储存液(stock)，例如在许个反应中。

在一方面，本发明提供了用于实现本文描述的方法的***，例如计算机***，包括关于本发明的各种其他方面中的任何方面。应当理解，执行本文公开的方法的一些实施例中涉及的计算操作，对于无计算机帮助的人来说是不实际的，或者甚至是不可能的。例如，在无计算设备的帮助下，将单个30bp读数从样本映射(mapping)到任何一人类染色体可能需要多年的努力。当然，在低等位基因(allele)频率突变的可靠调用需要将数千(例如至少约10,000)或甚至数百万个读数映射到一或多个染色体的情况下，无计算设备辅助序列分析和比对的挑战是复杂的。因此，本文描述的方法的一些实施例不能单独在人类头脑中执行，或者仅使用纸笔，而是需要使用计算***，例如一***包括一或多个处理器，其被编程以实现一或多个分析过程。

在一些实施例中，本发明提供了有形和/或非暂时性计算机可读介质或计算机程序产品，其包括用于执行各种计算机实现操作的程序指令和/或数据(包括数据结构)。计算机可读介质的示例包括但不限于半导体存储器装置、磁介质，诸如磁盘驱动器的、磁带；光学介质，诸如CD；磁光介质以及专门配置用以存储和执行程序指令的硬件装置，例如唯读存储器装置(read-only memory,ROM)和随机存取存储器(random access memory,RAM)。计算机可读介质可以由一终端使用者直接控制，或者所述介质可以由终端使用者间接控制。直接控制的介质的示例包括位于使用者设施处的介质和/或不与其他实体共享的介质。间接控制的介质的示例包括用户经由外部网络间接取得的介质和/或通过提供诸如“云端(cloud)”的共享资源的服务。程序指令的示例包括机器代码(例如由编译器产生的)，和包含更高阶代码的文件，其可被计算机使用解释器(interpreter)执行。

在一些实施例中，本文公开的方法和***中采用的数据或信息以电子格式提供。此类数据或信息的实例包括但不限于衍生自核酸样品的定序读数、参考序列(包括仅提供或主要提供多态性的参考序列)、用于制备定序读数(包括其一部分和/或其互补部分)的一或多种寡核苷酸的序列、判定，诸如癌症诊断判定、谘询建议、诊断等。如这里所使用的，以电子格式提供的数据或其他信息可用于存储在机器上以及多个机器之间的传输。通常，电子格式的数据以数字方式提供，并且可以作为字元(bits)和/或字节(bytes)，存储在各种数据结构、列表、数据库等中。所述数据可以电子、光学等方式实现。

在一些实施例中，本文提供了计算机程序产品，用于产生指示测试样品中DNA和RNA序列的输出。计算机产品可以包含多个指令，用于执行上述确定DNA和RNA序列的任一或多种方法。如所解释的，计算机产品可以包括非暂时性和/或有形计算机可读介质，其上记录有计算机可执行的或可编译的逻辑(例如指令)，用于使处理器能够确定目标序列。在一示例中，计算机产品包括计算机可读介质，其具有记录在其上的计算机可执行的或可编译的逻辑(例如指令)，用于使处理器能够诊断病症和/或确定目标核酸序列。

在一些实施例中，使用计算机处理***进行本文所述的方法(或其部分)，所述计算机处理***适于或配置用以执行用于确定衍生自样品的DNA和RNA的多核苷酸序列的方法，例如一或多个目标序列(例如表达的基因或其部分)。在一些实施例中，计算机处理***适于或配置用以执行如本文所述的方法。在一个实施例中，所述***包括定序装置，所述定序装置适于或配置用以定序多核苷酸以获得本文其他地方所述的序列信息类型，例如关于本文所述各种方面的任何一者。在一些实施例中，所述装置包括用于处理样品的组件，例如液体处理器和定序***，包括用于实施本文所述的任何各种方法的一或多个步骤的模块(例如样品处理，多核苷酸纯化和各种反应(例如，RT反应、扩增反应和定序反应))。

在一些实施例中，序列或其他数据被直接或间接地输入计算机或存储在计算机可读介质上。在一实施例中，计算机***直接与定序装置偶联，所述定序装置从样品中读取和/或分析核酸序列。通过计算机***中的介面提供来自这些工具的序列或其他信息。或者，由***处理的序列从序列存储源提供，例如数据库或其他存储库。一旦可用于处理装置，存储器装置或大容量存储装置至少暂时地缓冲或存储核酸的序列。另外，存储器装置可以存储各种染色体或基因组等的读取计数。存储器还可以存储用于分析序列或映射(mapping)数据的各种例程(routines)和/或程序(programs)。在一些实施例中，程序/例程包括用于执行统计分析的程序。

在一实例中，使用者将多核苷酸样品提供到定序装置中。通过连接到计算机的定序装置收集和/或分析数据。计算机上的软件允许数据收集和/或分析。可以存储、显示数据(通过显示器或其他类似装置)并且/或者发送到另一位置。计算机可以连接到互联网，用于将数据传输到远端使用者(例如，医生、科学家或分析员)使用的手持装置。应该理解，可以在传输之前存储和/或分析数据。在一些实施例中，收集原始数据并将其发送到远端使用者或装置，其将分析和/或存储所述数据。传输可以通过互联网进行，但也可以通过卫星或其他连接进行。或者，数据可以存储在计算机可读介质上，并且介质可以运送给终端使用者(例如，通过邮件)。远端使用者可以位于相同或不同的地理位置，包括但不限于建筑物、城市、州、国家或大陆。

在一些实施例中，所述方法包括收集关于多个多核苷酸序列(例如读数、共有序列和/或参考染色体序列)的数据并将数据发送到计算机或其他计算***。例如，计算机可以连接到实验室装置，例如样品收集装置、核苷酸扩增装置、核苷酸定序装置或杂交装置。然后，计算机可以收集由实验室装置收集的适用数据。数据可以在任何步骤存储在计算机上，例如在发送之前、发送期间或与发送结合或发送之后实时收集。数据可以存储在可从计算机中提取的计算机可读介质上。收集或存储的数据可以从计算机传输到远端位置，例如，通过本地网络或诸如互联网的广域网络。在远端位置，可以对传输的数据执行各种操作。

在本文公开的***、装置和方法中可以存储、传输、分析和/或操纵的电子格式化数据的类型包括：通过对核酸定序获得的读数，基于读数的共有序列，参考基因组或序列，将测试样本决定为受影响、未受影响或未决定的阈值，与目标序列相关的医学病况的实际调用，诊断(与决定相关的临床病况)，对于来自决定和/或诊断的进一步测试的建议，来自决定和/或诊断的治疗和/或监测。在一些实施例中，使用不同的装置在一或多个位置处，获得、存储传输、分析和/或操纵这些各种类型的数据。处理选项涵盖了广泛的选项。在一方面，所有或大部分所述信息被存储并使用在处理测试样品的地方，例如医生办公室或其他临床环境。在另一方面，样品在一位置获得，在不同的位置处理和任选地定序，读数被对齐并在一或多个不同位置进行决定，而在另一位置(可以是获得样品的位置)进行诊断、推荐和/或计划。

示例：

给出以下示例是为了说明本发明的各种实施方例，并不意味着以任何方式限制本发明。本示例以及本文所述的方法目前是优选实施例的代表，是示例性的，并不意图作为对本发明范围的限制。本领域技术人员将想到其中的变化和其他其他用途，包含在由权利要求的范围所限定的本发明精神内。

示例1：

图1显示制备无细胞核酸文库的示例性方法100的流程图，其使用单链DNA连接(ligation)，以标记在无细胞核酸样品中从cfRNA反转录而成的cDNA。方法100包括但不限于以下步骤：

在步骤110中，获得血液样品并从血浆成分中分离出循环的无细胞核酸。分离的无细胞核酸样品包括cfDNA和cfRNA的混合物。

在步骤115中，在无细胞核酸样品中从cfRNA合成出第一链cDNA。例如，具有3'-OH基团的随机六聚体引物以及高保真反转录酶用于反转录反应中合成第一链cDNA。现在无细胞核酸样品包括cfDNA和短cfRNA/cDNA杂合分子的混合物。

在步骤120中，例如使用过量的RNA酶H降解cfRNA/cDNA杂合分子中的cfRNA。无细胞核酸样品现在包括cfDNA和第一链cDNA片段的混合物，所述cDNA片段具有羟基于分子的3'端。

在步骤125中，使用单链DNA连接酶(例如来自Swift Biosciences的适应酶或来自New England BioLabs的Thermostable 5'AppDNA/RNA连接酶)将标签寡核苷酸(在图中表示为通用连接衔接子(universal ligation adapter))连接到第一链cDNA的3'端上。选择单链DNA连接酶，其对单链DNA具有特异性(即，对无细胞核酸样品中的双链cfDNA是无特异性的)。通用连接衔接子包括例如条形码序列和通用引物序列。通用连接衔接子还可以包括独特的分子标识物(unique molecular identifier，UMI)，其可以用于减少由扩增、文库制备和定序所引入的错误。无细胞核酸样品现在包括cfDNA和单链cDNA(衍生自cfRNA)的混合物，单链cDNA被标记有独特的条形码。

在步骤130中，合成第二链cDNA。例如使用通用连接衔接子上的通用引物序列作为引物，在延伸反应中合成第二链cDNA。无细胞核酸样品现在包括cfDNA和双链cDNA(衍生自cfRNA)的混合物，双链cDNA被标记有独特的条形码。

在步骤135中，制备定序文库。例如使用定序文库制备方案(例如，TruSeq文库制备方案(Illumina，Inc.))来制备定序库，其包括末端修复、增添3'端A尾部、定序衔接子连接以及PCR扩增步骤。定序文库现在包括来自cfDNA和具有条形码的cDNA(衍生自cfRNA)的扩增子。

在另一实例(未显示)中，在方法100的步骤115(第一链cDNA合成)之前，使用末端修复反应来修复双链cfDNA群体中的任何突出(overhanging)末端。

图2A和图2B以图式显示根据图1的方法100的步骤。即在步骤110，获得血液样品，并从血浆部分(未显示)中分离出循环的无细胞核酸。分离的无细胞核酸样品210包括cfDNA215和cfRNA 220的混合物。

在步骤115，将随机六聚体引物225用于反转录反应，以在无细胞核酸样品210中合成来自cfRNA 220的第一链cDNA 235。在无细胞核酸样品210中，用于从cfRNA转录出cDNA的反转录酶(未显示)是高保真反转录酶。无细胞核酸样品210现在包括cfDNA 215和短cfRNA/cDNA杂合分子230的混合物.fcRRNA/cDNA杂合分子230包括cfRNA 220的片段和第一链cDNA分子235。

在步骤120，cfRNA/cDNA杂合分子230中的cfRNA 220被降解。在一实例中，使用过量的RNA酶H降解cfRNA 220。无细胞核酸样品210现在包括cfDNA 215和第一链cDNA 235(衍生自cfRNA 220)的混合物，所述cDNA235在分子的3'端具有羟基。

在步骤125，将通用连接衔接子240连接到第一链cDNA 235的3'端。通用连接衔接子240包括5'腺苷基(adenyl group)、条形码区245和通用引物区250。使用单链DNA连接酶(single strand DNA ligase)将通用连接衔接子240连接到第一链cDNA 235的3'-OH端上，以产生被标记的第一链cDNA分子族群255。

在步骤130，合成第二链cDNA 260。例如使用与通用引物区250互补的引物250a，在延伸反应中合成第二链cDNA 260。无细胞核酸样品210现在包括cfDNA 215和一族群的双链cDNA分子265(衍生自cfRNA 220)的混合物，所述双链cDNA分子265被条形码区域245标记。

在步骤135，制备定序文库。例如使用定序文库270制备方案(例如，TruSeq文库制备方案(Illumina，Inc.))来制备定序库270，其包括末端修复(未显示)、增添3'端A尾部(未显示)、定序衔接子连接以及PCR扩增(未显示)步骤。定序文库270包括cfDNA的扩增子280和cDNA(衍生自cfRNA 220)的扩增子285。cDNA扩增子285包括条形码区域245和通用引物区域250。

示例2：

图3显示制备无细胞核酸文库的示例性方法300的流程图，其使用单链RNA(ssRNA)连接(ligation)，以标记在无细胞核酸样品中的cfRNA。方法300包括但不限于以下步骤。

在步骤310中，获得血液样品并从血浆成分中分离出循环的无细胞核酸。分离的无细胞核酸样品包括cfDNA和cfRNA的混合物。

在步骤315中，将无细胞核酸样品中的cfRNA片段化至特定大小范围。在一实例中，使用物理片段化方案(例如超声处理)将cfRNA片段化。在另一实例中，使用化学片段化方案(例如碱性消化，或二价金属阳离子(例如，Mg²⁺)和加热(例如约94℃))将cfRNA片段化。选择片段化反应条件，使得无细胞核酸样品中的cfRNA片段化至一定大小范围，并且cfDNA未片段化。

在任选的步骤320中，取决于在步骤315中用于片段化cfRNA的方法，可以将片段化的cfRNA的3'端磷酸化。可以使用T4多核苷酸激酶将片段化的cfRNA的3'端去磷酸化，从而留下3'-OH。

在步骤325中，使用RNA连接酶(例如T4 RNA连接酶)将标签寡核苷酸(在图中表示为通用连接衔接子)连接到cfRNA的3'端上。通用连接衔接子包括条形码序列和通用引物序列。通用连接衔接子还可以包括独特的分子标识物(UMI)，其可以用于减少由扩增、文库制备和定序所引入的错误。无细胞核酸样品现在包括cfDNA和片段化的cfRNA，所述片段化的cfRNA被标记有独特的条形码和通用引物序列。

在步骤330中，从被衔接子连接的cfRNA(被独特条形码和通用引物序列标记的cfRNA)合成第一链cDNA。第一链cDNA可以使用任何反转录反应从被衔接子连接的cfRNA合成，所述反转录反应使用通用连接衔接子中的通用引物区作为引物。在一实例中，使用通用连接衔接子中的通用引物序列作为引物，在模板转换反转录反应(例如，Clontech)中从cfRNA合成第一链cDNA。

在步骤335中，制备定序文库。例如使用定序文库制备方案(例如，TruSeq文库制备方案(Illumina，Inc.))来制备定序库，其包括末端修复、增添3'端A尾部、定序衔接子连接以及PCR扩增步骤。定序文库现在包括来自cfDNA和具有条形码的cDNA(衍生自cfRNA)的扩增子。

图4A和图4B以图示方式显示根据图3的方法300的步骤。即在步骤110，获得血液样品，并从血浆部分(未显示)中分离出循环的无细胞核酸。分离的无细胞核酸样品410包括cfDNA 415和cfRNA 420的混合物。

在步骤315中，将无细胞核酸样品410中的cfRNA 420片段化至特定大小范围。在一实例中，使用碱性消化方案将cfRNA 420片段化。选择片段化反应条件使得cfRNA 420片段化至特定大小范围，并且无细胞核酸样品410中的cfDNA415未被片段化。

在任选的步骤320中，使用T4多核苷酸激酶将片段化的cfRNA 420的3'端去磷酸化。

在步骤325中，将通用连接衔接子425连接到cfRNA 420的3'OH上。通用连接衔接子425包括5'腺苷基(5’adenyl group，rApp)、条形码区430和通用引物区435。使用RNA连接酶(例如，T4 RNA连接酶)将连接衔接子425连接到cfRNA 420的3'端，以产生包含条形码区域430和通用引物区域435的cfRNA分子族群440。

在步骤330中，从cfRNA 440(cfRNA 420，其标记有独特的条形码区域430和通用引物区域435)合成第一链cDNA 450。在所述实施例中，使用与通用引物区域435互补的引物435a和模板转换寡核苷酸446(当其作为一模板，用于连续引物延伸，添加其至少一部份的一互补序列445)，以产生cfRNA/cDNA杂合分子455的一族群。在模板转换反转录反应期间，在cfRNA/cDNA杂合分子455中与cfRNA 420相邻处形成切口460。

在步骤335，制备定序文库465。例如使用定序文库制备方案(例如，TruSeq文库制备方案(Illumina，Inc.))来制备定序库465，其包括末端修复(未显示)、增添3'端A尾部(未显示)、定序衔接子470连接以及PCR扩增(未显示)步骤。由于cfRNA/cDNA杂合分子455中的切口460，在所示方法的PCR扩增步骤中不扩增cfRNA链420。定序文库465包括cfDNA的扩增子475和cDNA(衍生自cfRNA 220)的扩增子485。cDNA扩增子480包括条形码区域460和通用引物区域435。

图5A和图5B分别显示通用连接接头500和模板转换寡核苷酸525的其他构造的示意图，其分别可以在图4A的步骤325中和图4B的步骤330中使用。参照图5A，通用连接衔接子500包括条形码区域430、通用引物区域435、合成定序(SBS)的引物区域510和P7引物区域515。如图5B所示，模板转换寡核苷酸525包括通用转换引物545、SBS引物区域530和P5引物区域535。因为通用连接衔接子500包括SBS区域510和P7引物区域515，并且模板转换寡核苷酸525包括SBS区域530和P5区域535，因此不需要将定序衔接子(例如定序衔接子470)连接到cfRNA/cDNA杂合分子455上。在所述实施例中，然后封闭具有通用连接衔接子500和其上的模板转换引物525的cfRNA/cDNA杂合分子455的末端，然后使用单独的连接步骤将定序衔接子添加到cfDNA 415上。

示例3：

图6说明制备无细胞核酸文库的示例性方法600的流程图，其使用生物素标记的随机六聚体引物，以标记在无细胞核酸样品中从cfRNA逆转录的cDNA。在此实施例中，掺入衍生自cfRNA的双链cDNA的生物素标记用于将无细胞核酸样品分离成cfDNA部分和cDNA部分(衍生自cfRNA)，用于制备两个分离的定序文库。方法600包括但不限于以下步骤。

在步骤610中，获得血液样品并从血浆成分中分离出循环的无细胞核酸。分离的无细胞核酸样品包括cfDNA和cfRNA的混合物。

在步骤615中，使用生物素标记的随机六聚体引物，在无细胞核酸样品中从cfRNA合成第一链cDNA，其中生物素标记通过可切割的尿嘧啶残基(uracil residue)与随机六聚体引物连接。生物素标记的随机六聚体引物还可以包括独特的分子标识物(UMI)，其可以用于减少由扩增、文库制备和定序所引入的错误。现在无细胞核酸样品包括cfDNA和短生物素连接的cfRNA/cDNA杂合分子的混合物。

在步骤620中，使用例如DNA聚合酶和RNA酶H合成第二链cDNA。

在步骤625中，使用链霉抗生物素蛋白珠(streptavidin beads)捕获生物素连接的cDNA，并将无细胞核酸样品分成生物素连接的cDNA沉淀部分(衍生自cfRNA)和cfDNA上清液部分。

在步骤630中，使用例如USER酶将生物素标记从双链cDNA上切下。USER酶是尿嘧啶DNA糖基化酶(uracil DNA glycosylase，UDG)和DNA糖基化酶-裂合酶核酸内切酶VIII(DNAglycosylase-lyase endonuclease VIII)的混合物。USER酶去除双链cDNA中的尿嘧啶残基，从而从双链cDNA中释放生物素标记。

在步骤635中，制备两个分离的定序文库。例如使用定序文库制备方案(例如，TruSeq文库制备方案(Illumina，Inc.))来制备cfDNA定序库，其包括末端修复、增添3'端A尾部、定序衔接子连接以及PCR扩增步骤。类似地，例如使用定序文库制备方案(例如，TruSeq文库制备方案(Illumina，Inc.))来制备cDNA定序库，其包括末端修复、增添3'端A尾部、定序衔接子连接以及PCR扩增步骤。

图7A和图7B以图示方式示出了图6的方法600的步骤。即在步骤610，获得血液样品，并从血浆部分(未显示)中分离出循环的无细胞核酸。分离的无细胞核酸样品710包括cfDNA 715和cfRNA 720的混合物。

在步骤615中，在反转录反应中使用包含随机引物序列730和生物素标记735的随机六聚体引物725，以在无细胞核酸样品710中从cfRNA 720合成第一链cDNA 740。生物素标记735通过尿嘧啶残基(U)与随机引物序列730连接。无细胞核酸样品710现在包括cfDNA715和短cfRNA/cDNA杂合分子745的混合物，其包括cfRNA 720的片段和用生物素标记735标记的cDNA分子740。

在步骤620中，使用例如DNA聚合酶和RNA酶H合成第二链cDNA。无细胞核酸样品710现在包括cfDNA 715和双链cDNA 750(衍生自cfRNA 720)的混合物，所述双链cDNA 750被生物素标记735标记。

在步骤625中，使用链霉抗生物素蛋白珠(streptavidin beads)捕获其上具有生物素标记735的双链cDNA 750，并将无细胞核酸样品710分成双链cDNA 750沉淀部分和cfDNA 715上清液部分。

在步骤630中，从双链cDNA 750切下生物素标记735，例如使用USER酶，其移除双链cDNA 750中的尿嘧啶残基(U)，从而从双链cDNA 750释放生物素标记735。

在步骤635，制备两个分离的定序文库。例如使用定序文库制备方案(例如，TruSeq文库制备方案(Illumina，Inc.))来制备cfDNA定序库760，其包括末端修复(未显示)、增添3'端A尾部(未显示)、定序衔接子755连接以及PCR扩增(未显示)步骤。相似地，例如使用定序文库制备方案来制备cDNA定序库765(衍生自cfRNA)，其包括末端修复(未显示)、增添3'端A尾部(未显示)、定序衔接子755连接以及PCR扩增(未显示)步骤。

从前述内容可以理解，尽管为了说明的目的，在本文中描述了本发明的特定实施例，但是在不脱离本发明的精神和范围的情况下可以进行各种修改。

贯穿本发明的描述，参考各种专利申请和出版物，每篇专利申请和出版物均通过引用整体并入本文。

Claims

1.一种区分一样品中多个RNA和DNA序列的方法，其特征在于：所述方法包括：

步骤a：获得包括RNA和DNA的一样品；

步骤b：反转录所述RNA以产生多个cDNA/RNA杂合分子；

步骤c：降解所述多个杂合分子的所述RNA以产生单链cDNA；

步骤d：在包括一单链DNA连接酶的一反应中，优先将包括一标签序列的一标签寡核苷酸与所述单链cDNA连接，以产生一被标记的cDNA；以及

步骤e：定序所述DNA和所述被标记的cDNA；

其中所述反转录、优先连接和定序皆是在所述DNA存在下进行。

2.如权利要求1所述的方法，其特征在于：所述RNA和DNA是无细胞核酸。

3.如权利要求1所述的方法，其特征在于：所述反转录包括：延伸多个引物，所述引物包括一随机序列。

4.如权利要求1所述的方法，其特征在于：所述反转录包括：沿一模板转换寡核苷酸延伸所述杂合分子的cDNA。

5.如权利要求4所述的方法，其特征在于：所述模板转换寡核苷酸包括一通用转换引物序列。

6.如权利要求1所述的方法，其特征在于：所述标签寡核苷酸与所述单链cDNA的一3'端连接。

7.如权利要求6所述的方法，其特征在于：所述标签寡核苷酸包括一引物结合序列。

8.如权利要求1或7所述的方法，其特征在于：所述定序包括：扩增所述被标记的cDNA，以产生一双链被标记的cDNA。

9.如权利要求8所述的方法，其特征在于：扩增所述被标记的cDNA包括：延伸与所述引物结合序列杂交的一引物。

10.如权利要求1所述的方法，其特征在于：所述定序包括：将多个定序衔接子连接到所述被标记的cDNA和所述DNA。

11.如权利要求1所述的方法，其特征在于：所述标签寡核苷酸包括一独特的分子标识物，其中根据所述独特的分子标识物，多个被标记的cDNA分子中的各者与所述多个被标记的cDNA分子中的其他者可相互区别。

12.如权利要求1所述的方法，其特征在于：所述样品是血液、一血液成分，血浆、血清、唾液、痰液、尿液、***、经***液、脑脊髓液或粪便。

13.如权利要求12所述的方法，其特征在于：所述样品是血液或一血液成分。

14.如权利要求1所述的方法，其特征在于：所述方法进一步包括：使用一处理器，根据所述标签序列或所述标签序列的一互补序列的存在或不存在，将多个RNA衍生的序列与多个DNA衍生的序列分开。

15.如权利要求14所述的方法，其特征在于：所述方法还包括：根据所述多个RNA衍生的序列和所述多个DNA衍生的序列，辨识一对象的一病症的存在或不存在。

16.如权利要求15所述的方法，其特征在于：所述病症是癌症。

17.如权利要求15所述的方法，其特征在于：所述方法进一步包括：根据所述多个RNA衍生的序列和所述多个DNA衍生的序列来治疗所述对象。

18.一种区分一样品中多个RNA和DNA序列的方法，其特征在于：所述方法包括：

步骤a：获得包括RNA和DNA的一样品；

步骤b：在包括一RNA连接酶的一反应中，将包括一标签序列的一标签寡核苷酸与所述RNA连接以产生一被标记的RNA；

步骤c：反转录所述被标记的RNA，以产生一被标记的cDNA；以及

步骤d：定序所述DNA和所述被标记的cDNA；

其中所述反转录、连接和定序皆是在所述DNA存在下进行。

19.如权利要求18所述的方法，其特征在于：所述RNA和DNA是无细胞的核酸。

20.如权利要求18所述的方法，其特征在于：所述方法进一步包括：在连接所述标签序列之前，使RNA片段化，以产生一片段化的RNA。

21.如权利要求20所述的方法，其特征在于：所述片段化的RNA具有在一预定范围内的一平均大小。

22.如权利要求20所述的方法，其特征在于：使所述RNA片段化包括：使RNA和DNA经受优先使所述RNA片段化的多个条件。

23.如权利要求20所述的方法，其特征在于：使所述RNA片段化包括：超声处理、化学片段化或加热。

24.如权利要求20所述的方法，其特征在于：所述方法还包括：使片段化的RNA的多个3'端去磷酸化。

25.如权利要求18所述的方法，其特征在于：所述标签寡核苷酸与所述RNA的一3'端连接。

26.如权利要求25所述的方法，其特征在于：所述标签寡核苷酸包括一引物结合序列。

27.如权利要求26所述的方法，其特征在于：所述反转录包括：延伸与所述引物结合序列杂交的一引物。

28.如权利要求18或27所述的方法，其特征在于：所述反转录包括：沿一模板转换寡核苷酸延伸所述被标示的cDNA。

29.如权利要求28所述的方法，其特征在于：所述模板转换寡核苷酸包括一通用转换引物序列。

30.如权利要求18或27所述的方法，其特征在于：所述定序包括：扩增所述被标记的cDNA，以产生一双链被标记的cDNA。

31.如权利要求18所述的方法，其特征在于：所述定序包括：将多个定序衔接子连接到所述被标记的cDNA和所述DNA。

32.如权利要求18所述的方法，其特征在于：所述标签寡核苷酸包括一独特的分子标识物，其中根据所述独特的分子标识物，多个被标记的cDNA分子中的各者与所述多个被标记的cDNA分子中的其他者可相互区别。

33.如权利要求18所述的方法，其特征在于：所述样品是血液、一血液成分，血浆、血清、唾液、痰液、尿液、***、经***液、脑脊髓液或粪便。

34.如权利要求33所述的方法，其特征在于：所述样品是血液或一血液成分。

35.如权利要求18所述的方法，其特征在于：所述反转录包括：延伸多个引物，所述引物包括一随机序列。

36.如权利要求18所述的方法，其特征在于：所述方法进一步包括：使用一处理器，根据所述标签序列或所述标签序列的一互补序列的存在或不存在，将多个RNA衍生的序列与多个DNA衍生的序列分开。

37.如权利要求36所述的方法，其特征在于：所述方法还包括：根据所述多个RNA衍生的序列和所述多个DNA衍生的序列，辨识一对象的一病症的存在或不存在。

38.如权利要求37所述的方法，其特征在于：所述病症是癌症。

39.如权利要求37所述的方法，其特征在于：所述方法进一步包括：根据所述多个RNA衍生的序列和所述多个DNA衍生的序列来治疗所述对象。

40.一种定序来自单一生物样品的无细胞核酸的方法，所述无细胞核酸包括DNA和RNA，其特征在于：所述方法包括：

步骤a：获得包括所述无细胞核酸的一样品；

步骤b：通过延伸一引物反转录RNA，以产生多个cDNA/RNA杂合分子，其中所述引物通过一切割位点与一结合对的一第一成分共价连接；

步骤c：通过将所述结合对的所述第一成分与包括所述结合对的一第二成分的一基质结合，将所述cDNA与所述DNA分离；

步骤d：切割所述切割位点；以及

步骤e：在所述分离的步骤后，对所述cDNA和所述DNA进行定序。

41.如权利要求40所述的方法，其特征在于：所述反转录包括：扩增所述cDNA，以产生一双链的被标记的cDNA。

42.如权利要求41所述的方法，其特征在于：所述扩增包括：降解所述多个杂合分子的所述RNA以产生一单链cDNA。

43.如权利要求40所述的方法，其特征在于：所述定序包括：扩增所述cDNA，以产生一双链的被标记的cDNA。

44.如权利要求40所述的方法，其特征在于：所述引物包括一随机序列。

45.如权利要求40所述的方法，其特征在于：所述结合对包括生物素和链霉抗生物素蛋白。

46.如权利要求45所述的方法，其特征在于：所述结合对的所述第一成分是生物素，并且所述结合对的所述第二成员是链霉抗生物素蛋白。

47.如权利要求40所述的方法，其特征在于：所述切割位点包括尿嘧啶，并且切割所述切割位点包括：将所述切割位点暴露于一尿嘧啶DNA糖基化酶和一DNA糖基化酶-裂解酶内切核酸酶。

48.如权利要求40所述的方法，其特征在于：所述反转录包括：沿一模板转换寡核苷酸延伸cDNA。

49.如权利要求48所述的方法，其特征在于：所述模板转换寡核苷酸包括一通用转换引物序列。

50.如权利要求40所述的方法，其特征在于：所述定序包括：将多个定序衔接子连接到所述被标记的cDNA和所述DNA。

51.如权利要求40所述的方法，其特征在于：所述样品是血液、一血液成分，血浆、血清、唾液、痰液、尿液、***、经***液、脑脊髓液或粪便。

52.如权利要求51所述的方法，其特征在于：所述样品是血液或一血液成分。

53.如权利要求40所述的方法，其特征在于：所述方法还包括：根据所述多个RNA衍生的序列和所述多个DNA衍生的序列，辨识一对象的一病症的存在或不存在。

54.如权利要求53所述的方法，其特征在于：所述病症是癌症。

55.如权利要求53所述的方法，其特征在于：所述方法进一步包括：根据所述多个RNA衍生的序列和所述多个DNA衍生的序列来治疗所述对象。

56.一种反应混和物，其特征在于：用于执行如权利要求1至55中任一项所述的方法，且所述反应混合物包括一种或多种用于扩增和/或定序核酸的试剂。

57.一种套件组，其特征在于：用于执行如权利要求1至55中任一项所述的方法，且所述套件组包括一种或多种用于扩增和/或定序核酸的试剂。