CN118176306A

CN118176306A - 用于mRNA 5’分析的模板转换寡核苷酸(TSO)

Info

Publication number: CN118176306A
Application number: CN202280072452.3A
Authority: CN
Inventors: 丹尼斯·普罗森; 瑞瑟雷·阿格巴亚尼·阿科布
Original assignee: Becton Dickinson and Co
Current assignee: Becton Dickinson and Co
Priority date: 2021-08-30
Filing date: 2022-08-29
Publication date: 2024-06-11
Also published as: EP4396369A1; WO2023034739A1

Abstract

本文的公开内容包括用于基于5’的基因表达谱分析和用于使用随机引发和延伸(RPE)的全转录组分析(WTA)的***、方法、组合物和试剂盒。在一些实施方案中，提供了模板转换寡核苷酸(TSO)和使用其减少文库制备过程中不期望的延伸产物的产生的方法。在一些实施方案中，TSO包含阻断序列。在一些实施方案中，阻断序列包含阻断核苷酸。在一些实施方案中还提供了免疫组库(immune repertoire)谱分析方法。

Description

用于mRNA 5’分析的模板转换寡核苷酸(TSO)

相关申请

本申请根据35 U.S.C.§119(e)要求2021年8月30日提交的美国临时专利申请序号63/238,748的权益，该相关申请的内容出于所有目的通过引用以其整体并入本文。

对序列表的引用

本申请连同电子格式的序列表一起提交。序列表作为题为68EB-317320-WO的文件提供，该文件创建于2022年8月27日，大小是24.0千字节。电子格式的序列表的信息通过引用以其整体并入本文。

背景

领域

本公开内容大体上涉及分子生物学领域，并且尤其涉及使用分子条形码化的多组学分析。

对相关技术的描述

分子条形码化的方法和技术可用于单细胞转录组学分析，包括使用例如逆转录、聚合酶链式反应(PCR)扩增和下一代测序(NGS)破译基因表达谱以确定细胞的状态。分子条形码化还可用于单细胞蛋白质组学分析。对使核酸靶在5’端和3’端中的一个或两个上分子条形码化的方法和技术存在需求。对能够有效地定量分析细胞的基因表达的***和方法存在需求。

概述

本文的公开内容包括用于对样品中的核酸靶进行标记的方法。在一些实施方案中，该方法包括：使核酸靶的拷贝与第一多于一种寡核苷酸条形码接触，其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区；在存在逆转录酶和包含(i)阻断序列的互补物和(ii)靶结合区或其一部分的模板转换寡核苷酸(TSO)的情况下，延伸与核酸靶的拷贝杂交的多于一种寡核苷酸条形码，以产生各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区、阻断序列和靶结合区的互补物的第一多于一种条形码化核酸分子；将每一种条形码化核酸分子的靶结合区的互补物与第一多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交；以及延伸与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’端，以产生各自包含第一分子标记的互补物和第二分子标记的第一多于一种延伸的条形码化核酸分子。方法可以包括：基于与第一多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。

本文的公开内容包括用于确定样品中核酸靶的数目的方法。在一些实施方案中，该方法包括：使核酸靶的拷贝与第一多于一种寡核苷酸条形码接触，其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与核酸靶杂交的靶结合区；在存在逆转录酶和包含(i)阻断序列的互补物和(ii)靶结合区或其一部分的模板转换寡核苷酸(TSO)的情况下，延伸与核酸靶的拷贝杂交的多于一种寡核苷酸条形码，以产生各自包含与核酸靶的至少一部分互补的序列、第一分子标记、靶结合区、阻断序列和靶结合区的互补物的第一多于一种条形码化核酸分子；将每一种条形码化核酸分子的靶结合区的互补物与第一多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交；延伸与条形码化核酸分子的靶结合区的互补物杂交的寡核苷酸条形码的3’端，以产生各自包含第一分子标记的互补物和第二分子标记的第一多于一种延伸的条形码化核酸分子；以及基于与第一多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。

方法可以包括：扩增第一多于一种延伸的条形码化核酸分子以产生各自包含第二分子标记的第一多于一种单标记的核酸分子，其中确定样品中核酸靶的拷贝数包括：基于与第一多于一种单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。

本文的公开内容包括用于对样品中的核酸靶进行标记的方法。在一些实施方案中，该方法包括：使核酸靶的拷贝与第一多于一种寡核苷酸条形码接触，其中第一多于一种寡核苷酸条形码的每一种寡核苷酸条形码包含第一通用序列、第一分子标记和能够与核酸靶杂交的靶结合区；在存在逆转录酶和包含(i)阻断序列的互补物和(ii)诱饵序列的模板转换寡核苷酸(TSO)的情况下，延伸与核酸靶的拷贝杂交的第一多于一种寡核苷酸条形码，以产生各自包含第一通用序列、第一分子标记、诱饵序列的互补物、阻断序列和与核酸靶的至少一部分互补的序列的第二多于一种条形码化核酸分子；使条形码化核酸分子与第二多于一种寡核苷酸条形码接触，其中第二多于一种寡核苷酸条形码的每一种寡核苷酸条形码包含第二通用序列、第二分子标记和诱饵序列；以及延伸：与条形码化核酸分子的诱饵序列的互补物杂交的第二多于一种寡核苷酸条形码中的寡核苷酸条形码的3’端，以产生各自包含第二分子标记、第二通用序列、第一分子标记的互补物和第一通用序列的互补物的第二多于一种延伸的条形码化核酸分子。方法可以包括：基于与第二多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、具有不同序列的第二分子标记或其组合的数目来确定样品中核酸靶的拷贝数。

本文的公开内容包括用于确定样品中核酸靶的拷贝数的方法。在一些实施方案中，该方法包括：使核酸靶的拷贝与第一多于一种寡核苷酸条形码接触，其中第一多于一种寡核苷酸条形码的每一种寡核苷酸条形码包含第一通用序列、第一分子标记和能够与核酸靶杂交的靶结合区；在存在逆转录酶和包含(i)阻断序列的互补物和(ii)诱饵序列的模板转换寡核苷酸(TSO)的情况下，延伸与核酸靶的拷贝杂交的第一多于一种寡核苷酸条形码，以产生各自包含第一通用序列、第一分子标记、诱饵序列的互补物、阻断序列和与核酸靶的至少一部分互补的序列的第二多于一种条形码化核酸分子；使条形码化核酸分子与第二多于一种寡核苷酸条形码接触，其中第二多于一种寡核苷酸条形码的每一种寡核苷酸条形码包含第二通用序列、第二分子标记和诱饵序列；延伸：与条形码化核酸分子的诱饵序列的互补物杂交的第二多于一种寡核苷酸条形码中的寡核苷酸条形码的3’端，以产生各自包含第二分子标记、第二通用序列、第一分子标记的互补物和第一通用序列的互补物的第二多于一种延伸的条形码化核酸分子；以及基于与第二多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、具有不同序列的第二分子标记或其组合的数目来确定样品中核酸靶的拷贝数。

在一些实施方案中，确定核酸靶的拷贝数包括基于与第二多于一种延伸的条形码化核酸分子中的延伸的条形码化核酸分子关联的具有不同序列的第一分子标记、具有不同序列的第二分子标记或其组合的数目来确定样品中多于一种核酸靶中的每一种的拷贝数，所述第二多于一种延伸的条形码化核酸分子包含多于一种核酸靶中的每一种的序列。在一些实施方案中，第一多于一种寡核苷酸条形码中的每一种寡核苷酸条形码的第一通用序列在第一分子标记和靶结合区的5’。在一些实施方案中，第二多于一种寡核苷酸条形码中的每一种寡核苷酸条形码的第二通用序列在第二分子标记和诱饵序列的5’。在一些实施方案中，诱饵序列包含至少6个核苷酸。在一些实施方案中，诱饵序列包括约20％至约80％的GC含量。

方法可以包括：使用扩增引物和包含第二通用序列或其一部分的引物扩增第二多于一种延伸的条形码化核酸分子，从而产生包含核酸靶的序列或其一部分的第二多于一种单标记的核酸分子，其中确定样品中核酸靶的拷贝数包括：基于与第二多于一种单标记的核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定样品中核酸靶的拷贝数。

方法可以包括：使用扩增引物和包含第一通用序列或其一部分的引物扩增第二多于一种延伸的条形码化核酸分子，从而产生包含核酸靶的序列或其一部分的第三多于一种单标记的核酸分子，其中确定样品中核酸靶的拷贝数包括：基于与第三多于一种单标记的核酸分子或其产物关联的具有不同序列的第一分子标记的数目来确定样品中核酸靶的拷贝数。

在一些实施方案中，第一和/或第二多于一种寡核苷酸条形码中的寡核苷酸条形码包含细胞标记，任选地，细胞标记位于分子标记的5’。在一些实施方案中，第一和/或第二多于一种寡核苷酸条形码中的寡核苷酸条形码的至少一部分包含至少一个可变序列，任选地，第一和/或第二多于一种寡核苷酸条形码中的至少10种在可变序列处包含不同序列，任选地，细胞标记和/或分子标记的至少一部分包含可变序列。在一些实施方案中，阻断序列位于第一和/或第二多于一种条形码化核酸分子的3’端。在一些实施方案中，阻断序列被配置为不与以下互补：(i)第一多于一种寡核苷酸条形码中的寡核苷酸条形码中靶结合区5’的区域；和/或(ii)第二多于一种寡核苷酸条形码中的寡核苷酸条形码中诱饵序列5’的区域。在一些实施方案中，阻断序列与以下少于约50％互补：(i)第一多于一种寡核苷酸条形码中的寡核苷酸条形码中靶结合区5’的区域；和/或(ii)第二多于一种寡核苷酸条形码中的寡核苷酸条形码中诱饵序列5’的区域。在一些实施方案中，阻断序列被配置成阻止第一和/或第二多于一种条形码化核酸分子的3’端的延伸。在一些实施方案中，阻断序列减少了包含第一通用序列的互补物的延伸的条形码化核酸分子的产生。

在一些实施方案中，在不存在阻断序列的情况下，(i)与第二多于一种寡核苷酸条形码的诱饵序列杂交的第二多于一种条形码化核酸分子的3’端；和/或(ii)与第一多于一种寡核苷酸条形码的靶结合区杂交的第一多于一种条形码化核酸分子的3’端能够被延伸以产生第三多于一种延伸的条形码化核酸分子。在一些实施方案中，与其中TSO不包含阻断序列的互补物的可比方法相比，第三多于一种延伸的条形码化核酸分子的产生减少了至少10％、至少25％、至少50％、至少80％、至少90％、至少95％或至少99％。

在一些实施方案中，第一和/或第二多于一种寡核苷酸条形码中的寡核苷酸条形码的至少一部分包含不变序列，任选地，第一和/或第二多于一种寡核苷酸条形码中的每一种在不变序列处包含相同的序列。在一些实施方案中，不变序列的长度在大约1-15个核苷酸之间，任选地不变序列的长度为1个核苷酸。在一些实施方案中，不变序列位于细胞标记中，任选地，细胞标记包含细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分，还任选地，不变序列位于细胞标记的第三部分。在一些实施方案中，阻断序列包含阻断物核苷酸，其中阻断物核苷酸位于阻断序列的3’端。在一些实施方案中，阻断物核苷酸被配置为不与不变序列互补。在一些实施方案中，不变序列和诱饵序列之间的距离与诱饵序列的互补物和阻断物核苷酸之间的距离等距。在一些实施方案中，不变序列和靶结合区之间的距离与靶结合区的互补物和阻断物核苷酸之间的距离等距。在一些实施方案中，TSO包含选自SEQ ID NO:1-7的序列，或与选自SEQ ID NO:1-7的序列表现出至少约50％同一性的序列。在一些实施方案中，阻断序列包含SEQ ID NO:1-7中任何一个的至少4个连续碱基。在一些实施方案中，阻断序列的互补物在TSO中诱饵序列的5’。在一些实施方案中，阻断序列的互补物在TSO中靶结合区或其部分的5’。

在一些实施方案中，与其中TSO不包含阻断序列的互补物的可比方法相比，模板转换效率降低了少于40％、少于20％、少于10％或少于5％。在一些实施方案中，方法还包括在一个或更多个延伸步骤之前或期间添加阻断物寡核苷酸。在一些实施方案中，该方法不包括添加阻断物寡核苷酸。在一些实施方案中，阻断序列的互补物包含阻断序列的反向互补序列和/或阻断序列的互补序列。

在一些实施方案中，使条形码化核酸分子的靶结合区的互补物与第一多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交包括使条形码化核酸分子的靶结合区的互补物与第一多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区进行分子间杂交。方法可以包括：在使每一种条形码化核酸分子的靶结合区的互补物与第一多于一种寡核苷酸条形码中的寡核苷酸条形码的靶结合区杂交之前，使第一多于一种条形码化核酸分子变性。方法可以包括：在扩增第一和/或第二多于一种延伸的条形码化核酸分子之前，使第一和/或第二多于一种延伸的条形码化核酸分子变性。

在一些实施方案中，确定核酸靶的拷贝数包括基于与第一多于一种单标记的核酸分子中包含多于一种核酸靶中的每一种的序列的单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定样品中多于一种核酸靶中的每一种的拷贝数。在一些实施方案中，多于一种核酸靶中的每一种的序列包括多于一种核酸靶中的每一种的子序列。在一些实施方案中，第一多于一种条形码化核酸分子和/或第二多于一种条形码化核酸分子中的核酸靶的序列包括核酸靶的子序列。

在一些实施方案中，靶结合区的互补物与靶结合区的一部分互补。在一些实施方案中，靶结合区包括基因特异性序列和/或多(dT)序列。在一些实施方案中，第二分子标记不同于第一分子标记，并且其中第二分子标记不是第一分子标记的互补物。在一些实施方案中，第一和/或第二多于一种延伸的条形码化核酸分子各自包含核酸靶的序列。在一些实施方案中，核酸靶包括mRNA，并且其中第一和/或第二多于一种延伸的条形码化核酸分子各自包含核酸靶的有义链的序列。在一些实施方案中，逆转录酶能够具有末端转移酶活性。在一些实施方案中，模板转换寡核苷酸包含一个或更多个3’核糖核苷酸，任选地三个3’核糖核苷酸，并且还任选地3’核糖核苷酸包含鸟嘌呤。在一些实施方案中，逆转录酶包括病毒逆转录酶，任选地病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。

样品可以包括单细胞，例如免疫细胞，并且还任选地包括B细胞或T细胞。在一些实施方案中，样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。在一些实施方案中，单细胞包括循环肿瘤细胞。在一些实施方案中，第一通用序列在分子标记和靶结合区的5’。在一些实施方案中，扩增第一多于一种延伸的条形码化核酸分子以产生第一多于一种单标记的核酸分子包括使用能够与第一通用序列杂交的引物和扩增引物。

在一些实施方案中，扩增引物是靶特异性引物，并且任选地，靶特异性引物与免疫受体、免疫受体的恒定区、免疫受体的可变区、免疫受体的多样性区和/或免疫受体的可变区和多样性区的连接处特异性杂交。免疫受体可以是T细胞受体(TCR)和/或B细胞受体(BCR)，并且任选地TCR包含TCRα链、TCRβ链、TCRγ链、TCRδ链或其任何组合；并且BCR受体包含BCR重链和/或BCR轻链。在一些实施方案中，扩增引物特异性结合延伸的条形码化核酸分子，所述延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记。在一些实施方案中，扩增引物不结合包含第一分子标记的延伸的条形码化核酸分子。在一些实施方案中，扩增引物包含核酸靶的互补物。在一些实施方案中，核酸靶包括mRNA，并且其中扩增引物包含核酸靶的反义链的序列。在一些实施方案中，使寡核苷酸条形码的3’端延伸包括使用嗜中温DNA聚合酶、嗜热DNA聚合酶、嗜冷DNA聚合酶或其任何组合来使寡核苷酸条形码的3’端延伸。在一些实施方案中，延伸寡核苷酸条形码的3’端包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶来延伸寡核苷酸条形码的3’端，并且任选地DNA聚合酶包含Klenow片段。

方法可以包括：获得第一和/或第二多于一种延伸的条形码化核酸分子或其产物的序列信息。方法可以包括：获得第一、第二和第三多于一种单标记的核酸分子或其产物中的一种或更多种的序列信息。在一些实施方案中，获得序列信息包括将测序衔接子附接至第一和/或第二多于一种延伸的条形码化核酸分子或其产物。在一些实施方案中，获得序列信息包括将测序衔接子附接至第一、第二和/或第三多于一种单标记的核酸分子或其产物。在一些实施方案中，获得序列信息包括：获得包含第一和/或第二多于一种延伸的条形码化核酸分子或其产物，和/或第一、第二和第三多于一种单标记的核酸分子或其产物中的一种或更多种的多于一个测序读段的测序数据，其中多于一个测序读段中的每一个包含(1)细胞标记序列，(2)分子标记序列，和/或(3)核酸靶的子序列。在一些实施方案中，总测序读段的少于40％、少于20％、少于10％或少于5％来自第三多于一种延伸的条形码化核酸分子或其产物。在一些实施方案中，与其中TSO不包含阻断序列的互补物的可比方法相比，来自第三多于一种延伸的条形码化核酸分子或其产物的测序读段的数目减少至少约2倍。

在一些实施方案中，获得序列信息包括获得单细胞的BCR轻链和BCR重链的序列信息。在一些实施方案中，BCR轻链和BCR重链的序列信息包括BCR轻链和/或BCR重链的互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列。方法可以包括：基于所获得的序列信息使单细胞的BCR轻链和BCR重链进行配对。在一些实施方案中，样品包括多于一个单细胞，方法包括基于所获得的序列信息使至少50％的所述单细胞的BCR轻链和BCR重链进行配对。

在一些实施方案中，获得序列信息包括获得单细胞的TCRα链和TCRβ链的序列信息。在一些实施方案中，TCRα链和TCRβ链的序列信息包括TCRα链和/或TCRβ链的互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列。方法可以包括：基于所获得的序列信息使单细胞的TCRα链和TCRβ链进行配对。在一些实施方案中，样品包括多于一个单细胞，方法包括基于所获得的序列信息使至少50％的所述单细胞的TCRα链和TCRβ链进行配对。

获得序列信息可以包括获得单细胞的TCRγ链和TCRδ链的序列信息。在一些实施方案中，TCRγ链和TCRδ链的序列信息包括TCRγ链和/或TCRδ链的互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列。方法可以包括：基于所获得的序列信息使单细胞的TCRγ链和TCRδ链进行配对。在一些实施方案中，样品包括多于一个单细胞，方法包括基于所获得的序列信息使至少50％的所述单细胞的TCRγ链和TCRδ链进行配对。

在一些实施方案中，靶结合区的互补物包括靶结合区的反向互补序列和/或靶结合区的互补序列。在一些实施方案中，分子标记的互补物包括分子标记的反向互补序列和/或分子标记的互补序列。在一些实施方案中，第一和/或第二多于一种条形码化核酸分子包括条形码化脱氧核糖核酸(DNA)分子和/或条形码化核糖核酸(RNA)分子。在一些实施方案中，靶结合区包括寡dT序列、随机序列、靶特异性序列或其组合。在一些实施方案中，靶结合区包含多(dT)区，并且其中核酸靶包含多(dA)区。在一些实施方案中，样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。在一些实施方案中，核酸靶包括核酸分子，并且任选地，核酸分子包括核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA或其任何组合。在一些实施方案中，mRNA编码免疫受体。在一些实施方案中，核酸靶包含细胞组分结合试剂。在一些实施方案中，核酸分子与细胞组分结合试剂关联。方法可以包括：使核酸分子和细胞组分结合试剂解离。

在一些实施方案中，第一多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列。在一些实施方案中，多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸。在一些实施方案中，第一多于一种寡核苷酸条形码与固体支持物关联，并且任选地，与同一固体支持物关联的第一多于一种寡核苷酸条形码各自包含相同的样品标记，并且还任选地，第一多于一种寡核苷酸条形码的每一种样品标记包含至少6个核苷酸。在一些实施方案中，第一多于一种寡核苷酸条形码各自包含细胞标记，并且任选地，第一多于一种寡核苷酸条形码的每一种细胞标记包含至少6个核苷酸。在一些实施方案中，与同一固体支持物关联的寡核苷酸条形码包含相同的细胞标记。在一些实施方案中，与不同的固体支持物关联的寡核苷酸条形码包含不同的细胞标记。在一些实施方案中，第一和/或第二多于一种延伸的条形码化核酸分子各自包含细胞标记和细胞标记的互补物，并且任选地细胞标记的互补物包含细胞标记的反向互补序列和/或细胞标记的互补序列。

方法可以包括：在存在乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(DMSO)、甘油、甲酰胺、7-脱氮-GTP、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合中的一种或更多种的情况下，延伸与核酸靶的拷贝杂交的第一多于一种寡核苷酸条形码。在一些实施方案中，第一和第二多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列，任选地，第一和第二多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸。在一些实施方案中，第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码与固体支持物关联。在一些实施方案中，与同一固体支持物关联的第一和第二多于一种寡核苷酸条形码各自包含相同的样品标记，任选地第一和第二多于一种寡核苷酸条形码的每一种样品标记包含至少6个核苷酸。在一些实施方案中，第一和第二多于一种寡核苷酸条形码各自包含细胞标记，任选地，第一和第二多于一种寡核苷酸条形码的每一种细胞标记包含至少6个核苷酸。在一些实施方案中，(a)与同一固体支持物关联的第一和第二多于一种寡核苷酸条形码中的寡核苷酸条形码包含相同的细胞标记；和/或(b)与不同固体支持物关联的第一和第二多于一种寡核苷酸条形码中的寡核苷酸条形码包含不同的细胞标记。

在一些实施方案中，第一和第二多于一种延伸的条形码化核酸分子的延伸的条形码化核酸分子各自包含细胞标记和细胞标记的互补物，任选地细胞标记的互补物包含细胞标记的反向互补序列或细胞标记的互补序列。在一些实施方案中，第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码中的至少一种寡核苷酸条形码被固定或部分地固定在合成颗粒上，或者第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码中的至少一种寡核苷酸条形码被包封或部分地包封在合成颗粒中。在一些实施方案中，固体支持物包括合成颗粒或平坦表面。

在一些实施方案中，样品包括单细胞，方法包括将包含多于一种寡核苷酸条形码的合成颗粒与样品中的单细胞关联。方法可包括：在使合成颗粒与单细胞关联后裂解单细胞，并且任选地裂解单细胞包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。在一些实施方案中，合成颗粒和单细胞在同一孔中。在一些实施方案中，合成颗粒和单细胞在同一液滴中。在一些实施方案中，第一多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在合成颗粒上，或者第一多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在合成颗粒中。

合成颗粒可以是可破坏的。在一些实施方案中，合成颗粒包括珠，例如琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合；选自以下的材料：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合；以及可破坏的水凝胶颗粒。

在一些实施方案中，第一和第二多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含接头官能团，合成颗粒包含固体支持物官能团，并且支持物官能团和接头官能团彼此关联，并且任选地接头官能团和支持物官能团单独地选自C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮，以及其任何组合。在一些实施方案中，第一多于一种寡核苷酸条形码中的每一种包含接头官能团，合成颗粒包含固体支持物官能团，并且支持物官能团和接头官能团彼此关联，并且任选地接头官能团和支持物官能团单独地选自C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮，以及其任何组合。

本文的公开内容包括试剂盒。在一些实施方案中，试剂盒包含：第一多于一种寡核苷酸条形码，其中第一多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区，并且其中第一多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列；逆转录酶；包含(i)阻断序列的互补物和(ii)靶结合区或其一部分的模板转换寡核苷酸(TSO)；和/或缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶。

本文的公开内容包括试剂盒。在一些实施方案中，试剂盒包含：第一多于一种寡核苷酸条形码，其中第一多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区，并且其中第一多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列；第二多于一种寡核苷酸条形码，其中第二多于一种寡核苷酸条形码的每一种寡核苷酸条形码包含第二通用序列、第二分子标记和诱饵序列，其中第二多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列；包含(i)阻断序列的互补物和(ii)诱饵序列的模板转换寡核苷酸(TSO)；缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶；和/或逆转录酶。

在一些实施方案中，第一和/或第二多于一种寡核苷酸条形码中的寡核苷酸条形码包含细胞标记，任选地，细胞标记位于分子标记的5’。在一些实施方案中，第一和/或第二多于一种寡核苷酸条形码中的寡核苷酸条形码的至少一部分包含至少一个可变序列，任选地，第一和/或第二多于一种寡核苷酸条形码中的至少10种在可变序列处包含不同序列，任选地，细胞标记和/或分子标记的至少一部分包含可变序列。

在一些实施方案中，阻断序列位于第一和/或第二多于一种条形码化核酸分子的3’端。在一些实施方案中，阻断序列被配置为不与以下互补：(i)第一多于一种寡核苷酸条形码中的寡核苷酸条形码中靶结合区5’的区域；和/或(ii)第二多于一种寡核苷酸条形码中的寡核苷酸条形码中诱饵序列5’的区域。在一些实施方案中，阻断序列与以下少于约50％互补：(i)第一多于一种寡核苷酸条形码中的寡核苷酸条形码中靶结合区5’的区域；和/或(ii)第二多于一种寡核苷酸条形码中的寡核苷酸条形码中诱饵序列5’的区域。

在一些实施方案中，第一和/或第二多于一种寡核苷酸条形码中的寡核苷酸条形码的至少一部分包含不变序列，任选地，第一和/或第二多于一种寡核苷酸条形码中的每一种在不变序列处包含相同的序列。在一些实施方案中，不变序列的长度在大约1-15个核苷酸之间，任选地不变序列的长度为1个核苷酸。在一些实施方案中，不变序列位于细胞标记中，任选地，细胞标记包括细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分，还任选地，不变序列位于细胞标记的第三部分。在一些实施方案中，阻断序列包含阻断物核苷酸，其中阻断物核苷酸位于阻断序列的3’端。在一些实施方案中，阻断物核苷酸被配置为不与不变序列互补。在一些实施方案中，不变序列和诱饵序列之间的距离与诱饵序列的互补物和阻断物核苷酸之间的距离等距。在一些实施方案中，不变序列和靶结合区之间的距离与靶结合区的互补物和阻断物核苷酸之间的距离等距。

在一些实施方案中，TSO包含选自SEQ ID NO:1-7的序列，或与选自SEQ ID NO:1-7的序列表现出至少约50％同一性的序列。在一些实施方案中，阻断序列包含SEQ ID NO:1-7中任何一个的至少4个连续碱基。在一些实施方案中，阻断序列的互补物在TSO中诱饵序列的5’。在一些实施方案中，阻断序列的互补物在TSO中靶结合区或其部分的5’。在一些实施方案中，阻断序列的互补物包含阻断序列的反向互补序列，和/或阻断序列的互补序列。

在一些实施方案中，缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶包括嗜中温DNA聚合酶、嗜热DNA聚合酶、嗜冷DNA聚合酶或其任何组合。在一些实施方案中，DNA聚合酶包括Klenow片段。在一些实施方案中，逆转录酶包括病毒逆转录酶，任选地鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。在一些实施方案中，模板转换寡核苷酸包含一个或更多个3’核糖核苷酸，任选地三个3’核糖核苷酸，并且还任选地3’核糖核苷酸包含鸟嘌呤。试剂盒可以包含：以下中的一种或更多种：乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(DMSO)、甘油、甲酰胺、7-脱氮-GTP、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合。试剂盒可以包含：缓冲液、盒(cartridge)、一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂或其组合。在一些实施方案中，靶结合区包括基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。

附图简述

图1图示了非限制性示例性条形码。

图2示出了条形码化和数字计数的非限制性示例性工作流程。

图3是示出用于从多于一种靶产生在3’端条形码化的靶的索引文库的非限制性示例性过程的示意图。

图4A-图4E示出了使用5’条形码化和本文公开的模板转换寡核苷酸确定核酸靶(例如，免疫受体的V(D)J区)的序列的非限制性示例性工作流程的示意图。

图5示出了使用本文提供的组合物和方法确定核酸靶(例如，免疫受体的V(D)J区)的序列的非限制性示例性工作流程。

图6描绘了采用模板转换寡核苷酸TSO1(TATGCGTAGTAGGTATG rGrGrG；SEQ ID NO:1)的文库制备方法的非限制性示意图。

图7描绘了采用模板转换寡核苷酸TSO21(GTGGAGTCGTTATGCGTAGTAGGTATGrGrGrG；SEQ ID NO:4)的文库制备方法的非限制性示意图。

图8描绘了采用模板转换寡核苷酸TSO t21(TGTGGAGTCGTTATGCGTAGTAGGTATGrGrGrG；SEQ ID NO:5)的文库制备方法的非限制性示意图。

图9描绘了采用模板转换寡核苷酸TSO12(TATGCGTAGTAGGTATGGTGGAGTCGTrGrGrG；SEQ ID NO:3)的文库制备方法的非限制性示意图。

图10描绘了采用模板转换寡核苷酸TSO t2dT₂₅(TGTGGAGTCGTTTTTTTTTTTTTTTTTTTTTTTTTT rGrGrG；SEQ ID NO:6)的文库制备方法的非限制性示意图。

图11描绘了采用模板转换寡核苷酸TSO1(TATGCGTAGTAGGTATG rGrGrG；SEQ IDNO:1)的文库制备方法的非限制性示意图。

图12描绘了采用模板转换寡核苷酸TSO12(TATGCGTAGTAGGTATGGTGGAGTCGTrGrGrG；SEQ ID NO:3)的文库制备方法的非限制性示意图。

图13描绘了采用模板转换寡核苷酸TSO21(GTGGAGTCGTTATGCGTAGTAGGTATGrGrGrG；SEQ ID NO:4)的文库制备方法的非限制性示意图。

图14描绘了采用模板转换寡核苷酸TSO t21(TGTGGAGTCGTTATGCGTAGTAGGTATGrGrGrG；SEQ ID NO:5)的文库制备方法的非限制性示意图。

图15描绘了采用模板转换寡核苷酸TSO t2dT₂₅(TGTGGAGTCGTTTTTTTTTTTTTTTTTTTTTTTTTT rGrGrG；SEQ ID NO:6)的文库制备方法的非限制性示意图。

详述

以下详述中参考了形成本文的一部分的附图。在附图中，除非上下文另外指示，否则相似的符号通常标识相似的组成部分。在详述、附图和权利要求书中描述的说明性实施方案不意味着是限制性的。在不脱离本文提供的主题的精神或范围的情况下，可以利用其他实施方案，并且可以做出其他改变。将容易理解的是，如本文一般描述的以及附图中图示的本公开内容的方面能够以各种不同的配置来布置、替换、组合、分离和设计，所有这些都在本文中明确设想并且构成本公开内容的一部分。

本文提及的所有专利、公布的专利申请、其他出版物和来自GenBank的序列，以及其他数据库关于相关技术通过引用以其整体并入。

对少量核酸(例如信使核糖核苷酸(mRNA)分子)进行定量对于确定例如在不同发育阶段或在不同环境条件下在细胞中表达的基因是临床上重要的。然而，确定核酸分子(例如，mRNA分子)的绝对数目也可以是非常具有挑战性的，尤其是当分子数目非常小时。确定样品中分子的绝对数目的一种方法是数字聚合酶链式反应(PCR)。理想地，PCR在每个循环中产生相同拷贝的分子。然而，PCR可具有缺点使得每个分子以随机概率复制，且此概率根据PCR循环和基因序列而变化，这导致扩增偏倚和不准确的基因表达测量。具有独特分子标记(molecular labels，也称为分子索引(molecular indexes，MI))的随机条形码可以用于计数分子数目和校正扩增偏倚。诸如Precise^TM测定(Cellular Research,Inc.(Palo Alto,CA))和Rhapsody^TM测定(Becton,Dickinson and Company(Franklin Lakes,NJ))的随机条形码化可以通过使用分子标记(ML)在逆转录(RT)期间标记mRNA来校正由PCR和文库制备步骤诱导的偏倚。

Precise^TM测定可以利用具有在多(T)寡核苷酸上的大量(例如6561种至65536种)独特分子标记序列的随机条形码的非耗尽性池(non-depleting pool)，以在RT步骤期间与样品中的所有多(A)-mRNA杂交。随机条形码可以包含通用PCR引发位点。在RT期间，靶基因分子与随机条形码随机反应。每一种靶分子可以与随机条形码杂交，导致产生随机条形码化的互补核糖核苷酸(cDNA)分子。在标记后，可以将来自微孔板微孔的随机条形码化cDNA分子汇集到单个管中用于PCR扩增和测序。可以分析原始测序数据以产生读段的数目、具有独特分子标记序列的随机条形码的数目以及mRNA分子的数目。

定义

除非另外定义，否则本文使用的技术术语和科学术语具有与本公开内容所属领域的普通技术人员通常所理解的相同意义。参见，例如，Singleton等人,Dictionary ofMicrobiology and Molecular Biology，第2版，J.Wiley&Sons(New York,NY 1994)；Sambrook等人,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press(Cold Spring Harbor,NY 1989)。为了本公开内容的目的，下文定义了以下术语。

如本文使用的，术语“衔接子”可以意指促进关联的核酸的扩增或测序的序列。关联的核酸可以包括靶核酸。关联的核酸可以包括空间标记、靶标记、样品标记、索引标记或条形码序列(例如，分子标记)中的一种或更多种。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子。衔接子可以是双链或单链的。一种或更多种衔接子可以位于核酸的5’端或3’端。当衔接子在5’和3’端包含已知序列时，已知序列可以是相同或不同的序列。位于多核苷酸的5’和/或3’端的衔接子可以能够与固定在表面上的一种或更多种寡核苷酸杂交。在一些实施方案中，衔接子可以包含通用序列。通用序列可以是两种或更多种核酸分子共有的核苷酸序列的区域。两种或更多种核酸分子也可以具有不同序列的区域。因此，例如，5’衔接子可以包含相同和/或通用核酸序列，并且3’衔接子可以包含相同和/或通用序列。可以存在于多于一种核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单种通用引物复制或扩增多于一种不同序列。类似地，可以存在于核酸分子的集合中的不同成员中的至少一种、两种(例如，一对)或更多种通用序列可以允许使用与通用序列互补的至少一种、两种(例如，一对)或更多种单一通用引物复制或扩增多于一种不同序列。因此，通用引物包含可与此类通用序列杂交的序列。可以修饰具有靶核酸序列的分子以将通用衔接子(例如，非靶核酸序列)附接到不同靶核酸序列的一个末端或两个末端。与靶核酸附接的一种或更多种通用引物可以提供通用引物杂交的位点。附接到靶核酸的一种或更多种通用引物可以彼此相同或不同。

如本文使用的，术语“关联”或“与...关联”可以意指，两个或更多个物质可以被鉴定为在某个时间点共定位。关联可以意指，两个或更多个物质在或曾经在相似的容器内。关联可以是信息学关联。例如，关于两个或更多个物质的数字信息可以被存储并且可以用于确定一种或更多种物质在某个时间点共定位。关联也可以是物理关联。在一些实施方案中，两个或更多个关联的物质彼此“拴系”、“附接”或“固定”或与共同的固体或半固体表面“拴系”、“附接”或“固定”。关联可以指用于将标记与固体或半固体支持物(诸如珠)附接的共价或非共价方式。关联可以是靶与标记之间的共价键。关联可以包括两个分子(诸如靶分子和标记)之间的杂交。

如本文使用的，术语“互补”可以指两个核苷酸之间精确配对的能力。例如，如果核酸在给定位置处的核苷酸能够与另一个核酸的核苷酸形成氢键，则这两个核酸被认为在该位置处是彼此互补的。两个单链核酸分子之间的互补性可以是“部分的”，其中只有一些核苷酸结合，或者当单链分子之间存在全部互补性时它可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补，则第一核苷酸序列可以被称为第二序列的“互补物”。如果第一核苷酸序列和与第二序列相反的序列(即，核苷酸顺序相反)互补，则第一核苷酸序列可以被称为第二序列的“反向互补物”。如本文使用的，“互补”序列可以指序列的“互补物”或“反向互补物”。从本公开内容理解，如果一个分子可以与另一个分子杂交，则其可以与其所杂交的分子互补或部分互补。

如本文使用的，术语“数字计数”可以指用于估计样品中靶分子数目的方法。数字计数可以包括确定已经与样品中的靶关联的独特标记的数目的步骤。这种方法(其本质上可以是随机的)将计数分子的问题从相同分子的定位和鉴定问题转化为有关检测一组预定义标记的一系列是/否数字问题。

如本文使用的，术语“一种标记(label)”或“多于一种标记(labels)”可以指与样品中的靶关联的核酸代码。标记可以是例如核酸标记。标记可以是完全或部分可扩增的标记。标记可以是完全或部分可测序的标记。标记可以是可鉴定为有区别的天然核酸的一部分。标记可以是已知的序列。标记可以包括核酸序列的连接处，例如天然和非天然序列的连接处。如本文使用的，术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如，在多种实施方案中，可以使用标记来确定样品的身份、样品的来源、细胞的身份和/或靶。

如本文使用的，术语“非耗尽性储库(non-depleting reservoir)”可以指由许多不同标记组成的条形码(例如，随机条形码)的池。非耗尽性储库可以包括大量不同的条形码，使得当非耗尽性储库与靶池关联时，每一种靶可能与独特条形码关联。每一种标记的靶分子的独特性可以通过随机选择的统计来确定，并且取决于与标记的多样性相比在集合中相同的靶分子的拷贝数。所得的标记的靶分子的集合的大小可以通过条形码化处理的随机性质来确定，并且然后对检测到的条形码的数目的分析允许计算原始集合或样品中存在的靶分子的数目。当存在的靶分子的拷贝数与独特条形码的数目的比率低时，标记的靶分子是高度独特的(即，多于一种靶分子被给定标记标记的概率非常低)。

如本文使用的，术语“核酸”是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可以包括一种或更多种类似物(例如，改变的主链、糖或核酸碱基)。类似物的一些非限制性实例包括：5-溴尿嘧啶、肽核酸、非天然核酸(xeno nucleic acid)、吗啉代核酸(morpholinos)、锁核酸、二醇核酸、苏糖核酸、二脱氧核苷酸、虫草菌素、7-脱氮-GTP、荧光团(例如，罗丹明或与糖连接的荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫代尿苷、假尿苷、二氢尿苷、辫苷以及怀俄苷。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。

核酸可以包括一种或更多种修饰(例如，碱基修饰、主链修饰)，以为核酸提供新的或增强的特征(例如，改进的稳定性)。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两个最常见的类别是嘌呤和嘧啶。核苷酸可以是还包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括呋喃戊糖的那些核苷，磷酸基团可以连接到糖的2’、3’或5’羟基部分。在形成核酸时，磷酸基团可以将相邻的核苷彼此共价连接以形成线性聚合化合物。继而，此线性聚合化合物的各端可以进一步连接而形成环状化合物；然而，线性化合物通常是合适的。此外，线性化合物可以具有内部核苷酸碱基互补性，并且因此可以按产生完全或部分双链化合物的方式折叠。在核酸中，磷酸基团通常可以称为形成核酸的核苷间主链。键(linkage)或主链可以是3’到5’磷酸二酯键。

核酸可以包括经修饰的主链和/或经修饰的核苷间键。经修饰的主链可以包括那些在主链中保留磷原子的主链和那些在主链中没有磷原子的主链。合适的其中含磷原子的经修饰的核酸主链可以包括，例如，硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基膦酸酯和其他烷基膦酸酯诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、亚膦酸酯、磷酰胺酯(phosphoramidate)(包括3’-氨基磷酰胺酯和氨基烷基磷酰胺酯、磷酸二酰胺酯(phosphorodiamidates)、硫代磷酰胺酯(thionophosphoramidates))、硫代烷基磷酸酯、硫代烷基磷酸三酯、硒代磷酸酯(selenophosphates)和硼磷酸酯(boranophosphates)，具有正常3’-5’连接、2’-5’连接的类似物以及具有反向极性的类似物(其中一个或更多个核苷酸间连接是3’至3’、5’至5’或2’至2’连接)。

核酸可以包含由以下形成的多核苷酸主链：短链烷基或环烷基核苷间连接、混合杂原子和烷基或环烷基核苷间连接，或者一个或更多个短链杂原子核苷间连接或杂环核苷间连接。这些可以包括具有吗啉代(morpholino)连接的那些(部分地由核苷的糖部分形成)；硅氧烷主链；硫化物、亚砜和砜主链；甲乙酰基(formacetyl)和硫代甲乙酰基主链；亚甲基甲乙酰基和硫代甲乙酰基主链；核糖乙酰基主链；含烯烃的主链；氨基磺酸酯主链；亚甲基亚氨基和亚甲基肼基主链；磺酸酯和磺酰胺主链；酰胺主链；和具有混合的N、O、S和CH₂组分部分的其他的那些。

核酸可以包括核酸模拟物。术语“模拟物”可意在包括其中仅呋喃糖环或呋喃糖环和核苷酸间连接两者被非呋喃糖基团代替的多核苷酸，仅呋喃糖环的代替也可称为糖替代物。杂环碱基部分或修饰的杂环碱基部分可被保持以与适当的靶核酸杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中，多核苷酸的糖主链可以被含酰胺的主链替代，特别是被氨基乙基甘氨酸主链替代。核苷酸可以被保留，并且直接或间接与主链的酰胺部分的氮杂氮原子结合。PNA化合物中的主链可以包含两个或更多个连接的氨基乙基甘氨酸单元，这使得PNA具有含酰胺的主链。杂环碱基部分可以直接或间接与主链的酰胺部分的氮杂氮原子结合。

核酸可以包括吗啉代主链结构。例如，核酸可以包含替代核糖环的6元吗啉代环。在这些实施方案的一些中，磷酸二酰胺酯或其他非磷酸二酯核苷间键可以替代磷酸二酯键。

核酸可以包括具有附接至吗啉代环的杂环碱基的连接的吗啉代单元(例如，吗啉代核酸)。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物与细胞蛋白可以具有较少的不期望的相互作用。基于吗啉代的多核苷酸可以是核酸的非离子模拟物。吗啉代类别内的各种化合物可以使用不同的连接基团来连接。另一类多核苷酸模拟物可以称为环己烯基核酸(CeNA)。核酸分子中通常存在的呋喃糖环可以被环己烯基环代替。使用亚磷酰胺化学可以制备CeNA DMT保护的亚磷酰胺单体并用于寡聚化合物合成。将CeNA单体掺入核酸链可以增加DNA/RNA杂合体的稳定性。CeNA寡腺苷酸酯可以与核酸互补物形成复合体，具有与天然复合体相似的稳定性。另外的修饰可以包括锁核酸(LNA)，其中2’-羟基基团连接到糖环的4’碳原子，从而形成2’-C,4’-C-氧亚甲基连接，从而形成双环糖部分。连接可以是桥接2’氧原子和4’碳原子的亚甲基(-CH₂-)_n基团，其中n是1或2。LNA和LNA类似物可以显示出与互补核酸的非常高的双链体热稳定性(Tm＝+3℃至+10℃)、对3’-核酸外切酶降解的稳定性和良好的溶解度特性。

核酸还可以包括核碱基(通常简称为“碱基”)修饰或取代。如本文使用的，“未修饰的”或“天然的”核碱基可以包括嘌呤碱基(例如，腺嘌呤(A)和鸟嘌呤(G))，以及嘧啶碱基(例如，胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。经修饰的核碱基可以包括其他合成以及天然的核碱基，诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物、2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-卤素尿嘧啶(5-halouracil)和胞嘧啶、5-丙炔基(-C≡C-CH₃)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶，8-卤素、8-氨基、8-硫代、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤，5-卤素特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶，7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基可以包括三环嘧啶，诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-夹类(G-clamps)，诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-夹类，诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3’,2’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。

如本文使用的，术语“样品”可以指包含靶的组合物。用于通过所公开的方法、装置和***进行分析的合适样品包括细胞、组织、器官或生物体。

如本文使用的，术语“采样装置”或“装置”可以指可以取样品的切片和/或将所述切片放置在基底上的装置。采样装置可以指例如荧光激活细胞分选(FACS)机、细胞分选机、活检针、活检装置、组织切片装置、微流体装置、刀片格栅和/或超薄切片机。

如本文使用的，术语“固体支持物”可以指可以附接多于一种条形码(例如，随机条形码)的离散固体或半固体表面。固体支持物可以包括任何类型的实心的、多孔的或空心的球体、球、承座(bearing)、圆柱体或由塑料、陶瓷、金属或聚合材料(例如，水凝胶)构成的其他类似配置，其上可以固定(例如，共价地或非共价地)核酸。固体支持物可以包括可以是球形的(例如，微球)或具有非球形或不规则形状的离散颗粒，所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。珠的形状可以是非球形的。以阵列间隔开的多于一个固体支持物可以不包括基底。固体支持物可以与术语“珠”互换使用。

如本文使用的，术语“随机条形码”可以指本公开内容的包含标记的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如，随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。

如本文使用的，术语“基因特异性随机条形码”可以指包含标记和基因特异性的靶结合区的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如，随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。

如本文使用的，术语“随机条形码化”可以指核酸的随机标记(例如，条形码化)。随机条形码化可以利用递归泊松策略来关联并对与靶关联的标记进行定量。如本文使用的，术语“随机条形码化”可以与“随机标记”互换使用。

如本文使用的，术语“靶”可以指可与条形码(例如，随机条形码)关联的组合物。用于通过所公开的方法、装置和***进行分析的示例性合适的靶包括寡核苷酸、DNA、RNA、mRNA、微RNA、tRNA等。靶可以是单链的或双链的。在一些实施方案中，靶可以是蛋白、肽或多肽。在一些实施方案中，靶是脂质。如本文使用的，“靶”可以与“物质(species)”互换使用。

如本文使用的，术语“逆转录酶”可以指具有逆转录酶活性(即，催化从RNA模板合成DNA)的一组酶。通常，这样的酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒(retroplasmid)逆转录酶、逆转录子逆转录酶、细菌逆转录酶、II组内含子衍生的逆转录酶，及它们的突变体、变体或衍生物。非逆转录病毒逆转录酶包括非LTR逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶和II组内含子逆转录酶。II组内含子逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)LI.LtrB内含子逆转录酶、细长嗜热聚球藻(Thermosynechococcus elongatus)TeI4c内含子逆转录酶或嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)GsI-IIC内含子逆转录酶。其他类别的逆转录酶可以包括许多类型的非逆转录病毒逆转录酶(即，尤其是逆转录子、II组内含子、以及多样性产生型逆转录元件)。

术语“通用衔接子引物”、“通用引物衔接子”或“通用衔接子序列”可互换地使用，以指可以用于与条形码(例如，随机条形码)杂交以产生基因特异性条形码的核苷酸序列。通用衔接子序列可以例如是在本公开内容的方法中使用的遍及所有条形码通用的已知序列。例如，当使用本文公开的方法标记多于一种靶时，每一种靶特异性序列可以连接到相同的通用衔接子序列。在一些实施方案中，多于一种通用衔接子序列可以用于本文公开的方法中。例如，当使用本文公开的方法标记多于一种靶时，至少两种靶特异性序列连接到不同的通用衔接子序列。通用衔接子引物及其互补物可以被包括在两种寡核苷酸中，其中的一种寡核苷酸包含靶特异性序列且另一种寡核苷酸包含条形码。例如，通用衔接子序列可以是包含靶特异性序列的寡核苷酸的一部分以产生与靶核酸互补的核苷酸序列。包含条形码和通用衔接子序列的互补序列的第二寡核苷酸可与核苷酸序列杂交并产生靶特异性条形码(例如，靶特异性随机条形码)。在一些实施方案中，通用衔接子引物具有与本公开内容的方法中使用的通用PCR引物不同的序列。

条形码

条形码化，诸如随机条形码化，已在例如US 2015/0299784、WO 2015/031691和Fu等人,Proc Natl Acad Sci U.S.A.2011年5月31日；108(22):9026-31中描述，这些出版物的内容特此以其整体并入。在一些实施方案中，本文公开的条形码可以是随机条形码，所述随机条形码可以是可以用于对靶随机标记(例如，条形码化、加标签)的多核苷酸序列。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例可以是以下或可以是约以下：1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或这些值中的任何两个值之间的数字或范围，则条形码可以称为随机条形码。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例是至少以下或是至多以下：1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1，则条形码可以称为随机条形码。随机条形码的条形码序列可以称为分子标记。

条形码(例如，随机条形码)可以包括一种或更多种标记。示例性标记可以包括通用标记、细胞标记、条形码序列(例如，分子标记)、样品标记、板标记、空间标记和/或前空间标记(pre-spatial label)。图1图示了具有空间标记的示例性条形码104。条形码104可以包含可以使条形码与固体支持物108连接的5’胺。条形码可以包含通用标记、维度标记、空间标记、细胞标记和/或分子标记。条形码中不同标记(包括但不限于通用标记、维度标记、空间标记、细胞标记和分子标记)的顺序可以变化。例如，如图1所示，通用标记可以是最5’侧的标记，并且分子标记可以是最3’侧的标记。空间标记、维度标记和细胞标记可以处于任何顺序。在一些实施方案中，通用标记、空间标记、维度标记、细胞标记和分子标记是处于任何顺序的。条形码可以包含靶结合区。靶结合区可以与样品中的靶(例如，靶核酸、RNA、mRNA、DNA)相互作用。例如，靶结合区可以包含可以与mRNA的多(A)尾相互作用的寡(dT)序列。在一些情况下，条形码的标记(例如，通用标记、维度标记、空间标记、细胞标记和条形码序列)可以由1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸隔开。

标记(例如，细胞标记)可以包含一组独特的定义长度的核酸子序列，例如各七个核苷酸(相当于一些汉明错误校正代码中使用的比特数目)，其可被设计成提供错误校正能力。可以设计包含七个核苷酸序列的错误校正子序列组，使得所述组中的序列的任何成对组合展现出定义的“遗传距离”(或错配碱基数)，例如一组错误校正子序列可被设计成展现三个核苷酸的遗传距离。在这种情况下，对于标记的靶核酸分子的序列数据组中的错误校正序列的审查(在下文更详细地描述)可允许人们检测或校正扩增错误或测序错误。在一些实施方案中，用于产生错误校正代码的核酸子序列的长度可以变化，例如，它们的长度可以是以下或可以是约以下：1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、31个、40个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。在一些实施方案中，其他长度的核酸子序列可以用来产生错误校正代码。

条形码可以包含靶结合区。靶结合区可以与样品中的靶相互作用。靶可以是以下或包括以下：核糖核酸(RNA)、信使RNA(mRNA)、微小RNA、小干扰RNA(siRNA)、RNA降解产物、各自含有多(A)尾的RNA或其任何组合。在一些实施方案中，多于一种靶可以包括脱氧核糖核酸(DNA)。

在一些实施方案中，靶结合区可以包括可以与mRNA的多(A)尾相互作用的寡(dT)序列。条形码的一种或更多种标记(例如，通用标记、维度标记、空间标记、细胞标记和条形码序列(例如，分子标记))可以通过间隔区(spacer)与条形码的另一种或两种剩余标记隔开。间隔区可以是例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸。在一些实施方案中，条形码的所有标记都未被间隔区隔开。

通用标记

条形码可以包含一种或更多种通用标记。在一些实施方案中，一种或更多种通用标记对于附接至给定固体支持物的条形码组中的所有条形码可以是相同的。在一些实施方案中，一种或更多种通用标记对于附接至多于一个珠的所有条形码可以是相同的。在一些实施方案中，通用标记可以包括能够与测序引物杂交的核酸序列。测序引物可以用于对包括通用标记的条形码进行测序。测序引物(例如，通用测序引物)可以包括与高通量测序平台关联的测序引物。在一些实施方案中，通用标记可以包括能够与PCR引物杂交的核酸序列。在一些实施方案中，通用标记可以包括能够与测序引物和PCR引物杂交的核酸序列。能够与测序引物或PCR引物杂交的通用标记的核酸序列可以被称为引物结合位点。通用标记可以包括可以用于引发条形码转录的序列。通用标记可以包括可以用于延伸条形码或条形码内的区域的序列。通用标记的长度可以是或大约是以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。例如，通用标记可以包括至少约10个核苷酸。通用标记的长度可以至少是或至多是以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。在一些实施方案中，可裂解接头或经修饰的核苷酸可以是通用标记序列的一部分，以使条形码能够从支持物上被裂解下来。

维度标记

条形码可以包含一种或更多种维度标记。在一些实施方案中，维度标记可以包括提供关于标记(例如，随机标记)发生的维度的信息的核酸序列。例如，维度标记可以提供关于靶被条形码化的时间的信息。维度标记可以与样品中条形码化(例如，随机条形码化)的时间关联。维度标记可以在标记的时间被激活。不同的维度标记可以在不同的时间被激活。维度标记提供关于靶、靶的组和/或样品被条形码化的顺序的信息。例如，在细胞周期的G0期可以将细胞的群体条形码化。在细胞周期的G1期，可以用条形码(例如，随机条形码)对细胞再次进行脉冲处理。在细胞周期的S期，可以用条形码对细胞再次进行脉冲处理，等等。每次脉冲(例如，细胞周期的每个期)时的条形码可以包含不同的维度标记。以这种方式，维度标记提供关于哪些靶在细胞周期的哪个期被标记的信息。维度标记可以探询许多不同的生物学时间。示例性的生物学时间可以包括但不限于细胞周期、转录(例如，转录起始)和转录物降解。在另一种实例中，样品(例如，细胞、细胞的群体)可以在用药物和/或疗法治疗之前和/或之后标记。不同靶的拷贝数的变化可以指示样品对药物和/或疗法的响应。

维度标记可以是可激活的。可激活的维度标记可以在特定时间点被激活。可激活的标记可以被例如组成型地激活(例如，不关闭)。可激活的维度标记可以被例如可逆地激活(例如，可激活的维度标记可以被打开和关闭)。维度标记可以被例如可逆地激活至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。维度标记可以被可逆地激活例如至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。在一些实施方案中，可以用荧光、光、化学事件(例如，裂解，连接另一种分子，添加修饰(例如，聚乙二醇化、类泛素化(sumoylate)、乙酰化、甲基化、去乙酰化、去甲基化)、光化学事件(例如，光罩(photocaging))以及引入非天然的核苷酸将维度标记激活。

在一些实施方案中，维度标记对于附接至给定固体支持物(例如，珠)的所有条形码(例如，随机条形码)可以是相同的，但对于不同的固体支持物(例如，珠)是不同的。在一些实施方案中，同一固体支持物上至少60％、70％、80％、85％、90％、95％、97％、99％或100％的条形码可以包含相同的维度标记。在一些实施方案中，同一固体支持物上至少60％的条形码可以包含相同的维度标记。在一些实施方案中，同一固体支持物上至少95％的条形码可以包含相同的维度标记。

多于一个固体支持物(例如，珠)中可以呈现多达10⁶种或更多种独特维度标记序列。维度标记的长度可以是、大约是、至少是或至多是以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、125个、150个、200个或300个或这些值中的任何两个值之间的数字或范围的核苷酸。

空间标记

条形码可以包含一种或更多种空间标记。在一些实施方案中，空间标记可以包含提供关于与条形码关联的靶分子的空间取向的信息的核酸序列。空间标记可以与样品中的坐标关联。坐标可以是固定的坐标。例如，坐标可以相对于基底固定。空间标记可以参考二维或三维网格。坐标可以相对于界标(landmark)固定。界标可在空间中被鉴定。界标可以是可被成像的结构。界标可以是生物结构，例如解剖学界标。界标可以是细胞界标，例如细胞器。界标可以是非天然界标，诸如具有可鉴定标识(诸如色码、条形码、磁特性(magneticproperty)、荧光、放射性或独特尺寸或形状)的结构。空间标记可以与物理分区(例如，孔、容器或液滴)关联。在一些实施方案中，将多于一种空间标记一起用于编码空间中的一个或更多个位置。

空间标记对于附接至给定固体支持物(例如，珠)的所有条形码可以是相同的，但对于不同的固体支持物(例如，珠)是不同的。在一些实施方案中，同一固体支持物上包含相同空间标记的条形码的百分比可以是以下或可以是约以下：60％、70％、80％、85％、90％、95％、97％、99％、100％或在这些值中的任何两个之间的数字或范围。在一些实施方案中，同一固体支持物上包含相同空间标记的条形码的百分比可以是至少以下或是至多以下：60％、70％、80％、85％、90％、95％、97％、99％或100％。在一些实施方案中，同一固体支持物上至少60％的条形码可以包含相同的空间标记。在一些实施方案中，同一固体支持物上至少95％的条形码可以包含相同的空间标记。

多于一个固体支持物(例如，珠)中可以呈现多达10⁶种或更多种独特空间标记序列。空间标记的长度可以是、大约是、至少是或至多是以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、150个、200个、250个、300个或这些值中的任何两个值之间的数字或范围的核苷酸。空间标记可以包含长度在约20个至约125个之间的核苷酸。

细胞标记

条形码(例如，随机条形码)可以包含一种或更多种细胞标记。在一些实施方案中，细胞标记可以包含提供用于确定哪种靶核酸来源于哪种细胞的信息的核酸序列。在一些实施方案中，细胞标记对于附接至给定固体支持物(例如，珠)的所有条形码是相同的，但对于不同的固体支持物(例如，珠)是不同的。在一些实施方案中，同一固体支持物上包含相同细胞标记的条形码的百分比可以是、大约是、至少大约是、至多大约是以下：60％、70％、80％、85％、90％、95％、97％、99％、100％或这些值中的任何两个值之间的数字或范围。

多于一个固体支持物(例如，珠)中可以呈现多达10⁶种或更多种独特细胞标记序列。细胞标记的长度可以是以下，或是约以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸，或在这些值中的任何两个值之间的数字或范围的核苷酸。细胞标记的长度可以是至少，或至多是以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、125个、150个、200个或300个核苷酸。

条形码序列

条形码可以包含一种或更多种条形码序列。在一些实施方案中，条形码序列可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。条形码序列可以包含为与条形码(例如，靶结合区)杂交的靶核酸物质的特定出现提供计数器(例如，提供粗略估计)的核酸序列。

在一些实施方案中，将一组相异的(diverse)条形码序列附接至给定固体支持物(例如，珠)。在一些实施方案中，可以存在以下或可以存在约以下：10²种、10³种、10⁴种、10⁵种、10⁶种、10⁷种、10⁸种、10⁹种独特分子标记序列或在这些值中的任何两个之间的数字或范围的独特分子标记序列。例如，多于一种条形码可以包括约6561种具有不同序列的条形码序列。作为另一种实例，多于一种条形码可以包括约65536种具有不同序列的条形码序列。在一些实施方案中，可以存在至少或至多10²种、10³种、10⁴种、10⁵种、10⁶种、10⁷种、10⁸种或10⁹种独特条形码序列。独特分子标记序列可以附接至给定固体支持物(例如，珠)。在一些实施方案中，独特分子标记序列被颗粒(例如水凝胶珠)部分或全部包含。

在不同实施方式中，条形码的长度可以是不同的。例如，条形码的长度可以是以下或可以是约以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。作为另一种实例，条形码的长度可以是至少以下或可以是至多以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。

分子标记

条形码(例如，随机条形码)可以包含一种或更多种分子标记。分子标记可以包括条形码序列。在一些实施方案中，分子标记可以包括提供与条形码杂交的特定类型的靶核酸物质的鉴定信息的核酸序列。分子标记可以包含为与条形码(例如，靶结合区)杂交的靶核酸物质的特定出现提供计数器的核酸序列。

在一些实施方案中，将一组相异的分子标记附接至给定固体支持物(例如，珠)。在一些实施方案中，可以存在以下或可以存在约以下：10²种、10³种、10⁴种、10⁵种、10⁶种、10⁷种、10⁸种、10⁹种或在这些值中的任何两个之间的数字或范围的独特分子标记序列。例如，多于一种条形码可以包括约6561种具有不同序列的分子标记。作为另一种实例，多于一种条形码可以包括约65536种具有不同序列的分子标记。在一些实施方案中，可以存在至少或至多10²种、10³种、10⁴种、10⁵种、10⁶种、10⁷种、10⁸种或10⁹种独特分子标记序列。具有独特分子标记序列的条形码可以附接至给定固体支持物(例如，珠)。

对于使用多于一种随机条形码进行的条形码化(例如随机条形码化)，不同分子标记序列的数目与任何靶的出现次数的比例可以是、大约是、至少是或至多是以下：1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1，或这些值中的任何两个值之间的数字或范围。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。

分子标记的长度可以是以下或可以是约以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。分子标记的长度可以是至少以下或可以是至多以下：1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。

靶结合区

条形码可以包含一个或更多个靶结合区，诸如捕获探针。在一些实施方案中，靶结合区可以与感兴趣的靶杂交。在一些实施方案中，靶结合区可以包含与靶(例如，靶核酸、靶分子，例如待分析的细胞核酸)特异性杂交(例如，与特定基因序列特异性杂交)的核酸序列。在一些实施方案中，靶结合区可以包含可以附接(例如，杂交)至特定靶核酸的特定位置的核酸序列。在一些实施方案中，靶结合区可以包含能够与限制性酶位点突出端(例如，EcoRI粘性末端突出端)特异性杂交的核酸序列。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。

在一些实施方案中，靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以指可以独立于靶核酸的特定序列结合多于一种靶核酸的序列。例如，靶结合区可以包括随机多聚体序列或与mRNA分子上的多(A)尾杂交的寡(dT)序列。随机多聚体序列可以是，例如，随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或任何长度的更高多聚体序列。在一些实施方案中，对于附接至给定珠的所有条形码，靶结合区是相同的。在一些实施方案中，对于附接至给定珠的多于一种条形码，靶结合区可以包括两种或更多种不同的靶结合序列。靶结合区的长度可以是以下，或是约以下：5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸，或在这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。

在一些实施方案中，靶结合区可以包含寡(dT)，所述寡(dT)可以与包含聚腺苷酸化末端的mRNA杂交。靶结合区可以是基因特异性的。例如，可以将靶结合区配置为与靶的特定区域杂交。靶结合区的长度可以是、大约是、至少是或至多是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或这些值中任何两个之间的数字或范围的核苷酸。当条形码包含基因特异性靶结合区时，条形码在本文中可以称为基因特异性条形码。

定向特性

随机条形码(例如，随机条形码)可以包含一种或更多种可以用于对条形码进行定向(例如，比对)的定向特性。条形码可以包含用于等电聚焦的部分。不同的条形码可以包含不同的等电聚焦点。当将这些条形码引入样品中时，样品可以经历等电聚焦，以便于将条形码定向成已知的方式。以这种方式，定向特性可以用于开发样品中条形码的已知的映射。示例性定向特性可以包括电泳迁移率(例如，基于条形码的尺寸)、等电点、自旋、电导率和/或自组装。例如，具有自组装的定向特性的条形码激活时可以自组装成特定的定向(例如，核酸纳米结构)。

亲和特性

条形码(例如，随机条形码)可以包含一种或更多种亲和特性。例如，空间标记可以包含亲和特性。亲和特性可以包括可以促进条形码与另一种实体(例如，细胞受体)结合的化学部分和/或生物部分。例如，亲和特性可以包括抗体，例如，对样品上的特定部分(例如，受体)特异性的抗体。在一些实施方案中，抗体可以将条形码引导至特定细胞类型或分子。在特定细胞类型或分子处和/或特定细胞类型或分子附近的靶可以被标记(例如，被随机标记)。在一些实施方案中，亲和特性可以提供空间标记的核苷酸序列之外的空间信息，因为抗体可以将条形码引导至特定位置。抗体可以是治疗性抗体，例如单克隆抗体或多克隆抗体。抗体可以是人源化的或嵌合的。抗体可以是裸抗体或融合抗体。

抗体可以是全长(即，天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如，IgG抗体)或免疫球蛋白分子的免疫活性(即，特异性结合性)部分(如抗体片段)。

抗体片段可以是例如抗体的一部分，诸如F(ab’)2、Fab’、Fab、Fv、sFv等。在一些实施方案中，抗体片段可以与由全长抗体识别的相同抗原结合。抗体片段可以包括由抗体的可变区组成的分离的片段，诸如由重链和轻链的可变区组成的“Fv”片段和其中轻链和重链的可变区通过肽接头连接的重组单链多肽分子(“scFv蛋白”)。示例性抗体可以包括但不限于癌细胞抗体、病毒抗体、结合至细胞表面受体(CD8、CD34、CD45)的抗体，和治疗性抗体。

通用衔接子引物

条形码可以包含一种或更多种通用衔接子引物。例如，基因特异性条形码(诸如基因特异性随机条形码)可以包含通用衔接子引物。通用衔接子引物可以指遍及所有条形码通用的核苷酸序列。通用衔接子引物可以用于构建基因特异性条形码。通用衔接子引物的长度可以是、大约是、至少是或至多是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或这些值中任何两个值之间的数字或范围的核苷酸。

接头

当条形码包含多于一种类型的标记(例如，多于一种细胞标记或多于一种条形码序列，诸如一种分子标记)时，标记之间可以散布有接头标记序列。接头标记序列的长度可以是至少约或至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。在一些情况下，接头标记序列的长度是12个核苷酸。接头标记序列可以用于促进条形码的合成。接头标记可以包括纠错(例如汉明)码。

固体支持物

在一些实施方案中，本文公开的条形码(诸如随机条形码)可以与固体支持物关联。固体支持物可以是例如合成颗粒。在一些实施方案中，固体支持物上的多于一种条形码(例如，第一多于一种条形码)的一些或所有条形码序列(诸如，随机条形码(例如，第一条形码序列)的分子标记)相差至少一个核苷酸。同一固体支持物上的条形码的细胞标记可以是相同的。不同固体支持物上的条形码的细胞标记可以相差至少一个核苷酸。例如，第一固体支持物上的第一多于一种条形码的第一细胞标记可以具有相同的序列，且第二固体支持物上的第二多于一种条形码的第二细胞标记可以具有相同的序列。第一固体支持物上的第一多于一种条形码的第一细胞标记和第二固体支持物上的第二多于一种条形码的第二细胞标记可以相差至少一个核苷酸。细胞标记、条形码或两者可以是例如大约5-20个核苷酸长。合成颗粒可以是例如珠。

珠可以是例如硅胶珠、可控孔径玻璃珠、磁珠、Dynabeads、交联葡聚糖/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠或其任何组合。珠可以包括材料诸如聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮或其任何组合。

在一些实施方案中，珠可以是用条形码或随机条形码官能化的聚合物珠(例如可变形珠或凝胶珠)(诸如来自10X Genomics(San Francisco,CA)的凝胶珠)。在一些实施方式中，凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如，四甲基乙二胺(TEMED))后，可以产生凝胶珠。

在一些实施方案中，颗粒可以是可破坏的(例如，可溶解的、可降解的)。例如，聚合物珠可以例如在期望的条件下溶解、熔化或降解。所期望的条件可以包括环境条件。所期望的条件可以导致聚合物珠以受控方式溶解、熔化或降解。凝胶珠可以由于化学刺激、物理刺激、生物刺激、热刺激、磁刺激、电刺激、光刺激或其任何组合而溶解、熔化或降解。

例如，分析物和/或试剂(诸如寡核苷酸条形码)可以偶联/固定至凝胶珠的内表面(例如，经由寡核苷酸条形码和/或用于产生寡核苷酸条形码的材料的扩散而可及的内部)和/或凝胶珠的外表面或本文描述的任何其他微胶囊。偶联/固定可以经由任何形式的化学键合(例如，共价键、离子键)或物理现象(例如，范德华力、偶极-偶极相互作用等)。在一些实施方案中，本文描述的试剂与凝胶珠或任何其他微胶囊的偶联/固定可以是可逆的，诸如，例如经由不稳定型部分(例如，经由化学交联物，包括本文描述的化学交联物)。在施加刺激后，不稳定型部分可以被裂解并释放所固定的试剂。在一些实施方案中，不稳定型部分是二硫键。例如，在经由二硫键将寡核苷酸条形码固定至凝胶珠的情况下，使二硫键暴露于还原剂可以裂解二硫键并从珠释放寡核苷酸条形码。不稳定型部分可以作为凝胶珠或微胶囊的一部分、作为将试剂或分析物与凝胶珠或微胶囊连接的化学接头的一部分和/或作为试剂或分析物的一部分被包括。在一些实施方案中，多于一种条形码的至少一种条形码可以被固定在颗粒上、被部分固定在颗粒上、被包封在颗粒中、被部分包封在颗粒中或其任何组合。

在一些实施方案中，凝胶珠可以包括宽范围的不同的聚合物，包括但不限于：聚合物、热敏聚合物、光敏聚合物、磁性聚合物、pH敏感聚合物、盐敏感聚合物、化学敏感聚合物、聚电解质、多糖、肽、蛋白和/或塑料。聚合物可以包括但不限于以下材料：诸如聚(N-异丙基丙烯酰胺)(PNIPAAm)、聚(苯乙烯磺酸酯)(PSS)、聚(烯丙基胺)(PAAm)、聚(丙烯酸)(PAA)、聚(乙烯亚胺)(PEI)、聚(双烯丙基二甲基-氯化铵)(PDADMAC)、聚(吡咯)(poly(pyrolle)，PPy)、聚(乙烯基吡咯烷酮)(PVPON)、聚(乙烯基吡啶)(PVP)、聚(甲基丙烯酸)(PMAA)、聚(甲基丙烯酸甲酯)(PMMA)、聚苯乙烯(PS)、聚(四氢呋喃)(PTHF)、聚(邻苯二甲醛)(PPA)、聚(己基紫精)(PHV)、聚(L-赖氨酸)(PLL)、聚(L-精氨酸)(PARG)、聚(乳酸-共-羟基乙酸)(PLGA)。

许多化学刺激可以用于触发珠的破坏、溶解或降解。这些化学改变的实例可以包括但不限于pH介导的珠壁改变、经由交联键的化学裂解使珠壁崩解、珠壁的触发解聚和珠壁转换反应。批量(bulk)改变也可以用于触发珠的破坏。

通过各种刺激对微胶囊的批量或物理改变在设计胶囊以释放试剂方面也提供了许多优点。在宏观尺度上发生批量或物理改变，其中珠破裂是由刺激引起的机械-物理力的结果。这些过程可以包括但不限于压力引起的破裂、珠壁熔化或珠壁的孔隙率的改变。

生物刺激也可以用于触发珠的破坏、溶解或降解。通常，生物触发物类似于化学触发物，但是许多实例使用生物分子或生命***中常见的分子，诸如酶、肽、糖、脂肪酸、核酸等。例如，珠可以包含具有对特定蛋白酶的裂解敏感的肽交联的聚合物。更特别地，一种实例可以包括包含GFLGK肽交联的微胶囊。在添加生物触发物(诸如蛋白酶组织蛋白酶B(Cathepsin B))后，壳壁的肽交联被裂解并且珠的内容物被释放。在其他情况下，蛋白酶可以是热激活的。在另一种实例中，珠包括包含纤维素的壳壁。壳聚糖水解酶的添加用作纤维素键裂解、壳壁解聚及其内部内容物释放的生物触发物。

还可以在施加热刺激后诱导珠释放其内容物。温度的改变可以引起珠的各种改变。热量的变化可能导致珠的熔化，使得珠壁崩解。在一些实施方案中，热量可以增加珠内部组分的内部压力，使得珠破裂或***。在一些实施方案中，热量可以使珠转化成收缩的脱水状态。热量还可以作用于珠壁内的热敏聚合物，从而引起珠的破坏。

将磁性纳米颗粒包括在微胶囊的珠壁中可以允许珠的触发破裂以及将珠引导呈阵列形式。本公开内容的装置可以包括用于任一目的的磁珠。在一种实例中，将Fe3O4纳米颗粒掺入含聚电解质的珠中，在存在振荡磁场刺激的情况下触发破裂。

珠也可以由于电刺激的结果被破坏、溶解或降解。与先前部分中描述的磁性颗粒类似，电敏珠可以允许珠的触发破裂以及其他功能，诸如电场中的对齐、电导率或氧化还原反应。在一种实例中，含电敏材料的珠在电场中对齐，从而可以控制内部试剂的释放。在其他实例中，电场可以在珠壁自身内引起氧化还原反应，这可以增加孔隙率。

也可以使用光刺激来破坏珠。许多光触发物是可能的，并且可以包括使用各种分子(诸如能够吸收特定波长范围的光子的纳米颗粒和发色团)的***。例如，金属氧化物涂层可以用作胶囊触发物。涂覆有SiO2的聚电解质胶囊的UV照射可以导致珠壁的崩解。在又另一种实例中，可以将可光切换材料(诸如偶氮苯基团)掺入珠壁中。在施加UV或可见光后，诸如这些的化学物质在吸收光子后经历可逆的顺式-至-反式异构化。在此方面，光子开关(photon switch)的掺入产生在施加光触发后可以崩解或变得更多孔的珠壁。

例如，在图2示出的条形码化(例如，随机条形码化)的非限制性示例中，在框208将诸如单细胞的细胞引入到微孔阵列的多于一个微孔上之后，在框212可以将珠引入到微孔阵列的多于一个微孔上。每个微孔可以包含一个珠。珠可以包含多于一种条形码。条形码可以包含附接至珠的5’胺区域。条形码可以包含通用标记、条形码序列(例如，分子标记)、靶结合区或其任何组合。

本文公开的条形码可以与固体支持物(例如，珠)关联(例如，附接)。与固体支持物关联的条形码可各自包含选自这样的组的条形码序列，所述组包括至少100种或1000种具有独特序列的条形码序列。在一些实施方案中，与固体支持物关联的不同条形码可以包含具有不同序列的条形码。在一些实施方案中，与固体支持物关联的条形码的一定百分比包含相同的细胞标记。例如，百分比可以是、大约是、至少是或至多是60％、70％、80％、85％、90％、95％、97％、99％、100％，或者是这些值中任何两个值之间的数字或范围。在一些实施方案中，与固体支持物关联的条形码可以具有相同的细胞标记。与不同固体支持物关联的条形码可以具有选自这样的组的不同的细胞标记，所述组包括至少100种或1000种具有独特序列的细胞标记。

本文公开的条形码可以与固体支持物(例如，珠)关联(例如，附接)。在一些实施方案中，可以用包括与多于一种条形码关联的多于一种合成颗粒的固体支持物将样品中的多于一种靶条形码化。在一些实施方案中，固体支持物可以包括与多于一种条形码关联的多于一个合成颗粒。不同固体支持物上的多于一种条形码的空间标记可以相差至少一个核苷酸。固体支持物可以例如在二维或三维包括多于一种条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔径玻璃珠、磁珠、Dynabeads、交联葡聚糖/琼脂糖凝胶珠、珠状纤维素、聚苯乙烯珠或其任何组合。固体支持物可包括聚合物、基质、水凝胶、针阵列装置、抗体或其任何组合。在一些实施方案中，固体支持物可以自由浮动。在一些实施方案中，固体支持物可以包埋到半固体或固体阵列中。条形码可以不与固体支持物关联。条形码可以是单独的核苷酸。条形码可以与基底关联。

如本文使用的，术语“拴系的”、“附接的”和“固定的”可以互换使用，并且可以指用于将条形码附接至固体支持物的共价或非共价方式。可以将各种不同的固体支持物中的任何一种用作固体支持物，以用于附接预先合成的条形码或用于原位固相合成条形码。

在一些实施方案中，固体支持物是珠。珠可以包括一种或更多种类型的实心的、多孔的或空心的球体、球、承座、圆柱体或可以固定(例如，共价地或非共价地)核酸的其他类似配置。珠可以由例如塑料、陶瓷、金属、聚合物材料或其任何组合构成。珠可以是或包括球形的(例如，微球)或具有非球形或不规则形状的离散颗粒，所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。在一些实施方案中，珠的形状可以是非球形的。

珠可以包含各种材料，包括但不限于顺磁性材料(例如，镁、钼、锂和钽)、超顺磁性材料(例如，铁氧体(Fe₃O₄；磁铁矿)纳米颗粒)、铁磁材料(例如，铁、镍、钴，它们的一些合金，以及一些稀土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙或其任何组合。

在一些实施方案中，珠(例如，标记所附接的珠)是水凝胶珠。在一些实施方案中，珠包括水凝胶。

本文公开的一些实施方案包括一个或更多个颗粒(例如，珠)。每个颗粒可以包含多于一种寡核苷酸(例如，条形码)。多于一种寡核苷酸中的每一种可以包含条形码序列(例如，分子标记序列)、细胞标记和靶结合区(例如，寡(dT)序列、基因特异性序列、随机多聚体或其组合)。多于一种寡核苷酸的每一种的细胞标记序列可以是相同的。不同颗粒上的寡核苷酸的细胞标记序列可以是不同的，使得可以鉴定不同颗粒上的寡核苷酸。在不同实施方式中，不同细胞标记序列的数目可以是不同的。在一些实施方案中，细胞标记序列的数目可以是以下或可以是约以下：10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10⁶、10⁷、10⁸、10⁹、这些值中的任何两个值之间的数字或范围或更多。在一些实施方案中，细胞标记序列的数目可以是至少以下或可以是至多以下：10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10⁶、10⁷、10⁸或10⁹。在一些实施方案中，多于一个颗粒中的不超过1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个颗粒包括具有相同细胞序列的寡核苷酸。在一些实施方案中，包括具有相同细胞序列的寡核苷酸的多于一个颗粒可以是至多0.1％、0.2％、0.3％、0.4％、0.5％、0.6％、0.7％、0.8％、0.9％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％或更多。在一些实施方案中，多于一个颗粒中没有一个具有相同的细胞标记序列。

每个颗粒上的多于一种寡核苷酸可以包含不同的条形码序列(例如，分子标记)。在一些实施方案中，条形码序列的数目可以是以下或可以是约以下：10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10⁶、10⁷、10⁸、10⁹，或这些值中的任何两个值之间的数字或范围。在一些实施方案中，条形码序列的数目可以是至少以下或可以是至多以下：10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10⁶、10⁷、10⁸或10⁹。例如，多于一种寡核苷酸中的至少100种包含不同的条形码序列。作为另一个实例，在单个颗粒中，多于一种寡核苷酸中的至少100种、500种、1000种、5000种、10000种、15000种、20000种、50000种，这些值中的任何两个之间的数字或范围，或更多种包含不同的条形码序列。一些实施方案提供了包含条形码的多于一个颗粒。在一些实施方案中，待标记的靶和不同条形码序列的出现(或拷贝或数目)的比例可以是至少1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90或更高。在一些实施方案中，多于一种寡核苷酸的每一种还包含样品标记、通用标记或二者。颗粒可以是例如纳米颗粒或微米颗粒。

珠的尺寸可以不同。例如，珠的直径的范围可以是0.1微米至50微米。在一些实施方案中，珠的直径可以是以下或可以是约以下：0.1微米、0.5微米、1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米或50微米或在这些值中的任何两个之间的数字或范围。

珠的直径可以与基底的孔的直径相关。在一些实施方案中，珠的直径可以比孔的直径长或短以下或者约以下：10％、20％、30％、40％、50％、60％、70％、80％、90％、100％或在这些值中的任何两个之间的数字或范围。珠的直径可以与细胞(例如，被基底的孔捕获的单细胞)的直径相关。在一些实施方案中，珠的直径可以比孔的直径长或短至少或至多10％、20％、30％、40％、50％、60％、70％、80％、90％或100％。珠的直径可以与细胞(例如，被基底的孔捕获的单细胞)的直径相关。在一些实施方案中，珠的直径可以比细胞的直径长或短以下、或长或短大约以下、长或短至少或至多以下：10％、20％、30％、40％、50％、60％、70％、80％、90％、100％、150％、200％、250％、300％，或者这些值中的任何两个值之间的数字或范围。

珠可以附接至基底和/或包埋到基底中。珠可以附接至凝胶、水凝胶、聚合物和/或基质和/或包埋到凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上的条形码上存在的空间标记来鉴定，该空间标记可以用作位置地址。

珠的实例可以包括但不限于链霉抗生物素蛋白珠、琼脂糖珠、磁珠、微珠、抗体缀合的珠(例如，抗免疫球蛋白微珠)、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠和BcMag^TM羧基封端磁珠。

珠可以与量子点或荧光染料关联(例如，用量子点或荧光染料浸渍)，以使其在一个荧光光学通道或多于一个光学通道中发荧光。珠可以与氧化铁或氧化铬关联，使其成为顺磁性或铁磁性。珠可以是可鉴定的。例如，可以使用照相机对珠成像。珠可以具有与珠关联的可检测代码。例如，珠可以包含条形码。珠可以改变尺寸，例如由于在有机溶液或无机溶液中溶胀。珠可以是疏水的。珠可以是亲水的。珠可以是生物相容的。

固体支持物(例如，珠)可以被可视化。固体支持物可以包含可视化标签(例如，荧光染料)。固体支持物(例如，珠)可以蚀刻有标识符(例如，数字)。标识符可以通过对珠成像来可视化。

固体支持物可以包括可溶性、半溶性或不溶性材料。当固体支持物包括接头、支架、构建模块(building block)或其他与其附接的反应性部分时，固体支持物可以被称为“官能化的”，而当固体支持物缺少这种与其附接的反应性部分时，固体支持物可以被称为“非官能化的”。固体支持物可以以溶液中游离，诸如在微量滴定孔中的形式；以流通形式，诸如在柱中；或以浸量尺(dipstick)使用。

固体支持物可以包括膜、纸(paper)、塑料、涂覆表面、平坦表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以采取树脂、凝胶、微球或其他几何配置的形式。固体支持物可以包括二氧化硅芯片、微米颗粒、纳米颗粒、板、阵列、毛细管、平坦支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢、金、银、铝、硅和铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、塑料材料包括多孔板或膜(例如，由聚乙烯、聚丙烯、聚酰胺、聚偏二氟乙烯形成)，和/或晶片、梳、针或针头(例如，适于组合合成或分析的针阵列)或珠，平坦表面诸如晶片(例如，硅晶片)的凹陷或纳升孔阵列，具有凹陷的晶片(具有或不具有过滤器底部)。

固体支持物可以包括聚合物基质(例如，凝胶、水凝胶)。聚合物基质可以能够渗透细胞内空间(例如，细胞器周围)。聚合物基质可以能够被泵送到整个循环***。

基底和微孔阵列

如本文使用的，基底可以指固体支持物类型。基底可以指可以包含本公开内容的条形码或随机条形码的固体支持物。基底可以例如包括多于一个微孔。基底可以例如是包括两个或更多个微孔的孔阵列。在一些实施方案中，微孔可以包括定义体积的小的反应室。在一些实施方案中，微孔可以捕获一个或更多个细胞。在一些实施方案中，微孔可以仅捕获一个细胞。在一些实施方案中，微孔可以捕获一个或更多个固体支持物。在一些实施方案中，微孔可以仅捕获一个固体支持物。在一些实施方案中，微孔捕获单细胞和单个固体支持物(例如，珠)。微孔可以包含本公开内容的条形码试剂。

条形码化的方法

本公开内容提供了用于估计身体样品(例如，组织、器官、肿瘤、细胞)中不同位置处的不同靶的数目的方法。方法可以包括将条形码(例如，随机条形码)紧密接近样品放置，裂解样品，将不同的靶与条形码关联，对靶进行扩增和/或对靶进行数字计数。方法还可以包括对从条形码上的空间标记获得的信息进行分析和/或将所述信息可视化。在一些实施方案中，方法包括使样品中的多于一种靶可视化。将多于一种靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在将样品中的多于一种靶条形码化(例如，随机条形码化)之前或之后产生二维映射图和三维映射图。将样品中的多于一种靶可视化可以包括将多于一种靶映射到样品的映射图上。将多于一种靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在将样品中的多于一种靶条形码化之前或之后产生二维映射图和三维映射图。在一些实施方案中，可以在裂解样品之前或之后生成二维映射图和三维映射图。在产生二维映射图或三维映射图之前或之后裂解样品可以包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。

在一些实施方案中，将多于一种靶条形码化包括将多于一种条形码与多于一种靶杂交以产生条形码化的靶(例如，随机条形码化的靶)。将多于一种靶条形码化可以包括产生条形码化靶的索引文库。产生条形码化靶的索引文库可以用包含多于一种条形码(例如，随机条形码)的固体支持物来进行。

使样品和条形码接触

本公开内容提供了用于使样品(例如，细胞)与本公开内容的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与条形码(例如，随机条形码)接触。细胞可以例如通过重力流来接触，其中可以使细胞沉淀并且产生单层。样品可以是组织薄切片。可以将薄切片放置于基底上。样品可以是一维的(例如，形成平坦表面)。可以使样品(例如，细胞)分散遍及基底，例如，通过在基底上生长/培养细胞。

当条形码紧密接近靶时，靶可以与条形码杂交。条形码可以按不可耗尽的比例接触，使得每一种不同的靶可以与本公开内容的不同条形码关联。为了确保靶与条形码之间的有效关联，可以将靶与条形码交联。

细胞裂解

在细胞和条形码的分配之后，可以使细胞裂解以释放靶分子。细胞裂解可以通过各种手段中的任何一种来完成，例如通过化学或生化手段，通过渗透冲击，或通过热裂解、机械裂解或光学裂解的手段。可以通过添加包含去污剂(例如，SDS、十二烷基硫酸锂、Triton X-100、Tween-20或NP-40)、有机溶剂(例如，甲醇或丙酮)或消化酶(例如，蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合的细胞裂解缓冲液来裂解细胞。为了增加靶与条形码的关联，可以通过例如降低裂解物的温度和/或增加裂解物的粘度来改变靶分子的扩散速率。

在一些实施方案中，可以使用滤纸来裂解样品。可以在滤纸上部用裂解缓冲液浸泡滤纸。可以通过压力将滤纸施加至样品，这可以促进样品的裂解以及样品的靶与基底的杂交。

在一些实施方案中，裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解来进行。化学裂解可以包括使用消化酶，诸如蛋白酶K、胃蛋白酶和胰蛋白酶。裂解可以通过将裂解缓冲液添加至基底来进行。裂解缓冲液可以包含Tris HCl。裂解缓冲液可以包含至少约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含至多约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含约0.1M Tris HCl。裂解缓冲液的pH可以是至少约1、2、3、4、5、6、7、8、9、10或更高。裂解缓冲液的pH可以是至多约1、2、3、4、5、6、7、8、9、10或更高。在一些实施方案中，裂解缓冲液的pH是约7.5。裂解缓冲液可以包含盐(例如，LiCl)。裂解缓冲液中的盐浓度可以是至少约0.1M、0.5M或1M或更高。裂解缓冲液中的盐浓度可以是至多约0.1M、0.5M或1M或更高。在一些实施方案中，裂解缓冲液中的盐浓度是约0.5M。裂解缓冲液可以包含去污剂(例如，SDS、十二烷基硫酸锂、triton X、tween、NP-40)。裂解缓冲液中的去污剂浓度可以是至少约或至多约0.0001％、0.0005％、0.001％、0.005％、0.01％、0.05％、0.1％、0.5％、1％、2％、3％、4％、5％、6％或7％或更高。在一些实施方案中，裂解缓冲液中的去污剂浓度是约1％的十二烷基硫酸锂。裂解方法中使用的时间可以取决于所使用的去污剂的量。在一些实施方案中，使用的去污剂越多，裂解所需的时间越少。裂解缓冲液可以包含螯合剂(例如，EDTA、EGTA)。裂解缓冲液中螯合剂的浓度可以是至少约或至多约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。在一些实施方案中，裂解缓冲液中的螯合剂浓度是约10mM。裂解缓冲液可以包含还原剂(例如，β-巯基乙醇、DTT)。裂解缓冲液中的还原剂浓度可以是至少约1mM、5mM、10mM、15mM或20mM或更高。裂解缓冲液中还原剂的浓度可以是至多约1mM、5mM、10mM、15mM或20mM或更高。在一些实施方案中，裂解缓冲液中的还原剂浓度是约5mM。在一些实施方案中，裂解缓冲液可以包含约0.1MTris HCl，约pH 7.5，约0.5M LiCl，约1％十二烷基硫酸锂，约10mM EDTA和约5mM DTT。

裂解可以在约4℃、10℃、15℃、20℃、25℃或30℃的温度进行。裂解可以进行约1分钟、5分钟、10分钟、15分钟或20分钟或更多分钟。裂解的细胞可以包括至少约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多个靶核酸分子。裂解的细胞可以包括至多约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多个靶核酸分子。

将条形码附接至靶核酸分子

在细胞裂解和核酸分子从细胞释放之后，核酸分子可以与共定位的固体支持物的条形码随机关联。关联可以包括使条形码的靶识别区与靶核酸分子的互补部分杂交(例如，条形码的寡(dT)可以与靶的多(A)尾相互作用)。可以选择用于杂交的测定条件(例如，缓冲液pH、离子强度、温度等)以促进形成特定的稳定的杂合体。在一些实施方案中，可以将从裂解的细胞释放的核酸分子与基底上的多于一种探针关联(例如，与基底上的探针杂交)。当探针包含寡(dT)时，可以将mRNA分子与探针杂交并且逆转录。寡核苷酸的寡(dT)部分可以充当用于cDNA分子的第一链合成的引物。例如，在图2所示的条形码化的非限制性示例中，在框216，mRNA分子可以与珠上的条形码杂交。例如，单链的核苷酸片段可以与条形码的靶结合区杂交。

附接还可以包括将条形码的靶识别区与靶核酸分子的一部分连接。例如，靶结合区可以包含可以能够与限制性位点突出端(例如，EcoRI粘性末端突出端)特异性杂交的核酸序列。测定程序还可以包括用限制性酶(例如，EcoRI)处理靶核酸以产生限制性位点突出端。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。连接酶(例如，T4DNA连接酶)可以用于连接两个片段。

例如，在图2所示的条形码化的非限制性示例中，在框220，来自多于一个细胞(或多于一个样品)的标记的靶(例如，靶-条形码分子)可随后汇集到例如管中。标记的靶可以通过例如取回(retrieving)条形码和/或附接靶-条形码分子的珠来汇集。

可以通过使用磁珠和外部施加的磁场来实现附接的靶-条形码分子的基于固体支持物的集合的取回。汇集靶-条形码分子后，所有进一步的处理可以在单个反应容器中进行。进一步的处理可以包括，例如，逆转录反应、扩增反应、裂解反应、解离反应和/或核酸延伸反应。进一步的处理反应可以在微孔内进行，即，不先汇集来自多于一个细胞的标记的靶核酸分子。

逆转录

本公开内容提供了使用逆转录(例如，在图2的框224处)来产生靶-条形码缀合物的方法。靶-条形码缀合物可以包含条形码以及靶核酸的全部或一部分的互补序列(即，条形码化的cDNA分子，诸如随机条形码化的cDNA分子)。关联的RNA分子的逆转录可以通过添加逆转录引物连同逆转录酶而发生。逆转录引物可以是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。寡(dT)引物的长度可以是12-18个核苷酸或可以是约12-18个核苷酸，并且与哺乳动物mRNA的3’端的内源多(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。

在一些实施方案中，标记的RNA分子的逆转录可以通过添加逆转录引物而发生。在一些实施方案中，逆转录引物是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。通常，寡(dT)引物的长度是12-18个核苷酸，并且与哺乳动物mRNA的3’端的内源多(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。

逆转录可以重复地发生以产生多于一个标记的cDNA分子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次逆转录反应。该方法可以包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次逆转录反应。

扩增

可以进行一个或更多个核酸扩增反应(例如，在图2的框228)以产生标记的靶核酸分子的多于一个拷贝。扩增可以以多重化方式进行，其中多于一种靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(如果存在)的至少一部分。扩增反应可以包括扩增细胞标记和/或条形码序列(例如，分子标记)的至少一部分。扩增反应可以包括扩增样品标签、细胞标记、空间标记、条形码序列(例如，分子标记)、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多于一种核酸的0.5％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、97％、100％或在这些值中的任何两个之间的范围或数字。方法还可以包括进行一个或更多个cDNA合成反应以产生包含样品标记、细胞标记、空间标记和/或条形码序列(例如，分子标记)的靶-条形码分子的一个或更多个cDNA拷贝。

在一些实施方案中，可以使用聚合酶链式反应(PCR)进行扩增。如本文使用的，PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。如本文使用的，PCR可以包括所述反应的衍生形式，包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重化PCR、数字PCR和组装PCR。

标记的核酸的扩增可以包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环到环扩增。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)和Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性核酸内切酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’核酸外切酶活性的核酸聚合酶的链置换扩增、滚环扩增和分支延伸扩增(RAM)。在一些实施方案中，扩增不产生环化转录物。

在一些实施方案中，本文公开的方法还包括对标记的核酸(例如，标记的RNA、标记的DNA、标记的cDNA)进行聚合酶链式反应以产生标记的扩增子(例如，随机标记的扩增子)。标记的扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或条形码序列(例如，分子标记)。标记的扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本公开内容的核酸可以包括合成的或改变的核酸。

扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括，但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及乙二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。

进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括例如，1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一种标记的靶(例如，随机标记的靶)的至少一部分。一种或更多种引物可以退火至多于一种标记的靶的3’端或5’端。一种或更多种引物可以退火至多于一种标记的靶的内部区域。内部区域可以与多于一种标记的靶的3’端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种基因特异性引物。

一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、条形码序列(例如，分子标记)、靶或其任何组合。一种或更多种引物可以包括通用引物和定制引物。定制引物可以设计成扩增一种或更多种靶。靶可以包括一个或更多个样品中总核酸的子集。靶可以包括一个或更多个样品中总标记靶的子集。一种或更多种引物可以包括至少96种或更多种定制引物、至少960种或更多种定制引物、或至少9600种或更多种定制引物。一种或更多种定制引物可以退火至两种或更多种不同的标记的核酸。两种或更多种不同的标记的核酸可以对应于一种或更多种基因。

可以在本公开内容的方法中使用任何扩增方案。例如，在一种方案中，第一轮PCR可以使用基因特异性引物和针对通用Illumina测序引物1序列的引物来扩增附接至珠的分子。第二轮PCR可以使用侧翼为Illumina测序引物2序列的巢式基因特异性引物和针对通用Illumina测序引物1序列的引物扩增第一PCR产物。第三轮PCR添加P5和P7以及样品索引，以使PCR产物变成Illumina测序文库。使用150bp×2测序的测序可以揭示读段1上的细胞标记和条形码序列(例如，分子标记)、读段2上的基因以及索引1读段上的样品索引。

在一些实施方案中，可以使用化学裂解将核酸从基底去除。例如，存在于核酸中的化学基团或经修饰的碱基可以用于促进将核酸从固体支持物去除。例如，酶可以用于将核酸从基底去除。例如，通过限制性核酸内切酶消化可以将核酸从基底去除。例如，用尿嘧啶-d-糖苷酶(UDG)处理含dUTP或ddUTP的核酸可以用于将核酸从基底去除。例如，可以使用进行核苷酸切除的酶(诸如，碱基切除修复酶，诸如无嘌呤/无嘧啶(apurinic/apyrimidinic，AP)核酸内切酶)将核酸从基底去除。在一些实施方案中，可以使用可光裂解基团以及光将核酸从基底去除。在一些实施方案中，可以使用可裂解接头将核酸从基底去除。例如，可裂解接头可以包括以下中的至少一种：生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、生物素/中性抗生物素蛋白、Ig蛋白A、光不稳定型接头、酸或碱不稳定型接头基团或适配体。

当探针是基因特异性时，可以将分子与探针杂交，并且逆转录和/或扩增。在一些实施方案中，在核酸已经合成(例如，逆转录)之后，核酸可以被扩增。扩增可以以多重方式进行，其中多种靶核酸序列同时扩增。扩增可以将测序衔接子添加至核酸。

在一些实施方案中，可以例如用桥接扩增在基底上进行扩增。cDNA可以加同聚物尾，以便产生相容末端，用于使用基底上的寡(dT)探针进行桥接扩增。在桥接扩增中，与模板核酸的3’端互补的引物可以是共价地附接至固体颗粒的每对引物中的第一引物。当包含模板核酸的样品与颗粒接触并进行单个热循环时，可以将模板分子退火至第一引物，并且第一引物通过添加核苷酸而向前延长以形成双链体分子，所述双链体分子由模板分子和与模板互补的新形成的DNA链构成。在下一循环的加热步骤中，双链体分子可以变性，从颗粒释放模板分子并且留下通过第一引物附接至颗粒的互补DNA链。在随后的退火和延长步骤的退火阶段中，互补链可以与第二引物杂交，第二引物在从第一引物去除的位置处与互补链的区段互补。这种杂交可导致互补链在第一引物和第二引物之间形成桥，通过共价键连接第一引物并通过杂交连接第二引物。在延长阶段，通过在同一反应混合物中添加核苷酸，第二引物可以在反向方向上延长，从而将桥转化为双链桥。然后开始下一个循环，并且双链桥可以变性以产生两个单链核酸分子，每个单链核酸分子具有的一个末端分别经由第一引物和第二引物附接至颗粒表面，其中每个单链核酸分子的另一个末端是未附接的。在这第二个循环的退火和延长步骤中，每条链可以与同一颗粒上先前未使用的另外的互补引物杂交，以形成新的单链桥。现在杂交的两个先前未使用的引物延长从而将两个新的桥转换成双链桥。

扩增反应可以包括扩增多于一种核酸的至少1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、97％或100％。

标记的核酸的扩增可以包括基于PCR的方法或非基于PCR的方法。标记的核酸的扩增可以包括对标记的核酸的指数式扩增。标记的核酸的扩增可以包括对标记的核酸的线性扩增。扩增可以通过PCR进行。PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。PCR可以涵盖反应的衍生形式，包括但不限于，RT-PCR、实时PCR、巢式PCR、定量PCR、多重化PCR、数字PCR、抑制PCR、半抑制PCR以及组装PCR。

在一些实施方案中，标记的核酸的扩增包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于MDA、TMA、NASBA、SDA、实时SDA、滚环扩增或环到环扩增。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、LCR、Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性核酸内切酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’核酸外切酶活性的核酸聚合酶的链置换扩增、滚环扩增和/或RAM。

在一些实施方案中，本文公开的方法还包括对扩增的扩增子(例如，靶)进行巢式聚合酶链式反应。扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标签或分子标识符标记。可选地，扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本发明的核酸可以包括合成的或改变的核酸。

在一些实施方案中，方法包括反复扩增标记的核酸以产生多于一个扩增子。本文公开的方法可以包括进行至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个或100个扩增反应。

扩增可以还包括将一种或更多种对照核酸添加至一个或更多个包含多于一种核酸的样品中。扩增可以还包括将一种或更多种对照核酸添加至多于一种核酸。对照核酸可以包含对照标记。

扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定型和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及乙二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。

进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括一种或更多种寡核苷酸。一种或更多种寡核苷酸可以包含至少约7-9个核苷酸。一种或更多种寡核苷酸可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一种标记的核酸的至少一部分。一种或更多种引物可以退火至多于一种标记的核酸的3’端和/或5’端。一种或更多种引物可以退火至多于一种标记的核酸的内部区域。内部区域可以与多于一种标记的核酸的3’端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种管家基因引物。一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标签、第二样品标签、分子标识符标记、核酸或其产物。一种或更多种引物可以包括通用引物和定制引物。定制引物可以被设计成扩增一种或更多种靶核酸。靶核酸可以包括一个或更多个样品中总核酸的子集。在一些实施方案中，引物是与本公开内容的阵列附接的探针。

在一些实施方案中，将样品中的多于一种靶条形码化(例如，随机条形码化)还包括产生条形码化靶(例如，随机条形码化靶)或靶的条形码化片段的索引文库。不同的条形码的条形码序列(例如，不同的随机条形码的分子标记)可以彼此不同。产生条形码化靶的索引文库包括从样品中的多于一种靶产生多于一种索引多核苷酸。例如，对于包括第一索引靶和第二索引靶的条形码化靶的索引文库，第一索引多核苷酸的标记区与第二索引多核苷酸的标记区可以相差以下、相差约以下、相差至少以下或相差至多以下：1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个核苷酸或在这些值中的任何两个之间的数字或范围的核苷酸。在一些实施方案中，产生条形码化靶的索引文库包括使多于一种靶(例如mRNA分子)与包含多(T)区和标记区的多于一种寡核苷酸接触；以及使用逆转录酶进行第一链合成以产生单链标记的cDNA分子(每一种包含cDNA区和标记区)，其中多于一种靶包括至少两种不同序列的mRNA分子，且多于一种寡核苷酸包括至少两种不同序列的寡核苷酸。产生条形码化靶的索引文库还可以包括扩增单链标记的cDNA分子以产生双链标记的cDNA分子；以及对双链标记的cDNA分子进行巢式PCR以产生标记的扩增子。在一些实施方案中，方法可以包括产生衔接子标记的扩增子。

条形码化(例如，随机条形码化)可以包括使用核酸条形码或标签以标记个体核酸(例如，DNA或RNA)分子。在一些实施方案中，其涉及在从mRNA产生cDNA分子时将DNA条形码或标签添加至cDNA分子。可以进行巢式PCR以使PCR扩增偏倚最小化。可以添加用于测序(例如下一代测序(NGS))使用的衔接子。例如在图2的框232处，可以使用测序结果来确定靶的一个或更多个拷贝的细胞标记、分子标记和核苷酸片段的序列。

图3是示出了产生条形码化靶(例如，随机条形码化靶)的索引文库，诸如条形码化的mRNA或其片段的索引文库的非限制性示例性过程的示意图。如步骤1中示出的，逆转录过程可以用独特分子标记序列、细胞标记序列和通用PCR位点对每个mRNA分子进行编码。具体地，通过将一组条形码(例如，随机条形码)310与RNA分子302的多(A)尾区308杂交(例如，随机杂交)，可以将RNA分子302逆转录以产生标记的cDNA分子304(包括cDNA区306)。条形码310中的每一个可以包括靶结合区，例如多(dT)区312、标记区314(例如，条形码序列或分子)和通用PCR区316。

在一些实施方案中，细胞标记序列可以包含3个至20个核苷酸。在一些实施方案中，分子标记序列可以包含3个至20个核苷酸。在一些实施方案中，多于一种随机条形码中的每一种还包括通用标记和细胞标记中的一种或更多种，其中通用标记对于固体支持物上的多于一种随机条形码是相同的，并且细胞标记对于固体支持物上的多于一种随机条形码是相同的。在一些实施方案中，通用标记可以包含3个至20个核苷酸。在一些实施方案中，细胞标记包含3个至20个核苷酸。

在一些实施方案中，标记区314可以包含条形码序列或分子标记318和细胞标记320。在一些实施方案中，标记区314可以包括通用标记、维度标记和细胞标记中的一种或更多种。条形码序列或分子标记318的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下：1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何两个值之间的数字或范围的核苷酸。细胞标记320的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下：1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何两个值之间的数字或范围的核苷酸。通用标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下：1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何两个值之间的数字或范围的核苷酸。通用标记对于固体支持物上的多于一种随机条形码可以是相同的，并且细胞标记对于固体支持物上的多于一种随机条形码是相同的。维度标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下：1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何两个值之间的数字或范围的核苷酸。

在一些实施方案中，标记区314可以包括以下、可以包括约以下、可以包括至少以下或可以包括至多以下：1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种或这些值中的任何两个值之间的数字或范围的不同标记，诸如条形码序列或分子标记318和细胞标记320。每一种标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下：1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。一组条形码或随机条形码310可以含有以下、可以含有约以下、可以含有至少以下或可以含有至多以下：10种、20种、40种、50种、70种、80种、90种、10²种、10³种、10⁴种、10⁵种、10⁶种、10⁷种、10⁸种、10⁹种、10¹⁰种、10¹¹种、10¹²种、10¹³种、10¹⁴种、10¹⁵种、10²⁰种或这些值中的任何两个值之间的数字或范围的条形码或随机条形码310。并且条形码或随机条形码310的组可以例如，各自包含独特标记区314。标记的cDNA分子304可以进行纯化以去除过量的条形码或随机条形码310。纯化可以包括Ampure珠纯化。

如步骤2中示出的，来自步骤1中的逆转录过程的产物可以汇集到1个管中，且用第1PCR引物池和第1通用PCR引物进行PCR扩增。因为独特标记区314，汇集是可能的。特别地，可以将标记的cDNA分子304扩增以产生巢式PCR标记的扩增子322。扩增可以包括多重PCR扩增。扩增可以包括以单一反应体积用96种多重引物进行的多重PCR扩增。在一些实施方案中，在单一反应体积中，多重PCR扩增可以利用以下、利用约以下、利用至少以下或利用至多以下：10种、20种、40种、50种、70种、80种、90种、10²种、10³种、10⁴种、10⁵种、10⁶种、10⁷种、10⁸种、10⁹种、10¹⁰种、10¹¹种、10¹²种、10¹³种、10¹⁴种、10¹⁵种、10²⁰种多重引物或在这些值中的任何值之间的数字或范围的多重引物。扩增可以包括使用第1PCR引物池324和通用引物328，所述第1PCR引物池324包括靶向特定基因的定制引物326A-C。定制引物326可以与标记的cDNA分子304的cDNA部分306’内的区域杂交。通用引物328可以与标记的cDNA分子304的通用PCR区域316杂交。

如图3的步骤3所示，来自步骤2中的PCR扩增的产物可以用巢式PCR引物池和第2通用PCR引物扩增。巢式PCR可以使PCR扩增偏倚最小化。特别地，巢式PCR标记的扩增子322可通过巢式PCR进行进一步扩增。巢式PCR可以包括在单一反应体积中用巢式PCR引物332a-c的巢式PCR引物池330和第2通用PCR引物328’进行的多重PCR。巢式PCR引物池330可以包含以下、包含约以下、包含至少以下或包含至多以下：1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种不同的巢式PCR引物330或在这些值中的任何值之间的数字或范围的不同的巢式PCR引物332。巢式PCR引物332可以包含衔接子334，并与标记的扩增子322的cDNA部分306”内的区域杂交。通用引物328’可以包含衔接子336，并与标记的扩增子322的通用PCR区域316杂交。由此，步骤3产生衔接子标记的扩增子338。在一些实施方案中，巢式PCR引物332和第2通用PCR引物328’可以不包含衔接子334和衔接子336。而是，衔接子334和衔接子336可以连接至巢式PCR的产物以产生衔接子标记的扩增子338。

如步骤4中示出的，可以使用文库扩增引物将来自步骤3的PCR产物进行PCR扩增用于测序。特别地，可以使用衔接子334和衔接子336对衔接子标记的扩增子338进行一个或更多个另外的测定。衔接子334和衔接子336可以与引物340和引物342杂交。一种或更多种引物340和引物342可以是PCR扩增引物。一种或更多种引物340和引物342可以是测序引物。一种或更多种衔接子334和衔接子336可以用于衔接子标记的扩增子338的进一步扩增。一种或更多种衔接子334和衔接子336可以用于对衔接子标记的扩增子338测序。引物342可以包含板索引344，使得使用同一组条形码或随机条形码310产生的扩增子可以使用下一代测序(NGS)在一个测序反应中测序。

用于mRNA 5’分析的模板转换寡核苷酸(TSO)

在一些实施方案中，提供了用于Rhapsody mRNA 5’分析的改进的模板转换寡核苷酸(TSO)。在一些实施方案中，改进是通过提高特异性的延伸阻断物序列来实现的。改进的TSO设计可应用于聚合酶缺乏3’至5’核酸外切酶或ssDNA核酸内切酶的任何***。该酶可以是嗜中温、嗜冷或嗜热聚合酶，或者聚合酶的混合物，只要退火序列的特定部分在过程温度是稳定的或稳定化的。

在一些实施方案中，提供了设计用于防止5’-捕获寡核苷酸(珠上包含捕获诱饵序列以捕获模板转换过程中产生的序列的寡核苷酸)向珠延伸的方法和组合物。在一些实施方案中，这种改进也被设计成使得模板转换效率不会降低。作为本文提供的方法和组合物实现的改进的结果，可以显著减少不需要的非靶向产物的存在、检测和测序。

在一些实施方案中，存在在VDJ PCR过程中产生的不需要的产物。例如，主要的不需要的测序产物可以是未对齐的读段或与其他基因组区域对齐的读段。能够阻断这些产物形式的产生将允许PCR反应资源然后用于产生更多的预期扩增产物，并且不包含额外的产物纯化。此外，当一些不需要的产物最终被测序时，它们使用昂贵的序列资源，导致无益的测序读段。

在一些实施方案中，珠包含2种不同类型的寡核苷酸(例如，寡核苷酸条形码)：一种被设计用于捕获mRNA的3’-末端(多dT-寡核苷酸)，第二种设计用于捕获模板转换mRNA的5’-末端(多dT-寡核苷酸或非多dT-寡核苷酸)。在非多dT-寡核苷酸5’-末端捕获序列的情况下，该设计还可以具有最靠近珠的独特扩增引物序列(通常称为5’-通用引物或PB-通用引物)。当PB-通用引物和特异性引物(例如VDJ引物)用于5’产物的PCR时，每个自杂交(或Pretzel化)cDNA可以形成指数扩增的特异性产物以及线性扩增的产物。在一些实施方案中，不需要的产物从这些线性扩增的产物产生。需要能够减少或消除这些不需要的产物的方法和组合物。

本文提供了用于VDJ分析和其它5’基因靶分析的方法和组合物。在一些实施方案中，提供了模板转换寡核苷酸(TSO)，其互补DNA序列(形成并连接到模板转换的cDNA的3’端)与珠上的5’-捕获诱饵部分地互补。在一些实施方案中，TSO的互补物的非互补部分充当延伸阻断物。在一些实施方案中，未对齐的序列用作阻断物。

在一些实施方案中，模板转换效率等于获得模板转换的转录物cDNA除以逆转录到转录物5’-末端的该转录物的总cDNA的百分比。令人惊讶且重要的是，没有发现如本文所述延长TSO会降低模板转换效率。在本文提供的一些实施方案中，较长的模板转换寡核苷酸(TSO)序列可以增加测量的模板转换效率。

在一些实施方案中，本文公开的方法和组合物减少了从VDJ PCR反应中导致非VDJ产物的不需要的产物。在一些实施方案中，需要阻止形成这些不需要的产物或在这些不需要的产物形成后分离它们。

在一些实施方案中，阻断优于分离，特别是如果阻断被简单地实现，因为在将被分离和丢弃的产物上浪费的资源更少。为了阻断这些不需要的扩增子，可以在反应混合物中加入阻断物寡核苷酸序列。例如，本文提供的用于基于5’的基因表达谱分析的***、方法、组合物和试剂盒可以与阻断物寡核苷酸协同采用，所述阻断物寡核苷酸在于2021年1月29日提交的题为”MESOPHILIC DNA POLYMERASE EXTENSION BLOCKERS”的美国专利申请第17/163,177号中描述，该专利申请的内容通过引用以其整体并入本文。作为将阻断寡核苷酸序列添加到反应混合物中的替代方案，如本文所示，当珠捕获序列仅是TSO序列的一部分时，阻断寡核苷酸序列可以被掺入TSO序列中。

在一些实施方案中，当TSO用于模板转换时，其互补序列被拷贝到cDNA链上。在一些实施方案中，mRNA和TSO在逆转录和模板转换后变性。然后，这种带有TSO的互补物的cDNA可以与珠上存在的诱饵部分地杂交(本文称为“pretzel化”)。(参见图6-图10)。

图7描绘了TSO互补物(TSO 21’)，其可以产生非互补序列，该序列将作为连接到珠的绝大多数寡核苷酸的延伸阻断物。在一些实施方案中，珠上的UMI包含在UMI中具有8个N的65,536个可能组合，并且因此，所有8个N的精确匹配将仅出现65,536个UMI中的1个。在一些实施方案中，细胞标记3(CL3)序列具有96个指定序列，其中96个序列中只有4个具有与TSO 21’的“阻断”部分的最后2个碱基互补的2个碱基。因此，在一些实施方案中，基本上所有具有TSO 21’的pretzel化产物将被阻止延伸。在一些实施方案中，提供了具有一个额外的5’碱基的TSO 21的修饰的设计，其可以产生具有3’端的阻断物，该阻断物与当前Rhapsody珠中使用的96个CL3序列中的任何一个都不互补。这种修饰的序列是TSO t21(在图8中示出)。

图10描绘了当所使用的珠仅具有一种类型的捕获序列(在本例中为poly dT₂₅)时使用的替代延伸阻断序列。在一些实施方案中，该方法采用仅具有这一捕获序列的珠。在一些实施方案中，本文公开的TSO有助于减少不想要的产物。在一些这样的实施方案中，仅存在一种类型的珠“通用”引物，并且在TS和pretzel化之后扩增出基因的5’端，可以使用通用引物和5’特异性引物。在一些实施方案中，这可以仍然允许从“通用”引物的3’端线性扩增产物。本文提供的TSO可以将降低“通用”至“通用”产物的指数扩增，该产物可以是所制造的最丰富的产物。

图9描绘了较长的TSO，其导致与捕获诱饵序列部分地互补的互补物，然而，它不形成阻断实体。

在一些实施方案中，与现有方案相比，本文提供的组合物和方法可以改进工作流程(例如，时间和精力—比额外分离清理所需的时间更少)，并增加测序结果的特异性(例如，更少的不需要的产物和更多的目标产物)。在一些实施方案中，本文公开了来源于被模板转换的寡核苷酸的互补物的阻断序列。在一些实施方案中，模板转换寡核苷酸(TSO)是完成模板转换所必需的，因此这不是添加另一种试剂。图5示出了使用本文提供的组合物和方法确定核酸靶(例如，免疫受体的V(D)J区)的序列的非限制性示例性工作流程。

在一些实施方案中，提供了用于文库制备(例如，VDJ文库制备)的方法和组合物。在一些实施方案中，方法和组合物包含改进的模板转换寡核苷酸(TSO)。在一些实施方案中，工作流程包括WTA分析和/或AbSeq分析。

图5示出了使用本文提供的组合物和方法确定核酸靶(例如，免疫受体的V(D)J区)的序列的非限制性示例性工作流程。细箭头指出工作流程的特定部分，在一些实施方案中，这些部分通过使用本文描述的TSO而得到改进(例如，改进的相互作用)。在一些实施方案中，VDJ文库制备遵循图5中概述的工作流程，使用靶向引物。

在一些实施方案中，提供了模板转换寡核苷酸(TSO)。在一些实施方案中，TSO，诸如，例如，TSO1(TATGCGTAGTAGGTATG rGrGrG；SEQ ID NO:1)和TSO2(GTGGAGTCGTGATTATArGrGrG；SEQ ID NO:2)，由生物信息学设计为独特且不干扰本文公开的引物组以及转录组、细胞标记等。

在一些实施方案中提供了与本文提供的寡核苷酸条形码(例如，靶结合区、诱饵序列)的5’捕获序列(例如，5’-诱饵)具有部分同源序列的TSO，诸如，例如，TSO12(TATGCGTAGTAGGTATGGTGGAGTCGT rGrGrG；SEQ ID NO:3)、TSO21(GTGGAGTCGTTATGCGTAGTAGGTATG rGrGrG；SEQ ID NO:4)、TSO t21(TGTGGAGTCGTTATGCGTAGTAGGTATG rGrGrG；SEQ ID NO:5)和CBO97(AAGCAGTGGTATCAACGCAGAGTACAT rGrGrG；SEQ ID NO:7)。本文公开的组合物和方法的一些实施方案连同本文公开的Rhapsody珠采用TSO21或TSO t21。在一些实施方案中，TSO t21的性能优于TSO21。TSO21和TSO t21是其DNA互补物与珠上的捕获诱饵部分地互补，并且其非互补部分可以作为延伸阻断物的TSO。

图6和图11描绘了使用模板转换寡核苷酸TSO1(TATGCGTAGTAGGTATG rGrGrG；SEQID NO:1)的文库制备方法的非限制性示意图。盒(box)包含5’捕获序列(例如，5’诱饵)。延伸显示在两个方向上发生(蓝色和橙色虚线)。在一些实施方案中，橙色延伸产物(例如，条形码化核酸分子的延伸)可以是来自延伸反应的高水平不需要的PCR产物(例如，“pretzel化”产物)的来源。图6和图11描绘了pretzel化TSO1产物。紫色箭头描绘了可用于特异性5’-VDJ扩增的特异性引物。

图7和图13描绘了使用模板转换寡核苷酸TSO21(GTGGAGTCGTTATGCGTAGTAGGTATGrGrGrG；SEQ ID NO:4)的文库制备方法的非限制性示意图。图7和图13描绘了pretzel化TSO21产物。紫色箭头描绘了可用于特异性5’-VDJ扩增的特异性引物。如图7和图13所示，在一些实施方案中，由于额外的序列(例如，阻断序列)，TSO21’不朝向珠延伸。在一些实施方案中，额外序列充当延伸阻断物。

图8和图14描绘了使用模板转换寡核苷酸TSO t21(TGTGGAGTCGTTATGCGTAGTAGGTATG rGrGrG；SEQ ID NO:5)的文库制备方法的非限制性示意图。TSO t21是TSO21的包含额外核苷酸(例如阻断物核苷酸)的修饰版本。紫色箭头描绘了可用于特异性5’-VDJ扩增的特异性引物。盒包含5’捕获序列(例如，5’诱饵)。如图8和图14所示，在一些实施方案中，由于额外的序列(例如，阻断序列)，TSO t21’不朝向珠延伸。在一些实施方案中，额外序列充当延伸阻断物。

图9和图12描绘了使用模板转换寡核苷酸TSO12(TATGCGTAGTAGGTATGGTGGAGTCGTrGrGrG；SEQ ID NO:3)的文库制备方法的非限制性示意图。盒包含5’捕获序列(例如，5’诱饵)。延伸显示在两个方向上发生(蓝色和绿色虚线)。在一些实施方案中，绿色延伸产物(例如，条形码化核酸分子的延伸)可以是来自延伸反应的高水平不需要的PCR产物(例如，“pretzel化”产物)的来源。图9和图12描绘了pretzel化TSO12产物。紫色箭头描绘了可用于特异性5’-VDJ扩增的特异性引物。TSO12是长度较长但不导致延伸阻断的TSO的示例。

在一些实施方案中，提供了用于与单个捕获序列珠(例如，珠上仅具有单一类型捕获序列的珠)一起使用的TSO。例如，图10和图15描绘了使用模板转换寡核苷酸TSO t2dT₂₅(TGTGGAGTCGTTTTTTTTTTTTTTTTTTTTTTTTTT rGrGrG；SEQ ID NO:6)的文库制备方法的非限制性示意图。盒包含5’捕获序列(例如，5’诱饵)。紫色箭头描绘了可用于特异性5’-VDJ扩增的特异性引物。如图10和图15所示，在一些实施方案中，由于额外的序列(例如，阻断序列)，TSO t2dT_25’不朝向珠延伸。在一些实施方案中，额外序列充当延伸阻断物。

在一些实施方案中，阻断序列与寡核苷酸条形码(例如，寡核苷酸条形码中靶结合区和/或诱饵序列5’的部分)不充分互补。如本文使用的，术语“充分互补”可以指连续的核酸碱基序列能够通过一系列互补碱基之间的氢键合与另一碱基序列杂交。互补碱基序列可以通过使用标准碱基配对(例如，G:C、A:T或A:U)在寡聚物序列中的每个位置处互补，或者可以包含一个或更多个不互补的残基(包括无碱基位置)，但其中整个互补碱基序列能够在适当的杂交条件下与另一个碱基序列特异性杂交。连续的碱基可以与寡聚物意图杂交的序列至少约80％、至少约85％、至少约90％、至少约95％、至少约99％或100％互补。基本上互补的序列可以指与参考序列相比，百分比同一性范围在100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、75、70或更少，或其间的任何数字的序列。本领域技术人员可以容易地选择适当的杂交条件，该条件可以基于碱基序列组成进行预测，或者通过使用常规测试来确定(参见例如Green和Sambrook,Molecular Cloning,ALaboratoryManual,第4版(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2012))。

本文描述的方法和***可以与使用与寡核苷酸关联(例如，与寡核苷酸附接或缀合)的抗体(本文也称为AbO或AbOligo)的方法和***一起使用。使用AbO来确定单细胞中的蛋白表达谱和追踪样品来源的一些实施方案已在US2018/0088112和US2018/0346970中描述；每一项的内容通过引用以其整体并入本文。在一些实施方案中，本文公开的方法允许对T细胞和B细胞的V(D)J谱分析、3’靶向扩增、5’靶向扩增、3’全转录组扩增(WTA)、5’WTA、用AbO进行蛋白表达谱分析和/或单个实验中的样品多重化分析。使用5’条形码化和/或3’条形码化确定核酸靶(例如，免疫受体的V(D)J区)的序列的方法在US2020/0109437中描述；该文献的内容通过引用以其整体并入本文。用于在核酸靶的5’端上进行分子条形码化的***、方法、组合物和试剂盒已经在例如US2019/0338278中描述，该文献的内容通过引用以其整体并入本文。在一些实施方案中，本文提供的用于基于5’的基因表达谱分析的***、方法、组合物和试剂盒可以与使用US20210139970中描述的组合的5’条形码化和随机引发方法获得全长V(D)J信息(例如，通过Rhapsody***上的Illumina测序)的方法协同使用；其内容通过引用整体并入本文。在一些实施方案中，本文提供的用于基于5’的基因表达谱分析的***、方法、组合物和试剂盒可以与基于随机引发和延伸(RPE)的全转录组分析方法和组合物协同采用，所述基于随机引发和延伸(RPE)的全转录组分析方法和组合物已在美国专利申请第16/677,012号中描述；其内容通过引用以其整体并入本文。在一些实施方案中，本文提供的用于基于5’的基因表达谱分析的***、方法、组合物和试剂盒可以与US20210238661中描述的阻断物寡核苷酸协同使用，其内容通过引用整体并入本文。本文公开的组合物和方法的一些实施方案包括第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码，它们已经在2021年6月1日提交的题为“OLIGONUCLEOTIDES AND BEADS FOR5PRIME GENE EXPRESSION ASSAY”的美国专利申请第17/336,055号中描述，并且其内容通过引用整体并入本文。在一些实施方案中，核酸靶(例如，mRNA)最初在3’端用第一多于一种寡核苷酸条形码被条形码化，并且随后在模板转换反应和与第一多于一种寡核苷酸条形码进行分子间杂交和延伸之后在5’端被条形码化。用于制备寡核苷酸条形码和条形码化颗粒的方法已经在例如US2015/0299784、WO2015/031691和Fu等人，PNAS U.S.A 2011May 31；108(22):9026-31中描述，这些出版物的内容以其整体并入本文。

对核酸靶的5’端进行条形码化的方法

高通量单细胞RNA测序改变了对复杂和异质生物样品的理解。然而，大多数方法只能实现对mRNA转录物信息进行3’分析，这可能限制了对剪接变体、选择性转录起始位点和由于重排造成的高度可变基因座诸如T细胞受体和B细胞受体和抗体的VDJ连接处的分析。使用5’条形码化和/或3’条形码化确定核酸靶(例如，免疫受体的V(D)J区)的序列的方法在2019年9月30日提交的美国专利申请第16/588,405号中描述；该专利申请的内容通过引用以其整体并入本文。用于在核酸靶的5’端上进行分子条形码化的***、方法、组合物和试剂盒已在作为美国专利申请公布第2019/0338278号公布的美国专利申请第16/588,405中描述，该专利申请的内容通过引用以其整体并入本文。

本文的公开内容包括用于将具有分子标记(或分子索引)的条形码(例如，随机条形码)附接到被条形码化或被标记的核酸靶(例如，脱氧核糖核酸分子和核糖核酸分子)的5’端的***、方法、组合物和试剂盒。本文公开的基于5’的转录物计数方法可以互补或补充例如基于3’的转录物计数方法(例如Rhapsody^TM测定(Becton,Dickinson and Company(Franklin Lakes,NJ))、Chromium^TM单细胞3’解决方案(10X Genomics(San Francisco,CA)))。条形码化的核酸靶可用于序列鉴定、转录物计数、选择性剪接分析、突变筛选和/或以高通量方式进行全长测序。对5’端(相对于被标记的靶核酸靶的5’)的转录物计数可以揭示在核酸分子的5’端或较靠近核酸分子的5’端的选择性剪接同种型和变体(包括但不限于剪接变体、单核苷酸多态性(SNP)、***、缺失、取代)。在一些实施方案中，方法可以涉及分子内杂交。

本公开内容的方法可用于鉴定B细胞受体(BCR)、T细胞受体(TCR)和抗体的VDJ区。VDJ重组又称为体细胞重组，是免疫***产生免疫球蛋白(Ig)(例如，BCR)和T细胞受体(TCR)的早期阶段中的遗传重组机制。VDJ重组可以几乎随机地组合可变(V)基因区段、多样性(D)基因区段和连接(J)基因区段。由于其在选择不同基因时的随机性，它能够多样地编码蛋白以匹配来自细菌、病毒、寄生虫、功能失调的细胞(诸如肿瘤细胞)和花粉的抗原。

VDJ区可以包含3Mb的大基因座，该3Mb的大基因座包含可变(V)基因、多样性(D)基因和连接(J)基因。这些是可以参与VDJ重组的区段。可以存在可以不经历VDJ重组的恒定基因。该基因座的VDJ重组中的第一个事件可以是，D基因中的一个重排到J基因中的一个。其后，V基因中的一个可以附加到该DJ重排以形成功能性的VDJ重排的基因，该功能性的VDJ重排的基因然后编码重链蛋白的可变区段。这两个步骤都可以由可以使间插DNA缺失的重组酶酶类催化。

该重组过程在祖B细胞中以逐步的方式发生以产生抗体组库所需的多样性。每个B细胞可能只产生一种抗体(例如，BCR)。这种特异性可以通过等位基因排斥，使得一个等位基因信号进行功能性重排以阻止第二个等位基因的进一步重组来实现。

在一些实施方案中，样品包括免疫细胞。免疫细胞可以包括，例如，T细胞、B细胞、淋巴样干细胞、髓样祖细胞、淋巴细胞、粒细胞、B细胞祖细胞、T细胞祖细胞、自然杀伤细胞、Tc细胞、Th细胞、浆细胞、记忆细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、肥大细胞、单核细胞、树突状细胞和/或巨噬细胞，或其任何组合。

T细胞可以是T细胞克隆，T细胞克隆可以指源自单个T细胞的T细胞或具有相同TCR的T细胞。T细胞可以是T细胞系的一部分，T细胞系可以包括T细胞克隆和具有不同TCR的T细胞的混合群体，所有这些TCR都可以识别相同的靶(例如，抗原、肿瘤、病毒)。T细胞可以从许多来源获得，包括外周血单个核细胞、骨髓、***组织、脾组织和肿瘤。T细胞可以诸如使用Ficoll分离从采集自受试者的单位血液获得。个体的循环血液中的细胞可以通过单采血液成分术(apheresis)或白细胞单采术(leukapheresis)获得。单采血液成分术产物可以包括淋巴细胞(包括T细胞、单核细胞、粒细胞、B细胞)、其他有核白细胞、红细胞和血小板。细胞可以被洗涤并在培养基中重悬以分离感兴趣的细胞。

T细胞可以通过裂解红细胞和耗尽单核细胞(例如，通过PERCOLL^TM梯度离心)从外周血淋巴细胞中分离。可以通过正选择或负选择技术进一步分离特定的T细胞亚群，诸如CD28+T细胞、CD4+T细胞、CDC、CD45RA+T细胞、和CD45RO+T细胞。例如，T细胞可以通过与抗CD3/抗CD28(即，3×28)-缀合珠诸如M-450CD3/CD28T或XCYTEDYNABEADS^TM一起孵育足以对于合意的T细胞进行正选择的时间段来分离。免疫细胞(例如，T细胞和B细胞)可以是抗原特异性的(例如，肿瘤特异性的)。

在一些实施方案中，细胞可以是抗原呈递细胞(APC)，诸如B细胞、来自***的活化的B细胞、类淋巴母细胞、静息B细胞或赘生性B细胞，例如来自淋巴瘤。APC可指在其表面表达至少一种BCRC蛋白的B细胞或滤泡树突状细胞。

本公开内容的方法可以用于追踪单个T细胞的分子表型。不同亚型的T细胞可以通过不同分子标志物的表达来区分。T细胞表达来自不同的TCR组库的独特的T细胞受体(TCR)。在大多数T细胞中，TCR可以由α链和β链的异源二聚体组成；每一个功能链都可能是T细胞发育过程中体细胞DNA重组事件的产物，允许在单个个体中表达超过一百万种不同的TCR。TCR可以用来定义个体T细胞的身份，允许在免疫应答过程中对T细胞克隆扩增的谱系进行追踪。本公开内容的免疫学方法可以以多种方式使用，包括但不限于，鉴定单个T细胞中独特的TCRα链和TCRβ链配对，在单细胞水平定量TCR和标志物表达，鉴定个体中的TCR多样性，表征不同T细胞群体中表达的TCR组库，确定TCR的α链等位基因和β链等位基因的功能性，以及鉴定免疫应答过程中T细胞的克隆扩增。

T细胞受体链配对

T细胞受体(TCR)是存在于T淋巴细胞表面上的识别分子。在T细胞表面上发现的T细胞受体可以由两个糖蛋白亚基组成，这两个亚基被称为α链和β链。这两条链可以构成约40kDa的分子量并具有可变结构域和恒定结构域。编码α链和β链的基因可以在V、D和J区的文库中被组织，基因从V、D和J区通过遗传重排形成。TCR可以识别由抗原呈递细胞呈递的抗原，该抗原作为与由组织相容性基因编码的特定自身分子组成的复合体的一部分。最有效的组织相容性基因被称为主要组织相容性复合体(MHC)。因此，被T细胞受体识别的复合体由MHC/肽配体组成。

在一些实施方案中，本公开内容的方法、装置和***可用于T细胞受体测序和配对。本公开内容的方法、装置和***可以用于对T细胞受体α链和β链进行测序，使α链和β链进行配对，和/或确定T细胞受体α链的功能性拷贝。单细胞可以被容纳在具有单个固体支持物(例如，珠)的单个分区(例如，孔)中。细胞可以被裂解。珠可以包含随机标记，随机标记可以结合到TCR的α和/或β链内的特定位置。与固体支持物关联的TCRα分子和TCRβ分子可以经历本公开内容的分子生物学方法，包括逆转录、扩增和测序。包含相同细胞标记的TCRα链和β链可以被认为来自相同的单细胞，从而使TCR的α链和β链进行配对。

抗体组库中的重链和轻链配对

本公开内容的方法、装置和***可以用于使BCR受体和抗体的重链和轻链进行配对。本公开内容的方法允许确定单个生物体或细胞群体中免疫受体和抗体的组库。本公开内容的方法可以帮助确定组成免疫受体的多肽链对。B细胞和T细胞各自表达免疫受体；B细胞表达免疫球蛋白和BCR，并且T细胞表达T细胞受体(TCR)。这两种免疫受体类型可以包含两条多肽链。免疫球蛋白可以包含可变重(VH)链和可变轻(VL)链。可以有两种TCR类型：一种由α链和β链组成，并且另一种由δ链和γ链组成。免疫受体中的多肽可以包含恒定区和可变区。可变区可以由B细胞或T细胞染色体上基因片段的重组和末端连接重排导致。在B细胞中，可变区的另外的多样化可以通过体细胞高频突变发生。

免疫***有大量的受体，并且由淋巴细胞表达的任何给定受体对可以由一对分别的、独特的转录物编码。知晓单细胞中表达的免疫受体链对的序列可以用来确定给定个体或细胞群体的免疫组库(immune repertoire)。

在一些实施方案中，本公开内容的方法、装置和***可用于抗体测序和配对。本公开内容的方法、装置和***可以用于对抗体重链和轻链(例如，B细胞中的抗体重链和轻链)进行测序，和/或对重链和轻链进行配对。单细胞可以被容纳在具有单个固体支持物(例如，珠)的单个分区(例如，孔)中。细胞可以被裂解。

珠可以包含随机标记，随机标记可以结合到抗体(例如，B细胞中的抗体)的重链和/或轻链内的特定位置。与固体支持物关联的重链分子和轻链分子可以经历本公开内容的分子生物学方法，包括逆转录、扩增和测序。包含相同细胞标记的抗体重链和轻链可以被认为来自相同的单细胞，从而使抗体的重链和轻链进行配对。

在一些实施方案中，第一和/或第二多于一种寡核苷酸条形码中的寡核苷酸条形码的至少一部分包含不变序列，任选地，第一和/或第二多于一种寡核苷酸条形码中的每一种在不变序列处包含相同的序列。在一些实施方案中，不变序列的长度在大约1-15个核苷酸之间，任选地不变序列的长度为1个核苷酸。在一些实施方案中，不变序列位于细胞标记中，任选地，细胞标记包括细胞标记的第一部分、第一接头、细胞标记的第二部分、第二接头和细胞标记的第三部分，还任选地，不变序列位于细胞标记的第三部分。在一些实施方案中，阻断序列包含阻断物核苷酸，其中阻断物核苷酸位于阻断序列的3’端。在一些实施方案中，阻断物核苷酸被配置为不与不变序列互补。在一些实施方案中，不变序列和诱饵序列之间的距离与诱饵序列的互补物和阻断物核苷酸之间的距离等距。在一些实施方案中，不变序列和靶结合区之间的距离与靶结合区的互补物和阻断物核苷酸之间的距离等距。在一些实施方案中，TSO包含选自SEQ ID NO:1-7的序列，或与选自SEQ ID NO:1-7的序列表现出至少约50％同一性的序列。在一些实施方案中，阻断序列包含SEQ ID NO:1-7中任何一个的至少4个连续碱基。在一些实施方案中，阻断序列的互补物在TSO中诱饵序列的5’。在一些实施方案中，阻断序列的互补物在TSO中靶结合区或其部分的5’。

在一些实施方案中，与其中TSO不包含阻断序列的互补物的可比方法相比，模板转换效率降低少于40％、少于20％、少于10％或少于5％。在一些实施方案中，方法还包括在一个或更多个延伸步骤之前或期间添加阻断物寡核苷酸。在一些实施方案中，该方法不包括添加阻断物寡核苷酸。在一些实施方案中，阻断序列的互补物包含阻断序列的反向互补序列和/或阻断序列的互补序列。

在一些实施方案中，样品包括单细胞，任选地免疫细胞，并且还任选地B细胞或T细胞。在一些实施方案中，样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。在一些实施方案中，单细胞包括循环肿瘤细胞。在一些实施方案中，第一通用序列在分子标记和靶结合区的5’。在一些实施方案中，扩增第一多于一种延伸的条形码化核酸分子以产生第一多于一种单标记的核酸分子包括使用能够与第一通用序列杂交的引物和扩增引物。

在一些实施方案中，扩增引物是靶特异性引物，并且任选地，靶特异性引物与免疫受体、免疫受体的恒定区、免疫受体的可变区、免疫受体的多样性区和/或免疫受体的可变区和多样性区的连接处特异性杂交。在一些实施方案中，免疫受体是T细胞受体(TCR)和/或B细胞受体(BCR)，并且任选地TCR包含TCRα链、TCRβ链、TCRγ链、TCRδ链或其任何组合；并且BCR受体包含BCR重链和/或BCR轻链。在一些实施方案中，扩增引物特异性结合延伸的条形码化核酸分子，所述延伸的条形码化核酸分子各自包含第一分子标记的互补物和第二分子标记。在一些实施方案中，扩增引物不结合包含第一分子标记的延伸的条形码化核酸分子。在一些实施方案中，扩增引物包含核酸靶的互补物。在一些实施方案中，核酸靶包括mRNA，并且其中扩增引物包含核酸靶的反义链的序列。在一些实施方案中，使寡核苷酸条形码的3’端延伸包括使用嗜中温DNA聚合酶、嗜热DNA聚合酶、嗜冷DNA聚合酶或其任何组合来使寡核苷酸条形码的3’端延伸。在一些实施方案中，延伸寡核苷酸条形码的3’端包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶来延伸寡核苷酸条形码的3’端，并且任选地DNA聚合酶包含Klenow片段。

在一些实施方案中，合成颗粒是可破坏的。在一些实施方案中，合成颗粒包括珠，并且任选地珠包括：琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合；选自以下的材料：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合；或者可破坏的水凝胶颗粒。

在一些实施方案中，第一和第二多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含接头官能团，合成颗粒包含固体支持物官能团，并且支持物官能团和接头官能团彼此关联，并且任选地接头官能团和支持物官能团单独地选自C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮以及其任何组合。在一些实施方案中，第一多于一种寡核苷酸条形码中的每一种包含接头官能团，合成颗粒包含固体支持物官能团，并且支持物官能团和接头官能团彼此关联，并且任选地接头官能团和支持物官能团单独地选自C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮以及其任何组合。

图4A-图4E示出了使用5’条形码化和本文公开的TSO确定核酸靶(例如，免疫受体的V(D)J区)的序列的非限制性示例性工作流程的示意图。条形码(例如，随机条形码、寡核苷酸条形码402)可以包含靶结合区(例如，多(dT)404)，该靶结合区可以经由多(dA)尾408与核酸靶(例如，多腺苷酸化的RNA转录物406)结合，或与其他核酸靶结合，用于标记或条形码化(例如，独特地标记)。靶结合区可以包含基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。在一些实施方案中，条形码与固体支持物(例如，颗粒410)关联。多于一种条形码402可以与颗粒410关联。在一些实施方案中，颗粒是珠。珠可以是用条形码或随机条形码官能化的聚合珠，例如可变形的珠或凝胶珠(诸如来自10X Genomics(San Francisco,CA)的凝胶珠)。在一些实施方式中，凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如，四甲基乙二胺(TEMED))后，可以产生凝胶珠。

图4A描绘了逆转录反应400a的非限制性示例性实施方案。在逆转录400a过程中，当到达寡核苷酸条形码402的末端后，酶(例如，逆转录酶，诸如Moloney鼠白血病病毒(MMLV))的末端转移酶活性使一些另外的核苷酸(例如，脱氧胞苷CCC 412)添加到新合成的cDNA序列链414c(RNA序列414r的反义序列)的3’端。这些CCC碱基412可以作为模板转换寡核苷酸(例如，模板转换寡核苷酸)416的锚定位点起作用，它包括与加尾序列(例如，rGrGrG418)互补的序列。模板转换寡核苷酸416可以包含阻断序列的互补物480rc和靶结合区404的至少一部分。在rGrGrG 418和附加的脱氧胞苷链段(stretch)412之间碱基配对后，酶“转换”模板链，从寡核苷酸条形码402到模板转换寡核苷酸416，并继续复制到模板转换寡核苷酸416的5’端。因此，得到的第一链标记的cDNA(例如，条形码化核酸分子420)含有模板转换寡核苷酸416的反向互补物序列并且因此可以包含靶结合区的互补物(例如，反向互补物)(例如，多(dA)408)和阻断序列480。阻断序列可以包含阻断核苷酸480a。条形码化核酸分子420可以包括cDNA 414c(RNA序列414r的反向互补序列)。该反应可以在存在一种或更多种配置为减少二级结构的添加剂(例如，乙二醇)的情况下进行。条形码化核酸分子420也可以包含许多标记。寡核苷酸条形码402可以包含分别用于标记转录物406和追踪RNA转录物406(或核酸靶，诸如例如抗体寡核苷酸，无论是与抗体关联的还是已与抗体解离的)的样品来源的第一分子标记(ML1)422和样品标记(例如，分区标记、细胞标记(CL)424)，以及用于后续反应的位于每一种条形码402的第一分子标记422/细胞标记424区域侧翼的一个或更多个另外的序列，诸如例如，第一通用序列426(例如，读段1序列)。细胞标记可以包含阻断核苷酸不能与之杂交的不变序列。每个样品的寡核苷酸条形码中分子标记的序列的组库可以足够大以对RNA转录物进行随机标记。在一些实施方案中，样品标记是分区标记。在一些实施方案中，样品标记是细胞标记。条形码化核酸分子420可以经历变性步骤400b(例如，变性)，从而产生单链的条形码化核酸分子421。

在一些实施方案中，在延伸多于一种条形码化核酸分子的3’端之后，使第一分子标记与第二分子标记杂交。在一些实施方案中，延伸的条形码化核酸分子各自包含第一分子标记、第二分子标记、靶结合区和靶结合区的互补物。在一些实施方案中，靶结合区的互补物与靶结合区的一部分互补。在一些实施方案中，靶结合区包括基因特异性序列。在一些实施方案中，靶结合区包括多(dT)序列。

术语“模板转换”可以指逆转录酶将初始核酸序列模板转换为新的核酸序列模板的3’端的能力，该新的核酸序列模板的3’端与从初始模板合成的核酸的3’端具有很小或没有互补性。模板转换的实例是逆转录酶将初始核酸序列模板/引物底物转换为新的核酸序列模板的3’端的能力，该新的核酸序列模板的3’端与核酸引物链的3’端几乎不互补或不互补。模板转换允许例如使用逆转录酶制备DNA拷贝，所述逆转录酶将初始核酸序列模板转换为新的核酸序列模板的3’端，该新的核酸序列模板的3’端与从初始模板合成的DNA的3’端具有很小或没有互补性，由此允许合成将衔接子序列与靶寡核苷酸序列直接相连(无连接)的连续产物DNA。模板转换可以包括连接衔接子、均聚物加尾(例如，多腺苷酸化)、随机引物或聚合酶可与之关联的寡核苷酸。在上述任何实施方案中，模板转换可用于引入靶结合区或其互补物。

在一些实施方案中，逆转录酶能够具有末端转移酶活性。在一些实施方案中，模板转换寡核苷酸包含一个或更多个3’核糖核苷酸。在一些实施方案中，模板转换寡核苷酸包含三个3’核糖核苷酸。在一些实施方案中，3’核糖核苷酸包括鸟嘌呤。在一些实施方案中，逆转录酶包括病毒逆转录酶。在一些实施方案中，病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶。在一些实施方案中，病毒逆转录酶是Moloney鼠白血病病毒(MMLV)逆转录酶。

靶结合区的互补物可以包括靶结合区的反向互补序列，或者可以包括靶结合区的互补序列。分子标记的互补物可以包括分子标记的反向互补序列，或者可以包括分子标记的互补序列。在一些实施方案中，多于一种条形码化核酸分子可以包括条形码化脱氧核糖核酸(DNA)分子和/或条形码化核糖核酸(RNA)分子。在一些实施方案中，核酸靶包括核酸分子(例如，核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA (siRNA)、RNA降解产物、含有多(A)尾的RNA或其任何组合)。在一些实施方案中，mRNA编码免疫受体。核酸靶可以包含细胞组分结合试剂。在一些实施方案中，核酸分子与细胞组分结合试剂关联。方法可以包括使核酸分子和细胞组分结合试剂解离。在一些实施方案中，多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列。多于一种寡核苷酸条形码的每一种分子标记可以包含至少6个核苷酸。

在一些实施方案中，多于一种寡核苷酸条形码与固体支持物关联。与同一固体支持物关联的多于一种寡核苷酸条形码可以各自包含相同的样品标记。多于一种寡核苷酸条形码的每一种样品标记可以包含至少6个核苷酸。多于一种寡核苷酸条形码可以各自包含细胞标记。多于一种寡核苷酸条形码的每一种细胞标记可以包含至少6个核苷酸。与同一固体支持物关联的寡核苷酸条形码可以包含相同的细胞标记。与不同固体支持物关联的寡核苷酸条形码可以包含不同的细胞标记。多于一种延伸的条形码化核酸分子可以各自包含细胞标记和细胞标记的互补物。细胞标记的互补物可以包括细胞标记的反向互补序列或细胞标记的互补序列。方法可以包括在存在乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(DMSO)、甘油、甲酰胺、7-脱氮-GTP、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合中的一种或更多种的情况下，延伸与核酸靶的拷贝杂交的多于一种寡核苷酸条形码。在一些实施方案中，固体支持物可以包括合成颗粒。在一些实施方案中，固体支持物可以包括平坦表面。

样品可以包含单细胞，并且方法可以包括将包含多于一种寡核苷酸条形码的合成颗粒与样品中的单细胞关联。方法可以包括在将合成颗粒与单细胞关联后裂解单细胞。裂解单细胞可以包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。在一些实施方案中，合成颗粒和单细胞在同一孔中。在一些实施方案中，合成颗粒和单细胞在同一液滴中。在一些实施方案中，多于一种寡核苷酸条形码中的至少一种被固定在合成颗粒上。在一些实施方案中，多于一种寡核苷酸条形码中的至少一种被部分地固定在合成颗粒上。多于一种寡核苷酸条形码中的至少一种可以被包封在合成颗粒中。在一些实施方案中，多于一种寡核苷酸条形码中的至少一种被部分地包封在合成颗粒中。在一些实施方案中，合成颗粒是可破坏的。合成颗粒可以包括珠。珠可以包括琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。合成颗粒可以包含选自以下的材料：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合。在一些实施方案中，合成颗粒可以包括可破坏的水凝胶颗粒。多于一种寡核苷酸条形码中的每一种可以包含接头官能团，合成颗粒可以包含固体支持物官能团，和/或支持物官能团和接头官能团可以彼此关联。在一些实施方案中，接头官能团和支持物官能团单独地选自C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮，以及其任何组合。

工作流程可以包括单链条形码化核酸分子421的分子内和/或分子间杂交400c。在一些实施方案中，可以发生多于一种类型的杂交反应400c(例如，400c1、400c2和/或400c3)。该工作流程可以包括在一个或更多个杂交反应400c(例如，400c1、400c2和/或400c3)之后的延伸反应400d。在一些实施方案中，杂交和/或延伸反应在存在高盐缓冲液和/或PEG的情况下进行。在一些实施方案中，使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶(例如，Klenow片段)进行延伸。缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶可以包括嗜中温DNA聚合酶、嗜热DNA聚合酶、嗜冷DNA聚合酶或其任何组合。

本文提供的方法和组合物的一些实施方案改进、减少或防止在对免疫受体的V(D)J区进行3’和/或5’表达谱分析期间产生的不期望的产物(例如，包含第一通用序列的互补物的延伸的条形码化核酸分子)。工作流程可以如图4A-图4E示出的进行。阻断序列可以被配置成阻止条形码化核酸分子的3’端延伸，如图所示(例如，由于缺乏与寡核苷酸条形码中dT 4045’的部分的杂交)。

单链延伸的条形码化核酸分子420ed可以用作用于一个或更多个扩增反应(例如，PCR)的模板，诸如例如，图4E中描绘的非限制性示例性扩增方案的模板。一次或更多次扩增可以包括靶特异性(例如，基因特异性)cDNA扩增。例如，单链延伸的条形码化核酸分子420ed可以使用包含第一通用序列426的序列的通用寡核苷酸引物476和靶特异性引物478进行第一轮扩增(“PCR1”)400f。靶特异性引物478可以包含第二通用序列(例如，读段2序列，通用PCR手柄)。靶特异性引物478可以包含核酸靶的互补物。靶特异性引物478可以结合免疫受体的恒定区、可变区、多样性区和/或连接区。在其中核酸靶包括mRNA的实施方案中，靶特异性引物478可以包含核酸靶(例如，cDNA)的反义链的序列。靶特异性引物478可以能够特异性结合单链延伸的条形码化核酸分子420ed并被延伸以产生产物482。产物482可以包含第一通用序列的反向互补物426rc。靶特异性引物478可以能够特异性结合产物482并被延伸以产生产物484。PCR1产物可以包含第二分子标记436和细胞标记424。包含482和484(例如，PCR1产物)的双链DNA分子可以进行另外的下游反应400g(如本文公开的引发和延伸反应、扩增反应和/或测序反应)。例如，在一些实施方案中，工作流程包括采用通用寡核苷酸引物和巢式靶特异性引物的第二轮扩增(“PCR2”)。通用寡核苷酸引物和/或巢式靶特异性引物可以经由一种或更多种引物中的一个或更多个突出端将一个或更多个测序衔接子添加到PCR2产物。工作流程可以包括PCR2产物的文库扩增(“索引PCR”)。索引PCR可以经由测序文库扩增引物中的突出端添加测序衔接子(例如，P5和P7)和样品索引(例如，i5、i7)。索引PCR扩增子可以被测序并经历本公开内容的下游方法。使用150bp×2测序的测序可以揭示读段1上的细胞标记、独特分子标记和/或基因(或基因的部分序列)，读段2上的基因(或基因的部分序列)以及索引1读段和/或索引2读段上的样品索引。PCR1、PCR2和/或PCR3可以包括1-30个循环(例如，15个循环)。在一些实施方案中，工作流程包括采用一组靶特异性PCR1引物和/或一组靶特异性PCR2引物的多重PCR。在一些实施方案中，靶包括BCR、TCR和/或免疫相关转录物。在一些实施方案中，可以对免疫受体的V(D)J区进行3’和/或5’表达谱分析。在一些实施方案中，可以研究单细胞平台中T细胞和/或B细胞的表型标志物和一种或更多种免疫受体V(D)J序列二者。在一些实施方案中，它们的转录物的3’和5’信息二者都可以在单个实验中捕获。本文公开的方法可以允许T细胞和B细胞二者的V(D)J检测(例如，高频突变)。

在一些实施方案中，本文提供的TSO可以与使用组合的5’条形码化和随机引发方法获得全长V(D)J信息(例如，在Rhapsody***上通过Illumina测序)的方法协同采用，所述方法已在2020年11月6日提交的题为“USING RANDOM PRIMING TO OBTAIN FULL-LENGTH V(D)J INFORMATION FOR IMMUNE REPERTOIRE SEQUENCING”的美国专利申请第17/091,639号中描述，该专利申请的内容通过引用以其整体并入本文。在一些实施方案中，提供了采用5’条形码化、随机引发和延伸以及所公开的TSO来获得全长V(D)J信息的方法。

免疫组库谱分析

在一些实施方案中，提供了对免疫受体的V(D)J区进行3’和/或5’表达谱分析的方法。在一些实施方案中，样品包括单细胞。在一些实施方案中，样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。单细胞可以包括免疫细胞。在一些实施方案中，免疫细胞是B细胞或T细胞。在一些实施方案中，单细胞可以包括循环肿瘤细胞。在一些实施方案中，每一种寡核苷酸条形码可以包含第一通用序列。在一些实施方案中，多于一种延伸的条形码化核酸分子包含第一通用序列并且不包含第一通用序列的互补物。在一些实施方案中，扩增多于一种延伸的条形码化核酸分子以产生多于一种单标记的核酸分子包括使用能够与第一通用序列杂交的引物和扩增引物。

在一些实施方案中，扩增引物是靶特异性引物。在一些这样的实施方案中，靶特异性引物与免疫受体特异性杂交。例如，靶特异性引物可以与免疫受体的恒定区、免疫受体的可变区、免疫受体的多样性区、免疫受体的可变区和多样性区的连接处或其任何组合特异性杂交。免疫受体可以是T细胞受体(TCR)和/或B细胞受体(BCR)。TCR可以包含TCRα链、TCRβ链、TCRγ链、TCRδ链或其任何组合。BCR可以包含BCR重链和/或BCR轻链。

方法可以包括获得多于一种延伸的条形码化核酸分子或其产物的序列信息。获得序列信息可以包括将测序衔接子附接到多于一种延伸的条形码化核酸分子或其产物。获得序列信息可以包括将测序衔接子附接到多于一种单标记的核酸分子或其产物。

获得序列信息可以包括获得单细胞的BCR轻链和BCR重链的序列信息。BCR轻链和BCR重链的序列信息可以包括BCR轻链和/或BCR重链的互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列。方法可以包括基于所获得的序列信息使单细胞的BCR轻链和BCR重链进行配对。样品可以包括多于一个单细胞，并且方法可以包括基于所获得的序列信息使至少50％的单细胞的BCR轻链和BCR重链进行配对。在一些实施方案中，其中BCR轻链和BCR重链按照本文提供的方法配对的样品的单细胞百分比可以是以下或是约以下：0.000000001％、0.00000001％、0.0000001％、0.000001％、0.00001％、0.0001％、0.001％、0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％，或这些值中的任何两个之间的数字或范围。在一些实施方案中，其中BCR轻链和BCR重链按照本文提供的方法配对的样品的单细胞百分比可以是至少以下或至多以下：0.000000001％、0.00000001％、0.0000001％、0.000001％、0.00001％、0.0001％、0.001％、0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。

获得序列信息可以包括获得单细胞的TCRα链和TCRβ链的序列信息。在一些实施方案中，TCRα链和TCRβ链的序列信息可以包括TCRα链和/或TCRβ链的互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列。在一些实施方案中，方法可以包括基于所获得的序列信息使单细胞的TCRα链和TCRβ链进行配对。在一些实施方案中，样品可以包括多于一个单细胞，并且方法可以包括基于所获得的序列信息使至少50％的单细胞的TCRα链和TCRβ链进行配对。在一些实施方案中，其中TCRα链和TCRβ链按照本文提供的方法配对的样品的单细胞百分比可以是以下或是约以下：0.000000001％、0.00000001％、0.0000001％、0.000001％、0.00001％、0.0001％、0.001％、0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％，或这些值中的任何两个之间的数字或范围。在一些实施方案中，其中TCRα链和TCRβ链按照本文提供的方法配对的样品的单细胞百分比可以是至少以下或至多以下：0.000000001％、0.00000001％、0.0000001％、0.000001％、0.00001％、0.0001％、0.001％、0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。

获得序列信息可以包括获得单细胞的TCRγ链和TCRδ链的序列信息。TCRγ链和TCRδ链的序列信息可以包含TCRγ链和/或TCRδ链的互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列。方法可以包括基于所获得的序列信息使单细胞的TCRγ链和TCRδ链进行配对。样品可以包括多于一个单细胞，并且方法可以包括基于所获得的序列信息使至少50％的单细胞的TCRγ链和TCRδ链进行配对。在一些实施方案中，其中TCRγ链和TCRδ链按照本文提供的方法配对的样品的单细胞百分比可以是、大约是、至少是或至多是以下：0.000000001％、0.00000001％、0.0000001％、0.000001％、0.00001％、0.0001％、0.001％、0.01％、0.1％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％，或这些值中的任何两个之间的数字或范围。

具有随机引发和延伸的全转录组分析(WTA)

本文的公开内容包括用于从cDNA产物(例如，BD Rhapsody单细胞分析***的cDNA产物)产生全转录组分析(WTA)文库用于使用公开的TSO在相容的测序仪(例如测序仪)上测序的方法。在一些实施方案中，标准的BD Rhapsody RNA工作流程首先经由BDRhapsody细胞捕获珠(下文称为‘珠’)上的3’捕获和cDNA合成来捕获RNA转录组，然后进行2次多重化巢式PCR扩增，以富集感兴趣的RNA靶(靶向测定)。在方法的一些实施方案中，靶向RNA分析通常对低表达靶产生更高的灵敏度，而WTA RNA分析提供更大广度的被询问基因。在一些实施方案中，期望的靶的成功扩增可能需要彻底了解感兴趣的模型***中的每一种RNA的3’端及其多腺苷酸化位点的使用。WTA方法，例如与BD Rhapsody一起使用，允许获得若干水平的信息，包括1)在其模型***中识别感兴趣的RNA靶，以鉴定待设计的一组基因；2)将其模型***中转录组的3’端表征为用于BD Rhapsody的新一代PCR组设计(PCR paneldesign)的输入，以及3)与标准BD Rhapsody靶向方法相比，允许用户通过测定更大广度的基因来进行发现生物学。在一些实施方案中，该方法包括使用第一和/或第二多于一种延伸的条形码化核酸分子或其产物作为模板的随机引发和延伸反应。在一些实施方案中，本文公开的组合物和方法可以与2021年1月29日提交的题为“MESOPHILIC DNA POLYMERASEEXTENSION BLOCKERS”的美国专利申请第17/163,177号中描述的基于RPE的全转录组分析方法和组合物协同使用，其内容通过引用整体并入本文。基于RPE的全转录组分析方法和组合物已经在美国专利申请第16/677,012号中描述；其内容通过引用整体并入本文。本文公开的基于RPE的WTA方法可以导致低丰度转录物的灵敏度提高、检测新的转录物、检测新的细胞类型和/或降低测序成本。与可选的非基于RPE的WTA方法(例如，基于连接或基于片段化的WTA方法)和/或基于RPE的WTA方法相比，本文提供的基于RPE的WTA方法的一些实施方案导致低丰度转录物的灵敏度提高、检测新的转录物、检测新的细胞类型和/或降低测序成本。

试剂盒

本文的公开内容包括试剂盒。在一些实施方案中，试剂盒包含：第一多于一种寡核苷酸条形码，其中第一多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区，并且其中第一多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列；第二多于一种寡核苷酸条形码，其中第二多于一种寡核苷酸条形码的每一种包含第二通用序列、第二分子标记和诱饵序列，其中第二多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列；包含(i)阻断序列的互补物和(ii)诱饵序列的模板转换寡核苷酸(TSO)；缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶；和/或逆转录酶。

在一些实施方案中，缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶包括嗜中温DNA聚合酶、嗜热DNA聚合酶、嗜冷DNA聚合酶或其任何组合。在一些实施方案中，DNA聚合酶包括Klenow片段。在一些实施方案中，逆转录酶包括病毒逆转录酶。在一些实施方案中，病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶。在一些实施方案中，病毒逆转录酶是Moloney鼠白血病病毒(MMLV)逆转录酶。在一些实施方案中，模板转换寡核苷酸包含一个或更多个3’核糖核苷酸，例如三个3’核糖核苷酸。在一些实施方案中，3’核糖核苷酸包括鸟嘌呤。在一些实施方案中，试剂盒包含以下中的一种或更多种：乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(DMSO)、甘油、甲酰胺、7-脱氮-GTP、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合。在一些实施方案中，试剂盒包含缓冲液。在一些实施方案中，试剂盒包含盒(cartridge)。在一些实施方案中，试剂盒包含一种或更多种用于逆转录反应的试剂。在一些实施方案中，试剂盒包含一种或更多种用于扩增反应的试剂。

尽管本文已经公开了各种方面和实施方案，但其他方面和实施方案对本领域技术人员将是明显的。本文公开的各种方面和实施方案用于说明的目的而并不旨在限制，真正范围和精神由以下权利要求指出。

本领域的技术人员将理解，对于本文公开的这个和其他过程和方法，在该过程和方法中执行的功能可以以不同的顺序实现。此外，所概述的步骤和操作仅作为示例提供，并且该步骤和操作中的一些可以是任选的，组合成较少的步骤和操作，或者延伸成另外的步骤和操作，而不偏离所公开的实施方案的本质。

关于本文中使用基本上任何复数和/或单数术语，在对于上下文和/或应用适当的情况下，本领域技术人员可以从复数转换为单数和/或从单数转换为复数。为了清楚起见，可以在本文明确阐述各种单数/复数排列。

本领域技术人员将理解，通常，本文使用的术语，并且特别是所附权利要求书(例如，所附权利要求书的主体)中的术语，通常旨在作为“开放性的”术语(例如，术语“包括/包含(including)”应解释为“包括但不限于(including but not limited to)”，术语“具有(having)”应解释为“具有至少(having at least)”，术语“包括/包含(includes)”应解释为“包括但不限于(includes but is not limited to)”等)。本领域技术人员将进一步理解，如果意图所介绍的权利要求陈述中的特定数字，则这样的意图将明确地陈述于权利要求中，并且在这种陈述不存在的情况下，不存在这种意图。例如，作为对理解的帮助，以下所附权利要求书可以包含介绍性措辞“至少一种”和“一种或更多种”的使用，以介绍权利要求陈述。然而，此类措辞的使用不应解读为意味着由不定冠词“一(a)”或“一(an)”介绍权利要求陈述会将任何包含此类介绍的权利要求陈述的具体权利要求限制到包含仅一种此类陈述的实施方案，甚至当同一权利要求包括介绍性措辞“一种或更多种”或“至少一种”以及不定冠词诸如“一(a)”或“一(an)”时也是如此(例如，“一(a)”和/或“一(an)”应解释为意指“至少一种”或“一种或更多种”)；这对于使用定冠词来介绍权利要求陈述同样适用。此外，即使明确地陈述了介绍的权利要求陈述的特定数字，本领域技术人员将认识到，此类陈述应解释为意指至少所陈述的数字(例如，仅陈述“两种陈述”而没有其他修饰词意指至少两种陈述或两种或更多种陈述)。此外，在使用类似于“A、B和C等中的至少一种”的惯例的那些情况下，通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如，“具有A、B和C中的至少一种的***”将包括但不限于具有单独的A，具有单独的B，具有单独的C，A和B一起，A和C一起，B和C一起，和/或A、B和C一起等的***)。在使用类似于“A、B或C等中的至少一种”的惯例的那些情况下，通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如，“具有A、B或C中的至少一种的***”将包括但不限于具有单独的A，具有单独的B，具有单独的C，A和B一起，A和C一起，B和C一起，和/或A、B和C一起等的***)。本领域技术人员将进一步理解，实际上，无论在说明书、权利要求书还是在附图中，呈现两个或更多个替代术语的任何分离性词语和/或措辞应被理解为考虑到包括术语之一、任一术语或两个术语的可能性。例如，短语“A或B”应被理解为包括“A”或“B”或“A和B”的可能性。

此外，当本公开内容的特征或方面以马库什组(Markush group)描述时，本领域技术人员将意识到，本公开内容还由此以马库什组的任何个体成员或成员子组描述。

如本领域技术人员将理解的，出于任何和所有目的，诸如在提供书面描述方面，本文公开的所有范围还涵盖该范围的任何和所有可能的子范围和子范围的组合。任何列举的范围可以被容易地认为充分地描述了并且使得同一范围能够被分成至少相等的二分之一、三分之一、四分之一、五分之一、十分之一等。作为非限制性实例，本文讨论的每个范围可以被容易地分成下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的，所有语言诸如“多达(up to)”、“至少”等包括所述及的数字并且指随后可以被分成如以上讨论的子范围的范围。最后，如本领域技术人员将理解的，范围包括每个单独的成员。因此，例如，具有1-3个细胞的组是指具有1个、2个或3个细胞的组。类似地，具有1-5个细胞的组是指具有1个、2个、3个、4个或5个细胞的组，等等。

从前述内容，应当理解，本文出于说明的目的已经描述了本公开内容的各种实施方案，并且可以在不脱离本公开内容的范围和精神的情况下进行各种修改。因此，本文公开的各种实施方案并不旨在进行限制，真正的范围和精神由以下权利要求来指示。

Claims

1.一种用于对样品中的核酸靶进行标记的方法，所述方法包括：

使核酸靶的拷贝与第一多于一种寡核苷酸条形码接触，其中每种寡核苷酸条形码包含第一通用序列、分子标记和能够与所述核酸靶杂交的靶结合区；

在存在逆转录酶和包含(i)阻断序列的互补物和(ii)靶结合区或其一部分的模板转换寡核苷酸(TSO)的情况下，延伸与所述核酸靶的拷贝杂交的所述多于一种寡核苷酸条形码，以产生各自包含与所述核酸靶的至少一部分互补的序列、第一分子标记、所述靶结合区、所述阻断序列和所述靶结合区的互补物的第一多于一种条形码化核酸分子；

使每种条形码化核酸分子的所述靶结合区的互补物与所述第一多于一种寡核苷酸条形码中的寡核苷酸条形码的所述靶结合区杂交；以及

延伸与所述条形码化核酸分子的所述靶结合区的互补物杂交的寡核苷酸条形码的3’端，以产生各自包含所述第一分子标记的互补物和第二分子标记的第一多于一种延伸的条形码化核酸分子。

2.根据权利要求1所述的方法，所述方法包括：基于与所述第一多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定所述样品中所述核酸靶的拷贝数。

3.一种用于确定样品中核酸靶的数目的方法，所述方法包括：

使每种条形码化核酸分子的所述靶结合区的互补物与所述第一多于一种寡核苷酸条形码中的寡核苷酸条形码的所述靶结合区杂交；

延伸与所述条形码化核酸分子的所述靶结合区的互补物杂交的所述寡核苷酸条形码的3’端，以产生各自包含所述第一分子标记的互补物和第二分子标记的第一多于一种延伸的条形码化核酸分子；以及

基于与所述第一多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定所述样品中所述核酸靶的拷贝数。

4.根据权利要求2-3中任一项所述的方法，

所述方法包括扩增所述第一多于一种延伸的条形码化核酸分子以产生各自包含所述第二分子标记的第一多于一种单标记的核酸分子，

其中确定所述样品中所述核酸靶的拷贝数包括：基于与所述第一多于一种单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定所述样品中所述核酸靶的拷贝数。

5.一种用于对样品中的核酸靶进行标记的方法，所述方法包括：

使核酸靶的拷贝与第一多于一种寡核苷酸条形码接触，其中所述第一多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含第一通用序列、第一分子标记和能够与所述核酸靶杂交的靶结合区；

在存在逆转录酶和包含(i)阻断序列的互补物和(ii)诱饵序列的模板转换寡核苷酸(TSO)的情况下，延伸与所述核酸靶的拷贝杂交的所述第一多于一种寡核苷酸条形码，以产生各自包含所述第一通用序列、所述第一分子标记、所述诱饵序列的互补物、所述阻断序列和与所述核酸靶的至少一部分互补的序列的第二多于一种条形码化核酸分子；

使所述条形码化核酸分子与第二多于一种寡核苷酸条形码接触，其中所述第二多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含第二通用序列、第二分子标记和所述诱饵序列；以及

延伸：

与所述条形码化核酸分子的诱饵序列的互补物杂交的所述第二多于一种寡核苷酸条形码中的寡核苷酸条形码的3’端，以产生各自包含第二分子标记、第二通用序列、所述第一分子标记的互补物和所述第一通用序列的互补物的第二多于一种延伸的条形码化核酸分子。

6.根据权利要求5所述的方法，所述方法还包括基于以下确定所述样品中所述核酸靶的拷贝数：

与所述第二多于一种延伸的条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、具有不同序列的第二分子标记或其组合的数目。

7.一种用于确定样品中核酸靶的拷贝数的方法，所述方法包括：

使所述条形码化核酸分子与第二多于一种寡核苷酸条形码接触，其中所述第二多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含第二通用序列、第二分子标记和所述诱饵序列；

延伸：

与所述条形码化核酸分子的所述诱饵序列的互补物杂交的所述第二多于一种寡核苷酸条形码中的寡核苷酸条形码的3’端，以产生各自包含第二分子标记、第二通用序列、所述第一分子标记的互补物和所述第一通用序列的互补物的第二多于一种延伸的条形码化核酸分子；以及

根据以下确定所述样品中所述核酸靶的拷贝数：

8.根据权利要求6-7中任一项所述的方法，

其中确定所述核酸靶的拷贝数包括基于与所述第二多于一种延伸的条形码化核酸分子中的延伸的条形码化核酸分子关联的具有不同序列的第一分子标记、具有不同序列的第二分子标记或其组合的数目来确定所述样品中多于一种核酸靶中的每一种的拷贝数，所述第二多于一种延伸的条形码化核酸分子包含所述多于一种核酸靶中的每一种的序列。

9.根据权利要求1-8中任一项所述的方法，其中所述第一多于一种寡核苷酸条形码中的每一种寡核苷酸条形码的所述第一通用序列在所述第一分子标记和所述靶结合区的5’。

10.根据权利要求1-9中任一项所述的方法，其中所述第二多于一种寡核苷酸条形码中的每一种寡核苷酸条形码的所述第二通用序列在所述第二分子标记和所述诱饵序列的5’。

11.根据权利要求1-10中任一项所述的方法，其中所述诱饵序列包含至少6个核苷酸。

12.根据权利要求1-11中任一项所述的方法，其中所述诱饵序列包含约20％至约80％的GC含量。

13.根据权利要求1-12中任一项所述的方法，

所述方法包括使用扩增引物和包含所述第二通用序列或其一部分的引物扩增所述第二多于一种延伸的条形码化核酸分子，从而产生包含所述核酸靶的序列或其一部分的第二多于一种单标记的核酸分子，

其中确定所述样品中所述核酸靶的拷贝数包括：基于与所述第二多于一种单标记的核酸分子或其产物关联的具有不同序列的第二分子标记的数目来确定所述样品中所述核酸靶的拷贝数。

14.根据权利要求1-13中任一项所述的方法，

所述方法包括使用扩增引物和包含所述第一通用序列或其一部分的引物扩增所述第二多于一种延伸的条形码化核酸分子，从而产生包含所述核酸靶的序列或其一部分的第三多于一种单标记的核酸分子，

其中确定所述样品中所述核酸靶的拷贝数包括：基于与所述第三多于一种单标记的核酸分子或其产物关联的具有不同序列的第一分子标记的数目来确定所述样品中所述核酸靶的拷贝数。

15.根据权利要求1-14中任一项所述的方法，其中所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的所述寡核苷酸条形码包含细胞标记，任选地，所述细胞标记位于所述分子标记的5’。

16.根据权利要求1-15中任一项所述的方法，其中所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的所述寡核苷酸条形码的至少一部分包含至少一个可变序列，任选地，所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的至少10种在所述可变序列处包含不同序列，任选地，所述细胞标记和/或分子标记的至少一部分包含可变序列。

17.根据权利要求1-16中任一项所述的方法，其中所述阻断序列：

位于所述第一多于一种条形码化核酸分子和/或第二多于一种条形码化核酸分子的3’端；

被配置为不与以下互补：(i)所述第一多于一种寡核苷酸条形码中的寡核苷酸条形码中所述靶结合区5’的区域；和/或(ii)所述第二多于一种寡核苷酸条形码中的寡核苷酸条形码中所述诱饵序列5’的区域；

与以下少于约50％互补：(i)所述第一多于一种寡核苷酸条形码中的寡核苷酸条形码中所述靶结合区5’的区域；和/或(ii)所述第二多于一种寡核苷酸条形码中的寡核苷酸条形码中所述诱饵序列5’的区域；

被配置为阻止所述第一多于一种条形码化核酸分子和/或第二多于一种条形码化核酸分子的3’端的延伸；

减少包含所述第一通用序列的互补物的延伸的条形码化核酸分子的产生；

包含阻断物核苷酸，其中所述阻断物核苷酸位于所述阻断序列的3’端；和/或

包含SEQ ID NO:1-7中任何一个的至少4个连续碱基。

18.根据权利要求1-17中任一项所述的方法，其中：

在不存在所述阻断序列的情况下，

(i)与所述第二多于一种寡核苷酸条形码的所述诱饵序列杂交的所述第二多于一种条形码化核酸分子的3’端；和/或

(ii)与所述第一多于一种寡核苷酸条形码的所述靶结合区杂交的所述第一多于一种条形码化核酸分子的3’端；

能够被延伸以产生第三多于一种延伸的条形码化核酸分子。

19.根据权利要求1-18中任一项所述的方法，其中与其中所述TSO不包含阻断序列的互补物的可比方法相比，所述第三多于一种延伸的条形码化核酸分子的产生减少了至少10％、至少25％、至少50％、至少80％、至少90％、至少95％或至少99％。

20.根据权利要求1-19中任一项所述的方法，其中所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的寡核苷酸条形码的至少一部分包含不变序列，任选地，所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的每一种在所述不变序列处包含相同的序列。

21.根据权利要求1-20中任一项所述的方法，其中所述不变序列的长度在约1-15个核苷酸之间，任选地所述不变序列的长度为1个核苷酸。

22.根据权利要求1-21中任一项所述的方法，其中所述不变序列位于所述细胞标记中，任选地，所述细胞标记包含所述细胞标记的第一部分、第一接头、所述细胞标记的第二部分、第二接头和所述细胞标记的第三部分，还任选地，所述不变序列位于所述细胞标记的第三部分。

23.根据权利要求1-22中任一项所述的方法，其中所述阻断物核苷酸被配置为不与所述不变序列互补。

24.根据权利要求1-23中任一项所述的方法，其中所述不变序列和所述诱饵序列之间的距离与所述诱饵序列的互补物和所述阻断物核苷酸之间的距离等距。

25.根据权利要求1-24中任一项所述的方法，其中所述不变序列和所述靶结合区之间的距离与所述靶结合区的互补物和所述阻断物核苷酸之间的距离等距。

26.根据权利要求1-25中任一项所述的方法，其中所述TSO包含选自由SEQ ID NO:1-7组成的组的序列，或与选自由SEQ ID NO:1-7组成的组的序列具有至少约50％同一性的序列。

27.根据权利要求1-26中任一项所述的方法，其中所述阻断序列的互补物在所述TSO中所述诱饵序列的5’。

28.根据权利要求1-27中任一项所述的方法，其中所述阻断序列的互补物在所述TSO中所述靶结合区或其部分的5’。

29.根据权利要求1-28中任一项所述的方法，其中，与其中所述TSO不包含阻断序列的互补物的可比方法相比，模板转换效率降低少于40％、少于20％、少于10％或少于5％。

30.根据权利要求1-29中任一项所述的方法，其中所述方法还包括在一个或更多个延伸步骤之前或期间添加阻断物寡核苷酸。

31.权利要求1-30中任一项的方法，其中所述方法不包括添加阻断物寡核苷酸。

32.根据权利要求1-31中任一项所述的方法，其中所述阻断序列的互补物包含所述阻断序列的反向互补序列和/或所述阻断序列的互补序列。

33.根据权利要求1-32中任一项所述的方法，其中使条形码化核酸分子的所述靶结合区的互补物与所述第一多于一种寡核苷酸条形码中的寡核苷酸条形码的所述靶结合区杂交包括使条形码化核酸分子的所述靶结合区的互补物与所述第一多于一种寡核苷酸条形码中的寡核苷酸条形码的所述靶结合区进行分子间杂交。

34.根据权利要求1-33中任一项所述的方法，所述方法包括在使每种条形码化核酸分子的所述靶结合区的互补物与所述第一多于一种寡核苷酸条形码中的寡核苷酸条形码的所述靶结合区杂交之前使所述第一多于一种条形码化核酸分子变性。

35.根据权利要求1-34中任一项所述的方法，所述方法包括在扩增所述第一多于一种延伸的条形码化核酸分子和/或第二多于一种延伸的条形码化核酸分子之前使所述第一多于一种延伸的条形码化核酸分子和/或第二多于一种延伸的条形码化核酸分子变性。

36.根据权利要求1-35中任一项所述的方法，

其中确定所述核酸靶的拷贝数包括基于与所述第一多于一种单标记的核酸分子中包含所述多于一种核酸靶中的每一种的序列的单标记的核酸分子关联的具有不同序列的第二分子标记的数目来确定所述样品中所述多于一种核酸靶中的每一种的拷贝数。

37.根据权利要求36所述的方法，其中所述多于一种核酸靶中的每一种的序列包括所述多于一种核酸靶中的每一种的子序列。

38.根据权利要求1-37中任一项所述的方法，其中所述第一多于一种条形码化核酸分子和/或第二多于一种条形码化核酸分子中的所述核酸靶的序列包含所述核酸靶的子序列。

39.根据权利要求1-38中任一项所述的方法，其中所述靶结合区的互互补物与所述靶结合区的一部分互补。

40.根据权利要求1-39中任一项所述的方法，其中所述靶结合区包含基因特异性序列，和/或多(dT)序列。

41.根据权利要求1-40中任一项所述的方法，其中所述第二分子标记不同于所述第一分子标记，并且其中所述第二分子标记不是所述第一分子标记的互补物。

42.根据权利要求1-41中任一项所述的方法，其中所述第一多于一种延伸的条形码化核酸分子和/或第二多于一种延伸的条形码化核酸分子各自包含所述核酸靶的序列。

43.根据权利要求1-42中任一项所述的方法，其中所述核酸靶包括mRNA，并且其中所述第一多于一种延伸的条形码化核酸分子和/或第二多于一种延伸的条形码化核酸分子各自包含所述核酸靶的有义链的序列。

44.根据权利要求1-43中任一项所述的方法，

其中所述逆转录酶能够具有末端转移酶活性；

其中所述模板转换寡核苷酸包含一个或更多个3’核糖核苷酸，任选地三个3’核糖核苷酸，并且还任选地所述3’核糖核苷酸包含鸟嘌呤；和/或

其中所述逆转录酶包括病毒逆转录酶，任选地所述病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。

45.根据权利要求1-44中任一项所述的方法，

其中所述样品包括单细胞、任选的免疫细胞，并且还任选的B细胞或T细胞；和/或

其中所述样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合，

任选地，其中单细胞包括循环肿瘤细胞。

46.根据权利要求1-45中任一项所述的方法，其中所述第一通用序列在所述分子标记和所述靶结合区的5’。

47.根据权利要求1-46中任一项所述的方法，其中扩增所述第一多于一种延伸的条形码化核酸分子以产生第一多于一种单标记的核酸分子包括使用能够与所述第一通用序列杂交的引物和扩增引物。

48.根据权利要求1-47所述的方法，其中所述扩增引物是靶特异性引物，并且任选地，所述靶特异性引物与免疫受体、免疫受体的恒定区、免疫受体的可变区、免疫受体的多样性区和/或免疫受体的可变区和多样性区的连接区特异性杂交。

49.根据权利要求48所述的方法，其中所述免疫受体是T细胞受体(TCR)和/或B细胞受体(BCR)，并且任选地

所述TCR包含TCRα链、TCRβ链、TCRγ链、TCRδ链或其任何组合；并且

所述BCR受体包含BCR重链和/或BCR轻链。

50.根据权利要求47-49中任一项的方法，其中所述扩增引物与各自包含所述第一分子标记的互补物和第二分子标记的所述延伸的条形码化核酸分子特异性结合。

51.根据权利要求47-50中任一项所述的方法，其中所述扩增引物不结合包含所述第一分子标记的延伸的条形码化核酸分子。

52.根据权利要求47-51中任一项所述的方法，其中所述扩增引物包含所述核酸靶的互补物。

53.根据权利要求47-52中任一项所述的方法，其中所述核酸靶包括mRNA，并且其中所述扩增引物包含所述核酸靶的反义链的序列。

54.根据权利要求1-53中任一项所述的方法，其中延伸所述寡核苷酸条形码的3’端包括使用嗜中温DNA聚合酶、嗜热DNA聚合酶、嗜冷DNA聚合酶或其任何组合延伸所述寡核苷酸条形码的3’端。

55.根据权利要求1-54中任一项所述的方法，其中延伸所述寡核苷酸条形码的3’端包括使用缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶延伸所述寡核苷酸条形码的3’端，并且任选地所述DNA聚合酶包含Klenow片段。

56.根据权利要求1-55中任一项所述的方法，所述方法包括获得所述第一多于一种延伸的条形码化核酸分子和/或第二多于一种延伸的条形码化核酸分子或其产物的序列信息。

57.根据权利要求1-56中任一项所述的方法，所述方法包括获得所述第一多于一种单标记的核酸分子、第二多于一种单标记的核酸分子和第三多于一种单标记的核酸分子或其产物中的一种或更多种的序列信息。

58.根据权利要求56-57中任一项所述的方法，其中获得所述序列信息包括将测序衔接子附接至所述第一多于一种延伸的条形码化核酸分子和/或第二多于一种延伸的条形码化核酸分子或其产物。

59.根据权利要求56-58中任一项所述的方法，其中获得所述序列信息包括将测序衔接子附接至所述第一多于一种单标记的核酸分子、第二多于一种单标记的核酸分子和/或第三多于一种单标记的核酸分子或其产物。

60.根据权利要求57-59中任一项所述的方法，其中获得所述序列信息包括：

获得测序数据，所述测序数据包括所述第一多于一种延伸的条形码化核酸分子和/或第二多于一种延伸的条形码化核酸分子或其产物、和/或所述第一多于一种单标记的核酸分子、第二多于一种单标记的核酸分子和第三多于一种单标记的核酸分子或其产物中的一种或更多种的多于一个测序读段，

其中所述多于一个测序读段中的每一个包含(1)细胞标记序列，(2)分子标记序列，和/或(3)所述核酸靶的子序列。

61.根据权利要求60所述的方法，其中总测序读段的少于40％、少于20％、少于10％或少于5％来自所述第三多于一种延伸的条形码化核酸分子或其产物。

62.根据权利要求60-61中任一项所述的方法，其中与其中所述TSO不包含阻断序列的互补物的可比方法相比，从所述第三多于一种延伸的条形码化核酸分子或其产物衍生的测序读段的数目减少至少约2倍。

63.根据权利要求56-62中任一项所述的方法，其中获得所述序列信息包括获得单细胞的所述BCR轻链和所述BCR重链的序列信息，

任选地，所述BCR轻链和所述BCR重链的序列信息包括所述BCR轻链和/或所述BCR重链的互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列，

任选地，所述方法包括基于所获得的序列信息使所述单细胞的所述BCR轻链和所述BCR重链进行配对，并且

任选地，所述样品包括多于一个单细胞，所述方法包括基于所获得的序列信息使至少50％的所述单细胞的所述BCR轻链和所述BCR重链进行配对。

64.根据权利要求56-63中任一项所述的方法，其中获得所述序列信息包括获得单细胞的所述TCRα链和所述TCRβ链的序列信息，

任选地，所述TCRα链和所述TCRβ链的序列信息包含所述TCRα链和/或所述TCRβ链的互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列，

任选地，所述方法包括基于所获得的序列信息使所述单细胞的所述TCRα链和所述TCRβ链行配对，并且

任选地，所述样品包括多于一个单细胞，所述方法包括基于所获得的序列信息使至少50％的所述单细胞的所述TCRα链和所述TCRβ链进行配对。

65.根据权利要求56-64中任一项所述的方法，其中获得所述序列信息包括获得单细胞的所述TCRγ链和所述TCRδ链的序列信息，

任选地，所述TCRγ链和所述TCRδ链的序列信息包括所述TCRγ链和/或所述TCRδ链的所述互补决定区1(CDR1)、CDR2、CDR3或其任何组合的序列，

任选地，所述方法包括基于所获得的序列信息使所述单细胞的所述TCRγ链和所述TCRδ链进行配对，并且

任选地，所述样品包括多于一个单细胞，所述方法包括基于所获得的序列信息使至少50％的所述单细胞的所述TCRγ链和所述TCRδ链进行配对。

66.根据权利要求1-65中任一项所述的方法，其中所述靶结合区的互补物包括所述靶结合区的反向互补序列和/或所述靶结合区的互补序列。

67.根据权利要求1-66中任一项所述的方法，其中所述分子标记的互补物包括所述分子标记的反向互补序列和/或所述分子标记的互补序列。

68.根据权利要求1-67中任一项所述的方法，其中所述第一多于一种条形码化核酸分子和/或第二多于一种条形码化核酸分子包括条形码化脱氧核糖核酸(DNA)分子和/或条形码化核糖核酸(RNA)分子。

69.根据权利要求1-68中任一项所述的方法，其中所述靶结合区包含寡聚dT序列、随机序列、靶特异性序列或其组合。

70.根据权利要求1-69中任一项所述的方法，其中所述靶结合区包含多(dT)区，并且其中所述核酸靶包含多(dA)区。

71.根据权利要求1-70中任一项所述的方法，其中所述样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。

72.根据权利要求1-71中任一项所述的方法，其中所述核酸靶包括：

核酸分子，任选地所述核酸分子包含核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA或其任何组合，任选地所述mRNA编码免疫受体；和/或

细胞组分结合试剂，任选地，所述核酸分子与所述细胞组分结合试剂关联，任选地，所述方法包括使所述核酸分子和所述细胞组分结合试剂解离。

73.根据权利要求1-72中任一项所述的方法，其中所述第一多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列。

74.根据权利要求1-73中任一项所述的方法，其中所述多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸。

75.根据权利要求1-74中任一项所述的方法，其中所述第一多于一种寡核苷酸条形码与固体支持物关联，并且任选地与同一固体支持物关联的第一多于一种寡核苷酸条形码各自包含相同的样品标记，并且还任选地所述第一多于一种寡核苷酸条形码的每一种样品标记包含至少6个核苷酸。

76.根据权利要求1-75中任一项所述的方法，

其中所述第一多于一种寡核苷酸条形码各自包含细胞标记，并且任选地，所述第一多于一种寡核苷酸条形码的每一种细胞标记包含至少6个核苷酸；

其中与同一固体支持物关联的寡核苷酸条形码包含相同的细胞标记；和/或

其中与不同固体支持物关联的寡核苷酸条形码包含不同的细胞标记。

77.根据权利要求76所述的方法，其中所述第一多于一种延伸的条形码化核酸分子和/或第二多于一种延伸的条形码化核酸分子各自包含细胞标记和所述细胞标记的互补物，并且任选地所述细胞标记的互补物包含所述细胞标记的反向互补序列和/或所述细胞标记的互补序列。

78.根据权利要求1-77中任一项所述的方法，所述方法包括在存在乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(DMSO)、甘油、甲酰胺、7-脱氮-GTP、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合中的一种或更多种的情况下，延伸与所述核酸靶的拷贝杂交的所述第一多于一种寡核苷酸条形码。

79.根据权利要求1-78中任一项所述的方法，

其中所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列，任选地，所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸；

其中所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码与固体支持物关联；

其中与同一固体支持物关联的所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码各自包含相同的样品标记，任选地所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码的每一种样品标记包含至少6个核苷酸；

其中所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码各自包含细胞标记，任选地，所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码的每一种细胞标记包含至少6个核苷酸；

其中(a)与同一固体支持物关联的所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码中的寡核苷酸条形码包含相同的细胞标记；和/或(b)与不同固体支持物关联的所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码中的寡核苷酸条形码包含不同的细胞标记；和/或

其中所述第一多于一种延伸的条形码化核酸分子和第二多于一种延伸的条形码化核酸分子中的所述延伸的条形码化核酸分子各自包含细胞标记和所述细胞标记的互补物，任选地，所述细胞标记的互补物包含所述细胞标记的反向互补序列或所述细胞标记的互补序列。

80.根据权利要求1-79中任一项所述的方法，

其中所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码中的至少一种寡核苷酸条形码被固定或部分地固定在所述合成颗粒上，或者所述第一多于一种寡核苷酸条形码和第二多于一种寡核苷酸条形码中的至少一种寡核苷酸条形码被包封或部分地包封在所述合成颗粒中；

其中所述固体支持物包括合成颗粒或平面表面；

其中所述样品包括单细胞，所述方法包括将包含所述多于一种寡核苷酸条形码的合成颗粒与所述样品中的单细胞关联；

其中所述方法包括在将所述合成颗粒与所述单细胞关联后裂解所述单细胞，并且任选地裂解所述单细胞包括加热所述样品、使所述样品与去污剂接触、改变所述样品的pH或其任何组合；

其中所述合成颗粒和所述单细胞处于同一孔中；

其中所述合成颗粒和所述单细胞在同一液滴中；

其中所述第一多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在所述合成颗粒上，或者所述第一多于一种寡核苷酸条形码中的至少一种被封闭或部分地封闭在所述合成颗粒中；和/或

其中所述合成颗粒是可破坏的。

81.根据权利要求1-80中任一项所述的方法，其中所述合成颗粒包括珠，并且任选地所述珠包括

琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合；

选自由以下组成的组的材料：聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合；或

可破坏的水凝胶颗粒。

82.根据权利要求1-81中任一项所述的方法，

其中所述第一多于一种寡核苷酸条形码和所述第二多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含接头官能团，

其中所述合成颗粒包含固体支持物官能团，并且

其中所述支持物官能团和所述接头官能团彼此关联，并且任选地所述接头官能团和所述支持物官能团单独地选自由以下组成的组：C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮及其任何组合。

83.根据权利要求1-82中任一项所述的方法，

其中所述第一多于一种寡核苷酸条形码中的每一种包含接头官能团，

其中所述合成颗粒包含固体支持物官能团，并且

其中所述支持物官能基团和所述接头官能基团彼此关联，

并且任选地，所述接头官能团和所述支持物官能团单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮，以及其任何组合组成的组。

84.一种试剂盒，所述试剂盒包含：

第一多于一种寡核苷酸条形码，其中所述第一多于一种寡核苷酸条形码中的每一种包含第一通用序列、细胞标记、分子标记和靶结合区，并且其中所述第一多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列；

逆转录酶；

模板转换寡核苷酸(TSO)，所述模板转换寡核苷酸(TSO)包含(i)阻断序列的互补物和(ii)所述靶结合区或其一部分；和/或

缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶。

85.一种试剂盒，所述试剂盒包含：

第二多于一种寡核苷酸条形码，其中所述第二多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含第二通用序列、第二分子标记和诱饵序列，其中所述第二多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列；

模板转换寡核苷酸(TSO)，所述模板转换寡核苷酸(TSO)包含(i)阻断序列的互补物和(ii)诱饵序列；

缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶；和/或

逆转录酶。

86.根据权利要求84-85中任一项所述的试剂盒，其中所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的所述寡核苷酸条形码包含细胞标记，任选地，所述细胞标记位于所述分子标记的5’。

87.根据权利要求84-86中任一项所述的试剂盒，其中所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的所述寡核苷酸条形码的至少一部分包含至少一个可变序列，任选地，所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的至少10种在所述可变序列处包含不同序列，任选地，所述细胞标记和/或分子标记的至少一部分包含可变序列。

88.根据权利要求84-87中任一项所述的试剂盒，其中所述阻断序列：

包含SEQ ID NO:1-7中任何一个的至少4个连续碱基。

89.根据权利要求84-88中任一项所述的试剂盒，其中所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的至少一部分寡核苷酸条形码包含不变序列，任选地，所述第一多于一种寡核苷酸条形码和/或第二多于一种寡核苷酸条形码中的每一个在所述不变序列处包含相同的序列。

90.根据权利要求84-89中任一项所述的试剂盒，其中所述不变序列：

长度在约1-15个核苷酸之间，任选地所述不变序列长度为1个核苷酸；和/或

位于所述细胞标记中，任选地，所述细胞标记包含所述细胞标记的第一部分、第一接头、所述细胞标记的第二部分、第二接头和所述细胞标记的第三部分，还任选地，所述不变序列位于所述细胞标记的第三部分。

91.根据权利要求84-90中任一项所述的试剂盒，

其中所述阻断物核苷酸被配置为不与所述不变序列互补；

其中所述不变序列与所述诱饵序列之间的距离与所述诱饵序列的互补物与所述阻断物核苷酸之间的距离等距；

其中所述不变序列与所述靶结合区之间的距离与所述靶结合区的互补物与所述阻断物核苷酸之间的距离等距；

其中所述TSO包含选自由SEQ ID NO:1-7组成的组的序列，或与选自由SEQ ID NO:1-7组成的组的序列表现至少约50％同一性的序列；

其中所述阻断序列的互补物在所述TSO中的所述诱饵序列的5’；

其中所述阻断序列的互补物在所述TSO中的所述靶结合区或其部分的5’；和/或

其中所述阻断序列的互补物包含所述阻断序列的反向互补序列和/或所述阻断序列的互补序列。

92.根据权利要求84-91中任一项所述的试剂盒，

其中所述缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶包括嗜中温DNA聚合酶、嗜热DNA聚合酶、嗜冷DNA聚合酶或其任何组合，任选地所述DNA聚合酶包含Klenow片段；

其中所述逆转录酶包含病毒逆转录酶、任选地鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶；和/或

其中所述模板转换寡核苷酸包含一个或更多个3’核糖核苷酸，任选地三个3’核糖核苷酸，并且还任选地所述3’核糖核苷酸包含鸟嘌呤。

93.根据权利要求84-92中任一项所述的试剂盒，所述试剂盒包含：

以下中的一种或更多种：乙二醇、聚乙二醇、1,2-丙二醇、二甲基亚砜(DMSO)、甘油、甲酰胺、7-脱氮-GTP、乙酰胺、四甲基氯化铵盐、甜菜碱或其任何组合；和/或

缓冲液、盒、一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂或其组合。

94.根据权利要求84-93中任一项所述的试剂盒，

其中所述靶结合区包含基因特异性序列、寡(dT)序列、随机多聚体或其任何组合；

95.根据权利要求84-94中任一项所述的试剂盒，

其中所述寡核苷酸条形码包含相同的样品标记和/或相同的细胞标记；任选地，其中第一多于一种寡核苷酸条形码的每一种样品标记、细胞标记和/或分子标记包含至少6个核苷酸；

其中所述第一多于一种寡核苷酸条形码中的至少一种被固定或被部分地固定在所述合成颗粒上；和/或所述第一多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在所述合成颗粒中；和/或

其中所述合成颗粒是可破坏的。

96.根据权利要求84-95中任一项所述的试剂盒，其中所述合成颗粒包括珠，并且任选地所述珠包括

可破坏的水凝胶颗粒。

97.根据权利要求84-96中任一项所述的试剂盒，

其中所述合成颗粒包含固体支持物官能团，并且

98.根据权利要求84-97中任一项所述的试剂盒，

其中所述合成颗粒包含固体支持物官能团，并且

其中所述支持物官能团和所述接头官能团彼此关联；并且任选地所述接头官能团和所述支持物官能团单独地选自由以下组成的组：C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮及其任何组合。