CN114807306A

CN114807306A - 用于标记细胞的方法和组合物

Info

Publication number: CN114807306A
Application number: CN202210411674.5A
Authority: CN
Inventors: 斯蒂法尼·克劳德·布泰特; 迈克尔·伊巴拉·卢塞罗; 塔尔耶伊·西格德·米克尔森; 凯瑟琳·法伊弗
Original assignee: 10X Genomics Inc
Current assignee: 10X Genomics Inc
Priority date: 2017-12-08
Filing date: 2018-12-07
Publication date: 2022-07-29
Also published as: WO2019113533A1; SG11201907566TA; EP3568494A1; EP3568494B1; CN110462060A; EP3919626A1; DK3568494T3; CN110462060B; US20220228220A1

Abstract

本公开提供了用于并行处理核酸样品的方法、***和组合物。本公开的方法和***包括使用样品特异性条形码序列，其有利于样品的多路复用、汇集群体内离散细胞群的检测，以及包含多于一个细胞的分配区的检测。

Description

用于标记细胞的方法和组合物

本申请是申请日为2018年12月07日、申请号为201880019306.8、发明名称为“用于标记细胞的方法和组合物”的中国专利申请(其对应PCT申请的申请日为2018年12月07日、申请号为PCT/US2018/064600)的分案申请。

交叉引用

本申请要求于2017年12月8日提交的美国临时申请62/596,557和于2018年8月28日提交的美国临时申请62/723,960以及于2018年8月21日提交的美国临时申请16/107,685的权益，所述申请均以引用方式全文并入本文。

背景技术

生物样品，如细胞样品，可被处理以用于各种目的，例如，分析细胞内的基因和/或蛋白质表达水平。这种分析可用于多种应用，如疾病(例如，癌症)的检测、疾病进展的研究，以及污染的检测。存在各种处理样品的方法，如聚合酶链式反应(PCR)和测序。

可在各种反应环境(如分配区(partition))内处理生物样品。分配区可以是孔或液滴。可采用液滴或孔以使生物样品能够被分配和独立处理的方式处理生物样品。例如，此类液滴可与其他液滴在流体上隔离，从而能够精确控制液滴中的各个环境。

将生物样品分配到独立分配区中进行独立处理，例如，使得能够以相对高通量的方式进行单细胞分析。在一些情况下，在随机分配之后将生物样品转化成良好混合的单细胞悬浮液。当前可用的样品处理技术由于不能并行处理多个样品而受到限制。

发明内容

鉴于上文，需要用于样品分析的改进的方法和组合物。本公开提供了用于样品分析，例如并行处理多个样品的方法和组合物。本公开的方法可包括分析细胞。例如，在进行进一步处理(例如，分配在分配区内、分析核酸分子或来自细胞内的其他分析物、对与细胞相关联的核酸分子进行测序等)之前，可为细胞提供条形码部分(例如，核酸条形码分子，如与亲脂性或两亲性部分偶合的核酸条形码分子)，并且条形码部分可随后用于鉴定细胞(例如，鉴定为来源于给定样品、属于某一类型、与给定分配区相关联等)。细胞的鉴定可包括，例如，进行核酸测序测定。本公开还提供了用于分析分配区(例如，液滴或孔)的细胞占据率的方法。此类方法可包括，例如，用多个条形码(例如，核酸条形码序列，如与亲脂性或两亲性部分偶合的核酸条形码序列)标记多个细胞以提供多个标记细胞。多个标记细胞中的标记细胞可用不同的条形码标记。标记细胞可分配在多个分配区(例如，液滴或孔)内并且可用另外的条形码(例如，分配区核酸条形码序列)进一步标记。标记细胞的条形码接着可用于例如将标记细胞鉴定为来源于同一分配区。本公开的方法还可用于确定细胞样品内细胞的相对尺寸，例如至少部分地基于细胞对条形码(例如，与亲脂性或两亲性部分偶合的条形码(例如，核酸条形码序列))的摄取。此类条形码的摄取可通过，例如，直接检测与细胞相关联的条形码或通过进行核酸测序测定并测量在测序测定中鉴定出的各种条形码序列的丰度来测量。

在一个方面中，本公开提供了一种用于分析分配区的细胞占据率的方法，其包括：(a)提供包含多个细胞核酸条形码序列的多个细胞核酸条形码分子，多个细胞核酸条形码分子中的每个细胞核酸条形码分子包含(i)多个细胞核酸条形码序列中的单个细胞核酸条形码序列和(ii)亲脂性部分；(b)用多个细胞核酸条形码序列标记多个细胞以产生多个标记细胞，其中多个标记细胞中的每个标记细胞包含多个细胞核酸条形码序列中的不同的细胞核酸条形码序列；(c)产生包含多个标记细胞和多个分配区核酸条形码序列的多个分配区，其中多个分配区中的每个分配区包含多个分配区核酸条形码序列中的不同的分配区核酸条形码序列，并且其中多个分配区的至少一部分包含多个标记细胞中的多于一个标记细胞；以及(d)使用(i)多个细胞核酸条形码序列中的细胞核酸条形码序列或其互补序列，以及(ii)多个分配区核酸条形码序列中的分配区核酸条形码序列或其互补序列将多个标记细胞中的至少两个标记细胞鉴定为来源于同一分配区。

在一些实施方案中，多个细胞核酸条形码序列中的给定细胞核酸条形码序列鉴定多个标记细胞的相关联细胞所来源的样品。在一些实施方案中，样品来源于生物流体。在一些实施方案中，生物流体包括血液或唾液。

在一些实施方案中，所述方法还包括，在(c)之后，由多个标记细胞合成多个条形码化核酸产物，其中多个条形码化核酸产物中的给定条形码化核酸产物包含(i)细胞鉴定序列，其包含多个细胞核酸条形码序列中的给定细胞核酸条形码序列或给定细胞核酸条形码序列的互补序列；以及(ii)分配区鉴定序列，其包含多个分配区核酸条形码序列中的给定分配区核酸条形码序列或给定分配区核酸条形码序列的互补序列。

在一些实施方案中，多个分配区核酸条形码分子包含多个分配区核酸条形码序列，多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含多个分配区核酸条形码序列中的单个分配区核酸条形码序列。在一些实施方案中，多个分配区核酸条形码分子中的给定分配区核酸条形码分子包含能够与多个细胞核酸条形码分子中的给定细胞核酸条形码分子的序列杂交的引发序列。在一些实施方案中，多个细胞核酸条形码分子中的每个细胞核酸条形码分子包含所述序列。在一些实施方案中，引发序列为靶向引发序列。在一些实施方案中，引发序列为随机N聚体序列。在一些实施方案中，多个条形码化核酸产物通过一个或多个引物延伸反应合成。在一些实施方案中，多个条形码化核酸产物通过一个或多个连接反应合成。在一些实施方案中，多个条形码化核酸产物通过一个或多个核酸扩增反应合成。

在一些实施方案中，所述方法还包括对多个条形码化核酸产物或其衍生物进行测序，以产生多个测序读长。在一些实施方案中，所述方法还包括使多个测序读长中的每个测序读长经由其相应的细胞鉴定序列与多个标记细胞中的标记细胞关联起来，并且使多个测序读长中的每个测序读长经由其相应的分配区鉴定序列与多个分配区中的分配区关联起来。

在一些实施方案中，所述方法还包括，在(c)中，将多个标记细胞与多个珠粒一起分配，其中多个珠粒中的每个珠粒包含多个分配区核酸条形码序列中的分配区核酸条形码序列。在一些实施方案中，多个分配区中的每个分配区包含多个珠粒中的单个珠粒。在一些实施方案中，多个珠粒中的每个珠粒包含多个分配区核酸条形码分子，其中多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含多个分配区核酸条形码序列中的单个分配区核酸条形码序列。在一些实施方案中，多个分配区核酸条形码序列中的每个分配区核酸条形码序列与多个珠粒中的其相应珠粒可释放地偶合。在一些实施方案中，多个分配区核酸条形码序列中的每个分配区核酸条形码序列在施加刺激后可从多个珠粒中的其相应珠粒上释放。在一些实施方案中，刺激是化学刺激。在一些实施方案中，所述方法还包括，在(c)之后，使多个分配区核酸条形码序列中的分配区核酸条形码序列从多个珠粒中的每个珠粒上释放。在一些实施方案中，所述方法还包括使多个珠粒中的每个珠粒降解，以使分配区核酸条形码序列从多个珠粒中的每个珠粒上释放。在一些实施方案中，多个分配区中的每个分配区包含能够使多个珠粒中的每个珠粒降解的试剂。在一些实施方案中，多个珠粒是多个凝胶珠粒。

在一些实施方案中，多个分配区是多个液滴。在一些实施方案中，多个分配区是多个孔。

在一些实施方案中，在(b)中，多个细胞是通过如下方式用所述多个细胞核酸条形码序列进行标记的：使各自偶合于多个细胞核酸条形码序列中的给定细胞核酸条形码序列的细胞结合部分与多个细胞中的每个细胞结合。在一些实施方案中，细胞结合部分为抗体、细胞表面受体结合分子、受体配体、小分子、前体(pro-body)、适体、单抗体、affimer、darpin或蛋白质支架。在一些实施方案中，细胞结合部分为抗体。在一些实施方案中，细胞结合部分结合多个细胞中的细胞的蛋白质。在一些实施方案中，细胞结合部分结合多个细胞中的细胞的细胞表面物质。在一些实施方案中，细胞结合部分结合多个细胞中的每个细胞所共有的物质。

在一些实施方案中，在(b)中，所述多个细胞是通过如下方式用所述多个细胞核酸条形码序列进行标记的：借助于细胞穿透肽将各自包含多个细胞核酸条形码序列中的单个细胞核酸条形码序列的核酸条形码分子递送至多个细胞中的每个细胞。

在一些实施方案中，在(b)中，所述多个细胞是借助于脂质体、纳米颗粒、电穿孔或机械力用多个细胞核酸条形码序列进行标记的。在一些实施方案中，机械力包括纳米线或显微注射的使用。

在一些实施方案中，多个细胞核酸条形码分子中的每个核酸条形码分子的亲脂性部分为胆固醇。

在一些实施方案中，亲脂性部分通过接头与多个细胞核酸条形码分子连接。

在一些实施方案中，多个细胞中的每个细胞包含多个核酸分子。在一些实施方案中，多个核酸分子包含多个脱氧核糖核酸分子。在一些实施方案中，多个核酸分子包含多个核糖核酸分子。在一些实施方案中，将标记细胞裂解或透化以使得多个核酸分子可被接近。在一些实施方案中，多个分配区核酸条形码分子包含多个分配区核酸条形码序列，多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含多个分配区核酸条形码序列中的单个分配区核酸条形码序列和能够与多个核酸分子的至少一个子集的序列杂交的引发序列。在一些实施方案中，引发序列为靶向引发序列。在一些实施方案中，引发序列为随机N聚体序列。

在一些实施方案中，在(c)之前，将多个细胞核酸条形码分子中的细胞核酸条形码分子的至少一个子集至少部分地设置在多个标记细胞内。

在另一方面中，本公开提供了一种用于分析分配区的细胞占据率的方法，其包括：(a)提供第一细胞核酸条形码分子，其包含(i)第一细胞核酸条形码序列和(ii)亲脂性部分；以及第二核酸条形码分子，其包含(i)第二细胞核酸条形码序列和(ii)亲脂性部分，其中第一细胞核酸条形码序列具有与第二细胞核酸条形码序列不同的序列；(b)用第一细胞核酸条形码序列标记第一细胞以产生第一标记细胞并且用第二细胞核酸条形码序列标记第二细胞以产生第二标记细胞；(c)产生包含第一标记细胞和第二标记细胞的分配区，其中分配区还包含分配区核酸条形码序列；(d)产生(i)第一条形码化核酸分子，其包含第一细胞核酸条形码序列或其互补序列，以及分配区核酸条形码序列或其互补序列；以及(ii)第二条形码化核酸分子，其包含第二细胞核酸条形码序列或其互补序列，以及分配区核酸条形码序列或其互补序列；以及(e)基于第一条形码化核酸分子和第二条形码化核酸分子具有相同的分配区核酸条形码序列或其互补序列，将第一标记细胞和第二标记细胞鉴定为来源于所述分配区。

在一些实施方案中，第一细胞核酸条形码序列和第二细胞核酸条形码序列鉴定第一细胞和第二细胞所来源的样品。在一些实施方案中，其中样品来源于生物流体。在一些实施方案中，生物流体包括血液或唾液。

在一些实施方案中，其中第一条形码化核酸分子和第二条形码化核酸分子各自包含引发序列。在一些实施方案中，引发序列为靶向引发序列。在一些实施方案中，引发序列为随机N聚体序列。

在一些实施方案中，第一条形码核酸分子和第二条形码核酸分子通过一个或多个引物延伸反应、连接反应或核酸扩增反应合成。

在一些实施方案中，所述方法还包括对第一条形码核酸分子和第二条形码核酸分子或其衍生物进行测序，以产生多个测序读长。在一些实施方案中，所述方法还包括使多个测序读长中的每个测序读长经由其细胞核酸条形码序列与第一标记细胞或第二标记细胞关联起来，并且使多个测序读长中的每个测序读长经由其相应的分配区核酸序列与分配区关联起来。

在一些实施方案中，所述方法还包括，在(c)中，将第一标记细胞和第二标记细胞与珠粒一起分配，所述珠粒包含多个核酸条形码分子，所述多个核酸条形码分子中的每一个包含分配区核酸条形码序列。在一些实施方案中，多个核酸条形码分子中的每个核酸条形码分子的分配区核酸条形码序列与珠粒可释放地偶合。在一些实施方案中，所述方法还包括，在(c)之后，使多个分配区核酸条形码分子的分配区核酸条形码序列从珠粒上释放。在一些实施方案中，珠粒是凝胶珠粒。

在一些实施方案中，分配区是孔。在一些实施方案中，分配区是液滴。

在一些实施方案中，第一细胞核酸条形码分子和第二细胞核酸条形码分子的亲脂性部分为胆固醇。

在一些实施方案中，第一细胞和第二细胞各自包含多个核酸分子。在一些实施方案中，将第一标记细胞和第二标记细胞裂解或透化以使得多个核酸分子可被接近。在一些实施方案中，多个分配区核酸条形码分子各自包含分配区核酸条形码序列和能够与多个核酸分子的至少一个子集的序列杂交的引发序列。在一些实施方案中，引发序列为靶向引发序列。在一些实施方案中，引发序列为随机N聚体序列。

在另一方面中，本公开提供了一种用于分析细胞的方法，其包括：(a)用细胞核酸条形码序列标记细胞，以产生标记细胞，其中细胞核酸条形码分子包含细胞核酸条形码序列和亲脂性部分；(b)产生包含标记细胞和多个分配区核酸条形码分子的分配区，其中多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含分配区核酸条形码序列；(c)将细胞透化以使得其中的多个核酸分子可被接近；(d)产生(i)条形码化核酸分子，其包含细胞核酸条形码序列或其互补序列，以及分配区核酸条形码序列或其互补序列；以及(ii)多个条形码化核酸产物，其各自包含多个核酸分子中的核酸分子的序列和分配区核酸条形码序列或其互补序列；以及(e)将多个核酸分子鉴定为来源于所述细胞。

在一些实施方案中，细胞核酸条形码序列鉴定细胞所来源的样品。在一些实施方案中，样品来源于生物流体。在一些实施方案中，生物流体包括血液或唾液。

在一些实施方案中，条形码化核酸分子包含引发序列。在一些实施方案中，多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含引发序列。在一些实施方案中，引发序列为靶向引发序列。在一些实施方案中，引发序列为随机N聚体序列。在一些实施方案中，引发序列能够与多个核酸分子的至少一个子集的序列杂交。在一些实施方案中，引发序列能够与细胞核酸条形码分子的序列杂交。

在一些实施方案中，条形码化核酸分子和多个条形码化核酸产物通过一个或多个引物延伸反应、连接反应或核酸扩增反应合成。

在一些实施方案中，所述方法还包括对条形码化核酸分子和条形码化核酸产物或其衍生物进行测序，以产生多个测序读长。在一些实施方案中，所述方法还包括使多个测序读长中的每个测序读长经由其分配区核酸条形码序列与分配区关联起来。

在一些实施方案中，所述方法还包括，在(b)中，将标记细胞与珠粒一起分配，所述珠粒包含多个分配区核酸条形码分子。在一些实施方案中，多个分配区核酸条形码分子中的每个核酸条形码分子的分配区核酸条形码序列与珠粒可释放地偶合。在一些实施方案中，所述方法还包括，在(b)之后，使多个分配区核酸条形码分子的分配区核酸条形码序列从珠粒上释放。在一些实施方案中，珠粒是凝胶珠粒。

在一些实施方案中，细胞核酸条形码分子的亲脂性部分为胆固醇。

在一些实施方案中，多个核酸分子包含多个脱氧核糖核酸分子。在一些实施方案中，多个核酸分子包含多个核糖核酸分子。

在一些实施方案中，在(b)之前，将细胞核酸条形码分子至少部分地设置在标记细胞内。

本公开的另外的方面和优势从以下具体实施方式变得为本领域技术人员显而易知，其中仅示出并描述本公开的例示性实施方案。应当认识到的是，本公开能够具有其他以及不同的实施方案，并且其若干细节能够在各种不同方面做出修改，所有均不脱离公开内容。因此，附图和说明书应被视为在本质上是说明性的而不是限制性的。

以引用的方式并入

在本说明书中提及的所有公布、专利和专利申请以引用的方式并入本文，其引用程度就如同每个单独的公布、专利或专利申请被具体和单独地指出以引用的方式并入一般。如果通过引用并入的出版物和专利或专利申请与说明书中包含的公开内容相矛盾，则说明书旨在取代和/或优先于任何这样的矛盾材料。

附图说明

在所附权利要求中具体阐述本发明的新颖特征。通过参考阐述说明性实施方案的以下详细描述和附图(在本文中还有“图(Figure和FIG.)”)获得对本发明的特征和优点的更好理解，在所述说明性实施方案中利用本发明的原理，在附图中：

图1示出用于分配单个生物颗粒的微流体通道结构的实例。

图2示出用于将携带条形码的珠粒递送至液滴的微流体通道结构的实例。

图3示出用于共分配生物颗粒和试剂的微流体通道结构的实例。

图4示出用于将珠粒受控地分配到离散液滴中的微流体通道结构的实例。

图5示出用于增加液滴产生通量的微流体通道结构的实例。

图6示出用于增加液滴产生通量的微流体通道结构的另一个实例。

图7A示出布置成二维构型的九个核酸条形码分子集合的示例性布置；图7B示出覆盖核酸条形码分子的二维布置的样品的实例。

图8示出已编程或以其他方式配置成实现本文提供的方法的计算机***。

图9示出包含胆固醇、接头和核酸附接区的示例性亲脂性部分缀合的特征条形码。

图10示意性地描绘了代表性的亲脂性条形码以及将细胞条形码与亲脂性条形码偶合的示例性核酸延伸方案。

图11A-11B示出由与～1uM的不具有亲脂性部分的特征条形码一起温育的第一细胞群(图11A)和第二细胞群(图11B)制备的条形码文库的BioAnalyzer结果，而图11C-11D示出由与～1uM的胆固醇缀合的特征条形码一起温育的第一细胞群(图11C)和第二细胞群(图11D)制备的条形码文库的BioAnalyzer结果。

图12A-12J示出来自与0.1μM胆固醇缀合的特征条形码一起温育的汇集细胞群的代表性图形，其示出x轴上的唯一分子标识符(UMI)计数的数量相对y轴上的细胞数量。图12A-B示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第一特征条形码序列(“BC1”)的log₁₀ UMI计数(图12A-重复1；图12B-重复2)。图12C-D示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第二特征条形码序列(“BC2”)的log₁₀ UMI计数(图12C-重复1；图12D-重复2)。图12E-F示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第三特征条形码序列(“BC3”)的log₁₀ UMI计数(图12E-重复1；图12F-重复2)。图12G-H示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第四特征条形码序列(“BC4”)的log₁₀ UMI计数(图12G-重复1；图12H-重复2)。图12I-12J示出从重复1的汇集细胞群获得的UMI计数的3D表示。图形描绘了线性(图12I)和log₁₀标度(图12J)的UMI计数。

图13A-13J示出来自与0.01μM胆固醇缀合的特征条形码一起温育的汇集细胞群的代表性图形，其示出x轴上的唯一分子标识符(UMI)计数的数量相对y轴上的细胞数量。图13A-B示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第一特征条形码序列(“BC1”)的log₁₀ UMI计数(图13A-重复1；图13B-重复2)。图13C-D示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第二特征条形码序列(“BC2”)的log₁₀ UMI计数(图13C-重复1；图13D-重复2)。图13E-F示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第三特征条形码序列(“BC3”)的log10 UMI计数(图13E-重复1；图13F-重复2)。图13G-H示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第四特征条形码序列(“BC4”)的log10 UMI计数(图13G-重复1；图13H-重复2)。图13I-13J示出从重复1的汇集细胞群获得的UMI计数的3D表示。图形描绘了线性(图13I)和log₁₀标度(图13J)的UMI计数。

图14A-14I示出来自与抗体缀合的特征条形码一起温育的汇集细胞群的代表性图形，其示出x轴上的唯一分子标识符(UMI)计数的数量相对y轴上的细胞数量。图14A-14B示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第一特征条形码序列(“BC18”)的UMI计数(图14A-重复1；图14B-重复2)。由这些结果，明确区分的含BC18的细胞群可被区分为1401a(重复1)和1401b(重复2)。图14C-14D示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第二特征条形码序列(“BC19”)的UMI计数(图14C-重复1；图14D-重复2)。由这些结果，明确区分的含BC19的细胞群可被区分为1402a(重复1)和1402b(重复2)。图14E-14F示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第三特征条形码序列(“BC20”)的UMI计数(图14E-重复1；图14F-重复2)。由这些结果，明确区分的含BC20的细胞群可被区分为1403a(重复1)和1403b(重复2)。图14G示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的特征条形码序列的UMI计数，其中BC18的log₁₀ UMI计数在y轴上并且BC20的log₁₀ UMI计数在x轴上。图14H示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的特征条形码序列的UMI计数，其中BC18的log₁₀ UMI计数在y轴上并且BC19的log₁₀ UMI计数在x轴上。图14I示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的特征条形码序列的UMI计数，其中BC19的log₁₀ UMI计数在y轴上并且BC20的log₁₀ UMI计数在x轴上。

图15A-15B示出使用抗体t-分布随机邻域嵌入(t-distributed stochasticneighbor embedding(t-SNE))制备的(图15A)以及基因表达(GEX)t-SNE分析中的UMI计数的簇集(图15B)

图16示出具有使用针头的固定阵列实现的条形码染色的组织切片的实例。

图17示出在空间上定位条形码和相关联细胞的扩散映射。

图18示出由条形码和其相对量限定的细胞位置(命名为“C1”至“C7”)。

图19示出空间映射的三维应用。

图20示出空间映射的三维应用。

图21A示出具有用于递送条形码分子的递送装置的小鼠脑部的区域。

图21B示出用于将条形码注射至样品的图案。

图22示出细胞直径与细胞表面积之间的相关性。

图23示出给定细胞直径(μm)的亲脂性条形码的摄取。

图24示出条形码计数相对细胞计数的示例性图形。

发明内容

虽然本文已经示出并描述本发明的各种实施方案，但是本领域技术人员显而易知此类实施方案仅作为举例来提供。许多改变、变化和取代可由本领域技术人员想到而不背离本发明。应理解，可使用本文所述的本发明的实施方案的各种替代方案。

在将值描述为范围的情况下，应理解，此类公开内容包括公开在此范围内的所有可能子范围，以及落入此范围内的特定数值，而不管特定数值或特定子范围是否明确说明。

如本文所用，术语“条形码”通常是指传达或能够传达关于分析物的信息的标记或标识符。条形码可以是分析物的一部分。条形码可以独立于分析物。除了分析物的内源特征(例如，分析物的大小或一个或多个末端序列)之外，条形码可以是附接于分析物(例如，核酸分子)的标签或标签的组合。条形码可以是唯一的。条形码可以有多种不同的格式。例如，条形码可包括：多核苷酸条形码；随机核酸和/或氨基酸序列；和合成核酸和/或氨基酸序列。条形码可以以可逆或不可逆的方式附接于分析物。在样品测序之前、期间和/或之后，可以将条形码添加到例如脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段中。条形码可以允许鉴定和/或定量各个测序读长。

如本文所用，术语“实时”可以指小于约1秒、十分之一秒、百分之一秒、毫秒或更小的响应时间。响应时间可能大于1秒。在一些情况下，实时可以指同时或基本上同时的处理、检测或鉴定。

如本文所用，术语“受试者”通常是指动物，如哺乳动物(例如人)或禽类(例如鸟)，或其他生物(如植物)。受试者可以是脊椎动物、哺乳动物、啮齿动物(例如小鼠)、灵长类动物、猿猴或人。动物可包括但不限于农场动物、运动型动物和宠物。受试者可以是健康的或无症状的个体、患有或疑似患有疾病(例如，癌症)或易患疾病的个体和/或需要治疗或疑似需要治疗的个体。受试者可以是患者。

如本文所用，术语“基因组”通常是指来自受试者的基因组信息，其可以是例如受试者遗传信息的至少一部分或全部。基因组可以在DNA或RNA中编码。基因组可包含编码区(例如，蛋白质的编码区)以及非编码区。基因组可以包括生物体中所有染色体一起的序列。例如，人类基因组普通具有共计46条染色体。所有这些染色体一起的序列可构成人类基因组。

术语“一个或多个衔接子”、“一个或多个接头”和“一个或多个标签”可以同义地使用。接头或标签可以通过任何方法包括连接、杂交或其他方法与待“标记”的多核苷酸序列偶合。

如本文所用，术语“测序”通常是指用于确定一种或多种多核苷酸中的核苷酸碱基序列的方法和技术。多核苷酸可以是例如核酸分子例如脱氧核糖核酸(DNA)或核糖核酸(RNA)，包括其变体或衍生物(例如，单链DNA)。测序可以通过目前可用的各种***执行，例如但不限于通过

Pacific Biosciences

Oxford

或Life Technologies(Ion

)的测序***。可替代地或另外地，可使用核酸扩增、聚合酶链式反应(PCR)(例如，数字PCR、定量PCR或实时PCR)或等温扩增来执行测序。此类***可以提供对应于受试者(例如人)的遗传信息的多个原始遗传数据，如从受试者提供的样品由***所产生。在一些实例中，此类***提供测序读长(在本文中也称为“读长”)。读长可以包括一串核酸碱基，其对应于已经测序的核酸分子的序列。在一些情况下，本文提供的***和方法可与蛋白质组信息一起使用。

如本文所用，术语“珠粒”通常是指颗粒。珠粒可以是固体或半固体颗粒。珠粒可以是凝胶珠粒。凝胶珠粒可包括聚合物基体(例如，通过聚合或交联形成的基体)。聚合物基体可包括一种或多种聚合物(例如，具有不同官能团或重复单元的聚合物)。交联可以通过共价、离子或诱导、相互作用或物理缠结。珠粒可以是大分子。珠粒可以由结合在一起的核酸分子形成。珠粒可以通过分子(例如大分子)的共价或非共价组装形成，如单体或聚合物。此类聚合物或单体可以是天然的或合成的。此类聚合物或单体可以是或包括例如核酸分子(例如DNA或RNA)。珠粒可以由聚合物材料形成。珠粒可以是磁性的或非磁性的。珠粒可以是刚性的。珠粒可以是柔性的和/或可压缩的。珠粒可以是可破坏的或可溶解的。珠粒可以是用包含一种或多种聚合物的涂层覆盖的固体颗粒(例如，包括但不限于氧化铁、金或银的金属基颗粒)。这种涂层可以是可破坏的或可溶解的。

如本文所用，术语“样品”通常是指受试者的生物样品。生物样品可包含任何数量的大分子，例如细胞大分子。生物样品可以是核酸样品或蛋白质样品。生物样品也可以是碳水化合物样品或脂质样品。生物样品可以来源于另一样品。样品可以是组织样品，例如活组织检查、核心活组织检查(core biopsy)、针吸出物或细针吸出物。样品可以是流体样品，例如血液样品、尿液样品或唾液样品。样品可以是皮肤样品。样品可以是面颊拭子(cheekswab)。样品可以是血浆或血清样品。样品可以是无细胞(cell-free或cell free)样品。无细胞样品可包括细胞外多核苷酸。细胞外多核苷酸可以从身体样品中分离，所述身体样品可以选自由血液、血浆、血清、尿液、唾液、粘膜分泌物、痰液、粪便和泪液组成的群组。

如本文所用，术语“生物颗粒”通常是指来源于生物样品的离散生物***。生物颗粒可以是病毒。生物颗粒可以是细胞或细胞衍生物。生物颗粒可以是细胞器。生物颗粒可以是来自细胞群的稀有细胞。生物颗粒可以是任何类型的细胞，包括但不限于原核细胞、真核细胞、细菌、真菌、植物、哺乳动物或其他动物细胞型、支原体、正常组织细胞、肿瘤细胞或任何其他细胞型，无论是来源于单细胞还是多细胞生物。生物颗粒可以是或可以包括基体(例如，凝胶或聚合物基体)，其包含细胞或来自细胞的一种或多种组分(例如，细胞珠)，例如来自细胞的DNA、RNA、细胞器、蛋白质或其任何组合。生物颗粒可以从受试者的组织获得。生物颗粒可以是硬化细胞。这种硬化细胞可以包括或不包括细胞壁或细胞膜。生物颗粒可包括细胞的一种或多种组分，但可不包括细胞的其他组分。此类组分的一个实例是细胞核或细胞器。细胞可以是活细胞。活细胞可以能够被培养，例如，当被包封在凝胶或聚合物基体中时被培养，或者当包含凝胶或聚合物基体时被培养。

如本文所用，术语“大分子组分”通常是指包含在生物颗粒内或来自生物颗粒的大分子。大分子组分可包含核酸。大分子组分可包含DNA。大分子组分可包含RNA。RNA可以是编码的或非编码的。例如，RNA可以例如是信使RNA(mRNA)、核糖体RNA(rRNA)或转移RNA(tRNA)。RNA可以是转录物。RNA可包括长度小于200个核酸碱基的小RNA，或长度大于200个核酸碱基的大RNA。小RNA主要包括5.8S核糖体RNA(rRNA)、5S rRNA、转移RNA(tRNA)、微RNA(miRNA)、小干扰RNA(siRNA)、核仁小RNA(snoRNA)、Piwi相互作用RNA(piRNA)、tRNA衍生的小RNA(tsRNA)和小rDNA衍生的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环状RNA。大分子组分可包含蛋白质。大分子组分可包含肽。大分子组分可包含多肽。

如本文所用，术语“分子标签”通常是指能够结合大分子组分的分子。分子标签可以以高亲和力结合大分子组分。分子标签可以以高特异性结合大分子组分。分子标签可包含核苷酸序列。分子标签可包含核酸序列。核酸序列可以是分子标签的至少一部分或全部。分子标签可以是核酸分子或可以是核酸分子的一部分。分子标签可以是寡核苷酸或多肽。分子标签可包含DNA适体。分子标签可以是或包含引物。分子标签可以是或包含蛋白质。分子标签可包含多肽。分子标签可以是条形码。

如本文所用，术语“分配区”通常是指可适合于包含一种或多种物质或进行一个或多个反应的空间或体积。分配区可以将空间或体积与另一个空间或体积隔离。分配区可以是例如液滴或孔。液滴可以是与第一相不混溶的第二相(例如油)中的第一相(例如水相)。液滴可以是不与第一相相分离的第二相中的第一相，例如像水相中的胶囊或脂质体。

如本文所用，术语“表位结合片段”通常是指完整抗体的能够结合与完整抗体相同表位(但程度不必相同)的部分。尽管多种类型的表位结合片段是可能的，但是表位结合片段通常包含保持在一起(例如，通过二硫键)的至少一对重链和轻链可变区(分别为VH和VL)，以保护抗原结合位点，并且不含有Fc区的全部或部分。抗体的表位结合片段可通过任何合适的技术(例如，重组DNA技术或完整抗体的酶促或化学切割)由给定抗体获得，并且通常可以与筛选完整抗体相同的方式针对特异性进行筛选。在一些实施方案中，表位结合片段包括F(ab’)₂片段、Fab’片段、Fab片段、Fd片段或Fv片段。在一些实施方案中，术语“抗体”包括抗体来源的多肽，如单链可变片段(scFv)、双体抗体或其他多聚体scFv、重链抗体、单结构域抗体，或包含足以赋予多肽特异性抗原结合能力的抗体部分(例如，一个或多个互补决定区(CDR))的其他多肽。

本文提供了用于处理细胞和/或多核苷酸样品的方法、***和组合物。在各种方面中，本文的方法、***和组合物使得能够并行处理多个样品。样品的并行处理可实现高通量分析。例如，使用本文提供的方法和组合物，可以并行处理多个细胞样品或由其衍生的多核苷酸，以用于基因表达分析。

细胞样品的并行分析

本文提供了用于并行分析多个样品的方法、***和组合物。样品可以包括细胞、细胞珠，或在一些情况下，细胞衍生物(例如，细胞的组分，如细胞核，或包含细胞或其组分的基体，如细胞珠)。细胞珠可以是例如通过含有生物颗粒的液滴和能够被聚合或胶凝的前体的聚合而包裹在凝胶或聚合物基体内的生物颗粒和/或其大分子组分中的一种或多种。在一个方面中，本公开提供了一种分析多个不同细胞样品的核酸(例如，脱氧核糖核酸(DNA)或核糖核酸(RNA))的方法。所述方法可包括使用多个核酸条形码分子标记一个或多个不同细胞样品的细胞和/或细胞珠，以产生多个标记细胞样品，其中多个核酸条形码分子中的单个核酸条形码分子包含样品条形码序列(例如，部分缀合的条形码分子，在本文中也称为特征条形码)，并且其中给定标记细胞样品的核酸条形码分子通过样品条形码序列而可区分于另一标记细胞样品的核酸条形码分子。多个标记细胞样品的核酸分子然后可进行一个或多个反应，以产生多个核酸条形码产物，其中多个核酸条形码产物中的单个核酸条形码产物包含(i)样品条形码序列(例如，核酸条形码序列)以及(ii)与多个标记细胞样品的核酸分子相对应的序列。与多个标记细胞样品的核酸分子相对应的序列可以是，例如，分配区核酸条形码分子。多个核酸条形码产物可进行测序反应，以产生多个测序读长，可基于样品条形码序列将所述测序读长与单个标记细胞样品关联起来，从而对多个不同细胞样品的核酸进行分析。在一些实施方案中，用两个或更多个核酸条形码分子标记细胞样品的单个细胞。在一些情况下，两个或更多个核酸条形码分子中的每一个具有唯一条形码序列(例如，唯一核酸条形码序列)。在一些情况下，两个或更多个核酸条形码分子的条形码序列在不同细胞样品之间不是唯一的，但是两个或更多个核酸条形码分子的条形码序列的组合是唯一组合。

核酸条形码分子可用于标记细胞样品的单个细胞和/或细胞珠。标记可以在下游工艺中使用，例如在测序分析中，作为用于将细胞和/或细胞珠与特定细胞样品关联起来的机制。例如，多个细胞样品(例如，来自多个不同受试者(例如，人或动物受试者)的多个细胞样品，或来自给定受试者的多个不同的生物流体或组织的多个细胞样品，或来自相同受试者的在不同时间获取的多个细胞样品)可以用核酸条形码分子唯一标记，使得特定样品的细胞可以被鉴定为来源于特定样品，即使在特定细胞样品与其他细胞样品混合并且并行进行核酸处理和/或测序的情况下。因此，本发明的方法提供了将复杂样品解卷积并实现大规模的并行、高通量测序的手段。

给定样品的细胞和/或细胞珠可用相同或不同标记进行标记。例如，可用第一标记来标记细胞样品的第一细胞并且可用第二标记来标记细胞样品的第二细胞。在一些情况下，第一标记和第二标记可以是相同的。在其他情况下，第一标记和第二标记可以是不同的。标记可在不同方面有所不同。例如，用于标记同一样品的细胞的第一标记和第二标记可包含相同的核酸条形码序列，但在另一方面(如唯一分子标识符序列)有差异。可替代地或另外地，第一标记和第二标记均可包含第一核酸条形码序列和第二核酸条形码序列，其中第一核酸条形码序列是相同的并且第二核酸条形码序列是不同的。类似地，施加于不同细胞样品的标记可具有一个或多个共有特征。例如，用于来自给定受试者的第一样品的细胞的标记可包含第一共有条形码序列(例如，相同核酸条形码序列)和第二共有条形码序列，同时用于来自同一受试者的第二样品的细胞的标记可包括第三共有条形码序列和第四共有条形码序列，所述第一共有条形码序列和第三共有条形码序列是相同的并且所述第二共有条形码序列和第四共有条形码序列是不同的。

本文提供的方法可包括细胞珠的标记和/或分析。细胞珠可包括生物颗粒和/或被包裹在凝胶或聚合物基体中的其大分子组分。例如，细胞珠可包括包埋细胞。可在细胞珠或其组分的标记之前产生细胞珠。可替代地，可在细胞的标记和分配之后产生细胞珠。例如，标记细胞可与可聚合材料共分配，并且包含标记细胞的细胞珠可在分配区内产生。刺激可用于促进分配区内的可聚合材料的聚合。

使用用于不同细胞样品的核酸条形码分子标记细胞样品的单个细胞和/或细胞珠可以产生多个标记细胞样品。用于标记细胞和/或细胞珠的单个核酸条形码分子(例如，部分缀合的条形码分子)可包含样品条形码序列(也称为特征条形码)。多个细胞样品中的单个细胞样品可以各自用具有对于细胞样品唯一的条形码序列的核酸条形码分子进行标记。在本文的实施方案中，给定标记细胞样品的核酸条形码分子通过样品条形码序列而可区分于另一标记细胞样品的核酸条形码分子。在一些情况下，标记细胞样品可以组合并批量进行下游样品处理。样品条形码序列随后可以用于确定特定细胞所来源的细胞样品。

单个核酸条形码分子可形成条形码化寡核苷酸的一部分。条形码化寡核苷酸(例如，部分缀合的条形码分子)除了核酸条形码分子或样品条形码序列之外还可以包含序列元件(例如，功能序列)。另外的序列元件可用于多种下游应用，包括但不限于样品制备，以用于测序分析，例如下一代序列分析。可以存在于本文的实施方案中的条形码化寡核苷酸上的另外的序列元件的非限制性实例包括扩增引物退火序列或其互补序列；测序引物退火序列或其互补序列；多个不同的条形码化寡核苷酸之间共享的共有序列；限制性酶识别位点；探针结合位点或测序衔接子(例如，用于附接于测序平台，如用于平行测序的流动池)；分子标识符序列，例如，唯一分子标识符(UMI)；亲脂性分子；以及抗体或其表位片段。例如，条形码化寡核苷酸可包含扩增引物结合序列。在另一个实例中，条形码化寡核苷酸可包含测序引物结合序列。在另一个实例中，条形码化寡核苷酸可包含亲脂性分子。在另一个实例中，条形码化寡核苷酸可包含抗体或其表位片段。序列元件可包括标记，如光学标记。这样的标记例如可实现序列元件所缔合的部分的检测。例如，如亲脂性分子的序列元件可包含荧光部分。荧光部分可允许亲脂性分子和其所缔合的部分的光学检测。

核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可连接于部分(“条形码化部分”)，如抗体或其表位结合片段、细胞表面受体结合分子、受体配体、小分子、前体、适体、单抗体、affimer、darpin或蛋白质支架。可与核酸条形码分子或条形码化寡核苷酸连接的部分可结合在多个细胞样品中的单个细胞的表面上表达的分子。标记细胞样品可指其中细胞和/或细胞珠与条形码化部分结合的样品。

可与部分(例如，条形码化部分)结合的细胞和/或细胞珠的分子可以是给定样品的所有细胞和/或多个不同细胞样品的所有细胞和/或细胞珠所共有的。这样的分子可以是蛋白质。例如，可与部分结合的蛋白质可以是膜受体、主要组织相容性复合体蛋白、细胞表面蛋白、糖蛋白、糖脂、蛋白通道或蛋白泵。细胞表面蛋白的非限制性实例可以是细胞粘附分子。可与部分(例如，条形码化部分)结合的分子可针对给定样品的所有细胞和/或细胞珠和/或多个不同细胞样品的所有细胞以类似水平表达。分子针对样品的所有细胞和/或细胞珠和/或多个不同细胞样品的所有细胞的表达可在生物可变性之内。可替代地，分子可针对细胞样品或多个不同细胞样品的某些细胞和/或细胞珠差异表达。例如，分子针对样品或多个不同细胞样品的所有细胞和/或细胞珠的表达可不在生物可变性之内，和/或细胞样品或多个不同细胞样品的一些细胞和/或细胞珠可以是异常细胞。条形码化部分可结合存在于细胞样品和/或多个不同细胞样品的大多数细胞和/或细胞珠上的分子。分子可存在于细胞样品和/或多个不同细胞样品中的至少50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的细胞和/或细胞珠上。

核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可与抗体或其表位结合片段连接，并且标记细胞和/或细胞珠可包括使抗体连接的条形码分子或表位结合片段连接的条形码分子经受适于将抗体与存在于细胞表面的分子结合的条件。抗体或其表位结合片段与存在于细胞表面的分子之间的结合亲和力可在期望范围内，以确保抗体或其表位结合片段保持与分子结合。例如，结合亲和力可在期望范围内，以确保抗体或其表位结合片段在各种样品处理步骤(如分配和/或核酸扩增或延伸)期间保持与分子结合。抗体或其表位结合片段与其所结合的分子之间的解离常数(Kd)可小于约100μM、90μM、80μM、70μM、60μM、50μM、40μM、30μM、20μM、10μM、9μM、8μM、7μM、6μM、5μM、4μM、3μM、2μM、1μM、900nM、800nM、700nM、600nM、500nM、400nM、300nM、200nM、100nM、90nM、80nM、70nM、60nM、50nM、40nM、30nM、20nM、10nM、9nM、8nM、7nM、6nM、5nM、4nM、3nM、2nM、1nM、900pM、800pM、700pM、600pM、500pM、400pM、300pM、200pM、100pM、90pM、80pM、70pM、60pM、50pM、40pM、30pM、20pM、10pM、9pM、8pM、7pM、6pM、5pM、4pM、3pM、2pM、或1pM。例如，解离常数可小于约10μM。

核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可偶合于细胞穿透肽(CPP)，并且标记细胞可包括通过细胞穿透肽将CPP偶合的核酸条形码分子递送到细胞和/或细胞珠中。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可缀合于细胞穿透肽(CPP)，并且标记细胞和/或细胞珠可包括通过细胞穿透肽将CPP缀合的核酸条形码分子递送到细胞和/或细胞珠中。可以在本文提供的方法中使用的细胞穿透肽可以包含至少一个非功能性半胱氨酸残基，所述半胱氨酸残基可以是游离的或被衍生化以与寡核苷酸形成二硫化物连接，所述寡核苷酸已针对这样的连接进行了修饰。可以在本文的实施方案中使用的细胞穿透肽的非限制性实例包括穿透素(penetratin)、转运肽(transportan)、plsl、TAT(48-60)、pVEC、MTS和MAP。可用于本文提供的方法的细胞穿透肽可以具有诱导细胞群的至少约30％、40％、50％、60％、70％、80％、90％、95％、96％、97％、98％、99％或100％的细胞的细胞穿透的能力。细胞穿透肽可为富精氨酸肽转运蛋白。细胞穿透肽可为穿透素或Tat肽。

核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可偶合于亲脂性分子，并且标记细胞和/或细胞珠可包括通过亲脂性分子将核酸条形码分子递送至细胞膜或核膜。亲脂性分子可以与脂质膜如细胞膜和核膜缔合和/或***其中。在一些情况下，***可以是可逆的。在一些情况下，亲脂性分子与细胞和/或细胞珠之间的缔合可以使得细胞和/或细胞珠在后续处理(例如，分配、细胞透化、扩增、汇集等)期间保持亲脂性分子(例如，以及其缔合组分，如核酸条形码分子)。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可进入细胞内空间和/或细胞核中。可以在本文提供的方法中使用的亲脂性分子的非限制性实例包括固醇脂质，如胆固醇、生育酚及其衍生物、二十四酸和棕榈酸。可在本文提供的方法中使用的其他亲脂性分子包括两亲性分子，其中头部基团(例如，电荷、脂族含量和/或芳族含量)和/或脂肪酸链长度(例如，C12、C14、C16或C18)可以变化。例如，脂肪酸侧链(例如，C12、C14、C16或C18)可以偶合于甘油或甘油衍生物(例如，3-叔丁基二苯基甲硅烷基甘油)，其也可包含，例如，阳离子头部基团。本文公开的核酸特征条形码分子接着可偶合于(直接或间接)这些两亲性分子。两亲性分子可与膜(例如，细胞/细胞珠或核膜)缔合和/或***其中。在一些情况下，两亲性或亲脂性部分可跨细胞膜并且向细胞和/或细胞珠的内部区域提供核酸条形码分子。

核酸条形码分子可附接于亲脂性部分(例如，胆固醇分子)。核酸条形码分子可通过接头，如四乙二醇(TEG)接头附接于亲脂性部分。其他示例性接头包括但不限于氨基接头C6、氨基接头C12、间隔子C3、间隔子C6、间隔子C12、间隔子9、间隔子18。核酸条形码分子可在核酸条形码分子的5’末端上附接于亲脂性部分或接头。可替代地，核酸条形码分子可在核酸条形码分子的3’末端上附接于亲脂性部分或接头。在一些情况下，第一核酸条形码分子在核酸条形码分子的5’末端处附接于亲脂性部分或接头，并且第二核酸条形码分子在核酸条形码分子的3’处附接于亲脂性部分或接头。接头可以是二醇或其衍生物。例如，接头可以是四乙二醇(TEG)或聚乙二醇(PEG)。核酸条形码分子可以可释放地附接于接头或亲脂性部分(例如，如本文其他地方针对核酸分子的可释放附接所描述的)，使得核酸条形码分子或其部分可以从亲脂性分子上释放。

在一些情况下，亲脂性分子可包含标记，如光学标记。这样的标记例如可实现亲脂性分子所缔合的部分的检测。例如，亲脂性分子可包含荧光部分。荧光部分可允许亲脂性分子和其所缔合的部分的光学检测。

适用于分析条形码化亲脂性分子的试剂和方案的实例在图10的小图I和II中示出。尽管在图10中示出亲脂性部分，但是本文所述的任何部分(例如，抗体)可以缀合于条形码寡核苷酸，如下文所述。如图10(小图I)所示，亲脂性部分(例如，胆固醇)1001直接(例如，共价结合、通过蛋白质-蛋白质相互作用结合等)偶合于寡核苷酸1002，所述寡核苷酸包含用于鉴定细胞或细胞群的特征条形码序列1003。在一些实施方案中，寡核苷酸1002还包含适用于下游反应的另外的序列(例如，包含第二核酸分子1006上的序列的反向互补序列的序列1004，以及任选地，包含被配置成用作PCR引物结合位点的序列的序列1005)。图10(小图I)还示出另外的寡核苷酸1006(例如，在一些情况下，其可附接于如本文其他地方所述的珠粒)，其包含细胞条形码序列1008(在本文中也称为珠粒条形码序列或核酸条形码序列)，以及与寡核苷酸1002上的序列1004互补的序列1010。在一些情况下，寡核苷酸1006还包含适用于下游反应的另外的功能序列，如UMI序列1009和衔接子序列1007(例如，包含测序引物结合位点的序列1007，例如读长1(“R1”)或读长2(“R2”)序列，以及在一些情况下，P5或P7流动池附接序列)。序列1010代表与互补序列1004互补的序列。在一些情况下，序列1004包含poly-A序列并且序列1010包含poly-T序列。在一些情况下，序列1010包含poly-A序列并且序列1004包含poly-T序列。在一些情况下，序列1004包含含GGG序列并且序列1010包含互补的含CCC序列。在一些情况下，序列1010包含含GGG序列并且序列1004包含互补的含CCC序列。在一些情况下，含CCC或含GGG序列包含一个或多个核糖核苷酸。在分析期间，序列1010与序列1004杂交并且寡核苷酸1002和/或1006通过聚合化酶(例如，逆转录酶、聚合酶)的作用延伸，其中寡核苷酸1006接着在其3’末端包含寡核苷酸1002的互补序列。这些构建体接着可以任选地如本文其他地方所述进行处理并且进行核酸测序，例如以鉴定与特定特征条形码1003和特定细胞条形码1008相关联的细胞。虽然图10的小图I中包括的序列以给定顺序呈现，但是所述序列可以不同的顺序被包括，和/或具有设置在一个或多个序列之间的另外的序列或核苷酸。例如，UMI 1009和条形码序列1008可调换。

在图10(小图II)所示的另一个实例中，亲脂性部分(例如，胆固醇)1021间接(例如，通过杂交或配体-配体相互作用，如生物素-链霉抗生素蛋白)偶合于寡核苷酸1022，所述寡核苷酸包含用于鉴定细胞或细胞群的特征条形码序列1023。亲脂性分子1021直接(例如，共价结合、通过蛋白质-蛋白质相互作用结合)偶合于杂交寡核苷酸1032，所述杂交寡核苷酸与寡核苷酸1022的序列1031杂交，从而间接地将寡核苷酸1022偶合于亲脂性部分。在一些实施方案中，寡核苷酸1022包含适用于下游反应的另外的序列(例如，包含第二核酸分子1026上的序列的反向互补序列的序列1024，以及任选地，包含被配置成用作PCR引物结合位点的序列的序列1025)。图10(小图II)还示出另外的寡核苷酸1026(例如，在一些情况下，其可附接于如本文其他地方所述的珠粒)，其包含细胞条形码序列1028(例如，核酸条形码序列)，以及与寡核苷酸1022上的序列1024互补的序列1030。在一些情况下，寡核苷酸1026还包含适用于下游反应的另外的功能序列，如UMI序列1029和衔接子序列1027(例如，包含测序引物结合位点的序列1027，例如读长1(“R1”)或读长2(“R2”)序列，以及在一些情况下，P5或P7流动池附接序列)。序列1010代表与互补序列1004互补的序列。在一些情况下，序列1024包含poly-A序列并且序列1030包含poly-T序列。在一些情况下，序列1030包含poly-A序列并且序列1024包含poly-T序列。在一些情况下，序列1024包含含GGG序列并且序列1030包含互补的含CCC序列。在一些情况下，序列1030包含含GGG序列并且序列1024包含互补的含CCC序列。在一些情况下，含CCC或含GGG序列包含一个或多个核糖核苷酸。在分析期间，序列1030与序列1024杂交并且寡核苷酸1022和/或1026通过聚合化酶(例如，逆转录酶、聚合酶)的作用延伸，其中寡核苷酸1026接着在其3’末端包含寡核苷酸1022的互补序列。这些构建体接着可以任选地如本文其他地方所述进行处理并且进行核酸测序，例如以鉴定与特定特征条形码1023和特定细胞条形码1028相关联的细胞。虽然图10的小图II中包括的序列以给定顺序呈现，但是所述序列可以不同顺序被包括，和/或具有设置在一个或多个序列之间的另外的序列或核苷酸。例如，UMI 1029和条形码序列1028可调换。

在一个实例中，本文提供的方法可用于使用连接于细胞表面的特征条形码标记细胞。多个细胞的细胞表面特征(例如，亲脂性部分，如胆固醇)可连接(例如，缀合)于特征条形码。特征条形码可包括，例如，被配置成与核酸条形码分子杂交的序列，如包含多个半胱氨酸核苷酸的序列(例如，CCC序列)。每个特征条形码可包含条形码序列和/或唯一分子标识符序列。可提供各自包含多个核酸条形码分子的多个珠粒(例如，凝胶珠粒)。每个珠粒的核酸条形码分子(例如，可释放地附接于每个珠粒)可包含条形码序列(例如，细胞条形码序列)、唯一分子标识符序列，以及被配置成与连接于细胞表面的特征条形码杂交的序列。各不同珠粒的核酸条形码分子包含相同的条形码序列，所述条形码序列不同于多个珠粒的其他珠粒的核酸条形码分子的条形码序列。可将特征条形码连接的细胞与多个珠粒一起分配到多个分配区(例如，液滴，如乳液中的含水液滴)中，使得多个分配区的至少一个子集各自包含单个细胞和单个珠粒。每个分配区的珠粒的一个或多个核酸条形码分子可附接(例如，杂交或连接)于同一分配区的细胞的一个或多个特征条形码。在将一个或多个核酸条形码分子附接于细胞的一个或多个特征条形码之前，可在分配区内将珠粒的一个或多个核酸条形码分子从珠粒上释放(例如，通过施加刺激，如化学刺激)。可将细胞在分配区内裂解或透化，以使得其中的分析物，如其中的核酸分子(例如，脱氧核糖核酸(DNA)分子和/或核糖核酸(RNA)分子)可被接近。也可利用珠粒的一个或多个核酸条形码分子在分配区内将细胞的一个或多个分析物(例如，核酸分子)条形码化，以提供多个条形码化分析物(例如，条形码化核酸分子)。包含条形码化分析物和条形码化细胞表面特征的多个分配区可合并(例如，汇集)。可进行另外的处理，例如，以制备条形码化分析物和条形码化细胞表面特征用于后续分析。例如，条形码化核酸分子可用流动池衔接子衍生化以有利于核酸测序。可检测(例如，使用核酸测序)条形码化分析物的条形码并用于将条形码化分析物鉴定为来源于多个细胞的特定细胞或细胞类型。

在另一个实例中，本文提供的方法可用于使用亲脂性特征条形码标记细胞。包含亲脂性部分(例如，胆固醇部分)的特征条形码可与多个细胞一起温育。特征条形码可包含光学标记，如荧光部分。特征条形码可包括，例如，被配置成与核酸条形码分子杂交的序列，如包含多个半胱氨酸核苷酸的序列(例如，CCC序列)。每个特征条形码还可包含条形码序列和/或唯一分子标识符序列。可提供各自包含多个核酸条形码分子的多个珠粒(例如，凝胶珠粒)。每个珠粒的核酸条形码分子(例如，可释放地附接于每个珠粒)可包含条形码序列(例如，细胞条形码序列)、唯一分子标识符序列，以及被配置成与特征条形码杂交的序列。各不同珠粒的核酸条形码分子包含相同的条形码序列，所述条形码序列不同于多个珠粒的其他珠粒的核酸条形码分子的条形码序列。与特征条形码一起温育的细胞可与多个珠粒一起分配(例如，在一个或多个洗涤过程之后)到多个分配区(例如，液滴，如乳液中的含水液滴)中，使得多个分配区的至少一个子集各自包含单个细胞和单个珠粒。在多个分配区的至少一个子集的每个分配区内，珠粒的一个或多个核酸条形码分子可附接(例如，杂交或连接)于细胞的一个或多个特征条形码。在将一个或多个核酸条形码分子附接于细胞的一个或多个特征条形码以提供条形码化特征条形码之前，可在分配区内将珠粒的一个或多个核酸条形码分子从珠粒上释放(例如，通过施加刺激，如化学刺激)。可将细胞在分配区内裂解或透化，以使得其中的分析物，如其中的核酸分子(例如，脱氧核糖核酸(DNA)分子和/或核糖核酸(RNA)分子)，和/或其中的特征条形码(例如，如果特征条形码已经渗透细胞膜的话)可被接近。也可利用珠粒的一个或多个核酸条形码分子在分配区内将细胞的一个或多个分析物(例如，核酸分子)条形码化，以提供多个条形码化分析物(例如，条形码化核酸分子)。包含条形码化分析物和条形码化特征条形码的多个分配区可合并(例如，汇集)。可进行另外的处理，例如，以制备条形码化分析物和条形码化特征条形码用于后续分析。例如，条形码化核酸分子和/或条形码化特征条形码可用流动池衔接子衍生化以有利于核酸测序。可检测(例如，使用核酸测序)条形码化分析物和条形码化特征条形码的条形码并用于将条形码化分析物和条形码化特征条形码鉴定为来源于多个细胞的特定细胞或细胞类型。

可使细胞和/或细胞珠与一种或多种另外的试剂连同部分缀合的特征条形码(例如，本文所述的亲脂性分子)接触。例如，可使细胞和/或细胞珠与亲脂性部分缀合的条形码分子和一种或多种另外的部分(例如，亲脂性部分)缀合的“锚钉”分子接触。在一些情况下，使细胞和/或细胞珠与以下各项接触：(1)亲脂性部分，其缀合于包含捕获序列(例如，poly-A序列)、特征条形码序列和引物序列的第一核酸分子；以及(2)锚钉分子，其包含缀合于包含与引物序列互补的序列的第二核酸分子的亲脂性部分。在其他情况下，使细胞和/或细胞珠与以下各项接触：(1)亲脂性部分，其缀合于包含捕获序列(例如，poly-A序列)、特征条形码序列和引物序列的第一核酸分子；(2)锚钉分子，其包含缀合于包含锚钉序列和与引物序列互补的序列的第二核酸分子的亲脂性部分；以及(3)共锚钉分子(co-anchor molecule)，其包含缀合于包含与锚钉序列互补的序列的第三核酸分子的亲脂性部分。部分缀合的寡核苷酸可以包含任何数量的修饰，如防止由聚合酶造成的延伸的修饰以及本文其他地方描述的其他此类修饰。

除特征条形码序列外，部分附接的条形码寡核苷酸的结构可包括多个序列元件。寡核苷酸可包括用于后续处理的功能序列，其可包括测序仪特异性流动池附接序列，例如用于Illumina测序***的P5或P7序列，以及测序引物序列，例如用于Illumina测序***的R1或R2测序引物序列中的一种或多种。特异性引发和/或捕获序列，如poly-A序列，也可包括在寡核苷酸结构中。

如上所述，可以对部分附接的条形码寡核苷酸进行处理以附接细胞条形码序列。细胞条形码寡核苷酸(其可附接于珠粒)可包含被设计成杂交并捕获含poly-A的部分附接的条形码寡核苷酸的poly-T序列。poly-T细胞条形码分子可包含锚定序列区段，以确保poly-T序列与部分附接的条形码寡核苷酸的poly-A序列杂交。此锚定序列可以包括核苷酸的随机短序列，例如，1聚体、2聚体、3聚体或更长序列。另外的序列区段可包括在细胞条形码寡核苷酸分子内。此另外的序列可提供唯一分子标识符(UMI)序列区段，例如，作为随机序列(例如，如随机N聚体序列)，其在单个寡核苷酸(例如，偶合于单个珠粒的细胞条形码分子)之间有所不同，而细胞条形码序列在寡核苷酸(例如，偶合于单个珠粒的细胞条形码分子)之间是恒定的。此唯一序列可用于提供所捕获的起始核酸分子的唯一标识符，以便允许定量所存在的原始分子的数量(例如，部分缀合的核酸条形码分子的数量)。

核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可偶合于多个珠粒，如多个凝胶珠粒。多个珠粒中的单个珠粒可以包括数十至成千上万或百万个单个寡核苷酸分子(例如，至少约10,000、50,000、100,000、500,000、1,000,000或10,000,000个寡核苷酸分子)，其中对于偶合于给定珠粒的所有寡核苷酸分子而言，寡核苷酸分子的条形码区段可以是恒定或相对恒定的。偶合于给定珠粒的寡核苷酸分子还可包含在偶合于给定珠粒的寡核苷酸分子之间可变化的可变或唯一序列区段。可变或唯一序列区段可以是唯一分子标识符(UMI)序列区段，其在寡核苷酸的序列内可包括5至约8个或更多个核苷酸。在一些情况下，唯一分子标识符(UMI)序列区段的长度可以是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸或更长。在一些情况下，唯一分子标识符(UMI)序列区段的长度可以是至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸或更长。在一些情况下，唯一分子标识符(UMI)序列区段的长度可以是至多2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些情况下，样品寡核苷酸(例如，分配区核酸条形码分子)可包含靶标特异性引物(例如，对部分缀合的寡核苷酸中的序列具有特异性的引物序列)。例如，特异性序列可以是不存在于捕获序列中的序列(例如，不是poly-A或含CCC的捕获序列)。

标记细胞和/或细胞珠可包括使用物理力或化学化合物将核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸递送到细胞和/或细胞珠中。标记细胞样品可指其中一个或多个细胞和/或细胞珠具有引入细胞和/或细胞珠(例如，偶合于细胞和/或细胞珠的表面)和/或细胞和/或细胞珠内的核酸条形码分子的样品。

使用物理力(例如，将核酸条形码分子或条形码化寡核苷酸递送至细胞和/或细胞珠)可以指使用物理力消除细胞膜屏障，从而有利于寡核苷酸的细胞内递送。可以在本文的实施方案中使用的物理方法的实例包括使用针头、弹道DNA、电穿孔、声孔效应、光致穿孔、磁转染以及流体动力(hydroporation)。

标记细胞和/或细胞珠可包括使用针头，例如进行注射(例如，显微注射)。可替代地或另外地，标记细胞和/或细胞珠可包括粒子轰击。利用粒子轰击，可将核酸条形码分子包被在重金属颗粒上并高速递送至细胞和/或细胞珠。标记细胞和/或细胞珠可包括电穿孔。利用电穿孔，核酸条形码分子可以通过由所施加的电力在细胞膜中形成的一个或多个孔进入细胞和/或细胞珠。膜的孔基于所施加的场强和脉冲持续时间可以是可逆的。标记细胞和/或细胞珠可包括声孔效应。可以使用声波将细胞膜暂时透化，从而允许核酸条形码分子的细胞摄取。标记细胞和/或细胞珠可包括光致穿孔。可以使用激光脉冲在细胞膜中产生瞬时孔，从而允许核酸条形码分子的细胞摄取。标记单个细胞和/或细胞珠可包括磁转染。核酸条形码分子可以偶合于磁性颗粒(例如，磁性纳米颗粒、纳米线等)并通过所施加的磁场定位至靶细胞和/或细胞珠。标记细胞和/或细胞珠可包括流体动力。可以通过水动压力将核酸条形码分子递送至细胞和/或细胞珠。

可以在本文的实施方案中使用各种化学化合物，以将核酸条形码分子递送到细胞和/或细胞珠中。化学载体可以包括无机颗粒、基于脂质的载体、基于聚合物的载体以及基于肽的载体。可以在本文的实施方案中用于将核酸条形码分子递送到细胞和/或细胞珠中的无机颗粒的非限制性实例包括由金属(例如，铁、金和银)、无机盐和陶瓷(例如，钙、镁或硅的磷酸盐或碳酸盐)制备的无机纳米颗粒。纳米颗粒的表面可被包被以有利于核酸分子结合或被化学改性以有利于核酸分子附接。可使用磁性纳米颗粒(例如，超磁性氧化铁)、富勒烯(例如，可溶性碳分子)、碳纳米管(例如，圆柱形富勒烯)、量子点和超分子***。

标记细胞和/或细胞珠可包括使用阳离子脂质，如脂质体。各种类型的脂质可以在脂质体递送中使用。在一些情况下，通过脂质纳米乳液将核酸条形码分子递送至细胞。脂质乳液是指通过乳化剂稳定化的一种不可混溶液体在另一液体中的分散体。标记细胞和/或细胞珠可包括使用固体脂质纳米颗粒。

标记细胞和/或细胞珠可包括使用基于肽的化学载体。阳离子肽可富集碱性残基，如赖氨酸和/或精氨酸。标记细胞和/或细胞珠可包括使用基于聚合物的化学载体。当与核酸分子混合时，阳离子聚合物可以形成被称为polypexes的纳米化复合物。基于聚合物的载体可包括天然蛋白质、肽和/或多糖。基于聚合物的载体可包括合成聚合物。标记细胞可包括使用包含聚乙烯亚胺(PEI)的基于聚合物的载体。PEI可以将DNA缩合成带正电的颗粒，所述颗粒与阴离子细胞表面残基结合并且通过内吞作用被携带到细胞中。标记细胞和/或细胞珠可包括使用基于聚合物的化学载体，所述化学载体包含聚-L-赖氨酸(PLL)、聚(DL-乳酸)(PLA)、聚(DL-乳酸-共-乙醇酸)(PLGA)、聚鸟氨酸、聚精氨酸、组蛋白或鱼精蛋白。基于聚合物的载体可包括聚合物例如PEG和PLL的混合物。其他聚合物包括树枝状聚合物、壳聚糖、葡聚糖的合成氨基衍生物以及阳离子丙烯酸类聚合物。

在细胞标记之后，单个细胞样品的大多数细胞和/或细胞珠可被标记有具有样品条形码序列的核酸条形码分子(例如，部分缀合的条形码分子，在本文中也称为特征条形码)。细胞样品中的至少50％、60％、70％、75％、80％、85％、90％或95％的细胞可被标记。在一些情况下，并非所有细胞都被标记。例如，细胞样品中的少于100％、95％、90％、85％、80％、75％、70％、65％、60％或50％的细胞可被标记。

多个标记细胞样品可进行一个或多个反应。一个或多个反应可包括一个或多个核酸延伸反应。一个或多个反应可包括一个或多个核酸扩增反应。可替代地或另外地，一个或多个反应可包括一个或多个连接反应。

多个标记细胞样品中的单个标记细胞和/或细胞珠可共分配到多个分配区(例如，多个孔或液滴)中。例如，标记细胞和/或细胞珠可在进行一个或多个反应之前分配到多个分配区中。可将标记细胞分配到具有一种或多种可聚合材料的分配区中，使得可在分配区内产生标记细胞珠。一个或多个标记细胞和/或细胞珠可被包括在多个分配区的给定分配区中。使多个标记细胞样品的核酸分子进行一个或多个反应可包括将多个标记细胞样品中的单个细胞和/或细胞珠分配到分配区中并且在单个分配区内合成核酸分子，所述核酸分子包含(i)样品条形码序列和(ii)与核酸分子相对应的序列。通过将标记细胞样品分配到多个分配区中，可对处于隔离环境中的单个细胞和/或细胞珠执行一个或多个反应。单个分配区可包括至多单个细胞和/或细胞珠。可替代地，分配区的子集可包含至少单个细胞和/或细胞珠。

分配区可以是非水相(如油)中的含水液滴。例如，分配区可包括液滴，如乳液中的液滴。可替代地或另外地，分配区包括孔或管。

分配区可含有包含用于合成核酸分子的试剂的珠粒。试剂可以可释放地附接于珠粒。试剂可包含核酸，如核酸引物。核酸可包含分配区特异性条形码序列。来自给定细胞样品的两个细胞可具有相同的样品(例如，细胞)条形码序列，但不同的分配区特异性条形码序列(例如，如果两个细胞被分配在包含不同的分配区特异性条形码序列的两个不同分配区中的话)。在一个实例中，来自第一细胞样品的第一细胞具有第一样品条形码序列和第一分配区特异性条形码序列并且来自第二细胞样品的第二细胞具有第二样品条形码序列和第二分配区特异性条形码序列。第一样品条形码序列和第二样品条形码序列可以是不同的。第一分配区特异性条形码序列和第二分配区特异性条形码序列也可以是不同的(例如，如果两个细胞被分配在包含不同的分配区特异性条形码序列的两个不同分配区中的话)。可替代地，第一分配区特异性条形码序列和第二分配区特异性条形码序列可以是相同的(例如，如果两个细胞被分配在相同分配区中的话)。

一个或多个寡核苷酸或核酸条形码分子偶合于其上的珠粒可以在施加刺激后降解。刺激可包括化学刺激。珠粒可在分配区内降解。在珠粒包含用于合成核酸分子的试剂的情况下，试剂在珠粒降解后可释放到例如包含珠粒的分配区中。

多个核酸条形码产物可以进行核酸测序以产生多个测序读长。可以基于样品条形码序列将单个测序读长与单个标记细胞样品关联起来。可以基于样品条形码序列将单个读长与单个标记细胞样品关联起来。

本公开的方法可包括在对核酸条形码产物或其衍生物进行如核酸测序的测定之前将来自分配区的多个核酸条形码产物汇集。可对核酸条形码产物进行如核酸扩增的处理。在一些情况下，可将一个或多个特征如一个或多个功能序列(例如，测序引物和/或流动池衔接子序列)添加至核酸条形码产物，例如，在来自分配区的核酸条形码产物汇集之后。例如，汇集的扩增产物可在测序之前进行一个或多个反应。例如，汇集的核酸条形码产物可进行一个或多个另外的反应(例如，核酸延伸、聚合酶链式反应或衔接子连接)。衔接子连接可包括，例如，将核酸条形码产物片段化(例如，通过机械剪切或酶促消化)和酶促连接。

细胞样品可包括多个细胞和/或细胞珠。细胞样品可包括除细胞和/或细胞珠之外的组分。例如，细胞样品可以包含蛋白质、细胞游离多核苷酸(cell-free polynucleotide)(例如，细胞游离DNA)、细胞稳定剂、蛋白质稳定剂、酶抑制剂、细胞核以及离子。

细胞样品可以获自任何各种来源。例如，细胞样品可以获自组织样品。组织样品可以获自任何合适的组织源。组织样品可以获自循环***、消化***、内分泌***、免疫***、淋巴***、神经***、肌***、生殖***、骨骼***、呼吸***、泌尿***以及皮肤***的组分。细胞样品可获自循环***如心脏或血管(例如，动脉、静脉等)的组织样品。细胞样品可获自消化***(例如，嘴部、食管、胃、小肠、大肠、直肠和***)的组织样品。细胞样品可获自内分泌***(例如，脑下垂体、松果体、甲状腺、甲状旁腺、肾上腺和胰腺)的组织样品。细胞样品可获自免疫***(例如，***、脾脏和骨髓)的组织样品。细胞样品可获自淋巴***(例如，***、淋巴导管和***)的组织样品。在一些实施方案中，细胞样品获自神经***(例如，脑部和脊髓)的组织样品。在一些实施方案中，细胞样品获自肌***(例如，骨骼肌、平滑肌和心肌)的组织样品。在一些实施方案中，细胞样品获自生殖***(例如，***、睾丸、***、子宫和卵巢)的组织样品。在一些实施方案中，细胞样品获自骨骼***(例如，肌腱、韧带和软骨)的组织样品。在一些实施方案中，细胞样品获自呼吸***(例如，气管、横膈膜和肺)的组织样品。在一些实施方案中，细胞样品获自泌尿***(例如，肾脏、输尿管、膀胱、***和尿道)的组织样品。在一些实施方案中，细胞样品获自皮肤***(例如，皮肤)的组织样品。

组织样品可以通过创伤性、微创性或非创伤性程序获得。组织样品可以例如通过手术切除、活组织检查、细胞刮除或擦拭获得。组织样品可以是在手术程序期间获得的组织样品或出于诊断目的获得的样品。组织样品可以是新鲜组织样品、冷冻组织样品或固定组织样品。

在一些情况下，组织和/或细胞样品可以是包埋的、防腐的、保存的和/或固定的。例如，组织和/或细胞样品可以是固定且包埋的。组织和/或细胞样品可包含一个或多个固定细胞。固定是保存生物组织或细胞免于腐烂，从而防止自溶或腐败的过程。固定的组织可保存其细胞、其组织组分或两者。固定可通过交联固定剂，通过在待固定的组织或细胞中的蛋白质之间形成共价键完成。固定可将可溶性蛋白质锚定至细胞的细胞骨架。固定可形成刚性细胞、刚性组织或两者。固定可通过使用化学品实现，如甲醛(例如***)、戊二醛、乙醇、甲醇、乙酸、四氧化锇、重铬酸钾、铬酸、高锰酸钾、岑克尔氏固定剂、苦味酸盐、赫佩斯谷氨酸缓冲液介导的具有保护作用的有机溶剂(Hepes-glutamic acid buffer-mediatedorganic solvent protection effect，HOPE)或其任何组合。甲醛可用作以重量比重量计处于水溶液中的约37％甲醛气体的混合物。甲醛水溶液可另外包含约10-15％的醇(例如甲醇)，从而形成被称为“***”的溶液。固定剂-强度(10％)溶液将等于甲醛气体在水中的3.7％溶液。甲醛可用作至少5％、8％、10％、12％或15％的中性缓冲***(NBF)溶液(即固定剂强度)。甲醛可用作3.7％至4.0％的在磷酸盐缓冲盐水中的甲醛(即***)。在一些情况下，使用至少2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10、10.5、11.0、11.5、12.0、12.5、13.0、13.5、14.0、14.5或15.0百分比(％)或更多的***冲洗液或浸泡液执行固定。在一些情况下，使用约10％的***冲洗液执行固定。固定剂体积可为按重量/体积计组织的10、15、20、25或30倍。在甲醛中固定之后，可将组织或细胞浸没在醇中以用于长期储存。在一些情况下，醇为甲醇、乙醇、丙醇、丁醇、含有五个或更多个碳原子的醇，或其任何组合。醇可以是直链或具有支链。醇可为呈水溶液形式的至少50％、60％、70％、80％或90％的醇。在一些实例中，醇是呈水溶液形式的70％乙醇。

细胞样品可以获自生物流体。生物流体可以获自任何合适的来源。可以从中获得细胞样品的示例性生物流体源包括羊水、胆汁、血液、脑脊髓液、淋巴液、心包液、腹膜液、胸膜液、唾液、***、痰、汗水、泪和尿。生物流体可以通过创伤性、微创性或非创伤性程序获得。包含血液的生物流体可以通过例如静脉穿刺、针刺或针吸获得。

通过本文提供的方法分析的多个不同的细胞样品可以是来自单个受试者的多个样品。多个不同的细胞样品可在预先限定或未限定的时间长度的过程中的不同时间点从单个受试者获得。例如，多个细胞样品可在施用治疗性治疗之前和/或之后的多个时间点从受试者获得。可对多个细胞样品进行分析以评估和/或监测受试者对治疗性治疗的反应。在一些实施方案中，多个不同的细胞样品是获自来自单个受试者的不同来源的细胞样品。例如，受试者可被诊断患有癌症并且对来自多个组织源的细胞样品进行检查以确定癌症转移的程度。多个不同的细胞样品可获自组织样品的不同区域。例如，受试者可进行手术治疗以切除肿瘤区域。可对来自组织样品的不同区域的多个不同细胞样品进行评估，以鉴定正常组织与异常组织之间的边界。多个不同的细胞样品可包括癌性和非癌性细胞样品。

通过本文提供的方法分析的多个不同的细胞样品可以是来自多个受试者的多个样品。可替代地或另外地，多个不同的细胞样品可包括来自同一受试者的多个不同的细胞样品。例如，不同的细胞样品可在不同的时间(例如，在治疗方案期间的不同时间点)取自同一受试者。在另一个实例中，不同的细胞样品可取自同一受试者的不同区域或特征。例如，第一细胞样品可以是血液样品，并且第二细胞样品可以是组织样品。对于并行处理，可将多个样品(例如，来自多个受试者)组合以用于同时处理。在一些情况下，来自至少两个不同受试者的至少两个不同的细胞样品同时处理(例如，至少3、4、5、6、7、8、9、10、15、20或25个样品)，组合且并行处理。

空间映射

在一个方面中，本公开提供了用于空间映射的方法和组合物。可以根据空间关系布置多个核酸条形码分子。空间映射样品中的多个细胞的方法可包括将包含标记条形码序列的多个核酸条形码分子点样(spotting)或以其他方式分布到包含细胞和/或细胞珠的细胞样品(例如，三维组织样品或基板上的组织切片)上，以在所述细胞样品中产生多个标记细胞。多个核酸条形码分子可经过修饰以穿透所述细胞样品中的细胞和/或细胞珠的细胞膜。核酸条形码分子可用亲脂性部分进行修饰。在一些情况下，根据预先限定的空间构型或图案用多个核酸条形码分子对细胞样品进行点样。例如，可以将九个核酸条形码分子集合(例如，具有9种唯一样品条形码序列的9个核酸条形码分子集合)布置在3x3的方形网格中。位于网格的特定方形(例如，#1)中的所有样品条形码可以具有相同的样品条形码序列(例如，样品条形码序列#1)。给定方形中的样品条形码序列可不同于其他方形中的所有其他样品条形码序列。各个集合的样品条形码和对应的样品条形码序列可以具有预先限定的空间关系。例如，参考图7A，样品条形码序列#1可被定位成接近样品条形码序列#2和#4；样品条形码序列#2可被定位成接近样品条形码序列#1、#3和#5；样品条形码序列#3可被定位成接近样品条形码序列#2和#6；样品条形码序列#4可被定位成接近样品条形码序列#1、#5和#7；样品条形码序列#5可被定位成接近样品条形码序列#2、#4、#6和#8；样品条形码序列#6可被定位成接近样品条形码序列#3、#5和#9；样品条形码序列#7可被定位成接近样品条形码序列#4和#8；样品条形码序列#8可被定位成接近样品条形码序列#5、#7和#9；并且样品条形码序列#9可被定位成接近样品条形码序列#6和#8。本文涵盖了其他空间布置和关系。多个核酸条形码分子可以被布置成任何合适的构型，例如沉积到平面或非平面二维表面上。

在一些情况下，经过修饰的核酸条形码分子偶合于亲脂性分子，所述亲脂性分子使得能够递送核酸分子跨过细胞膜或核膜。可以在本文描述的实施方案中使用的亲脂性分子的非限制性实例包括固醇脂质，如胆固醇、生育酚以及其衍生物。在其他情况下，经过修饰的核酸条形码分子偶合于细胞穿透肽，所述细胞穿透肽可以使得分子能够穿透样品中的细胞。在其他情况下，使用脂质体、纳米颗粒或电穿孔将经过修饰的核酸条形码分子递送到细胞和/或细胞珠中。在一些情况下，可通过机械力(例如纳米线或显微注射)将经过修饰的核酸条形码分子递送到细胞和/或细胞珠中。在一些实例中，使用抗体产生唯一样品条形码序列，所述抗体可结合与样品所定位的每个区域中的细胞和/或细胞珠偶合的蛋白质。抗体或衍生自抗体的序列接着可用于鉴定样品所定位的区域。

在一些情况下，将核酸条形码分子点样或以其他方式分布到细胞样品上，所述细胞样品包括以至少二维存在于细胞样品中的细胞和/或细胞珠。可在已知位置或以规则图案，例如以如上所述且如图7A所示的网格图案将核酸条形码分子点样到细胞样品上。在一些情况下，点样到已知位置中的核酸条形码分子从点样位置径向分布。核酸条形码分子的点样或分布图案可使得一些细胞和/或细胞珠将包含各自包含唯一条形码序列的两种或更多种不同的核酸条形码分子。例如，以3x3网格图案(参见，例如，图7A)将核酸条形码分子(例如，缀合于亲脂性部分的核酸条形码分子)点样到细胞样品上，使得不同的核酸条形码分子集合沉积到网格的每个“方形”上(即，网格的每个“方形”具有唯一条形码序列)。在一些情况下，核酸条形码分子从点样或分布点扩散出来(例如径向)，产生核酸条形码分子的浓度梯度，使得相比于离点样点较远的细胞，离点样位置较近的细胞和/或细胞珠将具有相对更多的核酸条形码分子。此外，在一些情况下，标记细胞和/或细胞珠将包括包含2个或更多个不同的核酸条形码序列的核酸条形码分子。然后可对细胞和/或细胞珠的具体条形码序列进行分析，以推断在细胞样品内细胞的特殊关系(或细胞与另一细胞的相对空间关系)。例如，图7A的网格#1中存在的细胞和/或细胞珠通过各自包含共有条形码序列(例如，条形码序列#1)的核酸条形码分子集合进行标记，同时网格#2中存在的细胞和/或细胞珠通过各自包含共有条形码序列(例如，条形码序列#2)的不同的核酸条形码分子集合进行标记。针对网格或图案的每个区域重复标记程序，以使不同的核酸条形码分子集合分布在细胞样品的相关部分上。取决于它们在细胞样品中的位置，细胞和/或细胞珠可被标记有一个或多个唯一条形码序列(例如，细胞可被标记有条形码序列#1和条形码序列#2等)。然后可将单个细胞和/或细胞珠与细胞样品解离并且针对包含一个或多个条形码序列的核酸条形码分子的存在进行分析。在一些情况下，针对特定条形码序列的存在以及与每个细胞和/或细胞珠缔合的每个核酸条形码分子的量对细胞和/或细胞珠进行分析(例如，使用UMI)。因此，在一些情况下，利用核酸条形码分子的已知点样图案、特定条形码序列的存在以及每个核酸条形码分子的量来确定细胞和/或细胞珠在细胞样品中的空间位置或细胞和/或细胞珠相对于细胞样品中的另一细胞和/或细胞珠的相对空间位置。

具有至少二维的样品700，例如组织样品或组织的横切面，可用多个核酸条形码分子标记，例如，如图7B所示。在一些情况下，存在于组织样品或组织的横切面的不同位置的细胞和/或细胞珠可用不同的样品条形码序列(例如，部分缀合的条形码分子，在本文也称为特征条形码)进行标记。核酸分析，例如测序分析，可以利用样品条形码序列和条形码序列的空间关系来分析样品中的细胞和/或细胞珠的亚群之间的各种差异。

在一些实例中，用于空间映射多个细胞和/或细胞珠的方法包括使用核酸条形码分子标记不同细胞样品的细胞和/或细胞珠以产生多个标记细胞样品。单个核酸条形码分子可包括样品条形码序列，并且给定标记细胞样品的核酸条形码分子可以通过样品条形码序列而可区分于另一标记细胞样品的核酸条形码分子。核酸条形码分子可布置成至少预先限定的二维构型。

接着，多个标记细胞样品的核酸分子可进行一个或多个反应，以产生多个条形码化核酸产物。单个核酸条形码产物可以包含(i)样品条形码序列和(ii)与核酸分子相对应的序列。

接着，可对多个核酸条形码产物(或其衍生物)进行测序，以产生测序读长。然后可基于样品条形码序列和核酸条形码分子的预先限定的二维布置推断单个细胞样品之间的空间关系，从而将多个细胞样品空间映射到至少二维构型上。

例如，具有至少二维的细胞样品(例如，载玻片上的组织切片或来自受试者的三维组织样品，如固定的组织样品)可用包含标记条形码序列的标记核酸条形码分子以如上所述的预先限定的图案进行点样。然后将细胞与细胞样品解离并且分配到多个分配区中，每个分配区包含(1)来自细胞样品的单细胞，单细胞包含至少一个包含标记条形码序列的标记核酸条形码分子；以及(2)包含样品条形码序列的多个样品核酸条形码分子，其中每个分配区包括包含不同样品条形码序列的样品核酸条形码分子。多个样品核酸条形码分子还包含唯一分子标识符(UMI)序列。多个样品核酸条形码分子可附接于珠粒(例如，凝胶珠粒)并且每个分配区包含单个珠粒。在一些情况下，标记核酸条形码分子包含一个或多个功能序列，如引物序列或UMI序列。在一些情况下，将细胞裂解以释放标记核酸条形码分子或细胞中存在的或与细胞缔合的其他分析物。在每个分配区中，通过样品核酸条形码分子将与每个孔相关联的标记核酸条形码分子条形码化，以产生包含标记条形码序列和样品条形码序列的核酸分子。除了标记核酸条形码分子的条形码化之外，还可利用样品条形码序列将如RNA或DNA分子的另外的分析物条形码化。利用样品条形码序列条形码化的核酸分子接着可以根据需要进行处理，以产生适用于测序的文库，如本文其他地方所述。

三维空间映射

条形码化分子(例如，寡核苷酸-亲脂性部分缀合物)可用于靶向或标记悬浮液中的细胞。在一个方面中，使完整组织样品(例如，固体组织样品)内的细胞与这些条形码分子接触以用于空间分析。本发明涉及用于将条形码分子原位注射到组织样品中并且随后鉴定与组织样品内的细胞对条形码分子的摄取相对应的位置的方法和装置或仪器。在一个方面中，寡核苷酸-亲脂性部分缀合物(例如，寡核苷酸-胆固醇缀合物)用于标记组织样品中的细胞。在一个实施方案中，使用非常细的针头(或针头的阵列)将缀合物注射到组织样品中。每个条形码分子的定位将具有限定的位置，例如处于二维(处于一个平面中的2D)或三维(处于几个平面中的3D)中。缀合物注射之后，条形码分子***细胞的质膜中(例如，通过亲脂性部分)并且在组织内扩散。在注射点，条形码的浓度将是最高的，并且当它在组织中扩散时，其浓度将降低。考虑到这种扩散，条形码的摄取将把其定位限定为注射点。利用针头的阵列(例如，图16)，当细胞吸收不同浓度的不同条形码时，将可以重新构建细胞位置，从而指示细胞与彼此的相对位置。也可使用本领域普通技术人员已知的微阵列核酸打印方法将条形码化分子施加至组织样品内的细胞。

图16示出具有使用针头的一个固定阵列实现的条形码染色的组织切片的实例(一个2维平面)。x、y、z可根据条形码的扩散进行确定。以举例的方式，10μm的细胞直径意味着条形码的扩散将在约10-15个细胞或约100μm-150μm的规模上。可以使用非常细的针头利用或不利用压力输注条形码，其中输注可以在所有方向(由条形码的期望扩散限定)上分开xμm的串样图案进行。每个针头可以输注不同的条形码。

图17示出用于在空间上定位条形码和关联细胞的扩散映射(2D视图中的一个平面)。图18示出由条形码及其相对量(输注点处的量较高，当细胞远离扩散点时，量较低)限定的细胞的位置(命名为“C1”至“C7”)。不同条形码在每个细胞中的量在空间上限定了其在组织中的位置。下表针对假设性情境中的细胞C1至C7示出这一点。

表1.条形码在细胞中的分布。

图19示出三维应用。3层的融合针头(fused needle)用于递送3种不同的条形码。图20示出利用条形码染色最大化3D空间的三维应用。

在一个实施方案中，本公开提供了用于空间映射的方法和组合物，其中使不同的条形码分子与3D生物样品(例如，固体组织样品)的不同区域接触。在一个其他实施方案中，生物样品包括感兴趣的不同区域，所述不同区域可与条形码分子接触。例如，图21A示出具有用于递送条形码分子(例如，寡核苷酸-亲脂性部分缀合物)的递送装置(例如，包括融合或多点针头的针头)的小鼠脑部的区域(P0-P8)。将组织样品(例如，小鼠脑部或其他固体组织样品)用合适的培养基如Hibernate培养基或HEB培养基(Thermo Fisher Scientific)洗涤，从培养基中移除，并且排干任何过量的培养基，之后施加条形码分子。将多个注射器(例如，2-3μL体积，安装有30至31号针头)装载合适浓度(例如，约0.1μM)的寡核苷酸-亲脂性部分缀合物，以用于以约1mm的深度注射到组织样品中。在固定的注射体积下，可根据细胞的所得标记和在组织内的扩散速度调节缀合物的浓度。如图21B所示，根据图案，第一缀合物在位置A注射，第二缀合物在位置B注射，第三缀合物在位置C注射，并且第四缀合物在位置D注射。在一个实施方案中，位置B距离位置A第一距离，位置C距离位置A和B第二距离，并且位置D距离位置A和B第三距离。在其他实施方案中，第一距离小于第二距离并且/或者大于第三距离(例如，图21B中的图案1)。

在另一实施方案中，位置A-D以线性图案注射，其中每个位置按顺序距离其他位置相同的距离。例如，位置A距离位置B第一距离并且距离位置C第二距离，其中第一距离为第二距离的一半(例如，图21B中的图案2)。本领域的普通技术人员将会知道，可以根据图21B所示的图案或任何其他合适的图案将不同缀合物注射到组织样品中。

注射之后，将组织样品在室温下温育以允许缀合物在它们相应的注射点扩散到组织中。温育之后，将组织样品放置在15mL圆锥管中并且再次在HEB培养基中洗涤(例如，洗涤两次)。移除培养基之后，根据合适的样品制备方案(例如，10X基因组学样品制备展示方案-解离小鼠胚胎神经组织以用于单细胞RNA测序CG00055(10X Genomics SamplePreparation Demonstrated Protocol–Dissociation of Mouse Embryonic NeuralTissue for Single Cell RNA Sequencing CG00055))将组织样品解离，以用于单细胞测序。解离之后，对来自组织样品的细胞的悬浮液进行处理以产生测序文库。如本文所述，将来自细胞悬浮液的单细胞(具有***它们的细胞膜中的寡核苷酸-亲脂性部分(例如，胆固醇)缀合物)提供于具有试剂的单个分配区中，所述试剂用于涉及来自相同单细胞的分析物的一个或多个另外的条形码化反应。对来自细胞悬浮液的分析物进行处理，以提供用于测序的核酸文库(参见，例如，美国专利10011872、9951386、10030267和10041116，所述专利以引用方式全文并入本文)。在一个实施方案中，通过测序以及与由悬浮液中的单细胞处理得到的一种或多种分析物相关联的条形码序列鉴定多个寡核苷酸-亲脂性部分缀合物的条形码序列。在一个实施方案中，将来自多个寡核苷酸-亲脂性部分缀合物的一个或多个条形码序列与对应于组织样品内的一个或多个细胞的一个或多个空间位置关联起来(参见图21A-21B)。在另一个实施方案中，空间位置对应于一个或多个细胞，其中特定的寡核苷酸-亲脂性部分缀合物扩散到组织样品中。在其他实施方案中，接着将一个或多个空间位置与在寡核苷酸-亲脂性部分缀合物扩散到其中的一个或多个细胞中检测和鉴定的一种或多种分析物关联起来。在一个另外的实施方案中，提供了一种使用寡核苷酸-亲脂性部分缀合物进行空间分析(例如，三维空间分析)的方法。在一个实施方案中，所述方法包括使组织样品(例如，固体组织样品)与多个寡核苷酸-亲脂性部分缀合物在样品内的多个位置接触。在另一个实施方案中，多个寡核苷酸-亲脂性部分缀合物包括第一、第二、第三、第四、第五、第六等类型的寡核苷酸-亲脂性部分缀合物。寡核苷酸-亲脂性部分缀合物的类型就条形码的序列和/或亲脂性部分的类型而言可以是不同的。在一个其他实施方案中，所述方法包括允许多个寡核苷酸-亲脂性部分缀合物扩散到组织样品中，使得多个寡核苷酸-亲脂性部分缀合物***到组织样品内的细胞的细胞膜中。在另外的实施方案中，所述方法包括提供来源于组织样品(含有扩散的寡核苷酸-亲脂性部分缀合物)的细胞(例如，单细胞)的悬浮液，使得悬浮液包含保留有多个寡核苷酸-亲脂性部分缀合物的一个或多个寡核苷酸-亲脂性部分缀合物的一个或多个细胞。在一个实施方案中，所述方法包括由细胞的悬浮液提供用于测序的核酸文库。在一个实施方案中，核酸文库包括与寡核苷酸-亲脂性部分缀合物相对应的核酸条形码分子以及分析物(如本文所述)，包括但不限于核酸分析物和蛋白质分析物。

双联体(Doublet)减少和检测

本公开还提供用于双联体减少的方法和组合物。在一个方面中，分析多核苷酸的方法可包括使用核酸条形码分子或包含核酸条形码分子的寡核苷酸标记不同细胞样品(例如，来自不同受试者如不同的人或动物的细胞样品；在不同时间获取的来自同一受试者的细胞样品；和/或从受试者的不同区域或特征，如从不同组织获取的来自同一受试者的细胞样品)的细胞和/或细胞珠以产生多个标记细胞样品，其中单个核酸条形码分子包含样品条形码序列(例如，部分缀合的条形码分子，在本文中也称为特征条形码)，并且其中给定标记细胞样品的核酸条形码分子通过样品条形码序列而可区分于另一标记细胞样品的核酸条形码分子。来自同一细胞样品的不同细胞和/或细胞珠具有相同的样品条形码序列。多个细胞样品中的标记细胞和/或细胞珠可共分配到多个分配区中。标记细胞和/或细胞珠可与多个珠粒，如多个凝胶珠粒共分配。多个珠粒中的珠粒可包含附接(例如，可释放地偶合)于其上的多个珠粒核酸条形码分子，其中附接于珠粒的单个珠粒核酸条形码分子包含珠粒条形码序列。给定珠粒的珠粒核酸条形码分子可通过它们的一个或多个珠粒条形码序列而可区分于另一珠粒的珠粒核酸条形码分子。给定分配区的至少一个标记细胞和/或细胞珠的核酸分子可进行一个或多个反应，以产生核酸条形码产物，所述核酸条形码产物包含(i)样品条形码序列，(ii)珠粒条形码序列，以及(iii)与至少一个标记细胞和/或细胞珠的核酸分子的一个核酸分子相对应的序列。可对核酸条形码产物进行测序以产生多个测序读长。在一些情况下，可将多个分配区的内容物汇集以提供与多个分配区相对应的多个核酸条形码产物。可对测序读长进行处理，以鉴定珠粒和样品条形码序列，所述序列可用于鉴定与测序读长相对应的细胞和/或细胞珠。例如，与来自被共分配在同一分配区的不同细胞样品的两个不同细胞和/或细胞珠相对应的测序读长可被鉴定为具有相同的珠粒条形码序列和不同的样品条形码序列。与来自被分配在不同分配区的同一细胞样品的两个不同细胞和/或细胞珠相对应的测序读长可被鉴定为具有不同的珠粒条形码序列和相同的样品条形码序列。

如本文其他地方所述，用于标记细胞样品的单个细胞和/或细胞珠的样品条形码序列可以随后用作将细胞和/或细胞珠和给定细胞样品关联起来的机制。例如，多个细胞样品可以使用核酸条形码分子唯一标记，使得特定样品的细胞和/或细胞珠可以被鉴定为来源于特定样品，即使是在特定细胞样品与另外的细胞样品混合并批量进行核酸处理的情况下。

单个核酸条形码分子可形成条形码化寡核苷酸的一部分。如本文其他地方所述的条形码化寡核苷酸可以包含除样品条形码序列之外的序列元件，所述序列元件可用于多种目的，例如用于样品制备以进行测序分析，例如下一代序列分析。

可以通过本文其他地方所述的多种合适机制中的任何机制，使用核酸条形码分子标记细胞和/或细胞珠。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可连接于部分(“条形码化部分”)，如抗体或其表位结合片段、细胞表面受体结合分子、受体配体、小分子、前体、适体、单抗体、affimer、darpin或蛋白质支架。可与核酸条形码分子或条形码化寡核苷酸连接的部分可结合在多个细胞样品的单个细胞的表面上表达的分子。标记细胞样品可指其中细胞和/或细胞珠与条形码化部分结合的样品。标记细胞样品可指其中细胞在细胞和/或细胞珠内具有核酸条形码分子的样品。

分子(例如，在多个细胞样品的单个细胞的表面上表达的分子)可以是多个不同的细胞样品的所有细胞和/或细胞珠所共有的。分子可以是蛋白质。本文的实施方案中的示例性蛋白质包括但不限于跨膜受体、主要组织相容性复合体蛋白、细胞表面蛋白、糖蛋白、糖脂、蛋白通道和蛋白泵。细胞表面蛋白的非限制性实例可以是细胞粘附分子。分子可针对样品的所有细胞和/或细胞珠以类似水平表达。分子针对样品的所有细胞和/或细胞珠的表达可在生物可变性之内。分子可在细胞样品的细胞和/或细胞珠中差异表达。分子针对样品的所有细胞和/或细胞珠的表达可不在生物可变性之内，并且细胞样品的一些细胞和/或细胞珠可以是和/或包括异常细胞。连接于核酸条形码分子或条形码化寡核苷酸的部分可结合存在于细胞样品的大多数细胞和/或细胞珠上的分子。分子可存在于细胞样品中的至少50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的细胞和/或细胞珠上。

细胞和/或细胞珠可以在(a)中通过任何合适的机制进行标记，包括本文其他地方所描述的那些机制。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可与抗体或其表位结合片段连接，并且标记细胞和/或细胞珠可包括使抗体连接的核酸条形码分子或表位结合片段连接的核酸条形码分子经受适于将抗体或其表位结合片段与存在于细胞表面的分子结合的条件。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可偶合于细胞穿透肽(CPP)，并且标记细胞和/或细胞珠可包括通过CPP将CPP偶合的核酸条形码分子递送到细胞和/或细胞珠中。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可缀合于细胞穿透肽(CPP)，并且标记细胞和/或细胞珠可包括通过CPP将CPP缀合的核酸条形码分子递送到细胞和/或细胞珠中。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可偶合于亲脂性分子，并且标记细胞和/或细胞珠可包括通过亲脂性分子将核酸条形码分子递送至细胞膜。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可进入细胞内空间。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可偶合于亲脂性分子，并且标记细胞可包括通过亲脂性分子将核酸条形码分子递送至核膜。核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可进入细胞核。标记细胞和/或细胞珠可包括使用物理力或化学化合物将核酸条形码分子或条形码化寡核苷酸递送到细胞和/或细胞珠中。可以在本文提供的方法中使用的物理方法的实例包括使用针头、弹道DNA、电穿孔、声孔效应、光致穿孔、磁转染以及流体动力。可以在本文提供的方法中使用各种化学化合物，以将核酸条形码分子递送至细胞。如本文先前所述的化学载体可以包括无机颗粒、基于脂质的载体、基于聚合物的载体以及基于肽的载体。在一些情况下，标记细胞和/或细胞珠可包括使用阳离子脂质，如脂质体。标记细胞样品可指其中细胞和/或细胞珠在细胞和/或细胞珠内具有核酸条形码分子的样品。

在细胞和/或细胞珠的标记之后，特定细胞样品中的大多数细胞和/或细胞珠可以被标记有具有样品特异性条形码序列的核酸条形码分子。细胞样品中的至少50％、60％、70％、75％、80％、85％、90％或95％的细胞可被标记。在一些情况下，并非多个细胞样品的给定细胞样品的所有细胞和/或细胞珠都被标记。细胞样品中的少于100％、95％、90％、85％、80％、75％、70％、65％、60％或50％的细胞和/或细胞珠可被标记。在一些情况下，多个细胞样品的多个不同细胞样品的细胞和/或细胞珠可不被标记。

多个标记细胞样品可以与多个珠粒共分配到多个分配区中。单个珠粒可包含附接于其上的多个珠粒核酸条形码分子。给定珠粒的珠粒核酸条形码分子可通过珠粒条形码序列而可区分于另一珠粒的珠粒核酸条形码分子。珠粒核酸条形码分子可以可释放地附接于珠粒。珠粒可以在施加刺激后降解。刺激可包括化学刺激。

通过将标记细胞样品分配到多个分配区中，可对处于隔离分配区中的单细胞单个地执行一个或多个反应。在一些情况下，分配区是非水相(如油)中的含水液滴。分配区包括液滴。例如，分配区可以是乳液中的液滴。可替代地，分配区可包括孔或管。

单个分配区可包含单个细胞和/或细胞珠。可替代地或另外地，分配区的子集可包含多于单个细胞和/或细胞珠。

在具有多于单个细胞和/或细胞珠的分配区中产生的核酸可不期望地将相同珠粒条形码序列分配给两个不同的细胞和/或细胞珠。虽然核酸可共享相同珠粒条形码序列，但是如果两个细胞和/或细胞珠来源于不同的细胞样品，那么两个不同的细胞和/或细胞珠可以通过不同的样品条形码序列区分开。通过使用样品条形码序列(例如，部分缀合的条形码分子)和珠粒(或分配区)条形码序列两者，可以鉴定来自包括多于一个标记细胞和/或细胞珠的分配区的测序读长。

细胞表征

在一个方面中，本文提供的方法可用于鉴定和/或表征细胞和/或细胞珠。例如，本公开提供了一种鉴定细胞和/或细胞珠的尺寸的方法。通过鉴定细胞的尺寸，还可确定其他特性，如其类型和/或所来源的组织。

不同尺寸(例如，直径)的细胞将具有不同的缔合细胞表面。例如，第一尺寸的第一细胞可具有与大于第一尺寸的第二尺寸的第二细胞不同的表面积和表面特征。如本文所述，亲脂性或两亲性部分(例如，偶合于核酸条形码分子)可与细胞和/或细胞珠的膜缔合和/或***其中。在亲脂性或两亲性部分(例如，偶合于核酸条形码分子)的非饱和浓度下，细胞或细胞珠对亲脂性或两亲性部分的摄取可与细胞或细胞珠的表面成比例。因此，大于第一细胞或细胞珠的第二细胞或细胞珠(例如，具有比第一细胞或细胞珠更大的直径以及因此更大的表面积)可摄取比第一细胞或细胞珠更多的亲脂性或两亲性部分(参见，例如，图22和23)。

鉴定或表征细胞和/或细胞珠可包括测量细胞和/或细胞珠对亲脂性或两亲性部分(例如，偶合于核酸条形码分子)的摄取。可向细胞或细胞珠或细胞或细胞珠的集合体提供已知量的亲脂性和/或两亲性部分(例如，偶合于核酸条形码分子)并且可测量此类部分的摄取。细胞对此类部分的摄取可通过，例如，测量未被细胞摄取的此类部分的残余量并且从初始已知量中减去此量来测量。在另一个实例中，可对亲脂性和/或两亲性部分进行标记(例如，使用光学可检测标记，如荧光部分)并且标记可用于确定一个或多个细胞/细胞珠对亲脂性和/或两亲性部分的相对摄取(例如，使用光学检测方法)。在另一个实例中，细胞和/或细胞珠所吸收的亲脂性/两亲性部分(例如，偶合于核酸条形码分子)的量可通过测量与细胞和/或细胞珠缔合的核酸条形码分子的量(例如，使用核酸测序)来确定。这样的方法可提供确定细胞尺寸的其他方法的替代方案，如流式细胞术。

在一个实例中，可用亲脂性或两亲性特征条形码标记多个细胞(例如，如本文所述)。包含亲脂性部分(例如，胆固醇部分)的特征条形码可与多个细胞一起温育。特征条形码可包含光学标记，如荧光部分。特征条形码可包括，例如，被配置成与核酸条形码分子杂交的序列，如包含多个半胱氨酸核苷酸的序列(例如，CCC序列)。每个特征条形码还可包含条形码序列和/或唯一分子标识符(UMI)序列。每个亲脂性或两亲性部分可偶合于不同的UMI序列。例如，在将使用约1百万个亲脂性或两亲性部分的情况下，可使用约1百万个不同的UMI序列。可替代地，每个亲脂性或两亲性部分可偶合于UMI和条形码序列的不同组合。例如，在将使用约1百万个亲脂性或两亲性部分的情况下，可使用约1百万个不同组合。可将细胞分配到具有多个分配区核酸条形码分子的多个分配区(例如，多个液滴，如乳液中的含水液滴)中，其中多个分配区核酸条形码分子中的每个核酸条形码分子包含条形码序列。每个分配区可包含至多一个细胞。多个分配区核酸条形码分子可遍布于分配区中，使得每个分配区包括具有不同条形码序列的核酸条形码分子，其中多个分配区中的给定分配区可包括具有相同条形码序列的多个核酸条形码分子。核酸条形码分子可偶合(例如，可释放地偶合)于珠粒(例如，凝胶珠粒)。除了条形码序列之外，核酸条形码分子还可包含唯一分子标识符序列和/或被配置成与偶合于亲脂性或两亲性部分的特征条形码杂交的序列(例如，GGG序列)。在包含细胞的每个分配区内，分配区核酸条形码分子可偶合于与亲脂性或两亲性部分偶合的特征条形码，使得细胞包含多个偶合于i)特征条形码和ii)分配区核酸条形码分子的亲脂性或两亲性部分。分配区核酸条形码分子的条形码序列在多个亲脂性或两亲性部分中是统一的并且将细胞鉴定为对应于给定分配区，而条形码和/或特征条形码的UMI序列的多样性与细胞对亲脂性或两亲性部分的摄取成比例，并且因此与细胞尺寸成比例。因此，在对偶合于分配区核酸条形码分子的特征条形码进行测序后(例如，在用例如流动池衔接子对偶合于分配区核酸条形码分子的特征条形码进行衍生化之后)，可获得多个测序读长，所述测序读长可与特征条形码和分配区核酸条形码分子所对应的细胞关联起来。条形码和/或特征条形码的UMI序列的数量可用于确定与其相关联的细胞的相对尺寸(例如，较大的细胞将具有比较小细胞更多的与其相关联的条形码和/或UMI序列)(参见，例如，图24)。

在另一个实例中，可用亲脂性或两亲性特征条形码标记多个细胞(例如，如本文所述)。包含亲脂性部分(例如，胆固醇部分)的特征条形码可与多个细胞一起温育。特征条形码可包含光学标记，如荧光部分。特征条形码可包括，例如，被配置成与核酸条形码分子杂交的序列，如包含多个半胱氨酸核苷酸的序列(例如，CCC序列)。每个特征条形码还可包含条形码序列和/或唯一分子标识符序列。可提供各自包含多个核酸条形码分子的多个珠粒(例如，凝胶珠粒)。每个珠粒的核酸条形码分子(例如，可释放地附接于每个珠粒)可包含条形码序列(例如，细胞条形码序列)、唯一分子标识符序列，以及被配置成与特征条形码杂交的序列。各不同珠粒的核酸条形码分子包含相同的条形码序列，所述条形码序列不同于多个珠粒的其他珠粒的核酸条形码分子的条形码序列。与特征条形码一起温育的细胞可与多个珠粒一起分配(例如，在一个或多个洗涤过程之后)到多个分配区(例如，液滴，如乳液中的含水液滴)中，使得多个分配区的至少一个子集各自包含单个细胞和单个珠粒。在多个分配区的至少一个子集的每个分配区内，珠粒的一个或多个核酸条形码分子可附接(例如，杂交或连接)于细胞的一个或多个特征条形码。在将一个或多个核酸条形码分子附接于细胞的一个或多个特征条形码以提供条形码化特征条形码之前，可在分配区内将珠粒的一个或多个核酸条形码分子从珠粒上释放(例如，通过施加刺激，如化学刺激)。可将细胞在分配区内裂解或透化，以使得其中的分析物，如其中的核酸分子(例如，脱氧核糖核酸(DNA)分子和/或核糖核酸(RNA)分子)，和/或其中的特征条形码(例如，如果特征条形码已经渗透细胞膜的话)可被接近。也可利用珠粒的一个或多个核酸条形码分子在分配区内将细胞的一个或多个分析物(例如，核酸分子)条形码化，以提供多个条形码化分析物(例如，条形码化核酸分子)。包含条形码化分析物和条形码化特征条形码的多个分配区可合并(例如，汇集)。可进行另外的处理，例如，以制备条形码化分析物和条形码化特征条形码用于后续分析。例如，条形码化核酸分子和/或条形码化特征条形码可用流动池衔接子衍生化以有利于核酸测序。条形码化分析物和条形码化特征条形码的条形码可使用核酸测序进行检测并且用于将条形码化分析物和条形码化特征条形码鉴定为来源于多个细胞的特定细胞或细胞类型。在测序测定中测量的给定序列(例如，条形码或UMI序列)的相对丰度可提供多个细胞的各种细胞的尺寸的估计。例如，与第一细胞相关联的第一条形码序列(例如，通过特征条形码和/或与第一细胞共分配的珠粒的核酸条形码分子的分配区核酸条形码序列)可以比与第二细胞相关联的第二条形码序列更大的数量出现，表明第一细胞大于第二细胞。与细胞碎片(例如，细胞组分和/或损伤细胞)相关联的条形码序列和UMI可具有少量与其缔合的亲脂性或两亲性部分并且因此可仅在最小程度上促进条形码序列相对细胞计数的分布(参见，例如，图24)。

用于样品区室化的***和方法

在一个方面中，本文所述的***和方法提供将单个生物颗粒的大分子组成内容物区室化、沉积或分配到离散隔室或分配区(在本文中可互换地称为分配区)中，其中每个分配区保持其自己的内容物与其他分配区的内容物的分离。分配区可以是乳液中的液滴。分配区可以包括一个或多个其他分配区。

本公开的分配区可包含生物颗粒和/或其大分子组分。分配区可包括一个或多个凝胶珠粒。分配区可包括一个或多个细胞珠。分配区可包括单个凝胶珠粒、单个细胞珠、单个细胞珠和单个凝胶珠粒、两个细胞珠和单个凝胶珠粒、三个细胞珠和单个凝胶珠粒等。细胞珠可以是例如通过含有生物颗粒的液滴和能够被聚合或胶凝的前体的聚合而包裹在凝胶或聚合物基体内的生物颗粒和/或其大分子组分中的一种或多种。可以在液滴产生之前、之后或同时如通过微胶囊(例如珠粒)将唯一标识符(如条形码)注射到液滴中，如下文进一步描述。微流体通道网络(例如，在芯片上)可用于产生如本文所述的分配区。在单个生物颗粒的分配中也可以采用替代机制，包括多孔膜，通过多孔膜将细胞的含水混合物挤出到非含水流体中。

分配区可在流体流内流动。分配区可包括例如微囊泡，其具有围绕内部流体中心或核心的外部屏障。在一些情况下，分配区可包括多孔基体，其能够在其基体内夹带和/或保留材料。分配区可包括非含水连续相(例如油相)内的含水流体的液滴。分配区可包括第二相内的第一相的液滴，其中第一相和第二相是不混溶的。在例如美国专利申请公布2014/0155295中描述了多种不同的容器，所述申请出于所有目的以引用方式全文并入本文。用于在非含水或油状连续相中产生稳定液滴的乳液体系描述于例如美国专利申请公布2010/0105112中，所述申请出于所有目的以引用方式全文并入本文。

就乳液中的液滴而言，在一个非限制性实例中，将单个生物颗粒分配到离散分配区中可以通过将含水流体中的生物颗粒的流动流引入非含水流体的流动流中，使得在两股流的汇合点处产生液滴来实现。通过提供生物颗粒的一定浓度和/或流速下的含水流，可以控制所得分配区的占据率(例如，每个分配区的生物颗粒的数量)。在使用单个生物颗粒分配区的情况下，可以选择不混溶流体的相对流速，使得平均而言，分配区可以每个分配区包含少于一个生物颗粒，以确保被占据的那些分配区主要被单独占据。在一些情况下，多个分配区中的分配区可包含至多一个生物颗粒(例如，珠粒、细胞或细胞材料)。在一些实施方案中，可以选择流体的相对流速，使得大多数分配区被占据，例如，仅允许一小部分未占据的分配区。可以控制流和通道架构以确保给定数量的单独占据分配区、小于一定水平的未占据分配区和/或小于一定水平的多占据分配区。在一些实施方案中，分配区包含多于一个生物颗粒。

图1示出用于分配单个生物颗粒的微流体通道结构100的实例。通道结构100可包括在通道汇合点110处连通的通道区段102、104、106和108。在操作中，包括悬浮生物颗粒(或细胞)114的第一含水流体112可沿通道区段102输送到汇合点110中，同时与含水流体112不混溶的第二流体116从通道区段104和106中的每一个输送到汇合点110，以产生第一含水流体112的离散液滴118、120，离散液滴118、120流入通道区段108并从汇合点110流走。通道区段108可以流体联接到可以储存和/或收集离散液滴的出口贮存器。产生的离散液滴可包括单个生物颗粒114(如液滴118)。产生的离散液滴可包括多于一个单独生物颗粒114(图1中未示出)，例如至少两个生物颗粒。离散液滴可以不包含生物颗粒114(例如液滴120)。每个离散分配区可以保持其自身内容物(例如，单独的生物颗粒114)与其他分配区的内容物的分离。

第二流体116可包含油，例如氟化油，其包括用于稳定所得液滴(例如，抑制所得液滴118、120的后续聚结)的含氟表面活性剂。特别有用的分配流体和含氟表面活性剂的实例描述于例如美国专利申请公布2010/0105112中，所述申请出于所有目的以引用方式全文并入本文。

如将理解的，本文描述的通道区段可以联接到多种不同流体源或接收部件中的任一个，包括其他***的贮存器、管道、歧管或流体部件。如将理解的，微流体通道结构100可具有其他几何形状。例如，微流体通道结构可具有多于一个通道汇合点。例如，微流体通道结构可以具有2、3、4或5个通道区段，所述通道区段各自承载在通道汇合点处相遇的生物颗粒、细胞珠和/或凝胶珠粒)。可以通过一个或多个流体流动单元引导流体沿着一个或多个通道或贮存器流动。流体流动单元可包括压缩机(例如，提供正压)、泵(例如，提供负压)、致动器等以控制流体的流动。还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。

产生的液滴可包括两个液滴子集：(1)占据的液滴118，其包含一个或多个生物颗粒114，和(2)未占据的液滴120，其不包含任何生物颗粒114。占据的液滴118可以包括单占液滴(具有一个生物颗粒)和多占液滴(具有多于一个生物颗粒)。如本文其他地方所述，在一些情况下，大多数占据的分配区可以每个占据的分配区包括不多于一个生物颗粒，并且一些产生的分配区可以未被(任何生物颗粒)占据。但是，在一些情况下，一些占据的分配区可能包括多于一个生物颗粒。在一些情况下，可以控制分配过程，使得少于约25％的占据分配区包含多于一个生物颗粒，并且在许多情况下，少于约20％的占据分配区具有多于一个生物颗粒，而在一些情况下，少于约10％或甚至少于约5％的占据分配区包括每个分配区多于一个生物颗粒。

在一些情况下，可能希望最小化过度数量空分配区的产生，例如以降低成本和/或提高效率。尽管这种最小化可以通过在分配汇合点110处提供足够数量的生物颗粒(例如，生物颗粒114)例如以确保至少一个生物颗粒被包封在分配区中来实现，但是泊松分布可以预期地增加包含多个生物颗粒的分配区的数量。因此，在要获得单占分配区的情况下，至多约95％、90％、85％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、15％、10％、5％或更少产生的分配区可以是未被占据的。

在一些情况下，可以控制一个或多个生物颗粒(例如，在通道区段102中)的流动，或者引导到分配汇合点中的其他流体(例如，在通道区段104、106中)的流动，使得在许多情况下，不多于约50％产生的分配区、不多于约25％产生的分配区或不多于约10％产生的分配区未被占据。可以控制这些流以便呈现单占分配区的非泊松分布，同时提供较低水平的未占据分配区。可以实现上述范围的未占据分配区，同时仍然提供上述任何单占率。例如，在许多情况下，使用本文所述的***和方法可以产生具有小于约25％、小于约20％、小于约15％、小于约10％，并且在许多情况下，小于约5％的多占率的所得分配区，同时具有小于约50％、小于约40％、小于约30％、小于约20％、小于约10％、小于约5％或更少的未占据分配区。

如应理解，上述占据率也适用于包括生物颗粒和另外试剂的分配区，包括但不限于携带条形码化核酸分子(例如，寡核苷酸)的微胶囊(参照图2描述)。占据分配区(例如，至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、95％或99％的占据分配区)可包括包含条形码化核酸分子的微胶囊(例如珠粒)和生物颗粒。

在另一方面中，除了基于液滴的分配之外或作为基于液滴的分配的替代方案，生物颗粒可以包封在微胶囊内，所述微胶囊包括其中夹带有一个或多个单独生物颗粒或少量生物颗粒的外壳、层或多孔基体。微胶囊可包括其他试剂。可以通过多种方法执行生物颗粒的包封。此类方法可以将含有生物颗粒的含水流体与聚合物前体材料组合，所述聚合物前体材料在将特定刺激施加到聚合物前体后能够形成凝胶或其他固体或半固体基体。这样的刺激可以包括，例如，热刺激(例如，加热或冷却)、光刺激(例如，通过光固化)、化学刺激(例如，通过交联、前体的聚合引发(例如，通过添加的引发剂))或其组合。

包含生物颗粒的微胶囊的制备可以通过多种方法执行。例如，气刀液滴或气溶胶发生器可用于将前体流体液滴分配到胶凝溶液中，以形成包含单独生物颗粒或少量生物颗粒的微胶囊。同样地，基于膜的包封***可用于产生包含如本文所述的包封生物颗粒的微胶囊。本公开的微流体***，如图1所示，可容易地用于包封如本文所述的细胞。特别地，并且参考图1，包含(i)生物颗粒114和(ii)聚合物前体材料(未示出)的含水流体112流入通道汇合点110，在通道汇合点110中含水流体112通过非含水流体116的流动被分配成液滴118、120。就包封方法而言，非含水流体116还可包括引发剂(未示出)，以引起聚合物前体的聚合和/或交联，从而形成包含夹带的生物颗粒的微胶囊。聚合物前体/引发剂对的实例包括美国专利申请公布2014/0378345中描述的那些，所述申请出于所有目的以引用方式全文并入本文。

例如，在聚合物前体材料包含线性聚合物材料(例如线性聚丙烯酰胺、PEG或其他线性聚合物材料)的情况下，活化剂可包含交联剂或活化在所形成的液滴中的交联剂的化学品。同样，对于包含可聚合单体的聚合物前体，活化剂可包括聚合引发剂。例如，在某些情况下，当聚合物前体包含丙烯酰胺单体与N,N'-双-(丙烯酰基)胱胺(BAC)共聚单体的混合物时，可在通道区段104和106中的第二流体流116内提供如四乙基甲二胺(TEMED)的试剂，其可以引发丙烯酰胺和BAC共聚成交联聚合物网络或水凝胶。

在汇合点110处第二流体流116与第一流体流112接触后，在液滴形成期间，TEMED可以从第二流体116扩散到包含线性聚丙烯酰胺的含水流体112中，这将活化液滴118、120内的聚丙烯酰胺的交联，导致以夹带细胞114的固体或半固体珠粒或颗粒的形式的凝胶(例如，水凝胶)微胶囊的形成。尽管描述了聚丙烯酰胺包封，但是其他“可活化的”包封组合物也可以用于本文所述的方法和组合物的上下文中。例如，形成藻酸盐液滴，然后暴露于二价金属离子(例如，Ca²⁺离子)，可以用作使用所述方法的包封方法。同样地，琼脂糖液滴也可以通过基于温度的胶凝(例如，在冷却后等)转化成胶囊。

在一些情况下，包封的生物颗粒可以选择性地从微胶囊中释放，例如通过时间的推移或在施加特定刺激后，所述刺激使微胶囊充分降解以允许生物颗粒(例如，细胞)或其其他内容物从微胶囊中释放，例如进入分配区(例如，液滴)。例如，就上述聚丙烯酰胺聚合物而言，微胶囊的降解可以通过引入适当的还原剂如DTT等以裂解交联聚合物基体的二硫键来完成。参见，例如，美国专利申请公布2014/0378345，所述申请出于所有目的以引用方式全文并入本文。

可以使生物颗粒经受足以聚合或胶凝前体的其他条件。足以聚合或胶凝前体的条件可包括暴露于加热、冷却、电磁辐射和/或光。足以聚合或胶凝前体的条件可包括足以聚合或胶凝前体的任何条件。在聚合或胶凝之后，可以在生物颗粒周围形成聚合物或凝胶。聚合物或凝胶可扩散地渗透到化学或生物化学试剂中。聚合物或凝胶不可扩散地渗透到生物颗粒的大分子组分中。以这种方式，聚合物或凝胶可以起允许生物颗粒经受化学或生物化学操作，同时在空间上将大分子组分限制在由聚合物或凝胶限定的液滴区域的作用。聚合物或凝胶可包括二硫键交联的聚丙烯酰胺、琼脂糖、藻酸盐、聚乙烯醇、聚乙二醇(PEG)-二丙烯酸酯、PEG-丙烯酸酯、PEG-硫醇、PEG-叠氮化物、PEG-炔烃、其他丙烯酸酯、壳聚糖、透明质酸、胶原蛋白、纤维蛋白、明胶或弹性蛋白中的一种或多种。聚合物或凝胶可包含任何其他聚合物或凝胶。

可以将聚合物或凝胶官能化以结合目标分析物，例如核酸、蛋白质、碳水化合物、脂质或其他分析物。聚合物或凝胶可以通过被动机制聚合或胶凝。聚合物或凝胶可以在碱性条件下或在升高的温度下是稳定的。聚合物或凝胶可具有与珠粒的机械性质类似的机械性质。例如，聚合物或凝胶可具有与珠粒类似的尺寸。聚合物或凝胶可具有与珠粒类似的机械强度(例如拉伸强度)。聚合物或凝胶的密度可以低于油。聚合物或凝胶的密度可以与缓冲液的密度大致类似。聚合物或凝胶可具有可调的孔径。可以选择孔径以例如保留变性的核酸。可以选择孔径以保持对外源性化学物质如氢氧化钠(NaOH)和/或内源性化学物质如抑制剂的扩散渗透性。聚合物或凝胶可以是生物相容的。聚合物或凝胶可以保持或增强细胞活力。聚合物或凝胶可以是生物化学相容的。聚合物或凝胶可以以热、化学、酶促和/或光的方式聚合和/或解聚。

聚合物可包含与二硫键交联的聚(丙烯酰胺-共-丙烯酸)。聚合物的制备可包括两步反应。在第一活化步骤中，可以将聚(丙烯酰胺-共-丙烯酸)暴露于酰化剂以将羧酸转化为酯。例如，可以将聚(丙烯酰胺-共-丙烯酸)暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉氯化物(DMTMM)。可以将聚丙烯酰胺-共-丙烯酸暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉的其他盐。在第二交联步骤中，可以将在第一步中形成的酯暴露于二硫化物交联剂。例如，可以将酯暴露于胱胺(2,2'-二硫代双(乙胺))。在这两个步骤之后，生物颗粒可以被通过二硫桥连接在一起的聚丙烯酰胺链包围。以这种方式，生物颗粒可以被包裹在凝胶或基体(例如，聚合物基体)内部或包含凝胶或基体以形成“细胞珠”。细胞珠可以包含生物颗粒(例如，细胞)或生物颗粒的大分子组分(例如，RNA、DNA、蛋白质等)。细胞珠可包括单个细胞或多个细胞，或单个细胞或多个细胞的衍生物。例如，在裂解和洗涤细胞后，可以从细胞裂解物中洗去抑制成分，并且可以将大分子组分结合为细胞珠。本文公开的***和方法可适用于含有生物颗粒的细胞珠(和/或液滴或其他分配区)和含有生物颗粒的大分子组分的细胞珠(和/或液滴或其他分配区)。

与基于液滴分配的生物颗粒相比，包封的生物颗粒可以提供更易储存和更便携的某些潜在优点。此外，在一些情况下，希望允许生物颗粒在分析之前温育一段选定时间，例如以便表征在存在或不存在不同刺激的情况下此类生物颗粒随时间的变化。在此类情况下，与在乳液液滴中分配相比，包封可以允许更长时间的温育，但是在一些情况下，液滴分配的生物颗粒也可以温育不同的时间段，例如，至少10秒、至少30秒、至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少5小时、或至少10小时或更长时间。生物颗粒的包封可以构成生物颗粒的分配，其他试剂在其中共分配。可替代地或另外地，包封的生物颗粒可以轻易地沉积到如上所述的其他分配区(例如，液滴)中。

珠粒

分配区可包含一个或多个唯一标识符，如条形码。条形码可预先、随后或同时递送到保持一个或多个分室化或分配生物颗粒的分配区。例如，可以在液滴产生之前、之后或同时将条形码注射到液滴中。将条形码递送到特定分配区允许稍后将单独生物颗粒的特征归属于特定分配区。条形码可通过任何合适的机制在例如核酸分子(例如，寡核苷酸)上递送至分配区。条形码化核酸分子可以通过微胶囊递送至分配区。在一些情况下，微胶囊可包含珠粒。珠粒在本文其他地方进一步详细描述。

在一些情况下，条形码化核酸分子可以最初与微胶囊缔合，然后从微胶囊释放。条形码化核酸分子的释放可以是被动的(例如，通过从微胶囊中扩散出来)。另外地或可替代地，从微胶囊中的释放可以在施加允许条形码化核酸分子从微胶囊中解离或释放的刺激后发生。这种刺激可破坏微胶囊，是将条形码化核酸分子与微胶囊偶合或在微胶囊内偶合的相互作用，或两者。这种刺激可以包括，例如，热刺激、光刺激、化学刺激(例如，pH的变化或使用一种或多种还原剂)、机械刺激、辐射刺激；生物刺激(例如酶)或其任何组合。

图2示出用于将携带条形码的珠粒递送至液滴的微流体通道结构200的实例。通道结构200可包括在通道汇合点210处连通的通道区段201、202、204、206和208。在操作中，通道区段201可将包含多个珠粒214(例如，具有核酸分子、寡核苷酸、分子标签)的含水流体212沿着通道区段201输送到汇合点210处。多个珠粒214可以源自珠粒的悬浮液。例如，通道区段201可以连接到包含珠粒214的含水悬浮液的贮存器。通道区段202可以将包括多个生物颗粒216的含水流体212沿着通道区段202输送到汇合点210。多个生物颗粒216可以源自生物颗粒的悬浮液。例如，通道区段202可以连接到包含生物颗粒216的含水悬浮液的贮存器。在一些情况下，第一通道区段201或第二通道区段202中或两个区段中的含水流体212可以包括一种或多种试剂，如下面进一步描述的。与含水流体212不混溶的第二流体218(例如，油)可以从通道区段204和206中的每一个被递送到汇合点210。在来自通道区段201和202中的每一个的含水流体212与来自通道区段204和206中的每一个的第二流体218在通道汇合点210处相遇后，含水流体212可以在第二流体218中以离散液滴220的形式被分配并且沿着通道区段208从汇合点210流出。通道区段208可以将离散液滴递送到流体联接到通道区段208的出口贮存器，在所述贮存器中将它们加以收集。

作为替代方案，通道区段201和202可以在汇合点210的上游的另一个汇合点处相遇。在这样的汇合点处，珠粒和生物颗粒可以形成混合物，所述混合物沿着另一个通道被引导到汇合点210以产生液滴220。所述混合物可以以交替的方式提供珠粒和生物颗粒，使得例如液滴包含单个珠粒和单个生物颗粒。

珠粒、生物颗粒和液滴可以基本上常规的流动模式(例如，以常规流速)沿着通道流动。此类常规的流动模式可允许液滴包括单个珠粒和单个生物颗粒。此类常规的流动模式可以允许液滴具有大于5％、10％、20％、30％、40％、50％、60％、70％、80％、90％或95％的占据率(例如，具有珠粒和生物颗粒的液滴)。在例如美国专利公布2015/0292988中提供了此类常规流动模式和可用于提供此类常规流动模式的装置，所述专利以引用方式全文并入本文。

第二流体218可包含油，例如氟化油，其包括用于稳定所得液滴(例如，抑制所得液滴220的后续聚结)的含氟表面活性剂。

产生的离散液滴可包括单独的生物颗粒216。产生的离散液滴可包括携带条形码或其他试剂的珠粒214。产生的离散液滴可包括单个生物颗粒和携带条形码的珠粒，如液滴220。在一些情况下，离散液滴可以包括多于一个单独的生物颗粒或不包括生物颗粒。在一些情况下，离散液滴可包括多于一个珠粒或不包括珠粒。离散液滴可能未被占据(例如，没有珠粒、没有生物颗粒)。

有利地，分配生物颗粒和携带条形码的珠粒的离散液滴可以有效地允许将条形码归属于分配区内的生物颗粒的大分子组分。分配区的内容物可保持与其他分配区的内容物离散。

如将理解的，本文描述的通道区段可以联接到多种不同流体源或接收部件中的任一个，包括其他***的贮存器、管道、歧管或流体部件。如将理解的，微流体通道结构200可具有其他几何形状。例如，微流体通道结构可具有多于一个通道汇合点。例如，微流体通道结构可以具有2、3、4或5个通道区段，每个通道区段携带在通道汇合点处相遇的珠粒。可以通过一个或多个流体流动单元引导流体沿着一个或多个通道或贮存器流动。流体流动单元可包括压缩机(例如，提供正压)、泵(例如，提供负压)、致动器等以控制流体的流动。还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。

珠粒可以是多孔的、无孔的、固体的、半固体的、半流体的、流体的和/或其组合。在一些情况下，珠粒可以是可溶解的、可破坏的和/或可降解的。在一些情况下，珠粒可以是不可降解的。在一些情况下，珠粒可以是凝胶珠粒。凝胶珠粒可以是水凝胶珠粒。凝胶珠粒可以由分子前体形成，例如聚合物或单体物质。半固体珠粒可以是脂质体珠粒。固体珠粒可包含金属，包括氧化铁、金和银。在一些情况下，珠粒可以是二氧化硅珠粒。在一些情况下，珠粒可以是刚性的。在其他情况下，珠粒可以是柔性的和/或可压缩的。

珠粒可具有任何合适的形状。珠粒形状的实例包括但不限于球形、非球形、椭圆形、长圆形、无定形、圆形、圆柱形及其变型形式。

珠粒可具有均匀尺寸或不均匀尺寸。在一些情况下，珠粒的直径可为至少约1微米(μm)、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更大。在一些情况下，珠粒的直径可小于约1μm、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更小。在一些情况下，珠粒的直径可以在约40-75μm、30-75μm、20-75μm、40-85μm、40-95μm、20-100μm、10-100μm、1-100μm、20-250μm、或20-500μm的范围内。

在某些方面中，珠粒可以以具有相对单分散尺寸分布的珠粒群体或多个珠粒提供。在需要在分配区内提供相对一致量的试剂的情况下，保持相对一致的珠粒特征(如尺寸)可有助于总体一致性。特别地，本文所述的珠粒可具有其横截面尺寸的变异系数小于50％、小于40％、小于30％、小于20％，并且在一些情况下小于15％、小于10％、小于5％或更小的尺寸分布。

珠粒可包含天然和/或合成材料。例如，珠粒可包含天然聚合物、合成聚合物或天然和合成聚合物。天然聚合物的实例包括蛋白质和糖，例如脱氧核糖核酸、橡胶、纤维素、淀粉(例如，直链淀粉、支链淀粉)、蛋白质、酶、多糖、丝、聚羟基链烷酸酯、壳聚糖、葡聚糖、胶原、角叉菜胶、卵叶车前子、***胶、琼脂、明胶、虫胶、梧桐树胶、黄原胶、玉米糖胶、瓜尔胶、刺梧桐树胶、琼脂糖、海藻酸、藻酸盐或其天然聚合物。合成聚合物的实例包括丙烯酸类、尼龙、硅氧烷、氨纶、粘胶人造丝、多元羧酸、聚乙酸乙烯酯、聚丙烯酰胺、聚丙烯酸酯、聚乙二醇、聚氨酯、聚乳酸、二氧化硅、聚苯乙烯、聚丙烯腈、聚丁二烯、聚碳酸酯、聚乙烯、聚对苯二甲酸乙二醇酯、聚(三氟氯乙烯)、聚(环氧乙烷)、聚(对苯二甲酸乙二醇酯)、聚乙烯、聚异丁烯、聚(甲基丙烯酸甲酯)、聚(甲醛)、聚甲醛、聚丙烯、聚苯乙烯、聚(四氟乙烯)、聚(乙酸乙烯酯)、聚(乙烯醇)、聚(氯乙烯)、聚(偏二氯乙烯)、聚(偏二氟乙烯)、聚(氟乙烯)和/或其组合(例如，共聚物)。珠粒也可以由除聚合物之外的材料形成，包括脂质、胶束、陶瓷、玻璃陶瓷、材料复合物、金属、其他无机材料等。

在一些情况下，珠粒可含有分子前体(例如，单体或聚合物)，其可通过分子前体的聚合形成聚合物网络。在一些情况下，前体可以是已经聚合的物质，其能够通过例如化学交联进行进一步聚合。在一些情况下，前体可包含丙烯酰胺或甲基丙烯酰胺单体、低聚物或聚合物中的一种或多种。在一些情况下，珠粒可包含预聚物，其是能够进一步聚合的低聚物。例如，可以使用预聚物制备聚氨酯珠粒。在一些情况下，珠粒可含有可进一步聚合在一起的单个聚合物。在一些情况下，可以通过不同前体的聚合生成珠粒，使得它们包含混合聚合物、共聚物和/或嵌段共聚物。在一些情况下，珠粒可在聚合物前体(例如，单体、低聚物、线性聚合物)、核酸分子(例如，寡核苷酸)、引物和其他实体之间包含共价键或离子键。在一些情况下，共价键可以是碳-碳键或硫醚键。

交联可以是永久的或可逆的，这取决于所用的特定交联剂。可逆交联可允许聚合物在适当条件下线性化或解离。在一些情况下，可逆交联还可以允许结合至珠粒表面的材料的可逆附接。在一些情况下，交联剂可形成二硫键。在一些情况下，形成二硫键的化学交联剂可以是胱胺或改性胱胺。

在一些情况下，二硫键可以在掺入珠粒的分子前体单元(例如，单体、低聚物或线性聚合物)或前体与核酸分子(例如，寡核苷酸)之间形成。例如，胱胺(包括改性胱胺)是包含二硫键的有机试剂，其可以用作珠粒的单个单体或聚合物前体之间的交联剂。聚丙烯酰胺可以在胱胺或包含胱胺的物质(例如，改性胱胺)的存在下聚合，以生成包含二硫键的聚丙烯酰胺凝胶珠粒(例如，包含可化学还原交联剂的可化学降解珠粒)。二硫键可以使珠粒在珠粒暴露于还原剂后被降解(或溶解)。

在一些情况下，壳聚糖(线性多糖聚合物)可以通过亲水链与戊二醛交联以形成珠粒。壳聚糖聚合物的交联可以通过由热、压力、pH变化和/或辐射引发的化学反应来实现。

在一些情况下，珠粒可包含acrydite部分，其在某些方面可用于将一个或多个核酸分子(例如，条形码序列、条形码化核酸分子、条形码化寡核苷酸、引物或其他寡核苷酸)附接于珠粒。在一些情况下，丙烯酰胺亚磷酰胺部分可以指由丙烯酰胺亚磷酰胺与一种或多种物质反应例如丙烯酰胺亚磷酰胺与其他单体和交联剂在聚合反应期间的反应所生成的丙烯酰胺亚磷酰胺类似物。可以修饰Acrydite部分以与待附接的物质形成化学键，例如核酸分子(例如条形码序列、条形码化核酸分子、条形码化寡核苷酸、引物或其他寡核苷酸)。丙烯酰胺亚磷酰胺部分可以用能够形成二硫键的硫醇基团修饰，或者可以用已经包含二硫键的基团修饰。硫醇或二硫化物(通过二硫化物交换)可以用作待附接的物质的锚点，或者丙烯酰胺亚磷酰胺部分的另一部分可以用于附接。在一些情况下，附接可以是可逆的，使得当二硫键断裂时(例如，在还原剂存在下)，附接的物质从珠粒中释放出来。在其他情况下，acrydite部分可包含可用于附接的反应性羟基。

用于附接核酸分子(例如，寡核苷酸)的珠粒的官能化可以通过多种不同方法实现，包括活化聚合物内的化学基团、将活性或可活化的官能团掺入聚合物结构中或者在珠粒生产中的预聚物或单体阶段进行附接。

例如，聚合形成珠粒的前体(例如，单体，交联剂)可包含丙烯酰胺亚磷酰胺部分，使得当生成珠粒时，珠粒还包含丙烯酰胺亚磷酰胺部分。所述acrydite部分可以附接于核酸分子(例如，寡核苷酸)，其可以包括引发序列(例如，用于扩增靶核酸的引物、随机引物(例如，随机N聚体)、用于信使RNA的引物序列(例如，polyT序列))和/或一个或多个条形码序列。一个或多个条形码序列可包括对于与给定珠粒偶合的所有核酸分子相同的序列和/或对于与给定珠粒偶合的所有核酸分子不同的序列。核酸分子可被掺入珠粒中。

在一些情况下，核酸分子可以包含例如用于附接于测序流动池的功能序列，例如用于

测序的P5序列。在一些情况下，核酸分子或其衍生物(例如，由核酸分子产生的寡核苷酸或多核苷酸)可以包含另一种功能序列，例如像用于附接于测序流动池以用于Illumina测序的P7序列。在一些情况下，核酸分子可包含条形码序列。在一些情况下，引物还可包含唯一分子标识符(UMI)。在一些情况下，引物可包含用于Illumina测序的R1引物序列。在一些情况下，引物可包含用于Illumina测序的R2引物序列。可以与本公开的组合物、装置、方法和***一起使用的此类核酸分子(例如，寡核苷酸、多核苷酸等)及其用途的实例提供于美国专利公布2014/0378345和2015/0376609中，所述专利各自以引用方式全文并入本文。

在一些情况下，包含具有反应性或能够被活化以使得变得具有反应性的官能团的前体可以与其他前体聚合以生成包含活化或可活化官能团的凝胶珠粒。然后官能团可以用于将另外的物质(例如，二硫化合物接头、引物、其他寡核苷酸等)附接于凝胶珠粒。例如，包含羧酸(COOH)基团的一些前体可与其他前体共聚合以形成也包含COOH官能团的凝胶珠粒。在一些情况下，丙烯酸(包含游离COOH基团的物质)、丙烯酰胺和双(丙烯酰基)胱胺可以共聚合在一起以生成包含游离COOH基团的凝胶珠粒。可以将凝胶珠粒的COOH基团活化(例如，通过1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉氯化物(DMTMM))使得它们具有反应性(例如，具有与胺官能团的反应性，其中EDC/NHS或DMTMM用于活化)。然后，活化的COOH基团可以与适当的物质(例如，包含胺官能团的物质，其中羧酸基团被活化以具有与胺官能团的反应性)反应，所述物质包含与珠粒连接的部分。

在聚合物网络中包含二硫键的珠粒可以通过将一些二硫键还原成游离硫醇来用另外的物质官能化。二硫键可以通过例如还原剂(例如DTT，TCEP等)的作用被还原，以生成游离硫醇基团，而不会溶解珠粒。然后，珠粒的游离硫醇可以与物质的游离硫醇或包含另一个二硫键的物质(例如，通过硫醇-二硫化物交换)反应，使得物质可以与珠粒连接(例如，通过生成的二硫键)。在一些情况下，珠粒的游离硫醇可与任何其他合适的基团反应。例如，珠粒的游离硫醇可与包含丙烯酰胺亚磷酰胺部分的物质反应。珠粒的游离硫醇基团可通过迈克尔加成化学与丙烯酰胺亚磷酰胺反应，使得包含丙烯酰胺亚磷酰胺的物质与珠粒连接。在一些情况下，可以通过包含硫醇加帽剂如N-乙基马来酰胺或碘乙酸酯来防止不受控制的反应。

可以控制珠粒内二硫键的活化，使得仅少量二硫键被活化。例如，可以通过控制用于生成游离硫醇基团的还原剂的浓度和/或用于在珠粒聚合中形成二硫键的试剂的浓度来进行控制。在一些情况下，低浓度(例如，还原剂分子:凝胶珠粒比率小于或等于约1:100,000,000,000、小于或等于约1:10,000,000,000、小于或等于约1:1,000,000,000、小于或等于约1:100,000,000、小于或等于约1:10,000,000、小于或等于约1:1,000,000、小于或等于约1:100,000、小于或等于约1:10,000)还原剂可用于还原。控制还原成游离硫醇的二硫键的数量可用于确保官能化期间的珠粒结构完整性。在一些情况下，光学活性剂(例如荧光染料)可以通过珠粒的游离硫醇基团与珠粒偶合，并用于定量珠粒中存在的游离硫醇的数量和/或追踪珠粒。

在一些情况下，在凝胶珠粒形成之后向凝胶珠粒中添加各部分可能是有利的。例如，在凝胶珠粒形成之后添加寡核苷酸(例如，条形码化寡核苷酸)可以避免在聚合期间可能发生的链转移终止期间物质的损失。此外，较小的前体(例如，不包含侧链基团和连接部分的单体或交联剂)可以用于聚合，并且由于粘性效应而可以最小程度地阻碍链末端生长。在一些情况下，在凝胶珠粒合成之后的官能化可以在潜在的破坏剂(例如，自由基)和/或化学环境的情况下使待负载的物质(例如，寡核苷酸)的暴露最小化。在一些情况下，所生成的凝胶可具有上限临界溶液温度(UCST)，其可允许温度驱动的珠粒溶胀和塌陷。在随后用寡核苷酸官能化珠粒期间，这种官能团可有助于寡核苷酸(例如，引物)渗入珠粒中。产生后官能化也可用于控制珠粒中物质的负载比率，使得例如负载比率的可变性最小化。物质负载也可以在分批过程中进行，使得多个珠粒可以在单批次中用物质官能化。

注射或以其他方式引入到分配区中的珠粒可包括可释放、可裂解或可逆附接的条形码。注射或以其他方式引入到分配区中的珠粒可包括可活化的条形码。注射或以其他方式引入到分配区中的珠粒可以是可降解的、可破裂的或可溶解的珠粒。

条形码可以可释放地、可裂解地或可逆地附接到珠粒，使得条形码可以通过裂解条形码分子与珠粒之间的连接而释放或为可释放的，或者通过下面的珠粒自身的降解释放，从而允许条形码被其他试剂接近或可被其他试剂接近，或两者兼而有之。在非限制性实例中，可以通过还原二硫键、使用限制酶、光活化裂解或通过其他类型的刺激(例如，化学、热、pH、酶等)和/或反应进行裂解来实现，例如本文其他地方所述。可释放的条形码有时可被称为可活化的，因为它们一旦释放就可用于反应。因此，例如，可通过从珠粒(或本文所述的其他合适类型的分配区)释放条形码来活化可活化的条形码。在所描述的方法和***的上下文中还设想了其他可活化配置。

除了珠粒与缔合分子(例如含有条形码的核酸分子(例如条形码化寡核苷酸))之间的可裂解键之外或作为其替代，珠粒可以在自发地或在暴露于一种或多种刺激(例如，温度变化、pH变化、暴露于特定化学物质或相、暴露于光、还原剂等)后为可降解、可破坏或可溶解的。在一些情况下，珠粒可以是可溶解的，使得珠粒的材料组分在暴露于特定化学物质或环境变化(例如变化温度或pH变化)时溶解。在一些情况下，凝胶珠粒可以在升高的温度和/或碱性条件下降解或溶解。在一些情况下，珠粒可以是可热降解的，使得当珠粒暴露于适当的温度变化(例如，加热)时，珠粒降解。与物质(例如，核酸分子，例如条形码化寡核苷酸)结合的珠粒的降解或溶解可导致物质从珠粒中释放。

从以上公开内容可以理解，珠粒的降解可以指在使物理珠粒本身的结构发生和不发生降解的情况下结合或夹带的物质从珠粒中解离。例如，珠粒的降解可以涉及通过本文其他地方描述的一种或多种物质和/或方法裂解可裂解键。在另一个实例中，可以通过例如由改变化学环境引起的渗透压差从珠粒中释放夹带的物质。举例来说，由渗透压差引起的珠粒孔径的改变通常可以在珠粒本身的结构没有降解的情况下发生。在一些情况下，由珠粒的渗透溶胀引起的孔径增加可以允许珠粒内的夹带物质的释放。在其他情况下，由于孔径收缩，珠粒的渗透收缩可能使珠粒更好地保留夹带物质。

可以将可降解的珠粒引入到分配区(例如乳液中的液滴或孔)中，使得珠粒在分配区内降解，并且当施加适当的刺激时，任何缔合的物质(例如，寡核苷酸)在液滴内释放。游离物质(例如，寡核苷酸、核酸分子)可以与分配区中包含的其他试剂相互作用。例如，包含胱胺并通过二硫键与条形码序列连接的聚丙烯酰胺珠粒可以与油包水乳液的液滴中的还原剂组合。在液滴内，还原剂可以破坏各种二硫键，导致珠粒降解并将条形码序列释放到液滴的含水内部环境中。在另一个实例中，加热在碱性溶液中包含结合珠粒的条形码序列的液滴也可导致珠粒降解并将附接的条形码序列释放到液滴的含水内部环境中。

任何合适数量的分子标签分子(例如，引物、条形码化寡核苷酸)可以与珠粒缔合，使得在从珠粒中释放后，分子标签分子(例如，引物，例如，条形码化寡核苷酸)以预先定义的浓度存在于分配区中。可以选择这种预定义浓度以促进用于在分配区内生成测序文库的某些反应(例如核酸延伸)。在一些情况下，引物的预先定义的浓度可以通过产生携带核酸分子(例如，寡核苷酸)的珠粒的过程来限制。

在一些情况下，珠粒可以非共价地负载有一种或多种试剂。珠粒可以通过例如使珠粒经受足以使珠粒溶胀的条件，使试剂有足够的时间扩散到珠粒的内部，并使珠粒经受足以使珠粒去溶胀的条件来非共价负载。例如，可以通过将珠粒置于热力学上有利的溶剂中，使珠粒经受较高或较低的温度，使珠粒经受较高或较低的离子浓度，和/或使珠粒经受电场来实现珠粒的溶胀。珠粒的溶胀可以通过各种溶胀方法来实现。珠粒的去溶胀可以通过例如将珠粒转移到热力学上不利的溶剂中，使珠粒经受较低或较高温度，使珠粒经受较低或较高的离子浓度，和/或除去电场来实现。珠粒的去溶胀可以通过各种去溶胀方法来实现。转移珠粒可能导致珠粒中的孔收缩。然后收缩可能阻碍珠粒内的试剂从珠粒的内部扩散出来。阻碍可能是由于试剂与珠粒内部之间的空间相互作用。转移可以以微流体方式完成。例如，转移可以通过将珠粒从一种共流动的溶剂流移动到不同的共流动的溶剂流中来实现。珠粒的溶胀性和/或孔径可通过改变珠粒的聚合物组成来调节。

在一些情况下，与前体连接的acrydite部分、与前体连接的另一种物质或前体本身可包含不稳定键，例如化学、热或光敏感键，例如二硫键、UV敏感键等。一旦丙烯酰胺亚磷酰胺部分或包含不稳定键的其他部分被掺入珠粒中，珠粒也可包含不稳定键。例如，不稳定键可用于将物质(例如，条形码、引物等)可逆地连接(例如，共价连接)到珠粒。在一些情况下，例如，在寡核苷酸与附接于珠粒的互补序列杂交时，热不稳定键可包括基于核酸杂交的附接，使得杂合体的热解链将寡核苷酸(例如含有条形码的序列)从珠粒或微胶囊释放。

向凝胶珠粒中添加多种类型的不稳定键可导致生成能够对不同刺激有反应的珠粒。每种类型的不稳定键可能对相关联的刺激(例如，化学刺激、光、温度、酶等)敏感，使得通过每个不稳定键附接到珠粒上的物质的释放可以通过施加适当的刺激来控制。这种官能团可用于从凝胶珠粒受控地释放物质。在一些情况下，包含不稳定键的另一物质可以在凝胶珠粒形成之后通过例如如上所述的凝胶珠粒的活化官能团与凝胶珠粒连接。如应当理解的，可释放地、可裂解地或可逆地附接到本文所述的珠粒的条形码包括通过条形码分子与珠粒之间的键联的裂解来释放或可释放的条形码，或通过下面的珠粒本身的降解来释放的条形码，允许条形码被其他试剂接近或可被其他试剂接近，或两者兼而有之。

如本文所述可释放的条形码有时可被称为可活化的，因为它们一旦释放就可用于反应。因此，例如，可通过从珠粒(或本文所述的其他合适类型的分配区)释放条形码来活化可活化的条形码。在所描述的方法和***的上下文中还设想了其他可活化配置。

除了可热裂解的键、二硫键和UV敏感键之外，可以与前体或珠粒偶合的不稳定键的其他非限制性实例包括酯键(例如，可用酸、碱或羟胺裂解)、邻位二醇键(例如，可通过高碘酸钠裂解)、狄尔斯-阿尔德(Diels-Alder)键(例如，可通过热裂解)、砜键(例如，可通过碱裂解)、甲硅烷基醚键(例如，可通过酸裂解)、糖苷键(例如，可通过淀粉酶裂解)、肽键(例如，可通过蛋白酶裂解)或磷酸二酯键(例如，可通过核酸酶(例如，DNA酶)裂解))。键可以通过其他核酸分子靶向酶裂解，例如限制酶(例如限制性内切核酸酶)，如下文进一步描述的。

在珠粒产生期间(例如，在前体聚合期间)，可以将物质包封在珠粒中。此类物质可能参与或可能不参与聚合。此类物质可以进入聚合反应混合物中，使得生成的珠粒在珠粒形成后包含各物质。在一些情况下，可在形成之后将此类物质加入凝胶珠粒中。此类物质可包括，例如，核酸分子(例如，寡核苷酸)、用于核酸连接、延伸或扩增反应的试剂(例如，引物、聚合酶、dNTP、辅因子(例如，离子辅因子)、缓冲液)包括文中所述的那些、用于酶促反应的试剂(例如，酶、辅因子、底物、缓冲液)、用于核酸修饰反应的试剂(例如聚合、连接或消化)和/或用于一种或多种测序平台的模板制备(例如，标记)的试剂(例如，用于

的

)。此类物质可包括本文所述的一种或多种酶，包括但不限于聚合酶、逆转录酶、限制性酶(例如，内切核酸酶)、转座酶、连接酶、蛋白酶K、DNA酶等。此类物质可包括本文其他地方所述的一种或多种试剂(例如，裂解剂、抑制剂、失活剂、螯合剂、刺激)。此类物质的捕集可以通过在前体的聚合期间生成的聚合物网络密度、凝胶珠粒内离子电荷的控制(例如，通过与聚合物质连接的离子物质)或通过其他物质的释放来控制。可以在珠粒降解后和/或通过施加能够从珠粒释放物质的刺激从珠粒释放包封的物质。可替代地或另外地，物质可在分配区形成期间或之后在分配区(例如，液滴)中分配。此类物质可包括但不限于也可包封在珠粒中的上述物质。

可降解珠粒可包含一种或多种具有不稳定键的物质，使得当珠粒/物质暴露于适当的刺激时，键断裂并且珠粒降解。不稳定键可以是化学键(例如，共价键、离子键)或可以是另一种类型的物理相互作用(例如，范德华相互作用、偶极-偶极相互作用等)。在一些情况下，用于产生珠粒的交联剂可包含不稳定键。在暴露于适当的条件后，不稳定键可以断裂并且珠粒降解。例如，当将包含胱胺交联剂的聚丙烯酰胺凝胶珠粒暴露于还原剂后，胱胺的二硫键可以断裂并且珠粒降解。

与不降解的珠粒相比，当将适当的刺激施加到珠粒上时，可降解的珠粒可用于更快地从珠粒释放附接的物质(例如，核酸分子、条形码序列、引物等)。例如，对于与多孔珠粒的内表面结合的物质或在包封物质的情况下，该物质在珠粒降解后可具有较大迁移率并且可被溶液中的其他物质接近。在一些情况下，物质也可以通过可降解的接头(例如，二硫化物接头)附接于可降解的珠粒。可降解的接头可以对与可降解珠粒相同的刺激有反应，或者两种可降解物质可以对不同的刺激有反应。例如，条形码序列可以通过二硫键附接到包含胱胺的聚丙烯酰胺珠粒上。在条形码化珠粒暴露于还原剂后，珠粒降解并且条形码序列在条形码序列与珠粒之间的二硫键断裂以及珠粒中胱胺的二硫键断裂后释放。

从以上公开内容可以理解，虽然被称为珠粒的降解，但在如上所述的许多情况下，所述降解可以指在使物理珠粒本身的结构发生和不发生降解的情况下结合或夹带的物质从珠粒中解离。例如，可以通过例如由改变化学环境引起的渗透压差从珠粒中释放夹带的物质。举例来说，由渗透压差引起的珠粒孔径的改变通常可以在珠粒本身的结构没有降解的情况下发生。在一些情况下，由珠粒的渗透溶胀引起的孔径增加可以允许珠粒内的夹带物质的释放。在其他情况下，由于孔径收缩，珠粒的渗透收缩可能使珠粒更好地保留夹带物质。

在提供可降解珠粒的情况下，避免将此类珠粒在给定时间之前暴露于引起这种降解的一个或多个刺激可能是有益的，以便例如避免过早的珠粒降解和由这种降解引起的问题，包括例如不良的流动特性和聚集。举例来说，在珠粒包含可还原的交联基团例如二硫化物基团的情况下，希望避免使此类珠粒与还原剂例如DTT或其他二硫化物裂解试剂接触。在此类情况下，对本文所述珠粒的处理将在一些情况下不提供还原剂，例如DTT。因为还原剂通常在商业酶制剂中提供，所以可能需要在处理本文所述的珠粒时提供不含还原剂(或不含DTT)的酶制剂。此类酶的实例包括例如聚合酶制剂、逆转录酶制剂、连接酶制剂、以及可用于处理本文所述珠粒的许多其他酶制剂。术语“不含还原剂”或“不含DTT”的制剂可以指对于用于降解这些珠粒的此类材料而言具有小于约1/10、小于约1/50、或甚至小于约1/100的较低范围的制剂。例如，对于DTT，不含还原剂的制剂可具有小于约0.01毫摩尔(mM)、0.005mM、0.001mM DTT、0.0005mM DTT、或甚至小于约0.0001mM DTT。在许多情况下，DTT的量可能无法检测到。

可以使用许多化学触发剂来触发珠粒的降解。这些化学变化的实例可包括但不限于pH介导的珠粒内组分完整性的改变、通过交联键的裂解的珠粒组分的降解以及珠粒组分的解聚。

在一些实施方案中，珠粒可以由包含可降解的化学交联剂(例如BAC或胱胺)的材料形成。此类可降解交联剂的降解可通过许多机制完成。在一些实施例中，可以将珠粒与化学降解剂接触，所述化学降解剂可以诱导氧化、还原或其他化学变化。例如，化学降解剂可以是还原剂，例如二硫苏糖醇(DTT)。还原剂的其他实例可包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可降解在形成珠粒的凝胶前体之间形成的二硫键，并且因此降解珠粒。在其他情况下，溶液的pH变化(例如pH增加)可触发珠粒的降解。在其他情况下，暴露于水溶液(例如水)可触发水解降解，并且因此触发珠粒的降解。

在施加热刺激后，还可以诱导珠粒释放其内容物。温度的变化可导致珠粒的各种变化。例如，热可导致固体珠粒液化。热的变化可导致珠粒的熔化，使得珠粒的一部分降解。在其他情况下，热可增加珠粒组分的内压，使得珠粒破裂或***。热还可以作用于用作构建珠粒的材料的热敏聚合物。

任何合适的试剂可使珠粒降解。在一些实施方案中，温度或pH的变化可用于降解珠粒内的热敏性或pH敏感性键。在一些实施方案中，化学降解剂可用于通过氧化、还原或其他化学变化降解珠粒内的化学键。例如，化学降解剂可以是还原剂，例如DTT，其中DTT可以降解在交联剂与凝胶前体之间形成的二硫键，因此降解珠粒。在一些实施方案中，可以添加还原剂以使珠粒降解，所述还原剂可以使珠粒释放或不释放其内容物。还原剂的实例可包括二硫苏糖醇(DTT)、β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可以以约0.1mM、0.5mM、1mM、5mM、10mM的浓度存在。还原剂可以以至少约0.1mM、0.5mM、1mM、5mM、10mM或大于10mM的浓度存在。还原剂可以以至多约10mM、5mM、1mM、0.5mM、0.1mM或更低的浓度存在。

任何合适数量的分子标签分子(例如，引物、条形码化寡核苷酸)可以与珠粒缔合，使得在从珠粒中释放后，分子标签分子(例如，引物，例如，条形码化寡核苷酸)以预先定义的浓度存在于分配区中。可以选择这种预定义浓度以促进用于在分配区内生成测序文库的某些反应，例如，核酸延伸、扩增或连接。在一些情况下，引物的预先定义的浓度可以通过产生携带寡核苷酸的珠粒的过程来限制。

尽管以上已经就提供基本上单独占据的分配区描述了图1和图2，但在某些情况下，可能希望提供例如包含两个、三个、四个或更多个细胞的多占分配区和/或在单个分配区内包括条形码化核酸分子(例如，寡核苷酸)的微胶囊(例如珠粒)。因此，如上所述，可以控制含有生物颗粒和/或珠粒的流体和分配流体的流动特性，以提供这种多占分配区。特别地，可以控制流动参数以提供大于约50％、大于约75％、并且在一些情况下大于约80％、90％、95％或更高的分配区的给定占据率。

在一些情况下，可以使用另外的微胶囊以将额外的试剂递送到分配区。在这种情况下，从不同的珠粒源(例如，包含不同的缔合试剂)通过不同的通道入口进入公共通道或液滴产生汇合点(例如，汇合点210)将不同的珠粒引入这样的公共通道或液滴产生汇合点可能是有利的。在此类情况下，可以控制不同珠粒进入通道或汇合点的流动和频率，以提供来自每个源的一定比率的微胶囊，同时确保到分配区中的此类珠粒与给定数量的生物颗粒的给定配对或组合(例如，每个分配区一个生物颗粒和一个珠粒)。

本文所述的分配区可包括小体积，例如，小于约10微升(μL)、5μL、1μL、900皮升(pL)、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL、500纳升(nL)、100nL、50nL或更低。

例如，在基于液滴的分配区的情况下，液滴可具有小于约1000pL、900pL、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL或更少的总体积。在与微胶囊共分配的情况下，应当理解，分配区内的样品流体体积(例如包括共分配的生物颗粒和/或珠粒)可小于上述体积的约90％、小于约80％、小于约70％、小于约60％、小于约50％、小于约40％、小于约30％、小于约20％、或小于上述体积的约10％。

如本文其他地方所述，将物质分配可产生分配区群或多个分配区。在此类情况下，可以产生或以其他方式提供任何合适数量的分配区。例如，可以产生或以其他方式提供至少约1,000个分配区、至少约5,000个分配区、至少约10,000个分配区、至少约50,000个分配区、至少约100,000个分配区、至少约500,000个分配区、至少约1,000,000个分配区、至少约5,000,000个分配区、至少约10,000,000个分配区、至少约50,000,000个分配区、至少约100,000,000个分配区、至少约500,000,000个分配区、至少约1,000,000,000个分配区或更多分配区。此外，多个分配区可以包括未占据的分配区(例如，空分配区)和占据的分配区。

试剂

根据某些方面，生物颗粒可以连同裂解试剂一起分配，以释放分配区内的生物颗粒的内容物。在此类情况下，裂解剂可以在将生物颗粒例如通过通道汇合点上游的另外通道或多个通道引入分配汇合点/液滴产生区(例如，汇合点210)的同时或就在其之前与生物颗粒悬浮液接触。根据其他方面，另外地或可替代地，生物颗粒可以连同其他试剂一起分配，如下面将进一步描述的。

图3示出用于共分配生物颗粒和试剂的微流体通道结构300的实例。通道结构300可包括通道区段301、302、304、306和308。通道区段301和302在第一通道汇合点309处连通。通道区段302、304、306和308在第二通道汇合点310处连通。

在示例性操作中，通道区段301可以将包括多个生物颗粒314的含水流体312沿着通道区段301输送到第二汇合点310中。作为替代或除此之外，通道区段301可以运输珠粒(例如，凝胶珠粒)。珠粒可包含条形码分子。

例如，通道区段301可以连接到包括生物颗粒314的含水悬浮液的贮存器。在第二汇合点310的上游和就在达到其之前，通道区段301可以在第一汇合点309处与通道区段302相遇。通道区段302可以将悬浮在含水流体312中的多个试剂315(例如，裂解剂)沿着通道区段302输送到第一汇合点309中。例如，通道区段302可以连接到包含试剂315的贮存器。在第一汇合点309之后，通道区段301中的含水流体312可以将生物颗粒314和试剂315携带到第二汇合点310。在一些情况下，通道区段301中的含水流体312可包括一种或多种试剂，所述一种或多种试剂可以是与试剂315相同或不同的试剂。与含水流体312不混溶的第二流体316(例如，油)可从通道区段304和306中的每一个递送到第二汇合点310。在来自通道区段301的含水流体312与来自通道区段304和306中的每一个的第二流体316在第二通道汇合点310处相遇后，含水流体312可以在第二流体316中以离散液滴318的形式被分配并且沿着通道区段308从第二汇合点310流出。通道区段308可以将离散液滴318递送到流体联接到通道区段308的出口贮存器，在所述贮存器中将它们加以收集。

第二流体316可包含油，例如氟化油，其包括用于稳定所得液滴(例如，抑制所得液滴318的后续聚结)的含氟表面活性剂。

产生的离散液滴可以包括单独的生物颗粒314和/或一种或多种试剂315。在一些情况下，产生的离散液滴可以包括携带条形码的珠粒(未示出)，例如通过本文其他地方描述的其他微流体结构。在一些情况下，离散液滴可能未被占据(例如，没有试剂、没有生物颗粒)。

有利地，当裂解试剂和生物颗粒共分配时，裂解试剂可以促进分配区内生物颗粒的内容物的释放。分配区中释放的内容物可能保持与其他分配区的内容物离散。

如将理解的，本文描述的通道区段可以联接到多种不同流体源或接收部件中的任一个，包括其他***的贮存器、管道、歧管或流体部件。如将理解的，微流体通道结构300可具有其他几何形状。例如，微流体通道结构可具有多于两个通道汇合点。例如，微流体通道结构可以具有2、3、4、5个或更多个通道区段，每个通道区段携带在通道汇合点处相遇的相同或不同类型的珠粒、试剂和/或生物颗粒。可以控制每个通道区段中的流体流动以控制不同元素到液滴中的分配。可以通过一个或多个流体流动单元引导流体沿着一个或多个通道或贮存器流动。流体流动单元可包括压缩机(例如，提供正压)、泵(例如，提供负压)、致动器等以控制流体的流动。还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。

裂解剂的实例包括生物活性试剂，例如用于裂解不同细胞类型(例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等)的裂解酶，例如溶菌酶、无色肽酶、溶葡球菌素、labiase、kitalase、溶细胞酶和可从例如Sigma-Aldrich公司(St Louis,MO)购得的各种其他裂解酶、以及其他可商购的裂解酶。其他裂解剂可以另外地或可替代地与生物颗粒共分配以引起生物颗粒内容物释放到分配区中。例如，在一些情况下，基于表面活性剂的裂解溶液可用于裂解细胞，但是这些可能不太适用于基于乳液的***，在基于乳液的***中表面活性剂可干扰稳定的乳液。在一些情况下，裂解溶液可包括非离子表面活性剂，例如像TritonX-100和Tween 20。在一些情况下，裂解溶液可包括离子表面活性剂，例如像十二烷基肌氨酸钠和十二烷基硫酸钠(SDS)。在某些情况下，也可以使用电穿孔、热、声学或机械细胞破坏，例如，基于非乳液的分配区如生物颗粒的包封可以补充或代替液滴分配区，其中在细胞破坏后，包封物的任何孔径足够小以保留给定大小的核酸片段。

除了与上述生物颗粒共分配的裂解剂之外，其他试剂也可以与生物颗粒共分配，包括例如DNA酶和RNA酶灭活剂或抑制剂(例如蛋白酶K)、螯合剂(例如EDTA)和用于去除或以其他方式降低不同细胞裂解物组分对核酸后续处理的负面活性或影响的其他试剂。另外，就包封的生物颗粒而言，可以将生物颗粒暴露于适当的刺激以从共分配的微胶囊中释放生物颗粒或其内容物。例如，在一些情况下，化学刺激可以连同包封的生物颗粒一起共分配，以允许微胶囊的降解和细胞或其内容物向更大的分配区中的释放。在一些情况下，所述刺激可以与本文其他地方描述的用于从其各自的微胶囊(例如珠粒)中释放核酸分子(例如，寡核苷酸)的刺激相同。在替代方面中，这可以是不同的且不重叠的刺激，以允许包封的生物颗粒在与核酸分子释放到相同分配区中不同的时间释放到分配区中。

另外的试剂也可以与生物颗粒共分配，例如片段化生物颗粒的DNA的内切核酸酶、DNA聚合酶和用于扩增生物颗粒的核酸片段并将条形码分子标签附接到扩增片段的dNTP。其他酶可共分配，包括但不限于聚合酶、转座酶、连接酶、蛋白酶K、DNA酶等。另外的试剂还可以包括逆转录酶，包括具有末端转移酶活性的酶、引物和寡核苷酸、以及可以用于模板转换的转换寡核苷酸(在本文中也称为“转换oligo”或“模板转换寡核苷酸”)。在一些情况下，模板转换可用于增加cDNA的长度。在一些情况下，模板转换可用于将预定义的核酸序列附加到cDNA。在模板转换的实例中，cDNA可以从模板(例如细胞mRNA)的逆转录产生，其中具有末端转移酶活性的逆转录酶可以以模板非依赖性方式向cDNA添加另外的核苷酸，例如polyC。转换oligo可包括与另外的核苷酸(例如polyG)互补的序列。cDNA上的另外核苷酸(例如polyC)可以与转换oligo上的另外核苷酸(例如polyG)杂交，由此转换oligo可以被逆转录酶用作模板以进一步延伸cDNA。模板转换寡核苷酸可包含杂交区和模板区。杂交区可包含能够与靶杂交的任何序列。在一些情况下，如前所述，杂交区包含一系列G碱基以与cDNA分子3'末端的突出C碱基互补。所述系列G碱基可包含1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或多于5个G碱基。模板序列可包含任何掺入cDNA的序列。在一些情况下，模板区包含至少1个(例如，至少2、3、4、5个或更多个)标签序列和/或功能序列。转换oligo可包含脱氧核糖核酸；核糖核酸；修饰的核酸包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、反向dT、5-甲基dC、2'-脱氧肌苷、Super T(5-羟基丁炔-2'-脱氧尿苷)、Super G(8-氮杂-7-脱氮鸟苷)、锁核酸(LNA)、解锁核酸(UNA，例如UNA-A、UNA-U、UNA-C、UNA-G)、Iso-dG、Iso-dC、2'氟代碱基(例如，氟代C、氟代U、氟代A和氟代G)或任何组合。

在一些情况下，转换oligo的长度可为至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸或更长。

在一些情况下，转换oligo的长度可为至多约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸。

一旦细胞的内容物释放到它们各自的分配区中，其中包含的大分子组分(例如，生物颗粒的大分子成分，例如RNA、DNA或蛋白质)可以在分配区内进一步处理。根据本文所述的方法和***，单个生物颗粒的大分子组分内容物可以具有唯一标识符，使得在表征那些大分子组分时，它们可以归属为来源于相同的一个或多个生物颗粒。通过将唯一标识符特定地分配给单独的生物颗粒或生物颗粒群组来提供将特征归属于单独的生物颗粒或生物颗粒群组的能力。唯一标识符(例如，以核酸条形码的形式)可以被指定或与各个生物颗粒或生物颗粒群组缔合，以便用唯一标识符对生物颗粒的大分子组分(并且导致其特征)加标签或进行标记。然后可以使用这些唯一标识符以将生物颗粒的组分和特征归属于单独的生物颗粒或生物颗粒群组。

在一些方面中，这通过将单个生物颗粒或生物颗粒群组与唯一标识符共分配来执行，例如如上所述(参见图2)。在一些方面中，唯一标识符以核酸分子(例如，寡核苷酸)的形式提供，所述核酸分子包含核酸条形码序列，所述核酸条形码序列可以附接于单独的生物颗粒的核酸内容物或以其他方式与单独的生物颗粒的核酸内容物缔合，或附接于生物颗粒的其他组分，特别是那些核酸的片段。核酸分子被分配，使得在给定分配区中的核酸分子之间，其中包含的核酸条形码序列是相同的，但是在不同分配区之间，核酸分子可以并且确实具有不同的条形码序列，或者至少表示在给定分析中所有分配区中的大量不同条形码序列。在一些方面中，只有一个核酸条形码序列可以与给定的分配区缔合，但是在一些情况下，可以存在两个或更多个不同的条形码序列。

核酸条形码序列可以在核酸分子(例如，寡核苷酸)的序列内包括约6至约20个或更多个核苷酸。在一些情况下，条形码序列的长度可以是约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下，条形码序列的长度可以是至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下，条形码序列的长度可以是至多约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。这些核苷酸可以是完全连续的，即在相邻核苷酸的单个区段中，或者它们可以被分成两个或更多个由1个或多个核苷酸分开的单独子序列。在一些情况下，分开的条形码子序列的长度可为约4至约16个核苷酸。在一些情况下，条形码子序列可以是约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下，条形码子序列可以是至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下，条形码子序列可以是至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。

共分配的核酸分子还可以包含可用于处理来自共分配的生物颗粒的核酸的其他功能序列。这些序列包括例如靶向或随机/通用扩增/延伸引物序列，其用于从分配区内的各个生物颗粒扩增或延伸基因组DNA，同时附接缔合的条形码序列、测序引物或引物识别位点，杂交或探测序列，例如用于鉴定序列存在或用于下拉条形码化核酸，或许多其他潜在的功能序列中任一种。还可以使用共分配寡核苷酸的其他机制，包括例如两个或更多个液滴的聚结，其中一个液滴包含寡核苷酸，或寡核苷酸微分配到分配区中，例如微流体***内的液滴。

在一个实例中，提供微胶囊(例如珠粒)，其各自包括大量可释放地附接于珠粒的上述条形码化核酸分子(例如，条形码化寡核苷酸)，其中附接于特定珠粒的所有核酸分子将包括相同的核酸条形码序列，但是在所使用的珠粒群体中表示大量不同的条形码序列。在一些实施方案中，水凝胶珠粒(例如包含聚丙烯酰胺聚合物基质)用作核酸分子进入分配区的固体支持物和递送载体，因为它们能够携带大量核酸分子，并且可以配置为在暴露于特定刺激后释放那些核酸分子，如本文其他地方所述。在一些情况下，珠粒群体提供各种条形码序列文库，其包括至少约1,000种不同的条形码序列、至少约5,000种不同的条形码序列、至少约10,000种不同的条形码序列、至少约50,000种不同的条形码序列、至少约100,000种不同的条形码序列、至少约1,000,000种不同的条形码序列、至少约5,000,000种不同的条形码序列或至少约10,000,000种不同的条形码序列或更多。另外，每个珠粒可以具有大量附接的核酸(例如寡核苷酸)分子。特别地，在单独的珠粒上包括条形码序列的核酸分子的分子数可以是至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下至少约10亿个核酸分子，或更多。给定珠粒的核酸分子可包括相同(或共有)条形码序列、不同条形码序列或两者的组合。给定珠粒的核酸分子可包括多个核酸分子集合。给定集合的核酸分子可包括相同的条形码序列。相同的条形码序列可以与另一集合的核酸分子的条形码序列不同。

此外，当分配珠粒群体时，所得到的分配区群体还可以包括各种条形码文库，其包括至少约1,000种不同的条形码序列、至少约5,000种不同的条形码序列、至少约10,000种不同的条形码序列、至少约50,000种不同的条形码序列、至少约100,000种不同的条形码序列、至少约1,000,000种不同的条形码序列、至少约5,000,000种不同的条形码序列、或至少约10,000,000种不同的条形码序列。另外，群体的每个分配区可以包括至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下至少约10亿个核酸分子。

在一些情况下，可能希望将多个不同的条形码掺入给定分配区内，或附接至分配区内的单个或多个珠粒。例如，在一些情况下，混合但已知的条形码序列集合可以在后续处理中提供更大的识别保证，例如，通过向给定分配区提供更强的地址或条形码属性，作为从给定分配区输出的重复或独立确认。

核酸分子(例如，寡核苷酸)在对珠粒施加特定刺激后可从珠粒中释放。在一些情况下，刺激可以是光刺激，例如通过裂解光不稳定键以释放核酸分子。在其他情况下，可以使用热刺激，其中珠粒环境的温度升高将导致键裂解或核酸分子从珠粒中的其他释放。在其他情况下，可以使用化学刺激，其裂解核酸分子与珠粒的键，或者以其他方式导致核酸分子从珠粒中释放。在一种情况下，此类组合物包括上述用于包封生物颗粒的聚丙烯酰胺基质，并且可以通过暴露于还原剂如DTT而降解以释放附接的核酸分子。

在一些方面中，提供了用于受控分配的***和方法。可以通过调节通道架构(例如，微流体通道架构)中的某些几何特征来控制液滴尺寸。例如，可以调节通道的扩张角、宽度和/或长度来控制液滴尺寸。

图4示出用于将珠粒受控地分配到离散液滴中的微流体通道结构的实例。通道结构400可包括在通道汇合点406(或交叉点)处与贮存器404连通的通道区段402。贮存器404可以是腔室。如本文所用，对“贮存器”的任何提及也可以指“腔室”。在操作中，包括悬浮珠粒412的含水流体408可以沿着通道区段402输送到汇合点406处以相遇与贮存器404中含水流体408不混溶的第二流体410，以产生流入贮存器404的含水流体408的液滴416、418。在含水流体408和第二流体410相遇的汇合点406处，可以基于各种因素形成液滴，例如在汇合点406处的流体动力，两种流体408、410的流速，流体性质以及通道结构400的某些几何参数(例如，w、h₀、α等)。多个液滴通过连续地从通道区段402注入含水流体408通过汇合点406而收集在贮存器404中。

产生的离散液滴可包括珠粒(例如，如在占据的液滴416中)。可替代地，产生的离散液滴可包括多于一个珠粒。可替代地，产生的离散液滴可以不包括任何珠粒(例如，如在未占据的液滴418中)。在一些情况下，产生的离散液滴可含有一个或多个生物颗粒，如本文其他地方所述。在一些情况下，产生的离散液滴可包含一种或多种试剂，如本文其他地方所述。

在一些情况下，含水流体408可以具有基本均匀浓度或频率的珠粒412。珠粒412可以从单独的通道(图4中未示出)引入到通道区段402中。通道区段402中珠粒412的频率可以通过控制珠粒412被引入通道区段402的频率和/或通道区段402和单独通道中流体的相对流速来控制。在一些情况下，珠粒可以从多个不同的通道引入到通道区段402中，并且相应地控制频率。

在一些情况下，通道区段402中的含水流体408可包括生物颗粒(例如，参见图1和图2描述)。在一些情况下，含水流体408可具有基本均匀浓度或频率的生物颗粒。与珠粒一样，生物颗粒可以从单独通道引入到通道区段402中。可以通过控制生物颗粒被引入到通道区段402的频率和/或通道区段402和单独通道中流体的相对流速来控制通道区段402中的含水流体408中的生物颗粒的频率或浓度。在一些情况下，可以从多个不同的通道将生物颗粒引入到通道区段402中，并相应地控制频率。在一些情况下，第一单独通道可以引入珠粒，并且第二单独通道可以将生物颗粒引入到通道区段402中。引入珠粒的第一单独通道可以在引入生物颗粒的第二单独通道的上游或下游。

第二流体410可包含油，例如氟化油，其包括用于稳定所得液滴(例如，抑制所得液滴的后续聚结)的含氟表面活性剂。

在一些情况下，第二流体410可以不经受和/或被引导任何流入或流出贮存器404。例如，第二流体410可以在贮存器404中是基本静止的。在一些情况下，第二流体410可以在贮存器404内流动，但不流入或流出贮存器404，例如通过向贮存器404施加压力和/或在汇合点406处受到含水流体408的进入流的影响。可替代地，第二流体410可以经受和/或被引导流入或流出贮存器404。例如，贮存器404可以是将第二流体410从上游引导到下游的通道，从而输送所产生的液滴。

在汇合点406处或附近的通道结构400可具有某些几何特征，其至少部分地确定通过通道结构400形成的液滴的尺寸。通道区段402可在汇合点406处或附近具有高度h₀和宽度w。举例来说，通道区段402可包括矩形横截面，其通向具有较宽横截面(例如在宽度或直径方面)的贮存器404。可替代地，通道区段402的横截面可以是其他形状，例如圆形、梯形、多边形或任何其他形状。在汇合点406处或附近的贮存器404的顶壁和底壁可以以扩张角α倾斜。扩散角α允许舌部(在汇合点406处离开通道区段402并在液滴形成之前进入贮存器404的部分含水流体408)增加深度并有助于减小中间形成的液滴的曲率。液滴尺寸可随着扩张角的增加而减小。可以通过针对上述几何参数h₀、w和α的以下等式预测所得的液滴半径R_d：

举例来说，对于w＝21μm，h＝21μm和α＝3°的通道结构，预测的液滴尺寸为121μm。在另一个实例中，对于w＝25μm，h＝25μm和α＝5°的通道结构，预测的液滴尺寸是123μm。在另一个实例中，对于w＝28μm，h＝28μm和α＝7°的通道结构，预测的液滴尺寸是124μm。

在一些情况下，扩张角α的范围可以在约0.5°至约4°、约0.1°至约10°、或约0°至约90°的范围之间。例如，扩张角可以是至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更高。在一些情况下，扩张角可以是至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。在一些情况下，宽度w可以在约100微米(μm)至约500μm的范围之间。在一些情况下，宽度w可以在约10μm至约200μm的范围之间。可替代地，宽度可小于约10μm。可替代地，宽度可以大于约500μm。在一些情况下，进入汇合点406的含水流体408的流速可在约0.04微升(μL)/分钟(min)与约40μL/min之间。在一些情况下，进入汇合点406的含水流体408的流速可在约0.01微升(μL)/分钟(min)与约100μL/min之间。可替代地，进入汇合点406的含水流体408的流速可小于约0.01μL/min。可替代地，进入汇合点406的含水流体408的流速可以大于约40μL/min，例如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更高。在较低的流速下，例如约小于或等于10微升/分钟的流速，液滴半径可能不取决于进入汇合点406的含水流体408的流速。

在一些情况下，至少约50％的产生的液滴可具有一致的尺寸。在一些情况下，至少约55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或更高的产生的液滴可以具有一致的尺寸。可替代地，小于约50％的产生的液滴可具有一致的尺寸。

可以通过增加生成点来增加液滴生成的通量，例如增加含水流体408通道区段(例如，通道区段402)与贮存器404之间的汇合点(例如，汇合点406)的数量。可替代地或另外地，可以通过增加通道区段402中的含水流体408的流速来增加液滴产生的通量。

图5示出用于增加液滴产生通量的微流体通道结构的实例。微流体通道结构500可包括多个通道区段502和贮存器504。多个通道区段502中的每一个可与贮存器504流体连通。通道结构500可在多个通道区段502与贮存器504之间包括多个通道汇合点506。每个通道汇合点可以是液滴产生点。来自图4中的通道结构400的通道区段402以及对其部件的任何描述可以对应于通道结构500中的多个通道区段502的给定通道区段以及对其相应部件的任何描述。来自通道结构400的贮存器404以及对其部件的任何描述可以对应于来自通道结构500的贮存器504以及对其相应部件的任何描述。

多个通道区段502中的每个通道区段可包括含水流体508，所述含水流体包括悬浮珠粒512。贮存器504可包括与含水流体508不混溶的第二流体510。在一些情况下，第二流体510可以不经受和/或被引导任何流入或流出贮存器504。例如，第二流体510可以在贮存器504中是基本静止的。在一些情况下，第二流体510可以在贮存器504内流动，但不流入或流出贮存器504，例如通过向贮存器504施加压力和/或在汇合点处受到含水流体508的进入流的影响。可替代地，第二流体510可以经受和/或被引导流入或流出贮存器504。例如，贮存器504可以是将第二流体510从上游引导到下游的通道，从而输送所产生的液滴。

在操作中，包括悬浮珠粒512的含水流体508可以沿着多个通道区段502输送到多个汇合点506中以与贮存器504中的第二流体510相遇以产生液滴516、518。从每个通道区段，在与贮存器504的每个相应汇合点处，可形成液滴。在含水流体508和第二流体510相遇的汇合点处，可以基于各种因素形成液滴，例如在汇合点处的流体动力，两种流体508、510的流速，流体性质以及通道结构500的某些几何参数(例如，w、h₀、α等)，如本文其他地方所述。多个液滴可以通过连续地从多个通道区段502注入含水流体508通过多个汇合点506而收集在贮存器504中。通过通道结构500的平行通道配置，通量可以显著增加。例如，具有五个包括含水流体508的入口通道区段的通道结构可以产生频率是具有一个入口通道区段的通道结构五倍的液滴，条件是通道区段中的流体流速基本上相同。不同入口通道区段中的流体流速可以基本上相同或不同。通道结构可以具有依据实际并且允许贮存器的尺寸那么多的平行通道区段。例如，通道结构可以具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、500、250、300、350、400、450、500、600、700、800、900、1000、1500、5000或更多个平行或基本平行的通道区段。

对于多个通道区段502中的每个通道区段，几何参数w、h₀和α可以是一致或不一致的。例如，每个通道区段可以在其与贮存器504的各自通道汇合点处或附近具有相同或不同的宽度。例如，每个通道区段可以在其与贮存器504的各自通道汇合点处或附近具有相同或不同的高度。在另一个实例中，贮存器504可以在与多个通道区段502的不同通道汇合点处具有相同或不同的扩张角。当几何参数一致时，有利地，即使增加了通量，也可以控制液滴尺寸为一致的。在一些情况下，当希望具有不同的液滴尺寸分布时，可以相应地改变多个通道区段502的几何参数。

图6示出用于增加液滴产生通量的微流体通道结构的另一个实例。微流体通道结构600可包括围绕贮存器604的周边大致圆形布置的多个通道区段602。多个通道区段602中的每一个可与贮存器604流体连通。通道结构600可在多个通道区段602与贮存器604之间包括多个通道汇合点606。每个通道汇合点可以是液滴产生点。来自图2中的通道结构400的通道区段402以及对其部件的任何描述可以对应于通道结构600中的多个通道区段602的给定通道区段以及对其相应部件的任何描述。来自通道结构400的贮存器404以及对其部件的任何描述可以对应于来自通道结构600的贮存器604以及对其相应部件的任何描述。

多个通道区段602中的每个通道区段可包括含水流体608，所述含水流体包括悬浮珠粒612。贮存器604可包括与含水流体608不混溶的第二流体610。在一些情况下，第二流体610可以不经受和/或被引导任何流入或流出贮存器604。例如，第二流体610可以在贮存器604中是基本静止的。在一些情况下，第二流体610可以在贮存器604内流动，但不流入或流出贮存器604，例如通过向贮存器604施加压力和/或在汇合点处受到含水流体608的进入流的影响。可替代地，第二流体610可以经受和/或被引导流入或流出贮存器604。例如，贮存器604可以是将第二流体610从上游引导到下游的通道，从而输送所产生的液滴。

在操作中，包括悬浮珠粒612的含水流体608可以沿着多个通道区段602输送到多个汇合点606中以与贮存器604中的第二流体610相遇以产生多个液滴616。从每个通道区段，在与贮存器604的每个相应汇合点处，可形成液滴。在含水流体608和第二流体610相遇的汇合点处，可基于多种因素形成液滴，例如汇合点处的水动力，两种流体608、610的流速，流体性质以及通道结构600的某些几何参数(例如，通道区段602的宽度和高度、贮存器604的扩张角等)，如本文其他地方所述。多个液滴可以通过连续地从多个通道区段602注入含水流体608通过多个汇合点606而收集在贮存器604中。通过通道结构600的基本平行通道配置，通量可以显著增加。通道结构可以具有依据实际并且贮存器的尺寸允许的那么多的基本平行通道区段。例如，通道结构可以具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、1500、5000或更多个平行或基本平行的通道区段。多个通道区段可以基本上均匀地间隔开，例如，围绕贮存器的边缘或周边。可替代地，多个通道区段的间隔可以是不均匀的。

贮存器604可以在每个通道汇合点处或附近具有扩张角α(图6中未示出)。多个通道区段602中的每个通道区段可以在通道汇合点处或附近具有宽度w和高度h₀。对于多个通道区段602中的每个通道区段，几何参数w、h₀和α可以是一致或不一致的。例如，每个通道区段可以在其与贮存器604的各自通道汇合点处或附近具有相同或不同的宽度。例如，每个通道区段可以在其与贮存器604的各自通道汇合点处或附近具有相同或不同的高度。

贮存器604可以在与多个通道区段602的不同通道汇合点处具有相同或不同的扩张角。例如，圆形贮存器(如图6所示)可以具有圆锥形、圆顶状、或者半球形顶板(例如，顶壁)以在多个通道汇合点606处或附近为每个通道区段602提供相同或基本相同的扩张角。当几何参数一致时，有利地，即使增加了通量，也可以控制所得液滴尺寸为一致的。在一些情况下，当希望具有不同的液滴尺寸分布时，可以相应地改变多个通道区段602的几何参数。

在一些情况下，至少约50％的产生的液滴可具有一致的尺寸。在一些情况下，至少约55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或更高的产生的液滴可以具有一致的尺寸。可替代地，小于约50％的产生的液滴可具有一致的尺寸。注入液滴中的珠粒和/或生物颗粒可以具有一致或不一致的尺寸。

例如，如上文或本文其他地方所述的通道网络可以流体地联接到适当的流体部件。例如，入口通道区段流体地联接到它们要递送到通道汇合点的材料的适当来源。这些来源可以包括多种不同的流体部件中的任一种，从在微流体装置的主体结构中限定或与其连接的简易贮存器，到从装置外来源、歧管、流体流动单元(例如，致动器、泵、压缩机)等递送流体的流体管道。同样地，出口通道区段(例如，通道区段208、贮存器604等)可以流体地联接到分配细胞的接收容器或导管以便后续处理。同样，这可以是在微流体设备的主体中限定的储存器，或者其可以是用于将分配细胞递送到随后的过程操作、仪器或部件的流体导管。

本文描述的方法和***可用于极大地提高单细胞应用和/或接收基于液滴的输入的其他应用的效率。例如，在对占据细胞和/或适当大小的细胞进行分选之后，可以执行的后续操作可以包括产生扩增产物、纯化(例如，通过固相可逆固定化(SPRI))、进一步处理(例如，剪切、功能序列的连接和随后的扩增(例如，通过PCR))。这些操作可以本体发生(例如，在分配区外)。在分配区是乳液中的液滴的情况下，可以破坏乳液并且将液滴的内容物汇集用于另外的操作。可连同携带条形码的珠粒共分配的其他试剂可包括阻断核糖体RNA(rRNA)的寡核苷酸和消化细胞中基因组DNA的核酸酶。替代地，可以在另外的处理操作期间应用rRNA去除剂。通过这种方法生成的构建体的构型可有助于在测序期间最小化(或避免)poly-T序列的测序和/或对多核苷酸序列的5'末端进行测序。可以对扩增产物(例如，第一扩增产物和/或第二扩增产物)进行测序以进行序列分析。在一些情况下，可以使用测序用部分发夹扩增(Partial Hairpin Amplification for Sequencing；PHASE)方法执行扩增。

多种应用需要生物颗粒群体内不同生物颗粒或生物体类型的存在的评估和其量化，包括例如微生物菌群分析和表征、环境测试、食品安全测试、流行病学分析，例如，追踪污染等。

计算机***

本公开提供了被编程用于实现本公开的方法的计算机***。图8示出计算机***801，其被编程或以其他方式配置用于并行处理多个细胞或核酸样品，例如(i)控制微流体***(例如，流体流动)以产生分配区，(ii)从未占据的液滴中分选占据的液滴，(iii)聚合液滴，(iv)执行测序应用，(v)产生和维持测序读长的文库，以及(vi)分析测序读长。计算机***801可以调节本公开的各种方面，例如像调节包含液滴的分配区的形成期间微流体结构中的一个或多个通道中的流体流速，调节聚合应用单元、核酸延伸或扩增等。计算机***801可以是用户的电子设备或相对于电子设备远程定位的计算机***。电子设备可以是移动电子设备。

计算机***801包括中央处理单元(CPU，在本文中也称为“处理器”和“计算机处理器”)805，其可为单一核心或多核心处理器，或用于并行处理的多个处理器。计算机***801还包括存储器或存储单元810(例如，随机存取存储器、只读存储器、闪速存储器)，电子存储单元815(例如，硬盘)，与一个或多个其他***通信的通信接口820(例如，网络适配器)，和***设备825，如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器810、存储单元815、接口820和***设备825通过通信总线(实线)如母板与CPU 805通信。存储单元815可为用于存储数据的数据存储单元(或数据储存库)。计算机***801可借助于通信接口820来可操作地耦接至计算机网络(“网络”)830。网络830可为互联网、互联网和/或外联网或与互联网通信的内部网和/或外联网。网络830在一些情况下为电信和/或数据网络。网络830可包括一个或多个计算机服务器，其可实现分布式计算，如云计算。网络830在一些情况下借助于计算机***801，可实施对等网络，其可使得耦接至计算机***801的设备能够作为客户端或服务器来运作。

CPU 805可执行序列机器可读指令，所述指令可在程序或软件中具体实现。指令可存储于存储单元，如存储器810中。指令可被引导至CPU 805，其可随后编程或另外配置CPU805来实施本公开的方法。由CPU 805执行的操作的实例可包括撷取、解码、执行和写回。

CPU 805可为电路的一部分，如集成电路。***801的一个或多个其他部件可包含于电路中。在一些情况下，电路是专用集成电路(ASIC)。

存储单元815可存储文件，如驱动程序、文库和保存程序。存储单元815可存储使用者数据，例如，使用者偏好和使用者程序。计算机***801在一些情况下可包括一个或多个额外数据存储单元，所述单元在计算机***801外部，如位于经由内部网或互联网与计算机***801通信的远程服务器上。

计算机***801可经由网络830与一个或多个远程计算机***通信。例如，计算机***801可以与用户(例如，运营商)的远程计算机***通信。远程计算机***的实例包括个人计算机(例如，便携式PC)、板式PC或平板PC(例如，

iPad、

GalaxyTab)、电话、智能电话(例如，

iPhone、支持Android的设备、

)或个人数字助理。用户可以经由网络830访问计算机***801。

如本文描述的方法可经由机器(例如，计算机处理器)可执行代码来实施，所述代码存储于计算机***801的电子存储位置上，例如像，存储器810或电子存储单元815。机器可执行或机器可读代码可以软件形式提供。在使用期间，代码可由处理器805执行。在一些情况下，代码可从存储单元815撷取并且存储在存储器810上准备由处理器805访问。在一些情况下，可排除电子存储单元815，并且机器可执行指令存储于存储器810上。

代码可预先编译并且被配置来供具有适于执行代码的处理器的机器来使用，或可在执行时间期间加以编译。代码可以程序语言来提供，可选择所述程序语言以使得代码能够以预先编译或原样编译方式来执行。

本文提供的***和方法，如计算机***801的方面可在编程中具体实现。技术的各个方面可被认为是通常呈机器(或处理器)可执行代码和/或相关联数据形式的“产品”或“制品”，所述数据承载或具体实现于一定类型的机器可读介质中。机器可执行代码可存储于电子存储单元，如存储器(例如，只读存储器、随机存取存储器、闪速存储器)或硬盘上。“存储”类型介质可包括计算机、处理器等的任何或所有有形存储器，或其相关联模块，如各种半导体存储器、磁带驱动器、磁盘驱动器等，其可在任何时候提供非暂时性存储用于软件编程。软件的全部或一部分可有时经由互联网或各种其他电信网络来传送。此类通信，例如，可使得将软件从一个计算机或处理器加载至另一个计算机或处理器，例如，从管理服务器或主机计算机加载至应用服务器的计算机平台中。因此，可承载软件元件的另一种类型的介质包括光、电和电磁波，如跨越本地设备之间的物理接口、经由有线和光学陆地线网络和各种空中链路所使用的光、电和电磁波。携带此类波的物理元件，如有线或无线链路、光链路等也可被认为是承载软件的介质。如本文使用，除非限于非暂时性、有形“存储”介质，术语如计算机或机器“可读介质”是指参与提供指令至处理器供执行的任何介质。

因此，机器可读介质，如计算机可执行代码，可采用许多形式，包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储器介质包括，例如，光盘或磁盘，如任何计算机等中的任何存储设备，如在附图中示出的可用于实施数据库等的存储设备。易失性存储器介质包括动态存储器，如这类计算机平台的主存储器。有形传输介质包括同轴电缆；铜线和光导纤维，包括构成计算机***中的总线的导线。载波传输介质可采用电或电磁信号，或声或光波的形式如在射频(RF)和红外(IR)数据通信期间产生的信号。常见形式的计算机可读介质因此包括例如：软盘、软磁盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、冲孔卡纸带、具有孔图案的任何其他物理存储器介质、RAM、ROM、PROM和EPROM、快闪EPROM、任何其他存储器芯片或盒、运输数据或指令的载波、运输这类载波的电缆或链路，或计算机可读取编程代码和/或数据的任何其他介质。许多这些形式的计算机可读介质可涉及运送一个或多个指令的一个或多个序列至处理器供执行。

计算机***801可包括或与电子显示器835通信，所述显示器包含用户接口(UI)840以用于提供例如测序分析的结果。UI的实例包括但不限于图形用户界面(GUI)和基于web的用户界面。

本公开的方法和***可经由一个或多个算法来实施。算法可在由中央处理单元805执行后经由软件来实施。算法可以，例如，执行测序并分析测序读长。

本公开的设备、***、组合物和方法可用于各种应用，比如例如，处理单细胞的单个分析物(例如，RNA、DNA或蛋白质)或多种分析物(例如，DNA和RNA、DNA和蛋白质、RNA和蛋白质、或RNA、DNA和蛋白质)。例如，将生物颗粒(例如，细胞或细胞珠)分配在分配区(例如，液滴)中，并处理生物颗粒的多种分析物以用于后续处理。多种分析物可以来自单细胞。这可以实现例如对细胞的蛋白质组、转录组和基因组同时分析。

本发明提供了包括但不限于以下实施方式：

1.一种用于分析分配区的细胞占据率的方法，其包括：

(a)提供包含多个细胞核酸条形码序列的多个细胞核酸条形码分子，所述多个细胞核酸条形码分子中的每个细胞核酸条形码分子包含(i)所述多个细胞核酸条形码序列中的单个细胞核酸条形码序列和(ii)亲脂性部分；

(b)用所述多个细胞核酸条形码序列标记多个细胞以产生多个标记细胞，其中所述多个标记细胞中的每个标记细胞包含所述多个细胞核酸条形码序列中的不同的细胞核酸条形码序列；

(c)产生包含所述多个标记细胞和多个分配区核酸条形码序列的多个分配区，其中所述多个分配区中的每个分配区包含所述多个分配区核酸条形码序列中的不同的分配区核酸条形码序列，并且其中所述多个分配区的至少一部分包含所述多个标记细胞中的多于一个标记细胞；以及

(d)使用(i)所述多个细胞核酸条形码序列中的细胞核酸条形码序列，或其互补序列，以及(ii)所述多个分配区核酸条形码序列中的分配区核酸条形码序列，或其互补序列将所述多个标记细胞中的至少两个标记细胞鉴定为来源于同一分配区。

2.如实施方式1所述的方法，其中所述多个细胞核酸条形码序列中的给定细胞核酸条形码序列鉴定所述多个标记细胞的相关联细胞所来源的样品。

3.如实施方式2所述的方法，其中所述样品来源于生物流体。

4.如实施方式3所述的方法，其中所述生物流体包括血液或唾液。

5.如实施方式1所述的方法，其还包括，在(c)之后，由所述多个标记细胞合成多个条形码化核酸产物，其中所述多个条形码化核酸产物中的给定条形码化核酸产物包含(i)细胞鉴定序列，其包含所述多个细胞核酸条形码序列中的给定细胞核酸条形码序列或所述给定细胞核酸条形码序列的互补序列；以及(ii)分配区鉴定序列，其包含所述多个分配区核酸条形码序列中的给定分配区核酸条形码序列或所述给定分配区核酸条形码序列的互补序列。

6.如实施方式5所述的方法，其中多个分配区核酸条形码分子包含所述多个分配区核酸条形码序列，所述多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含所述多个分配区核酸条形码序列中的单个分配区核酸条形码序列。

7.如实施方式6所述的方法，其中所述多个分配区核酸条形码分子中的给定分配区核酸条形码分子包含能够与所述多个细胞核酸条形码分子中的给定细胞核酸条形码分子的序列杂交的引发序列。

8.如实施方式7所述的方法，其中所述引发序列是靶向引发序列。

9.如实施方式7所述的方法，其中所述引发序列是随机N聚体序列。

10.如实施方式7所述的方法，其中所述多个细胞核酸条形码分子中的每个细胞核酸条形码分子包含所述序列。

11.如实施方式5所述的方法，其中所述多个条形码化核酸产物通过一个或多个引物延伸反应合成。

12.如实施方式5所述的方法，其中所述多个条形码化核酸产物通过一个或多个连接反应合成。

13.如实施方式5所述的方法，其中所述多个条形码化核酸产物通过一个或多个核酸扩增反应合成。

14.如实施方式5所述的方法，其还包括对所述多个条形码化核酸产物或其衍生物进行测序以产生多个测序读长。

15.如实施方式14所述的方法，其还包括使所述多个测序读长中的每个测序读长经由其相应的细胞鉴定序列与所述多个标记细胞中的标记细胞关联起来，并且使所述多个测序读长中的每个测序读长经由其相应的分配区鉴定序列与所述多个分配区中的分配区关联起来。

16.如实施方式1所述的方法，其还包括，在(c)中，将所述多个标记细胞与多个珠粒一起分配，其中所述多个珠粒中的每个珠粒包含所述多个分配区核酸条形码序列中的分配区核酸条形码序列。

17.如实施方式16所述的方法，其中所述多个分配区中的每个分配区包含所述多个珠粒中的单个珠粒。

18.如实施方式16所述的方法，其中所述多个珠粒中的每个珠粒包含多个分配区核酸条形码分子，其中所述多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含所述多个分配区核酸条形码序列中的单个分配区核酸条形码序列。

19.如实施方式16所述的方法，其中所述多个分配区核酸条形码序列中的每个分配区核酸条形码序列与所述多个珠粒中的其相应珠粒可释放地偶合。

20.如实施方式19所述的方法，其中所述多个分配区核酸条形码序列中的每个分配区核酸条形码序列在施加刺激后可从所述多个珠粒中的其相应珠粒上释放。

21.如实施方式20所述的方法，其中所述刺激是化学刺激。

22.如实施方式19所述的方法，其还包括，在(c)之后，使所述多个分配区核酸条形码序列中的分配区核酸条形码序列从所述多个珠粒中的每个珠粒上释放。

23.如实施方式22所述的方法，其还包括使所述多个珠粒中的每个珠粒降解，以使所述分配区核酸条形码序列从所述多个珠粒中的每个珠粒上释放。

24.如实施方式23所述的方法，其中所述多个分配区中的每个分配区包含能够使所述多个珠粒中的每个珠粒降解的试剂。

25.如实施方式16所述的方法，其中所述多个珠粒是多个凝胶珠粒。

26.如实施方式1所述的方法，其中所述多个分配区是多个液滴。

27.如实施方式1所述的方法，其中所述多个分配区是多个孔。

28.如实施方式1所述的方法，其中，在(b)中，所述多个细胞是通过如下方式用所述多个细胞核酸条形码序列进行标记的：使各自偶合于所述多个细胞核酸条形码序列中的给定细胞核酸条形码序列的细胞结合部分与所述多个细胞中的每个细胞结合。

29.如实施方式28所述的方法，其中所述细胞结合部分为抗体、细胞表面受体结合分子、受体配体、小分子、前体、适体、单抗体、affimer、darpin或蛋白质支架。

30.如实施方式29所述的方法，其中所述细胞结合部分为抗体。

31.如实施方式28所述的方法，其中所述细胞结合部分结合所述多个细胞中的细胞的蛋白质。

32.如实施方式28所述的方法，其中所述细胞结合部分结合所述多个细胞中的细胞的细胞表面物质。

33.如实施方式28所述的方法，其中所述细胞结合部分结合所述多个细胞中的每个细胞所共有的物质。

34.如实施方式1所述的方法，其中，在(b)中，所述多个细胞是通过如下方式用所述多个细胞核酸条形码序列进行标记的：借助于细胞穿透肽将各自包含所述多个细胞核酸条形码序列中的单个细胞核酸条形码序列的核酸条形码分子递送至所述多个细胞中的每个细胞。

35.如实施方式1所述的方法，其中，在(b)中，所述多个细胞是借助于脂质体、纳米颗粒、电穿孔或机械力用所述多个细胞核酸条形码序列进行标记的。

36.如实施方式35所述的方法，其中所述机械力包括纳米线或显微注射的使用。

37.如实施方式1所述的方法，其中所述多个细胞核酸条形码分子中的每个核酸条形码分子的所述亲脂性部分为胆固醇。

38.如实施方式1所述的方法，其中所述亲脂性部分通过接头连接于所述多个细胞核酸条形码分子。

39.如实施方式1所述的方法，其中所述多个细胞中的每个细胞包含多个核酸分子。

40.如实施方式39所述的方法，其中所述多个核酸分子包含多个脱氧核糖核酸分子。

41.如实施方式39所述的方法，其中所述多个核酸分子包含多个核糖核酸分子。

42.如实施方式40所述的方法，其中将所述标记细胞裂解或透化以使得所述多个核酸分子可被接近。

43.如实施方式42所述的方法，其中多个分配区核酸条形码分子包含所述多个分配区核酸条形码序列，所述多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含所述多个分配区核酸条形码序列中的单个分配区核酸条形码序列和能够与所述多个核酸分子的至少一个子集的序列杂交的引发序列。

44.如实施方式43所述的方法，其中所述引发序列是靶向引发序列。

45.如实施方式43所述的方法，其中所述引发序列是随机N聚体序列。

46.如实施方式1所述的方法，其中，在(c)之前，将所述多个细胞核酸条形码分子中的所述细胞核酸条形码分子的至少一个子集至少部分地设置在所述多个标记细胞内。

47.一种用于分析分配区的细胞占据率的方法，其包括：

(a)提供第一细胞核酸条形码分子，其包含(i)第一细胞核酸条形码序列和(ii)亲脂性部分；以及第二核酸条形码分子，其包含(i)第二细胞核酸条形码序列和(ii)亲脂性部分，其中所述第一细胞核酸条形码序列具有与所述第二细胞核酸条形码序列不同的序列；

(b)用所述第一细胞核酸条形码序列标记第一细胞以产生第一标记细胞并且用所述第二细胞核酸条形码序列标记第二细胞以产生第二标记细胞；

(c)产生包含所述第一标记细胞和所述第二标记细胞的分配区，其中所述分配区还包含分配区核酸条形码序列；

(d)产生(i)第一条形码化核酸分子，其包含所述第一细胞核酸条形码序列或其互补序列，以及所述分配区核酸条形码序列或其互补序列；以及(ii)第二条形码化核酸分子，其包含所述第二细胞核酸条形码序列或其互补序列，以及分配区核酸条形码序列或其互补序列；以及

(e)基于所述第一条形码化核酸分子和所述第二条形码化核酸分子具有相同的分配区核酸条形码序列或其互补序列，将所述第一标记细胞和所述第二标记细胞鉴定为来源于所述分配区。

48.如实施方式47所述的方法，其中所述第一细胞核酸条形码序列和所述第二细胞核酸条形码序列鉴定所述第一细胞和所述第二细胞所来源的样品。

49.如实施方式48所述的方法，其中所述样品来源于生物流体。

50.如实施方式49所述的方法，其中所述生物流体包括血液或唾液。

51.如实施方式47所述的方法，其中所述第一条形码化核酸分子和所述第二条形码化核酸分子各自包含引发序列。

52.如实施方式51所述的方法，其中所述引发序列是靶向引发序列。

53.如实施方式51所述的方法，其中所述引发序列是随机N聚体序列。

54.如实施方式47所述的方法，其中所述第一条形码核酸分子和所述第二条形码核酸分子通过一个或多个引物延伸反应、连接反应或核酸扩增反应合成。

55.如实施方式47所述的方法，其还包括对所述第一条形码核酸分子和所述第二条形码核酸分子或其衍生物进行测序，以产生多个测序读长。

56.如实施方式55所述的方法，其还包括使所述多个测序读长中的每个测序读长经由其细胞核酸条形码序列与所述第一标记细胞或所述第二标记细胞关联起来，并且使所述多个测序读长中的每个测序读长经由其相应的分配区核酸序列与所述分配区关联起来。

57.如实施方式47所述的方法，其还包括，在(c)中，将所述第一标记细胞和所述第二标记细胞与珠粒一起分配，所述珠粒包含多个核酸条形码分子，所述多个核酸条形码分子中的每一个包含所述分配区核酸条形码序列。

58.如实施方式57所述的方法，其中所述多个核酸条形码分子中的每个核酸条形码分子的所述分配区核酸条形码序列与所述珠粒可释放地偶合。

59.如实施方式58所述的方法，其还包括，在(c)之后，使所述多个分配区核酸条形码分子的分配区核酸条形码序列从所述珠粒上释放。

60.如实施方式57所述的方法，其中所述珠粒是凝胶珠粒。

61.如实施方式47所述的方法，其中所述分配区是孔。

62.如实施方式47所述的方法，其中所述分配区是液滴。

63.如实施方式47所述的方法，其中所述第一细胞核酸条形码分子和所述第二细胞核酸条形码分子的所述亲脂性部分为胆固醇。

64.如实施方式47所述的方法，其中所述第一细胞和所述第二细胞各自包含多个核酸分子。

65.如实施方式64所述的方法，其中将所述第一标记细胞和所述第二标记细胞裂解或透化以使得所述多个核酸分子可被接近。

66.如实施方式65所述的方法，其中多个分配区核酸条形码分子各自包含所述分配区核酸条形码序列和能够与所述多个核酸分子的至少一个子集的序列杂交的引发序列。

67.如实施方式66所述的方法，其中所述引发序列是靶向引发序列。

68.如实施方式66所述的方法，其中所述引发序列是随机N聚体序列。

69.如实施方式47所述的方法，其中，在(c)之前，将所述多个细胞核酸条形码分子中的所述细胞核酸条形码分子的至少一个子集至少部分地设置在所述多个标记细胞内。

70.一种用于分析细胞的方法，其包括：

(a)用细胞核酸条形码序列标记所述细胞以产生标记细胞，其中细胞核酸条形码分子包含所述细胞核酸条形码序列和亲脂性部分；

(b)产生包含所述标记细胞和多个分配区核酸条形码分子的分配区，其中所述多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含分配区核酸条形码序列；

(c)将所述细胞透化以使得其中的多个核酸分子可被接近；

(d)产生(i)条形码化核酸分子，其包含所述细胞核酸条形码序列或其互补序列，以及所述分配区核酸条形码序列或其互补序列；以及(ii)多个条形码化核酸产物，其各自包含所述多个核酸分子中的核酸分子的序列和所述分配区核酸条形码序列或其互补序列；以及

(e)将所述多个核酸分子鉴定为来源于所述细胞。

71.如实施方式70所述的方法，其中所述细胞核酸条形码序列鉴定所述细胞所来源的样品。

72.如实施方式71所述的方法，其中所述样品来源于生物流体。

73.如实施方式72所述的方法，其中所述生物流体包括血液或唾液。

74.如实施方式70所述的方法，其中所述多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含引发序列。

75.如实施方式74所述的方法，其中所述引发序列是靶向引发序列。

76.如实施方式74所述的方法，其中所述引发序列是随机N聚体序列。

77.如实施方式70所述的方法，其中所述条形码化核酸分子和所述多个条形码化核酸产物通过一个或多个引物延伸反应、连接反应或核酸扩增反应合成。

78.如实施方式70所述的方法，其还包括对所述条形码化核酸分子和所述条形码化核酸产物，或其衍生物进行测序，以产生多个测序读长。

79.如实施方式78所述的方法，其还包括使所述多个测序读长中的每个测序读长经由其分配区核酸条形码序列与所述分配区关联起来。

80.如实施方式70所述的方法，其还包括，在(b)中，将所述标记细胞与珠粒一起分配，所述珠粒包含所述多个分配区核酸条形码分子。

81.如实施方式80所述的方法，其中所述多个分配区核酸条形码分子中的每个核酸条形码分子的所述分配区核酸条形码序列与所述珠粒可释放地偶合。

82.如实施方式81所述的方法，其还包括，在(b)之后，使所述多个分配区核酸条形码分子的分配区核酸条形码序列从所述珠粒上释放。

83.如实施方式80所述的方法，其中所述珠粒是凝胶珠粒。

84.如实施方式70所述的方法，其中所述分配区是孔。

85.如实施方式70所述的方法，其中所述分配区是液滴。

86.如实施方式70所述的方法，其中所述细胞核酸条形码分子的所述亲脂性部分为胆固醇。

87.如实施方式70所述的方法，其中所述多个核酸分子包含多个脱氧核糖核酸分子。

88.如实施方式70所述的方法，其中所述多个核酸分子包含多个核糖核酸分子。

89.如实施方式74所述的方法，其中所述引发序列能够与所述多个核酸分子的至少一个子集的序列杂交。

90.如实施方式74所述的方法，其中所述引发序列能够与所述细胞核酸条形码分子的序列杂交。

91.如实施方式70所述的方法，其中，在(b)之前，将所述细胞核酸条形码分子至少部分地设置在所述标记细胞内。

实施例

实施例1.可在测序文库中检测与胆固醇缀合的特征条形码一起温育的细胞

由与和不与胆固醇缀合的特征条形码一起温育的细胞制备单细胞测序文库并且对其进行分析，以评估在处理的文库中检测特征条形码的能力。

简而言之，在PBS中洗涤之后将细胞在培养基中洗涤。对细胞计数并且将其分离到2mL Eppendorf管中并在室温下与以下各项一起温育五分钟：(1)浓度为1uM的胆固醇缀合的特征条形码；或(2)仅1uM特征条形码(即，不缀合于胆固醇部分的条形码)。在温育之后，将细胞在培养基中洗涤三次。然后将细胞汇集并计数。然后如本文其他地方一般性地描述将汇集的细胞群分配到液滴中以产生包含以下各项的液滴：(1)单细胞；以及(2)包含附接于其上的可释放核酸条形码分子的单个凝胶珠粒。附接于凝胶珠粒的核酸条形码分子包含条形码序列、UMI序列以及含GGG的捕获序列。胆固醇缀合的特征条形码包含与凝胶珠粒寡核苷酸捕获序列互补的含CCC的序列。

然后将每个液滴中的细胞裂解并且用细胞条形码序列将细胞核酸(包括特征条形码，如果存在的话)条形码化。然后将细胞条形码化核酸汇集并进行处理以完成文库制备。完全构建的条形码文库在BioAnalyzer上进行分析以检测特征条形码的存在。

图11A-11D示出由四个不同的细胞群制备的测序文库的BioAnalyzer结果(两个细胞群与胆固醇缀合的特征条形码“oligo133”一起温育并且两个细胞群仅与特征条形码“oligo131”一起温育，即没有胆固醇缀合)。如图11A-11B所示，对于与未缀合于胆固醇部分的特征条形码一起温育的两个细胞群，～150碱基对(特征条形码的期望尺寸-参见x轴)处的信号(如通过荧光单位(FU，y轴)所测量)为约500FU(参见箭头，图11A-B)。相比之下，如图11C-11D中所示，在由与胆固醇缀合的特征条形码一起温育的细胞制备的文库中观察到超过5,000FU(图11C–参见箭头)和～10,000FU(图11D–参见箭头)的信号。这些结果表明，特征条形码被成功地引入细胞群中并且当在混合细胞、汇集群中存在时可以成功地检测到特征条形码。

实施例2.胆固醇缀合的特征条形码文库的DNA测序结果

在PBS中洗涤之后将Jurkat细胞在培养基中洗涤并且接着对其进行计数。将100,000个此类细胞分到5个Eppendorf管(2mL)中以产生5个不同的细胞群。然后将单独的细胞群(总计四个)与0.1uM或0.01uM的胆固醇缀合的特征条形码(总计四种，每个细胞群一种)一起在室温下温育五分钟，以产生“标签化”具有第一条形码(BC1)的一个细胞群、“标签化”具有第二条形码(BC2)的一个细胞群、“标签化”具有第三条形码(BC3)的一个细胞群以及“标签化”具有第四条形码(BC4)的一个细胞群。一个细胞群不与胆固醇缀合的特征条形码一起温育(背景群)。然后将5个细胞群在培养基中洗涤，汇集到单个管中，然后对其进行计数以确定细胞数量。然后将汇集的细胞群分配成含单细胞的液滴以进行如上所述的单细胞条形码化。接着将完全构建的条形码文库在Illumina测序仪上进行测序以检测细胞和特征条形码的存在。

测序结果的分析汇总呈现于表2中。如表2所示，从所测试的0.1uM和0.01uM胆固醇缀合的特征条形码浓度的汇集细胞样品中成功地检测到与含有特征条形码BC1、BC2、BC3和BC4的细胞相对应的测序读长。“背景数量(#background)”指示与未标记群相关联的细胞的数量。在每个浓度下进行两个重复(重复1和重复2)。

表2.汇集细胞群的序列分析

图12A-12L示出来自与0.1μM胆固醇缀合的特征条形码一起温育的汇集细胞群的图形，其示出x轴上的唯一分子标识符(UMI)计数的数量相对y轴上的细胞数量。图12A-12B示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第一特征条形码序列(“BC1”)的log₁₀ UMI计数(图12A-重复1；图12B-重复2)。由这些结果，明确区分的含BC1的细胞群可被区分为1201a(重复1)和1201b(重复2)。图12C-12D示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第二特征条形码序列(“BC2”)的log₁₀ UMI计数(图12C-重复1；图12D-重复2)。由这些结果，明确区分的含BC2的细胞群可被区分为1202a(重复1)和1202b(重复2)。图12E-12F示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第三特征条形码序列(“BC3”)的log₁₀ UMI计数(图12E-重复1；图12F-重复2)。由这些结果，明确区分的含BC3的细胞群可被区分为1203a(重复1)和1203b(重复2)。图12G-12H示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第四特征条形码序列(“BC4”)的log₁₀UMI计数(图12G-重复1；图12H-重复2)。由这些结果，明确区分的含BC4的细胞群可被区分为1204a(重复1)和1204b(重复2)。

图12I-12J示出从重复1的用0.1uM胆固醇缀合的特征条形码进行条形码化的汇集细胞群获得的UMI计数的3D表示。图形描绘了处于线性(图12I)和log₁₀标度(图12J)的UMI计数。图形的三个轴示出与被发现含有BC1(1205、1209)、BC2(1206、1210)或BC3(1207、1211)的测序读长相对应的UMI计数。与含有BC4的测序读长和未标记细胞相关联的UMI计数簇集在一起(1208、1212)。

图13A-13L示出来自与0.01μM胆固醇缀合的特征条形码一起温育的汇集细胞群的图形，其示出x轴上的唯一分子标识符(UMI)计数的数量相对y轴上的细胞数量。图13A-13B示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第一特征条形码序列(“BC1”)的log₁₀ UMI计数(图13A-重复1；图13B-重复2)。由这些结果，明确区分的含BC1的细胞群可被区分为1301a(重复1)和1301b(重复2)。图13C-13D示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第二特征条形码序列(“BC2”)的log₁₀ UMI计数(图13C-重复1；图13D-重复2)。由这些结果，明确区分的含BC2的细胞群可被区分为1302a(重复1)和1302b(重复2)。图13E-13F示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第三特征条形码序列(“BC3”)的log₁₀ UMI计数(图13E-重复1；图13F-重复2)。由这些结果，明确区分的含BC3的细胞群可被区分为1303a(重复1)和1303b(重复2)。13G-13H示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第四特征条形码序列(“BC4”)的log₁₀UMI计数(图13G-重复1；图13H-重复2)。由这些结果，明确区分的含BC4的细胞群可被区分为1304a(重复1)和1304b(重复2)。

图13I-13J示出从重复1的用0.01uM胆固醇缀合的特征条形码进行条形码化的汇集细胞群获得的UMI计数的3D表示。图形描绘了线性(图13I)和log₁₀标度(图13J)的UMI计数。图形的三个轴示出与被发现含有BC1(1305、1309)、BC2(1306、1310)或BC3(1307、1311)的测序读长相对应的UMI计数。与含有BC4的测序读长和未标记细胞相关联的UMI计数簇集在一起(1308、1312)。

实施例3.抗体缀合的特征条形码文库的DNA测序结果

提供了广泛靶向人细胞类型中的细胞表面蛋白的BioLegend“散列(hashing)”抗体。抗体包括克隆LNH94(抗CD298)和2M2(抗β2-微球蛋白)的混合物。将抗体汇集成不同群体并且用不同的特征条形码进行条形码化。将Jurkat、Raji和293T细胞提供于单独群体中并且与不同的抗体缔合的特征条形码一起温育。Jurkat细胞用使用条形码#18(BC18)条形码化的抗体染色；Raji细胞用使用条形码#19(BC19)条形码化的抗体染色；并且293T细胞用使用条形码#20(BC20)条形码化的抗体染色。装载总共9,000个细胞。随后将单独的细胞群汇集。汇集混合物预期包括包含特征条形码BC18的Jurkat细胞、包含特征条形码BC19的Raji细胞，以及包含特征条形码BC20的293T细胞。对汇集混合物中的细胞数量进行计数以确定细胞数量。然后将汇集的细胞群分配成含单细胞的液滴以进行如上所述的单细胞条形码化。接着将完全构建的条形码文库在Illumina测序仪上进行测序以检测细胞和特征条形码的存在。

在汇集和文库制备之后，使用特征条形码UMI计数将细胞分组。条形码纯度计算为(靶条形码UMI)/(所有条形码UMI的总和)。对于多于1个条形码，通过高UMI计数鉴定多联体(multiplet)。

测序结果的分析汇总呈现于表3中。如表3所示，从所测试的0.1uM和0.01uM胆固醇缀合的特征条形码浓度的汇集细胞样品中成功地检测到与含有特征条形码BC1、BC2、BC3和BC4的细胞相对应的测序读长。“背景数量”指示与未标记群相关联的细胞的数量。在每个浓度下进行两个重复(重复1和重复2)。

表3.汇集细胞群的序列分析

图14A-14I示出来自与抗体缀合的特征条形码一起温育的汇集细胞群的图形，其示出x轴上的唯一分子标识符(UMI)计数的数量相对y轴上的细胞数量。图14A-14B示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第一特征条形码序列(“BC18”)的UMI计数(图14A-重复1；图14B-重复2)。由这些结果，明确区分的含BC18的细胞群可被区分为1401a(重复1)和1401b(重复2)。图14C-14D示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第二特征条形码序列(“BC19”)的UMI计数(图14C-重复1；图14D-重复2)。由这些结果，明确区分的含BC19的细胞群可被区分为1402a(重复1)和1402b(重复2)。图14E-14F示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的第三特征条形码序列(“BC20”)的UMI计数(图14E-重复1；图14F-重复2)。由这些结果，明确区分的含BC20的细胞群可被区分为1403a(重复1)和1403b(重复2)。

图14G-14I示出来自与抗体缀合的特征条形码一起温育的汇集细胞群的图形，其示出相对于各种条形码序列的群体的唯一分子标识符(UMI)计数的数量。将富集一个、两个(细胞双联体)和三个(细胞三联体(cell triplet))的细胞分类。图14G示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的特征条形码序列的UMI计数，其中BC18的log₁₀UMI计数在y轴上并且BC20的log₁₀ UMI计数在x轴上。该图形示出簇集的UMI计数，其中发现大多数测序读长包含BC18(1404)、BC19(1405)、BC20(1406)以及BC18和BC20(1407)图14H示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的特征条形码序列的UMI计数，其中BC18的log₁₀ UMI计数在y轴上并且BC19的log₁₀ UMI计数在x轴上。该图形示出簇集的UMI计数，其中发现大多数测序读长包含BC18(1408)、BC19(1410)、BC20(1409)以及BC18和BC19(1411)图14I示出从由汇集细胞群制备的测序文库产生的测序读长中鉴定的特征条形码序列的UMI计数，其中BC19的log₁₀ UMI计数在y轴上并且BC20的log₁₀ UMI计数在x轴上。该图形示出簇集的UMI计数，其中发现大多数测序读长包含BC18(1413)、BC19(1412)、BC20(1414)以及BC19和BC20(1415)与图14G-14I中的每一个的其他双联体和三联体相对应的另外的UMI计数在这些可视化中较不明显。

使用特征条形码UMI计数可鉴定细胞类型和多联体。如图15A-15B所示，通过抗体UMI计数鉴定的双联体在抗体t-分布随机邻域嵌入(t-SNE)(图15A)以及基因表达(GEX)t-SNE分析(图15B)中簇集在一起。簇集由GEX t-SNE中的细胞类型以及抗体t-SNE中的抗体标记驱动。簇之间的重叠显示，基于抗体的双联体鉴定与预期的基因表达谱匹配。图15A示出与单个条形码BC18、BC19和BC20相对应的簇(分别为1503、1502、1501)；包括BC18和BC19(1505)、BC18和BC20(1504)以及BC19和BC20(1506)的双联体；包括BC18、BC19和BC20的三联体(1507)；以及任何条形码的不存在(1508)。图15B示出与单个条形码BC18、BC19和BC20相对应的簇(分别为1513、1512、1511)；包括BC18和BC19(1515)、BC18和BC20(1514)以及BC19和BC20(1516)的双联体；以及任何条形码的不存在(1518)。与包括BC18、BC19和BC20的三联体相对应的簇在图15B中不明显。

尽管本文已示出和描述了本发明的优选实施方案，但对于本领域技术人员来说将显而易见，此类实施方案仅作为实例提供。本发明不旨在受到本说明书中提供的具体实施例限制。尽管已经参考上述说明书描述本发明，但本文中的实施方案的描述和说明不意图以限制意义解释。本领域技术人员现在将想到许多变化、改变和替换而不偏离本发明。此外，应当理解，本发明的所有方面均不限于本文所述的具体描述、配置或相对比例，其取决于多种条件和变量。应当理解的是，可以在实践本发明时采用在本文中描述的本发明的实施方案的各种替代方案。因此，预期本发明还应涵盖任何此类替代方案、修改、变型或等同物。所意图的是，以下权利要求限定本发明的范围以及由此涵盖这些权利要求及其等同物范围内的方法和结构。

Claims

1.一种用于分析分配区的细胞占据率的方法，其包括：

2.如权利要求1所述的方法，其中所述多个细胞核酸条形码序列中的给定细胞核酸条形码序列鉴定所述多个标记细胞的相关联细胞所来源的样品。

3.如权利要求2所述的方法，其中所述样品来源于生物流体。

4.如权利要求3所述的方法，其中所述生物流体包括血液或唾液。

5.如权利要求1所述的方法，其还包括，在(c)之后，由所述多个标记细胞合成多个条形码化核酸产物，其中所述多个条形码化核酸产物中的给定条形码化核酸产物包含(i)细胞鉴定序列，其包含所述多个细胞核酸条形码序列中的给定细胞核酸条形码序列或所述给定细胞核酸条形码序列的互补序列；以及(ii)分配区鉴定序列，其包含所述多个分配区核酸条形码序列中的给定分配区核酸条形码序列或所述给定分配区核酸条形码序列的互补序列。

6.如权利要求5所述的方法，其中多个分配区核酸条形码分子包含所述多个分配区核酸条形码序列，所述多个分配区核酸条形码分子中的每个分配区核酸条形码分子包含所述多个分配区核酸条形码序列中的单个分配区核酸条形码序列。

7.如权利要求6所述的方法，其中所述多个分配区核酸条形码分子中的给定分配区核酸条形码分子包含能够与所述多个细胞核酸条形码分子中的给定细胞核酸条形码分子的序列杂交的引发序列。

8.如权利要求7所述的方法，其中所述引发序列是靶向引发序列。

9.一种用于分析分配区的细胞占据率的方法，其包括：

10.一种用于分析细胞的方法，其包括：

(c)将所述细胞透化以使得其中的多个核酸分子可被接近；

(e)将所述多个核酸分子鉴定为来源于所述细胞。