CN116249786A

CN116249786A - 靶向单细胞cDNA测序的方法和组合物

Info

Publication number: CN116249786A
Application number: CN202180061602.6A
Authority: CN
Inventors: J·A·斯科尔尼克; 洪惠琪
Original assignee: National University of Singapore
Current assignee: National University of Singapore
Priority date: 2020-09-10
Filing date: 2021-09-09
Publication date: 2023-06-09
Also published as: EP4211270A1; WO2022053981A1; US20230366017A1

Abstract

在各种实施方式中，本发明大体上提供生成用于测序的标记DNA扩增子的方法。在一个实施方式中，所述方法包括：a)将第一寡核苷酸退火至核酸模板，其包含靶核酸分子序列和标签序列，其中，所述靶核酸分子序列包含目标基因座；b)从退火的第一寡核苷酸进行核酸模板导向的核酸延伸以提供第一延伸产物；c)环化第一延伸产物以产生环化的DNA模板；和d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子，从而用于测序。这些方法可用于将远距离目标基因座与逆转录引物连接起来。

Description

靶向单细胞cDNA测序的方法和组合物

相关申请

本申请要求于2020年9月10日提交的美国临时申请号63/076,672的权益。上述申请的全部内容通过引用并入本文。

通过引用将材料并入ASCII文本文件

本申请通过引用并入包含在以下同时提交的ASCII文本文件中的序列表：

文件名：44591155001_SEQUENCELISTING.txt；创建于2021年9月9日，大小为12,288字节。

背景技术

从混合细胞群中获取单细胞转录组信息的能力对于分子生物学研究和医学应用都很重要。需要一种灵敏且快速的方法来生成标记的DNA扩增子，以便对远离转录物末端的目标基因座进行测序。

发明内容

本发明提供了生成用于测序的标记DNA扩增子的方法。

一方面，本发明提供了一种生成用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)将第一寡核苷酸退火至核酸模板，所述核酸模板包含靶核酸分子序列、标签序列和第一通用序列的至少一部分，其中，靶核酸分子序列包含目标基因座；

b)从退火的第一寡核苷酸进行核酸模板导向的核酸延伸以产生第一延伸产物，所述第一延伸产物包含含有目标基因座的靶核酸分子序列的全部或部分、标签序列和第一通用序列的至少一部分；

c)环化第一延伸产物以产生环化的DNA模板，其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分；和

d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子，其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分，

从而生成用于测序的标记DNA扩增子。

在某些实施方式中，所述方法还包括进行第一延伸产物导向的核酸扩增以扩增第一延伸产物。在某些实施方式中，第一延伸产物导向的核酸扩增使用以下进行：

a)第一寡核苷酸；和

b)第一引物，其包含第一通用序列的至少一部分。

另一方面，本发明提供了一种生成用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)提供核酸模板，其包含靶核酸分子序列、标签序列和第一通用序列的至少一部分，其中，靶核酸分子序列包含目标基因座；

b)通过以下方式进行核酸模板导向的核酸扩增以产生第一扩增产物：

i.在引物退火至核酸模板中的互补核苷酸序列的条件下，使核酸模板与包含第一寡核苷酸和第一引物的反应混合物接触，其中，第一引物包含第一通用序列的至少一部分；和

ii.延伸第一寡核苷酸和第一引物中的每一个；

c)环化第一扩增产物以产生环化的DNA模板，其包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分；和

从而生成用于测序的标记DNA扩增子。

在另一方面，本发明提供了一种生用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)提供核酸模板，其从5'端到3'端包含截短的第一通用序列、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列，其中，靶核酸分子序列包含目标基因座；

b)通过以下方式进行核酸模板定向的核酸扩增以产生第一扩增产物：

i.在第一寡核苷酸和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下，使核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触，其中：

1)第一寡核苷酸从5'端到3'端包括第二通用序列和靶核酸分子特异性序列；和

2)第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分；和

ii.延伸第一寡核苷酸和第一反向引物中的每一个；

c)环化第一扩增产物以产生环化DNA模板，其包含第二通用序列、目标基因座、标签序列、第一通用序列和[i7]；和

d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子，其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和IlluminaP7序列，

从而生成用于测序的标记DNA扩增子。

在另一方面，本发明提供了一种生成用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)提供核酸模板，其从5'端到3'端包含截短的第一通用序列、标签序列、第二模板转换寡聚物(TSO2)序列和靶核酸分子序列，其中，靶核酸分子序列包含目标基因座；

1)第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列；和

ii.延伸第一寡核苷酸和第一反向引物中的每一个；

c)环化第一扩增产物以产生环化的DNA模板，其包含第二通用序列、目标基因座、TSO2序列、标签序列、第一通用序列和[i7]；和

d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子，其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、TSO2序列、标签序列和Illumina P7序列，

从而生成用于测序的标记DNA扩增子。

在某些实施方式中，核酸模板是互补DNA(cDNA)模板。在某些实施方式中，cDNA模板是通过反转录来自单个细胞的RNA获得的。在某些实施方式中，RNA是mRNA。在某些实施方式中，核酸模板是通过cDNA分子的扩增产生的双链DNA分子(例如，扩增子)。

在某些实施方式中，cDNA模板对应于第一链cDNA，其从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列。在其他实施方式中，cDNA模板对应于第二链cDNA，其从5'端到3'端包含第一通用序列的至少一部分、标签序列、第二模板转换寡聚物(TSO2)序列和靶核酸分子序列。

在某些实施方式中，目标基因座包含突变、多态性、***、缺失、基因融合、编辑的核苷酸、修饰的核苷酸、转基因或其组合。

在某些实施方式中，标签序列包含细胞识别标签或独特分子标识符(UMI)序列，或其组合。

在某些实施方式中，所述方法包括单个环化步骤。

在某些实施方式中，环化第一延伸产物包括由吉布森组装介导的分子内连接。

在某些实施方式中，所述方法用于制作测序文库。

在另一方面，本发明提供了一种用于测序的标记DNA扩增子，其从5'端到3'端包含目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分和标签序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含目标基因座、第二通用序列、第一通用序列和标签序列。

在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、第一通用序列、标签序列和Illumina P7序列。

在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和Illumina P7序列。

在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列、poly(T)序列和Illumina P7序列。

在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第二模板转换寡聚物(TSO2)序列和Illumina P7序列。

附图说明

前述内容将从以下示例实施方式的更具体描述中显而易见，如附图中所示，在附图中相同的附图标记在不同的视图中指代相同的部分。附图不一定按比例绘制，而是将重点放在说明实施方式上。

图1A和1B描绘了SIT-seq分子设计的非限制性实例(例如，对于从10x Genomics3'基因表达试剂盒或3'偏向RNA-Seq文库生成的cDNA)。分子设计将远距离目标基因座与逆转录引物(显示为10x Genomics细胞ID序列)联系起来。图1C描绘了用P5引物测序的Illumina文库的Sanger测序色谱图。Read 1和Read 2分别表示第一和第二通用序列。

图2描绘了SIT-seq分子设计的非限制性实例(例如，用于从10x Genomics 5'基因表达试剂盒或5'偏向RNA-Seq文库生成的cDNA)。

图3描绘了Illumina平台上SIT-seq文库测序的非限制性实例。

图4描绘了使用杂交和延伸的靶标富集的非限制性实例。

图5描绘了使用RNase H依赖性PCR(rhPCR)的靶标富集的非限制性实例。

具体实施方式

以下是示例实施方式的描述。

除非另有定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员普遍理解的相同含义。

在一方面，本发明提供了一种生成用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)将第一寡核苷酸退火至核酸模板，其包含靶核酸分子序列、标签序列和第一通用序列的至少一部分，其中，靶核酸分子序列包含目标基因座；

b)从退火的第一寡核苷酸进行核酸模板导向的核酸延伸以产生第一延伸产物，其包含含有目标基因座的靶核酸分子序列的全部或部分、标签序列和第一通用序列的至少一部分；

从而产生用于测序的标记DNA扩增子。

在某些实施方式中：

a)核酸模板包含截短的第一通用序列；

b)环化的DNA模板包含整个第一通用序列和整个第二通用序列；和

c)DNA扩增子包含整个第一通用序列和整个第二通用序列。

在某些实施方式中，所述方法进一步包含进行第一延伸产物导向的核酸扩增以扩增第一延伸产物。

在某些实施方式中，使用以下进行第一延伸产物导向的核酸扩增：

a)第一寡核苷酸；和

b)第一反向引物，其包含截短的第一通用序列的至少一部分。

a)提供核酸模板，其包含靶核酸分子序列、标签序列和第一通用序列的至少一部分，其中，所述靶核酸分子序列包含目标基因座；

i.在第一寡核苷酸和第一引物退火至核酸模板中的互补核苷酸序列的条件下，使核酸模板与包含第一寡核苷酸和第一引物的反应混合物接触，其中，第一引物包含第一通用序列的至少一部分，并且其中，第一寡核苷酸、第一引物或两者都包

含第二通用序列；和

ii.延伸第一寡核苷酸和第一引物中的每一个；

从而生成用于测序的标记DNA扩增子。

a)提供核酸模板，其从5'端到3'端包含截短的第一通用序列、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列，其中，所述靶核酸分子序列包含目标基因座；

ii.延伸第一寡核苷酸和第一反向引物中的每一个；

c)环化第一扩增产物以产生环化的DNA模板，其包含第二通用序列、目标基因座、标签序列、第一通用序列和[i7]；和

从而生成用于测序的标记DNA扩增子。

a)提供核酸模板，其从5'端到3'端包含截短的第一通用序列、标签序列、第二模板转换寡聚物(TSO2)序列和靶核酸分子序列，其中，所述靶核酸分子序列包含目标基因座；

ii.延伸第一寡核苷酸和第一反向引物中的每一个；

从而生成用于测序的标记DNA扩增子。

在某些实施方式中：

a)核酸模板包含截短的第一通用序列；

c)DNA扩增子包含整个第一通用序列和整个第二通用序列。

应当注意的是，贯穿本说明书，术语“包含”用于表示本发明的实施方式“包含”所指出的特征，并且因此也可以包括其他特征。然而，在本发明的上下文中，术语“包含”也可以涵盖本发明“基本上由相关特征组成”或“由相关特征组成”的实施方式。

术语“核苷酸”是指天然存在的核糖核苷酸或脱氧核糖核苷酸单体，以及它们的非天然存在的衍生物和类似物。因此，核苷酸可以包括，例如，包含天然存在的碱基(例如，A、G、C或T)的核苷酸、包含修饰碱基(例如，7-脱氮鸟苷或肌苷)的核苷酸和包含修饰核糖的核苷酸(例如，锁核酸(LNA))。

核酸模板

在某些实施方式中，核酸模板是互补DNA(cDNA)模板。如本文所用，“互补DNA”或“cDNA”是指在逆转录酶催化的反应中从单链RNA(例如，信使RNA(mRNA)、非聚腺苷酸化RNA、微小RNA)模板合成的核酸分子。在某些实施方式中，由逆转录酶催化的反应使用选自oligo(dT)引物、基因特异性引物和随机寡聚体的RT引物。在某些实施方式中，随机寡聚体是随机六聚体。

在某些实施方式中，核酸模板是通过cDNA分子的扩增产生的双链DNA分子(例如，扩增子)。

在某些实施方式中，cDNA模板是通过反转录来自单个细胞的RNA(例如，mRNA)获得的。在其他实施方式中，cDNA模板是通过逆转录来自多个细胞的RNA(例如，mRNA)获得的。细胞的非限制性实例包括哺乳动物细胞、植物细胞、细菌细胞和真菌细胞。在某些实施方式中，细胞是哺乳动物细胞。在某些实施方式中，细胞是癌细胞。在某些实施方式中，癌症是血癌(白血病、淋巴瘤或骨髓瘤)。在某些实施方式中，细胞是转移的癌细胞。

在某些实施方式中，cDNA模板对应于10x Genomics’3’RNA-Seq文库(图1A和1B)的cDNA。在某些实施方式中，cDNA模板对应于第一链cDNA。在某些实施方式中，cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列和靶核酸分子序列。在某些实施方式中，cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列。在某些实施方式中，cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、poly(T)序列和靶核酸分子序列。在某些实施方式中，cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、poly(T)序列、靶核酸分子序列和TSO1序列。在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中，第一通用序列的至少一部分是整个第一通用序列。

在某些实施方式中，TSO1序列包含

5’AAGCAGTGGTATCAACGCAGAGTACATrGrGrG 3’(SEQ ID NO:1)。如本文所用，“rG”代表核糖鸟苷。

在某些实施方式中，TSO1序列包含

5’AGAGACAGATTGCGCAATGNNNNNNNNrGrGrG 3’(SEQ ID NO:2)，其中，rG是核糖鸟苷。

在某些实施方式中，TSO1序列包含5’AAGCAGTGGTATCAACGCAGAGTACATrGrG+G 3’(SEQ ID NO:3)，其中，rG是核糖鸟苷，并且+G是锁核酸(LNA)修饰的鸟苷。

在某些实施方式中，cDNA模板对应于10x Genomics’5’RNA-Seq文库的cDNA(图2)。在某些实施方式中，cDNA模板对应于第二链cDNA。在某些实施方式中，cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列和靶核酸分子序列。在某些实施方式中，cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列和poly(A)序列。在某些实施方式中，cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列和PCR handle序列。在某些实施方式中，cDNA模板从5'端到3'端包含第一通用序列的至少一部分、标签序列、靶核酸分子序列、poly(A)序列和PCR handle序列。在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中，第一通用序列的至少一部分是整个第一通用序列。

在某些实施方式中，cDNA模板从5'端到3'端包含第二模板转换寡聚物(TSO2)序列和靶核酸分子序列。在某些实施方式中，cDNA模板从5'端到3'端包含TSO2序列、靶核酸分子序列和poly(A)序列。在某些实施方式中，cDNA模板从5'端到3'端包含TSO2序列、靶核酸分子序列和PCR handle序列。在某些实施方式中，cDNA模板从5'端到3'端包含TSO2序列、靶核酸分子序列、poly(A)序列和PCR handle序列。

在某些实施方式中，PCR handle序列包含5’AAGCAGTGGTATCAACGCAGAGTAC 3’(SEQID NO:4)。

在某些实施方式中，TSO2序列从5'端到3'端包含截短的第一通用序列、标签序列和5’TTTCTTATATrGrGrG 3’(SEQ ID NO:6)。在某些实施方式中，TSO2序列从5'端到3'端包含5’CTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:5)、标签序列和5’TTTCTTATATrGrGrG 3’(SEQ ID NO:6)。

在某些实施方式中，cDNA模板在多个cDNA中。

在某些实施方式中，所述方法进一步包括进行靶核酸分子(例如，靶mRNA)的逆转录以生成核酸模板(例如，cDNA模板)。在某些实施方式中，进行靶核酸分子的逆转录包括使mRNA(例如，来自单个细胞)与逆转录寡核苷酸和逆转录酶接触。在某些实施方式中，逆转录寡核苷酸选自由oligo(dT)引物、基因特异性引物和随机寡聚物组成的组。在某些实施方式中，随机寡聚体是随机六聚体。在某些实施方式中，逆转录寡核苷酸与珠结合。在某些实施方式中，样品(例如单个细胞)中的靶核酸分子和非靶核酸分子(即mRNA)都被逆转录，从而产生与非靶cDNA产物混合的cDNA模板(靶cDNA产物)。

在某些实施方式中，所述方法进一步包括进行cDNA末端的快速扩增(RACE)以生成核酸模板(例如，cDNA模板)。在某些实施方式中，进行5'-RACE。在某些实施方式中，进行3'-RACE。

靶核酸分子

术语“靶核酸分子”是指包含被分析的连续核苷酸序列的核酸分子(例如，就表达水平、序列信息或突变的存在进行分析)。

靶核酸分子可以是，例如，DNA、cDNA或RNA(例如，非编码RNA或mRNA)。在某些实施方式中，靶核酸分子是非编码RNA。在某些实施方式中，靶核酸分子是mRNA。在某些实施方式中，靶核酸分子包含poly(A)序列。

关于核酸的术语“序列”是指通过共价键(例如，磷酸二酯键)连接的一系列连续的核苷酸。

在某些实施方式中，靶核酸分子序列包含一个目标基因座。在某些实施方式中，目标基因座包含突变、多态性、***、缺失、基因融合、编辑的核苷酸、修饰的核苷酸、转基因或其组合。在某些实施方式中，靶核酸分子序列包含至少两个目标基因座，例如，2、3、4个以上目标基因座。

通用序列

在某些实施方式中，第一通用序列的至少一部分(例如，截短的第一通用序列)充当用于以测序仪依赖性方式进行下游扩增的PCR handle。第一通用序列可以通过cDNA制备方法来选择。在某些实施方式中，cDNA制备方法是10x Genomics和/或测序仪是Illumina测序仪。在某些实施方式中，截短的第一通用序列是在10x Genomics试剂盒中使用的截短的Illumina Read 1序列。

在某些实施方式中，第一通用序列的至少一部分是整个第一通用序列。在某些实施方式中，整个第一通用序列包含5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ IDNO:7)。

在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中，与整个第一通用序列相比，截短的第一通用序列在5’端缺失至少一个核苷酸。在某些实施方式中，截短的第一通用序列包含5’CTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:5)。

缺失的第一通用序列是指截短的第一通用序列中缺失整个第一通用序列的5'序列。缺失的第一通用序列可包含1-20个核苷酸，例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或1-15、2-15、2-14、3-14、3-13或4-13个核苷酸。

第二通用序列的至少一部分可以基于下游测序仪器来选择或者可以是具有对于PCR特异性而言具有足够高的T_m的任何序列。第二通用序列的至少一部分不应匹配任何已知的天然存在的序列。在某些实施方式中，第二通用序列的至少一部分也在环化事件中起作用。

在某些实施方式中，第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中，第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，整个第二通用序列包含5’ACACGTCTGAACTCC 3’(SEQ ID NO:8)。在某些实施方式中，整个第二通用序列包含5’GGAGTTCAGACGTGT 3’(SEQ ID NO:9)。

标签序列

如本文所用，“细胞识别标签”是指可以掺入延伸产物(例如，扩增子)中并在测序应用中用于鉴定产生延伸产物的特定细胞(例如，单个细胞)或细胞类型的核苷酸序列。细胞识别标签可以包含在引物(例如，延伸引物，如oligo(dT)引物，或扩增引物)中以用于引入延伸产物(例如，RT产物、扩增子)中。可以通过合适的核酸聚合酶，如逆转录酶或DNA聚合酶，将细胞识别标签掺入延伸产物中。

细胞识别标签序列的非限制性实例包括

5’AAACCTGAGAAACCAT 3’(SEQ ID NO:10)，

5’AAACCTGAGAAACCGC 3’(SEQ ID NO:11)，

5’AAACCTGAGAAACCTA3’(SEQ ID NO:12)，

5’AAACCTGAGAAACGAG 3’(SEQ ID NO:13)，

5’AAACCTGAGAAACGCC 3’(SEQ ID NO:14)，

5’AAACCTGAGAAAGTGG 3’(SEQ ID NO:15)，

5’AAACCTGAGAACAACT 3’(SEQ ID NO:16)，

5’AAACCTGAGAACAATC 3’(SEQ ID NO:17)，

5’AAACCTGAGAACTCGG 3’(SEQ ID NO:18)，和

5’AAACCTGAGAACTGTA3’(SEQ ID NO:19)。

细胞识别标签序列的其他实例可以在https://kb.10xgenomics.com/hc/en-us/articles/115004506263-What-is-a-barcode-whitelist-中找到。

“独特分子标识符”或“UMI”，也称为“随机分子标签(RMT)”，是用于标记核酸分子(例如，在扩增之前)并有助于重复项的识别。UMI通常是随机序列，通常大小范围为约4至约20个核苷酸长度。UMI的实例在本领域中是已知的。

在基于孔的***(例如，基于96孔的***)中，如果每个孔包含0或1个细胞，则细胞识别标签序列是可选的。

在某些实施方式中，UMI包含至少一个随机核苷酸序列，例如，1、2、3、4、5、6、7、8、9、10个以上随机核苷酸序列。随机核苷酸序列可包含1、2、3、4、5、6、7个以上核苷酸。某些实施方式中，随机核苷酸是随机六聚体。某些实施方式中，UMI包含10个核苷酸。某些实施方式中，UMI包含12个核苷酸。

第一寡核苷酸

第一寡核苷酸的长度可在约15至约110个核苷酸的范围内。例如，寡核苷酸的长度约为：15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110个核苷酸。在某些实施方式中，寡核苷酸的长度为约：20-110、25-110、25-100、30-100、30-95、35-95、35-90、40-90、40-85、50-85、50-80、55-80、55-75、60-75或60-70个核苷酸。

在某些实施方式中，第一寡核苷酸退火至靶核酸分子序列，该靶核酸分子序列是目标基因座3'的约0-400个核苷酸。例如，约：目标基因座3'的0-375、0-350、0-325、0-300、0-275、0-250、0-225、0-200、0-175、0-150、0-125、0-100、0-75、0-50、或0-25个核苷酸。在某些实施方式中，第一寡核苷酸退火至靶核酸分子序列，该序列是目标基因座3'的约0-150个核苷酸。

分子生物学领域的技术人员可以设计适合于要使用的序列平台和试剂盒的第一寡核苷酸。在某些实施方式中，第一寡核苷酸退火至靶核酸分子序列，该序列是目标基因座3’的约0-134,000个核苷酸(例如，用于纳米孔测序)。在某些实施方式中，第一寡核苷酸退火至靶核酸分子序列，该序列是目标基因座3’的约0-16,000个核苷酸处(例如，用于PacBio测序)。在某些实施方式中，第一寡核苷酸退火至靶核酸分子序列，该序列是目标基因座3’的约0-400个核苷酸(例如，用于Illumina测序)。在某些实施方式中，第一寡核苷酸退火至靶核酸分子序列，该序列是目标基因座3’的约0-150个核苷酸(例如，用于Illumina测序)。

在某些实施方式中，第一寡核苷酸包含靶核酸分子特异性序列。在某些实施方式中，第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列。在某些实施方式中，第一寡核苷酸从5'端到3'端包含缺失的第一通用序列、第二通用序列和靶核酸分子特异性序列。

在某些实施方式中，第一寡核苷酸包含5’GGAAAGAGTGT 3’(SEQ ID NO:20)，5’GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:31)和靶核酸分子特异性序列。在某些实施方式中，第一寡核苷酸包含5’GGAAAGAGTGT 3’(SEQ ID NO:20)、[i7]、5’GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:31)和靶核酸分子特异性序列。[i7]是指示(I7)接头序列(Illumina，San Diego，CA)。在某些实施方式中，[i7]序列选自由SEQ ID NO:34-57组成的组。

在某些实施方式中，第一寡核苷酸包含5’GGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:21)和靶核酸分子特异性序列。

在某些实施方式中，靶核酸分子序列包含至少两个目标基因座。在某些实施方式中，第一寡核苷酸退火至靶核酸分子序列，该序列位于目标基因座的3’(参考图4的可选方案)。在其他实施方式中，所述方法包含以下步骤：

a)将多个寡核苷酸退火至cDNA模板；

b)从多个退火的寡核苷酸进行cDNA模板导向的核酸延伸以产生多个第一延伸产物，其包含含有一个或多个目标基因座的靶核酸分子序列的全部或一部分、标签序列和第一通用序列的至少一部分；

c)环化多个第一延伸产物以产生多个环化的DNA模板，其包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分；和

d)进行环化的DNA模板导向的核酸扩增以产生多个DNA扩增子，其包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分，

从而产生用于测序的多个标记的DNA扩增子。

在某些实施方式中：

a)多个第一延伸产物中的每一个包含截短的第一通用序列；

b)多个环化的DNA模板中的每一个包含整个第一通用序列和整个第二通用序列；和

c)多个DNA扩增子中的每一个包含整个第一通用序列和整个第二通用序列。

在某些实施方式中，从多个退火的寡核苷酸进行cDNA模板导向的核酸延伸使用缺乏5'→3'核酸外切酶活性的DNA聚合酶进行(例如，Bst DNAPolymerase，Large Fragment，New England Biolabs，Ipswich，MA)。

在其他实施方式中，所述方法包括以下步骤：

b)通过以下方式进行核酸模板导向的核酸扩增以产生多种扩增产物：

i.在多个寡核苷酸引物和第一引物退火至核酸模板中的互补核苷酸序列的条件下，使核酸模板与包含多个寡核苷酸引物和第一引物的反应混合物接触，其中，第一引物包含第一通用序列的至少一部分；和

ii.延伸多个寡核苷酸和第一引物中的每一个；

c)环化多个第一扩增产物以产生多个环化的DNA模板，其包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分；和

从而生成用于测序的多个标记的DNA扩增子。

在某些实施方式中：

a)多个环化的DNA模板中的每一个包含整个第一通用序列和整个第二通用序列；和

b)多个DNA扩增子中的每一个包含整个第一通用序列和整个第二通用序列。

在某些实施方式中，核酸模板导向的核酸扩增使用缺乏5'→3'核酸外切酶活性的DNA聚合酶进行(例如，Bst DNA Polymerase，Large Fragment，New England Biolabs，Ipswich，MA)。

核酸模板导向的核酸延伸

在某些实施方式中，第一延伸产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、标签序列和第一通用序列的至少一部分。在某些实施方式中，第一延伸产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列和第一通用序列的至少一部分。

在某些实施方式中，第一延伸产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列和第一通用序列的至少一部分。在某些实施方式中，第一延伸产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列，标签序列和第一通用序列的至少一部分。

在某些实施方式中，第一延伸产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分和TSO2序列。在某些实施方式中，第一延伸产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分和TSO2序列。

在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中，第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。

在某些实施方式中，第一延伸产物在5’端包含缺失的第一通用序列。在某些实施方式中，第一延伸产物从5'端到3'端包含缺失的第一通用序列、第二通用序列、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列和截短的第一通用序列。在某些实施方式中，第一延伸产物从5'端到3'端包含缺失的第一通用序列、第二通用序列、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列和截短的第一通用序列。在某些实施方式中，第一延伸产物从5'端到3'端包含缺失的第一通用序列、第二通用序列、包含目标基因座的靶核酸分子序列的全部或一部分和TSO2序列。

在某些实施方式中，第一延伸产物包含全部靶核酸分子序列。在某些实施方式中，第一延伸产物包含含有目标基因座的靶核酸分子序列的一部分。

第一延伸产物导向的核酸扩增

在某些实施方式中，所述方法进一步包括进行第一延伸产物导向的核酸扩增以扩增第一延伸产物。在某些实施方式中，使用第一寡核苷酸和第一引物进行第一延伸产物导向的核酸扩增。

在某些实施方式中，第一引物包含整个第一通用序列的至少一部分。在某些实施方式中，第一引物包含截短的第一通用序列的至少一部分。

在某些实施方式中，第一引物进一步包含第二通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含第二通用序列的至少一部分、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含第二通用序列的至少一部分和第一通用序列的至少一部分。在某些实施方式中，第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中，第一引物从5'端到3'端包含整个第二通用序列、缺失的第一通用序列和截短的第一通用序列的至少一部分。

在某些实施方式中，第一引物进一步包含[i7]。在某些实施方式中，第一引物从5'端到3'端包含第二通用序列的至少一部分、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含第二通用序列的至少一部分、[i7]和第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含整个第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含[i7]和整个第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含[i7]和截短的第一通用序列的至少一部分。在某些实施方式中，[i7]序列选自由SEQ ID NO:34-57组成的组。

在某些实施方式中，第一引物是第一反向引物。在某些实施方式中，第一反向引物包含截短的第一通用序列的至少一部分。在某些实施方式中，第一反向引物从5'端到3'端包含缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一反向引物从5'端到3'端包含第二通用序列、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一反向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。在某些实施方式中，第一反向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。

在某些实施方式中，第一引物是第一正向引物。在某些实施方式中，第一正向引物包含截短的第一通用序列的至少一部分。在某些实施方式中，第一正向引物从5'端到3'端包含缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一正向引物从5'端到3'端包含第二通用序列、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一正向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一正向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。

在某些实施方式中(3’文库)，第一延伸产物导向的核酸扩增产物从5'端到3'端包含5’GGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:21)、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)、细胞识别标签序列、UMI、5’AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT 3’(SEQ ID NO:23)、[i7]和5’GTGACTGGAGTTCAGACGTGT 3’(SEQ ID NO:24)。

在某些实施方式中(5’文库)，第一延伸产物导向的核酸扩增产物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)、细胞识别标签序列、5’TTTCTTATATGGG 3’(SEQ ID NO:25)、包含目标基因座的靶核酸分子序列的全部或一部分和5’AGATCGGAAGAGCACACGTCTGAACTCC 3’(SEQ ID NO:26)。

在某些实施方式中，第一寡核苷酸或第一引物在3’端进一步包含RNA碱基，随后是封闭结构域；扩增第一延伸产物包括进行RNase H依赖性PCR。在某些实施方式中，进行RNA酶H依赖性PCR增加了第一延伸产物导向的核酸扩增的特异性。例如，国际申请No.PCT/IB2019/001398中描述了所述方法的细节，其内容通过引用并入本文。

核酸模板导向的核酸扩增

在某些实施方式中，第一寡核苷酸包含靶核酸分子特异性序列。在某些实施方式中，第一寡核苷酸从5'端到3'端包含第二通用序列的至少一部分和靶核酸分子特异性序列。在某些实施方式中，第一寡核苷酸从5'端到3'端包含缺失的第一通用序列、第二通用序列的至少一部分和靶核酸分子特异性序列。在某些实施方式中，第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第二通用序列的至少一部分是截短的第二通用序列。

在某些实施方式中，第一引物包含整个第一通用序列的至少一部分。在某些实施方式中，第一引物包含截短的第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含缺失的第一通用序列和截短的第一通用序列的至少一部分。

在某些实施方式中，第一引物进一步包含第二通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含第二通用序列的至少一部分、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含第二通用序列的至少一部分和整个第一通用序列的至少一部分。在某些实施方式中，第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中，第一引物从5'端到3'端包含整个第二通用序列、缺失的第一通用序列和截短的第一通用序列的至少一部分。

在某些实施方式中，第一引物进一步包含[i7]。在某些实施方式中，第一引物从5'端到3'端包含[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含[i7]和整个第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含第二通用序列的至少一部分、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。在某些实施方式中，第一引物从5'端到3'端包含第二通用序列的至少一部分、[i7]和整个第一通用序列的至少一部分。在某些实施方式中，第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中，第一引物从5'端到3'端包含整个第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。

在某些实施方式中：

a)第一寡核苷酸从5'端到3'端包含整个第二通用序列和靶核酸分子特异性序列；和

b)第一引物从5'端到3'端包含整个第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分。

在某些实施方式中，第一引物是第一反向引物。在某些实施方式中，第一反向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。

在某些实施方式中，第一引物是第一正向引物。在某些实施方式中，第一正向引物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]和5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)。

在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分、[i7]和第二通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分、[i7]和第二通用序列的至少一部分(参见，例如，图1B)。在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、TSO2序列、[i7]和第二通用序列的至少一部分(参见，例如，图2)。

在某些实施方式中，第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分、[i7]和第二通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分、[i7]和第二通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、TSO2序列、[i7]和第二通用序列的至少一部分。

在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分和[i7]。在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分和[i7]。在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、TSO2序列和[i7]。

在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列、包含目标基因座的靶核酸分子序列的全部或一部分、TSO2序列和第二通用序列的至少一部分。

在某些实施方式中，第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、TSO2序列和第二通用序列的至少一部分。

在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、标签序列和第一通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)序列、标签序列和第一通用序列的至少一部分。在某些实施方式中，第一扩增产物从5'端到3'端包含第二通用序列的至少一部分、包含目标基因座的靶核酸分子序列的全部或一部分和TSO2序列。

在某些实施方式中，第一通用序列的至少一部分是整个第一通用序列。在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中，第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中，第一通用序列的至少一部分是整个第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第一通用序列的至少一部分是整个第一通用序列并且第二通用序列的至少一部分是截短的第二通用序列。在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列并且第二通用序列的至少一部分是截短的第二通用序列。

在某些实施方式中，第一扩增产物包含全部靶核酸分子序列。在某些实施方式中，第一扩增产物包含含有目标基因座的靶核酸分子序列的一部分。

在某些实施方式中(3’文库)，第一扩增产物从5'端到3'端包含5’GGAGTTCAGACGTGTGCTCTTCCGATCT 3’(SEQ ID NO:21)、包含目标基因座的靶核酸分子序列的全部或一部分、poly(A)、细胞识别标签序列、UMI、5’AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT 3’(SEQ ID NO:23)、[i7]和5’GTGACTGGAGTTCAGACGTGT 3’(SEQ ID NO:24)。

在某些实施方式中(5’RNA-Seq文库)，第一扩增产物从5'端到3'端包含5’ACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:22)、[i7]、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’(SEQ ID NO:7)、细胞识别标签序列，5’TTTCTTATATGGG 3’(SEQ ID NO:25)、包含目标基因座的靶核酸分子序列的全部或一部分和5’AGATCGGAAGAGCACACGTCTGAACTCC 3’(SEQID NO:26)。

在某些实施方式中，第一寡核苷酸或第一引物在3'端进一步包含RNA碱基，随后是封闭结构域；扩增第一延伸产物包括进行RNase H依赖性PCR。在某些实施方式中，进行依赖于RNase HPCR增加了核酸模板导向的核酸扩增的特异性。例如，国际申请No.PCT/IB2019/001398中描述了该方法的细节，其内容通过引用并入本文。

环化第一个延伸和/或扩增产物

在某些实施方式中，所述方法包括单个环化步骤。在某些实施方式中，需要单个环化步骤的方法提高了效率、减少了数据丢失或其组合。

在某些实施方式中，环化第一延伸和/或扩增产物包括由吉布森组装介导的分子内连接、夹板连接或使用热稳定的ATP依赖性连接酶的连接。在某些实施方式中，环化第一延伸和/或扩增产物包括由吉布森组装介导的分子内连接。在某些实施方式中，环化第一延伸和/或扩增产物包括由夹板连接介导的分子内连接。在某些实施方式中，环化第一延伸和/或扩增产物包括由使用热稳定的ATP依赖性连接酶的连接介导的分子内连接。热稳定的ATP依赖性连接酶的非限制性实例包括CIRCL-连接酶和T4 DNA连接酶。

环化的DNA模板可以是单链或双链的。

在某些实施方式中，环化的DNA模板包括：

a)第二通用序列的至少一部分；

b)包含目标基因座的靶核酸分子序列的全部或一部分；

c)标签序列；和

d)第一通用序列的至少一部分。

在某些实施方式中，环化的DNA模板包括：

a)第二通用序列的至少一部分；

b)包含目标基因座的靶核酸分子序列的全部或一部分；

c)标签序列；

d)第一通用序列的至少一部分；和

e)[i7]。

在某些实施方式中，环化的DNA模板包括：

a)第二通用序列的至少一部分；

b)包含目标基因座的靶核酸分子序列的全部或一部分；

c)poly(A)序列；

d)标签序列；第一通用序列的至少一部分；和

e)第二通用序列的至少一部分。

在某些实施方式中，环化的DNA模板包括：

a)第二通用序列的至少一部分；

b)包含目标基因座的靶核酸分子序列的全部或一部分；

c)poly(A)序列；

d)标签序列；

e)第一通用序列的至少一部分；和

f)[i7]。

在某些实施方式中，环化的DNA模板包括：

a)第二通用序列的至少一部分；

b)包含目标基因座的靶核酸分子序列的全部或一部分；和

c)TSO2序列。

在某些实施方式中，环化的DNA模板包括：

a)第二通用序列的至少一部分；

b)包含目标基因座的靶核酸分子序列的全部或一部分；

c)TSO2序列；和

d)[i7]。

在某些实施方式中，第一通用序列的至少一部分是整个第一通用序列。在某些实施方式中，第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第一通用序列的至少一部分是整个第一通用序列并且第二通用序列的至少一部分是整个第二通用序列。在某些实施方式中，第一通用序列的至少一部分是截短的第一通用序列。在某些实施方式中，第二通用序列的至少一部分是截短的第二通用序列。

环化的DNA模板导向的核酸扩增

在某些实施方式中，环化的DNA模板导向的核酸扩增包括用高保真DNA聚合酶扩增环化的DNA模板的一部分。高保真DNA聚合酶的非限制性实例包括

高保真DNA聚合酶(New England Biolabs Inc.,Ipswich,MA)和KOD DNA聚合酶(Sigma Aldrich,St.Louis,MO)。

在某些实施方式中，进行环化的DNA模板导向的核酸扩增使用第二正向引物和第二反向引物。

在某些实施方式中，第二正向引物或第二反向引物包含靶核酸分子特异性序列、标签序列的全部或一部分、第一通用序列的全部或一部分、poly(A)序列、或其组合。

在某些实施方式中，第二正向引物包含靶核酸分子特异性序列。在某些实施方式中，第二正向引物从5'端到3'端包含Illumina P7序列和靶核酸分子特异性序列。在某些实施方式中，第二正向引物包含poly(A)序列。在某些实施方式中，第二正向引物从5'端到3'端包含Illumina P7序列和poly(A)序列。在某些实施方式中，第二正向引物包含TSO2序列。在某些实施方式中，第二正向引物从5'端到3'端包含Illumina P7序列和TSO2序列。

在某些实施方式中，第二反向引物包含靶核酸分子特异性序列。在某些实施方式中，第二反向引物从5'端到3'端包含Illumina P5序列和靶核酸分子特异性序列。

在某些实施方式中：

a)第二正向引物进一步包含与第一固定化寡核苷酸序列相反且互补的序列；和

b)第二反向引物进一步包含与第二固定化寡核苷酸序列反向和互补的序列。

在某些实施方式中，第一和第二固定化寡核苷酸被固定在Illumina流通池上。

在某些实施方式中，第一和第二固定化寡核苷酸序列分别包含：

a)CCTCTCTATGGGCAGTCGGTGAT(SEQ ID NO:27)和CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO:28)；

b)CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO:28)和CCTCTCTATGGGCAGTCGGTGAT(SEQ ID NO:27)；或

c)CAAGCAGAAGACGGCATACGAGAT(SEQ ID NO:29)和AATGATACGGCGACCACCGAGATCTACAC(SEQ ID NO:30)。

在某些实施方式中(3’RNA-Seq文库)：

a)第二正向引物从5'端到3'端包含5’AATGATACGGCGACCACCGAGATCTACAC 3’(SEQID NO:30)和靶核酸分子特异性序列；和

b)第二反向引物从5'端到3'端包含5’CAAGCAGAAGACGGCATACGAGAT 3’(SEQ IDNO:29)和poly(A)序列或靶核酸分子特异性序列。

在某些实施方式中(5’RNA-Seq文库)：

b)第二反向引物从5'端到3'端包含5’CAAGCAGAAGACGGCATACGAGAT 3’(SEQ IDNO:29)和TSO2序列或靶核酸分子特异性序列。

在某些实施方式中，第二正向引物或第二反向引物在3'端进一步包含RNA碱基，随后是封闭结构域；扩增环化的DNA模板包括进行RNase H依赖性PCR(rhPCR)。在某些实施方式中，进行rhPCR以增加PCR特异性。例如，国际申请No.PCT/IB2019/001398中描述了该方法的细节，其内容通过引用并入本文。

DNA扩增子

在某些实施方式中，DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列的至少一部分、标签序列、poly(T)序列和Illumina P7序列(参见，例如，图1A)。在某些实施方式中，DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分、标签序列、poly(T)序列和Illumina P7序列。

在某些实施方式中，DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、TSO2序列和Illumina P7序列(参见，例如，图2)。在某些实施方式中，DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、TSO2序列和Illumina P7序列。

在某些实施方式中，DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列的至少一部分、标签序列和Illumina P7序列。在某些实施方式中，DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分、标签序列和Illumina P7序列。

在某些实施方式中，DNA扩增子的长度在约100个碱基对和约5,000个碱基对之间。例如，长度约：100-4,500、150-4,500、150-4,000、200-4,000、200-3,500、250-3,500、250-3,000、300-3,000、300-2,500、350-2,500、350-2,000、350-1,500、350-1,000、300-1,000、300-800、400-800或400-600个碱基对。在某些实施方式中，DNA扩增子的长度在约200个碱基对和约500个碱基对之间。

在某些实施方式中，DNA扩增子的长度小于约5,000个碱基对。例如，长度小于约4,500、4,000、3,500、3,000、2,500、2,000、1,500、1,000、900、800、700、600、500、400、300或200个碱基对。

在某些实施方式中(3’RNA-Seq文库)，DNA扩增子从5'端到3'端包含5’AATGATACGGCGACCACCGAGATCTACAC 3’(SEQ ID NO:30)、目标基因座、5’AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:32)、[i7]、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’(SEQ ID NO:7)、细胞识别标签序列、UMI、oligo(dT)、靶核酸分子特异性序列的反向和互补序列和5’ATCTCGTATGCCGTCTTCTGCTTG 3’(SEQ ID NO:33)。

在某些实施方式中(5’RNA-Seq文库)，DNA扩增子从5'端到3'端包含5’AATGATACGGCGACCACCGAGATCTACAC 3’(SEQ ID NO:30)、目标基因座、5’AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC 3’(SEQ ID NO:32)、[i7]、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’(SEQ ID NO:7)、细胞识别标签序列、UMI、TSO2、靶核酸分子特异性序列和5’ATCTCGTATGCCGTCTTCTGCTTG 3’(SEQ ID NO:33)。

测序

在某些实施方式中，所述方法用于制作测序文库。

在某些实施方式中，所述方法进一步包含对DNA扩增子进行测序。

在某些实施方式中，使用第一通用序列特异性引物、第二通用序列特异性引物、I7序列特异性引物或前述的组合进行测序。在某些实施方式中，第一通用序列特异性引物包含ACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO:7)的全部或一部分。在某些实施方式中，第二通用序列特异性引物包含GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:31)的全部或一部分。在某些实施方式中，I7序列特异性引物包含AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO:32)的全部或一部分。

在某些实施方式中，所述方法鉴定修饰的核苷酸。鉴定修饰的核苷酸可能需要对样品进行预处理。

在另一方面，本发明提供了用于测序的标记DNA扩增子，其从5'端到3'端包含目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分和标签序列。另一方面，本发明提供了用于测序的标记DNA扩增子，其从5'端到3'端包含目标基因座、第二通用序列、第一通用序列的至少一部分和标签序列。另一方面，本发明提供了用于测序的标记DNA扩增子，其从5'端到3'端包含目标基因座、第二通用序列的至少一部分、第一通用序列和标签序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含目标基因座、第二通用序列、第一通用序列和标签序列。

在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分、标签序列和IlluminaP7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、第一通用序列的至少一部分、标签序列和Illumina P7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、第一通用序列、标签序列和Illumina P7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、第一通用序列、标签序列和Illumina P7序列。

在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列的至少一部分、标签序列和Illumina P7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列的至少一部分、标签序列和IlluminaP7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列、标签序列和Illumina P7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和Illumina P7序列。

在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列的至少一部分、标签序列、poly(T)序列和Illumina P7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列的至少一部分、标签序列、poly(T)序列和Illumina P7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第一通用序列、标签序列、poly(T)序列和Illumina P7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列、poly(T)序列和Illumina P7序列。

在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列的至少一部分、[i7]、第二模板转换寡聚物(TSO2)序列和IlluminaP7序列。在某些实施方式中，标记的DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第二模板转换寡聚物(TSO2)序列和Illumina P7序列。

实施例

实施例1

方法

如图1A所示，使用包含部分Illumina Read 1的oligo dT引物逆转录来自HEK293T细胞系的cDNA。使用部分Read 1、i7和Read 2标记的第一基因特异性寡核苷酸来生成单链扩增子。单链扩增子的分子结构如“3”所示。使用互补RNA寡核苷酸进行夹板连接以桥连5'和3'端。夹板连接生成单链环化模板，如“4”所示。利用P5-GSP和P7-GSP或P7-polyA的PCR产生最终的测序文库。生成的cDNA具有简化的分子结构，类似于使用10x Genomics Chromium3'基因表达试剂盒(10x Genomics，Pleasanton，CA)制备的cDNA。

cDNA合成后，使用KAPA HiFi DNA聚合酶(Kapa Biosystems Inc.，Wilmington，MA)进行半巢式基因特异性PCR。引物对由在目标基因座上游引发1-300个碱基对(例如，约50个碱基对)的基因特异性引物以及引发到cDNA 3'端的Read 1特异性引物组成。两种引物都在5'端包含Illumina Read 2序列，其提供了后续吉布森组装所必需的同源臂。用ZymoDNA清洁和浓缩(DCC-5)柱(Zymo Research，Irvine，CA)清理半巢式PCR扩增子。

纯化的PCR扩增子使用吉布森组装进行自环化。为了有利于分子内环化而不是分子间连接，吉布森组装在1mL的大反应体积中进行。建立以下反应并在50℃温育1小时：100-1000ng PCR扩增子、1x CutSmart缓冲液(New England Biolabs Inc.，Ipswich，MA)和10μL2x Gibson mastermix(New England Biolabs Inc.，Ipswich，MA)加水至终体积1mL。使用6Uλ核酸外切酶(New England Biolabs Inc.，Ipswich，MA)在37℃去除未连接的线性模板30分钟，并在65℃灭活20分钟。使用Zymo DCC-5柱(Zymo Research，Irvine，CA)清理环化模板。

设置第二轮PCR以生成短片段以紧密连接目标基因座和逆转录引发寡核苷酸(相当于单细胞cDNA文库中包含细胞ID的区域)，从而可以使用短读Illumina平台对它们进行测序。第二轮PCR中使用的引物是两个基因特异性引物，每个引物都附加有Illumina P5或Illumina P7接头。

最终的测序文库用Zymo DCC-5柱清理并用NEBNext文库定量试剂盒(New EnglandBiolabs Inc.，Ipswich，MA)定量。使用Illumina平台，Read 1序列包括逆转录引发寡核苷酸，而Read 2提供关于目标基因座的序列信息，即突变。

结果

Sanger测序用于验证该Illumina测序文库的分子设计，使用P5作为Sanger测序引物。在图1C中，Sanger测序根据分子设计识别关键元素，用于将远距离目标基因座连接到逆转录引物(cDNA 3'端的10x Genomics Cell ID条形码)。

初步数据表明，本文公开的分子设计产生了一个最佳文库，该文库同时提供有关目标基因座和cDNA标签(条形码/UMI)的序列信息。之前，使用基于液滴或纳米孔的平台生成的单细胞RNA-Seq文库不允许研究人员获得有关特定目标基因座的单细胞信息，并且在很大程度上仅适用于基因表达谱分析。通过这种分子工作流程，现在可以对目标基因座进行测序，同时保留单细胞cDNA标签提供的单细胞信息。

实施例2

如图4所示，可选方案B，多个寡核苷酸在1x NEB Thermo Pol缓冲液(New EnglandBiolabs Inc.，Ipswich，MA)中退火到cDNA模板，在60℃过夜。按照制造商方案(NewEngland Biolabs Inc.，Ipswich，MA)，通过添加Bst DNA聚合酶、大片段来使退火的寡核苷酸延伸。使用与PCR handle和截短的Read 1序列杂交的引物，将得到的延伸产物用作最小PCR扩增的模板。然后将产物用于自环化，然后使用第二正向和第二反向引物进行第二轮半巢式PCR，以产生最终的测序文库。

实施例3

如图5所示，PCR反应是根据KAPA HiFi Readymix(Roche，Basel，Switzerland)的制造商方案进行的，并进行了以下修改。rhPCR引物包含一个核糖核苷酸残基和一个3'封闭部分。在PCR循环程序的退火步骤中，退火到靶标的rhPCR引物通过用1mU/μL的RNase H2切割来激活。然后将产物用于自环化，然后使用第二正向和第二反向引物进行第二轮半巢式PCR，以产生最终的测序文库。

本文引用的所有专利、公开申请和参考文献的教导均通过引用以其整体并入本文。

虽然已经具体示出和描述了示例实施方式，但是本领域的技术人员将理解，在不脱离所附权利要求所涵盖的实施方式的范围的情况下，可以在其中进行形式和细节的各种改变。

表

/>

rG：核糖鸟苷；+G：锁核酸(LNA)修饰的鸟苷

序列表

<110> 新加坡国立大学

<120> 靶向单细胞cDNA测序的方法和组合物

<130> 4459.1155001

<150> 63/076,672

<151> 2020-09-10

<160> 57

<170> FastSEQ for Windows Version 4.0

<210> 1

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> modified_base

<222> (28)...(30)

<223> n是单脱氧鸟嘌呤

<400> 1

aagcagtggt atcaacgcag agtacatnnn 30

<210> 2

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> misc_feature

<222> (20)...(27)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (28)...(30)

<223> n是单脱氧鸟嘌呤

<400> 2

agagacagat tgcgcaatgn nnnnnnnnnn 30

<210> 3

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> misc_feature

<222> (28)...(29)

<223> n是单脱氧鸟嘌呤

<220>

<221> misc_feature

<222> (30)...(30)

<223> n is locked nucleic acid (LNA)-modified guanosine

(+G)

<400> 3

aagcagtggt atcaacgcag agtacatnnn 30

<210> 4

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 4

aagcagtggt atcaacgcag agtac 25

<210> 5

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 5

ctacacgacg ctcttccgat ct 22

<210> 6

<211> 13

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> misc_feature

<222> (11)...(13)

<223> n是单脱氧鸟嘌呤

<400> 6

tttcttatat nnn 13

<210> 7

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 7

acactctttc cctacacgac gctcttccga tct 33

<210> 8

<211> 15

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 8

acacgtctga actcc 15

<210> 9

<211> 15

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 9

ggagttcaga cgtgt 15

<210> 10

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 10

aaacctgaga aaccat 16

<210> 11

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 11

aaacctgaga aaccgc 16

<210> 12

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 12

aaacctgaga aaccta 16

<210> 13

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 13

aaacctgaga aacgag 16

<210> 14

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 14

aaacctgaga aacgcc 16

<210> 15

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 15

aaacctgaga aagtgg 16

<210> 16

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 16

aaacctgaga acaact 16

<210> 17

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 17

aaacctgaga acaatc 16

<210> 18

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 18

aaacctgaga actcgg 16

<210> 19

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 19

aaacctgaga actgta 16

<210> 20

<211> 11

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 20

ggaaagagtg t 11

<210> 21

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 21

ggagttcaga cgtgtgctct tccgatct 28

<210> 22

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 22

acacgtctga actccagtca c 21

<210> 23

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 23

agatcggaag agcgtcgtgt agggaaagag tgt 33

<210> 24

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 24

gtgactggag ttcagacgtg t 21

<210> 25

<211> 13

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 25

tttcttatat ggg 13

<210> 26

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 26

agatcggaag agcacacgtc tgaactcc 28

<210> 27

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 27

cctctctatg ggcagtcggt gat 23

<210> 28

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 28

ccatctcatc cctgcgtgtc tccgactcag 30

<210> 29

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 29

caagcagaag acggcatacg agat 24

<210> 30

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 30

aatgatacgg cgaccaccga gatctacac 29

<210> 31

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 31

gtgactggag ttcagacgtg tgctcttccg atct 34

<210> 32

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 32

agatcggaag agcacacgtc tgaactccag tcac 34

<210> 33

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 33

atctcgtatg ccgtcttctg cttg 24

<210> 34

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 34

gtgaatat 8

<210> 35

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 35

acaggcgc 8

<210> 36

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 36

catagagt 8

<210> 37

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 37

tgcgagac 8

<210> 38

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 38

tctctact 8

<210> 39

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 39

ctctcgtc 8

<210> 40

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 40

ccaagtct 8

<210> 41

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 41

ttggactc 8

<210> 42

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 42

gcagaatt 8

<210> 43

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 43

atgaggcc 8

<210> 44

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 44

actaagat 8

<210> 45

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 45

gtcggagc 8

<210> 46

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 46

agcctcat 8

<210> 47

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 47

gattctgc 8

<210> 48

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 48

tcgtagtg 8

<210> 49

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 49

ctacgaca 8

<210> 50

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 50

atggcatg 8

<210> 51

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 51

gcaatgca 8

<210> 52

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 52

cttatcgg 8

<210> 53

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 53

tccgctaa 8

<210> 54

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 54

gatctatc 8

<210> 55

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 55

agctcgct 8

<210> 56

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 56

acactaag 8

<210> 57

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 57

gtgtcgga 8

Claims

1.一种生成用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)将第一寡核苷酸退火至核酸模板，所述核酸模板包含靶核酸分子序列、标签序列和第一通用序列的至少一部分，其中，所述靶核酸分子序列包含目标基因座；

c)环化所述第一延伸产物以产生环化的DNA模板，所述环化的DNA模板包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分；和

d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子，所述DNA扩增子包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分，

从而生成用于测序的标记DNA扩增子。

2.如权利要求1所述的方法，其中：

a)所述核酸模板包含截短的第一通用序列；

b)所述环化的DNA模板包含整个第一通用序列和整个第二通用序列；和

c)所述DNA扩增子包含整个第一通用序列和整个第二通用序列。

3.如权利要求2所述的方法，其进一步包括进行第一延伸产物导向的核酸扩增以扩增所述第一延伸产物。

4.如权利要求3所述的方法，其中，使用以下进行第一延伸产物导向的核酸扩增：

a)所述第一寡核苷酸；和

b)包含截短的第一通用序列的至少一部分的第一反向引物。

5.一种生成用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)提供核酸模板，所述核酸模板包含靶核酸分子序列、标签序列和第一通用序列的至少一部分，其中，所述靶核酸分子序列包含目标基因座；

i.在第一寡核苷酸和第一反向引物退火至所述核酸模板中的互补核苷酸序列的条件下，使所述核酸模板与包含第一寡核苷酸和第一反向引物的反应混合物接触，

其中，所述第一反向引物包含所述第一通用序列的至少一部分；和

ii.延伸所述第一寡核苷酸和所述第一反向引物中的每一个；

c)环化所述第一扩增产物以产生环化的DNA模板，所述环化的DNA模板包含目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分；和

从而生成用于测序的标记DNA扩增子。

6.如权利要求5所述的方法，其中：

a)所述核酸模板包含截短的第一通用序列；

7.如权利要求1至6中任一项所述的方法，其中，所述核酸模板是互补DNA(cDNA)模板。

8.如权利要求7所述的方法，其中，所述cDNA模板是通过反转录来自单个细胞的RNA获得的。

9.如权利要求8所述的方法，其中，所述RNA是mRNA。

10.如权利要求1至9中任一项所述的方法，其中，所述cDNA模板对应于第一链cDNA，其从5'端到3'端包含截短的第一通用序列、标签序列和靶核酸分子序列。

11.如权利要求10所述的方法，其中，所述cDNA模板从5'端到3'端包含截短的第一通用序列、标签序列、poly(T)序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列。

12.如权利要求1至9中任一项所述的方法，其中，所述cDNA模板对应于第二链cDNA，其从5'端到3'端包含截短的第一通用序列、标签序列、靶核酸分子序列。

13.如权利要求12所述的方法，其中，所述cDNA模板从5'端到3'端包含截短的第一通用序列、标签序列、第二模板转换寡聚物(TSO2)序列、靶核酸分子序列、poly(A)序列和PCRhandle序列。

14.如权利要求1至13中任一项所述的方法，其中，所述目标基因座包括突变、多态性、***、缺失、基因融合、编辑的核苷酸、修饰的核苷酸、转基因或其组合。

15.如权利要求1至14中任一项所述的方法，其中，所述标签序列包括细胞识别标签或独特分子标识符(UMI)序列或其组合。

16.如权利要求1至15中任一项所述的方法，其中，所述第一寡核苷酸退火至靶核酸分子序列，所述靶核酸分子序列是目标基因座3’的约0-150个核苷酸。

17.如权利要求1至16中任一项所述的方法，其中，所述第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列。

18.如权利要求1至17中任一项所述的方法，其中，所述第一延伸产物或所述第一扩增产物从5'端到3'端包含含有目标基因座的靶核酸分子序列的全部或一部分、标签序列和截短的第一通用序列的至少一部分。

19.如权利要求4至18中任一项所述的方法，其中，所述第一寡核苷酸和所述第一反向引物进一步包含第二通用序列。

20.如权利要求4至19中任一项所述的方法，其中：

a)所述第一寡核苷酸或所述第一反向引物在3'端进一步包含RNA碱基，随后是封闭结构域；和

b)扩增所述第一延伸产物包括进行RNase H依赖性PCR。

21.如权利要求1至20中任一项所述的方法，其中，所述方法包括单个环化步骤。

22.如权利要求1至21中任一项所述的方法，其中，环化所述第一延伸产物或所述第一扩增产物包括由吉布森组装介导的分子内连接、夹板连接或使用热稳定的ATP依赖性连接酶的连接。

23.如权利要求22所述的方法，其中，环化所述第一延伸产物或所述第一扩增产物包括由吉布森组装介导的分子内连接。

24.如权利要求1至23中任一项所述的方法，其中，进行环化的DNA模板导向的核酸扩增包括用高保真DNA聚合酶扩增环化DNA模板的一部分。

25.如权利要求1至24中任一项所述的方法，其中，进行环化的DNA模板导向的核酸扩增使用第二正向引物和第二反向引物。

26.如权利要求25所述的方法，其中，所述第二正向引物或所述第二反向引物包含oligo dT序列、带条形码的随机核苷酸序列或其组合。

27.如权利要求25或26所述的方法，其中：

a)所述第二正向引物包含与第一固定寡核苷酸序列相反且互补的序列；和

b)所述第二反向引物包含与第二固定寡核苷酸序列相反和互补的序列。

28.如权利要求27所述的方法，其中，所述第一固定寡核苷酸序列和所述第二固定寡核苷酸序列：

a)分别包括CCTCTCTATGGGCAGTCGGTGAT(SEQ ID NO:27)和CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO:28)；

b)分别包括CCATCTCATCCCTGCGTGTCTCCGACTCAG(SEQ ID NO:28)和CCTCTCTATGGGCAGTCGGTGAT(SEQ ID NO:27)；

c)分别包括CAAGCAGAAGACGGCATACGAGAT(SEQ ID NO:29)和AATGATACGGCGACCACCGAGATCTACAC(SEQ ID NO:30)。

29.如权利要求25至28中任一项所述的方法，其中：

a)所述第二正向引物或所述第二反向引物包含RNA碱基，随后是3'端的封闭结构域；和

b)进行环化的DNA模板导向的核酸扩增包括进行RNase H依赖性PCR。

30.如权利要求1至29中任一项所述的方法，其中，所述DNA扩增子从5'端到3'端包含目标基因座、第二通用序列、第一通用序列和标签序列。

31.如权利要求1至30中任一项所述的方法，其中，所述DNA扩增子的长度在约200个碱基对和约500个碱基对之间。

32.如权利要求1至31中任一项所述的方法，其中，所述靶核酸分子序列包含至少两个目标基因座。

33.如权利要求32所述的方法，其中，所述第一寡核苷酸退火至靶核酸分子序列，所述靶核酸分子序列位于目标基因座的3’端。

34.如权利要求32所述的方法，其中，所述方法包括以下步骤：

a)将多个寡核苷酸退火至所述cDNA模板；

b)从多个退火的寡核苷酸进行cDNA模板导向的核酸延伸以产生多个第一延伸产物，所述第一延伸产物包含含有一个或多个目标基因座的靶核酸分子序列、标签序列和截短的第一通用序列的至少一部分；

c)环化所述多个第一延伸产物以产生多个环化的DNA模板；和

d)进行环化的DNA模板导向的核酸扩增以产生多个DNA扩增子，其包含一个或多个目标基因座、标签序列、第一通用序列和第二通用序列，

从而生成用于测序的多个标记的DNA扩增子。

35.如权利要求34所述的方法，其进一步包括进行第一延伸产物导向的核酸扩增以扩增多个第一延伸产物。

36.如权利要求32所述的方法，其中，所述方法包括以下步骤：

a)提供核酸模板；

b)通过以下方式进行核酸模板导向的核酸扩增以产生多个扩增产物：

i.在多个寡核苷酸引物和第一反向引物退火至核酸模板中的互补核苷酸序列的条件下，使核酸模板与包含多个寡核苷酸引物和第一反向引物的反应混合物接触；和

ii.延伸所述多个寡核苷酸和所述第一反向引物中的每一个；

c)环化多个第一扩增产物以产生多个环化的DNA模板；和

d)进行环化的DNA模板导向的核酸扩增以产生多个DNA扩增子，所述DNA扩增子包含一个或多个目标基因座、标签序列、第一通用序列的至少一部分和第二通用序列的至少一部分，

从而生成用于测序的多个标记的DNA扩增子。

37.如权利要求36所述的方法，其中，所述多个DNA扩增子包含所述第一通用序列和所述第二通用序列。

38.如权利要求1至37中任一项所述的方法，其中，所述方法用于制作测序文库。

39.如权利要求1至38中任一项所述的方法，其进一步包括对所述DNA扩增子进行测序。

40.如权利要求39所述的方法，其中，使用第一通用序列特异性引物、第二通用序列特异性引物或前述的组合进行测序。

41.如权利要求40所述的方法，其中，其中使用包含以下的全部或部分的引物进行测序：

a)ACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO:7)；

b)GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:31)；或

c)AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO:32)，

或上述的组合。

42.一种生成用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)提供核酸模板，所述核酸模板从5'端到3'端包含截短的第一通用序列、标签序列、靶核酸分子序列和第一模板转换寡聚物(TSO1)序列，其中，所述靶核酸分子序列包含目标基因座；

1)所述第一寡核苷酸从5'端到3'端包含第二通用序列和靶核酸分子特异性序列；和

2)所述第一反向引物从5'端到3'端包含第二通用序列、[i7]、缺失的第一通用序列和截短的第一通用序列的至少一部分；和

ii.延伸所述第一寡核苷酸和所述第一反向引物中的每一个；

c)环化所述第一扩增产物以产生环化的DNA模板，所述DNA模板包含第二通用序列、目标基因座、标签序列、第一通用序列和[i7]；和

d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子，所述DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和Illumina P7序列，

从而生成用于测序的标记DNA扩增子。

43.一种生成用于测序的标记DNA扩增子的方法，其包括以下步骤：

a)提供核酸模板，所述核酸模板从5'端到3'端包含截短的第一通用序列、标签序列、第二模板转换寡聚物(TSO2)序列和靶核酸分子序列，其中，所述靶核酸分子序列包含目标基因座；

ii.延伸所述第一寡核苷酸和所述第一反向引物中的每一个；

c)环化所述第一扩增产物以产生环化的DNA模板，所述环化的DNA模板包含第二通用序列、目标基因座、TSO2序列、标签序列、第一通用序列和[i7]；和

d)进行环化的DNA模板导向的核酸扩增以产生DNA扩增子，所述DNA扩增子从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、TSO2序列、标签序列和Illumina P7序列，

从而生成用于测序的标记DNA扩增子。

44.一种用于测序的标记DNA扩增子，其从5'端到3'端包含目标基因座、第二通用序列的至少一部分、第一通用序列的至少一部分和标签序列。

45.如权利要求44所述的标记的DNA扩增子，其从5'端到3'端包含目标基因座、第二通用序列、第一通用序列和标签序列。

46.如权利要求45所述的标记的DNA扩增子，其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、第一通用序列、标签序列和Illumina P7序列。

47.如权利要求46所述的标记的DNA扩增子，其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列和Illumina P7序列。

48.如权利要求47所述的标记的DNA扩增子，其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第一通用序列、标签序列poly(T)序列和Illumina P7序列。

49.如权利要求47所述的标记的DNA扩增子，其从5'端到3'端包含Illumina P5序列、目标基因座、第二通用序列、[i7]、第二模板转换寡聚物(TSO2)序列和Illumina P7序列。