CN118308491A - 单细胞dna甲基化检测方法 - Google Patents

单细胞dna甲基化检测方法 Download PDF

Info

Publication number
CN118308491A
CN118308491A CN202310018280.8A CN202310018280A CN118308491A CN 118308491 A CN118308491 A CN 118308491A CN 202310018280 A CN202310018280 A CN 202310018280A CN 118308491 A CN118308491 A CN 118308491A
Authority
CN
China
Prior art keywords
sequence
dna
primer
transposase
uracil
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310018280.8A
Other languages
English (en)
Inventor
曹云龙
谢晓亮
袁天骄
白雅丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Changping Laboratory
Peking University
Original Assignee
Beijing Changping Laboratory
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Changping Laboratory, Peking University filed Critical Beijing Changping Laboratory
Priority to CN202310018280.8A priority Critical patent/CN118308491A/zh
Priority to PCT/CN2024/070261 priority patent/WO2024146540A1/zh
Publication of CN118308491A publication Critical patent/CN118308491A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开提供了单细胞DNA甲基化分析的方法,其能够实现高通量,可应用于多种组织内单细胞的全基因组DNA甲基化测序。

Description

单细胞DNA甲基化检测方法
技术领域
本公开提供了单细胞DNA甲基化检测方法。
技术背景
DNA甲基化作为一种重要的表观遗传学修饰,在基因组调控过程中发挥着重要作用。DNA甲基化的建立与去除通常与细胞命运决定、胚胎发育、疾病发生等过程息息相关。研究者通过分析不同组织或不同细胞类型其基因组中DNA甲基化修饰分布差异,探索DNA甲基化与细胞类型特异性基因表达、细胞状态维持及转化之间的关系。随着研究的深入,研究者发现提取组织基因组DNA进行测序的方式会掩盖组织内细胞间的异质性。为针对大脑、癌症等复杂生物学组织实现高精度的DNA甲基化分析,高通量单细胞DNA甲基化测序技术显得尤为重要。
甲基化测序的原理是将携带与不携带甲基化修饰的胞嘧啶利用化学反应差异进行区分,其中包括基于重亚硫酸盐转化的全基因组DNA甲基化测序技术,TAPS流程(Liu etal.,Nature Biotechnology(2019).“Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution”),EM-seq流程(Williams et al.,New England Biolabs,Inc.(2019).“Enzymatic Methyl-seq:TheNext Generation of Methylome Analysis”)。化学反应对DNA造成的损伤以及纯化造成的DNA丢失均限制了这些方法在单细胞起始场景中应用。
重亚硫酸盐转化后进行DNA扩增的单细胞DNA甲基化测序方法包含scRRBS(Guo etal.,Genome Research(2013).“Single-Cell methylome landscapes of mouseembryonic stem cells and early embryos analyzed using reduced representationbisulfite sequencing”),scBS-seq(Smallwood et al.,Nature Methods(2014).“Single-cell genome-wide bisulfite sequencing for assessing epigeneticheterogeneity”),scWGBS(Farlik et al.,Cell Reports(2015).“Single-Cell DNAMethylome Sequencing and Bioinformatic Inference of Epigenomic Cell-StateDynamics”)。碍于重亚硫酸盐反应、纯化造成的DNA损伤和丢失,这些方法用于单细胞DNA甲基化测序的基因组覆盖水平较低。
《Science》期刊于2017年发表的snmC-seq(Luo et al.,Science(2017).“Single-cell methylomes identify neuronal subtypes and regulatory elements inmammalian cortex”)流程中,利用标签序列标记的随机引物对重亚硫酸盐转化后的产物进行扩增,进而携带不同标签序列的单细胞DNA可以混合建库,实现通量提升。该方法的问题在于对单细胞进行标签化之前,每个细胞需要单独进行重亚硫酸盐转化以及DNA纯化,这使得试剂成本,操作复杂度上升,对实验室平台要求较高,难以实现技术推广。《NatureBiotechnology》期刊于2018年发表的sci-MET(Mulqueen et al.,Nature Biotechnology(2018).“Highly scalable generation of DNA methylation profiles in singlecells”)方法,先利用标签化的Tn5对细胞核中DNA进行片段化,通过混匀再分选的方式可以实现标有不同标签的细胞在一个反应体系中进行重亚硫酸盐转化。然而重亚硫酸盐反应对DNA的破坏性使得本就片段化的DNA进一步破碎和降解,大量的信息丢失最终严重影响检测灵敏度。
专利申请WO2021077415中提供了一项基于Tn5转座以及酶学转化的单细胞DNA甲基化测序技术,该方法可被称为Cabernet技术,其通过Tn5将携带甲基化修饰的二代测序接头连接至DNA片段两端,结合酶学转化反应区分携带与未携带甲基化修饰的胞嘧啶,实现单细胞全基因组DNA甲基化检测。该方法替代了重亚硫酸盐转化,依赖酶学转化的方式尽可能减少了化学反应对DNA的损伤,然而每个细胞仍然需要单独操作,难以满足高通量需求。
利用Tn5引入单细胞独立标签再进行混合扩增的方式能够实现高通量,包括但不限于sci(single-cell combinatorial indexing)方法(Mulqueen et al.,NatureBiotechnology(2018).“Highly scalable generation of DNA methylation profilesin single cells”),《Nature Biotechnology》期刊于2021年发表的s3方法(Mulqueen etal.,Nature Biotechnology(2021),“High-content single-cell combinatorialindexing”)。s3方法中,Tn5转座酶组装有含尿嘧啶的DNA接头序列,可以在缺口补平反应时实现不完全延伸进而实现接头替换。该方法借助Tn5多细胞转座反应引入标签序列,实现通量提升,然而其限制转座反应效率的同时也并不适用于诸如甲基化测序等需要序列转化的方法。
综上所述,领域内依然缺少高通量、低成本、高灵敏度的单细胞DNA甲基化检测方法。
发明概述
本公开提供了用于单细胞甲基化检测的方法,其通过引入单细胞标签再进行混合酶学转化以及建库测序的方式实现高通量。
在一个方面,本公开提供了分析单细胞基因组DNA的甲基化特征的方法,其包括:
使来自单个细胞的基因组DNA与多个转座体接触,其中所述转座体包含转座酶和转座子DNA,其中所述转座子DNA包括双链的转座酶结合位点和悬突,其中所述悬突在所述悬突的5'末端包括第一引物结合序列,并且在所述第一引物结合序列的下游(如3’端)、所述转座酶结合位点的上游(如5’端)包含尿嘧啶核苷酸;以获得在每个末端均包含转座子DNA的双链基因组DNA片段;
使用不耐受尿嘧啶的聚合酶填充所述转座子DNA与基因组DNA片段之间的缺口,以形成基因组DNA片段的第一双链延伸产物;
将所述第一双链延伸产物与模板转换寡核苷酸接触,其中所述模板转换寡核苷酸从5’端至3’端包含:第二引物结合序列、标签序列以及转座酶结合位点结合序列;其中所述标签序列具有与该细胞相对应的独一无二的核苷酸序列;
使用不耐受尿嘧啶的聚合酶进行延伸反应,获得第二双链延伸产物;其中所述第二双链延伸产物构成该细胞的标签化基因组DNA片段的文库;
将获得自不同细胞的标签化基因组DNA片段的文库混合,并处理所述混合文库以将胞嘧啶转化为尿嘧啶;
使用第一和第二引物扩增经转化处理的混合文库以产生扩增子。
在某些实施方案中,所述转座体具有两个转座酶和两个转座子DNA,其中每个转座子DNA包括所述双链的转座酶结合位点和悬突。
在某些实施方案中,所述多个转座体将所述基因组DNA切割成代表基因组DNA片段文库的多个双链基因组DNA片段,其中每个双链基因组DNA片段均包括在所述基因组DNA片段的每个末端上的转座子DNA。
在某些实施方案中,所述第一双链延伸产物在每个末端具有5’悬突,所述悬突包含第一引物结合序列。
在某些实施方案中,所述第二双链延伸产物在一个末端具有5’悬突,所述悬突包含第一引物结合序列。
在某些实施方案中,所述模板转换寡核苷酸包含的转座酶结合位点结合序列能够杂交至所述第一双链延伸产物中位于基因组片段3’端的转座酶结合位点序列。
在某些实施方案中,所述甲基化包括5-甲基胞嘧啶(5mC)和/或5-羟甲基胞嘧啶(5hmC)。
在某些实施方案中,所述模板转换寡核苷酸所包含的转座酶结合位点结合序列包括锁核苷酸(LNA)修饰。
在某些实施方案中,所述转座酶结合位点结合序列包含多个LNA修饰,例如2个、3个、4个或5个LNA修饰。
在某些实施方案中,所述填充缺口和/或延伸步骤包括使用A、T、C、G四种核苷酸,其中胞嘧啶核苷酸(例如dCTP)包含经修饰的胞嘧啶,所述经修饰的胞嘧啶耐受所述转化步骤。在某些实施方案中,所述耐受转化步骤是指能够耐受将胞嘧啶转化为尿嘧啶的反应(例如APOBEC脱氨反应)而不发生序列改变。在某些实施方案中,所述经修饰的胞嘧啶是甲基化胞嘧啶,例如5-甲基胞嘧啶(5-mdC)或5-羟甲基胞嘧啶(5-hmdC)。
在某些实施方案中,所述第一引物结合序列不含胞嘧啶核苷酸。
在某些实施方案中,所述第一引物结合序列包含胞嘧啶核苷酸,所述胞嘧啶核苷酸含有经修饰的胞嘧啶,其中所述经修饰的胞嘧啶耐受所述转化步骤。在某些实施方案中,所述经修饰的胞嘧啶是甲基化胞嘧啶,例如5-甲基胞嘧啶(5-mdC)或5-羟甲基胞嘧啶(5-hmdC)。
在某些实施方案中,所述转座子DNA在第一引物结合序列的下游、所述转座酶结合位点的上游包含多个(例如2个,3个或4个)连续的尿嘧啶核苷酸。
在某些实施方案中,所述第一引物结合序列的3’端紧邻所述尿嘧啶核苷酸。在某些实施方案中,所述转座酶结合位点的5’端紧邻所述尿嘧啶核苷酸。在某些示例性实施方案中,所述第一引物结合序列与所述转座酶结合位点由3个连续的尿嘧啶核苷酸连接。
在某些实施方案中,在载体DNA存在的情况下处理所述混合文库以将胞嘧啶转化为尿嘧啶。在某些实施方案中,所述载体DNA选自长度在100bp至4000bp(例如100bp至1000bp、100bp至800bp、100bp至600bp、100bp至500bp、100bp至400bp、200bp至400bp)之间的dsDNA片段。在某些实施方案中,所述载体DNA选自长度为约200bp至400bp,例如300bp。在某些实施方案中,所述载体DNA是经超声处理的λDNA。
在某些实施方案中,所述方法还包括对所述扩增子进行测序。
在某些实施方案中,使用第一和第二引物扩增经转化处理的混合文库以产生扩增子,所述扩增子在每个末端包含测序接头,从而生成测序文库。
在某些实施方案中,所述测序接头为Illumina测序接头。
在某些实施方案中,所述第一引物引入P7端接头,所述第二引物引入P5端接头。在某些实施方案中,所述第一引物包含(i)在3’端的第一部分,其包含能够与第一引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P7序列,还可以包含期望的其它功能序列,例如index序列。在某些实施方案中,所述第二引物包含(i)在3’端的第一部分,其包含能够与第二引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P5序列,还可以包含期望的其它功能序列,例如index序列。
在某些实施方案中,所述第一引物引入P5端接头,所述第二引物引入P7端接头。在某些实施方案中,所述第一引物包含(i)在3’端的第一部分,其包含能够与第一引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P5序列,还可以包含期望的其它功能序列,例如index序列。在某些实施方案中,所述第二引物包含(i)在3’端的第一部分,其包含能够与第二引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P7序列,还可以包含期望的其它功能序列,例如index序列。
在某些实施方案中,所述转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶或IS5转座酶。
在某些实施方案中,所述不耐受尿嘧啶的聚合酶选自Q5聚合酶、Deep Vent DNA聚合酶、Phusion高保真聚合酶、KAPA高保真聚合酶、Phanta聚合酶或其任意组合。
在某些实施方案中,所述使用第一和第二引物进行扩增的步骤使用耐受尿嘧啶的聚合酶进行。在某些实施方案中,所述耐受尿嘧啶的聚合酶选自Q5U聚合酶、KAPA U+聚合酶、Phanta Uc聚合酶或其任意组合。
在某些实施方案中,在对所述双链基因组DNA片段进行缺口填充和延伸之前,从所述双链片段中去除结合的转座酶。
在某些实施方案中,所述方法还包括在所述延伸步骤之后但在所述转化步骤之前的步骤:纯化包含所述第二双链延伸产物的反应介质,例如通过DNA旋转柱(DNA spin-column)或基于珠粒的DNA纯化(beads-based DNA purification)来进行所述纯化步骤。
在某些实施方案中,所述方法还包括在所述扩增步骤之后的步骤:纯化包含所述扩增子的反应介质,例如通过DNA旋转柱(DNA spin-column)或基于珠粒的DNA纯化(beads-based DNA purification)来进行所述纯化步骤。
在某些实施方案中,所述将胞嘧啶转化为尿嘧啶的处理为酶学转化。在某些实施方案中,所述酶学转化包括APOBEC脱氨反应。在某些实施方案中,所述酶学转化包括使用T4-BGT酶和APOBEC3A酶。在某些实施方案中,所述酶学转化包括使用TET2酶和APOBEC3A酶。
附图说明
根据以下结合附图对说明性实施方案的详细描述,将更充分地理解本发明的前述和其它特征和有利方面,其中:
图1显示了示例性实施方案的工作流程的示意图。其中首先分选获得单细胞并细胞裂解,随后Tn5转座形成单细胞基因组DNA片段,并标记独立的标签序列以与其他细胞区分,随后标记有不同标签序列的单细胞DNA可以混合进行后续酶学转化以及建库测序流程。
图2显示了添加单细胞标签的示例性实施方案的化学反应原理示意图。
图3显示了标签化单细胞的数据拆分结果。左图展示了依据标签所拆分的不同单细胞测序数据量的分布情况,横坐标表示同一个96孔板中混合建库测序的多个细胞,纵坐标表示所拆分的测序读数的数目。右图展示了在同一个96孔板中对人类和小鼠DNA进行标签化后的混合建库测序,所拆分得到的测序读数其在人类和小鼠参考基因组中的比对情况。
图4显示了质控和相关性表现。A,不携带任何甲基化修饰的Lambda DNA片段(图中C表示)、CpG位点携带5mC修饰的pUC19 DNA片段(图中5mC表示)、5hmC DNA片段(图中5hmC表示),三种标准品依照TSO-Cabernet流程分别进行5mC和5hmC检测,所得准确率结果以柱状图展示。B,热图展示了TSO-Cabernet技术(TSO_1~TSO_5)和Cabernet技术(Cabernet_1~Cabernet_3,Bulk_Cabernet_1,Bulk_Cabernet_2)所检测的单细胞样本以及多细胞样本间基因组5mC修饰的皮尔森相关性,红色表示强相关性。
发明详述
根据一个方面,提供了分析单细胞基因组DNA的甲基化特征的方法,使来自单个细胞的基因组DNA与多个转座体接触。每个转座体具有两个转座酶(如Tn5转座酶)和两个转座子DNA,每个转座酶各自结合于转座子DNA,以形成转座酶/转座子DNA复合物二聚体。每个转座子DNA包括双链的转座酶结合位点(例如,双链19bp的Tnp结合位点)和悬突(例如5’悬突)。所述悬突在所述悬突的5'末端包括第一引物结合序列,并且在所述第一引物结合序列的下游(如3’端)、所述转座酶结合位点的上游(如5’端)包含尿嘧啶核苷酸(例如一个或多个连续的尿嘧啶核苷酸)。所述悬突可具有适合于包括第一引物结合序列或期望的其它功能序列的任何长度。
所述转座体沿双链基因组DNA随机结合至靶位置,并将双链基因组DNA切割成多个双链片段,其中每个双链片段具有通过转座酶结合位点连接至上链的第一复合物和通过转座酶结合位点连接至下链的第二复合物。由此,所述转座子DNA(即,转座酶结合位点连同包含第一引物结合序列的悬突)连接至所述双链片段的每个5'末端。根据一个方面,从所述复合物中除去所述转座酶。
所述转座子DNA连接至所述双链基因组DNA片段,并且在该基因组DNA双链片段的一条链与转座子DNA的一条链之间存在单链缺口。使用不耐受尿嘧啶的聚合酶填充所述转座子DNA与基因组DNA片段之间的缺口,在双链基因组DNA片段与双链转座子DNA之间产生双链连接,以形成基因组DNA片段的第一双链延伸产物,所述第一双链延伸产物在每个末端具有5’悬突,所述悬突包含第一引物结合序列。根据一个方面,所述第一引物结合序列的下游(如3’端)与所述转座酶结合位点的上游(如5’端)之间包含尿嘧啶核苷酸,由此在使用不耐受尿嘧啶的聚合酶进行缺口补平过程时,可阻止所述第一双链延伸产物的两条链的3’末端继续向第一引物结合序列延伸,从而形成在每个末端具有5’悬突的所述第一双链延伸产物。根据一个方面,所述第一双链延伸产物包含上链和下链,所述上链从5’端至3’端包含:第一引物结合序列、尿嘧啶核苷酸、转座酶结合位点、基因组DNA片段上链、经填充的缺口、转座酶结合位点,所述下链从5’端至3’端包含:第一引物结合序列、尿嘧啶核苷酸、转座酶结合位点、基因组DNA片段下链、经填充的缺口、转座酶结合位点。
将所述第一双链延伸产物与模板转换寡核苷酸接触,其中所述模板转换寡核苷酸从5’端至3’端包含:第二引物结合序列、标签序列以及转座酶结合位点结合序列;其中所述标签序列具有与该细胞相对应的独一无二的核苷酸序列。根据一个方面,通过引入标签序列,使得不同细胞的基因组DNA被不同的独特标签序列标记,以相互区分。根据一个方面,所述转座酶结合位点结合序列能够杂交至所述第一双链延伸产物中位于基因组片段3’端的转座酶结合位点序列。
使用不耐受尿嘧啶的聚合酶进行延伸反应,获得第二双链延伸产物;其中所述第二双链延伸产物在一个末端具有5’悬突,所述悬突包含第一引物结合序列;其中所述第二双链延伸产物构成该细胞的标签化基因组DNA片段的文库。根据一个方面,模板转换寡核苷酸与第一双链延伸产物的一条链退火结合,完成退火结合的模板转换寡核苷酸作为模版链,使第一双链延伸产物的该链得以经过延伸反应(如PCR延伸)获得所述标签序列和第二引物结合序列,由此使得基因组DNA片段被标签化。本领域技术人员理解,根据碱基配对法则,上述经延伸反应获得的标签化基因组DNA链所包含的标签序列和第二引物结合序列事实上与模板转换寡核苷酸中的相应序列互补。根据一个方面,第一双链延伸产物的一条链也会作为模板链,使完成退火结合的模板转换寡核苷酸向3’端延伸,其中所述第一引物结合序列的下游(如3’端)与所述转座酶结合位点的上游(如5’端)之间包含尿嘧啶核苷酸,由此在使用不耐受尿嘧啶的聚合酶进行延伸反应时,可阻止模板转换寡核苷酸的3’末端继续向第一引物结合序列延伸,从而形成在一个末端具有5’悬突的所述第二双链延伸产物。根据一个方面,所述第二双链延伸产物包含上链和下链,所述上链从5’端至3’端包含:第一引物结合序列、尿嘧啶核苷酸、转座酶结合位点、基因组DNA片段、转座酶结合位点、标签序列、第二引物结合序列,所述下链从5’端至3’端包含:第二引物结合序列、标签序列、转座酶结合位点、以基因组DNA片段为模板的延伸链、转座酶结合位点。
将获得自不同细胞的标签化基因组DNA片段的文库混合,并处理所述混合文库以将胞嘧啶转化为尿嘧啶。根据一个方面,分别对来自不同单个细胞的基因组DNA实施上述步骤,分别获得每个细胞各自的带有独特标签序列的第二双链延伸产物,随后将这些第二双链延伸产物混合。根据一个方面,将携带不同标签序列的单细胞基因组DNA混合后进行转化及建库,可明显提升通量。
使用第一和第二引物扩增经转化处理的混合文库以产生扩增子。根据一个方面,所述第一和第二引物分别特异性杂交至标签化基因组DNA片段两端的第一引物结合序列和第二引物结合序列。根据一个方面,将所述第一和第二引物与混合文库混合,并扩增所述标签化基因组DNA片段。根据一个方面,由所述第一引物和第二引物分别在所述标签化基因组DNA片段的两个末端引入测序接头,从而生成测序文库。根据一个方面,使用例如本领域技术人员已知的高通量测序方法对在每个末端包括测序接头的扩增子进行测序。
除非另外指出,否则某些实施方案或某些实施方案的特征的实施可采用在本领域普通技术人员能力内的分子生物学、微生物学、重组DNA等的常规技术。此类技术在文献中被充分解释。参见,Sambrook,Fritsch和Maniatis,MOLECULAR CLONING:A LABORATORYMANUAL,第2版(1989),OLIGONUCLEOTIDE SYNTHESIS(M.J.Gai编辑,1984),ANIMAL CELLCULTURE(R.I.Freshney,编辑,1987),the series METHODS IN ENZYMOLOGY(AcademicPress,Inc.);GENE TRANSFER VECTORS FOR MAMMALIAN CELLS(J.M.Miller和M.P.Calos编辑1987),HANDBOOK OF EXPERIMENTAL IMMUNOLOGY,(D.M.Weir和C.C.Blackwell,编辑),CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel,R.Brent,R.E.Kingston,D.D.Moore,J.G.Siedman,J.A.Smith,and K.Struhl,eds.,1987),CURRENT PROTOCOLS INIMMUNOLOGY(J.E.Coligan,A.M.Kruisbeek,D.H.Margulies,E.M.Shevach和W.Strober,编辑,1991);ANNUAL REVIEW OF IMMUNOLOGY;以及诸如ADVANCES IN IMMUNOLOGY等期刊的专题论文。本文上文和下文所提及的所有专利、专利申请和出版物均由此通过引用并入本文。
本文使用的核酸化学、生物化学、遗传学和分子生物学的术语和符号遵循本领域标准论文和文本(例如,Kornberg和Baker,DNA Replication,第2版(W.H.Freeman,NewYork,1992);Lehninger,Biochemistry,第2版(Worth Publishers,New York,1975);Strachan和Read,Human Molecular Genetics,第2版(Wiley-Liss,New York,1999);Eckstein,编者,Oligonucleotides and Analogs:A Practical Approach(OxfordUniversity Press,New York,1991);Gait,编者,Oligonucleotide Synthesis:APractical Approach(IRL Press,Oxford,1984);等等)的术语和符号。
术语定义
如本文中所用,“DNA甲基化”典型地包括DNA分子或DNA片段中胞嘧啶碱基被修饰为5-甲基胞嘧啶(5mC)。此外,尽管发生率低于5mC,也有少数胞嘧啶碱基被修饰为5-羟甲基胞嘧啶(5hmC)、5-醛基胞嘧啶(5fC)、5-羧基胞嘧啶(5caC)等。本文中提到甲基化时,泛指胞嘧啶碱基被修饰的任何情况,可以指修饰为5mC,也可以指修饰为5hmC、5fC、5caC等,除非上下文另有说明。在某些实施方案中,本文中所述的甲基化包含5-甲基胞嘧啶(5mC)和/或5-羟甲基胞嘧啶(5hmC)。
如本文中所用,“甲基化特征”是指关于DNA分子或DNA片段中甲基化状况的信息,包括但不限于,甲基化位点、甲基化水平、甲基化方式(5mC或5hmC)等。本文中“甲基化水平”,也可称为“甲基化程度”,指样本中某一特定甲基化位点被甲基化修饰的比例(或频率)。甲基化检测通常基于以下原理:将甲基化胞嘧啶和未甲基化的胞嘧啶中的一种转化为尿嘧啶(U)或者在碱基配对方式上基本上等同于尿嘧啶的碱基(例如二氢尿嘧啶,DHU);在随后的扩增过程中,对应的尿嘧啶作为胸腺嘧啶(T)与腺嘌呤(A)配对,最终结果是该甲基化位点的胞嘧啶或甲基化胞嘧啶在检测结果(如测序结果)中以胸腺嘧啶体现出来;通过与参考序列对比,就能够确定DNA分子或DNA片段中的胞嘧啶是否被甲基化。该参考序列可以为来自相同样品但不经上述转化的序列,或者健康群体中的对应序列。另外,如下文有描述的,还可通过一些方法来对不同甲基化方式(例如5mC和5hmC)进行区分。
如本文中所用,“单个细胞”是指一个细胞。可从目标组织或从活检物、血液样品或细胞培养物中获得可用于本文所述方法的单个细胞。另外,可获得来自特定器官、组织、肿瘤、赘生物(neoplasm)等的细胞,并将其用于本文所述的方法中。此外,通常地,可将来自任何群体的细胞用于所述方法,诸如原核或真核单细胞生物(包括细菌或酵母)群体。可使用本领域已知的标准方法获得单细胞悬浮液,所述方法包括例如使用胰蛋白酶或木瓜蛋白酶酶促消化组织样品中连接细胞的蛋白质或释放培养物中的贴壁细胞,或机械分离样品中的细胞。可将单细胞放置在任何允许单细胞被单独处理的合适反应容器中。例如96孔板,使得每个单个细胞被放置在单个孔中。
如本文中所用,术语“基因组”定义为由个体、细胞或细胞器所携带的集合基因集。如本文中所用,术语“基因组DNA”定义为包含由个体、细胞或细胞器所携带的部分或全部集合基因集的DNA材料。
如本文中所用,术语“核苷酸”是指具有一个或多个通过酯键与糖部分连接的磷酸基团的核苷。示例性核苷酸包括核苷一磷酸、二磷酸和三磷酸。术语“多核苷酸”、“寡核苷酸”和“核酸分子”在本文可中互换使用,并且是指通过5'与3'碳原子之间的磷酸二酯键联连接在一起的任意长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)的聚合物。以下是多核苷酸的非限制性实例:基因或基因片段(例如,探针、引物、EST或SAGE标签)、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、具有任何序列的分离的DNA、具有任何序列的分离的RNA、核酸探针和引物。多核苷酸可包含经修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。该术语还指双链和单链分子。除非另有说明或要求,否则包含多核苷酸的本发明的任何实施方案既包括双链形式,也包括已知或预测组成双链形式的两个互补单链形式中的每一个。多核苷酸由四个核苷酸碱基的特定序列组成:腺嘌呤(A);胞嘧啶(C);鸟嘌呤(G);胸腺嘧啶(T);以及当多核苷酸为RNA时,为对应于胸腺嘧啶的尿嘧啶(U)。因此,术语多核苷酸序列是多核苷酸分子的字母表示。可以将该字母表示形式输入到具有中央处理单元的计算机中的数据库中,并用于生物信息学应用,诸如功能基因组学和同源性搜索。
本文中所述的核苷酸包含天然核苷酸也包含核苷酸类似物或经修饰的核苷酸。术语“核苷酸类似物”、“经修饰的核苷酸”是指非标准核苷酸,包括非天然存在的核糖核苷酸或脱氧核糖核苷酸。在某些示例性实施方案中,可在任何位置修饰核苷酸类似物,以改变核苷酸的某些化学性质,但保留核苷酸类似物执行其预期功能的能力。可被衍生的核苷酸的位置的实例包括5位,例如5-(2-氨基)丙基尿苷、5-溴尿苷、5-丙炔尿苷、5-丙烯基尿苷等;等等;6位,例如6-(2-氨基)丙基尿苷;腺苷和/或鸟苷的8位,例如8-溴鸟苷、8-氯鸟苷、8-氟鸟苷等。核苷酸类似物还包括脱氮核苷酸,例如7-脱氮-腺苷;经O-和N-修饰的(例如,烷基化的,例如,N6-甲基腺苷,或其它本领域中所知晓的修饰)核苷酸;以及其它杂环修饰的核苷酸类似物,诸如Herdewijn,Antisense Nucleic Acid Drug Dev.,2000Aug.10(4):297-310中描述的那些。
核苷酸类似物还可包含对核苷酸的糖部分的修饰。例如,2'OH-基团可被选自以下的基团替代:H、OR、R、F、Cl、Br、I、SH、SR、NH2、NHR、NR2、COOR或OR,其中R是被取代或未取代的C1-C6烷基、烯基、炔基、芳基等。其它可能的修饰包括美国专利第5,858,988号和第6,291,438号中所描述的那些修饰。
核苷酸的磷酸酯基团也可例如通过用硫(例如,硫代磷酸酯)取代磷酸酯基团的一个或多个氧,或通过进行允许核苷酸执行其预期的功能的其它取代(诸如,例如在Eckstein,Antisense Nucleic Acid Drug Dev.2000Apr.10(2):117-21,Rusckowski等Antisense Nucleic Acid Drug Dev.2000Oct.10(5):333-45,Stein,Antisense NucleicAcid Drug Dev.2001Oct.11(5):317-25,Vorobjev等Antisense Nucleic Acid DrugDev.2001Apr.11(2):77-85和美国专利第5,684,143号中所描述的)来进行修饰。某些上述修饰(例如,磷酸酯基团修饰)降低了例如包含所述类似物的多核苷酸在体内或体外的水解速率。
如本文中所用,术语“互补”和“互补性”用于指与碱基配对法则相关的核苷酸序列。例如,序列5'-AGT-3'与序列5'-ACT-3'互补。互补可以是部分的也可以是全部的。当一个或多个核酸碱基根据碱基配对法则不匹配时,发生部分互补。当每个核酸碱基在碱基配对法则下与另一个碱基匹配时,发生核酸之间的全部或完全互补。核酸链之间的互补程度对核酸链之间的杂交效率和强度具有重要影响。
如本文中所用,术语“杂交”是指互补核酸的配对。杂交和杂交强度(即,核酸之间缔合的强度)受诸如以下因素影响:核酸之间的互补程度、所涉及条件的严格性、形成的杂交体的Tm以及核酸内的G:C比率。在其结构内包互补核酸的配对的单个分子被称为是“自身杂交的(self-hybridized)”。
如本文中所用,术语“Tm”是指核酸的解链温度。解链温度是双链核酸分子群体的一半解离成单链时的温度。用于计算核酸的Tm的方程式在本领域中是公知的。如标准参考文献所示,当核酸在1M NaCl的水溶液中时,可以通过以下公式计算Tm值的简单估算值:Tm=81.5+0.41(%G+C)(参见,例如Anderson和Young,Quantitative Filter Hybridization,in Nucleic Acid Hybridization(1985))。其它参考资料包括更复杂的计算,所述计算在Tm的计算中考虑了结构以及序列特征。
如本文中所用,术语“严格性”是指进行核酸杂交时所处的温度、离子强度和其它化合物诸如有机溶剂的存在的条件。
当用于核酸杂交时,“低严格条件”包括等同于下述的条件:当使用长度为约500个核苷酸的探针时,在42℃下在由5x SSPE和100mg/ml变性鲑鱼***DNA组成的溶液中结合或杂交,所述5x SSPE包含43.8g/l NaCl,6.9g/l NaH2PO4(H2O)和1.85g/l EDTA,用NaOH将pH调节至7.4)、0.1% SDS、5x Denhardt试剂(每500ml的50x Denhardt包含:5g Ficoll(Type400,Pharmacia),5g BSA(Fraction V;Sigma));然后在42℃下于含有5x SSPE,0.1%SDS的溶液中洗涤。
当用于核酸杂交时,“中等严格条件”包括等同于下述的条件:当采用长度为约500个核苷酸的探针时,在42℃下在由5x SSPE和100mg/ml变性鲑鱼***DNA组成的溶液中结合或杂交,所述5x SSPE包含43.8g/l NaCl,6.9g/l NaH2PO4(H2O)和1.85g/l EDTA,用NaOH将pH调节至7.4)、0.5% SDS、5x Denhardt试剂;然后在42℃下于含有1.0x SSPE,1.0% SDS的溶液中洗涤。
当用于核酸杂交时,“高严格条件”包括等同于下述的条件:当采用长度为约500个核苷酸的探针时,在42℃下在由5x SSPE和100mg/ml变性鲑鱼***DNA组成的溶液中结合或杂交,所述5x SSPE包含43.8g/l NaCl,6.9g/lNaH2PO4(H2O)和1.85g/l EDTA,用NaOH将pH调节至7.4)、0.5% SDS、5xDenhardt试剂;然后在42℃下于含有0.1x SSPE,1.0% SDS的溶液中洗涤。
当在两个单链多核苷酸之间以反向平行构型发生杂交时,该反应被称为“退火”,并且那些多核苷酸被描述为“互补的”。如果在第一多核苷酸的链之一与第二多核苷酸的链之一之间可以发生杂交,则双链多核苷酸与另一多核苷酸互补或同源。根据普遍接受的碱基配对法则,互补性或同源性(一个多核苷酸与另一个多核苷酸互补的程度)可根据相对链中预期会彼此形成氢键的碱基比例定量。
如本文中所用,术语“扩增”是指形成特定多核苷酸的额外或多个拷贝的过程。扩增方法包括本领域技术人员已知的PCR方法,并且还包括滚环扩增(Blanco等,J.Biol.Chem.,264,8935-8940,1989)、超支链滚环扩增(Lizard等,Nat.Genetics,19,225-232,1998)和环介导的等温扩增(Notomi等,Nuc.Acids Res.,28,e63,2000),所述每一篇文献由此通过引用整体并入。这些方法是本领域已知的并且广泛实践的。术语“扩增试剂”可以包括引物、核酸模板和扩增酶(例如聚合酶),才还可以包括扩增所需的其他试剂,例如核苷酸(如脱氧核糖核苷酸三磷酸)、缓冲液等。通常,将扩增试剂与其它反应组分一起放置并容纳在反应容器(试管、微孔等)中。
如本文中所用,术语“引物”通常包括天然的或合成的寡核苷酸,其在与多核苷酸模板形成双链体后能够充当核酸合成的起始点(诸如测序引物),并从其3'端沿模板延伸,从而形成延伸的双链体。在延伸过程中添加的核苷酸的序列由模板多核苷酸的序列确定。通常,引物通过DNA聚合酶延伸。引物的长度通常为3至36个核苷酸,5至24个核苷酸,14至36个核苷酸或17至30个核苷酸。“引物”可被认为是短的多核苷酸,通常具有游离的3'-OH基团,其通过与靶标杂交而与可能存在于目标样品中靶标或模板结合,并随后促进与靶标互补的多核苷酸聚合。
获得单细胞基因组DNA
根据一个方面,本公开所提供的方法涉及获得来自单个细胞的基因组DNA。
在某些实施方案中,鉴定细胞,然后分离单个细胞。本公开范围内的细胞包括本领域技术人员认为在其中理解DNA含量是有用的任何类型的细胞。根据本公开的细胞包括任何类型的癌细胞、肝细胞、***、胚胎细胞、干细胞、iPS细胞、ES细胞、神经元、红细胞、黑素细胞、星形胶质细胞、生殖细胞、少突胶质细胞、肾细胞等。
在某些实施方案中,可从目标组织或从活检物、血液样品或细胞培养物中获得可用于本文所述方法的单个细胞。另外,可获得来自特定器官、组织、肿瘤、赘生物(neoplasm)等的细胞,并将其用于本文所述的方法中。可使用本领域已知的标准方法获得单细胞悬浮液,所述方法包括例如使用胰蛋白酶或木瓜蛋白酶酶促消化组织样品中连接细胞的蛋白质或释放培养物中的贴壁细胞,或机械分离样品中的细胞。可将单细胞放置在任何允许单细胞被单独处理的合适反应容器中。例如96孔板,使得每个单个细胞被放置在单个孔中。
操纵单细胞的方法是本领域已知的,包括荧光激活细胞分选(FACS)、流式细胞术(Herzenberg.,PNAS USA 76:1453-55 1979)、显微操作和使用半自动细拣选器(例如,来自Stoelting Co.的QuixellTM细胞转移***)。例如,可以基于可通过显微镜观察检测的特征(诸如位置、形态或报告基因表达)来单独选择单个细胞。另外,梯度离心和流式细胞术的组合也可以用于增加分离或分选效率。
一旦鉴定出所需细胞,使用本领域技术人员已知的方法裂解细胞以释放包括DNA在内的细胞内容物。将所述细胞内容物包含在容器或收集空间内。在某些实施方案中,可以通过裂解细胞从细胞释放细胞内容物,诸如基因组DNA。裂解可通过例如加热细胞,或通过使用去垢剂或其它化学方法,或通过这些方法的组合来实现。可使用本领域已知的任何合适的裂解方法。在某些实施方案中,将细胞在含有去垢剂的细胞裂解液中加热。在某些实施方案中,在Tween-20存在下,将细胞在72℃加热2分钟,足以溶解细胞;或者,可将细胞在水中加热至65℃,进行10分钟(Esumi等,Neurosci Res60(4):439-51(2008));或在补充有0.5% NP-40的PCR缓冲液II(Applied Biosystems)中加热至70℃,进行90秒(Kurimoto等,Nucleic Acids Res34(5):e42(2006));或可用蛋白酶诸如蛋白酶K或通过使用离液盐诸如异硫氰酸胍来实现裂解(美国公开号2007/0281313)。所获得的细胞裂解物可直接用于根据本文描述的方法,例如可将反应混合物添加到细胞裂解物中。或者,可使用本领域技术人员已知的方法将细胞裂解物分成两个或更多个体积,诸如分入两个或更多个容器、管或区域中,其中将一部分细胞裂解物包含在每个体积的容器、管或区域中。然后可通过本文所述的方法对包含在每个容器、管或区域中的基因组DNA进行处理。
转座
根据一个方面,本公开所提供的方法涉及使用转座酶进行基因组DNA片段化的方法。该方法使用转座酶或转座体将原始或起始核酸序列(诸如基因组DNA)片段化并将包含第一引物结合序列的悬突序列连接至切割位点或断裂位点的每个末端,从而产生一组片段(该组的每个成员具有相同的悬突序列)。
在某些实施方案中,使用多个转座体或转座体文库将基因组DNA切割成双链片段。多个转座体或文库中的每个转座体是与转座子DNA结合的转座酶的二聚体,即每个转座体包括两个分开的转座子DNA。转座体的每个转座子DNA包括转座酶结合位点和包含第一引物结合序列的悬突序列。因此,通过转座体文库产生了来自原始核酸序列的许多片段,其中每个片段在片段的每个末端具有相同的包含第一引物结合序列的悬突序列。
在某些实施方案中,所述悬突可具有适合于包括第一引物结合序列或期望的其它功能序列的任何长度。在某些示例性实施方案中,所述悬突的长度不超过60bp,例如不超过55bp、不超过50bp。在某些示例性实施方案中,所述悬突的长度为至少4bp,例如至少5bp、至少8bp、至少10bp、至少12bp、至少15bp。在某些示例性实施方案中,所述悬突的长度为10-50bp。
在某些实施方案中,所述第一引物结合序列不含胞嘧啶核苷酸。根据一个方面,不包含胞嘧啶核苷酸的第一引物结合序列能够耐受将胞嘧啶转化为尿嘧啶的反应(例如APOBEC脱氨反应)而不发生序列改变。
在某些实施方案中,所述第一引物结合序列包含胞嘧啶核苷酸,所述胞嘧啶核苷酸含有经修饰的胞嘧啶,其中所述经修饰的胞嘧啶耐受所述转化步骤。在某些实施方案中,所述经修饰的胞嘧啶是甲基化胞嘧啶,例如5-甲基胞嘧啶(5-mdC)或5-羟甲基胞嘧啶(5-hmdC)。
在某些实施方案中,所述转座子DNA在第一引物结合序列的下游、所述转座酶结合位点的上游包含多个(例如2个,3个或4个)连续的尿嘧啶核苷酸。在某些实施方案中,所述第一引物结合序列的3’端紧邻所述尿嘧啶核苷酸。在某些实施方案中,所述转座酶结合位点的5’端紧邻所述尿嘧啶核苷酸。在某些实施方案中,所述第一引物结合序列的3’端与所述转座酶结合位点的5’端由多个(例如2个,3个或4个)连续的尿嘧啶核苷酸连接。
在某些实施方案中,示例性转座子***包括Tn5转座酶、Mu转座酶、Tn7转座酶或IS5转座酶等。其它有用的转座子***是本领域技术人员已知的,包括Tn3转座子***(参见Maekawa,T.,Yanagihara,K.,and Ohtsubo,E.(1996),A cell-free system of Tn3transposition and transposition immunity,Genes Cells 1,1007-1016)、Tn7转座子***(参见Craig,N.L.(1991),Tn7:a target site-specific transposon,Mol.Microbiol.5,2569-2573)、Tn10转座子***(参见Chalmers,R.,Sewitz,S.,Lipkow,K.,and Crellin,P.(2000),Complete nucleotide sequence of Tn10,J.Bacteriol 182,2970-2972)、Piggybac转座子***(参见Li,X.,Burnight,E.R.,Cooney,A.L.,Malani,N.,Brady,T.,Sander,J.D.,Staber,J.,Wheelan,S.J.,Joung,J.K.,McCray,P.B.,Jr.等(2013),PiggyBac transposase tools for genome engineering,Proc.Natl.Acad.Sci.USA 110,E2279-2287)、睡美人转座子***(Sleeping beautytransposon system)(参见Ivics,Z.,Hackett,P.B.,Plasterk,R.H.和Izsvak,Z.(1997),Molecular reconstruction of Sleeping Beauty,a Tc1-like transposon from fish,and its transposition in human cells,Cell 91,501-510)、Tol2转座子***(参见Kawakami,K.(2007),Tol2:a versatile gene transfer vector in vertebrates,GenomeBiol.8Suppl.1,S7.)
特定的Tn5转座***已被描述,并且其对于本领域技术人员而言是已知的。参见Goryshin,I.Y.和W.S.Reznikoff,Tn5 in vitro transposition.The Journal ofbiological chemistry,1998.273(13):第7367-74页;Davies,D.R.等,Three-dimensionalstructure of the Tn5 synaptic complex transposition intermediate.Science,2000.289(5476):第77-85页;Goryshin,I.Y.等,Insertional transposon mutagenesisby electroporation of released Tn5 transposition complexes.Naturebiotechnology,2000.18(1):第97-100页以及Steiniger-White,M.,I.Rayment和W.S.Reznikoff,Structure/function insights into Tn5 transposition.Currentopinion in structural biology,2004.14(1):第50-7页,所述每一篇文献出于所有目的由此通过引用整体并入。将Tn5转座***用于DNA文库制备和其它用途的试剂盒是已知的。参见Adey,A.等,Rapid,low-input,low-bias construction of shotgun fragmentlibraries by high-density in vitro transposition.Genome biology,2010.11(12):第R119页;Marine,R.等,Evaluation of a transposase protocol for rapidgeneration of shotgun high-throughput sequencing libraries from nanogramquantities of DNA.Applied and environmental microbiology,2011.77(22):第8071-9页;Parkinson,N.J.等,Preparation of high-quality next-generation sequencinglibraries from picogram quantities of target DNA.Genome research,2012.22(1):第125-33页;Adey,A.和J.Shendure,Ultra-low-input,tagmentation-based whole-genome bisulfite sequencing.Genome research,2012.22(6):第1139-43页;Picelli,S.等,Full-length RNA-seq from single cells using Smart-seq2.Nature protocols,2014.9(1):第171-81页以及Buenrostro,J.D.等,Transposition of native chromatinfor fast and sensitive epigenomic profiling of open chromatin,DNA-bindingproteins and nucleosome position.Nature methods,2013,所述每一篇文献出于所有目的由此通过引用整体并入。另见WO 98/10077、EP 2527438和EP 2376517,其每一个由此通过引用整体并入本文。市售转座子试剂盒以商品名NEXTERA出售,并且可从Illumina获得。
在某些示例性实施方案中,所述转座酶为Tn5转座酶,所述转座酶结合位点包含如AGATGTGTATAAGAGACAG(SEQ ID NO:11)所示的第一链和其互补序列所示的第二链。
在某些实施方案中,在对所述双链基因组DNA片段进行缺口填充和延伸之前,从所述双链片段中去除结合的转座酶。在某些实施方案中,通过使用蛋白酶使转座酶失活。在某些实施方案中,进一步包括通过热和/或蛋白酶抑制剂使蛋白酶失活。在某些实施方案中,通过在37-55℃下用终浓度为1-500μg/mL的蛋白酶消化(诸如QIAGEN蛋白酶)10-60分钟来使残留的转座酶失活。然后通过热和/或蛋白酶抑制剂(诸如AEBSF)使蛋白酶失活。
缺口填充
本文所述的转座体方法产生的双链片段随后被加工以填充缺口。本文所述的缺口填充使用不耐受尿嘧啶的聚合酶进行。不耐受尿嘧啶的聚合酶是指不能读取和扩增含有尿嘧啶的核酸模板的DNA聚合酶。此类聚合酶是本领域技术人员已知的。根据一个方面,本文所述的第一引物结合序列的下游(如3’端)与所述转座酶结合位点的上游(如5’端)之间包含尿嘧啶核苷酸,由此在使用不耐受尿嘧啶的聚合酶进行缺口补平过程时,可阻止3’末端继续向第一引物结合序列延伸,从而形成在每个末端具有5’悬突的第一双链延伸产物。
在某些实施方案中,所述不耐受尿嘧啶的聚合酶选自Q5聚合酶、Deep Vent DNA聚合酶、Phusion高保真聚合酶、KAPA高保真聚合酶、Phanta聚合酶或其任意组合。
在某些实施方案中,所述填充缺口步骤包括使用A、T、C、G四种核苷酸,其中胞嘧啶核苷酸(例如dCTP)包含经修饰的胞嘧啶,所述经修饰的胞嘧啶耐受所述转化步骤。本文所述的耐受转化步骤是指能够耐受将胞嘧啶转化为尿嘧啶的反应(例如APOBEC脱氨反应)而不发生序列改变。在某些实施方案中,所述经修饰的胞嘧啶是甲基化胞嘧啶,例如5-甲基胞嘧啶(5-mdC)或5-羟甲基胞嘧啶(5-hmdC)。在某些实施方案中,所述缺口填充步骤包括在dNTP混合物中使用甲基化dCTP代替dCTP。
标记单细胞基因组DNA
根据一个方面,本公开所提供的方法涉及通过引入标签序列使得不同细胞的基因组DNA被不同的独特标签序列标记,以相互区分。所述标签序列的引入通过本文所述的模板转换寡核苷酸并基于延伸反应实现。
在某些实施方案中,所述标签序列可具有适合于区分不同细胞的任何长度。在某些示例性实施方案中,所述标签序列的长度为4-30bp,例如4-25bp、4-20bp。在某些示例性实施方案中,所述标签序列的长度为4bp-16bp。
在某些实施方案中,所述模板转换寡核苷酸所包含的转座酶结合位点结合序列包括锁核苷酸(LNA)修饰。根据一个方面,基因组DNA片段两端存在反向互补配对的转座酶结合位点序列,因此在退火过程中存在单链DNA成环的可能。带有锁核苷酸修饰的转座酶结合位点结合序列有更高的Tm值(例如,每个锁核苷酸修饰能够提升2℃左右),这便使得退火时可以设置更高的退火温度,以实现模板转换寡核苷酸结合的同时避免单链DNA成环情况的发生。
在某些实施方案中,所述转座酶结合位点结合序列包含多个LNA修饰,例如2个、3个、4个或5个LNA修饰。在某些实施方案中,所述转座酶结合位点结合序列包含5个LNA修饰。
在某些实施方案中,所述模板转换寡核苷酸将退火至所述第一双链延伸产物中位于基因组片段3’端的转座酶结合位点序列,随后通过延伸反应(例如PCR)使第一双链延伸产物获得所述标签序列和第二引物结合序列,由此使得基因组DNA片段被标签化。
在某些实施方案中,所述延伸步骤包括使用A、T、C、G四种核苷酸,其中胞嘧啶核苷酸(例如dCTP)包含经修饰的胞嘧啶,所述经修饰的胞嘧啶耐受所述转化步骤。本文所述的耐受转化步骤是指能够耐受将胞嘧啶转化为尿嘧啶的反应(例如APOBEC脱氨反应)而不发生序列改变。在某些实施方案中,所述经修饰的胞嘧啶是甲基化胞嘧啶,例如5-甲基胞嘧啶(5-mdC)或5-羟甲基胞嘧啶(5-hmdC)。在某些实施方案中,所述延伸步骤包括在dNTP混合物中使用甲基化dCTP代替dCTP。
载体DNA和任选的纯化
根据某些方面,在载体DNA存在的情况下进行转化处理。根据某些方面,在载体DNA存在的情况下处理不同细胞的标签化基因组DNA片段的混合文库以将胞嘧啶转化为尿嘧啶。载体DNA可以是长度在100个碱基对(bp)至4千个碱基对(例如100bp至1000bp、100bp至800bp、100bp至600bp、100bp至500bp、100bp至400bp、200bp至400bp)之间的任何dsDNA片段。在某些实施方案中,所述载体DNA选自长度为约200bp至400bp,例如300bp。在某些实施方案中,所述载体DNA可以是与靶DNA不同的DNA类型。在某些实施方案中,所述载体DNA可以是与靶DNA相同的DNA类型。在某些实施方案中,所述载体DNA是经超声处理的λDNA。在某些实施方案中,载体DNA不包括Illumina测序衔接子。
所述载体DNA用于减少转化处理对所述靶DNA的损伤或所述靶DNA的损失。在某些实施方案中,以样品DNA量的100至1000倍(例如,100至1000倍)的量添加载体DNA到反应介质中。
根据某些方面,在进行甲基化检测所需的转化处理之前,可通过DNA旋转柱(DNAspin-column)或基于珠粒的DNA纯化(beads-based DNA purification)或本领域技术人员已知的其它纯化方法来纯化包括混合文库和载体DNA的所述反应介质。或者,所述反应介质可以直接进行转化。
转化
根据一个方面,本公开所提供的方法涉及将获得自不同细胞的标签化基因组DNA片段的文库混合并处理所述混合文库以将胞嘧啶转化为尿嘧啶。
在某些实施方案中,在载体DNA存在的情况下进行所述转化。
在某些实施方案中,将胞嘧啶转化为尿嘧啶的处理为酶学转化。用于将胞嘧啶转化为尿嘧啶的试剂是本领域技术人员已知的。在某些实施方案中,使用将胞嘧啶转化为尿嘧啶的酶促试剂,即胞嘧啶脱氨酶,包括ABOPEC家族的那些,诸如APOBEC-seq或APOBEC3A。APOBEC家族成员是胞苷脱氨酶,其将胞嘧啶转化为尿嘧啶,同时不改变修饰的胞嘧啶碱基。基于本公开,其它酶促试剂对于本领域技术人员将变得显而易见。
在某些实施方案中,所述酶学转化包括使用T4-BGT酶和APOBEC3A酶,以检测5hmC。
在某些实施方案中,所述酶学转化包括使用TET2酶和APOBEC3A酶,以检测5mC或5hmC。
在某些实施方案中,转化之后可以除去载体DNA,或者可以在不扩增载体DNA的情况下扩增转化的片段,从而获得扩增的片段化DNA。通过如本文所述的方法获得的标签化基因组DNA片段在每个末端具有第一和第二引物结合序列,从而使得标签化基因组DNA片段可以与载体DNA充分区分开。在某些实施方案中,第一和第二引物结合序列连接的DNA被扩增而载体DNA不被扩增。载体DNA变成单链DNA,即ssDNA,并从混合物中除去,产生纯的扩增的靶DNA片段。
任选的纯化
根据某些方面,可在扩增之前通过DNA旋转柱或基于珠粒的DNA纯化或本领域技术人员已知的其它纯化方法来纯化包括所述经转化的片段的反应介质。或者,所述反应介质可以直接进行扩增。在某些实施方案中,在所述转化步骤之后但在所述扩增步骤之前包括:纯化包含所述经转化处理的混合文库的反应介质;优选地,通过DNA旋转柱(DNA spin-column)或基于珠粒的DNA纯化(beads-based DNA purification)来进行所述纯化步骤。在某些实施方案中,将包含所述经转化处理的片段的所述反应介质不经纯化直接进行至所述扩增步骤。
扩增
根据一个方面,本公开所提供的方法涉及使用第一和第二引物扩增经转化处理的混合文库以产生扩增子。
在某些实施方案中,使用第一和第二引物扩增经转化处理的混合文库以产生扩增子,所述扩增子在每个末端包含测序接头,从而生成测序文库。
在某些实施方案中,所述第一引物引入第一测序接头序列,所述第二引物引入第二测序接头序列。在某些实施方案中,所述第一引物包含(i)在3’端的第一部分,其包含能够与第一引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含第一测序接头序列。在某些实施方案中,所述第一引物的第二部分还可以包含期望的其它功能序列,例如index序列。在某些实施方案中,所述第二引物包含(i)在3’端的第一部分,其包含能够与第二引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含第二测序接头序列。在某些实施方案中,所述第二引物的第二部分还可以包含期望的其它功能序列,例如index序列。
在某些实施方案中,所述测序接头为Illumina测序接头。
在某些实施方案中,所述第一引物引入P7端接头,所述第二引物引入P5端接头。在某些实施方案中,所述第一引物包含(i)在3’端的第一部分,其包含能够与第一引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P7序列。在某些实施方案中,所述第一引物的第二部分还可以包含期望的其它功能序列,例如i7 index序列。在某些实施方案中,所述第二引物包含(i)在3’端的第一部分,其包含能够与第二引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P5序列。在某些实施方案中,所述第二引物的第二部分还可以包含期望的其它功能序列,例如i5 index序列。
在某些实施方案中,所述第一引物引入P5端接头,所述第二引物引入P7端接头。在某些实施方案中,所述第一引物包含(i)在3’端的第一部分,其包含能够与第一引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P5序列。在某些实施方案中,所述第一引物的第二部分还可以包含期望的其它功能序列,例如i5 index序列。在某些实施方案中,所述第二引物包含(i)在3’端的第一部分,其包含能够与第二引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P7序列。在某些实施方案中,所述第二引物的第二部分还可以包含期望的其它功能序列,例如i7 index序列。
在某些实施方案中,所述使用第一和第二引物进行扩增的步骤使用耐受尿嘧啶的聚合酶进行。耐受尿嘧啶的聚合酶是指能够读取和扩增含有尿嘧啶的核酸模板的DNA聚合酶。此类聚合酶是本领域技术人员已知的。在某些实施方案中,所述耐受尿嘧啶的聚合酶选自Q5U聚合酶、KAPA U+聚合酶、Phanta Uc聚合酶或其任意组合。
在某些实施方案中,使用PCR实现扩增。用于PCR的方法是本领域公知的。PCR典型地包括提供具有所需靶序列的寡核苷酸引物和扩增试剂,然后在聚合酶(例如,DNA聚合酶)存在的情况下进行热循环。引物与双链靶序列的它们各自相应的链(“引物结合序列”)互补。为了实现扩增,使双链靶序列变性,然后将引物与其在靶分子内的互补序列退火。退火后,用聚合酶延伸引物,以形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复多次(即,变性、退火和延伸构成一个“循环”;可以有多个“循环”)以获得高浓度的所需靶序列的扩增区段。
任选的纯化
根据某些方面,在测序之前,可通过DNA旋转柱或基于珠粒的DNA纯化或本领域技术人员已知的其它纯化方法来纯化包括扩增片段的反应介质。扩增(诸如通过PCR反应)后进行的DNA纯化将去除大多数单链载体DNA,这会产生纯的经扩增的靶DNA文库准备用于测序。在某些实施方案中,在所述扩展步骤之后但在所述测序步骤之前包括:纯化包含所述扩增子的反应介质;优选地,通过DNA旋转柱(DNA spin-column)或基于珠粒的DNA纯化(beads-based DNA purification)来进行所述纯化步骤。
测序
可使用本领域技术人员已知的方法对根据本文所述的方法扩增的DNA进行测序和分析。可使用本领域已知的多种测序方法来确定目标核酸序列的序列,所述方法包括但不限于通过边合成边测序(SBS)、杂交测序(SBH)、通过连接测序(SBL)(Shendure等(2005)Science 309:1728)、定量增量荧光核苷酸加成测序(quantitative incrementalfluorescent nucleotide addition sequencing)(QIFNAS)、逐步连接并切割(stepwiseligation and cleavage)、荧光共振能量转移(FRET)、分子信标、TaqMan报告基因探针消化、焦磷酸测序、荧光原位测序(FISSEQ)、FISSEQ珠粒(美国专利第7,425,431号)、摆动测序(PCT/US05/27695)、多重测序(2008年2月6日提交的美国序列号12/027,039;Porreca等(2007)Nat.Methods 4:931)、聚合菌落(POLONY)测序(美国专利第6,432,360号、第6,485,944号和第6,511,803号以及PCT/US05/06425);纳米网格滚环测序(ROLONY)(2008年5月14日提交的美国序列号12/120,541)、等位基因特异性寡核苷酸连接测定(allele-specificoligo ligation assay)(例如,寡核苷酸连接测定(OLA)、使用连接的线性探针和滚环扩增(RCA)读数的单模板分子OLA、连接的挂锁探针和/或使用连接的圆形挂锁探针和滚环扩增(RCA)读数的单模板分子OLA)等。也可以利用高通量测序方法,例如使用诸如Roche 454、Illumina、AB-SOLiD、Helicos、Polonator平台之类的平台。多种基于光的测序技术在本领域中是已知的(Landegren等(1998)Genome Res.8:769-76;Kwok(2000)Pharmacogenomics1:95-100和Shi(2001)Clin.Chem.47:164-172)。
在某些实施方案中,可使用高通量测序方法(诸如Illumina测序平台)对扩增的DNA进行测序。在某些实施方案中,所述测序为边合成边测序(SBS)。
扩增和测序方法在预测医学领域中是有用的,在所述预测医学领域中诊断测定、预后测定、药物基因组学和监测临床试验被用于预后(预测)目的,从而预防性地治疗个体。因此,本发明的一个方面涉及用于确定基因组DNA以便确定个体是否有患病症和/或疾病的风险的诊断测定法。此类测定可用于预后或预测目的,从而在病症和/或疾病发作之前预防性治疗个体。因此,在某些示例性实施方案中,提供了使用本文所述的分析单细胞基因组DNA的甲基化特征的方法来诊断和/或预后一种或多种疾病和/或病症的方法。
应当理解,已经描述的本发明的实施方案仅是本发明原理的一些应用的说明。在不脱离本发明的真实精神和范围的情况下,本领域技术人员可以基于本文给出的教导进行多种修改。在整个本申请中引用的所有参考文献、专利和公开的专利申请的内容出于所有目的由此通过引用整体并入。
现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本申请所要求保护的范围。
实施例1
根据本申请的示例性实施方案,本申请提供了高通量单细胞5mC/5hmC检测方法,该方法可称为TSO-Cabernet。TSO-Cabernet方法包括通过FACS分选单个细胞;利用Tn5转座将单细胞基因组DNA进行片段化,在片段两端引入测序引物以及标签序列,从而将单细胞进行独立序列标记;通过标记有不同标签序列的单细胞混合进行酶学转化和建库测序(图1)。
根据本申请的示例性实施方案,对单细胞的基因组片段进行序列标记的方法包括:Tn5转座、缺口填充、接头置换、以及延伸(图2)。其中:
Tn5转座:利用Tn5转座将基因组DNA进行片段化,同时在基因组DNA两端引入自定义的P7端测序引物序列(即,第一引物结合序列)。所述基因组DNA的断裂和转座子的***在所述转座/***位点的两端留下了缺口,由此而产生的结果是具有连接至上链的5'位置的转座子DNA Tnp结合位点和自定义的P7端测序引物序列和连接至下链的5'位置的转座子DNA Tnp结合位点和自定义的P7端测序引物序列的基因组DNA片段。其中,自定义的P7端测序引物序列与ME序列(即,转座酶结合位点)之间设计了尿嘧啶碱基,从而在DNA聚合酶进行缺口补平过程中阻止其3’末端继续向P7端接头序列延伸,从而便于后续进行接头置换。此外,P7端测序引物序列(ME序列上游的接头序列)采用“不含胞嘧啶”的设计,在有尿嘧啶碱基阻挡的情况下,该接头序列会以单链形式存在,为避免酶学转化反应过程中BGT蛋白无法正常结合并且无法对其中的胞嘧啶提供糖基基团保护(BGT结合双链DNA)从而无法耐受APOBEC脱氨反应,因此针对P7端接头序列部分进行了“不含胞嘧啶”的设计,进而使其能够耐受APOBEC脱氨反应,不发生序列改变。
接头置换:接头置换基于的是PCR反应,即携带有标签序列和P5端测序引物序列(即,第二引物结合序列)的自定义寡核苷酸链(即,模板转换寡核苷酸)通过碱基互补配对结合到ME序列上。此外,样本DNA片段两端本身存在反向互补配对的ME序列,因此在降温退火的过程中存在单链DNA成环的可能。为了避免这一情况的发生,在用于接头置换的自定义寡核苷酸链中的ME序列部分设计了5个锁核苷酸(LNA)修饰。带有锁核苷酸修饰的ME序列有更高的Tm值(每个锁核苷酸修饰能够提升2℃左右),这便使得退火时可以设置更高的退火温度,以实现寡核苷酸链结合的同时避免单链DNA成环情况的发生。此外,本领域技术人员理解,也可以通过转座引入P5端测序引物序列,而在接头置换时引入P7端测序引物序列。
退火延伸:完成退火结合的寡核苷酸链作为模版链,使样本DNA得以经过PCR延伸获得P5端测序引物序列以及标签序列,并且寡核苷酸链也会向3’端延伸,形成双链DNA结构以保证后续DNA纯化以及酶学转化的效率。此外,在PCR延伸过程中采用的是带有修饰的胞嘧啶作为底物,这样可以保证延伸产生的部分经过酶学转化后不发生序列变化,进而保证扩增建库的正常进行。
至此,经过延伸步骤所产生的DNA双链已经具备了标签序列信息。携带不同标签序列的单细胞DNA样本可以混合在一起进行后续的酶学转化,最后以片段两端的序列为桥梁,建成适配illumina平台的测序文库。
实施例2
反应溶液的制备
2.1细胞裂解液的制备
表2-1:细胞裂解液配方
*序列:TCAGGTTTTCCTGAA(SEQ ID NO:1)
2.2转座反应液(2x)的制备
表2-2:转座反应液配方
2.3转座终止液的制备
表2-3:转座终止液配方
2.4转座子退火缓冲液(10x)的制备
表2-4:转座子退火缓冲液配方
2.5转座复合体储存液的制备
表2-5:转座复合体储存液配方
2.6磁珠稀释溶液的制备
表2-6:磁珠稀释溶液配方
2.7Lambda DNA片段化
将没有任何修饰的Lambda DNA(Thermo Scientific,SD0021)利用非接触式超声波破碎仪打断至300bp,纯化后置于-20℃长期保存。
实施例3
转座复合体的制备
3.1转座子的制备
表3-1:转座子序列
转座子的一条链为Tn5_3U_oligo,其包含P7端测序引物序列、尿嘧啶核苷酸以及ME序列,其示例性序列如表3-1所示。另一条链为Tn5_comp,其包含ME序列,其示例性序列如表3-1所示。
表3-2:转座子退火反应体系
将上表中所示成分混合,在PCR仪中运行程序(95℃1min,每3秒0.1℃降温至25℃,4℃hold),长期保存置于-20℃。
3.2转座复合体的组装
转座子按照1.1:1的比例与Tn5转座酶(Vazyme)混合,室温条件孵浴30min后,用转座复合体储存液稀释为250nM,分装保存在-80℃。
实施例4
分离单细胞及细胞裂解
采用口吸管方式或利用流式细胞分选仪进行单细胞分选。单细胞分选于装有2.5μL细胞裂解液的0.2mL PCR管中,运行细胞裂解PCR仪程序(50℃1h,65℃1h,70℃15min,4℃hold)。单细胞裂解产物于-80℃储存。
实施例5
单细胞的标签化
5.1Tn5转座反应
表5-1:转座子退火反应体系
按表5-1配置反应体系,55℃孵浴10min后,向转座反应体系中加入1μL 2mg/mL蛋白酶(QIAGEN,19157)及1μL转座终止液,运行PCR程序(50℃40min,70℃15min,4℃hold),以使转座酶失活。
5.2缺口补平及接头转换
向转座反应完成的DNA样品中加入18μL接头转换反应预混液(见表5-2),在PCR仪中运行程序(50℃3min,98℃30s,10个循环(98℃10s,59℃20s,72℃1min),72℃2min,4℃hold)。其中,标签化TSO序列(即,模板转换寡核苷酸)从5’端至3’端包含:P5端测序引物序列、标签序列以及ME结合序列,ME结合序列通过碱基互补配对结合到ME序列上。标签化TSO序列的示例性序列如SEQ ID NO:4所示:TCGTCGGCAGCGTC(P5端测序引物序列)TTACCGAC(标签序列)AGATGTGTA+TA+AG+AG+AC+AG(ME结合序列),注:“+”表示其3’相邻位置的核苷酸存在LNA修饰。
表5-2:接头转换反应预混液
*甲基化dCTP(NEB,N0356S)可替换为羟甲基化dCTP(Jena Bioscience,NU-932L)
随后将96孔板样品混合,加入40ng片段化Lambda DNA和5mL磁珠(Beckman,B23319),参照说明进行DNA纯化,最后洗脱于56μL 1mM Tris-HCl(pH=8.0)。
实施例6
文库制备
6.1TET2反应(检测5mC)
向56μL洗脱产物中加入44μL TET2反应预混液(见表6-1),并在37℃孵浴1h。
表6-1:TET2反应预混液
TET2反应结束加入2μL终止试剂(NEB,E7125L)并于37℃孵浴30min,终止TET2反应。随后加入183.6μL磁珠参照说明进行DNA纯化,用8μL 1mM Tris-HCl(pH=8.0)洗脱。
6.2BGT反应(检测5hmC)
向56μL洗脱产物中加入44μL BGT反应预混液(见表6-2),并在37℃孵浴2h。
表6-2:BGT反应预混液
BGT反应结束加入5μL蛋白酶K(NEB,P8107S)并于37℃孵浴30min,终止BGT反应。随后加入189μL磁珠参照说明进行DNA纯化,用8μL 1mM Tris-HCl(pH=8.0)洗脱。
6.3APOBEC反应
表6-3:APOBEC反应预混液
6.1或6.2获得的8μL洗脱产物中加入2μL 0.1M NaOH,50℃孵浴10min进行DNA双链变性,随后用冰进行快速冷却。保持样品置于冰上并加入10μL APOBEC反应预混液(配方见表6-3),37℃孵浴3h(检测5mC)或12h(检测5hmC)。
6.4文库扩增
加入20μL 2x Q5U PCR预混液(NEB,M0597L)以及0.4μL 100μM s3N501引物和0.4μL 100μM s3N701引物。s3N501引物是指引入P5端测序接头的引物,其包含P5序列、i5 index序列以及与引入基因组片段一端的P5端测序引物序列杂交的序列,其示例性序列如XX所示。s3N701引物是指引入P7端测序接头的引物,其包含P7序列、i7 index序列以及与引入基因组片段一端的P7端测序引物序列杂交的序列,其示例性序列如表6-4所示。
表6-4:接头引物序列
在PCR仪中运行程序(98℃30s,11个循环(98℃10s,60℃30s,65℃90s),65℃5min,4℃hold),进行全基因组扩增。随后使用DNA纯化试剂盒,根据说明进行纯化与片段选择。
实施例7
文库测序
使用Qubit荧光计对纯化及片段选择所得文库进行定量,并使用片段分析***检测文库片段分布情况。掺入20%碱基平衡序列以提高碱基复杂度,最终获得的文库按照0.9pM的浓度,使用illumina NovaSeq 6000测序仪进行150bp读长双端测序,测序引物序列如表7所示。
表7:测序引物序列
实施例8
测序结果
多细胞标签化后混合建库的组学测序技术,通常会因为单个细胞间的测序深度差异过大,出现低深度细胞质控不过关的情况,也会造成测序数据的分配不均等问题。通过统计同一个96孔板的细胞经过本公开提供的TSO-Cabernet方法处理以后,所能拆分出来的测序读数,发现该方法能够获得均一的测序深度分布(图3,左图),能够有效地保证同一个文库中的多个细胞可以获得充足的测序数据。
将多个细胞混合在一起进行酶学转化以及建库测序后,利用每个细胞间相互独立的标签序列对测序数据进行准确的拆分和溯源,是保证每个单细胞分析准确性的关键。为了验证这个问题,在同一个96孔板中的不同孔分别加入人类和小鼠的基因组DNA,并将每个孔中的DNA按照本公开提供的TSO-Cabernet流程进行标签化以及混合酶学转化、建库测序,最后将所获得的拆分数据依据人类和小鼠参考基因组进行比对。通过观察每个样本比对至人类和小鼠参考基因组的测序读数的数目,可以发现基本上不会出现人类和小鼠明显混合的样本(图3,右图),说明这个方法允许根据测序数据所含有的标签序列信息对绝大多数(大于99%)的测序读数进行准确的溯源,从而保证下游分析的准确性。
依照TSO-Cabernet流程进行5mC/5hmC检测的K562样本中掺有三种标准品(C对应Lambda DNA片段;5mC对应pUC19 DNA片段;5hmC对应5hmC修饰DNA片段),分别指示C、5mC、5hmC的检测准确性(图4A)。统计结果显示,进行5hmC测序时,C与5mC错误地被识别为5hmC的比例平均分别为0.576%与1.54%,5hmC可以被正确识别的比例平均为99.6%;进行5mC测序时,C错误地被识别为5mC的比例平均为0.818%,5mC可以被正确识别的比例平均为98.3%。此外,为了验证TSO-Cabernet流程检测DNA甲基化修饰结果的可靠性,从中抽取五个单细胞样本与使用WO2021077415中所公开的Cabernet技术检测的样本(包含单细胞和多细胞样本)进行全基因组范围DNA甲基化修饰的相关性分析(图4B)。从图中可以看出TSO-Cabernet流程和Cabernet流程检测基因组中DNA甲基化修饰的结果具有很高的相似性。以上结果可以说明TSO-Cabernet方法能够提供可靠的5mC和5hmC检测结果。本公开提供的TSO-Cabernet方法能够实现对多细胞的同时转化和建库处理,可见,本公开提供的方法在具备检测准确性的同时能够显著提升通量。

Claims (22)

1.分析单细胞基因组DNA的甲基化特征的方法,其包括:
使来自单个细胞的基因组DNA与多个转座体接触,其中所述转座体包含转座酶和转座子DNA,其中所述转座子DNA包括双链的转座酶结合位点和悬突,其中所述悬突在所述悬突的5'末端包括第一引物结合序列,并且在所述第一引物结合序列的下游、所述转座酶结合位点的上游包含尿嘧啶核苷酸;以获得在每个末端均包含转座子DNA的双链基因组DNA片段;
使用不耐受尿嘧啶的聚合酶填充所述转座子DNA与基因组DNA片段之间的缺口,以形成基因组DNA片段的第一双链延伸产物;
将所述第一双链延伸产物与模板转换寡核苷酸接触,其中所述模板转换寡核苷酸从5’端至3’端包含:第二引物结合序列、标签序列以及转座酶结合位点结合序列;其中所述标签序列具有与该细胞相对应的独一无二的核苷酸序列;
使用不耐受尿嘧啶的聚合酶进行延伸反应,获得第二双链延伸产物;其中所述第二双链延伸产物构成该细胞的标签化基因组DNA片段的文库;
将获得自不同细胞的标签化基因组DNA片段的文库混合,并处理所述混合文库以将胞嘧啶转化为尿嘧啶;
使用第一和第二引物扩增经转化处理的混合文库以产生扩增子。
2.权利要求1所述的方法,其中,所述模板转换寡核苷酸所包含的转座酶结合位点结合序列包括锁核苷酸(LNA)修饰;
优选地,所述转座酶结合位点结合序列包含多个LNA修饰,例如2个、3个、4个或5个LNA修饰。
3.权利要求1或2所述的方法,其中,所述填充缺口和/或延伸步骤包括使用A、T、C、G四种核苷酸,其中胞嘧啶核苷酸(例如dCTP)包含经修饰的胞嘧啶,所述经修饰的胞嘧啶耐受所述转化步骤;
优选地,所述经修饰的胞嘧啶是甲基化胞嘧啶,例如5-甲基胞嘧啶(5-mdC)或5-羟甲基胞嘧啶(5-hmdC)。
4.权利要求1-3任一项所述的方法,其中,所述第一引物结合序列不含胞嘧啶核苷酸。
5.权利要求1-3任一项所述的方法,其中,所述第一引物结合序列包含胞嘧啶核苷酸,所述胞嘧啶核苷酸含有经修饰的胞嘧啶,其中所述经修饰的胞嘧啶耐受所述转化步骤;
优选地,所述经修饰的胞嘧啶是甲基化胞嘧啶,例如5-甲基胞嘧啶(5-mdC)或5-羟甲基胞嘧啶(5-hmdC)。
6.权利要求1-5任一项所述的方法,其中,所述转座子DNA在第一引物结合序列的下游、所述转座酶结合位点的上游包含多个(例如2个,3个或4个)连续的尿嘧啶核苷酸。
7.权利要求1-6任一项所述的方法,其中,所述第一引物结合序列的3’端紧邻所述尿嘧啶核苷酸;
优选地,所述转座酶结合位点的5’端紧邻所述尿嘧啶核苷酸。
8.权利要求1-7任一项所述的方法,其中,在载体DNA存在的情况下处理所述混合文库以将胞嘧啶转化为尿嘧啶;
优选地,所述载体DNA选自长度在100bp至4000bp之间的dsDNA片段;
优选地,所述载体DNA是经超声处理的λDNA。
9.权利要求1-8任一项所述的方法,其还包括对所述扩增子进行测序。
10.权利要求1-9任一项所述的方法,其中,使用第一和第二引物扩增经转化处理的混合文库以产生扩增子,所述扩增子在每个末端包含测序接头,从而生成测序文库。
11.权利要求10所述的方法,其中,所述测序接头为Illumina测序接头。
12.权利要求11所述的方法,其中,所述第一引物引入P7端接头,所述第二引物引入P5端接头;
优选地,所述第一引物包含(i)在3’端的第一部分,其包含能够与第一引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P7序列;
优选地,所述第二引物包含(i)在3’端的第一部分,其包含能够与第二引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P5序列。
13.权利要求11所述的方法,其中,所述第一引物引入P5端接头,所述第二引物引入P7端接头;
优选地,所述第一引物包含(i)在3’端的第一部分,其包含能够与第一引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P5序列;
优选地,所述第二引物包含(i)在3’端的第一部分,其包含能够与第二引物结合序列杂交的序列,和(ii)位于所述第一部分的5’的第二部分,其包含P7序列。
14.权利要求1-13任一项所述的方法,其中所述转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶或IS5转座酶。
15.权利要求1-14任一项所述的方法,其中所述不耐受尿嘧啶的聚合酶选自Q5聚合酶、Deep Vent DNA聚合酶、Phusion高保真聚合酶、KAPA高保真聚合酶、Phanta聚合酶或其任意组合。
16.权利要求1-15任一项所述的方法,其中,所述使用第一和第二引物进行扩增的步骤使用耐受尿嘧啶的聚合酶进行;
优选地,所述耐受尿嘧啶的聚合酶选自Q5U聚合酶、KAPA U+聚合酶、Phanta Uc聚合酶或其任意组合。
17.权利要求1-16任一项所述的方法,其中在对所述双链基因组DNA片段进行缺口填充和延伸之前,从所述双链片段中去除结合的转座酶。
18.权利要求1-17任一项所述的方法,其还包括在所述延伸步骤之后但在所述转化步骤之前的步骤:纯化包含所述第二双链延伸产物的反应介质;
优选地,通过DNA旋转柱或基于珠粒的DNA纯化来进行所述纯化步骤。
19.权利要求1-18任一项所述的方法,其还包括在所述扩增步骤之后的步骤:纯化包含所述扩增子的反应介质;
优选地,通过DNA旋转柱或基于珠粒的DNA纯化来进行所述纯化步骤。
20.权利要求1-19任一项所述的方法,其中所述将胞嘧啶转化为尿嘧啶的处理为酶学转化。
21.权利要求20所述的方法,其中,所述酶学转化包括APOBEC脱氨反应。
22.权利要求20所述的方法,所述酶学转化包括使用T4-BGT酶和APOBEC3A酶,或者使用TET2酶和APOBEC3A酶。
CN202310018280.8A 2023-01-06 2023-01-06 单细胞dna甲基化检测方法 Pending CN118308491A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202310018280.8A CN118308491A (zh) 2023-01-06 2023-01-06 单细胞dna甲基化检测方法
PCT/CN2024/070261 WO2024146540A1 (zh) 2023-01-06 2024-01-03 单细胞dna甲基化检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310018280.8A CN118308491A (zh) 2023-01-06 2023-01-06 单细胞dna甲基化检测方法

Publications (1)

Publication Number Publication Date
CN118308491A true CN118308491A (zh) 2024-07-09

Family

ID=91729876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310018280.8A Pending CN118308491A (zh) 2023-01-06 2023-01-06 单细胞dna甲基化检测方法

Country Status (2)

Country Link
CN (1) CN118308491A (zh)
WO (1) WO2024146540A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9290807B2 (en) * 2011-07-29 2016-03-22 Cambridge Epigenetix Limited Methods for detection of nucleotide modification
NZ759895A (en) * 2017-06-07 2023-05-26 Illumina Inc Single cell whole genome libraries for methylation sequencing
AU2019222723B2 (en) * 2018-02-14 2023-10-12 Clearnote Health, Inc. Methods for the epigenetic analysis of DNA, particularly cell-free DNA
EP4048808A4 (en) * 2019-10-25 2023-08-09 Changping National Laboratory METHYLATION DETECTION AND ANALYSIS OF MAMMALIAN DNA
CN114438184B (zh) * 2022-04-08 2022-07-12 昌平国家实验室 游离dna甲基化测序文库构建方法及应用

Also Published As

Publication number Publication date
WO2024146540A1 (zh) 2024-07-11

Similar Documents

Publication Publication Date Title
US20200165650A1 (en) Polynucleotide enrichment using crispr-cas system
US20190203204A1 (en) Methods of De Novo Assembly of Barcoded Genomic DNA Fragments
JP2020522243A (ja) 核酸のマルチプレックス末端タギング増幅
US20200181606A1 (en) A Method of Amplifying Single Cell Transcriptome
JP6181751B2 (ja) 望まれない核酸配列のネガティブ選択のための組成物および方法
CN106574287B (zh) 用于核酸扩增的样品制备
CN110741092A (zh) 扩增dna以维持甲基化状态的方法
US20230056763A1 (en) Methods of targeted sequencing
CN114391043B (zh) 哺乳动物dna的甲基化检测及分析
CN118284703A (zh) 胚胎核酸分析
WO2024146540A1 (zh) 单细胞dna甲基化检测方法
CN114450420A (zh) 用于肿瘤学精确测定的组合物和方法
WO2021156295A1 (en) Methods for amplification of genomic dna and preparation of sequencing libraries
WO2023225515A1 (en) Compositions and methods for oncology assays
CN115279918A (zh) 用于测序的新型核酸模板结构

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination