CN110741092A

CN110741092A - 扩增dna以维持甲基化状态的方法

Info

Publication number: CN110741092A
Application number: CN201880029791.7A
Authority: CN
Inventors: 曹云龙; X·S·谢
Original assignee: Directors And Membership Groups Of Harvard College
Current assignee: Directors And Membership Groups Of Harvard College
Priority date: 2017-03-08
Filing date: 2018-03-08
Publication date: 2020-01-31
Also published as: RU2754038C2; IL269178A; RU2019131550A; AU2018231240A2; US20200063213A1; AU2018231240A1; EP3596098A1; MX2019010655A; EP3596098A4; JP2020513801A; WO2018165366A1; CA3055817A1; RU2019131550A3

Abstract

本发明提供了一种制备扩增的甲基化组的方法，所述方法通过延伸片段和用甲基转移酶和甲基源处理延伸的片段，将半甲基化的双链DNA转化成完全甲基化的双链DNA，来制备扩增的甲基化组。

Description

扩增DNA以维持甲基化状态的方法

相关申请数据

本申请要求于2017年3月8日提交的第62/468,595号美国临时申请的优先权，并通过引用将其整体纳入本文用于所有目的。

政府权益声明

本发明是在国立卫生研究院(National Institutes of Health)的5DP1CA186693政府资助下完成。政府对本发明享有某些权利。

背景技术

发明领域

本发明的实施方式一般涉及用于扩增DNA(例如来自单细胞的DNA，或无细胞的DNA)以维持甲基化信息或状态的方法和组合物。

背景技术

基因组DNA的亚硫酸氢钠转换已经成为DNA甲基化分析的金标准。用亚硫酸氢盐处理DNA将胞嘧啶残基转换成尿嘧啶，但不影响5-甲基胞嘧啶残基。该方法提供了区分未甲基化和甲基化胞嘧啶的可能，并提供了DNA甲基化状态的单核苷酸解析图。

亚硫酸氢盐转换中的主要挑战是与转换同时发生的DNA降解和片段化。完成转换所必须的条件，例如长孵育时间，升高的温度以及高亚硫酸氢盐浓度都可能导致达90％孵育的DNA降解和片段化。降解随着DNA脱嘌呤发生，导致随机链断裂。大量降解带来问题，而且在诸如与有限量的起始DNA或甚至单个细胞水平的DNA退火时，更加严重。直接对单个细胞进行亚硫酸氢盐转换然后进行DNA扩增可实现低覆盖率的单细胞亚硫酸氢盐转换。Guo,H.,等(2013)."Single-cell methylome landscapes of mouse embryonic stem cellsand early embryos analyzed using reduced representation bisulfitesequencing."(采用减少表现亚硫酸氢盐测序分析小鼠胚胎干细胞的单个细胞以及早期胚胎的甲基化组情况)Genome Res 23(12):2126-2135；Smallwood,S.A.,等(2014)."Single-cell genome-wide bisulfite sequencing for assessing epigeneticheterogeneity."(用于评估表观遗传学异质性的单个细胞基因组范围的亚硫酸氢盐测序)Nat Methods 11(8):817-820。

在细胞间变异和种群异质性起关键作用的研究中，如肿瘤生长、干细胞重编程、记忆形成、胚胎发育等，对单个细胞水平DNA进行高覆盖率基因组甲基化研究的能力非常重要。当进行分析的细胞样品是珍稀的、或罕见的、或少量的，例如当样品是一个细胞或单个细胞的完整或部分基因组，或无细胞DNA时。

各种已知的扩增方法，例如全基因组扩增法导致来自原始模板的甲基化信息或状态丧失。这样的全基因组扩增方法包括多重置换扩增(MDA)，其是在测序和其它分析之前在采用来自单个细胞的基因组DNA的领域的常用方法。在该方法中，随机引物退火后，利用具有强链置换活性的DNA聚合酶进行延伸。来自单个细胞的原始基因组DNA以级联样的形式指数扩增，以形成超支化DNA结构。扩增来自单个细胞的基因组DNA的其它方法述于Zong,C.,Lu,S.,Chapman,A.R.,和Xie,X.S.(2012),人单个细胞的单核苷酸和拷贝数变异的基因组范围检测(Genome-wide detection of single-nucleotide and copy-numbervariations of a single human cell),Science 338,1622-1626，其中描述了多重退火和基于环型的扩增循环(MALBAC)。本领域所知的另一方法是简并寡核苷酸引发的PCR或DOP-PCR。用于单个细胞基因组DNA的若干其他方法包括：Cheung,V.G.和S.F.Nelson,使用简并寡核苷酸引物的全基因组扩增允许成百上千个基因型以少于一纳克的基因组DNA进行(Whole genome amplification using a degenerate oligonucleotide primer allowshundreds of genotypes to be performed on less than one nanogram of genomicDNA),Proceedings of the National Academy of Sciences of the United States ofAmerica,1996.93(25):14676-9页；Telenius,H.,等,简并寡核苷酸引发的PCR：通过单个简并引物的常规扩增(Degenerate oligonucleotide-primed PCR:general amplificationof target DNA by a single degenerate primer),Genomics,1992.13(3):718-25页；Zhang,L.,等,单个细胞的全基因组扩增：对基因分析的启示(Whole genomeamplification from a single cell:implications for genetic analysis).Proceedings of the National Academy of Sciences of the United States ofAmerica,1992,89(13):5847-51页；Lao,K.,N.L.Xu,和N.A.Straus,使用单个引物的PCR的全基因组扩增(Whole genome amplification using single-primer PCR),Biotechnology Journal,2008,3(3):378-82页；Dean,F.B.,等,使用多重置换扩增的完整人基因组扩增(Comprehensive human genome amplification using multipledisplacement amplification),Proceedings of the National Academy of Sciencesof the United States of America,2002.99(8):5261-6页；Lage,J.M.,等,使用超支化链置换扩增和列阵-CGH对小DNA样品中基因变异的全基因组分析(Whole genome analysisof genetic alterations in small DNA samples using hyperbranched stranddisplacement amplification and array-CGH),Genome Research,2003,13(2):294-307页；Spits,C.,等,单个细胞全基因组置换扩增的优化和评价(Optimization andevaluation of single-cell whole-genome multiple displacement amplification),Human Mutation,2006,27(5):496-503页；Gole,J.,等,使用纳升微管进行单个细胞大规模平行聚合酶克隆和基因组测序(Massively parallel polymerase cloning and genomesequencing of single cells using nanoliter microwells),Nature Biotechnology,2013.31(12):1126-32页；Jiang,Z.,等,使用多重置换扩增的单个***的基因组扩增(Genome amplification of single sperm using multiple displacementamplification),Nucleic Acids Research,2005,33(10):e91页；Wang,J.,等,人***细胞中重组活性和新生突变比例的基因组范围单个细胞分析(Genome-wide Single-CellAnalysis of Recombination Activity and De Novo Mutation Rates in HumanSperm),Cell,2012.150(2):402-12页；Ni,X.,肺癌患者单循环肿瘤细胞中可再生拷贝数变异模式(Reproducible copy number variation patterns among single circulatingtumor cells of lung cancer patients),PNAS,2013,110,21082-21088；Navin,N.,通过单个细胞测序推测肿瘤进化(Tumor evolution inferred by single cell sequencing),Nature,2011,472(7341):90-94；Evrony,G.D.,等,人大脑中11个反转录转座和体细胞突变的单个神经元测序分析(Single-neuron sequencing analysis of l1retrotransposition and somatic mutation in the human brain),Cell,2012.151(3):483-96页；和McLean,J.S.,等,使用高通量单个细胞基因组学平台从医院槽中的生物膜中回收牙龈卟啉单胞菌病原体的基因组(Genome of the pathogen Porphyromonasgingivalis recovered from a biofilm in a hospital sink using a high-throughput single-cell genomics platform),Genome Research,2013.23(5):867-77页。关于全基因组扩增方面的方法报道于WO 2012/166425、US 7,718,403、US2003/0108870和US 7,402,386。

然而，存在对于扩增少量基因组DNA或DNA片段(例如来自单细胞或一小群细胞或无细胞DNA)的其它方法的需求，其中扩增子维持来自原始模板的甲基化信息。

发明内容

本公开提供了一种产生或使用DNA片段的方法，可随后对所述DNA片段进行变性和引物延伸，例如单引物延伸，例如使用产生半甲基化双链模板或片段的两个拷贝的PCR条件。半甲基化双链模板或片段的两个拷贝用甲基转移酶处理以在新合成的链位置上使胞嘧啶甲基化，其中在该位置处原始模板的双链片段被甲基化，即在该位置处的甲基由于延伸反应被除去。可重复引物延伸形成半甲基化双链DNA和用甲基转移酶处理的过程，以产生扩增的双链DNA片段，其具有原始双链DNA模板片段的甲基化模式。可分析具有原始模板片段甲基化特征的扩增的DNA片段群，以确定甲基化特征。

片段化的方法包括本领域已知的，并包括转座酶片段化，其中使用转座酶或转座体(transposome)来片段化原始或起始核酸序列，例如基因组DNA，其片段，无细胞DNA等，以及在切割或片段化位点的每个末端连接条码序列以便于(如需要)作为完整或全部甲基化组(methylome)的从头组装过程一部分的片段序列的后续计算再连接。

本公开的某些实施方式的其他特征和优势将在权利要求中以及以下附图和实施方式的说明下更为显而易见。

附图说明

本专利或申请文件包含至少一幅有色附图。本专利或专利申请公开的带彩色附图副本将根据要求，在支付所需的费用之后由政府机关提供。结合附图，通过以下示例性实施方式的详述能够更全面地理解本发明实施方式的上述和其他特征和其他优点，其中：

图1示意性描述了基因组核酸样品片段化，然后变性，引物延伸和用甲基化试剂处理的方法。该循环重复2-4次，以产生扩增的甲基化组，然后用亚硫酸氢盐或酶(例如ABOPEC家族成员)或其他试剂处理，将胞嘧啶变成尿嘧啶。

图2显示了甲基化胞嘧啶在使用2x150bp Miseq v2试剂盒的亚硫酸氢盐测序结果中独特排列的读数(1,000,000个读数)中的百分数。

图3显示了甲基转移酶DNMT1的性能。

图4示意性显示了用本文所述的扩增和甲基化方法的癌症诊断方法。

图5描述了甲基化敏感的限制性酶Clai在合成的寡核苷酸上的体外性能的数据分析，以开发用于本文所述的扩增和甲基化反应的最佳反应缓冲液。

图6描述了在一些缓冲条件下估计DNMT1的甲基转移效率的数据。

图7描述了变性和引物延伸并在一些缓冲条件下用甲基化剂处理的第一和第二轮循环中DNMT1的甲基转移效力的估计数据。

发明详述

除非另有说明，某些实施方式的实践或某些实施方式的特征可以采用分子生物学、微生物学、重组DNA中的常规技术，这些常规技术为本领域普通技术人员所知。这些技术在文献中已有充分描述。参见，例如，Sambrook,Fritsch,和Maniatis,《分子克隆：实验室手册(MOLECULAR CLONING:A LABORATORY MANUAL)》,第二版(1989),《寡核苷酸合成(OLIGONUCLEOTIDE SYNTHESIS)》(M.J.Gait编著,1984),《动物细胞培养(ANIMAL CELLCULTURE)》(R.I.Freshney编著,1987),《酶学方法(METHODS IN ENZYMOLOGY)》丛书(学术出版社有限公司(Academic Press,Inc.))；《哺乳动物细胞的基因转移载体(GENE TRANSFERVECTORS FOR MAMMALIAN CELLS)》(J.M.Miller和M.P.Calos编著.1987),《免疫学实验手册(HANDBOOK OF EXPERIMENTAL IMMUNOLOGY)》,(D.M.Weir和C.C.Blackwell编著),《新编分子生物学实验指南(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)》(F.M.Ausubel,R.Brent,R.E.Kingston,D.D.Moore,J.G.Siedman,J.A.Smith,和K.Struhl编著,1987),《新编免疫学实验指南(CURRENT PROTOCOLS IN IMMUNOLOGY)》(J.E.coligan,A.M.Kruisbeek,D.H.Margulies,E.M.Shevach和W.Strober编著,1991)；《免疫学年鉴(ANNUAL REVIEW OFIMMUNOLOGY)》；以及如《免疫学进展(ADVANCES IN IMMUNOLOGY)》等期刊中的专著。本文上下文中提及的所有专利、专利申请和出版物均以参考的方式用全文纳入本文。

本文所用的核酸化学、生物化学、遗传学和分子生物学的术语和符号遵循本领域的标准论述和文本中的术语和符号，例如，Kornberg和Baker，DNA Replication(《DNA复制》)，第二版(W.H.弗里曼出版社(W.H.Freeman)，纽约，1992)；Lehninger，Biochemistry(《生物化学》)，第二版(沃斯出版社(Worth Publishers)，纽约，1975)；Strachan和Read，Human Molecular Genetics(《人类分子遗传学》)，第二版(WL出版社(Wiley-Liss)，纽约，1999)；Eckstein编，Oligonucleotides andanalogs:A Practical Approach(《寡核苷酸和类似物：实践方法》)(牛津大学出版社(Oxford University Press)，纽约，1991)；Gait编，Oligonucleotide Synthesis:A Practical Approach(《寡核苷酸合成：实践方法》)(IRL出版社，牛津，1984)；等。

CpG位点或CG位点是胞嘧啶核苷酸以碱基线性顺序沿其5’到3’方向后随一个鸟嘌呤核苷酸的DNA区域。在哺乳动物中，CpG双核苷酸中的胞嘧啶可被甲基化，形成5-甲基胞嘧啶。基因内胞嘧啶的甲基化可改变其表达，通常导致翻译沉默或抑制。在哺乳动物中，70％到80％的CpG胞嘧啶甲基化，在人中存在有总共28,000,000个CpG位点。发现哺乳动物DNA的CpG双核苷酸中胞嘧啶甲基化与许多关键过程(包括胚胎发生、基因组特征、X-染色体失活、老化和癌发生)有关。在胚胎发生中，DNA甲基化模式大部分被除去，而在哺乳动物的世代之间重建。几乎全部来自亲本的甲基化被除去，首先是在配子发生过程中，然后在胚胎发生早期，每次都有去甲基化和再甲基化。在许多疾病过程，例如癌症中，基因启动子CpG岛需要异常高甲基化，导致可能被细胞***后的子细胞继承的转录沉默。

本文基于这样的认识：准确的基因组甲基化分析依赖于在DNA(例如少量DNA或来自单个细胞的DNA或无细胞DNA)加工过程中的甲基化信息的维持。本文提供了扩增来自单个细胞的DNA或少量DNA，以产生具有原始模板DNA的甲基化信息或状态的扩增子的方法。根据一方面，本文所述能够研究DNA甲基化的方法，通过比较获自个体的DNA样品，例如获自血液的无细胞DNA样品，的甲基化状态提供进一步的癌症诊断方法，其中DNA的甲基化状态指示癌症，即为标准。如果DNA样品的甲基化状态与指示癌症的标准甲基化状态相关，则诊断该个体患有癌症。可作为本文描述的方法的标准的癌症DNA的甲基化模式是本领域技术人员已知的，如下所述：Vadakedath S,Kandi V(2016)《DNA甲基化及其对各种癌症的效果：综述》(DNA Methylation and Its Effect on Various Cancers:An Overview.)，J MolBiomark Diagn S2:017.doi:10.4172/2155-9929.S2-017和《对不同类型癌症的甲基化分析：MethHC:DNA人类癌症的甲基化和基因表达数据库》(A DataBase of MethylationAnalysis on different type of cancers:MethHC:a database of DNA methylationand gene expression in human cancer.)W.Y.Huang,S.D.Hsu,H.Y.Huang,Y.M.Sun,C.H.Chou,S.L.Weng,H.D.Huang*核酸研究.2015年1月；43(数据库版本):D856-61，各在此完整引入以供参考。

根据一方面，双链DNA片段(例如无细胞DNA、或较长的DNA如基因组DNA产生的DNA片段)变性成第一模板单链DNA和第二模板单链DNA，然后引物延伸，例如单引物延伸各第一模板单链DNA和第二模板单链DNA，形成第一半-甲基化双链DNA和第二半-甲基化双链DNA。双链DNA是半甲基化的，因为引物延伸产生的互补链缺乏其所替换的原始链的甲基化状态。然后用甲基化试剂例如甲基转移酶如DNMT1处理半-甲基化的双链DNA，产生甲基化双链DNA片段，其使得原始模板的甲基化状态或信息被复制。如果甲基化获得原始模板的原始甲基化状态，则认为半甲基化的双链DNA的甲基化是完全甲基化。该变性、引物延伸形成半-甲基化双链DNA以及用甲基化剂处理以恢复甲基化的过程可重复多次，例如1-3次，1-4次或1-5次，即该过程可进行2-4次，2-5次或2-6次，以产生具有原始模板片段甲基化状态或信息的扩增片段。然后用如本领域已知的将胞嘧啶转换成尿嘧啶的试剂处理具有原始模板片段的甲基化状态或信息的扩增片段，然后用本领域已知的方法，例如高通量测序法对处理的扩增片段测序，以确定甲基化的性质和程度，甲基化模式，甲基化的存在与否等。在一个方面，扩增过程产生足够量的具有原始模板的原始甲基化状态的扩增子，从而抵消由于将胞嘧啶转换成尿嘧啶的试剂处理导致的降解，例如亚硫酸氢盐处理导致的降解，或当进行PCR反应时的等位基因丢失造成的DNA损失，而仍然具有足够的DNA用于甲基化分析。

甲基化试剂是本领域技术人员已知的，根据本公开内容将变得清楚。甲基化试剂可以是甲基转移酶。甲基化试剂的一个例子是DNMT1。DNMT1是哺乳动物细胞中最多的DNA甲基转移酶，被认为是关键维持的甲基转移酶，因为其在哺乳动物基因组中能优势甲基化半甲基化的CpG双核苷酸。该酶对于半甲基化的DNA比未甲基化的底物体外活性高7-100倍。通过将一轮PCR反应与DNMT1的基因组DNA温育结合，可以实现基因组DNA甲基化状态的复制。另外，可进行多次甲基化复制循环，导致亚硫酸氢盐转换或酶转换(如APOBEC等酶转换)或其他将胞嘧啶转换成尿嘧啶的试剂的起始DNA提高达32倍。其他有用的甲基化剂包括DNMT3a和DNMT3b，它们是哺乳动物甲基转移酶。还有用的甲基化试剂包括DRM2、MET1、和CMT3，它们是植物甲基化转移酶。其它有用的甲基化试剂包括Dam，其是细菌甲基转移酶。根据一个方面，应理解DNMT1或其他合适的甲基转移酶与甲基来源一起使用，并可和或不和本领域技术人员所知的辅助因子一起使用。DNMT1在没有辅助因子的情况下体外效率为95％，然而DNMT1也可以与辅助因子例如NP95(Uhrf1)一起使用，如Bashtrykov P1,JankeviciusG,Jurkowska RZ,Ragozin S,Jeltsch A所述。UHRF1蛋白通过变构机制刺激维持DNA甲基转移酶DNMT1的活性和特异性。J Biol Chem.2014在此完整引入以供参考。

根据一个方面，甲基转移酶例如DNMT1可能需要条件，例如缓冲条件，其不包括离子(例如阳离子)，如镁离子或锰离子等，其可能是用于引物延伸的PCR反应的组分或条件。本领域技术人员应理解用于引物延伸或PCR反应的离子(例如阳离子)的性质和程度。根据一个方面，在引物延伸步骤后使用螯合剂例如EDTA来螯合离子，例如镁离子，以进行甲基化步骤。技术人员应理解螯合步骤是为了螯合用于引物延伸步骤的离子但可能会抑制甲基化步骤。应理解在一些条件下，在甲基化过程中在反应介质中可存在镁离子。然而，在某些实施方式中，例如在引物延伸步骤和甲基化步骤在同一容器的相同介质中，不需要纯化步骤，因为使用例如EDTA的螯合剂以相等摩尔的方式螯合镁，以提供无镁缓冲液用于甲基转移反应。补充回镁，用于下一个引物延伸步骤(在PCR条件下，完成甲基转移反应后)的反应。示范性螯合剂包括亚氨基二琥珀酸(IDS)、聚天冬氨酸、乙二亚胺-N,N’-二琥珀酸(EDDS)、甲基甘氨酸二乙酸、基于氨基聚羧酸的螯合物、四钠盐或N-二乙酸。

将胞嘧啶转换成尿嘧啶的试剂是本领域技术人员已知的，包括亚硫酸氢盐试剂例如亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢铵、亚硫酸氢镁、偏亚硫酸氢钠、偏亚硫酸氢钾、偏亚硫酸氢铵、偏亚硫酸氢镁等。将胞嘧啶转换成尿嘧啶的酶性试剂，即胞嘧啶脱氨酶，包括ABOPEC家族的那些，例如APOBEC-seq或APOBEC3A。APOBEC家族成员是胞苷脱氨酶，其将胞嘧啶转换成尿嘧啶，同时保留5-甲基胞嘧啶，即不改变5-甲基胞嘧啶。这样的酶如US2013/0244237所述，可购自New England Biolabs公司。本领域技术人员根据本公开内容可明白其他酶性试剂。

用亚硫酸氢盐试剂，例如亚硫酸氢钠处理的DNA样品可将胞嘧啶转换成尿嘧啶，并保持5-甲基胞嘧啶(mC)不变。因此在亚硫酸氢盐处理后，DNA中的5-mC保持为胞嘧啶，而未修饰的胞嘧啶将变成尿嘧啶。亚硫酸氢盐处理可通过市售试剂盒，例如Imprint DNAModification试剂盒(Sigma),EZ DNA Methylation-DirectTM试剂盒(ZYMO)等进行。一旦DNA亚硫酸氢盐转换完毕，捕获单链DNA，脱磺酸盐并清洁。可通过纯化柱或磁珠捕获亚硫酸氢盐处理的DNA。可进一步用碱性溶液，优选氢氧化钠对亚硫酸氢盐处理的DNA脱磺化。然后洗脱并收集DNA入PCR管。亚硫酸氢盐处理的单链DNA可通过酶催化的使用恰当引物的DNA链合成转换成dsDNA。合适的酶包括Bst DNA聚合酶，外切核酸酶缺陷的Klenow DNA聚合酶大片段，phi29 DNA聚合酶，T4 DNA聚合酶,T7 DNA聚合酶,HIV-1逆转录酶,M-MLV逆转录酶,AMV逆转录酶等。这些酶将ssDNA模板中的尿嘧啶识别成胸腺嘧啶，并在互补链上加上腺嘌呤。互补链上的进一步聚合酶延伸将导致原始亚硫酸氢盐处理的ssDNA模板复制，除了用胸腺嘧啶替换尿嘧啶。因此，通过与参比基因组比较，鉴定所有胞嘧啶到胸腺嘧啶的转换和鸟嘌呤到腺嘌呤的转换(互补链)，可识别所有未修饰的胞嘧啶，并认为所有剩余的胞嘧啶被甲基化。

对于单个细胞甲基化组分析，使用随机引物，优选6-8聚体，更优选为六聚体。对于癌症诊断，使用一组(20+)选定的亚硫酸氢盐PCR引物(设计成扩增亚硫酸氢盐处理的DNA)，其靶向不同的癌症分化甲基化基因(仅在一些癌症类型中甲基化或未甲基化的基因)。示范性的癌症相关基因包括SEPT9基因,TMEM106A,NCS1,UXS1,HORMAD2,REC8,DOCK8,CDKL5等。本领域技术人员根据本公开内容可明白其他癌症相关基因。引物的选择是基于标准癌症甲基化数据。靶向基因的甲基化状态的不同组合鉴定出个体内存在的特定癌症类型。

因此，本公开所述的方法可对核酸样品，如少量基因组DNA或有限量DNA(如无细胞DNA)，如获自单个细胞或相同细胞类型的多个细胞的一个或多个基因组序列或来自获自个体或底物的胚胎、组织、液体或血液样品的一个或多个基因组序列。根据本公开的某些方面，核酸样品可以在来自单个细胞的未纯化的或未处理的裂解物中。根据本公开的一些方面，核酸样品可以是无细胞DNA，例如其存在于液体生物样品，例如血液中。待进行本文所述方法的核酸，在将其与各种试剂接触并且经历本文所述的各种条件之前，不需要被纯化，如通过柱纯化。

根据一些方面，本文所述的方法可称作甲基化扩增法或甲基转移酶的甲基化组复制循环(methylme replication loops with methyl-transferase，MERLOT)。本文所述的方法提供单细胞水平的基因组DNA或少量DNA的预扩增，同时维持原始模板dsDNA的甲基化信息或状态。根据一个示范性方面，方法包括DNA的一轮PCR反应和人甲基转移酶DNMT1孵育，以实现DNA甲基化状态的复制。根据一个方面，进行甲基化组复制循环多次可实现亚硫酸氢盐起始DNA转化量的2-32倍的增加，2-19倍的增加，2-18倍的增加，2-17倍的增加，2-16倍的增加，2-8倍的增加和2-4倍的增加。该扩增的DNA可补充亚硫酸氢盐转换或全基因组扩增时的DNA损失，并实现更高效的DNA(例如单细胞水平的DNA或少量DNA等)的甲基化状态确定。

本发明的实施方式利用产生DNA片段的方法，例如来自单个细胞或少量DNA或来自胚胎的DNA的全基因组的DNA片段，然后进行本文所述的扩增方法，以维持甲基化信息，然后用本领域技术人员已知的和本文所述的测序方法测序。

从原始DNA样品产生DNA片段的方法是本领域技术人员已知的。一种方法包括超声然后末端修复和衔接体序列连接。对于癌症诊断，使用一组(20+)所选的靶向PCR引物(对于正常DNA)产生在两端具有引发位点的DNA扩增子。基因靶标包括SEPT9基因,TMEM106A,NCS1,UXS1,HORMAD2,REC8,DOCK8,CDKL5等。

根据一个示范性方面，描述了用酶(如Tn5)产生核酸片段的方法。这样的方法是本领域已知的，包括那些用illumina Nextera试剂盒进行的。根据一个示范性方面，本文描述了利用转座子文库的方法，以及一种称作“标签化(tagmentation)”的方法，其从较大的dsDNA序列建立片段，其中用将用于单引物延伸和扩增中的引物标记这些片段。一般，作为转座体一部分的转座酶用于产生一组双链基因组DNA片段。根据某些方面，转座酶具有结合转座子DNA以及当接触时(如将其置于反应容器或反应体积内时)二聚化，形成转座酶/转座子DNA复合物二聚体的能力，该转座酶/转座子DNA复合物二聚体被称为转座体。转座体的各转座子DNA包含双链转座酶结合位点和第一核酸序列，其包含扩增促进序列，如特异性引物位点(“引物结合位点”)或转录启动子位点。第一核酸序列可以处于单链延伸的形式。

转座体具有随机结合沿双链核酸(如双链基因组DNA)分布的靶位置形成包括转座体和双链基因组DNA的复合物的能力。转座体中的转座酶切割双链基因组DNA，其中一个转座酶切割上链，一个转座酶切割下链。转座体中各转座子DNA在切割位点的各末端与双链基因组DNA连接，即转座体的一个转座子DNA与左侧切割位点连接，而转座体的另一转座子DNA与右侧切割位点连接。以这种方式提供具有引物结合位点的左侧切割位点和右侧切割位点。

根据某些方面，例如，多个转座酶/转座子DNA复合物二聚体(即，转座体)结合沿双链基因组DNA分布的相应的多个靶位置，并且然后将双链基因组DNA切割成多个双链片段，其中各片段具有带引物结合位点的转座子DNA，所述引物结合位点连接于双链片段各末端。以这种方式，引物结合位点可用于单引物延伸反应。

根据一个方面，转座子DNA连接于双链基因组DNA，并且单链缺口存在于基因组DNA的一条链和转座子DNA的一条链之间。根据一个方面，进行缺口延伸以填平缺口并产生双链基因组DNA和双链转座子DNA之间的双链连接。根据一个方面，包含转座酶结合位点和转座子DNA的扩增促进序列的核酸序列连接于双链片段的各末端。根据某些方面，转座酶连接转座子DNA，所述转座子DNA连接于双链片段的各末端。根据一个方面，将转座酶从转座子DNA去除，所述转座子DNA连接于双链基因组DNA片段的各末端。

根据本发明的一个方面，然后用转座子DNA作为模板，用引物结合位点对通过转座酶产生的双链基因组DNA片段进行填平缺口和延伸，所述双链基因组DNA片段具有连接于双链基因组DNA片段各末端的转座子DNA。相应地，产生双链核酸延伸产物，其包括双链基因组DNA片段和位于双链基因组DNA各末端的含有扩增促进序列，即引物延伸序列的双链转座子DNA。

在该阶段，包括基因组DNA片段和扩增促进序列的双链核酸延伸产物可用本领域技术人员熟知的方法进行引物延伸，产生一对半甲基化的双链DNA。该半甲基化双链DNA对然后与甲基化试剂，例如甲基转移酶如DNMT1以及甲基源孵育，将甲基置于引物延伸所产生的链上，从而符合原始模板链的甲基化。以这种方式，可以说该方法可加上甲基或恢复由于单引物延伸反应产生互补链而损失的原始模板链的甲基或恢复其甲基化信息或状态。

引物延伸包括使用单或多引物延伸。单引物延伸包括使用促进序列，其可以是位于双链基因组DNA各末端的特异性引物结合位点。所述“特异性”引物结合位点指示2个引物结合位点具有相同序列，并且因此共同序列的引物可以用于延伸所有片段。PCR引物序列和试剂可以用于延伸。延伸方法可以如所需进行任意次数，以最大化建立具有原始模板片段的甲基化信息的扩增子。

然后在进一步分析之前可以收集和/或纯化扩增子。可使用本领域技术人员已知的方法对扩增子进行扩增和/或测序。一旦经测序，可用本领域技术人员已知的方法分析片段的甲基化信息，然后与对应于一些疾病的甲基化标准比较，例如作为诊断患有一些疾病的患者的方法。

本公开的实施方式针对一种产生具有原始DNA模板的甲基化状态或信息的DNA扩增子，该状态或信息可能在建立互补链的扩增和/或引物延伸反应中丢失。DNA可以是少量基因组DNA或有限量DNA，如获自单个细胞或相同细胞类型的多个细胞的一个或多个基因组序列或来自获自个体或底物的组织、液体或血液样品(即循环DNA)的一个或多个基因组序列。根据本发明的一些方面，本文所述的方法利用片段化DNA的标签化方法，使用包括延伸引物的转座酶产生包含延伸引物位点的dsDNA，或使用靶向PCR产生靶向基因的扩增子。这些片段可变性成单链，延伸，并恢复甲基化信息。可重复该过程许多次，产生可进行亚硫酸氢盐转换或ABOPEC处理的扩增甲基化组。亚硫酸氢盐转换的扩增甲基化组然后可进行扩增和/或测序，例如使用本领域技术人员已知的高通量测序平台。可用本领域已知的方法，例如测序信息分析来分析甲基化状态。

本文所述方法在以高异质细胞群(如肿瘤和神经块)为特征的组织样品或生物***中具有特定应用。本文所述的方法可以利用不同来源的DNA材料，包括遗传异质性组织(例如，癌症)，稀有和珍贵样品(例如，胚胎干细胞)，和非***细胞(例如，神经元)等，以及本领域技术人员已知的测序平台和基因分型方法。

根据一个方面，获得DNA，如获自裂解的单个细胞的基因组核酸。使用多个转座体或转座体文库将DNA切割成双链片段。多个转座体或转座体文库中的每一个转座体是结合转座子DNA的转座酶的二聚体，即，各转座体包含2个单独的转座子DNA。转座体的每个转座子DNA包括转座酶结合位点和扩增或延伸促进序列，例如用于单引物延伸法的特异性引物结合位点。

转座体DNA在各切割或片段化位点连接各双链片段的上链和下链。然后处理双链片段以填平缺口。然后对该片段进行单引物延伸，以产生半甲基化dsDNA，然后用甲基转移酶处理，在不同位置加上甲基，以复制原始dsDNA模板的甲基化状态。重复该过程产生具有原始模板片段的甲基化特征的扩增模板片段群。可确定甲基化特征。在一个方面，可扩增和/或测序片段，可确定甲基化特征。

在某些方面，使用PCR条件实现引物延伸扩增。PCR是这样一种反应，其中使用由上游和下游引物组成的一组引物或一对引物和聚合催化剂(如DNA聚合酶，通常为热稳定的聚合酶)，由靶多核苷酸制备复制拷贝。PCR的方法在本领域是公知的，并且在例如MacPherson等.(1991)PCR 1：使用方法(PCR 1:A Practical Approach)牛津大学出版社(OxfordUniversity Press)IRL出版社(IRL Press)中教导。Mullis(美国专利号4,683,195、4,683,202和4,965,188)的术语“聚合酶链反应”(“PCR”)指无需克隆或纯化即可提高靶序列区段浓度的方法。用于扩增靶序列的该方法包括提供具有所需靶序列的寡核苷酸引物和扩增试剂，然后在聚合酶(例如，DNA聚合酶)存在的情况下进行准确的一连串热循环。引物与双链靶序列各自对应的链(“引物结合序列”)互补。为了进行扩增，将双链靶序列变性，然后将引物退火至靶分子中的其互补序列。退火后，用聚合酶延伸引物，从而形成一对新的互补链。如需要，变性、引物退火和聚合酶延伸步骤可以重复多次(即，变性、退火或延伸组成一个“循环”；可以存在许多“循环”)以获得所需靶序列的高浓度扩增区段。根据本公开，在一个循环后，用甲基添加试剂或酶如甲基转移酶(如DNMT1)处理得到的扩增子以在双链核酸片段上加上甲基。所需靶序列的扩增区段的长度由引物相对于彼此的相对位置确定，并且因此，长度是可控参数。由于该过程的重复，该方法被称为“聚合酶链式反应”(下文称之为“PCR”)并且靶序列被称为是“PCR扩增的”。当双链DNA扩增产物累积到DNA聚合酶活性被抑制的一定量时，PCR扩增达到饱和。一旦饱和，PCR扩增达到稳定水平，此时扩增产物不会随着PCR循环的增加而增加。

藉由PCR，有可能将基因组DNA中的特定靶序列的单拷贝扩增至通过几种不同方法(例如，与标记探针杂交；纳入生物素化引物，然后进行抗生物素蛋白-酶偶联物检测；将32P-标记的脱氧核苷酸三磷酸(如dCTP或dATP)纳入扩增区段)可检测的水平。除了基因组DNA，任何寡核苷酸或多核苷酸都可以用适当的引物分子组进行扩增。特别是，通过PCR过程其自身产生的扩增区段本身就是用于后续PCR扩增的有效模板。用于进行PCR的方法和试剂盒是本技术领域已熟知的。产生多核苷酸复制拷贝的所有方法(如PCR或基因克隆)在本文中统称为复制。引物还可以用作杂交反应中的探针，如Southern或Northern印迹分析。

“扩增”或“进行扩增”这样的表达指通过其将形成特定多核苷酸的额外或多个拷贝的过程。扩增包括诸如PCR、连接扩增(或连接酶链反应，LCR)和其他扩增方法的方法。这些方法在本领域中是已知且广泛应用的。参见，例如，美国专利号4,683,195和4,683,202，以及Innis等.,“PCR方法：方法和应用的指南”(PCR protocols:a guide to method andapplications)学术出版社股份有限公司(Academic Press,Incorporated)(1990)(针对PCR)；和Wu等.(1989)Genomics 4:560-569(针对LCR)。通常，PCR过程描述了一种基因扩增方法，其包括(i)引物与DNA样品(或文库)中特定基因的序列特异性杂交，(ii)随后的扩增，涉及使用DNA聚合酶的多轮退火、延伸和变性，和(iii)筛选PCR产物以获得正确大小的条带。使用的引物是具有足够长度和适当序列的寡核苷酸以引发聚合，即特异性地设计各引物，使其与待扩增的基因组基因座的各条链互补。

进行扩增反应的试剂和硬件是市售可得的。用于从特定基因区域扩增序列的引物优选与目标区域或其侧接区中的序列互补并与其特异性杂交，并且可以使用本领域技术人员已知道的方法制备。通过扩增生成的核酸序列可以直接进行测序。

当杂交以两个单链多核苷酸之间的反平行构型发生时，该反应被称为“退火”，并且这些多核苷酸被描述为“互补的”。如果杂交可以发生在第一多核苷酸的一条链与第二多核苷酸的链之间，那么双链多核苷酸可以与另一多核苷酸互补或同源。根据普遍接受的碱基配对规则，互补性或同源性(一个多核苷酸与另一个多核苷酸互补的程度)可依据相对链中预计将彼此之间形成氢键的碱基的比例来定量。

术语“PCR产物”、“PCR片段”和“扩增产物”指在变性、退火和延伸PCR步骤的一个或更多个循环完成后得到的化合物混合物。这些术语包括已经扩增了一个或多个靶序列的一个或多个片段的情况。

术语“扩增试剂”可以指除了引物、核酸模板和扩增酶以外扩增所需的那些试剂(脱氧核糖核苷三磷酸，缓冲液等)。通常，将扩增试剂与其他反应组分一起放置并容纳在反应容器中(试管，微孔等)。扩增方法包括本领域技术人员已知的PCR方法，并且还包括滚环扩增(Blanco等.,J.Biol.Chem.,264,8935-8940,1989)、超支化滚环扩增(Lizard等.,Nat.Genetics,19,225-232,1998)和环介导的等温扩增(Notomi等.,Nuc.Acids Res.,28,e63,2000)，其各自通过引用将其全部内容纳入本文。

根据一个方面，提供了亚硫酸氢盐处理或APOBEC处理的扩增甲基化组产生方法，其包括使来自单个细胞的双链基因组DNA与各自结合转座子DNA的Tn5转座酶接触，其中转座子DNA包括双链19bp的转座酶(Tnp)结合位点和第一核酸序列以形成被称之为转座体的转座酶/转座子DNA复合物二聚体，所述第一核酸序列包括引物结合位点。第一核酸序列可以处于单链延伸的形式。根据一个方面，第一核酸序列可以是突出端，如5’突出端，其中该突出端包含引发位点。该突出端可以是适合包含所需引发位点的任何长度。转座体沿着双链基因组DNA结合靶位置并将双链基因组DNA切割成多个双链片段，各双链片段具有通过Tnp结合位点连接上链的第一复合物，以及通过Tnp结合位点连接下链的第二复合物。转座子结合位点以及因此的转座子DNA连接双链片段各5’末端。根据一个方面，将Tn5转座酶从复合物去除。沿着转座子DNA延伸双链片段以制造这样的双链延伸产物，其在双链延伸产物的各末端具有特异性引物结合位点。根据一个方面，可能由于Tn5转座酶结合位点与双链基因组DNA片段所导致的缺口可以被填平。缺口填平的双链延伸产物变性为单链，每个单链可进行单引物延伸以产生半甲基化dsDNA，然后用甲基转移酶例如DNMT1处理，从而在半甲基化dsDNA上加上甲基。重复变性、引物延伸和甲基化步骤数次，以产生具有原始甲基化状态的原始模板dsDNA的扩增子。然后用亚硫酸氢盐或APOBEC或其他将胞嘧啶转换成尿嘧啶的试剂处理，而不改变5-甲基胞嘧啶。然后经处理的扩增子DNA进行多轮随机引发扩增，例如使用Klenow片段外-或Bst大片段，然后用衔接子例如ilumina衔接子进行约13-18轮PCR反应。合适的扩增方案如Stephen J Clark,Sébastien A Smallwood,Heather J Lee,FelixKrueger,Wolf Reik&Gavin Kelsey.“单细胞中采用亚硫酸氢盐测序(scBS-seq)的DNA甲基化基因组范围解析图谱”(Genome-wide base-resolution mapping of DNA methylationin single cells using single-cell bisulfite sequencing(scBS-seq)).NatureProtocols(2017)所述，在此完整引入以供参考。还可使用来自ZYMO的Pico Methyl-SeqTM文库制备试剂盒。

根据某些方面，示例性的转座子***包含Tn5转座酶，Mu转座酶，Tn7转座酶或IS5转座酶等。其它可用的转座子***是本领域技术人员已知的，并且包括Tn3转座子***(参见Maekawa,T.,Yanagihara,K.,和Ohtsubo,E.(1996),Tn3转座的无细胞***和转座免疫(Acell-free system of Tn3 transposition and transposition immunity),Genes Cells1,1007-1016)、Tn7转座子***(参见Craig,N.L.(1991),Tn7：靶向位点特异性转座子(Tn7:a target site-specific transposon),Mol.Microbiol.5,2569-2573)、Tn10转座子***(参见Chalmers,R.,Sewitz,S.,Lipkow,K.,和Crellin,P.(2000),Tn10的完整核苷酸序列(Complete nucleotide sequence of Tn10),J.Bacteriol 182,2970-2972)、Piggybac转座子***(参见Li,X.,Burnight,E.R.,Cooney,A.L.,Malani,N.,Brady,T.,Sander,J.D.,Staber,J.,Wheelan,S.J.,Joung,J.K.,McCray,P.B.,Jr.,等.(2013),用于基因组工程的PiggyBac转座酶工具(PiggyBac transposase tools for genome engineering),Proc.Natl.Acad.Sci.USA 110,E2279-2287)、睡美人转座子***(参见Ivics,Z.,Hackett,P.B.,Plasterk,R.H.,和Izsvak,Z.(1997),来自鱼类的睡美人、Tcl样转座子的分子重建及其在人细胞中的转座(Molecular reconstruction of Sleeping Beauty,a Tc1-liketransposon from fish,and its transposition in human cells),Cell 91,501-510)、Tol2转座子***(参见Kawakami,K.(2007),Tol2：脊椎动物中多功能基因转移载体(Tol2:aversatile gene transfer vector in vertebrates),Genome Biol.8增刊.1,S7.)。

可从生物样品获得DNA。本文所用术语“生物样品”旨在包括但不限于从对象中分离的组织、细胞、生物液体和分离物，以及对象中存在的组织、细胞和液体。

DNA可以获得自单个细胞或小细胞群。DNA可以来自任何物种或生物，包括但不限于人、动物、植物、酵母、病毒、真核和原核DNA。在一个具体方面中，实施方式是关于在不丧失特异性位点的表现度且获得扩增的甲基化组的情况下扩增基本上整个基因组的方法(本文定义为“全基因组扩增”)。在特定实施方式中，全基因组扩增包括同时扩增基因组文库基本上所有片段或所有片段。在另一个特定实施方式中，“基本上整个”或“基本上所有”指基因组中所有序列的约80％、约85％、约90％、约95％、约97％、或约99％。

根据一个方面，DNA样品是基因组DNA，显微解剖的染色体DNA，酵母人工染色体(YAC)DNA，质粒DNA，粘粒DNA，噬菌体DNA，P1衍生的人工染色体(PAC)DNA或细菌人工染色体(BAC)DNA，线粒体DNA，叶绿体DNA、司法鉴定样品DNA或来自待测试的自然或人工来源的其他DNA。在另一优选实施方式中，DNA样品是哺乳动物DNA、植物DNA、酵母DNA、病毒DNA或原核生物DNA。在又一优选实施方案中，DNA样品获自人、牛、猪、羊、马、啮齿动物、禽、鱼、虾、植物、酵母、病毒或细菌。优选地，DNA样品是基因组DNA。

根据一些示范性方面，用转座***产生多重引物延伸和甲基化反应的核酸片段，以产生用于亚硫酸氢盐处理(例如在一个反应容器中的)的扩增甲基化组。根据图1所示的示范性实施方式，首先将单个细胞捕获至PCR管的裂解缓冲液中，以释放gDNA。然后对基因组DNA进行Tn5标签化，片段化成约1kb的dsDNA，在其两端具有互补的PCR引发位点。得到的dsDNA片段热变性成ssDNA，然后引物延伸形成半甲基化dsDNA。半甲基化的dsDNA与DNMT1和SAM孵育3小时，形成完全甲基化的dsDNA，从而复制原始模板的甲基化状态。完全甲基化的dsDNA再次热变性，重复复制循环。复制循环可重复1-20次，1-10次，或1-5次。用亚硫酸氢钠处理扩增产物，准备下游分析。

描述了特定的Tn5转座子***，并且是本领域技术人员可使用的。参见Goryshin,I.Y.和W.S.Reznikoff,Tn5体外转座(Tn5 in vitro transposition).The Journal ofbiological chemistry,1998.273(13):7367-74页；Davies,D.R.,等.,Tn5突触复合物转座中间体的三维结构(Three-dimensional structure of the Tn5 synaptic complextransposition intermediate).Science,2000.289(5476):77-85页；Goryshin,I.Y.,等.,通过电穿孔释放的Tn5转座复合物的***转座子突变(Insertional transposonmutagenesis by electroporation of released Tn5 transposition complexes).Nature biotechnology,2000.18(1):97-100等以及Steiniger-White,M.,I.Rayment,和W.S.Reznikoff,Tn5转座的结构/功能研究(Structure/function insights intoTn5transposition).Current opinion in structural biology,2004.14(1):50-7页，其各自通过引用出于所有目的将其全部内容纳入本文。利用Tn5转座***进行DNA文库制备和其它应用的试剂盒是已知的。参见Adey,A.,等.,通过高密度体外转座来快速、低输入、低偏倚构建鸟枪片段文库(Rapid,low-input,low-bias construction of shotgun fragmentlibraries by high-density in vitro transposition).Genome biology,2010.11(12):R119页；Marine,R.,等.,评估用于从纳克量的DNA快速生成鸟枪高通量测序文库的转座酶方案(Evaluation of a transposase protocol for rapid generation of shotgunhigh-throughput sequencing libraries from nanogram quantities of DNA).Appliedand environmental microbiology,2011.77(22):8071-9页；Parkinson,N.J.,等.,由微微克量的靶DNA制备高质量下一代测序文库(Preparation of high-quality next-generation sequencing libraries from picogram quantities of target DNA).Genome research,2012.22(1):125-33页；Adey,A.和J.Shendure,超低输入、基于标签作用的全基因组亚硫酸氢盐测序(Ultra-low-input,tagmentation-based whole-genomebisulfite sequencing).Genome research,2012.22(6):1139-43页；Picelli,S.,等.,使用Smart-seq2由单个细胞的全长RNA-seq(Full-length RNA-seq from single cellsusing Smart-seq2).Nature protocols,2014.9(1):171-81页，以及Buenrostro,J.D.,等.,天然染色质的转座用于开放染色质、DNA结合蛋白和核小***置的快速和敏感表观基因组概况(Transposition of native chromatin for fast and sensitive epigenomicprofiling of open chromatin,DNA-binding proteins and nucleosome position).Nature methods,2013，其各自通过引用出于所有目的将其全部内容纳入本文。同样参见WO 98/10077、EP 2527438和EP 2376517，其各自通过引用出于所有目的将其全部内容纳入本文。市售可得的转座试剂盒以NEXTERA的名称销售并可从Illumina公司获得。

本文所用术语“基因组”被定义为由个体、细胞或细胞器携带的总体基因(collective gene)集合。本文所用术语“基因组DNA”被定义为这样的DNA材料，其包含由个体、细胞或细胞器携带的部分或全部集体基因集合。本公开的方面包括使用无细胞DNA。

本文所用术语“核苷”是指具有与核糖或脱氧核糖共价连接的嘌呤或嘧啶碱基的分子。示例性的核苷包括腺苷、鸟苷、胞苷、尿苷和胸苷。其它示例性的核苷包括肌苷、1-甲基肌苷、假尿苷、5,6-二氢尿苷、核糖胸核苷、2N-甲基鸟苷和2,2N,N-二甲基鸟苷(也称为“稀有”核苷)。术语“核苷酸”是指具有一个或多个与糖部分以酯键连接的磷酸基团的核苷。示例性的核苷酸包括核苷单磷酸、二磷酸和三磷酸。术语“多核苷酸”、“寡核苷酸”和“核酸分子”在本文中可互换使用，并指通过5'和3'碳原子之间的磷酸二酯键连接在一起的任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)的聚合物。多核苷酸可以具有任何三维结构并且可以进行已知或未知的任何功能。以下是多核苷酸的非限制性例子：基因或基因片段(例如，探针、引物、EST或SAGE标签)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任意序列的分离DNA、任意序列的分离RNA、核酸探针和引物。多核苷酸可以包括修饰的核苷酸，如甲基化的核苷酸和核苷酸类似物。该术语也指双链和单链分子。除非另有说明或要求，本发明包含多核苷酸的任何实施方式都包括双链形式和已知或预测构成双链形式的两种互补单链形式中的每一种。多核苷酸由4种核苷酸碱基的特定序列组成：腺嘌呤(A)；胞嘧啶(C)；鸟嘌呤(G)；胸腺嘧啶(T)；并且当多核苷酸是RNA时，尿嘧啶(U)替代胸腺嘧啶(T)。因此，术语多核苷酸序列是多核苷酸分子的字母表示。可以将该字母表示输入具有中央处理单元的计算机中的数据库中，并用于生物信息学应用，如功能基因组学和同源性搜索。

术语“DNA”、“DNA分子”和“脱氧核糖核酸分子”指脱氧核糖核苷酸的聚合物。可以自然合成DNA(例如，通过DNA复制)。可以对RNA进行转录后修饰。也可以化学合成DNA。DNA可以是单链(即ssDNA)或多链(例如，双链，即dsDNA)。

术语“核苷酸类似物”、“改变的核苷酸”和“修饰的核苷酸”指非标准核苷酸，包括非天然存在的核糖核苷酸或脱氧核糖核苷酸。在某些示例性实施方式中，在任何位置修饰核苷酸类似物，从而改变核苷酸的某些化学性质，但仍保留核苷酸类似物行使其预期功能的能力。可被衍生化的核苷酸位置的示例包括5位，例如，5-(2-氨基)丙基尿苷、5-溴尿苷、5-丙炔尿苷，5-丙烯基尿苷等；6位，例如，6-(2-氨基)丙基尿苷：腺苷和/或鸟苷的8-位，例如，8-溴鸟苷，8-氯鸟苷，8-氟鸟苷等。核苷酸类似物还包括脱氮核苷酸，例如，7-脱氮腺苷；O-和N-修饰的(例如，烷基化的，例如，N6-甲基腺苷，或如本领域其他已知的)核苷酸；以及其他杂环修饰的核苷酸类似物，如Herdewijn,Antisense Nucleic Acid Drug Dev.,2000年8月，10(4):297-310中所述的那些。

核苷酸类似物还可以包括对于核苷酸糖部分的修饰。例如，2'OH-基团可被选自如下的基团取代：H、OR、R、F、Cl、Br、I、SH、SR、NH₂、NHR、NR₂、COOR、或OR，其中，R是取代的或未取代的C₁-C₆烷基、烯基、炔基、芳基等。其它可能的修饰包括在美国专利号5,858,988,和6,291,438中所述的那些。

也可对核苷酸的磷酸基团进行修饰，例如，通过用硫取代磷酸基团的一个或多个氧(例如，硫代磷酸酯)，或通过进行允许核苷酸发挥其预期功能的其他取代方式，如在例如Eckstein,Antisense Nucleic Acid Drug Dev.2000年4月，10(2):117-21、Rusckowski等.Antisense Nucleic Acid Drug Dev.2000年10月，10(5):333-45、Stein,AntisenseNucleic Acid Drug Dev.2001年10月，11(5):317-25、Vorobjev等.Antisense NucleicAcid Drug Dev.2001年4月，11(2):77-85和美国专利号5,684,143中所述。例如，某些上述修饰(例如，磷酸基团修饰)降低了包含所示类似物的多核苷酸的体内或体外水解速率。

术语“体外”具有其本技术领域公认的含义，例如，涉及纯化的试剂或提取物，例如，细胞提取物。术语“体内”还具有其本技术领域公认的含义，例如，涉及活细胞，例如，生物体中的永生化细胞、原代细胞、细胞系和/或细胞。

本文所用术语“互补”和“互补性”用于指通过碱基配对规则相关联的核苷酸序列。例如，序列5'-AGT-3'与序列5'-ACT-3'互补。互补性可以是部分的或完全的。部分互补性发生在当一个或多个核酸碱基根据碱基配对规则不匹配时。核酸间完全或完整互补性发生在每个核酸碱基各自在碱基配对规则下与另一个碱基匹配时。核酸链间的互补性程度对于核酸链间杂交的效率和强度有显著影响。

术语“杂交”是指互补核酸的配对。杂交和杂交的强度(即核酸之间关联的强度)受诸如如下因素的影响：核酸之间的互补性程度，涉及条件的严谨性，形成的杂交体的T_m和核酸内G：C比例。认为在其结构中包含互补核酸配对的单个分子是“自交的”。

术语“T_m”指核酸的解链温度。解链温度是双链核酸分子群体一半解离成单链的温度。计算核酸T_m的等式是本领域熟知的。如标准参考文献所示，当核酸处于1M NaCl水性溶液中时，通过T_m＝81.5+0.41(％G+C)等式可以简单估计T_m值(参见，例如，Anderson和Young,定量滤膜杂交(Quantitative Filter Hybridization),Nucleic Acid Hybridization(1985))。其他参考文献包括更复杂的计算，它们将结构以及序列特性考虑到T_m的计算中。

术语“严谨性”指进行核酸杂交的温度，离子强度和存在其他化合物(如有机溶剂)的条件。

当述及核酸杂交时，“低严谨性条件”包括等同于使用约500个核苷酸长度的探针时，在42℃的溶液中结合或杂交的如下条件，所述溶液由5x SSPE(43.8g/l NaCl、6.9g/lNaH₂PO₄(H₂O)和1.85g/l EDTA，用NaOH将pH调至7.4)、0.1％SDS、5x Denhardt试剂(50xDenhardt试剂，其每500ml含：5g Ficoll(400型,法玛西亚公司(Pharmacia))、5g BSA(组分V；西格玛公司(Sigma)))和100mg//ml变性的鲑鱼精DNA组成，然后在42℃包括5x SSPE、0.1％SDS的溶液中洗涤。

当述及核酸杂交时，所用的“中严谨性条件”包括等同于使用约500个核苷酸长度的探针时，在42℃的溶液中结合和杂交的如下条件，所述溶液由5x SSPE(43.8g/l NaCl、6.9g/l NaH₂PO₄(H₂O)和1.85g/l EDTA、用NaOH将pH调节至7.4)、0.5％SDS、5x Denhardt试剂和100mg/ml变性的鲑鱼精DNA组成，然后在42℃包括1.0x SSPE、1.0％SDS的溶液中洗涤。

当述及核酸杂交时，所用的“高严谨性条件”包括等同于使用约500个核苷酸长度的探针时，在42℃的溶液中结合和杂交的如下条件，所述溶液由5x SSPE(43.8g/l NaCl、6.9g/l NaH₂PO₄(H₂O)和1.85g/l EDTA、用NaOH将pH调节至7.4)、0.5％SDS、5x Denhardt试剂和100mg/ml变性的鲑鱼精DNA组成，然后在42℃包括0.1x SSPE、1.0％SDS的溶液中洗涤。

在某些示例性实施方式中，鉴定细胞，然后分离单个细胞或多个细胞。本公开范围内的细胞包括任何类型的细胞，对于其中DNA内容物的理解被本领域技术人员认为是有用的。根据本公开的细胞包括任何类型的癌细胞、肝细胞、***、胚胎、干细胞、iPS细胞、ES细胞、神经元、红细胞、黑素细胞、星形胶质细胞、生殖细胞、少突胶质细胞、肾细胞等。根据一个方面，本发明的方法使用来自单个细胞的细胞DNA进行。多个细胞包括约2至约1,000,000个细胞，约2至约10个细胞，约2至约100个细胞，约2至约1,000个细胞，约2至约10,000个细胞，约2至约100,000个细胞，约2个至约10个细胞或约2至约5个细胞。

通过本文所述方法处理的核酸可以是DNA，并且它们可以由任何有用的来源获得，例如人样品。在具体的实施方式中，双链DNA分子被进一步定义为包含基因组，例如从来自人的样品获得的基因组。样品可以是来自人的任何样品，如血液、血清、血浆、脑脊液、脸颊刮擦物、***抽吸物、活组织检查、***(可以称为***液)、尿液、粪便、毛囊、唾液、汗液、免疫沉淀或物理分离的染色质等。在具体的实施方式中，样品包括单个细胞。在具体的实施方式中，样品仅包括单个细胞。

用于本发明的核酸还可以包括天然或非天然碱基。就此而言，天然脱氧核糖核酸可以具有选自腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤的一个或多个碱基，并且核糖核酸可以具有选自尿嘧啶，腺嘌呤，胞嘧啶或鸟嘌呤的一个或多个碱基。可以包括在核酸中的示例性非天然碱基(不论具有天然骨架还是类似物结构)包括但不限于，肌苷，黄嘌呤(xathanine)，次黄嘌呤(hypoxathanine)，异胞嘧啶，异鸟嘌呤，5-甲基胞嘧啶，5-羟甲基胞嘧啶，2-氨基腺嘌呤，6-甲基腺嘌呤，6-甲基鸟嘌呤，2-丙基鸟嘌呤，2-丙基腺嘌呤，2-硫尿嘧啶(2-thioLiracil)，2-硫代胸腺嘧啶，2-硫代胞嘧啶，15-卤代尿嘧啶，15-卤代胞嘧啶，5-丙炔基尿嘧啶，5-丙炔基胞嘧啶，6-偶氮尿嘧啶，6-偶氮胞嘧啶，6-偶氮胸腺嘧啶，5-尿嘧啶，4-硫尿嘧啶，8-卤代腺嘌呤或鸟嘌呤，8-氨基腺嘌呤或鸟嘌呤，8-硫醇腺嘌呤或鸟嘌呤，8-硫代烷基腺嘌呤或鸟嘌呤，8-羟基腺嘌呤或鸟嘌呤，5-卤代尿嘧啶或胞嘧啶，7-甲基鸟嘌呤，7-甲基腺嘌呤，8-氮杂鸟嘌呤，8-氮杂腺嘌呤，7-脱氮鸟嘌呤，7-脱氮腺嘌呤，3-脱氮鸟嘌呤，3-脱氮腺嘌呤等。一个特定实施方式可以利用核酸中的异胞嘧啶和异鸟嘌呤以减少非特异性杂交，如美国专利号5,681,702中所概述。

在特定实施方式中，已用亚硫酸氢盐或APOBEC或其他将胞嘧啶转换成尿嘧啶的试剂处理并分析了甲基化的扩增甲基化组提供了诊断或预后信息。例如，已用亚硫酸氢盐或APOBEC或其他将胞嘧啶转换成尿嘧啶的试剂处理并分析了甲基化的扩增的甲基化组可提供基因组拷贝数和/或序列信息，基因组印迹信息，等位变化信息，癌症诊断，产前诊断，亲子信息，疾病诊断、检测、监测和/或治疗信息、序列信息等。

本文所用“单个细胞”指一个细胞。可用于本文所述方法中的单个细胞可获自感兴趣组织，或活组织检查，血液样本，或细胞培养物。此外，可以获得来自特定器官、组织、肿瘤、赘生物等的细胞并将其用于本文所述的方法中。此外，通常，来自任何群体的细胞都可以用于所述方法中，如原核或真核单细胞生物体的群体，包括细菌或酵母。使用本领域已知的标准方法，可以获得单个细胞悬浮液，包括例如使用胰蛋白酶或木瓜蛋白酶酶促消化蛋白质，所述蛋白质在组织样品中连接细胞，或在培养中释放贴壁细胞，或在样品中机械地分离细胞。可以将单细胞置于任何合适的反应容器中，在其中可以单独处理单个细胞。例如96孔板，从而将各单个细胞置于单个孔中。

用于操作单个细胞的方法是本领域已知的，并且包括荧光激活细胞分选术(FACS)、流式细胞术(Herzenberg.,PNAS USA 76:1453-55 1979)、显微操作以及使用半自动细胞选择器(picker)(例如，来自Stoelting有限公司的Quixell^TM细胞转移***)。例如，可以基于通过显微镜观察可检测的特征(如位置、形态或报告基因表达)单独选择个体细胞。此外，还可以使用梯度离心和流式细胞术的组合来增加分离或分选效率。

一旦鉴定到所需细胞，使用本领域技术人员已知的方法将细胞裂解以释放包括DNA的细胞内容物。细胞内容物被包含在容器或收集体积内。在本发明的一些方面，细胞内容物(如基因组DNA)可通过裂解细胞从细胞释放。例如，裂解可以通过这样实现，加热细胞，或通过使用洗涤剂或其它化学方法，或通过这些方法的组合。然而，可以使用本领域已知的任何合适的裂解方法。例如，在存在吐温20的情况下，于72℃加热细胞2分钟足以将细胞裂解。或者，可以将细胞于65℃水中加热10分钟(Esumi等.,Neurosci Res 60(4):439-51(2008))；或于70℃在补充有0.5％NP-40的PCR缓冲液II(应用生物***公司(AppliedBiosystems))中90秒(Kurimoto等.,Nucleic Acids Res 34(5):e42(2006))；或者，裂解可以使用蛋白酶，如蛋白酶K，或通过使用离液盐，如异硫氰酸胍实现(美国公布号2007/0281313)。根据本文所述方法扩增基因组DNA可以直接在细胞裂解物上进行，从而使得可以将反应混合物添加到细胞裂解物。或者，可以使用本领域技术人员已知的方法将细胞裂解物分成两个或更多个体积，如分到两个或更多个容器、管或区域，其中各体积容器、管或区域包含细胞裂解物的一部分。然后，通过本文所述方法或本领域技术人员已知的方法，可以扩增包含在各容器、管或区域中的基因组DNA。

本文所用术语“引物”通常包括这样的天然或合成的寡核苷酸，其与多核苷酸模板形成双链体时能够用作核酸合成的起点(如测序引物)并从其3’末端沿模板延伸以形成延伸的双链体。在延伸过程中添加的核苷酸序列由模板多核苷酸的序列决定。通常，引物通过DNA聚合酶延伸。引物通常具有这样范围内的长度：3-36个核苷酸、5-24个核苷酸或14-36个核苷酸。本发明范围内的引物还包括正交引物、扩增引物、构建引物等。成对的引物可以侧接于感兴趣的序列或一组感兴趣的序列。引物和探针可以按顺序简并或准简并(quasi-degenerate)。本发明范围内的引物结合于靶序列邻近处。“引物”可以被认为是短多核苷酸，通常具有游离的3'-OH基团，其通过与靶标杂交结合潜在地存在于感兴趣样品中的模板或靶标，并在此后促进与该靶标互补的多核苷酸的聚合。本发明的引物由核苷酸组成，其范围在17-30个核苷酸。在一个方面，引物是至少17个核苷酸、又或者至少18个核苷酸、又或者至少19个核苷酸、又或者至少20个核苷酸、又或者至少21个核苷酸、又或者至少22个核苷酸、又或者至少23个核苷酸、又或者至少24个核苷酸、又或者至少25个核苷酸、又或者至少26个核苷酸、又或者至少27个核苷酸、又或者至少28个核苷酸、又或者至少29个核苷酸、又或者至少30个核苷酸、又或者至少50个核苷酸、又或者至少75个核苷酸又或者至少100个核苷酸。

引物包括那些对于所选目标基因座(例如与疾病如癌症相关的DNA)特异性的引物，可叫做目标基因座特异性引物，疾病特异性引物或癌症特异性引物。使用这样的目标基因组特异性引物或疾病特异性引物或癌症特异性引物能扩增目标基因座，例如疾病特异性DNA或癌症特异性DNA，从而鉴定出疾病特异性DNA或癌症特异性DNA，从而能诊断患有这些疾病或癌症的个体。

“扩增”或“进行扩增”这样的表达指通过其将形成特定多核苷酸的额外或多个拷贝的过程。

经亚硫酸氢盐或APOBEC或其他将胞嘧啶转换成尿嘧啶的试剂处理的扩增的甲基化组可用本领域技术人员已知的方法扩增、测序和分析。使用本领域已知的多种测序方法可以确定感兴趣的核酸序列的序列，所述方法包括但不限于通过杂交测序(SBH)，通过连接测序(SBL)(Shendure等.(2005)Science 309:1728)，定量增量荧光核苷酸加法测序(QIFNAS)，逐步连接和切割，荧光共振能量转移(FRET)，分子信标，TaqMan报告探针消化，焦磷酸测序，荧光原位测序(FISSEQ)，FISSEQ珠(美国专利号7,425,431)，摇摆测序(PCT/US05/27695)，多重测序(美国系列号12/027,039，提交于2008年2月6日；Porreca等(2007)Nat.Methods 4:931)，聚合集落(POLONY)测序(美国专利号6,432,360、6,485,944和6,511,803，以及PCT/US05/06425)；纳米网格滚环测序(ROLONY)(美国系列号12/120，541，2008年5月4日提交)、等位基因特异性寡聚体连接试验(例如，寡聚体连接试验(OLA)，使用连接的线性探针和滚环扩增(RCA)读出的单模板分子OLA，连接的锁式探针，和/或使用连接的环状锁式探针和滚环扩增(RCA)读出的单模板分子OLA)等。也可以利用高通量测序方法，例如，使用诸如Roche 454、Illumina Solexa、AB-SOLiD、Helicos、Polonator平台等的平台。本领域已知各种基于光的测序技术(Landegren等.(1998)Genome Res.8:769-76；Kwok(2000)Pharmacogenomics 1:95-100；以及Shi(2001)Clin.Chem.47:164-172)。

其他测序方法包括高通量筛选法，例如应用生物***公司的SOLiD测序技术或Illumina的基因组分析仪。在本发明的一个方面，可以对DNA进行鸟枪法测序。读数的数量可以是至少10,000、至少100万、至少1000万、至少1亿或至少10亿。在另一个方面，读数的数量可以是10,000-100,000，或者100,000-100万，或者100万-1000万，或者1000万-1亿、或者1亿到10亿。“读数(read)”是通过测序反应获得的连续核酸序列的长度。

“鸟枪法测序”是指用于非常大量DNA(如整个基因组)测序的方法。在该方法中，首先将待测序的DNA切碎成较小的片段，可以对其进行单独测序。然后根据这些片段的重叠序列将这些片段的序列重组为它们的原始顺序，从而产生完整的序列。可以使用多种不同的技术来完成DNA的“切碎”，包括限制酶消化或机械剪切。重叠序列通常由适当编程的计算机对齐。鸟枪法测序cDNA文库的方法和程序在本领域中是公知的。

本文所述的方法在预测医学领域是有用的，其中将诊断试验、预后试验、药物基因组学和监测临床试验用于预后(预测)目的，从而预防性地治疗个体。相应地，本发明的一个方面涉及诊断试验，其用于确定基因组DNA以便确定个体是否处于患病症和/或疾病的风险中。这样的试验可用于预后或预测目的，从而因此在病症和/或疾病发作之前预防性治疗个体。相应地，在某些示例性实施方式中，提供了使用本文所述一种或多种表达谱方法来诊断和/或预测一种或多种疾病和/或病症的方法。

在某些示例性实施方式中，提供了包含本文所述的一种或多种基因组DNA序列的电子设备可读介质。本文所用“电子设备可读介质”指用于存储、携带或保持可由电子设备直接读取和访问的数据或信息的任何合适的介质。这样的介质可以包括但不限于磁存储介质、如软盘，硬盘存储介质和磁带；光存储介质，如光盘；电子存储介质，如RAM，ROM，EPROM，EEPROM等；普通硬盘和这些类别的混合物，如磁/光存储介质。介质适用于或被配制成用于以使其上记录有本文描述的一个或多个表达谱。

本文所用术语“电子设备”旨在包括被配置成或适用于存储数据或信息的任何合适的计算或处理设备或其他设备。适合用于本发明的电子设备的示例包括独立计算设备；网络，包括局域网(LAN)、广域网(WAN)互联网、内联网和外联网；电子设备，如个人数字助理(PDA)、蜂窝电话、寻呼机等；和本地和分布式处理***。

本文所用“记录的”指用于在电子设备可读介质上存储或编码信息的处理。本领域技术人员可以容易地采用任何目前已知用于在已知介质上记录信息的方法来生成包含本文描述的一个或多个表达谱的制品。

可使用各种软件程序和格式来将本发明的基因组DNA信息存储在电子设备可读介质上。例如，核酸序列可以用文字处理文本文件来表示，以如WordPerfect和微软Word等市售可得软件对其进行格式化，或以ASCII文件的形式表示，存储在数据库应用程序，诸如DB2、Sybase、Oracle等，以及以其他形式。可使用任何数量的数据处理器结构格式(例如，文本文件或数据库)，从而获得或创建其上记录有本文所述一个或多个表达谱的介质。

应理解的是，已描述的本发明的实施方式仅用于说明本发明的一些应用和原理。基于本文的教导，本领域技术人员可进行多种修改而不偏离本发明的真正精神与范围。贯穿本发明中所引用的所有参考文献、专利和公开专利申请的内容通过引用全文纳入本文并用于所有目的。

以下实施例是本发明的代表。这些实施例并不构成对本发明范围的限制，因为这些和其他等价实施方式将对于本发明、附图和所附权利要求而言是显而易见的。

实施例I

方案

下述一般方案能够用于单细胞全甲基化组扩增。可用口吸管(mouth pipetting)、激光解剖、微流体装置、流式细胞计等分离单个细胞。

一般在裂解缓冲液中裂解单个细胞。在细胞裂解液中加入具有引物结合位点序列的转座体和转座缓冲液。转座后添加蛋白酶以去除与单细胞基因组DNA结合的转座酶。将Deepvent外切DNA(exo-DNA)聚合酶、dNTP、PCR反应缓冲液和引物添加到反应混合物，以填充转座子***产生的缺口。缺口修复后，使DNA片段变性。由此得到的具有互补末端的ssDNA将形成茎环结构。为了扩增茎环结构，进行具有递减退火温度的单引物PCR反应。得到的延伸产物然后与甲基化试剂例如DNMT1孵育。孵育后，根据需要多少轮甲基化复制，可进行多次DeepVent PCR反应和DNMT1孵育。可用Zymo EZ-Direct亚硫酸氢盐试剂盒直接用亚硫酸氢盐转换剂处理产物。

下述提供了更具体的方案，其用于单细胞全甲基化组扩增。

单细胞裂解

用FACs或口洗管将单个细胞分拣入2.5ul裂解缓冲液内。裂解缓冲液含有:1.825ul H₂O,0.05ul 1M TE缓冲液pH 8.0,0.05ul 1M KCL,0.375ul 0.1M DTT,0.075ul10％Triton X-100,0.125 20mg/ml蛋白酶Q(Qiagen)。裂解反应在以下热循环中发生:50℃20分钟,75℃ 20分钟,80℃ 5分钟。裂解后，从单细胞中释放dsDNA。

Tn5标签化

如下制备Tn5转座子复合物用于标签化。将1ul纯化的5μM Tn5蛋白质与1μl 5μMTn5 dsDNA混合。25℃保温45分钟。将98μl Tn5稀释缓冲液加到2μl转座子混合物中，实现0.05μM Tn5复合物。Tn5稀释缓冲液包括10μl 1M TE缓冲液pH 8.0,4ul 0.5M NaCl,和84ulH₂O。Tn5 dsDNA包括上链5’-CAT TAC GAG CGA GAT GTG TAT AAG AGA CAG-3’和下链5’-Phos-CTG TCT CTT ATA CAC ATC invdT-3’。在2.5μl细胞裂解液中加入1.5μl 0.05μM Tn5转座子复合物，1μl 5x Tn5***缓冲液。Tn5***缓冲液的1x缓冲条件包括10mM Tris-Hcl,5mM MgCl₂，pH7.8，于25℃。50℃孵育5μl反应物10分钟。在反应物中加入1ul 1mg/μl蛋白酶Q(Qiagen)，在如下热循环中孵育：50℃20分钟，70℃30分钟。得到的dsDNA应该长500-1000bp，在两个末端有30bp的DNA引发位点，在3’末端有9bp的缺口。

缺口修复和第一轮PCR反应

为了填充该9bp缺口，用具有链置换活性的Deep vent外切聚合酶修复缺口。缺口修复后，使DNA片段热变性。由此得到的具有互补末端的ssDNA形成茎环结构。为了扩增茎环结构，进行具有递减退火温度的单引物PCR反应。在6ul反应物中，加入1ul 10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVent exo^-,0.2ul 1uM30bp ssDNA引物，该引物具有序列5’-CAT TAC GAG CGA GAT GTG TAT AAG AGA CAG-3’,0.2ul 100mM MgSO₄,和2.3ul H₂O。1xPCR缓冲条件包括20mM Tris-HCL,10mM KCL,0.1％Trition X-100,pH 7.8，25℃。对10μl反应物进行以下热循环：72℃ 10分钟，95℃ 3分钟,68℃ 60秒，67℃ 60秒,66℃ 60秒,65℃60秒,64℃ 60秒,63℃ 60秒,62℃ 60秒,61℃ 60秒,60℃ 60秒,59℃ 60秒,58℃ 60秒,和72℃ 3分钟。得到半甲基化dsDNA片段。

第一轮DNMT1甲基转移反应

然后将得到的延伸产物与DNMT一起孵育。加入DETA以螯合Mg²⁺。在10ul反应物中加入1.5ul的10x甲基转移(MT)缓冲液,0.15ul 160uM SAM,0.15ul100ug/ml BSA,0.3ul200mM EDTA,2ul 2U/ul DNMT1,0.9ul H₂0。MERLOT MT缓冲液的1x缓冲条件包括20mMTris-HCL,1mM DTT,5％甘油,pH 7.8，25℃。将15ul反应物在37℃孵育3小时。由此得到甲基化dsDNA片段和完整的一轮扩增，即单引物延伸和甲基化。

按需多轮扩增和甲基化

可按需再进行1-20，1-10，或1-5轮扩增和甲基化。热循环与第一轮扩增和甲基化相同。对于第2、第3、第4、第5……轮扩增和甲基化循环分别加入以下试剂。

第二轮扩增，PCR

在15ul反应物中加入1ul的10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVentexo^-,0.2ul 1uM 30bp ssDNA引物,0.55ul 100mM MgSO₄和2.95ul H₂O。

第二轮DNMT1甲基转移反应

在20ul反应物中加入1ul的10x甲基转移(MT)缓冲液,0.25ul 160uM SAM,0.1ul100ug/ml BSA,0.325ul 100mM EDTA,2ul 2U/ul DNMT1,0.15μl 100mM DTT和1.175ulH₂0。

第三轮扩增，PCR

在25ul反应物中加入1ul的10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVentexo^-,0.2ul 1uM 30bp ssDNA引物,0.85ul 100mM MgSO₄和2.65ul H₂O。

第三轮DNMT1甲基转移反应

在30ul反应物中加入1ul的10x MERLOT甲基转移(MT)缓冲液,0.35ul160uM SAM,0.1ul 100ug/ml BSA,0.475ul 200mM EDTA,2ul 2U/ul DNMT1,0.25ul100mM DTT和0.825ul H₂0。

第四轮PCR

在35ul反应物中加入1ul的10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVentexo^-,0.2ul 1uM 30bp ssDNA引物,1.15ul 100mM MgSO₄和2.35ul H₂O。

第四轮DNMT1甲基转移反应

在40ul反应物中加入1ul的10x甲基转移(MT)缓冲液,0.45ul 160uM SAM,0.1ul100ug/ml BSA,0.625ul 200mM EDTA,2ul 2U/ul DNMT1,0.35μl 100mM DTT和0.475ulH₂0。

第五轮PCR

在45ul反应物中加入1ul的10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVentexo^-,0.2ul 1uM 30bp ssDNA引物,1.45ul 100mM MgSO₄和2.05ul H₂O。

第五轮DNMT1甲基转移反应

在50ul反应物中加入1ul的10x甲基转移(MT)缓冲液,0.55ul 160uM SAM,0.1ul100ug/ml BSA,0.775ul 100mM EDTA,2ul 2U/ul DNMT1,0.45μl 100mM DTT和0.125ulH₂0。

可直接用Zymo EZ-direct亚硫酸氢盐试剂盒等商用试剂盒，以亚硫酸氢钠处理完全甲基化的扩增dsDNA。亚硫酸氢盐转换的DNA可用于下游分析例如全基因组亚硫酸氢盐测序。

实施例II

试剂盒

公开的方法所需的材料和试剂可在试剂盒中组装在一起。本公开的用于单细胞全基因组甲基化组测序的试剂盒通常将至少包括进行所要求保护的方法所需的转座体(由转座酶和转座子DNA组成)、核苷酸和DNA聚合酶、与所需引物组。试剂盒还包括DNMT1和任何所需的缓冲液，包括那些如本文所述含有阳离子的缓冲液。试剂盒还可包含在甲基化步骤中螯合这些阳离子的螯合剂，还可包含当进行引物衍生时补充反应介质的阳离子。试剂盒还含有从DNA样品建立扩增的甲基化组的指令。本公开的用于早期癌症诊断的试剂盒通常可至少包括进行所述方法必需的选定引物组、核苷酸和DNA聚合物。试剂盒还可包括DNMT1和任何所需的缓冲液。试剂盒还可包含从无细胞DNA样品扩增目标DNA区域的指令。在各种情况中，试剂盒将优选具有对各种单独试剂、酶或反应物不同的容器。通常，将各物质在其各自的容器中适当分装。试剂盒的容器装置通常包括至少一个小瓶或试管。也可以是能够将试剂放置并分装于其中的细颈瓶、瓶子和其他容器装置。试剂盒的单个容器将优选保持密闭状态以用于商业销售。合适的较大容器可包括注塑或吹塑的塑料容器，其中保留所需小管。优选说明书与试剂盒一起提供。

实施例III

甲基转移效率

为了确定本文所述方法的甲基转移效率，首先对10pg完全甲基化的Hela gDNA和对10pg完全甲基化的Hela gDNA进行本文所述的单引物延伸和DNMT1孵育一轮所扩增的DNA进行亚硫酸氢盐测序(Miseq v2化学试剂盒,2x150bp对末端读数,总共1,000,000个读数)。在所有独特对应于人类基因组的读数中，完全甲基化的Hela gDNA中CpG中98.7％的胞嘧啶甲基化，而本文所述对10pg完全甲基化的Hela gDNA进行一轮单引物延伸和DNMT1孵育得到的扩增DNA中CpG中有93.60％的胞嘧啶甲基化。见图2。这表明DNMT1孵育中甲基转移效率为95.1％。见图3。

还显示DNMT1有从头甲基化活性。为了推断本文所述方法的从头甲基化率，对单个SM480细胞gDNA的10pg PCR产物和单个SM480细胞gDNA的10pg PCR产物经过1轮本文所述的单引物延伸和DNMT1孵育得到的扩增DNA进行亚硫酸氢盐测序(Miseq v2化学试剂盒,2x150bp对末端读数,总共1,000,000个读数)。见图2。结果显示有可容许的1.7％的从头甲基化率。见图3。

对于单细胞全甲基化组测序而不在亚硫酸氢盐转换前进行如本文所述的甲基化组的预扩增，可直接用亚硫酸氢钠处理单个细胞，然后进行亚硫酸氢盐后扩增和测序。对此，甲基化物覆盖率很低，因为在亚硫酸氢盐转换中DNA损失。小鼠甲基化组的代表性覆盖率为约20％。见Smallwood,S.A.,等(2014).“用于评估表观遗传异质性的单细胞基因组范围的亚硫酸氢盐测序”("Single-cell genome-wide bisulfite sequencing forassessing epigenetic heterogeneity.")Nat Methods 11(8):817-820，在此完整引入以供参考。得到了减少的代表形式，平均甲基化组覆盖率为4％。见Guo,H.,等(2013).“采用减少表现亚硫酸氢盐测序分析小鼠胚胎干细胞的单个细胞以及早期胚胎的甲基化组情况”("Single-cell methylome landscapes of mouse embryonic stem cells and earlyembryos analyzed using reduced representation bisulfite sequencing.")GenomeRes 23(12):2126-2135在此完整引入以供参考。在该低覆盖率下，需要大量细胞用于分析，以实现足够的统计学置信度(因为对于20％的覆盖率，需要对约15个细胞进行测序以再现≥3次的特定CpG位点的甲基化状态)，从而能有效克服细胞群体或对于稀有样品如人胚胎分析时的甲基化异质性。本文所述的包括单引物延伸和与甲基添加剂孵育的方法改善了甲基化组覆盖率达3-4倍，其大大改善了分析稀有样品和细胞之间的异质性的能力。

根据一个针对癌症诊断的实施方式，肿瘤释放的无细胞DNA的量相对于血浆DNA极其少。为了从大背景(血浆DNA)中回收无细胞肿瘤DNA的甲基化信息，现有的方法需要高度灵敏的甲基化检测法，例如甲基化特异性的qPCR，其依赖于中晚期癌症，其中肿瘤的无细胞DNA量比起癌症早期要显著高得多。因此，这样的方法灵敏度低，即对于早期癌症诊断仅50％左右。除了优化甲基化检测方法，本发明的方法扩增无细胞DNA而用甲基化试剂和一组选定的靶向差异甲基化基因的引物保留其甲基化状态。扩增且同时维持甲基化信息或状态提供了检测方法更早期的材料和提高的灵敏度。

根据一个方面，甲基转移效率和从头甲基化率被用于以最大效率产生扩增的甲基化组。甲基转移效率指半甲基化CpG在用甲基化试剂例如DNMT1孵育后完全甲基化的百分数。从头甲基化率指未甲基化的CpG在孵育后完全甲基化的百分数。

100％甲基转移效率指模板的原始半甲基化CpG位点的甲基化状态被完美复制。95％甲基转移效率指1轮DNMT1孵育中，5％的甲基化状态随机丢失，产生5％的甲基化状态分析假阴性率。对于3轮扩增，即3轮单引物延伸和甲基化试剂的孵育，假阴性率指数式增加，如1-0.95³＝14.3％。虽然当计算特定基因的甲基化时，考虑多个CpG位点的甲基化状态从而减少假阴性率，甲基转移率优选至少为95％。

0％的从头甲基化率指在原始模板的未甲基化的CpG位点上没有加上甲基。2％的从头甲基化率指1轮DNMT1孵育中，2％没有甲基化的CpG位点随机甲基化，引入2％的甲基化状态分析假阳性率。对于3轮扩增，即3轮单引物延伸和甲基化试剂的孵育，假阳性率线性增加，如3x 0.02＝6％。虽然当计算特定基因的甲基化时，考虑多个CpG位点的甲基化状态从而减少假阳性率，从头甲基化优选不高于2％。

实施例IV

基于甲基化分析的诊断方法

本发明的方面基于病况例如癌症的诊断或预后。根据一个方面，从个体获得包括无细胞DNA的血样。根据本文所述的方法处理无细胞DNA并进行分析，通过鉴定对应于癌细胞DNA的甲基化模式分析确定癌细胞DNA的存在。通过扩增靶向的差异甲基化基因座的甲基化状态，提高了捕获低丰度无细胞肿瘤DNA的灵敏度。该方法包括：(a)片段化获自个体血样的双链DNA，其中双链DNA序列具有一种甲基化模式，以产生片段模板双链DNA序列，其具有甲基化模式且在每个片段模板双链DNA序列的5’末端具有引物结合位点,(b)将片段模板双链DNA序列分成上模板链和下模板链,(c)用引物、聚合酶和核苷酸延伸上模板链和下模板链，产生未甲基化的互补链，得到半甲基化的双链DNA序列，其对应于具有甲基化模式的片段模板双链DNA序列,(d)处理半甲基化双链DNA序列以在对应于相应片段模板双链DNA序列的甲基化胞嘧啶的位置加上甲基，以产生完全甲基化的片段模板双链DNA序列；重复步骤(b)到(d)1-5次，产生片段模板双链DNA序列的完全甲基化扩增子；用试剂处理片段模板双链DNA序列的完全甲基化扩增子，将胞嘧啶残基转换成尿嘧啶；确定甲基化胞嘧啶模式；将甲基化胞嘧啶模式与癌症DNA的标准甲基化胞嘧啶模式比较；和当确定的甲基化胞嘧啶模式与癌症DNA的标准甲基化胞嘧啶模式匹配时，诊断该个体患有癌症。

根据一个方面，本文所述的方法包括(a)从病人个体的液体活检样品中提取可能含有无细胞肿瘤DNA的无细胞DNA或基因组DNA，其中无细胞肿瘤DNA序列与正常体细胞具有不同的甲基化模式；(b)将双链DNA序列分成上模板链和下模板链；(c)用聚合酶、核苷酸和选定的靶向差异甲基化基因座的引物组延伸上和下模板链，产生未甲基化的互补链，得到选定的差异甲基化基因座的半甲基化双链DNA序列；(d)加入EDTA以等摩尔螯合镁离子，产生无镁的缓冲条件；(e)用甲基转移酶处理半甲基化双链DNA序列，在对应于相应的双链DNA序列的甲基化胞嘧啶的位置加入甲基，以产生选定差异甲基化基因组的全甲基化双链DNA序列；(f)如此处理后，加入理想浓度的镁离子进行随后的引物延伸反应，例如如所需使用PCR条件；和(g)重复步骤产生选定的差异甲基化基因座的完全甲基化扩增子。然后，可用将胞嘧啶残基转换成尿嘧啶的试剂处理完全甲基化的扩增子，而保持甲基化胞嘧啶残基不变。可测定甲基化胞嘧啶模式。将无细胞DNA的甲基化胞嘧啶模式与不同癌症组织的甲基化胞嘧啶模式比较，测定在样品中是否存在无细胞肿瘤DNA。当测定的甲基化胞嘧啶模式中含有某类癌症的标准甲基化胞嘧啶模式时，可诊断该个体患有某类癌症。

根据一个方面，从血样提取血浆DNA。用靶向癌症差异甲基化基因的目标基因座的一组选定的生物素结合PCR引物进行一轮PCR引物延伸，与甲基化试剂孵育，产生目标基因座的半甲基化扩增子。可在甲基转移反应中使用DNMT1，以建立靶向基因座的甲基化扩增子。如所需，可重复引物延伸和孵育步骤产生所选目标基因座的扩增甲基化组。如所需，可重复引物延伸和孵育步骤1-20次或以上，产生所选目标基因座的扩增甲基化组。用例如结合于底物的亲和素结合伴侣分离或“沉降(pulled down)”生物素标记的扩增子。用亚硫酸氢钠处理分离的扩增子。用同一组PCR引物的亚硫酸氢盐转换形式扩增亚硫酸氢盐转换的扩增子。相同PCR引物不能扩增用亚硫酸氢盐处理的扩增子，因为所有未修饰的胞嘧啶都被转换成尿嘧啶，因此必须稍加改变引物以匹配C-U转换。该步骤后进行文库制备和测序。或者，该步骤后随甲基化特异性qPCR，以探测亚硫酸氢盐处理的扩增子的甲基化状态，在一个实施方式中一次一个基因。示范性基因是癌症基因，例如SEPT9。合适的甲基化特异性qPCR如下所述：Jorja D Warren等.“胞裂蛋白甲基化DNA是结直肠癌敏感的特异性血液测试”(Septin 9methylated DNA is a sensitive and specific blood test for colorectalcancer.)BMC Medicine 2011,9:133，在此完整引入以供参考。根据一个方面，如本文所述维持甲基化状态的扩增以产生扩增的甲基化组将灵敏度提高到超越已知的qPCR技术，以直接探测无细胞DNA的癌症基因的甲基化状态，例如采用EpiProColon进行。

更具体的，扩增和甲基化方法可用于无细胞肿瘤DNA的甲基化分析，如图4示意描述。如下进行血浆的无细胞DNA提取。将10ml血液收集在EDTA(乙二胺四乙酸)真空采血管中。每管在1350×g±150×g室温下离心12分钟。不搅动血沉棕黄层，将血浆转移到清洁的15ml锥形管中。第二次在1350×g±150×g下离心12分钟。不搅动沉淀将血浆转移到4ml管中。从4ml血浆用QIAmp循环核酸试剂盒(QIAGEN)提取无细胞DNA，在50ul洗脱缓冲液中洗脱。还可用Quick-cfDNATM血清和血浆试剂盒(ZYMO),Chamagic cfDNA 5k试剂盒(Chemagen),NucleoSpin血浆XS(TaKaRa)等进行无细胞DNA的提取。进一步用DNA浓缩和清洁试剂盒(ZYMO)浓缩50ul洗脱的DNA，并在6ul洗脱缓冲液中洗脱至PCR管中。

用针对差异甲基化的基因座的一组PCR引物对提取的无细胞DNA进行引物延伸和甲基化得到扩增的甲基化组。差异甲基化基因是在一个癌症细胞中与正常体细胞相比具有不同甲基化状态的基因，其根据标准癌症甲基化数据选择。差异甲基化基因包括但不限于：SEPT9；TMEM106A；NCS1；UXS1；HORMAD2；REC8；DOCK8；CDKL5；SNRPN；SNURF；ABCC6；CA10；DBC2；HEPACAM；KRT13；MYO3A；NKX6-2；PMF1；POU4F2；SYNPO2/肌足蛋白；ZNF154；3OST3B；ACADL；ATOH1/hATH；BECN1；C14；CBFA2T3；COL7A1；CREBBP；CXCL1；EDN3；ETS1；FAM110A/c20；FAM19A4/FLJ25161；FAT4；FGFR4；FOXC1；FOXF1；GHSR；GJB2/CX26；GPR180/ITR；HDAC1；HSD17B1；HSD17B2；HSD17B4；IPF1；ISL1；ITIH5；LEBREL1/P3H2；LEBREL2/P3H3；LRRC49；MGA；miR-124；miR-196a-2；miR-335；ADAMTS5；MYBL2；NFIX；NRN1；OGG1；PCDHGB6；PPP2R2B；PRDM12；PTRF；RNF20；ST18；STK36；STMN1；SULT1A1；SYNM；THAP10；TOX；TSC1；UAP1L1；UGT3A1；ZBTB8A；ZNF432；ADAMTS12；ADHFE1；BARX1；BEND4；CASR；CD109；CDX1；CNR1/CB(1)受体；CNRIP1；CNTFR；DEXI；DUSP26；EDIL3；ELMO1；EXTL3；EYA2；FLT1；GJC1；GLP1R；GPR101；GRIN2/NMDAR2A；GSPT2；HOMER2；INA；KCNK12；LAMA1；LRP2/Megalin；KISS1；MBD4/MED1；MCC；miR-342；miR-345；NDRG4；NGFR；NR3C1/GR；PIK3CG；PPARG；PTGIS；PTPRR；QKI；RGMA；SEPT9；SPG20；STARD8；STOX2；TBX5；THBS4/TSP4；TMEM8B/NGX6；VSX2/HOX10；ANGTL2；AXIN1；CCBE1；CTGF/IGFBP8；DNAJC15；FBXO32；FILIP1L；FZD4；GPR150；GUCY2C；HOXB5；ITGA8；LRP5；miR-130b；NFATX；PTPRN；RUNX1T1；TERC/hTR；TES；TMCO5；IFFO1；ALK；CHGA；CSMD2；DES；DUSP6；ELOVL4；FANCG；FGF2；FGF3；FGF5；FGF8；FGFR1；FLT3；FLT4；GAS1；GEMIN2/SIP1；HIC2；HSD17B12；IGFBP5；ITPR2；LMO1/RBTN1；I-mfa；miR-132；NEFL；NKX2-8；NTRK3/TRKC；NTSR1；PRG2；PTCH2；SLC32A1；TRH；TUBB3；ZNF415；CLSTN1；HIST1H4K；HIST2H2BF；INHA/抑制素α；KCNMA1；NKX3.1；NPBWR1/GPR7；NSMCE1/NSE1；PXMP4/PMP24；RGS2；S100A6；SLC18A2；SPRY4；SVIL；TFAP2E；TGFB2；ZNF132；NFATC；CST6；MDFI；ADAM23；ALDH1A3；APC；BNC1；BRCA1；CADM1/TSLC1/IGSF4；CASB；CAV1；CCNA1；CCND2；CD2/SRBC；CD44；CDH1/E-钙粘蛋白；CDH13/H-钙粘蛋白；CDKN1C/KIP2/p57；CDKN2A/ARF/p14；CDKN2B/INK4B/p15；CHFR；CIDEA；CLSTN1；COL1A2；CYP1A1；DAB2IP；DAPK1；DBC1；DIRAS(3)/ARHI；DKK3；DLC1；DLEC1；DPYS；EOMES；EPHA5；ESR1/ER-α；ESR2/ER-β；FHIT；FHL1；GAS7；GATA5；GSTP1；HIC1；HIST1H4K；HIST2H2Bf；HOXA11；HOXA9；HS3ST2/30ST2；ID4；IGF2；IGFBP3；KCNMA1；LAMA3；LAMC2；MAL；MARVELD1；MDFI；MGMT；MINT1/APBA1；MINT2/APBA2；MINT31；miR-34a；miR-34b；miR-34c；miR-9-1；MLH1；MMP2；MSH2；MSX1；MYOD1/MYF-3；NID2；NKX3-1；NPBWR1；NSMCE1/NSE1；OPCML；p14；PCDH17；PDLIM4/RIL；PENK；PGR；PITX2；PLAU/uPA；PRDM2/RIZ1；PTEN/MMAC1；PTGS2/COX2；PXMP4/PMP24；PYCARD/ASC/TMS1；RARB；RARB2；RARRES1/TIG1；RASSF1；RASSF1A；RASSF2；RB1；RBP1/CRBP1；RGS2；RPIA；RPRM/Reprimo；RUNX3；S100A6；SCGB3A1/HIN1；SERPINB5/丝抑蛋白；SFN/14-3-3σ；SFRP1/SARP2；SFRP2；SFRP4；SFRP5；SLC18A2；SLC5A8；SLIT2；SOCS1；SOX11；SOX17；SPARC；SPOCK2；SPRY4；STK11/LKB1；SVIL；SYK；TCF21；TERT；TFAP2E；TFPI2；TGFB2；THBS1；TIMP3；TMEFF2/HPP1/TPEF；TNFRSF10C/DcR1；TNFRSF10D/DcR2；TNFRSF25/DR3；TWIST1；UCHL1/PGP9.5；VIM；WIF1；WWOX；XAF1；ZNF132。

根据一个示范性实施方式，引物混合物是21对生物素修饰的引物的等量混合物，每一对引物靶向单个差异甲基化基因，包括SEPT9；TMEM106A；NCS1；UXS1；HORMAD2；REC8；DOCK8；CDKL5；SNRPN；SNURF；ABCC6；CA10；DBC2；HEPACAM；KRT13；MYO3A；NKX6-2；PMF1；POU4F2；SYNPO2/肌足蛋白；和CDH1/E-钙粘蛋白。选择该组合是因为21种靶向基因的甲基化状态的不同组合覆盖了6类常见癌症的诊断，包括：brca:乳腺侵袭性癌；coad:结肠腺癌；lihc:肝脏肝细胞癌；prad:***腺癌；stad:胃腺癌；和ucec:子宫内膜癌。本领域技术人员将理解可用其他癌基因的组合及其甲基化状态或特征来诊断其他癌症。其他方法可包括更多引物或改变引物混合物的组成来覆盖更多类型的癌症或提高癌症诊断的灵敏度和特异性。方法可如下进行。

用引物混合物的第一轮PCR反应

在6ul洗脱物中加入1ul的10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVentexo^-,0.2ul 1uM MERLOT生物素-引物混合物,0.2ul 100mM MgSO₄和2.3ul H₂O。1x MERLOTPCR缓冲条件包括20mM Tris-HCL,10mM KCL,0.1％Trition X-100,pH7.8，25℃。对10ul反应物进行以下热循环以跨越21对引物的所有退火温度(58℃到64℃):94℃ 2分钟,64℃ 60秒,63℃ 60秒,62℃ 60秒,61℃ 60秒,60℃ 60秒,59℃ 60秒,58℃ 60秒,和72℃ 3分钟。由此获得有一条链与生物素结合的半甲基化dsDNA片段。

第一轮DNMT1甲基转移反应

在10ul反应物中加入1.5ul的10x MERLOT甲基转移(MT)缓冲液,0.15ul160uMSAM,0.15ul 100ug/ml BSA,0.3ul 200mM EDTA,2ul 2U/ul DNMT1和0.9ul H₂0。MT缓冲液的1x缓冲条件包括20mM Tris-HCL,1mM DTT,5％甘油,pH 7.8，25℃。15ul反应物在37℃孵育3小时。得到甲基化dsDNA片段和完整的一轮扩增和甲基化。

按需多轮MERLOT

按需可再进行1-4轮扩增和甲基化。热循环与第一轮扩增和甲基化相同。对于第2、第3、第4、第5轮扩增和甲基化循环分别加入以下试剂。

第二轮PCR

在15ul反应物中加入1ul的10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVentexo^-,0.2ul 1uM MERLOT生物素引物混合物,0.55ul 100mM MgSO₄和2.95ul H₂O。

第二轮DNMT1甲基转移反应

在20ul反应物中加入1ul的10x甲基转移(MT)缓冲液,0.25ul 160uM SAM,0.1ul100ug/ml BSA,0.325ul 100mM EDTA,2ul 2U/ul DNMT1,0.15ul 100mM DTT和1.175ulH₂0。

第三轮PCR

在25ul反应物中加入1ul的10x MERLOT PCR缓冲液,0.2ul dNTP,0.1ul2U/ulDeepVent exo^-,0.2ul 1uM MERLOT生物素-引物混合物,0.85ul 100mM MgSO₄和2.65ulH₂O。

第三轮DNMT1甲基转移反应

在30ul反应物中加入1ul的10x甲基转移(MT)缓冲液,0.35ul 160uM SAM,0.1ul100ug/ml BSA,0.475ul 200mM EDTA,2ul 2U/ul DNMT1,0.25ul 100mM DTT和0.825ulH₂0。

第四轮PCR

在35ul反应物中加入1ul的10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVentexo^-,0.2ul 1uM MERLOT生物素-引物,1.15ul 100mM MgSO₄和2.35ul H₂O。

第四轮DNMT1甲基转移反应

在40ul反应物中加入1ul的10x甲基转移(MT)缓冲液,0.45ul 160uM SAM,0.1ul100ug/ml BSA,0.625ul 200mM EDTA,2ul 2U/ul DNMT1,0.35ul 100mM DTT和0.475ulH₂0。

第五轮PCR

在45ul反应物中加入1ul的10x PCR缓冲液,0.2ul dNTP,0.1ul 2U/ul DeepVentexo^-,0.2ul 1uM MERLOT生物素-引物混合物,1.45ul 100mM MgSO₄和2.05ul H₂O。

第五轮DNMT1甲基转移反应

在50ul反应物中加入1ul的10x甲基转移(MT)缓冲液,0.55ul 160uM SAM,0.1ul100ug/ml BSA,0.775ul 100mM EDTA,2ul 2U/ul DNMT1,0.45ul 100mM DTT和0.125ulH₂0。

用Dyna珠和亚硫酸氢盐转换富集

扩增且甲基化的dsDNA含有结合于DNA扩增子两端的生物素分子。通过标准Dyna珠M-280链霉亲和素在20ul洗脱缓冲液中洗涤和洗脱富集扩增子。用亚硫酸氢钠根据ZymoEZ-Direct亚硫酸氢盐试剂盒的指导处理扩增的差异甲基化基因扩增子。亚硫酸氢盐转换的DNA适用于下游分析，例如甲基化特异性qPCR，NGS测序，Pyro-测序，Sanger测序等。将基因扩增子的甲基化状态与癌基因的已知甲基化状态(即标准)比较，以通过匹配(即与癌细胞DNA的已知甲基化状态类似的甲基化状态)来确定在最初的测试样品中是否存在来自癌细胞的核酸。

实施例V

合成模板中的扩增和甲基化

为了测试DNMT1的体外性能，开发适用于本文所述的扩增和甲基化反应的最佳反应缓冲液，如图5所示采用了合成的dsDNA，其含有甲基化敏感的限制性切割位点。87bpdsDNA含有6bp ClaI基序：5’-ATCGAT-3’。如果CpG位点未甲基化，与Clai孵育时该87bpdsDNA能被切成两个片段。如果CpG位点已甲基化，则dsDNA不被切开。当dsDNA仅一条链含有甲基化的胞嘧啶，Clai的切割率大大下降，但如果反应时间足够长到饱和，还是能导致片段化。Clai孵育3小时(饱和)后，通过在生物分析仪上跑电泳，能计算完整dsDNA模板的确切百分数，以显示样品中甲基化模板的百分数。

87bp dsDNA模板是：

上链:5’-ACC TGT GAC TGA GAC ATC TGA AGG TGC AAT CAG GTG TCA GTC TTAAAG GAT CGA TAA GGA AGC GGA AGT AGT GGT CTC GTC GTA GTG-3’

下链:5’-CAC TAC GAC GAG ACC ACT ACT TCC GCT TCC TTA TCG ATC CTT TAAGAC TGA CAC CTG ATT GCA CCT TCA GAT GTC TCA GTC ACA GGT-3’。

为了估算DNMT1在一些缓冲条件下的甲基转移效率，将半甲基化的dsDNA模板与DNMT1一起在自制缓冲液中孵育，然后进行Clai切割和电泳，如图6所示。DNMT1可在15ul含有2ul 2U/ul DNMT1(NEB)的反应物中达到将近100％的甲基转移效率。反应缓冲条件是:1xMT缓冲液，补充有0.15ul 160uM SAM,0.15ul100ug/ml BSA。

为了估算DNMT1在一些缓冲条件下的从头甲基化率，将未甲基化的dsDNA模板与DNMT1一起在自制缓冲液中孵育，然后进行Clai切割和电泳，如图7所示。DNMT1显示在与2ul2U/ul DNMT1(NEB)在15ul反应物中孵育3小时，有接近0.1％的从头甲基化率。反应缓冲条件是:1x MT缓冲液，补充有0.15ul 160uM SAM,0.15ul 100ug/ml BSA，0.3ul 200mM EDTA。MT缓冲液的1x缓冲条件包括20mM Tris-HCL,1mM DTT,5％甘油,pH 7.8，于25℃。当在MT缓冲液中反应时，可实现DNMT1的强大性能，但为了扩增甲基化状态，也需要强大的聚合酶延伸反应。聚合酶延伸的理想的缓冲条件应当不与MT缓冲液冲突，并且在PCR缓冲液和MT缓冲液之间的切换应不复杂。目前，本文所述的扩增和甲基化反应进行聚合酶延伸使用10ul反应体积的0.1ul 2U/ul DeepVent exo^-。缓冲条件是1x PCR缓冲液，补充有0.2ul dNTP和0.2ul 100mM MgSO₄。通过EDTA螯合Mg2+实现缓冲切换。1xPCR缓冲条件包括20mM Tris-HCL,1mM DTT,5％甘油,pH 7.8，于25℃。87bp dsDNA模板的聚合酶延伸的热循环是94℃2分钟，58℃60秒和72℃3分钟。正向引物是5’-ACC TGT GAC TGA GAC ATC TG-3’。反向引物是5’-CAC TAC GAC GAG ACC ACT AC-3’。

通过组合聚合酶延伸和DNMT1甲基转移反应(MERLOT法)，可以实现原始模板的甲基化状态复制。对87bp甲基化模板的1轮MERLOT法然后Clai切割和电泳得到96.6％的全长模板，表示DNMT1具有96.6％的甲基转移效率。对87bp甲基化模板的2轮MERLOT法然后Clai切割和电泳得到95.4％的全长模板，表示用螯合反应成功切换缓冲液。

实施例VI

实施方案

本公开提供了一种制备扩增的甲基化组的方法，包括：(a)片段化具有甲基化模式的双链DNA序列，以产生片段模板双链DNA序列，其具有甲基化模式且在每个片段模板双链DNA序列的5’末端和3’末端具有引物结合位点,(b)将片段模板双链DNA序列分成上模板链和下模板链,(c)用引物、聚合酶和核苷酸延伸上模板链和下模板链，产生未甲基化的互补链，得到半甲基化的双链DNA序列，其对应于具有甲基化模式的片段模板双链DNA序列,(d)用甲基转移酶和甲基源处理半甲基化双链DNA序列，以在对应于相应片段化模板双链DNA序列的甲基化胞嘧啶的位置加上甲基，产生完全甲基化的片段模板双链DNA序列；和(e)重复步骤(b)到(d)产生片段模板双链DNA序列的完全甲基化的扩增子。

根据一个方面，该方法还包括用将胞嘧啶残基转换成尿嘧啶的试剂处理片段模板双链DNA序列的全甲基化扩增子，并分析甲基化胞嘧啶模式。根据一个方面，步骤(a)中的片段化通过双链DNA序列与转座体文库的接触实现，文库的每一个转座子具有其独特的相关条码序列且包含转座酶和转座子DNA同二聚体，其中同二聚体的每个转座子DNA包括转座酶结合位点、独特的条码序列和引物结合位点，其中转座体文库与沿着双链DNA序列的目标位置结合，转座酶将双链DNA序列切割成片段模板双链DNA序列，每个片段模板双链DNA序列在片段模板双链DNA序列的每个末端包括独特条码序列对的一个成员，填充在转座子DNA和片段模板双链DNA序列之间的缺口，形成片段模板双链DNA序列文库，其在每一个末端具有引物结合位点。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入螯合剂来螯合镁离子。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入EDTA来螯合镁离子。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入等摩尔的EDTA来螯合镁离子，产生甲基转移酶的理想缓冲条件。根据一个方面，步骤(e)包括在重复的步骤(c)中加入镁离子以产生引物延伸的理想引物延伸缓冲条件。根据一个方面，甲基转移酶是DNMT1。根据一个方面，所述转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶或IS5转座酶。根据一个方面，将胞嘧啶残基转换成尿嘧啶的试剂是亚硫酸氢钠。根据一个方面，双链DNA序列是基因组DNA。根据一个方面，双链DNA序列是获自单细胞的全基因组DNA或是无细胞DNA。根据一个方面，双链DNA序列是来自产前细胞、癌细胞或循环癌细胞的基因组DNA。根据一个方面，双链DNA序列是获自个体血样的无细胞肿瘤细胞基因组DNA。根据一个方面，步骤(b)到(d)重复1-20次。根据一个方面，步骤(b)到(d)重复1-10次。根据一个方面，步骤(b)到(d)重复1-5次。根据一个方面，用将胞嘧啶残基转换成尿嘧啶的试剂处理片段模板双链DNA序列的完全甲基化扩增子。根据一个方面，将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC家族的酶。根据一个方面，将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC3A。根据一个方面，引物是基因座特异性引物。根据一个方面，引物是疾病特异性引物。根据一个方面，引物是癌症特异性引物。

本文提供了诊断患有癌症的个体的方法，该方法包括：(a)片段化获自个体的液体活检样品的双链DNA，其中双链DNA序列具有甲基化模式，以产生片段模板双链DNA序列，其具有甲基化模式且在每个片段模板双链DNA序列的5’末端和3’末端具有引物结合位点,(b)将片段模板双链DNA序列分成上模板链和下模板链,(c)用癌症特异性引物、聚合酶和核苷酸延伸上模板链和下模板链，产生未甲基化的互补链，得到半甲基化的双链DNA序列，其对应于具有甲基化模式的片段模板双链DNA序列,(d)用甲基转移酶和甲基源处理半甲基化双链DNA序列以在对应于相应片段化模板双链DNA序列的甲基化胞嘧啶的位置加上甲基，以产生完全甲基化的片段模板双链DNA序列；(e)重复步骤(b)到(d)产生片段模板双链DNA序列的完全甲基化扩增子；用将胞嘧啶残基转换成尿嘧啶的试剂处理片段模板双链DNA序列的完全甲基化扩增子；确定甲基化胞嘧啶模式；将甲基化胞嘧啶模式与癌症DNA的标准甲基化胞嘧啶模式比较；确定甲基化胞嘧啶模式与癌症DNA的标准甲基化胞嘧啶模式的差异；和当确定的甲基化胞嘧啶模式与癌症DNA的标准甲基化胞嘧啶模式匹配时，诊断该个体患有癌症。根据一个方面，液体活检样品是血样、脊髓液样品或尿样。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入螯合剂来螯合镁离子。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入EDTA来螯合镁离子。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入等摩尔的EDTA来螯合镁离子，产生甲基转移酶的理想缓冲条件。根据一个方面，步骤(e)包括在重复的步骤(c)中加入镁离子以产生引物延伸的理想引物延伸缓冲条件。根据一个方面，甲基转移酶是DNMT1。根据一个方面，将胞嘧啶残基转换成尿嘧啶的试剂是亚硫酸氢钠。根据一个方面，将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC家族的酶。根据一个方面，将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC3A。根据一个方面，双链DNA序列是获自单个细胞的全基因组DNA。根据一个方面，双链DNA序列是来自癌细胞或循环癌细胞的基因组DNA。根据一个方面，双链DNA序列是获自个体血样的无细胞肿瘤细胞基因组DNA。根据一个方面，步骤(b)到(d)重复1-20次。根据一个方面，步骤(b)到(d)重复1-10次。根据一个方面，步骤(b)到(d)重复1-5次。根据一个方面，引物是癌症特异性引物。根据一个方面，确定甲基化胞嘧啶模式包括下一代测序，甲基化特异性qPCR或甲基化检测微阵列。根据一个方面，癌症选自乳腺侵袭性癌、结肠腺癌、肝脏肝细胞癌、***腺癌、胃腺癌和子宫内膜癌。

本文提供了个体癌症早期诊断的方法，该方法包括：(a)从个体液体活检样品提取可能含有无细胞肿瘤DNA的无细胞DNA或基因组DNA，其中无细胞肿瘤DNA序列与正常体细胞相比具有不同的甲基化模式，(b)将双链DNA序列分成上模板链和下模板链,(c)用聚合酶、核苷酸和选定的一组引物延伸上模板链和下模板链，该组引物针对癌细胞和正常细胞具有不同甲基化模式的基因组区域，得到选定的差异甲基化基因座的半甲基化的双链DNA序列,(d)用甲基转移酶处理半甲基化双链DNA序列，以在对应于相应双链DNA序列的甲基化胞嘧啶位置加上甲基，以产生所选差异甲基化基因座的完全甲基化的双链DNA序列；(e)重复步骤(b)到(d)产生所选差异甲基化基因座的完全甲基化扩增子；(f)用将胞嘧啶残基转换成尿嘧啶的试剂处理完全甲基化扩增子，同时保持甲基化胞嘧啶残基不变；(g)确定甲基化胞嘧啶模式；(h)将无细胞DNA的甲基化胞嘧啶模式与不同癌症组织的甲基化胞嘧啶模式比较，确定样品中是否存在无细胞肿瘤DNA，确定无细胞DNA的甲基化胞嘧啶模式和不同癌症组织的甲基化胞嘧啶模式之间的差异，确定在样品中是否存在无细胞肿瘤DNA；和(i)当确定的甲基化胞嘧啶模式包含癌症特异性甲基化模式时，诊断该个体患有某种类型的癌症。根据一个方面，液体活检样品是血样、脊髓液样品或尿样。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入螯合剂来螯合镁离子。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入EDTA来螯合镁离子。根据一个方面，步骤(c)包括镁离子，步骤(d)的处理包括加入等摩尔的EDTA来螯合镁离子，产生甲基转移酶的理想缓冲条件。根据一个方面，步骤(e)包括在重复的步骤(c)中加入镁离子以产生引物延伸的理想引物延伸缓冲条件。根据一个方面，甲基转移酶是DNMT1。根据一个方面，将胞嘧啶残基转换成尿嘧啶的试剂是亚硫酸氢钠。根据一个方面，将胞嘧啶转换成尿嘧啶的试剂是APOBEC家族的酶。根据一个方面，将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC3A。根据一个方面，双链DNA序列是获自单个细胞的全基因组DNA。根据一个方面，双链DNA序列是来自癌细胞或循环癌细胞的基因组DNA。根据一个方面，双链DNA序列是获自个体血样的无细胞肿瘤细胞基因组DNA。根据一个方面，步骤(b)到(d)重复1-20次。根据一个方面，步骤(b)到(d)重复1-10次。根据一个方面，步骤(b)到(d)重复1-5次。根据一个方面，引物是癌症特异性引物。根据一个方面，确定甲基化胞嘧啶模式包括下一代测序，甲基化特异性qPCR或甲基化检测微阵列。根据一个方面，癌症选自乳腺侵袭性癌、结肠腺癌、肝脏肝细胞癌、***腺癌、胃腺癌、和子宫内膜癌。

Claims

1.一种制备扩增的甲基化组的方法，所述方法包括：

(a)片段化具有甲基化模式的双链DNA序列，以产生片段模板双链DNA序列，其具有甲基化模式且在片段模板双链DNA序列的各5’末端和3’末端具有引物结合位点,

(b)将片段模板双链DNA序列分成上模板链和下模板链,

(c)用引物、聚合酶和核苷酸延伸上模板链和下模板链，产生未甲基化的互补链，得到半甲基化的双链DNA序列，其对应于具有甲基化模式的片段模板双链DNA序列,

(d)用甲基转移酶和甲基源处理半甲基化双链DNA序列以在对应于相应片段化模板双链DNA序列的甲基化胞嘧啶的位置加上甲基，以产生完全甲基化的片段模板双链DNA序列；和

(e)重复步骤(b)到(d)产生片段模板双链DNA序列的完全甲基化扩增子。

2.如权利要求1所述的方法，还包括用将胞嘧啶残基转换成尿嘧啶的试剂处理片段双链DNA序列的全甲基化扩增子，并分析甲基化胞嘧啶模式。

3.如权利要求1所述的方法，步骤(a)中的片段化通过使双链DNA序列与转座体文库接触实现，文库的每一个转座体具有其独特的相关条码序列，其中文库中的各转座体包含转座酶和转座子DNA同二聚体，其中同二聚体的每个转座子DNA包括转座酶结合位点、独特的条码序列和引物结合位点，其中转座体文库与沿着双链DNA序列的目标位置结合，转座酶将双链DNA序列切割成片段模板双链DNA序列，每个片段模板双链DNA序列在片段模板双链DNA序列的每个末端包括独特条码序列对的一个成员，

填充在转座子DNA和片段模板双链DNA序列之间的缺口，形成片段模板双链DNA序列文库，其在每一个末端具有引物结合位点。

4.如权利要求1所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入螯合剂来螯合镁离子。

5.如权利要求1所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入EDTA来螯合镁离子。

6.如权利要求1所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入等摩尔的EDTA来螯合镁离子，产生甲基转移酶的理想缓冲条件。

7.如权利要求1所述的方法，步骤(e)包括在重复的步骤(c)中加入镁离子以产生引物延伸的理想引物延伸缓冲条件。

8.如权利要求1所述的方法，所述甲基转移酶是DNMT1。

9.如权利要求3所述的方法，其中所述转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶或IS5转座酶。

10.如权利要求2所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是亚硫酸氢盐。

11.如权利要求1所述的方法，其中所述双链DNA序列是基因组DNA。

12.如权利要求1所述的方法，其中双链DNA序列是获自单细胞的全基因组DNA或无细胞DNA。

13.如权利要求1所述的方法，其中双链DNA序列是来自产前细胞、癌细胞或循环肿瘤细胞的基因组DNA。

14.如权利要求1所述的方法，其中双链DNA序列是获自个体血样的无细胞肿瘤细胞基因组DNA。

15.如权利要求1所述的方法，其中步骤(b)-(d)重复1-20次。

16.如权利要求1所述的方法，其中步骤(b)-(d)重复1-10次。

17.如权利要求1所述的方法，其中步骤(b)-(d)重复1-5次。

18.如权利要求1所述的方法，其中用将胞嘧啶残基转换成尿嘧啶的试剂处理片段模板双链DNA序列的完全甲基化扩增子。

19.如权利要求2所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC家族的酶。

20.如权利要求2所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC3A。

21.如权利要求1所述的方法，其中引物是基因座特异性引物。

22.如权利要求1所述的方法，其中引物是疾病特异性引物。

23.如权利要求1所述的方法，其中引物是癌症特异性引物。

24.一种诊断患有癌症的个体的方法，包括：

(a)片段化获自个体液体活检样品的双链DNA序列，其中双链DNA序列具有甲基化模式，以产生片段模板双链DNA序列，其具有甲基化模式且在片段模板双链DNA序列的各5’末端和3’末端具有引物结合位点，

(b)将片段模板双链DNA序列分成上模板链和下模板链,

(c)用癌症特异性引物、聚合酶和核苷酸延伸上模板链和下模板链，产生未甲基化的互补链，得到半甲基化的双链DNA序列，其对应于具有甲基化模式的片段模板双链DNA序列,

(e)重复步骤(b)到(d)产生片段模板双链DNA序列的完全甲基化扩增子；

用将胞嘧啶残基转换成尿嘧啶的试剂处理片段模板双链DNA序列的完全甲基化扩增子；

确定甲基化胞嘧啶模式；

将甲基化胞嘧啶模式与癌症DNA的标准甲基化胞嘧啶模式比较；

确定甲基化胞嘧啶模式和癌症DNA的标准甲基化胞嘧啶模式之间的差异；和

当确定的甲基化胞嘧啶模式与癌症DNA的标准甲基化胞嘧啶模式匹配时，诊断该个体患有癌症。

25.如权利要求24所述的方法，其中液体活检样品是血样、脊髓液样品或尿样。

26.如权利要求24所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入螯合剂来螯合镁离子。

27.如权利要求24所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入EDTA来螯合镁离子。

28.如权利要求24所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入等摩尔的EDTA来螯合镁离子，产生甲基转移酶的理想缓冲条件。

29.如权利要求24所述的方法，其中步骤(e)包括在重复的步骤(c)中加入镁离子以产生引物延伸的理想引物延伸缓冲条件。

30.如权利要求24所述的方法，其中所述甲基转移酶是DNMT1。

31.如权利要求24所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是亚硫酸氢盐。

32.如权利要求24所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC家族的酶。

33.如权利要求24所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC3A。

34.如权利要求24所述的方法，其中所述双链DNA序列是获自单个细胞的全基因组DNA。

35.如权利要求24所述的方法，其中双链DNA序列是来自癌细胞或循环肿瘤细胞的基因组DNA。

36.如权利要求24所述的方法，其中双链DNA序列是获自个体血样的无细胞肿瘤细胞基因组DNA。

37.如权利要求24所述的方法，其中步骤(b)-(d)重复1-20次。

38.如权利要求24所述的方法，其中步骤(b)-(d)重复1-10次。

39.如权利要求24所述的方法，其中步骤(b)-(d)重复1-5次。

40.如权利要求24所述的方法，其中引物是癌症特异性引物。

41.如权利要求24所述的方法，其中确定甲基化胞嘧啶模式包括下一代测序，甲基化特异性qPCR或甲基化检测微阵列。

42.如权利要求24所述的方法，其中癌症选自乳腺侵袭性癌、结肠腺癌、肝脏肝细胞癌、***腺癌、胃腺癌和子宫内膜癌。

43.一种个体癌症早期诊断的方法，包括：

(a)从个体液体活检样品提取可能含有无细胞肿瘤DNA的无细胞DNA或基因组DNA，其中无细胞肿瘤DNA序列与正常体细胞相比具有不同的甲基化模式，

(b)将双链DNA序列分成上模板链和下模板链,

(c)用聚合酶、核苷酸和选定的引物组延伸上模板链和下模板链，所述引物组针对癌细胞和正常细胞具有不同甲基化模式的基因组区域，得到选定的差异甲基化基因座的半甲基化双链DNA序列,

(d)用甲基转移酶处理半甲基化双链DNA序列，以在对应于相应双链DNA序列的甲基化胞嘧啶的位置加上甲基，以产生所选差异甲基化基因座的完全甲基化双链DNA序列；

(e)重复步骤(b)到(d)产生所选差异甲基化基因座的完全甲基化扩增子；

(f)用将胞嘧啶残基转换成尿嘧啶的试剂处理完全甲基化扩增子，同时保持甲基化胞嘧啶残基不变；

(g)确定甲基化胞嘧啶模式，

h)将无细胞DNA的甲基化胞嘧啶模式与不同癌症组织的甲基化胞嘧啶模式比较，确定样品中是否存在无细胞肿瘤DNA，确定无细胞DNA的甲基化胞嘧啶模式和不同癌症组织的甲基化胞嘧啶模式之间的差异，确定在样品中是否存在无细胞肿瘤DNA；和

(i)当确定的甲基化胞嘧啶模式包含癌症特异性甲基化模式时，诊断该个体患有某种类型的癌症。

44.如权利要求43所述的方法，其中液体活检样品是血样、脊髓液样品或尿样。

45.如权利要求43所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入螯合剂来螯合镁离子。

46.如权利要求43所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入EDTA来螯合镁离子。

47.如权利要求43所述的方法，其中步骤(c)包括镁离子，步骤(d)的处理包括加入等摩尔的EDTA来螯合镁离子，产生甲基转移酶的理想缓冲条件。

48.如权利要求43所述的方法，其中步骤(e)包括在重复的步骤(c)中加入镁离子以产生引物延伸的理想引物延伸缓冲条件。

49.如权利要求43所述的方法，其中所述甲基转移酶是DNMT1。

50.如权利要求43所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是亚硫酸氢盐。

51.如权利要求43所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC家族的酶。

52.如权利要求43所述的方法，其中将胞嘧啶残基转换成尿嘧啶的试剂是APOBEC3A。

53.如权利要求43所述的方法，其中所述双链DNA序列是获自单个细胞的全基因组DNA。

54.如权利要求43所述的方法，其中双链DNA序列是来自癌细胞或循环肿瘤细胞的基因组DNA。

55.如权利要求43所述的方法，其中双链DNA序列是获自个体血样的无细胞肿瘤细胞基因组DNA。

56.如权利要求43所述的方法，其中步骤(b)-(d)重复1-20次。

57.如权利要求43所述的方法，其中步骤(b)-(d)重复1-10次。

58.如权利要求43所述的方法，其中步骤(b)-(d)重复1-5次。

59.如权利要求43所述的方法，其中引物是癌症特异性引物。

60.如权利要求43所述的方法，其中确定甲基化胞嘧啶模式包括下一代测序，甲基化特异性qPCR或甲基化检测微阵列。

61.如权利要求43所述的方法，其中癌症选自乳腺侵袭性癌、结肠腺癌、肝脏肝细胞癌、***腺癌、胃腺癌和子宫内膜癌。