CN105209642A - 基因组测序和表观遗传分析的方法 - Google Patents

基因组测序和表观遗传分析的方法 Download PDF

Info

Publication number
CN105209642A
CN105209642A CN201480028173.2A CN201480028173A CN105209642A CN 105209642 A CN105209642 A CN 105209642A CN 201480028173 A CN201480028173 A CN 201480028173A CN 105209642 A CN105209642 A CN 105209642A
Authority
CN
China
Prior art keywords
cell
dna
sample
cells
methods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480028173.2A
Other languages
English (en)
Inventor
郑诣先
J·贾
X·郑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Carnegie Institution of Washington
Original Assignee
Carnegie Institution of Washington
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Carnegie Institution of Washington filed Critical Carnegie Institution of Washington
Publication of CN105209642A publication Critical patent/CN105209642A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/113Cycle sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/149Particles, e.g. beads

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文公开ChIP-seq的新颖方法。这些ChIP-seq方法使用载体DNA来防止DNA样本损失。通过本发明实现的更高DNA产率允许对小数量细胞进行ChIP-seq,从而允许对有限数量的初级细胞进行表观遗传分析。

Description

基因组测序和表观遗传分析的方法
发明领域
本发明涉及基因组测序和表观遗传分析的方法。
背景
染色质的表观遗传状态调控转录因子和复制机构对DNA的接近。在真核生物中,调控细胞的表观遗传状态的因素例如为DNA的甲基化作用和对组蛋白的共价修饰。下一代测序的发展已使得有可能使用染色质免疫沉淀法(ChIP-seq)来获得整个基因组的表观遗传修饰的概况。ChIP-seq允许对结合至基因组的特定区域的蛋白质进行高分辨检测,并且ChIP-seq可用于准确定位在细胞内导致表型改变的表观遗传修饰。
表观遗传修饰是指对特定DNA序列和其相关组蛋白进行可逆的共价修饰。这些可逆的共价修饰影响如何利用基础DNA,并因此还可控制性状(Jenuwein和Allis(2001)Science,293,1074-1080;Klose和Bird(2006)TrendsInBiochemicalSciences,31,89-97)。
对哺乳动物基因组的表观遗传修饰包括甲基化、乙酰化、核糖化、磷酸化、SUMO化修饰(sumoylation)、瓜氨酸化(citrullination)和泛素化(ubiquitylation)。这些修饰可在核小体内的4个核心组蛋白的超过30个氨基酸残基上发生。例如,对哺乳动物中DNA的大多数常见表观遗传修饰是对DNA的甲基化和羟甲基化,这两者皆可在胞嘧啶嘧啶环的第5个碳上进行。
对基因组的表观遗传修饰可如基因组诱变一般深刻地影响发育和健康。特定而言,上文所述的表观遗传修饰不改变一级DNA序列。相反地,该表观遗传修饰对基础DNA如何表达具有有效影响。因此,表观遗传修饰可如DNA序列中的突变一般有力地改变表现型。
例如,p16肿瘤校正基因的突变(即,核苷酸序列中的突变)使该基因沉默。类似地,在p16肿瘤校正基因的启动子上的DNA甲基化(即,核苷酸序列无突变)使该基因沉默。这两个事件(即,核苷酸序列的突变和正确序列的甲基化)皆有助于结肠直肠癌的发生和进展。然而,与永久性突变不同,p16的表观遗传沉默在药理学上可逆。因此,检测出表观遗传修饰的能力提供一种用于医疗干预和直接治疗方案的途径。
全基因组(genomewide)发生的特定表观遗传修饰也在发育期间调控细胞分化(Mikkelsen等人(2007)Nature,448,553-U552)。例如,成熟组织中的表观遗传修饰有助于癌症和其他疾病的引发和进展(Feinberg,A.P.(2007)Nature,447,433-440)。另外,研究已表明表观遗传修饰受到环境变量的影响,所述环境变量包括饮食(Waterland和Jirtle(2003)MolecularAndCellularBiology,23,5293-5300),环境毒素(Anway等人(2005)Science,308,1466-1469)以及母性行为(Weaver等人(2004)NatureNeuroscience,7,847-854)。考虑到表观遗传修饰在正常发育、环境响应、疾病发生和疾病进展中起到的基本作用,需要研发对基因组DNA进行测序以检测表观遗传修饰的方法。特定而言,需要研发对基因组DNA进行测序来从可由简单活检或组织样本获得的小数量细胞中检测出表观遗传修饰的方法。
此外,即使表观遗传修饰未由DNA序列的改变组成,所述表观遗传修饰仍可在有丝***期间从母细胞传递给子细胞,并且可从一代到下一代经由减数***持续传播。因此,即使表观遗传修饰可远比DNA序列的改变更容易地改变并回复其初始状态,但其仍对发育和疾病很重要。
因为表观遗传修饰涉及癌症发展和癌症进展,已对其进行格外研究。例如,与对人结肠直肠癌发展进行DNA甲基化时的扰动相关的早期观察以及后续研究表明DNA甲基化状态的实验操作在药理学或遗传学上有能力控制肿瘤发展。因此,愈来愈多研究表明针对表观遗传状态修改的治疗可控制癌症和疾病进展。同样地,可针对疾病状态对表观遗传修饰进行定位,并且表观遗传修饰可用作生物标志物来检测或预防疾病发生和进展。
表观遗传修饰的其他实例为响应于有机体环境而发展的那些表观遗传修饰(例如,人类生活的地方以及在周围环境中人类所暴露于的具体内容可能影响表观遗传修饰)。影响表观遗传的环境因素的实例包括养育期间的母性行为、暴露于内分泌干扰物以及食物的营养构成。此外,如上所述,表观遗传修饰和所得表现型可从父母传播给后代,即便仅父母而非后代暴露于所述环境因素。这引起以下可能:家族中存在的一些复杂性状(如肥胖、癌症或行为模式)通过表观遗传修饰来传播,并且所述复杂性状是由前代所经历的暴露环境因素所导致。
分析染色质的表观遗传修饰的现有方法,诸如染色质免疫沉淀法(ChIP),是劳动密集性的并且需要系列过程,所述系列过程对分析通量和样本数量构成显著限制。
ChIP涉及免疫沉淀法,其使用对所关注表观遗传修饰具有特异性的抗体来分离经过修饰的染色质,该染色质随后用大规模平行DNA测序(ChIP-seq)、微阵列杂交或基因特异性PCR来分析。ChIP可用于表征染色质相关蛋白质的基因组分布(genomeplacement),并且是目前实践用于表观遗传和染色质研究的主要分析工具。然而,其具有较大局限。首先,该分析一般需要至少107个细胞。换句话说,当细胞数目有限时,目前的ChIP方法需要的细胞远多于可用的细胞。例如,不可能在胚胎上、在体外培养中未繁殖的初级细胞上、在显微切割细胞上以及在从活体动物诸如人类的活检中直接获取的小细胞样本上执行ChIP-seq。因此,表观遗传测试的目前方法涉及巨量细胞分析(即,平均至少106个细胞)。
单个哺乳动物细胞中RNA和DNA的全基因组测序对以精确度揭示全面转录计划(globaltranscriptionalprogram)和DNA变异来说拥有巨大前景。然而,重要的缺失环节是该基因组在从组织分离的小数量细胞(例如小于106个细胞,例如1个至20,000个细胞之间)中的表观遗传和转录因子结合性图谱的信息。获得用于深度测序的DNA所需的多个步骤限制了染色质免疫沉淀法(ChIP)的应用,因为深度测序通常需要不能利用传统ChIP方法采集的大数量DNA(即,因为ChIP需要大量纯化步骤,通常损失大数量DNA)。
本文所述的是一种基于DNA强化回收的新方法。特定而言,本文提供的方法描述通过添加保护剂以及有利的DNA扩增(RepFamp)来在ChIP期间加强DNA回收(即,防止纯化和加工步骤中的DNA损失)。所述方法允许在极小数量的细胞中对表观遗传图谱进行稳健且可靠的定位,并且产生一种不用细胞计数来揭露表观遗传改变而进行全面转录组分析的新型和新颖方法。
发明概述
本发明涉及对来自细胞的样本的基因组DNA进行测序的方法,并且所述方法包括:对细胞的所述样本中的染色质进行断裂;将载体DNA加入细胞的所述样本的所述断裂染色质中,其中所述载体DNA(称为“DNA1”)是5’生物素化DNA;使载体DNA1和断裂染色质的混合物沉淀;使阻断引物退火,所述阻断引物防止DNA扩增并且与所述DNA1互补;对来自细胞的样本的基因组DNA进行扩增;以及对扩增DNA进行测序。在1个至20,000个细胞的细胞样本上执行所述方法。
本发明涉及对来自细胞的样本的基因组DNA进行测序的方法,并且所述方法包括:对细胞的所述样本中的染色质进行断裂;将载体DNA(称为“DNA2”)加入细胞的样本的断裂染色质中,其中所述载体DNA被5’悬突和3’间隔物3修饰进行5’生物素化;使载体DNA2和断裂染色质的混合物沉淀;使来自细胞的样本的基因组DNA扩增;以及对扩增DNA进行测序。在1个至20,000个细胞的细胞样本上执行所述方法。
本发明涉及对来自细胞的样本的基因组DNA进行测序的方法,并且所述方法包括:将细胞的样本与一大批增量细胞组合;对样本细胞和增量细胞中的染色质进行断裂;使细胞的断裂染色质沉淀;使来自细胞的所述样本的所述基因组DNA扩增;以及对扩增DNA进行测序。在1个至20,000个细胞的细胞样本上执行所述方法。
附图简述
图1示出对(1)经由保护来回收(RePro)与(2)经由保护和有利扩增来回收(RePam)进行比较的草图表示。为了RePro和RePam,将诸如DNA的保护低聚物加入样本细胞以用于ChIPDNA分离、全基因组DNA分离、或RNA分离。在RePro方案中,载体DNA和样本DNA两者皆将扩增(无偏向),这需要增加测序深度。在RePam中,所用的特异性载体测序或PCR引物抑制载体DNA的扩增,同时允许所关注DNA的扩增。该有偏向扩增降低所需的测序深度。测序之后,将使用软件来过滤载体DNA的读数以产生所关注DNA的读数。
图2示出列出载体DNA的许多可能类型中三个类型(来自啤酒酵母(S.cerevisia)或大肠杆菌(E.coli)、或合成寡聚DNA的基因组DNA)的图表,所述载体DNA来自果蝇、小家鼠和人类并且在黑尾果蝇(Drosophilamelanogaster)、小家鼠(Musmusculus)和智人(Homosapiens)的基因组研究中具有使用潜力。列出了在可定位至所关注基因组的载体DNA中的短序列标签的数量。理论上的短序列标签长50bp,涵盖1bp步长的载体DNA,并且利用允许3个失配的蝴蝶结(bowtie)来定位至所述靶基因组。来自其他物种的基因组DNA的使用允许RePro,同时合成DNA的使用允许RePro和RePam两者。RePam通过阻断载体DNA的扩增而提供对所关注DNA的有利扩增,并且减小定位所需的测序深度。
图3示出两种类型的载体DNA。图3A示出载体DNA1。载体DNA1为具有已知序列的生物素化DNA。图3B示出载体DNA2。载体DNA2含有与DNA1中相同的生物素化DNA,以及在两端皆含有额外的5’悬突和3’间隔物3修饰。该末端结构对DNA聚合酶填充所述悬突进行阻断,因此用于PCR的衔接子DNA不能连接这些末端,并且不能发生扩增。
图4示出在存在和不存在扩增阻断剂的情况下载体DNA1的PCR扩增图表。所述载体DNA1为如图3A所示的生物素化双链DNA。扩增阻断剂为在5’端携带所示修饰的寡聚DNA。生物分析仪曲线图显示随着标准文库构建程序中扩增阻断剂浓度增加,对载体DNA1扩增的阻断增加。红色箭头指示扩增载体DNA1的峰。
图5示出对载体DNA2的PCR扩增阻断的演示。载体DNA2为图3B所示的具有3’修饰的生物素化双链DNA。此类DNA不能连接至用于文库构建的PCR引物,因此,其不能扩增,如通过在利用标准文库构建程序进行PCR扩增之前和之后所述生物分析仪曲线图中缺乏特异性DNA2峰所表明。
图6示出通过将酵母基因组DNA应用作为使用RePro的载体,对来自500个胚胎干细胞(ESC)进行的ChIP-Seq。图6A示出示出H3K4me3在来自107、2000、或500个ESC上的富集的热图。每条线表示一个基因。该热图根据107个细胞样本中的H3K4me3富集来划分等级。图6B示出等值线图,该等值线图示出在不同测序深度下,107个细胞样本与2000个细胞或500个细胞样本之间,启动子上H3K4me3富集的相关性。每个点表示一个基因。相关系数为斯皮尔曼相关性。图6C和图6D以沿染色体17的放大图(C)和缩小图(D)示出出H3K4me3在500个细胞、2000个细胞或107个细胞样本中的ChIP-Seq富集的基因组视图。峰高度对应于在沿染色体每100bp滑动的500bp窗口中计算的RPKM(每百万读数每千碱基读数)值。
图7示出使用三倍归一化法对RNA-Seq读数的恰当处理。将具有已知比率和已知序列的DNA和RNA混合物掺入细胞的样本中。使用标准方案执行DNA和RNA分离和测序。DNA-Seq要求检测该基因组DNA的一小部分和掺杂(spiked-in)DNA读数,因此仅需要极低测序深度。遵循该标准程序的RNASeq将得到针对来自细胞的RNA和掺杂RNA的读数。三倍归一化方案表明允许精确测定细胞RNA读数,而无需预先知晓所用细胞数目。
图8示出三倍归一化法的应用,其用于恰当量化在ESC中通过Myc抑制剂进行的转录抑制。热图示出基于不同归一化策略的RNASeq折叠改变分析。TMM归一化(edgeR软件包中通常使用的归一化)是基于一种假设,即大多数基因的表达在不同样本之间保持不变,这在诸如Myc的转录因子受到抑制的情况下是不正确的。双倍归一化是使用掺杂RNA的读数和来自样本基因组DNA的总读数的归一化。为DNA-Seq加载从不同样本制备的相同百分比的DNA。虽然针对细胞基因组DNA的归一化规避了细胞数量计数的需要,但该双倍归一化未能避免在文库预备和测序期间引入变异。三倍归一化是本专利中所述的标准程序,如上文图6所示。仅该三倍归一化法如实地演示在ESC中由Myc抑制剂(10058-F4)导致的全面转录抑制,而无需预先知晓样本中的细胞数量。
图9示出对切割小鼠晶状体上皮细胞的分析以说明本发明的应用。绘制草图来展示具有晶状体上皮细胞的眼睛,所述晶状体上皮细胞提供晶状体纤维并且调控晶状体在整个哺乳动物生命中的体内稳态。诸如白内障之类眼睛疾病大部分与年龄相关,可由晶状体上皮细胞的老化相关改变所引起。表观遗传信息(诸如H3K4me3修饰的状态)将不仅阐明哪个已知路径(诸如电解质体内稳态、细胞凋亡和细胞增殖)对老化敏感,而且将揭露有助于眼睛疾病的新路径。
图10示出表明RePro允许对从切割自单个年轻或老年小鼠眼睛的几个晶状体上皮细胞的H3K4me3进行高质量定位的图解。图10A示出展示H3K4me3在来自年轻小鼠(出生后第30天,P30)和老年小鼠(P800)的晶状体样本的基因启动子上富集的热图。每条线表示一个基因。该热图根据在P30样本中的H3K4me3富集来划分等级。图10B示出等值线图,该等值线图示出在启动子上H3K4me3富集于P30小鼠和P800小鼠的晶状体样本之间的良好全面相关性。每个点表示一个基因。相关系数为斯皮尔曼相关性。
图11示出在老化晶状体上皮细胞中对老化相关表观遗传改变的鉴别。虽然全面表观遗传图谱是类似的,但高质量H3K4me3ChIP-Seq允许定位特异性基因处的显著H3K4me3修饰改变。示出了显示H3K4me3修饰显著损失或增加的在指定功能群中的基因。
图12示出演示所细胞数量的模拟的实例,以便获得使用RePro和RePam-ChIP-seq的最佳结果。
图13示出RePro-ChIP-seq、LinDA-ChIP-seq和Nano-ChIP-seq之间的比较。
定义
为方便起见,说明书、实施例和随附权利要求书中所用的某些术语和短语的含义提供如下。
如本文所用,术语“小数量细胞”是指1至100,000个细胞。在某些实施方案中,该术语用于指1至20,000个细胞、或1至10,000个细胞、或1至5,000个细胞。
如本文所用,术语“RePro”或“经由保护来回收”是指一种方法,其中载体DNA和样本DNA两者皆扩增(无偏向),这需要增加测序深度。
如本文所用,术语“RePam”或“经由保护和扩增来回收”是指一种方法,其中将特异性载体DNA(本文称为DNA2)用于抑制载体DNA的扩增,同时允许所关注DNA的扩增。该有偏向扩增降低所需的测序深度。
如本文所用,术语“DNA1”是指5’生物素化载体DNA。
如本文所用,术语“DNA2”是指还在两端皆含有额外5’悬突和3’间隔物3修饰的5’生物素化载体DNA。该末端结构对DNA聚合酶填充所述悬突进行阻断,因此用于PCR的衔接子DNA不能连接这些末端,并且不能发生扩增。
如本文所用,术语″表观遗传″在本文中是指DNA关于功能改变而非核苷酸序列改变的状态或状况。此类改变在本领域中称为“表观遗传性修饰”,并且往往导致基因的表达或沉默。表观遗传改变或标志(其可由样本中DNA的修饰所导致)的实例或与其相关蛋白质(其可使用根据本发明的方法分析)的实例包括但不限于组蛋白蛋白质修饰、非组蛋白蛋白质修饰和DNA甲基化。
如本文所用,术语″表观遗传分析″是指确定DNA的状态或状况,和其在分析物样本中与特异性蛋白质和其修饰同种型的相互作用,并且涉及分析或检测分析物生物样本中的表观遗传标志。
如本文所用,术语″染色质免疫沉淀法″也将是熟练技术人员已知的,并且包括以下三个步骤:--(i)从细胞中分离待分析的染色质;(ii)使用抗体对染色质进行免疫沉淀法;以及(iii)DNA分析。经受染色质免疫沉淀法的分析物生物样本可包含染色质。染色质是染色体的物质且在真核细胞内包括DNA和蛋白质(主要是组蛋白)的复合物,并且是基因在遗传上的载体。染色质一般以具有不同着色性质的两种状态存在,即常染色质和异染色质,并且在细胞***期间,染色质盘绕并折叠而形成中期染色体。因此,分析物生物样本包括核酸,诸如但不限于DNA,以及任何相关蛋白质。
分析的染色质可以但不必得自至少一个细胞。因此,在一个实施方案中,生物样本包括至少一个细胞。该细胞可来源于组织样本。在某些实例中,该细胞来源于活性有机体,并在体外培养中未永生化或繁殖。在某些实施方案中,分析物生物样本包括哺乳动物细胞。在特定实施方案中,分析物生物样本包括人类或小鼠细胞。
如本文所用,术语“合适引物”是指可以用于种特异性PCR的所选引物,即,该引物可以用于使仅来自分析物生物样本而非来自载体DNA的一段核酸扩增的PCR。与合适引物的设计有关的其他信息在随附实施例中提供。
如本文所用,术语“阻断引物”是指与DNA1的末端互补的DNA序列。通过在RePro期间退火至DNA1,阻断引物阻止DNA1的PCR扩增。
如本文所用,术语“表观遗传标记”是指具体细胞类型的细胞的任何表现或表现型,其被认为来源于或可能归结于此类细胞的染色质结构(即由表观遗传修饰决定)。
如本文所用,术语“3’间隔物3”是指用于将短间隔臂掺入低聚核苷酸中的三碳间隔物。如果需要较长间隔物,则可将3’间隔物3纳入一次或多次连续添加中。
如本文所用,术语“所关注细胞”是指含有将使用本文所述ChIP-seq方法进行测序的DNA的细胞。
如本文所用,术语“增量细胞”是指在ChIP-seq测定期间将细胞(例如酵母或大肠杆菌细胞)加入所关注细胞。特定而言,在ChIP测定中超声处理和染色质断裂之前,将增量细胞加入所关注细胞。
如本文所用,术语“特异性结合DNA的药剂”是指结合所关注DNA的任何生物学或化学部分。特定而言,如本文所用,所关注DNA为使用本文公开的ChIP-seq方法进行测序的DNA。
如本文所用,术语“分析物生物样本”和“所关注DNA”是指经受研究的DNA。换句话说,所述术语是指针对表观遗传修饰、表观遗传标记和DNA测序进行分析的DNA。
如本文所用,术语“染色质免疫沉淀法”和“ChIP”一般指包括以下步骤的方法:(1)从细胞中分离待分析的染色质;(2)使用抗体对染色质进行免疫沉淀法;以及(3)DNA分析。
如本文所用,术语“染色质”是指染色体的物质,并且在真核细胞中由DNA和蛋白质(主要是组蛋白)的复合物组成,并且是基因在遗传上的载体。染色质一般以具有不同着色性质的两种状态存在,即常染色质和异染色质,并且在细胞***期间,染色质盘绕并折叠而形成中期染色体。
如本文所用,术语“载体DNA”是指被添加以充当增量剂的DNA。
发明详述
引言
在纯细胞群中执行转录因子结合和表观遗传修饰的全基因组定位的能力在基础性和转化性研究中是关键性的。然而,因为染色质免疫沉淀法(ChIP)继以大规模平行测序(ChIP-seq)需要多步骤操作,所以大规模DNA损失使得不可能使用小数量细胞来执行ChIP-seq。目前,可靠的ChIP-seq实验需要大约50ng的自ChIP回收的DNA,这一般需要至少106个细胞。因此,尚不可能使用有限数量的细胞(例如,来自胚胎的细胞、来自活检的细胞、或来自眼晶体的细胞)获得用于基础研究和临床研究的可靠的全基因组转录因子/染色质蛋白结合或表观遗传信息。
已研发两种最新方法来克服与ChIP有关的对表观遗传修饰进行基因组定位的困难。这两种方法依靠优化ChIP和改良DNA扩增程序来产生用于测序的足够量的DNA。所述方法中的第一个方法据报道有能力执行10,000-20,000的ChIP-seq(Adli等人)。然而,Adli等人进行的应用有限,因为其需要几万个细胞并且因过度DNA扩增而引入了偏向性。第二个方法旨在通过使用基于T7RNA聚合酶的线性DNA扩增(称为LinDA)来减少DNA扩增中的偏向性(Shankarananarayanan,2011及2012)。虽然LinDA方法报道了对来自少至5,000个细胞的位点的全面定位,但结果是不一致的。此外,5,000个细胞的所报道下限对ChIP-seq而言仍过大,该ChIP-seq是在一个至几千个细胞范围内,例如20至100个细胞。
当存在有限数量的细胞(例如,一个至几千个细胞)时存在的防碍使用ChIP-seq的主要问题之一为在DNA剪切和随后ChIP步骤期间的DNA损失。如果DNA在任何步骤永久损失,则即使更佳的无偏向DNA扩增也不可用。因此,需要发展出一套技术,从而允许从ChIP中进行有效DNA回收以允许在小数量的细胞中进行有效的基因组测序。
染色质免疫沉淀(ChIP)
ChIP的原理基础在于,在活细胞内封装DNA的DNA-蛋白质复合物(即,染色质)可以经制备而保持表征各个活细胞的特异性的DNA-蛋白质互相作用。这些染色质(即,蛋白质-DNA复合物)片段随后可使用针对所讨论蛋白质的抗体来进行免疫沉淀。分离的染色质部分可随后进行处理以分离DNA和蛋白质组分,并且可随后通过聚合酶链式反应(PCR)或用于鉴别所定义序列的DNA片段的其他技术,确定结合具体蛋白质来分离的DNA片段(即,用于免疫沉淀法的抗体所针对的所述蛋白质)的同一性。
ChIP一般涉及以下三个关键步骤:--(i)从细胞中分离待分析的染色质;(ii)使用抗体对染色质进行免疫沉淀法;以及(iii)DNA分析。虽然熟练技术人员将了解存在各种用于执行ChIP的方法,但以下实例是ChIP所基于的标准原理的总体概述。
ChIP一般包括从细胞的生物样本中分离染色质的步骤。一旦采集到细胞,则提取其细胞核。在细胞核释放之后,将所述细胞核消化以便释放染色质。在其中所述方法包括使用NChIP(如下所述)的实施方案中,通过标准程序对细胞核进行核酸酶消化,分离出染色质。例如,可在消化时添加微球菌核酸酶。在其中所述方法包括使用XChIP(如下所述)的实施方案中,将染色质交联。例如,可通过添加诸如甲醛的合适交联剂来使染色质交联。此后,使染色质断裂。可通过超声处理来进行断裂。然而,可在断裂之后添加甲醛,然后继以核酸酶消化。或者,UV辐射可用作替代***联技术。
在断裂和交联之后,使蛋白质固定在染色质上,并且可对蛋白质-DNA复合物进行免疫沉淀。因此,一旦染色质已分离,则该方法包括使染色质免疫沉淀的步骤。用于免疫沉淀法步骤的合适技术也将是熟练技术人员已知的,并且实施例描述一种可如何实现此举的方法。可在添加针对所讨论蛋白质的合适抗体之后,进行免疫沉淀法。应可理解的是,合适抗体将取决于何种类型的表观遗传分析正在进行(即,正在受分析的基因表达)。
表观遗传分析是研究往往导致基因表达或沉默的细胞DNA的各种改变(称为表观遗传标志)。应该了解,根据本发明的方法可用于在任何所关注细胞类型的基因组的任何基因或区域上分析任何类别的表观遗传性修饰。样本中的DNA修饰可导致的表观遗传标志的实例包括组蛋白蛋白质修饰、非组蛋白蛋白质修饰和DNA甲基化。
因此,举例而言,用于免疫沉淀法步骤的抗体可能对诸如转录因子的非组蛋白蛋白质、或其他DNA结合蛋白是免疫特异性的。或者,举例而言,该抗体可能对组蛋白H1、H2A、H2B、H3和H4中的任一者以及它们的各种翻译后修饰同种型和变体(例如H2AZ)是免疫特异性的。或者,举例而言,该抗体可能对涉及染色质修饰的酶是免疫特异性的,所述酶诸如为组蛋白乙酰基转移酶或脱乙酰基酶、或DNA甲基移换酶。此外,组蛋白可通过所定义的酶,通过诸如乙酰化、甲基化、磷酸化、ADP核糖化、SUMO化修饰和泛素化,而在活体内被翻译后修饰。因此,该抗体可能对这些翻译后修饰中的任一者皆为免疫特异性的。
在免疫沉淀法步骤之后,该方法一般包括使来自分离蛋白/DNA部分的DNA纯化的步骤。此举可诸如通过苯酚-氯仿提取的标准技术或通过本领域技术人员已知的任何其他纯化法来实现。
在纯化步骤之后,通过PCR来分析结合蛋白质所分离的DNA片段。例如,该分析步骤可包括使用合适引物,所述引物在PCR期间将导致一段核酸的扩增。熟练技术人员将了解,根据本发明的方法可被用于在特异性PCR引物制备所针对的基因组的任何基因或任何区域上分析表观遗传性修饰。
ChIP技术具有两种主要变型,这些变型主要在起始(输入)染色质如何制备方面有所不同。第一变型(称为NChIP)使用通过标准程序对细胞核进行微球菌核酸酶消化所制备的天然染色质。然而,NChIP不可用于分析非组蛋白蛋白质,因为选择性核酸酶消化可能偏向输入染色质,并且核小体在消化期间可能重排。
第二变型(称为XChIP)使用通过在断裂染色质(例如,通过超声处理进行断裂)之前添加甲醛以使细胞生长来进行了交联的染色质。作为甲醛的替代形式,已成功使用UV辐射作为替代***联技术。然而,XChIP常常低效,并且可能产生错误结果。例如,XChIP交联可能固定(并进而扩大)蛋白质和基因组DNA之间的瞬态互相作用。此外,在XChIP中,抗体特异性可能因其所识别的蛋白质中的化学变化(由交联程序所引发)而受到损害。
此外,NChIP和XChIP的主要问题在于,它们两者皆需要至少106个细胞才能够产生足够数量的染色质以用于技术操作(NatureGenetics,2005,37,1194-1200)。如此大量的细胞可用培养细胞来实现,但采用来自低数量细胞源,例如具有包含少于60个细胞(人类)或20个细胞(小鼠)的典型ICM的早期胚胎,是不可能实现的。对于这一关键原因,ChIP和ChIP-seq限于大细胞群体的样本,进而妨碍对尚未培养或永生化的初级细胞的广泛表观遗传分析。因此,因为表观遗传改变响应于环境影响而发生,所以不可能使用培养细胞(活体外)来研究在活体内驱动分化和细胞改变的表观遗传机制。真实理解细胞在有机体内其自然状态时的表观遗传性状态的唯一方式是研究从有机体中直接提取(活检)的细胞,并且使细胞不暴露于体外培养中的人工条件(即,在体外培养中使小数量的初级细胞繁殖到至少106个细胞),所述人工条件可能导致表观遗传性修饰。
在ChIP期间,存在DNA损失的三个主要来源:超声处理、免疫沉淀法和从小珠上洗提ChIPDNA。为保护所关注DNA以免损失,重要的是添加载体DNA,所述载体DNA可通过ChIP的连续步骤与所关注DNA一起受到处理。
在某些实施方案中,本文所述的本发明包括一种添加生物素化的方法,所述载体DNA在ChIP期间用所关注DNA进行处理以防止所关注DNA损失。如本文所用,防止所关注DNA损失和增加所关注DNA回收的方法称为“经由保护来回收”或“RePro”或“ReProChIP-Seq”。图1中提供RePro的图式。
可通过将来自具有小数量所关注细胞的不同物种的大数量交联细胞混合,而执行RePro。在某些实施方案中,来自不同物种的细胞是哺乳动物细胞(例如人类细胞、小鼠细胞、大鼠细胞、仓鼠细胞、猫科动物细胞、犬科动物细胞和灵长类动物细胞)、昆虫细胞(例如果蝇细胞)、细菌细胞(例如大肠杆菌细胞)、或酵母细胞(例如啤酒酵母)(图2)。
在特定实施方案中,在果蝇、小鼠、或人类细胞的RePro中可将大肠杆菌细胞用作来自不同物种的细胞。在特定实施方案中,在果蝇、小鼠、或人类细胞的RePro中可将啤酒酵母细胞用作来自不同物种的细胞。
在一个特定实施方案中,使用酵母细胞来对组蛋白H3赖氨酸4甲基化或赖氨酸9甲基化(分别为H3K4me或H3K9me)进行表观遗传分析,因为可使用相同抗体来对在酵母、果蝇、小鼠和人类中显示这些表观遗传修饰组蛋白标志的染色质进行ChIP。
分析物生物样本
在某些实施方案中,本文所述方法包括使用少于一百万个细胞、少于900,000个细胞、少于800,000个细胞、少于700,000个细胞、少于600,000个细胞、少于500,000个细胞、少于400,000个细胞、少于300,000个细胞、少于200,000个细胞、少于90,000个细胞、少于80,000个细胞、少于70,000个细胞、少于60,000个细胞、少于50,000个细胞、少于40,000个细胞、少于30,000个细胞、少于20,000个细胞、或少于10,000个细胞作为分析物生物样本来进行ChIP-seq。
在某些实施方案中,本文所述方法包括使用约20,000个细胞、约19,000个细胞、约18,000个细胞、约17,000个细胞、约16,000个细胞、约15,000个细胞、约14,000个细胞、约13,000个细胞、约12,000个细胞、约11,000个细胞、约10,000个细胞、约9,500个细胞、约9,000个细胞、约8,500个细胞、约7,500个细胞、约7,000个细胞、约6,500个细胞、约6,000个细胞、约5,500个细胞、约5,000个细胞、约4,500个细胞、约4,000个细胞、约3,500个细胞、约3,000个细胞、约2,500个细胞、约2,000个细胞、约1,900个细胞、约1,800个细胞、约1,700个细胞、约1,600个细胞、约1,500个细胞、约1,400个细胞、约1,300个细胞、约1,200个细胞、约1,100个细胞、约1,000个细胞、约950个细胞、约900个细胞、约850个细胞、约800个细胞、约750个细胞、约700个细胞、约650个细胞、约600个细胞、约550个细胞、约500个细胞、约450个细胞、约400个细胞、约350个细胞、约300个细胞、约250个细胞、约200个细胞、约150个细胞、约100个细胞、约90个细胞、约80个细胞、约70个细胞、约60个细胞、约50个细胞、约40个细胞、约35个细胞、约30个细胞、约25个细胞、约20个细胞、约15个细胞、约10个细胞、9个细胞、8个细胞、7个细胞、6个细胞、5个细胞、4个细胞、3个细胞、2个细胞、或1个细胞作为分析物生物样本来进行ChIP-seq。
在本发明的某些实施方案中,该方法包括在作为分析物生物样本的少于5,000个细胞、少于1,000个细胞、少于500个细胞、少于100个细胞、少于75个细胞、少于50个细胞、或少于25个细胞上进行ChIP。
此外,据估计,一个细胞在染色质中含有每个细胞约6×103ng的DNA以及等量的DNA和蛋白质。因此,根据本发明的方法包括在少至6×103ngDNA、或约12×103ng染色质(等于1个细胞中DNA或染色质的质量)上进行ChIP。
根据上文所述,ChIP目前在表观遗传分析中的使用需要至少一百万个细胞的最少量并且通常更多,进而将其实验性或诊断性使用局限于培养细胞模型或局限于仅大数量细胞(即,至少一百万细胞)可用的情形。因此,本文所述方法提供了使用小数量细胞(少至20个细胞或甚至少至1个细胞)的意外的ChIP-seq结果。
经由保护来回收(RePro)
RePro是一种ChIP-seq方法,其中添加载体DNA作为增量剂,以在小数量细胞的ChIP-seq期间减少DNA损失。载体DNA是一种低聚物,其长度约200个碱基对至300个碱基对(“DNA1”)并且被5’生物素化(图3A和图4)。在一个实施方案中,在DNA1序列和来自所关注细胞的DNA中不存在重叠。
DNA1与所关注细胞混合以用于硫酸氢盐转换或基因组DNA分离。
对于ChIP,在将染色质断裂之后,添加DNA1。所关注染色质和DNA1两者皆可随后使用偶联至药剂的小珠来沉淀,所述药剂识别位于染色质、DNA、或结合至染色质的特异性蛋白质上的特定修饰。例如,所述小珠可轭合至与染色质、DNA、或结合至染色质的特异性蛋白质上的特异性修饰特异性结合的抗体。
在一个实施方案中,可使用抗生蛋白链菌素小珠来分离生物素化DNA1。
在另一实施方案中,代替所述抗生蛋白链菌素小珠或与所述抗生蛋白链菌素小珠一同,添加阻断引物。阻断引物由与DNA1末端互补的DNA序列组成。该阻断引物通过退火至DNA1来防止DNA1的PCR扩增。
在另一实施方案中,DNA1可结合至抗生蛋白链菌素,该抗生蛋白链菌素在加入细胞之前被偶联至未免疫抗体。随后,可将相同蛋白质A或二级抗体偶联小珠用于对所关注染色质以及DNA1两者进行免疫沉淀。
在替代性实施方案中,可在PCR之前,从混合物中提取DNA1。
在添加阻断引物之后,可使用本领域技术人员已知的传统和第二代测序方法,将所述DNA扩增。
因为DNA1的序列是已知的,所以在测序后可将剩余的DNA1(以及在PCR期间作为背景扩增的任何DNA1)减去,以便使用本领域技术人员已知的软件来提供干净的所关注DNA读数。
经由保护和有利扩增来回收(RePam)
RePam是一种ChIP-seq方法,其中添加载体DNA作为增量剂,以在小数量细胞的ChIP-seq期间减少DNA损失。载体DNA是一种低聚物,其长度约200个碱基对至300个碱基对并且被5’生物素化,含有5’悬突,并且在两端皆含有3’间隔物3修饰(“DNA2”)(图3B和图5和图10)。5’悬突和3’间隔物3修饰在PCR期间防止DNA2的扩增。在一个实施方案中,在DNA2序列和来自所关注细胞的DNA中不存在重叠。
DNA2与所关注细胞混合以用于硫酸氢盐转换或基因组DNA分离。
对于ChIP,在将染色质断裂之后,添加DNA2。所关注染色质和DNA2两者皆可随后使用偶联至药剂的小珠来沉淀,所述药剂识别位于染色质、DNA、或结合至染色质的特异性蛋白质上的特定修饰。例如,所述小珠可轭合至与染色质、DNA、或结合至染色质的特异性蛋白质上的特异性修饰特异性结合的抗体。
在一个实施方案中,可使用抗生蛋白链菌素小珠来分离生物素化DNA1。
在另一实施方案中,DNA2可结合至抗生蛋白链菌素,该抗生蛋白链菌素在加入细胞之前被偶联至未免疫抗体。随后,可将相同蛋白质A或二级抗体偶联小珠用于对所关注染色质以及DNA2两者进行免疫沉淀。
对于RePam,与RePro不同,因为将DNA2设计成防止扩增,所以不需要阻断引物。因此,可使用本领域技术人员已知的传统和第二代测序方法来使DNA扩增,而无需提取DNA2或阻断DNA2。
因为DNA2的序列是已知的,所以在测序后可将剩余的DNA2(以及在PCR期间作为背景扩增的任何DNA2)减去,以便使用本领域技术人员已知的软件来提供干净的所关注DNA读数。
使用来自不同有机体的载体DNA进行ChIP-seq
可通过使用来自不同有机体的载体DNA来优化用于小数量细胞的ChIP-seq。使用这一方法,添加载体DNA作为增量剂,以在小数量细胞的ChIP-seq期间减少DNA损失。
采用这种方法,将所关注细胞与不同物种的细胞混合。在某些实施方案中,不同物种的细胞是酵母或大肠杆菌细胞。在某些实施方案中,所关注细胞是小鼠或人类细胞。因为将细胞超声处理并且将DNA断裂,所以所关注DNA与不同细胞的DNA混合。特定而言,不同细胞的DNA充当增量剂,以防止所关注DNA损失并且增加所关注DNA的产率。
因为采用RePro和RePam,所以所关注DNA可用PCR来扩增,以评估所关注DNA的表观遗传性状态。
RNA读数的精确归一化
如上针对DNA测序所述,存在着低RNA产率和不能执行转录物的大规模平行测序(RNA-seq)的类似问题。最近的研究(Islam等人2011;Hashimshony等人,2012)已经表明,有可能使用单个细胞来执行RNA-seq。然而,目前的方法仍在样本制备期间遭受低丰度转录物的损失。在文库预备期间的此类转录物损失不能通过增加测序深度来弥补。
RNA-seq在转录组分析中的另一严重限制为数据归一化。现存方法使各个RNA读出数针对转录物读数的总数或中间数进行归一化,此举假定在不同样本中的总转录水平是相同的。然而,如果全面转录水平在不同样本中有所不同,则该归一化将产生对转录改变的错误鉴别。或者,已将已知量的外原性RNA加入RNA-seq样本来允许归一化(Baker等人,2005;Lovén,等人,2012),但该方法需要精确测定各个样本中的细胞数量,即使有可能,这也在仅使用少量细胞时变得极具挑战。另外,处于不同细胞周期阶段的细胞具有不同的基因组DNA含量,所述不同基因组DNA含量将导致不同的转录水平。因此,这种已知方法不适合于在具有显著细胞周期阶段差异的样本之间比较转录水平。因此,需要更简单和更稳健的用于归一化的方法。
本文所述方法可用于实现精确的RNA读数归一化(图7和图8),并且还保护样本RNA免受损失。特定而言,将类同于RePro和RePam中的载体DNA的保护剂与所关注细胞混合。该保护试剂为RNA1。为归一化该样本DNA,将已知序列和数量的DNA加入该样本。为归一化该样本RNA,将已知序列和数量的RNA2加入该样本。RNA1和RNA2两者皆用具有已知但不同序列以及具有多聚腺苷酸尾部的RNA来活体外转录。
将DNA和RNA从混合物中分离。含有对照DNA和来自所关注细胞的基因组DNA的DNA混合物经受标准基因组DNA文库构建和测序。为了从分离的RNA构建测序文库,添加阻断引物到阻断RNA1的扩增。该阻断引物的目的在于阻断RNA1的扩增。
一旦用该阻断引物阻断了该RNA1,则可开始扩增。在数据处理步骤期间,计算来自对照DNA和对照RNA-2的读数,并且通过软件来去除来自保护性RNA-1的污染性读数。将归一化的RNA读数(总细胞RNA读数/对照RNA-2读数之比)除以归一化的DNA读数(基因组DNA读数/对照DNA读数之比)。该数字允许将各个转录物读数归一化至基因组DNA水平,而无需计算各个样本中所用的细胞数量。
实施例
实施例1.使用RePro进行DNA回收的效率
为演示使用RePro的DNA回收效率和测序品质,在ReProChIP-seq中使用酵母细胞来与1千万个细胞的标准ChIP-seq进行比较以分析2000个和500个小鼠胚胎干细胞(ESC)中的H3K4me3修饰(图6)。酵母细胞使用甲醛来进行交联,并且与2000或500个交联ESC混合。在超声处理以将DNA断裂至200至300个碱基对之后,使用识别H3K4me3的抗体来利用标准ChIP和文库建立程序对携带所述H3K4me3修饰的酵母和ESC染色质进行ChIP。
通过与1千万个ESC的标准ChIP-seq相比,表明500个或2000个细胞的ReProChIP-seq在200K读数的测序深度下揭露了ESC中大部分的H3K4me3修饰(相关系数,500细胞:R=0.888;2000细胞:R=0.948)。重要的是,将读数深度进一步增加至高达1200K导致H3K4me3修饰DNA的连续增长。
因此,RePro-ChIP策略成功保存了可通过增加测序深度而回收的所关注DNA。
实施例2.作为载体DNA的生物素化寡聚DNA
为进一步拓宽RePro以允许对任何染色质结合蛋白或表观遗传标志进行ChIP,对生物素化寡聚DNA进行测试(图4)。将抗生蛋白链菌素小珠和与特异性ChIP抗体偶联的小珠加入用于免疫沉淀法的寡聚DNA和染色质混合物。为阻断抗生蛋白链菌素小珠对内源性生物素化染色质蛋白质的结合,在使用甲醛对细胞进行交联并且进行透性化之后,立即使用抗生蛋白链菌素来阻断所关注细胞中的这些蛋白质上的生物素。随后阻断过量抗生蛋白链菌素。在将生物素化寡聚DNA加入这些细胞之后,处理所述细胞以用于超声处理、免疫沉淀法和DNA回收。
为测试上述方法的实用性,在来自年轻和老年小鼠中执行对H3K4me3修饰的ReProChIP-seq分析(图8和图9)。已知晶状体上皮细胞的改变有助于白内障。定位与这些细胞中的老化相关的表观遗传改变的能力应该提供对白内障形成原因的理解。通过对从一个老年晶状体和一个年轻晶状体分离的晶状体上皮细胞进行RePro-ChIP-seq,表明与年轻细胞相比,在老年晶状体上皮细胞中的具有H3K4me3的约200个基因变得上调或下调。重要的是,这些基因中的许多基因涉及在晶状体上皮细胞退化和白内障形成中发现的生物进程。这些路径包括涉及调控细胞程序死亡、电解质体内稳态和细胞周期的基因。
有趣的是,已经用与人类群体的白内障倾向相关的SNP在GWAS(全基因组关联研究)进行的分析中发现这些基因中两个基因。已表明,通过将GWAS与EWAS(表观遗传全基因组关联研究)组合,也许有可能以显著增加的精确度和效率来鉴别致病/诊断基因和基因表达改变。因为精确EWAS需要受极小细胞数量限制的纯细胞群,所以不可能执行组蛋白修饰的EWAS分析。上述实例表明,本文所述方法可有机会在人类疾病基因探索和诊断中执行EWAS。
实施例3.模拟以确定用于最佳ChIP-seq的细胞数量下限
执行模拟ChIP-seq读取以确定提供最佳测序结果所需的细胞数量下限(图12)。
根据107细胞H3K4me3ChIP-seq数据(Jia2012),用二项分布从基因组中取样模拟ChIP-seq读数。假定对处于基因组中的最高H3K4me3峰之中的Oct4基因H3K4me3峰进行了完全ChIP,并且从特异性基因组位置产生读数的概率与该位置的ChIPseq标签密度以及细胞数量成正比。
假定仅回收10%的输入染色质,因此在最终文库中保存了10%的ChIP读数。
随后,对于不同细胞数量的各个测试组,使用MACS在变量p值阈中调用峰。如先前通过与另一H3K4me3ChIP-seq数据(Mikkelsen2007)所述,定义精确度和检索率。图12以80%或更高精确度绘制不同数量细胞的检索率。基于该模拟,如果细胞中的染色质回收率可达到输入的10%,则用于RePro和RePam-ChIP-seq的细胞的最低数量的理论极限为20个。
实施例4.比较ReproH3K4me3数据与Nano-ChIP-seq和LinDA
如本文所述,存在两种宣称能够在小数量细胞中执行ChIP-seq的现存ChIP-seq方法。所述方法称为Nano-ChIP-seq和LinDA-ChIP-seq。执行对来自Nano-ChIP-seq和LinDA-seq的数据的分析,并且将结果与本文所述RePro方法进行比较(图13)。
Nano-ChIP-seq方法仅允许10,000个细胞的ChIP测序。使用1,000个细胞由LinDA方法获得的数据不太稳健,并不能用于获得任何有用信息。因此,LinDA方法也使用通过分析10,000个细胞获得的数据。
由ENCODE计划(Landt2012)采用的可接受复制品的一个标准为从一个复制品中鉴别出的前40%的目标峰中的至少80%应该与另一复制品的目标峰重叠。该标准用于测试ReproH3K4me3数据是否可被接受来作为在1千万个细胞上使用的前述H3K4me3ChIP-seq数据的复制品(Mikkelsen2007)。“精确度”定义为从ReproH3K4me3数据中鉴别出的与前述H3K4me3峰重叠的前40%峰的百分比,并且“检索率”定义为从前述H3K4me3数据中鉴别出的与ReproH3K4me3峰重叠的前40%峰的百分比。采用500个细胞,ReproH3K4me3ChIP-seq数据达到98.2%精确度和93.7%检索率,并且仅用2000个细胞就达到100%的精确度和检索率(图13)。这些结果表明,RePro方法可用微小量的原材料来可靠地回收ChIP-seq峰。相反,采用10,000个细胞的H3K4me3的Nano-ChIP-seq数据仅可分别达到70%和70%的精确度和检索率水平,这未满足80%/80%标准。这可能是由于在通过大于30个PCR循环所引入的数据中存在高度偏向性。因此,该方法不适合于在10,000个细胞中进行ChIP测序。
通过将用于研究的参考数据组进行比较,为LinDA-ChIP-seq实施类似测试。虽然在一个使用10,000个细胞进行H3K4me3ChIP-seq的实验中,LinDA可具有超过80%的精确度和检索率,但其另一复制品却分别给出低于60%精确度水平和60%检索率水平的较差结果,从而表明该方法不稳定并且不可用,这可能归咎于涉及将DNA转录成RNA和将RNA反转录回成DNA的复杂且耗时的程序。此外,1,000个细胞H3K4me3ChIP-seq数据和5,000个细胞Erα(转录因子)数据的较差品质表明LinDA不能够从少于10,000细胞中产生有益ChIP-seq数据。
尽管为了清楚理解的目的,已经通过举例说明和实施例相当详细地描述了前述发明,但是在本发明的教导下本领域的技术人员将显而易见的是,在不背离随附权利要求的精神和范围的情况下可对本发明进行某些改变和修改。

Claims (57)

1.一种对来自细胞的样本的基因组DNA进行测序的方法,所述方法包括:
a.对细胞的所述样本中的染色质进行断裂,
b.将载体DNA加入细胞的所述样本的所述断裂染色质中,其中所述载体DNA是5’生物素化DNA(“DNA1”),
c.使载体DNA和断裂染色质的混合物沉淀,
d.使与所述DNA1互补的阻断引物退火,
e.使来自细胞的所述样本的所述基因组DNA扩增,以及
f.对所述扩增DNA进行测序;
其中细胞的所述样本包括1个至20,000个细胞,以及
其中所述阻断引物防止所述DNA1扩增。
2.如权利要求1所述的方法,其中细胞的所述样本为哺乳动物细胞。
3.如权利要求2所述的方法,其中所述哺乳动物细胞是人类或小鼠细胞。
4.如权利要求1至3中任一项所述的方法,其中细胞的所述样本为初级细胞。
5.如权利要求1至4中任一项所述的方法,其中将已测序DNA用于测定细胞的所述样本的表观遗传标记。
6.如权利要求1至5中任一项所述的方法,其中细胞的所述样本包括1个细胞。
7.如权利要求1至5中任一项所述的方法,其中细胞的所述样本包括约20个细胞。
8.如权利要求1至5中任一项所述的方法,其中细胞的所述样本包括约50个细胞。
9.如权利要求1至5中任一项所述的方法,其中细胞的所述样本包括约100个细胞。
10.如权利要求1至5中任一项所述的方法,其中细胞的所述样本包括约1000个细胞。
11.如权利要求1至10中任一项所述的方法,其中细胞的所述样本为癌细胞的样本。
12.如权利要求1至10中任一项所述的方法,其中细胞的所述样本为晶状体上皮细胞的样本。
13.如权利要求1至12中任一项所述的方法,其中所述DNA1的长度在200个碱基对与300个碱基对之间。
14.如权利要求1至13中任一项所述的方法,其中所述DNA1与来自细胞的所述样本的所述DNA不互补。
15.如权利要求1至14中任一项所述的方法,其中DNA1与断裂染色质的所述混合物用小珠进行沉淀。
16.如权利要求15所述的方法,其中所述小珠轭合至抗体。
17.如权利要求16所述的方法,其中所述抗体旨在对所述染色质或结合至所述染色质的蛋白质进行修饰。
18.如权利要求15所述的方法,其中所述小珠轭合至与来自细胞的所述样本的所述DNA特异性结合的药剂。
19.如权利要求18所述的方法,其中所述药剂为与来自细胞的所述样本的所述DNA的一部分互补的DNA链。
20.一种对来自细胞的样本的基因组DNA进行测序的方法,所述方法包括:
a.对细胞的所述样本的染色质进行断裂,
b.将载体DNA加入细胞的所述样本的所述断裂染色质中,其中所述载体DNA被5’悬突和3’间隔物3修饰进行5’生物素化(“DNA2”),
c.使载体DNA和断裂染色质的混合物沉淀,
d.使来自细胞的所述样本的所述基因组DNA扩增,以及
e.对所述扩增DNA进行测序;
其中细胞的所述样本包括1个至20,000个细胞。
21.如权利要求20所述的方法,其中细胞的所述样本为哺乳动物细胞。
22.如权利要求21所述的方法,其中所述哺乳动物细胞是人类或小鼠细胞。
23.如权利要求20至22中任一项所述的方法,其中细胞的所述样本为初级细胞。
24.如权利要求20至23中任一项所述的方法,其中将已测序DNA用于测定细胞的所述样本的表观遗传标记。
25.如权利要求20至24中任一项所述的方法,其中细胞的所述样本包括1个细胞。
26.如权利要求20至24中任一项所述的方法,其中细胞的所述样本包括20个细胞。
27.如权利要求20至24中任一项所述的方法,其中细胞的所述样本包括50个细胞。
28.如权利要求20至24中任一项所述的方法,其中细胞的所述样本包括100个细胞。
29.如权利要求20至24中任一项所述的方法,其中细胞的所述样本包括1000个细胞。
30.如权利要求20至29中任一项所述的方法,其中细胞的所述样本为癌细胞的样本。
31.如权利要求20至29中任一项所述的方法,其中细胞的所述样本为晶状体上皮细胞的样本。
32.如权利要求20至31中任一项所述的方法,其中所述DNA2的长度在200个碱基对与300个碱基对之间。
33.如权利要求20至32中任一项所述的方法,其中所述DNA2与来自细胞的所述样本的所述DNA不互补。
34.如权利要求20至33中任一项所述的方法,其中DNA2与断裂染色质的所述混合物用小珠进行沉淀。
35.如权利要求34所述的方法,其中所述小珠轭合至抗体。
36.如权利要求25所述的方法,其中所述抗体旨在对所述染色质或结合至所述染色质的蛋白质进行修饰。
37.如权利要求34所述的方法,其中所述小珠轭合至与来自细胞的所述样本的所述DNA特异性结合的药剂。
38.如权利要求37所述的方法,其中所述药剂为与来自细胞的所述样本的所述DNA互补的DNA链。
39.一种对来自细胞的样本的基因组DNA进行测序的方法,所述方法包括:
a.将所关注细胞的样本与增量细胞的样本组合,
b.使所述所关注细胞和所述增量细胞的染色质断裂,
c.使所述所关注细胞的断裂染色质沉淀,
d.使来自细胞的所述样本的所述基因组DNA扩增,以及
e.对所述扩增DNA进行测序;
其中细胞的所述样本包括1个至20,000个细胞,以及
其中所述增量细胞为酵母细胞或大肠杆菌细胞。
40.如权利要求39所述的方法,其中细胞的所述样本为哺乳动物细胞。
41.如权利要求40所述的方法,其中所述哺乳动物细胞是人类或小鼠细胞。
42.如权利要求39至41中任一项所述的方法,其中细胞的所述样本为初级细胞。
43.如权利要求39至42中任一项所述的方法,其中将已测序DNA用于测定细胞的所述样本的表观遗传标记。
44.如权利要求39至43中任一项所述的方法,其中细胞的所述样本包括1个细胞。
45.如权利要求39至43中任一项所述的方法,其中细胞的所述样本包括20个细胞。
46.如权利要求39至43中任一项所述的方法,其中细胞的所述样本包括50个细胞。
47.如权利要求39至43中任一项所述的方法,其中细胞的所述样本包括100个细胞。
48.如权利要求39至43中任一项所述的方法,其中细胞的所述样本包括1000个细胞。
49.如权利要求39至48中任一项所述的方法,其中细胞的所述样本为癌细胞的样本。
50.如权利要求39至48中任一项所述的方法,其中细胞的所述样本为晶状体细胞的样本。
51.如权利要求39至50中任一项所述的方法,其中所述增量细胞为啤酒酵母。
52.如权利要求39至50中任一项所述的方法,其中所述增量细胞为大肠杆菌。
53.如权利要求39至52中任一项所述的方法,其中所述断裂染色质用小珠进行沉淀。
54.如权利要求53所述的方法,其中所述小珠轭合至抗体。
55.如权利要求54所述的方法,其中所述抗体旨在对所述所关注细胞的所述染色质或结合至所述所关注细胞的所述染色质的蛋白质进行修饰。
56.如权利要求53所述的方法,其中所述小珠轭合至与来自所述所关注细胞的所述DNA特异性结合的药剂。
57.如权利要求56所述的方法,其中所述药剂为与来自所述所关注细胞的所述DNA互补的DNA链。
CN201480028173.2A 2013-03-15 2014-03-14 基因组测序和表观遗传分析的方法 Pending CN105209642A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361790320P 2013-03-15 2013-03-15
US61/790,320 2013-03-15
PCT/US2014/026939 WO2014152091A2 (en) 2013-03-15 2014-03-14 Methods of genome sequencing and epigenetic analysis

Publications (1)

Publication Number Publication Date
CN105209642A true CN105209642A (zh) 2015-12-30

Family

ID=51581675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480028173.2A Pending CN105209642A (zh) 2013-03-15 2014-03-14 基因组测序和表观遗传分析的方法

Country Status (3)

Country Link
US (2) US20160097088A1 (zh)
CN (1) CN105209642A (zh)
WO (2) WO2014152091A2 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105209642A (zh) * 2013-03-15 2015-12-30 ***华盛顿学院 基因组测序和表观遗传分析的方法
US20190345545A1 (en) * 2016-04-06 2019-11-14 Carnegie Institution Of Washington Methods of genome sequencing and epigenetic analysis
US20190203203A1 (en) * 2016-09-02 2019-07-04 Ludwig Institute For Cancer Research Ltd Genome-wide identification of chromatin interactions
US11215622B2 (en) * 2017-01-27 2022-01-04 Covaris, Inc. Generation of cfDNA reference material
CN111755071B (zh) * 2019-03-29 2023-04-21 中国科学技术大学 基于峰聚类的单细胞染色质可及性测序数据分析方法和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001032931A2 (en) * 1999-11-02 2001-05-10 Curagen Corporation Method and compositions for selectively inhibiting amplification of sequences in a population of nucleic acid molecules
US20090197265A1 (en) * 2006-01-26 2009-08-06 The University Of Birmingham , A University Epigenetic analyses
CN102409408A (zh) * 2010-09-21 2012-04-11 深圳华大基因科技有限公司 一种利用微量基因组dna进行全基因组甲基化位点精确检测的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102725419B (zh) * 2009-08-06 2016-08-03 康奈尔大学 用于表观遗传分析的设备和方法
US20130061340A1 (en) * 2011-09-02 2013-03-07 Stem Centrx, Inc. Identification and Enrichment of Cell Subpopulations
KR102252447B1 (ko) * 2011-05-04 2021-05-17 바이오셉트 인코포레이티드 핵산 서열 변이체를 검출하는 방법
LT2944693T (lt) * 2011-08-26 2019-08-26 Gen9, Inc. Kompozicijos ir būdai, skirti nukleorūgščių didelio tikslumo sąrankai
CN105209642A (zh) * 2013-03-15 2015-12-30 ***华盛顿学院 基因组测序和表观遗传分析的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001032931A2 (en) * 1999-11-02 2001-05-10 Curagen Corporation Method and compositions for selectively inhibiting amplification of sequences in a population of nucleic acid molecules
US20090197265A1 (en) * 2006-01-26 2009-08-06 The University Of Birmingham , A University Epigenetic analyses
CN102409408A (zh) * 2010-09-21 2012-04-11 深圳华大基因科技有限公司 一种利用微量基因组dna进行全基因组甲基化位点精确检测的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LEE等: "Mutant Enrichment with 3"Modified Oligonucleotides A Practical PCR Method for Detecting Trace Mutant DNAs", 《THE JOURNAL OF MOLECULAR DIAGNOSTICS》 *
唐华容 等: "一种微小染色质免疫共沉淀方法的建立", 《激光生物学报》 *
李敏俐 等: "染色质免疫沉淀试验中基因组DNA超声破碎条件优化策略", 《生物技术通报》 *
高山 等: "下一代测序中ChIP-seq数据的处理与分析", 《遗传》 *

Also Published As

Publication number Publication date
WO2017048758A1 (en) 2017-03-23
US20160097088A1 (en) 2016-04-07
US20180274007A1 (en) 2018-09-27
WO2014152091A3 (en) 2014-11-27
WO2014152091A2 (en) 2014-09-25

Similar Documents

Publication Publication Date Title
US8574832B2 (en) Methods for preparing sequencing libraries
CN111394426B (zh) 用于个人表观基因组学的至天然染色质的转座
CN107475375A (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
CN105745333A (zh) 用于预测年龄和鉴别诱发或者抑制早衰试剂的方法
CN105543339A (zh) 一种同时完成基因位点、染色体及连锁分析的方法
CN105209642A (zh) 基因组测序和表观遗传分析的方法
CN106148324B (zh) Rna-rna相互作用的分析鉴定方法及其应用
Finn et al. Maternal bias and escape from X chromosome imprinting in the midgestation mouse placenta
CN109563544A (zh) 用于膀胱癌的尿监测的诊断测定
CN107881249A (zh) lncRNA及其靶基因在选育高品质畜禽品种中应用
JP2024088778A (ja) 患者層別化のための液滴単一細胞エピゲノムプロファイリングの使用
Lee et al. Single-cell toolkits opening a new era for cell engineering
CN113564266B (zh) Snp分型遗传标记组合、检测试剂盒及用途
Brant et al. Influence of the Prader-Willi syndrome imprinting center on the DNA methylation landscape in the mouse brain
CN107365840A (zh) 基于dna条形码的鹿科动物快速鉴定试剂盒及其应用
Yin et al. Single cell transcriptome profiling revealed differences in gene expression during oocyte maturation in Haimen white goats
CN114875118B (zh) 确定细胞谱系的方法、试剂盒和装置
WO2019167029A1 (en) Measuring replication-associated dna methylation loss
US20190345545A1 (en) Methods of genome sequencing and epigenetic analysis
KR101884073B1 (ko) 마이크로 rna의 데이터 마이닝을 통한 마이크로 rna id의 분석방법
Khan et al. Functional Genomics–Linking Genotype with Phenotype on Genome-wide Scale
Banerjee et al. Dataset for miRNA expression analysis in the peripheral white blood cells of beef heifers at weaning
EP3730625A1 (en) Use of droplet single cell epigenome profiling for patent stratification
Orozco et al. Epigenome-wide association in adipose tissue from the METSIM cohort identifies novel loci and the involvement of adipocytes and macrophages in diabetes traits
JP2023540553A (ja) 真核生物dna複製起点、及びそれを含むベクター

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151230