CN113490750B - 微量dna甲基化高通量测序方法 - Google Patents
微量dna甲基化高通量测序方法 Download PDFInfo
- Publication number
- CN113490750B CN113490750B CN201980092829.XA CN201980092829A CN113490750B CN 113490750 B CN113490750 B CN 113490750B CN 201980092829 A CN201980092829 A CN 201980092829A CN 113490750 B CN113490750 B CN 113490750B
- Authority
- CN
- China
- Prior art keywords
- double
- stranded dna
- strand
- stranded
- single strand
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012165 high-throughput sequencing Methods 0.000 title abstract description 11
- 230000007067 DNA methylation Effects 0.000 title description 8
- 108020004414 DNA Proteins 0.000 claims abstract description 94
- 102000053602 DNA Human genes 0.000 claims abstract description 62
- 239000012634 fragment Substances 0.000 claims abstract description 42
- 238000011282 treatment Methods 0.000 claims abstract description 28
- 238000012163 sequencing technique Methods 0.000 claims abstract description 25
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 claims abstract description 18
- 108020004682 Single-Stranded DNA Proteins 0.000 claims abstract description 14
- 230000004543 DNA replication Effects 0.000 claims abstract description 7
- 230000004048 modification Effects 0.000 claims description 22
- 238000012986 modification Methods 0.000 claims description 22
- 230000000903 blocking effect Effects 0.000 claims description 20
- 230000000295 complement effect Effects 0.000 claims description 12
- 238000012164 methylation sequencing Methods 0.000 claims description 12
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical group OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 11
- 239000005547 deoxyribonucleotide Substances 0.000 claims description 10
- 239000002773 nucleotide Substances 0.000 claims description 10
- 125000003729 nucleotide group Chemical group 0.000 claims description 10
- 230000026731 phosphorylation Effects 0.000 claims description 10
- 238000006366 phosphorylation reaction Methods 0.000 claims description 10
- 238000002360 preparation method Methods 0.000 claims description 9
- 239000005546 dideoxynucleotide Substances 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 7
- 238000012408 PCR amplification Methods 0.000 claims description 5
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 230000011987 methylation Effects 0.000 abstract description 18
- 238000007069 methylation reaction Methods 0.000 abstract description 18
- 239000000047 product Substances 0.000 description 36
- 239000000243 solution Substances 0.000 description 35
- 238000006243 chemical reaction Methods 0.000 description 16
- 239000000872 buffer Substances 0.000 description 12
- 230000008439 repair process Effects 0.000 description 10
- 238000010276 construction Methods 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 8
- 102000012410 DNA Ligases Human genes 0.000 description 6
- 108010061982 DNA Ligases Proteins 0.000 description 6
- 239000007984 Tris EDTA buffer Substances 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 239000012264 purified product Substances 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 108091029430 CpG site Proteins 0.000 description 2
- 108091092584 GDNA Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000001369 bisulfite sequencing Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 208000007848 Alcoholism Diseases 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- RWQNBRDOKXIBIV-UHFFFAOYSA-N Thymine Natural products CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 201000007930 alcohol dependence Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Natural products NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000012113 quantitative test Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000025366 tissue development Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种微量DNA甲基化高通量测序方法。本发明提供的方法,依次包括如下步骤:(1)将双链DNA片段连接接头1,得到连接产物;接头1由两条单链DNA分子组成,命名为单链1‑1和单链1‑2;连接产物中,双链DNA片段的每条链的3’末端与单链1‑1的5’末端连接,双链DNA片段的每条链的5’末端与单链1‑2的3’末端相邻但不连接;(2)进行亚硫酸盐处理;(3)采用通用引物1进行DNA复制;(4)3’末端连接测序接头。
Description
技术领域
本发明属于生物技术领域,具体涉及一种微量DNA甲基化高通量测序方法。
背景技术
DNA甲基化是一种表观调控修饰,它在不改变碱基序列的情况下,参与调控蛋白质合成的多少。对人类来说,DNA甲基化是一种非常奇妙的化学修饰,亲人的关怀,机体的衰老、抽烟、酗酒甚至肥胖,都会被甲基化如实地记录到基因组上。基因组就像是一个日记本,甲基化作为文字,记录下人体的经历。DNA甲基化是重要的表观遗传学标记信息,获得全基因组范围内所有C位点的甲基化水平数据,对于表观遗传学的时空特异性研究具有重要意义。以新一代高通量测序平台为基础,进行全基因组DNA甲基化水平图谱绘制,特定物种的高精确度甲基化修饰模式的分析,必将在表观基因组学研究中具有里程碑式的意义,并为细胞分化、组织发育等基础机制研究,以及动植物育种、人类健康与疾病研究奠定基础。
全基因组甲基化测序WGBS(Whole Genome Bisulfite Sequencing),即全基因组亚硫酸氢盐测序,是研究生物甲基化的最常用手段,它可以覆盖所有甲基化位点,能够获得更加全面的甲基化图谱。但其在高通量测序中遇到了很多挑战:①亚硫酸氢盐处理会对DNA单链化并造成严重的损伤;②亚硫酸氢盐处理后的未甲基化C碱基会转变成U碱基,整个基因组的GC含量发生极端变化,造成后续扩增产生极大的偏好性;③建库需要微克级别的起始DNA,对于微量DNA很难有很有效的建库方法。
现有的WGBS大致分为两类,一类是Bisulfite处理前建库(Pre-BS),另一类是Bisulfite处理后建库(Post-BS)。Bisulfite处理前建库,在加完测序接头后进行亚硫酸盐处理,其文库在亚硫酸盐的作用下会造成90%的DNA断裂,最后导致文库转化率极低。Bisulfite处理后建库,在亚硫酸盐处理后对处理过后的单链DNA进行文库的制备,分为单链连接法(连接效率低,步骤复杂)和随机引物延伸法(对模板链具有严重的选择偏好性,操作复杂),过多的实验步骤也加重了DNA的丢失。因此发明一个简单、高效的建库方法对于甲基化研究具有重要意义。
发明公开
本发明提供了一种微量DNA甲基化高通量测序方法。
本发明提供了一种制备甲基化测序文库的方法,依次包括如下步骤:
(1)将双链DNA片段连接接头1,得到连接产物;接头1由两条单链DNA分子组成,命名为单链1-1和单链1-2;连接产物中,双链DNA片段的每条链的3’末端与单链1-1的5’末端连接(直接连接),双链DNA片段的每条链的5’末端与单链1-2的3’末端相邻但不连接(形成缺刻,nike);
(2)进行亚硫酸盐处理;
(3)采用通用引物1进行DNA复制;通用引物1的3’端区段与单链1-1反向互补;DNA复制时采用的聚合酶满足如下条件:具有扩增U的能力;
(4)3’末端连接测序接头。
步骤(1)的连接产物依次由如下区段组成:接头1、双链DNA片段、接头1。
步骤(1)的连接产物为具有缺刻的双链DNA分子,缺刻是由于双链DNA片段的每条链的5’末端与单链1-2的3’末端相邻但不连接引起的。
步骤(1)中,所述双链DNA片段的制备方法具体如下:将双链DNA分子进行平末端化以及3’末端加A。所述平末端化的实现方式包括但不限于末端修复。
所述双链DNA分子具体可为如下(a)或(b):
(a)基因组DNA进行打断得到的DNA片段;
(b)cfDNA。
所述双链DNA分子的量可为1-3000ng,更具体可为200-400ng。
所述双链DNA分子的长度可为100-600bp,更具体可为150-300bp。
步骤(1)中,所述双链DNA片段为具有粘末端的双链DNA,该双链DNA的每条链的3’末端均具有一个粘末端A。
步骤(1)中,双链DNA片段中的每条链的5’末端进行阻断修饰。
步骤(1)中,单链1-1和单链1-2反向互补。
步骤(1)中,单链1-1和单链1-2部分反向互补。
步骤(1)中,单链1-2中3’末端进行阻断修饰、其他部分与单链1-1反向互补。
阻断修饰的目的是阻断单链1-2与所述双链DNA片段进行连接。可以采用任意现有技术中的阻断修饰,例如氨基修饰。所述阻断修饰为双脱氧核苷酸。所述阻断修饰为一个双脱氧核苷酸。所述阻断修饰为一个双脱氧核苷酸ddT。
步骤(1)中,接头1为甲基化标签接头。
步骤(1)中,单链1-1的5’末端进行磷酸化修饰。
步骤(1)中,单链1-1中的C均为5-甲基胞嘧啶脱氧核糖核苷酸。
单链1-1具体如序列表的序列1所示。接头1-1中的C均代表5-甲基胞嘧啶脱氧核糖核苷酸。接头1-1的5’末端进行磷酸化修饰。
单链1-2具体如序列表的序列2所示。
步骤(2)中,亚硫酸盐处理包括但不限于亚硫酸氢盐处理或者重亚硫酸盐处理。
步骤(2)中,亚硫酸盐处理也可以为本领域技术人员公知的其它亚硫酸盐处理。
步骤(3)中,聚合酶还满足如下条件:具有3’末端加A活性(用于在双链的DNA产物3’末端加上A)。
步骤(3)中,聚合酶还满足如下条件:具有置换活性(用于打开高GC结构)。
步骤(3)中,通用引物1的3’端区段指的是从3’末端第2位核苷酸开始的上游的10-30个核苷酸。
步骤(3)中,通用引物1可以包含样本标签序列,也可以不包含样本标签序列。
步骤(3)中,通用引物1的3’末端的核苷酸为T。
通用引物1具体如序列表的序列3所示。
步骤(4)中,3’末端连接测序接头中所述连接的实现可以为直接连接也可为间接连接(即通过间隔序列连接)。
直接连接时,所述测序接头可为接头2。接头2由两条单链DNA分子组成,命名为单链2-1和单链2-2。单链2-1的3’末端的核苷酸为T,其他部分与单链2-2反向互补。接头2可以包含样本标签序列,也可以不包含样本标签序列。接头2可以进行单链连接,也可以进行双链连接。单链2-2的5’末端进行磷酸化修饰。单链2-1具体如序列表的序列4所示。单链2-2具体如序列表的序列5所示。
间接连接时,可先采用通用引物进行扩增再连接具有测序接头的与通用引物互补的引物。
步骤(4)的产物,可以用于后续的多样本混合平行测序,也可以用于PCR-free文库构建。
所述方法还可包括如下步骤(5):完成步骤(4)后,采用通用引物进行PCR扩增。步骤(5)用于富集DNA。步骤(5)中,可以通过通用引物添加样本标签。通用引物具体可为通用引物2和通用引物3。通用引物2具体如序列表的序列6所示。通用引物3具体如序列表的序列7所示。
以上任一所述方法在甲基化测序中的应用也属于本发明的保护范围。
本发明还保护一种制备甲基化测序文库的试剂盒,包括组件1、组件2、组件3和组件4;
所述组件1的功能为:给双链DNA片段连接接头1,得到连接产物;所述组件1包括组件1-1和组件1-2;组件1-1为接头1;组件1-2为用于实现所述连接的试剂或试剂组;接头1由两条单链DNA分子组成,命名为单链1-1和单链1-2;连接产物中,双链DNA片段的每条链的3’末端与单链1-1的5’末端连接,双链DNA片段的每条链的5’末端与单链1-2的3’末端相邻但不连接;
所述组件2的功能为:对DNA进行亚硫酸盐处理;
所述组件3的功能为:进行DNA复制;所述组件3包括组件3-1和组件3-2;组件3-1为通用引物1;组件3-2为用于实现所述复制的试剂或试剂组;通用引物1的3’端区段与单链1-1反向互补;组件3-2包括DNA聚合酶;所述DNA聚合酶满足如下条件:具有扩增U的能力;
所述组件4的功能为:给双链DNA的3’末端连接测序接头。
所述双链DNA片段为具有粘末端的双链DNA,该双链DNA的每条链的3’末端均具有一个粘末端A。
组件1的功能中,所述连接产物依次由如下区段组成:接头1、双链DNA片段、接头1。组件1的功能中,所述连接产物为具有缺刻的双链DNA分子,缺刻是由于双链DNA片段的每条链的5’末端与单链1-2的3’末端相邻但不连接引起的。
所述试剂盒还包括组件5;所述组件5的功能为:将双链DNA分子进行平末端化以及3’末端加A。所述平末端化的实现方式包括但不限于末端修复。
所述双链DNA分子具体可为如下(a)或(b):
(a)基因组DNA进行打断得到的DNA片段;
(b)cfDNA。
所述双链DNA分子的长度可为100-600bp,更具体可为150-300bp。
双链DNA片段中的每条链的5’末端进行阻断修饰。
单链1-1和单链1-2反向互补。
单链1-1和单链1-2部分反向互补。
单链1-2中3’末端进行阻断修饰、其他部分与单链1-1反向互补。
阻断修饰的目的是阻断单链1-2与所述双链DNA片段进行连接。可以采用任意现有技术中的阻断修饰,例如氨基修饰。所述阻断修饰为双脱氧核苷酸。所述阻断修饰为一个双脱氧核苷酸。所述阻断修饰为一个双脱氧核苷酸ddT。
接头1为甲基化标签接头。
单链1-1的5’末端进行磷酸化修饰。
单链1-1中的C均为5-甲基胞嘧啶脱氧核糖核苷酸。
单链1-1具体如序列表的序列1所示。接头1-1中的C均代表5-甲基胞嘧啶脱氧核糖核苷酸。接头1-1的5’末端进行磷酸化修饰。
单链1-2具体如序列表的序列2所示。
亚硫酸盐处理包括但不限于亚硫酸氢盐处理或者重亚硫酸盐处理。
亚硫酸盐处理也可以为本领域技术人员公知的其它亚硫酸盐处理。
DNA聚合酶还满足如下条件:具有3’末端加A活性(用于在双链的DNA产物3’末端加上A)。
DNA聚合酶还满足如下条件:具有置换活性(用于打开高GC结构)。
通用引物1的3’端区段指的是从3’末端第2位核苷酸开始的上游的10-30个核苷酸。
通用引物1可以包含样本标签序列,也可以不包含样本标签序列。
通用引物1的3’末端的核苷酸为T。
通用引物1具体如序列表的序列3所示。
组件4的功能中,给双链DNA的3’末端连接测序接头中所述连接的实现为直接连接或间接连接(即通过间隔序列连接)。
直接连接时,所述组件4包括接头2。接头2由两条单链DNA分子组成,命名为单链2-1和单链2-2。单链2-1的3’末端的核苷酸为T,其他部分与单链2-2反向互补。接头2可以包含样本标签序列,也可以不包含样本标签序列。接头2可以进行单链连接,也可以进行双链连接。单链2-2的5’末端进行磷酸化修饰。单链2-1具体如序列表的序列4所示。单链2-2具体如序列表的序列5所示。
间接连接时,所述组件4包括通用引物和接头引物。通用引物用于DNA扩增。接头引物具有测序接头且具有与通用引物互补的区段。
所述试剂盒还包括组件6。所述组件6的功能为:PCR扩增。所述组件6中包括用于PCR扩增的通用引物。所述通用引物中可以具有样本标签,也可以不具有样本标签。通用引物具体可为通用引物2和通用引物3。通用引物2具体如序列表的序列6所示。通用引物3具体如序列表的序列7所示。
以上任一所述试剂盒在甲基化测序中的应用也属于本发明的保护范围。
以上任一所述甲基化测序文库包括但不限于全基因组甲基化测序文库。
本发明的技术方案:小片段DNA(大片段DNA打断后得到的小片段DNA或cfDNA)进行末端修复和加A,然后通过双链连接接头的方式加上单链测序接头1,然后进行亚硫酸盐处理,处理过后,用通用引物以单链测序序列为锚定位点对亚硫酸盐处理过后的DNA进行复制,在得到新生成双链DNA的末端以双链连接的方式加上接头2,得到的产物进行纯化后,可以直接进行高通量测序,也可以通过通用引物对加上接头序列的模板进行后续PCR,完成高通量文库的构建。
附图说明
图1为建库流程示意图。
图2为接头连接方式示意图。
图3为文库产量比较。
图4为下机数据重复率比较。
图5为在不同染色体上CpG位点的甲基化率分布。
实施发明的最佳方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。如无特殊说明,实施例中的DNA分子中,A均代表腺嘌呤脱氧核糖核苷酸,T均代表胸腺嘧啶脱氧核糖核苷酸,C均代表胞嘧啶脱氧核糖核苷酸,G均代表鸟嘌呤脱氧核糖核苷酸。
实施例1、全基因组甲基化测序(WGBS)方法的建立
建库流程见图1,接头连接方式见图2。
一、文库的制备
1、DNA片段化
取基因组DNA(200-400ng),利用covaris-S2打断仪(美国Thermo FisherScientific公司,Covaris S2/S220 System,按照说明书操作)进行片段破碎,然后回收150-300bp之间的DNA片段,重新溶于56μl TE缓冲液中,即为DNA片段溶液。
取λ-DNA(200-400ng)(λ-DNA为外源参照,美国Thermo Fisher Scientific公司,货号SD0011),利用covaris-S2打断仪进行片段破碎,然后回收150-300bp之间的DNA片段,重新溶于56μl TE缓冲液中,即为DNA片段溶液。
2、末端修复和加A
取步骤1得到的DNA片段溶液,按照表1在1.5mL的离心管中配制反应体系。将反应体系置于PCR仪上,进行反应(反应条件:20℃、30分钟,然后65℃、30分钟)。反应完成后,用AMPureXP磁珠进行纯化,然后将纯化产物溶于34μl TE缓冲液,即为产物溶液。
表1
步骤1得到的DNA片段溶液 | 55.5μL |
末端修复缓冲液(10×) | 6.5μL |
末端修复酶体系 | 3.0μL |
总体积 | 65μL |
末端修复酶体系和末端修复缓冲液(10×)为“ UltraTM End Repair/dA-Tailing Module”的组件。/> UltraTM End Repair/dA-Tailing Module:美国NEB公司,货号E7442S;产品网址:https://www.neb.com/products/e7442-nebnext-ultra-end-repair-da-tai ling-module。
3、连接接头1(接头1即甲基化标签接头)
取步骤2得到的产物溶液,按照表2配制反应体系。将反应体系置于20℃的Thermomixer(Eppendorf)上,反应15min。反应完成后,用AMPure磁珠进行纯化,然后将纯化产物溶于22μl TE缓冲液,即为产物溶液。
表2
步骤2得到的产物溶液 | 18μL |
2×Rapid连接缓冲液 | 25μL |
接头1溶液 | 4μL |
T4DNA连接酶 | 3μL |
总体积 | 50μL |
接头1溶液提供的有效成分为接头1。接头1溶液中,接头1的浓度为10μM。
接头1由接头1-1和接头1-2形成。
接头1-1:5’-AGTCGGAGGCCAAGCG-3’;
接头1-2:5’-CGCTTGGCCTCCGACTT-3’。
接头1-1和接头1-2均为单链DNA分子。
接头1-1中的C均代表5-甲基胞嘧啶脱氧核糖核苷酸。接头1-1的5’末端进行磷酸化修饰。
接头1-2中,3’末端的最后一个核苷酸T(下划线标注)为双脱氧核苷酸ddT(目的是作为阻断修饰防止和目标片段进行连接)。
T4 DNA连接酶,为T4 DNA Ligase(Rapid)。2×Rapid连接缓冲液,为2X RapidLigation Buffer(B1010)。T4 DNA Ligase(Rapid):规格600,000U/ml。T4 DNA Ligase(Rapid)和2X Rapid Ligation Buffer(B1010):enzymatic公司,货号L6030-HC-L;产品网址http://www.enzymatics.com/products/t4-dna-ligase-rapid/。
4、亚硫酸盐处理
取步骤3得到的全部产物溶液,采用EZ DNA Methylation-Gold KitTM(ZYMO,货号D5042)并按试剂盒说明操作(目的是将DNA进行亚硫酸氢盐处理),得到18μl产物溶液。
5、DNA复制
取步骤4得到的产物溶液,按照表3配制反应体系,先95℃反应5min,然后降至60℃并加入1μl BST酶,然后60℃反应15分钟,然后75℃反应15分钟,得到产物溶液。
表3
步骤4得到的产物溶液 | 16μL |
10×Bst buffer | 2μL |
通用引物1溶液 | 1μL |
总体积 | 19μL |
通用引物1溶液提供的有效成分为通用引物1。通用引物1溶液中,通用引物1的浓度为10μM。
通用引物1如下:
5’-TGTGAGCCAAGGAGTTGNNNNNNNNNNTTGTCTTCCTAAGACCGCTTGGCCTCCGACTT-3’。
通用引物1中,下划线标注的为区别标识(指的是区分不同样本的标识),N为A、T、C、G任意。
通用引物1为单链DNA分子。
BST酶,为Bst 3.0DNA Polymerase,规格为8000units/ml,New England Biolabs,货号M0374S。10×Bst buffer为BST酶的配套缓冲液。
6、连接接头2(接头2即测序接头)
取步骤5得到的产物溶液,按表4配制反应体系。反应体系置于20℃的Thermomixer(Eppendorf)上,反应15min,然后用AMPureXP磁珠进行纯化,最后将纯化产物溶于22μl TE缓冲液,即为产物溶液。
表4
步骤5得到的产物溶液 | 20μL |
2×Rapid连接缓冲液 | 25μL |
接头2溶液 | 2μL |
T4 DNA连接酶 | 3μL |
总体积 | 50μL |
接头2溶液提供的有效成分为接头2。接头2溶液中,接头2的浓度为10μM。
接头2由接头2-1和接头2-2形成。
接头2-1:5’-GAACGACATGGCTACGATCCGACTT-3’;
接头2-2:5’-AGTCGGATCGTAGCCATGTCGTTC-3’。
接头2-1和接头2-2均为单链DNA分子。
接头2-2的5’末端进行磷酸化修饰。
T4 DNA连接酶,为T4 DNA Ligase(Rapid)。2×Rapid连接缓冲液,为2X RapidLigation Buffer(B1010)。T4 DNA Ligase(Rapid):规格600,000U/ml。T4 DNA Ligase(Rapid)和2X Rapid Ligation Buffer(B1010):enzymatic公司,货号L6030-HC-L;产品网址http://www.enzymatics.com/products/t4-dna-ligase-rapid/。
7、PCR扩增(可选步骤)
取步骤6得到的产物溶液,按照表5配制PCR反应体系。PCR反应条件:94℃ 1min;94℃ 30s、55℃ 30s、72℃ 30s,12个循环;72℃ 5min;12℃保持。反应结束后用AMPure磁珠进行纯化,最后将纯化产物溶于22μl TE缓冲液,即为文库溶液。
表5
步骤6得到的产物溶液 | 20μL |
2×kapa HIFI hot start master mix | 25μL |
通用引物2溶液 | 2.5μL |
通用引物3溶液 | 2.5μL |
总体积 | 50μL |
通用引物2溶液提供的有效成分为通用引物2。通用引物2溶液中,通用引物2的浓度为10μM。
通用引物2为单链DNA分子。
通用引物2(同接头2-1序列):5’-GAACGACATGGCTACGATCCGACTT-3’。
通用引物3溶液提供的有效成分为通用引物3。通用引物3溶液中,通用引物3的浓度为10μM。
通用引物3为单链DNA分子。
通用引物3:5’-TGTGAGCCAAGGAGTTG-3’。
2×kapa HIFI hot start master mix:KAPA BIOSYSTEMS公司,货号KK2602。
二、测序和数据分析
步骤一得到的文库溶液,进行质控,合格的进行高通量测序。
质控:使用Bioanalyzer分析***(Agilent,Santa Clara,USA)检测文库***片段的大小及含量。
高通量测序:测序平台BGIseq-500,测序类型PE100,测序深度30X;测序后数据经过比对后统计各项基本参数,包括下机数据、可用数据、数据利用率、比对率、GC含量和重复率等。
三、以λ-DNA的测序结果为参照,获得基因组DNA的全基因组甲基化测序结果。
实施例2、方法的具体应用示例
采用human genomic gDNA(Promega公司,货号G1521)的基因组DNA。按照实施例1的方法进行全基因组甲基化测序,结果见表6。进行三次重复试验,在表6中分别用优化方法1、优化方法2和优化方法3表示。
采用human genomic gDNA基因组DNA。采用MGIEasy全基因组甲基化文库制备试剂盒(货号1000005251)(按说明书操作)进行文库的制备,然后按照实施例1的步骤二进行测序和数据分析,结果见表6。进行三次重复试验,在表6中分别用常规方法1、常规方法2和常规方法3表示。
通过lanmbdaDNA的结果推算出亚硫酸盐的转化效率。
表6
文库产量比较见图3。常规方法的文库产量为150ng。本发明提供的方法的文库产量为1100ng。相对于常规方法,本发明提供的方法能够大幅度提高文库的产量,极大地提高DNA利用效率。
下机数据重复率比较见图4。常规方法的数据重复率为18.6%。本发明提供的方法的数据重复率为2.8%。相对于常规方法,本发明提供的方法能够极大地提高数据利用效率。
在不同染色体上CpG位点的甲基化率分布见图5。
工业应用
本发明的技术效果:(1)可以极大地提高文库的转化效率,是传统文库建库效率的10倍;(2)相对于单链连接方式的post-BS建库,发明方法的操作步骤简单;相对于随机引物延伸方式的post-BS建库,发明方法偏好性极小;(3)可以完成PCR-free的WGBS的文库制备,该方法得到的文库不经过PCR可直接应用于高通量测序平台进行测序,而其他建库方法需要通过PCR将U碱基转变为T碱基才能进行后面的DNB制备(MGI平台)或者桥式扩增(Illumina平台)。本发明技术方案带来的有益效果:(1)极大地提高了模板的利用效率,提高了文库的转化效率;(2)简单的操作步骤,可以完成PCR-free的文库制备,减少测序过程中的偏好性。产业化前景:甲基化建库试剂盒,临床甲基化检测产品:肿瘤早筛,肿瘤检测诊断等。
Claims (17)
1.一种制备甲基化测序文库的方法,依次包括如下步骤:
(1)将双链DNA片段连接接头1,得到连接产物;接头1由两条单链DNA分子组成,命名为单链1-1和单链1-2;连接产物中,双链DNA片段的每条链的3’末端与单链1-1的5’末端连接,双链DNA片段的每条链的5’末端与单链1-2的3’末端相邻但不连接;
(2)进行亚硫酸盐处理;
(3)采用通用引物1进行DNA复制;通用引物1的3’端区段与单链1-1反向互补;DNA复制时采用的聚合酶满足如下条件:具有扩增U的能力;
(4)3’末端连接测序接头。
2.如权利要求1所述的方法,其特征在于:步骤(1)中的所述双链DNA片段为具有粘末端的双链DNA,该双链DNA的每条链的3’末端均具有一个粘末端A。
3.如权利要求2所述的方法,其特征在于:步骤(1)中的所述双链DNA片段的制备方法如下:将双链DNA分子进行平末端化以及3’末端加A。
4.如权利要求3所述的方法,其特征在于:
所述双链DNA分子为如下(a)或(b):
(a)基因组DNA进行打断得到的DNA片段;
(b)cfDNA。
5.如权利要求1所述的方法,其特征在于:步骤(1)中,双链DNA片段中的每条链的5’末端进行阻断修饰。
6.如权利要求1所述的方法,其特征在于:步骤(1)中,单链1-2中3’末端进行阻断修饰、其他部分与单链1-1反向互补。
7.如权利要求5或6所述的方法,其特征在于:所述阻断修饰为双脱氧核苷酸。
8.如权利要求1所述的方法,其特征在于:步骤(1)中,单链1-1的5’末端进行磷酸化修饰。
9.如权利要求1所述的方法,其特征在于:步骤(1)中,单链1-1中的C均为5-甲基胞嘧啶脱氧核糖核苷酸。
10.如权利要求1所述的方法,其特征在于:步骤(2)中,亚硫酸盐处理为亚硫酸氢盐处理或者重亚硫酸盐处理。
11.如权利要求1所述的方法,其特征在于:步骤(3)中,聚合酶满足如下条件:具有3’末端加A活性。
12.如权利要求1所述的方法,其特征在于:步骤(3)中,聚合酶满足如下条件:具有置换活性。
13.如权利要求1所述的方法,其特征在于:步骤(4)中,3’末端连接测序接头中所述连接的实现为直接连接或间接连接。
14.如权利要求13所述的方法,其特征在于:步骤(4)中,所述连接的实现为直接连接时,所述测序接头为接头2;接头2由两条单链DNA分子组成,命名为单链2-1和单链2-2;单链2-1的3’末端的核苷酸为T,其他部分与单链2-2反向互补。
15.如权利要求14所述的方法,其特征在于:单链2-2的5’末端进行磷酸化修饰。
16.如权利要求1所述的方法,其特征在于:所述方法还包括如下步骤(5):完成步骤(4)后,采用通用引物进行PCR扩增。
17.权利要求1至16中任一所述方法在甲基化测序中的应用。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/087743 WO2020232621A1 (zh) | 2019-05-21 | 2019-05-21 | 微量dna甲基化高通量测序方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113490750A CN113490750A (zh) | 2021-10-08 |
CN113490750B true CN113490750B (zh) | 2024-03-22 |
Family
ID=73459419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980092829.XA Active CN113490750B (zh) | 2019-05-21 | 2019-05-21 | 微量dna甲基化高通量测序方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113490750B (zh) |
WO (1) | WO2020232621A1 (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011017760A1 (en) * | 2009-08-12 | 2011-02-17 | Commonwealth Scientific And Industrial Research Organisation | Detection and analysis of methylation in nucleic acid sequences |
CN103088433A (zh) * | 2011-11-02 | 2013-05-08 | 深圳华大基因科技有限公司 | 全基因组甲基化高通量测序文库的构建方法及其应用 |
CN104651352A (zh) * | 2013-11-15 | 2015-05-27 | 苏州吉玛基因股份有限公司 | 一种用于高通量测序分析dna甲基化状态的文库构建方法 |
CN107937985A (zh) * | 2017-10-25 | 2018-04-20 | 人和未来生物科技(长沙)有限公司 | 一种微量碎片化dna甲基化检测文库的构建方法和检测方法 |
CN109536579A (zh) * | 2018-11-05 | 2019-03-29 | 深圳市艾斯基因科技有限公司 | 单链测序文库的构建方法及其应用 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140228256A1 (en) * | 2012-01-10 | 2014-08-14 | Berry Genomics Co., Ltd. | Method and kit for constructing plasma dna sequencing library |
-
2019
- 2019-05-21 CN CN201980092829.XA patent/CN113490750B/zh active Active
- 2019-05-21 WO PCT/CN2019/087743 patent/WO2020232621A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011017760A1 (en) * | 2009-08-12 | 2011-02-17 | Commonwealth Scientific And Industrial Research Organisation | Detection and analysis of methylation in nucleic acid sequences |
CN103088433A (zh) * | 2011-11-02 | 2013-05-08 | 深圳华大基因科技有限公司 | 全基因组甲基化高通量测序文库的构建方法及其应用 |
CN104651352A (zh) * | 2013-11-15 | 2015-05-27 | 苏州吉玛基因股份有限公司 | 一种用于高通量测序分析dna甲基化状态的文库构建方法 |
CN107937985A (zh) * | 2017-10-25 | 2018-04-20 | 人和未来生物科技(长沙)有限公司 | 一种微量碎片化dna甲基化检测文库的构建方法和检测方法 |
CN109536579A (zh) * | 2018-11-05 | 2019-03-29 | 深圳市艾斯基因科技有限公司 | 单链测序文库的构建方法及其应用 |
Non-Patent Citations (2)
Title |
---|
"Bisulfite sequencing of chromatin immunoprecipitated DNA (BisChIP-seq) directly informs methylation status of histone-modified DNA";Aaron L. Statham等;《Genome Research》;第22卷;第1120-1127页 * |
"Library construction for next-generation sequencing: overviews and challenges";Steven R. Head等;《Biotechniques》;第56卷(第2期);第1-31页 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020232621A1 (zh) | 2020-11-26 |
CN113490750A (zh) | 2021-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6571895B1 (ja) | 核酸プローブ及びゲノム断片検出方法 | |
US9890375B2 (en) | Isolated oligonucleotide and use thereof in nucleic acid sequencing | |
CN105934523B (zh) | 核酸的多重检测 | |
US9745614B2 (en) | Reduced representation bisulfite sequencing with diversity adaptors | |
US8906621B2 (en) | Cross priming amplification of target nucleic acids | |
CN109536579B (zh) | 单链测序文库的构建方法及其应用 | |
CN109576346B (zh) | 高通量测序文库的构建方法及其应用 | |
CN111849965B (zh) | 用于减少偏向性的多核苷酸衔接子设计 | |
US20230056763A1 (en) | Methods of targeted sequencing | |
CN110760936B (zh) | 构建dna甲基化文库的方法及其应用 | |
CN110565174B (zh) | 一种dna文库构建方法 | |
CN113088562A (zh) | 一种新型的低起始量dna甲基化建库方法 | |
CN114096678A (zh) | 多种核酸共标记支持物及其制作方法与应用 | |
US9422551B2 (en) | Adapters for ligation to RNA in an RNA library with reduced bias | |
CN109295500B (zh) | 一种单细胞甲基化测序技术及其应用 | |
US20150099670A1 (en) | Method of preparing post-bisulfite conversion DNA library | |
US11680285B2 (en) | Hooked probe, method for ligating nucleic acid and method for constructing sequencing library | |
CN113490750B (zh) | 微量dna甲基化高通量测序方法 | |
WO2022199242A1 (zh) | 一组条码接头以及中通量多重单细胞代表性dna甲基化建库和测序方法 | |
US20210040540A1 (en) | Parallel liquid-phase hybrid capture method for simultaneously capturing sense and antisense double strands of genomic target region | |
WO2024063036A1 (ja) | ゲノムdnaのメチル化検出法 | |
CN118302538A (zh) | 一种用于检测剪接异构体的靶向高通量测序方法 | |
CN117625763A (zh) | 准确地平行定量变体核酸的高灵敏度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |