JP2023553984A - 二重鎖修復の方法 - Google Patents
二重鎖修復の方法 Download PDFInfo
- Publication number
- JP2023553984A JP2023553984A JP2023535682A JP2023535682A JP2023553984A JP 2023553984 A JP2023553984 A JP 2023553984A JP 2023535682 A JP2023535682 A JP 2023535682A JP 2023535682 A JP2023535682 A JP 2023535682A JP 2023553984 A JP2023553984 A JP 2023553984A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- strand
- dna
- enzymes
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 402
- 230000008439 repair process Effects 0.000 title description 162
- 238000012163 sequencing technique Methods 0.000 claims abstract description 140
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 115
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 112
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 112
- 230000035772 mutation Effects 0.000 claims abstract description 67
- 238000002360 preparation method Methods 0.000 claims abstract description 13
- 102000004190 Enzymes Human genes 0.000 claims description 191
- 108090000790 Enzymes Proteins 0.000 claims description 191
- 108020004414 DNA Proteins 0.000 claims description 149
- 230000000694 effects Effects 0.000 claims description 78
- 239000012634 fragment Substances 0.000 claims description 62
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 59
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 59
- 238000013467 fragmentation Methods 0.000 claims description 54
- 238000006062 fragmentation reaction Methods 0.000 claims description 54
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 52
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 claims description 49
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 claims description 49
- 238000006243 chemical reaction Methods 0.000 claims description 48
- 102000012410 DNA Ligases Human genes 0.000 claims description 44
- 108010061982 DNA Ligases Proteins 0.000 claims description 44
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 claims description 41
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 claims description 41
- 108010036364 Deoxyribonuclease IV (Phage T4-Induced) Proteins 0.000 claims description 37
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 claims description 32
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 31
- 239000000126 substance Substances 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 28
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 claims description 25
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 claims description 25
- 108020001738 DNA Glycosylase Proteins 0.000 claims description 23
- 102000028381 DNA glycosylase Human genes 0.000 claims description 23
- 208000035657 Abasia Diseases 0.000 claims description 22
- 102000003960 Ligases Human genes 0.000 claims description 21
- 108090000364 Ligases Proteins 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 239000003153 chemical reaction reagent Substances 0.000 claims description 19
- 238000006073 displacement reaction Methods 0.000 claims description 19
- HDLHSPLHIYZZER-UHFFFAOYSA-N formamide;pyrimidine Chemical compound NC=O.C1=CN=CN=C1 HDLHSPLHIYZZER-UHFFFAOYSA-N 0.000 claims description 19
- 108060002716 Exonuclease Proteins 0.000 claims description 18
- 108010010677 Phosphodiesterase I Proteins 0.000 claims description 18
- 102000013165 exonuclease Human genes 0.000 claims description 18
- 238000007789 sealing Methods 0.000 claims description 18
- 230000001419 dependent effect Effects 0.000 claims description 17
- 238000003786 synthesis reaction Methods 0.000 claims description 17
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 15
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 15
- 238000011049 filling Methods 0.000 claims description 15
- 229940035893 uracil Drugs 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 14
- 230000002255 enzymatic effect Effects 0.000 claims description 13
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 claims description 11
- 230000001965 increasing effect Effects 0.000 claims description 11
- 108091093078 Pyrimidine dimer Proteins 0.000 claims description 10
- UPUOLJWYFICKJI-UHFFFAOYSA-N cyclobutane;pyrimidine Chemical class C1CCC1.C1=CN=CN=C1 UPUOLJWYFICKJI-UHFFFAOYSA-N 0.000 claims description 10
- 101710149086 Nuclease S1 Proteins 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 9
- 150000003230 pyrimidines Chemical class 0.000 claims description 8
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 6
- 238000005304 joining Methods 0.000 claims description 6
- 230000000865 phosphorylative effect Effects 0.000 claims description 6
- 150000003212 purines Chemical class 0.000 claims description 6
- 230000008836 DNA modification Effects 0.000 claims description 4
- NKKLCOFTJVNYAQ-UHFFFAOYSA-N formamidopyrimidine Chemical compound O=CNC1=CN=CN=C1 NKKLCOFTJVNYAQ-UHFFFAOYSA-N 0.000 claims description 3
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 claims description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 claims description 2
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 claims description 2
- 239000002773 nucleotide Substances 0.000 abstract description 88
- 125000003729 nucleotide group Chemical group 0.000 abstract description 86
- 230000003902 lesion Effects 0.000 abstract description 31
- 230000003321 amplification Effects 0.000 abstract description 8
- 238000003199 nucleic acid amplification method Methods 0.000 abstract description 8
- 239000000523 sample Substances 0.000 description 327
- 102000053602 DNA Human genes 0.000 description 146
- 206010028980 Neoplasm Diseases 0.000 description 70
- 108091034117 Oligonucleotide Proteins 0.000 description 45
- 230000006378 damage Effects 0.000 description 40
- 238000001574 biopsy Methods 0.000 description 36
- 201000011510 cancer Diseases 0.000 description 35
- 239000000047 product Substances 0.000 description 33
- 230000000295 complement effect Effects 0.000 description 31
- 239000002777 nucleoside Substances 0.000 description 31
- 238000007481 next generation sequencing Methods 0.000 description 30
- 238000005251 capillar electrophoresis Methods 0.000 description 27
- 239000000203 mixture Substances 0.000 description 22
- 229920002477 rna polymer Polymers 0.000 description 22
- 125000003835 nucleoside group Chemical group 0.000 description 21
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 19
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 18
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 18
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 18
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 18
- 230000006870 function Effects 0.000 description 18
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 16
- 239000000758 substrate Substances 0.000 description 16
- 230000005778 DNA damage Effects 0.000 description 13
- 231100000277 DNA damage Toxicity 0.000 description 13
- 238000012512 characterization method Methods 0.000 description 13
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 13
- 108010017826 DNA Polymerase I Proteins 0.000 description 12
- 102000004594 DNA Polymerase I Human genes 0.000 description 12
- 108091092584 GDNA Proteins 0.000 description 12
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000011002 quantification Methods 0.000 description 12
- 238000003556 assay Methods 0.000 description 11
- -1 2'-fluororibose Chemical class 0.000 description 10
- 102000016911 Deoxyribonucleases Human genes 0.000 description 10
- 108010053770 Deoxyribonucleases Proteins 0.000 description 10
- 108010006785 Taq Polymerase Proteins 0.000 description 10
- 150000003833 nucleoside derivatives Chemical class 0.000 description 10
- 101710163270 Nuclease Proteins 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 9
- 239000000306 component Substances 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 238000009966 trimming Methods 0.000 description 9
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 8
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 7
- 241000124008 Mammalia Species 0.000 description 7
- 229910019142 PO4 Inorganic materials 0.000 description 7
- 229960005305 adenosine Drugs 0.000 description 7
- 239000011324 bead Substances 0.000 description 7
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 7
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 235000000346 sugar Nutrition 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 6
- 102100031780 Endonuclease Human genes 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 229940104302 cytosine Drugs 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 235000021317 phosphate Nutrition 0.000 description 6
- 238000006116 polymerization reaction Methods 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- 229910021592 Copper(II) chloride Inorganic materials 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 5
- 229930010555 Inosine Natural products 0.000 description 5
- 229960000643 adenine Drugs 0.000 description 5
- ORTQZVOHEJQUHG-UHFFFAOYSA-L copper(II) chloride Chemical compound Cl[Cu]Cl ORTQZVOHEJQUHG-UHFFFAOYSA-L 0.000 description 5
- 230000001351 cycling effect Effects 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000000126 in silico method Methods 0.000 description 5
- 229960003786 inosine Drugs 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000000869 mutational effect Effects 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 5
- 230000037452 priming Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000010008 shearing Methods 0.000 description 5
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 description 4
- 230000006820 DNA synthesis Effects 0.000 description 4
- 208000024875 Infantile dystonia-parkinsonism Diseases 0.000 description 4
- 102000004317 Lyases Human genes 0.000 description 4
- 108090000856 Lyases Proteins 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- 230000033590 base-excision repair Effects 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 230000009615 deamination Effects 0.000 description 4
- 238000006481 deamination reaction Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 210000004602 germ cell Anatomy 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 208000001543 infantile parkinsonism-dystonia Diseases 0.000 description 4
- 238000012417 linear regression Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 3
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 3
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- 206010053487 Exposure to toxic agent Diseases 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 3
- OMOVVBIIQSXZSZ-UHFFFAOYSA-N [6-(4-acetyloxy-5,9a-dimethyl-2,7-dioxo-4,5a,6,9-tetrahydro-3h-pyrano[3,4-b]oxepin-5-yl)-5-formyloxy-3-(furan-3-yl)-3a-methyl-7-methylidene-1a,2,3,4,5,6-hexahydroindeno[1,7a-b]oxiren-4-yl] 2-hydroxy-3-methylpentanoate Chemical compound CC12C(OC(=O)C(O)C(C)CC)C(OC=O)C(C3(C)C(CC(=O)OC4(C)COC(=O)CC43)OC(C)=O)C(=C)C32OC3CC1C=1C=COC=1 OMOVVBIIQSXZSZ-UHFFFAOYSA-N 0.000 description 3
- ASJWEHCPLGMOJE-LJMGSBPFSA-N ac1l3rvh Chemical compound N1C(=O)NC(=O)[C@@]2(C)[C@@]3(C)C(=O)NC(=O)N[C@H]3[C@H]21 ASJWEHCPLGMOJE-LJMGSBPFSA-N 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 3
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 3
- 230000027832 depurination Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000008014 freezing Effects 0.000 description 3
- 238000007710 freezing Methods 0.000 description 3
- 231100000024 genotoxic Toxicity 0.000 description 3
- 230000001738 genotoxic effect Effects 0.000 description 3
- 229940029575 guanosine Drugs 0.000 description 3
- 238000002513 implantation Methods 0.000 description 3
- 230000005865 ionizing radiation Effects 0.000 description 3
- 238000011528 liquid biopsy Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 230000004792 oxidative damage Effects 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 239000013635 pyrimidine dimer Substances 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 239000003642 reactive oxygen metabolite Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 108010068698 spleen exonuclease Proteins 0.000 description 3
- 238000010257 thawing Methods 0.000 description 3
- 229940104230 thymidine Drugs 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 3
- 229940045145 uridine Drugs 0.000 description 3
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- YUXQJAVLCFEZCS-UHFFFAOYSA-N 5-bromo-6-[3-(hydroxymethyl)piperidin-1-yl]-1h-pyrimidine-2,4-dione Chemical compound C1C(CO)CCCN1C1=NC(O)=NC(O)=C1Br YUXQJAVLCFEZCS-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical class OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 102100029995 DNA ligase 1 Human genes 0.000 description 2
- 101710148291 DNA ligase 1 Proteins 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 102000010719 DNA-(Apurinic or Apyrimidinic Site) Lyase Human genes 0.000 description 2
- 108010063362 DNA-(Apurinic or Apyrimidinic Site) Lyase Proteins 0.000 description 2
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 229930182474 N-glycoside Natural products 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 208000007660 Residual Neoplasm Diseases 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 241000589500 Thermus aquaticus Species 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 150000004712 monophosphates Chemical class 0.000 description 2
- 238000005580 one pot reaction Methods 0.000 description 2
- 239000007800 oxidant agent Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 1
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- RFCQJGFZUQFYRF-UHFFFAOYSA-N 2'-O-Methylcytidine Natural products COC1C(O)C(CO)OC1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-UHFFFAOYSA-N 0.000 description 1
- SXUXMRMBWZCMEN-UHFFFAOYSA-N 2'-O-methyl uridine Natural products COC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-UHFFFAOYSA-N 0.000 description 1
- RFCQJGFZUQFYRF-ZOQUXTDFSA-N 2'-O-methylcytidine Chemical class CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-ZOQUXTDFSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- BCZUPRDAAVVBSO-MJXNYTJMSA-N 4-acetylcytidine Chemical compound C1=CC(C(=O)C)(N)NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 BCZUPRDAAVVBSO-MJXNYTJMSA-N 0.000 description 1
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 1
- UVGCZRPOXXYZKH-QADQDURISA-N 5-(carboxyhydroxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(C(O)C(O)=O)=C1 UVGCZRPOXXYZKH-QADQDURISA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- MMUBPEFMCTVKTR-IBNKKVAHSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-1h-pyrimidine-2,4-dione Chemical compound C=1NC(=O)NC(=O)C=1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O MMUBPEFMCTVKTR-IBNKKVAHSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 206010055113 Breast cancer metastatic Diseases 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- PCDQPRRSZKQHHS-XVFCMESISA-N CTP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-XVFCMESISA-N 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 206010068051 Chimerism Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 108010063113 DNA Polymerase II Proteins 0.000 description 1
- 102000010567 DNA Polymerase II Human genes 0.000 description 1
- 108010071146 DNA Polymerase III Proteins 0.000 description 1
- 102000007528 DNA Polymerase III Human genes 0.000 description 1
- 108010001132 DNA Polymerase beta Proteins 0.000 description 1
- 102000001996 DNA Polymerase beta Human genes 0.000 description 1
- 102000016559 DNA Primase Human genes 0.000 description 1
- 108010092681 DNA Primase Proteins 0.000 description 1
- 230000005971 DNA damage repair Effects 0.000 description 1
- 108010025600 DNA polymerase iota Proteins 0.000 description 1
- 102100029765 DNA polymerase lambda Human genes 0.000 description 1
- 101710177421 DNA polymerase lambda Proteins 0.000 description 1
- 108010061914 DNA polymerase mu Proteins 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 101100224482 Drosophila melanogaster PolE1 gene Proteins 0.000 description 1
- 108700034637 EC 3.2.-.- Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010025076 Holoenzymes Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 206010068052 Mosaicism Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- BVAMAHMOUQYYPL-UHFFFAOYSA-N N1=CN=CC=C1.C1=CCC1 Chemical class N1=CN=CC=C1.C1=CCC1 BVAMAHMOUQYYPL-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 230000010718 Oxidation Activity Effects 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108700018273 Rad30 Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101000650594 Rattus norvegicus DNA-directed RNA polymerase I subunit RPA2 Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 101100117496 Sulfurisphaera ohwakuensis pol-alpha gene Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 101000717237 Tobacco streak virus (strain WC) RNA-directed RNA polymerase 2a Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- IKQDPOQDKMLSOK-LKEWCRSYSA-N [hydroxy-[[(2r,3s,5r)-3-hydroxy-5-[4-(methylamino)-2-oxopyrimidin-1-yl]oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(NC)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 IKQDPOQDKMLSOK-LKEWCRSYSA-N 0.000 description 1
- MALRVWPOKBDVSZ-XLPZGREQSA-N [hydroxy-[[(2r,3s,5r)-3-hydroxy-5-[6-(methylamino)purin-9-yl]oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 MALRVWPOKBDVSZ-XLPZGREQSA-N 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical class OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Chemical class OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 238000000889 atomisation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Chemical class OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 238000007068 beta-elimination reaction Methods 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 239000012503 blood component Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000011281 clinical therapy Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- OFEZSBMBBKLLBJ-BAJZRUMYSA-N cordycepin Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)C[C@H]1O OFEZSBMBBKLLBJ-BAJZRUMYSA-N 0.000 description 1
- OFEZSBMBBKLLBJ-UHFFFAOYSA-N cordycepine Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)CC1O OFEZSBMBBKLLBJ-UHFFFAOYSA-N 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006846 excision repair Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 150000002341 glycosylamines Chemical class 0.000 description 1
- 230000011132 hemopoiesis Effects 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 241001515942 marmosets Species 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 230000007886 mutagenicity Effects 0.000 description 1
- 231100000299 mutagenicity Toxicity 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 101710197907 rDNA transcriptional regulator pol5 Proteins 0.000 description 1
- 231100000812 repeated exposure Toxicity 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 238000009997 thermal pre-treatment Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000011637 translesion synthesis Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
配列決定のための核酸試料(試料)の調製に関連する方法およびキットが開示される;これは、1つの鎖に限定されたヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑え、ここで試料の少なくとも一部は二本鎖である。
Description
関連出願の相互参照
この出願は、35 U.S.C. § 119(e)の下で、2020年12月11日に出願された米国仮出願第63/124,700号、表題「METHODS FOR DUPLEX REPAIR」、2021年1月29日に出願された米国仮出願第63/143,397号、表題「METHODS FOR DUPLEX REPAIR」、2021年5月20日に出願された米国仮出願第63/191,320号、表題「METHODS FOR DUPLEX REPAIR」、2021年5月21日に出願された米国仮出願第63/191,914号、表題「METHODS FOR DUPLEX REPAIR」、および2021年6月30日に出願された米国仮出願第63/217,007号、表題「METHODS FOR DUPLEX REPAIR」の利益を主張し、それぞれの全開示は、その全体が参照により本明細書に組み込まれる。
この出願は、35 U.S.C. § 119(e)の下で、2020年12月11日に出願された米国仮出願第63/124,700号、表題「METHODS FOR DUPLEX REPAIR」、2021年1月29日に出願された米国仮出願第63/143,397号、表題「METHODS FOR DUPLEX REPAIR」、2021年5月20日に出願された米国仮出願第63/191,320号、表題「METHODS FOR DUPLEX REPAIR」、2021年5月21日に出願された米国仮出願第63/191,914号、表題「METHODS FOR DUPLEX REPAIR」、および2021年6月30日に出願された米国仮出願第63/217,007号、表題「METHODS FOR DUPLEX REPAIR」の利益を主張し、それぞれの全開示は、その全体が参照により本明細書に組み込まれる。
配列表
本出願はEFS-Webを介してASCII形式で提出された配列表を含み、その全体は参照により本明細書に組み込まれる。2021年12月10日に作成されたこのASCIIコピーはB119570118WO00-SEQ-GJM.txtという名称で、サイズは35,088バイトである。
本出願はEFS-Webを介してASCII形式で提出された配列表を含み、その全体は参照により本明細書に組み込まれる。2021年12月10日に作成されたこのASCIIコピーはB119570118WO00-SEQ-GJM.txtという名称で、サイズは35,088バイトである。
背景
核酸の正確な配列決定は、多くの分野(例えば生物医学の研究開発、臨床診断および治療)において極めて重要であるが、困難である。DNA配列決定のコストは2000年代初頭以来100万分の1に低下したが、次世代配列決定(NGS)のエラー率は依然として高く(~0.1%)、この数値は比較的変わっていない。このエラー率により、真の変異、特に存在量が少ない変異を解決することが困難になる。より高い忠実度は、各配列を複数回読み取ることで達成できる;例えば、元の各DNA二重鎖の両方の鎖からのリード(read)のコンセンサスを必要とすることにより、「二重鎖配列決定」などの技法では0.0001~0.00001%(1×10-6~1×10-7)という低いエラー率を達成できる。しかしその精度は、真の変異を識別するために用いる上で最も重要な領域では失敗の可能性がある。例えば、ホルマリン固定腫瘍生検などの重度に損傷した(例えば、以下でさらに記載されるように、酸化、脱アミノ化された)試料のエラー率は、100倍を超える可能性がある。これは、配列決定用の核酸を調製するのに必要な既存の方法では、各DNA二重鎖の一部が再合成され、もともと一方の鎖に限定されていた増幅可能な病変または変化が、両方の鎖の真の変異から識別できなくなる可能性があるためである。したがって、各二重鎖の両方の鎖からの配列のコンセンサスを必要とする二重鎖配列決定などの既存の方法の精度を、変異検出を損なうことなく向上させるための新しい方法が必要である。
核酸の正確な配列決定は、多くの分野(例えば生物医学の研究開発、臨床診断および治療)において極めて重要であるが、困難である。DNA配列決定のコストは2000年代初頭以来100万分の1に低下したが、次世代配列決定(NGS)のエラー率は依然として高く(~0.1%)、この数値は比較的変わっていない。このエラー率により、真の変異、特に存在量が少ない変異を解決することが困難になる。より高い忠実度は、各配列を複数回読み取ることで達成できる;例えば、元の各DNA二重鎖の両方の鎖からのリード(read)のコンセンサスを必要とすることにより、「二重鎖配列決定」などの技法では0.0001~0.00001%(1×10-6~1×10-7)という低いエラー率を達成できる。しかしその精度は、真の変異を識別するために用いる上で最も重要な領域では失敗の可能性がある。例えば、ホルマリン固定腫瘍生検などの重度に損傷した(例えば、以下でさらに記載されるように、酸化、脱アミノ化された)試料のエラー率は、100倍を超える可能性がある。これは、配列決定用の核酸を調製するのに必要な既存の方法では、各DNA二重鎖の一部が再合成され、もともと一方の鎖に限定されていた増幅可能な病変または変化が、両方の鎖の真の変異から識別できなくなる可能性があるためである。したがって、各二重鎖の両方の鎖からの配列のコンセンサスを必要とする二重鎖配列決定などの既存の方法の精度を、変異検出を損なうことなく向上させるための新しい方法が必要である。
発明の概要
核酸の調製に使用される既存の方法は、多くの作業およびステップを実施する。「末端修復」(ER)および「dAテーリング」(AT)(ER/AT)として知られる既存の方法はそれぞれ、dTMPテール付き(dTMP-tailed)配列決定アダプターのライゲーションの準備として、DNA断片を平滑化およびリン酸化し、デオキシアデノシン一リン酸(「dAMP」)の3’末端への非鋳型付加を実施するために使用される(図1)。ERおよびATは、逐次的に、または「ワンポット」反応内(例えば、プロセスおよび方法の全体が、ステップを分離することなく1つの反応容器内で同時に行われる)のいずれかで実施され、3’オーバーハングを消化して5’オーバーハングを埋め、かつ単一のdAMPを二重鎖の鎖の各3’末端に残すことが意図されている、DNAポリメラーゼ(単数または複数)を使用する。しかし、ER/AT(そのままで、またはNEB PreCR(登録商標)もしくはExoVIIなどの前処理と組み合わせて;例えば、図34および図35A~35Cを参照)は、伝統的に、5’エキソヌクレアーゼおよび/または鎖置換活性を有する、1つ以上のDNAポリメラーゼ(単数または複数)の使用を伴う。したがって、広範な鎖再合成が、二重鎖内の内部のニックおよびギャップ、および長い5’オーバーハングから生じる可能性があるという仮説が立てられた。再合成が、もともと一方の鎖に限定されていた増幅可能な病変または変化の存在下で生じると、エラーが両方の鎖にコピーされ、両方の鎖上の真の変異と区別できなくなり得るか、またはその可能性がある。二重鎖配列決定におけるこの偽の発見の源は、短い5’オーバーハングがしばしば埋められる断片末端で最も明確に見られるが(図2C)、本明細書では、かかるエラーは、以下が与えられている場合に断片のさらに深い部分にまで及び得ることが示されている:(i)ER/ATで一般的に使用されるTaqおよびクレノウなどのポリメラーゼの、5’エキソヌクレアーゼおよび鎖置換活性、および(ii)複数の内因性または外因性因子によって誘導される様々な程度の主鎖損傷、これは、鎖再合成のプライミング部位(例:ニック、ギャップ)として機能する。これは、271個の無細胞DNA(cfDNA)試料よりも約100倍高いエラー率を示した重度の損傷を受けたFFPE腫瘍DNA試料において、3’断片末端からの距離に応じて減少する長いテールのエラーが観察された理由を、説明できる可能性がある(図2C)。このメカニズムは、従来のER/ATキットを用いた、ニック、ギャップ、およびオーバーハングを有する合成オリゴヌクレオチドの処理を含む実験によっても確認された(図2Bおよび図3A)。断片末端でのエラーは、断片末端のin silicoトリミングによって軽減できるが、各断片の内部(または断片末端から事前に指定された距離を超える、例えば12bpを超える部分)で発生するエラーは、この方法では、DNA配列決定データの収量を大幅に妥協することなく解決することはできない。これは、二重鎖配列決定が理論的には、一方の鎖の塩基損傷エラーを識別できるが、実際にはその能力が出発物質の品質に依存しており、これには多くの理由から大きな問題があることを意味する。例えば、ER/ATの前に、試料を断片化してライブラリーを調製する。この断片化は、核酸を小さな断片に分解する。これは、物理的(例えば、超音波処理または物理的力によって)、酵素的、または化学的に達成することができる。しかし、あらゆる形態の断片化は、本質的に鎖に損傷を与えて破断し、オフターゲット損傷(例:オーバーハング、ニック、ギャップ、損傷塩基)を誘導する可能性がある。
核酸の調製に使用される既存の方法は、多くの作業およびステップを実施する。「末端修復」(ER)および「dAテーリング」(AT)(ER/AT)として知られる既存の方法はそれぞれ、dTMPテール付き(dTMP-tailed)配列決定アダプターのライゲーションの準備として、DNA断片を平滑化およびリン酸化し、デオキシアデノシン一リン酸(「dAMP」)の3’末端への非鋳型付加を実施するために使用される(図1)。ERおよびATは、逐次的に、または「ワンポット」反応内(例えば、プロセスおよび方法の全体が、ステップを分離することなく1つの反応容器内で同時に行われる)のいずれかで実施され、3’オーバーハングを消化して5’オーバーハングを埋め、かつ単一のdAMPを二重鎖の鎖の各3’末端に残すことが意図されている、DNAポリメラーゼ(単数または複数)を使用する。しかし、ER/AT(そのままで、またはNEB PreCR(登録商標)もしくはExoVIIなどの前処理と組み合わせて;例えば、図34および図35A~35Cを参照)は、伝統的に、5’エキソヌクレアーゼおよび/または鎖置換活性を有する、1つ以上のDNAポリメラーゼ(単数または複数)の使用を伴う。したがって、広範な鎖再合成が、二重鎖内の内部のニックおよびギャップ、および長い5’オーバーハングから生じる可能性があるという仮説が立てられた。再合成が、もともと一方の鎖に限定されていた増幅可能な病変または変化の存在下で生じると、エラーが両方の鎖にコピーされ、両方の鎖上の真の変異と区別できなくなり得るか、またはその可能性がある。二重鎖配列決定におけるこの偽の発見の源は、短い5’オーバーハングがしばしば埋められる断片末端で最も明確に見られるが(図2C)、本明細書では、かかるエラーは、以下が与えられている場合に断片のさらに深い部分にまで及び得ることが示されている:(i)ER/ATで一般的に使用されるTaqおよびクレノウなどのポリメラーゼの、5’エキソヌクレアーゼおよび鎖置換活性、および(ii)複数の内因性または外因性因子によって誘導される様々な程度の主鎖損傷、これは、鎖再合成のプライミング部位(例:ニック、ギャップ)として機能する。これは、271個の無細胞DNA(cfDNA)試料よりも約100倍高いエラー率を示した重度の損傷を受けたFFPE腫瘍DNA試料において、3’断片末端からの距離に応じて減少する長いテールのエラーが観察された理由を、説明できる可能性がある(図2C)。このメカニズムは、従来のER/ATキットを用いた、ニック、ギャップ、およびオーバーハングを有する合成オリゴヌクレオチドの処理を含む実験によっても確認された(図2Bおよび図3A)。断片末端でのエラーは、断片末端のin silicoトリミングによって軽減できるが、各断片の内部(または断片末端から事前に指定された距離を超える、例えば12bpを超える部分)で発生するエラーは、この方法では、DNA配列決定データの収量を大幅に妥協することなく解決することはできない。これは、二重鎖配列決定が理論的には、一方の鎖の塩基損傷エラーを識別できるが、実際にはその能力が出発物質の品質に依存しており、これには多くの理由から大きな問題があることを意味する。例えば、ER/ATの前に、試料を断片化してライブラリーを調製する。この断片化は、核酸を小さな断片に分解する。これは、物理的(例えば、超音波処理または物理的力によって)、酵素的、または化学的に達成することができる。しかし、あらゆる形態の断片化は、本質的に鎖に損傷を与えて破断し、オフターゲット損傷(例:オーバーハング、ニック、ギャップ、損傷塩基)を誘導する可能性がある。
本明細書で開示されるのは、二重鎖修復(DR)と呼ばれる新しいER/AT方法であり、これは、既存の方法に固有の問題の多くを最小化および/または除去する。例えば限定することなく、DRは、NGSアダプターのライゲーション前に、鎖再合成を最小限に抑え、これは偽変異の発見を大幅に制限する。本明細書に示すように、この再合成を最小限に抑えることで、DRは、各二重鎖の両方の鎖からの配列のコンセンサスに依存する、二重鎖配列決定および他の関連方法の主要なアキレス腱に対処して、最大の精度および堅牢性を提供する。
したがっていくつかの側面において、本開示は、配列決定用の核酸試料(試料)を調製する方法であって、もともと一本の鎖に限定されていたヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑える、前記方法に関し、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、ならびに以下を含む:(a)試料を、以下が可能な1つ以上の酵素と接触させること:(i)1つ以上の損傷塩基を、試料から切除すること;(ii)1つ以上の脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること;および(iii)5’オーバーハングを消化すること;(b)試料を、以下の1つ以上と接触させること:(i)鎖置換および5’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の3’オーバーハングを消化することができる、DNA依存性DNAポリメラーゼ;(ii)試料の鎖の5’末端をリン酸化することができる酵素;(c)試料を、ニックをシーリング可能なDNAリガーゼと接触させること;および(d)アダプターライゲーション用の試料を調製するステップ、ここで該調製は、dAMPを、試料の鎖の3’末端に付加すること(dAテーリング)を含む。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき、本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。
いくつかの態様において、dAテーリングは、試料を、1つのデオキシアノシン一リン酸(dAMP)を試料の鎖の各3’末端に組み込むことができる酵素と接触させること、および試料をdNTPと接触させることを含む。いくつかの態様において、本開示の方法のステップ(a)~(c)で使用される酵素および/またはdNTPは、dAテーリングの前に、反応容器から実質的に除去される。いくつかの態様において、dNTPは、実質的にdATPを含む。
いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触されて少なくとも5分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触されて少なくとも25分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触されて少なくとも30分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触されて少なくとも5分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触されて少なくとも25分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触されて少なくとも30分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触されて少なくとも15分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触されて少なくとも30分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触されて少なくとも45分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触されて少なくとも40分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触されて少なくとも60分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触されて少なくとも70分間インキュベートされる。
いくつかの態様において、ステップ(a)は、摂氏約32度(℃)~約42℃の温度で実施される。いくつかの態様において、ステップ(a)は、約35℃~約39℃の温度で実施される。いくつかの態様において、ステップ(b)は、約32℃~約42℃の温度で実施される。いくつかの態様において、ステップ(b)は、約35℃~約39℃の温度で実施される。いくつかの態様において、ステップ(c)は、約30℃~約70℃の温度で実施される。いくつかの態様において、ステップ(c)は、約33℃~約67℃の温度で実施される。いくつかの態様において、ステップ(d)は、約18℃~約69℃の温度で実施される。いくつかの態様において、ステップ(d)は、約20℃~約67℃の温度で実施される。
いくつかの態様において、ステップ(a)の前に、試料は(i)断片化される;または(ii)切断およびタグ付けされる(タグメントされる)。いくつかの態様において、断片化は、(a)物理的断片化;(b)酵素的断片化;および/または(c)化学的断片化によるものである。いくつかの態様において、断片化は物理的断片化による。いくつかの態様において、断片化は酵素的断片化による。いくつかの態様において、断片化は化学的断片化による。
いくつかの態様において、ステップ(a)は、試料を、以下からなる群から選択される1つ以上の酵素と接触させることを含む:(1)エンドヌクレアーゼIV(EndoIV);(2)ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);(3)ウラシル-DNAグリコシラーゼ(UDG);(4)T4ピリミジンDNAグリコシラーゼ(T4 PDG);(5)エンドヌクレアーゼVIII(EndoVIII)、および(6)エキソヌクレアーゼVII(ExoVII)。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。
いくつかの態様において、1つ以上の酵素の活性は、試料上の以下のDNA改変を触媒する:(1)損傷塩基の切除;および(2)1つ以上の脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること。いくつかの態様において、1つ以上の酵素の活性は、逐次的または同時である。
いくつかの態様において、損傷塩基は、ウラシル;8’オキソG;酸化ピリミジン;およびシクロブタンピリミジン二量体からなる群から選択される。
いくつかの態様において、試料の少なくとも1つの鎖の5’オーバーハングは、少なくとも10核酸塩基長である。いくつかの態様において、試料の少なくとも1つの鎖の5’オーバーハングは、少なくとも75核酸塩基長である。いくつかの態様において、試料の少なくとも1つの鎖の3’オーバーハングは、少なくとも10核酸塩基長である。いくつかの態様において、試料の少なくとも1つの鎖の3’オーバーハングは、少なくとも75核酸塩基長である。
いくつかの態様において、1つ以上の酵素は、試料の少なくとも1つの鎖の5’オーバーハングを16核酸塩基未満の長さに消化する。いくつかの態様において、1つ以上の酵素は、試料の少なくとも1つの鎖の5’オーバーハングを8核酸塩基未満の長さに消化する。いくつかの態様において、1つ以上の酵素は、試料の少なくとも1つの鎖の3’オーバーハングを16核酸塩基未満の長さに消化する。いくつかの態様において、1つ以上の酵素は、試料の少なくとも1つの鎖の3’オーバーハングを8核酸塩基未満の長さに消化する。
いくつかの態様において、エンドヌクレアーゼIV(EndoIV)は、脱塩基部位を切断する。いくつかの態様において、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼは、損傷プリンを切除する。いくつかの態様において、ウラシル-DNAグリコシラーゼ(UDG)は、ウラシルを切除する。いくつかの態様において、T4ピリミジンDNAグリコシラーゼ(T4 PDG)は、シクロブタンピリミジン二量体を切除する。いくつかの態様において、エンドヌクレアーゼVIII(EndoVIII)は、損傷ピリミジンを切除する。いくつかの態様において、DNAリガーゼは、HiFi Taq DNAリガーゼである。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。
いくつかの態様において、本開示の方法のステップ(b)は、DNA断片をポリヌクレオチドキナーゼ(Pnk)と接触させるステップを含む。いくつかの態様において、Pnkは、T4ポリヌクレオチドキナーゼである。いくつかの態様において、本開示の方法のステップ(b)で使用されるDNAポリメラーゼは、T4 DNAポリメラーゼである。いくつかの態様において、本開示の方法のステップ(d)で使用されるDNAポリメラーゼ(単数または複数)は、Taqポリメラーゼおよび/またはクレノウ断片を含む。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。
本開示の任意の方法のいくつかの態様において:(a)エンドヌクレアーゼIV(EndoIV)は、配列番号3または任意の既知のエンドヌクレアーゼIV配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;(b)ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg)は、配列番号4または任意の既知のホルムアミドピリミジン[fapy]-DNAグリコシラーゼ配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;(c)ウラシル-DNAグリコシラーゼ(UDG)は、配列番号5~7からなる群から選択されるアミノ酸配列または任意の既知のウラシル-DNAグリコシラーゼ(UDG)配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;(d)T4ピリミジンDNAグリコシラーゼ(T4 PDG)は、任意の既知のT4ピリミジンDNAグリコシラーゼ配列から選択されるアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;および/または(e)エンドヌクレアーゼVIII(EndoVIII)は、配列番号8~9からなる群から選択されるアミノ酸配列または任意の既知のエンドヌクレアーゼVIII配列に対して少なくとも70%の同一性を有するアミノ酸配列を含む。
本開示の任意の方法のいくつかの態様において、ポリヌクレオチドキナーゼは、配列番号10に対して少なくとも70%の同一性を有するアミノ酸配列を含む。
本開示の任意の方法のいくつかの態様において:(1)DNA依存性DNAポリメラーゼは、任意の既知のDNA依存性DNAポリメラーゼ配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;および/または(2)DNAリガーゼは、配列番号11~13からなる群から選択されるアミノ酸配列または任意の既知のDNAリガーゼ配列に対して少なくとも70%の同一性を有するアミノ酸配列を含む。
いくつかの側面において、本開示は、偽変異の検出を軽減する二重鎖配列決定の方法であって、以下を含む方法に関する:(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~51のいずれか1つに記載の方法を実施すること;(A3)試料を二重鎖配列決定すること;および(A4)変異をコンピュータ分析により同定すること。
いくつかの側面において、コンピュータ分析は、依然としていくらかの再合成が起こる断片末端の限られた領域における偽変異の検出を避けるために、断片の末端(例:最後の12bp)のトリミングを必要とする。
いくつかの側面において、本開示は、二重鎖配列決定におけるアーチファクトを低減する方法であって、以下を含む方法に関する:(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~51のいずれか1つに記載の方法を実施すること;および(A3)試料を二重鎖配列決定すること。
いくつかの側面において、本開示は、配列決定のための核酸試料調製の間の、合成鎖の合成を低減する方法であって、以下を含む方法に関する:(A1)配列決定する核酸を取得すること;および(A2)態様1または態様2~51のいずれか1つに記載の方法を実施すること。
いくつかの側面において、本開示は、変異同定の精度を高める方法であって、以下を含む方法に関する:(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~51のいずれか1つに記載の方法を実施すること;(A3)試料を二重鎖配列決定すること;および(A4)変異をコンピュータ分析により同定すること。
いくつかの側面において、本開示は、以下を含むキットに関する:(a)本開示の方法のいずれかを実施するための試薬;および(b)容器。いくつかの態様において、キットはさらに反応容器を含む。いくつかの態様において、キットの試薬は:(a)以下の1つ以上:エンドヌクレアーゼIV(EndoIV);エキソヌクレアーゼVII(ExoVII)、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);ウラシル-DNAグリコシラーゼ(UDG);T4 DNAポリメラーゼ;T4ピリミジンDNAグリコシラーゼ(T4 PDG);T4ポリヌクレオチドキナーゼ(T4 Pnk);クレノウ断片;HiFi Taqリガーゼ;Taqポリメラーゼ;および/またはエンドヌクレアーゼVIII(EndoVIII);および/または、(b)dNTP、を含む。いくつかの態様において、キットはさらに、試料を断片化するための試薬および材料を含む。
いくつかの側面において、本開示は、試料の少なくとも一部が二本鎖である、核酸試料(試料)を調製する方法であって、試料を反応容器に添加すること、および、(a)試料を、以下が可能な1つ以上の酵素と接触させること:(i)試料の鎖の5’末端をリン酸化すること;3’ヒドロキシル部分を、試料の鎖の3’末端に付加すること;および(ii)ニックをシーリングすること;(b)試料を、5’および3’オーバーハングを除去すると同時にギャップ領域を消化して平滑化二重鎖を生成することができる1つ以上の酵素と接触させること;および(c)デオキシアデノシン一リン酸(dAMP)を、試料の鎖の3’末端に付加すること(dAテーリング)、を含む、前記方法に関する。
いくつかの態様において、本開示の方法は酵素の使用を含み、ここで該酵素は、T4ポリヌクレオチドキナーゼ、HiFi Taqリガーゼ、またはそれらの組み合わせを含む。いくつかの態様において、本開示の方法は、ヌクレアーゼS1を含む酵素の使用を含む。
図面の簡単な説明
以下の図面は本明細書の一部を形成し、これらは本開示の一定の側面をさらに実証するために含まれており、これら図面の1つ以上を本明細書に提示される特定の態様の詳細な説明と組み合わせて参照することにより、さらによく理解することができる。明確にするために、すべての構成要素がすべての図面でラベル付けされているわけではない。図面に示されたデータは、決して本開示の範囲を限定するものではないことを理解されたい。図面においては、以下である:
以下の図面は本明細書の一部を形成し、これらは本開示の一定の側面をさらに実証するために含まれており、これら図面の1つ以上を本明細書に提示される特定の態様の詳細な説明と組み合わせて参照することにより、さらによく理解することができる。明確にするために、すべての構成要素がすべての図面でラベル付けされているわけではない。図面に示されたデータは、決して本開示の範囲を限定するものではないことを理解されたい。図面においては、以下である:
詳細な説明
次世代配列決定(NGS)の精度向上は、臨床医学における重要な目標である。これは、臨床検体中の低含量の変異を検出しようとする場合に特に重要であり、例えば、早期がん検出(Chabon et al., Nature, 2020;Corcoran et al., Ann Rev Cancer Bio, 2019)、微小残存病変(「MRD」)のモニタリング(Parsons et al., Clinic Cancer Res, 2020; Tie et al., Sci Trans Med, 2016)、アクションが可能な(actionable)変異または耐性変異の追跡(Parikh et al., Nat Med, 2019)、出生前遺伝子検査の実施(Lo et al., Sci Trans Med, 2010)および微生物またはウイルス感染の検出(Blauwkamp et al., 2019)などのためであり、なぜならばエラーは、不正確な診断および処置につながり得るからである。DNA塩基の損傷は、NGSにおける偽変異発見の主な原因である(Chen et al., Science, 2017)。シトシンの脱アミノ化、チミン二量体、ピリミジン二量体、8-オキソグアニン、6-O-メチルグアニン、脱プリン化、および脱ピリミジン化などの病変は、自然発生的に発生する場合と、次のような環境および化学的暴露に反応して発生する場合がある:紫外線(UV)照射、電離放射線、活性酸素種、および遺伝毒性物質、または試料処理手順、例えばホルマリン固定、凍結と解凍、加熱、音響剪断、および水溶液での長期保存など(Costello et al., Nucleic Acids Res, 2013;Wong et al., BMC Med Genomics, 2014)。修正することなく放置すると、かかる病変は、損傷乗り越え合成(translesion synthesis)が可能なポリメラーゼによってコピーされる場合に塩基対合の変化をもたらし、それによって偽変異の検出につながる可能性がある。これらの問題は、ライブラリー増幅および配列決定で導入される他のエラーと共に、標準的なNGSにおいてエラー率0.1%~1%に寄与する(Salk et al., Nat Rev Genetics, 2018)。
次世代配列決定(NGS)の精度向上は、臨床医学における重要な目標である。これは、臨床検体中の低含量の変異を検出しようとする場合に特に重要であり、例えば、早期がん検出(Chabon et al., Nature, 2020;Corcoran et al., Ann Rev Cancer Bio, 2019)、微小残存病変(「MRD」)のモニタリング(Parsons et al., Clinic Cancer Res, 2020; Tie et al., Sci Trans Med, 2016)、アクションが可能な(actionable)変異または耐性変異の追跡(Parikh et al., Nat Med, 2019)、出生前遺伝子検査の実施(Lo et al., Sci Trans Med, 2010)および微生物またはウイルス感染の検出(Blauwkamp et al., 2019)などのためであり、なぜならばエラーは、不正確な診断および処置につながり得るからである。DNA塩基の損傷は、NGSにおける偽変異発見の主な原因である(Chen et al., Science, 2017)。シトシンの脱アミノ化、チミン二量体、ピリミジン二量体、8-オキソグアニン、6-O-メチルグアニン、脱プリン化、および脱ピリミジン化などの病変は、自然発生的に発生する場合と、次のような環境および化学的暴露に反応して発生する場合がある:紫外線(UV)照射、電離放射線、活性酸素種、および遺伝毒性物質、または試料処理手順、例えばホルマリン固定、凍結と解凍、加熱、音響剪断、および水溶液での長期保存など(Costello et al., Nucleic Acids Res, 2013;Wong et al., BMC Med Genomics, 2014)。修正することなく放置すると、かかる病変は、損傷乗り越え合成(translesion synthesis)が可能なポリメラーゼによってコピーされる場合に塩基対合の変化をもたらし、それによって偽変異の検出につながる可能性がある。これらの問題は、ライブラリー増幅および配列決定で導入される他のエラーと共に、標準的なNGSにおいてエラー率0.1%~1%に寄与する(Salk et al., Nat Rev Genetics, 2018)。
塩基損傷エラーの偶然性のため、多くは、各DNA断片の複数コピーを配列決定し、リード間のコンセンサスを必要とすることによって、克服することができる。かかる「コンセンサスベースの」配列決定は、DNAの各一本鎖からのコンセンサスを必要とする場合は最大100倍まで、各DNA二重鎖の両方のセンス鎖からのコンセンサスを必要とする場合は最大1000倍まで、エラーを減らすことができる。
二重鎖の両方のセンス鎖の配列決定および読み取りを必要とする方法は、「二重鎖配列決定」として知られている(Schmitt et al., PNAS, 2012)。しかし、二重鎖DNAの主鎖損傷(例:ニック、ギャップ、およびオーバーハング)を修正し、かつNGSアダプターのライゲーションを促進するために使用される「末端修復/dAテーリング」(ER/AT)のための既存の方法では、アダプターライゲーションの前に各二重鎖の一部が再合成される可能性がある。塩基損傷の存在下で再合成が起こると、損傷乗り越え合成によりエラーが両方の鎖にコピーされ、両方の鎖上の真の変異と区別できなくなる可能性がある。
二重鎖配列決定における偽の発見の、この主な原因は、短い5’オーバーハングが埋められることが多い断片末端において最も明確に見られる。しかしこれは、(i)ER/ATで使用されるTaqおよびクレノウポリメラーゼの5’エキソヌクレアーゼ活性および鎖置換活性、および(ii)鎖再合成の「プライミング部位」として機能し得る様々な主鎖損傷、を考慮すると、さらに深くまで及び得る。
本明細書に開示されるのは、二重鎖修復と呼ばれるワークフローアプローチであり、これは塩基損傷エラーが両方の鎖にコピーされる可能性を、ある程度は、NGSアダプターライゲーション前の重合を最小限に抑え、二重鎖配列決定エラー率を劇的に低下させることにより制限するアプローチである(例えば、図1参照)。
本明細書において別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載のものと類似または等価の任意の方法および材料を、本発明の実施または試験に使用することができるが、好ましい方法および材料について説明する。
本明細書で参照されるすべての特許および刊行物(かかる特許および刊行物内に開示されるすべての配列を含む)は、参照により明示的に組み込まれる。
数値範囲は、範囲を定義する数値を含む。別段の指示がない限り、核酸は左から右に5’から3’の方向で記載される;アミノ酸配列はそれぞれ、左から右にアミノからカルボキシの方向で記載される。
本明細書で提供される見出しは、本発明の様々な側面または態様を限定するものではない。したがって、すぐ下で定義される用語は、明細書全体を参照することによってより完全に定義される。
別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 3D ED., John Wiley and Sons, New York (2006)、およびHale & Markham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N.Y. (1991)は、本明細書で使用される多くの用語の一般的な意味を、当業者に提供する。ただし特定の用語については、明確さおよび参照の容易さのために、以下に定義する。
本明細書で使用され得る用語「変異」は、野生型配列と比較した場合の、核酸中のヌクレオチドに対する変化、変更、または改変を指す。例えば、限定されないが、変異は、置換、挿入、欠失、またはそれらの任意の組み合わせを含み得る。いくつかの態様において、少なくとも1つの変異が存在する。いくつかの態様において、複数の変異が存在する。いくつかの態様において、複数の変異が存在する場合、変異は別個である(例えば、同じ種類ではない(例:置換、挿入、欠失))。いくつかの態様において、複数の変異が存在する場合、それらの変異は同一である(例えば、同じ種類(例:置換、挿入、欠失))である。さらに、いくつかの態様において、変異はフレームシフトを引き起こす。本明細書で互換的に使用される「野生型」および「ネイティブな」という用語は当業者に理解される専門用語であり、自然界に存在する物品、生物、株、遺伝子、または特徴の典型的な形態であって、操作された、変異体、またはバリアント形態から区別されるものを意味する。
用語「核酸」、「ヌクレオチド配列」、「ポリヌクレオチド」、「オリゴヌクレオチド」、および「ヌクレオチドのポリマー」という用語は、本明細書において互換的に使用され得るように、少なくとも2つの、核酸塩基-糖-リン酸塩の組み合わせ(例えば、ヌクレオチド)のストリングを指し、とりわけ、一本鎖DNAおよび二本鎖DNA、一本鎖領域と二本鎖領域の混合物であるDNA、一本鎖RNAおよび二本鎖RNA、および一本鎖領域と二本鎖領域の混合物であるRNA、ハイブリッド分子であって、一本鎖、より典型的には二本鎖、または一本鎖領域と二本鎖領域の混合物であり得るDNAおよびRNAを含む前記ハイブリッド分子である。さらに、本明細書で使用される用語(例:核酸など)は、RNAまたはDNA、またはRNAとDNAの両方を含む、三本鎖領域を指し得る。かかる領域の鎖は、同じ分子に由来するものであっても、異なる分子に由来するものであってもよい。領域は、1つ以上の分子のすべてを含み得るが、より一般的には、分子の一部の領域のみを含む。三重らせん領域の分子の1つは、しばしばオリゴヌクレオチドと呼ばれる。
用語(例:核酸など)はまた、化学的、酵素的、または代謝的に改変された核酸の形態、ならびに単純型および複雑型細胞を含む、ウイルスおよび細胞に特徴的なDNAおよびRNAの化学的形態も包含する。例えば、本明細書で使用される用語(例:核酸など)は、1つ以上の修飾塩基を含む本明細書に記載のDNAまたはRNAを含むことができる。核酸はまた、以下も含み得る:天然ヌクレオシド(すなわち、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)、ヌクレオシド類似体(例:2-アミノアデノシン、2-チオチミジン、イノシン、ピロロピリミジン、3-メチルアデノシン、5-メチルシチジン、C5ブロモウリジン、C5フルオロウリジン、C5ヨードウリジン、C5プロピニルウリジン、C5プロピニルシチジン、C5メチルシチジン、7デアザアデノシン、7デアザグアノシン、8オキソアデノシン、8オキソグアノシン、O(6)メチルグアニン、4-アセチルシチジン、5-(カルボキシヒドロキシメチル)ウリジン、ジヒドロウリジン、メチルシュードウリジン、1-メチルアデノシン、1-メチルグアノシン、N6-メチルアデノシン、および2-チオシチジン)、化学的修飾塩基、生物学的修飾塩基(例:メチル化塩基)、インターカレート塩基、修飾糖(例:2’-フルオロリボース、リボース、2’-デオキシリボース、2’-O-メチルシチジン、アラビノース、およびヘキソース)、または修飾リン酸基(例:ホスホロチオアートおよび5’Nホスホロアミダイト結合)。したがって、2つの例のみを挙げると、イノシンなどの異常な塩基を含むDNAまたはRNA、またはトリチル化塩基などの修飾塩基は、本明細書で使用される用語としての核酸である。用語(例:核酸など)はまた、ペプチド核酸(PNA)、ホスホロチオアート、およびネイティブな核酸のリン酸主鎖の別のバリアントも含む。天然の核酸はリン酸主鎖を有し、人工核酸は他の種類の主鎖を含有することができるが、含有される塩基は同じである。したがって、安定性または他の理由で主鎖が改変されたDNAまたはRNAは、その用語が本明細書で意図されているように、核酸である。
本明細書で使用され得る「核酸塩基」という用語は、窒素塩基として当業者に知られている技術用語であり、ヌクレオシドの構成要素を形成する窒素含有生物学的化合物であり、それ自体はヌクレオチドの構成要素である。核酸塩基(本明細書では単に塩基とも呼ばれる)は、塩基対を形成しかつ互いに積み重なって長鎖らせん構造を形成する能力を有するため、核酸(例えば、DNA、RNA)の基本構成ブロックの1つである。5つの標準的な核酸塩基が存在する:アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、およびウラシル(U)であり、A、C、G、およびTはDNAに見出され、A、C、G、およびUはRNAに見出される。
本明細書で使用され得る用語「ヌクレオシド」は、リン酸基のないヌクレオチドであることが一般に知られているグリコシルアミン(例:N-グリコシド)を指す。ヌクレオシドは、核酸塩基(例:窒素塩基)と五炭糖(例:ペントース)から構成される。五炭糖は、リボースまたはデオキシリボースのいずれかであり得る。ヌクレオシドは、RNAおよびDNAの構成成分であるヌクレオチドの生化学的前駆体である。ヌクレオシドの例には、シチジン(C)、ウリジン(U)、アデノシン(A)、グアノシン(G)、チミジン(T)、およびイノシン(I)が含まれるが、バリアント(例:改変または合成ヌクレオシド、改変または合成核酸塩基を含有するヌクレオシド)も含まれる。
本明細書で使用され得る「ヌクレオチド」という用語は、一般に、核酸塩基、糖、およびリン酸塩(例:ヌクレオシドおよびリン酸塩)を含む組成物を指すことが当業者に知られている技術用語である(これらの組成物(例:ヌクレオチド)は、プリンとピリミジンに分離される)。ヌクレオチドは、ポリメラーゼを用いてコピーすることができる核酸の構成要素である。ヌクレオシドであるシチジン(C)、ウリジン(U)、アデノシン(A)、グアノシン(G)、チミジン(T)、およびイノシン(I)は、リン酸基と共に標準ヌクレオチドを表し、合成反応で使用される個々のヌクレオチド(例:3つのリン酸基を有するヌクレオチド(例:「三リン酸」))を指す場合、DNA形態(例:デオキシリボースを有する)において、dATP、dGTP、dCTP、およびdTTPと呼ばれ得る。リン酸基のうちの2つを加水分解すると、核酸の重合に使用する一リン酸ヌクレオチドが得られる。一般に、dATP、dGTP、dCTP、およびdTTPは、dNTPと呼ばれることがあり、ここで「N」は、ヌクレオシドの性質に関する曖昧さを表す。したがってdNTPの混合物は、それぞれの全部または一部の濃度を含み得る。ヌクレオチドは、既知のプリン塩基およびピリミジン塩基のみでなく、損傷を受けた他の複素環塩基(例:酸化、メチル化、アシル化、脱デニル化された塩基など)も含有する。この用語は当技術分野ではよく知られており、当業者には容易に理解されるであろう。
DNA合成は、酵素ベースの合成方法(例:鋳型鎖に基づくDNAポリメラーゼ)および化学合成方法の両方を包含する。様々な態様において、DNA合成とは酵素プロセスを指し、このプロセスによりDNAポリメラーゼは、入ってくるヌクレオチド塩基対を成長するDNA鎖の利用可能な3’末端に逐次的に結合させる触媒作用に基づいて、成長する鎖の末端ヌクレオチドと成長する鎖に付加される入ってくるヌクレオチド塩基との間の新しいホスホジエステル結合の形成を介して、DNAの新たな鎖を生成する。典型的には、成長するDNA鎖に付加されるヌクレオチド塩基の順序は、反対側のDNA鎖によって、「鋳型」鎖上の同族塩基対との水素結合に基づく対合を介して決定される。DNA再合成とは、DNA二重らせんの一方の鎖のニックまたはギャップで典型的には生じる、DNA合成の形態を指し、この時利用可能な3’末端が露出され、そこからDNA合成が起こり、ここでDNAポリメラーゼは、鋳型鎖に対して新しい鎖を合成しつつ、同時に下流の既存の鎖を置き換える。
本明細書で使用され得る「ポリメラーゼ」という用語は、核酸(例:DNAポリメラーゼ、RNAポリメラーゼ)およびポリマーの合成を助けるかまたはそれらを合成する酵素を一般に指すことが当業者に知られている技術用語である。多数のポリメラーゼが知られており、例えば、限定することなく、これらはすべて本明細書で企図される;DNAポリメラーゼI(Polガンマ、Polシータ、Polニュー)、DNAポリメラーゼII(Polアルファ、Polデルタ、Polイプシロン、Polゼータ)、DNAポリメラーゼIIIホロ酵素、DNAポリメラーゼIV(DinB)(SOS修復ポリメラーゼ、Polベータ、Polラムダ、Polミュー)、DNAポリメラーゼV(SOSポリメラーゼ、Polエータ、Polイオータ、Polカッパ)、逆転写酵素、およびRNAポリメラーゼ(RNA Pol I、RNA Pol II、RNA Pol III、T7 RNA Pol、RNAレプリカーゼ、プライマーゼ)。さらに企図されるのは、細菌(例:Thermus aquaticus)由来のポリメラーゼである。例えば、Thermus aquaticusからのTaqは、ポリメラーゼ連鎖反応(PCR)で使用される一般的なDNAポリメラーゼである。いくつかの態様において、ポリメラーゼは、Taqポリメラーゼである。いくつかの態様において、ポリメラーゼは、3’→5’エキソヌクレアーゼ活性を欠いている。いくつかの態様において、ポリメラーゼは、クレノウ断片である。いくつかの態様において、ポリメラーゼは、3’→5’エキソヌクレアーゼ活性を欠くクレノウ断片である。いくつかの態様において、ポリメラーゼは、本明細書に記載されるポリメラーゼのいずれかのヒトバリアントである。
本明細書で使用され得る用語「アダプターライゲーション」は、ヌクレオチド(例:核酸、オリゴヌクレオチド、例えばアダプター)の既知の配列を、1つ以上の核酸(例:DNA断片、DNAの相補鎖)の1つ以上の末端に付着(例:ライゲーション)するプロセスを一般に指すことが当業者に知られている用語を指す。多くの場合、アダプターは、それらが結合することが意図されている核酸断片に相補的な特定の配列を含有するが、例えば限定されないが、核酸がdAテール付きの場合、アダプターは「T」オーバーハングを有し得、ここで「T」は、チミン核酸塩基を含むヌクレオチドを指す。TオーバーハングはdAテールに相補的であるため、ライゲーションが容易になる。
本明細書で使用され得る用語「dAテーリング」は、非鋳型アデノシン(A)(例:アデノシン一リン酸)を含む「テール」を有する核酸(例:DNA、RNA)の状態または特徴を指す。「テール」とは、核酸(例:DNA、RNA)の3’末端のアデノシン(例:AAAAA)が、相補鎖の5’末端ヌクレオチドを越えるオーバーハングを含むことを意味する。用語(例:dAテール)は、アデノシンが核酸の3’末端に付加されるプロセスを説明する動詞(例:dAテーリング)として使用される場合があるいくつかの態様において、dAテーリングは、3’→5’エキソヌクレアーゼ活性を欠くクレノウ断片を用いて実施される。いくつかの態様において、dAテーリングは、Taqポリメラーゼを用いて実施される。
本明細書で使用され得る用語「オーバーハング」は、反対側の鎖(例:相補鎖)の末端(例:末端ヌクレオチド)を越えて伸びる(例:突き出る)二本鎖核酸の部分を指すと当業者に知られている技術用語を指す。例えば、これに限定されないが、5’オーバーハングは、それと結合して二本鎖核酸二重鎖を形成する反対側の鎖(例:相補鎖)の3’末端(3’末端ヌクレオチド)を越えて伸びる核酸の鎖の部分を指すであろう。さらなる例として、限定されないが、3’オーバーハングは、それと結合して二本鎖核酸二重鎖を形成する反対側の鎖(例:相補鎖)の5’末端(5’末端ヌクレオチド)を越えて伸びる核酸の鎖の部分を指すであろう。当業者に理解されるように、二本鎖二重鎖(double-stranded duplex)は、5’および3’オーバーハングの両方、単一の5’オーバーハング、2つの5’オーバーハング、単一の3’オーバーハング、2つの3’オーバーハング、1つのオーバーハング(例:5’または3’)と1つの平滑末端、または2つの平滑末端を含み得る。本明細書で使用される用語「平滑末端」は、二本鎖二重鎖の性質を指し、ここで二重鎖を形成する2つの鎖は同じヌクレオチド対で終結し、したがって二重鎖のその末端にオーバーハングを有さない(例:末端は平滑である)。
本明細書で使用され得る用語「エキソヌクレアーゼ」は、核酸(例:ポリヌクレオチド、オリゴヌクレオチド)の末端からヌクレオチドを切断する活性を少なくとも有する酵素を指すことが当業者に一般に知られている技術用語を指す。いくつかの態様において、エキソヌクレアーゼは、ヌクレオチドを一度に1つずつ切断する。エキソヌクレアーゼは、核酸のいずれかの方向(例:5’末端からまたは3’末端からのいずれか)でヌクレオチドを切断することができる。かかる活性の説明において、ヌクレオチドを核酸の5’末端から開始して(例:3’末端の遠位にある5’ヌクレオチド)切断するエキソヌクレアーゼを指す場合、多くの場合表記は5’→3’エキソヌクレアーゼ活性と示され、または、ヌクレオチドを核酸の3’末端から開始して(例:5’末端の遠位にある3’ヌクレオチド)切断するエキソヌクレアーゼを指す場合、3’→5’エキソヌクレアーゼ活性と示される。いくつかの態様において、エキソヌクレアーゼは5’→3’エキソヌクレアーゼ活性を有する。いくつかの態様において、エキソヌクレアーゼは、Exo VIIであり得る。
用語「相補的」および「相補性」は、本明細書において互換的に使用され得るように、鎖(例:オリゴヌクレオチド)内の核酸(例:RNA、DNA)におけるヌクレオチド(例:A、C、G、T、U)の特性であって、反対方向の核酸鎖(例:平行に走っているが逆方向(すなわち、5’-3’が3’-5’と整列する、および3’-5’が5’-3’と整列する))内の別の特定のヌクレオチドと対合する(すなわち、ワトソン・クリック塩基対合ルール)ところの、前記特性を指す。デオキシリボ核酸(DNA)に関して、相補的塩基対合は、アデニン(A)とチミン(T)(例:AとT、TとA)、グアニン(G)とシトシン(C)(例:GとC、CとG)であり、リボ核酸(RNA)に関して、相補的塩基対合は、Aとウラシル(U)(例:AとU、UとA)、およびGとC(例:GとC、CとG)である。これは、各塩基対がその相補的な塩基(例:A-T/U、T/U-A、C-G、G-C)と同数の水素結合を形成する能力によって生じ、例えばグアニンとシトシンの間の結合は、常に2つの水素結合を共有するA-T/U結合と比べて、3つの水素結合を共有する。
核酸の対の少なくとも一方の鎖のすべての塩基が、その相補的塩基対の反対側にある場合、かかる鎖はもう一方の鎖の配列に対して完全に相補的であるとみなされる。かかる鎖の1つ以上の塩基が、その相補的な塩基対を除く任意の他の塩基の反対側の位置にある場合、その塩基は「ミスマッチ」とみなされ、鎖は部分的に相補的であるとみなされる。したがって、鎖は、整列する塩基がなくなるまで、様々な程度の部分相補性を示すことができ、整列した時点でそれらは非相補的となる。
他の非標準ヌクレオチド(例:5-メチルシトシン、5-ヒドロキシメチルシトシン)は当技術分野で知られており、それらの特性および相補性は当業者には容易に明らかであろう。
二重鎖修復は、試料中に広範なDNA損傷がある場合でも、高精度の配列決定を保証することができる。ここでは、重度に損傷したcfDNA試料とFFPE gDNA試料の両方で劇的なエラーの減少が観察されたが、ただし、二重鎖修復で修復されたFFPE gDNA試料のエラー率は、cfDNA試料のエラー率よりもわずかに高かった。塩基および主鎖の損傷は、自然に、および環境や化学剤に反応して発生し得ることを考慮すると、幅広い試料に対する二重鎖配列決定の信頼性を確保するには、二重鎖修復が必要である。
ExoVIIは5’オーバーハングを完全に平滑化できないため、ギャップ領域および残りの短い(≦7nt)5’オーバーハング内で、DNA病変修復およびオーバーハング除去ステップ後に、再合成が依然として必要であった。しかし、ギャップ領域の埋め込みを制限することで、二重鎖の最大限の回復を確保しつつ、エラーの伝播を防いだ。さらに、ER/AT中に埋められる5’オーバーハングの長さを制限することにより、断片末端内に末端修復エラーを集中させ、断片末端からの距離によってin silicoでそれらをフィルタリングすることが可能となった。さらに、DNA病変修復およびオーバーハング除去ステップで使用された酵素カクテルは、最も一般的なDNA塩基病変のみを認識したが、一方でDNA内に生じて塩基の誤った対合につながり得る、多くの可能性ある塩基損傷が存在する(Cadet and Wagner 2013)。しかし、DNA重合が起こらない二重鎖領域、またはポリメラーゼ(単数または複数)が損傷乗り越え合成できない二重鎖領域でそれらが偶然発生した場合、二重鎖配列決定エラーとしては現れないが、DNA二重鎖の喪失が生じる可能性がある。
本明細書で使用され得る用語「ギャップ」は、二本鎖核酸二重鎖(例:二重鎖を形成するのに十分な相補性を有する核酸の少なくとも2つの鎖からなる、核酸)の部分を指すことが当業者に一般に知られている技術用語を指す;ギャップは一本鎖であり、その両側は二本鎖部分に結合されている。二本鎖部分の間のこの「ギャップ」は、少なくとも1つ(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、またはそれ以上)のヌクレオシドおよび/またはリン酸塩をそれらの反対側に有さない、少なくとも1つ(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、またはそれ以上)の一本鎖部分を含む。この用語は、反対側の鎖(例:相補鎖)の一部がギャップ内に存在しないという点で、用語「ニック」(以下でさらに定義される)と対比され、ここでニックの場合、鎖の一部は隣接するヌクレオチドに結合していない可能性があるが、しかしそれらはすべて反対側の鎖(例:相補鎖)には存在している。
本明細書で使用され得る用語「ニック」は、二本鎖核酸二重鎖(例:二重鎖を形成するのに十分な相補性を有する核酸の少なくとも2つの鎖からなる、核酸)の部分を指すことが当業者に一般に知られている技術用語を指し、ここで、鎖の2つの隣接する構成要素の間には、結合が欠如している。例えば、限定はされないが、ニックは、二重鎖の一方の鎖における2つの隣接するヌクレオチド間の連続性の欠如(例:不連続性)として説明され得る。ニックは様々な原因で形成される可能性があり、DNAの機能実行にとって有益な場合もあれば有害な場合もある。この用語は、反対側の鎖(例:相補鎖)の一部がニック内に存在せず、鎖の一部が隣接する鎖に結合できない可能性があるが、しかしそれらはすべて反対鎖(例:相補鎖)には存在するというという点で、用語「ギャップ」(上でさらに定義されているように)と対比される;一方でギャップでは、反対鎖(例:相補鎖)の一部(例:ヌクレオシド、リン酸基)が欠落している。
本明細書で開示されるのは、既存の方法に固有の問題の多くを最小化および/または除去する、二重鎖修復(DR)と呼ばれる新しいER/AT方法である。例えば、これに限定されないが、DRはNGSアダプターのライゲーション前の鎖再合成を最小限に抑え、これにより偽変異の発見を大幅に制限する。本明細書でわかるように、この再合成を最小限に抑えることにより、DRは、二重鎖配列決定および各二重鎖の両方の鎖からの配列のコンセンサスに依存する他の関連方法の、主要なアキレス腱に対処し、最大の精度および堅牢性を提供する。
変異は、上記のように、野生型核酸とは異なる、所定の核酸(例:DNA、RNA)の領域(例:セクション、部分、核酸塩基、ヌクレオシド、ヌクレオチド)であり、ほとんどの場合、核酸のそれぞれの鎖に反映される。すなわち、試料に変異が存在する場合、その変異とその相補体が、配列決定時に核酸の各鎖で観察されるだろう。しかし、試料が一本鎖部分(例:ギャップ、オーバーハング)または鎖再合成を引き起こす可能性のある領域(例:ニック)を含有し得ることを考慮すると、これは問題である。この問題は、損傷塩基がそのような一本鎖領域または再合成される他の領域に存在する場合、損傷塩基がその相補鎖の合成に、それから試料が生成された核酸には元々存在しなかった塩基を含めるよう指示し得るために、発生する(損傷塩基は非標準塩基対合に影響を与える可能性があるため)。1本の鎖がミスマッチ塩基を含有する場合にも、同じことが起こり得る。かかる場合、ミスマッチは、そのネイティブのミスマッチ塩基ではなく、再合成された相補体中で対合したマッチ(paired match)を示す。これが起こると、両方の鎖の配列決定はそれぞれの鎖において変異を読み取り、変異を示す;しかしこの変異は、元の核酸を正確に反映していない可能性がある。かかる変異は、本明細書では「偽変異」と呼ばれる。偽変異は、核酸の相補鎖の再合成から生じる変異であり、試料が得られた元の(例:ネイティブ、野生型)核酸の相補鎖を表さない。
したがって、いくつかの側面において、本開示は、配列決定用の核酸試料(試料)を調製する方法であって、もともと一本の鎖に限定されていたヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑える、前記方法に関し、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、ならびに以下を含む:(a)試料を、以下が可能な1つ以上の酵素と接触させること:(i)1つ以上の損傷塩基を、試料から切除すること;(ii)1つ以上の脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること;および(iii)5’オーバーハングを消化すること;(b)試料を、以下の1つ以上と接触させること:(i)鎖置換および5’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の3’オーバーハングを消化することができる、DNA依存性DNAポリメラーゼ;(ii)試料の鎖の5’末端をリン酸化することができる酵素;(c)試料を、ニックをシーリング可能なDNAリガーゼと接触させること;および(d)アダプターライゲーション用の試料を調製するステップ、ここで該調製は、dAMPを試料の鎖の3’末端に付加すること(dAテーリング)を含む。
本明細書で使用され得る用語「反応容器」は、本明細書に記載の反応(例:方法)を実施するために使用される容器を指す。当業者には理解されるように、反応容器は、その中で行われる反応または方法に適したものである。例えば、プラスチック(例:ポリエチレン)、ガラス、金属、または他の適切な材料等の材料(例:本明細書に記載の方法の構成要素)であって、その中で使用される試薬(例:核酸、dNTP、酵素)によって分解されず、または損傷を受けにくいものを使用することができる。反応容器の例としては、96ウェルプレート(または他の任意の数の既製ウェルプレート)、エッペンドルフチューブ、フラスコ、ビーカー、シリンダーなどが挙げられる。適切な反応容器の決定および選択は、当業者には直ちに明らかであり、過度の実験を必要としないであろう。
本明細書で使用され得る用語「リガーゼ」は、少なくとも化学結合の形成を通して2つの分子(例:ヌクレオチド、例えばヌクレオチドの糖およびリン酸基)の結合を触媒する活性を有する酵素を指すことが当業者に一般に知られている技術用語を指す。例えば、限定されないが、リガーゼは、ホスホジエステル結合の形成を通じてヌクレオチドを結合することができる(例:DNAリガーゼ(例:DNAリガーゼ1;NCBI RefSeqGene NG_007395.1;Taq DNAリガーゼ(例:HiFi Taq DNAリガーゼ;New England BioLabs, Inc.: neb.com/products/m0647-hi-fi-taq-dna-ligase#Product%20Information))。リガーゼは、本明細書で上に挙げた基本活性(例:2つの分子の結合を触媒すること)を利用する、様々な最終活性を有し得る;例えば、限定はされないが、それらはニックをシールし、および/または末端結合を可能にし得る(例:同じ核酸二重鎖に会合していない核酸などの、会合していない2つの核酸をライゲートする)。リガーゼは当技術分野で周知であり、当業者には容易に理解されるであろう。いくつかの態様において、リガーゼは、ニックシーリング活性を有する。いくつかの態様において、リガーゼは、末端結合活性を有さない(例:欠いている)。いくつかの態様において、リガーゼは、ニックシーリング活性を有するが、末端結合活性を欠いている。いくつかの態様において、リガーゼはDNAリガーゼである。いくつかの態様において、リガーゼはDNAリガーゼ1である。いくつかの態様において、リガーゼはHiFi Taqリガーゼである。いくつかの態様において、リガーゼはヒトリガーゼである。
本明細書で使用され得る用語「リアーゼ」は、少なくとも化学結合の破断(breaking)を触媒する活性を有する酵素を指すことが当業者に一般に知られている技術用語を指す。しかしリアーゼは、加水分解以外の手段(例:置換反応、付加反応、および脱離反応)によってこの破断を行うという点で、同様の活性を共有する他の酵素とは異なる。リアーゼ触媒反応は、多くの場合、炭素原子と別の原子(例:酸素、硫黄、または別の炭素原子)の間の結合を破断することによって、作用することが知られている。特定の種類のリアーゼが当分野に存在することは一般に知られており、その選択および使用は、本開示を読めば当業者には容易に明らかとなるであろう。例えば、限定されないが、いくつかの態様において、リアーゼはAPリアーゼ(例:DNA-AP-リアーゼ)である。APリアーゼは、β脱離反応を介して核酸の脱塩基(例:非プリン性または非ピリミジン性)部位からのC3’-O-P結合3’の切断を促進することが、当技術分野で一般に知られている。この反応により、3’末端不飽和糖と末端5’リン酸塩を有する生成物が残される。
本明細書で使用され得る用語「損傷した」とは、核酸塩基、ヌクレオシド、ヌクレオチド、または核酸を説明する文脈で使用される場合、これらの構成要素のいずれかが、その天然の状態から物質または環境要因との分解相互作用によって変化または改変されていることを指す。例えば、損傷塩基は、限定されないが、8’-オキソグアニンなどの酸化塩基、脱アミノ化塩基(例:シトシンの脱アミノ化によって生成されるウラシル、またはアデニンの脱アミノ化によって生成されるヒポキサンチン(例:イノシンに見られるような))、酸化ピリミジン、および/またはシクロブタンピリミジン二量体を指し得る。損傷塩基(例:DNA病変)は当技術分野で周知であり、誤ったまたは非標準的な塩基対合(例:A/T、C/G、A/U以外の塩基対合)をもたらす可能性がある。さらに、この用語(例:損傷した)は、脱塩基部位を含むものと理解されるべきである。脱塩基部位とは、一般に、プリンもピリミジンも見出されない(例:ヌクレオチドがピリミジンでもプリンでもない)核酸(例:DNA、RNA)内の部位を指すことが、当技術分野で知られている。脱塩基部位は、DNAの糖リン酸主鎖は無傷であるが、核酸塩基自体が欠落している場合に発生する可能性がある。
二重鎖配列決定
二重鎖配列決定は、二重鎖の両方の鎖からの情報を用いて、試料または試料を得た対象のゲノムプロファイルに関する結果を生成する、核酸配列決定の一種である。本明細書で使用される用語「対象」は、本明細書の主題を用いた処置または診断を必要とする任意の生物を指す。例えば、限定されないが、対象は哺乳動物および非哺乳動物を含み得る。いくつかの態様において、対象は哺乳動物である。いくつかの態様において、対象は非哺乳動物である。本明細書で使用される場合、「哺乳動物」とは、哺乳綱を構成する任意の動物(例:ヒト、マウス、ラット、ネコ、イヌ、ヒツジ、ウサギ、ウマ、ウシ、ヤギ、ブタ、モルモット、ハムスター、ニワトリ、シチメンチョウ、または非ヒト霊長類(例:マーモセット、マカク))である。いくつかの態様において、哺乳動物はヒトである。本明細書で使用する用語「二重鎖配列決定」は、各DNA二重鎖の両方の鎖からの配列のコンセンサスを必要とすることによって高精度を引き出す、任意の配列決定方法も包含する。二重鎖配列決定は、コンピュータ分析が二重鎖の既知の特性の使用によってエラーを解決できるため、核酸の配列に関してより高い精度を提供する能力を本質的に備えている。例えば限定はされないが、核酸塩基が、二重鎖の一部である場合に標準的な塩基「対合」を形成すると理解すること。核酸のこの特性は、少なくとも前世紀の後半以来よく知られており、当業者により容易に理解され認識されている。したがってこの知識を利用すると、二重鎖の一方の鎖の配列決定から、予測される相補的配列を推測し決定することが可能である。次いで、この推定された相補的配列を、二重鎖の核酸の配列決定された第2鎖からの結果と比較することができる。このように2本の鎖を比較すると、得られた配列を確認し、または相違点を強調することができるため、可能性ある病変(例:損傷塩基)または片方の鎖にのみ見られるミスマッチ、またはさらなる調査のための配列決定エラーもしくは領域を特定することができる。これらの違いは、誤った塩基の挿入、欠失、または変異(例:損傷塩基)によって生じ得る。さらに、配列決定された二重鎖の結果を参照データとさらに比較することで、配列内で起こり得る変異についての洞察をさらに得ることができる。したがって、二重鎖配列決定は、核酸の配列を解明する高精度の方法を提供し、その精度により、その差異の影響(例:ゲノムデータにおける変異の影響)を決定する際のより高い分解能が可能となる。
二重鎖配列決定は、二重鎖の両方の鎖からの情報を用いて、試料または試料を得た対象のゲノムプロファイルに関する結果を生成する、核酸配列決定の一種である。本明細書で使用される用語「対象」は、本明細書の主題を用いた処置または診断を必要とする任意の生物を指す。例えば、限定されないが、対象は哺乳動物および非哺乳動物を含み得る。いくつかの態様において、対象は哺乳動物である。いくつかの態様において、対象は非哺乳動物である。本明細書で使用される場合、「哺乳動物」とは、哺乳綱を構成する任意の動物(例:ヒト、マウス、ラット、ネコ、イヌ、ヒツジ、ウサギ、ウマ、ウシ、ヤギ、ブタ、モルモット、ハムスター、ニワトリ、シチメンチョウ、または非ヒト霊長類(例:マーモセット、マカク))である。いくつかの態様において、哺乳動物はヒトである。本明細書で使用する用語「二重鎖配列決定」は、各DNA二重鎖の両方の鎖からの配列のコンセンサスを必要とすることによって高精度を引き出す、任意の配列決定方法も包含する。二重鎖配列決定は、コンピュータ分析が二重鎖の既知の特性の使用によってエラーを解決できるため、核酸の配列に関してより高い精度を提供する能力を本質的に備えている。例えば限定はされないが、核酸塩基が、二重鎖の一部である場合に標準的な塩基「対合」を形成すると理解すること。核酸のこの特性は、少なくとも前世紀の後半以来よく知られており、当業者により容易に理解され認識されている。したがってこの知識を利用すると、二重鎖の一方の鎖の配列決定から、予測される相補的配列を推測し決定することが可能である。次いで、この推定された相補的配列を、二重鎖の核酸の配列決定された第2鎖からの結果と比較することができる。このように2本の鎖を比較すると、得られた配列を確認し、または相違点を強調することができるため、可能性ある病変(例:損傷塩基)または片方の鎖にのみ見られるミスマッチ、またはさらなる調査のための配列決定エラーもしくは領域を特定することができる。これらの違いは、誤った塩基の挿入、欠失、または変異(例:損傷塩基)によって生じ得る。さらに、配列決定された二重鎖の結果を参照データとさらに比較することで、配列内で起こり得る変異についての洞察をさらに得ることができる。したがって、二重鎖配列決定は、核酸の配列を解明する高精度の方法を提供し、その精度により、その差異の影響(例:ゲノムデータにおける変異の影響)を決定する際のより高い分解能が可能となる。
二重鎖配列決定は、従来の配列決定と同じステップの多くを必要とする。特に興味深いステップの1つは、試料二重鎖を、鎖が実質的に「二重鎖」になるように操作することであり、すなわち鎖は、一本鎖部分(例:ギャップ、オーバーハング)がなく、連続した(例:ニックが欠けた)核酸の2本の鎖から構成される。さらに、鎖を、配列決定プロセスで使用されるアダプターのライゲーション用に調製する必要がある。伝統的に、このプロセスでは多くの特定の酵素が用いられる:例えばDNAポリメラーゼ(単数または複数)は、3’オーバーハングを主に消化し5’オーバーハングを埋め、ポリヌクレオチドキナーゼ(単数または複数)は断片末端をリン酸化し、およびDNAポリメラーゼ(単数または複数)は、アデニン(例:デオキシアデノシン一リン酸(dAMP)の形態で)の、3’末端への非鋳型付加(例:デオキシチミン一リン酸(dTMP)テール付き配列決定アダプターのライゲーションが求められる場合)を実施する。例えば、DNAポリメラーゼ(単数または複数)は、dNTPの混合物と共に提供されて、3’末端ヌクレオチドが認識されかつ対応する鋳型鎖が存在する場合に、鎖の合成を開始する。この部位(例:3’末端ヌクレオチド)は、二重鎖が5’オーバーハングを含有する鎖の、ニック、ギャップ、または3’末端に存在し得る。さらに、使用される1つ以上のDNAポリメラーゼ(単数または複数)は、鎖置換活性または5’エキソヌクレアーゼ活性のいずれかを有するため、下流にあるすべての断片を除去(例:置換または消化)する。例えば、これに限定されないが、合成がニックまたはギャップで開始される場合、新たに合成された鎖は、下流の「ネイティブ」鎖を除去しこれを再合成する。この再合成は、前述の問題の一部を修正するがフェイルセーフではなく、元の「ネイティブ」鎖には存在しなかった誤った情報を、再合成された鎖に導入する可能性がある。これは、ミスマッチ塩基または損傷塩基(例:病変)を介した合成の結果として発生する可能性があり、ポリメラーゼに対し、「ネイティブ」鎖の塩基を代表していない、ミスマッチまたは損傷塩基に相補的な塩基を挿入するように、指示する可能性がある。これは次に、配列決定の結果において、一方の鎖上のミスマッチ塩基とは対照的に、両方の鎖上の正しく対になった塩基のセットとして解釈されるが、これは正確ではない(例:偽変異である)。これと同じエラーは、損傷塩基またはミスマッチ塩基を介して合成が起きるどの場所でも生じ得る(例:試料が一本鎖である場合などでも)。さらに、かかる鎖の置換および再合成は、鎖内の不一致、または二重鎖内のミスマッチがある場所を、覆い隠す(例:消去する)ことができる。したがって、二重鎖配列決定法の精度を高め、偽変異の導入を軽減するための改善が必要である。
本明細書で使用され得る用語「実質的に」は、活性の程度または豊富さを記載するために使用する場合、一般に、過度の努力なしで達成可能な量としての、活性の値を指す。理解できるように、この量は実施される活動に応じて変化し、単純な活動ではより高い閾値が必要となり、より複雑な活動ではより低い閾値が必要となる。例えば、限定されないが、試薬、dNTP、または酵素を混合物から実質的に排除または除去することを指す場合、実質的な量は、50%以上の除去を指し得る。いくつかの態様において、実質的にとは、少なくとも50%(例:50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%、99.95%、99.99%、またはそれ以上)、および実験誤差内にある変数のすべての値(例:平均について95%信頼区間)または示された値の+/-10%以内の、いずれか大きい方を指す。いくつかの態様において、実質的にとは、標的の少なくとも75%が除去されることを指す。いくつかの態様において、実質的にとは、標的の少なくとも80%が除去されることを指す。いくつかの態様において、実質的にとは、標的の少なくとも85%が除去されることを指す。いくつかの態様において、実質的にとは、標的の少なくとも90%が除去されることを指す。いくつかの態様において、実質的にとは、標的の少なくとも95%が除去されることを指す。
本明細書で使用され得る用語「キナーゼ」は、リン酸基の基質への転移(例:ATPからのリン酸基を、核酸(例:DNA)へ)を触媒する酵素を指すことが当業者に知られている技術用語である。したがって、キナーゼを使用して、ライゲーション用のDNAを調製することができる(例:5’リン酸塩が利用可能であることを確認することにより)。いくつかの態様において、キナーゼはポリヌクレオチドキナーゼ(Pnk)である。いくつかの態様において、キナーゼはT4ポリヌクレオチドキナーゼである。
本明細書で使用され得る用語「下流」は、複数ヌクレオチド(例:核酸)の所与の配列におけるランドマークに対する、あるヌクレオチドの位置を指し、下流とは、ランドマークよりも「さらに3’側」を意味するものとする(核酸の場合)。例えばヌクレオチドは、それがランドマークよりも核酸の3’末端に近い(したがって5’末端から遠い)場合、ランドマークの下流にある。逆に、本明細書で使用され得る用語「上流」は、複数ヌクレオチド(例:核酸)の所与の配列のランドマークに対する、あるヌクレオチドの位置を指し、上流とは、ランドマークよりも「さらに5’側」を意味するものとする(核酸の場合)。例えばヌクレオチドは、それがランドマークよりも核酸の5’末端に近い(したがって3’末端から遠い)場合、ランドマークの上流にある。
二重鎖修復(DR)方法
したがっていくつかの側面において、本開示は、もともと天然では一本鎖のみにあったヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑える、配列決定用の核酸試料(試料;およびかかる用語は本明細書でさらに詳しく説明する)を調製する方法に関し、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、ならびに以下を含む:(a)試料を、以下が可能な1つ以上の酵素と接触させること:(i)1つ以上の損傷塩基を、試料から切除すること;(ii)1つ以上の脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること;(iii)および5’オーバーハングを消化すること;(b)試料を、以下の1つ以上と接触させること:(i)鎖置換および5’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ/または試料の3’オーバーハングを消化することができる、DNA依存性DNAポリメラーゼ;および(ii)試料の鎖の5’末端をリン酸化することができる酵素;および(c)試料を、ニックをシーリング可能なDNAリガーゼと接触させること。いくつかの態様において、本開示の方法はさらに以下を含む:(d)アダプターライゲーション用の試料を調製すること、ここで調製は:(i)デオキシアデノシン一リン酸(dAMP)を試料の鎖の3’末端に付加すること(dAテーリング);または(ii)任意に試料の末端をさらに平滑化すること、を含む。
二重鎖修復(DR)方法
したがっていくつかの側面において、本開示は、もともと天然では一本鎖のみにあったヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑える、配列決定用の核酸試料(試料;およびかかる用語は本明細書でさらに詳しく説明する)を調製する方法に関し、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、ならびに以下を含む:(a)試料を、以下が可能な1つ以上の酵素と接触させること:(i)1つ以上の損傷塩基を、試料から切除すること;(ii)1つ以上の脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること;(iii)および5’オーバーハングを消化すること;(b)試料を、以下の1つ以上と接触させること:(i)鎖置換および5’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ/または試料の3’オーバーハングを消化することができる、DNA依存性DNAポリメラーゼ;および(ii)試料の鎖の5’末端をリン酸化することができる酵素;および(c)試料を、ニックをシーリング可能なDNAリガーゼと接触させること。いくつかの態様において、本開示の方法はさらに以下を含む:(d)アダプターライゲーション用の試料を調製すること、ここで調製は:(i)デオキシアデノシン一リン酸(dAMP)を試料の鎖の3’末端に付加すること(dAテーリング);または(ii)任意に試料の末端をさらに平滑化すること、を含む。
いくつかの側面において、方法は、試料の少なくとも一部が二本鎖である核酸試料(試料)を調製することを含み、これは以下を含む:(a)試料を、以下が可能な1つ以上の酵素と接触させること:(i)試料の鎖の5’末端をリン酸化すること;3’ヒドロキシル部分を、試料の鎖の3’末端に付加すること;および(ii)ニックをシーリングすること;(b)試料を、5’および3’オーバーハングを除去すると共にギャップ領域を消化して平滑化二重鎖を生成することができる1つ以上の酵素と接触させること;および(c)デオキシアデノシン一リン酸(dAMP)を、試料の鎖の3’末端に付加すること(dAテーリング)。かかる方法において、損傷塩基を切除する必要性、ExoVIIで処理する必要性、またはExoVII処理後に残されたギャップおよび短い5’オーバーハングを埋める必要性は、酵素(例:エンドヌクレアーゼ(例:ヌクレアーゼS1))を使用して、一本鎖ギャップ領域を切断し、オーバーハング領域に存在するヌクレオチドを切断することにより、軽減され得る。いくつかの態様において、ステップ(a)(1)で使用される酵素は、T4ポリヌクレオチドキナーゼ、HiFi Taqリガーゼ、またはそれらの組み合わせを含む。いくつかの態様において、ステップ(b)で使用される酵素は、ヌクレアーゼS1である。
本明細書で使用され得る用語「エンドヌクレアーゼ」および「ヌクレアーゼ」は、一般にポリヌクレオチド鎖(例:オリゴヌクレオチド、核酸)内のホスホジエステル結合(単数または複数)を切断する酵素を指すことが当業者に知られている技術用語である。ヌクレアーゼは天然に存在する場合もあれば、遺伝子操作された場合もある。いくつかの態様において、エンドヌクレアーゼは、エンドヌクレアーゼIV(EndoIV)である。いくつかの態様において、エンドヌクレアーゼは、エンドヌクレアーゼVIII(EndoVIII)である。いくつかの態様において、ヌクレアーゼはヌクレアーゼS1を含む(例えば、限定はされないが以下を参照されたい:thermofisher.com/order/catalog/product/EN0321#/EN0321;promega.com/products/cloning-and-dna-markers/molecular-biology-enzymes-and-reagents/s1-nuclease/?catNum=M5761;takarabio.com/products/cloning/modifying-enzymes/nucleases/s1-nuclease;およびsigmaaldrich.com/US/en/product/SIGMA/N5661)。ヌクレアーゼS1は一本鎖核酸を分解し、5’-ホスホリルモノヌクレオチドまたはオリゴヌクレオチドを放出し、および、二本鎖DNA(dsDNA)を、ニック、ギャップ、ミスマッチ、またはループによって生じた一本鎖領域で切断することもある。
本明細書に記載の方法を実施することにより、偽変異が導入される可能性は実質的に軽減される。例えば、最初に損傷塩基を切除し、脱塩基部位を切断し、かつ得られた末端を、DNAポリメラーゼによる伸長と試料からのDNAリガーゼによるライゲーションに適合するように処理する酵素を使用することにより、一方の鎖で塩基が切除されてギャップが生成されるか(ここで相補鎖は切除点にまだ存在し、二重鎖が無傷のままであるための主鎖を形成する)、または、二重鎖/鎖の破断が発生し、2つの「娘」二重鎖が作成される(ここで、相補鎖は切除点には存在せず、二重鎖は2つの小さな核酸に分解される)。このステップの利点は、限定されないが、損傷塩基が存在するギャップ領域において鎖破断を誘導することであり、なぜならば、本明細書に開示される方法のステップ(b)はDNAポリメラーゼを使用してギャップを埋めることを含み得るが、一方、アダプターライゲーション前に再合成されなかった完全二重鎖領域の1つの鎖上の任意の損傷塩基またはミスマッチ塩基は、修正されないままであれば、コンピュータで二重鎖配列決定を用いて解決される可能性があるからである。さらに、これらの得られた二重鎖(無傷であるか、または分解されている(例:鎖破断が起こっている))は、その後、5’オーバーハングを消化できる酵素に曝露される(例:接触される)と、任意の5’オーバーハングの長さが実質的に低減され、その後のステップ(b)での、断片の最末端までの埋め込みを制限するであろう。次に得られた二重鎖を、鎖置換および5’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋めることができかつ3’オーバーハングの消化が可能なDNA依存性DNAポリメラーゼ、およびポリヌクレオチドキナーゼに曝露(例:接触)させると、前のステップで完全に消化されなかった任意の残りの短い5’オーバーハングは埋められて、平滑末端が得られ;任意の残りの3’オーバーハングは消化されて平滑末端が生成され;および、任意の内部ギャップ(例:損傷塩基の切除および脱塩基部位の切断によって生じる小さなギャップ、およびDNA断片にも存在し得る任意のより長いギャップ)は、下流のDNAセグメントの5’末端まで埋められる。次に、得られた二重鎖を、ニックを(好ましくは、キメラ形成を避けるために最小限の末端結合活性で)シーリング可能なDNAリガーゼに曝露(例:接触)させると、任意の残りのニック(例:試料中に本質的に存在する他のもののうち、ギャップを埋めた後に残ったニック)はシールされ、連続した平滑二重鎖を形成する。次に、得られた二重鎖を、それぞれ5’エキソヌクレアーゼ活性および鎖置換活性を有するTaqまたはクレノウ断片などのDNAポリメラーゼを使用して、DNA二重鎖の3’末端への、dAMPの非鋳型伸長(例:付加)(例:dAテーリング)を実行できるDNAポリメラーゼに曝露する(例:接触させる)と、鎖再合成に利用できる「プライミング部位」が実質的に少なくなる。さらに、ステップ(d)が、dAMP以外のヌクレオチドの付加を制限する条件下で実施される場合(例:このステップの前にdNTPを実質的に除去することによって、または極端に過剰なdATPを提供することによって)、このステップでの鎖再合成の可能性は、大幅に軽減することができる。この保存された情報は、変異の精度および解像度の大幅な向上を可能にする。
本明細書で使用され得る用語「接触された」は、1つの物質(例:酵素、試薬、dNTP)の別の物質(例:試料、混合物)への暴露であって、ある量および意図で、すなわち、2つの物質が相互作用して、一方の物質の活性が他方の物質(例:試料に作用する酵素)に影響を与えるようにすること、または2つの物質が相互作用することを意図しての、前記曝露を記述するために使用される。この用語は、2つの物質間の物理的接触を必要とするものと解釈されるべきではないが、さらに物理的接触を禁止するものでもない。例えば、物質間の相互作用および/または活性に影響を与えるのに、近接性は十分であり得る。いくつかの態様において、接触は、物質を同じ容器(例:反応容器)に導入することによって達成される。いくつかの態様において、接触は、物質を同じ反応容器に導入することによって達成される。いくつかの態様において、接触は、物質A(例:試薬、dNTP、酵素など)を、物質B(例:試料)を含有するか、物質Bが同時に導入されるか、または物質Bが後で導入される反応容器に導入することによって達成される。いくつかの態様において、接触は、物質が互いに物理的に接触する(例:物理的に相互作用する)ときに達成される。いくつかの態様において、接触は、物質が互いに化学的に相互作用するときに達成される。いくつかの態様において、接触は、物質が互いに酵素的に相互作用するときに達成される。いくつかの態様において、接触は、物質が互いに近接しているときに達成される。
いくつかの態様において、本開示の方法はさらに(d)アダプターライゲーション用の試料を調製することを含み、ここで調製することは:(i)デオキシアデノシン一リン酸(dAMP)を試料の鎖の3’末端に付加すること(dAテーリング);または(ii)試料の末端を平滑化すること、を含む。いくつかの態様において、dAテーリングは、試料を、デオキシアデノシン一リン酸(dAMP)を試料の鎖の3’末端に組み込むことができる酵素と接触させること、および、試料を、dNTPと接触させることを含む。いくつかの態様において、本開示の方法のステップ(a)~(c)で使用される酵素および/またはdNTPは、dAテーリングの前に、反応容器から実質的に除去される。いくつかの態様において、dNTPは実質的にdATPを含む。いくつかの態様において、本明細書に開示される方法の1つ以上(例:ステップ(a)、(b)、(c)、(d)等の代表として、1、2、3、4、5、またはそれ以上)は、「ワンポット」反応で行われ、ここでこれらのステップは、酵素および緩衝液を同じ反応容器に順次添加し、反応条件(例:温度)を調整することによって、実施される。いくつかの態様において、ステップは連続して実施される。いくつかの態様において、前のステップからの試薬および酵素は、次のステップに進む前に混合物から除去されない。いくつかの態様において、前のステップからの試薬および酵素は、次のステップに進む前に混合物から除去される。いくつかの態様において、1つ以上のステップが1つの反応容器内で実施される。いくつかの態様において、1つ以上のステップが、2つ以上の反応容器内で実施される(例:方法全体を通じて少なくとも1つの時点で移される)。
いくつかの態様において、試料を、ステップ(a)の1つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも15秒間(例:15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60秒、またはそれ以上)接触させる。いくつかの態様において、試料を、ステップ(a)の1つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも1分間(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60分、またはそれ以上)接触させる。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも5分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも25分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする。いくつかの態様において、試料を、ステップ(a)の1つ以上の酵素と、方法の任意の後続のステップに進む前に6時間未満(例:6、5、4、3、2、1時間、またはそれ未満)接触させる。いくつかの態様において、試料を、ステップ(a)の1つ以上の酵素と、方法の任意の後続のステップに進む前に60分未満(例:60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1分、またはそれ未満)接触させる。いくつかの態様において、試料を、ステップ(a)の1つ以上の酵素と、方法の任意の後続のステップに進む前に1~60分間接触させる。いくつかの態様において、試料を、ステップ(a)の1つ以上の酵素と、方法の任意の後続のステップに進む前に10~45分間接触させる。いくつかの態様において、試料を、ステップ(a)の1つ以上の酵素と、方法の任意の後続のステップに進む前に20~35分間接触させる。
いくつかの態様において、試料を、ステップ(b)の1つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも15秒間(例:15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60秒、またはそれ以上)接触させる。いくつかの態様において、試料を、ステップ(b)の1つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも1分間(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60分、またはそれ以上)接触させる。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも5分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも25分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする。いくつかの態様において、試料を、ステップ(b)の1つ以上の酵素と、方法の任意の後続のステップに進む前に6時間未満(例:6、5、4、3、2、1時間、またはそれ未満)接触させる。いくつかの態様において、試料を、ステップ(b)の1つ以上の酵素と、方法の任意の後続のステップに進む前に60分未満(例:60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1分、またはそれ未満)接触させる。いくつかの態様において、試料を、ステップ(b)の1つ以上の酵素と、方法の任意の後続のステップに進む前に1~60分間接触させる。いくつかの態様において、試料を、ステップ(b)の1つ以上の酵素と、方法の任意の後続のステップに進む前に10~45分間接触させる。いくつかの態様において、試料を、ステップ(b)の1つ以上の酵素と、方法の任意の後続のステップに進む前に20~35分間接触させる。
いくつかの態様において、試料を、ステップ(c)の1つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも15秒間(例:15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60秒、またはそれ以上)接触させる。いくつかの態様において、試料を、ステップ(c)の1つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも1分間(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60分、またはそれ以上)接触させる。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも5分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも25分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする。いくつかの態様において、試料を、ステップ(c)の1つ以上の酵素と、方法の任意の後続のステップに進む前に6時間未満(例:6、5、4、3、2、1時間、またはそれ未満)接触させる。いくつかの態様において、試料を、ステップ(c)の1つ以上の酵素と、方法の任意の後続のステップに進む前に60分未満(例:60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1分、またはそれ未満)接触させる。いくつかの態様において、試料を、ステップ(c)の1つ以上の酵素と、方法の任意の後続のステップに進む前に1~90間接触させる。いくつかの態様において、試料を、ステップ(c)の1つ以上の酵素と、方法の任意の後続のステップに進む前に30~60分間接触させる。いくつかの態様において、試料を、ステップ(c)の1つ以上の酵素と、方法の任意の後続のステップに進む前に35~55分間接触させる。いくつかの態様において、温度サイクルが起こり得る場合、本明細書に記載される接触時間は、任意の温度への暴露についての、または関係するステップの温度サイクルの任意の部分についてのものであり得る。
いくつかの態様において、試料を、ステップ(d)の1つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも15秒間(例:15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60秒、またはそれ以上)接触させる。いくつかの態様において、試料を、ステップ(d)の1つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも1分間(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60分、またはそれ以上)接触させる。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも5分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも25分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする。いくつかの態様において、試料を、ステップ(d)の1つ以上の酵素と、方法の任意の後続のステップに進む前に6時間未満(例:6、5、4、3、2、1時間、またはそれ未満)接触させる。いくつかの態様において、試料を、ステップ(d)の1つ以上の酵素と、方法の任意の後続のステップに進む前に60分未満(例:60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1分、またはそれ未満)接触させる。いくつかの態様において、試料を、ステップ(d)の1つ以上の酵素と、方法の任意の後続のステップに進む前に1~60分間接触させる。いくつかの態様において、試料を、ステップ(d)の1つ以上の酵素と、方法の任意の後続のステップに進む前に10~45分間接触させる。いくつかの態様において、試料を、ステップ(d)の1つ以上の酵素と、方法の任意の後続のステップに進む前に20~35分間接触させる。
いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも15秒の第2の期間(例:15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60秒、またはそれ以上)インキュベートする。いくつかの態様において、第2の期間は、少なくとも1分(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60分、またはそれ以上)である。いくつかの態様において、第2の期間は少なくとも5分である。いくつかの態様において、第2の期間は少なくとも25分である。いくつかの態様において、第2の期間は少なくとも30分である。いくつかの態様において、第2の期間は、6時間未満(例:6、5、4、3、2、1時間、またはそれ未満)である。いくつかの態様において、第2の期間は、60分未満(例:60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1分、またはそれ未満)である。いくつかの態様において、第2の期間は1~60分である。いくつかの態様において、第2の期間は10~45分である。いくつかの態様において、第2の期間は、方法の任意の後続のステップに進む前に、20~35分である。
いくつかの態様において、本明細書に開示される任意の方法のステップ(a)は、約20℃~約50℃の温度(例:20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50℃)で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(a)は、約25℃~約45℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(a)は、約30℃~約40℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(a)は、約35℃~約39℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(a)は、約37℃の温度で実施される。
いくつかの態様において、本明細書に開示される任意の方法のステップ(b)は、約20℃~約50℃の温度(例:20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50℃)で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(b)は、約25℃~約45℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(b)は、約30℃~約40℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(b)は、約35℃~約39℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(b)は、約37℃の温度で実施される。
いくつかの態様において、本明細書に開示される任意の方法のステップは、酵素反応を促進するために複数の温度で実行され得る。例えば、これに限定されないが、繰り返しの曝露と「サイクル」が望ましい場合、手動または自動の温度サイクルを使用することができる。かかるサイクルのための技術、方法、およびプロトコルは、当技術分野でよく知られている。いくつかの態様において、サイクルは、自動サーモサイクラーで実施されてもよい。いくつかの態様において、サイクルは、2つの温度設定点:第1温度と第2温度を有し得る。
いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約20℃~約50℃の第1温度(例:20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50℃)で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約25℃~約45℃の第1温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約30℃~約40℃の第1温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約33℃~約37℃の第1温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約35℃の第1温度で実施される。
いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約40℃~約80℃の第2温度(例:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80℃)で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約55℃~約75℃の第2温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約60℃~約70℃の第2温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約63℃~約67℃の第2温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(c)は、約65℃の第2温度で実施される。
いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約18℃~約70℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約20℃~約66℃の温度で実施される。いくつかの態様において、本明細書に記載の方法のステップ(d)は、2つの異なる温度、温度1および温度2で実施される。
いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約17℃~約25℃の温度1(例:17、18、19、20、21、22、23、24、25℃)で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約19℃~約23℃の温度1で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約20℃~約22℃の温度1で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約22℃の温度1で実施される。
いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約60℃~約70℃の温度2(例:60、61、62、63、64、65、66、67、68、69、70℃)で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約62℃~約68℃の温度2で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約64℃~約66℃の温度2で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ(d)は、約65℃の温度2で実施される。
いくつかの態様において、ステップ(a)の前に、試料は(i)断片化される;または(ii)切断およびタグ付けされる(タグメントされる)。いくつかの態様において、断片化は、(a)物理的断片化;(b)酵素的断片化;および/または(c)化学的断片化によるものである。いくつかの態様において、断片化は物理的断片化による。いくつかの態様において、物理的断片化は噴霧化による。いくつかの態様において、物理的断片化は音響剪断(acoustic shearing)による。いくつかの態様において、物理的断片化はニードル剪断(needle shearing)による。いくつかの態様において、物理的断片化はフレンチプレッシャーセル(French pressure cell)による。いくつかの態様において、物理的断片化は超音波処理による。いくつかの態様において、物理的断片化は流体力学的剪断による。いくつかの態様において、断片化は酵素的断片化による。いくつかの態様において、酵素的断片化はヌクレアーゼまたはエンドヌクレアーゼによる。いくつかの態様において、酵素的断片化はDNase Iによる。いくつかの態様において、酵素的断片化は制限エンドヌクレアーゼによる。いくつかの態様において、酵素的断片化はトランスポザーゼ(transposase)による。いくつかの態様においては、化学的断片化による。いくつかの態様において、化学的断片化は熱および二価金属カチオン断片化による。
いくつかの態様において、ステップ(a)は、試料を、以下からなる群から選択される1つ以上の酵素と接触させることを含む:(1)エンドヌクレアーゼIV(EndoIV);(2)ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);(3)ウラシル-DNAグリコシラーゼ(UDG);(4)T4ピリミジンDNAグリコシラーゼ(T4 PDG);(5)エンドヌクレアーゼVIII(EndoVIII)、および(6)エキソヌクレアーゼVII(ExoVII)。
本明細書で使用され得る用語「グリコシラーゼ」は、核酸(例:DNA)の修復に主に関与する酵素を指すことが当業者に一般に知られている技術用語を指す。グリコシラーゼがDNA修復を助ける主な活性は、塩基切除修復によるものであり、これは損傷DNAを除去し、エラーのない新しい新鮮なDNAに置き換える(例:損傷塩基(例:病変)を除去または修復する)。グリコシラーゼは、主鎖(例:糖リン酸基)を無傷のまま残しながら、DNAの損傷した窒素部分と相互作用する。この切除により、損傷塩基の合成と置換(例:新しいDNAの挿入)がその部位において可能となる。例えば、限定されないが、DNAグリコシラーゼは、N-グリコシド結合を切断することによって、ウラシル残基をDNAから切除し、これによりDNA切除修復プロセスが開始される。いくつかの態様において、グリコシラーゼは、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);ウラシル-DNAグリコシラーゼ(UDG);T4ピリミジンDNAグリコシラーゼ(T4 PDG);またはそれらの組み合わせから選択される。いくつかの態様において、グリコシラーゼは、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg)である。いくつかの態様において、グリコシラーゼは、ウラシル-DNAグリコシラーゼ(UDG)である。いくつかの態様において、グリコシラーゼは、T4ピリミジンDNAグリコシラーゼ(T4 PDG)である。
いくつかの態様において、1つ以上の酵素の活性は、試料上の以下のDNA改変を触媒する:(1)損傷塩基の切除;および(2)脱塩基部位の切除。いくつかの態様において、1つ以上の酵素の活性は、逐次的または同時である。
いくつかの態様において、損傷塩基は、ウラシル;8’オキソG;酸化ピリミジン;およびシクロブタンピリミジン二量体からなる群から選択される。
いくつかの態様において、試料の少なくとも1つの鎖の5’オーバーハングは、少なくとも10核酸塩基長である。いくつかの態様において、試料の少なくとも1つの鎖の5’オーバーハングは、少なくとも75核酸塩基長である。いくつかの態様において、試料の少なくとも1つの鎖の3’オーバーハングは、少なくとも10核酸塩基長である。いくつかの態様において、試料の少なくとも1つの鎖の3’オーバーハングは、少なくとも75核酸塩基長である。
いくつかの態様において、1つ以上の酵素は、試料の少なくとも1つの鎖の5’オーバーハングを、16核酸塩基未満の長さに消化する。いくつかの態様において、1つ以上の酵素は、試料の少なくとも1つの鎖の5’オーバーハングを、8核酸塩基未満の長さに消化する。いくつかの態様において、1つ以上の酵素は、試料の少なくとも1つの鎖の3’オーバーハングを、16核酸塩基未満の長さに消化する。いくつかの態様において、1つ以上の酵素は、試料の少なくとも1つの鎖の3’オーバーハングを、8核酸塩基未満の長さに消化する。
いくつかの態様において、エンドヌクレアーゼIV(EndoIV)は、脱塩基部位を切断する。いくつかの態様において、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼは、損傷プリンを切除する。いくつかの態様において、ウラシル-DNAグリコシラーゼ(UDG)は、ウラシルを切除する。いくつかの態様において、T4ピリミジンDNAグリコシラーゼ(T4 PDG)は、シクロブテンピリミジン二量体を切除する。いくつかの態様において、エンドヌクレアーゼVIII(EndoVIII)は、損傷ピリミジンを切除する。いくつかの態様において、DNAリガーゼは、HiFi Taq DNAリガーゼである。
いくつかの態様において、本開示の方法のステップ(b)は、DNA断片をポリヌクレオチドキナーゼ(Pnk)と接触させることを含む。いくつかの態様において、Pnkは、T4ポリヌクレオチドキナーゼである。
本開示の任意の方法のいくつかの態様において:(a)エンドヌクレアーゼIV(EndoIV)は、配列番号3または任意の既知のエンドヌクレアーゼIV配列に対して少なくとも70%の同一性(例:少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)を有するアミノ酸配列を含み;(b)ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg)は、配列番号4または任意の既知のホルムアミドピリミジン[fapy]-DNAグリコシラーゼ配列に対して少なくとも70%の同一性(例:少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)を有するアミノ酸配列を含み;(c)ウラシル-DNAグリコシラーゼ(UDG)は、配列番号5~7からなる群から選択されるアミノ酸配列または任意の既知のウラシル-DNAグリコシラーゼ配列に対して少なくとも70%の同一性(例:少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)を有するアミノ酸配列を含み;(d)T4ピリミジンDNAグリコシラーゼ(T4 PDG)は、任意の既知のT4ピリミジンDNAグリコシラーゼ配列に対して少なくとも70%の同一性(例:少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)を有するアミノ酸配列を含み;および/または(e)エンドヌクレアーゼVIII(EndoVIII)は、配列番号8~9からなる群から選択されるアミノ酸配列または任意の既知のエンドヌクレアーゼVIII配列に対して少なくとも70%の同一性(例:少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)を有するアミノ酸配列を含む。
本開示の任意の方法のいくつかの態様において、ポリヌクレオチドキナーゼは、配列番号10のアミノ酸配列または任意の既知のポリヌクレオチドキナーゼ配列に対して少なくとも70%の同一性(例:少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)を有するアミノ酸配列を含む。
本開示の任意の方法のいくつかの態様において:(1)DNA依存性DNAポリメラーゼは、任意の既知のDNA依存性DNAポリメラーゼ配列に対して少なくとも70%の同一性(例:少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)を有するアミノ酸配列を含み;および/または(2)DNAリガーゼは、任意の既知のDNAリガーゼ配列に対して少なくとも70%の同一性(例:少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)を有するアミノ酸配列を含む。
いくつかの側面において、本開示は、偽変異の検出を軽減する二重鎖配列決定の方法であって、以下を含む方法に関する:(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~51のいずれか1つに記載の方法を実施すること;(A3)試料を二重鎖配列決定すること;および(A4)変異をコンピュータ分析により同定すること。
いくつかの側面において、本開示は、二重鎖配列決定におけるアーチファクトを低減する方法であって、以下を含む方法に関する:(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~51のいずれか1つに記載の方法を実施すること;および(A3)試料を二重鎖配列決定すること。
いくつかの側面において、本開示は、配列決定のための核酸試料調製の間に合成鎖の合成を低減する方法であって、以下を含む方法に関する:(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~51のいずれか1つに記載の方法を実施すること。
いくつかの側面において、本開示は、変異同定の精度を高める方法であって、以下を含む方法に関する:(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~51のいずれか1つに記載の方法を実施すること;(A3)試料を二重鎖配列決定すること;および(A4)変異をコンピュータ分析により同定すること。
いくつかの態様において、試料は配列決定される。いくつかの態様において、配列決定はサンガーベースの配列決定である。いくつかの態様において、配列決定は、高スループット配列決定(例:次世代配列決定)に基づく。次世代配列決定または「NGS」は当技術分野で周知であり、当業者には容易に明らかであろう。例えば、限定されないが、NGS配列決定技法にはLife Technologies(商標)およびIllumina(商標)、PacBio、およびOxford Nanoporeからのものが含まれる。いくつかの態様において、配列決定は二重鎖配列決定である。いくつかの態様において、配列決定はコンピュータ上のコンピュータ分析を含む。いくつかの態様において、このコンピュータ分析は、試料配列のトリミングを含む。トリミングは、鎖の少なくとも1つの末端における、所与の断片の配列決定をトリミングすることを含み得る。このトリミングは、少なくとも部分的には、多くの場合本明細書の他の場所で説明されるように、鎖再合成により断片の末端で発生し得る偽変異またはミスマッチによる任意のエラーを、補償または低減するために実施される。いくつかの態様において、トリミングは、少なくとも1つの末端で生じる。いくつかの態様において、トリミングは両方の末端で生じる。いくつかの態様において、配列の少なくとも1つのヌクレオチドがトリミングされる(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれ以上)。いくつかの態様において、少なくとも10のヌクレオチドがトリミングされる。いくつかの態様において、少なくとも12のヌクレオチドがトリミングされる。いくつかの態様において、配列の30未満のヌクレオチドがトリミングされる(例:30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、または1)。いくつかの態様において、15未満のヌクレオチドがトリミングされる。いくつかの態様において、少なくとも13のヌクレオチドがトリミングされる。
いくつかの側面において、本開示は、以下を含むキットに関する:(a)本開示の任意の方法を実施するための試薬;および(b)容器。いくつかの態様において、キットはさらに反応容器を含む。いくつかの態様において、キットの試薬は以下を含む:(a)次の1つ以上:エンドヌクレアーゼIV(EndoIV);ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);ウラシル-DNAグリコシラーゼ(UDG);T4ピリミジンDNAグリコシラーゼ(T4 PDG);および/またはエンドヌクレアーゼVIII(EndoVIII);および/または、(b)dNTP。いくつかの態様において、キットはさらに、試料を断片化するための試薬および材料を含む。
コンピュータ分析は、任意の適切なアルゴリズム、例えばParsons et al. Clinical Cancer Research, DOI: 10.1158/1078-0432.CCR-19-3005, vol. 26, No. 11, pp. 2556-2564、2020年6月発行に記載されており、その全体は参照により本明細書に組み込まれる。
試料
いくつかの態様において、本開示の任意の方法で使用される試料は、DNA、RNA、またはそれらの組み合わせを含む。いくつかの態様において、試料はDNAを含む。いくつかの態様において、試料はRNAを含む。適切な試料の選択、および本開示の方法の実行は、当業者には容易に明らかであり、過度の実験を必要としないであろう。例えば、限定されないが、試料は、無細胞DNA(cfDNA)および/または生殖系列DNAを含み得る。いくつかの態様において、試料はcfDNAを含む。いくつかの態様において、試料は生殖系列DNAを含む。
いくつかの態様において、本開示の任意の方法で使用される試料は、DNA、RNA、またはそれらの組み合わせを含む。いくつかの態様において、試料はDNAを含む。いくつかの態様において、試料はRNAを含む。適切な試料の選択、および本開示の方法の実行は、当業者には容易に明らかであり、過度の実験を必要としないであろう。例えば、限定されないが、試料は、無細胞DNA(cfDNA)および/または生殖系列DNAを含み得る。いくつかの態様において、試料はcfDNAを含む。いくつかの態様において、試料は生殖系列DNAを含む。
さらに、容易に明らかなように、試料は様々な供給源から生成され得る。試料を構成する核酸は、対象の任意の成分に由来し得る。例えば、限定されないが、試料は、対象を構成する血液、唾液、または他の細胞成分であり得る。いくつかの態様において、試料は、対象から生検によって生成される。いくつかの態様において、生検は液体生検である。いくつかの態様において、生検は腫瘍生検である。
いくつかの態様において、試料はゼロのギャップ(例:0)を含有する。いくつかの態様において、試料は、少なくとも1つのギャップ(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上のギャップ)を含む。いくつかの態様において、試料は、1つより多くのギャップ(例:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上のギャップ)を含む。いくつかの態様において、試料は、10以下のギャップ(例:100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、または0のギャップ)を含む。いくつかの態様において、試料は、10以下のギャップ(例:10、9、8、7、6、5、4、3、2、1、または0のギャップ)を含む。いくつかの態様において、試料は、0~101のギャップを含む。いくつかの態様において、試料は0~11のギャップを含む。いくつかの態様において、試料は1~101のギャップを含む。いくつかの態様において、試料は1~11のギャップを含む。
いくつかの態様において、ギャップは試料の一本鎖領域を含み、ここで少なくとも1つ(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上)のヌクレオシドは、試料の一本鎖部分の反対側に存在しない。いくつかの態様において、ギャップは、試料の一本鎖領域を含み、ここで、1つより多く(例:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上)のヌクレオシドは、二重鎖の一本鎖部分の反対側に存在しない。いくつかの態様において、ギャップは、試料の一本鎖領域を含み、ここで、100未満(例:100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、または1)のヌクレオシドは、試料の一本鎖領域の反対側に存在しない。いくつかの態様において、ギャップは試料の一本鎖領域を含み、ここで、10未満(例:10、9、8、7、6、5、4、3、2、または1)のヌクレオシドは、試料の一本鎖領域の反対側に存在しない。いくつかの態様において、ギャップは一本鎖領域を含み、ここで1~101のヌクレオシドは、試料の一本鎖領域の反対側に存在しない。いくつかの態様において、ギャップは一本鎖領域を含み、ここで1~11のヌクレオシドは、試料の一本鎖領域の反対側に存在しない。
いくつかの態様において、試料は、試料の少なくとも1つの鎖に少なくとも1つのギャップを含む。いくつかの態様において、試料は、試料の両方の鎖に少なくとも1つのギャップを含む。いくつかの態様において、試料は、試料の少なくとも1つの鎖に1つより多くのギャップを含む。いくつかの態様において、試料は、試料の両方の鎖に1つより多くのギャップを含む。
いくつかの態様において、試料はオーバーハングを含まない。いくつかの態様において、試料はオーバーハングを含む。いくつかの態様において、オーバーハングは、長さが少なくとも1ヌクレオシド(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、またはそれ以上のヌクレオシド)である。いくつかの態様において、オーバーハングは、1ヌクレオシドを超える長さである。いくつかの態様において、オーバーハングの長さは、試料の長さからオーバーハングを差し引いた長さより短い(例:試料の全長の50%未満)。いくつかの態様において、オーバーハングは、長さが350ヌクレオシド未満(例:350、349、348、347、346、345、344、343、342、341、340、339、338、337、336、335、334、333、332、331、330、329、328、327、326、325、324、323、322、321、320、319、318、317、316、315、314、313、312、311、310、309、308、307、306、305、304、303、302、301、300、299、298、297、296、295、294、293、292、291、290、289、288、287、286、285、284、283、282、281、280、279、278、277、276、275、274、273、272、271、270、269、268、267、266、265、264、263、262、261、260、259、258、257、256、255、254、253、252、251、250、249、248、247、246、245、244、243、242、241、240、239、238、237、236、235、234、233、232、231、230、229、228、227、226、225、224、223、222、221、220、219、218、217、216、215、214、213、212、211、210、209、208、207、206、205、204、203、202、201、200、199、198、197、196、195、194、193、192、191、190、189、188、187、186、185、184、183、182、181、180、179、178、177、176、175、174、173、172、171、170、169、168、167、166、165、164、163、162、161、160、159、158、157、156、155、154、153、152、151、150、149、148、147、146、145、144、143、142、141、140、139、138、137、136、135、134、133、132、131、130、129、128、127、126、125、124、123、122、121、120、119、118、117、116、115、114、113、112、111、110、109、108、107、106、105、104、103、102、101、100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1)である。いくつかの態様において、オーバーハングの長さは100ヌクレオシド未満である。いくつかの態様において、オーバーハングの長さは0~100ヌクレオシドである。いくつかの態様において、オーバーハングの長さは1~350ヌクレオシドである。いくつかの態様において、オーバーハングの長さは1~100ヌクレオシドである。いくつかの態様において、オーバーハングの長さは1~50ヌクレオシドである。
いくつかの態様において、試料は、オーバーハングを含まない。いくつかの態様において、試料は、少なくとも1つ(例:1、2)のオーバーハングを含む。いくつかの態様において、試料は2つのオーバーハングを含む。いくつかの態様において、試料は少なくとも1つの5’オーバーハングを含む。いくつかの態様において、試料は2つの5’オーバーハングを含む。いくつかの態様において、試料は少なくとも1つの3’オーバーハングを含む。いくつかの態様において、試料は2つの3’オーバーハングを含む。いくつかの態様において、試料は5’オーバーハングと3’オーバーハングを含む。
いくつかの態様において、試料はゼロのニック(例:0)を含有する。いくつかの態様において、試料は、少なくとも1つのニック(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上のニック)を含む。いくつかの態様において、試料は、1つより多くのニック(例:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上のニック)を含む。いくつかの態様において、試料は、10以下のニック(例:100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、または0のニック)を含む。いくつかの態様において、試料は、10以下のニック(例:10、9、8、7、6、5、4、3、2、1、または0のニック)を含む。いくつかの態様において、試料は、0~101のニックを含む。いくつかの態様において、試料は0~11のニックを含む。いくつかの態様において、試料は1~101のニックを含む。いくつかの態様において、試料は1~11のニックを含む。
いくつかの態様において、試料は、試料の少なくとも1つの鎖に少なくとも1つのニックを含む。いくつかの態様において、試料は、試料の両方の鎖に少なくとも1つのニックを含む。いくつかの態様において、試料は、試料の少なくとも1本の鎖に1つより多くのニックを含む。いくつかの態様において、試料は、試料の両方の鎖に1つより多くのニックを含む。
いくつかの態様において、試料はゼロの損傷塩基(例:0)を含有する。いくつかの態様において、試料は、少なくとも1つの損傷塩基(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の損傷塩基)を含む。いくつかの態様において、試料は、1つより多くの損傷塩基(例:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の損傷塩基)を含む。いくつかの態様において、試料は、10以下の損傷塩基(例:100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、または0の損傷塩基)を含む。いくつかの態様において、試料は、10以下の損傷塩基(例:10、9、8、7、6、5、4、3、2、1、または0の損傷塩基)を含む。いくつかの態様において、試料は、0~101の損傷塩基を含む。いくつかの態様において、試料は0~11の損傷塩基を含む。いくつかの態様において、試料は1~101の損傷塩基を含む。いくつかの態様において、試料は1~11の損傷塩基を含む。
いくつかの態様において、試料は、試料の少なくとも1つの鎖に少なくとも1つの損傷塩基を含む。いくつかの態様において、試料は、試料の両方の鎖に少なくとも1つの損傷塩基を含む。いくつかの態様において、試料は、少なくとも1つの鎖に1つより多くの損傷塩基を含む。いくつかの態様において、試料は、試料の二本鎖部分に損傷塩基を含む。いくつかの態様において、試料は、試料の一本鎖部分に損傷塩基を含む。いくつかの態様において、試料は、試料の一本鎖部分と二本鎖部分の両方に損傷塩基を含む。
いくつかの態様において、試料はゼロのミスマッチ(例:0)を含有する。いくつかの態様において、試料は、少なくとも1つのミスマッチ(例:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上のミスマッチ)を含む。いくつかの態様において、試料は、1つより多くのミスマッチ(例:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上のミスマッチ)を含む。いくつかの態様において、試料は、10以下のミスマッチ(例:100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、または0のミスマッチ)を含む。いくつかの態様において、試料は、10以下のミスマッチ(例:10、9、8、7、6、5、4、3、2、1、または0のミスマッチ)を含む。いくつかの態様において、試料は、0~101のミスマッチを含む。いくつかの態様において、試料は0~11のミスマッチを含む。いくつかの態様において、試料は1~101のミスマッチを含む。いくつかの態様において、試料は1~11のミスマッチを含む。
用語「同一性パーセント」、「配列同一性」、「同一性%」、「配列同一性%」、および「%同一である」は、本明細書では互換的に使用され得て、2つの配列間(例:核酸またはアミノ酸)の類似性の定量的測度を指す。ヒトと他の種との間のゲノムDNA配列、イントロンおよびエクソン配列、およびアミノ酸配列の同一性パーセントは、種の種類によって異なり、チンパンジーはすべての種の中で各カテゴリーにおいて、最も高いヒトとの同一性パーセントを有する。
2つの核酸配列の同一性パーセントの計算は、例えば、最適な比較目的のために2つの配列を整列させることによって行うことができる(例:最適アライメントのために第1および第2の核酸配列の一方または両方にギャップを導入することができ、同一でない配列は比較目的では無視することができる)。ある態様において、比較目的で整列された配列の長さは、参照配列の長さの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または100%である。次いで、対応するヌクレオチド位置のヌクレオチドを比較する。第1配列内の位置が、第2配列内の対応する位置と同じヌクレオチドによって占められている場合、分子はその位置で同一である。2つの配列間の同一性パーセントは、配列が共有する同一位置の数の関数であり、2つの配列の最適なアラインメントのために導入すべきギャップの数および各ギャップの長さを考慮する。
配列の比較および2つの配列間の同一性パーセントの決定は、数学的アルゴリズムを用いて達成することができる。例えば、2つのヌクレオチド配列間の同一性パーセントは、以下に記載されているような方法を用いて決定することができる:Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988;Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993;Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987;Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994;およびSequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991;これらの各々は、参照により本明細書に組み込まれる。例えば、2つのヌクレオチド配列間の同一性パーセントは、PAM120重み付き残基表(weight residue table)、12のギャップ長ペナルティおよび4のギャップペナルティを使用するALIGNプログラム(バージョン2.0)に組み込まれている、Meyers and Miller (CABIOS, 1989, 4:11-17)のアルゴリズムを使用して決定することができる。2つのヌクレオチド配列間の同一性パーセントは、代替的に、NWSgapdna.CMPマトリックスを用いるGCGソフトウェアパッケージのGAPプログラムを使用して決定することもできる。配列間の同一性パーセントを決定するために一般に使用される方法としては、参照により本明細書に組み込まれるCarillo, H., and Lipman, D., SIAM J Applied Math., 48:1073 (1988)に開示されたものが挙げられるが、これらに限定されない。同一性を特定するための技法は、公的に入手可能なコンピュータプログラムに体系化されている。2つの配列間の相同性を決定するための例示的なコンピュータソフトウェアとしては、GCGプログラムパッケージ、Devereux, J., et al., Nucleic Acids Research, 12(1), 387 (1984))、BLASTP、BLASTN、およびFASTA、Atschul, S. F. et al., J. Molec. Biol., 215, 403 (1990))が挙げられるが、これらに限定されない。
同一性パーセント、またはその範囲(例:少なくとも、それより多く、等)が記載されている場合、特に指定がない限りエンドポイントは含まれるものとし、その範囲(例:少なくとも70%の同一性)には引用された範囲内のすべての範囲(例:少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも95.5%、少なくとも96%、少なくとも96.5%、少なくとも97%、少なくとも97.5%、少なくとも98%、少なくとも98.5%、少なくとも99%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、少なくとも99.9%の同一性)およびそのすべての増分(例:1パーセントの10分の1(例:0.1%)、1パーセントの100分の1(例:0.01%)など)が含まれるものとする。
本明細書において別段に定義されない限り、本開示に関連して使用される科学用語および技術用語は、当業者(those of ordinary skill in the art)(例:当業者(the skilled artisan))によって一般に理解される意味を有するものとする。用語の意味および範囲は明らかであるが、潜在的な曖昧さがある場合には、本明細書で提供される定義が、任意の辞書または外部の定義より優先される。さらに、文脈により別段の要求がない限り、単数形の用語には複数形が含まれ、複数形の用語には単数形が含まれるものとする。本開示において、別段の記載がない限り、「または」の使用は「および/または」を意味する。さらに、「含むこと」という用語、ならびに「含む」および「含まれる」などの他の形式の使用は、限定的ではない。また、具体的に別段の記載がない限り、「要素」または「構成要素」などの用語は、1つのユニットを含む要素および構成要素と、2つ以上のサブユニットを含む要素および構成要素の両方を包含する。
一般に、本明細書に記載の細胞および組織培養、分子生物学、免疫学、微生物学、遺伝学、ならびにタンパク質および核酸の化学およびハイブリダイゼーションに関連して使用される命名法、およびそれらの技法は、当技術分野でよく知られており、一般に使用されているものである。本開示の方法および技法は、一般に、当技術分野で周知の従来の方法に従って、および、別段の指示がない限り、本開示全体にわたって引用および議論される様々な一般的およびより具体的な参考文献に記載されているように実施される。酵素反応および精製技法は、製造業者の仕様書に従って、当技術分野で一般的に達成されるように、または本明細書に記載のように実施される。本明細書に記載の分析化学、有機合成化学、および医薬品および創薬化学に関連して使用される命名法、ならびにそれらの実験手順および技法は、当技術分野でよく知られ一般的に使用されているものである。標準的な技法は、化学合成、化学分析、医薬品の調製、製剤化、および送達、ならびに対象の処置に使用される。
用語「およそ」または「約」は本明細書で互換的に使用され、1つ以上の興味ある値に適用される場合、記載された基準値に類似する値を指す。ある態様において、用語「およそ」または「約」は、記載された基準値のいずれかの方向の15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、またはそれ未満内(すなわち、これより大きいパーセンテージまたは小さいパーセンテージ)に入る値の範囲を指すが、ただし、別段の記載がない限り、または文脈から明らかでない限りにおいてである(例えば、かかる数値が可能な値の100%を超える場合)。
例1:二重鎖修復は二重鎖配列決定における偽変異の発見を制限する
次世代配列決定(NGS)に基づくさらなる検査が臨床使用に向けて進歩しているため、NGSの精度を最大化することが不可欠である。これは、臨床検体中の低含量の変異を検出しようとする場合に特に重要であり、例えば、早期がん検出(Chabon et al., Nature, 2020;Corcoran et al., Ann Rev Cancer Bio, 2019)、微小残存病変(「MRD」)のモニタリング(Parsons et al., Clinic Cancer Res, 2020; Tie et al., Sci Trans Med, 2016)、アクションが可能な変異または耐性変異の追跡(Parikh et al., Nat Med, 2019)、出生前遺伝子検査の実施(Lo et al., Sci Trans Med, 2010)および微生物またはウイルス感染の検出(Blauwkamp et al., 2019)などのためであり、なぜならばエラーは、不正確な診断および処置につながり得るからである。さらに、高精度のNGSは研究用途でも望まれており、例えば体細胞モザイク現象(Dou et al., Trends in Genetics, 2018)およびクローン性造血の研究(Genovese et al., 2014)、化合物の変異原性の評価(Matsumura et al., 2018)、クラスター化され規則的に間隔のあいた短い回文構造の繰り返し(「CRISPR」)(Anzalone, 2020)等の塩基編集技術の特徴付け、およびDNAのデジタルデータ保存での使用(Ceze et al., Nat Rev Genetics, 2019)などであり、なぜならばエラーは、根拠のない生物学的発見または情報の誤った(デ)コード化につながり得るからである。
次世代配列決定(NGS)に基づくさらなる検査が臨床使用に向けて進歩しているため、NGSの精度を最大化することが不可欠である。これは、臨床検体中の低含量の変異を検出しようとする場合に特に重要であり、例えば、早期がん検出(Chabon et al., Nature, 2020;Corcoran et al., Ann Rev Cancer Bio, 2019)、微小残存病変(「MRD」)のモニタリング(Parsons et al., Clinic Cancer Res, 2020; Tie et al., Sci Trans Med, 2016)、アクションが可能な変異または耐性変異の追跡(Parikh et al., Nat Med, 2019)、出生前遺伝子検査の実施(Lo et al., Sci Trans Med, 2010)および微生物またはウイルス感染の検出(Blauwkamp et al., 2019)などのためであり、なぜならばエラーは、不正確な診断および処置につながり得るからである。さらに、高精度のNGSは研究用途でも望まれており、例えば体細胞モザイク現象(Dou et al., Trends in Genetics, 2018)およびクローン性造血の研究(Genovese et al., 2014)、化合物の変異原性の評価(Matsumura et al., 2018)、クラスター化され規則的に間隔のあいた短い回文構造の繰り返し(「CRISPR」)(Anzalone, 2020)等の塩基編集技術の特徴付け、およびDNAのデジタルデータ保存での使用(Ceze et al., Nat Rev Genetics, 2019)などであり、なぜならばエラーは、根拠のない生物学的発見または情報の誤った(デ)コード化につながり得るからである。
DNA塩基の損傷は、NGSにおける偽変異発見の主な原因である(Chen et al., Science, 2017)。シトシンの脱アミノ化、チミン二量体、ピリミジン二量体、8-オキソグアニン、6-O-メチルグアニン、脱プリン化、および脱ピリミジン化などの病変は、自然発生的に発生する場合と、次のような環境および化学的暴露に反応して発生する場合がある:紫外線(UV)照射、電離放射線、活性酸素種、および遺伝毒性物質、または試料処理手順、例えばホルマリン固定、凍結と解凍、加熱、音響剪断、および水溶液での長期保存など(Costello et al., Nucleic Acids Res, 2013;Wong et al., BMC Med Genomics, 2014)。修正することなく放置すると、かかる病変は、損傷乗り越え合成が可能なポリメラーゼによってコピーされる場合に塩基対合の変化をもたらし、それによって偽変異の検出につながる可能性がある。これらの問題は、ライブラリー増幅および配列決定で導入される他のエラーと共に、標準的なNGSにおいてエラー率0.1%~1%に寄与する(Salk et al., Nat Rev Genetics, 2018)。
塩基損傷エラーの偶然性のため、多くは、各DNA断片の複数コピーを配列決定し、リード間のコンセンサスを必要とすることによって、克服することができる。かかる「コンセンサスベースの」配列決定は、DNAの各一本鎖からのコンセンサスを必要とする場合は最大100倍まで、各DNA二重鎖の両方のセンス鎖からのコンセンサスを必要とする場合は最大1000倍まで、エラーを減らすことができる。二重鎖の両方のセンス鎖の配列決定および読み取りを必要とする方法は、「二重鎖配列決定」として知られている(Schmitt et al., PNAS, 2012)。しかし、二重鎖DNAの主鎖損傷(例:ニック、ギャップ、およびオーバーハング)を修正し、NGSアダプターのライゲーションを促進するために使用される「末端修復/dAテーリング」(ER/AT)のための既存の方法では、アダプターライゲーションの前に各二重鎖の一部が再合成される可能性がある。塩基損傷の存在下で再合成が起こると、損傷乗り越え合成によりエラーが両方の鎖にコピーされ、両方の鎖上の真の変異と区別できなくなる可能性がある。二重鎖配列決定における偽の発見の、この主な原因は、短い5’オーバーハングが埋められることが多い断片末端において最も明確に見られる。しかしこれは、(i)ER/ATで使用されるTaqおよびクレノウポリメラーゼの5’エキソヌクレアーゼ活性および鎖置換活性、および(ii)鎖再合成の「プライミング部位」として機能し得る様々な主鎖損傷、を考慮すると、さらに深くまで及び得る。
本明細書で提示されるのは、少なくとも鎖再合成を制限することによって塩基損傷エラーが両方の鎖にコピーされる可能性を制限する、二重鎖修復と呼ばれるアプローチである(図1)。cfDNAおよびFFPE腫瘍生検の一分子リアルタイム配列決定および遺伝子パネル配列決定の両方を使用して、二重鎖修復が、鎖再合成を最小限に抑えて二重鎖配列決定における偽変異の発見を制限することが示された。
市販の末端修復/dAテーリング(ER/AT)キットは広範なDNA再合成を行う
まず、ER/AT方法で再合成された塩基の数を測定するためのアッセイを開発した。この技法は、d6mATP、d4mCTP、dTTP、およびdGTPからなるカスタムdNTPミックスを使用してER/ATを実施すること、およびd6mATPおよびd4mCTPが組み込まれた場所を検出できるPacBioシーケンサー上で調製されたライブラリーを配列決定すること、を含んでいた(図2A)。このアッセイが、再合成された塩基を、単一ヌクレオチド分解能で確実に検出できることを確認するために、3つの合成オリゴヌクレオチドを調製した:完全二重鎖(NGSアダプターのdAテール付きライゲーションのためのアデノシンオーバーハングを含む);10塩基対の5’オーバーハングを有するオリゴヌクレオチド;およびお80塩基対の5’オーバーハングを有するオリゴヌクレオチド。予想通り、トップ鎖のオーバーハング領域で埋め込みが観察され、市販のER/ATが5’オーバーハングを埋めることが確認された。さらに、埋め込み塩基はトップ鎖とボトム鎖の両方の3’末端の上流で検出され、T4 DNAポリメラーゼなどのポリメラーゼが、埋め込みを開始する前に3’末端を噛み返す(例:分解する)可能性があり、それがさらにDNA重合の程度を増加させたことを示唆している(図2B)。次に、市販のER/ATキットがニックまたはギャップ部位の下流のすべての塩基を再合成するかどうかを確認するための試験を実施した。短いオリゴを、80塩基対の5’オーバーハングを有する合成オリゴヌクレオチドにアニーリングして、同じ位置に1つの人工ニックまたは1ヌクレオチドのギャップを有する完全二重鎖を形成し、これが市販のER/ATに供されると、ニックまたはギャップ部位の下流の全領域が埋められることを示した(図2B)。再合成は、トップ鎖とボトム鎖の両方の3’末端の上流でも検出された。
まず、ER/AT方法で再合成された塩基の数を測定するためのアッセイを開発した。この技法は、d6mATP、d4mCTP、dTTP、およびdGTPからなるカスタムdNTPミックスを使用してER/ATを実施すること、およびd6mATPおよびd4mCTPが組み込まれた場所を検出できるPacBioシーケンサー上で調製されたライブラリーを配列決定すること、を含んでいた(図2A)。このアッセイが、再合成された塩基を、単一ヌクレオチド分解能で確実に検出できることを確認するために、3つの合成オリゴヌクレオチドを調製した:完全二重鎖(NGSアダプターのdAテール付きライゲーションのためのアデノシンオーバーハングを含む);10塩基対の5’オーバーハングを有するオリゴヌクレオチド;およびお80塩基対の5’オーバーハングを有するオリゴヌクレオチド。予想通り、トップ鎖のオーバーハング領域で埋め込みが観察され、市販のER/ATが5’オーバーハングを埋めることが確認された。さらに、埋め込み塩基はトップ鎖とボトム鎖の両方の3’末端の上流で検出され、T4 DNAポリメラーゼなどのポリメラーゼが、埋め込みを開始する前に3’末端を噛み返す(例:分解する)可能性があり、それがさらにDNA重合の程度を増加させたことを示唆している(図2B)。次に、市販のER/ATキットがニックまたはギャップ部位の下流のすべての塩基を再合成するかどうかを確認するための試験を実施した。短いオリゴを、80塩基対の5’オーバーハングを有する合成オリゴヌクレオチドにアニーリングして、同じ位置に1つの人工ニックまたは1ヌクレオチドのギャップを有する完全二重鎖を形成し、これが市販のER/ATに供されると、ニックまたはギャップ部位の下流の全領域が埋められることを示した(図2B)。再合成は、トップ鎖とボトム鎖の両方の3’末端の上流でも検出された。
この技法を、5人の健康なドナーからのcfDNAに適用した。埋め込みは主に3’末端付近で発生したが、断片のさらに深くまで伸びる可能性もあった(図2C)。場合によっては、一本鎖の大部分または鎖全体が、市販のキットを使用することによってER/ATの間に再合成された(図2D)。全体として、この結果は、市販のER/ATキットがcfDNAの主鎖損傷の修復を試みつつ大規模なDNA再合成を実施していることを示唆し、これは、配列決定されたほとんどの塩基対が元のcfDNA二重鎖からのものではない可能性があることを意味する。
鎖再合成は、塩基損傷がある場合に最も問題である
1人の健康なドナーからの無細胞DNA(cfDNA)を、異なる濃度のDNase I(さらなるニックを誘導するため)および酸化剤CuCl2/H2O2に供した。次いで、IDT xGen汎がん遺伝子パネルの標的化二重鎖配列決定を各試料に適用し、最高のエラー率を、cfDNAを最高濃度のDNase IおよびCuCl2/H2O2で処理した場合に検出した(図3B)。同じ濃度のCuCl2/H2O2では、使用したDNase Iの量に応じて測定されたエラー率が増加した。これにより、より多量のDNase Iによって誘導されるニックからの鎖再合成がより高度に行われると、より多くの塩基損傷エラーが伝播し、二重鎖配列決定エラー率が増加する可能性があることが確認された。最も高いエラー率は、最大濃度のDNase IおよびCuCl2/H2O2を使用した二重鎖配列決定で観察された。また、観察された変異は、CuCl2/H2O2曝露の予想される変異シグネチャーと一致することが確認された(図4)。
1人の健康なドナーからの無細胞DNA(cfDNA)を、異なる濃度のDNase I(さらなるニックを誘導するため)および酸化剤CuCl2/H2O2に供した。次いで、IDT xGen汎がん遺伝子パネルの標的化二重鎖配列決定を各試料に適用し、最高のエラー率を、cfDNAを最高濃度のDNase IおよびCuCl2/H2O2で処理した場合に検出した(図3B)。同じ濃度のCuCl2/H2O2では、使用したDNase Iの量に応じて測定されたエラー率が増加した。これにより、より多量のDNase Iによって誘導されるニックからの鎖再合成がより高度に行われると、より多くの塩基損傷エラーが伝播し、二重鎖配列決定エラー率が増加する可能性があることが確認された。最も高いエラー率は、最大濃度のDNase IおよびCuCl2/H2O2を使用した二重鎖配列決定で観察された。また、観察された変異は、CuCl2/H2O2曝露の予想される変異シグネチャーと一致することが確認された(図4)。
二重鎖修復はDNA末端修復およびdAテーリングの間のDNA重合を制限する
二重鎖修復は、アダプターライゲーションの前に既存のER/AT方法によって導入されるエラーを制限するための、カスタムの方法/キットである(図1、図5)。二重鎖修復は、4つのステップからなる:(1)損傷塩基の切除およびオーバーハングの除去、(2)平滑化および制限された埋め込み、(3)ニックシーリング、および(4)dAテーリング。ステップ1では、DNAを、エンドヌクレアーゼIV(EndoIV)、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg)、ウラシル-DNAグリコシラーゼ(UDG)、T4ピリミジンDNAグリコシラーゼ(T4 PDG)およびエンドヌクレアーゼVIII(EndoVIII)からなる酵素カクテルで処理する。これらの酵素の同時活性により、ウラシル、8’オキソG、酸化ピリミジン、シクロブタンピリミジン二量体および脱塩基部位などの損傷塩基が切除され、その結果、二本鎖領域に1ヌクレオチドのギャップが生じるか、一本鎖領域に鎖破断が生じる。このステップではエキソヌクレアーゼVII(ExoVII)を使用して、3’および5’の一本鎖オーバーハングを分解する。ステップ2において、T4ポリヌクレオチドキナーゼがDNA末端を(脱)リン酸化し、T4 DNAポリメラーゼ(3’→5’エキソヌクレアーゼ活性はあるが、5’→3’エキソヌクレアーゼ活性または鎖置換活性は持たない)が、3’オーバーハングを平滑化し、ギャップおよび短い(≦7nt)残りの5’オーバーハングを埋める。ステップ3では、ニックがHiFi Taq DNAリガーゼによってシールされて、誤った分子間ライゲーションを最小限に抑えるために選択される。ステップ4のdAテーリングは、クレノウ断片(exo-)およびTaqDNAポリメラーゼを使用し、DNA再合成を防ぐためにdATPのみの存在下で実施される。市販のER/ATと比較した二重鎖修復の性能を検証するために、フルオロフォアで標識され、かつ複数のタイプの主鎖および塩基損傷を含有する合成オリゴヌクレオチドを、キャピラリー電気泳動によって分析した(図3A)。
二重鎖修復は、アダプターライゲーションの前に既存のER/AT方法によって導入されるエラーを制限するための、カスタムの方法/キットである(図1、図5)。二重鎖修復は、4つのステップからなる:(1)損傷塩基の切除およびオーバーハングの除去、(2)平滑化および制限された埋め込み、(3)ニックシーリング、および(4)dAテーリング。ステップ1では、DNAを、エンドヌクレアーゼIV(EndoIV)、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg)、ウラシル-DNAグリコシラーゼ(UDG)、T4ピリミジンDNAグリコシラーゼ(T4 PDG)およびエンドヌクレアーゼVIII(EndoVIII)からなる酵素カクテルで処理する。これらの酵素の同時活性により、ウラシル、8’オキソG、酸化ピリミジン、シクロブタンピリミジン二量体および脱塩基部位などの損傷塩基が切除され、その結果、二本鎖領域に1ヌクレオチドのギャップが生じるか、一本鎖領域に鎖破断が生じる。このステップではエキソヌクレアーゼVII(ExoVII)を使用して、3’および5’の一本鎖オーバーハングを分解する。ステップ2において、T4ポリヌクレオチドキナーゼがDNA末端を(脱)リン酸化し、T4 DNAポリメラーゼ(3’→5’エキソヌクレアーゼ活性はあるが、5’→3’エキソヌクレアーゼ活性または鎖置換活性は持たない)が、3’オーバーハングを平滑化し、ギャップおよび短い(≦7nt)残りの5’オーバーハングを埋める。ステップ3では、ニックがHiFi Taq DNAリガーゼによってシールされて、誤った分子間ライゲーションを最小限に抑えるために選択される。ステップ4のdAテーリングは、クレノウ断片(exo-)およびTaqDNAポリメラーゼを使用し、DNA再合成を防ぐためにdATPのみの存在下で実施される。市販のER/ATと比較した二重鎖修復の性能を検証するために、フルオロフォアで標識され、かつ複数のタイプの主鎖および塩基損傷を含有する合成オリゴヌクレオチドを、キャピラリー電気泳動によって分析した(図3A)。
5’オーバーハングを有する合成オリゴ:dsDNA基質を、30塩基対の5’オーバーハングおよび他の末端の2つの異なるヌクレアーゼ耐性フルオロフォアと共に調製した(図3A、列i)。市販のER/ATキットを使用すると、101塩基対のdAテール付き生成物が検出され、DNAポリメラーゼが5’オーバーハング全体に相補的な30塩基対を再合成したことが示唆された。対照的に、二重鎖修復では、30塩基対の5’オーバーハングがステップ1の後に3塩基対に分解され、3ヌクレオチドのみがステップ2の間に埋められた;これは、73塩基対のdAテール付き生成物により示される。
3’オーバーハングを有する合成オリゴ:dsDNA基質を30塩基対の3’オーバーハングと共に調製し、市販のキットが71塩基対のdAテール付き生成物を生成することを観察した;これは、3’オーバーハングが完全に平滑化されており、埋め込みがないことを示唆する(図3A、列ii)。同様に二重鎖修復では、dAテール付き生成物も71bpであるため、最初の2つのステップの後に3’オーバーハングが平滑化された。
ニックを有する合成オリゴ:30塩基対のオリゴを30塩基対の5’オーバーハング基質にアニーリングして、人工ニックを有するdsDNAを作製し、101塩基対のdAテール付き生成物を市販のER/ATキットを用いて検出しした;これは、DNAポリメラーゼが、ニック翻訳または鎖置換によって30ヌクレオチドを埋めて、101塩基対のトップ鎖生成物を作ったことを示唆する(ニックをシールするDNAリガーゼがなかったため;図3A、列iii)。二重鎖修復を使用すると、ステップ2において、T4 DNAポリメラーゼはニック翻訳活性または鎖置換活性を欠いているため、ニック部位からトップ鎖を伸長できず、ニックはステップ3において、HiFi Taq DNAリガーゼによって効率的にシールされた。
ギャップ領域に塩基損傷のない合成オリゴ:29塩基対または25塩基対のオリゴを、30塩基対の5’オーバーハングを有するdsDNAにアニーリングして、1ヌクレオチドまたは5ヌクレオチドのギャップを有するdsDNAを作った;そして、市販キットのDNAポリメラーゼが、ギャップ部位からボトム鎖を通してニック翻訳または鎖置換によってコピーされ、30ヌクレオチドを埋めて、101塩基対のdAテール付き生成物を生成したことを観察した(図3A、列ivおよびv)。しかしながら二重鎖修復では、ステップ2の間にT4 DNAポリメラーゼはさらなる再合成を行わず、1ヌクレオチドまたは5ヌクレオチドのギャップを効率的に埋め(T4 DNAポリメラーゼが27ヌクレオチドのギャップを効率的に埋め得ることも観察された(図6))、結果として生じたニックは、HiFi Taq DNAリガーゼによってステップ3の間に効率的にシールされた。
ギャップ領域に塩基損傷を有する合成オリゴ:29塩基対のオリゴを30塩基対の5’オーバーハングを有するdsDNAにアニーリングして、1ヌクレオチドのギャップおよびウラシルまたは8’オキソG病変をギャップ領域の反対側に有するdsDNAを作った(図3A、列viおよびvii)。101塩基対のdAテール付き生成物が市販のキットで検出され、これは、DNAポリメラーゼが、塩基損傷エラーを両方の鎖に伝播させ得る塩基損傷を含有するボトム鎖をコピーしたことを示唆した。対照的に二重鎖修復では、70塩基対の生成物がステップ1の後に検出され、これは、意図した鎖破断が塩基損傷位置で発生し、塩基損傷エラーが両方の鎖にコピーされるのを防止したことを示唆している。ステップ4では、71塩基対のdAテール付き生成物が得られた。
二重鎖修復は実際の臨床試料における二重鎖配列決定エラーを制限する
二重鎖修復が二重鎖配列決定エラーを制限できるかどうかを試験するために、図3Bからの最も重度に損傷したcfDNAおよびFFPE gDNA試料に対し、二重鎖修復対市販キットを用いてER/ATを実施し、次いで、IDT xGen汎がんパネルまたはカスタムパネルの標的化配列決定を適用した。二重鎖修復は、損傷したcfDNA試料(1×10-6から~5×10-8)およびFFPE gDNA試料(6×10-5から1×-6)についてそれぞれ、市販のER/ATキットと比較して20倍および60倍のエラーの減少を示した(図3C)。最も重度の損傷を受けたcfDNAの二重鎖修復による修復のエラー率は、市販のER/ATを使用して調製された損傷のないcfDNAよりもさらに低い。この結果は、二重鎖修復が試料内の塩基損傷エラーの伝播を防止し、二重鎖配列決定の忠実度を向上できることを確認する。
二重鎖修復が二重鎖配列決定エラーを制限できるかどうかを試験するために、図3Bからの最も重度に損傷したcfDNAおよびFFPE gDNA試料に対し、二重鎖修復対市販キットを用いてER/ATを実施し、次いで、IDT xGen汎がんパネルまたはカスタムパネルの標的化配列決定を適用した。二重鎖修復は、損傷したcfDNA試料(1×10-6から~5×10-8)およびFFPE gDNA試料(6×10-5から1×-6)についてそれぞれ、市販のER/ATキットと比較して20倍および60倍のエラーの減少を示した(図3C)。最も重度の損傷を受けたcfDNAの二重鎖修復による修復のエラー率は、市販のER/ATを使用して調製された損傷のないcfDNAよりもさらに低い。この結果は、二重鎖修復が試料内の塩基損傷エラーの伝播を防止し、二重鎖配列決定の忠実度を向上できることを確認する。
例2:二重鎖修復はDNA損傷にもかかわらず高精度の配列決定を可能にする
DNAにおける合成変異のDNA配列は、遺伝的多様性を推進し1、遺伝子機能を変化させ2、細胞の表現型に影響を与え3、細胞集団をマークし4、進化の軌跡を定義し5、疾患および状態を強調し6、および精密医療と診断の標的を提供する7。したがって、広範囲の存在量にわたって変異を検出できることが重要である。例えば、低存在量の変異(例:VAFが0.1~1%未満、「単一二重鎖」の分解能まで)を検出することは、がんの進化8および薬剤耐性9の研究、体細胞モザイク現象10およびクローン性造血11の理解、塩基編集技術の特徴付け12、化合物の変異原性の評価13、病原性バリアントの発見14、ヒト胚発生の研究15、微生物またはウイルス感染16およびがん17、および組織または液体生検などの検体からの臨床的にアクションが可能なゲノム変化18の検出などにとって重要である。
DNAにおける合成変異のDNA配列は、遺伝的多様性を推進し1、遺伝子機能を変化させ2、細胞の表現型に影響を与え3、細胞集団をマークし4、進化の軌跡を定義し5、疾患および状態を強調し6、および精密医療と診断の標的を提供する7。したがって、広範囲の存在量にわたって変異を検出できることが重要である。例えば、低存在量の変異(例:VAFが0.1~1%未満、「単一二重鎖」の分解能まで)を検出することは、がんの進化8および薬剤耐性9の研究、体細胞モザイク現象10およびクローン性造血11の理解、塩基編集技術の特徴付け12、化合物の変異原性の評価13、病原性バリアントの発見14、ヒト胚発生の研究15、微生物またはウイルス感染16およびがん17、および組織または液体生検などの検体からの臨床的にアクションが可能なゲノム変化18の検出などにとって重要である。
次世代配列決定(NGS)の進歩にもかかわらず、DNA損傷は変異検出を混乱させ、精度を試料品質に依存させるが、これは大きな問題である19。ウラシル、チミン二量体、ピリミジン二量体、8-オキソグアニン(8’オキソG)、6-O-メチルグアニン、脱プリン化、および脱ピリミジン化などの病変は、自然発生的に発生する場合と、次のような環境および化学的暴露に反応して発生する場合がある:UV照射、電離放射線、活性酸素種、および遺伝毒性物質、または試料処理手順、例えばホルマリン固定、凍結と解凍、加熱と熱サイクル、音響剪断、および水溶液での長期保存など。増幅されると損傷乗り越え合成が起こり得て、変異をin vitroで導入する。これらは、試料調製および配列決定における他のエラーと共に、NGSのエラー率0.1~1%に寄与する22。
塩基損傷エラーの偶然性のため、それらのほとんどは、各DNA断片の複数コピーをバーコード化および配列決定し、リード間のコンセンサスを必要とすることにより、克服することができる。かかる方法は、DNAの各一本鎖からのコンセンサスを必要とする場合は最大100倍、各DNA二重鎖の両方のセンス鎖からのコンセンサスを必要とする場合は最大10,000倍まで、二重鎖配列決定と呼ばれる技法においてエラーを低減することができる23。しかし、配列決定のために剪断された(sheared)ものを含め、ほとんどの二本鎖DNA断片には「ギザギザの末端(jagged ends)」があり、これは、配列決定アダプターを両方の鎖にライゲートするために修復する必要がある。「末端修復/dAテーリング」(ER/AT)方法は、3’オーバーハングを除去し、5’オーバーハングを埋め、5’末端をリン酸化し(「末端修復」を介して)、および各3’末端に単一のdAMPを残して(「dAテーリング」を介して)、dTMPテール付きアダプターのライゲーションを容易にするように設計される。ER/AT方法はそれでも、各二重鎖の一部を再合成し得るポリメラーゼを含む。
再合成が、1つの鎖に限定された増幅可能な病変または変化の存在下で起こる場合、変化した塩基対合は、増幅時に新たに合成された鎖に伝播するであろう。これにより、一方の鎖からの増幅可能な病変または変化が、両方の鎖上の真の変異から識別できなくなる(図7A)。この問題は、短い5’オーバーハングの埋め込みに起因して、各二重鎖の末端(例:最後の約12bp)で観察される24。しかしかかるエラーは、(i)ER/ATで使用されるTaqおよびクレノウポリメラーゼの5’エキソヌクレアーゼ活性および鎖置換活性25、および(ii)鎖再合成のための「プライミング部位」として作用する、DNAの様々なニック、ギャップ、およびオーバーハング26を考慮すると、さらに深く広がる可能性もある。
本明細書においては、従来のER/ATをニック、ギャップ、またはオーバーハングを有するDNAに適用すると、各二重鎖の実質的な部分が再合成されることが実証される。さらに示されているのは、鎖再合成を制限する、二重鎖修復と呼ばれる新しいER/AT方法である。一分子およびパネル配列決定を使用して、二重鎖修復をcfDNAおよびホルマリン固定腫瘍生検などの試料に適用すると、鎖の再合成を最小限に抑え、様々な程度のDNA損傷にもかかわらず高い精度を回復することが示されている。
例2に関連する方法
二重鎖修復ワークフロー:二重鎖修復は4つのステップからなる。ステップ1では、DMAを、1×NEBuffer 2中のEndoIV(カタログ番号M0304S)、Fpg(カタログ番号M0240S)、UDG(カタログ番号M0280S)、T4 PDG(カタログ番号M0308S)、EndoVIII(カタログ番号M0299S)およびExoVII(カタログ番号M0379S)(すべてNEB製、各0.2μLを使用)からなる酵素カクテルと共に、0.05μg/μLのBSAの存在下(総反応量=20μL)、37℃で30分間処理する。ステップ2では、T4 PNK(カタログ番号M0201S;NEB;0.25μLを使用)、T4 DNAポリメラーゼ(カタログ番号M0203S;NEB;0.25μLを使用)、ATP(最終濃度=0.8mM)、およびdNTPミックス(各dNTPの最終濃度=0.5mM)をステップ1の反応混合物に加え、37℃でさらに30分間インキュベートする。ステップ3では、HiFi Taqリガーゼ(カタログ番号M0647S;NEB;0.5μLを使用)および10×HiFi Taqリガーゼ緩衝液(1.5μLを使用)をステップ2の反応混合物にスパイクし、45分かけて35℃から65℃まで加熱するサーマルサイクラー上でインキュベートする。得られた生成物を3×Ampureビーズクリーンアップの実施により精製し、17μLの10mMのTris緩衝液で溶出する。ステップ4では、精製された生成物を、1×NEBuffer 2中のクレノウ断片(3’→5’exo-)(カタログ番号M0212L;NEB;1μLを使用)およびTaq DNAポリメラーゼ(カタログ番号M0273S;NEB;0.2μLを使用)で、0.2mMのdATPの存在下(総反応量=20μL)室温で30分間、その後65℃で30分間処理する。配列決定用の二重鎖修復ライブラリーを調製するには、T4 DNAリガーゼ(カタログ番号M0202L;NEB;1000ユニットを使用)、5’-デアデニラーゼ(カタログ番号M0331S;NEB;0.5μLを使用)、PEG 8000(最終濃度=10%(w/v))、およびカスタムのデュアルインデックス二重鎖UMIアダプター(IDT)をステップ4の反応混合物に添加し(総反応量=55μL)、これを次に室温で1時間インキュベートし、続いて1.2×Ampureビーズクリーンアップを実施し、精製された生成物をPCRで増幅する。
二重鎖修復ワークフロー:二重鎖修復は4つのステップからなる。ステップ1では、DMAを、1×NEBuffer 2中のEndoIV(カタログ番号M0304S)、Fpg(カタログ番号M0240S)、UDG(カタログ番号M0280S)、T4 PDG(カタログ番号M0308S)、EndoVIII(カタログ番号M0299S)およびExoVII(カタログ番号M0379S)(すべてNEB製、各0.2μLを使用)からなる酵素カクテルと共に、0.05μg/μLのBSAの存在下(総反応量=20μL)、37℃で30分間処理する。ステップ2では、T4 PNK(カタログ番号M0201S;NEB;0.25μLを使用)、T4 DNAポリメラーゼ(カタログ番号M0203S;NEB;0.25μLを使用)、ATP(最終濃度=0.8mM)、およびdNTPミックス(各dNTPの最終濃度=0.5mM)をステップ1の反応混合物に加え、37℃でさらに30分間インキュベートする。ステップ3では、HiFi Taqリガーゼ(カタログ番号M0647S;NEB;0.5μLを使用)および10×HiFi Taqリガーゼ緩衝液(1.5μLを使用)をステップ2の反応混合物にスパイクし、45分かけて35℃から65℃まで加熱するサーマルサイクラー上でインキュベートする。得られた生成物を3×Ampureビーズクリーンアップの実施により精製し、17μLの10mMのTris緩衝液で溶出する。ステップ4では、精製された生成物を、1×NEBuffer 2中のクレノウ断片(3’→5’exo-)(カタログ番号M0212L;NEB;1μLを使用)およびTaq DNAポリメラーゼ(カタログ番号M0273S;NEB;0.2μLを使用)で、0.2mMのdATPの存在下(総反応量=20μL)室温で30分間、その後65℃で30分間処理する。配列決定用の二重鎖修復ライブラリーを調製するには、T4 DNAリガーゼ(カタログ番号M0202L;NEB;1000ユニットを使用)、5’-デアデニラーゼ(カタログ番号M0331S;NEB;0.5μLを使用)、PEG 8000(最終濃度=10%(w/v))、およびカスタムのデュアルインデックス二重鎖UMIアダプター(IDT)をステップ4の反応混合物に添加し(総反応量=55μL)、これを次に室温で1時間インキュベートし、続いて1.2×Ampureビーズクリーンアップを実施し、精製された生成物をPCRで増幅する。
合成オリゴヌクレオチドの鎖再合成のキャピラリー電気泳動による定量化:フルオロフォア標識一本鎖オリゴヌクレオチド(IDTより;表1)を、低TE緩衝液(pH8.0)に再懸濁し、アニーリングして、ニック、ギャップ、またはオーバーハングを有するDNA二本鎖を形成した。次に20~200ngの各二重鎖基質を、従来のER/ATキット、Kapa Hyper Prepキット、または二重鎖修復のワークフローに通し、各ステップ後の生成物のアリコートをキャピラリー電気泳動分析のためにEton Bioscienceに送付した。返されたデータはPeak Scanner 2ソフトウェアで分析し、再較正した。
キャピラリー電気泳動トレースの再較正のために、合成オリゴヌクレオチドの長さをIDTの質量分析によって確認した(データ示さず)。しかしながら、Peak scanner 2ソフトウェアを使用することによる生の断片分析から報告された対照ピーク位置は、予想される位置とは異なる(表1、図8);6-FAMタグ付き分子のピーク位置は一貫して過小評価として表示されるが、一方ATTO 550のピーク位置は過大評価として表示される。
表1:合成オリゴヌクレオチドのDNA配列。アスタリスク(*)は、フルオロフォアをヌクレアーゼによる切断から保護するC3スペーサーまたはホスホロチオアート結合の存在を示す。
表1:合成オリゴヌクレオチドのDNA配列。アスタリスク(*)は、フルオロフォアをヌクレアーゼによる切断から保護するC3スペーサーまたはホスホロチオアート結合の存在を示す。
キャピラリー電気泳動データを解釈するために、ピーク位置の再較正を既知の長さの合成オリゴヌクレオチドのラダーを使用して行った。式1~2は、オリゴヌクレオチドの長さを、線形回帰を通じて生のピーク位置に関連付ける。
y=1.0381x-7.681 式1
式1.6-FAMタグ付き鎖の生の断片分析ピーク位置の線形回帰。100bp、90bp、80bp、および70bpのssDNA対照内の6-FAMタグ付きオリゴの、実験的に決定された値(表1、それぞれオリゴe、d、c、b)を使用して、実際のオリゴヌクレオチド長(x)を、6-FAM基質の断片分析の読み取り値(y)に関連付けるモデルを生成した(図9A)。
y=0.9666x+5.039 式2
式2.ATTO-550タグ付き鎖の生の断片分析ピーク位置の線形回帰。100bp、90bp、80bp、および70bpのssDNA対照内のATTO-550タグ付きオリゴの、実験的に決定された値(表1、それぞれオリゴi、h、g、f)を使用して、実際のオリゴヌクレオチド長(x)を、ATTO-550基質の断片分析の読み取り値(y)に関連付けるモデルを生成した(図9B)。
y=1.0381x-7.681 式1
式1.6-FAMタグ付き鎖の生の断片分析ピーク位置の線形回帰。100bp、90bp、80bp、および70bpのssDNA対照内の6-FAMタグ付きオリゴの、実験的に決定された値(表1、それぞれオリゴe、d、c、b)を使用して、実際のオリゴヌクレオチド長(x)を、6-FAM基質の断片分析の読み取り値(y)に関連付けるモデルを生成した(図9A)。
y=0.9666x+5.039 式2
式2.ATTO-550タグ付き鎖の生の断片分析ピーク位置の線形回帰。100bp、90bp、80bp、および70bpのssDNA対照内のATTO-550タグ付きオリゴの、実験的に決定された値(表1、それぞれオリゴi、h、g、f)を使用して、実際のオリゴヌクレオチド長(x)を、ATTO-550基質の断片分析の読み取り値(y)に関連付けるモデルを生成した(図9B)。
臨床検体。すべての患者は、研究目的での血液および/または腫瘍組織の収集および遺伝子データの分析を許可する書面によるインフォームドコンセントを提出した。健康なドナーの血液試料はResearch Blood ComponentsまたはBoston Biosciencesに注文した。転移性乳がん患者は、IRB承認の組織分析およびバンキングコホート(Dana-Farber Cancer Institute[DFCI]protocol identifier 05-055)への登録のために、将来を見越して特定した。血漿は、EDTAチューブ内の10~20ccの全血から採取した。
cfDNAまたはgDNA上の鎖再合成のPacBioシーケンサーによる定量化:PacBioのワークフローに従って、多重化ライブラリーをSMRTbell Express鋳型キット2.0(Pacific Biosciences)を用いて調製したが、ただし次の改変を加えた:1)「SSオーバーハングの除去」および「DNA損傷修復」ステップはスキップした;2)ER/ATをKapa Hyper Prepキットまたは二重鎖修復を用いて実施した;3)カスタム緩衝液(5×)を調製した:これは、250mMのTris、2mMのd6mATP、2mMのd4mCTP、2mMのdGTP、2mMのdTTP、50mMのMgCl2、50mMのDTT、および5mMのATP(pH7.5)からなり、これを用いて、ER/ATをd6mATP(N6-メチル-2’-デオキシアデノシン-5’-三リン酸)、d4mCTP(N4-メチル-2’-デオキシシチジン-5’-三リン酸)、dGTP、およびdTTP(すべてTriLink Biotechnologies製)と共に実施した;4)1.8×Ampure PBビーズのクリーンアップをヌクレアーゼ処理後に実施した;5)「2回目のAmpure PBビーズ精製」ステップはスキップした。各ライブラリー構築への入力は、50ngの合成オリゴヌクレオチド、または20~40ngのcfDNAもしくはgDNAであった。調製したままの状態のPacBioライブラリーを、試料あたり少なくとも65,000のリード数を目標としてSequel IIで配列決定した。
CuCl2/H2O2およびDNase IによるDNA損傷の誘導:DNA損傷を誘導するための条件を、CuCl2/H2O2およびDNase Iによって最適化した(図10A~10B、図11、図12、表2)。次に20ngのcfDNAを、1×DNase 1緩衝液中の0、0.2、または2mUのDNase 1(カタログ番号M0303S、NEB)および0、1、または100μMのCuCl2/H2O2(総反応量=20μL)で16℃で1時間処理した。次いで40mMのEDTAを添加して反応をクエンチし、得られた生成物を、2×Ampureビーズクリーンアップを行って精製した。
表2:DNase 1処理後のDNA損失の定量化。入力は20ngの100bpのdsDNAオリゴであった。*低い収率はAmpureビーズのクリーンアップステップの間に大幅な損失が発生したことを示す;**2番目の生物学的複製の濃度は、Qubitアッセイの検出限界未満である。
表2:DNase 1処理後のDNA損失の定量化。入力は20ngの100bpのdsDNAオリゴであった。*低い収率はAmpureビーズのクリーンアップステップの間に大幅な損失が発生したことを示す;**2番目の生物学的複製の濃度は、Qubitアッセイの検出限界未満である。
cfDNA試料およびgDNA試料の処理:cfDNAは、健康なドナーまたはがん患者の新鮮または保存血漿から以前と同じ方法に従って抽出した24、27。gDNAは、FFPE腫瘍組織またはバフィーコートから抽出し、以前に記載されているのと同じプロトコルに従って剪断および定量化した24、27。次にcfDNAまたはgDNAライブラリーを10~20ngのDNA入力から、Kapa Hyper Prepキットまたはカスタムデュアルインデックス二重鎖UMIアダプター(IDT)を備えた二重鎖修復を用いて構築した。IDTの汎がんパネルを使用したハイブリッド選択(HS)は、調製されたライブラリーに対して、xGenユニバーサルブロッカー(IDT)を有するxGenハイブリダイゼーションおよび洗浄キットを用いて実施した。HSの2回目のラウンドの後、ライブラリーを増幅、定量化し、HiSeq2500ラピッドラン(100bpペアエンドラン)またはHiSeqX(151bpペアエンドラン)での配列決定のために、部位あたり200,000×の標的生深度(targeted raw depth)でプールした。
二重鎖配列決定データの分析およびエラー率の定量化:次いで、生のリードを前述のように二重鎖コンセンサス呼び出しパイプラインを通じて処理した24。エラー率は、二重鎖配列決定用に特に調整されたフィルターを適用した後、総塩基に対する非参照塩基の割合を計数することにより算出した24。がん患者の真の体細胞バリアントを塩基エラーとして誤って数えることを避けるため、体細胞変異のあるいかなる遺伝子座も、その患者の腫瘍生検の全エクソーム配列決定から除外した。バフィーコートDNAに由来するマッチした正常値も、任意の生殖系列変異をフィルタリングするために使用した。塩基エラー位置の分析では、エラーメトリクス(metrics)収集パイプラインを断片フィルターの終端を無効にして再実行し、DNA二重鎖全体にわたるエラーを観察した。
一分子リアルタイム(SMRT)配列決定データからの再合成の推定:初めに、Circular Consensus Sequences(CCS)ツール(Pacific Biosciences)を使用して、生のリードからコンセンサスリードを生成した。平均動力学(mean-kinetics)フラグは、改変されたdNTPを識別するために後で使用される各塩基位置について、他のメトリクスのうちでもinterpulse duration(IPD)を出力するためにも使用した。次に、limaツール(Pacific Biosciences)を使用して、同じフローセル上で一緒に配列決定された試料を逆多重化した。次いでこれらのCCSリードを、鎖再合成を推定するための隠れマルコフモデル(HMM)への入力として使用した。
次いでHMMを実施して、各二重鎖の3’末端上の再合成量をSMRT配列決定データから推定した。HMMは、元の塩基を有する領域(O)とER/AT中に埋められた塩基を有する領域(F)をそれぞれ表す、2つの状態で構成される。HMMは、鎖内の内部位置から始まり3’末端まで続く再合成を推定するように設計された。さらに、FからOへの遷移を許可しない遷移マトリックスを設計した。OからFへの遷移確率xは鎖の長さの逆数に等しく、OからOへの遷移確率yは1-xに等しい。経験的な発光マトリックスの開発のために、合成二重鎖を既知の再合成領域と元の塩基を用いて配列決定した(表1)。PacBioのSMRT配列決定は、各位置の塩基およびinterpulse duration(IPD)の両方を放出し、次いでこれを収集して、各状態の各塩基のIPD分布の放出行列を形成する(図13A~13C)。このHMMを使用し、ビタビ(Viterbi)アルゴリズムを各二重鎖DNA鎖に適用して、元の塩基と再合成された塩基の最も可能性の高い領域を決定し、再合成された塩基の総数を計算した。
再合成された内部塩基対のフラクションを推定するために、HMMから推定された再合成の領域を取得し、二重鎖断片のいずれかの末端から12塩基対を超える再合成塩基対の数を、いずれかの断片末端から12塩基対を超える塩基対の総数と比較して、算出した。すべての分析について、標準の非改変dNTPを用いて対照試料も実行し、バックグラウンド再合成推定値を測定し、そのバックグラウンドを改変dNTPを用いた試料から差し引きいた。
新しいER/ATアプローチとしての二重鎖修復
従来のER/AT方法が、増幅可能な病変を含む、ニック、ギャップ、またはオーバーハングを有するDNA二重鎖の実質的領域を再合成できるかどうかを決定するために、二重鎖オリゴヌクレオチドであって以下を有するもの:(i)5’オーバーハング、(ii)3’オーバーハング、(iii)ニック、(iv~v)塩基損傷のない様々な長さのギャップ、または(vi~vii)塩基損傷のあるギャップ(図7B、表1)を生成した。トップ鎖およびボトム鎖を異なる色素で標識し、キャピラリー電気泳動を使用してER/AT中の断片長の変化を定量化できるようにした(図7A~7B)。
従来のER/AT方法が、増幅可能な病変を含む、ニック、ギャップ、またはオーバーハングを有するDNA二重鎖の実質的領域を再合成できるかどうかを決定するために、二重鎖オリゴヌクレオチドであって以下を有するもの:(i)5’オーバーハング、(ii)3’オーバーハング、(iii)ニック、(iv~v)塩基損傷のない様々な長さのギャップ、または(vi~vii)塩基損傷のあるギャップ(図7B、表1)を生成した。トップ鎖およびボトム鎖を異なる色素で標識し、キャピラリー電気泳動を使用してER/AT中の断片長の変化を定量化できるようにした(図7A~7B)。
ライブラリー変換効率を定量化するために、隣接するアダプター領域を標的とするddPCRアッセイを設計した。二重ライゲーションが成功した断片のみがQX200 ddPCR EvaGreen Supermix(Bio-Rad)内で指数関数的に増幅されて、検出された。
従来のER/AT方法を適用したところ、実質的な鎖再合成が、3’オーバーハングを有する基質を除くすべての基質で観察された(図7B、図14)。例えば、トップ鎖の中央に1つだけのニックがある場合でも、ニック部位の下流の30塩基は完全に再合成される。これらの結果は、従来のER/AT方法が、ニック、ギャップ、またはオーバーハングが存在する場合でも各二重鎖の大部分を再合成できることを確認する。
この問題に対処するために、二重鎖修復と呼ばれる新しいアプローチが考案され、これは慎重かつ段階的な様式でER/ATを実施して、鎖再合成を制限する(図7A)。二重鎖修復は、エラーをin silicoでトリミングできる断片末端(例:最後の12bp)に再合成を「集中」させるように設計された24。二重鎖修復は4つのステップで構成される:(1)損傷塩基の切除およびオーバーハングの除去、(2)平滑化および制限された埋め込み、(3)ニックシーリング、および(4)制限されたdAテーリング。ステップ1では、DNAを、塩基切除修復(BER)に関与する酵素、例えばエンドヌクレアーゼIV(EndoIV)、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg)、ウラシル-DNAグリコシラーゼ(UDG)、T4ピリミジンDNAグリコシラーゼ(T4 PDG)、およびエンドヌクレアーゼVIII(EndoVIII)、からなる酵素カクテルで処理する。これらの酵素は、ウラシル、8’オキソG、酸化ピリミジン、シクロブタンピリミジン二量体などの損傷塩基を切除し、脱塩基部位を切断し、二本鎖領域に1ntのギャップまたは一本鎖領域に鎖破断を生じる。エキソヌクレアーゼVII(ExoVII)もこのステップで使用されて、3’および5’の一本鎖オーバーハングを分解する。次に、ステップ2では、T4ポリヌクレオチドキナーゼがDNA末端を(脱)リン酸化し、一方、T4 DNAポリメラーゼは3’オーバーハングを平滑化し、ExoVII消化後に残る小さなギャップと短い(7nt以下)5’オーバーハングを埋める。その後、ステップ3でニックがHiFi Taq DNAリガーゼによってシールされる。ステップ4では、制限dAテーリングを、クレノウ断片(exo-)とTaq DNAポリメラーゼを使用して、ただしdATPのみの存在下で実施し、それらの活性を非鋳型化された伸長に制限する。
前述の合成二重鎖を使用して、二重鎖修復が最小限の再合成でER/ATを促進することが確認された。まず、各ステップを理想的な緩衝液条件で各ステップ後に3×Ampureビーズクリーンアップを実施することにより試験し、主要生成物を示した(図7Bおよび図14)。各基質について、重要な酵素の活性が関与していることが確認され、一方で存在する他の酵素がそれらの活性を損なわないことが確認された。例えば基質(i)の場合、長い5’オーバーハングはExoVIIによって大部分が消化され(図15)、残りの3塩基はT4 DNAポリメラーゼによって埋められる(図14)。基質(ii)の場合、3’オーバーハングはExoVIIによって部分的に消化され(図15)、次いでT4 DNAポリメラーゼによって完全に平滑化される(図14)。基質(iii)の場合、ニックはHiFi Taq DNAリガーゼによってシールされる(図16)。基質(iv~v)の場合、ギャップは最初にT4 DNAポリメラーゼによって埋められ(図14および図16)、その後、生じた「ニック」がHiFi Taq DNAリガーゼによってシールされる。基質(vi~vii)の場合、損傷塩基が切除され(ウラシルはUDGにより、8’オキソGはFpgによる;図17および図13A~13C)、および脱塩基部位が切断されて鎖破断が生じ、したがってステップ2のギャップ充填中の損傷乗り越え合成が回避される。dAテーリングは、dATPが存在する場合にのみ機能することも確認された(図18~20)。反応条件が最適化され、ステップ間の複数のAmpureクリーンアップが排除されて、DNA損失の低減を支援した(図21~22)。これらの結果は、二重鎖修復が、従来のER/ATと同等のライブラリー変換効率を達成しながら鎖再合成を制限する様式で、ER/ATを行うことを示唆する(図10A~10B)。
二重鎖修復は臨床検体からのDNA二重鎖の再合成を制限する
次に、ER/ATを無細胞DNA(cfDNA)およびホルマリン固定パラフィン包埋(FFPE)腫瘍生検などの臨床試料に適用した場合の、鎖再合成を定量化した。以下を含むアッセイを考案した:ER/ATを、d6mATP、d4mCTP、dTTP、およびdGTPを含む改変dNTPミックスを使用して実施すること、調製したライブラリーを、d6mATPおよびd4mCTPが組み込まれた場所を検出できるPacBioシーケンサーで配列決定すること28、および隠れマルコフモデルを適用して再合成された領域を特定すること(図23Aおよび図11;方法)。その性能は、従来のER/ATで処理した合成オリゴヌクレオチド(表1)を用いて検証した。予想される領域におけるd6mATPおよびd4mCTPの取り込みに対応して、延長されたinterpulse duration(IPD)が観察された(図12、列i)。ほとんどの場合に予想される再合成塩基の推定数も判明した(図12、列ii)。興味深いことに、ニックまたはギャップのある基質では、80bp5’オーバーハングを有する基質と同じ末端3’OHを有するにもかかわらず、予想よりも長い埋め込みを持つ分子がいくつか見つかった。これは、ポリメラーゼの3’エキソヌクレアーゼ活性によるものである可能性があり、隣接する下流鎖に遭遇した場合に顕著になり得ると考えられる。
次に、ER/ATを無細胞DNA(cfDNA)およびホルマリン固定パラフィン包埋(FFPE)腫瘍生検などの臨床試料に適用した場合の、鎖再合成を定量化した。以下を含むアッセイを考案した:ER/ATを、d6mATP、d4mCTP、dTTP、およびdGTPを含む改変dNTPミックスを使用して実施すること、調製したライブラリーを、d6mATPおよびd4mCTPが組み込まれた場所を検出できるPacBioシーケンサーで配列決定すること28、および隠れマルコフモデルを適用して再合成された領域を特定すること(図23Aおよび図11;方法)。その性能は、従来のER/ATで処理した合成オリゴヌクレオチド(表1)を用いて検証した。予想される領域におけるd6mATPおよびd4mCTPの取り込みに対応して、延長されたinterpulse duration(IPD)が観察された(図12、列i)。ほとんどの場合に予想される再合成塩基の推定数も判明した(図12、列ii)。興味深いことに、ニックまたはギャップのある基質では、80bp5’オーバーハングを有する基質と同じ末端3’OHを有するにもかかわらず、予想よりも長い埋め込みを持つ分子がいくつか見つかった。これは、ポリメラーゼの3’エキソヌクレアーゼ活性によるものである可能性があり、隣接する下流鎖に遭遇した場合に顕著になり得ると考えられる。
次に、上記の再合成定量法を使用して、二重鎖修復と従来のER/ATとの間の再合成塩基対の差の推定を、それぞれ100μMのCuCl2/H2O2および2mUのDNase 1によって誘導された塩基および主鎖損傷を有する健康なドナーcfDNA試料で試験することにより実施した(「方法」を参照)。二重鎖修復のいくつかのバリエーションも、再合成の制限に対する各ステップの影響を評価するために試験した。この方法を適用して、次のことが推定された:内部(interior)二重鎖塩基対(元の二重鎖DNA断片のいずれかの末端から12塩基対を超える塩基対として定義)の54%が従来のER/ATでは再合成されたのに対し、二重鎖修復では3%が再合成された(図23B)。注目すべきことに、試験した二重鎖修復プロトコルの各ステップは、内部塩基対再合成の量をさらに低減するのに役立っていた。特に、ステップ1でのBERのスキップは再合成にほとんど影響を及ぼさないことが観察されたが、一方ステップ1をスキップすると内部再合成フラクションが3%から9%に増加し、これは、5’オーバーハングでの再合成を抑制するにはExoVII処理が必要であることを示唆する。さらに、ステップ2をスキップすると、内部再合成フラクションが9%から11%にわずかに増加するだけであり、制限された埋め込みの間には再合成が制限されることが確認された。さらに、ステップ3をスキップすると内部再合成フラクションが11%から35%に増加し、これは、シールされていないニックがdAテーリング中に有意な再合成を引き起こしたことを示唆する。さらに、ステップ4でdATP単独の代わりにdNTPミックスを使用すると、再合成フラクションが35%から47%に増加し、dAテーリング中の鋳型伸長を抑制するには、dATPを単独で使用することが不可欠であることを示唆する。全体として、これらの結果は、再合成を最小限に抑えるためには、二重鎖修復の完全なプロトコルが必要であることを示唆する。
二重鎖修復が臨床試料における再合成をどの程度制限できるかを評価するために、このアッセイを使用して、健康なドナーのcfDNA、がん患者のcfDNA、および腫瘍FFPE生検を含むいくつかの異なる試料タイプにわたる再合成を測定した。d6mATPとd4mCTPが臨床試料中に実際のエピジェネティック改変として存在する可能性があることを考慮して29、各患者に対して、すべての標準dNTPと従来のER/ATを使用して対照試料も実行し、任意のバックグラウンドノイズを制御した。平均IPDを、各CCS鎖の鎖位置にわたり、元のDNA鎖の3’末端からの距離に対して調べた(図23C)。すべての試料タイプについて、対照試料のすべての位置で一貫して低い平均IPDが観察された。対照的に平均IPDは、従来のER/ATおよび二重鎖修復の両方について、CCS鎖の3’末端に向かって有意に増加した(図23C)。さらに、二重鎖修復では高いIPDは3’末端から12塩基対以内に集中しているが、従来のER/ATでは鎖のさらに奥まで伸びている。次に、本明細書に記載の再合成定量法を使用して、臨床試料における内部二重鎖塩基対の再合成の量を推定した。再合成された内部塩基対のフラクション(対照試料からのバックグラウンドノイズを差し引いた後;図24)は、従来のER/ATの方が、二重鎖修復より、すべての試料タイプにわたってはるかに高い(図23D)。特に、従来のER/ATでは、内部二重鎖塩基対の修復の発生が、健康なcfDNA、がん患者のcfDNA、FFPE腫瘍gDNA試料でそれぞれ平均して8%(範囲7~9%)、16%(範囲15~17%)、および41%(範囲32~57%)であったが、二重鎖修復を使用した場合にこれらは0.12%(範囲0.00~0.17%)、0.0345%(範囲0.03~0.04%)、および5%(範囲0.5~10%)に減少し、したがって内部塩基対の再合成の67倍、464倍、および8倍の減少に相当することが観察された。これらの結果は、従来のER/ATが、cfDNAおよびFFPE腫瘍生検などの臨床試料で実質的な鎖再合成を誘導し、二重鎖修復がこれを大幅に制限できることを示唆する。
二重鎖修復は誘導されたDNA損傷を克服し二重鎖配列決定を強化する
ER/ATにおける鎖再合成は増幅可能な病変または変化が存在する場合に最も問題であるとの推論から、1人の健康なドナー(HD_78)からのcfDNAを異なる濃度の酸化剤CuCl2/H2O2およびDNase Iに曝露して、DNAをほとんど分解することなく、塩基および主鎖の損傷を誘導した(図25~27、表2)。次いで、従来のER/ATを適用し、二重鎖配列決定を実施し、各二重鎖の末端から最後の12bpをトリミングした後に、エラー率を計算した24(図28A、図29、表4)。
表4:ターゲットパネル配列決定によってプロファイリングされたすべての試料の配列決定メトリクス。
CuCl2/H2O2の各濃度において、エラー率はDNase Iの量が増加するにつれて増加する一方、両方の最高濃度では、未処理のcfDNAよりも3.6倍高いエラー率(C.I.2.8~4.5)が得られることが見出された。予想通り、エラーの最大の増加が観察され、これは、CuCl2/H2O2曝露の予想されるC→A変異シグネチャーと一致した(13.9倍、図29)30。これらの結果は、従来のER/ATでは、配列決定の精度が試料内のDNA損傷の程度に依存することを示唆する。
ER/ATにおける鎖再合成は増幅可能な病変または変化が存在する場合に最も問題であるとの推論から、1人の健康なドナー(HD_78)からのcfDNAを異なる濃度の酸化剤CuCl2/H2O2およびDNase Iに曝露して、DNAをほとんど分解することなく、塩基および主鎖の損傷を誘導した(図25~27、表2)。次いで、従来のER/ATを適用し、二重鎖配列決定を実施し、各二重鎖の末端から最後の12bpをトリミングした後に、エラー率を計算した24(図28A、図29、表4)。
表4:ターゲットパネル配列決定によってプロファイリングされたすべての試料の配列決定メトリクス。
誘導された損傷の影響が回復可能かどうかを決定するために、最も重度に損傷した試料に二重鎖修復を適用し、それらを同じ遺伝子パネルで配列決定した。エラー率の、1.2e-6から3.7e-7への有意な減少が観察され、これは従来のER/ATで処理したネイティブcfDNA試料と同様であった(3.2e-7、図28A)。実際、誘導されたC→Aエラーの影響はほぼ完全に「救済」されたが(図29)、他のコンテキストについてはエラー率にほとんど変化はなかった(図29)。次いで、二重鎖修復をネイティブ(すなわち、損傷していない)cfDNAに適用し、試験したすべての条件の中で最も低いエラー率を見出した(1.0e-7、図28A、図29)。これらの結果は、二重鎖修復が誘導されたDNA損傷の影響を回復できることを示唆する。
次に、臨床試料の二重鎖配列決定に使用した場合に、二重鎖修復が従来のER/ATよりも高い精度を提供できるかどうかを決定することが求められた。A127遺伝子「汎がん」パネルを3つの試料タイプにわたって適用した(図28B)。すべての試料において、二重鎖修復を適用した場合のエラー率が従来のER/ATと比較して低いことが観察された。特に、エラー率の中央値は、健全なcfDNAでは5.8e-7(範囲3.2e-7~8.1e-7)から3.0e-7(範囲9.2e-8~3.8e-7)に、がんcfDNAでは1.4e-6(範囲1.4e-6~3.8e-6)から4.3e-7(範囲3.6e-7~5.3e-7)に、およびFFPE腫瘍生検では2.8e-5(範囲2.1e-5~1.1e-4)から1.0e-5(範囲5.2e-6~1.7e-5)に減少し、これはそれぞれ、エラー率における中央値の2.5倍(C.I.1.6~3.3)、4.0倍(C.I.3.4~4.5)、および4.0倍(C.I.3.1~4.9)の減少であり、P48からのがん患者のcfDNAは、エラー率において最大の8.9倍の減少を示した(図28B)。さらに、二重鎖配列決定エラー率の最も顕著な減少は、次のコンテキストで生じた:C→T(健康なcfDNAの場合は中央値3.6倍、C.I.2.5~4.1;がんのcfDNAの場合は中央値5.7倍、C.I.5.3~5.8;FFPE生検の場合は中央値4.1倍、C.I.3.1~5.0)、C→A(健康なcfDNAの場合は中央値3.4倍、C.I.2.7~3.8;がんのcfDNAの場合は中央値3.8倍、C.I.3.6~4.0;FFPE生検の場合は中央値19.0倍、C.I.18.7~19.3)、C→G(健康なcfDNAの場合は中央値1.9倍、C.I.1.2~2.5;がんのcfDNAの場合は中央値1.5倍、C.I.1.0~1.9;FFPE生検の場合は中央値6.2倍、C.I.5.8~6.6;図30、表3)。
表3:ターゲットパネル配列決定の変異コンテキスト別のエラー率および倍率変化。3つのがん患者cfDNA試料と5つのFFPE腫瘍生検について、変異コンテキスト別に分類された二重鎖配列決定エラー率。試料は、二重鎖修復および従来のER/ATで処理した。
表3:ターゲットパネル配列決定の変異コンテキスト別のエラー率および倍率変化。3つのがん患者cfDNA試料と5つのFFPE腫瘍生検について、変異コンテキスト別に分類された二重鎖配列決定エラー率。試料は、二重鎖修復および従来のER/ATで処理した。
注目すべきことに、塩基エラーは断片の末端でより顕著に濃縮されており、二重鎖修復については、合計9,122の塩基エラーの34%(評価された全塩基について正規化した後)がいずれかの二重鎖断片末端からの最初の塩基にあり、これに比べて従来のER/ATでは、合計31,100の塩基エラーのわずか15%がそうであることが観察された(図28C、図17)。全体として、従来のER/ATの68%とは対照的に、二重鎖修復では塩基エラーの74%が断片の末端から12bp以内に集中していると推定された。これらの塩基エラーは、二重鎖断片の末端から12bp未満の領域をフィルタリングすることによりin silicoで除去できることは注目に値する。最後に、鎖再合成フラクションと観察されたエラー率との関係を、臨床試料全体で調べた。再合成された内部塩基対のフラクションと二重鎖配列決定のエラー率との間には、全体として強い相関関係が観察された(ピアソンのr=0.859;図28D)。これらの結果は、二重鎖修復がライブラリー構築中の再合成を制限することにより、臨床試料の二重鎖配列決定において一貫してより高い精度を提供できることを立証する。
本明細書では、既存の「末端修復/dAテーリング」(ER/AT)方法は、特に内部ニック、ギャップ、または長い5’オーバーハングがある場合に、各DNA二重鎖の大部分を再合成可能であることが示される。これは、両方の鎖からのリードのコンセンサスを必要とする二重鎖配列決定等の技法にとって大きな問題である。ここで紹介するのは、ER/ATを慎重かつ段階的に実施する二重鎖修復と呼ばれる解決策である。これは、cfDNAおよびFFPE腫瘍生検などの検体の、がん遺伝子パネルの二重鎖配列決定において、再合成を8~464倍に制限し、誘導されたDNA損傷の影響を回復し、最大8.9倍高い精度をもたらすことが示されている。二重鎖配列決定の生物医学研究および診断検査における広範な使用を考慮すると、これらの発見は、腫瘍学、感染症、免疫学、出生前医学、法医学、遺伝子工学などの多くの分野に広範な影響を与える可能性がある。
この例は、ER/ATにおけるこの主要なアキレス腱を特徴付け、DNA損傷にもかかわらず高精度のDNA配列決定を回復するための解決策を提供した。短い5’オーバーハングの埋め込みのために、二重鎖配列データにおいて偽変異が断片末端に蓄積することが認識されているが、偽変異が各DNA二重鎖の内部に、ER/ATの結果としてどの程度現れる可能性があるかは、まだ確立されていない。本明細書に記載の一分子配列決定アッセイは、ER/ATおよびDNA修復のメカニズムに対する新たな洞察を提供した。実際、驚いたことには、健康なcfDNA、がん患者のcfDNA、およびFFPE腫瘍生検において、各二重鎖の末端から12bpを超える塩基対のそれぞれ7~9%、15~17%、および32~57%が、従来のER/AT方法を適用すると再合成され得ることが見出された。さらに、様々な塩基および主鎖の損傷の誘導は、従来のER/AT方法を適用した場合にいかにしてこの2つが一緒にエラーの「完璧な嵐」を生み出すのかを示した。鎖再合成とエラー率の両方がDNase I濃度と共に増加するという、本明細書で示された観察は、液体生検などの診断検査の信頼性が、個人の血流中のヌクレアーゼ活性によって影響を受け得ることを示唆する。臨床検体の品質には大きなばらつきがあることを考えると、これらの発見はこの分野にとって重要な意味を有する。
本明細書に示すように、ER/AT方法は「鉛筆と消しゴム」のように機能し、ホスホジエステル主鎖の不連続部の下流の核酸塩基を書き換え、元々1本の鎖に限定されていた病変または変化の誤検出を促進する。一方、二重鎖修復の解決策は、二重鎖DNAの配列完全性を保存し、かつDNAの遺伝情報の二重性を利用する方法の信頼性を向上させる、最初の既知のアプローチの1つを提供する。
例2における参考文献
以下の各参考文献は、その全体が本明細書に組み込まれる。
例2における参考文献
以下の各参考文献は、その全体が本明細書に組み込まれる。
例3:二重鎖修復は各DNA二重鎖の「元の」核酸塩基組成を最大化する
図13A~13Cおよび図31A~31Dに関連して、次の結論が得られる:
図13A~13Cおよび図31A~31Dに関連して、次の結論が得られる:
最初に、従来のER/AT方法は、ニック、ギャップ、および長いオーバーハングが存在する各二重鎖を実質的に再合成できることが確認されている(図13A)。
cfDNAおよびFFPE腫瘍生検中の塩基対の7~52%より多くが、再合成され得ることが発見された(図13B)。
二重鎖修復(例:図1および本明細書に記載)を用いると、再合成が5.5~7.5倍少ないことが確認されている(図13C)。
二重鎖修復は、誘導されたDNA損傷の影響を軽減し(図31A~31B)、二重鎖配列決定にさらに高い精度を付与する(図31C~31D)ことが見出された。
例4:二重鎖修復の追加の方法
上記実施例に記載の二重鎖修復は、依然として、ExoVII処理後に残るギャップおよび短いオーバーハングの埋め込みの制限を必要とし(図32A~32B)、これにより、両方の鎖にコピーされる塩基損傷エラーが理論的に「ゼロではない」可能性が残される(図32C~32F)。したがって目的は、次世代の二重鎖修復、例えば「v2」を創出することであり、これは、鎖再合成の必要性を完全に排除し、したがって理論的には両方の鎖へのエラー伝播の可能性を「ゼロ」にし、一方で高い分子回収率を保有するものである。これを達成するための提案を図33Aに詳しく示す;これはヌクレアーゼS1の使用を伴い、ヌクレアーゼS1とは、二重鎖DNA中の一本鎖ギャップ領域およびオーバーハングを切断し、二本鎖領域を無傷のままにしつつ、完全に平滑化された二重鎖を生成することが実証された、一本鎖エンドヌクレアーゼである。この機能により、二重鎖修復v2は、損傷塩基の切除、ExoVIIでの処理、またはExoVII処理後に残ったギャップおよび短い5’オーバーハングを埋める必要性を排除することで、以前のバージョンよりも改善されている。
上記実施例に記載の二重鎖修復は、依然として、ExoVII処理後に残るギャップおよび短いオーバーハングの埋め込みの制限を必要とし(図32A~32B)、これにより、両方の鎖にコピーされる塩基損傷エラーが理論的に「ゼロではない」可能性が残される(図32C~32F)。したがって目的は、次世代の二重鎖修復、例えば「v2」を創出することであり、これは、鎖再合成の必要性を完全に排除し、したがって理論的には両方の鎖へのエラー伝播の可能性を「ゼロ」にし、一方で高い分子回収率を保有するものである。これを達成するための提案を図33Aに詳しく示す;これはヌクレアーゼS1の使用を伴い、ヌクレアーゼS1とは、二重鎖DNA中の一本鎖ギャップ領域およびオーバーハングを切断し、二本鎖領域を無傷のままにしつつ、完全に平滑化された二重鎖を生成することが実証された、一本鎖エンドヌクレアーゼである。この機能により、二重鎖修復v2は、損傷塩基の切除、ExoVIIでの処理、またはExoVII処理後に残ったギャップおよび短い5’オーバーハングを埋める必要性を排除することで、以前のバージョンよりも改善されている。
二重鎖修復v2は、3つのステップからなる:(1)リン酸化およびニックシーリング;(2)オーバーハングおよびギャップの除去;および(3)制限されたdAテーリング:図33A。ステップ1では、T4ポリヌクレオチドキナーゼおよびHiFi Taqリガーゼを使用して、DNAが5’リン酸部分と3’ヒドロキシル部分を有し、ニックがシールされていることをそれぞれ確認する。ステップ2では、ヌクレアーゼS1が5’および3’オーバーハングを除去すると同時に、長さ1ヌクレオチド程度の小さいギャップ領域を可溶性dNMP(例:デオキシヌクレオシド一リン酸)中に消化し、これらのモチーフの以前の末端で平滑化二重鎖を生成する。注目すべき点は、ヌクレアーゼS1消化後に5’リン酸部分と3’ヒドロキシル部分が残されることである。ステップ3では、制限されたdAテーリングのために、以前の二重鎖修復方法で利用されていたようにクレノウ断片(exo-)およびTaq DNAポリメラーゼにdATPのみを補充する(すなわち、dCTP、dGTP、および/またはdTTPは提供されない)。これにより、3’デオキシアデノシンテールのみが付加できることが保証される。
キャピラリー電気泳動(図33B)、ddPCR(図33C)、一分子配列決定(図32A)、および二重鎖配列決定(図32C)アッセイを使用して、二重鎖修復v2、その分子回収率、再合成された塩基の数、および二重鎖配列決定エラー率を、それぞれ市販のER/ATキットと比較して特徴付ける。各ステップは、キャピラリー電気泳動(CE)による評価のために、ニック、ギャップ、およびオーバーハングを有する蛍光標識された合成オリゴヌクレオチドを使用して独自に試験され、最初にCEトレースから酵素活性および変換効率を定性的に評価する(図33B)。意図した性能が確認された後、二重鎖修復v2は可能な限り少ないステップの方法として緩衝液交換を排除し、緩衝液組成と実験条件(例:時間、温度、濃度、および代替酵素)を最適化して、分子回収率を最大化することを目指して定式化される。次に、生殖系列配列が決定されている健康なドナーからのバフィーコート由来のゲノムDNAの様々な入力(例:<1~1000ng)を試験し、様々な方法(例:超音波処理、酵素消化)で異なる挿入サイズの中央値(例:50~250bp)に剪断する。次に二重鎖修復v2の、再合成された塩基の数、二重鎖配列決定エラー率、および分子回収率を、KAPA(商標)Hyper PrepおよびNEB(商標)Ultra IIキットを使用し、市販のER/ATと比較して特徴付ける。様々な程度の塩基および主鎖損傷を受けたDNA(図32E)およびホルマリン固定腫瘍生検(図32B~32C)などの困難な試料も、試料取り扱い条件、例えば、様々な凍結融解サイクル、緩衝液組成、および室温での保管延長の影響を調査するために、試験されるであろう。二重鎖修復v2は、二重鎖修復の性能をさらに改善し、FFPE腫瘍生検を含むほとんどの試料について再合成される塩基の数をゼロに減らし(図32B)、したがって二重鎖配列決定精度を最大化する(図32C)。これにより、二重鎖配列決定方法で現在必要とされている、各断片の最後の12bpをトリミングする必要性も制限され、データ出力が向上する可能性がある。将来のDNA断片化戦略では、例えばオーバーハングの長さを制限するか、または、二本鎖破断箇所でのタグメンテーションまたはライゲーションを介してアダプターを直接付加することができれば、ER/ATの必要性が制限される可能性がある。ただし、cfDNAなどの自然に断片化された試料タイプでは、常にER/ATが必要になるであろう。
配列
本開示は、本開示の方法で使用され得る多くの異なる酵素に言及する。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。いかなる意味においても本開示を限定することを意図するものではないが、以下は、本開示の方法において使用され得る酵素アミノ酸配列の例である。本開示は、以下のアミノ酸配列、または本明細書に開示されるアミノ酸配列のいずれかと少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または99%、または最大100%の配列同一性を有するアミノ酸配列の使用を企図する。
参考文献
以下の各参考文献は、その全体が本明細書に組み込まれる。
追加の態様
本開示は、本開示の方法で使用され得る多くの異なる酵素に言及する。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。いかなる意味においても本開示を限定することを意図するものではないが、以下は、本開示の方法において使用され得る酵素アミノ酸配列の例である。本開示は、以下のアミノ酸配列、または本明細書に開示されるアミノ酸配列のいずれかと少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または99%、または最大100%の配列同一性を有するアミノ酸配列の使用を企図する。
以下の各参考文献は、その全体が本明細書に組み込まれる。
態様1.ヌクレオチド損傷または塩基対不一致の増幅による偽変異の伝播を最小限に抑える、配列決定用の核酸試料(試料)を調製する方法であって、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、および:
(a)試料を、以下が可能な1つ以上の酵素と接触させること:
(i)1つ以上の損傷塩基を、試料から切除すること;
(ii)1つ以上の脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること;
(iii)5’オーバーハングを消化すること;
(b)試料を、以下の1つ以上と接触させること:
(i)鎖置換および5’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の3’オーバーハングを消化することができる、DNA依存性DNAポリメラーゼ;
(ii)試料の鎖の5’末端をリン酸化することができる酵素;および
(c)試料を、ニックをシーリング可能なDNAリガーゼと接触させること、
を含む、前記方法。
(a)試料を、以下が可能な1つ以上の酵素と接触させること:
(i)1つ以上の損傷塩基を、試料から切除すること;
(ii)1つ以上の脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること;
(iii)5’オーバーハングを消化すること;
(b)試料を、以下の1つ以上と接触させること:
(i)鎖置換および5’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の3’オーバーハングを消化することができる、DNA依存性DNAポリメラーゼ;
(ii)試料の鎖の5’末端をリン酸化することができる酵素;および
(c)試料を、ニックをシーリング可能なDNAリガーゼと接触させること、
を含む、前記方法。
態様2.以下をさらに含む、態様1に記載の方法:
(d)アダプターライゲーション用の試料を調製するステップ、ここで該調製は、以下を含む:
(i)デオキシアデノシン一リン酸(dAMP)を、試料の鎖の3’末端に付加すること(dAテーリング);または
(ii)任意に、試料の末端を平滑化すること。
(d)アダプターライゲーション用の試料を調製するステップ、ここで該調製は、以下を含む:
(i)デオキシアデノシン一リン酸(dAMP)を、試料の鎖の3’末端に付加すること(dAテーリング);または
(ii)任意に、試料の末端を平滑化すること。
態様3.dAテーリングが、試料を、デオキシアデノシン一リン酸(dAMP)を試料の鎖の3’末端に組み込むことができる酵素と接触させること、および試料をdNTPと接触させること、を含む、態様2に記載の方法。
態様4.ステップ(a)~(c)で使用される酵素および/またはdNTPが、dAテーリングの前に反応容器から実質的に除去される、態様2または態様3に記載の方法。
態様5.試料と接触するdNTPが、dATPを実質的に含む、態様2または態様3~4のいずれか1つに記載の方法。
態様6.試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも5分間インキュベートする、態様1または態様2~5のいずれか1つに記載の方法。
態様7.試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも25分間インキュベートする、態様1または態様2~6のいずれか1つに記載の方法。
態様8.試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする、態様1または態様2~7のいずれか1つに記載の方法。
態様9.試料を、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも5分間インキュベートする、態様1または態様2~8のいずれか1つに記載の方法。
態様10.試料を、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも25分間インキュベートする、態様1または態様2~9のいずれか1つに記載の方法。
態様11.方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする、態様1または態様2~10のいずれか1つに記載の方法。
態様12.試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも15分間インキュベートする、態様1または態様2~11のいずれか1つに記載の方法。
態様13.試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする、態様1または態様2~12のいずれか1つに記載の方法。
態様14.試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも45分間インキュベートする、態様1または態様2~13のいずれか1つに記載の方法。
態様15.試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも40分間インキュベートする、態様2または態様3~14のいずれか1つに記載の方法。
態様16.試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも60分間インキュベートする、態様2または態様3~15のいずれか1つに記載の方法。
態様17.試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも70分間インキュベートする、態様2または態様3~16のいずれか1つに記載の方法。
態様18.ステップ(a)が、約32℃~約42℃の温度で実施される、態様1または態様2~17のいずれか1つに記載の方法。
態様19.ステップ(a)が、約35℃~約39℃の温度で実施される、態様1または態様2~18のいずれか1つに記載の方法。
態様20.ステップ(b)が、約32℃~約42℃の温度で実施される、態様1または態様2~19のいずれか1つに記載の方法。
態様21.ステップ(b)が、約35℃~約39℃の温度で実施される、態様1または態様2~20のいずれか1つに記載の方法。
態様22.ステップ(c)が、約30℃~約70℃の温度で実施される、態様1または態様2~21のいずれか1つに記載の方法。
態様23.ステップ(c)が、約33℃~約67℃の温度で実施される、態様1または態様2~22のいずれか1つに記載の方法。
態様24.ステップ(d)が、約18℃~約69℃の温度で実施される、態様2または態様3~23のいずれか1つに記載の方法。
態様25.ステップ(d)が、約20℃~約67℃の温度で実施される、態様2または態様3~24のいずれか1つに記載の方法。
態様26.ステップ(a)の前に、試料が:(i)断片化される;または(ii)切断およびタグ付けされる(タグメントされる)、態様1または態様2~25のいずれか1つに記載の方法。
態様27.断片化が、(a)物理的断片化;(b)酵素的断片化;および/または(c)化学的断片化によるものである、態様27に記載の方法。
態様28.断片化が、物理的断片化による、態様26または態様27に記載の方法。
態様29.断片化が、酵素的断片化による、態様26または態様27に記載の方法。
態様30.断片化が、化学的断片化による、態様26または態様27に記載の方法。
態様31.ステップ(a)が、試料を、以下からなる群から選択される1つ以上の酵素と接触させることを含む、態様1または態様2~30のいずれか1つに記載の方法:(1)エンドヌクレアーゼIV(EndoIV);(2)ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);(3)ウラシル-DNAグリコシラーゼ(UDG);(4)T4ピリミジンDNAグリコシラーゼ(T4 PDG);および(5)エンドヌクレアーゼVIII(EndoVIII);(6)エキソヌクレアーゼVII(ExoVII)。
態様32.1つ以上の酵素の同時活性が、試料上の以下のDNA改変を触媒する、態様1または態様2~31のいずれか1つに記載の方法:(1)損傷塩基の切除;および(2)脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること。
態様33.損傷塩基が、ウラシル;8’オキソG;酸化ピリミジン;およびシクロブタンピリミジン二量体からなる群から選択される、態様1または態様2~32のいずれか1つに記載の方法。
態様34.試料の少なくとも1つの鎖の5’オーバーハングが、少なくとも10核酸塩基長である、態様1または態様2~33のいずれか1つに記載の方法。
態様35.試料の少なくとも1つの鎖の5’オーバーハングが、少なくとも75核酸塩基長である、態様1または態様2~34のいずれか1つに記載の方法。
態様36.試料の少なくとも1つの鎖の3’オーバーハングが、少なくとも10核酸塩基長である、態様1または態様2~35のいずれか1つに記載の方法。
態様37.試料の少なくとも1つの鎖の3’オーバーハングが、少なくとも75核酸塩基長である、態様1または態様2~36のいずれか1つに記載の方法。
態様38.1つ以上の酵素が、試料の少なくとも1つの鎖の5’オーバーハングを16核酸塩基未満の長さに消化する、態様1または態様2~37のいずれか1つに記載の方法。
態様39.1つ以上の酵素が、試料の少なくとも1つの鎖の5’オーバーハングを8核酸塩基未満の長さに消化する、態様1または態様2~38のいずれか1つに記載の方法。
態様40.1つ以上の酵素が、試料の少なくとも1つの鎖の3’オーバーハングを16核酸塩基未満の長さに消化する、態様1または態様2~39のいずれか1つに記載の方法。
態様41.1つ以上の酵素が、試料の少なくとも1つの鎖の3’オーバーハングを8核酸塩基未満の長さに消化する、態様1または態様2~40のいずれか1つに記載の方法。
態様42.エンドヌクレアーゼIV(EndoIV)が、脱塩基部位を切断する、態様1または態様2~41のいずれか1つに記載の方法。
態様43.ホルムアミドピリミジン[fapy]-DNAグリコシラーゼが、損傷プリンを切除する、態様1または態様2~41のいずれか1つに記載の方法。
態様44.ウラシル-DNAグリコシラーゼ(UDG)が、ウラシルを切除する、態様1または態様2~41のいずれか1つに記載の方法。
態様45.T4ピリミジンDNAグリコシラーゼ(T4 PDG)が、シクロブタンピリミジン二量体を切除する、態様1または態様2~41のいずれか1つに記載の方法。
態様46.エンドヌクレアーゼVIII(EndoVIII)が、損傷ピリミジンを切除する、態様1または態様2~41のいずれか1つに記載の方法。
態様47.DNAリガーゼが、HiFi Taq DNAリガーゼである、態様1または態様2~46のいずれか1つに記載の方法。
態様48.DNAリガーゼが、ニックシーリング活性を有するが、末端結合活性を欠く、態様1または態様2~47のいずれか1つに記載の方法。
態様49.ステップ(b)が、DNA断片をポリヌクレオチドキナーゼ(Pnk)と接触させることを含む、態様2または態様3~48のいずれか1つに記載の方法。
態様50.Pnkが、T4ポリヌクレオチドキナーゼである、態様49に記載の方法。
態様51.態様31または態様32~50のいずれか1つに記載の方法であって、(a)エンドヌクレアーゼIV(EndoIV)が、配列番号3のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;(b)ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg)が、配列番号4のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;(c)ウラシル-DNAグリコシラーゼ(UDG)が、配列番号5~7からなる群から選択されるアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;(d)T4ピリミジンDNAグリコシラーゼ(T4 PDG)が、任意の既知の配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;(e)エンドヌクレアーゼVIII(EndoVIII)が、配列番号8~9からなる群から選択されるアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;および/または(f)エキソヌクレアーゼVII(ExoVII)が、任意の既知のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含む、前記方法。
態様52.ポリヌクレオチドキナーゼが、配列番号8のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含む、態様49または態様50~51のいずれか1つに記載の方法。
態様53.態様1または態様2~52のいずれか1つに記載の方法であって、(1)DNA依存性DNAポリメラーゼが、任意の既知のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;および/または(2)DNAリガーゼが、配列番号11~13からなる群から選択されるアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含む、前記方法。
態様54.偽変異の検出を軽減する配列決定方法であって、(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~52のいずれか1つに記載の方法を実施すること;(A3)試料を配列決定すること;および(A4)変異をコンピュータ分析により同定すること、を含む、前記方法。
態様55.二重鎖配列決定におけるアーチファクトを低減する方法であって、(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~52のいずれか1つに記載の方法を実施すること;および(A3)試料を二重鎖配列決定すること、を含む、前記方法。
態様56.配列決定のための核酸試料調製の間の、合成鎖の合成を低減する方法であって、(A1)配列決定する核酸を取得すること;および(A2)態様1または態様2~52のいずれか1つに記載の方法を実施すること、を含む、前記方法。
態様57.変異同定の精度を高める方法であって、(A1)配列決定する核酸を取得すること;(A2)態様1または態様2~52のいずれか1つに記載の方法を実施すること;(A3)試料を二重鎖配列決定すること;および(A4)変異をコンピュータ分析により同定すること、を含む、前記方法。
態様58.(a)態様1~57のいずれかに記載の方法を実施するための試薬;および(b)容器、を含むキット:
態様59.反応容器をさらに含む、態様58に記載のキット。
態様60.試薬が以下を含む、態様58または態様59のいずれか1つに記載のキット:(a)エンドヌクレアーゼIV(EndoIV)、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);ウラシル-DNAグリコシラーゼ(UDG);T4ピリミジンDNAグリコシラーゼ(T4 PDG);および/またはエンドヌクレアーゼVIII(EndoVIII);エキソヌクレアーゼVII(ExoVII)、T4ポリヌクレアーゼキナーゼ(T4 Pnk)、T4 DNAポリメラーゼ、HiFi Taqリガーゼ、クレノウ断片、およびTaqポリメラーゼの、1つ以上、および/または(b)dNTP。
態様61.キットがさらに、試料を断片化するための試薬および材料を含む、態様58または態様59~60のいずれか1つに記載のキット。
態様62.試料の少なくとも一部が二本鎖である核酸試料(試料)を調製する方法であって、試料を反応容器に添加すること、および、(a)試料を、以下が可能な1つ以上の酵素と接触させること:(i)試料の鎖の5’末端をリン酸化すること;3’ヒドロキシル部分を試料の鎖の3’末端に付加すること;および(ii)ニックをシーリングすること;(b)試料を、5’および3’オーバーハングを除去すると共にギャップ領域を消化することができる1つ以上の酵素と接触させて、平滑化二重鎖を生成すること;および(c)デオキシアデノシン一リン酸(dAMP)を、試料の鎖の3’末端に付加すること(dAテーリング)、を含む、前記方法。
態様63.ステップ(a)(1)で使用される酵素が、T4ポリヌクレオチドキナーゼ、HiFi Taqリガーゼ、またはそれらの組み合わせを含む、態様62に記載の方法。
態様64.ステップ(b)で使用される酵素が、ヌクレアーゼS1である、態様62または態様63に記載の方法。
本明細書で明示的に記載されている態様に加えて、本開示に開示されている特色のすべては、任意の組み合わせ(例:順列、組み合わせ)で組み合わせられることを理解されたい。本開示に開示されている各要素は、同一、等価、または類似の目的を果たす代替の特色によって置き換えることができる。したがって特に明記しない限り、開示される各特色は、一般的な一連の等価または類似の特色の例にすぎない。
上記の説明から、当業者は、本発明の本質的な特徴を容易に確認することができ、本発明の精神および範囲から逸脱することなく、本発明に様々な変更および改変を加えて、本発明を様々な用途および条件に適応させることができる。したがって、他の態様もまた特許請求の範囲内にある。
均等物および範囲
冠詞「a」、「an」、および「the」などは、逆の指示がない限り、または文脈から明らかでない限り、1またはそれ以上を意味し得る。グループの1つ以上のメンバー間に「または」を含む態様または説明は、逆の指示がない限り、または文脈から明らかでない限り、グループメンバーの1つ、複数、またはすべてが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する場合に、満たされると見なされる。本発明は、グループの正確に1つのメンバーが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する態様を含む。本発明は、グループメンバーの1つより多くまたはすべてが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する態様を含む。
冠詞「a」、「an」、および「the」などは、逆の指示がない限り、または文脈から明らかでない限り、1またはそれ以上を意味し得る。グループの1つ以上のメンバー間に「または」を含む態様または説明は、逆の指示がない限り、または文脈から明らかでない限り、グループメンバーの1つ、複数、またはすべてが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する場合に、満たされると見なされる。本発明は、グループの正確に1つのメンバーが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する態様を含む。本発明は、グループメンバーの1つより多くまたはすべてが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する態様を含む。
さらに本開示は、列挙された請求項の1つ以上からの1つ以上の限定、要素、条項、および説明用語が別の請求項に導入されるすべての変形、組み合わせ、および順列を包含する。例えば、別の請求項に従属する任意の請求項は、同じ基本請求項に従属する任意の他の請求項に見られる1つ以上の限定を含むように、改変することができる。要素がリストとして提示される場合、例えばマーカッシュグループ形式では、要素の各サブグループも開示され、任意の要素(単数または複数)をグループから削除できる。一般に、本発明または本発明の側面が特定の要素および/または特色を含むとされる場合、開示の特定の態様または開示の側面は、かかる要素および/または特色からなる、または本質的にそれらからなることを理解されたい。簡単にするために、これらの態様は、本明細書では直接的具体的に説明されてはいない。用語「含む(comprising)」および「含有する(containing)」は、オープンであることを意図しており、追加の要素またはステップを含めることを許容することにも留意されたい。範囲が指定されている場合は、エンドポイントも含まれる。さらに、別段の指示がない限り、または文脈および当業者の理解から明らかでない限り、範囲として表わされる値は、本発明の異なる態様において記載された範囲内の任意の特定の値または部分範囲を、文脈上明らかに別段の指示がない限り、範囲の下限の単位の10分の1までとることができる。
本出願は、様々な発行された特許、公開された特許出願、学術文献、および他の刊行物を参照し、そのすべてが参照により本明細書に組み込まれる。組み込まれた参考文献のいずれかと本明細書との間に矛盾がある場合には、本明細書が優先するものとする。さらに、従来技術に該当する本発明の特定の態様は、任意の1つ以上の態様から明示的に除外することができる。かかる態様は当業者には既知であるとみなされるため、それらは、本明細書に明示的に除外が記載されていなくても、除外することができる。本発明のいかなる特定の態様も、先行技術の存在に関連するか否かにかかわらず、いかなる態様からいかなる理由によっても、除外することができる。
当業者は、日常的な実験のみを使用して、本明細書に記載される特定の態様の多くの均等物を認識するか、確認することができるであろう。本明細書に記載される本態様の範囲は、上記の説明に限定されることを意図するものではなく、むしろ添付の態様に記載される通りである。当業者であれば、以下の態様で定義される本発明の精神または範囲から逸脱することなく、この説明に対する様々な変更および改変を行うことができることを、理解するであろう。
Claims (64)
- 核酸試料(試料)を調製する方法であって、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、および:
(a)試料を、以下が可能な1つ以上の酵素と接触させること:
(i)1つ以上の損傷塩基を、試料から切除すること;
(ii)1つ以上の脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること;
(iii)5’オーバーハングを消化すること;
(b)試料を、以下の1つ以上と接触させること:
(i)鎖置換および5’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の3’オーバーハングを消化することができる、DNA依存性DNAポリメラーゼ;
(ii)試料の鎖の5’末端をリン酸化することができる酵素;および
(c)試料を、ニックをシーリング可能なDNAリガーゼと接触させること、
を含む、前記方法。 - 以下をさらに含む、請求項1に記載の方法:
(d)アダプターライゲーション用の試料を調製するステップ、ここで該調製は、以下を含む:
(i)デオキシアデノシン一リン酸(dAMP)を、試料の鎖の3’末端に付加すること(dAテーリング);または
(ii)任意に、試料の末端をさらに平滑化すること。 - dAテーリングが、試料を、デオキシアデノシン一リン酸(dAMP)を試料の鎖の3’末端に組み込むことができる酵素と接触させること、および試料をdNTPと接触させること、を含む、請求項2に記載の方法。
- ステップ(a)~(c)で使用される酵素および/またはdNTPが、dAテーリングの前に反応容器から実質的に除去される、請求項2または請求項3に記載の方法。
- 試料と接触するdNTPが、dATPを実質的に含む、請求項2または請求項3~4のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも5分間インキュベートする、請求項1または請求項2~5のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも25分間インキュベートする、請求項1または請求項2~6のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(a)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする、請求項1または請求項2~7のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも5分間インキュベートする、請求項1または請求項2~8のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも25分間インキュベートする、請求項1または請求項2~9のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(b)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする、請求項1または請求項2~10のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも15分間インキュベートする、請求項1または請求項2~11のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも30分間インキュベートする、請求項1または請求項2~12のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(c)の1つ以上の酵素と接触させて少なくとも45分間インキュベートする、請求項1または請求項2~13のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも40分間インキュベートする、請求項2または請求項3~14のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも60分間インキュベートする、請求項2または請求項3~15のいずれか一項に記載の方法。
- 試料を、方法の任意の後続のステップに進む前に、ステップ(d)の1つ以上の酵素と接触させて少なくとも70分間インキュベートする、請求項2または請求項3~16のいずれか一項に記載の方法。
- ステップ(a)が、約32℃~約42℃の温度で実施される、請求項1または請求項2~17のいずれか一項に記載の方法。
- ステップ(a)が、約35℃~約39℃の温度で実施される、請求項1または請求項2~18のいずれか一項に記載の方法。
- ステップ(b)が、約32℃~約42℃の温度で実施される、請求項1または請求項2~19のいずれか一項に記載の方法。
- ステップ(b)が、約35℃~約39℃の温度で実施される、請求項1または請求項2~20のいずれか一項に記載の方法。
- ステップ(c)が、約30℃~約70℃の温度で実施される、請求項1または請求項2~21のいずれか一項に記載の方法。
- ステップ(c)が、約33℃~約67℃の温度で実施される、請求項1または請求項2~22のいずれか一項に記載の方法。
- ステップ(d)が、約18℃~約69℃の温度で実施される、請求項2または請求項3~23のいずれか一項に記載の方法。
- ステップ(d)が、約20℃~約67℃の温度で実施される、請求項2または請求項3~24のいずれか一項に記載の方法。
- ステップ(a)の前に、試料が:
(i)断片化される;または
(ii)切断およびタグ付けされる(タグメントされる)、
請求項1または請求項2~25のいずれか一項に記載の方法。 - 断片化が、
(a)物理的断片化;
(b)酵素的断片化;および/または
(c)化学的断片化、
によるものである、請求項27に記載の方法。 - 断片化が、物理的断片化による、請求項26または請求項27に記載の方法。
- 断片化が、酵素的断片化による、請求項26または請求項27に記載の方法。
- 断片化が、化学的断片化による、請求項26または請求項27に記載の方法。
- ステップ(a)が、試料を、以下からなる群から選択される1つ以上の酵素と接触させることを含む、請求項1または請求項2~30のいずれか一項に記載の方法:
(1)エンドヌクレアーゼIV(EndoIV);
(2)ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);
(3)ウラシル-DNAグリコシラーゼ(UDG);
(4)T4ピリミジンDNAグリコシラーゼ(T4 PDG);および
(5)エンドヌクレアーゼVIII(EndoVIII);
(6)エキソヌクレアーゼVII(ExoVII)。 - 1つ以上の酵素の同時活性が、試料上の以下のDNA改変を触媒する、請求項1または請求項2~31のいずれか一項に記載の方法:
損傷塩基の切除;および
(2)脱塩基部位を切断すること、および得られた末端を、DNAポリメラーゼによる伸長および/またはDNAリガーゼによるライゲーションに適合するように処理すること。 - 損傷塩基が、ウラシル;8’オキソG;酸化ピリミジン;およびシクロブタンピリミジン二量体からなる群から選択される、請求項1または請求項2~32のいずれか一項に記載の方法。
- 試料の少なくとも1つの鎖の5’オーバーハングが、少なくとも10核酸塩基長である、請求項1または請求項2~33のいずれか一項に記載の方法。
- 試料の少なくとも1つの鎖の5’オーバーハングが、少なくとも75核酸塩基長である、請求項1または請求項2~34のいずれか一項に記載の方法。
- 試料の少なくとも1つの鎖の3’オーバーハングが、少なくとも10核酸塩基長である、請求項1または請求項2~35のいずれか一項に記載の方法。
- 試料の少なくとも1つの鎖の3’オーバーハングが、少なくとも75核酸塩基長である、請求項1または請求項2~36のいずれか一項に記載の方法。
- 1つ以上の酵素が、試料の少なくとも1つの鎖の5’オーバーハングを16核酸塩基未満の長さに消化する、請求項1または請求項2~37のいずれか一項に記載の方法。
- 1つ以上の酵素が、試料の少なくとも1つの鎖の5’オーバーハングを8核酸塩基未満の長さに消化する、請求項1または請求項2~38のいずれか一項に記載の方法。
- 1つ以上の酵素が、試料の少なくとも1つの鎖の3’オーバーハングを16核酸塩基未満の長さに消化する、請求項1または請求項2~39のいずれか一項に記載の方法。
- 1つ以上の酵素が、試料の少なくとも1つの鎖の3’オーバーハングを8核酸塩基未満の長さに消化する、請求項1または請求項2~40のいずれか一項に記載の方法。
- エンドヌクレアーゼIV(EndoIV)が、脱塩基部位を切断する、請求項1または請求項2~41のいずれか一項に記載の方法。
- ホルムアミドピリミジン[fapy]-DNAグリコシラーゼが、損傷プリンを切除する、請求項1または請求項2~41のいずれか一項に記載の方法。
- ウラシル-DNAグリコシラーゼ(UDG)が、ウラシルを切除する、請求項1または請求項2~41のいずれか一項に記載の方法。
- T4ピリミジンDNAグリコシラーゼ(T4 PDG)が、シクロブタンピリミジン二量体を切除する、請求項1または請求項2~41のいずれか一項に記載の方法。
- エンドヌクレアーゼVIII(EndoVIII)が、損傷ピリミジンを切除する、請求項1または請求項2~41のいずれか一項に記載の方法。
- DNAリガーゼが、HiFi Taq DNAリガーゼである、請求項1または請求項2~46のいずれか一項に記載の方法。
- DNAリガーゼが、ニックシーリング活性を有するが、末端結合活性を欠く、請求項1または請求項2~47のいずれか一項に記載の方法。
- ステップ(b)が、DNA断片をポリヌクレオチドキナーゼ(Pnk)と接触させることを含む、請求項2または請求項3~48のいずれか一項に記載の方法。
- Pnkが、T4ポリヌクレオチドキナーゼである、請求項49に記載の方法。
- 請求項31または請求項32~50のいずれか一項に記載の方法であって、
(a)エンドヌクレアーゼIV(EndoIV)が、配列番号3のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;
(b)ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg)が、配列番号4のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;
(c)ウラシル-DNAグリコシラーゼ(UDG)が、配列番号5~7からなる群から選択されるアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;
(d)T4ピリミジンDNAグリコシラーゼ(T4 PDG)が、任意の既知の配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;
(e)エンドヌクレアーゼVIII(EndoVIII)が、配列番号6~7からなる群から選択されるアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;および/または
(f)エキソヌクレアーゼVII(ExoVII)が、任意の既知のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含む、
前記方法。 - ポリヌクレオチドキナーゼが、配列番号10のアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含む、請求項49または請求項50~51のいずれか一項に記載の方法。
- 請求項1または請求項2から52のいずれか一項に記載の方法であって:
(1)DNA依存性DNAポリメラーゼが、任意の既知のまたは入手可能なアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含み;および/または
(2)DNAリガーゼが、配列番号11~13からなる群から選択されるアミノ酸配列に対して少なくとも70%の同一性を有するアミノ酸配列を含む、
前記方法。 - 偽変異の検出を軽減する配列決定方法であって、
(A1)配列決定する核酸を取得すること;
(A2)請求項1または請求項2~52のいずれか一項に記載の方法を実施すること;
(A3)試料を配列決定すること;および
(A4)変異をコンピュータ分析により同定すること、
を含む、前記方法。 - 二重鎖配列決定におけるアーチファクトを低減する方法であって、
(A1)配列決定する核酸を取得すること;
(A2)請求項1または請求項2~52のいずれか一項に記載の方法を実施すること;および
(A3)試料を二重鎖配列決定すること、
を含む、前記方法。 - 配列決定のための核酸試料調製の間の、合成鎖の合成を低減する方法であって、
(A1)配列決定する核酸を取得すること;および
(A2)請求項1または請求項2~52のいずれか一項に記載の方法を実施すること、
を含む、前記方法。 - 変異同定の精度を高める方法であって、
(A1)配列決定する核酸を取得すること;
(A2)請求項1または請求項2~52のいずれか一項に記載の方法を実施すること;
(A3)試料を二重鎖配列決定すること;および
(A4)変異をコンピュータ分析により同定すること、
を含む、前記方法。 - 以下を含むキット:
(a)請求項1~57のいずれかに記載の方法を実施するための試薬;および
(b)容器。 - 反応容器をさらに含む、請求項58に記載のキット。
- 試薬が以下を含む、請求項58または請求項59のいずれか一項に記載のキット:
(a)エンドヌクレアーゼIV(EndoIV)、ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);ウラシル-DNAグリコシラーゼ(UDG);T4ピリミジンDNAグリコシラーゼ(T4 PDG);および/またはエンドヌクレアーゼVIII(EndoVIII);エキソヌクレアーゼVII(ExoVII)、T4ポリヌクレアーゼキナーゼ(T4 Pnk)、T4 DNAポリメラーゼ、HiFi Taqリガーゼ、クレノウ断片、およびTaqポリメラーゼの、1つ以上、および/または
(b)dNTP。 - キットがさらに、試料を断片化するための試薬および材料を含む、請求項58または請求項59~60のいずれか一項に記載のキット。
- 試料の少なくとも一部が二本鎖である核酸試料(試料)を調製する方法であって、試料を反応容器に添加すること、および、
(a)試料を、以下が可能な1つ以上の酵素と接触させること:
(i)試料の鎖の5’末端をリン酸化すること;3’ヒドロキシル部分を試料の鎖の3’末端に付加すること;および
(ii)ニックをシーリングすること;
(b)試料を、5’および3’オーバーハングを除去すると共にギャップ領域を消化することができる1つ以上の酵素と接触させて、平滑化二重鎖を生成すること;および
(c)デオキシアデノシン一リン酸(dAMP)を、試料の鎖の3’末端に付加すること(dAテーリング)、
を含む、前記方法。 - ステップ(a)(1)で使用される酵素が、T4ポリヌクレオチドキナーゼ、HiFi Taqリガーゼ、またはそれらの組み合わせを含む、請求項62に記載の方法。
- ステップ(b)で使用される酵素が、ヌクレアーゼS1である、請求項62または請求項63に記載の方法。
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063124700P | 2020-12-11 | 2020-12-11 | |
US63/124,700 | 2020-12-11 | ||
US202163143397P | 2021-01-29 | 2021-01-29 | |
US63/143,397 | 2021-01-29 | ||
US202163191320P | 2021-05-20 | 2021-05-20 | |
US63/191,320 | 2021-05-20 | ||
US202163191914P | 2021-05-21 | 2021-05-21 | |
US63/191,914 | 2021-05-21 | ||
US202163217007P | 2021-06-30 | 2021-06-30 | |
US63/217,007 | 2021-06-30 | ||
PCT/US2021/062936 WO2022125977A1 (en) | 2020-12-11 | 2021-12-10 | Methods for duplex repair |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023553984A true JP2023553984A (ja) | 2023-12-26 |
Family
ID=81973982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023535682A Pending JP2023553984A (ja) | 2020-12-11 | 2021-12-10 | 二重鎖修復の方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240110223A1 (ja) |
EP (1) | EP4259819A1 (ja) |
JP (1) | JP2023553984A (ja) |
WO (1) | WO2022125977A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024020573A1 (en) * | 2022-07-21 | 2024-01-25 | Guardant Health, Inc. | Methods for detection and reduction of sample preparation-induced methylation artifacts |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8722585B2 (en) * | 2011-05-08 | 2014-05-13 | Yan Wang | Methods of making di-tagged DNA libraries from DNA or RNA using double-tagged oligonucleotides |
US10023856B2 (en) * | 2013-09-25 | 2018-07-17 | Thermo Fisher Scientific Baltics Uab | Enzyme composition for DNA end repair, adenylation, phosphorylation |
US20180051341A1 (en) * | 2016-08-17 | 2018-02-22 | New England Biolabs, Inc. | Method for Reducing Sequencing Errors Caused by DNA Fragmentation |
-
2021
- 2021-12-10 JP JP2023535682A patent/JP2023553984A/ja active Pending
- 2021-12-10 WO PCT/US2021/062936 patent/WO2022125977A1/en active Application Filing
- 2021-12-10 US US18/266,555 patent/US20240110223A1/en active Pending
- 2021-12-10 EP EP21904519.2A patent/EP4259819A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4259819A1 (en) | 2023-10-18 |
WO2022125977A1 (en) | 2022-06-16 |
US20240110223A1 (en) | 2024-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11697843B2 (en) | Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing | |
US11326202B2 (en) | Methods of enriching and determining target nucleotide sequences | |
CN110036118B (zh) | 用于识别核酸分子的组合物和方法 | |
US20220259638A1 (en) | Methods and compositions for high throughput sample preparation using double unique dual indexing | |
US9745614B2 (en) | Reduced representation bisulfite sequencing with diversity adaptors | |
CN106912197B (zh) | 用于多重pcr的方法和组合物 | |
CN109937254B (zh) | 核酸样品制备方法 | |
CN110023504B (zh) | 用于分析无细胞dna的核酸样品制备方法 | |
JP6970205B2 (ja) | Dnaおよびrnaの同時濃縮を含むプライマー伸長標的濃縮およびそれに対する向上 | |
JP2023081950A (ja) | ライブラリー調製方法ならびにそのための組成物および使用 | |
EP4090766A1 (en) | Methods of targeted sequencing | |
JP2022160661A (ja) | 単一分子配列決定のための一本鎖環状dna鋳型の作成 | |
CN111801427B (zh) | 用于单分子的单链环状dna模板的产生 | |
JP6876785B2 (ja) | 単分子配列決定のための一本鎖環状dnaライブラリーを生成するための方法 | |
JP2023553984A (ja) | 二重鎖修復の方法 | |
WO2022144003A1 (zh) | 一种用于高通量靶向测序的多重pcr文库构建方法 | |
WO2019180528A1 (en) | Methods of labelling nucleic acids | |
WO2019180527A1 (en) | Methods of sequencing nucleic acids and error correction of sequence reads | |
WO2022229128A1 (en) | Amplification of single stranded dna | |
US20240052342A1 (en) | Method for duplex sequencing | |
US20230193353A1 (en) | Methods and compositions for high-fidelity sequence analysis of individual long and ultralong nucleic acid molecules | |
WO2024137316A1 (en) | Oligonucleotides and methods for capturing single-stranded templates and/or templates with 3' overhangs |