KR102084186B1 - Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법 - Google Patents
Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법 Download PDFInfo
- Publication number
- KR102084186B1 KR102084186B1 KR1020180005709A KR20180005709A KR102084186B1 KR 102084186 B1 KR102084186 B1 KR 102084186B1 KR 1020180005709 A KR1020180005709 A KR 1020180005709A KR 20180005709 A KR20180005709 A KR 20180005709A KR 102084186 B1 KR102084186 B1 KR 102084186B1
- Authority
- KR
- South Korea
- Prior art keywords
- emx1
- dna
- target
- sequence
- leu
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000005783 single-strand break Effects 0.000 title abstract description 14
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 85
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 85
- 102100026846 Cytidine deaminase Human genes 0.000 claims abstract description 42
- 108010031325 Cytidine deaminase Proteins 0.000 claims abstract description 42
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 39
- 239000000203 mixture Substances 0.000 claims abstract description 23
- 108020004414 DNA Proteins 0.000 claims description 304
- 108090000623 proteins and genes Proteins 0.000 claims description 135
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 70
- 238000003776 cleavage reaction Methods 0.000 claims description 60
- 230000007017 scission Effects 0.000 claims description 60
- 108091033409 CRISPR Proteins 0.000 claims description 50
- 150000007523 nucleic acids Chemical group 0.000 claims description 48
- 102000004169 proteins and genes Human genes 0.000 claims description 48
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 43
- 239000012634 fragment Substances 0.000 claims description 35
- 229940035893 uracil Drugs 0.000 claims description 35
- 239000002773 nucleotide Substances 0.000 claims description 34
- 125000003729 nucleotide group Chemical group 0.000 claims description 33
- 230000000295 complement effect Effects 0.000 claims description 29
- 230000000694 effects Effects 0.000 claims description 24
- 108020004999 messenger RNA Proteins 0.000 claims description 24
- 102000053602 DNA Human genes 0.000 claims description 21
- 239000013612 plasmid Substances 0.000 claims description 21
- 108091079001 CRISPR RNA Proteins 0.000 claims description 20
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 19
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 18
- 238000000338 in vitro Methods 0.000 claims description 16
- 239000003153 chemical reaction reagent Substances 0.000 claims description 15
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 11
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 claims description 11
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 claims description 11
- 150000001413 amino acids Chemical class 0.000 claims description 11
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 claims description 10
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 claims description 10
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 10
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 9
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 claims description 9
- 229940113082 thymine Drugs 0.000 claims description 9
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 108020001507 fusion proteins Proteins 0.000 claims description 7
- 102000037865 fusion proteins Human genes 0.000 claims description 7
- 102000039446 nucleic acids Human genes 0.000 claims description 7
- 108020004707 nucleic acids Proteins 0.000 claims description 7
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 claims description 6
- 230000003197 catalytic effect Effects 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 3
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 claims description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 claims 1
- 125000000539 amino acid group Chemical group 0.000 claims 1
- 230000008030 elimination Effects 0.000 claims 1
- 238000003379 elimination reaction Methods 0.000 claims 1
- 238000012937 correction Methods 0.000 abstract description 12
- 238000003203 nucleic acid sequencing method Methods 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 45
- 210000004027 cell Anatomy 0.000 description 38
- 108020004511 Recombinant DNA Proteins 0.000 description 22
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 22
- 239000002299 complementary DNA Substances 0.000 description 18
- 230000035772 mutation Effects 0.000 description 16
- 101710163270 Nuclease Proteins 0.000 description 14
- 108091034117 Oligonucleotide Proteins 0.000 description 14
- 101150038500 cas9 gene Proteins 0.000 description 13
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 12
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 12
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 12
- 229940104302 cytosine Drugs 0.000 description 11
- 230000008685 targeting Effects 0.000 description 11
- 235000001014 amino acid Nutrition 0.000 description 10
- 229940024606 amino acid Drugs 0.000 description 10
- 238000003752 polymerase chain reaction Methods 0.000 description 10
- 238000012350 deep sequencing Methods 0.000 description 9
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 230000005782 double-strand break Effects 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 108010092854 aspartyllysine Proteins 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 230000007018 DNA scission Effects 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 description 4
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 4
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 description 4
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 description 3
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 3
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 241000589601 Francisella Species 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 101150063416 add gene Proteins 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 230000009437 off-target effect Effects 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000605902 Butyrivibrio Species 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- 241000223282 Candidatus Peregrinibacteria Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 241000186394 Eubacterium Species 0.000 description 2
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 description 2
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 description 2
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 description 2
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 2
- 101000755690 Homo sapiens Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- 241000605894 Porphyromonas Species 0.000 description 2
- 241000605861 Prevotella Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- 241000194022 Streptococcus sp. Species 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000033590 base-excision repair Effects 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 238000006481 deamination reaction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 150000004985 diamines Chemical class 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- FGRBYDKOBBBPOI-UHFFFAOYSA-N 10,10-dioxo-2-[4-(N-phenylanilino)phenyl]thioxanthen-9-one Chemical compound O=C1c2ccccc2S(=O)(=O)c2ccc(cc12)-c1ccc(cc1)N(c1ccccc1)c1ccccc1 FGRBYDKOBBBPOI-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 1
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241001453245 Campylobacter jejuni subsp. jejuni Species 0.000 description 1
- 241001502303 Candidatus Methanoplasma Species 0.000 description 1
- 241001040999 Candidatus Methanoplasma termitum Species 0.000 description 1
- 241001437378 Candidatus Paceibacter Species 0.000 description 1
- 241000243205 Candidatus Parcubacteria Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000511343 Chondrostoma nasus Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 1
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 description 1
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 description 1
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 1
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 description 1
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 1
- 102000010719 DNA-(Apurinic or Apyrimidinic Site) Lyase Human genes 0.000 description 1
- 108010063362 DNA-(Apurinic or Apyrimidinic Site) Lyase Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101900341982 Escherichia coli Uracil-DNA glycosylase Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- 101000742736 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3G Proteins 0.000 description 1
- 101000742769 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 1
- 101000940871 Homo sapiens Endonuclease Proteins 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- KWHFUMYCSPJCFQ-NGTWOADLSA-N Ile-Thr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N KWHFUMYCSPJCFQ-NGTWOADLSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241001134638 Lachnospira Species 0.000 description 1
- 241001148627 Leptospira inadai Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 1
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000542065 Moraxella bovoculi Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 101100377889 Mus musculus Apobec2 gene Proteins 0.000 description 1
- 101100489915 Mus musculus Apobec4 gene Proteins 0.000 description 1
- 101000940870 Mus musculus Endonuclease Proteins 0.000 description 1
- 101001128656 Mus musculus Endonuclease Proteins 0.000 description 1
- 101000755751 Mus musculus Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 101000672225 Mus musculus Uracil-DNA glycosylase Proteins 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 241000251745 Petromyzon marinus Species 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- 241000878522 Porphyromonas crevioricanis Species 0.000 description 1
- 241001135241 Porphyromonas macacae Species 0.000 description 1
- 241001135219 Prevotella disiens Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- COLJZWUVZIXSSS-CIUDSAMLSA-N Ser-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N COLJZWUVZIXSSS-CIUDSAMLSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FKZSXTKZLPPHQU-GQGQLFGLSA-N Ser-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N FKZSXTKZLPPHQU-GQGQLFGLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 1
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- WEFIPBYPXZYPHD-HJPIBITLSA-N Tyr-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WEFIPBYPXZYPHD-HJPIBITLSA-N 0.000 description 1
- YWXMGBUGMLJMIP-IHPCNDPISA-N Tyr-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC3=CC=C(C=C3)O)N YWXMGBUGMLJMIP-IHPCNDPISA-N 0.000 description 1
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- QHONGSVIVOFKAC-ULQDDVLXSA-N Tyr-Pro-His Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QHONGSVIVOFKAC-ULQDDVLXSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000032798 delamination Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000007849 hot-start PCR Methods 0.000 description 1
- 102000043482 human APOBEC2 Human genes 0.000 description 1
- 102000048415 human APOBEC3B Human genes 0.000 description 1
- 102000048419 human APOBEC3C Human genes 0.000 description 1
- 102000043429 human APOBEC3D Human genes 0.000 description 1
- 102000049338 human APOBEC3F Human genes 0.000 description 1
- 102000054962 human APOBEC3G Human genes 0.000 description 1
- 102000044839 human APOBEC3H Human genes 0.000 description 1
- 102000056680 human APOBEC4 Human genes 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- GUUBJKMBDULZTE-UHFFFAOYSA-M potassium;2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid;hydroxide Chemical compound [OH-].[K+].OCCN1CCN(CCS(O)(=O)=O)CC1 GUUBJKMBDULZTE-UHFFFAOYSA-M 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000036647 reaction Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000014393 valine Nutrition 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01G—HORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
- A01G13/00—Protecting plants
- A01G13/02—Protective coverings for plants; Coverings for the ground; Devices for laying-out or removing coverings
- A01G13/0206—Canopies, i.e. devices providing a roof above the plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01G—HORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
- A01G13/00—Protecting plants
- A01G13/02—Protective coverings for plants; Coverings for the ground; Devices for laying-out or removing coverings
- A01G13/025—Devices for laying-out or removing plant coverings
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2497—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/02—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
- C12Y302/02027—Uracil-DNA glycosylase (3.2.2.27)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16B—DEVICES FOR FASTENING OR SECURING CONSTRUCTIONAL ELEMENTS OR MACHINE PARTS TOGETHER, e.g. NAILS, BOLTS, CIRCLIPS, CLAMPS, CLIPS OR WEDGES; JOINTS OR JOINTING
- F16B2/00—Friction-grip releasable fastenings
- F16B2/20—Clips, i.e. with gripping action effected solely by the inherent resistance to deformation of the material of the fastening
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/11—Antisense
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/301—Endonuclease
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Mycology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Environmental Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mechanical Engineering (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
시티딘 디아미나제, 불활성화된 표적특이적 엔도뉴클레아제, 및 가이드 RNA를 포함하는, DNA 단일 가닥 절단 (single strand break)용 조성물, 이를 이용한 DNA 단일 가닥 절단 (single strand break) 생성 방법, 염기 교정 (base editing)이 도입된 DNA의 핵산 서열 분석 방법, 및 염기 교정 위치, on-target 부위에서의 염기 교정 효율, 비표적 위치 (off-target site), 및/또는 표적 특이성을 확인 (또는 측정 또는 검출)하는 방법이 제공된다.
Description
시티딘 디아미나제(deaminase), 불활성화된 표적특이적 엔도뉴클레아제, 및 가이드 RNA를 포함하는, DNA 단일 가닥 절단 (single strand break)용 조성물, 이를 이용한 DNA 단일 가닥 절단 (single strand break) 생성 방법, 염기 교정 (base editing)이 도입된 DNA의 핵산 서열 분석 방법, 및 염기 교정 위치, on-target 부위에서의 염기 교정 효율, 비표적 위치 (off-target site), 및/또는 표적 특이성을 확인 (또는 측정 또는 검출)하는 방법과 관련된 것이다.
DNA 결합 모듈과 시티딘 디아미나제(cytidine deaminase)를 포함하는 염기 교정기 (Base Editor; Programmable deaminase)는 DNA 이중 가닥 절단 (DNA double-strand breaks)을 생성하지 않고 유전체에서 표적화 된 뉴클레오티드 치환 또는 염기 교정을 가능하게 한다. 표적 부위에 작은 삽입 또는 결실 (indels)을 유도하는 CRISPR-Cas9 및 ZFN (zinc-finger nucleases)과 같은 programmable nucleases와 달리, programmable 디아미나제는 표적 부위에서 몇 개의 뉴클레오타이드 내에서 C를 T로 (또는 보다 적은 비율로 C를 G 또는 A로) 변환시킨다. 염기교정기는 인간의 세포, 동물 및 식물에 대한 유전 질환을 유발하는 점 돌연변이를 수정하거나 단일염기다형성 (single-nucleotide polymorphisms; SNP)을 생성 할 수 있다.
염기교정기는 다음의 4 종류가 보고되어 있다:
1) S. pyogenes에서 유래하는 촉매적으로 결핍된 Cas9 (catalytically-deficient Cas9; dCas9) 또는 D10A Cas9 니케이즈 (nCas9)와, 래트의 시티딘 디아미나아제인 rAPOBEC1를 포함하는 베이스 에디터 (Base Editors; BEs); 2) dCas9 또는 nCas9와, 바다칠성장어(sea lamprey)의 activation-induced cytidine deaminase (AID) ortholog인 PmCDA1 또는 인간 AID를 포함하는 Target-AID; 3) MS2-결합 단백질에 융합된 과활성화된 AID 변이체를 모집하기 위해 MS2 RNA 헤어핀에 연결된 sgRNAs와 dCas9를 포함하는 CRISPR-X; 및 4) 징크-핑거 단백질 또는 transcription activator-like effectors (TALEs)가 시티딘 디아미나제에 융합 된 것.
염기교정기에 의한 염기 교정(base editing)에 대한 광범위한 관심에도 불구하고, 염기교정기의 유전체 전체에 대한 표적 특이성을 분석할 수 있는 수단이 개발된 바가 없다. 따라서, 염기교정기의 유전체 전체에 대한 표적 특이성을 분석하여, 염기교정기의 염기 교정 효율, 비표적 사이트 (off-target site), 비표적 효과(off-target effect) 등을 분석할 수 있는 수단의 개발이 필요하다.
본 명세서에서는 염기교정기의 유전체 전체에 대한 표적 특이성을 분석할 수 있는 수단, 및 이를 통하여 염기교정기의 비표적 사이트, 비표적 효과 등을 분석할 수 있는 수단이 제공된다.
일 예는 (a) 디아미나제 또는 이의 암호화 유전자 (cDNA, rDNA, 또는 mRNA), (b) 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자(cDNA, rDNA, 또는 mRNA), 및 (c) 가이드 RNA 또는 이의 암호화 유전자를 포함하는, DNA 단일 가닥 절단 (single strand breaks)용 조성물을 제공한다. 상기 조성물은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 포함하지 않는 것일 수 있다.
다른 예는, (a) 디아미나제 또는 이의 암호화 유전자 (cDNA, rDNA, 또는 mRNA), 및 (b) 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자(cDNA, rDNA, 또는 mRNA), 및 (c) 가이드 RNA 또는 이의 암호화 유전자를 세포에 도입하거나 세포로부터 분리된 DNA에 접촉시키는 단계를 포함하는, DNA 단일 가닥 절단 (single strand break) 방법을 제공한다. 상기 방법은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 처리하는 단계를 포함하지 않는 것일 수 있다.
다른 예는,
(i) (a) 디아미나제 또는 이의 암호화 유전자 (cDNA, rDNA, 또는 mRNA), 및 (b) 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자(cDNA, rDNA, 또는 mRNA), 및 (c) 가이드 RNA 또는 이의 암호화 유전자를 세포에 도입하거나 세포로부터 분리된 DNA에 접촉시켜 DNA 단일 가닥 절단을 유도하는 단계; 및
(ii) 상기 단일 가닥 절단된 DNA 절편의 핵산 서열을 분석하는 단계
를 포함하는, 상기 디아미나제에 의하여 염기 교정 (base editing)이 도입된 DNA의 핵산 서열 분석 방법을 제공한다. 상기 방법은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 처리하는 단계를 포함하지 않는 것일 수 있다.
다른 예는,
(i) (a) 디아미나제 또는 이의 암호화 유전자 (cDNA, rDNA, 또는 mRNA), 및 (b) 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자(cDNA, rDNA, 또는 mRNA) 및 (c) 가이드 RNA 또는 이의 암호화 유전자를 세포에 도입하거나 세포로부터 분리된 DNA에 접촉시켜 DNA 단일 가닥 절단을 유도하는 단계;
(ii) 상기 절단된 DNA 절편의 핵산 서열을 분석하는 단계; 및
(iii) 상기 분석에 의여 수득된 핵산 서열 데이터로부터 단일 가닥 절단 위치를 확인하는 단계
를 포함하는, 디아미나제의 염기 교정 또는 단일가닥절단 위치, on-target 부위에서의 염기 교정 효율, 비표적 위치 (off-target site), 및/또는 표적 특이성을 확인 (또는 측정 또는 검출)하는 방법을 제공한다. 상기 방법은, 예컨대, 상기 단계 (ii) 이후 및 단계 (iii) 이전, 동시 또는 이후에, (iii-1) 상기 분석에 의여 수득된 핵산 서열 데이터(sequence read)에서 염기 교정 (예컨대, 시토신(C)의 우라실(U) 또는 티민 (T)으로의 변환) 여부를 확인하는 단계를 추가로 포함할 수 있다. 상기 방법은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 처리하여 DNA에 이중 가닥 절단을 생성하는 단계를 포함하지 않는 것일 수 있다. 일 예에서, 상기 방법 (예컨대, on-target 부위에서의 염기 교정 효율, 비표적 위치 (off-target site) 확인 방법)은, 상기 단계 (iii) 이후에, (iv) 상기 절단 위치가 표적 위치 (on-target site)가 아닌 경우, 비표적 위치 (off-target site)로 확인(판단)하는 단계를 추가로 포함할 수 있다.
본 명세서에서는 Digenome-seq를 수정하여 인간 유전체에서 Cas9 니케이즈(nickase)와 디아미나제 (deaminase)로 구성된 염기교정기 (예컨대, Base Editor 3; BE3)의 특이성을 평가하였다. 유전체 DNA를 BE3 및 가이드 RNA로 시험관내에서 처리하여 DNA 이중 가닥 중 단일 가닥에 절단이 생성되는 것을 확인하였다. 본 명세서에서 제공되는 디아미나제를 이용한 DNA 단일 가닥 절단 방법 및 이를 이용한 핵산 서열 분석 방법에 의하여, BE3 비표적 사이트를 전체 유전체 시퀀싱 데이터를 사용하여 계산적으로 확인할 수 있다.
우선, DNA에 이중 가닥 절단을 유발하지 않는 디아미나제를 이용하여 DNA에 이중 가닥 절단을 생성하는 기술이 제공된다.
일 예는 일 예는 (a) 디아미나제 또는 이의 암호화 유전자 (cDNA, rDNA, 또는 mRNA), (b) 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자(cDNA, rDNA, 또는 mRNA), 및 (c) 가이드 RNA 또는 이의 암호화 유전자를 포함하는, DNA 단일 가닥 절단 (single strand breaks)용 조성물을 제공한다. 상기 조성물은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 포함하지 않는 것일 수 있다.
본 명세서에 사용된 암호화 유전자는 cDNA, rDNA 또는 이를 포함하는 재조합 벡터, 또는 mRNA 형태로 사용될 수 있다.
상기 디아미나제는 시티딘 디아미나제일 수 있다. 시티딘 디아미나제는 뉴클레오타이드에 존재하는 염기인 시토신 (예컨대, 2중 가닥 DNA 또는 RNA에 존재하는 시토신)을 우라실 (또는 티민)로 변환 (C-to-U(or C-to-T) conversion or C-to-U(or C-to-T) editing)시키는 활성을 갖는 모든 효소를 의미하는 것으로, 표적 부위의 서열 (표적 서열)의 PAM 서열이 존재하는 가닥에 위치하는 시토신을 우라실로 변환시킨다. 일 예에서, 상기 시티딘 디아미나제는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등과 같은 포유류로부터 유래된 것일 수 있으나, 이에 제한되는 것은 아니다. 예컨대, 상기 시티딘 디아미나제는 APOBEC ("apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like") 패밀리에 속하는 효소들, AID (activation-induced cytidine deaminase), CDA (cytidine deaminase; 예컨대, CDA1) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으며, 예컨대, 다음으로 이루어진 군에서 1종 이상 선택될 수 있으나, 이에 제한되는 것은 아니다:
APOBEC1: 인간 (Homo sapiens) APOBEC1 (단백질: GenBank Accession Nos. NP_001291495.1, NP_001635.2, NP_005880.2 등; 유전자 (앞에 기재된 단백질 순서대로 이를 암호화 하는 유전자를 기재함): GenBank Accession Nos. NM_001304566.1, NM_001644.4, NM_005889.3 등), 마우스 (Mus musculus) APOBEC1 (단백질: GenBank Accession Nos. NP_001127863.1, NP_112436.1 등; 유전자 (앞에 기재된 단백질 순서대로 이를 암호화 하는 유전자를 기재함): GenBank Accession Nos. NM_001134391.1, NM_031159.3 등);
APOBEC2: 인간 APOBEC2 (단백질: GenBank Accession No. NP_006780.1 등; 유전자: GenBank Accession No. NM_006789.3 등), 마우스 APOBEC2 (단백질: GenBank Accession No. NP_033824.1 등; 유전자: GenBank Accession No. NM_009694.3 등);
APOBEC3B: 인간 APOBEC3B (단백질: GenBank Accession Nos. NP_001257340.1, NP_004891.4 등; 유전자 (mRNA or cDNA, 이하 동일) (앞에 기재된 단백질 순서대로 이를 암호화 하는 유전자를 기재함): GenBank Accession Nos. NM_001270411.1, NM_004900.4 등), 마우스 (Mus musculus) APOBEC3B (단백질: GenBank Accession Nos. NP_001153887.1, NP_001333970.1, NP_084531.1 등; 유전자 (앞에 기재된 단백질 순서대로 이를 암호화 하는 유전자를 기재함): GenBank Accession Nos. NM_001160415.1, NM_001347041.1, NM_030255.3 등);
APOBEC3C: 인간 APOBEC3C (단백질: GenBank Accession No. NP_055323.2 등; 유전자: GenBank Accession No. NM_014508.2 등);
APOBEC3D (including APOBEC3E): 인간 APOBEC3D (단백질: GenBank Accession No. NP_689639.2 등; 유전자: GenBank Accession No. NM_152426.3 등);
APOBEC3F: 인간 APOBEC3F (단백질: GenBank Accession Nos. NP_660341.2, NP_001006667.1 등; 유전자 (앞에 기재된 단백질 순서대로 이를 암호화 하는 유전자를 기재함): NM_145298.5, NM_001006666.1 등);
APOBEC3G: 인간 APOBEC3G (단백질: GenBank Accession Nos. NP_068594.1, NP_001336365.1, NP_001336366.1, NP_001336367.1 등; 유전자 (앞에 기재된 단백질 순서대로 이를 암호화 하는 유전자를 기재함): NM_021822.3, NM_001349436.1, NM_001349437.1, NM_001349438.1 등);
APOBEC3H: 인간 APOBEC3H (단백질: GenBank Accession Nos. NP_001159474.2, NP_001159475.2, NP_001159476.2, NP_861438.3 등; 유전자 (앞에 기재된 단백질 순서대로 이를 암호화 하는 유전자를 기재함): NM_001166002.2, NM_001166003.2, NM_001166004.2, NM_181773.4 등);
APOBEC4 (including APOBEC3E): 인간 APOBEC4 (단백질: GenBank Accession No. NP_982279.1 등; 유전자: GenBank Accession No. NM_203454.2 등); 마우스 APOBEC4 (단백질: GenBank Accession No. NP_001074666.1 등; 유전자: GenBank Accession No. NM_001081197.1 등);
Activation-induced cytidine deaminase (AICDA 또는 AID): 인간 AID (단백질: GenBank Accession Nos. NP_001317272.1, NP_065712.1 등; 유전자 (앞에 기재된 단백질 순서대로 이를 암호화 하는 유전자를 기재함): GenBank Accession Nos. NM_001330343.1, NM_020661.3 등); 마우스 AID (단백질: GenBank Accession No. NP_033775.1 등; 유전자: GenBank Accession No. NM_009645.2 등); 및
CDA (cytidine deaminase; EC number 3.5.4.5; 예컨대, CDA1): GenBank Accession Nos. NP_001776.1 (유전자: NM_001785.2), CAA06460.1 (유전자: AJ005261.1), NP_416648.1 (유전자: NC_000913.3) 등.
본 명세서에 사용된 바로서, 표적 특이적 뉴클레아제는, 유전자 가위 (programmable nuclease)라고도 불리며, 목적하는 유전체 DNA 상의 특정 위치를 인식하여 절단할 수 있는 모든 형태의 엔도뉴클레아제를 통칭한다.
예컨대, 상기 표적 특이적 뉴클레아제는 표적 유전자의 특정 서열을 인식하고 뉴클레오티드 절단 활성을 가져 표적 유전자에서 인델 (insertion and/or deletion, Indel)을 야기할 수 있는 모든 뉴클레아제에서 선택된 1종 이상일 수 있다.
예컨대, 상기 표적 특이적 뉴클레아제는 미생물 면역체계인 CRISPR에서 유래한 RGEN (RNA-guided engineered nuclease; 예컨대, Cas9, Cpf1, 등) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.
일 구체예에서, 상기 표적 특이적 뉴클레아제는 Cas 단백질 (예컨대, Cas9 단백질(CRISPR (Clustered regularly interspaced short palindromic repeats) associated protein 9)), Cpf1 단백질 (CRISPR from Prevotella and Francisella 1) 등과 같은 타입 Ⅱ 및/또는 타입 V의 CRISPR 시스템에 수반되는 엔도뉴클레아제로 이루어진 군에서 선택된 1종 이상일 수 있다. 이 경우, 상기 표적 특이적 뉴클레아제는 유전체 DNA의 표적 부위로 안내하기 위한 표적 DNA 특이적 가이드 RNA를 추가로 포함할 수 있다. 상기 가이드 RNA는 생체 외 (in vitro)에서 전사된(transcribed) 것일 수 있고, 예컨대 올리고뉴클레오티드 이중가닥 또는 플라스미드 주형으로부터 전사된 것일 수 있으나, 이에 제한되지 않는다. 상기 표적 특이적 뉴클레아제 및 가이드 RNA는 리보핵산 단백질 (RNP) 형태로 사용될 수 있으며, 상기 리보핵산 단백질은 표적 특이적 뉴클레아제 또는 이의 암호화 유전자 및 RNA 또는 이의 암호화 유전자가 혼합물 또는 서로 결합된 복합체 형태로 포함된 것일 수 있다.
Cas9 단백질은 CRISPR/Cas 시스템의 주요 단백질 구성 요소로, 활성화된 엔도뉴클레아제 또는 nickase 기능을 할 수 있는 단백질이다.
Cas9 단백질 또는 유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다. 예컨대, 상기 Cas9 단백질은
스트렙토코커스 sp. (Streptococcus sp.), 예컨대, 스트렙토코커스 피요젠스 (Streptococcus pyogenes) 유래의 Cas9 단백질 (예컨대, SwissProt Accession number Q99ZW2(NP_269215.1) (암호화 유전자: 서열번호 4);
캄필로박터 속, 예컨대, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질;
스트렙토코커스 속, 예컨대, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 또는 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질;
네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 Cas9 단백질;
파스테우렐라 (Pasteurella) 속, 예컨대, 파스테우렐라 물토시다 (Pasteurella multocida) 유래의 Cas9 단백질;
프란시셀라 (Francisella) 속, 예컨대, 프란시셀라 노비시다 (Francisella novicida) 유래의 예컨대 Cas9 단백질
등으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.
Cpf1 단백질은 상기 CRISPR/Cas 시스템과는 구별되는 새로운 CRISPR 시스템의 엔도뉴클레아제로서, Cas9에 비해 상대적으로 크기가 작고 tracrRNA가 필요 없으며, 단일 가이드 RNA에 의해 작용할 수 있다. 또한, 티민 (thymine)이 풍부한 PAM (protospacer-adjacent motif) 서열을 인식하고 DNA의 이중 사슬을 잘라 점착종단 (cohesive end; cohesive double-strand break)을 생성한다.
예컨대, 상기 Cpf1 단백질은 캔디다투스 (Candidatus) 속, 라치노스피라 (Lachnospira) 속, 뷰티리비브리오 (Butyrivibrio) 속, 페레그리니박테리아 (Peregrinibacteria), 액시도미노코쿠스 (Acidominococcus) 속, 포르파이로모나스 (Porphyromonas) 속, 프레보텔라 (Prevotella) 속, 프란시셀라 (Francisella) 속, 캔디다투스 메타노플라스마 (Candidatus Methanoplasma), 또는 유박테리움 (Eubacterium) 속 유래의 것일 수 있고, 예컨대, Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasiicus, Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium (ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi (237), Smiihella sp. (SC_KO8D17), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, Candidatus Paceibacter , Eubacterium eligens 등의 미생물 유래의 것일 수 있으나, 이에 제한되는 것은 아니다 .
상기 표적 특이적 엔도뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것(non-naturally occurring)일 수 있다. 일 예에서, 상기 표적 특이적 엔도뉴클레아제 (예컨대, Cas9, Cpf1, 등)은 재조합 DNA에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN(Recombinant DNA; rDNA)는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대, 재조합 DNA를 적절한 유기체에서 발현시켜 표적 특이적 엔도뉴클레아제를 생산 (in vivo 또는 in vitro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 암호화 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 뉴클레오타이드 서열을 갖는 것일 수 있다.
상기 불활성화된 표적특이적 엔도뉴클레아제불활성화된 표적특이적 엔도뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실한 표적특이적 엔도뉴클레아제을 의미하는 것으로, 예컨대, 엔도뉴클레아제 활성을 상실하고 니케이즈 활성을 갖는 불활성화된 표적특이적 엔도뉴클레아제 및 엔도뉴클레아제 활성과 니케이즈 활성을 모두 상실한 불활성화된 표적특이적 엔도뉴클레아제 중에서 선택된 1종 이상일 수 있다. 일 예에서, 상기 불활성화된 표적특이적 엔도뉴클레아제가 니케이즈 활성을 갖는 것일 수 있으며, 이 경우 상기 시토신이 우라실로 변환되는 것과 동시 또는 순서와 무관하게 순차적으로, 시토신이 우라실로 변환된 가닥 또는 그 반대 가닥 (예컨대 반대 가닥)에서 nick이 도입된다 (예컨대, PAM 서열이 존재하는 가닥의 반대 가닥에 PAM 서열의 5' 말단 방향으로 3번째 뉴클레오타이드와 4번째 뉴클레오타이드 사이에 해당하는 위치에 nick이 도입됨). 이와 같은 표적특이적 엔도뉴클레아제의 변형(돌연변이)는 적어도 촉매 활성을 갖는 아스파르트산 잔기 (catalytic aspartate residue; 예컨대, 스트렙토코커스 피요젠스 유래 Cas9 단백질의 경우 10번째 위치의 아스파르트산 (D10), 762번째 위치의 글루탐산 (E762), 840번째 위치의 히스티딘 (H840), 854번째 위치의 아스파라긴 (N854), 863번째 위치의 아스파라긴 (N863), 986번째 위치의 아스파르트산 (D986) 등으로 이루어진 군에서 선택된 하나 이상)가 임의의 다른 아미노산으로 치환된 Cas9의 돌연변이를 포함하는 것일 수 있으며, 상기 다른 아미노산은 알라닌 (alanine)일 수 있지만, 이에 제한되지 않는다.
본 명세서에 사용된 바로서, 상기 '다른 아미노산'은, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 발린, 아스파라긴산, 시스테인, 글루타민, 글리신, 세린, 트레오닌, 티로신, 아스파르트산, 글루탐산, 아르기닌, 히스티딘, 라이신, 상기 아미노산들의 공지된 모든 변형체 중에서, 야생형 단백질이 원래 변이 위치에 갖는 아미노산을 제외한 아미노산들 중에서 선택된 아미노산을 의미한다.
일 예에서, 상기 불활성화된 표적특이적 엔도뉴클레아제가 변형 Cas9 단백질인 경우, 변형 Cas9 단백질은 스트렙토코커스 피요젠스 (Streptococcus pyogenes) 유래의 Cas9 단백질(예컨대, SwissProt Accession number Q99ZW2(NP_269215.1))에 D10 또는 H840 위치에서의 돌연변이 (예컨대, 다른 아미노산으로의 치환) 가 도입되어 엔도뉴클레아제 활성이 상실되고 니케이즈 활성을 갖는 변형 Cas9, 스트렙토코커스 피요젠스 (Streptococcus pyogenes) 유래의 Cas9 단백질에 D10 및 H840 위치 모두에 돌연변이(예컨대, 다른 아미노산으로의 치환)가 도입되어 엔도뉴클레아제 활성 및 니케이즈 활성을 모두 상실한 변형 Cas9 단백질 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 예컨대, 상기 CAs9 단백질의 D10 위치에서의 돌연변이는 D10A 돌연변이 (Cas9 단백질의 아미노산 중 10번째 아미노산인 D가 A로 치환된 돌연변이를 의미함; 이하, Cas9에 도입된 돌연변이는 동일한 방법으로 표기됨)일 수 있고, 상기 H840 위치에서의 돌연변이는 H840A 돌연변이일 수 있다. 일 구체예에서, 상기 불활성화된 표적특이적 엔도뉴클레아제는 스트렙토코커스 피요젠스 (Streptococcus pyogenes) 유래의 Cas9 단백질 (서열번호 4)의 D10가 A로 치환된 D10A 돌연변이를 갖는 니케이즈 (예컨대, 서열번호 11에 의하여 코딩됨)일 수 있다.
상기 시티딘 디아미나제와 불활성화된 표적특이적 엔도뉴클레아제는 직접 또는 펩타이드 링커를 통하여 서로 융합된 융합 단백질 (예컨대, N-말단에서 C-말단 방향으로 시티딘 디아미나제-불활성화된 표적특이적 엔도뉴클레아제 순서로 위치하거나 (즉, 시티딘 디아미나제의 C-말단에 불활성화된 표적특이적 엔도뉴클레아제가 융합됨), 불활성화된 표적특이적 엔도뉴클레아제-시티딘 디아미나제 순서로 위치(즉, 불활성화된 표적특이적 엔도뉴클레아제의 C-말단에 시티딘 디아미나제가 융합됨)할 수 있음) 형태로 사용(또는 상기 조성물에 포함)되거나 되거나, 정제된 시티딘 디아미나제 또는 이를 암호화하는 mRNA와 불활성화된 표적특이적 엔도뉴클레아제 또는 이를 암호화하는 mRNA의 혼합물 형태로 사용(또는 상기 조성물에 포함)되거나, 시티딘 디아미나제 암호화 유전자와 불활성화된 표적특이적 엔도뉴클레아제 암호화 유전자가 모두 포함 (예컨대, 상기 두 유전자는 앞서 설명한 융합 단백질을 암호화하도록 포함됨)된 하나의 플라스미드 형태로 사용(또는 상기 조성물에 포함)되거나, 시티딘 디아미나제 암호화 유전자와 불활성화된 표적특이적 엔도뉴클레아제 암호화 유전자가 각각 별개의 플라스미드에 포함된 시티딘 디아미나제 발현 플라스미드와 불활성화된 표적특이적 엔도뉴클레아제 발현 플라스미드의 혼합물 형태로 사용(또는 상기 조성물에 포함)될 수 있다. 일 구체예에서는 N-말단에서 C-말단 방향으로, 시티딘 디아미나제-불활성화된 표적특이적 엔도뉴클레아제 순서로 위치하는 융합 단백질, 또는 불활성화된 표적특이적 엔도뉴클레아제-시티딘 디아미나제 순서로 위치하는 융합 단백질, 또는 상기 융합 단백질을 암호화하도록 시티딘 디아미나제 암호화 유전자와 불활성화된 표적특이적 엔도뉴클레아제 암호화 유전자가 하나의 플라스미드에 포함된 형태로 사용될 수 있다.
상기 플라스미드는 상기 시티딘 디아미나제 암호화 유전자 및/또는 불활성화된 표적특이적 엔도뉴클레아제 암호화 유전자를 삽입하고 이를 숙주세포 내에서 발현시킬 수 있는 발현 시스템을 포함하는 모든 플라스미드일 수 있다. 상기 플라스미드는 목적 유전자 발현을 위한 요소 (elements)를 포함하는 것으로, 복제원점 (replication origin), 프로모터, 작동 유전자 (operator), 전사 종결 서열 (terminator) 등을 포함할 수 있고, 숙주 세포의 게놈 내로의 도입을 위한 적절한 효소 부위 (예컨대, 제한 효소 부위) 및/또는 임의로 숙주 세포 내로의 성공적인 도입을 확인하기 위한 선별 마커 및/또는 단백질로의 번역을 위한 리보좀 결합 부위 (ribosome binding site; RBS) 및/또는 전자 조절 인자 등을 추가로 포함할 수 있다. 상기 플라스미드는 당업계에서 사용되는 플라스미드, 예컨대, pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, pUC19 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다. 상기 숙주세포는 상기 시티딘 디아미나제에 의하여 염기 교정 또는 이중 가닥 절단을 도입하고자 하는 세포 (예컨대, 인간 세포 등과 같은 포유류 세포를 포함하는 진핵 세포) 또는 상기 시티딘 디아미나제 암호화 유전자 및/또는 불활성화된 표적특이적 엔도뉴클레아제 암호화 유전자를 발현하여 시티딘 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제를 발현할 수 있는 모든 세포 (예컨대, E. coli 등) 들 중에서 선택될 수 있다.
상기 가이드 RNA는 상기 시티딘 디아미나제와 불활성화된 표적특이적 엔도뉴클레아제의 혼합물 또는 융합 단백질을 표적 부위로 안내하는 역할을 하는 것으로, CRISPR RNA (crRNA), trans-activating crRNA (tracrRNA), 및 단일 가이드 RNA (single guide RNA; sgRNA)로 이루어진 군에서 선택된 1종 이상일 수 있으며, 구체적으로 crRNA와 tracrRNA가 서로 결합된 이중 가닥 crRNA:tracrRNA 복합체, 또는 crRNA 또는 그 일부와 tracrRNA 또는 그 일부가 올리고뉴클레오타이드 링커로 연결된 단일 가닥 가이드 RNA (sgRNA)일 수 있다.
상기 가이드 RNA의 구체적 서열은 사용된 표적특이적 엔도뉴클레아제 의 종류 또는 그 유래 미생물 등에 따라서 적절히 선택할 수 있으며, 이는 이 발명이 속하는 기술 분야의 통상의 지식을 가진 자가 용이하게 알 수 있는 사항이다.
표적특이적 엔도뉴클레아제로서 Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, crRNA는 다음의 일반식 1로 표현될 수 있다:
5'-(Ncas9)l-(GUUUUAGAGCUA)-(Xcas9)m-3' (일반식 1)
상기 일반식 1에서,
Ncas9는 표적화 서열, 즉 표적 유전자(target gene)의 표적 부위(target site)의 서열에 따라서 결정되는 부위 (즉, 표적 부위의 서열과 혼성화 가능한 서열임)이며, l은 상기 표적화 서열에 포함된 뉴클레오타이드 수를 나타내는 것으로 17 내지 23 또는 18 내지 22의 정수, 예컨대 20일 수 있고;
상기 표적 서열의 3' 방향으로 인접하여 위치하는 연속하는 12개의 뉴클레오타이드(GUUUUAGAGCUA; 서열번호 1)를 포함하는 부위는 crRNA의 필수적 부분이고,
Xcas9는 crRNA의 3' 말단쪽에 위치하는 (즉, 상기 crRNA의 필수적 부분의 3' 방향으로 인접하여 위치하는) m개의 뉴클레오타이드를 포함하는 부위로, m은 8 내지 12의 정수, 예컨대 11일 수 있으며, 상기 m개의 뉴클레오타이드들은 서로 같거나 다를 수 있으며, 각각 독립적으로 A, U, C 및 G로 이루어진 군에서 선택될 수 있다.
일 예에서, 상기 Xcas9는 UGCUGUUUUG(서열번호 2)를 포함할 수 있으나 이에 제한되지 않는다.
또한, 상기 tracrRNA는 다음의 일반식 2로 표현될 수 있다:
5'-(Ycas9)p-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)-3' (일반식 2)
상기 일반식 2에서,
60개의 뉴클레오타이드 (UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC; 서열번호 3)로 표시된 부위는 tracrRNA의 필수적 부분이고,
Ycas9는 상기 tracrRNA의 필수적 부분의 5' 말단에 인접하여 위치하는 p개의 뉴클레오타이드를 포함하는 부위로, p는 6 내지 20의 정수, 예컨대 8 내지 19의 정수일 수 있으며, 상기 p개의 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.
또한, sgRNA는 상기 crRNA의 표적화 서열과 필수적 부위를 포함하는 crRNA 부분과 상기 tracrRNA의 필수적 부분 (60개 뉴클레오타이드)를 포함하는 tracrRNA 부분이 올리고뉴클레오타이드 링커를 통하여 헤어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때, 올리고뉴클레오타이드 링커가 루프 구조에 해당함). 보다 구체적으로, 상기 sgRNA는 crRNA의 표적화 서열과 필수적 부분을 포함하는 crRNA 부분과 tracrRNA의 필수적 부분을 포함하는 tracrRNA 부분이 서로 결합된 이중 가닥 RNA 분자에서, crRNA 부위의 3' 말단과 tracrRNA 부위의 5' 말단이 올리고뉴클레오타이드 링커를 통하여 연결된 헤어핀 구조를 갖는 것일 수 있다.
일 예에서, sgRNA는 다음의 일반식 3으로 표현될 수 있다:
5'-(Ncas9)l-(GUUUUAGAGCUA)-(올리고뉴클레오타이드 링커)-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)-3' (일반식 3)
상기 일반식 3에서, (Ncas9)l는 표적화 서열로서 앞서 일반식 1에서 설명한 바와 같다.
상기 sgRNA에 포함되는 올리고뉴클레오타이드 링커는 3 내지 5개, 예컨대 4개의 뉴클레오타이드를 포함하는 것일 수 있으며, 상기 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.
상기 crRNA 또는 sgRNA는 5' 말단 (즉, crRNA의 타겟팅 서열 부위의 5' 말단)에 1 내지 3개의 구아닌(G)을 추가로 포함할 수 있다.
상기 tracrRNA 또는 sgRNA는 tracrRNA의 필수적 부분(60nt)의 3' 말단에 5개 내지 7개의 우라실 (U)을 포함하는 종결부위를 추가로 포함할 수 있다.
상기 가이드 RNA의 표적 서열은 표적 DNA 상의 PAM (Protospacer Adjacent Motif 서열(S. pyogenes Cas9의 경우, 5'-NGG-3' (N은 A, T, G, 또는 C임))의 5'에 인접하여 위치하는 약 17개 내지 약 23개 또는 약 18개 내지 약22개, 예컨대 20개의 연속하는 핵산 서열일 수 있다.
상기 가이드 RNA의 표적 서열과 혼성화 가능한 가이드 RNA의 표적화 서열은 상기 표적 서열이 위치하는 DNA 가닥 (즉, PAM 서열(5'-NGG-3' (N은 A, T, G, 또는 C임)이 위치하는 DNA 가닥)의 상보적인 가닥의 뉴클레오타이드 서열과 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 뉴클레오타이드 서열을 의미하는 것으로, 상기 상보적 가닥의 뉴클레오타이드 서열과 상보적 결합이 가능하다.
본 명세서에서, 표적 부위의 핵산 서열은 표적 유전자의 해당 유전자 부위의 두 개의 DNA 가닥 중 PAM 서열이 위치하는 가닥의 핵산 서열로 표시된다. 이 때, 실제로 가이드 RNA가 결합하는 DNA 가닥은 PAM 서열이 위치하는 가닥의 상보적 가닥이므로, 상기 가이드 RNA에 포함된 표적화 서열은, RNA 특성상 T를 U로 변경하는 것을 제외하고, 표적 부위의 서열과 동일한 핵산 서열을 갖게 된다. 따라서, 본 명세서에서, 가이드 RNA의 표적화 서열과 표적 부위의 서열 (또는 절단 부위의 서열)은 T와 U가 상호 변경되는 것을 제외하고 동일한 핵산 서열로 표시된다.
상기 가이드 RNA는 RNA 형태로 사용 (또는 상기 조성물에 포함)되거나, 이를 암호화하는 DNA를 포함하는 플라스미드 형태로 사용 (또는 상기 조성물에 포함)될 수 있다.
본 명세서에 기재된 조성물 및 방법은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 포함 또는 사용하지 않는 것을 특징으로 하는 것일 수 있다. 상기 우라실-특이적 제거 시약은 상기 시티딘 디아미나제에 의하여 시토신로부터 변환된 우라실을 제거하고, 및/또는 상기 우라실이 제거된 위치에 DNA 절단을 도입하는 역할을 하는 모든 물질을 포함할 수 있다.
일 예에서, 상기 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)은 우라실 DNA 글라이코실라제 (Uracil DNA glycosylase; UDG), 엔도뉴클레아제 VIII, 및 이들의 조합을 포함한다. 일 예에서, 상기 우라실-특이적 제거 시약은 엔도뉴클레아제 VIII 또는 우라실 DNA 글라이코실라제와 엔도뉴클레아제 VIII의 조합을 포함하는 것일 수 있다.
우라실 DNA 글라이코실라제 (Uracil DNA glycosylase; UDG)는 DNA에 존재하는 우라실 (U)을 제거하여 DNA의 mutagenesis를 방지하는 작용을 하는 효소로서, 우라실의 N-glycosylic bond을 절단함으로써 base-excision repair (BER) pathway를 개시하도록 하는 역할을 하는 모든 효소들 중에서 1종 이상 선택될 수 있다. 예컨대, 상기 우라실 DNA 글라이코실라제는 Escherichia coli 우라실 DNA 글라이코실라제 (예컨대, GenBank Accession Nos. ADX49788.1, ACT28166.1, EFN36865.1, BAA10923.1, ACA76764.1, ACX38762.1, EFU59768.1, EFU53885.1, EFJ57281.1, EFU47398.1, EFK71412.1, EFJ92376.1, EFJ79936.1, EFO59084.1, EFK47562.1, KXH01728.1, ESE25979.1, ESD99489.1, ESD73882.1, ESD69341.1 등), 인간 우라실 DNA 글라이코실라제 (예컨대, GenBank Accession Nos. NP_003353.1, NP_550433.1 등), 마우스 우라실 DNA 글라이코실라제 (예컨대, GenBank Accession Nos. NP_001035781.1, NP_035807.2 등) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.
상기 엔도뉴클레아제 VIII는 상기 우라실이 제거된 뉴클레오타이드를 제거하는 역할을 하는 것으로, 상기 우라실 DNA 글라이코실라제에 의하여 손상된 우라실을 이중 가닥 DNA로부터 제거하는 N-glycosylase 활성과 상기 손상된 우라실 제거로부터 발생한 apurinic site (AP site)의 3' 및 5' 말단을 절단하는 AP-lyase 활성을 모두 갖는 모든 효소들 중에서 1종 이상 선택될 수 있다. 예컨대, 상기 엔도뉴클레아제 VIII는 인간 엔도뉴클레아제 VIII (예컨대, GenBank Accession Nos. BAC06476.1, NP_001339449.1, NP_001243481.1, NP_078884.2, NP_001339448.1 등), 마우스 엔도뉴클레아제 VIII (예컨대, GenBank Accession Nos. BAC06477.1, NP_082623.1 등), Escherichia coli 엔도뉴클레아제 VIII (예컨대, GenBank Accession Nos. OBZ49008.1, OBZ43214.1, OBZ42025.1, ANJ41661.1, KYL40995.1, KMV55034.1, KMV53379.1, KMV50038.1, KMV40847.1, AQW72152.1 등) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.
다른 예는, (a) 디아미나제 또는 이의 암호화 유전자 (cDNA, rDNA, 또는 mRNA), (b) 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자(cDNA, rDNA, 또는 mRNA), 및 (c) 가이드 RNA 또는 이의 암호화 유전자를,
세포에 도입하거나 세포로부터 분리된 DNA에 접촉시키는 단계
를 포함하는, DNA에 단일 가닥 절단 (double strand break)를 생성하는 방법을 제공한다. 상기 방법은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 처리하는 단계를 포함하지 않는 것일 수 있다.
이와 같이 DNA에 단일 가닥 절단을 생성 (또는 도입)함으로써, 유전체 DNA 또는 DNA의 표적 부위에서 시티딘 디아미나제에 의하여 염기 교정(base editing, 즉 C에서 U로의 변환)이 일어난 위치 또는 상기 단일 가닥 절단이 생성 (도입)된 위치, 염기 교정 효율 등을 분석할 수 있으며, 이를 통하여, on-target 부위에서의 염기 교정 효율, on-target 서열에 대한 특이성, off-target 서열 등을 확인 (또는 측정)할 수 있다.
다른 예는,
(i) (a) 디아미나제 또는 이의 암호화 유전자 (cDNA, rDNA, 또는 mRNA), (b) 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자(cDNA, rDNA, 또는 mRNA), 및 (c) 가이드 RNA 또는 이의 암호화 유전자를 세포에 도입하거나 세포로부터 분리된 DNA에 접촉시켜 DNA 단일 가닥 절단을 유도하는 단계; 및
(ii) 상기 단일 가닥 절단된 DNA 절편의 핵산 서열을 분석하는 단계
를 포함하는, 디아미나제에 의하여 염기 교정(base editing)이 도입된 DNA의 핵산 서열 분석 방법을 제공한다. 상기 방법은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 처리하여 DNA에 이중 가닥 절단을 생성하는 단계를 포함하지 않는 것일 수 있다.
다른 예는,
(i) (a) 디아미나제 또는 이의 암호화 유전자 (cDNA, rDNA, 또는 mRNA), 및 (b) 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자(cDNA, rDNA, 또는 mRNA) 및 (c) 가이드 RNA 또는 이의 암호화 유전자를 세포에 도입하거나 세포로부터 분리된 DNA에 접촉시켜 DNA 단일 가닥 절단을 유도하는 단계;
(ii) 상기 절단된 DNA 절편의 핵산 서열을 분석하는 단계; 및
(iii) 상기 분석에 의여 수득된 핵산 서열 데이터로부터 단일 가닥 절단 위치를 확인하는 단계
를 포함하는, 디아미나제의 염기 교정 위치, 단일 가닥 절단 위치, on-target 부위에서의 염기 교정 효율, 비표적 위치 (off-target site), 및/또는 표적 특이성을 확인 (또는 측정 또는 검출)하는 방법을 제공한다. 상기 방법은, 예컨대, 상기 단계 (ii) 이후 및 단계 (iii) 이전, 동시 또는 이후에, (iii-1) 상기 분석에 의여 수득된 핵산 서열 데이터(sequence read)에서 염기 교정 (예컨대, 시토신(C)의 우라실(U) 또는 티민 (T)으로의 변환) 여부를 확인하는 단계를 추가로 포함할 수 있다. 상기 방법은 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)을 처리하여 DNA에 이중 가닥 절단을 생성하는 단계를 포함하지 않는 것일 수 있다.
일 예에서, 상기 방법 (예컨대, on-target 부위에서의 염기 교정 효율, 비표적 위치 (off-target site) 확인 방법)은, 상기 단계 (iii) 이후에, (iv) 상기 절단 위치가 표적 위치 (on-target site)가 아닌 경우, 비표적 위치 (off-target site)로 확인(판단)하는 단계를 추가로 포함할 수 있다.
상기 디아미나제, 불활성화된 표적특이적 엔도뉴클레아제, 가이드 RNA 및 우라실-특이적 제거 시약은 앞서 설명한 바와 같다.
본 명세서에서 제공된 방법들은 세포 내 또는 시험관 내 (in vitro)에서 수행되는 것일 수 있으며, 예컨대, 시험관 내에서 수행되는 것일 수 있다. 보다 구체적으로, 상기 방법의 모든 단계가 시험관 내 (in vitro)에서 수행되거나, 상기 단계 (i)은 세포 내에서 수행되고, 상기 단계 (ii) 이후 단계는 상기 단계 (i)이 수행된 세포에서 추출된 DNA (예컨대, 유전체 DNA)를 사용하여 시험관 내 (in vitro)에서 수행되는 것일 수 있다.
상기 단계 (i)은 디아미나제 (또는 이의 암호화 유전자) 및 불활성화된 표적특이적 엔도뉴클레아제 (또는 이의 암호화 유전자)와 가이드 RNA를 세포에 형질감염시키거나, 또는 상기 세포로부터 추출된 DNA에 접촉 (예컨대, 함께 배양)시켜, 가이드 RNA에 의하여 표적화되는 표적 부위 내에서 염기 교정 (염기 변환, 예컨대, 시토신에서 우라실로의 변환) 및 DNA 단일 가닥에 nick 발생을 유도하는 단계이다. 상기 세포는 디아미나제에 의한 염기 교정 및/또는 단일 가닥 절단을 도입하고자 하는 모든 진핵 세포들 중에서 선택된 것일 수 있으며, 예컨대, 인간 세포를 포함하는 포유 동물 세포들 중에서 선택될 수 있다.
상기 형질감염은
(1) 디아미나제, 불활성화된 표적특이적 엔도뉴클레아제, 및 가이드 RNA의 혼합물 또는 이들이 결합된 복합체 (리보핵산단백질; RNP),
(2) 디아미나제 암호화 mRNA, 불활성화된 표적특이적 엔도뉴클레아제 암호화 mRNA, 및 가이드 RNA의 혼합물, 또는
(3) 디아미나제 암호화 유전자 및 표적특이적 엔도뉴클레아제 암호화 유전자를 각각 또는 함께 포함하는 플라스미드 (재조합 벡터), 및 가이드 RNA 또는 가이드 RNA 암호화 유전자를 포함하는 플라스미드
를 통상적인 모든 수단에 의하여 세포에 도입시킴으로써 수행될 수 있으며, 예컨대, 상기 도입은 전기천공 (electroporation), 리포펙션, 미세주입 등에 의하여 수행될 수 있으나 이에 제한되는 것은 아니다.
일 구체예에서, 상기 단계 (i)은 상기 세포 (디아미나제 및 불활성화된 엔도뉴클레아제에 의한 염기 교정 (염기 교정 위치, 염기 교정 효율 등) 및/또는 단일 가닥 절단 (절단 위치, 절단 효율 등)을 확인하고자 하는 세포)로부터 추출된 DNA를 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제 (예컨대, 시티딘 디아미나제 및 불활성화된 Cas9 단백질을 포함하는 융합 단백질) 및 가이드 RNA와 함께 배양함으로써 수행될 수 있다 (in vitro). 상기 세포로부터 추출된 DNA는 유전체 DNA (genome DNA) 또는 표적 유전자 또는 표적 부위를 포함하는 PCR (polymerase chain reaction) 증폭 산물일 수 있다.
임의로, 상기 단계 (i) 수행 (또는 완료) 후 단계 (ii) 수행 전에, (a) 단계 (i)에서 사용된 디아미나제, 불활성화된 표적특이적 엔도뉴클레아제, 및/또는 가이드 RNA를 제거하는 단계를 추가로 포함할 수 있다. 또한, 상기 단계 (i) 수행 (또는 완료) 후 단계 (ii) 수행 전에, 단일가닥 절단이 일어난 이중가닥 DNA 절편의 말단 평활화 (또는 말단 수선; end repair) 단계를 추가로 포함할 수 있으며, 상기 말단 평활화 단계는 (b) 단일가닥 절단이 일어난 이중가닥 DNA 절편에서, 절단이 일어나지 않은 가닥의 3'쪽 (절단된 가닥의 절단 지점의 5' 말단쪽과 상보적 위치)의 연장된 뉴클레오타이드를 제거(절단)하는 3'-to-5' 절단 (3'-to-5' trimming) 단계, 및/또는 (c) 단일가닥 절단이 일어난 이중가닥 DNA 절편에서, 절단이 일어난 가닥의 절단 지점에서의 3' 말단의 뉴클레오타이드를 연장시키는 5'-to-3' DNA 합성 단계를 추가로 포함할 수 있다 (실시예 1의 그림 참조). 상기 3'-to-5' 절단 단계는 적절한 통상의 엑소뉴클레아제를 사용하여 수행할 수 있다. 상기 5'-to-3' DNA 합성 단계는 적절한 통상의 DNA 폴리머라제를 사용하여 수행할 수 있다.
또한, 임의로, 상기 단계 (i) 수행 (또는 완료) 후 단계 (ii) 수행 전에, 단계 (ii)의 DNA 절편의 핵산 서열 분석을 보다 용이하게 하기 위하여, 단일가닥 절단된 DNA 절편 (DNA 이중 가닥 중, 절단된 가닥의 절단 위치(cleavage site)를 포함하는 연속하는 10 내지 30nt 또는 15 내지 25nt의 올리고뉴클레오타이드 및/또는 절단되지 않은 가닥의 절단 위치와 대응되는(상보적인) 위치를 포함하는 연속하는 10 내지 30nt 또는 15 내지 25nt의 올리고뉴클레오타이드)를 증폭시키는 과정을 추가로 포함할 수 있다. 상기 단계 (ii)에서 핵산 서열 분석에 사용되는 단일 가닥 절단된 DNA 절편은, 단일가닥 절단이 일어난 가닥의 절단 위치를 포함하는 연속하는 10 내지 30nt 또는 15 내지 25nt의 올리고뉴클레오타이드 및/또는 절단되지 않은 가닥의 절단 위치와 대응되는(상보적인) 위치를 포함하는 연속하는 10 내지 30nt 또는 15 내지 25nt의 올리고뉴클레오타이드; 및/또는 상기 올리고뉴클레오타이드의 증폭산물을 포함할 수 있다.
상기 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제는 가이드 RNA와 함께 사용되어 서열 특이성 (specificity)을 가지므로 대부분 표적 위치(on-target)에 작용하지만, 표적 서열 이외의 부위에 표적 서열과 유사한 서열이 어느 정도 존재하는지에 따라 비표적 위치 (off-target site)에 작용하는 부작용이 발생할 수도 있다. 본 명세서에서, 비표적 위치 (off-target site)라 함은 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제의 표적 부위는 아니지만 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제가 활성을 가지는 위치를 말한다. 즉, 표적 위치 이외의, 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제에 의해 염기 교정 및/또는 절단되는 위치를 말한다. 일 예에서, 상기 비표적 위치는 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제에 대한 실제 비표적 위치뿐만 아니라 비표적 위치가 될 가능성이 있는 잠재적인 비표적 위치까지 포함하는 개념으로 사용될 수 있다. 상기 비표적 위치는 이에 제한되는 것은 아니나, 시험관 내 (in vitro)에서 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제에 의해 절단되는 표적 위치 이외의 모든 위치를 의미할 수 있다.
디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제가 표적 위치 이외의 위치에서도 활성을 가지는 것은 다양한 원인에 의해 야기될 수 있다. 예컨대, 표적 부위에 대하여 설계된 표적 서열과 뉴클레오타이드 불일치 (mismatch) 수준이 낮아서, 표적 서열과 서열 상동성이 높은 표적 서열 이외의 서열 (비표적 서열)의 경우 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제가 작동할 가능성이 있다.
상기 비표적 위치는 이에 제한되는 것은 아니나, 다음의 조건 중 하나 이상을 만족하는 서열 부위 (유전자 부위)일 수 있다:
5' 말단이 수직정렬 되는 DNA 리드의 수가 2 이상, 예컨대, 3 이상, 4 이상, 5 이상, 6 이상, 7 이상, 8 이상, 9 이상, 또는 10 이상;
이중가닥 DNA 절편 중 절단이 일어난 가닥과 상보적 가닥이 PAM 서열을 포함;
이중가닥 DNA 절편 중 절단이 일어난 가닥과 상보적 가닥이 표적 위치의 서열(표적 서열)과 15개 이하 또는 10개 이하, 예컨대, 1개 내지 15개, 1개 내지 14개, 1개 내지 13 개, 1개 내지 12개, 1개 내지 11개, 1개 내지 10개, 1개 내지 9개, 1개 내지 8개, 1개 내지 7개, 1개 내지 6개, 1개 내지 5개, 1개 내지 4개, 1개 내지 3개, 1개 내지 2개, 또는 1개의 불일치(mismatch) 뉴클레오타이드를 포함; 및
이중가닥 DNA 절편 중 절단이 일어난 가닥과 상보적 가닥이 염기 교정 (하나 이상의 시토신(C)의 우라실(U) 또는 티민 (T)으로의 변환)을 포함.
비표적 위치에서 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제가 작동하는 경우 유전체 내에서 원치 않는 유전자의 돌연변이를 야기할 수 있어 심각한 문제가 야기될 수 있다. 이에, 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제의 표적 위치에서의 활성 못지 않게 비표적 서열을 정확히 검출하여 분석하는 과정 또한 매우 중요할 수 있으며, 이는 비표적 효과 없이 표적 위치에만 특이적으로 작동하는 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제를 개발하는데 유용하게 사용될 수 있을 것이다.
본 발명의 목적상 상기 시티딘 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제는 생체 내 (in vivo) 및 시험관 내 (in vitro)에서 활성을 가질 수 있으므로, 시험관 내에서 DNA (예컨대, 유전체 DNA)의 비표적 위치를 검출하는데 사용될 수 있으며, 이를 생체 내에서 적용하였을 때 상기 검출된 비표적 위치 (비표적 서열을 포함하는 유전자상 위치 (부위))와 동일한 위치에도 활성을 가질 것을 예상할 수 있다.
상기 단계 (ii)는 상기 단계 (i)에서 절단 (단일 가닥 절단)된 DNA 절편의 핵산 서열을 분석하는 단계로서, 통상적인 모든 핵산 서열 분석 방법에 의하여 수행될 수 있다. 예컨대, 상기 단계 (i)에서 사용된 분리된 DNA가 유전체 DNA인 경우, 상기 핵산 서열 분석은 전체 유전체 시퀀싱 (whole genome sequencing)에 의하여 수행될 수 있다. 전체 유전체 시퀀싱을 수행하는 경우, 표적 부위의 서열과 상동성을 가지는 서열을 찾아 비표적 위치일 것으로 예측하는 간접적인 방법과 달리 전체 유전체 수준에서 실질적으로 표적 특이적 뉴클레아제에 의해 절단되는 비표적 위치를 검출할 수 있으므로, 보다 정확하게 비표적 위치를 검출할 수 있다.
본 명세서에 사용된 바로서, "전체 유전체 시퀀싱 (whole genome sequencing; WGS)"은 차세대 시퀀싱 (next generation sequencing)에 의한 전장 유전체 시퀀싱을 10 X, 20 X, 40 X 형식으로 여러 배수로 유전체를 읽는 방법을 의미한다. "차세대 시퀀싱"은 칩 (Chip) 기반 및 PCR 기반 페어드엔드 (paired end) 형식으로 전장 유전체를 조각내고, 상기 조각을 화학적인 반응 (hybridization)에 기초하여 초고속으로 시퀀싱을 수행하는 기술을 의미한다.
상기 단계 (iii)은 상기 단계 (ii)에서 수득한 염기서열 데이터 (sequence read)에서 DNA가 절단된 위치를 확인 (또는 결정)하는 단계로서, 시퀀싱 데이터를 분석하여 표적 위치 (on-target site)와 비표적 위치(off-target site)를 간편하게 검출할 수 있다. 상기 염기서열 데이터로부터 DNA가 절단된 특정 위치를 결정하는 것은 다양한 접근 방법으로 수행될 수 있으며, 본 명세서에서는 상기 위치를 결정하기 위한 여러 가지의 합리적인 방법들을 제공한다. 그러나 이는 본 발명의 기술적 사상에 포함되는 예시에 불과하며, 본 발명의 범위가 이들 방법에 의해 제한되는 것은 아니다.
예컨대, 상기 절단된 위치를 결정하기 위한 일례로서, 전체 유전체 시퀀싱을 통해 수득한 염기서열 데이터를 유전체 상의 위치에 따라 정렬하였을 경우, 5' 말단이 수직 정렬된 위치가 DNA가 절단된 위치를 의미할 수 있다. 상기 염기서열 데이터를 유전체 상의 위치에 따라 정렬하는 단계는 분석 프로그램 (예를 들어, BWA/GATK 또는 ISAAC 등)을 이용하여 수행할 수 있다. 본 명세서에 사용된 바로서, 상기 용어 "수직 정렬"이란, BWA/GATK 또는 ISAAC 등의 프로그램으로 전체 유전체 시퀀싱 결과를 분석할 때, 인접한 왓슨 가닥 (Watson strand)과 크릭 가닥 (Crick strand) 각각에 대해, 2 개 이상의 염기서열 데이터의 5' 말단이 유전체 상의 동일한 위치 (nucleotide position)에서 시작되는 배열을 말한다. 이로 인하여, 상기 단계 (ii)에서 절단되어 동일한 5' 말단을 갖게 되는 DNA 단편들이 각각 시퀀싱되어 나타나게 된다.
즉, 상기 단계 (i)에서의 절단이 표적 위치 및 비표적 위치에서 일어나는 경우, 염기서열 데이터를 정렬하게 되면 공통적으로 절단된 부위는 각각 그 위치가 5' 말단으로 시작되므로 수직 정렬되나, 절단되지 않은 부위에는 5' 말단이 존재하지 않으므로 정렬 시 스태거드 (staggered) 방식으로 배열될 수 있다. 따라서, 수직 정렬된 위치를 상기 단계 (i)에서 절단된 부위로 볼 수 있으며, 이는 곧 불활성화된 표적특이적 엔도뉴클레아제에 의하여 절단된 표적 위치 또는 비표적 위치를 의미하는 것일 수 있다.
상기 "정렬"은 표준 염기서열 (reference genome)로 염기서열 데이터를 맵핑한 뒤, 유전체에서 동일 위치를 가지는 염기들을 각 위치에 맞게 배열하는 것을 의미한다. 따라서, 염기서열 데이터를 상기와 같은 방식으로 정렬할 수 있다면 어떠한 컴퓨터 프로그램도 이용될 수 있으며, 이는 당업계에 이미 알려진 공지의 프로그램이거나 또는 목적에 맞게 제작된 프로그램들 중에서 선택될 수 있다. 일 실시예에서는 ISAAC를 이용하여 정렬을 수행하였으나, 이에 제한되는 것은 아니다.
정렬 결과, 상기 설명한 바와 같은 5' 말단이 수직 정렬된 위치를 찾는 등의 방법을 통해 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제에 의해 DNA가 절단된 위치를 결정할 수 있고, 상기 절단된 위치가 표적 위치 (on-target site)가 아니라면, 비표적 위치 (off-target site)로 판단할 수 있다. 다시 말해, 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제의 표적 위치로 설계한 염기 서열과 동일한 서열은 표적 위치이고, 상기 염기 서열과 동일하지 않은 서열은 비표적 위치로 볼 수 있다. 이는 상기 기술한 비표적 위치의 정의상 자명한 것이다.
상기 방법 (예컨대, on-target 부위에서의 염기 교정 효율, 비표적 위치 (off-target site) 확인 방법)은, 상기 단계 (iii) 이후에, 상기 절단 위치가 표적 위치 (on-target site)가 아닌 경우, 비표적 위치 (off-target site)로 확인(판단)하는 단계를 추가로 포함할 수 있다.
염기교정기 (디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제)에 의해 절단된 DNA 절편 중 절단된 가닥은 5' 말단이 수직정렬된다. 상기5' 말단이 수직정렬 되는 DNA 리드 (DNA read; 본 명세서에서 사용되는 바로서, 5' 말단이 수직정렬되고 동일한 핵산 서열을 갖는 DNA 단편 또는 상기 DNA 단편의 집단을 의미함)의 개수에 따라서, 절단 위치의 개수를 확인할 수 있다. 예컨대, 5' 말단이 수직정렬 되는 DNA 리드의 개수가 1인 경우, 상기 염기교정기에 의하여 하나의 위치, 즉 표적 위치에서만 절단이 일어났음을 확인할 수 있다. 5' 말단이 수직 정렬되는 DNA 리드의 개수가 2이상, 예컨대, 3 이상, 4 이상, 5 이상, 6 이상, 7 이상, 8 이상, 9 이상, 또는 10 이상인 경우, 2 이상의 다수의 위치에서 절단이 일어났음을 확인할 수 있으며, 이는 표적위치 이외의 위치 (비표적 위치)에서 DNA 절단이 있음을 의미하는 것이다. 또한, 상기 5' 말단이 수직정렬되는 DNA 리드들 중 표적 위치가 아닌 것 (즉, 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 것)은 비표적 위치라고 확인 (또는 결정)할 수 있다.
따라서, 상기 단계 (iii)의 단일 가닥 절단 위치를 확인하는 단계는 (a) 5' 말단이 수직정렬 되는 DNA 리드의 수를 확인(또는 측정)하는 단계를 포함할 수 있다. 이 경우, 5' 말단이 수직정렬 되는 DNA 리드의 수가 2 이상, 예컨대, 3 이상, 4 이상, 5 이상, 6 이상, 7 이상, 8 이상, 9 이상, 또는 10 이상인 경우, 표적 위치가 아닌 위치 (비표적 위치)에서 DNA 절단이 일어난 것으로 확인 (또는 결정)할 수 있다. 또한, 이 경우, 상기 단계 (iv)의 비표적 위치로 확인하는 단계는 (iv-1) 상기 2개 이상의 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드를 비표적 위치로 확인 (또는 결정)하는 단계를 포함할 수 있다.
또한, 상기 비표적 위치가 PAM 서열을 포함하는지 여부를 확인(보다 구체적으로, 절단된 DNA 절편 중, 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드와 상보적 가닥 (상보적 서열을 갖는 가닥)이 PAM 서열을 포함하는지 여부를 확인)함으로써, 염기교정기에 포함된 표적특이적 엔도뉴클레아제에 의한 표적특이적 절단이 아닌 오류로 절단된 위치를 배제하여 비표적 위치의 정확도를 보다 증가시킬 시킬 수 있다. 따라서, 상기 단계 (iii)의 단일 가닥 절단 위치를 확인하는 단계는, (b) 비표적 위치가 PAM 서열을 포함하는지 여부를 확인하는 단계, 예컨대, 절단된 DNA 절편 중, 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드와 상보적 가닥 (상보적 서열을 갖는 가닥)이 염기교정기에 포함된 표적특이적 엔도뉴클레아제에 특이적인 PAM 서열을 포함하는지 여부를 확인하는 단계를 추가로 포함할 수 있다. 이 경우, 상기 단계 (iv)의 비표적 위치로 확인하는 단계는, (iv-2) 절단된 DNA 절편 중, 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드와 상보적 가닥 (상보적 서열을 갖는 가닥)이 염기교정기에 포함된 표적특이적 엔도뉴클레아제에 특이적인 PAM 서열을 포함하는 경우, 비표적 위치로 확인 (또는 결정)하는 단계를 포함할 수 있다.
또한, 상기 비표적 위치는 표적 위치의 서열과 상동성을 가지는 서열로 구성된 것일 수 있다. 보다 구체적으로, 표적 위치 서열은 PAM 서열을 포함하는 가닥의 핵산 서열로 표현되므로, 상기 비표적 위치는, 절단된 DNA 절편 중, 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드와 상보적 가닥 (상보적 서열을 갖는 가닥)의 핵산 서열이 표적 위치와 1 개 이상의 뉴클레오타이드 불일치 (mismatch)를 가지는 서열, 더욱 구체적으로 표적 위치(표적 서열)와 15개 이하 또는 10개 이하, 예컨대, 1개 내지 15개, 1개 내지 14개, 1개 내지 13개, 1개 내지 12개, 1개 내지 11개, 1개 내지 10개, 1개 내지 9개, 1개 내지 8개, 1개 내지 7개, 1개 내지 6개, 1개 내지 5개, 1개 내지 4개, 1개 내지 3개, 또는 1개 내지 2개의 뉴클레오타이드 불일치를 가지는 것일 수 있다.
따라서, 상기 단계 (iii)의 단일 가닥 절단 위치를 확인하는 단계는, (c) 절단된 DNA 절편 중, 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드와 상보적 가닥 (상보적 서열을 갖는 가닥)의 표적 위치 서열에 대한 불일치 뉴클레오타이드 수를 확인 (또는 측정)하는 단계를 추가로 포함할 수 있다. 이 경우, 상기 불일치 뉴클레오타이드 수가 15개 이하 또는 10개 이하, 예컨대, 1개 내지 15개, 1개 내지 14개, 1개 내지 13개, 1개 내지 12개, 1개 내지 11개, 1개 내지 10개, 1개 내지 9개, 1개 내지 8개, 1개 내지 7개, 1개 내지 6개, 1개 내지 5개, 1개 내지 4개, 1개 내지 3개, 또는 1개 내지 2개인 경우, 상기 DNA 리드를 표적 위치가 아닌 위치 (비표적 위치)에서 DNA 절단이 일어난 것으로 확인 (또는 결정)할 수 있다. 또한, 이 경우, 상기 단계 (iv)의 비표적 위치로 확인하는 단계는, (iv-3) 절단된 DNA 절편 중, 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드와 상보적 가닥 (상보적 서열을 갖는 가닥)의 표적 위치 서열에 대한 불일치 뉴클레오타이드가 15개 이하 또는 10개 이하, 예컨대, 1개 내지 15개, 1개 내지 14개, 1개 내지 13개, 1개 내지 12개, 1개 내지 11개, 1개 내지 10개, 1개 내지 9개, 1개 내지 8개, 1개 내지 7개, 1개 내지 6개, 1개 내지 5개, 1개 내지 4개, 1개 내지 3개, 또는 1개 내지 2개인 경우, 비표적 위치로 확인 (또는 결정)하는 단계를 포함할 수 있다.
상기 단계 (iii)는 단계 (a), (b), 및 (c) 중 하나 이상 (예컨대, 단계 (a) 및, (b)와 (c) 중 하나 이상)을 포함할 수 있으며, 상기 단계 (a), (b), 및 (c) 중 2 이상을 포함하는 경우, 이들은 동시에 또는 순서에 상관없이 순차적으로 수행되는 것일 수 있다. 또한, 단계 (iv)는 단계 (iv-1), (iv-2), 및 (iv-3) 중 하나 이상(예컨대, 단계 (iv-1) 및, (iv-2)와 (iv-3) 중 하나 이상)을 포함할 수 있으며, 상기 단계 (iv-1), (iv-2), 및 (iv-3) 중 2 이상을 포함하는 경우, 이들은 동시에 또는 순서에 상관없이 순차적으로 수행되는 것일 수 있다.
상기 단계 (iii-1)의 염기 교정 (예컨대, 시토신(C)의 우라실(U) 또는 티민 (T)으로의 변환) 여부를 확인하는 단계는, 절단된 DNA 절편 중, 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드와 상보적 가닥 (상보적 서열을 갖는 가닥)이 염기 교정 (하나 이상의 시토신(C)의 우라실(U) 또는 티민 (T)으로의 변환)을 포함하는지 여부를 확인 (측정)하는 단계를 포함하는 것일 수 있다. 이 경우, 상기 단계 (iv)의 비표적 위치로 확인하는 단계는, (iv-4) 절단된 DNA 절편 중, 5' 말단이 수직정렬 되는 DNA 리드 중 표적 위치의 핵산 서열과 상이한 핵산 서열을 갖는 DNA 리드와 상보적 가닥 (상보적 서열을 갖는 가닥)이 염기 교정 (하나 이상의 시토신(C)의 우라실(U) 또는 티민 (T)으로의 변환)을 포함하는 경우, 비표적 위치로 확인 (또는 결정)하는 단계를 포함할 수 있다.
일 실시예에서, 유전체 DNA에 대하여 상기 단계 (i)를 수행하여 단일 가닥 절단한 뒤, 전체 유전체 분석 (단계 (ii)) 수행 후, 이를 ISAAC로 정렬하여 절단된 위치에서는 수직 정렬, 절단되지 않은 위치에서는 스태거드 방식으로 정렬되는 패턴을 확인하여, 이를 5' 말단 플롯으로 나타내었을 때 절단 부위에서 독특한 패턴이 나타날 수 있다.
나아가 이에 제한되는 것은 아니나, 구체적인 일례로 왓슨 가닥 (Watson strand)과 크릭 가닥 (Crick strand)에 해당하는 염기서열 데이터 (sequence read)가 각각 두 개 이상씩 수직으로 정렬되는 위치를 비표적 위치인 것으로 판단할 수 있고, 또한 20 % 이상의 염기서열 데이터가 수직으로 정렬되고, 각각의 왓슨 가닥 및 크릭 가닥에서 동일한 5' 말단을 가진 염기서열 데이터의 수가 10 이상인 위치가 비표적 위치, 즉 절단되는 위치인 것으로 판단할 수 있다.
상기한 방법은 단계 (ii) 및 (iii)의 과정은 Digenome-seq (digested-genome sequencing일 수 있으며, 보다 구체적인 내용은 한국 특허공개 제10-2016-0058703호에 기재되어 있다 (상기 문헌은 본 발명에 참조로서 포함된다).
앞서 설명한 방법에 의하여, 디아미나제의 염기 교정 위치 및/또는 단일 가닥 절단 위치, on-target 부위에서의 염기 교정 효율 또는 표적 특이성 (즉, [on-target 부위에서의 염기 교정 또는 절단 빈도]/[전체 염기 교정 또는 절단 빈도]), 및/또는 비표적 위치 (off-target site; 디아미나제의 염기 교정 위치로 확인된 위치 중 on-target 위치가 아닌 위치)를 확인 (또는 측정 또는 검출)할 수 있다.
상기 비표적 위치 확인(검출)은 시험관 내 (in vitro)에서 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제를 유전체 DNA에 처리하여 수행될 수 있다. 이에 상기 방법을 통해 확인(검출)된 비표적 위치에 대하여 실질적으로 생체 내 (in vivo)에서도 비표적 효과가 나타나는지 확인해볼 수 있다. 다만 이는 추가적인 검증 과정에 불과하므로 본 발명의 범위에 필수적으로 수반되는 단계는 아니며, 필요에 따라 추가적으로 수행될 수 있는 단계에 불과하다.
본 명세서에 사용된 바로서, 용어 "비표적 효과 (off-target effect)"는 비표적 위치 (off-target site)에서 염기 교정 및/또는 이중 가닥 절단이 일어나는 수준을 의미하기 위한 것일 수 있다. 용어 "인델(Insertion and/or deletion; Indel)"은 DNA의 염기 배열에서 일부 염기가 중간에 삽입되거나 (insertion) 및/또는 결실된 (deletion) 변이를 총칭한다.
본 명세서에서 제공되는 시티딘 디아미나제를 이용한 DNA 단일 가닥 절단 방법 및 이를 이용한 핵산 서열 분석 기술에 의하여, 시티딘 디아미나제의 염기 교정 위치, 표적 특이성, 및/또는 비표적 위치를 보다 정확하고 효율적으로 확인할 수 있다.
도 1은 EMX1의 표적 위치에서의 C→U 변환 및 직선 정렬(straight alignment)을 보여주는 대표적인 IGV 이미지이다.
도 2는 Digenome-seq 결과 얻어진 하나의 가닥에서만 시퀀스 리드의 균일한 정렬을 갖는 절단 위치(nicked sites)의 개수 및 이들 위치 중 10개 이하의 mismatch를 갖는 PAM-포함 위치의 개수 보여준다.
도 3a는 rAPOBEC1-XTEN-dCas9-NLS 벡터의 개열지도이다.
도 3b는 rAPOBEC1-XTEN-dCas9-UGI-NLS 벡터의 개열지도이다.
도 3c는 rAPOBEC1-XTEN-Cas9n-UGI-NLS 벡터의 개열지도이다.
도 4는 Cas9 expression plasmid의 개열지도이다.
도 5는 pET28b-BE1 벡터의 개열지도이다.
도 6은 pET28b-BE3 delta UGI 벡터의 개열지도이다
도 2는 Digenome-seq 결과 얻어진 하나의 가닥에서만 시퀀스 리드의 균일한 정렬을 갖는 절단 위치(nicked sites)의 개수 및 이들 위치 중 10개 이하의 mismatch를 갖는 PAM-포함 위치의 개수 보여준다.
도 3a는 rAPOBEC1-XTEN-dCas9-NLS 벡터의 개열지도이다.
도 3b는 rAPOBEC1-XTEN-dCas9-UGI-NLS 벡터의 개열지도이다.
도 3c는 rAPOBEC1-XTEN-Cas9n-UGI-NLS 벡터의 개열지도이다.
도 4는 Cas9 expression plasmid의 개열지도이다.
도 5는 pET28b-BE1 벡터의 개열지도이다.
도 6은 pET28b-BE3 delta UGI 벡터의 개열지도이다
이하 본 발명을 다음의 실시예에 의하여 보다 구체적으로 설명하고자 한다. 그러나 이들은 본 발명을 예시하기 위한 것일 뿐이며, 본 발명의 범위가 이들 실시예에 의하여 제한되는 것은 아니다.
[
참고예
]
1. 세포 배양 및 형질감염
HEK293T 세포 (ATCC CRL-11268)를 10%(w/v) FBS 및 1%(w/v) 페니실린/스트렙토 마이신 (Welgene)으로 보충된 DMEM (Dulbecco Modified Eagle Medium) 배지에서 유지시켰다. HEK293T 세포 (1.5x105)를 24- 웰 플레이트에 접종하고, Lipofectamine 2000 (Invitrogen)을 사용하여 sgRNA plasmid (500 ng)와, Base Editor plasmid (Addgene plasmid #73019 (Expresses BE1 with C-terminal NLS in mammalian cells; rAPOBEC1-XTEN-dCas9-NLS; 도 3a), #73020 (Expresses BE2 in mammalian cells; rAPOBEC1-XTEN-dCas9-UGI-NLS; 도 3b), #73021 (Expresses BE3 in mammalian cells; rAPOBEC1-XTEN-Cas9n-UGI-NLS; 도 3c)) (1.5㎍) 또는 Cas9 expression plasmid (Addgene plasmid #43945; 도 4)를 형질감염시켰다 (at ~80% confluency). 형질감염 후 72 시간 후에 DNeasy Blood & Tissue Kit (Qiagen)을 사용하여 유전체 DNA를 분리하였다. 상기 세포에 대하여 마이코플라스마 오염 여부를 테스트하지 않았다.
하기하는 실시예에 사용된 sgRNA는 표적 부위 서열 (표적 서열; EMX1 on-target 서열; GAGTCCGAGCAGAAGAAGAAGGG (서열번호 14)) 중 5' 말단의 PAM 서열 (5'-NGG-3' (N은 A, T, G, 또는 C임))을 제외한 서열에서 T를 U로 바꾼 서열을 아래의 일반식 3의 표적화 서열 '(Ncas9)l'로 하여 제작된 것을 사용하였다:
5'-(Ncas9)l-(GUUUUAGAGCUA; 서열번호 1)-(GAAA)-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC; 서열번호 3)-3' (일반식 3; 올리고뉴클레오타이드 링커: GAAA).
2. 단백질 정제
His6-rAPOBEC1-XTEN-dCas9 단백질을 코딩하는 플라스미드(pET28b-BE1; Expresses BE1 with N-terminal His6 tag in E. Coli; 도 5)는 David Liu (Addgene plasmid #73018)로부터 제공받고, 상기 His6-rAPOBEC1-XTEN-dCas9 단백질을 코딩하는 플라스미드 pET28b-BE1에서 site directed mutagenesis를 이용하여 dCas9의 A840을 H840로 치환하여, His6-rAPOBEC1-nCas9 단백질 (BE3 delta UGI; UGI 도메인을 결여한 BE3 변이형)을 코딩하는 플라스미드(pET28b-BE3 delta UGI; 도 6)를 제작하였다.
Rosetta 발현 세포 (Novagen, catalog number: 70954-3CN)를 상기 준비된 pET28b-BE1 또는 pET28b-BE3 delta UGI로 형질 전환시키고, 100 ㎍/ml kanamycin 과 50 mg/ml carbenicilin을 포함하는 Luria-Bertani (LB) brot에서 37 조건으로 밤새 배양하였다. pET28b-BE1 또는 pET28b-BE3 delta UGI을 함유하는 Rosetta 세포를 밤새 배양한 배양물 10ml를 100㎍/ml kanamycin 및 50mg/ml carbenicilin을 함유하는 400ml LB broth에 접종하고 OD600이 0.5-0.6에 도달 할 때까지 30 조건에서 배양하였다. 상기 배양된 세포를 1 시간 동안 16 로 냉각시키고, 0.5 mM IPTG(Isopropyl β-D-1-thiogalactopyranoside)를 보충하여, 14-18 시간 동안 배양하였다.
단백질 정제를 위해, 세포를 4 에서 10 분 동안 5000xg에서 원심 분리하여 수확하고, 리소자임 (Sigma) 및 프로테아제 억제제 (Roche complete, EDTA-free)보충된 용해 완충액 (50 mM NaH2PO4, 300 mM NaCl, 1 mM DTT 및 10 mM imidazole, pH 8.0) 5 ml 에서 초음파 처리하여 용해시켰다. 상기 얻어진 세포 반응물을 4 에서 13,000 rpm로 30분 동안 원심분리하여 얻어진 용해성 세포 용해물을 Ni-NTA 아가로즈 레진(Qiagen)과 함께 4에서 1 시간 동안 배양하였다. 세포 용해물/Ni-NTA 혼합물을 컬럼에 적용하고 완충액 (50 mM NaH2PO4, 300 mM NaCl 및 20 mM 이미다졸, pH 8.0)으로 세척하였다. BE3 단백질을 용출 완충액 (50 mM NaH2PO4, 300 mM NaCl 및 250 mM 이미다졸, pH 8.0)으로 용출시켰다. 용출된 단백질을 저장 완충액 (20 mM HEPES-KOH (pH 7.5), 150 mM KCl, 1 mM DTT 및 20% 글리세롤)으로 버퍼 교체하여 저장하고 원심 분리 필터 유닛 (Millipore)을 사용하여 농축시켜, rAPOBEC1-nCas9 단백질을 정제하였다.
3. 유전체 DNA의 탈아민화
유전체 DNA는 제조자의 지시에 따라 DNeasy Blood & Tissue Kit (Qiagen)을 사용하여 HEK293T 세포로부터 정제(추출)하였다. 유전체 DNA (10 ㎍)를 상기 참고예 2에서 정제된 rAPOBEC1-nCas9 단백질 (300 nM)과 sgRNA (900 nM)와 함께 500 ㎕의 반응 용량으로 37 에서 8 시간 동안 완충액 (100 mM NaCl, 40 mM) Hris-HCl, 10 mM MgCl2, 및 100 ㎍/ml BSA, pH 7.9)에서 배양하였다.
상기 사용된 sgRNA는 표적 부위 서열 (표적 서열; EMX1 on-target 서열; GAGTCCGAGCAGAAGAAGAAGGG (서열번호 14)) 중 5' 말단의 PAM 서열 (5'-NGG-3' (N은 A, T, G, 또는 C임))을 제외한 서열에서 T를 U로 바꾼 서열을 아래의 일반식 3의 표적화 서열 '(Ncas9)l'로 하여 제작된 것을 사용하였다:
5'-(Ncas9)l-(GUUUUAGAGCUA)-(GAAA)-(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)-3' (일반식 3; 올리고뉴클레오타이드 링커: GAAA).
RNase A (50 ㎍/mL)를 사용하여 sgRNA를 제거한 후, 우라실 함유 유전체 DNA를 DNeasy Blood & Tissue Kit (Qiagen)로 정제하였다. 표적 부위를 SUN-PCR 블렌드를 사용하여 PCR 증폭시키고 생거 (Sanger) 서열 분석을 수행하여 BE3-매개 시토신 탈아민화 및 DNA 절단을 확인하였다.
4. 전체 유전체 및
Digenome
Sequencing
Covaris 시스템 (Life Technologies)을 사용하여 400-500 bp 범위로 유전체 DNA (1 ㎍)를 단편화하고 End Repair Mix (Thermo Fischer)를 사용하여 blunt-ended 시켰다. 단편화된 DNA를 어댑터로 연결하여 라이브러리를 생성 한 다음, ㈜마크로젠에 의뢰하여 HiSeq X Ten Sequencer (Illumina)를 사용하여 WGS(whole genome sequencing)를 수행하였다 (Kim, D., Kim, S., Kim, S., Park, J. & Kim, J.S. Genome-wide target specificities of CRISPR-Cas9 nucleases revealed by multiplex Digenome-seq. Genome research 26, 406-415 (2016)).
5. 표적 심층 시퀀싱 (Targeted deep sequencing)
deep sequencing 라이브러리 생성을 위해, 표적과 잠재적인 비표적 부위를 KAPA HiFi HotStart PCR 키트 (KAPA Biosystems # KK2501)로 증폭시켰다. 풀링된 PCR 증폭물을 TruSeq HT Dual Index 시스템 (Illumina)이 장착된 MiniSeq (Illumina) 또는 Illumina Miseq(LAS Inc. 한국)을 사용하여 시퀀싱하였다.
상기 표적 심층 시퀀싱에 사용된 프라이머는 다음과 같다:
EMX1
On-target sequence: GAGTCCGAGCAGAAGAAGAAGGG (서열번호 14)
1st PCR
Forward(5'→3'):
AGTGTTGAGGCCCCAGTG (서열번호 15);
Reverse(5'→3'):
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCAGCAAGCAGCACTCT (서열번호 16);
2nd PCR
Forward(5'→3'):
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGGGCCTCCTGAGTTTCTCAT (서열번호 17);
Reverse(5'→3')
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCAGCAAGCAGCACTCT (서열번호 18);
실시예
1.
Digenome
-
seq를
이용한 BE3
비표적
위치 확인
생체 외에서 (in vitro), 인간 유전체 DNA에 EMX1 특이적 sgRNA (참고예 3 참조; on target 서열: 서열번호 14)와 rAPOBEC1-nCas9 단백질 (BE3: 참고예 2에서 정제됨)이 복합체를 형성한 리보핵산단백질을 처리하여 표적 (on-target) 위치 및 비표적 (off-target) 위치에서 한 가닥에는 C→U 변환을, 다른 가닥에서는 절단 (nick)을 유도한 후, 참고예 4를 참조하여 Digenome-seq를 수행하였다. 본 실시예에서, Uracil DNA glycosylase (UDG)와 DNA glycosylase-lyase Endonuclease VIII는 사용하지 않았다. end repair 및 adaptor ligation 후, BE3 처리된 유전체 DNA에 대하여 전체 유전체 시퀀싱 (WGS)을 수행하였다.
그 과정을 모식적으로 나타내면 다음과 같다:
한 가닥에서 서열 리드의 균일한 정렬 및 다른 가닥에서 C→U 변환이 일어난 표적 위치 및 비표적 위치를 계산적으로 확인하였다.
도 1은 EMX1의 표적 위치에서의 C→U 변환 및 직선 정렬(straight alignment)을 보여주는 대표적인 IGV 이미지이다.
상기 Digenome-seq 결과 얻어진 하나의 가닥에서만 시퀀스 리드의 균일한 정렬을 갖는 절단 위치(nicked sites; 5' 말단이 수직정렬을 갖는 위치(read))의 개수 및 이들 위치 중 10개 이하의 mismatch를 갖는 PAM-포함 위치(read)의 개수를 도 2에 나타내었다. 그룹 A와 B는 동일한 5' 말단을 갖는 시퀀스 리드의 절대 개수 (n ≥ 5 또는 10) 및 상대 개수 (각각 10% 또는 20%)를 갖는 것으로 확인되고 표적 서열과 상동성을 갖는 위치의 개수를 보여준다.
인간 유전체 전역에서 동일한 5' 말단을 갖는 서열 리드의 절대적 개수 (n≥ 5 또는 10) 및 상대적 개수 (각각 10 % 또는 20 %)를 계수하여 유전체 내에서의 균일한 정렬 패턴과 관련된 모든 위치를 열거하였다. 그 결과, 도 2에 나타난 바와 같이, 각각 90,496 또는 1,807 개의 해당 위치들을 확보하였다. 단일가닥 절단 (nick)이 있는 위치들 중 34 개 (그룹 A) 또는 142 개 (그룹 B; 상기 그룹 A를 포함함) 위치들은 각각 단일가닥 절단 위치의 하류방향의 PAM (5'-NGN-3' 또는 5'-NNG-3') 3 염기쌍을 가지며, 10 개 이하의 불일치 염기를 갖는 EMX1 표적 서열과 10개 이하의 mismatches를 갖는 정도의 상동성을 갖는다.
Digenome-seq를 통해 확인된 EMX1에 대한 BE3 비표적 위치에서의 Cas9 유도 indel 빈도와 BE3 유도 치환 빈도를 HEK293T 세포에서 표적심층시퀀싱(참고예 5 참조)을 사용하여 측정하였다. 손상되지 않은 유전체 DNA 또는 rAPOBEC1-nCas9로 처리된 유전체 DNA를 사용하여 얻어진 WGS 데이터에서의 이들 위치 각각에서 C→T 변환이 일어나는지 여부를 확인하였다.
EMX1에서 BE3에 의하여 절단된 DNA 서열 (표적 위치 1개 + 비표적 위치 141개 = 총 142개)을 아래의 표 1에 정리하였다 (아래 표 1에서, on target 서열과 mismatch인 염기는 소문자로 표시함).
Chr | Position | DNA seq at a nickage sites | 서열번호 | |
EMX1-001 (on- target) |
chr2 | 73160998 | GAGTCCGAGCAGAAGAAGAAGGG | 14 |
EMX1-002 | chr4 | 131662222 | GAaTCCaAG-AGAAGAAGAATGG | 19 |
EMX1-003 | chr2 | 219845072 | GAGgCCGAGCAGAAGAAagACGG | 20 |
EMX1-004 | chr11 | 62365273 | GAaTCCaAGCAGAAGAAGAgAAG | 21 |
EMX1-005 | chr8 | 128801258 | GAGTCCtAGCAGgAGAAGAAGAG | 22 |
EMX1-006 | chr15 | 44109763 | GAGTCtaAGCAGAAGAAGAAGAG | 23 |
EMX1-007 | chr19 | 24250503 | GAGTCCaAGCAGtAGAgGAAGGG | 24 |
EMX1-008 | chr6 | 9118799 | acGTCtGAGCAGAAGAAGAATGG | 25 |
EMX1-009 | chr5 | 9227162 | aAGTCtGAGCAcAAGAAGAATGG | 26 |
EMX1-010 | chr1 | 4515013 | GtGTCCtAG-AGAAGAAGAAGGG | 27 |
EMX1-011 | chr5 | 45359067 | GAGTtaGAGCAGAAGAAGAAAGG | 28 |
EMX1-012 | chr13 | 96928092 | GAGaCaGAG-AGAAGAAGAATGG | 29 |
EMX1-013 | chr18 | 34906762 | GAGcCtGAGCgGAAGAgGAAAGG | 30 |
EMX1-014 | chr1 | 184236243 | aAtaCaGAGCAGAAGAAGAATGG | 31 |
EMX1-015 | chr18 | 1677040 | agtcCaGAGCAaAAtAAGAAGGG | 32 |
EMX1-016 | chr1 | 33606480 | GAGcCtGAGCAGAAGgAGAAGGG | 33 |
EMX1-017 | chr3 | 111296327 | GAagaaGAGCAaAAGAAGAAGGG | 34 |
EMX1-018 | chr22 | 34716275 | GtGaCaGAGCAaAAGAAGAAAGG | 35 |
EMX1-019 | chr3 | 37781974 | GAagagGAGCAaAAGAAGAAGGG | 36 |
EMX1-020 | chr20 | 6653999 | aAGTCCagaCAGAAGAAGAAGGA | 37 |
EMX1-021 | chr16 | 78848850 | aAaTCCaAcCAGAAGAAGAAAGG | 38 |
EMX1-022 | chr6 | 92449690 | GttcaaGAGCAGgAGAAGAAGGG | 39 |
EMX1-023 | chr4 | 87256692 | GAGTaaGAGaAGAAGAAGAAGGG | 40 |
EMX1-024 | chr11 | 43747948 | aAGcCCGAGCAaAgGAAGAAAGG | 41 |
EMX1-025 | chr5 | 160643032 | cctataGAGCAaAAGAAGAAAGG | 42 |
EMX1-026 | chr11 | 120873098 | GAtcaaGAGaAGAAGAAGAAGGG | 43 |
EMX1-027 | chr5 | 62692054 | cAaaaaGAGCAaAAGAAGAACGG | 44 |
EMX1-028 | chrX | 3077291 | tAcagtGAGCAaAAGAAGAAGGG | 45 |
EMX1-029 | chr14 | 98236084 | GttcaaGAGCAGgAGAAGAAGGG | 46 |
EMX1-030 | chr2 | 205473563 | ttcTCaGAGCAaAAGAAGAATGG | 47 |
EMX1-031 | chr3 | 189633259 | cttTGCcAGGAGAAGgAcAtTGC | 48 |
EMX1-032 | chr10 | 58498683 | agGTtaGAGCAaAAGAAGAAAGG | 49 |
EMX1-033 | chr1 | 35818892 | tAtaCgGAGCAGAAGAAGAATGG | 50 |
EMX1-034 | chr3 | 45605387 | GAGTCCacaCAGAAGAAGAAAGA | 51 |
EMX1-035 | chr3 | 5031614 | GAaTCCaAGCAGgAGAAGAAGGA | 52 |
EMX1-036 | chr12 | 106646090 | aAGTCCatGCAGAAGAgGAAGGG | 53 |
EMX1-037 | chr1 | 23720618 | aAGTCCGAGgAGAgGAAGAAAGG | 54 |
EMX1-038 | chr11 | 107812992 | aAGTCCaAGt-GAAGAAGAAAGG | 55 |
EMX1-039 | chr4 | 169444372 | GAGaaCGAGaAGAAagAGgAGAG | 56 |
EMX1-040 | chr6 | 18327737 | GAGagaGAGagagAGAgGgAGGG | 57 |
EMX1-041 | chr2 | 230161576 | ctGgCaGAGCAaAAGAAGAgGGG | 58 |
EMX1-042 | chr3 | 95690186 | tcaTCCaAGCAGAAGAAGAAGAG | 59 |
EMX1-043 | chr4 | 33321466 | GtacagGAGCAGgAGAAGAATGG | 60 |
EMX1-044 | chr22 | 49900715 | aAGaagGAGaAGAAGAAGAAGGG | 61 |
EMX1-045 | chr12 | 94591214 | GAGagaGAGagagAGAgaAAGGG | 62 |
EMX1-046 | chr5 | 146833190 | GAGcCgGAGCAGAAGAAGgAGGG | 63 |
EMX1-047 | chr6 | 111509461 | GAGggaGAGagGgAGAgagAAAG | 64 |
EMX1-048 | chr1 | 26490139 | ttaTCtccGagaAgGAAGAAGGG | 65 |
EMX1-049 | chr6 | 31265461 | GAtTCtGtcCcGAAtcAGAAGGG | 66 |
EMX1-050 | chr14 | 30099303 | atGcaaGAGaAGAAGAAGAAAGG | 67 |
EMX1-051 | chr3 | 83057859 | agcaggGAGCAGAgGAAGAATGG | 68 |
EMX1-052 | chr15 | 35575311 | GAGaagGAGaAGAAGAAGAAGGG | 69 |
EMX1-053 | chr1 | 55846672 | actctaGAGCAGAAaAAGAATGG | 70 |
EMX1-054 | chr6 | 104384459 | GAGgagGAGgAGgAGgAaggAGG | 71 |
EMX1-055 | chr19 | 9975831 | aAagagGAGaAGAAGAAGAAGGG | 72 |
EMX1-056 | chr12 | 99525769 | GgGgagGAGCAGAAGAAGAgAGG | 73 |
EMX1-057 | chr6 | 162280006 | agGcCgagGCAGgAGAAtAgGAG | 74 |
EMX1-058 | chr7 | 85359110 | GAGaagGAGCAGAAaAAGAATGG | 75 |
EMX1-059 | chr2 | 10462867 | acagtaGAGCAGAAGAAGAcTGG | 76 |
EMX1-060 | chr3 | 18195303 | atccaaGAGCAGgAGAAGAAGGG | 77 |
EMX1-061 | chr2 | 57855994 | ataagaGAGCAaAAGAAGAAAGG | 78 |
EMX1-062 | chr6 | 33957284 | GAGagaGAGagagAGAgaAACGG | 79 |
EMX1-063 | chr22 | 37474903 | GAGaagGAGaAGAAGgAGAAGAG | 80 |
EMX1-064 | chr8 | 141193983 | aAGaagaAGaAGAAGAAGAAGAG | 81 |
EMX1-065 | chr1 | 110038435 | tttcggGAGCAGAAGAAGAACAG | 82 |
EMX1-066 | chr4 | 117483357 | atcaCaGAGCAGgAGAAGAAGGG | 83 |
EMX1-067 | chr4 | 6150362 | aAacagGAGCAGAgGAAGAAGGG | 84 |
EMX1-068 | chr2 | 116142148 | aAGaagagGaAGAgGAgGAAAAG | 85 |
EMX1-069 | chr12 | 30794309 | GAaatgGAGaAGAAGAAGAAGGG | 86 |
EMX1-070 | chr22 | 44527016 | GAGagaGAaagaAAGAAaAAGGA | 87 |
EMX1-071 | chr9 | 96189722 | GctgtgGAGCAaAAGAAGAAAGG | 88 |
EMX1-072 | chr8 | 113493465 | GAGgagGAGCAGAAGAAGAAAAG | 89 |
EMX1-073 | chr11 | 46171476 | tAaaagGAGCAGAAaAAGAAGGG | 90 |
EMX1-074 | chrX | 3075272 | tAccttGAGCAaAAGAAGAAGGG | 91 |
EMX1-075 | chr5 | 56038567 | aAGaagGAGaAGAAGAAGAAGGG | 92 |
EMX1-076 | chr2 | 71789100 | GcaggaGAGCAGAAGAAGAAAGG | 93 |
EMX1-077 | chr7 | 52389195 | aAGagCGAGattAAGAgGAATGG | 94 |
EMX1-078 | chr5 | 31088930 | aAGaaaGgagAGgAGAgGAgAGG | 95 |
EMX1-079 | chr11 | 111680806 | agtagtGAGCAGAAGAAGAtAGG | 96 |
EMX1-080 | chr20 | 51306677 | aAGaagGAGaAGAAGAAGAAGAG | 97 |
EMX1-081 | chr19 | 38433655 | GAGagaGAGagagAGAgaAAGAG | 98 |
EMX1-082 | chr8 | 60956107 | GgccagGAGCAGgAGAAGAAGGG | 99 |
EMX1-083 | chr16 | 26617803 | agaggaGAGCAGAAGAAGgATGG | 100 |
EMX1-084 | chr12 | 52621931 | aAGaagGAGaAGAAGAAGgAGGA | 101 |
EMX1-085 | chr3 | 156028864 | cAtTaaGAGCAGgAGAAGAAGGG | 102 |
EMX1-086 | chr6 | 40280504 | cgcTgatAcagaAAGAAGAATGG | 103 |
EMX1-087 | chr1 | 35385601 | GAagtgGAGCAGgAGAAGAAGGG | 104 |
EMX1-088 | chr1 | 59299359 | tttgtgGAGCAGAAaAAGAAAGG | 105 |
EMX1-089 | chr15 | 61646877 | aAGTCaGAGgAGAAGAAGAAGGG | 106 |
EMX1-090 | chr2 | 159685754 | aAagCtGAGCAGAAaAAGAAGGG | 107 |
EMX1-091 | chr12 | 41494108 | GcagtgGAGCAGAAGAAGAtGGG | 108 |
EMX1-092 | chr7 | 119831026 | acaaaaGAGCAGAgGAAGAAAGG | 109 |
EMX1-093 | chr1 | 234492864 | GAagtaGAGCAGAAGAAGAAGCG | 110 |
EMX1-094 | chr14 | 104091588 | aAagagGgagAGAAGAAGAAGGG | 111 |
EMX1-095 | chr1 | 31954326 | aAGaagGAGaAGAAGAAGAAGAG | 112 |
EMX1-096 | chr8 | 120587501 | aAGgCCaAGCAGAAGAgtAATGG | 113 |
EMX1-097 | chr2 | 46020469 | acacaaGAGCAGAAGAAGAAAGA | 114 |
EMX1-098 | chr2 | 219294645 | GccaatGAGCAGgAGAAGAAGGG | 115 |
EMX1-099 | chr8 | 11924153 | cAtataGAGCAaAAGAAGAgAGG | 116 |
EMX1-100 | chr6 | 54740531 | GAGgtgGAGggGAAGAgGgAAGG | 117 |
EMX1-101 | chr1 | 156786840 | GAGagaGAGagagAGAgaAAGGG | 118 |
EMX1-102 | chr6 | 30791217 | aAGgagGAGaAGAAGAAGAAGGG | 119 |
EMX1-103 | chr3 | 192777993 | GAGggaGAGagagAGAgagAAAG | 120 |
EMX1-104 | chr2 | 36207879 | agtcggGAGCAGgAGAAGAAAGG | 121 |
EMX1-105 | chr16 | 54831367 | GttcaaGAGCAGAAGAAGAATGG | 122 |
EMX1-106 | chr6 | 160868147 | tctaaaGAGCAGAAaAAGAAAGG | 123 |
EMX1-107 | chr2 | 24438043 | actgatGAGCAGAAGAAGAAAGG | 124 |
EMX1-108 | chr22 | 37102243 | aAGaagGAGaAGAAGAAGgAGGA | 125 |
EMX1-109 | chr11 | 121786535 | agGaaaagagAGAAGAAGAAGGG | 126 |
EMX1-110 | chr7 | 3337380 | GAGgagGAGaAGAAGAAGAAGGG | 127 |
EMX1-111 | chr8 | 112924257 | GAGagaGAGagagAGAgaAAGGG | 128 |
EMX1-112 | chr16 | 69047289 | GAGgCCGAagctgAGgtGggAGG | 129 |
EMX1-113 | chr8 | 105164125 | GAGcCCaAGaAGAAGAAGAAGGA | 130 |
EMX1-114 | chr13 | 83353702 | atGTaCagagAGAAGAAGAAAGG | 131 |
EMX1-115 | chr2 | 102929260 | GccTtCagagAGAAGAAGAATGG | 132 |
EMX1-116 | chr15 | 22366621 | GgagtaGAGCAGAgGAAGAAGGG | 133 |
EMX1-117 | chr2 | 172374203 | GAagtaGAGCAGAAGAAGAAGCG | 134 |
EMX1-118 | chr8 | 31096390 | GctcCtGAGCAGAAGAAGAACAG | 135 |
EMX1-119 | chr2 | 66729772 | agtTCaGAGCAGgAGAAGAATGG | 136 |
EMX1-120 | chr2 | 14472327 | atGaaCagagAGAAGAAGAATGG | 137 |
EMX1-121 | chr8 | 140468447 | GAGagCGAGagagAGAgagAGGG | 138 |
EMX1-122 | chr7 | 52204863 | aAaaagGAGCAGAAGAAGAAGGA | 139 |
EMX1-123 | chr1 | 151027598 | ttcTCCaAGCAGAAGAAGAAGAG | 140 |
EMX1-124 | chr1 | 35590719 | GAGagaGAGagagAGAgaAAGGG | 141 |
EMX1-125 | chr1 | 106744880 | ttGgaaagagAGAAGAAGAAGGG | 142 |
EMX1-126 | chr10 | 115484209 | aAGaggaAGaAGAAGAAGAAGAG | 143 |
EMX1-127 | chr3 | 119686684 | GAGagaGAGaAagAGAAagAGAG | 144 |
EMX1-128 | chr8 | 53295601 | GAagaaGAGaAGAAGAAGAAGGG | 145 |
EMX1-129 | chr18 | 12032247 | GAtTCtGAGaAaAttAAGAtGGG | 146 |
EMX1-130 | chr15 | 61383748 | GgGctCcgGCAGAAGAtGccATG | 147 |
EMX1-131 | chr1 | 209298672 | GAtTCCaAGCAatgGAgGAgGGG | 148 |
EMX1-132 | chr7 | 17446438 | GtccaaGAGCAGgAGAAGAAGGG | 149 |
EMX1-133 | chr13 | 74473871 | atcTggGAGCAGgAGAAGAAGGG | 150 |
EMX1-134 | chr5 | 5141237 | GAGgatccGagGAtGtAGAAGGG | 151 |
EMX1-135 | chr12 | 5041728 | GAagaaGAagAaAgaAAGAAAGA | 152 |
EMX1-136 | chr8 | 112756160 | cAGagaGAGaAtAAGtAGcATAG | 153 |
EMX1-137 | chr8 | 17384135 | tgaggaagagAGAAGAAGAAAGG | 154 |
EMX1-138 | chr12 | 4545932 | cAagCatgagAGAAGAAGAtGGG | 155 |
EMX1-139 | chr10 | 58848728 | GAGcaCGAGCAagAGAAGAAGGG | 156 |
EMX1-140 | chr14 | 48932119 | GAGTCCcAGCAaAAGAAGAAAAG | 157 |
EMX1-141 | chr3 | 145057362 | GAGTCCct-CAGgAGAAGAAAGG | 158 |
EMX1-142 | chr9 | 111348573 | GAGTCCttG-AGAAGAAGgAAGG | 159 |
표 1에 열거된 절단 사이트에서 측정된 count (동일한 5' 말단을 갖는 sequence reads의 개수), depth (특정 위치에서의 sequence reads 개수), %(count/depth) 및 C→T 변환이 일어난 reads 개수를 아래의 표 2에 나타내었다:
count | depth | %(count/depth) | C to T conversion | Group A | Group B | ||
(+) Base editor | Untreated | ||||||
EMX1-001 (on- target) |
21 | 51 | 41.2 | 6 | 0 | v | v |
EMX1-002 | 21 | 39 | 53.8 | 8 | 0 | v | v |
EMX1-003 | 22 | 41 | 53.7 | 0 | 0 | v | v |
EMX1-004 | 36 | 79 | 45.6 | 10 | 0 | v | v |
EMX1-005 | 29 | 68 | 42.6 | 1 | 0 | v | v |
EMX1-006 | 26 | 62 | 41.9 | 9 | 0 | v | v |
EMX1-007 | 10 | 29 | 34.5 | 0 | 0 | v | v |
EMX1-008 | 24 | 86 | 27.9 | 0 | 0 | v | v |
EMX1-009 | 44 | 159 | 27.7 | 10 | 0 | v | v |
EMX1-010 | 11 | 41 | 26.8 | 0 | 0 | v | v |
EMX1-011 | 50 | 109 | 45.9 | N.A. | N.A. | v | v |
EMX1-012 | 15 | 43 | 34.9 | 1 | 0 | v | v |
EMX1-013 | 16 | 46 | 34.8 | 0 | 0 | v | v |
EMX1-014 | 22 | 64 | 34.4 | 0 | 1 | v | v |
EMX1-015 | 16 | 53 | 30.2 | 0 | 0 | v | v |
EMX1-016 | 19 | 63 | 30.2 | 1 | 0 | v | v |
EMX1-017 | 24 | 82 | 29.3 | N.A. | N.A. | v | v |
EMX1-018 | 24 | 85 | 28.2 | 0 | 0 | v | v |
EMX1-019 | 14 | 50 | 28.0 | N.A. | N.A. | v | v |
EMX1-020 | 10 | 36 | 27.8 | 0 | 0 | v | v |
EMX1-021 | 13 | 47 | 27.7 | 0 | 0 | v | v |
EMX1-022 | 13 | 48 | 27.1 | 1 | 0 | v | v |
EMX1-023 | 10 | 37 | 27.0 | N.A. | N.A. | v | v |
EMX1-024 | 11 | 42 | 26.2 | 0 | 0 | v | v |
EMX1-025 | 15 | 58 | 25.9 | N.A. | N.A. | v | v |
EMX1-026 | 11 | 43 | 25.6 | 0 | 0 | v | v |
EMX1-027 | 16 | 67 | 23.9 | N.A. | N.A. | v | v |
EMX1-028 | 10 | 44 | 22.7 | N.A. | N.A. | v | v |
EMX1-029 | 10 | 45 | 22.2 | 0 | 0 | v | v |
EMX1-030 | 14 | 63 | 22.2 | 0 | 0 | v | v |
EMX1-031 | 13 | 61 | 21.3 | 0 | 0 | v | v |
EMX1-032 | 13 | 61 | 21.3 | N.A. | N.A. | v | v |
EMX1-033 | 14 | 66 | 21.2 | 0 | 0 | v | v |
EMX1-034 | 14 | 53 | 26.4 | 2 | 0 | v | v |
EMX1-035 | 9 | 48 | 18.8 | 0 | 0 | - | v |
EMX1-036 | 8 | 46 | 17.4 | 1 | 0 | - | v |
EMX1-037 | 8 | 51 | 15.7 | 0 | 0 | - | v |
EMX1-038 | 6 | 42 | 14.3 | 0 | 0 | - | v |
EMX1-039 | 7 | 22 | 31.8 | 1 | 0 | - | v |
EMX1-040 | 7 | 22 | 31.8 | N.A. | N.A. | - | v |
EMX1-041 | 7 | 23 | 30.4 | 0 | 0 | - | v |
EMX1-042 | 7 | 25 | 28.0 | 0 | 0 | - | v |
EMX1-043 | 6 | 23 | 26.1 | 0 | 0 | - | v |
EMX1-044 | 7 | 27 | 25.9 | N.A. | N.A. | - | v |
EMX1-045 | 8 | 35 | 22.9 | N.A. | N.A. | - | v |
EMX1-046 | 9 | 40 | 22.5 | 0 | 0 | - | v |
EMX1-047 | 8 | 38 | 21.1 | N.A. | N.A. | - | v |
EMX1-048 | 5 | 24 | 20.8 | 0 | 0 | - | v |
EMX1-049 | 7 | 34 | 20.6 | 0 | 0 | - | v |
EMX1-050 | 8 | 40 | 20.0 | 0 | 0 | - | v |
EMX1-051 | 6 | 30 | 20.0 | N.A. | N.A. | - | v |
EMX1-052 | 10 | 51 | 19.6 | N.A. | N.A. | - | v |
EMX1-053 | 12 | 63 | 19.0 | 0 | 0 | - | v |
EMX1-054 | 7 | 37 | 18.9 | N.A. | N.A. | - | v |
EMX1-055 | 12 | 64 | 18.8 | N.A. | N.A. | - | v |
EMX1-056 | 8 | 43 | 18.6 | N.A. | N.A. | - | v |
EMX1-057 | 5 | 27 | 18.5 | 1 | 0 | - | v |
EMX1-058 | 9 | 49 | 18.4 | N.A. | N.A. | - | v |
EMX1-059 | 13 | 71 | 18.3 | N.A. | N.A. | - | v |
EMX1-060 | 10 | 55 | 18.2 | 0 | 0 | - | v |
EMX1-061 | 10 | 55 | 18.2 | N.A. | N.A. | - | v |
EMX1-062 | 5 | 28 | 17.9 | N.A. | N.A. | - | v |
EMX1-063 | 5 | 28 | 17.9 | N.A. | N.A. | - | v |
EMX1-064 | 7 | 40 | 17.5 | N.A. | N.A. | - | v |
EMX1-065 | 13 | 76 | 17.1 | 0 | 0 | - | v |
EMX1-066 | 5 | 30 | 16.7 | 0 | 0 | - | v |
EMX1-067 | 5 | 30 | 16.7 | 0 | 0 | - | v |
EMX1-068 | 6 | 36 | 16.7 | N.A. | N.A. | - | v |
EMX1-069 | 19 | 115 | 16.5 | N.A. | N.A. | - | v |
EMX1-070 | 6 | 37 | 16.2 | N.A. | N.A. | - | v |
EMX1-071 | 9 | 56 | 16.1 | N.A. | N.A. | - | v |
EMX1-072 | 15 | 94 | 16.0 | N.A. | N.A. | - | v |
EMX1-073 | 11 | 70 | 15.7 | N.A. | N.A. | - | v |
EMX1-074 | 7 | 45 | 15.6 | 0 | 0 | - | v |
EMX1-075 | 9 | 59 | 15.3 | N.A. | N.A. | - | v |
EMX1-076 | 9 | 59 | 15.3 | N.A. | N.A. | - | v |
EMX1-077 | 5 | 33 | 15.2 | 0 | 0 | - | v |
EMX1-078 | 14 | 93 | 15.1 | N.A. | N.A. | - | v |
EMX1-079 | 6 | 40 | 15.0 | N.A. | N.A. | - | v |
EMX1-080 | 11 | 75 | 14.7 | N.A. | N.A. | - | v |
EMX1-081 | 6 | 42 | 14.3 | N.A. | N.A. | - | v |
EMX1-082 | 6 | 43 | 14.0 | 0 | 0 | - | v |
EMX1-083 | 6 | 43 | 14.0 | N.A. | N.A. | - | v |
EMX1-084 | 7 | 50 | 14.0 | N.A. | N.A. | - | v |
EMX1-085 | 7 | 50 | 14.0 | N.A. | N.A. | - | v |
EMX1-086 | 5 | 36 | 13.9 | N.A. | N.A. | - | v |
EMX1-087 | 7 | 51 | 13.7 | N.A. | N.A. | - | v |
EMX1-088 | 7 | 51 | 13.7 | N.A. | N.A. | - | v |
EMX1-089 | 6 | 44 | 13.6 | 0 | 0 | - | v |
EMX1-090 | 10 | 74 | 13.5 | 0 | 0 | - | v |
EMX1-091 | 12 | 89 | 13.5 | N.A. | N.A. | - | v |
EMX1-092 | 5 | 37 | 13.5 | N.A. | N.A. | - | v |
EMX1-093 | 7 | 52 | 13.5 | N.A. | N.A. | - | v |
EMX1-094 | 6 | 45 | 13.3 | N.A. | N.A. | - | v |
EMX1-095 | 6 | 46 | 13.0 | N.A. | N.A. | - | v |
EMX1-096 | 11 | 85 | 12.9 | 0 | 0 | - | v |
EMX1-097 | 6 | 47 | 12.8 | 0 | 0 | - | v |
EMX1-098 | 5 | 39 | 12.8 | N.A. | N.A. | - | v |
EMX1-099 | 6 | 48 | 12.5 | N.A. | N.A. | - | v |
EMX1-100 | 6 | 48 | 12.5 | N.A. | N.A. | - | v |
EMX1-101 | 8 | 64 | 12.5 | N.A. | N.A. | - | v |
EMX1-102 | 7 | 57 | 12.3 | N.A. | N.A. | - | v |
EMX1-103 | 6 | 50 | 12.0 | N.A. | N.A. | - | v |
EMX1-104 | 7 | 59 | 11.9 | 0 | 0 | - | v |
EMX1-105 | 6 | 51 | 11.8 | 0 | 0 | - | v |
EMX1-106 | 9 | 77 | 11.7 | N.A. | N.A. | - | v |
EMX1-107 | 8 | 69 | 11.6 | N.A. | N.A. | - | v |
EMX1-108 | 5 | 43 | 11.6 | N.A. | N.A. | - | v |
EMX1-109 | 5 | 43 | 11.6 | N.A. | N.A. | - | v |
EMX1-110 | 7 | 61 | 11.5 | N.A. | N.A. | - | v |
EMX1-111 | 7 | 61 | 11.5 | N.A. | N.A. | - | v |
EMX1-112 | 5 | 44 | 11.4 | 0 | 0 | - | v |
EMX1-113 | 5 | 44 | 11.4 | 0 | 0 | - | v |
EMX1-114 | 7 | 62 | 11.3 | 0 | 0 | - | v |
EMX1-115 | 6 | 53 | 11.3 | 0 | 0 | - | v |
EMX1-116 | 8 | 71 | 11.3 | N.A. | N.A. | - | v |
EMX1-117 | 6 | 53 | 11.3 | N.A. | N.A. | - | v |
EMX1-118 | 6 | 54 | 11.1 | 0 | 0 | - | v |
EMX1-119 | 5 | 45 | 11.1 | 0 | 0 | - | v |
EMX1-120 | 5 | 46 | 10.9 | 0 | 0 | - | v |
EMX1-121 | 6 | 55 | 10.9 | 0 | 0 | - | v |
EMX1-122 | 6 | 55 | 10.9 | N.A. | N.A. | - | v |
EMX1-123 | 8 | 75 | 10.7 | 0 | 0 | - | v |
EMX1-124 | 6 | 56 | 10.7 | N.A. | N.A. | - | v |
EMX1-125 | 7 | 66 | 10.6 | N.A. | N.A. | - | v |
EMX1-126 | 5 | 47 | 10.6 | N.A. | N.A. | - | v |
EMX1-127 | 5 | 47 | 10.6 | N.A. | N.A. | - | v |
EMX1-128 | 8 | 76 | 10.5 | N.A. | N.A. | - | v |
EMX1-129 | 5 | 48 | 10.4 | 0 | 0 | - | v |
EMX1-130 | 5 | 48 | 10.4 | 0 | 0 | - | v |
EMX1-131 | 5 | 48 | 10.4 | 0 | 0 | - | v |
EMX1-132 | 5 | 48 | 10.4 | 1 | 0 | - | v |
EMX1-133 | 5 | 48 | 10.4 | N.A. | N.A. | - | v |
EMX1-134 | 7 | 68 | 10.3 | 0 | 0 | - | v |
EMX1-135 | 6 | 59 | 10.2 | N.A. | N.A. | - | v |
EMX1-136 | 5 | 49 | 10.2 | N.A. | N.A. | - | v |
EMX1-137 | 7 | 69 | 10.1 | N.A. | N.A. | - | v |
EMX1-138 | 5 | 50 | 10.0 | 0 | 0 | - | v |
EMX1-139 | 5 | 50 | 10.0 | 0 | 0 | - | v |
EMX1-140 | 7 | 44 | 15.9 | 0 | 0 | - | v |
EMX1-141 | 5 | 40 | 12.5 | 1 | 0 | - | v |
EMX1-142 | 6 | 49 | 12.2 | 1 | 0 | - | v |
(N.A.: not applicable because there are no cytosines to be deaminated at these sites)
상기 표 2에 나타난 바와 같이, BE-3 처리된 유전체 DNA 또는 손상되지 않은 (BE-3 미처리) 유전체 DNA를 사용하여 얻은 WGS 데이터에서 142개의 그룹 B 위치들 중 16개 위치 (BE-3 처리군) 또는 1개 위치(BE-3 미처리군)에서 C→T 변환이 각각 관찰되었다. 이들 위치들 중 70 개 위치는 BE3-매개 디아미네이션의 window인 4 내지 8 번 위치 (5'에서 3' 방향으로 1 내지 20번으로 넘버링됨)에 시토신을 갖지 않는다 (표 2에서 N.A.로 표시).
Digenome-seq에 의해 확인된 그룹 A와 그룹 B 사이트의 일부에서의 비표적 효과(off-target effect)를 확인하기 위하여, HEK293T 세포에서 targeted deep sequencing을 수행하고, BE3-유도 염기교정 빈도와 Cas9-유도 indel 빈도를 측정하여, 하기의 표 3에 나타내었다:
Validation by NGS | ||||||
Indel frequency (%) | Base editing frequency (%) | |||||
(-) Cas9 | (+) Cas9 | Validation | (-) BE3 | (+) BE3 | Validation | |
EMX1-001 (on- target) |
0.15 | 61.59 | Validated | 0.10 | 49.33 | Validated |
EMX1-002 | 0.01 | 0.01 | Invalidated | 0.16 | 1.05 | Validated |
EMX1-003 | 0.00 | 7.94 | Validated | 0.24 | 4.04 | Validated |
EMX1-004 | 0.00 | 0.01 | Validated | 0.16 | 0.93 | Validated |
EMX1-005 | 0.00 | 8.63 | Validated | 0.05 | 2.47 | Validated |
EMX1-006 | 0.29 | 38.25 | Validated | 0.04 | 15.59 | Validated |
EMX1-007 | 0.01 | 0.01 | Invalidated | 0.08 | 0.13 | Validated |
EMX1-008 | 0.02 | 0.17 | Validated | 0.03 | 0.62 | Validated |
EMX1-009 | 0.10 | 3.45 | Validated | 0.02 | 0.15 | Validated |
EMX1-010 | 0.08 | 0.08 | Invalidated | 0.07 | 0.70 | Validated |
EMX1-034 | 0.00 | 0.00 | Invalidated | 0.33 | 0.40 | Invalidated |
EMX1-035 | 0.46 | 0.89 | Validated | 0.23 | 0.48 | Validated |
EMX1-036 | 0.01 | 0.02 | Invalidated | 0.09 | 0.31 | Validated |
EMX1-037 | 0.01 | 0.23 | Validated | 0.20 | 0.23 | Validated |
EMX1-038 | 0.01 | 0.01 | Invalidated | 0.14 | 0.16 | Validated |
EMX1-140 | 0.01 | 0.00 | Invalidated | 0.38 | 0.36 | Invalidated |
EMX1-141 | 0.00 | 0.00 | Invalidated | 0.30 | 0.37 | Invalidated |
EMX1-142 | 0.01 | 0.01 | Invalidated | 0.19 | 0.17 | Invalidated |
표 3에 나타난 바와 같이, 총 18 개 사이트를 분석하였으며, EMX1 on-target site를 포함한 14 개 사이트에서 시퀀싱 에러에 의한 noise 수준 (0.002~0.38%) 이상의 빈도로 BE3에 의한 점돌연변이가 일어남을 관찰하였다 (유효성 확인 비율 78%). BE3는 background noise 수준보다 낮은 빈도로 다른 BE3-관련 Digenome-양성 사이트에서 변이를 유도하는 것이 가능하다. 중요한 것은, 상기 방법에 의하여 0.13% 이하의 빈도로 염기 교정이 검출되는 BE3 비표적 위치의 확인이 가능하다는 것이며, 이는 Digenome-seq가 매우 민감한 방법임을 보여준다. EMX1에 특이적인 Cas9 뉴클레아제는 노이즈 수준 이상의 빈도로 18 개 위치 중 9 개 위치에서 indels를 유도하며, 이는 BE3 및 Cas9 비표적 위치가 종종 다르다는 것을 보여준다. 종합하면, 이러한 결과는 BE3 비표적 위치가 Digenome-seq 데이터를 사용하여 확인될 수 있음을 보여준다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> INSTITUTE FOR BASIC SCIENCE
<120> METHOD OF IDENTIFYING GENOME-WIDE OFF-TARGET SITES OF BASE
EDITORS BY DETECTING SINGLE STRAND BREAKS IN GENOMIC DNA
<130> DPP20176864KR
<150> 62/446,951
<151> 2017-01-17
<160> 159
<170> KopatentIn 3.0
<210> 1
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> Essential part of crRNA
<400> 1
guuuuagagc ua 12
<210> 2
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'-terminal part of crRNA
<400> 2
ugcuguuuug 10
<210> 3
<211> 60
<212> RNA
<213> Artificial Sequence
<220>
<223> Essential part of tracrRNA
<400> 3
uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60
<210> 4
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 from Streptococcus pyogenes
<400> 4
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 5
<211> 4107
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9-coding sequence
<400> 5
atggacaaga agtacagcat cggcctggac atcggtacca acagcgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aagttcaagg tgctgggcaa caccgaccgc 120
cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180
gccacccgcc tgaagcgcac cgcccgccgc cgctacaccc gccgcaagaa ccgcatctgc 240
tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccaccgc 300
ctggaggaga gcttcctggt ggaggaggac aagaagcacg agcgccaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgcgcaag 420
aagctggtgg acagcaccga caaggccgac ctgcgcctga tctacctggc cctggcccac 480
atgatcaagt tccgcggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccc 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg cccgcctgag caagagccgc 660
cgcctggaga acctgatcgc ccagctgccc ggcgagaaga agaacggcct gttcggcaac 720
ctgatcgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900
ctgctgagcg acatcctgcg cgtgaacacc gagatcacca aggcccccct gagcgccagc 960
atgatcaagc gctacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgcgc 1020
cagcagctgc ccgagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gcccatcctg 1140
gagaagatgg acggcaccga ggagctgctg gtgaagctga accgcgagga cctgctgcgc 1200
aagcagcgca ccttcgacaa cggcagcatc ccccaccaga tccacctggg cgagctgcac 1260
gccatcctgc gccgccagga ggacttctac cccttcctga aggacaaccg cgagaagatc 1320
gagaagatcc tgaccttccg catcccctac tacgtgggcc ccctggcccg cggcaacagc 1380
cgcttcgcct ggatgacccg caagagcgag gagaccatca ccccctggaa cttcgaggag 1440
gtggtggaca agggcgccag cgcccagagc ttcatcgagc gcatgaccaa cttcgacaag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgcgcaagcc cgccttcctg 1620
agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaaccg caaggtgacc 1680
gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740
agcggcgtgg aggaccgctt caacgccagc ctgggcacct accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860
ctgaccctga ccctgttcga ggaccgcgag atgatcgagg agcgcctgaa gacctacgcc 1920
cacctgttcg acgacaaggt gatgaagcag ctgaagcgcc gccgctacac cggctggggc 1980
cgcctgagcc gcaagcttat caacggcatc cgcgacaagc agagcggcaa gaccatcctg 2040
gacttcctga agagcgacgg cttcgccaac cgcaacttca tgcagctgat ccacgacgac 2100
agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160
cacgagcaca tcgccaacct ggccggcagc cccgccatca agaagggcat cctgcagacc 2220
gtgaaggtgg tggacgagct ggtgaaggtg atgggccgcc acaagcccga gaacatcgtg 2280
atcgagatgg cccgcgagaa ccagaccacc cagaagggcc agaagaacag ccgcgagcgc 2340
atgaagcgca tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccc 2400
gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggccgc 2460
gacatgtacg tggaccagga gctggacatc aaccgcctga gcgactacga cgtggaccac 2520
atcgtgcccc agagcttcct gaaggacgac agcatcgaca acaaggtgct gacccgcagc 2580
gacaagaacc gcggcaagag cgacaacgtg cccagcgagg aggtggtgaa gaagatgaag 2640
aactactggc gccagctgct gaacgccaag ctgatcaccc agcgcaagtt cgacaacctg 2700
accaaggccg agcgcggcgg cctgagcgag ctggacaagg ccggcttcat caagcgccag 2760
ctggtggaga cccgccagat caccaagcac gtggcccaga tcctggacag ccgcatgaac 2820
accaagtacg acgagaacga caagctgatc cgcgaggtga aggtgatcac cctgaagagc 2880
aagctggtga gcgacttccg caaggacttc cagttctaca aggtgcgcga gatcaacaac 2940
taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gatcaagaag 3000
taccccaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcgcaag 3060
atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120
aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat ccgcaagcgc 3180
cccctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg ccgcgacttc 3240
gccaccgtgc gcaaggtgct gagcatgccc caggtgaaca tcgtgaagaa gaccgaggtg 3300
cagaccggcg gcttcagcaa ggagagcatc ctgcccaagc gcaacagcga caagctgatc 3360
gcccgcaaga aggactggga ccccaagaag tacggcggct tcgacagccc caccgtggcc 3420
tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480
aaggagctgc tgggcatcac catcatggag cgcagcagct tcgagaagaa ccccatcgac 3540
ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcatcaa gctgcccaag 3600
tacagcctgt tcgagctgga gaacggccgc aagcgcatgc tggccagcgc cggcgagctg 3660
cagaagggca acgagctggc cctgcccagc aagtacgtga acttcctgta cctggccagc 3720
cactacgaga agctgaaggg cagccccgag gacaacgagc agaagcagct gttcgtggag 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagcgcgtg 3840
atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca ccgcgacaag 3900
cccatccgcg agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960
cccgccgcct tcaagtactt cgacaccacc atcgaccgca agcgctacac cagcaccaag 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gtctgtacga gacccgcatc 4080
gacctgagcc agctgggcgg cgactaa 4107
<210> 6
<211> 229
<212> PRT
<213> Artificial Sequence
<220>
<223> APOBEC-1 from Rattus norvegicus
<400> 6
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 7
<211> 5148
<212> DNA
<213> Artificial Sequence
<220>
<223> BE3 coding sequence
<400> 7
catcatcatc atcatcacat gtcttctgaa accggtccgg ttgcggttga cccgaccctg 60
cgtcgtcgta tcgaaccgca cgaattcgaa gttttcttcg acccgcgtga actgcgtaaa 120
gaaacctgcc tgctgtacga aatcaactgg ggtggtcgtc actctatctg gcgtcacacc 180
tctcagaaca ccaacaaaca cgttgaagtt aacttcatcg aaaaattcac caccgaacgt 240
tacttctgcc cgaacacccg ttgctctatc acctggttcc tgtcttggtc tccgtgcggt 300
gaatgctctc gtgcgatcac cgaattcctg tctcgttacc cgcacgttac cctgttcatc 360
tacatcgcgc gtctgtacca ccacgcggac ccgcgtaacc gtcagggtct gcgtgacctg 420
atctcttctg gtgttaccat ccagatcatg accgaacagg aatctggtta ctgctggcgt 480
aacttcgtta actactctcc gtctaacgaa gcgcactggc cgcgttaccc gcacctgtgg 540
gttcgtctgt acgttctgga actgtactgc atcatcctgg gtctgccgcc gtgcctgaac 600
atcctgcgtc gtaaacagcc gcagctgacc ttcttcacca tcgcgctgca gtcttgccac 660
taccagcgtc tgccgccgca catcctgtgg gcgaccggtc tgaaatccgg tagcgaaaca 720
ccggggactt cagaatcggc caccccggag tctgataaga aatactcaat aggcttagct 780
atcggcacaa atagcgtcgg atgggcggtg atcactgatg aatataaggt tccgtctaaa 840
aagttcaagg ttctgggaaa tacagaccgc cacagtatca aaaaaaatct tataggggct 900
cttttatttg acagtggaga gacagcggaa gcgactcgtc tcaaacggac agctcgtaga 960
aggtatacac gtcggaagaa tcgtatttgt tatctacagg agattttttc aaatgagatg 1020
gcgaaagtag atgatagttt ctttcatcga cttgaagagt cttttttggt ggaagaagac 1080
aagaagcatg aacgtcatcc tatttttgga aatatagtag atgaagttgc ttatcatgag 1140
aaatatccaa ctatctatca tctgcgaaaa aaattggtag attctactga taaagcggat 1200
ttgcgcttaa tctatttggc cttagcgcat atgattaagt ttcgtggtca ttttttgatt 1260
gagggagatt taaatcctga taatagtgat gtggacaaac tatttatcca gttggtacaa 1320
acctacaatc aattatttga agaaaaccct attaacgcaa gtggagtaga tgctaaagcg 1380
attctttctg cacgattgag taaatcaaga cgattagaaa atctcattgc tcagctcccc 1440
ggtgagaaga aaaatggctt atttgggaat ctcattgctt tgtcattggg tttgacccct 1500
aattttaaat caaattttga tttggcagaa gatgctaaat tacagctttc aaaagatact 1560
tacgatgatg atttagataa tttattggcg caaattggag atcaatatgc tgatttgttt 1620
ttggcagcta agaatttatc agatgctatt ttactttcag atatcctaag agtaaatact 1680
gaaataacta aggctcccct atcagcttca atgattaaac gctacgatga acatcatcaa 1740
gacttgactc ttttaaaagc tttagttcga caacaacttc cagaaaagta taaagaaatc 1800
ttttttgatc aatcaaaaaa cggatatgca ggttatattg atgggggagc tagccaagaa 1860
gaattttata aatttatcaa accaatttta gaaaaaatgg atggtactga ggaattattg 1920
gtgaaactaa atcgtgaaga tttgctgcgc aagcaacgga cctttgacaa cggctctatt 1980
ccccatcaaa ttcacttggg tgagctgcat gctattttga gaagacaaga agacttttat 2040
ccatttttaa aagacaatcg tgagaagatt gaaaaaatct tgacttttcg aattccttat 2100
tatgttggtc cattggcgcg tggcaatagt cgttttgcat ggatgactcg gaagtctgaa 2160
gaaacaatta ccccatggaa ttttgaagaa gttgtcgata aaggtgcttc agctcaatca 2220
tttattgaac gcatgacaaa ctttgataaa aatcttccaa atgaaaaagt actaccaaaa 2280
catagtttgc tttatgagta ttttacggtt tataacgaat tgacaaaggt caaatatgtt 2340
actgaaggaa tgcgaaaacc agcatttctt tcaggtgaac agaagaaagc cattgttgat 2400
ttactcttca aaacaaatcg aaaagtaacc gttaagcaat taaaagaaga ttatttcaaa 2460
aaaatagaat gttttgatag tgttgaaatt tcaggagttg aagatagatt taatgcttca 2520
ttaggtacct accatgattt gctaaaaatt attaaagata aagatttttt ggataatgaa 2580
gaaaatgaag atatcttaga ggatattgtt ttaacattga ccttatttga agatagggag 2640
atgattgagg aaagacttaa aacatatgct cacctctttg atgataaggt gatgaaacag 2700
cttaaacgtc gccgttatac tggttgggga cgtttgtctc gaaaattgat taatggtatt 2760
agggataagc aatctggcaa aacaatatta gattttttga aatcagatgg ttttgccaat 2820
cgcaatttta tgcagctgat ccatgatgat agtttgacat ttaaagaaga cattcaaaaa 2880
gcacaagtgt ctggacaagg cgatagttta catgaacata ttgcaaattt agctggtagc 2940
cctgctatta aaaaaggtat tttacagact gtaaaagttg ttgatgaatt ggtcaaagta 3000
atggggcggc ataagccaga aaatatcgtt attgaaatgg cacgtgaaaa tcagacaact 3060
caaaagggcc agaaaaattc gcgagagcgt atgaaacgaa tcgaagaagg tatcaaagaa 3120
ttaggaagtc agattcttaa agagcatcct gttgaaaata ctcaattgca aaatgaaaag 3180
ctctatctct attatctcca aaatggaaga gacatgtatg tggaccaaga attagatatt 3240
aatcgtttaa gtgattatga tgtcgatcac attgttccac aaagtttcct taaagacgat 3300
tcaatagaca ataaggtctt aacgcgttct gataaaaatc gtggtaaatc ggataacgtt 3360
ccaagtgaag aagtagtcaa aaagatgaaa aactattgga gacaacttct aaacgccaag 3420
ttaatcactc aacgtaagtt tgataattta acgaaagctg aacgtggagg tttgagtgaa 3480
cttgataaag ctggttttat caaacgccaa ttggttgaaa ctcgccaaat cactaagcat 3540
gtggcacaaa ttttggatag tcgcatgaat actaaatacg atgaaaatga taaacttatt 3600
cgagaggtta aagtgattac cttaaaatct aaattagttt ctgacttccg aaaagatttc 3660
caattctata aagtacgtga gattaacaat taccatcatg cccatgatgc gtatctaaat 3720
gccgtcgttg gaactgcttt gattaagaaa tatccaaaac ttgaatcgga gtttgtctat 3780
ggtgattata aagtttatga tgttcgtaaa atgattgcta agtctgagca agaaataggc 3840
aaagcaaccg caaaatattt cttttactct aatatcatga acttcttcaa aacagaaatt 3900
acacttgcaa atggagagat tcgcaaacgc cctctaatcg aaactaatgg ggaaactgga 3960
gaaattgtct gggataaagg gcgagatttt gccacagtgc gcaaagtatt gtccatgccc 4020
caagtcaata ttgtcaagaa aacagaagta cagacaggcg gattctccaa ggagtcaatt 4080
ttaccaaaaa gaaattcgga caagcttatt gctcgtaaaa aagactggga tccaaaaaaa 4140
tatggtggtt ttgatagtcc aacggtagct tattcagtcc tagtggttgc taaggtggaa 4200
aaagggaaat cgaagaagtt aaaatccgtt aaagagttac tagggatcac aattatggaa 4260
agaagttcct ttgaaaaaaa tccgattgac tttttagaag ctaaaggata taaggaagtt 4320
aaaaaagact taatcattaa actacctaaa tatagtcttt ttgagttaga aaacggtcgt 4380
aaacggatgc tggctagtgc cggagaatta caaaaaggaa atgagctggc tctgccaagc 4440
aaatatgtga attttttata tttagctagt cattatgaaa agttgaaggg tagtccagaa 4500
gataacgaac aaaaacaatt gtttgtggag cagcataagc attatttaga tgagattatt 4560
gagcaaatca gtgaattttc taagcgtgtt attttagcag atgccaattt agataaagtt 4620
cttagtgcat ataacaaaca tagagacaaa ccaatacgtg aacaagcaga aaatattatt 4680
catttattta cgttgacgaa tcttggagct ccagccgcat tcaagtattt tgacacaacg 4740
atagatcgca aacgatacac ttctaccaag gaggtgctag acgcgacact gattcaccaa 4800
tccatcacgg gattatatga aactcggata gatttgtcac agcttggggg tgactctggt 4860
ggttctacta atctgtcaga tattattgaa aaggagaccg gtaagcaact ggttatccag 4920
gaatccatcc tcatgctccc agaggaggtg gaagaagtca ttgggaacaa gccggaaagc 4980
gatatactcg tgcacaccgc ctacgacgag agcaccgacg agaatgtcat gcttctgact 5040
agcgacgccc ctgaatacaa gccttgggct ctggtcatac aggatagcaa cggtgagaac 5100
aagattaaga tgctctctgg tggttctccc aagaagaaga ggaaagtc 5148
<210> 8
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Hisx6
<400> 8
catcatcatc atcatcac 18
<210> 9
<211> 687
<212> DNA
<213> Artificial Sequence
<220>
<223> rAPOBEC1
<400> 9
atgtcttctg aaaccggtcc ggttgcggtt gacccgaccc tgcgtcgtcg tatcgaaccg 60
cacgaattcg aagttttctt cgacccgcgt gaactgcgta aagaaacctg cctgctgtac 120
gaaatcaact ggggtggtcg tcactctatc tggcgtcaca cctctcagaa caccaacaaa 180
cacgttgaag ttaacttcat cgaaaaattc accaccgaac gttacttctg cccgaacacc 240
cgttgctcta tcacctggtt cctgtcttgg tctccgtgcg gtgaatgctc tcgtgcgatc 300
accgaattcc tgtctcgtta cccgcacgtt accctgttca tctacatcgc gcgtctgtac 360
caccacgcgg acccgcgtaa ccgtcagggt ctgcgtgacc tgatctcttc tggtgttacc 420
atccagatca tgaccgaaca ggaatctggt tactgctggc gtaacttcgt taactactct 480
ccgtctaacg aagcgcactg gccgcgttac ccgcacctgt gggttcgtct gtacgttctg 540
gaactgtact gcatcatcct gggtctgccg ccgtgcctga acatcctgcg tcgtaaacag 600
ccgcagctga ccttcttcac catcgcgctg cagtcttgcc actaccagcg tctgccgccg 660
cacatcctgt gggcgaccgg tctgaaa 687
<210> 10
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> XTEN (linker)
<400> 10
tccggtagcg aaacaccggg gacttcagaa tcggccaccc cggagtct 48
<210> 11
<211> 4101
<212> DNA
<213> Artificial Sequence
<220>
<223> coding gene of Cas9 (D10A, nickase)
<400> 11
gataagaaat actcaatagg cttagctatc ggcacaaata gcgtcggatg ggcggtgatc 60
actgatgaat ataaggttcc gtctaaaaag ttcaaggttc tgggaaatac agaccgccac 120
agtatcaaaa aaaatcttat aggggctctt ttatttgaca gtggagagac agcggaagcg 180
actcgtctca aacggacagc tcgtagaagg tatacacgtc ggaagaatcg tatttgttat 240
ctacaggaga ttttttcaaa tgagatggcg aaagtagatg atagtttctt tcatcgactt 300
gaagagtctt ttttggtgga agaagacaag aagcatgaac gtcatcctat ttttggaaat 360
atagtagatg aagttgctta tcatgagaaa tatccaacta tctatcatct gcgaaaaaaa 420
ttggtagatt ctactgataa agcggatttg cgcttaatct atttggcctt agcgcatatg 480
attaagtttc gtggtcattt tttgattgag ggagatttaa atcctgataa tagtgatgtg 540
gacaaactat ttatccagtt ggtacaaacc tacaatcaat tatttgaaga aaaccctatt 600
aacgcaagtg gagtagatgc taaagcgatt ctttctgcac gattgagtaa atcaagacga 660
ttagaaaatc tcattgctca gctccccggt gagaagaaaa atggcttatt tgggaatctc 720
attgctttgt cattgggttt gacccctaat tttaaatcaa attttgattt ggcagaagat 780
gctaaattac agctttcaaa agatacttac gatgatgatt tagataattt attggcgcaa 840
attggagatc aatatgctga tttgtttttg gcagctaaga atttatcaga tgctatttta 900
ctttcagata tcctaagagt aaatactgaa ataactaagg ctcccctatc agcttcaatg 960
attaaacgct acgatgaaca tcatcaagac ttgactcttt taaaagcttt agttcgacaa 1020
caacttccag aaaagtataa agaaatcttt tttgatcaat caaaaaacgg atatgcaggt 1080
tatattgatg ggggagctag ccaagaagaa ttttataaat ttatcaaacc aattttagaa 1140
aaaatggatg gtactgagga attattggtg aaactaaatc gtgaagattt gctgcgcaag 1200
caacggacct ttgacaacgg ctctattccc catcaaattc acttgggtga gctgcatgct 1260
attttgagaa gacaagaaga cttttatcca tttttaaaag acaatcgtga gaagattgaa 1320
aaaatcttga cttttcgaat tccttattat gttggtccat tggcgcgtgg caatagtcgt 1380
tttgcatgga tgactcggaa gtctgaagaa acaattaccc catggaattt tgaagaagtt 1440
gtcgataaag gtgcttcagc tcaatcattt attgaacgca tgacaaactt tgataaaaat 1500
cttccaaatg aaaaagtact accaaaacat agtttgcttt atgagtattt tacggtttat 1560
aacgaattga caaaggtcaa atatgttact gaaggaatgc gaaaaccagc atttctttca 1620
ggtgaacaga agaaagccat tgttgattta ctcttcaaaa caaatcgaaa agtaaccgtt 1680
aagcaattaa aagaagatta tttcaaaaaa atagaatgtt ttgatagtgt tgaaatttca 1740
ggagttgaag atagatttaa tgcttcatta ggtacctacc atgatttgct aaaaattatt 1800
aaagataaag attttttgga taatgaagaa aatgaagata tcttagagga tattgtttta 1860
acattgacct tatttgaaga tagggagatg attgaggaaa gacttaaaac atatgctcac 1920
ctctttgatg ataaggtgat gaaacagctt aaacgtcgcc gttatactgg ttggggacgt 1980
ttgtctcgaa aattgattaa tggtattagg gataagcaat ctggcaaaac aatattagat 2040
tttttgaaat cagatggttt tgccaatcgc aattttatgc agctgatcca tgatgatagt 2100
ttgacattta aagaagacat tcaaaaagca caagtgtctg gacaaggcga tagtttacat 2160
gaacatattg caaatttagc tggtagccct gctattaaaa aaggtatttt acagactgta 2220
aaagttgttg atgaattggt caaagtaatg gggcggcata agccagaaaa tatcgttatt 2280
gaaatggcac gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg 2340
aaacgaatcg aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt 2400
gaaaatactc aattgcaaaa tgaaaagctc tatctctatt atctccaaaa tggaagagac 2460
atgtatgtgg accaagaatt agatattaat cgtttaagtg attatgatgt cgatcacatt 2520
gttccacaaa gtttccttaa agacgattca atagacaata aggtcttaac gcgttctgat 2580
aaaaatcgtg gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac 2640
tattggagac aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg 2700
aaagctgaac gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg 2760
gttgaaactc gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact 2820
aaatacgatg aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa 2880
ttagtttctg acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac 2940
catcatgccc atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat 3000
ccaaaacttg aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg 3060
attgctaagt ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat 3120
atcatgaact tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct 3180
ctaatcgaaa ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc 3240
acagtgcgca aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag 3300
acaggcggat tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct 3360
cgtaaaaaag actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat 3420
tcagtcctag tggttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa 3480
gagttactag ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt 3540
ttagaagcta aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat 3600
agtctttttg agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa 3660
aaaggaaatg agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat 3720
tatgaaaagt tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag 3780
cataagcatt atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt 3840
ttagcagatg ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca 3900
atacgtgaac aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctcca 3960
gccgcattca agtattttga cacaacgata gatcgcaaac gatacacttc taccaaggag 4020
gtgctagacg cgacactgat tcaccaatcc atcacgggat tatatgaaac tcggatagat 4080
ttgtcacagc ttgggggtga c 4101
<210> 12
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> NLS
<400> 12
cccaagaaga agaggaaagt c 21
<210> 13
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> linker
<400> 13
tctggtggtt ct 12
<210> 14
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1 on-target sequence
<400> 14
gagtccgagc agaagaagaa ggg 23
<210> 15
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> 1st PCR forward primer for targeted deep sequencing
<400> 15
agtgttgagg ccccagtg 18
<210> 16
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> 1st PCR reverse primer for targeted deep sequencing
<400> 16
gtgactggag ttcagacgtg tgctcttccg atctcagcag caagcagcac tct 53
<210> 17
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> 2nd PCR forward primer for targeted deep sequencing
<400> 17
acactctttc cctacacgac gctcttccga tctgggcctc ctgagtttct cat 53
<210> 18
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> 2nd PCR reverse primer for targeted deep sequencing
<400> 18
gtgactggag ttcagacgtg tgctcttccg atctcagcag caagcagcac tct 53
<210> 19
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-002 off-target sequence
<400> 19
gaatccaaga gaagaagaat gg 22
<210> 20
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-003 off-target sequence
<400> 20
gaggccgagc agaagaaaga cgg 23
<210> 21
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-004 off-target sequence
<400> 21
gaatccaagc agaagaagag aag 23
<210> 22
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-005 off-target sequence
<400> 22
gagtcctagc aggagaagaa gag 23
<210> 23
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-006 off-target sequence
<400> 23
gagtctaagc agaagaagaa gag 23
<210> 24
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-007 off-target sequence
<400> 24
gagtccaagc agtagaggaa ggg 23
<210> 25
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-008 off-target sequence
<400> 25
acgtctgagc agaagaagaa tgg 23
<210> 26
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-009 off-target sequence
<400> 26
aagtctgagc acaagaagaa tgg 23
<210> 27
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-010 off-target sequence
<400> 27
gtgtcctaga gaagaagaag gg 22
<210> 28
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-011 off-target sequence
<400> 28
gagttagagc agaagaagaa agg 23
<210> 29
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-012 off-target sequence
<400> 29
gagacagaga gaagaagaat gg 22
<210> 30
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-013 off-target sequence
<400> 30
gagcctgagc ggaagaggaa agg 23
<210> 31
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-014 off-target sequence
<400> 31
aatacagagc agaagaagaa tgg 23
<210> 32
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-015 off-target sequence
<400> 32
agtccagagc aaaataagaa ggg 23
<210> 33
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-016 off-target sequence
<400> 33
gagcctgagc agaaggagaa ggg 23
<210> 34
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-017 off-target sequence
<400> 34
gaagaagagc aaaagaagaa ggg 23
<210> 35
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-018 off-target sequence
<400> 35
gtgacagagc aaaagaagaa agg 23
<210> 36
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-019 off-target sequence
<400> 36
gaagaggagc aaaagaagaa ggg 23
<210> 37
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-020 off-target sequence
<400> 37
aagtccagac agaagaagaa gga 23
<210> 38
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-021 off-target sequence
<400> 38
aaatccaacc agaagaagaa agg 23
<210> 39
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-022 off-target sequence
<400> 39
gttcaagagc aggagaagaa ggg 23
<210> 40
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-023 off-target sequence
<400> 40
gagtaagaga agaagaagaa ggg 23
<210> 41
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-024 off-target sequence
<400> 41
aagcccgagc aaaggaagaa agg 23
<210> 42
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-025 off-target sequence
<400> 42
cctatagagc aaaagaagaa agg 23
<210> 43
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-026 off-target sequence
<400> 43
gatcaagaga agaagaagaa ggg 23
<210> 44
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-027 off-target sequence
<400> 44
caaaaagagc aaaagaagaa cgg 23
<210> 45
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-028 off-target sequence
<400> 45
tacagtgagc aaaagaagaa ggg 23
<210> 46
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-029 off-target sequence
<400> 46
gttcaagagc aggagaagaa ggg 23
<210> 47
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-030 off-target sequence
<400> 47
ttctcagagc aaaagaagaa tgg 23
<210> 48
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-031 off-target sequence
<400> 48
ctttgccagg agaaggacat tgc 23
<210> 49
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-032 off-target sequence
<400> 49
aggttagagc aaaagaagaa agg 23
<210> 50
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-033 off-target sequence
<400> 50
tatacggagc agaagaagaa tgg 23
<210> 51
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-034 off-target sequence
<400> 51
gagtccacac agaagaagaa aga 23
<210> 52
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-035 off-target sequence
<400> 52
gaatccaagc aggagaagaa gga 23
<210> 53
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-036 off-target sequence
<400> 53
aagtccatgc agaagaggaa ggg 23
<210> 54
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-037 off-target sequence
<400> 54
aagtccgagg agaggaagaa agg 23
<210> 55
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-038 off-target sequence
<400> 55
aagtccaagt gaagaagaaa gg 22
<210> 56
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-039 off-target sequence
<400> 56
gagaacgaga agaaagagga gag 23
<210> 57
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-040 off-target sequence
<400> 57
gagagagaga gagagaggga ggg 23
<210> 58
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-041 off-target sequence
<400> 58
ctggcagagc aaaagaagag ggg 23
<210> 59
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-042 off-target sequence
<400> 59
tcatccaagc agaagaagaa gag 23
<210> 60
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-043 off-target sequence
<400> 60
gtacaggagc aggagaagaa tgg 23
<210> 61
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-044 off-target sequence
<400> 61
aagaaggaga agaagaagaa ggg 23
<210> 62
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-045 off-target sequence
<400> 62
gagagagaga gagagagaaa ggg 23
<210> 63
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-046 off-target sequence
<400> 63
gagccggagc agaagaagga ggg 23
<210> 64
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-047 off-target sequence
<400> 64
gagggagaga gggagagaga aag 23
<210> 65
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-048 off-target sequence
<400> 65
ttatctccga gaaggaagaa ggg 23
<210> 66
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-049 off-target sequence
<400> 66
gattctgtcc cgaatcagaa ggg 23
<210> 67
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-050 off-target sequence
<400> 67
atgcaagaga agaagaagaa agg 23
<210> 68
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-051 off-target sequence
<400> 68
agcagggagc agaggaagaa tgg 23
<210> 69
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-052 off-target sequence
<400> 69
gagaaggaga agaagaagaa ggg 23
<210> 70
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-053 off-target sequence
<400> 70
actctagagc agaaaaagaa tgg 23
<210> 71
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-054 off-target sequence
<400> 71
gaggaggagg aggaggaagg agg 23
<210> 72
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-055 off-target sequence
<400> 72
aaagaggaga agaagaagaa ggg 23
<210> 73
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-056 off-target sequence
<400> 73
ggggaggagc agaagaagag agg 23
<210> 74
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-057 off-target sequence
<400> 74
aggccgaggc aggagaatag gag 23
<210> 75
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-058 off-target sequence
<400> 75
gagaaggagc agaaaaagaa tgg 23
<210> 76
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-059 off-target sequence
<400> 76
acagtagagc agaagaagac tgg 23
<210> 77
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-060 off-target sequence
<400> 77
atccaagagc aggagaagaa ggg 23
<210> 78
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-061 off-target sequence
<400> 78
ataagagagc aaaagaagaa agg 23
<210> 79
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-062 off-target sequence
<400> 79
gagagagaga gagagagaaa cgg 23
<210> 80
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-063 off-target sequence
<400> 80
gagaaggaga agaaggagaa gag 23
<210> 81
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-064 off-target sequence
<400> 81
aagaagaaga agaagaagaa gag 23
<210> 82
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-065 off-target sequence
<400> 82
tttcgggagc agaagaagaa cag 23
<210> 83
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-066 off-target sequence
<400> 83
atcacagagc aggagaagaa ggg 23
<210> 84
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-067 off-target sequence
<400> 84
aaacaggagc agaggaagaa ggg 23
<210> 85
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-068 off-target sequence
<400> 85
aagaagagga agaggaggaa aag 23
<210> 86
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-069 off-target sequence
<400> 86
gaaatggaga agaagaagaa ggg 23
<210> 87
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-070 off-target sequence
<400> 87
gagagagaaa gaaagaaaaa gga 23
<210> 88
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-071 off-target sequence
<400> 88
gctgtggagc aaaagaagaa agg 23
<210> 89
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-072 off-target sequence
<400> 89
gaggaggagc agaagaagaa aag 23
<210> 90
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-073 off-target sequence
<400> 90
taaaaggagc agaaaaagaa ggg 23
<210> 91
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-074 off-target sequence
<400> 91
taccttgagc aaaagaagaa ggg 23
<210> 92
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-075 off-target sequence
<400> 92
aagaaggaga agaagaagaa ggg 23
<210> 93
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-076 off-target sequence
<400> 93
gcaggagagc agaagaagaa agg 23
<210> 94
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-077 off-target sequence
<400> 94
aagagcgaga ttaagaggaa tgg 23
<210> 95
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-078 off-target sequence
<400> 95
aagaaaggag aggagaggag agg 23
<210> 96
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-079 off-target sequence
<400> 96
agtagtgagc agaagaagat agg 23
<210> 97
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-080 off-target sequence
<400> 97
aagaaggaga agaagaagaa gag 23
<210> 98
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-081 off-target sequence
<400> 98
gagagagaga gagagagaaa gag 23
<210> 99
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-082 off-target sequence
<400> 99
ggccaggagc aggagaagaa ggg 23
<210> 100
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-083 off-target sequence
<400> 100
agaggagagc agaagaagga tgg 23
<210> 101
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-084 off-target sequence
<400> 101
aagaaggaga agaagaagga gga 23
<210> 102
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-085 off-target sequence
<400> 102
cattaagagc aggagaagaa ggg 23
<210> 103
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-086 off-target sequence
<400> 103
cgctgataca gaaagaagaa tgg 23
<210> 104
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-087 off-target sequence
<400> 104
gaagtggagc aggagaagaa ggg 23
<210> 105
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-088 off-target sequence
<400> 105
tttgtggagc agaaaaagaa agg 23
<210> 106
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-089 off-target sequence
<400> 106
aagtcagagg agaagaagaa ggg 23
<210> 107
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-090 off-target sequence
<400> 107
aaagctgagc agaaaaagaa ggg 23
<210> 108
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-091 off-target sequence
<400> 108
gcagtggagc agaagaagat ggg 23
<210> 109
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-092 off-target sequence
<400> 109
acaaaagagc agaggaagaa agg 23
<210> 110
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-093 off-target sequence
<400> 110
gaagtagagc agaagaagaa gcg 23
<210> 111
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-094 off-target sequence
<400> 111
aaagagggag agaagaagaa ggg 23
<210> 112
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-095 off-target sequence
<400> 112
aagaaggaga agaagaagaa gag 23
<210> 113
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-096 off-target sequence
<400> 113
aaggccaagc agaagagtaa tgg 23
<210> 114
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-097 off-target sequence
<400> 114
acacaagagc agaagaagaa aga 23
<210> 115
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-098 off-target sequence
<400> 115
gccaatgagc aggagaagaa ggg 23
<210> 116
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-099 off-target sequence
<400> 116
catatagagc aaaagaagag agg 23
<210> 117
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-100 off-target sequence
<400> 117
gaggtggagg ggaagaggga agg 23
<210> 118
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-101 off-target sequence
<400> 118
gagagagaga gagagagaaa ggg 23
<210> 119
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-102 off-target sequence
<400> 119
aaggaggaga agaagaagaa ggg 23
<210> 120
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-103 off-target sequence
<400> 120
gagggagaga gagagagaga aag 23
<210> 121
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-104 off-target sequence
<400> 121
agtcgggagc aggagaagaa agg 23
<210> 122
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-105 off-target sequence
<400> 122
gttcaagagc agaagaagaa tgg 23
<210> 123
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-106 off-target sequence
<400> 123
tctaaagagc agaaaaagaa agg 23
<210> 124
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-107 off-target sequence
<400> 124
actgatgagc agaagaagaa agg 23
<210> 125
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-108 off-target sequence
<400> 125
aagaaggaga agaagaagga gga 23
<210> 126
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-109 off-target sequence
<400> 126
aggaaaagag agaagaagaa ggg 23
<210> 127
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-110 off-target sequence
<400> 127
gaggaggaga agaagaagaa ggg 23
<210> 128
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-111 off-target sequence
<400> 128
gagagagaga gagagagaaa ggg 23
<210> 129
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-112 off-target sequence
<400> 129
gaggccgaag ctgaggtggg agg 23
<210> 130
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-113 off-target sequence
<400> 130
gagcccaaga agaagaagaa gga 23
<210> 131
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-114 off-target sequence
<400> 131
atgtacagag agaagaagaa agg 23
<210> 132
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-115 off-target sequence
<400> 132
gccttcagag agaagaagaa tgg 23
<210> 133
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-116 off-target sequence
<400> 133
ggagtagagc agaggaagaa ggg 23
<210> 134
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-117 off-target sequence
<400> 134
gaagtagagc agaagaagaa gcg 23
<210> 135
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-118 off-target sequence
<400> 135
gctcctgagc agaagaagaa cag 23
<210> 136
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-119 off-target sequence
<400> 136
agttcagagc aggagaagaa tgg 23
<210> 137
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-120 off-target sequence
<400> 137
atgaacagag agaagaagaa tgg 23
<210> 138
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-121 off-target sequence
<400> 138
gagagcgaga gagagagaga ggg 23
<210> 139
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-122 off-target sequence
<400> 139
aaaaaggagc agaagaagaa gga 23
<210> 140
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-123 off-target sequence
<400> 140
ttctccaagc agaagaagaa gag 23
<210> 141
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-124 off-target sequence
<400> 141
gagagagaga gagagagaaa ggg 23
<210> 142
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-125 off-target sequence
<400> 142
ttggaaagag agaagaagaa ggg 23
<210> 143
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-126 off-target sequence
<400> 143
aagaggaaga agaagaagaa gag 23
<210> 144
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-127 off-target sequence
<400> 144
gagagagaga aagagaaaga gag 23
<210> 145
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-128 off-target sequence
<400> 145
gaagaagaga agaagaagaa ggg 23
<210> 146
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-129 off-target sequence
<400> 146
gattctgaga aaattaagat ggg 23
<210> 147
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-130 off-target sequence
<400> 147
gggctccggc agaagatgcc atg 23
<210> 148
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-131 off-target sequence
<400> 148
gattccaagc aatggaggag ggg 23
<210> 149
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-132 off-target sequence
<400> 149
gtccaagagc aggagaagaa ggg 23
<210> 150
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-133 off-target sequence
<400> 150
atctgggagc aggagaagaa ggg 23
<210> 151
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-134 off-target sequence
<400> 151
gaggatccga ggatgtagaa ggg 23
<210> 152
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-135 off-target sequence
<400> 152
gaagaagaag aaagaaagaa aga 23
<210> 153
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-136 off-target sequence
<400> 153
cagagagaga ataagtagca tag 23
<210> 154
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-137 off-target sequence
<400> 154
tgaggaagag agaagaagaa agg 23
<210> 155
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-138 off-target sequence
<400> 155
caagcatgag agaagaagat ggg 23
<210> 156
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-139 off-target sequence
<400> 156
gagcacgagc aagagaagaa ggg 23
<210> 157
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-140 off-target sequence
<400> 157
gagtcccagc aaaagaagaa aag 23
<210> 158
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-141 off-target sequence
<400> 158
gagtccctca ggagaagaaa gg 22
<210> 159
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> EMX1-142 off-target sequence
<400> 159
gagtccttga gaagaaggaa gg 22
Claims (15)
- 삭제
- (i) 시티딘 디아미나제 또는 이의 암호화 유전자, 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자, 및 가이드 RNA 또는 이의 암호화 유전자를 세포에 도입하거나 세포로부터 분리된 DNA에 접촉시켜 DNA 단일 가닥 절단을 유도하는 단계;
(ii) 상기 단일 가닥 절단된 DNA 절편의 핵산 서열을 분석하는 단계; 및
(iii) 상기 분석에 의여 수득된 핵산 서열 데이터로부터 단일 가닥 절단 위치를 확인하는 단계
를 포함하고,
상기 불활성화된 표적특이적 엔도뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실한 Cas9 단백질 또는 Cpf1 단백질이고,
상기 단일 가닥 절단 위치를 확인하는 단계는 상기 단일 가닥 절단된 DNA 절편을 수직 정렬하여 동일한 5' 말단을 갖는 서열 리드의 수가 5개 이상이고, %([동일한 5' 말단을 갖는 서열 리드의 개수]/[특정 위치에서의 sequence reads 개수])가 10% 이상인 위치에 대하여 수행하는 것이고,
시험관 내 (in vitro)에서 수행되고,
단계 (i)의 세포로부터 분리된 DNA는 유전체 DNA이고,
단계 (ii)의 핵산 서열 분석은 전체 유전체 시퀀싱에 의하여 수행되는 것인,
시티딘 디아미나제의 염기 교정 위치 확인 방법. - (i) 시티딘 디아미나제 또는 이의 암호화 유전자, 불활성화된 표적특이적 엔도뉴클레아제 또는 이의 암호화 유전자, 및 가이드 RNA 또는 이의 암호화 유전자를 세포에 도입하거나 세포로부터 분리된 DNA에 접촉시켜 DNA 단일 가닥 절단을 유도하는 단계;
(ii) 상기 단일 가닥 절단된 DNA 절편의 핵산 서열을 분석하는 단계; 및
(iii) 상기 분석에 의여 수득된 핵산 서열 데이터로부터 단일 가닥 절단 위치를 확인하는 단계
를 포함하고,
상기 불활성화된 표적특이적 엔도뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실한 Cas9 단백질 또는 Cpf1 단백질이고,
상기 단일 가닥 절단 위치를 확인하는 단계는 상기 단일 가닥 절단된 DNA 절편을 수직 정렬하여 동일한 5' 말단을 갖는 서열 리드의 수가 5개 이상이고, %([동일한 5' 말단을 갖는 서열 리드의 개수]/[특정 위치에서의 sequence reads 개수])가 10% 이상인 위치에 대하여 수행하는 것이고,
시험관 내 (in vitro)에서 수행되고,
단계 (i)의 세포로부터 분리된 DNA는 유전체 DNA이고,
단계 (ii)의 핵산 서열 분석은 전체 유전체 시퀀싱에 의하여 수행되는 것인,
시티딘 디아미나제의 비표적 위치 (off-target site) 확인 방법. - 제2항 또는 제3항에 있어서, 상기 불활성화된 표적특이적 엔도뉴클레아제는 스트렙토코커스 피요젠스 (Streptococcus pyogenes) 유래의 Cas9 단백질의,
(1) D10, H840, 또는 D10 및 H840;
(2) D1135, R1335, 및 T1337로 이루어진 군에서 선택된 하나 이상; 또는
(3) 상기 (1) 및 (2)의 아미노산 잔기 모두
가 야생형과 다른 아미노산으로 치환된 것인, 방법. - 제2항 또는 제3항에 있어서, 상기 가이드 RNA는 CRISPR RNA (crRNA) 및 trans-activating crRNA (tracrRNA)를 포함하는 이중 RNA, 또는 단일 가이드 RNA (sgRNA)인, 방법.
- 제2항 또는 제3항에 있어서, 상기 시티딘 디아미나제는 APOBEC (apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like), AID (activation-induced cytidine deaminase), CDA (cytidine deaminase), 또는 이들이 조합인, 방법.
- 제2항 또는 제3항에 있어서, 상기 시티딘 디아미나제 및 불활성화된 표적특이적 엔도뉴클레아제는
융합단백질 형태,
시티딘 디아미나제 또는 이를 암호화하는 mRNA와, 불활성화된 표적특이적 엔도뉴클레아제 또는 이를 암호화하는 mRNA의 혼합물 형태, 또는
시티딘 디아미나제 암호화 유전자와 불활성화된 표적특이적 엔도뉴클레아제 암호화 유전자를 각각 또는 함께 포함하는 플라스미드 형태
로 사용되는 것인, 방법 - 제2항 또는 제3항에 있어서, 우라실-특이적 제거 시약 (Uracil-Specific Excision Reagent; USER)를 사용하지 않고,
상기 우라실-특이적 제거 시약은 우라실 DNA 글라이코실라제 (Uracil DNA glycosylase; UDG), 엔도뉴클레아제 VIII, 및 이들의 조합인,
방법. - 제2항 또는 제3항에 있어서, 상기 단일 가닥 절단 위치를 확인하는 단계는 상기 단일 가닥 절단된 DNA 절편을 수직 정렬하여 동일한 5' 말단을 갖는 서열 리드의 수가 10개 이상이고, %([동일한 5' 말단을 갖는 서열 리드의 개수]/[특정 위치에서의 sequence reads 개수])가 20% 이상인 위치에 대하여 수행하는 것인,
방법. - 삭제
- 삭제
- 제3항에 있어서, 상기 단계 (iii) 이후에,
(iv) 상기 절단 위치가 표적 위치 (on-target site)가 아닌 경우, 비표적 위치 (off-target site)로 확인하는 단계를 추가로 포함하는, 방법. - 삭제
- 삭제
- 제12항에 있어서,
상기 비표적 위치는 다음 중 하나 이상에 해당하는 것인, 방법:
DNA 절편 중 절단이 일어난 가닥과 상보적 가닥이 PAM 서열을 포함;
DNA 절편 중 절단이 일어난 가닥과 상보적 가닥이 표적 위치의 서열과 15개 이하의 불일치 뉴클레오타이드를 포함; 및
DNA 절편 중 절단이 일어난 가닥과 상보적 가닥이 하나 이상의 시토신(C)의 우라실(U) 또는 티민 (T)으로의 변환을 포함.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762446951P | 2017-01-17 | 2017-01-17 | |
US62/446,951 | 2017-01-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180084671A KR20180084671A (ko) | 2018-07-25 |
KR102084186B1 true KR102084186B1 (ko) | 2020-03-03 |
Family
ID=62908205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180005709A KR102084186B1 (ko) | 2017-01-17 | 2018-01-16 | Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20180258418A1 (ko) |
EP (1) | EP3572525A4 (ko) |
JP (1) | JP2020505062A (ko) |
KR (1) | KR102084186B1 (ko) |
CN (1) | CN110234770A (ko) |
WO (1) | WO2018135838A2 (ko) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3613852A3 (en) | 2011-07-22 | 2020-04-22 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US9068179B1 (en) | 2013-12-12 | 2015-06-30 | President And Fellows Of Harvard College | Methods for correcting presenilin point mutations |
AU2015298571B2 (en) | 2014-07-30 | 2020-09-03 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
CN108513575A (zh) | 2015-10-23 | 2018-09-07 | 哈佛大学的校长及成员们 | 核碱基编辑器及其用途 |
WO2018027078A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harard College | Adenosine nucleobase editors and uses thereof |
CA3033327A1 (en) | 2016-08-09 | 2018-02-15 | President And Fellows Of Harvard College | Programmable cas9-recombinase fusion proteins and uses thereof |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
KR20240007715A (ko) | 2016-10-14 | 2024-01-16 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 핵염기 에디터의 aav 전달 |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
JP2020510439A (ja) | 2017-03-10 | 2020-04-09 | プレジデント アンド フェローズ オブ ハーバード カレッジ | シトシンからグアニンへの塩基編集因子 |
SG11201908658TA (en) | 2017-03-23 | 2019-10-30 | Harvard College | Nucleobase editors comprising nucleic acid programmable dna binding proteins |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
US11732274B2 (en) | 2017-07-28 | 2023-08-22 | President And Fellows Of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE) |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
CN109295186B (zh) * | 2018-09-30 | 2023-10-03 | 中山大学 | 一种基于全基因组测序检测腺嘌呤单碱基编辑***脱靶效应的方法及其在基因编辑中的应用 |
CN110804628B (zh) * | 2019-02-28 | 2023-05-12 | 中国科学院脑科学与智能技术卓越创新中心 | 高特异性无脱靶单碱基基因编辑工具 |
DE112020001342T5 (de) | 2019-03-19 | 2022-01-13 | President and Fellows of Harvard College | Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen |
US20220228133A1 (en) * | 2019-05-22 | 2022-07-21 | Toolgen Incorporated | Single base substitution protein, and composition comprising same |
CN114867852A (zh) * | 2019-10-30 | 2022-08-05 | 成对植物服务股份有限公司 | V型crispr-cas碱基编辑器及其使用方法 |
WO2021108717A2 (en) * | 2019-11-26 | 2021-06-03 | The Broad Institute, Inc | Systems and methods for evaluating cas9-independent off-target editing of nucleic acids |
WO2021175287A1 (zh) * | 2020-03-04 | 2021-09-10 | 中国科学院遗传与发育生物学研究所 | 检测单碱基编辑***随机脱靶效应的方法 |
KR20230002481A (ko) * | 2020-04-24 | 2023-01-05 | 기초과학연구원 | Cas9 또는 cas9 변이체를 이용한 유전체 교정 |
EP4146804A1 (en) | 2020-05-08 | 2023-03-15 | The Broad Institute Inc. | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
WO2022056301A1 (en) * | 2020-09-11 | 2022-03-17 | Metagenomi Ip Technologies, Llc | Base editing enzymes |
WO2023132704A1 (ko) * | 2022-01-07 | 2023-07-13 | 주식회사 툴젠 | 유전자 편집 과정에서 발생 가능한 오프 타겟을 예측하는 방법 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100080068A (ko) * | 2008-12-31 | 2010-07-08 | 주식회사 툴젠 | 신규한 징크 핑거 뉴클레아제 및 이의 용도 |
CA2907198C (en) * | 2013-03-15 | 2019-12-10 | The General Hospital Corporation | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing |
WO2014186686A2 (en) * | 2013-05-17 | 2014-11-20 | Two Blades Foundation | Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases |
EP4245853A3 (en) * | 2013-06-17 | 2023-10-18 | The Broad Institute, Inc. | Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation |
US9737604B2 (en) * | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9068179B1 (en) * | 2013-12-12 | 2015-06-30 | President And Fellows Of Harvard College | Methods for correcting presenilin point mutations |
CN111471674A (zh) * | 2014-03-05 | 2020-07-31 | 国立大学法人神户大学 | 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体 |
AU2015298571B2 (en) * | 2014-07-30 | 2020-09-03 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
JP6621820B2 (ja) * | 2014-11-14 | 2019-12-18 | インスティチュート フォー ベーシック サイエンスInstitute For Basic Science | ゲノムでプログラマブルヌクレアーゼの非標的位置を検出する方法 |
CN105647968B (zh) * | 2016-02-02 | 2019-07-23 | 浙江大学 | 一种CRISPR/Cas9工作效率快速测试***及其应用 |
KR102026421B1 (ko) * | 2016-09-13 | 2019-09-27 | 주식회사 툴젠 | 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법 |
GB2572918B (en) * | 2016-12-23 | 2023-02-15 | Harvard College | Gene editing of PCSK9 |
WO2018117746A1 (ko) * | 2016-12-23 | 2018-06-28 | 기초과학연구원 | 동물 배아의 염기 교정용 조성물 및 염기 교정 방법 |
-
2018
- 2018-01-16 JP JP2019559249A patent/JP2020505062A/ja active Pending
- 2018-01-16 EP EP18741209.3A patent/EP3572525A4/en not_active Withdrawn
- 2018-01-16 KR KR1020180005709A patent/KR102084186B1/ko active IP Right Grant
- 2018-01-16 WO PCT/KR2018/000747 patent/WO2018135838A2/ko unknown
- 2018-01-16 US US15/872,907 patent/US20180258418A1/en not_active Abandoned
- 2018-01-16 CN CN201880007380.8A patent/CN110234770A/zh active Pending
Non-Patent Citations (2)
Title |
---|
nature. vol.533, pp.420~433(2016)* |
PLOS Pathogens, vol.9(5), e1003361(2013)* |
Also Published As
Publication number | Publication date |
---|---|
WO2018135838A3 (ko) | 2018-12-06 |
US20180258418A1 (en) | 2018-09-13 |
WO2018135838A2 (ko) | 2018-07-26 |
JP2020505062A (ja) | 2020-02-20 |
CN110234770A (zh) | 2019-09-13 |
EP3572525A2 (en) | 2019-11-27 |
KR20180084671A (ko) | 2018-07-25 |
EP3572525A4 (en) | 2020-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102084186B1 (ko) | Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법 | |
KR102026421B1 (ko) | 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법 | |
RU2713328C2 (ru) | Гибридные днк/рнк-полинуклеотиды crispr и способы применения | |
CN102796728B (zh) | 用于通过转座酶的dna片段化和标记的方法和组合物 | |
CN113373130B (zh) | Cas12蛋白、含有Cas12蛋白的基因编辑***及应用 | |
KR102210700B1 (ko) | 아데노신 디아미나아제를 이용한 염기 교정 확인 방법 | |
WO2023039436A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
WO2024112441A1 (en) | Double-stranded dna deaminases and uses thereof | |
CN109337904B (zh) | 基于C2c1核酸酶的基因组编辑***和方法 | |
CN113583999B (zh) | Cas9蛋白、含有Cas9蛋白的基因编辑***及应用 | |
CN116410955B (zh) | 两种新型核酸内切酶及其在核酸检测中的应用 | |
CN109868271B (zh) | 利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法 | |
KR102067810B1 (ko) | 크로마틴 dna를 이용한 유전체 서열분석 방법 및 유전체 교정 확인 방법 | |
WO2023076952A1 (en) | Enzymes with hepn domains | |
WO2021187554A1 (ja) | 耐熱性ミスマッチエンドヌクレアーゼ変異体 | |
CN110438103B (zh) | 一种新型高效的常温ii型限制性内切酶 | |
WO2023039434A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
WO2023039438A1 (en) | Systems, compositions, and methods involving retrotransposons and functional fragments thereof | |
WO2023039377A1 (en) | Class ii, type v crispr systems | |
KR20230083164A (ko) | 연녹색 구피색 양파 판별용 조성물 및 이를 이용한 판별방법 | |
US20070202508A1 (en) | Novel thermophilic proteins and the nucleic acids encoding them | |
CN116804190A (zh) | SlugCas9突变体蛋白及其相关应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |