CN115244176A - 向导rna-cas蛋白复合物的缀合物 - Google Patents
向导rna-cas蛋白复合物的缀合物 Download PDFInfo
- Publication number
- CN115244176A CN115244176A CN202080073024.3A CN202080073024A CN115244176A CN 115244176 A CN115244176 A CN 115244176A CN 202080073024 A CN202080073024 A CN 202080073024A CN 115244176 A CN115244176 A CN 115244176A
- Authority
- CN
- China
- Prior art keywords
- guide rna
- conjugate
- cas protein
- dna
- complex
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010085220 Multiprotein Complexes Proteins 0.000 title description 3
- 102000007474 Multiprotein Complexes Human genes 0.000 title description 3
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 212
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 171
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 98
- 108091028113 Trans-activating crRNA Proteins 0.000 claims abstract description 74
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 58
- 239000013603 viral vector Substances 0.000 claims abstract description 58
- 238000000034 method Methods 0.000 claims abstract description 42
- 239000003446 ligand Substances 0.000 claims abstract description 35
- 239000000203 mixture Substances 0.000 claims abstract description 35
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 34
- 150000002632 lipids Chemical class 0.000 claims abstract description 34
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 29
- 229920000642 polymer Polymers 0.000 claims abstract description 25
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 23
- 229920001184 polypeptide Polymers 0.000 claims abstract description 21
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 16
- 235000018102 proteins Nutrition 0.000 claims description 165
- 108020004414 DNA Proteins 0.000 claims description 139
- 108091033409 CRISPR Proteins 0.000 claims description 136
- 239000002773 nucleotide Substances 0.000 claims description 85
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 70
- 125000003729 nucleotide group Chemical group 0.000 claims description 49
- 238000010362 genome editing Methods 0.000 claims description 41
- 125000005647 linker group Chemical group 0.000 claims description 38
- 230000021615 conjugation Effects 0.000 claims description 37
- -1 glycans Polymers 0.000 claims description 34
- 102000053602 DNA Human genes 0.000 claims description 32
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 30
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 29
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 26
- 230000003612 virological effect Effects 0.000 claims description 26
- 150000004676 glycans Chemical class 0.000 claims description 25
- 230000008685 targeting Effects 0.000 claims description 24
- 108010042407 Endonucleases Proteins 0.000 claims description 22
- 229920001282 polysaccharide Polymers 0.000 claims description 21
- 239000005017 polysaccharide Substances 0.000 claims description 21
- 108020003175 receptors Proteins 0.000 claims description 21
- 150000007523 nucleic acids Chemical class 0.000 claims description 20
- 102000039446 nucleic acids Human genes 0.000 claims description 19
- 108020004707 nucleic acids Proteins 0.000 claims description 19
- 230000000295 complement effect Effects 0.000 claims description 18
- 229910052740 iodine Inorganic materials 0.000 claims description 17
- 125000000217 alkyl group Chemical group 0.000 claims description 16
- 238000003776 cleavage reaction Methods 0.000 claims description 16
- 239000003814 drug Substances 0.000 claims description 16
- 230000035772 mutation Effects 0.000 claims description 16
- 230000007017 scission Effects 0.000 claims description 16
- 239000012096 transfection reagent Substances 0.000 claims description 16
- 108091023037 Aptamer Proteins 0.000 claims description 15
- 241001465754 Metazoa Species 0.000 claims description 15
- 239000007864 aqueous solution Substances 0.000 claims description 15
- 229940035893 uracil Drugs 0.000 claims description 15
- 238000012937 correction Methods 0.000 claims description 14
- 230000014509 gene expression Effects 0.000 claims description 14
- 239000013612 plasmid Substances 0.000 claims description 14
- 238000007385 chemical modification Methods 0.000 claims description 13
- 235000018417 cysteine Nutrition 0.000 claims description 13
- 229940113082 thymine Drugs 0.000 claims description 13
- 230000002457 bidirectional effect Effects 0.000 claims description 12
- 101150038500 cas9 gene Proteins 0.000 claims description 11
- 108020004705 Codon Proteins 0.000 claims description 10
- 241000725303 Human immunodeficiency virus Species 0.000 claims description 10
- 230000005782 double-strand break Effects 0.000 claims description 10
- 238000003780 insertion Methods 0.000 claims description 10
- 230000037431 insertion Effects 0.000 claims description 10
- 230000033616 DNA repair Effects 0.000 claims description 9
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 9
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 9
- 108020005202 Viral DNA Proteins 0.000 claims description 9
- 241000700605 Viruses Species 0.000 claims description 9
- 125000003342 alkenyl group Chemical group 0.000 claims description 9
- 125000003118 aryl group Chemical group 0.000 claims description 9
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 7
- 230000037430 deletion Effects 0.000 claims description 7
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 7
- 125000003545 alkoxy group Chemical group 0.000 claims description 6
- 125000000304 alkynyl group Chemical group 0.000 claims description 6
- 150000001945 cysteines Chemical class 0.000 claims description 6
- 125000001072 heteroaryl group Chemical group 0.000 claims description 6
- 229910052739 hydrogen Inorganic materials 0.000 claims description 6
- 125000006297 carbonyl amino group Chemical group [H]N([*:2])C([*:1])=O 0.000 claims description 5
- 125000000753 cycloalkyl group Chemical group 0.000 claims description 5
- 230000001105 regulatory effect Effects 0.000 claims description 5
- 229940124597 therapeutic agent Drugs 0.000 claims description 5
- 208000036142 Viral infection Diseases 0.000 claims description 4
- 125000002252 acyl group Chemical group 0.000 claims description 4
- 230000001684 chronic effect Effects 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 239000003623 enhancer Substances 0.000 claims description 4
- 108020001507 fusion proteins Proteins 0.000 claims description 4
- 102000037865 fusion proteins Human genes 0.000 claims description 4
- 125000000623 heterocyclic group Chemical group 0.000 claims description 4
- 230000000873 masking effect Effects 0.000 claims description 4
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 claims description 4
- 230000009385 viral infection Effects 0.000 claims description 4
- 125000003837 (C1-C20) alkyl group Chemical group 0.000 claims description 3
- 125000003601 C2-C6 alkynyl group Chemical group 0.000 claims description 3
- 125000004432 carbon atom Chemical group C* 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 230000002441 reversible effect Effects 0.000 claims description 3
- 230000002103 transcriptional effect Effects 0.000 claims description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 2
- 238000005304 joining Methods 0.000 claims description 2
- 125000001475 halogen functional group Chemical group 0.000 claims 4
- 102000004533 Endonucleases Human genes 0.000 claims 3
- 230000001268 conjugating effect Effects 0.000 claims 2
- 229940126585 therapeutic drug Drugs 0.000 claims 2
- GVNVAWHJIKLAGL-UHFFFAOYSA-N 2-(cyclohexen-1-yl)cyclohexan-1-one Chemical compound O=C1CCCCC1C1=CCCCC1 GVNVAWHJIKLAGL-UHFFFAOYSA-N 0.000 claims 1
- 101150065749 Churc1 gene Proteins 0.000 claims 1
- 101000869592 Daucus carota Major allergen Dau c 1 Proteins 0.000 claims 1
- 208000031886 HIV Infections Diseases 0.000 claims 1
- 208000037357 HIV infectious disease Diseases 0.000 claims 1
- 241000700721 Hepatitis B virus Species 0.000 claims 1
- 208000029433 Herpesviridae infectious disease Diseases 0.000 claims 1
- 101000650136 Homo sapiens WAS/WASL-interacting protein family member 3 Proteins 0.000 claims 1
- 102100038239 Protein Churchill Human genes 0.000 claims 1
- 102100027539 WAS/WASL-interacting protein family member 3 Human genes 0.000 claims 1
- 238000011097 chromatography purification Methods 0.000 claims 1
- 238000005520 cutting process Methods 0.000 claims 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 claims 1
- 125000000717 hydrazino group Chemical group [H]N([*])N([H])[H] 0.000 claims 1
- 108700015182 recombinant rCAS Proteins 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000002360 preparation method Methods 0.000 abstract description 4
- 239000000562 conjugate Substances 0.000 description 112
- 108091079001 CRISPR RNA Proteins 0.000 description 97
- 210000004027 cell Anatomy 0.000 description 77
- 229920001223 polyethylene glycol Polymers 0.000 description 34
- 239000002202 Polyethylene glycol Substances 0.000 description 33
- 239000012636 effector Substances 0.000 description 32
- 238000005859 coupling reaction Methods 0.000 description 26
- 238000002347 injection Methods 0.000 description 26
- 239000007924 injection Substances 0.000 description 26
- 230000000670 limiting effect Effects 0.000 description 26
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 22
- 102100031780 Endonuclease Human genes 0.000 description 21
- 239000000126 substance Substances 0.000 description 18
- 210000001519 tissue Anatomy 0.000 description 18
- 102000005962 receptors Human genes 0.000 description 16
- 239000013598 vector Substances 0.000 description 16
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 201000010099 disease Diseases 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 239000011780 sodium chloride Substances 0.000 description 12
- 239000013607 AAV vector Substances 0.000 description 11
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 11
- 239000002777 nucleoside Substances 0.000 description 11
- 150000003384 small molecules Chemical class 0.000 description 11
- 125000001424 substituent group Chemical group 0.000 description 11
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 10
- 208000035473 Communicable disease Diseases 0.000 description 10
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 10
- 241000193996 Streptococcus pyogenes Species 0.000 description 10
- 230000033228 biological regulation Effects 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 238000000338 in vitro Methods 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 238000001890 transfection Methods 0.000 description 10
- 150000003852 triazoles Chemical class 0.000 description 10
- 125000000524 functional group Chemical group 0.000 description 9
- 230000001717 pathogenic effect Effects 0.000 description 9
- 150000001412 amines Chemical group 0.000 description 8
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 8
- 125000005843 halogen group Chemical group 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000002560 therapeutic procedure Methods 0.000 description 8
- 241000699670 Mus sp. Species 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 230000006320 pegylation Effects 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- VKIGAWAEXPTIOL-UHFFFAOYSA-N 2-hydroxyhexanenitrile Chemical compound CCCCC(O)C#N VKIGAWAEXPTIOL-UHFFFAOYSA-N 0.000 description 6
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 6
- 230000007018 DNA scission Effects 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 6
- 108020004682 Single-Stranded DNA Proteins 0.000 description 6
- 241000194019 Streptococcus mutans Species 0.000 description 6
- 150000001345 alkine derivatives Chemical group 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 150000001875 compounds Chemical group 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 230000000155 isotopic effect Effects 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 5
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 101710163270 Nuclease Proteins 0.000 description 5
- 210000001744 T-lymphocyte Anatomy 0.000 description 5
- 150000001720 carbohydrates Chemical class 0.000 description 5
- 235000014633 carbohydrates Nutrition 0.000 description 5
- 238000010511 deprotection reaction Methods 0.000 description 5
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 5
- 150000002148 esters Chemical class 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 239000002105 nanoparticle Substances 0.000 description 5
- 239000002953 phosphate buffered saline Substances 0.000 description 5
- 150000008300 phosphoramidites Chemical class 0.000 description 5
- 125000006239 protecting group Chemical group 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 102000003964 Histone deacetylase Human genes 0.000 description 4
- 108090000353 Histone deacetylase Proteins 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 4
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 4
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 4
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 4
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 4
- 108091008874 T cell receptors Proteins 0.000 description 4
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 125000004429 atom Chemical group 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 235000012000 cholesterol Nutrition 0.000 description 4
- 230000009918 complex formation Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 210000001808 exosome Anatomy 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 238000011577 humanized mouse model Methods 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 230000009437 off-target effect Effects 0.000 description 4
- XUYJLQHKOGNDPB-UHFFFAOYSA-N phosphonoacetic acid Chemical compound OC(=O)CP(O)(O)=O XUYJLQHKOGNDPB-UHFFFAOYSA-N 0.000 description 4
- 239000013600 plasmid vector Substances 0.000 description 4
- 230000001566 pro-viral effect Effects 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 150000003568 thioethers Chemical class 0.000 description 4
- 210000003462 vein Anatomy 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- KMEMIMRPZGDOMG-UHFFFAOYSA-N 2-cyanoethoxyphosphonamidous acid Chemical compound NP(O)OCCC#N KMEMIMRPZGDOMG-UHFFFAOYSA-N 0.000 description 3
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 3
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 241000702421 Dependoparvovirus Species 0.000 description 3
- 101000686777 Escherichia phage T7 T7 RNA polymerase Proteins 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 102000011787 Histone Methyltransferases Human genes 0.000 description 3
- 108010036115 Histone Methyltransferases Proteins 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 3
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 3
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 3
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 108020002494 acetyltransferase Proteins 0.000 description 3
- 102000005421 acetyltransferase Human genes 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 125000003158 alcohol group Chemical group 0.000 description 3
- 125000006241 alcohol protecting group Chemical group 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 229910021529 ammonia Inorganic materials 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 238000002832 anti-viral assay Methods 0.000 description 3
- 230000000840 anti-viral effect Effects 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000012412 chemical coupling Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000005289 controlled pore glass Substances 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 229910052736 halogen Inorganic materials 0.000 description 3
- 150000002367 halogens Chemical group 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 210000000987 immune system Anatomy 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 210000005228 liver tissue Anatomy 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 235000018977 lysine Nutrition 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 150000003833 nucleoside derivatives Chemical class 0.000 description 3
- 230000009438 off-target cleavage Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 235000004400 serine Nutrition 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 229930003799 tocopherol Natural products 0.000 description 3
- 239000011732 tocopherol Substances 0.000 description 3
- 230000007306 turnover Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- OZFAFGSSMRRTDW-UHFFFAOYSA-N (2,4-dichlorophenyl) benzenesulfonate Chemical compound ClC1=CC(Cl)=CC=C1OS(=O)(=O)C1=CC=CC=C1 OZFAFGSSMRRTDW-UHFFFAOYSA-N 0.000 description 2
- 125000004191 (C1-C6) alkoxy group Chemical group 0.000 description 2
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 2
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- AUDYZXNUHIIGRB-UHFFFAOYSA-N 3-thiophen-2-ylpyrrole-2,5-dione Chemical compound O=C1NC(=O)C(C=2SC=CC=2)=C1 AUDYZXNUHIIGRB-UHFFFAOYSA-N 0.000 description 2
- WOJKKJKETHYEAC-UHFFFAOYSA-N 6-Maleimidocaproic acid Chemical compound OC(=O)CCCCCN1C(=O)C=CC1=O WOJKKJKETHYEAC-UHFFFAOYSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 2
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 2
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 206010002091 Anaesthesia Diseases 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 2
- 229940045513 CTLA4 antagonist Drugs 0.000 description 2
- 108700004991 Cas12a Proteins 0.000 description 2
- 108091036055 CccDNA Proteins 0.000 description 2
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 2
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 2
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 108091006905 Human Serum Albumin Proteins 0.000 description 2
- 102000008100 Human Serum Albumin Human genes 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 2
- 208000024556 Mendelian disease Diseases 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- PGAVKCOVUIYSFO-XVFCMESISA-N UTP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-XVFCMESISA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 210000005006 adaptive immune system Anatomy 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 230000000735 allogeneic effect Effects 0.000 description 2
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 2
- 230000037005 anaesthesia Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 230000000890 antigenic effect Effects 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 239000003443 antiviral agent Substances 0.000 description 2
- 229910052786 argon Inorganic materials 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 125000001584 benzyloxycarbonyl group Chemical group C(=O)(OCC1=CC=CC=C1)* 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000005013 brain tissue Anatomy 0.000 description 2
- 210000000234 capsid Anatomy 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 108020001778 catalytic domains Proteins 0.000 description 2
- 239000007822 coupling agent Substances 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 239000003431 cross linking reagent Substances 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 230000002939 deleterious effect Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000002270 exclusion chromatography Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 235000019152 folic acid Nutrition 0.000 description 2
- 239000011724 folic acid Substances 0.000 description 2
- 239000012737 fresh medium Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 238000002523 gelfiltration Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 210000005003 heart tissue Anatomy 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- CBOIHMRHGLHBPB-UHFFFAOYSA-N hydroxymethyl Chemical compound O[CH2] CBOIHMRHGLHBPB-UHFFFAOYSA-N 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 239000011630 iodine Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 238000002515 oligonucleotide synthesis Methods 0.000 description 2
- 229920001542 oligosaccharide Polymers 0.000 description 2
- 150000002482 oligosaccharides Chemical class 0.000 description 2
- 231100000590 oncogenic Toxicity 0.000 description 2
- 230000002246 oncogenic effect Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000007800 oxidant agent Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002207 retinal effect Effects 0.000 description 2
- 238000004007 reversed phase HPLC Methods 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 235000010378 sodium ascorbate Nutrition 0.000 description 2
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 2
- 229960005055 sodium ascorbate Drugs 0.000 description 2
- 235000017557 sodium bicarbonate Nutrition 0.000 description 2
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 2
- 235000017550 sodium carbonate Nutrition 0.000 description 2
- 229910000029 sodium carbonate Inorganic materials 0.000 description 2
- PPASLZSBLFJQEF-RXSVEWSESA-M sodium-L-ascorbate Chemical compound [Na+].OC[C@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RXSVEWSESA-M 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 125000000547 substituted alkyl group Chemical group 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 235000010384 tocopherol Nutrition 0.000 description 2
- 229960001295 tocopherol Drugs 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 125000002221 trityl group Chemical group [H]C1=C([H])C([H])=C([H])C([H])=C1C([*])(C1=C(C(=C(C(=C1[H])[H])[H])[H])[H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 229950010342 uridine triphosphate Drugs 0.000 description 2
- PGAVKCOVUIYSFO-UHFFFAOYSA-N uridine-triphosphate Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 2
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 2
- PAHHYDSPOXDASW-VGWMRTNUSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-1-[(2s)-2-amino-3-hydroxypropanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO PAHHYDSPOXDASW-VGWMRTNUSA-N 0.000 description 1
- PMCVACOFMITXTP-UHFFFAOYSA-N (3,3-dimethyl-2-phenoxybutanoyl) 3,3-dimethyl-2-phenoxybutanoate Chemical compound C=1C=CC=CC=1OC(C(C)(C)C)C(=O)OC(=O)C(C(C)(C)C)OC1=CC=CC=C1 PMCVACOFMITXTP-UHFFFAOYSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- WTBFLCSPLLEDEM-JIDRGYQWSA-N 1,2-dioleoyl-sn-glycero-3-phospho-L-serine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCC\C=C/CCCCCCCC WTBFLCSPLLEDEM-JIDRGYQWSA-N 0.000 description 1
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 1
- RRQYJINTUHWNHW-UHFFFAOYSA-N 1-ethoxy-2-(2-ethoxyethoxy)ethane Chemical compound CCOCCOCCOCC RRQYJINTUHWNHW-UHFFFAOYSA-N 0.000 description 1
- SDTORDSXCYSNTD-UHFFFAOYSA-N 1-methoxy-4-[(4-methoxyphenyl)methoxymethyl]benzene Chemical compound C1=CC(OC)=CC=C1COCC1=CC=C(OC)C=C1 SDTORDSXCYSNTD-UHFFFAOYSA-N 0.000 description 1
- UTQNKKSJPHTPBS-UHFFFAOYSA-N 2,2,2-trichloroethanone Chemical group ClC(Cl)(Cl)[C]=O UTQNKKSJPHTPBS-UHFFFAOYSA-N 0.000 description 1
- KSXTUUUQYQYKCR-LQDDAWAPSA-M 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KSXTUUUQYQYKCR-LQDDAWAPSA-M 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 125000000022 2-aminoethyl group Chemical group [H]C([*])([H])C([H])([H])N([H])[H] 0.000 description 1
- 125000002941 2-furyl group Chemical group O1C([*])=C([H])C([H])=C1[H] 0.000 description 1
- ZISVTYVLWSZJAL-UHFFFAOYSA-N 3,6-bis[4-[bis(2-hydroxydodecyl)amino]butyl]piperazine-2,5-dione Chemical compound CCCCCCCCCCC(O)CN(CC(O)CCCCCCCCCC)CCCCC1NC(=O)C(CCCCN(CC(O)CCCCCCCCCC)CC(O)CCCCCCCCCC)NC1=O ZISVTYVLWSZJAL-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- UOQHWNPVNXSDDO-UHFFFAOYSA-N 3-bromoimidazo[1,2-a]pyridine-6-carbonitrile Chemical compound C1=CC(C#N)=CN2C(Br)=CN=C21 UOQHWNPVNXSDDO-UHFFFAOYSA-N 0.000 description 1
- GXGKKIPUFAHZIZ-UHFFFAOYSA-N 5-benzylsulfanyl-2h-tetrazole Chemical compound C=1C=CC=CC=1CSC=1N=NNN=1 GXGKKIPUFAHZIZ-UHFFFAOYSA-N 0.000 description 1
- MOAHOVZVLRRKPK-UHFFFAOYSA-N 6-azido-2-(2,5-dioxopyrrolidin-1-yl)hexanoic acid Chemical compound OC(=O)C(CCCCN=[N+]=[N-])N1C(=O)CCC1=O MOAHOVZVLRRKPK-UHFFFAOYSA-N 0.000 description 1
- JCORXJUUSVCJEP-UHFFFAOYSA-N 6-azidohexanoic acid Chemical compound OC(=O)CCCCCN=[N+]=[N-] JCORXJUUSVCJEP-UHFFFAOYSA-N 0.000 description 1
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 102000005427 Asialoglycoprotein Receptor Human genes 0.000 description 1
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 208000011691 Burkitt lymphomas Diseases 0.000 description 1
- 102000008203 CTLA-4 Antigen Human genes 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 108091007741 Chimeric antigen receptor T cells Proteins 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108010041504 Costimulatory and Inhibitory T-Cell Receptors Proteins 0.000 description 1
- 102000000529 Costimulatory and Inhibitory T-Cell Receptors Human genes 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- YZCKVEUIGOORGS-OUBTZVSYSA-N Deuterium Chemical compound [2H] YZCKVEUIGOORGS-OUBTZVSYSA-N 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102100021579 Enhancer of filamentation 1 Human genes 0.000 description 1
- 102220518659 Enhancer of filamentation 1_D10A_mutation Human genes 0.000 description 1
- 206010015108 Epstein-Barr virus infection Diseases 0.000 description 1
- 206010015719 Exsanguination Diseases 0.000 description 1
- 101710142246 External core antigen Proteins 0.000 description 1
- 201000011240 Frontotemporal dementia Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108700024845 Hepatitis B virus P Proteins 0.000 description 1
- 241000700586 Herpesviridae Species 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 101000937544 Homo sapiens Beta-2-microglobulin Proteins 0.000 description 1
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 1
- 101000898310 Homo sapiens Enhancer of filamentation 1 Proteins 0.000 description 1
- 101001066129 Homo sapiens Glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- PIWKPBJCKXDKJR-UHFFFAOYSA-N Isoflurane Chemical compound FC(F)OC(Cl)C(F)(F)F PIWKPBJCKXDKJR-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 208000032420 Latent Infection Diseases 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 208000009829 Lewy Body Disease Diseases 0.000 description 1
- 201000002832 Lewy body dementia Diseases 0.000 description 1
- 239000012098 Lipofectamine RNAiMAX Substances 0.000 description 1
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 1
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- ZUMJHHKVODHWBH-CJUXHSAQSA-N P(O)(N)OC[C@@H]1[C@H]([C@]([C@@H](O1)N1C=NC=2C(N)=NC=NC1=2)(O)CC#C)O Chemical compound P(O)(N)OC[C@@H]1[C@H]([C@]([C@@H](O1)N1C=NC=2C(N)=NC=NC1=2)(O)CC#C)O ZUMJHHKVODHWBH-CJUXHSAQSA-N 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 101710123874 Protein-glutamine gamma-glutamyltransferase Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 238000011579 SCID mouse model Methods 0.000 description 1
- 108091006611 SLC10A1 Proteins 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 1
- 102100021988 Sodium/bile acid cotransporter Human genes 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 1
- 208000034799 Tauopathies Diseases 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 description 1
- 238000010958 [3+2] cycloaddition reaction Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 230000004520 agglutination Effects 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000036436 anti-hiv Effects 0.000 description 1
- 238000011225 antiretroviral therapy Methods 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 239000002214 arabinonucleotide Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009697 arginine Nutrition 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 125000003435 aroyl group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 108010006523 asialoglycoprotein receptor Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical group [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 238000010461 azide-alkyne cycloaddition reaction Methods 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000003995 blood forming stem cell Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 1
- 125000001589 carboacyl group Chemical group 0.000 description 1
- OSQPUMRCKZAIOZ-UHFFFAOYSA-N carbon dioxide;ethanol Chemical compound CCO.O=C=O OSQPUMRCKZAIOZ-UHFFFAOYSA-N 0.000 description 1
- 150000003857 carboxamides Chemical class 0.000 description 1
- POIUWJQBRNEFGX-XAMSXPGMSA-N cathelicidin Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C1=CC=CC=C1 POIUWJQBRNEFGX-XAMSXPGMSA-N 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 239000008004 cell lysis buffer Substances 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- JZCCFEFSEZPSOG-UHFFFAOYSA-L copper(II) sulfate pentahydrate Chemical compound O.O.O.O.O.[Cu+2].[O-]S([O-])(=O)=O JZCCFEFSEZPSOG-UHFFFAOYSA-L 0.000 description 1
- 238000009109 curative therapy Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 229910052805 deuterium Inorganic materials 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MHDVGSVTJDSBDK-UHFFFAOYSA-N dibenzyl ether Chemical compound C=1C=CC=CC=1COCC1=CC=CC=C1 MHDVGSVTJDSBDK-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 229940014144 folate Drugs 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 230000001738 genotoxic effect Effects 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 125000004996 haloaryloxy group Chemical group 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 102000047486 human GAPDH Human genes 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 229960002725 isoflurane Drugs 0.000 description 1
- 229940099563 lactobionic acid Drugs 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- NSPJNIDYTSSIIY-UHFFFAOYSA-N methoxy(methoxymethoxy)methane Chemical compound COCOCOC NSPJNIDYTSSIIY-UHFFFAOYSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000000274 microglia Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 101150015886 nuc-1 gene Proteins 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 239000000863 peptide conjugate Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- UYWQUFXKFGHYNT-UHFFFAOYSA-N phenylmethyl ester of formic acid Natural products O=COCC1=CC=CC=C1 UYWQUFXKFGHYNT-UHFFFAOYSA-N 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 208000030683 polygenic disease Diseases 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 238000011533 pre-incubation Methods 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 210000004206 promonocyte Anatomy 0.000 description 1
- 238000000164 protein isolation Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 102220005480 rs35477770 Human genes 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010015840 seryl-prolyl-lysyl-lysine Proteins 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- ILMRJRBKQSSXGY-UHFFFAOYSA-N tert-butyl(dimethyl)silicon Chemical group C[Si](C)C(C)(C)C ILMRJRBKQSSXGY-UHFFFAOYSA-N 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- FPGGTKZVZWFYPV-UHFFFAOYSA-M tetrabutylammonium fluoride Chemical compound [F-].CCCC[N+](CCCC)(CCCC)CCCC FPGGTKZVZWFYPV-UHFFFAOYSA-M 0.000 description 1
- 150000003536 tetrazoles Chemical class 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 125000002640 tocopherol group Chemical class 0.000 description 1
- 235000019149 tocopherols Nutrition 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 125000004665 trialkylsilyl group Chemical group 0.000 description 1
- 125000004044 trifluoroacetyl group Chemical group FC(C(=O)*)(F)F 0.000 description 1
- 125000000025 triisopropylsilyl group Chemical group C(C)(C)[Si](C(C)C)(C(C)C)* 0.000 description 1
- 125000000026 trimethylsilyl group Chemical group [H]C([H])([H])[Si]([*])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000007502 viral entry Effects 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7042—Compounds having saccharide radicals and heterocyclic rings
- A61K31/7052—Compounds having saccharide radicals and heterocyclic rings having nitrogen as a ring hetero atom, e.g. nucleosides, nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/164—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/18—Antivirals for RNA viruses for HIV
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/96—Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1131—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1131—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses
- C12N15/1132—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses against retroviridae, e.g. HIV
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- AIDS & HIV (AREA)
- Gastroenterology & Hepatology (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本申请提供了向导RNA‑CRISPR Cas蛋白(RNP)复合体缀合物的组合物。缀合物包含向导RNA‑CRISPR Cas蛋白(RNP)复合物和一个或多个选自PEG、非PEG聚合物、细胞受体的配体、脂质、寡核苷酸、多肽或蛋白的分子。这些分子以化学方式与Cas蛋白和/或向导RNA连接。缀合物作为RNP复合物被递送至目标细胞,或在靶细胞中由向导RNA缀合物和编码Cas蛋白的mRNA或病毒载体生成,或在靶细胞中由crRNA缀合物和编码Cas蛋白和tracrRNA的病毒载体生成。还提供了这些缀合物的制备方法和用途。
Description
相关申请的交叉引用
本申请要求于2019年8月19日提交的美国临时申请号62/888,551,于2019年10月14日提交的美国临时申请号62/914,565,和于2019年11月20日提交的美国临时申请号62/937,876的权益。其全部所述发明通过引用并入本申请。
技术领域
本发明涉及一种向导RNA-Cas蛋白质(RNP)复合物缀合物的组合物及其作为药物治疗病毒感染性疾病的用途,以及作为基因调控、***/剔除和/或校正的治疗方法。缀合物包括向导RNA(s)-Cas蛋白(RNP)复合物和一个或多个选自一组包含PEG、非PEG聚合物、细胞受体的配体、脂质、寡核苷酸,抗体、多糖和多肽或蛋白的分子。这些分子化学连接到Cas蛋白和/或向导RNA。向导RNA进行了化学修饰,以增加其稳定性,增强目标识别的特异性和最小化/消除毒性。缀合物作为RNP复合物被递送至靶细胞,或在靶细胞中由向导RNA缀合物和编码Cas蛋白的mRNA或质粒或病毒载体生成,或在靶细胞中由crRNA缀合物和编码Cas蛋白和tracrRNA的质粒或病毒载体生成。这些缀合物可用于通过促进模板化DNA修复来提高基因编辑的准确性,通过掩蔽向导RNA-Cas蛋白复合物的抗原决定位和化学修饰来降低或阻止宿主预先存在的免疫反应,及改善RNP复合物的非病毒递送。
背景技术
提供以下对背景的描述只是为了帮助理解本公开内容,而不是承认描述或构成本披露前现有技术。
CRISPR-Cas***是细菌的适应性免疫***,由成簇的规则间隔的短回文DNA重复序列和CRISPR相关基因组成。CRISPR-Cas***保护细菌免受入侵的噬菌体和移动遗传元件的侵害。CRISPR-Cas9于生物技术和生物医学研究中的众多应用、以及作为基因治疗多种疾病的治疗剂,包括癌症、传染病和遗传病,如镰状细胞性贫血和杜兴氏肌营养不良症(DMD),正在被开发。在NIH全球数据库中列出的人类细胞中涉及CRISPR的临床试验迄今为止达33项。使用CRISPR-Cas9多重基因编辑,已产生缺乏TCRβ链、B2M、PD-1、TCR和CTLA-4的同种异体通用CAR T细胞,具有增强的效力。
CRISPR-Cas9已被应用于沉默/纠正在阿尔茨海默病、亨廷顿病和帕金森病等神经退行性疾病的致病蛋白,它应该能基本上阻止症状的进一步发展,它也可能是适用于路易体痴呆、额颞叶痴呆、及其它tau蛋白病和肌萎缩侧索硬化症(ALS)等多种疾病的治疗。催化受损的Cas9(dCas9)可以靶向许多基因组位点,这促成了例如碱基编辑,prime编辑、表观遗传编辑、基因调控以及染色质成像和建模等技术的发展。
慢性和/或潜伏性病毒感染,例如HIV、HBV和HSV,导致了感染者巨大的痛苦、生命损失和经济负担。这些传染性疾病是不治之症,感染者具有不同程度的传染性,是对公众健康的突出威胁,突显了对治愈性疗法的迫切需求。迄今为止,有效的抗病毒疗法仅抑制病毒复制,但不清除患者体内的病毒,不针对人体细胞中整合的潜在病毒基因(例如前病毒DNA)或非复制型附加型病毒基因组(例如cccDNA)。然而,据报道,这些病毒DNA直接导致了慢性或潜伏感染。
多份报告显示CRISPR-Cas9作为靶向病毒基因组的潜在抗病毒药剂,以治疗HBV、HIV、HSV和Epstein-Barr病毒(EBV)等。Yang等人报道了CRISPR/Cas9***可显著减少在用HBV表达载体转染的Huh-7细胞中HBV核心和表面蛋白的产生,破坏在体外和体内的HBV编码模板,表明其在根除持续性HBV感染方面的潜力。他们观察到两种针对不同位点的组合gRNA可以提高所致***缺失突变的效率。Seeger和Sohn的研究还报告了CRISPR/Cas9有效灭活通过NTCP编码以允许HBV感染的HepG2细胞中的HBV基因。Wang和Quake观察到来自Burkitt淋巴瘤患者、具有潜伏Epstein-Barr病毒感染的细胞,在暴露于通过质粒递送的靶向病毒基因组的CRISPR/Cas9载体和等摩尔比七种向导RNA的混合物后,停止增长,其病毒滴度同时降低。Hu等人报道的单一和多重配置靶向HIV-1LTR U3区域的CRISPR/Cas9***可以消除整合的HIV-1基因组。它在潜伏感染的小胶质细胞、前单核细胞和T细胞,完全切除了一个9,709bp的整合前病毒DNA片段,该片段跨越其5′到3′LTR,并且,对宿主细胞没有造成基因毒性或脱靶编辑。CRISPR-Cas9最近的研究表明,当用于人源化小鼠时,与长效缓释抗逆转录病毒疗法相结合,它可以清除一部分人源化小鼠中的HIV-1,有望治愈这种迄今为止无法治愈的疾病(Dash,et al.Nat.Comm.2019,10,2753)。更多研究可以参见最近的关于CRISPR-Cas9抗病毒应用的综述(Lee,C.Molecules 2019,24,1349)。
正如先前使用体外或体内转录的crRNA或sgRNA的例子所支持的,在多个位点靶向基因或病毒DNA可以提高有效性。可以通过提供不同化学改性的CRISPR RNA(crRNAs)、单分子向导RNA(sgRNA)或偶联单分子向导RNA(lgRNA)(包括多个靶向基因序列)的混合物/化学库来更好地实施靶向多个位点和/或病毒基因组中单个位点的变异/突变,相当于诸如HAART的联合疗法。
发明内容
本发明涉及一种向导RNA-Cas蛋白(RNP)复合物缀合物的组合物及其作为药物在治疗病毒性传染病和基于基因调控、***/剔除和/或校正疗法的用途。缀合物包含向导RNA(s)-Cas蛋白(RNP)复合物和一个或多个选自下组包含PEG、非PEG聚合物、细胞受体的配体、脂质、寡核苷酸、抗体、多糖和多肽/蛋白的分子,所述分子化学连接到Cas蛋白和/或向导RNA。缀合物作为RNP复合物递送至靶细胞,或在靶细胞中由向导RNA缀合物和通过共同注射或单独注射递送的编码Cas蛋白的mRNA或质粒或病毒载体生成,或在靶细胞中由crRNA缀合物和共同注射或单独注射质粒或病毒载体在靶细胞中形成的蛋白质和编码Cas蛋白和tracrRNA生成。这些缀合物可用于通过促进模板化DNA修复来提高基因编辑的准确性,通过掩蔽降低向导RNA-Cas蛋白复合物的抗原表位和化学修饰来降低或阻止宿主预先存在的免疫反应,及改善RNP复合物的非病毒递送。
所述RNP复合物缀合物的向导RNA是经过化学修饰的crRNA、双向导RNA(crRNA和tracrRNA)、sgRNA或lgRNA-寡核苷酸,包含在糖部分修饰的核苷酸,例如2′-脱氧核糖核苷酸、2′-甲氧基核糖核苷酸、2′-F-核糖核苷酸、2′-F-***核苷酸、2′-O,4′-C-亚甲基核苷酸(LNA)、未锁定核苷酸(UNA)、膦酰基乙酸酯(PACE)核苷酸、硫代膦酰基乙酸酯(thioPACE)核苷酸和单硫代磷酸酯核苷酸:
其中Q是核碱基,R是H、OH、F、OMe或OCH2CH2OCH3;化学的修饰的crRNA、sgRNA或lgRNA-寡核苷酸任选地包含修饰的核苷酸碱基部分,例如G-clamps、A-clamps和其他修饰碱基:
其中:
(i)Z是N或CR16;(ii)R9、R10、R11、R12、R13、R14和R15独立地为H、F、Cl、Br、I、OH、OR'、SH、SR'、SeH、SeR'、NH2、NHR'、NHOH、NHOR'、NR'OR′、NR'2、NHNH2、NR′NH2、NR′NHR'、NHNR'2、NR'NR'2、C1-C6的低级烷基、C1-C6的卤代(F、Cl、Br、I)低级烷基,C2-C6的低级烯基,卤代(F,Cl,Br,I)C2-C6的低级烯基,CN,C2-C6的低级炔基,卤化的(F,Cl,Br,I)C2-C6的低级炔基,C1-C6的低级烷氧基,卤化(F、Cl、Br、I)的C1-C6低级烷氧基、CN、CO2H、CO2R'、CONH2、CONHR'、CONR'2、CH=CHCO2H,或CH=CHCO2R',其中R'是任选取代的烷基,其包括,但不限于,H,包含或不包含取代基的C1-C20烷基,包含或不包含取代基的的低级烷基、包含或不包含取代基的环烷基、包含或不包含取代基的C2-C6炔基、包含或不包含取代基的C2-C6低级烯基、包含或不包含取代基的芳基、包含或不包含取代基的的杂芳基、包含或不包含取代基的磺酰基或包含或不包含取代基的酰基,其包括但不限于C(=O)烷基,或者,在NR'2的情况下,每个R'包含至少一个C原子,这些C原子连接形成包含至少两个碳的杂环。
在一些实施方案中,向导RNA的糖、碱基、或两者经过化学修饰,以优化向导RNA靶向区域序列与靶DNA双链体的互补识别,以提高切割效率和降低脱靶效应。
在一些实施方案中,向导RNA的糖、碱基、或两者经过化学修饰,以优化Cas蛋白与向导RNA靶向区域序列与DNA靶链杂化所形成双链体的次要凹槽或/和主要凹槽之间的形状互补性,以提高切割效率并降低脱靶效应。
在一些实施方案中,经过化学修饰的crRNA、双向导RNA、sgRNA或lgRNA-寡核苷酸与多肽/蛋白、适体、寡核苷酸、抗体、分子受体配体(如GalNAc)、生物素、胆固醇、生育酚、脂质或叶酸等缀合,用于选择性地靶向组织。缀合位点选自这些寡核苷酸的3'-end、5'-end和lgRNA偶联位点。
在某些实施方案中,所述编码Cas蛋白和tracrRNA的病毒载体包含以下元件,可选地在5'>3'方向:哺乳动物启动子和可选的增强子,编码单个Cas蛋白的cDNA,一个或多个核定位序列、多聚腺苷酸化信号、U6启动子和tracrRNA序列。例如,如图7(A)所示的腺相关病毒(AAV)载体。
在某些实施方案中,所述能够使靶细胞稳定表达Cas蛋白的病毒载体包含以下元件,可选地在5'>3'方向:哺乳动物启动子和可选的增强子,编码单个Cas蛋白的cDNA,一个或多个核定位序列和多聚腺苷酸化信号。例如,如图7(B)所示的腺相关病毒(AAV)载体。
在一些实施方案中,所述编码Cas9和/或tracrRNA的cDNA的病毒载体经过优化,编码Cas9变体和tracrRNA,以获得更好的功效并降低脱靶和其他副作用。
在一些实施方案中,所述病毒载体和crRNA,或lgRNA-或sgRNA或其缀合物在有或没有转染试剂的水溶液中,或包装在非病毒载体中,通过共同注射或单独注射给药。
在一些实施方案中,活性的crRNA-tracrRNA-Cas9三元缀合物在细胞内或体内由tracrRNA-Cas9二元复合物与crRNA或crRNA缀合物,通过重复:反重复识别与tracrRNA杂交,结合与Cas9的相互作用,而形成;或由Cas9与通过重复:反重复识别形成的crRNA-tracrRNA复合物或其缀合物的结合,而形成。活性的lgRNA-/sgRNA-Cas9二元复合物由通过稳定或诱导表达在体内形成的Cas9结合到外源lgRNA-或sgRNA或其缀合物,而形成。
在某些实施方案中,经过化学修饰的、结构优化的lgRNA-或crRNA或其缀合物阵列库和稳定或诱导表达Cas蛋白或Cas9-tracrRNA二元复合物的细胞或动物,用于药物发现、医学研究和生物学研究,以及全基因组筛查。
在一些实施方案中,Cas蛋白是其他2类CRISPR***的单一蛋白效应子,例如Cas12a蛋白。它在组织嗜性病毒载体中递送。化学修饰的crRNA(s)或其缀合物,通过共注射或分开注射,以水溶液形式、或与转染试剂一起、或包装在非病毒载体中递送。Cas9和Cas12a等单一蛋白质效应子可以无催化活性,与其它蛋白质效应子偶联/融合,例如转录激活剂、转录阻遏物、DNA甲基转移酶、组蛋白乙酰转移酶和脱乙酰酶的催化结构域,和核酸脱氨酶,以用于基因编辑和调控。
在一些实施方案中,所述载体和寡核苷酸或其缀合物被施用于靶细胞,如来自患者的T细胞,然后,将经过修饰的细胞回输至患者。
在另一个实施方案中,用所述编码tracrRNA-Cas9二元复合物的载体处理靶组织或细胞,然后将经过修饰后的细胞回输给患者。再施用所述crRNA或其缀合物以激活CRISPR-Cas9,以用于靶向基因或病毒基因组的调节、破坏或校正。
在又一个实施方案中,用所述编码Cas9蛋白的载体处理靶组织或细胞,然后将修饰后的细胞回输给患者。再施用所述lgRNA-或sgRNA或其缀合物以激活CRISPR-Cas9,以用于靶向基因或病毒基因组的调节、破坏或校正。
在一些实施方案中,编码Cas9直系同源物的一种病毒载体具有以顺式编码的tracrRNA,与crRNA(s)或crRNA缀合物在含或不含转染试剂的水溶液中,或包装在非病毒载体中,通过共同注射或单独注射给药。载体的给药比例为每个crRNA的拷贝数从1:1到1:5。在一些实施方案中,施用单种crRNA或其缀合物。在一些实施方案中,施用多种crRNA或其缀合物的混合物。
在一些实施方案中,一种编码Cas9直系同源物的病毒载体和在含或不含转染试剂的水溶液中,或包装在非病毒载体中的单种或多种lgRNA或其缀合物,通过联合注射或单独注射给药。载体与每个lgRNA-拷贝的给药比例为1:1至1:5。
在某些实施方案中,病毒载体选自工程化的腺相关病毒(AAV)、逆转录病毒、慢病毒、腺病毒载体等。
在某些实施方案中,Cas9蛋白的密码子C端带有针对人类细胞进行了密码子优化SV40核定位信号。
在某些实施方案中,Cas9蛋白的表达受单个或多个可切换的转录启动子/增强子/抑制子调控。
在某些实施方案中,基于病毒载体的组织嗜性和Cas9基因的细胞选择性启动子,Cas9蛋白被选择性地递送至特定组织。
在某些实施方案中,crRNA、双向导RNA、sgRNA或lgRNA-靶向区域包含选自病原体DNA基因组的12~20nt序列,例如病毒、细菌、或其他引起疾病的微生物,其中每个胸腺嘧啶被尿嘧啶取代。所述序列紧挨着原间隔物相邻基序(例如酿弄链球菌的NGG)。靶向区域RNA寡聚体的序列为紧邻原间隔物相邻基序的有义非目标链(5'→3')基序,即非目标链的有或没有经过进一步化学修饰的RNA转录本。通过crRNA、sgRNA或lgRNA-靶向区域序列与反义靶DNA链互补识别,介导Cas9 DNA核酸内切酶进行位点特异性切割,以形成特定的双链断裂(DSB)。然后,通过非同源末端连接(NHEJ)和微同源介导末端连接(MMEJ)的DNA修复途径加入导致病毒基因组降解或病原体的致命突变。
在某些实施方案中,crRNA、sgRNA或lgRNA-靶向区域为选自12~20nt的HIV基因组序列,其中每个胸腺嘧啶被尿嘧啶取代。所选序列紧挨着原间隔物相邻基序(例如酿弄链球菌的NGG)。靶向区域RNA寡聚体的序列与基因组有义序列具有相同的序列链(5'→3'),即它的有或没有经过进一步化学修饰的RNA转录本。
在某些实施方案中,crRNA、sgRNA或lgRNA-靶向区域为选自12~20nt的HBV基因组序列,其中每个胸腺嘧啶被尿嘧啶取代。所选序列紧挨着原间隔物相邻基序(例如酿弄链球菌的NGG)。靶向区域RNA寡聚体的序列与基因组有义序列具有相同的序列链(5'→3'),即它的有或没有经过进一步化学修饰的RNA转录本。
在某些实施方案中,crRNA、sgRNA或lgRNA-靶向区域为选自12~20nt的HSV基因组序列,其中每个胸腺嘧啶被尿嘧啶取代。所选序列紧挨着原间隔物相邻基序(例如酿弄链球菌的NGG)。靶向区域RNA寡聚体的序列与基因组有义序列具有相同的序列链(5'→3'),即它的有或没有经过进一步化学修饰的RNA转录本。
在某些实施方案中,crRNA、sgRNA或lgRNA-靶向区域为选自12~20nt的EBV基因组序列,其中每个胸腺嘧啶被尿嘧啶取代。所选序列紧挨着原间隔物相邻基序(例如酿脓链球菌的NGG)。靶向区域RNA寡聚体的序列与基因组有义序列具有相同的序列链(5'→3'),即它的有或没有经过进一步化学修饰的RNA转录本。
在某些实施方案中,多个crRNA、sgRNA或lgRNA-靶向区域序列分别对应于病毒基因组的不同基因座和/或靶基因组单个基因座的变体。
在某些实施方案中,crRNA、sgRNA和lgRNA-靶向区域序列选自参与病毒进入、转录/逆转录和/或复制的宿主因子的12~20nt基因序列,其中每个胸腺嘧啶被尿嘧啶取代。所述序列紧挨着原间隔物相邻基序(例如酿弄链球菌的NGG)。靶向区域RNA寡聚体的序列为紧邻原间隔物相邻基序的有义非目标链(5'→3')基序,即非目标链的有或没有经过进一步化学修饰的RNA转录本。通过crRNA、sgRNA或lgRNA-靶向区域序列与反义靶DNA链互补识别,介导Cas9 DNA核酸内切酶进行位点特异性切割,以形成特定的双链断裂(DSB)。在这些因子中引入突变,导致宿主对病毒的抵抗力。
在某些实施方案中,crRNA、sgRNA和lgRNA-靶向区域序列选自宿主突变位点、缺陷基因或编码有缺陷或部分活性或功能蛋白质的靶基因的12~20nt序列,其中每个胸腺嘧啶被尿嘧啶取代。所述序列紧挨着原间隔物相邻基序(例如酿弄链球菌的NGG)。靶向区域RNA寡聚体的序列为紧邻原间隔物相邻基序的有义非目标链(5′→3')基序,即非目标链的有或没有经过进一步化学修饰的RNA转录本。通过crRNA、sgRNA或lgRNA-靶向区域序列与反义靶DNA链互补识别,介导Cas9 DNA核酸内切酶进行位点特异性切割,以形成特定的双链断裂(DSB),允许两侧有同源区域的转基因盒与宿主基因座重组,并用正确的序列替换突变的DNA。
在某些实施方案中,所述转基因盒为与向导RNA缀合的同源定向修复ssDNA模板,形成向导RNA-ssDNA模板缀合物,用于以其正确的基因序列替换突变的DNA。
在某些实施方案中,所述转基因盒为与向导RNA缀合的同源定向修复ssDNA模板,形成向导RNA-ssDNA模板缀合物,用于编辑病毒游离DNA和宿主基因中整合的病毒DNA。所述基因编辑是碱基或碱基序列的删除,***或点突变,以抑制或消除病毒蛋白质表达、或因病毒DNA整合而上调的宿主致病蛋白的过度表达。
在某些实施方案中,所述基因编辑包含引入终止密码子和/或顺式表达的调节元件,以抑制或消除病毒蛋白表达、或宿主因病毒DNA整合上调的致病蛋白的过度表达。
在某些实施方案中,所述向导RNA-ssDNA缀合物可选地进一步与多肽、适体、抗体、受体小分子配体如GalNAc、胆固醇、生育酚、脂质或叶酸等缀合,用于选择性组织靶向。其缀合位点选自所述向导RNA-ssDNA缀合物的3'-末端、5'-末端和连接位点。
Cas蛋白选自Cas9变体,包括SpCas9、StlCas9、SaCas9、NmCas9等(Jin and etal.Adv.Sci.2020,1902312;Doudna,J.A.Nature 2020,578,229),也可以是与蛋白质效应子偶联/融合的切口酶或无催化活性的Cas9(dCas9),用于基因编辑和调控。所述蛋白质效应子包括转录激活因子、转录抑制因子、DNA的催化结构域甲基转移酶、组蛋白乙酰转移酶和脱乙酰酶、逆转录酶和核酸脱氨酶等。
或者,Cas蛋白可以是其他2类的任何单一蛋白CRISPR***(V型和VI型),例如Cas12(a、b、c、e、g、h、i等)、Cas13和Cas14蛋白。Cas12和Cas14等单一蛋白质效应子可以是无催化活性的,与其它蛋白质效应子偶联/融合,用于基因编辑和调控。所述其它蛋白质效应子包括转录激活剂、转录抑制物、DNA甲基转移酶、组蛋白乙酰转移酶和脱乙酰酶的催化结构域,以及核酸酸性脱氨酶等。
在某些实施方案中,Cas蛋白被工程化,通过定点诱变替换暴露于溶液中、在抗原决定位附近,或包含其中的氨基酸,以引入用于缀合的半胱氨酸。野生型酶的半胱氨酸(例如SpCas9的C80和C573)选择性地被突变,以避免酶由于在这些半胱氨酸缀合而失活。
在某些实施方案中,向导RNA-Cas蛋白(RNP)复合物与其它分子缀合。所述其它分子包括PEG、非PEG聚合物、细胞受体配体,抗体、脂质、寡核苷酸、多糖、聚糖和多肽。
在某些实施方案中,Cas缀合位点选自蛋白表面/暴露于溶剂内/突出的氨基酸残基,例如Cas蛋白的此类赖氨酸、精氨酸、丝氨酸、半胱氨酸、天冬氨酸、或谷氨酸,或由定点诱变引入的氨基酸,例如半胱氨酸,用于选择性缀合以掩盖或屏蔽抗原决定位。
在某些实施方案中,向导RNA-Cas蛋白(RNP)复合物的缀合位点位于Cas蛋白或向导RNA,或Cas蛋白或向导RNA两者都包含缀合位。
在某些实施方案中,向导RNA-Cas蛋白(RNP)复合物经过聚乙二醇化。
在某些实施方案中,向导RNA-Cas蛋白(RNP)复合物与多于两个PEG聚合物分子进行缀合以屏蔽/掩蔽抗原决定位。
在某些实施方案中,向导RNA-Cas蛋白(RNP)复合物与其他非PEG聚合物、细胞受体的配体、脂质、寡核苷酸、抗体、多糖、聚糖或多肽等缀合。
在某些实施方案中,PEG缀合的向导RNA-Cas蛋白(RNP)复合物进一步与其它非PEG聚合物、细胞受体的配体、脂质、寡核苷酸、抗体、多糖、聚糖或多肽缀合。
在某些实施方案中,向导RNA-Cas蛋白(RNP)复合物共价连接至一个或多个分子。所述分子选自PEG、非PEG聚合物、细胞受体配体、脂质、寡核苷酸、抗体、多糖、聚糖和多肽。
在某些实施方案中,向导RNA-缀合物,例如lgRNA-ssDNA缀合物,与编码Cas蛋白的mRNA或载体一起递送。
在某些实施方案中,向导RNA-缀合物,例如lgRNA-ssDNA缀合物,被递送至稳定或诱导表达Cas蛋白的细胞。
在某些实施方案中,lgRNA-ssDNA缀合物通过ssDNA与从Cas9:lgRNA-:DNA复合物中不对称释放的R环PAM远端片段杂交,促进模板化修复DNA的断裂或缺口,并促进RNP复合物快速从编辑过的DNA中释放,以增加其周转频率(TOF)。
在某些实施方案中,lgRNA-ssDNA缀合物通过ssDNA与从Cas9:lgRNA-:DNA复合物中不对称释放的R环3'-OH片段杂交,促进模板化修复DNA的断裂或缺口,并促进RNP复合物快速从编辑过的DNA中释放,以增加其周转频率(TOF)。
发明详述
用于基因调控、***/剔除和/或校正的最常用类型的CRISPR***迄今为止主要是由Cas9代表的II型。CRISPR-Cas9是一种天然发生的细菌防御***。CRISPR Cas9核酸内切酶与crRNA:tracrRNA结合,被激活,并特异性地识别与crRNA中的靶向区域序列互补DNA序列(目标链),并在识别到在非目标DNA链的3'-末端原始间隔区相邻基序(PAM)后,将其切割。tracrRNA和Cas9的存在是通过双链RNA特异性核糖核酸酶RNase III将pre-crRNA加工成单个crRNA所必需的,以形成crRNA:tracrRNA双链体。这个双链体被人工融合成一个单一向导RNA(通过四核苷酸环形成的单分子向导RNA或通过非核苷酸接头的的所述偶联向导RNA),以用于基因组工程和其他应用。
CRISPR***包括其他2类CRISPR***,例如V型和VI型。
本发明的一个方面涉及聚乙二醇化向导RNA-Cas蛋白复合物的组合物,用作治疗病毒感染性疾病的药物,和作为基于基因调控、破坏和/或校正的疗法。PEG聚合物可以是其他聚合物、细胞受体的配体、脂质、寡核苷酸、抗体、多糖或多肽,与Cas蛋白和/或引导RNA缀合。
在一些实施方案中,crRNA、sgRNA和lgRNA-经过化学修饰优化,以提高切割目标DNA(如病毒基因组DNA)的效率,以及在有或没有工程化Cas蛋白的情况下最大限度地减少宿主基因组DNA的脱靶切割。
在一些实施方案中,crRNA、sgRNA或lgRNA-是化学修饰过的,并与一个或多个ssDNA供体模板缀合。
在一些实施方案中,施用lgRNA-Cas蛋白复合物缀合物编辑致病基因,其中lgRNA或lgRNA-缀合物包含一个或多个化学连接的、可经过或没有经过化学修饰的ssDNA供体模板。
在一些实施方案中,致病基因是游离基因的和整合的病毒DNA。
在一些实施方案中,致病基因是突变的宿主基因或任何被编辑的基因。
本发明的一个方面涉及编码tracrRNA-Cas蛋白二元复合物病毒载体和经过寡核苷酸化学修饰的crRNA或其缀合物的组合物,均被递送至相同的靶细胞,所述组合物的制备方法,以及用作治疗病毒感染性疾病的治疗剂和用作基因基于调节、破坏和/或校正的疗法。以及在组织嗜性病毒载体中递送tracrRNA-Cas蛋白质二元复合物,和在水溶液中或通过转染试剂或在非病毒载体中递送经过化学修饰的crRNA或其与细胞靶向配体缀合物的方法。所述递送通过共同注射或单独注射。
本发明的另一个方面涉及编码Cas蛋白病毒载体和寡核苷酸经过化学修饰的lgRNA、sgRNA或其缀合物的组合物,均被递送至相同的靶细胞,所述组合物的制备方法,以及用作治疗病毒感染性疾病的治疗剂和用作基因基于调节、破坏和/或校正的疗法。以及在组织嗜性病毒载体中递送Cas蛋白质,和在水溶液中或通过转染试剂或在非病毒载体中递送经过化学修饰的lgRNA、sgRNA或其与细胞靶向配体缀合物的方法。所述递送通过共同注射或单独注射。
本发明的又一方面涉及编码Cas蛋白病毒载体,该蛋白不需要tracrRNA的情况下起作用,与寡核苷酸经过化学修饰的crRNA或其缀合物的组合物,均被递送到相同的靶细胞,以及在组织嗜性病毒载体中递送Cas蛋白质,和在水溶液中或通过转染试剂或在非病毒载体中递送经过化学修饰的crRNA或其缀合物的方法,所述递送通过共同注射或单独注射,用于治疗病毒性传染病和作为基因基于剔除、***和/或校正的疗法。
在一些实施方案中,crRNA、sgRNA和lgRNA或其缀合物经过化学修饰优化,与有或没有经过工程化的Cas蛋白复合,以提高切割目标基因组DNA(如病毒)的效率和用于最小化宿主基因组DNA的脱靶切割。
在一些实施方案中,Cas蛋白是工程改造的,或者是CRISPR相关的较小尺寸的蛋白质,因此更易于在人体细胞中进行病毒递送,以实现高效给药和更好的剂型。
在其他实施方案中,所述组合物单独或与小分子治疗剂、治疗用蛋白质(如抗体)或核酸,例如mRNA、反义寡核苷酸和小干扰RNA,一起共同或单独施用。
附图说明
图1:Cas9/lgRNA-复合物缀合物概略图(A)在上图;与tris-GalNAc配体偶联的向导RNA概略图示例(B)在底部。
图2:显示了聚乙二醇化Cas9/lgRNA-复合物概略图。
图3:显示制备聚乙二醇化Cas9/lgRNA-复合物的方法实例。
A.在预先形成的RNP复合物的丝氨酸和赖氨酸残基上选择性缀合;B.选择性在预先形成的RNP复合物的赖氨酸残基处缀合;C.与工程化Cas蛋白通过定点诱变获得的半胱氨酸残基的选择性缀合,然后是RNP形成。
图4:显示了Cas9/lgRNA-ssDNA与宿主酶协同作用。与缀合的ssDNA杂交后,并使用ssDNA作为模板,宿主DNA聚合酶延伸从Cas9:lgRNA-:DNA复合物中不对称地释放的R环PAM远端链。
图5:显示了用于编辑致病基因的多周转STAR(Seek-Tag-Amend-Release)
CRISPR Cas,作用的RNP复合物的释放被加快。1.目标序列搜求:Cas9/lgRNA-ssDNA复合物结合到双链DNA,所述双链包含一个紧接在原始间隔区相邻基序前的DNA序列,与lgRNA的前17-20个核苷酸匹配,形成R环。2.标记:HNH在PAM的上游碱基位置3切割目标链,而RuvC较不精确的切割和3'端进一步加工形成缩短的、不同长度的非目标链PAM远端,不对称地由Cas9:lgRNA-ssDNA:DNA复合物释放。释放的DNA链充当引物,并与作为DNA修复模板的缀合ssDNA的3'-同源臂杂化。3.修正:修复2中标记的双链断裂,其中,细胞酶进一步加工末端,并连接间隙。4.释放:Cas9:lgRNA-ssDNA复合物从经修复的DNA中释放出来,进入下一个周期。Cas9蛋白也可以是切口酶,例如HNH(H840A),DNA缺口以类似的方式(STAR)形成和被修复,并释放nCas9:lgRNA-ssDNA复合物。
图6:显示Cas9-gRNA:DNA双链体形状互补性的识别:(A)通过氢键在双链体主要和次要凹槽处结合;(B)绑定G-Clamp的示例;(C)A-Clamps和G-Clamps与主要和次要凹槽的互补氢键(D)。
图7:显示编码Cas9:tracrRNA复合物的AAV载体(A)和Cas9蛋白质的AAV载体(B)。启动子是组织选择性的人类启动子,它可以是诱导型。并且,Cas9可以是dCas9-蛋白效应子融合蛋白或Cas9切口酶,或任何其他Cas蛋白。
图8:显示三元Cas9:crRNA:tracrRNA RNP复合物分为可变的crRNA(s)和一个固定的二元Cas9:tracrRNA RNP复合物两部分,用于其分别细胞递送。Cas9可以是dCas-效应子融合蛋白或Cas9切口酶及其融合蛋白,或任何其他Cas蛋白。二元Cas9:tracrRNA RNP复合物可在体外制备并递送至靶细胞(b.和c.)或由靶细胞中的Cas9蛋白和tacrRNA形成(a.)。二元Cas9:tracrRNA RNP复合物与添加的crRNA(s)或其缀合物形成三元Cas9:crRNA:tracrRNA RNP复合物及其缀合物(d.)。或者,在体外制备三元Cas9:crRNA:tracrRNA RNP复合物及其缀合物,并递送至靶细胞(e.和f.)。
图9:显示通过注射施用AAV载体和crRNA/crRNA缀合物(A)、AAV载体和lgRNA/lgRNA-缀合物(B)或包装在脂质纳米颗粒中的mRNA(Cas9-NLS)和lgRNA-缀合物的混合物(C)。
图10:显示通过IV注射施用AAV载体和crRNA/crRNA缀合物(A)、AAV载体和lgRNA-/lgRNA-缀合物(B)、或mRNA混合物(Cas9-NLS)和lgRNA-缀合物,在肝脏中形成RNP复合物。
图11:显示离体T细胞输入疗法(ACT)的示意图:以同种异体通用CAR-T细胞为例。
定义
本申请使用的术语的定义与本领域的普通技术人员已知的那些一致,在任何差异的情况下,使用如本申请中指定的定义。
如本申请所用,术语“核苷”是指由杂环组成的分子含氮碱基,含有与糖,特别是戊糖的N-糖苷键。如本申请所用,一个扩展的术语“核苷”还指无环核苷和碳环核苷。
如本申请所用,术语“核苷酸”是指由核苷单磷酸盐、二磷酸盐或三磷酸盐组成的分子,在5′-位、3′-位或两者兼有磷酸酯。所述磷酸盐也可以是膦酸盐、氨基磷酸盐、二氨基磷酸盐、膦酰基乙酸盐(PACE)、硫代膦酰基乙酸酯(thioPACE)或单硫代磷酸酯。
术语“寡核苷酸”(ON)在本申请中可与“多核苷酸”、“核苷酸序列”和“核酸”交换使用,是指任何长度的核苷酸,脱氧核糖核苷酸或核糖核苷酸,或其类似物的聚合物。一个寡核苷酸可包含一种或多种修饰的核苷酸,其可在寡核苷酸组装之前或之后引入。所述核苷酸序列可以被非核苷酸成分打断。
术语“CRISPR-Cas***”是指原核免疫***,其赋予对外来例如存在于质粒和噬菌体中的那些遗传元件的抗性,提供一种获得性免疫。含有间隔序列的RNA指示Cas(CRISPR相关的)蛋白识别和切割外来致病DNA。其他RNA引导的Cas蛋白切割外源RNA。CRISPR存在于大约50%的已测序细菌基因组中,并且近90%的已测序古细菌基因组。该***正在被设计优化用于基因调控和编辑,真核细胞中的基因***、破坏和/或校正。
术语“CRISPR/Cas9”是指II型CRISPR-Cas***,例如spCas9来自化脓性链球菌。II型CRISPR-Cas***包括蛋白质Cas9和两种非编码RNA(crRNA和tracrRNA)。这两种非编码RNA通过一个四核苷酸环进一步融合成一个单分子向导RNA(sgRNA),或通过一个或多个非核苷酸(nNt)接头化学连接的一个单分子向导RNA(lgRNA)。Cas9/sgRNA-或Cas9/lgRNA-复合物结合包含与向导RNA的前17-20个核苷酸序列匹配的双链DNA,序列紧接在原型间隔区相邻基序(PAM)之前。一旦绑定,两个独立的Cas9中的核酸酶结构域(HNH和RuvC)在P AM上游3个碱基前(HNH)或更多碱基前(RuvC)各自切割DNA链中的一个,形成DNA双链断裂(DSB)。
术语“Cas蛋白”是指第2类CRISPR-Cas蛋白。
术语“脱靶效应”是指Cas9或任何其他Cas蛋白对基因组DNA的非靶向切割,尽管gRNA的靶序列和基因组DNA序列之间不完全匹配。gRNA的靶序列和基因组DNA序列之间的单一错配允许Cas9进行脱靶切割。以下所有的脱靶效应案例已见诸报告:(a)长度相同但有1-5个碱基错配;(b)靶基因组DNA中的脱靶位点有一个或多个碱基缺失(“缺失”);(c)靶基因组DNA中的脱靶位点有一个或多个额外的碱基(“***”)。
术语“向导RNA”(gRNA)是指CRISPR-Cas***的核糖核酸部分,例如crRNA和tracrRNA、和由crRNA与tracrRNA通过四核苷酸环(GAAA)(定义为单分子向导核酸)或其他化学接头,例如nNt接头(定义为偶联向导核酸)融合形成的单分子向导核酸。其可与“嵌合RNA”、“嵌合向导RNA”、“单向导RNA”和“合成向导RNA”互换使用。gRNA包含重复:抗重复双链体、茎环1-3、以及茎环1和2之间接头的二级结构。
术语“双RNA”或“双向导RNA”是指短CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA)。crRNA与tracrRNA杂交形成crRNA:tracrRNA双链体,加载到Cas蛋白上以引导切割带有适当的原型间隔区相邻基序(PAM)的同源DNA序列。
术语“偶联向导RNA”是指通过在crgRNA和tracrgRNA之间或在其他位点以化学连接方式连接而形成非核苷酸接头(nNt-接头)的向导核酸(gRNA)。
“双lgRNA-”、“三重lgRNA-”和“多重lgRNA-”的术语是指向导RNA片段通过非核苷酸化学连接融合、杂交复合而形成的合成向导RNA。双tracrgRNA由tracrgRNA1和tracrgRNA2(~30nt的RNA片段)之间的化学连接形成。crgRNA(~30nt)与双tracrgRNA融合形成三重lgRNA,加载到Cas9上,以指示Cas9切割带有适当原始间隔区相邻基序(PAM)的同源DNA序列。每个RNA片段都可以很容易地通过化学方式制造,并兼容广泛的化学修饰.
术语“指导序列”是指向导RNA内的约20个碱基的序列,以指定目标位点,并且在本申请中可与术语“向导”或“靶向区域”互换使用。术语“tracr配对序列”也可以与术语“直接重复”互换使用。
术语“crgRNA”是指具有用于缀合/连接化学官能团的crRNA。该寡核苷酸可以在接近其3′端任何一个或几个核苷酸,或其完整序列进行化学修饰。crgRNA也可以通过RNA聚合酶(例如噬菌体T7 RNA聚合酶)转录,在体外制备。其缀合化学功能团,例如胺和炔烃,在其5′处结合(最好是5′-GU或5′-GC)或3′-末端,以三磷酸核苷类似物引入,例如CTP、UTP:
等等。
术语“tracrgRNA”是指具有用于缀合/连接化学官能团的tracrRNA。该寡核苷酸可以在任何一个或几个核苷酸的位置,或其完整序列进行化学修饰。tracrgRNA也可以通过RNA聚合酶(例如噬菌体T7 RNA聚合酶)转录,在体外制备。其缀合化学功能团,例如胺和炔烃,在其5′处结合(最好是5′-GU或5′-GC)或3′-末端,以三磷酸核苷类似物引入。
术语“原型间隔区相邻基序(PAM)”是指CRISPR细菌适应性免疫***中,紧随Cas9靶向序列的DNA序列,包括NGG、NNNNGATT、NNAGAA、NAAC和其他来自不同细菌物种的不同序列,其中,N是任何核苷酸。在CRISPR-Cas12a***中,“PAM”指的是紧接在目标DNA序列之前的DNATTTN等序列。
术语“化学连接”是指通过点击连接(叠氮化物-炔烃反应产生***键)、硫醇-马来酰亚胺反应、或形成其他化学基团的化学方法,将合成的寡核苷酸连接在一起。
术语“互补”是指核酸通过传统的Watson-Crick或其他非传统类型与另一个核酸序列形成氢键的能力。Cas9包含两个核酸酶结构域,HNH和RuvC,分别可切割DNA与crRNA中、约20个核苷酸(nt)的引导序列互补链和非互补链。
术语“供体模板”是指转基因盒或基因编辑序列,其两侧具有同源区以与宿主基因座重组,并通过HDR/SSTR,以正确的序列替换DNA突变。供体模板可以是ssDNA或dsDNA或质粒/载体,可通过共价键化学缀合到向导RNA或Cas蛋白。
供体模板可以通过化学合成制备,配备有化学缀合/连接的官能团。还可以在体外通过DNA聚合酶基因合成进行制备,所制备供体模板在其5′或3′端可以具有以三磷酸核苷类似物酶促引入的用于化学缀合/连接的化学官能团,例如胺和炔烃。
术语“基因编辑序列”、“基因-编辑-序列”或“基因_编辑_序列”是指供体模板序列中包含的、以引入预期基因编辑的序列。该序列位于与切割位点两侧DNA片段相同的两个同源臂之间。
术语“杂交”是指一种反应,其中一个或多个寡核苷酸,通过核苷酸碱基之间稳定的氢键,形成复合物。该复合物可以包含两条形成双链结构的链,三个或三个更多的链形成多链复合物、单个自杂交链或任何这些的组合。能够与给定序列杂交的序列称为给定序列的“互补”序列。
如本申请所用,同义词“羟基保护基”和“醇保护基”,是指通常与醇基的氧相连的取代基,用于在其他官能团反应时阻断或保护醇官能团。此类醇保护基团的实例包括但不限于2-四氢吡喃基、2-(双乙酰氧基乙氧基)甲基、三苯甲基、三氯乙酰基、碳酸酯型封端基团,例如苄氧基羰基、三烷基甲硅烷基,例如三甲基甲硅烷基、叔丁基二甲基甲硅烷基、叔丁基二苯基甲硅烷基、苯基二甲基甲硅烷基,三异丙基甲硅烷基和二甲苯基二甲基甲硅烷基,酯基,例如甲酰基,(C1-C10)烷酰基,可选地被(C1-C6)烷基、(C1-C6)烷氧基、卤素、单-、二-或三-取代芳基,芳氧基或卤代芳氧基取代、芳酰基,在芳环上的碳被卤素、(C1-C6)烷基、(C1-C6)烷氧基可选地单-、二-或三-取代,其中芳基是苯基、2-呋喃基、碳酸酯、磺酸盐,和醚类如苄基醚、对甲氧基苄基醚、甲氧基甲基醚、2-乙氧基乙基醚等。所用醇保护基团的选择并不重要,只要衍生醇基团对化合物的其他位置上的后续反应稳定,并且可以在适当时去除而不破坏分子的其余部分。J.W.Barton描述了上述术语所指组的其他示例,“有机化学中的保护基团”,J.G.W.McOmie主编,Plenum Press,纽约,纽约,1973年和G.M.Wuts,,T.W.Greene,“有机合成中的保护基团”,John Wiley&Sons Inc.,新泽西州霍博肯,2007年,在此引入作为参考。相关术语“被保护的羟基”或“被保护的醇”定义为如上所述的被保护基取代的羟基。
如本申请所用,术语“氮保护基”是指在氮原子很容易引入和去除的官能团。氮保护基的例子包括但不限于乙酰基(Ac)、三氟乙酰基、Boc、Cbz、苯甲酰基(Bz)、N,N-二甲基甲脒(DMF)、三苯甲基和苄基(Bn)。另见G.M.Wuts、T.W.Greene、“有机合成中的保护基团”,John Wiley&Sons Inc.,新泽西州霍博肯,2007年,及相关出版物。
如本申请所用,术语“缀合”是指用交联试剂以共价交联的方法将药物分子、蛋白质或核酸与其他分子交联。缀合的产物称为“缀合物”。传统药物可以与单克隆抗体连接以提供靶向给药、防止分解、减少免疫原性,并增加循环中的生物利用度。CRISPR RNP复合物可以通过共价或非共价连接其他分子,进行化学修饰。
如本申请所用,术语“缀合位点”是指通过缀合直接与其他分子连接的化学结构。缀合位点可以是氨基酸残基、蛋白质的N-末端或C-末端、核苷、核苷酸或磷酸酯。
如本申请所用,术语“PEG”或“聚乙二醇”是指聚乙二醇链、直链、支链、取代或未取代。线性单PEG链的衍生物包含至少2个PEG亚基。
如本申请所用,术语“聚乙二醇化”是指聚乙二醇(PEG)聚合物链共价或非共价连接融合小分子或/和大分子的过程,例如药物、CRISPR RNP复合物、药用蛋白质或囊泡,生成的产物被描述为经过聚乙二醇化的。聚乙二醇化通常通过PEG反应性衍生物与目标分子的孵育实现。
如本申请所用,术语“聚糖”是指多糖或碳水化合物糖缀合物的一部分,例如糖蛋白、糖脂或蛋白聚糖,即使碳水化合物只是一种寡糖。
如本申请所用,术语“多糖”是指包含大量以糖苷连接的单糖的化合物。
如本申请所用,术语“抗原决定位”、“表位”或“抗原决定簇”是指抗原被免疫***识别的部分,特别是抗原被抗体、B细胞或T细胞识别的部分。表位可以是构象型的或线性的。
如本申请所用,术语“表位掩蔽”是指识别潜在的免疫原性肽序列,并对其进行修饰或去除,以防止其被免疫***识别,同时仍保持原始蛋白质的药用功能。
术语“同位素富集”是指含有至少一个具有不同于该原子的天然同位素组成的原子。“同位素组成”是指给定原子存在的每种同位素的量。“天然同位素组成”是指给定原子天然存在的同位素组成或丰度。如本申请所用,含富集同位素的化合物包含氘、13C、15N和/或18O,其含量与天然同位素组成不同。CRISPR RNP复合物的缀合物可选地在选定位置进行同位素富集,以根据同位素效应优化其药物特性。
如本申请所用,术语“治疗剂”和“治疗剂组合”是指可用于治疗或预防疾病或一种或多种症状的任何药剂。在某些实施方案中,术语“治疗剂”包括本申请提供的化合物。在某些实施方案中,治疗剂是已知可用于、或已经或正在用于治疗或预防疾病或一种或多种症状。
术语“基因治疗”是指改变患者的致病基因或将突变基因的健康序列引入患者以治疗遗传疾病。CRISPR/Cas潜在地可以用于引入位点特异性基因编辑,以纠正引起疾病的突变,或将正确的基因传递到人类基因组中以修复缺陷基因或所需基因。CRISPR/Cas可用于去除和/或灭活游离型如HBV cccDNA和整合的病毒基因组,如HIV前病毒DNA和整合的HBVDNA来治愈这些传染病。
注意,如所使用的,除非上下文另有明确规定,否则,单数形式“a”、“an”和“the”指代包括复数形式。因此,例如,指代“a向导RNA(s)-Cas蛋白(RNP)复合物”可以包括多个这样的复合物。指代“the缀合物”可以包括一种或多种缀合物,及其它对本领域技术人员已知的等价物,等等。还应注意的是,权利要求可能被描述为排除任何可选元素。因此,本声明旨在作为使用此类与权利要求要素有关陈述的排他性术语,如“仅”、“唯一”等,或使用“负面”限制的先行更正。
如本申请所用,术语“约”将根据本领域中普通技术人员所理解,会根据使用它的上下文而在一定程度上有所不同。如果有给定上下文,本领域普通技术人员不清楚该术语的使用时,“约”表示该术语的正负10%。
核苷酸
在一些实施方案中,crRNA和tracrRNA在3′-末端和5′-末端被分别截短:
双链末端通过小分子非核苷酸接头(nNt-linker,ligation1)重新连接,形成二重偶联向导核酸:
在一些实施方案中,双链末端通过四核苷酸环(例如GAAA)连接,形成单分子向导核酸:
在其他实施方案中,tracrRNA是连接的双寡核苷酸(通过连接2,tracrgRNA1和tracrgRNA2之间的内部连接),或多个寡核苷酸。非限制性示例包括:
在一些实施方案中,crRNA和tracrRNA被进一步截短,所得lgRNA的非限制性示例包括:
在一些实施方案中,crRNA和tracrRNA在3′-末端和5′-末端被截短,分别地,双链体末端通过核苷酸接头(例如适体)重新连接,从而提供带有小分子和蛋白质识别模块的扩展单分子gRNA:
在另一个实施方案中,crRNA和tracrRNA分别在3′末端和5′-末端被截短,双链末端由非核苷酸接头-适体缀合物重新连接提供带有小分子和蛋白质识别模块的扩展单分子lgRNA:
在另一个实施方案中,tracrRNA的茎环在GAAA四环处分割,所形成的双链体末端通过非核苷酸接头-适体缀合物重新连接以提供带有小分子和蛋白质识别模块的扩展tracrRNA:
在又一个实施方案中,lgRNA在sgRNA的两个GAAA四环中的任一个或两者通过非核苷酸接头,或5′/3′-末端与适体缀合,以结合小分子或生物聚合物,例如蛋白质或核酸:
在一些实施方案中,crRNA和tracrRNA在3′-末端和5′-末端分别截短,其重复/反重复双链体包含一个凸起和多于12个Watson-Crick碱基对:
在一些实施方案中,crRNA和tracrRNA在tracrRNA 3′端和crRNA的5′-末端通过核苷酸接头或非核苷酸接头连接,分别形成sgRNA或lgRNA;并且该tracrRNA可选地是偶联tracrRNA,其包含一个或多个非核苷酸接头:
在一些实施方案中,双向导RNA、sgRNA和lgRNA是小分子配体、抗体或适体缀合物:
在一些实施方案中,crRNA、双向导RNA、sgRNA和lgRNA是单链模板修复(SSTR)供体DNA模板序列的缀合物。该序列包含一个5′-同源臂和一个下游基因编辑序列,可选地后跟一个3′-同源臂。以下给出非限制性的此类示例:
在某些实施方案中,缀合接头是寡核苷酸。
在某些实施方案中,缀合接头是RNA四核苷酸环,例如ANYA、CUYG、GNRA、UNAC和UNCG,其中N可以是尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤,R是鸟嘌呤或腺嘌呤,Y是尿嘧啶或胞嘧啶。
在某些实施方案中,缀合接头是如在US10,059,940的nNt接头,选自包含在炔烃和叠氮化合物通过由Cu(I)催化或没有Cu(I)催化的[3+2]环加成反应(例如张力促进的叠氮化物-炔烃环加成(SPAAC))形成的***,通过硫醇和马来酰亚胺之间的化学连接形成的硫醚,和其他官能团。
在某些实施方案中,位于基因编辑序列侧翼的同源臂与目标DNA的包含PAM非目标链重叠。
在某些实施方案中,位于基因编辑序列侧翼的同源臂与目标DNA的目标链重叠。
在一些实施方案中,缀合位点是核苷碱基U或C的5位,或核苷碱基7-脱氮鸟嘌呤或7-脱氮腺嘌呤的7-位,或核苷碱基嘌呤的8-位。
在其他实施方案中,缀合位点是crRNA、tracrRNA、单链HDR/SSTR供体模板的(ssDNA)、sgRNA或lgRNA的5′-末端核苷酸糖部分的2′-或5′-位置。
在其他实施方案中,缀合位点是crRNA、tracrRNA、单链HDR/SSTR供体模板(ssDNA)、sgRNA或lgRNA的3′-末端核苷酸糖部分的2′-或3′-位置。
在某些实施方案中,作为非限制性实例,lgRNA-ssDNA缀合物包括以下结构:
在一些实施例中,“基因编辑序列”包括一个或多个选自包括5′-(tga)-3′、5′-(taa)-3′、5′-(tag)-3′、5′-(tga-ntga-ntga)-3′,5′-(tga-ntga-ntaa)-3′,5′-(tga-ntga-ntag)-3′,5′-(tga-ntaa-ntga)-3′,5′-(tga-ntaa-ntaa)-3′,5′-(tga-ntaa-ntag)-3′,5′-(tga-ntga-ntga)-3′、5′-(tga-ntga-ntaa)-3′、5′-(tga-ntga-ntag)-3′、5′-(taa-ntga-ntga)-3′,5′-(taa-ntga-ntaa)-3′、5′-(taa-ntga-ntag)-3′、5′-(taa-ntaa-ntga)-3′、5′-(taa-ntaa-ntaa)-3′、5′-(taa-ntaa-ntag)-3′、5′-(taa-ntga ntga)-3′、5'-(taa-ntga-ntaa)-3'、5'-(taa-ntga-ntag)-3',5'-(tag-ntga-ntga)-3',5'-(tag-ntga-ntaa)-3',5'-(tag-ntga-ntag)-3',5'-(tag-ntaa-ntga)-3',5'-(tag-ntaa-ntaa)-3',5'-(tag-ntaa-ntag)-3',5'-(tag-ntga-ntga)-3',5'-(tag-ntga-ntaa)-3'和5'-(tag-ntga-ntag)-3'的终止密码子序列组,其中n为任意核苷酸,所述多个终止密码子包含重复的所述序列,其间被不存在的或更多的核苷酸分隔,或多个不同的所述序列,序列之间由不存在或更多的核苷酸分隔。
在一些实施例中,“基因编辑序列”包括一种或多种序列,例如终止密码子,以使整合和游离病毒DNA、致癌或动物和人类的致病基因位点失活。
在一些实施例中,“基因编辑序列”包括一种或多种诸如终止密码子之类的序列可以使靶基因失活,并消除有害的脱靶编辑。
在一些实施方案中,“基因编辑序列”包括DNA序列以纠正动物和人类的致癌或致病基因突变。
在其他实施方案中,缀合的单链HDR/SSTR供体模板(ssDNA)与其互补链形成双链体,即HDR供体模板是双链DNA(dsDNA),通过其任一链的接头与向导RNA共价连接。所述链接X和Y可以是相同或不同的核苷酸接头或nNt接头。
在一些实施方案中,所述缀合的寡核苷酸是供体模板,包含与待编辑DNA双链体的靶链或非靶链重叠的两个序列,例如5'-和3'-同源臂,和基因编辑序列。所述两个序列位于所述基因编辑序列侧翼,可选地经过化学修饰。并且,所述3'-同源臂包含5至17个经过或未经过化学修饰的DNA片段,其与向导RNA靶区的5'-末端序列互补。所述3'-同源臂的5'-末端连接一个包含所述基因编辑序列。所述基因编辑序列和5'-同源臂寡核苷酸作为DNA修复的模板(即图4和5)。
在一些实施方案中,所述缀合的寡核苷酸是供体模板,包含与待编辑DNA双链体的靶链或非靶链重叠的两个序列,例如5′-和3'-同源臂,和基因编辑序列。所述两个序列位于所述基因编辑序列侧翼,可选地经过化学修饰。并且,所述3′-同源臂包含5至17个经过或未经过化学修饰的DNA或DNA/RNA嵌合体片段,与被切割DNA链的5'-末端序列(包含3‘-OH)互补。该5′-末端序列也是DNA链增长的引物。所述3'-同源臂的5'-末端连接一个包含所述基因编辑序列。所述基因编辑序列和5'-同源臂寡核苷酸作为DNA修复的模板(即图4和5)。
在一些实施方案中,所述缀合的寡核苷酸是用于DNA修复的供体模板或作为第二个寡核苷酸通过互补杂交桥接的分子。
非核苷酸接头(nNt-接头)
通过化学连接形成的nNt-接头包含如下作为非限制性实例的M核心结构式M-1至M-13:
其中X=O、S、NH或CH2,m=0至3,和n=0至3,
和两个包含作为非限制性实例结构式L-1至L-23的L接头:
其中m=0到16和n=0到16,
所述L个接头和所述M个核心结构连接为L-M-L,其中两个L接头相同或不同,并且每个L任选地包含一种或多种结构式L-1至L-23或式L-1至L-23的部分结构,并连接至两个末端核苷酸。以Nuc-1至Nuc-18为非限制性示例:
其中连接的位置是L-M-L的和上游和下游寡核苷酸的其中R是H,OH,CH2OH,F,NH2,OMe,CH2OMe,OCH2CH2OMe,烷基,环烷基,芳基或杂芳基,R'是H,OH,CH2OH,F,NH2,OMe,CH2OMe,OCH2CH2OMe,烷基、环烷基、芳基或杂芳基,Q是天然或非天然核酸碱基。
在一些实施方案中,M核心结构、L和末端核苷酸是可选地用取代基修饰,如卤素(F、Cl、Br、I)、C1-C6的低级烷基、卤代(F,Cl,Br,I)C1-C6的低级烷基,C2-C6的低级烯基,卤代(F,Cl,Br,I)C2-C6的低级烯基、CN、C2-C6的低级炔基、卤化(F、Cl、Br、I)的低级炔基C2-C6,C1-C6的低级烷氧基,卤化(F、Cl、Br、I)的C1-C6低级烷氧基,经过或未经过取代的芳基、经过或未经过取代的杂芳基、经过或未经过取代的磺酰基,或经过或未经过取代的酰基,其包括但不限于C(=O)烷基、NR'2、CN、CO2H、CO2R'、CONH2、CONHR'、CONR'2、CH=CHCO2H或CH=CHCO2R',其中R'是任选的取代的烷基,包括但不限于H、经过或未经过取代的C1-C20烷基、经过或未经过取代的低级烷基、经过或未经过取代的环烷基、经过或未经过取代的C2-C6的炔基、经过或未经过取代C2-C6低级烯基、经过或未经过取代的芳基、经过或未经过取代的杂芳基、经过或未经过取代的磺酰基或经过或未经过取代的酰基,包括但不限于C(=O)烷基,或者,在NR'2的情况下,每个R'包含至少一个C原子,这些C原子连接形成包含至少两个碳的杂环。
在一些实施方案中,nNt-接头连接crRNA的3'-末端核苷酸和tracrRNA的5'-末端核苷酸。在一些实施例中,nNt-接头连接crRNA的5′-末端核苷酸和tracrRNA的3'-末端核苷酸。在一些在实施方案中,nNt-接头连接tracrRNA的两个寡核苷酸片段。
在一些实施方案中,nNt-接头(L-M-L)中的两个L之一共价连接至向导RNA,另一个L共价连接至PEG聚合物、非PEG聚合物、细胞受体的配体、脂质、寡核苷酸、抗体、多糖或多肽。
在一些实施方案中,nNt-接头(L-M-L)中的两个L之一共价连接至Cas蛋白暴露的氨基酸残基,如赖氨酸、丝氨酸和半胱氨酸,另一个L与PEG聚合物、非PEG聚合物、细胞受体的配体、脂质、寡核苷酸、抗体、多糖或肽共价连接。
在一些实施方案中,两个核苷酸/核苷之间的nNt-接头由以下结构式表示:
CRISPR效应子蛋白
在一些实施方案中,CRISPR效应核酸内切酶选自II型2类Cas蛋白质,包括酿脓性链球菌衍生的Cas9(SpCas9,4.1kb),较小的Cas9直系同源物,包括金黄色葡萄球菌衍生的Cas9(SaCas9,3.16kb),来自空肠弯曲杆菌的Cas9(CjCas9,2.95kb)、嗜热链球菌Cas9(St1Cas9,3.3kb)、脑膜炎奈瑟菌(NmCas9,3.2kb)和工程化的许多Cas9其他变体蛋白质,例如SpCas9-HF1、eSpCas9和HypaCas9,V型蛋白质,第2类,包括Cas12(Cas12a(Cpf1)、Cas12b(C2c1)、Cas 12c、Cas12e、Cas12g、Cas12h、Cas12i等)和Cas14,VI型2类蛋白质,例如Cas13a和Cas13b。所述CRISPR效应子蛋白可以是切口酶,例如SpCas9-切口酶(D10A或H840A),或无催化活性的蛋白例如Cas9(dCas9)与蛋白质效应子(如)在N-端或C-端偶联/融合,如FokI、转录激活蛋白、转录阻抑蛋白、DNA甲基转移酶的催化结构域、组蛋白乙酰转移酶和脱乙酰酶、逆转录酶(prime editor)和核酸脱氨酶(碱基编辑器)。
在另一个实施方案中,所述CRISPR效应核酸内切酶是人工的蛋白,包含一个或多个源自人类的功能域。
在又一个实施方案中,所述CRISPR效应子核酸内切酶是通过定点诱变功能化2类CRISPR Cas蛋白以引入正交结合位点,例如半胱氨酸,并去除有害的结合位点(例如SpCas9中的C80),相应的RNP缀合物是通过选择性缀合制备的,例如通过马来酰亚胺化学的半胱氨酸聚乙二醇化。
在又一个实施方案中,RNP复合物缀合物通过以下方式合成:与交联剂反应,或通过酶催化反应,如胺转移酶TGase催化PEG末端的伯胺与谷氨酰胺的羧酰胺反应。
编码CAS蛋白或Cas-tracrRNA复合物的组织向性病毒载体
在一些实施方案中,所述编码Cas效应子Cas9或Cas9-tracrRNA复合物等核酸内切酶的病毒载体是逆转录病毒、慢病毒、腺病毒、AAV,或杆状病毒。
在一些实施方案中,所述编码Cas效应子Cas9或Cas9-tracrRNA复合物等核酸内切酶的病毒载体是一种工程化AAV或AAV嵌合体,通过改变AAV衣壳的向性,在目标组织上实现高转导效率,并通过避免人类先前存在的抗AAV衣壳中和抗体而具有低免疫原性。
在一些实施方案中,所述编码Cas效应子Cas9或Cas9-tracrRNA复合物等核酸内切酶的病毒载体是天然的或工程改造的AAV,以实现脑组织靶向递送。此类AAV血清型包括非限制性实例AAV1、AAV2/DJ、AAV2/DJ8、AAV2g9、AAV2-retro和scAAV9。
在一些实施方案中,所述编码Cas效应子Cas9或Cas9-tracrRNA复合物等核酸内切酶的病毒载体是天然的或工程改造的AAV,以实现肝组织靶向递送。此类AAV血清型包括非限制性实例AAV8和AAV3。
在一些实施方案中,所述编码Cas效应子Cas9或Cas9-tracrRNA复合物等核酸内切酶病毒的载体是天然的或工程改造的AAV,以实现肌肉组织靶向递送。此类AAV血清型包括非限制性实例AAV6、AAV8和AAV9。
在一些实施方案中,所述编码Cas效应子Cas9或Cas9-tracrRNA复合物等核酸内切酶的病毒载体是天然的或工程改造的AAV,以实现心脏组织靶向递送。此类AAV血清型包括非限制性实例AAVrh74和AAV9。
在一些实施方案中,所述编码Cas效应子Cas9或Cas9-tracrRNA复合物等核酸内切酶的病毒载体是天然的或工程改造的AAV,以实现视网膜组织靶向递送。此类AAV血清型包括非限制性实例AAV1、AAV2、AAV5、AAV8和AAV9。
在一些实施方案中,所述编码Cas效应子Cas9或Cas9-tracrRNA复合物等核酸内切酶的病毒载体是天然的或工程改造的AAV,以实现肺组织靶向递送。此类AAV血清型包括非限制性实例AAV9。
在一些实施方案中,所述病毒载体Cas效应子核酸内切酶的表达,例如Cas9,或Cas9-tracrRNA复合物,由可诱导的组织特异性启动子驱动。
在一些实施方案中,所述病毒载体Cas效应子核酸内切酶的表达,例如Cas9,或Cas9-tracrRNA复合物,由脑组织特异性启动子驱动,例如非限制性例子pMecp2、hSyn1、TRE3G和EFS。
在一些实施方案中,所述病毒载体的Cas效应子核酸内切酶的表达,例如Cas9,或Cas9-tracrRNA复合物,由肝组织特异性启动子驱动,例如非限制性实例TBG和HCRhAATp等,或肺组织特异性启动子例如非限制性实例EFS。
在一些实施方案中,所述病毒载体Cas效应子核酸内切酶的表达,例如Cas9,或的Cas9-tracrRNA复合物,由心脏组织特异性启动子驱动,如非限制性实例CMV、Myh6、CB和CK7-miniCMV。
在一些实施方案中,所述病毒载体的Cas效应子核酸内切酶的表达,例如Cas9,或Cas9-tracrRNA复合物,由视网膜组织特异性启动子驱动,如非限制性实例EFS、CMV、Spc512、pMecp2和Picam2。
在一些实施方案中,所述病毒载体的Cas效应子核酸内切酶的表达,例如Cas9,或Cas9-tracrRNA复合物,由肌肉组织特异性启动子驱动,如非限制性实例CMV、EFS和CK8。
在一些实施方案中,局部或***施用所述编码Cas效应子核酸内切酶如Cas9或Cas9-tracrRNA复合物的病毒载体,以优化动物和人类的组织靶向递送。注射部位是静脉注射,皮下、肌肉内、皮内、腹膜内、玻璃体内、鼻内、气管内、视网膜下、眼内或心内或其他部位。化学修饰的lgRNA、sgRNA、crRNA或其缀合物在水溶液中以无转染方式、或与转染试剂、或在非病毒载体中通过共同注射或单独注射。
在一些实施方案中,所述编码Cas效应子内切核酸酶如Cas9或Cas9-tracrRNA复合物的病毒载体施用于分离的细胞,包括T细胞等,然后,化学修饰的lgRNA或crRNA通过电穿孔或显微注射,或与转染试剂或在非病毒载体中施用。
RNP复合物的非病毒递送
在一些实施方案中,向导RNA缀合物、向导RNA-Cas蛋白质(RNP)复合物的缀合物,例如聚乙二醇化RNP复合物,或lgRNA缀合物和编码Cas-NLS蛋白的mRNA混合物与用于递送核酸治疗药物的脂质一起递送,如DOPE、DOTAP、DOPS、DLin-MC3-DMA、cKK-E12、DSPC、POPE、503O13、PEG-DMG、生物还原性脂质8-O14B、胆固醇等。
在其他实施方案中,向导RNA-Cas蛋白(RNP)的缀合物如聚乙二醇化RNP复合物等在脂质纳米颗粒、脂质体、或外泌体内递送。
在又一个实施方案中,向导RNA(s)缀合物和编码Cas蛋白的mRNA在脂质纳米颗粒、脂质体或外泌体中递送。
在又一个实施方案中,向导RNA的缀合物与脂质或多肽,或在脂质纳米颗粒、脂质体或外泌体内被递送到稳定或诱导细胞表达Cas蛋白,或与编码Cas蛋白的病毒载体共同递送。
在又一个实施方案中,crRNA的缀合物与脂质或多肽,或在脂质纳米颗粒、脂质体或外泌体中被递送到稳定或诱导地表达Cas9蛋白和tracrRNA的细胞,或与编码Cas9蛋白和tracrRNA的病毒载体共同递送。
在一些实施方案中,所述crRNA,或lgRNA,或sgRNA,或它们的向导RNA(s)-Cas蛋白(RNP)复合物的缀合物或缀合物通过电穿孔或显微注射给药。
RNP复合物的缀合物
本发明的一个方面涉及向导RNA-Cas蛋白质(RNP)复合物的缀合物,例如聚乙二醇化的CRISPR Cas蛋白引导RNA复合物,由缀合预先形成的向导RNA-CRISPR-Cas RNP(s)(如例RNP-I)制备,
或通过Cas蛋白的位点选择性缀合,再与向导RNA复合形成RNP复合物制备。其中,向导RNA是lgRNA、crRNA、sgRNA或双向导RNA。其中,Cas蛋白质是Cas9,包含一个核酸酶叶(NUC)和一个识别叶(REC),工程化的Cas9,或此处所述酿脓性链球菌Cas9的例子以外的Cas蛋白。其中,向导lgRNA由双模块(crRNA和tracrRNA)和单个nNt接头组成,或由化学连接形成的双重或多重nNt接头(lgRNA),连接位点优选为位于四核苷酸环(A32-U37)和/或茎2(C70-G79)(以酿脓性链球菌Cas9的sgRNA为例),而sgRNA的任何3'、5′-磷酸二酯都可以作为连接位点、替换为nNt-Linker。其中,向导RNA被化学修饰,并可选地与一个或多个分子缀合,这些分子选自PEG、非PEG聚合物、细胞受体的配体、脂质、寡核苷酸、抗体、多糖和多肽。
本发明的另一方面涉及编码CRISPR-Cas9-tracrRNA二元RNP复合物的病毒载体或质粒,(以RNP-II为例),该二元RNP复合物在靶细胞中进一步与crRNA或其缀合物复合。其中,Cas9包含核酸酶叶(NUC)和识别叶(REC),可以是酿脓性链球菌Cas9例子之外的Cas蛋白,也可以是工程化的Cas蛋白。
本发明的另一方面涉及聚乙二醇化的CRISPR Cas蛋白-向导RNA复合物。其中,向导RNA是crRNA、双向导RNA、sgRNA或lgRNA。
本发明的另一方面涉及CRISPR Cas蛋白与一个或多个分子的缀合物,该分子选自PEG、非PEG聚合物、细胞受体的配体分子、脂质、寡核苷酸、抗体、多糖和多肽。
本发明的另一方面涉及CRISPR Cas蛋白-向导RNA复合物的缀合物。其中,向导RNA是crRNA、双向导RNA、sgRNA或lgRNA的缀合物,具有一个或多个用于基因编辑供体模板的单链DNA(ssDNA)。
本发明的另一方面涉及CRISPR Cas蛋白-向导RNA复合物的缀合物。其中,向导RNA是crRNA、双向导RNA、sgRNA或lgRNA的缀合物,具有一个或多个用于基因编辑供体模板的单链DNA(ssDNA)。其中,CRISPR Cas蛋白与一个或多个分子缀合,这些分子包括PEG、非PEG聚合物、细胞受体的配体、脂质、寡核苷酸的组,抗体、多糖和多肽。
以下是聚乙二醇化试剂的一些非限制性实例。
PEG可以是直链的或支链的,与Cas蛋白的赖氨酸或半胱氨酸残基缀合:
本发明的另一方面涉及Cas蛋白-向导RNA复合物的脂质缀合物,其通过预先形成的CRISPR-Cas RNP复合物与脂质缀合制备,或通过Cas蛋白位点选择性地与脂质缀合,然后与向导RNA形成RNP复合物而制备。
以下是脂质缀合试剂的一些非限制性实例:
本发明的另一方面涉及Cas蛋白向导RNA复合物的肽缀合物,其通过预先形成的CRISPR-Cas RNP复合物与肽缀合制备,或通过Cas蛋白位点选择性地与肽缀合,然后与向导RNA形成RNP复合物而制备。非限制性示例包括核定位信号(NLS)短肽的缀合物。
本发明的另一方面涉及Cas蛋白-向导RNA复合物与细胞受体小分子配体的缀合物,其通过预先形成的CRISPR-Cas RNP复合物与小分子配体缀合制备,或通过Cas蛋白位点选择性地与小分子配体缀合,然后与向导RNA形成RNP复合物而制备。非限制性实例包括去唾液酸糖蛋白受体配体(ASGPrL),例如N-乙酰半乳糖胺(GalNAc)和乳糖酸。
本发明的又一方面涉及Cas蛋白-向导RNA复合物与碳水化合物的缀合物,其通过预先形成的CRISPR-Cas RNP复合物与碳水化合物缀合制备,或通过Cas蛋白位点选择性地与碳水化合物缀合,然后与向导RNA形成RNP复合物而制备。非限制性实例包括寡糖和多糖。
本发明的又一方面涉及工程改造Cas9蛋白的缀合物,其在C80发生突变,并通过定点诱变引入一个或多个半胱氨酸,以进行位点选择性缀合。
本发明涉及一种或多种向导RNA-Cas蛋白(RNP)复合物缀合物的组合物,及其治疗病毒感染,和基于基因调控、破坏和/或校正以治疗疾病的药物用途。缀合物包含向导RNA-Cas蛋白(RNP)复合物和一个或多个选自以下的分子,包括PEG、非PEG聚合物、细胞受体的配体、脂质、寡核苷酸的组,抗体、多糖、聚糖和肽。这些分子与Cas蛋白和/或向导RNA化学连接。
所述使用可选地包括递送HDR模板,其中,所述模板表达正常或异常较少的蛋白质,以减轻或消除病症或疾病状态。所述HDR模板可选地化学连接到向导RNA和/或Cas蛋白。
本发明的一些方面涉及供体模板,其包含“基因编辑序列”,该序列包含一个或多个基因调控序列或终止密码子。在一些实施方案中,供体模板与引导RNA缀合,是lgRNA的一部分。
本发明的一些方面涉及聚乙二醇化的CRISPR-Cas9-lgRNA缀合物和转染试剂***。
本发明的一些方面涉及使用向导RNA(s)-Cas蛋白(RNP)复合物的缀合物,例如聚乙二醇化CRISPR-Cas9-lgRNA-缀合***,用于针对前病毒DNA、或整合病毒DNA、或游离环状脱氧核糖核酸的抗病毒治疗。
在一些实施方案中,靶向HBV病毒基因组的非限制性实例序列包括:
ctctgctagatcccagagtg[aGG],(序列号:41)
gctatcgctggatgtgtctg[cGG],(序列号:42)
tggacttctctcaattttct[a[G[G]G]G]],(序列号:43)
gggggatcacccgtgtgtct[tGG],(序列号:44)
tatgtggatgatgtggtactgg[gGG],(序列号:45)
cctcaccatacagcactc[gGG],(序列号:46)
gtgttggggtgagttgatgaatc[tGG],(序列号:47)
其中[]中的核苷酸是PAM,或紧邻PAM序列、17-20nt长的任何序列。
在一些实施方案中,药用Cas9-lgRNA RNP缀合物包含靶向病毒基因组中不同位点的多个lgRNA(多重编辑)。
在一些实施方案中,多个crgRNA,包括但不限于YMDD序列及其在HBV聚合酶催化结构域的突变,对应于
tatgtggatgat gtggtactgg[gGG],(序列号:48)
tatatggatgat gtggtattgg[gGG],(序列号:49)
tatgtggatgat gtggtattgg[gGG],(序列号:50)
tatatagatgat gtggtactgg[gGG],(序列号:51)
连接到tracrgRNA以产生lgRNA的混合物,从而形成Cas9-lgRNARNP缀合物的混合物,以针对基于直接作用抗病毒剂(DAA)治疗中的耐药性。
在一些实施方案中,靶向HIV病毒基因组序列的非限制性实例包括:
gattggcaga actacacacc[aGG],(序列号:52)
atcagatatc cactgacctt[tGG],(序列号:53)
gcgtggcctg ggcgggactg[gGG],(序列号:54)
cagcagttct tgaagtactc[cGG],(序列号:55)
其中[]中的核苷酸是PAM,或紧邻PAM序列、17-20nt长的任何序列。
在一些实施方案中,靶向疱疹病毒科病毒如HSV和EBV病毒基因组序列的非限制性实例包括:
gccctggaccaacccggccc[gGG],(序列号:56)
ggccgctgccccgctccggg[tGG],(序列号:57)
ggaagacaatgtgccgcca[tGG],(序列号:58)
tctggaccagaaggctccgg[cGG],(序列号:59)
gctgccgcggagggtgatga[cGG],(序列号:60)
ggtggcccaccgggtccgct[gGG],(序列号:61)
gtcctcgagggggccgtcgc[gGG],(序列号:62)
其中[]中的核苷酸是PAM,或紧邻PAM序列、17-20nt长的任何序列。
在一些实施方案中,靶向基因组序列的非限制性实例包括紧邻PAM序列的,17-20nt的基因编码内源性T细胞受体(TCR)、HLA I类(HLA-I)或T细胞抑制性受体或信号分子,例如程序性细胞死亡蛋白1(PD1)和细胞毒性T淋巴细胞相关蛋白4(CTLA4)。
本发明的其他方面涉及所述CRISPR-Cas蛋白-向导RNA缀合***用于基因治疗和人类传染病的治疗。
在一些实施方案中,靶向序列是包含引起疾病突变的人类基因组序列,例如
5’-aaa gaa aat atm mmt ggt gtt-3’(序列号:63),
其中m是突变。“基因编辑序列”包括
5’-aaa gaa aat atc ttt ggt gtt-3’(序列号:64)。
下面给出了人类单基因疾病的非限制性例子(表格1)。其他例子包括人类多基因疾病,例如心脏病和糖尿病。
表1.单基因疾病及其患病率示例
具体实施方式
本说明书中引用的所有出版物和专利均通过以下方式并入本申请参考,每个单独的出版物或专利都被具体地和单独地表明通过引用并入本申请,并通过引用相关出版物以公开和描述本申请的方法和/或材料。任何引用出版物是在申请日期之前披露的,不应被解释为承认本公开无权依据在先公开而早于此类公开。此外,提供的发布日期可能与实际发布日期不同,可能需要独立确认。
本公开不限于所描述的特定实施例,可以变通。还应理解,本申请使用的术语仅是为了描述于本发明的范围特定的实施例,而不是限制性的,本公开将仅受所附权利要求的限制。
如本领域技术人员在阅读本公开内容后将显而易见的,本申请描述和说明的各个实施例具有分立的组件和特征,可以很容易地与其他实施例的任何组件和特征在不脱离本公开的范围或精神的情况下分离或组合。任何所叙述的方法可以按照所述事件的顺序或以任何其他合乎逻辑的顺序来执行。
实施例
以下实施例进一步说明所公开的实施例,本发明不受这些实施例的限制。
实施例1:
SaCas9 crRNA-GalNAc缀合物的合成
步骤1.使用2′-TBS保护的具有A、G和C核碱基的叔丁基苯氧基乙酰基保护的RNA亚磷酰胺单体和未受保护的尿嘧啶制备3′-氨基-crRNA。乙腈中的0.3M苄基硫代四唑(LinkTechnologies)用作偶联剂,叔丁基苯氧基乙酸酐作为封端剂,0.1M碘作为氧化剂。寡核苷酸合成在Applied Biosystems 394自动化DNA/RNA合成仪上进行;使用标准的1.0μmoleRNA亚磷酰胺循环。CPG上的尿苷如前所述(US20160215275A1)制备,并填充到扭转柱中。使用前,所有β-氰乙基亚磷酰胺单体都溶解在无水乙腈中至浓度为0.1M。逐步偶联效率由三苯甲基阳离子电导率自动监测确定,在所有情况下均>97.5%。
然后通过用在DMF中的20%哌啶处理来Fmoc去保护。所得到的3′-末端氨基乙基寡核苷酸产物,然后用6-叠氮基己酸的NHS酯在DMF中处理。
从固体支持物切除寡核苷酸和去保护是通过在室温下暴露于浓氨水/乙醇(3/1v/v)2小时实现,然后在密封管中在55℃下加热45分钟,在1.0M TBAF在THF中24小时脱硅烷,得到3′-叠氮化物-crRNA。
或者,跳过与NHS酯反应的步骤,上述将得到的完全去保护的寡核苷酸溶解在0.5MNa2CO3/NaHCO3缓冲液(pH 8.75)中,并与在DMSO中的琥珀酰亚胺基-6-叠氮基己酸酯(20eq.)一起孵育,得到3′-azide-crRNA。
步骤2.室温下、向0.2M NaCl(50μL)中加入tri-GalNAc-炔烃(0.2nmol)和3′-叠氮化物-crRNA(0.2nmol,再加入三羟丙基***配体(28nmol,在42μL 0.2M NaCl中)、抗坏血酸钠(40nmol,在4μL 0.2M NaCl中)和CuSO4.5H2O(4nmol,在4.0μL 0.2M NaCl中),在氩气下、将反应混合物保持在室温下至所需时间,再添加甲酰胺(50μL)。直接上样到20%聚丙烯酰胺电泳凝胶,进行反应样品分析。反相HPLC纯化后,得到crRNA-tri-GalNAc缀合物。
实施例2:Cas9::crRNA-GalNAc::tracrRNA复合物
Cas9蛋白:
重组Cas9蛋白可从New England BioLabs,Inc.和其他供应商获得,或通过常规使用的方案从大肠杆菌中表达和纯化而获得(Anders,C.和Jinek,M.Methods Enzymol.2014,546,1-20)。Cas9蛋白的纯度和浓度通过SDS-PAGE分析。
Cas9::crRNA-GalNAc::tracrRNA复合物:
tracrRNA按报道在Applied Biosystems 394自动化DNA/RNA合成仪上合成。Cas9、crRNA-GalNAc和tracrRNA在预孵育裂解缓冲液中,以1:5:5摩尔比例混合,重构Cas9::crRNA-GalNAc::tracrRNA(RNP)复合物。
或者,tracrRNA通过RNA聚合酶,例如噬菌体T7 RNA聚合酶,体外转录而制备。
实施例3:CRISPR-Cas RNP复合物的聚乙二醇化
RNP(向导RNA-Cas蛋白)复合物的聚乙二醇化在不同的m-PEG-pNP或m-PEG-NHS的浓度下进行。2mg/mL在生理盐水中的RNP与1.5mL微量离心管中不同浓度的m-PEG-pNP或m-PEG-NHS(0.5、1、2、4和6mg/mL)一起孵化。反应在30℃下进行3小时。所得聚乙二醇化的RNP复合物无需进一步纯化,根据报告的程序用于体外DNA切割。
或者,在其在-80℃储存或使用之前,聚乙二醇化RNP复合物的尺寸通过排除色谱(SEC)纯化:在Akta Purifier上,使用HiLoad 16/60S200 superdex柱和凝胶过滤缓冲液(20mM HEPES pH 7.5,150mM KCl,10%(v/v)甘油),流速为1mL/min。PEG化RNP复合物的加载体积不超过1mL。
实施例4:表达和纯化SpCas9(Cys-SpCas9:M1C,C80A、S145C、S204C、S469C、S1159C)
含有氨基酸取代的SpCas9表达质粒通过标准PCR和分子克隆制备。
引物在Applied Biosystems 394DNA/RNA自动化合成仪上合成。使用标准1.0μmole DNA亚磷酰胺循环。核-CPG支持物被填充到扭曲柱中。所有β-氰乙基亚磷酰胺单体都是在立即使用前溶解在无水乙腈中,至浓度为0.1M。逐步耦合效率由三苯甲基阳离子电导率自动监测确定,所有步骤均>99%。
Cys-SpCas9在大肠杆菌菌株Rosetta 2DE3细胞中表达,蛋白质分离和纯化如文献所述(Anders,et al.Methods Enzymol.2014,546,1-20)。
实施例5:Cys-SpCas9蛋白的聚乙二醇化
Cys-SpCas9蛋白在不同浓度的m-PEG-马来酰亚胺中聚乙二醇化。在1.5-mL微量离心管中,用在盐水中不同浓度的m PEG-马来酰亚胺(0.5、1、2、4和6mg/mL)孵育2mg/mL的蛋白质。反应在30℃下进行3小时。
在其在-80℃储存或使用之前,聚乙二醇化RNP复合物的尺寸通过排除色谱
(SEC)纯化:在Akta Purifier上,使用HiLoad 16/60S200 superdex柱和凝胶过滤缓冲液(20mM HEPES pH 7.5,150mM KCl,10%(v/v)甘油),流速为1mL/min。PEG化RNP复合物的加载体积不超过1mL。
实施例6:Cys-SpCas9::lgRNA复合物
聚乙二醇化Cys-SpCas9蛋白和lgRNA在DNA切割缓冲液中,以1:2摩尔比例重组为Cas::lgRNA复合物。所得聚乙二醇化的RNP复合物无需进一步纯化,根据报告的程序用于体外DNA切割。
实施例7:ON-1(序列号:66)
除了寡核苷酸在其3'-末端被截短,ON-1的合成方式类似于在实施例1。寡核苷酸从固相被切割下,并完全脱保护和纯化,如实施例1所述。
示例8:ON-2
除了使用了与Fmoc-己胺连接的固相载体,ON-2的合成类似于ON-1的合成。其中,使用2'-炔丙基腺苷亚磷酰胺用于引入炔烃。
然后,在DMF中的20%哌啶中Fmoc去保护。在DMF中用6-马来酰亚胺己酸的NHS酯与所得3'-末端氨基己基寡核苷酸反应。
从固体支持物切割寡核苷酸和完全去保护的实现如下:在室温下暴露于浓氨水/乙醇(3/1v/v)2小时,然后在密封管中在55℃下加热45分钟,然后在THF中的1.0MTBAF中脱硅烷24小时。
或者,跳过与NHS酯反应的步骤,将上述得到的完全去保护的寡核苷酸溶解在0.5MNa2CO3/NaHCO3缓冲液(pH 8.75)中,然后与在DMSO中的6-马来酰亚胺己酸(20eq.)的NHS酯一起孵育,得到ON-2。
实施例9:ON-3(序列号:68)
炔烃ON-1和叠氮化物ON-2(各0.2nmol)在0.2M NaCl中的溶液(50μL)在室温下退火30分钟。同时,在氩气下,加入三羟丙基***配体(28nmol,在42μL 0.2MNaCl中)、抗坏血酸钠(40nmol,在4μL 0.2M NaCl中)和CuSO4.5H2O(4nmol,在4.0μL 0.2M NaCl中)。将反应混合物保持在室温下至所需时间,再添加甲酰胺(50μL)。直接上样到20%聚丙烯酰胺电泳凝胶,进行反应样品分析。反相HPLC纯化,得到产品。
实施例10:ON-4(序列号:69)
ON-4以类似于实施例4中引物合成的方式合成。
从固相支持物切割寡核苷酸和去保护实现如下:在室温下暴露于浓氨水/乙醇(3/1v/v)2小时,然后在密封管中在55℃下加热45分钟。
实施例11:lgRNA-ssDNA(序列号:70)和sgRNA-ssDNA(序列号:72)
携带马来酰亚胺基的ON-3寡核苷酸与5'-SH寡核苷酸(ON-4,1:1摩尔比),在0.1M乙酸三乙铵(TEAA)中、pH 7.0、在室温下孵育过夜。通过HPLC分析和分离反应混合物,得到lgRNA ssDNA。
或者,ON-3寡核苷酸被携带马来酰亚胺基团(ON-5(序列号:71))的sgRNA取代,该sgRNA由在末端脱氧核苷酸转移酶(TdT)存在时酶促单核苷酸加成,然后通过胺与NHS化学反应引入马来酰亚胺基团。所述3'-末端的胺是由尿苷三磷酸类似物引入的。
将携带马来酰亚胺基的ON-5寡核苷酸与5'-SH寡核苷酸(ON-4,1:1摩尔比)在0.1M醋酸三乙铵(TEAA)中、pH 7.0、在室温下孵育过夜。通过HPLC分析和分离反应混合物,得到sgRNA-ssDNA产物。
实施例12:ssDNA(-3’,5’-)lgRNA(序列号:73)
将3'-末端带有马来酰亚胺基的ssDNA寡核苷酸与5'-SH-lgRNA(1:1摩尔比)在0.1M乙酸三乙铵(TEAA)中、pH 7.0、在室温下孵育过夜。通过HPLC分析和分离反应混合物,得到ssDNA-lgRNA产物。
实施例13:Cys-SpCas9::ssDNA-lgRNA复合物
PEG化的Cys-SpCas9蛋白和ssDNA-lgRNA在在DNA切割缓冲液中以1:2的摩尔比重组Cas9::ssDNA-lgRNA复合物。聚乙二醇化的RNP复合物无需进一步纯化,根据文献报告的步骤用于DNA切割/编辑。
实施例14:Cys-SpCas9-切口酶(H840A)::ssDNA-lgRNA复合物
在DNA切割缓冲液中以1:2的摩尔比,预孵育Cys-SpCas9-切口酶(H840A)缀合物和ssDNA-lgRNA,重组Cas9::ssDNA-lgRNA复合物。RNP复合物无需进一步纯化,根据文献报告的步骤用于DNA切割/编辑。
实施例15:细胞转染和Cas9::ssDNA-lgRNA活性分析
a.阳离子脂质转染(Liu,D.et al.Nature Biotechnology 2015,33,73–80):
纯化的合成ssDNA-lgRNA或合成ssDNA-lgRNA的混合物与纯化的Cas9蛋白孵育5分钟,然后,在OPTIMEM媒介里与阳离子脂质试剂复合。将所得混合物在37℃下应用于细胞4小时。
b.用细胞穿透肽转染(Kim,H.et al.Genome Res.2014,24:1012-1019):
细胞穿透肽(CPP)与纯化的重组Cys Cas9蛋白的缀合:在PBS(pH 7.4)中,将1mgCas9蛋白(2mg/mL)与50μg 4-马来酰亚胺丁酰GGGRRRRRRRRRLLLL(m9R;2mg/mL)逐滴混合,然后室温下在旋转器上孵育2小时。为了去除未缀合的9mR,使用50kDa分子量截止膜,将样品在DPBS(pH7.4)中、在4℃下、透析24小时。从透析膜收集Cys-Cas9-m9R蛋白,并使用Bradford方法(Biorad)测定蛋白质浓度。
合成的ssDNA-lgRNA或合成的ssDNA-lgRNA的混合物与CPP复合:将1μl去离子水中的ssDNA-lgRNA(1μg)小心地加入的在100μl DPBS(pH 7.4)中的C3G9R4LC肽(9R)。ssDNA-lgRNA:肽重量比范围为1:2.5至1:40。将该混合物在室温下孵育30分钟,并使用不含RNase的去离子水稀释10倍。
150μl Cys-Cas9-m9R(2μM)蛋白与100μl ssDNA-lgRNA:9R复合物混合(10:50μg),所得混合物在37℃下应用于细胞4小时。Cys-Cas9-m9R和ssDNA-lgRNA:9R也可以依次应用于细胞。
实施例16:细胞中的抗HBV
抗病毒测定根据文献报道的方法进行(Hu,W.et al.Proc Natl Acad Sci USA2014,110:11461–11466;Lin,Su.et al.Molecular Therapy-Nucleic Acids,2014,3,e186)。其中,细胞递送是基于阳离子脂质或CPP的Cys-Cas9-ssDNA-lgRNA复合物递送,而不是文献所述的使用gRNA/Cas9表达的质粒转染/转向导量。
或者,用ssDNA-lgRNA和编码Cas9蛋白的mRNA(ssDNA-lgRNA/mRNA~10:1)处理细胞,二者可以作为混合物或顺序在LNP中递送。或用在LNP中的ssDNA-lgRNA和编码Cas9蛋白的AAV载体处理细胞。其中,LNP配制胺与RNA-磷酸盐的比例约为3-6(N:P)。
实施例17:嵌合小鼠中的抗HBV
在HBV感染的嵌合小鼠中的抗病毒测定是根据文献所述方法。实施例使用Cys-Cas9-ssDNA-lgRNA RNP复合物的缀合物,而不是小干扰RNA(Thi,E.P.and et al.ACSInfec.Dis.2019,5,725-737)。所有动物都是在特定的无病原体条件下、按照由美国国立卫生研究院的实验动物道德准则培育。cDNA-uPA/SCID(cDNA-uPA(+/wt)/SCID(+/+))半合子小鼠如所述产生。冷冻保存的人肝细胞(2-岁的女性,西班牙裔,BD195,BD Biosciences)被移植到在麻醉下的、2-4周大的半合子cDNA-uPA/SCID小鼠的脾脏。扩张人类肝细胞10-12周,通过使用临床化学分析仪(BioMajesty系列JCA-BM6050,JEOL Ltd.)、用胶乳凝集免疫比浊法(LZ Test“Eiken”U-ALB,Eiken Chemical Co.,Ltd.)测量从尾静脉收集血液中的人白蛋白(h-Alb)更换指数。h-Alb浓度超过7.0mg/mL的雄性嵌合小鼠被判定为PXB小鼠,其更换指数超过70%。
通过尾静脉静脉注射含有1×105份HBV以前感染过动物的血清实现PXB小鼠(>70%更换指数,13-15周龄)HBV感染。感染后八周,HBV DNA滴度大于1.0×106拷贝/mL和大于7.0mg/mL h-Alb的动物被选中(每组n=5)。Cys-Cas9-ssDNA lgRNA复合物通过侧尾静脉以每只动物0.2mL的体积给药。动物是在异氟醚麻醉下通过放血在不同时间点实施安乐死。从每只动物的中叶或左侧叶收集肝组织进行DNA提取,用于新一代测序(NGS)。编辑效率和脱靶如所述确定(Finn,J.D.et al.Cell Reports 2018,22,2227-2235;Tsai,S.Q.etal.Nat.Methods 2017,14,607-614)。
将血液收集到血清分离管中。通过化学发光酶免疫测定法(ARCHITECT,Abbott)检测血清HBV DNA,使用化学发光酶免疫测定法评估血清HBeAg(ARCHITECT,Abbott)。在第42天(研究终止),通过Quantigene 2.0b DNA分析(Affymetrix)测定肝脏总量HBV RNA和3.5kb HBV(pg)RNA,并参比人类甘油醛-3-磷酸脱氢酶(GAPDH)mRNA进行数据标准化。在第42天对肝脏切片进行HBcAg免疫组化分析。
或者,所使用的Cys-Cas9-ssDNA-lgRNA RNP复合物的缀合物可以被ssDNA-lgRNA和编码Cas9蛋白的mRNA(ssDNA-lgRNA/mRNA~10:1)替代。二者可以作为混合物或在LNP中顺序施用。或用在LNP中的ssDNA-lgRNA和编码Cas9蛋白的AAV载体替代。其中,LNP配制胺与RNA-磷酸盐的比例约为3-6(N:P)。
实施例18:人源化小鼠中的抗HIV
在HIV感染的人源化小鼠中的抗病毒测定是根据文献所述方法。实施例使用Cys-Cas9-ssDNA-lgRNA RNP复合物的缀合物,而不是AAV9-CRISPR-Cas9载体(Dash,P.K.and etal.Nat.Comm.2019,10,1-20)。
使用免疫磁珠,从人脐带血或胎儿肝细胞富集CD34+HSC。流式细胞仪显示CD34+细胞纯度>90%。用30号针头,在20μl磷酸盐缓冲盐水(PBS)中,通过肝内(i.h.)注射,细胞被移植到使用RS-2000×射线辐照器照射过新生小鼠(1Gy),50,000个细胞/小鼠。在第18周年龄,NSG-hu小鼠在腹膜内(ip),以104组织培养感染剂量50(TCID50)/ml感染HIV-1NL4-3。
Cys-Cas9-ssDNA-lgRNA复合物通过侧尾静脉施用,每只动物施用的体积为0.2mL。使用ddPCR检测HIV-1核酸和编辑效率,脱靶率确定如文献所述。
或者,ssDNA-lgRNA和编码Cas9蛋白的mRNA(ssDNA lgRNA/mRNA~10:1)作为混合物或顺序施用,或依次施用在LNP中的ssDNA-lgRNA和编码Cas9蛋白的AAV载体处理细胞。其中,LNP配制胺与RNA-磷酸盐的比例约为3-6(N:P)。
实施例19:AAV-EFS_CMV::NLS-SaCas9-NLS-polyA;U6-tracrRNA质粒
5'-gtttact tatac ctaaa attac agaat ctact aaaac aaggc aaaat gccgtgttta tctcg tcaac ttgtt ggcga gattt tt-3'(顶部,序列号:74)
5'-ggccaa aaatc tcgcc aacaa gttga cgaga taaac acggc atttt gcctt gttttagtag attct gtaat tttag gtata agt-3'(底部,序列号:75)
用于编码SaCas9***tracrRNA的cDNA的寡核苷酸的上链和下链是使用具有常规保护A、G和C核碱基和未保护的胸腺嘧啶DNA亚磷酰胺单体合成的。乙腈中的0.45M四唑用作偶联剂,乙酸酐作为封端剂,0.1M碘作为氧化剂。寡核苷酸合成在Applied Biosystems 394自动DNA/RNA合成仪上实施,使用标准的1.0μmole DNA亚磷酰胺循环。共价偶联在CPG(可控孔玻璃)上的核苷被包装进一个扭曲反应柱。在使用前,将所有β-氰乙基亚磷酰胺单体分别溶解在无水乙腈中,浓度为0.1M。逐步耦合效率由自动三苯甲基阳离子电导率监测确定,在所有情况下均>99%。
病毒质粒的制备是利用标准重组DNA克隆技术。
将上述cDNA链(1:1)磷酸化和退火,并克隆进入线性化的pX601-AAV-EFS_CMV::NLS-SaCas9-NLS-polyA3×HA-bGHpA;U6::BsaI-sgRNA表达质粒载体(Addgene基因质粒#61591),如下所示。AAV向量是用BsaI和NotI消化以去除***的sgRNA支架,用antarctic磷酸酶(AnP)处理,并用快速核苷酸去除试剂盒(QIAGEN)纯化。在T4多核苷酸激酶(PNK)缓冲液中,将等量的互补寡核苷酸混合,进行退火。这些退火的种子对用T4 PNK磷酸化,并使用T7 DNA连接酶连接到经BsaI和NotI消化的AAV。
实施例20:病毒的制备
如文献所述,使用三重质粒转染方法包装AAV::SaCas9病毒(Chew,et al.NatureMethods,2016)。在150mm板、由DMEM+glutaMAX+丙酮酸+10%FBS(Life Technologies)组成,补充含有1x MEM非必需氨基酸(Gibco)的生长培养基中,铺板293FT细胞(LifeTechnologies)。转染时的汇合度为70-90%之间。20μg pHelper质粒、10μg pRepCap质粒(编码衣壳蛋白)和将10μg携带目的构建体的AAV质粒在500μLDMEM中混合,添加200μg PEI“MAX”(Polysciences)(40kDa,1mg/mL水溶液,pH 7.1)。其中,PEI:DNA质量比为5:1。将混合物孵育15分钟,然后逐滴转移到细胞培养基中。转染后当天,培养基更换为DMEM+glutamax+丙酮酸+2%FBS。转染48-72小时后,通过刮除或用1×PBS(pH7.2)+5mM EDTA解离收获细胞,并以1500g沉淀12分钟。细胞沉淀重新悬浮于1-5mL细胞裂解缓冲液中(Tris HCl pH 7.5+2mMMgCl2+150mM NaCl),并在干冰-乙醇浴和37℃水浴之间冻融3次。用4000g去除细胞碎片5分钟,收集上层清液。
收集的AAV上层清液用50U/mL Benzonase和1U/mLRiboshredder在37℃下处理30分钟。孵育后,使用Amicon Ultra-15(50kDa MWCO)(Millipore)进行超滤,将裂解液浓缩至<3mL,并加载到由15%、25%、40%、60%Optiprep(Sigma-Aldrich)各2mL组成不连续密度梯度的,11.2mL Optiseal聚丙烯管(Beckman-Coulter)的顶部。在18℃,在NVT65转子上,将试管以58000rpm超速离心1.5小时。提取40%组分,使用Amicon Ultra-15(50kDa或100kDaMWCO)(Millipore),在添加过35mM NaCl的1×PBS(pH7.2)透析。纯化的AAV以25μL等分试样形式储存在-80℃。
AAV效价(载体基因组)通过水解探针qPCR,对比从线性化的亲本AAV质粒产生的标准曲线确定。
实施例21:Cas9-tracrRNA稳定细胞的产生和转染crRNA
96孔板中,将细胞在100μL生长培养基中以每孔2x 104铺板。纯化的AAV以70-90%的融合度应用。第二天,用新鲜的生长培养基代替培养基,将细胞在37℃和5%CO2下孵育24小时。用新鲜培养基更换培养基,细胞用crRNAs进行转染。其中,可以使用或不使用转染试剂。
实施例22:小鼠注射
将AAV载体和crRNA,通过侧尾静脉注射,递送至5-6周龄雄性小鼠。在注射前,所有AAV剂量均以无菌磷酸盐缓冲盐水(PBS),pH 7.4(Gibco)调整为100μL或200μL。
实施例23:诱导型Cas9稳定细胞的产生和转染lgRNA
根据制造商协议中的详细方法,实现Edit-R诱导型慢病毒hEF1a-Blast-Cas9核酸酶颗粒的细胞转导。细胞以每孔5x 104个细胞铺板于一个24孔板,使用不含Tet的生长培养基,在37℃的加湿CO2培养箱中培养过夜,用Edit-R诱导型慢病毒hEF1α-Blast-Cas9Nuclease转导。换成不含Tet的生长培养基,持续孵化4-6小时,孵育持续24-48小时。在不含Tet、含有适量杀稻瘟素的的选择性培养基中选择可诱导的Cas9稳定细胞,并扩展。
然后,在新鲜制备的多西环素溶液中诱导被选择的诱导型Cas9稳定细胞至少24小时。使用Lipofectamine RNAiMax和lgRNA转染细胞。12小时后用新鲜培养基更换培养基。然后,细胞生长72小时,必要时更换培养基。
等价公开
本公开不限于在本申请中描述的特定的实施例,其旨在作为本公开各个方面个体的举例说明。可以在不背离其精神和范围的情况下,对本公开的许多修改和变化,对本领域技术人员来说是显而易见的。此外,在本公开范围内的,本申请所列举之外的那些功能等效的方法和装置,对于本领域技术人员从前面的描述中将显而易见。这样的修改和变化旨在落入本公开的范围内。应当理解,本公开内容不限于特定的方法、试剂、化合物组成,或生物***。这些当然可以变化。还应该理解的是,本申请使用的术语仅用于描述特定实施例的目的,而不是意在限制。
此外,本公开的特征或方面是根据Markush组描述的,本领域技术人员将认识到,本公开也因此描述Markush组的任何成员或成员小组。
如本领域技术人员将理解的,出于任何和所有目的,特别是就提供书面描述而言,本申请公开的所有范围还包括任何以及所有可能的子范围及其子范围的组合。任何列出的范围都可以轻松被认为足以描述并能够将相同的范围分解为至少相等的二分之一、三分之一、四分之一、五分之一、十分之一等。作为非限制性示例,本申请讨论的每个范围可以是很容易分解为下三分之一、中三分之一和上三分之一等。本领域技术人员认识到,所有语言,例如“最多”、“至少”、“大于”、“小于”等,包括所引用的数字,并包括可以随后细分为子范围的范围,如上所述。最后,如本领域技术人员将理解的,范围包括每个个体成员。因此,例如,具有1-3或1到3个项目的组是指具有1、2、或3项。类似地,具有1-5或1至5个项目的组是指具有1、2、3、4或5个项目的组,等等。
所有专利、专利申请、临时申请和出版物在本申请中所提及或引用的内容,通过引用整体并入,包括所有图和表,只要它们在与本说明书的明确教示不矛盾的范围内。
序列表
Cys-SpCas9蛋白的DNA序列:
tgcgacaagaagtacagcatcggcctggacatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatcgcctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggactgcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgcctgcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagtgcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagtgcgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggcgac
(序列号:76)
Cys-SpCas9-NLS蛋白的蛋白质序列:
CDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIAYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVCSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINACGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKCEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKCVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDAYPYDVPDYASLGSGSPKKKRKVD
(序列号:77)
SEQUENCE LISTING
<110> 钟明宏
<120> 向导RNA-Cas 蛋白复合物的缀合物
<130> 01-00002
<150> US62/888,551
<151> 2019-08-19
<150> US62/914,565
<151> 2019-10-14
<150> US62/937,876
<151> 2019-11-20
<160> 72
<170> PatentIn version 3.5
<210> 1
<211> 42
<212> RNA
<213> 化脓性链球菌
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 1
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 2
<211> 81
<212> RNA
<213> 化脓性链球菌
<400> 2
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu u 81
<210> 3
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> lgRNA, nn (32, 33) 可以是碱基配对的,也可以不是。n32 (A) 和 n33 (B)二者之间以非核苷酸接头连接.
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, or u
<400> 3
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuu 94
<210> 4
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> sgRNA: crRNA 和 tracrRNA 通过四核苷酸环gaaa形成单分子 RNA。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 4
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 5
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> lgRNA 通过crgRNA 和tracrgRNA,nn (32, 33)之间的偶联反应,及tracrgRNA内 a70 和a71之间的偶联反应形成。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, or u
<400> 5
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuu 94
<210> 6
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> 在 a32 和 u33之间***了一个适配体的 gRNA。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 6
nnnnnnnnnn nnnnnnnnnn guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuu 94
<210> 7
<211> 92
<212> RNA
<213> 人工序列
<220>
<223> gRNA中***了两个适配体,分别位于a32 和 u33
及 g69 和 a70。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 7
nnnnnnnnnn nnnnnnnnnn guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaguggcacc gagucggugc uu 92
<210> 8
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> lgRNA中***了两个化学偶联的适配体,分别位于a32 和 u33 之间
及 a70 和 a71之间。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, or u
<400> 8
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuu 94
<210> 9
<211> 62
<212> RNA
<213> 人工序列
<220>
<223> 化学偶联的tracrRNA 中***了两个由非核苷酸接头连接的的适配体, 分别位于5'-末端 和 u33 之间
及 a38 和 a39之间。
<220>
<221> misc_feature
<222> (1)..(1)
<223> n 是 a, c, g, or u
<400> 9
nagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60
uu 62
<210> 10
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> lgRNA 中***了两个由化学偶联而连接的的适配体, 分别位于n32 和 n33 之间
及 a70 和 a71之间的非核苷酸接头上。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, or u
<400> 10
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuu 94
<210> 11
<211> 36
<212> RNA
<213> 化脓性链球菌
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 11
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcu 36
<210> 12
<211> 66
<212> RNA
<213> 化脓性链球菌
<400> 12
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuu 66
<210> 13
<211> 47
<212> RNA
<213> 人工序列
<220>
<223> lgRNA (部分序列) 由tracrRNA 和crRNA之间化学偶联而生成。非核苷酸接头位于c15
(tracrRNA的3'-末端) 和 g16 (crRNA的5'-末端)之间。
<220>
<221> misc_feature
<222> (28)..(47)
<223> n 是 a, c, g, or u
<400> 13
ggaagggaac ccuccggugg guuaaagnnn nnnnnnnnnn nnnnnnn 47
<210> 14
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> lgRNA, nn (32, 33) 可以是碱基配对的,也可以不是。n32 (A) 和 n33 (B)二者之间以非核苷酸接头连接. GalAc
配体通过非核苷酸接头缀合在 lgRNA 的3'-末端。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, or u
<400> 14
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuu 94
<210> 15
<211> 47
<212> RNA
<213> 人工序列
<220>
<223> lgRNA (部分序列) 由tracrRNA 和crRNA之间化学偶联而生成。T非核苷酸接头位于c15
(tracrRNA的3'-末端) 和 g16 (crRNA的5'-末端)之间。 GalAc 配体通过第二个非核苷酸接头缀合在 lgRNA的3'-末端。
<220>
<221> misc_feature
<222> (28)..(47)
<223> n 是 a, c, g, or u
<400> 15
ggaagggaac ccuccggugg guuaaagnnn nnnnnnnnnn nnnnnnn 47
<210> 16
<211> 42
<212> RNA
<213> nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 16
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 17
<211> 81
<212> RNA
<213> 人工序列
<220>
<223> GalAc 配体通过第二个非核苷酸接头缀合在 tracrRNA 的3'-末端。
<400> 17
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu u 81
<210> 18
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 胆固醇通过非核苷酸接头缀合在 crRNA 的3'-末端。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 18
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 19
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 生育 酚 通过非核苷酸接头缀合在 crRNA 的3'-末端。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 19
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 20
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 适配体通过非核苷酸接头缀合在 crRNA 的3'-末端。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 20
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 21
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 抗体通过非核苷酸接头缀合在 crRNA 的3'-末端。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or u
<400> 21
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 22
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 待编辑靶体DNA图示。 其靶体链被移除。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, or t
<220>
<221> misc_feature
<222> (24)..(25)
<223> n 是 a, c, g, or t
<400> 22
nnnnnnnnnn nnnnnnnnnn tggnn 25
<210> 23
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 由非核苷酸接头连接的crRNA-ssDNA 缀合物, 其中n1 到 n2o 是靶序,
n33 到 n60 是单链DNA。 单链DNA通过非核苷酸接头缀合在crRNA的3’-末端。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(60)
<223> n 是 a, c, g, t or u
<400> 23
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
<210> 24
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 由非核苷酸接头连接的ssDNA-tracrRNA 缀合物, n1 到 n50 是单链DNA。单链DNA通过非核苷酸接头缀合在tracrRNA的5’-末端的n51。
<220>
<221> misc_feature
<222> (1)..(51)
<223> n 是 a, c, g, t or u
<400> 24
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nagcauagca 60
aguuaaaaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc ggugcuu 117
<210> 25
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> lgRNA 通过crgRNA 和tracrgRNA,nn (32, 33)之间的偶联反应,及 tracrgRNA内 a70 和a71之间的偶联反应形成。ssDNA 通过非核苷酸接头连接在位于nn (32, 33)之间的缀合位.
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, t or u
<400> 25
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuu 94
<210> 26
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> lgRNA 通过crgRNA 和tracrgRNA,nn (32, 33)之间的偶联反应,及 tracrgRNA内 a70 和a71之间的偶联反应形成。ssDNA 通过非核苷酸接头连接在位于n70 和 n71之间的缀合位。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, t or u
<400> 26
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuu 94
<210> 27
<211> 144
<212> DNA
<213> 人工序列
<220>
<223> lgRNA 通过crgRNA 和tracrgRNA,nn (32, 33)之间的偶联反应,及 tracrgRNA内 a70 和a71之间的偶联反应形成。ssDNA (n95 到 n144)通过非核苷酸接头或核苷酸接头连接在lgRNA 3'-末端。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (95)..(144)
<223> n 是 a, c, g, t or u
<400> 27
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuunnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnn 144
<210> 28
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> tracrRNA 通过a37 和 a38之间的偶联反应形成。ssDNA (n62 到 n111)通过非核苷酸接头或核苷酸接头连接在tracrRNA 3'-末端。
<220>
<221> misc_feature
<222> (62)..(111)
<223> n 是 a, c, g, t or u
<400> 28
agcaaguuaa aauaaggcua guccguuauc aacuugaaaa aguggcaccg agucggugcu 60
unnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn n 111
<210> 29
<211> 144
<212> DNA
<213> 人工序列
<220>
<223> lgRNA 通过crRNA和 tracrRNA内 nn(82, 83)之间的偶联反应,及 tracrgRNA内 a120 和a121之间的偶联反应形成。ssDNA (n1 到 n50)通过非核苷酸接头或核苷酸接头连接在lgRNA 5'-末端。
<220>
<221> misc_feature
<222> (1)..(70)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (82)..(83)
<223> n 是 a, c, g, t or u
<400> 29
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu aucaacuuga 120
aaaaguggca ccgagucggu gcuu 144
<210> 30
<211> 144
<212> DNA
<213> 人工序列
<220>
<223> lgRNA 通过crRNA和 tracrRNA内 nn(82, 83)之间的偶联反应,及 tracrgRNA内 a120 和a121之间的偶联反应形成。ssDNA (n1 到 n50)通过三氮唑非核苷酸接头连接在lgRNA 5'-末端。
<220>
<221> misc_feature
<222> (1)..(70)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (82)..(83)
<223> n 是 a, c, g, t or u
<400> 30
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu aucaacuuga 120
aaaaguggca ccgagucggu gcuu 144
<210> 31
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> lgRNA 通过crgRNA 和tracrgRNA内nn (32, 33)之间的偶联反应,及tracrgRNA内 a70 和a71之间的偶联反应形成。ssDNA (n1 到 n50) 通过非核苷酸接头缀合在位于nn(32, 33)之间的偶联位。其中非核苷酸接头位于 ssDNA的3'-末端和 u33之间.
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(32)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (34)..(34)
<223> n 是 a, c, g, t or u
<400> 31
nnnnnnnnnn nnnnnnnnnn guuuuagagc ununagcaag uuaaaauaag gcuaguccgu 60
uaucaacuug aaaaaguggc accgagucgg ugcuu 95
<210> 32
<211> 144
<212> DNA
<213> 人工序列
<220>
<223> lgRNA 通过crRNA和 tracrRNA内 nn(32, 33)之间的偶联反应,及 tracrgRNA内 a70 和a71之间的偶联反应形成。ssDNA (n95 到 n144)通过三氮唑非核苷酸接头连接在lgRNA 3'-末端。其中三氮唑非核苷酸接头位于lgRNA的3'-末端和 ssDNA的5'-末端.
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (95)..(144)
<223> n 是 a, c, g, t or u
<400> 32
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuunnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnn 144
<210> 33
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> lgRNA 通过crgRNA 内 u33 和 tracrgRNA内n34之间的偶联反应,及tracrgRNA内 a71 和a72之间的偶联反应形成。ssDNA (n1 到 n50) 通过非核苷酸接头缀合在位于nn(32, 33)之间的偶联位。其中非核苷酸接头位于 ssDNA的5'-末端和 u33之间。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(32)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (34)..(34)
<223> n 是 a, c, g, t or u
<400> 33
nnnnnnnnnn nnnnnnnnnn guuuuagagc ununagcaag uuaaaauaag gcuaguccgu 60
uaucaacuug aaaaaguggc accgagucgg ugcuu 95
<210> 34
<211> 194
<212> DNA
<213> Artificial Sequence
<220>
<223> ssDNA (n145 到 n194) 通过三氮唑非核苷酸接头缀合于lgRNA的3'-末端和ssDNA的5'-末端,另一个ssDNA 通过硫醇-马来酰亚胺偶联反应缀合于lgRNA的5'-末端。
<220>
<221> misc_feature
<222> (1)..(70)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (82)..(83)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (145)..(194)
<223> n 是 a, c, g, t or u
<400> 34
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu aucaacuuga 120
aaaaguggca ccgagucggu gcuunnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnn 194
<210> 35
<211> 144
<212> DNA
<213> 人工序列
<220>
<223> ssDNA (n95 到 n144) 通过三氮唑非核苷酸接头缀合于lgRNA的3'-末端和dsDNA之间。dsDNA中的互补链被移除。
<220>
<221> misc_feature
<222> (1)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(33)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (95)..(144)
<223> n 是 a, c, g, t or u
<400> 35
nnnnnnnnnn nnnnnnnnnn guuuuagagc unnagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuunnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnn 144
<210> 36
<211> 23
<212> DNA
<213> HBV
<400> 36
ctctgctaga tcccagagtg agg 23
<210> 37
<211> 23
<212> DNA
<213> HBV
<400> 37
gctatcgctg gatgtgtctg cgg 23
<210> 38
<211> 25
<212> DNA
<213> HBV
<400> 38
tggacttctc tcaattttct agggg 25
<210> 39
<211> 23
<212> DNA
<213> HBV
<400> 39
gggggatcac ccgtgtgtct tgg 23
<210> 40
<211> 25
<212> DNA
<213> HBV
<400> 40
tatgtggatg atgtggtact ggggg 25
<210> 41
<211> 21
<212> DNA
<213> HBV
<400> 41
cctcaccata cagcactcgg g 21
<210> 42
<211> 26
<212> DNA
<213> HBV
<400> 42
gtgttggggt gagttgatga atctgg 26
<210> 43
<211> 25
<212> DNA
<213> HBV
<400> 43
tatgtggatg atgtggtact ggggg 25
<210> 44
<211> 25
<212> DNA
<213> HBV
<400> 44
tatatggatg atgtggtatt ggggg 25
<210> 45
<211> 25
<212> DNA
<213> HBV
<400> 45
tatgtggatg atgtggtatt ggggg 25
<210> 46
<211> 25
<212> DNA
<213> HBV
<400> 46
tatatagatg atgtggtact ggggg 25
<210> 47
<211> 23
<212> DNA
<213> HIV
<400> 47
gattggcaga actacacacc agg 23
<210> 48
<211> 23
<212> DNA
<213> HIV
<400> 48
atcagatatc cactgacctt tgg 23
<210> 49
<211> 23
<212> DNA
<213> HIV
<400> 49
gcgtggcctg ggcgggactg ggg 23
<210> 50
<211> 23
<212> DNA
<213> HIV
<400> 50
cagcagttct tgaagtactc cgg 23
<210> 51
<211> 23
<212> DNA
<213> EBV
<400> 51
gccctggacc aacccggccc ggg 23
<210> 52
<211> 23
<212> DNA
<213> EBV
<400> 52
ggccgctgcc ccgctccggg tgg 23
<210> 53
<211> 22
<212> DNA
<213> EBV
<400> 53
ggaagacaat gtgccgccat gg 22
<210> 54
<211> 23
<212> DNA
<213> EBV
<400> 54
tctggaccag aaggctccgg cgg 23
<210> 55
<211> 23
<212> DNA
<213> EBV
<400> 55
gctgccgcgg agggtgatga cgg 23
<210> 56
<211> 23
<212> DNA
<213> EBV
<400> 56
ggtggcccac cgggtccgct ggg 23
<210> 57
<211> 23
<212> DNA
<213> EBV
<400> 57
gtcctcgagg gggccgtcgc ggg 23
<210> 58
<211> 21
<212> DNA
<213> human
<400> 58
aaagaaaata tmmmtggtgt t 21
<210> 59
<211> 21
<212> DNA
<213> human
<400> 59
aaagaaaata tctttggtgt t 21
<210> 60
<211> 50
<212> RNA
<213> 人工序列
<220>
<223> GalAcs 通过三氮唑非核苷酸接头缀合于crRNA的3'-末端。
<400> 60
gcguggccug ggcgggacug guuuuaguac ucuguaauuu uagguaugag 50
<210> 61
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> crRNA 3'-azide
<400> 61
cuauauggau gaugugguac guuuuagagc u 31
<210> 62
<211> 61
<212> RNA
<213> 人工序列
<220>
<223> 5'-炔基 tracrRNA 3'-马来酰亚胺。
<400> 62
agcaaguuaa aauaaggcua guccguuauc aacuugaaaa aguggcaccg agucggugcu 60
u 61
<210> 63
<211> 92
<212> RNA
<213> 人工序列
<220>
<223> lgRNA 3'-马来酰亚胺。lgRNA 包含位于u31 和 a32之间的三氮唑非核苷酸接头。
<400> 63
cuauauggau gaugugguac guuuuagagc uagcaaguua aaauaaggcu aguccguuau 60
caacuugaaa aaguggcacc gagucggugc uu 92
<210> 64
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> ssDNA, 5'-硫醇
<220>
<221> misc_feature
<222> (20)..(20)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n 是 a, c, g, t or u
<400> 64
ucagacttgg cccccatgan tgantgaatc catatag 37
<210> 65
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 包含硫代醚非核苷酸接头(u93 和 u94)的lgRNA-ssDNA 缀合物。
<220>
<221> misc_feature
<222> (112)..(112)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (116)..(116)
<223> n 是 a, c, g, t or u
<400> 65
cuauauggau gaugugguac guuuuagagc uagcaaguua aaauaaggcu aguccguuau 60
caacuugaaa aaguggcacc gagucggugc uuucagactt ggcccccatg antgantgaa 120
tccatatag 129
<210> 66
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 3'-马来酰亚胺。
<400> 66
gcuauaugga ugauguggua cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu u 101
<210> 67
<211> 138
<212> DNA
<213> 人工序列
<220>
<223> 包含硫代醚非核苷酸接头(u101 和 u102)的lgRNA-ssDNA 缀合物。
<220>
<221> misc_feature
<222> (121)..(121)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (125)..(125)
<223> n 是 a, c, g, t or u
<400> 67
gcuauaugga ugauguggua cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uucagacttg gcccccatga 120
ntgantgaat ccatatag 138
<210> 68
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 包含硫代醚非核苷酸接头(u37 和 u38)的lgRNA-ssDNA 缀合物。
<220>
<221> misc_feature
<222> (19)..(19)
<223> n 是 a, c, g, t or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n 是 a, c, g, t or u
<400> 68
cagacttggc ccccatgant gantgaatcc atatagucua uauggaugau gugguacguu 60
uuagagcuag caaguuaaaa uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag 120
ucggugcuu 129
<210> 69
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA encoding SaCas9 tracrRNA.
<400> 69
gtttacttat acctaaaatt acagaatcta ctaaaacaag gcaaaatgcc gtgtttatct 60
cgtcaacttg ttggcgagat tttt 84
<210> 70
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 编码 SaCas9 tracrRNA的cDNA。
<400> 70
ggccaaaaat ctcgccaaca agttgacgag ataaacacgg cattttgcct tgttttagta 60
gattctgtaa ttttaggtat aagt 84
<210> 71
<211> 4104
<212> DNA
<213> 人工序列
<220>
<223> 通过位点导向诱变生成的人工SpCas9蛋白的DNA序列。
<400> 71
tgcgacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120
cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180
gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatcgcc 240
tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300
ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420
aaactggtgg actgcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480
atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600
atcaacgcct gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660
cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720
ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900
ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960
atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020
cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140
gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200
aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260
gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320
gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380
agattcgcct ggatgaccag aaagtgcgag gaaaccatca ccccctggaa cttcgaggaa 1440
gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620
agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680
gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740
tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800
atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860
ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920
cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980
aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040
gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100
agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160
cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220
gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280
atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340
atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400
gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460
gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520
atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580
gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640
aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700
accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760
ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820
actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880
aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940
taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000
taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060
atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120
aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180
cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240
gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300
cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360
gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420
tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagtgcgtg 3480
aaagagctgc tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540
tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600
tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660
cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720
cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840
atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900
cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960
cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080
gacctgtctc agctgggagg cgac 4104
<210> 72
<211> 1392
<212> PRT
<213> 人工序列
<220>
<223> 人工SpCas9-NLS蛋白的序列。
<400> 72
Cys Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Ala
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Cys
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Cys Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Cys Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Cys Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Gly Ser Gly
1370 1375 1380
Ser Pro Lys Lys Lys Arg Lys Val Asp
1385 1390
Claims (38)
1.一种CRISPR-Cas蛋白-向导RNA复合物的缀合物,包括:
1)偶联向导RNA-Cas蛋白(RNP)复合物和
2)一个或多个分子,选自PEG、非PEG的分子聚合物、细胞受体的配体、脂质、寡核苷酸、抗体、多糖、聚糖和多肽或蛋白,
其中所述一个或多个分子与所述RNP复合物以化学方式连接。
2.权利要求1的CRISPR-Cas蛋白-向导RNA复合物的所述缀合物,包含与一个或多个选自下组与偶联向导RNA共价连接的分子,包括PEG、非PEG聚合物、细胞受体配体、脂质、寡核苷酸、多糖、聚糖、多肽/蛋白、适配体和/或抗体,以形成偶联向导RNA-缀合物,所述多个分子可以相同也可以不同。
3.权利要求1的CRISPR-Cas蛋白-向导RNA复合物的所述缀合物,包含与一个或多个选自下组与Cas蛋白共价连接的分子,包括PEG、非PEG聚合物、细胞受体配体、脂质、寡核苷酸、多糖、聚糖、多肽/蛋白、适配体和/或抗体形成Cas蛋白-缀合物,所述多个分子可以相同也可以不同。
5.权利要求2的所述偶联向导RNA-缀合物在碱基部分经过化学修饰,所述修饰的碱基选自:
其中:
(i)Z是N或CR16;(ii)R9、R10、R11、R12、R13、R14和R15独立地为H、F、Cl、Br、I、OH、OR'、SH、SR'、SeH、SeR'、NH2、NHR'、NHOH、NHOR'、NR'OR'、NR'2、NHNH2、NR'NH2、NR'NHR'、NHNR'2、NR'NR'2、C1-C6的低级烷基、C1-C6的卤代(F、Cl、Br、I)低级烷基,C2-C6的低级烯基,卤代(F,Cl,Br,I)C2-C6的低级烯基,CN,C2-C6的低级炔基,卤化的(F,Cl,Br,I)C2-C6的低级炔基,C1-C6的低级烷氧基,卤化的(F、Cl、Br、I)C1-C6的低级烷氧基、CN、CO2H、CO2R'、CONH2、CONHR'、CONR'2、CH=CHCO2H,或CH=CHCO2R',其中R'是经过或未经过取代的烷基,其包括,但不限于,H,经过或未经过取代的C1-C20烷基,经过或未经过取代的低级烷基、经过或未经过取代的环烷基、经过或未经过取代的C2-C6炔基、经过或未经过取代的C2-C6低级烯基、经过或未经过取代的芳基、经过或未经过取代的杂芳基、经过或未经过取代的磺酰基或经过或未经过取代的酰基,其包括但不限于C(=O)烷基,或者,在NR'2的情况下,每个R'包含至少一个C原子,这些C原子连接形成包含至少两个碳的杂环。
6.权利要求2的所述偶联向导RNA-缀合物,其靶向区域序列包含选自HIV基因组中的12~20个核苷酸,其中每个胸腺嘧啶被尿嘧啶取代。
7.权利要求2的所述偶联向导RNA-缀合物,其靶向区域序列包含选自HBV基因组中12~20nt,其中每个胸腺嘧啶被尿嘧啶取代。
8.权利要求2的所述偶联向导RNA-缀合物,其靶向区域序列包含选自HSV基因组中12~20个核苷酸,其中每个胸腺嘧啶被尿嘧啶取代。
9.权利要求2的所述偶联向导RNA-缀合物,其靶向区域序列包含选自EBV基因组中12~20nt,其中每个胸腺嘧啶被尿嘧啶取代。
10.权利要求2的所述偶联向导RNA-缀合物,其靶向区域序列包含选自待编辑的宿主基因组的12~20nt,其中每个胸腺嘧啶被替换为尿嘧啶。
11.权利要求2的所述偶联向导RNA-缀合物,包含一个或多个同位素富集的核苷酸和/或nNt接头,或同位素富集到其全部核苷酸和nNt接头。
12.权利要求2的所述偶联向导RNA-缀合物,包含偶联向导RNA-和与其缀合的ssDNA模板,所述ssDNA模板包括基因编辑序列和位于基因编辑序列侧翼的、与靶体DNA双链中的目标链或非目标链重叠的两条序列,所述两条序列经过或未经过化学修饰。
13.权利要求12所述的基因编辑序列,包括一个或多个终止密码子序列,选自于以下序列组:5'-(tga)-3'、5'-(taa)-3'、5'-(tag)-3'、5'-(tga-ntga-ntga)-3',5'-(tga-ntga-ntaa)-3',5'-(tga-ntga-ntag)-3',5'-(tga-ntaa-ntga)-3',5'-(tga-ntaa-ntaa)-3'、5'-(tga-ntaa ntag)-3'、5'-(tga-ntga-ntga)-3'、5'-(tga-ntga-ntaa)-3'、5'-(tga-ntga-ntag)-3',5'-(taa-ntga-ntga)-3',5'-(taa-ntga-ntaa)-3',5'-(taa-ntga-ntag)-3',5'-(taa-ntaa-ntga)-3',5'-(taa-ntaa-ntaa)-3'、5'-(taa-ntaa ntag)-3'、5'-(taa-ntga-ntga)-3'、5'-(taa-ntga-ntaa)-3'、5'-(taa-ntga-ntag)-3',5'-(tag-ntga-ntga)-3',5'-(tag-ntga-ntaa)-3',5'-(tag-ntga-ntag)-3',5'-(tag-ntaa-ntga)-3',5'-(tag-ntaa-ntaa)-3',5'-(tag-ntaa ntag)-3',5'-(tag-ntga-ntga)-3',5'-(tag-ntga-ntaa)-3',5'-(tag-ntga-ntag)-3',其中n为任意核苷酸,所述多个终止密码子序列包含重复的或不同的所述序列,在所述重复的或不同的序列之间不存在或有一个或多个核苷酸。
14.如权利要求12所述的基因编辑序列,其包含一个或多个转录顺式调控元件,所述多个重复的或不同的元件序列之间不存在、或包含一个或多个核苷酸,隔开所述元件序列。
15.权利要求1的所述RNP缀合物包含偶联向导RNA-或偶联向导RNA-缀合物的混合物,靶向靶基因组的不同基因座、和/或目标基因组的单个基因座的耐药变体、或病毒靶基因组单个基因座的准种。
16.如权利要求1所述的Cas蛋白是重组核酸内切酶Cas9、dCas9、Cas9切口酶、Cas12或Cas14、或其融合蛋白。
17.权利要求3的所述Cas蛋白是重组核酸内切酶,包括至少两个半胱氨酸,并且所述半胱氨酸中的至少一个通过定点突变引入,所述半胱氨酸与其它分子缀合,以实现抗原决定位的掩蔽和/或细胞靶向递送。
18.权利要求1的CRISPR-Cas蛋白-偶联向导RNA-复合物的所述缀合物是聚乙二醇化CRISPR-Cas蛋白-偶联向导RNA复合物。
19.权利要求1的CRISPR-Cas蛋白-向导RNA复合物的所述缀合物包含共价连接的、用于靶向细胞递送的分子。
20.包含权利要求1所述CRISPR-Cas蛋白偶联向导RNA-复合物缀合物的治疗用药物。
21.包含权利要求1所述crRNA缀合物和编码Cas蛋白及tracrRNA的质粒或病毒的治疗用药物,所述crRNA缀合物和编码Cas蛋白及tracrRNA的质粒或病毒在靶细胞中形成CRISPR-Cas-向导RNA复合物缀合物。
22.包含权利要求1所述偶联向导RNA-缀合物和编码Cas蛋白mRNA的治疗用药物,所述偶联向导RNA-缀合物和Cas蛋白mRNA在靶细胞中形成CRISPR-Cas-向导RNA复合物缀合物。
23.一种生化试剂盒,包含权利要求1所述CRISPR-Cas蛋白-偶联向导RNA复合物的缀合物。
24.一种基因编辑方法,包括以下步骤:
1)将权利要求1所述CRISPR-Cas蛋白-偶联向导RNA-复合物的缀合物递送至靶细胞;
2)所述复合物切割靶体DNA,导致其双链断裂或产生单链缺口;
3)产生的切割产物的单DNA链与缀合的供体模板3'-末端的同源臂杂交,延伸断裂的单DNA互补链3'端,并使用所述模板引入其基因编辑序列中包含的碱基***突变、碱基缺失突变或点突变来编辑目标基因;
4)延伸另一条链,并通过宿主蛋白加工端链,连接DNA间隙,RNP复合物进入下一轮新基因编辑。
25.权利要求24用于治疗慢性病毒感染的方法,包括以下步骤:
1)将CRISPR-Cas蛋白-偶联向导RNA-复合物的缀合物递送至感染细胞权利要求1;
2)切割病毒游离型、整合型DNA或两者,形成双链断裂或缺口;
3)产生的切割产物的单DNA链与偶合的供体模板3'-末端的同源臂杂交,延伸断裂的单DNA互补链3'端,并使用所述模板引入其基因编辑序列中包含的碱基***突变、碱基缺失突变或点突变来编辑目标基因;
4)延伸另一条链,通过宿主蛋白加工端链,将间隙连接,并正常化被病毒DNA整合破坏的宿主基因的表达,RNP复合物进入下一轮新基因编辑。
26.如权利要求25所述的慢性病毒感染是HBV、HIV或疱疹病毒感染。
27.权利要求1的CRISPR-Cas蛋白-偶联向导RNA复合物缀合物的制备和使用方法,包括以下步骤:
1)合成经过或未经过化学修饰偶联向导RNA或偶联向导RNA-缀合物;
2)制备重组Cas蛋白;
3)通过混合/孵育Cas蛋白和偶联向导RNA或偶联向导RNA-缀合物组装RNP复合物;
4)将步骤3)中形成的RNP复合物与PEG、聚合物、脂质、寡核苷酸、细胞受体的配体、多糖、聚糖或多肽缀合;
5)向细胞、动物和人体组织递送经过或未经过色谱纯化的CRISPR-Cas蛋白质-偶联向导RNA-复合物的缀合物。
28.如权利要求27所述的方法,其特征在于,所述步骤3)和步骤4)倒序如下:
3)将Cas蛋白与PEG、聚合物、脂质、寡核苷酸、细胞受体的配体、多糖、聚糖或多肽缀合;
4)通过混合/孵育Cas蛋白缀合物和偶联向导RNA或偶联向导RNA-缀合物组装RNP复合物;
其中步骤3)的所述Cas蛋白的缀合位点是半胱氨酸。
29.一种将CRISPR RNP复合物的缀合物递送至细胞或动物的方法,包括:
1)递送组织识别的编码包含识别域和核酸内切酶域的Cas蛋白的嗜性病毒载体;
2)在水溶液中、或与转染试剂一起、或在非病毒载体内,递送向导RNA,所述向导RNA选自偶联向导RNA、偶联向导RNA-缀合物、包含crRNA缀合物和由nNt连接生成的tracrRNA的双向导RNA、和包含crRNA缀合物的双向导RNA;
其中1)和2)可以是共同注射或单独注射。
30.如权利要求29所述的方法,还包括:3)递送一个或多个供体核酸用于校正、***或替换目标基因的碱基序列,该供体核酸包含或不包含与其缀合的细胞靶向配体、抗体或适体,并在水溶液中、或与转染试剂、或在非病毒载体中实现递送。
31.权利要求29的所述方法,其中2)所述向导RNA缀合物包含向导RNA和一个或多个与其缀合的用于DNA修复的ssDNA模板,所述向导RNA缀合物在水溶液中或与转染试剂或在非病毒载体中实现递送。
32.权利要求31的所述方法,其中所述缀合的ssDNA模板被双链DNA(dsDNA)模板替换,所述双链DNA通过它的任一链共价连接到导向RNA。其中,所述接头为核苷酸接头或nNt接头。
33.如权利要求29所述的方法,其特征在于,其中1)所述Cas蛋白是作为其mRNA,在水溶液中或与转染试剂或在非病毒载体中实现传递。
34.一种将CRISPR RNP复合物的缀合物递送至细胞或动物的方法,包括:
1)递送组织识别的包含编码tracrRNA和包含识别域和核酸内切酶域的Cas蛋白的嗜性病毒载体,
2)在水溶液中、或与转染试剂、或在非病毒载体中,递送crRNA缀合物;
其中1)和2)可以是共同注射或单独注射。
35.如权利要求34所述的方法,进一步包括:3)递送一个或多个供体核酸用于校正、***或替换目标基因的碱基序列,该供体核酸包含或不包含与其缀合的细胞靶向配体、抗体或适体,并在水溶液中、或与转染试剂、或在非病毒载体中实现递送;
其中1)、2)和3)可以是共同注射或单独注射。
36.权利要求34的所述方法,其中2)所述crRNA缀合物包含一个或多个用于DNA修复的ssDNA模板,所述ssDNA模板缀合在crRNA的5'-末端或3'-末端,并以水溶液或与转染试剂或在非病毒载体中实现递送。
37.权利要求36的所述方法,其中所述缀合的ssDNA模板被双链DNA(dsDNA)模板替换,所述双链DNA通过它的任一链共价连接到导向RNA。其中,所述接头为核苷酸接头或nNt接头。
38.如权利要求34所述的方法,其中所述Cas蛋白和tracrRNA的表达是可选地由单个或多个可切换的转录启动子和/或增强子和/或抑制子调控。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962888551P | 2019-08-19 | 2019-08-19 | |
US62/888,551 | 2019-08-19 | ||
US201962914565P | 2019-10-14 | 2019-10-14 | |
US62/914,565 | 2019-10-14 | ||
US201962937876P | 2019-11-20 | 2019-11-20 | |
US62/937,876 | 2019-11-20 | ||
PCT/US2020/036860 WO2021034373A1 (en) | 2019-08-19 | 2020-06-10 | Conjugates of guide rna-cas protein complex |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115244176A true CN115244176A (zh) | 2022-10-25 |
Family
ID=74645556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080073024.3A Pending CN115244176A (zh) | 2019-08-19 | 2020-06-10 | 向导rna-cas蛋白复合物的缀合物 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210054371A1 (zh) |
CN (1) | CN115244176A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114990104B (zh) * | 2021-11-15 | 2023-10-20 | 广州瑞风生物科技有限公司 | 改造的sgRNA分子及其应用 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104968784A (zh) * | 2012-10-23 | 2015-10-07 | 基因工具股份有限公司 | 包含特异于靶dna的向导rna和cas蛋白质编码核酸或cas蛋白质的用于切割靶dna的组合物及其用途 |
US20160215275A1 (en) * | 2015-01-27 | 2016-07-28 | Minghong Zhong | Chemically Ligated RNAs for CRISPR/Cas9-lgRNA Complexes as Antiviral Therapeutic Agents |
CN105829536A (zh) * | 2013-08-22 | 2016-08-03 | 纳幕尔杜邦公司 | 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物 |
CN105899658A (zh) * | 2013-12-12 | 2016-08-24 | 布罗德研究所有限公司 | 针对hbv和病毒性疾病以及障碍的crispr-cas***和组合物的递送、用途和治疗应用 |
WO2017096041A1 (en) * | 2015-12-02 | 2017-06-08 | The Regents Of The University Of California | Compositions and methods for modifying a target nucleic acid |
US20170306306A1 (en) * | 2014-10-24 | 2017-10-26 | Life Technologies Corporation | Compositions and Methods for Enhancing Homologous Recombination |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3294880A4 (en) * | 2015-05-15 | 2018-12-26 | Dharmacon, Inc. | Synthetic single guide rna for cas9-mediated gene editing |
US11253601B2 (en) * | 2016-07-11 | 2022-02-22 | Translate Bio Ma, Inc. | Nucleic acid conjugates and uses thereof |
WO2020093025A1 (en) * | 2018-11-01 | 2020-05-07 | Synthego Corporation | Methods for knock-out of a target sequence through introduction of a premature stop codon |
-
2020
- 2020-06-10 CN CN202080073024.3A patent/CN115244176A/zh active Pending
- 2020-08-17 US US16/994,660 patent/US20210054371A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104968784A (zh) * | 2012-10-23 | 2015-10-07 | 基因工具股份有限公司 | 包含特异于靶dna的向导rna和cas蛋白质编码核酸或cas蛋白质的用于切割靶dna的组合物及其用途 |
CN105829536A (zh) * | 2013-08-22 | 2016-08-03 | 纳幕尔杜邦公司 | 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物 |
CN105899658A (zh) * | 2013-12-12 | 2016-08-24 | 布罗德研究所有限公司 | 针对hbv和病毒性疾病以及障碍的crispr-cas***和组合物的递送、用途和治疗应用 |
US20170306306A1 (en) * | 2014-10-24 | 2017-10-26 | Life Technologies Corporation | Compositions and Methods for Enhancing Homologous Recombination |
US20160215275A1 (en) * | 2015-01-27 | 2016-07-28 | Minghong Zhong | Chemically Ligated RNAs for CRISPR/Cas9-lgRNA Complexes as Antiviral Therapeutic Agents |
WO2017096041A1 (en) * | 2015-12-02 | 2017-06-08 | The Regents Of The University Of California | Compositions and methods for modifying a target nucleic acid |
US20180320202A1 (en) * | 2015-12-02 | 2018-11-08 | The Regents Of The University Of California | Compositions and methods for modifying a target nucleic acid |
Also Published As
Publication number | Publication date |
---|---|
US20210054371A1 (en) | 2021-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240132877A1 (en) | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use | |
US12018257B2 (en) | Single-stranded RNA-editing oligonucleotides | |
US20240076661A1 (en) | LgRNA-directed CRISPR Gene Editing | |
US11274300B2 (en) | Oligonucleotide complexes for use in RNA editing | |
KR102618864B1 (ko) | 합성 가이드 분자, 그와 관련된 조성물 및 방법 | |
ES2959815T3 (es) | Edición génica selectiva de alelo y usos de la misma | |
US20200340012A1 (en) | Crispr-cas genome engineering via a modular aav delivery system | |
JP2023516692A (ja) | ゲノムを調節するための方法及び組成物 | |
JP2023517187A (ja) | ゲノムを調節するための方法及び組成物 | |
EP4100032A1 (en) | Gene editing methods for treating spinal muscular atrophy | |
KR20190042660A (ko) | 화학적으로 변형된 단일 가닥 rna-편집 올리고뉴클레오타이드 | |
WO2021034373A1 (en) | Conjugates of guide rna-cas protein complex | |
KR20160089530A (ko) | Hbv 및 바이러스 질병 및 질환을 위한 crisprcas 시스템 및 조성물의 전달,용도 및 치료적 적용 | |
JP2021519071A (ja) | シュードウリジン化のための核酸分子 | |
KR20220123398A (ko) | 합성 가이드 rna, 이의 조성물, 방법 및 용도 | |
WO2023240261A1 (en) | Nucleobase editing system and method of using same for modifying nucleic acid sequences | |
CN115244176A (zh) | 向导rna-cas蛋白复合物的缀合物 | |
WO2020006423A9 (en) | Synthetic guide molecules, compositions and methods relating thereto | |
WO2023120658A1 (ja) | 酵素、複合体、組換えベクター、遺伝性疾患治療薬及びポリヌクレオチド | |
US20240141382A1 (en) | Gene editing components, systems, and methods of use | |
US20240084274A1 (en) | Gene editing components, systems, and methods of use | |
WO2024020346A2 (en) | Gene editing components, systems, and methods of use | |
WO2023288304A2 (en) | Context-specific adenine base editors and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |