CN113454227A - 编码蛋白质的rna - Google Patents
编码蛋白质的rna Download PDFInfo
- Publication number
- CN113454227A CN113454227A CN201980092197.7A CN201980092197A CN113454227A CN 113454227 A CN113454227 A CN 113454227A CN 201980092197 A CN201980092197 A CN 201980092197A CN 113454227 A CN113454227 A CN 113454227A
- Authority
- CN
- China
- Prior art keywords
- signal peptide
- protein
- amino acid
- acid sequence
- mrna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 641
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 628
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 1048
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 183
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 108
- 239000013598 vector Substances 0.000 claims abstract description 43
- 239000013604 expression vector Substances 0.000 claims abstract description 26
- 238000013518 transcription Methods 0.000 claims abstract description 26
- 230000035897 transcription Effects 0.000 claims abstract description 26
- 239000000203 mixture Substances 0.000 claims abstract description 24
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 16
- 238000001415 gene therapy Methods 0.000 claims abstract description 13
- 235000018102 proteins Nutrition 0.000 claims description 625
- 150000001413 amino acids Chemical class 0.000 claims description 478
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims description 247
- 238000012217 deletion Methods 0.000 claims description 197
- 238000006467 substitution reaction Methods 0.000 claims description 197
- 230000037430 deletion Effects 0.000 claims description 194
- 238000003780 insertion Methods 0.000 claims description 187
- 230000037431 insertion Effects 0.000 claims description 187
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 claims description 141
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 125
- 102000004877 Insulin Human genes 0.000 claims description 121
- 108090001061 Insulin Proteins 0.000 claims description 121
- 229940125396 insulin Drugs 0.000 claims description 121
- 102100037852 Insulin-like growth factor I Human genes 0.000 claims description 117
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 claims description 91
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 claims description 91
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 claims description 91
- 239000003102 growth factor Substances 0.000 claims description 80
- 210000004027 cell Anatomy 0.000 claims description 63
- 108090000174 Interleukin-10 Proteins 0.000 claims description 50
- 102000004388 Interleukin-4 Human genes 0.000 claims description 49
- 108090000978 Interleukin-4 Proteins 0.000 claims description 49
- 102000004316 Oxidoreductases Human genes 0.000 claims description 48
- 108090000854 Oxidoreductases Proteins 0.000 claims description 48
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 claims description 46
- 102000003951 Erythropoietin Human genes 0.000 claims description 45
- 108090000394 Erythropoietin Proteins 0.000 claims description 45
- 101150088952 IGF1 gene Proteins 0.000 claims description 45
- 229940105423 erythropoietin Drugs 0.000 claims description 45
- 229940076144 interleukin-10 Drugs 0.000 claims description 39
- 229940028885 interleukin-4 Drugs 0.000 claims description 35
- 108010063919 Glucagon Receptors Proteins 0.000 claims description 30
- 102100040890 Glucagon receptor Human genes 0.000 claims description 30
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 claims description 29
- 101000617130 Homo sapiens Stromal cell-derived factor 1 Proteins 0.000 claims description 27
- 210000002027 skeletal muscle Anatomy 0.000 claims description 25
- 102000044162 human IGF1 Human genes 0.000 claims description 24
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 23
- 108091026890 Coding region Proteins 0.000 claims description 22
- 102000019197 Superoxide Dismutase Human genes 0.000 claims description 22
- 108010012715 Superoxide dismutase Proteins 0.000 claims description 22
- 102100033513 Prostate and testis expressed protein 2 Human genes 0.000 claims description 21
- 102100035326 Complement factor H-related protein 2 Human genes 0.000 claims description 18
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 18
- 101001076292 Homo sapiens Insulin-like growth factor II Proteins 0.000 claims description 17
- 102100025947 Insulin-like growth factor II Human genes 0.000 claims description 17
- 102000004127 Cytokines Human genes 0.000 claims description 15
- 108090000695 Cytokines Proteins 0.000 claims description 15
- 229940088597 hormone Drugs 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 15
- 102100028073 Fibroblast growth factor 5 Human genes 0.000 claims description 12
- 102100029225 Insulin-like growth factor-binding protein 5 Human genes 0.000 claims description 12
- 102100024319 Intestinal-type alkaline phosphatase Human genes 0.000 claims description 12
- 108091005804 Peptidases Proteins 0.000 claims description 12
- 229920001184 polypeptide Polymers 0.000 claims description 12
- 108090000380 Fibroblast growth factor 5 Proteins 0.000 claims description 11
- 101001060267 Homo sapiens Fibroblast growth factor 5 Proteins 0.000 claims description 11
- 101100018355 Homo sapiens IGFBP5 gene Proteins 0.000 claims description 11
- 101001135020 Homo sapiens Prostate and testis expressed protein 2 Proteins 0.000 claims description 11
- 108090000961 Insulin-like growth factor binding protein 5 Proteins 0.000 claims description 11
- 101710184243 Intestinal-type alkaline phosphatase Proteins 0.000 claims description 11
- 208000029549 Muscle injury Diseases 0.000 claims description 11
- 239000004365 Protease Substances 0.000 claims description 11
- 101710101149 Complement factor H-related protein 2 Proteins 0.000 claims description 10
- 101710098093 Prostate and testis expressed protein 2 Proteins 0.000 claims description 10
- 239000005556 hormone Substances 0.000 claims description 10
- 230000000508 neurotrophic effect Effects 0.000 claims description 10
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 claims description 9
- 102000028718 growth factor binding proteins Human genes 0.000 claims description 8
- 108091009353 growth factor binding proteins Proteins 0.000 claims description 8
- 229910052698 phosphorus Inorganic materials 0.000 claims description 8
- 229910052721 tungsten Inorganic materials 0.000 claims description 8
- 229910052720 vanadium Inorganic materials 0.000 claims description 8
- 230000002227 vasoactive effect Effects 0.000 claims description 8
- 229910052727 yttrium Inorganic materials 0.000 claims description 8
- 101710154607 Azurocidin Proteins 0.000 claims description 7
- 108010006303 Carboxypeptidases Proteins 0.000 claims description 7
- 102000005367 Carboxypeptidases Human genes 0.000 claims description 7
- 108010078791 Carrier Proteins Proteins 0.000 claims description 7
- 108090000371 Esterases Proteins 0.000 claims description 7
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 claims description 7
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 claims description 7
- 108010056771 Glucosidases Proteins 0.000 claims description 7
- 102000004366 Glucosidases Human genes 0.000 claims description 7
- 108700023372 Glycosyltransferases Proteins 0.000 claims description 7
- 102000004157 Hydrolases Human genes 0.000 claims description 7
- 108090000604 Hydrolases Proteins 0.000 claims description 7
- 108060003951 Immunoglobulin Proteins 0.000 claims description 7
- 108090000769 Isomerases Proteins 0.000 claims description 7
- 102000004195 Isomerases Human genes 0.000 claims description 7
- 108090000856 Lyases Proteins 0.000 claims description 7
- 102000004317 Lyases Human genes 0.000 claims description 7
- 102000005741 Metalloproteases Human genes 0.000 claims description 7
- 108010006035 Metalloproteases Proteins 0.000 claims description 7
- 102000014171 Milk Proteins Human genes 0.000 claims description 7
- 108010011756 Milk Proteins Proteins 0.000 claims description 7
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 claims description 7
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 claims description 7
- 108091000080 Phosphotransferase Proteins 0.000 claims description 7
- 102000004357 Transferases Human genes 0.000 claims description 7
- 108090000992 Transferases Proteins 0.000 claims description 7
- 102000018358 immunoglobulin Human genes 0.000 claims description 7
- 239000003446 ligand Substances 0.000 claims description 7
- 229940125956 metalloenzyme inhibitor Drugs 0.000 claims description 7
- 235000021239 milk protein Nutrition 0.000 claims description 7
- 239000000137 peptide hydrolase inhibitor Substances 0.000 claims description 7
- 102000020233 phosphotransferase Human genes 0.000 claims description 7
- 102000051366 Glycosyltransferases Human genes 0.000 claims description 6
- 108010025020 Nerve Growth Factor Proteins 0.000 claims description 6
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 claims description 6
- 238000012258 culturing Methods 0.000 claims description 6
- -1 inhha Proteins 0.000 claims description 6
- 239000000122 growth hormone Substances 0.000 claims description 5
- 229910052799 carbon Inorganic materials 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 229910052739 hydrogen Inorganic materials 0.000 claims description 4
- 229910052740 iodine Inorganic materials 0.000 claims description 4
- 229910052717 sulfur Inorganic materials 0.000 claims description 4
- 239000001963 growth medium Substances 0.000 claims description 3
- 239000002609 medium Substances 0.000 claims description 3
- 102100026376 Artemin Human genes 0.000 claims description 2
- 102100039068 Interleukin-10 Human genes 0.000 claims 5
- 102000043635 human AZU1 Human genes 0.000 claims 3
- 101000635938 Homo sapiens Transforming growth factor beta-1 proprotein Proteins 0.000 claims 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 2
- 102100030742 Transforming growth factor beta-1 proprotein Human genes 0.000 claims 2
- 101800001382 Betacellulin Proteins 0.000 claims 1
- 102100035345 Cerebral dopamine neurotrophic factor Human genes 0.000 claims 1
- 102100024300 Cryptic protein Human genes 0.000 claims 1
- AVVWPBAENSWJCB-GASJEMHNSA-N D-mannofuranose Chemical compound OC[C@@H](O)[C@H]1OC(O)[C@@H](O)[C@H]1O AVVWPBAENSWJCB-GASJEMHNSA-N 0.000 claims 1
- 102100030323 Epigen Human genes 0.000 claims 1
- 102100039111 FAD-linked sulfhydryl oxidase ALR Human genes 0.000 claims 1
- 101150021185 FGF gene Proteins 0.000 claims 1
- 101150065433 GCHFR gene Proteins 0.000 claims 1
- 102000024452 GDNF Human genes 0.000 claims 1
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 claims 1
- 101000785776 Homo sapiens Artemin Proteins 0.000 claims 1
- 101000737775 Homo sapiens Cerebral dopamine neurotrophic factor Proteins 0.000 claims 1
- 101000980044 Homo sapiens Cryptic protein Proteins 0.000 claims 1
- 101000938352 Homo sapiens Epigen Proteins 0.000 claims 1
- 101000959079 Homo sapiens FAD-linked sulfhydryl oxidase ALR Proteins 0.000 claims 1
- 101001054725 Homo sapiens Inhibin beta B chain Proteins 0.000 claims 1
- 101001054832 Homo sapiens Inhibin beta C chain Proteins 0.000 claims 1
- 101000688216 Homo sapiens Intestinal-type alkaline phosphatase Proteins 0.000 claims 1
- 101000749842 Homo sapiens Leukocyte cell-derived chemotaxin 1 Proteins 0.000 claims 1
- 101000616876 Homo sapiens Mesencephalic astrocyte-derived neurotrophic factor Proteins 0.000 claims 1
- 101001121082 Homo sapiens Mimecan Proteins 0.000 claims 1
- 101100241084 Homo sapiens NRTN gene Proteins 0.000 claims 1
- 101001136670 Homo sapiens Persephin Proteins 0.000 claims 1
- 101000611888 Homo sapiens Platelet-derived growth factor C Proteins 0.000 claims 1
- 101001056707 Homo sapiens Proepiregulin Proteins 0.000 claims 1
- 101001028804 Homo sapiens Protein eyes shut homolog Proteins 0.000 claims 1
- 102100027003 Inhibin beta B chain Human genes 0.000 claims 1
- 102100026812 Inhibin beta C chain Human genes 0.000 claims 1
- 102100040448 Leukocyte cell-derived chemotaxin 1 Human genes 0.000 claims 1
- 102100021833 Mesencephalic astrocyte-derived neurotrophic factor Human genes 0.000 claims 1
- 102100026632 Mimecan Human genes 0.000 claims 1
- 102100030173 Muellerian-inhibiting factor Human genes 0.000 claims 1
- 101710122877 Muellerian-inhibiting factor Proteins 0.000 claims 1
- 101100405118 Mus musculus Nr4a1 gene Proteins 0.000 claims 1
- 102100021584 Neurturin Human genes 0.000 claims 1
- 102100036660 Persephin Human genes 0.000 claims 1
- 102100040681 Platelet-derived growth factor C Human genes 0.000 claims 1
- 102100037596 Platelet-derived growth factor subunit A Human genes 0.000 claims 1
- 102100040990 Platelet-derived growth factor subunit B Human genes 0.000 claims 1
- 102100029837 Probetacellulin Human genes 0.000 claims 1
- 102100025498 Proepiregulin Human genes 0.000 claims 1
- 102100037166 Protein eyes shut homolog Human genes 0.000 claims 1
- 108010019674 Proto-Oncogene Proteins c-sis Proteins 0.000 claims 1
- 102400000267 Rhomboid-related protein 2, N-terminal fragment Human genes 0.000 claims 1
- 101800000645 Rhomboid-related protein 2, N-terminal fragment Proteins 0.000 claims 1
- 102100030053 Secreted frizzled-related protein 3 Human genes 0.000 claims 1
- 101800000716 Tumor necrosis factor, membrane form Proteins 0.000 claims 1
- 108010020277 WD repeat containing planar cell polarity effector Proteins 0.000 claims 1
- 101000779569 Zymomonas mobilis subsp. mobilis (strain ATCC 31821 / ZM4 / CP4) Alkaline phosphatase PhoD Proteins 0.000 claims 1
- 108010017843 platelet-derived growth factor A Proteins 0.000 claims 1
- 108020004707 nucleic acids Proteins 0.000 abstract description 11
- 102000039446 nucleic acids Human genes 0.000 abstract description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 3
- 201000010099 disease Diseases 0.000 abstract description 2
- 208000035475 disorder Diseases 0.000 abstract 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 380
- 230000006870 function Effects 0.000 description 85
- 230000028327 secretion Effects 0.000 description 59
- 102000003814 Interleukin-10 Human genes 0.000 description 45
- 239000002773 nucleotide Substances 0.000 description 32
- 125000003729 nucleotide group Chemical group 0.000 description 32
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 30
- 108020004705 Codon Proteins 0.000 description 24
- 150000003839 salts Chemical class 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 18
- 239000012634 fragment Substances 0.000 description 18
- 108700026244 Open Reading Frames Proteins 0.000 description 16
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 16
- 238000001890 transfection Methods 0.000 description 16
- 238000002965 ELISA Methods 0.000 description 14
- 238000004113 cell culture Methods 0.000 description 14
- 239000012228 culture supernatant Substances 0.000 description 14
- 230000006698 induction Effects 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 11
- 238000000692 Student's t-test Methods 0.000 description 11
- 102000003967 Fibroblast growth factor 5 Human genes 0.000 description 10
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 10
- 102000004371 Insulin-like growth factor binding protein 5 Human genes 0.000 description 10
- 102000035195 Peptidases Human genes 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 208000027418 Wounds and injury Diseases 0.000 description 9
- 230000006378 damage Effects 0.000 description 9
- 208000014674 injury Diseases 0.000 description 9
- 210000003205 muscle Anatomy 0.000 description 9
- 101000878135 Homo sapiens Complement factor H-related protein 2 Proteins 0.000 description 8
- 101000987586 Homo sapiens Eosinophil peroxidase Proteins 0.000 description 8
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 8
- 102000044890 human EPO Human genes 0.000 description 8
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 8
- 229940045145 uridine Drugs 0.000 description 8
- OPCMVVKRCLOEDQ-UHFFFAOYSA-N 1-(4-chlorophenyl)-2-(methylamino)pentan-1-one Chemical compound ClC1=CC=C(C=C1)C(C(CCC)NC)=O OPCMVVKRCLOEDQ-UHFFFAOYSA-N 0.000 description 7
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 7
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 239000002777 nucleoside Substances 0.000 description 7
- 101001033233 Homo sapiens Interleukin-10 Proteins 0.000 description 6
- 101001002709 Homo sapiens Interleukin-4 Proteins 0.000 description 6
- 102000013275 Somatomedins Human genes 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 102000052620 human IL10 Human genes 0.000 description 6
- 102000055229 human IL4 Human genes 0.000 description 6
- 210000003292 kidney cell Anatomy 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 108010088751 Albumins Proteins 0.000 description 5
- 102000009027 Albumins Human genes 0.000 description 5
- OBMZMSLWNNWEJA-XNCRXQDQSA-N C1=CC=2C(C[C@@H]3NC(=O)[C@@H](NC(=O)[C@H](NC(=O)N(CC#CCN(CCCC[C@H](NC(=O)[C@@H](CC4=CC=CC=C4)NC3=O)C(=O)N)CC=C)NC(=O)[C@@H](N)C)CC3=CNC4=C3C=CC=C4)C)=CNC=2C=C1 Chemical compound C1=CC=2C(C[C@@H]3NC(=O)[C@@H](NC(=O)[C@H](NC(=O)N(CC#CCN(CCCC[C@H](NC(=O)[C@@H](CC4=CC=CC=C4)NC3=O)C(=O)N)CC=C)NC(=O)[C@@H](N)C)CC3=CNC4=C3C=CC=C4)C)=CNC=2C=C1 OBMZMSLWNNWEJA-XNCRXQDQSA-N 0.000 description 5
- 101000920686 Homo sapiens Erythropoietin Proteins 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 241000701161 unidentified adenovirus Species 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 4
- 102100030009 Azurocidin Human genes 0.000 description 4
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 4
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 235000019419 proteases Nutrition 0.000 description 4
- 210000001139 rectus abdominis Anatomy 0.000 description 4
- 230000003248 secreting effect Effects 0.000 description 4
- 210000005070 sphincter Anatomy 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 239000013603 viral vector Substances 0.000 description 4
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical group O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 3
- 108091033380 Coding strand Proteins 0.000 description 3
- 101000693844 Homo sapiens Insulin-like growth factor-binding protein complex acid labile subunit Proteins 0.000 description 3
- 102000003839 Human Proteins Human genes 0.000 description 3
- 108090000144 Human Proteins Proteins 0.000 description 3
- 102100025515 Insulin-like growth factor-binding protein complex acid labile subunit Human genes 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 210000001612 chondrocyte Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 3
- 210000002288 golgi apparatus Anatomy 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 210000005229 liver cell Anatomy 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000001543 one-way ANOVA Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 210000000513 rotator cuff Anatomy 0.000 description 3
- 102220290157 rs771847879 Human genes 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101100203566 Caenorhabditis elegans sod-3 gene Proteins 0.000 description 2
- 102000000844 Cell Surface Receptors Human genes 0.000 description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 description 2
- 108010008951 Chemokine CXCL12 Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 101150092822 FGF5 gene Proteins 0.000 description 2
- 102100039619 Granulocyte colony-stimulating factor Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101150002416 Igf2 gene Proteins 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 108010000684 Matrix Metalloproteinases Proteins 0.000 description 2
- 102000002274 Matrix Metalloproteinases Human genes 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 101150036143 NTF3 gene Proteins 0.000 description 2
- 241000411545 Punargentus Species 0.000 description 2
- 101100533820 Rattus norvegicus Sod3 gene Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 210000003489 abdominal muscle Anatomy 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000004013 groin Anatomy 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000035876 healing Effects 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000010255 intramuscular injection Methods 0.000 description 2
- 239000007927 intramuscular injection Substances 0.000 description 2
- 235000015250 liver sausages Nutrition 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000004118 muscle contraction Effects 0.000 description 2
- 230000004220 muscle function Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000000062 pectoralis major Anatomy 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 210000002250 primary motor neuron Anatomy 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- XYSQXZCMOLNHOI-UHFFFAOYSA-N s-[2-[[4-(acetylsulfamoyl)phenyl]carbamoyl]phenyl] 5-pyridin-1-ium-1-ylpentanethioate;bromide Chemical compound [Br-].C1=CC(S(=O)(=O)NC(=O)C)=CC=C1NC(=O)C1=CC=CC=C1SC(=O)CCCC[N+]1=CC=CC=C1 XYSQXZCMOLNHOI-UHFFFAOYSA-N 0.000 description 2
- 210000002363 skeletal muscle cell Anatomy 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- VOUAQYXWVJDEQY-QENPJCQMSA-N 33017-11-7 Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)NCC(=O)NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)CCC1 VOUAQYXWVJDEQY-QENPJCQMSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 241000714230 Avian leukemia virus Species 0.000 description 1
- 108010075254 C-Peptide Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 101000739876 Homo sapiens Brain-derived neurotrophic factor Proteins 0.000 description 1
- 101000746367 Homo sapiens Granulocyte colony-stimulating factor Proteins 0.000 description 1
- 101100126159 Homo sapiens INS gene Proteins 0.000 description 1
- 101500025353 Homo sapiens Insulin A chain Proteins 0.000 description 1
- 101500025354 Homo sapiens Insulin B chain Proteins 0.000 description 1
- 101001054649 Homo sapiens Latent-transforming growth factor beta-binding protein 2 Proteins 0.000 description 1
- 101001054646 Homo sapiens Latent-transforming growth factor beta-binding protein 3 Proteins 0.000 description 1
- 101000634196 Homo sapiens Neurotrophin-3 Proteins 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 102100027017 Latent-transforming growth factor beta-binding protein 2 Human genes 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000713883 Myeloproliferative sarcoma virus Species 0.000 description 1
- 101001055320 Myxine glutinosa Insulin-like growth factor Proteins 0.000 description 1
- 102100029268 Neurotrophin-3 Human genes 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 241000713896 Spleen necrosis virus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 102000008221 Superoxide Dismutase-1 Human genes 0.000 description 1
- 108010021188 Superoxide Dismutase-1 Proteins 0.000 description 1
- 102100036407 Thioredoxin Human genes 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 210000001361 achilles tendon Anatomy 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000000617 arm Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 210000001217 buttock Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000010001 cellular homeostasis Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 239000000824 cytostatic agent Substances 0.000 description 1
- 230000001085 cytostatic effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 102000022382 heparin binding proteins Human genes 0.000 description 1
- 108091012216 heparin binding proteins Proteins 0.000 description 1
- 102000051542 human BDNF Human genes 0.000 description 1
- 229940077456 human brain-derived neurotrophic factor Drugs 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 210000003692 ilium Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 102000028416 insulin-like growth factor binding Human genes 0.000 description 1
- 108091022911 insulin-like growth factor binding Proteins 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 210000002414 leg Anatomy 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000001699 lower leg Anatomy 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000003061 neural cell Anatomy 0.000 description 1
- 230000036403 neuro physiology Effects 0.000 description 1
- 230000003955 neuronal function Effects 0.000 description 1
- 230000006576 neuronal survival Effects 0.000 description 1
- 239000003900 neurotrophic factor Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 210000004197 pelvis Anatomy 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 210000004180 plasmocyte Anatomy 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 210000003314 quadriceps muscle Anatomy 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 102200090720 rs137852501 Human genes 0.000 description 1
- 102220054627 rs45495192 Human genes 0.000 description 1
- 102220138004 rs886055626 Human genes 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 238000011287 therapeutic dose Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 238000011200 topical administration Methods 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 102000029947 transforming growth factor beta binding proteins Human genes 0.000 description 1
- 108091014793 transforming growth factor beta binding proteins Proteins 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 230000001228 trophic effect Effects 0.000 description 1
- 238000007492 two-way ANOVA Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 230000004218 vascular function Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
Abstract
本发明涉及包含编码蛋白质和信号肽的核酸序列的mRNA、和包含编码蛋白质和信号肽的核酸的转录单元、表达载体或基因治疗载体。本文还公开了包含所述mRNA、转录单元、表达载体或基因治疗载体的治疗组合物以及该治疗组合物在治疗疾病或病症中的用途。
Description
技术领域
本发明涉及包含编码蛋白质和信号肽的核酸序列的mRNA,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
本发明进一步涉及一种包含核酸序列的mRNA,所述核酸序列编码:
i)蛋白质;ii)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质不是氧化还原酶。本发明涉及包含编码蛋白质和信号肽的核酸序列的转录单元或表达载体,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。本发明还涉及包含编码蛋白质和与所述蛋白质异源的信号肽的核酸序列的转录单元或表达载体,其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽。本发明还涉及包含mRNA和/或转录单元或表达载体的治疗组合物和试剂盒。本发明还涉及mRNA、转录单元或表达载体、治疗组合物和/或试剂盒,其用作药物,特别是涉及包含核酸序列的mRNA,所述核酸序列编码i)IGF1;和ii)脑源性神经营养因子(BDNF)的信号肽,其用作药物。本发明还涉及mRNA及其治疗组合物,用于治疗骨骼肌损伤的方法。
背景技术
过去已经进行了不同的尝试来增加编码的蛋白质的表达和分泌的产量,特别是通过使用改善的体外和/或体内表达***。现有技术中通常描述的增加表达和分泌的方法通常基于使用含有特定启动子和相应调控元件的表达载体或表达盒。由于这些表达载体或表达盒通常限于特定的细胞***,因此必须调整这些表达***以适用于不同的细胞***。然后通常将这种调整的表达载体或表达盒转染到细胞中,并且通常根据特定细胞系进行处理。因此,主要优选那些能够通过细胞固有的***在靶细胞中表达编码的蛋白质的核酸分子,如mRNA,而与特定细胞类型特异的启动子和调控元件无关。在这种情况下,可以在mRNA稳定元件和增加mRNA翻译效率的元件之间进行区分。例如,WO 02/098443描述了通常为稳定形式的mRNA,并针对其编码区中的翻译进行优化。WO 02/098443进一步公开了一种确定序列修饰的方法。WO 02/098443另外描述了在mRNA序列中取代腺嘌呤和尿嘧啶核苷酸以增加序列的鸟嘌呤/胞嘧啶(G/C)含量的可能性。在这种情况下,WO 02/098443一般地提及了作为此类修饰的碱基序列的序列,其中修饰的mRNA编码至少一种生物活性肽或多肽,所述生物活性肽或多肽在待治疗的患者中,例如,完全不翻译、或不充分翻译或存在错误翻译。在增加编码的蛋白质的表达的另一种方法中,申请WO 2007/036366描述了β珠蛋白基因的长poly(A)序列(特别是长于120bp)和至少两个3'非翻译区的组合对mRNA的稳定性和翻译活性的正性作用。尽管本领域取得的所有进展,但是在无细胞***、细胞或生物体中编码的蛋白质的有效表达,特别是有效分泌(重组表达)仍然是一个具有挑战性的问题。
发明内容
本发明提供了包含编码蛋白质和信号肽的核酸序列的mRNA,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽选自
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
本发明进一步提供了一种包含核酸序列的mRNA,所述核酸序列编码
i)蛋白质;和
ii)与所述蛋白质异源的信号肽,
其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质不是氧化还原酶,特别是本发明提供了一种包含核酸序列的mRNA,所述核酸序列编码
i)蛋白质;和
ii)与所述蛋白质异源的信号肽,
其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质选自羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶;免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白。
本发明进一步提供了包含编码蛋白质和信号肽的核酸序列的转录单元或表达载体,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
本发明进一步提供了包含编码蛋白质和与所述蛋白质异源的信号肽的核酸序列的转录单元或表达载体,其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质不是氧化还原酶。本发明进一步提供了包含编码蛋白质和与所述蛋白质异源的信号肽的核酸序列的转录单元或表达载体,其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质选自羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶;免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白。本发明进一步提供了包含上述mRNA和/或转录单元或表达载体的治疗组合物。本发明进一步提供了一种试剂盒,其包含上述mRNA、转录单元或表达载体和/或治疗组合物,以及说明书,任选地载体图,任选地宿主细胞,任选地用于培养宿主细胞的培养基,和/或任选地用于选择和培养转染的宿主细胞的选择培养基。本发明进一步提供了上述mRNA、转录单元或表达载体、治疗组合物或试剂盒,用作药物。本发明进一步提供了一种用作药物的包含核酸序列的mRNA,所述核酸序列编码i)IGF1;和ii)脑源性神经营养因子(BDNF)的信号肽。本发明进一步提供了用于治疗骨骼肌损伤的方法中的mRNA或包含mRNA的治疗组合物。
本发明人惊奇地发现一种包含编码蛋白质和信号肽的核酸序列的mRNA,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽选自
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其天然地不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰,
与转染编码蛋白质及其天然、同源信号肽的mRNA的细胞分泌的蛋白质相比,转染该mRNA的细胞提供更有效的蛋白质分泌。特别地,本发明人惊奇地发现一种包含核酸序列的mRNA,所述核酸序列编码i)蛋白质;和ii)与所述蛋白质异源的BDNF信号肽,转染该mRNA的细胞比转染蛋白质的天然、同源信号肽的细胞更有效地分泌蛋白质。与包含相同蛋白质和该蛋白质的天然、同源信号肽的mRNA相比,分泌的蛋白质量高达六倍。这一意想不到的发现可用于在细胞中有效地递送和表达编码所需蛋白质的mRNA,以获得比使用该蛋白质的天然、同源信号肽更高的蛋白质分泌量。由本发明提供的以相同量的mRNA获得的更高的蛋白质分泌量对于降低需要局部施用于组织中的治疗剂量是极其有用的,从而增加了其安全性窗口,对抗潜在的与mRNA相关的副作用。此外,它使得该应用更适合用于控释和装置包衣的制剂。此外,它降低了与mRNA相关的免疫原性的风险,并使得该应用更适合注射体积有限的组织或以前无法接近的组织。本发明人还发现,可以有效地向骨骼肌递送和表达mRNA,特别是编码人IGF-1的mRNA,从而允许在骨骼肌中表达所需多肽,从而为肌肉提供相关的功能益处。mRNA优选以液体组合物存在,优选以裸露形式存在。该液体组合物可以例如通过注射直接递送至骨骼肌,并且不需要用于mRNA的任何基因转移载体或运载体或用于增强向组织转移的方法,例如电转移或超声。而且,表明将mRNA注射到受伤的骨骼肌中加速了恢复过程,并导致骨骼肌的功能增强。出乎意料的是,用编码IGF-1的mRNA处理的动物到16天就达到了健康范围内的功能水平。相比之下,接受载剂治疗的对照动物甚至到第28天都没有达到完全的功能恢复。
附图说明
图1显示了Cpd.1的DNA和RNA序列。(A)显示人密码子优化的IGF1的DNA序列(SEQID No:1),其包含其预先结构域(pre-domain)、前结构域(pro-domain)和编码结构域。预先结构域(信号肽)的序列用斜体表示,前结构域的序列用下划线表示,IGF-1编码结构域用粗体表示,终止密码子用粗体表示。(B)示出了人IGF1的预先(pre-)、前(pro-)和编码结构域的RNA序列(SEQ ID NO:2),其中尿苷是N1-甲基假尿苷。预先和前结构域在分泌时被切割。
图2显示了Cpd.2的DNA和RNA序列。(A)显示人密码子优化的IGF1的DNA序列(SEQID NO:3),其包含IGF2预先结构域和IGF1前和编码结构域。预先结构域(信号肽)的序列用斜体表示,前结构域的序列用下划线表示,IGF1编码结构域用粗体表示,终止密码子用粗体表示。(B)示出了IGF2的预先、IGF1的前和编码结构域的RNA序列(SEQ ID NO:4),其中尿苷是N1-甲基假尿苷。预先和前结构域在分泌时被切割。
图3显示了Cpd.3的DNA和RNA序列。(A)显示人密码子优化的IGF1的DNA序列(SEQID NO:5),其包含ALB预先结构域和IGF1前和编码结构域。预先结构域(信号肽)的序列用斜体表示,前结构域的序列用下划线表示,IGF1编码结构域用粗体表示,终止密码子用粗体表示。(B)示出了ALB的预先、IGF1的前和编码结构域的RNA序列(SEQ ID NO:6),其中尿苷是N1-甲基假尿苷。预先和前结构域在分泌时被切割。
图4显示了Cpd.4的DNA和RNA序列。(A)显示人密码子优化的IGF1的DNA序列(SEQID NO:7),其包含BDNF预先结构域和IGF1前和编码结构域。预先结构域(信号肽)的序列用斜体表示,前结构域的序列用下划线表示,IGF1编码结构域用粗体表示,终止密码子用粗体表示。(B)示出了BDNF的预先、IGF1的前和编码结构域的RNA序列(SEQ ID NO:8),其中尿苷是N1-甲基假尿苷。预先和前结构域在分泌时被切割。
图5显示了Cpd.5的DNA和RNA序列。(A)显示人密码子优化的IGF1的DNA序列(SEQID NO:9),其包含CXCL12预先结构域和IGF1前和编码结构域。预先结构域(信号肽)的序列用斜体表示,前结构域的序列用下划线表示,IGF1编码结构域用粗体表示,终止密码子用粗 体表示。(B)示出了CXCL12的预先、IGF1的前和编码结构域的RNA序列(SEQ ID NO:10),其中尿苷是N1-甲基假尿苷。预先和前结构域在分泌时被切割。
图6显示了Cpd.6的DNA和RNA序列。(A)显示人密码子优化的IGF1的DNA序列(SEQID No:11),其包含合成的信号肽1预先结构域和IGF1前和编码结构域。预先结构域(信号肽)的序列用斜体表示,前结构域的序列用下划线表示,IGF1编码结构域用粗体表示,终止密码子用粗体表示。(B)示出了合成的信号肽1的预先和IGF1的前和编码结构域的RNA序列(SEQ ID NO:12),其中尿苷是N1-甲基假尿苷。预先和前结构域在分泌时被切割。
图7显示了Cpd.7的DNA和RNA序列。(A)显示人密码子优化的IGF1的DNA序列(SEQID NO:13),其包含合成的信号肽2预先结构域和IGF1前和编码结构域。预先结构域(信号肽)的序列用斜体表示,前结构域的序列用下划线表示,IGF1编码结构域用粗体表示,终止密码子用粗体表示。(B)示出了合成的信号肽2的预先和IGF1的前和编码结构域的RNA序列(SEQ ID NO:14),其中尿苷是N1-甲基假尿苷。预先和前结构域在分泌时被切割。
图8显示载体pVAX.A120的DNA序列,其中Cpd.1***以粗体标记(SEQ ID NO:15)。从其原始质粒中消化Cpd.1的ORF,并将其亚克隆到载体中。
图9显示载体pMA-T的DNA序列,其中Cpd.2***以粗体标记(SEQ ID NO:16)。从其原始质粒中消化Cpd.2的ORF,并将其亚克隆到载体中。
图10显示载体pMA-T的DNA序列,其中Cpd.3***以粗体标记(SEQ ID NO:17)。从其原始质粒中消化Cpd.3的ORF,并将其亚克隆到载体中。
图11显示载体pMA-T的DNA序列,其中Cpd.4***以粗体标记(SEQ ID NO:18)。从其原始质粒中消化Cpd.4的ORF,并将其亚克隆到载体中。
图12显示载体pMA-T的DNA序列,其中Cpd.5***以粗体标记(SEQ ID NO:19)。从其原始质粒中消化Cpd.5的ORF,并将其亚克隆到载体中。
图13显示载体pMA-RQ的DNA序列,其中Cpd.6以粗体标记(SEQ ID NO:20)。从其原始质粒中消化Cpd.6的ORF,并将其亚克隆到载体中。
图14显示载体pMA-RQ的DNA序列,其中Cpd.7以粗体标记(SEQ ID NO:21)。从其原始质粒中消化Cpd.7的ORF,并将其亚克隆到载体中。
图15显示用于扩增mRNA的IVT的pMA-T和pMA-RQ质粒的正向(SEQ ID NO:22)和反向引物(SEQ ID NO:23)序列。
图16显示Cpd.1-Cpd.7信号肽的基因名称、UniProt编号、密码子优化的DNA和氨基酸序列以及载体。1-Cpd.7(SEQ ID No:24-37)。注意,Cpd.6和Cpd.7的信号肽是合成肽,与公共数据库中的已知蛋白质序列不匹配。
图17显示了通过用Cpd.1-Cpd.7的mRNA转染诱导人胚肾细胞(HEK293T)分泌IGF1。分别用2μg Cp.1-Cpd.7转染HEK293T细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。Cpd.4诱导的IGF1分泌显著高于Cpd.1(3.3倍)。数据代表4次重复的平均值±平均值的标准误差。通过单因素ANOVA,随后通过Dunnett多重比较检验评估显著性(***,<0.001)。
图18显示了用Cpd.1或Cpd.4进行mRNA转染后,在HEK293T细胞中诱导的IGF1分泌的浓度依赖性。用不同浓度(0、0.02、0.06、0.2、0.6或2μg)的Cpd.1或Cpd.4转染细胞,并在24小时后使用特异性ELISA测量细胞培养上清液中分泌的IGF1。Cpd.4(EC50 0.134μg)比Cpd.1(EC50 0.889μg)显著更有效地诱导IGF1分泌。数据代表2次重复的平均值±平均值的标准误差。通过两条曲线的双因素ANOVA评估显著性(***,<0.001)。
图19显示了通过用Cpd.1-Cpd.7的mRNA转染诱导小鼠骨骼肌细胞(C2C12)分泌IGF1。分别用2μg Cp.1-Cpd.7转染C2C12细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。Cpd.4诱导的IGF1分泌显著高于Cpd.1(6.1倍)。数据代表4次重复的平均值±平均值的标准误差。通过单因素ANOVA,随后通过Dunnett多重比较检验评估显著性(***,<0.001)。
图20显示了通过用Cpd.1和Cpd.4的mRNA转染诱导人原代骨骼肌细胞(HSkMC)分泌IGF1。分别用2μg Cp.1或Cpd.4转染HSkMC细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。Cpd.4诱导的IGF1分泌显著高于Cpd.1(3.1倍)。数据代表3次重复的平均值±平均值的标准误差。通过单因素ANOVA,随后通过Dunnett多重比较检验评估显著性(**,P<0.01)。
图21显示了notexin损伤后胫骨前(TA)肌肉的功能恢复。在通过肌肉内注射引起Notexin损伤(第0天)后,在第1天和第4天通过肌肉内注射施加了两次IGF-I mRNA治疗(Cpd.4(1μg))(见箭头)。对照组接受了载剂溶液。在损伤后第1、4、7、10、14、21和28天评估肌肉功能。数据代表每组和每个时间点5只小鼠的平均值±平均值的标准误差(SEM)。星号表示通过学生t检验评估的Cpd.4治疗组与对照组的显著差异(p<0.05)。
图22显示了通过用Cpd.1(作为对照)和Cpd.8-Cpd.26的mRNA转染诱导人胚肾细胞(HEK293T)分泌IGF1。分别用0.3μg Cpd.1和Cpd.8-Cpd.26转染HEK293T细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。针对Cpd.1IGF1分泌对IGF1分泌进行标准化。Cpd.8、9、10、11、12和13显示IGF1分泌降低,而Cpd.14、15、16、17、18、19、20、21、23、24、25和26诱导的IGF1分泌高于Cpd.1(高达2.6倍)。数据表示每种Cpd.的2-11次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.1相比的显著性(*,p<0.05;**,p<0.001;***,<0.001)。
图23显示了用Cpd.1(作为对照)和Cpd.4-Cpd.26的mRNA转染诱导人肝细胞(HepG2)分泌IGF1。分别用0.3μg Cp.1和Cpd.4-Cpd.26转染HepG2细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。针对Cpd.1对IGF1分泌进行归一化。Cpd.8、9和12显示IGF1分泌降低,而Cpd.4、15、16、17、18、19、20、21、22、23、24、25和26诱导的IGF1分泌高于Cpd.1(高达8.3倍)。数据表示每种Cpd.的2-4次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.1相比的显著性(**,p<0.01;***,<0.001)。
图24显示了通过用Cpd.1(作为对照)和Cpd.4-Cpd.24的mRNA转染诱导人神经细胞(IMR32)分泌IGF1。分别用0.3μg Cp.1和Cpd.4-Cpd.24转染IMR32细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。针对Cpd.1IGF1分泌对IGF1分泌进行标准化。Cpd.4、14、15、16、17、20、22、23和24诱导的IGF1分泌高于Cpd.1(高达2.6倍)。数据表示每种Cpd.的2-6次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.1相比的显著性(*,p<0.05;***,<0.001)。
图25显示了通过用Cpd.1(作为对照)和Cpd.4-Cpd.25的mRNA转染诱导人原代软骨细胞分泌IGF1。分别用0.6μg Cp.1和Cpd.4-Cpd.25转染软骨细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。针对Cpd.1IGF1分泌对IGF1分泌进行标准化。Cpd.4、14、15、16、20、21、22、24和25诱导的IGF1分泌高于Cpd.1(高达1.9倍)。数据表示每种Cpd.的1-2次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.1相比的显著性(*,p<0.05;***,<0.001)。
图26显示了通过用Cpd.1(作为对照)和Cpd.4-Cpd.17的mRNA转染诱导大鼠野生型(A)或SOD1GS93A(B)原代运动神经元分泌IGF1。分别用0.3μg Cp.1、Cpd.4、Cpd.14和Cpd.17转染大鼠野生型原代运动神经元,并分别用0.3μg Cp.1、Cpd.14和Cpd.17转染大鼠SOD1GS93A原代运动神经元,在48小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。针对Cpd.1IGF1分泌对IGF1分泌进行标准化。Cpd.4、14和17诱导的IGF1分泌高于Cpd.1(在野生型中高达4.3倍,在SOD1S93A中高达9.3倍)。数据表示每种Cpd.的2次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.1相比的显著性,揭示没有统计学差异。
图27显示了通过用Cpd.27、Cpd.28或Cpd.29的mRNA转染诱导人胚肾细胞(HEK293T,A)、人肝细胞(HepG2,B)和人肺癌细胞(A549,C)分泌EPO。分别用0.3-0.9μgCp.27、Cpd.28或Cpd.29转染细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的EPO。针对Cpd.27对EPO分泌进行标准化。在所分析的所有三种细胞类型中,Cpd.28和29诱导的EPO分泌高于Cpd.27(高达1.8倍)。数据表示每种Cpd.的3-8次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.27相比的显著性(*,p<0.05;***,<0.001)。
图28显示了通过用Cpd.30、Cpd.31或Cpd.32的mRNA转染诱导人胚肾细胞(HEK293T)分泌INS。分别用0.6μg Cp.30、Cpd.31或Cpd.32转染细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的INS。针对Cpd.30对INS分泌进行标准化。Cpd.31和32诱导的INS分泌高于Cpd.30(高达3.9倍)。数据表示每种Cpd.的3-5次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.30相比的显著性(*,p<0.05;***,<0.001)。
图29显示了通过用Cpd.33、Cpd.34或Cpd.35的mRNA转染诱导人胚肾细胞(HEK293T,A)、人肝细胞(HepG2,B)、人单核细胞(THP-1,C)和人肺癌细胞(A549,D)分泌IL4。分别用0.5-0.6μg Cp.33、Cpd.34或Cpd.35转染细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IL4。针对Cpd.33对IL4分泌进行标准化。在所分析的所有三种细胞类型中,Cpd.34和35诱导的IL4分泌高于Cpd.33(高达2.2倍)。数据表示每种Cpd.的3-8次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.33相比的显著性(*,p<0.05;***,<0.001)。
图30显示了通过用Cpd.36、Cpd.37或Cpd.38的mRNA转染诱导人胚肾细胞(HEK293T,A)、人肝细胞(HepG2,B)或人单核细胞(THP-1,C)分泌IL10。分别用0.3-0.6μgCp.36、Cpd.37或Cpd.38转染细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IL10。针对Cpd.36对IL10分泌进行标准化。在所分析的所有三种细胞类型中,Cpd.37和38诱导的IL10分泌高于Cpd.36(高达2.2倍)。数据表示每种Cpd.的4-8次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.与Cpd.36相比的显著性(**,p<0.01;***,<0.001)。
图31显示了通过用Cpd.39的mRNA转染诱导人肝细胞(HepG2,A)和人原代软骨细胞(B)分泌IGF-1。分别用0.3-0.6μg Cp.39转染细胞,并在24小时后使用特异性ELISA在细胞培养上清液中测量分泌的IGF1。针对Cpd.1IGF1分泌对IGF1分泌进行标准化。在所分析的所有两种细胞类型中,Cpd.39诱导的IGF1分泌高于Cpd.1(高达1.4倍)。数据代表4-7次重复的平均值±平均值的标准误差。通过学生t检验评估了各Cpd.1与Cpd.39相比的显著性(**,p<0.01;***,<0.001)。
具体实施方式
如本文所用,术语“RNA”包括编码氨基酸序列的RNA以及不编码氨基酸序列的RNA。通常,本文所用的RNA是编码RNA,即编码氨基酸序列的RNA。这样的RNA分子也称为mRNA(信使RNA),并且是单链RNA分子。因此,本文所用的术语“RNA”优选是指mRNA。RNA可以通过本领域普通技术人员已知的合成化学和酶学方法制备,或通过使用重组技术制备,或可以从天然来源分离,或通过其组合制备。RNA可以任选地包含非天然和天然存在的核苷修饰,例如,N1-甲基假尿苷,在本文中也称为甲基假尿苷。
如本文所用,术语“mRNA”(即信使RNA)是指由核苷磷酸盐构建块构成的聚合物,其中主要由腺苷、胞苷、尿苷和鸟苷作为核苷,并且其包含编码蛋白质的编码区。在本发明的上下文中,应将mRNA理解为意指任何多核糖核苷酸分子,如果其进入细胞,则适于表达蛋白质或其片段或可翻译为蛋白质或其片段。应当理解,包含编码蛋白质和信号肽的核酸序列的本发明的mRNA是指多核糖核酸分子,如果其进入细胞,则适于诱导所述蛋白质或其片段的表达和分泌。本发明的mRNA是人工核酸分子,即人工mRNA。人工核酸分子例如人工mRNA通常可以被理解为不是天然存在的核酸分子,如重组mRNA。重组mRNA是本发明优选的mRNA。mRNA包含编码蛋白质或其片段的核糖核苷酸序列,所述蛋白质或其片段在细胞中或在细胞附近的功能通常是必需的或有益的,特别是在骨骼肌损伤愈合的情况下。mRNA可以包含完整蛋白质或其功能变体的序列。因此,完整蛋白质的mRNA的核酸序列通常包含编码信号肽的核酸序列和编码蛋白质的核酸序列。本发明的mRNA包含编码蛋白质和信号肽的核酸序列。编码蛋白质的核酸序列可以任选地包含蛋白质的前结构域,其通常位于蛋白质的N-末端。蛋白质和信号肽通常由本发明的mRNA的核酸序列从5'至3’按以下的顺序编码:i)信号肽和ii)蛋白质,即信号肽编码区的最后一个核苷之后是蛋白质编码区的第一个核苷,或者在蛋白质包含前结构域的情况下,信号肽编码区的最后一个核苷之后是蛋白质的前蛋白质形式的编码区的第一个核苷。核糖核苷酸序列可以编码蛋白质或其功能片段,所述蛋白质作为因子、诱导物、调节物、刺激物或酶发挥作用,其中该蛋白质通常是其功能是为了治疗疾病(特别是骨骼肌损伤)所必需的蛋白质。在此,功能变体被理解为是指片段,其在细胞中可以承担细胞中所需功能的蛋白质的功能。另外,mRNA还可以具有其他功能区和/或3'或5'非编码区。3'和/或5'非编码区可以是蛋白质编码序列的天然侧翼区,或者是有助于RNA稳定的人工序列,例如5'端的帽和/或3’端的polyA尾。本领域技术人员可以通过常规实验确定在每种情况下适合于此的序列。可以对mRNA或用于转录mRNA的DNA进行密码子优化。优选地,可以对本发明中用于转录本发明的mRNA的DNA和本发明的mRNA进行密码子优化。通常,密码子优化是指使用在宿主细胞基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子(例如,多于1、2、3、4、5、10、15、20、25、50或更多个密码子),来修饰用于在目的宿主细胞中表达的核酸序列,同时又保持了天然氨基酸序列的过程。密码子使用表是容易获得的,例如,在“密码子使用数据库”中,并且这些表可以以多种方式进行修改。也可获得计算机算法,用于密码子优化在特定宿主细胞中用于表达的特定序列,如Gene(Aptagen,Pa),和优选地,(ThermoFischer,Ma)。
如本文所用,术语“裸RNA”是指不与任何种类的其他化合物(特别是蛋白质、肽、聚合物如阳离子聚合物、脂质、脂质体、病毒载体等)复合的RNA。因此,“裸RNA”是指以游离且未复合的形式存在于例如液体组合物中的RNA,其以分子形式分散在溶液中。例如,不考虑“裸RNA”与脂质和/或聚合物载体***(例如脂质纳米颗粒和胶束)/转染试剂,例如DreamFectTM Gold或(分支)PEI复合。因此,包含mRNA的组合物,例如本发明的治疗组合物,例如,不包含脂质和/或聚合物载体***转染试剂,例如DreamFectTM Gold或(分支)PEI。
术语“核酸序列”、“核苷酸序列(nucleotide sequence)”和“核苷酸序列(nucleotide acid sequence)”在本文中可互换使用,并且在本文中具有相同的含义,优选地是指DNA或RNA。术语“核酸序列”、“核苷酸序列”和“核苷酸序列”优选与术语“多核苷酸序列”同义使用。优选地,核酸序列是包含核苷酸单体或由核苷酸单体组成的聚合物,所述核苷酸单体通过糖/磷酸盐-骨架的磷酸二酯键彼此共价连接。术语“核酸序列”还涵盖修饰的核酸序列,例如碱基修饰、糖修饰或骨架修饰等的DNA或RNA。
如本文所用,术语“开放阅读框”是指几个核苷酸三联体的序列,其可以被翻译成肽或蛋白质。开放阅读框(ORF)优选在其5'端包含起始密码子(即通常用于编码氨基酸甲硫氨酸的三个接续核苷酸的组合(ATG))和后续区(其长度通常为3核苷酸的倍数)。ORF优选地由终止密码子(例如,TAA、TAG、TGA)终止。通常,这是开放阅读框的唯一终止密码子。因此,在本发明的上下文中,开放阅读框优选是核酸序列,其由可以被三除的多个核苷酸组成,这些核苷酸以起始密码子(例如ATG)开始,并且优选以终止密码子(例如,TAA、TGA或TAG)终止。开放阅读框可以是分离的,或者可以并入更长的核酸序列中,例如并入载体或mRNA中。开放阅读框也可以称为“(蛋白质)编码区”,或优选地,称为“编码序列”。
术语“信号肽”在本文中也称为发信号肽、预先结构域、信号序列、靶向信号、定位信号、定位序列、转运肽、前导序列或前导肽,其是短肽(通常长16-40个氨基酸),存在于新合成的将进入分泌途径的蛋白质的N-末端。本发明的信号肽优选为10-50,更优选11-45,甚至更优选12-45,最优选13-45,特别是14-45,更特别是15-45,甚至更特别是16-40个氨基酸长。根据本发明的信号肽位于目的蛋白质的N-末端或目的蛋白质的前蛋白质形式的N-末端。使用根据本发明的信号肽,目的蛋白质的分泌量至少等于使用其天然(同源)信号肽分泌的所述蛋白质的量,优选地,高于使用其天然(同源)信号肽分泌的所述蛋白质的量。根据本发明的信号肽通常是真核生物来源的,例如是真核生物蛋白质的信号肽,优选地是哺乳动物来源的,例如是哺乳动物蛋白质的信号肽,更优选地是人来源的,例如是哺乳动物蛋白质的信号肽。在一些实施方案中,异源信号肽和/或待修饰的同源信号肽是真核生物蛋白质的天然存在的信号肽,优选是哺乳动物蛋白质的天然存在的信号肽,更优选是人蛋白质的天然存在的信号肽。
如本文所用,术语“蛋白质”是指通常包含一个或多个肽或多肽的分子。肽或多肽通常是通过肽键连接的氨基酸残基链。肽通常包含2至50个氨基酸残基。多肽通常包含超过50个氨基酸残基。蛋白质通常折叠成3-维形式,这可能是蛋白质发挥其生物学功能所必需的。如本文所用,术语“蛋白质”包括蛋白质的片段和融合蛋白质。优选地,蛋白质是哺乳动物的,更优选地是人来源的,即是人蛋白质。优选地,蛋白质是通常从细胞分泌的蛋白质,即天然从细胞分泌的蛋白质。本文所指的蛋白质通常选自羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶;免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白。
羧肽酶是蛋白质,其是水解(切割)蛋白质羧基末端(C-末端)的肽键的蛋白酶;细胞因子是分泌蛋白,其通过细胞表面受体作为靶细胞信号传导的调节物在局部或全身发挥作用,细胞因子通常参与免疫反应;细胞外配体和转运蛋白是分泌蛋白,其通过与其他蛋白质结合或携带其他蛋白质或其他分子发挥作用,以执行某种生物学功能;细胞外基质蛋白是为周围细胞提供结构和生化支持的支持细胞分泌的一组蛋白质;葡糖苷酶是参与将复杂的碳水化合物(如淀粉和糖原)分解成单体的酶;糖基转移酶是建立天然糖苷键的酶;生长因子是能够刺激细胞生长、增殖、愈合和细胞分化的分泌蛋白,其通过细胞表面受体作为靶细胞信号传导的调节物局部或全身发挥作用,生长因子通常参与营养反应和存活或细胞稳态信号传导;生长因子结合蛋白是与生长因子结合从而调节其生物活性的分泌蛋白;肝素结合蛋白是与肝素相互作用以调节其生物学功能的分泌蛋白,其通常与另一物质共同与生长因子或激素结合;激素是由多细胞生物体中的腺体产生的一类信号传导分子的成员,其被分泌并由循环***运输到远处靶器官,通过与其靶细胞上的特定受体结合来调节生理和行为;水解酶是一类通过利用水破坏化学键来生化催化分子裂解的酶,从而导致较大分子***为较小分子;免疫球蛋白是主要由浆细胞产生的大的Y形分泌蛋白,其被免疫***用来中和病原体,如致病细菌和病毒;异构酶是一大类将分子从一种异构体转化为另一种异构体的酶,从而促进分子内重排,其中键断裂和形成;激酶是催化将磷酸基团从高能、提供磷酸的分子转移到特定底物的酶;裂解酶是通过水解和氧化以外的方式催化各种化学键断裂的酶,通常形成新的双键或新的环结构;基质金属蛋白酶(MMP)的金属酶抑制剂细胞抑制剂;金属蛋白酶是催化机制涉及金属离子的蛋白酶;乳蛋白是分泌到乳液中的蛋白质;神经活性蛋白是分泌蛋白,其在局部或通过远距离发挥作用以支持神经元功能、存活和生理;蛋白酶(也称为肽酶或蛋白酶)是通过水解肽键进行蛋白水解的酶;蛋白酶抑制剂是抑制蛋白酶功能的蛋白质;蛋白质磷酸酶是从其底物蛋白质的磷酸化氨基酸残基中去除磷酸基团的酶;酯酶是在含水的化学反应中,在氨基酸残基处将酯分解为酸和醇的酶;转移酶是一类催化特定官能团(例如甲基或糖基)从一个分子(称为供体)转移到另一个分子(称为受体)的酶;血管活性蛋白是在生物学上影响血管功能的分泌蛋白。本文提及的羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶;免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白可见于UniProt数据库。
在本文中具有相同含义的术语“片段”或“序列片段”是,例如,核酸分子如DNA或RNA或蛋白质的全长序列的较短部分。因此,片段通常包含与全长序列内的相应延伸序列相同的序列或由其组成。在本发明的上下文中,优选的序列片段包含实体的连续延伸序列,或由其组成,例如对应于该片段所源自的分子中的实体的连续延伸序列的核苷酸或氨基酸,其代表该片段所源自的整个(即全长)分子的至少5%,通常至少20%,优选至少30%,更优选至少40%,更优选至少50%,甚至更优选至少60%,甚至更优选至少70%,最优选至少80%。
如本文所用,术语“与所述蛋白质异源的信号肽”是指与该蛋白质天然存在的信号肽不同的天然存在的信号肽,即该信号肽不是源自该蛋白质的相同基因。通常,与给定蛋白质异源的信号肽是来自另一蛋白质的信号肽,其与该给定蛋白质无关,即该信号肽的氨基酸序列不同于给定蛋白质的信号肽,例如其氨基酸序列与给定蛋白质的信号肽的差异大于50%,优选大于60%,更优选大于70%,甚至更优选大于80%,最优选大于90%,特别是大于95%。优选地,与给定蛋白质异源的信号肽与给定蛋白质的天然存在(同源)的信号肽的氨基酸序列具有小于95%,优选小于90%,更优选小于80%,甚至更优选小于70%,最优选小于60%,特别是小于50%的序列同一性。尽管异源序列可以源自相同的生物体,但是它们天然地(本质上)不存在于相同的核酸分子中,例如不存在于相同的mRNA中。与蛋白质异源的信号肽和与该信号肽异源的蛋白质可以具有相同或不同的来源,并且通常具有相同的来源,优选地是真核生物来源的,更优选地是相同真核生物体的真核生物来源的,甚至更优选地是哺乳动物来源的,特别是相同哺乳动物生物体的哺乳动物来源的,更特别是人来源的。在实施例1中,公开了一种mRNA,其包含编码人BDNF信号肽和人IGF1的核酸序列,即信号肽与蛋白质是异源的,其中信号肽和蛋白质是相同来源的,即人来源。
如本文所用,术语“与所述蛋白质同源的信号肽”是指蛋白质的天然存在的信号肽。与蛋白质同源的信号肽是由蛋白质的基因编码的信号肽,如其天然存在的。与蛋白质同源的信号肽通常是真核生物来源的,例如,真核生物蛋白质的天然存在的信号肽,优选地是哺乳动物来源的,例如哺乳动物蛋白质的天然存在的信号肽,更优选地是人来源的,例如人蛋白质天然存在的信号肽。
如本文所用,术语“本质上不具有信号肽功能的天然存在的氨基酸序列”是指天然地存在的氨基酸序列,其与天然存在的任何信号肽的氨基酸序列都不同。如本发明所述,本质上不具有信号肽功能的天然存在的氨基酸序列优选为10-50,更优选11-45,甚至更优选12-45,最优选13-45,特别是14-45,更特别是15-45,甚至更特别是16-40个氨基酸长。优选地,本发明的本质上不具有信号肽功能的天然存在的氨基酸序列是真核生物来源的,并且与真核生物来源的任何信号肽都不相同,更优选地是哺乳动物来源的,并且与哺乳动物来源的任何信号肽都不相同,更优选是人来源的,并且与自然界中存在的任何人来源的信号肽都不相同。本质上不具有信号肽功能的天然存在的氨基酸序列通常是蛋白质编码序列的氨基酸序列。根据本发明,本质上不具有信号肽功能的天然存在的氨基酸序列通常是真核生物来源的,优选是哺乳动物来源的,更优选是人来源的。
如本文所用,术语“天然存在的”、“天然的”和“本质上”具有等同的含义。
如本文所用,术语“信号肽的氨基酸序列的N-末端的氨基酸1-9”是指信号肽的氨基酸序列的N-末端的前9个氨基酸。类似地,本文所用的术语“信号肽的氨基酸序列的N-末端的氨基酸1-7”是指信号肽的氨基酸序列的N-末端的前七个氨基酸,术语“信号肽的氨基酸序列的N-末端的氨基酸1-5”是指信号肽的氨基酸序列的N-末端的前五个氨基酸。
如本文所用,术语“通过至少一个氨基酸的***、缺失和/或取代修饰的氨基酸序列”是指在氨基酸序列内包括至少一个氨基酸的氨基酸取代、***和/或缺失的氨基酸序列。如本文所用,术语“通过至少一个氨基酸的***、缺失和/或取代来修饰与所述蛋白质异源的信号肽”是指与蛋白质异源的天然存在的信号肽的氨基酸序列,在其天然存在的氨基酸序列中包含至少一个氨基酸的氨基酸取代、***和/或缺失。如本文所用,术语“通过***、缺失和/或取代至少一个氨基酸修饰与所述蛋白质同源的信号肽”是指与蛋白质同源的天然存在的信号肽,在其天然存在的氨基酸序列中包含至少一个氨基酸的氨基酸取代、***和/或缺失。如本文所用,术语“通过至少一个氨基酸的***、缺失和/或取代修饰天然存在的氨基酸序列”是指天然存在的氨基酸序列,在其天然存在的氨基酸序列内包括至少一个氨基酸的氨基酸取代、***和/或缺失。本文中的“氨基酸取代”或“取代”是指用另一种氨基酸替换亲本蛋白质序列中特定位置上的氨基酸。例如,取代R34K是指多肽,其中位置34上的精氨酸被赖氨酸取代。对于前面的示例,34K表示位置34被赖氨酸取代。出于本文的目的,多个替换通常以斜杠分隔。例如,R34K/L78V是指包含取代R34K和L38V的双变体。本文所用的“氨基酸***”或“***”是指在亲本蛋白质序列的特定位置上添加氨基酸。例如,***-34表示在位置34上的***。本文所用的“氨基酸缺失”或“缺失”是指在亲本蛋白质序列中的特定位置上去除氨基酸。例如,R34-表示在位置34上缺失精氨酸。
优选地,缺失的氨基酸是疏水性分数低于-0.8,优选低于1.9的氨基酸。优选地,替代氨基酸是疏水性分数高于被取代氨基酸的疏水性分数的氨基酸,更优选地,替代氨基酸是疏水性分数为2.8以及2.8以上的氨基酸,更优选地是疏水性分数3.8以及3.8以上的氨基酸。优选地,***的氨基酸是疏水性分数为2.8以及2.8以上的氨基酸,更优选地是疏水性分数为3.8以及3.8以上的氨基酸。
通常***、缺失和/或取代给定氨基酸序列的1至15个、优选1至11个氨基酸、更优选1至10个氨基酸、甚至更优选1至9个氨基酸、特别是1至8个氨基酸、更特别是1至7个氨基酸、甚至更特别是1至6个氨基酸、特别优选地1至5个氨基酸、更特别优选地1至4个氨基酸、甚至更特别优选地1至2个氨基酸。通常在信号肽氨基酸序列的N-末端的氨基酸1-11内、优选在氨基酸1-10内、更优选在氨基酸1-9内、甚至更优选在氨基酸1-8内、特别是在氨基酸1-7内、更特别是在氨基酸1-6内、甚至更特别是在氨基酸1-5内、特别优选在氨基酸1-4内、更特别优选在氨基酸1-3内、甚至更特别优选在氨基酸内氨基1-2内,***、缺失和/或取代给定氨基酸序列的1至15个、优选1至11个氨基酸、更优选1至10个氨基酸、甚至更优选1至9个氨基酸、特别是1至8个氨基酸、更特别是1至7个氨基酸、甚至更特别是1至6个氨基酸、特别优选地1至5个氨基酸、更特别优选地1至4个氨基酸、甚至更特别优选地1至2个氨基酸。
优选地,氨基酸序列任选地通过至少一个氨基酸的缺失和/或取代来修饰。
优选地,与未修饰的信号肽相比,修饰的信号肽的氨基酸序列N-末端的前9个氨基酸的平均疏水性分数增加1.0单位或更高。
如本文所用,术语“***1”、“***1(IGF1)”或“IGF1”通常是指不含信号肽的IGF1蛋白质的天然序列,并且可以包含前肽和/或E-肽,优选是指不含信号肽且不含E-肽的IGF1蛋白质的天然序列。如本文所用,术语“人***1(IGF1)”是指人IGF1的天然序列(pro-IGF1,其指Uniprot数据库中的UniProtKB-P05019,和Genbank数据库中的NM_000618.4、NM_001111285.2和NM_001111283.2、或其片段。编码人***1的天然DNA序列可以被密码子优化。人IGF1的天然序列包含具有21个氨基酸的人信号肽(核苷酸1-63)、具有27个氨基酸的人前肽(也称为前结构域)(核苷酸64-144)、具有70个氨基酸的成熟人IGF1(核苷酸145-354)、和所谓的E-肽(或E-结构域)的人IGF1的C-末端结构域,或由其组成。人IGF1的C-末端结构域(所谓的E-肽或E-结构域)包含由选择性的剪接事件产生的Ea-、Eb-或Ec-结构域。Ea-结构域包含35个氨基酸(105个核苷酸)或由其组成,Eb-结构域包含77个氨基酸(231个核苷酸)或由其组成,Ec-结构域包含40个氨基酸(120个核苷酸)或由其组成(参见,例如Wallis M(2009)New insulin-likegrowth factor(IGF)-precursor sequences from mammalian genomes:the molecularevolution of IGFs and associated peptides in primates.Growth Horm IGF Res 19(1):12-23.Doi:10.1016/j.ghir.2008.05.001)。如本文所用,术语“人***1(IGF)”通常是指不含信号肽的人IGF1蛋白质的天然序列,并且可以包含前肽和/或E-肽,优选是指不含信号肽且不含E-肽的人IGF1蛋白质的天然序列。如本文所用,术语“人***1(IGF)”通常包括成熟的人IGF1。术语“成熟蛋白质”是指在表达和分泌蛋白质的细胞中、在内质网中合成并通过高尔基体分泌的蛋白质。术语“成熟IGF1”是指在表达和分泌IGF1的细胞中、在内质网中合成并通过高尔基体分泌的蛋白质。术语“成熟的人IGFI”是指在表达和分泌人IGF1的人细胞中、在内质网中合成并通过高尔基体分泌的蛋白质,其通常包含由SEQ ID NO:39所示的核苷酸序列编码的氨基酸。
如本文所用,术语“胰岛素”或“INS”通常是指没有信号肽的胰岛素的天然序列。如本文所用,术语“人胰岛素”或“人INS”是指人胰岛素的天然序列,其指Uniprot数据库中的UniProtKB-P01308,和Genbank数据库中的NM_000207.2、NM_001185097.1、NM_001185098.1和NM_001291897.1、或其片段。编码人胰岛素的天然DNA序列可以被密码子优化。人胰岛素的天然序列包含具有24个氨基酸的人信号肽(核苷酸1-72)、具有30个氨基酸的人胰岛素B链(核苷酸73-163)、具有31个氨基酸的人胰岛素前肽(也称为连接肽;C-肽)(核苷酸64-144)、和包含或由21个氨基酸组成的人胰岛素A链的C-末端结构域(核苷酸64-144),或由其组成。如本文所用,术语“人胰岛素”通常包括没有信号肽的人胰岛素。
如本文所用,术语“***”、“EPO”或“Epo”通常是指没有信号肽的EPO的天然序列。本文使用的术语“人***”、“人EPO”或“人Epo”是指人***的天然序列,其指Uniprot数据库中的UniProtKB-P01588,和Genbank数据库中的NM_000799.2,或其片段。编码人***的天然DNA序列可以被密码子优化。人***的天然序列包含具有27个氨基酸的人信号肽(核苷酸1-81)、具有166个氨基酸的人Epo编码链(核苷酸82-579),或由其组成。如本文所用,术语“人***”通常包括没有信号肽的人EPO。
如本文所用,术语“白细胞介素-4”或“IL4”通常是指没有信号肽的IL4的天然序列。如本文所用,术语“人白细胞介素-4”或“人IL4”是指人IL4的天然序列,其指Uniprot数据库中的UniProtKB-P05112,和Genbank数据库中的NM_000589.3和NM_172348.2,或其片段。编码人IL4的天然DNA序列可以被密码子优化。人IL4的天然序列包含具有24个氨基酸的人信号肽(核苷酸1-72)、具有129个氨基酸的人IL4编码链(核苷酸73-387),或由其组成。如本文所用,术语“人IL4”通常包括没有信号肽的人IL4。
如本文中通常使用的,术语“白细胞介素-10”或“IL10”是指没有信号肽的IL10的天然序列。如本文所用的术语“人白细胞介素-10”或“人IL10”是指人IL10的天然序列,其指Uniprot数据库中的UniProtKB–P22301,和Genbank数据库中的NM_000572.2,或其片段。编码人IL10的天然DNA序列可以被密码子优化。人IL10的天然序列包含具有18个氨基酸的人信号肽(核苷酸1-54)、具有160个氨基酸的人IL10编码链(核苷酸55-534),或由其组成。如本文所用,术语“人IL10”通常包括没有信号肽的人IL10。
如本文所用,术语“胰岛素生长因子1(IGF1)的信号肽”或“IGF1的信号肽”是指IGF1的天然信号肽,其指Uniprot数据库中的P05019,和Genbank数据库中的NM_000618.4、NM_001111284.1和NM_001111285.2,优选具有SEQ ID NO:24所示的氨基酸序列,和/或优选由SEQ ID NO:25所示的DNA序列编码。
如本文所用,术语“胰岛素生长因子2(IGF2)的信号肽”或“IGF2的信号肽”是指IGF2的天然信号肽,其指Uniprot数据库中的P01344,和Genbank数据库中的NM_000612.5、NM_001007139.5、NM_001127598.2、NM_001291861.2和NM_001291862.2,优选具有SEQ IDNO:26所示的氨基酸序列,和/或优选由SEQ ID NO:27所示的DNA序列编码。
如本文所用,术语“血清白蛋白(ALB)的信号肽”或“ALB的信号肽”是指ALB的天然信号肽,其指Uniprot数据库中的P02768,和Genbank数据库中的NM_000477.6,优选具有如SEQ ID NO:28所示的氨基酸序列,和/或优选由SEQ ID NO:29所示的DNA序列编码。
如本文所用,术语“脑源性神经营养因子(BDNF)”或“BDNF的信号肽”是指BDNF的天然信号肽,其指Uniprot数据库中的P23560,和Genbank数据库中的NM_001143805.1、NM_170731.4、NM_170734.3、NM_001143810.1和NM_001143809.1,优选具有SEQ ID NO:30所示的氨基酸序列,和/或优选由SEQ ID NO:31所示的DNA序列编码。
如本文所用,术语“基质细胞衍生因子-1(CXCL12)的信号肽”或“CXCL12的信号肽”是指CXCL12的天然信号肽,其指Uniprot数据库中的P48061,和Genbank数据库中的NM_000609.6、NM_001033886.2、NM_001178134.1、NM_001277990.1和NM_199168.3,优选具有SEQ ID NO:32所示的氨基酸序列,和/或优选由SEQ ID NO:33所示的DNA序列编码。
如本文所用,术语“合成的信号肽1的信号肽(合成seq1)”或“合成的seq1的信号肽”是指合成的信号肽1,其具有如SEQ ID NO:34所示的氨基酸序列,和/或由SEQ ID NO:35所示的DNA序列编码。
如本文所用,术语“合成的信号肽2的信号肽(合成seq2)”或“合成的seq1的信号肽”是指合成的信号肽1,其具有如SEQ ID NO:36所示的氨基酸序列,和/或由SEQ ID NO:37所示的DNA序列编码。
如本文所用,术语“潜在转化生长因子β结合蛋白2(LTBP2)的信号肽”或“LTBP2的信号肽”是指LTBP2的天然信号肽,其指Uniprot数据库中的Q14767和Genbank数据库中的NM_000428.2,并且优选具有如SEQ ID NO:41所示的氨基酸序列,和/或优选由SEQ ID NO:42所示的DNA序列编码。
如本文所用,术语“***结合蛋白复合物酸不稳定亚基(IGFALS)的信号肽”或“IGFALS的信号肽”是指IGFALS的天然信号肽,其指Uniprot数据库中的P35858,和Genbank数据库中的NM_001146006.1和NM_004970.2,优选具有SEQ ID NO:46所示的氨基酸序列,和/或优选由SEQ ID NO:47所示的DNA序列编码。
如本文所用,术语“胰岛素(INS)的信号肽”或“INS的信号肽”是指INS的天然信号肽,其指Uniprot数据库中的P1308,和Genbank数据库中的NM_001185097.1、NM_000207.2、NM_001185098.1和NM_001291897.1,优选具有SEQ ID NO:51所示的氨基酸序列,和/或优选由SEQ ID NO:52所示的DNA序列编码。
如本文所用,术语“***(Epo)的信号肽”或“Epo的信号肽”是指Epo的天然信号肽,其指Uniprot数据库中的P01588,和Genbank数据库中的NM_000799.2,优选具有如SEQ ID NO:56所示的氨基酸序列,和/或优选由SEQ ID NO:57所示的DNA序列编码。
如本文所用,术语“粒细胞集落刺激因子(CSF3)的信号肽”或“CSF3的信号肽”是指CSF3的天然信号肽,其指Uniprot数据库中的P09919,和Genbank数据库中的NM_000759.3、NM_001178147.1、NM_172219.2和NM_172220.2,优选具有如SEQ ID NO:61所示的氨基酸序列,和/或优选由SEQ ID NO:62所示的DNA序列编码。
如本文所用,术语“β-神经生长因子(NGF)的信号肽”或“NGF的信号肽”是指NGF的天然信号肽,其指Uniprot数据库中的P01138,和Genbank数据库中的NM_002506.2和XM_006710663.3,优选具有如SEQ ID NO:66所示的氨基酸序列,和/或优选由SEQ ID NO:67所示的DNA序列编码。
如本文所用,术语“白细胞介素4(IL4)的信号肽”或“IL4的信号肽”是指IL4的天然信号肽,其指Uniprot数据库中的P05112,和Genbank数据库中的NM_000589.3和NM_172348.2,优选具有如SEQ ID NO:77所示的氨基酸序列,和/或优选由SEQ ID NO:78所示的DNA序列编码。
如本文所用,术语“白细胞介素10(IL10)的信号肽”或“IL10的信号肽”是指IL10的天然信号肽,其指Uniprot数据库中的P22301,和Genbank数据库中的NM_000572.2,优选具有如SEQ ID No:82所示的氨基酸序列,和/或优选由SEQ ID NO:83所示的DNA序列编码。
如本文所用,术语“成纤维细胞生长因子5(FGF5)的信号肽”或“FGF5的信号肽”是指FGF5的天然信号肽,其指Uniprot数据库中的P12034,和Genbank数据库中的NM_004464.3和NM_033143.2,优选具有SEQ ID NO:87所示的氨基酸序列,和/或优选由SEQ ID NO:88或SEQ ID NO:183所示的DNA序列编码。
如本文所用,术语“补体因子H相关蛋白2(FHR2)的信号肽”或“FHR2的信号肽”是指FHR2的天然信号肽,其指Uniprot数据库中的P36980,和Genbank数据库中的NM_001312672.1和NM_005666.3,优选具有SEQ ID NO:92所示的氨基酸序列,和/或优选由SEQID NO:93所示的DNA序列编码。
如本文所用,术语“***结合蛋白5(IBP5)的信号肽”或“IBP5的信号肽”是指IBP5的天然信号肽,其指Uniprot数据库中的P24593,和Genbank数据库中的NM_001312672.1和NM_000599.3,优选具有如SEQ ID NO:97所示的氨基酸序列,和/或优选由SEQ ID NO:98所示的DNA序列编码。
如本文所用,术语“神经营养因子3(NTF3)的信号肽”或“NTF3的信号肽”是指NTF3的天然信号肽,其指Uniprot数据库中的P20783,和Genbank数据库中的NM_002527.4、XM_011520963.2和NM_001102654.1,优选具有如SEQ ID NO:102所示的氨基酸序列,和/或优选由SEQ ID NO:103所示的DNA序列编码。
如本文所用,术语“***和睾丸表达的蛋白2(PATE2)的信号肽”或“PATE2的信号肽”是指PATE2的天然信号肽,其指Uniprot数据库中的Q6UY27,和Genbank数据库中的NM_212555.2,优选具有SEQ ID NO:107所示的氨基酸序列,和/或优选由SEQ ID NO:108所示的DNA序列编码。
如本文所用,术语“细胞外超氧化物歧化酶(SOD3)的信号肽”或“SOD3的信号肽”是指SOD3的天然信号肽,其指Uniprot数据库中的P08294,和Genbank数据库中的NM_003102.2,优选具有如SEQ ID No:112所示的氨基酸序列,和/或优选由SEQ ID NO:113所示的DNA序列编码。
如本文所用,术语“胰高血糖素受体(GL-R)的编码序列”或“GL-R的编码序列”是指GL-R的编码链,其是本质上不具有信号肽功能的天然存在的氨基酸序列,是指Uniprot数据库中的P47871,和Genbank数据库中的NM_000160.4和XM_006722277.1,优选具有SEQ IDNO:117所示的氨基酸序列,和/或优选由SEQ ID NO:118所示的DNA序列编码。
如本文所用,术语“修饰的胰岛素生长因子1(IGF1)的信号肽”、“修饰的IGF1的信号肽”或“IGF1修饰的信号肽”是指修饰的IGF1的信号肽,其中Uniprot数据库中的P05019、和Genbank数据库中的NM_000618.4、NM_001111284.1和NM_001111285.2的IGF1的天然信号肽通过G2L/S5L/T9L/Q10L取代以及K3-和C15-缺失而被修饰,并且优选具有SEQ ID NO:122所示的氨基酸序列,和/或优选由SEQ ID NO:123所示的DNA序列编码。
如本文所用,术语“修饰的胰岛素生长因子2(IGF2)的信号肽”、“修饰的IGF2的信号肽”或“IGF2-修饰的信号肽”是指修饰的IGF2的信号肽,其中Uniprot数据库中的P01344、Genbank数据库中的NM_000612.5、NM_001007139.5、NM_001127598.2、NM_001291861.2和NM_001291862.2的IGF2的天然信号肽通过G2L/G6L/K7L/S8L取代以及P4-、M5-、I23-和A24-缺失而被修饰,并且优选具有SEQ ID NO:127所示的氨基酸序列,和/或由SEQ ID NO:128所示的DNA序列编码。
如本文所用,术语“修饰的基质细胞衍生因子-1(CXCL12)的信号肽”、“修饰的CXCL12的信号肽”或“CXCL12修饰的信号肽”是指修饰的CXCL12的信号肽,其中Uniprot数据库的P48061和Genbank数据库中的NM_000609.6、NM_001033886.2、NM_001178134.1、NM_001277990.1和NM_199168.3的CXCL12的天然信号肽通过N3-和K5-缺失而被修饰,并且优选具有如SEQ ID NO:132所示的氨基酸序列,和/或优选由SEQ ID NO:133所示的DNA序列编码。
如本文所用,术语“修饰的白细胞介素4(IL4)的信号肽”、“修饰的IL4的信号肽”或“IL4修饰的信号肽”是指修饰的IL4的信号肽,其中Uniprot数据库的P05112和Genbank数据库中的NM_000589.3和NM_172348.2的IL4的天然信号肽通过G2-、T4-、S5-和Q6-缺失而被修饰,并且优选具有如SEQ ID NO:166所示的氨基酸序列,和/或优选由SEQ ID NO:167所示的DNA序列编码。
如本文所用,术语“修饰的白细胞介素10(IL10)的信号肽”、“修饰的IL10的信号肽”或“IL10修饰的信号肽”是指修饰的IL10的信号肽,其中Uniprot数据库的P22301和Genbank数据库中的NM_000572.2的IL10的天然信号肽通过H2V/S3L/S4L和S8L取代而被修饰,并且优选具有如SEQ ID NO:174所示的氨基酸序列,和/或优选由SEQ ID NO:175所示的DNA序列编码。
如本文所用,术语“修饰的胰岛素(INS)的信号肽”、“修饰的INS的信号肽”或“INS修饰的信号肽”是指修饰的INS的信号肽,其中Uniprot数据库的P1308和Genbank数据库中的NM_001185097.1、NM_000207.2、NM_001185098.1和NM_001291897.1的INS的天然信号肽通过M5-和R6-缺失而被修饰,并且优选具有如SEQ ID NO:147所示的氨基酸序列,和/或优选由SEQ ID NO:148或SEQ ID NO:182所示的DNA序列编码。
如本文所用,术语“修饰的脑源性神经营养因子(BDNF)的信号肽”、“修饰的BDNF的信号肽”或“BDNF修饰的信号肽”是指修饰的BDNF的信号肽,其中Uniprot数据库的P23560和Genbank数据库中的NM_001143805.1、NM_170731.4、NM_170734.3、NM_001143810.1和NM_001143809.1的BDNF的天然信号肽通过T2L/T7L和S11L取代而被修饰,并且优选具有如SEQID NO:137所示的氨基酸序列,和/或优选由SEQ ID NO:138所示的DNA序列编码。
如本文所用,术语“修饰的***(Epo)的信号肽”、“修饰的Epo的信号肽”或“Epo修饰的信号肽”是指修饰的Epo的信号肽,其中Uniprot数据库的P01588和Genbank数据库中的NM_000799.2的Epo的天然信号肽通过G2L/P7L/W9L取代和H4-、E5-和W11-缺失而被修饰,并且优选具有如SEQ ID NO:152所示的氨基酸序列,和/或优选由SEQID NO:153所示的DNA序列编码。
如本文所用,术语“修饰的胰岛素生长因子1(IGF1)前结构域”、“修饰的IGF1前结构域”或“修饰的IGF1-Pro”是指IGF1的前肽,其是本质上不具有信号肽功能的天然存在的氨基酸序列(Uniprot数据库中的P05019和Genbank数据库中的NM_000618.4、NM_001111284.1和NM_001111285.2),通过缺失前肽N-末端中侧翼22-31的十个氨基酸残基(VKMHTMSSSH)而被修饰,并且优选具有如SEQ ID NO:142所示的氨基酸序列,和/或优选由SEQ ID NO:143所示的DNA序列编码。
如本文所用,术语“修饰的肠型碱性磷酸酶(ALPI)前结构域”、“修饰的ALPI前结构域”、“修饰的ALPI”或“修饰的ALPI-Pro”是指ALPI的前肽,其是天然存在的本质上不具有信号肽功能的氨基酸序列(Uniprot数据库中的P09923,和Genbank数据库中的NM_001631.4),通过A504L/A505L/S511L/G517L/T518L取代和H506-、P507-、A509-、A510-和P513-缺失而被修饰,并且优选具有如SEQ ID NO:189所示的氨基酸序列,和/或优选由SEQ ID NO:190所示的DNA序列编码。
如本文所用,术语“mRNA包含编码IGF1的前肽的核酸序列,以及编码成熟IGF1的核酸序列,并且不包含编码IGF1的E-肽的核酸序列”,通常指这样的mRNA,其包含编码具有27个氨基酸的人IGF1的前肽(也称为前结构域)的核苷酸序列,以及编码具有70个氨基酸的成熟人IGF1的核苷酸序列,而不包含编码人IGF1的E-肽(也称为“E结构域”)的核苷酸序列,即不包含编码Ea-、Eb-或Ec-结构域的核苷酸序列。可以对编码具有27个氨基酸的人IGF1的前肽(也称为前结构域)的核苷酸序列和编码具有70个氨基酸的成熟人IGF1的核苷酸序列进行密码子优化。
如本文所用,术语“载体”或“表达载体”是指天然存在的或合成产生的用于细胞中摄取、增殖、表达或传递核酸构建体,例如质粒、小环、噬菌粒、粘粒、人工染色体/小染色体、噬菌体、病毒(例如杆状病毒、逆转录病毒、腺病毒、腺相关病毒、单纯疱疹病毒、噬菌体)。载体可以整合到宿主细胞的基因组中,也可以作为自主复制的构建体保留在宿主细胞中。用于构建载体的方法是本领域技术人员众所周知的,并在各种出版物中有所描述。尤其是,用于构建合适载体的技术是本领域技术人员已知的,包括对功能性和调节性成分的描述,例如启动子、增强子、终止和聚腺苷酸化信号、选择标记物、复制起点和剪接信号。真核表达载体通常还将包含原核序列,其促进载体在细菌中的繁殖,例如复制起点和在细菌中用于选择的抗生素抗性基因,其可以在转染真核细胞之前被去除。包含可将多核苷酸可操作地连接到其中的克隆位点的多种真核表达载体在本领域中是众所周知的,并且某些可从公司购得,例如Agilent Technologies,Santa Clara,Calif.;Invitrogen,Carlsbad,Calif.;Promega,Madison,Wis.或Invivogen,San Diego,Calif.。
如本文所用,术语“基因治疗载体”是指用于将核酸序列例如编码基因的核酸序列递送至细胞中的任何载体。基因治疗载体和基因递送方法是本领域众所周知的。这些方法的非限制性示例包括病毒载体递送***,其包括DNA和RNA病毒,其在递送至细胞后具有游离型基因组或整合的基因组;非病毒载体递送***,其包括DNA质粒、裸核酸和与递送载体复合的核酸、转座子***(用于递送和整合到宿主基因组中;Moriarity,等人(2013)Nucleic Acids Res 41(8),e92,Aronovich,等人,(2011)Hum.Mol.Genet.20(R1),R14-R20)、逆转录病毒介导的DNA转运(例如,莫洛尼鼠白血病病毒、脾脏坏死病毒、逆转录病毒(如劳斯肉瘤病毒、哈维肉瘤病毒)、禽类白血病病毒、长臂猿白血病病毒、人免疫缺陷病毒、腺病毒、骨髓增生性肉瘤病毒和乳腺肿瘤病毒;例如,参见Kay等人(1993)Science262,117-119,Anderson(1992)Science 256,808-813)、以及DNA病毒介导的DNA转运,包括腺病毒、疱疹病毒、细小病毒和腺相关病毒(例如,Ali等人(1994)Gene Therapy 1,367-384)。病毒载体还包括但不限于腺相关病毒、腺病毒、慢病毒、逆转录病毒和单纯疱疹病毒载体。能够整合到宿主基因组中的载体包括但不限于逆转录病毒或慢病毒。
如本文所用,术语“转录单元”、“表达单位”或“表达盒”是指载体、构建体或多核苷酸序列内的区域,其包含一个或多个待转录的基因,其中包含在区段内的基因可操作地彼此连接。它们从单个启动子转录,并且通过至少一个聚腺苷酸化信号终止转录。结果,不同的基因至少通过转录连接。可以从每个转录单元(多顺反子转录单元)转录和表达一种以上的蛋白质或产物。每个转录单元将包含调控元件,其对该单元内所包含的任何选定序列的转录和翻译是必需的,并且每个转录单元可包含相同或不同的调控元件。例如,每个转录单元可以包含相同的终止子。IRES元件或内含子可用于功能性连接转录单元内的基因。载体或多核苷酸序列可包含一个以上的转录单元。
如本文所用,术语“骨骼肌损伤”是指由离心肌肉收缩、伸长和肌肉超负荷引起的骨骼肌的任何损伤和断裂,优选骨骼肌的断裂。原则上,任何骨骼肌都可能受到此类损伤或断裂的影响。优选地,骨骼肌损伤是骨骼肌的损伤和断裂,其中骨骼肌选自头、颈、胸、背、腹、骨盆、手臂,腿和臀部的肌肉群。
更优选地,骨骼肌损伤是这样的损伤和断裂,其中骨骼肌选自拓肌、颞肌、***状肌、胸大肌、胫后肌、胫前肌、腓肠肌、喙肱肌、膈肌、掌长肌、腹直肌、***外***、***内***、肩胛下肌、二头肌、三头肌、股四头肌、小腿肌、腹股沟、跟腱、三角肌、大圆肌、肌腱套冈上肌、肌腱套冈下肌、小圆肌肩袖、肌腱套肩胛下肌、股直肌、腹直肌、腹外斜肌、咬肌、斜方肌、阔肌、胸肌、竖脊肌、髂肋肌、最长肌、棘肌、背阔肌、横突棘肌、背半棘肌、颈半棘肌、头半棘肌、多裂肌、旋转肌、棘间肌、横突间肌、头夹肌、颈夹肌、肋间肌、肋下肌、胸横肌、肋提肌、下后锯肌、上后锯肌、腹横肌、腹直肌、锥状肌、提睾肌、腰方肌、外斜肌、腹内斜肌。
甚至更优选地,骨骼肌损伤是这样的损伤和断裂,其中骨骼肌选自拓肌、颞肌、***状肌、胸大肌、胫后肌、胫前肌、腓肠肌、喙肱肌、膈肌、掌长肌、腹直肌、***外***、***内***、肩胛下肌、二头肌、三头肌、股四头肌、小腿肌、腹股沟、跟腱、三角肌、大圆肌、肌腱套冈上肌、肌腱套冈下肌、小圆肌肩袖、肌腱套肩胛下肌、股直肌、腹直肌、腹外斜肌、咬肌、斜方肌、阔肌、胸肌。
优选地,通过本发明的方法治疗由离心肌肉收缩、伸长或肌肉超负荷引起的骨骼肌的任何损伤和断裂,优选骨骼肌的断裂。
在第一方面,本发明提供了包含编码蛋白质和信号肽的核酸序列的mRNA,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
一方面,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,条件是所述蛋白质不是氧化还原酶或与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其在本质上不具有信号肽功能,或天然存在的氨基酸序列,其在本质上不具有信号肽功能,并通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;和
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在另一个实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽是与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽是与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰。
在另一个实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽是天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
一方面,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,条件是所述蛋白质不是氧化还原酶或与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其在本质上不具有信号肽功能,或天然存在的氨基酸序列,其在本质上不具有信号肽功能,并通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;和
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽选自:
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽是与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽是与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰。
在另一个实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.5的平均疏水性分数,其中信号肽是天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
一方面,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,条件是所述蛋白质不是氧化还原酶或与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其在本质上不具有信号肽功能,或天然存在的氨基酸序列,其在本质上不具有信号肽功能,并通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸被修饰。
一方面,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;和
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽选自:
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽是与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶。
在进一步的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽是与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰。
在另一个实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,其中信号肽是天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在一个优选的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽包含长度为16至40个氨基酸的氨基酸序列、或由其组成,其中所述氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽选自:i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步优选的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中所述信号肽包含长度为16至40个氨基酸的氨基酸序列、或由其组成,其中所述氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;和
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步优选的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中所述信号肽包含长度为16至40个氨基酸的氨基酸序列、或由其组成,其中所述氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步优选的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中所述信号肽包含长度为16至40个氨基酸的氨基酸序列、或由其组成,其中所述氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中信号肽选自:
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步优选的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽包含长度为16至40个氨基酸的氨基酸序列、或由其组成,其中所述氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽是与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
在进一步优选的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽包含长度为16至40个氨基酸的氨基酸序列、或由其组成,其中所述氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽是与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步优选的实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中所述信号肽包含长度为16至40个氨基酸的氨基酸序列、或由其组成,其中所述氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽是天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在一实施方案中,所述信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰,
其中在信号肽的氨基酸序列的N-末端的氨基酸1-11内、优选在氨基酸1-10内、更优选在氨基酸1-9内、甚至更优选在氨基酸1-8内、特别是在氨基酸1-7内、更特别是在氨基酸1-6内、甚至更特别是在氨基酸1-5内、特别优选在氨基酸1-4内、更特别优选在氨基酸1-3内、更特别优选在氨基酸1-2内,进行通过***、缺失和/或取代至少一个氨基酸的修饰。
术语“疏水性分数”或“疏水分数”在本文中与术语“亲水性分数(hydropathyscore)”同义使用,并且是指根据Kyte-Doolittle量表(Kyte J.,Doolittle R.F.;J.Mol.Biol.157:105-132(1982))计算的氨基酸的疏水性程度。根据Kyte-Doolittle量表的氨基酸疏水性分数如下:
氨基酸序列的“平均疏水性分数”,例如信号肽的氨基酸序列的N-末端氨基酸1-9的平均疏水性分数,是相加氨基酸序列中的每个氨基酸的根据Kyte-Doolittle量表的疏水性分数(例如N-末端氨基酸1-9的9个氨基酸中的每个氨基酸的疏水性分数)、再除以氨基酸数(例如,除以九)而计算的。
在本发明的一个实施方案中,氨基酸序列的N-末端的氨基酸1-9具有等于或大于2.05,优选等于或大于2.1,更优选等于或大于2.15,甚至更优选等于或大于2.2,特别是等于或大于2.25,更特别是等于或大于2.3,甚至更特别是等于或大于2.35的平均疏水性分数。在进一步的实施方案中,氨基酸序列的N-末端的氨基酸1-9具有2.05至4.5,优选2.1至4.5,更优选2.15至4.5,甚至更优选2.2至4.5,特别是2.25至4.5,更特别是2.3至4.5,甚至更特别是2.35至4.5的平均疏水性分数。在进一步的实施方案中,氨基酸序列的N-末端的氨基酸1-9具有2.05至4.0,优选2.1至4.0,更优选2.15至4.0,甚至更优选2.2至4.0,特别是2.25至4.0,更特别是2.3至4.0,甚至更特别是2.35至4.0的平均疏水性分数。
在本发明的一个实施方案中,信号肽氨基酸序列的C-末端的最后9个氨基酸的平均疏水性分数比信号肽氨基酸序列的N-末端的氨基酸1-9的平均疏水性分数低至少1.0个单位,优选低至少1.1个单位,更优选低至少1.2个单位,甚至更优选低至少1.3个单位,特别是低1.0至4个单位,更特别是低1.1至4个单位,甚至更特别是低1.2至4个单位,最特别是低1.3至4个单位。
在本发明的一个实施方案中,信号肽氨基酸序列的N-末端的氨基酸1-9、氨基酸2-10、氨基酸3-11、氨基酸4-12和氨基酸5-13分别具有大于1.5的平均疏水性分数,优选大于1.6的平均疏水性分数,更优选大于1.7的平均疏水性分数,甚至更优选大于1.8的平均疏水性分数,更优选大于1.9的平均疏水性分数,特别是1.5至4.5的平均疏水性分数,更特别是1.6至4.5的平均疏水性分数,甚至更特别是1.7至4.5的平均疏水性分数,更特别是1.8至4.5的平均疏水性分数,最特别是1.9至4.5的平均疏水性分数。
在本发明的一个实施方案中,信号肽的氨基酸序列的N-末端的氨基酸8-16的平均疏水性分数至少等于或低于信号肽的氨基酸序列的N-末端的氨基酸3-11的平均疏水性分数,优选比信号肽的氨基酸序列的N-末端的氨基酸3-11的平均疏水性分数低至少0.4个单位,更优选低0.4-2.0个单位。
在本发明的一个实施方案中,信号肽包含长度为18至40个氨基酸的氨基酸序列、或由其组成,并且其中信号肽的氨基酸序列的N-末端的氨基酸10-18的平均疏水性分数比信号肽的氨基酸序列的N-末端的氨基酸3-11的平均疏水性分数低至少0.5个单位,优选低0.5至3.0个单位。
在本发明的一个实施方案中,信号肽的氨基酸序列的C-末端的最后9个氨基酸的平均疏水性分数比信号肽的氨基酸序列的N-末端的氨基酸3-11的平均疏水性分数低至少1.5个单位,优选低1.5-3.5个单位。
在本发明的一个实施方案中,信号肽的氨基酸序列的任何9个连续氨基酸的平均疏水性分数不超过4.1。
在本发明的一个实施方案中,信号肽的氨基酸序列的C-末端的最后9个氨基酸包含至少一个具有负的疏水性分数的氨基酸,优选地,信号肽的氨基酸序列的C-末端的最后9个氨基酸包含选自G、Q、N、T、S、R、K、H、D、E、P、Y和W的氨基酸。
在本发明的一个实施方案中,信号肽的氨基酸序列的N-末端的氨基酸1-9的第二氨基酸选自P、Y、W、S、T、G、A、M、C、F、L、V和I。
在本发明的一个优选的实施方案中,信号肽的氨基酸序列的N-末端的氨基酸1-9的第二氨基酸选自A、L、S、T、V和W。
在本发明的一个实施方案中,信号肽的氨基酸序列的N-末端的氨基酸1-9具有6.1或更低的平均极性,优选具有6.1以下的平均极性,更优选具有4以下的平均极性,甚至更优选具有2以下的平均极性,特别是具有6.1至0的平均极性,更特别是具有4至0的平均极性,甚至更特别是具有2至0的平均极性,最特别是具有1至0.2的平均极性。
在本发明的一个实施方案中,信号肽的氨基酸序列的N-末端的氨基酸1-7具有6.1或更低的平均极性,优选具有6.1以下的平均极性,更优选具有4以下的平均极性,甚至更优选具有2以下的平均极性,特别是具有6.1至0的平均极性,更特别是具有4至0的平均极性,甚至更特别是具有2至0的平均极性,最特别是具有1至0.2的平均极性。
在本发明的一个实施方案中,信号肽的氨基酸序列的N-末端的氨基酸1-5具有6.1或更低的平均极性,优选具有6.1以下的平均极性,更优选具有4以下的平均极性,甚至更优选具有2以下的平均极性,特别是具有6.1至0的平均极性,更特别是具有4至0的平均极性,甚至更特别是具有2至0的平均极性,最特别是具有1.1至0.2的平均极性。
根据Zimmerman Polarity index(Zimmerman J.M.,Eliezer N.,Simha R.;J.Theor.Biol.21:170-201(1968))计算极性。氨基酸序列的“平均极性”,例如信号肽的氨基酸序列的N-末端氨基酸1-9的平均极性,是相加氨基酸序列中的根据ZimmermanPolarity index计算的每个氨基酸的极性值(例如N-末端氨基酸1-9的9个氨基酸中的每个氨基酸的平均极性)、再除以氨基酸数(例如,除以九)而计算的。根据Zimmerman Polarityindex的氨基酸极性如下:
本发明信号肽的氨基酸序列的上述平均疏水性分数或平均极性可以通过使用公众可获得的在线数据库ProtScale(http://www.expasy.org/tools/protscale.html)计算,参见Gasteiger E.等人(Gasteiger E.,Hoogland C.,Gattiker A.,Duvaud S.,Wilkins M.R.,Appel R.D.,Bairoch A.;Protein Identification and Analysis Toolson the ExPASy Server;(In)John M.Walker(ed):The Proteomics Protocols Handbook,Humana Press(2005).第571-607页),其中选择Kyte&Doolittle量表(“Hphob./Kyte&Doolittle”)的疏水性或Zimmerman量表(“Polarity/Zimmerman”)的极性,并且对应于信号肽的特定窗口大小(例如9个氨基酸的窗口大小)进行设置,其中窗口边缘相对权重值设置为100%,且未进行量表标准化。可以通过打开结果页面中“数值格式(冗长)”上的链接来检索相应的数值数据。
在本发明的一个实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.7的平均疏水性分数。在一个实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-7具有大于1.7的平均疏水性分数,且信号肽包含14至40个氨基酸长度的氨基酸序列、或由其组成。
在本发明的一个实施方案中,氨基酸序列的N-末端的氨基酸1-7具有等于或大于1.6,优选等于或大于1.7,更优选等于或大于1.75,甚至更优选等于或大于1.8,特别是等于或大于2.0,更特别是等于或大于2.1,甚至更特别是等于或大于2.2的平均疏水性分数。在进一步的实施方案中,氨基酸序列的N-末端的氨基酸1-7具有1.6至4.5,优选1.7至4.5,更优选1.75至4.5,甚至更优选1.8至4.5,特别是2.0至4.5,更特别是2.1至4.5,甚至更特别是2.2至4.5的平均疏水性分数。在进一步的实施方案中,氨基酸序列的N-末端的氨基酸1-7具有1.6至4.0,优选1.7至4.0,更优选1.75至4.0,甚至更优选1.8至4.0,特别是2.0至4.0,更特别是2.1至4.0,甚至更特别是2.2至4.0的平均疏水性分数。
在本发明的一个实施方案中,信号肽的氨基酸序列的C-末端的最后7个氨基酸的平均疏水性分数等于或低于信号肽氨基酸序列的N-末端的氨基酸1-7的平均疏水性分数,优选低至少0.06个单位,更优选低至少1.0个单位,甚至更优选低至少1.1个单位,特别是低至少1.2个单位,更特别是低1.0至4个单位,甚至更特别地低1.0和4个单位,最特别地低1.2至4个单位。
在本发明的一个实施方案中,信号肽氨基酸序列的N-末端的氨基酸1-7、氨基酸2-8、氨基酸3-9、氨基酸4-10和氨基酸5-11分别具有大于1.4的平均疏水性分数,优选大于1.5的平均疏水性分数,更优选大于1.6的平均疏水性分数,甚至更优选大于1.7的平均疏水性分数,更优选大于1.75的平均疏水性分数,特别是1.4至4.5的平均疏水性分数,更特别是1.5至4.5的平均疏水性分数,甚至更特别是1.6至4.5的平均疏水性分数,更特别是1.7至4.5的平均疏水性分数,最特别是1.75至4.5的平均疏水性分数。
在本发明的一个实施方案中,信号肽的氨基酸序列的C-末端的最后7个氨基酸的平均疏水性分数比信号肽的氨基酸序列的N-末端的氨基酸3-9的平均疏水性分数低至少1.0个单位,优选低1.0-3.6个单位。
在本发明的一个实施方案中,信号肽的氨基酸序列的任何7个连续氨基酸的平均疏水性分数不超过4.1。
在本发明的一个实施方案中,信号肽的氨基酸序列的C-末端的最后7个氨基酸包含至少一个具有负的疏水性分数的氨基酸,优选地,信号肽的氨基酸序列的C-末端的最后7个氨基酸包含选自G、Q、N、T、S、R、K、H、D、E、P、Y和W的氨基酸。
在本发明的一个实施方案中,信号肽氨基酸序列的N-末端的氨基酸1-7的第二氨基酸选自P、Y、W、S、T、G、A、M、C、F、L、V和I。
在本发明的一个优选实施方案中,信号肽氨基酸序列的N-末端的氨基酸1-7的第二氨基酸选自A、L、S、T、V和W。
在本发明的一个实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3个单位的平均疏水性分数。在一个实施方案中,mRNA包含编码蛋白质和信号肽的核酸序列,其中信号肽的氨基酸序列的N-末端的氨基酸1-5具有大于1.3的平均疏水性分数,且信号肽包含12至40个氨基酸长度的氨基酸序列、或由其组成。
在本发明的一个实施方案中,氨基酸序列的N-末端的氨基酸1-5具有等于或大于1.0,优选等于或大于1.1,更优选等于或大于1.2,甚至更优选等于或大于1.25,特别是等于或大于1.3,更特别是等于或大于1.35,甚至更特别是等于或大于1.38的平均疏水性分数。在进一步的实施方案中,氨基酸序列的N-末端的氨基酸1-5具有1至4.5,优选1.1至4.5,更优选1.2至4.5,甚至更优选1.25至4.5,特别是1.3至4.5,更特别是1.35至4.5,甚至更特别是1.38至4.5的平均疏水性分数。在进一步的实施方案中,氨基酸序列的N-末端的氨基酸1-5具有1.0至4.0,优选1.1至4.0,更优选1.2至4.0,甚至更优选1.25至4.0,特别是1.3至4.0,更特别是1.35至4.0,甚至更特别是1.38至4.0的平均疏水性分数。
在本发明的一个实施方案中,信号肽氨基酸序列的C-末端的最后5个氨基酸的平均疏水性分数比信号肽氨基酸序列的N-末端的氨基酸1-5的平均疏水性分数低至少0.2个单位,优选低至少0.24个单位,更优选低至少1.0个单位,甚至更优选低至少1.2个单位,特别是低0.2至4个单位,更特别是低0.24至4个单位,更特别是低1.0至4个单位,最特别是低1.2至4个单位。
在本发明的一个实施方案中,信号肽氨基酸序列的N-末端的氨基酸1-5、氨基酸2-6、氨基酸3-7、氨基酸4-8和氨基酸5-9分别具有大于1.0的平均疏水性分数,优选大于1.15的平均疏水性分数,更优选大于1.2的平均疏水性分数,甚至更优选大于1.21的平均疏水性分数,更优选大于1.23的平均疏水性分数,特别是1.0至4.5的平均疏水性分数,更特别是1.15至4.5的平均疏水性分数,甚至更特别是1.2至4.5的平均疏水性分数,更特别是1.21至4.5的平均疏水性分数,最特别是1.23至4.5的平均疏水性分数。
在本发明的一个实施方案中,信号肽的氨基酸序列的C-末端的最后5个氨基酸的平均疏水性分数比信号肽的氨基酸序列的N-末端的氨基酸3-7的平均疏水性分数低至少1.2个单位,优选低1.2至3.0个单位,更优选低1.2至4.3个单位。
在本发明的一个实施方案中,信号肽的氨基酸序列的任何5个连续氨基酸的平均疏水性分数不超过4.2,优选地不超过4.3。
在本发明的一个实施方案中,信号肽的氨基酸序列的C-末端的5 9个氨基酸包含至少一个具有负的疏水性分数的氨基酸,优选地,信号肽的氨基酸序列的C-末端的最后5个氨基酸包含选自G、Q、N、T、S、R、K、H、D、E、P、Y和W的氨基酸。
在本发明的一个实施方案中,信号肽氨基酸序列的N-末端的氨基酸1-9的第二氨基酸选自P、Y、W、S、T、G、A、M、C、F、L、V和I。
在本发明的一个优选实施方案中,信号肽氨基酸序列的N-末端的氨基酸1-9的第二氨基酸选自A、L、S、T、V和W。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代氨基酸数目少于与所述蛋白质异源的信号肽氨基酸序列的氨基酸数目的50%而被修饰。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的信号肽具有与未修饰的与所述蛋白质异源的信号肽的氨基酸序列差异在于一个氨基酸,优选两个、更优选三个、甚至更优选四个、最优选五个、特别是六个、更特别是七个、甚至更特别是八个、最特别是九或十个氨基酸的序列。
在一个实施方案中,修饰的信号肽具有这样的氨基酸序列,其与未修饰的与所述蛋白质异源的信号肽的氨基酸序列的不同在于1-2个氨基酸、优选1-3个氨基酸、更优选1-4个氨基酸、甚至更优选1-5个氨基酸、最优选1-6个氨基酸、特别是1-7个氨基酸、更特别是1-10个氨基酸、甚至更特别是1-12个氨基酸、最特别是1-15个氨基酸。
在一个实施方案中,修饰的信号肽与未修饰的与所述蛋白质异源的信号肽的氨基酸序列具有95%至50%、优选95%至60%、更优选95%至70%、甚至更优选95%至80%、最优选95%至90%的序列同一性。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,条件是修饰的信号肽具有这样的序列,其与所述蛋白质的天然存在(同源)的信号肽的氨基酸序列不同在于至少一个氨基酸、优选至少两个、更优选至少三个、甚至更优选至少四个、最优选至少五个、特别是至少六个、更特别是至少七个、甚至更特别是至少八个、最特别是至少九或十个氨基酸。在一个实施方案中,与所述蛋白质异源的修饰的信号肽与所述蛋白质的天然存在(同源)的信号肽的氨基酸序列具有小于95%,优选小于90%,更优选小于80%,甚至更优选小于70%,最优选小于60%,特别是小于50%的序列同一性。
在本发明的一个实施方案中,信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中未修饰的与所述蛋白质同源的信号肽的氨基酸序列的N-末端的氨基酸1-9具有2或更低的平均疏水性分数,优选低于2的平均疏水性分数。
在本发明的一个实施方案中,信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代氨基酸数目少于与所述蛋白质同源的信号肽的氨基酸序列的氨基酸数目的50%而被修饰。
在本发明的一个实施方案中,信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质同源的的修饰的信号肽的一个、优选两个、更优选三个、甚至更优选四个、最优选五个、特别是六个、更特别是七个、甚至更特别是8-12个、最特别是9-15个氨基酸与未修饰的与所述蛋白质同源的信号肽的氨基酸序列不同。在一个实施方案中,与所述蛋白质同源的修饰的信号肽的1-2个氨基酸、优选1-3个氨基酸、更优选1-4个氨基酸、甚至更优选1-5个氨基酸、最优选1-6个氨基酸、特别是1-7个氨基酸、更特别是1-1-10个氨基酸、甚至更特别是1-12个氨基酸、最特别是1-15个氨基酸与未修饰的与所述蛋白质同源的信号肽的氨基酸序列不同。
在一个实施方案中,与所述蛋白质同源的修饰的信号肽与未修饰的与所述蛋白质同源的信号肽的氨基酸序列具有小于95%、优选小于90%、更优选小于80%、甚至更优选小于70%、最优选小于60%、特别是小于50%的序列同一性。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代氨基酸数目少于天然存在的氨基酸序列的氨基酸数目的50%而被修饰。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列的1个、优选2个、更优选3个、甚至更优选4个、最优选5个、特别是6个、更特别是7个、甚至更特别是8-12个、最特别是9-15个氨基酸与未修饰的天然存在的氨基酸序列的氨基酸序列不同。
在一个实施方案中,修饰的天然存在的氨基酸序列的1-2个氨基酸、优选1-3个氨基酸、更优选1-4个氨基酸、甚至更优选1-5个氨基酸、最优选1-6个氨基酸、特别是1-7个氨基酸、更特别是1-1-10个氨基酸、甚至更特别是1-12个氨基酸、最特别是1-15个氨基酸与未修饰的天然存在的氨基酸序列的氨基酸序列不同。
在一个实施方案中,修饰的天然存在的氨基酸序列与未修饰的天然存在的氨基酸序列的氨基酸序列具有小于95%、优选小于90%、更优选小于80%、甚至更优选小于70%、最优选小于60%、特别是小于50%的序列同一性。
在本发明的一个实施方案中,天然存在的本质上不具有信号肽功能的氨基酸序列的修饰序列,其氨基酸序列与天然存在的信号肽的氨基酸序列具有多于50%、优选多于60%、更优选多于70%、甚至更优选多于80%、最优选多于90%、特别是多于95%的不同,在一个实施方案中,天然存在的本质上不具有信号肽功能的氨基酸序列的修饰序列,其与天然存在的信号肽的氨基酸序列具有小于100%、优选小于95%、更优选小于90%、甚至更优选小于80%、最优选小于70%、特别是小于60%、更特别是小于50%的序列同一性。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自脑源性神经营养因子(BDNF)的信号肽、神经营养因子-3(NTF-3)的信号肽、成纤维细胞生长因子5(FGF5)的信号肽、***结合蛋白5(IBP5)的信号肽、***和睾丸表达的蛋白2(PATE2)的信号肽、细胞外超氧化物歧化酶(SOD3)的信号肽和补体因子H相关蛋白2(FHR2)的信号肽,或i)通过***、缺失和/或取代至少一个氨基酸而修饰的与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自C-X-C基序趋化因子配体12(CXCL12)的信号肽、胰岛素生长因子2(IGF2)的信号肽、胰岛素(INS)的信号肽和脑源性神经营养因子(BDNF)的信号肽。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自如SEQ ID NO:30所示的脑源性神经营养因子(BDNF)的信号肽、如SEQ ID NO:102所示的神经营养因子-3(NTF-3)的信号肽、如SEQ ID NO:87所示的成纤维细胞生长因子5(FGF5)的信号肽、如SEQ ID NO:97所示的***结合蛋白5(IBP5)的信号肽、如SEQ ID NO:107所示的***和睾丸表达的蛋白2(PATE2)的信号肽、如SEQ ID NO:112所示的细胞外超氧化物歧化酶(SOD3)的信号肽和如SEQ ID NO:92所示的补体因子H相关蛋白2(FHR2)的信号肽,或i)通过***、缺失和/或取代至少一个氨基酸而修饰的与所述蛋白质异源的信号肽,其中修饰的与所述蛋白质异源的信号肽选自如SEQ ID NO:132所示的C-X-C基序趋化因子配体12(CXCL12)的修饰的信号肽、如SEQ ID NO:127所示的胰岛素生长因子2(IGF2)的修饰的信号肽、如SEQ ID NO:147所示的胰岛素(INS)的修饰的信号肽和如SEQ ID NO:137所示的脑源性神经营养因子(BDNF)的修饰的信号肽。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自脑源性神经营养因子(BDNF)的信号肽、神经营养因子-3(NTF-3)的信号肽、成纤维细胞生长因子5(FGF5)的信号肽、***结合蛋白5(IBP5)的信号肽、***和睾丸表达的蛋白2(PATE2)的信号肽、细胞外超氧化物歧化酶(SOD3)的信号肽和补体因子H相关蛋白2(FHR2)的信号肽。优选地,与所述蛋白质异源的信号肽选自如SEQ ID NO:30所示的脑源性神经营养因子(BDNF)的信号肽、如SEQ ID NO:102所示的神经营养因子-3(NTF-3)的信号肽、如SEQ ID NO:87所示的成纤维细胞生长因子5(FGF5)的信号肽、如SEQ ID NO:97所示的***结合蛋白5(IBP5)的信号肽、如SEQ ID NO:107所示的***和睾丸表达的蛋白2(PATE2)的信号肽、如SEQ ID NO:112所示的细胞外超氧化物歧化酶(SOD3)的信号肽和如SEQ ID NO:92所示的补体因子H相关蛋白2(FHR2)的信号肽。
在本发明的一个实施方案中,信号肽是i)通过***、缺失和/或取代至少一个氨基酸而修饰的与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自C-X-C基序趋化因子配体12(CXCL12)的信号肽、胰岛素生长因子2(IGF2)的信号肽、胰岛素(INS)的信号肽和脑源性神经营养因子(BDNF)的信号肽。
在本发明的一个优选的实施方案中,通过***、缺失和/或取代至少一个氨基酸而修饰的与所述蛋白质异源的信号肽选自如SEQ ID NO:132所示的C-X-C基序趋化因子配体12(CXCL12)的修饰的信号肽、如SEQ ID NO:127所示的胰岛素生长因子2(IGF2)的修饰的信号肽、如SEQ ID NO:147所示的胰岛素(INS)的修饰的信号肽和如SEQ ID NO:137所示的脑源性神经营养因子(BDNF)的修饰的信号肽。
在本发明的一个实施方案中,信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质同源的信号肽和所述蛋白质选自胰岛素生长因子1(IGF1)的信号肽和IGF1、胰岛素的信号肽和INS、***(EPO)的信号肽和EPO、白细胞介素4(IL-4)的信号肽和IL-4、以及白细胞介素10(IL-10)的信号肽和IL-10。
在本发明的一个优选的实施方案中,通过***、缺失和/或取代至少一个氨基酸而修饰的与所述蛋白质同源的信号肽选自如SEQ ID NO:122所示的胰岛素生长因子1(IGF1)的修饰的信号肽、如SEQ ID No:147所示的胰岛素的修饰的信号肽、如SEQ ID NO:152所示的***(EPO)的修饰的信号肽、如SEQ ID No:166所示的白细胞介素4(IL-4)的修饰的信号肽、以及如SEQ ID No:174所示的白细胞介素10(IL-10)的修饰的信号肽。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,其中所述天然存在的氨基酸序列选自胰岛素生长因子1(IGF1)的前肽、胰高血糖素受体(GL-R)的编码序列和肠型碱性磷酸酶(ALPI)的前肽。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是胰高血糖素受体(GL-R)的编码序列,iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的前肽,或iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是肠型碱性磷酸酶(ALPI)的前肽。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是胰高血糖素受体(GL-R)的编码序列。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的前肽。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是肠型碱性磷酸酶(ALPI)的前肽。
在本发明的一个优选的实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是如SEQ ID NO:117所示的胰高血糖素受体(GL-R)的编码序列,iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID NO:142所示的胰岛素生长因子1(IGF1)的修饰的前肽,或iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID NO:189所示的肠型碱性磷酸酶(ALPI)的前肽。
在本发明的一个优选实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是如SEQ ID NO:117所示的胰高血糖素受体(GL-R)的编码序列。
在本发明的一个优选的实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID NO:142所示的胰岛素生长因子1(IGF1)的修饰的前肽。
在本发明的一个优选的实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID No:189所示的肠型碱性磷酸酶(ALPI)的修饰的前肽。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,其中使用与所述蛋白质异源的信号肽分泌蛋白质的量高于使用与所述蛋白质同源的信号肽的所述分泌蛋白质的量。优选地,使用与所述蛋白质异源的信号肽分泌蛋白质的量高于使用与所述蛋白质同源的信号肽的所述分泌蛋白质的量,优选高至少1.4倍。
在本发明的一个实施方案中,信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中使用与所述蛋白质同源的修饰的信号肽分泌蛋白质的量高于使用未修饰的与所述蛋白质同源的信号肽的所述分泌蛋白质的量。优选地,使用与所述蛋白质同源的修饰的信号肽分泌蛋白质的量高于使用与所述蛋白质同源的未修饰信号肽的所述分泌蛋白质的量,优选高至少1.4倍。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,并且其中使用天然存在的本质上不具有信号肽功能的氨基酸序列的分泌蛋白质的量高于使用与所述蛋白质同源的信号肽的所述分泌蛋白质的量。优选地,使用任选修饰的天然存在的氨基酸序列的分泌蛋白质的量高于使用与所述蛋白质同源的信号肽的所述分泌蛋白质的量,优选倍至少高1.4。
在本发明的一个实施方案中,其中信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,条件是所述蛋白质不是硫氧还蛋白,更特别地,其中所述蛋白质不是杆细胞来源视锥细胞活性因子。
在本发明的一个实施方案中,信号肽选自:i)与所述蛋白质异源的信号肽,并且所述蛋白质选自胰岛素生长因子1(IGF1)、胰岛素(INS)、***(EPO)、白细胞介素4(IL-4)和白细胞介素10(IL-10)。
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,并且所述蛋白质是IGF1。
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,并且所述蛋白质选自胰岛素生长因子1(IGF1)、胰岛素(INS)、***(EPO)、白细胞介素4(IL-4)和白细胞介素10(IL-10);
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是胰高血糖素受体(GL-R)的编码序列,并且所述蛋白质是胰岛素生长因子1(IGF1);和iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中所述天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的前肽,并且所述蛋白质是胰岛素生长因子1(IGF1)。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,并且所述蛋白质选自胰岛素生长因子1(IGF1)、胰岛素(INS)、***(EPO)、白细胞介素4(IL-4)和白细胞介素10(IL-10)。
在本发明的一个优选的实施方案中,信号肽是i)与所述蛋白质异源的信号肽,并且所述蛋白质选自如SEQ ID NO:188所示的胰岛素生长因子1(IGF1)、如SEQ ID NO:185所示的胰岛素(INS)、如SEQ ID NO:184所示的***(EPO)、如SEQ ID No:186所示的白细胞介素-4(IL-4)、以及如SEQ ID No:187所示的白细胞介素-10(IL-10)。
在本发明的一个实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,并且所述蛋白质为IGF1。
在本发明的一个优选实施方案中,信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,并且所述蛋白质是如SEQ ID NO:188所示的IGF1。
在本发明的一个实施方案中,信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,并且所述蛋白质选自胰岛素生长因子1(IGF1)、胰岛素(INS)、***(EPO)、白细胞介素4(IL-4)和白细胞介素10(IL-10)。
在本发明的一个优选的实施方案中,信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,并且所述蛋白质选自如SEQ ID NO:188所示的胰岛素生长因子1(IGF1)、如SEQ ID NO:185所示的胰岛素(INS)、如SEQ ID NO:184所示的***(EPO)、如SEQ ID No:186所示的白细胞介素4(IL-4)、和如SEQ ID No:187所示的白细胞介素10(IL-10)。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列是胰高血糖素受体(GL-R)的编码序列,并且所述蛋白质是胰岛素生长因子1(IGF1)。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的前肽,并且所述蛋白质是胰岛素生长因子1(IGF1)。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是肠型碱性磷酸酶(ALPI)的前肽,并且所述蛋白质是胰岛素生长因子1(IGF1)。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列是胰高血糖素受体(GL-R)的编码序列,并且所述蛋白质是如SEQ ID No:188所示的胰岛素生长因子1(IGF1)。
在本发明的一个实施方案中,信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的修饰的前肽,并且所述蛋白质是如SEQ ID NO:188所示的胰岛素生长因子1(IGF1)。
在本发明的一个实施方案中,信号肽是iii)天然不具有信号肽功能的天然发生的氨基酸序列,其中所述天然发生的氨基酸序列通过***,缺失和/或取代至少一种氨基酸而被修饰,其中所述修饰的天然氨基酸序列是肠型碱性磷酸酶(ALPI)的修饰的前肽,并且所述蛋白质是如SEQ ID No:188所示的胰岛素生长因子1(IGF1)。
在本发明的一个优选实施方案中,信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自脑源性神经营养因子(BDNF)的信号肽、神经营养因子-3(NTF-3)的信号肽、成纤维细胞生长因子5(FGF5)的信号肽、***结合蛋白5(IBP5)的信号肽、***和睾丸表达的蛋白2(PATE2)的信号肽、细胞外超氧化物歧化酶(SOD3)的信号肽和补体因子H相关蛋白2(FHR2)的信号肽,条件是所述蛋白质不是氧化还原酶;
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质异源的信号肽选自C-X-C基序趋化因子配体12(CXCL12)的信号肽、胰岛素生长因子2(IGF2)的信号肽、胰岛素(INS)的信号肽和脑源性神经营养因子(BDNF)的信号肽,条件是所述蛋白质不是氧化还原酶。
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质同源的信号肽选自:胰岛素生长因子1(IGF1)的信号肽、胰岛素(INS)的信号肽、***(EPO)的信号肽、白细胞介素4的信号肽(IL-4)和白细胞介素10的信号肽(IL-10);
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是胰高血糖素受体(GL-R)的编码序列;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的前肽;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是肠型碱性磷酸酶(ALPI)的前肽。
在本发明的一个优选实施方案中,信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自脑源性神经营养因子(BDNF)的信号肽、神经营养因子-3(NTF-3)的信号肽、成纤维细胞生长因子5(FGF5)的信号肽、***结合蛋白5(IBP5)的信号肽、***和睾丸表达的蛋白2(PATE2)的信号肽、细胞外超氧化物歧化酶(SOD3)的信号肽和补体因子H相关蛋白2(FHR2)的信号肽,并且所述蛋白质选自细胞因子、生长因子和激素;
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质异源的信号肽选自C-X-C基序趋化因子配体12(CXCL12)的信号肽、胰岛素生长因子2(IGF2)的信号肽、胰岛素(INS)的信号肽和脑源性神经营养因子(BDNF)的信号肽,并且所述蛋白质选自细胞因子、生长因子和激素;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质同源的信号肽和所述蛋白质选自胰岛素生长因子1(IGF1)的信号肽和IGF1、胰岛素的信号肽和INS、***(EPO)的信号肽和EPO、白细胞介素4(IL-4)的信号肽和IL-4、以及白细胞介素10(IL-10)的信号肽和IL-10;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中信号肽是胰高血糖素受体(GL-R)的编码序列,并且所述蛋白质选自细胞因子、生长因子、和激素,优选是生长因子;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中所述天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的前肽,并且所述蛋白质选自细胞因子、生长因子、和激素,优选是生长因子;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中所述天然存在的氨基酸序列是肠型碱性磷酸酶(ALPI)的前肽,并且所述蛋白质选自细胞因子、生长因子和激素,优选是生长因子。
在本发明的一个优选实施方案中,信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自脑源性神经营养因子(BDNF)的信号肽、神经营养因子-3(NTF-3)的信号肽、成纤维细胞生长因子5(FGF5)的信号肽、***结合蛋白5(IBP5)的信号肽、***和睾丸表达的蛋白2(PATE2)的信号肽、细胞外超氧化物歧化酶(SOD3)的信号肽和补体因子H相关蛋白2(FHR2)的信号肽,并且所述蛋白质选自胰岛素生长因子1(IGF1)、胰岛素(INS)、***(EPO)、白细胞介素4(IL-4)和白细胞介素10(IL-10);
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质异源的信号肽选自C-X-C基序趋化因子配体12(CXCL12)的信号肽、胰岛素生长因子2(IGF2)的信号肽、胰岛素(INS)的信号肽和脑源性神经营养因子(BDNF)的信号肽,并且所述蛋白质是胰岛素生长因子1(IGF1);
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而修饰,其中与所述蛋白质同源的信号肽和所述蛋白质选自胰岛素生长因子1(IGF1)的信号肽和IGF1、胰岛素的信号肽和INS、***的信号肽(EPO)和EPO、白细胞介素4(IL-4)的信号肽和IL-4、白细胞介素10的信号肽(IL-10)和IL-10;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是胰高血糖素受体(GL-R)的编码序列,并且所述蛋白质是胰岛素生长因子1(IGF1);
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中所述天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的前肽,并且所述蛋白质是胰岛素生长因子1(IGF1);和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中天然存在的氨基酸序列是肠型碱性磷酸酶(ALPI)的前肽,并且所述蛋白质是胰岛素生长因子1(IGF1)。
在本发明的一个优选实施方案中,信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽和所述蛋白质选自脑源性神经营养因子(BDNF)的信号肽和IGF1、胰岛素、EPO或IL-10;神经营养因子-3(NTF-3)的信号肽和IGF1;成纤维细胞生长因子5(FGF5)的信号肽和IGF1或IL4;***结合蛋白5(IBP5)的信号肽和IGF1;***和睾丸表达的蛋白2(PATE2)的信号肽和IGF1;细胞外超氧化物歧化酶(SOD3)的信号肽和IGF1;和补体因子H相关蛋白2(FHR2)的信号肽和IGF1;
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质异源的信号肽和所述蛋白质选自C-X-C基序趋化因子配体12(CXCL12)的信号肽和IGF1;胰岛素生长因子2(IGF2)的信号肽和IGF1;胰岛素(INS)的信号肽和IGF1;和脑源性神经营养因子(BDNF)的信号肽和IGF1;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质同源的信号肽和所述蛋白质选自胰岛素生长因子1(IGF1)的信号肽和IGF1、胰岛素的信号肽和INS、***(EPO)的信号肽和EPO、白细胞介素4(IL-4)的信号肽和IL-4、白细胞介素10的信号肽(IL-10)和IL-10;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是胰高血糖素受体(GL-R)的编码序列,并且所述蛋白质是胰岛素生长因子1(IGF1);
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中所述天然存在的氨基酸序列是胰岛素生长因子1(IGF1)的前肽,并且所述蛋白质是胰岛素生长因子1(IGF1);和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中所述天然存在的氨基酸序列是肠型碱性磷酸酶(ALPI)的前肽,并且所述蛋白质是胰岛素生长因子1(IGF1)。
在本发明的一个优选实施方案中,信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自如SEQ IDNO:30所示的脑源性神经营养因子(BDNF)的信号肽、如SEQ ID NO:102所示的神经营养因子-3(NTF-3)的信号肽、如SEQ ID NO:87所示的成纤维细胞生长因子5(FGF5)的信号肽、如SEQ ID NO:97所示的***结合蛋白5(IBP5)的信号肽、如SEQ ID NO:107所示的***和睾丸表达的蛋白2(PATE2)的信号肽、如SEQ ID NO:112所示的细胞外超氧化物歧化酶(SOD3)的信号肽和如SEQ ID NO:92所示的补体因子H相关蛋白2(FHR2)的信号肽,条件是所述蛋白质不是氧化还原酶;
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质异源的信号肽选自如SEQ ID NO:132所示的C-X-C基序趋化因子配体12(CXCL12)的信号肽、如SEQ ID NO:127所示的胰岛素生长因子2(IGF2)的信号肽、如SEQ ID NO:147所示的胰岛素(INS)的信号肽和如SEQ IDNO:137所示的脑源性神经营养因子(BDNF)的信号肽,条件是所述蛋白质不是氧化还原酶。
i)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质同源的信号肽选自如SEQ ID NO:122所示的胰岛素生长因子1(IGF1)的修饰的信号肽、如SEQ ID No:147所示的胰岛素(INS)的修饰的信号肽、如SEQ ID NO:152所示的***(EPO)的修饰的信号肽、如SEQID NO:166所示的白细胞介素4(IL-4)的修饰的信号肽、以及如SEQ ID NO:174所示的白细胞介素10(IL-10)的修饰的信号肽。
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是如SEQ ID NO:117所示的胰高血糖素受体(GL-R)的编码序列;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID NO:142所示的胰岛素生长因子1(IGF1)的修饰的前肽;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID NO:189所示的肠型碱性磷酸酶(ALPI)的修饰的前肽。
在本发明的一个优选实施方案中,信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自如SEQ IDNO:30所示的脑源性神经营养因子(BDNF)的信号肽、如SEQ ID NO:102所示的神经营养因子-3(NTF-3)的信号肽、如SEQ ID NO:87所示的成纤维细胞生长因子5(FGF5)的信号肽、如SEQ ID NO:97所示的***结合蛋白5(IBP5)的信号肽、如SEQ ID NO:107所示的***和睾丸表达的蛋白2(PATE2)的信号肽、如SEQ ID NO:112所示的细胞外超氧化物歧化酶(SOD3)的信号肽和如SEQ ID NO:92所示的补体因子H相关蛋白2(FHR2)的信号肽,并且所述蛋白质选自细胞因子、生长因子和激素;
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质异源的修饰的信号肽选自如SEQID NO:132所示的C-X-C基序趋化因子配体12(CXCL12)的修饰的信号肽、如SEQ ID NO:127所示的胰岛素生长因子2(IGF2)的修饰的信号肽、如SEQ ID NO:147所示的胰岛素(INS)的修饰的信号肽和如SEQ ID NO:137所示的脑源性神经营养因子(BDNF)的修饰的信号肽,并且所述蛋白质选自细胞因子、生长因子和激素;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质同源的修饰的信号肽和所述蛋白质选自SEQ ID NO:122所示的胰岛素生长因子1(IGF1)的修饰的信号肽和如SEQ ID NO:188所示的IGF1;如SEQ ID NO:147所示的胰岛素的修饰的信号肽和如SEQ ID NO:185所示的胰岛素(INS);如SEQ ID NO:152所示的***(EPO)的修饰的信号肽和如SEQ IDNo:184所示的EPO;如SEQ ID NO:166所示的白细胞介素4(IL-4)的修饰的信号肽和如SEQID NO:186所示的IL-4;如SEQ ID NO:174所示的白细胞介素10(IL-10)的修饰的信号肽和如SEQ ID NO:187所示的IL-10;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是如SEQ ID No:117所示的胰高血糖素受体(GL-R)的编码序列,并且所述蛋白质选自细胞因子;生长因子;和激素,优选是生长因子;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID No:142所示的胰岛素生长因子1(IGF1)的修饰的前肽,并且所述蛋白质选自细胞因子;生长因子;和激素,优选是生长因子;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID No:189所示的肠型碱性磷酸酶(ALPI)的修饰的前肽,并且所述蛋白质选自细胞因子;生长因子和激素,优选是生长因子。
在本发明的一个优选实施方案中,信号肽选自:
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自如SEQ IDNO:30所示的脑源性神经营养因子(BDNF)的信号肽、如SEQ ID NO:102所示的神经营养因子-3(NTF-3)的信号肽、如SEQ ID NO:87所示的成纤维细胞生长因子5(FGF5)的信号肽、如SEQ ID NO:97所示的***结合蛋白5(IBP5)的信号肽、如SEQ ID NO:107所示的***和睾丸表达的蛋白2(PATE2)的信号肽、如SEQ ID NO:112所示的细胞外超氧化物歧化酶(SOD3)的信号肽和如SEQ ID NO:92所示的补体因子H相关蛋白2(FHR2)的信号肽,并且所述蛋白质选自如SEQ ID No:188所示的胰岛素生长因子1(IGF1)、如SEQ ID NO:185所示的胰岛素、如SEQ ID NO:184所示的***(EPO)、如SEQ ID NO:186所示的白细胞介素4(IL-4)、和如SEQ ID NO:187所示的白细胞介素10(IL-10);i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质异源的修饰的信号肽选自如SEQ ID NO:132所示的C-X-C基序趋化因子配体12(CXCL12)的修饰的信号肽、如SEQ ID NO:127所示的胰岛素生长因子2(IGF2)的修饰的信号肽、如SEQ ID NO:147所示的胰岛素(INS)的修饰的信号肽和如SEQ ID NO:137所示的脑源性神经营养因子(BDNF)的修饰的信号肽,并且所述蛋白质是如SEQ ID No:188所示的胰岛素生长因子1(IGF1);
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的与所述蛋白质同源的信号肽和所述蛋白质选自如SEQ ID NO:122所示的胰岛素生长因子1(IGF1)的修饰的信号肽和SEQ ID No:188所示的IGF1、如SEQ ID No:147所示的胰岛素的修饰的信号肽和如SEQ ID No:185所示的胰岛素(INS)、如SEQ ID No:152所示的***(EPO)的修饰的信号肽和SEQ ID No:184所示的EPO、如SEQ ID No:166所示的白细胞介素4(IL-4)的修饰的信号肽和如SEQ IDNo:186所示的IL-4、如SEQ ID No:174所示的白细胞介素10(IL-10)的修饰的信号肽和如SEQ ID No:187所示的IL-10;
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中天然存在的氨基酸序列是如SEQ ID No:117所示的胰高血糖素受体(GL-R)的编码序列,并且所述蛋白质是如SEQ ID No:188所示的胰岛素生长因子1(IGF1);
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID No:142所示的胰岛素生长因子1(IGF1)的修饰的前肽,并且所述蛋白质是如SEQ ID No:188所示的胰岛素生长因子1(IGF1);和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列通过***、缺失和/或取代至少一个氨基酸而被修饰,其中修饰的天然存在的氨基酸序列是如SEQ ID No:189所示的肠型碱性磷酸酶(ALPI)的修饰的前肽,并且所述蛋白质是如SEQ ID No:188所示的胰岛素生长因子1(IGF1)。
在本发明的一个特别优选的实施方案中,包含编码蛋白质和信号肽的核酸序列的mRNA选自如SEQ ID NO:8所示的mRNA序列、如SEQ ID NO:105所示的mRNA序列、如SEQ IDNO:90所示的mRNA序列、如SEQ ID NO:100所示的mRNA序列、如SEQ ID NO:110所示的mRNA序列、如SEQ ID NO:115所示的mRNA序列、如SEQ ID NO:95所示的mRNA序列、如SEQ ID NO:135所示的mRNA序列、如SEQ ID NO:130所示的mRNA序列、如SEQ ID NO:150所示的mRNA序列、如SEQ ID NO:140所示的mRNA序列、如SEQ ID NO:125所示的mRNA序列、如SEQ ID NO:161所示的mRNA序列、如SEQ ID NO:155所示的mRNA序列、如SEQ ID NO:169所示的mRNA序列、如SEQID NO:177所示的mRNA序列、如SEQ ID NO:120所示的mRNA序列、如SEQ ID NO:145所示的mRNA序列和如SEQ ID NO:192所示的mRNA序列。
在一个进一步的方面,本发明提供了包含核酸序列的mRNA,所述核酸序列编码
i)蛋白质;和
ii)与所述蛋白质异源的信号肽,
其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质不是氧化还原酶,
特别是,包含核酸序列的mRNA,所述核酸序列编码
i)蛋白质;和
ii)与所述蛋白质异源的信号肽,
其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质选自羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶;免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白。
在本发明的一个实施方案中,所述蛋白质是治疗性蛋白质。在本发明的一个优选的实施方案中,所述蛋白质是人源的蛋白质,即,人蛋白质。在本发明的一个进一步优选的实施方案中,所述蛋白质选自均为人源的羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶;免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白。在本发明的一个更优选的实施方案中,本发明的蛋白质是人蛋白质,其选自人羧肽酶;人细胞因子;人细胞外配体和转运蛋白;人细胞外基质蛋白;人葡糖苷酶;人糖基转移酶;人生长因子;人生长因子结合蛋白;人肝素结合蛋白;人激素;人水解酶;人免疫球蛋白;人异构酶;人激酶;人裂解酶;人金属酶抑制剂;人金属蛋白酶;人乳蛋白;人神经活性蛋白;人蛋白酶;人蛋白酶抑制剂;人蛋白质磷酸酶;人酯酶;人转移酶和人血管活性蛋白。
在一个实施方案中,蛋白质选自羧肽酶、细胞因子、细胞外配体和转运蛋白、细胞外基质蛋白、葡糖苷酶、糖基转移酶、生长因子、生长因子结合蛋白、肝素结合蛋白、激素、水解酶、免疫球蛋白、异构酶、激酶、裂解酶、金属酶抑制剂、金属蛋白酶、乳蛋白、神经活性蛋白、蛋白酶、蛋白酶抑制剂、蛋白质磷酸酶、酯酶、转移酶和血管活性蛋白,其中所述羧肽酶选自ACE,ACE2,CNDP1,CPA1,CPA2,CPA4,CPA5,CPA6,CPB1,CPB2,CPE,CPN1,CPQ,CPXM1,CPZ和SCPEP1;其中所述细胞因子选自BMP1,BMP10,BMP15,BMP2,BMP3,BMP4,BMP5,BMP6,BMP7,BMP8A,BMP8B,C1QTNF4,CCL1,CCL11,CCL13,CCL14,CCL15,CCL16,CCL17,CCL18,CCL19,CCL2,CCL21,CCL22,CCL23,CCL24,CCL25,CCL26,CCL27,CCL28,CCL3,CCL3L1,CCL3L3,CCL4,CCL4L,CCL4L2,CCL5,CCL7,CCL8,CD40LG,CER1,CKLF,CLCF1,CNTF,CSF1,CSF2,CSF3,CTF1,CX3CL1,CXCL1,CXCL10,CXCL11,CXCL12,CXCL13,CXCL14,CXCL16,CXCL17,CXCL2,CXCL3,CXCL5,CXCL8,CXCL9,DKK1,DKK2,DKK3,DKK4,EDA,EBI3,FAM3B,FAM3C,FASLG,FLT3LG,GDF1,GDF10,GDF11,GDF15,GDF2,GDF3,GDF5,GDF6,GDF7,GDF9,GPI,GREM1,GREM2,GRN,IFNA1,IFNA13,IFNA10,IFNA14,IFNA16,IFNA17,IFNA2,IFNA21,IFNA4,IFNA5,IFNA6,IFNA7,IFNA8,IFNB1,IFNE,IFNG,IFNK,IFNL1,IFNL2,IFNL3,IFNL4,IFNW1,IL10,IL11,IL12A,IL12B,IL13,IL15,IL16,IL17A,IL17B,IL17C,IL17D,IL17F,IL18,IL19,IL1A,IL1B,IL1F10,IL2,IL20,IL21,IL22,IL23A,IL24,IL25,IL26,IL27,IL3,IL31,IL32,IL33,IL34,IL36A,IL36B,IL36G,IL36RN,IL37,IL4,IL5,IL6,IL7,IL9,LEFTY1,LEFTY2,LIF,LTA,MIF,MSTN,NAMPT,NODAL,OSM,PF4,PF4V1,SCGB3A1,SECTM1,SLURP1,SPP1,THNSL2,THPO,TNF,TNFSF10,TNFSF11,TNFSF12,TNFSF13,TNFSF13B,TNFSF14,TNFSF15,TSLP,VSTM1,WNT1,WNT10A,WNT10B,WNT11,WNT16,WNT2,WNT2B,WNT3,WNT3A,WNT4,WNT5A,WNT5B,WNT6,WNT7A,WNT7B,WNT8A,WNT8B,WNT9A,WNT9B,XCL1和XCL2;其中所述细胞外配体和转运蛋白选自APCS,CHI3L1,CHI3L2,CLEC3B,DMBT1,DMKN,EDDM3A,EDDM3B,EFNA4,EMC10,ENAM,EPYC,ERVH48-1,F13B,FCN1,FCN2,GLDN,GPLD1,HEG1,ITFG1,KAZALD1,KCP,LACRT,LEG1,METRN,NOTCH2NL,NPNT,OLFM1,OLFML3,PRB2,PSAP,PSAPL1,PSG1,PSG6,PSG9,PTX3,PTX4,RBP4,RNASE10,RNASE12,RNASE13,RNASE9,RSPRY1,RTBDN,S100A12,S100A13,S100A7,S100A8,SAA2,SAA4,SCG1,SCG2,SCG3,SCGB1C1,SCGB1C2,SCGB1D1,SCGB1D2,SCGB1D4,SCGB2B2,SCGB3A2,SCGN,SCRG1,SCUBE1,SCUBE2,SCUBE3,SDCBP,SELENOP,SFTA2,SFTA3,SFTPA1,SFTPA2,SFTPC,SFTPD,SHBG,SLURP2,SMOC1,SMOC2,SMR3A,SMR3B,SNCA,SPATA20,SPATA6,SOGA1,SPARC,SPARCL1,SPATA20,SPATA6,SRPX2,SSC4D,STX1A,SUSD4,SVBP,TCN1,TCN2,TCTN1,TF,TULP3,TFF2,TFF3,THSD7A,TINAG,TINAGL1,TMEFF2,TMEM25和VWC2L;其中所述细胞外基质蛋白选自ABI3BP,AGRN,CCBE1,CHL1,COL15A1,COL19A1,COLEC11,DMBT1,DRAXIN,EDIL3,ELN,EMID1,EMILIN1,EMILIN2,EMILIN3,EPDR1,FBLN1,FBLN2,FBLN5,FLRT1,FLRT2,FLRT3,FREM1,GLDN,IBSP,KERA,KIAA0100,KIRREL3,KRT10,LAMB2,MGP,RPTN,SBSPON,SDC1,SDC4,SEMA3A,SEMA3B,SEMA3C,SEMA3D,SEMA3E,SEMA3F,SEMA3G,SIGLEC1,SIGLEC10,SIGLEC6,SLIT1,SLIT2,SLIT3,SLITRK1,SNED1,SNORC,SPACA3,SPACA7,SPON1,SPON2,STATH,SVEP1,TECTA,TECTB,TNC,TNN,TNR和TNXB;其中所述葡糖苷酶选自AMY1A,AMY1B,AMY1C,AMY2A,AMY2B,CEMIP,CHIA,CHIT1,FUCA2,GLB1L,GLB1L2,HPSE,HYAL1,HYAL3,KL,LYG1,LYG2,LYZL1,LYZL2,MAN2B2,SMPD1,SMPDL3B,SPACA5和SPACA5B;其中所述糖基转移酶选自ART5,B4GALT1,EXTL2,GALNT1,GALNT2,GLT1D1,MGAT4A,ST3GAL1,ST3GAL2,ST3GAL3,ST3GAL4,ST6GAL1和XYLT1;其中所述生长因子选自AMH,ARTN,BTC,CDNF,CFC1,CFC1B,CHRDL1,CHRDL2,CLEC11A,CNMD,EFEMP1,EGF,EGFL6,EGFL7,EGFL8,EPGN,EREG,EYS,FGF1,FGF10,FGF16,FGF17,FGF18,FGF19,FGF2,FGF20,FGF21,FGF22,FGF23,FGF3,FGF4,FGF5,FGF6,FGF7,FGF8,FGF9,FRZB,GDNF,GFER,GKN1,HBEGF,HGF,IGF1,IGF2,INHA,INHBA,INHBB,INHBC,INHBE,INS,KITLG,MANF,MDK,MIA,NGF,NOV,NRG1,NRG2,NRG3,NRG4,NRTN,NTF3,NTF4,OGN,PDGFA,PDGFB,PDGFC,PDGFD,PGF,PROK1,PSPN,PTN,SDF1,SDF2,SFRP1,SFRP2,SFRP3,SFRP4,SFRP5,TDGF1,TFF1,TGFA,TGFB1,TGFB2,TGFB3,THBS4,TIMP1,VEGFA,VEGFB,VEGFC,VEGFD和WISP3;其中所述生长因子结合蛋白选自CHRD,CYR61,ESM1,FGFBP1,FGFBP2,FGFBP3,HTRA1,GHBP,IGFALS,IGFBP1,IGFBP2,IGFBP3,IGFBP4,IGFBP5,IGFBP6,IGFBP7,LTBP1,LTBP2,LTBP3,LTBP4,SOSTDC1,NOG,TWSG1和WIF1;其中所述肝素结合蛋白选自ADA2,ADAMTSL5,ANGPTL3,APOB,APOE,APOH,COL5A1,COMP,CTGF,FBLN7,FN1,FSTL1,HRG,LAMC2,LIPC,LIPG,LIPH,LIPI,LPL,PCOLCE2,POSTN,RSPO1,RSPO2,RSPO3,RSPO4,SAA1,SLIT2,SOST,THBS1和VTN;其中所述激素选自ADCYAP1,ADIPOQ,ADM,ADM2,ANGPTL8,APELA,APLN,AVP,C1QTNF12,C1QTNF9,CALCA,CALCB,CCK,CGA,CGB1,CGB2,CGB3,CGB5,CGB8,COPA,CORT,CRH,CSH1,CSH2,CSHL1,ENHO,EPO,ERFE,FBN1,FNDC5,FSHB,GAL,GAST,GCG,GH,GH1,GH2,GHRH,GHRL,GIP,GNRH1,GNRH2,GPHA2,GPHB5,IAPP,INS,INSL3,INSL4,INSL5,INSL6,LHB,METRNL,MLN,NPPA,NPPB,NPPC,OSTN,OXT,PMCH,PPY,PRL,PRLH,PTH,PTHLH,PYY,RETN,RETNLB,RLN1,RLN2,RLN3,SCT,SPX,SST,STC1,STC2,TG,TOR2A,TRH,TSHB,TTR,UCN,UCN2,UCN3,UTS2,UTS2B和VIP;其中所述水解酶选自AADACL2,ABHD15,ACP7,ACPP,ADA2,ADAMTSL1,AOAH,ARSF,ARSI,ARSJ,ARSK,BTD,CHI3L2,ENPP1,ENPP2,ENPP3,ENPP5,ENTPD5,ENTPD6,GBP1,GGH,GPLD1,HPSE,LIPC,LIPF,LIPG,LIPH,LIPI,LIPK,LIPM,LIPN,LPL,PGLYRP2,PLA1A,PLA2G10,PLA2G12A,PLA2G1B,PLA2G2A,PLA2G2D,PLA2G2E,PLA2G2F,PLA2G3,PLA2G5,PLA2G7,PNLIP,PNLIPRP2,PNLIPRP3,PON1,PON3,PPT1,SMPDL3A,THEM6,THSD1和THSD4;其中所述免疫球蛋白选自IGSF10,IGKV1-12,IGKV1-16,IGKV1-33,IGKV1-6,IGKV1D-12,IGKV1D-39,IGKV1D-8,IGKV2-30,IGKV2D-30,IGKV3-11,IGKV3D-20,IGKV5-2,IGLC1,IGLC2和IGLC3;其中所述异构酶选自NAXE,PPIA和PTGDS;其中所述激酶选自ADCK1,ADPGK,FAM20C,ICOS和PKDCC;其中所述裂解酶选自PM20D1,PAM和CA6;其中所述金属酶抑制剂选自FETUB,SPOCK3,TIMP2,TIMP3,TIMP4,WFIKKN1和WFIKKN2;其中所述金属蛋白酶选自ADAM12,ADAM28,ADAM9,ADAMDEC1,ADAMTS1,ADAMTS10,ADAMTS12,ADAMTS13,ADAMTS14,ADAMTS15,ADAMTS16,ADAMTS17,ADAMTS18,ADAMTS19,ADAMTS2,ADAMTS20,ADAMTS3,ADAMTS4,ADAMTS5,ADAMTS6,ADAMTS7,ADAMTS8,ADAMTS9,CLCA1,CLCA2,CLCA4,IDE,MEP1B,MMEL1,MMP1,MMP10,MMP11,MMP12,MMP13,MMP16,MMP17,MMP19,MMP2,MMP20,MMP21,MMP24,MMP25,MMP26,MMP28,MMP3,MMP7,MMP8,MMP9,PAPPA,PAPPA2,TLL1,和TLL2;其中所述乳蛋白选自CSN1S1,CSN2,CSN3和LALBA;其中所述神经活性蛋白选自CARTPT,NMS,NMU,NPB,NPFF,NPS,NPVF,NPW,NPY,PCSK1N,PDYN,PENK,PNOC,POMC,PROK2,PTH2,PYY2,PYY3,QRFP,TAC1和TAC3;其中所述蛋白酶选自ADAMTS6,C1R,C1RL,C2,CASP4,CELA1,CELA2A,CELA2B,CFB,CFD,CFI,CMA1,CORIN,CTRB1,CTRB2,CTSB,CTSD,DHH,F10,F11,F12,F2,F3,F7,F8,F9,FAP,FURIN,GZMA,GZMK,GZMM,HABP2,HGFAC,HTRA3,HTRA4,IHH,KLK10,KLK11,KLK12,KLK13,KLK14,KLK15,KLK3,KLK4,KLK5,KLK6,KLK7,KLK8,KLK9,KLKB1,MASP1,MASP2,MST1L,NAPSA,OVCH1,OVCH2,PCSK2,PCSK5,PCSK6,PCSK9,PGA3,PGA4,PGA5,PGC,PLAT,PLAU,PLG,PROC,PRSS1,PRSS12,PRSS2,PRSS22,PRSS23,PRSS27,PRSS29P,PRSS3,PRSS33,PRSS36,PRSS38,PRSS3P2,PRSS42,PRSS44,PRSS47,PRSS48,PRSS53,PRSS57,PRSS58,PRSS8,PRTN3,RELN,REN,TMPRSS11D,TMPRSS11E,TMPRSS2,TPSAB1,TPSB2和TPSD1;其中所述蛋白酶抑制剂选自A2M,A2ML1,AMBP,ANOS1,COL28A1,COL6A3,COL7A1,CPAMD8,CST1,CST2,CST3,CST4,CST5,CST6,CST7,CST8,CST9,CST9L,CST9LP1,CSTL1,EPPIN,GPC3,HMSD,ITIH1,ITIH2,ITIH3,ITIH4,ITIH5,ITIH6,KNG1,OPRPN,OVOS1,OVOS2,PAPLN,PI15,PI16,PI3,PZP,R3HDML,SERPINA1,SERPINA10,SERPINA11,SERPINA12,SERPINA13P,SERPINA3,SERPINA4,SERPINA5,SERPINA7,SERPINA9,SERPINB2,SERPINB5,SERPINC1,SERPINE1,SERPINE2,SERPINE3,SERPINF2,SERPING1,SERPINI1,SERPINI2,SPINK1,SPINK13,SPINK14,SPINK2,SPINK4,SPINK5,SPINK6,SPINK7,SPINK8,SPINK9,SPINT1,SPINT3,SPINT4,SPOCK1,SPOCK2,SPP2,SSPO,TFPI,TFPI2,WFDC1,WFDC10A,WFDC13,WFDC2,WFDC3,WFDC5,WFDC6,和WFDC8;其中所述蛋白质磷酸酶选自ACP7,ACPP,PTEN和PTPRZ1;其中所述酯酶选自BCHE,CEL,CES4A,CES5A,NOTUM和SIAE;其中所述转移酶选自METTL24,FKRP,CHSY1,CHST9和B3GAT1;其中所述血管活性蛋白选自AGGF1,AGT,ANGPT1,ANGPT2,ANGPTL4,ANGPTL6,EDN1,EDN2,EDN3和NTS。
在一个优选的实施方案中,蛋白质选自细胞因子;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;神经活性蛋白;和血管活性蛋白。
在一个优选的实施方案中,蛋白质选自细胞因子;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;神经活性蛋白和血管活性蛋白,其中所述细胞因子选自BMP1,BMP10,BMP15,BMP2,BMP3,BMP4,BMP5,BMP6,BMP7,BMP8A,BMP8B,C1QTNF4,CCL1,CCL11,CCL13,CCL14,CCL15,CCL16,CCL17,CCL18,CCL19,CCL2,CCL21,CCL22,CCL23,CCL24,CCL25,CCL26,CCL27,CCL28,CCL3,CCL3L1,CCL3L3,CCL4,CCL4L,CCL4L2,CCL5,CCL7,CCL8,CD40LG,CER1,CKLF,CLCF1,CNTF,CSF1,CSF2,CSF3,CTF1,CX3CL1,CXCL1,CXCL10,CXCL11,CXCL12,CXCL13,CXCL14,CXCL16,CXCL17,CXCL2,CXCL3,CXCL5,CXCL8,CXCL9,DKK1,DKK2,DKK3,DKK4,EDA,EBI3,FAM3B,FAM3C,FASLG,FLT3LG,GDF1,GDF10,GDF11,GDF15,GDF2,GDF3,GDF5,GDF6,GDF7,GDF9,GPI,GREM1,GREM2,GRN,IFNA1,IFNA13,IFNA10,IFNA14,IFNA16,IFNA17,IFNA2,IFNA21,IFNA4,IFNA5,IFNA6,IFNA7,IFNA8,IFNB1,IFNE,IFNG,IFNK,IFNL1,IFNL2,IFNL3,IFNL4,IFNW1,IL10,IL11,IL12A,IL12B,IL13,IL15,IL16,IL17A,IL17B,IL17C,IL17D,IL17F,IL18,IL19,IL1A,IL1B,IL1F10,IL2,IL20,IL21,IL22,IL23A,IL24,IL25,IL26,IL27,IL3,IL31,IL32,IL33,IL34,IL36A,IL36B,IL36G,IL36RN,IL37,IL4,IL5,IL6,IL7,IL9,LEFTY1,LEFTY2,LIF,LTA,MIF,MSTN,NAMPT,NODAL,OSM,PF4,PF4V1,SCGB3A1,SECTM1,SLURP1,SPP1,THNSL2,THPO,TNF,TNFSF10,TNFSF11,TNFSF12,TNFSF13,TNFSF13B,TNFSF14,TNFSF15,TSLP,VSTM1,WNT1,WNT10A,WNT10B,WNT11,WNT16,WNT2,WNT2B,WNT3,WNT3A,WNT4,WNT5A,WNT5B,WNT6,WNT7A,WNT7B,WNT8A,WNT8B,WNT9A,WNT9B,XCL1和XCL2;其中所述生长因子选自AMH,ARTN,BTC,CDNF,CFC1,CFC1B,CHRDL1,CHRDL2,CLEC11A,CNMD,EFEMP1,EGF,EGFL6,EGFL7,EGFL8,EPGN,EREG,EYS,FGF1,FGF10,FGF16,FGF17,FGF18,FGF19,FGF2,FGF20,FGF21,FGF22,FGF23,FGF3,FGF4,FGF5,FGF6,FGF7,FGF8,FGF9,FRZB,GDNF,GFER,GKN1,HBEGF,HGF,IGF1,IGF2,INHA,INHBA,INHBB,INHBC,INHBE,INS,KITLG,MANF,MDK,MIA,NGF,NOV,NRG1,NRG2,NRG3,NRG4,NRTN,NTF3,NTF4,OGN,PDGFA,PDGFB,PDGFC,PDGFD,PGF,PROK1,PSPN,PTN,SDF1,SDF2,SFRP1,SFRP2,SFRP3,SFRP4,SFRP5,TDGF1,TFF1,TGFA,TGFB1,TGFB2,TGFB3,THBS4,TIMP1,VEGFA,VEGFB,VEGFC,VEGFD和WISP3;其中所述生长因子结合蛋白选自CHRD,CYR61,ESM1,FGFBP1,FGFBP2,FGFBP3,HTRA1,GHBP,IGFALS,IGFBP1,IGFBP2,IGFBP3,IGFBP4,IGFBP5,IGFBP6,IGFBP7,LTBP1,LTBP2,LTBP3,LTBP4,SOSTDC1,NOG,TWSG1和WIF1;其中所述肝素结合蛋白选自ADA2,ADAMTSL5,ANGPTL3,APOB,APOE,APOH,COL5A1,COMP,CTGF,FBLN7,FN1,FSTL1,HRG,LAMC2,LIPC,LIPG,LIPH,LIPI,LPL,PCOLCE2,POSTN,RSPO1,RSPO2,RSPO3,RSPO4,SAA1,SLIT2,SOST,THBS1和VTN;其中所述激素选自ADCYAP1,ADIPOQ,ADM,ADM2,ANGPTL8,APELA,APLN,AVP,C1QTNF12,C1QTNF9,CALCA,CALCB,CCK,CGA,CGB1,CGB2,CGB3,CGB5,CGB8,COPA,CORT,CRH,CSH1,CSH2,CSHL1,ENHO,EPO,ERFE,FBN1,FNDC5,FSHB,GAL,GAST,GCG,GH,GH1,GH2,GHRH,GHRL,GIP,GNRH1,GNRH2,GPHA2,GPHB5,IAPP,INS,INSL3,INSL4,INSL5,INSL6,LHB,METRNL,MLN,NPPA,NPPB,NPPC,OSTN,OXT,PMCH,PPY,PRL,PRLH,PTH,PTHLH,PYY,RETN,RETNLB,RLN1,RLN2,RLN3,SCT,SPX,SST,STC1,STC2,TG,TOR2A,TRH,TSHB,TTR,UCN,UCN2,UCN3,UTS2,UTS2B和VIP;其中所述神经活性蛋白选自CARTPT,NMS,NMU,NPB,NPFF,NPS,NPVF,NPW,NPY,PCSK1N,PDYN,PENK,PNOC,POMC,PROK2,PTH2,PYY2,PYY3,QRFP,TAC1,和TAC3;其中所述血管活性蛋白选自AGGF1,AGT,ANGPT1,ANGPT2,ANGPTL4,ANGPTL6,EDN1,EDN2,EDN3和NTS。
在甚至更优选的实施方案中,蛋白质选自细胞因子;生长因子;激素和神经活性蛋白质。
在本发明的一个具体的实施方案中,蛋白质选自细胞因子;生长因子;激素和神经活性蛋白质,其中所述细胞因子选自BMP1,BMP10,BMP15,BMP2,BMP3,BMP4,BMP5,BMP6,BMP7,BMP8A,BMP8B,C1QTNF4,CCL1,CCL11,CCL13,CCL14,CCL15,CCL16,CCL17,CCL18,CCL19,CCL2,CCL21,CCL22,CCL23,CCL24,CCL25,CCL26,CCL27,CCL28,CCL3,CCL3L1,CCL3L3,CCL4,CCL4L,CCL4L2,CCL5,CCL7,CCL8,CD40LG,CER1,CKLF,CLCF1,CNTF,CSF1,CSF2,CSF3,CTF1,CX3CL1,CXCL1,CXCL10,CXCL11,CXCL12,CXCL13,CXCL14,CXCL16,CXCL17,CXCL2,CXCL3,CXCL5,CXCL8,CXCL9,DKK1,DKK2,DKK3,DKK4,EDA,EBI3,FAM3B,FAM3C,FASLG,FLT3LG,GDF1,GDF10,GDF11,GDF15,GDF2,GDF3,GDF5,GDF6,GDF7,GDF9,GPI,GREM1,GREM2,GRN,IFNA1,IFNA13,IFNA10,IFNA14,IFNA16,IFNA17,IFNA2,IFNA21,IFNA4,IFNA5,IFNA6,IFNA7,IFNA8,IFNB1,IFNE,IFNG,IFNK,IFNL1,IFNL2,IFNL3,IFNL4,IFNW1,IL10,IL11,IL12A,IL12B,IL13,IL15,IL16,IL17A,IL17B,IL17C,IL17D,IL17F,IL18,IL19,IL1A,IL1B,IL1F10,IL2,IL20,IL21,IL22,IL23A,IL24,IL25,IL26,IL27,IL3,IL31,IL32,IL33,IL34,IL36A,IL36B,IL36G,IL36RN,IL37,IL4,IL5,IL6,IL7,IL9,LEFTY1,LEFTY2,LIF,LTA,MIF,MSTN,NAMPT,NODAL,OSM,PF4,PF4V1,SCGB3A1,SECTM1,SLURP1,SPP1,THNSL2,THPO,TNF,TNFSF10,TNFSF11,TNFSF12,TNFSF13,TNFSF13B,TNFSF14,TNFSF15,TSLP,VSTM1,WNT1,WNT10A,WNT10B,WNT11,WNT16,WNT2,WNT2B,WNT3,WNT3A,WNT4,WNT5A,WNT5B,WNT6,WNT7A,WNT7B,WNT8A,WNT8B,WNT9A,WNT9B,XCL1和XCL2;所述生长因子选自AMH,ARTN,BTC,CDNF,CFC1,CFC1B,CHRDL1,CHRDL2,CLEC11A,CNMD,EFEMP1,EGF,EGFL6,EGFL7,EGFL8,EPGN,EREG,EYS,FGF1,FGF10,FGF16,FGF17,FGF18,FGF19,FGF2,FGF20,FGF21,FGF22,FGF23,FGF3,FGF4,FGF5,FGF6,FGF7,FGF8,FGF9,FRZB,GDNF,GFER,GKN1,HBEGF,HGF,IGF1,IGF2,INHA,INHBA,INHBB,INHBC,INHBE,INS,KITLG,MANF,MDK,MIA,NGF,NOV,NRG1,NRG2,NRG3,NRG4,NRTN,NTF3,NTF4,OGN,PDGFA,PDGFB,PDGFC,PDGFD,PGF,PROK1,PSPN,PTN,SDF1,SDF2,SFRP1,SFRP2,SFRP3,SFRP4,SFRP5,TDGF1,TFF1,TGFA,TGFB1,TGFB2,TGFB3,THBS4,TIMP1,VEGFA,VEGFB,VEGFC,VEGFD和WISP3;所述激素选自ADCYAP1,ADIPOQ,ADM,ADM2,ANGPTL8,APELA,APLN,AVP,C1QTNF12,C1QTNF9,CALCA,CALCB,CCK,CGA,CGB1,CGB2,CGB3,CGB5,CGB8,COPA,CORT,CRH,CSH1,CSH2,CSHL1,ENHO,EPO,ERFE,FBN1,FNDC5,FSHB,GAL,GAST,GCG,GH,GH1,GH2,GHRH,GHRL,GIP,GNRH1,GNRH2,GPHA2,GPHB5,IAPP,INS,INSL3,INSL4,INSL5,INSL6,LHB,METRNL,MLN,NPPA,NPPB,NPPC,OSTN,OXT,PMCH,PPY,PRL,PRLH,PTH,PTHLH,PYY,RETN,RETNLB,RLN1,RLN2,RLN3,SCT,SPX,SST,STC1,STC2,TG,TOR2A,TRH,TSHB,TTR,UCN,UCN2,UCN3,UTS2,UTS2B和VIP;所述神经活性蛋白选自CARTPT,NMS,NMU,NPB,NPFF,NPS,NPVF,NPW,NPY,PCSK1N,PDYN,PENK,PNOC,POMC,PROK2,PTH2,PYY2,PYY3,QRFP,TAC1和TAC3。
在本发明的另一个具体实施方案中,蛋白质选自细胞因子、生长因子、激素和神经活性蛋白,其中所述细胞因子选自BMP-2、BMP-4、CNTF、MSTN、IFNG、IL6、SPP1;其中所述生长因子选自EGF、FGF1、GDNF、IGF1、IGF2、NTF3、TGFB1;其中所述激素选自EPO、FBN1、GH、GHRH、OSTN、UCN;其中所述神经活性蛋白选自NPFF、NPY、PNOC、POMC。
在本发明的另一个具体实施方案中,蛋白质选自细胞因子、生长因子、激素和神经活性蛋白,其中所述细胞因子选自BMP-2、BMP-4、CNTF、MSTN、IFNG、IL4、IL6、IL10、SPP1;其中所述生长因子选自EGF、FGF1、GDNF、IGF1、IGF2、NTF3、TGFB1;其中所述激素选自EPO、FBN1、GH、GHRH、OSTN、UCN、INS;其中所述神经活性蛋白选自NPFF、NPY、PNOC、POMC。
在本发明的一个更具体的实施方案中,蛋白质选自生长因子。在本发明的一个甚至更具体的实施方案中,蛋白质选自生长因子,其中所述生长因子选自AMH,ARTN,BDNF,BTC,CDNF,CFC1,CFC1B,CHRDL1,CHRDL2,CLEC11A,CNMD,EFEMP1,EGF,EGFL6,EGFL7,EGFL8,EPGN,EREG,EYS,FGF1,FGF10,FGF16,FGF17,FGF18,FGF19,FGF2,FGF20,FGF21,FGF22,FGF23,FGF3,FGF4,FGF5,FGF6,FGF7,FGF8,FGF9,FRZB,GDNF,GFER,GKN1,HBEGF,HGF,IGF1,IGF2,INHA,INHBA,INHBB,INHBC,INHBE,INS,KITLG,MANF,MDK,MIA,NGF,NOV,NRG1,NRG2,NRG3,NRG4,NRTN,NTF3,NTF4,OGN,PDGFA,PDGFB,PDGFC,PDGFD,PGF,PROK1,PSPN,PTN,SDF1,SDF2,SFRP1,SFRP2,SFRP3,SFRP4,SFRP5,TDGF1,TFF1,TGFA,TGFB1,TGFB2,TGFB3,THBS4,TIMP1,VEGFA,VEGFB,VEGFC,VEGFD和WISP3。
在本发明的另一个更具体的实施方案中,蛋白质选自生长因子,其中所述生长因子选自EGF、FGF1、GDNF、IGF1、IGF2、NTF3、TGFB1。最特别地,蛋白质是IGF1,优选人IGF1。
在本发明甚至更具体的实施方案中,蛋白质选自细胞因子、生长因子和激素,其中优选地,所述细胞因子选自BMP-2、BMP-4、CNTF、MSTN、IFNG、IL4、IL6、IL10、SPP1;所述生长因子选自EGF、FGF1、GDNF、IGF1、IGF2、NTF3、TGFB1;所述激素选自EPO、FBN1、GH、GHRH、OSTN、UCN、INS。最具体地,蛋白质选自胰岛素生长因子1(IGF1)、胰岛素(INS)、***(EPO)、白细胞介素4(IL-4)和白细胞介素10(IL-10)。
在本发明的一个实施方案中,mRNA是裸mRNA。在一个优选的实施方案中,mRNA包含抗反向(antireverse)CAP类似物,例如m7G(5')G、m7GpppG帽、内部核糖体进入位点(IRES)和/或3'末端的polyA尾,特别是为了改善翻译。mRNA可以进一步具有技术人员已知的促进翻译的区域。
在本发明的一个优选实施方案中,mRNA包含修饰和未修饰核苷酸的组合。在一个更优选的实施方案中,在这样的修饰mRNA中,1至100%、优选10至100%、更优选50至100%、甚至更优选90至100%、最优选100%的尿苷核苷酸被修饰。含腺苷、鸟苷和胞苷的核苷酸可以是未修饰的或部分修饰的,并且它们优选地以未修饰的形式存在。优选地,mRNA中修饰的尿苷核苷酸的含量在5至25%的范围内。在本发明的一个特别优选的实施方案中,修饰的尿苷核苷酸是N1-甲基假尿苷。在本发明的一个更特别优选的实施方案中,mRNA包含修饰和未修饰核苷酸的组合,其中在这样的修饰的mRNA中1至100%、优选10至100%、更优选50至100%、甚至更优选90至100%、最优选100%的尿苷核苷酸是N1-甲基假尿苷。
在本发明的一个更优选的实施方案中,mRNA是密码子优化的mRNA,并且含有修饰和未修饰核苷酸的组合。在一个更优选的实施方案中,在这样的修饰mRNA中,1至100%、优选10至100%、更优选50至100%、甚至更优选90至100%、最优选100%的尿苷核苷酸被修饰。含腺苷、鸟苷和胞苷的核苷酸可以是未修饰的或部分修饰的,并且它们优选地以未修饰的形式存在。优选地,mRNA中修饰的尿苷核苷酸的含量在5至25%的范围内。在本发明的一个特别优选的实施方案中,修饰的尿苷核苷酸是N1-甲基假尿苷。在本发明的一个更特别优选的实施方案中,RNA是包含修饰和未修饰核苷酸的组合的mRNA,其中在这样的修饰的mRNA中1至100%、优选10至100%、更优选50至100%、甚至更优选90至100%、最优选100%的尿苷核苷酸是N1-甲基假尿苷。
在本发明的一个优选实施方案中,mRNA包含编码作为蛋白质的人***1(IGF1)的核酸序列,更优选地,mRNA是裸mRNA,其包含编码作为蛋白质的人***1(IGF1)的核酸序列。在本发明的该优选实施方案中,mRNA包含编码成熟人IGF-1的核酸序列。
在本发明的一个更优选的实施方案中,mRNA包含编码IGF1前肽(优选人IGF1前肽)的核酸序列,和编码IGF1成熟蛋白(优选人IGF1成熟蛋白)的核酸序列,并且不包含编码IGF1的E-肽的核酸序列,优选不包含编码人IGF1的E-肽的核酸序列。
在本发明的另一个更优选的实施方案中,mRNA包含编码IGF1前肽(优选人IGF1前肽)的核酸序列,编码IGF1成熟蛋白(优选人IGF1成熟蛋白)的核酸序列。优选地,mRNA不包含编码IGF1的E-肽的核酸序列,更优选地不包含编码人IGF1的E-肽的核酸序列。在本发明的另一个更优选的实施方案中,mRNA包含编码IGF1前肽(优选人IGF1前肽)的核酸序列,编码IGF1成熟蛋白(优选人IGF1成熟蛋白)的核酸序列和编码脑源性神经营养因子(BDNF)信号肽的核酸序列。优选地,mRNA不包含编码IGF1的E-肽的核酸序列,更优选地不包含编码人IGF1的E-肽的核酸序列。
在本发明的一个更优选的实施方案中,mRNA包含编码IGF1的前肽(也称为前结构域)(优选具有27个氨基酸的人IGF1的前肽)的核苷酸序列,和编码成熟IGF1(优选地具有70个氨基酸的成熟人IGF1)的核苷酸序列,优选不包含编码IGF1的E-肽的核苷酸序列,优选不包含编码人IGF1的E-肽的核酸序列。
在本发明的另一个更优选的实施方案中,mRNA包含编码IGF1的前肽(也称为前结构域)(优选具有27个氨基酸的人IGF1的前肽)的核苷酸序列、编码成熟IGF1(优选地具有70个氨基酸的成熟人IGF1)的核苷酸序列,和编码脑源性神经营养因子(BDNF)的信号肽的核酸序列。优选地,mRNA不包含编码IGF1的E-肽的核苷酸序列,更优选地不包含编码人IGF1的E-肽的核酸序列。
在本发明的一个特别优选的实施方案中,mRNA包含编码具有27个氨基酸的人IGF1的前肽(也称为前结构域)的核酸序列,和编码具有70个氨基酸的成熟人IGF1的核苷酸序列,优选地不包含编码人IGF1的E-肽(也称为E-结构域)的核苷酸序列,其中编码具有27个氨基酸的人IGF1的前肽(也称为前结构域)的核苷酸序列,以及编码具有70个氨基酸的成熟人IGF1的核苷酸序列和编码E-肽的核苷酸序列分别为Uniprot数据库中的UniProtKB-P05019、Genbank数据库中的NM_000618.4、NM_001111285.2和NM_001111283.2。
在本发明的一个更特别优选的实施方案中,mRNA包含编码具有如SEQ ID No:38所示的27个氨基酸的人IGF1前肽(也称为前结构域)的核酸序列,和编码具有如SEQ ID No:39所示的70个氨基酸的成熟人IGF1的核苷酸序列,并且优选地不包含编码人IGF1的E-肽(也称为E-结构域)的核苷酸序列。
在本发明的一个更特别优选的实施方案中,mRNA包含编码具有如SEQ ID No:38所示的27个氨基酸的人IGF1前肽(也称为前结构域)的核酸序列、编码具有如SEQ ID No:39所示的70个氨基酸的成熟人IGF1的核苷酸序列,和编码脑源性神经营养因子(BDNF)信号肽的核酸序列,优选编码如SEQ ID No:30所示的脑源性神经营养因子(BDNF)信号肽的核苷酸序列,优选地,mRNA不包含编码人IGF1的E-肽(也称为E-结构域)的核苷酸序列。
在本发明的一个特别优选的实施方案中,包含编码人***1(IGF1)和脑源性神经营养因子(BDNF)的信号肽的核酸序列的mRNA包含如SEQ ID NO:8所示的核酸序列。
在本发明的另一个更特别优选的实施方案中,包含编码人***1(IGF1)和脑源性神经营养因子(BDNF)的信号肽的核酸序列的mRNA包含从SEQ ID No:7所示的DNA序列转录的核酸序列,优选地,核酸序列从SEQ ID NO:7所示的DNA序列体外转录。
在本发明的一个更特别优选的实施方案中,包含编码人***1(IGF1)和脑源性神经营养因子(BDNF)的信号肽的核酸序列的mRNA包含如SEQ ID NO:8所示的核酸序列,其中优选1至100%,更优选50至100%,甚至更优选90至100%,最优选100%的尿苷核苷酸是N1-甲基假尿苷。
在本发明的另一个更特别优选的实施方案中,包含编码人***1(IGF1)和脑源性神经营养因子(BDNF)的信号肽的核酸序列的mRNA包含从SEQ ID No:7所示的DNA序列转录的核酸序列,其中优选1至100%,更优选50至100%,甚至更优选90至100%,最优选100%的尿苷核苷酸是N1-甲基假尿苷。在该实施方案中,核苷酸序列优选从如SEQID NO:7所示的DNA序列体外转录,而作为尿苷核苷酸,仅N1-甲基假尿苷-5'-三磷酸(N1-甲基假-UTP)即,100%N1-甲基假-UTP用于从SEQ ID NO:7所示的DNA序列转录。
在本发明的一个优选实施方案中,脑源性神经营养因子(BDNF)的信号肽是人BDNF的信号肽,更优选是SEQ ID No:31所示的信号肽,特别是由如SEQ ID NO:30所示的核酸序列编码的人BDNF的信号肽。
在本发明的一个更优选的实施方案中,mRNA包含核酸序列,其按以下从5'到3'的顺序编码:
i)脑源性神经营养因子(BDNF)的信号肽;
ii)可选地,蛋白质的前结构域;和
iii)成熟蛋白。
在本发明的一个甚至更优选的实施方案中,mRNA包含核酸序列,其按以下从5'到3'的顺序编码:
i)脑源性神经营养因子(BDNF)的信号肽;
ii)可选地,人IGF的前结构域;和
iii)成熟人IGF。
在本发明的一个优选实施方案中,脑源性神经营养因子(BDNF)的信号肽代替蛋白质的天然信号肽。
在进一步的方面,本发明提供了包含核酸的转录单元、表达载体或基因治疗载体,所述核酸编码蛋白质和信号肽,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽选自
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
在进一步的方面,本发明提供了包含核酸序列的转录单元、表达载体或基因治疗载体,所述核酸序列编码蛋白质和与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质不是氧化还原酶,优选地,不是硫氧还蛋白,更优选地,不是杆细胞来源视锥细胞活性因子。关于脑源性神经营养因子(BDNF)的信号肽和蛋白质,与本文别处已经阐述的相同。
在进一步的方面,本发明提供了包含核酸序列的转录单元、表达载体或基因治疗载体,所述核酸序列编码蛋白质和与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质选自羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶;免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白。关于脑源性神经营养因子(BDNF)的信号肽和蛋白质,与本文别处已经阐述的相同。
在进一步的方面,本发明提供了一种治疗组合物,其包含如上所述的mRNA和/或转录单元、表达载体或基因治疗载体。关于脑源性神经营养因子(BDNF)的信号肽和蛋白质,与本文别处已经阐述的相同。通常本发明的mRNA作为治疗组合物提供,其优选为液体组合物。液体组合物是其中mRNA存在于液体溶液中的任何组合物。在本发明的一个实施方案中,将mRNA溶解在水或缓冲或未缓冲的水性溶液中。溶液优选为水性溶液。因此,液体可以是水,优选无菌水,更优选“注射用水”(WFI)或任何其他缓冲或未缓冲的水性溶液。在本发明的一个实施方案中,液体组合物是未缓冲的溶液,优选盐溶液,更优选药学上可接受的盐的盐溶液,甚至更优选NaCl溶液,即盐水。优选地,盐溶液是等渗的,甚至更优选其显示生理pH值。在本发明的一个优选实施方案中,含有mRNA的溶液是缓冲的溶液。优选地,这种溶液与血液是等渗的。原则上,可以使用在生理范围内,特别是在pH3.0至10.5,更优选pH4.0至9.0范围内的有效缓冲的任何缓冲液。优选的缓冲液是醋酸盐、磷酸盐、磷酸盐缓冲盐水(PBS)、碳酸盐、乳酸盐和柠檬酸盐缓冲液或林格氏溶液,优选磷酸盐缓冲盐水(PBS)。因此,在本发明更优选的实施方案中,其中含有mRNA的溶液是磷酸盐缓冲盐水(PBS)。
治疗组合物中mRNA的浓度不是特别关键,可以根据需要进行调整。优选地,浓度在0.05至20.0μg/μl的范围内,更优选在0.1至10.0μg/μl的范围内,甚至更优选在0.2至5μg/l的范围内,特别是在0.4至2.0μg/μl的范围内,更特别地是在0.6至1.5μg/μl的范围内,甚至更特别地在0.80至1.20μg/μl的范围内。特别优选的是在0.01μg至0.1g的范围内,优选0.1μg至0.01g、更优选0.5μg至1mg、甚至更优选0.5μg至10μg的范围。
在进一步的方面,本发明提供了一种试剂盒,其包含上述mRNA、和/或转录单元、表达载体、或基因治疗载体、或治疗组合物,以及说明书,任选地载体图,任选地宿主细胞,任选地用于培养宿主细胞的培养基,和/或任选地用于选择和培养转染的宿主细胞的选择培养基。本发明的试剂盒可以在内容物试剂盒中提供,(或以)内容物试剂盒的形式提供。该试剂盒还可以包含本发明的治疗组合物的一种或多种组分,例如,在一个或多个单独的容器中。例如,试剂盒可以包含mRNA(例如干燥形式)、增溶剂和(缓冲或未缓冲的)水性溶液,例如,分别在一个、两个或三个(或更多个)单独的容器中。该试剂盒还可以包括说明书或说明插页。
在进一步的方面,本发明提供了上述mRNA、转录单元、表达载体或基因治疗载体、治疗组合物或试剂盒,用作药物。关于信号肽,例如脑源性神经营养因子(BDNF)的信号肽和蛋白质,与本文别处已经阐述的相同。
在进一步的方面中,本发明提供了mRNA或包含或含有mRNA的治疗组合物,其用于治疗骨骼肌损伤的方法中。本发明还提供了mRNA或包含或含有mRNA的治疗组合物在制备用于治疗受试者的骨骼肌损伤的药物中的用途。
本发明还提供了治疗受试者骨骼肌损伤的方法,所述方法包括向受试者施用mRNA或包含或含有mRNA的治疗组合物。
骨骼肌损伤,例如肌肉断裂是运动中最常见的损伤之一,其频率在所有持续损伤中占10-55%不等。肌肉损伤可能是由离心肌肉收缩、伸长和肌肉超负荷引起的。所有运动相关损伤中超过90%是由离心肌肉收缩、伸长或肌肉超负荷引起的。当肌肉受到突然的、沉重的压力(例如直接打击)时,就会发生骨骼肌损伤。在肌肉断裂中,肌肉受到过度的离心张力,导致肌纤维过度紧张,从而导致它们在肌腱连接处(MTJ)附近断裂。肌肉断裂是医生治疗的最常见的诉求之一,占所有运动相关伤害的大部分。腘绳肌复合体(hamstring musclecomplex,HMC)的损伤通常会影响运动员参加以下运动:所述运动在跑步时强制快速加速和减速并需要离心肌肉收缩。轻度损伤可以容易地通过保守治疗处理,更具破坏性的损伤是腘绳肌完全断裂。腘绳肌断裂是保守治疗还是手术治疗,这取决于它们是如何分类的。有轻度、中度或重度断裂。虽然轻度至中度断裂可以保守治疗,但重度断裂是手术治疗的明确指征。保守治疗是由临床表现决定的,立即开始冷冻疗法、加压绷带、固定和非甾体抗炎药、以及之后的弹性绷带治疗,并在患者感到舒适后进行物理治疗。治疗性超声作为一种治疗选择被广泛讨论,但没有发现对最终的再生结果有显著影响。在2周内,疼痛应该明显减轻,以便可以增加物理治疗,包括如上所述的积极锻炼。然而,该领域公认手术干预并非没有风险,必须谨慎选择候选人(TA,TL,M,V,Vaittinen S,Kalimo H,M(2007)Muscle injuries:optimising recovery.BestPract Res Clin Rheumatol 21(2):317-331.DOI:10.1016/j.berh.2006.12.004;HorstK,Dienstknecht T,Sellei RM,Pape HC(2014)Partial rupture of the hamstringmuscle complex:a literature review on treatment options.Eur JOrthop SurgTraumatol 24(3):285-9.DOI:10.1007/s00590-013-1315-x)。目前的治疗选择几乎没有提供超出身体自身愈合过程的(效益),事实上,非甾体抗炎药(NSAID)可能损害愈合过程。由于目前没有有效的药物疗法,未满足的医疗需求很高。尤其需要提供治疗骨骼肌损伤的有效方法,其加速恢复过程并导致受伤肌肉功能的增加。
在本发明的一个优选实施方案中,用于治疗骨骼肌损伤的方法中的mRNA是编码生长因子的mRNA,优选是编码人***1(IGF1)的mRNA。编码生长因子的mRNA通常包含编码信号肽的核酸序列,任选地包含编码生长因子前肽的核酸序列和编码成熟生长因子的核酸序列。编码人IGF1的mRNA优选地包含编码信号肽的核酸序列,任选地包含编码人IGF1前肽的核酸序列和编码成熟人IGF1的核酸序列,甚至更优选地包含编码信号肽的核酸序列、编码人IGF1前肽的核酸序列和编码成熟人IGF1的核酸序列,并且不包含编码人IGF1的E-肽的核酸序列。编码生长因子的mRNA包含的信号肽可以是与生长因子同源的信号肽,即生长因子的信号肽,或可以是与生长因子异源的信号肽,并且优选地是与生长因子异源的信号肽,更优选地是脑源性神经营养因子(BDNF)的信号肽,特别是人BDNF的信号肽。编码人IGF1的mRNA包含的信号肽可以是与人IGF1同源的信号肽,即人IGF1的信号肽,或可以是与人IGF1异源的信号肽,并且优选地是与人IGF1异源的信号肽,更优选地是脑源性神经营养因子(BDNF)的信号肽,特别是人BDNF的信号肽。
因此,在本发明的一个更优选的实施方案中,用于治疗骨骼肌损伤的方法的mRNA是编码人***1(IGF1)的mRNA,其包含编码脑源性神经营养因子(BDNF)的信号肽的核酸序列,特别是包含编码人BDNF的信号肽的核酸序列,任选地包含编码人IGF1前肽的核酸序列和编码成熟人IGF-1的核酸序列。在本发明的一个甚至更优选的实施方案中,用于治疗骨骼肌损伤的方法的mRNA是编码人***1(IGF1)的mRNA,其包含编码脑源性神经营养因子(BDNF)的信号肽的核酸序列,特别是包含编码人BDNF的信号肽的核酸序列,任选地包含编码人IGF1前肽的核酸序列和编码成熟人IGF-1的核酸序列,并且其不包含编码人IGF1的E-肽的核酸序列。
因此,在一个进一步的方面,本发明提供了包含核酸序列的mRNA,所述核酸序列编码
i)IGF1,优选人IGF1;和
ii)脑源性神经营养因子(BDNF)的信号肽,优选人BDNF的信号肽,用于治疗骨骼肌损伤的方法中。
本发明还提供了包含核酸序列的mRNA用于制备治疗受试者骨骼肌损伤的药物中的用途,所述核酸序列编码:
i)IGF1,优选人IGF1;和
ii)脑源性神经营养因子(BDNF)的信号肽,优选人BDNF的信号肽。
本发明还提供了一种治疗受试者骨骼肌损伤的方法,所述方法包括向受试者施用包含核酸序列的mRNA,所述核酸序列编码:
i)IGF1,优选人IGF1;和
ii)脑源性神经营养因子(BDNF)的信号肽,优选人BDNF的信号肽。
优选地,本发明提供了包含核酸序列的mRNA,所述核酸序列编码
i)成熟的IGF1,优选成熟的人IGF1;
ii)任选地,IGF1的前结构域,优选人IGF1的前结构域;
iii)脑源性神经营养因子(BDNF)的信号肽,优选人BDNF的信号肽,用于治疗骨骼肌损伤的方法中。
本发明还提供了包含核酸序列的mRNA用于制备治疗受试者骨骼肌损伤的药物中的用途,所述核酸序列编码:
i)成熟的IGF1,优选成熟的人IGF1;
ii)任选地,IGF1的前结构域,优选人IGF1的前结构域;
iii)脑源性神经营养因子(BDNF)的信号肽,优选人BDNF的信号肽。
本发明还提供了一种治疗受试者骨骼肌损伤的方法,所述方法包括向受试者施用包含核酸序列的mRNA,所述核酸序列编码:
i)成熟的IGF1,优选成熟的人IGF1;
ii)任选地,IGF1的前结构域,优选人IGF1的前结构域;
iii)脑源性神经营养因子(BDNF)的信号肽,优选人BDNF的信号肽。
关于用于治疗骨骼肌损伤的方法中的包含编码人***1(IGF1)和脑源性神经营养因子(BDNF)信号肽的核酸序列的mRNA,与本文别处已经阐述的相同。在本发明的一个特别优选的实施方案中,包含编码人***1(IGF1)和脑源性神经营养因子(BDNF)的信号肽的核酸序列的mRNA包含如SEQ ID NO:8所示的核酸序列。在本发明的另一个更特别优选的实施方案中,包含编码人***1(IGF1)和脑源性神经营养因子(BDNF)的信号肽的核酸序列的mRNA包含从SEQ ID No:7所示的DNA序列转录的核酸序列。优选地,核酸序列从SEQ ID NO:7所示的DNA序列体外转录。
可以通过本领域技术人员已知的方式,优选通过注射,更优选通过肌内注射,通常通过使用带针的注射器,将mRNA和/或治疗组合物应用于细胞和组织,例如骨骼肌。原则上,任何市售的与针头组合的注射器均可用于此目的。优选的是皮下注射针。针的直径由针规(G;根据Stub针规)表示。通常,可以使用7G(最大)到33G(最小)的医用针头。
在一些实施方案中,mRNA和/或治疗组合物可通过直接DNA转移递送至细胞(Wolff等人(1990)Science 247,1465-1468)。mRNA和/或治疗组合物可在细胞膜轻度机械破坏、使细胞暂时透化后递送至细胞。这种对膜的轻度机械破坏可以通过轻轻地迫使细胞通过小孔来实现(Sharei等人PLOS ONE(2015)10(4),e0118803)。在另一个实施方案中,可以通过脂质体介导的DNA转移将mRNA和/或治疗组合物递送至细胞(例如,Gao&Huang(1991)Biochem.Ciophys.Res.Comm.179,280-285,Crystal(1995)Nature Med.1,15-17,Caplen等人(1995)Nature Med.3,39-46)。术语“脂质体”可以包括通过产生包封的脂质双层或聚集体而形成的各种单层和多层脂质载体。mRNA可以被包裹在脂质体的水性内部,散布在脂质体的脂质双层内,通过连接分子(所述连接分子与脂质体和寡核苷酸结合)与脂质体连接,捕获在脂质体中,或与脂质体复合。
在本发明的一个实施方案中,RNA或治疗组合物以治疗剂的形式直接施用到骨骼肌中(优选通过注射),所述治疗剂的形式即液体组合物,其中包含作为裸RNA的RNA。关于施用方式以及组合物和其中所含RNA的特性,与本文别处已经阐述的相同。在一个优选的实施方案中,本发明的液体组合物和mRNA分别被直接施用到骨骼肌中。在这情况下,最优选的施用方式是注射,即肌内注射。
原则上,在本发明的上下文中设想尽可能早地,即在骨骼肌损伤的最早可能阶段,分别施用mRNA和治疗组合物。例如,这个阶段是一旦已经观察到一种或多种第一症状(例如疼痛)后。然而,诊断之后的任何可能的时间点都是可能的和值得的,因此,根据本发明都是可以设想的。例如,在手术干预的情况下(例如在肌肉断裂之后),可以在手术干预期间但至少在手术干预之后不久,分别施用mRNA和治疗组合物。
在一个实施方案中,分别在骨骼肌再生的炎症期间、或甚至之前,以及在早期增殖期,分别施用mRNA和治疗组合物。例如,可以在损伤后第0天至第10天,优选在第0天至第7天期间施用。更具体地,可以在损伤后第0、1、2、3、4、5、6或7天施用。优选地,在损伤后第1天并且甚至更优选地在损伤后第0天施用。在优选的实施方案中,在所述骨骼肌损伤之后的炎症期之前施用治疗组合物。特别优选地,在损伤后第1天施用,并在损伤后第4天重复施用。
例如,根据待治疗损伤的进程,可以重复至少一次,但优选多次(例如,3至5次)进行根据本发明的mRNA和治疗组合物的分别施用。重复施用可以在第1、2、3、4、5、6、7、8或9天之后,优选地在第2、3、4、5、6、7天之后,更优选地在第3、4或5天之后进行。重复施用可以是每几周(例如每1、2、3或4周)至每几天(例如每1、2、3、4、5或6天)施用,优选每2天或3天施用。
本发明的mRNA或治疗组合物可以以合适的剂量施用于患者。给药方案可由主治医师确定,例如基于临床因素。如医学领域众所周知的,任何一名患者的剂量取决于许多因素,包括患者的块头、体表面积、年龄、待施用的具体化合物、性别、施用时间和途径、总体健康状况、和同时施用的其他药物。然而,技术人员/主治医师容易地推导出施用的活性物质的(治疗上的)有效浓度和/或剂量,例如在体内或离体施用的活性物质的(治疗上的)有效浓度和/或剂量。相应的样品可以取自例如骨骼肌(例如通过合适的探针),在所述样品中可以检测活性化合物(裸RNA)以及其相应浓度,例如通过HPLC确定。
活性物质(例如mRNA)的典型剂量可以是,例如在1ng至几克的范围内,优选在0.1μg至1g的范围内,优选在1μg至0.1g的范围内,更优选地在10μg至1mg的范围内,甚至更优选在15μg至0.5mg的范围内,最优选在20μg至100μg的范围内。特别优选地是在0.01μg至0.1g的范围内,优选0.1μg至0.01g、更优选0.5μg至1mg、甚至更优选0.5μg至10μg。这尤其适用于人患者。应用(m)RNA治疗时,用于表达的(m)RNA的剂量应对应于该范围;然而,原则上也可以设想低于或高于该示例性范围的剂量,尤其是考虑到上述因素。通常,作为治疗组合物常规施用的方案应在每天每公斤体重0.1μg至10mg单位的范围内,优选在1μg至1mg单位的范围内,更优选在10μg至0.1mg单位的范围内。同样,这尤其适用于人患者。可以通过定期评估来监测进程。剂量可以变化,但是作为本发明液体组合物的组分的(m)RNAs,通过注射施用的优选剂量是每次注射大约105至1015个拷贝的(m)RNA分子。同样,这尤其适用于人患者。
特别地,设想将本发明的治疗组合物施用于患者,优选施用于人患者/人。然而,也可以在非人动物受试者/患者中治疗(或预防)本文描述的骨骼肌损伤,例如宠物(例如狗、猫、兔、大鼠和小鼠)、牛(例如牛、猪、羊)、马(例如赛马)或小马、骆驼(例如赛骆驼)或鸟(例如鸡、火鸡、鹦鹉)。
特别地,包含mRNA的治疗组合物在损伤、疾患和/或疾病(例如骨骼肌损伤)的愈合过程中具有治疗活性。
在本发明的一个更特别优选的实施方案中,用作药物的编码***1(IGF1)的mRNA包含从SEQ ID NO:7的DNA序列转录的核酸序列。在本发明甚至更特别优选的实施方案中,用作药物的编码***1(IGF1)的mRNA包含SEQ ID NO:8的核酸序列。
本发明的任何治疗组合物可以与说明书或说明书插页一起提供。说明书/插页可以包括针对技术人员/主治医师的指导,指导其如何根据本发明治疗(或预防)如本文所述的疾病或病患(骨骼肌损伤)。特别地,说明书/插页可以包括指导,该指导分别关于本文所述的递送/施用方式和递送/施用方案(例如递送/施用途径、剂量方案、递送/施用时间、递送/施用频率)。特别地,说明书/插页可以包括说明,该说明分别说明注射mRNA和/或制备用于注射到骨骼肌中的mRNA。说明书/插页可以进一步包括说明,该说明分别说明制备用于在骨骼肌损伤后的炎症期间施用的mRNA。原则上,本文其他地方分别关于递送/施用方式和递送/施用方案所述的内容可作为相应说明包含在说明书/插页中。
实施例
实施例1方法和材料
IGF1的克隆和信号肽的替换
IGF1是在内质网中合成并通过高尔基体分泌的70个氨基酸的多肽,其以自分泌和旁分泌方式作为细胞外生长因子发挥作用。为了确保mRNA诱导的IGF1从转染细胞中正确表达和分泌,mRNA序列包括人IGF1的天然N-末端预先-前-序列(pre-pro-IGF1)。该序列由编码具有21个氨基酸的人IGF1预先结构域(信号肽)的序列(核苷酸1-63)和编码具有27个氨基酸的人前结构域的序列(核苷酸64-144)组成。此外,该构建体包含编码具有70个氨基酸的成熟人IGF1的完整编码序列的序列(核苷酸145-354)。在Cpd.2-7中,预先结构域(信号肽,核苷酸1-63)被IGF2、ALB、BDNF、CXCL12或合成的信号肽1或2的各预先结构域替换。没有向构建体添加C-末端E-结构域。总之,克隆载体包含人pre-pro-IGF1 DNA且没有E-肽信息的拷贝,并被定义为Cpd.1,而Cpds.2-7包含替代的预先结构域(信号肽)。图1显示了由其预先结构域、前结构域和编码结构域编码的IGF1的DNA和RNA序列。图2显示了由IGF2预先结构域、其前结构域和编码结构域编码的IGF1的DNA和RNA序列。图3显示了由ALB预先结构域和其前结构域和编码结构域编码的IGF1的DNA和RNA序列。图4显示了由BDNF预先结构域和其前结构域和编码结构域编码的IGF1的DNA和RNA序列。图5显示了由CXCL12预先结构域和其前结构域和编码结构域编码的IGF1的DNA和RNA序列。图6显示了由合成的信号肽1预先结构域和其前结构域和编码结构域编码的IGF1的DNA和RNA序列。图7显示了由合成的信号肽2预先结构域和其前结构域和编码结构域编码的IGF1的DNA和RNA序列。图8显示了pVAX.A120载体(www.thermofisher.com),其中具有Cpd.1***。图9显示了pMA-T载体(www.thermofisher.com),其中具有Cpd.2***。图10显示了pMA-T载体,其中具有Cpd.3***。图11显示了pMA-T载体,其中具有Cpd.4***。图12显示了pMA-T载体,其中具有Cpd.5***。图13显示了pMA-RQ载体(www.thermofisher.com),其中具有Cpd.6***。图14显示了pMA-RQ载体(www.thermofisher.com),其中具有Cpd.6***。图15显示了用于扩增Cpd.2-7的引物。图16通过指示预先结构域和载体的基因名称、UniProt编号、DNA和氨基酸序列,总结了不同预先结构域的标识。对于Cpd.6和Cpd.7,不存在基因名称,因为其是人工的预先结构域。通过使用(ThermoFischer,MA)进行了Cpds.1-7的DNA和mRNA序列的密码子优化。
由GeneArt(www.thermofisher.com,ThermoFischer,MA)合成pre-pro-IGF1DNA序列的开放阅读框,其具有BamHI和EcoRI限制性位点,并使用相同的限制酶亚克隆到pVAX1.A120载体中。整个载体的DNA序列见图8。克隆的***方向和碱基序列通过几个克隆的Sanger测序得到证实。选择成功的克隆作为体外转录(IVT)mRNA生产的模板。对于替代的预先结构域变体Cpd.2-Cpd.7,pMA-T(图9-12)和pMA-RQ(图13-14)载体用作IVT的模板。所有IVT反应都产生具有相同polyA120尾的mRNA。
替换Cpd.8-Cpd.39mRNA中的信号肽。
在Cpd.8-26和Cpd.39中,IGF1(即Cpd.1)的预先结构域(信号肽,核苷酸1-63)被LTBP2(Cpd.8;Uniprot ID:Q14767)、IGFALS(Cpd.9;Uniprot ID:P35858)、INS(Cpd.10;Uniprot ID:P01308),)、Epo(Cpd.11;Uniprot ID:P01588)、CSF3(Cpd.12;Uniprot ID:P09919)、NGF(Cpd.13;Uniprot ID:P01138)、FGF5(Cpd.14;Uniprot ID:P12034)、FHR2(Cpd.15;Uniprot ID:P36980)、IBP5(Cpd.16;Uniprot ID:P24593)、NTF3(Cpd.17;UniprotID:P20783)、PATE2(Cpd.18;Uniprot ID:Q6UY27)、SOD3(Cpd.19;Uniprot ID:P08294)的各预先结构域、GLR(Cpd.20;Uniprot ID:P47871)的部分编码序列、IGF1(Cpd.21;UniprotID:P05019)的修饰的预先结构域序列、IGF2(Cpd.22;Uniprot ID:P01344)的修饰的预先结构域序列、CXCL12(Cpd.23;Uniprot ID:P48061)的修饰的预先结构域序列、BDNF(Cpd.24;Uniprot ID:P23560)的修饰的预先结构域序列、IGF1(Cpd.25;Uniprot ID:P05019)的修饰的前结构域序列、ALPI(Cpd.39;Uniprot ID:P09923)的修饰的前结构域序列、INS(Cpd.26;Uniprot ID:P01308)的修饰的预先结构域序列替换。与Cpd.1类似地,上述所有特定的化合物均不具有E-肽。通过使用(ThermoFischer,MA)进行了Cpd.8-26和Cpd的DNA和mRNA序列的密码子优化。
Cpd.27由编码具有27个氨基酸的人***(Epo;Uniprot ID:P01588)的预先结构域(信号肽)的序列(核苷酸1-81)和编码具有166个氨基酸的人***的编码链的序列(核苷酸82-498)组成。在Cpd.28和Cpd.29中,Epo的预先结构域(信号肽,核苷酸1-81)被Epo(Uniprot ID:P01588)的修饰的预先结构域序列和BDNF(Uniprot ID:P23560)的预先结构域序列替换。通过使用(ThermoFischer,MA)进行Cpds27-29的DNA和mRNA序列的密码子优化。
Cpd.30由编码具有24个氨基酸的人胰岛素(INS;Uniprot ID:P01308)的预先结构域(信号肽)的序列(核苷酸1-72)、和编码具有30个氨基酸的B-链结构域的序列(核苷酸73-162)、和编码具有31个氨基酸的连接肽(C-肽)结构域的序列(核苷酸163-255)、和编码具有21个氨基酸的A-链结构域的序列(核苷酸256-330)组成。在Cpd.31和Cpd.32中,INS的预先结构域(信号肽,核苷酸1-72)被INS(Uniprot ID:P01308)的修饰的预先结构域序列和BDNF(Uniprot ID:P23560)的预先结构域序列替换。通过使用(ThermoFischer,MA)进行了Cpd.30-32的DNA和mRNA序列的密码子优化。
Cpd.33由编码具有24个氨基酸的人白细胞介素4(IL-4;Uniprot ID:P05112)的预先结构域(信号肽)的序列(核苷酸1-72)、和编码具有129个氨基酸的编码链结构域的序列(核苷酸73-387)组成。在Cpd.34和Cpd.35中,IL-4的预先结构域(信号肽,核苷酸1-72)被IL-4(Uniprot ID:P05112)的修饰的预先结构域序列和FGF5(Uniprot ID:P01308)的预先结构域序列替换。通过使用(ThermoFischer,MA)进行Cpd.33-35的DNA和mRNA序列的密码子优化。
Cpd.36由编码具有24个氨基酸的人白细胞介素10(IL-10;Uniprot ID:P22301)的预先结构域(信号肽)的序列(核苷酸1-54)、和编码具有160个氨基酸的编码链结构域的序列(核苷酸55-534)组成。在Cpd.37和Cpd.38中,IL-10的预先结构域(信号肽,核苷酸1-54)被IL-10(Uniprot ID:P22301)的修饰的预先结构域序列和BDNF(Uniprot ID:P23560)的预先结构域序列替换。通过使用(ThermoFischer,MA)进行了Cpd.36-38的DNA和mRNA序列的密码子优化。
在下表1中显示了Cpd.1-39的信号肽的氨基酸序列和DNA序列以及各Cpd.1-39的RNA序列和DNA序列和载体。
表1:Cpd.1-39的信号肽的氨基酸序列和DNA序列以及Cpd.1-39的RNA序列和DNA序列和载体
Cpd.1至Cpd.7mRNA的体外转录(IVT)
含有Cpd.1(SEQ ID No.15)的pVAX.A120载体也具有T7启动子和长度为120bp的poly-A尾,并且使用Xho I酶将载体在poly-A尾的下游线性化,然后在体外转录(IVT)生成mRNA。对于pMA-T和pMA-RQ载体,使用同源引物对(SEQI ID No:22和23)基于PCR生成IVT-mRNA(图15)。反向引物含有120bp的poly-A,以便在成熟的mRNA中包含poly-A尾。通过MEGAscript T7试剂盒(www.ambion.com)中的T7 RNA聚合酶进行IVT,线性化的质粒和PCR扩增子用作IVT的模板。产生的所有mRNA均在5'端具有抗反向CAP类似物(ARCA;[m7G(5’)G]),并用100%N1-甲基假尿苷-UTP(www.trilink.com)进行化学修饰。使用MEGAclear试剂盒(www.ambion.com)纯化体外转录的mRNA,并在Agilent 2100生物分析仪(www.agilent.com)中使用RNA 6000Nano试剂盒分析质量和浓度。
Cpd.1和Cpd.8至Cpd.39mRNA的体外转录(IVT)
对于编码Cpd.1(SEQ ID No.40;在亚克隆至pVAX.A120载体之前)和Cpd.8至Cpd.39的pMA-T和pMA-RQ载体,使用同源引物对(SEQI ID No:22和23)进行基于PCR的IVT-mRNA生成(图15)。反向引物含有120bp的poly-A,以便在成熟的mRNA中包含poly-A尾。通过MEGAscript T7试剂盒(www.ambion.com)中的T7 RNA聚合酶进行IVT,PCR扩增子用作IVT的模板。产生的所有mRNA均在5'端具有抗反向CAP类似物(ARCA;[m7G(5’)G]),并用100%N1-甲基假尿苷-UTP(www.trilink.com)进行化学修饰。使用MEGAclear试剂盒(www.ambion.com)纯化体外转录的mRNA,并使用RNA琼脂糖凝胶电泳分析质量和浓度。
HEK293T、C2C12和HepG2细胞的体外转染
人胚胎肾细胞293(HEK293T;ATCC,CRL-1573,Rockville,MD,USA)维持在Dulbecco's Modified Eagle's培养基(DMEM,www.biochrom.com)中,其中补充有10%(v/v)胎牛血清(FBS),以及青霉素-链霉素-两性霉素B的混合物(882087,Biozym,Oldendorf,德国)。将细胞以7,000-20,000个细胞/孔接种在96孔培养板中,并在转染前在37℃下在含有5%CO2的潮湿气氛中孵育24小时。细胞在含有10%FBS且不含抗生素的DMEM生长培养基中生长,以在转染前达到<60%的汇合度。
人肝癌细胞系HepG2(Cat#85011430,ECACC UK)在37℃、在含有5%CO2的潮湿气氛中、在含有10%胎牛血清和青霉素-链霉素-两性霉素B的混合物(882087,Biozym,Oldendorf,德国)的Dulbecco's Modified Eagle's培养基(DMEM)中生长。HepG2细胞每2天和每5天分别以1:2和1:4的***比进行传代培养。在转染前24小时,将细胞以20,000-40,000个细胞/孔的密度铺板到96孔微量滴定板中。细胞在含有10%FBS且不含抗生素的DMEM生长培养基中生长,以在转染前达到30-40%的汇合度。
小鼠成肌细胞系C2C12(ATCC,CRL-1772,Rockville,MD,USA)在37℃、在含有5%CO2的潮湿气氛中、在含有10%胎牛血清和青霉素-链霉素-两性霉素B的混合物(882087,Biozym,Oldendorf,德国)的Dulbecco's Modified Eagle's培养基(DMEM)中生长。C2C12细胞每2天和每5天分别以1:2和1:4的***比进行传代培养。在转染前24小时,将细胞以20,000个细胞/孔的密度铺板到96孔微量滴定板中。细胞在含有2%FBS且不含抗生素的DMEM生长培养基中生长,以在转染前达到80-90%的汇合度。
此后,按照制造商的说明书,使用Lipofectamine 2000(www.invitrogen.com)用0.3μg的不同mRNA变体转染细胞。移除100μl DMEM,并用50μl Opti-MEM和50μl含有mRNA和Lipofectamine 2000复合物的Opti-MEM(www.thermofisher.com)代替。5小时后,将培养基更换为新鲜培养基,并将板在37℃下在含有5%CO2的潮湿气氛中孵育24小时。
HSkMC细胞的体外转染
HSkMC细胞以每96孔40.000个细胞的密度铺板在微量滴定板上的SkM生长培养基(PromoCell,Heidelberg,Germany)中。细胞在37℃孵育箱和5%CO2的潮湿气氛中生长1天,至>90%的汇合度。在转染当天,使用Lipofectamin 2000(www.invitrogen.com)、用2μg的不同mRNA变体(Cpd.1或4)处理细胞。因此,移除100μl培养基,并添加在OPTIMEM培养基(www.thermofisher.com)中的1μl Lipofectamin/孔和2μg mRNA/孔。然后将细胞在37℃和5%CO2的潮湿气氛中孵育24小时。
IMR32细胞的体外转染
转染前24小时,将高加索人神经母细胞瘤IMR32细胞(Cat#86041809,ECACC,UK)以每孔60,000个细胞的密度铺板在96预包被的BRAND微量滴定板(Cat#782082)中的MinimumEssential Medium Eagle(EMEM,Bioconcept Cat#1-31S01-I,www.bioconcept.ch)中,其中补充有10%(v/v)热灭活胎牛血清(FBS)、L-谷氨酰胺(2mM)和非必需氨基酸(NEAA,1x)。细胞在37℃下在含有5%CO2的潮湿气氛中过夜生长。按照制造商的说明书,使用JetMessenger(www.polyplus-transfection.com),用0.3μg mRNA构建体转染细胞。简而言之,通过每0.1μg mRNA构建体混合0.25μl JetMessenger试剂形成mRNA/JetMessenger复合物。在室温下孵育15分钟后,将JetMessenger复合物以10μl加入,转染5小时后,将培养基/mRNA/JetMessenger从孔中移除,并替换为新鲜的100μl生长培养基,并将板在37℃下、在含有5%CO2的潮湿气氛中孵育24小时。
A549细胞的体外转染
人肺癌细胞系(Sigma-Aldrich,Buchs Switzerland cat#6012804)维持在补充有10%FBS(Thermofischer,Basel,Switzerland cat#10500-064)的Dulbecco'sModifiedEagle's的高葡萄糖培养基(DMEM,Sigma-Aldrich,Buchs Switzerland cat#D0822)中。转染前24小时,将A549细胞以10,000个细胞/孔的密度铺板在常规生长培养基中。此后,按照制造商的说明书,使用Lipofectamine 2000(www.invitrogen.com),用不同的mRNA(0.3-0.6μg)转染细胞。移除100μl DMEM。将50μl Opti-MEM(www.thermofisher.com)添加到每孔中,然后加入50μl含有mRNA和Lipofectamine 2000复合物的Opti-MEM。培养5小时后,将培养基更换为新鲜培养基,并将板在37℃下在含有5%CO2的潮湿气氛中孵育24小时。
THP-1细胞的体外转染
人单核细胞白血病细胞系THP-1(Sigma-Aldrich,Buchs Switzerland,Cat.#88081201)维持在补充有10%FBS和2mM谷氨酰胺的生长培养基(RPMI1640)中。在转染前72小时,将细胞以30,000个THP-1细胞接种在96孔细胞培养板中,并用在生长培养基中稀释的50nM佛波醇12-肉豆蔻酸酯13-醋酸酯(PMA)(Sigma-Aldrich,Buchs Switzerland,Cat.#P8139)活化。使用Lipofectamine 2000(www.thermofisher.com),用(300-600ng/孔)mRNA转染细胞,移除100μl DMEM。将50μl Opti-MEM(www.thermofisher.com)添加到每孔中,然后加入50μl含有mRNA和Lipofectamine 2000复合物的Opti-MEM。5小时后,将培养基替换为补充有50nM PMA的新鲜生长培养基,并将板在37℃下在含有5%CO2的潮湿气氛中孵育24小时。
大鼠原代脊髓神经元
使用CO2深度麻醉和颈椎脱位处死妊娠14天的怀孕雌性野生型Wistar大鼠(Janvier labs,France)或SOD1G93A Sprague Dawley大鼠(Taconic Bioscience)。将胎儿从子宫中取出并立即置于冰冷的Leibovitz培养基中,其中补充有2%青霉素(10,000U/mL)和链霉素(10mg/mL)溶液(PS)和1%牛血清白蛋白(BSA)。解剖脊髓,并在37℃下用0.05%胰蛋白酶-0.02%EDTA处理20分钟。通过添加补充有4.5g/l葡萄糖、0.5mg/mL DNAase I和II以及10%胎牛血清(FCS)的Dulbecco’s modified Eagle’s培养基(DMEM)来停止解离。使细胞3次强制通过10mL移液管尖端,进行机械分离。此外,将细胞在4℃下以515g离心10分钟。将所得沉淀重新悬浮在由神经基础培养基组成的限定培养基中,所述神经基础培养基含有2%B27补充剂溶液、2mmol/l谷氨酰胺、2%PS溶液和10ng/ml脑源性神经营养因子(BDNF)。将细胞以20,000个细胞每孔接种在96孔聚-D-赖氨酸预包被的板中,并在37℃下在含有5%CO2的潮湿气氛中培养。每两天更换一次培养基。在培养11-12天后,按照制造商的说明书使用JetMessenger(www.polyplus-transfection.com)转染mRNA构建体(0.3g)。
人分化的软骨细胞的体外转染。
人关节软骨软骨细胞(Sigma/Cell Applications,Buchs,Switzerland Cat.#402-05A)维持在软骨细胞生长培养基(Sigma Aldrich,Buchs,witzerland Cat#411-500)中。细胞在37℃下在含有5%CO2的潮湿气氛中孵育。通过使细胞在分化培养基(SigmaAldrich,Buchs,Switzreland Cat.#A411D-250)中在海藻酸盐珠上生长最少3周而使其分化。对于海藻酸盐珠的制备,每4x106软骨细胞使用1ml 1.2%无菌海藻酸盐溶液(0.9%NaCl中的1.2%Alginate Sigma Aldrich,Buchs Switzerland Cat.#A-2033)。将细胞重新悬浮在相应体积的1.2%海藻酸盐溶液中,并通过22号针逐滴分配到6孔未处理的细胞培养板中的100mM CaCl2溶液中。15分钟后,聚合珠用0.9%NaCl洗涤5次,用分化培养基洗涤2次。软骨细胞/海藻酸盐珠在37℃下在含有5%CO2的潮湿气氛中孵育最少3周,以分化,每两天更换一次培养基。转染前24小时,通过用0.9%NaCl洗涤2次并在海藻酸盐溶解缓冲液(55mM柠檬酸钠、150mM NaCl、30mM EDTA pH6.8)中孵育约5分钟,从海藻酸盐珠中释放分化的软骨细胞。用0.9%NaCl洗涤细胞2次。将每孔30,000个细胞接种在96孔TPP板(SigmaAldrich,Buchs,Switzerland Cat.#92096)的100μl生长培养基中,并过夜生长。按照制造商的说明书,使用JetMessenger(www.polyplus-transfection.com),用0.6μg mRNA构建体转染细胞。一式四份添加10μl mRNA/JetMessenger复合物。通过每0.1μgmRNA构建体混合0.25μl JetMessenger试剂,形成mRNA/JetMessenger复合物,并在室温下孵育15分钟。转染后5小时后,从孔中移除转染复合物(培养基/mRNA/JetMessenger)并替换为100μl生长培养基。将板在37℃下在含有5%CO2的潮湿气氛中孵育24小时。
细胞培养上清液中蛋白质水平的分析
转染后24小时,收集转染细胞的上清液,冷冻并在20℃下储存,直至根据制造商的说明书通过ELISA定量分析:IGF1(Cat.#E20,Mediagnost,Reutlingen,Germany)、***(EPO;Cat.#BMS2035,ThermoFisher,Basel,Switzerland)、胰岛素(INS,Cat.#RAB0327,Sigma-Aldrich,Buchs,Switzerland)、白细胞介素4(IL-4,Cat.#88-7046-22,ThermoFisher,Basel,Switzreland)和白细胞介素10(IL-10,Cat.#KIT 10947SinoBiological,China)。在用相应的ELISA缓冲液稀释后分析细胞上清液。
数据分析
为了评估标准品或样品中的蛋白质(IGF1、EPO、INS、IL-4、IL-10)水平,从标准品或样品的平均吸光度中减去空白的平均吸光度值。根据制造商的方案,使用四参数非线性回归生成并绘制标准曲线。为了确定每个样品中蛋白质(IGF1、EPO、INS、IL-4、IL-10)的浓度,从标准曲线内插不同蛋白质的浓度。通过乘以稀释因子来计算样品的最终蛋白质浓度。所有计算均使用GraphPad Prism8(San Diego,USA)进行。为了表示与内源性信号肽构建体相比的增加倍数,将各个构建体产生的蛋白质水平除以相同浓度的内源性信号肽构建体产生的蛋白质水平。
结果
IGF1的克隆
通过Sanger测序证实了所有***成功克隆到pVAX.A120中。所有测试的克隆都导致IGF1***的正确方向,序列准确度为100%。选择阳性克隆用于IVT生成mRNA。
Cpd.1-39的平均疏水性和极性
Cpd.1-39的信号肽氨基酸序列的N-末端氨基酸1-9、氨基酸1-7和氨基酸1-5以及C-末端的最后九个氨基酸的平均疏水性,以及Cpd.1-39的N-末端氨基酸1-9的平均极性如下表2-5所示。
表2:Cpd.1-39的信号肽氨基酸序列的N-末端氨基酸1-18和C-末端最后9个氨基酸的平均疏水性和极性,以及Cpd.1-39的信号肽N-末端的氨基酸1-9的平均极性
表3:Cpd.1-39的信号肽氨基酸序列的N-末端氨基酸1-18以及C-末端的最后九个氨基酸的平均疏水性和极性,以及Cpd.1-39的信号肽N-末端氨基酸1-9的平均极性(续)
表4:Cpd.1-39的信号肽氨基酸序列的N-末端氨基酸1-13以及C-末端的最后九个氨基酸的平均疏水性和极性,以及Cpd.1-39的信号肽N-末端的氨基酸1-7的平均极性
表5:Cpd.1-39的信号肽氨基酸序列的N-末端氨基酸1-9和C-末端最后9个氨基酸的平均疏水性和极性,以及Cpd.1-39的信号肽N-末端的氨基酸1-5的平均极性
mRNA的体外转录
用Xho I将IGF1_pVAX.A120质粒线性化,使用IVT***生成IGF1mRNA(Cpd.1)。类似地,使用基于PCR的IVT生成范围50-200μg的具有改变的预先结构域(信号肽,在载体pMA-T和pMA-RQ中编码的Cpd.2-Cpd.7)的IGF1 mRNA(图16),用于体外转染实验。同样,对于在pMA-T和pMA-RQ载体中编码的Cpd.1(SEQ ID No.40)和Cpd.8-26,使用基于PCR的IVT生成范围50-200μg的具有改变的信号肽的IGF1 mRNA,用于体外转染实验。除了IGF1mRNA,还生成了50-200μg具有内源性或改变的信号肽的***(EPO,Cpd.27-29)、胰岛素(INS,Cpd.30-32)、白细胞介素4(IL4,Cpd.33-35)和白细胞介素10(IL10,Cpd.36-38)的mRNA,用于体外转染实验。
体外转染HEK293T细胞以检测IGF1分泌
HEK293T细胞与Cpd.1-Cpd.7mRNA孵育24小时后,评估细胞培养物上清液中分泌的IGF1水平(图17)。Cpd.1能够诱导高达50ng/ml的IGF1分泌。Cpd.4诱导的IGF1分泌显著高于Cpd.1(3.3倍,0.001)。为了评估Cpd.1和Cpd.4的浓度依赖性,测试了不同浓度的Cpd.1和Cpd.4(0.02-2μg/孔)诱导IGF1分泌到上清液中(图18)。Cpd.1显示EC50为0.89μg,Cpd.4的EC50为0.13μg,表明Cpd.4在诱导HEK293T细胞分泌IGF1方面的效力高6.8倍。总之,图17和18的数据表明,Cpd.4比Cpd.1更强和更有效地在HEK293T细胞中诱导IGF1分泌,表明该信号肽促进在该细胞类型中产生的IGF1离开细胞。
体外转染C2C12细胞以测试IGF1分泌
C2C12细胞与Cpd.1-Cpd.7mRNA孵育24小时后,评估细胞培养物上清液中分泌的IGF1水平(图19)。Cpd.1能够诱导高达60ng/ml的IGF1分泌。Cpd.4诱导的IGF1分泌显著高于Cpd.1(6.1倍,0.001)。数据表明,Cpd.4比Cpd.1更强地在C2C12细胞中诱导IGF1分泌,表明该信号肽也促进在该细胞类型中产生的IGF1离开细胞。
体外转染HSkMC细胞以测试IGF1分泌
HSkMC细胞与Cpd.1或Cpd.4mRNA孵育24小时后,评估细胞培养物上清液中分泌的IGF1水平(图20)。Cpd.1能够诱导高达30ng/ml的IGF1分泌。Cpd.4诱导的IGF1分泌显著高于Cpd.1(3.1倍,P<0.05)。数据表明,Cpd.4比Cpd.1更强地在原代HSkMC细胞中诱导IGF1分泌,表明该信号肽也促进在该细胞类型中产生的IGF1离开细胞。
在HEK293T细胞中体外转染其他mRNA以检测IGF1分泌
在另一组测试中,分析了Cpd.8-Cpd.26调节HEK293T细胞分泌IGF1的潜力。与作为对照的Cpd.1和作为测试mRNA的Cpd.8-26孵育24小时后,评估细胞培养物上清液中分泌的IGF1水平(图22)。Cpd.1响应标准化为1,数据表示为Cpd.1的倍数变化。Cpd.8、Cpd.9、Cpd.10、Cpd.11、Cpd.12和Cpd13显示IGF1的分泌降低,而Cpd.14、Cpd.15、Cpd.16、Cpd.17、Cpd.18、Cpd.19、Cpd.20、Cpd.21、Cpd.23、Cpd.24、Cpd.25和Cpd.26与Cpd.1相比,能够诱导显著更高的IGF1分泌,高达2.6倍。其中,Cpd.15和Cpd.21显示出与Cpd.4相似的诱导(见图17)。总之,数据表明Cpd.14、Cpd.15、Cpd.16、Cpd.17、Cpd.18、Cpd.19、Cpd.20、Cpd.21、Cpd.23、Cpd.24、Cpd.25和Cpd.26比Cpd.1更强和更有效地在HEK293T细胞中诱导IGF1分泌,表明这些信号肽促进在该细胞类型中产生的IGF1离开细胞。
体外转染HepG2细胞以测试IGF1分泌
HepG2细胞与作为对照的Cpd.1和作为测试mRNA的Cpd.4-26孵育24小时后,评估细胞培养物上清液中分泌的IGF1水平(图23)。Cpd.1响应标准化为1,数据表示为Cpd.1的倍数变化。其中Cpd.8、Cpd.9和Cpd.12显示IGF1的分泌降低,而Cpd.4、Cpd.14、Cpd.15、Cpd.16、Cpd.17、Cpd.18、Cpd.19、Cpd.20、Cpd.21、Cpd.22、Cpd.23、Cpd.24、Cpd.25和Cpd.26与Cpd.1相比,能够诱导显著更高的IGF1分泌,高达8.3倍。总之,数据表明Cpd.4、Cpd.14、Cpd.15、Cpd.16、Cpd.17、Cpd.18、Cpd.19、Cpd.20、Cpd.21、Cpd.22、Cpd.23、Cpd.24、Cpd.25和Cpd.26比Cpd.1更强地在HepG2细胞中诱导IGF1分泌,表明这些信号肽促进在该细胞类型中产生的IGF1离开细胞。
体外转染IMR32神经细胞以测试IGF1分泌
IMR324神经细胞与作为对照的Cpd.1和作为测试mRNA的Cpd.4-24孵育24小时后,评估细胞培养物上清液中分泌的IGF1水平(图24)。Cpd.1响应标准化为1,数据表示为Cpd.1的倍数变化。Cpd.4、Cpd.14、Cpd.15、Cpd.16、Cpd.17、Cpd.20、Cpd.22、Cpd.23和Cpd.24与Cpd.1相比,能够诱导显著更高的IGF1分泌,高达2.6倍。总之,数据表明Cpd.4、Cpd.14、Cpd.15、Cpd.16、Cpd.17、Cpd.20、Cpd.22、Cpd.23和Cpd.24比Cpd.1更强地在IMR32神经细胞中诱导IGF1分泌,表明这些信号肽促进在该细胞类型中产生的IGF1离开细胞。
体外转染人软骨细胞以测试IGF1分泌
软骨细胞与作为对照的Cpd.1和作为测试mRNA的Cpd.4-25孵育24小时后,评估细胞培养物上清液中分泌的IGF1水平(图25)。Cpd.1响应标准化为1,数据表示为Cpd.1的倍数变化。Cpd.4、Cpd.14、Cpd.15、Cpd.16、Cpd.20、Cpd.21、Cpd.22、Cpd.24和Cpd.25与Cpd.1相比,能够诱导显著更高的IGF1分泌,高达1.9倍。总之,数据表明Cpd.4、Cpd.14、Cpd.15、Cpd.16、Cpd.20、Cpd.21、Cpd.22、Cpd.24和Cpd.25比Cpd.1更强地在软骨细胞中诱导IGF1分泌,表明这些信号肽促进在该细胞类型中产生的IGF1离开细胞。
体外转染大鼠运动神经元以测试IGF1分泌
将大鼠运动神经元或大鼠转基因SOD1G93A(图26B)与作为对照的Cpd.1和作为测试mRNA的Cpd.4、Cpd.14和Cpd.17(用于野生型)(图26A)或Cpd.14和Cpd.17(用于转基因SOD1G93A)(图26B)孵育48小时后,评估细胞培养物上清液中分泌的IGF1水平(图26A和B)。Cpd.1响应标准化为1,数据表示为Cpd.1的倍数变化。Cpd.4、Cpd.14和Cpd.17与Cpd.1相比,能够在野生型中诱导高达4.3倍的IGF1分泌,在转基因SOD1GS93A中诱导高达9.3倍的IGF1分泌。总之,数据表明Cpd.4、Cpd.14和Cpd.17比Cpd.1更强地在运动神经元中诱导IGF1分泌,表明这些信号肽促进在该细胞类型中产生的IGF1离开细胞。
体外转染HEK293T、HepG2和A549细胞以检测EPO分泌
HEK293T、HepG2或A549细胞与作为对照的Cpd.27和作为测试mRNA的Cpd.28和Cpd.29孵育24小时后,评估细胞培养物上清液中分泌的***(EPO)水平(图27)。Cpd.27响应标准化为1,数据表示为Cpd.27的倍数变化。Cpd.28与Cpd.27相比,能够在HEK293T细胞(图27A)、HepG2细胞(图27B)和A549细胞(图27C)中诱导高达1.8倍的EPO分泌,Cpd.29与Cpd.27相比,在HEK293T细胞(图27A)和HepG2细胞(图27B)中诱导高达1.4倍的EPO分泌。总之,数据表明Cpd.28和Cpd.29比Cpd.27更强地诱导EPO分泌,表明这些信号肽促进在这些细胞类型中产生的EPO离开细胞。
体外转染HEK293T细胞以检测INS分泌
HEK293T细胞与作为对照的Cpd.30和作为测试mRNA的Cpd.31和Cpd.32孵育24小时后,评估细胞培养物上清液中分泌的胰岛素(INS)水平(图28)。Cpd.30响应标准化为1,数据表示为Cpd.30的倍数变化。Cpd.31和Cpd.32与Cpd.30相比,能够在HEK293T细胞中诱导高达3.9倍的INS分泌。总之,数据表明Cpd.31和Cpd.32比Cpd.30更强地诱导INS分泌,表明这些信号肽促进在该细胞类型中产生的INS离开细胞。
体外转染HEK293T、HepG2、THP-1和A549细胞以检测IL4分泌
HEK293T、HepG2、THP-1或A549细胞与作为对照的Cpd.33和作为测试mRNA的Cpd.34和Cpd.35孵育24小时后,评估细胞培养物上清液中分泌的白细胞介素4(IL4)水平(图29)。Cpd.33响应标准化为1,数据表示为Cpd.33的倍数变化。Cpd.34与Cpd.33相比,能够在HEK293T细胞(图29A)、HepG2细胞(图29B)、THP-1细胞(图29C)和A549细胞(图29D)中诱导高达2.2倍的IL4分泌,Cpd.35与Cpd.33相比,在HepG2细胞(图29B)和THP-1细胞(图29C)中分别诱导高达1.3倍的IL4分泌。总之,数据表明Cpd.34和Cpd.35比Cpd.33更强地诱导IL4分泌,表明这些信号肽促进在这些细胞类型中产生的IL4离开细胞。
体外转染HEK293T、HepG2和THP-1细胞以检测IL10分泌
HEK293T、HepG2或THP-1细胞与作为对照的Cpd.36和作为测试mRNA的Cpd.37和Cpd.38孵育24小时后,评估细胞培养物上清液中分泌的白细胞介素10(IL10)水平(图30)。Cpd.36响应标准化为1,数据表示为Cpd.36的倍数变化。Cpd.37与Cpd.36相比,能够在HEK293T细胞(图30A)、HepG2细胞(图30B)和THP-1细胞(图30C)中诱导高达2.2倍的IL10分泌,Cpd.38与Cpd.36相比,在THP-1细胞(图30C)中诱导1.4倍的IL10分泌。总之,数据表明Cpd.37和Cpd.38比Cpd.36更强地诱导IL10分泌,表明这些信号肽促进在这些细胞类型中产生的IL10离开细胞。
在HepG2和人原代软骨细胞中体外转染Cpd.39以测试IGF1的分泌
HepG2或软骨细胞与作为对照的Cpd.1和作为测试mRNA的Cpd.39孵育24小时后,评估细胞培养物上清液中分泌的IGF1水平(图31)。Cpd.1响应标准化为1,数据表示为Cpd.1的倍数变化。Cpd.39与Cpd.1相比,能够在HepG2(图31A)和人原代软骨细胞(图31B)中诱导高达1.4倍的显著更高的IGF1分泌。总之,数据表明Cpd.39比Cpd.1更强地诱导IGF1分泌,表明该信号肽促进在这些细胞类型中产生的IGF1离开细胞。
实施例2
为了测试局部应用的IGF-I mRNA在骨骼肌损伤小鼠模型中的功效,在第0天对8-10周龄雄性C57BL6/J小鼠的胫骨前肌(TA)进行黑牙蛇毒素(notexin)诱导的肌毒性损伤。在损伤后第1天,通过肌内注射将载剂或1μg mRNA(Cpd.4)应用到受损伤的肌肉中,并在损伤后第4天重复。在损伤后第1、4、7、10、14、21和28天测量TA的肌肉功能。在整个研究过程中还评估了对侧TA肌肉的子集,以评估TA肌肉功能的健康对照水平。
方法和材料
IGF-1的克隆和IGF-1mRNA的体外转录
如实施例1中所述进行IGF-1的克隆和IGF-1mRNA的体外转录。使用密码子优化的Cpd.4DNA(图4),克隆在pMA-T载体中,以提供如图11所示的构建体。该构建体用于产生体外转录的mRNA,以用于mRNA处理。
黑牙蛇毒素损伤
针对每只小鼠,制备浓度为0.4μg/40μl盐水的黑牙蛇毒素(Latoxan,Valence,France)。在室中诱导小鼠麻醉(约4-5%异氟醚,至生效),并通过鼻锥维持(约2-3%异氟醚,至生效)。然后将小鼠维持在加热(37℃)的手术台上。TA肌肉的中部***皮肤用脱毛膏备皮(Nair Hair Remover,45秒,然后用水冲洗3次),然后用必妥碘(betadyne)和70%酒精3次交替擦洗,进一步备皮,以防止皮肤细菌进入软组织。使用结核菌素注射器(tuberculinsyringe),将制备的0.04ml黑牙蛇毒素肌肉注射到右侧TA的***部。动物在手术过程中没有明显疼痛,随后施用适当的抗疼痛治疗(注射后,每12小时丁丙诺啡0.05-0.1mg/kg持续48小时)。在麻醉诱导时给予第一剂镇痛剂,以确保在恢复时镇痛剂存在。在第一个48小时后,每周至少检查动物两次,以确保正确愈合和恢复正常步态。
mRNA处理
小鼠被随机分配为mRNA或载剂处理。如上所述,使用异氟醚麻醉小鼠,并在肌肉中部对损伤的TA肌肉施用一次肌内注射mRNA或载剂处理。
体内TA功能的评估
在损伤后第1、4、7、10、14、21和28天,使用305C肌杠杆***(Aurora ScientificInc.,Aurora,Canada)在体内测量肌肉性能。如上所述完成小鼠的麻醉,并将小鼠放置在恒温控制的桌子上。使用压在胫骨头上的销钉隔离膝盖,将足牢牢固定在电机轴上的踏板上。对于背屈肌群,收缩是由腓神经经皮电刺激引起的。通过增加电流确定最佳等长抽搐扭矩,在每次收缩之间至少间隔30秒以避免疲劳。然后以增加的刺激频率(0.2ms脉冲,500ms训练持续时间)进行一系列刺激:1、10、20、40、60、80、100、150Hz,然后以1Hz进行最后的刺激。绘制了最大峰值等长力。
数据分析
分组数据并计算平均值和标准误差。使用GraphPad Prism 8(San Diego,USA)进行统计分析。使用学生t检验进行比较。
结果
实施例2显示,在毒素(黑牙蛇毒素)诱导的TA肌肉损伤小鼠模型中,在肌肉损伤后第1天和第4天早期进行IGF-I mRNA肌内治疗导致肌肉功能加速和完全恢复(图21)。用1μgCpd.4处理的动物在16天达到健康范围内的功能水平。相比之下,接受载剂处理的对照动物和较低剂量治疗的小鼠甚至到第28天都没有达到完全的功能恢复。因此,数据表明IGF-ImRNA治疗可以加速肌肉损伤后的愈合,并且可以通过完全恢复肌肉功能来潜在地预防慢性损伤。因此,令人惊讶的是,在损伤后早期只需要两个剂量。
Claims (54)
1.包含编码蛋白质和信号肽的核酸序列的mRNA,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽选自
i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
2.根据权利要求1所述的mRNA,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9具有6.1或以下的平均极性。
3.根据权利要求1或2所述的mRNA,其中所述信号肽的氨基酸序列的C-末端的最后9个氨基酸的平均疏水性分数比所述信号肽的氨基酸序列的N-末端的氨基酸1-9的平均疏水性分数低至少1.0个单位。
4.根据权利要求1-3中任一项所述的mRNA,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9、氨基酸2-10、氨基酸3-11、氨基酸4-12和氨基酸5-13分别具有1.5以上的平均疏水性分数。
5.根据权利要求1-4中任一项所述的mRNA,其中所述信号肽的氨基酸序列的N-末端的氨基酸8-16的平均疏水性分数等于或低于所述信号肽的氨基酸序列的N-末端的氨基酸3-11的平均疏水性分数。
6.根据权利要求1-4中任一项所述的mRNA,其中所述信号肽包含长度为18至40个氨基酸的氨基酸序列,并且其中所述信号肽的氨基酸序列的N-末端的氨基酸10-18的平均疏水性分数比所述信号肽的氨基酸序列的N-末端的氨基酸3-11的平均疏水性分数低至少0.5个单位。
7.根据权利要求1-6中任一项所述的mRNA,其中所述信号肽的氨基酸序列的C-末端的最后9个氨基酸的平均疏水性分数比所述信号肽的氨基酸序列的N-末端的氨基酸3-11的平均疏水性分数低至少1.5个单位。
8.根据权利要求1-7中任一项所述的mRNA,其中所述信号肽的氨基酸序列的任何9个连续氨基酸的平均疏水性分数不超过4.1。
9.根据权利要求1-8中任一项所述的mRNA,其中所述信号肽的氨基酸序列的C-末端的最后9个氨基酸包含至少一个具有负的疏水性分数的氨基酸。
10.根据权利要求9所述的mRNA,其中所述至少一个具有负的疏水性分数的氨基酸选自G、Q、N、T、S、R、K、H、D、E、P、Y和W。
11.根据权利要求1-10中任一项所述的mRNA,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9的第二氨基酸选自P、Y、W、S、T、G、A、M、C、F、L、V和I。
12.根据权利要求1-10中任一项所述的mRNA,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9的第二氨基酸选自A、L、S、T、V和W。
13.根据权利要求1-12中任一项所述的mRNA,其中所述信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰,其中修饰的与所述蛋白质同源的信号肽的氨基酸序列N-末端氨基酸1-9的平均疏水性分数比未修饰的所述信号肽的氨基酸序列N-末端氨基酸1-9的平均疏水性分数高至少1.0个单位。
14.根据权利要求1-13或2-13中任一项所述的mRNA,其中根据Kyte-Doolittle量表计算所述疏水性分数,根据Zimmerman Polarity index计算极性。
15.根据权利要求1-14中任一项所述的mRNA,其中所述信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽选自脑源性神经营养因子(BDNF)的信号肽、神经营养因子-3(NTF-3)的信号肽、成纤维细胞生长因子5(FGF5)的信号肽、***结合蛋白5(IBP5)的信号肽、***和睾丸表达的蛋白2(PATE2)的信号肽、细胞外超氧化物歧化酶(SOD3)的信号肽和补体因子H相关蛋白2(FHR2)的信号肽。
16.根据权利要求1-14中任一项所述的mRNA,其中所述信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质异源的信号肽选自C-X-C基序趋化因子配体12(CXCL12)的信号肽、胰岛素生长因子2(IGF2)的信号肽、胰岛素(INS)的信号肽和脑源性神经营养因子(BDNF)的信号肽。
17.根据权利要求1-14中任一项所述的mRNA,其中所述信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,其中与所述蛋白质同源的信号肽和所述蛋白质选自胰岛素生长因子1(IGF1)的信号肽和IGF1、胰岛素的信号肽和INS、***(EPO)的信号肽和EPO、白细胞介素4(IL-4)的信号肽和IL-4、以及白细胞介素10(IL-10)的信号肽和IL-10。
18.根据权利要求1-14中任一项所述的mRNA,其中所述信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,其中所述天然存在的氨基酸序列选自胰岛素生长因子1(IGF1)的前肽、胰高血糖素受体(GL-R)的编码序列和肠型碱性磷酸酶(ALPI)的前肽。
19.根据权利要求1-18中任一项所述的mRNA,其中所述信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,并且其中使用与所述蛋白质异源的信号肽分泌蛋白质的量高于使用与所述蛋白质同源的信号肽的所述蛋白质的分泌量。
20.根据权利要求1-18中任一项所述的mRNA,其中所述信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,并且其中使用与所述蛋白质同源的修饰的信号肽分泌蛋白质的量高于使用与所述蛋白质同源的未修饰信号肽的所述蛋白质的分泌量。
21.根据权利要求1-18中任一项所述的mRNA,其中所述信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,并且其中使用天然存在的本质上不具有信号肽功能的氨基酸序列的分泌蛋白质的量高于使用与所述蛋白质同源的信号肽的所述蛋白质的分泌量。
22.根据权利要求1-21中任一项所述的mRNA,其中所述信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代氨基酸数目少于与所述蛋白质异源的信号肽的氨基酸序列的氨基酸数目的50%而被修饰。
23.根据权利要求1-21中任一项所述的mRNA,其中所述信号肽是ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代氨基酸数目少于与所述蛋白质同源的信号肽的氨基酸序列的氨基酸数目的50%而被修饰。
24.根据权利要求1-21中任一项所述的mRNA,其中所述信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代氨基酸数目少于天然存在的氨基酸序列的氨基酸序列的氨基酸数目的50%而被修饰。
25.根据权利要求1-24中任一项所述的mRNA,其中所述蛋白质选自细胞因子、生长因子和激素。
26.根据权利要求1-25中任一项所述的mRNA,其中所述信号肽是:i)与所述蛋白质异源的信号肽,并且所述蛋白质选自胰岛素生长因子1(IGF1)、胰岛素(INS)、***(EPO)、白细胞介素4(IL-4)和白细胞介素10(IL-10)。
27.根据权利要求1-25中任一项所述的mRNA,其中所述信号肽是i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽通过***、缺失和/或取代至少一个氨基酸而被修饰,并且所述蛋白质为IGF1。
28.根据权利要求1-27中任一项所述的mRNA,其中所述信号肽是iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸而被修饰,并且所述蛋白质为IGF1。
29.根据权利要求1-5和权利要求7-28中任一项所述的mRNA,其中所述信号肽包含长度为16至40个氨基酸的氨基酸序列。
30.一种转录单元、表达载体或基因治疗载体,其包含编码蛋白质和信号肽的核酸序列,其中所述信号肽的氨基酸序列的N-末端的氨基酸1-9具有大于2的平均疏水性分数,其中所述信号肽选自i)与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽任选地通过***、缺失和/或取代至少一个氨基酸被修饰,条件是所述蛋白质不是氧化还原酶;
ii)与所述蛋白质同源的信号肽,其中与所述蛋白质同源的信号肽通过***、缺失和/或取代至少一个氨基酸被修饰;和
iii)天然存在的氨基酸序列,其本质上不具有信号肽功能,其中所述天然存在的氨基酸序列任选地通过***、缺失和/或取代至少一个氨基酸被修饰。
31.一种治疗组合物,其包含权利要求1-29中任一项所述的mRNA和/或权利要求30所述的转录单元、表达载体或基因治疗载体。
32.一种试剂盒,其包含权利要求1-29中任一项所述的mRNA,权利要求30所述的转录单元、表达载体或基因治疗载体,和/或权利要求31所述的治疗组合物,以及说明书,任选地载体图,任选地宿主细胞,任选地用于培养宿主细胞的培养基,和/或任选地用于选择和培养转染的宿主细胞的选择培养基。
33.一种包含核酸序列的mRNA,所述核酸序列编码
i)蛋白质;和
ii)与所述蛋白质异源的信号肽,
其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质不是氧化还原酶。
34.一种包含核酸序列的mRNA,所述核酸序列编码
i)蛋白质;和
ii)与所述蛋白质异源的信号肽,
其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质选自羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶;免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白。
35.根据权利要求33或34所述的mRNA,其中所述蛋白质选自细胞因子;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;神经活性蛋白;和血管活性蛋白。
36.根据权利要求33或34所述的mRNA,其中所述蛋白质是生长因子。
37.根据权利要求36所述的mRNA,其中所述生长因子选自AMH,ARTN,BTC,CDNF,CFC1,CFC1B,CHRDL1,CHRDL2,CLEC11A,CNMD,EFEMP1,EGFL6,EGFL7,EGFL8,EPGN,EREG,EYS,FGF1,FGF10,FGF16,FGF17,FGF18,FGF19,FGF2,FGF20,FGF21,FGF22,FGF23,FGF3,FGF4,FGF5,FGF6,FGF7,FGF8,FGF9,FRZB,GDNF,GFER,GKN1,HBEGF,IGF1,IGF2,INHA,INHBA,INHBB,INHBC,INHBE,KITLG,MANF,MDK,MIA,NGF,NOV,NRG1,NRG2,NRG3,NRG4,NRTN,NTF3,NTF4,OGN,PDGFA,PDGFB,PDGFC,PDGFD,PGF,PROK1,PSPN,PTN,SDF1,SDF2,SFRP1,SFRP2,SFRP3,SFRP4,SFRP5,TDGF1,TFF1,TGFA,TGFB1,TGFB2,TGFB3,THBS4,TIMP1,VEGFA,VEGFB,VEGFC,VEGFD和WISP3。
38.根据权利要求33或34所述的mRNA,其中所述蛋白质是IGF1。
39.根据权利要求33-38中任一项所述的mRNA,其中所述脑源性神经营养因子(BDNF)的信号肽包含如SEQ ID NO:31所示的氨基酸序列。
40.根据权利要求33-39中任一项所述的mRNA,其中编码蛋白质的核酸序列和编码与所述蛋白质异源的脑源性神经营养因子(BDNF)的信号肽的核酸序列可操作地连接。
41.根据权利要求33-40中任一项所述的mRNA,其中所述mRNA包含核酸序列,其按以下从5'到3'的顺序编码:
i)脑源性神经营养因子(BDNF)的信号肽;
ii)可选地,蛋白质的前结构域;和
iii)成熟蛋白;
其中编码脑源性神经营养因子(BDNF)的信号肽的核酸序列、任选地编码蛋白质的前结构域的核酸序列和编码成熟蛋白质的核酸序列有效连接。
42.根据权利要求33-41中任一项所述的mRNA,其中所述mRNA包含编码IGF1的前肽的核酸序列、编码成熟IGF1的核酸序列和编码脑源性神经营养因子(BDNF)的信号肽的核酸序列,并且其不包含编码IGF1的E-肽的核酸序列。
43.根据权利要求33-42中任一项所述的mRNA,其中所述脑源性神经营养因子(BDNF)的信号肽代替蛋白质的天然信号肽。
44.一种转录单元、表达载体或基因治疗载体,其包含编码蛋白质和与所述蛋白质异源的信号肽的核酸序列,其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质不是氧化还原酶。
45.一种转录单元、表达载体或基因治疗载体,其包含核酸序列,所述核酸序列编码蛋白质和与所述蛋白质异源的信号肽,其中与所述蛋白质异源的信号肽是脑源性神经营养因子(BDNF)的信号肽,并且其中所述蛋白质选自羧肽酶;细胞因子;细胞外配体和转运蛋白;细胞外基质蛋白;葡糖苷酶;糖基转移酶;生长因子;生长因子结合蛋白;肝素结合蛋白;激素;水解酶,免疫球蛋白;异构酶;激酶;裂解酶;金属酶抑制剂;金属蛋白酶;乳蛋白;神经活性蛋白;蛋白酶;蛋白酶抑制剂;蛋白质磷酸酶;酯酶;转移酶和血管活性蛋白。
46.一种治疗组合物,其包含权利要求33-43任一项所述的mRNA和/或权利要求44或45所述的转录单元、表达载体或基因治疗载体。
47.一种试剂盒,其包含权利要求33-43中任一项所述的mRNA,权利要求44或45所述的转录单元、表达载体或基因治疗载体,和/或权利要求46所述的治疗组合物,以及说明书,任选地载体图,任选地宿主细胞,任选地用于培养宿主细胞的培养基,和/或任选地用于选择和培养转染的宿主细胞的选择培养基。
48.根据权利要求1-28或33-43中任一项所述的mRNA、根据权利要求30或44-45所述的转录单元、表达载体或基因治疗载体、根据权利要求31或46所述的治疗组合物或根据权利要求32或47所述的试剂盒,用作药物的用途。
49.根据权利要求1-29或权利要求38或42中任一项所述的mRNA,用于治疗骨骼肌损伤的方法中的用途。
50.一种mRNA,用于治疗骨骼肌损伤的方法中的用途。
51.一种包含mRNA的治疗组合物,用于治疗骨骼肌损伤的方法中的用途。
52.根据权利要求50或51所述用途的mRNA或组合物,其中所述mRNA是编码人***1(IGF1)的mRNA。
53.根据权利要求52所述用途的mRNA或组合物,其中所述编码人IGF1的mRNA包含编码信号肽的核酸序列,任选地编码人IGF1前肽的核酸序列和编码成熟人IGF1的核酸序列。
54.根据权利要求53所述用途的mRNA或组合物,其中所述编码信号肽的核酸序列编码脑源性神经营养因子(BDNF)的信号肽。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18214221.6 | 2018-12-19 | ||
EP18214221 | 2018-12-19 | ||
EP19208066.1 | 2019-11-08 | ||
EP19208066 | 2019-11-08 | ||
PCT/EP2019/086019 WO2020127532A2 (en) | 2018-12-19 | 2019-12-18 | Rna encoding a protein |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113454227A true CN113454227A (zh) | 2021-09-28 |
Family
ID=68848313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980092197.7A Pending CN113454227A (zh) | 2018-12-19 | 2019-12-18 | 编码蛋白质的rna |
Country Status (18)
Country | Link |
---|---|
US (1) | US20220002364A1 (zh) |
EP (1) | EP3898982A2 (zh) |
JP (1) | JP2022514863A (zh) |
KR (1) | KR20210105382A (zh) |
CN (1) | CN113454227A (zh) |
AU (1) | AU2019407921A1 (zh) |
BR (1) | BR112021011771A2 (zh) |
CA (1) | CA3120638A1 (zh) |
CL (1) | CL2021001571A1 (zh) |
CO (1) | CO2021007916A2 (zh) |
IL (1) | IL284035A (zh) |
MA (1) | MA54503A (zh) |
MX (1) | MX2021007241A (zh) |
PE (1) | PE20211342A1 (zh) |
PH (1) | PH12021551135A1 (zh) |
SG (1) | SG11202105267VA (zh) |
TW (1) | TW202043477A (zh) |
WO (1) | WO2020127532A2 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4259279A1 (en) | 2020-12-14 | 2023-10-18 | Regeneron Pharmaceuticals, Inc. | Methods of treating metabolic disorders and cardiovascular disease with inhibin subunit beta e (inhbe) inhibitors |
JP2024504414A (ja) * | 2021-01-26 | 2024-01-31 | シギロン セラピューティクス, インコーポレイテッド | 抗原特異的免疫寛容を誘導するための組成物、デバイス及び方法 |
AU2022228458A1 (en) * | 2021-03-01 | 2023-09-14 | The Johns Hopkins University | Molecular indexing of proteins by self assembly (mipsa) for efficient proteomic investigations |
WO2022216944A1 (en) * | 2021-04-07 | 2022-10-13 | Mayo Foundation For Medical Education And Research | Methods and materials for reversing atherogenic plaque instability |
KR20230173121A (ko) * | 2021-04-19 | 2023-12-26 | 베르사멥 아게 | 하부 요로 증상을 치료하는 방법 |
CN117813380A (zh) * | 2021-06-23 | 2024-04-02 | 维萨梅布有限公司 | 用于调节诸基因表达的组合物和方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103328649A (zh) * | 2010-11-22 | 2013-09-25 | 科利迪尤斯生物医药有限公司 | 用于改善重组酶及其它蛋白的蛋白表达和分泌的新的信号序列 |
CN104321069A (zh) * | 2011-10-27 | 2015-01-28 | 威尔斯达眼科制剂公司 | 编码视杆细胞来源的视锥细胞活力因子的载体 |
WO2015139046A1 (en) * | 2014-03-14 | 2015-09-17 | Genentech, Inc. | Methods and compositions for secretion of heterologous polypeptides |
US20170183389A1 (en) * | 2014-04-24 | 2017-06-29 | Accurna, Inc. | Method for improving protein expression, and composition for protein expression |
WO2018185468A1 (en) * | 2017-04-05 | 2018-10-11 | Quethera Limited | Genetic construct for use in the treatment of neurodegenerative disorder or stroke |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2305699B1 (de) | 2001-06-05 | 2014-08-13 | CureVac GmbH | Stabilisierte mRNA mit erhöhtem G/C-Gehalt und optimierter Codon Usage für die Impfung gegen Schlafkrankheit, Leishmaniose und Toxoplasmose |
DE102005046490A1 (de) | 2005-09-28 | 2007-03-29 | Johannes-Gutenberg-Universität Mainz | Modifikationen von RNA, die zu einer erhöhten Transkriptstabilität und Translationseffizienz führen |
US20090047259A1 (en) * | 2005-12-22 | 2009-02-19 | Enrique Lara | Methods of Using the Calcineurin A Variant CnA-beta 1 |
EP2281047B1 (en) * | 2008-04-15 | 2020-04-08 | Genzyme Corporation | Methods to produce rod-derived cone viability factor (rdcvf) |
US9994829B2 (en) * | 2012-07-02 | 2018-06-12 | Iprogen Biotech, Inc. | Intracellular protein delivery |
-
2019
- 2019-12-18 MX MX2021007241A patent/MX2021007241A/es unknown
- 2019-12-18 CA CA3120638A patent/CA3120638A1/en active Pending
- 2019-12-18 SG SG11202105267VA patent/SG11202105267VA/en unknown
- 2019-12-18 PE PE2021000874A patent/PE20211342A1/es unknown
- 2019-12-18 CN CN201980092197.7A patent/CN113454227A/zh active Pending
- 2019-12-18 BR BR112021011771-7A patent/BR112021011771A2/pt unknown
- 2019-12-18 WO PCT/EP2019/086019 patent/WO2020127532A2/en active Application Filing
- 2019-12-18 MA MA054503A patent/MA54503A/fr unknown
- 2019-12-18 AU AU2019407921A patent/AU2019407921A1/en active Pending
- 2019-12-18 KR KR1020217021821A patent/KR20210105382A/ko active Search and Examination
- 2019-12-18 JP JP2021535281A patent/JP2022514863A/ja active Pending
- 2019-12-18 EP EP19818197.6A patent/EP3898982A2/en active Pending
- 2019-12-19 TW TW108146645A patent/TW202043477A/zh unknown
-
2021
- 2021-05-19 PH PH12021551135A patent/PH12021551135A1/en unknown
- 2021-06-15 CL CL2021001571A patent/CL2021001571A1/es unknown
- 2021-06-15 IL IL284035A patent/IL284035A/en unknown
- 2021-06-16 US US17/348,876 patent/US20220002364A1/en active Pending
- 2021-06-16 CO CONC2021/0007916A patent/CO2021007916A2/es unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103328649A (zh) * | 2010-11-22 | 2013-09-25 | 科利迪尤斯生物医药有限公司 | 用于改善重组酶及其它蛋白的蛋白表达和分泌的新的信号序列 |
CN104321069A (zh) * | 2011-10-27 | 2015-01-28 | 威尔斯达眼科制剂公司 | 编码视杆细胞来源的视锥细胞活力因子的载体 |
WO2015139046A1 (en) * | 2014-03-14 | 2015-09-17 | Genentech, Inc. | Methods and compositions for secretion of heterologous polypeptides |
US20170183389A1 (en) * | 2014-04-24 | 2017-06-29 | Accurna, Inc. | Method for improving protein expression, and composition for protein expression |
WO2018185468A1 (en) * | 2017-04-05 | 2018-10-11 | Quethera Limited | Genetic construct for use in the treatment of neurodegenerative disorder or stroke |
Non-Patent Citations (2)
Title |
---|
ANDY HESKETH ET AL.: "Bacterial Signaling Nucleotides Inhibit Yeast Cell Growth by Impacting Mitochondrial and Other Specifically Eukaryotic Functions", MBIO, vol. 8, no. 4, pages 1 - 20 * |
赵慧等: "信号肽对外源蛋白分泌效率的影响", 生命的化学, vol. 23, no. 3, pages 177 - 179 * |
Also Published As
Publication number | Publication date |
---|---|
MX2021007241A (es) | 2021-09-23 |
CO2021007916A2 (es) | 2021-09-20 |
AU2019407921A1 (en) | 2021-06-10 |
WO2020127532A2 (en) | 2020-06-25 |
IL284035A (en) | 2021-08-31 |
PE20211342A1 (es) | 2021-07-26 |
BR112021011771A2 (pt) | 2021-08-31 |
WO2020127532A3 (en) | 2020-09-17 |
MA54503A (fr) | 2021-10-27 |
CL2021001571A1 (es) | 2022-04-18 |
SG11202105267VA (en) | 2021-07-29 |
PH12021551135A1 (en) | 2022-02-28 |
US20220002364A1 (en) | 2022-01-06 |
KR20210105382A (ko) | 2021-08-26 |
EP3898982A2 (en) | 2021-10-27 |
CA3120638A1 (en) | 2020-06-25 |
JP2022514863A (ja) | 2022-02-16 |
TW202043477A (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113454227A (zh) | 编码蛋白质的rna | |
US20210024907A1 (en) | Nucleic acid-based therapeutics | |
CN114901822A (zh) | 用于同时调节基因表达的组合物和方法 | |
JP2017535266A (ja) | 筋萎縮性側索硬化症(als)を治療する組成物および方法 | |
Zhao et al. | p NNS-Conjugated Chitosan Mediated IGF-1 and miR-140 Overexpression in Articular Chondrocytes Improves Cartilage Repair | |
US20220372519A1 (en) | In vitro assembly of anellovirus capsids enclosing rna | |
KR20210039495A (ko) | 피드백이 가능한 합성 유전자, 표적 시드 매치 카세트, 및 그 용도 | |
US20240000914A1 (en) | Chicken anemia virus (cav)-based vectors | |
US20230304014A1 (en) | Mirna-485 inhibitor for huntington's disease | |
ES2559106A1 (es) | Método de activación de la expresión del gen Pitx2 para promover la regeneración muscular | |
US20240117354A1 (en) | Compositions and methods for modulating expression of genes | |
US20240117361A1 (en) | Compositions and methods for modulating expression of genes | |
US20220378841A1 (en) | Modified cells and related methods | |
US20230098714A1 (en) | Microrna compositions and methods of use | |
US20230121720A1 (en) | Diagnostic methods using pcg-1a expression | |
TW202334431A (zh) | 新穎指環載體(anellovector)組合物及方法 | |
TW202223095A (zh) | 串聯指環病毒構築體 | |
KR20220155585A (ko) | Sirt1 발현을 사용하는 진단 방법 | |
TW202221126A (zh) | 用於鑑別及特徵化指環病毒之方法及其用途 | |
NZ791466A (en) | Nucleic Acid Products And Methods Of Administration Thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |