ES2972511T3 - Enzimas para el corte de glicoproteínas - Google Patents
Enzimas para el corte de glicoproteínasInfo
- Publication number
- ES2972511T3 ES2972511T3 ES17704236T ES17704236T ES2972511T3 ES 2972511 T3 ES2972511 T3 ES 2972511T3 ES 17704236 T ES17704236 T ES 17704236T ES 17704236 T ES17704236 T ES 17704236T ES 2972511 T3 ES2972511 T3 ES 2972511T3
- Authority
- ES
- Spain
- Prior art keywords
- seq
- endoh
- endos
- fusion
- glycoprotein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000004190 Enzymes Human genes 0.000 title claims description 123
- 108090000790 Enzymes Proteins 0.000 title claims description 123
- 102000003886 Glycoproteins Human genes 0.000 title claims description 95
- 108090000288 Glycoproteins Proteins 0.000 title claims description 95
- 238000005520 cutting process Methods 0.000 title claims description 15
- 108010031186 Glycoside Hydrolases Proteins 0.000 claims description 113
- 102000005744 Glycoside Hydrolases Human genes 0.000 claims description 113
- 125000005647 linker group Chemical group 0.000 claims description 81
- 230000004927 fusion Effects 0.000 claims description 73
- 150000004676 glycans Chemical class 0.000 claims description 61
- ULSLJYXHZDTLQK-UHFFFAOYSA-N Coumatetralyl Chemical compound C1=CC=CC2=C1OC(=O)C(C1C3=CC=CC=C3CCC1)=C2O ULSLJYXHZDTLQK-UHFFFAOYSA-N 0.000 claims description 48
- 230000000694 effects Effects 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 29
- -1 mannose glycan Chemical class 0.000 claims description 18
- 125000000539 amino acid group Chemical group 0.000 claims description 10
- 101150056653 EndoA gene Proteins 0.000 claims description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 4
- 238000010397 one-hybrid screening Methods 0.000 claims description 3
- 229940088598 enzyme Drugs 0.000 description 111
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 110
- 238000006243 chemical reaction Methods 0.000 description 82
- 108020001507 fusion proteins Proteins 0.000 description 77
- 102000037865 fusion proteins Human genes 0.000 description 74
- 108090000623 proteins and genes Proteins 0.000 description 68
- 102000004169 proteins and genes Human genes 0.000 description 66
- 235000018102 proteins Nutrition 0.000 description 61
- 229960000575 trastuzumab Drugs 0.000 description 60
- 239000011780 sodium chloride Substances 0.000 description 55
- 238000003776 cleavage reaction Methods 0.000 description 49
- 230000007017 scission Effects 0.000 description 49
- 239000000872 buffer Substances 0.000 description 46
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 43
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 40
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 39
- 239000007983 Tris buffer Substances 0.000 description 37
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 37
- 108091028043 Nucleic acid sequence Proteins 0.000 description 33
- 239000000499 gel Substances 0.000 description 31
- 238000000746 purification Methods 0.000 description 31
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 31
- 235000000346 sugar Nutrition 0.000 description 31
- 239000000523 sample Substances 0.000 description 28
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 26
- 235000001014 amino acid Nutrition 0.000 description 24
- 229940024606 amino acid Drugs 0.000 description 24
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical group CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 22
- 125000003275 alpha amino acid group Chemical group 0.000 description 22
- 150000001413 amino acids Chemical class 0.000 description 22
- 229920001542 oligosaccharide Polymers 0.000 description 22
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 22
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 20
- 150000002482 oligosaccharides Chemical class 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 19
- 239000012634 fragment Substances 0.000 description 19
- 230000008569 process Effects 0.000 description 18
- 238000011282 treatment Methods 0.000 description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 18
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 17
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- 239000001509 sodium citrate Substances 0.000 description 17
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 17
- 230000014509 gene expression Effects 0.000 description 15
- 125000001424 substituent group Chemical group 0.000 description 15
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 13
- 102100021935 C-C motif chemokine 26 Human genes 0.000 description 13
- 101000897493 Homo sapiens C-C motif chemokine 26 Proteins 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 13
- 239000012528 membrane Substances 0.000 description 13
- 150000002772 monosaccharides Chemical group 0.000 description 12
- 238000011002 quantification Methods 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 11
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 11
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 11
- 239000012741 Laemmli sample buffer Substances 0.000 description 11
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 11
- 230000021615 conjugation Effects 0.000 description 11
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 10
- 108010049003 Fibrinogen Proteins 0.000 description 10
- 102000008946 Fibrinogen Human genes 0.000 description 10
- 239000004471 Glycine Substances 0.000 description 10
- 238000010790 dilution Methods 0.000 description 10
- 239000012895 dilution Substances 0.000 description 10
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 10
- 229940012952 fibrinogen Drugs 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000013595 glycosylation Effects 0.000 description 10
- 238000006206 glycosylation reaction Methods 0.000 description 10
- 239000002953 phosphate buffered saline Substances 0.000 description 10
- 230000001225 therapeutic effect Effects 0.000 description 10
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 9
- 238000005119 centrifugation Methods 0.000 description 9
- 230000003301 hydrolyzing effect Effects 0.000 description 9
- 238000004949 mass spectrometry Methods 0.000 description 9
- 239000011535 reaction buffer Substances 0.000 description 9
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 8
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 8
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 8
- 239000004473 Threonine Substances 0.000 description 8
- 239000008188 pellet Substances 0.000 description 8
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 7
- 108010066476 ribonuclease B Proteins 0.000 description 7
- 239000011550 stock solution Substances 0.000 description 7
- 229920002684 Sepharose Polymers 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 150000001720 carbohydrates Chemical class 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 239000000562 conjugate Substances 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 125000000524 functional group Chemical group 0.000 description 6
- 230000000717 retained effect Effects 0.000 description 6
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 5
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 5
- 239000007853 buffer solution Substances 0.000 description 5
- 230000022811 deglycosylation Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000000502 dialysis Methods 0.000 description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 5
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 229920002401 polyacrylamide Polymers 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 238000004007 reversed phase HPLC Methods 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 230000010474 transient expression Effects 0.000 description 5
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 4
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 239000000611 antibody drug conjugate Substances 0.000 description 4
- 229940049595 antibody-drug conjugate Drugs 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 235000009582 asparagine Nutrition 0.000 description 4
- 229960001230 asparagine Drugs 0.000 description 4
- 150000001540 azides Chemical class 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 238000007306 functionalization reaction Methods 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 238000011081 inoculation Methods 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 229950006780 n-acetylglucosamine Drugs 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 4
- 238000001542 size-exclusion chromatography Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 3
- 102100040004 Gamma-glutamylcyclotransferase Human genes 0.000 description 3
- 102000002068 Glycopeptides Human genes 0.000 description 3
- 108010015899 Glycopeptides Proteins 0.000 description 3
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 3
- 101000886680 Homo sapiens Gamma-glutamylcyclotransferase Proteins 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 150000001412 amines Chemical class 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000000132 electrospray ionisation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- MPMKMQHJHDHPBE-RUZDIDTESA-N 4-[[(2r)-1-(1-benzothiophene-3-carbonyl)-2-methylazetidine-2-carbonyl]-[(3-chlorophenyl)methyl]amino]butanoic acid Chemical compound O=C([C@@]1(N(CC1)C(=O)C=1C2=CC=CC=C2SC=1)C)N(CCCC(O)=O)CC1=CC=CC(Cl)=C1 MPMKMQHJHDHPBE-RUZDIDTESA-N 0.000 description 2
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- 102000003951 Erythropoietin Human genes 0.000 description 2
- 108090000394 Erythropoietin Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical group CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 2
- 229930186217 Glycolipid Natural products 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 2
- 102000008100 Human Serum Albumin Human genes 0.000 description 2
- 108091006905 Human Serum Albumin Proteins 0.000 description 2
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- YINZYTTZHLPWBO-UHFFFAOYSA-N Kifunensine Natural products COC1C(O)C(O)C(O)C2NC(=O)C(=O)N12 YINZYTTZHLPWBO-UHFFFAOYSA-N 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- SQVRNKJHWKZAKO-PFQGKNLYSA-N N-acetyl-beta-neuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-PFQGKNLYSA-N 0.000 description 2
- 230000004988 N-glycosylation Effects 0.000 description 2
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- IAJILQKETJEXLJ-QTBDOELSSA-N aldehydo-D-glucuronic acid Chemical compound O=C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-QTBDOELSSA-N 0.000 description 2
- 150000001336 alkenes Chemical class 0.000 description 2
- 230000029936 alkylation Effects 0.000 description 2
- 238000005804 alkylation reaction Methods 0.000 description 2
- LNTHITQWFMADLM-UHFFFAOYSA-N anhydrous gallic acid Natural products OC(=O)C1=CC(O)=C(O)C(O)=C1 LNTHITQWFMADLM-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 229960000074 biopharmaceutical Drugs 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 2
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 229940105423 erythropoietin Drugs 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 229940097043 glucuronic acid Drugs 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- IAJILQKETJEXLJ-LECHCGJUSA-N iduronic acid Chemical compound O=C[C@@H](O)[C@H](O)[C@@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-LECHCGJUSA-N 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- OIURYJWYVIAOCW-VFUOTHLCSA-N kifunensine Chemical compound OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H]2NC(=O)C(=O)N12 OIURYJWYVIAOCW-VFUOTHLCSA-N 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- KZNICNPSHKQLFF-UHFFFAOYSA-N succinimide Chemical compound O=C1CCC(=O)N1 KZNICNPSHKQLFF-UHFFFAOYSA-N 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 229960004072 thrombin Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 229960001612 trastuzumab emtansine Drugs 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- JTTIOYHBNXDJOD-UHFFFAOYSA-N 2,4,6-triaminopyrimidine Chemical compound NC1=CC(N)=NC(N)=N1 JTTIOYHBNXDJOD-UHFFFAOYSA-N 0.000 description 1
- 150000003923 2,5-pyrrolediones Chemical class 0.000 description 1
- UQBIAGWOJDEOMN-UHFFFAOYSA-N 2-O-(2-O-(alpha-D-mannopyranosyl)-alpha-D-mannopyranosyl)-D-mannopyranose Natural products OC1C(O)C(CO)OC(O)C1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(O)C(O)C(CO)O1 UQBIAGWOJDEOMN-UHFFFAOYSA-N 0.000 description 1
- VUFNLQXQSDUXKB-DOFZRALJSA-N 2-[4-[4-[bis(2-chloroethyl)amino]phenyl]butanoyloxy]ethyl (5z,8z,11z,14z)-icosa-5,8,11,14-tetraenoate Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)OCCOC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 VUFNLQXQSDUXKB-DOFZRALJSA-N 0.000 description 1
- MSWZFWKMSRAUBD-GASJEMHNSA-N 2-amino-2-deoxy-D-galactopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O MSWZFWKMSRAUBD-GASJEMHNSA-N 0.000 description 1
- 125000000979 2-amino-2-oxoethyl group Chemical group [H]C([*])([H])C(=O)N([H])[H] 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical class NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- XFJBGINZIMNZBW-CRAIPNDOSA-N 5-chloro-2-[4-[(1r,2s)-2-[2-(5-methylsulfonylpyridin-2-yl)oxyethyl]cyclopropyl]piperidin-1-yl]pyrimidine Chemical compound N1=CC(S(=O)(=O)C)=CC=C1OCC[C@H]1[C@@H](C2CCN(CC2)C=2N=CC(Cl)=CN=2)C1 XFJBGINZIMNZBW-CRAIPNDOSA-N 0.000 description 1
- MJZJYWCQPMNPRM-UHFFFAOYSA-N 6,6-dimethyl-1-[3-(2,4,5-trichlorophenoxy)propoxy]-1,6-dihydro-1,3,5-triazine-2,4-diamine Chemical compound CC1(C)N=C(N)N=C(N)N1OCCCOC1=CC(Cl)=C(Cl)C=C1Cl MJZJYWCQPMNPRM-UHFFFAOYSA-N 0.000 description 1
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108010053481 Antifreeze Proteins Proteins 0.000 description 1
- 101100480489 Arabidopsis thaliana TAAC gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 108010004651 DAB(486)-interleukin 2 Proteins 0.000 description 1
- 108010053187 Diphtheria Toxin Proteins 0.000 description 1
- 102000016607 Diphtheria Toxin Human genes 0.000 description 1
- 108010008165 Etanercept Proteins 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 101000724418 Homo sapiens Neutral amino acid transporter B(0) Proteins 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- LCWXJXMHJVIJFK-UHFFFAOYSA-N Hydroxylysine Natural products NCC(O)CC(N)CC(O)=O LCWXJXMHJVIJFK-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 108010073807 IgG Receptors Proteins 0.000 description 1
- 102000009490 IgG Receptors Human genes 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000019223 Interleukin-1 receptor Human genes 0.000 description 1
- 108050006617 Interleukin-1 receptor Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 239000012515 MabSelect SuRe Substances 0.000 description 1
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 1
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 1
- 108010031099 Mannose Receptor Proteins 0.000 description 1
- 108010090665 Mannosyl-Glycoprotein Endo-beta-N-Acetylglucosaminidase Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 1
- MNLRQHMNZILYPY-MKFCKLDKSA-N N-acetyl-D-muramic acid Chemical compound OC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)OC(O)[C@@H]1NC(C)=O MNLRQHMNZILYPY-MKFCKLDKSA-N 0.000 description 1
- MNLRQHMNZILYPY-MDMHTWEWSA-N N-acetyl-alpha-D-muramic acid Chemical compound OC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)O[C@H](O)[C@@H]1NC(C)=O MNLRQHMNZILYPY-MDMHTWEWSA-N 0.000 description 1
- SQVRNKJHWKZAKO-LUWBGTNYSA-N N-acetylneuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-LUWBGTNYSA-N 0.000 description 1
- 102100028267 Neutral amino acid transporter B(0) Human genes 0.000 description 1
- 101150096185 PAAS gene Proteins 0.000 description 1
- 235000016816 Pisum sativum subsp sativum Nutrition 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 238000003514 Retro-Michael reaction Methods 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- DPOPAJRDYZGTIR-UHFFFAOYSA-N Tetrazine Chemical compound C1=CN=NN=N1 DPOPAJRDYZGTIR-UHFFFAOYSA-N 0.000 description 1
- 102000036693 Thrombopoietin Human genes 0.000 description 1
- 108010041111 Thrombopoietin Proteins 0.000 description 1
- 102000004338 Transferrin Human genes 0.000 description 1
- 108090000901 Transferrin Proteins 0.000 description 1
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 101710090322 Truncated surface protein Proteins 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 229960000446 abciximab Drugs 0.000 description 1
- YRKCREAYFQTBPV-UHFFFAOYSA-N acetylacetone Chemical compound CC(=O)CC(C)=O YRKCREAYFQTBPV-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 229960000548 alemtuzumab Drugs 0.000 description 1
- 150000001345 alkine derivatives Chemical class 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical group OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 150000001408 amides Chemical group 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 229940094361 arcalyst Drugs 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 1
- 238000003705 background correction Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 229960004669 basiliximab Drugs 0.000 description 1
- 229960003270 belimumab Drugs 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- QLTSDROPCWIKKY-PMCTYKHCSA-N beta-D-glucosaminyl-(1->4)-beta-D-glucosamine Chemical compound O[C@@H]1[C@@H](N)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](N)[C@@H](O)[C@H](O)[C@@H](CO)O1 QLTSDROPCWIKKY-PMCTYKHCSA-N 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229960000455 brentuximab vedotin Drugs 0.000 description 1
- 229960001838 canakinumab Drugs 0.000 description 1
- 229940022399 cancer vaccine Drugs 0.000 description 1
- 238000009566 cancer vaccine Methods 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001728 carbonyl compounds Chemical class 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- YCIMNLLNPGFGHC-UHFFFAOYSA-N catechol Chemical group OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 1
- 229960000419 catumaxomab Drugs 0.000 description 1
- 230000007969 cellular immunity Effects 0.000 description 1
- 229960003115 certolizumab pegol Drugs 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 description 1
- UKUBCVAQGIZRHL-UHFFFAOYSA-N delta-Guanidinovaleric acid Chemical compound NC(N)=NCCCCC(O)=O UKUBCVAQGIZRHL-UHFFFAOYSA-N 0.000 description 1
- 108010017271 denileukin diftitox Proteins 0.000 description 1
- 229960001251 denosumab Drugs 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 150000008049 diazo compounds Chemical class 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 231100000371 dose-limiting toxicity Toxicity 0.000 description 1
- 229960002224 eculizumab Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 229940073621 enbrel Drugs 0.000 description 1
- 244000088681 endo Species 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 229960002442 glucosamine Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 150000002337 glycosamines Chemical class 0.000 description 1
- 229960001743 golimumab Drugs 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000004727 humoral immunity Effects 0.000 description 1
- 239000000017 hydrogel Substances 0.000 description 1
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 229960000598 infliximab Drugs 0.000 description 1
- 229960005386 ipilimumab Drugs 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 239000011565 manganese chloride Substances 0.000 description 1
- 235000002867 manganese chloride Nutrition 0.000 description 1
- 150000002704 mannoses Chemical class 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000003593 megakaryocyte Anatomy 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- SQDFHQJTAWCFIB-UHFFFAOYSA-N n-methylidenehydroxylamine Chemical compound ON=C SQDFHQJTAWCFIB-UHFFFAOYSA-N 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229960005027 natalizumab Drugs 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 150000002825 nitriles Chemical class 0.000 description 1
- 150000007855 nitrilimines Chemical class 0.000 description 1
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- JFNLZVQOOSMTJK-KNVOCYPGSA-N norbornene Chemical compound C1[C@@H]2CC[C@H]1C=C2 JFNLZVQOOSMTJK-KNVOCYPGSA-N 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 229960002450 ofatumumab Drugs 0.000 description 1
- 229960000470 omalizumab Drugs 0.000 description 1
- 229940100027 ontak Drugs 0.000 description 1
- 229940035567 orencia Drugs 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 101710135378 pH 6 antigen Proteins 0.000 description 1
- 229960000402 palivizumab Drugs 0.000 description 1
- 229960001972 panitumumab Drugs 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 150000003003 phosphines Chemical class 0.000 description 1
- 229910000073 phosphorus hydride Inorganic materials 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 229960003876 ranibizumab Drugs 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229960004641 rituximab Drugs 0.000 description 1
- 108010017584 romiplostim Proteins 0.000 description 1
- 108010038196 saccharide-binding proteins Proteins 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 229960002317 succinimide Drugs 0.000 description 1
- 150000004905 tetrazines Chemical class 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229960003989 tocilizumab Drugs 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000012581 transferrin Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 150000004043 trisaccharides Chemical class 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 229960003824 ustekinumab Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2497—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/54—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
- A61K47/549—Sugars, nucleosides, nucleotides or nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/13—Labelling of peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/005—Glycopeptides, glycoproteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01096—Mannosyl-glycoprotein endo-beta-N-acetylglucosaminidase (3.2.1.96)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Epidemiology (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Description
DESCRIPCIÓN
Enzimas para el corte de glicoproteínas
Campo de la invención
[0001] La presente invención se sitúa en el campo de la hidrólisis enzimática de oligosacáridos, más en particular del corte de glicoproteínas. La invención se refiere a enzimas mejoradas para tal corte para liberar la GIcNAc central y a un proceso para cortar glicoproteínas usando las enzimas según la invención.
Antecedentes de la invención
[0002] Las glicoproteínas existen en muchas variantes glicosiladas, o glicoformas, que pueden diferir sustancialmente en sus propiedades bioquímicas y funciones (biológicas). Los glicanos son estructuralmente diversos e incorporan una amplia gama de residuos de monosacáridos y enlaces glicosídicos.
[0003] Muchas proteínas terapéuticas son glicoproteínas y, aunque algunas se purifican a partir de fuentes naturales, la mayoría se expresan de forma recombinante. La elección del sistema de expresión influye mucho en la glicosilación. Se han realizado esfuerzos notables para controlar la glicosilación de los sistemas de producción de glicoproteínas motivados por el impacto en la funcionalidadin vivo.Por ejemplo, los anticuerpos monoclonales con glicosilación modificada muestran una farmacocinética y una función efectora mejoradas. Los glicopéptidos ofrecen posibilidades interesantes en el desarrollo de vacunas contra el cáncer dada su capacidad para estimular la inmunidad tanto humoral como celular. Además, el escudo de glicanos del VIH es una diana eficaz para la neutralización de anticuerpos y una diana emergente para el diseño de vacunas.
[0004] Por otro lado, la eliminación de N-glicanos de las glicoproteínas proporciona oportunidades terapéuticas complementarias. La desglicosilación de IgG disminuye significativamente la unión de anticuerpos a los receptores Fc-gamma, evitando así la captación inespecífica de anticuerpos por, por ejemplo, macrófagos o megacariocitos, lo que puede provocar trombocitopenia. Este último fenómeno biológico es responsable de la toxicidad limitante de dosis (d Lt ) de Kadcyla®, un conjugado de anticuerpo y fármaco para tratar el cáncer de mama con regulación positiva de HER2. La desglicosilación selectiva de anticuerposin vivobrinda oportunidades para tratar a pacientes con autoinmunidad mediada por anticuerpos. La eliminación de la glicoforma con alto contenido en manosa en una glicoproteína terapéutica recombinante puede ser beneficiosa, ya que se sabe que las glicoformas con alto contenido en manosa ponen en riesgo la eficacia terapéutica mediante una captación inespecífica por parte de los receptores de manosa endógenos y conducen a una eliminación rápida, como se describe, por ejemplo, en Gorovits y Krinos-Fiorotti, Cancer Immunol. Immunother. 2013, 62, 217-223 y Goetze et al, Glycobiology 2011, 21, 949-959. Además, Van de Bovenkamp et al., J. Immunol. 2016, 196, 1435-1441 describen cómo los glicanos con alto contenido en manosa pueden influir en la inmunidad. Reusch y Tejada, Glycobiology 2015, 25, 1325-1334, describen que una glicosilación inadecuada en anticuerpos monoclonales podría contribuir a una producción ineficaz a partir de genes de Ig expresados. En algunos casos, una secuencia de adición de carbohidratos generada por un reordenamiento de la región V o una hipermutación somática puede dar como resultado un anticuerpo que no puede plegarse ni secretarse adecuadamente, como se describe en Gala y Morrison, J. Immunol. 2004, 172, 5489-5494.
[0005] Una ventaja adicional de las proteínas terapéuticas desglicosiladas es la regularidad entre lotes mucho más facilitada y la homogeneidad significativamente mejorada, lo cual es muy ventajoso para la aprobación por las autoridades.
[0006] Un enfoque muy útil y sencillo para obtener proteínas recombinantes desglicosiladas, ofreciendo así una ruta para mejorar la eficacia de los anticuerpos terapéuticos y otras N-glicoproteínas, es mediante la eliminación enzimática de glicanos. Afortunadamente, se han descubierto endoglicosidasas que son capaces de escindir N-glicanos, lo que ofrece la posibilidad de eliminación selectiva a partir de una glicoproteína recombinante. Las endoglicosidasas también han encontrado un uso en la preparación de conjugados a partir de glicoproteínas, liberando selectivamente los restos básicos de GIcNAc tras el corte, seguido de la bioconjugación. Otro campo de uso de las endoglicosidasas es la espectrometría de masas, una de las herramientas analíticas clave para caracterizar proteínas (terapéuticas), incluidas las glicoproteínas y los anticuerpos monoclonales en particular. Mediante la escisión enzimática del glicano complejo y heterogéneo de la proteína, se facilita significativamente el análisis por espectrometría de masas.
[0007] La bioconjugación es el proceso de unir dos o más moléculas, de las cuales al menos una es una biomolécula y la otra molécula puede denominarse "molécula diana” o "molécula de interés". Se ha descubierto que muchos compuestos diferentes son útiles para conjugarse con glicoproteínas. Por ejemplo, la modulación de la estructura y función de las proteínas mediante modificación covalente con una sonda química para su detección y/o aislamiento se ha convertido en una poderosa herramienta en la investigación basada en proteomas y en aplicaciones biomédicas. El etiquetado fluorescente o de afinidad de proteínas es clave para estudiar el tráfico de proteínas en su hábitat nativo, y las vacunas basadas en conjugados de proteínas y carbohidratos han ganado importancia en la lucha contra el VIH, el cáncer, la malaria y las bacterias patógenas. La PEGilación de proteínas o la unión de una proteína a la albúmina sérica son estrategias útiles para mejorar el perfil farmacocinético al reducir las tasas de eliminación, mientras que la funcionalización de una proteína transportadora, como un anticuerpo monoclonal con una carga útil tóxica, es una estrategia prometedora en el tratamiento dirigido de enfermedades (en particular del cáncer).
[0008] En general, se pueden reconocer dos conceptos estratégicos en el campo de la bioconjugación: (a) conjugación basada en un grupo funcional nativo (en otras palabras: un grupo funcional ya presente en la biomolécula de interés, como por ejemplo un tiol, una amina, un alcohol o una unidad de hidroxifenol) o (b) un proceso en dos pasos que implica la modificación de uno (o más) grupos reactivos únicos en una biomolécula antes del proceso de conjugación real.
[0009] El primer enfoque normalmente implica una cadena lateral de aminoácido reactivo en una proteína (por ejemplo, cisteína o lisina), o un grupo funcional en un glicano (por ejemplo, amina, aldehído) o ácido nucleico (por ejemplo, funcionalidad purina o pirimidina o alcohol). Como se resume, entre otros, en G.T. Hermanson, "Bioconjugate Techniques", Elsevier, 3a ed. 2013. Cabe destacar que la conjugación de cisteína-maleimida destaca para la conjugación de proteínas en virtud de su alta velocidad de reacción y quimioselectividad. Sin embargo, cuando no hay cisteína libre disponible para la conjugación, como ocurre con muchas proteínas, a menudo se requieren otros métodos, cada uno de los cuales adolece de sus propias deficiencias, especialmente en términos de especificidad al sitio. Además, una desventaja general de los conjugados de proteínas obtenidos mediante alquilación con maleimidas es que, en general, los conjugados de succinimida resultantes pueden ser inestables debido a la reacción inversa de la alquilación, es decir, una reacción retro-Michael.
[0010] Una buena solución y de amplia aplicación para la bioconjugación implica el enfoque en dos pasos.
[0011] Aunque es más laboriosa, la conjugación en dos pasos mediante una funcionalidad modificada generalmente conduce a una mayor selectividad (especificidad al sitio) que la conjugación con una funcionalidad natural. Además de eso, se puede lograr una estabilidad total mediante la elección adecuada de la construcción. Los ejemplos típicos de un grupo funcional que se puede impartir a la biomolécula incluyen alquino (tensionado), alqueno (tensionado), norborneno, tetrazina, azida, fosfina, óxido de nitrilo, nitrona, nitrilo imina, compuesto diazo, compuesto carbonilo, (O-alquil)hidroxilamina e hidracina, que pueden lograrse mediante un enfoque de biología molecular o química. Se sabe que cada uno de los grupos funcionales anteriores tiene al menos un compañero de reacción, que en muchos casos implica una reactividad mutua completa. Por ejemplo, los ciclooctinos reaccionan selectiva y exclusivamente con los 1,3-dipolos, los alquenos tensionados con las tetrazinas y las fosfinas con las azidas, dando lugar a enlaces covalentes totalmente estables.
[0012] Una ruta eficaz hacia la introducción de funcionalidades modificadas, como azidas, en glicoproteínas específicas es mediante la funcionalización selectiva de los glicanos presentes en la glicoproteína. Todos los anticuerpos recombinantes, generados en sistemas hospedadores de mamíferos, contienen el sitio de N-glicosilación conservado en el residuo de asparagina en la posición 297 o cerca de ella. Estos glicanos siempre se forman como una mezcla compleja de isoformas, véanse, por ejemplo, las figuras 1 y 2 , que consisten en una mezcla altamente heterogénea de glicanos complejos, híbridos y con alto contenido en manosa. El corte de estos glicanos mediante una endoglicosidasa deja solo el resto central de GlcNAc (unido a N297), opcionalmente fucosilado en el grupo 6-OH. El resto central de GlcNAc liberado proporciona un punto de anclaje adecuado para las moléculas diana, proporcionando un producto con una homogeneidad mucho mayor en comparación con los productos obtenidos por conjugación con restos de azúcar terminales presentes en la estructura de glicanos original. Sin embargo, una desventaja de este enfoque es que diferentes glicanos pueden requerir diferentes endoglicosidasas, cada una con sus propias condiciones óptimas, de modo que pueden ser necesarios múltiples tratamientos enzimáticos para un corte adecuado y completo de la glicoproteína. Por ejemplo, se sabe que EndoH corta glicoformas híbridas y con alto contenido en manosa, pero no glicanos de tipo complejo, mientras que EndoS es capaz de cortar glicanos de tipo complejo y, hasta cierto punto, glicanos híbridos, pero no formas con alto contenido en manosa. EndoF2 puede cortar glicanos complejos (pero no híbridos), mientras que endoF3 solo puede cortar glicanos complejos que también están 1 ,6-fucosilados. Otra endoglicosidasa, EndoD, es capaz de hidrolizar únicamente el glicano Mans (M5). Una descripción general de las actividades específicas de diferentes endoglicosidasas se divulga en Freeze et al. Curr. Protoc. Mol. Biol., 2010, 89:17.13A.1-17. Yamamoto et al. divulgan en Glycoconjugate J. 2005, 22, 35-42, una construcción quimérica de EndoD y EndoBH, que estaba completamente inactiva. La construcción quimérica se diseñó para investigar la homología de ambas endoglicosidasas en el corte de glicanos. En el contexto de la conjugación de glicoproteínas, en WO 2007/095506 y WO 2008/029281 se describe que el corte del glicano puede tener lugar con EndoH, hidrolizando así un enlace glicosídico GIcNAc-GIcNAc y liberando una GlcNAc para la introducción enzimática de GalNAz. Van Geel et al. divulgan en Bioconjugate Chem. 2015, 26, 2233 que la transferencia de una variedad de restos de galactosa modificados con azida al residuo central de GlcNAc de un anticuerpo monoclonal, obtenido mediante corte con una endoglicosidasa, seguido de la unión de una carga útil tóxica mediante química click sin cobre, es un método eficaz para obtener conjugados anticuerpo-fármaco con un perfil de eficacia y seguridad mejorado demostrado en comparación con el fármaco comercializado Kadcyla®.
[0013] Como producto de la tecnología del ADN recombinante, las proteínas de fusión se han desarrollado como una clase de biomoléculas novedosas con propiedades multifuncionales. Al fusionar genéticamente dos o más proteínas o dominios proteicos, se genera un producto de proteína de fusión que puede mostrar funciones similares o claramente diferentes a las de los restos componentes. Las proteínas de fusión han encontrado aplicaciones en estrategias de purificación, inmovilización, adquisición de imágenes y productos biofarmacéuticos. Por ejemplo, muchos fármacos proteicos se fusionan con dominios Fc de anticuerpos, como la Fc-inmunoglobulina G1 (Fc-lgG1), o con proteínas transportadoras como la albúmina sérica humana (HSA) o la transferrina (Tf) para extender sus semividas plasmáticas y lograr efectos terapéuticos mejorados. Varios medicamentos de proteínas de fusión, incluido Enbrel® (factor de necrosis tumoral/Fc-lgG1), Ontak® (interleucina-2/toxina diftérica), Orencia® (antígeno 4 asociado al linfocito T citotóxico/Fc-lgG1), Amevive® (antígeno 3 de función leucocitaria/Fc-lgG1), Arcalyst® (dominio extracelular del receptor de interleucina 1/Fc-lgG1) y Nplate® (trombopoyetina/Fc-lgG1) han sido aprobados por la FDA para su aplicación terapéutica. Un ejemplo relevante de una proteína de fusión de una endoglicosidasa se puede encontrar en Warren et al., Prot. Ing. Design Select.
2005, 18, 497-501, donde se describe una fusión del dominio de unión a carbohidratos (CBM) con EndoF1 o PNGasaF.
[0014] La construcción exitosa de una proteína de fusión recombinante requiere las proteínas que la componen, pero también las porciones conectoras pueden desempeñar un papel importante. Las porciones conectoras pueden ser cortas o largas, flexibles o rígidas y de naturaleza escindible o no escindible. En algunos casos, la porción conectora puede aumentar la estabilidad o el plegamiento, mejorar la expresión o la actividad biológica o alterar la farmacocinética. La naturaleza típica de las porciones conectoras conocidas en la técnica son oligómeros de glicina, por ejemplo, Ge, oligómeros de GGGGS, oligómeros de EAAAK y variantes de estos. Se puede encontrar una descripción general reciente de las porciones conectoras para proteínas de fusión en Chen et al., Adv. Drug Deliv. Rev.2013, 65, 1357-1369.
Resumen de la invención
[0015] La invención se refiere a proteínas de fusión, en las que dos endoglicosidasas están fusionadas, posiblemente mediante una porción conectora. Las enzimas de fusión según la invención son capaces convenientemente de cortar glicoproteínas que comprenden al menos dos glicoformas distintas en un solo paso. Todos los glicanos de glicoproteínas que no pueden eliminarse mediante una única enzima convencional se cortan completamente para liberar la GIcNAc central mediante la enzima de fusión según la invención. Sorprendentemente, ambas actividades de la enzima de fusión funcionan bien al pH óptimo de una de las endoglicosidasas, mientras que la otra endoglicosidasa normalmente puede requerir un pH diferente para funcionar de manera óptima. Además, se ha descubierto que la actividad de una endoglicosidasa particular en una proteína de fusión puede mostrar una mayor eficiencia de corte en comparación con la misma endoglicosidasa como una sola enzima. La invención se refiere además al uso de la enzima de fusión según la invención para cortar glicoproteínas. En otro aspecto, la invención se refiere al proceso de producción de la enzima de fusión. En un aspecto adicional, la invención se refiere a un proceso para cortar glicoproteínas, que comprende cortar la glicoproteína con una enzima de fusión según la invención, para obtener una glicoproteína cortada.
Descripción de las figuras
[0016]
En la Figura 1 se muestran glicanos ejemplares con alto contenido en manosa (Man3 (M3), Man5 (M5) y Mang (M9)), de tipo complejo (biantenario), tipo bisecado, tipo triantenario y tetraantenario.
En la Figura 2 se muestra un anticuerpo que comprende un glicano en cada cadena pesada. Los patrones de glicosilación complejos más típicos de un anticuerpo recombinante son G1F, G0F y G1. También puede estar presente cierta glicosilación de tipo manosa (M5) y, en algunos casos, un glicano de tipo híbrido (por ejemplo, M5G1).
En la Figura 3 se muestran los resultados del corte de la glicoproteína RNasaB con alto contenido en manosa en Tris pH 7,5 mediante las endoglicosidasas EndoS, EndoS2 y EndoSH. Serie de concentraciones: 0,025, 0,125, 0,125 (duplo) y 0,25 mg/ml. Banda superior = RNasaB intacta, banda inferior = RNasaB cortada. En la Figura 4 se muestra una gráfica del porcentaje de conversión (corte) de cAC10 a pH 6 mediante las endoglicosidasas EndoS, EndoS2 y EndoSH obtenidas en el Ejemplo 14. Línea de tendencia para EndoSH: y = 2,0784x 1,027 (R2 = 0,9982). Línea de tendencia para EndoS: y = 2,0103x (R2 = 0,9838). Línea de tendencia para EndoS2: y = 1,0297*- 0,1622 (R2 = 0,9998).
En la Figura 5 se muestra una gráfica del porcentaje de conversión (corte) de trastuzumab con alto contenido en manosa a pH 6 mediante las endoglicosidasas EndoS, EndoS2 y EndoSH obtenidas en el Ejemplo 15.Descripción detallada de la invención
Definiciones
[0017] El verbo "comprender", y sus conjugaciones, tal como se usa en esta descripción y en las reivindicaciones, se usa en su sentido no limitativo para significar que los elementos que siguen a la palabra están incluidos, pero los elementos no mencionados específicamente no están excluidos.
[0018] Además, la referencia a un elemento por el artículo indefinido "un" o "una" no excluye la posibilidad de que esté presente más de uno de los elementos, a menos que el contexto requiera claramente que exista uno y solo uno de los elementos. Por tanto, el artículo indefinido "un" o "una" suele significar "al menos un/a”.
[0019] El término general "azúcar" se utiliza en este documento para indicar un monosacárido, por ejemplo, glucosa (Glc), galactosa (Gal), manosa (Man) y fucosa (Fuc). El término "derivado de azúcar" se utiliza en el presente documento para indicar un derivado de un azúcar monosacárido, es decir, un azúcar monosacárido que comprende sustituyentes y/o grupos funcionales. Entre los ejemplos de un derivado de azúcar se incluyen los aminoazúcares y ácidos de azúcar, por ejemplo, glucosamina (GlcNH2), galactosamina (GaINHz), N-acetilglucosamina (GIcNAc), N-acetilgalactosamina (GaINAc), ácido siálico (Sia), también conocido como ácido N-acetilneuramínico (NeuNAc), y ácido N-acetilmurámico (MurNAc), ácido glucurónico (GlcA) y ácido idurónico (IdoA).
[0020] El término "nucleótido" se utiliza en este documento con su significado científico normal. El término "nucleótido" se refiere a una molécula que está compuesta por una nucleobase, un azúcar de cinco carbonos (ya sea ribosa o 2-desoxirribosa) y uno, dos o tres grupos fosfato. Sin el grupo fosfato, la nucleobase y el azúcar componen un nucleósido. Por tanto, un nucleótido también puede denominarse nucleósido monofosfato, nucleósido difosfato o nucleósido trifosfato. La nucleobase puede ser adenina, guanina, citosina, uracilo o timina. Entre los ejemplos de nucleótidos se incluyen uridina difosfato (UDP), guanosina (GDP), timidina difosfato (TDP), citidina difosfato (CDP) y citidina monofosfato (CMP).
[0021] El término "proteína" se utiliza en este documento en su significado científico normal. En el presente documento, los polipéptidos que comprenden aproximadamente 10 o más aminoácidos se consideran proteínas. Una proteína puede comprender aminoácidos naturales, pero también no naturales.
[0022] Las proteínas y enzimas incluyen mutantes de las mismas. Por ejemplo, "endoglicosidasa" incluye tanto endoglicosidasas nativas (de tipo salvaje) como endoglicosidasas mutantes, siempre que la actividad endoglicosidasa se mantenga sustancialmente. Un dominio que tiene una secuencia de aminoácidos que es diferente de una secuencia de aminoácidos de tipo salvaje se denomina aquí dominio mutante. La mutación puede, por ejemplo, comprender un único cambio de aminoácido (una mutación puntual), pero también múltiples cambios de aminoácidos (por ejemplo, de 1 a 10, preferiblemente de 1 a 6, más preferiblemente de 1, 2, 3 o 4, incluso más preferiblemente de 1 o 2 aminoácidos), o una deleción o inserción de uno o más (por ejemplo, de 1 a 10, preferiblemente de 1 a 6, tal como 1, 2, 3 o 4, preferiblemente de 1 o 2) aminoácidos. Alternativamente, se pueden aplicar deleciones o inserciones más grandes a la enzima. Por ejemplo, se ha descubierto que un fragmento de la endoglicosidasa D (deleción de 599 aminoácidos de su porción C-terminal) conserva su actividad endoglicosidasa (Yamamoto et al. en Glycoconjugate J. 2005, 22, 35-42). El experto conoce las posibilidades a este respecto y, siempre que se conserve sustancialmente la actividad endoglicosidasa, la enzima puede contener cualquier tipo de mutación.
[0023] El término "glicoproteína" se utiliza en este documento en su significado científico normal y se refiere a una proteína que comprende una o más cadenas de monosacáridos u oligosacáridos ("glicanos") unidas covalentemente a la proteína. Un glicano puede estar unido a un grupo hidroxilo de la proteína (glicano unido a O), por ejemplo al grupo hidroxilo de la serina, treonina, tirosina, hidroxilisina o hidroxiprolina, o a una función amida de la proteína (N-glicoproteína), por ejemplo, asparagina o arginina, o a un carbono de la proteína (C-glicoproteína), por ejemplo, triptófano. Una glicoproteína puede comprender más de un glicano, puede comprender una combinación de uno o más monosacáridos y uno o más oligosacáridos glicanos, y puede comprender una combinación de glicanos unidos a N, unidos a O y unidos a C. Se estima que más del 50 % de todas las proteínas tienen algún tipo de glicosilación y, por tanto, se consideran glicoproteínas. Entre los ejemplos de glicoproteínas se incluyen PSMA (antígeno prostático específico de membrana), CAL (lipasa de Candida antartica), gp41, gp120, EPO (eritropoyetina), proteína anticongelante y anticuerpos.
[0024] El término "glicano" se utiliza en este documentocoen su significado científico normal y se refiere a una cadena de monosacáridos u oligosacáridos que está unida a una proteína. Por tanto, el término glicano se refiere a la parte carbohidrato de una glicoproteína. El glicano está unido a una proteína a través del carbono C-1 de un azúcar, que puede no tener más sustituciones adicionales (monosacárido) o puede tener sustituyentes adicionales en uno o más de sus grupos hidroxilo (oligosacárido). Un glicano de origen natural normalmente comprende de 1 a aproximadamente 10 restos de sacárido. Sin embargo, cuando una cadena de sacáridos más larga está unida a una proteína, dicha cadena de sacáridos también se considera aquí un glicano. Un glicano de una glicoproteína puede ser un monosacárido. Normalmente, un glicano monosacárido de una glicoproteína consiste en una única N-acetilglucosamina (GlcNAc), glucosa (Glc), manosa (Man) o fucosa (Fuc) unida covalentemente a la proteína. Un glicano también puede ser un oligosacárido. Una cadena de oligosacáridos de una glicoproteína puede ser lineal o ramificada. En un oligosacárido, el azúcar que está directamente unido a la proteína se llama azúcar central. En un oligosacárido, un azúcar que no está directamente unido a la proteína y está unido a al menos otros dos azúcares se llama azúcar interno. En un oligosacárido, un azúcar que no está directamente unido a la proteína, sino a otro azúcar, es decir, que no lleva más sustituyentes azúcar en uno o más de sus otros grupos hidroxilo, se llama azúcar terminal. Para evitar dudas, pueden existir múltiples azúcares terminales en un oligosacárido de una glicoproteína, pero solo un azúcar central. El extremo de un oligosacárido que está directamente unido a la proteína se llama extremo reductor de un glicano. El otro extremo del oligosacárido se llama extremo no reductor de un glicano. Un glicano puede ser un glicano unido a O, un glicano unido a N o un glicano unido a C.
[0025] En un glicano unido a O, un glicano monosacárido u oligosacárido está unido a un átomo de O en un aminoácido de la proteína, típicamente a través de un grupo hidroxilo de serina (Ser) o treonina (Thr). Para los glicanos unidos a O, existe una amplia diversidad de cadenas. Los glicanos unidos a O de origen natural suelen presentar un resto a-O-GalNAc unido a serina o treonina, además sustituido con galactosa, ácido siálico y/o fucosa. El aminoácido hidroxilado que lleva la sustitución de glicano puede formar parte de cualquier secuencia de aminoácidos en la proteína.
[0026] En un glicano unido a N, un glicano monosacárido u oligosacárido está unido a la proteína a través de un átomo de N en un aminoácido de la proteína, típicamente a través de una amida de nitrógeno en la cadena lateral de la asparagina (Asn) o la arginina (Arg). Para los glicanos unidos a N, existe una amplia diversidad de glicanos. Los glicanos unidos a N de origen natural presentan un resto p-N-GlcNAc unido a asparagina, a su vez con un sutituyente adicional p-GlcNAc en su 4-OH, a su vez con un sutituyente adicional p-Man en su 4-OH, a su vez con un sutituyente adicional a-Man en su 3-OH y 6-OH, lo que lleva al glicano pentasacárido Man<3>GlcNAc<2>. El resto central GlcNAc puede tener incorporado a-Fuc en la posición 6-OH. Man<3>GlcNAc<2>es la estructura base de oligosacáridos común de casi todas las glicoproteínas unidas a N y puede transportar una amplia variedad de otros sustituyentes, incluidos, entre otros, Man, GIcNAc, Gal y ácido siálico. La asparagina que está reemplazada con el glicano en su cadena lateral suele ser parte de la secuencia Asn-X-Y, siendo X cualquier aminoácido excepto prolina e Y siendo serina o treonina.
[0027] En un glicano unido a C, un glicano monosacárido u oligosacárido está unido a un átomo de C en un aminoácido de la proteína, típicamente a un átomo de C del triptófano (Trp).
[0028] El término "anticuerpo" se utiliza en este documento en su significado científico normal. Un anticuerpo es una proteína generada por el sistema inmunitario que es capaz de reconocer y unirse a un antígeno específico. Un anticuerpo es un ejemplo de glicoproteína. El término anticuerpo en el presente documento se usa en su sentido más amplio e incluye específicamente anticuerpos monoclonales, anticuerpos policlonales, dímeros, multímeros, anticuerpos multiespecíficos (por ejemplo, anticuerpos biespecíficos), fragmentos de anticuerpos y anticuerpos de cadena simple y doble. En el presente documento también se pretende que el término "anticuerpo" incluya anticuerpos humanos, anticuerpos humanizados, anticuerpos quiméricos y anticuerpos que se unen específicamente al antígeno del cáncer. El término "anticuerpo" pretende incluir anticuerpos completos, pero también fragmentos de un anticuerpo que se unen al antígeno, por ejemplo, un fragmento Fab de un anticuerpo, F(ab')<2>, fragmento Fv o fragmento Fc de un anticuerpo escindido, un fragmento scFv-Fc, un minicuerpo, un diacuerpo o un scFv. Además, el término incluye anticuerpos modificados genéticamente y derivados de un anticuerpo. Los anticuerpos, fragmentos de anticuerpos y anticuerpos modificados genéticamente pueden obtenerse mediante métodos conocidos en la técnica. Entre los ejemplos típicos de anticuerpos se incluyen, entre otros, abciximab, rituximab, basiliximab, palivizumab, infliximab, trastuzumab, alemtuzumab, adalimumab, tositumomab-I131, cetuximab, ibrituximab tiuxetan, omalizumab, bevacizumab, natalizumab, ranibizumab, panitumumab, eculizumab, certolizumab pegol, golimumab, canakinumab, catumaxomab, ustekinumab, tocilizumab, ofatumumab, denosumab, belimumab, ipilimumab y brentuximab.
[0029] Una "porción conectora" se define en este caso como un resto que conecta dos o más elementos de un compuesto. La enzima de fusión según la invención puede contener, por ejemplo, una porción conectora que conecta las dos unidades de endoglicosidasa. En el contexto de las enzimas de fusión según la presente invención, las porciones conectaras normalmente contienen al menos un aminoácido y, de la manera más preferible, consisten en uno o más aminoácidos.
[0030] Un "bioconjugado" se define en el presente documento como un compuesto en el que una biomolécula está unida covalentemente a una molécula diana a través de una porción conectora. Un bioconjugado comprende una o más biomoléculas y/o una o más moléculas diana. La porción conectora puede comprender uno o más restos espaciadores. Una molécula diana puede ser una sustancia activa, una molécula indicadora, un polímero, una superficie sólida, un hidrogel, una nanopartícula, una micropartícula o una biomolécula.
[0031] El término "enzima de fusión" en el presente documento se refiere a una enzima en la que las secuencias de aminoácidos de dos o más enzimas que originalmente pertenecían a enzimas separadas se unen entre sí, opcionalmente mediante una porción conectora. Las enzimas de fusión son conocidas en la técnica y pueden crearse mediante la unión de dos o más genes que originalmente codifican enzimas separadas. La traducción de este gen da como resultado un único polipéptido con propiedades funcionales derivadas de cada una de las enzimas originales.
Enzima de fusión
[0032] En un primer aspecto, la invención se refiere a una enzima de fusión que comprende dos endoglicosidasas, opcionalmente conectadas mediante una porción conectora. La enzima de fusión según la invención puede representarse mediante la estructura (1 ):
EndoX-(L)p-EndoY (1)
[0033] En el presente documento, EndoX y EndoY son individualmente una endoglicosidasa, L es una porción conectora y p es 0 o 1. EndoX es EndoS y EndoY es una endoglicosidasa distinta de EndoX. En el contexto de la presente invención, la "enzima de fusión" también puede denominarse "proteína de fusión". La enzima de fusión según la invención es preferiblemente una fusión de extremo a extremo, ya sea directa o mediante una porción conectora L.
Endoglicosidasa
[0034] Las endoglicosidasas se conocen en la técnica como enzimas que escinden oligosacáridos entre dos enlaces glicosídicos, liberándolos como tales de glicoproteínas, glicopéptidos o glicolípidos. Estos oligosacáridos suelen denominarse glicanos. En el contexto de la presente invención, "Endo" se refiere a endoglicosidasa. Las endoglicosidasas hidrolizan el enlace entre dos unidades de azúcar en un oligosacárido o polisacárido, pero no entre la unidad central de azúcar, que está directamente unida a la parte peptídica de una glicoproteína, y el aminoácido al que está conectada. Las endoglicosidasas normalmente hidrolizan el enlace entre los dos residuos centrales de N-acetilglucosamina (GIcNAc) en glicanos unidos a N, dejando así el residuo central de GlcNAc conectado a la parte peptídica de la glicoproteína.
[0035] En el contexto de la presente invención, el término endoglicosidasa abarca todos los miembros de la familia de las endoglicosidasas que liberan oligosacáridos a partir de glicoproteínas, glicopéptidos o glicolípidos. La endoglicosidasa también puede escindir cadenas de polisacáridos entre residuos que no son el residuo terminal, aunque es más común liberar oligosacáridos de moléculas de lípidos y proteínas conjugadas.
[0036] En el contexto de la presente invención, el término endoglicosidasa abarca tanto las endoglicosidasas sin desnaturalizar como las endoglicosidasas truncadas y sus mutantes, siempre que se conserve sustancialmente la actividad endoglicosidasa. En otras palabras, la secuencia de aminoácidos de EndoX y EndoY puede comprender una secuencia de aminoácidos diferente en comparación con la endoglicosidasa sin desnaturalizar. En una forma de realización, la secuencia de aminoácidos de EndoX y EndoY comprende un mutante. En una forma de realización, la secuencia de aminoácidos de EndoX y EndoY no comprende un mutante. En una forma de realización, la secuencia de aminoácidos de EndoX y EndoY comprende una secuencia truncada. En una forma de realización, la secuencia de aminoácidos de EndoX y EndoY no comprende una secuencia truncada. Cuando se observa la secuencia de EndoX y EndoY individualmente, se prefiere que cada una de EndoX y EndoY tenga al menos un 80 % de identidad de secuencia con la correspondiente secuencia de aminoácidos nativa del dominio catalítico de la endoglicosidasa, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la secuencia de aminoácidos nativa correspondiente. De la manera más preferible, cada una de EndoX y EndoY tiene una identidad de secuencia del 100 % con la secuencia de aminoácidos correspondiente del dominio catalítico de la endoglicosidasa. Alternativa o adicionalmente, se prefiere que cada una de EndoX y EndoY tenga al menos un 80 % de similitud de secuencia con la secuencia de aminoácidos nativa correspondiente, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de similitud de secuencia con la correspondiente secuencia de aminoácidos nativa del dominio catalizador de la endoglicosidasa. De la manera más preferible, cada una de EndoX y EndoY tiene un 100 % de similitud de secuencia con la correspondiente secuencia de aminoácidos nativa del dominio catalítico de la endoglicosidasa.
[0037] La identidad de secuencia y las similitudes se pueden calcular fácilmente mediante métodos conocidos y/o métodos de programas informáticos conocidos en la técnica, tales como BLASTP, disponible públicamente en NCBI y otras fuentes (BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894; Altschul, S., et al., J. Mol. Biol. 215:403-410 (1990), incorporados por referencia.
[0038] Los glicanos que pueden ser escindidos por las glicosidasas existen en varias glicoformas, que generalmente se agrupan en tres tipos: con alto contenido en manosa, complejas e híbridas. Los tres tipos tienen un núcleo de p1,4-N,N'-diacetilquitobiosa (GlcNAc<2>), conectado a un trisacárido formado por manosas (Mana). Opcionalmente, la GlcNAc central puede estar fucosilada, pero no es siempre es así. Los glicanos con alto contenido en manosa contienen al menos 2 residuos de manosa adicionales, lo que normalmente da como resultado de 5 a 9 residuos de manosa. Los glicanos complejos tienen uno o más monómeros de azúcar, que no son mañosa, conectados a dos de los residuos de mañosa de la unidad central Mans. Estos monómeros de azúcar adicionales normalmente se seleccionan de entre GIcNAc, galactosa (Gal) y ácido siálico (Neu5Ac). Los glicanos complejos existen en formas bi, tri y tetraantenarias, dependiendo del número de (oligo)sacáridos que están conectados a la unidad central Man5. Los glicanos híbridos tienen un oligosacárido con alto contenido en manosa conectado a uno de los residuos de manosa de la unidad central Man5, y un oligosacárido de tipo complejo conectado al otro residuo de manosa. En la Figura 1 se ofrece una descripción general de los tipos de glicanos. Incluso dentro de un tipo de glicano específico, existen muchas posibilidades, lo que aumenta la heterogenicidad de las glicoproteínas. Por ejemplo, los glicanos complejos biantenarios unidos al residuo N297 de los anticuerpos pueden existir en varias glicoformas distintas, incluidas, entre otras, G1, G1F, G0F y SG1F, como se muestra en la Figura 2.
[0039] Las endo-p-N-acetilglucosaminidasas (ENGasas, también denominadas endoglicosidasas o Endos), normalmente hidrolizan el N-glicano de una glicoproteína en el enlace p-1,4-glicosídico de la quitobiosa central. Estas enzimas, que se encuentran principalmente en GH18 y GH85 en la clasificación CAZy (Lombard et al. en Nucleic Acid Res. 2014, 42, D490) se distribuyen ampliamente desde bacterias hasta animales y participan en diversas funciones biológicas, como el metabolismo de los glicanos o la patogénesis bacteriana (Karamanos, Adv. Biochem. 2013, 1, 81). Las endoglicosidasas suelen ser específicas para la hidrólisis de uno o dos tipos de glicanos. Algunas son específicas para la hidrólisis de glicanos con alto contenido en manosa (por ejemplo, EndoA, EndoD, EndoT), mientras que otras, además de los glicanos con alto contenido en manosa, también escinden glicanos híbridos (por ejemplo, EndoF1, EndoH). También existen endoglicosidasas específicas para la hidrólisis de glicanos complejos en varias variantes. Una descripción general de las diferentes actividades se divulga en Freeze et al. en Curr. Protoc. Mol. Biol., 2010, 89:17.13A.1-17. La EndoS escinde glicanos complejos biantenarios, triantenarios y tetraantenarios, pero su actividad se limita casi exclusivamente a los anticuerpos, en particular la cadena pesada de IgG.
[0040] EndoX y EndoY son dos endoglicosidasas distintas. EndoX es EndoS y EndoY se selecciona preferiblemente del grupo que consiste en EndoA, EndoBi, EndoBH, EndoBT, EndoCE, EndoD, EndoE, EfEndo18A, EndoF1, EndoF2, EndoF3, EndoH, EndoLL, EndoM, EndoOm y EndoT. Estas endoglicosidasas y sus secuencias de aminoácidos son conocidas por los expertos. A continuación, se proporcionan algunas secuencias de aminoácidos preferidas para endoglicosidasas específicas.
[0041] En una forma de realización preferida, EndoS tiene al menos un 80 %, preferiblemente al menos un 90 %, más preferiblemente al menos un 95 % de identidad de secuencia con la SEQ ID N.° 4 o la SEQ ID N.° 5, de la manera más preferible, EndoS tiene un 100 % de identidad de secuencia con la SEQ ID N.° 4 o la SEQ ID N.° 5. En una forma de realización, EndoS tiene la SEQ ID N.° 4 o la SEQ ID N.° 5. Preferiblemente, EndoS tiene las identidades de secuencia indicadas con la SEQ ID N.° 4.
SEQ ID n° 4:
MPSIDSLHYLSENSKKEFKEELSKAGQESQKVKEILAKAQQADKQAQELAKMKIPEKIPMKPLHGPLYGGYF RTWHDKTSDPTEKDKVNSMGELPKEVDLAFIFHDWTKDYSLFWKELATKHVPKLNKQGTRVIRTIPWRFLAG GDNSGIAEDTSKYPNTPEGNKALAKAIVDEYVYKYNLDGLDVDVEHDSIPKVDKKEDTAGVERSIQVFEEIG KLIGPKGVDKSRLFIMDSTYMADKNPLIERGAPYINLLLVQVYGSQGEKGGWEPVSNRPEKTMEERWQGYSK YIRPEQYMIGFSFYEENAQEGNLWYDINSRKDEDKANGINTDITGTRAERYARWQPKTGGVKGGIFSYAIDR DGVAHQPKKYAKQKEFKDATDNIFHSDYSVSKALKTVMLKDKSYDLIDEKDFPDKALREAVMAQVGTRKGDL ERFNGTLRLDNPAIQSLEGLNKFKKLAQLDLIGLSRITKLDRSVLPANMKPGKDTLETVLETYKKDNKEEPA
TIPPVSLKVSGLTGLKELDLSGFDRETLAGLDAATLTSLEKVDISGNKLDLAPGTENRQIFDTMLSTISNHV GSNEQTVKFDKQKPTGHYPDTYGKTSLRLPVANEKVDLQSQLLFGTVTNQGTLINSEADYKAYQNHKIAGRS FVDSNYHYNNFKVSYENYTVKVTDSTLGTTTDKTLATDKEETYKVDFFSPADKTKAVHTAKVIVGDEKTMMV NLAEGATVIGGSADPVNARKVFDGQLGSETDNISLGWDSKQSIIFKLKEDGLIKHWRFFNDSARNPETTNKP IQEASLQIFNIKDYNLDNLLENPNKFDDEKYWITVDTYSAQGERATAFSNTLNNITSKYWRWFDTKGDRYS SPWPELQILGYPLPNADTIMKTVTTAKELSQQKDKFSQKMLDELKIKEMALETSLNSKIFDVTAINANAGV LKDCIEKRQLLKK
SEQ ID n° 5:
MGSSHHHHHHSSGLVPRGSHMPSIDSLHYLSENSKKEFKEELSKAGQESQKVKEILAKAQQADKQAQELAKM KIPEKIPMKPLHGPLYGGYFRTWHDKTSDPTEKDKVNSMGELPKEVDLAFIFHDWTKDYSLFWKELATKHVP KLNKQGTRVIRTIPWRFLAGGDNSGIAEDTSKYPNTPEGNKALAKAIVDEYVYKYNLDGLDVDVEHDSIPKV DKKEDTAGVERSIQVFEEIGKLIGPKGVDKSRLFIMDSTYMADKNPLIERGAPYINLLLVQVYGSQGEKGGW EPVSNRPEKTMEERWQGYSKYIRPEQYMIGFSFYEENAQEGNLWYDINSRKDEDKANGINTDITGTRAERYA RWQPKTGGVKGGIFSYAIDRDGVAHQPKKYAKQKEFKDATDNIFHSDYSVSKALKTVMLKDKSYDLIDEKDF PDKALREAVMAQVGTRKGDLERFNGTLRLDNPAIQSLEGLNKFKKLAQLDLIGLSRITKLDRSVLPANMKPG KDTLETVLETYKKDNKEEPATIPPVSLKVSGLTGLKELDLSGFDRETLAGLDAATLTSLEKVDISGNKLDLA PGTENRQIFDTMLSTISNHVGSNEQTVKFDKQKPTGHYPDTYGKTSLRLPVANEKVDLQSQLLFGTVTNQGT LINSEADYKAYQNHKIAGRSFVDSNYHYNNFKVSYENYTVKVTDSTLGTTTDKTLATDKEETYKVDFFSPAD KTKAVHTAKVIVGDEKTMMVNLAEGATVIGGSADPVNARKVFDGQLGSETDNISLGWDSKQSIIFKLKEDGL IKHWRFFNDSARNPETTNKPIQEASLQIFNIKDYNLDNLLENPNKFDDEKYWITVDTYSAQGERATAFSNTL NNITSKYWRWFDTKGDRYSSPWPELQILGYPLPNADTIMKTVTTAKELSQQKDKFSQKMLDELKIKEMAL ETSLNSKIFDVTAINANAGVLKDCIEKRQLLKK
[0042] En una forma de realización preferida, EndoH tiene al menos un 80 %, preferiblemente al menos un 90 %, más preferiblemente al menos un 95 % de identidad de secuencia con la SEQ ID N.° 6, más preferiblemente EndoH tiene un 100 % de identidad de secuencia con la SEQ ID N.° 6. En una forma de realización, EndoH tiene SEQ ID N.° 6. SEQ ID n° 6:
APAPVKQGPTSVAYVEVNNNSMLNVGKYTLADGGGNAFDVAVIFAANINYDTGTKTAYLHFNENVQRVLDNA VTQIRPLQQQGIKVLLSVLGNHQGAGFANFPSQQAASAFAKQLSDAVAKYGLDGVDFDDEYAEYGNNGTAQP NDSSFVHLVTALRANMPDKIISLYNIGPAASRLSYGGVDVSDKFDYAWNPYYGTWQVPGIALPKAQLSPAAV EIGRTSRSTVADLARRTVDEGYGVYLTYNLDGGDRTADVSAFTRELYGSEAVRTP
[0043] En una forma de realización preferida, EndoFI tiene al menos un 80 %, preferiblemente al menos un 90 %, más preferiblemente al menos un 95 % de identidad de secuencia con la SEQ ID N.° 7, más preferiblemente EndoFI tiene un 100 % de identidad de secuencia con la SEQ ID N.° 7. En una forma de realización, EndoF1 tiene la SEQ ID N.° 7. SEQ ID n° 7:
AVTGTTKANIKLFSFTEVNDTNPLNNLNFTLKNSGKPLVDMWLFSANINYDAANDKVFVSNNPNVQHLLTN RAKYLKPLQDKGIKVILSILGNHDRSGIANLSTARAKAFAQELKNTCDLYNLDGVFFDDEYSAYQTPPPSGF VTPSNNAAARLAYETKQAMPNKLVTVYVYSRTSSFPTAVDGVNAGSYVDYAIHDYGGSYDLATNYPGLAKSG MVMSSQEFNQGRYATAQALRNIVTKGYGGHMIFAMDPNRSNFTSGQLPALKLIAKELYGDELVYSNTPYSKD
W
[0044] En una forma de realización preferida, EndoF2 tiene al menos un 80 %, preferiblemente al menos un 90 %, más preferiblemente al menos un 95 % de identidad de secuencia con la SEQ ID N.° 8, más preferiblemente EndoF2 tiene un 100 % de identidad de secuencia con la SEQ ID N.° 8. En una forma de realización, EndoF2 tiene la SEQ ID N.° 8. SEQ ID n° 8:
MAVNLSNLIAYKNSDHQISAGYYRTWRDSATASGNLPSMRWLPDSLDMVMVFPDYTPPENAYWNTLKTNYVP YLHKRGTKVIITLGDLNSATTTGGQDSIGYSSWAKGIYDKWVGEYNLDGIDIDIESSPSGATLTKFVAATKA LSKYFGPKSGTGKTFVYDTNQNPTNFFIQTAPRYNYVFLQAYGRSTTNLTTVSGLYAPYISMKQFLPGFSFY EENGYPGNYWNDVRYPQNGTGRAYDYARWQPATGKKGGVFSYAIERDAPLTSSNDNTLRAPNFRVTKDLIKI MNP
[0045] En una forma de realización preferida, EndoF3 tiene al menos un 80 %, preferiblemente al menos un 90 %, más preferiblemente al menos un 95 % de identidad de secuencia con la SEQ ID N.° 9, más preferiblemente EndoF3 tiene un 100 % de identidad de secuencia con la SEQ ID N.° 9. En una forma de realización, EndoF3 tiene la SEQ ID N.° 9. SEQ ID n° 9:
MATALAGSNGVCIAYYITDGRNPTFKLKDIPDKVDMVILFGLKYWSLQDTTKLPGGTGMMGSFKSYKDLDTQ
IRSLQSRGIKVLQNIDDDVSWQSSKPGGFASAAAYGDAIKSIVIDKWKLDGISLDIEHSGAKPNPIPTFPGY
AATGYNGWYSGSMAATPAFLNVISELTKYFGTTAPNNKQLQIASGIDVYAWNKIMENFRNNFNYIQLQSYGA
NVSRTQLMMNYATGTNKIPASKMVFGAYAEGGTNQANDVEVAKWTPTQGAKGGMMIYTYNSNVSYANAVRDA
VKN
[0046] En una forma de realización preferida, EfEndo18A tiene al menos un 80 %, preferiblemente al menos un 90 %, más preferiblemente al menos un 95 % de identidad de secuencia con la SEQ ID N.° 10, de la manera más preferible, EfEndo18A tiene un 100 % de identidad de secuencia con la SEQ ID N.° 10. En una forma de realización, EfEndo18A tiene SEQ ID N.° 10. SEQ ID n° 10:
ASTVTPKTVMYVEVNNHDFNNVGKYTLAGTNQPAFDMGIIFAANINYDTVNKKPYLYLNERVQQTLNEAETQ
IRPVQARGTKVLLSILGNHEGAGFANFPTYESADAFAAQLEQWNTYHLDGIDFDDEYAEYGKNGTPQPNNS
SFIWLLQALRNRLGNDKLITFYNIGPAAANSSANPQMSSLIDYAWNPYYSTWNPPQIAGMPASRLGASAVEV
GVNQNLAAQYAKRTKAEQYGIYLMYNLPGKDSSAYISAATQELYGRKTNYSPTVPTP
[0047] Estas secuencias preferidas para las endoglicosidasas individuales también son válidas para la enzima de fusión según la invención. Por lo tanto, para que EndoX sea EndoS, se prefiere que la secuencia de aminoácidos de EndoS sea como se ha definido antes en este documento. El experto es capaz de aplicar las secuencias proporcionadas anteriormente a la enzima de fusión según la fórmula (1 ).
[0048] En una forma de realización, la enzima según la invención comprende una secuencia de aminoácidos seleccionada entre SEQ ID N.°: 4 - SEQ ID N.°: 5, conectada mediante una secuencia de aminoácidos seleccionada entre SEQ ID N.°: 11 y SEQ ID N.°: 12 a otra secuencia de aminoácidos seleccionada entre SEQ ID N.°: 6 - SEQ ID N.°: 10, que tiene individualmente al menos un 50 % de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia con las SEQ ID individuales, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 % , 98 % o un 99 % de identidad de secuencia con respecto a cada una de SEQ ID N.°: 4 - SEQ ID N.°: 12. En una forma de realización preferida, estas identidades de secuencia se aplican a la combinación de SEQ ID en la enzima de fusión según la invención.
[0049] Preferiblemente, la enzima de la invención, que tiene las identidades de secuencia indicadas anteriormente con respecto a la SEQ ID N.°: 2, tiene actividad EndoS y EndoH. De la manera más preferible, la enzima según la invención tiene una identidad de secuencia del 100 % con la SEQ ID N.°: 2. En una forma de realización, la enzima según la invención comprende la SEQ ID N.°: 4 conectada a través de la SEQ ID N.°: 11 a la SEQ ID N.°: 6, tiene individualmente al menos un 50 % de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia con las SEQ ID individuales, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con respecto a la SEQ ID N.°: 4 , SEQ ID N.°: 11 y SEQ ID N.°: 6. En una forma de realización preferida, estas identidades de secuencia se aplican a la combinación de la SEQ ID N.°: 4, SEQ ID N.°: 11 y SEQ ID N.°: 6. Preferiblemente, la enzima de la invención, que tiene las identidades de secuencia indicadas anteriormente con respecto a la SEQ ID N.°: 1, tiene actividad EndoS y EndoH. De la manera más preferible, la enzima según la invención tiene una identidad de secuencia del 100 % con la SEQ ID N.°: 1. En una forma de realización, la enzima según la invención que comprende la SEQ ID N.°: 4 conectada a través de la SEQ ID N.°: 12 a la SEQ ID N.°: 6, que tiene individualmente al menos un 50 % de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia. % de identidad de secuencia con las SEQ ID individuales, tales como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o un 99 % de identidad de secuencia con respecto a la SEQ ID N.°: 4, SEQ ID N.°: 12 y SEQ ID N.°: 6.
[0050] En una forma de realización preferida, la enzima de fusión según la invención tiene al menos un 50 % de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % o, de la manera más preferible, un 100 % de identidad de secuencia con respecto a cualquiera de las SEQ ID N.°: 1, 2, 15, 18 y 21. Las ID de secuencia más preferidas se seleccionan de entre S<e>Q ID N.°: 1 , 2 y 21.
[0051] En una forma de realización, la enzima de fusión según la invención tiene al menos un 50%de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % o, de la manera más preferible, un 100 % identidad de secuencia con respecto a la SEQ ID N.°: 1. En una forma de realización, la enzima de fusión según la invención tiene al menos un 50 % de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o un 99 % o, de la manera más preferible, un 100 % identidad de secuencia con respecto a la SEQ ID N.°: 2. En una forma de realización, la enzima de fusión según la invención tiene al menos un 50 % de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o un 99 % o, de la manera más preferible, un 100 % identidad de secuencia con respecto a la SEQ ID N.°: 15. En una forma de realización, la enzima de fusión según la invención tiene al menos un 50 % de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o un 99 % o, de la manera más preferible, un 100 % identidad de secuencia con respecto a la SEQ ID N.°: 18. En una forma de realización, la enzima de fusión según la invención tiene al menos un 50 % de identidad de secuencia, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o un 99 % o, de la manera más preferible, un 100 % de identidad de secuencia con respecto a la SEQ ID N.°: 21.
[0052] En una forma de realización, EndoY se selecciona del grupo que consiste en EndoA, EndoBi, EndoBH, EndoBT, EndoCE, EndoD, EndoE, EfEndo18A, EndoF1, EndoF2, EndoF3, EndoH, EndoLL, EndoM, EndoOm y EndoT. Un grupo preferido de endoglicosidasas para usar como EndoY consiste en EndoE, EfEndo18A, EndoF1, EndoF2, EndoF3, EndoH, EndoS y EndoT, más preferiblemente en EndoF1, EndoF2, EndoF3, EfEndo18A y EndoH. En una forma de realización, al menos una de entre EndoX y EndoY, preferiblemente EndoY, se selecciona del grupo que consiste en EfEndo18A EndoF1 y EndoH.
[0053] En una forma de realización, EndoY es una endoglicosidasa capaz de escindir un glicano del tipo con alto contenido en manosa, tal como EndoA, EndoE, EfEndo18A, EndoF1, EndoH, EndoM o EndoT. Preferiblemente, la endoglicosidasa capaz de escindir un glicano del tipo alto en manosa se selecciona del grupo que consiste en EndoE, EfEndo18A, EndoF1, EndoH y EndoT, más preferiblemente se selecciona del grupo que consiste en EfEndo18A, EndoF1 y EndoH. De la manera más preferible, la endoglicosidasa capaz de escindir un glicano del tipo con alto contenido en manosa es EndoH.
[0054] EndoX es una endoglicosidasa capaz de escindir un glicano de tipo complejo, es decir, EndoS. Preferiblemente, EndoY es una endoglicosidasa que tiene una actividad diferente, preferiblemente una endoglicosidasa capaz de escindir un glicano del tipo con alto contenido en manosa.
[0055] Se prefiere especialmente que la enzima de fusión según la invención contenga dos endoglicosidasas distintas que difieran en su actividad endoglicosidasa, ya que dos actividades endoglicosidasa distintas pueden combinarse como tales en una única enzima. Por lo tanto, EndoX y EndoY preferiblemente tienen cada una una actividad endoglicosidasa distinta seleccionada entre la capacidad de hidrolizar glicanos con alto contenido en manosa, la capacidad de hidrolizar glicanos complejos y la capacidad de hidrolizar glicanos híbridos, más preferiblemente seleccionada entre la capacidad de hidrolizar glicanos con alto contenido en manosa y la capacidad de hidrolizar glicanos complejos. Preferiblemente, EndoY es una endoglicosidasa capaz de hidrolizar glicanos con alto contenido en manosa. Preferiblemente, la endoglicosidasa que es capaz de hidrolizar glicanos con alto contenido en manosa también es capaz de hidrolizar glicanos híbridos. Preferiblemente, la endoglicosidasa que es capaz de hidrolizar glicanos complejos es capaz de hidrolizar glicanos complejos biantenarios y/o triantenarios, más preferiblemente todos los glicanos complejos.
[0056] Por ejemplo, cuando EndoX es EndoS y EndoY es EndoH, la enzima de fusión resultante tiene actividad tanto EndoS como EndoH, y es capaz de cortar glicanos complejos en glicoproteínas (como anticuerpos) en la unidad central GlcNAc, dejando solo el residuo central de GlcNAc en la glicoproteína (actividad EndoS), así como el corte (escisión) de glicanos con alto contenido en manosa (actividad EndoH).
[0057] Sorprendentemente, ambas actividades de la enzima de fusión funcionan sin problemas a un pH de alrededor de 7 - 8, mientras que la EndoH monomérica requiere un pH en el rango de 5 - 6, o incluso un pH de 6 para funcionar de manera óptima.
[0058] En una forma de realización, EndoX y EndoY son dos endoglicosidasas distintas que difieren en el pH óptimo de al menos 1 unidad de pH, preferiblemente al menos 1,5 unidad de pH, de la manera más preferible, al menos 2 unidades de pH. El experto conoce el pH óptimo que pertenece a endoglicosidasas específicas. Dichas enzimas de fusión pueden ser activas a un pH específico, que no es el pH óptimo de al menos una de EndoX y EndoY.
[0059] En una forma de realización preferida, EndoX es EndoS y EndoY se selecciona de entre EndoD, EndoH, EndoE, EfEndo18A, EndoT o EndoF1. De este modo, la enzima de fusión es capaz de hidrolizar glicanos complejos (actividad EndoS), así como de hidrolizar glicanos con alto contenido en manosa (actividad EndoD, EndoF1, EndoH, EndoE, EfEndo18A, EndoT o EndoF1). En una forma de realización, EndoX es EndoS y EndoY es preferiblemente EndoF1, EndoH o EfEndo18A, más preferiblemente EndoY es EndoH. De la manera más preferible, EndoX es EndoS y EndoY es EndoH.
[0060] En una forma de realización, EndoY se selecciona de entre EndoF1, EndoF2, EndoF3, EfEndo18A y EndoH.
[0061] Preferiblemente, EndoX es EndoS y EndoY se selecciona de entre EndoF1, EfEndo18A y EndoH.
[0062] En una forma de realización, EndoX es EndoS y EndoY es EndoF1 o EndoH.
[0063] En una forma de realización preferida, la enzima de fusión según la invención se selecciona del grupo formado por enzimas de estructura (1), en donde EndoX = EndoS y EndoY = EndoH; EndoX = EndoS y EndoY = EndoE; EndoX = EndoS y EndoY = EfEndo18A; EndoX = EndoS y EndoY = EndoT; EndoX = EndoS y EndoY = EndoF1. Más preferiblemente, las enzimas de fusión según la invención se seleccionan del grupo que consiste en enzimas con la estructura (1), en donde EndoX = EndoS y EndoY = EndoH; EndoX = EndoS y EndoY = EfEndo18A; EndoX = EndoS y EndoY = EndoF1. Aún más preferiblemente, las enzimas de fusión según la invención se seleccionan del grupo que consiste en enzimas con la estructura (1), en donde EndoX = EndoS y EndoY = EndoH; EndoX = EndoS y EndoY = EfEndo18A; EndoX = EndoS y EndoY = EndoF1. De la manera más preferible, las enzimas de fusión según la invención son una enzima de estructura (1), donde EndoX = EndoS y EndoY = EndoH.
Porción conectora
[0064] En la enzima según la invención, EndoX y EndoY están unidas preferiblemente mediante una porción conectora. En caso de que esté presente una porción conectora, p = 1. En caso de que no esté presente ninguna porción conectora, p = 0. Preferiblemente, p = 1. Las porciones conectoras para enzimas de fusión son conocidas en la técnica y se puede utilizar cualquier porción conectora adecuada, incluidas porciones conectoras flexibles y rígidas. Se puede encontrar más información en Chen et al., Adv. Drug Deliv. Rev.2013, 65, 1357 1369 y Fusion Protein Technologies for Biopharmaceuticals: Application and Challenges, Cap. 4: Fusion Protein Linkers: Effects on Production, Bioactivity, and Pharmacokinetics, 2013, John Wiley & Sons, Inc.
[0065] Preferiblemente, dicha porción conectora es una porción conectora flexible que permite que la proteína adyacente se mueva con relativa libertad.
[0066] En una forma de realización, la porción conectora, preferiblemente la porción conectora flexible, está compuesta de residuos amino y tiene una longitud de 1 a 100 residuos de aminoácidos, preferiblemente de 3 a 59, de 10 a 45 o de 15 a 40 residuos de aminoácidos, tal como 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 o 40 residuos de aminoácidos.
[0067] En una forma de realización, la porción conectora, preferiblemente la porción conectora flexible, está compuesta de residuos amino como glicina, serina, histidina y/o alanina y tiene una longitud de 3 a 59 residuos de aminoácidos, preferiblemente de 10 a 45 o 15 a 40 residuos de aminoácidos, como 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38,39 o 40 residuos de aminoácidos.
[0068] La porción conectora comprende preferiblemente uno o más dominios flexibles que proporcionan flexibilidad a la porción conectora. Preferiblemente, uno o dos, más preferiblemente dos de dichos dominios flexibles están comprendidos en la porción conectora. Dichos dominios flexibles son conocidos en la técnica y normalmente están compuestos de glicina, serina y/o treonina. En una forma de realización, la porción conectora comprende al menos un residuo de glicina, serina y/o treonina. Preferiblemente, al menos el 40 % de los aminoácidos de la porción conectora se seleccionan de entre glicina, serina y treonina, más preferiblemente del 50 al 90 %, de la manera más preferible, del 70 al 85 % de los aminoácidos de la porción conectora se seleccionan de entre glicina, serina y treonina. En una forma de realización, la porción conectora no comprende treonina y los rangos anteriores se aplican a glicina y serina.
[0069] Los dominios flexibles adecuados específicos incluyen dominios GS (como (G4S)n, en donde n es un número entero en el rango de 1 - 10, preferiblemente 1 - 6, de la manera más preferible, 2 - 4), poli-G (tal como Gm, en donde m es un número entero en el rango de 1 - 30, preferiblemente 3 - 20, de la manera más preferible, 5 - 10), porciones conectoras GSAGSAAGSGEF, EGKSSGSGSESKST, PAS (porciones conectoras basadas en Pro, Ala, Ser; véase Schlapschy et al., Protein Eng Des Sel. 2013, 26, 489-501), y porciones conectoras de polipéptido recombinante extendido (XTEN) (véase Podust et al., Protein Eng Des Sel. 2013, 26, 743-753). Los dominios GS, que consisten en tramos de residuos de glicina y serina, son los más preferidos. Por lo tanto, en una forma de realización, la porción conectora comprende uno o más dominios (G<4>S)n, preferiblemente uno o dos, de la manera más preferible, dos dominios.
[0070] Alternativa o adicionalmente, la porción conectora puede comprender uno o más dominios rígidos, tales como dominios que forman hélice □, tales como (EAAAK)o o A(EAAAK)oA (donde o es un número entero en el intervalo de 1 a 10, preferiblemente de 2 a 5, de la manera más preferible, 3 o 4), y dominios ricos en prolina, tal como (XP)q (donde X es cualquier aminoácido, preferiblemente seleccionado de entre alanina, lisina y glutamina, y q es un número entero en el intervalo 2 - 25, preferiblemente 5 - 17).
[0071] Opcionalmente, la porción conectora comprende una etiqueta para facilitar la purificación y/o detección como se conoce en la técnica, tal como una etiqueta Fc, una etiqueta FLAG, una etiqueta poly(His), etiqueta (RP)6R, etiqueta HA y etiqueta Myc. Una etiqueta de este tipo también puede estar presente en otra parte de la porción conectora según la invención. Por tanto, en una forma de realización, la enzima de fusión según la invención comprende una etiqueta para facilitar la purificación y/o detección, tal como una etiqueta Fc, una etiqueta FLAG, una etiqueta poly(His), una etiqueta (RP)6R, una etiqueta HA y una etiqueta Myc, más preferiblemente una etiqueta poly(His). En una forma de realización, la enzima de fusión según la invención comprende una porción conectora, es decir, p = 1 , y la porción conectora comprende una etiqueta para facilitar la purificación y/o detección, tal como una etiqueta Fc, una etiqueta FLAG, una etiqueta poly(His), una etiqueta (RP)6R, una etiqueta HA y una etiqueta Myc, más preferiblemente una etiqueta poly(His). La etiqueta puede estar situada en el extremo C de la porción conectora, en el extremo N de la porción conectora o puede estar incrustada en la porción conectora con aminoácidos adicionales a cada lado de la etiqueta. Se prefiere esta última conformación, especialmente cuando los dominios flexibles están ubicados a ambos lados de la etiqueta, ya que proporciona una accesibilidad óptima de la etiqueta para unirse a una matriz de afinidad.
[0072] En una forma de realización, la porción conectora tiene la estructura (G<4>S)<n1>(H)r(EF)s(G<4>S)<n2>, en donde n1 y n2 individualmente son números enteros en el rango de 1 - 10 , preferiblemente 1 - 6, incluso más preferiblemente 2 - 4, de la manera más preferible, 3, y r es un número entero en el rango de 2 - 10, preferiblemente 4 - 8, de la manera más preferible, preferiblemente 6, y s = 0 o 1. En una forma de realización, la porción conectora tiene la estructura (G<4>S)<3>(H)<6>(G<4>S)<3>, es decir, en donde n1 = 3, n2 = 3, r = 6 y s = 0 (aminoácidos 950 a 985 de SEQ ID N.° 2). En una forma de realización, la porción conectora tiene la estructura (G<4>S)<3>(H)<6>EF(G<4>S)<3>, es decir, en donde n1 = 3, n2 = 3, r = 6 y s = 1 (aminoácidos 950 a 987 de SEQ ID N.° 1).
[0073] En una forma de realización preferida, la porción conectora tiene al menos un 80 %, preferiblemente al menos un 90 %, más preferiblemente al menos un 95 % de identidad de secuencia con la SEQ ID N.° 11 o 12, de la manera más preferible, la porción conectora tiene un 100 % de identidad de secuencia con la SEQ ID N.° 11 o SEQ ID N.° 12. En una forma de realización, la porción conectora tiene la SEQ ID N.° 11. En una forma de realización, la porción conectora tiene la SEQ ID N.° 12.
SEQ ID n° 11: GGGGGSGGGGSGGGGSHHHHHHEFGGGGSGGGGSGGGGS
SEQ ID n° 12: GGGGGSGGGGSGGGGSHHHHHHHGGGGSGGGGSGGGGS
[0074] La enzima de fusión según la invención se puede preparar mediante técnicas rutinarias conocidas en la técnica, tales como introducir un vector de expresión (por ejemplo, plásmido) que comprende la secuencia codificante de la enzima en una célula huésped (por ejemplo,E. coli)para la expresión, a partir del cual se puede aislar la enzima. Alternativamente, la enzima se produce mediante expresión transitoria en CHO. Un posible enfoque para la preparación y purificación de la enzima de fusión según la invención se proporciona en los ejemplos 1 - 4 y 16 - 24, y su funcionamiento se demuestra en los ejemplos 5, 6, 8, 13 - 15 y 25 - 37, en los que varias glicoproteínas, incluido el trastuzumab y el trastuzumab con alto contenido en manosa, se cortan de manera eficiente en un solo paso.
Enzima de fusión preferida
[0075] En una forma de realización especialmente preferida, la invención se refiere a una enzima de fusión que comprende las dos endoglicosidasas EndoS y EndoH. En un ejemplo particular, las dos endoglicosidasas EndoS y EndoH están conectadas mediante una porción conectora, preferiblemente una porción conectora -(Gly<4>Ser)<3>-(His)<6>-(Gly<4>Ser)<3>-. La enzima de fusión según la invención también se denomina EndoSH. En una forma de realización, la enzima según la invención tiene al menos un 50 % de identidad de secuencia con la SEQ ID N.°: 1, preferiblemente al menos un 70 %, más preferiblemente al menos un 80 % de identidad de secuencia con la SEQ ID N.°: 1, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o un 99 % de identidad de secuencia con la SEQ ID N.°: 1. Preferiblemente, la enzima de la invención, que tiene la identidad de secuencia indicada anteriormente con la SEQ ID N.°: 1, tiene actividad EndoS y EndoH. De la manera más preferible, la enzima según la invención tiene un 100 % de identidad de secuencia con la SEQ ID N.°: 1. En una forma de realización, la enzima según la invención tiene al menos un 50 % de identidad de secuencia con la SEQ ID N.°: 2, preferiblemente al menos un 70 %, más preferiblemente al menos un 80%de identidad de secuencia con SEQ ID N.°: 2, tal como al menos un 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o un 99 % de identidad de secuencia con la SEQ ID N.°: 2. Preferiblemente, la enzima de la invención, que tiene la identidad de secuencia indicada anteriormente con la SEQ ID N.°: 2, tiene actividad EndoS y EndoH. de la manera más preferible, la enzima según la invención tiene una identidad de secuencia del 100 % con la SEQ ID N.°: 2.
[0076] También se incluyen enzimas de fusión de EndoS y EndoH, en las que la porción conectora se reemplaza por otra porción conectora adecuada conocida en la técnica, donde dicha porción conectora puede ser rígida o flexible. Preferiblemente, dicha porción conectora es una porción conectora flexible que permite que los dominios proteicos adyacentes se muevan con relativa libertad entre sí. Preferiblemente, dicha porción conectora flexible está compuesta de residuos amino como glicina, serina, histidina y/o alanina y tiene una longitud de 3 a 59 residuos de aminoácidos, preferiblemente 10 a 45 o 15 a 40 residuos de aminoácidos, tales como 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 o 40 residuos de aminoácidos, o de 20 a 38, de 25 a 37 o de 30 a 36 residuos de aminoácidos. Opcionalmente, la enzima de fusión está unida covalentemente a, o comprende, una etiqueta para facilitar la purificación y/o la detección como se conoce en la técnica, tal como una etiqueta Fc, una etiqueta FLAG, una etiqueta poly(His), una etiqueta HA y una tiqueta Myc. El corte de glicoproteínas se conoce en la técnica, por ejemplo, en Yamamoto, Biotechnol. Lett. 2013, 35, 1733, WO 2007/133855 o WO 2014/065661. La enzima según esta forma de realización tiene actividad tanto EndoS como EndoH, y es capaz de cortar glicanos en glicoproteínas (tales como anticuerpos) por la unidad central GlcNAc, dejando solo el residuo central de GlcNAc en la glicoproteína (actividad EndoS), así como también glicanos con alto contenido en manosa (actividad EndoH). Sorprendentemente, ambas actividades de la enzima de fusión funcionan sin problemas a un pH de alrededor de 7 - 8, mientras que la EndoH monomérica requiere un pH de 6 para funcionar de manera óptima.
[0077] Uso
[0078] Otro aspecto de la invención se refiere al uso de la enzima de fusión según la invención para cortar glicoproteínas, preferiblemente para cortar anticuerpos. El corte también puede denominarse desglicosilación y se define con más detalle a continuación, en el contexto del procedimiento según la invención. El uso según este aspecto puede ocurririn vitrooin vivo.
Proceso de corte de glicoproteínas
[0079] La enzima de fusión según la invención es especialmente adecuada para el corte de glicoproteínas. Por tanto, en un aspecto adicional, la invención se refiere a un proceso para cortar glicoproteínas. El proceso según este aspecto puede ocurririn vitrooin vivo.El corte de glicoproteínas se conoce en la técnica, por ejemplo. Yamamoto, Biotechnol. Lett. 2013, 35, 1733, WO 2007/133855 o WO 2014/065661. Las glicoproteínas, como los anticuerpos, normalmente contienen diferentes glicoformas, que requieren diferentes endoglicosidasas para eliminarse. Las enzimas de fusión de la invención son especialmente adecuadas para desglicosilar en un solo paso una glicoproteína que tiene dos cadenas de glicano diferentes. Así, en una forma de realización, la glicoproteína que se somete al proceso según la invención comprende al menos dos glicanos distintos, preferiblemente dos glicanos distintos. Preferiblemente, la glicoproteína comprende al menos un glicano con alto contenido en manosa y al menos un glicano complejo, más preferiblemente la glicoproteína comprende al menos un glicano con alto contenido en manosa, al menos un glicano híbrido y al menos un glicano complejo. El glicano complejo puede ser un glicano bi-, tri- o tetraantenario.
[0080] En una forma de realización especialmente preferida, la glicoproteína es un anticuerpo.
[0081] El proceso según el presente aspecto también puede denominarse proceso para modificar una glicoproteína. El proceso comprendió poner en contacto la glicoproteína con una enzima de fusión según la invención, para obtener una glicoproteína cortada. El proceso también puede denominarse proceso para cortar una glicoproteína o desglicosilación de una glicoproteína. El corte o desglicosilación de una glicoproteína se refiere a la eliminación de un glicano de dicha glicoproteína. La estructura exacta del glicano que se elimina puede variar dependiendo de la naturaleza exacta de las endoglicosidasas que están presentes en la enzima de fusión, pero el residuo central de GlcNAc se mantiene en la glicoproteína en todo momento. El experto apreciará qué enzima de fusión, es decir, qué combinación de endoglicosidasas, es adecuada para cortar qué patrón de glicosilación de la glicoproteína.
[0082] Con las endoglicosidasas convencionales, las glicoproteínas que contienen una combinación de un glicano con alto contenido en manosa y un glicano bi, tri o tetraantenario complejo requerirían dos enzimas distintas para el corte, lo que a menudo requiere diferentes condiciones de solución amortiguadora y rangos de pH. Estas glicoproteínas ahora se pueden cortar eficientemente en un solo paso, sin necesidad de aplicar intercambio de solución amortiguadora para lograr el pH óptimo, con la enzima de fusión según la invención. Así, en una forma de realización, la glicoproteína, preferiblemente el anticuerpo, comprende al menos un glicano con alto contenido en manosa y al menos un glicano bi-, tri- o tetraantenario complejo, más preferiblemente al menos un glicano con alto contenido en mañosa, al menos un glicano híbrido y/o complejo bi-, tri- o tetraantenario. Por ejemplo, la enzima de fusión en la que EndoX es EndoS, y EndoY se selecciona de entre EndoH, EndoE, EfEndo18A, EndoT o EndoF1, es adecuada para cortar una glicoproteína que comprende un complejo de glicano complejo unido a N y un glicano con alto contenido en manosa, para obtener una glicoproteína cortada que comprende solo el/los sustituyente(s) de N-acetilglucosamina central opcionalmente fucosilada.
[0083] El experto conoce las condiciones adecuadas para realizar el corte de glicoproteínas. Por ejemplo, el proceso se lleva a cabo en un medio y a una temperatura que sea eficaz para cortar las glicoproteínas. Normalmente, se pueden aplicar los medios y condiciones que se aplican para una de las enzimas endoglicosidasas individuales. Como el pH óptimo de las endoglicosidasas individuales puede diferir, el proceso se puede llevar a cabo en una forma de realización a un pH que es de 0,5 a 3 unidades de pH, preferiblemente de 1 a 2 unidades de pH, diferente del pH óptimo de una o ambas, preferiblemente una de EndoX y EndoY. Por ejemplo, en el caso de que EndoY sea EndoH, que tiene un pH óptimo de 5 - 6, el proceso se puede llevar a cabo a pH 7 - 8. En una forma de realización, el corte se realiza a un pH en el intervalo de 4 - 9, preferiblemente en el intervalo de 6 - 8, de la manera más preferible, en el intervalo de 7 - 8. Los inventores han descubierto sorprendentemente que la enzima de fusión según la invención en la que EndoX = EndoS y EndoY = EndoH es completamente operativa a un pH superior a 7, mientras que el rango de pH funcional para EndoH es de 5,0 a 6,0, con el pH óptimo a 5,5.
[0084] Además, los inventores han descubierto que la actividad de una endoglicosidasa particular en una proteína de fusión puede mostrar una mayor eficiencia de corte en comparación con la misma endoglicosidasa como una sola enzima.
[0085] El corte proporciona glicoproteínas cortadas, en las que todos los restos de glicano presentes en la glicoproteína original, independientemente de su tipo y glicoforma, se cortan y solo quedan los sustituyentes de N-acetilglucosamina central opcionalmente fucosilados. Dicho sustituyente central de N-acetilglucosamina opcionalmente fucosilado se une normalmente mediante un enlace N-glicosídico al átomo de nitrógeno de la amida en la cadena lateral de un aminoácido de asparagina de la glicoproteína, tal como N297 cuando la glicoproteína es un anticuerpo.
[0086] La glicoproteína cortada obtenida de este modo se puede utilizar según se considere adecuado. Por ejemplo, cuando la glicoproteína es el producto de interés, la glicoproteína cortada según la invención es homogénea con respecto a los patrones de glicosilación. Esto puede ser particularmente importante cuando la glicoproteína se usa como medicamento, ya que la eficacia terapéutica y/o la toxicidad pueden variar para diferentes glicoformas de la glicoproteína. Tales variaciones impredecibles en eficacia y toxicidad se erradican cuando se utiliza el proceso según la invención.
[0087] Alternativamente, la glicoproteína cortada se puede usar para una funcionalización adicional, tal como mediante la introducción de un resto de azúcar opcionalmente sustituido que se conoce en la técnica, por ejemplo, en van Geel et.al, Bioconjugate Chem, 2015, 26, 2233. La glicoproteína cortada se puede poner en contacto con un compuesto con la fórmula S-P, en la que S es un resto de azúcar opcionalmente sustituido y P es un nucleótido, en presencia de un catalizador adecuado, tal como una glicosiltransferasa o N-acetilglicosiltransferasa. La glicoproteína modificada así obtenida comprende un resto de azúcar S conectado al extremo no reductor del glicano cortado. Usando un resto de azúcar S sustituido, las posibilidades de modificación o funcionalización adicional de la glicoproteína a través de dicho sustituyente son infinitas. Esta secuencia de pasos de reacción encuentra un uso particular en la preparación de bioconjugados, tales como conjugados anticuerpo-fármaco. Dichos pasos son conocidos por el experto en la materia, por ejemplo, a partir de WO 2014/065661.
Ejemplos
[0088] Análisis RP-HPLC de anticuerpos monoclonales reducidos: Antes del análisis por RP-HPLC, las muestras se redujeron incubando una solución de 10 pg de IgG (modificada) durante 15 minutos a 37 °C con DTT 10 mM y Tris 100 mM, pH 8,0 en un volumen total de 50 pl. A la muestra reducida se le añadió una solución de ACN al 49 %, MQ al 49 % y ácido fórmico al 2 % (50 pl). La HPLC de fase inversa se realizó en una HPLC Agilent 1100 utilizando una columna ZORBAX Poroshell 300SB-C8 de 1 x 75 mM, 5 pm (Agilent Technologies) a 1 ml/min a 70 °C utilizando un gradiente lineal de 16,9 minutos del 25 al 50 % de solución amortiguadora B (con solución amortiguadora A = 90 % MQ, 10 % ACN, 0,1 % TFA y solución amortiguadora B = 90 % ACN, 10 % MQ, 0,1 % TFA).
[0089] Análisis por espectrometría de masas de anticuerpos monoclonales: Antes del análisis por espectrometría de masas, las IgG se trataron con DTT, que permite el análisis de cadenas ligeras y pesadas, o se trataron con Fabricator™ (disponible comercialmente en Genovis, Lund, Suecia), que permite el análisis del fragmento Fc/2. Para el análisis de las cadenas ligera y pesada, se incubó una solución de 20 pg de IgG (modificada) durante 5 minutos a 37 °C con DTT 100 mM en un volumen total de 4 pl. Si están presentes, las funcionalidades azida se reducen a aminas en estas condiciones. Para el análisis del fragmento Fc/2, se incubó una solución de 20 pg de IgG (modificada) durante 1 hora a 37 °C con Fabricator™ (1.25 U/pL) en solución salina regulada con fosfato (PBS) a pH 6,6 en un volumen total de 10 pL. Después de la reducción o digestión con el Fabricator, las muestras se lavaron tres veces con milliQ utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Millipore), lo que dio como resultado un volumen de muestra final de aproximadamente 40 pl. A continuación, las muestras se analizaron mediante tiempo de vuelo con ionización por electroespray (ESI-TOF) en un AccuTOF de JEOL. Los espectros desconvolucionados se obtuvieron utilizando el software Magtran.
Ejemplo 1: clonación de la proteína de fusión EndoSH en el vector de expresión (pET22B)
[0090] Se obtuvo de Genscript un vector pET22B que contiene una secuencia codificante EndoS-(G4S)3-(His)6-EF-(G4S)3-EndoH (EndoSH) (EndoSH se identifica mediante la SEQ ID N.°: 1) entre los sitios EcoRl-HindIII. La secuencia de ADN para la proteína de fusión EndoSH consiste en los residuos codificantes 48-995 de EndoS fusionados mediante una porción conectora N-terminal de glicina-serina (GS) a los residuos codificantes 41-313 de EndoH. La porción conectora glicina-serina (GS) comprende un formato -(G4S)3-(His)6-EF-(G4S)3-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
Ejemplo 2: expresión en E. coli de la proteína de fusión EndoSH
[0091] La expresión de la proteína de fusión EndoSH (identificada por SEQ ID N.°: 1) comienza con la transformación del plásmido (pET22b-EndoSH) en células BL21. El siguiente paso es la inoculación de 500 ml de cultivo (medio LB ampilicina) con células BL21. Cuando la DO600 alcanzó 0,7, los cultivos se indujeron con IPTG 1 mM (500 pl de solución madre 1 M).
Ejemplo 3: purificación de la proteína de fusión EndoSH de E. coli
[0092] Después de inducción durante la noche a 16 °C, el cultivo se sedimentó mediante centrifugación. El sedimento se resuspendió en 40 ml de PBS y se incubó en hielo con 5 ml de lisozima (10 mg/ml) durante 30 minutos. Después de media hora, se añadieron 5 ml de Triton-X-100 al 10 % y se sonicaron (10 minutos) en hielo. Después de la sonicación, los restos celulares se eliminaron mediante centrifugación (10 minutos a 8000 xg) seguidax de filtración a través de un filtro con un diámetro de poro de 0,22 pM. Alternativamente, la lisis del sedimento que contiene EndoSH se puede realizar mediante prensa de French. En este caso, el sedimento se resuspende en 10 ml de PBS/G de sedimento. La suspensión celular se lisa tres veces bajo presión (20000 25000 psi) mediante una prensa de French usando Emulsiflex C3, Avestin. Después de la prensa de French, los restos celulares se eliminaron mediante centrifugación (20 minutos, 10000 xg). El extracto/fracción soluble se cargó en una columna HisTrap HP de 5 ml (GE Healthcare). La columna se lavó primero con solución amortiguadora A (solución amortiguadora Tris 20 mM, imidazol 20 mM, NaCl 500 mM, pH 7,5). La proteína retenida se eluyó con solución amortiguadora B (Tris 20 mM, NaCl 500 mM, imidazol 250 mM, pH 7,5, 10 ml). Las fracciones se analizaron mediante SDS-PAGE en geles de poliacrilamida (12 %). Las fracciones que contenían proteína diana purificada se combinaron y la solución amortiguadora se intercambió con Tris 20 mM, pH 7,5 y NaCl 150 mM mediante diálisis realizada durante la noche a 4 °C. La proteína purificada se concentró hasta al menos 2 mg/ml usando una membrana Amicon Ultra-0.5, Ultracel-10 (Millipore). El producto se almacena a -80 °C antes de volverse a usar.
Ejemplo 4: expresión de CHO y purificación de la proteína de fusión EndoSH de CHO
[0093] EndoSH (identificada por SEQ ID N.°: 2) se expresó transitoriamente en células CHO K1 de Evitria (Zurich, Suiza) a una escala de 20 ml. El sobrenadante, que contenía la proteína de fusión EndoSH, se diluyó con solución amortiguadora de elución (2 ml, Tris 20 mM, NaCl 500 mM, imidazol 500 mM) y solución amortiguadora de unión (18 ml, Tris 20 mM, NaCl 500 mM, imidazol 5 mM, pH = 7.4) hasta una concentración final de imidazol de 10 mM. La mezcla se cargó en una columna de Ni-NTA (GE Healthcare) y el producto se eluyó siguiendo un protocolo de elución estándar. Las fracciones recogidas (5 ml) se analizaron en un gel SDS-PAGE (10 %). El producto que contenía la fracción se concentró parcialmente (~2 ml) y se dializó con solución amortiguadora TBS. La concentración de proteína, determinada mediante análisis con nanodrop, se fijó en 0,5 mg/ml.
Ejemplo 5: corte de trastuzumab por EndoSH
[0094] Se cortó trastuzumab (obtenido de Epirus biopharma (Utrecht, Países Bajos); 14 mg/ml) en solución amortiguadora Tris 25 mM, pH 8, utilizando una concentración de EndoSH de 0,1 o 1 % p/p. Las reacciones, 350 pg de trastuzumab (25 pl) y la cantidad adecuada de EndoSH se agitaron a 37 °C y se analizaron mediante análisis de EM en tiempo extra, de 1 a 3 horas. Las muestras se sometieron al tratamiento con Fabricator antes del análisis. Se observaron conversiones completas al producto cortado, que se corta hasta el residuo de azúcar GlcNAc central, después de 1 hora a 37 °C con EndoSH al 0,1 % p/p.
Ejemplo 6: corte de trastuzumab con alto contenido en manosa mediante la proteína de fusión EndoSH
[0095] Se cortó trastuzumab con glicanos con alto contenido en mañosa (obtenido mediante expresión transitoria en células CHO K1 en presencia de kifunensina realizada por Evitria (Zurich, Suiza)) (14 mg/mL) en solución amortiguadora Tris 25 mM pH 8 usando una concentración de 0,1 o 1 % p/p de EndoSH. Las reacciones, 350 pg de trastuzumab con alto contenido en manosa (25 pl) y la cantidad adecuada de EndoSH se agitaron a 37 °C y se analizaron mediante análisis de EM en tiempo extra, de 1 a 3 horas. Las muestras se sometieron al tratamiento con Fabricator antes del análisis. Se observaron conversiones completas al producto cortado, que se corta hasta el residuo de azúcar GlcNAc central, después de 3 horas a 37 °C con EndoSH al 1 % p/p.
Ejemplo 7: expresión transitoria y purificación de cAC10
[0096] cAC10 se expresó transitoriamente en células CHO K1 por Evitria (Zurich, Suiza) a una escala de 5 L. El sobrenadante se purificó usando una columna XK 26/20 rellena con 50 ml de proteína A sefarosa. En una sola serie, se cargaron 5 litros de sobrenadante en la columna seguido de lavado con al menos 10 volúmenes de columna de Tris 25 mM, pH 7,5, NaCl 150 mM. La proteína retenida se eluyó con glicina 0,1 M, pH 2,7. El cAC10 eluido se neutralizó inmediatamente con Tris-HCl 1,5 M, pH 8,8, y se dializó con Tris 25 mM, pH 8,0. A continuación, la IgG se concentró hasta aproximadamente 20 mg/ml usando una unidad de ultrafiltración Vivaspin Turbo 15 (Sartorius) y se almacenó a -80 °C antes de volverse a usar.
Ejemplo 8: corte de cAC10 por EndoSH
[0097] El corte de glicanos de cAC10 (obtenido mediante expresión transitoria en células CHO K1 realizada por Evitria (Zurich, Suiza)) se realizó con la proteína de fusión EndoSH. Así, se incubó cAC10 (14,5 mg/ml) con EndoSH (1 p/p %) en Tris 25 mM, pH 7,5 con NaCl 150 mM durante aproximadamente 16 horas a 37 °C. La IgG cortada se dializó con 3 x 1 l de Tris-HCl 25 mM, pH 8,0. El análisis por espectrometría de masas de una muestra digerida con Fabricator mostró tres picos del fragmento Fc/2 perteneciente a un producto principal (masa observada de 24105 Da, aproximadamente el 80 % del fragmento Fc/2 total), correspondiente a cAC10 con sustituyentes en GlcNAc(Fuc) central, y dos productos menores (masas observadas de 23959 y 24233 Da, aproximadamente 5 y 15 % del fragmento Fc/2 total), correspondientes a cAC10 con sustituyentes en GIcNAc central y cAC10 con sustituyentes en GlcNAc(Fuc) central de lisina C-terminal.
Ejemplos 9 -12: preparación de bioconjugado cAC10
[0098] Para demostrar que los anticuerpos cortados por la enzima de fusión según la invención pueden modificarse adicionalmente, se preparó el conjugado anticuerpo-fármaco 113 a partir del anticuerpo cortado del Ejemplo 8. El compuesto 99 se preparó mediante la activación del compuesto 58 como se describe y se prepara de acuerdo con el Ejemplo 50 de WO 2016/053107 (PCT/NL2015/050697). En el segundo paso, el cAC10 cortado se convirtió en el mAb 13d modificado con azido mediante la acción de His-TnGalNAcT en presencia de 6-N<3>-GalNAc-UDP (disponible comercialmente en GlycoHub) como sustrato. La preparación de los
[0100] Una solución del compuesto 99 (4,7 mg, 9,0 |_imol) en DMF (200 |_il) se añadió a Val-Cit-PABC-MMAE sólido (vc-PABC-MMAE, 10 mg, 8,1 |_imol) seguido de la adición de EtsN (3,7 |_il, 2,7 mg, 27 |_imol). Después de 23 h, se añadió 2'-(etilendioxi)bis(etilamina) (1,3 |_il, 1,3 mg, 8,9 |_imol) en d Mf (13 |_il de solución al 10 % en DMF). La mezcla se dejó durante 4 h y se purificó mediante cromatografía HPLC en fase inversa (C18) (30 ^ 90 % MeCN (1 % AcOH) en H2O (1 % AcOH). El producto se obtuvo como una película incolora (10,7 mg, 7,1 l_imol, 87 %) LCMS (ESI+) calculado para C74H117N12O19S+ (M+H+) 1509,83 experimental 1510,59.
Ejemplo 10: expresión transitoria y purificación de His-Tn GaINAcT(33-421)
[0101] His-TnGaINAcT(33-421) (identificada por la SEQ ID N.°: 33) se optimizó con codones y se expresó transitoriamente en células CHO K1 por Evitria (Zurich, Suiza) a una escala de 5 L. El sobrenadante se purificó utilizando una columna XK 16/20 rellena con 25 ml de Ni Sepharose excel (GE Healthcare). En cada serie se cargaron aproximadamente 1,5 l de sobrenadante en la columna seguido de lavado con al menos 10 volúmenes de columna de solución amortiguadora A (solución amortiguadora Tris 20 mM, imidazol 5 mM, NaCl 500 mM, pH 7,5). La proteína retenida se eluyó con solución amortiguadora B (Tris 20 mM, NaCl 500 mM, imidazol 500 mM, pH 7,5). La solución amortiguadora de las fracciones eluidas se intercambió con Tris 25 mM, pH 8,0, utilizando una columna de desalinización HiPrep H26/10 (GE Healthcare). La proteína purificada se concentró hasta al menos 3 mg/ml usando una unidad de ultrafiltración Vivaspin Turbo 4 (Sartorius) y se almacenó a -80 °C antes de volverse a usar.
Ejemplo 11: glicosiltransferencia del 6-N3-GalNAc-UDP a cAC10 cortado por la acción de TnGaINAcT[0102] Se utiliza el sustrato 6-N3-GalNAc-UDP (11 d) para la preparación de la biomolécula modificada cAC10-(6-N3-GalNAc)2 13d. Se incubó cAC10 cortado (10 mg/ml), obtenido mediante tratamiento con EndoSH de cAC10 como se ha escrito anteriormente en el Ejemplo 8, con el sustrato 6-N.3-GalNAc-UDP (2,5 mM, disponible comercialmente en GlycoHub) y 0,5 mg/ml de His-TnGaINAcT(33-421) (5 p/p %) en MnCl2 10 mM y Tris-HCl 25 mM, pH 8,0 a 30 °C. Después de 3 horas, la cantidad de His-TnGaINAcT(33-421) se aumentó hasta una concentración final de 1 mg/ml (10 p/p %) y la reacción se incubó durante la noche a 30 °C. La biomolécula 13d se purificó a partir de la mezcla de reacción en una columna HiTrap MabSelect SuRe de 5 ml (GE Healthcare) usando un purificador AKTA-10 (GE Healthcare). La IgG eluida se neutralizó inmediatamente con Tris-HCl 1,5 M, pH 8,8, y se dializó con PBS, pH 7,4. A continuación, la IgG se concentró usando una membrana Amicon Ultra-0,5, Ultracel-10 (Millipore) hasta alcanzar una concentración de 23,38 mg/ml. El análisis por espectrometría de masas de una muestra digerida con Fabricator mostró tres picos del fragmento Fc/2 perteneciente a un producto principal (masa observada 24333 Da, aproximadamente el 80 % del fragmento Fc/2 total), correspondiente a cAC10 con sustituyentes en 6-N3-GalNAc-GlcNAc(Fuc) central y dos productos menores (masas observadas de 24187 y 24461 Da, aproximadamente 5 y 15 % del fragmento Fc/2 total), correspondientes a cAC10 con sustituyentes en 6-N3-GalNAc-GlcNAc central y 6-cAC10 con sustituyentes en 6-N3-GalNAc-GlcNAc(Fuc) central de lisina C-terminal.
Ejemplo 12: conjugación de 13d con 100 para obtener el conjugado 113
[0103] Se preparó un bioconjugado según la invención mediante conjugación del compuesto 100 como porción conectora conjugado a la biomolécula modificada 13d como biomolécula. A una solución de cAC10 (azida)2 (13d) (287 |_il, 6,7 mg, 23,38 mg/ml en PBS pH 7,4) se añadió PBS pH 7,4 (133 |_il) y el compuesto 100 (27 |_il, solución 10 mM en DMF). La reacción se incubó a temperatura ambiente durante la noche y luego se purificó en un Superdex200 10/300 GL (GE Healthcare) en un A<k>TA Purifier-10 (GE Healthcare). El análisis por espectrometría de masas de la muestra digerida con Fabricator mostró un producto principal (masa observada 25844 Da, aproximadamente el 80%del fragmento Fc/2 total), correspondiente al fragmento Fc/2 conjugado. El análisis RP-HPLC de la muestra reducida indicó una DAR media de 1,88.
Ejemplo 13: comparación de la eficiencia de corte de EndoS, EndoS2 y EndoSH en RNasaB a diferentes concentraciones
[0104] Primero, se preparan diluciones enzimáticas de las tres enzimas (EndoS y EndoS2 de Genovis, Lund, Suecia; EndoSH obtenida como en el Ejemplo 3) para obtener soluciones madre con 0,25 mg/mL (dil 1), 0,125 mg/mL (dil 2) y 0,025 mg/ml (dil 3). A continuación, se cargaron 12 viales con 2,5 j l de RNasa B (5 mg/ml) seguido de 0,5 j l de dilución 1-3 (dil 2 por duplicado) para cada enzima. Las reacciones se incubaron durante 30 minutos seguido de la adición de 36 j l de agua. De estas soluciones diluidas, se agregaron de 6 j l a 6 j l de solución amortiguadora de muestra para el análisis de SDS-PAGE. Se cargaron doce muestras en gel SDS-PAGE (4 por enzima) y se procesaron durante 70 minutos, se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua (véase la Figura 3 para ver el gel resultante). Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLIQS v1.1).
Tabla 1. Porcentajes de corte (conversión) de RNasaB tras el tratamiento con diferentes endoglicosidasas a diferentes concentraciones de enzima.
Ejemplo 14: comparación de la eficiencia de corte de EndoS, EndoS2 y EndoSH en cAC10
[0105] Se trató cAC10 (4 mg, 20 mg/ml en Tris pH 8,0) con Fabricator™ (Genovis, Lund, Suecia, 4 jl, 66 U/ jl) durante 1 h a 37 °C. A continuación, el cAC10 escindido se intercambió con solución amortiguadora Tris pH 6,0 (50 mM, 3 x) utilizando una membrana Amicon Ultra-0,5, Ultracel-10 (Merck Millipore) hasta una concentración de 20 mg/ml. Posteriormente, se iniciaron tres reacciones que contenían cada una cAC10 (8,3 mg/ml) y una endoglicosidasa (EndoS y EndoS2 de Genovis, Lund, Suecia; EndoSH obtenida como en el Ejemplo 3) a 0,83 |jg/ml en Tris pH 6,050 mM. Se tomaron muestras de 2 j l después de 15 min y 35 min, se diluyeron con 70 j l de MiliQ y se analizaron directamente mediante tiempo de vuelo con ionización por electroespray (ESI-TOF) en un AccuTOF de JEOL. Los porcentajes de conversión se calcularon en función de las intensidades de los picos de masa cortados y no cortados (véase el gráfico de la Figura 4).
Tabla 2. Porcentajes de corte (conversión) de cAC10 tras el tratamiento con diferentes endoglicosidasas en diferentes momentos.
Ejemplo 15: comparación de la eficacia de corte de EndoS, EndoS2 y EndoSH en trastuzumab con alto contenido en manosa
[0106] Se trató trastuzumab con alto contenido en manosa (1,3 mg, 8,8 mg/ml en Tris pH 8,0), obtenido mediante la expresión de trastuzumab en presencia de kifunensina, con Fabricator™ (3 jl, 66 U/jL) durante 1 h a 37 °C. A continuación, el trastuzumab con alto contenido en manosa escindido se intercambió con solución amortiguadora Tris a pH 6,0 (50 mM, 3 *) utilizando una membrana Amicon Ultra-0,5, Ultracel-10 (Merck Millipore) hasta una concentración de 20 mg/ml. Se iniciaron tres reacciones que contenían trastuzumab con alto contenido en manosa (10 mg/ml) y una endoglicosidasa (EndoS y EndoS2 de Genovis, Lund, Suecia; EndoSH obtenida como en el Ejemplo 3) a 4,4 jg/ml en Tris pH 6,0 50 mM. Se tomaron muestras de 2 j l después de 30, 60 y 120 minutos, se diluyeron con 70 j l de MiliQ y se analizaron directamente mediante tiempo de vuelo con ionización por electroespray (ESI-TOF) en un AccuTOF de JEOL. Los porcentajes de conversión se calcularon en función de las intensidades de los picos de masa cortados y no cortados (véase el gráfico de la Figura 5).
Tabla 3. Porcentajes de corte (conversión) de trastuzumab con alto contenido en manosa tras el tratamiento con diferentes endo licosidasas en diferentes momentos.
[0107] Estos experimentos demuestran que EndoSH es más eficaz para cortar trastuzumab y cAC10 con alto contenido en manosa que EndoS2, y EndoSH permite cortar otras glicoproteínas (por ejemplo, RNasaB), lo que no es posible con EndoS2, ya que la actividad está restringida al sitio N297. Por tanto, si un anticuerpo, por ejemplo, un anticuerpo monoclonal, tiene un alto nivel indeseable de manosa en un sitio de N-glicosilación diferente, EndoSH podría cortarlo, mientras que EndoS2 no puede.
Ejemplo 16: clonación de proteínas de fusión en un vector de expresión
[0108] Un vector pET22B que contiene EndoF3-(G4S)3-(His)e-EF-(G4S)3-EfEndo18A (EndoF3-EfEndo18A), identificándose la secuencia codificante EndoF3-EfEndo18A mediante SEQ ID N.°: 13; o EndoF2-(G4S)3-His6-EF-(G4S)3-EfEndo18A (EndoF2-EfEndo18A), identificándose la secuencia codificante EndoF2-EfEndo18A mediante SEQ ID N.°: 14; o EndoS-(GaS)s-Hiss-EF-(GaS)s-EfEndo18A (EndoS-EfEndo18A), identificándose la secuencia codificante EndoS-EfEndo18A mediante S<e>Q ID N.°: 15; o EndoF3-(G4S)3-His6-EF-(G4S)3-EndoF1 (EndoF3-EndoF1), identificándose la secuencia codificante EndoF3-EndoF1 mediante SEQ ID N.°: 16; o EndoF2-(G4S)3-His6-EF-(G4S)3-EndoF1 (EndoF2-EndoF1), identificándose la secuencia codificante EndoF2-EndoF1 mediante SEQ ID N.°: 17; o EndoS-(G4S)3-His6-EF-(G4S)3-EndoF1 (EndoS-EndoF1), identificándose la secuencia codificante EndoS-EndoF1 mediante SEQ ID N.°: 18; o EndoF3-(G4S)3-His6-EF-(G4S)3-EndoH (EndoF3-EndoH), identificándose la secuencia codificante EndoF3-EndoH mediante SEQ ID N.°: 19; o EndoF2-(G4S)3-His6-EF-(G<4>S)<3>-EndoH (EndoF2-EndoH), la secuencia codificante EndoF2-EndoH identificada por SEQ ID N.°: 20, entre los sitios Ndel-Hindll se obtuvo en Genscript, Piscataway, EE. UU.
[0109] La secuencia de ADN para la proteína de fusión EndoF3-EfEndo18A consiste en los residuos codificantes 40-329 de EndoF3 fusionados mediante una porción conectora N-terminal de glicina-serina (GS) a los residuos codificantes 42-314 de EfEndo18A. La secuencia de ADN se identifica mediante la SEQ ID N.°: 22. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0110] La secuencia de ADN de la proteína de fusión EndoF2-EfEndo18A consiste en los residuos codificantes 46-335 de EndoF2 fusionados mediante una porción conectora N-terminal de glicina-serina (GS) a los residuos codificantes 42-314 de EfEndo18A. La secuencia de ADN se identifica mediante la SEQ ID N.°: 23. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0111] La secuencia de ADN de la proteína de fusión EndoS-EfEndo18A consiste en los residuos codificantes 48 995 de EndoS fusionados mediante una porción conectora N-terminal de glicina-serina (GS) a los residuos codificantes 42-314 de EfEndo18A. La secuencia de ADN se identifica mediante la SEQ ID N.°: 24. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0112] La secuencia de ADN de la proteína de fusión EndoF3-EndoF1 consiste en los residuos codificantes 40 329 de EndoF3 fusionados mediante una porción conectora de glicina-serina (GS) N-terminal unida a los residuos codificantes 51-339 de EndoF1. La secuencia de ADN se identifica mediante la SEQ ID N.°: 25. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0113] La secuencia de ADN de la proteína de fusión EndoF2-EndoF1 consiste en los residuos codificantes 46 335 de EndoF2 fusionados mediante una porción conectora de glicina-serina (GS) N-terminal unida a los residuos codificantes 51-339 de EndoF1. La secuencia de ADN se identifica mediante la SEQ ID N.°: 26. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0114] La secuencia de ADN de la proteína de fusión EndoS-EndoF1 consiste en los residuos codificantes 48 995 de EndoS fusionados mediante una porción conectora de glicina-serina (GS) N-terminal unida a los residuos codificantes 51-339 de EndoF1. La secuencia de ADN se identifica mediante la SEQ ID N.°: 27. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0115] La secuencia de ADN para la proteína de fusión EndoF3-EndoH consiste en los residuos codificantes 40 329 de EndoF3 fusionados mediante una porción conectora N-terminal de glicina-serina (GS) a los residuos codificantes 41-313 de EndoH. La secuencia de ADN se identifica mediante la SEQ ID N.°: 28. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0116] La secuencia de ADN de la proteína de fusión EndoF2-EndoH consiste en los residuos codificantes 46 335 de EndoF2 fusionados mediante una porción conectora N-terminal de glicina-serina (GS) a los residuos codificantes 41-313 de EndoH. La secuencia de ADN se identifica mediante la SEQ ID N.°: 29. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0117] La secuencia de ADN de la proteína de fusión EndoS-EndoH consiste en los residuos codificantes 48-995 de EndoS fusionados mediante una porción conectora N-terminal de glicina-serina (GS) a los residuos codificantes 41-313 de EndoH. La secuencia de ADN se identifica mediante la SEQ ID N.°: 30. La porción conectora glicina-serina (GS) comprende un formato -(G<4>S)<3>-(His)<6>-EF-(G<4>S)<3>-, que permite espaciar las dos enzimas y, al mismo tiempo, introduce una etiqueta de purificación IMAC.
[0118] La secuencia de ADN de la proteína de fusión His6-EndoS-EndoH consiste en los residuos codificantes 48-995 de EndoS fusionados directamente (es decir, sin porción conectora (GS)) a los residuos codificantes 41 313 de EndoH. La secuencia de ADN se identifica mediante la SEQ ID N.°: 31. La etiqueta His6 permite la purificación mediante purificación IMAC.
[0119] La secuencia de ADN para los residuos codificantes 33-421 de His6-TnGalNAcT con una etiqueta N-terminal His6 se identifica con la SEQ ID N.°: 32. La etiqueta His6 permite la purificación mediante purificación IMAC.
Ejemplo 17: expresión de proteína de fusión en E. coli a pequeña escala
[0120] La expresión de las proteínas de fusión EndoF3-EndoF1 (SEQ ID N.°: 16), EndoS-EndoF1 (SEQ ID N.°: 18), EndoF2-EndoH (SEQ ID N.°: 20) comienza con la transformación del plásmido en células BL21 (DE3). El siguiente paso es la inoculación de 50 ml de cultivo (medio LB ampilicina; 100 g/ml) con células BL21(DE3). En caso de His6-EndoS-EndoH, se utilizó kanamicina (50 jg/mL). Cuando la DO<600>alcanzó un valor de 0,5-0,7, los cultivos se indujeron con IPTG 1 mM (50 j l de solución madre 1 M). Las expresiones de EndoF3-EndoF1 (SEQ ID N.°: 16) y EndoF2-EndoH (SEQ ID N.°: 20) se repitieron a gran escala como se describe en los Ejemplos 19 y 21.
Ejemplo 18: purificación a pequeña escala de proteína de fusión de E. coli mediante NiNTA
[0121] Después de inducción durante la noche a 16 °C, los cultivos de las expresiones EndoF3-EndoF1 (SEQ ID N.°: 16), EndoS-EndoF1 (SEQ ID N.°: 18), EndoF2-EndoH (SEQ ID N.°: 20) se sedimentaron mediante centrifugación. Los sedimentos se resuspendieron en 3-8 ml de PBS y se sonicaron con Sonopuls Mini20, Bandelin (usando micropunta MS 2,5) al 70 % (3 x 1 min) en hielo. Después de la sonicación, los restos celulares se eliminaron mediante centrifugación (10 min, 10000 x g). El extracto soluble se cargó en una columna de Ni sefarosa hecha a mano (obtenida de ThermoFisher Scientific y Ni sefarosa de GE Healthcare). La columna se lavó primero con solución amortiguadora A (solución amortiguadora Tris 20 mM, imidazol 5 mM, NaCl 500 mM, pH 7,5). La proteína retenida se eluyó con solución amortiguadora B (Tris 20 mM, NaCl 500 mM, imidazol 250 mM, pH 7,5, 5 ml). Las fracciones se analizaron mediante SDS-PAGE en geles de poliacrilamida (12 %). Las fracciones que contenían la proteína diana purificada se combinaron y la solución amortiguadora se intercambió por TBS pH 7,5 mediante diálisis realizada durante la noche a 4 °C. Los rendimientos se muestran en la Tabla 4. Las proteínas se congelaron rápidamente y se almacenaron a -80 °C antes de volverse a usar.
Tabla 4. Rendimientos para las purificaciones a pequeña escala de proteínas de fusión deE. colimediante
NiNTA.
Ejemplo 19: expresión a gran escala de proteína de fusión en E. coli
[0122] La expresión de las proteínas de fusión EndoF3-EndoF1 (SEQ ID N.°: 16), EndoF2-EndoH (SEQ ID N.°: 20), EndoS-EfEndo18A (SEQ ID N.°: 15), EndoF2-EndoF1 (SEQ ID N.°: 17) y EndoF3 -EndoH (SEQ ID N.°: 19) comenzó con la transformación del plásmido en células BL21(DE3). El siguiente paso fue la inoculación de 500 ml de cultivo (medio LB ampilicina; 100 jg/ml) con células BL21(DE3). Cuando la DO600 alcanzó 0,5-0,7 los cultivos se indujeron con IPTG 1 mM (500 j l de solución madre 1 M).
Ejemplo 20: purificación a gran escala de proteína de fusión de E. coli mediante NiNTA
[0123] Después de inducción durante la noche a 16 °C, los cultivos de proteínas EndoS-EfEndo18A (SEQ ID N.°: 15), EndoF2-EndoF1 (SEQ ID N.°: 17), EndoF3-EndoH (SEQ ID N.°: 19), EndoF3-EndoF1 (SEQ ID N.°: NO: 16) y EndoF2-EndoH (SEQ ID N.°: 20) se sedimentaron mediante centrifugación. Los sedimentos se resuspendieron en 10 ml de PBS/G de sedimento. La suspensión celular se lisó tres veces bajo presión (20000-25000 psi) mediante una prensa de French usando Emulsiflex C3, Avestin. Después de la prensa de French, los restos celulares se eliminaron mediante centrifugación (20 minutos a 10000 xg). El extracto soluble se cargó en una columna HisTrap HP de 5 ml (GE Healthcare). La columna se lavó primero con solución amortiguadora A (solución amortiguadora Tris 20 mM, imidazol 5 mM, NaCl 500 mM, pH 7,5). La proteína retenida se eluyó con solución amortiguadora B (Tris 20 mM, NaCl 500 mM, imidazol 250 mM, pH 7,5, 10 ml). Las fracciones se analizaron mediante SDS-PAGE en geles de poliacrilamida (12 %). Las fracciones que contenían proteína diana purificada se combinaron y la solución amortiguadora se intercambió con Tris pH 7,5 mediante diálisis realizada durante la noche a 4 °C. Los rendimientos se muestran en la tabla 5 a continuación. Las proteínas se congelaron rápidamente y se almacenaron a -80 °C antes de volverse a usar.
Tabla 5. Rendimientos para l rifi i n r n l r ín f i n deE. colimediante NiNTA.
Ejemplo 21: purificación de proteína de fusión de E. coli mediante SEC
[0124] Para EndoF3-EndoF1 (SEQ ID N.°: 16), EndoF2-EndoF1 (SEQ ID N.°: 17), EndoF3-EndoH (SEQ ID N.°: 19) y EndoF2-EndoH (SEQ ID N.°: 20) la purificación NiNTA, que se describe en el ejemplo 20, fue seguida de cromatografía de exclusión por tamaño (SEC) para aislar el monómero. Se instaló una Superdex 75 10/300 GL en el purificador Akta. La columna se enjuagó con MilliQ (20 ml) seguido de acondicionamiento con TBS pH 7,5 (25 ml, 0,8 ml/min). Se cargaron aproximadamente 1 - 3 mg de proteína purificada con NiNTA y se procesaron a 0,8 ml/min usando TBS pH 7,5. Se recogió la proteína monomérica y se analizaron las fracciones mediante SDS-PAGE en geles de poliacrilamida (12 %) o en masa en AccuTOF. Los rendimientos se muestran a continuación en la tabla 6. Las proteínas se congelaron rápidamente y se almacenaron a -80 °C antes de volverse a usar. Tabla 6. Resumen de la cantidad de proteína de fusión de endoglicosidasa purificada con NiNTA que se cargó en la columna SEC los rendimientos de la fracción monomérica.
Ejemplo 22: clonación de la proteína de fusión His6-EndoS-EndoH (sin porción conectora GS) en el vector de expresión pET28B
[0125] Un vector pET28B que contenía His6-EndoS-EndoH (His6-EndoSH sin porción conectora GS), con la secuencia de codificación de His6-EndoS-EndoH identificada por la SEQ ID N.°: 21, entre los sitios Ncol-Hindll se obtuvo en Genscript Piscataway, EE. UU.
[0126] La secuencia de ADN de la proteína de fusión His6-EndoSH codifica una etiqueta de purificación IMAC N-terminal y un sitio de escisión de trombina fusionado a los residuos codificantes 48-995 de EndoS fusionados a los residuos codificantes 41-313 de EndoH.
Ejemplo 23: expresión a pequeña escala de E. coli de la proteína de fusión Hise-EndoS-EndoH (sin porción conectora GS)
[0127] La expresión de la proteína de fusión His.6-EndoS-EndoH (SEQ ID N.°: 21) comienza con la transformación del plásmido en células BL21(DE3). El siguiente paso es la inoculación de 50 ml de cultivo (medio LB kanamicina; 50 g/ml) con células BL21(DE3). Cuando la DO<600>alcanzó un valor de 0,5, el cultivo se indujo con IPTG 1 mM (50 |_il de solución madre 1 M).
Ejemplo 24: purificación a pequeña escala de proteína de fusión de E. coli mediante NiNTA
[0128] Después de inducción durante la noche a 16 °C, el cultivo de la expresión del Ejemplo 23 se sedimentó mediante centrifugación. El sedimento se resuspendió en 7 ml de PBS y se sonicó con Sonopuls Mini20, Bandelin (usando micropunta MS 2,5) al 70 % (3 x 1 min) en hielo. Después de la sonicación, los restos celulares se eliminaron mediante centrifugación (10 min, 10000 x g). El extracto soluble se cargó en una columna de Ni sefarosa hecha a mano (obtenida de ThermoFisher Scientific y Ni sefarosa de GE Healthcare). La columna se lavó primero con solución amortiguadora A (solución amortiguadora Tris 20 mM, imidazol 5 mM, NaCl 500 mM, pH 7,5). La proteína retenida se eluyó con solución amortiguadora B (Tris 20 mM, NaCl 500 mM, imidazol 250 mM, pH 7,5, 5 ml). Las fracciones se analizaron mediante SDS-PAGE en geles de poliacrilamida (12 %). Las fracciones que contenían proteína diana purificada se combinaron y la solución amortiguadora se intercambió por TBS pH 7,5 mediante diálisis realizada durante la noche a 4 °C. El rendimiento después de la diálisis fue de 9 mg. El producto se congeló rápidamente y se almacenó a -80 °C antes de volverse a usar.
Ejemplo 25: comparación de la eficacia de corte de EndoSH, EndoF3-EndoH, EndoS-EfEndo18A y EndoF2-EndoFI en trastuzumab con alto contenido en mañosa
[0129] Se trató trastuzumab con alto contenido en manosa (0,7 ml, 6,0 mg, 8,8 mg/ml en Tris pH 8,0) con Fabricator™ (9 pl, 50 U/pL) durante 1 h a 37 °C. A continuación, el trastuzumab con alto contenido en manosa digerido con Fabricator™ se dividió en tres porciones iguales y se intercambió la solución amortiguadora por citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM, respectivamente. El intercambio de solución amortiguadora se realizó utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Merck Millipore) y las muestras se concentraron hasta una concentración final de 10 mg/ml. Para EndoSH (identificada por la SEQ ID N.°: 1), EndoF3-EndoH (identificada por la EQ ID N.°: 19), EndoS-EfEndo18A (identificada por la S<e>Q ID N.°: 15) y EndoF2-EndoF1 (identificada por la SEQ ID N.°: 17), se prepararon series de diluciones de 10, 50 y 250 nM en cada una de las soluciones amortiguadoras de reacción mencionadas anteriormente. Las reacciones se iniciaron añadiendo 2 pl de trastuzumab con alto contenido en manosa (10 mg/mL) digerido con Fabricator™ a 2 pl de la proteína de fusión de endoglicosidasa diluida en la solución amortiguadora correspondiente, lo que da como resultado una concentración final de 5 mg/mL de IgG digerida con Fabricator™ (fragmento Fc/267 pM) con endoglicosidasa 5, 25 y 125 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Las reacciones se neutralizaron mediante la adición de 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol seguida de una incubación durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1).
Tabla 7. Porcentajes de corte (conversión) de trastuzumab con alto contenido en manosa digerido con F ri r™ r l r mi n v ri r ín f i n n li i H 4 7 .
Ejemplo 26: comparación de la eficacia de corte de EndoSH, EndoF3-EndoH, EndoS-EfEndo18A y EndoF2-EndoF1 en trastuzumab
[0130] Trastuzumab (obtenido de Epirus biopharma (Utrecht, Países Bajos); 287 pl, 6,0 mg, 21 mg/ml en Tris pH 8,0), se trató con Fabricator™ (9 pl, 50 U/pL) durante 1 h a 37 °C. A continuación, el trastuzumab digerido con Fabricator™ se dividió en tres porciones iguales y la solución amortiguadora se intercambió por citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM, respectivamente. El intercambio de solución amortiguadora se realizó utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Merck Millipore) y las muestras se concentraron hasta una concentración final de 10 mg/ml. Para EndoSH (identificada por la SEQ ID N.°: 1), EndoF3-EndoH identificada por la SEQ ID N.°: 19), EndoS-EfEndo18A (identificada por la SEQ ID N.°: 15) y EndoF2-EndoF1 (identificada por la SEQ ID N.°: 17), se prepararon diluciones de 50 y 250 nM en cada una de las soluciones amortiguadoras mencionadas anteriormente. Las reacciones se iniciaron añadiendo 5 pl de trastuzumab digerido con Fabricator™ (10 mg/ml) en 5 pl de la proteína de fusión de endoglicosidasa diluida en la solución amortiguadora correspondiente, lo que da como resultado una concentración final de 5 mg/ml de IgG digerida con Fabricator™ (fragmento Fc/267 pM) con endoglicosidasa 25 y 125 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Para cada reacción se tomó una muestra (4 pl) y se añadió a 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol y se incubó durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1). Tabla 8. Porcentajes de corte (conversión) de trastuzumab digerido con Fabricator™ tras el tratamiento de varias r ín f i n n li i H 4 7 .
Ejemplo 27: corte de trastuzumab mediante EndoF3-EndoH (comparativo)
[0131] Para demostrar que se puede lograr una conversión completa para el corte de trastuzumab mediante EndoF3-EndoH (identificada por la SEQ ID N.°: 19), se incubó trastuzumab digerido con Fabricator™ (4 pl, 40 pg, 10 mg/ml en citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM) con citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM (8,73 pl) y EndoF3-EndoH (7,27 pl), 4 pg, 0,55 mg/ml en citrato de sodio 50 mM (pH 4,5 con NaCl 150 mM) durante 60 minutos a 37 °C. El análisis por espectrometría de masas de una muestra digerida con Fabricator mostró un pico principal del fragmento Fc/2 (masa observada 24139 Da, aproximadamente el 95 % del fragmento Fc/2 total), correspondiente al trastuzumab con sustituyentes en la GlcNAc(Fuc) central.
Ejemplo 28: corte de trastuzumab mediante EndoF2-EndoF1 (comparativo)
[0132] Para demostrar que se puede lograr una conversión completa para el corte de trastuzumab mediante EndoF2-EndoF1 (identificada por la SEQ ID N.°: 17), se incubó trastuzumab digerido con Fabricator™(4 pl, 40 pg, 10 mg/ml en citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM) en citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM (11,06 pl) y EndoF2-EndoF1 (4,94 pl), 4 pg, 0,81 mg/ml en citrato de sodio 50 mM (pH 4,5 con NaCl 150 mM) durante 60 minutos a 37 °C. El análisis por espectrometría de masas de una muestra digerida con Fabricator mostró un pico principal del fragmento Fc/2 (masa observada 24139 Da, aproximadamente el 95 % del fragmento Fc/2 total), correspondiente al trastuzumab con sustituyentes en la GlcNAc(Fuc) central.
Ejemplo 29: comparación de la eficacia de corte de EndoSH, EndoF3-EndoF1, EndoS-EndoF1, EndoF2-EndoH en trastuzumab con alto contenido en manosa
[0133] Se trató trastuzumab con alto contenido en manosa (0,7 ml, 6,0 mg, 8,8 mg/ml en Tris pH 8,0) con Fabricator™ (9 pl, 50 U/pL) durante 1 h a 37 °C. A continuación, se dividió trastuzumab con alto contenido en manosa digerido con Fabricator™ en tres porciones iguales y se intercambió la solución amortiguadora por citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM, respectivamente. El intercambio de solución amortiguadora se realizó utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Merck Millipore) y las muestras se concentraron hasta una concentración final de 10 mg/ml. EndoSH (identificada por la SEQ ID N.°: 1), EndoF3-EndoF1 (identificada por la SEQ ID N.°: 16), EndoS-EndoF1 (identificada por la SEQ ID N.°: 18) y EndoF2-EndoH (identificada por la<s>E<q>ID N.°: 20) se diluyeron a una concentración de 250 nM en cada una de las soluciones amortiguadoras de reacción mencionadas anteriormente. Las reacciones se iniciaron añadiendo 2 pl de trastuzumab con alto contenido en manosa (10 mg/ml) digerido con Fabricator™ en 2 pl de la proteína de fusión de endoglicosidasa (250 nM) en la solución amortiguadora correspondiente, lo que da como resultado una concentración final de 5 mg/ml de IgG digerida con Fabricator™ (fragmento Fc/2 67 pM) con endoglicosidasa 125 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Las reacciones se inactivaron mediante la adición de 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol seguida de una incubación durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1).
Tabla 9. Porcentajes de corte (conversión) de trastuzumab con alto contenido en manosa digerido con Fabricator™ tras el tratamiento de varias proteínas de fusión de endoglicosidasas (125 nM) a pH 4,5, 6,0 y 7,5. | pH | EndoSH | EndoF3-EndoF1 | EndoS-EndoF1 | EndpF2-EndoH |
Ejemplo 30: comparación de la eficacia de corte de EndoSH, EndoF3-EndoH y EndoS-EfEndo18A, EndoF2-EndoFI en trastuzumab
[0134] Se trató trastuzumab (obtenido en Epirus biopharma (Utrecht, Países Bajos); 287 pl, 6,0 mg, 21 mg/ml en Tris pH 8,0), con Fabricator™ (9 pl, 50 U/pL) durante 1 h a 37 °C. A continuación, el trastuzumab digerido con Fabricator™ se dividió en tres porciones iguales y la solución amortiguadora se intercambió por citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM, respectivamente. El intercambio de solución amortiguadora se realizó utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Merck Millipore) y las muestras se concentraron hasta una concentración final de 10 mg/ml. EndoSH (identificada por la SEQ ID N.°: 1), EndoF3-EndoF1 (identificada por la SEQ ID N.°: 16), EndoS-EndoF1 (identificada por la SEQ ID N.°: 18) y EndoF2-EndoH (identificada por la SEQ ID N.°: 20) se diluyeron a una concentración de 250 nM en cada una de las soluciones amortiguadoras de reacción mencionadas anteriormente. Las reacciones se iniciaron añadiendo 5 pl de trastuzumab digerido con Fabricator™ (10 mg/mL) a 5 pl de la proteína de fusión de endoglicosidasa (250 nM) en la solución amortiguadora correspondiente, lo que da como resultado una concentración final de 5 mg/mL de IgG digerida con Fabricator™ (fragmento Fc/267 pM) con endoglicosidasa 125 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Para cada reacción, se tomó una muestra (4 pl) y se añadió a 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol y se incubó durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1).
Tabla 10. Porcentajes de corte (conversión) de trastuzumab tras el tratamiento con diferentes endoglicosidasas 125 nM a H 45 60 75.
Ejemplo 31: comparación de la eficacia de corte de proteínas de fusión EndoS-EndoH con y sin porción conectora en trastuzumab con alto contenido en manosa
[0135] Se trató trastuzumab con alto contenido en manosa (0,7 ml, 6,0 mg, 8,8 mg/ml en Tris pH 8,0) con Fabricator™ (9 pl, 50 U/pL) durante 1 h a 37 °C. A continuación, se dividió trastuzumab con alto contenido en manosa digerido con Fabricator™ en tres porciones iguales y se intercambió la solución amortiguadora por citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM, respectivamente. El intercambio de solución amortiguadora se realizó utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Merck Millipore) y las muestras se concentraron hasta una concentración final de 10 mg/ml. Para EndoSH (identificada por la SEQ ID N.°: 1) e His6-EndoSH (His6-EndoS-EndoH sin porción conectora GS; identificada por la SEQ ID N.°: 21) se prepararon series de diluciones de 10, 50 y 250 nM en cada una de las soluciones amortiguadoras de reacción mencionadas anteriormente. Las reacciones se iniciaron añadiendo 2 pl de trastuzumab con alto contenido en manosa digerido con Fabricator™ (10 mg/mL) en 2 pl de la proteína de fusión de endoglicosidasa diluida en la solución amortiguadora correspondiente, lo que da como resultado una concentración final de 5 mg/mL de IgG digerida con Fabricator™ (fragmento Fc/267 pM) con endoglicosidasa 5, 25 y 125 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Las reacciones se inactivaron mediante la adición de 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol seguida de una incubación durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLIQS v1.1).
Tabla 11. Porcentajes de corte (conversión) de trastuzumab con alto contenido en mañosa digerido con Fabricator™ tras el tratamiento con proteínas de fusión EndoS-EndoH con y sin porción conectora a pH 4,5, 6,0 y
7,5.
g p __________________________________
Ejemplo 32: comparación de la eficacia de corte de proteínas de fusión EndoS-EndoH con y sin porción conectora en trastuzumab
[0136] Se trató trastuzumab (obtenido en Epirus biopharma (Utrecht, Países Bajos); 287 pl, 6,0 mg, 21 mg/ml en Tris pH 8,0) con Fabricator™ (9 pl, 50 U/pL) durante 1 h a 37 °C. A continuación, el trastuzumab digerido con Fabricator™ se dividió en tres porciones iguales y la solución amortiguadora se intercambió por citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM, respectivamente. El intercambio de solución amortiguadora se realizó utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Merck Millipore) y las muestras se concentraron hasta una concentración final de 10 mg/ml. Para EndoSH (identificada por la SEQ ID N.°: 1) e His6 se prepararon series de diluciones -EndoSH (EndoS-EndoH sin porción conectora GS; identificada por la SEQ ID N.°: 21) de 2, 10, 50 y 250 nM en cada una de las soluciones amortiguadoras mencionadas anteriormente. Las reacciones se iniciaron añadiendo 5 pl de trastuzumab digerido con Fabricator™ (10 mg/ml) en 5 pl de la proteína de fusión de endoglicosidasa diluida en la solución amortiguadora correspondiente, lo que da como resultado una concentración final de 5 mg/ml de IgG digerida con Fabricator™ (fragmento Fc/2 67 pM) con endoglicosidasa 1, 5, 25 y 125 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Para cada reacción, se tomó una muestra (4 pl) y se añadió a 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol y se incubó durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1).
Tabla 12. Porcentajes de corte (conversión) de trastuzumab digerido con Fabricator™ tras tratamiento con r ín f i n En -En H n in r i n n r H 4 7 .
Ejemplo 33: comparación de la eficiencia de corte de EndoSH, EndoF3-EndoH y EndoS-EfEndo18A, EndoF2-EndoFI en cAC10
[0137] Se trató cAC10 (300 pl, 6,0 mg, 20,1 mg/ml en Tris pH 8,0), obtenido como se describe anteriormente en el Ejemplo 7, con Fabricator™ (9 pl, 50 U/pL) durante 1 h a 37 °C. A continuación, el cAC10 digerido con Fabricator™ se dividió en tres porciones iguales y la solución amortiguadora se intercambió por citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM. El intercambio de solución amortiguadora se realizó utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Merck Millipore) y las muestras se concentraron hasta una concentración final de 10 mg/ml. El Ejemplo 26 mostró un pH óptimo para el corte de glicanos de tipo complejo de pH 7,5 para EndoSH (identificada por la SEQ ID N.°: 1), pH 4,5 para EndoF3-EndoH (identificada por la SEQ ID N.°: 19), pH 7,5 para EndoS-EfEndo18A (identificada por la SEQ ID N.°: 15) y pH 4,5 para EndoF2-EndoF1 (identificada por la SEQ ID N.°: 17). Para cada una de las proteínas de fusión mencionadas anteriormente se preparó una serie de diluciones de 5, 50 y 500 nM en la solución amortiguadora de reacción con el pH óptimo como se ha mencionado anteriormente. Las reacciones se iniciaron añadiendo 5 pl de cAC10 digerido con Fabricator™ (10 mg/mL) a 5 pl de la proteína de fusión de endoglicosidasa diluida en la solución amortiguadora correspondiente, lo que da como resultado una concentración final de 5 mg/mL de IgG digerida con Fabricator™ (fragmento Fc/267 pM) con proteína de fusión de endoglicosidasa 2,5, 25 y 250 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Para cada reacción, se tomó una muestra (4 pl) y se añadió a 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol y se incubó durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLIQS v1.1).
Tabla 13. Porcentajes de corte (conversión) de cAC10 digerido con Fabricator™ tras el tratamiento de varias r ín f i n n li i n H im ífi r r ín f i n.
Ejemplo 34: comparación de la eficiencia de corte de EndoSH, EndoF3-EndoH y EndoS-EfEndo18A, EndoF2-EndoFI en RNasaB
[0138] Se preparó una solución madre de RNasaB (2 mg/ml) en citrato de sodio 50 mM, pH 4,5, con NaCl 150 mM y en Tris.HCl 50 mM, pH 6,0, con NaCl 150 mM. El Ejemplo 26 mostró un pH óptimo para el corte de glicanos con alto contenido en manosa de pH 6,0 para EndoSH (identificada por la SEQ ID N.°: 1), pH 6,0 para EndoF3-EndoH (identificada por la SEQ ID N.°: 19), pH 6,0 para EndoS- EfEndo18A (identificada por la SEQ ID N.°: 15) y pH 4,5 para EndoF2-EndoF1 (identificada por la SEQ ID N.°: 17). Para cada una de las proteínas de fusión mencionadas anteriormente se preparó una serie de diluciones de 10, 50 y 250 nM en la solución amortiguadora de reacción con el pH óptimo como se ha mencionado anteriormente. Las reacciones se iniciaron añadiendo 5 pl de RNasa B (2 mg/mL en la solución amortiguadora correspondiente) a 5 pl de la proteína de fusión de endoglicosidasa diluida en la solución amortiguadora de reacción óptima como se ha mencionado anteriormente. Esto da como resultado una concentración final de 1 mg/ml de RNasa B con proteína de fusión de endoglicosidasa 5, 25 y 125 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Para cada reacción, se tomó una muestra (4 pl) y se añadió a 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol y se incubó durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1).
Tabla 14. Porcentajes de corte (conversión) de RNasa B tras el tratamiento de diversas proteínas de fusión de n li i l v l r H im ífi r r ín f i n.
Ejemplo 35: comparación de la eficiencia de corte de EndoSH, EndoF3-EndoH y EndoS-EfEndo18A, EndoF2-EndoFI en fibrinógeno
[0139] Se disolvió fibrinógeno de plasma humano (disponible comercialmente en Sigma), que contiene un sitio de glicosilación en las cadenas alfa, beta y gamma, hasta una concentración final de 10 mg/ml en Tris.HCl 50 mM, pH 6,0 con 150 NaCl mM y en Tris.HCl 50 mM pH 7,5 con NaCl 150 mM girando a 300 r.p.m. a 37 °C durante 15 minutos. El fibrinógeno no se pudo disolver en citrato de sodio 50 mM, pH 4,5, con NaCl 150 mM usando el procedimiento mencionado anteriormente. El Ejemplo 26 mostró un pH óptimo para el corte de glicanos de tipo complejo de pH 7,5 para EndoSH (identificada por la SEQ ID N.°: 1), pH 4,5 para EndoF3-EndoH (identificada por la SEQ ID N.°: 19), pH 7,5 para EndoS- EfEndo18A (identificada por la SEQ ID N.°: 15) y pH 4,5 para EndoF2-EndoF1 (identificada por la SEQ ID N.°: 17). Para EndoSH y EndoS-EfEndo18A se preparó una serie de diluciones de 5, 50 y 500 nM en Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM, que es la solución amortiguadora de reacción óptima para estas enzimas. Para EndoF3-EndoH y EndoF2-EndoF1 se preparó una serie de diluciones de 5, 50 y 500 nM en Tris.HCl 50 mM pH 6,0 con NaCl 150 mM, que es el pH más óptimo en el que se puede solubilizar el fibrinógeno. Las reacciones se iniciaron añadiendo 5 gl de fibrinógeno (10 mg/mL) a 5 gl de la proteína de fusión de endoglicosidasa diluida en la solución amortiguadora correspondiente, dando como resultado una concentración final de 5 mg/mL de fibrinógeno con proteína de fusión endoglicosidasa de 2,5, 25 y 250 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Para cada reacción, se tomó una muestra (4 |_il) y se añadió a 16 gl de solución amortiguadora de muestra 1x Laemmli con 2-mercaptoetanol y se incubó durante 5 minutos a 95 °C. Las muestras (5 gl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante aproximadamente 120 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon para las cadenas beta y gamma basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1).
Tabla 15. Porcentajes de corte (conversión) de fibrinógeno tras el tratamiento de diversas proteínas de fusión de _____________endoglicosidasas al valor de pH óptimo específico para cada proteína de fusión._____________ Cadena de Concentración EndoSH (a pH EndoF3-EndoH EndoS-EfEndo18A EndoF2-EndoF1 fibrinó eno de enzima nM 75 a H 60 a H 75 a H 60
La conversión se calculó por separado para las cadenas beta y gamma utilizando la siguiente fórmula: conversión (%) = 100 x (fibrinógenocortado) / (fibrinógenocortado fibrinógenoglicosilado). *Nota: Los resultados son difíciles de interpretar con precisión debido a las señales de fondo en el nivel máximo de fibrinógeno no tratado. No se aplicó ninguna corrección de fondo para la cuantificación de la conversión.__________________________
Ejemplo 36: comparación de la eficacia de corte de las proteínas de fusión EndoSH y EndoF3-EndoH con las proteínas individuales EndoS, EndoF3 y EndoH en trastuzumab
[0140] Se trató trastuzumab (obtenido en Epirus biopharma (Utrecht, Países Bajos); 287 gl, 6,0 mg, 21 mg/ml en Tris pH 8,0) con Fabricator™ (9 gl, 50 U/gL) durante 1 h a 37 °C. A continuación, el trastuzumab digerido con Fabricator™ se dividió en tres porciones iguales y la solución amortiguadora se intercambió por citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM, respectivamente. El intercambio de solución amortiguadora se realizó utilizando una membrana Amicon Ultra-0.5, Ultracel-10 (Merck Millipore) y las muestras se concentraron hasta una concentración final de 10 mg/ml. EndoSH (identificada por la SeQ ID N.°: 1), EndoF3-EndoH (identificada por la SEQ ID N.°: 19), EndoS (disponible comercialmente en Genovis, Lund, Suecia), EndoF3 (disponible comercialmente en Sigma-Aldrich, UE) y EndoH (disponible comercialmente en New England Biolabs, Ipswich, EE. UU.) se diluyeron a 50 y 500 nM en cada una de las soluciones amortiguadoras mencionadas anteriormente. Las reacciones se iniciaron añadiendo 5 gl de trastuzumab digerido con Fabricator™ (10 mg/mL) a 5 gl de endoglicosidasas diluidas en la solución amortiguadora correspondiente, lo que da como resultado una concentración final de 5 mg/mL de IgG digerida con Fabricator™ (fragmento Fc/267 gM) con endoglicosidasa 25 y 250 nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Para cada reacción se tomó una muestra (4 gl) y se añadió a 16 gl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol y se incubó durante 5 minutos a 95 °C. Las muestras (5 gl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1).
Tabla 16. Porcentajes de corte (conversión) de trastuzumab digerido con Fabricator™ tras el tratamiento de iv r n li i r ín f i n ^ n li i H 4 7 .
Ejemplo 37: comparación de la eficacia de corte de las proteínas de fusión EndoSH y EndoF3-EndoH con las proteínas individuales EndoS, EndoF3 y EndoH en RNasaB
[0141] Se preparó una solución madre de RNasaB (2 mg/ml) en citrato de sodio 50 mM, pH 4,5 con NaCl 150 mM, en Tris.HCl 50 mM, pH 6,0 con NaCl 150 mM y en Tris.HCl 50 mM, pH 7,5 con NaCl 150 mM. EndoSH (identificada por la SEQ ID N.°: 1), EndoF3-EndoH (identificada por la SEQ ID N.°: 19), EndoS (disponible comercialmente en Genovis, Lund, Suecia), EndoF3 (disponible comercialmente en Sigma-Aldrich, UE) y EndoH (disponibles comercialmente en New England Biolabs, Ipswich, EE. UU.) se diluyeron hasta una concentración de 50 nM en cada una de las soluciones amortiguadoras mencionadas anteriormente. Las reacciones se iniciaron añadiendo 5 pl de RNasa B (2 mg/mL) a 5 pl de la proteína de fusión de endoglicosidasa diluida (50 nM) en la solución amortiguadora de reacción correspondiente, dando como resultado una concentración final de 1 mg/mL de RNasa B y 25 Endoglicosidasa nM. Las reacciones se incubaron durante 60 minutos a 37 °C. Para cada reacción, se tomó una muestra (4 pl) y se añadió a 16 pl de solución amortiguadora de muestra 1x Laemmli sin 2-mercaptoetanol y se incubó durante 5 minutos a 95 °C. Las muestras (5 pl/muestra) se cargaron en gel SDS-PAGE y se procesaron durante 70 minutos (20 mA), se tiñeron en coomassie coloidal durante la noche y finalmente se quitó la tinción en agua. Los porcentajes de conversión se calcularon basándose en el escaneo del gel SDS-PAGE con un escáner plano normal y la cuantificación con una herramienta de software (CLlQS v1.1). Tabla 17. Porcentajes de corte (conversión) de RNasa B tras el tratamiento de diversas endoglicosidasas y ___________ proteínas de fusión de endoglicosidasas (25 nM) a^ pH 4,5, 6,0 y 7,5. ______________ pH End EndoF3-EndoH EndoS EndoF3 End
4,5 74 75 30
6,0 70 100 39
7,5 42 48 33 La conversión se calculó utilizando la siguiente fórmula: conversión (%) = 100 x (RNasaBcortada) / (RNasaBcortada RNasaBglicosilada).___________________________________________________Secuencias
[0142]
Identificación de secuencia de proteína de fusiónEndoS-EndoH(o EndoSH) tal como se expresa en E coli (SEQ. ID N.°: 1):
1 MPSIDSLHYL SENSKKEFKE ELSKAGQESQ KVKEILAKAQ QADKQAQELA
51 KMKIPEKIPM KPLHGPLYGG YFRTWHDKTS DPTEKDKVNS MGELPKEVDL
101 AFIFHDWTKD YSLFWKELAT KHVPKLNKQG TRVIRTIPWR FLAGGDNSGI
151 AEDTSKYPNT PEGNKALAKA IVDEYVYKYN LDGLDVDVEH DSIPKVDKKE
201 DTAGVERSIQ VFEEIGKLIG PKGVDKSRLF IMDSTYMADK NPLIERGAPY
251 INLLLVQVYG SQGEKGGWEP VSNRPEKTME ERWQGYSKYI RPEQYMIGFS
301 FYEENAQEGN LWYDINSRKD EDKANGINTD ITGTRAERYA RWQPKTGGVK
351 GGIFSYAIDR DGVAHQPKKY AKQKEFKDAT DNIFHSDYSV SKALKTVMLK
401 DKSYDLIDEK DFPDKALREA VMAQVGTRKG DLERFNGTLR LDNPAIQSLE
451 GLNKFKKLAQ LDLIGLSRIT KLDRSVLPAN MKPGKDTLET VLETYKKDNK
501 EEPATIPPVS LKVSGLTGLK ELDLSGFDRE TLAGLDAATL TSLEKVDISG
551 NKLDLAPGTE NRQIFDTMLS TISNHVGSNE QTVKFDKQKP TGHYPDTYGK
601 TSLRLPVANE KVDLQSQLLF GTVTNQGTLI NSEADYKAYQ NHKIAGRSFV
651 DSNYHYNNFK VSYENYTVKV TDSTLGTTTD KTLATDKEET YKVDFFSPAD
701 KTKAVHTAKV IVGDEKTMMV NLAEGATVIG GSAD PVNARK VFDGQLGSET
751 DNISLGWDSK QSIIFKLKED GLIKHWRFFN DSARNPETTN KPIQEASLQI
801 FNIKDYNLDN LLENPNKFDD EKYWITVDTY SAQGERATAF SNTLNNITSK
851 YWRWFDTKG DRYSSPWPE LQILGYPLPN ADTIMKTVTT AKELSQQKDK
901 FSQKMLDELK IKEMALETSL NSKIFDVTAI NANAGVLKDC IEKRQLLKKG
951 GGGSGGGGSG GGGSHHHHHH EFGGGGSGGG GSGGGGSAPAPVKQGPTSVA1001YVEVNNNSML NVGKYTLADG GGNAFDVAVI FAANINYDTG TKTAYLHFNE1051NVQRVLDNAV TQIRPLQQQG IKVLLSVLGN HQGAGFANFP SQQAASAFAK1101QLSDAVAKYG LDGVDFDDEY AEYGNNGTAQ PNDSSFVHLV TALRANMPDK1151IIS L Y N IG P A ASRLSYGGVD VSDKFDYAWN PYYGTWQVPG IALPKAQLSP1201AAVEIGRTSR STVADLARRT VDEGYGVYLT YNLDGGDRTA DVSAFTRELY1251GSEAVRTP
(la porción conectora está subrayada, la secuencia de EndoH se indica en cursiva)
Identificación de secuencia de la proteína de fusiónEndoS-EndoH(o EndoSH) tal como se expresa en CHO (SEQ. ID N.°: 2):
1 MPSIDSLHYL SENSKKEFKE ELSKAGQESQ KVKEILAKAQ QADKQAQELA
51 KMKIPEKIPM KPLHGPLYGG YFRTWHDKTS DPTEKDKVNS MGELPKEVDL
101 AFIFHDWTKD YSLFWKELAT KHVPKLNKQG TRVIRTIPWR FLAGGDNSGI
151 AEDTSKYPNT PEGNKALAKA IVDEYVYKYN LDGLDVDVEH DSIPKVDKKE 201 DTAGVERSIQ VFEEIGKLIG PKGVDKSRLF IMDSTYMADK NPLIERGAPY
251 INLLLVQVYG SQGEKGGWEP VSNRPEKTME ERWQGYSKYI RPEQYMIGFS
301 FYEENAQEGN LWYDINSRKD EDKANGINTD ITGTRAERYA RWQPKTGGVK
351 GGIFSYAIDR DGVAHQPKKY AKQKEFKDAT DNIFHSDYSV SKALKTVMLK
401 DKSYDLIDEK DFPDKALREA VMAQVGTRKG DLERFNGTLR LDNPAIQSLE
451 GLNKFKKLAQ LDLIGLSRIT KLDRSVLPAN MKPGKDTLET VLETYKKDNK
501 EEPATIPPVS LKVSGLTGLK ELDLSGFDRE TLAGLDAATL TSLEKVDISG
551 NKLDLAPGTE NRQIFDTMLS TISNHVGSNE QTVKFDKQKP TGHYPDTYGK
601 TSLRLPVANE KVDLQSQLLF GTVTNQGTLI NSEADYKAYQ NHKIAGRSFV
651 DSNYHYNNFK VSYENYTVKV TDSTLGTTTD KTLATDKEET YKVDFFSPAD
701 KTKAVHTAKV IVGDEKTMMV NLAEGATVIG GSADPVNARK VFDGQLGSET
751 DNISLGWDSK QSIIFKLKED GLIKHWRFFN DSARNPETTN KPIQEASLQI
801 FNIKDYNLDN LLENPNKFDD EKYWITVDTY SAQGERATAF SNTLNNITSK
851 YWRWFDTKG DRYSSPWPE LQILGYPLPN ADTIMKTVTT AKELSQQKDK
901 FSQKMLDELK IKEMALETSL NSKIFDVTAI NANAGVLKDC IEKRQLLKKG
951 GGGSGGGGSG GGGSHHHHHH GGGGSGGGGS GGGGSAPAPV KQGPTSVAYV
1001EVNNNSMLNV GKYTLADGGG NAFDVAVIFA ANINYDTGTK TAYLHFNENV
1051QRVLDNAVTQ IRPLQQQGIK VLLSVLGNHQ GAGFANFPSQ QAASAFAKQL
1101SDAVAKYGLD GVDFDDEYAE YGNNGTAQPN DSSFVHLVTA LRANMPDKII
1151SLYNIG PAAS RLSYGGVDVS DKFDYAWNPY YGTWQVPGIA LPKAQLSPAA
1201V E IG RTSRST VADLARRTVD EGYGVYLTYN LDGGDRTADV SAFTRELYGS
1251EAVRTP
(la porción conectora está subrayada, la secuencia EndoH se indica en cursiva)
Secuencia deHis6-TnGalNAcT(33-421)tal como se expresa en E coli (SEQ. ID N.0: 3):
1 MGSSHHHHHH SSGLVPRGSH MSPLRTYLYT PLYNATQPTL RNVERLAANW PKKIPSNYIE 61 DSEEYSIKNI SLSNHTTRAS WHPPSSITE TASKLDKNMT IQDGAFAMIS PTPLLITKLM 121 DSIKSYVTTE DGVKKAEAW TLPLCDSMPP DLGPITLNKT ELELEWVEKK FPEVEWGGRY 181 SPPNCTARHR VAIIVPYRDR QQHLAIFLNH MHPFLMKQQI EYGIFIVEQE GNKDFNRAKL 241 MNVGFVESQK LVAEGWQCFV FHDIDLLPLD TRNLYSCPRQ PRHMSASIDK LHFKLPYEDI 301 FGGVSAMTLE QFTRVNGFSN KYWGWGGEDD DMSYRLKKIN YHIARYKMSI ARYAMLDHKK 361 STPNPKRYQL LSQTSKTFQK DGLSTLEYEL VQWQYHLYT HILVNIDERS
Identificación de secuencia de la proteína de fusiónEndoF3-EfEndo18Atal como se expresa en E coli (SEQ. ID N.0: 13):
1 MATALAGSNG VCIAYYITDG RNPTFKLKDI PDKVDMVILF GLKYWSLQDT 51 TKLPGGTGMM GSFKSYKDLD TQIRSLQSRG IKVLQNIDDD VSWQSSKPGG
101 FASAAAYGDA IKSIVIDKWK LDGISLDIEH SGAKPNPIPT FPGYAATGYN
151 GWYSGSMAAT PAFLNVISEL TKYFGTTAPN NKQLQIASGI DVYAWNKIME
201 NFRNNFNYIQ LQSYGANVSR TQLMMNYATG TNKIPASKMV FGAYAEGGTN
251 QANDVEVAKW TPTQGAKGGM MIYTYNSNVS YANAVRDAVK NGGGGSGGGG
301 SGGGGSHHHH HHEFGGGGSG GGGSGGGGSASTVTPKTVMY VEVNNHDFNN
351 VGKYTLAGTN QPAFDMGIIF AANINYDTVN KKPYLYLNER VQQTLNEAET
401 QIRPVQARGT KVLLSILGNH EGAGFANFPT YESADAFAAQ LEQWNTYHL
451 DGIDFDDEYA EYGKNGTPQP NNSSFIWLLQ ALRNRLGNDK LITF YN IG P A
501 AANSSANPQM SSLIDYAW NP YYSTWNPPQI AGMPASRLGA SAVEVGVNQN
551 LAAQYAKRTK AEQYGIYLMY NLPGKDSSAY ISAATQELYG RKTNYSPTVP
601 TP
(la porción conectora está subrayada, la secuencia EfEndo18A está indicada en cursiva)
Identificación de secuencia de la proteína de fusiónEndoF2-EfEndo18Atal como se expresa en E coli (SEQ. ID N.0:14):
1 MAVNLSNLIA YKNSDHQISA GYYRTWRDSA TASGNLPSMR WLPDSLDMVM
51 VFPDYTPPEN AYWNTLKTNY VPYLHKRGTK VIITLGDLNS ATTTGGQDSI
101 GYSSWAKGIY DKWVGEYNLD GIDIDIESSP SGATLTKFVA ATKALSKYFG
151 PKSGTGKTFV YDTNQNPTNF FIQTAPRYNY VFLQAYGRST TNLTTVSGLY
201 APYISMKQFL PGFSFYEENG YPGNYWNDVR YPQNGTGRAY DYARWQPATG
251 KKGGVFSYAI ERDAPLTSSN DNTLRAPNFR VTKDLIKIMN PGGGGSGGGG
301 SGGGGSHHHH HHEFGGGGSG GGGSGGGGSA STVTPKTVMY VEVNNHDFNN
351 VGKYTLAGTN QPAFDMGIIF AANINYDTVN KKPYLYLNER VQQTLNEAET
401 QIRPVQARGT KVLLSILGNH EGAGFANFPT YESADAFAAQ LEQW NTYHL
451 DGIDFDDEYA EYGKNGTPQP NNSSFIWLLQ ALRNRLGNDK LITF YN IG P A
501 AANSSANPQM SSLIDYAW NP YYSTWNPPQI AGMPASRLGA SAVEVGVNQN
551 LAAQYAKRTK AEQYGIYLMYNLPGKDSSAY ISAATQELYG RKTNYSPTVP
601 TP
(la porción conectora está subrayada, la secuencia EfEndo18A está indicada en cursiva)
Identificación de secuencia de la proteína de fusiónEndoS-EfEndo18Atal como se expresa en E coli (SEQ. ID N.0:15):
1 MPSIDSLHYL SENSKKEFKE ELSKAGQESQ KVKEILAKAQ QADKQAQELA
51 KMKIPEKIPM KPLHGPLYGG YFRTWHDKTS DPTEKDKVNS MGELPKEVDL
101 AFIFHDWTKD YSLFWKELAT KHVPKLNKQG TRVIRTIPWR FLAGGDNSGI
151 AEDTSKYPNT PEGNKALAKA IVDEYVYKYN LDGLDVDVEH DSIPKVDKKE
201 DTAGVERSIQ VFEEIGKLIG PKGVDKSRLF IMDSTYMADK NPLIERGAPY
251 INLLLVQVYG SQGEKGGWEP VSNRPEKTME ERWQGYSKYI RPEQYMIGFS
301 FYEENAQEGN LWYDINSRKD EDKANGINTD ITGTRAERYA RWQPKTGGVK
351 GGIFSYAIDR DGVAHQPKKY AKQKEFKDAT DNIFHSDYSV SKALKTVMLK
401 DKSYDLIDEK DFPDKALREA VMAQVGTRKG DLERFNGTLR LDNPAIQSLE
451 GLNKFKKLAQ LDLIGLSRIT KLDRSVLPAN MKPGKDTLET VLETYKKDNK
501 EEPATIPPVS LKVSGLTGLK ELDLSGFDRE TLAGLDAATL TSLEKVDISG
551 NKLDLAPGTE NRQIFDTMLS TISNHVGSNE QTVKFDKQKP TGHYPDTYGK
601 TSLRLPVANE KVDLQSQLLF GTVTNQGTLI NSEADYKAYQ NHKIAGRSFV
651 DSNYHYNNFK VSYENYTVKV TDSTLGTTTD KTLATDKEET YKVDFFSPAD
701 KTKAVHTAKV IVGDEKTMMV NLAEGATVIG GSADPVNARK VFDGQLGSET
751 DNISLGWDSK QSIIFKLKED GLIKHWRFFN DSARNPETTN KPIQEASLQI
801 FNIKDYNLDN LLENPNKFDD EKYWITVDTY SAQGERATAF SNTLNNITSK
851 YWRWFDT KG DRYSSPWPE LQILGYPLPN ADTIMKTVTT AKELSQQKDK
901 FSQKMLDELK IKEMALETSL NSKIFDVTAI NANAGVLKDC IEKRQLLKKG
951 GGGSGGGGSG GGGSHHHHHH EFGGGGSGGG GSGGGGSAST VTPKTVMYVE
1001 VNNHDFNNVG KYTLAGTNQP AFDMGIIFAA NINYDTVNKK PYLYLNERVQ
1051 QTLNEAETQI RPVQARGTKV LLSILGNHEG AGFANFPTYE SADAFAAQLE
1101 QWNTYHLDG IDFDDEYAEY GKNGTPQPNN SSFIWLLQAL RNRLGNDKLI
1151 TFYNIGPAAA NSSANPQMSS LIDYAWNPYY STWNPPQIAG MPASRLGASA
1201 VEVGVNQNLA AQYAKRTKAE QYGIYLMYNL PGKDSSAYIS AATQELYGRK
1251 TNYSPTVPTP
(la porción conectora está subrayada, la secuencia EfEndo18A está indicada en cursiva)
Identificación de secuencia de la proteína de fusiónEndoF3-EndoF1tal como se expresa en E coli (SEQ. ID N.°: 16):
1 MATALAGSNG VCIAYYITDG RNPTFKLKDI PDKVDMVILF GLKYWSLQDT
51 TKLPGGTGMM GSFKSYKDLD TQIRSLQSRG IKVLQNIDDD VSWQSSKPGG
101 FASAAAYGDA IKSIVIDKWK LDGISLDIEH SGAKPNPIPT FPGYAATGYN
151 GWYSGSMAAT PAFLNVISEL TKYFGTTAPN NKQLQIASGI DVYAWNKIME
201 NFRNNFNYIQ LQSYGANVSR TQLMMNYATG TNKIPASKMV FGAYAEGGTN
251 QANDVEVAKW TPTQGAKGGM MIYTYNSNVS YANAVRDAVK NGGGGSGGGG
301 SGGGGSHHHH HHEFGGGGSG GGGSGGGGSAVTGTTKANIK LFSFTEVNDT
351 NPLNNLNFTL KNSGKPLVDM WLFSANINY DAANDKVFVS NNPNVQHLLT
401 NRAKYLKPLQ DKGLKVLLSL LGNHDRSGIA NLSTARAKAF AQELKNTCDL
451 YNLDGVFFDD EYSAYQTPPP SGFVTPSNNA AARLAYETKQ AMPNKLVTVY
501 VYSRTSSFPT AVDGVNAGSY VDYAIHDYGG SYDLATNYPG LAKSGMVMSS
551 QEFNQGRYAT AQALRNIVTK GYGGHMIFAM DPNRSNFTSG QLPALKLIAK
601 ELYGDELVYS NTPYSKDW
(la porción conectora está subrayada, la secuencia EndoFI se indica en cursiva)
Identificación de secuencia de la proteína de fusiónEndoF2-EndoF1tal como se expresa en E coli (SEQ. ID N.°: 17):
1MAVNLSNLIA YKNSDHQISA GYYRTWRDSA TASGNLPSMR WLPDSLDMVM
51 VFPDYTPPEN AYWNTLKTNY VPYLHKRGTK VIITLGDLNS ATTTGGQDSI
101 GYSSWAKGIY DKWVGEYNLD GIDIDIESSP SGATLTKFVA ATKALSKYFG
151 PKSGTGKTFV YDTNQNPTNF FIQTAPRYNY VFLQAYGRST TNLTTVSGLY
201 APYISMKQFL PGFSFYEENG YPGNYWNDVR YPQNGTGRAY DYARWQPATG
251 KKGGVFSYAI ERDAPLTSSN DNTLRAPNFR VTKDLIKIMN PGGGGSGGGG
301 SGGGGSHHHH HHEFGGGGSG GGGSGGGGSAVTGTTKANIK LFSFTEVNDT
351 NPLNNLNFTL KNSGKPLVDM WLFSANINY DAANDKVFVS NNPNVQHLLT
401 NRAKYLKPLQ D K G IK V ILS I LGNHDRSGIA NLSTARAKAF AQELKNTCDL
451 YNLDGVFFDD EYSAYQTPPP SGFVTPSNNA AARLAYETKQ AMPNKLVTVY
501 VYSRTSSFPT AVDGVNAGSY VDYAIHDYGG SYDLATNYPG LAKSGMVMSS
551 QEFNQGRYAT AQALRNIVTK GYGGHMIFAM DPNRSNFTSG QLPALKLIAK
601 ELYGDELVYS NTPYSKDW
(la porción conectora está subrayada, la secuencia EndoF1 se indica en cursiva)
Identificación de secuencia de proteína de fusiónEndoS-EndoF1tal como se expresa en E coli (SEQ. ID N.°: 18):1 MPSIDSLHYL SENSKKEFKE ELSKAGQESQ KVKEILAKAQ QADKQAQELA 51 KMKIPEKIPM KPLHGPLYGG YFRTWHDKTS DPTEKDKVNS MGELPKEVDL
101 AFIFHDWTKD YSLFWKELAT KHVPKLNKQG TRVIRTIPWR FLAGGDNSGI
151 AEDTSKYPNT PEGNKALAKA IVDEYVYKYN LDGLDVDVEH DSIPKVDKKE
201 DTAGVERSIQ VFEEIGKLIG PKGVDKSRLF IMDSTYMADK NPLIERGAPY
251 INLLLVQVYG SQGEKGGWEP VSNRPEKTME ERWQGYSKYI RPEQYMIGFS
301 FYEENAQEGN LWYDINSRKD EDKANGINTD ITGTRAERYA RWQPKTGGVK
351 GGIFSYAIDR DGVAHQPKKY AKQKEFKDAT DNIFHSDYSV SKALKTVMLK
401 DKSYDLIDEK DFPDKALREA VMAQVGTRKG DLERFNGTLR LDNPAIQSLE
451 GLNKFKKLAQ LDLIGLSRIT KLDRSVLPAN MKPGKDTLET VLETYKKDNK
501 EEPATIPPVS LKVSGLTGLK ELDLSGFDRE TLAGLDAATL TSLEKVDISG
551 NKLDLAPGTE NRQIFDTMLS TISNHVGSNE QTVKFDKQKP TGHYPDTYGK
601 TSLRLPVANE KVDLQSQLLF GTVTNQGTLI NSEADYKAYQ NHKIAGRSFV
651 DSNYHYNNFK VSYENYTVKV TDSTLGTTTD KTLATDKEET YKVDFFSPAD
701 KTKAVHTAKV IVGDEKTMMV NLAEGATVIG GSADPVNARK VFDGQLGSET
751 DNISLGWDSK QSIIFKLKED GLIKHWRFFN DSARNPETTN KPIQEASLQI
801 FNIKDYNLDN LLENPNKFDD EKYWITVDTY SAQGERATAF SNTLNNITSK
851 YWRWF DTKG DR YSS PWPE LQILGYPLPN ADTIMKTVTT AKELSQQKDK
901 FSQKMLDELK IKEMALETSL NSKIFDVTAI NANAGVLKDC IEKRQLLKKG
951 GGGSGGGGSG GGGSHHHHHH EFGGGGSGGG GSGGGGSAVTGTTKANIKLF
1001 SFTEVNDTNP LNNLNFTLKN SGKPLVDMW LFSANINYDA ANDKVFVSNN
1051 PNVQHLLTNR AKYLKPLQDK G IK V ILS ILG NHDRSGIANL S TARAKAFAQ
1101 ELKNTCDLYN LDGVFFDDEY SAYQTPPPSG FVTPSNNAAA RLAYETKQAM
1151 PNKLVTVYVY SRTSSFPTAV DGVNAGSYVD YAIHDYGGSY DLATNYPGLA
1201 KSGMVMSSQE FNQGRYATAQ ALRNIVTKGY GGHMIFAMDP NRSNFTSGQL
1251 PALKLIAKEL YGDELVYSNT PYSKDW
(la porción conectora está subrayada, la secuencia EndoFI se indica en cursiva)
Identificación de secuencia de la proteína de fusiónEndoF3-EndoHtal como se expresa en E coli (SEQ. ID N.°: 19):
1 MATALAGSNG VCIAYYITDG RNPTFKLKDI PDKVDMVILF GLKYWSLQDT
51 TKLPGGTGMM GSFKSYKDLD TQIRSLQSRG IKVLQNIDDD VSWQSSKPGG
101 FASAAAYGDA IKSIVIDKWK LDGISLDIEH SGAKPNPIPT FPGYAATGYN
151 GWYSGSMAAT PAFLNVISEL TKYFGTTAPN NKQLQIASGI DVYAWNKIME
201 NFRNNFNYIQ LQSYGANVSR TQLMMNYATG TNKIPASKMV FGAYAEGGTN 251 QANDVEVAKW TPTQGAKGGM MIYTYNSNVS YANAVRDAVK NGGGGSGGGG
301 SGGGGSHHHH HHEFGGGGSG GGGSGGGGSAPAPVKQGPTS VAYVEVNNNS
351MLNVGKYTLA DGGGNAFDVA VIFAANINYD TGTKTAYLHF NENVQRVLDN
401AVTQIRPLQQ QGIKVLLSVL GNHQGAGFAN FPSQQAASAF AKQLSDAVAK
451YGLDGVDFDD EYAEYGNNGT AQPNDSSFVH LVTALRANMP D K IIS L Y N IG
501PAASRLSYGG VDVSDKFDYA WNPYYGTWQV PGIALPKAQL SPAAVEIG RT
551SRSTVADLAR RTVDEGYGVY LTYNLDGGDR TADVSAFTRE LYGSEAVRTP
(la porción conectora está subrayada, la secuencia EndoH se indica en cursiva)
Identificación de secuencia de la proteína de fusiónEndoF2-EndoHtal como se expresa en E coli (SEQ. ID N.°: 20):
1 MAVNLSNLIA YKNSDHQISA GYYRTWRDSA TASGNLPSMR WLPDSLDMVM
51 VFPDYTPPEN AYWNTLKTNY VPYLHKRGTK V IIT LG D LN S ATTTGGQDSI
101 GYSSWAKGIY DKWVGEYNLD G ID ID IE S S P SGATLTKFVA ATKALSKYFG
151 PKSGTGKTFV YDTNQNPTNF FIQTAPRYNY VFLQAYGRST TNLTTVSGLY
201 APYISMKQFL PGFSFYEENG YPGNYWNDVR YPQNGTGRAY DYARWQPATG
251 KKGGVFSYAI ERDAPLTSSN DNTLRAPNFR VTKD LIK IM N PGGGGSGGGG
301 SGGGGSHHHH HHEFGGGGSG GGGSGGGGSAPAPVKQGPTS VAYVEVNNNS
351 MLNVGKYTLA DGGGNAFDVA VLFAANLNYD TGTKTAYLHF NENVQRVLDN
401 AVTQLRPLQQ QGLKVLLSVL GNHQGAGFAN FPSQQAASAF AKQLSDAVAK
451 YGLDGVDFDD EYAEYGNNGT AQPNDSSFVH LVTALRANMP DKLLSLYNLG
501 PAASRLSYGG VDVSDKFDYA WNPYYGTWQV PGLALPKAQL SPAAVELGRT
551 SRSTVADLAR RTVDEGYGVY LTYNLDGGDR TADVSAFTRE LYGSEAVRTP
(la porción conectora está subrayada, la secuencia EndoH se indica en cursiva)
Identificación de secuencia de la proteína de fusiónHis6-EndoS-EndoH(EndoS-EndoH sin porción conectora GS) tal como se expresa en E coli (SEQ. ID N.°: 21):
iMGSSHHHHHH SSGLVPRGSH M PSIDSLHYL SENSKKEFKE ELSKAGQESQ
51 KVKEILAKAQ QADKQAQELA KMKIPEKIPM KPLHGPLYGG YFRTWHDKTS 101 DPTEKDKVNS MGELPKEVDL AFIFHDWTKD YSLFWKELAT KHVPKLNKQG 151 TRVIRTIPWR FLAGGDNSGI AEDTSKYPNT PEGNKALAKA IVDEYVYKYN 201 LDGLDVDVEH DSIPKVDKKE DTAGVERSIQ VFEEIGKLIG PKGVDKSRLF 251 IMDSTYMADK NPLIERGAPY INLLLVQVYG SQGEKGGWEP VSNRPEKTME 301 ERWQGYSKYI RPEQYMIGFS FYEENAQEGN LWYDINSRKD EDKANGINTD 351 ITGTRAERYA RWQPKTGGVK GGIFSYAIDR DGVAHQPKKY AKQKEFKDAT 401 DNIFHSDYSV SKALKTVMLK DKSYDLIDEK DFPDKALREA VMAQVGTRKG 451 DLERFNGTLR LDNPAIQSLE GLNKFKKLAQ LDLIGLSRIT KLDRSVLPAN 501 MKPGKDTLET VLETYKKDNK EEPATIPPVS LKVSGLTGLK ELDLSGFDRE 551 TLAGLDAATL TSLEKVDISG NKLDLAPGTE NRQIFDTMLS TISNHVGSNE 601 QTVKFDKQKP TGHYPDTYGK TSLRLPVANE KVDLQSQLLF GTVTNQGTLI 651 NSEADYKAYQ NHKIAGRSFV DSNYHYNNFK VSYENYTVKV TDSTLGTTTD 701 KTLATDKEET YKVDFFSPAD KTKAVHTAKV IVGDEKTMMV NLAEGATVIG 751 GSADPVNARK VFDGQLGSET DNISLGWDSK QSIIFKLKED GLIKHWRFFN 801 DSARNPETTN KPIQEASLQI FNIKDYNLDN LLENPNKFDD EKYWITVDTY 851 SAQGERATAF SNTLNNITSK YW RW FDTKG DRY SS PWPE LQILGYPLPN 901 ADTIMKTVTT AKELSQQKDK FSQKMLDELK IKEMALETSL NSKIFDVTAI 951 NANAGVLKDC IEKRQLLKKAPAPVKQGPTS VAYVEVNNNS MLNVGKYTLA1001 DGGGNAFDVA VIFAANINYD TGTKTAYLHF NENVQRVLDN AVTQIRPLQQ 1051 QGIKVLLSVL GNHQGAGFAN FPSQQAASAF AKQLSDAVAK YGLDGVDFDD 1101 EYAEYGNNGT AQPNDSSFVH LVTALRANMP D K IIS L Y N IG PAASRLSYGG 1151 VDVSDKFDYA WNPYYGTWQV PGIALPKAQL SPAAVEIGRT SRSTVADLAR 1201 RTVDEGYGVY LTYNLDGGDR TADVSAFTRE LYGSEAVRTP
(La secuencia N-terminal que incluye la etiqueta His y el sitio de escisión de trombina está subrayada, la secuencia EndoH está en cursiva)
Identificación de secuencia de A D N que codifica la p ro te ína de fusiónE ndoF3-E fE ndo18Ata l com o se expresa en E co li (SEQ. ID N.°: 22) :
ATGGCTACAGCGCTGGCTGGTTCTAACGGGGTCTGCATCGCGTATTACATCACCGATGGGCGTAATCCGACG TTCAAATTGAAAGACATCCCGGATAAAGTAGACATGGTAATTCTTTTTGGTCTTAAGTATTGGTCATTGCAG GATACAACCAAATTGCCAGGGGGTACTGGTATGATGGGTTCGTTTAAATCCTACAAGGACCTGGACACCCAG ATTCGTAGTCTTCAAAGCCGTGGAATCAAAGTGTTGCAGAACATTGACGACGACGTCTCATGGCAGTCCTCG AAGCCGGGTGGGTTCGCTTCCGCCGCTGCTTACGGGGATGCTATTAAGAGTATCGTAATTGATAAGTGGAAG CTGGACGGGATTAGCTTGGATATTGAGCATTCGGGGGCTAAACCCAACCCTATCCCAACTTTTCCTGGATAT GCCGCGACAGGATATAATGGCTGGTATTCAGGATCTATGGCAGCCACGCCTGCCTTTCTTAATGTTATCTCA GAGCTTACTAAATAC TT TGGTACAAC GGCACCGAATAATAAG CAACTTCAGAT TGCTTC GGGTATTGAC GTA TATGCCTG GAATAAAAT CATGGAGAAC TTTCGTAATAAC TTCAAC TACAT CCAATTACAGTCATACGGAG CT AATGTCTCTCGTACTCAACTTATGATGAATTACGCAACGGGAACTAATAAAATTCCCGCCTCTAAAATGGTT TTCGGCGCCTACGCAGAGGGTGGCACTAACCAGGCAAATGACGTGGAGGTCGCCAAGTGGACACCTACGCAG GGCGCAAAGGGCGGTATGATGATCTATACTTACAATTCGAACGTGAGCTATGCAAATGCGGTTCGCGACGCA GTGAAAAATGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTCACCACCACCACCACCAC GAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGCTTCAACCGTAACCCCTAAA ACGGTTATGTACGTAGAAGTAAATAACCACGATTTCAACAATGTCGGGAAATACACTCTTGCCGGTACTAAT CAGCCGGCGTTC GATAT GGGTATTAT TTTTGCCGC CAACATCAAT TATGACAC CGTCAATAAGAAAC CATAC CTGTACTTGAACGAGCGCGTACAGCAAACACTGAATGAAGCGGAGACGCAGATCCGTCCGGTCCAGGCACGT GGAACGAAGGTTTTGCTTTCCATCTTGGGTAATCACGAAGGCGCAGGATTTGCCAATTTTCCTACGTATGAG TCGGCGGACGCTTTCGCCGCGCAACTTGAGCAGGTTGTCAATACGTACCATTTAGACGGGATTGATTTCGAT GATGAGTACGCCGAGTACGGAAAAAACGGGACCCCTCAGCCGAACAACTCATCCTTCATCTGGTTACTGCAA GCTCTTCGCAACCGTCTGGGAAATGATAAACTTATCACTTTCTACAACATTGGCCCGGCAGCCGCTAACAGC AGCGCAAACCCTCAAATGTCATCTTTGATTGACTATGCCTGGAATCCCTATTATTCGACATGGAACCCCCCA CAAATTGCAGGTATGCCTGCCTCCCGCCTGGGGGCTTCTGCGGTTGAAGTGGGCGTTAACCAGAATCTTGCA GCACAGTAT GCCAAGCGTACTAAGGCT GAGCAGTAT GGAATCTAT CTGATGTACAAT CTGCCAGGAAAAGAT
TCTAGCGCTTATATCTCAGCAGCGACTCAGGAGCTGTATGGGCGCAAGACGAACTATAGCCCCACGGTCCCG ACTCCGTGATAA
Identificación de secuencia de A D N que codifica la proteína de fusiónE ndoF2-E fE ndo18Ata l com o se expresa en E co li (SEQ. ID N.°: 23):
ATGGCGGTAAACCTTAGTAATCTTATCGCTTATAAAAATAGTGACCATCAGATCAGTGCGGGATATTACCGT ACATGGCGTGACAGCGCCACAGCCAGTGGTAATCTTCCTAGTATGCGTTGGTTGCCAGACTCATTGGACATG GTAAT GGTATTCCCAGAC TATAC TCCTCCG GAAAAT GCGTATTGGAAC ACAC TGAAGACTAAC TAC GTAC CA TACCTGCATAAGCGTGGCACGAAAGTTATTATCACATTGGGGGACCTTAACTCTGCAACGACCACGGGAGGG CAAGATTCTATTGGGTATTCATCGTGGGCCAAAGGAATCTATGATAAATGGGTGGGCGAGTATAATCTTGAT GGAATCGATATTGACATCGAATCGTCACCGTCCGGTGCGACCTTAACGAAGTTTGTTGCGGCAACAAAAGCG TTGTCAAAGTAT TTT GGACCAAAGAGT GGGACAG GCAAGAC CTTT GTATACGATAC CAAT CAGAATC CGACT AATTTCTTTATCCAAACTGCCCCACGCTACAACTACGTATTTCTTCAAGCATACGGGCGCTCGACCACTAAT CTGACGACGGTCTCTGGATTATACGCCCCCTATATTTCAATGAAACAATTTCTGCCCGGCTTCTCTTTTTAC GAAGAAAACGGTTACCCAGGTAATTATTGGAATGATGTGCGTTACCCCCAGAACGGTACAGGCCGTGCCTAC GACTACGCGCGCTGGCAGCCCGCCACGGGAAAAAAAGGAGGGGTGTTCAGTTATGCCATCGAGCGCGACGCC CCTCTTACATCGTCAAACGACAATACCCTGCGTGCGCCTAACTTTCGTGTAACGAAGGACTTAATCAAAATT ATGAATCCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTCACCACCACCACCACCAC GAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGCTTCAACCGTAACCCCTAAA ACGGTTATGTACGTAGAAGTAAATAACCACGATTTCAACAATGTCGGGAAATACACTCTTGCCGGTACTAAT CAGCCGGCGTTC GATAT GGGTAT TATTTTTGCCGC CAACAT CAATTATGACAC CGTCAATAAGAAAC CATAC CTGTACTTGAACGAGCGCGTACAGCAAACACTGAATGAAGCGGAGACGCAGATCCGTCCGGTCCAGGCACGT GGAACGAAGGTTTTGCTTTCCATCTTGGGTAATCACGAAGGCGCAGGATTTGCCAATTTTCCTACGTATGAG TCGGCGGACGCTTTCGCCGCGCAACTTGAGCAGGTTGTCAATACGTACCATTTAGACGGGATTGATTTCGAT GATGAGTACGCCGAGTACGGAAAAAACGGGACCCCTCAGCCGAACAACTCATCCTTCATCTGGTTACTGCAA GCTCTTCGCAACCGTCTGGGAAATGATAAACTTATCACTTTCTACAACATTGGCCCGGCAGCCGCTAACAGC AGCGCAAACCCTCAAATGTCATCTTTGATTGACTATGCCTGGAATCCCTATTATTCGACATGGAACCCCCCA CAAATTGCAGGTATGCCTGCCTCCCGCCTGGGGGCTTCTGCGGTTGAAGTGGGCGTTAACCAGAATCTTGCA GCACAGTATGCCAAGCGTACTAAGGCTGAGCAGTATGGAATCTATCTGATGTACAATCTGCCAGGAAAAGAT TCTAGCGCTTATATCTCAGCAGCGACTCAGGAGCTGTATGGGCGCAAGACGAACTATAGCCCCACGGTCCCG ACTCCGTGATAA
Identificación de secuencia de ADN que codifica la proteína de fusiónEndoS-EfEndo18Atal como se expresa en E coli (SEQ. ID N.°: 24):
ATGCCGTCAATCGATTCGCTGCATTATCTGAGCGAAAACTCTAAAAAAGAATTTAAAGAAGAACTGAGCAAA GCGGGC CAGGAAT CTCAAAAAGT TAAAGAAAT CCTGG CAAAAGC TCAGCAAG CCGATAAACAG GCACAAGAA CTGGCTAAAATGAAAATTCCGGAAAAAATCCCGATGAAACCGCTGCATGGTCCGCTGTACGGCGGTTATTTC CGTACCTGGCACGATAAAACGTCAGACCCGACCGAAAAAGACAAAGTCAACTCGATGGGCGAACTGCCGAAA GAAGTGGATCTGGCTTTTATTTTCCATGATTGGACCAAAGACTACTCTCTGTTTTGGAAAGAACTGGCAACG AAACACGTTCCGAAACTGAACAAACAGGGTACGCGTGTCATTCGTACCATTCCGTGGCGCTTCCTGGCTGGC GGTGATAATTCAGGCATCGCGGAAGACACCTCGAAATATCCGAACACGCCGGAAGGTAATAAAGCGCTGGCC AAAGCAATCGTCGATGAATACGTGTACAAATACAATCTGGACGGCCTGGATGTGGACGTTGAACATGATTCA ATTCCGAAAGTGGATAAAAAAGAAGACACCGCCGGCGTGGAACGTTCGATCCAGGTTTTTGAAGAAATTGGT AAACTGATCGGCCCGAAAGGTGTTGATAAAAGCCGTCTGTTCATCATGGATTCTACCTATATGGCCGACAAA AATCCGCTGATTGAACGCGGTGCACCGTACATCAACCTGCTGCTGGTCCAGGTGTATGGCAGCCAAGGTGAA AAAGGCGGTTGGGAACCGGTGTCTAACCGTCCGGAAAAAACCATGGAAGAACGCTGGCAGGGCTACTCAAAA TATATTCGTCCGGAACAATACATGATCGGCTTTTCGTTCTATGAAGAAAACGCGCAGGAAGGTAATCTGTGG TACGATAT TAATAGT CGCAAAGAT GAAGACAAAG CCAACGGCATTAATAC CGATAT CACGGGTACCCGTGCG GAACGCTATGCCCGTTGGCAGCCGAAAACCGGCGGTGTTAAAGGCGGTATTTTTAGCTACGCGATCGATCGT GACGGTGTCGCCCATCAGCCGAAAAAATACGCAAAACAAAAAGAGTTCAAAGATGCTACCGACAACATCTTC CACAGCGATTACAGTGTCTCCAAAGCGCTGAAAACCGTGATGCTGAAAGATAAATCTTACGATCTGATCGAC GAAAAAGATTTTCCGGACAAAGCGCTGCGCGAAGCCGTTATGGCACAGGTCGGCACCCGCAAAGGTGACCTG GAACGTTTTAATGGCACGCTGCGCCTGGATAACCCGGCCATTCAGAGCCTGGAAGGTCTGAATAAATTCAAA AAACTGGCACAACTGGACCTGATTGGCCTGAGCCGTATCACCAAACTGGATCGCTCTGTGCTGCCGGCCAAC ATGAAAC CGGGTAAAGACAC GCTG GAAACCGTTC TGGAAACCTACAAAAAAGATAACAAAGAAGAAC CGGCA ACGATCCCGCCGGTGTCTCTGAAAGTTTCCGGCCTGACCGGTCTGAAAGAACTGGATCTGAGCGGCTTTGAC CGTGAAACGCTGGCAGGTCTGGATGCGGCCACGCTGACCAGTCTGGAAAAAGTTGATATTTCCGGCAATAAA CTGGACCTGGCGCCGGGTACCGAAAACCGCCAGATTTTTGATACGATGCTGAGTACCATCTCCAACCATGTT GGCAG CAATGAACAGAC CGTCAAAT TCGACAAACAAAAAC CGACG GGCCACTAC CCGGATACGTAT GGTAAA ACCAGCCTGCGTCTGCCGGTCGCCAACGAAAAAGTGGATCTGCAGTCTCAACTGCTGTTTGGCACGGTTACC AATCAG GGTACCCT GATTAACAGC GAAGCAGATTACAAG GCTTAC CAAAACCATAAAAT CGCGGGTCGCT CA TTTGTGGATTCGAACTACCACTACAACAACTTCAAAGTTAGTTACGAAAACTACACCGTTAAAGTCACGGAT TCCACCCTGGGCACCACGACCGATAAAACGCTGGCCACCGACAAAGAAGAAACCTACAAAGTCGATTTCTTT AGCCCGGCAGACAAAACGAAAGCGGTGCATACCGCCAAAGTGATTGTTGGCGATGAAAAAACCATGATGGTG AACCTGGCTGAAGGTGCGACGGTTATCGGCGGTTCCGCAGACCCGGTTAACGCTCGCAAAGTCTTTGATGGC CAGCTGGGTAGTGAAACCGATAATATTTCCCTGGGTTGGGACTCAAAACAGTCGATTATCTTCAAACTGAAA GAAGACGGCCTGATCAAACACTGGCGTTTCTTTAACGATAGTGCCCGCAATCCGGAAACGACCAACAAACCG ATTCAG GAAGCAT CCCTGCAAATC TTCAACATCAAAGAT TACAAC CTGGACAAT CTGCTGGAAAAC CCGAAT AAATTCGATGACGAAAAATACTGGATCACGGTGGATACCTATAGCGCGCAGGGCGAACGTGCTACGGCGTTT AGTAACACCCTGAACAATATTACGTCCAAATACTGGCGTGTGGTTTTCGATACCAAAGGTGACCGCTATAGC TCTCCGGTCGTGCCGGAACTGCAGATTCTGGGCTATCCGCTGCCGAATGCTGATACGATCATGAAAACCGTG ACGAC CGCGAAAGAAC TGTCACAG CAAAAAGATAAAT TCTCGCAGAAAAT GCTGGAC GAACTGAAAAT TAAA GAAATGGCTCTGGAAACCAGCCTGAACAGTAAAATTTTCGATGTTACGGCGATCAATGCTAACGCTGGTGTG CTGAAAGACTGTATTGAAAAACGCCAACTGCTGAAAAAAGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGC GGCGGCGGCTCTCACCACCACCACCACCACGAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGC GGCGGCTCTGCTTCAACCGTAACCCCTAAAACGGTTATGTACGTAGAAGTAAATAACCACGATTTCAACAAT GTCGGGAAATACACTCTTGCCGGTACTAATCAGCCGGCGTTCGATATGGGTATTATTTTTGCCGCCAACATC AATTATGACACCGTCAATAAGAAACCATACCTGTACTTGAACGAGCGCGTACAGCAAACACTGAATGAAGCG GAGACGCAGATCCGTCCGGTCCAGGCACGTGGAACGAAGGTTTTGCTTTCCATCTTGGGTAATCACGAAGGC GCAGGATTTGCCAATTTTCCTACGTATGAGTCGGCGGACGCTTTCGCCGCGCAACTTGAGCAGGTTGTCAAT ACGTAC CATTTAGAC GGGATTGAT TTCGATGATGAGTAC GCCGAGTAC GGAAAAAAC GGGACCC CTCAGCCG AACAACTCATCCTTCATCTGGTTACTGCAAGCTCTTCGCAACCGTCTGGGAAATGATAAACTTATCACTTTC TACAACATTGGCCCGGCAGCCGCTAACAGCAGCGCAAACCCTCAAATGTCATCTTTGATTGACTATGCCTGG AATCCCTATTATTCGACATGGAACCCCCCACAAATTGCAGGTATGCCTGCCTCCCGCCTGGGGGCTTCTGCG GTTGAAGTGGGCGTTAACCAGAATCTTGCAGCACAGTATGCCAAGCGTACTAAGGCTGAGCAGTATGGAATC TATCTGAT GTACAAT CTGCCAGGAAAAGAT TCTAGCGCT TATATCT CAGCAGC GACTCAGGAG CTGTAT GGG CGCAAGACGAACTATAGCCCCACGGTCCCGACTCCGTGATAA
Identificación de secuencia de ADN que codifica la proteína de fusiónEndoF3-EndoF1tal como se expresa en E coli (SEQ. ID N.°: 25):
ATGGCTACAGCGCTGGCTGGTTCTAACGGGGTCTGCATCGCGTATTACATCACCGATGGGCGTAATCCGACG TTCAAATTGAAAGACATCCCGGATAAAGTAGACATGGTAATTCTTTTTGGTCTTAAGTATTGGTCATTGCAG GATACAACCAAATTGCCAGGGGGTACTGGTATGATGGGTTCGTTTAAATCCTACAAGGACCTGGACACCCAG ATTCGTAGTCTTCAAAGCCGTGGAATCAAAGTGTTGCAGAACATTGACGACGACGTCTCATGGCAGTCCTCG AAGCCGGGTGGGTTCGCTTCCGCCGCTGCTTACGGGGATGCTATTAAGAGTATCGTAATTGATAAGTGGAAG CTGGACGGGATTAGCTTGGATATTGAGCATTCGGGGGCTAAACCCAACCCTATCCCAACTTTTCCTGGATAT GCCGCGACAGGATATAATGGCTGGTATTCAGGATCTATGGCAGCCACGCCTGCCTTTCTTAATGTTATCTCA GAGCTTACTAAATACTTTGGTACAACGGCACCGAATAATAAGCAACTTCAGATTGCTTCGGGTATTGACGTA TATGCCT GGAATAAAAT CATGGAGAACTT TCGTAATAAC TTCAAC TACAT CCAATTACAGT CATAC GGAGCT AATGTCTCTCGTACTCAACTTATGATGAATTACGCAACGGGAACTAATAAAATTCCCGCCTCTAAAATGGTT TTCGGCGCCTACGCAGAGGGTGGCACTAACCAGGCAAATGACGTGGAGGTCGCCAAGTGGACACCTACGCAG GGCGCAAAGGGCGGTATGATGATCTATACTTACAATTCGAACGTGAGCTATGCAAATGCGGTTCGCGACGCA GTGAAAAATGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTCACCACCACCACCACCAC GAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGCGGTAACCGGGACAACGAAG GCTAACAT CAAACTTTTTAGTTT TACAGAG GTAAAC GACACTAAT CCGTTGAACAATCT GAACTTTACCTTA AAAAACTCGGGAAAACCCTTAGTAGATATGGTAGTGTTATTTTCCGCGAACATTAACTATGACGCGGCCAAC GATAAGGTCTTCGTATCGAATAATCCGAACGTACAGCATCTTTTGACCAATCGTGCGAAGTACCTTAAGCCG TTACAAGACAAGGGGATCAAGGTGATTTTGTCAATCTTAGGGAACCATGATCGCTCCGGGATCGCCAATTTG AGTACGGCTCGTGCGAAGGCATTTGCTCAGGAACTGAAGAATACTTGCGATTTGTATAATTTAGACGGGGTA TTCTTTGATGATGAGTACTCTGCTTACCAAACGCCACCGCCGAGCGGCTTCGTGACACCCAGTAATAACGCC GCAGCTCGCCTTGCTTATGAAACAAAGCAGGCTATGCCAAACAAGCTGGTCACGGTGTACGTCTATTCCCGC ACTTCGAGTTTTCCCACAGCGGTAGACGGGGTCAACGCCGGGTCCTACGTAGACTATGCGATTCATGACTAC GGTGGCTCATACGACTTGGCTACTAATTATCCGGGGTTGGCTAAGTCTGGGATGGTGATGTCTAGTCAGGAG TTTAACCAGGGCCGTTACGCGACTGCACAAGCATTGCGCAACATTGTGACCAAGGGCTATGGAGGCCACATG ATCTTTGCCATGGACCCCAATCGTTCTAATTTCACGTCAGGGCAACTGCCCGCACTGAAGCTGATTGCCAAG GAGCTTTACGGG GAT GAGCTTGT GTACAG CAACACT CCTTACAGTAAG GATT GGTGATAA
Identificación de secuencia de A D N que codifica la proteína de fusiónEndoF2-EndoF1ta l com o se expresa en E coli (SEQ. ID N.°: 26):
ATGGCGGTAAACCTTAGTAATCTTATCGCTTATAAAAATAGTGACCATCAGATCAGTGCGGGATATTACCGT ACATGGCGTGACAGCGCCACAGCCAGTGGTAATCTTCCTAGTATGCGTTGGTTGCCAGACTCATTGGACATG GTAATGGTAT TCCCAGACTATAC TCCTCCGGAAAAT GCGTAT TGGAACACACT GAAGACTAAC TACGTACCA TACCTGCATAAGCGTGGCACGAAAGTTATTATCACATTGGGGGACCTTAACTCTGCAACGACCACGGGAGGG CAAGATTCTATTGGGTATTCATCGTGGGCCAAAGGAATCTATGATAAATGGGTGGGCGAGTATAATCTTGAT GGAATCGATATTGACATCGAATCGTCACCGTCCGGTGCGACCTTAACGAAGTTTGTTGCGGCAACAAAAGCG TTGTCAAAGT ATTTT GGACCAAAGAGT GGGACAGGCAAGAC CTTTGTAT ACGATAC CAATCAGAAT CCGACT AATTTCTTTATCCAAACTGCCCCACGCTACAACTACGTATTTCTTCAAGCATACGGGCGCTCGACCACTAAT CTGACGACGGTCTCTGGATTATACGCCCCCTATATTTCAATGAAACAATTTCTGCCCGGCTTCTCTTTTTAC GAAGAAAACGGTTACCCAGGTAATTATTGGAATGATGTGCGTTACCCCCAGAACGGTACAGGCCGTGCCTAC GACTACGCGCGCTGGCAGCCCGCCACGGGAAAAAAAGGAGGGGTGTTCAGTTATGCCATCGAGCGCGACGCC CCTCTTACATCGTCAAACGACAATACCCTGCGTGCGCCTAACTTTCGTGTAACGAAGGACTTAATCAAAATT ATGAATCCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTCACCACCACCACCACCAC GAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGCGGTAACCGGGACAACGAAG GCTAACAT CAAACTTTTTAGTTT TACAGAGGTAAAC GACAC TAATC CGTTGAACAAT CTGAAC TTTACCTTA AAAAACTCGGGAAAACCCTTAGTAGATATGGTAGTGTTATTTTCCGCGAACATTAACTATGACGCGGCCAAC GATAAGGTCTTCGTATCGAATAATCCGAACGTACAGCATCTTTTGACCAATCGTGCGAAGTACCTTAAGCCG TTACAAGACAAGGGGATCAAGGTGATTTTGTCAATCTTAGGGAACCATGATCGCTCCGGGATCGCCAATTTG AGTACGGCTCGTGCGAAGGCATTTGCTCAGGAACTGAAGAATACTTGCGATTTGTATAATTTAGACGGGGTA TTCTTTGATGATGAGTACTCTGCTTACCAAACGCCACCGCCGAGCGGCTTCGTGACACCCAGTAATAACGCC GCAGCTCGCCTTGCTTATGAAACAAAGCAGGCTATGCCAAACAAGCTGGTCACGGTGTACGTCTATTCCCGC ACTTCGAGTTTTCCCACAGCGGTAGACGGGGTCAACGCCGGGTCCTACGTAGACTATGCGATTCATGACTAC GGTGGCTCATACGACTTGGCTACTAATTATCCGGGGTTGGCTAAGTCTGGGATGGTGATGTCTAGTCAGGAG TTTAACCAGGGCCGTTACGCGACTGCACAAGCATTGCGCAACATTGTGACCAAGGGCTATGGAGGCCACATG ATCTTTGCCATGGACCCCAATCGTTCTAATTTCACGTCAGGGCAACTGCCCGCACTGAAGCTGATTGCCAAG GAGCTTTACGGGGATGAGCTTGTGTACAGCAACACTCCTTACAGTAAGGATTGGTGATAA
ATGCCGTCAATCGATTCGCTGCATTATCTGAGCGAAAACTCTAAAAAAGAATTTAAAGAAGAACTGAGCAAA GCGGGCCAGGAAT CTCAAAAAGTTAAAGAAAT CCTGGCAAAAG CTCAGCAAGC CGATAAACAGGCACAAGAA CTGGCTAAAATGAAAATTCCGGAAAAAATCCCGATGAAACCGCTGCATGGTCCGCTGTACGGCGGTTATTTC CGTACCTGGCACGATAAAACGTCAGACCCGACCGAAAAAGACAAAGTCAACTCGATGGGCGAACTGCCGAAA GAAGTGGATCTGGCTTTTATTTTCCATGATTGGACCAAAGACTACTCTCTGTTTTGGAAAGAACTGGCAACG AAACACGTTCCGAAACTGAACAAACAGGGTACGCGTGTCATTCGTACCATTCCGTGGCGCTTCCTGGCTGGC GGTGATAATTCAGGCATCGCGGAAGACACCTCGAAATATCCGAACACGCCGGAAGGTAATAAAGCGCTGGCC AAAGCAATCGTCGATGAATACGTGTACAAATACAATCTGGACGGCCTGGATGTGGACGTTGAACATGATTCA ATTCCGAAAGTGGATAAAAAAGAAGACACCGCCGGCGTGGAACGTTCGATCCAGGTTTTTGAAGAAATTGGT AAACTGATCGGCCCGAAAGGTGTTGATAAAAGCCGTCTGTTCATCATGGATTCTACCTATATGGCCGACAAA AATCCGCTGATTGAACGCGGTGCACCGTACATCAACCTGCTGCTGGTCCAGGTGTATGGCAGCCAAGGTGAA AAAGGCGGTTGGGAACCGGTGTCTAACCGTCCGGAAAAAACCATGGAAGAACGCTGGCAGGGCTACTCAAAA TATATTCGTCCGGAACAATACATGATCGGCTTTTCGTTCTATGAAGAAAACGCGCAGGAAGGTAATCTGTGG TACGATATTAATAGT CGCAAAGATGAAGACAAAG CCAACG GCATTAATACCGATAT CACGGGTACCCGTGCG GAACGCTATGCCCGTTGGCAGCCGAAAACCGGCGGTGTTAAAGGCGGTATTTTTAGCTACGCGATCGATCGT GAC GGTGTCGCC CATCAG CCGAAAAAATAC G CAAAACAAAAAGAGT TCAAAGAT GCTACCGACAACAT CTTC CACAG CGATTACAGT GTCTCCAAAG CGCTGAAAAC CGT GATGCTGAAAGATAAAT CTTAC GATCTGAT CGAC GAAAAAGATTTTCCGGACAAAGCGCTGCGCGAAGCCGTTATGGCACAGGTCGGCACCCGCAAAGGTGACCTG GAACGTTTTAATGGCACGCTGCGCCTGGATAACCCGGCCATTCAGAGCCTGGAAGGTCTGAATAAATTCAAA AAACTGGCACAACTGGACCTGATTGGCCTGAGCCGTATCACCAAACTGGATCGCTCTGTGCTGCCGGCCAAC AT GAAACCGG GTAAAGACAC GCTG GAAACCGT TCTGGAAAC CTACAAAAAAGATAACAAAGAAGAAC CGGCA ACGATCCCGCCGGTGTCTCTGAAAGTTTCCGGCCTGACCGGTCTGAAAGAACTGGATCTGAGCGGCTTTGAC CGTGAAACGCTGGCAGGTCTGGATGCGGCCACGCTGACCAGTCTGGAAAAAGTTGATATTTCCGGCAATAAA CTGGACCTGGCGCCGGGTACCGAAAACCGCCAGATTTTTGATACGATGCTGAGTACCATCTCCAACCATGTT GGCAG CAATGAACAGAC CGTCAAAT TCGACAAACAAAAAC CGACGG GCCACTAC CCGGATAC GTAT GGTAAA ACCAGCCTGCGTCTGCCGGTCGCCAACGAAAAAGTGGATCTGCAGTCTCAACTGCTGTTTGGCACGGTTACC AAT CAGGGTACCCT GATTAACAGC GAAGCAGAT TACAAG GCTTACCAAAAC CATAAAAT CGCGGGTCGCT CA TTTGTGGATTCGAACTACCACTACAACAACTTCAAAGTTAGTTACGAAAACTACACCGTTAAAGTCACGGAT TCCACCCTGGGCACCACGACCGATAAAACGCTGGCCACCGACAAAGAAGAAACCTACAAAGTCGATTTCTTT AGCCCGGCAGACAAAACGAAAGCGGTGCATACCGCCAAAGTGATTGTTGGCGATGAAAAAACCATGATGGTG AACCTGGCTGAAGGTGCGACGGTTATCGGCGGTTCCGCAGACCCGGTTAACGCTCGCAAAGTCTTTGATGGC CAGCTGGGTAGTGAAACCGATAATATTTCCCTGGGTTGGGACTCAAAACAGTCGATTATCTTCAAACTGAAA GAAGACGGCCTGATCAAACACTGGCGTTTCTTTAACGATAGTGCCCGCAATCCGGAAACGACCAACAAACCG ATTCAGGAAGCATCCCTGCAAATCTTCAACATCAAAGATTACAACCTGGACAATCTGCTGGAAAACCCGAAT AAATTCGATGACGAAAAATACTGGATCACGGTGGATACCTATAGCGCGCAGGGCGAACGTGCTACGGCGTTT AGTAACACCCTGAACAATATTACGTCCAAATACTGGCGTGTGGTTTTCGATACCAAAGGTGACCGCTATAGC TCTCCGGTCGTGCCGGAACTGCAGATTCTGGGCTATCCGCTGCCGAATGCTGATACGATCATGAAAACCGTG AC GAC CGCGAAAGAACT GTCACAG CAAAAAGAT AAAT TCTCGCAGAAAAT GCTGGACGAAC TGAAAAT TAAA GAAATGGCTCTGGAAACCAGCCTGAACAGTAAAATTTTCGATGTTACGGCGATCAATGCTAACGCTGGTGTG CTGAAAGACTGTATTGAAAAACGCCAACTGCTGAAAAAAGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGC GGCGGCGGCTCTCACCACCACCACCACCACGAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGC GGCGGCTCTGCGGTAACCGGGACAACGAAGGCTAACATCAAACTTTTTAGTTTTACAGAGGTAAACGACACT AATCCGTTGAACAATCTGAACTTTACCTTAAAAAACTCGGGAAAACCCTTAGTAGATATGGTAGTGTTATTT TCCGCGAACATTAACTATGACGCGGCCAACGATAAGGTCTTCGTATCGAATAATCCGAACGTACAGCATCTT TTGACCAATCGTGCGAAGTACCTTAAGCCGTTACAAGACAAGGGGATCAAGGTGATTTTGTCAATCTTAGGG AACCATGATCGCTCCGGGATCGCCAATTTGAGTACGGCTCGTGCGAAGGCATTTGCTCAGGAACTGAAGAAT ACTTGCGATTTGTATAATTTAGACGGGGTATTCTTTGATGATGAGTACTCTGCTTACCAAACGCCACCGCCG AGCGGCTTCGTGACACCCAGTAATAACGCCGCAGCTCGCCTTGCTTATGAAACAAAGCAGGCTATGCCAAAC AAGCTGGTCACGGTGTACGTCTATTCCCGCACTTCGAGTTTTCCCACAGCGGTAGACGGGGTCAACGCCGGG TCCTACGTAGACTATGCGATTCATGACTACGGTGGCTCATACGACTTGGCTACTAATTATCCGGGGTTGGCT AAGTCTGGGATGGTGATGTCTAGTCAGGAGTTTAACCAGGGCCGTTACGCGACTGCACAAGCATTGCGCAAC ATTGTGACCAAGGGCTATGGAGGCCACATGATCTTTGCCATGGACCCCAATCGTTCTAATTTCACGTCAGGG CAACTGCCCGCACTGAAGCTGATTGCCAAGGAGCTTTACGGGGATGAGCTTGTGTACAGCAACACTCCTTAC AGTAAGGATT GGTGATAA
Identificación de secuencia de A D N que codifica la proteína de fusiónE ndoF3-EndoHta l com o se expresa en E coli (SEQ. ID N.°: 28):
ATGGCTACAGCGCTGGCTGGTTCTAACGGGGTCTGCATCGCGTATTACATCACCGATGGGCGTAATCCGACG TTCAAATTGAAAGACATCCCGGATAAAGTAGACATGGTAATTCTTTTTGGTCTTAAGTATTGGTCATTGCAG GATACAACCAAATTGCCAGGGGGTACTGGTATGATGGGTTCGTTTAAATCCTACAAGGACCTGGACACCCAG ATTCGTAGTCTTCAAAGCCGTGGAATCAAAGTGTTGCAGAACATTGACGACGACGTCTCATGGCAGTCCTCG AAGCCGGGTGGGTTCGCTTCCGCCGCTGCTTACGGGGATGCTATTAAGAGTATCGTAATTGATAAGTGGAAG CTGGACGGGATTAGCTTGGATATTGAGCATTCGGGGGCTAAACCCAACCCTATCCCAACTTTTCCTGGATAT GCCGCGACAGGATATAATGGCTGGTATTCAGGATCTATGGCAGCCACGCCTGCCTTTCTTAATGTTATCTCA GAGCTTAC TAAATAC TTTGGTACAAC GGCAC CGAATAATAAG CAAC TTCAGAT TGCTTC GGGTATT GACGTA TATGCCT GGAATAAAAT CATGGAGAACTTT CGTAATAAC TTCAAC TACAT CCAATTACAG TCATAC GGAGCT AATGTCTCTCGTACTCAACTTATGATGAATTACGCAACGGGAACTAATAAAATTCCCGCCTCTAAAATGGTT TTCGGCGCCTACGCAGAGGGTGGCACTAACCAGGCAAATGACGTGGAGGTCGCCAAGTGGACACCTACGCAG GGCGCAAAGGGCGGTATGATGATCTATACTTACAATTCGAACGTGAGCTATGCAAATGCGGTTCGCGACGCA GTGAAAAATGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTCACCACCACCACCACCAC GAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGCCCCGGCCCCGGTGAAGCAG GGGCCGACCTCGGTGGCCTACGTCGAGGTGAACAACAACAGCATGCTCAACGTCGGCAAGTACACCCTGGCG GACGGAGGCGGCAACGCCTTCGACGTAGCCGTGATCTTCGCGGCGAACATCAACTACGACACCGGCACGAAG ACGGCCTACCTGCACTTCAACGAGAACGTGCAGCGCGTCCTTGACAACGCTGTCACGCAGATACGGCCGTTG CAGCAACAGGGCATCAAGGTCCTCCTCTCGGTGCTCGGCAACCACCAGGGCGCCGGGTTCGCGAACTTCCCC TCACAGCAGGCGGCTTCGGCGTTCGCGAAGCAGCTCTCGGACGCCGTGGCGAAGTACGGCCTCGACGGCGTC GACTTCGACGACGAATACGCCGAGTACGGCAACAACGGCACCGCGCAGCCCAACGACAGTTCGTTCGTGCAC CTGGTGACGGCACTGCGCGCGAACATGCCCGACAAGATCATCAGCCTCTACAACATCGGCCCGGCCGCGTCC CGCCTGTCGTACGGCGGTGTCGACGTCTCCGACAAGTTCGACTACGCCTGGAATCCCTACTACGGCACCTGG CAGGTCCCCGGCATCGCACTGCCCAAGGCGCAGCTGTCGCCGGCGGCCGTCGAGATCGGCCGGACCTCACGG AGCACCGTCGCCGACCTCGCCCGTCGCACCGTCGACGAGGGGTACGGCGTCTATCTGACGTACAACCTCGAC GGCGGCGATCGCACCGCCGACGTCTCCGCGTTCACCAGGGAGCTGTACGGCAGCGAGGCGGTCCGGACGCCG TGATAA
Identificación de secuencia de ADN que codifica la proteína de fusiónEndoF2-EndoHtal como se expresa en E coli (SEQ. ID N.°: 29):
ATGGCGGTAAACCTTAGTAATCTTATCGCTTATAAAAATAGTGACCATCAGATCAGTGCGGGATATTACCGT ACATGGCGTGACAGCGCCACAGCCAGTGGTAATCTTCCTAGTATGCGTTGGTTGCCAGACTCATTGGACATG GTAAT GGTATTCCCAGAC TATAC TCCTCCGGAAAAT GCGTATTGGAACACAC TGAAGAC TAAC TACGTAC CA TACCTGCATAAGCGTGGCACGAAAGTTATTATCACATTGGGGGACCTTAACTCTGCAACGACCACGGGAGGG CAAGATTCTATTGGGTATTCATCGTGGGCCAAAGGAATCTATGATAAATGGGTGGGCGAGTATAATCTTGAT GGAATCGATATTGACATCGAATCGTCACCGTCCGGTGCGACCTTAACGAAGTTTGTTGCGGCAACAAAAGCG TTGTCAAAGTAT TTT GGACCAAAGAGT GGGACAGGCAAGAC CTTTGTATAC GATAC CAATCAGAAT CCGAC T AATTTCTTTATCCAAACTGCCCCACGCTACAACTACGTATTTCTTCAAGCATACGGGCGCTCGACCACTAAT CTGACGACGGTCTCTGGATTATACGCCCCCTATATTTCAATGAAACAATTTCTGCCCGGCTTCTCTTTTTAC GAAGAAAACGGTTACCCAGGTAATTATTGGAATGATGTGCGTTACCCCCAGAACGGTACAGGCCGTGCCTAC GACTACGCGCGCTGGCAGCCCGCCACGGGAAAAAAAGGAGGGGTGTTCAGTTATGCCATCGAGCGCGACGCC CCTCTTACATCGTCAAACGACAATACCCTGCGTGCGCCTAACTTTCGTGTAACGAAGGACTTAATCAAAATT ATGAATCCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTCACCACCACCACCACCAC GAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGCCCCGGCCCCGGTGAAGCAG GGGCCGACCTCGGTGGCCTACGTCGAGGTGAACAACAACAGCATGCTCAACGTCGGCAAGTACACCCTGGCG GACGGAGGCGGCAACGCCTTCGACGTAGCCGTGATCTTCGCGGCGAACATCAACTACGACACCGGCACGAAG ACGGCCTACCTGCACTTCAACGAGAACGTGCAGCGCGTCCTTGACAACGCTGTCACGCAGATACGGCCGTTG CAGCAACAGGGCATCAAGGTCCTCCTCTCGGTGCTCGGCAACCACCAGGGCGCCGGGTTCGCGAACTTCCCC TCACAGCAGGCGGCTTCGGCGTTCGCGAAGCAGCTCTCGGACGCCGTGGCGAAGTACGGCCTCGACGGCGTC GACTTCGACGACGAATACGCCGAGTACGGCAACAACGGCACCGCGCAGCCCAACGACAGTTCGTTCGTGCAC CTGGTGACGGCACTGCGCGCGAACATGCCCGACAAGATCATCAGCCTCTACAACATCGGCCCGGCCGCGTCC CGCCTGTCGTACGGCGGTGTCGACGTCTCCGACAAGTTCGACTACGCCTGGAATCCCTACTACGGCACCTGG CAGGTCCCCGGCATCGCACTGCCCAAGGCGCAGCTGTCGCCGGCGGCCGTCGAGATCGGCCGGACCTCACGG AGCACCGTCGCCGACCTCGCCCGTCGCACCGTCGACGAGGGGTACGGCGTCTATCTGACGTACAACCTCGAC GGCGGCGATCGCACCGCCGACGTCTCCGCGTTCACCAGGGAGCTGTACGGCAGCGAGGCGGTCCGGACGCCG TGATAA
Identificación de secuencia de ADN que codifica la proteína de fusiónEndoS-EndoH(o EndoSH) tal como se expresa en E coli (SEQ. ID N.°: 30):
AT GCCGTCAATCGAT TCGCTGCAT TATCTGAG CGAAAAC TCTAAAAAAGAAT TTAAAGAAGAAC TGAGCAAA GCGGGCCAG GAATCT CAAAAAGT TAAAGAAAT CCTGGCAAAAG CTCAG CAAGC CGATAAACAG GCACAAGAA CTGGCTAAAATGAAAATTCCGGAAAAAATCCCGATGAAACCGCTGCATGGTCCGCTGTACGGCGGTTATTTC CGTACCTGG CACGATAAAAC GT CAGACCCGAC CGAAAAAGACAAAGT CAACTC GATGGGCGAAC TGCCGAAA GAAGTGGATCTGGCTTTTATTTTCCATGATTGGACCAAAGACTACTCTCTGTTTTGGAAAGAACTGGCAACG AAACACGTTCCGAAACTGAACAAACAGGGTACGCGTGTCATTCGTACCATTCCGTGGCGCTTCCTGGCTGGC GGTGATAATTCAGGCATCGCGGAAGACACCTCGAAATATCCGAACACGCCGGAAGGTAATAAAGCGCTGGCC AAAGCAATCGTCGATGAATACGTGTACAAATACAATCTGGACGGCCTGGATGTGGACGTTGAACATGATTCA ATTCCGAAAGTGGATAAAAAAGAAGACACCGCCGGCGTGGAACGTTCGATCCAGGTTTTTGAAGAAATTGGT AAACTGATCGGCCCGAAAGGTGTTGATAAAAGCCGTCTGTTCATCATGGATTCTACCTATATGGCCGACAAA AATCCGCTGATTGAACGCGGTGCACCGTACATCAACCTGCTGCTGGTCCAGGTGTATGGCAGCCAAGGTGAA AAAGGCGGTTGGGAACCGGTGTCTAACCGTCCGGAAAAAACCATGGAAGAACGCTGGCAGGGCTACTCAAAA TATATTCGTCCGGAACAATACATGATCGGCTTTTCGTTCTATGAAGAAAACGCGCAGGAAGGTAATCTGTGG TACGATAT TAATAGT CGCAAAGAT GAAGACAAAG CCAAC GGCATTAATAC CGATAT CACGGGTACCCGTGCG GAACGCTATGCCCGTTGGCAGCCGAAAACCGGCGGTGTTAAAGGCGGTATTTTTAGCTACGCGATCGATCGT GACGGTGTCGCC CATCAGCCGAAAAAATAC GCAAAACAAAAAGAGT TCAAAGAT GCTACCGACAACATC TTC CACAGCGAT TACAGT GTCTCCAAAG CGCTGAAAAC CGT GATGCTGAAAGATAAAT CTTACGAT CTGATC GAC GAAAAAGATTTTCCGGACAAAGCGCTGCGCGAAGCCGTTATGGCACAGGTCGGCACCCGCAAAGGTGACCTG GAACGTTTTAATGGCACGCTGCGCCTGGATAACCCGGCCATTCAGAGCCTGGAAGGTCTGAATAAATTCAAA AAACTGGCACAACTGGACCTGATTGGCCTGAGCCGTATCACCAAACTGGATCGCTCTGTGCTGCCGGCCAAC AT GAAACCGGGTAAAGACAC GCT GGAAACC GTTCTGGAAAC CTACAAAAAAGATAACAAAGAAGAAC CG GCA ACGATCCCGCCGGTGTCTCTGAAAGTTTCCGGCCTGACCGGTCTGAAAGAACTGGATCTGAGCGGCTTTGAC CGTGAAACGCTGGCAGGTCTGGATGCGGCCACGCTGACCAGTCTGGAAAAAGTTGATATTTCCGGCAATAAA CTGGACCTGGCGCCGGGTACCGAAAACCGCCAGATTTTTGATACGATGCTGAGTACCATCTCCAACCATGTT GGCAGCAAT GAACAGAC CGTCAAAT TCGACAAACAAAAAC CGACGGG CCACTACC CGGATACGTAT GGTAAA ACCAGCCTGCGTCTGCCGGTCGCCAACGAAAAAGTGGATCTGCAGTCTCAACTGCTGTTTGGCACGGTTACC AATCAGGGTACCCT GAT TAACAG CGAAGCAGAT TACAAG GCTTACCAAAAC CATAAAAT CGCGGGTCGCTCA TTTGTGGATTCGAACTACCACTACAACAACTTCAAAGTTAGTTACGAAAACTACACCGTTAAAGTCACGGAT TCCACCCTGGGCACCACGACCGATAAAACGCTGGCCACCGACAAAGAAGAAACCTACAAAGTCGATTTCTTT AGCCCGGCAGACAAAACGAAAGCGGTGCATACCGCCAAAGTGATTGTTGGCGATGAAAAAACCATGATGGTG AACCTGGCTGAAGGTGCGACGGTTATCGGCGGTTCCGCAGACCCGGTTAACGCTCGCAAAGTCTTTGATGGC CAGCTGGGTAGTGAAACCGATAATATTTCCCTGGGTTGGGACTCAAAACAGTCGATTATCTTCAAACTGAAA GAAGACGGCCTGATCAAACACTGGCGTTTCTTTAACGATAGTGCCCGCAATCCGGAAACGACCAACAAACCG ATTCAGGAAGCATCCCTGCAAATCTTCAACATCAAAGATTACAACCTGGACAATCTGCTGGAAAACCCGAAT AAATTCGATGACGAAAAATACTGGATCACGGTGGATACCTATAGCGCGCAGGGCGAACGTGCTACGGCGTTT AGTAACACCCTGAACAATATTACGTCCAAATACTGGCGTGTGGTTTTCGATACCAAAGGTGACCGCTATAGC TCTCCGGTCGTGCCGGAACTGCAGATTCTGGGCTATCCGCTGCCGAATGCTGATACGATCATGAAAACCGTG ACGACCG CGAAAGAAC TGTCACAG CAAAAAGATAAAT TCT CGCAGAAAAT GCTGGAC GAACTGAAAAT TAAA GAAATGGCTCTGGAAACCAGCCTGAACAGTAAAATTTTCGATGTTACGGCGATCAATGCTAACGCTGGTGTG CTGAAAGACTGTATTGAAAAACGCCAACTGCTGAAAAAAGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGC GGCGGCGGCTCTCACCACCACCACCACCACGAATTCGGCGGCGGCGGCTCTGGCGGCGGCGGCTCTGGCGGC GGCGGCTCTGCCCCGGCCCCGGTGAAGCAGGGGCCGACCTCGGTGGCCTACGTCGAGGTGAACAACAACAGC ATGCTCAACGTCGGCAAGTACACCCTGGCGGACGGAGGCGGCAACGCCTTCGACGTAGCCGTGATCTTCGCG GCGAACATCAACTACGACACCGGCACGAAGACGGCCTACCTGCACTTCAACGAGAACGTGCAGCGCGTCCTT GACAACGCTGTCACGCAGATACGGCCGTTGCAGCAACAGGGCATCAAGGTCCTCCTCTCGGTGCTCGGCAAC CACCAGGGCGCCGGGTTCGCGAACTTCCCCTCACAGCAGGCGGCTTCGGCGTTCGCGAAGCAGCTCTCGGAC GCCGTGGCGAAGTACGGCCTCGACGGCGTCGACTTCGACGACGAATACGCCGAGTACGGCAACAACGGCACC GCGCAGCCCAACGACAGTTCGTTCGTGCACCTGGTGACGGCACTGCGCGCGAACATGCCCGACAAGATCATC AGCCTCTACAACATCGGCCCGGCCGCGTCCCGCCTGTCGTACGGCGGTGTCGACGTCTCCGACAAGTTCGAC TACGCCTGGAATCCCTACTACGGCACCTGGCAGGTCCCCGGCATCGCACTGCCCAAGGCGCAGCTGTCGCCG GCGGCCGTCGAGATCGGCCGGACCTCACGGAGCACCGTCGCCGACCTCGCCCGTCGCACCGTCGACGAGGGG TACGGCGTCTATCTGACGTACAACCTCGACGGCGGCGATCGCACCGCCGACGTCTCCGCGTTCACCAGGGAG CTGTACGGCAGCGAGGCGGTCCGGACGCCGTGATAA
Identificación de secuencia de ADN que codifica la proteína de fusiónHiS6-EndoS-EndoH(EndoS-EndoH sin porción conectora GS) tal como se expresa en E coli (SEQ. ID N.°: 31):
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGCCGTCAATC GATTCGCTGCATTATCTGAGCGAAAACTCTAAAAAAGAATTTAAAGAAGAACTGAGCAAAGCGGGCCAGGAA TCTCAAAAAGT TAAAGAAAT CCTGGCAAAAGCT CAGCAAGC CGATAAACAG GCACAAGAAC TGGCTAAAAT G AAAATTCCGGAAAAAATCCCGATGAAACCGCTGCATGGTCCGCTGTACGGCGGTTATTTCCGTACCTGGCAC GATAAAAC GTCAGACC CGACCGAAAAAGACAAAGT CAACTC GATGGGCGAAC TGCCGAAAGAAGT G GATCTG GCTTTTATTTTCCATGATTGGACCAAAGACTACTCTCTGTTTTGGAAAGAACTGGCAACGAAACACGTTCCG AAACTGAACAAACAGGGTACGCGTGTCATTCGTACCATTCCGTGGCGCTTCCTGGCTGGCGGTGATAATTCA GGCATCGCGGAAGACACCTCGAAATATCCGAACACGCCGGAAGGTAATAAAGCGCTGGCCAAAGCAATCGTC GATGAATACGTGTACAAATACAATCTGGACGGCCTGGATGTGGACGTTGAACATGATTCAATTCCGAAAGTG GATAAAAAAGAAGACACCGCCGGCGTGGAACGTTCGATCCAGGTTTTTGAAGAAATTGGTAAACTGATCGGC CCGAAAGGTGTTGATAAAAGCCGTCTGTTCATCATGGATTCTACCTATATGGCCGACAAAAATCCGCTGATT GAACGCGGTGCACCGTACATCAACCTGCTGCTGGTCCAGGTGTATGGCAGCCAAGGTGAAAAAGGCGGTTGG GAACCGGTGTCTAACCGTCCGGAAAAAACCATGGAAGAACGCTGGCAGGGCTACTCAAAATATATTCGTCCG GAACAATACATGATCGGCTTTTCGTTCTATGAAGAAAACGCGCAGGAAGGTAATCTGTGGTACGATATTAAT AGTCGCAAAGATGAAGACAAAGCCAACGGCATTAATACCGATATCACGGGTACCCGTGCGGAACGCTATGCC CGTTGGCAGCCGAAAACCGGCGGTGTTAAAGGCGGTATTTTTAGCTACGCGATCGATCGTGACGGTGTCGCC CATCAG CCGAAAAAAT ACGCAAAAC AAAAAGAGT TCAAAGAT GCTACCGACAACATCTTCCAC AGCGATTAC AGTGTCTCCAAAGCGCTGAAAACCGTGATGCTGAAAGATAAATCTTACGATCTGATCGACGAAAAAGATTTT CCGGACAAAGCGCTGCGCGAAGCCGTTATGGCACAGGTCGGCACCCGCAAAGGTGACCTGGAACGTTTTAAT GGCACGCTGCGCCTGGATAACCCGGCCATTCAGAGCCTGGAAGGTCTGAATAAATTCAAAAAACTGGCACAA CTGGACCTGATTGGCCTGAGCCGTATCACCAAACTGGATCGCTCTGTGCTGCCGGCCAACATGAAACCGGGT AAAGAC ACGCTGGAAAC CGTTCT GGAAACCTACAAAAAAGAT AAC AAAGAAGAAC CGGCAAC GATCCCGCC G GTGTCTCTGAAAGTTTCCGGCCTGACCGGTCTGAAAGAACTGGATCTGAGCGGCTTTGACCGTGAAACGCTG GCAGGTCTGGATGCGGCCACGCTGACCAGTCTGGAAAAAGTTGATATTTCCGGCAATAAACTGGACCTGGCG CCGGGTACCGAAAACCGCCAGATTTTTGATACGATGCTGAGTACCATCTCCAACCATGTTGGCAGCAATGAA CAGACCGTCAAATTCGACAAACAAAAACCGACGGGCCACTACCCGGATACGTATGGTAAAACCAGCCTGCGT CTGCCGGTCGCCAACGAAAAAGTGGATCTGCAGTCTCAACTGCTGTTTGGCACGGTTACCAATCAGGGTACC CTGATTAACAGCGAAGCAGATTACAAGGCTTACCAAAACCATAAAATCGCGGGTCGCTCATTTGTGGATTCG AACTACCACTACAACAACTTCAAAGTTAGTTACGAAAACTACACCGTTAAAGTCACGGATTCCACCCTGGGC ACCAC GACCGATAAAAC GCTGGC CACCGACAAAGAAGAAAC CTACAAAGT C GATTTCTTTAGCCCGG CAGAC AAAACGAAAGCGGTGCATACCGCCAAAGTGATTGTTGGCGATGAAAAAACCATGATGGTGAACCTGGCTGAA GGTGCGACGGTTATCGGCGGTTCCGCAGACCCGGTTAACGCTCGCAAAGTCTTTGATGGCCAGCTGGGTAGT GAAACCGATAATATTTCCCTGGGTTGGGACTCAAAACAGTCGATTATCTTCAAACTGAAAGAAGACGGCCTG ATCAAACACTGGCGTTTCTTTAACGATAGTGCCCGCAATCCGGAAACGACCAACAAACCGATTCAGGAAGCA TCCC TGCAAATCT TCAACATCAAAGAT TACAAC CTGGACAAT CTGCTGGAAAAC CCGAATAAAT TCGATGAC GAAAAATACTGGATCACGGTGGATACCTATAGCGCGCAGGGCGAACGTGCTACGGCGTTTAGTAACACCCTG AACAATATTACGTCCAAATACTGGCGTGTGGTTTTCGATACCAAAGGTGACCGCTATAGCTCTCCGGTCGTG CCGGAACTGCAGATTCTGGGCTATCCGCTGCCGAATGCTGATACGATCATGAAAACCGTGACGACCGCGAAA GAACTGTCACAGCAAAAAGATAAATTCTCGCAGAAAATGCTGGACGAACTGAAAATTAAAGAAATGGCTCTG GAAACCAGCCTGAACAGTAAAATTTTCGATGTTACGGCGATCAATGCTAACGCTGGTGTGCTGAAAGACTGT ATTGAAAAACGCCAACTGCTGAAAAAAGCCCCGGCCCCGGTGAAGCAGGGGCCGACCTCGGTGGCCTACGTC GAGGTGAACAACAACAGCATGCTCAACGTCGGCAAGTACACCCTGGCGGACGGAGGCGGCAACGCCTTCGAC GTAGCCGTGATCTTCGCGGCGAACATCAACTACGACACCGGCACGAAGACGGCCTACCTGCACTTCAACGAG AACGTGCAGCGCGTCCTTGACAACGCTGTCACGCAGATACGGCCGTTGCAGCAACAGGGCATCAAGGTCCTC CTCTCGGTGCTCGGCAACCACCAGGGCGCCGGGTTCGCGAACTTCCCCTCACAGCAGGCGGCTTCGGCGTTC GCGAAGCAGCTCTCGGACGCCGTGGCGAAGTACGGCCTCGACGGCGTCGACTTCGACGACGAATACGCCGAG TACGGCAACAACGGCACCGCGCAGCCCAACGACAGTTCGTTCGTGCACCTGGTGACGGCACTGCGCGCGAAC ATGCCCGACAAGATCATCAGCCTCTACAACATCGGCCCGGCCGCGTCCCGCCTGTCGTACGGCGGTGTCGAC GTCTCCGACAAGTTCGACTACGCCTGGAATCCCTACTACGGCACCTGGCAGGTCCCCGGCATCGCACTGCCC AAGGCGCAGCTGTCGCCGGCGGCCGTCGAGATCGGCCGGACCTCACGGAGCACCGTCGCCGACCTCGCCCGT CGCACCGTCGACGAGGGGTACGGCGTCTATCTGACGTACAACCTCGACGGCGGCGATCGCACCGCCGACGTC TCCGCGTTCACCAGGGAGCTGTACGGCAGCGAGGCGGTCCGGACGCCGTGATAA
Identificación de secuencia de ADN que codificaHiS6-TnGalNAcT(33-421)como se expresa en CHO (SEQ. ID N.°: 32):
AT GAATTTTGGACTGAGGCTGATTTTCCTGGTGCTGACCCTGAAAGGCGTCCAGTGTCATCACCAT CAC CAT CACTCCCCGCTTCG CACATAT CTTTACACTCCATTATACAAT GCCACC CAGCCCACAC TCAGAAAC GTC GAG AG GCTG GCAGCTAAC TGGCCAAAGAAGAT CCCTAGTAAT TATATAGAAGATAG CGAAGAGTATAG CATCAAG AATATTTCTTTGAGCAACCACACAACTAGAGCATCTGTGGTACATCCTCCTTCCTCTATCACCGAAACGGCA AGCAAACTGGATAAGAATATGACCATCCAAGACGGCGCCTTTGCTATGATTAGCCCGACGCCCTTGCTTATC ACCAAATTGATGGATAGCATCAAATCTTATGTTACTACCGAGGATGGGGTTAAGAAAGCCGAAGCCGTCGTA ACTCTCCCCCTCTGTGATAGCATGCCTCCTGACCTTGGTCCTATTACTCTTAACAAAACCGAGCTCGAGCTC GAATGGGTTGAGAAAAAGTTCCCTGAGGTCGAGTGGGGTGGACGTTATAGTCCCCCCAACTGCACAGCTAGG CATCGC GTAGCAAT CATAGT CCCGTACCGAGACAGACAGCAACAC CTG GCAAT CTTCTTAAAT CACATG CAC CCCTTCCT GATGAAACAGCAGAT CGAATAT GGCATCTTTAT CGTGGAGCAGGAAG GAAACAAG GACTTTAAC CGTGCGAAACTTATGAACGTCGGCTTTGTTGAAAGTCAAAAACTCGTTGCCGAGGGATGGCAGTGTTTCGTT TTTCAT GACATAGAC CTGCT CCCACTG GACACTAGAAAC CTCTATAGC TGCCCGAGACAG CCAC GCCACAT G AGCGCTTCCATTGACAAACTTCACTTTAAGCTGCCTTACGAAGACATCTTCGGTGGCGTGTCAGCCATGACT CTGGAACAGT TCAC CCGAGT GAAT GGATTTTCAAATAAATAC TGGGGAT GGGGGGGAGAGGAC GACGATAT G AGT TAT CGGCTTAAGAAAAT CAACTACCATATTG CAAGATATAAAAT GTCCATCG CCCGATAC GCCATG TTG GACCACAAGAAGT CAACACC CAAT CCTAAGCGGTAC CAATTACTCTCACAGAC CT CAAAGACAT TCCAGAAA GACGGGCTGAGCACCCTGGAATATGAGCTGGTGCAAGTCGTTCAATATCATCTGTATACTCACATCCTGGTT AATATTGACGAGAGGTCCTGATAA
(la secuencia señal para la secreción está subrayada)
Identificación de secuencia deHise-TnGalNAcT(33-421)como se expresa en CHO (SEQ. ID N.°: 33):
HHHHHHSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASWHPPSS ITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAWTLPLCDSMPPDLGPITLNK TELELEWVEKKFPEVEWGGRYS PPNCTARHRVAIIVPYRDRQQHLAIFLNHMHP FLMKQQIEYGIFIVEQEG NKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKLHFKLPYEDIFGG VSAMTLEQFTRVNGFSNKYWGWGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTS KTFQKDGLSTLEYELVQWQYHLYTHILVNIDERS
Claims (15)
1. Enzima de fusión con la estructura (1):
EndoX-(L)p-EndoY (1)
en donde EndoX es EndoS, EndoY es una endoglicosidasa distinta de EndoX, L es una porción conectora y p es 0 o 1.
2. Enzima según la reivindicación 1, en donde EndoY se selecciona del grupo formado por EndoA, EndoBi, EndoBH, EndoBT, EndoCE, EndoD, EndoE, EfEndo18A, EndoF1, EndoF2, EndoF3, EndoH, EndoLL, EndoM, EndoOm y EndoT, preferiblemente se seleccionada del grupo formado por EndoF1, EndoF2, EndoF3, EfEndo18AyEndoH.
3. Enzima según la reivindicación 1 o 2, en donde las endoglicosidasas representadas por EndoX y EndoY tienen actividad endoglicosidasa distinta.
4. Enzima según cualquiera de las reivindicaciones 1 - 3, en donde EndoY es EndoF1, EndoD, EndoE, EndoH, EfEndo18A o EndoT, preferiblemente EndoH.
5. Enzima según cualquiera de las reivindicaciones 1 a 4, en donde EndoX tiene al menos un 80 % de identidad de secuencia con cualquiera de las SEQ ID N.° 4 y 5, y EndoY tiene al menos un 80 % de identidad de secuencia con cualquiera de las SEQ ID N.° 6-10.
6. Enzima según cualquiera de las reivindicaciones 1 a 5, que tiene al menos un 50 % de identidad de secuencia con cualquiera de las SeQ ID N.° 1,2, 15, 18 o 21.
7. Enzima según cualquiera de las reivindicaciones 1 - 6, en donde p = 0.
8. Enzima según cualquiera de las reivindicaciones 1 - 6, en donde p = 1 y L está compuesto de residuos amino y tiene una longitud de 1 a 100 residuos aminoácidos.
9. Enzima según la reivindicación 8, en la que la porción conectora tiene la secuencia (G4S)n1(H)r(EF)s(G4S)n2, en donde n1 y n2 individualmente son números enteros en el rango de 1 - 10, r es un número entero en el rango de 2 - 10 y s = 0 o 1.
10. Uso de la enzima de fusión según cualquiera de las reivindicaciones 1 a 9 para cortar una glicoproteína.
11. Uso según la reivindicación 10, en donde la glicoproteína es un anticuerpo.
12. Método para cortar una glicoproteína, poniendo en contacto la glicoproteína con una enzima de fusión según cualquiera de las reivindicaciones 1 - 9.
13. Método según la reivindicación 12, en donde la glicoproteína comprende al menos un glicano con alto contenido en manosa y al menos un glicano complejo, preferiblemente en el que la glicoproteína comprende además al menos un glicano híbrido.
14. Método según cualquiera de las reivindicaciones 12 - 13, en donde la glicoproteína es un anticuerpo.
15. Método según cualquiera de las reivindicaciones 12 a 14, en donde el contacto se realiza a un pH que es de 0,5 a 3 unidades de pH, preferiblemente de 1 a 2 unidades de pH, diferente del pH óptimo de una o ambas de EndoX y EndoY.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16154739 | 2016-02-08 | ||
EP16154712 | 2016-02-08 | ||
EP16173595 | 2016-06-08 | ||
EP16173599 | 2016-06-08 | ||
EP16206867 | 2016-12-23 | ||
PCT/EP2017/052792 WO2017137459A1 (en) | 2016-02-08 | 2017-02-08 | Enzymes for trimming of glycoproteins |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2972511T3 true ES2972511T3 (es) | 2024-06-13 |
Family
ID=58009825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES17704236T Active ES2972511T3 (es) | 2016-02-08 | 2017-02-08 | Enzimas para el corte de glicoproteínas |
Country Status (4)
Country | Link |
---|---|
US (2) | US10858641B2 (es) |
EP (1) | EP3414328B1 (es) |
ES (1) | ES2972511T3 (es) |
WO (1) | WO2017137459A1 (es) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SI2991683T1 (sl) | 2013-05-02 | 2020-01-31 | Glykos Finland Oy | Konjugati glikoproteina ali glikana s toksično obremenitvijo |
EP4010470A4 (en) * | 2019-08-05 | 2023-08-09 | Cho Pharma Inc | FUSION PROTEIN FOR ANTIBODY GLYCOFORM REMODELING |
WO2021142199A1 (en) | 2020-01-09 | 2021-07-15 | Mersana Therapeutics, Inc. | Site specific antibody-drug conjugates with peptide-containing linkers |
NL2026400B1 (en) | 2020-09-02 | 2022-05-04 | Synaffix Bv | Methods for the preparation of bioconjugates |
AU2022205057A1 (en) | 2021-01-04 | 2023-07-13 | Mersana Therapeutics, Inc. | B7h4-targeted antibody-drug conjugates and methods of use thereof |
CN117157107A (zh) | 2021-02-08 | 2023-12-01 | 西纳福克斯股份有限公司 | 多功能抗体 |
TW202346322A (zh) * | 2022-03-02 | 2023-12-01 | 日商第一三共股份有限公司 | 含Fc分子之製造方法 |
EP4344707A1 (en) | 2022-09-29 | 2024-04-03 | Emergence Therapeutics AG | New anti-nectin-4 antibody drug conjugates |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2187386C (en) | 1995-10-27 | 2007-01-23 | Kaoru Takegawa | Gene encoding endo-.beta.-n-acetylglucosaminidase a |
EP2623986B1 (en) | 2006-02-10 | 2017-06-14 | Life Technologies Corporation | Labeling and detection of post translationally modified proteins |
WO2007133855A2 (en) | 2006-03-27 | 2007-11-22 | University Of Maryland Biotechnology Institute | Glycoprotein synthesis and remodeling by enzymatic transglycosylation |
WO2009141599A1 (en) | 2008-05-20 | 2009-11-26 | The University Of York | Enhanced glycosylation using modified endohexosaminidase |
JP2013506404A (ja) | 2009-10-02 | 2013-02-28 | ロシュ グリクアート アーゲー | 抗体における非フコシル化の検出法 |
PL3912642T3 (pl) | 2012-10-23 | 2023-08-14 | Synaffix B.V. | Zmodyfikowane przeciwciało, koniugat przeciwciała i sposób ich otrzymywania |
EP3057618B1 (en) * | 2013-10-14 | 2022-12-14 | SynAffix B.V. | Glycoengineered antibody, antibody-conjugate and methods for their preparation |
JP6750148B2 (ja) | 2014-04-25 | 2020-09-02 | 公益財団法人野口研究所 | 糖鎖切断抗体の製造方法及び均一糖鎖抗体 |
EP3598983A1 (en) | 2014-10-03 | 2020-01-29 | Synaffix B.V. | Sulfamide linker, conjugates thereof, and methods of preparation |
-
2017
- 2017-02-08 US US16/076,319 patent/US10858641B2/en active Active
- 2017-02-08 WO PCT/EP2017/052792 patent/WO2017137459A1/en active Application Filing
- 2017-02-08 ES ES17704236T patent/ES2972511T3/es active Active
- 2017-02-08 EP EP17704236.3A patent/EP3414328B1/en active Active
-
2020
- 2020-12-07 US US17/113,975 patent/US11713453B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10858641B2 (en) | 2020-12-08 |
US20190040374A1 (en) | 2019-02-07 |
US20210332342A1 (en) | 2021-10-28 |
EP3414328A1 (en) | 2018-12-19 |
US11713453B2 (en) | 2023-08-01 |
WO2017137459A1 (en) | 2017-08-17 |
EP3414328B1 (en) | 2024-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2972511T3 (es) | Enzimas para el corte de glicoproteínas | |
JP7297820B2 (ja) | ベータ-(1,4)-n-アセチルガラクトサミニルトランスフェラーゼ又はその突然変異体を用いる糖タンパク質の改変方法 | |
CN107810273B (zh) | 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法 | |
KR102576850B1 (ko) | 박테로이드 기원의 푸코시다제 및 이의 사용 방법 | |
ES2848861T3 (es) | Enzima mutante EndoS | |
JP2020114818A (ja) | 糖鎖工学的に操作された抗体、抗体コンジュゲート、及びそれらの調製方法 | |
US9689016B2 (en) | Method for in vivo production of deglycosylated recombinant proteins used as substrate for downstream protein glycoremodeling | |
JP2016538877A (ja) | 修飾糖タンパク質、タンパク質コンジュゲート及びそれらの調製方法 | |
US20170009266A1 (en) | Process for the attachment of a galnac moiety comprising a (hetero)aryl group to a glcnac moiety, and product obtained thereby | |
Huang et al. | Site-selective sulfation of N-glycans by human GlcNAc-6-O-sulfotransferase 1 (CHST2) and chemoenzymatic synthesis of sulfated antibody glycoforms | |
US11591408B2 (en) | Antibody glycoconjugates and methods of production and use | |
KR101755430B1 (ko) | 개선된 효율을 갖는 시알산전달효소를 이용한 당단백질의 당사슬에 시알산을 부가하는 방법 | |
JP5967725B2 (ja) | 複合型糖鎖加水分解酵素 | |
JP6993637B2 (ja) | フコース含有糖鎖を特異的に切断するエンドグリコシダーゼ | |
WO2015072785A1 (ko) | 구멍장이 버섯 유래의 시알산 결합 특이적인 재조합 렉틴 | |
Singha et al. | Catfish (Clarias batrachus) serum lectin recognizes polyvalent Tn [α-d-GalpNAc1-Ser/Thr], Tα [β-d-Galp-(1→ 3)-α-d-GalpNAc1-Ser/Thr], and II [β-d-Galp (1→ 4)-β-d-GlcpNAc1-] mammalian glycotopes | |
EP2725104A1 (en) | Method for preparing polymeric protein composed of monomeric protein produced by fusing protein having immunoglobulin fold structure to protein capable of serving as subunit structure | |
CN118056009A (zh) | 分离的多肽及其应用 | |
Giddens | Chemoenzymatic synthesis of homogenous glycopeptides and glycoproteins using bacterial endoglycosidases | |
KR20230011417A (ko) | 글리코실화된 Fc 도메인을 포함하는 단백질의 부위 특이적 컨쥬게이션을 위한 방법 | |
Kim et al. | Sialidases of corynebacteria and their biotechnological applications | |
CA3164271A1 (en) | Glycosylated single chain immunoglobulin domains | |
JP2019085372A (ja) | N−アセチルグルコサミントランスフェラーゼを用いた多分岐糖鎖を有するIgG抗体の調製方法 | |
Nicola et al. | A novel glycoconjugation method and unexpected photo-induced site-selective protein cleavage reaction |