RU2821317C1 - Вариант белка, экспортирующего o-фосфосерин, и способ получения о-фосфосерина, цистеина и его производных с его использованием - Google Patents
Вариант белка, экспортирующего o-фосфосерин, и способ получения о-фосфосерина, цистеина и его производных с его использованием Download PDFInfo
- Publication number
- RU2821317C1 RU2821317C1 RU2022114846A RU2022114846A RU2821317C1 RU 2821317 C1 RU2821317 C1 RU 2821317C1 RU 2022114846 A RU2022114846 A RU 2022114846A RU 2022114846 A RU2022114846 A RU 2022114846A RU 2821317 C1 RU2821317 C1 RU 2821317C1
- Authority
- RU
- Russia
- Prior art keywords
- leu
- ala
- phosphoserine
- amino acid
- gly
- Prior art date
Links
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 title claims abstract description 143
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 title claims abstract description 23
- 235000018417 cysteine Nutrition 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 title claims description 59
- 108090000623 proteins and genes Proteins 0.000 title abstract description 152
- 102000004169 proteins and genes Human genes 0.000 title abstract description 104
- 235000018102 proteins Nutrition 0.000 title abstract description 101
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 title abstract description 29
- 150000001413 amino acids Chemical group 0.000 claims abstract description 169
- 230000000694 effects Effects 0.000 claims abstract description 155
- 229920001184 polypeptide Polymers 0.000 claims abstract description 138
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 138
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 138
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims abstract description 31
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims abstract description 31
- 229960000310 isoleucine Drugs 0.000 claims abstract description 31
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims abstract description 31
- 239000004474 valine Substances 0.000 claims abstract description 31
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims abstract description 26
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims abstract description 21
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims abstract description 17
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims abstract description 17
- 239000004472 Lysine Substances 0.000 claims abstract description 16
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims abstract description 16
- 239000004473 Threonine Substances 0.000 claims abstract description 16
- 235000003704 aspartic acid Nutrition 0.000 claims abstract description 16
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims abstract description 16
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims abstract description 16
- 241000588724 Escherichia coli Species 0.000 claims abstract description 15
- 150000001944 cysteine derivatives Chemical class 0.000 claims abstract description 15
- 108091033319 polynucleotide Proteins 0.000 claims description 89
- 102000040430 polynucleotide Human genes 0.000 claims description 89
- 239000002157 polynucleotide Substances 0.000 claims description 89
- 244000005700 microbiome Species 0.000 claims description 77
- 235000001014 amino acid Nutrition 0.000 claims description 45
- 229940024606 amino acid Drugs 0.000 claims description 42
- 239000013598 vector Substances 0.000 claims description 42
- 239000002609 medium Substances 0.000 claims description 36
- 238000006467 substitution reaction Methods 0.000 claims description 31
- UUQMNUMQCIQDMZ-UHFFFAOYSA-N betahistine Chemical compound CNCCC1=CC=CC=N1 UUQMNUMQCIQDMZ-UHFFFAOYSA-N 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 17
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 15
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 claims description 12
- 108030001910 O-phosphoserine sulfhydrylases Proteins 0.000 claims description 11
- 108010038555 Phosphoglycerate dehydrogenase Proteins 0.000 claims description 4
- 102100021762 Phosphoserine phosphatase Human genes 0.000 claims description 4
- 239000001963 growth medium Substances 0.000 claims description 4
- 102000030592 phosphoserine aminotransferase Human genes 0.000 claims description 4
- 108010088694 phosphoserine aminotransferase Proteins 0.000 claims description 4
- 108010076573 phosphoserine phosphatase Proteins 0.000 claims description 4
- 102100037579 D-3-phosphoglycerate dehydrogenase Human genes 0.000 claims description 3
- 229910052979 sodium sulfide Inorganic materials 0.000 claims 1
- GRVFOGOEDUUMBP-UHFFFAOYSA-N sodium sulfide (anhydrous) Chemical compound [Na+].[Na+].[S-2] GRVFOGOEDUUMBP-UHFFFAOYSA-N 0.000 claims 1
- AKHNMLFCWUSKQB-UHFFFAOYSA-L sodium thiosulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=S AKHNMLFCWUSKQB-UHFFFAOYSA-L 0.000 claims 1
- 235000019345 sodium thiosulphate Nutrition 0.000 claims 1
- 150000003680 valines Chemical class 0.000 claims 1
- 239000000126 substance Substances 0.000 abstract description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 abstract 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 abstract 1
- 239000002773 nucleotide Substances 0.000 description 39
- 125000003729 nucleotide group Chemical group 0.000 description 39
- 108020004414 DNA Proteins 0.000 description 31
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 28
- 230000014509 gene expression Effects 0.000 description 26
- 210000004027 cell Anatomy 0.000 description 25
- 238000012986 modification Methods 0.000 description 25
- 230000004048 modification Effects 0.000 description 24
- 210000000349 chromosome Anatomy 0.000 description 22
- 229960001153 serine Drugs 0.000 description 20
- 230000001965 increasing effect Effects 0.000 description 19
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 17
- 235000004400 serine Nutrition 0.000 description 17
- 102000015841 Major facilitator superfamily Human genes 0.000 description 16
- 108050004064 Major facilitator superfamily Proteins 0.000 description 16
- 108010050848 glycylleucine Proteins 0.000 description 16
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 14
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 14
- 238000004925 denaturation Methods 0.000 description 14
- 230000036425 denaturation Effects 0.000 description 14
- 238000006116 polymerization reaction Methods 0.000 description 14
- 235000008521 threonine Nutrition 0.000 description 14
- 101150010882 S gene Proteins 0.000 description 13
- 239000012634 fragment Substances 0.000 description 12
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 230000005764 inhibitory process Effects 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 9
- 150000007523 nucleic acids Chemical class 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 125000004429 atom Chemical group 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 7
- 239000004471 Glycine Substances 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 108010044940 alanylglutamine Proteins 0.000 description 7
- 238000000137 annealing Methods 0.000 description 7
- 108010037850 glycylvaline Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000004201 L-cysteine Substances 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 230000002708 enhancing effect Effects 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 5
- 235000013878 L-cysteine Nutrition 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- 229910052717 sulfur Inorganic materials 0.000 description 5
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 4
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 4
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 4
- NDKSHNQINMRKHT-PEXQALLHSA-N His-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N NDKSHNQINMRKHT-PEXQALLHSA-N 0.000 description 4
- PWKSKIMOESPYIA-BYPYZUCNSA-N L-N-acetyl-Cysteine Chemical compound CC(=O)N[C@@H](CS)C(O)=O PWKSKIMOESPYIA-BYPYZUCNSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- GBFLZEXEOZUWRN-VKHMYHEASA-N S-carboxymethyl-L-cysteine Chemical compound OC(=O)[C@@H](N)CSCC(O)=O GBFLZEXEOZUWRN-VKHMYHEASA-N 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 4
- 229960004308 acetylcysteine Drugs 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000001747 exhibiting effect Effects 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 101150033014 rhtB gene Proteins 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 125000003396 thiol group Chemical group [H]S* 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 3
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 3
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 241000588722 Escherichia Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 3
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 3
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 3
- 102000018697 Membrane Proteins Human genes 0.000 description 3
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 102000054767 gene variant Human genes 0.000 description 3
- 230000009036 growth inhibition Effects 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 108091005573 modified proteins Proteins 0.000 description 3
- 102000035118 modified proteins Human genes 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 230000004952 protein activity Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- 150000003679 valine derivatives Chemical class 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- 101150103854 yhhS gene Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 2
- LFLUCDOSQPJJBE-UHFFFAOYSA-N 3-phosphonooxypyruvic acid Chemical compound OC(=O)C(=O)COP(O)(O)=O LFLUCDOSQPJJBE-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 2
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 2
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 2
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 2
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 2
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 2
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 2
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 2
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 2
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 2
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 2
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 2
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 2
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 2
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 2
- UYYZZJXUVIZTMH-AVGNSLFASA-N Cys-Glu-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UYYZZJXUVIZTMH-AVGNSLFASA-N 0.000 description 2
- ZHCCYSDALWJITB-SRVKXCTJSA-N Cys-Phe-Cys Chemical compound N[C@@H](CS)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O ZHCCYSDALWJITB-SRVKXCTJSA-N 0.000 description 2
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 2
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 2
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 2
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 2
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 2
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 2
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 2
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 2
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 2
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 2
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 2
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 2
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 2
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 2
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 2
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 2
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 2
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 2
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- POMXSEDNUXYPGK-IHRRRGAJSA-N Leu-Met-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N POMXSEDNUXYPGK-IHRRRGAJSA-N 0.000 description 2
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 2
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- ZEVPMOHYCQFWSE-NAKRPEOUSA-N Met-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N ZEVPMOHYCQFWSE-NAKRPEOUSA-N 0.000 description 2
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- OAOLATANIHTNCZ-IHRRRGAJSA-N Phe-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N OAOLATANIHTNCZ-IHRRRGAJSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- NHHZWPNMYQUNEH-ACRUOGEOSA-N Phe-Tyr-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N NHHZWPNMYQUNEH-ACRUOGEOSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 2
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 2
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 2
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 2
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 2
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 2
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 2
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- CXUFDWZBHKUGKK-CABZTGNLSA-N Trp-Ala-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O)=CNC2=C1 CXUFDWZBHKUGKK-CABZTGNLSA-N 0.000 description 2
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 2
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 2
- LHHDBONOFZDWMW-AAEUAGOBSA-N Trp-Asp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LHHDBONOFZDWMW-AAEUAGOBSA-N 0.000 description 2
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 2
- OFTGYORHQMSPAI-PJODQICGSA-N Trp-Met-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O OFTGYORHQMSPAI-PJODQICGSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 2
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 2
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 2
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 2
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 2
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- LNWSJGJCLFUNTN-ZOBUZTSGSA-N Val-Trp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LNWSJGJCLFUNTN-ZOBUZTSGSA-N 0.000 description 2
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 2
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 239000003434 antitussive agent Substances 0.000 description 2
- 229940124584 antitussives Drugs 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- -1 aromatic amino acids Chemical class 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 101150003830 serC gene Proteins 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 235000002374 tyrosine Nutrition 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- NLQIBSKINOPHNA-FQEVSTJZSA-N (2r)-2-(9h-fluoren-9-ylmethoxycarbonylamino)-3-[2-[(2-methylpropan-2-yl)oxy]-2-oxoethyl]sulfanylpropanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CSCC(=O)OC(C)(C)C)C(O)=O)C3=CC=CC=C3C2=C1 NLQIBSKINOPHNA-FQEVSTJZSA-N 0.000 description 1
- WFDQTEFRLDDJAM-LURJTMIESA-N (2r)-2-[(2-methylpropan-2-yl)oxycarbonylamino]-3-methylsulfanylpropanoic acid Chemical compound CSC[C@@H](C(O)=O)NC(=O)OC(C)(C)C WFDQTEFRLDDJAM-LURJTMIESA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- PWKSKIMOESPYIA-UHFFFAOYSA-N 2-acetamido-3-sulfanylpropanoic acid Chemical compound CC(=O)NC(CS)C(O)=O PWKSKIMOESPYIA-UHFFFAOYSA-N 0.000 description 1
- VHPXSBIFWDAFMB-UHFFFAOYSA-N 2-amino-Delta(2)-thiazoline-4-carboxylic acid Chemical compound NC1=[NH+]C(C([O-])=O)CS1 VHPXSBIFWDAFMB-UHFFFAOYSA-N 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- ADVPTQAUNPRNPO-REOHCLBHSA-M 3-sulfino-L-alanine(1-) Chemical compound [O-]C(=O)[C@@H]([NH3+])CS([O-])=O ADVPTQAUNPRNPO-REOHCLBHSA-M 0.000 description 1
- 241000567139 Aeropyrum pernix Species 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- SWJYSDXMTPMBHO-FXQIFTODSA-N Cys-Pro-Ser Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SWJYSDXMTPMBHO-FXQIFTODSA-N 0.000 description 1
- GGLZPLKKBSSKCX-RXMQYKEDSA-N D-ethionine Chemical compound CCSCC[C@@H](N)C(O)=O GGLZPLKKBSSKCX-RXMQYKEDSA-N 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- CLSDNFWKGFJIBZ-YUMQZZPRSA-N Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O CLSDNFWKGFJIBZ-YUMQZZPRSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- VCUNGPMMPNJSGS-JYJNAYRXSA-N Gln-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VCUNGPMMPNJSGS-JYJNAYRXSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- XKPOCESCRTVRPL-KBIXCLLPSA-N Glu-Cys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XKPOCESCRTVRPL-KBIXCLLPSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- ZNOHKCPYDAYYDA-BPUTZDHNSA-N Glu-Trp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNOHKCPYDAYYDA-BPUTZDHNSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- KWHFUMYCSPJCFQ-NGTWOADLSA-N Ile-Thr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N KWHFUMYCSPJCFQ-NGTWOADLSA-N 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- VHPXSBIFWDAFMB-REOHCLBHSA-N L-2-amino-Delta(2)-thiazoline-4-carboxylic acid Chemical compound NC1=[NH+][C@H](C([O-])=O)CS1 VHPXSBIFWDAFMB-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ILRYLPWNYFXEMH-WHFBIAKZSA-N L-cystathionine Chemical compound [O-]C(=O)[C@@H]([NH3+])CCSC[C@H]([NH3+])C([O-])=O ILRYLPWNYFXEMH-WHFBIAKZSA-N 0.000 description 1
- XVOYSCVBGLVSOL-REOHCLBHSA-N L-cysteic acid Chemical compound OC(=O)[C@@H](N)CS(O)(=O)=O XVOYSCVBGLVSOL-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010036940 Levansucrase Proteins 0.000 description 1
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 1
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 1
- MPCKIRSXNKACRF-GUBZILKMSA-N Met-Pro-Asn Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O MPCKIRSXNKACRF-GUBZILKMSA-N 0.000 description 1
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- 241000187480 Mycobacterium smegmatis Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 101710161951 O-phosphoserine sulfhydrylase Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 101710190786 PI protein Proteins 0.000 description 1
- 101150038013 PIR gene Proteins 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 201000007100 Pharyngitis Diseases 0.000 description 1
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- QEPZQAPZKIPVDV-KKUMJFAQSA-N Phe-Cys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N QEPZQAPZKIPVDV-KKUMJFAQSA-N 0.000 description 1
- WZEWCHQHNCMBEN-PMVMPFDFSA-N Phe-Lys-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N WZEWCHQHNCMBEN-PMVMPFDFSA-N 0.000 description 1
- OKQQWSNUSQURLI-JYJNAYRXSA-N Phe-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N OKQQWSNUSQURLI-JYJNAYRXSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 1
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- BARPGRUZBKFJMA-SRVKXCTJSA-N Pro-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BARPGRUZBKFJMA-SRVKXCTJSA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000588768 Providencia Species 0.000 description 1
- 101150118278 S' gene Proteins 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- 241000224527 Trichomonas vaginalis Species 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- GHUNBABNQPIETG-MELADBBJSA-N Tyr-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O GHUNBABNQPIETG-MELADBBJSA-N 0.000 description 1
- UMXSDHPSMROQRB-YJRXYDGGSA-N Tyr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UMXSDHPSMROQRB-YJRXYDGGSA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- XYNFFTNEQDWZNY-ULQDDVLXSA-N Tyr-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N XYNFFTNEQDWZNY-ULQDDVLXSA-N 0.000 description 1
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- YQMILNREHKTFBS-IHRRRGAJSA-N Val-Phe-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YQMILNREHKTFBS-IHRRRGAJSA-N 0.000 description 1
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000000397 acetylating effect Effects 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 229960003767 alanine Drugs 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000012501 ammonium carbonate Nutrition 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- CREXVNNSNOKDHW-UHFFFAOYSA-N azaniumylideneazanide Chemical group N[N] CREXVNNSNOKDHW-UHFFFAOYSA-N 0.000 description 1
- 210000003578 bacterial chromosome Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000004359 castor oil Substances 0.000 description 1
- 235000019438 castor oil Nutrition 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000003240 coconut oil Substances 0.000 description 1
- 235000019864 coconut oil Nutrition 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000012364 cultivation method Methods 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 229910001873 dinitrogen Inorganic materials 0.000 description 1
- 229910001882 dioxygen Inorganic materials 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000011790 ferrous sulphate Substances 0.000 description 1
- 235000003891 ferrous sulphate Nutrition 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- ZEMPKEQAKRGZGQ-XOQCFJPHSA-N glycerol triricinoleate Natural products CCCCCC[C@@H](O)CC=CCCCCCCCC(=O)OC[C@@H](COC(=O)CCCCCCCC=CC[C@@H](O)CCCCCC)OC(=O)CCCCCCCC=CC[C@H](O)CCCCCC ZEMPKEQAKRGZGQ-XOQCFJPHSA-N 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 208000030603 inherited susceptibility to asthma Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 235000020778 linoleic acid Nutrition 0.000 description 1
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 235000014593 oils and fats Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000151 polyglycol Polymers 0.000 description 1
- 239000010695 polyglycol Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- DHCDFWKWKRSZHF-UHFFFAOYSA-N sulfurothioic S-acid Chemical compound OS(O)(=O)=S DHCDFWKWKRSZHF-UHFFFAOYSA-N 0.000 description 1
- 235000020238 sunflower seed Nutrition 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
Abstract
Изобретение относится к области биотехнологии, конкретно к варианту белка, экспортирующего О-фосфосерин (ОФС), и может быть использовано для получения O-фосфосерина, цистеина и производных цистеина в Escherichia coli. Предложен полипептид, обладающий ОФС-экспортирующей активностью и содержащий SEQ ID NO: 1 или идентичную ей на 90% или более аминокислотную последовательность, которая содержит а) замену изолейцина (I) в положении, соответствующем 241 в SEQ ID NO: 11, на треонин, замену аспарагиновой кислоты в положении, соответствующем 246 в SEQ ID NO: 11, на валин и замену валина в положении, соответствующем 330 в SEQ ID NO: 11, на изолейцин и имеет b) фенилаланин в положении, соответствующем 88, и c) лизин в положении, соответствующем 207. Изобретение обеспечивает повышение выхода ОФС в клетках Escherichia coli - продуцента ОФС. 10 н. и 4 з.п. ф-лы, 7 табл., 2 пр.
Description
ОБЛАСТЬ ТЕХНИКИ
Данная заявка относится к варианту белка, экспортирующего О-фосфосерин (ОФС), и способу получения O-фосфосерина, цистеина и производных цистеина с его использованием.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
L-цистеин, аминокислота, играющая важную роль в метаболизме серы у всех живых организмов, используется не только в синтезе таких биологических белков, как кератин волос, глутатион, биотин, метионин и другие серосодержащие метаболиты, но также является предшественником биосинтеза кофермента А.
Способы получения L-цистеина с использованием микроорганизмов, известные в области техники, включают: 1) способ биологического превращения D,L-2-аминотиазолин-4-карбоновой кислоты (D,L-ATC) в L-цистеин с использованием микроорганизмов, 2) способ получения L-цистеина путем непосредственной ферментации с использованием Е.coli (US 5972663 A; Wada М and Takagi Н, Appl. Microbiol. Biochem., 73:48-54, 2006) и 3) способ получения О-фосфосерина (далее «ОФС») посредством ферментации с использованием микроорганизмов, а затем превращение О-фосфосерина в L-цистеин посредством реакции О-фосфосерина с серой при каталитическом действии O-фосфосеринсульфгидрилазы (далее «ОФСС») (US 8557549 В2).
В частности, для получения цистеина способом 3) с высоким выходом предшественник, ОФС, необходимо получить в избыточном количестве.
Техническая задача
Авторы настоящего изобретения завершили настоящее изобретение, идентифицировав вариант с повышенной активностью фактора экспорта, способного обеспечивать бесперебойный экспорт ОФС, полученного в штамме, продуцирующем ОФС, из клетки и подтвердив, что экспорт ОФС улучшается благодаря указанному варианту.
Техническое решение
Одной из задач настоящего изобретения является предоставление полипептида, обладающего О-фосфосерин (ОФС)-экспортирующей активностью.
Другой задачей настоящего изобретения является предоставление полинуклеотида, кодирующего указанный полипептид по настоящему изобретению.
Еще одной задачей настоящего изобретения является предоставление вектора, содержащего указанный полинуклеотид по настоящему изобретению.
Следующей задачей настоящего изобретения является предоставление О-фосфосерин-продуцирующего микроорганизма, содержащего любое одно или более из полипептида по настоящему изобретению, полинуклеотида по настоящему изобретению и вектора по настоящему изобретению.
Еще одной задачей настоящего изобретения является предоставление способа получения О-фосфосерина, включающего культивирование в среде указанного О-фосфосерин-продуцирующего микроорганизма по настоящему изобретению.
Еще одной задачей настоящего изобретения является предоставление способа получения цистеина или его производного, который включает:
a) получение О-фосфосерина (ОФС) или содержащей его среды посредством культивирования в среде О-фосфосерин-продуцирующего микроорганизма, который содержит любое одно или более из полипептида по настоящему изобретению, полинуклеотида, кодирующий полипептид по настоящему изобретению, и вектора, содержащего полинуклеотид по настоящему изобретению; и
b) реакцию О-фосфосерина или содержащей его среды, полученных на стадии а), с сульфидом в присутствии О-фосфосеринсульфгидрилазы (ОФСС) или экспрессирующего ее микроорганизма.
Полезные эффекты
Когда микроорганизм, обладающий способностью продуцировать О-фосфосерин, культивируют с использованием полипептида, обладающего О-фосфосерин-экспортирующей активностью, по настоящему изобретению, это может обеспечить получение ОФС с высоким выходом по сравнению с использованием существующего немодифицированного белка или варианта.
Предпочтительные воплощения изобретения
Далее настоящее изобретение будет описано более подробно. При этом, каждое описание и воплощение, раскрытое в настоящем изобретении, также может быть применено к другим описаниям и воплощениям, соответственно. Таким образом, все комбинации различных элементов, описанных в настоящем изобретении, входят в объем настоящего изобретения. Более того, объем настоящего изобретения не ограничивается конкретным описанием, приведенным ниже.
В одном аспекте настоящего изобретения для решения указанных выше задач в настоящем изобретении предложен полипептид, обладающий О-фосфосерин (ОФС)-экспортирующей активностью, включающий а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющему аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K).
В настоящем документе термин «О-фосфосерин» (далее «ОФС») относится к сложному эфиру фосфорной кислоты и серина, являющегося составным компонентом многих белков. В частности, ОФС является предшественником L-цистеина и может быть конвертирован в цистеин посредством реакции с сульфидом при каталитическом действии ОФС сульфгидрилазы (далее «ОФСС»), но не ограничиваясь указанным (US 8557549 В2).
В настоящем документе термин «полипептид, обладающий ОФС-экспортирующей активностью», относится к мембранному белку, обладающему активностью экспорта ОФС за пределы клетки, и указанный мембранный белок может происходить из Е. coli. В настоящем изобретении полипептид, обладающий ОФС-экспортирующей активностью, может быть транспортером YhhS суперсемейства MFS (major facilitator superfamily) или его вариантом. В частности, полипептид по настоящему изобретению может представлять собой вариант транспортера YhhS MFS, демонстрирующий улучшенную активность по сравнению с таковой у транспортера YhhS MFS дикого типа, идентифицированного в качестве белка, обладающего ОФС-экспортирующей активностью у Е. coli, свободных от подавления роста при условии существования избытка ОФС.
В настоящем документе термин «вариант» относится к белку, в котором по меньшей мере одна аминокислотная последовательность отличается от указанной последовательности вследствие консервативной замены и/или модификации, при этом функции и свойства этого белка сохраняются. Варианты отличаются от установленной последовательности заменой, делецией или добавлением нескольких аминокислот. Такие варианты как правило можно идентифицировать посредством модификации одной из вышеупомянутых аминокислотных последовательностей белка и оценки свойств модифицированного белка. Таким образом, активность вариантов может быть усилена, оставлена без изменений или ослаблена по сравнению с нативным белком. Кроме того, некоторые варианты могут включать варианты, у которых были удалены одна или более чем одна часть, такая как N-концевая лидерная последовательность или транс мембранный домен. Другие варианты могут включать варианты, у которых была удалена часть с N- и/или С-конца зрелого белка. Термин «вариант» может использоваться взаимозаменяемо с такими терминами, как модифицированный, модификация, модифицированный белок, модифицированный полипептид, мутант, мутеин, дивергент, вариант и т.д., без ограничения, при условии, что эти термины используются для обозначения вариации. В настоящем документе вариант может относиться к вариантам, обладающим повышенной активностью модифицированного белка по сравнению с таковой у белка дикого типа или немодифицированного белка, однако не ограничивается ими.
В настоящем документе термин «консервативная замена» относится к замене одной аминокислоты на другую аминокислоту, имеющую схожую структуру и/или химические свойства. Например, вариант может иметь одну или более чем одну консервативную замену, при этом сохраняя одну или более чем одну биологическую активность. Такие аминокислотные замены, как правило, могут возникать на основании сходства в полярности, заряде, растворимости, гидрофобности, гидрофильности и/или амфипатической природы остатка. Например, среди электрически заряженных аминокислот положительно заряженные (основные) аминокислоты включают аргинин, лизин и гистидин, а отрицательно заряженные (кислые) аминокислоты включают глутаминовую кислоту и аспарагиновую кислоту; среди незаряженных аминокислот неполярные аминокислоты включают глицин, аланин, валин, лейцин, изолейцин, метионин, фенилаланин, триптофан и пролин; полярные или гидрофильные аминокислоты включают серин, треонин, цистеин, тирозин, аспарагин и глутамин, и ароматические аминокислоты включают фенилаланин, триптофан и тирозин.
Кроме того, варианты могут также включать делецию или добавление аминокислот, которые оказывают минимальное влияние на свойства и вторичную структуру полипептида. Например, полипептид может быть конъюгирован с сигнальной (или лидерной) последовательностью на N-конце белка, задействованного в транспортировке белков одновременно с трансляцией или после ее завершения. Кроме того, полипептид может также быть конъюгирован с другой последовательностью или линкером для обнаружения, очистки или синтеза полипептида.
В частности, полипептид, обладающий ОФС-экспортирующей активностью по настоящему изобретению, может представлять собой полипептид, обладающий ОФС-экспортирующей активностью, содержащий а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющему аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), либо полипептид, обладающий ОФС-экспортирующей активностью, содержащий а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющему аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K).
Полипептид, обладающий ОФС-экспортирующей активностью по настоящему изобретению, может представлять собой полипептид, обладающий ОФС-экспортирующей активностью, содержащий а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющему аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), либо полипептид, обладающий ОФС-экспортирующей активностью, содержащий а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и состоящему или по существу состоящему из аминокислотной последовательности, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K).
Кроме того, полипептид, обладающий ОФС-экспортирующей активностью по настоящему изобретению может включать, без ограничения, любой полипептид, имеющий аминокислотную последовательность, демонстрирующую идентичность по меньшей мере 70%, 80%, 90%, 95% или 99% или выше и менее чем 100% с аминокислотной последовательностью SEQ ID NO: 11 либо SEQ ID NO: 1 и демонстрирующий ОФС-экспортирующую способность, по существу идентичную или соответствующую таковой полипептида, при этом представляет собой полипептид, содержащий а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющему аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K). Кроме того, очевидно, что любой вариант полипептида, имеющий аминокислотную последовательность, у которой осуществлена делеция, модификация, замена или добавление части аминокислотной последовательности в аминокислотных положениях, соответствующих 88, 207, 241, 246 и 330 аминокислотной последовательности SEQ ID NO: 11, может также входить в объем настоящего изобретения, при условии, что он является полипептидом, имеющим аминокислотную последовательность, по существу обладающую ОФС-экспортирующей активностью, будучи последовательностью, обладающей такой идентичностью.
В частности, полипептид, обладающий ОФС-экспортирующей активностью по настоящему изобретению, может представлять собой полипептид, имеющий аминокислотную последовательность SEQ ID NO: 1.
В настоящем изобретении полипептид, обладающий О-фосфосерин-экспортирующей активностью, имеющий аминокислотную последовательность SEQ ID NO: 1, может представлять собой полипептид, обладающий О-фосфосерин-экспортирующей активностью, содержащий аминокислотную последовательность SEQ ID NO: 1, полипептид, обладающий О-фосфосерин-экспортирующей активностью, представленный аминокислотной последовательностью SEQ ID NO: 1, полипептид, обладающий О фосфосерин-экспортирующей активностью, по существу состоящий из аминокислотной последовательности SEQ ID NO: 1, или полипептид, обладающий О-фосфосерин-экспортирующей активностью, состоящий из аминокислотной последовательности SEQ ID NO: 1. Кроме того, полипептид, обладающий О-фосфосерин-экспортирующей активностью по настоящему изобретению не исключает незначащего добавления последовательности в направлении против или по ходу транскрипции от аминокислотной последовательности SEQ ID NO: 1.
В настоящем документе SEQ ID NO: 1 может означать аминокислотную последовательность, обладающую ОФС-экспортирующей активностью. В частности, SEQ ID NO: 1 может представлять собой аминокислотную последовательность, составляющую вариант переносчика YhhS MFS, белка, проявляющего ОФС-экспортирующую активность, кодируемого геном yhhS.
Аминокислотная последовательность переносчика YhhS MFS, белка, проявляющего ОФС-экспортирующую активность, кодируемого геном yhhS, может быть получена из известной базы данных GenBank of NCBI. Аминокислотная последовательность переносчика YhhS MFS может, например, представлять собой SEQ ID NO: 11. Кроме того, аминокислотная последовательность переносчика YhhS MFS может представлять собой аминокислотную последовательность, происходящую из Escherichia coli (Е. coli), но не ограничиваться ей.
В другом аспекте настоящего изобретения в настоящем изобретении предложен полинуклеотид, кодирующий полипептид, обладающий О-фосфосерин-экспортирующей активностью, содержащий а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющий аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), или полипептид, обладающий О-фосфосерин-экспортирующей активностью, имеющий аминокислотную последовательность SEQ ID NO: 1.
SEQ ID NO: 11, SEQ ID NO: 1, О фосфосерин и полипептид, обладающий О-фосфосерин-экспортирующей активностью, являются такими, как описано выше.
В настоящем документе «полинуклеотид», представляющий собой полимер нуклеотидов, состоящий из мономеров нуклеотидов, соединенных в длинную цепочку ковалентными связями, является цепью ДНК или РНК определенной длины.
Полинуклеотид может включать в себя любой полинуклеотид, кодирующий полипептид, обладающий ОФС-экспортирующей активностью по настоящему изобретению, без ограничения. В настоящем изобретении ген, кодирующий аминокислотную последовательность ОФС-экспортирующего белка, может представлять собой ген yhhS. Кроме того, ген может происходить из Escherichia coli (Е. coli), но не ограничиваться указанным.
В частности, полинуклеотид, кодирующий полипептид, обладающий ОФС-экспортирующей активностью по настоящему изобретению, может иметь или содержать нуклеотидную последовательность, кодирующую аминокислотную последовательность, представленную SEQ ID NO: 1. Кроме того, полинуклеотид, кодирующий полипептид, обладающий ОФС-экспортирующей активностью по настоящему изобретению, может состоять или по существу состоять из нуклеотидной последовательности, кодирующей аминокислотную последовательность, представленную SEQ ID NO: 1. Вследствие вырожденности кодонов или с учетом предпочтения кодонов у организма, в котором экспрессируется полипептид, могут происходить различные модификации в кодирующей области полинуклеотида по настоящему изобретению, в том объеме, который не меняет аминокислотную последовательность полипептида. Полипептид по настоящему изобретению может содержать или иметь, например, нуклеотидную последовательность, обладающую гомологией или идентичностью по меньшей мере 80%, 90%, 95%, 95% или 99% или выше с нуклеотидной последовательностью SEQ ID NO: 2, но не ограничивается указанным. В одном воплощении полинуклеотид по настоящему изобретению может состоять или по существу состоять из нуклеотидной последовательности, обладающей гомологией или идентичностью по меньшей мере 80%, 90%, 95%, 95% или 99% или выше с нуклеотидной последовательностью SEQ ID NO: 2, но не ограничивается указанным.
Кроме того, полинуклеотид по настоящему изобретению может включать в себя зонд, который может быть получен из известной генной последовательности, например, последовательности, которая гибридизуется в жестких условиях с последовательностью, комплементарной всей или части нуклеотидной последовательности, кодирующей аминокислотную последовательность SEQ ID NO: 1, без ограничения. «Жесткие условия» относятся к условиям, при которых обеспечивается специфическая гибридизация между полинуклеотидами. Такие условия отдельно описаны в литературе (см. J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York). Например, жесткие условия могут включать условия, при которых гены, обладающие высокой гомологией или идентичностью 40% или более, в частности, 90% или более, более конкретно, 95% или более, еще более конкретно, 97% или более, особенно 99% или более, гибридизуются друг с другом, а гены, обладающие гомологией или идентичностью меньше указанных, не гибридизуются друг с другом, или стандартные условия отмывки при гибридизации по Саузерну, т.е., в частности, однократную, двукратную или трехкратную отмывку при концентрации соли и температуре, соответствующих 60°С, 1X SSC, 0,1% SDS, в частности, 60°С, 0,1Х SSC, 0,1% SDS, и более конкретно, 68°С, 0,1Х SSC, 0,1% SDS.
Для гибридизации необходимо, чтобы две нуклеиновых кислоты содержали комплементарные последовательности, хотя, в зависимости от строгости гибридизации, возможны несовпадения между основаниями. Термин «комплементарный» используется для описания взаимодействия между нуклеотидными основаниями, которые могут гибридизоваться друг с другом. Например, в случае ДНК аденозин комплементарен тимину, а цитозин комплементарен гуанину. Таким образом, полинуклеотид по настоящему изобретению может включать выделенные фрагменты нуклеотидов, комплементарные полной последовательности, а также по существу схожие с ними последовательности нуклеиновых кислот.
В настоящем документе термин «гомология» или «идентичность» относится к степени соответствия двух заданных аминокислотных последовательностей или нуклеотидных последовательностей и может выражаться в процентах. Термины «гомология» и «идентичность» зачастую могут использоваться взаимозаменяемо друг с другом.
Гомология или идентичность последовательностей консервативных полипептидов или полинуклеотидов может быть установлена при помощи стандартных алгоритмов выравнивания, можно применять значения штрафов за открытие гэпа, установленные в используемой программе по умолчанию. Обычно предполагается, что гомологичные или идентичные последовательности гибридизуются друг с другом в условиях умеренной или высокой жесткости по всей длине их последовательности или по меньшей мере на протяжение приблизительно 50%, 50%, 60%, 70%, 80% или 90% от всей длины. Кроме того, подразумеваются и полинуклеотиды, которые в гибридизующихся полинуклеотидах вместо кодонов содержат вырожденные кодоны.
Установить, обладают ли две любые полинуклеотидные последовательности гомологией, сходством или идентичностью, можно, например, при помощи известного компьютерного алгоритма, такого как программа FASTA с использованием параметров по умолчанию (Pearson et al., (1988) Proc. Natl. Acad. Sci. USA 85:2444). В альтернативном варианте, это можно установить при помощи алгоритма Нидлмана-Вунша (Needleman and Wunsch, 1970, J. Mol. Biol. 48:443-453), используемого в программе Needleman пакета EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16:276-277) (версии 5.0.0 или более поздней) (пакет программ GCG (Devereux, J., et al., Nucleic Acids Research 12:387 (1984)), BLASTP, BLASTN, FASTA (Atschul, S.F., et al., J MOLEC BIOL 215:403 (1990); Guide to Huge Computers, Martin J. Bishop, ed., Academic Press, San Diego, 1994, and CARILLO et al. (1988) SIAM J Applied Math 48:1073). Например, гомологию, сходство или идентичность можно установить при помощи BLAST или ClustalW Национального Центра Биотехнологической Информации (NCBI).
Гомологию, сходство или идентичность полипептидов или полинуклеотидов можно устанавливать путем сравнения информации о последовательности с использованием компьютерной программы GAP, такой как Needleman et al. (1970), J Mol Biol. 48:443, как описано Smith and Waterman, Adv. Appl. Math (1981) 2:482. Вкратце, программа GAP устанавливает гомологию, сходство или идентичность как значение, полученное путем деления количества одинаковых выровненных символов (т.е. нуклеотидов или аминокислот) на общее количество символов в более короткой из двух последовательностей. Параметры по умолчанию для программы GAP могут включать (1) унарную матрицу сравнения (содержащую значение 1 для идентичных и 0 для неидентичных символов) и взвешенную матрицу сравнения, предложенную Gribskov et al. (1986), Nucl. Acids Res. 14:6745, как описано в Атласе белковых последовательностей и структур под ред. Schwartz and Dayhoff, Atlas of Protein Sequence and Structure, National Biomedical Research Foundation, pp. 353-358 (1979) (или подстановочную матрицу EDNAFULL (EMBOSS версия NCBI NUC4.4)); (2) штраф 3,0 за каждый пропуск и дополнительный штраф 0,10 за каждый символ в каждом пропуске (или штраф за открытие пропуска 10 и штраф за продолжение пропуска 0,5); и (3) отсутствие штрафа за концевые пропуски.
Кроме того, установить, обладают ли две любых полинуклеотидных или полипептидных последовательности гомологией, сходством или идентичностью друг с другом, можно путем сравнения последовательностей в эксперименте с гибридизацией по Саузерну в определенных строгих условиях, а определение надлежащих условий гибридизации известно из уровня техники и может быть установлено способами, хорошо известными специалистам в данной области техники (например, J. Sambrook et al.).
В частности, полинуклеотиды, обладающие гомологией или идентичностью, можно обнаружить с использованием условий гибридизации, включающих стадию гибридизации при значении Tm 55°С в описанных выше условиях. Кроме того, значение Tm может быть 60°С, 63°С или 65°С, не ограничиваясь указанными значениями и может быть соответствующим образом скорректировано специалистом в области техники в зависимости от задачи.
Надлежащая строгость для гибридизации полинуклеотидов зависит от длины полинуклеотидов и степени комплементарности, и эти переменные хорошо известны в области техники (см. Sambrook et al., выше, 9.50-9.51, 11.7-11.8).
В еще одном аспекте настоящего изобретения в настоящем изобретении предложен вектор, содержащий полинуклеотид, кодирующий полипептид, обладающий О-фосфосерин-экспортирующей активностью, включающий а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11 на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11 на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11 на изолейцин (I), и имеющий аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), либо полинуклеотид, кодирующий полипептид, обладающий О фосфосерин-экспортирующей активностью, имеющий аминокислотную последовательность SEQ ID NO: 1.
SEQ ID NO: 11, SEQ ID NO: 1, О-фосфосерин, полипептид, обладающий O-фосфосерин-экспортирующей активностью, и полинуклеотид являются такими, как описано выше.
В настоящем документе термин «вектор» относится к ДНК-конструкции, содержащей нуклеотидную последовательность полинуклеотида, кодирующего целевой полипептид или белок, функционально связанную с подходящей регуляторной последовательностью, обеспечивающей экспрессию целевого полипептида или белка в подходящей клетке-хозяине. Регуляторная последовательность может включать промотор, способный инициировать транскрипцию, любую последовательность оператора для регуляции транскрипции, последовательность, кодирующую подходящий сайт связывания рибосомы на мРНК, и последовательность для регуляции терминации транскрипции и трансляции. После трансформации в подходящую клетку-хозяин вектор может реплицироваться или функционировать независимо от генома хозяина или может интегрироваться в его геном.
Вектор, используемый в настоящем изобретении, не ограничивается конкретными векторами, при условии, что он способен реплицироваться в клетке-хозяине, и можно использовать любой вектор, известный в области техники. Примеры типично используемых векторов могут включать природные или рекомбинантные плазмиды, космиды, вирусы и бактериофаги. Например, в качестве фагового вектора или космидного вектора можно использовать pWE15, М13, MBL3, MBL4, IХII, ASHII, APII, t10, t11, Charon4A и Charon21A, а в качестве плазмидного вектора использовать вектор на основе pBR, pUC, pBluescriptII, pGEM, pTZ, pCL, pSK, pSKH и pET. В частности, можно использовать векторы pCL, pSK, pSKH130, pDZ, pACYC177, pACYC184, pECCG117, pUC19, pBR322, pMW118 и pCC1BAC.
Встраивание полинуклеотида в хромосому можно осуществлять любым известным в области техники способом, например, посредством гомологичной рекомбинации, но способ этим не ограничивается.
Вектор может дополнительно включать в себя селективный маркер для подтверждения встраивания в хромосому. Селективный маркер используют для отбора клеток, трансформированных вектором, т.е. для подтверждения того, встроилась ли целевая молекула нуклеиновой кислоты, и могут использоваться маркеры, обеспечивающие фенотип, позволяющий осуществлять отбор, такой как устойчивость к лекарственным средствам, ауксотрофия, устойчивость к цитотоксическим агентам или экспрессия модифицированных поверхностных белков. В среде, обработанной селективным агентом, могут выживать или демонстрировать различные фенотипы только клетки, экспрессирующие селективный маркер, таким образом можно осуществлять отбор трансформированных клеток.
В настоящем документе термин «трансформация» относится к внедрению вектора, который включает в себя полинуклеотид, кодирующий целевой полипептид или белок, в клетку-хозяина, так чтобы белок, кодируемый полинуклеотидом, был способен экспрессироваться в клетке-хозяине. Для трансформированного полинуклеотида не имеет значения, встроен ли он в хромосому клетки-хозяина и находится в ней или находится за пределами хромосомы, и могут быть включены оба варианта, лишь бы только трансформированный полинуклеотид мог экспрессироваться в клетке-хозяине. Кроме того, полинуклеотид может включать ДНК и РНК, которые кодируют целевой полипептид или белок.
Полинуклеотид может быть внедрен в любой форме, при условии, что он может быть внедрен в клетку-хозяина и экспрессироваться в ней. Например, полинуклеотид может быть внедрен в клетку-хозяина в форме экспрессионной кассеты, которая представляет собой генную конструкцию, включающую в себя все элементы, необходимые для ее автономной экспрессии. Экспрессионная кассета как правило может включать в себя промотор, функционально связанный с полинуклеотидом, сигнал терминации транскрипции, сайт связывания рибосомы и сигнал терминации трансляции. Экспрессионная кассета может быть в форме самореплицирующегося экспрессирующего вектора. Кроме того, полинуклеотид может быть внедрен в клетку-хозяина как таковой и функционально связан с последовательностями, необходимыми для его экспрессии в клетке-хозяине, без конкретного ограничения.
Кроме того, в настоящем документе термин «функционально связанный» означает, что последовательность гена функционально связана с последовательностью промотора, который инициирует и опосредует транскрипцию полинуклеотида, кодирующего целевой полипептид или белок по настоящему изобретению.
В другом аспекте настоящего изобретения в настоящем изобретении предложен О фосфосерин-продуцирующий микроорганизм, включающий любое одно или более из полипептида, обладающего О-фосфосерин (ОФС)-экспортирующей активностью, содержащего а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющего аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), либо полипептида, обладающего О-фосфосерин-экспортирующей активностью, имеющего аминокислотную последовательность SEQ ID NO: 1, полинуклеотида, кодирующего полипептид по настоящему изобретению, и вектора, содержащего полинуклеотид, кодирующий полипептид по настоящему изобретению.
SEQ ID NO: 11, SEQ ID NO: 1, О-фосфосерин, полипептид, обладающий О-фосфосерин-экспортирующей активностью, полинуклеотид и вектор являются такими, как описано выше.
В настоящем документе термин «ОФС-продуцирующий микроорганизм» относится к микроорганизму, обладающему от природы слабой способностью продуцировать ОФС, или к микроорганизму, которому придали ОФС-продуцирующую способность в результате природных или искусственных генетических модификаций родительского штамма, не обладающего ОФС-продуцирующей способностью. В частности, микроорганизм может представлять собой микроорганизм, экспрессирующий полипептид, имеющий аминокислотную последовательность SEQ ID NO: 1, но не ограничивается им. В настоящем изобретении «ОФС-продуцирующий микроорганизм» может использоваться взаимозаменяемо с «микроорганизмом, обладающим ОФС-продуцирующей способностью», «ОФС-продуцирующим штаммом» и «линией ОФС-продуцирующего штамма».
Для задач настоящего изобретения в случае ОФС-продуцирующего микроорганизма, микроорганизм может включать любое одно или более из полипептида, обладающего ОФС-экспортирующей активностью по настоящему изобретению, полинуклеотида, кодирующего полипептид по настоящему изобретению, и вектора, содержащего полинуклеотид по настоящему изобретению, за счет чего усиливается активность экспрессируемого с него полипептида, и, таким образом, количество продуцируемого ОФС может повышаться по сравнению с таковым у микроорганизма дикого типа до модификации. Важно, что продуцирование ОФС может быть повышено в результате внедрения полипептида, обладающего ОФС-экспортирующей активностью по настоящему изобретению, и усиления его активности, тогда как микроорганизмы дикого типа не способны продуцировать ОФС или могут продуцировать только следовые количества даже если они способны продуцировать ОФС. Таким образом, ОФС-продуцирующий микроорганизм по настоящему изобретению может быть таким, у которого активность полипептида, обладающего ОФС-экспортирующей активностью по настоящему изобретению, усилена по сравнению с его эндогенной активностью, но не ограничивается им.
В настоящем документе термин «усиление по сравнению с его эндогенной активностью» относится к повышенной активности белка по сравнению с активностью белка, имеющегося у микроорганизма в естественном состоянии.
В настоящем документе термин «экспрессируемый/экспрессирующийся» относится к состоянию, в котором целевой полипептид или белок вводят в микроорганизм или в котором целевой полипептид или белок модифицируют для его экспрессии в микроорганизме. Когда целевой полипептид или белок представляет собой полипептид или белок, присутствующий в микроорганизме, это может означать состояние, в котором его активность усилена по сравнению с эндогенной активностью или активностью до модификации.
В настоящем документе термин «усиление активности» полипептида или белка означает, что активность полипептида или белка усиливается по сравнению с его эндогенной активностью. В настоящем документе термин «эндогенная активность» относится к активности конкретного полипептида или белка, которой исходно обладал родительский штамм до трансформации или немодифицированный микроорганизм, в случае, когда свойство микроорганизма изменено вследствие генетической модификации, вызванной фактором природного или искусственного происхождения, и может использоваться взаимозаменяемо с «активностью до модификации». «Усиление» или «повышение» активности полипептида или белка по сравнению с его эндогенной активностью означает, что активность усиливается по сравнению с активностью конкретного полипептида или белка, которой исходно обладал родительский штамм до трансформации или немодифицированный микроорганизм.
«Повышение активности» может достигаться посредством внедрения чужеродного полипептида или белка или посредством усиления активности эндогенного полипептида или белка, но, в частности, может достигаться посредством усиления активности эндогенного полипептида или белка. Подтвердить, усилилась или нет активность полипептида или белка можно по повышению уровня активности, уровня экспрессии целевого полипептида или белка или по количеству продукта, экспортируемого целевым белком.
В настоящем изобретении полипептид или белок, предназначенный для усиления активности, то есть целевой полипептид или белок, может быть вариантом переносчика YhhS MFS, и в частности, может быть вариантом переносчика YhhS MFS, обладающего ОФС-экспортирующей активностью, которая усилена по сравнению с таковой у переносчика YhhS MFS дикого типа, но не ограничивается им.
Кроме того, в настоящем изобретении продукт, экспортируемый целевым полипептидом или белком, может представлять собой О-фосфосерин, но не ограничивается им.
Усиление активности полипептида или белка может достигаться различными способами, хорошо известными в области техники, и может не ограничиваться конкретными способами, при условии, что активность целевого полипептида или белка может усиливаться по сравнению с таковой у микроорганизма до модификации. Способ может включать генную инженерию или белковую инженерию, но не ограничивается ими.
Способ усиления активности полипептида или белка с использованием генной инженерии может достигаться, например, посредством:
1) способа увеличения числа внутриклеточных копий гена или полинуклеотида, кодирующих полипептид или белок;
2) способа замены регулирующей экспрессию последовательности гена, кодирующего полипептид или белок, на хромосоме последовательностью, обладающей сильной активностью;
3) способа модификации нуклеотидной последовательности инициирующего кодона или 5'-нетранслируемой области (5'-UTR) полипептида или белка;
4) способа модификации полинуклеотидной последовательности на хромосоме с усилением активности полипептида или белка;
5) способа внедрения чужеродного полинуклеотида, обладающего активностью полипептида или белка или модифицированного полинуклеотида с оптимизированным составом кодонов полинуклеотида; или
6) их комбинации, не ограничиваясь перечисленным.
Способ усиления активности полипептида или белка с использованием белковой инженерии может достигаться, например, посредством анализа третичной структуры полипептида или белка, а также выбора и модификации экспонированного сайта или его химической модификации, не ограничиваясь перечисленным.
1) способ увеличения числа копий гена, кодирующего полипептид или белок может осуществляться методом, известным в области техники, например, внедрением в клетку-хозяина вектора, функционально связанного с геном или полинуклеотидом, кодирующим полипептид или белок и способного реплицироваться и функционировать независимо от клетки-хозяина. В альтернативном варианте указанный способ может осуществляться путем внедрения в клетку-хозяина вектора, способного встраивать ген или полинуклеотид в хромосому клетки-хозяина, с которой ген функционально связан, однако способ не ограничивается перечисленными. Указанный вектор является таким, как описано выше.
2) способ замены регулирующей экспрессию последовательности гена, кодирующего полипептид или белок на хромосоме последовательностью, имеющей сильную активность, можно осуществлять известным в области техники методом, например, путем осуществления модификации последовательности посредством делеции, вставки, неконсервативной или консервативной замены последовательности нуклеиновой кислоты или их комбинации для дополнительного усиления активности регулирующей экспрессию последовательности, или путем замены полинуклеотидной последовательности последовательностью нуклеиновых кислот с более высокой активностью. Регулирующая экспрессию последовательность, может включать промотор, последовательность оператора, последовательность, кодирующую сайт связывания рибосомы и последовательность, регулирующую терминацию транскрипции и трансляции, не ограничиваясь перечисленным. В частности, указанный способ может включать присоединение сильного гетерологичного промотора вместо исходного промотора, но не ограничивается этим.
Примеры сильного промотора могут включать промотор CJ7 (US 7662943 В2), промотор CJ1 (US 7662943 В2), промотор lac, промотор trp, промотор trc, промотор tac, промотор PR фага лямбда, промотор PL и промотор tet, но не ограничиваются указанными.
3) способ модификации нуклеотидной последовательности инициирующего кодона или 5'-UTR полипептида или белка можно осуществлять известным в области техники методом, например, путем замены эндогенного инициирующего кодона полипептида или белка другим инициирующим кодоном, имеющим более высокую степень экспрессии полипептида или белка по сравнению с эндогенным инициирующим кодоном, не ограничиваясь указанным.
4) способ модификации полинуклеотидной последовательности на хромосоме, обеспечивающий усиление активности полипептида или белка, можно осуществлять известным в области техники методом, например, путем включения модификации в регулирующую экспрессию последовательность посредством делеции, вставки, неконсервативной или консервативной замены нуклеотидной последовательности или их комбинации для дополнительного усиления активности полинуклеотидной последовательности или путем замены полинуклеотидной последовательности модифицированной полинуклеотидной последовательностью с более высокой активностью. В частности, замена может достигаться путем встраивания гена в хромосому посредством гомологичной рекомбинации, но не ограничивается этим.
Используемый при этом вектор может дополнительно включать в себя селективный маркер для подтверждения встраивания в хромосому. Селективный маркер является таким, как описано выше.
5) способ внедрения чужеродного полинуклеотида, обладающего активностью полипептида или белка, может осуществляться известным в области техники методом, например, посредством внедрения в клетку-хозяина чужеродного полинуклеотида, кодирующего полипептид или белок, демонстрирующий такую же или схожую активность с полипептидом или белком или его модифицированным полинуклеотидом с оптимизированным кодонным составом. Чужеродный полинуклеотид может применяться без ограничения, независимо от его происхождения или последовательности, при условии, что он демонстрирует такую же или схожую активность с полипептидом или белком. Кроме того, для оптимизированной транскрипции и трансляции чужеродного полинуклеотида в клетке-хозяине его кодоны могут быть оптимизированы и внедрены в клетку-хозяина. Внедрение может быть осуществлено специалистом в области техники посредством выбора подходящего способа трансформации, известного в области техники, а экспрессия внедренного полинуклеотида в клетке-хозяине обеспечивает продуцирование полипептида или белка, тем самым увеличивая его активность.
Наконец, 6) комбинация способов, указанных выше, может осуществляться путем применения любых одного или более способов с 1) по 5) в комбинации.
Такое усиление активности полипептида или активности белка может представлять собой увеличение активности или концентрации целевого полипептида или белка по сравнению с активностью или концентрацией полипептида или белка, экспрессируемых в штамме дикого типа или штамме микроорганизма до модификации, или может представлять собой увеличение количества продукта, получаемого из целевого полипептида или белка, но не ограничивается указанным. В настоящем документе термин «штамм до модификации» или «микроорганизм до модификации» не исключает штаммов, содержащих мутации, которые могут возникать естественным путем в микроорганизмах, и может относиться к самому природному штамму или к штамму до модификации, у которого свойство изменено вследствие генетической мутации, вызванной природными или искусственными факторами. «Штамм до модификации» или «микроорганизм до модификации» может использоваться взаимозаменяемо с «немутированным штаммом», «немодифицированный штаммом», «немутированным микроорганизмом» или «платформенным микроорганизмом».
В настоящем изобретении платформенный микроорганизм может представлять собой СА07-0012 - известный микроорганизм, продуцирующий ОФС, СА07-0022/pCL_Prmf-serA*(G336V)-serC(KCCM11103P (US 8557549 В2) - штамм, у которого активности эндогенных SerA (D-3-фосфоглицератдегидрогеназы) и SerC (3-фосфосеринаминотрансферазы) усилены, и СА07-0012 (KCCM11121P, US 8557549 В2), или штамм, у которого активность эндогенной фосфосеринфосфатазы (SerB) ослаблена, но не ограничивается указанными.
Микроорганизм по настоящему изобретению может представлять собой рекомбинантный микроорганизм, полученный путем трансформации вектором, содержащим полинуклеотид, кодирующий полипептид, но не ограничивается указанным.
Микроорганизм по настоящему изобретению не ограничивается его типом при условии, что он способен продуцировать ОФС, и может быть любым прокариотическим или эукариотическим микроорганизмом, в частности, прокариотическим микроорганизмом. Прокариотический микроорганизм может включать штаммы микроорганизмов, относящиеся к роду Escherichia, роду Erwinia, роду Serratia, роду Providencia, роду Corynebacterium и роду Brevibacterium, в частности, микроорганизм, относящийся к роду Escherichia, и более конкретно, Escherichia coli, но не ограничиваться указанным. В частности, в случае микроорганизма, относящегося к роду Escherichia, ОФС и L-серин могут продуцироваться при помощи SerA, SerC и SerB, которые являются ферментами пути биосинтеза L-серина (Ahmed Zahoor, Computational and structural biotechnology journal, Vol. 3, 2012 October; Wendisch V. F. et al., Curr Opin Microbiol. 2006 Jun; 9(3):268-74; Peters-Wendisch P. et al., Appl Environ Microbiol. 2005 Nov; 71(11):7139-44.).
ОФС-продуцирующий микроорганизм по настоящему изобретению может являться таким, у которого активность фосфосеринфосфатазы (SerB) может быть дополнительно ослаблена по сравнению с его эндогенной активностью.
SerB по настоящему изобретению обладает активностью превращения ОФС в L-серин, и таким образом, модифицированный микроорганизм с ослабленной активностью SerB обладает свойством накопления в нем ОФС, и поэтому полезен для получения ОФС.SerB по настоящему изобретению может представлять собой белок, имеющий или включающий в себя аминокислотную последовательность, представленную SEQ ID NO: 3, или может представлять собой белок, состоящий или по существу состоящий из аминокислотной последовательности, представленной SEQ ID NO: 3, но не ограничивается таковым. Кроме того, SerB может иметь или включать в себя аминокислотную последовательность, обладающую гомологией или идентичностью 80%, 90%, 95% или 99% или выше с аминокислотной последовательностью, представленной SEQ ID NO: 3, при условии, что она демонстрирует активность SerB. Кроме того, SerB по настоящему изобретению может состоять или по существу состоять из аминокислотной последовательности, обладающей гомологией или идентичностью 80%, 90%, 95% или 99% или выше с аминокислотной последовательностью, представленной SEQ ID NO: 3, но не ограничивается таковым. Кроме того, полинуклеотид, кодирующий SerB, может иметь или включать в себя нуклеотидную последовательность, кодирующую аминокислотную последовательность, представленную SEQ ID NO: 3. Кроме того, полинуклеотид, кодирующий SerB, может состоять или по существу состоять из нуклеотидной последовательности, кодирующей аминокислотную последовательность, представленную SEQ ID NO: 3. Вследствие вырожденности кодонов или с учетом предпочтения кодонов у организма, в котором будет экспрессироваться полипептид, полинуклеотид, кодирующий SerB по настоящему изобретению, может претерпевать различные модификации в кодирующей области, в том объеме, который не изменяет аминокислотную последовательность белка SerB. Полинуклеотид, кодирующий SerB по настоящему изобретению, может иметь или включать в себя нуклеотидную последовательность, обладающую гомологией или идентичностью по меньшей мере 80%, 90%, 95%, 95% или 99% или выше и менее 100% с нуклеотидной последовательностью SEQ ID NO: 4. Кроме того, полинуклеотид, кодирующий SerB по настоящему изобретению, может состоять или по существу состоять из нуклеотидной последовательности, обладающей гомологией или идентичностью 80%, 90%, 95%, 95% или 99% или выше и менее 100% с нуклеотидной последовательностью SEQ ID NO: 4, но не ограничивается таковым.
В настоящем документе термин «ослабление активности по сравнению с его эндогенной активностью» означает, что природный штамм дикого типа, родительский штамм или целевой белок не экспрессируют фермент или белок или не обладают активностью или обладают пониженной активностью даже при экспрессии по сравнению с немодифицированный штаммом. В частности, понижение является широким понятием, включающим случай, когда активность белка понижается по сравнению с активностью белка, которой исходно обладал микроорганизм вследствие мутации гена, кодирующего белок, модификации регулирующей экспрессию последовательности, или делеции части или всех генов и так далее; случай, когда суммарный уровень активности внутриклеточных белков понижен по сравнению с таковым у природного штамма или штамма до модификации вследствие ингибирования экспрессии гена, кодирующего белок или ингибирования трансляции; и их комбинации.
Ослабление активности белка может достигаться различными способами, хорошо известными в области техники. Примеры способов могут включать: способ модификации последовательности гена, кодирующего белок, так чтобы активность белка была устранена или ослаблена; способ модификации регулирующей экспрессию последовательности, так чтобы экспрессия гена понизилась; способ делеции части или всего гена, кодирующего белок; способ внедрения антисмыслового олигонуклеотида (например, антисмысловой РНК), подавляющий трансляцию мРНК в белок через комплементарное связывание с транскриптом гена на хромосоме; способ, делающий невозможным присоединение рибосомы вследствие образования вторичной структуры путем искусственного добавления комплементарной последовательности к последовательности Шайн-Далгарно (ШД) на переднем конце последовательности ШД гена, кодирующего белок; и способ инженерии обратной транскрипции (RTE), при котором добавляют промотор для обратной транскрпции к 3' концу открытой рамки считывания (ORF) полинуклеотидной последовательности гена, кодирующего белок; и их комбинации, но не ограничивается перечисленным.
В частности, способ модификации последовательности гена на хромосоме можно осуществлять посредством индуцирования модификации в указанной последовательности путем делеции, вставки, неконсервативной замены, консервативной замены или их комбинации, так чтобы дополнительно ослабить активность белка; или путем замены последовательности последовательностью гена, модифицированной таким образом, чтобы иметь ослабленную активность, либо последовательностью гена, модифицированной таким образом, чтобы активность полностью отсутствовала.
Способ модификации регулирующей экспрессию последовательности, может осуществляться посредством индуцирования модификации в последовательности, регулирующую экспрессию, путем делеции, вставки, консервативной замены, неконсервативной замены или их комбинации для дальнейшего ослабления активности регулирующей экспрессию последовательности; или путем замены последовательности последовательностью нуклеиновых кислот, обладающей более слабой активностью. Регулирующая экспрессию последовательность может включать промотор, последовательность оператора, последовательность, кодирующую сайт связывания рибосомы, и последовательность регуляции транскрипции и трансляции.
Способ делеции части или всего гена, кодирующего белок, может осуществляться путем замены полинуклеотида, кодирующего эндогенный целевой белок в составе хромосомы полинуклеотидом или маркерным геном, имеющим частичную делецию последовательности нуклеиновых кислот с использованием вектора для встраивания в хромосому бактерий. Например, может применяться способ делеции гена посредством гомологичной рекомбинации. Кроме того, в настоящем документе термин «часть», хотя он может варьировать в зависимости от типов полинуклеотида, может относиться в частности к 1-300 нуклеотидам, более конкретно к 1-100 нуклеотидам, и еще более конкретно к 1-50 нуклеотидам, но не ограничивается указанным.
Кроме того, способ модификации регулирующей экспрессию последовательности, может осуществляться путем включения модификации в регулирующую экспрессию последовательность путем делеции, вставки, консервативной замены, неконсервативной замены или их комбинации для дальнейшего ослабления активности регулирующей экспрессию последовательности; или путем замены последовательности последовательностью нуклеиновых кислот, обладающей более слабой активностью. Выражение регуляторная последовательность может включать промотор, последовательность оператора, последовательность, кодирующую сайт связывания рибосомы, и последовательность регуляции транскрипции и трансляции.
Кроме того, способ модификации последовательности гена на хромосоме можно осуществлять путем индуцирования модификации в последовательности путем делеции, вставки, консервативной замены, неконсервативной замены или их комбинации, так чтобы дополнительно ослабить активность белка; или путем замены последовательности последовательностью гена, модифицированной таким образом, чтобы иметь ослабленную активность, либо последовательностью гена, модифицированной таким образом, чтобы активность полностью отсутствовала.
Кроме того, ОФС-продуцирующий микроорганизм по настоящему изобретению может быть таким, у которого активность фосфоглицератдегидрогеназы (SerA) или фосфосеринаминотрансферазы (SerC) дополнительно усилена по сравнению с их эндогенной активностью.
SerA представляет собой белок, способный конвертировать 3-фосфоглицерат в 3-фосфогидроксипируват.SerC представляет собой белок, способный конвертировать 3-фосфогидроксипируват в ОФС. Соответственно, любой микроорганизм с усиленными активностями SerA и/или SerC может эффективно применяться в качестве ОФС-продуцирующего микроорганизма.
SerA может представлять собой белок, имеющий или включающий в себя аминокислотную последовательность, представленную SEQ ID NO: 5 или 6, или белок, состоящий или по существу состоящий из аминокислотной последовательности, представленной SEQ ID NO: 5 или 6, но не ограничивается таковым. Аминокислотная последовательность, представленная SEQ ID NO: 5, представляет собой последовательность SerA дикого типа, а аминокислотная последовательность, представленная SEQ ID NO: 6, представляет собой последовательность варианта SerA, свободного от ингибирования серином по механизму обратной связи. Кроме того, SerA по настоящему изобретению может иметь или включать в себя аминокислотную последовательность, обладающую гомологией или идентичностью по меньшей мере 80%, 90%, 95% или 99% или выше и менее 100% с аминокислотной последовательностью, представленной SEQ ID NO: 5 или 6, при условии, что она демонстрирует активность SerA дикого типа или активность варианта SerA, свободного от ингибирования серином по механизму обратной связи, но не ограничивается указанным. Кроме того, SerA по настоящему изобретению может состоять или по существу состоять из аминокислотной последовательности, обладающей гомологией или идентичностью по меньшей мере 80%, 90%, 95% или 99% или выше и менее 100% с аминокислотной последовательностью, представленной SEQ ID NO: 5 или 6, при условии, что она демонстрирует активность SerA дикого типа или активность варианта SerA, свободного от ингибирования серином по механизму обратной связи. Варианты SerA, свободные от ингибирования серином по механизму обратной связи, относятся к таким белкам, у которых внедрена модификация в ген, кодирующий SerA, посредством вставки нуклеотида гена, кодирующего SerA, или замены гена, кодирующего SerA дикого типа, и так далее, тем самым сохраняющие активность при ингибировании серином или глицином по механизму обратной связи, или обладающие их усиленными активностями, и такие варианты, которые свободны от ингибирования серином по механизму обратной связи, уже хорошо известны (Grant G.A. et al., J. Biol. Chem., 39:5357-5361, 1999; Grant G. A. et al., Biochem., 39:7316-7319, 2000; Grant G.A. et al., J. Biol. Chem., 276:17844-17850, 2001; Peters-Wendisch P. et al., Appl. Microbiol. Biotechnol., 60:37-441, 2002; US 6258573 B1).
Кроме того, полинуклеотид, кодирующий SerA дикого типа или вариант SerA, свободные от ингибирования серином по механизму обратной связи, может иметь или включать в себя нуклеотидную последовательность, кодирующую любую из аминокислотных последовательностей, представленных SEQ ID NO: 5 или 6. Кроме того, последовательность полинуклеотида, кодирующего SerA дикого типа или вариант SerA, свободный от ингибирования серином по механизму обратной связи, может состоять или по существу состоять из нуклеотидной последовательности, кодирующей любую из аминокислотных последовательностей, представленных SEQ ID NO: 5 или SEQ ID NO: 6, но не ограничивается таковым. Вследствие вырожденности кодонов или с учетом предпочтения кодонов у организма, в котором будет экспрессироваться полипептид, полинуклеотидная последовательность, кодирующая SerA дикого типа или вариант SerA, свободный от ингибирования серином по механизму обратной связи, может претерпевать различные модификации в кодирующей области, в том объеме, который не меняет аминокислотную последовательность полипептида, кодирующего SerA дикого типа или вариант SerA, свободный от ингибирования серином по механизму обратной связи. Например, нуклеотидная последовательность, кодирующая аминокислотную последовательность, представленную SEQ ID NO: 5, может представлять собой нуклеотидную последовательность, обладающую гомологией или идентичностью по меньшей мере 80%, 90%, 95% или 99% или выше с нуклеотидной последовательностью SEQ ID NO: 7. Кроме того, нуклеотидная последовательность, кодирующая аминокислотную последовательность, представленную SEQ ID NO: 6, может представлять собой нуклеотидную последовательность, обладающую гомологией или идентичностью по меньшей мере 80%, 90%, 95% или 99% или выше с нуклеотидной последовательностью SEQ ID NO: 8, но не ограничивается таковой.
SerC может, например, представлять собой белок, имеющий или включающий в себя аминокислотную последовательность, представленную SEQ ID NO: 9, или белок, состоящий или по существу состоящий из аминокислотной последовательности, представленной SEQ ID NO: 9, но не ограничивается таковым. Кроме того, SerC может иметь или включать в себя аминокислотную последовательность, обладающую гомологией или идентичностью по меньшей мере 80%, 90%, 95% или 99% или выше и менее 100% с аминокислотной последовательностью, представленной SEQ ID NO: 9, при условии, что она демонстрирует активность SerC. Кроме того, SerC может состоять или по существу состоять из аминокислотной последовательности, обладающей гомологией или идентичностью по меньшей мере 80%, 90%, 95% или 99% или выше и менее 100% с аминокислотной последовательностью, представленной SEQ ID NO: 9, при условии, что она демонстрирует активность SerC.
Кроме того, полинуклеотид, кодирующий SerC, может иметь нуклеотидную последовательность, кодирующую аминокислотную последовательность, представленную SEQ ID NO: 9. Вследствие вырожденности кодонов или с учетом предпочтения кодонов у организма, в котором будет экспрессироваться полипептид, полинуклеотид может претерпевать различные модификации в кодирующей области в том объеме, который не меняет аминокислотную последовательность полипептида. Полинуклеотид, кодирующий SerC, может иметь или включать в себя нуклеотидную последовательность, обладающую гомологией или идентичностью 80%, 90%, 95% или 99% или выше с нуклеотидной последовательностью SEQ ID NO: 10, но не ограничивается таковым. Кроме того, полинуклеотид, кодирующий SerC, может состоять или по существу состоять из нуклеотидной последовательности, обладающей гомологией или идентичностью 80%, 90%, 95% или 99% или выше с нуклеотидной последовательностью SEQ ID NO: 10, но не ограничивается таковым.
В настоящем документе термин «усиление по сравнению с его эндогенной активностью» и способ усиления являются такими, как описано выше.
Кроме того, микроорганизм может представлять собой микроорганизм, у которого способность внедрять ОФС в клетку или разлагать ОФС может быть дополнительно ослаблена.
В отношение содержимого ОФС-продуцирующих микроорганизмов, в качестве документа уровня техники в настоящем изобретении можно указать содержание US 8557549 В2, в дополнение к тому, что описано выше.
В еще одном аспекте настоящего изобретения в настоящем изобретении предложен способ получения О-фосфосерина, включающий культивирование О-фосфосерин-продуцирующего микроорганизма, который содержит любое одно или более из полипептида, обладающего О фосфосерин-экспортирующей активностью, содержащего а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющего аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), либо полипептида, обладающего О-фосфосерин-экспортирующей активностью, имеющего аминокислотную последовательность SEQ ID NO: 1, полинуклеотида, кодирующего полипептид по настоящему изобретению, и вектора, содержащего полинуклеотид по настоящему изобретению.
SEQ ID NO: 11, SEQ ID NO: 1, О-фосфосерин, полипептид, обладающий О-фосфосерин-экспортирующей активностью, полинуклеотид, вектор и микроорганизм являются такими, как описано выше.
В настоящем документе термин «культивирование» означает, что микроорганизм выращивают в надлежащим образом контролируемых внешних условиях. Процесс культивирования по настоящему изобретению можно осуществлять в подходящей культуральной среде и условиях культивирования, известных в области техники. Такой способ культивирования может быть легко адаптирован специалистом в области техники в зависимости от отбираемого штамма. В частности, культивирование может представлять собой периодическое культивирование, непрерывное культивирование и непрерывное культивирование с подпиткой, не ограничиваясь перечисленным.
При культивировании рекомбинантного микроорганизма, обладающего пониженной активностью SerB по сравнению с его эндогенной активностью, среда может дополнительно содержать глицин или серии, по причине индуцированной потребности рекомбинантного микроорганизма в серине. Глицин может быть представлен в форме очищенного глицина, глицин-содержащего экстракта дрожжей или триптона. Концентрация глицина в среде обычно должна составлять от 0,1 г/л до 10 г/л, и в частности, от 0,5 г/л до 3 г/л. Кроме того, серин может быть представлен в форме очищенного серина, серин-содержащего экстракта дрожжей или триптона. Концентрация серина в среде обычно должна составлять от 0,1 г/л до 5 г/л, и в частности, от 0,1 г/л до 1 г/л.
Примеры источника углерода, присутствующего в среде, могут включать сахариды и углеводы, такие как глюкоза, сахароза, лактоза, фруктоза, мальтоза, крахмал и целлюлоза; масла и жиры, такие как соевое масло, масло семян подсолнечника, касторовое масло и кокосовое масло; жирные кислоты, такие как пальмитиновая кислота, стеариновая кислота и линолевая кислота; спирты, такие как глицерин и этанол; и органические кислоты, такие как уксусная кислота. Такие источники углерода можно использовать по-отдельности или в комбинации, без ограничения.
Примеры источника азота, присутствующего в среде, могут включать источники органического азота, такие как пептон, дрожжевой экстракт, мясной экстракт, мальтозный экстракт, кукурузный экстракт и соевую муку; и источники неорганического азота, такие как мочевина, сульфат аммония, хлорид аммония, фосфат аммония, карбонат аммония и нитрат аммония. Такие источники азота можно использовать по-отдельности или в комбинации, без ограничения.
Примеры источника фосфора, присутствующего в среде, могут включать однозамещенный фосфат калия, двузамещенный фосфат калия и соответствующие натрий-содержащие соли, без ограничения.
Кроме того, среда для культивирования может содержать соли металлов, такие как сульфат магния или сульфат железа, и может дополнительно содержать аминокислоты, витамины и соответствующие предшественники. Такие культуральные среды или предшественники можно добавлять в культуру при периодическом культивировании или непрерывном культивировании, и они не ограничиваются перечисленными.
В процессе культивирования можно корректировать рН среды путем добавления надлежащим образом такого соединения как гидроксид аммония, гидроксид калия, аммоний, фосфорная кислота и серная кислота. Кроме того, можно предупреждать образование пены в ходе культивирования при помощи пеногасителя, такого как сложный полигликолевый эфир жирной кислоты. Кроме того, для поддержания аэробных условий культивирования в культуру можно инжектировать газообразный кислород или газ, содержащий кислород; или для поддержания анаэробных или микроаэробных условий можно инжектировать газообразный азот, газообразный водород или двуокись углерода, без инжектирования газа. Температура культуры может находиться в диапазоне от 25°С до 40°С, в частности, от 30°С до 35°С. Культивирование можно продолжать до тех пор, пока удается продуцировать желаемый материал, и в частности, в течение 10-100 часов, но эти приведенные в качестве иллюстрации примеры не являются исчерпывающими.
Данное изобретение может дополнительно включать стадию приготовления среды до стадии культивирования в способе по настоящему изобретению, но не ограничивается этим.
Данное изобретение может дополнительно включать стадию выделения ОФС, полученного на стадии культивирования, в способе по настоящему изобретению после стадии культивирования. В частности, требуемый ОФС можно выделять из культуры путем отделения и очистки при помощи соответствующего способа, известного в области техники, в соответствии со способом культивирования, например, периодического культивирования, непрерывного культивирования и непрерывного культивирование с подпиткой, не ограничиваясь перечисленным.
В еще одном аспекте настоящего изобретения в настоящем изобретении предложен способ получения цистеина или его производного, включающий:
а) получение О-фосфосерина (ОФС) или содержащей его среды посредством культивирования в среде О-фосфосерин-продуцирующего микроорганизма, содержащего любое одно или более из полипептида, обладающего О-фосфосерин-экспортирующей активностью, содержащего а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющего аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), либо полипептида, обладающего О-фосфосерин-экспортирующей активностью, имеющего аминокислотную последовательность SEQ ID NO: 1, полинуклеотида, кодирующего полипептид по настоящему изобретению, и вектора, содержащего полинуклеотид по настоящему изобретению; и
b) проведение реакции между О-фосфосерином или содержащей его средой, полученными на стадии а), и сульфидом в присутствии О-фосфосеринсульфгидрилазы (ОФСС) или экспрессирующего ее микроорганизма.
SEQ ID NO: 11, SEQ ID NO: 1, О-фосфосерин, полипептид, обладающий О-фосфосерин-экспортирующей активностью, полинуклеотид, вектор и микроорганизм являются такими, как описано выше.
В настоящем документе термин «производное» относится к схожим соединениям, полученным путем химической модификации части любого соединения. Указанный термин обычно относится к соединениям, в которых атом водорода или конкретная группа атомов заменен(а) другим атомом или группой атомов.
В настоящем документе термин «производное цистеина» относится к соединениям, в которых атом водорода или конкретная группа атомов заменен(а) другим атомом или группой атомов. Например, производные цистеина могут находиться в форме, в которой атом азота аминогруппы (-NH2) или атом серы тиоловой группы (-SH) в цистеине имеет другой атом или группу атомов, присоединенные к нему, и примеры производных цистеина могут включать NAC (N-ацетилцистеин), SCMC (S-карбоксиметилцистеин), Boc-Cys(Me)-OH, (R)-S-(2-амино-2-карбоксиэтил)-L-гомоцистеин, (R)-2-амино-3-сульфопропионовую кислоту, D-2-амино-4-(этилтио)бутировую кислоту, 3-сульфино-L-аланин, Fmoc-Cys(Boc-метил)-OH, селено-L-цистеин, 5-(2-тиазолил)-L-цистеин, 5-(2-тиенил)-L-цистеин, 5-(4-толил)-L-цистеин и так далее, без ограничения.
При получении цистеина в соответствии со способом по настоящему изобретению превращение в производные цистеина может легко осуществляться в разные производные цистеина любым методом, хорошо известным в области техники.
В частности, способ получения производных цистеина может дополнительно включать превращение цистеина, полученного на стадии b), в производное цистеина. Например, можно осуществить синтез N-ацетилцистеина (NAC) из цистеина путем реакции с ацетилирующим реагентом, или можно осуществить синтез S-карбоксиметилцистеина (SCMC) из цистеина путем реакции с галогенуксусной кислотой в щелочных условиях, без ограничения.
Такие производные цистеина используют преимущественно в качестве фармацевтических материалов для средств от кашля, уменьшающих кашель средств и терапевтических средств против бронхита, бронхиальной астмы, ларингофарингита и так далее, без ограничения.
В настоящем документе термин «О-фосфосеринсульфгидрилаза (ОФСС)» относится к ферменту, катализирующему реакцию, в ходе которой ОФС из тиоловой группы превращается в цистеин. Фермент может быть первоначально обнаруженным у Aeropyrum pernix, Mycobacterium tuberculosis, Mycobacterium smegmatis, and Trichomonas vaginalis (Mino K. and Ishikawa K., FEBS Letters, 551:133-138, 2003; Burns K.E. et al., J. Am. Chem. Soc., 127:11602-11603, 2005). Кроме того, ОФСС может включать не только белки ОФСС дикого типа, но также варианты белков, которые включают делецию, замену или вставку в части полинуклеотидной последовательности, кодирующей ОФСС, которые демонстрируют активность, равную или превосходящую биологическую активность белков ОФСС дикого типа, а также может включать все белки ОФСС, раскрытые в US 8557549 В2 и US 9127324 В2 и их варианты.
Сульфид, который может применяться в настоящем изобретении, может представлять собой любой сульфид, например, в форме сульфида (S2-) или тиосульфата (S2O3 2-), находящийся не только в твердой форме, обычно используемой в области техники, но также в жидкой или газообразной форме вследствие разницы в рН, давлении и растворимости, и, следовательно, может быть конвертирован в тиоловую группу. В частности, сульфид может включать Na2S, NaSH, H2S, (NH4)2S и Na2S2O3, которые могут быть источником тиоловой группы для ОФС, но не ограничивается ими. В ходе реакции единственная тиоловая группа встречается с единственной реакционноспособной группой ОФС с образованием одного цистеина или его производного. В данной реакции сульфид добавляют, в частности, в количестве от 0,1 до 3 молярных эквивалентов и, в частности, от 1 до 2 молярных эквивалентов, в зависимости от молярной концентрации ОФС, без ограничения.
Кроме того, способ по настоящему изобретению может дополнительно включать выделение цистеина, полученного на вышеупомянутой реакционной стадии. В частности, необходимый цистеин может быть выделен путем разделения и очистки из реакционного раствора с использованием подходящей реакции, известной в области техники.
В еще одном аспекте настоящего изобретения в настоящем изобретении предложено применение полипептида, обладающего О фосфосерин-экспортирующей активностью, содержащего а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющего аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), или полипептида, обладающего О-фосфосерин-экспортирующей активностью, имеющего аминокислотную последовательность SEQ ID NO: 1, для получения О-фосфосерина, цистеина или производных цистеина.
В еще одном аспекте настоящего изобретения в настоящем изобретении предложено применение полипептида, обладающего О-фосфосерин-экспортирующей активностью, содержащего а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (Т), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V), и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I), и имеющего аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и с) аминокислота в положении, соответствующем 207, представляет собой лизин (K), или полипептида, обладающего О-фосфосерин-экспортирующей активностью, имеющего аминокислотную последовательность SEQ ID NO: 1 для экспортирования О-фосфосерина из микроорганизмов.
SEQ ID NO: 11, SEQ ID NO: 1, О-фосфосерин, цистеин, производное цистеина и микроорганизм являются такими, как описано выше.
ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Далее настоящее изобретение будет описано более подробно посредством примеров. Однако, данные Примеры являются лишь предпочтительными примерами, приведенными в целях иллюстрации и, следовательно, объем настоящего изобретения не ограничивается указанными Примерами. При этом, технические признаки, которые не описаны в настоящем документе, могут быть в достаточной степени поняты и легко реализованы специалистами в области техники, к которой относится настоящее изобретение, или в схожей области техники.
Пример 1. Получение вариантов переносчика YhhS суперсемейства MFS (Major Facilitator Superfamily)
Для того, чтобы улучшить активность экспортера О-фосфосерина (далее «ОФС») для улучшения ОФС-экспортирующей активности у ОФС-продуцирующего штамма получали варианты переносчика YhhS суперсемейства MFS (major facilitator superfamily) (SEQ ID NO: 11), экспортирующего ОФС белка, и кодирующего его гена yhhS (SEQ ID NO: 12). Способ подробно описан ниже.
Вначале конструировали библиотеку вариантов гена yhhS. С этой целью проводили случайный мутагенез посредством ПЦР (ПЦР сниженной точности от JENA) с использованием геноспецифической пары праймеров (SEQ ID NO: 13 и 14) с использованием в качестве матрицы геномной ДНК Escherichia coli K12_W3110 (АТСС27325). Проводили ПЦР с денатурацией при 94°С в течение 5 мин; последующих 20 циклов денатурации при 94°С в течение 30 сек, отжига при 55°С в течение 30 сек и полимеризации при 72°С в течение 1 мин; и затем полимеризацией при 72°С в течение 5 мин. Для встраивания полученных таким образом фрагментов мутантного гена в вектор pCL1920 с промотором rhtB вначале конструировали вектор pCL PrhtB. Осуществляли ПЦР с использованием геноспецифической пары праймеров (SEQ ID NO: 16 и 17) для обеспечения промотора rhtB (SEQ ID NO: 15). Проводили ПЦР с денатурацией при 94°С в течение 5 мин; последующих 30 циклов денатурации при 94°С в течение 30 сек, отжига при 55°С в течение 30 сек и полимеризации при 72°С в течение 1 мин; и затем полимеризацией при 72°С в течение 5 мин. Фрагмент промотора rhtB встраивали в вектор pCL1920 (GenBank No. АВ236930), разрезали SacI и SmaI с получением pCLPrhtB. Вектор pCLPrhtB разрезали SmaI и PstI, и затем в него клонировали фрагменты мутантного гена с использованием набора для клонирования Infusion (Clontech Laboratories, Inc.). Осуществляли клонирование при 50°С в течение 60 минут с конструированием таким образом плазмидных библиотек вариантов гена pCL PrhtB yhhS. Использованные последовательности праймеров приведены в Таблице 1 ниже.
Проводили скрининг сконструированных таким образом рекомбинантных плазмидных библиотек при помощи высокопроизводительного скрининга (HTS). В частности, платформенный штамм, использованный для скрининга, представлял собой СА07-0012 (KCCM11121P, US 8557549 В2), являющийся штаммом с ослабленной активностью эндогенной фосфосеринфосфатазы (SerB) на основе штамма Е. coli дикого типа W3110.
Затем для получения вариантов с улучшенной ОФС-экспортирующей активностью платформенный штамм СА07-0012 трансформировали сконструированными таким образом плазмидными библиотеками вариантов гена pCL_PrhtB-yhhS посредством электропорации, а затем культивировали в среде, содержащей избыточное количество ОФС и отбирали три колонии, освободившиеся от подавления роста. Затем из трех отобранных колоний получали плазмиды и анализировали при помощи технологии секвенирования.
Из них отбирали три варианта гена yhhS, задействованные в освобождении от подавления роста в условиях избыточного добавления ОФС, и получали вариант, превосходящий yhhS М45 (US 2019-0233859 А1), являющийся существующим вариантом гена yhhS с повышенной ОФС-экспортирующей активностью, и обозначали его yhhS453.
Путем анализа аминокислотной последовательности полипептида, кодируемого yhhS453, подтверждали, что YhhS453 имел аминокислотную последовательность SEQ ID NO: 1.
Пример 2. Подтверждение ОФС-экспортирующей активности варианта yhhS453 гена yhhS
2-1. Конструирование штамма с внедренным yhhS453 с использованием ОФС-продуцирующего штамма и оценка ОФС-продуцирующей способности
Одним вариантом плазмиды pCL_PrhtB-yhhS453, обнаруженным в Примере 1, трансформировали ОФС-продуцирующий штамм СА07-0012 посредством электропорации, традиционно используемой в данной области техники. Таким образом конструировали ОФС-продуцирующий штамм CA07-0012/pCL_PrhtB-yhhS453 с внедренными вариантами yhhS453 гена yhhS и оценивали его ОФС-продуцирующую способность.
В частности, каждый из штаммов высаживали на твердую среду LB и культивировали в инкубаторе при 33°С в течение ночи. Штаммами, которые культивировали на твердой среде LB в течение ночи, инокулировали в 25 мл среды, показанной в Таблице 2 ниже, и затем культивировали в инкубаторе при 33°С при скорости 200 об/мин в течение 48 часов. Результаты приведены в Таблице 3 ниже.
Как показано в Таблице 3, в случае штамма с внедренным вариантом гена yhhS' по настоящему изобретению, подтверждали, что количество продуцируемого ОФС повышалось по сравнению со штаммом с внедренным геном yhhS дикого типа. Кроме того, подтверждали, что количество продуцируемого ОФС повышалось по сравнению с yhhS М45, представляющим собой платформенный вариант гена yhhS. В частности, yhhS453 продемонстрировал, что концентрация ОФС повышалась на 82% по сравнению с yhhS дикого типа и на 35% по сравнению с yhhS М45, платформенным вариантом гена yhhS.
CA07-0012/pCL_PrhtB-yhhS453 получил название Escherichia coli СА07-0352, и штамм СА07-0352 депонировали в Центре культур микроорганизмов Кореи (KCCM) в соответствии с Будапештским Соглашением 14 мая 2020 под регистрационным номером KCCM12720P.
2-2. Конструирование штамма с внедренным yhhS453 с использованием штаммов с усиленными SerA и SerC и оценка ОФС-продуцирующей способности
Для повторного подтверждения активности yhhS453 использовали СА07-0022/pCL-Prmf-serA*(G336V)-serC (KCCM11103P, US 8557549 В2), который как ОФС-продуцирующий штамм с улучшенной ОФС-продуцирующей способностью, обладает усиленной активностью D-3-фосфоглицератдегидрогеназы (SerA) и 3-фосфосеринаминотрансферазы (SerC) как путей биосинтеза ОФС.
yhhS453 клонировали в сайт рестрикционного фермента HindIII вектора pCL_Prmf-serA*(G336V)-serC. Вначале проводили ПЦР с использованием пары праймеров с последовательностями SEQ ID NO: 18 и 19 с использованием в качестве матрицы pCL_PrhtB-yhhS453 для получения фрагмента гена yhhS453. Проводили ПЦР с денатурацией при 94°С в течение 5 мин; последующих 30 циклов денатурации при 94°С в течение 30 сек, отжига при 55°С в течение 30 сек и полимеризации при 72°С в течение 1 мин; и затем полимеризацией при 72°С в течение 5 мин. Фрагмент гена yhhS453, полученный посредством ПЦР, клонировали с использованием набора для клонирования In-fusion. Осуществляли клонирование при 50°С в течение 60 минут с конструированием таким образом варианта плазмиды pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS. В качестве контроля использовали CA07-0022/pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS M25 и CA07-0022/pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS M45 (US 2019-0233859 A1). Использованные последовательности праймеров приведены в Таблице 4 ниже.
Каждой из полученных таким образом плазмид трансформировали ОФС-продуцирующий штамм СА07-0012 посредством электропорации, традиционно используемой в данной области техники. Таким образом конструировали ОФС-продуцирующий штамм CA07-0022/pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453 с внедренным вариантом yhhS453 гена yhhS и оценивали его ОФС-продуцирующую способность.
В частности, каждый из штаммов высаживали на твердую среду LB и затем культивировали в инкубаторе при 33°С в течение ночи. Штаммами, которые культивировали на твердой среде LB в течение ночи, инокулировали в 25 мл среды, показанной в Таблице 1 выше, и затем культивировали в инкубаторе при 33°С при скорости 200 об/мин в течение 48 часов. Результаты приведены в Таблице 5 ниже.
Как показано в Таблице 5, когда yhhS453 по настоящему изобретению внедряли в ОФС-продуцирующий штамм, в котором был усилен ген пути биосинтеза ОФС, подтверждали, что количество продуцируемого ОФС может улучшаться. Это позволяет предположить, что yhhS453 по настоящему изобретению можно эффективно применять для получения ОФС.
CA07-0022/pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453 обозначали Echerichia coli СА07-0353 и депонировали штамм СА07-0353 в Центре культур микроорганизмов Кореи (КССМ) в соответствии с Будапештским Соглашением 14 мая 2020 под регистрационным номером KCCM12721P.
2-3. Конструирование штамма с внедренным yhhS453 в зависимости от силы промотора на хромосоме и оценка ОФС-продуцирующей способности
Для подтверждения того, что внедрение yhhS453 в хромосому улучшало ОФС-экспортирующую активность, производили замену аутологичного промотора микроорганизма промотором trc и конструировали штамм с внедренным yhhS453 по настоящему изобретению и оценивали его ОФС-продуцирующую способность. В частности, для встраивания промотора trc в хромосому Е. coli использовали вектор pSKH130 (SEQ ID NO: 30). Указанный вектор содержал белок PI (ген pir)-зависимый репликон R6K, ген SacB (ген левансахаразы) и ген устойчивости к канамицину. После получения необходимого штамма с использованием R6K и канамицина при первом кроссовере с использованием вектора антибиотики удаляли из среды, содержащей сахарозу, для получения штамма. Более конкретно, конструировали вектор pSKH130_yhhS453, чтобы заменить аутологичный yhhS в штамме СА07-0022 на yhhS453. Для конструирования pSKH130-yhhS453 проводили ПЦР с использованием пары праймеров с последовательностями SEQ ID NO: 20 и 21 с использованием в качестве матрицы pCL_PrhtB-yhhS453, полученного в Примере 1, для получения фрагмента гена yhhS453. Проводили ПЦР с денатурацией при 94°С в течение 5 мин; последующих 30 циклов денатурации при 94°С в течение 30 сек, отжига при 55°С в течение 30 сек и полимеризации при 72°С в течение 1 мин; и затем полимеризацией при 72°С в течение 5 мин. Амплифицированный фрагмент гена клонировали с использованием вектора pSKH130, обработанного рестрикционным ферментом EcoRV и набора для клонирования In-fusion (Clontech Laboratories, Inc.) для получения pSK-yhhS453. Полученной плазмидой трансформировали штамм СА7-0022 посредством электропорации. Среди трансформированных штаммов отбирали штамм с внедрением в хромосому в результате рекомбинации (кроссовера) на твердой среде LB, содержащей канамицин, а затем вырезали сайт плазмиды из хромосомы посредством второй рекомбинации (замены) в среде, содержащей сахарозу. После завершения второй рекомбинации штамм использовали для проведения ПЦР с использованием пары праймеров с последовательностями SEQ ID NO: 22 и 23 и анализировали последовательность для конструирования штамма СА07-0022::yhhS453.
Конструировали PSKH130-Ptrc-yhhS453' для усиления промотора yhhS453 в сконструированном таким образом штамме СА07-0022::yhhS453. Более конкретно, проводили ПЦР с использованием пары праймеров с последовательностями SEQ ID NO: 24 и 25 с использованием в качестве матрицы штамма Е. coli дикого типа W3110 для получения фрагмента ДНК yhhSUP. Проводили ПЦР с денатурацией при 94°С в течение 5 мин; последующих 30 циклов денатурации при 94°С в течение 30 сек, отжига при 55°С в течение 30 сек и полимеризации при 72°С в течение 1 мин; и затем полимеризацией при 72°С в течение 5 мин. Затем проводили ПЦР с использованием пары праймеров с последовательностями SEQ ID NO: 26 и 27 с использованием в качестве матрицы pCL_Ptrc-gfp (US 2017-0247727 А1) для получения фрагмента ДНК Ptrc. Проводили ПЦР с денатурацией при 94°С в течение 5 мин; последующих 30 циклов денатурации при 94°С в течение 30 сек, отжига при 55°С в течение 30 сек и полимеризации при 72°С в течение 1 мин; и затем полимеризацией при 72°С в течение 5 мин. Затем проводили ПЦР с использованием пары праймеров с последовательностями SEQ ID NO: 28 и 29 с использованием в качестве матрицы pCL_PrhtB-yhhS453 для получения фрагмента гена yhhS453. Проводили ПЦР с денатурацией при 94°С в течение 5 мин; последующих 30 циклов денатурации при 94°С в течение 30 сек, отжига при 55°С в течение 30 сек и полимеризации при 72°С в течение 1 мин; и затем полимеризацией при 72°С в течение 5 мин. Амплифицированные фрагменты гена клонировали с использованием вектора pSKH130, обработанного рестрикционным ферментом EcoRV и IST для получения pSKH_yhhSUP_Ptrc-yhhS453. Полученной плазмидой трансформировали штамм СА7-0022::yhhS453 посредством электропорации. Среди трансформированных штаммов отбирали штамм с внедрением в хромосому в результате рекомбинации (кроссовера) на твердой среде LB, содержащей канамицин, а затем вырезали сайт плазмиды из хромосомы посредством второй рекомбинации (замены) в среде, содержащей сахарозу. После завершения второй рекомбинации штамм верифицировали с использованием пары праймеров с последовательностями SEQ ID NO: 22 и 23. Сконструированный штамм обозначали CA07-0022::Ptrc-yhhS453. Использованные последовательности праймеров приведены в Таблице 6 ниже.
В качестве контрольной группы использовали сконструированные таким же образом CA07-0022::Ptrc-yhhS, CA07-0022::Ptrc-yhhS М25 и CA07-0022::Ptrc-yhhS М45. Нуклеотидные последовательности праймеров, использованных для ПЦР, были такими же, как описано выше. Для подтверждения ОФС-продуцирующей способности полученный таким образом штамм трансформировали путем внедрения вектора pCL_Prmf-serA*(G336V)-(RBS)serC. усиленного serA и serC, посредством электропорации, стандартно используемой в области техники.
Каждый из штаммов высаживали на твердую среду LB и затем культивировали в инкубаторе при 33°С в течение ночи. Штаммами, которые культивировали на твердой среде LB в течение ночи, инокулировали в 25 мл среды, показанной в Таблице 1 выше, и затем культивировали в инкубаторе при 33°С при скорости 200 об/мин в течение 48 часов. Результаты приведены в Таблице 7 ниже.
Как показано в Таблице 7 выше, когда активность yhhS453 повышалась в результате усиления промотора на хромосоме, подтверждали, что количество продуцируемого ОФС повышалось более чем двукратно по сравнению со штаммом с внедренным yhhS дикого типа, и также подтверждали, что концентрация ОФС была существенно выше по сравнению с другими вариантами гена yhhS М45 и М25.
Специалистам в области техники очевидно, что возможны и другие конкретные воплощения настоящего изобретения, без отклонения от его сущности или существенных характеристик. Описанные воплощения следует считать только иллюстративными во всех отношениях, но не ограничивающими изобретение. Таким образом, объем настоящего изобретения определяется представленной формулой изобретения, а не описанием, приведенным выше. Все изменения, охватываемые значениями и диапазоном эквивалентности формулы изобретения, следует считать входящими в объем настоящего изобретения.
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> CJ CheilJedang Corporation
<120> Вариант белка, экспортирующего O-фосфосерин, и способ получения
O-фосфосерина, цистеина и его производных с его использованием
<130> OPA21198
<150> KR 10-2020-0069753
<151> 2020-06-09
<160> 30
<170> KoPatentIn 3.0
<210> 1
<211> 405
<212> PRT
<213> Artificial Sequence
<220>
<223> yhhS453
<400> 1
Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn
1 5 10 15
Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr
20 25 30
Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met
35 40 45
Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe
50 55 60
Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu
65 70 75 80
Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser
85 90 95
Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile
100 105 110
Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln
115 120 125
Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly
130 135 140
Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr
145 150 155 160
Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp
165 170 175
Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val
180 185 190
Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly
195 200 205
Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly
210 215 220
Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe
225 230 235 240
Thr Thr Leu Phe Tyr Val Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala
245 250 255
Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro
260 265 270
Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe
275 280 285
Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro
290 295 300
Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu
305 310 315 320
Val Phe Pro Ala Leu Gly Val Val Ala Ile Lys Ala Val Pro Gln Gln
325 330 335
Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser
340 345 350
Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly
355 360 365
Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu
370 375 380
Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu
385 390 395 400
Ala Ala Ser Ser Ser
405
<210> 2
<211> 1218
<212> DNA
<213> Artificial Sequence
<220>
<223> yhhS453
<400> 2
atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60
tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120
ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180
ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240
ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300
ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360
cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420
ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480
ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540
gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600
ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660
tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720
accacgctgt tttatgtcgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780
agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840
ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900
gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960
gtgttcccgg cattgggtgt agtggcgata aaagcggttc cgcagcaaaa tcagggggcg 1020
gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080
gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140
gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200
gccgcctcat catcttaa 1218
<210> 3
<211> 322
<212> PRT
<213> Artificial Sequence
<220>
<223> serB
<400> 3
Met Pro Asn Ile Thr Trp Cys Asp Leu Pro Glu Asp Val Ser Leu Trp
1 5 10 15
Pro Gly Leu Pro Leu Ser Leu Ser Gly Asp Glu Val Met Pro Leu Asp
20 25 30
Tyr His Ala Gly Arg Ser Gly Trp Leu Leu Tyr Gly Arg Gly Leu Asp
35 40 45
Lys Gln Arg Leu Thr Gln Tyr Gln Ser Lys Leu Gly Ala Ala Met Val
50 55 60
Ile Val Ala Ala Trp Cys Val Glu Asp Tyr Gln Val Ile Arg Leu Ala
65 70 75 80
Gly Ser Leu Thr Ala Arg Ala Thr Arg Leu Ala His Glu Ala Gln Leu
85 90 95
Asp Val Ala Pro Leu Gly Lys Ile Pro His Leu Arg Thr Pro Gly Leu
100 105 110
Leu Val Met Asp Met Asp Ser Thr Ala Ile Gln Ile Glu Cys Ile Asp
115 120 125
Glu Ile Ala Lys Leu Ala Gly Thr Gly Glu Met Val Ala Glu Val Thr
130 135 140
Glu Arg Ala Met Arg Gly Glu Leu Asp Phe Thr Ala Ser Leu Arg Ser
145 150 155 160
Arg Val Ala Thr Leu Lys Gly Ala Asp Ala Asn Ile Leu Gln Gln Val
165 170 175
Arg Glu Asn Leu Pro Leu Met Pro Gly Leu Thr Gln Leu Val Leu Lys
180 185 190
Leu Glu Thr Leu Gly Trp Lys Val Ala Ile Ala Ser Gly Gly Phe Thr
195 200 205
Phe Phe Ala Glu Tyr Leu Arg Asp Lys Leu Arg Leu Thr Ala Val Val
210 215 220
Ala Asn Glu Leu Glu Ile Met Asp Gly Lys Phe Thr Gly Asn Val Ile
225 230 235 240
Gly Asp Ile Val Asp Ala Gln Tyr Lys Ala Lys Thr Leu Thr Arg Leu
245 250 255
Ala Gln Glu Tyr Glu Ile Pro Leu Ala Gln Thr Val Ala Ile Gly Asp
260 265 270
Gly Ala Asn Asp Leu Pro Met Ile Lys Ala Ala Gly Leu Gly Ile Ala
275 280 285
Tyr His Ala Lys Pro Lys Val Asn Glu Lys Ala Glu Val Thr Ile Arg
290 295 300
His Ala Asp Leu Met Gly Val Phe Cys Ile Leu Ser Gly Ser Leu Asn
305 310 315 320
Gln Lys
<210> 4
<211> 969
<212> DNA
<213> Artificial Sequence
<220>
<223> serB
<400> 4
atgcctaaca ttacctggtg cgacctgcct gaagatgtct ctttatggcc gggtctgcct 60
ctttcattaa gtggtgatga agtgatgcca ctggattacc acgcaggtcg tagcggctgg 120
ctgctgtatg gtcgtgggct ggataaacaa cgtctgaccc aataccagag caaactgggt 180
gcggcgatgg tgattgttgc cgcctggtgc gtggaagatt atcaggtgat tcgtctggca 240
ggttcactca ccgcacgggc tacacgcctg gcccacgaag cgcagctgga tgtcgccccg 300
ctggggaaaa tcccgcacct gcgcacgccg ggtttgctgg tgatggatat ggactccacc 360
gccatccaga ttgaatgtat tgatgaaatt gccaaactgg ccggaacggg cgagatggtg 420
gcggaagtaa ccgaacgggc gatgcgcggc gaactcgatt ttaccgccag cctgcgcagc 480
cgtgtggcga cgctgaaagg cgctgacgcc aatattctgc aacaggtgcg tgaaaatctg 540
ccgctgatgc caggcttaac gcaactggtg ctcaagctgg aaacgctggg ctggaaagtg 600
gcgattgcct ccggcggctt tactttcttt gctgaatacc tgcgcgacaa gctgcgcctg 660
accgccgtgg tagccaatga actggagatc atggacggta aatttaccgg caatgtgatc 720
ggcgacatcg tagacgcgca gtacaaagcg aaaactctga ctcgcctcgc gcaggagtat 780
gaaatcccgc tggcgcagac cgtggcgatt ggcgatggag ccaatgacct gccgatgatc 840
aaagcggcag ggctggggat tgcctaccat gccaagccaa aagtgaatga aaaggcggaa 900
gtcaccatcc gtcacgctga cctgatgggg gtattctgca tcctctcagg cagcctgaat 960
cagaagtaa 969
<210> 5
<211> 410
<212> PRT
<213> Artificial Sequence
<220>
<223> SerA дикого типа
<400> 5
Met Ala Lys Val Ser Leu Glu Lys Asp Lys Ile Lys Phe Leu Leu Val
1 5 10 15
Glu Gly Val His Gln Lys Ala Leu Glu Ser Leu Arg Ala Ala Gly Tyr
20 25 30
Thr Asn Ile Glu Phe His Lys Gly Ala Leu Asp Asp Glu Gln Leu Lys
35 40 45
Glu Ser Ile Arg Asp Ala His Phe Ile Gly Leu Arg Ser Arg Thr His
50 55 60
Leu Thr Glu Asp Val Ile Asn Ala Ala Glu Lys Leu Val Ala Ile Gly
65 70 75 80
Cys Phe Cys Ile Gly Thr Asn Gln Val Asp Leu Asp Ala Ala Ala Lys
85 90 95
Arg Gly Ile Pro Val Phe Asn Ala Pro Phe Ser Asn Thr Arg Ser Val
100 105 110
Ala Glu Leu Val Ile Gly Glu Leu Leu Leu Leu Leu Arg Gly Val Pro
115 120 125
Glu Ala Asn Ala Lys Ala His Arg Gly Val Trp Asn Lys Leu Ala Ala
130 135 140
Gly Ser Phe Glu Ala Arg Gly Lys Lys Leu Gly Ile Ile Gly Tyr Gly
145 150 155 160
His Ile Gly Thr Gln Leu Gly Ile Leu Ala Glu Ser Leu Gly Met Tyr
165 170 175
Val Tyr Phe Tyr Asp Ile Glu Asn Lys Leu Pro Leu Gly Asn Ala Thr
180 185 190
Gln Val Gln His Leu Ser Asp Leu Leu Asn Met Ser Asp Val Val Ser
195 200 205
Leu His Val Pro Glu Asn Pro Ser Thr Lys Asn Met Met Gly Ala Lys
210 215 220
Glu Ile Ser Leu Met Lys Pro Gly Ser Leu Leu Ile Asn Ala Ser Arg
225 230 235 240
Gly Thr Val Val Asp Ile Pro Ala Leu Cys Asp Ala Leu Ala Ser Lys
245 250 255
His Leu Ala Gly Ala Ala Ile Asp Val Phe Pro Thr Glu Pro Ala Thr
260 265 270
Asn Ser Asp Pro Phe Thr Ser Pro Leu Cys Glu Phe Asp Asn Val Leu
275 280 285
Leu Thr Pro His Ile Gly Gly Ser Thr Gln Glu Ala Gln Glu Asn Ile
290 295 300
Gly Leu Glu Val Ala Gly Lys Leu Ile Lys Tyr Ser Asp Asn Gly Ser
305 310 315 320
Thr Leu Ser Ala Val Asn Phe Pro Glu Val Ser Leu Pro Leu His Gly
325 330 335
Gly Arg Arg Leu Met His Ile His Glu Asn Arg Pro Gly Val Leu Thr
340 345 350
Ala Leu Asn Lys Ile Phe Ala Glu Gln Gly Val Asn Ile Ala Ala Gln
355 360 365
Tyr Leu Gln Thr Ser Ala Gln Met Gly Tyr Val Val Ile Asp Ile Glu
370 375 380
Ala Asp Glu Asp Val Ala Glu Lys Ala Leu Gln Ala Met Lys Ala Ile
385 390 395 400
Pro Gly Thr Ile Arg Ala Arg Leu Leu Tyr
405 410
<210> 6
<211> 410
<212> PRT
<213> Artificial Sequence
<220>
<223> Мутантный SerA
<400> 6
Met Ala Lys Val Ser Leu Glu Lys Asp Lys Ile Lys Phe Leu Leu Val
1 5 10 15
Glu Gly Val His Gln Lys Ala Leu Glu Ser Leu Arg Ala Ala Gly Tyr
20 25 30
Thr Asn Ile Glu Phe His Lys Gly Ala Leu Asp Asp Glu Gln Leu Lys
35 40 45
Glu Ser Ile Arg Asp Ala His Phe Ile Gly Leu Arg Ser Arg Thr His
50 55 60
Leu Thr Glu Asp Val Ile Asn Ala Ala Glu Lys Leu Val Ala Ile Gly
65 70 75 80
Cys Phe Cys Ile Gly Thr Asn Gln Val Asp Leu Asp Ala Ala Ala Lys
85 90 95
Arg Gly Ile Pro Val Phe Asn Ala Pro Phe Ser Asn Thr Arg Ser Val
100 105 110
Ala Glu Leu Val Ile Gly Glu Leu Leu Leu Leu Leu Arg Gly Val Pro
115 120 125
Glu Ala Asn Ala Lys Ala His Arg Gly Val Trp Asn Lys Leu Ala Ala
130 135 140
Gly Ser Phe Glu Ala Arg Gly Lys Lys Leu Gly Ile Ile Gly Tyr Gly
145 150 155 160
His Ile Gly Thr Gln Leu Gly Ile Leu Ala Glu Ser Leu Gly Met Tyr
165 170 175
Val Tyr Phe Tyr Asp Ile Glu Asn Lys Leu Pro Leu Gly Asn Ala Thr
180 185 190
Gln Val Gln His Leu Ser Asp Leu Leu Asn Met Ser Asp Val Val Ser
195 200 205
Leu His Val Pro Glu Asn Pro Ser Thr Lys Asn Met Met Gly Ala Lys
210 215 220
Glu Ile Ser Leu Met Lys Pro Gly Ser Leu Leu Ile Asn Ala Ser Arg
225 230 235 240
Gly Thr Val Val Asp Ile Pro Ala Leu Cys Asp Ala Leu Ala Ser Lys
245 250 255
His Leu Ala Gly Ala Ala Ile Asp Val Phe Pro Thr Glu Pro Ala Thr
260 265 270
Asn Ser Asp Pro Phe Thr Ser Pro Leu Cys Glu Phe Asp Asn Val Leu
275 280 285
Leu Thr Pro His Ile Gly Gly Ser Thr Gln Glu Ala Gln Glu Asn Ile
290 295 300
Gly Leu Glu Val Ala Gly Lys Leu Ile Lys Tyr Ser Asp Asn Gly Ser
305 310 315 320
Thr Leu Ser Ala Val Asn Phe Pro Glu Val Ser Leu Pro Leu His Val
325 330 335
Gly Arg Arg Leu Met His Ile His Glu Asn Arg Pro Gly Val Leu Thr
340 345 350
Ala Leu Asn Lys Ile Phe Ala Glu Gln Gly Val Asn Ile Ala Ala Gln
355 360 365
Tyr Leu Gln Thr Ser Ala Gln Met Gly Tyr Val Val Ile Asp Ile Glu
370 375 380
Ala Asp Glu Asp Val Ala Glu Lys Ala Leu Gln Ala Met Lys Ala Ile
385 390 395 400
Pro Gly Thr Ile Arg Ala Arg Leu Leu Tyr
405 410
<210> 7
<211> 1233
<212> DNA
<213> Artificial Sequence
<220>
<223> SerA дикого типа
<400> 7
atggcaaagg tatcgctgga gaaagacaag attaagtttc tgctggtaga aggcgtgcac 60
caaaaggcgc tggaaagcct tcgtgcagct ggttacacca acatcgaatt tcacaaaggc 120
gcgctggatg atgaacaatt aaaagaatcc atccgcgatg cccacttcat cggcctgcga 180
tcccgtaccc atctgactga agacgtgatc aacgccgcag aaaaactggt cgctattggc 240
tgtttctgta tcggaacaaa ccaggttgat ctggatgcgg cggcaaagcg cgggatcccg 300
gtatttaacg caccgttctc aaatacgcgc tctgttgcgg agctggtgat tggcgaactg 360
ctgctgctat tgcgcggcgt gccggaagcc aatgctaaag cgcaccgtgg cgtgtggaac 420
aaactggcgg cgggttcttt tgaagcgcgc ggcaaaaagc tgggtatcat cggctacggt 480
catattggta cgcaattggg cattctggct gaatcgctgg gaatgtatgt ttacttttat 540
gatattgaaa ataaactgcc gctgggcaac gccactcagg tacagcatct ttctgacctg 600
ctgaatatga gcgatgtggt gagtctgcat gtaccagaga atccgtccac caaaaatatg 660
atgggcgcga aagaaatttc actaatgaag cccggctcgc tgctgattaa tgcttcgcgc 720
ggtactgtgg tggatattcc ggcgctgtgt gatgcgctgg cgagcaaaca tctggcgggg 780
gcggcaatcg acgtattccc gacggaaccg gcgaccaata gcgatccatt tacctctccg 840
ctgtgtgaat tcgacaacgt ccttctgacg ccacacattg gcggttcgac tcaggaagcg 900
caggagaata tcggcctgga agttgcgggt aaattgatca agtattctga caatggctca 960
acgctctctg cggtgaactt cccggaagtc tcgctgccac tgcacggtgg gcgtcgtctg 1020
atgcacatcc acgaaaaccg tccgggcgtg ctaactgcgc tgaacaaaat cttcgccgag 1080
cagggcgtca acatcgccgc gcaatatctg caaacttccg cccagatggg ttatgtggtt 1140
attgatattg aagccgacga agacgttgcc gaaaaagcgc tgcaggcaat gaaagctatt 1200
ccgggtacca ttcgcgcccg tctgctgtac taa 1233
<210> 8
<211> 1233
<212> DNA
<213> Artificial Sequence
<220>
<223> Мутантный SerA
<400> 8
atggcaaagg tatcgctgga gaaagacaag attaagtttc tgctggtaga aggcgtgcac 60
caaaaggcgc tggaaagcct tcgtgcagct ggttacacca acatcgaatt tcacaaaggc 120
gcgctggatg atgaacaatt aaaagaatcc atccgcgatg cccacttcat cggcctgcga 180
tcccgtaccc atctgactga agacgtgatc aacgccgcag aaaaactggt cgctattggc 240
tgtttctgta tcggaacaaa ccaggttgat ctggatgcgg cggcaaagcg cgggatcccg 300
gtatttaacg caccgttctc aaatacgcgc tctgttgcgg agctggtgat tggcgaactg 360
ctgctgctat tgcgcggcgt gccggaagcc aatgctaaag cgcaccgtgg cgtgtggaac 420
aaactggcgg cgggttcttt tgaagcgcgc ggcaaaaagc tgggtatcat cggctacggt 480
catattggta cgcaattggg cattctggct gaatcgctgg gaatgtatgt ttacttttat 540
gatattgaaa ataaactgcc gctgggcaac gccactcagg tacagcatct ttctgacctg 600
ctgaatatga gcgatgtggt gagtctgcat gtaccagaga atccgtccac caaaaatatg 660
atgggcgcga aagaaatttc actaatgaag cccggctcgc tgctgattaa tgcttcgcgc 720
ggtactgtgg tggatattcc ggcgctgtgt gatgcgctgg cgagcaaaca tctggcgggg 780
gcggcaatcg acgtattccc gacggaaccg gcgaccaata gcgatccatt tacctctccg 840
ctgtgtgaat tcgacaacgt ccttctgacg ccacacattg gcggttcgac tcaggaagcg 900
caggagaata tcggcctgga agttgcgggt aaattgatca agtattctga caatggctca 960
acgctctctg cggtgaactt cccggaagtc tcgctgccac tgcacgttgg gcgtcgtctg 1020
atgcacatcc acgaaaaccg tccgggcgtg ctaactgcgc tgaacaaaat cttcgccgag 1080
cagggcgtca acatcgccgc gcaatatctg caaacttccg cccagatggg ttatgtggtt 1140
attgatattg aagccgacga agacgttgcc gaaaaagcgc tgcaggcaat gaaagctatt 1200
ccgggtacca ttcgcgcccg tctgctgtac taa 1233
<210> 9
<211> 362
<212> PRT
<213> Artificial Sequence
<220>
<223> SerC
<400> 9
Met Ala Gln Ile Phe Asn Phe Ser Ser Gly Pro Ala Met Leu Pro Ala
1 5 10 15
Glu Val Leu Lys Gln Ala Gln Gln Glu Leu Arg Asp Trp Asn Gly Leu
20 25 30
Gly Thr Ser Val Met Glu Val Ser His Arg Gly Lys Glu Phe Ile Gln
35 40 45
Val Ala Glu Glu Ala Glu Lys Asp Phe Arg Asp Leu Leu Asn Val Pro
50 55 60
Ser Asn Tyr Lys Val Leu Phe Cys His Gly Gly Gly Arg Gly Gln Phe
65 70 75 80
Ala Ala Val Pro Leu Asn Ile Leu Gly Asp Lys Thr Thr Ala Asp Tyr
85 90 95
Val Asp Ala Gly Tyr Trp Ala Ala Ser Ala Ile Lys Glu Ala Lys Lys
100 105 110
Tyr Cys Thr Pro Asn Val Phe Asp Ala Lys Val Thr Val Asp Gly Leu
115 120 125
Arg Ala Val Lys Pro Met Arg Glu Trp Gln Leu Ser Asp Asn Ala Ala
130 135 140
Tyr Met His Tyr Cys Pro Asn Glu Thr Ile Asp Gly Ile Ala Ile Asp
145 150 155 160
Glu Thr Pro Asp Phe Gly Ala Asp Val Val Val Ala Ala Asp Phe Ser
165 170 175
Ser Thr Ile Leu Ser Arg Pro Ile Asp Val Ser Arg Tyr Gly Val Ile
180 185 190
Tyr Ala Gly Ala Gln Lys Asn Ile Gly Pro Ala Gly Leu Thr Ile Val
195 200 205
Ile Val Arg Glu Asp Leu Leu Gly Lys Ala Asn Ile Ala Cys Pro Ser
210 215 220
Ile Leu Asp Tyr Ser Ile Leu Asn Asp Asn Gly Ser Met Phe Asn Thr
225 230 235 240
Pro Pro Thr Phe Ala Trp Tyr Leu Ser Gly Leu Val Phe Lys Trp Leu
245 250 255
Lys Ala Asn Gly Gly Val Ala Glu Met Asp Lys Ile Asn Gln Gln Lys
260 265 270
Ala Glu Leu Leu Tyr Gly Val Ile Asp Asn Ser Asp Phe Tyr Arg Asn
275 280 285
Asp Val Ala Lys Ala Asn Arg Ser Arg Met Asn Val Pro Phe Gln Leu
290 295 300
Ala Asp Ser Ala Leu Asp Lys Leu Phe Leu Glu Glu Ser Phe Ala Ala
305 310 315 320
Gly Leu His Ala Leu Lys Gly His Arg Val Val Gly Gly Met Arg Ala
325 330 335
Ser Ile Tyr Asn Ala Met Pro Leu Glu Gly Val Lys Ala Leu Thr Asp
340 345 350
Phe Met Val Glu Phe Glu Arg Arg His Gly
355 360
<210> 10
<211> 1089
<212> DNA
<213> Artificial Sequence
<220>
<223> SerC
<400> 10
atggctcaaa tcttcaattt tagttctggt ccggcaatgc taccggcaga ggtgcttaaa 60
caggctcaac aggaactgcg cgactggaac ggtcttggta cgtcggtgat ggaagtgagt 120
caccgtggca aagagttcat tcaggttgca gaggaagccg agaaggattt tcgcgatctt 180
cttaatgtcc cctccaacta caaggtatta ttctgccatg gcggtggtcg cggtcagttt 240
gctgcggtac cgctgaatat tctcggtgat aaaaccaccg cagattatgt tgatgccggt 300
tactgggcgg caagtgccat taaagaagcg aaaaaatact gcacgcctaa tgtctttgac 360
gccaaagtga ctgttgatgg tctgcgcgcg gttaagccaa tgcgtgaatg gcaactctct 420
gataatgctg cttatatgca ttattgcccg aatgaaacca tcgatggtat cgccatcgac 480
gaaacgccag acttcggcgc agatgtggtg gtcgccgctg acttctcttc aaccattctt 540
tcccgtccga ttgacgtcag ccgttatggt gtaatttacg ctggcgcgca gaaaaatatc 600
ggcccggctg gcctgacaat cgtcatcgtt cgtgaagatt tgctgggcaa agcgaatatc 660
gcgtgtccgt cgattctgga ttattccatc ctcaacgata acggctccat gtttaacacg 720
ccgccgacat ttgcctggta tctatctggt ctggtcttta aatggctgaa agcgaacggc 780
ggtgtagctg aaatggataa aatcaatcag caaaaagcag aactgctata tggggtgatt 840
gataacagcg atttctaccg caatgacgtg gcgaaagcta accgttcgcg gatgaacgtg 900
ccgttccagt tggcggacag tgcgcttgac aaattgttcc ttgaagagtc ttttgctgct 960
ggccttcatg cactgaaagg tcaccgtgtg gtcggcggaa tgcgcgcttc tatttataac 1020
gccatgccgc tggaaggcgt taaagcgctg acagacttca tggttgagtt cgaacgccgt 1080
cacggttaa 1089
<210> 11
<211> 405
<212> PRT
<213> Artificial Sequence
<220>
<223> yhhS MFS
<400> 11
Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn
1 5 10 15
Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr
20 25 30
Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met
35 40 45
Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe
50 55 60
Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu
65 70 75 80
Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser
85 90 95
Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile
100 105 110
Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln
115 120 125
Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly
130 135 140
Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr
145 150 155 160
Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp
165 170 175
Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val
180 185 190
Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly
195 200 205
Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly
210 215 220
Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe
225 230 235 240
Ile Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala
245 250 255
Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro
260 265 270
Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe
275 280 285
Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro
290 295 300
Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu
305 310 315 320
Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln
325 330 335
Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser
340 345 350
Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly
355 360 365
Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu
370 375 380
Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu
385 390 395 400
Ala Ala Ser Ser Ser
405
<210> 12
<211> 1218
<212> DNA
<213> Artificial Sequence
<220>
<223> yhhS
<400> 12
atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60
tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120
ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180
ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240
ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300
ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360
cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420
ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480
ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540
gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600
ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660
tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720
atcacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780
agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840
ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900
gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960
gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020
gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080
gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140
gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200
gccgcctcat catcttaa 1218
<210> 13
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_PrhtB-yhhS library_F
<400> 13
caccgggagc ccgggatgcc cgaacccgta gccga 35
<210> 14
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_PrhtB-yhhS library_R
<400> 14
cttgcatgcc tgcagttaag atgatgaggc ggcct 35
<210> 15
<211> 341
<212> DNA
<213> Artificial Sequence
<220>
<223> Промотор rhtB
<400> 15
cgatggtcga tgattaagac atcaaacccc aaatggaaca ggtcataggc cagttccgca 60
tattttacgt agctctcaat acgccccggg cagatgacta ccacccggtc atggtgctgt 120
gcgcgaaaac ggacaaagcg caccggaatg tcatccacac cagtaaactc tgcttcatca 180
cgctgacgcc agaaatcagt cagcggtccc atggtaaaag cagcaaacgc gttttctctt 240
gtttcccagt ctttttgctg ctgaaacatc gggtaatctg cctcttaaac cacgtaaaat 300
cgtttttttt agcgtgcctg acacaacgct gcgacagtag c 341
<210> 16
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_PrhtB_F
<400> 16
cggggatcct ctagacgctt gctgcaactc tctca 35
<210> 17
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_PrhtB_R
<400> 17
tacgggttcg ggcatgatat ctttcctgtg tgaaa 35
<210> 18
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453_F
<400> 18
cacggttaaa agcttcgatg gtcgatgatt aagac 35
<210> 19
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453_R
<400> 19
gattacgcca agcttttaag atgatgaggc ggcct 35
<210> 20
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pSK-yhhS453_F
<400> 20
caggaattcg atatcatgcc cgaacccgta gccga 35
<210> 21
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pSK-yhhS453_R
<400> 21
gactagcgtg atatcttaag atgatgaggc ggcct 35
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> yhhS-out-F
<400> 22
atgtgaatct gtggattatt 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> yhhS-out-R
<400> 23
gttatggccg tttatcgaaa 20
<210> 24
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> W3110 yhhSUP_F
<400> 24
caggaattcg atatctcgct ccggcgacat atgca 35
<210> 25
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> W3110 yhhSUP_R
<400> 25
cagcaagcgg gtaccgagga tcaccacatt tttac 35
<210> 26
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_Ptrc-gfp_F
<400> 26
aatgtggtga tcctcggtac ccgcttgctg caact 35
<210> 27
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_Ptrc-gfp_R
<400> 27
tacgggttcg ggcatgatat ctttcctgtg tgaaa 35
<210> 28
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_PrhtB-yhhS453_F
<400> 28
cacaggaaag atatcatgcc cgaacccgta gccga 35
<210> 29
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pCL_PrhtB-yhhS453_R
<400> 29
gactagcgtg atatcgcacc catcgccatc gcccc 35
<210> 30
<211> 4695
<212> DNA
<213> Artificial Sequence
<220>
<223> pSKH130
<400> 30
tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc 60
gataatgtcg ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca 120
gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc 180
agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact 240
cctgatgatg catggttact caccactgcg atccccggga aaacagcatt ccaggtatta 300
gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg 360
ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct 420
caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt 480
aatggctggc ctgttgaaca agtctggaaa gaaatgcata agcttttgcc attctcaccg 540
gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa 600
ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc 660
atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa 720
tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt 780
ttctaatcag aattggttaa ttggttgtaa cactggcaga gcattacgct gacttgacgg 840
gacggcggct ttgttgaata aatcgaactt ttgctgagtt gaaggatcag atcacgcatc 900
ttcccgacaa cgcagaccgt tccgtggcaa agcaaaagtt caaaatcacc aactggtcca 960
cctacaacaa agctctcatc aaccgtggct ccctcacttt ctggctggat gatggggcga 1020
ttcaggcctg gtatgagtca gcaacacctt cttcacgagg cagacctcag cgctcaaaga 1080
tgcaggggta aaagctaacc gcatctttac cgacaaggca tccggcagtt caacagatcg 1140
ggaagggctg gatttgctga ggatgaaggt ggaggaaggt gatgtcattc tggtgaagaa 1200
gctcgaccgt cttggccgcg acaccgccga catgatccaa ctgataaaag agtttgatgc 1260
tcagggtgta gcggttcggt ttattgacga cgggatcagt accgacggtg atatggggca 1320
aatggtggtc accgcgcgta atacgactca ctatagggcg aattggagct ccaccgcggt 1380
ggcggccgct ctagacttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 1440
cgccttcttg acgagttctt ctgagcggga ctctggggtt cgctagagga tcgatccttt 1500
ttaacccatc acatatacct gccgttcact attatttagt gaaatgagat attatgatat 1560
tttctgaatt gtgattaaaa aggcaacttt atgcccatgc aacagaaact ataaaaaata 1620
cagagaatga aaagaaacag atagattttt tagttcttta ggcccgtagt ctgcaaatcc 1680
ttttatgatt ttctatcaaa caaaagagga aaatagacca gttgcaatcc aaacgagagt 1740
ctaatagaat gaggtcgaaa agtaaatcgc gcgggtttgt tactgataaa gcaggcaaga 1800
cctaaaatgt gtaaagggca aagtgtatac tttggcgtca ccccttacat attttaggtc 1860
tttttttatt gtgcgtaact aacttgccat cttcaaacag gagggctgga agaagcagac 1920
cgctaacaca gtacataaaa aaggagacat gaacgatgaa catcaaaaag tttgcaaaac 1980
aagcaacagt attaaccttt actaccgcac tgctggcagg aggcgcaact caagcgtttg 2040
cgaaagaaac gaaccaaaag ccatataagg aaacatacgg catttcccat attacacgcc 2100
atgatatgct gcaaatccct gaacagcaaa aaaatgaaaa atatcaagtt cctgaattcg 2160
attcgtccac aattaaaaat atctcttctg caaaaggcct ggacgtttgg gacagctggc 2220
cattacaaaa cgctgacggc actgtcgcaa actatcacgg ctaccacatc gtctttgcat 2280
tagccggaga tcctaaaaat gcggatgaca catcgattta catgttctat caaaaagtcg 2340
gcgaaacttc tattgacagc tggaaaaacg ctggccgcgt ctttaaagac agcgacaaat 2400
tcgatgcaaa tgattctatc ctaaaagacc aaacacaaga atggtcaggt tcagccacat 2460
ttacatctga cggaaaaatc cgtttattct acactgattt ctccggtaaa cattacggca 2520
aacaaacact gacaactgca caagttaacg tatcagcatc agacagctct ttgaacatca 2580
acggtgtaga ggattataaa tcaatctttg acggtgacgg aaaaacgtat caaaatgtac 2640
agcagttcat cgatgaaggc aactacagct caggcgacaa ccatacgctg agagatcctc 2700
actacgtaga agataaaggc cacaaatact tagtatttga agcaaacact ggaactgaag 2760
atggctacca aggcgaagaa tctttattta acaaagcata ctatggcaaa agcacatcat 2820
tcttccgtca agaaagtcaa aaacttctgc aaagcgataa aaaacgcacg gctgagttag 2880
caaacggcgc tctcggtatg attgagctaa acgatgatta cacactgaaa aaagtgatga 2940
aaccgctgat tgcatctaac acagtaacag atgaaattga acgcgcgaac gtctttaaaa 3000
tgaacggcaa atggtacctg ttcactgact cccgcggatc aaaaatgacg attgacggca 3060
ttacgtctaa cgatatttac atgcttggtt atgtttctaa ttctttaact ggcccataca 3120
agccgctgaa caaaactggc cttgtgttaa aaatggatct tgatcctaac gatgtaacct 3180
ttacttactc acacttcgct gtacctcaag cgaaaggaaa caatgtcgtg attacaagct 3240
atatgacaaa cagaggattc tacgcagaca aacaatcaac gtttgcgcca agcttcctgc 3300
tgaacatcaa aggcaagaaa acatctgttg tcaaagacag catccttgaa caaggacaat 3360
taacagttaa caaataaaaa cgcaaaagaa aatgccgatg ggtaccgagc gaaatgaccg 3420
accaagcgac gcccaacctg ccatcggatc ccccgggctg caggaattcg atatcacgct 3480
agtcgaccta gctagcatat ggggagatct actagtaaag catgccaatt ggtattctat 3540
agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg tagccgcgtt 3600
ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag cagaccctat 3660
catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc tgagtttctg 3720
gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc atcgctagcc 3780
catggctaat tcccatgtca gccgttaagt gttcctgtgt cactcaaaat tgctttgaga 3840
ggctctaagg gcttctcagt gcgttacatc cctggcttgt tgtccacaac cgttaaacct 3900
taaaagcttt aaaagcctta tatattcttt tttttcttat aaaacttaaa accttagagg 3960
ctatttaagt tgctgattta tattaatttt attgttcaaa catgagagct tagtacgtga 4020
aacatgagag cttagtacgt tagccatgag agcttagtac gttagccatg agggtttagt 4080
tcgttaaaca tgagagctta gtacgttaaa catgagagct tagtacgtga aacatgagag 4140
cttagtacgt actatcaaca ggttgaactg ctgatcttca gatcctctac gccggacgca 4200
tcgtggccgg atcttgcggc cgcaaaaatt aaaaatgaag ttttaaatca atctaaagta 4260
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca ccaataactg 4320
ccttaaaaaa actagcgctg aggtctgcct cgtgaagaag gtgttgctga ctcataccag 4380
gcctgaatcg ccccatcatc cagccagaaa gtgagggagc cacggttgat gagagctttg 4440
ttgtaggtgg accagttggt gattttgaac ttttgctttg ccacggaacg gtctgcgttg 4500
tcgggaagat gcgtgatctg atccttcaac tcagcaaaag ttcgatttat tcaacaaagc 4560
cacgttgtgt ctcaaaatct ctgatgttac attgcacaag ataaaaatat atcatcatga 4620
acaataaaac tgtctgctta cataaacagt aatacaaggg gtgttatgag ccatattcaa 4680
cgggaaacgt cttgc 4695
<---
Claims (19)
1. Полипептид, обладающий О-фосфосерин-экспортирующей активностью и содержащий аминокислотную последовательность SEQ ID NO: 1 или идентичную ей на 90% или более, которая содержит а) замену изолейцина (I) в положении, соответствующем 241 в аминокислотной последовательности SEQ ID NO: 11, на треонин (T), замену аспарагиновой кислоты (D) в положении, соответствующем 246 в аминокислотной последовательности SEQ ID NO: 11, на валин (V) и замену валина (V) в положении, соответствующем 330 в аминокислотной последовательности SEQ ID NO: 11, на изолейцин (I) и имеет аминокислотную последовательность, где b) аминокислота в положении, соответствующем 88, представляет собой фенилаланин и c) аминокислота в положении, соответствующем 207, представляет собой лизин (K).
2. Полипептид по п. 1, содержащий аминокислотную последовательность SEQ ID NO: 1.
3. Полинуклеотид, кодирующий полипептид по п. 1.
4. О-фосфосерин-продуцирующий микроорганизм, содержащий любое одно или более из полипептида по п. 1, полинуклеотида, кодирующего указанный полипептид, и вектора, содержащего указанный полинуклеотид, где указанный микроорганизм представляет собой Escherichia coli.
5. Микроорганизм по п. 4, у которого активность фосфосеринфосфатазы (SerB) дополнительно ослаблена по сравнению с ее эндогенной активностью.
6. Микроорганизм по п. 4, у которого активность фосфоглицератдегидрогеназы (SerA) или фосфосеринаминотрансферазы (SerC) дополнительно усилена по сравнению с ее эндогенной активностью.
7. Способ получения О-фосфосерина, включающий культивирование в среде О-фосфосерин-продуцирующего микроорганизма по п. 4 и выделение О-фосфосерина из культуральной среды или из микроорганизма.
8. Способ получения цистеина, включающий:
a) получение О-фосфосерина (ОФС) или содержащей его среды посредством способа по п. 7; и
b) проведение реакции между О-фосфосерином или содержащей его средой, полученных на стадии a), и сульфидом в присутствии О-фосфосеринсульфгидрилазы (ОФСС) или экспрессирующего ее микроорганизма.
9. Способ получения производного цистеина, включающий:
a) получение О-фосфосерина (ОФС) или содержащей его среды посредством способа по п. 7;
b) проведение реакции между О-фосфосерином или содержащей его средой, полученных на стадии a), и сульфидом в присутствии О-фосфосеринсульфгидрилазы (ОФСС) или экспрессирующего ее микроорганизма; и
c) превращение цистеина, полученного на стадии b), в производное цистеина.
10. Способ по п. 8, где сульфид представляет собой по меньшей мере один сульфид, выбранный из группы, состоящей из Na2S, NaSH, (NH4)2S, H2S и Na2S2O3.
11. Применение полипептида по п. 1 для получения О-фосфосерина.
12. Применение полипептида по п. 1 для получения цистеина.
13. Применение полипептида по п. 1 для получения производного цистеина.
14. Применение полипептида по п. 1 для высвобождения О-фосфосерина из О-фосфосерин-продуцирующего микроорганизма, где указанный микроорганизм представляет собой Escherichia coli.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2020-0069753 | 2020-06-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2821317C1 true RU2821317C1 (ru) | 2024-06-20 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2663726C1 (ru) * | 2014-08-12 | 2018-08-08 | СиДжей ЧеилДжеданг Корпорейшн | Микроорганизм, продуцирующий о-фосфосерин, и способ получения о-фосфосерина или l-цистеина с использованием этого микроорганизма |
RU2694589C1 (ru) * | 2015-09-11 | 2019-07-16 | СиДжей ЧеилДжеданг Корпорейшн | Новый вариант эффлюксного белка О-фосфосерина и способ продуцирования О-фосфосерина, цистеина и его производного с использованием этого варианта |
EP3564359A1 (en) * | 2016-12-29 | 2019-11-06 | CJ Cheiljedang Corporation | Escherichia |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2663726C1 (ru) * | 2014-08-12 | 2018-08-08 | СиДжей ЧеилДжеданг Корпорейшн | Микроорганизм, продуцирующий о-фосфосерин, и способ получения о-фосфосерина или l-цистеина с использованием этого микроорганизма |
RU2694589C1 (ru) * | 2015-09-11 | 2019-07-16 | СиДжей ЧеилДжеданг Корпорейшн | Новый вариант эффлюксного белка О-фосфосерина и способ продуцирования О-фосфосерина, цистеина и его производного с использованием этого варианта |
EP3564359A1 (en) * | 2016-12-29 | 2019-11-06 | CJ Cheiljedang Corporation | Escherichia |
Non-Patent Citations (1)
Title |
---|
БД "UniProtKB/Swiss-Prot" последовательность под номером P37621.2, размещена 05.12.2007. GOUDE R. et al., Electroporation of Mycobacteria, Mycobacteria Protocols, Methods in Molecular Biology, 2009, v.465, р.203-215, с.203. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2730025C1 (ru) | Новый вариант аспартокиназы и способ получения L-аминокислоты с использованием этого варианта | |
KR102277407B1 (ko) | 신규한 글루타메이트 합성 효소 서브 유니트 알파 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
US10696990B2 (en) | Variant of O-phosphoserine exporter and method of producing O-phosphoserine, cysteine, and its derivatives using the same | |
KR102377500B1 (ko) | 외래 metZ 유전자에 의해 코딩되는 단백질이 도입된 L-메티오닌 생산 미생물 및 이를 이용한 L-메티오닌 생산방법 | |
RU2821317C1 (ru) | Вариант белка, экспортирующего o-фосфосерин, и способ получения о-фосфосерина, цистеина и его производных с его использованием | |
KR102287112B1 (ko) | 신규한 쿠퍼익스포팅 P-type 에이티피에이즈 A 변이체 및 이를 이용한 L-트립토판 생산 방법 | |
JP2024503049A (ja) | GlxR蛋白質変異体またはこれを利用したスレオニン生産方法 | |
JP7407941B2 (ja) | O-ホスホセリン排出タンパク質変異体、並びにそれを用いたo-ホスホセリン、システイン及びその誘導体の生産方法 | |
KR102414743B1 (ko) | 신규 o-포스포세린 배출 단백질 및 이를 이용한 o-포스포세린, 시스테인 및 이의 유도체의 생산 방법 | |
RU2790565C1 (ru) | Новый вариант экспортирующей медь АТФазы А Р-типа и способ получения L-триптофана с его применением | |
RU2791193C1 (ru) | Новый вариант феррохелатазы и способ получения l-триптофана с его применением | |
RU2797499C1 (ru) | Новый вариант белка семейства транспортера цианата и способ получения L-триптофана с его применением | |
KR102654301B1 (ko) | NADH:quinone 산화환원효소의 발현이 조절된 재조합 미생물 및 이를 이용한 O-포스포세린, 시스테인 및 이의 유도체의 생산방법 | |
RU2790562C1 (ru) | НОВЫЙ ВАРИАНТ ТАУТОМЕРАЗЫ pptA И СПОСОБ ПОЛУЧЕНИЯ L-ТРИПТОФАНА С ЕГО ПРИМЕНЕНИЕМ | |
RU2793185C1 (ru) | Новый вариант гидролазы и способ получения L-триптофана | |
TWI843130B (zh) | Nadh:醌氧化還原酶的表現受調控的重組微生物及使用該微生物製備o-磷絲胺酸、半胱胺酸及其衍生物的方法 | |
TWI832275B (zh) | 新穎YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法 | |
RU2790564C1 (ru) | Новый вариант обменнного транспортера н(+)/cl(-) и способ получения l-триптофана с его применением | |
RU2795972C1 (ru) | Новый вариант белка HTRL и способ получения L-триптофана с его применением | |
CA3222110A1 (en) | Novel mdth variant and method for producing o-phosphoserine, cysteine, and derivative of cysteine using same | |
JP2024522877A (ja) | NADH:quinone酸化還元酵素の発現が調節された組換え微生物、並びにそれを用いたO-ホスホセリン、システイン及びその誘導体の生産方法。 | |
KR20230103229A (ko) | O-포스포세린 생산 미생물 및 이를 이용한 o-포스포세린 또는 l-시스테인 생산 방법 |