KR20230137443A - 거울상 선택성으로 뒤집힌 ω-트랜스아미나제 돌연변이체의 구성 및 적용 - Google Patents
거울상 선택성으로 뒤집힌 ω-트랜스아미나제 돌연변이체의 구성 및 적용 Download PDFInfo
- Publication number
- KR20230137443A KR20230137443A KR1020237029776A KR20237029776A KR20230137443A KR 20230137443 A KR20230137443 A KR 20230137443A KR 1020237029776 A KR1020237029776 A KR 1020237029776A KR 20237029776 A KR20237029776 A KR 20237029776A KR 20230137443 A KR20230137443 A KR 20230137443A
- Authority
- KR
- South Korea
- Prior art keywords
- transaminase
- ata117
- mutant
- ala
- gly
- Prior art date
Links
- 238000010276 construction Methods 0.000 title description 5
- 102000003929 Transaminases Human genes 0.000 claims abstract description 34
- 108090000340 Transaminases Proteins 0.000 claims abstract description 34
- 230000035772 mutation Effects 0.000 claims abstract description 29
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 28
- 150000001413 amino acids Chemical class 0.000 claims abstract description 25
- 239000002773 nucleotide Substances 0.000 claims abstract description 23
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 23
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 21
- 239000013612 plasmid Substances 0.000 claims abstract description 15
- ODLMAHJVESYWTB-UHFFFAOYSA-N ethylmethylbenzene Natural products CCCC1=CC=CC=C1 ODLMAHJVESYWTB-UHFFFAOYSA-N 0.000 claims abstract description 13
- 241000894006 Bacteria Species 0.000 claims abstract description 11
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims abstract description 5
- 238000004519 manufacturing process Methods 0.000 claims abstract description 3
- 102220148530 rs886061344 Human genes 0.000 claims description 186
- 102220534525 Protein fuzzy homolog_F225T_mutation Human genes 0.000 claims description 27
- 102220534503 Protein fuzzy homolog_F225Y_mutation Human genes 0.000 claims description 18
- 235000018102 proteins Nutrition 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 16
- -1 Methylsulfonyl phenylpropanone Chemical compound 0.000 claims description 13
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 13
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 13
- 229940024606 amino acid Drugs 0.000 claims description 11
- 235000001014 amino acid Nutrition 0.000 claims description 11
- 230000003287 optical effect Effects 0.000 claims description 9
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 6
- 229960000310 isoleucine Drugs 0.000 claims description 6
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 claims description 6
- 239000004474 valine Substances 0.000 claims description 6
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 6
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical group OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 claims description 5
- 239000007853 buffer solution Substances 0.000 claims description 5
- 239000003054 catalyst Substances 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical group SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical group C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 3
- 102220578461 Suppressor of fused homolog_V69D_mutation Human genes 0.000 claims description 3
- 235000004279 alanine Nutrition 0.000 claims description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 3
- 235000018417 cysteine Nutrition 0.000 claims description 3
- 238000007852 inverse PCR Methods 0.000 claims description 3
- 102220160825 rs202001245 Human genes 0.000 claims description 3
- 102200095470 rs28940296 Human genes 0.000 claims description 3
- 102220032873 rs367543128 Human genes 0.000 claims description 3
- 102220323583 rs375754042 Human genes 0.000 claims description 3
- 102220121593 rs886042878 Human genes 0.000 claims description 3
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 abstract 1
- 239000000758 substrate Substances 0.000 description 25
- 238000006243 chemical reaction Methods 0.000 description 23
- 239000007795 chemical reaction product Substances 0.000 description 22
- 239000000047 product Substances 0.000 description 21
- 102220474756 Uncharacterized protein C14orf178_H26Y_mutation Human genes 0.000 description 15
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 14
- 239000007791 liquid phase Substances 0.000 description 14
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 13
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 13
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- 239000007788 liquid Substances 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- 238000011160 research Methods 0.000 description 10
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 9
- PSVPUHBSBYJSMQ-UHFFFAOYSA-N 4-methylsulfonylbenzaldehyde Chemical compound CS(=O)(=O)C1=CC=C(C=O)C=C1 PSVPUHBSBYJSMQ-UHFFFAOYSA-N 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- 102000014701 Transketolase Human genes 0.000 description 7
- 108010043652 Transketolase Proteins 0.000 description 7
- 229910052759 nickel Inorganic materials 0.000 description 7
- FXLOVSHXALFLKQ-UHFFFAOYSA-N p-tolualdehyde Chemical compound CC1=CC=C(C=O)C=C1 FXLOVSHXALFLKQ-UHFFFAOYSA-N 0.000 description 7
- 238000010587 phase diagram Methods 0.000 description 7
- 238000005891 transamination reaction Methods 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- HUMNYLRZRPPJDN-UHFFFAOYSA-N benzaldehyde Chemical compound O=CC1=CC=CC=C1 HUMNYLRZRPPJDN-UHFFFAOYSA-N 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- IGGFFPOIFHZYKC-PBCZWWQYSA-N Thr-His-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O IGGFFPOIFHZYKC-PBCZWWQYSA-N 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 239000012148 binding buffer Substances 0.000 description 5
- 150000002576 ketones Chemical class 0.000 description 5
- 239000012460 protein solution Substances 0.000 description 5
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 description 5
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 239000010421 standard material Substances 0.000 description 5
- 230000000707 stereoselective effect Effects 0.000 description 5
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 150000001412 amines Chemical class 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 238000004587 chromatography analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000012149 elution buffer Substances 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 238000004811 liquid chromatography Methods 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 3
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 3
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 3
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 3
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 3
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 3
- 102000008300 Mutant Proteins Human genes 0.000 description 3
- 108010021466 Mutant Proteins Proteins 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 150000001299 aldehydes Chemical class 0.000 description 3
- 238000005576 amination reaction Methods 0.000 description 3
- 125000003277 amino group Chemical group 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 230000008033 biological extinction Effects 0.000 description 3
- BVKZGUZCCUSVTD-UHFFFAOYSA-N carbonic acid Chemical class OC(O)=O BVKZGUZCCUSVTD-UHFFFAOYSA-N 0.000 description 3
- 238000010523 cascade reaction Methods 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 239000005457 ice water Substances 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 125000004170 methylsulfonyl group Chemical group [H]C([H])([H])S(*)(=O)=O 0.000 description 3
- QNGNSVIICDLXHT-UHFFFAOYSA-N para-ethylbenzaldehyde Natural products CCC1=CC=C(C=O)C=C1 QNGNSVIICDLXHT-UHFFFAOYSA-N 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- ZPVFWPFBNIEHGJ-UHFFFAOYSA-N 2-octanone Chemical compound CCCCCCC(C)=O ZPVFWPFBNIEHGJ-UHFFFAOYSA-N 0.000 description 2
- IQVAERDLDAZARL-UHFFFAOYSA-N 2-phenylpropanal Chemical compound O=CC(C)C1=CC=CC=C1 IQVAERDLDAZARL-UHFFFAOYSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 2
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 2
- WZGZDOXCDLLTHE-SYWGBEHUSA-N Ala-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 WZGZDOXCDLLTHE-SYWGBEHUSA-N 0.000 description 2
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 2
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 2
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 2
- ZVUMKOMKQCANOM-AVGNSLFASA-N Asn-Phe-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVUMKOMKQCANOM-AVGNSLFASA-N 0.000 description 2
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 2
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- IAJCFCQAUJYERZ-UHFFFAOYSA-N C(C)(C)N.C(C1=CC=CC=C1)=O Chemical compound C(C)(C)N.C(C1=CC=CC=C1)=O IAJCFCQAUJYERZ-UHFFFAOYSA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UWTATZPHSA-N D-Asparagine Chemical compound OC(=O)[C@H](N)CC(N)=O DCXYFEDJOCDNAF-UWTATZPHSA-N 0.000 description 2
- XUJNEKJLAYXESH-UWTATZPHSA-N D-Cysteine Chemical compound SC[C@@H](N)C(O)=O XUJNEKJLAYXESH-UWTATZPHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-RFZPGFLSSA-N D-Isoleucine Chemical compound CC[C@@H](C)[C@@H](N)C(O)=O AGPKZVBTJJNPAG-RFZPGFLSSA-N 0.000 description 2
- ONIBWKKTOPOVIA-SCSAIBSYSA-N D-Proline Chemical compound OC(=O)[C@H]1CCCN1 ONIBWKKTOPOVIA-SCSAIBSYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 2
- 229930195711 D-Serine Natural products 0.000 description 2
- ODKSFYDXXFIFQN-SCSAIBSYSA-N D-arginine Chemical compound OC(=O)[C@H](N)CCCNC(N)=N ODKSFYDXXFIFQN-SCSAIBSYSA-N 0.000 description 2
- 229930028154 D-arginine Natural products 0.000 description 2
- 229930182846 D-asparagine Natural products 0.000 description 2
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 description 2
- 229930182847 D-glutamic acid Natural products 0.000 description 2
- HNDVDQJCIGZPNO-RXMQYKEDSA-N D-histidine Chemical compound OC(=O)[C@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-RXMQYKEDSA-N 0.000 description 2
- 229930195721 D-histidine Natural products 0.000 description 2
- 229930182845 D-isoleucine Natural products 0.000 description 2
- ROHFNLRQFUQHCH-RXMQYKEDSA-N D-leucine Chemical compound CC(C)C[C@@H](N)C(O)=O ROHFNLRQFUQHCH-RXMQYKEDSA-N 0.000 description 2
- 229930182819 D-leucine Natural products 0.000 description 2
- KDXKERNSBIXSRK-RXMQYKEDSA-N D-lysine Chemical compound NCCCC[C@@H](N)C(O)=O KDXKERNSBIXSRK-RXMQYKEDSA-N 0.000 description 2
- FFEARJCKVFRZRR-SCSAIBSYSA-N D-methionine Chemical compound CSCC[C@@H](N)C(O)=O FFEARJCKVFRZRR-SCSAIBSYSA-N 0.000 description 2
- 229930182818 D-methionine Natural products 0.000 description 2
- COLNVLDHVKWLRT-MRVPVSSYSA-N D-phenylalanine Chemical compound OC(=O)[C@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-MRVPVSSYSA-N 0.000 description 2
- 229930182832 D-phenylalanine Natural products 0.000 description 2
- 229930182820 D-proline Natural products 0.000 description 2
- AYFVYJQAPQTCCC-STHAYSLISA-N D-threonine Chemical compound C[C@H](O)[C@@H](N)C(O)=O AYFVYJQAPQTCCC-STHAYSLISA-N 0.000 description 2
- 229930182822 D-threonine Natural products 0.000 description 2
- 229930182827 D-tryptophan Natural products 0.000 description 2
- QIVBCDIJIAJPQS-SECBINFHSA-N D-tryptophane Chemical compound C1=CC=C2C(C[C@@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-SECBINFHSA-N 0.000 description 2
- OUYCCCASQSFEME-MRVPVSSYSA-N D-tyrosine Chemical compound OC(=O)[C@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-MRVPVSSYSA-N 0.000 description 2
- 229930195709 D-tyrosine Natural products 0.000 description 2
- KZSNJWFQEVHDMF-SCSAIBSYSA-N D-valine Chemical compound CC(C)[C@@H](N)C(O)=O KZSNJWFQEVHDMF-SCSAIBSYSA-N 0.000 description 2
- 229930182831 D-valine Natural products 0.000 description 2
- 229930195710 D‐cysteine Natural products 0.000 description 2
- 241000672609 Escherichia coli BL21 Species 0.000 description 2
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 2
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 2
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 2
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 2
- CMPHFUWXKBPNRS-WDSOQIARSA-N His-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 CMPHFUWXKBPNRS-WDSOQIARSA-N 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 2
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 2
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 2
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 2
- 239000007836 KH2PO4 Substances 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 2
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 2
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 2
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 2
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 2
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 2
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 2
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- PDKILSUYSUGCAO-JBACZVJFSA-N Tyr-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PDKILSUYSUGCAO-JBACZVJFSA-N 0.000 description 2
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 2
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 2
- KZOZXAYPVKKDIO-UFYCRDLUSA-N Tyr-Met-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KZOZXAYPVKKDIO-UFYCRDLUSA-N 0.000 description 2
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 2
- XTOCLOATLKOZAU-JBACZVJFSA-N Tyr-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N XTOCLOATLKOZAU-JBACZVJFSA-N 0.000 description 2
- 108010064997 VPY tripeptide Proteins 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 2
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 2
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 2
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 150000008365 aromatic ketones Chemical class 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 150000003935 benzaldehydes Chemical class 0.000 description 2
- AKGGYBADQZYZPD-UHFFFAOYSA-N benzylacetone Chemical compound CC(=O)CCC1=CC=CC=C1 AKGGYBADQZYZPD-UHFFFAOYSA-N 0.000 description 2
- 229960002161 brivaracetam Drugs 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- HPNMFZURTQLUMO-UHFFFAOYSA-N diethylamine Chemical compound CCNCC HPNMFZURTQLUMO-UHFFFAOYSA-N 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 2
- JJWLVOIRVHMVIS-UHFFFAOYSA-N isopropylamine Chemical compound CC(C)N JJWLVOIRVHMVIS-UHFFFAOYSA-N 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 2
- 235000019796 monopotassium phosphate Nutrition 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 229960001233 pregabalin Drugs 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- YPFDHNVEDLHUCE-UHFFFAOYSA-N propane-1,3-diol Chemical compound OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 2
- 238000010298 pulverizing process Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 235000008170 thiamine pyrophosphate Nutrition 0.000 description 2
- 239000011678 thiamine pyrophosphate Substances 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- AYIRNRDRBQJXIF-NXEZZACHSA-N (-)-Florfenicol Chemical compound CS(=O)(=O)C1=CC=C([C@@H](O)[C@@H](CF)NC(=O)C(Cl)Cl)C=C1 AYIRNRDRBQJXIF-NXEZZACHSA-N 0.000 description 1
- HOJZEMQCQRPLQQ-VIFPVBQESA-N (4r)-4-phenylpyrrolidin-2-one Chemical compound C1NC(=O)C[C@@H]1C1=CC=CC=C1 HOJZEMQCQRPLQQ-VIFPVBQESA-N 0.000 description 1
- HNBYUQGKCIUEOU-UHFFFAOYSA-N 2-anilinopropane-1,3-diol Chemical compound OCC(CO)NC1=CC=CC=C1 HNBYUQGKCIUEOU-UHFFFAOYSA-N 0.000 description 1
- HHDDCCUIIUWNGJ-UHFFFAOYSA-N 3-hydroxypyruvic acid Chemical compound OCC(=O)C(O)=O HHDDCCUIIUWNGJ-UHFFFAOYSA-N 0.000 description 1
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- PWYFCPCBOYMOGB-LKTVYLICSA-N Ala-Gln-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PWYFCPCBOYMOGB-LKTVYLICSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 1
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 1
- 241000186063 Arthrobacter Species 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- AMRANMVXQWXNAH-ZLUOBGJFSA-N Asp-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O AMRANMVXQWXNAH-ZLUOBGJFSA-N 0.000 description 1
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- TXYAHZNZCQPYKG-UHFFFAOYSA-N C(C)(=O)C1=CC=CC=C1.[Se] Chemical compound C(C)(=O)C1=CC=CC=C1.[Se] TXYAHZNZCQPYKG-UHFFFAOYSA-N 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-GSVOUGTGSA-N D-glutamine Chemical compound OC(=O)[C@H](N)CCC(N)=O ZDXPYRJPNDTMRX-GSVOUGTGSA-N 0.000 description 1
- 229930195715 D-glutamine Natural products 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- RIUZKUJUPVFAGY-HOTGVXAUSA-N Gly-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)CN RIUZKUJUPVFAGY-HOTGVXAUSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- NHRINZSPIUXYQZ-DCAQKATOSA-N Leu-Met-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N NHRINZSPIUXYQZ-DCAQKATOSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- ZEDVFJPQNNBMST-CYDGBPFRSA-N Met-Arg-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZEDVFJPQNNBMST-CYDGBPFRSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- UDOYVQQKQHZYMB-DCAQKATOSA-N Met-Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDOYVQQKQHZYMB-DCAQKATOSA-N 0.000 description 1
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- BHHGXPLMPWCGHP-UHFFFAOYSA-N Phenethylamine Chemical compound NCCC1=CC=CC=C1 BHHGXPLMPWCGHP-UHFFFAOYSA-N 0.000 description 1
- QXNSKJLSLYCTMT-FXQIFTODSA-N Pro-Cys-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O QXNSKJLSLYCTMT-FXQIFTODSA-N 0.000 description 1
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- XSXABUHLKPUVLX-JYJNAYRXSA-N Pro-Ser-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O XSXABUHLKPUVLX-JYJNAYRXSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- ZOCJFNXUVSGBQI-HSHDSVGOSA-N Thr-Trp-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ZOCJFNXUVSGBQI-HSHDSVGOSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- KWTRGSQOQHZKIA-PMVMPFDFSA-N Trp-Lys-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CCCCN)C(O)=O)C1=CC=C(O)C=C1 KWTRGSQOQHZKIA-PMVMPFDFSA-N 0.000 description 1
- UEFHVUQBYNRNQC-SFJXLCSZSA-N Trp-Phe-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=CC=C1 UEFHVUQBYNRNQC-SFJXLCSZSA-N 0.000 description 1
- YCQKQFKXBPJXRY-PMVMPFDFSA-N Trp-Tyr-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCCCN)C(=O)O)N YCQKQFKXBPJXRY-PMVMPFDFSA-N 0.000 description 1
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 1
- VSYROIRKNBCULO-BWAGICSOSA-N Tyr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O VSYROIRKNBCULO-BWAGICSOSA-N 0.000 description 1
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- XPYNXORPPVTVQK-SRVKXCTJSA-N Val-Arg-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N XPYNXORPPVTVQK-SRVKXCTJSA-N 0.000 description 1
- ZQGPWORGSNRQLN-NHCYSSNCSA-N Val-Asp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZQGPWORGSNRQLN-NHCYSSNCSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 239000001961 anticonvulsive agent Substances 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- MSYKRHVOOPPJKU-BDAKNGLRSA-N brivaracetam Chemical compound CCC[C@H]1CN([C@@H](CC)C(N)=O)C(=O)C1 MSYKRHVOOPPJKU-BDAKNGLRSA-N 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000006184 cosolvent Substances 0.000 description 1
- KWGRBVOPPLSCSI-UHFFFAOYSA-N d-ephedrine Natural products CNC(C)C(O)C1=CC=CC=C1 KWGRBVOPPLSCSI-UHFFFAOYSA-N 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 229960003760 florfenicol Drugs 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- AYXYPKUFHZROOJ-ZETCQYMHSA-N pregabalin Chemical compound CC(C)C[C@H](CN)CC(O)=O AYXYPKUFHZROOJ-ZETCQYMHSA-N 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- KRIOVPPHQSLHCZ-UHFFFAOYSA-N propiophenone Chemical compound CCC(=O)C1=CC=CC=C1 KRIOVPPHQSLHCZ-UHFFFAOYSA-N 0.000 description 1
- KWGRBVOPPLSCSI-WCBMZHEXSA-N pseudoephedrine Chemical compound CN[C@@H](C)[C@@H](O)C1=CC=CC=C1 KWGRBVOPPLSCSI-WCBMZHEXSA-N 0.000 description 1
- 229960003908 pseudoephedrine Drugs 0.000 description 1
- 229960001327 pyridoxal phosphate Drugs 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- MFFMDFFZMYYVKS-SECBINFHSA-N sitagliptin Chemical compound C([C@H](CC(=O)N1CC=2N(C(=NN=2)C(F)(F)F)CC1)N)C1=CC(F)=C(F)C=C1F MFFMDFFZMYYVKS-SECBINFHSA-N 0.000 description 1
- 229960004034 sitagliptin Drugs 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 229960002363 thiamine pyrophosphate Drugs 0.000 description 1
- AYEKOFBPNLCAJY-UHFFFAOYSA-O thiamine pyrophosphate Chemical compound CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N AYEKOFBPNLCAJY-UHFFFAOYSA-O 0.000 description 1
- YXVCLPJQTZXJLH-UHFFFAOYSA-N thiamine(1+) diphosphate chloride Chemical compound [Cl-].CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N YXVCLPJQTZXJLH-UHFFFAOYSA-N 0.000 description 1
- OTVAEFIXJLOWRX-NXEZZACHSA-N thiamphenicol Chemical compound CS(=O)(=O)C1=CC=C([C@@H](O)[C@@H](CO)NC(=O)C(Cl)Cl)C=C1 OTVAEFIXJLOWRX-NXEZZACHSA-N 0.000 description 1
- 229960003053 thiamphenicol Drugs 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
- C12Y206/01018—Beta-alanine-pyruvate transaminase (2.6.1.18)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P41/00—Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/22—Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Analytical Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 SEQ ID NO: 13에 기재된 서열에서 아미노산 돌연변이의 서열을 갖는 트랜스아미나제 돌연변이체를 제공한다. 또한 해당 단백질 아미노산 서열은 SEQ ID NO: 1에 기재된 것과 같고, 해당 돌연변이체를 암호화하는 뉴클레오티드 서열은 SEQ ID NO: 2에 기재된 것과 같은 거울상 선택성으로 뒤집힌 ω-트랜스아미나제 ATA117 돌연변이체를 제공하며; 또한 상기 뉴클레오티드 서열을 운반하는 플라스미드, ω-트랜스아미나제 ATA117 돌연변이체를 발현하는 유전자 조작 박테리아 및 ω-트랜스아미나제 ATA117 돌연변이체가 (1R,2R)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판을 생산하는 방법을 제공한다.
Description
본 발명은 2021년 2월 5일 중국 특허청에 출원된 출원번호 202110162624.3, 발명 명칭 '거울상 선택성으로 뒤집힌 ω-트랜스아미나제 돌연변이체의 구성 및 응용' 및 2021년 5월 24일 중국 특허청에 출원된 출원번호 202110567238.2, 발명 명칭 '효소 캐스케이드 반응을 이용한 (1R, 2R)-AMPP의 합성 방법'에 대한 중국 특허 출원에 우선권을 요구하며, 그 모든 내용은 인용을 통해 본 발명에 포함된다.
본 발명은 효소 공학 분야에 관한 것으로, 트랜스아미나아제 돌연변이체의 구성 및 적용에 관한 것으로, 특히 거울상 선택성으로 뒤집힌 ω-트랜스아미나아제 돌연변이체의 구성 및 적용에 관한 것이다.
트랜스아미나제는 α-트랜스아미나제와 ω-트랜스아미나제 두 가지 유형으로 나뉜다. α-트랜스아미나제는 I형, III형 및 IV형 아족을 포함하며 아미노기 전이반응 촉매 시 기질 케톤의 α-카르복실산에 의존한다. 반면 II형 아족에 속하는 ω-트랜스아미나제는 기질 케톤의 α-카르복실산에 의존하지 않으며, 다양한 지방족 케톤 및 방향족 케톤의 비대칭 아미노기 전이반응에 광범위하게 사용되어 입체 특이성 아민을 생성한다. 그 중 ATA117 은 널리 사용되는 ω-트랜스아미나아제 중 하나다. 2008년 Wolfgang Kroutil 연구팀은 ATA117이 4-페닐-2-뷰타논과 같은 일련의 방향족 케톤과 옥탄온과 같은 지방족 케톤을 효율적으로 촉매하여 ee≥99%인 R-구성 아민을 생산할 수 있다고 보고했다. 2010년 Wolfgang Kroutil 연구팀은 ATA117이 유기 셀레늄 아세토페논을 촉매하여 입체 특이성 R-p-셀레늄 페닐에틸아민을 생성할 수 있다고 보고했는데, 팔라듐 촉매제인 키랄 리간드이다. 같은 해 GregoryJ. Hughes 연구팀은 ATA117을 여러 차례 효소 진화시켜 ATA-117-Rd11 돌연변이체를 얻었으며, 이 돌연변이체는 큰 입체 장해 기질인 시타글립틴 전구체 케톤의 촉매 작용을 효과적으로 수행했다. 반면 Yu-GuoZheng 연구팀은 2020년 ATA-117-Rd11 돌연변이체를 활용하여 촉매 생산한 입체 특이성 L-글루포시네이트 생성물, ee>99%, 80kg의 반응 전구체를 24 시간 동안 70 kg의 L-글루포시네이트 생성물로 전환했다. 요약하면, ω-트랜스아미나아제 ATA117 은 기질 스펙트럼이 비교적 광범위하여 다양한 기질을 효과적으로 촉매함으로써 입체 특이성 아민을 생산할 수 있다.
ω-트랜스아미나제는 입체 특이성 아민을 생산할 수 있을 뿐만 아니라 오르토 키랄 중심에 대해 특정 거울상 선택성을 가진다. 2009년 Wolfgang Kroutil 연구팀은 ω트랜스아미나제 ATA117로 라세미 알데히드 기질을 광학분할하여 R-4-페닐기-2-피롤리돈을 얻었다고 보고했다. ATA117 은 알데히드 오르토의 카이랄 중심에 대해 거울상 선택성을 가지며, 공용매 및 pH의 최적화를 통해 아미노기전 생성물의 ee는 68%에 도달할 수 있다. 2013년 Vicente Gotor 연구팀이 라세미 α-알킬기-β-케톤에스테르에 대한 24 개 상용 S-및 R-트랜스아미나제의 광학분할을 조사한 결과, 촉매 효율은 높지만 부분 입체 선택성은 좋지 않은 것으로 나타났다. 2014년 Wolfgang Kroutil 연구팀이 슈드모나스속, 아르트로박터속, 아스페르질루스 테레우스 및 하이포모나스에서 추출한 ω-트랜스아미나제의 라세미 2-페닐 프로피온알데히드 및 파라-메타-오르토 메틸과 메톡시로 치환된 2-페닐 프로피온알데히드에 대한 광학분할을 조사한 결과, 이러한 트랜스아미나제가 오르토 키랄 중심에 대해 보이는 입체 선택성은 ee(R)= 76-98%인 것으로 나타났다. 2018 년 Wolfgang Kroutil 연구팀은 아르트로박터KNK168, 아스페르질루스테레우스, 필라멘트 모양의 곰팡이 푸사리움, 하이포모나스, 네오사르토리야 피쉐리, 바실러스 메가테리움 및 기타 출처에서 ω-트랜스아미나제에 의한 라세미 지방족 알데히드의 광학분할을 조사하였고, 한 단계의 아미노기 전이반응을 통해 높은 입체 선택성을 갖는 항간질 약물 브리바라세탐 및 프레가발린을 얻었다. 그중, 하이포모나스에서 추출한 ω-트랜스아미나제는 1 단계 광학분할을 통해 ee가 92%에 달하는 높은 입체 선택성을 지닌 R-브리바라세탐 키랄 중간체를 얻을 수 있었다. Wolfgang Kroutil 연구팀은 필라멘트 모양의 곰팡이 푸사리움에서 추출한 ω-트랜스아미나제 및 ArRmut11 돌연변이체를 기반으로 몇 개의 아미노산 부위를 돌연변이시켰다. 이때 생성된 돌연변이체는 라세미 지방족 알데히드와 S-프레가발린의 합성을 촉매하는데, 이들의 ee는 각각 76%와 80%에 도달할 수 있다. 2019년 Iva nLavandera 연구팀은 일련의 상업용 트랜스아미나제와 바실러스 메가테리움에서 추출한 트랜스아미나제 및 그 돌연변이체의 라세미 α-알킬기-β-케토아미드 기질에 대한 광학분할 상황을 보고했다. 그중, 상업용 R 트랜스아미나제가 이러한 기질에 대해 가장 높은 촉매 효율 및 입체 선택성을 가졌으며, 부분 입체 선택성 de는 96%에 달했다. 반면 바실러스 메가테리움에서 추출한 트랜스아미나제와 그 돌연변이체는 일부 기질만 치환할 수 있고 부분 입체 선택성이 상대적으로 낮았다. 종합해보면 대부분의 보고서에서는 다른 종에서 추출한 ω-트랜스아미나제를 스크리닝하여 알데히드 기질의 오르토 키랄 중심에 대한 높은 입체 선택성을 얻을 수 있는 반면, 상업용 트랜스아미나제를 스크리닝하면 α-알킬기-β-케토아미드와 같은 케톤 기질의 오르토 키랄 중심에 대해 높은 입체 선택성을 얻을 수 있는 것으로 나타났다. 그러나 키랄 방향족 하이드록시케톤 화합물에 대한 ω-트랜스아미노 효소의 거울상 선택성에 관한 문헌 보고는 아직 없다.
따라서 이 분야의 기술자들에게 어떻게 키랄 방향족 하이드록시케톤 화합물에 대한 높은 거울상 선택성을 갖는 ω-트랜스아미나제를 제공하여 이를 (1R,2R)-아미노디올 생성물의 광학분할 합성에 적용할 것인지는 시급히 해결해야 할 문제이다.
현재 키랄 방향족 하이드록시케톤 화합물에 대한 높은 거울상 선택성을 갖는 ω-트랜스아미나제를 제공하여 이를 (1R,2R)-아미노디올 생성물의 광학분할 합성에 적용하는 방법은 시급히 해결해야 할 문제이다.
[1]. 일종의 트랜스아미나제 돌연변이체. 여기서, 상기 트랜스아미나제 돌연변이체는 SEQ ID NO: 13에 열거된 서열에서 아미노산 돌연변이된 서열을 가지며, 상기 아미노산 돌연변이가 발생한 부위는 아래 어느 하나의 돌연변이다:
V69F, V69G, V69A, V69L, V69I, V69P, V69M, V69W, V69S, V69Q, V69T, V69C, V69N, V69Y, V69D, V69E, V69K, V69R, V69H, V69A+F122G, V69A+F122A, V69A+F122L, V69A+F122I, V69A+F122V, V69A+F122P, V69A+F122M, V69A+F122W, V69A+F122S, V69A+F122Q, V69A+F122T, V69A+F122C, V69A+F122N, V69A+F122Y, V69A+F122D, V69A+F122E, V69A+F122K, V69A+F122R, V69A+F122H, V69A+F122C+I157F, V69A+F122C+I157G, V69A+F122C+I157A, V69A+F122C+I157L, V69A+F122C+I157I, V69A+F122C+I157V, V69A+F122C+I157P, V69A+F122C+I157M, V69A+F122C+I157W, V69A+F122C+I157S, V69A+F122C+I157Q, V69A+F122C+I157T, V69A+F122C+I157C, V69A+F122C+I157N, V69A+F122C+I157Y, V69A+F122C+I157D, V69A+F122C+I157E, V69A+F122C+I157K, V69A+F122C+I157R, V69A+F122C+I157H, V69A+F122C+I157H+F225G, V69A+F122C+I157H+F225A, V69A+F122C+I157H+F225L, V69A+F122C+I157H+F225I, V69A+F122C+I157H+F225V, V69A+F122C+I157H+F225P, V69A+F122C+I157H+F225M, V69A+F122C+I157H+F225W, V69A+F122C+I157H+F225S, V69A+F122C+I157H+F225Q, V69A+F122C+I157H+F225T, V69A+F122C+I157H+F225C, V69A+F122C+I157H+F225N, V69A+F122C+I157H+F225Y, V69A+F122C+I157H+F225D, V69A+F122C+I157H+F225E, V69A+F122C+I157H+F225K, V69A+F122C+I157H+F225R, V69A+F122C+I157H+F225H.
[2] [1]에서 서술한 트랜스아미나제 돌연변이체에 따라 거울상 선택성으로 뒤집힌 ω-트랜스아미나제 ATA117 돌연변이체. 여기서, 상기 ω-트랜스아미나제 ATA117 돌연변이체의 단백질 아미노산 서열은 SEQ ID NO: 1와 같다.
[3]. [2]에서 서술한 트랜스아미나제 돌연변이체. 여기서, 상기 ω-트랜스아미나제 ATA117 돌연변이체는 ω-트랜스아미나제 ATA117의 아미노산 서열의 반복 포화 돌연변이에 의해 생성되고, 상기 ω-트랜스아미나제 ATA117 돌연변이는 위치 N1의 발린, 위치 N2의 페닐알라닌, 위치 N3의 이소류신 및 위치 N4의 페닐알라닌 중 적어도 하나의 돌연변이를 가진다.
[4]. [3]에서 서술한 트랜스아미나제 돌연변이체. 여기서, 위치 N1의 발린은 알라닌으로 돌연변이되고, 위치 N2의 페닐알라닌은 시스테인으로 돌연변이되며, 위치 N3의 이소류신은 히스티딘으로 돌연변이되고, 위치 N4의 페닐알라닌은 히스티딘으로 돌연변이된다.
[5]. 일종의 DNA 뉴클레오티드 서열. 여기서, 상기 DNA 뉴클레오티드 서열은 [1] 내지 [4] 중 어느 한 항목에서 서술한 트랜스아미나제 돌연변이를 코딩하는 뉴클레오티드 서열을 포함한다.
[6]. [5]에서 서술한 일종의 DNA 뉴클레오티드 서열. 여기서, 상기 DNA 뉴클레오티드 서열은 SEQ ID NO: 2와 같다.
[7]. [6]에서 서술한 DNA 뉴클레오티드 서열을 운반하는 플라스미드이다.
[8]. 일종의 ω-트랜스아미나제 ATA117 돌연변이체를 발현하는 유전자 조작 박테리아. 여기서, 상기 ω-트랜스아미나제 ATA117 돌연변이체의 단백질 아미노산 서열은 SEQ ID NO: 1와 같다.
[9]. [8]에서 서술한 ω-트랜스아미나제 ATA117 돌연변이를 발현하는 유전자 조작 박테리아를 구성하는 방법으로 A1, ATA117 코드를 가진 유전자의 재조합 플라스미드를 주형으로 사용하는 단계; A2, 돌연변이를 포함하는 프라이머를 설계 및 합성하는 단계; A3, 역 PCR로 전체 플라스미드를 증폭하는 단계; A4, PCR 생성물을 발현 숙주로 변환하는 단계를 포함한다.
[10]. [9]에서 서술한 일종의 ω-트랜스아미나제ATA117 돌연변이체를 발현하는 유전자 조작 박테리아를 구성하는 방법. 여기서, 상기 발현 숙주는E.coli BL21(DE3)이다.
[11].[1] 내지 [4] 중 어느 한 항목에서 서술한 트랜스아미나제 돌연변이체에 기반한 (1R,2R)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐페닐프로판의 제조 방법: 상기 트랜스아미나제 돌연변이체 순수 단백질을 촉매제로 완충시스템에서 라세미 1,3-디하이드록시-1-메틸설포닐프로피오케논을 촉매하고, 광학분할을 통해 높은 입체 선택성 (1R,2R)-1,3-디하이드록시-2-아미노기-1-p-메틸설포닐페닐프로판을 얻는다.
또한, 상기 기술적 문제를 해결하기 위해 본 발명은 半합리적 설계에 기반하여 ω-트랜스아미나제 ATA117를 분자 개조하고, 유전자 반복포화와 돌연변이 방법을 결합하여 상응하는 돌연변이체를 얻었다.
본 발명의 제1측면은, SEQ ID NO: 13에 나열된 서열 중 아미노산 돌연변이가 발생하는 서열을 갖는 트랜스아미나제 돌연변이체를 제공한다. 여기서 발생한 아미노산 돌연변이는 아래 어느 하나의 돌연변이를 포함한다:
V69F, V69G, V69A, V69L, V69I, V69P, V69M, V69W, V69S, V69Q, V69T, V69C, V69N, V69Y, V69D, V69E, V69K, V69R, V69H, V69A+F122G, V69A+F122A, V69A+F122L, V69A+F122I, V69A+F122V, V69A+F122P, V69A+F122M, V69A+F122W, V69A+F122S, V69A+F122Q, V69A+F122T, V69A+F122C, V69A+F122N, V69A+F122Y, V69A+F122D, V69A+F122E, V69A+F122K, V69A+F122R, V69A+F122H, V69A+F122C+I157F, V69A+F122C+I157G, V69A+F122C+I157A, V69A+F122C+I157L, V69A+F122C+I157I, V69A+F122C+I157V, V69A+F122C+I157P, V69A+F122C+I157M, V69A+F122C+I157W, V69A+F122C+I157S, V69A+F122C+I157Q, V69A+F122C+I157T, V69A+F122C+I157C, V69A+F122C+I157N, V69A+F122C+I157Y, V69A+F122C+I157D, V69A+F122C+I157E, V69A+F122C+I157K, V69A+F122C+I157R, V69A+F122C+I157H, V69A+F122C+I157H+F225G, V69A+F122C+I157H+F225A, V69A+F122C+I157H+F225L, V69A+F122C+I157H+F225I, V69A+F122C+I157H+F225V, V69A+F122C+I157H+F225P, V69A+F122C+I157H+F225M, V69A+F122C+I157H+F225W, V69A+F122C+I157H+F225S, V69A+F122C+I157H+F225Q, V69A+F122C+I157H+F225T, V69A+F122C+I157H+F225C, V69A+F122C+I157H+F225N, V69A+F122C+I157H+F225Y, V69A+F122C+I157H+F225D, V69A+F122C+I157H+F225E, V69A+F122C+I157H+F225K, V69A+F122C+I157H+F225R, V69A+F122C+I157H+F225H.
본 발명의 제2측면은, 일종의 거울상 선택성으로 뒤집힌 ω-트랜스아미나제 ATA117 돌연변이체를 제공하며, 해당 돌연변이체의 단백질 아미노산 서열은SEQ ID NO: 1에 열거된(SEQ ID NO: 13 서열 기반 아미노산 돌연변이 V69A+F122C+I157H+F225) 바와 같다.
SEQ ID NO: 1의 구체적인 서열은 아래와 같다:
MAFSADTSEI VYTHDTGLDY ITYSDYELDP ANPLAGGAAW IEGAFVPPSE ARISIFDQGY 60
LHSDVTYTAF HVWNGNAFRL DDHIERLFSN AESMRIIPPL TQDEVKEIAL ELVAKTELRE 120
ACVSVSITRG YSSTPGERDI TKHRPQVYMY AVPYQWHVPF DRIRDGVHAM VAQSVRRTPR 180
SSIDPQVKNF QWGDLIRAVQ ETHDRGFEAP LLLDGDGLLA EGSGHNVVVI KDGVVRSPGR 240
AALPGITRKT VLEIAESLGH EAILADITLA ELLDADEVLG CTTAGGVWPF VSVDGNPISD 300
GVPGPVTQSI IRRYWELNVE SSSLLTPVQY 330
또한, 돌연변이체는 ATA117의 아미노산 서열이 반복적인 포화와 돌연변이에 의해 생성되고, 위치 N1의 발린, 위치 N2의 페닐알라닌, 위치 N3의 이소류신, 및 위치 N4의 페닐알라닌 중 적어도 하나의 돌연변이를 갖는다.
또한, 위치 N1의 발린은 알라닌으로 돌연변이된다.
또한, 위치 N2의 페닐알라닌은 시스테인으로 돌연변이된다.
또한, 위치 N3의 이소류신은 히스티딘으로 돌연변이된다.
또한, 위치 N4의 페닐알라닌은 히스티딘으로 돌연변이된다.
또한, 돌연변이체는 라세미된 p-메틸설포닐 페닐 디하이드록시 케톤(도 1의 화학식 1')에 대해 비교적 높은 R-거울상 선택성을 가진다.
본 발명의 제3측면은, 해당 ω-트랜스아미나제 ATA117 돌연변이체를 암호화하는 뉴클레오티드 서열을 포함하는 DNA를 제공한다.
또한, DNA의 뉴클레오티드 서열은 SEQ ID NO: 2에 표시된 것과 같다.
SEQ ID NO: 2의 구체적인 서열은 아래와 같다:
atggcattta gcgcggatac cagcgaaatc gtctataccc acgataccgg tctggattac 60
atcacctaca gcgattacga actggatccg gcaaatccgt tagcaggcgg cgcagcttgg 120
attgaaggcg catttgttcc gccgtctgaa gcgcgtatta gcatcttcga tcagggctat 180
ctgcatagcg acgttaccta taccgcattc cacgtttgga acggtaacgc atttcgtctg 240
gacgatcaca tcgaacgtct gttcagcaac gccgaaagta tgcgtattat tccgccgctg 300
acccaagacg aagtcaaaga aatcgcgctg gaactggttg caaaaaccga actgcgcgaa 360
gcgtgtgtta gcgttagcat tacccgcggt tatagtagta ccccgggcga acgcgatatt 420
accaaacatc gtccgcaggt ctacatgtac gctgttccgt accagtggca tgttccgttt 480
gatcgtattc gcgacggcgt tcacgcaatg gttgcacaga gcgtgcgtcg taccccgcgt 540
agcagcatcg atccgcaggt caaaaacttc cagtggggcg atttaattcg cgcagttcag 600
gaaacccacg atcgcggttt tgaagcaccg ttactgttag acggcgacgg tttactggca 660
gaaggtagcg gccataacgt cgtcgtcatt aaagatgggg ttgttcgttc tccgggtcgt 720
gcagcattac cgggtattac ccgcaaaacc gttctggaaa ttgcggaatc cctgggtcat 780
gaagcgattc tggcggatat taccttagcg gaactgctgg acgcagacga agttttaggt 840
tgtaccaccg ctggcggcgt ttggccgttt gttagcgttg acggcaatcc gattagcgat 900
ggtgttccgg gtccggttac ccaaagcatt attcgtcgct actgggagct gaacgttgaa 960
agtagcagcc tgttaacccc ggttcagtat taa 993
본 발명의 제4 측면은, 상기 뉴클레오티드 서열을 갖는 플라스미드를 제공한다.
또한, ω-트랜스아미나제 ATA117 유전자 암호를 운반하는 재조합 플라스미드는 Synbio Technologies Co. Ltd.에서 ATA117 유전자를 합성한 다음, 효소 절단하여 pRSFduet-1 벡터 sal I/HindIII 효소 절단 부위에 연결 삽입하여 수득한다.
본 발명의 제5 측면은, ω-트랜스아미나제 ATA117 돌연변이를 발현하는 유전자 조작 박테리아를 제공한다.
또한, 유전자 조작 박테리아를 구성하는 방법은 A1, ATA117 코드를 가진 유전자의 재조합 플라스미드를 주형으로 사용하는 단계; A2, 돌연변이를 포함하는 프라이머를 설계 및 합성하는 단계; A3, 역 PCR로 전체 플라스미드를 증폭하는 단계 및 A4, PCR 생성물을 발현 숙주로 변환하는 단계를 포함한다.
또한, 발현 숙주는 E.coli BL21(DE3) 이다.
본 발명의 제6측면은, ω-트랜스아미나제 ATA117 돌연변이체에 의해 (1R,2R)-1,3-디히드록시-2-아미노-1-p-메틸설포닐 페닐프로판 (도 1의 화학식 2b)을 제조하는 방법을 제공한다: ω-트랜스아미나제 ATA117 돌연변이체 순수 단백질을 촉매제로 완충시스템에서 라세미 1,3-디하이드록시-1-p-메틸설포닐 프로피오페논 (도 1의 화학식1')을 촉매하고, 광학분할을 통해 높은 입체 선택성 (1R,2R)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판 (도1의 화학식 2b)을 얻는다.
또한, 완충시스템은 단일 수상 시스템이다.
본 발명에서 (1R,2R)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판은 (1R,2R)-2-아미노기-1-(4-(메틸설포닐)페닐)프로판-1,3-디올로도 칭할 수 있으며 약칭은 (1R,2R)-AMPP이다.
1. 본 발명에서 얻은 ATA117_ACHH 돌연변이체는 방향족 하이드록시케톤 화합물의 오르토-키랄 중심에 대해 비교적 높은 R-선택성을 가지며, 이는 키랄 하이드록시케톤 화합물에 대한 ω-트랜스아미나제의 거울상 선택성에 관한 연구를 보완한다.
2. 돌연변이체 ATA117_ACHH은 라세미 하이드록시케톤에 대한 광학분할로 높은 입체 선택성을 지닌 (1R,2R)-아미노 알코올을 얻을 수 있다. (1R,2R)-아미노 알코올 다양한 약물 중간체, 예컨데 티암페니콜, 플로르페니콜 및 슈도에페드린과 같은 키랄 중간체이다. 따라서, 상기 돌연변이체는 키랄 약물 중간체의 합성에 사용될 가능성이 있다.
3. 야생형 ATA117은 키랄 1,3-디하이드록시-1-p-메틸설포닐 피논아세톤1에 대한 거울상 이성질체 비율이 8.5E(S)인 반면, ATA117_ACHH 돌연변이체의 거울상 이성질체 비율은 11.7E(R)이다. 본 발명에서 수득한 돌연변이체는 키랄 (1R,2R)-아미노디올 생성물 합성에 적용할 수 있는 토대를 마련했다.
도 1은 화합물(화학식 1')에 대한 ATA117_ACHH 돌연변이체의 광학분할 개략도이다.
도 2는 ATA117_ACHH 돌연변이체 단백질 광학분할 라세미 기질(화학식 1')과 화학식 2a 및 화학식 2b의 합성에 대한 전환율 개략도이다.
도 3은 ATA117_ACHH 돌연변이체 단백질 광학분할 라세미 기질 (화학식 1')과 화학식 2a 및 화학식 2b의 합성에 대한 입체 선택성 개략도이다.
도 4는 C18 칼럼 조건에서 메틸설포닐 벤젤알데히드를 기질로 하는 반응 생성물의 액상이다.
도 5는 키랄 액상 조건에서 메틸설포닐 벤젤알데히드를 기질로 하는 트레오 반응 생성물의 액상 다이어그램이다.
도 6은 반응 생성물 (1R,2R)-AMPP의 수소 스펙트럼이다.
도 7은 반응 생성물 (1R,2R)-AMPP의 탄소 스펙트럼이다.
도 8은 C18 컬럼 조건하에서 벤젤알데히드를 기질로 하는 반응 생성물의 액상 다이어그램, 즉 효소 캐스케이드로 촉매된 벤젤알데히드 반응 생성물의 고성능 액상 크로마토그래피이다. 여기서, A는 효소 캐스케이드 반응 생성물의 HPLC 크로마토그래피이고; B는 (1R,2R)-페닐세리놀의 표준물질이며; C는 트레오 및 에리트로 생성물의 혼합물의 표준물질이다.
도 9는 C18 컬럼 조건하에서 p-톨루알데히드를 기질로 하는 반응 생성물의 액체 크리마토그래피, 즉 효소 캐스케이드로 촉매된 p-톨루알데히드 반응 생성물의 고성능 액체 크로마토그래피이다. 여기서, A는 효소 캐스케이드 생성물의 HPLC 크로마토그래피이고; B는 (1R,2R)-p-메틸 페닐세리놀의 표준물질이며; C는 트레오와 에리트로 생성물의 혼합 표준물질이다.
도 2는 ATA117_ACHH 돌연변이체 단백질 광학분할 라세미 기질(화학식 1')과 화학식 2a 및 화학식 2b의 합성에 대한 전환율 개략도이다.
도 3은 ATA117_ACHH 돌연변이체 단백질 광학분할 라세미 기질 (화학식 1')과 화학식 2a 및 화학식 2b의 합성에 대한 입체 선택성 개략도이다.
도 4는 C18 칼럼 조건에서 메틸설포닐 벤젤알데히드를 기질로 하는 반응 생성물의 액상이다.
도 5는 키랄 액상 조건에서 메틸설포닐 벤젤알데히드를 기질로 하는 트레오 반응 생성물의 액상 다이어그램이다.
도 6은 반응 생성물 (1R,2R)-AMPP의 수소 스펙트럼이다.
도 7은 반응 생성물 (1R,2R)-AMPP의 탄소 스펙트럼이다.
도 8은 C18 컬럼 조건하에서 벤젤알데히드를 기질로 하는 반응 생성물의 액상 다이어그램, 즉 효소 캐스케이드로 촉매된 벤젤알데히드 반응 생성물의 고성능 액상 크로마토그래피이다. 여기서, A는 효소 캐스케이드 반응 생성물의 HPLC 크로마토그래피이고; B는 (1R,2R)-페닐세리놀의 표준물질이며; C는 트레오 및 에리트로 생성물의 혼합물의 표준물질이다.
도 9는 C18 컬럼 조건하에서 p-톨루알데히드를 기질로 하는 반응 생성물의 액체 크리마토그래피, 즉 효소 캐스케이드로 촉매된 p-톨루알데히드 반응 생성물의 고성능 액체 크로마토그래피이다. 여기서, A는 효소 캐스케이드 생성물의 HPLC 크로마토그래피이고; B는 (1R,2R)-p-메틸 페닐세리놀의 표준물질이며; C는 트레오와 에리트로 생성물의 혼합 표준물질이다.
다음은 구체적인 실시예와 함께 데이터를 참조하여 본 발명을 더욱 상세히 설명한다. 이러한 실시예는 본 발명을 예시할 뿐이며 어떠한 방식으로도 발명의 범위를 제한하지 않는다는 점을 이해해야 한다.
본 발명에 기술된 생물학적 재료 출처 대한 일반적인 설명은:
(1R,2R)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판은 황스융신바이오테크유한회사(黃石永信生物科技有限公司)에서 구매했다. 일반 액체 크로마토그래피 컬럼 C18(4.6×250mm, 입자 크기 5μm) 은 페이뤄먼과학기구회사(菲羅門科學儀器公司) 제품이다; 키랄 액체 크로마토그래피 칼럼 IG(4.6 × 250mm, 입자 크기 5μm)는 다사이루약물키랄기술유한회사(大賽藥物手性技術有限公司) 제품이다.
본 명세서에서, 메폭시, 메탄설포닐 및 메탄설포닐기는 동일한 화학 구조를 나타낸다.
실시예1. 반복되는 포화 돌연변이
VN-F:agcgacgttacctataccnnkttccacgtttggaacggtaacgca (SEQ ID NO: 3)
VN-R:accgttccaaacgtggaamnnggtataggtaacgtcgctatgcag (SEQ ID NO: 4)
FN-F:accgaactgcgcgaagcgnnkgttagcgttagcattacccgcggt (SEQ ID NO: 5)
FN-R:ggtaatgctaacgctaacmnncgcttcgcgcagttcggtttttgc (SEQ ID NO: 6)
IN-F: gctgttccgtaccagtggnnkgttccgtttgatcgtattcgcgac (SEQ ID NO: 7)
IN-R: aatacgatcaaacggaacmnnccactggtacggaacagcgtacat (SEQ ID NO: 8)
FN-F: ctggcagaaggtagcggcnnkaacgtcgtcgtcattaaagatggg (SEQ ID NO: 9)
FN-R: tttaatgacgacgacgttmnngccgctaccttctgccagtaaacc (SEQ ID NO: 10)
여기서 n은 a, t, c 및 g의 임의의 염기를 나타내고, k는 t 또는 g 염기를 나타내고, m은 a 또는 c 염기를 나타내며, 해당 축퇴 코돈은 20 개의 무작위 아미노산을 암호화할 수 있다.
(1) 재조합 플라스미드 pRSFduet-1-ATA117은 주형으로 사용하고, VN-F 및 VN-R은 프라이머로 사용하며, PhantaMax 중합효소 (Vazyme에서 구매)를 사용하여 PCR 증폭(95℃ 5min; 95℃ 30s,65℃ 30s,72℃ 5min,34개 순환; 72℃ 10min)을 진행한다. PCR 생성물은 FD-DpnI 소화 (30℃ 인큐베이터, 6h) 경과 후 E.coliBL21(DE3) 수용성 세포로 직접 변형된다. 소생액을 충분히 불어넣어 고르게 혼합하고 약 1/8의 소생액을 카나마이신 내성 LB 플레이트에 코팅하고 37℃에서 12-16h 배양하여 재조합 하위 라이브러리를 얻는다.
(2) 상기 희석 플레이트 위의 모든 단일 콜로니 (약 40개)를 골라 카나마이신 내성 LB 배지에서 37℃로 7-8h 배양한다. 배양액의 일부는 시퀀싱에 사용하고, 나머지 배양액은 잠시 4℃의 냉장고에 넣어 단기 보관한다. 시퀀싱이 정확한 형질전환체 배양액을 1%의 접종량으로 카나마이신-내성 5mL LB 배양 배지를 담은 신선한 24 웰 플레이트로 옮기고 37℃에서 3h 배양한 후, 0.2mM IPTG 유도제를 첨가하여 20℃에서 15h 배양하여 재조합 유전자의 효율적인 발현을 유도하고, 재조합 세포를 4,000rpm에서 원심분리하여 박테리아를 수집하고, -80℃에서 저장한다. 동일한 유도 방법으로 PRSFduet-1-ATA117 재조합 박테리아를 대조군으로 구한다.
(3) 수득한 재조합 박테리아를 50mM Tris-Cl(pH = 7.5) 현탁액 300㎕에 첨가하고, 초음파로 분쇄하고, 저온 원심분리하고, 상청액은 라세미 1,3-디히드록시-1-p-메틸설포닌 프로피오페논 촉매에 사용한다.
(4) (3)의 상기 반응 생성물을 사용하여 C18 컬럼의 부분 입체 선택성을 측정하며, 액상 분석 조건은 실시예2에 기재된 바와 같다. 실험 결과 ATA117/VN 포화 돌연변이체에서 ATA117 돌연변이체의 S-하이드록시케톤에 대한 기질 선택성이 야생형 ATA117보다 현저히 낮았으므로 ATA117_A를 다음 라운드 FN 포화 돌연변이 주형으로 선택한다. 돌연변이체의 구성, 발현, 반응 및 검출 방법은 전술한 바와 같다. 실험 결과 ATA117_A/FN 포화 돌연변이체에서 키랄 하이드록시케톤 기질에 대한 ATA117_AC 돌연변이의 선택성이 역전되었으므로 ATA117_AC를 다음 라운드 IN 포화 돌연변이 주형으로 선택한다. IN 포화 돌연변이는 후 FN 돌연변이를 반복하였고, R-하이드록시케톤 기질에 대한 높은 선택성을 갖는 돌연변이체 ATA117_ACHH를 최종적으로 수득한다.
실시예2. 트랜스아미나제의 발현 및 정제
트랜스아미나제의 발현 및 정제 방법은, LB 고체 배지에서 재조합 플라스미드를 함유한 대장균군 E.coli BL21(DE3)의 단일 콜로니를 수집하여, 40ml의 LB 액체 배지(50㎍/ml의 카나마이신 항생제 함유)에 접종하고, 37℃, 220rpm에서 밤새 배양한다. 7.5 ml의 박테리아 배양액을 500ml의 액체 LB 배지를 포함하는 2L 쉐이크 플라스크에 옮기고, 2병을 접종한 다음 OD600 이 0.6-0.8에 도달할 때까지 37 ℃ 및 220 rpm에서 배양하고, 0.2mM IPTG를 첨가하여 유도, 20℃, 200rp에서 15h 유도 배양한다. 1L의 발효액을 수집하고, 5,000rpm에서 20분간 원심분리로 세포를 수집하며, 수집한 세포를 30mL의 니켈 컬럼 결합 완충액에 재현탁하고 얼음물 혼합물에 넣는다.
실시예3. ATA117 및 그 돌연변이체의 거울상 선택성 테스트
반응 시스템 총 100 μl(50mM Tris-Clbuffer, pH7.5), 2mM 라세미 1,3-디하이드록시-1-p-메틸설피논 프로피오케논, 2mM PLP, 200mM D-Ala, 5μM ATA117, 20μM ATA117_A, 20μM ATA117_AC, 40μM ATA117_ACH, 40μM ATA117_ACHH은 30℃에서 1h 반응하고, 반응이 끝나면 200μl 메탄올을 추가하여 반응을 종료한다. 앨리전트 액체상을 사용하여 시료를 분석한다. C18 컬럼(4.6×150mm, 입자 크기 3μm), 컬럼 온도 30℃, 224nm, 0.5ml/min, A상:H2O(10mM KH2PO4, pH=8.5), B상: 아세토니트릴. 크로마토그래피 조건은 표 1에 표시된 것과 같다:
[표 1] 크로마토그래피 조건
(1S,2R)-및 (1R,2R)-1,3-디하이드록시-1-p-메틸설포닐 프로피오페논 아민화 생성물의 보류 시간은 각각 13.2분 및 14.1분이었다. de=(RR-SR)/(RR+SR),E=ln[1-c×(1+de)]/ln[1-c×(1-de)]. 여기서, RR 및 SR은 (1R,2R)-및 (1S,2R)-1,3-디하이드록시-1-p-메틸설포닐 페닐프로판 아민화 생성물의 농도를 나타내고, c는 라세미 1,3-디하이드록시-1-p-메틸설포닐 페닐프로판의 전환율을 나타낸다.
테스트 결과는 표 2와 같다:
[표 2] ATA117 및 그 돌연변이체의 거울상 이성질체 비율(E)
De는 부분 입체 이성질체 초과값을 나타낸다.
실시예4. ATA117_ACHH를 응용한 (1R,2R)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판의 합성
반응 시스템은 총 100μl(100mM Tris-Cl buffer, pH 7.5), 25μM ATA117_ACHH 순수 단백질, 5Mm 라세미 1,3-디하이드록시-1-p-메틸설포닐 프로피오케논, 2mM PLP, 200mM D-Ala, 10mM NADH, 90U/ml LDH, 200mM 포도당, 30U/ml GDH로 구성되었으며, 30℃에서 15min,30min,1h,2h,3h,4h,반응 후 메탄올을 추가하여 반응을 종료한다. 반응 생성물은 우선 보통 액상 컬럼으로 분리하고, 부분 입체 이성질체의 선택성을 조사하며 분석 방법은 상기와 같다. (에리트로)-및 (트레오)-1,3-디하이드록시-1-p-메틸설포닐 페닐프로파논 아민화 생성물(즉, 1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판)의 보류 시간은 각각 13.2 및 14.1 분이다. 액상의 피크에 따라, (트레오)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판 시료를 수집하고 농축한 다음 키랄 액상 컬럼으로 한단계 더 원심분리하여 거울상 이성질체의 선택성을 조사한다. 거울상 이성질체 분석 조건은 키랄 컬럼 IG컬럼, 컬럼 온도 25℃, 0.5 ml/min, 224nm이고; 크로마토그래피 조건은 순수 메탄올 (0.1% 디에틸아민 함유), 15분이다. (1R,2R)-및(1S,2S)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판의 체류 시간은 각각 5.6min 및 9.4min이었다. ee=[(RR-SS)/(RR SS)]×100%이다. 여기서, RR (화학식2b) 및 SS는 (1R,2R)-및 (1S,2S)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판을 나타낸다. ATA117_ACHH 돌연변이체 단백질과 (1R,2R)-1,3-디하이드 록시-2-아미노-1-p-메틸설포닐 페닐프로판(화학식2b)의 합성 촉매 전환율 및 입체선택성 개략도는 도 2와 도 3에 표시된 것과 같다.
실시예5. ATA117_ACHH 및 기타 돌연변이체를 이용한 (1R,2R)-AMPP 및 그 유도체의 합성
(1R,2R)-AMPP 및 그의 유도체의 합성 방법은, 벤즈알데히드 유도체를 기질로 사용하여 대장균군 트랜스케톨라제 돌연변이체의 작용 하에 아미노기 전이반응을 진행하고 화학식2에 표시된 반응 생성물을 수득한다. 이어서 화학식2에 표시된 화합물을 기질로 사용하여 트랜스아미나제 ATA117 돌연변이의 작용하에 아미노기 전이반응을 수행한다. 아미노기 공여체는 D-알라닌, D-글리신, D-발린, D-류신, D-이소류신, D-메티오닌, D-프롤린, D-트립토판, D-세린, D-타이로신, D-시스테인, D-페닐알라닌, D-아스파라긴, D-글루타민, D-트레오닌, D-아스파르트산, D-글루타민산, D-라이신, D-아르기닌, D-히스티딘 또는 이소프로필아민으로 화학식 3에 표시된 (1R,2R)-AMPP 및 그 유도체와 합성하였다.
이와 관련된 반응식은 아래와 같다:
이하 상기 방법을 상세히 설명한다:
1단계: 대장균으로부터 트랜스케톨라제 돌연변이체의 발현 및 정체
SEQ ID NO: 12에 표시된 서열에서 상기 아미노산 돌연변이가 발생한 뉴클레오티드 서열을 벡터 pET28a에 도입하고, 숙주 E.coliBL21 에 도입한다; 이어 LB 고체 배지에서 재조합 플라스미드를 함유하는 대장균군 E.coli BL21의 단일 콜로니를 선택하고, 40ml LB 액체 배지(50μg/ml 카나마이신 항생제 함유)에 접종하여, 37℃, 220rpm에서 밤새 배양한다; 10ml 박테리아 배양액을 500ml 액체 LB 배지를 포함하는 2L 쉐이크 플라스크에 옮긴 다음 2병을 접종하고, 37℃, 220rpm에서 OD600이 0.6-0.8에 도달할 때까지 계속 배양하고, 0.2mM IPTG를 첨가하여 유도, 30℃, 200rpm에서 5h 유도 배양한다.
배양이 완료되면 1L의 발효액을 수집하고, 5000rpm에서 20분간 원심분리로 세포를 수집하며, 수집한 세포를 30 mL의 니켈 컬럼 결합 완충액에 재현탁하고 얼음물 혼합물에 넣어 초음파 분쇄를 한다. 초음파 분쇄 조건은 작동 5s, 멈춤 10s로 총 30min 진행한다.
분쇄 처리를 거친 혼합물을 12,000rpm에서 30min 원심분리하고, 상청액을 0.22㎛ 필터로 여과한다. 이어서, 여과된 시료를 니켈 컬럼 결합 완충액으로 미리 평형화된 2 ml의 니켈 충전재에 로딩하고, 컬럼 부피의 20배인 50mM 이미다졸 용출 완충액으로 불순물 단백질을 세척한 다음, 5ml 250mM 이미다졸 용출 완충액으로 표적 단백질을 용출하고, 시료를 각 튜브에 500㎕씩 나눈다. 각 튜브의 단백질 농도를 측정하고, 농도가 더 높은 몇 개 튜브의 단백질액을 합하여 2.5ml로 희석하거나 농축한 다음, 시료를 글리세롤 완충액으로 평형화된 탈염 컬럼으로 옮긴다. 단백질 용액을 건조시킨 후 3.5ml 글리세롤 완충액을 첨가하여 단백질을 용출시킴으로써 대장균 케톨전이효소 돌연변이체의 순수 단백질을 얻는다.
단계 1에서, 단백질 농도 측정은 Thermo Scientific Nanodrop 8000-type 검출기를 사용하여 280nm에서의 흡광도 E를 검출하고, 표적 단백질 농도는 몰 흡광 계수에 따라 환산하여 구한다. 즉, 단백질 농도 (mg/mL)는 E/몰 흡광 계수, 재조합 효소의 몰 소광 계수는 소프트웨어 Vector NTI 예측을 통해 구한다.
2단계: 트랜스아미나제 ATA117 돌연변이체의 발현 및 정제
SEQ ID NO: 14에 표시된 서열에 아미노산 돌연변이가 발생한 뉴클레오티드 서열을 벡터 pRSFDuet에 도입하고, 숙주 E.coli BL21를 도입한다. 이어서, LB 고체 배지에서 재조합 플라스미드를 함유한 대장균군 E.coli BL21의 단일 콜로니를 선택하고, 40ml LB 액체 배지(50μg/ml 카나마이신 항생제 함유)에 접종하고, 37℃, 220rpm에서 밤새 배양한다. 10ml의 박테리아 배양액을 500ml의 액체 LB 배지를 포함하는 2L 쉐이크 플라스크로 옮겨 2병을 접종하고, OD600 이 0.6-0.8에 도달할 때까지 37℃, 220 rpm에서 계속 배양하고, 0.2mM IPTG를 첨가하여 유도, 20℃, 200rpm에서 15h 유도 배양한다.
배양 종료 후, 1L의 발효액을 수집하고 5,000rpm에서 20min 원심분리로 세포를 수집하며, 30 mL의 니켈 칼럼 결합 완충액에서 재현탁하고, 얼음물 혼합물에 넣어 초음파 분쇄한다. 초음파 분쇄 조건은 작동5s, 멈춤 10s로 총 30min 진행한다.
분쇄 처리를 거친 혼합물을 12,000rpm에서 30min 원심분리하고, 상청액을 0.22㎛ 필터로 여과한다. 이어서, 여과된 시료를 니켈 컬럼 결합 완충액으로 미리 평형화된 2ml의 니켈 충전재에 로딩하고, 컬럼 부피의 20배인 50mM 용출 완충액으로 불순물 당백질을 세척한 다음, 5 ㎖ 250mM 이미다졸 용출 완충액으로 표적 단백질을 용출하고, 시료를 각 튜브에 500 ㎕씩 나눈다. 트랜스아미나제가 보조 인자 PLP과 결합하기 때문에 노란색으로 나타난다. 짙은 노란색 단백질액이 담긴 여러 튜브를 결합하고 단백질 용액을 2.5ml로 희석하거나 농축한 다음, 시료를 글리세롤 완충액으로 평형화된 색채분석 컬럼으로 옮긴다. 단백질 용액을 건조시킨 후, 3.5ml 글리세롤 완충 용액을 첨가하여 단백질을 용출시킴으로써 트랜스아미나제 돌연변이체 순수 단백질을 수득한다.
3 단계: (1R,2R)-AMPP 및 그 유도체 합성
100mM를 함유한 Tris-HCl buffer(pH 7.5)에 10mM 벤즈알데히드 유도체, 30mM 하이드록시피루베이트(LiHPA, 트랜스케톤 공여체), 4.8mM 티아민 피로포스페이트 (TPP, 트랜스케톤 반응 보조 인자), 18 mMMMgCl2 (트랜스케톤 반응 금속 이온), 100μM 대장균군 트랜스케톤 돌연변이를 첨가하여 50μl에 첨가하여 25 ℃에서 1-3h 반응시킨다.
상기 반응 시스템에 100mM Tris-HCl buffer(pH 7.5), 200mM D-Ala, D-글리신, D-발린, D-류신, D-이소류신, D-메티오닌, D-프롤린, D-트립토판, D-세린, D-타이로신, D-시스테인, D-페닐알라닌, D-아스파라긴, D-트레오닌, D-아스파르트산, D-글루타민산, D-라이신, D-아르기닌, D-히스티딘 또는 이소프로필아민(트랜스아민화 공여체), 2mM 피리독살인산(PLP, 아미노기 전이반응 보조 인자), 50μM 트랜스아미나제 ATA117 돌연변이체를 첨가하여 반응 시스템을 100μl로 확장하고, 25 ℃에서 3-6h 반응시켜 (1R,2R)-AMPP 및 그 유도체를 얻는다.
[표 3] 효소 캐스케이드 반응 생성물의 전환율 및 입체 선택성
실험 그룹 | 기질 | 아미노기 공여체 |
대장균 트랜스케톨라제 |
트랜스아미나제 | 전환율 | De | ee |
1 | P-메틸설포닐 벤즈알데히드 | D-알라닌 | H26Y | V69A+F122C+I157H | *** | * | ***** |
2 | P-메틸설포닐 벤즈알데히드 | D-알라닌 | H26Y+F434Y | V69A+F122C+I157H | *** | *** | ***** |
3 | P-메틸설포닐 벤즈알데히드 | D-알라닌 | H26Y+F434Y+L466H | V69A+F122C | *** | *** | ***** |
4 | P-메틸설포닐 벤즈알데히드 | D-알라닌 | H26Y+F434Y+L466H | V69A+F122C+I157H | *** | **** | ***** |
5 | P-메틸설포닐 벤즈알데히드 | D-알라닌 | H26Y+F434Y+L466H | V69A+F122C+I157H+F225H | *** | **** | ***** |
6 | P-메틸설포닐 벤즈알데히드 | 이소프로필아민 | H26Y+F434Y | V69A+F122C+I157H | *** | *** | ***** |
7 | P-메틸설포닐 벤즈알데히드 | 이소프로필아민 | H26Y+F434Y+L466H | V69A+F122C+I157H | *** | **** | ***** |
8 | 벤즈알데히드 | D-알라닌 | H26Y+F434Y | V69A+F122C+I157H | ** | *** | ***** |
9 | 벤즈알데히드 | D-알라닌 | H26Y+F434Y+L466F | V69A+F122C+I157H+F225H | ** | **** | ***** |
10 | 벤즈알데히드 | 이소프로필아민 | H26Y+F434Y | V69A+F122C+I157H | ** | *** | ***** |
11 | 벤즈알데히드 | 이소프로필아민 | H26Y+F434Y+L466F | V69A+F122C+I157H | ** | **** | ***** |
12 | P-메틸 벤즈알데히드 | D-알라닌 | H26Y+F434Y | V69A+F122C+I157H | ** | *** | ***** |
13 | P-메틸 벤즈알데히드 | D-알라닌 | H26Y+F434Y+L466F | V69A+F122C+I157H+F225H | ** | **** | ***** |
14 | P-메틸 벤즈알데히드 | 이소프로필아민 | H26Y+F434Y | V69A+F122C+I157H | ** | *** | ***** |
15 | P-메틸 벤즈알데히드 | 이소프로필아민 | H26Y+F434Y+L466F | V69A+F122C+I157H | ** | **** | ***** |
전환율이 0-40%인 *, 전환율이 40-60%인 **, 전환율이 60-80%인 ** *, 전환율이> 80%인 * * * * 이다.
de가 0-40%인 *, de가 40-70%인 **, de가 70-90%인 **, de가> 90%인 ****이다.
ee가 0-40%인 *, ee가 40-70%인 **, ee가 70-90%인 ***, ee가 90-99%인 ****, ee가> 99%인 *****이다.
본 발명의 추가 반응 생성물은 Agilent 1200형 액체 크로마토그래프 검측하며, 구체적인 검출 방법은 C18 컬럼(4.6×150mm, 입자 크기 3㎛), 칼럼 온도 30℃, 0.5ml/min, A상: H2O(10 mM KH2PO4, pH=8.5), B상: 아세토니트릴을 포함한다.
[표 4] 액체 크로마토그래피의 크로마토그래피 조건
도 4는 C18 컬럼 조건에서 p-메틸설포닐 벤즈알데히드를 기질로 하는 반응 생성물의 액상 다이어그램이다. 도 4에서, 상단은 (에리트로)-p-메틸설포닐 페닐세리놀과 (트레오)-p-메틸설포닐 페닐세리놀 표준 물질의 액상 다이어그램이며, 중간은 (1R,2R)-p-메틸설포닐 페닐세리놀, 최하단은 실험그룹 5 가 얻은 반응 생성물이다. 도 4에 도시된 바와 같이, 실험군5에서 제조한 물질은 주로 트레오이며, 공식 de=[(트레오-에리트로)/(트레오+에리트로)]×100%에 의하여 de>90%를 얻는다. 여기서, 에리트로와 트레오는 (에리트로)- 및 (트레오)-P-메틸설폰닐 페닐세리놀을 나타낸다.
액상의 피크에 따라, (트레오)-p-메틸설포닐 페닐세리놀의 생성물을 수집하고 농축한 뒤 키랄 액체상 컬럼으로 추가 원심분리하여 생성물의 거울상 선택성을 조사한다. 거울상 이성질체 분석 조건은 키랄 컬럼 IG 컬럼, 컬럼 온도 25℃, 0.5 ml/min, 224nm이고, 크로마토그래피 조건은 순수 메탄올(0.1% 디에틸아민 함유), 15분이다. 도 5는 키랄 액상 컬럼 조건에서 (에리트로)-p-메틸설포닐 페닐세리놀 생성물의 액상도이다. 도 5의 상단은 에리트로+트레오 표준 물질 대조, 두 번째 라인은 트레오 표준 물질 대조, 세 번째 라인은 (1R,2R)-p-메틸설포닐 페닐세리놀 표준 물질 대조, 네 번째이자 마지막 라인은 반응 생성물 (트레오)-p-메틸설포닐 페닐세리놀이다. 도 5에서 도시한 바와 같이, (1R,2R)-및 (1S,2S)-p-메틸설포닐 페닐세리놀의 보류 시간은 각각 5.6분 및 9.4 분이고, 공식 ee =[(RR-SS)/(RR+SS)]×100%에 따라 계산한 ee 값은 99% 보다 크다. 여기서, RR 및 SS는 (1R,2R)- 및 (1S,2S)-p-메탄설포닐 페닐세리놀을 나타낸다.
도 6 은 반응 생성물 (1R,2R)-AMPP의 수소 스펙트럼이고, 도 7 은 반응 생성물 (1R,2R)-AMPP의 탄소 스펙트럼이다. 도 6, 도 7 및 도 4, 도5의 표준 물질 대조를 통해 본 발명이 (1R,2R)-AMPP를 합성하고, de 값 및 ee 값과 결합했으며, 본 발명에서 제공하는 방법으로 제조된 (1R,2R)-AMPP의 입체선택성이 높음을 알 수 있다.
도 8은 C18 컬럼 조건에서 벤즈알데히드를 기질로 갖는 실험군9 반응 생성물의 액상 다이어그램이다. 도 8에서, 상단은 실험군9가 얻은 반응 생성물이고, 중간은 (1R,2R)-페닐세리놀의 표준 물질, 하단은 (에리트로)-페닐세리놀과 (트레오)-페닐세리놀 표준 물질이다. 도 5에 도시된 바와 같이, 실험군9에서 제조한 물질은 주로 트레오이며, 공식 de=[(트레오-에리트로)/(트레오+에리트로]×100%에 의하여 de>90%를 얻는다. 여기서, 에리트로와 트레오는 (에리트로)- 및 (트레오)-페닐세리놀을 나타낸다.
도 9는 C18 컬럼 조건에서 p-톨루알데히드를 기질로 갖는 실험군13 반응 생성물의 액상 다이어그램이다. 도 9에서, 상단는 실험군13이 얻은 반응 생성물이고, 하단은 (트레오)-P-메틸 페닐세리놀 표준 물질이다. 도 9에서 도시한 바와 같이, 실험군13이 제조한 물질이 주로 얻은 산물은 에리트로이며, 공식 de=[(트레오-에리트로)/(트레오+에리트로)]×100%에 의하여 de>90%를 얻는다. 여기서, 에리트로와 트레오는 (에리트로)- 및 (트레오)-P-메틸 페닐세리놀을 나타낸다.
대장균군 트랜스케톨라제의 아미노산 서열(SEQ ID NO:11)
1 MSSRKELANA IRALSMDAVQ KAKSGHPGAP MGMADIAEVL WRDFLKHNPQ NPSWADRDRF
61 VLSNGHGSML IYSLLHLTGY DLPMEELKNF RQLHSKTPGH PEVGYTAGVE TTTGPLGQGI
121 ANAVGMAIAE KTLAAQFNRP GHDIVDHYTY AFMGDGCMME GISHEVCSLA GTLKLGKLIA
181 FYDDNGISID GHVEGWFTDD TAMRFEAYGW HVIRDIDGHD AASIKRAVEE ARAVTDKPSL
241 LMCKTIIGFG SPNKAGTHDS HGAPLGDAEI ALTREQLGWK YAPFEIPSEI YAQWDAKEAG
301 QAKESAWNEK FAAYAKAYPQ EAAEFTRRMK GEMPSDFDAK AKEFIAKLQA NPAKIASRKA
361 SQNAIEAFGP LLPEFLGGSA DLAPYNLTLW SGSKAINEDA AGNYIHYGVR EFGMTAIANG
421 ISLHGGFLPY TSTFLMFVEY ARNAVRMAAL MKQRQVMVYT HDSIGLGETG PTHQPVEQVA
481 SLRVTPNMST WRPCDQVESA VAWKYGVERQ DGPTALILSQ QNLAQQERTE EQLANIARGG
541 YVLKDCAGQP ELIFIATGSE VELAVAAYEK LTAEGVKARV VSMPSTDAFD KQDAAYRESV
601 LPKAVTARVA VEAGIADYWY KYVGLNGAIV GMTTFGESAP AELLFEEFGF TVDNVVAKAK
661 ELL
대장균군 트랜스케톨라제의 뉴클레오티드 서열(SEQ ID NO:11)
atgtcctcacgtaaagagcttgccaatgctattcgtgcgctgagcatggacgcagtacagaaagccaaatccggtcacccgggtgcccctatgggtatggctgacattgccgaagtcctgtggcgtgatttcctgaaacacaacccgcagaatccgtcctgggctgaccgtgaccgcttcgtgctgtccaacggccacggctccatgctgatctacagcctgctgcacctcaccggttacgatctgccgatggaagaactgaaaaacttccgtcagctgcactctaaaactccgggtcacccggaagtgggttacaccgctggtgtggaaaccaccaccggtccgctgggtcagggtattgccaacgcagtcggtatggcgattgcagaaaaaacgctggcggcgcagtttaaccgtccgggccacgacattgtcgaccactacacctacgccttcatgggcgacggctgcatgatggaaggcatctcccacgaagtttgctctctggcgggtacgctgaagctgggtaaactgattgcattctacgatgacaacggtatttctatcgatggtcacgttgaaggctggttcaccgacgacaccgcaatgcgtttcgaagcttacggctggcacgttattcgcgacatcgacggtcatgacgcggcatctatcaaacgcgcagtagaagaagcgcgcgcagtgactgacaaaccttccctgctgatgtgcaaaaccatcatcggtttcggttccccgaacaaagccggtacccacgactcccacggtgcgccgctgggcgacgctgaaattgccctgacccgcgaacaactgggctggaaatatgcgccgttcgaaatcccgtctgaaatctatgctcagtgggatgcgaaagaagcaggccaggcgaaagaatccgcatggaacgagaaattcgctgcttacgcgaaagcttatccgcaggaagccgctgaatttacccgccgtatgaaaggcgaaatgccgtctgacttcgacgctaaagcgaaagagttcatcgctaaactgcaggctaatccggcgaaaatcgccagccgtaaagcgtctcagaatgctatcgaagcgttcggtccgctgttgccggaattcctcggcggttctgctgacctggcgccgtataacctgaccctgtggtctggttctaaagcaatcaacgaagatgctgcgggtaactacatccactacggtgttcgcgagttcggtatgaccgcgattgctaacggtatctccctgcacggtggcttcctgccgtacacctccaccttcctgatgttcgtggaatacgcacgtaacgccgtacgtatggctgcgctgatgaaacagcgtcaggtgatggtttacacccacgactccatcggtctgggcgaaaccggcccgactcaccagccggttgagcaggtcgcttctctgcgcgtaaccccgaacatgtctacatggcgtccgtgtgaccaggttgaatccgcggtcgcgtggaaatacggtgttgagcgtcaggacggcccgaccgcactgatcctctcccaacagaacctggcgcagcaggaacgaactgaagagcaactggcaaacatcgcgcgcggtggttatgtgctgaaagactgcgccggtcagccggaactgattttcatcgctaccggttcagaagttgaactggctgttgctgcctacgaaaaactgactgccgaaggcgtgaaagcgcgcgtggtgtccatgccgtctaccgacgcatttgacaagcaggatgctgcttaccgtgaatccgtactgccgaaagcggttactgcacgcgttgctgtagaagcgggtattgctgactactggtacaagtatgttggcctgaacggtgctatcgtcggtatgaccaccttcggtgaatctgctccggcagagctgctgtttgaagagttcggcttcactgttgataacgttgttgcgaaagcaaaagaactgctgtaa
트랜스아미나제 ATA117의 아미노산 서열(SEQ ID NO: 13)
1 MAFSADTSEI VYTHDTGLDY ITYSDYELDP ANPLAGGAAW IEGAFVPPSE ARISIFDQGY
61 LHSDVTYTVF HVWNGNAFRL DDHIERLFSN AESMRIIPPL TQDEVKEIAL ELVAKTELRE
121 AFVSVSITRG YSSTPGERDI TKHRPQVYMY AVPYQWIVPF DRIRDGVHAM VAQSVRRTPR
181 SSIDPQVKNF QWGDLIRAVQ ETHDRGFEAP LLLDGDGLLA EGSGFNVVVI KDGVVRSPGR
241 AALPGITRKT VLEIAESLGH EAILADITLA ELLDADEVLG CTTAGGVWPF VSVDGNPISD
301 GVPGPVTQSI IRRYWELNVE SSSLLTPVQY
트랜스아미나제 ATA117의 뉴클레오티드 서열
atggcatttagcgcggataccagcgaaatcgtctatacccacgataccggtctggattacatcacctacagcgattacgaactggatccggcaaatccgttagcaggcggcgcagcttggattgaaggcgcatttgttccgccgtctgaagcgcgtattagcatcttcgatcagggctatctgcatagcgacgttacctataccgtcttccacgtttggaacggtaacgcatttcgtctggacgatcacatcgaacgtctgttcagcaacgccgaaagtatgcgtattattccgccgctgacccaagacgaagtcaaagaaatcgcgctggaactggttgcaaaaaccgaactgcgcgaagcgtttgttagcgttagcattacccgcggttatagtagtaccccgggcgaacgcgatattaccaaacatcgtccgcaggtctacatgtacgctgttccgtaccagtggatcgttccgtttgatcgtattcgcgacggcgttcacgcaatggttgcacagagcgtgcgtcgtaccccgcgtagcagcatcgatccgcaggtcaaaaacttccagtggggcgatttaattcgcgcagttcaggaaacccacgatcgcggttttgaagcaccgttactgttagacggcgacggtttactggcagaaggtagcggctttaacgtcgtcgtcattaaagatggggttgttcgttctccgggtcgtgcagcattaccgggtattacccgcaaaaccgttctggaaattgcggaatccctgggtcatgaagcgattctggcggatattaccttagcggaactgctggacgcagacgaagttttaggttgtaccaccgctggcggcgtttggccgtttgttagcgttgacggcaatccgattagcgatggtgttccgggtccggttacccaaagcattattcgtcgctactgggagctgaacgttgaaagtagcagcctgttaaccccggttcagtat
본 발명이 상기와 같이 바람직한 실시예로 개시되었으나, 이는 본 발명을 제한하려는 것은 아니며, 이 기술에 익숙한 사람이라면 본 발명의 정신과 범위를 벗어나지 않는 범위 내에서 다양한 변경 및 수정을 할 수 있으므로, 본 발명의 보호 범위는 청구항에 의해 정의되어야 한다.
<110> ZHEJIANG APELOA KANGYU PHARMACEUTICAL CO., LTD.
APELOA PHARMACEUTICAL CO., LTD.
<120> CONSTRUCTION AND APPLICATIONS OF ENATIOSELECTIVE FLIPPED
w-TRANSAMINASE MUTANT
<130> 23IP08002CN
<150> CN202110162624.3
<151> 2021-02-05
<150> CN202110567238.2
<151> 2021-05-24
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 330
<212> PRT
<213> Artificial Sequence
<220>
<223> ATA117_ACHH amino acid sequence
<400> 1
Met Ala Phe Ser Ala Asp Thr Ser Glu Ile Val Tyr Thr His Asp Thr
1 5 10 15
Gly Leu Asp Tyr Ile Thr Tyr Ser Asp Tyr Glu Leu Asp Pro Ala Asn
20 25 30
Pro Leu Ala Gly Gly Ala Ala Trp Ile Glu Gly Ala Phe Val Pro Pro
35 40 45
Ser Glu Ala Arg Ile Ser Ile Phe Asp Gln Gly Tyr Leu His Ser Asp
50 55 60
Val Thr Tyr Thr Ala Phe His Val Trp Asn Gly Asn Ala Phe Arg Leu
65 70 75 80
Asp Asp His Ile Glu Arg Leu Phe Ser Asn Ala Glu Ser Met Arg Ile
85 90 95
Ile Pro Pro Leu Thr Gln Asp Glu Val Lys Glu Ile Ala Leu Glu Leu
100 105 110
Val Ala Lys Thr Glu Leu Arg Glu Ala Cys Val Ser Val Ser Ile Thr
115 120 125
Arg Gly Tyr Ser Ser Thr Pro Gly Glu Arg Asp Ile Thr Lys His Arg
130 135 140
Pro Gln Val Tyr Met Tyr Ala Val Pro Tyr Gln Trp His Val Pro Phe
145 150 155 160
Asp Arg Ile Arg Asp Gly Val His Ala Met Val Ala Gln Ser Val Arg
165 170 175
Arg Thr Pro Arg Ser Ser Ile Asp Pro Gln Val Lys Asn Phe Gln Trp
180 185 190
Gly Asp Leu Ile Arg Ala Val Gln Glu Thr His Asp Arg Gly Phe Glu
195 200 205
Ala Pro Leu Leu Leu Asp Gly Asp Gly Leu Leu Ala Glu Gly Ser Gly
210 215 220
His Asn Val Val Val Ile Lys Asp Gly Val Val Arg Ser Pro Gly Arg
225 230 235 240
Ala Ala Leu Pro Gly Ile Thr Arg Lys Thr Val Leu Glu Ile Ala Glu
245 250 255
Ser Leu Gly His Glu Ala Ile Leu Ala Asp Ile Thr Leu Ala Glu Leu
260 265 270
Leu Asp Ala Asp Glu Val Leu Gly Cys Thr Thr Ala Gly Gly Val Trp
275 280 285
Pro Phe Val Ser Val Asp Gly Asn Pro Ile Ser Asp Gly Val Pro Gly
290 295 300
Pro Val Thr Gln Ser Ile Ile Arg Arg Tyr Trp Glu Leu Asn Val Glu
305 310 315 320
Ser Ser Ser Leu Leu Thr Pro Val Gln Tyr
325 330
<210> 2
<211> 993
<212> DNA
<213> Artificial Sequence
<220>
<223> ATA117_ACHH nucleotide sequence
<400> 2
atggcattta gcgcggatac cagcgaaatc gtctataccc acgataccgg tctggattac 60
atcacctaca gcgattacga actggatccg gcaaatccgt tagcaggcgg cgcagcttgg 120
attgaaggcg catttgttcc gccgtctgaa gcgcgtatta gcatcttcga tcagggctat 180
ctgcatagcg acgttaccta taccgcattc cacgtttgga acggtaacgc atttcgtctg 240
gacgatcaca tcgaacgtct gttcagcaac gccgaaagta tgcgtattat tccgccgctg 300
acccaagacg aagtcaaaga aatcgcgctg gaactggttg caaaaaccga actgcgcgaa 360
gcgtgtgtta gcgttagcat tacccgcggt tatagtagta ccccgggcga acgcgatatt 420
accaaacatc gtccgcaggt ctacatgtac gctgttccgt accagtggca tgttccgttt 480
gatcgtattc gcgacggcgt tcacgcaatg gttgcacaga gcgtgcgtcg taccccgcgt 540
agcagcatcg atccgcaggt caaaaacttc cagtggggcg atttaattcg cgcagttcag 600
gaaacccacg atcgcggttt tgaagcaccg ttactgttag acggcgacgg tttactggca 660
gaaggtagcg gccataacgt cgtcgtcatt aaagatgggg ttgttcgttc tccgggtcgt 720
gcagcattac cgggtattac ccgcaaaacc gttctggaaa ttgcggaatc cctgggtcat 780
gaagcgattc tggcggatat taccttagcg gaactgctgg acgcagacga agttttaggt 840
tgtaccaccg ctggcggcgt ttggccgttt gttagcgttg acggcaatcc gattagcgat 900
ggtgttccgg gtccggttac ccaaagcatt attcgtcgct actgggagct gaacgttgaa 960
agtagcagcc tgttaacccc ggttcagtat taa 993
<210> 3
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> VN-F
<220>
<221> misc_feature
<222> (19)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (20)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (21)
<223> k is t or g
<400> 3
agcgacgtta cctataccnn kttccacgtt tggaacggta acgca 45
<210> 4
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> VN-R
<220>
<221> misc_feature
<222> (19)
<223> m is a or c
<220>
<221> misc_feature
<222> (20)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (21)
<223> n is a, c, g or t
<400> 4
accgttccaa acgtggaamn nggtataggt aacgtcgcta tgcag 45
<210> 5
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> FN-F
<220>
<221> misc_feature
<222> (19)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (20)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (21)
<223> k is t or g
<400> 5
accgaactgc gcgaagcgnn kgttagcgtt agcattaccc gcggt 45
<210> 6
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> FN-R
<220>
<221> misc_feature
<222> (19)
<223> m is a or c
<220>
<221> misc_feature
<222> (20)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (21)
<223> n is a, c, g or t
<400> 6
ggtaatgcta acgctaacmn ncgcttcgcg cagttcggtt tttgc 45
<210> 7
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> IN-F
<220>
<221> misc_feature
<222> (19)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (20)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (21)
<223> k is t or g
<400> 7
gctgttccgt accagtggnn kgttccgttt gatcgtattc gcgac 45
<210> 8
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> IN-R
<220>
<221> misc_feature
<222> (19)
<223> m is a or c
<220>
<221> misc_feature
<222> (20)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (21)
<223> n is a, c, g or t
<400> 8
aatacgatca aacggaacmn nccactggta cggaacagcg tacat 45
<210> 9
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> FN-F
<220>
<221> misc_feature
<222> (19)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (20)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (21)
<223> k is t or g
<400> 9
ctggcagaag gtagcggcnn kaacgtcgtc gtcattaaag atggg 45
<210> 10
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> FN-R
<220>
<221> misc_feature
<222> (19)
<223> m is a or c
<220>
<221> misc_feature
<222> (20)
<223> n is a, c, g or t
<220>
<221> misc_feature
<222> (21)
<223> n is a, c, g or t
<400> 10
tttaatgacg acgacgttmn ngccgctacc ttctgccagt aaacc 45
<210> 11
<211> 663
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Escherichia coli transketolase
<400> 11
Met Ser Ser Arg Lys Glu Leu Ala Asn Ala Ile Arg Ala Leu Ser Met
1 5 10 15
Asp Ala Val Gln Lys Ala Lys Ser Gly His Pro Gly Ala Pro Met Gly
20 25 30
Met Ala Asp Ile Ala Glu Val Leu Trp Arg Asp Phe Leu Lys His Asn
35 40 45
Pro Gln Asn Pro Ser Trp Ala Asp Arg Asp Arg Phe Val Leu Ser Asn
50 55 60
Gly His Gly Ser Met Leu Ile Tyr Ser Leu Leu His Leu Thr Gly Tyr
65 70 75 80
Asp Leu Pro Met Glu Glu Leu Lys Asn Phe Arg Gln Leu His Ser Lys
85 90 95
Thr Pro Gly His Pro Glu Val Gly Tyr Thr Ala Gly Val Glu Thr Thr
100 105 110
Thr Gly Pro Leu Gly Gln Gly Ile Ala Asn Ala Val Gly Met Ala Ile
115 120 125
Ala Glu Lys Thr Leu Ala Ala Gln Phe Asn Arg Pro Gly His Asp Ile
130 135 140
Val Asp His Tyr Thr Tyr Ala Phe Met Gly Asp Gly Cys Met Met Glu
145 150 155 160
Gly Ile Ser His Glu Val Cys Ser Leu Ala Gly Thr Leu Lys Leu Gly
165 170 175
Lys Leu Ile Ala Phe Tyr Asp Asp Asn Gly Ile Ser Ile Asp Gly His
180 185 190
Val Glu Gly Trp Phe Thr Asp Asp Thr Ala Met Arg Phe Glu Ala Tyr
195 200 205
Gly Trp His Val Ile Arg Asp Ile Asp Gly His Asp Ala Ala Ser Ile
210 215 220
Lys Arg Ala Val Glu Glu Ala Arg Ala Val Thr Asp Lys Pro Ser Leu
225 230 235 240
Leu Met Cys Lys Thr Ile Ile Gly Phe Gly Ser Pro Asn Lys Ala Gly
245 250 255
Thr His Asp Ser His Gly Ala Pro Leu Gly Asp Ala Glu Ile Ala Leu
260 265 270
Thr Arg Glu Gln Leu Gly Trp Lys Tyr Ala Pro Phe Glu Ile Pro Ser
275 280 285
Glu Ile Tyr Ala Gln Trp Asp Ala Lys Glu Ala Gly Gln Ala Lys Glu
290 295 300
Ser Ala Trp Asn Glu Lys Phe Ala Ala Tyr Ala Lys Ala Tyr Pro Gln
305 310 315 320
Glu Ala Ala Glu Phe Thr Arg Arg Met Lys Gly Glu Met Pro Ser Asp
325 330 335
Phe Asp Ala Lys Ala Lys Glu Phe Ile Ala Lys Leu Gln Ala Asn Pro
340 345 350
Ala Lys Ile Ala Ser Arg Lys Ala Ser Gln Asn Ala Ile Glu Ala Phe
355 360 365
Gly Pro Leu Leu Pro Glu Phe Leu Gly Gly Ser Ala Asp Leu Ala Pro
370 375 380
Tyr Asn Leu Thr Leu Trp Ser Gly Ser Lys Ala Ile Asn Glu Asp Ala
385 390 395 400
Ala Gly Asn Tyr Ile His Tyr Gly Val Arg Glu Phe Gly Met Thr Ala
405 410 415
Ile Ala Asn Gly Ile Ser Leu His Gly Gly Phe Leu Pro Tyr Thr Ser
420 425 430
Thr Phe Leu Met Phe Val Glu Tyr Ala Arg Asn Ala Val Arg Met Ala
435 440 445
Ala Leu Met Lys Gln Arg Gln Val Met Val Tyr Thr His Asp Ser Ile
450 455 460
Gly Leu Gly Glu Thr Gly Pro Thr His Gln Pro Val Glu Gln Val Ala
465 470 475 480
Ser Leu Arg Val Thr Pro Asn Met Ser Thr Trp Arg Pro Cys Asp Gln
485 490 495
Val Glu Ser Ala Val Ala Trp Lys Tyr Gly Val Glu Arg Gln Asp Gly
500 505 510
Pro Thr Ala Leu Ile Leu Ser Gln Gln Asn Leu Ala Gln Gln Glu Arg
515 520 525
Thr Glu Glu Gln Leu Ala Asn Ile Ala Arg Gly Gly Tyr Val Leu Lys
530 535 540
Asp Cys Ala Gly Gln Pro Glu Leu Ile Phe Ile Ala Thr Gly Ser Glu
545 550 555 560
Val Glu Leu Ala Val Ala Ala Tyr Glu Lys Leu Thr Ala Glu Gly Val
565 570 575
Lys Ala Arg Val Val Ser Met Pro Ser Thr Asp Ala Phe Asp Lys Gln
580 585 590
Asp Ala Ala Tyr Arg Glu Ser Val Leu Pro Lys Ala Val Thr Ala Arg
595 600 605
Val Ala Val Glu Ala Gly Ile Ala Asp Tyr Trp Tyr Lys Tyr Val Gly
610 615 620
Leu Asn Gly Ala Ile Val Gly Met Thr Thr Phe Gly Glu Ser Ala Pro
625 630 635 640
Ala Glu Leu Leu Phe Glu Glu Phe Gly Phe Thr Val Asp Asn Val Val
645 650 655
Ala Lys Ala Lys Glu Leu Leu
660
<210> 12
<211> 1992
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of E. coli transketolase
<400> 12
atgtcctcac gtaaagagct tgccaatgct attcgtgcgc tgagcatgga cgcagtacag 60
aaagccaaat ccggtcaccc gggtgcccct atgggtatgg ctgacattgc cgaagtcctg 120
tggcgtgatt tcctgaaaca caacccgcag aatccgtcct gggctgaccg tgaccgcttc 180
gtgctgtcca acggccacgg ctccatgctg atctacagcc tgctgcacct caccggttac 240
gatctgccga tggaagaact gaaaaacttc cgtcagctgc actctaaaac tccgggtcac 300
ccggaagtgg gttacaccgc tggtgtggaa accaccaccg gtccgctggg tcagggtatt 360
gccaacgcag tcggtatggc gattgcagaa aaaacgctgg cggcgcagtt taaccgtccg 420
ggccacgaca ttgtcgacca ctacacctac gccttcatgg gcgacggctg catgatggaa 480
ggcatctccc acgaagtttg ctctctggcg ggtacgctga agctgggtaa actgattgca 540
ttctacgatg acaacggtat ttctatcgat ggtcacgttg aaggctggtt caccgacgac 600
accgcaatgc gtttcgaagc ttacggctgg cacgttattc gcgacatcga cggtcatgac 660
gcggcatcta tcaaacgcgc agtagaagaa gcgcgcgcag tgactgacaa accttccctg 720
ctgatgtgca aaaccatcat cggtttcggt tccccgaaca aagccggtac ccacgactcc 780
cacggtgcgc cgctgggcga cgctgaaatt gccctgaccc gcgaacaact gggctggaaa 840
tatgcgccgt tcgaaatccc gtctgaaatc tatgctcagt gggatgcgaa agaagcaggc 900
caggcgaaag aatccgcatg gaacgagaaa ttcgctgctt acgcgaaagc ttatccgcag 960
gaagccgctg aatttacccg ccgtatgaaa ggcgaaatgc cgtctgactt cgacgctaaa 1020
gcgaaagagt tcatcgctaa actgcaggct aatccggcga aaatcgccag ccgtaaagcg 1080
tctcagaatg ctatcgaagc gttcggtccg ctgttgccgg aattcctcgg cggttctgct 1140
gacctggcgc cgtataacct gaccctgtgg tctggttcta aagcaatcaa cgaagatgct 1200
gcgggtaact acatccacta cggtgttcgc gagttcggta tgaccgcgat tgctaacggt 1260
atctccctgc acggtggctt cctgccgtac acctccacct tcctgatgtt cgtggaatac 1320
gcacgtaacg ccgtacgtat ggctgcgctg atgaaacagc gtcaggtgat ggtttacacc 1380
cacgactcca tcggtctggg cgaaaccggc ccgactcacc agccggttga gcaggtcgct 1440
tctctgcgcg taaccccgaa catgtctaca tggcgtccgt gtgaccaggt tgaatccgcg 1500
gtcgcgtgga aatacggtgt tgagcgtcag gacggcccga ccgcactgat cctctcccaa 1560
cagaacctgg cgcagcagga acgaactgaa gagcaactgg caaacatcgc gcgcggtggt 1620
tatgtgctga aagactgcgc cggtcagccg gaactgattt tcatcgctac cggttcagaa 1680
gttgaactgg ctgttgctgc ctacgaaaaa ctgactgccg aaggcgtgaa agcgcgcgtg 1740
gtgtccatgc cgtctaccga cgcatttgac aagcaggatg ctgcttaccg tgaatccgta 1800
ctgccgaaag cggttactgc acgcgttgct gtagaagcgg gtattgctga ctactggtac 1860
aagtatgttg gcctgaacgg tgctatcgtc ggtatgacca ccttcggtga atctgctccg 1920
gcagagctgc tgtttgaaga gttcggcttc actgttgata acgttgttgc gaaagcaaaa 1980
gaactgctgt aa 1992
<210> 13
<211> 330
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of the transaminase ATA117
<400> 13
Met Ala Phe Ser Ala Asp Thr Ser Glu Ile Val Tyr Thr His Asp Thr
1 5 10 15
Gly Leu Asp Tyr Ile Thr Tyr Ser Asp Tyr Glu Leu Asp Pro Ala Asn
20 25 30
Pro Leu Ala Gly Gly Ala Ala Trp Ile Glu Gly Ala Phe Val Pro Pro
35 40 45
Ser Glu Ala Arg Ile Ser Ile Phe Asp Gln Gly Tyr Leu His Ser Asp
50 55 60
Val Thr Tyr Thr Val Phe His Val Trp Asn Gly Asn Ala Phe Arg Leu
65 70 75 80
Asp Asp His Ile Glu Arg Leu Phe Ser Asn Ala Glu Ser Met Arg Ile
85 90 95
Ile Pro Pro Leu Thr Gln Asp Glu Val Lys Glu Ile Ala Leu Glu Leu
100 105 110
Val Ala Lys Thr Glu Leu Arg Glu Ala Phe Val Ser Val Ser Ile Thr
115 120 125
Arg Gly Tyr Ser Ser Thr Pro Gly Glu Arg Asp Ile Thr Lys His Arg
130 135 140
Pro Gln Val Tyr Met Tyr Ala Val Pro Tyr Gln Trp Ile Val Pro Phe
145 150 155 160
Asp Arg Ile Arg Asp Gly Val His Ala Met Val Ala Gln Ser Val Arg
165 170 175
Arg Thr Pro Arg Ser Ser Ile Asp Pro Gln Val Lys Asn Phe Gln Trp
180 185 190
Gly Asp Leu Ile Arg Ala Val Gln Glu Thr His Asp Arg Gly Phe Glu
195 200 205
Ala Pro Leu Leu Leu Asp Gly Asp Gly Leu Leu Ala Glu Gly Ser Gly
210 215 220
Phe Asn Val Val Val Ile Lys Asp Gly Val Val Arg Ser Pro Gly Arg
225 230 235 240
Ala Ala Leu Pro Gly Ile Thr Arg Lys Thr Val Leu Glu Ile Ala Glu
245 250 255
Ser Leu Gly His Glu Ala Ile Leu Ala Asp Ile Thr Leu Ala Glu Leu
260 265 270
Leu Asp Ala Asp Glu Val Leu Gly Cys Thr Thr Ala Gly Gly Val Trp
275 280 285
Pro Phe Val Ser Val Asp Gly Asn Pro Ile Ser Asp Gly Val Pro Gly
290 295 300
Pro Val Thr Gln Ser Ile Ile Arg Arg Tyr Trp Glu Leu Asn Val Glu
305 310 315 320
Ser Ser Ser Leu Leu Thr Pro Val Gln Tyr
325 330
<210> 14
<211> 990
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the transaminase ATA117
<400> 14
atggcattta gcgcggatac cagcgaaatc gtctataccc acgataccgg tctggattac 60
atcacctaca gcgattacga actggatccg gcaaatccgt tagcaggcgg cgcagcttgg 120
attgaaggcg catttgttcc gccgtctgaa gcgcgtatta gcatcttcga tcagggctat 180
ctgcatagcg acgttaccta taccgtcttc cacgtttgga acggtaacgc atttcgtctg 240
gacgatcaca tcgaacgtct gttcagcaac gccgaaagta tgcgtattat tccgccgctg 300
acccaagacg aagtcaaaga aatcgcgctg gaactggttg caaaaaccga actgcgcgaa 360
gcgtttgtta gcgttagcat tacccgcggt tatagtagta ccccgggcga acgcgatatt 420
accaaacatc gtccgcaggt ctacatgtac gctgttccgt accagtggat cgttccgttt 480
gatcgtattc gcgacggcgt tcacgcaatg gttgcacaga gcgtgcgtcg taccccgcgt 540
agcagcatcg atccgcaggt caaaaacttc cagtggggcg atttaattcg cgcagttcag 600
gaaacccacg atcgcggttt tgaagcaccg ttactgttag acggcgacgg tttactggca 660
gaaggtagcg gctttaacgt cgtcgtcatt aaagatgggg ttgttcgttc tccgggtcgt 720
gcagcattac cgggtattac ccgcaaaacc gttctggaaa ttgcggaatc cctgggtcat 780
gaagcgattc tggcggatat taccttagcg gaactgctgg acgcagacga agttttaggt 840
tgtaccaccg ctggcggcgt ttggccgttt gttagcgttg acggcaatcc gattagcgat 900
ggtgttccgg gtccggttac ccaaagcatt attcgtcgct actgggagct gaacgttgaa 960
agtagcagcc tgttaacccc ggttcagtat 990
Claims (11)
- ω-트랜스아미나제 ATA117 돌연변이체의 단백질 아미노산 서열이 SEQ ID NO: 1인 것을 특징으로 하는 거울상 선택성으로 뒤집힌 ω-트랜스아미나제 ATA117 돌연변이체.
- 청구항 1에 있어서, 상기 ω-트랜스아미나제 ATA117 돌연변이체의 아미노산 서열이 반복 포화 돌연변이에 의해 생성되고, 상기 ω-트랜스아미나제 ATA117이 위치 N1에서 발린, 위치 N2에서 페닐알라닌, 위치 N3에서 이소류신 및 위치 N4에서 페닐알라닌 중 적어도 하나의 돌연변이를 갖는 것을 특징으로 하는 ω-트랜스 아미나제 ATA117 돌연변이체.
- 청구항 2에 있어서, 위치 N1의 발린이 알라닌으로 돌연변이되고, 위치 N2의 페닐알라닌이 시스테인으로 돌연변이되며, 위치 N3의 이소류신이 히스티딘으로 돌연변이 되고, 위치 N4의 페닐알라닌이 히스티딘으로 돌연변이되는 것을 특징으로 하는 ω-트랜스아미나제 ATA117 돌연변이체.
- 청구항 2의 ω-트랜스아미나제 ATA117 돌연변이체를 암호화하는 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 DNA 뉴클레오티드 서열.
- 청구항 4에 있어서, 상기 DNA 뉴클레오티드 서열이 SEQ ID NO: 2와도 같은 것을 특징으로 하는 DNA 뉴클레오티드 서열.
- 청구항 5항에서 서술한 DNA 뉴클레오티드 서열을 운반하는 플라스미드.
- ω-트랜스아미나제 ATA117 돌연변이체의 단백질 아미노산 서열이 SEQ ID NO: 1와 같은 것을 특징으로 하는 ω-트랜스아미나제 ATA117 돌연변이체를 발현하는 유전자 조작 박테리아.
- A1, ATA117 코드를 가진 유전자의 재조합 플라스미드를 주형으로 사용하는 단계;
A2. 돌연변이를 포함하는 프라이머를 설계 및 합성하는 단계;
A3. 역 PCR로 전체 플라스미드 증폭하는 단계;
A4. PCR 생성물을 발현 숙주로 변환하는 단계를 포함하는 것을 특징으로 하는 청구항 7에 따른 ω-트랜스아미나제 ATA117 돌연변이체를 발현하는 유전자 조작 박테리아의 구성 방법. - 청구항 8에 있어서, 상기 발현 숙주가 E.coli BL21(DE3)인 것을 특징으로 하는 ω-트랜스아미나제 ATA117 돌연변이체를 발현하는 유전자 조작 박테리아의 구성 방법.
- 청구항 1에서 서술한 ω-트랜스아미나제 ATA117 돌연변이체를 기반으로, 상기 ω-트랜스아미나제 ATA117 돌연변이체 순수 단백질을 촉매제로 사용하여 완충 시스템에서 라세미 1,3-디하이드록시-1-p-메틸설포닐 페닐프로파논1을 촉매하고, 광학분할을 통해 높은 입체 선택성 (1R,2R)-1,3-디하이드록시-2-아미노-1-p-메틸 폰실페닐프로판2b를 구하는 (1R,2R)-1,3-디하이드록시-2-아미노-1-p-메틸설포닐 페닐프로판 2b 제조 방법.
- 상기 트랜스아미나제 돌연변이체는 SEQ ID NO: 13에 표시된 서열에서 아미노산 돌연변이가 발생하는 서열을 가지고, 상기 아미노산 돌연변이가 발생하는 부위는 다음가 같은 임의의 조합 돌연변이 부위인 것을 특징으로 하는 트랜스아미나제 돌연변이체:
V69F, V69G, V69A, V69L, V69I, V69P, V69M, V69W, V69S, V69Q, V69T, V69C, V69N, V69Y, V69D, V69E, V69K, V69R, V69H, V69A+F122G, V69A+F122A, V69A+F122L, V69A+F122I, V69A+F122V, V69A+F122P, V69A+F122M, V69A+F122W, V69A+F122S, V69A+F122Q, V69A+F122T, V69A+F122C, V69A+F122N, V69A+F122Y, V69A+F122D, V69A+F122E, V69A+F122K, V69A+F122R, V69A+F122H, V69A+F122C+I157F, V69A+F122C+I157G, V69A+F122C+I157A, V69A+F122C+I157L, V69A+F122C+I157I, V69A+F122C+I157V, V69A+F122C+I157P, V69A+F122C+I157M, V69A+F122C+I157W, V69A+F122C+I157S, V69A+F122C+I157Q, V69A+F122C+I157T, V69A+F122C+I157C, V69A+F122C+I157N, V69A+F122C+I157Y, V69A+F122C+I157D, V69A+F122C+I157E, V69A+F122C+I157K, V69A+F122C+I157R, V69A+F122C+I157H, V69A+F122C+I157H+F225G, V69A+F122C+I157H+F225A, V69A+F122C+I157H+F225L, V69A+F122C+I157H+F225I, V69A+F122C+I157H+F225V, V69A+F122C+I157H+F225P, V69A+F122C+I157H+F225M, V69A+F122C+I157H+F225W, V69A+F122C+I157H+F225S, V69A+F122C+I157H+F225Q, V69A+F122C+I157H+F225T, V69A+F122C+I157H+F225C, V69A+F122C+I157H+F225N, V69A+F122C+I157H+F225Y, V69A+F122C+I157H+F225D, V69A+F122C+I157H+F225E,V69A+F122C+I157H+F225K, V69A+F122C+I157H+F225R, V69A+F122C+I157H+F225H.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110162624.3 | 2021-02-05 | ||
CN202110162624.3A CN114875005B (zh) | 2021-02-05 | 2021-02-05 | 一种对映选择性翻转的ω-转氨酶突变体的构建及应用 |
CN202110567238.2 | 2021-05-24 | ||
CN202110567238 | 2021-05-24 | ||
PCT/CN2022/074737 WO2022166838A1 (zh) | 2021-02-05 | 2022-01-28 | 一种对映选择性翻转的ω-转氨酶突变体的构建及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230137443A true KR20230137443A (ko) | 2023-10-04 |
Family
ID=82740921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237029776A KR20230137443A (ko) | 2021-02-05 | 2022-01-28 | 거울상 선택성으로 뒤집힌 ω-트랜스아미나제 돌연변이체의 구성 및 적용 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP4289946A1 (ko) |
KR (1) | KR20230137443A (ko) |
CN (1) | CN117043323A (ko) |
BR (1) | BR112023015759A2 (ko) |
CL (1) | CL2023002311A1 (ko) |
MX (1) | MX2023009213A (ko) |
WO (1) | WO2022166838A1 (ko) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2448816T3 (es) * | 2009-02-26 | 2014-03-17 | Codexis, Inc. | Biocatalizadores de transaminasa |
WO2011005477A1 (en) * | 2009-06-22 | 2011-01-13 | Codexis, Inc. | Transaminase reactions |
CN103608355B (zh) * | 2011-06-24 | 2016-06-29 | 默沙东公司 | 固定化转氨酶和生产及使用固定化转氨酶的方法 |
GB201412545D0 (en) * | 2014-07-15 | 2014-08-27 | Univ Manchester The And Manchester Metropolitan University | Enzymatic processes and uses |
CN109486787A (zh) * | 2018-12-23 | 2019-03-19 | 尚科生物医药(上海)有限公司 | 一种pH稳定性提高的转氨酶突变体 |
CN109735583A (zh) * | 2019-03-21 | 2019-05-10 | 浙江工业大学 | 一种单一转氨酶催化级联反应不对称合成l-草铵膦的方法 |
CN110747181B (zh) * | 2019-11-27 | 2021-05-28 | 江南大学 | 一种ω-转氨酶突变体及其在生产手性芳香胺中的应用 |
CN111454971B (zh) * | 2020-03-23 | 2022-11-11 | 天津大学 | 一种提高手性胺转化率的方法 |
-
2022
- 2022-01-28 CN CN202280019985.5A patent/CN117043323A/zh active Pending
- 2022-01-28 KR KR1020237029776A patent/KR20230137443A/ko unknown
- 2022-01-28 EP EP22749117.2A patent/EP4289946A1/en active Pending
- 2022-01-28 WO PCT/CN2022/074737 patent/WO2022166838A1/zh active Application Filing
- 2022-01-28 MX MX2023009213A patent/MX2023009213A/es unknown
- 2022-01-28 BR BR112023015759A patent/BR112023015759A2/pt unknown
-
2023
- 2023-08-04 CL CL2023002311A patent/CL2023002311A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
BR112023015759A2 (pt) | 2023-11-21 |
CL2023002311A1 (es) | 2024-04-26 |
EP4289946A1 (en) | 2023-12-13 |
MX2023009213A (es) | 2023-08-22 |
WO2022166838A1 (zh) | 2022-08-11 |
CN117043323A (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Slabu et al. | Discovery, engineering, and synthetic application of transaminase biocatalysts | |
Liu et al. | Efficient biosynthesis of L-phenylglycine by an engineered Escherichia coli with a tunable multi-enzyme-coordinate expression system | |
Akita et al. | Artificial thermostable D-amino acid dehydrogenase: Creation and application | |
Li et al. | Exploration of transaminase diversity for the oxidative conversion of natural amino acids into 2-ketoacids and high-value chemicals | |
CN108410831B (zh) | 酮酸还原酶、基因、工程菌及在合成手性芳香2-羟酸中的应用 | |
Wang et al. | Engineering of Cascade Reactions and Alditol Oxidase for High‐Yielding Synthesis of (R)‐Phenylethanolamine from Styrene, l‐Phenylalanine, Glycerol or Glucose | |
CN113322291A (zh) | 一种手性氨基醇类化合物的合成方法 | |
CN114875005B (zh) | 一种对映选择性翻转的ω-转氨酶突变体的构建及应用 | |
KR20230137443A (ko) | 거울상 선택성으로 뒤집힌 ω-트랜스아미나제 돌연변이체의 구성 및 적용 | |
CN114908129B (zh) | 用于制备(r)-4-氯-3-羟基丁酸乙酯的脱氢酶 | |
CN114350631B (zh) | 草铵膦脱氢酶突变体、工程菌、固定化细胞及应用 | |
CN109593739A (zh) | 重组酮酸还原酶突变体、基因、工程菌及其应用 | |
Zhang et al. | Efficient biosynthesis of enantiopure tolvaptan by utilizing alcohol dehydrogenase-catalyzed enantioselective reduction | |
CN105950595B (zh) | (-)-γ-内酰胺酶、基因、突变体、载体及其制备与应用 | |
Gaggero | Building up quaternary stereocenters through biocatalyzed direct insertion of carbon nucleophiles on ketones | |
WO2022166843A1 (zh) | 一种高立体选择性r转酮酶突变体及其编码基因和应用 | |
KR20230137995A (ko) | 효소 캐스케이드 반응을 이용한 (1r,2r)-ampp 합성 방법 | |
CN112746066B (zh) | 一种l-赖氨酸脱羧酶突变体及其应用 | |
KR20210003816A (ko) | 유전자 조작 박테리아 및 단삼소 생산에서 이의 응용 | |
WO2010047188A1 (ja) | L-及びd-脂肪族アミノ酸水酸化物の製造方法 | |
CN114774491B (zh) | 制备(2s,3r)-2-(邻苯二甲酰亚胺基甲基)-3-羟基丁酸酯的方法 | |
CN108949646B (zh) | 一种可联产丹参素和丙氨酸的工程菌及其应用 | |
US20220204949A1 (en) | Gene mining method combining functional sequence and structure simulation, nadh-preferring phosphinothricin dehydrogenase mutant and application thereof | |
Asano et al. | Exploiting Natural Diversity for Industrial Enzymatic Applications | |
CN117210431A (zh) | 一种热稳定性转氨酶突变体及其工程菌与应用 |