KR102488647B1 - 마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물 - Google Patents
마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물 Download PDFInfo
- Publication number
- KR102488647B1 KR102488647B1 KR1020220077357A KR20220077357A KR102488647B1 KR 102488647 B1 KR102488647 B1 KR 102488647B1 KR 1020220077357 A KR1020220077357 A KR 1020220077357A KR 20220077357 A KR20220077357 A KR 20220077357A KR 102488647 B1 KR102488647 B1 KR 102488647B1
- Authority
- KR
- South Korea
- Prior art keywords
- alkyl
- macrocosine
- formula
- carboxylic acid
- compound
- Prior art date
Links
- -1 carboxylic acid compound Chemical class 0.000 title claims abstract description 131
- 238000000034 method Methods 0.000 title claims abstract description 41
- MQGFYNRGFWXAKA-GXSYYHJRSA-N Micrococcin Chemical compound C[C@H](O)CNC(=O)C(=C/C)/NC(=O)C1=CSC(C=2N=C(SC=2)C=2N=C3C=4N=C(SC=4)[C@H]([C@@H](C)O)NC(=O)C=4N=C(SC=4)[C@@H](C(C)C)NC(=O)C=4N=C(SC=4)C(=C/C)/NC(=O)[C@H]([C@@H](C)O)NC(=O)C=4N=C(SC=4)C3=CC=2)=N1 MQGFYNRGFWXAKA-GXSYYHJRSA-N 0.000 title description 4
- 108010009882 micrococcin Proteins 0.000 title description 4
- MQGFYNRGFWXAKA-TWSKATCCSA-N micrococcin P1 Natural products CC=C(NC(=O)c1csc(n1)c2csc(n2)c3ccc4c5nc(cs5)C(=O)N[C@@H]([C@@H](C)O)C(=O)NC(=CC)c6nc(cs6)C(=O)N[C@@H](C(C)C)c7nc(cs7)C(=O)N[C@@H]([C@@H](C)O)c8nc(cs8)c4n3)C(=O)NC[C@@H](C)O MQGFYNRGFWXAKA-TWSKATCCSA-N 0.000 title description 4
- 150000001875 compounds Chemical class 0.000 claims description 106
- 229910052739 hydrogen Inorganic materials 0.000 claims description 57
- 239000001257 hydrogen Substances 0.000 claims description 57
- 125000000008 (C1-C10) alkyl group Chemical group 0.000 claims description 52
- 125000000217 alkyl group Chemical group 0.000 claims description 44
- 108090000623 proteins and genes Proteins 0.000 claims description 40
- 150000002431 hydrogen Chemical class 0.000 claims description 36
- 125000001072 heteroaryl group Chemical group 0.000 claims description 34
- 125000000753 cycloalkyl group Chemical group 0.000 claims description 25
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 25
- 239000013604 expression vector Substances 0.000 claims description 23
- 244000063299 Bacillus subtilis Species 0.000 claims description 17
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 17
- 229910000000 metal hydroxide Inorganic materials 0.000 claims description 15
- 150000004692 metal hydroxides Chemical class 0.000 claims description 15
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims description 14
- 229910005965 SO 2 Inorganic materials 0.000 claims description 14
- 125000004414 alkyl thio group Chemical group 0.000 claims description 14
- 125000004435 hydrogen atom Chemical group [H]* 0.000 claims description 14
- 125000003118 aryl group Chemical group 0.000 claims description 13
- 125000006374 C2-C10 alkenyl group Chemical group 0.000 claims description 11
- 229910052736 halogen Inorganic materials 0.000 claims description 11
- 150000002367 halogens Chemical class 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 229910052760 oxygen Inorganic materials 0.000 claims description 11
- 230000001131 transforming effect Effects 0.000 claims description 10
- 125000000027 (C1-C10) alkoxy group Chemical group 0.000 claims description 9
- 229910052717 sulfur Inorganic materials 0.000 claims description 9
- 229930014626 natural product Natural products 0.000 claims description 8
- 125000004390 alkyl sulfonyl group Chemical group 0.000 claims description 6
- 125000004397 aminosulfonyl group Chemical group NS(=O)(=O)* 0.000 claims description 6
- 125000004453 alkoxycarbonyl group Chemical group 0.000 claims description 5
- 125000004448 alkyl carbonyl group Chemical group 0.000 claims description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 5
- 125000006832 (C1-C10) alkylene group Chemical group 0.000 claims description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 claims description 4
- 125000002947 alkylene group Chemical group 0.000 claims description 4
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 claims description 4
- 229910052783 alkali metal Inorganic materials 0.000 claims description 3
- 150000001340 alkali metals Chemical class 0.000 claims description 3
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 claims description 2
- 125000000229 (C1-C4)alkoxy group Chemical group 0.000 claims description 2
- 229910052784 alkaline earth metal Inorganic materials 0.000 claims description 2
- 150000001342 alkaline earth metals Chemical class 0.000 claims description 2
- 229910052751 metal Inorganic materials 0.000 claims description 2
- 239000002184 metal Substances 0.000 claims description 2
- 125000000524 functional group Chemical group 0.000 abstract description 11
- 125000002843 carboxylic acid group Chemical group 0.000 abstract description 5
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 78
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 36
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 27
- 239000013612 plasmid Substances 0.000 description 26
- 239000000243 solution Substances 0.000 description 25
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 23
- 239000013598 vector Substances 0.000 description 23
- 238000002360 preparation method Methods 0.000 description 21
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 20
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 19
- 230000002829 reductive effect Effects 0.000 description 19
- 239000000126 substance Substances 0.000 description 19
- 238000005481 NMR spectroscopy Methods 0.000 description 17
- 239000007787 solid Substances 0.000 description 17
- 108091092584 GDNA Proteins 0.000 description 16
- 229920006395 saturated elastomer Polymers 0.000 description 16
- 125000004432 carbon atom Chemical group C* 0.000 description 15
- 239000012044 organic layer Substances 0.000 description 15
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 14
- 125000000623 heterocyclic group Chemical group 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 14
- 230000003115 biocidal effect Effects 0.000 description 13
- 238000004440 column chromatography Methods 0.000 description 13
- 229910052757 nitrogen Inorganic materials 0.000 description 13
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 12
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 12
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 12
- XLMXLFRJEYNHMO-JMMJCSMWSA-N Micrococcin P2 Natural products CC=C(NC(=O)c1csc(n1)c2csc(n2)c3ccc4c5nc(cs5)C(=O)N[C@@H]([C@@H](C)O)C(=O)NC(=CC)c6nc(cs6)C(=O)N[C@@H](C(C)C)c7nc(cs7)C(=O)N[C@@H]([C@@H](C)O)c8nc(cs8)c4n3)C(=O)NCC(=O)C XLMXLFRJEYNHMO-JMMJCSMWSA-N 0.000 description 12
- 230000001851 biosynthetic effect Effects 0.000 description 11
- 238000003756 stirring Methods 0.000 description 11
- 239000000463 material Substances 0.000 description 10
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 9
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 9
- 125000005842 heteroatom Chemical group 0.000 description 9
- 125000001424 substituent group Chemical group 0.000 description 9
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 8
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 8
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 8
- 239000003242 anti bacterial agent Substances 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 241000193830 Bacillus <bacterium> Species 0.000 description 7
- 238000007865 diluting Methods 0.000 description 7
- KDLHZDBZIXYQEI-UHFFFAOYSA-N palladium Substances [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 7
- 201000008827 tuberculosis Diseases 0.000 description 7
- 230000003570 biosynthesizing effect Effects 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 125000002950 monocyclic group Chemical group 0.000 description 6
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 6
- 239000007858 starting material Substances 0.000 description 6
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 6
- 125000006527 (C1-C5) alkyl group Chemical group 0.000 description 5
- LMDZBCPBFSXMTL-UHFFFAOYSA-N 1-ethyl-3-(3-dimethylaminopropyl)carbodiimide Chemical compound CCN=C=NCCCN(C)C LMDZBCPBFSXMTL-UHFFFAOYSA-N 0.000 description 5
- 101000655617 Bacillus cereus (strain ATCC 14579 / DSM 31 / CCUG 7414 / JCM 2152 / NBRC 15305 / NCIMB 9373 / NCTC 2599 / NRRL B-3711) Thiocillin Proteins 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 5
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical class [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 5
- 125000003545 alkoxy group Chemical group 0.000 description 5
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 5
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 5
- 239000001301 oxygen Substances 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- VQHCTFJXSIUDOJ-CPTXHEQMSA-N thiocillin IV Natural products CO[C@H](C)[C@@H]1NC(=O)c2csc(n2)[C@@H](NC(=O)c3csc(n3)C(=CC)NC(=O)[C@@H](NC(=O)c4csc(n4)c5ccc(nc5c6csc1n6)c7nc(cs7)c8nc(cs8)C(=O)NC(=CC)C(=O)NCC(=O)C)[C@@H](C)O)C(C)C VQHCTFJXSIUDOJ-CPTXHEQMSA-N 0.000 description 5
- 238000005160 1H NMR spectroscopy Methods 0.000 description 4
- GQHTUMJGOHRCHB-UHFFFAOYSA-N 2,3,4,6,7,8,9,10-octahydropyrimido[1,2-a]azepine Chemical compound C1CCCCN2CCCN=C21 GQHTUMJGOHRCHB-UHFFFAOYSA-N 0.000 description 4
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 description 4
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 4
- FZWLAAWBMGSTSO-UHFFFAOYSA-N Thiazole Chemical group C1=CSC=N1 FZWLAAWBMGSTSO-UHFFFAOYSA-N 0.000 description 4
- QFPBQHRZGAWLEX-LXEHTOTDSA-N YM-266183 Natural products CC=C(NC(=O)c1csc(n1)c2csc(n2)c3ccc4c5nc(cs5)C(=O)N[C@@H]([C@@H](C)O)C(=O)NC(=CC)c6nc(cs6)C(=O)N[C@H](c7nc(cs7)C(=O)N[C@@H]([C@@H](C)O)c8nc(cs8)c4n3)C(C)(C)O)C(=O)NCC(=O)C QFPBQHRZGAWLEX-LXEHTOTDSA-N 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 4
- 125000002619 bicyclic group Chemical group 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 125000001188 haloalkyl group Chemical group 0.000 description 4
- NPZTUJOABDZTLV-UHFFFAOYSA-N hydroxybenzotriazole Substances O=C1C=CC=C2NNN=C12 NPZTUJOABDZTLV-UHFFFAOYSA-N 0.000 description 4
- 239000012046 mixed solvent Substances 0.000 description 4
- 238000001946 ultra-performance liquid chromatography-mass spectrometry Methods 0.000 description 4
- GHYOCDFICYLMRF-UTIIJYGPSA-N (2S,3R)-N-[(2S)-3-(cyclopenten-1-yl)-1-[(2R)-2-methyloxiran-2-yl]-1-oxopropan-2-yl]-3-hydroxy-3-(4-methoxyphenyl)-2-[[(2S)-2-[(2-morpholin-4-ylacetyl)amino]propanoyl]amino]propanamide Chemical compound C1(=CCCC1)C[C@@H](C(=O)[C@@]1(OC1)C)NC([C@H]([C@@H](C1=CC=C(C=C1)OC)O)NC([C@H](C)NC(CN1CCOCC1)=O)=O)=O GHYOCDFICYLMRF-UTIIJYGPSA-N 0.000 description 3
- QFLWZFQWSBQYPS-AWRAUJHKSA-N (3S)-3-[[(2S)-2-[[(2S)-2-[5-[(3aS,6aR)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]-3-methylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-[1-bis(4-chlorophenoxy)phosphorylbutylamino]-4-oxobutanoic acid Chemical compound CCCC(NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H](NC(=O)CCCCC1SC[C@@H]2NC(=O)N[C@H]12)C(C)C)P(=O)(Oc1ccc(Cl)cc1)Oc1ccc(Cl)cc1 QFLWZFQWSBQYPS-AWRAUJHKSA-N 0.000 description 3
- 125000006273 (C1-C3) alkyl group Chemical group 0.000 description 3
- 125000006736 (C6-C20) aryl group Chemical group 0.000 description 3
- UNILWMWFPHPYOR-KXEYIPSPSA-M 1-[6-[2-[3-[3-[3-[2-[2-[3-[[2-[2-[[(2r)-1-[[2-[[(2r)-1-[3-[2-[2-[3-[[2-(2-amino-2-oxoethoxy)acetyl]amino]propoxy]ethoxy]ethoxy]propylamino]-3-hydroxy-1-oxopropan-2-yl]amino]-2-oxoethyl]amino]-3-[(2r)-2,3-di(hexadecanoyloxy)propyl]sulfanyl-1-oxopropan-2-yl Chemical compound O=C1C(SCCC(=O)NCCCOCCOCCOCCCNC(=O)COCC(=O)N[C@@H](CSC[C@@H](COC(=O)CCCCCCCCCCCCCCC)OC(=O)CCCCCCCCCCCCCCC)C(=O)NCC(=O)N[C@H](CO)C(=O)NCCCOCCOCCOCCCNC(=O)COCC(N)=O)CC(=O)N1CCNC(=O)CCCCCN\1C2=CC=C(S([O-])(=O)=O)C=C2CC/1=C/C=C/C=C/C1=[N+](CC)C2=CC=C(S([O-])(=O)=O)C=C2C1 UNILWMWFPHPYOR-KXEYIPSPSA-M 0.000 description 3
- 125000003229 2-methylhexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 3
- JMTMSDXUXJISAY-UHFFFAOYSA-N 2H-benzotriazol-4-ol Chemical compound OC1=CC=CC2=C1N=NN2 JMTMSDXUXJISAY-UHFFFAOYSA-N 0.000 description 3
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical class [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 3
- 241000193755 Bacillus cereus Species 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 238000006069 Suzuki reaction reaction Methods 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 3
- 125000003342 alkenyl group Chemical group 0.000 description 3
- 125000003282 alkyl amino group Chemical group 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 125000004429 atom Chemical group 0.000 description 3
- 239000002585 base Substances 0.000 description 3
- 150000001721 carbon Chemical group 0.000 description 3
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 3
- 229960005091 chloramphenicol Drugs 0.000 description 3
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 3
- 229940125773 compound 10 Drugs 0.000 description 3
- 229940125797 compound 12 Drugs 0.000 description 3
- 229940126214 compound 3 Drugs 0.000 description 3
- 229940125898 compound 5 Drugs 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 125000001041 indolyl group Chemical group 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- ZLVXBBHTMQJRSX-VMGNSXQWSA-N jdtic Chemical compound C1([C@]2(C)CCN(C[C@@H]2C)C[C@H](C(C)C)NC(=O)[C@@H]2NCC3=CC(O)=CC=C3C2)=CC=CC(O)=C1 ZLVXBBHTMQJRSX-VMGNSXQWSA-N 0.000 description 3
- 150000002678 macrocyclic compounds Chemical class 0.000 description 3
- OKKJLVBELUTLKV-VMNATFBRSA-N methanol-d1 Chemical compound [2H]OC OKKJLVBELUTLKV-VMNATFBRSA-N 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 125000001624 naphthyl group Chemical group 0.000 description 3
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 3
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- FPGGTKZVZWFYPV-UHFFFAOYSA-M tetrabutylammonium fluoride Chemical compound [F-].CCCC[N+](CCCC)(CCCC)CCCC FPGGTKZVZWFYPV-UHFFFAOYSA-M 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- CYPYTURSJDMMMP-WVCUSYJESA-N (1e,4e)-1,5-diphenylpenta-1,4-dien-3-one;palladium Chemical compound [Pd].[Pd].C=1C=CC=CC=1\C=C\C(=O)\C=C\C1=CC=CC=C1.C=1C=CC=CC=1\C=C\C(=O)\C=C\C1=CC=CC=C1.C=1C=CC=CC=1\C=C\C(=O)\C=C\C1=CC=CC=C1 CYPYTURSJDMMMP-WVCUSYJESA-N 0.000 description 2
- 125000006835 (C6-C20) arylene group Chemical group 0.000 description 2
- 125000005916 2-methylpentyl group Chemical group 0.000 description 2
- 125000003469 3-methylhexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])(C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 2
- 125000005917 3-methylpentyl group Chemical group 0.000 description 2
- 241000276408 Bacillus subtilis subsp. subtilis str. 168 Species 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 2
- WMFOQBRAJBCJND-UHFFFAOYSA-M Lithium hydroxide Chemical compound [Li+].[OH-] WMFOQBRAJBCJND-UHFFFAOYSA-M 0.000 description 2
- RJQXTJLFIWVMTO-TYNCELHUSA-N Methicillin Chemical compound COC1=CC=CC(OC)=C1C(=O)N[C@@H]1C(=O)N2[C@@H](C(O)=O)C(C)(C)S[C@@H]21 RJQXTJLFIWVMTO-TYNCELHUSA-N 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- 241001467553 Mycobacterium africanum Species 0.000 description 2
- 241000186366 Mycobacterium bovis Species 0.000 description 2
- 241000187919 Mycobacterium microti Species 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- MZRVEZGGRBJDDB-UHFFFAOYSA-N N-Butyllithium Chemical compound [Li]CCCC MZRVEZGGRBJDDB-UHFFFAOYSA-N 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 150000001408 amides Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005801 aryl-aryl coupling reaction Methods 0.000 description 2
- 125000004541 benzoxazolyl group Chemical group O1C(=NC2=C1C=CC=C2)* 0.000 description 2
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 125000002993 cycloalkylene group Chemical group 0.000 description 2
- 230000018044 dehydration Effects 0.000 description 2
- 238000006297 dehydration reaction Methods 0.000 description 2
- NKLCNNUWBJBICK-UHFFFAOYSA-N dess–martin periodinane Chemical compound C1=CC=C2I(OC(=O)C)(OC(C)=O)(OC(C)=O)OC(=O)C2=C1 NKLCNNUWBJBICK-UHFFFAOYSA-N 0.000 description 2
- 229940072185 drug for treatment of tuberculosis Drugs 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- PQVSTLUFSYVLTO-UHFFFAOYSA-N ethyl n-ethoxycarbonylcarbamate Chemical compound CCOC(=O)NC(=O)OCC PQVSTLUFSYVLTO-UHFFFAOYSA-N 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 108091008053 gene clusters Proteins 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 125000006588 heterocycloalkylene group Chemical group 0.000 description 2
- WJRBRSLFGCUECM-UHFFFAOYSA-N hydantoin Chemical compound O=C1CNC(=O)N1 WJRBRSLFGCUECM-UHFFFAOYSA-N 0.000 description 2
- 125000004464 hydroxyphenyl group Chemical group 0.000 description 2
- 125000002883 imidazolyl group Chemical group 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 125000004491 isohexyl group Chemical group C(CCC(C)C)* 0.000 description 2
- 125000001972 isopentyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 2
- 125000000468 ketone group Chemical group 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- GLXDVVHUTZTUQK-UHFFFAOYSA-M lithium hydroxide monohydrate Substances [Li+].O.[OH-] GLXDVVHUTZTUQK-UHFFFAOYSA-M 0.000 description 2
- 229940040692 lithium hydroxide monohydrate Drugs 0.000 description 2
- NUJOXMJBOLGQSY-UHFFFAOYSA-N manganese dioxide Chemical compound O=[Mn]=O NUJOXMJBOLGQSY-UHFFFAOYSA-N 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- QARBMVPHQWIHKH-UHFFFAOYSA-N methanesulfonyl chloride Chemical compound CS(Cl)(=O)=O QARBMVPHQWIHKH-UHFFFAOYSA-N 0.000 description 2
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 2
- 229960003085 meticillin Drugs 0.000 description 2
- 125000002757 morpholinyl group Chemical group 0.000 description 2
- 230000036457 multidrug resistance Effects 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 125000004433 nitrogen atom Chemical group N* 0.000 description 2
- 125000002971 oxazolyl group Chemical group 0.000 description 2
- WXHIJDCHNDBCNY-UHFFFAOYSA-N palladium dihydride Chemical class [PdH2] WXHIJDCHNDBCNY-UHFFFAOYSA-N 0.000 description 2
- NFHFRUOZVGFOOS-UHFFFAOYSA-N palladium;triphenylphosphane Chemical compound [Pd].C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1 NFHFRUOZVGFOOS-UHFFFAOYSA-N 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 229910000073 phosphorus hydride Inorganic materials 0.000 description 2
- 125000003367 polycyclic group Chemical group 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- BWHMMNNQKKPAPP-UHFFFAOYSA-L potassium carbonate Chemical compound [K+].[K+].[O-]C([O-])=O BWHMMNNQKKPAPP-UHFFFAOYSA-L 0.000 description 2
- 238000002953 preparative HPLC Methods 0.000 description 2
- 238000000039 preparative column chromatography Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 125000000714 pyrimidinyl group Chemical group 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 125000003507 tetrahydrothiofenyl group Chemical group 0.000 description 2
- CBDKQYKMCICBOF-UHFFFAOYSA-N thiazoline Chemical compound C1CN=CS1 CBDKQYKMCICBOF-UHFFFAOYSA-N 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- LLHOYOCAAURYRL-RITPCOANSA-N (2s,3r)-3-hydroxy-2-[(2-methylpropan-2-yl)oxycarbonylamino]butanoic acid Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)OC(C)(C)C LLHOYOCAAURYRL-RITPCOANSA-N 0.000 description 1
- 125000003837 (C1-C20) alkyl group Chemical group 0.000 description 1
- 125000004455 (C1-C3) alkylthio group Chemical group 0.000 description 1
- 125000006376 (C3-C10) cycloalkyl group Chemical group 0.000 description 1
- QFCMBRXRVQRSSF-UHFFFAOYSA-N 1,2,3,3a,4,5,6,6a-octahydropyrrolo[3,4-c]pyrrole Chemical compound C1NCC2CNCC21 QFCMBRXRVQRSSF-UHFFFAOYSA-N 0.000 description 1
- ZOBPZXTWZATXDG-UHFFFAOYSA-N 1,3-thiazolidine-2,4-dione Chemical compound O=C1CSC(=O)N1 ZOBPZXTWZATXDG-UHFFFAOYSA-N 0.000 description 1
- RYHBNJHYFVUHQT-UHFFFAOYSA-N 1,4-Dioxane Chemical compound C1COCCO1 RYHBNJHYFVUHQT-UHFFFAOYSA-N 0.000 description 1
- 125000004973 1-butenyl group Chemical group C(=CCC)* 0.000 description 1
- 125000006039 1-hexenyl group Chemical group 0.000 description 1
- MCTWTZJPVLRJOU-UHFFFAOYSA-N 1-methyl-1H-imidazole Chemical compound CN1C=CN=C1 MCTWTZJPVLRJOU-UHFFFAOYSA-N 0.000 description 1
- 125000006023 1-pentenyl group Chemical group 0.000 description 1
- YBYIRNPNPLQARY-UHFFFAOYSA-N 1H-indene Natural products C1=CC=C2CC=CC2=C1 YBYIRNPNPLQARY-UHFFFAOYSA-N 0.000 description 1
- 125000003562 2,2-dimethylpentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C(C([H])([H])[H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- FFOVFIRMBLLEJP-UHFFFAOYSA-N 2,3,4,7-tetrahydro-1h-purine Chemical compound N1CNC=C2NC=NC21 FFOVFIRMBLLEJP-UHFFFAOYSA-N 0.000 description 1
- 125000006069 2,3-dimethyl-2-butenyl group Chemical group 0.000 description 1
- 125000003660 2,3-dimethylpentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(C([H])([H])[H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 125000003764 2,4-dimethylpentyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- DDVRNOMZDQTUNS-UHFFFAOYSA-N 2,7-diazaspiro[4.4]nonane Chemical compound C1NCCC11CNCC1 DDVRNOMZDQTUNS-UHFFFAOYSA-N 0.000 description 1
- NINJAJLCZUYDGV-UHFFFAOYSA-N 2-azaspiro[4.4]nonane Chemical compound C1CCCC21CNCC2 NINJAJLCZUYDGV-UHFFFAOYSA-N 0.000 description 1
- 125000004974 2-butenyl group Chemical group C(C=CC)* 0.000 description 1
- 125000006040 2-hexenyl group Chemical group 0.000 description 1
- 125000006029 2-methyl-2-butenyl group Chemical group 0.000 description 1
- 125000006024 2-pentenyl group Chemical group 0.000 description 1
- VSWICNJIUPRZIK-UHFFFAOYSA-N 2-piperideine Chemical compound C1CNC=CC1 VSWICNJIUPRZIK-UHFFFAOYSA-N 0.000 description 1
- 125000006325 2-propenyl amino group Chemical group [H]C([H])=C([H])C([H])([H])N([H])* 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 125000004336 3,3-dimethylpentyl group Chemical group [H]C([H])([H])C([H])([H])C(C([H])([H])[H])(C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 1
- FPQQSJJWHUJYPU-UHFFFAOYSA-N 3-(dimethylamino)propyliminomethylidene-ethylazanium;chloride Chemical compound Cl.CCN=C=NCCCN(C)C FPQQSJJWHUJYPU-UHFFFAOYSA-N 0.000 description 1
- 125000004337 3-ethylpentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(C([H])([H])C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000006041 3-hexenyl group Chemical group 0.000 description 1
- 125000006027 3-methyl-1-butenyl group Chemical group 0.000 description 1
- JDUXMFGFGCJNGO-UHFFFAOYSA-N 4-bromo-1,3-thiazole-2-carbaldehyde Chemical compound BrC1=CSC(C=O)=N1 JDUXMFGFGCJNGO-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- NOWKCMXCCJGMRR-UHFFFAOYSA-N Aziridine Chemical compound C1CN1 NOWKCMXCCJGMRR-UHFFFAOYSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- 101150111062 C gene Proteins 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 206010011409 Cross infection Diseases 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 1
- 239000004201 L-cysteine Substances 0.000 description 1
- 235000013878 L-cysteine Nutrition 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 208000032420 Latent Infection Diseases 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 239000006391 Luria-Bertani Medium Substances 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical group [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- 239000012359 Methanesulfonyl chloride Substances 0.000 description 1
- 206010029803 Nosocomial infection Diseases 0.000 description 1
- 101150103068 P2 gene Proteins 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 238000003477 Sonogashira cross-coupling reaction Methods 0.000 description 1
- 238000006619 Stille reaction Methods 0.000 description 1
- DTQVDTLACAAQTR-UHFFFAOYSA-M Trifluoroacetate Chemical compound [O-]C(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-M 0.000 description 1
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- UCRWCWMLGBHKOX-UHFFFAOYSA-N [N+](=O)(OC(=O)ON)[O-] Chemical group [N+](=O)(OC(=O)ON)[O-] UCRWCWMLGBHKOX-UHFFFAOYSA-N 0.000 description 1
- 208000038016 acute inflammation Diseases 0.000 description 1
- 230000006022 acute inflammation Effects 0.000 description 1
- 125000004183 alkoxy alkyl group Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 125000002178 anthracenyl group Chemical group C1(=CC=CC2=CC3=CC=CC=C3C=C12)* 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- HONIICLYMWZJFZ-UHFFFAOYSA-N azetidine Chemical compound C1CNC1 HONIICLYMWZJFZ-UHFFFAOYSA-N 0.000 description 1
- 125000003828 azulenyl group Chemical group 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 1
- 125000000499 benzofuranyl group Chemical group O1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000001164 benzothiazolyl group Chemical group S1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- IPWKHHSGDUIRAH-UHFFFAOYSA-N bis(pinacolato)diboron Chemical compound O1C(C)(C)C(C)(C)OB1B1OC(C)(C)C(C)(C)O1 IPWKHHSGDUIRAH-UHFFFAOYSA-N 0.000 description 1
- 239000012267 brine Substances 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- XNNQFQFUQLJSQT-UHFFFAOYSA-N bromo(trichloro)methane Chemical compound ClC(Cl)(Cl)Br XNNQFQFUQLJSQT-UHFFFAOYSA-N 0.000 description 1
- CREMABGTGYGIQB-UHFFFAOYSA-N carbon carbon Chemical compound C.C CREMABGTGYGIQB-UHFFFAOYSA-N 0.000 description 1
- 125000004181 carboxyalkyl group Chemical group 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 125000000259 cinnolinyl group Chemical group N1=NC(=CC2=CC=CC=C12)* 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 125000006254 cycloalkyl carbonyl group Chemical group 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000000582 cycloheptyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 125000003963 dichloro group Chemical group Cl* 0.000 description 1
- MKRTXPORKIRPDG-UHFFFAOYSA-N diphenylphosphoryl azide Chemical compound C=1C=CC=CC=1P(=O)(N=[N+]=[N-])C1=CC=CC=C1 MKRTXPORKIRPDG-UHFFFAOYSA-N 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037771 disease arising from reactivation of latent virus Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000017574 dry cough Diseases 0.000 description 1
- 125000002587 enol group Chemical group 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 125000003983 fluorenyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3CC12)* 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 125000002541 furyl group Chemical group 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 125000000262 haloalkenyl group Chemical group 0.000 description 1
- 125000004438 haloalkoxy group Chemical group 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 150000004677 hydrates Chemical class 0.000 description 1
- 125000002768 hydroxyalkyl group Chemical group 0.000 description 1
- 125000005027 hydroxyaryl group Chemical group 0.000 description 1
- 125000003454 indenyl group Chemical group C1(C=CC2=CC=CC=C12)* 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 125000005468 isobutylenyl group Chemical group 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 125000001786 isothiazolyl group Chemical group 0.000 description 1
- 125000000842 isoxazolyl group Chemical group 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- LROBJRRFCPYLIT-UHFFFAOYSA-M magnesium;ethyne;bromide Chemical compound [Mg+2].[Br-].[C-]#C LROBJRRFCPYLIT-UHFFFAOYSA-M 0.000 description 1
- 239000000401 methanolic extract Substances 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000003136 n-heptyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000001280 n-hexyl group Chemical group C(CCCCC)* 0.000 description 1
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 238000005935 nucleophilic addition reaction Methods 0.000 description 1
- 150000007530 organic bases Chemical class 0.000 description 1
- 125000001715 oxadiazolyl group Chemical group 0.000 description 1
- AHHWIHXENZJRFG-UHFFFAOYSA-N oxetane Chemical compound C1COC1 AHHWIHXENZJRFG-UHFFFAOYSA-N 0.000 description 1
- 125000003566 oxetanyl group Chemical group 0.000 description 1
- YJVFFLUZDVXJQI-UHFFFAOYSA-L palladium(ii) acetate Chemical compound [Pd+2].CC([O-])=O.CC([O-])=O YJVFFLUZDVXJQI-UHFFFAOYSA-L 0.000 description 1
- 125000004592 phthalazinyl group Chemical group C1(=NN=CC2=CC=CC=C12)* 0.000 description 1
- 125000004193 piperazinyl group Chemical group 0.000 description 1
- 125000003386 piperidinyl group Chemical group 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- 229910000027 potassium carbonate Inorganic materials 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 229940002612 prodrug Drugs 0.000 description 1
- 239000000651 prodrug Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 1
- WGYKZJWCGVVSQN-UHFFFAOYSA-N propylamine Chemical compound CCCN WGYKZJWCGVVSQN-UHFFFAOYSA-N 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000425 proton nuclear magnetic resonance spectrum Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 125000004309 pyranyl group Chemical group O1C(C=CC=C1)* 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000003226 pyrazolyl group Chemical group 0.000 description 1
- 125000002098 pyridazinyl group Chemical group 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 1
- 125000000168 pyrrolyl group Chemical group 0.000 description 1
- 125000002294 quinazolinyl group Chemical group N1=C(N=CC2=CC=CC=C12)* 0.000 description 1
- 125000002943 quinolinyl group Chemical group N1=C(C=CC2=CC=CC=C12)* 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 125000006413 ring segment Chemical group 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 1
- 239000012453 solvate Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- GLBQVJGBPFPMMV-UHFFFAOYSA-N sulfilimine Chemical compound S=N GLBQVJGBPFPMMV-UHFFFAOYSA-N 0.000 description 1
- 125000000020 sulfo group Chemical group O=S(=O)([*])O[H] 0.000 description 1
- 125000004963 sulfonylalkyl group Chemical group 0.000 description 1
- 150000003462 sulfoxides Chemical class 0.000 description 1
- 125000005555 sulfoximide group Chemical group 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- APBDREXAUGXCCV-UHFFFAOYSA-L tetraethylazanium;carbonate Chemical compound [O-]C([O-])=O.CC[N+](CC)(CC)CC.CC[N+](CC)(CC)CC APBDREXAUGXCCV-UHFFFAOYSA-L 0.000 description 1
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 1
- 125000001712 tetrahydronaphthyl group Chemical group C1(CCCC2=CC=CC=C12)* 0.000 description 1
- 125000001412 tetrahydropyranyl group Chemical group 0.000 description 1
- 125000004853 tetrahydropyridinyl group Chemical group N1(CCCC=C1)* 0.000 description 1
- 125000004632 tetrahydrothiopyranyl group Chemical group S1C(CCCC1)* 0.000 description 1
- 125000003831 tetrazolyl group Chemical group 0.000 description 1
- 125000000335 thiazolyl group Chemical group 0.000 description 1
- 125000001544 thienyl group Chemical group 0.000 description 1
- 125000002053 thietanyl group Chemical group 0.000 description 1
- 125000004001 thioalkyl group Chemical group 0.000 description 1
- 108010057451 thiocillin Proteins 0.000 description 1
- 229930188234 thiocillin Natural products 0.000 description 1
- BRNULMACUQOKMR-UHFFFAOYSA-N thiomorpholine Chemical compound C1CSCCN1 BRNULMACUQOKMR-UHFFFAOYSA-N 0.000 description 1
- 125000003944 tolyl group Chemical group 0.000 description 1
- 229910052723 transition metal Inorganic materials 0.000 description 1
- 150000003624 transition metals Chemical class 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 125000004954 trialkylamino group Chemical group 0.000 description 1
- 125000004306 triazinyl group Chemical group 0.000 description 1
- 125000001425 triazolyl group Chemical group 0.000 description 1
- COIOYMYWGDAQPM-UHFFFAOYSA-N tris(2-methylphenyl)phosphane Chemical compound CC1=CC=CC=C1P(C=1C(=CC=CC=1)C)C1=CC=CC=C1C COIOYMYWGDAQPM-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- UGOMMVLRQDMAQQ-UHFFFAOYSA-N xphos Chemical compound CC(C)C1=CC(C(C)C)=CC(C(C)C)=C1C1=CC=CC=C1P(C1CCCCC1)C1CCCCC1 UGOMMVLRQDMAQQ-UHFFFAOYSA-N 0.000 description 1
- 125000005023 xylyl group Chemical group 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D513/00—Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00
- C07D513/22—Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00 in which the condensed system contains four or more hetero rings
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/33—Heterocyclic compounds
- A61K31/395—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
- A61K31/41—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
- A61K31/425—Thiazoles
- A61K31/429—Thiazoles condensed with heterocyclic ring systems
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/16—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
- C12P17/167—Heterorings having sulfur atoms as ring heteroatoms, e.g. vitamin B1, thiamine nucleus and open chain analogs
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Public Health (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Veterinary Medicine (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 발명은 마크로코신 기반 카르복실산 화합물의 제조방법 및 제조된 마크로코신 기반 카르복실산 화합물을 제공하는 것으로, 본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 마크로코신 화합물에 카르복실산기가 도입됨으로써 다양한 작용기를 도입이 용이하다.
Description
본 발명은 마크로코신 화합물을 기반으로 하여 제조되는 마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물을 제공한다.
또한, 본 발명은 마크로코신 기반 카르복실산 화합물을 제조하기 위한 출발물질인 마크로코신 화합물의 생합성 방법을 제공한다.
또한, 본 발명은 상기 제조된 마크로코신 기반 카르복실산 화합물로부터 항생제로 유용한 마크로코신 유도체를 제조하는 방법을 제공한다.
다양한 감염증에 대해 인류는 항생제를 개발하여 대처해왔다.
그러나 최근 대부분의 항생 물질들에 저항성을 갖는 메티실린 내성 황색포도상구균(Methicillin resistance Staphylococcus aureus; MRSA)의 출연빈도가 증가하고 있다.
메티실린 내성 황색포도상구균은 병원이나 의료 기관 등에 입원해 있는 환자에게 원내 감염이 일어나고, 신체 접촉을 통하여 사람과 사람 사이로 감염되는데, 수술 후 외상을 통하여 감염되거나 폐렴을 일으키면 생명이 위태로울 정도로 위험하다.
또한 미코박테리움 튜베쿨로시스(M. tuberculosis), 미코박테리움 보비스(M. bovis), 미코박테리움 미크로티(M. microti), 미코박테리움 아프리카눔(M. africanum)을 비롯한 결핵균군에 의해 유발되는 만성 감염성 질환인 결핵균도 아직 극복하지 못한 질병 중 하나이다.
결핵은 감염된 환자의 면역상태에 따라 장기간의 잠복감염 상태로 유지될 수 있는데, 전 세계 인구의 약 30%인 20억명이 잠복감염 상태인 것으로 추정되고 있다. 결핵에 감염 시, 상당한 기간 동안 무증상일 수 있으나, 이후 공통적인 증상으로서 폐의 급성 염증을 나타낼 수 있으며, 그 결과 발열 및 마른 기침(nonproductive cough)을 유발시킨다. 이를 치료하지 않으면, 일반적으로 심각한 합병증 및 사망을 초래한다.
항결핵제 개발은 1940년대 스트렙토마이신을 시작으로 더 효과적인 항결핵제들이 개발되었으며, 이로 인해 결핵의 발생 및 사망이 급격하게 감소하였다.
그러나 1980년대 기존의 항생제로 통제할 수 없는 내성 균주인 '다제내성 결핵(Multidrug resistance(MDR)-TB)'의 발생으로 인하여 다제내성 결핵의 환자수는 감소하지 않고 있어, 심각한 보건문제로 대두되고 있다.
한편 마크로코신은 티오펩타이드 천연물로, 26개로 원자로 구성된 거대 고리를 가지는 구조적 특징을 가지고 있으며, 화합물의 구조에 따라 마크로코신 P1(micrococcin P1 (MP1))과 마크로코신 P2(micrococcin P2 (MP2))로 나누어진다. 마크로코신 P1은 다양한 그람 양성균에 대해 효능이 있는 것으로 알려져 있는데, L11 단백질과 23S rRNA 사이에 형성된 복합체에 결합하여 단백질 합성을 억제하는 작용 기전으로 항균작용을 나타낸다.
이에 항상된 항생효과를 가진 마크로코신 유도체를 개발하기 위한 연구가 진행되고 있다.
그러나 마크로코신은 다수의 티아졸고리를 함유하며, 미생물에 의해 생성되는 복잡한 구조로, 다양한 작용기를 도입하기 용이하지 않다.
이에 본 발명의 발명자들은 마크로코신에 다양한 작용기를 도입하기 위해 연구하던 중, 특정한 마크로코신 화합물을 금속 수산화물과 반응시킴으로써 특정한 작용기를 잘라내어 마크로코신 기반 카르복실산 화합물을 제조할 수 있음을 발견하여 본 발명을 완성하였다.
이에 본 발명은 마크로코신 기반 카르복실산 화합물의 제조방법을 제공한다.
또한, 본 발명은 마크로코신 기반 카르복실산 화합물을 제조하기 위한 출발물질인 마크로코신 화합물의 생합성 방법을 제공한다.
또한, 본 발명은 상기 제조된 마크로코신 기반 카르복실산 화합물로부터 항생제로 유용한 마크로코신 유도체를 제조하는 방법을 제공한다.
본 발명은 우수한 항생효과를 가질 수 있는 마크로코신 유도체를 제조하기 위한 중간체로 유용하게 사용가능한 마크로코신 기반 카르복실산 화합물의 제조방법을 제공한다.
본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은,
하기 화학식 2로 표시되는 마크로코신 화합물을 금속 수산화물과 반응시켜 하기 화학식 1로 표시되는 마크로코신 기반 카르복실산 화합물을 제조하는 단계를 포함한다.
[화학식 1]
[화학식 2]
상기 화학식 1 및 2에서,
R1 내지 R3은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며,
상기 R1 내지 R3의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나이상으로 더 치환될 수 있으며;
Ra는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며;
Rb는 수소 또는 C1-C10알킬이다.
또한, 본 발명은 마크로코신 기반 카르복실산 화합물을 제조하기 위한 출발물질인 마크로코신 화합물의 생합성 방법을 제공한다.
본 발명의 마크로코신 화합물의 생합성 방법은, 하기 화학식 2-2의 마크로코신 화합물의 제조방법으로,
1) BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, 및 BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 포함한다.
[화학식 2-2]
상기 화학식 2-2에서,
R5A는 수소 또는 하이드록시이고, R5B는 하이드록시 또는 메톡시이다.
또한, 본 발명은 우수한 항생효과를 가질 수 있는 마크로코신 유도체를 제조하기 위한 중간체로 유용하게 사용가능한 마크로코신 기반 카르복실산 화합물을 제공하는 것으로, 마크로코신 기반 카르복실산 화합물은 상기 화학식 1로 표시된다.
또한, 본 발명은 상기 제조된 마크로코신 기반 카르복실산 화합물을 중간체로 하여 항생제로 유용한 마크로코신 유도체를 제조하는 방법을 제공한다.
본 발명의 마크로코신 유도체의 제조방법은,
상기 화학식 2의 마크로코신 화합물을 금속 수산화물과 반응시켜 상기 화학식 1의 마크로코신 기반 카르복실산 화합물을 제조하는 단계;
상기 화학식 1의 마크로코신 기반 카르복실산 화합물로부터 하기 화학식 3의 마크로코신 유도체를 제조하는 단계;를 포함한다.
[화학식 3]
상기 화학식 3에서,
R1 내지 R3은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며;
상기 R1 내지 R3의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있으며;
Z1 및 Z2은 서로 독립적으로 단일결합, -CONR11-, -NR12CO-, -COO-, -OCO-, -CR13R14-, -NR15COO-, -NR16-, -S-, -O-, -SO2- 또는 -OCONR17-이며, R11 내지 R17은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, 카르복실C1-C10알킬 또는 C1-C10알콕시카보닐C1-C10알킬이며;
A2는 단일결합, C1-C10알킬렌, C3-C10시클로알킬렌, C3-C10헤테로시클로알킬렌, C6-C20아릴렌 또는 C6-C20헤테로아릴렌이며;
R은 수소, 할로겐, 아미노, 하이드록시, -B(OH)2, 치환 또는 비치환 할로C1-C10알킬, 치환 또는 비치환 C1-C10알킬, 치환 또는 비치환 C2-C10알케닐, 치환 또는 비치환 C3-C10시클로알킬, 치환 또는 비치환 C3-C10헤테로시클로알킬, 치환 또는 비치환 C6-C20아릴, 또는 치환 또는 비치환 C3-C20헤테로아릴이다.
본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 단순한 공정 및 온화한 조건 하에서 마크로코신 화합물로부터 마크로코신 기반 카르복실산기가 도입된 화합물을 용이하게 제조할 수 있다.
본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 온화한 조건에서 높은 순도 및 수율로 마크로코신 기반 카르복실산 화합물의 제조가 가능하다.
또한 본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법으로 제조된 마크로코신 기반 카르복실산 화합물은 도입된 카르복실산기에 다양한 작용기를 용이하게 도입함으로써 다양한 마크로코신 유도체를 쉽게 제조할 수 있다. 즉, 본 발명의 마크로코신 기반 카르복실산 화합물은 다양한 작용기가 도입된 마크로코신 유도체를 제조하기 위한 중간체로 매우 유용할 수 있다.
따라서 본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 우수한 항생효과를 가지는 마크로코신 기반 유도체의 제조에 매우 유용하게 사용될 수 있다.
또한, 본 발명에 따르면, 특정 유전자들을 포함하는 벡터로 형질전환된 바실러스 섭틸리스(Bacillus subtilis) 세포 내에서 목적 물질인 마크로코신 화합물을 효율적으로 생합성할 수 있으며, 유용 유전자의 추가적인 도입을 통하여 거대 고리에 다양한 치환기를 도입시킬 수 있다.
도 1 - 본 발명의 실시예 2의 pUC19에 도입된 유전자 재조합 플라스미드 1의 도식도.
도 2 - 본 발명의 실시예 2의 pUC19에 도입된 유전자 재조합 플라스미드 2의 도식도.
도 3 - 본 발명의 실시예 2의 pUC19에 도입된 유전자 재조합 플라스미드 3의 도식도.
도 4 - 각 플라스미드에 의해 형질전환된 바실러스 추출물의 UPLC-MS 분석 결과
도 2 - 본 발명의 실시예 2의 pUC19에 도입된 유전자 재조합 플라스미드 2의 도식도.
도 3 - 본 발명의 실시예 2의 pUC19에 도입된 유전자 재조합 플라스미드 3의 도식도.
도 4 - 각 플라스미드에 의해 형질전환된 바실러스 추출물의 UPLC-MS 분석 결과
이하 본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법에 대해 상세히 설명한다. 이때, 사용되는 기술 용어 및 과학 용어에 있어서 다른 정의가 없다면, 이 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 통상적으로 이해하고 있는 의미를 가지며, 하기의 설명에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 설명은 생략한다.
본 명세서에서 사용된 하기 용어들은 다음과 같이 정의되나, 이는 단지 예시적인 것에 불과하며, 본 발명, 출원 또는 용도를 한정하려는 것은 아니다.
본 명세서에서 사용된 용어인 "본 발명의 마크로코신 화합물"은 당업자가 인식할 수 있는 마크로코신 화합물이라면 모두 가능하며, 일례로 마크로코신 P2의 화합물인 화학식 11 내지 12의 각각의 화합물들뿐만 아니라, 이들의 클라드레이트(clathrates), 수화물, 용매화물, 프로드럭 또는 다형체를 포함하는 의미이다.
[화학식 11]
[화학식 12]
또한 본 명세서에서 용어 "마크로코신 화합물", "마크로코신 기반 카르복실산 화합물", "마크로코신 유도체"는 이의 약학적으로 허용 가능한 염이 언급되지 않을 경우 본 발명 화합물의 약학적으로 허용 가능한 염도 포함하는 의미이다. 일 실시예에 있어, 본 발명의 마크로코신 화합물은 입체이성질체적으로 순수한 화합물들(예를 들어, 다른 입체이성질체가 실질적으로 없는(예를 들어, 85% ee 이상, 90% ee 이상, 95% ee 이상, 97% ee 이상, 또는 99% ee 이상))로 존재할 수 있다. 즉, 본 발명에 따른 "마크로코신 화합물", "마크로코신 기반 카르복실산 화합물", "마크로코신 유도체" 또는 그의 염이 호변이성적(tautomeric) 이성질체 및/또는 입체이성질체(예를 들어, 기하이성질체(geometrical isomer) 및 배좌 이성질체(conformational isomers))일 경우 그들의 분리된 이성질체 및 혼합물 각각 또한 본 발명의 화합물의 범주에 포함된다. 본 발명의 화합물 또는 그의 염이 구조 내에 비대칭 탄소(asymmetric carbon)를 가지고 있는 경우에, 그들의 광학 활성 화합물 및 라세믹 혼합물들 또한 본 발명의 화합물의 범위에 포함된다. 예를 들어, 본 발명의 화합물들이 설폭사이드(sulfoxide)(SOR) 구조를 가질 경우 이들이 chirality를 가질 수 있다. 본 발명의 화합물에는 이러한 이성질체의 R 및 S form이 포함되며, R 및 S form들의 혼합물들 또한 본 발명의 화합물 범주에 포함된다. 또한, 본 발명의 화합물들은 Keto form 또는 Enol form 중 어느 하나의 형태로 존재할 수 있으며, 이들 형태 모두 본 발명의 화합물 범주에 포함된다.
본 명세서에서 용어 "치환기(substituent)", "라디칼(radical)", "기(group)", "모이어티(moiety)", 및 "절편(fragment)"은 서로 바꾸어 사용할 수 있다.
본 명세서에 있어서, "CA-CB"는 "탄소수가 A 이상이고 B 이하"인 것을 의미한다. 즉, "C1-C10"와 같이 기재될 경우 이는 탄소수가 1 내지 10개임을 의미한다. 예를 들어, C1-C10 알킬은 탄소 수가 1 내지 10인 알킬을 의미한다.
본 명세서에서 사용된 용어 "알킬"은 (탄소수가 특별히 한정되지 않은 경우) 탄소수 1 내지 20, 바람직하게 탄소수 1 내지 15, 보다 바람직하게 탄소수 1 내지 10, 좋기로는 탄소수 1 내지 6을 가진 포화된 직쇄상 또는 분지상의 비-고리(cyclic) 탄화수소를 의미한다. "저급 알킬"은 탄소수가 1 내지 4, 또는 탄소수가 1 내지 6인 직쇄상 또는 분지상 알킬을 의미한다. 대표적인 포화 직쇄상 알킬은 메틸, 에틸, n-프로필, n-부틸, n-펜틸, n-헥실, n-헵틸, n-옥틸, n-노닐과 n-데실을 포함하고, 반면에 포화 분지상 알킬은 이소프로필, sec-부틸, 이소부틸, tert-부틸, 이소펜틸, 2-메틸헥실, 3-메틸부틸, 2-메틸펜틸, 3-메틸펜틸, 4-메틸펜틸, 2-메틸헥실, 3-메틸헥실, 2-메틸펜틸, 3-메틸펜틸, 4-메틸펜틸, 2-메틸헥실, 3-메틸헥실, 4-메틸헥실, 5- 메틸헥실, 2,3-디메틸부틸, 2,3-디메틸펜틸, 2,4-디메틸펜틸, 2,3-디메틸헥실, 2,4-디메틸헥실, 2,5-디메틸헥실, 2,2-디메틸펜틸, 2,2-디메틸헥실, 3,3-디메틸펜틸, 3,3-디메틸헥실, 4,4-디메틸헥실, 2-에틸펜틸, 3-에틸펜틸, 2-에틸헥실, 3-에틸헥실, 4-에틸헥실, 2-메틸-2-에틸펜틸, 2-메틸-3-에틸펜틸, 2-메틸-4-에틸펜틸, 2-메틸-2-에틸헥실, 2-메틸-3-에틸헥실, 2-메틸-4-에틸헥실, 2,2-디에틸펜틸, 3,3-디에틸헥실, 2,2-디에틸헥실, 및 3,3-디에틸헥실을 포함한다.
본 명세서에서 사용된 용어 "알케닐"은 2 내지 20개, 바람직하게 2 내지 15, 바람직하게 2 내지 10, 보다 바람직하게 2 내지 6의 탄소 원자 및 적어도 하나의 탄소-탄소 이중 결합을 포함하는 포화된 직쇄상 또는 분지상 비-고리 탄화수소를 의미한다. 대표적인 직쇄상 및 분지상 (C2-C10) 알케닐은 비닐, 알릴, 1-부테닐, 2-부테닐, 이소부틸레닐, 1-펜테닐, 2-펜테닐, 3-메틸-1-부테닐, 2-메틸-2-부테닐, 2,3-디메틸-2-부테닐, 1-헥세닐(hexenyl), 2-헥세닐, 3-헥세닐, 1-헵테닐, 2-헵테닐, 3-헵테닐, 1-옥테닐, 2-옥테닐, 3옥테닐, 1-노네닐(nonenyl), 2-노네닐, 3-노네닐, 1-데세닐, 2-데세닐 및 3-데세닐을 포함한다. 이러한 알케닐 그룹은 선택적으로 치환될 수 있다.
본 명세서에서 사용된 용어 "할로겐" 및 "할로"는 플루오린, 클로린, 브로민 또는 아이오딘을 의미한다.
본 명세서에서 사용된 용어 "할로알킬", "할로알콕시" 또는 "할로알케닐"은 각각 하나 이상의 수소 원자가 할로겐 원자로 치환된 알킬, 알콕시 또는 알케닐 그룹을 의미한다. 예를 들어, 할로알킬은 -CF3, -CHF2, -CH2F, -CBr3, -CHBr2, -CH2Br, -CCl3, -CHCl2, -CH2CI, -CI3, -CHI2, -CH2I, -CH2-CF3, -CH2-CHF2, -CH2-CH2F, -CH2-CBr3, -CH2-CHBr2, -CH2-CH2Br, -CH2-CCl3, -CH2-CHCl2, -CH2-CH2CI, -CH2-CI3, -CH2-CHI2, -CH2-CH2I, 및 이와 유사한 것을 포함한다. 여기에서 알킬 및 할로겐은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "알콕시"는 -OCH3, -OCH2CH3, -O(CH2)2CH3, -O(CH2)3CH3, -O(CH2)4CH3, -O(CH2)5CH3, 및 이와 유사한 것을 포함하는 -O-(알킬)을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "저급알콕시"는 -O-(저급알킬)을 의미하며, 여기에서 저급 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "아릴"은 5 내지 10의 고리 원자를 함유하는 탄소고리 방향족 그룹을 의미한다. 대표적인 예는 페닐, 톨릴(tolyl), 자일릴(xylyl), 나프틸, 테트라하이드로나프틸, 안트라세닐(anthracenyl), 플루오레닐(fluorenyl), 인데닐(indenyl), 아줄레닐(azulenyl) 등을 포함하나, 이에 한정되는 것은 아니다. 탄소고리 방향족 그룹은 선택적으로 치환될 수 있다.
본 명세서에서 사용된 용어 "사이클로알킬(cycloalkyl)"은 탄소 및 수소 원자를 가지며 탄소-탄소 다중 결합을 가지지 않는 모노사이클릭 또는 폴리사이클릭 포화 고리(ring)를 의미한다. 사이클로알킬 그룹의 예는 (C3-C10)사이클로알킬(예를 들어, 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실 및 사이클로헵틸)을 포함하나, 이에 한정되는 것은 아니다. 사이클로알킬 그룹은 선택적으로 치환될 수 있다. 일 실시예에서, 사이클로알킬 그룹은 모노사이클릭 또는 바이사이클릭 링(고리)이다.
본 명세서에 사용된 용어 “헤테로사이클로알킬”은 2 내지 20개, 바람직하게 2 내지 15개, 바람직하게 2 내지 10개, 바람직하게 2 내지 6개의 탄소 원자 및 질소, 산소 및 황으로 이루어진 군으로부터 선택된 1 내지 6개의 헤테로원자, 예를 들어 1 내지 5개의 헤테로원자, 1 내지 4개의 헤테로원자, 1 내지 3개의 헤테로원자, 또는 1 내지 2개의 헤테로원자로 이루어진 안정한 3- 내지 18-원 포화 또는 일부 불포화 라디칼을 지칭한다. 예시적인 헤테로사이클알킬은 비제한적으로 안정한 3-15 원 포화 또는 일부 불포화 라디칼, 안정한 3-12 원 포화 또는 일부 불포화 라디칼, 안정한 3-9 원 포화 또는 일부 불포화 라디칼, 안정한 8-원 포화 또는 일부 불포화 라디칼, 안정한 7-원 포화 또는 일부 불포화 라디칼, 안정한 6-원 포화 또는 일부 불포화 라디칼, 또는 안정한 5-원 포화 또는 일부 불포화 라디칼을 포함한다. 헤테로사이클알킬은 포화 또는 불포화된 단일고리, 다중고리 또는 스피로고리 형태를 모두 포함하며, 헤테로원자 또는 탄소원자를 통해 결합될 수 있다. 이러한 헤테로사이클로알킬 라디칼의 예로는 옥세탄, 아지리딘, 피롤리딘, 아제티딘, 피페리딘, 테트라하이드로피리딘, 피페라진, 모폴린, 티오모폴린, 1,3-디하이드로벤조[c][1,2]옥사보롤, 이미다졸리딘-2,4-디온, 티아졸리딘-2,4-디온, 피리미딘-2,4(1H,3H)-디온, 3-아자바이사이클로[3.1.0]헥산, 옥타하이드로피롤로[3,4-c]피롤, 2,7-다이아자스피로[4.4]노난, 2-아자스피로[4.4]노난 등의 비방향족 헤테로고리의 1가 라디칼을 포함할 수 있다.
본 명세서에서 사용된 용어 "모노-알킬아미노"는 -NHCH3, -NHCH2CH3, -NH(CH2)2CH3, -NH(CH2)3CH3, -NH(CH2)4CH3, -NH(CH2)5CH3, 및 이와 유사한 것을 포함하는, -NH(알킬)을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "디-알킬아미노"는 -N(CH3)2, -N(CH2CH3)2, -N((CH2)2CH3)2, -N(CH3)(CH2CH3), 및 이와 유사한 것을 포함하는 -N(알킬)(알킬)을 의미하며, 여기에서 각 알킬은 서로 독립적으로 위에서 정의된 알킬이다.
본 명세서에서 사용된 용어 "알킬아미노"는 위에서 정의된 모노-알킬아미노, 디-알킬아미노 및 트리-알킬아미노를 포함하는 개념이다.
본 명세서에서 사용된 용어 "카르복실산" "카르복실" 및 "카르복시"는 -COOH를 의미한다.
본 명세서에서 사용된 용어 "카르복실알킬"은 -CH2COOH, -CH2CH2COOH, -(CH2) 2CH2COOH, -(CH2)3CH2CO0H, -(CH2)4CH2CO0H, -(CH2)5CH2COOH, -CH(COOH)-CH3, -CH2CH(COOH)CH3, 및 이와 유사한 것을 포함하는, 하나 이상의 수소 원자가 하이드록시로 치환된 알킬을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "아미노알킬"은 -CH2-NH2, -(CH2)2-NH2, -(CH2)3-NH2, -(CH2)4-NH2, -(CH2)5-NH2및 이와 유사한 것을 포함하는 -(알킬)-NH2을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "모노-알킬아미노알킬"은 -CH2-NH-CH3, -CH2-NHCH2CH3, -CH2-NH(CH2)2CH3, -CH2-NH(CH2)3CH3, -CH2-NH(CH2)4CH3, -CH2-NH(CH2)5CH3, -(CH2)2-NH-CH3, 및 이와 유사한 것을 포함하는, -(알킬)-NH(알킬)을 의미하며, 여기에서 각 알킬은 서로 독립적으로 위에서 정의된 알킬이다.
본 명세서에서 사용된 "헤테로사이클(헤테로고리)"은 질소, 산소 및 황으로부터 독립적으로 선택된 1 내지 4의헤테로원자를 함유하는 포화되거나, 포화되지 않은 5- 내지 7-멤버의 모노사이클릭, 또는 7- 내지 10-멤버의 바이사이클릭, 헤테로사이클릭 링(고리)를 의미하며, 여기에서 질소 및 황 헤테로원자는 선택적으로 산화될 수 있고, 질소 헤테로원자는 선택적으로 사가화(quaternized)될 수 있으며, 상기 헤테로고리 중 일부가 벤젠 고리에 융합한 바이사이클릭 링을 포함한다. 헤테로고리는 헤테로원자 또는 탄소 원자에 의하여 부착될 수 있다. 헤테로고리는 위에서 정의된 헤테로아릴을 포함한다. 대표적인 헤테로고리는 모포리닐(morpholinyl), 피롤리디노닐(pyrrolidinonyl), 피롤리디닐(pyrrolidinyl), 피페리디닐, 히단토이닐(hydantoinyl), 발레롤락타밀(valerolactamyl), 옥시라닐, 옥세타닐, 테트라하이드로퓨라닐, 테트라하이드로피라닐(tetrahydropyranyl), 테트라하이드로피리디닐, 테트라하이드로피리미디닐, 테트라하이드로티오페닐, 테트라하이드로티오피라닐, 테트라하이드로피리미디닐, 테트라하이드로티오페닐, 및 테트라하이드로티오피라닐을 포함한다. "페닐에 융합된 헤테로고리"는 페닐 고리의 두 개의 인접한 탄소 원자에 부착된 헤테로고리를 의미하며, 여기에서 헤테로고리는 위에서 정의된 것과 같다.
본 명세서에서 사용된 "헤테로아릴"은 질소, 산소 및 황으로 구성된 군으로부터 선택된 적어도 하나의 헤테로원자를 가지고, 모노- 및 바이사이클릭 링 시스템을 포함하는 적어도 하나의 탄소 원자를 포함하는 5 내지 10 멤버의 방향족 헤테로고리(heterocycle) 링이다. 대표적인 헤테로아릴은 트리아졸일, 테트라졸일, 옥사디아졸일, 피리딜, 퓨릴, 벤조퓨라닐, 티오페닐, 벤조티오페닐, 퀴놀리닐, 피롤일(pyrrolyl), 인돌일, 옥사졸일, 벤족사졸일(benzoxazolyl), 이미다졸일, 벤즈이미다졸일, 티아졸일(thiazolyl), 벤조티아졸일, 이속사졸일, 파이라졸일(pyrazolyl), 이소티아졸일, 피리다지닐, 피리미디닐, 파이라지닐, 트리아지닐, 신놀리닐(cinnolinyl), 프탈라지닐, 퀴나졸리닐, 피리미딜, 옥세타닐, 아제피닐, 피페라지닐, 모포리닐(morpholinyl), 디옥사닐, 티에타닐 및 옥사졸일이다. 헤테로아릴 그룹은 모노사이클릭 또는 바이사이클릭일 수 있다. 헤테로아릴은 용어 헤테로아릴환, 헤테로아릴 그룹 또는 헤테로방향족과 혼용하여 사용될 수 있으며, 이들 용어는 모두 임의로 치환된 환을 포함할 수 있다.
본 명세서에서 사용된 용어 "하이드록시알킬"은 -CH2OH, -CH2CH2OH, -(CH2) 2CH2OH, -(CH2)3CH20H, -(CH2)4CH20H, -(CH2)5CH2OH, -CH(OH)-CH3, -CH2CH(OH)CH3, 및 이와 유사한 것을 포함하는, 하나 이상의 수소 원자가 하이드록시로 치환된 알킬을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "하이드록시아릴"은 하나 이상의 수소 원자가 하이드록시로 치환된 아릴을 의미하며, 여기에서 아릴은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "알킬티오"은 -S-CH3, -S-CH2CH3, -S-(CH2)2CH3, -S-(CH2)3CH3, -S-(CH2)4CH3, -S-(CH2)5CH3, 및 이와 유사한 것을 포함하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "설폰산" 및 “설포”는 -S03H를 의미한다.
본 명세서에서 사용된 용어 "설포닐알킬"은 -SO2-CH3, -SO2-CH2CH3, -SO2-(CH2)2CH3, -SO2-(CH2)3CH3, -SO2-(CH2)4CH3, 및 -S02-(CH2)5CH3을 포함하는 -S02-(알킬)을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "설피닐알킬(sulfinylalkyl)"은 -SO-CH3, -SO-CH2CH3, -SO-(CH2)2CH3, -SO-(CH2)3CH3, -SO-(CH2)4CH3, -SO-(CH2)5CH3, 및 이와 유사한 것을 포함하는, -SO-(알킬)을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서에서 사용된 용어 "티오알킬"은 -S-CH3, -S-CH2CH3, -S-(CH2)2CH3, -S-(CH2)3CH3, -S-(CH2)4CH3, -S-(CH2)5CH3, 및 이와 유사한 것을 포함하며, 여기에서 알킬은 위에서 정의된 것과 같다.
본 명세서의 용어, "치환"은 화합물의 탄소 원자에 결합된 수소 원자가 다른 치환기로 바뀌는 것을 의미하며, 치환되는 위치는 수소 원자가 치환되는 위치 즉, 치환기가 치환 가능한 위치라면 한정하지 않으며, 2 이상 치환되는 경우, 2 이상의 치환기는 서로 동일하거나 상이할 수 있다.
본 명세서에서 사용된 용어 "치환된"(substituted)은 치환되는 부분(예를 들어, 알킬, 아릴, 헤테로아릴, 헤테로사이클 또는 사이클로알킬)의 수소 원자가 다른 원자 또는 다른 작용기(즉, 치환기)로 대체되는 것을 의미한다. 케토치환기의 경우, 두개의 수소원자는 이중결합에 의해 탄소에 부착되는 산소로 치환된다. 치환체와 관련하여 별도의 기재가 없는 한, 본 발명의 임의로 치환된 치환체로는 할로겐, 하이드록실, (저급)알킬, 할로알킬, 모노- 또는 디-알킬아미노, 아릴, 헤테로사이클, -NO2, -NRa1Rb1, -NRa1C(=O) Rb1, -NRa1C(=O)NRa1Rb1, -NRa1C(=O)ORb1, -NRa1SO2Rb1, -ORa1, -CN, -C(=O)Ra1, -C(=O)ORa1, -C(=O)NRa1Rb1, -OC(=O)Ra1, -OC(=O)ORa1, -OC(=O)NRa1Rb1, -NRa1SO2Rb1, -PO3Ra1, -PO(ORa1)(ORb1), -SO2Ra1, -S(O)Ra1, -SO(=NRa1)Rb1 (예를 들어, sulfoximine), -S(=NRa1)Rb1 (예를 들어, sulfilimine) 및 -SRa1가 이용될 수 있으며, 여기에서 Ra1와 Rb1는 같거나 다를 수 있으며, 서로 독립적으로 수소, 할로겐, 아미노, 알킬, 알콕시알킬, 할로알킬, 아릴 또는 헤테로사이클이고, 또는 부착된 질소원자와 같이 Ra1와 Rb1는 헤테로사이클 형태가 될 수 있다. 여기서 Ra1와 Rb1는 결합된 원자에 따라 복수 개일 수 있으며, 상기 알킬은 C1-C20알킬일 수 있으며, 아릴은 C6-C20일 수 있으며, 헤테로사이클은 C3-C20일 수 있다.
본 발명은 놀라운 항생효과를 가지는 마크로코신 유도체를 제조할 수 있는 마크로코신 기반 카르복실산 화합물의 제조방법을 제공하는 것으로,
본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은,
하기 화학식 2로 표시되는 마크로코신 화합물을 금속수산화물과 반응시켜 하기 화학식 1로 표시되는 마크로코신 기반 카르복실산 화합물을 제조하는 단계를 포함한다.
[화학식 1]
[화학식 2]
상기 화학식 1 및 2에서,
R1 내지 R3은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며,
상기 R1 내지 R3의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나이상으로 더 치환될 수 있으며;
Ra는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며;
Rb는 수소 또는 C1-C10알킬이다.
본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 특정한 마크로코신 화합물을 금속 수산화물과 반응시켜 특정한 작용기()를 절단하여 하이드록시기가 도입됨으로써 제조된 마크로코신 기반 카르복실산 화합물은 우수한 활성을 가지는 다양한 작용기의 도입이 용이하다.
구체적으로, 화학식 2의 마크로코신 화합물은 말단에 카보닐기를 포함하고 있으며, 말단에 존재하는 카보닐기는 금속 수산화물의 처리에 의하여 티아졸에 결합된 아마이드 작용기(-C(=O)-NH-) 내 산소와 분자내 수소결합을 형성할 수 있으며, 형성된 수소결합은 티아졸 고리에 결합된 카보닐을 활성화시켜 수산화이온의 친핵성 첨가를 유도할 수 있다. 이로 인하여 티아졸에 결합된 아마이드 작용기(-C(=O)-NH-) 내 질소 원자는 염기도가 현저하게 낮아지게 되어 상당히 우수한 이탈기로 작용할 수 있다.
본 발명의 일 실시예에 있어서, 상기 R1 내지 R3은 서로 독립적으로 수소 또는 C1-C10알킬이며, 상기 R1 내지 R3의 알킬은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나이상으로 더 치환될 수 있으며,
더욱 좋기로는 R1 내지 R3은 서로 독립적으로 수소 또는 C1-C5알킬이며, 상기 R1 내지 R3의 알킬은 하이드록시, 티오, C1-C5알킬티오, C1-C5알킬, C1-C5알콕시, 하이드록시C1-C5알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C8헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있다.
바람직하게 본 발명의 일 실시예에 있어서, 상기 Ra는 수소 또는 C1-C10알킬이며; Rb는 C1-C10알킬일 수 있다.
바람직하게 본 발명의 일 실시예에 있어서, 상기 R1 내지 R3은 서로 독립적으로 수소 또는 이며, L1은 C1-C3알킬렌이며, R4는 수소, 하이드록시, 티오, C1-C4알킬티오, C1-C4알킬, C1-C4알콕시, C6-C12아릴, 하이드록시C6-C12아릴 또는 C3-C10헤테로아릴일 수 있다.
보다 바람직하게 본 발명의 일 실시예에 있어서, 상기 R1 내지 R3은 서로 독립적으로 수소이거나, 하기 구조에서 선택되는 어느 하나일 수 있다:
더욱 바람직하게 본 발명의 일 실시예에 따른 화학식 2는 하기 화학식 2-1로 표시될 수 있다.
[화학식 2-1]
상기 화학식 2-1에서,
Ra는 수소 또는 C1-C10알킬이며,
Rb는 C1-C10알킬이며;
L1a 내지 L1c는 서로 독립적으로 C1-C3알킬렌이며;
R4a 내지 R4c은 서로 독립적으로 수소, 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 또는 C3-C10헤테로아릴이다.
좋기로는 상기 화학식 2A에서 Ra는 C1-C5알킬이며, Rb는 C1-C5알킬이며; L1a 내지 L1c는 서로 독립적으로 C1-C3알킬렌이며; R4a 내지 R4c은 서로 독립적으로 수소, 하이드록시, 티오, C1-C5알킬티오, C1-C5알킬, C1-C5알콕시, 하이드록시C1-C5알킬, 페닐, 나프틸, 하이드록시페닐, 이미다졸릴 또는 인돌릴일 수 있으며, 더욱 좋기로는 상기 화학식 2A에서 Ra는 C1-C3알킬이며, Rb는 C1-C3알킬이며; L1a 내지 L1c는 서로 독립적으로 메틸렌, 1,1-에틸렌, 1,2-에틸렌, 1,1-프로필렌, 1,2-프로필렌, 1,3-프로필렌 또는 2,2-프로필렌이며; R4a 내지 R4c은 서로 독립적으로 수소, 하이드록시, 티오, C1-C3알킬티오, C1-C3알킬, 하이드록시C1-C3알킬, 페닐, 나프틸, 하이드록시페닐, 이미다졸릴 또는 인돌릴일 수 있다.
본 발명의 일 실시예에 따른 마크로코신 화합물은 하기 화학식 2-1-A, 화학식 2-1-B 또는 화학식 2-1-C에서 선택될 수 있으나, 이에 한정이 있는 것은 아니다.
[화학식 2-1-A]
[화학식 2-1-B]
[화학식 2-1-C]
본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 금속 수산화물을 이용하여 온화한 조건 및 단순한 공정으로 마크로코신 골격에 카르복실산기를 도입함으로써 마크로코신 기반 화합물에 다양한 작용기를 손쉽게 도입할 수 있어 우수한 항생효과를 나타낼 수 있는 다양한 마크로코신 유도체를 합성하는 데 있어 매우 유용하다.
바람직하게 일 실시예에 따른 금속 수산화물의 금속은 알칼리금속 또는 알칼리토금속일 수 있으나, 이에 한정되는 것은 아니며, 보다 바람직하게는 알칼리금속일 수 있으며, 구체적으로 Li 또는 Na일 수 있다.
일 실시예에 따른 금속 수산화물은 마크로코신 화합물 1몰에 대하여 3 내지 12몰, 바람직하게 5 내지 10몰로 사용될 수 있으며, 상기 반응은 30 내지 80℃에서 8 내지 24시간동안, 바람직하게는 40 내지 60℃에서 12 내지 24시간동안 수행될 수 있다. 상기 금속 수산화물을 상술된 범위 내로 사용할 경우 목적하는 카르복실산 화합물이 높은 순도 및 수율로 제조 가능하다.
일 실시예에 따른 상기 화학식 2의 마크로코신 화합물은 천연물에서 분리된 것이거나 전합성으로 제조된 것일 수 있으며, 이에 한정이 있는 것은 아니다.
일 구체예에 있어, 상기 화학식 2의 마크로코신 화합물은 유기 합성분야에서 이용가능한 방법으로 합성된 것일 수 있다. 본 발명의 화학식 2의 마크로코신 화합물이 합성된 것일 경우 상기 화학식 2의 마크로코신 화합물은 당업자가 인식할 수 있는 방법이라면 모두 가능하다.
일례로 모토 커플링, 스즈키 커플링, 슈틸레 커플링, 소노가시라 커플링, 헥크 커플링 또는 부트발트 커플링과 같은 아릴-아릴 커플링 반응으로 제조될 수 있다.
바람직하게 아릴-아릴 커플링은 전이금속 촉매 촉매 하에서 수행될 수 있으며, 스즈키 커플링 반응은 Pd(0) 복합체 또는 Pd(II) 염을 사용될 수 있으며, 바람직한 Pd(0) 복합체는 Pd(Ph3P)4와 같은 하나이상의 포스핀 리간드를 함유할 수 있다. 또 다른 바람직한 포스핀 리간드는 트리스(오르토-톨릴)포스핀(Pd(o-Tol)4)일 수 있다.
바람직한 Pd(II) 염은 팔라듐 아세테이트, 즉 Pd(OAc)2일 수 있다. 스즈키 커플링은 염기, 예를 들어 탄산나트륨, 인산칼륨 또는 유기 염기, 예컨대 테트라에틸암모늄 카르보네이트의 존재 하에 수행될 수 있으며, 야마모토 중합은 Ni(0) 복합체, 예를 들어 비스(1,5-시클로옥타디에닐) 니켈(0)이 사용될 수 있다.
일 실시예에 따른 화학식 2의 마크로코신 화합물의 제조방법에서의 반응시간은 반응물질, 용매의 종류와 양 등에 따라 달라질 수 있으며, 일례로 TLC등을 통하여 출발물질이 완전히 소모됨을 확인한 후 반응을 완결시킨다. 반응이 완결되면 감압 하에서 용매를 증류시킨 후, 관 크로마토그래피 등의 통상의 방법을 통하여 목적물을 분리 정제할 수 있다.
일 구체예에 있어, 상기 화학식 2의 마크로코신 화합물은 천연물에서 분리된 것일 수 있다.
일 구체예에 있어, 상기 화학식 2-1-A의 마크로코신 화합물은
1) BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조될 수 있다.
일 구체예에 있어, 상기 화학식 2-1-B의 마크로코신 화합물은
1) BcTclE, BcTclO, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조될 수 있다.
일 구체예에 있어, 상기 화학식 2-1-C의 마크로코신 화합물은
1) BcTclE, BcTclD, BcTclC, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조될 수 있다.
상기 단계 2)의 형질전환된 바실러스 섭틸리스를 발효 배양시켜 각각의 마크로코신 화합물을 생산 및 분비시키는 단계를 추가로 포함할 수 있으나, 이에 제한되지 않는다.
본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 마크로코신 기반의 화합물에 카르복실산기가 도입됨으로써 다양한 작용기의 도입이 매우 용이해 다양한 마크로코신 유도체를 가능하게 한다.
또한, 본 발명은 마크로코신 기반 카르복실산 화합물을 제조하기 위한 출발물질인 마크로코신 화합물의 생합성 방법을 제공한다.
본 발명에 따른 마크로코신 화합물의 생합성 방법은, 하기 화학식 2-2의 마크로코신 화합물을 제조하는 것으로,
1) BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, 및 BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 포함한다.
[화학식 2-2]
상기 화학식 2-2에서,
R5A는 수소 또는 하이드록시이고, R5B는 하이드록시 또는 메톡시이다.
일 실시예에 있어, 상기 발현 벡터는 BcTclO, BcTclD 및 BcTclC 유전자 중 하나 이상을 더 포함할 수 있다.
일 구체예에 있어, 상기 발현 벡터는 BcTclO 유전자를 더 포함할 수 있다.
일 구체예에 있어, 상기 발현 벡터는 BcTclD 및 BcTclC 유전자를 더 포함할 수 있다.
본 발명의 유전자들이 도입된 벡터로 형질전환된 형질전환체에서 마크로코신 화합물의 생합성이 가능하며, 특정 유전자들을 포함하는 벡터로 형질전환된 바실러스 섭틸리스(Bacillus subtilis) 세포 내에서 목적 물질인 마크로코신 화합물을 효율적으로 생합성할 수 있으며, 유용 유전자의 추가적인 도입을 통하여 거대 고리에 다양한 치환기를 도입시킬 수 있다.
또한, 본 발명은 우수한 항생효과를 가질 수 있는 마크로코신 유도체를 제조하기 위한 중간체로 유용하게 사용가능한 마크로코신 기반 카르복실산 화합물을 제공하는 것으로, 마크로코신 기반 카르복실산 화합물은 상기 화학식 1로 표시된다.
또한, 본 발명은 상기 제조된 마크로코신 기반 카르복실산 화합물을 중간체로 하여 항생제로 유용한 마크로코신 유도체를 제조하는 방법을 제공한다.
본 발명의 마크로코신 유도체의 제조방법은,
하기 화학식 2의 마크로코신 화합물을 금속 수산화물과 반응시켜 하기 화학식 1의 마크로코신 기반 카르복실산 화합물을 제조하는 단계;
하기 화학식 1의 마크로코신 기반 카르복실산 화합물로부터 하기 화학식 3의 마크로코신 유도체를 제조하는 단계;를 포함한다.
[화학식 3]
[화학식 1]
[화학식 2]
상기 화학식 1 내지 3에서,
R1 내지 R3은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며;
상기 R1 내지 R3의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있으며;
Ra는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며;
Rb는 수소 또는 C1-C10알킬이고;
Z1 및 Z2은 서로 독립적으로 단일결합, -CONR11-, -NR12CO-, -COO-, -OCO-, -CR13R14-, -NR15COO-, -NR16-, -S-, -O-, -SO2- 또는 -OCONR17-이며, R11 내지 R17은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, 카르복실C1-C10알킬 또는 C1-C10알콕시카보닐C1-C10알킬이며;
A2는 단일결합, C1-C10알킬렌, C3-C10시클로알킬렌, C3-C10헤테로시클로알킬렌, C6-C20아릴렌 또는 C6-C20헤테로아릴렌이며;
R은 수소, 할로겐, 아미노, 하이드록시, -B(OH)2, 치환 또는 비치환 할로C1-C10알킬, 치환 또는 비치환 C1-C10알킬, 치환 또는 비치환 C2-C10알케닐, 치환 또는 비치환 C3-C10시클로알킬, 치환 또는 비치환 C3-C10헤테로시클로알킬, 치환 또는 비치환 C6-C20아릴, 또는 치환 또는 비치환 C3-C20헤테로아릴이다.
일 실시예에 있어서, 상기 화학식 1의 마크로코신 기반 카르복실산 화합물은 하기 화학식 4의 아민 화합물과의 반응에 의해 상기 화학식 3의 마크로코신 유도체를 제조할 수 있다.
[화학식 4]
상기 화학식 4에서, A1, A2, Z1, Z2 및 R은 상기 화학식 3에서의 정의와 동일하다.
일 실시예에 따른 화학식 3의 마크로코신 유도체는 다양한 세균의 사멸 및 억제에 효과적으로, 항생제로서 매우 우수한 효과를 가진다.
일 실시예에 따른 화학식 3에서, 상기 Z1은 단일결합, -CONR11-, -NR12CO- 또는 -COO-이며; Z2는 단일결합, -CONR11-, -NR12CO-, -NR15COO-, -NR16-, -S- 또는 -OCONR17-이며; R11, R12 및 R15 내지 R17은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실C1-C10알킬일 수 있다.
일 실시예에 따른 화학식 3에서, 상기 R은 수소, 아미노, -B(OH)2, C3-C10헤테로시클로알킬 또는 C3-C20헤테로아릴이고, 상기 R의 헤테로시클로알킬 또는 헤테로아릴은 할로겐, 아미노, 니트로, 하이드록시, 카르복실산기, -B(OH)2, C1-C10알킬카보닐, C1-C10알콕시카보닐, C2-C10알케닐, C1-C10알킬, 할로C1-C10알킬, C3-C10헤테로시클로카보닐, 알릴아미노, C1-C10알킬설포닐, 아미노설포닐, 아미노C1-C10알킬, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C1-C10알킬아미노, 디C1-C10알킬아미노, C6-C20아릴아미노, 디C6-C20아릴아미노, C3-C20헤테로아릴, 할로C6-C20아릴, 할로C1-C10알킬C6-C20아릴, C6-C20아릴, C3-C10시클로알킬, C3-C10시클로알킬카보닐, C1-C10알콕시카보닐C1-C10알킬 및 카르복실산C1-C10알킬로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있다.
바람직하게 일 실시예에 따른 화학식 3에서, 상기 Z1 및 Z2은 서로 독립적으로 단일결합, -CONR11-, -COO- 또는 -NR16-이며; R11 및 R16은 서로 독립적으로 수소일 수 있다.
보다 바람직하게 일 실시예에 따른 화학식 3에서, 상기 Z1는 단일결합, -CONR11- 또는 -COO-이며; Z2은 단일결합, -CONR11- 또는 -NR16-이며; R11 및 R16은 서로 독립적으로 수소일 수 있다.
바람직하게 일 실시예에 따른 화학식 3에서, 상기 A1은 또는 이며, R'는 C1-C10알킬이며, p는 0 내지 2의 정수이며; A2는 단일결합 또는 C1-C10알킬렌이며; R는 수소, 아미노, 또는 -B(OH)2이거나, 하기 구조에서 선택되는 어느 하나일 수 있다.
(상기 구조식에서,
X는 O 또는 S이며;
X1는 NR31, O, S 또는 SO2이며;
X2 내지 X5는 각각 독립적으로 NR32, O 또는 S이며;
R20 내지 R22, R31 및 R32는 서로 독립적으로 수소, 할로겐, 니트로, C1-C10알킬카보닐, C1-C10알콕시카보닐, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실C1-C10알킬이다.)
보다 바람직하게 일 실시예에 있어서, 상기 R는 수소, 아미노, 또는 -B(OH)2이거나, 하기 구조에서 선택되는 어느 하나일 수 있다:
(상기 구조식에서,
R21 및 R22는 서로 독립적으로 수소, 할로겐, 니트로, C1-C10알킬카보닐, C1-C10알콕시카보닐, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실산C1-C10알킬이고;
R31 및 R32는 서로 독립적으로 수소, C1-C10알킬카보닐, C1-C10알콕시카보닐, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실산C1-C10알킬이다.)
보다 바람직하게 상기 R21 및 R22는 서로 독립적으로 수소, 할로겐, 니트로, C1-C10알킬 또는 C3-C10시클로알킬이고; R31 및 R32는 서로 독립적으로 수소, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실산C1-C10알킬일 수 있다.
일 실시예에 따른 화학식 3의 마크로코신 유도체는 하기 구조에서 선택될 수 있으나, 이에 한정이 있는 것은 아니다.
일 실시예에 따른 화학식 3의 마크로코신 유도체의 항생제로서의 효과는 KR 10-2022-0068934 A에 상세히 기재되어 있다.
이하 본 발명의 마크로코신 화합물의 제조방법에 대해 구체적인 일례를 들어 설명하나, 이러한 구체적인 실시예로 본 발명이 한정되는 것은 아니다.
[제조예 1] 화합물 A1의 제조
1단계: 화합물 a-1의 제조
N-Boc-L-트레오닌 (2 g, 9.2 mmol)과 (R)-2-((tert-부틸디페닐실릴)옥시)프로판-1-아민 (3.46 g, 11 mmol, 1.2 eq)을 다이클로로메탄 (40 mL)에 녹인 후, 1-에틸-3-(3-디메틸아미노프로필)카보디이미드 (EDCI, 2.1 g, 11 mmol, 1.2 eq), 하이드록시벤조트리아졸 (HOBt, 1.48 g, 11 mmol, 1.2 eq), 다이아이소프로필에틸아민 (DIPEA, 3.2 ml, 18.4 mmol, 2 eq)를 적가한 뒤 상온에서 2시간 동안 교반시켰다. 다이클로로메탄으로 묽힌 뒤 물로 씻었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, 20% ~ 40% 에틸아세테이트/헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 a-1 (2.80 g, 60%)를 얻었다.
1H NMR (600 MHz, CDCl3): δ 7.69 (m, 4H), 7.49 - 7.44 (m, 2H), 7.43 - 7.39 (m, 4H), 6.89 (brs, 1H), 5.47 (d, J = 7.9 Hz, 1H), 4.34 (qd, J = 6.4, 2.0 Hz, 1H), 4.05 - 3.97 (m, 2H), 3.34 - 3.30 (m, 1H), 3.24 (dt, J = 13.5, 4.5 Hz, 1H), 2.87 (brs, 1H), 1.48 (s, 9H), 1.18 (d, J = 6.4 Hz, 3H), 1.10 (s, 9H), 1.06 (d, J = 6.2 Hz, 3H); LCMS : C28H43N2O5Si 에 대하여 515.2 (M+H+).
2단계: 화합물 a-2의 제조
화합물 a-1 (4.50 g, 8.8 mmol, 1.1 eq)을 다이클로로메탄 (40 mL) / 트리플루오로아세트산 (40 mL)에 녹인 뒤, 상온에서 1시간 교반 후, 감압농축시켰다. 얻은 화합물은 다이클로로메탄 (20 mL)에 녹인 뒤, 2-브로모티아졸-4-카르복실산 (1.66 g, 8 mmol), 1-에틸-3-(3-디메틸아미노프로필)카보디이미드 (1.68 g, 8.8 mmol, 1.1 eq), 하이드록시벤조트리아졸 (1.19 g, 8.8 mmol, 1.1 eq), 다이아이소프로필에틸아민 (4.2 mL, 24 mmol, 3 eq)를 적가한 뒤 상온에서 12시간 동안 교반시켰다. 다이클로로메탄으로 묽힌 뒤, 물로 씻어주었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, 20% ~ 50% 에틸아세테이트/헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 노란색 고체 화합물 a-2 (3.00 g, 63%)을 얻었다.
1H NMR (600 MHz, CDCl3) δ 8.08 (s, 1H), 8.01 (d, J = 8.4 Hz, 1H), 7.69 - 7.65 (m, 4H), 7.48 - 7.44 (m, 2H), 7.42 - 7.37 (m, 4H), 6.92 - 6.90 (m, 1H), 4.44 (qd, J = 6.5, 1.9 Hz, 1H), 4.39 (dd, J = 8.4, 1.9 Hz, 1H), 4.02 - 3.97 (m, 1H), 3.55 (brs, 1H), 3.29 (app.t, J = 5.3 Hz, 2H), 1.22 (d, J = 6.5 Hz, 3H), 1.05 (s, 9H), 1.03 (d, J = 6.5 Hz, 3H); LCMS : C27H35BrN3O4SSi 에 대하여 604.1 (M+H+).
3단계: 화합물 a-3의 제조
화합물 a-2 (3 g, 5 mmol)를 다이클로로메탄 (40 mL)에 녹인 뒤, 메탄설포닐 클로라이드 (MsCl, 1.15 mL, 14.9 mmol, 3 eq), 트리에틸아민 (2.1 mL, 14.9 mmol, 3 eq)를 적가한 후, 상온에서 1시간 동안 교반시켰다. 그리고 나서 1,8-디아자바이사이클로[5,4,0]언덱-7-엔 (DBU, 11.2 ml, 74.8 mmol, 15 eq)을 첨가하고 상온에서 2시간동안 교반시켰다. 반응 종결을 확인한 뒤, 다이클로로메탄에 묽힌 뒤, 과포화된 염화암모늄을 넣어 씻어 주었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, 30% ~ 50% 에틸아세테이트/헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 a-3 (2.2 g 75 %)을 얻었다.
1H NMR (600 MHz, CDCl3): δ8.32 (s, 1H), 8.12 (s, 1H), 7.66 - 7.64 (m, 4H), 7.48 - 7.41 (m, 2H), 7.40 - 7.37 (m, 4H), 6.53 (q, J = 7.1 Hz, 1H), 6.39 (app.t, J = 5.3 Hz, 1H), 4.05 - 4.01 (m, 1H), 3.41 (ddd, J = 13.6, 5.4, 3.6 Hz, 1H), 3.33 (dt, J = 13.6, 5.9 Hz, 1H), 1.79 (d, J = 7.1 Hz, 3H), 1.10 (d, J = 6.2 Hz, 3H), 0.99 (s, 9H); LCMS : C27H33BrN3O3SSi 에 대하여 586.1 (M+H+).
4단계: 화합물 a-4의 제조
화합물 a-3 (2.2 g, 3.74 mmol)을 테트라히드로푸란 (30 mL)에 녹인 뒤, 1 M 테트라-n-부틸 암모늄 플루오라이드 (TBAF, 6.74 mL, 6.74 mmol, 1.8 eq)를 적가한 뒤, 상온에서 30분간 교반시켰다. 에틸아세테이트로 묽힌 뒤, 과포화된 염화암모늄을 넣어 씻어 주었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, (2 % ~ 5 % 메탄올 : 98 % ~ 95 % 다이클로로메탄) 용액으로 컬럼크로마토그래피를 이용하여 분리하여 무색 액체 화합물 a-4 (800 mg, 61 %)을 얻었다.
1H NMR (600 MHz, CD3OD): δ 8.30 (d, J = 0.9 Hz, 1H), 6.71 (q, J = 7.1 Hz, 1H), 3.94 - 3.85 (m, 1H), 3.30 (dd, J = 13.5, 4.7 Hz, 1H), 3.20 (dd, J = 13.4, 7.1 Hz, 1H), 1.79 (d, J = 7.1 Hz, 3H), 1.16 (d, J = 6.3 Hz, 3H); LCMS : C11H15BrN3O3S 에 대하여 348.0 (M+H+).
5단계: 화합물 A1의 제조
화합물 a-4 (386 mg, 1.12 mmol)을 다이클로로메탄 (10 mL)에 녹인 뒤, 데스-마틴 페리오디난 (706 mg, 1.66 mmol, 1.5 eq)을 적가하였다. 상온에서 2시간 교반 시킨 뒤, 다이클로로메탄으로 묽히고, 과포화된 탄산수소나트륨으로 씻어 주었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, (2 % ~ 5 % 메탄올 : 98 % ~ 95 % 다이클로로메탄) 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 A1 (356 mg, 89 %)을 얻었다.
1H NMR (600 MHz, CD3OD): δ8.30 (s, 1H), 6.77 (q, J = 7.1 Hz, 1H), 4.07 (s, 2H), 2.18 (s, 3H), 1.81 (d, J = 7.1 Hz, 3H); LCMS : C11H13BrN3O3S 에 대하여 345.9 (M+H+).
[실시예 1] 화합물 13 (마크로코신 P2)의 제조
1단계: 화합물 3의 제조
4-브로모-2-포르밀티아졸 (768 mg, 4 mmol)을 테트라히드로푸린 (10 mL)에 녹인 뒤, 에티닐마그네슘 브로마이드 용액 (0.5 M in THF, 16 mL, 8 mmol)을 0℃에서 천천히 적가하였다. 상온에서 30분간 교반 후, 과포화된 암모늄 클로라이드 용액을 첨가하여 반응을 중지시켰다. 에틸아세테이트로 추출한 뒤 무수 황산나트륨으로 탈수시켜 감압농축하였다. 얻은 잔여물을 30% 에틸아세테이트/70% 헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 하얀 고체 화합물을 얻었다. 얻은 화합물 (632 mg, 2.9 mmol)을 다이클로로메탄 (30 mL)에 녹인 뒤, 이산화망간 (2.52 g, 29 mmol)을 첨가한 뒤, 상온에서 2시간동안 교반시켰다. 셀라이트를 이용하여 망간 잔여물을 걸러낸 뒤, 다이클로로메탄으로 추출하고 무수 황산나트륨으로 탈수시키고 난 뒤, 감압농축하여 갈색 고체 화합물 3 (527 mg, 61%) 를 얻었다.
1H NMR (400 MHz, CDCl3) δ 7.69 (s, 1H), 3.67 (s, 1H); LCMS : C6H3BrNOS 에 대하여 215.9 (M+H+).
2단계: 화합물 5의 제조
화합물 4는 참고문헌[Org. Lett, 2020, 22, 6, 2365-2370]에 개시된 방법으로 합성되었다.
아세토니트릴 (6.52 mL, 125 mmol, 2 eq)을 테트라히드로푸란 (120 mL)에 녹인 후, n-부틸리튬 용액 (2.5 M in hexanes, 54.8 mL, 137 mmol, 2.2 eq)을 -78℃에서 천천히 적가하였다. -78℃에서 20분동안 교반 후, 테트라히드로푸란 (120 mL)에 녹아 있는 화합물 4 (22.3 g, 62.6 mmol)을 같은 온도에서 천천히 적가시켰다. 상온으로 천천히 온도를 올린 뒤, 1시간 동안 반응시킨 뒤, 1 M 농도의 염산을 넣어 반응을 중지시켰다. 에틸아세테이트로 묽힌 뒤, 추가로 염산을 넣어 pH3으로 산성화시켰다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 후 감압농축하여 갈색 고체 화합물 5 (22.2 g, 97%)를 얻었다.
1H NMR (400 MHz, CDCl3) δ 8.29 (s, 1H), 4.71 (d, J = 17.7 Hz, 1H), 4.32 - 4.09 (m, 3H), 1.70 (broad peak, 6H), 1.54 - 1.38 (m, 7H), 1.31 - 1.06 (m, 5H); LCMS : C17H24N3O4S 에 대하여 366.1 (M+H+).
3단계: 화합물 6의 제조
화합물 5 (22.3 g, 61.0 mmol)을 톨루엔 (300 mL)과 아세트산 (60 mL) 혼합물에 녹인 뒤, 아세트산암모늄 (47 g, 610 mmol, 10 eq)을 적가하였다. 120℃에서 1시간 동안 교반시킨 후 상온으로 천천히 식혔다. 에틸아세테이트로 묽힌 뒤, 과포화된 탄산수소나트륨 용액과 물로 씻었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 후 감압농축하여 노란색 오일 화합물 6 (21.0 g, 94%)를 얻었다.
1H NMR (400 MHz, CDCl3) δ 7.60 (s, 1H), 5.59 - 5.51 (m, 2H), 4.81 - 4.50 (m, 2H), 4.21 - 4.10 (m, 1H), 1.67 (s, 6H), 1.48 - 1.36 (m, 6H), 1.27 - 0.96 (m, 6H); LCMS : C17H25N4O3S 에 대하여 365.1 (M+H+).
4단계: 화합물 7의 제조
화합물 6 (21.0 g, 57.5 mmol)을 에탄올 (300 ml)에 녹인 뒤, 화합물 3 (22.9 g, 106.3 mmol, 1.85 eq)을 적가 한 뒤, 60℃에서 90분동안 교반시켰다. TLC와 LC Mass로 출발물질이 사라진 것을 확인한 뒤, 아세트산 (30% volume, 90 ml)을 첨가하고 난 뒤, 90℃에서 16시간 동안 반응시켰다. 감압농축하여 에탄올과 아세트산을 제거한 뒤, 디클로로메탄으로 묽힌 뒤, 과포화된 탄산수소나트륨 용액으로 반응을 중지시켰다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 후 감압농축시켰다. 5% ~ 15% 에틸아세테이트/헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 노란색 고체 화합물 7 (16.5 g, 51%)를 얻었다.
1H NMR (400 MHz, CDCl3) δ 8.27 (s, 1H), 8.19 (s, 2H), 7.48 (s, 1H), 4.85 (d, J = 7.3 Hz, 1H), 4.58 - 4.23 (broad peak, 1H), 1.83 - 1.67 (broad peak, 6H), 1.57 - 1.45 (m, 6H), 1.33 - 1.20 (m, 6H); LCMS : C23H25BrN5O3S2 에 대하여 562.0 (M+H+).
5단계: 화합물 9의 제조
화합물 7 (1.42 g, 2.53 mmol)을 에탄올 (27 mL)과 인산 나트륨 버퍼 용액 (pH 7, 9 mL), 물 (4.5 mL)의 혼합용액에 녹인 뒤, L-시스테인 (3.06 g, 25.3 mmol, 10 eq)을 적가하였다. 100℃에서 24시간 동안 교반 시킨 뒤, 감압농축하여 에탄올을 제거하고 에틸아세테이트로 묽혔다. 과량의 시스테인을 제거하기 위해 1 M 농도의 염산으로 씻은 뒤, 무수 황산나트륨으로 탈수시켰다. 추출하여 얻은 용액을 감압농축하여 갈색 오일의 티아졸린을 얻을 수 있었다.
갈색 오일의 티아졸린 (1.68 g, 2.53 mmol)을 다이클로로메탄 (30 mL)에 녹인 뒤, 브로모트리클로로메탄 (1.0 mL, 10.12 mmol, 4 eq)을 넣은 뒤, 1,8-디아자바이사이클로[5,4,0]언덱-7-엔 (1.88 mL, 12.65 mmol, 5 eq)을 천천히 적가시켰다. 60℃에서 4시간 교반시킨 뒤, 1 M 농도의 염산을 넣어 반응을 중지시켰다. 다이클로로메탄으로 추출한 뒤, 물과 소금물로 세척하였다. 추출한 유기층을 무수 황산나트륨으로 탈수시킨 후 감압농축하고, 5% ~ 15% 메탄올/다이클로로메탄 용액으로 컬럼크로마토그래피를 이용하여 분리하여 갈색 고체 화합물 9 (1.05g, 62%)를 얻었다.
1H NMR (400 MHz, CDCl3) δ 8.35 - 8.05 (m, 3H), 7.89 (bs, 1H), 7.33 (s, 1H), 4.49 - 4.40 (m, 1H), 4.09 - 3.97 (m, 1H), 1.71 - 1.29 (m, 10H), 1.26 - 1.08 (m, 8H); LCMS : C26H27BrN5O5S3 에 대하여 664.0 (M+H+).
6단계: 화합물 10의 제조
화합물 B1은 참고문헌 [Org. Lett, 2020, 22, 6, 2365-2370]에 따라 제조되었다. 화합물 9 (1.05 g, 1.57 mmol)를 아세토니트릴 (8 mL)에 녹인 뒤, 화합물 B1 (932 mg, 1.88 mmol), 1-메틸이미다졸 (0.376 mL, 4.71 mmol, 3 eq), TCFH (Chloro-N,N,N,N-tetramethylformamidinium hexafluorophosphate, 0.528 g, 1.88 mmol, 1.2 eq)을 넣고 상온에서 30분동안 교반시켰다. 이 용액을 에틸아세테이트로 묽힌 뒤, 물로 씻어주고 유기층을 무수 황산나트륨을 이용하여 탈수시키고 감압농축하였다. 이 농축액을 (40% ~ 90 % 에틸아세테이트 : 60 % ~ 10 % 헥산) 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 10 (1.05 g, 60 %)를 얻었다.
1H NMR (400 MHz, CDCl3) δ 8.69 (s, 1H), 8.44 (d, J = 9.5 Hz, 1H), 8.35 - 8.24 (m, 4H), 8.24 - 8.17 (m, 1H), 8.06 (s, 1H), 7.96 (s, 1H), 7.94 - 7.87 (m, 1H), 6.47 (q, 7.1 Hz, 1H), 5.41 - 5.31 (m, 1H), 4.88 (d, J = 5.3 Hz, 1H), 4.78 (bs, 1H), 4.68 - 4.58 (m, 1H), 4.58 - 4.46 (m, 1H), 4.16 - 3.98 (m, 1H), 3.86 (s, 3H), 2.49 - 2.45 (m, 1H), 1.87 (d, J = 7.1 Hz, 3H), 1.69 - 1.48 (m, 6H), 1.45 - 1.32 (m,3H), 1.31 - 1.08 (m, 12H), 1.03 (d, J = 6.8 Hz, 3H), 0.95 (d, J = 6.7 Hz, 3H); LCMS : C46H52BrN10O9S5 에 대하여 1127.1 (M+H+).
7단계: 화합물 11의 제조
화합물 10 (200 mg, 0.177 mmol)을 테트라히드로푸란 (1 mL) / 물 (1 mL)의 혼합용매에 넣고 수산화리튬1수화물 (22 mg, 0.531 mmol, 3 eq)을 첨가한 뒤 상온에서 2시간동안 교반시켰다. 이 용액을 다이클로로메탄에 묽히고, 1 M 염산용액으로 씻어준 뒤, 무수 황산나트륨을 이용하여 탈수시키고 감압농축하여 카복실산을 얻었다. 이 농축액을 다이클로로메탄 (1 mL) / 트리플루오로아세트산 (1 mL)의 혼합용매에 넣고 상온에서 30분동안 교반시킨 후 감압농축하여 트리플루오로아세트산염을 얻었다. 이 농축액을 DMF (1 mL)에 묽힌 뒤, 디페닐포스포릴 아자이드 (0.038 mL, 0.177 mmol, 1 eq), 탄산수소 나트륨 (0.045 mL, 0.531 mmol, 3 eq)을 넣고 12 시간 상온에서 교반시켰다. 이 용액을 다이클로로메탄으로 묽히고, 유기층을 물로 3번 씻어준 뒤 무수 황산나트륨으로 탈수시키고 감압농축한 후 (2 % ~ 5 % 메탄올 : 98 % ~ 95 % 다이클로로메탄) 용액으로 컬럼크로마토그래피를 이용하여 분리하여 노란색 고체 화합물 11 (96 mg, 56%)을 합성하였다.
1H NMR (400 MHz, CDCl3) δ 8.77 (s, 1H), 8.39 (d, J = 9.6 Hz, 1H), 8.22 - 8.18 (m, 2H), 8.16 - 8.09 (m, 3H), 8.01 - 7.92 (m, 3H), 7.40 (s, 1H), 6.39 (q, J = 7.0 Hz, 1H), 5.27 - 5.18 (m, 2H), 4.92 (d, J = 7.8 Hz, 1H), 4.67 (s, 1H), 4.47 - 4.33 (m, 1H), 2.95 (bs, 1H), 2.48 (dq, J = 13.4, 6.6 Hz, 1H), 2.22 (bs, 1H), 1.81 (d, J = 7.0 Hz, 3H), 1.57 (d, J = 5.2 Hz, 3H), 1.19 (d, J = 6.5 Hz, 3H), 1.14 (d, J = 6.7 Hz, 3H), 0.95 (d, J = 6.6 Hz, 3H); LCMS : C37H36BrN10O6S5 에 대하여 955.0 (M+H+).
8단계: 화합물 12의 제조
화합물 11 (41 mg, 0.043 mmol)을 1,4-다이옥산 (0.6 mL)에 녹인 후, 비스(피나콜라토)다이보론 (B2Pin2, 14.2 mg, 0.056 mmol, 1.3 eq), 포타슘아세테이트 (KOAc, 6.7 mg, 0.065 mmol, 1.5 eq), 엑스포스 (Xphos, 3.1 mg, 15 mol%)를 첨가하였다. 첨가한 후, 1분동안 질소를 넣어 주고, 트리스(디벤질리덴아세톤)디팔라듐(0) (Pd2(dba)3, 4mg, 10 mol%)를 적가하였다. 90℃에서 3시간 동안 교반한 후, 다이클로로메탄으로 묽힌후, 유기층을 추출하였다. 추출한 유기층을 물로 세척하고, 무수 황산나트륨으로 탈수시킨 후 감압농축시켜 고체 화합물 12 (18 mg, 47 %)를 얻었다.
1H NMR (400 MHz, MeOD) δ 8.40 - 8.21 (m, 4H), 8.13 (s, 1H), 7.93 (s, 1H), 7.76 (s, 1H), 6.61 (q, J = 6.9 Hz, 1H), 5.29 - 5.19 (m, 2H), 4.75 (d, J = 3.1 Hz, 1H), 4.62 - 4.50 (m, 1H), 4.30 (dd, J = 6.3, 2.9 Hz, 1H), 2.64 (dq, J = 13.4, 6.7 Hz, 1H), 1.85 (d, J = 7.0 Hz, 3H), 1.53 (d, J = 6.4 Hz, 3H), 1.19 (d, J = 6.3 Hz, 3H), 1.13 (d, J = 6.7 Hz, 3H), 0.99 (d, J = 6.7 Hz, 3H); LCMS : C37H38BN10O8S5 에 대하여 921.1 (M+H+).
9단계: 화합물 13의 제조
화합물 12 (276 mg, 0.3 mmol)을 테트라히드로푸란 (6 mL)와 물 (1.5 mL)의 혼합용매에 녹였다. 화합물 A1 (155 mg, 0.45 mmol, 1.5 eq)을 적가한 후, 3분간 질소를 공급하였다. 이후에 탄산칼륨 (124 mg, 0.9 mmol, 3 eq), 테트라키스(트라이페닐포스핀)팔라듐 (Pd(PPh3)4, 10 mol%, 35 mg)을 넣고 다시 질소를 1분간 넣어 주었다. 38℃에서 3시간 동안 교반시킨 후, 감압농축시켰다. 얻은 잔여물을 0~5% 메탄올/다이클로로메탄 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 13 (179 mg, 55%)를 얻었다.
1H NMR (600 MHz, MeOD) δ 8.40 - 8.31 (m, 4H), 8.27 (s, 1H), 8.22 (s, 1H), 8.13 (s, 1H), 7.96 (s, 1H), 6.82 (q, J = 7.1 Hz, 1H), 6.60 (q, J = 6.8 Hz, 1H), 5.24 (d, J = 2.9 Hz, 1H), 5.22 (d, J = 8.8 Hz, 1H), 4.78 (d, J = 3.1 Hz, 1H), 4.62 - 4.55 (m, 1H), 4.30 (qd, J = 6.3, 2.8 Hz, 1H), 4.10 (d, J = 13.0 Hz, 1H), 2.63 (dq, J = 13.4, 6.7 Hz, 1H), 2.19 (s, 3H), 2.20 - 2.14 (m, 1H), 1.92 (s, 1H) 1.86 (app. d, J = 7.0 Hz, 6H), 1.55 (d, J = 6.4 Hz, 3H), 1.18 (d, J = 6.3 Hz, 3H), 1.13 (d, J = 6.7 Hz, 3H), 0.99 (d, J = 6.7 Hz, 3H); LCMS : C48H48N13O9S6 에 대하여 1142.2 (M+H+).
[실시예 2] 마크로코신 화합물의 제조
1) 바실러스 세레우스 게노믹 DNA 분리
바실러스 세레우스(Bacillus cereus) ATCC 14579 균주의 배양을 위해 루리아-버타니 배지(Luria-Bertani, LB; Becton, Dickinso and Company, New Jersey, USA) 를 이용하여 루리아-버타니 한천 배지에 형성된 단일 콜로니를 LB broth 5 ml에 접종하고, 30 ℃에서 3일간 배양하였다. 이를 통해 분리된 균주로부터 게노믹 DNA 미니 키트(genomic DNA extraction kit; promega, WI, USA)를 사용하여 게놈 DNA를 분리하였다.
2) 벡터 제작
Thiocillin을 생합성하는 유전자 클러스터는 24개의 생합성 관련 유전자들이 22kb에 걸쳐 구성되어 있다. 이 중에서 8개의 유전자를 이용하여 Micrococcin P2을 합성할 수 있는 벡터를 제작하였고 이를 바실러스 섭틸리스(Bacillus subtilis) 168에서 발현하여 물질을 확보하고자 하였다.
벡터 제작에 사용된 생합성 유전자는 BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 이다. BcTclIJKLMNP의 경우 자일로스에 의해 유도 가능한 프로모터(Xylose inducible promoter)에 유전자 클로닝을 하였고, BcTclE 역시 동일한 자일로스 유도 프로모터에 4개의 BcTclE 유전자를 연결하여 재조합 플라스미드를 확보하였다.
바실러스 형질전환용 벡터는 pUC19 벡터를 변형하여 준비하였다. pUC19는 바실러스 형질전환에 사용하기 위해 pDG1661 벡터로부터 도입한 amyE, cat, ThrC, 염기 서열을 이용하여 제작하였다. 1번 벡터는 형질전환 바실러스 섭틸리스가 amyE locus에 integration되어 클로람페니콜에 저항성을 갖도록 디자인한 벡터를 이용하여 생합성 유전자들을 삽입하였다. 즉, 1번 벡터는 Micrococcin P2 생합성 유전자(BcTclE,J,K,L,M,N,P)가 클로닝되어 있고, 2번 벡터는 1번 벡터에 BcTclO 유전자를 추가 삽입한 것이다. 3번 벡터의 경우 BcTclD, BcTclC 유전자를 삽입한 벡터이다.
각 유전자들은 DNA로부터 통상적인 중합효소연쇄반응(polymerase chain reaction, PCR) 방법을 통해 증폭하여 Gibson assembly(NEB, England) 또는 리가아제를 이용하여 유전자 클로닝을 하였다. 이에 사용한 벡터는 pUC19을 바실러스 섭틸리스 형질전환할 수 있게 변형한 벡터로, 클로닝 및 벡터의 변형에 사용된 프라이머는 하기 표 1 내지 표 3에 기재된 바와 같다.
1번 벡터 | |||
번호 | 이름 | 프라이머 서열 | 주형 |
1 | amyE-F | GTGCACCATATGTTTGCAAAACGATTCAAAACC | pDG1661 |
2 | amyE-R | TCGAATTCCGTATCATGCGACTCTACC | pDG1661 |
3 | cat-amyE-F | CGACCTGCAGGCATGCAAGCTTGCACCCATTAGTTCAACAAAC | pDG1661 |
4 | cat-amyE-R | ATGACCATGATTACGCCAAGCTATCAATGGGGAAGAGAACCGC | pDG1661 |
5 | xylR-CRE-F | ACGGAATTCGAGCTCGGTACCGAACTCCTTTTTCATATGAGAAGG | gDNA |
6 | xylR-CRE-R | TTCTAGAGGATACCCGGGTACCTTAGTAAACCACTTTGTTTGCGCTTCC | gDNA |
7 | BcTclE-F | GGGGCTAGCTTTAAGAAGGAGATATACAT | gDNA |
8 | BcTclE-R | GCTCTAGATTAAGTTGTACAACAACTGC | gDNA |
9 | BcTclI-F | GTTTACTAAGGTACCCGGGATCCGTTTGTTCCCTTTATAGAAAGG | gDNA |
10 | BcTclJ-R | TCAGTGGTGGTGGTGGTGGTGCTCGAGTTATGGGAAAGGATGAGGAGTTAC | gDNA |
11 | BcTclK-F | TCCTCATCCTTTCCCATAACATTTTTTATGAAAGATGG | gDNA |
12 | BcTclL-R | TCAGTGGTGGTGGTGGTGGTGCTCGAGTCATCCCTTTCTACTCTTATACAATG | gDNA |
13 | BcTclM-F | ATAAGAGTAGAAAGGGATGACTTAAATGGAGCAGTATC | gDNA |
14 | BcTclN-R | TCAGTGGTGGTGGTGGTGGTGCTCGAGTCATACATAAAATTGTTCTCCTTTAGTT | gDNA |
15 | BcTclP-F | TAAAGGAGAACAATTTTATGTATGACGGAAAACGGGTGAATC | gDNA |
16 | BcTclP-R | TCAGTGGTGGTGGTGGTGGTGTCGAGATCTAGTGTAATGTATAACCACC | gDNA |
2번 벡터 | |||
번호 | 이름 | 프라이머 서열 | 주형 |
1 | TclO-F | AGGAGAACAATTTTATGTATGACGAATAAAACTAAAGGAGAAC | gDNA |
2 | TclO-R | TCAGTGGTGGTGGTGGTGGTGCTCGAGCTAACGTTTTATTCCATTCAC | gDNA |
3번 벡터 | |||
번호 | 이름 | 프라이머 서열 | 주형 |
1 | TclD-F | TGCAGTTGTTGTACAACTTAACAATTAGAGAGGAGTATAC | gDNA |
2 | TclC-R | TCAGTGGTGGTGGTGGTGGTGCTCGAGTCAAGAAAGATTAATATTATCTAC | gDNA |
유전자 클로닝을 위한 숙주세포로 대장균(Escherichia coli) DH5α (Enzynomics, Korea)을 선택하였고, 유전자는 시퀀싱을 통해 돌연변이가 없음을 확인한 후에, 다음 분자클로닝을 진행하였다. 이를 통해 바실러스에서 티오펩타이드를 생합성 할 수 있는 벡터를 제작하였다. pUC19에 새로 도입된 유전자 재조합 플라스미드 도식도는 도 1, 도 2 및 도3 에 나타내었으며, 이의 염기서열은 서열목록에 기재하였다.
3) 형질전환 바실러스에서의 물질 합성 및 분석
도 1, 도 2 및 도 3에 도시된 3개의 플라스미드는 Bacillus subtilis 168 숙주에 통상적으로 알려진 프로토콜을 사용하여 형질전환하였다. 형질전환된 바실러스 섭틸리스를 루리아-버타니(LB) 배지에서, 클로람페니콜(Chloramphenicol, Sigma, USA) 10 ug/mL, 생합성 유전자의 발현을 유도하기 위해서 자일로스(Xylose, TCI, Tokyo)을 1%가 되게 첨가하여 72시간동안 37 ℃, 200rpm을 유지하면서 배양하였다. 생합성 유전자들에 의해 생산되는 대사산물을 확인하기 위해 각 플라스미드에 의해 형질전환된 바실러스 섭틸리스 균주를 메탄올을 이용해 추출하여, UPLC-MS(Ultra Performance Liquid Chromatography Mass Spectrometry)을 통해 확인하였다. 그 결과를 도 4에 도시하였으며, 검출된 물질들의 질량들을 확인해 보았을 때, 1번 물질은 1142.6, 2번 물질은 1156.5, 3번 물질은 1158.3 의 수치를 나타냈다.
4) 발현된 대사산물의 분리정제
플라스미드 1과 2에 의해 형질 전환된 바실러스로부터 합성된 물질을 각각 분리 정제하였다. 자일로스를 통한 생합성 유전자의 발현 후 세포 배양액 2L를 4,000 xg에서 20 분간 원심분리하여 세포를 수득하여 상등액을 버리고, 메탄올 100mL을 이용하여 재현탁한 후 20분 동안 상온에 방치하였다. 이후 12,000 xg에서 15 분간 원심분리하여 추출액을 확보하였다.
확보한 메탄올 추출액은 무수 황산나트륨으로 탈수시켜 감압농축시켰다. 이를 다시 메탄올/다이클로로메탄(1/9 (v/v))으로 녹이고 유기층을 필터 후, 분취컬럼크로마토크래피 (Prep-HPLC) (5 % ~ 70 % 아세토나이트릴 (0.1% TFA) : 95 % ~ 30 % 물 (0.1% TFA))를 이용하여 화합물을 얻었다. 얻어진 2가지의 물질의 구조를 입증하기 위해 600MHz 핵자기공명기를 이용하여 1H NMR 스펙트럼을 다음과 같이 얻었다.
도 4에 도시된 1번 물질은 흰색 고체 화합물로 얻어졌으며, 이의 1H NMR은 천연물 Micrococcin P2와 동일함을 확인하였다.
<1번 물질> 1H NMR (600 MHz, MeOD) δ 8.40 - 8.31 (m, 4H), 8.26 (s, 1H), 8.21 (s, 1H), 8.14 (s, 1H), 7.95 (s, 1H), 6.83 (q, J = 7.1 Hz, 1H), 6.60 (q, J = 6.8 Hz, 1H), 5.25 (d, J = 2.9 Hz, 1H), 5.21 (d, J = 8.9 Hz, 1H), 4.77 (d, J = 3.1 Hz, 1H), 4.63 - 4.56 (m, 1H), 4.30 (qd, J = 6.3, 2.8 Hz, 1H), 4.10 (d, J = 13.0 Hz, 1H), 2.63 (dq, J = 13.4, 6.7 Hz, 1H), 2.19 (s, 3H), 2.20 - 2.14 (m, 1H), 1.93 (s, 1H) 1.85 (app. d, J = 7.0 Hz, 6H), 1.55 (d, J = 6.4 Hz, 3H), 1.18 (d, J = 6.6 Hz, 3H), 1.13 (d, J = 6.6 Hz, 3H), 0.99 (d, J = 6.9 Hz, 3H); LCMS : C48H48N13O9S6 에 대하여 1142.2 (M+H+).
도 4에 도시된 2번 물질은 노란색 고체 화합물로 얻어졌으며, 이의 1H NMR은 천연물 Thiocillin IV와 동일함을 확인하였다.
<2번 물질> 1H NMR (600 MHz, CDCl3) δ 8.71 (s, 1H), 8.57(s, 1H), 8.30 (d, J = 8.0 Hz, 1H), 8.26 (s, 1H), 8.20 (s, 1H), 8.17 - 8.14 (m, 2H), 8.08 - 7.99 (m, 3H), 7.92 (s, 1H), 7.79 (d, J = 7.1 Hz, 1H), 7.74 (s, 1H), 6.89 (d, J = 7.0 Hz, 1H), 6.49 (q, J = 6.9 Hz, 1H), 5.40 (d, J = 10.2 Hz, 1H), 5.25 (t, J = 9.7 Hz, 1H), 4.96 (dd, J = 6.8, 3.5 Hz, 1H), 4.49 (s, 1H), 4.46 (s, 1H), 4.15(m, 1H), 2.85(s, 3H), 2.53 (ddd, J = 16.3, 13.4, 6.7 Hz, 1H), 2.28 (s, 3H), 1.86 (d, J = 7.0 Hz, 6H), 1.69 (d, J = 6.3 Hz, 3H), 1.20 (d, J = 6.6 Hz, 3H), 1.16 (d, J = 6.3 Hz, 3H), 1.00 (d, J = 6.6 Hz, 3H); LCMS : C49H49N13O9S6 에 대하여 1156.6.
한편, 도 4에 도시된 3번 물질은 UPLC-MS을 통해 검출된 질량이 1158.3 의 수치를 나타내 YM-266183과 질량이 일치함을 확인하였다.
각 플라스미드를 통해 생합성된 물질의 구조를 하기 표 4에 기재하였다.
상기 표 4의 각 화합물들은 순서대로 플라스미드 1, 2 및 3에 의해 합성된 Micrococcin P2, Thiocillin IV 및 YM-266183의 구조를 나타낸다.
플라스미드 1에는 생합성 유전자 BcTclE,I,J,K,L,M,N,P 가 삽입되어 있고, 이로부터 천연물 Micrococcin P2이 합성되었다. 플라스미드 1은 Micrococcin P2 생합성 가능한 유전자 클러스터로, 플라스미드 1을 구성하고 있는 생합성 유전자에 의해 천연물 Micrococcin P2 골격이 합성이 가능함을 알 수 있다.
플라스미드 2는 플라스미드 1에 BcTclO 유전자가 추가로 삽입되어 있으며, 이로부터 Thiocillin IV이 얻어졌다. 즉, Micrococcin P2 생합성 유전자와 BcTclO 유전자를 함께 삽입하는 경우 선택적으로 O-Methylation된 Thiocillin IV을 합성할 수 있음을 알 수 있다.
플라스미드 3에는 플라스미드 1에 BcTclD, BcTclC 유전자가 추가로 삽입되어 있으며, 이에 의하여 Valine hydroxylation된 물질, YM-266183이 얻어졌다. 즉 Micrococcin P2 유전자와 BcTclD, C 유전자를 함께 발현하는 바실러스를 배양, 분리 정제함으로써, YM-266183 화합물을 얻을 수 있음을 알 수 있다.
생합성 유전자들은 각 플라스미드 예시에서 확인할 수 있듯이, TclO, 혹은 TclD,C와 천연물 Micrococcin P2간의 조합을 통해 마크로사이클 내부의 생합성 효소에 의한 변형을 조절할 수 있다.
[실시예 3] 마크로코신 기반 카르복실산 화합물 C-1의 제조
Micrococcin P2 (14 mg, 0.012 mmol)을 테트라히드로푸란 (150 μL) / 물 (150 μL)의 혼합용매에 넣고 수산화리튬 일수화물(LiOH·H2O) (4.0 mg, 0.096 mmol)을 첨가한 뒤 50℃에서 17시간동안 교반시켰다. 교반 완료 후, 상기 반응혼합물을 다이클로로메탄으로 묽히고, 1M 염산용액으로 씻어준 뒤, 수퍼 솔벤트 (클로로포름 : 프로판올 = 4 : 1 (v:v))로 추출하였다. 이후에 무수 황산나트륨을 이용하여 탈수시킨 뒤, 분취컬럼크로마토크래피 (Prep-HPLC) (5 % ~ 70 % 아세토나이트릴 (0.1% TFA) : 95 % ~ 30 % 물 (0.1% TFA))를 이용하여 분리하여 옅은 노란색의 고체 화합물 C-1 (7.4 mg, 61 %)을 얻었다.
1H NMR (400 MHz, DMSO, ppm) δ 9.55 (s, 1H), 8.59 - 8.51 (m, 2H), 8.50 - 8.35 (m, 3H), 8.35 - 8.27 (m, 2H), 8.28 - 8.17 (m, 2H), 8.13 (s, 1H), 7.88 (d, J = 7.6 Hz, 1H), 6.47 (q, J = 6.5 Hz, 1H), 5.20 - 4.96 (m, 2H), 4.73 - 4.63 (m, 1H), 4.42 - 4.33 (m, 1H), 4.04 - 3.96 (m, 1H), 1.76 (d, J = 6.3 Hz, 3H), 1.38 (d, J = 6.0 Hz, 3H), 1.00 (dd, J = 25.3, 6.1 Hz, 6H), 0.86 (d, J = 6.4 Hz, 3H); LCMS : C41H37N11O8S6 에 대하여 1004.2 (M+H+).
[실시예 4] 마크로코신 기반 카르복실산 화합물 C-2의 제조
상기 실시예 3의 Micrococcin P2 대신에 Thiocillin IV을 사용하는 것을 제외하고는 실시예 3과 동일하게 반응시켜 카복실산 화합물 C-2을 제조하였으며, 이를 LCMS을 통해 확인하였다. LCMS: C42H40N11O8S6 1018.2 (M+H+)
[실시예 5] 마크로코신 유도체 9의 제조
상기 실시예 3에서 제조된 마크로코신 기반 카르복실산 화합물 C-1 (30 mg, 0.03 mmol)을 디메틸포름아마이드 (0.3 mL)에 녹인 뒤 1-에틸-3-(3-디메틸아미노프로필)카보디아미드 (7.5 mg, 0.039 mmol, 1.3 eq), 하이드록시벤조트리아졸 (5.3 mg, 0.039 mmol, 1.3 eq), N,N-디이소프로필에틸아민 (21 uL, 0.12 mmol, 4 eq), 아민화합물 z-1 (8.6 mg, 0.036 mmol, 1.2 eq)을 넣고 상온에서 12시간 동안 교반시켰다. 교반 완료 후, 이 용액을 다이클로로메테인으로 묽히고, 유기층을 물로 3번 씻어준 뒤 무수 황산나트륨으로 탈수시켜 감압농축하였다. 얻은 잔여물을 (3~5 % 메탄올 : 97~95 % 다이클로로메탄) 용액으로 컬럼크로마토그래피를 이용해 분리하여 흰색 고체의 마크로코신 유도체 9 (15.1 mg, 41 %)를 얻었다.
1H NMR (400 MHz, CDCl3) δ 8.58 (s, 1H), 8.39 (d, J = 9.6 Hz, 1H), 8.29 (d, J = 8.1 Hz, 1H), 8.26 - 8.15 (m, 4H), 8.14 - 8.09 (m, 2H), 8.01 - 7.94 (m, 4H), 7.40 (t, J = 6.2 Hz, 1H), 6.42 (q, J = 7.0 Hz, 1H), 5.88 (s, 1H), 5.29 - 5.18 (m, 2H), 4.87 (d, J = 7.9 Hz, 1H), 4.64 (s, 1H), 4.50 (s, 1H), 4.40 (d, J = 6.6 Hz, 1H), 3.93 (s, 2H), 3.63 (t, J = 6.1 Hz, 2H), 3.32 - 3.22 (m, 2H), 2.96 (s, 1H), 2.54 - 2.42 (m, 1H), 1.92 - 1.69 (m, 7H), 1.57 (d, J = 6.3 Hz, 3H), 1.23 - 1.16 (m, 5H), 1.15 (d, J = 6.7 Hz, 3H), 0.97 (d, J = 6.6 Hz, 3H) ; LCMS : C51H51N15O10S6 에 대하여 1226.23 (M+H+).
이상과 같이 본 발명에서는 특정된 사항들과 한정된 실시예에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
<110> A&J SCIENCE CO.,LTD.
<120> Method for preparing micrococcin-based carboxylic acid compound
and micrococcin-based carboxylic acid compound prepared therefrom
<130> 22P220267
<150> KR 10-2021-0085881
<151> 2021-06-30
<160> 3
<170> KoPatentIn 3.0
<210> 1
<211> 18647
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid 1 - Example 2
<400> 1
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgtt tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat 240
tgctgtttca tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat 300
cgaatgagct tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt 360
cgttcaatac gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc 420
agacatctcc gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact 480
ggtactggct gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac 540
aagaatttaa agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg 600
cggtcatcaa tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc 660
caaactggac acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc 720
agaattcatt gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc 780
tgaaacggtt cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg 840
ccaaacatat agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca 900
caaatacatc tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg 960
ctgcatatgc gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg 1020
ctttaaagaa tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg 1080
cggacaagct agtgacatgg gtagagtcgc atgatacgga attcgagctc ggtaccgaac 1140
tcctttttca tatgagaagg tgccatgtca ctattgcttc agaaatactc ctagaataaa 1200
aaaactcatc tttaaagatg agctgtccat tccataaaaa attacattgt aatcatgtcc 1260
agaaaatgat caatcacaat ggaggacatt cctaatgccg gtgcattctg tcctaaggaa 1320
gatggcaata attcatagct attgcctaat tgggaataaa cccttgatga tacttcactt 1380
ctcattgaat ttaaaaccat aggatgcgat tcaattatgc tatttcttaa aattacggct 1440
tgtgggttga aagtatttag aatattggta aggcctattc ctaaatagaa tccaaaattt 1500
tgtaatgcat ttaaggttcc gatatcattc agatgggcga ggtttatgat atcttgatag 1560
gacagttttt tctctttggt ctgaagagat tttaataaag ccttctctga agcatacaat 1620
tcccagcatc ctcggtttcc gcaactgcat ttaggaccat taaagtctat tgtcatatgt 1680
cccatttctc cagagaagcc gcttactcct ctatataaat gattgttgat aataacaccg 1740
atccctattc ctgtgctgat acttacgtaa ataatgttat cgtgattttt tgcagctcca 1800
aatacttttt ctccatatgc gccagcattt gcctcatttt caataaaaac aggcacattg 1860
tacttctctt gtatcgaaga ttttaagtca atatctctcc agttggagtt cggagtgaaa 1920
acaatttttt gatctttatc aatgagtcca ggcacgcaaa tacctatacc aataagcccg 1980
tacggagatt ggggcatttg cgtaataaag tgatgaatca tatcaatcaa aatgtctttc 2040
gttatttctg gagaattgga ttccaaatgg cggtattgat caagaacgat tgttccttca 2100
aggtctgtta aaatgccatt aatataatcc acaccaacat ctattccaac ggagtatcct 2160
gcctttttat taaaaacaag catgacaggt cttcttccgc cacttgattg tccttgacct 2220
atttcaaata ccatactttc tttcattaac gtgtttacct gtgatgagac agttgattta 2280
tttaatccag tcatttcaga taattttgct cttgaaatag gtgaattttt aaggatttct 2340
tttaataata acttttgatt tacttttttg acaaaggttt gatcagcgat atccacttca 2400
tccactccat ttgtttaatc tttaaattaa gtatcaacat agtacatagc gaatcttccc 2460
tttattatat ctaatgtgtt cataaaaaac taaaaaaaat attgaaaata ctgacgaggt 2520
tatataagat gaaaataagt tagtttgttt aaacaacaaa ctaataggtg atgtacttac 2580
tatatgaaat aaaatgcatc tgtatttgaa tgaatttatt tttaaggggg aaatcacatg 2640
gctcaatctc attccagttc aatcaactat tttggaagcg caaacaaagt ggtttactaa 2700
ggtacccggg ctagctttaa gaaggagata tacatatgag tgaaattaaa aaagcattaa 2760
atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat gctatgccag 2820
aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt acatgcagtt 2880
gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa ttaaaaaagc 2940
attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg ttgatgctat 3000
gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg tatgtacatg 3060
cagttgttgt acaacttaat ctagctttaa gaaggagata tacatatgag tgaaattaaa 3120
aaagcattaa atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat 3180
gctatgccag aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt 3240
acatgcagtt gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa 3300
ttaaaaaagc attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg 3360
ttgatgctat gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg 3420
tatgtacatg cagttgttgt acaacttaac tcgagcacca ccaccaccac cactgacgta 3480
cgggcccaag cggtacccgg ggatccgttt gttcccttta tagaaaggaa tgatcaaatg 3540
ttagaaataa aagaaaaaca atttattaaa ttaaaagagg acacattctt ttttccttca 3600
gctgaaggga tatactttag gaattctata ggttatttta caatcaaagg tagaaatatt 3660
tacccgtttt ttagtgaaat cagtaaatat ttgaatggta aatatacttt gaaagatata 3720
gtgagtgagt taagcaaaac ccaagaagaa aaatttttaa aattaattgc catattagag 3780
aagaatggtt ttgtaaaata taccgaaagg gttattgatg aaaattatta taaaaattat 3840
gaaaaagaaa ttgcatttat agattattat actaataatg gcatcgaatt atttaaaaaa 3900
ctctctaatt tcaagatttg tttatatggt agcaataagt tatctaatac tattcaaaaa 3960
agcttagaaa acatagggat acaaaatatt aaaagaggct ctcgttttga ttttgaggga 4020
gacattgtta tttattgcaa taatgatgtt aatgaaaggg aaaatctact ggaatgtatg 4080
gacttttctc agaataaaat atttattttt gtaggtaata aagaatcatt aggaattatt 4140
agtcctatta taaaaaattt agatgattgg aaggaatttg aaaatatatt agagattggt 4200
gcagataata ttaaagaaaa tacaacattt actagcaact ctatattaag tagtatgcta 4260
agttttgaaa ttataaagta tgtaacaaat tgtttgcaaa gtgatttaat taatgcggca 4320
tacattttaa atactgatac tttaaaaggg aattttgttc aggtaaaaaa aaaaatagac 4380
ttaaaacaag attttattga aactttcaaa caatcaagcg gaggcaacgg tttgtatatc 4440
aataaaatag gtagaggttc taggaaacaa attccgctct cgcaatggga ggttgaattg 4500
gataaattag gtgacatgaa tagtgaaaaa attaaggtcg ttagctttgg tgatacccac 4560
caggaagcga ggtttaatac ttattataaa accatagaac atctaataat caatggggaa 4620
tttaacttag aggaatcata tagctttaag aatcttgata caatcacttt agctattgat 4680
gaacaattta aaagaaaatt aacaatttca tgcgacatag ataaagaact tgcaatcaga 4740
aaagcaatat taaaagcaat tttaaagagg gaaattaatg taattgataa ttatcaagag 4800
ctttccccat taaaaataag tgattatata gataataaaa atatacaata ctattgtaaa 4860
ctgattaaca ttttaaaagc gaaaatagaa ttgcgtttta agaaattagt agagggtttg 4920
tttttggtag tagttagtga caatagttat aggggagtta gtataggatt taatttaaat 4980
acagcattag aaaatgctct taggcaattt attaataatt tacaaaatag tatctataca 5040
ataaatattg aagatgtaat atttaaaaga attaatgatt gggatgatga atgcattcga 5100
gagtttttga cagatgaaaa attagaagtt tttatctgta gtatacaaaa taatgttatt 5160
tcagcagaaa tttctatagt tggagcaata ttaatagaaa gttaggtgaa ttgaaaaatg 5220
aataaggaag tccttataat cagggatgaa agctttggag aattttttga ttcttttttt 5280
ttaaatgaaa ataatcgaaa agtttgtttt atagatagta ataaaaaaga tttgaaatat 5340
ttattaaaaa actttttaga gaataaaaag tttagttatg tactaatctt tccaaaggaa 5400
tggaatccta tgatgtatag gtcacttgat gcagtgttag aagactatga tgtaccgtgg 5460
atctatataa cacaattttt taataaaatt ttaataggtc cttttagaaa ttctaagcaa 5520
aaaggttgtt tagattgttt atattataga tggtttatga caaaaaagga tcgtattaat 5580
ttatttgaat tgaagaaatg tttatcagaa ggacataatg taaaaatatc tggagattta 5640
ttgaatgctt caatggttgg attagcaatt actttagcat ttaaactaat aaataatgag 5700
gtttcggaat tttcgtatat tattgacaaa aagacattga gattcaatgg tcataatttt 5760
ttacctaatc cacattgtca agtatgtggg cacatggata atgacgagaa aagattaata 5820
gaacacaaat tttttacagc acttaacgat aatactctta aagaaaagaa aggaaatcgt 5880
tttttatcaa aagaatattt agaagatacc ctatctaaaa attttttaga tgtagaaact 5940
ggtatattta ataaactttt ggacgattat gaaagtcctt tcgcagtttc ggtagcaaat 6000
cttcctttaa aggttggaaa ggatgaggtt ggtgttggaa gaacggataa ttatgctaat 6060
agtcacttaa ctgcaatatt agaaggaata gagagatatt gcggaatgga accaaggggg 6120
aatagaacta acgtttttgg tagttataat gagctaatgg aaaatgctct caatccatct 6180
gttttaggat tacacgcgga agaacagtat caattaaaaa gatttccttt taataaatat 6240
aatccagata aaaaaatgaa atgggtctgg gggtattctt ttaataagaa taaggcgata 6300
ttagtccctg aaacttatgc ctattatggt acgaattata gagatggcgt tcaaaatagt 6360
tttgtttatg aaatctcgaa tggatgtgct ttaggaggac atttattgga agctacattg 6420
caaggaattt atgaagtagt ggaaagagat gcttttctta tatcttggta tactaaatta 6480
ccattaaaac gtataagaaa agaatctatt aaggatcaga cgattcaatt attattaacg 6540
agatttgaat atcaaactga ttatgatatt catctgtata atatgacttt agagaataaa 6600
ataccaacta ttttagctat tgcaaaaaat agaggtgctt ttggcatgaa tattttatgt 6660
gctgcaggtt gtcatttaga tataaataaa gcaattgaaa gttcattaca tgagttatgt 6720
ggaatcttag aggcaatcaa aagtaaattt gaaaatagga aaagtgaatt atacgaaatg 6780
gcaaagaatt attcacttgt acggacgatg gaagatcatt cattattatt tggattgaaa 6840
gaacttgaaa aagagtttga ttttctatta aagagcccga ttgaaattga tttaagtgag 6900
gtagaacctt taaaatatag caacaatata catacagatt tattgaatgt aattgattat 6960
tttaaaaaaa taaatttaga tatcatcgta gtcgatcaaa ccgcggaaga tataaaattt 7020
aacaacttgt attgtgtaaa agttattatt ccaggaatgt tacctatgac atttggacat 7080
gatatgagaa gaatacataa tttaccaagg atattccgtg ttccaaggga attaggacat 7140
aaaattaaga atgaaaatga aattaagaac aatcaggtaa ctcctcatcc tttcccataa 7200
cattttttat gaaagatggt gatataacat gaaaccaata aactatgtac cacatttttt 7260
atgtagaata tctggtgaag aaataaactc tatttcagaa attgagttta ttaaaacctt 7320
ggaatgttta gaattatccg aaggaatttt aaggaaaata aattctttat cagcagactt 7380
aacgaaagat ttacatgatt gtatttcttt atataaagaa caatctattt cacgtgtatt 7440
aataaatctt aaaagagata tttttaatat gaggtttaat cgagttcaaa agtataaact 7500
agaaaatatc tcaggtttta accacgataa attaaattta tggttaaatt tagctcaaga 7560
atatcaaagc acgctacatc tgatgagaga aacttttaaa atggaaatac aggaaaaaag 7620
agggaaatta aagcagttat ttagtaatag tgaatatata aaagccattc aagtctcaaa 7680
tactcaactt tatgaaaatc tcctagaata cttacaagat aatcaaagtc atcctccaaa 7740
aaagatgagg aatattgaac agtctctaat taattaccta agtcgtatga tatttaagcc 7800
aactcccttc agttcattta caggattaaa ttacggtttt tttagtcagg aagattcaag 7860
ttttgaaata aatactaagg aaagcaaagg tcacactcga ataaacatgg tttatttaaa 7920
aaaaattgaa agaatgttat taaatcgaat atctataaaa aataaatgtt atgtttcgtt 7980
aaatcaaacg ataaacgaag aggaaaatta tatgtttttt cgaagaggta aagatgggac 8040
tagtcaagct tttactggtg aagcttttat aaagataaaa aagagcgagc tcttaaagga 8100
gttaattcaa tattttgaag gaatatcttc aatgaatata gttgaggttg tatcatttct 8160
ttccgaaaaa acaaattatg aaactgaagc tttatataat tacttattta agttagagaa 8220
aatgggagtg ttagatttta gcttaggtgt gtccgaacaa tcggacaatt acacgaaaga 8280
tttgatagaa aacttattgg ggattaaaga ttcattagtt gaaaaatcgg tctcacacct 8340
tgtagaaata gaaaaaattc aggcgatttt ctctgaatcc aattaccaaa aacgttatgt 8400
acttttaaaa aatttacaag aacatataaa gaagatttat agtttatttg atttaaaatt 8460
agagtctaat gatttgacct ctctattatt cgaggatgtt agttataaaa atactaagat 8520
tatattaaat gaaaatcaat ggaaaacgca tcttgatgat tttaatttaa ttaagaattt 8580
aatgccactt tttgatgata atatccttga aaaattaagt atgaatataa tttttaagga 8640
tatatatggt aacaaggggg caatagattt attagaattc tatagagagt ttaataaata 8700
tgataaaaat ttattatgga agaaaattag aaaaaatgat acatatcttt atttaaaaaa 8760
attgagaaca gagttttatg attatctaga aacacaaatt aatatggggt tagacactat 8820
ctttttaaat aaaagttggt taaagaaatt tattaacaag ttccctgatt tattgaagag 8880
taaggaaaat tattctttct attttcaaat agcctatgat aatcaagata atagaatttt 8940
agttttaaat aagatagggc caggattagg taagcacttt tcaagatatg gtaatttatt 9000
tttaaatagc gaatacaagg aaaataatag atttattaat tctcttatag aacagtataa 9060
aaaatatgat caaaatgggg gggttttaac agatttaaat gcagtgttag gtctaaatct 9120
taatatgcat cctaatcttt taaattatga aattacttat ccaggatgca atcctagtaa 9180
aggaattaat caagtagcat taaaggatat tgaagtattg tatgattcta attctgacca 9240
actaaaatta tattctaaac aatatagaca gaatgttaaa ttacttccat tgggattttt 9300
gtttccagca ttgtccccat ctttatataa gtttttatgt ggattttcgg aatcaaatgg 9360
gatagagtat tctttttgga acaagttctt aaatgaacac aataataatt tttcactttt 9420
acctagaatt atgttaggat cagtagcttt ggatagaaga acatggaaaa ttaatgcgaa 9480
ggaaatacaa aaggaatttt ctaaagatac atttgaaact tttattaact tccataagtg 9540
ggtgaaagaa aatcaactac cggaagatat atttttaagg gttgcaaaca caatggacgc 9600
ttttagtgag aatgaattat taaatcaaga tttaggaagt tggattgcag aaattaaaca 9660
aactaaacat cgtaaacctc aatatgttaa ttttaataat tactttcata tcgatgcctt 9720
aagaaagatt attaaagatg ttaataatac agtaacaatt caagaagttt atcctcatcc 9780
agatgatgtg tattatcaaa aaaatagtaa aaaatgtgta gaatttttag ttgaggtttt 9840
ttaataaagg aatgattata tgaacgagaa taattttata tggaaggctt atcatatttt 9900
ttatcatcaa aatcaagatt ttctaattac aaattgtatc aaaccaattt tagatgaatt 9960
gataaaaaag aaattaatta gtaaattttt ttttataaga tattgggaag gcggacctca 10020
tattagagtg cgactttatt gtacattaaa taaatctcaa gaagttgatt ataaatttaa 10080
tgattttgtt tctaaattct tgaaaacata tccttcttca tcaacattag atagaaacat 10140
gataaagaat caattagcaa aattagctag tcttgaagag ggtactgagt caacatgtgt 10200
tcgagagaat aatcatatta ttcatctaga atataatcca gagtataaac gatatggagg 10260
agaaaatgga atagagattg cggaagaaca tttttaccat tcaagtataa tgtgtttgaa 10320
gttaatacaa gaaattaata aaaagacaaa tcgtttgcgc atatctattg aaattatact 10380
atcttattta aaagctatga atatgaactt acaagagagt attaagtttt tagaaggcta 10440
ttatctaata tggaaaagat atgtatacag caataccaat aacgttgaag aattcttcgc 10500
taacaaatat attaagcaaa aaaaagtaat agacaaaatt gtagtaaact atttcaattc 10560
taataataat aaaggtatgt taggagaaaa atggagtaat catttgaatt taactgtaca 10620
gaatttagaa aatgattggg atcggggaga attaataata gataaagatg ttttagcata 10680
tataaatatc cctcaaaaga ttgcttttat agttacaagt tatgttcata tgacaaacaa 10740
taggcttggt atcatgccgc aagaagaagc ctatttaagc tatatgcttt tatgtagttt 10800
gaaatcattg tataagagta gaaagggatg acttaaatgg agcagtatca taaaattgta 10860
ttaactggaa gtaatgctga gactatgtta ataaaaaata tagagcctgt agcagttaag 10920
tttataaata actataaggg ttttttctat gtttttaaat atagtaaaga ttttccaatt 10980
atcgatgttt atatcaacaa caaaattgtt acagaaaatc aattaaataa aattttacag 11040
aattctgggg ctaaatataa aatttataaa aattcaatat ttaatgagac acaagggaat 11100
tttgggatgt taggtgataa atatctggca gaatttttta aaaagacaaa tgaaattagc 11160
cttaatatac taaatcaaaa ttttgagagt tacaataaaa aaatagaatt tgcgctagag 11220
ataatgttaa tttcagcgca ctataattat gattcaataa aaaaaggcta cttatcctat 11280
gcatctcatg taaatggatt ttttactaga tggaaagatc caaataaaat tagagatata 11340
tttcataaga actacttaaa taacaaagag tacctagaat cgaaagtttc agaaataata 11400
gataataaca acagaagtag cttgagcgaa ttatcggata ttattacaga aatgaagaaa 11460
gagatgacta ctgatattga gaaggggaac ctgcatgtat ttaatattga attactacaa 11520
aaaccaggag aaagagattt tctagaaaaa agtcagtttc ataagacgat attaaataat 11580
ccagatttct ctaattttat gaataaagat ataaactttt taggttcacg cctaataact 11640
gtatttacgt acttattaat acgaaattta gggattcaaa ataaagatag atatctactt 11700
tgctactata tctataaaat tattgaagaa aaatataata tagatacttt ggaattaata 11760
agggattttg gtaaagggag ggataataat gttgaagact tacaaagata ttgaagattt 11820
tttatataat ttgcaatatt cgcctgctaa agcttcagat ttcaatttag atttaagtaa 11880
ttatgataga cccttgcctt ttaaaattta taggaataga gaatcgatag atttagacga 11940
taactttccg atttgtatta atgatttaga tggtattgat tattcaaatt tcgaaattat 12000
tagttattta ttgtggtata cctatggttt taccagctac aattggttaa caaaaccaac 12060
attaaatggt cagaatacat ccttaagttt ttttagaaga agtgtagcct caggtggcgg 12120
cttatatcct ggggaaattt acttatatgt ggagagtatt aaaggtatca agtcaggatt 12180
atattatttt gatgttaggg gaccgagatt aattttacta agggaaggaa attttcaaga 12240
atttatcaaa aaatctttgc aatataatca agatagaaat gtttatattt ttataacatc 12300
attttattgg aaaaacttct ttaaatattt aaatttctcg tatcgtttac aaggcttaga 12360
tatcggtgct attgtaagcc aagctcacct aatttcaaag aaattaggtc ttaattcgga 12420
gattaggtat cactttgatg ataaaaaaat taatgatttt ttaggaatca acgctgagga 12480
agaaagcagc tacgtagttt tgcctataga tatggataat aattcatata aaagtgaaaa 12540
taaggttccc gcttttgagt actttaaaaa cgatacaaca ttcaattata ttgaacattt 12600
aaatgttggc cccaaaaatg tatgtcagga tatttataaa atcaatagta atattatcaa 12660
tagtggctta attaaagtta aaaaaaatga aatagcatct tttaaagagg aggcaaatgt 12720
tgttcataaa gaaaaatatg attatgacat tttgaaggct tctgtaagtc gtatatcacc 12780
aggagagaac tttttgtctg attttttgaa tattcagcat gttcacaaag ttctagatgt 12840
tggaatgcag gaacaattta aaaatgatat ttttagcgat aattatagtg ttctaaagga 12900
tgttgaaatt tacttttatg ccaataagat tgaaggttta ccaaaaggct actattacta 12960
taatccaagt aataaaagtt tcgttttgaa acataaaggt gatttttcta gtgtttttca 13020
ggagaatctt acacgaaaaa attttaattt agtagaaatg cctttaattg tgcacttagt 13080
attaaacatg aaaaaattta tagaaaatat gaaatttaga ggctatagag tcatgcaaat 13140
ggaggcaggg agaattatgc atcaaataca attgaatgct gcaggtttga acctagggag 13200
ccatccaatg ttaggttata gggctgataa tttggaggag ttttttggta ttcaaaataa 13260
tataactgtc cagatgtcta ttggtaaata tagaccttta ttgaggctaa ccaataattt 13320
attgaataaa actaaaggag aacaatttta tgtatgacgg aaaacgggtg aatccatatg 13380
aactctatca aacaatttaa ttttaaaaat aaaaatattt ttattactgg agctaccagt 13440
gatatagcta tctgtatagc agaatccttc tctggatttg gcgggaattt aattttatct 13500
gatactgata aacaattacc aaaattagaa catgttaaac aaaaaatgat tgaaaaattt 13560
aggaataatg ttcaaattgt aactattgat ttatataagg ttaatgatat acaaaatgca 13620
attgaaaaat tagataaacc aattgatata ttgatcaatt gtgctggaaa taattacttt 13680
gttccagctc tggaggttag tgaagagaat tggcaaaaaa ttatagatgt aaatttgaaa 13740
ggaacttttt ttcttagtca gtcaatagca aaaaaaatga ttagtgacgg cataaagggg 13800
aaaattgtaa atattggatc gcaacatggg gtagttgcca atggtctaag agccccctat 13860
tgtattagta agtttggatt aataggtttg acaaaagttt tagcgctaga gtggtctact 13920
tttaatatat tggttaattg tgtttcacca acgtatgtaa aaacttctaa aagtaaggat 13980
ttcttggagc atgaagatgt taaaaaagca tatttatata aaatcccttt gaaaaaatat 14040
gctttacccc acgatatatc atatgcagta ttgtttttaa gtagcgatca aaatcagata 14100
attacagggg aaaatatttt agttaatggt ggttatacat tacactagat ctcaccacca 14160
ccaccaccac tgacgtacgg gcccaagctt gcacccatta gttcaacaaa cgaaaattgg 14220
ataaagtggg atatttttaa aatatatatt tatgttacag taatattgac ttttaaaaaa 14280
ggattgattc taatgaagaa agcagacaag taagcctcct aaattcactt tagataaaaa 14340
tttaggaggc atatcaaatg aactttaata aaattgattt agacaattgg aagagaaaag 14400
agatatttaa tcattatttg aaccaacaaa cgacttttag tataaccaca gaaattgata 14460
ttagtgtttt ataccgaaac ataaaacaag aaggatataa attttaccct gcatttattt 14520
tcttagtgac aagggtgata aactcaaata cagcttttag aactggttac aatagcgacg 14580
gagagttagg ttattgggat aagttagagc cactttatac aatttttgat ggtgtatcta 14640
aaacattctc tggtatttgg actcctgtaa agaatgactt caaagagttt tatgatttat 14700
acctttctga tgtagagaaa tataatggtt cggggaaatt gtttcccaaa acacctatac 14760
ctgaaaatgc tttttctctt tctattattc catggacttc atttactggg tttaacttaa 14820
atatcaataa taatagtaat taccttctac ccattattac agcaggaaaa ttcattaata 14880
aaggtaattc aatatattta ccgctatctt tacaggtaca tcattctgtt tgtgatggtt 14940
atcatgcagg attgtttatg aactctattc aggaattgtc agataggcct aatgactggc 15000
ttttataata tgagataatg ccgactgtac tttttacagt cggttttcta atgtcactaa 15060
cctgccccgt tagttgaaga aggtttttat attacagctc cagatcctct acgccggacg 15120
catcgtggcc ggcatcaccg gcgccacagg tgcggttgct ggcgcctata tcgccgacat 15180
caccgatggg gaagatcggg ctcgccactt cgggctcatg agcgcttgtt tcggcgtggg 15240
tatggtggca ggccccgtgg ccgggggact gttgggcgcc atctccttgc atgcaccatt 15300
ccttgcggcg gcggtgctca acggcctcaa cctactactg ggctgcttcc taatgcagga 15360
gtcgcataag ggagagcgtc gacatggatg agcgatgatg atatccgttt aggctgggcg 15420
gtgatagctt ctcgttcagg cagtacgcct cttttctttt ccagacctga gggaggcgga 15480
aatggtgtga ggttcccggg gaaaagccaa ataggcgatc gcgggagtgc tttatttgaa 15540
gatcaggcta tcactgcggt caatagattt cacaatgtga tggctggaca gcctgaggaa 15600
ctctcgaacc cgaatggaaa caaccagata tttatgaatc agcgcggctc acatggcgtt 15660
gtgctggcaa atgcaggttc atcctctgtc tctatcaata cggcaacaaa attgcctgat 15720
ggcaggtatg acaataaagc tggagcgggt tcatttcaag tgaacgatgg taaactgaca 15780
ggcacgatca atgccaggtc tgtagctgtg ctttatcctg atgatattgc aaaagcgcct 15840
catgttttcc ttgagaatta caaaacaggt gtaacacatt ctttcaatga tcaactgacg 15900
attaccttgc gtgcagatgc gaatacaaca aaagccgttt atcaaatcaa taatggacca 15960
gacgacaggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat ccaatttggc 16020
aaaacataca ccatcatgtt aaaaggaacg aacagtgatg gtgtaacgag gaccgagaaa 16080
tacagttttg ttaaaagaga tccagcgtcg gccaaaacca tcggctatca aaatccgaat 16140
cattggagcc aggtaaatgc ttatatctat aaacatgatg ggagccgagt aattgaattg 16200
accggatctt ggcctggaaa accaatgact aaaaatgcag acggaattta cacgctgacg 16260
ctgcctgcgg acacggatac aaccaacgca aaagtgattt ttaataatgg cagcgcccaa 16320
gtgcccggtc agaatcagcc tggctttgat tacgtgctaa atggtttata taatgactcg 16380
ggcttaagcg gttctcttcc ccattgatag cttggcgtaa tcatggtcat agctgtttcc 16440
tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg 16500
taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc 16560
cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 16620
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 16680
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 16740
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 16800
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 16860
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 16920
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 16980
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 17040
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 17100
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 17160
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 17220
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 17280
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 17340
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 17400
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 17460
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 17520
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 17580
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 17640
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 17700
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 17760
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 17820
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 17880
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 17940
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 18000
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 18060
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 18120
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 18180
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 18240
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 18300
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 18360
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 18420
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 18480
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 18540
aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 18600
catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtc 18647
<210> 2
<211> 19472
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid 2 - Example 2
<400> 2
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgtt tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat 240
tgctgtttca tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat 300
cgaatgagct tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt 360
cgttcaatac gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc 420
agacatctcc gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact 480
ggtactggct gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac 540
aagaatttaa agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg 600
cggtcatcaa tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc 660
caaactggac acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc 720
agaattcatt gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc 780
tgaaacggtt cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg 840
ccaaacatat agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca 900
caaatacatc tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg 960
ctgcatatgc gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg 1020
ctttaaagaa tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg 1080
cggacaagct agtgacatgg gtagagtcgc atgatacgga attcgagctc ggtaccgaac 1140
tcctttttca tatgagaagg tgccatgtca ctattgcttc agaaatactc ctagaataaa 1200
aaaactcatc tttaaagatg agctgtccat tccataaaaa attacattgt aatcatgtcc 1260
agaaaatgat caatcacaat ggaggacatt cctaatgccg gtgcattctg tcctaaggaa 1320
gatggcaata attcatagct attgcctaat tgggaataaa cccttgatga tacttcactt 1380
ctcattgaat ttaaaaccat aggatgcgat tcaattatgc tatttcttaa aattacggct 1440
tgtgggttga aagtatttag aatattggta aggcctattc ctaaatagaa tccaaaattt 1500
tgtaatgcat ttaaggttcc gatatcattc agatgggcga ggtttatgat atcttgatag 1560
gacagttttt tctctttggt ctgaagagat tttaataaag ccttctctga agcatacaat 1620
tcccagcatc ctcggtttcc gcaactgcat ttaggaccat taaagtctat tgtcatatgt 1680
cccatttctc cagagaagcc gcttactcct ctatataaat gattgttgat aataacaccg 1740
atccctattc ctgtgctgat acttacgtaa ataatgttat cgtgattttt tgcagctcca 1800
aatacttttt ctccatatgc gccagcattt gcctcatttt caataaaaac aggcacattg 1860
tacttctctt gtatcgaaga ttttaagtca atatctctcc agttggagtt cggagtgaaa 1920
acaatttttt gatctttatc aatgagtcca ggcacgcaaa tacctatacc aataagcccg 1980
tacggagatt ggggcatttg cgtaataaag tgatgaatca tatcaatcaa aatgtctttc 2040
gttatttctg gagaattgga ttccaaatgg cggtattgat caagaacgat tgttccttca 2100
aggtctgtta aaatgccatt aatataatcc acaccaacat ctattccaac ggagtatcct 2160
gcctttttat taaaaacaag catgacaggt cttcttccgc cacttgattg tccttgacct 2220
atttcaaata ccatactttc tttcattaac gtgtttacct gtgatgagac agttgattta 2280
tttaatccag tcatttcaga taattttgct cttgaaatag gtgaattttt aaggatttct 2340
tttaataata acttttgatt tacttttttg acaaaggttt gatcagcgat atccacttca 2400
tccactccat ttgtttaatc tttaaattaa gtatcaacat agtacatagc gaatcttccc 2460
tttattatat ctaatgtgtt cataaaaaac taaaaaaaat attgaaaata ctgacgaggt 2520
tatataagat gaaaataagt tagtttgttt aaacaacaaa ctaataggtg atgtacttac 2580
tatatgaaat aaaatgcatc tgtatttgaa tgaatttatt tttaaggggg aaatcacatg 2640
gctcaatctc attccagttc aatcaactat tttggaagcg caaacaaagt ggtttactaa 2700
ggtacccggg ctagctttaa gaaggagata tacatatgag tgaaattaaa aaagcattaa 2760
atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat gctatgccag 2820
aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt acatgcagtt 2880
gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa ttaaaaaagc 2940
attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg ttgatgctat 3000
gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg tatgtacatg 3060
cagttgttgt acaacttaat ctagctttaa gaaggagata tacatatgag tgaaattaaa 3120
aaagcattaa atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat 3180
gctatgccag aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt 3240
acatgcagtt gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa 3300
ttaaaaaagc attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg 3360
ttgatgctat gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg 3420
tatgtacatg cagttgttgt acaacttaac gaataaaact aaaggagaac aattttatgt 3480
atgaaaataa tgtaaaagat acaaaggatt tttataatga tatagggcat ataagttgga 3540
gtgttgcccc ctcgcaacac tatcatgtgg gaatttttga attagaaaaa gattccatgg 3600
aggatgctca aaatagaacg gtagaatata tggcacgtaa agttgcggca tcagatcttg 3660
acgtactatt agatattgga tgtggctccg ggcttactgc agtacaaatt agtaaaaagg 3720
aaaattgtaa aattgtaggt ataaatattt ccgaaaagca acttgcaatt gggaaaaagc 3780
taatttctaa agagaaaatt aatagcaggg taaagctaat gaatatggac gcacatcaat 3840
taaactttaa gtcaggtatg tttgatggtg catacgctct agagagtatc atgcatatga 3900
atagggaaaa ggttttaagt gaggtacata gagtattaaa aaatggtgct ccttttagtt 3960
tatgtgattg gtatgtaaag aaatctttaa ctccagtaga gaagaggttt ttagaaacca 4020
ttacacttgg taagtatatt acaaaggaac agtattttag tctttatcaa actcaaaatt 4080
tcatggatat tgaaattgaa gaatggagca ataaaatatt accgacttat aaatattgga 4140
cgacgattac ggatgaaatg aaagaaaaac ttcctgatca tttactatat gtaatagaag 4200
aaaattctaa agtactatca gatattgcaa ttgaaaaatt aggatattta caagtgaatg 4260
gaataaaacg ttagctcgag caccaccacc accaccactg acgtacgggc ccaagcggta 4320
cccggggatc cgtttgttcc ctttatagaa aggaatgatc aaatgttaga aataaaagaa 4380
aaacaattta ttaaattaaa agaggacaca ttcttttttc cttcagctga agggatatac 4440
tttaggaatt ctataggtta ttttacaatc aaaggtagaa atatttaccc gttttttagt 4500
gaaatcagta aatatttgaa tggtaaatat actttgaaag atatagtgag tgagttaagc 4560
aaaacccaag aagaaaaatt tttaaaatta attgccatat tagagaagaa tggttttgta 4620
aaatataccg aaagggttat tgatgaaaat tattataaaa attatgaaaa agaaattgca 4680
tttatagatt attatactaa taatggcatc gaattattta aaaaactctc taatttcaag 4740
atttgtttat atggtagcaa taagttatct aatactattc aaaaaagctt agaaaacata 4800
gggatacaaa atattaaaag aggctctcgt tttgattttg agggagacat tgttatttat 4860
tgcaataatg atgttaatga aagggaaaat ctactggaat gtatggactt ttctcagaat 4920
aaaatattta tttttgtagg taataaagaa tcattaggaa ttattagtcc tattataaaa 4980
aatttagatg attggaagga atttgaaaat atattagaga ttggtgcaga taatattaaa 5040
gaaaatacaa catttactag caactctata ttaagtagta tgctaagttt tgaaattata 5100
aagtatgtaa caaattgttt gcaaagtgat ttaattaatg cggcatacat tttaaatact 5160
gatactttaa aagggaattt tgttcaggta aaaaaaaaaa tagacttaaa acaagatttt 5220
attgaaactt tcaaacaatc aagcggaggc aacggtttgt atatcaataa aataggtaga 5280
ggttctagga aacaaattcc gctctcgcaa tgggaggttg aattggataa attaggtgac 5340
atgaatagtg aaaaaattaa ggtcgttagc tttggtgata cccaccagga agcgaggttt 5400
aatacttatt ataaaaccat agaacatcta ataatcaatg gggaatttaa cttagaggaa 5460
tcatatagct ttaagaatct tgatacaatc actttagcta ttgatgaaca atttaaaaga 5520
aaattaacaa tttcatgcga catagataaa gaacttgcaa tcagaaaagc aatattaaaa 5580
gcaattttaa agagggaaat taatgtaatt gataattatc aagagctttc cccattaaaa 5640
ataagtgatt atatagataa taaaaatata caatactatt gtaaactgat taacatttta 5700
aaagcgaaaa tagaattgcg ttttaagaaa ttagtagagg gtttgttttt ggtagtagtt 5760
agtgacaata gttatagggg agttagtata ggatttaatt taaatacagc attagaaaat 5820
gctcttaggc aatttattaa taatttacaa aatagtatct atacaataaa tattgaagat 5880
gtaatattta aaagaattaa tgattgggat gatgaatgca ttcgagagtt tttgacagat 5940
gaaaaattag aagtttttat ctgtagtata caaaataatg ttatttcagc agaaatttct 6000
atagttggag caatattaat agaaagttag gtgaattgaa aaatgaataa ggaagtcctt 6060
ataatcaggg atgaaagctt tggagaattt tttgattctt tttttttaaa tgaaaataat 6120
cgaaaagttt gttttataga tagtaataaa aaagatttga aatatttatt aaaaaacttt 6180
ttagagaata aaaagtttag ttatgtacta atctttccaa aggaatggaa tcctatgatg 6240
tataggtcac ttgatgcagt gttagaagac tatgatgtac cgtggatcta tataacacaa 6300
ttttttaata aaattttaat aggtcctttt agaaattcta agcaaaaagg ttgtttagat 6360
tgtttatatt atagatggtt tatgacaaaa aaggatcgta ttaatttatt tgaattgaag 6420
aaatgtttat cagaaggaca taatgtaaaa atatctggag atttattgaa tgcttcaatg 6480
gttggattag caattacttt agcatttaaa ctaataaata atgaggtttc ggaattttcg 6540
tatattattg acaaaaagac attgagattc aatggtcata attttttacc taatccacat 6600
tgtcaagtat gtgggcacat ggataatgac gagaaaagat taatagaaca caaatttttt 6660
acagcactta acgataatac tcttaaagaa aagaaaggaa atcgtttttt atcaaaagaa 6720
tatttagaag ataccctatc taaaaatttt ttagatgtag aaactggtat atttaataaa 6780
cttttggacg attatgaaag tcctttcgca gtttcggtag caaatcttcc tttaaaggtt 6840
ggaaaggatg aggttggtgt tggaagaacg gataattatg ctaatagtca cttaactgca 6900
atattagaag gaatagagag atattgcgga atggaaccaa gggggaatag aactaacgtt 6960
tttggtagtt ataatgagct aatggaaaat gctctcaatc catctgtttt aggattacac 7020
gcggaagaac agtatcaatt aaaaagattt ccttttaata aatataatcc agataaaaaa 7080
atgaaatggg tctgggggta ttcttttaat aagaataagg cgatattagt ccctgaaact 7140
tatgcctatt atggtacgaa ttatagagat ggcgttcaaa atagttttgt ttatgaaatc 7200
tcgaatggat gtgctttagg aggacattta ttggaagcta cattgcaagg aatttatgaa 7260
gtagtggaaa gagatgcttt tcttatatct tggtatacta aattaccatt aaaacgtata 7320
agaaaagaat ctattaagga tcagacgatt caattattat taacgagatt tgaatatcaa 7380
actgattatg atattcatct gtataatatg actttagaga ataaaatacc aactatttta 7440
gctattgcaa aaaatagagg tgcttttggc atgaatattt tatgtgctgc aggttgtcat 7500
ttagatataa ataaagcaat tgaaagttca ttacatgagt tatgtggaat cttagaggca 7560
atcaaaagta aatttgaaaa taggaaaagt gaattatacg aaatggcaaa gaattattca 7620
cttgtacgga cgatggaaga tcattcatta ttatttggat tgaaagaact tgaaaaagag 7680
tttgattttc tattaaagag cccgattgaa attgatttaa gtgaggtaga acctttaaaa 7740
tatagcaaca atatacatac agatttattg aatgtaattg attattttaa aaaaataaat 7800
ttagatatca tcgtagtcga tcaaaccgcg gaagatataa aatttaacaa cttgtattgt 7860
gtaaaagtta ttattccagg aatgttacct atgacatttg gacatgatat gagaagaata 7920
cataatttac caaggatatt ccgtgttcca agggaattag gacataaaat taagaatgaa 7980
aatgaaatta agaacaatca ggtaactcct catcctttcc cataacattt tttatgaaag 8040
atggtgatat aacatgaaac caataaacta tgtaccacat tttttatgta gaatatctgg 8100
tgaagaaata aactctattt cagaaattga gtttattaaa accttggaat gtttagaatt 8160
atccgaagga attttaagga aaataaattc tttatcagca gacttaacga aagatttaca 8220
tgattgtatt tctttatata aagaacaatc tatttcacgt gtattaataa atcttaaaag 8280
agatattttt aatatgaggt ttaatcgagt tcaaaagtat aaactagaaa atatctcagg 8340
ttttaaccac gataaattaa atttatggtt aaatttagct caagaatatc aaagcacgct 8400
acatctgatg agagaaactt ttaaaatgga aatacaggaa aaaagaggga aattaaagca 8460
gttatttagt aatagtgaat atataaaagc cattcaagtc tcaaatactc aactttatga 8520
aaatctccta gaatacttac aagataatca aagtcatcct ccaaaaaaga tgaggaatat 8580
tgaacagtct ctaattaatt acctaagtcg tatgatattt aagccaactc ccttcagttc 8640
atttacagga ttaaattacg gtttttttag tcaggaagat tcaagttttg aaataaatac 8700
taaggaaagc aaaggtcaca ctcgaataaa catggtttat ttaaaaaaaa ttgaaagaat 8760
gttattaaat cgaatatcta taaaaaataa atgttatgtt tcgttaaatc aaacgataaa 8820
cgaagaggaa aattatatgt tttttcgaag aggtaaagat gggactagtc aagcttttac 8880
tggtgaagct tttataaaga taaaaaagag cgagctctta aaggagttaa ttcaatattt 8940
tgaaggaata tcttcaatga atatagttga ggttgtatca tttctttccg aaaaaacaaa 9000
ttatgaaact gaagctttat ataattactt atttaagtta gagaaaatgg gagtgttaga 9060
ttttagctta ggtgtgtccg aacaatcgga caattacacg aaagatttga tagaaaactt 9120
attggggatt aaagattcat tagttgaaaa atcggtctca caccttgtag aaatagaaaa 9180
aattcaggcg attttctctg aatccaatta ccaaaaacgt tatgtacttt taaaaaattt 9240
acaagaacat ataaagaaga tttatagttt atttgattta aaattagagt ctaatgattt 9300
gacctctcta ttattcgagg atgttagtta taaaaatact aagattatat taaatgaaaa 9360
tcaatggaaa acgcatcttg atgattttaa tttaattaag aatttaatgc cactttttga 9420
tgataatatc cttgaaaaat taagtatgaa tataattttt aaggatatat atggtaacaa 9480
gggggcaata gatttattag aattctatag agagtttaat aaatatgata aaaatttatt 9540
atggaagaaa attagaaaaa atgatacata tctttattta aaaaaattga gaacagagtt 9600
ttatgattat ctagaaacac aaattaatat ggggttagac actatctttt taaataaaag 9660
ttggttaaag aaatttatta acaagttccc tgatttattg aagagtaagg aaaattattc 9720
tttctatttt caaatagcct atgataatca agataataga attttagttt taaataagat 9780
agggccagga ttaggtaagc acttttcaag atatggtaat ttatttttaa atagcgaata 9840
caaggaaaat aatagattta ttaattctct tatagaacag tataaaaaat atgatcaaaa 9900
tgggggggtt ttaacagatt taaatgcagt gttaggtcta aatcttaata tgcatcctaa 9960
tcttttaaat tatgaaatta cttatccagg atgcaatcct agtaaaggaa ttaatcaagt 10020
agcattaaag gatattgaag tattgtatga ttctaattct gaccaactaa aattatattc 10080
taaacaatat agacagaatg ttaaattact tccattggga tttttgtttc cagcattgtc 10140
cccatcttta tataagtttt tatgtggatt ttcggaatca aatgggatag agtattcttt 10200
ttggaacaag ttcttaaatg aacacaataa taatttttca cttttaccta gaattatgtt 10260
aggatcagta gctttggata gaagaacatg gaaaattaat gcgaaggaaa tacaaaagga 10320
attttctaaa gatacatttg aaacttttat taacttccat aagtgggtga aagaaaatca 10380
actaccggaa gatatatttt taagggttgc aaacacaatg gacgctttta gtgagaatga 10440
attattaaat caagatttag gaagttggat tgcagaaatt aaacaaacta aacatcgtaa 10500
acctcaatat gttaatttta ataattactt tcatatcgat gccttaagaa agattattaa 10560
agatgttaat aatacagtaa caattcaaga agtttatcct catccagatg atgtgtatta 10620
tcaaaaaaat agtaaaaaat gtgtagaatt tttagttgag gttttttaat aaaggaatga 10680
ttatatgaac gagaataatt ttatatggaa ggcttatcat attttttatc atcaaaatca 10740
agattttcta attacaaatt gtatcaaacc aattttagat gaattgataa aaaagaaatt 10800
aattagtaaa ttttttttta taagatattg ggaaggcgga cctcatatta gagtgcgact 10860
ttattgtaca ttaaataaat ctcaagaagt tgattataaa tttaatgatt ttgtttctaa 10920
attcttgaaa acatatcctt cttcatcaac attagataga aacatgataa agaatcaatt 10980
agcaaaatta gctagtcttg aagagggtac tgagtcaaca tgtgttcgag agaataatca 11040
tattattcat ctagaatata atccagagta taaacgatat ggaggagaaa atggaataga 11100
gattgcggaa gaacattttt accattcaag tataatgtgt ttgaagttaa tacaagaaat 11160
taataaaaag acaaatcgtt tgcgcatatc tattgaaatt atactatctt atttaaaagc 11220
tatgaatatg aacttacaag agagtattaa gtttttagaa ggctattatc taatatggaa 11280
aagatatgta tacagcaata ccaataacgt tgaagaattc ttcgctaaca aatatattaa 11340
gcaaaaaaaa gtaatagaca aaattgtagt aaactatttc aattctaata ataataaagg 11400
tatgttagga gaaaaatgga gtaatcattt gaatttaact gtacagaatt tagaaaatga 11460
ttgggatcgg ggagaattaa taatagataa agatgtttta gcatatataa atatccctca 11520
aaagattgct tttatagtta caagttatgt tcatatgaca aacaataggc ttggtatcat 11580
gccgcaagaa gaagcctatt taagctatat gcttttatgt agtttgaaat cattgtataa 11640
gagtagaaag ggatgactta aatggagcag tatcataaaa ttgtattaac tggaagtaat 11700
gctgagacta tgttaataaa aaatatagag cctgtagcag ttaagtttat aaataactat 11760
aagggttttt tctatgtttt taaatatagt aaagattttc caattatcga tgtttatatc 11820
aacaacaaaa ttgttacaga aaatcaatta aataaaattt tacagaattc tggggctaaa 11880
tataaaattt ataaaaattc aatatttaat gagacacaag ggaattttgg gatgttaggt 11940
gataaatatc tggcagaatt ttttaaaaag acaaatgaaa ttagccttaa tatactaaat 12000
caaaattttg agagttacaa taaaaaaata gaatttgcgc tagagataat gttaatttca 12060
gcgcactata attatgattc aataaaaaaa ggctacttat cctatgcatc tcatgtaaat 12120
ggatttttta ctagatggaa agatccaaat aaaattagag atatatttca taagaactac 12180
ttaaataaca aagagtacct agaatcgaaa gtttcagaaa taatagataa taacaacaga 12240
agtagcttga gcgaattatc ggatattatt acagaaatga agaaagagat gactactgat 12300
attgagaagg ggaacctgca tgtatttaat attgaattac tacaaaaacc aggagaaaga 12360
gattttctag aaaaaagtca gtttcataag acgatattaa ataatccaga tttctctaat 12420
tttatgaata aagatataaa ctttttaggt tcacgcctaa taactgtatt tacgtactta 12480
ttaatacgaa atttagggat tcaaaataaa gatagatatc tactttgcta ctatatctat 12540
aaaattattg aagaaaaata taatatagat actttggaat taataaggga ttttggtaaa 12600
gggagggata ataatgttga agacttacaa agatattgaa gattttttat ataatttgca 12660
atattcgcct gctaaagctt cagatttcaa tttagattta agtaattatg atagaccctt 12720
gccttttaaa atttatagga atagagaatc gatagattta gacgataact ttccgatttg 12780
tattaatgat ttagatggta ttgattattc aaatttcgaa attattagtt atttattgtg 12840
gtatacctat ggttttacca gctacaattg gttaacaaaa ccaacattaa atggtcagaa 12900
tacatcctta agttttttta gaagaagtgt agcctcaggt ggcggcttat atcctgggga 12960
aatttactta tatgtggaga gtattaaagg tatcaagtca ggattatatt attttgatgt 13020
taggggaccg agattaattt tactaaggga aggaaatttt caagaattta tcaaaaaatc 13080
tttgcaatat aatcaagata gaaatgttta tatttttata acatcatttt attggaaaaa 13140
cttctttaaa tatttaaatt tctcgtatcg tttacaaggc ttagatatcg gtgctattgt 13200
aagccaagct cacctaattt caaagaaatt aggtcttaat tcggagatta ggtatcactt 13260
tgatgataaa aaaattaatg attttttagg aatcaacgct gaggaagaaa gcagctacgt 13320
agttttgcct atagatatgg ataataattc atataaaagt gaaaataagg ttcccgcttt 13380
tgagtacttt aaaaacgata caacattcaa ttatattgaa catttaaatg ttggccccaa 13440
aaatgtatgt caggatattt ataaaatcaa tagtaatatt atcaatagtg gcttaattaa 13500
agttaaaaaa aatgaaatag catcttttaa agaggaggca aatgttgttc ataaagaaaa 13560
atatgattat gacattttga aggcttctgt aagtcgtata tcaccaggag agaacttttt 13620
gtctgatttt ttgaatattc agcatgttca caaagttcta gatgttggaa tgcaggaaca 13680
atttaaaaat gatattttta gcgataatta tagtgttcta aaggatgttg aaatttactt 13740
ttatgccaat aagattgaag gtttaccaaa aggctactat tactataatc caagtaataa 13800
aagtttcgtt ttgaaacata aaggtgattt ttctagtgtt tttcaggaga atcttacacg 13860
aaaaaatttt aatttagtag aaatgccttt aattgtgcac ttagtattaa acatgaaaaa 13920
atttatagaa aatatgaaat ttagaggcta tagagtcatg caaatggagg cagggagaat 13980
tatgcatcaa atacaattga atgctgcagg tttgaaccta gggagccatc caatgttagg 14040
ttatagggct gataatttgg aggagttttt tggtattcaa aataatataa ctgtccagat 14100
gtctattggt aaatatagac ctttattgag gctaaccaat aatttattga ataaaactaa 14160
aggagaacaa ttttatgtat gacggaaaac gggtgaatcc atatgaactc tatcaaacaa 14220
tttaatttta aaaataaaaa tatttttatt actggagcta ccagtgatat agctatctgt 14280
atagcagaat ccttctctgg atttggcggg aatttaattt tatctgatac tgataaacaa 14340
ttaccaaaat tagaacatgt taaacaaaaa atgattgaaa aatttaggaa taatgttcaa 14400
attgtaacta ttgatttata taaggttaat gatatacaaa atgcaattga aaaattagat 14460
aaaccaattg atatattgat caattgtgct ggaaataatt actttgttcc agctctggag 14520
gttagtgaag agaattggca aaaaattata gatgtaaatt tgaaaggaac tttttttctt 14580
agtcagtcaa tagcaaaaaa aatgattagt gacggcataa aggggaaaat tgtaaatatt 14640
ggatcgcaac atggggtagt tgccaatggt ctaagagccc cctattgtat tagtaagttt 14700
ggattaatag gtttgacaaa agttttagcg ctagagtggt ctacttttaa tatattggtt 14760
aattgtgttt caccaacgta tgtaaaaact tctaaaagta aggatttctt ggagcatgaa 14820
gatgttaaaa aagcatattt atataaaatc cctttgaaaa aatatgcttt accccacgat 14880
atatcatatg cagtattgtt tttaagtagc gatcaaaatc agataattac aggggaaaat 14940
attttagtta atggtggtta tacattacac tagatctcac caccaccacc accactgacg 15000
tacgggccca agcttgcacc cattagttca acaaacgaaa attggataaa gtgggatatt 15060
tttaaaatat atatttatgt tacagtaata ttgactttta aaaaaggatt gattctaatg 15120
aagaaagcag acaagtaagc ctcctaaatt cactttagat aaaaatttag gaggcatatc 15180
aaatgaactt taataaaatt gatttagaca attggaagag aaaagagata tttaatcatt 15240
atttgaacca acaaacgact tttagtataa ccacagaaat tgatattagt gttttatacc 15300
gaaacataaa acaagaagga tataaatttt accctgcatt tattttctta gtgacaaggg 15360
tgataaactc aaatacagct tttagaactg gttacaatag cgacggagag ttaggttatt 15420
gggataagtt agagccactt tatacaattt ttgatggtgt atctaaaaca ttctctggta 15480
tttggactcc tgtaaagaat gacttcaaag agttttatga tttatacctt tctgatgtag 15540
agaaatataa tggttcgggg aaattgtttc ccaaaacacc tatacctgaa aatgcttttt 15600
ctctttctat tattccatgg acttcattta ctgggtttaa cttaaatatc aataataata 15660
gtaattacct tctacccatt attacagcag gaaaattcat taataaaggt aattcaatat 15720
atttaccgct atctttacag gtacatcatt ctgtttgtga tggttatcat gcaggattgt 15780
ttatgaactc tattcaggaa ttgtcagata ggcctaatga ctggctttta taatatgaga 15840
taatgccgac tgtacttttt acagtcggtt ttctaatgtc actaacctgc cccgttagtt 15900
gaagaaggtt tttatattac agctccagat cctctacgcc ggacgcatcg tggccggcat 15960
caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga 16020
tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc 16080
cgtggccggg ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt 16140
gctcaacggc ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga 16200
gcgtcgacat ggatgagcga tgatgatatc cgtttaggct gggcggtgat agcttctcgt 16260
tcaggcagta cgcctctttt cttttccaga cctgagggag gcggaaatgg tgtgaggttc 16320
ccggggaaaa gccaaatagg cgatcgcggg agtgctttat ttgaagatca ggctatcact 16380
gcggtcaata gatttcacaa tgtgatggct ggacagcctg aggaactctc gaacccgaat 16440
ggaaacaacc agatatttat gaatcagcgc ggctcacatg gcgttgtgct ggcaaatgca 16500
ggttcatcct ctgtctctat caatacggca acaaaattgc ctgatggcag gtatgacaat 16560
aaagctggag cgggttcatt tcaagtgaac gatggtaaac tgacaggcac gatcaatgcc 16620
aggtctgtag ctgtgcttta tcctgatgat attgcaaaag cgcctcatgt tttccttgag 16680
aattacaaaa caggtgtaac acattctttc aatgatcaac tgacgattac cttgcgtgca 16740
gatgcgaata caacaaaagc cgtttatcaa atcaataatg gaccagacga caggcgttta 16800
aggatggaga tcaattcaca atcggaaaag gagatccaat ttggcaaaac atacaccatc 16860
atgttaaaag gaacgaacag tgatggtgta acgaggaccg agaaatacag ttttgttaaa 16920
agagatccag cgtcggccaa aaccatcggc tatcaaaatc cgaatcattg gagccaggta 16980
aatgcttata tctataaaca tgatgggagc cgagtaattg aattgaccgg atcttggcct 17040
ggaaaaccaa tgactaaaaa tgcagacgga atttacacgc tgacgctgcc tgcggacacg 17100
gatacaacca acgcaaaagt gatttttaat aatggcagcg cccaagtgcc cggtcagaat 17160
cagcctggct ttgattacgt gctaaatggt ttatataatg actcgggctt aagcggttct 17220
cttccccatt gatagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 17280
tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 17340
ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 17400
aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 17460
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 17520
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 17580
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 17640
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 17700
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 17760
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 17820
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 17880
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 17940
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 18000
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 18060
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 18120
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 18180
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 18240
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 18300
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 18360
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 18420
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 18480
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 18540
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 18600
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 18660
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 18720
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 18780
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 18840
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 18900
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 18960
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 19020
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 19080
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 19140
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 19200
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 19260
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 19320
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 19380
atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta 19440
taaaaatagg cgtatcacga ggccctttcg tc 19472
<210> 3
<211> 19738
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid 3 - Example 2
<400> 3
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgtt tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat 240
tgctgtttca tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat 300
cgaatgagct tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt 360
cgttcaatac gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc 420
agacatctcc gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact 480
ggtactggct gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac 540
aagaatttaa agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg 600
cggtcatcaa tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc 660
caaactggac acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc 720
agaattcatt gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc 780
tgaaacggtt cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg 840
ccaaacatat agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca 900
caaatacatc tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg 960
ctgcatatgc gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg 1020
ctttaaagaa tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg 1080
cggacaagct agtgacatgg gtagagtcgc atgatacgga attcgagctc ggtaccgaac 1140
tcctttttca tatgagaagg tgccatgtca ctattgcttc agaaatactc ctagaataaa 1200
aaaactcatc tttaaagatg agctgtccat tccataaaaa attacattgt aatcatgtcc 1260
agaaaatgat caatcacaat ggaggacatt cctaatgccg gtgcattctg tcctaaggaa 1320
gatggcaata attcatagct attgcctaat tgggaataaa cccttgatga tacttcactt 1380
ctcattgaat ttaaaaccat aggatgcgat tcaattatgc tatttcttaa aattacggct 1440
tgtgggttga aagtatttag aatattggta aggcctattc ctaaatagaa tccaaaattt 1500
tgtaatgcat ttaaggttcc gatatcattc agatgggcga ggtttatgat atcttgatag 1560
gacagttttt tctctttggt ctgaagagat tttaataaag ccttctctga agcatacaat 1620
tcccagcatc ctcggtttcc gcaactgcat ttaggaccat taaagtctat tgtcatatgt 1680
cccatttctc cagagaagcc gcttactcct ctatataaat gattgttgat aataacaccg 1740
atccctattc ctgtgctgat acttacgtaa ataatgttat cgtgattttt tgcagctcca 1800
aatacttttt ctccatatgc gccagcattt gcctcatttt caataaaaac aggcacattg 1860
tacttctctt gtatcgaaga ttttaagtca atatctctcc agttggagtt cggagtgaaa 1920
acaatttttt gatctttatc aatgagtcca ggcacgcaaa tacctatacc aataagcccg 1980
tacggagatt ggggcatttg cgtaataaag tgatgaatca tatcaatcaa aatgtctttc 2040
gttatttctg gagaattgga ttccaaatgg cggtattgat caagaacgat tgttccttca 2100
aggtctgtta aaatgccatt aatataatcc acaccaacat ctattccaac ggagtatcct 2160
gcctttttat taaaaacaag catgacaggt cttcttccgc cacttgattg tccttgacct 2220
atttcaaata ccatactttc tttcattaac gtgtttacct gtgatgagac agttgattta 2280
tttaatccag tcatttcaga taattttgct cttgaaatag gtgaattttt aaggatttct 2340
tttaataata acttttgatt tacttttttg acaaaggttt gatcagcgat atccacttca 2400
tccactccat ttgtttaatc tttaaattaa gtatcaacat agtacatagc gaatcttccc 2460
tttattatat ctaatgtgtt cataaaaaac taaaaaaaat attgaaaata ctgacgaggt 2520
tatataagat gaaaataagt tagtttgttt aaacaacaaa ctaataggtg atgtacttac 2580
tatatgaaat aaaatgcatc tgtatttgaa tgaatttatt tttaaggggg aaatcacatg 2640
gctcaatctc attccagttc aatcaactat tttggaagcg caaacaaagt ggtttactaa 2700
ggtacccggg ctagctttaa gaaggagata tacatatgag tgaaattaaa aaagcattaa 2760
atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat gctatgccag 2820
aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt acatgcagtt 2880
gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa ttaaaaaagc 2940
attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg ttgatgctat 3000
gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg tatgtacatg 3060
cagttgttgt acaacttaat ctagctttaa gaaggagata tacatatgag tgaaattaaa 3120
aaagcattaa atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat 3180
gctatgccag aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt 3240
acatgcagtt gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa 3300
ttaaaaaagc attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg 3360
ttgatgctat gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg 3420
tatgtacatg cagttgttgt acaacttaac aattagagag gagtatacat atgcttactg 3480
aaaaacaagt aaactttttt aaaaaaaatg gttatctaat tttagaagat tttttttctt 3540
tacatgaact aaaacaaatg aaattaacat ttcaacataa gataaaaaat caaaagaact 3600
caaaaggatt ctattcaggc atcttaactc aacaccttaa tctttggaat aaggattctt 3660
tttttaagaa ccttgtattt aacaaaagaa tttcgagaat tgcaaaagaa ctgttggaga 3720
ctaagaatat acggatttta caagatcatg ccttaattaa aaaaagcata gtaggtaaag 3780
ctactccttg gcatcaggat ttctcttatt ttccaattaa tgaacctgaa gcattaactg 3840
tttggattcc gtttcaagat gtctatgaaa aaaatggatg tatgagctat cttcctactt 3900
caaatacatt aggaagatta actaaagttc atatgtataa tatcgataaa cctttagaag 3960
atataaacat ttctcctgcg atagctaaac taaaagctgg gagtatagtt attcatcatt 4020
ctttaacttt gcattatgca tactctaaca taagtgataa tgatcggttg gcctatgcaa 4080
ttgtctatat gaaagatgaa gtaacttata atggaaacag acatccactg atagataaaa 4140
atttatttgc caaaaatcaa aaattagaag ggaccaactt ccctattatc gaggagagtg 4200
taacgttaac atgataaaag aacttgatca cgtaatgata aaagtccaaa atctagaaga 4260
aagtattact ttttattcag agcagttacg actgcaaata atctgggagt atgataatta 4320
tgtaggattt cataacggta tagttattca tgattcgaaa aacagtgaaa atttaactag 4380
ctttttcaaa gtagattctg tagaagaaac agtcaaaata ttaaaagaga gcaatgttaa 4440
aattatttta gagcccactc ctattccgac tggatataca gcagcctttc aagacatcag 4500
taataacatt attcatattg tagataatat taatctttct tgactcgagc accaccacca 4560
ccaccactga cgtacgggcc caagcggtac ccggggatcc gtttgttccc tttatagaaa 4620
ggaatgatca aatgttagaa ataaaagaaa aacaatttat taaattaaaa gaggacacat 4680
tcttttttcc ttcagctgaa gggatatact ttaggaattc tataggttat tttacaatca 4740
aaggtagaaa tatttacccg ttttttagtg aaatcagtaa atatttgaat ggtaaatata 4800
ctttgaaaga tatagtgagt gagttaagca aaacccaaga agaaaaattt ttaaaattaa 4860
ttgccatatt agagaagaat ggttttgtaa aatataccga aagggttatt gatgaaaatt 4920
attataaaaa ttatgaaaaa gaaattgcat ttatagatta ttatactaat aatggcatcg 4980
aattatttaa aaaactctct aatttcaaga tttgtttata tggtagcaat aagttatcta 5040
atactattca aaaaagctta gaaaacatag ggatacaaaa tattaaaaga ggctctcgtt 5100
ttgattttga gggagacatt gttatttatt gcaataatga tgttaatgaa agggaaaatc 5160
tactggaatg tatggacttt tctcagaata aaatatttat ttttgtaggt aataaagaat 5220
cattaggaat tattagtcct attataaaaa atttagatga ttggaaggaa tttgaaaata 5280
tattagagat tggtgcagat aatattaaag aaaatacaac atttactagc aactctatat 5340
taagtagtat gctaagtttt gaaattataa agtatgtaac aaattgtttg caaagtgatt 5400
taattaatgc ggcatacatt ttaaatactg atactttaaa agggaatttt gttcaggtaa 5460
aaaaaaaaat agacttaaaa caagatttta ttgaaacttt caaacaatca agcggaggca 5520
acggtttgta tatcaataaa ataggtagag gttctaggaa acaaattccg ctctcgcaat 5580
gggaggttga attggataaa ttaggtgaca tgaatagtga aaaaattaag gtcgttagct 5640
ttggtgatac ccaccaggaa gcgaggttta atacttatta taaaaccata gaacatctaa 5700
taatcaatgg ggaatttaac ttagaggaat catatagctt taagaatctt gatacaatca 5760
ctttagctat tgatgaacaa tttaaaagaa aattaacaat ttcatgcgac atagataaag 5820
aacttgcaat cagaaaagca atattaaaag caattttaaa gagggaaatt aatgtaattg 5880
ataattatca agagctttcc ccattaaaaa taagtgatta tatagataat aaaaatatac 5940
aatactattg taaactgatt aacattttaa aagcgaaaat agaattgcgt tttaagaaat 6000
tagtagaggg tttgtttttg gtagtagtta gtgacaatag ttatagggga gttagtatag 6060
gatttaattt aaatacagca ttagaaaatg ctcttaggca atttattaat aatttacaaa 6120
atagtatcta tacaataaat attgaagatg taatatttaa aagaattaat gattgggatg 6180
atgaatgcat tcgagagttt ttgacagatg aaaaattaga agtttttatc tgtagtatac 6240
aaaataatgt tatttcagca gaaatttcta tagttggagc aatattaata gaaagttagg 6300
tgaattgaaa aatgaataag gaagtcctta taatcaggga tgaaagcttt ggagaatttt 6360
ttgattcttt ttttttaaat gaaaataatc gaaaagtttg ttttatagat agtaataaaa 6420
aagatttgaa atatttatta aaaaactttt tagagaataa aaagtttagt tatgtactaa 6480
tctttccaaa ggaatggaat cctatgatgt ataggtcact tgatgcagtg ttagaagact 6540
atgatgtacc gtggatctat ataacacaat tttttaataa aattttaata ggtcctttta 6600
gaaattctaa gcaaaaaggt tgtttagatt gtttatatta tagatggttt atgacaaaaa 6660
aggatcgtat taatttattt gaattgaaga aatgtttatc agaaggacat aatgtaaaaa 6720
tatctggaga tttattgaat gcttcaatgg ttggattagc aattacttta gcatttaaac 6780
taataaataa tgaggtttcg gaattttcgt atattattga caaaaagaca ttgagattca 6840
atggtcataa ttttttacct aatccacatt gtcaagtatg tgggcacatg gataatgacg 6900
agaaaagatt aatagaacac aaatttttta cagcacttaa cgataatact cttaaagaaa 6960
agaaaggaaa tcgtttttta tcaaaagaat atttagaaga taccctatct aaaaattttt 7020
tagatgtaga aactggtata tttaataaac ttttggacga ttatgaaagt cctttcgcag 7080
tttcggtagc aaatcttcct ttaaaggttg gaaaggatga ggttggtgtt ggaagaacgg 7140
ataattatgc taatagtcac ttaactgcaa tattagaagg aatagagaga tattgcggaa 7200
tggaaccaag ggggaataga actaacgttt ttggtagtta taatgagcta atggaaaatg 7260
ctctcaatcc atctgtttta ggattacacg cggaagaaca gtatcaatta aaaagatttc 7320
cttttaataa atataatcca gataaaaaaa tgaaatgggt ctgggggtat tcttttaata 7380
agaataaggc gatattagtc cctgaaactt atgcctatta tggtacgaat tatagagatg 7440
gcgttcaaaa tagttttgtt tatgaaatct cgaatggatg tgctttagga ggacatttat 7500
tggaagctac attgcaagga atttatgaag tagtggaaag agatgctttt cttatatctt 7560
ggtatactaa attaccatta aaacgtataa gaaaagaatc tattaaggat cagacgattc 7620
aattattatt aacgagattt gaatatcaaa ctgattatga tattcatctg tataatatga 7680
ctttagagaa taaaatacca actattttag ctattgcaaa aaatagaggt gcttttggca 7740
tgaatatttt atgtgctgca ggttgtcatt tagatataaa taaagcaatt gaaagttcat 7800
tacatgagtt atgtggaatc ttagaggcaa tcaaaagtaa atttgaaaat aggaaaagtg 7860
aattatacga aatggcaaag aattattcac ttgtacggac gatggaagat cattcattat 7920
tatttggatt gaaagaactt gaaaaagagt ttgattttct attaaagagc ccgattgaaa 7980
ttgatttaag tgaggtagaa cctttaaaat atagcaacaa tatacataca gatttattga 8040
atgtaattga ttattttaaa aaaataaatt tagatatcat cgtagtcgat caaaccgcgg 8100
aagatataaa atttaacaac ttgtattgtg taaaagttat tattccagga atgttaccta 8160
tgacatttgg acatgatatg agaagaatac ataatttacc aaggatattc cgtgttccaa 8220
gggaattagg acataaaatt aagaatgaaa atgaaattaa gaacaatcag gtaactcctc 8280
atcctttccc ataacatttt ttatgaaaga tggtgatata acatgaaacc aataaactat 8340
gtaccacatt ttttatgtag aatatctggt gaagaaataa actctatttc agaaattgag 8400
tttattaaaa ccttggaatg tttagaatta tccgaaggaa ttttaaggaa aataaattct 8460
ttatcagcag acttaacgaa agatttacat gattgtattt ctttatataa agaacaatct 8520
atttcacgtg tattaataaa tcttaaaaga gatattttta atatgaggtt taatcgagtt 8580
caaaagtata aactagaaaa tatctcaggt tttaaccacg ataaattaaa tttatggtta 8640
aatttagctc aagaatatca aagcacgcta catctgatga gagaaacttt taaaatggaa 8700
atacaggaaa aaagagggaa attaaagcag ttatttagta atagtgaata tataaaagcc 8760
attcaagtct caaatactca actttatgaa aatctcctag aatacttaca agataatcaa 8820
agtcatcctc caaaaaagat gaggaatatt gaacagtctc taattaatta cctaagtcgt 8880
atgatattta agccaactcc cttcagttca tttacaggat taaattacgg tttttttagt 8940
caggaagatt caagttttga aataaatact aaggaaagca aaggtcacac tcgaataaac 9000
atggtttatt taaaaaaaat tgaaagaatg ttattaaatc gaatatctat aaaaaataaa 9060
tgttatgttt cgttaaatca aacgataaac gaagaggaaa attatatgtt ttttcgaaga 9120
ggtaaagatg ggactagtca agcttttact ggtgaagctt ttataaagat aaaaaagagc 9180
gagctcttaa aggagttaat tcaatatttt gaaggaatat cttcaatgaa tatagttgag 9240
gttgtatcat ttctttccga aaaaacaaat tatgaaactg aagctttata taattactta 9300
tttaagttag agaaaatggg agtgttagat tttagcttag gtgtgtccga acaatcggac 9360
aattacacga aagatttgat agaaaactta ttggggatta aagattcatt agttgaaaaa 9420
tcggtctcac accttgtaga aatagaaaaa attcaggcga ttttctctga atccaattac 9480
caaaaacgtt atgtactttt aaaaaattta caagaacata taaagaagat ttatagttta 9540
tttgatttaa aattagagtc taatgatttg acctctctat tattcgagga tgttagttat 9600
aaaaatacta agattatatt aaatgaaaat caatggaaaa cgcatcttga tgattttaat 9660
ttaattaaga atttaatgcc actttttgat gataatatcc ttgaaaaatt aagtatgaat 9720
ataattttta aggatatata tggtaacaag ggggcaatag atttattaga attctataga 9780
gagtttaata aatatgataa aaatttatta tggaagaaaa ttagaaaaaa tgatacatat 9840
ctttatttaa aaaaattgag aacagagttt tatgattatc tagaaacaca aattaatatg 9900
gggttagaca ctatcttttt aaataaaagt tggttaaaga aatttattaa caagttccct 9960
gatttattga agagtaagga aaattattct ttctattttc aaatagccta tgataatcaa 10020
gataatagaa ttttagtttt aaataagata gggccaggat taggtaagca cttttcaaga 10080
tatggtaatt tatttttaaa tagcgaatac aaggaaaata atagatttat taattctctt 10140
atagaacagt ataaaaaata tgatcaaaat gggggggttt taacagattt aaatgcagtg 10200
ttaggtctaa atcttaatat gcatcctaat cttttaaatt atgaaattac ttatccagga 10260
tgcaatccta gtaaaggaat taatcaagta gcattaaagg atattgaagt attgtatgat 10320
tctaattctg accaactaaa attatattct aaacaatata gacagaatgt taaattactt 10380
ccattgggat ttttgtttcc agcattgtcc ccatctttat ataagttttt atgtggattt 10440
tcggaatcaa atgggataga gtattctttt tggaacaagt tcttaaatga acacaataat 10500
aatttttcac ttttacctag aattatgtta ggatcagtag ctttggatag aagaacatgg 10560
aaaattaatg cgaaggaaat acaaaaggaa ttttctaaag atacatttga aacttttatt 10620
aacttccata agtgggtgaa agaaaatcaa ctaccggaag atatattttt aagggttgca 10680
aacacaatgg acgcttttag tgagaatgaa ttattaaatc aagatttagg aagttggatt 10740
gcagaaatta aacaaactaa acatcgtaaa cctcaatatg ttaattttaa taattacttt 10800
catatcgatg ccttaagaaa gattattaaa gatgttaata atacagtaac aattcaagaa 10860
gtttatcctc atccagatga tgtgtattat caaaaaaata gtaaaaaatg tgtagaattt 10920
ttagttgagg ttttttaata aaggaatgat tatatgaacg agaataattt tatatggaag 10980
gcttatcata ttttttatca tcaaaatcaa gattttctaa ttacaaattg tatcaaacca 11040
attttagatg aattgataaa aaagaaatta attagtaaat ttttttttat aagatattgg 11100
gaaggcggac ctcatattag agtgcgactt tattgtacat taaataaatc tcaagaagtt 11160
gattataaat ttaatgattt tgtttctaaa ttcttgaaaa catatccttc ttcatcaaca 11220
ttagatagaa acatgataaa gaatcaatta gcaaaattag ctagtcttga agagggtact 11280
gagtcaacat gtgttcgaga gaataatcat attattcatc tagaatataa tccagagtat 11340
aaacgatatg gaggagaaaa tggaatagag attgcggaag aacattttta ccattcaagt 11400
ataatgtgtt tgaagttaat acaagaaatt aataaaaaga caaatcgttt gcgcatatct 11460
attgaaatta tactatctta tttaaaagct atgaatatga acttacaaga gagtattaag 11520
tttttagaag gctattatct aatatggaaa agatatgtat acagcaatac caataacgtt 11580
gaagaattct tcgctaacaa atatattaag caaaaaaaag taatagacaa aattgtagta 11640
aactatttca attctaataa taataaaggt atgttaggag aaaaatggag taatcatttg 11700
aatttaactg tacagaattt agaaaatgat tgggatcggg gagaattaat aatagataaa 11760
gatgttttag catatataaa tatccctcaa aagattgctt ttatagttac aagttatgtt 11820
catatgacaa acaataggct tggtatcatg ccgcaagaag aagcctattt aagctatatg 11880
cttttatgta gtttgaaatc attgtataag agtagaaagg gatgacttaa atggagcagt 11940
atcataaaat tgtattaact ggaagtaatg ctgagactat gttaataaaa aatatagagc 12000
ctgtagcagt taagtttata aataactata agggtttttt ctatgttttt aaatatagta 12060
aagattttcc aattatcgat gtttatatca acaacaaaat tgttacagaa aatcaattaa 12120
ataaaatttt acagaattct ggggctaaat ataaaattta taaaaattca atatttaatg 12180
agacacaagg gaattttggg atgttaggtg ataaatatct ggcagaattt tttaaaaaga 12240
caaatgaaat tagccttaat atactaaatc aaaattttga gagttacaat aaaaaaatag 12300
aatttgcgct agagataatg ttaatttcag cgcactataa ttatgattca ataaaaaaag 12360
gctacttatc ctatgcatct catgtaaatg gattttttac tagatggaaa gatccaaata 12420
aaattagaga tatatttcat aagaactact taaataacaa agagtaccta gaatcgaaag 12480
tttcagaaat aatagataat aacaacagaa gtagcttgag cgaattatcg gatattatta 12540
cagaaatgaa gaaagagatg actactgata ttgagaaggg gaacctgcat gtatttaata 12600
ttgaattact acaaaaacca ggagaaagag attttctaga aaaaagtcag tttcataaga 12660
cgatattaaa taatccagat ttctctaatt ttatgaataa agatataaac tttttaggtt 12720
cacgcctaat aactgtattt acgtacttat taatacgaaa tttagggatt caaaataaag 12780
atagatatct actttgctac tatatctata aaattattga agaaaaatat aatatagata 12840
ctttggaatt aataagggat tttggtaaag ggagggataa taatgttgaa gacttacaaa 12900
gatattgaag attttttata taatttgcaa tattcgcctg ctaaagcttc agatttcaat 12960
ttagatttaa gtaattatga tagacccttg ccttttaaaa tttataggaa tagagaatcg 13020
atagatttag acgataactt tccgatttgt attaatgatt tagatggtat tgattattca 13080
aatttcgaaa ttattagtta tttattgtgg tatacctatg gttttaccag ctacaattgg 13140
ttaacaaaac caacattaaa tggtcagaat acatccttaa gtttttttag aagaagtgta 13200
gcctcaggtg gcggcttata tcctggggaa atttacttat atgtggagag tattaaaggt 13260
atcaagtcag gattatatta ttttgatgtt aggggaccga gattaatttt actaagggaa 13320
ggaaattttc aagaatttat caaaaaatct ttgcaatata atcaagatag aaatgtttat 13380
atttttataa catcatttta ttggaaaaac ttctttaaat atttaaattt ctcgtatcgt 13440
ttacaaggct tagatatcgg tgctattgta agccaagctc acctaatttc aaagaaatta 13500
ggtcttaatt cggagattag gtatcacttt gatgataaaa aaattaatga ttttttagga 13560
atcaacgctg aggaagaaag cagctacgta gttttgccta tagatatgga taataattca 13620
tataaaagtg aaaataaggt tcccgctttt gagtacttta aaaacgatac aacattcaat 13680
tatattgaac atttaaatgt tggccccaaa aatgtatgtc aggatattta taaaatcaat 13740
agtaatatta tcaatagtgg cttaattaaa gttaaaaaaa atgaaatagc atcttttaaa 13800
gaggaggcaa atgttgttca taaagaaaaa tatgattatg acattttgaa ggcttctgta 13860
agtcgtatat caccaggaga gaactttttg tctgattttt tgaatattca gcatgttcac 13920
aaagttctag atgttggaat gcaggaacaa tttaaaaatg atatttttag cgataattat 13980
agtgttctaa aggatgttga aatttacttt tatgccaata agattgaagg tttaccaaaa 14040
ggctactatt actataatcc aagtaataaa agtttcgttt tgaaacataa aggtgatttt 14100
tctagtgttt ttcaggagaa tcttacacga aaaaatttta atttagtaga aatgccttta 14160
attgtgcact tagtattaaa catgaaaaaa tttatagaaa atatgaaatt tagaggctat 14220
agagtcatgc aaatggaggc agggagaatt atgcatcaaa tacaattgaa tgctgcaggt 14280
ttgaacctag ggagccatcc aatgttaggt tatagggctg ataatttgga ggagtttttt 14340
ggtattcaaa ataatataac tgtccagatg tctattggta aatatagacc tttattgagg 14400
ctaaccaata atttattgaa taaaactaaa ggagaacaat tttatgtatg acggaaaacg 14460
ggtgaatcca tatgaactct atcaaacaat ttaattttaa aaataaaaat atttttatta 14520
ctggagctac cagtgatata gctatctgta tagcagaatc cttctctgga tttggcggga 14580
atttaatttt atctgatact gataaacaat taccaaaatt agaacatgtt aaacaaaaaa 14640
tgattgaaaa atttaggaat aatgttcaaa ttgtaactat tgatttatat aaggttaatg 14700
atatacaaaa tgcaattgaa aaattagata aaccaattga tatattgatc aattgtgctg 14760
gaaataatta ctttgttcca gctctggagg ttagtgaaga gaattggcaa aaaattatag 14820
atgtaaattt gaaaggaact ttttttctta gtcagtcaat agcaaaaaaa atgattagtg 14880
acggcataaa ggggaaaatt gtaaatattg gatcgcaaca tggggtagtt gccaatggtc 14940
taagagcccc ctattgtatt agtaagtttg gattaatagg tttgacaaaa gttttagcgc 15000
tagagtggtc tacttttaat atattggtta attgtgtttc accaacgtat gtaaaaactt 15060
ctaaaagtaa ggatttcttg gagcatgaag atgttaaaaa agcatattta tataaaatcc 15120
ctttgaaaaa atatgcttta ccccacgata tatcatatgc agtattgttt ttaagtagcg 15180
atcaaaatca gataattaca ggggaaaata ttttagttaa tggtggttat acattacact 15240
agtcaccacc accaccacca ctgacgtacg ggcccaagct tgcacccatt agttcaacaa 15300
acgaaaattg gataaagtgg gatattttta aaatatatat ttatgttaca gtaatattga 15360
cttttaaaaa aggattgatt ctaatgaaga aagcagacaa gtaagcctcc taaattcact 15420
ttagataaaa atttaggagg catatcaaat gaactttaat aaaattgatt tagacaattg 15480
gaagagaaaa gagatattta atcattattt gaaccaacaa acgactttta gtataaccac 15540
agaaattgat attagtgttt tataccgaaa cataaaacaa gaaggatata aattttaccc 15600
tgcatttatt ttcttagtga caagggtgat aaactcaaat acagctttta gaactggtta 15660
caatagcgac ggagagttag gttattggga taagttagag ccactttata caatttttga 15720
tggtgtatct aaaacattct ctggtatttg gactcctgta aagaatgact tcaaagagtt 15780
ttatgattta tacctttctg atgtagagaa atataatggt tcggggaaat tgtttcccaa 15840
aacacctata cctgaaaatg ctttttctct ttctattatt ccatggactt catttactgg 15900
gtttaactta aatatcaata ataatagtaa ttaccttcta cccattatta cagcaggaaa 15960
attcattaat aaaggtaatt caatatattt accgctatct ttacaggtac atcattctgt 16020
ttgtgatggt tatcatgcag gattgtttat gaactctatt caggaattgt cagataggcc 16080
taatgactgg cttttataat atgagataat gccgactgta ctttttacag tcggttttct 16140
aatgtcacta acctgccccg ttagttgaag aaggttttta tattacagct ccagatcctc 16200
tacgccggac gcatcgtggc cggcatcacc ggcgccacag gtgcggttgc tggcgcctat 16260
atcgccgaca tcaccgatgg ggaagatcgg gctcgccact tcgggctcat gagcgcttgt 16320
ttcggcgtgg gtatggtggc aggccccgtg gccgggggac tgttgggcgc catctccttg 16380
catgcaccat tccttgcggc ggcggtgctc aacggcctca acctactact gggctgcttc 16440
ctaatgcagg agtcgcataa gggagagcgt cgacatggat gagcgatgat gatatccgtt 16500
taggctgggc ggtgatagct tctcgttcag gcagtacgcc tcttttcttt tccagacctg 16560
agggaggcgg aaatggtgtg aggttcccgg ggaaaagcca aataggcgat cgcgggagtg 16620
ctttatttga agatcaggct atcactgcgg tcaatagatt tcacaatgtg atggctggac 16680
agcctgagga actctcgaac ccgaatggaa acaaccagat atttatgaat cagcgcggct 16740
cacatggcgt tgtgctggca aatgcaggtt catcctctgt ctctatcaat acggcaacaa 16800
aattgcctga tggcaggtat gacaataaag ctggagcggg ttcatttcaa gtgaacgatg 16860
gtaaactgac aggcacgatc aatgccaggt ctgtagctgt gctttatcct gatgatattg 16920
caaaagcgcc tcatgttttc cttgagaatt acaaaacagg tgtaacacat tctttcaatg 16980
atcaactgac gattaccttg cgtgcagatg cgaatacaac aaaagccgtt tatcaaatca 17040
ataatggacc agacgacagg cgtttaagga tggagatcaa ttcacaatcg gaaaaggaga 17100
tccaatttgg caaaacatac accatcatgt taaaaggaac gaacagtgat ggtgtaacga 17160
ggaccgagaa atacagtttt gttaaaagag atccagcgtc ggccaaaacc atcggctatc 17220
aaaatccgaa tcattggagc caggtaaatg cttatatcta taaacatgat gggagccgag 17280
taattgaatt gaccggatct tggcctggaa aaccaatgac taaaaatgca gacggaattt 17340
acacgctgac gctgcctgcg gacacggata caaccaacgc aaaagtgatt tttaataatg 17400
gcagcgccca agtgcccggt cagaatcagc ctggctttga ttacgtgcta aatggtttat 17460
ataatgactc gggcttaagc ggttctcttc cccattgata gcttggcgta atcatggtca 17520
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 17580
agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 17640
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 17700
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 17760
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 17820
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 17880
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 17940
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 18000
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 18060
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 18120
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 18180
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 18240
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 18300
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 18360
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 18420
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 18480
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 18540
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 18600
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 18660
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 18720
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 18780
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 18840
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 18900
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 18960
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 19020
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 19080
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 19140
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 19200
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 19260
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 19320
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 19380
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 19440
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 19500
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 19560
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 19620
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 19680
accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtc 19738
Claims (18)
- 하기 화학식 2로 표시되는 마크로코신 화합물을 금속 수산화물과 반응시켜 하기 화학식 1로 표시되는 마크로코신 기반 카르복실산 화합물을 제조하는 방법에 있어서, 상기 금속 수산화물은 화학식 2의 마크로코신 화합물 1몰에 대하여 3 내지 12몰로 사용되는 것인, 화학식 1로 표시되는 마크로코신 기반 카르복실산 화합물의 제조방법:
[화학식 1]
[화학식 2]
상기 화학식 1 및 2에서,
R1 내지 R3은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며;
상기 R1 내지 R3의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있으며;
Ra는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며;
Rb는 수소 또는 C1-C10알킬이다. - 제 1항에 있어서,
상기 R1 내지 R3은 서로 독립적으로 수소 또는 C1-C10알킬이며, 상기 R1 내지 R3의 알킬은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법. - 제 1항에 있어서,
상기 Ra는 수소 또는 C1-C10알킬이며; Rb는 C1-C10알킬인, 마크로코신 기반 카르복실산 화합물의 제조방법. - 제 1항에 있어서,
상기 금속 수산화물의 금속은 알칼리금속 또는 알칼리토금속인, 마크로코신 기반 카르복실산 화합물의 제조방법. - 삭제
- 제 1항에 있어서,
상기 화학식 2의 마크로코신 화합물은 천연물로부터 분리된 것이거나 합성으로 제조된 것인, 마크로코신 기반 카르복실산 화합물의 제조방법. - 제 6항에 있어서,
상기 화학식 2-1-A 의 마크로코신 화합물은
1) BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조되는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법. - 제 6항에 있어서,
상기 화학식 2-1-B의 마크로코신 화합물은
1) BcTclE, BcTclO, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조되는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법. - 제 6항에 있어서,
상기 화학식 2-1-C의 마크로코신 화합물은
1) BcTclE, BcTclD, BcTclC, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조되는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법. - 삭제
- 하기 화학식 2의 마크로코신 화합물을 금속 수산화물과 반응시켜 하기 화학식 1의 마크로코신 기반 카르복실산 화합물을 제조하는 단계;
화학식 1의 마크로코신 기반 카르복실산 화합물로부터 화학식 3의 마크로코신 유도체를 제조하는 단계;를 포함하는 마크로코신 유도체의 제조 방법:
[화학식 3]
[화학식 1]
[화학식 2]
상기 화학식 1 내지 3에서,
R1 내지 R3은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며;
상기 R1 내지 R3의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있으며;
Ra는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며;
Rb는 수소 또는 C1-C10알킬이고;
Z1 및 Z2은 서로 독립적으로 단일결합, -CONR11-, -NR12CO-, -COO-, -OCO-, -CR13R14-, -NR15COO-, -NR16-, -S-, -O-, -SO2- 또는 -OCONR17-이며, R11 내지 R17은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, 카르복실C1-C10알킬 또는 C1-C10알콕시카보닐C1-C10알킬이며;
A1은 또는 이며, R'는 C1-C10알킬이며, p는 0 내지 2의 정수이며;
A2는 단일결합 또는 C1-C10알킬렌이며;
R은 수소, 아미노 또는 -B(OH)2이거나, 하기 구조에서 선택되는 어느 하나이고;
X는 O 또는 S이며;
X1는 NR31, O, S 또는 SO2이며;
X2 내지 X5는 각각 독립적으로 NR32, O 또는 S이며;
R20 내지 R22, R31 및 R32는 서로 독립적으로 수소, 할로겐, 니트로, C1-C10알킬카보닐, C1-C10알콕시카보닐, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실C1-C10알킬이다. - 제 16항에 있어서,
상기 화학식 3에서, Z1은 단일결합, -CONR11-, -NR12CO- 또는 -COO-이며; Z2는 단일결합, -CONR11-, -NR12CO-, -NR15COO-, -NR16-, -S- 또는 -OCONR17-이며; R11, R12 및 R15 내지 R17은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실C1-C10알킬인, 제조방법. - 삭제
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2022/009133 WO2023277485A1 (ko) | 2021-06-30 | 2022-06-27 | 마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물 |
EP22833541.0A EP4365188A1 (en) | 2021-06-30 | 2022-06-27 | Method for preparing micrococcin-based carboxylic acid compound and micrococcin-based carboxylic acid compound prepared thereby |
CN202280047108.9A CN117597352A (zh) | 2021-06-30 | 2022-06-27 | 基于微球菌素的羧酸化合物的制备方法和由此制备的基于微球菌素的羧酸化合物 |
JP2023580628A JP2024523639A (ja) | 2021-06-30 | 2022-06-27 | ミクロコクシンに基づくカルボン酸化合物の製造方法、およびそれから製造されたミクロコクシンに基づくカルボン酸化合物 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20210085881 | 2021-06-30 | ||
KR1020210085881 | 2021-06-30 |
Publications (3)
Publication Number | Publication Date |
---|---|
KR20230004289A KR20230004289A (ko) | 2023-01-06 |
KR102488647B1 true KR102488647B1 (ko) | 2023-01-18 |
KR102488647B9 KR102488647B9 (ko) | 2024-03-13 |
Family
ID=84924119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220077357A KR102488647B1 (ko) | 2021-06-30 | 2022-06-24 | 마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102488647B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008115165A (ja) | 2006-10-10 | 2008-05-22 | Astellas Pharma Inc | チオペプタイド化合物 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG59966A1 (en) * | 1995-03-08 | 1999-02-22 | Daicel Chem | Process for producing a carboxylic acid |
KR100872059B1 (ko) | 2007-02-21 | 2008-12-05 | 주식회사 레고켐 바이오사이언스 | 아미독심 또는 하이드록사마이드 기를 가지는 신규한옥사졸리디논 유도체 및 이를 함유하는 의약 조성물 |
-
2022
- 2022-06-24 KR KR1020220077357A patent/KR102488647B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008115165A (ja) | 2006-10-10 | 2008-05-22 | Astellas Pharma Inc | チオペプタイド化合物 |
Non-Patent Citations (1)
Title |
---|
비특허1: J. AM. CHEM. SOC. (2009), 131, PP.17563-17565 |
Also Published As
Publication number | Publication date |
---|---|
KR102488647B9 (ko) | 2024-03-13 |
KR20230004289A (ko) | 2023-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20110015045A (ko) | 2-상 추출 발효를 이용한 부탄올의 생산방법 | |
KR20120115500A (ko) | 전해질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법 | |
KR20120117990A (ko) | 삼투조절물질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법 | |
AU2016203445B2 (en) | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion | |
CN107002095B (zh) | 用于治疗溶酶体贮积症的腺伴随病毒载体 | |
DK2087106T3 (en) | MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS | |
CN112553229A (zh) | 用于治疗帕金森病的aadc多核苷酸 | |
KR20130087013A (ko) | 추출 발효에서의 알코올 제거를 위한 오일로부터 유래되는 추출 용매 | |
KR20130087014A (ko) | 알코올 생산성 향상을 위한 지방산의 보충 | |
KR20100118973A (ko) | 이소프렌을 생성하기 위한 조성물 및 방법 | |
CN108026556A (zh) | 在具有经改造的输入/输出的微生物宿主中人乳寡糖的产生 | |
CN107858297A (zh) | 在蔗糖上生长的重组破囊壶菌和其组合物、制备方法及用途 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
KR20110038087A (ko) | 재생가능 자원으로부터의 이소프렌 중합체 | |
KR20070085669A (ko) | 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
CN110551713A (zh) | 用于修饰梭状芽孢杆菌属细菌的优化的遗传工具 | |
US20040146996A1 (en) | Microorganisms and processes for enhanced production of pantothenate | |
KR20210107680A (ko) | 개선된 프럭토오스 이용을 위해 조작된 미생물 균주 | |
CN110214182A (zh) | 用于i型黏多糖贮积症的基因治疗 | |
CN112852860B (zh) | 质粒载体及其在构建多拷贝表达***中的应用 | |
KR102488647B1 (ko) | 마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물 | |
CN117597352A (zh) | 基于微球菌素的羧酸化合物的制备方法和由此制备的基于微球菌素的羧酸化合物 | |
MXPA04012807A (es) | Microorganismos y proceso para la produccion aumentada de pantotenato. | |
CN110462044A (zh) | 自引导整合构建体(sgic) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
G170 | Re-publication after modification of scope of protection [patent] |