KR102488647B1

KR102488647B1 - 마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물

Info

Publication number: KR102488647B1
Application number: KR1020220077357A
Authority: KR
Inventors: 황희종; 손영진; 김다현; 이주석; 클로비스 샤카; 슈폴리니 마르코
Original assignee: 주식회사 에이엔제이사이언스
Priority date: 2021-06-30
Filing date: 2022-06-24
Publication date: 2023-01-18
Also published as: KR102488647B9; KR20230004289A

Abstract

본 발명은 마크로코신 기반 카르복실산 화합물의 제조방법 및 제조된 마크로코신 기반 카르복실산 화합물을 제공하는 것으로, 본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 마크로코신 화합물에 카르복실산기가 도입됨으로써 다양한 작용기를 도입이 용이하다.

Description

마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물 {Method for preparing micrococcin-based carboxylic acid compound and micrococcin-based carboxylic acid compound prepared therefrom}

본 발명은 마크로코신 화합물을 기반으로 하여 제조되는 마크로코신 기반 카르복실산 화합물의 제조방법 및 이로부터 제조된 마크로코신 기반 카르복실산 화합물을 제공한다.

또한, 본 발명은 마크로코신 기반 카르복실산 화합물을 제조하기 위한 출발물질인 마크로코신 화합물의 생합성 방법을 제공한다.

또한, 본 발명은 상기 제조된 마크로코신 기반 카르복실산 화합물로부터 항생제로 유용한 마크로코신 유도체를 제조하는 방법을 제공한다.

다양한 감염증에 대해 인류는 항생제를 개발하여 대처해왔다.

그러나 최근 대부분의 항생 물질들에 저항성을 갖는 메티실린 내성 황색포도상구균(Methicillin resistance Staphylococcus aureus; MRSA)의 출연빈도가 증가하고 있다.

메티실린 내성 황색포도상구균은 병원이나 의료 기관 등에 입원해 있는 환자에게 원내 감염이 일어나고, 신체 접촉을 통하여 사람과 사람 사이로 감염되는데, 수술 후 외상을 통하여 감염되거나 폐렴을 일으키면 생명이 위태로울 정도로 위험하다.

또한 미코박테리움 튜베쿨로시스(M. tuberculosis), 미코박테리움 보비스(M. bovis), 미코박테리움 미크로티(M. microti), 미코박테리움 아프리카눔(M. africanum)을 비롯한 결핵균군에 의해 유발되는 만성 감염성 질환인 결핵균도 아직 극복하지 못한 질병 중 하나이다.

결핵은 감염된 환자의 면역상태에 따라 장기간의 잠복감염 상태로 유지될 수 있는데, 전 세계 인구의 약 30%인 20억명이 잠복감염 상태인 것으로 추정되고 있다. 결핵에 감염 시, 상당한 기간 동안 무증상일 수 있으나, 이후 공통적인 증상으로서 폐의 급성 염증을 나타낼 수 있으며, 그 결과 발열 및 마른 기침(nonproductive cough)을 유발시킨다. 이를 치료하지 않으면, 일반적으로 심각한 합병증 및 사망을 초래한다.

항결핵제 개발은 1940년대 스트렙토마이신을 시작으로 더 효과적인 항결핵제들이 개발되었으며, 이로 인해 결핵의 발생 및 사망이 급격하게 감소하였다.

그러나 1980년대 기존의 항생제로 통제할 수 없는 내성 균주인 '다제내성 결핵(Multidrug resistance(MDR)-TB)'의 발생으로 인하여 다제내성 결핵의 환자수는 감소하지 않고 있어, 심각한 보건문제로 대두되고 있다.

한편 마크로코신은 티오펩타이드 천연물로, 26개로 원자로 구성된 거대 고리를 가지는 구조적 특징을 가지고 있으며, 화합물의 구조에 따라 마크로코신 P1(micrococcin P1 (MP1))과 마크로코신 P2(micrococcin P2 (MP2))로 나누어진다. 마크로코신 P1은 다양한 그람 양성균에 대해 효능이 있는 것으로 알려져 있는데, L11 단백질과 23S rRNA 사이에 형성된 복합체에 결합하여 단백질 합성을 억제하는 작용 기전으로 항균작용을 나타낸다.

이에 항상된 항생효과를 가진 마크로코신 유도체를 개발하기 위한 연구가 진행되고 있다.

그러나 마크로코신은 다수의 티아졸고리를 함유하며, 미생물에 의해 생성되는 복잡한 구조로, 다양한 작용기를 도입하기 용이하지 않다.

한국등록특허공보 제10-0872059호

이에 본 발명의 발명자들은 마크로코신에 다양한 작용기를 도입하기 위해 연구하던 중, 특정한 마크로코신 화합물을 금속 수산화물과 반응시킴으로써 특정한 작용기를 잘라내어 마크로코신 기반 카르복실산 화합물을 제조할 수 있음을 발견하여 본 발명을 완성하였다.

이에 본 발명은 마크로코신 기반 카르복실산 화합물의 제조방법을 제공한다.

본 발명은 우수한 항생효과를 가질 수 있는 마크로코신 유도체를 제조하기 위한 중간체로 유용하게 사용가능한 마크로코신 기반 카르복실산 화합물의 제조방법을 제공한다.

본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은,

하기 화학식 2로 표시되는 마크로코신 화합물을 금속 수산화물과 반응시켜 하기 화학식 1로 표시되는 마크로코신 기반 카르복실산 화합물을 제조하는 단계를 포함한다.

[화학식 1]

[화학식 2]

상기 화학식 1 및 2에서,

R₁ 내지 R₃은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며,

상기 R₁ 내지 R₃의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나이상으로 더 치환될 수 있으며;

R_a는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며;

R_b는 수소 또는 C1-C10알킬이다.

본 발명의 마크로코신 화합물의 생합성 방법은, 하기 화학식 2-2의 마크로코신 화합물의 제조방법으로,

1) BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, 및 BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;

2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 포함한다.

[화학식 2-2]

상기 화학식 2-2에서,

R_5A는 수소 또는 하이드록시이고, R_5B는 하이드록시 또는 메톡시이다.

또한, 본 발명은 우수한 항생효과를 가질 수 있는 마크로코신 유도체를 제조하기 위한 중간체로 유용하게 사용가능한 마크로코신 기반 카르복실산 화합물을 제공하는 것으로, 마크로코신 기반 카르복실산 화합물은 상기 화학식 1로 표시된다.

또한, 본 발명은 상기 제조된 마크로코신 기반 카르복실산 화합물을 중간체로 하여 항생제로 유용한 마크로코신 유도체를 제조하는 방법을 제공한다.

본 발명의 마크로코신 유도체의 제조방법은,

상기 화학식 2의 마크로코신 화합물을 금속 수산화물과 반응시켜 상기 화학식 1의 마크로코신 기반 카르복실산 화합물을 제조하는 단계;

상기 화학식 1의 마크로코신 기반 카르복실산 화합물로부터 하기 화학식 3의 마크로코신 유도체를 제조하는 단계;를 포함한다.

[화학식 3]

상기 화학식 3에서,

R₁ 내지 R₃은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며;

상기 R₁ 내지 R₃의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있으며;

Z₁ 및 Z₂은 서로 독립적으로 단일결합, -CONR₁₁-, -NR₁₂CO-, -COO-, -OCO-, -CR₁₃R₁₄-, -NR₁₅COO-, -NR₁₆-, -S-, -O-, -SO₂- 또는 -OCONR₁₇-이며, R₁₁ 내지 R₁₇은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, 카르복실C1-C10알킬 또는 C1-C10알콕시카보닐C1-C10알킬이며;

A₁은

또는

이며, R'는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며, p는 0 내지 4의 정수이며;

A₂는 단일결합, C1-C10알킬렌, C3-C10시클로알킬렌, C3-C10헤테로시클로알킬렌, C6-C20아릴렌 또는 C6-C20헤테로아릴렌이며;

R은 수소, 할로겐, 아미노, 하이드록시, -B(OH)₂, 치환 또는 비치환 할로C1-C10알킬, 치환 또는 비치환 C1-C10알킬, 치환 또는 비치환 C2-C10알케닐, 치환 또는 비치환 C3-C10시클로알킬, 치환 또는 비치환 C3-C10헤테로시클로알킬, 치환 또는 비치환 C6-C20아릴, 또는 치환 또는 비치환 C3-C20헤테로아릴이다.

본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 단순한 공정 및 온화한 조건 하에서 마크로코신 화합물로부터 마크로코신 기반 카르복실산기가 도입된 화합물을 용이하게 제조할 수 있다.

본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 온화한 조건에서 높은 순도 및 수율로 마크로코신 기반 카르복실산 화합물의 제조가 가능하다.

또한 본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법으로 제조된 마크로코신 기반 카르복실산 화합물은 도입된 카르복실산기에 다양한 작용기를 용이하게 도입함으로써 다양한 마크로코신 유도체를 쉽게 제조할 수 있다. 즉, 본 발명의 마크로코신 기반 카르복실산 화합물은 다양한 작용기가 도입된 마크로코신 유도체를 제조하기 위한 중간체로 매우 유용할 수 있다.

따라서 본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 우수한 항생효과를 가지는 마크로코신 기반 유도체의 제조에 매우 유용하게 사용될 수 있다.

또한, 본 발명에 따르면, 특정 유전자들을 포함하는 벡터로 형질전환된 바실러스 섭틸리스(Bacillus subtilis) 세포 내에서 목적 물질인 마크로코신 화합물을 효율적으로 생합성할 수 있으며, 유용 유전자의 추가적인 도입을 통하여 거대 고리에 다양한 치환기를 도입시킬 수 있다.

도 1 - 본 발명의 실시예 2의 pUC19에 도입된 유전자 재조합 플라스미드 1의 도식도.
도 2 - 본 발명의 실시예 2의 pUC19에 도입된 유전자 재조합 플라스미드 2의 도식도.
도 3 - 본 발명의 실시예 2의 pUC19에 도입된 유전자 재조합 플라스미드 3의 도식도.
도 4 - 각 플라스미드에 의해 형질전환된 바실러스 추출물의 UPLC-MS 분석 결과

이하 본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법에 대해 상세히 설명한다. 이때, 사용되는 기술 용어 및 과학 용어에 있어서 다른 정의가 없다면, 이 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 통상적으로 이해하고 있는 의미를 가지며, 하기의 설명에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 설명은 생략한다.

본 명세서에서 사용된 하기 용어들은 다음과 같이 정의되나, 이는 단지 예시적인 것에 불과하며, 본 발명, 출원 또는 용도를 한정하려는 것은 아니다.

본 명세서에서 사용된 용어인 "본 발명의 마크로코신 화합물"은 당업자가 인식할 수 있는 마크로코신 화합물이라면 모두 가능하며, 일례로 마크로코신 P2의 화합물인 화학식 11 내지 12의 각각의 화합물들뿐만 아니라, 이들의 클라드레이트(clathrates), 수화물, 용매화물, 프로드럭 또는 다형체를 포함하는 의미이다.

[화학식 11]

[화학식 12]

또한 본 명세서에서 용어 "마크로코신 화합물", "마크로코신 기반 카르복실산 화합물", "마크로코신 유도체"는 이의 약학적으로 허용 가능한 염이 언급되지 않을 경우 본 발명 화합물의 약학적으로 허용 가능한 염도 포함하는 의미이다. 일 실시예에 있어, 본 발명의 마크로코신 화합물은 입체이성질체적으로 순수한 화합물들(예를 들어, 다른 입체이성질체가 실질적으로 없는(예를 들어, 85% ee 이상, 90% ee 이상, 95% ee 이상, 97% ee 이상, 또는 99% ee 이상))로 존재할 수 있다. 즉, 본 발명에 따른 "마크로코신 화합물", "마크로코신 기반 카르복실산 화합물", "마크로코신 유도체" 또는 그의 염이 호변이성적(tautomeric) 이성질체 및/또는 입체이성질체(예를 들어, 기하이성질체(geometrical isomer) 및 배좌 이성질체(conformational isomers))일 경우 그들의 분리된 이성질체 및 혼합물 각각 또한 본 발명의 화합물의 범주에 포함된다. 본 발명의 화합물 또는 그의 염이 구조 내에 비대칭 탄소(asymmetric carbon)를 가지고 있는 경우에, 그들의 광학 활성 화합물 및 라세믹 혼합물들 또한 본 발명의 화합물의 범위에 포함된다. 예를 들어, 본 발명의 화합물들이 설폭사이드(sulfoxide)(SOR) 구조를 가질 경우 이들이 chirality를 가질 수 있다. 본 발명의 화합물에는 이러한 이성질체의 R 및 S form이 포함되며, R 및 S form들의 혼합물들 또한 본 발명의 화합물 범주에 포함된다. 또한, 본 발명의 화합물들은 Keto form 또는 Enol form 중 어느 하나의 형태로 존재할 수 있으며, 이들 형태 모두 본 발명의 화합물 범주에 포함된다.

본 명세서에서 용어 "치환기(substituent)", "라디칼(radical)", "기(group)", "모이어티(moiety)", 및 "절편(fragment)"은 서로 바꾸어 사용할 수 있다.

본 명세서에 있어서, "C_A-C_B"는 "탄소수가 A 이상이고 B 이하"인 것을 의미한다. 즉, "C1-C10"와 같이 기재될 경우 이는 탄소수가 1 내지 10개임을 의미한다. 예를 들어, C1-C10 알킬은 탄소 수가 1 내지 10인 알킬을 의미한다.

본 명세서에서 사용된 용어 "알킬"은 (탄소수가 특별히 한정되지 않은 경우) 탄소수 1 내지 20, 바람직하게 탄소수 1 내지 15, 보다 바람직하게 탄소수 1 내지 10, 좋기로는 탄소수 1 내지 6을 가진 포화된 직쇄상 또는 분지상의 비-고리(cyclic) 탄화수소를 의미한다. "저급 알킬"은 탄소수가 1 내지 4, 또는 탄소수가 1 내지 6인 직쇄상 또는 분지상 알킬을 의미한다. 대표적인 포화 직쇄상 알킬은 메틸, 에틸, n-프로필, n-부틸, n-펜틸, n-헥실, n-헵틸, n-옥틸, n-노닐과 n-데실을 포함하고, 반면에 포화 분지상 알킬은 이소프로필, sec-부틸, 이소부틸, tert-부틸, 이소펜틸, 2-메틸헥실, 3-메틸부틸, 2-메틸펜틸, 3-메틸펜틸, 4-메틸펜틸, 2-메틸헥실, 3-메틸헥실, 2-메틸펜틸, 3-메틸펜틸, 4-메틸펜틸, 2-메틸헥실, 3-메틸헥실, 4-메틸헥실, 5- 메틸헥실, 2,3-디메틸부틸, 2,3-디메틸펜틸, 2,4-디메틸펜틸, 2,3-디메틸헥실, 2,4-디메틸헥실, 2,5-디메틸헥실, 2,2-디메틸펜틸, 2,2-디메틸헥실, 3,3-디메틸펜틸, 3,3-디메틸헥실, 4,4-디메틸헥실, 2-에틸펜틸, 3-에틸펜틸, 2-에틸헥실, 3-에틸헥실, 4-에틸헥실, 2-메틸-2-에틸펜틸, 2-메틸-3-에틸펜틸, 2-메틸-4-에틸펜틸, 2-메틸-2-에틸헥실, 2-메틸-3-에틸헥실, 2-메틸-4-에틸헥실, 2,2-디에틸펜틸, 3,3-디에틸헥실, 2,2-디에틸헥실, 및 3,3-디에틸헥실을 포함한다.

본 명세서에서 사용된 용어 "알케닐"은 2 내지 20개, 바람직하게 2 내지 15, 바람직하게 2 내지 10, 보다 바람직하게 2 내지 6의 탄소 원자 및 적어도 하나의 탄소-탄소 이중 결합을 포함하는 포화된 직쇄상 또는 분지상 비-고리 탄화수소를 의미한다. 대표적인 직쇄상 및 분지상 (C2-C10) 알케닐은 비닐, 알릴, 1-부테닐, 2-부테닐, 이소부틸레닐, 1-펜테닐, 2-펜테닐, 3-메틸-1-부테닐, 2-메틸-2-부테닐, 2,3-디메틸-2-부테닐, 1-헥세닐(hexenyl), 2-헥세닐, 3-헥세닐, 1-헵테닐, 2-헵테닐, 3-헵테닐, 1-옥테닐, 2-옥테닐, 3옥테닐, 1-노네닐(nonenyl), 2-노네닐, 3-노네닐, 1-데세닐, 2-데세닐 및 3-데세닐을 포함한다. 이러한 알케닐 그룹은 선택적으로 치환될 수 있다.

본 명세서에서 사용된 용어 "할로겐" 및 "할로"는 플루오린, 클로린, 브로민 또는 아이오딘을 의미한다.

본 명세서에서 사용된 용어 "할로알킬", "할로알콕시" 또는 "할로알케닐"은 각각 하나 이상의 수소 원자가 할로겐 원자로 치환된 알킬, 알콕시 또는 알케닐 그룹을 의미한다. 예를 들어, 할로알킬은 -CF₃, -CHF₂, -CH₂F, -CBr₃, -CHBr₂, -CH₂Br, -CCl₃, -CHCl₂, -CH₂CI, -CI₃, -CHI₂, -CH₂I, -CH₂-CF₃, -CH₂-CHF₂, -CH₂-CH₂F, -CH₂-CBr₃, -CH₂-CHBr₂, -CH₂-CH₂Br, -CH₂-CCl₃, -CH₂-CHCl₂, -CH₂-CH₂CI, -CH₂-CI₃, -CH₂-CHI₂, -CH₂-CH₂I, 및 이와 유사한 것을 포함한다. 여기에서 알킬 및 할로겐은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "알콕시"는 -OCH₃, -OCH₂CH₃, -O(CH₂)₂CH₃, -O(CH₂)₃CH₃, -O(CH₂)₄CH₃, -O(CH₂)₅CH₃, 및 이와 유사한 것을 포함하는 -O-(알킬)을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "저급알콕시"는 -O-(저급알킬)을 의미하며, 여기에서 저급 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "아릴"은 5 내지 10의 고리 원자를 함유하는 탄소고리 방향족 그룹을 의미한다. 대표적인 예는 페닐, 톨릴(tolyl), 자일릴(xylyl), 나프틸, 테트라하이드로나프틸, 안트라세닐(anthracenyl), 플루오레닐(fluorenyl), 인데닐(indenyl), 아줄레닐(azulenyl) 등을 포함하나, 이에 한정되는 것은 아니다. 탄소고리 방향족 그룹은 선택적으로 치환될 수 있다.

본 명세서에서 사용된 용어 "사이클로알킬(cycloalkyl)"은 탄소 및 수소 원자를 가지며 탄소-탄소 다중 결합을 가지지 않는 모노사이클릭 또는 폴리사이클릭 포화 고리(ring)를 의미한다. 사이클로알킬 그룹의 예는 (C3-C10)사이클로알킬(예를 들어, 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실 및 사이클로헵틸)을 포함하나, 이에 한정되는 것은 아니다. 사이클로알킬 그룹은 선택적으로 치환될 수 있다. 일 실시예에서, 사이클로알킬 그룹은 모노사이클릭 또는 바이사이클릭 링(고리)이다.

본 명세서에 사용된 용어 “헤테로사이클로알킬”은 2 내지 20개, 바람직하게 2 내지 15개, 바람직하게 2 내지 10개, 바람직하게 2 내지 6개의 탄소 원자 및 질소, 산소 및 황으로 이루어진 군으로부터 선택된 1 내지 6개의 헤테로원자, 예를 들어 1 내지 5개의 헤테로원자, 1 내지 4개의 헤테로원자, 1 내지 3개의 헤테로원자, 또는 1 내지 2개의 헤테로원자로 이루어진 안정한 3- 내지 18-원 포화 또는 일부 불포화 라디칼을 지칭한다. 예시적인 헤테로사이클알킬은 비제한적으로 안정한 3-15 원 포화 또는 일부 불포화 라디칼, 안정한 3-12 원 포화 또는 일부 불포화 라디칼, 안정한 3-9 원 포화 또는 일부 불포화 라디칼, 안정한 8-원 포화 또는 일부 불포화 라디칼, 안정한 7-원 포화 또는 일부 불포화 라디칼, 안정한 6-원 포화 또는 일부 불포화 라디칼, 또는 안정한 5-원 포화 또는 일부 불포화 라디칼을 포함한다. 헤테로사이클알킬은 포화 또는 불포화된 단일고리, 다중고리 또는 스피로고리 형태를 모두 포함하며, 헤테로원자 또는 탄소원자를 통해 결합될 수 있다. 이러한 헤테로사이클로알킬 라디칼의 예로는 옥세탄, 아지리딘, 피롤리딘, 아제티딘, 피페리딘, 테트라하이드로피리딘, 피페라진, 모폴린, 티오모폴린, 1,3-디하이드로벤조[c][1,2]옥사보롤, 이미다졸리딘-2,4-디온, 티아졸리딘-2,4-디온, 피리미딘-2,4(1H,3H)-디온, 3-아자바이사이클로[3.1.0]헥산, 옥타하이드로피롤로[3,4-c]피롤, 2,7-다이아자스피로[4.4]노난, 2-아자스피로[4.4]노난 등의 비방향족 헤테로고리의 1가 라디칼을 포함할 수 있다.

본 명세서에서 사용된 용어 "모노-알킬아미노"는 -NHCH₃, -NHCH₂CH₃, -NH(CH₂)₂CH₃, -NH(CH₂)₃CH₃, -NH(CH₂)₄CH₃, -NH(CH₂)₅CH₃, 및 이와 유사한 것을 포함하는, -NH(알킬)을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "디-알킬아미노"는 -N(CH₃)₂, -N(CH₂CH₃)₂, -N((CH₂)₂CH₃)₂, -N(CH₃)(CH₂CH₃), 및 이와 유사한 것을 포함하는 -N(알킬)(알킬)을 의미하며, 여기에서 각 알킬은 서로 독립적으로 위에서 정의된 알킬이다.

본 명세서에서 사용된 용어 "알킬아미노"는 위에서 정의된 모노-알킬아미노, 디-알킬아미노 및 트리-알킬아미노를 포함하는 개념이다.

본 명세서에서 사용된 용어 "카르복실산" "카르복실" 및 "카르복시"는 -COOH를 의미한다.

본 명세서에서 사용된 용어 "카르복실알킬"은 -CH₂COOH, -CH₂CH₂COOH, -(CH₂)₂CH₂COOH, -(CH₂)₃CH₂CO0H, -(CH₂)₄CH₂CO0H, -(CH₂)₅CH₂COOH, -CH(COOH)-CH₃, -CH₂CH(COOH)CH₃, 및 이와 유사한 것을 포함하는, 하나 이상의 수소 원자가 하이드록시로 치환된 알킬을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "아미노알킬"은 -CH₂-NH₂, -(CH₂)₂-NH₂, -(CH₂)₃-NH₂, -(CH₂)₄-NH₂, -(CH₂)₅-NH₂및 이와 유사한 것을 포함하는 -(알킬)-NH₂을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "모노-알킬아미노알킬"은 -CH₂-NH-CH₃, -CH₂-NHCH₂CH₃, -CH₂-NH(CH₂)₂CH₃, -CH₂-NH(CH₂)₃CH₃, -CH₂-NH(CH₂)₄CH₃, -CH₂-NH(CH₂)₅CH₃, -(CH₂)₂-NH-CH₃, 및 이와 유사한 것을 포함하는, -(알킬)-NH(알킬)을 의미하며, 여기에서 각 알킬은 서로 독립적으로 위에서 정의된 알킬이다.

본 명세서에서 사용된 "헤테로사이클(헤테로고리)"은 질소, 산소 및 황으로부터 독립적으로 선택된 1 내지 4의헤테로원자를 함유하는 포화되거나, 포화되지 않은 5- 내지 7-멤버의 모노사이클릭, 또는 7- 내지 10-멤버의 바이사이클릭, 헤테로사이클릭 링(고리)를 의미하며, 여기에서 질소 및 황 헤테로원자는 선택적으로 산화될 수 있고, 질소 헤테로원자는 선택적으로 사가화(quaternized)될 수 있으며, 상기 헤테로고리 중 일부가 벤젠 고리에 융합한 바이사이클릭 링을 포함한다. 헤테로고리는 헤테로원자 또는 탄소 원자에 의하여 부착될 수 있다. 헤테로고리는 위에서 정의된 헤테로아릴을 포함한다. 대표적인 헤테로고리는 모포리닐(morpholinyl), 피롤리디노닐(pyrrolidinonyl), 피롤리디닐(pyrrolidinyl), 피페리디닐, 히단토이닐(hydantoinyl), 발레롤락타밀(valerolactamyl), 옥시라닐, 옥세타닐, 테트라하이드로퓨라닐, 테트라하이드로피라닐(tetrahydropyranyl), 테트라하이드로피리디닐, 테트라하이드로피리미디닐, 테트라하이드로티오페닐, 테트라하이드로티오피라닐, 테트라하이드로피리미디닐, 테트라하이드로티오페닐, 및 테트라하이드로티오피라닐을 포함한다. "페닐에 융합된 헤테로고리"는 페닐 고리의 두 개의 인접한 탄소 원자에 부착된 헤테로고리를 의미하며, 여기에서 헤테로고리는 위에서 정의된 것과 같다.

본 명세서에서 사용된 "헤테로아릴"은 질소, 산소 및 황으로 구성된 군으로부터 선택된 적어도 하나의 헤테로원자를 가지고, 모노- 및 바이사이클릭 링 시스템을 포함하는 적어도 하나의 탄소 원자를 포함하는 5 내지 10 멤버의 방향족 헤테로고리(heterocycle) 링이다. 대표적인 헤테로아릴은 트리아졸일, 테트라졸일, 옥사디아졸일, 피리딜, 퓨릴, 벤조퓨라닐, 티오페닐, 벤조티오페닐, 퀴놀리닐, 피롤일(pyrrolyl), 인돌일, 옥사졸일, 벤족사졸일(benzoxazolyl), 이미다졸일, 벤즈이미다졸일, 티아졸일(thiazolyl), 벤조티아졸일, 이속사졸일, 파이라졸일(pyrazolyl), 이소티아졸일, 피리다지닐, 피리미디닐, 파이라지닐, 트리아지닐, 신놀리닐(cinnolinyl), 프탈라지닐, 퀴나졸리닐, 피리미딜, 옥세타닐, 아제피닐, 피페라지닐, 모포리닐(morpholinyl), 디옥사닐, 티에타닐 및 옥사졸일이다. 헤테로아릴 그룹은 모노사이클릭 또는 바이사이클릭일 수 있다. 헤테로아릴은 용어 헤테로아릴환, 헤테로아릴 그룹 또는 헤테로방향족과 혼용하여 사용될 수 있으며, 이들 용어는 모두 임의로 치환된 환을 포함할 수 있다.

본 명세서에서 사용된 용어 "하이드록시알킬"은 -CH₂OH, -CH₂CH₂OH, -(CH₂)₂CH₂OH, -(CH₂)₃CH₂0H, -(CH₂)₄CH₂0H, -(CH₂)₅CH₂OH, -CH(OH)-CH₃, -CH₂CH(OH)CH₃, 및 이와 유사한 것을 포함하는, 하나 이상의 수소 원자가 하이드록시로 치환된 알킬을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "하이드록시아릴"은 하나 이상의 수소 원자가 하이드록시로 치환된 아릴을 의미하며, 여기에서 아릴은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "알킬티오"은 -S-CH₃, -S-CH₂CH₃, -S-(CH₂)₂CH₃, -S-(CH₂)₃CH₃, -S-(CH₂)₄CH₃, -S-(CH₂)₅CH₃, 및 이와 유사한 것을 포함하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "설폰산" 및 “설포”는 -S0₃H를 의미한다.

본 명세서에서 사용된 용어 "설포닐알킬"은 -SO₂-CH₃, -SO₂-CH₂CH₃, -SO₂-(CH₂)₂CH₃, -SO₂-(CH₂)₃CH₃, -SO₂-(CH₂)₄CH₃, 및 -S0₂-(CH₂)₅CH₃을 포함하는 -S0₂-(알킬)을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "설피닐알킬(sulfinylalkyl)"은 -SO-CH₃, -SO-CH₂CH₃, -SO-(CH₂)₂CH₃, -SO-(CH₂)₃CH₃, -SO-(CH₂)₄CH₃, -SO-(CH₂)₅CH₃, 및 이와 유사한 것을 포함하는, -SO-(알킬)을 의미하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서에서 사용된 용어 "티오알킬"은 -S-CH₃, -S-CH₂CH₃, -S-(CH₂)₂CH₃, -S-(CH₂)₃CH₃, -S-(CH₂)₄CH₃, -S-(CH₂)₅CH₃, 및 이와 유사한 것을 포함하며, 여기에서 알킬은 위에서 정의된 것과 같다.

본 명세서의 용어, "치환"은 화합물의 탄소 원자에 결합된 수소 원자가 다른 치환기로 바뀌는 것을 의미하며, 치환되는 위치는 수소 원자가 치환되는 위치 즉, 치환기가 치환 가능한 위치라면 한정하지 않으며, 2 이상 치환되는 경우, 2 이상의 치환기는 서로 동일하거나 상이할 수 있다.

본 명세서에서 사용된 용어 "치환된"(substituted)은 치환되는 부분(예를 들어, 알킬, 아릴, 헤테로아릴, 헤테로사이클 또는 사이클로알킬)의 수소 원자가 다른 원자 또는 다른 작용기(즉, 치환기)로 대체되는 것을 의미한다. 케토치환기의 경우, 두개의 수소원자는 이중결합에 의해 탄소에 부착되는 산소로 치환된다. 치환체와 관련하여 별도의 기재가 없는 한, 본 발명의 임의로 치환된 치환체로는 할로겐, 하이드록실, (저급)알킬, 할로알킬, 모노- 또는 디-알킬아미노, 아릴, 헤테로사이클, -NO₂, -NR_a1R_b1, -NR_a1C(=O) R_b1, -NR_a1C(=O)NR_a1R_b1, -NR_a1C(=O)OR_b1, -NR_a1SO₂R_b1, -OR_a1, -CN, -C(=O)R_a1, -C(=O)OR_a1, -C(=O)NR_a1R_b1, -OC(=O)R_a1, -OC(=O)OR_a1, -OC(=O)NR_a1R_b1, -NR_a1SO₂R_b1, -PO₃R_a1, -PO(OR_a1)(OR_b1), -SO₂R_a1, -S(O)R_a1, -SO(=NR_a1)R_b1 (예를 들어, sulfoximine), -S(=NR_a1)R_b1 (예를 들어, sulfilimine) 및 -SR_a1가 이용될 수 있으며, 여기에서 R_a1와 R_b1는 같거나 다를 수 있으며, 서로 독립적으로 수소, 할로겐, 아미노, 알킬, 알콕시알킬, 할로알킬, 아릴 또는 헤테로사이클이고, 또는 부착된 질소원자와 같이 R_a1와 R_b1는 헤테로사이클 형태가 될 수 있다. 여기서 R_a1와 R_b1는 결합된 원자에 따라 복수 개일 수 있으며, 상기 알킬은 C1-C20알킬일 수 있으며, 아릴은 C6-C20일 수 있으며, 헤테로사이클은 C3-C20일 수 있다.

본 발명은 놀라운 항생효과를 가지는 마크로코신 유도체를 제조할 수 있는 마크로코신 기반 카르복실산 화합물의 제조방법을 제공하는 것으로,

하기 화학식 2로 표시되는 마크로코신 화합물을 금속수산화물과 반응시켜 하기 화학식 1로 표시되는 마크로코신 기반 카르복실산 화합물을 제조하는 단계를 포함한다.

[화학식 1]

[화학식 2]

상기 화학식 1 및 2에서,

R_b는 수소 또는 C1-C10알킬이다.

본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 특정한 마크로코신 화합물을 금속 수산화물과 반응시켜 특정한 작용기(

)를 절단하여 하이드록시기가 도입됨으로써 제조된 마크로코신 기반 카르복실산 화합물은 우수한 활성을 가지는 다양한 작용기의 도입이 용이하다.

구체적으로, 화학식 2의 마크로코신 화합물은 말단에 카보닐기를 포함하고 있으며, 말단에 존재하는 카보닐기는 금속 수산화물의 처리에 의하여 티아졸에 결합된 아마이드 작용기(-C(=O)-NH-) 내 산소와 분자내 수소결합을 형성할 수 있으며, 형성된 수소결합은 티아졸 고리에 결합된 카보닐을 활성화시켜 수산화이온의 친핵성 첨가를 유도할 수 있다. 이로 인하여 티아졸에 결합된 아마이드 작용기(-C(=O)-NH-) 내 질소 원자는 염기도가 현저하게 낮아지게 되어 상당히 우수한 이탈기로 작용할 수 있다.

본 발명의 일 실시예에 있어서, 상기 R₁ 내지 R₃은 서로 독립적으로 수소 또는 C1-C10알킬이며, 상기 R₁ 내지 R₃의 알킬은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나이상으로 더 치환될 수 있으며,

더욱 좋기로는 R₁ 내지 R₃은 서로 독립적으로 수소 또는 C1-C5알킬이며, 상기 R₁ 내지 R₃의 알킬은 하이드록시, 티오, C1-C5알킬티오, C1-C5알킬, C1-C5알콕시, 하이드록시C1-C5알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C8헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있다.

바람직하게 본 발명의 일 실시예에 있어서, 상기 R_a는 수소 또는 C1-C10알킬이며; R_b는 C1-C10알킬일 수 있다.

바람직하게 본 발명의 일 실시예에 있어서, 상기 R₁ 내지 R₃은 서로 독립적으로 수소 또는

이며, L₁은 C1-C3알킬렌이며, R₄는 수소, 하이드록시, 티오, C1-C4알킬티오, C1-C4알킬, C1-C4알콕시, C6-C12아릴, 하이드록시C6-C12아릴 또는 C3-C10헤테로아릴일 수 있다.

보다 바람직하게 본 발명의 일 실시예에 있어서, 상기 R₁ 내지 R₃은 서로 독립적으로 수소이거나, 하기 구조에서 선택되는 어느 하나일 수 있다:

더욱 바람직하게 본 발명의 일 실시예에 따른 화학식 2는 하기 화학식 2-1로 표시될 수 있다.

[화학식 2-1]

상기 화학식 2-1에서,

R_a는 수소 또는 C1-C10알킬이며,

R_b는 C1-C10알킬이며;

L_1a 내지 L_1c는 서로 독립적으로 C1-C3알킬렌이며;

R_4a 내지 R_4c은 서로 독립적으로 수소, 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 또는 C3-C10헤테로아릴이다.

좋기로는 상기 화학식 2A에서 R_a는 C1-C5알킬이며, R_b는 C1-C5알킬이며; L_1a 내지 L_1c는 서로 독립적으로 C1-C3알킬렌이며; R_4a 내지 R_4c은 서로 독립적으로 수소, 하이드록시, 티오, C1-C5알킬티오, C1-C5알킬, C1-C5알콕시, 하이드록시C1-C5알킬, 페닐, 나프틸, 하이드록시페닐, 이미다졸릴 또는 인돌릴일 수 있으며, 더욱 좋기로는 상기 화학식 2A에서 R_a는 C1-C3알킬이며, R_b는 C1-C3알킬이며; L_1a 내지 L_1c는 서로 독립적으로 메틸렌, 1,1-에틸렌, 1,2-에틸렌, 1,1-프로필렌, 1,2-프로필렌, 1,3-프로필렌 또는 2,2-프로필렌이며; R_4a 내지 R_4c은 서로 독립적으로 수소, 하이드록시, 티오, C1-C3알킬티오, C1-C3알킬, 하이드록시C1-C3알킬, 페닐, 나프틸, 하이드록시페닐, 이미다졸릴 또는 인돌릴일 수 있다.

일 구체예에 있어서, 상기

,

및

은 서로 독립적으로 하기 구조에서 선택되는 어느 하나일 수 있다:

본 발명의 일 실시예에 따른 마크로코신 화합물은 하기 화학식 2-1-A, 화학식 2-1-B 또는 화학식 2-1-C에서 선택될 수 있으나, 이에 한정이 있는 것은 아니다.

[화학식 2-1-A]

[화학식 2-1-B]

[화학식 2-1-C]

본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 금속 수산화물을 이용하여 온화한 조건 및 단순한 공정으로 마크로코신 골격에 카르복실산기를 도입함으로써 마크로코신 기반 화합물에 다양한 작용기를 손쉽게 도입할 수 있어 우수한 항생효과를 나타낼 수 있는 다양한 마크로코신 유도체를 합성하는 데 있어 매우 유용하다.

바람직하게 일 실시예에 따른 금속 수산화물의 금속은 알칼리금속 또는 알칼리토금속일 수 있으나, 이에 한정되는 것은 아니며, 보다 바람직하게는 알칼리금속일 수 있으며, 구체적으로 Li 또는 Na일 수 있다.

일 실시예에 따른 금속 수산화물은 마크로코신 화합물 1몰에 대하여 3 내지 12몰, 바람직하게 5 내지 10몰로 사용될 수 있으며, 상기 반응은 30 내지 80℃에서 8 내지 24시간동안, 바람직하게는 40 내지 60℃에서 12 내지 24시간동안 수행될 수 있다. 상기 금속 수산화물을 상술된 범위 내로 사용할 경우 목적하는 카르복실산 화합물이 높은 순도 및 수율로 제조 가능하다.

일 실시예에 따른 상기 화학식 2의 마크로코신 화합물은 천연물에서 분리된 것이거나 전합성으로 제조된 것일 수 있으며, 이에 한정이 있는 것은 아니다.

일 구체예에 있어, 상기 화학식 2의 마크로코신 화합물은 유기 합성분야에서 이용가능한 방법으로 합성된 것일 수 있다. 본 발명의 화학식 2의 마크로코신 화합물이 합성된 것일 경우 상기 화학식 2의 마크로코신 화합물은 당업자가 인식할 수 있는 방법이라면 모두 가능하다.

일례로 모토 커플링, 스즈키 커플링, 슈틸레 커플링, 소노가시라 커플링, 헥크 커플링 또는 부트발트 커플링과 같은 아릴-아릴 커플링 반응으로 제조될 수 있다.

바람직하게 아릴-아릴 커플링은 전이금속 촉매 촉매 하에서 수행될 수 있으며, 스즈키 커플링 반응은 Pd(0) 복합체 또는 Pd(II) 염을 사용될 수 있으며, 바람직한 Pd(0) 복합체는 Pd(Ph₃P)₄와 같은 하나이상의 포스핀 리간드를 함유할 수 있다. 또 다른 바람직한 포스핀 리간드는 트리스(오르토-톨릴)포스핀(Pd(o-Tol)₄)일 수 있다.

바람직한 Pd(II) 염은 팔라듐 아세테이트, 즉 Pd(OAc)₂일 수 있다. 스즈키 커플링은 염기, 예를 들어 탄산나트륨, 인산칼륨 또는 유기 염기, 예컨대 테트라에틸암모늄 카르보네이트의 존재 하에 수행될 수 있으며, 야마모토 중합은 Ni(0) 복합체, 예를 들어 비스(1,5-시클로옥타디에닐) 니켈(0)이 사용될 수 있다.

일 실시예에 따른 화학식 2의 마크로코신 화합물의 제조방법에서의 반응시간은 반응물질, 용매의 종류와 양 등에 따라 달라질 수 있으며, 일례로 TLC등을 통하여 출발물질이 완전히 소모됨을 확인한 후 반응을 완결시킨다. 반응이 완결되면 감압 하에서 용매를 증류시킨 후, 관 크로마토그래피 등의 통상의 방법을 통하여 목적물을 분리 정제할 수 있다.

일 구체예에 있어, 상기 화학식 2의 마크로코신 화합물은 천연물에서 분리된 것일 수 있다.

일 구체예에 있어, 상기 화학식 2-1-A의 마크로코신 화합물은

1) BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;

2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조될 수 있다.

일 구체예에 있어, 상기 화학식 2-1-B의 마크로코신 화합물은

1) BcTclE, BcTclO, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;

일 구체예에 있어, 상기 화학식 2-1-C의 마크로코신 화합물은

1) BcTclE, BcTclD, BcTclC, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;

상기 단계 2)의 형질전환된 바실러스 섭틸리스를 발효 배양시켜 각각의 마크로코신 화합물을 생산 및 분비시키는 단계를 추가로 포함할 수 있으나, 이에 제한되지 않는다.

본 발명의 마크로코신 기반 카르복실산 화합물의 제조방법은 마크로코신 기반의 화합물에 카르복실산기가 도입됨으로써 다양한 작용기의 도입이 매우 용이해 다양한 마크로코신 유도체를 가능하게 한다.

본 발명에 따른 마크로코신 화합물의 생합성 방법은, 하기 화학식 2-2의 마크로코신 화합물을 제조하는 것으로,

[화학식 2-2]

상기 화학식 2-2에서,

일 실시예에 있어, 상기 발현 벡터는 BcTclO, BcTclD 및 BcTclC 유전자 중 하나 이상을 더 포함할 수 있다.

일 구체예에 있어, 상기 발현 벡터는 BcTclO 유전자를 더 포함할 수 있다.

일 구체예에 있어, 상기 발현 벡터는 BcTclD 및 BcTclC 유전자를 더 포함할 수 있다.

본 발명의 유전자들이 도입된 벡터로 형질전환된 형질전환체에서 마크로코신 화합물의 생합성이 가능하며, 특정 유전자들을 포함하는 벡터로 형질전환된 바실러스 섭틸리스(Bacillus subtilis) 세포 내에서 목적 물질인 마크로코신 화합물을 효율적으로 생합성할 수 있으며, 유용 유전자의 추가적인 도입을 통하여 거대 고리에 다양한 치환기를 도입시킬 수 있다.

본 발명의 마크로코신 유도체의 제조방법은,

하기 화학식 2의 마크로코신 화합물을 금속 수산화물과 반응시켜 하기 화학식 1의 마크로코신 기반 카르복실산 화합물을 제조하는 단계;

하기 화학식 1의 마크로코신 기반 카르복실산 화합물로부터 하기 화학식 3의 마크로코신 유도체를 제조하는 단계;를 포함한다.

[화학식 3]

[화학식 1]

[화학식 2]

상기 화학식 1 내지 3에서,

R_b는 수소 또는 C1-C10알킬이고;

A₁은

또는

일 실시예에 있어서, 상기 화학식 1의 마크로코신 기반 카르복실산 화합물은 하기 화학식 4의 아민 화합물과의 반응에 의해 상기 화학식 3의 마크로코신 유도체를 제조할 수 있다.

[화학식 4]

상기 화학식 4에서, A₁, A₂, Z₁, Z₂ 및 R은 상기 화학식 3에서의 정의와 동일하다.

일 실시예에 따른 화학식 3의 마크로코신 유도체는 다양한 세균의 사멸 및 억제에 효과적으로, 항생제로서 매우 우수한 효과를 가진다.

일 실시예에 따른 화학식 3에서, 상기 Z₁은 단일결합, -CONR₁₁-, -NR₁₂CO- 또는 -COO-이며; Z₂는 단일결합, -CONR₁₁-, -NR₁₂CO-, -NR₁₅COO-, -NR₁₆-, -S- 또는 -OCONR₁₇-이며; R₁₁, R₁₂ 및 R₁₅ 내지 R₁₇은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실C1-C10알킬일 수 있다.

일 실시예에 따른 화학식 3에서, 상기 R은 수소, 아미노, -B(OH)₂, C3-C10헤테로시클로알킬 또는 C3-C20헤테로아릴이고, 상기 R의 헤테로시클로알킬 또는 헤테로아릴은 할로겐, 아미노, 니트로, 하이드록시, 카르복실산기, -B(OH)₂, C1-C10알킬카보닐, C1-C10알콕시카보닐, C2-C10알케닐, C1-C10알킬, 할로C1-C10알킬, C3-C10헤테로시클로카보닐, 알릴아미노, C1-C10알킬설포닐, 아미노설포닐, 아미노C1-C10알킬, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C1-C10알킬아미노, 디C1-C10알킬아미노, C6-C20아릴아미노, 디C6-C20아릴아미노, C3-C20헤테로아릴, 할로C6-C20아릴, 할로C1-C10알킬C6-C20아릴, C6-C20아릴, C3-C10시클로알킬, C3-C10시클로알킬카보닐, C1-C10알콕시카보닐C1-C10알킬 및 카르복실산C1-C10알킬로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있다.

바람직하게 일 실시예에 따른 화학식 3에서, 상기 Z₁ 및 Z₂은 서로 독립적으로 단일결합, -CONR₁₁-, -COO- 또는 -NR₁₆-이며; R₁₁ 및 R₁₆은 서로 독립적으로 수소일 수 있다.

보다 바람직하게 일 실시예에 따른 화학식 3에서, 상기 Z₁는 단일결합, -CONR₁₁- 또는 -COO-이며; Z₂은 단일결합, -CONR₁₁- 또는 -NR₁₆-이며; R₁₁ 및 R₁₆은 서로 독립적으로 수소일 수 있다.

바람직하게 일 실시예에 따른 화학식 3에서, 상기 A₁은

또는

이며, R'는 C1-C10알킬이며, p는 0 내지 2의 정수이며; A₂는 단일결합 또는 C1-C10알킬렌이며; R는 수소, 아미노, 또는 -B(OH)₂이거나, 하기 구조에서 선택되는 어느 하나일 수 있다.

(상기 구조식에서,

X는 O 또는 S이며;

X₁는 NR₃₁, O, S 또는 SO₂이며;

X₂ 내지 X₅는 각각 독립적으로 NR₃₂, O 또는 S이며;

R₂₀ 내지 R_22,R₃₁ 및 R₃₂는 서로 독립적으로 수소, 할로겐, 니트로, C1-C10알킬카보닐, C1-C10알콕시카보닐, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실C1-C10알킬이다.)

보다 바람직하게 일 실시예에 있어서, 상기 R는 수소, 아미노, 또는 -B(OH)₂이거나, 하기 구조에서 선택되는 어느 하나일 수 있다:

(상기 구조식에서,

R₂₁ 및 R₂₂는 서로 독립적으로 수소, 할로겐, 니트로, C1-C10알킬카보닐, C1-C10알콕시카보닐, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실산C1-C10알킬이고;

R₃₁ 및 R₃₂는 서로 독립적으로 수소, C1-C10알킬카보닐, C1-C10알콕시카보닐, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실산C1-C10알킬이다.)

보다 바람직하게 상기 R₂₁ 및 R₂₂는 서로 독립적으로 수소, 할로겐, 니트로, C1-C10알킬 또는 C3-C10시클로알킬이고; R₃₁ 및 R₃₂는 서로 독립적으로 수소, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실산C1-C10알킬일 수 있다.

일 실시예에 따른 화학식 3의 마크로코신 유도체는 하기 구조에서 선택될 수 있으나, 이에 한정이 있는 것은 아니다.

일 실시예에 따른 화학식 3의 마크로코신 유도체의 항생제로서의 효과는 KR 10-2022-0068934 A에 상세히 기재되어 있다.

이하 본 발명의 마크로코신 화합물의 제조방법에 대해 구체적인 일례를 들어 설명하나, 이러한 구체적인 실시예로 본 발명이 한정되는 것은 아니다.

[제조예 1] 화합물 A1의 제조

1단계: 화합물 a-1의 제조

N-Boc-L-트레오닌 (2 g, 9.2 mmol)과 (R)-2-((tert-부틸디페닐실릴)옥시)프로판-1-아민 (3.46 g, 11 mmol, 1.2 eq)을 다이클로로메탄 (40 mL)에 녹인 후, 1-에틸-3-(3-디메틸아미노프로필)카보디이미드 (EDCI, 2.1 g, 11 mmol, 1.2 eq), 하이드록시벤조트리아졸 (HOBt, 1.48 g, 11 mmol, 1.2 eq), 다이아이소프로필에틸아민 (DIPEA, 3.2 ml, 18.4 mmol, 2 eq)를 적가한 뒤 상온에서 2시간 동안 교반시켰다. 다이클로로메탄으로 묽힌 뒤 물로 씻었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, 20% ~ 40% 에틸아세테이트/헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 a-1 (2.80 g, 60%)를 얻었다.

¹H NMR (600 MHz, CDCl₃): δ 7.69 (m, 4H), 7.49 - 7.44 (m, 2H), 7.43 - 7.39 (m, 4H), 6.89 (brs, 1H), 5.47 (d, J = 7.9 Hz, 1H), 4.34 (qd, J = 6.4, 2.0 Hz, 1H), 4.05 - 3.97 (m, 2H), 3.34 - 3.30 (m, 1H), 3.24 (dt, J = 13.5, 4.5 Hz, 1H), 2.87 (brs, 1H), 1.48 (s, 9H), 1.18 (d, J = 6.4 Hz, 3H), 1.10 (s, 9H), 1.06 (d, J = 6.2 Hz, 3H); LCMS : C₂₈H₄₃N₂O₅Si에 대하여 515.2 (M+H⁺).

2단계: 화합물 a-2의 제조

화합물 a-1 (4.50 g, 8.8 mmol, 1.1 eq)을 다이클로로메탄 (40 mL) / 트리플루오로아세트산 (40 mL)에 녹인 뒤, 상온에서 1시간 교반 후, 감압농축시켰다. 얻은 화합물은 다이클로로메탄 (20 mL)에 녹인 뒤, 2-브로모티아졸-4-카르복실산 (1.66 g, 8 mmol), 1-에틸-3-(3-디메틸아미노프로필)카보디이미드 (1.68 g, 8.8 mmol, 1.1 eq), 하이드록시벤조트리아졸 (1.19 g, 8.8 mmol, 1.1 eq), 다이아이소프로필에틸아민 (4.2 mL, 24 mmol, 3 eq)를 적가한 뒤 상온에서 12시간 동안 교반시켰다. 다이클로로메탄으로 묽힌 뒤, 물로 씻어주었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, 20% ~ 50% 에틸아세테이트/헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 노란색 고체 화합물 a-2 (3.00 g, 63%)을 얻었다.

¹H NMR (600 MHz, CDCl₃) δ 8.08 (s, 1H), 8.01 (d, J = 8.4 Hz, 1H), 7.69 - 7.65 (m, 4H), 7.48 - 7.44 (m, 2H), 7.42 - 7.37 (m, 4H), 6.92 - 6.90 (m, 1H), 4.44 (qd, J = 6.5, 1.9 Hz, 1H), 4.39 (dd, J = 8.4, 1.9 Hz, 1H), 4.02 - 3.97 (m, 1H), 3.55 (brs, 1H), 3.29 (app.t, J = 5.3 Hz, 2H), 1.22 (d, J = 6.5 Hz, 3H), 1.05 (s, 9H), 1.03 (d, J = 6.5 Hz, 3H); LCMS : C₂₇H₃₅BrN₃O₄SSi에 대하여 604.1 (M+H⁺).

3단계: 화합물 a-3의 제조

화합물 a-2 (3 g, 5 mmol)를 다이클로로메탄 (40 mL)에 녹인 뒤, 메탄설포닐 클로라이드 (MsCl, 1.15 mL, 14.9 mmol, 3 eq), 트리에틸아민 (2.1 mL, 14.9 mmol, 3 eq)를 적가한 후, 상온에서 1시간 동안 교반시켰다. 그리고 나서 1,8-디아자바이사이클로[5,4,0]언덱-7-엔 (DBU, 11.2 ml, 74.8 mmol, 15 eq)을 첨가하고 상온에서 2시간동안 교반시켰다. 반응 종결을 확인한 뒤, 다이클로로메탄에 묽힌 뒤, 과포화된 염화암모늄을 넣어 씻어 주었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, 30% ~ 50% 에틸아세테이트/헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 a-3 (2.2 g 75 %)을 얻었다.

¹H NMR (600 MHz, CDCl₃): δ8.32 (s, 1H), 8.12 (s, 1H), 7.66 - 7.64 (m, 4H), 7.48 - 7.41 (m, 2H), 7.40 - 7.37 (m, 4H), 6.53 (q, J = 7.1 Hz, 1H), 6.39 (app.t, J = 5.3 Hz, 1H), 4.05 - 4.01 (m, 1H), 3.41 (ddd, J = 13.6, 5.4, 3.6 Hz, 1H), 3.33 (dt, J = 13.6, 5.9 Hz, 1H), 1.79 (d, J = 7.1 Hz, 3H), 1.10 (d, J = 6.2 Hz, 3H), 0.99 (s, 9H); LCMS : C₂₇H₃₃BrN₃O₃SSi에 대하여 586.1 (M+H⁺).

4단계: 화합물 a-4의 제조

화합물 a-3 (2.2 g, 3.74 mmol)을 테트라히드로푸란 (30 mL)에 녹인 뒤, 1 M 테트라-n-부틸 암모늄 플루오라이드 (TBAF, 6.74 mL, 6.74 mmol, 1.8 eq)를 적가한 뒤, 상온에서 30분간 교반시켰다. 에틸아세테이트로 묽힌 뒤, 과포화된 염화암모늄을 넣어 씻어 주었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, (2 % ~ 5 % 메탄올 : 98 % ~ 95 % 다이클로로메탄) 용액으로 컬럼크로마토그래피를 이용하여 분리하여 무색 액체 화합물 a-4 (800 mg, 61 %)을 얻었다.

¹H NMR (600 MHz, CD₃OD): δ 8.30 (d, J = 0.9 Hz, 1H), 6.71 (q, J = 7.1 Hz, 1H), 3.94 - 3.85 (m, 1H), 3.30 (dd, J = 13.5, 4.7 Hz, 1H), 3.20 (dd, J = 13.4, 7.1 Hz, 1H), 1.79 (d, J = 7.1 Hz, 3H), 1.16 (d, J = 6.3 Hz, 3H); LCMS : C₁₁H₁₅BrN₃O₃S에 대하여 348.0 (M+H⁺).

5단계: 화합물 A1의 제조

화합물 a-4 (386 mg, 1.12 mmol)을 다이클로로메탄 (10 mL)에 녹인 뒤, 데스-마틴 페리오디난 (706 mg, 1.66 mmol, 1.5 eq)을 적가하였다. 상온에서 2시간 교반 시킨 뒤, 다이클로로메탄으로 묽히고, 과포화된 탄산수소나트륨으로 씻어 주었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 뒤, (2 % ~ 5 % 메탄올 : 98 % ~ 95 % 다이클로로메탄) 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 A1 (356 mg, 89 %)을 얻었다.

¹H NMR (600 MHz, CD₃OD): δ8.30 (s, 1H), 6.77 (q, J = 7.1 Hz, 1H), 4.07 (s, 2H), 2.18 (s, 3H), 1.81 (d, J = 7.1 Hz, 3H); LCMS : C₁₁H₁₃BrN₃O₃S에 대하여 345.9 (M+H⁺).

[실시예 1] 화합물 13 (마크로코신 P2)의 제조

1단계: 화합물 3의 제조

4-브로모-2-포르밀티아졸 (768 mg, 4 mmol)을 테트라히드로푸린 (10 mL)에 녹인 뒤, 에티닐마그네슘 브로마이드 용액 (0.5 M in THF, 16 mL, 8 mmol)을 0℃에서 천천히 적가하였다. 상온에서 30분간 교반 후, 과포화된 암모늄 클로라이드 용액을 첨가하여 반응을 중지시켰다. 에틸아세테이트로 추출한 뒤 무수 황산나트륨으로 탈수시켜 감압농축하였다. 얻은 잔여물을 30% 에틸아세테이트/70% 헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 하얀 고체 화합물을 얻었다. 얻은 화합물 (632 mg, 2.9 mmol)을 다이클로로메탄 (30 mL)에 녹인 뒤, 이산화망간 (2.52 g, 29 mmol)을 첨가한 뒤, 상온에서 2시간동안 교반시켰다. 셀라이트를 이용하여 망간 잔여물을 걸러낸 뒤, 다이클로로메탄으로 추출하고 무수 황산나트륨으로 탈수시키고 난 뒤, 감압농축하여 갈색 고체 화합물 3 (527 mg, 61%) 를 얻었다.

¹H NMR (400 MHz, CDCl₃) δ 7.69 (s, 1H), 3.67 (s, 1H); LCMS : C₆H₃BrNOS에 대하여 215.9 (M+H⁺).

2단계: 화합물 5의 제조

화합물 4는 참고문헌[Org. Lett,　2020, 22, 6, 2365-2370]에 개시된 방법으로 합성되었다.

아세토니트릴 (6.52 mL, 125 mmol, 2 eq)을 테트라히드로푸란 (120 mL)에 녹인 후, n-부틸리튬 용액 (2.5 M in hexanes, 54.8 mL, 137 mmol, 2.2 eq)을 -78℃에서 천천히 적가하였다. -78℃에서 20분동안 교반 후, 테트라히드로푸란 (120 mL)에 녹아 있는 화합물 4 (22.3 g, 62.6 mmol)을 같은 온도에서 천천히 적가시켰다. 상온으로 천천히 온도를 올린 뒤, 1시간 동안 반응시킨 뒤, 1 M 농도의 염산을 넣어 반응을 중지시켰다. 에틸아세테이트로 묽힌 뒤, 추가로 염산을 넣어 pH3으로 산성화시켰다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 후 감압농축하여 갈색 고체 화합물 5 (22.2 g, 97%)를 얻었다.

¹H NMR (400 MHz, CDCl₃) δ 8.29 (s, 1H), 4.71 (d, J = 17.7 Hz, 1H), 4.32 - 4.09 (m, 3H), 1.70 (broad peak, 6H), 1.54 - 1.38 (m, 7H), 1.31 - 1.06 (m, 5H); LCMS : C₁₇H₂₄N₃O₄S에 대하여 366.1 (M+H⁺).

3단계: 화합물 6의 제조

화합물 5 (22.3 g, 61.0 mmol)을 톨루엔 (300 mL)과 아세트산 (60 mL) 혼합물에 녹인 뒤, 아세트산암모늄 (47 g, 610 mmol, 10 eq)을 적가하였다. 120℃에서 1시간 동안 교반시킨 후 상온으로 천천히 식혔다. 에틸아세테이트로 묽힌 뒤, 과포화된 탄산수소나트륨 용액과 물로 씻었다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 후 감압농축하여 노란색 오일 화합물 6 (21.0 g, 94%)를 얻었다.

¹H NMR (400 MHz, CDCl₃) δ 7.60 (s, 1H), 5.59 - 5.51 (m, 2H), 4.81 - 4.50 (m, 2H), 4.21 - 4.10 (m, 1H), 1.67 (s, 6H), 1.48 - 1.36 (m, 6H), 1.27 - 0.96 (m, 6H); LCMS : C₁₇H₂₅N₄O₃S에 대하여 365.1 (M+H⁺).

4단계: 화합물 7의 제조

화합물 6 (21.0 g, 57.5 mmol)을 에탄올 (300 ml)에 녹인 뒤, 화합물 3 (22.9 g, 106.3 mmol, 1.85 eq)을 적가 한 뒤, 60℃에서 90분동안 교반시켰다. TLC와 LC Mass로 출발물질이 사라진 것을 확인한 뒤, 아세트산 (30% volume, 90 ml)을 첨가하고 난 뒤, 90℃에서 16시간 동안 반응시켰다. 감압농축하여 에탄올과 아세트산을 제거한 뒤, 디클로로메탄으로 묽힌 뒤, 과포화된 탄산수소나트륨 용액으로 반응을 중지시켰다. 유기층을 추출하여 무수 황산나트륨으로 탈수시킨 후 감압농축시켰다. 5% ~ 15% 에틸아세테이트/헥산 용액으로 컬럼크로마토그래피를 이용하여 분리하여 노란색 고체 화합물 7 (16.5 g, 51%)를 얻었다.

¹H NMR (400 MHz, CDCl₃) δ 8.27 (s, 1H), 8.19 (s, 2H), 7.48 (s, 1H), 4.85 (d, J = 7.3 Hz, 1H), 4.58 - 4.23 (broad peak, 1H), 1.83 - 1.67 (broad peak, 6H), 1.57 - 1.45 (m, 6H), 1.33 - 1.20 (m, 6H); LCMS : C₂₃H₂₅BrN₅O₃S₂에 대하여 562.0 (M+H⁺).

5단계: 화합물 9의 제조

화합물 7 (1.42 g, 2.53 mmol)을 에탄올 (27 mL)과 인산 나트륨 버퍼 용액 (pH 7, 9 mL), 물 (4.5 mL)의 혼합용액에 녹인 뒤, L-시스테인 (3.06 g, 25.3 mmol, 10 eq)을 적가하였다. 100℃에서 24시간 동안 교반 시킨 뒤, 감압농축하여 에탄올을 제거하고 에틸아세테이트로 묽혔다. 과량의 시스테인을 제거하기 위해 1 M 농도의 염산으로 씻은 뒤, 무수 황산나트륨으로 탈수시켰다. 추출하여 얻은 용액을 감압농축하여 갈색 오일의 티아졸린을 얻을 수 있었다.

갈색 오일의 티아졸린 (1.68 g, 2.53 mmol)을 다이클로로메탄 (30 mL)에 녹인 뒤, 브로모트리클로로메탄 (1.0 mL, 10.12 mmol, 4 eq)을 넣은 뒤, 1,8-디아자바이사이클로[5,4,0]언덱-7-엔 (1.88 mL, 12.65 mmol, 5 eq)을 천천히 적가시켰다. 60℃에서 4시간 교반시킨 뒤, 1 M 농도의 염산을 넣어 반응을 중지시켰다. 다이클로로메탄으로 추출한 뒤, 물과 소금물로 세척하였다. 추출한 유기층을 무수 황산나트륨으로 탈수시킨 후 감압농축하고, 5% ~ 15% 메탄올/다이클로로메탄 용액으로 컬럼크로마토그래피를 이용하여 분리하여 갈색 고체 화합물 9 (1.05g, 62%)를 얻었다.

¹H NMR (400 MHz, CDCl₃) δ 8.35 - 8.05 (m, 3H), 7.89 (bs, 1H), 7.33 (s, 1H), 4.49 - 4.40 (m, 1H), 4.09 - 3.97 (m, 1H), 1.71 - 1.29 (m, 10H), 1.26 - 1.08 (m, 8H); LCMS : C₂₆H₂₇BrN₅O₅S₃에 대하여 664.0 (M+H⁺).

6단계: 화합물 10의 제조

화합물 B1은 참고문헌 [Org. Lett,　2020, 22, 6, 2365-2370]에 따라 제조되었다. 화합물 9 (1.05 g, 1.57 mmol)를 아세토니트릴 (8 mL)에 녹인 뒤, 화합물 B1 (932 mg, 1.88 mmol), 1-메틸이미다졸 (0.376 mL, 4.71 mmol, 3 eq), TCFH (Chloro-N,N,N,N-tetramethylformamidinium hexafluorophosphate, 0.528 g, 1.88 mmol, 1.2 eq)을 넣고 상온에서 30분동안 교반시켰다. 이 용액을 에틸아세테이트로 묽힌 뒤, 물로 씻어주고 유기층을 무수 황산나트륨을 이용하여 탈수시키고 감압농축하였다. 이 농축액을 (40% ~ 90 % 에틸아세테이트 : 60 % ~ 10 % 헥산) 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 10 (1.05 g, 60 %)를 얻었다.

¹H NMR (400 MHz, CDCl₃) δ 8.69 (s, 1H), 8.44 (d, J = 9.5 Hz, 1H), 8.35 - 8.24 (m, 4H), 8.24 - 8.17 (m, 1H), 8.06 (s, 1H), 7.96 (s, 1H), 7.94 - 7.87 (m, 1H), 6.47 (q, 7.1 Hz, 1H), 5.41 - 5.31 (m, 1H), 4.88 (d, J = 5.3 Hz, 1H), 4.78 (bs, 1H), 4.68 - 4.58 (m, 1H), 4.58 - 4.46 (m, 1H), 4.16 - 3.98 (m, 1H), 3.86 (s, 3H), 2.49 - 2.45 (m, 1H), 1.87 (d, J = 7.1 Hz, 3H), 1.69 - 1.48 (m, 6H), 1.45 - 1.32 (m,3H), 1.31 - 1.08 (m, 12H), 1.03 (d, J = 6.8 Hz, 3H), 0.95 (d, J = 6.7 Hz, 3H); LCMS : C₄₆H₅₂BrN₁₀O₉S₅에 대하여 1127.1 (M+H⁺).

7단계: 화합물 11의 제조

화합물 10 (200 mg, 0.177 mmol)을 테트라히드로푸란 (1 mL) / 물 (1 mL)의 혼합용매에 넣고 수산화리튬1수화물 (22 mg, 0.531 mmol, 3 eq)을 첨가한 뒤 상온에서 2시간동안 교반시켰다. 이 용액을 다이클로로메탄에 묽히고, 1 M 염산용액으로 씻어준 뒤, 무수 황산나트륨을 이용하여 탈수시키고 감압농축하여 카복실산을 얻었다. 이 농축액을 다이클로로메탄 (1 mL) / 트리플루오로아세트산 (1 mL)의 혼합용매에 넣고 상온에서 30분동안 교반시킨 후 감압농축하여 트리플루오로아세트산염을 얻었다. 이 농축액을 DMF (1 mL)에 묽힌 뒤, 디페닐포스포릴 아자이드 (0.038 mL, 0.177 mmol, 1 eq), 탄산수소 나트륨 (0.045 mL, 0.531 mmol, 3 eq)을 넣고 12 시간 상온에서 교반시켰다. 이 용액을 다이클로로메탄으로 묽히고, 유기층을 물로 3번 씻어준 뒤 무수 황산나트륨으로 탈수시키고 감압농축한 후 (2 % ~ 5 % 메탄올 : 98 % ~ 95 % 다이클로로메탄) 용액으로 컬럼크로마토그래피를 이용하여 분리하여 노란색 고체 화합물 11 (96 mg, 56%)을 합성하였다.

¹H NMR (400 MHz, CDCl₃) δ 8.77 (s, 1H), 8.39 (d, J = 9.6 Hz, 1H), 8.22 - 8.18 (m, 2H), 8.16 - 8.09 (m, 3H), 8.01 - 7.92 (m, 3H), 7.40 (s, 1H), 6.39 (q, J = 7.0 Hz, 1H), 5.27 - 5.18 (m, 2H), 4.92 (d, J = 7.8 Hz, 1H), 4.67 (s, 1H), 4.47 - 4.33 (m, 1H), 2.95 (bs, 1H), 2.48 (dq, J = 13.4, 6.6 Hz, 1H), 2.22 (bs, 1H), 1.81 (d, J = 7.0 Hz, 3H), 1.57 (d, J = 5.2 Hz, 3H), 1.19 (d, J = 6.5 Hz, 3H), 1.14 (d, J = 6.7 Hz, 3H), 0.95 (d, J = 6.6 Hz, 3H); LCMS : C₃₇H₃₆BrN₁₀O₆S₅에 대하여 955.0 (M+H⁺).

8단계: 화합물 12의 제조

화합물 11 (41 mg, 0.043 mmol)을 1,4-다이옥산 (0.6 mL)에 녹인 후, 비스(피나콜라토)다이보론 (B₂Pin₂, 14.2 mg, 0.056 mmol, 1.3 eq), 포타슘아세테이트 (KOAc, 6.7 mg, 0.065 mmol, 1.5 eq), 엑스포스 (Xphos, 3.1 mg, 15 mol%)를 첨가하였다. 첨가한 후, 1분동안 질소를 넣어 주고, 트리스(디벤질리덴아세톤)디팔라듐(0) (Pd₂(dba)₃, 4mg, 10 mol%)를 적가하였다. 90℃에서 3시간 동안 교반한 후, 다이클로로메탄으로 묽힌후, 유기층을 추출하였다. 추출한 유기층을 물로 세척하고, 무수 황산나트륨으로 탈수시킨 후 감압농축시켜 고체 화합물 12 (18 mg, 47 %)를 얻었다.

¹H NMR (400 MHz, MeOD) δ 8.40 - 8.21 (m, 4H), 8.13 (s, 1H), 7.93 (s, 1H), 7.76 (s, 1H), 6.61 (q, J = 6.9 Hz, 1H), 5.29 - 5.19 (m, 2H), 4.75 (d, J = 3.1 Hz, 1H), 4.62 - 4.50 (m, 1H), 4.30 (dd, J = 6.3, 2.9 Hz, 1H), 2.64 (dq, J = 13.4, 6.7 Hz, 1H), 1.85 (d, J = 7.0 Hz, 3H), 1.53 (d, J = 6.4 Hz, 3H), 1.19 (d, J = 6.3 Hz, 3H), 1.13 (d, J = 6.7 Hz, 3H), 0.99 (d, J = 6.7 Hz, 3H); LCMS : C₃₇H₃₈BN₁₀O₈S₅에 대하여 921.1 (M+H⁺).

9단계: 화합물 13의 제조

화합물 12 (276 mg, 0.3 mmol)을 테트라히드로푸란 (6 mL)와 물 (1.5 mL)의 혼합용매에 녹였다. 화합물 A1 (155 mg, 0.45 mmol, 1.5 eq)을 적가한 후, 3분간 질소를 공급하였다. 이후에 탄산칼륨 (124 mg, 0.9 mmol, 3 eq), 테트라키스(트라이페닐포스핀)팔라듐 (Pd(PPh₃)₄, 10 mol%, 35 mg)을 넣고 다시 질소를 1분간 넣어 주었다. 38℃에서 3시간 동안 교반시킨 후, 감압농축시켰다. 얻은 잔여물을 0~5% 메탄올/다이클로로메탄 용액으로 컬럼크로마토그래피를 이용하여 분리하여 흰색 고체 화합물 13 (179 mg, 55%)를 얻었다.

¹H NMR (600 MHz, MeOD) δ 8.40 - 8.31 (m, 4H), 8.27 (s, 1H), 8.22 (s, 1H), 8.13 (s, 1H), 7.96 (s, 1H), 6.82 (q, J = 7.1 Hz, 1H), 6.60 (q, J = 6.8 Hz, 1H), 5.24 (d, J = 2.9 Hz, 1H), 5.22 (d, J = 8.8 Hz, 1H), 4.78 (d, J = 3.1 Hz, 1H), 4.62 - 4.55 (m, 1H), 4.30 (qd, J = 6.3, 2.8 Hz, 1H), 4.10 (d, J = 13.0 Hz, 1H), 2.63 (dq, J = 13.4, 6.7 Hz, 1H), 2.19 (s, 3H), 2.20 - 2.14 (m, 1H), 1.92 (s, 1H) 1.86 (app. d, J = 7.0 Hz, 6H), 1.55 (d, J = 6.4 Hz, 3H), 1.18 (d, J = 6.3 Hz, 3H), 1.13 (d, J = 6.7 Hz, 3H), 0.99 (d, J = 6.7 Hz, 3H); LCMS : C₄₈H₄₈N₁₃O₉S₆에 대하여 1142.2 (M+H⁺).

[실시예 2] 마크로코신 화합물의 제조

1) 바실러스 세레우스 게노믹 DNA 분리

바실러스 세레우스(Bacillus cereus) ATCC 14579 균주의 배양을 위해 루리아-버타니 배지(Luria-Bertani, LB; Becton, Dickinso and Company, New Jersey, USA) 를 이용하여 루리아-버타니 한천 배지에 형성된 단일 콜로니를 LB broth 5 ml에 접종하고, 30 ℃에서 3일간 배양하였다. 이를 통해 분리된 균주로부터 게노믹 DNA 미니 키트(genomic DNA extraction kit; promega, WI, USA)를 사용하여 게놈 DNA를 분리하였다.

2) 벡터 제작

Thiocillin을 생합성하는 유전자 클러스터는 24개의 생합성 관련 유전자들이 22kb에 걸쳐 구성되어 있다. 이 중에서 8개의 유전자를 이용하여 Micrococcin P2을 합성할 수 있는 벡터를 제작하였고 이를 바실러스 섭틸리스(Bacillus subtilis) 168에서 발현하여 물질을 확보하고자 하였다.

벡터 제작에 사용된 생합성 유전자는 BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 이다. BcTclIJKLMNP의 경우 자일로스에 의해 유도 가능한 프로모터(Xylose inducible promoter)에 유전자 클로닝을 하였고, BcTclE 역시 동일한 자일로스 유도 프로모터에 4개의 BcTclE 유전자를 연결하여 재조합 플라스미드를 확보하였다.

바실러스 형질전환용 벡터는 pUC19 벡터를 변형하여 준비하였다. pUC19는 바실러스 형질전환에 사용하기 위해 pDG1661 벡터로부터 도입한 amyE, cat, ThrC, 염기 서열을 이용하여 제작하였다. 1번 벡터는 형질전환 바실러스 섭틸리스가 amyE locus에 integration되어 클로람페니콜에 저항성을 갖도록 디자인한 벡터를 이용하여 생합성 유전자들을 삽입하였다. 즉, 1번 벡터는 Micrococcin P2 생합성 유전자(BcTclE,J,K,L,M,N,P)가 클로닝되어 있고, 2번 벡터는 1번 벡터에 BcTclO 유전자를 추가 삽입한 것이다. 3번 벡터의 경우 BcTclD, BcTclC 유전자를 삽입한 벡터이다.

각 유전자들은 DNA로부터 통상적인 중합효소연쇄반응(polymerase chain reaction, PCR) 방법을 통해 증폭하여 Gibson assembly(NEB, England) 또는 리가아제를 이용하여 유전자 클로닝을 하였다. 이에 사용한 벡터는 pUC19을 바실러스 섭틸리스 형질전환할 수 있게 변형한 벡터로, 클로닝 및 벡터의 변형에 사용된 프라이머는 하기 표 1 내지 표 3에 기재된 바와 같다.

1번 벡터
번호	이름	프라이머 서열	주형
1	amyE-F	GTGCACCATATGTTTGCAAAACGATTCAAAACC	pDG1661
2	amyE-R	TCGAATTCCGTATCATGCGACTCTACC	pDG1661
3	cat-amyE-F	CGACCTGCAGGCATGCAAGCTTGCACCCATTAGTTCAACAAAC	pDG1661
4	cat-amyE-R	ATGACCATGATTACGCCAAGCTATCAATGGGGAAGAGAACCGC	pDG1661
5	xylR-CRE-F	ACGGAATTCGAGCTCGGTACCGAACTCCTTTTTCATATGAGAAGG	gDNA
6	xylR-CRE-R	TTCTAGAGGATACCCGGGTACCTTAGTAAACCACTTTGTTTGCGCTTCC	gDNA
7	BcTclE-F	GGGGCTAGCTTTAAGAAGGAGATATACAT	gDNA
8	BcTclE-R	GCTCTAGATTAAGTTGTACAACAACTGC	gDNA
9	BcTclI-F	GTTTACTAAGGTACCCGGGATCCGTTTGTTCCCTTTATAGAAAGG	gDNA
10	BcTclJ-R	TCAGTGGTGGTGGTGGTGGTGCTCGAGTTATGGGAAAGGATGAGGAGTTAC	gDNA
11	BcTclK-F	TCCTCATCCTTTCCCATAACATTTTTTATGAAAGATGG	gDNA
12	BcTclL-R	TCAGTGGTGGTGGTGGTGGTGCTCGAGTCATCCCTTTCTACTCTTATACAATG	gDNA
13	BcTclM-F	ATAAGAGTAGAAAGGGATGACTTAAATGGAGCAGTATC	gDNA
14	BcTclN-R	TCAGTGGTGGTGGTGGTGGTGCTCGAGTCATACATAAAATTGTTCTCCTTTAGTT	gDNA
15	BcTclP-F	TAAAGGAGAACAATTTTATGTATGACGGAAAACGGGTGAATC	gDNA
16	BcTclP-R	TCAGTGGTGGTGGTGGTGGTGTCGAGATCTAGTGTAATGTATAACCACC	gDNA

2번 벡터
번호	이름	프라이머 서열	주형
1	TclO-F	AGGAGAACAATTTTATGTATGACGAATAAAACTAAAGGAGAAC	gDNA
2	TclO-R	TCAGTGGTGGTGGTGGTGGTGCTCGAGCTAACGTTTTATTCCATTCAC	gDNA

3번 벡터
번호	이름	프라이머 서열	주형
1	TclD-F	TGCAGTTGTTGTACAACTTAACAATTAGAGAGGAGTATAC	gDNA
2	TclC-R	TCAGTGGTGGTGGTGGTGGTGCTCGAGTCAAGAAAGATTAATATTATCTAC	gDNA

유전자 클로닝을 위한 숙주세포로 대장균(Escherichia coli) DH5α (Enzynomics, Korea)을 선택하였고, 유전자는 시퀀싱을 통해 돌연변이가 없음을 확인한 후에, 다음 분자클로닝을 진행하였다. 이를 통해 바실러스에서 티오펩타이드를 생합성 할 수 있는 벡터를 제작하였다. pUC19에 새로 도입된 유전자 재조합 플라스미드 도식도는 도 1, 도 2 및 도3 에 나타내었으며, 이의 염기서열은 서열목록에 기재하였다.

3) 형질전환 바실러스에서의 물질 합성 및 분석

도 1, 도 2 및 도 3에 도시된 3개의 플라스미드는 Bacillus subtilis 168 숙주에 통상적으로 알려진 프로토콜을 사용하여 형질전환하였다. 형질전환된 바실러스 섭틸리스를 루리아-버타니(LB) 배지에서, 클로람페니콜(Chloramphenicol, Sigma, USA) 10 ug/mL, 생합성 유전자의 발현을 유도하기 위해서 자일로스(Xylose, TCI, Tokyo)을 1%가 되게 첨가하여 72시간동안 37 ℃, 200rpm을 유지하면서 배양하였다. 생합성 유전자들에 의해 생산되는 대사산물을 확인하기 위해 각 플라스미드에 의해 형질전환된 바실러스 섭틸리스 균주를 메탄올을 이용해 추출하여, UPLC-MS(Ultra Performance Liquid Chromatography Mass Spectrometry)을 통해 확인하였다. 그 결과를 도 4에 도시하였으며, 검출된 물질들의 질량들을 확인해 보았을 때, 1번 물질은 1142.6, 2번 물질은 1156.5, 3번 물질은 1158.3 의 수치를 나타냈다.

4) 발현된 대사산물의 분리정제

플라스미드 1과 2에 의해 형질 전환된 바실러스로부터 합성된 물질을 각각 분리 정제하였다. 자일로스를 통한 생합성 유전자의 발현 후 세포 배양액 2L를 4,000 xg에서 20 분간 원심분리하여 세포를 수득하여 상등액을 버리고, 메탄올 100mL을 이용하여 재현탁한 후 20분 동안 상온에 방치하였다. 이후 12,000 xg에서 15 분간 원심분리하여 추출액을 확보하였다.

확보한 메탄올 추출액은 무수 황산나트륨으로 탈수시켜 감압농축시켰다. 이를 다시 메탄올/다이클로로메탄(1/9 (v/v))으로 녹이고 유기층을 필터 후, 분취컬럼크로마토크래피 (Prep-HPLC) (5 % ~ 70 % 아세토나이트릴 (0.1% TFA) : 95 % ~ 30 % 물 (0.1% TFA))를 이용하여 화합물을 얻었다. 얻어진 2가지의 물질의 구조를 입증하기 위해 600MHz 핵자기공명기를 이용하여 ¹H NMR 스펙트럼을 다음과 같이 얻었다.

도 4에 도시된 1번 물질은 흰색 고체 화합물로 얻어졌으며, 이의 ¹H NMR은 천연물 Micrococcin P2와 동일함을 확인하였다.

<1번 물질> ¹H NMR (600 MHz, MeOD) δ 8.40 - 8.31 (m, 4H), 8.26 (s, 1H), 8.21 (s, 1H), 8.14 (s, 1H), 7.95 (s, 1H), 6.83 (q, J = 7.1 Hz, 1H), 6.60 (q, J = 6.8 Hz, 1H), 5.25 (d, J = 2.9 Hz, 1H), 5.21 (d, J = 8.9 Hz, 1H), 4.77 (d, J = 3.1 Hz, 1H), 4.63 - 4.56 (m, 1H), 4.30 (qd, J = 6.3, 2.8 Hz, 1H), 4.10 (d, J = 13.0 Hz, 1H), 2.63 (dq, J = 13.4, 6.7 Hz, 1H), 2.19 (s, 3H), 2.20 - 2.14 (m, 1H), 1.93 (s, 1H) 1.85 (app. d, J = 7.0 Hz, 6H), 1.55 (d, J = 6.4 Hz, 3H), 1.18 (d, J = 6.6 Hz, 3H), 1.13 (d, J = 6.6 Hz, 3H), 0.99 (d, J = 6.9 Hz, 3H); LCMS : C₄₈H₄₈N₁₃O₉S₆에 대하여 1142.2 (M+H⁺).

도 4에 도시된 2번 물질은 노란색 고체 화합물로 얻어졌으며, 이의 ¹H NMR은 천연물 Thiocillin IV와 동일함을 확인하였다.

<2번 물질> ¹H NMR (600 MHz, CDCl₃) δ 8.71 (s, 1H), 8.57(s, 1H), 8.30 (d, J = 8.0 Hz, 1H), 8.26 (s, 1H), 8.20 (s, 1H), 8.17 - 8.14 (m, 2H), 8.08 - 7.99 (m, 3H), 7.92 (s, 1H), 7.79 (d, J = 7.1 Hz, 1H), 7.74 (s, 1H), 6.89 (d, J = 7.0 Hz, 1H), 6.49 (q, J = 6.9 Hz, 1H), 5.40 (d, J = 10.2 Hz, 1H), 5.25 (t, J = 9.7 Hz, 1H), 4.96 (dd, J = 6.8, 3.5 Hz, 1H), 4.49 (s, 1H), 4.46 (s, 1H), 4.15(m, 1H), 2.85(s, 3H), 2.53 (ddd, J = 16.3, 13.4, 6.7 Hz, 1H), 2.28 (s, 3H), 1.86 (d, J = 7.0 Hz, 6H), 1.69 (d, J = 6.3 Hz, 3H), 1.20 (d, J = 6.6 Hz, 3H), 1.16 (d, J = 6.3 Hz, 3H), 1.00 (d, J = 6.6 Hz, 3H); LCMS : C₄₉H₄₉N₁₃O₉S₆ 에 대하여 1156.6.

한편, 도 4에 도시된 3번 물질은 UPLC-MS을 통해 검출된 질량이 1158.3 의 수치를 나타내 YM-266183과 질량이 일치함을 확인하였다.

각 플라스미드를 통해 생합성된 물질의 구조를 하기 표 4에 기재하였다.

형질전환 바실러스로부터 생합성된 물질들의 구조

플라스미드	플라스미드 1	플라스미드 2	플라스미드 3
생합성된 물질의 구조

상기 표 4의 각 화합물들은 순서대로 플라스미드 1, 2 및 3에 의해 합성된 Micrococcin P2, Thiocillin IV 및 YM-266183의 구조를 나타낸다.

플라스미드 1에는 생합성 유전자 BcTclE,I,J,K,L,M,N,P 가 삽입되어 있고, 이로부터 천연물 Micrococcin P2이 합성되었다. 플라스미드 1은 Micrococcin P2 생합성 가능한 유전자 클러스터로, 플라스미드 1을 구성하고 있는 생합성 유전자에 의해 천연물 Micrococcin P2 골격이 합성이 가능함을 알 수 있다.

플라스미드 2는 플라스미드 1에 BcTclO 유전자가 추가로 삽입되어 있으며, 이로부터 Thiocillin IV이 얻어졌다. 즉, Micrococcin P2 생합성 유전자와 BcTclO 유전자를 함께 삽입하는 경우 선택적으로 O-Methylation된 Thiocillin IV을 합성할 수 있음을 알 수 있다.

플라스미드 3에는 플라스미드 1에 BcTclD, BcTclC 유전자가 추가로 삽입되어 있으며, 이에 의하여 Valine hydroxylation된 물질, YM-266183이 얻어졌다. 즉 Micrococcin P2 유전자와 BcTclD, C 유전자를 함께 발현하는 바실러스를 배양, 분리 정제함으로써, YM-266183 화합물을 얻을 수 있음을 알 수 있다.

생합성 유전자들은 각 플라스미드 예시에서 확인할 수 있듯이, TclO, 혹은 TclD,C와 천연물 Micrococcin P2간의 조합을 통해 마크로사이클 내부의 생합성 효소에 의한 변형을 조절할 수 있다.

[실시예 3] 마크로코신 기반 카르복실산 화합물 C-1의 제조

Micrococcin P2 (14 mg, 0.012 mmol)을 테트라히드로푸란 (150 μL) / 물 (150 μL)의 혼합용매에 넣고 수산화리튬 일수화물(LiOH·H₂O) (4.0 mg, 0.096 mmol)을 첨가한 뒤 50℃에서 17시간동안 교반시켰다. 교반 완료 후, 상기 반응혼합물을 다이클로로메탄으로 묽히고, 1M 염산용액으로 씻어준 뒤, 수퍼 솔벤트 (클로로포름 : 프로판올 = 4 : 1 (v:v))로 추출하였다. 이후에 무수 황산나트륨을 이용하여 탈수시킨 뒤, 분취컬럼크로마토크래피 (Prep-HPLC) (5 % ~ 70 % 아세토나이트릴 (0.1% TFA) : 95 % ~ 30 % 물 (0.1% TFA))를 이용하여 분리하여 옅은 노란색의 고체 화합물 C-1 (7.4 mg, 61 %)을 얻었다.

¹H NMR (400 MHz, DMSO, ppm) δ 9.55 (s, 1H), 8.59 - 8.51 (m, 2H), 8.50 - 8.35 (m, 3H), 8.35 - 8.27 (m, 2H), 8.28 - 8.17 (m, 2H), 8.13 (s, 1H), 7.88 (d, J = 7.6 Hz, 1H), 6.47 (q, J = 6.5 Hz, 1H), 5.20 - 4.96 (m, 2H), 4.73 - 4.63 (m, 1H), 4.42 - 4.33 (m, 1H), 4.04 - 3.96 (m, 1H), 1.76 (d, J = 6.3 Hz, 3H), 1.38 (d, J = 6.0 Hz, 3H), 1.00 (dd, J = 25.3, 6.1 Hz, 6H), 0.86 (d, J = 6.4 Hz, 3H); LCMS : C₄₁H₃₇N₁₁O₈S₆ 에 대하여 1004.2 (M+H⁺).

[실시예 4] 마크로코신 기반 카르복실산 화합물 C-2의 제조

상기 실시예 3의 Micrococcin P2 대신에 Thiocillin IV을 사용하는 것을 제외하고는 실시예 3과 동일하게 반응시켜 카복실산 화합물 C-2을 제조하였으며, 이를 LCMS을 통해 확인하였다. LCMS: C₄₂H₄₀N₁₁O₈S₆1018.2 (M+H⁺)

[실시예 5] 마크로코신 유도체 9의 제조

상기 실시예 3에서 제조된 마크로코신 기반 카르복실산 화합물 C-1 (30 mg, 0.03 mmol)을 디메틸포름아마이드 (0.3 mL)에 녹인 뒤 1-에틸-3-(3-디메틸아미노프로필)카보디아미드 (7.5 mg, 0.039 mmol, 1.3 eq), 하이드록시벤조트리아졸 (5.3 mg, 0.039 mmol, 1.3 eq), N,N-디이소프로필에틸아민 (21 uL, 0.12 mmol, 4 eq), 아민화합물 z-1 (8.6 mg, 0.036 mmol, 1.2 eq)을 넣고 상온에서 12시간 동안 교반시켰다. 교반 완료 후, 이 용액을 다이클로로메테인으로 묽히고, 유기층을 물로 3번 씻어준 뒤 무수 황산나트륨으로 탈수시켜 감압농축하였다. 얻은 잔여물을 (3~5 % 메탄올 : 97~95 % 다이클로로메탄) 용액으로 컬럼크로마토그래피를 이용해 분리하여 흰색 고체의 마크로코신 유도체 9 (15.1 mg, 41 %)를 얻었다.

¹H NMR (400 MHz, CDCl₃) δ 8.58 (s, 1H), 8.39 (d, J = 9.6 Hz, 1H), 8.29 (d, J = 8.1 Hz, 1H), 8.26 - 8.15 (m, 4H), 8.14 - 8.09 (m, 2H), 8.01 - 7.94 (m, 4H), 7.40 (t, J = 6.2 Hz, 1H), 6.42 (q, J = 7.0 Hz, 1H), 5.88 (s, 1H), 5.29 - 5.18 (m, 2H), 4.87 (d, J = 7.9 Hz, 1H), 4.64 (s, 1H), 4.50 (s, 1H), 4.40 (d, J = 6.6 Hz, 1H), 3.93 (s, 2H), 3.63 (t, J = 6.1 Hz, 2H), 3.32 - 3.22 (m, 2H), 2.96 (s, 1H), 2.54 - 2.42 (m, 1H), 1.92 - 1.69 (m, 7H), 1.57 (d, J = 6.3 Hz, 3H), 1.23 - 1.16 (m, 5H), 1.15 (d, J = 6.7 Hz, 3H), 0.97 (d, J = 6.6 Hz, 3H) ; LCMS : C₅₁H₅₁N₁₅O₁₀S₆에 대하여 1226.23 (M+H⁺).

이상과 같이 본 발명에서는 특정된 사항들과 한정된 실시예에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.

<110> A&J SCIENCE CO.,LTD. <120> Method for preparing micrococcin-based carboxylic acid compound and micrococcin-based carboxylic acid compound prepared therefrom <130> 22P220267 <150> KR 10-2021-0085881 <151> 2021-06-30 <160> 3 <170> KoPatentIn 3.0 <210> 1 <211> 18647 <212> DNA <213> Artificial Sequence <220> <223> Plasmid 1 - Example 2 <400> 1 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgtt tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat 240 tgctgtttca tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat 300 cgaatgagct tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt 360 cgttcaatac gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc 420 agacatctcc gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact 480 ggtactggct gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac 540 aagaatttaa agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg 600 cggtcatcaa tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc 660 caaactggac acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc 720 agaattcatt gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc 780 tgaaacggtt cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg 840 ccaaacatat agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca 900 caaatacatc tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg 960 ctgcatatgc gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg 1020 ctttaaagaa tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg 1080 cggacaagct agtgacatgg gtagagtcgc atgatacgga attcgagctc ggtaccgaac 1140 tcctttttca tatgagaagg tgccatgtca ctattgcttc agaaatactc ctagaataaa 1200 aaaactcatc tttaaagatg agctgtccat tccataaaaa attacattgt aatcatgtcc 1260 agaaaatgat caatcacaat ggaggacatt cctaatgccg gtgcattctg tcctaaggaa 1320 gatggcaata attcatagct attgcctaat tgggaataaa cccttgatga tacttcactt 1380 ctcattgaat ttaaaaccat aggatgcgat tcaattatgc tatttcttaa aattacggct 1440 tgtgggttga aagtatttag aatattggta aggcctattc ctaaatagaa tccaaaattt 1500 tgtaatgcat ttaaggttcc gatatcattc agatgggcga ggtttatgat atcttgatag 1560 gacagttttt tctctttggt ctgaagagat tttaataaag ccttctctga agcatacaat 1620 tcccagcatc ctcggtttcc gcaactgcat ttaggaccat taaagtctat tgtcatatgt 1680 cccatttctc cagagaagcc gcttactcct ctatataaat gattgttgat aataacaccg 1740 atccctattc ctgtgctgat acttacgtaa ataatgttat cgtgattttt tgcagctcca 1800 aatacttttt ctccatatgc gccagcattt gcctcatttt caataaaaac aggcacattg 1860 tacttctctt gtatcgaaga ttttaagtca atatctctcc agttggagtt cggagtgaaa 1920 acaatttttt gatctttatc aatgagtcca ggcacgcaaa tacctatacc aataagcccg 1980 tacggagatt ggggcatttg cgtaataaag tgatgaatca tatcaatcaa aatgtctttc 2040 gttatttctg gagaattgga ttccaaatgg cggtattgat caagaacgat tgttccttca 2100 aggtctgtta aaatgccatt aatataatcc acaccaacat ctattccaac ggagtatcct 2160 gcctttttat taaaaacaag catgacaggt cttcttccgc cacttgattg tccttgacct 2220 atttcaaata ccatactttc tttcattaac gtgtttacct gtgatgagac agttgattta 2280 tttaatccag tcatttcaga taattttgct cttgaaatag gtgaattttt aaggatttct 2340 tttaataata acttttgatt tacttttttg acaaaggttt gatcagcgat atccacttca 2400 tccactccat ttgtttaatc tttaaattaa gtatcaacat agtacatagc gaatcttccc 2460 tttattatat ctaatgtgtt cataaaaaac taaaaaaaat attgaaaata ctgacgaggt 2520 tatataagat gaaaataagt tagtttgttt aaacaacaaa ctaataggtg atgtacttac 2580 tatatgaaat aaaatgcatc tgtatttgaa tgaatttatt tttaaggggg aaatcacatg 2640 gctcaatctc attccagttc aatcaactat tttggaagcg caaacaaagt ggtttactaa 2700 ggtacccggg ctagctttaa gaaggagata tacatatgag tgaaattaaa aaagcattaa 2760 atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat gctatgccag 2820 aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt acatgcagtt 2880 gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa ttaaaaaagc 2940 attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg ttgatgctat 3000 gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg tatgtacatg 3060 cagttgttgt acaacttaat ctagctttaa gaaggagata tacatatgag tgaaattaaa 3120 aaagcattaa atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat 3180 gctatgccag aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt 3240 acatgcagtt gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa 3300 ttaaaaaagc attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg 3360 ttgatgctat gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg 3420 tatgtacatg cagttgttgt acaacttaac tcgagcacca ccaccaccac cactgacgta 3480 cgggcccaag cggtacccgg ggatccgttt gttcccttta tagaaaggaa tgatcaaatg 3540 ttagaaataa aagaaaaaca atttattaaa ttaaaagagg acacattctt ttttccttca 3600 gctgaaggga tatactttag gaattctata ggttatttta caatcaaagg tagaaatatt 3660 tacccgtttt ttagtgaaat cagtaaatat ttgaatggta aatatacttt gaaagatata 3720 gtgagtgagt taagcaaaac ccaagaagaa aaatttttaa aattaattgc catattagag 3780 aagaatggtt ttgtaaaata taccgaaagg gttattgatg aaaattatta taaaaattat 3840 gaaaaagaaa ttgcatttat agattattat actaataatg gcatcgaatt atttaaaaaa 3900 ctctctaatt tcaagatttg tttatatggt agcaataagt tatctaatac tattcaaaaa 3960 agcttagaaa acatagggat acaaaatatt aaaagaggct ctcgttttga ttttgaggga 4020 gacattgtta tttattgcaa taatgatgtt aatgaaaggg aaaatctact ggaatgtatg 4080 gacttttctc agaataaaat atttattttt gtaggtaata aagaatcatt aggaattatt 4140 agtcctatta taaaaaattt agatgattgg aaggaatttg aaaatatatt agagattggt 4200 gcagataata ttaaagaaaa tacaacattt actagcaact ctatattaag tagtatgcta 4260 agttttgaaa ttataaagta tgtaacaaat tgtttgcaaa gtgatttaat taatgcggca 4320 tacattttaa atactgatac tttaaaaggg aattttgttc aggtaaaaaa aaaaatagac 4380 ttaaaacaag attttattga aactttcaaa caatcaagcg gaggcaacgg tttgtatatc 4440 aataaaatag gtagaggttc taggaaacaa attccgctct cgcaatggga ggttgaattg 4500 gataaattag gtgacatgaa tagtgaaaaa attaaggtcg ttagctttgg tgatacccac 4560 caggaagcga ggtttaatac ttattataaa accatagaac atctaataat caatggggaa 4620 tttaacttag aggaatcata tagctttaag aatcttgata caatcacttt agctattgat 4680 gaacaattta aaagaaaatt aacaatttca tgcgacatag ataaagaact tgcaatcaga 4740 aaagcaatat taaaagcaat tttaaagagg gaaattaatg taattgataa ttatcaagag 4800 ctttccccat taaaaataag tgattatata gataataaaa atatacaata ctattgtaaa 4860 ctgattaaca ttttaaaagc gaaaatagaa ttgcgtttta agaaattagt agagggtttg 4920 tttttggtag tagttagtga caatagttat aggggagtta gtataggatt taatttaaat 4980 acagcattag aaaatgctct taggcaattt attaataatt tacaaaatag tatctataca 5040 ataaatattg aagatgtaat atttaaaaga attaatgatt gggatgatga atgcattcga 5100 gagtttttga cagatgaaaa attagaagtt tttatctgta gtatacaaaa taatgttatt 5160 tcagcagaaa tttctatagt tggagcaata ttaatagaaa gttaggtgaa ttgaaaaatg 5220 aataaggaag tccttataat cagggatgaa agctttggag aattttttga ttcttttttt 5280 ttaaatgaaa ataatcgaaa agtttgtttt atagatagta ataaaaaaga tttgaaatat 5340 ttattaaaaa actttttaga gaataaaaag tttagttatg tactaatctt tccaaaggaa 5400 tggaatccta tgatgtatag gtcacttgat gcagtgttag aagactatga tgtaccgtgg 5460 atctatataa cacaattttt taataaaatt ttaataggtc cttttagaaa ttctaagcaa 5520 aaaggttgtt tagattgttt atattataga tggtttatga caaaaaagga tcgtattaat 5580 ttatttgaat tgaagaaatg tttatcagaa ggacataatg taaaaatatc tggagattta 5640 ttgaatgctt caatggttgg attagcaatt actttagcat ttaaactaat aaataatgag 5700 gtttcggaat tttcgtatat tattgacaaa aagacattga gattcaatgg tcataatttt 5760 ttacctaatc cacattgtca agtatgtggg cacatggata atgacgagaa aagattaata 5820 gaacacaaat tttttacagc acttaacgat aatactctta aagaaaagaa aggaaatcgt 5880 tttttatcaa aagaatattt agaagatacc ctatctaaaa attttttaga tgtagaaact 5940 ggtatattta ataaactttt ggacgattat gaaagtcctt tcgcagtttc ggtagcaaat 6000 cttcctttaa aggttggaaa ggatgaggtt ggtgttggaa gaacggataa ttatgctaat 6060 agtcacttaa ctgcaatatt agaaggaata gagagatatt gcggaatgga accaaggggg 6120 aatagaacta acgtttttgg tagttataat gagctaatgg aaaatgctct caatccatct 6180 gttttaggat tacacgcgga agaacagtat caattaaaaa gatttccttt taataaatat 6240 aatccagata aaaaaatgaa atgggtctgg gggtattctt ttaataagaa taaggcgata 6300 ttagtccctg aaacttatgc ctattatggt acgaattata gagatggcgt tcaaaatagt 6360 tttgtttatg aaatctcgaa tggatgtgct ttaggaggac atttattgga agctacattg 6420 caaggaattt atgaagtagt ggaaagagat gcttttctta tatcttggta tactaaatta 6480 ccattaaaac gtataagaaa agaatctatt aaggatcaga cgattcaatt attattaacg 6540 agatttgaat atcaaactga ttatgatatt catctgtata atatgacttt agagaataaa 6600 ataccaacta ttttagctat tgcaaaaaat agaggtgctt ttggcatgaa tattttatgt 6660 gctgcaggtt gtcatttaga tataaataaa gcaattgaaa gttcattaca tgagttatgt 6720 ggaatcttag aggcaatcaa aagtaaattt gaaaatagga aaagtgaatt atacgaaatg 6780 gcaaagaatt attcacttgt acggacgatg gaagatcatt cattattatt tggattgaaa 6840 gaacttgaaa aagagtttga ttttctatta aagagcccga ttgaaattga tttaagtgag 6900 gtagaacctt taaaatatag caacaatata catacagatt tattgaatgt aattgattat 6960 tttaaaaaaa taaatttaga tatcatcgta gtcgatcaaa ccgcggaaga tataaaattt 7020 aacaacttgt attgtgtaaa agttattatt ccaggaatgt tacctatgac atttggacat 7080 gatatgagaa gaatacataa tttaccaagg atattccgtg ttccaaggga attaggacat 7140 aaaattaaga atgaaaatga aattaagaac aatcaggtaa ctcctcatcc tttcccataa 7200 cattttttat gaaagatggt gatataacat gaaaccaata aactatgtac cacatttttt 7260 atgtagaata tctggtgaag aaataaactc tatttcagaa attgagttta ttaaaacctt 7320 ggaatgttta gaattatccg aaggaatttt aaggaaaata aattctttat cagcagactt 7380 aacgaaagat ttacatgatt gtatttcttt atataaagaa caatctattt cacgtgtatt 7440 aataaatctt aaaagagata tttttaatat gaggtttaat cgagttcaaa agtataaact 7500 agaaaatatc tcaggtttta accacgataa attaaattta tggttaaatt tagctcaaga 7560 atatcaaagc acgctacatc tgatgagaga aacttttaaa atggaaatac aggaaaaaag 7620 agggaaatta aagcagttat ttagtaatag tgaatatata aaagccattc aagtctcaaa 7680 tactcaactt tatgaaaatc tcctagaata cttacaagat aatcaaagtc atcctccaaa 7740 aaagatgagg aatattgaac agtctctaat taattaccta agtcgtatga tatttaagcc 7800 aactcccttc agttcattta caggattaaa ttacggtttt tttagtcagg aagattcaag 7860 ttttgaaata aatactaagg aaagcaaagg tcacactcga ataaacatgg tttatttaaa 7920 aaaaattgaa agaatgttat taaatcgaat atctataaaa aataaatgtt atgtttcgtt 7980 aaatcaaacg ataaacgaag aggaaaatta tatgtttttt cgaagaggta aagatgggac 8040 tagtcaagct tttactggtg aagcttttat aaagataaaa aagagcgagc tcttaaagga 8100 gttaattcaa tattttgaag gaatatcttc aatgaatata gttgaggttg tatcatttct 8160 ttccgaaaaa acaaattatg aaactgaagc tttatataat tacttattta agttagagaa 8220 aatgggagtg ttagatttta gcttaggtgt gtccgaacaa tcggacaatt acacgaaaga 8280 tttgatagaa aacttattgg ggattaaaga ttcattagtt gaaaaatcgg tctcacacct 8340 tgtagaaata gaaaaaattc aggcgatttt ctctgaatcc aattaccaaa aacgttatgt 8400 acttttaaaa aatttacaag aacatataaa gaagatttat agtttatttg atttaaaatt 8460 agagtctaat gatttgacct ctctattatt cgaggatgtt agttataaaa atactaagat 8520 tatattaaat gaaaatcaat ggaaaacgca tcttgatgat tttaatttaa ttaagaattt 8580 aatgccactt tttgatgata atatccttga aaaattaagt atgaatataa tttttaagga 8640 tatatatggt aacaaggggg caatagattt attagaattc tatagagagt ttaataaata 8700 tgataaaaat ttattatgga agaaaattag aaaaaatgat acatatcttt atttaaaaaa 8760 attgagaaca gagttttatg attatctaga aacacaaatt aatatggggt tagacactat 8820 ctttttaaat aaaagttggt taaagaaatt tattaacaag ttccctgatt tattgaagag 8880 taaggaaaat tattctttct attttcaaat agcctatgat aatcaagata atagaatttt 8940 agttttaaat aagatagggc caggattagg taagcacttt tcaagatatg gtaatttatt 9000 tttaaatagc gaatacaagg aaaataatag atttattaat tctcttatag aacagtataa 9060 aaaatatgat caaaatgggg gggttttaac agatttaaat gcagtgttag gtctaaatct 9120 taatatgcat cctaatcttt taaattatga aattacttat ccaggatgca atcctagtaa 9180 aggaattaat caagtagcat taaaggatat tgaagtattg tatgattcta attctgacca 9240 actaaaatta tattctaaac aatatagaca gaatgttaaa ttacttccat tgggattttt 9300 gtttccagca ttgtccccat ctttatataa gtttttatgt ggattttcgg aatcaaatgg 9360 gatagagtat tctttttgga acaagttctt aaatgaacac aataataatt tttcactttt 9420 acctagaatt atgttaggat cagtagcttt ggatagaaga acatggaaaa ttaatgcgaa 9480 ggaaatacaa aaggaatttt ctaaagatac atttgaaact tttattaact tccataagtg 9540 ggtgaaagaa aatcaactac cggaagatat atttttaagg gttgcaaaca caatggacgc 9600 ttttagtgag aatgaattat taaatcaaga tttaggaagt tggattgcag aaattaaaca 9660 aactaaacat cgtaaacctc aatatgttaa ttttaataat tactttcata tcgatgcctt 9720 aagaaagatt attaaagatg ttaataatac agtaacaatt caagaagttt atcctcatcc 9780 agatgatgtg tattatcaaa aaaatagtaa aaaatgtgta gaatttttag ttgaggtttt 9840 ttaataaagg aatgattata tgaacgagaa taattttata tggaaggctt atcatatttt 9900 ttatcatcaa aatcaagatt ttctaattac aaattgtatc aaaccaattt tagatgaatt 9960 gataaaaaag aaattaatta gtaaattttt ttttataaga tattgggaag gcggacctca 10020 tattagagtg cgactttatt gtacattaaa taaatctcaa gaagttgatt ataaatttaa 10080 tgattttgtt tctaaattct tgaaaacata tccttcttca tcaacattag atagaaacat 10140 gataaagaat caattagcaa aattagctag tcttgaagag ggtactgagt caacatgtgt 10200 tcgagagaat aatcatatta ttcatctaga atataatcca gagtataaac gatatggagg 10260 agaaaatgga atagagattg cggaagaaca tttttaccat tcaagtataa tgtgtttgaa 10320 gttaatacaa gaaattaata aaaagacaaa tcgtttgcgc atatctattg aaattatact 10380 atcttattta aaagctatga atatgaactt acaagagagt attaagtttt tagaaggcta 10440 ttatctaata tggaaaagat atgtatacag caataccaat aacgttgaag aattcttcgc 10500 taacaaatat attaagcaaa aaaaagtaat agacaaaatt gtagtaaact atttcaattc 10560 taataataat aaaggtatgt taggagaaaa atggagtaat catttgaatt taactgtaca 10620 gaatttagaa aatgattggg atcggggaga attaataata gataaagatg ttttagcata 10680 tataaatatc cctcaaaaga ttgcttttat agttacaagt tatgttcata tgacaaacaa 10740 taggcttggt atcatgccgc aagaagaagc ctatttaagc tatatgcttt tatgtagttt 10800 gaaatcattg tataagagta gaaagggatg acttaaatgg agcagtatca taaaattgta 10860 ttaactggaa gtaatgctga gactatgtta ataaaaaata tagagcctgt agcagttaag 10920 tttataaata actataaggg ttttttctat gtttttaaat atagtaaaga ttttccaatt 10980 atcgatgttt atatcaacaa caaaattgtt acagaaaatc aattaaataa aattttacag 11040 aattctgggg ctaaatataa aatttataaa aattcaatat ttaatgagac acaagggaat 11100 tttgggatgt taggtgataa atatctggca gaatttttta aaaagacaaa tgaaattagc 11160 cttaatatac taaatcaaaa ttttgagagt tacaataaaa aaatagaatt tgcgctagag 11220 ataatgttaa tttcagcgca ctataattat gattcaataa aaaaaggcta cttatcctat 11280 gcatctcatg taaatggatt ttttactaga tggaaagatc caaataaaat tagagatata 11340 tttcataaga actacttaaa taacaaagag tacctagaat cgaaagtttc agaaataata 11400 gataataaca acagaagtag cttgagcgaa ttatcggata ttattacaga aatgaagaaa 11460 gagatgacta ctgatattga gaaggggaac ctgcatgtat ttaatattga attactacaa 11520 aaaccaggag aaagagattt tctagaaaaa agtcagtttc ataagacgat attaaataat 11580 ccagatttct ctaattttat gaataaagat ataaactttt taggttcacg cctaataact 11640 gtatttacgt acttattaat acgaaattta gggattcaaa ataaagatag atatctactt 11700 tgctactata tctataaaat tattgaagaa aaatataata tagatacttt ggaattaata 11760 agggattttg gtaaagggag ggataataat gttgaagact tacaaagata ttgaagattt 11820 tttatataat ttgcaatatt cgcctgctaa agcttcagat ttcaatttag atttaagtaa 11880 ttatgataga cccttgcctt ttaaaattta taggaataga gaatcgatag atttagacga 11940 taactttccg atttgtatta atgatttaga tggtattgat tattcaaatt tcgaaattat 12000 tagttattta ttgtggtata cctatggttt taccagctac aattggttaa caaaaccaac 12060 attaaatggt cagaatacat ccttaagttt ttttagaaga agtgtagcct caggtggcgg 12120 cttatatcct ggggaaattt acttatatgt ggagagtatt aaaggtatca agtcaggatt 12180 atattatttt gatgttaggg gaccgagatt aattttacta agggaaggaa attttcaaga 12240 atttatcaaa aaatctttgc aatataatca agatagaaat gtttatattt ttataacatc 12300 attttattgg aaaaacttct ttaaatattt aaatttctcg tatcgtttac aaggcttaga 12360 tatcggtgct attgtaagcc aagctcacct aatttcaaag aaattaggtc ttaattcgga 12420 gattaggtat cactttgatg ataaaaaaat taatgatttt ttaggaatca acgctgagga 12480 agaaagcagc tacgtagttt tgcctataga tatggataat aattcatata aaagtgaaaa 12540 taaggttccc gcttttgagt actttaaaaa cgatacaaca ttcaattata ttgaacattt 12600 aaatgttggc cccaaaaatg tatgtcagga tatttataaa atcaatagta atattatcaa 12660 tagtggctta attaaagtta aaaaaaatga aatagcatct tttaaagagg aggcaaatgt 12720 tgttcataaa gaaaaatatg attatgacat tttgaaggct tctgtaagtc gtatatcacc 12780 aggagagaac tttttgtctg attttttgaa tattcagcat gttcacaaag ttctagatgt 12840 tggaatgcag gaacaattta aaaatgatat ttttagcgat aattatagtg ttctaaagga 12900 tgttgaaatt tacttttatg ccaataagat tgaaggttta ccaaaaggct actattacta 12960 taatccaagt aataaaagtt tcgttttgaa acataaaggt gatttttcta gtgtttttca 13020 ggagaatctt acacgaaaaa attttaattt agtagaaatg cctttaattg tgcacttagt 13080 attaaacatg aaaaaattta tagaaaatat gaaatttaga ggctatagag tcatgcaaat 13140 ggaggcaggg agaattatgc atcaaataca attgaatgct gcaggtttga acctagggag 13200 ccatccaatg ttaggttata gggctgataa tttggaggag ttttttggta ttcaaaataa 13260 tataactgtc cagatgtcta ttggtaaata tagaccttta ttgaggctaa ccaataattt 13320 attgaataaa actaaaggag aacaatttta tgtatgacgg aaaacgggtg aatccatatg 13380 aactctatca aacaatttaa ttttaaaaat aaaaatattt ttattactgg agctaccagt 13440 gatatagcta tctgtatagc agaatccttc tctggatttg gcgggaattt aattttatct 13500 gatactgata aacaattacc aaaattagaa catgttaaac aaaaaatgat tgaaaaattt 13560 aggaataatg ttcaaattgt aactattgat ttatataagg ttaatgatat acaaaatgca 13620 attgaaaaat tagataaacc aattgatata ttgatcaatt gtgctggaaa taattacttt 13680 gttccagctc tggaggttag tgaagagaat tggcaaaaaa ttatagatgt aaatttgaaa 13740 ggaacttttt ttcttagtca gtcaatagca aaaaaaatga ttagtgacgg cataaagggg 13800 aaaattgtaa atattggatc gcaacatggg gtagttgcca atggtctaag agccccctat 13860 tgtattagta agtttggatt aataggtttg acaaaagttt tagcgctaga gtggtctact 13920 tttaatatat tggttaattg tgtttcacca acgtatgtaa aaacttctaa aagtaaggat 13980 ttcttggagc atgaagatgt taaaaaagca tatttatata aaatcccttt gaaaaaatat 14040 gctttacccc acgatatatc atatgcagta ttgtttttaa gtagcgatca aaatcagata 14100 attacagggg aaaatatttt agttaatggt ggttatacat tacactagat ctcaccacca 14160 ccaccaccac tgacgtacgg gcccaagctt gcacccatta gttcaacaaa cgaaaattgg 14220 ataaagtggg atatttttaa aatatatatt tatgttacag taatattgac ttttaaaaaa 14280 ggattgattc taatgaagaa agcagacaag taagcctcct aaattcactt tagataaaaa 14340 tttaggaggc atatcaaatg aactttaata aaattgattt agacaattgg aagagaaaag 14400 agatatttaa tcattatttg aaccaacaaa cgacttttag tataaccaca gaaattgata 14460 ttagtgtttt ataccgaaac ataaaacaag aaggatataa attttaccct gcatttattt 14520 tcttagtgac aagggtgata aactcaaata cagcttttag aactggttac aatagcgacg 14580 gagagttagg ttattgggat aagttagagc cactttatac aatttttgat ggtgtatcta 14640 aaacattctc tggtatttgg actcctgtaa agaatgactt caaagagttt tatgatttat 14700 acctttctga tgtagagaaa tataatggtt cggggaaatt gtttcccaaa acacctatac 14760 ctgaaaatgc tttttctctt tctattattc catggacttc atttactggg tttaacttaa 14820 atatcaataa taatagtaat taccttctac ccattattac agcaggaaaa ttcattaata 14880 aaggtaattc aatatattta ccgctatctt tacaggtaca tcattctgtt tgtgatggtt 14940 atcatgcagg attgtttatg aactctattc aggaattgtc agataggcct aatgactggc 15000 ttttataata tgagataatg ccgactgtac tttttacagt cggttttcta atgtcactaa 15060 cctgccccgt tagttgaaga aggtttttat attacagctc cagatcctct acgccggacg 15120 catcgtggcc ggcatcaccg gcgccacagg tgcggttgct ggcgcctata tcgccgacat 15180 caccgatggg gaagatcggg ctcgccactt cgggctcatg agcgcttgtt tcggcgtggg 15240 tatggtggca ggccccgtgg ccgggggact gttgggcgcc atctccttgc atgcaccatt 15300 ccttgcggcg gcggtgctca acggcctcaa cctactactg ggctgcttcc taatgcagga 15360 gtcgcataag ggagagcgtc gacatggatg agcgatgatg atatccgttt aggctgggcg 15420 gtgatagctt ctcgttcagg cagtacgcct cttttctttt ccagacctga gggaggcgga 15480 aatggtgtga ggttcccggg gaaaagccaa ataggcgatc gcgggagtgc tttatttgaa 15540 gatcaggcta tcactgcggt caatagattt cacaatgtga tggctggaca gcctgaggaa 15600 ctctcgaacc cgaatggaaa caaccagata tttatgaatc agcgcggctc acatggcgtt 15660 gtgctggcaa atgcaggttc atcctctgtc tctatcaata cggcaacaaa attgcctgat 15720 ggcaggtatg acaataaagc tggagcgggt tcatttcaag tgaacgatgg taaactgaca 15780 ggcacgatca atgccaggtc tgtagctgtg ctttatcctg atgatattgc aaaagcgcct 15840 catgttttcc ttgagaatta caaaacaggt gtaacacatt ctttcaatga tcaactgacg 15900 attaccttgc gtgcagatgc gaatacaaca aaagccgttt atcaaatcaa taatggacca 15960 gacgacaggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat ccaatttggc 16020 aaaacataca ccatcatgtt aaaaggaacg aacagtgatg gtgtaacgag gaccgagaaa 16080 tacagttttg ttaaaagaga tccagcgtcg gccaaaacca tcggctatca aaatccgaat 16140 cattggagcc aggtaaatgc ttatatctat aaacatgatg ggagccgagt aattgaattg 16200 accggatctt ggcctggaaa accaatgact aaaaatgcag acggaattta cacgctgacg 16260 ctgcctgcgg acacggatac aaccaacgca aaagtgattt ttaataatgg cagcgcccaa 16320 gtgcccggtc agaatcagcc tggctttgat tacgtgctaa atggtttata taatgactcg 16380 ggcttaagcg gttctcttcc ccattgatag cttggcgtaa tcatggtcat agctgtttcc 16440 tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg 16500 taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc 16560 cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 16620 gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 16680 ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 16740 agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 16800 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 16860 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 16920 gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 16980 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 17040 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 17100 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 17160 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 17220 tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 17280 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 17340 caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 17400 aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 17460 cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 17520 ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 17580 tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 17640 atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 17700 tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 17760 aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 17820 catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 17880 gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 17940 ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 18000 aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 18060 atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 18120 cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 18180 gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 18240 agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 18300 gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 18360 caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 18420 ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 18480 tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 18540 aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 18600 catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtc 18647 <210> 2 <211> 19472 <212> DNA <213> Artificial Sequence <220> <223> Plasmid 2 - Example 2 <400> 2 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgtt tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat 240 tgctgtttca tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat 300 cgaatgagct tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt 360 cgttcaatac gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc 420 agacatctcc gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact 480 ggtactggct gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac 540 aagaatttaa agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg 600 cggtcatcaa tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc 660 caaactggac acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc 720 agaattcatt gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc 780 tgaaacggtt cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg 840 ccaaacatat agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca 900 caaatacatc tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg 960 ctgcatatgc gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg 1020 ctttaaagaa tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg 1080 cggacaagct agtgacatgg gtagagtcgc atgatacgga attcgagctc ggtaccgaac 1140 tcctttttca tatgagaagg tgccatgtca ctattgcttc agaaatactc ctagaataaa 1200 aaaactcatc tttaaagatg agctgtccat tccataaaaa attacattgt aatcatgtcc 1260 agaaaatgat caatcacaat ggaggacatt cctaatgccg gtgcattctg tcctaaggaa 1320 gatggcaata attcatagct attgcctaat tgggaataaa cccttgatga tacttcactt 1380 ctcattgaat ttaaaaccat aggatgcgat tcaattatgc tatttcttaa aattacggct 1440 tgtgggttga aagtatttag aatattggta aggcctattc ctaaatagaa tccaaaattt 1500 tgtaatgcat ttaaggttcc gatatcattc agatgggcga ggtttatgat atcttgatag 1560 gacagttttt tctctttggt ctgaagagat tttaataaag ccttctctga agcatacaat 1620 tcccagcatc ctcggtttcc gcaactgcat ttaggaccat taaagtctat tgtcatatgt 1680 cccatttctc cagagaagcc gcttactcct ctatataaat gattgttgat aataacaccg 1740 atccctattc ctgtgctgat acttacgtaa ataatgttat cgtgattttt tgcagctcca 1800 aatacttttt ctccatatgc gccagcattt gcctcatttt caataaaaac aggcacattg 1860 tacttctctt gtatcgaaga ttttaagtca atatctctcc agttggagtt cggagtgaaa 1920 acaatttttt gatctttatc aatgagtcca ggcacgcaaa tacctatacc aataagcccg 1980 tacggagatt ggggcatttg cgtaataaag tgatgaatca tatcaatcaa aatgtctttc 2040 gttatttctg gagaattgga ttccaaatgg cggtattgat caagaacgat tgttccttca 2100 aggtctgtta aaatgccatt aatataatcc acaccaacat ctattccaac ggagtatcct 2160 gcctttttat taaaaacaag catgacaggt cttcttccgc cacttgattg tccttgacct 2220 atttcaaata ccatactttc tttcattaac gtgtttacct gtgatgagac agttgattta 2280 tttaatccag tcatttcaga taattttgct cttgaaatag gtgaattttt aaggatttct 2340 tttaataata acttttgatt tacttttttg acaaaggttt gatcagcgat atccacttca 2400 tccactccat ttgtttaatc tttaaattaa gtatcaacat agtacatagc gaatcttccc 2460 tttattatat ctaatgtgtt cataaaaaac taaaaaaaat attgaaaata ctgacgaggt 2520 tatataagat gaaaataagt tagtttgttt aaacaacaaa ctaataggtg atgtacttac 2580 tatatgaaat aaaatgcatc tgtatttgaa tgaatttatt tttaaggggg aaatcacatg 2640 gctcaatctc attccagttc aatcaactat tttggaagcg caaacaaagt ggtttactaa 2700 ggtacccggg ctagctttaa gaaggagata tacatatgag tgaaattaaa aaagcattaa 2760 atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat gctatgccag 2820 aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt acatgcagtt 2880 gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa ttaaaaaagc 2940 attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg ttgatgctat 3000 gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg tatgtacatg 3060 cagttgttgt acaacttaat ctagctttaa gaaggagata tacatatgag tgaaattaaa 3120 aaagcattaa atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat 3180 gctatgccag aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt 3240 acatgcagtt gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa 3300 ttaaaaaagc attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg 3360 ttgatgctat gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg 3420 tatgtacatg cagttgttgt acaacttaac gaataaaact aaaggagaac aattttatgt 3480 atgaaaataa tgtaaaagat acaaaggatt tttataatga tatagggcat ataagttgga 3540 gtgttgcccc ctcgcaacac tatcatgtgg gaatttttga attagaaaaa gattccatgg 3600 aggatgctca aaatagaacg gtagaatata tggcacgtaa agttgcggca tcagatcttg 3660 acgtactatt agatattgga tgtggctccg ggcttactgc agtacaaatt agtaaaaagg 3720 aaaattgtaa aattgtaggt ataaatattt ccgaaaagca acttgcaatt gggaaaaagc 3780 taatttctaa agagaaaatt aatagcaggg taaagctaat gaatatggac gcacatcaat 3840 taaactttaa gtcaggtatg tttgatggtg catacgctct agagagtatc atgcatatga 3900 atagggaaaa ggttttaagt gaggtacata gagtattaaa aaatggtgct ccttttagtt 3960 tatgtgattg gtatgtaaag aaatctttaa ctccagtaga gaagaggttt ttagaaacca 4020 ttacacttgg taagtatatt acaaaggaac agtattttag tctttatcaa actcaaaatt 4080 tcatggatat tgaaattgaa gaatggagca ataaaatatt accgacttat aaatattgga 4140 cgacgattac ggatgaaatg aaagaaaaac ttcctgatca tttactatat gtaatagaag 4200 aaaattctaa agtactatca gatattgcaa ttgaaaaatt aggatattta caagtgaatg 4260 gaataaaacg ttagctcgag caccaccacc accaccactg acgtacgggc ccaagcggta 4320 cccggggatc cgtttgttcc ctttatagaa aggaatgatc aaatgttaga aataaaagaa 4380 aaacaattta ttaaattaaa agaggacaca ttcttttttc cttcagctga agggatatac 4440 tttaggaatt ctataggtta ttttacaatc aaaggtagaa atatttaccc gttttttagt 4500 gaaatcagta aatatttgaa tggtaaatat actttgaaag atatagtgag tgagttaagc 4560 aaaacccaag aagaaaaatt tttaaaatta attgccatat tagagaagaa tggttttgta 4620 aaatataccg aaagggttat tgatgaaaat tattataaaa attatgaaaa agaaattgca 4680 tttatagatt attatactaa taatggcatc gaattattta aaaaactctc taatttcaag 4740 atttgtttat atggtagcaa taagttatct aatactattc aaaaaagctt agaaaacata 4800 gggatacaaa atattaaaag aggctctcgt tttgattttg agggagacat tgttatttat 4860 tgcaataatg atgttaatga aagggaaaat ctactggaat gtatggactt ttctcagaat 4920 aaaatattta tttttgtagg taataaagaa tcattaggaa ttattagtcc tattataaaa 4980 aatttagatg attggaagga atttgaaaat atattagaga ttggtgcaga taatattaaa 5040 gaaaatacaa catttactag caactctata ttaagtagta tgctaagttt tgaaattata 5100 aagtatgtaa caaattgttt gcaaagtgat ttaattaatg cggcatacat tttaaatact 5160 gatactttaa aagggaattt tgttcaggta aaaaaaaaaa tagacttaaa acaagatttt 5220 attgaaactt tcaaacaatc aagcggaggc aacggtttgt atatcaataa aataggtaga 5280 ggttctagga aacaaattcc gctctcgcaa tgggaggttg aattggataa attaggtgac 5340 atgaatagtg aaaaaattaa ggtcgttagc tttggtgata cccaccagga agcgaggttt 5400 aatacttatt ataaaaccat agaacatcta ataatcaatg gggaatttaa cttagaggaa 5460 tcatatagct ttaagaatct tgatacaatc actttagcta ttgatgaaca atttaaaaga 5520 aaattaacaa tttcatgcga catagataaa gaacttgcaa tcagaaaagc aatattaaaa 5580 gcaattttaa agagggaaat taatgtaatt gataattatc aagagctttc cccattaaaa 5640 ataagtgatt atatagataa taaaaatata caatactatt gtaaactgat taacatttta 5700 aaagcgaaaa tagaattgcg ttttaagaaa ttagtagagg gtttgttttt ggtagtagtt 5760 agtgacaata gttatagggg agttagtata ggatttaatt taaatacagc attagaaaat 5820 gctcttaggc aatttattaa taatttacaa aatagtatct atacaataaa tattgaagat 5880 gtaatattta aaagaattaa tgattgggat gatgaatgca ttcgagagtt tttgacagat 5940 gaaaaattag aagtttttat ctgtagtata caaaataatg ttatttcagc agaaatttct 6000 atagttggag caatattaat agaaagttag gtgaattgaa aaatgaataa ggaagtcctt 6060 ataatcaggg atgaaagctt tggagaattt tttgattctt tttttttaaa tgaaaataat 6120 cgaaaagttt gttttataga tagtaataaa aaagatttga aatatttatt aaaaaacttt 6180 ttagagaata aaaagtttag ttatgtacta atctttccaa aggaatggaa tcctatgatg 6240 tataggtcac ttgatgcagt gttagaagac tatgatgtac cgtggatcta tataacacaa 6300 ttttttaata aaattttaat aggtcctttt agaaattcta agcaaaaagg ttgtttagat 6360 tgtttatatt atagatggtt tatgacaaaa aaggatcgta ttaatttatt tgaattgaag 6420 aaatgtttat cagaaggaca taatgtaaaa atatctggag atttattgaa tgcttcaatg 6480 gttggattag caattacttt agcatttaaa ctaataaata atgaggtttc ggaattttcg 6540 tatattattg acaaaaagac attgagattc aatggtcata attttttacc taatccacat 6600 tgtcaagtat gtgggcacat ggataatgac gagaaaagat taatagaaca caaatttttt 6660 acagcactta acgataatac tcttaaagaa aagaaaggaa atcgtttttt atcaaaagaa 6720 tatttagaag ataccctatc taaaaatttt ttagatgtag aaactggtat atttaataaa 6780 cttttggacg attatgaaag tcctttcgca gtttcggtag caaatcttcc tttaaaggtt 6840 ggaaaggatg aggttggtgt tggaagaacg gataattatg ctaatagtca cttaactgca 6900 atattagaag gaatagagag atattgcgga atggaaccaa gggggaatag aactaacgtt 6960 tttggtagtt ataatgagct aatggaaaat gctctcaatc catctgtttt aggattacac 7020 gcggaagaac agtatcaatt aaaaagattt ccttttaata aatataatcc agataaaaaa 7080 atgaaatggg tctgggggta ttcttttaat aagaataagg cgatattagt ccctgaaact 7140 tatgcctatt atggtacgaa ttatagagat ggcgttcaaa atagttttgt ttatgaaatc 7200 tcgaatggat gtgctttagg aggacattta ttggaagcta cattgcaagg aatttatgaa 7260 gtagtggaaa gagatgcttt tcttatatct tggtatacta aattaccatt aaaacgtata 7320 agaaaagaat ctattaagga tcagacgatt caattattat taacgagatt tgaatatcaa 7380 actgattatg atattcatct gtataatatg actttagaga ataaaatacc aactatttta 7440 gctattgcaa aaaatagagg tgcttttggc atgaatattt tatgtgctgc aggttgtcat 7500 ttagatataa ataaagcaat tgaaagttca ttacatgagt tatgtggaat cttagaggca 7560 atcaaaagta aatttgaaaa taggaaaagt gaattatacg aaatggcaaa gaattattca 7620 cttgtacgga cgatggaaga tcattcatta ttatttggat tgaaagaact tgaaaaagag 7680 tttgattttc tattaaagag cccgattgaa attgatttaa gtgaggtaga acctttaaaa 7740 tatagcaaca atatacatac agatttattg aatgtaattg attattttaa aaaaataaat 7800 ttagatatca tcgtagtcga tcaaaccgcg gaagatataa aatttaacaa cttgtattgt 7860 gtaaaagtta ttattccagg aatgttacct atgacatttg gacatgatat gagaagaata 7920 cataatttac caaggatatt ccgtgttcca agggaattag gacataaaat taagaatgaa 7980 aatgaaatta agaacaatca ggtaactcct catcctttcc cataacattt tttatgaaag 8040 atggtgatat aacatgaaac caataaacta tgtaccacat tttttatgta gaatatctgg 8100 tgaagaaata aactctattt cagaaattga gtttattaaa accttggaat gtttagaatt 8160 atccgaagga attttaagga aaataaattc tttatcagca gacttaacga aagatttaca 8220 tgattgtatt tctttatata aagaacaatc tatttcacgt gtattaataa atcttaaaag 8280 agatattttt aatatgaggt ttaatcgagt tcaaaagtat aaactagaaa atatctcagg 8340 ttttaaccac gataaattaa atttatggtt aaatttagct caagaatatc aaagcacgct 8400 acatctgatg agagaaactt ttaaaatgga aatacaggaa aaaagaggga aattaaagca 8460 gttatttagt aatagtgaat atataaaagc cattcaagtc tcaaatactc aactttatga 8520 aaatctccta gaatacttac aagataatca aagtcatcct ccaaaaaaga tgaggaatat 8580 tgaacagtct ctaattaatt acctaagtcg tatgatattt aagccaactc ccttcagttc 8640 atttacagga ttaaattacg gtttttttag tcaggaagat tcaagttttg aaataaatac 8700 taaggaaagc aaaggtcaca ctcgaataaa catggtttat ttaaaaaaaa ttgaaagaat 8760 gttattaaat cgaatatcta taaaaaataa atgttatgtt tcgttaaatc aaacgataaa 8820 cgaagaggaa aattatatgt tttttcgaag aggtaaagat gggactagtc aagcttttac 8880 tggtgaagct tttataaaga taaaaaagag cgagctctta aaggagttaa ttcaatattt 8940 tgaaggaata tcttcaatga atatagttga ggttgtatca tttctttccg aaaaaacaaa 9000 ttatgaaact gaagctttat ataattactt atttaagtta gagaaaatgg gagtgttaga 9060 ttttagctta ggtgtgtccg aacaatcgga caattacacg aaagatttga tagaaaactt 9120 attggggatt aaagattcat tagttgaaaa atcggtctca caccttgtag aaatagaaaa 9180 aattcaggcg attttctctg aatccaatta ccaaaaacgt tatgtacttt taaaaaattt 9240 acaagaacat ataaagaaga tttatagttt atttgattta aaattagagt ctaatgattt 9300 gacctctcta ttattcgagg atgttagtta taaaaatact aagattatat taaatgaaaa 9360 tcaatggaaa acgcatcttg atgattttaa tttaattaag aatttaatgc cactttttga 9420 tgataatatc cttgaaaaat taagtatgaa tataattttt aaggatatat atggtaacaa 9480 gggggcaata gatttattag aattctatag agagtttaat aaatatgata aaaatttatt 9540 atggaagaaa attagaaaaa atgatacata tctttattta aaaaaattga gaacagagtt 9600 ttatgattat ctagaaacac aaattaatat ggggttagac actatctttt taaataaaag 9660 ttggttaaag aaatttatta acaagttccc tgatttattg aagagtaagg aaaattattc 9720 tttctatttt caaatagcct atgataatca agataataga attttagttt taaataagat 9780 agggccagga ttaggtaagc acttttcaag atatggtaat ttatttttaa atagcgaata 9840 caaggaaaat aatagattta ttaattctct tatagaacag tataaaaaat atgatcaaaa 9900 tgggggggtt ttaacagatt taaatgcagt gttaggtcta aatcttaata tgcatcctaa 9960 tcttttaaat tatgaaatta cttatccagg atgcaatcct agtaaaggaa ttaatcaagt 10020 agcattaaag gatattgaag tattgtatga ttctaattct gaccaactaa aattatattc 10080 taaacaatat agacagaatg ttaaattact tccattggga tttttgtttc cagcattgtc 10140 cccatcttta tataagtttt tatgtggatt ttcggaatca aatgggatag agtattcttt 10200 ttggaacaag ttcttaaatg aacacaataa taatttttca cttttaccta gaattatgtt 10260 aggatcagta gctttggata gaagaacatg gaaaattaat gcgaaggaaa tacaaaagga 10320 attttctaaa gatacatttg aaacttttat taacttccat aagtgggtga aagaaaatca 10380 actaccggaa gatatatttt taagggttgc aaacacaatg gacgctttta gtgagaatga 10440 attattaaat caagatttag gaagttggat tgcagaaatt aaacaaacta aacatcgtaa 10500 acctcaatat gttaatttta ataattactt tcatatcgat gccttaagaa agattattaa 10560 agatgttaat aatacagtaa caattcaaga agtttatcct catccagatg atgtgtatta 10620 tcaaaaaaat agtaaaaaat gtgtagaatt tttagttgag gttttttaat aaaggaatga 10680 ttatatgaac gagaataatt ttatatggaa ggcttatcat attttttatc atcaaaatca 10740 agattttcta attacaaatt gtatcaaacc aattttagat gaattgataa aaaagaaatt 10800 aattagtaaa ttttttttta taagatattg ggaaggcgga cctcatatta gagtgcgact 10860 ttattgtaca ttaaataaat ctcaagaagt tgattataaa tttaatgatt ttgtttctaa 10920 attcttgaaa acatatcctt cttcatcaac attagataga aacatgataa agaatcaatt 10980 agcaaaatta gctagtcttg aagagggtac tgagtcaaca tgtgttcgag agaataatca 11040 tattattcat ctagaatata atccagagta taaacgatat ggaggagaaa atggaataga 11100 gattgcggaa gaacattttt accattcaag tataatgtgt ttgaagttaa tacaagaaat 11160 taataaaaag acaaatcgtt tgcgcatatc tattgaaatt atactatctt atttaaaagc 11220 tatgaatatg aacttacaag agagtattaa gtttttagaa ggctattatc taatatggaa 11280 aagatatgta tacagcaata ccaataacgt tgaagaattc ttcgctaaca aatatattaa 11340 gcaaaaaaaa gtaatagaca aaattgtagt aaactatttc aattctaata ataataaagg 11400 tatgttagga gaaaaatgga gtaatcattt gaatttaact gtacagaatt tagaaaatga 11460 ttgggatcgg ggagaattaa taatagataa agatgtttta gcatatataa atatccctca 11520 aaagattgct tttatagtta caagttatgt tcatatgaca aacaataggc ttggtatcat 11580 gccgcaagaa gaagcctatt taagctatat gcttttatgt agtttgaaat cattgtataa 11640 gagtagaaag ggatgactta aatggagcag tatcataaaa ttgtattaac tggaagtaat 11700 gctgagacta tgttaataaa aaatatagag cctgtagcag ttaagtttat aaataactat 11760 aagggttttt tctatgtttt taaatatagt aaagattttc caattatcga tgtttatatc 11820 aacaacaaaa ttgttacaga aaatcaatta aataaaattt tacagaattc tggggctaaa 11880 tataaaattt ataaaaattc aatatttaat gagacacaag ggaattttgg gatgttaggt 11940 gataaatatc tggcagaatt ttttaaaaag acaaatgaaa ttagccttaa tatactaaat 12000 caaaattttg agagttacaa taaaaaaata gaatttgcgc tagagataat gttaatttca 12060 gcgcactata attatgattc aataaaaaaa ggctacttat cctatgcatc tcatgtaaat 12120 ggatttttta ctagatggaa agatccaaat aaaattagag atatatttca taagaactac 12180 ttaaataaca aagagtacct agaatcgaaa gtttcagaaa taatagataa taacaacaga 12240 agtagcttga gcgaattatc ggatattatt acagaaatga agaaagagat gactactgat 12300 attgagaagg ggaacctgca tgtatttaat attgaattac tacaaaaacc aggagaaaga 12360 gattttctag aaaaaagtca gtttcataag acgatattaa ataatccaga tttctctaat 12420 tttatgaata aagatataaa ctttttaggt tcacgcctaa taactgtatt tacgtactta 12480 ttaatacgaa atttagggat tcaaaataaa gatagatatc tactttgcta ctatatctat 12540 aaaattattg aagaaaaata taatatagat actttggaat taataaggga ttttggtaaa 12600 gggagggata ataatgttga agacttacaa agatattgaa gattttttat ataatttgca 12660 atattcgcct gctaaagctt cagatttcaa tttagattta agtaattatg atagaccctt 12720 gccttttaaa atttatagga atagagaatc gatagattta gacgataact ttccgatttg 12780 tattaatgat ttagatggta ttgattattc aaatttcgaa attattagtt atttattgtg 12840 gtatacctat ggttttacca gctacaattg gttaacaaaa ccaacattaa atggtcagaa 12900 tacatcctta agttttttta gaagaagtgt agcctcaggt ggcggcttat atcctgggga 12960 aatttactta tatgtggaga gtattaaagg tatcaagtca ggattatatt attttgatgt 13020 taggggaccg agattaattt tactaaggga aggaaatttt caagaattta tcaaaaaatc 13080 tttgcaatat aatcaagata gaaatgttta tatttttata acatcatttt attggaaaaa 13140 cttctttaaa tatttaaatt tctcgtatcg tttacaaggc ttagatatcg gtgctattgt 13200 aagccaagct cacctaattt caaagaaatt aggtcttaat tcggagatta ggtatcactt 13260 tgatgataaa aaaattaatg attttttagg aatcaacgct gaggaagaaa gcagctacgt 13320 agttttgcct atagatatgg ataataattc atataaaagt gaaaataagg ttcccgcttt 13380 tgagtacttt aaaaacgata caacattcaa ttatattgaa catttaaatg ttggccccaa 13440 aaatgtatgt caggatattt ataaaatcaa tagtaatatt atcaatagtg gcttaattaa 13500 agttaaaaaa aatgaaatag catcttttaa agaggaggca aatgttgttc ataaagaaaa 13560 atatgattat gacattttga aggcttctgt aagtcgtata tcaccaggag agaacttttt 13620 gtctgatttt ttgaatattc agcatgttca caaagttcta gatgttggaa tgcaggaaca 13680 atttaaaaat gatattttta gcgataatta tagtgttcta aaggatgttg aaatttactt 13740 ttatgccaat aagattgaag gtttaccaaa aggctactat tactataatc caagtaataa 13800 aagtttcgtt ttgaaacata aaggtgattt ttctagtgtt tttcaggaga atcttacacg 13860 aaaaaatttt aatttagtag aaatgccttt aattgtgcac ttagtattaa acatgaaaaa 13920 atttatagaa aatatgaaat ttagaggcta tagagtcatg caaatggagg cagggagaat 13980 tatgcatcaa atacaattga atgctgcagg tttgaaccta gggagccatc caatgttagg 14040 ttatagggct gataatttgg aggagttttt tggtattcaa aataatataa ctgtccagat 14100 gtctattggt aaatatagac ctttattgag gctaaccaat aatttattga ataaaactaa 14160 aggagaacaa ttttatgtat gacggaaaac gggtgaatcc atatgaactc tatcaaacaa 14220 tttaatttta aaaataaaaa tatttttatt actggagcta ccagtgatat agctatctgt 14280 atagcagaat ccttctctgg atttggcggg aatttaattt tatctgatac tgataaacaa 14340 ttaccaaaat tagaacatgt taaacaaaaa atgattgaaa aatttaggaa taatgttcaa 14400 attgtaacta ttgatttata taaggttaat gatatacaaa atgcaattga aaaattagat 14460 aaaccaattg atatattgat caattgtgct ggaaataatt actttgttcc agctctggag 14520 gttagtgaag agaattggca aaaaattata gatgtaaatt tgaaaggaac tttttttctt 14580 agtcagtcaa tagcaaaaaa aatgattagt gacggcataa aggggaaaat tgtaaatatt 14640 ggatcgcaac atggggtagt tgccaatggt ctaagagccc cctattgtat tagtaagttt 14700 ggattaatag gtttgacaaa agttttagcg ctagagtggt ctacttttaa tatattggtt 14760 aattgtgttt caccaacgta tgtaaaaact tctaaaagta aggatttctt ggagcatgaa 14820 gatgttaaaa aagcatattt atataaaatc cctttgaaaa aatatgcttt accccacgat 14880 atatcatatg cagtattgtt tttaagtagc gatcaaaatc agataattac aggggaaaat 14940 attttagtta atggtggtta tacattacac tagatctcac caccaccacc accactgacg 15000 tacgggccca agcttgcacc cattagttca acaaacgaaa attggataaa gtgggatatt 15060 tttaaaatat atatttatgt tacagtaata ttgactttta aaaaaggatt gattctaatg 15120 aagaaagcag acaagtaagc ctcctaaatt cactttagat aaaaatttag gaggcatatc 15180 aaatgaactt taataaaatt gatttagaca attggaagag aaaagagata tttaatcatt 15240 atttgaacca acaaacgact tttagtataa ccacagaaat tgatattagt gttttatacc 15300 gaaacataaa acaagaagga tataaatttt accctgcatt tattttctta gtgacaaggg 15360 tgataaactc aaatacagct tttagaactg gttacaatag cgacggagag ttaggttatt 15420 gggataagtt agagccactt tatacaattt ttgatggtgt atctaaaaca ttctctggta 15480 tttggactcc tgtaaagaat gacttcaaag agttttatga tttatacctt tctgatgtag 15540 agaaatataa tggttcgggg aaattgtttc ccaaaacacc tatacctgaa aatgcttttt 15600 ctctttctat tattccatgg acttcattta ctgggtttaa cttaaatatc aataataata 15660 gtaattacct tctacccatt attacagcag gaaaattcat taataaaggt aattcaatat 15720 atttaccgct atctttacag gtacatcatt ctgtttgtga tggttatcat gcaggattgt 15780 ttatgaactc tattcaggaa ttgtcagata ggcctaatga ctggctttta taatatgaga 15840 taatgccgac tgtacttttt acagtcggtt ttctaatgtc actaacctgc cccgttagtt 15900 gaagaaggtt tttatattac agctccagat cctctacgcc ggacgcatcg tggccggcat 15960 caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga 16020 tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc 16080 cgtggccggg ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt 16140 gctcaacggc ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga 16200 gcgtcgacat ggatgagcga tgatgatatc cgtttaggct gggcggtgat agcttctcgt 16260 tcaggcagta cgcctctttt cttttccaga cctgagggag gcggaaatgg tgtgaggttc 16320 ccggggaaaa gccaaatagg cgatcgcggg agtgctttat ttgaagatca ggctatcact 16380 gcggtcaata gatttcacaa tgtgatggct ggacagcctg aggaactctc gaacccgaat 16440 ggaaacaacc agatatttat gaatcagcgc ggctcacatg gcgttgtgct ggcaaatgca 16500 ggttcatcct ctgtctctat caatacggca acaaaattgc ctgatggcag gtatgacaat 16560 aaagctggag cgggttcatt tcaagtgaac gatggtaaac tgacaggcac gatcaatgcc 16620 aggtctgtag ctgtgcttta tcctgatgat attgcaaaag cgcctcatgt tttccttgag 16680 aattacaaaa caggtgtaac acattctttc aatgatcaac tgacgattac cttgcgtgca 16740 gatgcgaata caacaaaagc cgtttatcaa atcaataatg gaccagacga caggcgttta 16800 aggatggaga tcaattcaca atcggaaaag gagatccaat ttggcaaaac atacaccatc 16860 atgttaaaag gaacgaacag tgatggtgta acgaggaccg agaaatacag ttttgttaaa 16920 agagatccag cgtcggccaa aaccatcggc tatcaaaatc cgaatcattg gagccaggta 16980 aatgcttata tctataaaca tgatgggagc cgagtaattg aattgaccgg atcttggcct 17040 ggaaaaccaa tgactaaaaa tgcagacgga atttacacgc tgacgctgcc tgcggacacg 17100 gatacaacca acgcaaaagt gatttttaat aatggcagcg cccaagtgcc cggtcagaat 17160 cagcctggct ttgattacgt gctaaatggt ttatataatg actcgggctt aagcggttct 17220 cttccccatt gatagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 17280 tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 17340 ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 17400 aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 17460 tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 17520 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 17580 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 17640 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 17700 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 17760 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 17820 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 17880 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 17940 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 18000 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 18060 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 18120 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 18180 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 18240 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 18300 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 18360 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 18420 cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 18480 actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 18540 aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 18600 cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 18660 ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 18720 cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 18780 ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 18840 cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 18900 ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 18960 tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 19020 ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 19080 aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 19140 gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 19200 gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 19260 ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 19320 catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 19380 atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta 19440 taaaaatagg cgtatcacga ggccctttcg tc 19472 <210> 3 <211> 19738 <212> DNA <213> Artificial Sequence <220> <223> Plasmid 3 - Example 2 <400> 3 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgtt tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat 240 tgctgtttca tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat 300 cgaatgagct tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt 360 cgttcaatac gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc 420 agacatctcc gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact 480 ggtactggct gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac 540 aagaatttaa agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg 600 cggtcatcaa tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc 660 caaactggac acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc 720 agaattcatt gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc 780 tgaaacggtt cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg 840 ccaaacatat agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca 900 caaatacatc tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg 960 ctgcatatgc gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg 1020 ctttaaagaa tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg 1080 cggacaagct agtgacatgg gtagagtcgc atgatacgga attcgagctc ggtaccgaac 1140 tcctttttca tatgagaagg tgccatgtca ctattgcttc agaaatactc ctagaataaa 1200 aaaactcatc tttaaagatg agctgtccat tccataaaaa attacattgt aatcatgtcc 1260 agaaaatgat caatcacaat ggaggacatt cctaatgccg gtgcattctg tcctaaggaa 1320 gatggcaata attcatagct attgcctaat tgggaataaa cccttgatga tacttcactt 1380 ctcattgaat ttaaaaccat aggatgcgat tcaattatgc tatttcttaa aattacggct 1440 tgtgggttga aagtatttag aatattggta aggcctattc ctaaatagaa tccaaaattt 1500 tgtaatgcat ttaaggttcc gatatcattc agatgggcga ggtttatgat atcttgatag 1560 gacagttttt tctctttggt ctgaagagat tttaataaag ccttctctga agcatacaat 1620 tcccagcatc ctcggtttcc gcaactgcat ttaggaccat taaagtctat tgtcatatgt 1680 cccatttctc cagagaagcc gcttactcct ctatataaat gattgttgat aataacaccg 1740 atccctattc ctgtgctgat acttacgtaa ataatgttat cgtgattttt tgcagctcca 1800 aatacttttt ctccatatgc gccagcattt gcctcatttt caataaaaac aggcacattg 1860 tacttctctt gtatcgaaga ttttaagtca atatctctcc agttggagtt cggagtgaaa 1920 acaatttttt gatctttatc aatgagtcca ggcacgcaaa tacctatacc aataagcccg 1980 tacggagatt ggggcatttg cgtaataaag tgatgaatca tatcaatcaa aatgtctttc 2040 gttatttctg gagaattgga ttccaaatgg cggtattgat caagaacgat tgttccttca 2100 aggtctgtta aaatgccatt aatataatcc acaccaacat ctattccaac ggagtatcct 2160 gcctttttat taaaaacaag catgacaggt cttcttccgc cacttgattg tccttgacct 2220 atttcaaata ccatactttc tttcattaac gtgtttacct gtgatgagac agttgattta 2280 tttaatccag tcatttcaga taattttgct cttgaaatag gtgaattttt aaggatttct 2340 tttaataata acttttgatt tacttttttg acaaaggttt gatcagcgat atccacttca 2400 tccactccat ttgtttaatc tttaaattaa gtatcaacat agtacatagc gaatcttccc 2460 tttattatat ctaatgtgtt cataaaaaac taaaaaaaat attgaaaata ctgacgaggt 2520 tatataagat gaaaataagt tagtttgttt aaacaacaaa ctaataggtg atgtacttac 2580 tatatgaaat aaaatgcatc tgtatttgaa tgaatttatt tttaaggggg aaatcacatg 2640 gctcaatctc attccagttc aatcaactat tttggaagcg caaacaaagt ggtttactaa 2700 ggtacccggg ctagctttaa gaaggagata tacatatgag tgaaattaaa aaagcattaa 2760 atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat gctatgccag 2820 aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt acatgcagtt 2880 gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa ttaaaaaagc 2940 attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg ttgatgctat 3000 gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg tatgtacatg 3060 cagttgttgt acaacttaat ctagctttaa gaaggagata tacatatgag tgaaattaaa 3120 aaagcattaa atacgcttga aattgaagat tttgatgcaa ttgaaatggt tgatgttgat 3180 gctatgccag aaaacgaagc gcttgaaatt atgggagcgt catgtacgac atgcgtatgt 3240 acatgcagtt gttgtacaac ttaatctagc tttaagaagg agatatacat atgagtgaaa 3300 ttaaaaaagc attaaatacg cttgaaattg aagattttga tgcaattgaa atggttgatg 3360 ttgatgctat gccagaaaac gaagcgcttg aaattatggg agcgtcatgt acgacatgcg 3420 tatgtacatg cagttgttgt acaacttaac aattagagag gagtatacat atgcttactg 3480 aaaaacaagt aaactttttt aaaaaaaatg gttatctaat tttagaagat tttttttctt 3540 tacatgaact aaaacaaatg aaattaacat ttcaacataa gataaaaaat caaaagaact 3600 caaaaggatt ctattcaggc atcttaactc aacaccttaa tctttggaat aaggattctt 3660 tttttaagaa ccttgtattt aacaaaagaa tttcgagaat tgcaaaagaa ctgttggaga 3720 ctaagaatat acggatttta caagatcatg ccttaattaa aaaaagcata gtaggtaaag 3780 ctactccttg gcatcaggat ttctcttatt ttccaattaa tgaacctgaa gcattaactg 3840 tttggattcc gtttcaagat gtctatgaaa aaaatggatg tatgagctat cttcctactt 3900 caaatacatt aggaagatta actaaagttc atatgtataa tatcgataaa cctttagaag 3960 atataaacat ttctcctgcg atagctaaac taaaagctgg gagtatagtt attcatcatt 4020 ctttaacttt gcattatgca tactctaaca taagtgataa tgatcggttg gcctatgcaa 4080 ttgtctatat gaaagatgaa gtaacttata atggaaacag acatccactg atagataaaa 4140 atttatttgc caaaaatcaa aaattagaag ggaccaactt ccctattatc gaggagagtg 4200 taacgttaac atgataaaag aacttgatca cgtaatgata aaagtccaaa atctagaaga 4260 aagtattact ttttattcag agcagttacg actgcaaata atctgggagt atgataatta 4320 tgtaggattt cataacggta tagttattca tgattcgaaa aacagtgaaa atttaactag 4380 ctttttcaaa gtagattctg tagaagaaac agtcaaaata ttaaaagaga gcaatgttaa 4440 aattatttta gagcccactc ctattccgac tggatataca gcagcctttc aagacatcag 4500 taataacatt attcatattg tagataatat taatctttct tgactcgagc accaccacca 4560 ccaccactga cgtacgggcc caagcggtac ccggggatcc gtttgttccc tttatagaaa 4620 ggaatgatca aatgttagaa ataaaagaaa aacaatttat taaattaaaa gaggacacat 4680 tcttttttcc ttcagctgaa gggatatact ttaggaattc tataggttat tttacaatca 4740 aaggtagaaa tatttacccg ttttttagtg aaatcagtaa atatttgaat ggtaaatata 4800 ctttgaaaga tatagtgagt gagttaagca aaacccaaga agaaaaattt ttaaaattaa 4860 ttgccatatt agagaagaat ggttttgtaa aatataccga aagggttatt gatgaaaatt 4920 attataaaaa ttatgaaaaa gaaattgcat ttatagatta ttatactaat aatggcatcg 4980 aattatttaa aaaactctct aatttcaaga tttgtttata tggtagcaat aagttatcta 5040 atactattca aaaaagctta gaaaacatag ggatacaaaa tattaaaaga ggctctcgtt 5100 ttgattttga gggagacatt gttatttatt gcaataatga tgttaatgaa agggaaaatc 5160 tactggaatg tatggacttt tctcagaata aaatatttat ttttgtaggt aataaagaat 5220 cattaggaat tattagtcct attataaaaa atttagatga ttggaaggaa tttgaaaata 5280 tattagagat tggtgcagat aatattaaag aaaatacaac atttactagc aactctatat 5340 taagtagtat gctaagtttt gaaattataa agtatgtaac aaattgtttg caaagtgatt 5400 taattaatgc ggcatacatt ttaaatactg atactttaaa agggaatttt gttcaggtaa 5460 aaaaaaaaat agacttaaaa caagatttta ttgaaacttt caaacaatca agcggaggca 5520 acggtttgta tatcaataaa ataggtagag gttctaggaa acaaattccg ctctcgcaat 5580 gggaggttga attggataaa ttaggtgaca tgaatagtga aaaaattaag gtcgttagct 5640 ttggtgatac ccaccaggaa gcgaggttta atacttatta taaaaccata gaacatctaa 5700 taatcaatgg ggaatttaac ttagaggaat catatagctt taagaatctt gatacaatca 5760 ctttagctat tgatgaacaa tttaaaagaa aattaacaat ttcatgcgac atagataaag 5820 aacttgcaat cagaaaagca atattaaaag caattttaaa gagggaaatt aatgtaattg 5880 ataattatca agagctttcc ccattaaaaa taagtgatta tatagataat aaaaatatac 5940 aatactattg taaactgatt aacattttaa aagcgaaaat agaattgcgt tttaagaaat 6000 tagtagaggg tttgtttttg gtagtagtta gtgacaatag ttatagggga gttagtatag 6060 gatttaattt aaatacagca ttagaaaatg ctcttaggca atttattaat aatttacaaa 6120 atagtatcta tacaataaat attgaagatg taatatttaa aagaattaat gattgggatg 6180 atgaatgcat tcgagagttt ttgacagatg aaaaattaga agtttttatc tgtagtatac 6240 aaaataatgt tatttcagca gaaatttcta tagttggagc aatattaata gaaagttagg 6300 tgaattgaaa aatgaataag gaagtcctta taatcaggga tgaaagcttt ggagaatttt 6360 ttgattcttt ttttttaaat gaaaataatc gaaaagtttg ttttatagat agtaataaaa 6420 aagatttgaa atatttatta aaaaactttt tagagaataa aaagtttagt tatgtactaa 6480 tctttccaaa ggaatggaat cctatgatgt ataggtcact tgatgcagtg ttagaagact 6540 atgatgtacc gtggatctat ataacacaat tttttaataa aattttaata ggtcctttta 6600 gaaattctaa gcaaaaaggt tgtttagatt gtttatatta tagatggttt atgacaaaaa 6660 aggatcgtat taatttattt gaattgaaga aatgtttatc agaaggacat aatgtaaaaa 6720 tatctggaga tttattgaat gcttcaatgg ttggattagc aattacttta gcatttaaac 6780 taataaataa tgaggtttcg gaattttcgt atattattga caaaaagaca ttgagattca 6840 atggtcataa ttttttacct aatccacatt gtcaagtatg tgggcacatg gataatgacg 6900 agaaaagatt aatagaacac aaatttttta cagcacttaa cgataatact cttaaagaaa 6960 agaaaggaaa tcgtttttta tcaaaagaat atttagaaga taccctatct aaaaattttt 7020 tagatgtaga aactggtata tttaataaac ttttggacga ttatgaaagt cctttcgcag 7080 tttcggtagc aaatcttcct ttaaaggttg gaaaggatga ggttggtgtt ggaagaacgg 7140 ataattatgc taatagtcac ttaactgcaa tattagaagg aatagagaga tattgcggaa 7200 tggaaccaag ggggaataga actaacgttt ttggtagtta taatgagcta atggaaaatg 7260 ctctcaatcc atctgtttta ggattacacg cggaagaaca gtatcaatta aaaagatttc 7320 cttttaataa atataatcca gataaaaaaa tgaaatgggt ctgggggtat tcttttaata 7380 agaataaggc gatattagtc cctgaaactt atgcctatta tggtacgaat tatagagatg 7440 gcgttcaaaa tagttttgtt tatgaaatct cgaatggatg tgctttagga ggacatttat 7500 tggaagctac attgcaagga atttatgaag tagtggaaag agatgctttt cttatatctt 7560 ggtatactaa attaccatta aaacgtataa gaaaagaatc tattaaggat cagacgattc 7620 aattattatt aacgagattt gaatatcaaa ctgattatga tattcatctg tataatatga 7680 ctttagagaa taaaatacca actattttag ctattgcaaa aaatagaggt gcttttggca 7740 tgaatatttt atgtgctgca ggttgtcatt tagatataaa taaagcaatt gaaagttcat 7800 tacatgagtt atgtggaatc ttagaggcaa tcaaaagtaa atttgaaaat aggaaaagtg 7860 aattatacga aatggcaaag aattattcac ttgtacggac gatggaagat cattcattat 7920 tatttggatt gaaagaactt gaaaaagagt ttgattttct attaaagagc ccgattgaaa 7980 ttgatttaag tgaggtagaa cctttaaaat atagcaacaa tatacataca gatttattga 8040 atgtaattga ttattttaaa aaaataaatt tagatatcat cgtagtcgat caaaccgcgg 8100 aagatataaa atttaacaac ttgtattgtg taaaagttat tattccagga atgttaccta 8160 tgacatttgg acatgatatg agaagaatac ataatttacc aaggatattc cgtgttccaa 8220 gggaattagg acataaaatt aagaatgaaa atgaaattaa gaacaatcag gtaactcctc 8280 atcctttccc ataacatttt ttatgaaaga tggtgatata acatgaaacc aataaactat 8340 gtaccacatt ttttatgtag aatatctggt gaagaaataa actctatttc agaaattgag 8400 tttattaaaa ccttggaatg tttagaatta tccgaaggaa ttttaaggaa aataaattct 8460 ttatcagcag acttaacgaa agatttacat gattgtattt ctttatataa agaacaatct 8520 atttcacgtg tattaataaa tcttaaaaga gatattttta atatgaggtt taatcgagtt 8580 caaaagtata aactagaaaa tatctcaggt tttaaccacg ataaattaaa tttatggtta 8640 aatttagctc aagaatatca aagcacgcta catctgatga gagaaacttt taaaatggaa 8700 atacaggaaa aaagagggaa attaaagcag ttatttagta atagtgaata tataaaagcc 8760 attcaagtct caaatactca actttatgaa aatctcctag aatacttaca agataatcaa 8820 agtcatcctc caaaaaagat gaggaatatt gaacagtctc taattaatta cctaagtcgt 8880 atgatattta agccaactcc cttcagttca tttacaggat taaattacgg tttttttagt 8940 caggaagatt caagttttga aataaatact aaggaaagca aaggtcacac tcgaataaac 9000 atggtttatt taaaaaaaat tgaaagaatg ttattaaatc gaatatctat aaaaaataaa 9060 tgttatgttt cgttaaatca aacgataaac gaagaggaaa attatatgtt ttttcgaaga 9120 ggtaaagatg ggactagtca agcttttact ggtgaagctt ttataaagat aaaaaagagc 9180 gagctcttaa aggagttaat tcaatatttt gaaggaatat cttcaatgaa tatagttgag 9240 gttgtatcat ttctttccga aaaaacaaat tatgaaactg aagctttata taattactta 9300 tttaagttag agaaaatggg agtgttagat tttagcttag gtgtgtccga acaatcggac 9360 aattacacga aagatttgat agaaaactta ttggggatta aagattcatt agttgaaaaa 9420 tcggtctcac accttgtaga aatagaaaaa attcaggcga ttttctctga atccaattac 9480 caaaaacgtt atgtactttt aaaaaattta caagaacata taaagaagat ttatagttta 9540 tttgatttaa aattagagtc taatgatttg acctctctat tattcgagga tgttagttat 9600 aaaaatacta agattatatt aaatgaaaat caatggaaaa cgcatcttga tgattttaat 9660 ttaattaaga atttaatgcc actttttgat gataatatcc ttgaaaaatt aagtatgaat 9720 ataattttta aggatatata tggtaacaag ggggcaatag atttattaga attctataga 9780 gagtttaata aatatgataa aaatttatta tggaagaaaa ttagaaaaaa tgatacatat 9840 ctttatttaa aaaaattgag aacagagttt tatgattatc tagaaacaca aattaatatg 9900 gggttagaca ctatcttttt aaataaaagt tggttaaaga aatttattaa caagttccct 9960 gatttattga agagtaagga aaattattct ttctattttc aaatagccta tgataatcaa 10020 gataatagaa ttttagtttt aaataagata gggccaggat taggtaagca cttttcaaga 10080 tatggtaatt tatttttaaa tagcgaatac aaggaaaata atagatttat taattctctt 10140 atagaacagt ataaaaaata tgatcaaaat gggggggttt taacagattt aaatgcagtg 10200 ttaggtctaa atcttaatat gcatcctaat cttttaaatt atgaaattac ttatccagga 10260 tgcaatccta gtaaaggaat taatcaagta gcattaaagg atattgaagt attgtatgat 10320 tctaattctg accaactaaa attatattct aaacaatata gacagaatgt taaattactt 10380 ccattgggat ttttgtttcc agcattgtcc ccatctttat ataagttttt atgtggattt 10440 tcggaatcaa atgggataga gtattctttt tggaacaagt tcttaaatga acacaataat 10500 aatttttcac ttttacctag aattatgtta ggatcagtag ctttggatag aagaacatgg 10560 aaaattaatg cgaaggaaat acaaaaggaa ttttctaaag atacatttga aacttttatt 10620 aacttccata agtgggtgaa agaaaatcaa ctaccggaag atatattttt aagggttgca 10680 aacacaatgg acgcttttag tgagaatgaa ttattaaatc aagatttagg aagttggatt 10740 gcagaaatta aacaaactaa acatcgtaaa cctcaatatg ttaattttaa taattacttt 10800 catatcgatg ccttaagaaa gattattaaa gatgttaata atacagtaac aattcaagaa 10860 gtttatcctc atccagatga tgtgtattat caaaaaaata gtaaaaaatg tgtagaattt 10920 ttagttgagg ttttttaata aaggaatgat tatatgaacg agaataattt tatatggaag 10980 gcttatcata ttttttatca tcaaaatcaa gattttctaa ttacaaattg tatcaaacca 11040 attttagatg aattgataaa aaagaaatta attagtaaat ttttttttat aagatattgg 11100 gaaggcggac ctcatattag agtgcgactt tattgtacat taaataaatc tcaagaagtt 11160 gattataaat ttaatgattt tgtttctaaa ttcttgaaaa catatccttc ttcatcaaca 11220 ttagatagaa acatgataaa gaatcaatta gcaaaattag ctagtcttga agagggtact 11280 gagtcaacat gtgttcgaga gaataatcat attattcatc tagaatataa tccagagtat 11340 aaacgatatg gaggagaaaa tggaatagag attgcggaag aacattttta ccattcaagt 11400 ataatgtgtt tgaagttaat acaagaaatt aataaaaaga caaatcgttt gcgcatatct 11460 attgaaatta tactatctta tttaaaagct atgaatatga acttacaaga gagtattaag 11520 tttttagaag gctattatct aatatggaaa agatatgtat acagcaatac caataacgtt 11580 gaagaattct tcgctaacaa atatattaag caaaaaaaag taatagacaa aattgtagta 11640 aactatttca attctaataa taataaaggt atgttaggag aaaaatggag taatcatttg 11700 aatttaactg tacagaattt agaaaatgat tgggatcggg gagaattaat aatagataaa 11760 gatgttttag catatataaa tatccctcaa aagattgctt ttatagttac aagttatgtt 11820 catatgacaa acaataggct tggtatcatg ccgcaagaag aagcctattt aagctatatg 11880 cttttatgta gtttgaaatc attgtataag agtagaaagg gatgacttaa atggagcagt 11940 atcataaaat tgtattaact ggaagtaatg ctgagactat gttaataaaa aatatagagc 12000 ctgtagcagt taagtttata aataactata agggtttttt ctatgttttt aaatatagta 12060 aagattttcc aattatcgat gtttatatca acaacaaaat tgttacagaa aatcaattaa 12120 ataaaatttt acagaattct ggggctaaat ataaaattta taaaaattca atatttaatg 12180 agacacaagg gaattttggg atgttaggtg ataaatatct ggcagaattt tttaaaaaga 12240 caaatgaaat tagccttaat atactaaatc aaaattttga gagttacaat aaaaaaatag 12300 aatttgcgct agagataatg ttaatttcag cgcactataa ttatgattca ataaaaaaag 12360 gctacttatc ctatgcatct catgtaaatg gattttttac tagatggaaa gatccaaata 12420 aaattagaga tatatttcat aagaactact taaataacaa agagtaccta gaatcgaaag 12480 tttcagaaat aatagataat aacaacagaa gtagcttgag cgaattatcg gatattatta 12540 cagaaatgaa gaaagagatg actactgata ttgagaaggg gaacctgcat gtatttaata 12600 ttgaattact acaaaaacca ggagaaagag attttctaga aaaaagtcag tttcataaga 12660 cgatattaaa taatccagat ttctctaatt ttatgaataa agatataaac tttttaggtt 12720 cacgcctaat aactgtattt acgtacttat taatacgaaa tttagggatt caaaataaag 12780 atagatatct actttgctac tatatctata aaattattga agaaaaatat aatatagata 12840 ctttggaatt aataagggat tttggtaaag ggagggataa taatgttgaa gacttacaaa 12900 gatattgaag attttttata taatttgcaa tattcgcctg ctaaagcttc agatttcaat 12960 ttagatttaa gtaattatga tagacccttg ccttttaaaa tttataggaa tagagaatcg 13020 atagatttag acgataactt tccgatttgt attaatgatt tagatggtat tgattattca 13080 aatttcgaaa ttattagtta tttattgtgg tatacctatg gttttaccag ctacaattgg 13140 ttaacaaaac caacattaaa tggtcagaat acatccttaa gtttttttag aagaagtgta 13200 gcctcaggtg gcggcttata tcctggggaa atttacttat atgtggagag tattaaaggt 13260 atcaagtcag gattatatta ttttgatgtt aggggaccga gattaatttt actaagggaa 13320 ggaaattttc aagaatttat caaaaaatct ttgcaatata atcaagatag aaatgtttat 13380 atttttataa catcatttta ttggaaaaac ttctttaaat atttaaattt ctcgtatcgt 13440 ttacaaggct tagatatcgg tgctattgta agccaagctc acctaatttc aaagaaatta 13500 ggtcttaatt cggagattag gtatcacttt gatgataaaa aaattaatga ttttttagga 13560 atcaacgctg aggaagaaag cagctacgta gttttgccta tagatatgga taataattca 13620 tataaaagtg aaaataaggt tcccgctttt gagtacttta aaaacgatac aacattcaat 13680 tatattgaac atttaaatgt tggccccaaa aatgtatgtc aggatattta taaaatcaat 13740 agtaatatta tcaatagtgg cttaattaaa gttaaaaaaa atgaaatagc atcttttaaa 13800 gaggaggcaa atgttgttca taaagaaaaa tatgattatg acattttgaa ggcttctgta 13860 agtcgtatat caccaggaga gaactttttg tctgattttt tgaatattca gcatgttcac 13920 aaagttctag atgttggaat gcaggaacaa tttaaaaatg atatttttag cgataattat 13980 agtgttctaa aggatgttga aatttacttt tatgccaata agattgaagg tttaccaaaa 14040 ggctactatt actataatcc aagtaataaa agtttcgttt tgaaacataa aggtgatttt 14100 tctagtgttt ttcaggagaa tcttacacga aaaaatttta atttagtaga aatgccttta 14160 attgtgcact tagtattaaa catgaaaaaa tttatagaaa atatgaaatt tagaggctat 14220 agagtcatgc aaatggaggc agggagaatt atgcatcaaa tacaattgaa tgctgcaggt 14280 ttgaacctag ggagccatcc aatgttaggt tatagggctg ataatttgga ggagtttttt 14340 ggtattcaaa ataatataac tgtccagatg tctattggta aatatagacc tttattgagg 14400 ctaaccaata atttattgaa taaaactaaa ggagaacaat tttatgtatg acggaaaacg 14460 ggtgaatcca tatgaactct atcaaacaat ttaattttaa aaataaaaat atttttatta 14520 ctggagctac cagtgatata gctatctgta tagcagaatc cttctctgga tttggcggga 14580 atttaatttt atctgatact gataaacaat taccaaaatt agaacatgtt aaacaaaaaa 14640 tgattgaaaa atttaggaat aatgttcaaa ttgtaactat tgatttatat aaggttaatg 14700 atatacaaaa tgcaattgaa aaattagata aaccaattga tatattgatc aattgtgctg 14760 gaaataatta ctttgttcca gctctggagg ttagtgaaga gaattggcaa aaaattatag 14820 atgtaaattt gaaaggaact ttttttctta gtcagtcaat agcaaaaaaa atgattagtg 14880 acggcataaa ggggaaaatt gtaaatattg gatcgcaaca tggggtagtt gccaatggtc 14940 taagagcccc ctattgtatt agtaagtttg gattaatagg tttgacaaaa gttttagcgc 15000 tagagtggtc tacttttaat atattggtta attgtgtttc accaacgtat gtaaaaactt 15060 ctaaaagtaa ggatttcttg gagcatgaag atgttaaaaa agcatattta tataaaatcc 15120 ctttgaaaaa atatgcttta ccccacgata tatcatatgc agtattgttt ttaagtagcg 15180 atcaaaatca gataattaca ggggaaaata ttttagttaa tggtggttat acattacact 15240 agtcaccacc accaccacca ctgacgtacg ggcccaagct tgcacccatt agttcaacaa 15300 acgaaaattg gataaagtgg gatattttta aaatatatat ttatgttaca gtaatattga 15360 cttttaaaaa aggattgatt ctaatgaaga aagcagacaa gtaagcctcc taaattcact 15420 ttagataaaa atttaggagg catatcaaat gaactttaat aaaattgatt tagacaattg 15480 gaagagaaaa gagatattta atcattattt gaaccaacaa acgactttta gtataaccac 15540 agaaattgat attagtgttt tataccgaaa cataaaacaa gaaggatata aattttaccc 15600 tgcatttatt ttcttagtga caagggtgat aaactcaaat acagctttta gaactggtta 15660 caatagcgac ggagagttag gttattggga taagttagag ccactttata caatttttga 15720 tggtgtatct aaaacattct ctggtatttg gactcctgta aagaatgact tcaaagagtt 15780 ttatgattta tacctttctg atgtagagaa atataatggt tcggggaaat tgtttcccaa 15840 aacacctata cctgaaaatg ctttttctct ttctattatt ccatggactt catttactgg 15900 gtttaactta aatatcaata ataatagtaa ttaccttcta cccattatta cagcaggaaa 15960 attcattaat aaaggtaatt caatatattt accgctatct ttacaggtac atcattctgt 16020 ttgtgatggt tatcatgcag gattgtttat gaactctatt caggaattgt cagataggcc 16080 taatgactgg cttttataat atgagataat gccgactgta ctttttacag tcggttttct 16140 aatgtcacta acctgccccg ttagttgaag aaggttttta tattacagct ccagatcctc 16200 tacgccggac gcatcgtggc cggcatcacc ggcgccacag gtgcggttgc tggcgcctat 16260 atcgccgaca tcaccgatgg ggaagatcgg gctcgccact tcgggctcat gagcgcttgt 16320 ttcggcgtgg gtatggtggc aggccccgtg gccgggggac tgttgggcgc catctccttg 16380 catgcaccat tccttgcggc ggcggtgctc aacggcctca acctactact gggctgcttc 16440 ctaatgcagg agtcgcataa gggagagcgt cgacatggat gagcgatgat gatatccgtt 16500 taggctgggc ggtgatagct tctcgttcag gcagtacgcc tcttttcttt tccagacctg 16560 agggaggcgg aaatggtgtg aggttcccgg ggaaaagcca aataggcgat cgcgggagtg 16620 ctttatttga agatcaggct atcactgcgg tcaatagatt tcacaatgtg atggctggac 16680 agcctgagga actctcgaac ccgaatggaa acaaccagat atttatgaat cagcgcggct 16740 cacatggcgt tgtgctggca aatgcaggtt catcctctgt ctctatcaat acggcaacaa 16800 aattgcctga tggcaggtat gacaataaag ctggagcggg ttcatttcaa gtgaacgatg 16860 gtaaactgac aggcacgatc aatgccaggt ctgtagctgt gctttatcct gatgatattg 16920 caaaagcgcc tcatgttttc cttgagaatt acaaaacagg tgtaacacat tctttcaatg 16980 atcaactgac gattaccttg cgtgcagatg cgaatacaac aaaagccgtt tatcaaatca 17040 ataatggacc agacgacagg cgtttaagga tggagatcaa ttcacaatcg gaaaaggaga 17100 tccaatttgg caaaacatac accatcatgt taaaaggaac gaacagtgat ggtgtaacga 17160 ggaccgagaa atacagtttt gttaaaagag atccagcgtc ggccaaaacc atcggctatc 17220 aaaatccgaa tcattggagc caggtaaatg cttatatcta taaacatgat gggagccgag 17280 taattgaatt gaccggatct tggcctggaa aaccaatgac taaaaatgca gacggaattt 17340 acacgctgac gctgcctgcg gacacggata caaccaacgc aaaagtgatt tttaataatg 17400 gcagcgccca agtgcccggt cagaatcagc ctggctttga ttacgtgcta aatggtttat 17460 ataatgactc gggcttaagc ggttctcttc cccattgata gcttggcgta atcatggtca 17520 tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 17580 agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 17640 cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 17700 caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 17760 tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 17820 cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 17880 aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 17940 gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 18000 agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 18060 cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 18120 cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 18180 ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 18240 gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 18300 tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 18360 acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 18420 tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 18480 attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 18540 gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 18600 ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 18660 taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 18720 ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 18780 ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 18840 gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 18900 ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 18960 gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 19020 tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 19080 atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 19140 gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 19200 tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 19260 atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 19320 agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 19380 ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 19440 tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 19500 aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 19560 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 19620 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 19680 accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtc 19738

Claims

하기 화학식 2로 표시되는 마크로코신 화합물을 금속 수산화물과 반응시켜 하기 화학식 1로 표시되는 마크로코신 기반 카르복실산 화합물을 제조하는 방법에 있어서, 상기 금속 수산화물은 화학식 2의 마크로코신 화합물 1몰에 대하여 3 내지 12몰로 사용되는 것인, 화학식 1로 표시되는 마크로코신 기반 카르복실산 화합물의 제조방법:
[화학식 1]

[화학식 2]

상기 화학식 1 및 2에서,
R₁ 내지 R₃은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며;
상기 R₁ 내지 R₃의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있으며;
R_a는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며;
R_b는 수소 또는 C1-C10알킬이다.
제 1항에 있어서,
상기 R₁ 내지 R₃은 서로 독립적으로 수소 또는 C1-C10알킬이며, 상기 R₁ 내지 R₃의 알킬은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법.
제 1항에 있어서,
상기 R_a는 수소 또는 C1-C10알킬이며; R_b는 C1-C10알킬인, 마크로코신 기반 카르복실산 화합물의 제조방법.
제 2항에 있어서,
상기 R₁ 내지 R₃은 서로 독립적으로 수소 또는
이며, L₁은 C1-C3알킬렌이며, R₄는 수소, 하이드록시, 티오, C1-C4알킬티오, C1-C4알킬, C1-C4알콕시, C6-C12아릴, 하이드록시C6-C12아릴 또는 C3-C10헤테로아릴인, 마크로코신 기반 카르복실산 화합물의 제조방법.
제 4항에 있어서,
상기 R₁ 내지 R₃은 서로 독립적으로 수소이거나, 하기 구조에서 선택되는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법.
제 1항에 있어서,
상기 화학식 2의 마크로코신 화합물은 하기 화학식 2-1-A, 화학식 2-1-B 또는 화학식 2-1-C으로 표시되는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법:
[화학식 2-1-A]

[화학식 2-1-B]

[화학식 2-1-C]
제 1항에 있어서,
상기 금속 수산화물의 금속은 알칼리금속 또는 알칼리토금속인, 마크로코신 기반 카르복실산 화합물의 제조방법.
삭제
제 1항에 있어서,
상기 화학식 2의 마크로코신 화합물은 천연물로부터 분리된 것이거나 합성으로 제조된 것인, 마크로코신 기반 카르복실산 화합물의 제조방법.
제 6항에 있어서,
상기 화학식 2-1-A 의 마크로코신 화합물은
1) BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조되는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법.
제 6항에 있어서,
상기 화학식 2-1-B의 마크로코신 화합물은
1) BcTclE, BcTclO, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조되는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법.
제 6항에 있어서,
상기 화학식 2-1-C의 마크로코신 화합물은
1) BcTclE, BcTclD, BcTclC, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 통해 제조되는 것인, 마크로코신 기반 카르복실산 화합물의 제조방법.
1) BcTclE, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, 및 BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 포함하는 하기 화학식 2-1-A의 마크로코신 화합물의 제조방법:
[화학식 2-1-A]
1) BcTclE, BcTclO, BcTclI, BcTclJ, BcTclK, BcTclL, BcTclM, BcTclN, 및 BcTclP 유전자를 포함하는 발현 벡터를 제작하는 단계;
2) 상기 단계 1)의 발현벡터를 바실러스 섭틸리스(Bacillus subtilis)에 형질전환하는 단계;를 포함하는 하기 화학식 2-1-B의 마크로코신 화합물의 제조방법.
[화학식 2-1-B]
삭제
하기 화학식 2의 마크로코신 화합물을 금속 수산화물과 반응시켜 하기 화학식 1의 마크로코신 기반 카르복실산 화합물을 제조하는 단계;
화학식 1의 마크로코신 기반 카르복실산 화합물로부터 화학식 3의 마크로코신 유도체를 제조하는 단계;를 포함하는 마크로코신 유도체의 제조 방법:
[화학식 3]

[화학식 1]

[화학식 2]

상기 화학식 1 내지 3에서,
R₁ 내지 R₃은 서로 독립적으로 수소, C1-C10알킬, C3-C10시클로알킬, C6-C12아릴 또는 C3-C10헤테로아릴이며;
상기 R₁ 내지 R₃의 알킬, 시클로알킬, 아릴 및 헤테로아릴은 하이드록시, 티오, C1-C10알킬티오, C1-C10알킬, C1-C10알콕시, 하이드록시C1-C10알킬, C6-C12아릴, 하이드록시C6-C12아릴 및 C3-C10헤테로아릴로 이루어진 군으로부터 선택되는 하나 이상으로 더 치환될 수 있으며;
R_a는 수소, C1-C10알킬, C2-C10알케닐 또는 C1-C10알콕시C1-C10알킬이며;
R_b는 수소 또는 C1-C10알킬이고;
Z₁ 및 Z₂은 서로 독립적으로 단일결합, -CONR₁₁-, -NR₁₂CO-, -COO-, -OCO-, -CR₁₃R₁₄-, -NR₁₅COO-, -NR₁₆-, -S-, -O-, -SO₂- 또는 -OCONR₁₇-이며, R₁₁ 내지 R₁₇은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, 카르복실C1-C10알킬 또는 C1-C10알콕시카보닐C1-C10알킬이며;
A₁은
또는
이며, R'는 C1-C10알킬이며, p는 0 내지 2의 정수이며;
A₂는 단일결합 또는 C1-C10알킬렌이며;
R은 수소, 아미노 또는 -B(OH)₂이거나, 하기 구조에서 선택되는 어느 하나이고;

X는 O 또는 S이며;
X₁는 NR₃₁, O, S 또는 SO₂이며;
X₂ 내지 X₅는 각각 독립적으로 NR₃₂, O 또는 S이며;
R₂₀ 내지 R_22,R₃₁ 및 R₃₂는 서로 독립적으로 수소, 할로겐, 니트로, C1-C10알킬카보닐, C1-C10알콕시카보닐, C1-C10알킬, C1-C10알킬설포닐, 아미노설포닐, 하이드록시C1-C10알킬, 디하이드록시C1-C10알킬, 시아노C1-C10알킬, C3-C10시클로알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실C1-C10알킬이다.
제 16항에 있어서,
상기 화학식 3에서, Z₁은 단일결합, -CONR₁₁-, -NR₁₂CO- 또는 -COO-이며; Z₂는 단일결합, -CONR₁₁-, -NR₁₂CO-, -NR₁₅COO-, -NR₁₆-, -S- 또는 -OCONR₁₇-이며; R₁₁, R₁₂ 및 R₁₅ 내지 R₁₇은 서로 독립적으로 수소, 하이드록시, C1-C10알킬, C1-C10알콕시카보닐C1-C10알킬 또는 카르복실C1-C10알킬인, 제조방법.
삭제