KR101916290B1

KR101916290B1 - 캡슐형 그람-양성 세균 생체접합체 백신

Info

Publication number: KR101916290B1
Application number: KR1020187004586A
Authority: KR
Inventors: 미카엘 바커; 미카엘 코바릭; 미카엘 베터
Original assignee: 글락소스미스클라인 바이오로지칼즈 에스.에이.
Priority date: 2010-05-06
Filing date: 2011-05-04
Publication date: 2018-11-09
Also published as: EP2566507A1; CY1119895T1; JP6339366B2; PL2566507T3; ES2844596T3; EP3281639B1; JP2013524844A; IL222711A0; DK2566507T3; NO2566507T3; ES2657588T3; US8871491B2; HUE037956T2; CN103079591B; US20170128559A1; EP2566507B1; KR20180021219A; CA2798381A1; LT2566507T; HRP20180064T1

Abstract

본 발명의 한 실시양태는 신규 스타필로코커스 아우레우스 생체접합체 백신에 관한 것이다. 보다 일반적으로, 본 발명은 삽입된 핵산 공통 서열을 포함하는 단백질 담체; 상기 공통 서열에 연결된 하나 이상의 폴리사카라이드, 예컨대, 캡슐형 그람-양성 폴리사카라이드; 및 선택적으로 보조제 또는 약학적으로 허용가능한 담체를 포함하는 그람-양성 및 다른 생체접합체 백신에 관한 것이다. 추가 양태에서, 본 발명은 그람-양성 및 다른 생체접합체 백신을 제조하는 방법에 관한 것이다. 또 다른 양태에서, 하나 이상의 폴리사카라이드, 예컨대, 그람-양성 폴리사카라이드를 포함하는 N-글리코실화된 단백질이 제공된다. 또한, 본 발명은 제1 원핵 유기체의 글리코실트랜스퍼라제(glycosyltransferase) 및 제2 원핵 유기체의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열을 포함하는 개조된 원핵 유기체에 관한 것이다. 또한, 본 발명은 N-글리코실화된 단백질 및/또는 생체접합체 백신을 생성하는 폴리사카라이드 및 효소를 코딩하는 플라스미드 및 이 플라스미드로 형질전환된 원핵세포를 포함한다. 추가로, 본 발명은 상기 생체접합체 백신을 투여하는 단계를 포함하는, 포유동물에서 면역 반응을 유도하는 방법에 관한 것이다.

Description

캡슐형 그람-양성 세균 생체접합체 백신{CAPSULAR GRAM-POSITIVE BACTERIA BIOCONJUGATE VACCINES}

본 발명은 삽입된 핵산 공통 서열(consensus sequence)을 포함하는 단백질 담체; 상기 공통 서열에 연결된, 세균, 예컨대, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드; 및 선택적으로 보조제를 포함하는 생체접합체 백신, 예컨대, 그람-양성 백신에 관한 것이다. 추가로, 본 발명은 변형된 캡슐형 폴리사카라이드 또는 LPS의 생성을 포함하는 변형된 LPS 생합성 경로를 이용하는 글리코실화 시스템에 의해 제조된 그람-양성 세균 백신, 예컨대, 스타필로코커스 아우레우스(Staphylococcus aureus) 백신 또는 다른 세균 백신에 관한 것이다.

관련 출원에 대한 상호참조

본원은 미국 특허법 제119조 제e항(35 U.S.C. §119(e)) 하에서 2010년 5월 6일자로 출원된 미국 가출원 제61/332,170호(전체적으로 본원에 참고로 도입됨)의 이익을 주장한다.

연방 지원 연구에 대한 선언

본 발명의 양태는 미국 국립보건원에 의해 수여된 승인 1R01AI088754-2의 하위승인 105699 하에서 정부 지원으로 만들어졌다. 정부는 본 발명의 이들 양태에 있어서 일정한 권리를 갖는다.

서열목록

본원은 EFS-웹을 통해 ASCII 형식으로 제출되었고 전체적으로 본원에 참고로 도입되는 서열목록을 함유한다. 2011년 5월 2일자로 생성된 상기 ASCII 사본의 파일명은 031229US.txt이고 상기 사본의 크기는 206,590 바이트이다.

백신은 현대 의학의 가장 위대한 공중보건 발명들 중 하나이고 수백만 명의 생명을 구하였다. 면역화는 감염을 예방하고 조절하는 이상적인 수단인 것으로 입증되었다. 매년 백신은 최대 3백만 명의 사망을 예방하고, 750,000명의 소아를 장애로부터 구한다(문헌[Global Alliance for Vaccines and Immunization - Press Releases (March 11, 2006) at www.gavialliance.org/media_centre/press_releases/2006_03_09_en_pr_queenrania_delhi.php]). 1999년, CDC는 면역화를 20세기 최고의 공중보건 성과로 선언하였다(문헌[Ten great public health achievements-United States, 1900-1999. MMWR Morb Mortal Wkly Rep 48:241-3 (April 2, 1999)]). 몇몇 세균, 예컨대, 파상풍 또는 디프테리아를 야기하는 세균은 상기 질환의 주원인인 독소를 생성한다. 이 독소는 해독된 형태로 백신으로서 사용될 수 있다. 그러나, 대다수의 세균에 있어서, 백신을 개발하는 데에 사용될 수 있는 단일 독소가 없다.

가장 성공적인 백신으로는 담체 단백질에 접합된 해모필러스 인플루엔자(Haemophilus influenzae), 네이세리아 메닝기티디스(Neisseria meningitidis) 및 스트렙토코커스 뉴모니아(Streptococcus pneumoniae)와 같은 세균 병원체의 표면 폴리사카라이드가 있다. 이들 세균들은 미생물 병독성 및 식균작용 사멸에 대한 내성을 촉진할 뿐만 아니라 그들이 건조되는 것을 방지하는 캡슐에 의해 둘러싸여 있다.

세균 폴리사카라이드는 T 세포 에피토프를 함유하는 단백질 담체에 커플링되어 있는 경우 인간에서 오래 지속되는 면역 반응을 이끌어낼 수 있다. 이 개념은 80년 전에 고안되었고(문헌[Avery, O. T., and W. F. Goebel. 1929. Chemo-immunological studies on conjugated carbohydrate-proteins. II Immunological specificity of synthetic sugar-proteins. J. Exp. Med. 50:521-533]), 단백질 담체 디프테리아 독소에 커플링된 해모필러스 인플루엔자 B형(HIB)의 폴리사카라이드에 대해 나중에 입증되었다(문헌[Anderson, P. 1983. Antibody responses to Haemophilus influenzae type b and diphtheria toxin induced by conjugates of oligosaccharides of the type b capsule with the nontoxic protein CRM197. Infect Immun 39:233-8; Schneerson, R., O. Barrera, A. Sutton, and J. B. Robbins. 1980. Preparation, characterization, and immunogenicity of Haemophilus influenzae type b polysaccharide-protein conjugates. J Exp Med 152:361-76]). 또한, 이 당접합체는 1987년 미국에서 허가받은 최초의 접합된 백신이었고, 그 직후 미국 유아 면역화 일정 내로 도입되었다. HIB 이외에, 캡슐화된 인간 병원체 네이세리아 메닝기티디스 및 스트렙토코커스 뉴모니아에 대한 접합된 백신이 성공적으로 사용되었다. 이들 백신의 상용은 비인두 콜로니화 및 감염을 감소시켰다. 현재 전세계 백신 시장의 약 25%가 접합된 백신을 포함한다.

그람-양성 세균은 캡슐형 폴리사카라이드에 의해 둘러싸인 세포막을 갖는다. 스타필로코커스는 이러한 그람-양성 세균 중 하나이다.

스타필로코커스 아우레우스는 감염을 야기한다. 스타필로코커스 아우레우스는 다양한 범위의 인간 질환의 원인인 기회감염성 세균 병원체이다. 스타필로코커스 아우레우스는 정상 인간의 점막 표면에서 콜로니화될 수 있지만, 상처 감염의 주원인이기도 하고 골수염, 심내막염, 및 전이성 합병증을 갖는 세균혈증을 포함하는 여러 감염을 유도하는 침윤력을 갖는다(문헌[Lowy, F. D. 1998. Staphylococcus aureus infections. New Engl J Med 339:520-32]). 스타필로코커스 아우레우스는 환기구 관련 폐렴에 관여하는 가장 흔한 병원체들 중 하나이고, 소인성 위험 인자를 갖지 않는 이미 건강한 성인 및 소아에 영향을 미치는 지역사회 획득 폐렴의 중요한 새로운 원인이다(문헌[Kollef, M. H., A. Shorr, Y. P. Tabak, V. Gupta, L. Z. Liu, and R. S. Johannes. 2005. Epidemiology and outcomes of health-care-associated pneumonia: results from a large US database of culture-positive pneumonia. Chest 128:3854-62; Shorr, A. F. 2007. Epidemiology and economic impact of meticillin-resistant Staphylococcus aureus: review and analysis of the literature. Pharmacoeconomics 25:751-68]).

스타필로코커스 아우레우스는 병원내 세균혈증의 두 번째로 가장 흔한 원인이고, 메티실린 내성 스타필로코커스 아우레우스(MRSA) 균주는 미국에서 집중 치료 병동 내의 모든 감염의 50% 이상을 차지한다. 병원 및 지역사회 내에서의 스타필로코커스 아우레우스 감염은 증가하고 있다. MRSA 균주는 1974년에는 스타필로코커스 감염의 2%로부터 단리되었고 2004년에는 스타필로코커스 감염의 63%로부터 단리되었다. 대다수의 병원내 MRSA 균주는 다중약물 내성을 나타내고, 심지어 메티실린 감수성 균주는 치명적일 수 있다. 집단에 근거한 활성 사례 발견을 이용한 최근 보고는 2005년에 미국에서 94,360건의 침윤성 MRSA 감염이 일어났고 이들 감염의 대다수(58%)가 병원 외부에서 일어났다는 것을 보여주었다(문헌[Klevens, R. M., M. A. Morrison, J. Nadle, S. Petit, K. Gershman, S. Ray, L. H. Harrison, R. Lynfield, G. Dumyati, J. M. Townes, A. S. Craig, E. R. Zell, G. E. Fosheim, L. K. McDougal, R. B. Carey, and S. K. Fridkin. 2007. Invasive methicillin-resistant Staphylococcus aureus infections in the United States. JAMA 298: 1763-71]). 이 분석에서, 2005년에 AIDS로 인해 사망한 미국인보다 MRSA로 인해 사망한 미국인(18,000명 초과의 사망)이 더 많았다.

뉴욕/재팬(New York/Japan) 클론으로도 공지되어 있는 스타필로코커스 아우레우스 USA100은 널리 퍼진 미국 병원 획득 MRSA 균주를 대표하는 MRSA 균주이다(문헌[Dougal, L. K., C. D. Steward, G. E. Killgore, J. M. Chaitram, S. K. McAllister, and F. C. Tenover. 2003. Pulsed-field gel electrophoresis typing of oxacillin-resistant Staphylococcus aureus isolates from the United States: establishing a national database. J Clin Microbiol 41:5113-20]).

역학적 분석은 스타필로코커스 아우레우스가 미국에서만 매년 약 2백만 건의 임상 감염을 야기한다는 것을 보여준다(문헌[Fridkin, S. K., J. C. Hageman, M. Morrison, L. T. Sanza, K. Como-Sabetti, J. A. Jernigan, K. Harriman, L. H. Harrison, R. Lynfield, and M. M. Farley. 2005. Methicillin-resistant Staphylococcus aureus disease in three communities. N Engl J Med 352: 1436-44; King, M. D., B. J. Humphrey, Y. F. Wang, E. V. Kourbatova, S. M. Ray, and H. M. Blumberg. 2006. Emergence of community-acquired methicillin-resistant Staphylococcus aureus USA 300 clone as the predominant cause of skin and soft-tissue infections. Ann Intern Med 144:309-17; Klevens, R. M., M. A. Morrison, J. Nadle, S. Petit, K. Gershman, S. Ray, L. H. Harrison, R. Lynfield, G. Dumyati, J. M. Townes, A. S. Craig, E. R. Zell, G. E. Fosheim, L. K. McDougal, R. B. Carey, S. K. Fridkin, and M. I. for the Active Bacterial Core surveillance. 2007. Invasive methicillin-resistant Staphylococcus aureus infections in the United States. JAMA 298: 1763-1771]). 스타필로코커스 아우레우스 감염은 수치에서 증가하고 있을 뿐만 아니라 항생제에 대한 스타필로코커스 아우레우스의 내성도 증가하고 있다. MRSA는 미국에서 병원내 스타필로코커스 아우레우스 감염의 40% 내지 60%를 차지하고, 이들 균주들 중 대다수가 다중약물 내성을 나타낸다. 병원내 감염의 주공급원으로서 악명이 높은 스타필로코커스 아우레우스는 소인성 위험 인자를 갖지 않는 비입원 개체에서 지역사회 획득 감염의 수를 상승시키는 데 있어서 최근에 새로운 역할을 맡았다. 병독성 지역사회 관련된 MRSA(CA-MRSA) 균주는 미국 및 유럽에서 보다 더 널리 퍼지고 있고, 그들의 전염이 전세계적으로 관찰되고 있다(문헌[Baggett, H. C, T. W. Hennessy, K. Rudolph, D. Bruden, A. Reasonover, A. Parkinson, R. Sparks, R. M. Donlan, P. Martinez, K. Mongkolrattanothai, and J. C. Butler. 2004. Community-onset methicillin-resistant Staphylococcus aureus associated with antibiotic use and the cytotoxin Panton-Valentine leukocidin during a furunculosis outbreak in rural Alaska. J Infect Dis 189: 1565-73; Gilbert, M., J. MacDonald, D. Gregson, J. Siushansian, K. Zhang, S. Elsayed, K. Laupland, T. Louie, K. Hope, M. Mulvey, J. Gillespie, D. Nielsen, V. Wheeler, M. Louie, A. Honish, G. Keays, and J. Conly. 2006. Outbreak in Alberta of community-acquired (USA300) methicillin-resistant Staphylococcus aureus in people with a history of drug use, homelessness or incarceration. Canad Med Assoc J 175:149-54; Kazakova, S. V., J. C. Hageman, M. Matava, A. Srinivasan, L. Phelan, B. Garfinkel, T. Boo, S. McAllister, J. Anderson, B. Jensen, D. Dodson, D. Lonsway, L. K. McDougal, M. Arduino, V. J. Fraser, G. Killgore, F. C. Tenover, S. Cody, and D. B. Jernigan. 2005. A clone of methicillin-resistant Staphylococcus aureus among professional football players. N Engl J Med 352:468-75]).

메티실린에 대한 스타필로코커스 아우레우스 내성은 보다 더 흔해지고 있을 뿐만 아니라, 반코마이신에 대한 감소된 감수성을 나타내는 다수의 단리물들도 보고되어 있다. vanA를 보유하고 반코마이신에 대해 완전한 내성을 나타내는 스타필로코커스 아우레우스의 7개 임상 단리물들이 미국에서 단리되었다. 이들 단리물들도 메티실린에 대한 내성을 나타낸다(문헌[Chang, S., D. M. Sievert, J. C. Hageman, M. L. Boulton, F. C. Tenover, F. P. Downes, S. Shah, J. T. Rudrik, G. R. Pupp, W. J. Brown, D. Cardo, and S. K. Fridkin. 2003. Infection with vancomycin-resistant Staphylococcus aureus containing the vanA resistance gene. New Engl J Med 348: 1342-7]). 스타필로코커스 아우레우스가 항생제에 의해 항상 제어될 수 없고 MRSA 단리물이 지역사회에서 점차적으로 널리 퍼지고 있기 때문에, 추가 제어 방법, 예컨대, 백신이 절실히 필요하다.

스타필로코커스 아우레우스 캡슐형 폴리사카리이드는 감염에 관여한다. 표면 관련 부착, 분비된 외부단백질(exoprotein) 및 독소, 및 면역 회피 인자를 포함하는 많은 병독성 인자들이 스타필로코커스 감염의 발병기작에 기여한다(문헌[Foster, T. J. 2005. Immune evasion by staphylococci. Nature Reviews Microbiology 3:948-58]). 많은 침윤성 세균 병원체처럼, 스타필로코커스 아우레우스는 숙주 선천 면역 방어에 의한 제거에 대한 그의 내성을 증강시키는 캡슐형 폴리사카라이드(CP)(도 4)를 생성한다. 스타필로코커스 아우레우스의 대다수의 임상 단리물들은 캡슐화되어 있고, 혈청형 5 및 8 균주가 가장 널리 퍼져있다(문헌[Arbeit, R. D., W. W. Karakawa, W. F. Vann, and J. B. Robbins. 1984. Predominance of two newly described capsular polysaccharide types among clinical isolates of Staphylococcus aureus. Diagn Microbiol Infect Dis 2:85-91]). 5형(CP5) 및 8형(CP8) 캡슐형 폴리사카라이드는 N-아세틸 만노사미뉴론산(ManNAcA), N-아세틸 L-푸코스아민(L-FucNAc) 및 N-아세틸 D-푸코스아민(D-FucNAc)으로 구성된 유사한 트라이사카라이드 반복 단위를 갖는다(문헌[Jones, C. 2005. Revised structures for the capsular polysaccharides from Staphylococcus aureus types 5 and 8, components of novel glycoconjugate vaccines. Carbohydr Res 340: 1097-106]). CP5 및 CP8은 혈청학적으로 상이하고, 이것은 당 사이의 연결 및 O-아세틸화의 부위에서의 차이에 기인할 수 있다(도 4).

종래 연구는 스타필로코커스 아우레우스 캡슐 생성과 시험관내 식균작용 섭취 및 사멸에 대한 내성 사이의 상관관계를 보여주었다(문헌[Fattom, A., R. Schneerson, S. C. Szu, W. F. Vann, J. Shiloach, W. W. Karakawa, and J. B. Robbins. 1990. Synthesis and immunologic properties in mice of vaccines composed of Staphylococcus aureus type 5 and type 8 capsular polysaccharides conjugated to Pseudomonas aeruginosa exotoxin A. Infect Immun 58:2367-74; Thakker, M., J.-S. Park, V. Carey, and J. C. Lee. 1998. Staphylococcus aureus serotype 5 capsular polysaccharide is antiphagocytic and enhances bacterial virulence in a murine bacteremia model. Infect Immun 66:5183-5189; Watts, A., D. Ke, Q. Wang, A. Pillay, A. Nicholson-Weller, and J. C. Lee. 2005. Staphylococcus aureus strains that express serotype 5 or serotype 8 capsular polysaccharides differ in virulence. Infect Immun 73:3502-11]). 인간 호중구는 보체 활성을 갖는 비면역 혈청의 존재 하에서 캡슐-음성 돌연변이체를 식균하는 반면, 캡슐화된 단리물은 최적 옵소닌식균작용(opsonophagocytic) 사멸을 위해 캡슐 특이적 항체 및 보체 둘다를 필요로 한다(문헌[Bhasin, N., A. Albus, F. Michon, P. J. Livolsi, J.-S. Park, and J. C. Lee. 1998. Identification of a gene essential for O-acetylation of the Staphylococcus aureus type 5 capsular polysaccharide. Mol Microbiol 27:9-21; Thakker, M., J.-S. Park, V. Carey, and J. C. Lee. 1998. Staphylococcus aureus serotype 5 capsular polysaccharide is antiphagocytic and enhances bacterial virulence in a murine bacteremia model. Infect Immun 66:5183-5189; Watts, A., D. Ke, Q. Wang, A. Pillay, A. Nicholson-Weller, and J. C. Lee. 2005. Staphylococcus aureus strains that express serotype 5 or serotype 8 capsular polysaccharides differ in virulence. Infect Immun 73:3502-11]). 닐슨(Nilsson) 등은 마우스로부터의 복막 대식세포가 모 균주 레이놀드(Reynold)에 비해 유의하게 더 많은 수의 CP5-음성 돌연변이체를 식균한다고 보고하였다(문헌[Nilsson, I.-M., J. C. Lee, T. Bremell, C. Ryden, and A. Tarkowski. 1997. The role of staphylococcal polysaccharide microcapsule expression in septicemia and septic arthritis. Infect Immun 65:4216-4221]). 일단 식균되면, CP5-양성 균주는 상기 돌연변이체 균주보다 더 높은 정도로 세포내에서 생존하였다. 컨니온(Cunnion) 등은 동질유전자(isogenic) 스타필로코커스 아우레우스 균주의 옵소닌화(opsonization)를 비교하여 CP5-양성 균주가 무캡슐형(acapsular) 돌연변이체보다 42% 더 낮은 정도로 혈청 보체(C')에 결합한다는 것을 입증하였다(문헌[Cunnion, K. M., J. C. Lee, and M. M. Frank. 2001. Capsule production and growth phase influence binding of complement to Staphylococcus aureus. Infect Immun 69:6796-6803]).

스타필로코커스 아우레우스 백신 개발은 통상적으로 표적으로서 캡슐을 수반한다. 스타필로코커스 질환에 대한 보호를 위한 백신 디자인은 인간에서 스타필로코커스 아우레우스 감염의 변화무쌍한 징후 및 임상 복잡성에 의해 복잡해진다. 많은 스타필로코커스 아우레우스 백신 후보물질들이 동물 감염 모델에서 조사되었으나, 2개의 면역화 섭생법만이 III기 임상 시험을 완료하였다고 보고되었다(문헌[Schaffer, A. C, and J. C. Lee. 2008. Vaccination and passive immunisation against Staphylococcus aureus. Int J Antimicrob Agents 32 Suppl 1:S71-8]). 제1 백신은 스타필로코커스 아우레우스의 임상 균주들 중에서 가장 널리 퍼져 있는 2개의 캡슐형 폴리사카라이드(CP)(도 4)를 주성분으로 하는 백신이다. 팻톰(Fattom) 등은 혈청형 5(CP5) 및 혈청형 8(CP8) 폴리사카라이드를 무독성 재조합 슈도모나스 애루기노사(Pseudomonas aeruginosa) 외부단백질(exoprotein) A(rEPA)에 접합시켰다(문헌[Fattom, A.R. Schneerson, S. C. Szu, W. F.Vann, J. Shiloach, W. W. Karakawa and J. B. Robbins. 1990. Synthesis and immunologic properties in mice of vaccines composed of Staphylococcus aureus type 5 and type 8 capsular polysaccharides conjugated to Pseudomonas aeruginosa exotoxin. Infect Immun 58: 2367-74]). 상기 접합체 백신은 마우스 및 인간에서 면역원성을 나타내었고 치사적 및 비치사적 스타필로코커스 감염으로부터 설치류를 보호하는 데 있어서 효능을 보인 옵소닌 활성(opsonic) 항체를 유도하였다(문헌[Fattom, A.R. Schneerson, S. C. Szu, W. F.Vann, J. Shiloach, W. W. Karakawa and J. B. Robbins. 1990. Synthesis and immunologic properties in mice of vaccines composed of Staphylococcus aureus type 5 and type 8 capsular polysaccharides conjugated to Pseudomonas aeruginosa exotoxin. Infect Immun 58: 2367-74; Fattom, A., R. Schneerson, D. C. Watson, W. W. Karakawa, D. Fitzgerald, I. Pastan, X. Li, J. Shiloach, D. A. Bryla, and J. B. Robbins. 1993. Laboratory and clinical evaluation of conjugate vaccines composed of S. aureus type 5 and type 8 capsular polysaccharides bound to Pseudomonas aeruginosa recombinant exoprotein A. Infect Immun 61: 1023-32; Fattom, A. I., J. Sarwar, A. Ortiz, and R. Naso. 1996. A Staphylococcus aureus capsular polysaccharide (CP) vaccine and CP-specific antibodies protect mice against bacterial challenge. Infect Immun 64: 1659-65; Lee, J. C, J. S. Park, S. E. Shepherd, V. Carey, and A. Fattom. 1997. Protective efficacy of antibodies to the Staphylococcus aureus type 5 capsular polysaccharide in a modified model of endocarditis in rats. Infect Immun 65:4146-51]). 수동 면역화 연구는 CP5 특이적 항체 및 CP8 특이적 항체 둘다가 스타필로코커스 아우레우스 유방염의 뮤린 모델에서 감염을 유의하게 감소시킨다는 것을 보여주었다(문헌[Tuchscherr, L. P., F. R. Buzzola, L. P. Alvarez, J. C. Lee, and D. O. Sordelli. 2008. Antibodies to capsular polysaccharide and clumping factor A prevent mastitis and the emergence of unencapsulated and small-colony variants of Staphylococcus aureus in mice. Infect Immun 76:5738-44]). 조합된 CP5 접합체 및 CP8 접합체 백신이 인간에서 안전하고 옵소닌식균작용 활성을 보이는 항체를 이끌어낸다는 것이 밝혀졌다.

스타필로코커스 아우레우스 백신 개발은 표적으로서 표면 단백질도 수반한다. 제2 스타필로코커스 아우레우스 임상 백신 시험은 스타필로코커스 감염을 예방하는 데 있어서 스타필로코커스 부착에 대한 항체의 보호 효능에 근거한 시험이었다. 스타필로코커스 아우레우스 응괴 인자(clumping factor) A는 표면에서 발현되고 스타필로코커스가 피브리노겐에 부착하는 것을 매개하고(문헌[Foster, T. J., and M. Hook. 1998. Surface protein adhesins of Staphylococcus aureus. Trends Microbiol 6:484-8]) 스타필로코커스 아우레우스가 생체물질 표면(문헌[Vaudaux, P. E., P. Francois, R. A. Proctor, D. McDevitt, T. J. Foster, R. M. Albrecht, D. P. Lew, H. Wabers, and S. L. Cooper. 1995. Use of adhesion-defective mutants of Staphylococcus aureus to define the role of specific plasma proteins in promoting bacterial adhesion to canine arteriovenous shunts. Infection & Immunity 63:585-90]), 혈괴 및 손상된 내피 표면(문헌[Moreillon, P., J. M. Entenza, P. Francioli, D. McDevitt, T. J. Foster, P. Francois, and P. Vaudaux. 1995. Role of Staphylococcus aureus coagulase and clumping factor in pathogenesis of experimental endocarditis. Infection & Immunity 63:4738-43])에 부착되는 것을 촉진하는 세포벽 고착 단백질이다. ClfA의 피브리노겐 결합 도메인은 전장 단백질의 영역 A 내에 위치한다(문헌[McDevitt, D., P. Francois, P. Vaudaux, and T. J. Foster. 1995. Identification of the ligand-binding domain of the surface-located fibrinogen receptor (clumping factor) of Staphylococcus aureus. Molecular Microbiology 16:895-907]). ClfA는 카테터에 의해 유도된 스타필로코커스 심내막염의 동물 모델에서 매우 중요한 상호작용인 스타필로코커스 아우레우스와 혈소판의 결합에 있어서 중요한 역할을 수행한다(문헌[Sullam, P. M., A. S. Bayer, W. M. Foss, and A. L. Cheung. 1996. Diminished platelet binding in vitro by Staphylococcus aureus is associated with reduced virulence in a rabbit model of infective endocarditis. Infection & Immunity 64:4915-21]).

난라(Nanra) 등은 ClfA에 대한 항체가 시험관내에서 스타필로코커스 아우레우스의 옵소닌식균작용 사멸을 유도하였다고 보고하였다(문헌[Nanra, J. S., Y. Timofeyeva, S. M. Buitrago, B. R. Sellman, D. A. Dilts, P. Fink, L. Nunez, M. Hagen, Y. V. Matsuka, T. Mininni, D. Zhu, V. Pavliak, B. A. Green, K. U. Jansen, and A. S. Anderson. 2009. Heterogeneous in vivo expression of clumping factor A and capsular polysaccharide by Staphylococcus aureus: Implications for vaccine design. Vaccine 27:3276-80]). 더욱이, ClfA의 결합 영역 A의 재조합 형태로 면역화된 마우스는 스타필로코커스 아우레우스에 의해 유도된 관절염 및 치사율의 감소를 보였다(문헌[Josefsson, E., O. Hartford, L. O'Brien, J. M. Patti, and T. Foster. 2001. Protection against experimental Staphylococcus aureus arthritis by vaccination with clumping factor A, a novel virulence determinant. Journal of Infectious Diseases 184: 1572-80]). 수동 면역화 실험은 ClfA에 대한 특이성을 나타내는 상승된 수준의 항체를 함유하는 인간 다중클론 면역글로불린 제제를 제공받은 토끼에서 수행되었다(문헌[Vernachio, J., A. S. Bayer, T. Le, Y. L. Chai, B. Prater, A. Schneider, B. Ames, P. Syribeys, J. Robbins, J. M. Patti, J. Vernachio, A. S. Bayer, T. Le, Y.-L. Chai, B. Prater, A. Schneider, B. Ames, P. Syribeys, J. Robbins, and J. M. Patti. 2003. Anti-clumping factor A immunoglobulin reduces the duration of methicillin-resistant Staphylococcus aureus bacteremia in an experimental model of infective endocarditis. Antimicrobial Agents & Chemotherapy 47:3400-6]). 카테터에 의해 유도된 스타필로코커스 아우레우스 심내막염을 갖는 토끼의 혈액으로부터의 세균 제거는 반코마이신 치료만을 이용하였을 때보다 조합 요법을 이용하였을 때 더 우수하였다. 추가로, ClfA 특이적 항체의 수동 전달은 스타필로코커스 아우레우스 유방염의 뮤린 모델에서 감염을 유의하게 감소시켰다(문헌[Tuchscherr, L. P., F. R. Buzzola, L. P. Alvarez, J. C. Lee, and D. O. Sordelli. 2008. Antibodies to capsular polysaccharide and clumping factor A prevent mastitis and the emergence of unencapsulated and small-colony variants of Staphylococcus aureus in mice. Infect Immun 76: 5738-44]).

III기 임상 시험은 보고된 바에 의하면 2000년에 낮은 출생 체중 미숙아에서 후발성(late-onset) 패혈증으로부터 보호하기 위해 디자인되었다. 유아는 ClfA 및 SdrG에 대한 상승된 항체 역가를 갖는, 공여자로부터 풀링된 인간 면역글로불린 제제인 베로네이트(Veronate)의 최대 4회 투여를 제공받았다. 유사한 II기 임상 시험으로부터 예상된 결과에도 불구하고, 이 예방적 요법은 신생아에서 스타필로코커스 감염의 빈도를 감소시키지 못하였다(문헌[DeJonge, M., D. Burchfield, B. Bloom, M. Duenas, W. Walker, M. Polak, E. Jung, D. Millard, R. Schelonka, F. Eyal, A. Morris, B. Kapik, D. Roberson, K. Kesler, J. Patti, and S. Hetherington. 2007. Clinical trial of safety and efficacy of INH-A21 for the prevention of nosocomial staphylococcal bloodstream infection in premature infants. J Pediatr 151:260-5]).

원핵 유기체에서 단백질 글리코실화가 일어나지만 천연적으로 거의 일어나지 않는다고 밝혀져 있다. 다른 한편으로, N-연결된 단백질 글리코실화는 진핵 유기체의 소포체에서 일어나는 필수적인 보존된 과정이다. 상기 글리코실화는 분비 단백질 및 막 단백질의 단백질 폴딩, 올리고머화, 안정성, 질 조절, 분류 및 수송에 있어서 중요하다(문헌[Helenius, A., and Aebi, M. (2004). Roles of N-linked glycans in the endoplasmic reticulum. Annu. Rev. Biochem. 73, 1019-1049]). 단백질 글리코실화는 단백질의 항원성, 안정성 및 반감기에 매우 유리한 영향을 미친다. 또한, 글리코실화는 크로마토그래피, 예를 들면, 단백질의 글리코실화된 부분(moiety)과 상호작용하는 고체상에 결합된 렉틴 리간드를 사용하는 친화성 크로마토그래피에 의한 단백질의 정제를 보조할 수 있다. 따라서, 글리코실화는 생물학적으로 및 약학적으로 유용한 글리코실화 패턴을 제공하기 위해 진핵세포에서 많은 글리코실화된 단백질을 재조합적으로 제조하기 위한 확립된 관행이다.

접합체 백신은 세균 감염으로부터 보호하는 데 있어서 성공적으로 사용되고 있다. 폴리사카라이드가 T 세포 독립적 항원이기 때문에, 항원성 폴리사카라이드와 단백질 담체의 접합이 보호 기억 반응을 위해 요구된다. 폴리사카라이드는 폴리사카라이드 및 단백질 담체 내의 활성화 반응성 기를 사용하는 상이한 화학적 방법들에 의해 단백질 담체에 접합되었다(문헌[Qian, F., Y. Wu, O. Muratova, H. Zhou, G. Dobrescu, P. Duggan, L. Lynn, G. Song, Y. Zhang, K. Reiter, N. MacDonald, D. L. Narum, C. A. Long, L. H. Miller, A. Saul, and G. E. Mullen. 2007. Conjugating recombinant proteins to Pseudomonas aeruginosa ExoProtein A: a strategy for enhancing immunogenicity of malaria vaccine candidates. Vaccine 25:3923-3933; Pawlowski, A., G. Kallenius, and S. B. Svenson. 2000. Preparation of pneumococcal capsular polysaccharide-protein conjugates vaccines utilizing new fragmentation and conjugation technologies. Vaccine 18: 1873-1885; Robbins, J. B., J. Kubler-Kielb, E. Vinogradov, C. Mocca, V. Pozsgay, J. Shiloach, and R. Schneerson. 2009. Synthesis, characterization, and immunogenicity in mice of Shigella sonnei O-specific oligosaccharide-core-protein conjugates. Proc Natl Acad Sci USA 106:7974-7978]).

접합체 백신은 소아를 세균 감염으로부터 보호하기 위해 소아에게 투여될 수 있고 성인에게 오래 지속되는 면역 반응을 제공할 수 있다. 본 발명의 구축물은 동물에서 IgG 반응을 발생시키는 것으로 발견되었다. 폴리사카라이드(즉, 당 잔기)는 당 특이적 단기 면역 반응을 유발하는 것으로 생각된다. 실제로, 인간 면역 시스템은 세균의 특정 폴리사카라이드 표면 구조체, 예컨대, O-항원 및 캡슐형 폴리사카라이드에 대한 강한 반응을 발생시킨다. 그러나, 폴리사카라이드에 대한 면역 반응이 IgM 의존적이기 때문에, 면역 시스템은 기억을 발생시키지 못한다. 그러나, 폴리사카라이드를 운반하는 단백질 담체는 T 세포 의존적이고 면역 시스템이 기억을 발생시키기 때문에 오래 지속되는 보호를 제공하는 IgG 반응을 유발한다. 이러한 이유로, 백신을 개발함에 있어서 백신을 단백질 담체-폴리사카라이드 접합체로서 개발하는 것이 유리하다.

원핵 유기체는 글리코실화된 단백질을 거의 생성하지 못한다. 그러나, 식품 유래의 병원체인 캄필로박터 제주니(Campylobacter jejuni)라는 세균은 그의 단백질을 글리코실화할 수 있다는 것이 입증되었다(문헌[Szymanski, et al. (1999). Evidence for a system of general protein glycosylation in Campylobacter jejuni. Mol. Microbiol. 32, 1022-1030]). 글리코실화를 위해 요구되는 수단은 pgl 좌위에 밀집되어 있는 12개의 유전자에 의해 코딩된다. 글리코실화의 파괴는 캄필로박터 제주니의 침윤 및 발병기작에 영향을 미치지만 대다수의 진핵 유기체에서만큼 치명적이지는 않다(문헌[Burda P. and M. Aebi, (1999). The dolichol pathway of N-linked glycosylation. Biochim Biophys Acta 1426(2):239-57]). pgl 좌위는 캄필로박터에서 N-연결된 단백질 글리코실화를 담당한다는 사실, 및 에스케리치아 콜라이(Escherichia coli)에서 pgl 좌위 및 수용체 당단백질을 동시에 재조합적으로 발현시킴으로써 캄필로박터 제주니 단백질의 N-글리코실화를 재구성할 수 있다는 사실이 밝혀져 있다(문헌[Wacker, M., D. Linton, P. G. Hitchen, M. Nita-Lazar, S. M. Haslam, S. J. North, M. Panico, H. R. Morris, A. Dell, B. W. Wren, and M. Aebi. 2002. N-linked glycosylation in C. jejuni and its functional transfer into E. coli. Science 298:1790-3]).

캄필로박터의 N-연결된 단백질 글리코실화 생합성 경로는 세균의 폴리사카라이드 생합성 경로와 상당히 유사하다(문헌[Bugg, T. D., and P. E. Brandish. 1994. From peptidoglycan to glycoproteins: common features of lipid-linked oligosaccharide biosynthesis. FEMS Microbiol Lett 119:255-62]). 세균의 항원성 폴리사카라이드 및 캄필로박터의 올리고사카라이드 둘다가 담체 지질인 운데카프레닐 피로포스페이트(UndPP) 상에서 합성된다는 지식에 근거하여, 상기 2개의 경로를 에스케리치아 콜라이에서 조합하였다(문헌[Feldman, M. F., M. Wacker, M. Hernandez, P. G. Hitchen, C. L. Marolda, M. Kowarik, H. R. Morris, A. Dell, M. A. Valvano, and M. Aebi. 2005. Engineering N-linked protein glycosylation with diverse O antigen Hpopolysaccharide structures in Escherichia coli. Proc Natl Acad Sci USA 102:3016-21]). PglB는 지질-연결된 당 기질에 대한 엄격한 특이성을 나타내지 않는다는 것이 입증되었다. UndPP 상에서 조립된 항원성 폴리사카라이드는 원형질막주위공간(periplasm) 내에서 PglB에 의해 포획되어 단백질 담체로 전달된다(문헌[Feldman, M. F., M. Wacker, M. Hernandez, P. G. Hitchen, C. L. Marolda, M. Kowarik, H. R. Morris, A. Dell, M. A. Valvano, and M. Aebi. 2005. Engineering N-linked protein glycosylation with diverse O antigen Hpopolysaccharide structures in Escherichia coli. Proc Natl Acad Sci USA 102:3016-21; Wacker, M., M. F. Feldman, N. Callewaert, M. Kowarik, B. R. Clarke, N. L. Pohl, M. Hernandez, E. D. Vines, M. A. Valvano, C. Whitfield, and M. Aebi. 2006. Substrate specificity of bacterial oligosaccharyltransferase (OTase) suggests a common transfer mechanism for the bacterial and eukaryotic systems. Proc Natl Acad Sci USA 103:7088-93]). 캄필로박터 PglB는 UndPP-연결된 올리고사카라이드가 환원 말단에서 N-아세틸화된 헥소스아민을 함유하는 경우 다양한 다수의 UndPP-연결된 올리고사카라이드를 전달하여, N-글리코사이드 연결을 통한 항원성 폴리사카라이드와 선택된 단백질의 접합을 가능하게 한다는 것이 밝혀졌다(Wacker et al. (2006)). 이것은 생체내에서 접합된 백신의 제조를 위한 이론적 근거를 제공할 수 있지만, 이 이론적 가능성을 실현하기 위해서는 많은 어려운 과제가 극복되어야 한다.

캄필로박터 제주니가 일반적인 N-연결된 단백질 글리코실화 시스템을 함유한다는 이 종래 발견에 근거하여, 캄필로박터 제주니의 N-연결된 단백질 글리코실화 기구를 포함하도록 에스케리치아 콜라이를 변형시켰다. 이 방식으로, 캄필로박터 제주니에 천연적으로 존재하는 단백질의 글리코실화된 형태가 에스케리치아 콜라이 숙주에서 생성되었다. 이 과정이 백신 생성물로서 사용될 글리코실화된 단백질들을 변형된 에스케리치아 콜라이 숙주 내의 상이한 복제기점들로부터 생성하는 데에 이용될 수 있다는 것도 밝혀졌다. 에스케리치아 콜라이에 의한 생성은 다량의 유용한 백신을 생성할 수 있는 이러한 변형된 에스케리치아 콜라이 숙주의 대규모 배양물이 생성될 수 있기 때문에 유리하다.

이 과정을 이용하여 스타필로코커스 아우레우스에 대한 백신 생성물로서 사용될 글리코실화된 단백질을 변형된 에스케리치아 콜라이 숙주에서 생성하는 것은 극복될 수 없는 것으로 인식된 문제점에 직면한다. 첫째, 에스케리치아 콜라이는 그람-음성 세균이고, 이의 사카라이드 생합성 경로는 중합 단계 후 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스의 사카라이드 생합성 경로와 매우 상이하다. 또한, 종래 기술과 직접적으로 일치하는 스타필로코커스 아우레우스 캡슐형 폴리사카라이드를 생성하도록 에스케리치아 콜라이를 유전적으로 개조하는 것은 실행불가능할 것이다. 예를 들면, 스타필로코커스 아우레우스는 그람-양성 유기체이고, 이의 캡슐 합성은 세포 외피 구조 및 세포 외피의 구축과 관련되어 있다. 캡슐 생성 생합성 기구는 구체적으로 캡슐형 폴리사카라이드(PS)를 세포 및 이의 세포벽의 외부 상에 배열하도록 디자인된다. 에스케리치아 콜라이의 세포 외피가 기본적으로 상이한 방식으로 구축되기 때문에 변형된 에스케리치아 콜라이 유기체에서 이 캡슐을 생성하는 것은 적어도 고도로 자원 집약적일 것이라는 이유로 극히 어려울 것이다. PS 전구체로부터 캡슐을 조립하기 위한 생합성 기구는 상이한 환경으로 인해 작용하지 않을 것이다. 스타필로코커스 아우레우스 캡슐은 단일막을 통과해야 하는 반면, 에스케리치아 콜라이에서는 진정한 캡슐의 최종 위치에 도달하기 위해 횡단되어야 하는 추가 막이 존재한다. 더욱이, 스타필로코커스 아우레우스 캡슐이 매우 크기 때문에, 에스케리치아 콜라이의 2개의 막 사이에서 스타필로코커스 아우레우스 캡슐과 같은 큰 캡슐을 제조하는 것은 실현불가능하다고 생각되었다.

상이한 유기체들로부터의 효소들이 함께 작용할 수 있는 원리는 이전에 밝혀졌다(예를 들면, 문헌[Rubires, X., F. Saigi, N. Pique, N. Climent, S. Merino, S. Alberti, J. M. Tomas and M. Regue. 1997. A gene (wbbL) from Serratia marcescens N28b (04) complements the rfb-50 mutation of Escherichia coli K-12 derivatives. J. Bacteriol 179(23): 7581-6]). 그러나, 그람-양성 유기체로부터의 변형된 LPS 폴리사카라이드가 그람-음성 유기체에서 이전에 생성된 적이 전혀 없다고 생각된다.

본 발명은 신규 스타필로코커스 아우레우스 생체접합체를 제공한다.

본 발명자들은 본원에서 놀랍게도 신규 스타필로코커스 아우레우스 생체접합체 백신을 발견하였다. 이 신규 스타필로코커스 아우레우스 백신은 하나의 그람 균주를 갖는 원핵생물의 올리고사카라이드 또는 폴리사카라이드가 상이한 그람 균주를 갖는 숙주 원핵생물에서 단백질을 글리코실화할 수 있다는 예측되지 않는 신규 발견에 근거한다. 본 발명의 다른 예측되지 않는 신규 특징은 이하에 기재된 실시양태들을 포함하나 이들로 제한되지 않는다.

보다 일반적으로, 본 발명은 삽입된 핵산 공통 서열을 포함하는 단백질 담체; 상기 공통 서열에 연결된, 세균, 예컨대, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드; 및 선택적으로 보조제를 포함하는 생체접합체 백신, 예컨대, 그람-양성 백신에 관한 것이다. 추가로, 본 발명은 변형된 캡슐형 폴리사카라이드 또는 LPS의 생성을 포함하는 변형된 LPS 생합성 경로를 이용하는 글리코실화 시스템에 의해 제조된 그람-양성 세균 백신, 예컨대, 스타필로코커스 아우레우스 백신 또는 다른 세균 백신에 관한 것이다.

추가로, 본 발명은 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 포함하는 단백질; 및 상기 공통 서열에 연결된, 세균, 예컨대, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 포함하는 재조합 N-글리코실화된 단백질에 관한 것이다.

나아가, 본 발명은 N-글리코사이드 연결에 의해 연결된 스타필로코커스 아우레우스의 변형된 캡슐형 폴리사카라이드와 동일한 유기체로부터의 단백질 항원의 조합물에 관한 것이다.

추가로, 본 발명은 제1 원핵 종, 예컨대, 그람-양성 종의 하나 이상의 글리코실트랜스퍼라제(glycosyltransferase)를 코딩하는 뉴클레오타이드 서열; 상이한 원핵 종, 예컨대, 그람-음성 종의 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에 관한 것이다. 또한, 본 발명은 그람-양성 원핵 유기체에만 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 도입된 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 개조된 숙주 원핵 유기체에 관한 것이다.

나아가, 본 발명은 제1 원핵 종, 예컨대, 그람-양성 종, 예를 들면, 스타필로코커스 아우레우스의 하나 이상의 글리코실트랜스퍼라제; 제2 원핵 종의 하나 이상의 글리코실트랜스퍼라제; 단백질; 및 OTase를 코딩하는 핵산을 포함하는 숙주 원핵 유기체에서 생체접합체 백신을 제조하는 방법에 관한 것이다. 추가로, 본 발명은 WaaL에 의해 지질 A 코어로 전달될 수 있고/있거나 OTase에 의해 선택된 담체에 연결될 수 있는 변형된 캡슐형 폴리사카라이드를 그람-음성 세균에서 생성함으로써 생체접합체 백신을 제조하는 것에 관한 것이다.

추가로, 본 발명은 제1 원핵 유기체에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하고 상기 제1 원핵 유기체와 상이한 제2 원핵 유기체에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에서 글리코실화된 단백질을 제조하는 방법에 관한 것이다. 또한, 본 발명은 상이한 유기체들로부터의 상이한 글리코실트랜스퍼라제들의 조합물에 의해 합성된, 그람-양성 세균의 캡슐형 폴리사카라이드로 N-글리코실화된 단백질을 제조하는 것에 관한 것이다. 나아가, 본 발명은 그람-양성 원핵 유기체에만 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 도입된 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에서 글리코실화된 단백질을 제조하는 것에 관한 것이다.

나아가, 본 발명은 플라스미드, 예컨대, 서열번호 2, 서열번호 3 및 서열번호 4 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 또한, 본 발명은 서열번호 6, 서열번호 7, 서열번호 8 및 서열번호 16 중 하나 이상의 서열을 포함하는 플라스미드를 포함한다. 또한, 본 발명은 서열번호 10, 서열번호 11 및 서열번호 12 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 나아가, 본 발명은 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21 및 서열번호 27 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다.

추가로, 본 발명은 형질전환된 세균 세포, 예를 들면, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21 및 서열번호 27 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포에 관한 것이다. 추가로, 본 발명은 서열번호 5, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15 및 서열번호 16 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포에 관한 것이다.

또한, 본 발명은 포유동물에서 그람-양성 세균 및 다른 세균에 의해 야기된 감염에 대한 면역 반응을 유도하는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 포함하는 단백질; 및 상기 공통 서열에 연결된 하나 이상의 올리고사카라이드 또는 폴리사카라이드로서, 그람-양성 세균으로부터의 또 다른 하나 이상의 올리고사카라이드 또는 폴리사카라이드와 동일하거나 상이한 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 포함하는 유효량의 약학 조성물을 상기 포유동물에게 투여하는 단계를 포함한다.

또 다른 양태에서, 본 발명은 표적 폴리사카라이드를 사용하여 단백질을 전체적으로 또는 부분적으로 글리코실화하는 데에 사용되는 상기 표적 폴리사카라이드를 확인하는 방법을 특징으로 한다. 상기 표적 폴리사카라이드를 포함하는 상기 글리코실화된 단백질은 예를 들면, 백신 조성물에서 사용될 수 있다. 한 실시양태에서, 표적 폴리사카라이드를 확인하는 방법은 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스를 표적으로서 확인하는 단계; 3개 이상의 단량체를 포함하는, 상기 그람-양성 세균에 의해 생성된 폴리사카라이드의 제1 반복 단위를 확인하는 단계; 및 상기 제1 반복 단위와 동일한 단량체를 2개 포함하는 제2 반복 단위를 포함하는, 그람-음성 종의 세균에 의해 생성된 폴리사카라이드를 확인하는 단계를 포함한다.

또한, 본 발명은 제1 세균 종, 예컨대, 그람-음성 종의 세균을 변형시키는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 3개의 단량체를 포함하는, 그람-양성 종, 예컨대, 스타필로코커스 아우레우스의 폴리사카라이드의 제1 반복 단위를 확인하는 단계; 제1 반복 단위와 동일한 단량체를 2개 포함하는 또 다른 반복 단위를 포함하는, 제2 그람-음성 종의 세균에 의해 생성된 폴리사카라이드를 확인하는 단계; a) 상기 제2 반복 단위, 및 b) 상기 제2 반복 단위에 존재하지 않는 상기 제1 반복 단위의 단량체를 포함하는 트라이사카라이드를 조립하는 글리코실트랜스퍼라제를 코딩하는 하나 이상의 뉴클레오타이드 서열을 상기 제1 그람-음성 종의 세균 내로 삽입하는 단계; 단백질을 코딩하는 뉴클레오타이드 서열을 삽입하는 단계; 및 OTase를 코딩하는 뉴클레오타이드 서열을 삽입하는 단계를 포함한다.

본 발명자들은 본원에서 놀랍게도 신규 스타필로코커스 아우레우스 생체접합체 백신을 발견하였다. 이 신규 스타필로코커스 아우레우스 백신은 하나의 그람 균주를 갖는 원핵생물의 올리고사카라이드 또는 폴리사카라이드가 상이한 그람 균주를 갖는 숙주 원핵생물에서 단백질을 글리코실화할 수 있다는 예측되지 않는 신규 발견에 근거한다.

도 1은 슈도모나스 애루기노사 O11 O-항원 생합성에 의해 예시된 wzx/wzy 의존성 O-항원 생합성에 대한 경로를 보여준다. 제시된 반응을 담당하는 것으로 추정되는, 유리딘 다이포스페이트(UDP) 및 유리딘 모노포스페이트(UMP)를 비롯한 단백질 명칭이 화살표 위에 또는 아래에 표시되어 있다.
도 2는 에스케리치아 콜라이에서의 개조된 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 혈청형 5(CP5) 생합성에 대한 제안된 경로를 보여준다. 슈도모나스 애루기노사 O11의 O-항원 클러스터(cluster)에 의해 제공된 효소는 도 1에서 표시된 바와 같이 표시된다. 스타필로코커스 아우레우스 CP5로부터의 효소는 Cap5로서 표시된다(도 6과 비교). WecB 및 WecC는 UDP-ManNAcA의 생성에 필요한 에스케리치아 콜라이 효소들이다. 다른 표시된 단백질 및 효소는 유리딘 다이포스페이트(UDP), 유리딘 모노포스페이트(UMP) 및 보조효소 A(CoA)를 포함한다.
도 3은 개조된 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 혈청형 8(CP8) 생합성에 대한 제안된 경로를 보여준다. 유전자 명칭은 화살표로 표시되어 있다(도 1, 2 및 6과 비교)(UDP: 유리딘 다이포스페이트, UMP: 유리딘 모노포스페이트, CoA: 보조효소 A).
도 4는 캡슐형 스타필로코커스 아우레우스 및 슈도모나스 애루기노사 O-항원 반복 단위(RU) 구조체의 구조적 중첩을 보여준다.
도 5a는 스타필로코커스 아우레우스 효소에 의한 불완전한 O11 O-항원 RU(반복 단위)의 연장의 SDS-PAGE 분석을 보여준다.
도 5b는 스타필로코커스 아우레우스 효소에 의한 불완전한 O11 O-항원 RU의 연장의 면역검출을 보여준다.
도 6은 본 발명의 한 실시양태에서 키메라 O11/CP5 및 O11/CP8 유전자 클러스터를 구축하는 방법을 보여준다.
도 7a는 에스케리치아 콜라이 지질 추출물에서 검출된 본 발명의 한 실시양태의 중합된 CP5 LPS를 보여준다.
도 7b는 에스케리치아 콜라이 지질 추출물에서 검출된 본 발명의 한 실시양태의 중합된 CP8 LPS를 보여준다.
도 8a는 W3110 Δ wecA 세포에서 키메라 클러스터를 함유하는 pLAFR 플라스미드 상의 항생제 내성 유전자에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석 및 은 염색으로 확인한 결과를 보여준다.
도 8b는 W3110 Δ wecA 세포에서 키메라 클러스터를 함유하는 pLAFR 플라스미드 상의 항생제 내성 유전자에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석, 은 염색 및 면역검출로 확인한 결과를 보여준다.
도 9는 W3110 Δ wecA 세포에서 키메라 클러스터 앞에 있는 프로모터에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석 및 면역검출로 확인한 결과를 보여준다.
도 10a는 키메라 CP5 클러스터(서열번호 2)를 사용하여 제조한 본 발명의 CP5의 재조합 RU의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 10b는 cap8I 폴리머라제(polymerase)를 결여하는 키메라 CP8 클러스터를 사용하여 제조한 본 발명의 CP8의 재조합 RU의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 11a는 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10a에서 관찰된 37분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11b는 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10a에서 관찰된 40분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11c는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 32분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11d는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 38분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11e는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 45분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11f는 글리칸 구조 최적화의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 11g(도 11ga을 포함함)는 본 발명의 한 실시양태에서 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 전체 CP5 글리칸 레퍼토리의 HPLC 분석 결과를 제시한다.
도 11h는 본 발명의 한 실시양태에서 탈아세틸화된 CP5 글리칸 및 RU 균질성의 HPLC 분석 결과를 제시한다.
도 11i는 본 발명의 한 실시양태에서 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 CP8 글리칸 레퍼토리의 HPLC 분석 결과를 제공한다.
도 11j는 본 발명의 한 실시양태에서 CP8 글리칸의 탈아세틸화 및 RU 균질성의 HPLC 결과를 보여준다.
도 11k는 본 발명의 한 실시양태에서 wzzO7을 CP8 키메라 클러스터와 함께 동시발현시킴으로써 유도된 RU 중합의 감소 및 LLO의 증가를 보여주는 HPLC 결과를 제시한다.
도 12는 본 발명의 실시양태에서 스타필로코커스 아우레우스 플립파제(plippase) 유전자 cap5K(서열번호 2 및 서열번호 3)를 갖거나 갖지 않는 세포로부터 Ni² ⁺ 친화성 크로마토그래피에 의해 정제된 EPA-CP5 생체접합체의 SDS-PAGE 분석 결과를 보여준다.
도 13a는 Ni² ⁺ 친화성 크로마토그래피 및 음이온 교환 크로마토그래피에 의해 정제된 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체의 분석을 제시한다.
도 13b는 본 발명의 한 실시양태에 따라 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DNNNSTPTVISHR 내의 글리코실화 부위에 대해 실측된 M/Z 질량(m/z=2088([M+H]⁺))을 보여준다. 삽입도는 상기 펩티드에 부착된 RU 구조체를 보여준다.
도 13c는 본 발명의 한 실시양태에 따라 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DQNR 내의 글리코실화 부위에 대해 실측된 M/Z 질량(m/z=1165([M+H]⁺))을 보여준다. 삽입도는 상기 펩티드에 부착된 RU 구조체를 보여준다.
도 13d는 Ni² ⁺ 친화성 크로마토그래피 및 음이온 교환 크로마토그래피에 의해 정제된 본 발명의 한 실시양태에 따른 CP8-EPA 생체접합체의 분석을 보여준다.
도 13e는 본 발명의 한 실시양태에 따른 당접합체 생성을 위해 3개의 플라스미드(좌측 레인) 또는 2개의 플라스미드(우측 레인)를 함유하는 세포로부터 정제된 CP5-EPA 생체접합체를 보여준다.
도 13f는 Ni² ⁺ 친화성 크로마토그래피에 의해 정제된 본 발명의 한 실시양태 따른 CP8-EPA 생체접합체의 분석을 보여준다.
도 14a는 도 13a로부터의 3 플라스미드 시스템을 사용하여 생성한 본 발명의 한 실시양태의 정제된 CP5-EPA 생체접합체의 고질량 MALDI 분석을 제시한다.
도 14b는 도 13a로부터의 3 플라스미드 시스템을 사용하여 생성한 본 발명의 한 실시양태의 CP5-EPA 생체접합체의 크기 배제 크로마토그래피에 의한 특징규명을 보여준다.
도 14c는 본 발명의 한 실시양태에 따른 정제된 CP5-Hla 생체접합체의 SDS-PAGE 분석 및 면역검출을 보여준다.
도 14d는 본 발명의 한 실시양태에 따른 정제된 CP5-AcrA 생체접합체의 결과를 보여준다.
도 14e는 본 발명의 한 실시양태에 따른 정제된 CP5-ClfA 생체접합체의 결과를 보여준다.
도 15a는 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체에 의해 마우스에서 발생된 특이적 항-CP5 항체를 보여준다.
도 15b는 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체에 의해 토끼에서 발생된 특이적 항-CP5 항체를 보여준다.
도 16a는 본 발명의 한 실시양태에 따른 CP5-EPA를 사용한 토끼의 면역화에 의해 발생된 CP5 특이적 항체의 (스타필로코커스 아우레우스 레이놀드에 대한) 시험관내 옵소닌식균작용 활성을 보여준다.
도 16b는 본 발명의 한 실시양태에 따른 CP5-EPA를 사용한 토끼의 면역화에 의해 발생된 CP5 특이적 항체의 (스타필로코커스 아우레우스 USA100에 대한) 시험관내 옵소닌식균작용 활성을 보여준다.
도 17a는 약 3.6.10⁷ CFU의 스타필로코커스 아우레우스 균주 레이놀드에 의해 복강내로 공격받은(challenged) 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 17b는 2 mg의 CP5-EPA IgG를 주입받은 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 17c는 300 ㎍의 CP5-EPA IgG를 주입받은 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 18은 상이한 투여량의 CP5-EPA를 본 발명의 한 실시양태에 따른 백신으로서 사용하고 공격을 위해 마우스 세균혈증 모델을 사용한 능동 면역화 분석의 결과를 보여준다.

본 발명의 한 실시양태에 따라, 그람-양성 유기체로부터의 LPS 폴리사카라이드는 그람-음성 유기체에서 생성되는 것으로 밝혀졌다. 본 발명자들은 이것이 종래 기술로부터의 중요하고 유의한 발전을 나타내는 새로운 결과라고 생각한다.

본 발명의 범위 내에 있는 핵산은 서열목록에 함유된 본 발명의 핵산에 의해 예시된다. 숙주 세포에서 발현될 수 있는, 면역원성 성분을 코딩하는 임의의 핵산 또는 이의 일부가 본 발명에서 사용될 수 있다. 하기 서열 설명은 본원 전체에서 사용된 일부 용어들의 이해를 돕기 위해 제공되고 본 발명의 실시양태를 제한하는 것으로 해석되어서는 안 된다.

서열번호 1은 (부분적으로 유전자은행 수납번호 AF236052로부터 유래된) 상보적 가닥인, 슈도모나스 애루기노사 PAO103으로부터의 O11 O-항원 서열을 EcoRI 부위 내에 함유하는 pLAFR1(유전자은행 수납번호 AY532632.1)을 나타낸다.

서열번호 2는 상동 재조합에 의해 wbjA-wzy를 치환시키는 cap5HIJ 유전자를 갖는 pLAFR1-O11에 상응하는, CP5 키메라 클러스터를 함유하는 pLAFR1을 나타낸다. 삽입된 서열은 상동 재조합된 클론의 선택을 위한 cat 카세트도 함유한다.

서열번호 3은 상동 재조합에 의해 wbjA-wzy를 치환시키는 cap5HIJ 유전자 및 cap5J와 cat 카세트 사이에 클로닝된 cap5K를 갖는 pLAFR1-O11에 상응하는, cap5K 플립파제 유전자를 갖는 CP5 키메라 클러스터를 함유하는 pLAFR1을 나타낸다.

서열번호 4는 wbjA-wzy를 치환시키는 cap8KHIJ 유전자를 갖는 pLAFR1-O11에 상응하는, 플립파제 유전자를 포함하는 CP8 키메라 클러스터를 함유하는 pLAFR1을 나타낸다. 삽입된 서열은 상동 재조합된 클론의 선택을 위한 cat 카세트도 함유한다.

서열번호 5는 H1a-H35L 생성을 위한 발현 플라스미드를 나타낸다. H1a-H35L을 코딩하는 ORF는 pEC415 내의 NdeI/SacI 내로 클로닝된다.

서열번호 6은 H1a-H35L 부위 202 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 202 주위에 있는 당부위(glycosite) 및 C-말단 His 태그를 코딩한다. 이 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.

서열번호 7은 H1a-H35L 부위 238 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 238 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.

서열번호 8은 H1a-H35L 부위 272 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 272 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.

서열번호 9는 ClfA 생성을 위한 발현 플라스미드를 나타낸다. 상기 유전자는 화학적으로 합성되었고 pEC415 발현 벡터 내의 NdeI/SacI 내로 클로닝되었다.

서열번호 10은 ClfA 부위 290 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 290 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.

서열번호 11은 ClfA 부위 327 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 327 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.

서열번호 12는 ClfA 부위 532 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 532 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.

서열번호 13은 신호 서열을 갖고 위치 260 및 402에서 2개의 글리코실화 부위를 갖는, 재조합 유전적으로 해독된 EPA의 아미노산 서열을 나타낸다.

서열번호 14는 신호 서열을 갖지 않고 위치 241 및 384에서 2개의 글리코실화 부위를 갖지 않는, 재조합 유전적으로 해독된 EPA의 아미노산 서열을 나타낸다.

서열번호 15는 NheI/SalI을 통해 pEC415 내로 클로닝된, AcrA를 코딩하는 ORF를 나타낸다.

서열번호 16은 H1a-H35L 부위 130 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 130 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 내의 NheI/SalI 내로 클로닝된다.

서열번호 17은 cap5K 플립파제를 갖고, 이 플립파제 다음에 에스케리치아 콜라이 혈청형 O121의 galF와 wbqA 사이의 유전자간 DNA 서열 및 pglB ORF로 구성된 pglB 발현 카세트를 갖는 CP5 생성 유전자 클러스터를 나타낸다. 삽입체는 pLAFR1의 EcoRI 부위 내로 클로닝된다.

서열번호 18은 cap8K 플립파제를 갖고, 이 플립파제 다음에 에스케리치아 콜라이 혈청형 O121의 galF와 wbqA 사이의 유전자간 DNA 서열 및 pglB ORF로 구성된 pglB 발현 카세트를 갖는 CP8 생성 유전자 클러스터를 나타낸다. 삽입체는 pLAFR1의 EcoRI 부위 내로 클로닝된다.

서열번호 19는 cap8K 플립파제를 갖고, 이 플립파제 다음에 에스케리치아 콜라이 혈청형 O121의 galF와 wbqA 사이의 유전자간 DNA 서열 및 pglB ORF로 구성된 pglB 발현 카세트를 갖는 CP8 생성 유전자 클러스터를 나타내고, 이 서열은 SfaAI/BspTI 내로, 즉 슈도모나스 애루기노사 O11의 wzx와 cap8H 사이에 클로닝된 에스케리치아 콜라이 혈청형 O7의 wzz에 대한 유전자를 추가로 갖는다. 삽입체는 pLAFR1의 EcoRI 부위 내로 클로닝된다.

서열번호 20은 EPA 및 wzz에 대한 발현 플라스미드를 나타낸다. 골격(backbone)은 내성 카세트가 치환되어 있는(클로람페니콜 대신에 가나마이신) pACT3이다.

서열번호 21은 pext21 Eco/Sal 내로 클로닝된 에스케리치아 콜라이 혈청형 O7의 wzz를 나타낸다.

서열번호 22는 실시예에 기재된 펩티드 서열을 나타낸다.

서열번호 23은 실시예에 기재된 펩티드 서열을 나타낸다.

서열번호 24는 단백질 공통 서열 D/E-X-N-Z-S/T를 나타내고, 이때 X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있다.

서열번호 25는 글리코실화 부위를 나타낸다.

서열번호 26은 글리코실화 부위를 나타낸다.

서열번호 27은 EcoRI/BamHI 부위 내로 클로닝된 pglB ORF를 함유하는 발현 플라스미드를 나타낸다.

본 명세서에서 사용되고 당업계에서 통상의 기술을 가진 자에게 공지된 용법과 일치하는 용어 및 약어의 설명은 이하에 기재되어 있다. 이 설명은 이러한 용어 및 약어의 이해를 돕기 위해 제공되고 본 발명의 실시양태를 제한하는 것으로 해석되어서는 안 된다.

AcrA는 캄필로박터 제주니로부터의 당단백질을 의미한다.

능동 면역화는 항원에 노출시킨 후 면역(항체)을 유도하는 것을 의미한다.

APC는 항원 제시 세포를 의미한다.

Amp는 앰피실린을 의미한다.

세균혈증은 순환 혈액 중의 생존 세균의 존재를 의미한다.

C'는 보체를 의미한다.

CapA는 스타필로코커스 아우레우스 CP5에서 쇄 길이 결정인자(determinant)인 것으로 제안된 효소이다.

CapB는 스타필로코커스 아우레우스 CP5에서 폴리사카라이드 쇄 길이의 조절제인 것으로 제안된 효소이다.

CapC는 스타필로코커스 아우레우스 CP5에서 수송자 단백질을 코딩하는 것으로 제안된 효소이다.

CapD는 4,6-데하이드라타제(dehydratase) 활성을 갖는 효소이고 스타필로코커스 아우레우스 CP5에서 전구체 UDPGlcNAc를 UDP-2-아세트아미도-2,6-다이데옥시-D-자일로-4-헥술로스로 전환시킨다.

CapE는 스타필로코커스 아우레우스 CP5에서 UDP-D-GlcNAc가 UDP-2-아세트아미도-2,6-다이데옥시-D-자일로-4-헥술로스로 에피머화되는 것을 촉진하는 4,6-데하이드라타제 3,5-에피머라제(epimerase)이다.

CapF는 스타필로코커스 아우레우스 CP5에서 UDP-2-아세트아미도-2,6-다이데옥시-D-자일로-4-헥술로스가 UDP-L-6dTalNAc로 환원되는 것을 촉진하는 리덕타제(reductase)이다.

CapG는 스타필로코커스 아우레우스 CP5에서 UDP-L-6dTalNAc가 UDP-LFucNAc로 에피머화되는 것을 촉진하는 2-에피머라제이다.

CapH는 스타필로코커스 아우레우스 CP5에서 O-아세틸트랜스퍼라제(acetyltransferase)이다.

CP8에서 CapH는 스타필로코커스 아우레우스 CP5로부터의 CapI와 유사한 트랜스퍼라제이다.

CapI는 스타필로코커스 아우레우스 CP5에서 UDP-ManNAcA가 담체 지질-D-FucNAc-L-FucNAc-ManNAcA를 생성하는 담체 지질-D-FucNAc-L-FucNAc로 전달되는 것을 촉진하는 글리코실트랜스퍼라제이다.

CP8에서 CapI는 스타필로코커스 아우레우스 CP5의 CapJ와 유사한 폴리머라제이다.

CapJ는 스타필로코커스 아우레우스 CP5에서 폴리머라제이다.

CP8에서 CapJ는 스타필로코커스 아우레우스 CP5의 CapH와 유사한 O-아세틸트랜스퍼라제이다.

CapK는 스타필로코커스 아우레우스 CP5에서 플립파제이다.

스타필로코커스 아우레우스 CP8에서 CapK는 CP5의 CapK와 유사한다.

CapL은 스타필로코커스 아우레우스 CP5에서 UDP-L-FucNAc가 담체 지질-D-FucNAc-L-FucNAc를 생성하는 D-FucNAc-담체 지질로 전달되는 것을 촉진하는 트랜스퍼라제이다.

CapM은 스타필로코커스 아우레우스 CP5에서 UDP-D-FucNAc가 담체 지질-D-FucNAc를 생성하는 담체 지질 상으로 전달되는 것을 촉진하는 트랜스퍼라제이다.

CapN은 스타필로코커스 아우레우스 CP5에서 UDP-2-아세트아미도-2,6-다이데옥시-D-자일로-4-헥술로스가 UDP-D-FucNAc로 환원되는 것을 촉진하는 4-리덕타제(reductase)이다.

CapO는 스타필로코커스 아우레우스 CP5에서 UDP-D-ManNAc가 UDP-ManNAcA로 전환되는 것을 촉진하는 데하이드로게나제(dehydrogenase)이다.

CapP는 스타필로코커스 아우레우스 CP5에서 UDP-D-GlcNAc가 UDP-D-ManNAc로 에피머화되는 것을 촉진하는 2-에피머라제이다.

CFU는 콜로니 형성 단위를 의미한다.

ClfA는 세포벽에 고착된 단백질인 스타필로코커스 아우레우스 응괴 인자 A를 의미한다.

접합체 백신은 폴리사카라이드 항원을 담체 단백질에 공유부착시켜 생성한 백신을 의미한다. 접합체 백신은 항균 면역 반응 및 면역학적 기억을 이끌어낸다. 유아 및 노인에서, 폴리사카라이드 항원들에 대한 보호 면역 반응은 이들 항원들이 T 세포 의존성 반응을 유도하는 단백질과 접합된 경우 유도될 수 있다.

공통 서열은 아미노산 서열 -D/E-X-N-Z-S/T-를 의미하고, 이때 X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있고, 이 서열 내에서 N-연결된 당단백질에 대한 탄수화물 부착 부위가 발견된다.

천연 형태의 캡슐형 폴리사카라이드는 폴리사카라이드의 두꺼운 점막 유사 층을 의미하고 수용성 및 통상적으로 산성을 나타낸다. 천연 캡슐형 폴리사카라이드는 1개 내지 수개의 모노사카라이드/단량체의 규칙적 반복 단위로 구성된다.

CP5는 스타필로코커스 아우레우스 5형 캡슐형 폴리사카라이드 또는 혈청형 5 캡슐형 폴리사카라이드를 의미한다.

CP8은 스타필로코커스 아우레우스 8형 캡슐형 폴리사카라이드 또는 혈청형 8 캡슐형 폴리사카라이드를 의미한다.

D-FucNAc는 N-아세틸 D-푸코스아민을 의미한다.

ECA는 장내세균 공통 항원을 의미한다.

ELISA는 샘플 중의 항체 또는 항원의 존재를 검출하기 위해 면역학에서 주로 이용되는 생화학적 기법인 효소-연결된 면역흡착 분석을 의미한다.

EPA 또는 EPAr은 무독성 재조합 슈도모나스 애루기노사 외부단백질 A를 의미한다.

당접합체 백신은 항원성 또는 면역원성 올리고사카라이드에 연결된 단백질 담체를 포함하는 백신을 의미한다.

글리코실트랜스퍼라제는 모노사카라이드 단위를 활성화된 뉴클레오타이드 당으로부터 글리코실 수용체 분자로 전달하는 촉매로서 작용하는 효소를 의미한다.

그람-양성 균주는 그람 염색(귀중한 진단 수단)에 의해 자주색으로 염색되는 세균 균주를 의미한다. 그람-양성 세균은 펩티도글리칸(세포벽의 약 50% 내지 90%)으로 만들어진 두꺼운 그물망 유사 세포벽을 갖는다.

그람-음성 균주는 분홍색으로 염색되는 보다 얇은 층(세포벽의 약 10%)을 갖는 세균 균주를 의미한다. 그람-음성 세균은 지질을 함유하고 원형질막주위공간에 의해 세포벽으로부터 분리되어 있는 추가 외막도 갖는다.

H1a(알파 독소)는 분비된 공극 형성 독소이자 스타필로코커스 아우레우스의 필수 병독성 인자 항원인 알파 헤모라이신(hemolysin)을 의미한다.

H1a-H35L은 스타필로코커스 아우레우스로부터의 H1a의 돌연변이체 형태인 무독성 알파-독소 돌연변이체를 의미한다.

히스티딘 태그 또는 폴리히스티딘 태그는 5개 이상의 히스티딘(His) 잔기로 구성되어 있고 종종 단백질의 N-말단 또는 C-말단에 존재하고 니켈 친화성 컬럼에 특이적으로 결합함으로써 단순하고 신속한 방식으로 정제하는 데에 사용되는 단백질 내의 아미노산 모티프이다.

IV는 정맥내를 의미한다.

kDa는 킬로달톤을 의미하고 원자 질량 유닛이다.

L-FucNAc는 N-아세틸 L-푸코스아민을 의미한다.

LPS는 리포폴리사카라이드를 의미한다. 리포글리칸으로도 공지되어 있는 리포폴리사카라이드(LPS)는 공유결합에 의해 연결된 지질 및 폴리사카라이드로 구성된 큰 분자이고, 이들은 그람-음성 세균의 외막에서 발견되고 내독소로서 작용하고 동물에서 강한 면역 반응을 이끌어낸다.

ManNAcA는 N-아세틸 만노스아미뉴론산(mannosaminuronic acid)을 의미한다.

메티실린 내성 스타필로코커스 아우레우스 균주(MRSA)는 보다 긴 입원 및 집중 치료 병동에서의 보다 많은 감염과 관련되어 있으므로 더욱 많은 항생제 투여를 초래하는 메티실린 내성 스타필로코커스 아우레우스 균주이다.

N-글리칸 또는 N-연결된 올리고사카라이드는 N-글리코사이드 연결을 통해 단백질 내의 아스파라긴 잔기의 ε-아미드 질소에 연결된, 가변 조성을 갖는 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드를 의미한다.

N-연결된 단백질 글리코실화는 "글리칸"(모노사카라이드, 올리고사카라이드 또는 폴리사카라이드)을 표적 단백질 상의 아스파라긴(N) 측쇄의 질소에 공유연결하는 과정 또는 경로를 의미한다.

O-항원 또는 O-폴리사카라이드는 LPS 내에 함유된 반복 글리칸 중합체를 의미한다. O-항원은 코어 올리고사카라이드에 부착되고 LPS 분자의 최외각 도메인을 포함한다.

올리고사카라이드 또는 폴리사카라이드는 공유결합된 탄수화물(모노사카라이드)에 의해 형성된 동종중합체 또는 이종중합체를 의미하고 글리코사이드 결합에 의해 서로 연결된 반복 단위(모노사카라이드, 다이사카라이드, 트라이사카라이드 등)를 포함하나 이들로 제한되지 않는다.

옵소닌식균작용 활성은 보체 및 특이적 항체의 존재 하에서의 병원체의 식균작용을 의미한다. 혈청 항체의 시험관내 옵소닌식균작용 활성(OPA)은 생체내 항체의 기능적 활성을 대표하므로 보호 면역과 상관관계를 갖는다고 생각된다.

OTase 또는 OST는 올리고사카라이드 또는 폴리사카라이드가 합성중인 단백질 또는 폴딩된 단백질의 공통 서열에 존재하는 아스파라긴(N) 잔기로 기계적으로 독특하게 선택적으로 전달되는 것(글리코실화)을 촉진하는 올리고사카릴 트랜스퍼라제를 의미한다.

수동 면역화는 이미 만들어진 항체 형태의 활성 체액성 면역이 한 개체로부터 또 다른 개체로 전달되는 것을 의미한다.

원형질막주위공간은 그람-음성 세균의 내부 세포질막과 외부 외막 사이의 공간을 의미한다.

PMN은 인간 및 많은 포유동물(모든 포유동물은 아님)의 말초 혈액에서 가장 풍부한 백혈구 세포인 다형핵(polymorphonuclear) 호중구를 의미한다.

단백질 담체는 올리고사카라이드 또는 폴리사카라이드가 부착되는 공통 서열을 포함하는 단백질을 의미한다.

RU는 개별 모노사카라이드가 올리고사카라이드 또는 폴리사카라이드로 조립됨으로써 합성된 특정 폴리사카라이드를 포함하는 반복 단위를 의미한다.

신호 서열은 단백질이 상이한 위치로 이동되도록 유도하는, 상기 단백질의 N-말단에 존재하는 짧은(예를 들면, 약 3개 내지 60개의 아미노산 길이) 펩티드를 의미한다.

UDP-D-ManNAc는 UDP-N-아세틸-D-만노스아민이다.

UDP-D-ManNAcA는 UDP-N-아세틸-D-만노스아미뉴론산이다.

UDP-D-QuiNAc는 UDP-N-아세틸-D-퀴노보스아민이다.

UDP-L-FucNAc는 UDP-N-아세틸-L-푸코스아민이다.

UDP-L-6dTalNAc는 UDPN-아세틸-L-뉴모스아민이다.

Und는 11개의 프레놀(prenol) 단위로 구성된 운데카프레닐 또는 운데카프레놀 지질을 의미한다.

UndP는 세균 세포 외피로 이출되는(exported) 탄수화물 중합체에 대한 글리칸 생합성 중간체의 (Und로부터 유도된) 보편적인 지질 담체인 운데카프레닐 포스페이트를 의미한다.

UndPP는 UndP의 인산화된 버전인 운데카프레닐 피로포스페이트를 의미한다.

wbjA는 슈도모나스 애루기노사 O11의 글루코실트랜스퍼라제이다.

wbjB는 스타필로코커스 아우레우스에서 CP5 및 CP8의 캡슐 생합성에 필요한 효소와 유사한 추정(putative) 에피머라제이다.

wbjC는 슈도모나스 애루기노사 O11의 추정 에피머라제이다.

wbjD는 슈도모나스 애루기노사 O11의 추정 에피머라제이다.

wbjE는 슈도모나스 애루기노사 O11의 추정 에피머라제이다.

wbjF는 슈도모나스 애루기노사 O11의 글리코실트랜스퍼라제이다.

wbpL은 슈도모나스 애루기노사 O11에서 LPS 생합성에 참여하는 글리코실트랜스퍼라제이다.

wbpM은 슈도모나스 애루기노사 O11에서 LPS 생합성에 참여하는 글리코실트랜스퍼라제이다.

본 발명의 실시양태는 캄피로박터 제주니가 원핵 유기체에 대한 독특한 특징인 일반적인 N-연결된 단백질 글리코실화 시스템을 함유한다는 발견에 적어도 부분적으로 근거한다. 캄필로박터 제주니의 다양한 단백질들이 헵타사카라이드에 의해 변형되는 것으로 밝혔다. 이 헵타사카라이드는 특이적 글리코실트랜스퍼라제에 의해 촉진되는, 뉴클레오타이드-활성화된 모노사카라이드의 단계적 부가에 의해 내막의 세포질 쪽에서 지질 담체인 UndPP 상에서 조립된다. 그 다음, 지질-연결된 올리고사카라이드는 플립파제, 예를 들면, PglK에 의해 원형질막주위공간 내로 플립핑된다(즉, 횡단하여 확산된다). N-연결된 단백질 글리코실화의 제1 단계에서, OTase(예를 들면, PglB)는 올리고사카라이드가 담체 지질로부터 공통 서열 Asp/Glu-Xaa-Asn-Zaa-Ser/Thr(즉, D/E-X-N-Z-S/T)(이때, Xaa 및 Zaa는 Pro를 제외한 임의의 아미노산일 수 있음) 내의 Asn 잔기로 전달되는 것을 촉진한다. 본 발명자들은 헵타사카라이드에 대한 글리코실화 클러스터를 에스케리치아 콜라이 내로 성공적으로 전달하였고 캄필로박터의 N-연결된 당단백질을 생성할 수 있었다.

그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에 대한 백신 생성물로서 사용될 글리코실화된 단백질을 생성하기 위해 그람-음성 숙주 세균, 예컨대, 에스케리치아 콜라이를 변형시키는 신규 발명적 방법이 개발되었다. 이 방법의 개발은 많은 면에서 예측되지 않는 상당한 문제점을 극복하고 통상적인 지식 및 종래 기술로부터 실질적으로 벗어날 것을 필요로 하였다.

이 신규 발명적 방법에서, 표적 유기체, 예를 들면, 스타필로코커스 아우레우스의 관심있는 폴리사카라이드와 구조적으로 유사한 폴리사카라이드를 생성하는 또 다른 그람-음성 세균이 확인되었다. 본 발명의 목적을 위해, 구조적 유사성은 확인된 다른 그람-음성 세균의 폴리사카라이드 내의 반복 단위와 부분적으로 동일한 표적(예를 들면, 스타필로코커스 아우레우스)의 폴리사카라이드 내의 반복 단위로서 나타난다. 이 후자 세균이 그람-음성 세균이기 때문에, 예를 들면, 에스케리치아 콜라이 유기체가 숙주인 경우, 본 발명자들은 변형된 에스케리치아 콜라이 유기체에서의 그의 생합성 경로의 이용이 구축된 RU 항원의 생합성, 및 변형된 에스케리치아 콜라이 유기체의 세포질로부터 원형질막주위공간 내로의 상기 항원의 플립핑을 가능하게 할 것이라고 먼저 가정하였다(그 후, 이하에 논의된 바와 같이 실험에 의해 입증됨). 또한, 본 발명자들은 이 생합성 경로를 통해 생성된 폴리사카라이드의 크기가 그람-양성 스타필로코커스 아우레우스의 생합성 경로에 의해 생성된 폴리사카라이드보다 훨씬 더 작을 것이라고 가정하였다(그 후, 이하에 논의된 바와 같이 실험에 의해 입증됨).

결과적으로, 이하에 논의된 바와 같이, 본 발명자들은 전술된 어려운 문제점을 해결하는 신규 혁신적 방법을 개발하였다.

나아가 놀랍게도, 그람-음성 유기체의 LPS 경로의 양태가 이하에 상세히 기재된 바와 같이 그람-양성 세균, 예를 들면, 스타필로코커스 아우레우스에 천연적으로 존재하는 캡슐형 폴리사카라이드와 동일한 몇몇 반복 단위들을 함유하는 폴리사카라이드를 생성하는 데에 사용될 수 있다는 것을 발견하였다.

따라서, 스타필로코커스 아우레우스에 대한 글리코실화된 단백질 백신의 폴리사카라이드 부분을 제조함에 있어서, 한 가지 놀라운 해결책은 그람-음성 세균, 예컨대, 에스케리치아 콜라이에 천연적으로 존재하는 폴리사카라이드에 적어도 부분적으로 근거하여 폴리사카라이드 부분을 구축하는 것이다. 추가로, 본 발명자들은 이를 수행함에 있어서 스타필로코커스 아우레우스에 의해 생성된 관심있는 폴리사카라이드와 가능한 유사한 폴리사카라이드를 생성하는 세균을 찾는 것이 확실히 중요하다는 것도 발견하였다. 슈도모나스 애루기노사는 이러한 세균이다.

도 1은, 본 명세서에 비추어 볼 때 당업자에게 자명할 바와 같이, O-항원 클러스터 내에 제공된 효소 또는 그람-음성 숙주 세포의 하우스 킵핑 효소에 의해 세포질에서 뉴클레오타이드-활성화된 모노사카라이드가 제조되는 한 실시양태의 단계적 도식을 제공한다. 도 1의 도식에서 과정의 단계는 좌측에서 우측으로 진행된다. 도 1에 도시된 실시양태에서, 글리코실포스페이트 트랜스퍼라제((WbpL)는 D-FucNAc 포스페이트를 UndP에 부가하여 UndPP-FucNAc를 형성한다. 그 다음, 특이적 글리코실트랜스퍼라제가 반복 단위(RU) 올리고사카라이드를 형성하는 모노사카라이드를 부가하여 UndPP-D-FucNAc 분자를 추가로 연장시킨다(WbjE, WbjA). 그 다음, RU는 Wzx 단백질에 의해 원형질막주위공간 내로 플립핑된다. Wzy 효소는 원형질막주위공간 내의 RU를 중합하여 O-항원 폴리사카라이드를 형성한다. 중합체 길이는 Wzz 단백질에 의해 조절된다. 많은 세균 올리고사카라이드 및 폴리사카라이드가 UndPP 상에서 조립된 후 다른 분자로 전달된다. 즉, UndPP는 세균에서 당을 위한 일반적인 구축 플랫폼이다. 에스케리치아 콜라이 및 (추측건대) 대다수의 다른 그람-음성 세균에서, O-항원은 에스케리치아 콜라이 효소 WaaL에 의해 UndPP로부터 지질 A 코어로 전달되어 리포폴리사카라이드(LPS)를 형성한다.

도 2는, 본 명세서에 비추어 볼 때 당업자에게 자명할 바와 같이, 슈도모나스 애루기노사 O11의 O-항원 클러스터 내에 제공된 효소, 그람-음성 숙주 세포의 하우스 킵핑 효소, 및 UDP-ManNAcA 생합성에 필요한 것으로 공지되어 있는 스타필로코커스 아우레우스 및/또는 에스케리치아 콜라이 효소(Cap5OP 및/또는 WecBC)에 의해 세포질에서 뉴클레오타이드-활성화된 모노사카라이드가 제조되는 한 실시양태를 보여준다. 도 2의 도식에서 과정의 단계는 좌측에서 우측으로 진행된다. O11 생합성에서와 같이, WbpL 및 WbjE는 코어 다이사카라이드를 합성한다. 그 다음, 스타필로코커스 아우레우스 글리코실트랜스퍼라제 Cap5I가 D-ManNAcA를 부가한다. Cap5H는 아세틸 기를 제2 FucNAc 잔기에 부가한다. 아세틸화는 도 2에 나타낸 바와 같이 RU 합성의 제1 단계일 수 있다. 플립핑은 재조합적으로 발현된 슈도모나스 애루기노사의 Wzx 또는 Cap5K, 또는 예를 들면, 에스케리치아 콜라이 염색체 내에 코딩된 ECA 클러스터의 내재적으로 발현된 Wzx 유사 효소인, 시스템 내의 Wzx 단백질들 중 하나 또는 전부에 의해 가능하다. 중합은 UndPP 상에서 CP5 폴리사카라이드를 형성하는 Cap5J 폴리머라제의 독점적 활성이다. 다른 UndPP-연결된 폴리사카라이드로서 CP5 당이 에스케리치아 콜라이 효소 WaaL에 의해 지질 A 코어로 전달되어 재조합 LPS(LPS 캡슐)를 형성한다.

도 3은, 본 명세서에 비추어 볼 때 당업자에게 자명할 바와 같이, 슈도모나스 애루기노사 O11의 O-항원 클러스터 내에 제공된 효소, 그람-음성 숙주 세포의 하우스 킵핑 효소, 및 UDP-ManNAcA 생합성에 필요한 것으로 공지되어 있는 스타필로코커스 아우레우스 및/또는 에스케리치아 콜라이 효소(Cap8OP 및/또는 WecBC)에 의해 세포질에서 뉴클레오타이드-활성화된 모노사카라이드가 제조되는 것을 보여준다. 도 3의 도식에서 과정의 단계는 좌측에서 우측으로 진행된다. O11 생합성에서와 같이, WbpL 및 WbjE는 코어 다이사카라이드를 합성한다. 그 다음, 스타필로코커스 아우레우스 글리코실트랜스퍼라제 Cap8H가 D-ManNAcA를 부가한다. Cap8J는 아세틸 기를 제2 FucNAc 잔기에 부가한다. 아세틸화가 활성화된 당 상에서 일어나는지 아니면 지질 결합된 RU 상에서 일어나는지는 공지되어 있지 않다. 플립핑은 재조합적으로 발현된 슈도모나스 애루기노사의 Wzx 또는 Cap8K, 또는 예를 들면, 에스케리치아 콜라이 염색체 내에 코딩된 ECA 클러스터의 내재적으로 발현된 Wzx 유사 효소인, 시스템 내의 Wzx 단백질들 중 하나 또는 전부에 의해 가능하다. 중합은 UndPP 상에서 CP8 폴리사카라이드를 형성하는 Cap8I 폴리머라제의 독점적 활성이다. 그 다음, CP8 당이 효소 WaaL에 의해 에스케리치아 콜라이에서 지질 A 코어로 전달된다.

도 4는 O11, CP5 및 CP8 폴리사카라이드의 상이한 구조를 보여준다. RU가 UndPP 및 다이사카라이드 α-D-FucNAc-(1,3)-L-FucNAc로 구성된 동일한 줄기(stem) 구조를 공유한다는 것은 도 4에 나타나 있다. 스타필로코커스 아우레우스 RU들은 중간 L-FucNAc 상에서 또는 ManNAcA 잔기 상에서 단일 O-아세틸 기에 의해 부분적으로 장식되어 있고, 이것은 스타필로코커스 아우레우스 RU의 특징이다. 스타필로코커스 아우레우스 RU에서 제2 당과 제3 당의 연결뿐만 아니라 중합된 RU들 사이의 연결도 그들 사이에 상이하다. 우측에서, 당 구조체는 상이한 표시로 나타나 있다. 역 화살(CP5 및 CP8)에 의해 표시된 숫자는 O-아세틸 기에 의해 변형된 탄소의 위치를 표시한다. RU 구조체의 대안적인 표시는 좌측 하부에 나타나 있다. 도 4에 나타낸 바와 같이, 슈도모나스 애루기노사에 천연적으로 존재하는 폴리사카라이드의 일부인 O11 항원 내의 RU와 스타필로코커스의 각종 균주의 CP5 및 CP8 캡슐의 RU 사이에 상당한 중첩이 존재한다. 구체적으로, 도 4에 나타낸 바와 같이, RU 내의 L-FucNAc-→D-FucNAc 부분이 둘다에서 동일하다.

또 다른 양태에서, 본 발명은 단백질을 표적 폴리사카라이드로 전체적으로 또는 부분적으로 글리코실화하는 데에 사용될 상기 표적 폴리사카라이드를 확인하는 방법을 특징으로 한다. 상기 표적 폴리사카라이드를 포함하는 상기 글리코실화된 단백질은 예를 들면, 백신 조성물에서 사용될 수 있다. 표적 폴리사카라이드를 확인하는 방법은 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스를 표적으로서 확인하는 단계; 3개 이상의 단량체를 포함하는, 상기 그람-양성 세균에 의해 생성된 폴리사카라이드의 제1 반복 단위를 확인하는 단계; 및 상기 제1 반복 단량체 단위와 동일한 단량체를 2개 이상 포함하는 제2 반복 단위를 포함하는, 그람-음성 종의 세균에 의해 생성된 폴리사카라이드를 확인하는 단계를 포함한다.

따라서, 본 발명의 한 실시양태에서, 제1 그람-음성 종의 세균을 변형시키는 방법은 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스를 표적으로서 확인하는 단계; 3개 이상의 단량체를 포함하는, 상기 그람-양성 세균에 의해 생성된 폴리사카라이드의 제1 반복 단위를 확인하는 단계; 상기 제1 반복 단위와 동일한 단량체를 2개 이상 포함하는 제2 반복 단위를 포함하는, 제2 그람-음성 종의 세균에 의해 생성된 폴리사카라이드를 확인하는 단계; a) 상기 제2 반복 단위, 및 b) 상기 제2 반복 단위에 존재하지 않는 상기 제1 반복 단위의 단량체를 함유하는 트라이사카라이드를 조립하는 글리코실트랜스퍼라제를 코딩하는 하나 이상의 뉴클레오타이드 서열을 상기 제1 그람-양성 종의 세균 내로 삽입하는 단계; 단백질, 예컨대, 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 포함하는 단백질을 코딩하는 뉴클레오타이드 서열을 삽입하는 단계; 및 OTase를 코딩하는 뉴클레오타이드 서열을 삽입하는 단계를 포함한다.

본 발명의 한 실시양태에서, 상기 방법은 제2 반복 단위에 존재하지 않는 제1 반복 단위의 단량체를 함유하는 트라이사카라이드를 조립하고 상기 제2 반복 단위를 조립하는 글리코실트랜스퍼라제를 코딩하는 하나 이상의 뉴클레오타이드 서열을 숙주 그람-음성 세균 내로 삽입하는 단계를 추가로 포함한다. 본 발명의 추가 실시양태는 제1 반복 단위로부터의 하나 이상의 단량체 단위를 조립하는 그람-음성 세균으로부터의 하나 이상의 글리코실트랜스퍼라제, 및 제2 반복 단위로부터의 2개 이상의 단량체를 조립하는 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스로부터의 하나 이상의 글리코실트랜스퍼라제를 삽입하는 단계를 포함한다. 상기 방법은 단백질을 코딩하는 뉴클레오타이드 서열 및 OTase를 코딩하는 뉴클레오타이드 서열을 그람-음성 숙주 세균 내로 삽입하는 단계를 추가로 포함한다.

본 발명의 하나 이상의 실시양태에서, 반복 단위를 구축하고 구축된 반복 단위를 플립핑하고 중합할, 스타필로코커스 아우레우스의 CP5 균주 및 CP8 균주로부터의 필요한 효소들을 코딩하는 상응하는 핵산을 보유하는 숙주 에스케리치아 콜라이 균주가 발생된다. 한 실시양태에서, 필요한 특이적 글리코실트랜스퍼라제는 슈도모나스 애루기노사에 천연적으로 존재하는, L-FucNAc-→D-FucNAc RU를 형성하는 글리코실트랜스퍼라제, 및 D-ManNAcA 모노사카라이드를 부가하여 스타필로코커스 아우레우스의 CP5 균주 및 CP8 균주 각각에 천연적으로 존재하는 RU를 완성하는 글리코실트랜스퍼라제에 상응하는 글리코실트랜스퍼라제에 상응한다. 이러한 실시양태는 핵산을 숙주 세포 내로 주입하기 위해 플라스미드를 사용하는 단계를 추가로 포함할 수 있다. 추가 실시양태는 한 플라스미드에서 L-FucNAc-→D-FucNAc에 상응하는 글리코실트랜스퍼라제를 코딩하는 핵산을 사용하고, 상이한 플라스미드에서 D-ManNAcA에 상응하는 글리코실트랜스퍼라제를 코딩하는 핵산을 사용하는 단계를 포함한다. 종래 기술에 비추어 볼 때 놀랍게도, 이러한 실시양태의 한 이점은 스타필로코커스 아우레우스 캡슐의 구축된 RU 중합체를 생성하는 것을 담당하는 슈도모나스 애루기노사의 변형된 LPS 생합성 경로가 스타필로코커스 아우레우스의 캡슐보다 훨씬 더 작은 구조체를 발생시킨다는 것이다.

추가로, 본 발명은 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음); 및 상기 공통 서열에 연결된, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 포함하는 재조합 N-글리코실화된 단백질에 관한 것이다. 또 다른 실시양태에서, 상기 재조합 N-글리코실화된 단백질은 2개 이상의 상기 삽입된 공통 서열을 포함한다. 추가 실시양태에서, 상기 재조합 N-글리코실화된 단백질은 2개 이상의 상기 스타필로코커스 아우레우스 올리고사카라이드 또는 폴리사카라이드를 포함한다. 추가 실시양태에서, 상기 재조합 N-글리코실화된 단백질은 2개 이상의 상기 삽입된 공통 서열, 및 상이한 스타필로코커스 아우레우스 균주, 예를 들면, 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 5 균주 및 캡슐형 폴리사카라이드 8 균주로부터의 올리고사카라이드 또는 폴리사카라이드를 포함한다.

나아가, 본 발명은 N-글리코사이드 연결에 의해 조합된, 스타필로코커스 아우레우스의 변형된 캡슐형 폴리사카라이드와 동일한 유기체로부터의 단백질 항원의 조합물에 관한 것이다.

본 발명의 실시양태는 천연적으로 글리코실화된 단백질을 포함한다. 이러한 천연적으로 글리코실화된 단백질(예를 들면, 캄필로박터 제주니 단백질)은 천연 공통 서열을 함유하지만 임의의 추가(즉, 도입된) 최적화된 공통 서열을 포함하지 않는다. 천연적으로 글리코실화된 단백질은 원핵 단백질 및 진핵 단백질을 포함한다. 본 발명의 실시양태는 하기 N-글리코실화된 부분적 아미노산 서열들 중 하나 이상의 서열을 포함하는 재조합 N-글리코실화된 단백질을 추가로 포함하고, 이때 상기 N-글리코실화된 부분적 아미노산 서열 중 하나 이상의 서열이 도입된다: D/E-X-N-Z-S/T(최적화된 공통 서열)(이때, X 및 Z는 Pro를 제외한 임의의 천연 아미노산일 수 있음). 단백질 내로의 특정 부분적 아미노산 서열(최적화된 공통 서열)의 도입은 도입 위치에서 OTase, 예를 들면, 캄필로박터 종으로부터의 OTase, 예를 들면, 캄필로박터 제주니로부터의 OTase에 의해 효율적으로 N-글리코실화되는 단백질을 발생시킨다.

본 발명의 내용에서 사용된 용어 "부분적 아미노산 서열"은 "최적화된 공통 서열" 또는 "공통 서열"로서 지칭될 것이다. 최적화된 공통 서열은 OTase, 예를 들면, 캄필로박터 종으로부터의 OTase, 예를 들면, 캄필로박터 제주니로부터의 OTase에 의해 N-글리코실화된다.

아미노산에 대한 국제적으로 수용된 1 문자 코드에 따라, 약어 D, E, Ν, S 및 T는 각각 아스파르트산, 글루탐산, 아스파라긴, 세린 및 쓰레오닌을 표시한다.

최적화된 공통 서열의 도입은 하나 이상의 아미노산의 부가, 결실 및/또는 치환에 의해 달성될 수 있다. 최적화된 공통 서열을 도입하기 위한 하나 이상의 아미노산의 부가, 결실 및/또는 치환은 당업자에게 잘 공지되어 있는 화학적 합성 방법, 예컨대, 고체상-보조된 화학적 펩티드 합성에 의해 달성될 수 있다. 대안적으로(보다 큰 폴리펩티드의 경우 바람직함), 본 발명의 단백질은 하나 이상의 최적화된 공통 서열을 코딩하는 핵산을 천연적으로 글리코실화된 단백질일 수 있거나 천연적으로 글리코실화되지 않은 단백질일 수 있는 출발 단백질의 핵산 서열 내로 부가함으로써 표준 재조합 기법에 의해 제조될 수 있다.

바람직한 실시양태에서, 본 발명의 단백질은 하나 이상, 바람직하게는 2개 이상 또는 3개 이상, 보다 바람직하게는 5개 이상의 상기 도입된 N-글리코실화된 최적화된 아미노산 서열을 포함할 수 있다.

본 발명의 단백질 내의 하나 이상의 N-글리코실화된 최적화된 아미노산 서열의 존재는 그들의 항원성을 증가시키고/시키거나, 그들의 안정성을 증가시키고/시키거나, 그들의 생물학적 활성에 영향을 미치고/미치거나, 그들의 생물학적 반감기를 연장시키고/시키거나, 그들의 정제를 단순화하는 데에 유리할 수 있다.

최적화된 공통 서열은 위치 X 및 Z에서 프롤린을 제외한 임의의 아미노산을 포함할 수 있다. 용어 "임의의 아미노산"은 일반 천연 아미노산 및 희귀 천연 아미노산뿐만 아니라, 최적화된 공통 서열이 OTase에 의해 여전히 N-글리코실화되게 할 합성 아미노산 유도체 및 유사체도 포함하기 위한 것이다. X 및 Z의 경우 천연 일반 아미노산 및 희귀 아미노산이 바람직하다. X와 Z는 동일할 수 있거나 상이할 수 있다.

X 및 Z가 본 발명에 따른 단백질에서 각각의 최적화된 공통 서열에 대해 상이할 수 있다는 것을 인식해야 한다.

최적화된 공통 서열에 결합된 N-글리칸은 특이적 글리코실트랜스퍼라제; 및 OTase에 의한 전달을 위해 지질 담체 상에서 올리고사카라이드를 조립할 때 그들의 상호작용에 의해 결정될 것이다. 당업자는 원하는 숙주 세포에 존재하는 특이적 글리코실트랜스퍼라제의 종류 및 양을 변경함으로써 N-글리칸을 디자인할 수 있다(문헌[Raetz & Whitfield, Lipopolysaccharide Endotoxins, NIH-PA Author Manuscript 1-57, 19-25 (published in final edited form as: Annual Rev. Biochem., 71: 635-700 (2002)); Reeves et al., Bacterial Polysaccharide Synthesis and Gene Nomenclature, Trends in Microbio. 4(3): 495-503, 497-98 (Dec. 1996); and Whitfield, C. and I. S. Roberts. 1999. Structure, assembly and regulation of expression of capsules in Escherichia coli. Mol Microbiol 31(5): 1307-19]).

본원에서 사용된 "폴리사카라이드"는 2개 이상의 모노사카라이드를 포함하는 사카라이드를 포함한다. 폴리사카라이드는 올리고사카라이드, 트라이사카라이드, 하나 이상의 모노사카라이드(또는 단량체)를 포함하는 반복 단위, 및 당업자에 의해 폴리사카라이드로서 인식되는 다른 사카라이드를 포함한다. 본원에서 N-글리칸은 N-글리코사이드 연결을 통해 단백질 내의 아스파라긴 잔기의 ε-아미드 질소에 연결된, 가변 조성을 갖는 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드로서 정의된다.

본 발명의 실시양태의 폴리사카라이드는 스타필로코커스 아우레우스 폴리사카라이드, 예컨대, CP5 및 CP8을 포함하나 이들로 제한되지 않는다. 본 발명의 실시양태는 세균을 표적으로 하는 스타필로코커스 아우레우스 폴리사카라이드, 예컨대, 스타필로코커스 아우레우스의 메티실린 내성 균주를 표적으로 하는 폴리사카라이드를 추가로 포함한다. 본원에서 폴리사카라이드가 세균 균주를 표적화한다고 언급되어 있는 경우, 이러한 폴리사카라이드는 면역 또는 항원성 반응이 요구되는 세균으로부터 유래된 폴리사카라이드를 포함하고, 면역 또는 항원성 반응이 요구되는 세균과 동일한, 이 세균에 근거한, 이 세균으로부터 유래된, 이 세균에 천연적으로 존재하는, 또는 이 세균으로부터 개조된 폴리사카라이드를 추가로 포함한다.

본 발명의 재조합 단백질의 유래에 대한 제한은 없다. 한 실시양태에서, 상기 단백질은 포유동물, 세균, 바이러스, 진균 또는 식물 단백질로부터 유래된다. 추가 실시양태에서, 상기 단백질은 포유동물, 가장 바람직하게는 인간 단백질로부터 유래된다. 바람직하게는 백신에서 활성 성분으로서 사용될 본 발명에 따른 항원성 재조합 단백질을 제조하기 위해서는, 상기 재조합 단백질이 세균, 바이러스 또는 진균 단백질로부터 유래되는 것이 바람직하다. 다양한 유래의 단백질들의 글리코실화는 당업자에게 공지되어 있다(문헌[Kowarik et al. "Definition of the bacterial N-glycosylation site consensus sequence" EMBO J. (2006) 1-10]).

일례에서, 한 실시양태에서 유전적으로 해독된 슈도모나스 애루기노사 외독소(EPA)가 적합한 단백질 담체이다. 글리코실화될 수 있는 형태의 EPA를 생성하기 위해, EPA를 코딩하는 핵산은 상기 논의된 바와 같이 글리코실화 부위의 삽입에 의해 변형될 필요가 있다.

본 발명의 실시양태에서 사용될 단백질 담체는 바람직하게는 일부 면역학적 및 약리학적 특징을 갖는다. 면역학적 관점에서 볼 때, 바람직하게는 단백질 담체는 (1) T 세포 에피토프를 가져야 하고; (2) 면역 시스템에서 항원을 항원 제시 세포(APC)에 전달할 수 있어야 하고; (3) 강력하고 지속성이 있어야 하고; (4) 항원 특이적 전신 IgG 반응을 발생시킬 수 있어야 한다. 약리학적 관점에서 볼 때, 담백질 담체는 바람직하게는 (1) 무독성을 나타내어야 하고; (2) 온전한 상피 장벽을 가로질러 항원을 효율적으로 전달할 수 있어야 한다. 보다 바람직하게는, 이들 면역학적 특징 및 약리학적 특징 이외에, 세균 생체접합체의 생성에 사용될 것으로 고려되는 단백질 담체는 (1) 원형질막주위공간 내로 용이하게 분비되어야 하고; (2) 그 자신 내로 루프 또는 선형 서열로서 용이하게 도입된 항원 에피토프를 가질 수 있어야 한다. 당업자는 본 개시내용 및 당업자의 지식에 근거하여 본 발명의 구체적인 실시양태에서 사용될 수 있는 적합한 단백질 담체를 상용적으로 검토하고 확인할 수 있다.

본 발명의 한 실시양태에서, 캄필로박터 단백질 AcrA가 단백질 담체이다.

본 발명의 추가 실시양태에서, 유전적으로 해독된 슈도모나스 애루기노사 외독소(EPA)는 백신이 요구되는 표적 유기체가 스타필로코커스 아우레우스인 단백질 담체이다. 천연 글리코실화 부위를 함유하는 AcrA와 달리, EPA는 이러한 천연 글리코실화 부위를 함유하지 않고 글리코실화 부위의 삽입(예를 들면, 상기 논의된 바와 같은 최적화된 공통 서열을 코딩하는 핵산을 EPA를 코딩하는 핵산 서열 내로 삽입)에 의해 변형될 필요가 있다. 추가 실시양태에서, EPA는 스타필로코커스 아우레우스 항원을 사용한 글리코실화를 허용하는 2개의 글리코실화 부위를 도입하도록 변형된다. 추가 실시양태에서, 2개의 공통 서열이 국제특허출원 공보 제WO 2009/104074호의 실시예 10에서 논의된 바와 같이 도입된다.

본 발명의 실시양태에서 2개의 글리코실화 부위를 함유하도록 변형된 EPA의 아미노산 서열은 서열번호 13(신호 서열을 가짐) 및 서열번호 14(신호 서열을 갖지 않음)로서 제공된다. 서열번호 13에서 글리코실화 부위는 위치 260DNNNS 및402DQNRT에 존재하는 DNNNS 및 DQNRT이다. 서열번호 14에서 글리코실화 부위는 위치 241DNNNS 및 383DQNRT에 존재하는 DNNNS 및 DQNRT이다.

단백질 담체, 예컨대, EPA는 세균 생체접합체의 생성에서 N-글리코실화 부위가 부가될 수 있는 단백질이다. N-글리코실화 부위는 상기 논의된 공통 서열의 도입, 즉 D/E-X-N-Z-S/T 서열의 삽입(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)을 필요로 한다. 본 발명자들은 이러한 공통 서열이 돌연변이보다는 삽입에 의해, 추가로 삽입된 플랭킹(flanking) 잔기의 이용에 의해, 및 N-글리코실화 부위의 작동을 최적화하기 위한 플랭킹 잔기의 돌연변이에 의해 표면 루프 내에 도입된다는 것을 발견하였다.

스타필로코커스 아우레우스의 몇몇 잘 특징규명된 단백질 서브단위 항원은 알파 헤모라이신(알파 독소, H1a), 응괴 인자 알파(ClfA), IsdB 및 판톤-발레틴 류코시딘(Panton-Valentine Leukocidin)(PVL)이다.

H1a는 분비된 공극 형성 독소이고 스타필로코커스 아우레우스 폐렴의 마우스 모델에서 MRSA의 필수 병독성 인자이다. 독립적인 스타필로코커스 아우레우스 균주들에 의한 H1a 발현의 수준은 그들의 병독성과 직접적으로 상관관계를 갖는다. 공극을 형성할 수 없는 돌연변이체 형태의 H1a(Hla-H35L, 서열번호 5)를 사용한 능동 면역화는 항원 특이적 면역글로불린 G 반응을 발생시키고 스트렙토코커스 뉴모니아에 대한 보호를 부여하는 것으로 밝혀졌다(문헌[Menzies, B. E., and D. S. Kernodle. 1996. Passive immunization with antiserum to a nontoxic alpha-toxin mutant from Staphylococcus aureus is protective in a murine model. Infect Immun 64: 1839-41; Jursch, R., A. Hildebrand, G. Hobom, J. Tranum-Jensen, R. Ward, M. Kehoe and S. Bhakdi. 1994. Histidine residues near the N terminus of staphylococcal alpha-toxin as reporters of regions that are critical for oligomerization and pore formation. Infect Immun 62(6): 2249-56]). H1a 특이적 항체의 전달은 스타필로코커스 아우레우스 공격으로부터 무경험(naive) 동물을 보호하고 감염 동안 인간 폐 상피세포의 손상을 예방한다(문헌[Bubeck Wardenburg, J., A. M. Palazzolo-Ballance, M. Otto, O. Schneewind, and F. R. DeLeo. 2008. Panton-Valentine leukocidin is not a virulence determinant in murine models of community-associated methicillin-resistant Staphylococcus aureus disease. J Infect Dis 198: 1166-70]). 백신으로서 사용되기 위해, H1a 내의 H35 돌연변이는 단백질의 독성을 제거할 필요가 있다(문헌[Menzies, B. E., and D. S. Kernodle. 1994. Site-directed mutagenesis of the alpha-toxin gene of Staphylococcus aureus: role of histidines in toxin activity in vitro and in a murine model. Infect Immun 62: 1843-7]). ClfA는 면역화에 사용될 프로테아제 내성 도메인을 함유한다. 항-ClfA 항체 및 항-CP5 항체를 사용한 마우스의 수동 면역화는 유선 감염 모델에서 유선을 효과적으로 멸균한다(문헌[Tuchscherr, L. P., F. R. Buzzola, L. P. Alvarez, J. C. Lee, and D. O. Sordelli. 2008. Antibodies to capsular polysaccharide and clumping factor A prevent mastitis and the emergence of unencapsulated and small-colony variants of Staphylococcus aureus in mice. Infect Immun 76: 5738-44]).

본 발명의 추가 실시양태는 스타필로코커스 아우레우스에 천연적으로 존재하는 단백질, 예를 들면, H1a 및 C1fA의 글리코실화를 포함한다. 본 발명의 추가 예시적 실시양태에서, 사용되는 단백질 담체는 H1a 단백질, 예를 들면, H1a-H35L(예를 들면, 서열번호 6, 서열번호 7, 서열번호 8 또는 서열번호 16)이 되도록 선택될 수 있다. 본 발명의 또 다른 추가 예시적 실시양태에서, 단백질 담체는 ClfA 단백질(예를 들면, 서열번호 10, 서열번호 11 또는 서열번호 12)이다.

추가로, 본 발명은 제1 원핵 종, 예컨대, 그람-양성 종의 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 상이한 원핵 종, 예컨대, 그람-음성 종의 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 숙주 원핵 유기체에 관한 것이다. 또한, 본 발명은 그람-양성 원핵 유기체에만 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 도입된 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 숙주 원핵 유기체에 관한 것이다. 또한, 본 발명은 예를 들면, 숙주 원핵 유기체와 상이한 제1 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 및 상기 제1 원핵 유기체의 종과 상이하고 예를 들면, 상기 숙주와 상이한 제2 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 또는 개조된 숙주 원핵 유기체에 관한 것이다. 상기 개조된 원핵 유기체는 예를 들면, 그람-양성 종인 제1 원핵 종을 포함할 수도 있다. 상기 개조된 원핵 유기체는 예를 들면, 그람-음성 종인 제2 원핵 종을 포함할 수도 있다. 본 발명은 예를 들면, 재조합 또는 개조된 그람-음성 숙주 원핵 유기체와 상이한 그람-음성 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 스타필로코커스 아우레우스에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 또는 개조된 그람-음성 숙주 원핵 유기체를 추가로 포함한다. 추가로, 본 발명은 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 스타필로코커스 아우레우스 CP5 균주 및/또는 스타필로코커스 아우레우스 CP8 균주에 천연적으로 존재하는 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 슈도모나스 애루기노사 EPA, 스타필로코커스 아우레우스 알파 헤모라이신 또는 스타필로코커스 아우레우스 응괴 인자 A 단백질 담체를 코딩하는 뉴클레오타이드 서열; 및 OTase, 예를 들면, 캄필로박터 제주니에 천연적으로 존재하는 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 또는 개조된 에스케리치아 콜라이 숙주를 포함한다.

추가 실시양태에서, 변형된 숙주 에스케리치아 콜라이 유기체에서 다른 그람-음성 유기체의 생합성 경로를 사용하는 것 이외에 (i) (표적 그람-양성 스타필로코커스 아우레우스 유기체의 관심있는 폴리사카라이드의 반복 단위와 동일한) 다른 그람-음성 유기체의 폴리사카라이드의 반복 단위의 구조를 구축하기 위한 글리코실트랜스퍼라제, (ii) 다른 그람-음성 유기체의 관련 폴리사카라이드에서 발견되지 않는, 표적 그람-양성 스타필로코커스 아우레우스 유기체의 관심있는 폴리사카라이드의 단위를 구축하기 위한 글리코실트랜스퍼라제, 및 (iii) 표적 그람-양성 스타필로코커스 아우레우스 유기체의 관심있는 구축된 RU를 플립핑하고 중합하여 스타필로코커스 아우레우스 캡슐 유사 폴리사카라이드를 형성하기 위한 효소를 코딩하는 핵산도 숙주 에스케리치아 콜라이 유기체 내에 포함된다. 구체적으로, 이 실시양태에서, (i)을 코딩하는 핵산은 다른 그람-음성 세균으로부터 유래되는 반면, (ii) 및 (iii)을 코딩하는 핵산은 표적 그람-양성 스타필로코커스 아우레우스 유기체로부터 유래된다.

본 발명의 또 다른 양태는 i) 그람-양성 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; ii) 단백질을 코딩하는 뉴클레오타이드 서열; 및 iii) OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 개조된 숙주 원핵 유기체에 관한 것이고, 이때 상기 그람-양성 원핵 종의 수송자 유전자를 코딩하는 서열은 결실되어 있다. 이러한 실시양태는 그람-양성 글리코실트랜스퍼라제만을 코딩하는 도입된 핵산 구축물을 포함한다.

하나 이상의 다른 실시양태에서 숙주 내로 도입될 다른 핵산에 관하여, 슈도모나스 애루기노사 및 스타필로코커스 아우레우스 각각으로부터의 글리코실트랜스퍼라제를 코딩하는 핵산 이외에 단백질, 예컨대, AcrA, H1a, ClfA 또는 EPA(서열번호 15, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 16, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14), 및 캄피로박터 제주니의 올리고사카릴트랜스퍼라제(서열번호 27)(상기 유기체의 글리코실화 기구의 일부임)를 코딩하는 핵산이 숙주 내로 주입된다. 그 결과, 변형된 에스케리치아 콜라이 유기체는 AcrA 단백질을 스타필로코커스 아우레우스 및 다른 그람-음성 세균로부터의 글리코실트랜스퍼라제의 작용에 의해 상기 유기체 내에서 생성된 폴리사카라이드로 글리코실화할 수 있다.

본 발명의 한 실시양태는 i) 숙주 원핵 유기체와 상이한 제1 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; ii) 상기 숙주 원핵 유기체와 상이한 제2 원핵 종, 예를 들면, 그람-양성 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; iii) 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 개조된 숙주 원핵 유기체를 포함한다. 본 발명의 실시양태에서, 상기 제1 원핵 종은 그람-음성 종, 예를 들면, 슈도모나스 애루기노사이다.

본 발명의 내용에서, 숙주 세포는 임의의 숙주 세포, 예를 들면, 진핵 또는 원핵 숙주 세포를 의미한다. 다른 실시양태에서, 숙주 세포는 원핵 숙주 세포, 예를 들면, 에스케리치아 아종, 캄필로박터 아종, 살모넬라(Salmonella) 아종, 쉬겔라(Shigella) 아종, 헬리코박터(Helicobacter) 아종, 슈도모나스 아종 또는 바실러스(Bacillus) 아종이다. 추가 실시양태에서, 숙주 세포는 에스케리치아 콜라이, 캄필로박터 제주니, 살모넬라 티피뮤리움(Salmonella typhimurium) 등이다.

나아가, 본 발명은 스타필로코커스 아우레우스의 하나 이상의 글리코실트랜스퍼라제; 제2 원핵 종의 하나 이상의 글리코실트랜스퍼라제; 단백질; 및 OTase를 코딩하는 핵산을 숙주 원핵 유기체 내로 도입하는 단계를 포함하는, 생체접합체 백신을 제조하는 방법에 관한 것이다. 또한, 본 발명은 그람-음성 세균에서 운데카프레놀(Und) 상의 변형된 캡슐형 폴리사카라이드를 생성하고 이들 폴리사카라이드 항원들을 선택된 단백질 담체에 연결함으로써 생체접합체 백신을 제조하는 것에 관한 것이다.

추가로, 본 발명은 제1 원핵 유기체에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하고 상기 제1 원핵 유기체와 상이한 제2 원핵 유기체에 천연적으로 존재하는 글리코실트랜스퍼라제도 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에서 글리코실화된 단백질을 제조하는 방법에 관한 것이다. 추가로, 본 발명은 상이한 유기체로부터의 상이한 글리코실트랜스퍼라제들의 조합물에 의해 합성된 그람-양성 세균의 캡슐형 폴리사카라이드로 N-글리코실화된 단백질을 제조하는 것에 관한 것이다. 나아가, 본 발명은 그람-양성 원핵 유기체에만 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 도입된 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에서 글리코실화된 단백질을 제조하는 것에 관한 것이다.

당업계에서 공지되어 있는 바와 같이, 상이한 폴리사카라이드들의 생합성은 세균 세포에서 보존되어 있다. 폴리사카라이드들은 한정된 특이성을 갖는 상이한 글리코실트랜스퍼라제들에 의해 세포질 막에서 담체 지질 상에서 공통 전구체(활성화된 당 뉴클레오타이드)로부터 조립된다(문헌[Whitfield, C., and I. S. Roberts. 1999. Structure, assembly and regulation of expression of capsules in Escherichia coli. Mol Microbiol 31: 1307-19]). 그람-음성 세균에서 O-항원의 폴리사카라이드를 생성하는 생합성 경로 및 그람-양성 세균에서 캡슐형 폴리사카라이드 I형을 생성하는 생합성 경로는 보존되어 있다. 상기 과정은 폴리사카라이드 조립을 위해 동일한 지질 담체, 즉 UndP를 사용한다. 상기 과정은 막의 세포질 쪽에서 모노사카라이드-1-포스페이트를 담체 지질 UndP에 부가하는 것으로 시작된다. 상기 항원은 활성화된 당 뉴클레오타이드로부터의 모노사카라이드가 상이한 글리코실트랜스퍼라제들에 의해 순차적으로 부가됨으로써 구축된다. 그 다음, 지질-연결된 올리고사카라이드 또는 RU가 플립파제에 의해 상기 막을 통해 플립핑된다. RU는 원형질막주위공간에서 효소 Wzy에 의해 중합되어 그람-음성 세균에서 소위 O-항원을 형성하거나 그람-양성 세균에서 캡슐형 폴리사카라이드를 형성한다. 그람-음성 세균은 Wzz 효소를 사용하여 중합체의 길이를 조절하고, 상기 중합체는 지질 A 코어로 전달되어 LPS를 형성한다. LPS는 O-항원을 외부에 노출시키는 외막으로 추가로 전위된다(예를 들면, 도 1에 도시된 바와 같음). 대조적으로, 그람-양성 세균은 상이한 전문화된 효소 기구를 이용한 추가 수송을 통해 이 지질-결합된 전구체로부터 캡슐을 형성한다. 이들 폴리사카라이드들의 생합성 경로는 원형질막주위공간 내의 폴리사카라이드를 단백질 담체 상으로 포획함으로써 생체내에서 생체접합체를 제조할 수 있게 한다.

캡슐형 폴리사카라이드에 대한 폴리사카라이드 구축 과정은 상기 캡슐형 폴리사카라이드가 중합 후 담체 지질로부터 방출되고 표면 상으로 이출된다는 점에서 상이하다. 원형질막주위공간 구획을 함유하지 않는 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에서, 상기 항원의 중합은 막의 외부 쪽에서 일어난다. 또한, 스타필로코커스 아우레우스에서 길이 조절은 캡슐 조립을 담당하는 3종의 효소들로 구성된 기구에 포함된다. 이 조립에서, 폴리사카라이드는 담체 지질로부터 방출되어 효소적 과정에 의해 표면으로 이출된다.

스타필로코커스 아우레우스에서 기능성 캡슐 발현을 위해 필요한 유전자 클러스터에서 발견되는 유전적 요소는 wzy 의존성 O-항원 합성 클러스터에서 발견되는 유전적 기구와 유사하다(문헌[Dean, C. R., C. V. Franklund, J. D. Retief, M. J. Coyne, Jr., K. Hatano, D. J. Evans, G. B. Pier, and J. B. Goldberg. 1999. Characterization of the serogroup O11 O-antigen locus of Pseudomonas aeruginosa PA103. J Bacteriol 181:4275-4284]).

그람-양성 세균에서의 폴리사카라이드 구축과 그람-음성 세균에서의 폴리사카라이드 구축의 이들 차이점들에도 불구하고, 놀랍게도 그람-음성 유기체 내의 LPS 경로의 양태를 이용하여 그람-양성 세균, 예를 들면, 스타필로코커스 아우레우스에 천연적으로 존재하는 캡슐형 폴리사카라이드와 동일한 몇몇 반복 단위들을 함유하는 폴리사카라이드를 생성할 수 있다는 것을 발견하고 검증하였다. 이러한 폴리사카라이드가 그람-음성 숙주에서 LPS 경로 기작에 의해 생성되기 때문에, 이러한 폴리사카라이드의 구조는 LPS 폴리사카라이드 전구체의 구조와 동일하다. 따라서, 본 발명의 그람-음성 시스템에서 생성된 이러한 폴리사카라이드는 본원의 목적을 위해 "변형된 캡슐형 폴리사카라이드" 또는 "LPS 캡슐"로서 특징지워질 수 있다. 나아가, LPS 생합성 경로와 캡슐형 생합성 경로를 조합하는 이 새로이 합성된 발현 시스템 및 생합성 경로는 본원의 목적을 위해 "변형된 LPS 생합성 경로"인 것으로서 특징지워질 수 있다.

본 발명의 한 실시양태에서, 변형된 LPS 생합성 경로에 의해 생성된 변형된 폴리사카라이드는 하기 폴리사카라이드를 포함한다:

본 발명의 추가 실시양태에서, 변형된 LPS 생합성 경로에 의해 생성된 변형된 폴리사카라이드는 하기 폴리사카라이드를 포함한다:

본 발명의 기술을 이용하여, 면역원성을 나타내는 세균 생체접합체를 제조할 수 있다. 원하는 단백질의 원하는 위치에서 세균 폴리사카라이드의 생체내 접합을 가능하게 하는 유전적 변형이 만들어질 수 있다.

본 발명의 또 다른 양태는 상기 논의된 바와 같은 변형된 LPS 생합성 경로를 이용하여 단백질 담체에 접합된 LPS 캡슐 또는 변형된 LPS를 제조하는 것을 포함한다.

본 발명의 추가 실시양태는 Cap5 및 Cap8 완전 폴리사카라이드 생합성 클러스터를 코딩하는 뉴클레오타이드 서열 구축물을 포함하고, 이때 결실된 수송자 유전자는 스타필로코커스 아우레우스의 capA, capB 및 capC이다(도 6 참조).

본 발명의 추가 실시양태는 CP5/O11 키메라 클러스터(서열번호 2, 서열번호 3 또는 서열번호 17) 또는 CP8/O11 키메라 클러스터(서열번호 4, 서열번호 18 또는 서열번호 19)를 숙주 세포의 게놈 내로 삽입하는 것을 포함하다. 본 발명의 추가 실시양태는 (a) CP5/O11 키메라 클러스터(서열번호 2, 서열번호 3 또는 서열번호 17) 또는 CP8/O11 키메라 클러스터(서열번호 4, 서열번호 18 또는 서열번호 19); (b) OTase를 코딩하는 핵산; 및 (c) 도입된 공통 서열을 갖거나 갖지 않는 단백질을 코딩하는 핵산을 숙주 세포의 게놈 내로 삽입하는 것을 포함한다.

본 발명의 또 다른 실시양태는 플라스미드, 예를 들면, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18 및 서열번호 19 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 또한, 본 발명은 서열번호 13, 서열번호 14 및 서열번호 15 중 하나 이상의 서열을 포함하는 플라스미드를 포함한다. 또한, 본 발명은 서열번호 16, 서열번호 6, 서열번호 7 및 서열번호 8 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 또한, 본 발명은 서열번호 10; 서열번호 11 및 서열번호 12 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 나아가, 본 발명은 서열번호 20, 서열번호 21 및 서열번호 27 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다.

나아가, 본 발명의 실시양태는 예를 들면, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21 및 서열번호 27 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포를 포함하는 형질전환된 세균 세포에 관한 것이다. 서열번호 19 및 서열번호 20 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포도 본 발명에 포함된다. 서열번호 13, 서열번호 19 및 서열번호 21 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포도 본 발명에 포함된다. 추가로, 본 발명은 서열번호 16, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 10, 서열번호 11 및 서열번호 12 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포에 관한 것이다. 또한, 본 발명은 예를 들면, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18 및 서열번호 19 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포를 포함하는 형질전환된 세균 세포에 관한 것으로서, 이때 상기 세균 세포는 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제, 및 스타필로코커스 아우레우스 CP5 및/또는 CP8에 천연적으로 존재하는 글리코실트랜스퍼라제를 발현한다. 서열번호 17, 서열번호 18 및 서열번호 19 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포도 본 발명에 포함되고, 이때 상기 세균 세포는 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제, 스타필로코커스 아우레우스 CP5 및/또는 CP8에 천연적으로 존재하는 글리코실트랜스퍼라제 및 PglB를 발현한다. (a) 서열번호 19를 포함하는 플라스미드로 형질전환된 세균 세포로서, 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제, 스타필로코커스 아우레우스 CP8에 천연적으로 존재하는 글리코실트랜스퍼라제, 에스케리치아 콜라이 혈청형 O7의 Wzz 및 PglB를 발현하는 세균 세포; (b) 서열번호 19 및 서열번호 20 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포로서, 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제, 스타필로코커스 아우레우스 CP8에 천연적으로 존재하는 글리코실트랜스퍼라제, Wzz(길이 조절제), EPA 및 PglB를 발현하는 세균 세포; 및 (c) 서열번호 16, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 10, 서열번호 11 및 서열번호 12 중 하나 이상의 서열을 포함하는 세균 세포도 본 발명에 포함된다.

추가로, 본 발명의 실시양태는 포유동물, 예를 들면, 인간에서 그람-양성 세균 및 다른 세균에 의해 야기된 감염에 대한 면역 반응을 유도하는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음)를 포함하는 단백질; 및 상기 공통 서열에 연결된, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드로서, 또 다른 하나 이상의 올리고사카라이드 또는 폴리사카라이드와 동일하거나 또는 상이한 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 포함하는 유효량의 약학 조성물을 상기 포유동물에게 투여하는 단계를 포함한다. 본 발명의 추가 실시양태는 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음); 하나 이상의 스타필로코커스 아우레우스 올리고사카라이드 또는 폴리사카라이드, 예컨대, CP5 폴리사카라이드; 및 약학적으로 허용가능한 보조제를 포함하는 유효량의 약학 조성물을 포유동물에게 투여하는 단계를 포함하는, 상기 포유동물에서 스타필로코커스 아우레우스에 의해 야기된 감염에 대한 면역 반응을 유도하는 것에 관한 것이다. 본 발명의 또 다른 실시양태는 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음); 하나 이상의 스타필로코커스 아우레우스 CP8 폴리사카라이드; 및 약학적으로 허용가능한 보조제를 포함하는 유효량의 약학 조성물을 포유동물에게 투여하는 단계를 포함하는, 상기 포유동물에서 스타필로코커스 아우레우스에 의해 야기된 감염에 대한 면역 반응을 유도하는 방법을 포함한다. 추가 실시양태는 2개 이상의 공통 서열을 갖는 단백질 및 상이한 그람-양성 세균 균주로부터의 올리고사카라이드 또는 폴리사카라이드를 포함하는 유효량의 약학 조성물을 투여하는 단계를 포함하는, 포유동물에서 스타필로코커스 아우레우스에 의해 야기된 감염에 대한 면역 반응을 유도하는 것에 관한 것이다. 추가 실시양태는 2개 이상의 공통 서열을 갖는 단백질, 및 스타필로코커스 아우레우스 CP5 및 스타필로코커스 아우레우스 CP8을 포함하는 폴리사카라이드를 포함하는 유효량의 약학 조성물을 투여하는 단계를 포함하는, 포유동물에서 스타필로코커스 아우레우스에 의해 야기된 감염에 대한 면역 반응을 유도하는 것에 관한 것이다.

본 명세서에서 특정 뉴클레오타이드 또는 아미노산 서열이 언급되는 경우, 본 발명은 언급된 서열과 동일한 기능을 여전히 구현하는 상동 서열을 포함한다는 것을 이해할 것이다. 본 발명의 한 실시양태에서, 이러한 서열은 85% 이상의 상동성을 나타낸다. 또 다른 실시양태에서, 이러한 서열은 90% 이상의 상동성을 나타낸다. 추가 실시양태에서, 이러한 서열은 95% 이상의 상동성을 나타낸다. 2개의 뉴클레오타이드 또는 아미노산 서열들 사이의 퍼센트 동일성의 측정은 당업자에게 공지되어 있다.

본원에 기재된 핵산 서열, 예컨대, 본 명세서에 수반되는 서열목록에 기재된 핵산 서열은 단지 예이고, 이들 서열들이 상이한 방식으로 조합될 수 있다는 것은 당업자에게 자명할 것이다. 본 발명의 추가 실시양태는 핵산의 변이체를 포함한다. 핵산의 변이체(예를 들면, 코돈-최적화된 핵산)는 실질적으로 동일, 즉 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26 및/또는 서열번호 27과 70% 이상 동일, 예를 들면, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.5% 이상 동일할 수 있다. 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26 및/또는 서열번호 27을 함유하는 서열의 핵산 변이체도 포함된다. 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26 및/또는 서열번호 27을 함유하는 서열, 또는 이의 일부로부터의 하나 이상의 뉴클레오타이드(예를 들면, 2개, 3개, 4개, 5개, 6개, 8개, 10개, 12개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개 또는 그 이상의 뉴클레오타이드)의 치환, 변경, 변형, 대체, 결실 및/또는 부가를 갖는 핵산이 포함된다.

이러한 변이체는 원핵 글리코실트랜스퍼라제를 코딩하고 i) 숙주 세포, 예컨대, 에스케리치아 콜라이에서 발현되고 ii) 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18 및/또는 서열번호 19, 및/또는 이들의 일부와 실질적으로 동일한 핵산을 포함한다.

본원에 기재된 핵산은 재조합 DNA 및 합성(예를 들면, 화학적으로 합성된) DNA를 포함한다. 핵산은 이중 가닥 또는 단일 가닥 핵산일 수 있다. 단일 가닥 핵산의 경우, 상기 핵산은 센스 가닥 또는 안티센스 가닥일 수 있다. 핵산은 본 명세서에 비추어 볼 때 당업자에게 공지되어 있는 바와 같이 올리고뉴클레오타이드 유사체 또는 유도체를 사용함으로써 합성될 수 있다.

본원에 기재된 핵산을 포함하는 플라스미드는 발현을 위해 숙주 세포 내로 형질전환될 수 있다. 형질전환 기법은 본 명세서에 비추어 볼 때 당업자에게 공지되어 있다.

본 발명의 추가 실시양태는 단백질 담체에 접합된 LPS 캡슐 또는 변형된 LPS를 함유하는 그람-양성 생체접합체 백신을 제조하는 것을 포함한다.

본 발명의 추가 실시양태는 신규 생체접합체 백신을 포함한다. 본 발명의 추가 실시양태는 면역원성 또는 항원성 생체접합체를 직접적으로 생성하는 재조합 세균 세포를 사용하여 이러한 생체접합체 백신을 제조하는 신규 방법을 포함한다. 한 실시양태에서, 생체접합체 백신은 세균 질환, 예컨대, 설사, 병원내 감염 및 수막염을 치료하거나 예방하는 데에 사용될 수 있다. 추가 실시양태에서, 생체접합체 백신은 암 또는 다른 질환의 치료 및/또는 예방 잠재력을 가질 수 있다.

본 발명의 또 다른 실시양태에서, 폴리사카라이드(즉, 당 잔기)와 단백질(예컨대, 단백질 담체)의 합성된 복합체가 감염, 예컨대, 스타필로코커스 아우레우스 감염으로부터 보호하는 접합체 백신으로서 사용될 수 있다. 한 실시양태에서, 생체접합체 백신, 예컨대, 그람-양성 백신은 삽입된 핵산 공통 서열을 포함하는 단백질 담체; 상기 공통 서열에 연결된, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드; 및 선택적으로 보조제를 포함한다. 추가로, 또 다른 실시양태에서, 본 발명은 삽입된 핵산 공통 서열을 포함하는 단백질 담체; 상기 공통 서열에 연결된, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드, 예컨대, 캡슐형 폴리사카라이드 또는 LPS 캡슐; 및 선택적으로 보조제를 포함하는 그람-양성 생체접합체 백신, 예컨대, 스타필로코커스 아우레우스 백신에 관한 것이다. 본 발명의 또 다른 실시양태에서, 스타필로코커스 아우레우스 생체접합체 백신은 2개 이상의 이들 삽입된 공통 서열들을 포함한다. 추가 실시양태에서, 스타필로코커스 아우레우스 생체접합체 백신은 2개 이상의 스타필로코커스 아우레우스 올리고사카라이드 또는 폴리사카라이드를 포함한다. 추가 실시양태는 2개 이상의 상기 삽입된 공통 서열; 및 상이한 스타필로코커스 아우레우스 균주, 예를 들면, 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 5 균주(CP5) 및 캡슐형 폴리사카라이드 8 균주(CP8)로부터의 올리고사카라이드 또는 폴리사카라이드를 포함한다.

본 발명의 추가 실시양태는 변형된 캡슐형 폴리사카라이드 또는 LPS 캡슐의 생성을 포함하는, 변형된 LPS 경로를 이용하는 글리코실화 시스템에 의해 제조된 스타필로코커스 아우레우스 백신을 포함한다. 추가 실시양태는 그람-음성 원핵 종의 글리코실트랜스퍼라제를 코딩하지 않는 도입된 핵산으로부터 변형된 캡슐형 폴리사카라이드를 생성하는 것을 포함하는 변형된 LPS 경로를 이용하는 글리코실화 시스템에 의해 제조된 스타필로코커스 아우레우스 백신을 포함한다.

추가 실시양태는 하기 i) 내지 v)를 코딩하는 핵산을 포함하는 글리코실화 시스템에 의해 제조된 스타필로코커스 아우레우스 백신을 포함한다: i) 슈도모나스 애루기노사에 천연적으로 존재하는 O11 항원의 RU의 L-FucNAc-→D-FucNAc를 생성하는 것을 담당하는 하나 이상의 글리코실트랜스퍼라제; ii) 스타필로코커스 아우레우스의 CP5 또는 CP8 균주에 천연적으로 존재하는 D-ManNAcA 함유 RU를 생성하는 것을 담당하는 하나 이상의 글리코실트랜스퍼라제; iii) CP5 또는 CP8 구축된 RU의 플립핑 및 중합을 담당하는 하나 이상의 효소; iv) 도입된 공통 서열을 함유하는 재조합 단백질; 및 v) 캄필로박터 제주니로부터의 올리고사카릴트랜스퍼라제. 이 실시양태에서, 숙주 유기체는 그람-음성 세균, 예를 들면, 에스케리치아 콜라이일 수 있다.

본 발명의 추가 실시양태는 하기 i) 내지 iv)를 코딩하는 핵산을 포함하는 글리코실화 시스템에 의해 제조된 스타필로코커스 아우레우스 백신을 포함한다: i) 슈도모나스 애루기노사에 천연적으로 존재하는 O11 항원의 RU의 L-FucNAc-→D-FucNAc를 생성하는 것을 담당하는 글리코실트랜스퍼라제; ii) 스타필로코커스 아우레우스의 CP5 또는 CP8 균주에 천연적으로 존재하는 D-ManNAcA 함유 RU를 생성하는 것을 담당하는 글리코실트랜스퍼라제; 캄필로박터 제주니의 AcrA 단백질; 및 iv) 캄필로박터 제주니로부터의 올리고사카릴트랜스퍼라제. 이 실시양태에서, 숙주 유기체는 그람-음성 세균, 예를 들면, 에스케리치아 콜라이일 수 있다.

본 발명의 백신은 치료 및 예방 유용성을 갖는다. 본 발명의 백신이 인간 의학 및 수의학 분야에서 유용할 수 있다는 것이 인식될 것이다. 따라서, 면역화될 대상체는 인간 또는 다른 동물, 예를 들면, 소, 양, 돼지, 말, 염소 및 가금류(예를 들면, 닭, 칠면조, 오리 및 거위)를 포함하는 농장 동물, 및 애완 동물, 예컨대, 개 및 고양이일 수 있다.

또 다른 양태에서, 본 발명은 세균, 예컨대, 그람-양성 세균에 대해 포유동물을 면역화시키는 백신을 발생시키는 방법에 관한 것이다. 상기 방법은 대상체를 생체접합체, 예컨대, 그람-양성 폴리사카라이드, 예를 들면, 스타필로코커스 아우레우스 폴리사카라이드 및 약학적으로 허용가능한 담체를 포함하는 생체접합체로 면역화시키는 단계를 포함한다.

또한, 본 발명은 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에 의한 감염으로부터 보호하기 위한, 또는 그람-양성 감염, 예컨대, 스타필로코커스 아우레우스 감염을 치료하기 위한 백신 조성물을 특징으로 한다. 한 실시양태에서, 상기 백신 조성물은 스타필로코커스 아우레우스로부터의 하나 이상의 면역원성 성분, 예컨대, 폴리사카라이드, 또는 이의 단편 또는 일부를 포함한다. 추가 실시양태에서, 상기 백신 조성물은 그람-음성 또는 그람-양성 세균으로부터의 하나 이상의 면역원성 성분, 예컨대, 단백질, 또는 이의 단편 또는 일부를 포함한다.

본 발명의 한 양태는 스타필로코커스 아우레우스 폴리사카라이드의 하나 이상의 면역원성 성분 또는 단편 및 약학적으로 허용가능한 담체를 함유하는, 스타필로코커스 아우레우스에 의한 감염으로부터 보호하기 위한 백신 조성물을 제공한다. 이러한 면역원성 성분 또는 단편은 예를 들면, 약 2개 이상의 단량체 길이 또는 약 3개 이상의 단량체 길이를 갖는 스타필로코커스 아우레우스 폴리사카라이드를 포함할 수 있다. 본 발명의 추가 양태에서, 스타필로코커스 아우레우스 RU는 상기 단량체를 포함한다. 이러한 반복 단위는 예를 들면, 1개(하나) 이상의 단량체 길이를 갖는 스타필로코커스 아우레우스 RU를 포함할 수 있다.

본 발명의 면역원성 성분 또는 단편은 예를 들면, 재조합적으로 또는 화학적 합성을 통해 제조된 폴리사카라이드 또는 폴리펩티드의 스크리닝, 또는 예를 들면, 폴리사카라이드 및 단백질을 포함하는 생체접합체의 스크리닝에 의해 수득될 수 있다. 본 발명의 면역원성 성분 또는 단편의 스크리닝은 하나 이상의 여러 상이한 분석을 이용함으로써 수행될 수 있다. 예를 들면, 스크리닝 분석은 ELISA 및 당업자에게 공지되어 있는 다른 분석을 포함한다.

한 실시양태에서, 면역원성 성분 또는 단편은 예를 들면, 당접합체 백신 후보물질인 CP5-EPA에 대한 특이적 항-CP5 항체(ELISA에 의해 정량됨)를 측정하는, 마우스(도 15a) 및 토끼(도 15b)에서 수득된 면역 반응, 및 당업자에게 공지되어 있는 다른 수단에 의해 측정될 때 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스 CP5 또는 CP8 폴리사카라이드에 대한 IgG 항체를 자극하는 폴리사카라이드 및/또는 단백질의 능력에 의해 확인된다.

한 실시양태에서, 면역원성 성분 또는 단편은 예를 들면, 토끼 항-CP5-EPA 항체(하기 실시예 7에서 수득됨, 도 15b 참조)를 사용한 스타필로코커스 아우레우스 사멸("시험관내" 활성) 및 당업자에게 공지되어 있는 다른 수단에 의해 측정될 때 옵소닌 활성, 예컨대, 옵소닌식균작용 사멸을 자극하는 폴리사카라이드 및/또는 단백질의 능력에 의해 확인된다.

추가 실시양태에서, 면역원성 성분 또는 단편은 예를 들면, 마우스에서 CP5-EPA를 사용한 능동 면역화(도 18)의 이용을 통한 세균 감염("공격")으로부터의 보호 및 당업자에게 공지되어 있는 다른 수단에 의해 측정될 때 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에 대한 체액성 면역 및/또는 세포 매개 면역을 자극하는 폴리사카라이드 및/또는 단백질의 능력에 의해 확인된다.

본 발명의 한 실시양태에서, 본 발명의 백신 조성물은 본 발명의 스타필로코커스 아우레우스 폴리사카라이드의 면역원성 성분 또는 단편을 포함하고 선택적으로 약학적으로 허용가능한 담체 또는 보조제를 추가로 포함하는 당단백질을 주성분으로 할 수 있다. 본 발명의 추가 실시양태에서, 백신 조성물은 본 발명의 스타필로코커스 아우레우스 단백질의 면역원성 성분 또는 단편을 포함하고 선택적으로 약학적으로 허용가능한 담체 또는 보조제를 추가로 포함하는 당단백질을 주성분으로 할 수 있다. 본 발명의 추가 양태에서, 백신 조성물은 본 발명의 슈도모나스 애루기노사 단백질의 면역원성 성분 또는 단편을 포함하고 선택적으로 약학적으로 허용가능한 담체 또는 보조제를 추가로 포함하는 당단백질을 주성분으로 할 수 있다.

1종의 포유동물, 예를 들면, 마우스에게 투여될 백신을 또 다른 종류의 포유동물, 예를 들면, 인간에게 투여하기 위해 변형시키는 방법은 당업자에게 잘 공지되어 있다. 예를 들면, 당업자는 마우스에서 백신 조성물에서 사용된 당단백질의 단백질 담체로부터 히스티딘 태그를 결실시키는 것이 인간에게 투여될 백신 조성물에 적합한 당단백질을 만들 것이라는 것을 용이하게 인식할 것이다. 예를 들면, 단백질 담체, 예를 들면, EPA(서열번호 13), ClfA(서열번호 10, 서열번호 11, 서열번호 12), 및 H1a(서열번호 6, 서열번호 7, 서열번호 8, 서열번호 16)로부터의 히스티딘 태그(His 태그)의 결실이 인간에게 투여될 당단백질에서의 상기 단백질 담체의 사용을 위해 인식될 것이다.

그람-양성 세균에 의해 야기된 감염 또는 질환, 예를 들면, 스타필로코커스 아우레우스에 의해 야기된 감염 또는 질환, 또는 다른 세균에 의해 야기된 감염 또는 질환을 위해 사용되는 약물치료의 투여량의 감소, 또는 환자의 혈청 또는 점액 중의 항체의 생성 증가를 포함하는, 그람-양성, 예를 들면, 스타필로코커스 아우레우스 또는 다른 세균 감염 또는 질환의 증상들 중 임의의 증상의 호전이 원하는 임상 목표라는 것을 이해해야 한다. 본 발명의 백신 조성물들 중 몇몇 백신 조성물은 그람-양성 감염, 예를 들면, 스타필로코커스 아우레우스 감염, 또는 다른 세균 감염의 예방에 유용하고, 몇몇 백신 조성물은 그람-양성 감염, 예를 들면, 스타필로코커스 아우레우스 감염, 또는 다른 세균 감염의 치료에 유용하고, 몇몇 백신 조성물은 이러한 감염의 예방 및 치료 둘다에 유용하다는 것이 당업자에게 자명할 것이다.

본 발명의 실시양태, 예컨대, 백신 및 다른 약제는 선택적으로 당업계에서 잘 공지되어 있고 본 명세서에 비추어 볼 때 자명한 바와 같이 적합한 약학적으로 허용가능한 담체, 부형제, 희석제 및/또는 보조제를 사용함으로써 제조될 수 있다. 부형제, 희석제 또는 보조제는 활성 성분에 대한 비히클 또는 매질로서 작용할 수 있는 고체, 반고체 또는 액체 물질일 수 있다. 본 명세서에 비추어 볼 때, 조성물 제조 분야의 당업자는 선택된 생성물의 구체적인 특징, 치료될 질환 또는 병태, 상기 질환 또는 병태의 단계, 및 다른 관련 환경에 따라 적절한 투여 제형 및 방식을 용이하게 선택할 수 있다(문헌[Remington's Pharmaceutical Sciences, Mack Publishing Co. (1990)]). 약학적으로 허용가능한 희석제, 부형제 또는 보조제의 비율 및 성질은 선택된 약학적 활성 화합물의 가용성 및 화학적 성질, 선택된 투여 경로 및 표준 약학 관행에 의해 결정된다.

따라서, 본 발명의 실시양태에서, 백신 조성물은 면역원성 성분 또는 단편, 예를 들면, 스타필로코커스 아우레우스 폴리사카라이드 또는 이의 단편, 및/또는 스타필로코커스 아우레우스 또는 슈도모나스 애루기노사 단백질 또는 이의 단편을 포함하고, 선택적으로 약학적으로 허용가능한 담체를 포함한다. 용어 "약학적으로 허용가능한 담체"는 무독성 담체를 의미한다. 적합한 약학적으로 허용가능한 담체는 예를 들면, 하나 이상의 물, 식염수, 포스페이트 완충 식염수, 덱스트로스, 글리세롤, 에탄올 등 및 이들의 조합물을 포함한다. 약학적으로 허용가능한 담체는 항체의 저장 수명 또는 효능을 증강시키는 소량의 보조 물질, 예컨대, 습윤화제 또는 유화제, 보존제 또는 완충제를 추가로 포함할 수 있다. 이러한 약학적으로 허용가능한 담체는 예를 들면, 약학적 비히클, 부형제 또는 매질로서 작용하는 액체, 반고체 또는 고체 희석제를 포함한다. 당업계에서 공지되어 있는 임의의 희석제가 사용될 수 있다. 예시적인 희석제는 폴리옥시에틸렌 소르비탄 모노라우레이트, 마그네슘 스테아레이트, 메틸하이드록시벤조에이트 및 프로필하이드록시벤조에이트, 탈크, 알기네이트, 전분, 락토스, 수크로스, 덱스트로스, 소르비톨, 만니톨, 아카시아 검, 칼슘 포스페이트, 미네랄 오일, 코코아 버터 및 테오브로마(theobroma) 오일을 포함하나 이들로 제한되지 않는다.

추가로, 본 발명의 추가 실시양태에서, 백신 조성물은 미립자 보조제, 예컨대, 알루미늄 염(알루미늄 하이드록사이드, 알루미늄 포스페이트, 알루미늄 하이드록시포스페이트 설페이트 등); 유화액, 예컨대, 수중유(MF59, AS03); 액체와 염의 조합물, 예컨대, ASO4; 유중수(몬타나이드(Montanide)); ISCOMS, 리포좀/비로좀; 나노입자 및 마이크로입자 등; 비미립자화된 보조제, 예컨대, 펩티드; 사포닌(QS21); MPL A; 사이토카인; DNA 유도체; 세균 독소 등을 포함하나 이들로 제한되지 않는 보조제 또는 보조제의 조합물을 선택적으로 포함할 수 있다. 추가 실시양태는 동물에서 사용되는 보조제, 예컨대, 프로인트 완전 보조제(Freund's Complete Adjuvant) 및 프로인트 불완전 보조제(Freund's Incomplete Adjuvant), 마이콜레이트계 보조제(예를 들면, 트레할로스 다이마이콜레이트), 세균 리포폴리사카라이드(LPS), 펩티도글리칸(즉, 뮤레인, 뮤코펩티드 또는 당단백질, 예컨대, N-오파카(Opaca), 뮤라밀 다이펩티드[MDP], 또는 MDP 유사체), 프로테오글리칸, 스트렙토코커스 제제(예를 들면, OK432), DEAE-덱스트란, 중성 오일(예컨대, 미글리올(miglyol)), 식물성 오일(예컨대, 아라키스 오일), 플루로닉, 리비(Ribi) 보조제 시스템 또는 인터루킨, 특히 세포 매개 면역을 자극하는 인터루킨을 포함한다. 사용되는 보조제는 부분적으로 당접합체 백신의 조성 및 종류에 의해 좌우될 것이다. 투여될 보조제의 양은 포유동물의 종류 및 크기에 의해 좌우될 것이다. 최적 투여량은 상용적인 방법에 의해 용이하게 결정될 수 있다.

본 발명의 추가 양태는 본 발명에 따른 하나 이상의 당단백질을 포함하는 약학 조성물에 관한 것이다. 당단백질을 포함하는 약제의 제조는 당업계에서 잘 공지되어 있다. 최종 약학 조성물의 제조 방법, 및 그의 투여의 방식 및 세부사항은 사용되는 단백질, 숙주 세포, 핵산 및/또는 벡터에 의해 좌우될 것이다.

본 발명의 폴리사카라이드 또는 당단백질의 치료 유효량이 특히, 투여 일정, 투여되는 항체의 단위 투여량, 폴리사카라이드 또는 당단백질이 다른 치료제와 조합되어 투여되는지 여부, 환자의 면역 상태 및 건강, 및 구체적인 폴리사카라이드 또는 당단백질의 치료 활성에 의해 좌우될 것이라는 것은 당업자에게 자명할 것이다.

본 발명의 백신 조성물 및/또는 약학 제제는 경구, 비경구 또는 국소 사용에 적합하게 만들어질 수 있고 정제, 캡슐제, 좌약제, 용액, 현탁액 또는 임의의 다른 적합한 수단 또는 투약 제형의 형태로 환자에게 투여될 수 있다. 본 발명의 추가 양태에서, 백신 조성물 및/또는 약학 제제는 예를 들면, 정맥내, 피내, 근육내, 유선내, 복강내 또는 피하 주사; 또는 경구, 설하, 비강, 항문 또는 질 전달을 포함하는 임의의 공지된 방법에 의해 면역화될 대상체 내로 도입될 수 있다. 본 발명의 약학적 활성 화합물은 그 자체로 효과적이지만 안정성, 결정화의 편리성, 증가된 가용성 등을 위해 그의 약학적으로 허용가능한 염, 예컨대, 산 부가 염 또는 염기 부가 염의 형태로 제제화되어 투여될 수 있다. 본 발명의 한 실시양태에서, 백신 조성물은 비경구, 예를 들면, 피하 또는 근육내 주사에 의해 투여된다. 근육내 면역화 방법은 문헌(문헌[Wolff et al. (1990) Science 247: 1465-1468 and by Sedegah et al. (1994) Immunology 91: 9866-9870])에 기재되어 있다. 다른 투여 방식은 경구 및 경피를 포함한다.

본 발명의 백신은 예를 들면, 성인 또는 소아에서 일차 예방제로서 투여될 수 있거나, 감염된 숙주에서 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스의 성공적인 박멸 후 이차 예방제로서 투여될 수 있거나, 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에 의한 감염을 예방하기 위해 숙주에서 면역 반응을 유도할 목적으로 치료제로서 투여될 수 있다. 본 발명의 백신은 당업자에 의해 용이하게 결정되는 양으로 투여된다. 치료는 일정한 기간에 걸친 단회 투약 또는 다회 투약으로 구성될 수 있다. 예를 들면, 몇몇 실시양태에서, 인간의 경우 본 발명의 백신의 전형적인 투여량은 단백질 담체에 결합될(그리고 단백질 담체의 질량을 포함하지 않는) 약 1 ㎍ 내지 25 ㎍의 올리고사카라이드 항원, 추가 실시양태에서 약 1 ㎍ 내지 약 10 ㎍의 폴리사카라이드 항원, 추가 실시양태에서 약 2 ㎍의 폴리사카라이드 항원이다. 추가 실시양태에서, 당접합체 또는 백신에서 당/단백질 비는 약 1:5 내지 약 1:10이다. 선택적으로, 본 발명의 백신, 예컨대, 생체접합체 백신은 보조제를 포함할 수 있다. 당업자는 최적 투여량이 환자의 체중, 질환, 투여 경로 및 다른 인자들에 따라 더 많거나 더 적을 수 있다는 것을 인식할 것이다. 또한, 당업자는 적합한 투여량 수준이 공지된 백신을 사용한 결과에 근거하여 수득될 수 있다는 것을 인식할 것이다. 투약 횟수는 질환, 제제 및 임상 시험으로부터의 효능 데이터에 의해 좌우될 것이다.

백신 조성물은 전달하기 편리한 형태로 포장될 수 있다. 수용자 포유동물 내로의 면역원성 성분 또는 단편의 도입에 적합한 전달 형태가 바람직하다.

본 발명의 한 실시양태는 일반적으로 변형된 LPS 생합성 경로를 이용함으로써 그람-음성 유기체에서 그람-양성 유기체에 대한 백신을 재조합적으로 생성하는 것에 관한 것이다. 이것은 올리고사카릴트랜스퍼라제 및 단백질을 코딩하는 핵산, 및 2종 이상의 상이한 유기체로부터 유래된 글리코실트랜스퍼라제를 코딩하는 핵산을 숙주 내로 삽입함으로써 달성된다. 이 실시양태는 (i) 단백질; (ii) 올리고사카릴트랜스퍼라제 및 (iii) 2종 이상의 상이한 유기체로부터의 글리코실트랜스퍼라제를 코딩하는 핵산이 삽입된 천연 유기체에 근거하여 유기체를 유전적으로 개조하는 것에 관한 것이다.

이러한 실시양태의 일례에서, 글리코실화된 단백질 생성물은 스타필로코커스 아우레우스용 백신으로서 사용되기 위해 제조된다. 본 발명의 백신 생성물은 유전적으로 변형된 에스케리치아 콜라이 숙주에서 제조된다. 스타필로코커스 아우레우스는 그람-양성 세균이고 폴리사카라이드 캡슐을 갖는다. 이 유기체에 대한 백신 생성물은 이 캡슐형 폴리사카라이드와 유사한 구조를 갖는 당 부분을 갖는 글리코실화된 단백질을 주성분으로 할 수 있다.

또 다른 양태에서, 본 발명은 고전적인 화학적 접합 방법에 비해 이점을 제공하는, 면역원성 접합체 백신을 제조하는 신규 생체공학적 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 세균 세포, 예를 들면, 그람-음성 세포, 예컨대, 에스케리치아 콜라이에서의 당단백질의 생체내 제조를 포함한다.

당업자에게 공지되어 있는 바와 같이, 당접합체의 제조 및 정제는 사용되는 백신 후보물질 및 플라스미드의 조합에 따라 달라질 수 있다. 예를 들면, 단백질 담체, 당접합체의 당 성분, 및 예를 들면, 동물 또는 인간에서의 정제된 백신 후보물질의 의도된 용도에 근거하여 어떤 정제 절차를 선택할지는 공지되어 있다. 예를 들면, 인간에서 사용되기 위해, 정제를 용이하게 할 His 태그가 제거되어야 한다는 것은 공지되어 있다.

본원에서 언급된 모든 공개문헌들은 전체적으로 참고로 도입된다. 본원에서 사용된 용어 "또는"이 적절한 경우 조합될 수 있는 대안을 표시한다는 것, 즉 용어 "또는"이 각각의 나열된 대안을 개별적으로 및 그들의 조합물 형태로 포함한다는 것을 이해해야 한다. 본원에서 사용된 바와 같이, 문맥이 달리 명시하지 않는 한, 단수형의 언급은 복수형을 포함하고, 복수형의 언급은 단수형을 포함한다.

본 발명은 본 발명의 조성물 및 방법뿐만 아니라 그의 유용성도 추가로 기술하는 하기 실시예를 참조함으로써 더 정의된다. 본 발명의 범위 내에 있는 조성물 및 방법 둘다에 대한 변형이 실시될 수 있다는 것이 당업자에게 자명할 것이다.

실시예

실시예 1: 에스케리치아 콜라이 세포에서 CP5 및 CP8 폴리사카라이드의 합성

본 발명의 실시양태의 목적은 에스케리치아 콜라이에서 CP5 및 CP8 항원성 폴리사카라이드를 생성하는 것이다. 상기 논의된 바와 같이, 종래 기술에 비추어 볼 때 놀랍게도, 본 발명자들은 CP 생성 경로와 O-항원 생성 경로가 기능적으로 중첩된다는 사실(RU의 구조에서 나타나는 사실)(도 1 내지 4 참조)을 새로운 방식으로 활용하였다. CP5의 캡슐형 글리칸 및 CP8의 캡슐형 글리칸은 2-아세트아미도-2-데옥시-D-만뉴론산(D-ManNAcA), 및 D-입체구조 또는 L-입체구조를 갖는 2개의 2-아세트아미도-2,6-다이데옥시 갈락토스 잔기(D-FucNAc 및 L-FucNAc)로 구성된 유사한 트라이사카라이드 RU로 구성된 중합체이다. ManNAcA 잔기는 2종의 혈청형에서 상이하게 연결되어 있고, 중합된 글리칸의 RU들 사이의 연결도 상이하다. 또한, 2개의 항원에서 상이한 위치에서 면역우성 O-아세틸 변형이 존재한다(문헌[Jones, C. 2005. Revised structures for the capsular polysaccharides from Staphylococcus aureus types 5 and 8, components of novel glycoconjugate vaccines. Carbohydr Res 340: 1097-106]). 슈도모나스 애루기노사 LPS의 O11 항원이 [-3)-α-L-FucNAc-(1,3)-β-D-FucNAc-(1,2)-β-D-Glc-(1-]를 함유하기 때문에, 슈도모나스 애루기노사 LPS의 O11 항원은 그의 구조 면에서 CP5 및 CP8과 유사하다(도 4)(문헌[Knirel, Y. A., V. V. Dashunin, A. S. Shashkov, N. K. Kochetkov, B. A. Dmitriev and I.L. Hofman. 1988. Somatic antigens of Shigella: structure of the O-specific polysaccharide chain of the Shigella dysenteriae type 7 lipopolysaccharide. Carbohydr Res 179: 51-60]). 트라이사카라이드 RU는 스타필로코커스 아우레우스의 D-ManNAcA가 글루코스 단위로 치환되고, 슈도모나스 O11 LPS에서 O-아세틸 변형이 존재하지 않고, RU에서 제2 모노사카라이드와 제3 모노사카라이드 사이의 연결 종류에서의 차이가 존재하는 점에서만 상이하다(도 4).

UndPP 상에서 CP5 및 CP8 글리칸을 합성할 수 있는 유전적 시스템을 발생시키기 위해, 본 발명자들은 딘(Dean) 등의 방법(문헌[Dean, C. R., C. V. Franklund, J. D. Retief, M. J. Coyne, Jr., K. Hatano, D. J. Evans, G. B. Pier, and J. B. Goldberg. 1999. Characterization of the serogroup O1l O-antigen locus of Pseudomonas aeruginosa PA103. J Bacteriol 181:4275-4284])을 이용하여 균주 PA103으로부터의 슈도모나스 애루기노사 O11 O-항원 유전자 클러스터를 변형시켰다. UndPP-D-FucNAc-L-FuncNAc로 구성된 줄기 구조체의 합성을 위한 생합성 기구를 코딩하는 유전자를 스타필로코커스 아우레우스 글리칸의 완성을 위해 필요한 스타필로코커스 아우레우스 효소로 보완하였다(도 1 내지 4)(이것도 본 과정의 신규 용도임). 따라서, 딘 등의 방법을 이용하여 UndPP-FucNAc-FucNAc 생합성에 필요한 슈도모나스 애루기노사 PA103으로부터의 모든 유전적 요소들을 발현시켰다. 제3 당을 부가하는 글리코실트랜스퍼라제를 코딩하는 유전자를 결실시키고 스타필로코커스 아우레우스 Mu50(CP5) 및 MW2(CP8)로부터의 cap5 또는 cap8 클러스터로부터의 상응하는 유전자(약간의 변형을 가짐)로 치환시켰다.

스타필로코커스 아우레우스 캡슐형 폴리사카라이드에 대한 특이적 잔기를 합성하는 효소를 코딩하는 유전자를 사우(Sau) 등(문헌[Sau, S., N. Bhasin, E. R. Wann, J. C. Lee, T. J. Foster, and C. Y. Lee. 1997. The S. aureus allelic genetic loci for serotype 5 and 8 capsule expression contain the type-specific genes flanked by common genes. Microbiology 143: 2395-405.; O'Riordan, K. and J. C. Lee. 2004. Staphylococcus aureus capsular polysaccharides. Clin Microbiol Rev 17(1): 218-34])에 의해 예측된 유전자의 기능에 따라 단계적으로 O11 배경(background) 내로 도입하였다. 이러한 단계들은 이하에 설명되어 있다.

cap5I/cap8H 유전자 생성물은 ManNAcA를 RU의 UndPP-D-FucNAc-L-FuncNAc에 부가하여 각각의 혈청형에 대해 특이적인 연결을 형성하는 글리코실트랜스퍼라제인 것으로 예측되었다(문헌[Sau, S., N. Bhasin, E. R. Wann, J. C. Lee, T. J. Foster, and C. Y. Lee. 1997. The Staphylococcus aureus allelic genetic loci for serotype 5 and 8 capsule expression contain the type-specific genes flanked by common genes. Microbiology 143: 2395-405]). 이를 입증하기 위해, 슈도모나스 애루기노사 O11 O-항원의 생성을 제공하는 플라스미드의 존재 하에서 에스케리치아 콜라이에서 Cap5I 및 Cap8H의 활성을 분석하였다. O11 클러스터를 발현하는 세포는 먼저 UndPP 상에서 O11 O-항원을 합성하고, 상기 항원이 O11 특이적 리포폴리사카라이드(LPS)를 형성하는 에스케리치아 콜라이 효소 Waal(O-항원 리가제(ligase))에 의해 UndPP로부터 지질 A 코어로 전달된다(문헌[Goldberg, J. B., K. Hatano, G. S. Meluleni and G. B. Pier. 1992. Cloning and surface expression of Pseudomonas aeruginosa O antigen in Escherichia coli. Proc Natl Acad Sci USA 89(22): 10716-20]). 이 리포폴리사카라이드를 합성하기 위해, 슈도모나스 애루기노사 PA103으로부터의 O11 O-항원 클러스터를 pLAFR1(서열번호 1) 내로 클로닝하였다. 그 다음, 제3 당을 O11 RU에 부가하는 효소인 글리코실트랜스퍼라제를 코딩하는 wbjA 유전자를 트랜포존(transposon) 돌연변이유발로 결실시켰다. 돌연변이된 클러스터(O11 wbjA ::Tn50<dhfr -1>)를 상동 재조합으로 더 변형시켜 wzy 유전자의 폴리머라제 활성을 제거함으로써, O11 유전자 클러스터의 글리코실트랜스퍼라제 wbjA 및 wzy 폴리머라제에 대한 유전자들이 불활성화되어 있는 O11 wbjA::Tn50<dhfr-1>wzy::cat(돌연변이된 서열번호 1을 나타냄)을 형성하였다. 이 변형된 클러스터를, 타시(Tasi) 등의 문헌(문헌[Tsai, C. M., and C. E. Frasch. 1982. A sensitive silver stain for detecting lipopolysaccharides in polyacrylamide gels. Anal Biochem 119: 115-9])에 개시된 방법에 따라 W3110 ΔwecA 세포에서 발현시켰고, 추출물을 프로테이나제(proteinase) K로 처리하였고 SDS-PAGE 및 은 염색으로 분석하였다. 본원에 기재된 바와 같은 pLAFR1로부터의 돌연변이된 O11 클러스터를 발현시키는 W3110 Δ wecA 추출물의 은 염색을 보여주는 결과는 도 5a에 제공되어 있다. 제2 열은 유도성 플라스미드 pEXT22로부터 발현된 유전자를 표시한다. 별표는 합성된 코돈 최적화된 유전자를 표시한다. 상이한 관련 당형태들이 화살표로 표시되어 있다.

분석은 겔에서 2개의 주요 밴드를 보여주었다(도 5a, 레인 1). 신호는 비변형된 지질 A 코어(도 5a, 하부 밴드), 및 절두된(truncated) O11 RU에서 예측된 바와 같이 지질 A 코어 및 2개의 FucNAc 잔기로 구성된 LPS에 상응한다. 별도의 IPTG 유도성 플라스미드로부터의 wbjA 야생형 카피의 발현 시, 상부 밴드는 보다 느린 전기영동 이동으로 변동되었는데, 이것은 글루코스 잔기가 절두된 O11 LPS에 부가되었음을 암시한다(도 5a, 레인 2). 예측된 스타필로코커스 아우레우스 글리코실트랜스퍼라제 Cap5I(레인 4) 및 Cap8H(도 5a, 레인 3)가 WbjA 대신에 트랜스로(in trans) 발현되었을 경우, 글리코실화된 지질 A 코어 신호의 유사한 변동이 관찰되었는데, 이것은 가능하게는 글루코스보다 훨씬 더 큰 모노사카라이드, 아마도 ManNAcA의 부가를 암시한다. 이 데이터는 스타필로코커스 아우레우스 글리코실트랜스퍼라제가 슈도모나스 애루기노사 효소의 활성에 의해 합성되는 UndPP-D-FucNAc-L-FuncNAc 당지질을 연장시킬 수 있다는 것을 입증한다.

생합성 기구가 슈도모나스 애루기노사의 O11 O-항원 클러스터에 존재하는 것이 아니라 스타필로코커스 아우레우스 CP5/8 클러스터에 존재하기 때문에, 에스케리치아 콜라이에서의 스타필로코커스 아우레우스 RU 조립을 위한 전제조건이 UDP-ManNAcA의 제공이라는 것도 이 방식으로 확인하였다. 모든 다른 필요한 뉴클레오타이드-활성화된 당들이 에스케리치아 콜라이의 하우스 킵핑 기능 및 슈도모나스 애루기노사의 O11 O-항원 클러스터에 의해 제공된다. 에스케리치아 콜라이는 wecB 및 wecC의 발현을 통해 ManNAcA 글리코실트랜스퍼라제에 대한 기질인 UDP-ManNAcA를 생성하는 것으로 공지되어 있다. 상기 유전자들은 장내세균 공통 항원(ECA) 생합성을 담당하는 클러스터에서 항시적으로 발현된다(문헌[Meier-Dieter, U., R. Starman, K. Barr, H. Mayer, and P. D. Rick. 1990. Biosynthesis of enterobacterial common antigen in Escherichia coli. J Biol Chem 265:13490-13497]). 스타필로코커스 아우레우스의 CP 클러스터에서 발견된 UDP-ManMAcA 생합성을 위한 기능성 상동체(homolog)는 종래 보고된 바와 같이 wecBC의 활성을 보완하는 것으로 밝혀졌다(문헌[Kiser, K. B., N. Bhasin, L. Deng and J. C. Lee. 1999. Staphylococcus aureus cap5P encodes a UDP-N-acetylglucosamine 2-epimerase with functional redundancy. J. Bacteriol 181(16): 4818-24]). 이것은 에스케리치아 콜라이에서의 CP 항원의 생성이 숙주 균주의 wecBC 유전자의 기능성 발현에 의존한다는 것을 보여준다. 따라서, 재조합 시스템에서 Cap5I 및 Cap8H에 대한 기질로서 UDP-ManNAcA를 제공하기 위해, WecB 및 WecC가 발현되어야 한다는 것이 확인되었다. 이러한 시스템에서, 장내세균 공통 항원을 발현하는 임의의 원핵 균주, 예컨대, 에스케리치아 콜라이 야생형 균주, 예를 들면, wecA 결실을 갖거나 갖지 않고 추가 wzzE 결실을 갖거나 갖지 않는 W3110계 종류의 세포를 사용할 수 있다.

스타필로코커스 아우레우스 캡슐형 폴리사카라이드의 추가 연장은 글리칸의 최대 면역학적 활성을 위해 필요한 것으로 생각된다. cap5J/cap8I 유전자는 반복 단위를 중합하는 wzy 상동체를 코딩하고, cap5K/cap8K는 UndPP-결합된 트라이사카라이드를 막의 세포질 쪽으로부터 원형질막주위공간 쪽으로 전위시키는 플립파제를 코딩한다. cap5H/cap8I는 RU의 위치 3'에서 L-FucNAc 또는 위치 4'에서 ManNAcA를 변형시키는 O-아세틸트랜스퍼라제를 코딩한다(문헌[Bhasin, N., A. Albus, et al. (1998). "Identification of a gene essential for O-acetylation of the Staphylococcus aureus type 5 capsular polysaccharide." Mol Microbiol 27(1): 9-21]). 아세틸화는 상기 폴리사카라이드의 면역학적 반응성을 차별화하는 중요한 결정인자이다(문헌[Fattom, A. I., J. Sarwar, L. Basham, S. Ennifar, and R. Naso. 1998. Antigenic determinants of S. aureus type 5 and type 8 capsular polysaccharide vaccines. Infect Immun 66:4588-92]). RU가 연장될 수 있고 아세틸화될 수 있다는 것을 보여주기 위해, 중합 및 O-아세틸화를 담당하는 스타필로코커스 아우레우스 효소들을 돌연변이된 O11 클러스터의 존재 하에서 별도의 플라스미드로부터 발현시켰다. O11 wbjA ::Tn50<dhfr -1>wzy::cat 클러스터, 및 CP5 클러스터의 상이한 유전자들을 발현하는 W3110 Δ wecA 세포로부터의 추출물을 프로테이나제 K로 처리하였고 SDS-PAGE, 전기전달(electrotransfer) 및 이어서 항-CP5 당(제이 씨 리(J. C. Lee)(하버드 의과대학 브림감 부인과병원 의학부; 미국 매사추세츠주 보스톤 소재)로부터 입수됨)을 사용한 면역블롯팅으로 분석하였다. 도 5b는 SDS-PAGE 및 전기전달에 의해 분리된 프로테이나제 K 처리된 에스케리치아 콜라이 추출물을 항-CP5 항혈청을 사용하여 면역검출한 결과를 보여준다. 분석된 모든 추출물들이 본원에 기재된 바와 같은 pLAFR 플라스미드로부터 발현되는 wbjA 및 부분적으로 (별표로 표시된) wzy 유전자의 결실을 갖는 슈도모나스 애루기노사 O11 클러스터를 함유하였고 이들 세포들에서 CP5 중합 및 O-아세틸화를 가능하게 하는 (표시된 바와 같은) 상이한 Cap5 단백질들을 발현하는 2개 플라스미드(pEXT22, pACT3)를 더 함유하였다. 실험 세부사항, 예컨대, 유도제 농도 및 발현 배양 항온처리 온도가 표시되어 있다.

도 5b에서, 결과는 고분자량의 O-항원 중합체에 대해 전형적인 신호와 같은 래더를 보여준다. 상이한 밴드들은 프로테이나제 K 분해에 대한 안정성을 나타내는 LPS 또는 UndPP 상의 선형으로 중합된 상이한 수의 RU를 나타낸다. O-아세틸트랜스퍼라제의 존재 또는 부재 하에서 래더 유사 구조의 상이한 강도가 관찰되었다. 강한 신호는 cap5H의 존재에서 검출된 반면(도 5b, 레인 1 내지 4), cap5H를 갖지 않는 레인에서는 사실상 존재하지 않았다(도 5b, 레인 5 및 6). 이것은 O-아세틸화가 특이적 항혈청에 의한 인식을 증가시킨다는 것, 또는 O-아세틸화가 플립핑 또는 중합 자체를 더 효율적으로 가속화시키거나 더 많은 RU 생성을 유도함으로써 중합 활성을 증강시킨다는 것을 의미한다. cap5H가 별도의 플라스미드로부터 단독으로 발현된 경우 신호 강도가 더 강하지만(도 5b의 레인 1을 레인 3과 비교하고, 도 5b의 레인 2를 레인 4와 비교함), cap5H 유전자는 상이한 골격 플라스미드로부터 발현된 경우 기능성을 나타낸다(도 5b, 레인 1, 2, 3 및 4). 스타필로코커스 아우레우스 유전자의 유도를 위해 보다 적은 IPTG가 사용될수록 신호가 보다 강해졌다는 것(도 5b의 레인 1을 레인 2와 비교하고, 도 5b의 레인 3을 레인 4와 비교함)은 놀랍고도 주목할만하다.

실시예 2: 에스케리치아 콜라이 세포에서 지질 상에서의 CP5 및 CP8 중합체의 합성

cap5 특이적 유전자의 높은 발현이 중합체 형성을 낮추기 때문에, 이 문제점을 해결하기 위해 재조합 글리칸에 대한 대안적 발현 시스템을 구축하였다. 구체적으로, 종래 기술에 비추어 볼 때 예측되지 않는 신규 방법에서, O11의 슈도모나스 애루기노사 글리코실트랜스퍼라제(wbjA) 및 폴리머라제(wzy)를, 스타필로코커스 아우레우스 Mu50/MW2의 캡슐형 유전자 클러스터로부터의 CP5/8 특이적 요소(cap5/8 HIJK 및 이의 일부)를 코딩하는 유전자로 치환시켜 슈도모나스 애루기노사 O11 및 스타필로코커스 아우레우스 CP5 또는 CP8 유전자로 구성된 단일 키메라 유전자 클러스터를 생성하였다(도 6). 상기 구축물은 스타필로코커스 아우레우스의 특이적 유전자들을 함유하였다. 다트센코(Datsenko) 등의 방법(문헌[Datsenko, K. A., and B. L. Wanner. 2000. One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc Natl Acad Sci USA 97:6640-5])에 따라, 발현 검출을 위해 각각의 구축물에 태그를 부착시켰고, 각각의 구축물은 도입된 리보좀 결합 부위에 이어서 재조합된 클론의 선택을 위한 클로람페니콜 내성 카세트(cat)를 함유함으로써 서열번호 2, 서열번호 3 및 서열번호 4를 발생시켰다.

도 6은 본 발명의 키메라 O11/CP5 및 O11/CP8 유전자 클러스터를 구축하는 본 발명의 방법의 한 실시양태를 보여준다. 스타필로코커스 아우레우스 CP5 및 CP8 CP 클러스터(상부), 및 슈도모나스 애루기노사 PA103 rfb 클러스터(O11, 중간)는 공개된 바와 같이 표시되어 있다(문헌[Dean, C. R., C. V. Franklund, J. D. Retief, M. J. Coyne, Jr., K. Hatano, D. J. Evans, G. B. Pier, and J. B. Goldberg. 1999. Characterization of the serogroup O11 O-antigen locus of Pseudomonas aeruginosa PA103. J Bacteriol 181:4275-84; Sau, S., N. Bhasin, E. R. Wann, J. C. Lee, T. J. Foster and C. Y Lee. 1997. The S. aureus allelic genetic loci for serotype 5 and 8 capsule expression contain the type-specific genes flanked by common genes. Microbiology 143 (Pt 7): 2395-405]). 상기 유전자들의 상동 기능은 이하에 기재되어 있다. 완전한 정방향 대각선은 상기 2종의 유기체에서 UndPP 상에서의 D-FucNAc-L-FucNAc 다이사카라이드의 합성을 담당하는 유전자를 표시하고; 점선은 제3 모노사카라이드를 RU에 부가하는 글리코실트랜스퍼라제를 표시한다. wzx 유사 플립파제 유전자는 부러진 정방향 대각선으로 표시되어 있고, wzy 유사 RU 폴리머라제 유전자는 부러진 역방향 대각선으로 표시되어 있다. CP5 클러스터는 Wzz 길이 조절제(빈 화살표)를 함유하지 않지만, 스타필로코커스 아우레우스에서 작용하는 길이 조절제를 포함하는, 캡슐형 폴리사카라이드에 대한 이출 기구를 구성하는 3개 유전자의 세트(빈 화살표)를 함유한다. 완전한 정방향 대각선으로 표시된 O-아세틸트랜스퍼라제 유전자는 CP 클러스터에만 존재한다. 스타필로코커스 아우레우스에서 UDP-ManNAcA 생합성에 필요한 유전자들은 흑색으로 표시되어 있다. 이들은 슈도모나스 애루기노사 O-항원의 생성을 위해서는 필요하지 않다. O11, CP5 및 CP8 폴리사카라이드의 구조적 차이의 원인이 되는 유전자들은 각각의 유전자 클러스터의 시작부(O11: wbjA 및 wzy) 또는 중간부(CP5/8: cap5/8 HIJK)에서 함께 밀집되어 있다. CP8 클러스터는 구조적 특이성을 부여하는 중간부(cap5/8 HIJK)를 제외하고 길이 및 DNA 서열을 고려할 때 CP5 클러스터와 거의 동일하다. 상기 키메라 클러스터는 상동 재조합 및 고전적인 클로닝을 이용하여 플라스미드 유래의 O11 클러스터의 wbjA 및 wzy 유전자를 CP5(또는 CP8) 클러스터의 특이성 부분(cap5/8 HIJK) 및 빈 화살표로 표지된 cat로 표시된 클로람페니콜 아세틸트랜스퍼라제 카세트(cat, 선택을 위한 것임)로 치환시켜 서열번호 2, 서열번호 3 및 서열번호 4를 발생시킴으로써 구축되었다. 부러진 화살표에서 별표는 상동 재조합에 사용된 불완전한 유전자 서열을 표시한다. 서열번호 3 및 서열번호 4의 DNA를 나타내는 생성된 2개의 키메라 클러스터는 하부 패널에 제시되어 있다.

본 발명의 키메라 CP5 및 CP8이 놀랍게도 UndPP 상에서 정확한 RU를 조립한다는 것을 입증하고 반복 단위가 중합된다는 것을 확인하기 위해, 전체 키메라 클러스터를 함유하는 에스케리치아 콜라이 세포(W3310 Δ wecA)의 프로테이나제 K 분해물을 SDS-PAGE로 분리하였다. 구체적으로, pLAFR 플라스미드 상에서 키메라 CP5 유전자 클러스터(도 7a) 또는 키메라 CP8 유전자 클러스터(도 7b)를 함유하거나 결여하는 플라스미드를 갖는 세포를 프로테이나제 K로 처리하였고 SDS-PAGE로 분리하였고, 은 염색(도 7a 및 7b의 좌측 패널), 또는 니트로셀룰로스 막으로의 전기전달 후 항-CP5 또는 항-CP8 항혈청을 사용한 면역검출(도 7a 및 7b의 우측 패널)을 이용하여 지질을 가시화하였다. 플립파제 유전자 cap5K를 결여하는 구축물(서열번호 2) 및 플립파제 유전자 cap5K를 함유하는 구축물(서열번호 3)을 시험하였다. 전자는 CP5 LPS 생성에 있어서 보다 낮은 활성을 나타내는 것으로 밝혀졌다.

전기전달, 및 항-CP5 특이적 혈청을 사용한 면역검출 후, 전체 키메라 CP5 클러스터를 발현하는 추출물은 그의 동종 혈청으로 프로빙된 에스케리치아 콜라이로부터의 내재성 O-항원 구조체와 유사한 신호와 같은 래더를 보인다(도 7a, 우측 마지막 2개의 레인). 이것은 CP5 반복 단위가 중합된다는 것, 바람직한 중합체 길이가 있다는 것, 및 CP5 항원이 이들 세포들에서 지질 A 코어로 전달된다는 것을 강하게 암시한다. 동일한 추출물을 SDS-PAGE 후 은 염색으로 가시화하였는데(도면의 좌측 면에 있는 도 7a), 키메라 CP5(cap5K를 갖지 않음) 및 키메라 CP5로 표지된 우측 상의 2개의 레인은 CP5 O-항원 유사 구조체로 장식된 에스케리치아 콜라이의 지질 A 코어로 구성된 LPS가 실제로 형성된다는 것을 보여준다. cap5K 플립파제 유전자를 갖거나 갖지 않는 CP5 키메라 클러스터를 발현하는 세포로부터 유래된 추출물들로부터 강도 차이가 수득되었다. 2개의 추출물의 비교는 Cap5K 발현이 중합체 생성을 상당히 증가시킨다는 것을 보여준다(도 7a의 양쪽 페널에서 중간 레인과 우측 레인을 비교함).

도 7b에 나타낸 바와 같이, CP8 키메라 클러스터를 사용한 경우 동일한 결과가 관찰되었다. pLAFR 플라스미드 상에서 키메라 CP8 유전자 클러스터를 함유하거나 결여하는 플라스미드를 함유하는 세포를 프로테이나제 K로 처리하였고 SDS-PAGE로 분리하였고, 은 염색(좌측 패널), 또는 니트로셀룰로스 막으로의 전기전달 후 항-CP8 항혈청을 사용한 면역검출(우측 패널)을 이용하여 지질을 검출하였다. 플립파제 유전자 cap8K를 함유하는 CP8 키메라 구축물은 서열번호 4에 상응한다.

본 발명의 놀라운 추가 신규 확장은 에스케리치아 콜라이에서 상기 키메라 클러스터의 유지 및 발현을 위해 사용되는 플라스미드 골격을 변화시킴으로써 발생되었다. 키메라 CP5 클러스터를 함유하는 pLAFR1 내의 내성 카세트는 Tet에서 Kan으로 교체하였다. 추가로, cap5K를 함유하는 전체 CP5 키메라 클러스터를 리(Lee) 등의 방법(문헌[Lee, D. J., L. E. Bingle, K. Heurlier, M. J. Pallen, C. W. Penn, S. J. Busby and J. L. Hobman. 2009. Gene doctoring: a method for recombineering in laboratory and pathogenic Escherichia coli strains. BMC Microbiol 9: 252])에 따라 플라스미드 pDOC-C 및 pACYC177(유전자은행 수납번호 #X06402) 내로 서브클로닝하였다.

도 8a 및 8b에 나타낸 바와 같이, SDS-PAGE, 전기전달, 및 항-CP5 특이적 항혈청을 사용한 면역검출로 분석하였을 때 이들 플라스미들 모두가 CP5 중합체 생성을 제공하였다. 도 8a에서, 상이한 키메라 클러스터들을 함유하는 세포들로부터의 총 세포 추출물을 프로테이나제 K로 처리하였고 SDS-PAGE 및 은 염색으로 분석하였다. 플라스미드들은 다음과 같이 표시된 상이한 스타필로코커스 아우레우스 특이적 유전자들, 및 항생제 선택을 위해 사용되는 상이한 내성 유전자들을 함유한다: 테트라사이클린(Tet) 및 HIJ, 서열번호 2; Tet HIJK, 서열번호 3; Tet 및 유전자 부재; 빈 플라스미드 대조군(숫자는 분자량 마커에 상응함). 가나마이신(Kan)으로 표지된 레인은 테트라사이클린 내성 카세트가 가나마이신 내성 유전자로 치환되어 있는 서열번호 3의 변이체를 함유한다.

도 8b에서, 숙주 균주는 도 8a에서와 마찬가지로 에스케리치아 콜라이 W3110 Δ wecA이었다. 도 8b에서 좌측 레인은 도 8a에서와 마찬가지로 분자량 마커에 상응한다. 도 8b에서, 상이한 키메라 클러스터들을 함유하는 세포로부터의 총 세포 추출물을 프로테이나제 K로 처리하였고 SDS-PAGE 및 은 염색으로 분석하였고(좌측 패널) 전기전달 후 항-CP5 면역블롯팅으로 분석하였다(우측 패널). 사용된 플라스미드들은 테트라사이클린 대신에 가나마이신 카세트를 함유하는 변형된 pLAFR1 플라스미드 골격(도 8a 참조)에 존재하거나 클로람페니콜 내성 카세트를 함유하는 pACYC에 존재하는 서열번호 3으로 표시된 키메라 CP5 클러스터를 함유한다.

추가로, 키메라 O11-CP5 LPS를 발현시키기 위해 상이한 프로모터들을 시험하였다. 이들 시험에서, 숙주 균주는 키메라 CP5 클러스터를 보유하는 에스케리치아 콜라이 W3110 Δ wecA이었다. 이 균주에서, 상기 키메라 클러스터는 wecAwzzE 유전자를 치환시켰다. pLAFR1로부터 발현된 상이한 키메라 클러스터들을 함유하는 세포로부터의 총 세포 추출물을 프로테이나제 K로 처리하였고 SDS-PAGE 및 전기전달 후 항-CP5 면역블롯팅으로 분석하였다. 플라스미드는 wbjA 및 wzy가 도 9의 레인 아래에 표시된 바와 같은 상이한 스타필로코커스 아우레우스 특이성 유전자들(cat 카세트를 가짐)로 치환되어 있는 O11 클러스터를 함유하였다. 추가로, cap5 특이성 유전자의 앞에 위치한 DNA를 변화시켰고 지질 글리코실화에 대한 효과를 분석하였다. 이들 상이한 프로모터 영역들의 효과는 도 9에 도시된 바와 같이 분석하였다. wzz/wzx는 초기 상동 재조합 후 cap 유전자 앞에 위치한 원래의 유전자(도 6 참조)를 표시한다(처음 2개의 레인에 상응하는 도 9). 이들 2개의 유전자를 제거하였고(중간 3개의 레인에 상응하는 도 9) 강한 프로모터 서열을 코딩하는 에스케리치아 콜라이 O121 O-항원 클러스터 앞에 있는 0.6 kb 영역(PO121)으로 치환시켰다(마지막 3개의 레인에 상응하는 도 9). 도 9에서 wzz/wzx 및 HIJ로 표시된 레인들은 서열번호 2를 발현하는 세포로부터 유래되었고, wzz/wzx 및 HIJK로 표시된 레인들은 서열번호 3으로부터 유래되었다. 도 9에서 분자량 마커는 겔 프레임의 좌측에 표시되어 있다.

도 9에 나타낸 바와 같이, 결과는 관련 프로모터 활성이 wzx 유전자에 존재하고(도 9의 처음 2개 레인 - wzz/wzx) LPS 생성 기능을 상실하지 않으면서 상기 프로모터가 에스케리치아 콜라이로부터의 항시적 프로모터, 예를 들면, 혈청형 O121 wb 프로모터(PO121, 도 9의 마지막 3개 레인)로 기능적으로 치환될 수 있다는 것을 보여주었다. 종합하건대, 이들 결과들은 본원에 기재된 바와 같은 O11 O-항원 및 CP5 캡슐형 중합체 생성을 위한 O11 및 스타필로코커스 아우레우스 요소들이 많은 상이한 에스케리치아 콜라이 발현 시스템들에서 조합되어 재조합 스타필로코커스 아우레우스 폴리사카라이드를 생성할 수 있다는 것을 의미한다.

이들 결과들은 그람-양성 유기체로부터 유래된 캡슐형 폴리사카라이드 구조체를 에스케리치아 콜라이에서 생성할 수 있다는 것을 처음으로 보여주었다. 이것은 종래 기술 및 통상적인 예측과 대조적으로 O11 클러스터의 효소들을 스타필로코커스 아우레우스 cap 클러스터의 효소들과 조합하여 키메라 폴리사카라이드를 구축할 수 있었다는 것, 즉 상기 효소들이 생체내에서 동일한 구조체에 함께 작용한다는 것을 의미한다.

실시예 3: 재조합 글리칸의 분자 구조 확인

에스케리치아 콜라이에서 키메라 CP5/O11 클러스터의 활성을 분자 수준에서 확인하기 위해, 환원 말단에서 2-아미노벤즈아미드(2-AB)를 사용한 당의 형광 표지를 이용함으로써 UndPP-연결된 당의 분석을 가능하게 하는 신규 방법을 개발하였다. 분석 해상도를 증강시키기 위해, 비중합된 RU의 양을 증가시키는 결실을 함유하는 키메라 클러스터를 사용하였다. pLAFR1 플라스미드에 함유된 키메라 클러스터를 발현하고 cap5K 플립파제를 결여하는(서열번호 2) 상이한 에스케리치아 콜라이 세포들로부터의 당지질을 이하에 기재된 바와 같이 분석하였다.

UndPP-연결된 글리칸을 추출하기 위해, 에스케리치아 콜라이 세포를 0.9% NaCl로 세척하고 동결건조하였다. 건조된 세포를 30 ㎖의 유기 용매(85% 내지 95% 메탄올 = M)로 1회 추출하였다. 동결건조된 세포 펠렛을 5 ㎖ 클로로포름:메탄올:물(C:M:W = 10:10:3; 부피/부피/부피)로 2회 더 추출하였다. (M) 추출물을 클로로포름 및 물을 사용하여 3:48:47(C:M:W)의 최종비로 전환시켰다. 물을 첨가하여 최종 비가 10:10:9(C:M:W)가 되게 함으로써 10:10:3(C:M:W) 추출물을 2상 블라이/드와이어(Bligh/Dyer) 시스템(문헌[Bligh, E. G. and W. J. Dyer. 1959. A rapid method of total lipid extraction and purification. Can J Biochem Physiol 37(8): 911-7])으로 전환시켰다. 층을 원심분리하여 분리하였고, 상부 수층을 추가 가공을 위해 보관하였다.

추출된 당지질을 정제하기 위해, 수층을 tC₁₈ Sep-PAK 카트리지로 처리하였다. 상기 카트리지를 10 ㎖ 메탄올로 컨디셔닝한 후 10 ㎖ 3:48:47(C:M:W)로 평형화시켰다. 샘플을 적재한 후, 상기 카트리지를 10 ㎖ 3:48:47(C:M:W)로 세척하였고 5 ㎖ 메탄올 및 5 ㎖ 10:10:3(C:M:W)으로 용출하였다. 조합된 용출물을 N₂ 하에서 건조하였다. 상기 건조된 샘플을 2 ㎖ n-프로판올:2 M 트라이플루오로아세트산(1:1)에 용해시키고 50℃에서 15분 동안 가열한 후 N₂ 하에서 증발시켜 건조함으로써 당지질 샘플을 가수분해하였다(문헌[Glover, K. J., E. Weerapana and B. Imperiali. 2005. In vitro assembly of the UndPP-linked heptasaccharide for prokaryotic N-linked glycosylation. Proc Natl Acad Sci USA 102(40): 14255-9]). 건조된 샘플을 2-AB로 표지하였고, 문헌(문헌[Bigge, J. C, T. P. Patel, J. A. Bruce, P. N. Goulding, S. M. Charles, R. B. Parekh. 1995. Nonselective and efficient fluorescent labeling of glycans using 2-amino benzamide and anthranilic acid. Anal Biochem 230(2): 229-38; Merry, A. H., D. C. Neville, L. Royle, B. Matthews, D. J. Harvey, R. A. Dwek and P. M. Rudd. 2002. Recovery of intact 2-aminobenzamide-labeled O-glycans released from glycoproteins by hydrazinolysis. Anal Biochem 304(1): 91-9])에 기재된 바와 같은 페이퍼 디스크 방법을 이용하여 글리칸 세정을 수행하였다. 로일(Royle) 등에 따른 글리코셉-N 순상 컬럼(GlycoSep-N normal phase column)을 이용하되 3 용매 시스템으로 변형된 HPLC를 이용하여 2-AB 표지된 글리칸을 분리하였다(문헌[Royle, L., T. S. Mattu, E. Hart, J. I. Langridge, A. H. Merry, N. Murphy, D. J. Harvey, R. A. Dwek, P. M. Rudd. 2002. An analytical and structural database provides a strategy for sequencing O-glycans from microgram quantities of glycoproteins. Anal Biochem 304(1): 70-90]). 용매 A는 80% 아세토니트릴 중의 10 mM 암모늄 포르메이트(pH 4.4)이었다. 용매 B는 40% 아세토니트릴 중의 30 mM 암모늄 포르메이트(pH 4.4)이었다. 용매 C는 0.5% 포름산이었다. 컬럼 온도는 30℃이었고, 2-AB 표지된 글리칸은 형광(여기 λex = 330 nm, 방출 λem = 420 nm)에 의해 검출되었다. 구배 조건은 0.4 ㎖/분의 유속으로 160분 동안 100% A 내지 100% B를 사용하는 선형 구배 후, 1 ㎖/분까지 유속을 증가시키면서 2분 동안 100% B 내지 100% C를 사용하는 선형 구배이었다. 상기 컬럼을 100% C로 5분 동안 세척하였고, 2분 동안 100% A로 회복시켰고 1 ㎖/분의 유속으로 100% A에서 15분 동안 런닝한 후, 유속을 5분 동안 0.4 ㎖/분으로 회복시켰다. 물 중의 샘플을 주입하였다.

건조된 분획을 5 ㎕의 10% 아세토니트릴(ACN) 및 0.1% 트라이플루오로아세트산(TFA)에 재현탁시켰고 표적 플레이트 상에서 매트릭스 용액(50% ACN 및 0.1% TFA 중의 40 mg/㎖ DHB)과 1:1로 혼합하였다. MS 및 MS/MS 데이터를 울트라플렉스(Ultraflex)-II MALDI-ToF/ToF 질량 분광계(브룩커 달토닉 게엠베하(Bruker Daltonik GmbH), 독일 브레멘 소재) 상에서 양성 이온 모드로 수동으로 획득하였다. MS/MS를 LIFT 방법을 이용하여 수득하였다. 표준 펩티드 혼합물(브룩커 달토닉 게엠베하)을 외부 보정에 사용하였다. 플렉스 분석 소프트웨어(브룩커 달토닉 게엠베하)를 이용하여 분광을 이출하였고 수동으로 분석하였다.

키메라 클러스터를 갖거나(굵은 선) 갖지 않는(얇은 점선) 플라스미드를 함유하는 에스케리치아 콜라이 W3110 Δ wecA(CP5)로부터의 메탄올 추출물을 tC₁₈ 카트리지 상에서 정제하였고 순상 HPLC로 분석하였다. 37', 40' 및 45' 용출에서 발견된, 도 10a에 나타낸 피크들에 상응하는 분획들을 MALDI-MS/MS로 분석하였다. 37분 및 40분에서 용출된 샘플은 각각 부착된 O-아세틸 기를 갖는 재조합 CP5 RU, 및 부착된 O-아세틸 기를 갖지 않는 재조합 CP5 RU로서 확인되었다. 45분에서 용출된 샘플은 1개의 데옥시-N-아세틸헥소스아민(도 1e에 나타낸 바와 같음)에 의해 연장된 비아세틸화된 스타필로코커스 아우레우스 RU 구조체로서 확인되었다. CP5 키메라 클러스터에서, cap5HIJ는 pLAFR 상의 O11 클러스터의 wbjA 및 wzy 유전자들을 치환시켰다. 상기 치환은 cap5HIJ 유전자 이외에 cat 카세트를 수반하였다(서열번호 2).

키메라 클러스터를 갖거나(굵은 선) 갖지 않는(얇은 점선) 플라스미드를 함유하는 에스케리치아 콜라이 W3110 Δ wecAwzzE로부터의 메탄올 추출물을 tC₁₈ 카트리지 상에서 정제하였고 순상 HPLC로 분석하였다. 도 10b는 키메라 클러스터(중합효소를 갖지 않는 서열번호 4)를 사용하여 제조한 CP8의 재조합 RU의 HPLC 분석 결과를 보여준다. 재조합 당을 발현하는 세포에 대해 특이적인 피크들을 용출의 23', 32', 38' 및 45'에서 확인하였고 수집하였고 MALDI-MS 및 MALDI-MS/MS로 분석하였다. C8 키메라 클러스터에서, cap8HJK는 O11 클러스터, 즉 폴리머라제를 갖지 않는 구축물의 wbjA 및 wzy 유전자들을 치환시켜 분석을 위한 단일 RU를 축적시켰다. 상기 치환은 cap 유전자 이외에 cat 카세트를 수반하였다.

도 11a는 37분에서 용출된 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태의 발현에 의해 발생된 특이적 피크의 MALDI-MS/MS 분석 결과를 보여준다. 주 질량 m/z=772([M+H]⁺)를 선택하여 MS/MS로 분석하였는데, 이것은 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 아세틸화된 CP5 RU 구조체와 일치하는 단편화 패턴을 보여준다. O-아세틸화된 종은 상기 RU의 중간 위치에서 42 플러스 모노사카라이드 FucNAc(dHexNAc(OAc))의 질량의 특이적 상실을 특징으로 한다. 단편 이온은 기능성 글리코믹스 협회인 CFG(www.functionalglycomics.org/static/consortium/Nomenclature.shtml)의 명명법에 따라 표시되어 있다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11a의 삽입도에 제시되어 있다.

도 11b는 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태를 발현시킴으로써 발생된 (40분에 용출된) 특이적 피크의 MALDI-MS/MS 분석 결과를 보여준다. m/z=730([M+H]⁺)의 주 질량을 선택하여 MS/MS로 분석하였는데, 이것은 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 비아세틸화된 CP5 RU 구조체와 일치하는 단편화 이온 시리즈를 보여준다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11b의 삽입도에 제시되어 있다.

도 11c는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (32분에 용출된) 특이적 피크의 MALDI-MS/MS 분석 결과를 보여준다. m/z=794([M+Na]⁺)의 주 질량을 선택하여 MS/MS로 분석하였는데, 이것은 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 아세틸화된 CP8 RU 구조체와 일치하는 단편화 이온 시리즈를 보여준다. O-아세틸화된 종은 42 플러스 상기 RU의 최외각 위치에 존재하는 모노사카라이드 ManNAcA(HexNAcA(OAc))의 질량의 특이적 상실을 특징으로 한다. 단편 이온은 CFG의 명명법에 따라 표시되어 있다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11c의 삽입도에 제시되어 있다.

도 11d는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (38분에 용출된) 특이적 피크의 MALDI-MS/MS 분석 결과를 보여준다. m/z=730([M+H]⁺)의 질량을 선택하여 MS/MS로 분석하였는데, 이것은 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 비아세틸화된 CP8 RU 구조체와 일치하는 단편화 이온 시리즈를 보여준다. 추가 분석은 후기 용출 피크들(도 10a에서 40분 및 도 10b에서 38분에 나타남)이 CP5 RU 및 CP8 RU의 비-O-아세틸화된 트라이사카라이드를 함유한다는 것을 보여주었다. 단편 이온은 CFG의 명명법에 따라 표시되어 있다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11d의 삽입도에 제시되어 있다.

MS 결과는 질량 및 단편화 이온 시리즈가 중간 FucNAc 잔기의 O-아세틸화를 갖는 CP5 RU 올리고사카라이드(즉, 도 10a 및 도 11a에서 37'에 나타난 피크) 또는 중간 FucNAc 잔기의 O-아세틸화를 갖지 않는 CP5 RU 올리고사카라이드(즉, 도 10a 및 11b에서 피크 40')의 분자 구조와 일치한다는 것을 보여주었다. 도 10a에서 45분에 나타나는 신호는 이하에 더 분석되는 바와 같이 테트라사카라이드로서 확인되었다. 폴리머라제 유전자를 결여하는 키메라 CP8 클러스터를 사용하여 동일한 분석을 반복하였다. 이러한 추출물에서, 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 O-아세틸화된 RU 구조체와 일치하는 신호가 도 10b 및 11c에 나타낸 바와 같이 용출의 23' 및 32'에서 발견되었다. MALDI-MS/MS에 의해 확인된 바와 같이 동일한 글리칸 서열에 대한 2개의 상이한 용출 시간의 존재는 O-아세틸 이동이 샘플 제조 동안 일어난다는 것을 암시한다. 비아세틸화된 RU는 각각 도 11b 및 11d에 나타낸 바와 같이 40' 및 38'에서 CP5 추출물 및 CP8 추출물에 대해 확인되었다. CP5 RU 구조체 및 CP8 RU 구조체가 예를 들면, W3110, W3310 Δ wecA, W3110 Δw ecAwz zE 및 W3110 Δ wecAwzzE Δ waaL을 포함하는 상이한 에스케리치아 콜라이 균주들에 존재하였다.

실시예 4: 반복 단위 구조체의 개선 및 이의 분석

키메라 CP8 클러스터(서열번호 4)를 발현하지만 wzy 폴리머라제 유전자 cap8I를 결여하는 에스케리치아 콜라이 세포로부터 유래된, 45분에서 용출된 도 10b에 나타낸 HPLC 피크도 MALDI-MS/MS로 분석하였다. 전체 스캔 MS에서 가장 강한 이온은 m/z=939([M+H]⁺)이었고, 서열 분석을 MS/MS로 수행하였다. 이 MS/MS 분석의 결과는 도 11e에 나타나 있고, 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 바와 같이 비환원 말단에서 1개의 데옥시-N-아세틸헥소스아민에 의해 연장된 비아세틸화된 스타필로코커스 아우레우스 캡슐형 RU와 일치하는 단편화 이온 시리즈를 제공한다. 가상 구조에 상응하는 단편 이온은 CFG의 명명법에 따라 피크 위에 표시되어 있다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11e의 삽입도에 제시되어 있다.

도 11e에 나타낸 결과는 에스케리치아 콜라이 글리코실트랜스퍼라제가 CP8 RU의 ManNAcA 잔기를 변형시킬 수 있었다는 것을 암시하였다. 이러한 변경된 RU는 아마도 cap8I에 의해 중합되지 않을 것이다. 에스케리치아 콜라이 숙주 W3110에서의 글리코실트랜스퍼라제 특이성의 분석은 ECA 클러스터로부터의 효소가 재조합 당, 특히 4-N-아세틸푸코스아민 트랜스퍼라제로 추정되는 wecF 유전자 생성물을 방해할 수 있다는 것을 암시하였다. WecF는 4-N-아세틸푸코스아민을 ECA에 포함된 ManNAcA 상으로 천연적으로 부가하고, 아마도 상기 효소는 CP8 및 CP5 RU도 연장시킬 수 있을 것이다.

이 문제점을 해결하기 위해, 또 다른 신규 방법을 개발하였다. 구체적으로, wecC 유전자의 하류에 위치하는 wecF를 포함하는 ECA 클러스터의 유전자들을 결실시켰다. 이것은 문헌[Datsenko, K. A. and B. L. Wanner (2000). "One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products." Proc Natl Acad Sci USA 97(12): 6640-6645]에 기재된 방법을 이용하여 달성하였다. 상이한 에스케리치아 콜라이 발현 숙주들에서 waaL 및 rmlB-wecG 유전자 영역이 결실되었고, 몇몇 균주에서 wecA-wzzECA도 결실되었다. 폴리머라제 돌연변이체 CP8 키메라 클러스터를 발현하는 이들 돌연변이된 세포로부터의 Sep-PAK 정제된 추출물(메탄올 및 10:10:3 추출물)을 전술된 바와 같이 순상 HPLC로 분석하였다.

도 11f는 ECA 클러스터 유전자 rmlB-wecG의 추가 결실을 갖는 세포(W3110 ΔwaaLΔrmlB-wecG ::cat)(굵은 선)와 비교된, 서열번호 4의 폴리머라제 돌연변이체를 발현하는 에스케리치아 콜라이 W3110 Δ waaL 세포(얇은 점선)로부터의 메탄올 추출물의 HPLC 분석 결과를 제공한다. 추출물을 tC₁₈ 카트리지 상에서 정제하였고 순상 HPLC로 분석하였다. 도 11f에 나타낸 바와 같이, 도 10b에서 45'에 나타나는 주 피크는 존재하지 않았고, 아세틸화된 CP8 RU 및 비아세틸화된 CP8 RU에 대한 특이적 피크가 발생하였는데(도 11f), 이것은 ECA 글리코실트랜스퍼라제 중 하나(아마도 wecF)가 비정상적인 연장 표현형의 원인이라는 것을 암시한다. CP5 키메라 클러스터를 상이한 균주들에서 시험하였을 때 유사한 결과가 수득되었다. 이것은 에스케리치아 콜라이 유래의 글리코실트랜스퍼라제 및 뉴클레오타이드-활성화된 당 생합성에 필요한 효소들을 결실시키는 것이 에스케리치아 콜라이에서 재조합적으로 생성된 폴리사카라이드의 질 및 양을 최적화하는 가능한 방법이라는 것을 암시한다. 표적 효소는 아마도 O-항원 클러스터, ECA 클러스터, 및 콜란산 또는 캡슐 클러스터 내에 코딩되어 있을 것이다.

UndPP에 연결된 재조합 폴리사카라이드의 질에 대한 추가 증거를, 전술된 바와 같이 염색체적으로 최적화된 발현 숙주로부터 Sep-PAK 정제되고 형광 표지된 당지질 추출물의 최적화된 순상 HPLC 분석으로부터 수득하였다. CP5 및 CP8 올리고사카라이드 및 폴리사카라이드에 연결된 하전된 지질의 정제를 위한 Sep-PAK 컬럼의 최적 성능을 위해, Sep-PAK 카트리지에 적재하기 전에 tert-부틸 암모늄 포스페이트(TBAP)를 상기 추출물에 첨가하였다. 트렌트(Trent) 등에 의해 보고된 바와 같이, 이 염의 양이온은 음 전하를 소수성 부틸 쇄로 차폐시킴으로써 하전된 화합물의 컬럼 결합을 개선시킨다(문헌[Trent, M. S., A. A. Ribeiro, et al. (2001). "Accumulation of a polyisoprene-linked amino sugar in polymyxin-resistant Salmonella typhimurium and Escherichia coli: structural characterization and transfer to lipid A in the periplasm." J Biol Chem 276(46): 43132-43144]). 이 최적화된 방법은 폴리머라제를 함유하는 CP5 또는 CP8 키메라 클러스터를 발현하는 세포로부터 메탄올 추출에 의해 수득된 CP5 및 CP8 샘플에 적용되었다.

도 11g는 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 전체 CP5 글리칸 레퍼토리를 보여주는 HPLC 분석 결과를 제공한다. 키메라 CP5 클러스터 SEQ3(직선) 또는 빈 플라스미드 대조군(점선)을 발현하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlB-wecG ::cat로부터의 메탄올 추출물을 Sep-PAK 카트리지 상에서 고체상 추출하였고 약산으로 처리하여 UndPP로부터 당을 가수분해하였다. 생성된 물질을 환원성 아민화를 통해 2-AB와 반응시켜 글리칸의 환원 말단을 표지하였고 순상 HPLC로 분석하였다. 점선이 아니라 직선으로 제시된 신호는 CP5 특이적 물질을 나타낸다. 대문자는 회수된 분획의 MALDI-MS/MS에 의해 확인되는 바와 같이 아세틸화된 CP5 RU 및/또는 비아세틸화된 CP5 RU의 중합체를 함유하는 피크를 표시한다. 도 11g의 범례는 MS/MS 분석으로부터 유추된 바와 같은 제안된 분자 구조를 표시한다. MS/MS에 의해 확인된 동일한 중합도를 갖는 구조를 보인 아세틸화된 RU 중합체 및 비아세틸화된 RU 중합체가 굵은 막대로 표시되는 바와 같이 크로마토그램에서 함께 군을 이루고 있다는 것을 주목해야 한다. 대문자는 하기 길이를 보여준다: A 및 B: 1개의 RU; C, D 및 E: 2개의 RU; F 및 G: 3개의 RU; 및 H: 4개의 RU. 도 11g에서 95'와 125' 사이의 넓은 피크는 아마도 컬럼에 의해 분리되지 않은 5개 이상의 중합된 RU를 나타낼 것이다.

도 11h는 아세틸화된 CP5 글리칸 및 RU 균질성을 보여주는 추가 HPLC 결과를 제공한다. 이 HPLC 분석을 준비하기 위해, (도 11g를 참조하여 전술된 절차에 따라 제조된) 서열번호 3의 키메라 CP5 클러스터를 발현하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlB-wecG ::cat의 2-AB 표지된 글리칸 샘플을 수용액 중의 NaOH로 처리하였고 다시 표지하였다. 도 11h에 나타낸 바와 같이, 알칼리 처리 전의 샘플(점선) 및 알칼리 처리 후의 샘플(직선)을 HPLC로 분석하였다. 도 11h에서 숫자는 상응하는 피크에서 추정되는 RU의 수를 표시한다. 도 11h에서, 도 11g에 나타낸 아세틸화된 피크들이 비아세틸화된 중합체로부터의 신호에서 단일화되어 있고 탈아세틸화가 95분 후 용출 시간에서 RU 단위들을 분리한다는 것을 주시해야 한다.

도 11i는 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 CP8 글리칸 레퍼토리를 보여주는 HPLC 분석 결과를 제공한다. 키메라 CP8 클러스터(서열번호 4)(직선) 또는 빈 플라스미드 대조군(점선)을 발현하는 에스케리치아 콜라이 W3110 Δw a aLΔ wecAwzzECA Δ rmlB-wecG ::cat로부터의 메탄올 추출물을 Sep-PAK 카트리지 상에서 고체상 추출하였고 약산으로 처리하여 UndPP로부터 당을 가수분해하였다. 생성된 물질을 환원성 아민화를 통해 2-AB와 반응시켜 글리칸의 환원 말단을 표지하였고 순상 HPLC로 분석하였다. 점선이 아니라 직선으로 제시된 신호는 CP8 특이적 물질을 나타낸다. 회수된 분획의 MALDI-MS/MS에 의해 확인되는 바와 같이, 아세틸화된 CP8 RU 및/또는 비아세틸화된 CP8 RU로 추정되는 구조체들이 표시되어 있다. 도 11g에 나타낸 CP5를 사용한 HPLC 결과에서와 마찬가지로, 동일한 중합도를 갖는 아세틸화된 CP8 RU 중합체 및 비아세틸화된 CP8 RU 중합체가 굵은 막대로 표시되는 바와 같이 도 11h의 크로마토그램에서 함께 군을 이루고 있다는 것을 주목해야 한다. 110' 후에 검출된 물질은 보다 긴 CP8 중합체를 나타낸다.

도 11j는 CP8 글리칸의 탈아세틸화 및 RU 균질성을 보여주는 추가 HPLC 결과를 제공한다. 서열번호 4의 키메라 CP8 클러스터를 발현하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlB-wecG ::cat로부터의 2-AB 표지된 글리칸 샘플을 수용액 중의 NaOH로 처리하였고 다시 표지하였다. 알칼리 처리 전의 샘플(점선) 및 알칼리 처리 후의 샘플(직선)을 HPLC로 분석하였다. 숫자는 상응하는 피크에서 추정되는 RU의 수를 표시한다. 아세틸화된 피크가 많이 사라지고 비아세틸화된 중합체의 신호가 증가하고 탈아세틸화가 110분 후 용출 시간에서 RU 단위들을 분리한다는 것을 주목해야 한다.

도 11h 및 11j는 이들 CP5 샘플 및 CP8 샘플에 대한 알칼리 처리를 수행하여 상기 올리고사카라이드 및 폴리사카라이드로부터 아세틸화 변형을 제거하였을 때 O-항원의 특징적인 래더 유사 밴딩 패턴을 표시하는 HPLC 결과를 보여준다. 상기 결과는 용출 시간 증가를 일정하게 감소시킴에 따라 불연속적인 날카로운 피크를 보여준다. 이것은 이러한 분석된 탄수화물 쇄들이 동일한 RU로 구성된 선형 중합체라는 것을 암시한다. 이 데이터는 에스케리치아 콜라이에서 생성된 재조합 CP5 당 및 CP8 당이 규칙적으로 중합되고 부분적으로 아세틸화된다는 것을 보여준다. 비아세틸화된 CP5 중합체 및 CP8 중합체는 그들의 구조적 유사성으로부터 예측된 바와 같이 HPLC 컬럼으로부터 유사하게 용출되지만, 순상 크로마토그래피는 차이점도 보여준다: 예를 들면, CP5는 CP8보다 더 낮은 정도로 중합되고, 아세틸화는 CP5에서 더 빈번하고, 4 초과의 RU 길이에서 CP5는 7개의 RU로 구성된 중합체의 제조에 대한 명확한 선호를 나타내는 반면, CP8은 더 넓은 중합도로 중합되고, HPLC 및 MS/MS 결과에 의해 암시되는 바와 같이, CP5는 CP8보다 글리칸 생성에 대해 더 효율적이다.

wzy 의존성 중합 경로에서, 특이적 효소(쇄 길이 결정인자에 대한 wzz 또는 cld)가 수행될 RU 중합 단계의 평균 수를 결정하는 것을 담당한다는 것은 모랄다(Marolda) 등에 의해 보고되었다(문헌[Marolda, C. L., L. D. Tatar, et al. (2006). "Interplay of the Wzx translocase and the corresponding polymerase and chain length regulator proteins in the translocation and periplasmic assembly of lipopolysaccharide O antigen." J Bacteriol 188(14): 5124-5135]). Wzz 효소는 특정 반복부 수 평균, 예를 들면, 짧은 당 중합체, 긴 당 중합체 및 매우 긴 당 중합체를 야기하고 그의 길이 특이성을 외재성(exogenous) 폴리사카라이드 경로에 전달하는 것으로 공지되어 있다. CP8 당지질의 길이 및 양을 생성 균주에서 분석하여 보다 길고 보다 적은 양의 상기 당을 발생시켰다. 분자의 양을 증가시켜 단백질 글리코실화를 위한 당 전달 효율을 증가시키기 위해, CP8 당 길이의 하향조절을 특이적 Wzz 효소를 사용하여 수행하였다.

지질 상의 CP8 당의 크기 및 양에 대한 Wzz 단백질의 효과를 시험하기 위해, 에스케리치아 콜라이 wzzO7로부터의 Wzz의 동시발현을 별개의 플라스미드(서열번호 19)로부터 수행하였다. 도 11k는 이 시험의 결과를 제공한다. 키메라 CP8 클러스터(서열번호 4) 및 플라스미드 유래의 IPTG 유도성 wzzO7 카피(서열번호 21, 직선), 또는 빈 플라스미드 대조군(점선)을 발현하는 에스케리치아 콜라이 W3110 Δw a aLΔ wecAwzzECA Δ rmlB-wecG ::cat로부터의 메탄올 추출물을 Sep-PAK 카트리지 상에서 고체상 추출하였고 약산으로 처리하여 UndPP로부터 당을 가수분해하였다. 2-AB 표지된 글리칸을 순상 HPLC로 분석하였다. CP8 샘플의 알칼리 처리는 95'와 115' 사이의 면적의 85% 초과 면적이 CP8의 7개 또는 8개 RU 중합체를 나타낸다는 것을 보여주었는데, 이것은 매우 다양한 아세틸화를 암시한다. 또한, 이들 결과들은 키메라 CP8 클러스터가 a) 가장 풍부한 글리칸의 반복부 수가 7 내지 8에 집중되게 하였고, b) 크로마토그램 하의 면적으로부터 판단된 바와 같이 형광 신호의 전체 강도를 더 높였다는 것을 암시한다.

알칼리 처리는 도 11i 및 11j에서와 마찬가지로 단축된 글리칸의 아세틸화를 확인시켜주었는데, 이것은 재조합 폴리사카라이드의 길이가 외래 Wzz 효소에 의해 조절될 수 있다는 것을 암시한다. O-항원으로부터 유래된 Wzz 효소를 사용하여 캡슐형 당 중합체 길이를 조절하는 것도 가능하다. 나아가, 상기 키메라 클러스터 앞에 위치하는 상이한 프로모터들이 플라스미드 상에서 존재하는 경우 상이한 발현도 및 상이한 중합도를 야기한다.

실시예 5: CP5 및 CP8 글리칸을 사용한 단백질 글리코실화 및 생성물 특징규명

키메라 클러스터의 상이한 변이체들을 생체접합체 생성에 대해 시험하였다. O11 O-항원 클러스터 내에 wbjA 및 wzy 대신에 스타필로코커스 아우레우스 특이성 영역의 상이한 변이체들을 함유하는 키메라 O11/CP5 유전자 클러스터들(서열번호 2 및 서열번호 3)을 PglB(서열번호 27) 및 EPA(서열번호 13)의 존재 하에서 숙주 균주 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzE ::cat에서 발현시켰다. W3110 ΔwaaLΔ wecAwzzE ::cat 숙주 세포는 wbjA 및 wzy 유전자가 상이한 cap5 유전자 세트(및 cat 카세트, 서열번호 2 및 서열번호 3)로 치환되어 있는 O11 O-항원 클러스터를 갖는 pLAFR1 플라스미드 이외에 별도의 플라스미드로부터 2개의 글리코실화 부위를 갖는 EPA(서열번호 13) 및 PglB(서열번호 27)를 발현하였다.

하기 a) 내지 c)를 함유하는 EPA 단백질이 발현된다: a) 원형질막주위공간으로의 이출을 위한 N-말단 신호 펩티드 서열, b) 전체적으로 본원에 참고로 도입되는 국제특허출원 공보 제WO 2009/104074호의 실시예 10에 기재된 바와 같이 단백질 서열(서열번호 13) 내로 도입된 2개의 세균 N-글리코실화 공통 서열, 및 c) 정제를 위한 헥사 His 태그. 세포를 5 ℓ 삼각 플라스크 내의 LB 배지에서 성장시켰다. 밤샘 배양물을 0.05의 OD_600nm까지 희석하였다. 약 0.5의 OD_600nm에서 1 mM IPTG를 첨가하여 PglB 발현을 유도하였고, 아라비노스(0.2% 최종 농도)를 첨가하여 EPA 발현을 유도하였다. 세포를 4시간 동안 성장시켰고, 유도를 반복하였고, 세포를 추가 약 16시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트(spheroplast)를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni² ⁺친화성 크로마토그래피 상에 적재하였다. 스타필로코커스 아우레우스 플립파제 유전자 cap5K를 갖지 않는 EPA-CP5 생체접합체 및 스타필로코커스 아우레우스 플립파제 유전자 cap5K를 갖는 EPA-CP5 생체접합체(각각 서열번호 2 및 서열번호 3)를 0.5 M 이미다졸로 용출하였고, 용출된 피크들을 풀링하여 SDS-PAGE로 분석하였고 코마시에 및 은으로 염색하였다(도 12).

도 12는 SDS-PAGE 결과를 제공한다. 좌측 패널은 코마시에 염색을 보여주고, 우측 패널은 은 염색을 보여준다. 중간에 있는 숫자는 분자량 마커의 크기를 표시한다. 레인 아래에 있는 문자는 생체접합체 생성에 사용된 균주들에서 발현된 키메라 클러스터에 존재하는 유전자들을 표시한다. 숙주 균주는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzE ::cat이었다. 결과는 아마도 비글리코실화된 EPA에 상응하는 70 kDa(전기영동 이동)에서 단백질 신호, 및 위에 존재하는 밴드의 래더(100 kDa 내지 170 kDa)를 보여준다. 상기 래더는 아마도 CP5 재조합 스타필로코커스 아우레우스 글리칸으로 글리코실화된 EPA 단백질에 상응한다. 또한, 상기 결과는 플립파제 유전자를 시스템 내에 포함시킨 것이 당단백질 수율을 증가시킨다는 것(중간 레인 및 우측 레인)을 암시한다.

별도의 분석에서, 키메라 CP5 유전자 클러스터(서열번호 3), 플라스미드 pEXT21로부터의 PglB(서열번호 27) 및 별도의 플라스미드로부터의 EPA(2개의 글리코실화 부위를 함유함, 서열번호 13)를 동시발현시킴으로써 CP5-EPA 생체접합체를 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzE ::cat에서 생성하였다. 보다 조절된 생체접합체 제조 방법을 수득하기 위해, 세포를 37℃에서 2 ℓ 생체반응기 내에서 30의 OD_600nm까지 성장시켰고, 1 mM IPTG 및 0.2% 아라비노스를 첨가하여 PglB 및 EPA의 발현을 유도하였다. 세포를 산소 제한 조건 하에서 37℃에서 18시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고 세척하였고 200의 OD_600nm에서 25% 수크로스 완충제에 재현탁시켰고, 4℃에서 30분 동안 항온처리한 후, 현탁액을 펠렛화하였고, 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 상청액에 존재하는 원형질막주위공간 단백질들을 Ni² ⁺ 친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 소스큐(SourceQ) 음이온 교환 컬럼 상에 적재하였다. 증가하는 농도의 NaCl의 구배를 인가하여 글리코실화된 EPA를 비글리코실화된 EPA로부터 분리하였다.

도 13a에 나타낸 바와 같이, 정제된 글리코실화된 EPA(CP5-EPA)를 SDS-PAGE로 분리하였고 코마시에(좌측 레인)로 염색하였거나 니트로셀룰로스 막으로 전달한 후 항-CP5 항체(중간 레인) 또는 항-EPA 항체(우측 레인)와 함께 항온처리하였다. 정제된 생체접합체는 EPA 특이적 항체(우측 레인) 및 CP5 특이적 다중클론 항혈청(중간 레인)에 의해 인식되었다. 화살표는 겔에서의 위치를 표시하고, 상기 겔로부터 조각을 절단하여 트립신처리 및 MALDI-MS/MS에 의한 당펩티드의 분석에 사용하였다. 도 13b는 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DNNNSTPTVISHR 내의 글리코실화 부위에 대해 실측된 M/Z 질량의 MALDI-MS/MS(m/z=2088([M+H]⁺)를 제공한다. m/z=2088의 MS/MS 분석은 표시된 당 부분의 부분적 단편화를 보여준다. 삽입도는 도 13a로부터의 정제된 CP5-EPA의 트립신처리로부터 유도된 펩티드에 부착된 RU 구조체를 보여준다. ManNAcA(HexNAcA, 217 Da) 및 아세틸화된 FucNAc(dHexNAc(0Ac), 229 Da)의 순차적 상실은 예측된 글리칸 구조를 뒷받침한다. 도 13c는 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DQNR 내의 글리코실화 부위에 대해 실측된 M/Z 질량의 MALDI-MS/MS(m/z=1165([M+H]⁺)를 제공한다. m/z=1165의 MS/MS 분석은 CP5 RU 구조체와 일치하는 전체 Y-이온 단편화 이온 시리즈를 보여준다. 삽입도는 도 13a로부터의 정제된 CP5-EPA의 트립신처리로부터 유도된 펩티드에 부착된 RU 구조체를 보여준다. 펩티드 DQNR(m/z=532 Da([M+H+])) 상의 예측된 글리칸 구조체를 확인시켜주는, ManNAcA(HexNAcA, 217 Da), 아세틸화된 FucNAc(dHexNAc(0Ac), 229 Da) 및 FucNAc(dHexNAc, 187 Da)의 순차적 상실이 나타나 있다.

도 13d에서, CP5 생체접합체의 생성과 동일한 방법을 이용하여 에스케리치아 콜라이에서 CP8 생체접합체를 생성하였다. 키메라 CP8 유전자 클러스터(서열번호 4), (pEXT21 플라스미드(서열번호 27) 내의) PglB, 및 2개의 글리코실화 부위를 함유하는 EPA(서열번호 13)의 동시발현으로 CP8-EPA 생체접합체를 에스케리치아 콜라이에서 생성하였다. 세포를 생체반응기 내에서 글리세롤, 펩톤 및 C 공급원으로서의 효모 추출물을 함유하는 반-한정(semi-defined) 배지에서 7 ℓ의 출발 부피로 성장시켰다. 세포를 37℃에서 회분(batch) 또는 펄스-회분(pulsed-batch) 방식으로 30의 OD_600nm까지 성장시켰고, 1 mM IPTG 및 10% 아라비노스를 첨가하여 PglB 및 EPA의 발현을 유도하였다. 유도 후, 세포를 산소 제한 조건 하에서 15시간 동안 유가 방식으로 더 배양하였다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni² ⁺친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 소스큐 음이온 교환 컬럼 상에 적재하였다. 증가하는 농도의 NaCl의 구배를 인가하여 글리코실화된 EPA를 비글리코실화된 EPA로부터 분리하였다.

도 13d에 나타낸 바와 같이, 정제된 단백질을 SDS-PAGE로 분리하였고 코마시에(좌측 레인)로 염색하였거나 니트로셀룰로스 막으로 전달한 후 항-CP8 항체(우측 레인) 또는 항-EPA 항체(중간 레인)와 함께 항온처리하였다.

글리코실화 시스템을 추가로 개선시키기 위해 상이한 방법들을 시험하였다. 한 방법에서, 생성 시스템에서 플라스미드 수를 감소시켜 추가 항생제의 용량을 낮추고 여분의 플라스미드를 유지하기 위해, pglB에 대한 발현 카세트를 CP5(서열번호 17) 및 CP8(서열번호 18)에 대한 키메라 클러스터가 함유된 플라스미드 내로 클로닝하였다. 발현 카세트는 에스케리치아 콜라이 O121 게놈의 galF와 wbqA 사이에 존재하는 유전자간 영역(프로모터 서열을 위한 것임) 및 이 영역의 하류에 위치한 pglB 서열로 구성된다. 이 발현 카세트를 CP5 및 CP8 키메라 클러스터의 바로 하류에 클로닝하였다. 본 발명자들은 별도의 플라스미드 또는 동일한 플라스미드(서열번호 17) 상에서 키메라 CP5 클러스터(서열번호 3) 및 pglB(서열번호 27)를 함유하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA ::cat를 시험하였다. 추가로, 아라비노스 유도성 프로모터의 조절 하에서 플라스미드로부터 EPA(서열번호 13)를 발현시켰다. 세포를 37℃에서 5 ℓ 삼각 플라스크 내의 LB 배지에서 성장시켰다. 밤샘 배양물을 0.05의 OD_600nm까지 희석하였다. 약 0.5의 OD_600nm에서 1 mM IPTG를 첨가하여 PglB 발현을 유도하였고, 아라비노스(0.2% 최종 농도)를 첨가하여 EPA 발현을 유도하였다. 세포를 4시간 동안 성장시켰고, 유도를 반복하였고, 세포를 추가 약 16시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni² ⁺친화성 크로마토그래피 상에 적재하였다. EPA-CP5를 0.5 M 이미다졸로 용출하였고, 용출된 피크들을 풀링하여 SDS-PAGE 및 코마시에로 분석하였다. 도 13e는 SDS-PAGE 결과를 보여준다. 당생체접합체 생성을 위해 3개의 플라스미드(좌측 레인) 또는 2개의 플라스미드(우측 레인)를 함유하는 세포가 나타나 있다. 결과는 CP5-EPA를 위한 당지질 및 접합체 생성이 유지되었다는 것을 보여준다.

시스템의 추가 최적화는 단백질 글리코실화에 사용되는 wzz(중합체 길이 조절제) 단백질 서열을 플라스미드 내로 도입하는 것이었다. CP8-EPA를 생성하는 시스템에 의해 예시되는 바와 같이, wzz를 플라스미드 유래의 키메라 CP8 클러스터 내에 도입하였고(서열번호 19) 담체 단백질에 대한 발현 플라스미드 내의 epa 유전자의 하류에도 도입하였다(서열번호 20). CP8-EPA 생체접합체를 2개의 플라스미드를 포함하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlB-wecG ::cat에서 생성하였다: 1개의 플라스미드는 키메라 CP8 유전자 클러스터 이외에 wzzO7 유전자의 카피, 및 pglB 유전자의 항시적 발현을 위한 DNA 카세트를 함유하였고(서열번호 19); 제2 플라스미드는 2개의 글리코실화 부위를 함유하는 해독된 EPA 단백질의 발현 및 분비를 위한 제1 유전자, 및 동일한 프로모터의 조절 하에 있는 제2 wzzO7 카피를 함유하였다(서열번호 20). 언급된 플라스미드들을 함유하는 생성된 균주인 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlBCA-wecG ::cat를 생체반응기 내에서 글리세롤, 펩톤 및 C 공급원으로서의 효모 추출물을 함유하는 반-한정 배지에서 7 ℓ의 출발 부피로 성장시켰다. 세포를 회분 또는 펄스-회분 방식으로 30의 OD_600nm까지 성장시켰고, PglB 및 EPA의 발현을 유도하였다. 유도 후, 세포를 산소 제한 조건 하에서 15시간 동안 유가 방식으로 더 배양하였고 원심분리로 회수하였다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni² ⁺친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였다. 코마시에, 및 항-His 항혈청 및 항-CP8 항혈청을 사용한 웨스턴 블롯에 의해 확인된 당접합체 CP8-EPA의 형성은 도 13f에 나타나 있다. 도 13f는 정제된 단백질의 SDS-PAGE 분리 및 코마시에에 의한 분석(좌측 레인) 또는 니트로셀룰로스 막으로의 전달 및 항-His 태그 항체(중간 레인) 또는 항-CP8 항체(우측 레인)를 사용한 프로빙에 의한 분석 결과를 보여준다.

CP5-EPA 당접합체의 특징규명을 다양한 분석 방법으로 더 세밀하게 수행하였다. 코발엑스(CovalX)(스위스, 슐리에렌 소재)는 도 13a에 나타낸 분석에서 사용된 3 플라스미드 시스템을 이용하여 W3110 Δ waaL Δ wecAwzzECA ::cat에서 생성한 정제된 CP5-EPA 샘플의 고질량 MALDI 분석을 수행하였다. 도 14a는 고질량 MALDI 결과를 보여준다. A⁺ 및 B⁺는 각각 비글리코실화된 EPA 및 글리코실화된 EPA에 상응하는 단백질 종 질량([M+H]⁺)을 표시한다. 고분자량의 올리고머 형태가 존재할 수 있고, 낮은 MW 영역에서의 신호는 오염물질 또는 분해 생성물이다. 도 14a에 제시된 결과는 상기 단백질 제제가 EPA 단백질 단독보다 4 kDa 더 크고(5.2개 반복 단위의 중간 당 길이를 표시함) 주로 단량체인 단백질 집합체를 함유하였다는 것을 보여준다. 이것은 SDS-PAGE, 코마시에 브릴리언트 블루 염색, 및 주요 접합체 형태에서의 반복 단위의 카운팅에 의해 분석된 바와 같이 상기 제제 중의 주요 당접합체 형태의 당 길이가 5 내지 7이라는 결과와 일치한다(도 7, 8 및 13a 참조).

CP5-EPA를 크기 배제 크로마토그래피(SEC-HPLC)로 더 특징규명하였다. 본 발명자들은 도 13a에 나타낸 분석에서 사용된 3 플라스미드 시스템을 W3110 Δ waaL Δw ecAwzzE CA::cat에서 사용하였다. 샘플을 음이온 교환 크로마토그래피로 정제하여 비글리코실화된 EPA를 제거하였다. 분석을 수펠코(Supelco) TSK G2000SWXL 컬럼 상에서 수행하였다. 도 14b는 정제된 CP5-EPA 샘플의 SEC-HPLC 분석 결과를 보여준다. 280 nm에서 측정된 UV 기록이 표시되어 있다. 굵은 직선은 3.25 ㎍의 정제된 CP5-EPA의 분석으로부터 수득되었고, 얇은 선은 5 ㎍의 정제된 비글리코실화된 EPA로부터 수득되었다. 용출의 11.5분에서 균질한 주 피크가 나타나는 반면, 비글리코실화된 EPA는 12.9분에서 용출되었다(도 14b). 2개 분자의 수력학적 반경의 계산으로부터 비글리코실화된 EPA에 대한 42 kDa의 크기 및 글리코실화된 EPA에 대한 166 kDa의 크기를 수득하였다. 이것은 글리코실화된 EPA가 글리칸의 선형 구조로 인해 예측된 바와 같이 용액 중에서 연장된 단량체 단백질로서 나타난다는 것을 암시한다.

따라서, 본 발명자들의 분석은 CP5-EPA 생체접합체가 EPA 단백질 및 정확한 O-아세틸화된 글리칸 구조체로 구성된다는 것을 확인시켜주었다. 이들 결과에 근거하여, CP8-EPA 생체접합체도 EPA 단백질 및 정확한 O-아세틸화된 글리칸 구조체로 구성된다는 것을 예측할 수 있었다.

실시예 6: 스타필로코커스 아우레우스 단백질 글리코실화 및 생성물 특징규명

당접합체 백신 후보물질을 발생시키기 위한 "생체내" 글리코실화의 다능성을 입증하기 위해, 여러 담체 단백질들을 CP5로 글리코실화될 기질로서 사용하였다. 스타필로코커스 아우레우스에 대한 생체접합체 백신의 면역 반응을 더 증가시키기 위해, 담체 단백질 EPA를 캄필로박터 제주니로부터의 AcrA 및 스타필로코커스 아우레우스로부터의 2개 단백질(H1a 및 ClfA)로 교체하였다. 담체 단백질로서 사용하기 위해, 세균 N-글리코실화 부위를 삽입하여 H1a 및 ClfA를 변형시켰다. 국제특허출원 공보 제WO 2006/119987호에 기재된 과정을 수행하여 H1a-H35L에 대한 4개의 버전(서열번호 6, 서열번호 7, 서열번호 8 및 서열번호 16) 및 ClfA에 대한 3개의 버전(서열번호 10, 서열번호 11 및 서열번호 12)을 발생시켰다.

H1a-H35L 부위 130의 글리코실화를 위해, 하기 2개의 발현 플라스미드를 포함하는 에스케리치아 콜라이 세포(W3110 Δ waaL Δ wecAwzzE Δ rmlB-wecG)를 사용하였다: 원형질막주위공간 내로의 분비를 위한 N-말단 신호 펩티드, 1개의 N-글리코실화 부위 및 정제를 위한 헥사 His 태그를 함유하는 H1a-H35L의 발현이 ParaBAD 프로모터의 조절 하에 있는, H1a-H35L 생성을 위한 제1 플라스미드(서열번호 16); 및 CP5 키메라 클러스터 및 pglB의 발현을 위한 제2 플라스미드(서열번호 17). 이 시스템은 교체된 단백질 담체 발현 플라스미드를 갖는 상기 최적화된 2 플라스미드 CP5-EPA 발현 시스템에 상응한다. 세포를 12 ℓ 생체반응기 내의 풍부 배지에서 30의 OD_600nm까지 성장시켰고, 0.2% 아라비노스를 첨가하여 H1a의 발현을 유도하였다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 상청액 중의 원형질막주위공간 단백질들을 Ni² ⁺친화성 크로마토그래피 상에 적재하였다. 글리코실화된(CP5-H1a) 및 비글리코실화된 H1a를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 음이온 교환 크로마토그래피 상에 적재하였다. 단백질을 0 M 내지 0.7 M NaCl의 선형 구배로 용출하여 H1a로부터 CP5-H1a를 분리하였다. 생성된 단백질을 SDS-PAGE로 분리하였고 코마시에로 염색하였거나, 니트로셀룰로스 막으로 전달한 후 표시된 바와 같이 항-His, 항-H1a 또는 항-CP5 항혈청으로 프로빙하였다(도 14c). 도 14c의 결과는 코마시에(좌측 레인), 및 항-His(중간 좌측 레인), 항-H1a(중간 우측 레인) 및 항-CP5(우측 레인) 항혈청을 사용한 웨스턴 블롯에 의해 확인된 당접합체(CP5-H1a)의 형성을 보여준다.

개조된 글리코실화 부위 130을 갖는 H1a-H35L의 본질(identity)을 인-겔(in-gel) 트립신처리 및 MALDI-MS/MS로 확인하였다.

담체 단백질이 CP5 및 CP8에 의한 글리코실화에 대해 교체될 수 있다는 것을 더 입증하기 위해, 캄필로박터 제주니 AcrA 단백질을 글리코실화 수용체로서 사용하였다(도 14d 참조). 3 플라스미드 시스템(서열번호 3, 서열번호 15 및 서열번호 27)을 사용하였을 때, 이 접합체에 대한 생성 균주는 CP5 키메라 클러스터(서열번호 3), IPTG에 의해 유도되는 PglB 단백질(서열번호 27), 및 별도의 플라스미드 상에서 아라비노스 유도 하에 존재하는 AcrA(서열번호 15)를 보유하는 W3110 ΔwaaL이었다. 세포를 생체반응기 내에서 글리세롤, 펩톤 및 C 공급원으로서의 효모 추출물을 함유하는 반-한정 배지에서 7 ℓ의 출발 부피로 성장시켰다. 세포를 회분 또는 펄스-회분 방식으로 30의 OD_600nm까지 성장시켰고, 1 mM IPTG 및 10% 아라비노스를 첨가하여 PglB 및 AcrA의 발현을 유도하였다. 유도 후, 세포를 산소 제한 조건 하에서 15시간 동안 유가 방식으로 더 배양하였고 원심분리로 회수하였다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni² ⁺친화성 크로마토그래피 상에 적재하였다. CP5-AcrA 당단백질을 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였다. 정제된 단백질을 SDS-PAGE로 분리하였고 코마시에로 염색하였거나, 니트로셀룰로스 막으로 전달한 후 표시된 바와 같이 항-AcrA 또는 항-CP5 항혈청으로 프로빙하였다(도 14d).

ClfA 내로의 세균 N-글리코실화 부위의 삽입을 국제특허출원 공보 제WO 2006/119987호에 기재된 바와 같이 수행하여 서열번호 10, 서열번호 11 및 서열번호 12를 발생시켰다. 담체 단백질을 에스케리치아 콜라이 세포에서 아라비노스 유도성 프로모터로부터 발현시켰다. 원형질막주위공간 내로의 분비를 위한 N-말단 신호 펩티드, 여러 N-글리코실화 부위, 및 정제를 위한 헥사 His 태그를 생성하도록 유전자를 디자인하였다. 에스케리치아 콜라이 세포의 원형질막주위공간 추출물로부터 정제를 시작하였다.

ClfA 327의 글리코실화를 위해, 상기 최적화된 CP5-EPA 발현 시스템을 사용하였다. 2 플라스미드 시스템(서열번호 17 및 서열번호 11)을 사용하였을 때, CP5 키메라 클러스터 및 pglB(항시적 발현 카세트)뿐만 아니라 (ParaBAD 프로모터의 조절 하에 있는) ClfA 327에 대한 발현 플라스미드도 포함하는 에스케리치아 콜라이 세포(W3110 Δ wecAwzzE Δ rmlB-wecG Δ waaL)를 1 ℓ 삼각 플라스크 내의 LB 배지에서 성장시켰다. 밤샘 배양물을 0.05의 OD_600nm까지 희석하였다. 약 0.5의 OD_600nm에서 아라비노스(0.2% 최종 농도)를 첨가하여 ClfA 발현을 유도하였다. 상기 세포를 20시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni²⁺친화성 크로마토그래피 상에 적재하였다. ClfA-CP5를 0.5 M 이미다졸로 용출하였고, SDS-PAGE로 분리하였고 코마시에로 염색하였거나, 니트로셀룰로스 막으로 전달한 후 항-His 또는 항-CP5 항혈청으로 프로빙하였다. 도 14e는 단백질의 아미노산 위치 327 주위에 삽입된 글리코실화 부위를 갖는 ClfA 변이체(서열번호 11)를 사용하여 수득한 결과를 보여준다. 상기 결과는 코마시에 염색, 및 항-His 웨스턴 블롯에 의해 확인된 ClfA의 형성, 및 항-CP5 항혈청을 사용한 웨스턴 블롯에 의해 확인된 당접합체(CP5-ClfA)의 형성을 보여준다.

실시예 7: 당접합체 백신으로서의 CP5 -EPA의 활성

내부에 cap5K를 갖는 CP5 키메라 클러스터(서열번호 3), PglB 단백질(서열번호 27), 및 2개의 글리코실화 신호 부위를 갖는 (pEC415 상의) EPA를 포함하는 W3110 Δ waaL Δ wecAwzzECA ::cat 세포를 1 ℓ 삼각 플라스크 내의 LB 배지에서 성장시켰다. 밤샘 배양물을 0.05의 OD_600nm까지 희석하였다. 약 0.5의 OD_600nm에서 각각 아라비노스(0.2% 최종 농도) 및 1 mM IPTG를 첨가하여 EPA 및 PglB 발현을 유도하였다. 상기 세포를 20시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni² ⁺친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 소스큐 음이온 교환 컬럼 상에 적재하였다. 증가하는 농도의 NaCl의 구배를 인가하여 글리코실화된 EPA를 비글리코실화된 EPA로부터 분리하였다. 용출된 단백질의 양을 BCA 분석으로 측정하였고, 코마시에에 의해 염색된 SDS-PAGE 상에서 수득된 밴드의 크기에 근거하여 당의 이론상 질량을 계산하였다. 단백질 측정과 더불어, 제제 중의 폴리사카라이드 항원의 양을 평가하였다. 이 평가된 정량을 고질량 MALDI MS 방법으로 확인하였다(도 14a 참조).

살아있는 동물에서 CP5-EPA의 면역원성을 측정하기 위해, 1 ㎍의 정제된 당접합체를 보조제로서 알루미늄 하이드록사이드의 존재 하에서 1일째 날(제1 주입), 21일째 날(제2 주입) 및 56일째 날(제3 주입)에 IP(복강내) 경로로 마우스 내에 주입하였다. 각각 제2 주입 및 제3 주입으로부터 2주 후 시점인 35일째 날 및 61일째 날 후, 코팅을 위해 폴리-L-라이신-변형된 CP5를 사용하는 ELISA로 IgG 반응을 측정하였다(문헌[Gray, B.M. 1979. ELISA methodology for polysaccharide antigens: protein coupling of polysaccharides for adsorption to plastic tubes. J. Immunol. 28:187-192]). CP5-생체접합체로 면역화된 마우스로부터의 혈액을 CP5 캡슐형 폴리사카라이드에 대한 특이적 IgG 항체에 대해 분석하였다. 도 15a는 마우스에서 CP5-EPA에 의해 발생된 IgG 역가를 제공한다. ELISA 플레이트를 폴리-L-라이신-변형된 CP5로 코팅하였고, 2회 면역화된 마우스(각각의 희석에서 제2 막대(빈 막대)) 또는 3회 면역화된 마우스(각각의 희석에서 제1 막대(정방향 대각선))에서의 IgG 반응을 삼중으로 측정하였다. 대조군인 면역전 혈청을 사용하여 수득한 신호는 각각의 희석에서 제3 막대(역방향 대각선)로 표시되어 있다. 알칼리성 포스파타제-접합된 단백질 G를 사용하여 마우스 IgG 반응을 측정하였다. 도 15a에 나타낸 바와 같이, CP5-EPA 생체접합체는 6.4 x 10³의 혈청 항체 역가를 이끌어내었다. 도 15a에 제시된 결과는 CP5-EPA가 마우스에서 CP5 특이적 항체를 발생시킨다는 것을 보여준다. 이 실험은 에스케리치아 콜라이에서 생성된 생체접합체가 마우스에서 면역원성을 나타낸다는 것을 보여준다.

유사한 실험을 숙주 유기체로서 토끼를 사용하여 수행하였다. CP5-EPA(15 ㎍ CP5)를 프로인트 완전 보조제의 존재 하에서 1일째 날에 피내로 토끼 내에 주입하였고 프로인트 불완전 보조제의 존재 하에서 20일째 날, 30일째 날 및 40일째 날에 피하로 토끼 내에 주입하였다. 61일째 날 후, 코팅을 위해 폴리-L-라이신-변형된 CP5를 사용하는 ELISA로 IgG 반응을 측정하였다(문헌[Gray, B.M. 1979. ELISA methodology for polysaccharide antigens: protein coupling of polysaccharides for adsorption to plastic tubes. J. Immunol. 28: 187-192]). 도 15b는 토끼에서 CP5-EPA에 의해 발생된 IgG 역가를 제공한다. 도 15b에 제시된 결과는 CP5-EPA가 토끼에서 CP5 특이적 항체를 발생시킨다는 것을 보여준다. CP5-EPA 생체접합체에 대한 면역 반응은 각각의 희석에서 제2 막대(정방향 대각선)로 표시되어 있다. 대조군 혈청은 사멸된 스타필로코커스 아우레우스에 대해 발생된 CP5 특이적 흡수된 혈청(WC 추출물, 각각의 희석에서 제1 막대(점)) 및 면역전 혈청(각각의 희석에서 제3 막대(빈 막대))을 포함한다. 다양한 항원으로 면역화된 토끼로부터의 혈청을 정제된 CP5에 대한 특이적 항체에 대해 분석하였다. 플레이트를 폴리-L-라이신-변형된 CP5로 코팅하였다. 대조군인 면역전 혈청을 사용하여 수득한 신호는 각각의 희석에서 제3 막대(역방향 대각선)로 표시되어 있다. 알칼리성 포스파타제-접합된 단백질 G를 사용하여 토끼 IgG 반응을 삼중으로 측정하였다. CP5-EPA 생체접합체는 (항혈청이 CP5 특이성을 나타내도록, 완전히 사멸된 후 우드(Wood) 46으로 흡수된 스타필로코커스 아우레우스 및 트립신처리된 동질유전자 무캡슐형 돌연변이체를 사용하여 면역화시킴으로써 제조된) 대조군 혈청의 역가보다 4배 더 높은 1 x 10⁶의 역가를 이끌어내었다. 이 실험은 상기 생체접합체가 고역가의 CP5 특이적 IgG 반응을 이끌어낼 수 있었다는 것을 보여준다.

실시예 8: CP5 항체의 기능적 활성

시험관내 활성

실시예 7에 기재된 바와 같이 발생된 토끼 다중클론 항혈청을 단백질 A 친화성 컬럼으로 정제하여 IgG 특이적 항체를 풍부하게 하였다. 스타필로코커스 아우레우스 생체접합체 CP5-EPA로 면역화된 토끼로부터 수득된 IgG를 고전적인 시험관내 옵소닌식균작용 사멸 분석에서 기능적 활성에 대해 시험하였다(문헌[Thakker, M., J.-S. Park, V. Carey, and J. C. Lee. 1998. Staphylococcus aureus serotype 5 capsular polysaccharide is antiphagocytic and enhances bacterial virulence in a murine bacteremia model. Infect Immun 66:5183-5189]). 스타필로코커스 아우레우스를 콜롬비아 아가 + 2% NaCl 상에서 25시간 동안 배양하였다. 이 세균을 최소 필수 배지 + 1% BSA(MEM-BSA)에 현탁시켰다. PMN(다형핵 호중구)을 새로 채취된 인간 혈액으로부터 단리하였고 세척하였고 카운팅하였고 MEM-BSA에 현탁시켰다. 스타필로코커스 아우레우스 CP5-EPA로 면역화된 토끼로부터 정제된 IgG 제제, 또는 국제특허출원 공보 제WO 2009/104074호에 기재된 바와 같이 정제된 쉬겔라 O1-EPA로 면역화된 토끼로부터 정제된 IgG 제제(대조군)를 MEM-BSA에서 제조된 연속 10배 희석물 형태로 분석에 첨가하였다. 기니아 피그 혈청(펠-프리즈(Pel-Freez))을 C 공급원으로서 사용하였다. 각각의 분석(0.5 ㎖ 총 부피)은 약 5 x 10⁶ PMN, 1 x 10⁶ CFU 스타필로코커스 아우레우스, 0.5% 내지 1%의 기니아 피그 혈청, 및 140 ㎍/㎖ 내지 1 ㎍/㎖의 다양한 농도의 IgG를 함유하였다. 대조군 샘플들은 1) C' 및 PMN과 함께 항온처리되었으나 항체와 함께 항온처리되지 않은 스타필로코커스 아우레우스; 2) IgG 및 C'와 함께 항온처리되었으나 PMN과 함께 항온처리되지 않은 스타필로코커스 아우레우스; 또는 3) 스타필로코커스 아우레우스만을 함유하였다. 샘플들을 37℃에서 2시간 동안 빙글빙글 회전시켰다(12 rpm). 멸균수 중의 샘플 희석물들을 볼텍싱하였고, 희석된 샘플들을 TSA 상에서 이중으로 플레이팅하여 세균 사멸을 평가하였다. 퍼센트 사멸을 0시간과 비교된 2시간 후 CFU/㎖의 감소로서 정의하였다.

제1 실험 세트에서, 원형 CP5 단리물인 메티실린 감수성 스타필로코커스 아우레우스(MSSA) 균주 레이놀드의 옵소닌식균작용 사멸을 시험하였고, 결과는 도 16a에 제시되어 있다. 토끼에서 발생된 CP5-EPA에 대한 항체의 옵소닌 활성을 스타필로코커스 아우레우스 혈청형 5 균주 레이놀드에 대해 시험하였다. CP5-EPA 항체는 1.4 ㎍/㎖의 농도까지 옵소닌 활성을 보인 반면, O1-EPA 항체는 140 ㎍/㎖에서 약간의 옵소닌 활성을 보였다. 스타필로코커스 아우레우스 전체 세포 추출물(제이 씨 리(J. C. Lee)(하버드 의과대학 브림감 부인과병원 의학부; 미국 매사추세츠주 보스톤 소재)로부터 입수됨)에 대해 발생된 양성 대조군 혈청은 항-CP5-EPA 혈청(WC 항혈청 1%)과 유사한 활성을 보였다.

도 16a에 나타낸 바와 같이, 스타필로코커스 아우레우스 레이놀드의 65% 내지 75%가 CP5-EPA에 대한 항체 및 보체 활성을 갖는 1% 기니아 피그 혈청과 함께 항온처리되었을 때 PMN에 의해 사멸되었다. 본 분석에서 항혈청은 최종 1%의 농도로 사용되었고, 스타필로코커스 아우레우스 접종물의 89%가 이 조건 하에서 사멸되었다. 스타필로코커스 아우레우스가 C'(1% 기니아 피그 혈청) 단독에 의해, 또는 PMN 없이 항체 및 C'에 의해 옵소닌화되었을 때 사멸이 거의 관찰되지 않았다. 나타낸 데이터는 2회 내지 5회 실험의 평균이다. 그래프로 표시된 모든 샘플들은 기니아 피그 혈청 C'를 포함하였고, C'의 부재 하에서는 사멸이 관찰되지 않았다. 항체 단독 및 보체 단독 중 어느 것도 옵소닌 활성을 보이지 않았고, 이 특징은 캡슐화된 세균 병원체의 특징이다. 대조적으로, 대조군 백신(EPA에 커플링된 쉬겔라 O1 항원)에 의해 유도된 항체는 C'의 존재 하에서조차도 옵소닌 활성을 보이지 않았다. 본 발명자들은 본 분석에서 양성 대조군으로서 CP5 특이적 토끼 항혈청(제이 씨 리(하버드 의과대학 브림감 부인과병원 의학부; 미국 매사추세츠주 보스톤 소재)로부터 입수됨)도 시험하였다. 이들 데이터는 CP5-EPA 생체접합체에 대해 발생된 항체가 입증된 옵소닌 활성을 갖는 CP5 항체(문헌[Thakker, M., J.-S. Park, V. Carey, and J. C. Lee. 1998. Staphylococcus aureus serotype 5 capsular polysaccharide is antiphagocytic and enhances bacterial virulence in a murine bacteremia model. Infect Immun 66:5183-5189])에 필적할만한, 캡슐화된 스타필로코커스 아우레우스에 대한 옵소닌 활성을 보였다는 것을 보여준다.

CP5-EPA에 대한 항체의 옵소닌 활성을 CP5-EPA의 MRSA 균주 USA100에 대해 시험하였다. 도 16b는 CP5+ 단리물이고 NRS382로 지칭되는 스타필로코커스 아우레우스 균주 USA100에 대해 시험된 IgG 및 C'의 옵소닌 활성의 결과를 제공한다. 나타낸 데이터는 2회 내지 5회 실험의 평균이다. 그래프로 표시된 모든 샘플들은 기니아 피그 혈청 C'를 포함하였고, C'의 부재 하에서는 사멸이 관찰되지 않았다. 도 16b에 나타낸 바와 같이, USA100 접종물의 약 60%가 0.5% 기니아 피그 보체 및 100 ㎍/㎖ 내지 1 ㎍/㎖ 농도의 CP5-EPA IgG와 함께 항온처리되었을 때 PMN에 의해 사멸되었다. 최소 사멸은 PMN의 부재 하에서 또는 IgG가 분석으로부터 배제되었을 때 관찰되었다. O1-EPA 접합체 백신에 대해 발생된 IgG가 PMN+C'에 첨가되었을 때 사멸이 달성되지 않았다(이 분석 샘플에서 세균이 증식됨). 스타필로코커스 아우레우스가 C' 단독에 의해, 또는 PMN 없이 항체 및 C'에 의해 옵소닌화되었을 때 사멸이 거의 관찰되지 않았다. 따라서, CP5-EPA 항체는 100 ㎍/㎖ 내지 1 ㎍/㎖의 농도에서 옵소닌 활성을 보인 반면, O1-EPA 항체는 100 ㎍/㎖에서 약간의 옵소닌 활성을 보였다. 이 실험은 CP5-EPA 항체가 MSSA 및 MRSA 균주 둘다에 대한 옵소닌 활성을 나타낸다는 것을 보여준다.

생체내 활성

생체접합체 CP5-EPA 백신에 대해 발생된 IgG의 옵소닌 활성이 스타필로코커스 감염의 마우스 모델에서 보호를 예측할 것인지를 확인하기 위해, 수동 면역화 실험을 수행하였다. 초기 연구에서, CP5-EPA 또는 쉬겔라 O1-EPA로 면역화된 토끼로부터 수득된 1.4 mg 내지 2 mg의 IgG를 스위스-웹스터 수컷 마우스(약 6주령)에게 정맥(꼬리 정맥)내로 주입하였다. 24시간 후, 약 3.6 x 10⁷ CFU의 스타필로코커스 아우레우스 레이놀드를 사용하여 상기 마우스를 복강내(IP) 경로를 통해 공격하였다. 공격으로부터 2시간 후 세균혈증도를 측정하여 세균혈증의 항체 매개 치유를 평가하였다. 배양에 의한 검출 하한은 혈액 ㎖ 당 5 CFU이었다. 도 17a는 측정된 세균혈증도를 보여준다. 각각의 점은 세균 접종으로부터 2시간 후 개별 마우스에 대한 꼬리 정맥 천자(puncture)에 의해 수행된 정량 혈액 배양을 나타낸다. 수평선은 중간 CFU/㎖ 값을 나타낸다. 빈 원은 항-CP5-EPA 항체를 수득한 마우스로부터의 혈액 샘플이고, 흑색으로 채워진 원은 상이한 글리칸(쉬겔라 디센테리애(Shigella dysenteriae) O1)에 접합된 EPA에 대해 발생된 대조군 항체 제제를 제공받은 동물로부터의 샘플이다. 도 17a의 결과는 CP5 항체를 제공받은 마우스가 O1 특이적 항체를 제공받은 마우스에 비해 세균혈증도의 유의한(만-휘트니(Mann-Whitney) 분석에 의할 때 P = 0.0006) 감소를 보였다는 것을 보여준다. 실제로, 혈액 ㎖ 당 CFU 단위로 표시되는 감소는 O1-EPA IgG를 제공받은 마우스에 비해 CP5-EPA로 수동 면역화된 마우스에서 98%이었다.

후속 수동 면역화 실험에서, 스타필로코커스 아우레우스 레이놀드의 보다 낮은 접종물(약 5.5 x 10⁶ CFU/마우스)을 사용하여 마우스를 복강내로 공격하였다. CP5-EPA 항체를 사용한 수동 면역화를 5 내지 6 x 10⁶ CFU의 스타필로코커스 아우레우스 레이놀드에 의해 복강내로 공격받은 마우스에서 시험하였다. 세균 공격 24시간 전, 2 mg의 CP5-EPA IgG 또는 O1-EPA IgG를 정맥(IV)내로 마우스 내에 주입하였다. 도 17b는 측정된 세균혈증도를 보여준다. 각각의 점은 세균 접종으로부터 2시간 후 개별 마우스에 대한 꼬리 정맥 천자에 의해 수행된 정량 혈액 배양을 나타낸다. 수평선은 중간 CFU/㎖ 값을 나타낸다. 빈 원은 항-CP5-EPA 항체를 수득한 마우스로부터의 혈액 샘플이고, 흑색으로 채워진 원은 상이한 글리칸(쉬겔라 디센테리애 O1)에 접합된 EPA에 대해 발생된 대조군 항체 제제를 제공받은 동물로부터의 샘플이다. 도 17b에 나타낸 바와 같이, 2 mg의 CP5-EPA IgG를 제공받은 마우스는 2 mg의 O1-EPA IgG를 제공받은 동물보다 유의하게(만-휘트니 분석에 의할 때 P <0.0001) 낮은 세균혈증도를 보였다. 실제로, CP5-EPA 항체로 수동 면역화된 7마리의 마우스 중 6마리의 마우스가 멸균 혈액 배양물을 가졌다(각각의 마우스로부터 채취되고 플레이팅된 혈액 부피에 따라 혈액 ㎖ 당 6 CFU 내지 30 CFU의 검출 하한). O1-EPA IgG를 제공받은 대조군 마우스와 비교될 때 CP5 항체로 인한 세균혈증도의 감소는 98%이었다.

세균혈증으로부터의 보호가 보다 낮은 수준의 IgG에 의해 부여될 수 있는지를 확인하기 위해, 300 ㎍의 CP5-EPA 또는 O1-EPA IgG를 사용하여 IV 경로로 마우스를 수동 면역화시킨 후속 실험을 수행하였다. 24시간 후, 6 x 10⁶ CFU의 스타필로코커스 아우레우스 레이놀드를 사용하여 상기 마우스를 복강내로 접종하였다. 배양에 의한 검출 하한은 혈액 ㎖ 당 13 CFU 내지 67 CFU이었다. 도 17b는 측정된 세균혈증도를 보여준다. 각각의 점은 세균 접종으로부터 2시간 후 개별 마우스에 대한 꼬리 정맥 천자에 의해 수행된 정량 혈액 배양을 나타낸다. 수평선은 중간 CFU/㎖ 값을 나타낸다. 빈 원은 항-CP5-EPA 항체를 수득한 마우스로부터의 혈액 샘플이고, 흑색으로 채워진 원은 상이한 글리칸(쉬겔라 디센테리애 O1)에 접합된 EPA에 대해 발생된 대조군 항체 제제를 제공받은 동물로부터의 샘플이다. 도 17b의 결과와 마찬가지로, 도 17c의 결과는 세균혈증으로부터의 CP5 항체 매개 보호가 상기 보다 낮은 항체 투여량에서 달성되었다는 것을 보여준다. 세균혈증도의 98% 감소는 CP5 생체접합체 백신에 의해 유도된 항체에 의해 달성되었고, 9마리의 마우스 중 8마리의 마우스가 멸균 혈액 배양물을 가졌는데, 이것은 쉬겔라 O1-EPA 항체를 제공받은 8마리의 마우스 중 0 마리의 마우스가 멸균 혈액 배양물을 가졌다는 결과와 비교된다.

실시예 9: 마우스에서의 능동 면역화

생체접합체 CP5-EPA를 사용한 마우스의 백신접종이 수동 면역화 분석에서와 마찬가지로 세균 공격으로부터의 보호를 매개한다는 것을 보여주기 위해, 능동 면역화 연구를 수행하였다.

키메라 CP5 유전자 클러스터(서열번호 3), 플라스미드 pEXT21로부터의 PglB(서열번호 27) 및 별도의 플라스미드로부터의 EPA(2개의 글리코실화 부위를 함유함, 서열번호 13)를 동시발현시킴으로써 CP5-EPA 생체접합체를 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzE ::cat에서 생성하였다. 세포를 생체반응기 내에서 글리세롤, 펩톤 및 C 공급원으로서의 효모 추출물을 함유하는 반-한정 배지에서 7 ℓ의 출발 부피로 성장시켰다. 세포를 회분 또는 펄스-회분 방식으로 30의 OD_600nm까지 성장시켰고, 1 mM IPTG 및 10% 아라비노스를 첨가하여 PglB 및 EPA의 발현을 유도하였다. 유도 후, 세포를 산소 제한 조건 하에서 15시간 동안 유가 방식으로 더 배양하였고 원심분리로 회수하였다. 상기 세포를 세척하였고 200의 OD_600nm까지 25% 수크로스 완충제에 재현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni² ⁺친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 소스큐 음이온 교환 컬럼 상에 적재하였다. 증가하는 농도의 NaCl의 구배를 인가하여 글리코실화된 EPA를 비글리코실화된 EPA로부터 분리하였다.

CP5-EPA를 CP5 스타필로코커스 아우레우스 균주로부터 보호하기 위한 접합체 백신으로서 사용하고자 한다. 이러한 능동 면역화가 작용하는지를 시험하기 위해, 본 발명자들은 상이한 암컷 스위스-웹스터 마우스 군들을 3개의 상이한 투여량의 CP5-EPA로 면역화시켰고 세균혈증 모델을 이용하여 면역화를 분석하였다. 상기 3개의 투여량을 0일째 날, 14일째 날 및 28일째 날에 피하 주입하였다. 도 18에 나타낸 바와 같이, 42일째 날에 스타필로코커스 아우레우스 균주 JL278을 사용하여 마우스를 복강내로 공격하였다. 5개 마우스 군들을 x-축 아래에 표시된 3개의 상이한 투여량의 CP5-EPA로 면역화시켰다(점선 원; 빈 원; 및 역방향 대각선으로 채워진 원). 2개의 대조군들은 보조제(정방향 대각선으로 채워진 원) 또는 PBS(흑색으로 채워진 원)만을 제공받았다. 각각의 점은 단일 마우스로부터의 혈액 샘플을 나타낸다. 최저 투여량의 백신(0.2 ㎍)이 군으로부터의 모든 마우스에서 보호를 유도하였다. 공격으로부터 2시간 후, 코팅을 위해 폴리-L-라이신-변형된 CP5를 사용하는 ELISA(Gray et al. (1979))를 이용하여 혈액 샘플을 cfu 형성 및 항-CP5 항체에 대해 분석하였다. CP5-EPA로 면역화된 모든 군들에서, 혈액 중의 cfu의 평균 감소가 관찰되었다. 그러나, 최저 투여량의 백신을 제공받은 군에서만 모든 5마리의 마우스에서 세균혈증으로부터의 일반적인 보호가 존재하였다. 항-CP5 항체에 대한 혈액 분석은 상이한 마우스 군들에서 보호와 평균 ELISA 역가 사이의 양의 상관관계를 보여주었다. 도 18에 제시된 상기 결과는 상기 항체가 면역화된 마우스에서 세균혈증으로부터의 보호를 유도하였다는 것을 보여준다.

이들 연구들은 CP5-EPA 생체접합체 백신이 인간 PMN에 의한 식균작용 사멸을 위해 스타필로코커스 아우레우스를 옵소닌화하고 수동 면역화 연구 및 능동 면역화 연구에서 세균혈증으로부터 마우스를 보호하는 항체를 유도하였다는 것을 보여준다. 이들 데이터는 제시된 생체접합체가 다수의 스타필로코커스 아우레우스 균주들에 의해 유발되는 질환으로부터 보호할 것임을 입증하는 강력한 증거를 제공한다.

본 발명이 그의 실시양태들을 참조하면서 구체적으로 제시되고 기재되어 있지만, 당업자는 하기 특허청구범위에 의해 포괄되는 본 발명의 범위를 벗어나지 않으면서 형태 및 세부사항에서의 다양한 변화가 본 발명 내에서 만들어질 수 있다는 것을 이해할 것이다.

SEQUENCE LISTING <110> GLYCOVAXYN AG <120> CAPSULAR GRAM-POSITIVE BACTERIA BIOCONJUGATE VACCINES <130> P51971WO <140> PCT/EP2011/057111 <141> 2011-05-04 <150> US 61/332,170 <151> 2010-05-06 <160> 27 <170> PatentIn version 3.5 <210> 1 <211> 13369 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 1 aattcacatg ttgcccatcc acgaaaccac cttatcgccg tggaacgcac ctggatcgac 60 agccccagca aagcagtcgc ttcctggtcc ggcaccggaa acatcgtacg gagaaaacaa 120 aaaaggccgc taggcggcct tttccggaga acgatgactc agggttctcg ccgcctctgg 180 cgatagatcc agtcgacgat ttcaccgtca ggcgcatagc cgctgacggt ttcccgcagc 240 aactggcgaa cccgcgagta gtcgtccttc tccacggcgg ccagcaactg ctccagcacg 300 accttgaagg cctcccagct caggtgttcc tcgttggccc gcatgatcat cggatggtcg 360 gtgggattca cgttgtcacc gatcagcagc tcttcgtaga gcttctcgcc aggacgcagg 420 ccactgaact cgatggcgat gtcaccatgg ggcgaacgct cggaacgcac gctcaggccg 480 gacaggtgga tcatcttctc ggcgagctcc aggatcttca ccggcggccc catgtccagc 540 acgaatacat ctccgccctg ccccatcgaa ccggcctgga tgaccaactg cgccgcctcg 600 ggaatggtca tgaagtaacg ggtgatgctc gggtgggtga ccgtcaccgg gccgccgcgc 660 ttgatctgct cgcggaacag cggaatgacc gaaccggacg aaccgaggac gttgccgaag 720 cggaccatgg tgaaacgggt cttgttgacg tgatgcacgt ccttccggtc gccgaacagc 780 accggcgccg attcgttgct gagcgcctga aggaccattt ccgccaggcg cttggtgctg 840 cccatcacat tggtcggccg caccgccttg tcggtggaaa tcagcacgaa gttctgcacg 900 ccgacctgca ccgcggcctg caccgcatgc aaggtgccta tcacgttgtt gagaacgccc 960 tcggcgatgt tgtgctcgac gatcggcaca tgcttgtagg ccgccgcatg gtagacggta 1020 ttgaccttcc aggtacgcat cacgtccacc aggcgctcgg gattgcgcac cgaaccgagg 1080 atcggcaaca ggttcaccga aagcgactcg cgcttgatcc gacgctccag ttcctgatgg 1140 atgctataga ggttgtattc gctgtgttcg aacaggatca gcacgctagg cgaacaactc 1200 atgatctgcc gacagagttc cgaaccgata gagccgcccg ccccggtcac catcaccacc 1260 tgaccgcgga tgcaccgttc cagcagctcc ttgcgcggtg cgacgctgtc gcgccccagc 1320 aggtcagcga tgtccacctc ctgcaggtca tccaccttga cccggccgct ggccaggtcc 1380 atgaagccgg gcatgctgcg cacgtgcagc gggaacggct ccagggactc gagaatctct 1440 cggcgccggg cccgagtggc ggaaggaatc gccaggagaa cctcctgcgc gcccgtctcg 1500 tcgatcatct ggcggatatg cttggcggta tagacccgca gaccggcaat gacccggttg 1560 gcgatctgct tgtcgtcatc gatgaacgcc accggacgca tcgcccgacc gagacgcaac 1620 gccgcaacca actggttgcc ggccgccccc gccccataga taaccaccct gggcaggcca 1680 tcctggcggt tgagaaatgg taccgactgc acagcagagt accagtcgcc catgaaatac 1740 tggcgcatgg ccagacgcaa gccgccgatc agcagcatgc tcaaccacca gtagttgaac 1800 accagggaac gcggcaccgg cgccggcgcg ccacgatacc agtacaccac cagcgacagc 1860 accagagccg agatggtcac cgccttggcg atggcgatca atgcgtcgtt accgagatag 1920 cgcatcaccg cgcgatacat gccgaagcga atgaatagtg gaatggcgat gaccggcgca 1980 gtgatgaaaa gccatgcatg ctcgccgaac acgtcgatca tatcgtctgt gcctagacgg 2040 accacaaaag cgagccacag agacagccat accagaagga tatccgtagc cacttgaagc 2100 aaacgtttcc agcgacgagg catggataac aactttactc ttaaacgatc tagcattccc 2160 ctactccttt aggcctgagc ggacgactct agcttacccg ccttgaacct cactgccaga 2220 aaaacgagag ggacgtaggc tatgacgatg cccatcaaag gctctagaga cccactcccg 2280 accaacaagg ctatagggag gagccagatg acgttcaatg ccgtgacgcc aatcgtaaca 2340 ggagcatgct ttccatagta tcggcttgcg tattgatagg catggcttcg atgagcctca 2400 tacaccttgt cccctctcag caagcgacga atcagggtat aggtcgcatc gacgatgaaa 2460 acgcctaaca ggaccaacca tgcccagaaa aaattcgtat tcatccacat ggcatgaatg 2520 gaaagaattc ctaaaacaat ccccagaaga ccactacccg catctcccat gaaaattttt 2580 gggggtggaa aattccagaa caagaatcca aaaacggcaa aagctagcga taaggggagc 2640 aaagcctgcg tcagttggcc attcagccag tataataatg ccccaccaac acagacaaaa 2700 atggcctgaa ggctagcaag tccatcgatc ccatccatga agttatagag attcagcaac 2760 cacacgagat agaaagcaaa gagaagtcct ccgaaccacc ccaggtccca actgacacca 2820 acaatctgaa atggtggtat gccattcaaa aagtacaatg agaccaaggc tgcactaaaa 2880 tgtcccagca gacgccagcg tgcggcgata tgaccgtgat catccatgaa tccaataatg 2940 gcaaccccgc cgccagcgag aagtaaagcc caggacacgg cccatgagat atttcccagt 3000 acagcccaaa taggcagcat gagacaaaaa gtaactacaa tggcgacccc tcctccgcgt 3060 ggagtgggaa cgacatggga acttcgagag ttaggggtgt caagtaagct cctcgctaag 3120 gcataacgac gcaagaggcc tgtaagcagt cccgaaaccc cagctgcagc gagtaacaaa 3180 taccattctt ccatttataa atttatcccc aaaaatactc tcaccccttc aacagggttc 3240 tattcgattg ttctgcgtgg tacgccatgc tagtagcaaa gcgcctgcag ataatcattc 3300 agtacgtttg acatatattc taccaacatc ttccaacgcg gaaagggtgc tcttgcgggg 3360 ttcccaacca agcaaaagcc tgcctttcga cgagtcgacc tctagtgagc agcataactg 3420 agtgtataac ccaccctttc ctactaattt aagaaacctc agaataaacc taggaacagg 3480 ccacatgatg gggcgacgcc ccattcccgc agcaagcgca gtcaccagtt gcttggtaga 3540 aatctcctga ccatcggata ccaaaaacag ttcgccggca gcagaagggt gcgtcataca 3600 gcaagctaga aagtcaacta aattatccag agaaacaaaa cttcgtcggt tatctatgca 3660 accaaatgga agaggaagtc ccgaagcaac cagcttcaac aatcgcgaga aatttccagg 3720 agctttccag tcgtaaacga gtggaggcct gacgataaca agttctgttg aggaatgctt 3780 gaaaagctcc cgaagcgcta cttcagcctc aaactttgaa atcgcatatt ctgcatgagg 3840 agccggcttg gagttctcat cgaagggctt ttctttggtt aaagcgccat ttacaccaat 3900 agaactaaca aaaatgaaac gctttacaga tgcttcgatc gcctgccgag caagcgccag 3960 agtagcatcg cgattcacct tccgaaaaat atctagtgaa tcacgctgcc ttccaaagat 4020 atgggctcgt ccagctagat gaactacaca ttcaacaccc cgcagcgcag catcaagctt 4080 agtgctctct ttcagctccg ctcgaacata ctcaaccccc gtaacgggat tgtacaggga 4140 tcgtacttgt ccgacaacct gaaagggggc ggcagcaagc gacctgcaaa gcgcactccc 4200 gacaaaaccg ctagccccgg ttaccagcac cttcatcata ttttcgactc agacagaagc 4260 ggtcgaacac aggcagcgaa tttttccaat gaaatatatt cagaataatt ttgctgaagg 4320 acactccgcg ggactccgcc taaactagac aagtcgagtt cacaaatctc atcgatcaat 4380 cttgccaaag caaccggatc attcggcgga cagttccaac cgattccggt ctcatctatt 4440 atacgggaga tttcagcccc tttttccatg acagctagaa tcggtttgtc tgctgccatg 4500 gagaaatatg ccttgctggg aaccccaagc ccgaacattc cttcttctaa ggtaactaag 4560 gcaacgtcac aggcagccaa accaaaattc ttttcggcta atggcagcct tccaaaatac 4620 ctcaaccgag cacactgatc ttccagcgcg tgttttttta cactgtcgac caaggcacca 4680 tctccaataa aagcaaaagc cgccttctcg tttttaacca actgaatagc agaaagtatg 4740 ttttctatac cttgtaatcg accgacatta ccaaaaaatt ggaaaaccct tttacctttc 4800 cattcaggaa tattgataaa aggagcatcc tctctcggta ctgggaaaac ctctttctca 4860 caggcccaat tcgaaataaa gaccaaagat cgcgggtcat tcaccttctc tttcataaga 4920 gcttccatat cgcgccctat tacgactaga cgatcagcgg atgagtaaat gaaagaaaag 4980 agacgacgta gaagccggta ggcaatacta tctttcttca gaacgcccgc cggcaccaag 5040 ttctcgggaa acacatcatg caccagcagc acccacttga aaccgagggc ataccttagc 5100 aagggaaacg tcatcagtag aagagcaggg ttggttccac tcaataccac atctcctcgt 5160 ctggcacgag aagtcaattt tactgagaac agaaacgcct gaaaaatctg cgccaatcct 5220 ctagaaagga gcctattctt attgctcctc ggaaacttaa agcattcttg ctcaacggaa 5280 ggtgaaacca caggcggggt ttcacctgcg gtcagcggga aaattacggt tagcccacca 5340 aactcccgct gcatctttcc tattatcttc tcccaatagt atcccgtgga gttctgattg 5400 gcaccgacat actcagaaac cacaaatatc cttgccatca actccacgcc tcaagttaat 5460 attttttcca gacagttcgc atgacatagt cccgatagct atgaactatg cgaacaatct 5520 tttcagaaac gttgggcatg ctatagtcag cgaccaagcg taacatgcgc tctgcgtcgc 5580 gcctctgtcc ctccaacacc tcgagtgctt gtagtactcg atccgaatcc agtccgacca 5640 tcatcaccac agcctcttcc atgccttctg ggcgttcatg agcctcacga atattcaaag 5700 cgggaaaatt cagtattgaa gactcctcac tgatggtccc actgtcagaa ataactgcct 5760 tggctgtaat ttgcagttta ttgtaatcct taaagccgag gggtttcagc agtttaatac 5820 cctcgtgaaa ctttgcctcc gtcgcctcaa ttctcttttt tgttctaggg tgagttgata 5880 cgatgacggg cagcgagtac ttttctgcca cagcgttgag catagaaacc aacttcaaga 5940 aattcttatc cgaatctatg ttttcctctc ggtgcgcact cacgacaaag aaccgctctg 6000 ttttcaaccc gagcctttca agaatatcgg aggactcgat cccgtcacga tagtgctcga 6060 gaacttcgaa catagggcta ccagtcttga taaccatgtc tggagaaagt ccttcacgca 6120 agagataatc acgcgcaatt gtactatagg tcaaatttac atcagctgta tgatcgacaa 6180 tgcgccgatt tatctcttca ggcacacgca tatcgaaaca gcgattgcct gcttccatat 6240 gaaaggtcgg tatcttacgc cgttttgcag gcagtaccgc catacaacta ttggtatcac 6300 ccagcacgag cagcgcatcg ggatctattt cgcccagaac acgatcgact gcgattatta 6360 cattccctat cgtttcagcc ccggaagacc cggcggcgtt tagaaaataa tccggctttc 6420 ttataccgag gtcctgaaaa aatatttcat taagttcgta atcataattc tgtccagtat 6480 ggacaagtac atgatcgcag tactgatcaa gcttcgccat gaccctagac aagcgaataa 6540 tctcaggacg agttccaaca accgtaacga cttttagctt ctgcattgtt atctcactat 6600 accttacgca ccttcgccta ctgaacaagc gtaggtatcc ggattttccc gatcaaatac 6660 ttcgttagcc cacaacatga ctaccatatc gtcagttccg acattagtaa tgtcatgagt 6720 ccatccaggt actgtttcga caatttctgc cttttcacca ttagtgcaaa tttcgtaaaa 6780 tgccccggtc aggatgtttc taaacttgaa acgtgccatc cctttgataa ccagaaactt 6840 ttcggttttc gagtgatggt aatgcccgcc cctggtaaca cctggatgag ccgtaaaaaa 6900 cgagaactgg ccagagtccg cggtcttcag catctcgacg aatgtgccac gcggatccga 6960 atgcattggc acgtcgtaac taaaactatc ttctggcaag aaacttagat aagtcgagta 7020 caaggcgcgc gtcaatcccg agccaaccct tgcggtagtc agtgactttc gactattacg 7080 aaactcatac aattgttctg cgagctcacc aacagaaatc tgatactggg gctcgacctg 7140 tagtgaaact gcattggata gcttcccatc catgactttc atgaaggtgc gaaccacatc 7200 atctatgtat acaagagtga tctctgccga ggaattgtta atttgaatcg gaatatctcg 7260 aataatatta tgacaaaaag tcgcaaccgc tgaattataa ttcggacgcg accatttacc 7320 gaatacatta ggaaggcgaa atatgtagac aggacaacca atatcctcac ctagcacttg 7380 gagatgctct tctgcggctc gcttgcttaa accgtactca ttatccacct cagcctgaat 7440 ggatgaagta taaagaagtg gtatggctcg tccattggac cttaccgcct cacacagagc 7500 atacgtgagt tcggaattcc cgatcttaaa ctcttctggt ttttccggac gattgacccc 7560 ggcaagatga aaaataaaat cgacggaacg aattagctca ggcaaattac caacactact 7620 ctcgcgggtg aatggcacca cctcgatacc accccgctct gcaagatgag cgcacagatt 7680 ccttccaaca aatccattcg cgccagttac aagaactttc atcgtttatt cctctggact 7740 ggcactctcg ccacgctgaa tagcacgaat gaaatccaac ttcagcaaca gctttttcat 7800 tccttcgata tccagacgtt tggtattatg agaattatag tcctctgtat gagtaatttt 7860 ttcctcgcct tgctccacaa acttactata gttcagatca cgcaaatctg gggggatacg 7920 ataatagtca cccatgtctt cagcacaggc catttcctct cgactaagaa gcgcctcata 7980 aagcttctct ccatgacgcg tacctattac attgatagga taaccattct tgccaagcaa 8040 ttgagtaagc gcatgagcca gcacctcgat ggttgcagcc ggtgctttct gtacaaaaag 8100 atctccattg gtaccatgct cgaaagcata aagcacaagg tctacggcat ccgtaagcgt 8160 catcatgaaa cgtgtcatgt ttggatcagt gattgtgaga ggctggcctg atcgcatttg 8220 ctcgataaag agaggaatga ccgagcccct tgaagccatg acgttaccat aacgggtgcc 8280 acaaattacg gtaggagtgc gttccaggtt tcgagacttg gcgaccatga ccttttccat 8340 catggccttt gaaataccca tggcattgat tgggtaaact gccttatccg tactcagaca 8400 aacgactttt ttgacgccat tctggatagc agattcgagg acattttccg ttccgatgac 8460 attggtcttc acagcctcca tcgggtagaa ctcacaagag ggaacctgtt tcaatgcagc 8520 cgcatggaaa atgtagtcca caccgcgagt agcattcaga gtgctttgat agtcgcggac 8580 atctccaata taaaacctca acttggggtg agcatagcac ttacgcatat catcttgctt 8640 cttctcatcc cgactgaata cacgtatttc accaatatct gtatccagaa aacgcttcaa 8700 aacggcattt ccaaaggaac cagttccacc ggtaattaac agaacagagt tcttatccat 8760 acaccacctc tttactaatg tgttcaacgt cccttttccg cctcaaaata taaagaaagc 8820 gaaaaacaac gagccagaac aatgcagccc ctaccggatg gaaaagccca ccgccgctaa 8880 agacataatt aacgaaccag attataaatg cagagcataa gaagcctaac tctgtacaag 8940 ctgtttttct tcgccggaag acaagcaaaa atacagagta gacaaaaagc aacaatagca 9000 aaagaacagc caagccacca aaaatgaaac catagatgca aagcagctcg acaataccat 9060 tgtgcgccat tggatattgc gcatacccta gaaccccccc tcccccaaaa acgcccgcgc 9120 ccaaaacaag tatctcgcta ccgtagaaag acaatgtttc caaaggcagt gcagttaccc 9180 gatcgaatat ggattcgaag aatggaacat cttgcgagac tgaggaatcg gaggtgagga 9240 gcccgacaat cagtcgatgc acggtttcca gactgccagc cccgaagtct gcaaggaaaa 9300 atacagataa acccagccct gcaagaagga aggtgaaaaa caagtatgtc tttttgatca 9360 gttttagcca ataggcaaag aataagacaa tgacgatatt ggccagagca gctttctgca 9420 gcgacagcat cgcccccaag caaagaagaa ggaaacatac cacgcgcgcc caacccttta 9480 gataaaagag tgaagcaagt gcgggaactc ccaccataac accatatgcg gtcaaacttc 9540 ctaccaatga tgcaaaacgg gcgcccccag cacgctcact ggcttcagcg aaccattcta 9600 taggtccaaa tacatactgc cagagaaaag aaagagccgc cagactgaag aaaaatgaaa 9660 taagttgcat gggcactttt agattatctc tggcaagaac catagcaaca aagagaagag 9720 gtaatgatgc ccacaacctg aaaatcccta tggaatagtc tccatataga tcgaaccata 9780 acaccgaaac gagcgaggca tacgtccaga agaaaataac aaatatacct aatgcgctat 9840 atttaatatc cctccagtta ttaataaata agagaaaaaa cagcccacaa aacccagcaa 9900 gaactaaata atacgcaccg gatagattcc ggagaatatg aaagagaaac acaaaaagga 9960 gaaccagagc aacgcttctc tgcttcatga gtaccaccca tctttgtttg ctttctcttt 10020 ggaaagtttc gactttctat cgagaacccc cttccgatag gatgaggcca aaacgagcct 10080 ataagcagct ctagagtaga gccatcgaat agagtccgtt ttctctagag aatgaataag 10140 aatatttgaa aactttgact ccagcgcaag acacagcact gctctgaata gactctgaaa 10200 cttgcttgac aaagcaaagc ccggctccat ccatcgtata ggaccaagag tctcaaggtc 10260 atcagttgtt gcaactttca tgaattccgg cattccgtca cgggcggcat gatagtactt 10320 gcgacagaac ttcgaaatac tgccttccgg ttcgacatgc tcgatttcag cccgacaagg 10380 aagaacagaa taaccaagct tgccaaccct taacccaaac tccgtatctt caaagccgta 10440 cccaacaaat cgctcatcaa aaagagcatt atcttggagc agaatatccc tctcagcgag 10500 catattcatg gtaacaatag ttttataccc caaggagttg ggcagcggct tgtcagcaga 10560 gaagtgacaa ctatccctat agcgatagta attactcgtc gacaccaatg agcaagaaaa 10620 tctgacacca ccgcaccaga taacgcgttc cccccttcga gagttagcag cgttcagaaa 10680 attcgagaga tgagcaggat ctggcacaca atcatcatca agaagcacta cgtagcgccc 10740 cttcgctaaa cgaacgcctt tatttcgttt tgcactagcc gaattcagct cggcctgctc 10800 aagacggacg ttgaagccct gaaccgcttc gaactcgcgg accacatcgg gtgtttcatc 10860 accactatta ctgtcgacaa caataacttc aaaatcctta aaagccagag actgcgctac 10920 aaggccggcc aggaccaatt ttagttcctt gggacgacgc caagtactaa cgacgacact 10980 caacaacatc aaagtcccct tttctctctc aacttaaccg tggccaggaa aaacattccc 11040 atccccaaag agacctctgt aacgaccagc gtccacgctc caaaaagctc atccccccaa 11100 agcgccaaga ggataaatgt taataccccg cccaattccg caaaaaaaat tgctcgcaaa 11160 tatacaccat catacccaga aggaacaaga gtcaaccctc catacagaac accaatacaa 11220 gcaaacactg gcactatcga aaacattctt attacaacag ttagacctct ggactgttcc 11280 gggaatagga gatatgaaat gtattcagaa aataagaaaa gaaataaaca actaggaata 11340 gctattagta acatcagacc tagcgctttc cttcttaaac tgccgactgc cgggtcggca 11400 ctcgcataca tcctgctaaa agtcggaaat agagcgctag ctatgggtga agtagcagcc 11460 gcgatcccgc gaaggaattt atccgcagta gaaagcactc cggccgcgga ggctccacca 11520 acaacaccaa ccgccgcaac gagcacttgc atgtgcaagc taagaaaagc cagagaaaga 11580 aaagatcgag caccgtcacg caatatatcg agaattctgt ctttctcgag aaccgggcgc 11640 caccgtattc ccatagaaaa taaaatacaa cagagagcac ttccacctat gacataggaa 11700 aaaccaaacc ccaacgaagc cagcacaagg tcagaatcct tcgtgacaaa aaaaacgacc 11760 aataggaaat aaaatacctt agacaaaaaa ttggtaagcg ccaaccatcc aaacagcgct 11820 cttccctgaa agaaccatac tgcttgaaga taatttccaa ctactgccgg aagagcagcc 11880 gcaaccaata caagcaaggg gattggtaaa atagaagata cagccaaaat ggccagcact 11940 aaaagtgaaa gcagcaacaa taagaatcta gcactctgta caacagaaaa gaaactagac 12000 agttcaactt tgttatcgat aatggcagcc tttcttgatc ctgccagaat aaatccaaag 12060 tctaccagtt gacatagaat gacagccacg gcctgggcaa tcaccaattg gccaaacgct 12120 tcgcttgaca atgttctcgt gagaaaagga atcgcagcaa gaggcaaaag atagttgctg 12180 cccatggata taccggagta gaaaacgccc cgccttattg acattctact cgataccccc 12240 taatacaatt caacaactac aacaagtaag ccctgatgcc agtaagtggc atcagggttt 12300 agatcaaaac ttagcgaaga gagccatcgc tacgaagctt ccttataaaa ccagcgagca 12360 ctgcgagtag aattccaatt atcaatcctg ccaaagtacc tatagtaact ataagaatct 12420 tcttcggctt aatgggttga tttgaaaaag agagtccctc gtcttccttg tagacagcca 12480 ccgcatcaga atccacagac aaactggagt tccaagatag tttctcttgg agagttctca 12540 actcaggaat gaatggagca tctacactac gcgactcaag attgttgatt tcagcgcgca 12600 gcgccttagc tcctcgcatg tacatcaagt caccatccat gatcgaggag agttgttgct 12660 cggacgcccc ttctattaat ggcgggccat ctatcttgag cgactccgca atcagcaatg 12720 cctccttcaa acgtgcaatt ctatcatcac ggcggccctt cgccatattc tgcagcacgg 12780 ttatgcggct ctgcattgca gcatttctta cctggaaatc tctacctgca ctatcaataa 12840 cctcatgcac ggcccgatcc gcagccaaac gcacgaaagc ttgtgcccat gtagcaagaa 12900 cctctcgctt cgtgccctcc acaattaccg tataacggtc tgcatctggc ttgttagcag 12960 gatcaatctt tacctctttg gagaacttct tataaaactc ctcctgctca tcttcgcttt 13020 ccgctccctc acccacctgg ggaaggtata tcttatagaa gaactctttt ttattctcat 13080 ccgaaagcag attgcgcgaa aagatcgcat agatacttct aacagtatat gcatctaggc 13140 cattctccct tctaccaaca ttgaaacctt cgatagaccc aagagcagga ggcactactg 13200 caaccctata ttcatataca ggcttactca gatacgcata ggtaaaagac ccgattaatg 13260 caagaagagt agtcagaaga atcagaacct tgttaaccca aagctccttg accagcttca 13320 ccaggtcaac ctcaccatca gccgtcatca aagaagaatt gcctcaggg 13369 <210> 2 <211> 15244 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 2 aattcacatg ttgcccatcc acgaaaccac cttatcgccg tggaacgcac ctggatcgac 60 agccccagca aagcagtcgc ttcctggtcc ggcaccggaa acatcgtacg gagaaaacaa 120 aaaaggccgc taggcggcct tttccggaga acgatgactc agggttctcg ccgcctctgg 180 cgatagatcc agtcgacgat ttcaccgtca ggcgcatagc cgctgacggt ttcccgcagc 240 aactggcgaa cccgcgagta gtcgtccttc tccacggcgg ccagcaactg ctccagcacg 300 accttgaagg cctcccagct caggtgttcc tcgttggccc gcatgatcat cggatggtcg 360 gtgggattca cgttgtcacc gatcagcagc tcttcgtaga gcttctcgcc aggacgcagg 420 ccactgaact cgatggcgat gtcaccatgg ggcgaacgct cggaacgcac gctcaggccg 480 gacaggtgga tcatcttctc ggcgagctcc aggatcttca ccggcggccc catgtccagc 540 acgaatacat ctccgccctg ccccatcgaa ccggcctgga tgaccaactg cgccgcctcg 600 ggaatggtca tgaagtaacg ggtgatgctc gggtgggtga ccgtcaccgg gccgccgcgc 660 ttgatctgct cgcggaacag cggaatgacc gaaccggacg aaccgaggac gttgccgaag 720 cggaccatgg tgaaacgggt cttgttgacg tgatgcacgt ccttccggtc gccgaacagc 780 accggcgccg attcgttgct gagcgcctga aggaccattt ccgccaggcg cttggtgctg 840 cccatcacat tggtcggccg caccgccttg tcggtggaaa tcagcacgaa gttctgcacg 900 ccgacctgca ccgcggcctg caccgcatgc aaggtgccta tcacgttgtt gagaacgccc 960 tcggcgatgt tgtgctcgac gatcggcaca tgcttgtagg ccgccgcatg gtagacggta 1020 ttgaccttcc aggtacgcat cacgtccacc aggcgctcgg gattgcgcac cgaaccgagg 1080 atcggcaaca ggttcaccga aagcgactcg cgcttgatcc gacgctccag ttcctgatgg 1140 atgctataga ggttgtattc gctgtgttcg aacaggatca gcacgctagg cgaacaactc 1200 atgatctgcc gacagagttc cgaaccgata gagccgcccg ccccggtcac catcaccacc 1260 tgaccgcgga tgcaccgttc cagcagctcc ttgcgcggtg cgacgctgtc gcgccccagc 1320 aggtcagcga tgtccacctc ctgcaggtca tccaccttga cccggccgct ggccaggtcc 1380 atgaagccgg gcatgctgcg cacgtgcagc gggaacggct ccagggactc gagaatctct 1440 cggcgccggg cccgagtggc ggaaggaatc gccaggagaa cctcctgcgc gcccgtctcg 1500 tcgatcatct ggcggatatg cttggcggta tagacccgca gaccggcaat gacccggttg 1560 gcgatctgct tgtcgtcatc gatgaacgcc accggacgca tcgcccgacc gagacgcaac 1620 gccgcaacca actggttgcc ggccgccccc gccccataga taaccaccct gggcaggcca 1680 tcctggcggt tgagaaatgg taccgactgc acagcagagt accagtcgcc catgaaatac 1740 tggcgcatgg ccagacgcaa gccgccgatc agcagcatgc tcaaccacca gtagttgaac 1800 accagggaac gcggcaccgg cgccggcgcg ccacgatacc agtacaccac cagcgacagc 1860 accagagccg agatggtcac cgccttggcg atggcgatca atgcgtcgtt accgagatag 1920 cgcatcaccg cgcgatacat gccgaagcga atgaatagtg gaatggcgat gaccggcgca 1980 gtgatgaaaa gccatgcatg ctcgccgaac acgtcgatca tatcgtctgt gcctagacgg 2040 accacaaaag cgagccacag agacagccat accagaagga tatccgtagc cacttgaagc 2100 aaacgtttcc agcgacgagg catggataac aactttactc ttaaacgatc tagcattccc 2160 ctactccttt aggcctgagc ggacgactct agcttacccg ccttgaacct cactgccaga 2220 aaaacgagag ggacgtaggc tatgacgatg cccatcaaag gctctagaga cccactcccg 2280 accaacaagg ctatagggag gagccagatg acgttcaatg ccgtgacgcc aatcgtaaca 2340 ggagcatgct ttccatagta tcggcttgcg tattgatagg catggcttcg atgagcctca 2400 tacaccttgt cccctctcag caagcgacga atcagggtat aggtcgcatc gacgatgaaa 2460 acgcctaaca ggaccaacca tgcccagaaa aaattcgtat tcatccacat ggcatgaatg 2520 gaaagaattc ctaaaacaat ccccagaaga ccactacccg catctcccat gaaaattttt 2580 gggggtggaa aattccagaa caagaatcca aaaacggcaa aagctagcga taaggggagc 2640 aaagcctgcg tcagttggcc attcagccag tataataatg ccccaccaac acagacaaaa 2700 atggcctgaa ggctagcaag tccatcgatc ccatccatga agttatagag attcagcaac 2760 cacacgagat agaaagcaaa gagaagtcct ccgaaccacc ccaggtccca actgacacca 2820 acaatctgaa atggtggtat gccattcaaa aagtacaatg agaccaaggc tgcactaaaa 2880 tgtcccagca gacgccagcg tgcggcgata tgaccgtgat catccatgaa tccaataatg 2940 gcaaccccgc cgccagcgag aagtaaagcc caggacacgg cccatgagat atttcccagt 3000 acagcccaaa taggcagcat gagacaaaaa gtaactacaa tggcgacccc tcctccgcgt 3060 ggagtgggaa cgacatggga acttcgagag ttaggggtgt caagtaagct cctcgctaag 3120 gcataacgac gcaagaggcc tgtaagcagt cccgaaaccc cagctgcagc gagtaacaaa 3180 taccattctt ccatttataa atttatcccc aaaaatactc tcaccccttc aacagggttc 3240 tattcgattg ttctgcgtgg tacgccatgc tagtagcaaa gcgcctgcag ataatcattc 3300 agtacgtttg acatatattc taccaacatc ttccaacgcg gaaagggtgc tcttgcgggg 3360 ttcccaacca agcaaaagcc tgcctttcga cgagtcgacc tctagtgagc agcataactg 3420 agtgtataac ccaccctttc ctactaattt aagaaacctc agaataaacc taggaacagg 3480 ccacatgatg gggcgacgcc ccattcccgc agcaagcgca gtcaccagtt gcttggtaga 3540 aatctcctga ccatcggata ccaaaaacag ttcgccggca gcagaagggt gcgtcataca 3600 gcaagctaga aagtcaacta aattatccag agaaacaaaa cttcgtcggt tatctatgca 3660 accaaatgga agaggaagtc ccgaagcaac cagcttcaac aatcgcgaga aatttccagg 3720 agctttccag tcgtaaacga gtggaggcct gacgataaca agttctgttg aggaatgctt 3780 gaaaagctcc cgaagcgcta cttcagcctc aaactttgaa atcgcatatt ctgcatgagg 3840 agccggcttg gagttctcat cgaagggctt ttctttggtt aaagcgccat ttacaccaat 3900 agaactaaca aaaatgaaac gctttacaga tgcttcgatc gcctgccgag caagcgccag 3960 agtagcatcg cgattcacct tccgaaaaat atctagtgaa tcacgctgcc ttccaaagat 4020 atgggctcgt ccagctagat gaactacaca ttcaacaccc cgcagcgcag catcaagctt 4080 agtgctctct ttcagctccg ctcgaacata ctcaaccccc gtaacgggat tgtacaggga 4140 tcgtacttgt ccgacaacct gaaagggggc ggcagcaagc gacctgcaaa gcgcactccc 4200 gacaaaaccg ctagccccgg ttaccagcac cttcatcata ttttcgactc agacagaagc 4260 ggtcgaacac aggcagcgaa tttttccaat gaaatatatt cagaataatt ttgctgaagg 4320 acactccgcg ggactccgcc taaactagac aagtcgagtt cacaaatctc atcgatcaat 4380 cttgccaaag caaccggatc attcggcgga cagttccaac cgattccggt ctcatctatt 4440 atacgggaga tttcagcccc tttttccatg acagctagaa tcggtttgtc tgctgccatg 4500 gagaaatatg ccttgctggg aaccccaagc ccgaacattc cttcttctaa ggtaactaag 4560 gcaacgtcac aggcagccaa accaaaattc ttttcggcta atggcagcct tccaaaatac 4620 ctcaaccgag cacactgatc ttccagcgcg tgttttttta cactgtcgac caaggcacca 4680 tctccaataa aagcaaaagc cgccttctcg tttttaacca actgaatagc agaaagtatg 4740 ttttctatac cttgtaatcg accgacatta ccaaaaaatt ggaaaaccct tttacctttc 4800 cattcaggaa tattgataaa aggagcatcc tctctcggta ctgggaaaac ctctttctca 4860 caggcccaat tcgaaataaa gaccaaagat cgcgggtcat tcaccttctc tttcataaga 4920 gcttccatat cgcgccctat tacgactaga cgatcagcgg atgagtaaat gaaagaaaag 4980 agacgacgta gaagccggta ggcaatacta tctttcttca gaacgcccgc cggcaccaag 5040 ttctcgggaa acacatcatg caccagcagc acccacttga aaccgagggc ataccttagc 5100 aagggaaacg tcatcagtag aagagcaggg ttggttccac tcaataccac atctcctcgt 5160 ctggcacgag aagtcaattt tactgagaac agaaacgcct gaaaaatctg cgccaatcct 5220 ctagaaagga gcctattctt attgctcctc ggaaacttaa agcattcttg ctcaacggaa 5280 ggtgaaacca caggcggggt ttcacctgcg gtcagcggga aaattacggt tagcccacca 5340 aactcccgct gcatctttcc tattatcttc tcccaatagt atcccgtgga gttctgattg 5400 gcaccgacat actcagaaac cacaaatatc cttgccatca actccacgcc tcaagttaat 5460 attttttcca gacagttcgc atgacatagt cccgatagct atgaactatg cgaacaatct 5520 tttcagaaac gttgggcatg ctatagtcag cgaccaagcg taacatgcgc tctgcgtcgc 5580 gcctctgtcc ctccaacacc tcgagtgctt gtagtactcg atccgaatcc agtccgacca 5640 tcatcaccac agcctcttcc atgccttctg ggcgttcatg agcctcacga atattcaaag 5700 cgggaaaatt cagtattgaa gactcctcac tgatggtccc actgtcagaa ataactgcct 5760 tggctgtaat ttgcagttta ttgtaatcct taaagccgag gggtttcagc agtttaatac 5820 cctcgtgaaa ctttgcctcc gtcgcctcaa ttctcttttt tgttctaggg tgagttgata 5880 cgatgacggg cagcgagtac ttttctgcca cagcgttgag catagaaacc aacttcaaga 5940 aattcttatc cgaatctatg ttttcctctc ggtgcgcact cacgacaaag aaccgctctg 6000 ttttcaaccc gagcctttca agaatatcgg aggactcgat cccgtcacga tagtgctcga 6060 gaacttcgaa catagggcta ccagtcttga taaccatgtc tggagaaagt ccttcacgca 6120 agagataatc acgcgcaatt gtactatagg tcaaatttac atcagctgta tgatcgacaa 6180 tgcgccgatt tatctcttca ggcacacgca tatcgaaaca gcgattgcct gcttccatat 6240 gaaaggtcgg tatcttacgc cgttttgcag gcagtaccgc catacaacta ttggtatcac 6300 ccagcacgag cagcgcatcg ggatctattt cgcccagaac acgatcgact gcgattatta 6360 cattccctat cgtttcagcc ccggaagacc cggcggcgtt tagaaaataa tccggctttc 6420 ttataccgag gtcctgaaaa aatatttcat taagttcgta atcataattc tgtccagtat 6480 ggacaagtac atgatcgcag tactgatcaa gcttcgccat gaccctagac aagcgaataa 6540 tctcaggacg agttccaaca accgtaacga cttttagctt ctgcattgtt atctcactat 6600 accttacgca ccttcgccta ctgaacaagc gtaggtatcc ggattttccc gatcaaatac 6660 ttcgttagcc cacaacatga ctaccatatc gtcagttccg acattagtaa tgtcatgagt 6720 ccatccaggt actgtttcga caatttctgc cttttcacca ttagtgcaaa tttcgtaaaa 6780 tgccccggtc aggatgtttc taaacttgaa acgtgccatc cctttgataa ccagaaactt 6840 ttcggttttc gagtgatggt aatgcccgcc cctggtaaca cctggatgag ccgtaaaaaa 6900 cgagaactgg ccagagtccg cggtcttcag catctcgacg aatgtgccac gcggatccga 6960 atgcattggc acgtcgtaac taaaactatc ttctggcaag aaacttagat aagtcgagta 7020 caaggcgcgc gtcaatcccg agccaaccct tgcggtagtc agtgactttc gactattacg 7080 aaactcatac aattgttctg cgagctcacc aacagaaatc tgatactggg gctcgacctg 7140 tagtgaaact gcattggata gcttcccatc catgactttc atgaaggtgc gaaccacatc 7200 atctatgtat acaagagtga tctctgccga ggaattgtta atttgaatcg gaatatctcg 7260 aataatatta tgacaaaaag tcgcaaccgc tgaattataa ttcggacgcg accatttacc 7320 gaatacatta ggaaggcgaa atatgtagac aggacaacca atatcctcac ctagcacttg 7380 gagatgctct tctgcggctc gcttgcttaa accgtactca ttatccacct cagcctgaat 7440 ggatgaagta taaagaagtg gtatggctcg tccattggac cttaccgcct cacacagagc 7500 atacgtgagt tcggaattcc cgatcttaaa ctcttctggt ttttccggac gattgacccc 7560 ggcaagatga aaaataaaat cgacggaacg aattagctca ggcaaattac caacactact 7620 ctcgcgggtg aatggcacca cctcgatacc accccgctct gcaagatgag cgcacagatt 7680 ccttccaaca aatccattcg cgccagttac aagaactttc atcgtttatt cctctggact 7740 ggcactctcg ccacgctgaa tagcacgaat gaaatccaac ttcagcaaca gctttttcat 7800 tccttcgata tccagacgtt tggtattatg agaattatag tcctctgtat gagtaatttt 7860 ttcctcgcct tgctccacaa acttactata gttcagatca cgcaaatctg gggggatacg 7920 ataatagtca cccatgtctt cagcacaggc catttcctct cgactaagaa gcgcctcata 7980 aagcttctct ccatgacgcg tacctattac attgatagga taaccattct tgccaagcaa 8040 ttgagtaagc gcatgagcca gcacctcgat ggttgcagcc ggtgctttct gtacaaaaag 8100 atctccattg gtaccatgct cgaaagcata aagcacaagg tctacggcat ccgtaagcgt 8160 catcatgaaa cgtgtcatgt ttggatcagt gattgtgaga ggctggcctg atcgcatttg 8220 ctcgataaag agaggaatga ccgagcccct tgaagccatg acgttaccat aacgggtgcc 8280 acaaattacg gtaggagtgc gttccaggtt tcgagacttg gcgaccatga ccttttccat 8340 catggccttt gaaataccca tggcattgat tgggtaaact gccttatccg tactcagaca 8400 aacgactttt ttgacgccat tctggatagc agattcgagg acattttccg ttccgatgac 8460 attggtcttc acagcctcca tcgggtagaa ctcacaagag ggaacctgtt tcaatgcagc 8520 cgcatggaaa atgtagtcca caccgcgagt agcattcaga gtgctttgat agtcgcggac 8580 atctccaata taaaacctca acttggggtg agcatagcac ttacgcatat catcttgctt 8640 cttctcatcc cgactgaata cacgtatttc accaatatct gtatccagaa aacgcttcaa 8700 aacggcattt ccaaaggaac cagttccacc ggtaattaac agaacagagt tcttatccat 8760 acaccacctc tttacgtgta ggctggagct gcttcgaagt tcctatactt tctagagaat 8820 aggaacttcg gaataggaac ttcatttaaa tggcgcgcct tacgccccgc cctgccactc 8880 atcgcagtac tgttgtattc attaagcatc tgccgacatg gaagccatca caaacggcat 8940 gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca 9000 tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga 9060 aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat 9120 aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga 9180 aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 9240 tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgta 9300 attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 9360 gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg gtctggttat 9420 aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc cattgggata 9480 tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta gctcctgaaa 9540 atctcgacaa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg tgaaagttgg 9600 aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg 9660 tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc acaggtaggc 9720 gcgccgaagt tcctatactt tctagagaat aggaacttcg gaataggaac taaggaggat 9780 attcatatgg tgcacggaag tttaaactta tttatcatca tcatctttat aatcaccatg 9840 atgacgccgt ccttttgtaa taaaatagaa caacacaaac caaaattcac ttacaactaa 9900 ataatttgaa ctaaacatta ataatgtgat tggatagatt gctataaaca taacgagtaa 9960 atctatagtg tttggatcat agttcctaat cattttataa actagtagca aaatgcaaat 10020 cattatgata aaaaacccta ataagccaaa tgatagaatc aactcaataa tgatgttatg 10080 tggtatattt ccgattagtt tataatagtt aaatggccca tagcctaata acggactttg 10140 ttgaataaag taaatacctt tttcataaat cggtcctctt ccagaagtac cttctaaatt 10200 aagtgttcca ccttgtagat atgaaaatgt tctagtattc gaaccttttg taaaaagaaa 10260 gtaaatcaat acactagata tgcttaatgc aaaaatatac ataatgcttt ttactgcaat 10320 aggtattcct cttttaaacg taataagtat aaatgcaaat aagccgtaaa gaattaataa 10380 aatagcacct ccacgccctc ctggtataaa cacaataggg atatcaatta ttgtaaatag 10440 aacatatatc cacttatgtt tcactgaacc tttcataatg aaataaatgc ctaatccggc 10500 agtaaatgct gaaaggtacg aagcgttttg atagttcata agtccaaaat tgatatagct 10560 aggtatctca cctgtaagtt ttggtattaa aattacaaaa ataaatgaaa tagaaaatat 10620 gaaaaatact aatttaaaaa atctttctac cgtagccttg tttatatatt taatataaat 10680 accactaatt gccgctggaa ctgcccatgt taaaaagaat agaatattat ttttagctag 10740 tttctcttcc ttatctggtg aaaaataata aaaagctaga taaagcaaac atatagcaat 10800 taataatatt aaccctcgcg gaatttcttg cgtgacaatt atcttataaa tagcaaacac 10860 cgtagtaatt aatgctatac caaccatggt tgagtaatac accggctcta tagggaaccc 10920 taatacttct ttagtaaatg tagagattac tataaatatg ttcatgctga taattgcaca 10980 aagtacaaaa aatttcatag ttcctcctgc tagaggatcc ccgggtcctt acagatcctc 11040 ttctgagatg agtttttgtt caaatttata taattctact aatcgttcac tttctatttg 11100 ccaattcaaa attttagacg ccttaattgc attttgacgt aaatgattaa acaaatcgtg 11160 attatctctt aattttctaa ccgccttttc aatttctaac ggcgtaactt cctttaaaac 11220 aatgccaaat ttatattttt cattgagata aatatgctct ttgacaggag ataaaattac 11280 tggtaaacca gcatgtatac attcaaaaat tttattagat actgtatatt caaaattaat 11340 agatacaggt ttcgtcaaga taacaccaac attactttct gctaacttat caaccaattc 11400 ttttacttca actggtttat ccaacctaat attttccgag ttataactaa tcagttcttt 11460 tatcacttct tcatgcggac caaaccctcg aattatgaat gaaggagcat tttgtttaaa 11520 agctgatgaa gcaataataa actcttcata tcctctgtcc attacaattt gaccttgata 11580 tacgatttct ttaaagtttt cgatttcttt aaattctctg ctatcattta aaataggtgc 11640 attcgtaata acattcgctt ccttcttata tcctttagat tgataatatt cttttgctgc 11700 atgacttact gttacgaagg cattaacacg atgttttact atgtgttttt ctatactttc 11760 tacaaacttt gaaataagtg gaactttatt aataaaggca tttttcgcat atatttcatg 11820 cgcatcataa acaatattag cttttttata attgcttaaa tagaccatta ataatacgtc 11880 gaaatcattt gcatgaatca cgtcaggttt aaaagcttta atttctcgga taacacctgt 11940 tgcaaatctt atacgcttaa ttaatttaga aagaatattt ttgggatcta ccttgctacc 12000 taacaaacga taattacaat ctaaattttc caatcgccta ttagtagctt gtgaattatt 12060 cattccaaca attttataat cattcgtaac gcctttaatt gtttctattt gtttaagtac 12120 ccttgggtct tgaacaatat tactcgatac aatatttaaa attctcattg tacacctcct 12180 gctcattgta cacctcctgt tacgcataat ccggcacatc atacggataa ctagtatcct 12240 ttttatttaa atattcaacc gaaaatcctt ttagtttgtc aggcgttttc tcccaccact 12300 tgctttccaa aagtttttca attgttttat tgtcaaatcg cttcttaatc acttttgcag 12360 gaaccccacc aacaacctca tatgctccta catttttagt aacaactgag ccggctgcta 12420 tgactgcacc agtatttatt gttaatccat ccataataat tacatttgca ccaatccaca 12480 catcattttt aattgttgta cggcttggtt ggtcattaaa gtctataaac ttttgcttta 12540 tgttaaatgg attattatta gaataaaaaa tcggtgatga gctaaaaaag tgtgtaggat 12600 gttttcctaa cccaattttt acatccgaag atatcgaaca atatcttcct acttctacat 12660 tattaaaatc actaccaaat ccaatataac tgtattcacc aatgtgagaa ttcctgattt 12720 tacaccatct atctatatag ttattgccat caaattttga gtttgtaata tacgccaagc 12780 gatgaatctt aacattcgat tctttagagg actggttttt cagcaaacca attatctttt 12840 caatcgctat cctcatctta agatcaaagt ccccttttct ctctcaactt aaccgtggcc 12900 aggaaaaaca ttcccatccc caaagagacc tctgtaacga ccagcgtcca cgctccaaaa 12960 agctcatccc cccaaagcgc caagaggata aatgttaata ccccgcccaa ttccgcaaaa 13020 aaaattgctc gcaaatatac accatcatac ccagaaggaa caagagtcaa ccctccatac 13080 agaacaccaa tacaagcaaa cactggcact atcgaaaaca ttcttattac aacagttaga 13140 cctctggact gttccgggaa taggagatat gaaatgtatt cagaaaataa gaaaagaaat 13200 aaacaactag gaatagctat tagtaacatc agacctagcg ctttccttct taaactgccg 13260 actgccgggt cggcactcgc atacatcctg ctaaaagtcg gaaatagagc gctagctatg 13320 ggtgaagtag cagccgcgat cccgcgaagg aatttatccg cagtagaaag cactccggcc 13380 gcggaggctc caccaacaac accaaccgcc gcaacgagca cttgcatgtg caagctaaga 13440 aaagccagag aaagaaaaga tcgagcaccg tcacgcaata tatcgagaat tctgtctttc 13500 tcgagaaccg ggcgccaccg tattcccata gaaaataaaa tacaacagag agcacttcca 13560 cctatgacat aggaaaaacc aaaccccaac gaagccagca caaggtcaga atccttcgtg 13620 acaaaaaaaa cgaccaatag gaaataaaat accttagaca aaaaattggt aagcgccaac 13680 catccaaaca gcgctcttcc ctgaaagaac catactgctt gaagataatt tccaactact 13740 gccggaagag cagccgcaac caatacaagc aaggggattg gtaaaataga agatacagcc 13800 aaaatggcca gcactaaaag tgaaagcagc aacaataaga atctagcact ctgtacaaca 13860 gaaaagaaac tagacagttc aactttgtta tcgataatgg cagcctttct tgatcctgcc 13920 agaataaatc caaagtctac cagttgacat agaatgacag ccacggcctg ggcaatcacc 13980 aattggccaa acgcttcgct tgacaatgtt ctcgtgagaa aaggaatcgc agcaagaggc 14040 aaaagatagt tgctgcccat ggatataccg gagtagaaaa cgccccgcct tattgacatt 14100 ctactcgata ccccctaata caattcaaca actacaacaa gtaagccctg atgccagtaa 14160 gtggcatcag ggtttagatc aaaacttagc gaagagagcc atcgctacga agcttcctta 14220 taaaaccagc gagcactgcg agtagaattc caattatcaa tcctgccaaa gtacctatag 14280 taactataag aatcttcttc ggcttaatgg gttgatttga aaaagagagt ccctcgtctt 14340 ccttgtagac agccaccgca tcagaatcca cagacaaact ggagttccaa gatagtttct 14400 cttggagagt tctcaactca ggaatgaatg gagcatctac actacgcgac tcaagattgt 14460 tgatttcagc gcgcagcgcc ttagctcctc gcatgtacat caagtcacca tccatgatcg 14520 aggagagttg ttgctcggac gccccttcta ttaatggcgg gccatctatc ttgagcgact 14580 ccgcaatcag caatgcctcc ttcaaacgtg caattctatc atcacggcgg cccttcgcca 14640 tattctgcag cacggttatg cggctctgca ttgcagcatt tcttacctgg aaatctctac 14700 ctgcactatc aataacctca tgcacggccc gatccgcagc caaacgcacg aaagcttgtg 14760 cccatgtagc aagaacctct cgcttcgtgc cctccacaat taccgtataa cggtctgcat 14820 ctggcttgtt agcaggatca atctttacct ctttggagaa cttcttataa aactcctcct 14880 gctcatcttc gctttccgct ccctcaccca cctggggaag gtatatctta tagaagaact 14940 cttttttatt ctcatccgaa agcagattgc gcgaaaagat cgcatagata cttctaacag 15000 tatatgcatc taggccattc tcccttctac caacattgaa accttcgata gacccaagag 15060 caggaggcac tactgcaacc ctatattcat atacaggctt actcagatac gcataggtaa 15120 aagacccgat taatgcaaga agagtagtca gaagaatcag aaccttgtta acccaaagct 15180 ccttgaccag cttcaccagg tcaacctcac catcagccgt catcaaagaa gaattgcctc 15240 aggg 15244 <210> 3 <211> 16483 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 3 tcacatgttg cccatccacg aaaccacctt atcgccgtgg aacgcacctg gatcgacagc 60 cccagcaaag cagtcgcttc ctggtccggc accggaaaca tcgtacggag aaaacaaaaa 120 aggccgctag gcggcctttt ccggagaacg atgactcagg gttctcgccg cctctggcga 180 tagatccagt cgacgatttc accgtcaggc gcatagccgc tgacggtttc ccgcagcaac 240 tggcgaaccc gcgagtagtc gtccttctcc acggcggcca gcaactgctc cagcacgacc 300 ttgaaggcct cccagctcag gtgttcctcg ttggcccgca tgatcatcgg atggtcggtg 360 ggattcacgt tgtcaccgat cagcagctct tcgtagagct tctcgccagg acgcaggcca 420 ctgaactcga tggcgatgtc accatggggc gaacgctcgg aacgcacgct caggccggac 480 aggtggatca tcttctcggc gagctccagg atcttcaccg gcggccccat gtccagcacg 540 aatacatctc cgccctgccc catcgaaccg gcctggatga ccaactgcgc cgcctcggga 600 atggtcatga agtaacgggt gatgctcggg tgggtgaccg tcaccgggcc gccgcgcttg 660 atctgctcgc ggaacagcgg aatgaccgaa ccggacgaac cgaggacgtt gccgaagcgg 720 accatggtga aacgggtctt gttgacgtga tgcacgtcct tccggtcgcc gaacagcacc 780 ggcgccgatt cgttgctgag cgcctgaagg accatttccg ccaggcgctt ggtgctgccc 840 atcacattgg tcggccgcac cgccttgtcg gtggaaatca gcacgaagtt ctgcacgccg 900 acctgcaccg cggcctgcac cgcatgcaag gtgcctatca cgttgttgag aacgccctcg 960 gcgatgttgt gctcgacgat cggcacatgc ttgtaggccg ccgcatggta gacggtattg 1020 accttccagg tacgcatcac gtccaccagg cgctcgggat tgcgcaccga accgaggatc 1080 ggcaacaggt tcaccgaaag cgactcgcgc ttgatccgac gctccagttc ctgatggatg 1140 ctatagaggt tgtattcgct gtgttcgaac aggatcagca cgctaggcga acaactcatg 1200 atctgccgac agagttccga accgatagag ccgcccgccc cggtcaccat caccacctga 1260 ccgcggatgc accgttccag cagctccttg cgcggtgcga cgctgtcgcg ccccagcagg 1320 tcagcgatgt ccacctcctg caggtcatcc accttgaccc ggccgctggc caggtccatg 1380 aagccgggca tgctgcgcac gtgcagcggg aacggctcca gggactcgag aatctctcgg 1440 cgccgggccc gagtggcgga aggaatcgcc aggagaacct cctgcgcgcc cgtctcgtcg 1500 atcatctggc ggatatgctt ggcggtatag acccgcagac cggcaatgac ccggttggcg 1560 atctgcttgt cgtcatcgat gaacgccacc ggacgcatcg cccgaccgag acgcaacgcc 1620 gcaaccaact ggttgccggc cgcccccgcc ccatagataa ccaccctggg caggccatcc 1680 tggcggttga gaaatggtac cgactgcaca gcagagtacc agtcgcccat gaaatactgg 1740 cgcatggcca gacgcaagcc gccgatcagc agcatgctca accaccagta gttgaacacc 1800 agggaacgcg gcaccggcgc cggcgcgcca cgataccagt acaccaccag cgacagcacc 1860 agagccgaga tggtcaccgc cttggcgatg gcgatcaatg cgtcgttacc gagatagcgc 1920 atcaccgcgc gatacatgcc gaagcgaatg aatagtggaa tggcgatgac cggcgcagtg 1980 atgaaaagcc atgcatgctc gccgaacacg tcgatcatat cgtctgtgcc tagacggacc 2040 acaaaagcga gccacagaga cagccatacc agaaggatat ccgtagccac ttgaagcaaa 2100 cgtttccagc gacgaggcat ggataacaac tttactctta aacgatctag cattccccta 2160 ctcctttagg cctgagcgga cgactctagc ttacccgcct tgaacctcac tgccagaaaa 2220 acgagaggga cgtaggctat gacgatgccc atcaaaggct ctagagaccc actcccgacc 2280 aacaaggcta tagggaggag ccagatgacg ttcaatgccg tgacgccaat cgtaacagga 2340 gcatgctttc catagtatcg gcttgcgtat tgataggcat ggcttcgatg agcctcatac 2400 accttgtccc ctctcagcaa gcgacgaatc agggtatagg tcgcatcgac gatgaaaacg 2460 cctaacagga ccaaccatgc ccagaaaaaa ttcgtattca tccacatggc atgaatggaa 2520 agaattccta aaacaatccc cagaagacca ctacccgcat ctcccatgaa aatttttggg 2580 ggtggaaaat tccagaacaa gaatccaaaa acggcaaaag ctagcgataa ggggagcaaa 2640 gcctgcgtca gttggccatt cagccagtat aataatgccc caccaacaca gacaaaaatg 2700 gcctgaaggc tagcaagtcc atcgatccca tccatgaagt tatagagatt cagcaaccac 2760 acgagataga aagcaaagag aagtcctccg aaccacccca ggtcccaact gacaccaaca 2820 atctgaaatg gtggtatgcc attcaaaaag tacaatgaga ccaaggctgc actaaaatgt 2880 cccagcagac gccagcgtgc ggcgatatga ccgtgatcat ccatgaatcc aataatggca 2940 accccgccgc cagcgagaag taaagcccag gacacggccc atgagatatt tcccagtaca 3000 gcccaaatag gcagcatgag acaaaaagta actacaatgg cgacccctcc tccgcgtgga 3060 gtgggaacga catgggaact tcgagagtta ggggtgtcaa gtaagctcct cgctaaggca 3120 taacgacgca agaggcctgt aagcagtccc gaaaccccag ctgcagcgag taacaaatac 3180 cattcttcca tttataaatt tatccccaaa aatactctca ccccttcaac agggttctat 3240 tcgattgttc tgcgtggtac gccatgctag tagcaaagcg cctgcagata atcattcagt 3300 acgtttgaca tatattctac caacatcttc caacgcggaa agggtgctct tgcggggttc 3360 ccaaccaagc aaaagcctgc ctttcgacga gtcgacctct agtgagcagc ataactgagt 3420 gtataaccca ccctttccta ctaatttaag aaacctcaga ataaacctag gaacaggcca 3480 catgatgggg cgacgcccca ttcccgcagc aagcgcagtc accagttgct tggtagaaat 3540 ctcctgacca tcggatacca aaaacagttc gccggcagca gaagggtgcg tcatacagca 3600 agctagaaag tcaactaaat tatccagaga aacaaaactt cgtcggttat ctatgcaacc 3660 aaatggaaga ggaagtcccg aagcaaccag cttcaacaat cgcgagaaat ttccaggagc 3720 tttccagtcg taaacgagtg gaggcctgac gataacaagt tctgttgagg aatgcttgaa 3780 aagctcccga agcgctactt cagcctcaaa ctttgaaatc gcatattctg catgaggagc 3840 cggcttggag ttctcatcga agggcttttc tttggttaaa gcgccattta caccaataga 3900 actaacaaaa atgaaacgct ttacagatgc ttcgatcgcc tgccgagcaa gcgccagagt 3960 agcatcgcga ttcaccttcc gaaaaatatc tagtgaatca cgctgccttc caaagatatg 4020 ggctcgtcca gctagatgaa ctacacattc aacaccccgc agcgcagcat caagcttagt 4080 gctctctttc agctccgctc gaacatactc aacccccgta acgggattgt acagggatcg 4140 tacttgtccg acaacctgaa agggggcggc agcaagcgac ctgcaaagcg cactcccgac 4200 aaaaccgcta gccccggtta ccagcacctt catcatattt tcgactcaga cagaagcggt 4260 cgaacacagg cagcgaattt ttccaatgaa atatattcag aataattttg ctgaaggaca 4320 ctccgcggga ctccgcctaa actagacaag tcgagttcac aaatctcatc gatcaatctt 4380 gccaaagcaa ccggatcatt cggcggacag ttccaaccga ttccggtctc atctattata 4440 cgggagattt cagccccttt ttccatgaca gctagaatcg gtttgtctgc tgccatggag 4500 aaatatgcct tgctgggaac cccaagcccg aacattcctt cttctaaggt aactaaggca 4560 acgtcacagg cagccaaacc aaaattcttt tcggctaatg gcagccttcc aaaatacctc 4620 aaccgagcac actgatcttc cagcgcgtgt ttttttacac tgtcgaccaa ggcaccatct 4680 ccaataaaag caaaagccgc cttctcgttt ttaaccaact gaatagcaga aagtatgttt 4740 tctatacctt gtaatcgacc gacattacca aaaaattgga aaaccctttt acctttccat 4800 tcaggaatat tgataaaagg agcatcctct ctcggtactg ggaaaacctc tttctcacag 4860 gcccaattcg aaataaagac caaagatcgc gggtcattca ccttctcttt cataagagct 4920 tccatatcgc gccctattac gactagacga tcagcggatg agtaaatgaa agaaaagaga 4980 cgacgtagaa gccggtaggc aatactatct ttcttcagaa cgcccgccgg caccaagttc 5040 tcgggaaaca catcatgcac cagcagcacc cacttgaaac cgagggcata ccttagcaag 5100 ggaaacgtca tcagtagaag agcagggttg gttccactca ataccacatc tcctcgtctg 5160 gcacgagaag tcaattttac tgagaacaga aacgcctgaa aaatctgcgc caatcctcta 5220 gaaaggagcc tattcttatt gctcctcgga aacttaaagc attcttgctc aacggaaggt 5280 gaaaccacag gcggggtttc acctgcggtc agcgggaaaa ttacggttag cccaccaaac 5340 tcccgctgca tctttcctat tatcttctcc caatagtatc ccgtggagtt ctgattggca 5400 ccgacatact cagaaaccac aaatatcctt gccatcaact ccacgcctca agttaatatt 5460 ttttccagac agttcgcatg acatagtccc gatagctatg aactatgcga acaatctttt 5520 cagaaacgtt gggcatgcta tagtcagcga ccaagcgtaa catgcgctct gcgtcgcgcc 5580 tctgtccctc caacacctcg agtgcttgta gtactcgatc cgaatccagt ccgaccatca 5640 tcaccacagc ctcttccatg ccttctgggc gttcatgagc ctcacgaata ttcaaagcgg 5700 gaaaattcag tattgaagac tcctcactga tggtcccact gtcagaaata actgccttgg 5760 ctgtaatttg cagtttattg taatccttaa agccgagggg tttcagcagt ttaataccct 5820 cgtgaaactt tgcctccgtc gcctcaattc tcttttttgt tctagggtga gttgatacga 5880 tgacgggcag cgagtacttt tctgccacag cgttgagcat agaaaccaac ttcaagaaat 5940 tcttatccga atctatgttt tcctctcggt gcgcactcac gacaaagaac cgctctgttt 6000 tcaacccgag cctttcaaga atatcggagg actcgatccc gtcacgatag tgctcgagaa 6060 cttcgaacat agggctacca gtcttgataa ccatgtctgg agaaagtcct tcacgcaaga 6120 gataatcacg cgcaattgta ctataggtca aatttacatc agctgtatga tcgacaatgc 6180 gccgatttat ctcttcaggc acacgcatat cgaaacagcg attgcctgct tccatatgaa 6240 aggtcggtat cttacgccgt tttgcaggca gtaccgccat acaactattg gtatcaccca 6300 gcacgagcag cgcatcggga tctatttcgc ccagaacacg atcgactgcg attattacat 6360 tccctatcgt ttcagccccg gaagacccgg cggcgtttag aaaataatcc ggctttctta 6420 taccgaggtc ctgaaaaaat atttcattaa gttcgtaatc ataattctgt ccagtatgga 6480 caagtacatg atcgcagtac tgatcaagct tcgccatgac cctagacaag cgaataatct 6540 caggacgagt tccaacaacc gtaacgactt ttagcttctg cattgttatc tcactatacc 6600 ttacgcacct tcgcctactg aacaagcgta ggtatccgga ttttcccgat caaatacttc 6660 gttagcccac aacatgacta ccatatcgtc agttccgaca ttagtaatgt catgagtcca 6720 tccaggtact gtttcgacaa tttctgcctt ttcaccatta gtgcaaattt cgtaaaatgc 6780 cccggtcagg atgtttctaa acttgaaacg tgccatccct ttgataacca gaaacttttc 6840 ggttttcgag tgatggtaat gcccgcccct ggtaacacct ggatgagccg taaaaaacga 6900 gaactggcca gagtccgcgg tcttcagcat ctcgacgaat gtgccacgcg gatccgaatg 6960 cattggcacg tcgtaactaa aactatcttc tggcaagaaa cttagataag tcgagtacaa 7020 ggcgcgcgtc aatcccgagc caacccttgc ggtagtcagt gactttcgac tattacgaaa 7080 ctcatacaat tgttctgcga gctcaccaac agaaatctga tactggggct cgacctgtag 7140 tgaaactgca ttggatagct tcccatccat gactttcatg aaggtgcgaa ccacatcatc 7200 tatgtataca agagtgatct ctgccgagga attgttaatt tgaatcggaa tatctcgaat 7260 aatattatga caaaaagtcg caaccgctga attataattc ggacgcgacc atttaccgaa 7320 tacattagga aggcgaaata tgtagacagg acaaccaata tcctcaccta gcacttggag 7380 atgctcttct gcggctcgct tgcttaaacc gtactcatta tccacctcag cctgaatgga 7440 tgaagtataa agaagtggta tggctcgtcc attggacctt accgcctcac acagagcata 7500 cgtgagttcg gaattcccga tcttaaactc ttctggtttt tccggacgat tgaccccggc 7560 aagatgaaaa ataaaatcga cggaacgaat tagctcaggc aaattaccaa cactactctc 7620 gcgggtgaat ggcaccacct cgataccacc ccgctctgca agatgagcgc acagattcct 7680 tccaacaaat ccattcgcgc cagttacaag aactttcatc gtttattcct ctggactggc 7740 actctcgcca cgctgaatag cacgaatgaa atccaacttc agcaacagct ttttcattcc 7800 ttcgatatcc agacgtttgg tattatgaga attatagtcc tctgtatgag taattttttc 7860 ctcgccttgc tccacaaact tactatagtt cagatcacgc aaatctgggg ggatacgata 7920 atagtcaccc atgtcttcag cacaggccat ttcctctcga ctaagaagcg cctcataaag 7980 cttctctcca tgacgcgtac ctattacatt gataggataa ccattcttgc caagcaattg 8040 agtaagcgca tgagccagca cctcgatggt tgcagccggt gctttctgta caaaaagatc 8100 tccattggta ccatgctcga aagcataaag cacaaggtct acggcatccg taagcgtcat 8160 catgaaacgt gtcatgtttg gatcagtgat tgtgagaggc tggcctgatc gcatttgctc 8220 gataaagaga ggaatgaccg agccccttga agccatgacg ttaccataac gggtgccaca 8280 aattacggta ggagtgcgtt ccaggtttcg agacttggcg accatgacct tttccatcat 8340 ggcctttgaa atacccatgg cattgattgg gtaaactgcc ttatccgtac tcagacaaac 8400 gacttttttg acgccattct ggatagcaga ttcgaggaca ttttccgttc cgatgacatt 8460 ggtcttcaca gcctccatcg ggtagaactc acaagaggga acctgtttca atgcagccgc 8520 atggaaaatg tagtccacac cgcgagtagc attcagagtg ctttgatagt cgcggacatc 8580 tccaatataa aacctcaact tggggtgagc atagcactta cgcatatcat cttgcttctt 8640 ctcatcccga ctgaatacac gtatttcacc aatatctgta tccagaaaac gcttcaaaac 8700 ggcatttcca aaggaaccag ttccaccggt aattaacaga acagagttct tatccataca 8760 ccacctcttt acgtgtaggc tggagctgct tcgaagttcc tatactttct agagaatagg 8820 aacttcggaa taggaacttc atttaaatgg cgcgccttac gccccgccct gccactcatc 8880 gcagtactgt tgtattcatt aagcatctgc cgacatggaa gccatcacaa acggcatgat 8940 gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg 9000 tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac 9060 tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg 9120 ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat 9180 cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt 9240 aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacgtaatt 9300 ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 9360 tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 9420 tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 9480 caacggtggt atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc 9540 tcgacaactc aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac 9600 ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt ggcccagggc ttcccggtat 9660 caacagggac accaggattt atttattctg cgaagtgatc ttccgtcaca ggtaggcgcg 9720 ccgaagttcc tatactttct agagaatagg aacttcggaa taggaactaa ggaggatatt 9780 catatggtgc acttacgcat aatccggcac atcatacgga taactatcga cgtccttttt 9840 attaatgaat ttagacttta aacctataat atttaaaatc acatacttaa taatgttgct 9900 gaacagcgtt gtccaaaaga atccatttag accaaacgca attgtcatta aaatagttat 9960 gaatataaat gtaatcgtgt gaagcgtcat ataattcgct tgtaatgtta ttgatgcgtg 10020 ttttgtattt aaagtttgga tcataatact cactgcattg aataaaacac ctatattacc 10080 taaaataata aacttcgaat ataaacttga atcaatgtta tacagtaaag agacaataat 10140 taatgtaatt ggataacata taatcatgac taaacatagt gcagctatag caaatagatt 10200 agttttcaaa tattgcttct ttatattgtc gctttcattt acagaaatat atgaaagtac 10260 tacattatta atcggataca gaaatgtagc taacattttc ccaataaatg ttgaaagaaa 10320 tgatatagtt acagctgttc cacctataat tggtaataag attaatctat ctaagtagag 10380 attcaaatta ttaaggctat ttgtactcag tagcatcaca taatctttga ccacattatt 10440 atcttcactt tgatactcgc ctatagttaa tccccgtaat ttaaccaatg tatatatcgt 10500 tgcaaacaat tcactggtaa taaaacaaac aatccagttt tggattaaat aatatagaaa 10560 tagtcctatc agcaaaccta aaaattgaat aagagcaata tacaaaatct gattatattt 10620 taaagtcatc ctaaaaaata cattcagata aatccttaaa cacattaaaa tattaagtag 10680 aattaaaaag ataatatcga tggtgttcaa attaaaaaag taaagaaata caataattaa 10740 agctatactc tcaatcagaa ttgaaattaa aagtatcgac acaaatttcc agtagtaatg 10800 attggatttg tatagattca tattaattaa tcgtatattg ttaagcgtat tgcctaatac 10860 aacactcgtg attgttatta ttgtataaat cgttaaaata gaaccaaacg cttcattacc 10920 tactcgttga ttaataattg gataagctaa aaattgtaat cctaaagcta taagcaacgt 10980 accaattatt gtctttacgc tatccataat aaaaactttc ttaaccatga tgcctcctgt 11040 ttaaacttat ttatcatcat catctttata atcaccatga tgacgccgtc cttttgtaat 11100 aaaatagaac aacacaaacc aaaattcact tacaactaaa taatttgaac taaacattaa 11160 taatgtgatt ggatagattg ctataaacat aacgagtaaa tctatagtgt ttggatcata 11220 gttcctaatc attttataaa ctagtagcaa aatgcaaatc attatgataa aaaaccctaa 11280 taagccaaat gatagaatca actcaataat gatgttatgt ggtatatttc cgattagttt 11340 ataatagtta aatggcccat agcctaataa cggactttgt tgaataaagt aaataccttt 11400 ttcataaatc ggtcctcttc cagaagtacc ttctaaatta agtgttccac cttgtagata 11460 tgaaaatgtt ctagtattcg aaccttttgt aaaaagaaag taaatcaata cactagatat 11520 gcttaatgca aaaatataca taatgctttt tactgcaata ggtattcctc ttttaaacgt 11580 aataagtata aatgcaaata agccgtaaag aattaataaa atagcacctc cacgccctcc 11640 tggtataaac acaataggga tatcaattat tgtaaataga acatatatcc acttatgttt 11700 cactgaacct ttcataatga aataaatgcc taatccggca gtaaatgctg aaaggtacga 11760 agcgttttga tagttcataa gtccaaaatt gatatagcta ggtatctcac ctgtaagttt 11820 tggtattaaa attacaaaaa taaatgaaat agaaaatatg aaaaatacta atttaaaaaa 11880 tctttctacc gtagccttgt ttatatattt aatataaata ccactaattg ccgctggaac 11940 tgcccatgtt aaaaagaata gaatattatt tttagctagt ttctcttcct tatctggtga 12000 aaaataataa aaagctagat aaagcaaaca tatagcaatt aataatatta accctcgcgg 12060 aatttcttgc gtgacaatta tcttataaat agcaaacacc gtagtaatta atgctatacc 12120 aaccatggtt gagtaataca ccggctctat agggaaccct aatacttctt tagtaaatgt 12180 agagattact ataaatatgt tcatgctgat aattgcacaa agtacaaaaa atttcatagt 12240 tcctcctgct agaggatccc cgggtcctta cagatcctct tctgagatga gtttttgttc 12300 aaatttatat aattctacta atcgttcact ttctatttgc caattcaaaa ttttagacgc 12360 cttaattgca ttttgacgta aatgattaaa caaatcgtga ttatctctta attttctaac 12420 cgccttttca atttctaacg gcgtaacttc ctttaaaaca atgccaaatt tatatttttc 12480 attgagataa atatgctctt tgacaggaga taaaattact ggtaaaccag catgtataca 12540 ttcaaaaatt ttattagata ctgtatattc aaaattaata gatacaggtt tcgtcaagat 12600 aacaccaaca ttactttctg ctaacttatc aaccaattct tttacttcaa ctggtttatc 12660 caacctaata ttttccgagt tataactaat cagttctttt atcacttctt catgcggacc 12720 aaaccctcga attatgaatg aaggagcatt ttgtttaaaa gctgatgaag caataataaa 12780 ctcttcatat cctctgtcca ttacaatttg accttgatat acgatttctt taaagttttc 12840 gatttcttta aattctctgc tatcatttaa aataggtgca ttcgtaataa cattcgcttc 12900 cttcttatat cctttagatt gataatattc ttttgctgca tgacttactg ttacgaaggc 12960 attaacacga tgttttacta tgtgtttttc tatactttct acaaactttg aaataagtgg 13020 aactttatta ataaaggcat ttttcgcata tatttcatgc gcatcataaa caatattagc 13080 ttttttataa ttgcttaaat agaccattaa taatacgtcg aaatcatttg catgaatcac 13140 gtcaggttta aaagctttaa tttctcggat aacacctgtt gcaaatctta tacgcttaat 13200 taatttagaa agaatatttt tgggatctac cttgctacct aacaaacgat aattacaatc 13260 taaattttcc aatcgcctat tagtagcttg tgaattattc attccaacaa ttttataatc 13320 attcgtaacg cctttaattg tttctatttg tttaagtacc cttgggtctt gaacaatatt 13380 actcgataca atatttaaaa ttctcattgt acacctcctg ctcattgtac acctcctgtt 13440 acgcataatc cggcacatca tacggataac tagtatcctt tttatttaaa tattcaaccg 13500 aaaatccttt tagtttgtca ggcgttttct cccaccactt gctttccaaa agtttttcaa 13560 ttgttttatt gtcaaatcgc ttcttaatca cttttgcagg aaccccacca acaacctcat 13620 atgctcctac atttttagta acaactgagc cggctgctat gactgcacca gtatttattg 13680 ttaatccatc cataataatt acatttgcac caatccacac atcattttta attgttgtac 13740 ggcttggttg gtcattaaag tctataaact tttgctttat gttaaatgga ttattattag 13800 aataaaaaat cggtgatgag ctaaaaaagt gtgtaggatg ttttcctaac ccaattttta 13860 catccgaaga tatcgaacaa tatcttccta cttctacatt attaaaatca ctaccaaatc 13920 caatataact gtattcacca atgtgagaat tcctgatttt acaccatcta tctatatagt 13980 tattgccatc aaattttgag tttgtaatat acgccaagcg atgaatctta acattcgatt 14040 ctttagagga ctggtttttc agcaaaccaa ttatcttttc aatcgctatc ctcatcttaa 14100 gatcaaagtc cccttttctc tctcaactta accgtggcca ggaaaaacat tcccatcccc 14160 aaagagacct ctgtaacgac cagcgtccac gctccaaaaa gctcatcccc ccaaagcgcc 14220 aagaggataa atgttaatac cccgcccaat tccgcaaaaa aaattgctcg caaatataca 14280 ccatcatacc cagaaggaac aagagtcaac cctccataca gaacaccaat acaagcaaac 14340 actggcacta tcgaaaacat tcttattaca acagttagac ctctggactg ttccgggaat 14400 aggagatatg aaatgtattc agaaaataag aaaagaaata aacaactagg aatagctatt 14460 agtaacatca gacctagcgc tttccttctt aaactgccga ctgccgggtc ggcactcgca 14520 tacatcctgc taaaagtcgg aaatagagcg ctagctatgg gtgaagtagc agccgcgatc 14580 ccgcgaagga atttatccgc agtagaaagc actccggccg cggaggctcc accaacaaca 14640 ccaaccgccg caacgagcac ttgcatgtgc aagctaagaa aagccagaga aagaaaagat 14700 cgagcaccgt cacgcaatat atcgagaatt ctgtctttct cgagaaccgg gcgccaccgt 14760 attcccatag aaaataaaat acaacagaga gcacttccac ctatgacata ggaaaaacca 14820 aaccccaacg aagccagcac aaggtcagaa tccttcgtga caaaaaaaac gaccaatagg 14880 aaataaaata ccttagacaa aaaattggta agcgccaacc atccaaacag cgctcttccc 14940 tgaaagaacc atactgcttg aagataattt ccaactactg ccggaagagc agccgcaacc 15000 aatacaagca aggggattgg taaaatagaa gatacagcca aaatggccag cactaaaagt 15060 gaaagcagca acaataagaa tctagcactc tgtacaacag aaaagaaact agacagttca 15120 actttgttat cgataatggc agcctttctt gatcctgcca gaataaatcc aaagtctacc 15180 agttgacata gaatgacagc cacggcctgg gcaatcacca attggccaaa cgcttcgctt 15240 gacaatgttc tcgtgagaaa aggaatcgca gcaagaggca aaagatagtt gctgcccatg 15300 gatataccgg agtagaaaac gccccgcctt attgacattc tactcgatac cccctaatac 15360 aattcaacaa ctacaacaag taagccctga tgccagtaag tggcatcagg gtttagatca 15420 aaacttagcg aagagagcca tcgctacgaa gcttccttat aaaaccagcg agcactgcga 15480 gtagaattcc aattatcaat cctgccaaag tacctatagt aactataaga atcttcttcg 15540 gcttaatggg ttgatttgaa aaagagagtc cctcgtcttc cttgtagaca gccaccgcat 15600 cagaatccac agacaaactg gagttccaag atagtttctc ttggagagtt ctcaactcag 15660 gaatgaatgg agcatctaca ctacgcgact caagattgtt gatttcagcg cgcagcgcct 15720 tagctcctcg catgtacatc aagtcaccat ccatgatcga ggagagttgt tgctcggacg 15780 ccccttctat taatggcggg ccatctatct tgagcgactc cgcaatcagc aatgcctcct 15840 tcaaacgtgc aattctatca tcacggcggc ccttcgccat attctgcagc acggttatgc 15900 ggctctgcat tgcagcattt cttacctgga aatctctacc tgcactatca ataacctcat 15960 gcacggcccg atccgcagcc aaacgcacga aagcttgtgc ccatgtagca agaacctctc 16020 gcttcgtgcc ctccacaatt accgtataac ggtctgcatc tggcttgtta gcaggatcaa 16080 tctttacctc tttggagaac ttcttataaa actcctcctg ctcatcttcg ctttccgctc 16140 cctcacccac ctggggaagg tatatcttat agaagaactc ttttttattc tcatccgaaa 16200 gcagattgcg cgaaaagatc gcatagatac ttctaacagt atatgcatct aggccattct 16260 cccttctacc aacattgaaa ccttcgatag acccaagagc aggaggcact actgcaaccc 16320 tatattcata tacaggctta ctcagatacg cataggtaaa agacccgatt aatgcaagaa 16380 gagtagtcag aagaatcaga accttgttaa cccaaagctc cttgaccagc ttcaccaggt 16440 caacctcacc atcagccgtc atcaaagaag aattgcctca ggg 16483 <210> 4 <211> 16660 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 4 aattccctga ggcaattctt ctttgatgac ggctgatggt gaggttgacc tggtgaagct 60 ggtcaaggag ctttgggtta acaaggttct gattcttctg actactcttc ttgcattaat 120 cgggtctttt acctatgcgt atctgagtaa gcctgtatat gaatataggg ttgcagtagt 180 gcctcctgct cttgggtcta tcgaaggttt caatgttggt agaagggaga atggcctaga 240 tgcatatact gttagaagta tctatgcgat cttttcgcgc aatctgcttt cggatgagaa 300 taaaaaagag ttcttctata agatatacct tccccaggtg ggtgagggag cggaaagcga 360 agatgagcag gaggagtttt ataagaagtt ctccaaagag gtaaagattg atcctgctaa 420 caagccagat gcagaccgtt atacggtaat tgtggagggc acgaagcgag aggttcttgc 480 tacatgggca caagctttcg tgcgtttggc tgcggatcgg gccgtgcatg aggttattga 540 tagtgcaggt agagatttcc aggtaagaaa tgctgcaatg cagagccgca taaccgtgct 600 gcagaatatg gcgaagggcc gccgtgatga tagaattgca cgtttgaagg aggcattgct 660 gattgcggag tcgctcaaga tagatggccc gccattaata gaaggggcgt ccgagcaaca 720 actctcctcg atcatggatg gtgacttgat gtacatgcga ggagctaagg cgctgcgcgc 780 tgaaatcaac aatcttgagt cgcgtagtgt agatgctcca ttcattcctg agttgagaac 840 tctccaagag aaactatctt ggaactccag tttgtctgtg gattctgatg cggtggctgt 900 ctacaaggaa gacgagggac tctctttttc aaatcaaccc attaagccga agaagattct 960 tatagttact ataggtactt tggcaggatt gataattgga attctactcg cagtgctcgc 1020 tggttttata aggaagcttc gtagcgatgg ctctcttcgc taagttttga tctaaaccct 1080 gatgccactt actggcatca gggcttactt gttgtagttg ttgaattgta ttagggggta 1140 tcgagtagaa tgtcaataag gcggggcgtt ttctactccg gtatatccat gggcagcaac 1200 tatcttttgc ctcttgctgc gattcctttt ctcacgagaa cattgtcaag cgaagcgttt 1260 ggccaattgg tgattgccca ggccgtggct gtcattctat gtcaactggt agactttgga 1320 tttattctgg caggatcaag aaaggctgcc attatcgata acaaagttga actgtctagt 1380 ttcttttctg ttgtacagag tgctagattc ttattgttgc tgctttcact tttagtgctg 1440 gccattttgg ctgtatcttc tattttacca atccccttgc ttgtattggt tgcggctgct 1500 cttccggcag tagttggaaa ttatcttcaa gcagtatggt tctttcaggg aagagcgctg 1560 tttggatggt tggcgcttac caattttttg tctaaggtat tttatttcct attggtcgtt 1620 ttttttgtca cgaaggattc tgaccttgtg ctggcttcgt tggggtttgg tttttcctat 1680 gtcataggtg gaagtgctct ctgttgtatt ttattttcta tgggaatacg gtggcgcccg 1740 gttctcgaga aagacagaat tctcgatata ttgcgtgacg gtgctcgatc ttttctttct 1800 ctggcttttc ttagcttgca catgcaagtg ctcgttgcgg cggttggtgt tgttggtgga 1860 gcctccgcgg ccggagtgct ttctactgcg gataaattcc ttcgcgggat cgcggctgct 1920 acttcaccca tagctagcgc tctatttccg acttttagca ggatgtatgc gagtgccgac 1980 ccggcagtcg gcagtttaag aaggaaagcg ctaggtctga tgttactaat agctattcct 2040 agttgtttat ttcttttctt attttctgaa tacatttcat atctcctatt cccggaacag 2100 tccagaggtc taactgttgt aataagaatg ttttcgatag tgccagtgtt tgcttgtatt 2160 ggtgttctgt atggagggtt gactcttgtt ccttctgggt atgatggtgt atatttgcga 2220 gcaatttttt ttgcggaatt gggcggggta ttaacattta tcctcttggc gctttggggg 2280 gatgagcttt ttggagcgtg gacgctggtc gttacagagg tctctttggg gatgggaatg 2340 tttttcctgg ccacggttaa gttgagagag aaaaggggac tttgatctta aggcgatcgc 2400 taggaggaca gctatgcgta ttgcgattct gggcgcgacc aacattaaac atatgagcct 2460 gctgagccat tatctgaacc atattgatct gaacattaac gaagtggata ttatttatac 2520 cgataaatat gatattgaag aacatattca gggcatcaac aactactaca aatacaaagt 2580 ggatatcaaa gaagattgga ccttcatcaa gaaagcgatt gcgtattatc gttttcgtcc 2640 gtatgcgatg aaaattctga aagaaaaccg ttatgatttt gtgattgtgt ggggcagcta 2700 caccggccat ctgttcaaaa gctttctgga aaaacattac aaaaacaaat tcatcctgaa 2760 catccgtgat tactttttcg aaaacaacaa actgattaaa tatcgtatga agaaaatcgt 2820 ggatgcgagc cgtgtgacca ccctgagcag cgaaggcttt ctgaaattcc tgccgaaaag 2880 cgaaaaatac cgtatcatct acagctacaa catgagcatc atccgtgaaa gcaacgtgac 2940 cgatggcttt aaaaaacgtt ggccgattaa cattggcttt attggcaacg tgcgttttaa 3000 cgaaattaac cagaaactga ttaaagaact ggcgaacgat agccgttttc atatgcagta 3060 ttttggcacc ggcagcgaaa aactggaagt gtttgcgcgt gaaaacttta ttaacaacat 3120 tacctttagc ggcggctttg atctgaaaga aaccccgaaa tatctgaacg aaattgatat 3180 tctgaacaac ctgtttggca accagaacat tgcgctggat accgcgctga gcattcgtat 3240 gtattatgcg ctgtttctga acaaaccgat tattaccacc gatgatacct ttaccgcgac 3300 cgaagcgaac aaatttggcc tgggctttag cattaacccg gaaaacctga aaggcattgg 3360 cgatgaactg atggattggt ataacaacct ggatgtgatg gatattaacc ataaacgtga 3420 agcgtatcgt aacgatgtga ttgaaaacaa caaacagttt tatcaggaaa ttggccgtat 3480 ttttaacgaa gaacagaaac tgattagcga agaagatctg taacgtttaa acaggaggac 3540 agctatgaac aaaatttata acgtgaccag ctatgtgatt gcgattctga tgtttccgtg 3600 cctgatgctg ggcgataaac cgctgctgtt tctggcgccg attagctatg gcgtgggcaa 3660 actgttcatc agcttcagca acaacccgaa cttcaaattc agcaaaatcg tgtacgatgt 3720 gctgggcttt ctgcgtctgg tgtttattcc ggcgatgatt gtgtttttcc aggatagcac 3780 cattgataac ctgccgctgg gccaggcgta ttttaaccag gcggtgattt atatgagcgt 3840 ggaatttatt attggcagcc tgtttattct gattctgagc aaactgttca agcatgaagt 3900 tgtgagccgt aacagcttta ccctgagcgg cagcagcatt tattatattg tgtttggcct 3960 ggtgatttgc ggcatttttg tggcgtttcc ggaagtgcgt aaaaacatta gctttctgat 4020 tattaaaacc gatgcgatgg gccgtggcac cgaagcgacc agcggcctga acgtgctgtt 4080 tgtgatgctg tttcagctgg cgctggcgct gctgtttctg atcatcgcgt acgcgagcta 4140 caaaaaatac aaagaaaacc cgaaaatcat ctacgtggtg ctgccgctgg cgattggcat 4200 tctgaacatt agcctgattg tgggcgaacg tcgtagctat cagctgtata ccatggtggc 4260 ggtgctgacc gttgtgagca tcctgtttag caaacataaa cgtcgtatca acatcatcat 4320 catcagcgtg ggcatcttcg tgctggcgct gatgaccctg tataaagaac tgtatgtgtt 4380 taactatagc agctatagcg aagcgctgaa cagcaccagc gtgagcaacc tgaaaattgt 4440 ggataccctg cagagctatt tttatggccc gagcaacatt gcggcgagca ttgattatct 4500 gaactattat aacggcagct ttaaacagta tctgtttgat aacacccgtg cggtgtttgg 4560 ctttaacttt ttcctggata aaaaacagct gattaccagc cagctgttta accagctgat 4620 ttatggcagc aaacagctga ccggccatct gattagcagc gcgggctatg gcattattta 4680 ttttggcccg ctgtttttct acctgaacct gattgcgaac atctttttcg cgtttctgag 4740 cgaatacatc atccgtaaaa gccatagcct ggaagtgatc ttcatcggca cctacatcta 4800 catgcgtctg attaccagca tttttagcca tccgaccccg ctgattaccc tgattagcat 4860 gattctggtg gtgtatgtga ttgcgatcat cccgggcatc atcatcaaga aattcaccaa 4920 aaaagtgggc atcgaagatt acaaagatga tgatgataaa taacgtttaa acaggaggac 4980 agctatgatt gtgaaaacct ttatgaaaag caaaattttt cgtctgatga acaccccgct 5040 gctgctgttt tataaaaaag aatatctgac cggctattat tttgaaaaca aagtggcggg 5100 ctggctgtgg gcgtggaaag cggtgccatt caagctgctg ggcattaaca ccagcctgcc 5160 gtttccggcg gatattaccg tgcgtatgca taacccgaac aacattgtgt ttgataaaaa 5220 cgatattcat atttttcaga gcccgggcac ctattttaac aactttagcg cggtgattta 5280 tattggccgt ggcgtgtata ttgcgccgaa cgtgggcatt attaccgcga accataacat 5340 taaaaacctg aaaagccatg cgccgggcga agatgtgaaa attggcaact atagctggat 5400 tggcatgaac agcgtgattc tgccgggcgt ggaactgggc gaacatacca ttgtgggcgc 5460 gggcagcgtg gtgaccaaaa gctttccgga aggcaacgtg gtgattggcg gcaacccggc 5520 gaaaattatt aagaaaatca gctatccgta tgatgtgccg gattatgcgt aattaattaa 5580 ccaggtgcac gaagaaaatt atgagattaa ataaatttat tggcgattcg tttttaatga 5640 ttttaagcag tggcatcgct caagtcatat taatcatcac taccccaatt attacaagac 5700 tatattcacc tacagaattt ggtgagttta caattttttc aaatatcgca atgattttaa 5760 taccaataat aaatgcaaga tacgatttgt tgattgtgaa taccaaaaat gaccgtagtg 5820 ctaatatact ttcacaaatc agttttttga tatcattgct tattttatta atactgatac 5880 caatatttgc gattagtgca tgtttatacc caaactttat attagatttt attttcatta 5940 ttattatgtt gtttttggta agtttaacaa acatttttac aaattatcta aataaggaaa 6000 gaaagtataa agtgttaagt ttgattaatg tgtttagagc tggatcaatg gctttacttc 6060 aaatcatttt cggactttta gcattaggaa gtttaggatt aattattggt ttttcattat 6120 cctatatcgc aggcattaca ctaggatata aaacgtttaa aaagcacttt aatattgtga 6180 gagataaaga agaaactaaa gcattatttt tagaaaataa aaatcagtta gtttattcaa 6240 caccatcaat attattaaat agtttgtctt tctcggttgt tgtgttcttt ataggtattt 6300 tgtataccaa tacagaagtg ggtatttatg gtatggccat aagagtacta ggcataccag 6360 tgacaattat ttcattaggg ttatcaaaaa tatttatgca acaagccaat gactattata 6420 ttgaacatgg taacttccga aatttattac ttaaatttag ttccatactg gttatagttt 6480 ctataattct ttatgtgcca ctttatttgt tcagtgaaga attagtcaat atattattag 6540 gacatagctg ggttgacgca attacagtta taaaaattgt tatcccatta tttgttataa 6600 ggctgattgt atcaacggta tcactttctg tgattgtatt acaaaaacaa cagttagaat 6660 taatactaca agcgttattt ttaataggta ctactgcaac atttgttata tcaaaaatgc 6720 ttaatttaac ttttttaaac tttgtatcta ttaatacaat tgttttaatc gtatcgtaca 6780 tgatattttt catagcactc tattattttg ctaaaaataa acagttcaaa aattctagtt 6840 atccgtatga tgtgccggat tatgcgtaag tgcaccatat gaatatcctc cttagttcct 6900 attccgaagt tcctattctc tagaaagtat aggaacttcg gcgcgcctac ctgtgacgga 6960 agatcacttc gcagaataaa taaatcctgg tgtccctgtt gataccggga agccctgggc 7020 caacttttgg cgaaaatgag acgttgatcg gcacgtaaga ggttccaact ttcaccataa 7080 tgaaataaga tcactaccgg gcgtattttt tgagttgtcg agattttcag gagctaagga 7140 agctaaaatg gagaaaaaaa tcactggata taccaccgtt gatatatccc aatggcatcg 7200 taaagaacat tttgaggcat ttcagtcagt tgctcaatgt acctataacc agaccgttca 7260 gctggatatt acggcctttt taaagaccgt aaagaaaaat aagcacaagt tttatccggc 7320 ctttattcac attcttgccc gcctgatgaa tgctcatccg gaattacgta tggcaatgaa 7380 agacggtgag ctggtgatat gggatagtgt tcacccttgt tacaccgttt tccatgagca 7440 aactgaaacg ttttcatcgc tctggagtga ataccacgac gatttccggc agtttctaca 7500 catatattcg caagatgtgg cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt 7560 tattgagaat atgtttttcg tctcagccaa tccctgggtg agtttcacca gttttgattt 7620 aaacgtggcc aatatggaca acttcttcgc ccccgttttc accatgggca aatattatac 7680 gcaaggcgac aaggtgctga tgccgctggc gattcaggtt catcatgccg tttgtgatgg 7740 cttccatgtc ggcagatgct taatgaatac aacagtactg cgatgagtgg cagggcgggg 7800 cgtaaggcgc gccatttaaa tgaagttcct attccgaagt tcctattctc tagaaagtat 7860 aggaacttcg aagcagctcc agcctacacg taaagaggtg gtgtatggat aagaactctg 7920 ttctgttaat taccggtgga actggttcct ttggaaatgc cgttttgaag cgttttctgg 7980 atacagatat tggtgaaata cgtgtattca gtcgggatga gaagaagcaa gatgatatgc 8040 gtaagtgcta tgctcacccc aagttgaggt tttatattgg agatgtccgc gactatcaaa 8100 gcactctgaa tgctactcgc ggtgtggact acattttcca tgcggctgca ttgaaacagg 8160 ttccctcttg tgagttctac ccgatggagg ctgtgaagac caatgtcatc ggaacggaaa 8220 atgtcctcga atctgctatc cagaatggcg tcaaaaaagt cgtttgtctg agtacggata 8280 aggcagttta cccaatcaat gccatgggta tttcaaaggc catgatggaa aaggtcatgg 8340 tcgccaagtc tcgaaacctg gaacgcactc ctaccgtaat ttgtggcacc cgttatggta 8400 acgtcatggc ttcaaggggc tcggtcattc ctctctttat cgagcaaatg cgatcaggcc 8460 agcctctcac aatcactgat ccaaacatga cacgtttcat gatgacgctt acggatgccg 8520 tagaccttgt gctttatgct ttcgagcatg gtaccaatgg agatcttttt gtacagaaag 8580 caccggctgc aaccatcgag gtgctggctc atgcgcttac tcaattgctt ggcaagaatg 8640 gttatcctat caatgtaata ggtacgcgtc atggagagaa gctttatgag gcgcttctta 8700 gtcgagagga aatggcctgt gctgaagaca tgggtgacta ttatcgtatc cccccagatt 8760 tgcgtgatct gaactatagt aagtttgtgg agcaaggcga ggaaaaaatt actcatacag 8820 aggactataa ttctcataat accaaacgtc tggatatcga aggaatgaaa aagctgttgc 8880 tgaagttgga tttcattcgt gctattcagc gtggcgagag tgccagtcca gaggaataaa 8940 cgatgaaagt tcttgtaact ggcgcgaatg gatttgttgg aaggaatctg tgcgctcatc 9000 ttgcagagcg gggtggtatc gaggtggtgc cattcacccg cgagagtagt gttggtaatt 9060 tgcctgagct aattcgttcc gtcgatttta tttttcatct tgccggggtc aatcgtccgg 9120 aaaaaccaga agagtttaag atcgggaatt ccgaactcac gtatgctctg tgtgaggcgg 9180 taaggtccaa tggacgagcc ataccacttc tttatacttc atccattcag gctgaggtgg 9240 ataatgagta cggtttaagc aagcgagccg cagaagagca tctccaagtg ctaggtgagg 9300 atattggttg tcctgtctac atatttcgcc ttcctaatgt attcggtaaa tggtcgcgtc 9360 cgaattataa ttcagcggtt gcgacttttt gtcataatat tattcgagat attccgattc 9420 aaattaacaa ttcctcggca gagatcactc ttgtatacat agatgatgtg gttcgcacct 9480 tcatgaaagt catggatggg aagctatcca atgcagtttc actacaggtc gagccccagt 9540 atcagatttc tgttggtgag ctcgcagaac aattgtatga gtttcgtaat agtcgaaagt 9600 cactgactac cgcaagggtt ggctcgggat tgacgcgcgc cttgtactcg acttatctaa 9660 gtttcttgcc agaagatagt tttagttacg acgtgccaat gcattcggat ccgcgtggca 9720 cattcgtcga gatgctgaag accgcggact ctggccagtt ctcgtttttt acggctcatc 9780 caggtgttac caggggcggg cattaccatc actcgaaaac cgaaaagttt ctggttatca 9840 aagggatggc acgtttcaag tttagaaaca tcctgaccgg ggcattttac gaaatttgca 9900 ctaatggtga aaaggcagaa attgtcgaaa cagtacctgg atggactcat gacattacta 9960 atgtcggaac tgacgatatg gtagtcatgt tgtgggctaa cgaagtattt gatcgggaaa 10020 atccggatac ctacgcttgt tcagtaggcg aaggtgcgta aggtatagtg agataacaat 10080 gcagaagcta aaagtcgtta cggttgttgg aactcgtcct gagattattc gcttgtctag 10140 ggtcatggcg aagcttgatc agtactgcga tcatgtactt gtccatactg gacagaatta 10200 tgattacgaa cttaatgaaa tattttttca ggacctcggt ataagaaagc cggattattt 10260 tctaaacgcc gccgggtctt ccggggctga aacgataggg aatgtaataa tcgcagtcga 10320 tcgtgttctg ggcgaaatag atcccgatgc gctgctcgtg ctgggtgata ccaatagttg 10380 tatggcggta ctgcctgcaa aacggcgtaa gataccgacc tttcatatgg aagcaggcaa 10440 tcgctgtttc gatatgcgtg tgcctgaaga gataaatcgg cgcattgtcg atcatacagc 10500 tgatgtaaat ttgacctata gtacaattgc gcgtgattat ctcttgcgtg aaggactttc 10560 tccagacatg gttatcaaga ctggtagccc tatgttcgaa gttctcgagc actatcgtga 10620 cgggatcgag tcctccgata ttcttgaaag gctcgggttg aaaacagagc ggttctttgt 10680 cgtgagtgcg caccgagagg aaaacataga ttcggataag aatttcttga agttggtttc 10740 tatgctcaac gctgtggcag aaaagtactc gctgcccgtc atcgtatcaa ctcaccctag 10800 aacaaaaaag agaattgagg cgacggaggc aaagtttcac gagggtatta aactgctgaa 10860 acccctcggc tttaaggatt acaataaact gcaaattaca gccaaggcag ttatttctga 10920 cagtgggacc atcagtgagg agtcttcaat actgaatttt cccgctttga atattcgtga 10980 ggctcatgaa cgcccagaag gcatggaaga ggctgtggtg atgatggtcg gactggattc 11040 ggatcgagta ctacaagcac tcgaggtgtt ggagggacag aggcgcgacg cagagcgcat 11100 gttacgcttg gtcgctgact atagcatgcc caacgtttct gaaaagattg ttcgcatagt 11160 tcatagctat cgggactatg tcatgcgaac tgtctggaaa aaatattaac ttgaggcgtg 11220 gagttgatgg caaggatatt tgtggtttct gagtatgtcg gtgccaatca gaactccacg 11280 ggatactatt gggagaagat aataggaaag atgcagcggg agtttggtgg gctaaccgta 11340 attttcccgc tgaccgcagg tgaaaccccg cctgtggttt caccttccgt tgagcaagaa 11400 tgctttaagt ttccgaggag caataagaat aggctccttt ctagaggatt ggcgcagatt 11460 tttcaggcgt ttctgttctc agtaaaattg acttctcgtg ccagacgagg agatgtggta 11520 ttgagtggaa ccaaccctgc tcttctactg atgacgtttc ccttgctaag gtatgccctc 11580 ggtttcaagt gggtgctgct ggtgcatgat gtgtttcccg agaacttggt gccggcgggc 11640 gttctgaaga aagatagtat tgcctaccgg cttctacgtc gtctcttttc tttcatttac 11700 tcatccgctg atcgtctagt cgtaataggg cgcgatatgg aagctcttat gaaagagaag 11760 gtgaatgacc cgcgatcttt ggtctttatt tcgaattggg cctgtgagaa agaggttttc 11820 ccagtaccga gagaggatgc tccttttatc aatattcctg aatggaaagg taaaagggtt 11880 ttccaatttt ttggtaatgt cggtcgatta caaggtatag aaaacatact ttctgctatt 11940 cagttggtta aaaacgagaa ggcggctttt gcttttattg gagatggtgc cttggtcgac 12000 agtgtaaaaa aacacgcgct ggaagatcag tgtgctcggt tgaggtattt tggaaggctg 12060 ccattagccg aaaagaattt tggtttggct gcctgtgacg ttgccttagt taccttagaa 12120 gaaggaatgt tcgggcttgg ggttcccagc aaggcatatt tctccatggc agcagacaaa 12180 ccgattctag ctgtcatgga aaaaggggct gaaatctccc gtataataga tgagaccgga 12240 atcggttgga actgtccgcc gaatgatccg gttgctttgg caagattgat cgatgagatt 12300 tgtgaactcg acttgtctag tttaggcgga gtcccgcgga gtgtccttca gcaaaattat 12360 tctgaatata tttcattgga aaaattcgct gcctgtgttc gaccgcttct gtctgagtcg 12420 aaaatatgat gaaggtgctg gtaaccgggg ctagcggttt tgtcgggagt gcgctttgca 12480 ggtcgcttgc tgccgccccc tttcaggttg tcggacaagt acgatccctg tacaatcccg 12540 ttacgggggt tgagtatgtt cgagcggagc tgaaagagag cactaagctt gatgctgcgc 12600 tgcggggtgt tgaatgtgta gttcatctag ctggacgagc ccatatcttt ggaaggcagc 12660 gtgattcact agatattttt cggaaggtga atcgcgatgc tactctggcg cttgctcggc 12720 aggcgatcga agcatctgta aagcgtttca tttttgttag ttctattggt gtaaatggcg 12780 ctttaaccaa agaaaagccc ttcgatgaga actccaagcc ggctcctcat gcagaatatg 12840 cgatttcaaa gtttgaggct gaagtagcgc ttcgggagct tttcaagcat tcctcaacag 12900 aacttgttat cgtcaggcct ccactcgttt acgactggaa agctcctgga aatttctcgc 12960 gattgttgaa gctggttgct tcgggacttc ctcttccatt tggttgcata gataaccgac 13020 gaagttttgt ttctctggat aatttagttg actttctagc ttgctgtatg acgcaccctt 13080 ctgctgccgg cgaactgttt ttggtatccg atggtcagga gatttctacc aagcaactgg 13140 tgactgcgct tgctgcggga atggggcgtc gccccatcat gtggcctgtt cctaggttta 13200 ttctgaggtt tcttaaatta gtaggaaagg gtgggttata cactcagtta tgctgctcac 13260 tagaggtcga ctcgtcgaaa ggcaggcttt tgcttggttg ggaaccccgc aagagcaccc 13320 tttccgcgtt ggaagatgtt ggtagaatat atgtcaaacg tactgaatga ttatctgcag 13380 gcgctttgct actagcatgg cgtaccacgc agaacaatcg aatagaaccc tgttgaaggg 13440 gtgagagtat ttttggggat aaatttataa atggaagaat ggtatttgtt actcgctgca 13500 gctggggttt cgggactgct tacaggcctc ttgcgtcgtt atgccttagc gaggagctta 13560 cttgacaccc ctaactctcg aagttcccat gtcgttccca ctccacgcgg aggaggggtc 13620 gccattgtag ttactttttg tctcatgctg cctatttggg ctgtactggg aaatatctca 13680 tgggccgtgt cctgggcttt acttctcgct ggcggcgggg ttgccattat tggattcatg 13740 gatgatcacg gtcatatcgc cgcacgctgg cgtctgctgg gacattttag tgcagccttg 13800 gtctcattgt actttttgaa tggcatacca ccatttcaga ttgttggtgt cagttgggac 13860 ctggggtggt tcggaggact tctctttgct ttctatctcg tgtggttgct gaatctctat 13920 aacttcatgg atgggatcga tggacttgct agccttcagg ccatttttgt ctgtgttggt 13980 ggggcattat tatactggct gaatggccaa ctgacgcagg ctttgctccc cttatcgcta 14040 gcttttgccg tttttggatt cttgttctgg aattttccac ccccaaaaat tttcatggga 14100 gatgcgggta gtggtcttct ggggattgtt ttaggaattc tttccattca tgccatgtgg 14160 atgaatacga attttttctg ggcatggttg gtcctgttag gcgttttcat cgtcgatgcg 14220 acctataccc tgattcgtcg cttgctgaga ggggacaagg tgtatgaggc tcatcgaagc 14280 catgcctatc aatacgcaag ccgatactat ggaaagcatg ctcctgttac gattggcgtc 14340 acggcattga acgtcatctg gctcctccct atagccttgt tggtcgggag tgggtctcta 14400 gagcctttga tgggcatcgt catagcctac gtccctctcg tttttctggc agtgaggttc 14460 aaggcgggta agctagagtc gtccgctcag gcctaaagga gtaggggaat gctagatcgt 14520 ttaagagtaa agttgttatc catgcctcgt cgctggaaac gtttgcttca agtggctacg 14580 gatatccttc tggtatggct gtctctgtgg ctcgcttttg tggtccgtct aggcacagac 14640 gatatgatcg acgtgttcgg cgagcatgca tggcttttca tcactgcgcc ggtcatcgcc 14700 attccactat tcattcgctt cggcatgtat cgcgcggtga tgcgctatct cggtaacgac 14760 gcattgatcg ccatcgccaa ggcggtgacc atctcggctc tggtgctgtc gctggtggtg 14820 tactggtatc gtggcgcgcc ggcgccggtg ccgcgttccc tggtgttcaa ctactggtgg 14880 ttgagcatgc tgctgatcgg cggcttgcgt ctggccatgc gccagtattt catgggcgac 14940 tggtactctg ctgtgcagtc ggtaccattt ctcaaccgcc aggatggcct gcccagggtg 15000 gttatctatg gggcgggggc ggccggcaac cagttggttg cggcgttgcg tctcggtcgg 15060 gcgatgcgtc cggtggcgtt catcgatgac gacaagcaga tcgccaaccg ggtcattgcc 15120 ggtctgcggg tctataccgc caagcatatc cgccagatga tcgacgagac gggcgcgcag 15180 gaggttctcc tggcgattcc ttccgccact cgggcccggc gccgagagat tctcgagtcc 15240 ctggagccgt tcccgctgca cgtgcgcagc atgcccggct tcatggacct ggccagcggc 15300 cgggtcaagg tggatgacct gcaggaggtg gacatcgctg acctgctggg gcgcgacagc 15360 gtcgcaccgc gcaaggagct gctggaacgg tgcatccgcg gtcaggtggt gatggtgacc 15420 ggggcgggcg gctctatcgg ttcggaactc tgtcggcaga tcatgagttg ttcgcctagc 15480 gtgctgatcc tgttcgaaca cagcgaatac aacctctata gcatccatca ggaactggag 15540 cgtcggatca agcgcgagtc gctttcggtg aacctgttgc cgatcctcgg ttcggtgcgc 15600 aatcccgagc gcctggtgga cgtgatgcgt acctggaagg tcaataccgt ctaccatgcg 15660 gcggcctaca agcatgtgcc gatcgtcgag cacaacatcg ccgagggcgt tctcaacaac 15720 gtgataggca ccttgcatgc ggtgcaggcc gcggtgcagg tcggcgtgca gaacttcgtg 15780 ctgatttcca ccgacaaggc ggtgcggccg accaatgtga tgggcagcac caagcgcctg 15840 gcggaaatgg tccttcaggc gctcagcaac gaatcggcgc cggtgctgtt cggcgaccgg 15900 aaggacgtgc atcacgtcaa caagacccgt ttcaccatgg tccgcttcgg caacgtcctc 15960 ggttcgtccg gttcggtcat tccgctgttc cgcgagcaga tcaagcgcgg cggcccggtg 16020 acggtcaccc acccgagcat cacccgttac ttcatgacca ttcccgaggc ggcgcagttg 16080 gtcatccagg ccggttcgat ggggcagggc ggagatgtat tcgtgctgga catggggccg 16140 ccggtgaaga tcctggagct cgccgagaag atgatccacc tgtccggcct gagcgtgcgt 16200 tccgagcgtt cgccccatgg tgacatcgcc atcgagttca gtggcctgcg tcctggcgag 16260 aagctctacg aagagctgct gatcggtgac aacgtgaatc ccaccgacca tccgatgatc 16320 atgcgggcca acgaggaaca cctgagctgg gaggccttca aggtcgtgct ggagcagttg 16380 ctggccgccg tggagaagga cgactactcg cgggttcgcc agttgctgcg ggaaaccgtc 16440 agcggctatg cgcctgacgg tgaaatcgtc gactggatct atcgccagag gcggcgagaa 16500 ccctgagtca tcgttctccg gaaaaggccg cctagcggcc ttttttgttt tctccgtacg 16560 atgtttccgg tgccggacca ggaagcgact gctttgctgg ggctgtcgat ccaggtgcgt 16620 tccacggcga taaggtggtt tcgtggatgg gcaacatgtg 16660 <210> 5 <211> 972 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 5 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60 gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120 aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180 agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240 attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300 ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360 tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420 aacggcaacg tgaccggcga tgataccggc aaaattggtg gactgattgg cgcgaacgtg 480 agcattggcc ataccctgaa atatgtgcag ccggatttta aaaccattct ggaaagcccg 540 accgataaaa aagtgggctg gaaagtgatt tttaacaaca tggtgaacca gaactggggc 600 ccgtatgatc gtgatagctg gaacccggtg tatggcaacc agctgtttat gaaaacccgt 660 aacggcagca tgaaagcggc ggataacttt ctggatccga acaaagcgag cagcctgctg 720 agcagcggct ttagcccgga ttttgcgacc gtgattacca tggatcgtaa agcgagcaaa 780 cagcagacca acattgatgt gatttatgaa cgtgtgcgtg atgattatca gctgcattgg 840 accagcacca actggaaagg caccaacacc aaagataaat ggattgatcg tagcagcgaa 900 cgttataaaa ttgattggga aaaagaagaa atgaccaacg gcagccatca tcatcatcat 960 cattaggtcg ac 972 <210> 6 <211> 990 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 6 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60 gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120 aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180 agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240 attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300 ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360 tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420 aacggcaacg tgaccggcga tgataccggc aaaattggtg gactgattgg cgcgaacgtg 480 agcattggcc ataccctgaa atatgtgcag ccggatttta aaaccattct ggaaagcccg 540 accgataaaa aagtgggctg gaaagtgatt tttaacaaca tggtgaacca gaactggggc 600 ccgtatgatc gtgatagctg gaacccggtg tatggcaacc agctgtttat gaaaacccgt 660 aacggcaaag atcaaaatag aactaaaatg aaagcggcgg ataactttct ggatccgaac 720 aaagcgagca gcctgctgag cagcggcttt agcccggatt ttgcgaccgt gattaccatg 780 gatcgtaaag cgagcaaaca gcagaccaac attgatgtga tttatgaacg tgtgcgtgat 840 gattatcagc tgcattggac cagcaccaac tggaaaggca ccaacaccaa agataaatgg 900 attgatcgta gcagcgaacg ttataaaatt gattgggaaa aagaagaaat gaccaacggc 960 agccatcatc atcatcatca ttaagtcgac 990 <210> 7 <211> 990 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 7 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60 gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120 aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180 agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240 attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300 ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360 tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420 aacggcaacg tgaccggcga tgataccggc aaaattggtg gactgattgg cgcgaacgtg 480 agcattggcc ataccctgaa atatgtgcag ccggatttta aaaccattct ggaaagcccg 540 accgataaaa aagtgggctg gaaagtgatt tttaacaaca tggtgaacca gaactggggc 600 ccgtatgatc gtgatagctg gaacccggtg tatggcaacc agctgtttat gaaaacccgt 660 aacggcagca tgaaagcggc ggataacttt ctggatccga acaaagcgag cagcctgctg 720 agcagcggct ttagcccgga ttttgcgacc gtgattacca tggatcgtaa agcgaaagat 780 caaaatagaa ctaaaaaaca gcagaccaac attgatgtga tttatgaacg tgtgcgtgat 840 gattatcagc tgcattggac cagcaccaac tggaaaggca ccaacaccaa agataaatgg 900 attgatcgta gcagcgaacg ttataaaatt gattgggaaa aagaagaaat gaccaacggc 960 agccatcatc atcatcatca ttaagtcgac 990 <210> 8 <211> 990 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 8 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60 gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120 aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180 agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240 attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300 ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360 tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420 aacggcaacg tgaccggcga tgataccggc aaaattggtg gactgattgg cgcgaacgtg 480 agcattggcc ataccctgaa atatgtgcag ccggatttta aaaccattct ggaaagcccg 540 accgataaaa aagtgggctg gaaagtgatt tttaacaaca tggtgaacca gaactggggc 600 ccgtatgatc gtgatagctg gaacccggtg tatggcaacc agctgtttat gaaaacccgt 660 aacggcagca tgaaagcggc ggataacttt ctggatccga acaaagcgag cagcctgctg 720 agcagcggct ttagcccgga ttttgcgacc gtgattacca tggatcgtaa agcgagcaaa 780 cagcagacca acattgatgt gatttatgaa cgtgtgcgtg atgattatca gctgcattgg 840 accagcacca actggaaagg caccaacacc aaagataaag atcaaaatag aactaaatgg 900 attgatcgta gcagcgaacg ttataaaatt gattgggaaa aagaagaaat gaccaacggc 960 agccatcatc atcatcatca ttaagtcgac 990 <210> 9 <211> 1659 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 9 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcc 60 gcgagcgaaa acagcgtgac ccagagcgat agcgcgagca acgaaagcaa aagcaacgat 120 agcagcagcg tgagcgcggc gccgaaaacc gatgatacca acgtgagcga taccaaaacc 180 agcagcaaca ccaacaacgg cgaaaccagc gtggcgcaga acccggcgca gcaggaaacc 240 acccagagca gcagcaccaa cgcgaccacc gaagaaaccc cggtgaccgg tgaagccacc 300 accaccacca ccaaccaggc caacaccccg gcgaccaccc agagcagcaa caccaacgcg 360 gaagaactgg tgaaccagac cagcaacgaa accaccttta acgataccaa caccgtgagc 420 agcgtgaaca gcccgcagaa cagcaccaac gcggaaaacg tgagcaccac ccaggatacc 480 agcaccgaag cgaccccgag caacaacgaa agcgcgccgc agagcaccga tgcgagcaac 540 aaagatgtgg tgaatcaggc cgttaatacc agcgcgccgc gtatgcgtgc ctttagcctg 600 gcggccgtgg ccgccgatgc tccagcagca ggtaccgata ttaccaacca gctgaccaac 660 gtgaccgtgg gcattgatag cggcaccacc gtgtatccgc atcaggcagg ttatgtgaaa 720 ctgaactatg gctttagcgt gccgaacagc gcggtgaaag gcgatacctt taaaattacc 780 gtgccgaaag aactgaacct gaacggcgtg accagcaccg cgaaagtgcc gccgattatg 840 gcaggtgatc aggtgctggc gaacggcgtg attgatagcg atggcaacgt gatttatacc 900 tttaccgatt atgtgaacac caaagatgat gtgaaagcga ccctgaccat gccagcatat 960 attgatccgg aaaacgtgaa gaaaaccggc aacgtgaccc tggcgaccgg cattggcagc 1020 accaccgcga acaaaaccgt tctggtggat tatgaaaaat acggcaaatt ctacaacctg 1080 agcatcaaag gcaccatcga tcagatcgat aaaaccaaca acacctatcg tcagaccatt 1140 tatgtgaacc cgagcggcga taacgtgatt gcgccggtgc tgaccggcaa cctgaaaccg 1200 aacaccgata gcaacgcgct gattgatcag cagaacacca gcattaaagt gtataaagtg 1260 gataacgcgg cggatctgag cgaaagctat tttgtgaacc cggaaaactt tgaagatgtg 1320 accaacagcg tgaacattac ctttccgaac ccgaaccagt ataaagtgga atttaacacc 1380 ccggatgatc agattaccac cccgtatatt gtggtggtga acggccatat tgatccgaac 1440 agcaaaggcg atctggcgct gcgtagcacc ctgtatggct ataacagcaa cattatttgg 1500 cgtagcatga gctgggataa cgaagtggcg tttaacaacg gcagcggcag cggcgatggc 1560 attgataaac cggtggtgcc ggaacagccg gatgaaccgg gcgaaattga accgattccg 1620 gaagatggca gccatcatca tcatcatcat taggtcgac 1659 <210> 10 <211> 1677 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 10 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcc 60 gcgagcgaaa acagcgtgac ccagagcgat agcgcgagca acgaaagcaa aagcaacgat 120 agcagcagcg tgagcgcggc gccgaaaacc gatgatacca acgtgagcga taccaaaacc 180 agcagcaaca ccaacaacgg cgaaaccagc gtggcgcaga acccggcgca gcaggaaacc 240 acccagagca gcagcaccaa cgcgaccacc gaagaaaccc cggtgaccgg tgaagccacc 300 accaccacca ccaaccaggc caacaccccg gcgaccaccc agagcagcaa caccaacgcg 360 gaagaactgg tgaaccagac cagcaacgaa accaccttta acgataccaa caccgtgagc 420 agcgtgaaca gcccgcagaa cagcaccaac gcggaaaacg tgagcaccac ccaggatacc 480 agcaccgaag cgaccccgag caacaacgaa agcgcgccgc agagcaccga tgcgagcaac 540 aaagatgtgg tgaatcaggc cgttaatacc agcgcgccgc gtatgcgtgc ctttagcctg 600 gcggccgtgg ccgccgatgc tccagcagca ggtaccgata ttaccaacca gctgaccaac 660 gtgaccgtgg gcattgatag cggcaccacc gtgtatccgc atcaggcagg ttatgtgaaa 720 ctgaactatg gctttagcgt gccgaacagc gcggtgaaag gcgatacctt taaaattacc 780 gtgccgaaag aactgaacct gaacggcgtg accagcaaag atcaaaatag aactaaagcg 840 aaagtgccgc cgattatggc aggtgatcag gtgctggcga acggcgtgat tgatagcgat 900 ggcaacgtga tttatacctt taccgattat gtgaacacca aagatgatgt gaaagcgacc 960 ctgaccatgc cagcatatat tgatccggaa aacgtgaaga aaaccggcaa cgtgaccctg 1020 gcgaccggca ttggcagcac caccgcgaac aaaaccgttc tggtggatta tgaaaaatac 1080 ggcaaattct acaacctgag catcaaaggc accatcgatc agatcgataa aaccaacaac 1140 acctatcgtc agaccattta tgtgaacccg agcggcgata acgtgattgc gccggtgctg 1200 accggcaacc tgaaaccgaa caccgatagc aacgcgctga ttgatcagca gaacaccagc 1260 attaaagtgt ataaagtgga taacgcggcg gatctgagcg aaagctattt tgtgaacccg 1320 gaaaactttg aagatgtgac caacagcgtg aacattacct ttccgaaccc gaaccagtat 1380 aaagtggaat ttaacacccc ggatgatcag attaccaccc cgtatattgt ggtggtgaac 1440 ggccatattg atccgaacag caaaggcgat ctggcgctgc gtagcaccct gtatggctat 1500 aacagcaaca ttatttggcg tagcatgagc tgggataacg aagtggcgtt taacaacggc 1560 agcggcagcg gcgatggcat tgataaaccg gtggtgccgg aacagccgga tgaaccgggc 1620 gaaattgaac cgattccgga agatggcagc catcatcatc atcatcatta agtcgac 1677 <210> 11 <211> 1677 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 11 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcc 60 gcgagcgaaa acagcgtgac ccagagcgat agcgcgagca acgaaagcaa aagcaacgat 120 agcagcagcg tgagcgcggc gccgaaaacc gatgatacca acgtgagcga taccaaaacc 180 agcagcaaca ccaacaacgg cgaaaccagc gtggcgcaga acccggcgca gcaggaaacc 240 acccagagca gcagcaccaa cgcgaccacc gaagaaaccc cggtgaccgg tgaagccacc 300 accaccacca ccaaccaggc caacaccccg gcgaccaccc agagcagcaa caccaacgcg 360 gaagaactgg tgaaccagac cagcaacgaa accaccttta acgataccaa caccgtgagc 420 agcgtgaaca gcccgcagaa cagcaccaac gcggaaaacg tgagcaccac ccaggatacc 480 agcaccgaag cgaccccgag caacaacgaa agcgcgccgc agagcaccga tgcgagcaac 540 aaagatgtgg tgaatcaggc cgttaatacc agcgcgccgc gtatgcgtgc ctttagcctg 600 gcggccgtgg ccgccgatgc tccagcagca ggtaccgata ttaccaacca gctgaccaac 660 gtgaccgtgg gcattgatag cggcaccacc gtgtatccgc atcaggcagg ttatgtgaaa 720 ctgaactatg gctttagcgt gccgaacagc gcggtgaaag gcgatacctt taaaattacc 780 gtgccgaaag aactgaacct gaacggcgtg accagcaccg cgaaagtgcc gccgattatg 840 gcaggtgatc aggtgctggc gaacggcgtg attgatagcg atggcaacgt gatttatacc 900 tttaccgatt atgtgaacac caaagataaa gatcaaaata gaactaaagt gaaagcgacc 960 ctgaccatgc cagcatatat tgatccggaa aacgtgaaga aaaccggcaa cgtgaccctg 1020 gcgaccggca ttggcagcac caccgcgaac aaaaccgttc tggtggatta tgaaaaatac 1080 ggcaaattct acaacctgag catcaaaggc accatcgatc agatcgataa aaccaacaac 1140 acctatcgtc agaccattta tgtgaacccg agcggcgata acgtgattgc gccggtgctg 1200 accggcaacc tgaaaccgaa caccgatagc aacgcgctga ttgatcagca gaacaccagc 1260 attaaagtgt ataaagtgga taacgcggcg gatctgagcg aaagctattt tgtgaacccg 1320 gaaaactttg aagatgtgac caacagcgtg aacattacct ttccgaaccc gaaccagtat 1380 aaagtggaat ttaacacccc ggatgatcag attaccaccc cgtatattgt ggtggtgaac 1440 ggccatattg atccgaacag caaaggcgat ctggcgctgc gtagcaccct gtatggctat 1500 aacagcaaca ttatttggcg tagcatgagc tgggataacg aagtggcgtt taacaacggc 1560 agcggcagcg gcgatggcat tgataaaccg gtggtgccgg aacagccgga tgaaccgggc 1620 gaaattgaac cgattccgga agatggcagc catcatcatc atcatcatta agtcgac 1677 <210> 12 <211> 1677 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 12 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcc 60 gcgagcgaaa acagcgtgac ccagagcgat agcgcgagca acgaaagcaa aagcaacgat 120 agcagcagcg tgagcgcggc gccgaaaacc gatgatacca acgtgagcga taccaaaacc 180 agcagcaaca ccaacaacgg cgaaaccagc gtggcgcaga acccggcgca gcaggaaacc 240 acccagagca gcagcaccaa cgcgaccacc gaagaaaccc cggtgaccgg tgaagccacc 300 accaccacca ccaaccaggc caacaccccg gcgaccaccc agagcagcaa caccaacgcg 360 gaagaactgg tgaaccagac cagcaacgaa accaccttta acgataccaa caccgtgagc 420 agcgtgaaca gcccgcagaa cagcaccaac gcggaaaacg tgagcaccac ccaggatacc 480 agcaccgaag cgaccccgag caacaacgaa agcgcgccgc agagcaccga tgcgagcaac 540 aaagatgtgg tgaatcaggc cgttaatacc agcgcgccgc gtatgcgtgc ctttagcctg 600 gcggccgtgg ccgccgatgc tccagcagca ggtaccgata ttaccaacca gctgaccaac 660 gtgaccgtgg gcattgatag cggcaccacc gtgtatccgc atcaggcagg ttatgtgaaa 720 ctgaactatg gctttagcgt gccgaacagc gcggtgaaag gcgatacctt taaaattacc 780 gtgccgaaag aactgaacct gaacggcgtg accagcaccg cgaaagtgcc gccgattatg 840 gcaggtgatc aggtgctggc gaacggcgtg attgatagcg atggcaacgt gatttatacc 900 tttaccgatt atgtgaacac caaagatgat gtgaaagcga ccctgaccat gccagcatat 960 attgatccgg aaaacgtgaa gaaaaccggc aacgtgaccc tggcgaccgg cattggcagc 1020 accaccgcga acaaaaccgt tctggtggat tatgaaaaat acggcaaatt ctacaacctg 1080 agcatcaaag gcaccatcga tcagatcgat aaaaccaaca acacctatcg tcagaccatt 1140 tatgtgaacc cgagcggcga taacgtgatt gcgccggtgc tgaccggcaa cctgaaaccg 1200 aacaccgata gcaacgcgct gattgatcag cagaacacca gcattaaagt gtataaagtg 1260 gataacgcgg cggatctgag cgaaagctat tttgtgaacc cggaaaactt tgaagatgtg 1320 accaacagcg tgaacattac ctttccgaac ccgaaccagt ataaagtgga atttaacacc 1380 ccggatgatc agattaccac cccgtatatt gtggtggtga acggccatat tgatccgaac 1440 agcaaaggcg atctggcgct gcgtagcacc ctgtatggct ataacagcaa cattatttgg 1500 cgtagcatga gctgggataa cgaagtggcg tttaacaacg gcaaagatca aaatagaact 1560 aaaggcagcg gcgatggcat tgataaaccg gtggtgccgg aacagccgga tgaaccgggc 1620 gaaattgaac cgattccgga agatggcagc catcatcatc atcatcatta agtcgac 1677 <210> 13 <211> 643 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 13 Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser 1 5 10 15 Ala Ser Ala Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys 20 25 30 Ala Cys Val Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser 35 40 45 Val Asp Pro Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr 50 55 60 Ser Met Val Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp 65 70 75 80 Asn Ala Leu Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly 85 90 95 Gly Val Glu Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala 100 105 110 Arg Gly Ser Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys 115 120 125 Pro Ser Asn Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln 130 135 140 Leu Ser His Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu 145 150 155 160 Leu Ala Lys Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu 165 170 175 Ser Asn Glu Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser 180 185 190 Val Val Met Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu 195 200 205 Trp Ala Ser Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val 210 215 220 Tyr Asn Tyr Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu 225 230 235 240 Gly Lys Ile Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu 245 250 255 Asp Ile Lys Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg 260 265 270 Leu His Phe Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln 275 280 285 Ala Cys His Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg 290 295 300 Gly Trp Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val 305 310 315 320 Ala Leu Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val 325 330 335 Ile Arg Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu 340 345 350 Ala Ile Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala 355 360 365 Ala Ala Glu Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu 370 375 380 Ala Gly Ala Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala 385 390 395 400 Lys Asp Gln Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser 405 410 415 Gly Asp Ala Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu 420 425 430 Gly Asp Gly Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp 435 440 445 Thr Val Glu Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly 450 455 460 Tyr Val Phe Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser 465 470 475 480 Ile Val Phe Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile 485 490 495 Trp Arg Gly Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr 500 505 510 Ala Gln Asp Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala 515 520 525 Leu Leu Arg Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg 530 535 540 Thr Gly Leu Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg 545 550 555 560 Leu Ile Gly His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro 565 570 575 Glu Glu Glu Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu 580 585 590 Arg Thr Val Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val 595 600 605 Gly Gly Asp Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile 610 615 620 Ser Ala Leu Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu 625 630 635 640 Asp Leu Lys <210> 14 <211> 624 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 14 Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys Ala Cys Val 1 5 10 15 Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser Val Asp Pro 20 25 30 Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr Ser Met Val 35 40 45 Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp Asn Ala Leu 50 55 60 Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly Gly Val Glu 65 70 75 80 Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala Arg Gly Ser 85 90 95 Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys Pro Ser Asn 100 105 110 Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln Leu Ser His 115 120 125 Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu Leu Ala Lys 130 135 140 Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu Ser Asn Glu 145 150 155 160 Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser Val Val Met 165 170 175 Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu Trp Ala Ser 180 185 190 Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val Tyr Asn Tyr 195 200 205 Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu Gly Lys Ile 210 215 220 Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu Asp Ile Lys 225 230 235 240 Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg Leu His Phe 245 250 255 Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His 260 265 270 Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu 275 280 285 Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr 290 295 300 Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg Asn 305 310 315 320 Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg 325 330 335 Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu 340 345 350 Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala 355 360 365 Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Lys Asp Gln 370 375 380 Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser Gly Asp Ala 385 390 395 400 Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu Gly Asp Gly 405 410 415 Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp Thr Val Glu 420 425 430 Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly Tyr Val Phe 435 440 445 Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser Ile Val Phe 450 455 460 Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile Trp Arg Gly 465 470 475 480 Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr Ala Gln Asp 485 490 495 Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala Leu Leu Arg 500 505 510 Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg Thr Gly Leu 515 520 525 Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg Leu Ile Gly 530 535 540 His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro Glu Glu Glu 545 550 555 560 Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu Arg Thr Val 565 570 575 Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val Gly Gly Asp 580 585 590 Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile Ser Ala Leu 595 600 605 Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu Asp Leu Lys 610 615 620 <210> 15 <211> 1148 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 15 taatgaaata cctgctgccg accgctgctg ctggtctgct gctcctcgct gcccagccgg 60 cgatggccat gcatatgagc aaagaagaag caccaaaaat acaaatgccg cctcaacctg 120 taacaaccat gagtgctaaa tctgaagatt taccacttag ttttacttac cctgctaaac 180 ttgtcagtga ttatgatgtc attataaaac ctcaagttag cggcgtaata gtaaataaac 240 tttttaaagc tggagataag gtaaaaaaag gacaaacatt atttattata gaacaagata 300 aatttaaagc tagtgttgat tcagcttacg gacaagcttt aatggctaag gcaactttcg 360 aaaatgcaag caaggatttt aatcgttcta aagctctttt tagcaaaagt gcaatctctc 420 aaaaagaata cgactcttct cttgctacat ttaacaattc aaaagctagt ctagcaagtg 480 ctagagcaca gcttgcaaat gcaagaattg atctagatca taccgagata aaagctcctt 540 ttgatggtac tataggagat gctttagtta atataggaga ttatgtaagt gcttcaacaa 600 ctgaactagt tagagttaca aatttaaatc ctatttacgc agatttcttt atttcagata 660 cagataaact aaatttagtc cgcaatactc aaagtggaaa atgggattta gacagcattc 720 atgcaaattt aaatcttaat ggagaaaccg ttcaaggcaa actttatttt attgattcgg 780 ttatagatgc taatagtgga acagtaaaag ccaaagccgt atttgataac aataactcaa 840 cacttttacc gggtgctttt gcaacaatta cttcagaagg ttttatacaa aaaaatggct 900 ttaaagtgcc tcaaataggt gttaaacaag atcaaaatga tgtttatgtt cttcttgtta 960 aaaatggaaa agtagaaaaa tcttctgtac atataagcta ccaaaacaat gaatacgcca 1020 ttattgacaa aggattgcaa aatggcgata aaatcatttt agataacttt aaaaaaattc 1080 aagttggtag cgaagttaaa gaaattggag cacaactcga gcaccaccac caccaccact 1140 gagtcgac 1148 <210> 16 <211> 990 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 16 catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60 gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120 aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180 agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240 attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300 ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360 tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420 aacggcaacg tgaccggcga tgataccggc aaagatcaaa atagaactaa aattggtgga 480 ctgattggcg cgaacgtgag cattggccat accctgaaat atgtgcagcc ggattttaaa 540 accattctgg aaagcccgac cgataaaaaa gtgggctgga aagtgatttt taacaacatg 600 gtgaaccaga actggggccc gtatgatcgt gatagctgga acccggtgta tggcaaccag 660 ctgtttatga aaacccgtaa cggcagcatg aaagcggcgg ataactttct ggatccgaac 720 aaagcgagca gcctgctgag cagcggcttt agcccggatt ttgcgaccgt gattaccatg 780 gatcgtaaag cgagcaaaca gcagaccaac attgatgtga tttatgaacg tgtgcgtgat 840 gattatcagc tgcattggac cagcaccaac tggaaaggca ccaacaccaa agataaatgg 900 attgatcgta gcagcgaacg ttataaaatt gattgggaaa aagaagaaat gaccaacggc 960 agccatcatc atcatcatca ttaagtcgac 990 <210> 17 <211> 19442 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 17 gaattccctg aggcaattct tctttgatga cggctgatgg tgaggttgac ctggtgaagc 60 tggtcaagga gctttgggtt aacaaggttc tgattcttct gactactctt cttgcattaa 120 tcgggtcttt tacctatgcg tatctgagta agcctgtata tgaatatagg gttgcagtag 180 tgcctcctgc tcttgggtct atcgaaggtt tcaatgttgg tagaagggag aatggcctag 240 atgcatatac tgttagaagt atctatgcga tcttttcgcg caatctgctt tcggatgaga 300 ataaaaaaga gttcttctat aagatatacc ttccccaggt gggtgaggga gcggaaagcg 360 aagatgagca ggaggagttt tataagaagt tctccaaaga ggtaaagatt gatcctgcta 420 acaagccaga tgcagaccgt tatacggtaa ttgtggaggg cacgaagcga gaggttcttg 480 ctacatgggc acaagctttc gtgcgtttgg ctgcggatcg ggccgtgcat gaggttattg 540 atagtgcagg tagagatttc caggtaagaa atgctgcaat gcagagccgc ataaccgtgc 600 tgcagaatat ggcgaagggc cgccgtgatg atagaattgc acgtttgaag gaggcattgc 660 tgattgcgga gtcgctcaag atagatggcc cgccattaat agaaggggcg tccgagcaac 720 aactctcctc gatcatggat ggtgacttga tgtacatgcg aggagctaag gcgctgcgcg 780 ctgaaatcaa caatcttgag tcgcgtagtg tagatgctcc attcattcct gagttgagaa 840 ctctccaaga gaaactatct tggaactcca gtttgtctgt ggattctgat gcggtggctg 900 tctacaagga agacgaggga ctctcttttt caaatcaacc cattaagccg aagaagattc 960 ttatagttac tataggtact ttggcaggat tgataattgg aattctactc gcagtgctcg 1020 ctggttttat aaggaagctt cgtagcgatg gctctcttcg ctaagttttg atctaaaccc 1080 tgatgccact tactggcatc agggcttact tgttgtagtt gttgaattgt attagggggt 1140 atcgagtaga atgtcaataa ggcggggcgt tttctactcc ggtatatcca tgggcagcaa 1200 ctatcttttg cctcttgctg cgattccttt tctcacgaga acattgtcaa gcgaagcgtt 1260 tggccaattg gtgattgccc aggccgtggc tgtcattcta tgtcaactgg tagactttgg 1320 atttattctg gcaggatcaa gaaaggctgc cattatcgat aacaaagttg aactgtctag 1380 tttcttttct gttgtacaga gtgctagatt cttattgttg ctgctttcac ttttagtgct 1440 ggccattttg gctgtatctt ctattttacc aatccccttg cttgtattgg ttgcggctgc 1500 tcttccggca gtagttggaa attatcttca agcagtatgg ttctttcagg gaagagcgct 1560 gtttggatgg ttggcgctta ccaatttttt gtctaaggta ttttatttcc tattggtcgt 1620 tttttttgtc acgaaggatt ctgaccttgt gctggcttcg ttggggtttg gtttttccta 1680 tgtcataggt ggaagtgctc tctgttgtat tttattttct atgggaatac ggtggcgccc 1740 ggttctcgag aaagacagaa ttctcgatat attgcgtgac ggtgctcgat cttttctttc 1800 tctggctttt cttagcttgc acatgcaagt gctcgttgcg gcggttggtg ttgttggtgg 1860 agcctccgcg gccggagtgc tttctactgc ggataaattc cttcgcggga tcgcggctgc 1920 tacttcaccc atagctagcg ctctatttcc gacttttagc aggatgtatg cgagtgccga 1980 cccggcagtc ggcagtttaa gaaggaaagc gctaggtctg atgttactaa tagctattcc 2040 tagttgttta tttcttttct tattttctga atacatttca tatctcctat tcccggaaca 2100 gtccagaggt ctaactgttg taataagaat gttttcgata gtgccagtgt ttgcttgtat 2160 tggtgttctg tatggagggt tgactcttgt tccttctggg tatgatggtg tatatttgcg 2220 agcaattttt tttgcggaat tgggcggggt attaacattt atcctcttgg cgctttgggg 2280 ggatgagctt tttggagcgt ggacgctggt cgttacagag gtctctttgg ggatgggaat 2340 gtttttcctg gccacggtta agttgagaga gaaaagggga ctttgatctt aagatgagga 2400 tagcgattga aaagataatt ggtttgctga aaaaccagtc ctctaaagaa tcgaatgtta 2460 agattcatcg cttggcgtat attacaaact caaaatttga tggcaataac tatatagata 2520 gatggtgtaa aatcaggaat tctcacattg gtgaatacag ttatattgga tttggtagtg 2580 attttaataa tgtagaagta ggaagatatt gttcgatatc ttcggatgta aaaattgggt 2640 taggaaaaca tcctacacac ttttttagct catcaccgat tttttattct aataataatc 2700 catttaacat aaagcaaaag tttatagact ttaatgacca accaagccgt acaacaatta 2760 aaaatgatgt gtggattggt gcaaatgtaa ttattatgga tggattaaca ataaatactg 2820 gtgcagtcat agcagccggc tcagttgtta ctaaaaatgt aggagcatat gaggttgttg 2880 gtggggttcc tgcaaaagtg attaagaagc gatttgacaa taaaacaatt gaaaaacttt 2940 tggaaagcaa gtggtgggag aaaacgcctg acaaactaaa aggattttcg gttgaatatt 3000 taaataaaaa ggatactagt tatccgtatg atgtgccgga ttatgcgtaa caggaggtgt 3060 acaatgagca ggaggtgtac aatgagaatt ttaaatattg tatcgagtaa tattgttcaa 3120 gacccaaggg tacttaaaca aatagaaaca attaaaggcg ttacgaatga ttataaaatt 3180 gttggaatga ataattcaca agctactaat aggcgattgg aaaatttaga ttgtaattat 3240 cgtttgttag gtagcaaggt agatcccaaa aatattcttt ctaaattaat taagcgtata 3300 agatttgcaa caggtgttat ccgagaaatt aaagctttta aacctgacgt gattcatgca 3360 aatgatttcg acgtattatt aatggtctat ttaagcaatt ataaaaaagc taatattgtt 3420 tatgatgcgc atgaaatata tgcgaaaaat gcctttatta ataaagttcc acttatttca 3480 aagtttgtag aaagtataga aaaacacata gtaaaacatc gtgttaatgc cttcgtaaca 3540 gtaagtcatg cagcaaaaga atattatcaa tctaaaggat ataagaagga agcgaatgtt 3600 attacgaatg cacctatttt aaatgatagc agagaattta aagaaatcga aaactttaaa 3660 gaaatcgtat atcaaggtca aattgtaatg gacagaggat atgaagagtt tattattgct 3720 tcatcagctt ttaaacaaaa tgctccttca ttcataattc gagggtttgg tccgcatgaa 3780 gaagtgataa aagaactgat tagttataac tcggaaaata ttaggttgga taaaccagtt 3840 gaagtaaaag aattggttga taagttagca gaaagtaatg ttggtgttat cttgacgaaa 3900 cctgtatcta ttaattttga atatacagta tctaataaaa tttttgaatg tatacatgct 3960 ggtttaccag taattttatc tcctgtcaaa gagcatattt atctcaatga aaaatataaa 4020 tttggcattg ttttaaagga agttacgccg ttagaaattg aaaaggcggt tagaaaatta 4080 agagataatc acgatttgtt taatcattta cgtcaaaatg caattaaggc gtctaaaatt 4140 ttgaattggc aaatagaaag tgaacgatta gtagaattat ataaatttga acaaaaactc 4200 atctcagaag aggatctgta aggacccggg gatcctctag caggaggaac tatgaaattt 4260 tttgtacttt gtgcaattat cagcatgaac atatttatag taatctctac atttactaaa 4320 gaagtattag ggttccctat agagccggtg tattactcaa ccatggttgg tatagcatta 4380 attactacgg tgtttgctat ttataagata attgtcacgc aagaaattcc gcgagggtta 4440 atattattaa ttgctatatg tttgctttat ctagcttttt attatttttc accagataag 4500 gaagagaaac tagctaaaaa taatattcta ttctttttaa catgggcagt tccagcggca 4560 attagtggta tttatattaa atatataaac aaggctacgg tagaaagatt ttttaaatta 4620 gtatttttca tattttctat ttcatttatt tttgtaattt taataccaaa acttacaggt 4680 gagataccta gctatatcaa ttttggactt atgaactatc aaaacgcttc gtacctttca 4740 gcatttactg ccggattagg catttatttc attatgaaag gttcagtgaa acataagtgg 4800 atatatgttc tatttacaat aattgatatc cctattgtgt ttataccagg agggcgtgga 4860 ggtgctattt tattaattct ttacggctta tttgcattta tacttattac gtttaaaaga 4920 ggaataccta ttgcagtaaa aagcattatg tatatttttg cattaagcat atctagtgta 4980 ttgatttact ttctttttac aaaaggttcg aatactagaa cattttcata tctacaaggt 5040 ggaacactta atttagaagg tacttctgga agaggaccga tttatgaaaa aggtatttac 5100 tttattcaac aaagtccgtt attaggctat gggccattta actattataa actaatcgga 5160 aatataccac ataacatcat tattgagttg attctatcat ttggcttatt agggtttttt 5220 atcataatga tttgcatttt gctactagtt tataaaatga ttaggaacta tgatccaaac 5280 actatagatt tactcgttat gtttatagca atctatccaa tcacattatt aatgtttagt 5340 tcaaattatt tagttgtaag tgaattttgg tttgtgttgt tctattttat tacaaaagga 5400 cggcgtcatc atggtgatta taaagatgat gatgataaat aagtttaaac aggaggcatc 5460 atggttaaga aagtttttat tatggatagc gtaaagacaa taattggtac gttgcttata 5520 gctttaggat tacaattttt agcttatcca attattaatc aacgagtagg taatgaagcg 5580 tttggttcta ttttaacgat ttatacaata ataacaatca cgagtgttgt attaggcaat 5640 acgcttaaca atatacgatt aattaatatg aatctataca aatccaatca ttactactgg 5700 aaatttgtgt cgatactttt aatttcaatt ctgattgaga gtatagcttt aattattgta 5760 tttctttact tttttaattt gaacaccatc gatattatct ttttaattct acttaatatt 5820 ttaatgtgtt taaggattta tctgaatgta ttttttagga tgactttaaa atataatcag 5880 attttgtata ttgctcttat tcaattttta ggtttgctga taggactatt tctatattat 5940 ttaatccaaa actggattgt ttgttttatt accagtgaat tgtttgcaac gatatataca 6000 ttggttaaat tacggggatt aactataggc gagtatcaaa gtgaagataa taatgtggtc 6060 aaagattatg tgatgctact gagtacaaat agccttaata atttgaatct ctacttagat 6120 agattaatct tattaccaat tataggtgga acagctgtaa ctatatcatt tctttcaaca 6180 tttattggga aaatgttagc tacatttctg tatccgatta ataatgtagt actttcatat 6240 atttctgtaa atgaaagcga caatataaag aagcaatatt tgaaaactaa tctatttgct 6300 atagctgcac tatgtttagt catgattata tgttatccaa ttacattaat tattgtctct 6360 ttactgtata acattgattc aagtttatat tcgaagttta ttattttagg taatataggt 6420 gttttattca atgcagtgag tattatgatc caaactttaa atacaaaaca cgcatcaata 6480 acattacaag cgaattatat gacgcttcac acgattacat ttatattcat aactatttta 6540 atgacaattg cgtttggtct aaatggattc ttttggacaa cgctgttcag caacattatt 6600 aagtatgtga ttttaaatat tataggttta aagtctaaat tcattaataa aaaggacgtc 6660 gatagttatc cgtatgatgt gccggattat gcgtaagtgc accatatgaa tatcctcctt 6720 agttcctatt ccgaagttcc tattctctag aaagtatagg aacttcggcg cgcctacctg 6780 tgacggaaga tcacttcgca gaataaataa atcctggtgt ccctgttgat accgggaagc 6840 cctgggccaa cttttggcga aaatgagacg ttgatcggca cgtaagaggt tccaactttc 6900 accataatga aataagatca ctaccgggcg tattttttga gttgtcgaga ttttcaggag 6960 ctaaggaagc taaaatggag aaaaaaatca ctggatatac caccgttgat atatcccaat 7020 ggcatcgtaa agaacatttt gaggcatttc agtcagttgc tcaatgtacc tataaccaga 7080 ccgttcagct ggatattacg gcctttttaa agaccgtaaa gaaaaataag cacaagtttt 7140 atccggcctt tattcacatt cttgcccgcc tgatgaatgc tcatccggaa ttacgtatgg 7200 caatgaaaga cggtgagctg gtgatatggg atagtgttca cccttgttac accgttttcc 7260 atgagcaaac tgaaacgttt tcatcgctct ggagtgaata ccacgacgat ttccggcagt 7320 ttctacacat atattcgcaa gatgtggcgt gttacggtga aaacctggcc tatttcccta 7380 aagggtttat tgagaatatg tttttcgtct cagccaatcc ctgggtgagt ttcaccagtt 7440 ttgatttaaa cgtggccaat atggacaact tcttcgcccc cgttttcacc atgggcaaat 7500 attatacgca aggcgacaag gtgctgatgc cgctggcgat tcaggttcat catgccgttt 7560 gtgatggctt ccatgtcggc agatgcttaa tgaatacaac agtactgcga tgagtggcag 7620 ggcggggcgt aaggcgcgcc atttaaatga agttcctatt ccgaagttcc tattctctag 7680 aaagtatagg aacttcgaag cagctccagc ctacacgtaa agaggtggtg tatggataag 7740 aactctgttc tgttaattac cggtggaact ggttcctttg gaaatgccgt tttgaagcgt 7800 tttctggata cagatattgg tgaaatacgt gtattcagtc gggatgagaa gaagcaagat 7860 gatatgcgta agtgctatgc tcaccccaag ttgaggtttt atattggaga tgtccgcgac 7920 tatcaaagca ctctgaatgc tactcgcggt gtggactaca ttttccatgc ggctgcattg 7980 aaacaggttc cctcttgtga gttctacccg atggaggctg tgaagaccaa tgtcatcgga 8040 acggaaaatg tcctcgaatc tgctatccag aatggcgtca aaaaagtcgt ttgtctgagt 8100 acggataagg cagtttaccc aatcaatgcc atgggtattt caaaggccat gatggaaaag 8160 gtcatggtcg ccaagtctcg aaacctggaa cgcactccta ccgtaatttg tggcacccgt 8220 tatggtaacg tcatggcttc aaggggctcg gtcattcctc tctttatcga gcaaatgcga 8280 tcaggccagc ctctcacaat cactgatcca aacatgacac gtttcatgat gacgcttacg 8340 gatgccgtag accttgtgct ttatgctttc gagcatggta ccaatggaga tctttttgta 8400 cagaaagcac cggctgcaac catcgaggtg ctggctcatg cgcttactca attgcttggc 8460 aagaatggtt atcctatcaa tgtaataggt acgcgtcatg gagagaagct ttatgaggcg 8520 cttcttagtc gagaggaaat ggcctgtgct gaagacatgg gtgactatta tcgtatcccc 8580 ccagatttgc gtgatctgaa ctatagtaag tttgtggagc aaggcgagga aaaaattact 8640 catacagagg actataattc tcataatacc aaacgtctgg atatcgaagg aatgaaaaag 8700 ctgttgctga agttggattt cattcgtgct attcagcgtg gcgagagtgc cagtccagag 8760 gaataaacga tgaaagttct tgtaactggc gcgaatggat ttgttggaag gaatctgtgc 8820 gctcatcttg cagagcgggg tggtatcgag gtggtgccat tcacccgcga gagtagtgtt 8880 ggtaatttgc ctgagctaat tcgttccgtc gattttattt ttcatcttgc cggggtcaat 8940 cgtccggaaa aaccagaaga gtttaagatc gggaattccg aactcacgta tgctctgtgt 9000 gaggcggtaa ggtccaatgg acgagccata ccacttcttt atacttcatc cattcaggct 9060 gaggtggata atgagtacgg tttaagcaag cgagccgcag aagagcatct ccaagtgcta 9120 ggtgaggata ttggttgtcc tgtctacata tttcgccttc ctaatgtatt cggtaaatgg 9180 tcgcgtccga attataattc agcggttgcg actttttgtc ataatattat tcgagatatt 9240 ccgattcaaa ttaacaattc ctcggcagag atcactcttg tatacataga tgatgtggtt 9300 cgcaccttca tgaaagtcat ggatgggaag ctatccaatg cagtttcact acaggtcgag 9360 ccccagtatc agatttctgt tggtgagctc gcagaacaat tgtatgagtt tcgtaatagt 9420 cgaaagtcac tgactaccgc aagggttggc tcgggattga cgcgcgcctt gtactcgact 9480 tatctaagtt tcttgccaga agatagtttt agttacgacg tgccaatgca ttcggatccg 9540 cgtggcacat tcgtcgagat gctgaagacc gcggactctg gccagttctc gttttttacg 9600 gctcatccag gtgttaccag gggcgggcat taccatcact cgaaaaccga aaagtttctg 9660 gttatcaaag ggatggcacg tttcaagttt agaaacatcc tgaccggggc attttacgaa 9720 atttgcacta atggtgaaaa ggcagaaatt gtcgaaacag tacctggatg gactcatgac 9780 attactaatg tcggaactga cgatatggta gtcatgttgt gggctaacga agtatttgat 9840 cgggaaaatc cggataccta cgcttgttca gtaggcgaag gtgcgtaagg tatagtgaga 9900 taacaatgca gaagctaaaa gtcgttacgg ttgttggaac tcgtcctgag attattcgct 9960 tgtctagggt catggcgaag cttgatcagt actgcgatca tgtacttgtc catactggac 10020 agaattatga ttacgaactt aatgaaatat tttttcagga cctcggtata agaaagccgg 10080 attattttct aaacgccgcc gggtcttccg gggctgaaac gatagggaat gtaataatcg 10140 cagtcgatcg tgttctgggc gaaatagatc ccgatgcgct gctcgtgctg ggtgatacca 10200 atagttgtat ggcggtactg cctgcaaaac ggcgtaagat accgaccttt catatggaag 10260 caggcaatcg ctgtttcgat atgcgtgtgc ctgaagagat aaatcggcgc attgtcgatc 10320 atacagctga tgtaaatttg acctatagta caattgcgcg tgattatctc ttgcgtgaag 10380 gactttctcc agacatggtt atcaagactg gtagccctat gttcgaagtt ctcgagcact 10440 atcgtgacgg gatcgagtcc tccgatattc ttgaaaggct cgggttgaaa acagagcggt 10500 tctttgtcgt gagtgcgcac cgagaggaaa acatagattc ggataagaat ttcttgaagt 10560 tggtttctat gctcaacgct gtggcagaaa agtactcgct gcccgtcatc gtatcaactc 10620 accctagaac aaaaaagaga attgaggcga cggaggcaaa gtttcacgag ggtattaaac 10680 tgctgaaacc cctcggcttt aaggattaca ataaactgca aattacagcc aaggcagtta 10740 tttctgacag tgggaccatc agtgaggagt cttcaatact gaattttccc gctttgaata 10800 ttcgtgaggc tcatgaacgc ccagaaggca tggaagaggc tgtggtgatg atggtcggac 10860 tggattcgga tcgagtacta caagcactcg aggtgttgga gggacagagg cgcgacgcag 10920 agcgcatgtt acgcttggtc gctgactata gcatgcccaa cgtttctgaa aagattgttc 10980 gcatagttca tagctatcgg gactatgtca tgcgaactgt ctggaaaaaa tattaacttg 11040 aggcgtggag ttgatggcaa ggatatttgt ggtttctgag tatgtcggtg ccaatcagaa 11100 ctccacggga tactattggg agaagataat aggaaagatg cagcgggagt ttggtgggct 11160 aaccgtaatt ttcccgctga ccgcaggtga aaccccgcct gtggtttcac cttccgttga 11220 gcaagaatgc tttaagtttc cgaggagcaa taagaatagg ctcctttcta gaggattggc 11280 gcagattttt caggcgtttc tgttctcagt aaaattgact tctcgtgcca gacgaggaga 11340 tgtggtattg agtggaacca accctgctct tctactgatg acgtttccct tgctaaggta 11400 tgccctcggt ttcaagtggg tgctgctggt gcatgatgtg tttcccgaga acttggtgcc 11460 ggcgggcgtt ctgaagaaag atagtattgc ctaccggctt ctacgtcgtc tcttttcttt 11520 catttactca tccgctgatc gtctagtcgt aatagggcgc gatatggaag ctcttatgaa 11580 agagaaggtg aatgacccgc gatctttggt ctttatttcg aattgggcct gtgagaaaga 11640 ggttttccca gtaccgagag aggatgctcc ttttatcaat attcctgaat ggaaaggtaa 11700 aagggttttc caattttttg gtaatgtcgg tcgattacaa ggtatagaaa acatactttc 11760 tgctattcag ttggttaaaa acgagaaggc ggcttttgct tttattggag atggtgcctt 11820 ggtcgacagt gtaaaaaaac acgcgctgga agatcagtgt gctcggttga ggtattttgg 11880 aaggctgcca ttagccgaaa agaattttgg tttggctgcc tgtgacgttg ccttagttac 11940 cttagaagaa ggaatgttcg ggcttggggt tcccagcaag gcatatttct ccatggcagc 12000 agacaaaccg attctagctg tcatggaaaa aggggctgaa atctcccgta taatagatga 12060 gaccggaatc ggttggaact gtccgccgaa tgatccggtt gctttggcaa gattgatcga 12120 tgagatttgt gaactcgact tgtctagttt aggcggagtc ccgcggagtg tccttcagca 12180 aaattattct gaatatattt cattggaaaa attcgctgcc tgtgttcgac cgcttctgtc 12240 tgagtcgaaa atatgatgaa ggtgctggta accggggcta gcggttttgt cgggagtgcg 12300 ctttgcaggt cgcttgctgc cgcccccttt caggttgtcg gacaagtacg atccctgtac 12360 aatcccgtta cgggggttga gtatgttcga gcggagctga aagagagcac taagcttgat 12420 gctgcgctgc ggggtgttga atgtgtagtt catctagctg gacgagccca tatctttgga 12480 aggcagcgtg attcactaga tatttttcgg aaggtgaatc gcgatgctac tctggcgctt 12540 gctcggcagg cgatcgaagc atctgtaaag cgtttcattt ttgttagttc tattggtgta 12600 aatggcgctt taaccaaaga aaagcccttc gatgagaact ccaagccggc tcctcatgca 12660 gaatatgcga tttcaaagtt tgaggctgaa gtagcgcttc gggagctttt caagcattcc 12720 tcaacagaac ttgttatcgt caggcctcca ctcgtttacg actggaaagc tcctggaaat 12780 ttctcgcgat tgttgaagct ggttgcttcg ggacttcctc ttccatttgg ttgcatagat 12840 aaccgacgaa gttttgtttc tctggataat ttagttgact ttctagcttg ctgtatgacg 12900 cacccttctg ctgccggcga actgtttttg gtatccgatg gtcaggagat ttctaccaag 12960 caactggtga ctgcgcttgc tgcgggaatg gggcgtcgcc ccatcatgtg gcctgttcct 13020 aggtttattc tgaggtttct taaattagta ggaaagggtg ggttatacac tcagttatgc 13080 tgctcactag aggtcgactc gtcgaaaggc aggcttttgc ttggttggga accccgcaag 13140 agcacccttt ccgcgttgga agatgttggt agaatatatg tcaaacgtac tgaatgatta 13200 tctgcaggcg ctttgctact agcatggcgt accacgcaga acaatcgaat agaaccctgt 13260 tgaaggggtg agagtatttt tggggataaa tttataaatg gaagaatggt atttgttact 13320 cgctgcagct ggggtttcgg gactgcttac aggcctcttg cgtcgttatg ccttagcgag 13380 gagcttactt gacaccccta actctcgaag ttcccatgtc gttcccactc cacgcggagg 13440 aggggtcgcc attgtagtta ctttttgtct catgctgcct atttgggctg tactgggaaa 13500 tatctcatgg gccgtgtcct gggctttact tctcgctggc ggcggggttg ccattattgg 13560 attcatggat gatcacggtc atatcgccgc acgctggcgt ctgctgggac attttagtgc 13620 agccttggtc tcattgtact ttttgaatgg cataccacca tttcagattg ttggtgtcag 13680 ttgggacctg gggtggttcg gaggacttct ctttgctttc tatctcgtgt ggttgctgaa 13740 tctctataac ttcatggatg ggatcgatgg acttgctagc cttcaggcca tttttgtctg 13800 tgttggtggg gcattattat actggctgaa tggccaactg acgcaggctt tgctcccctt 13860 atcgctagct tttgccgttt ttggattctt gttctggaat tttccacccc caaaaatttt 13920 catgggagat gcgggtagtg gtcttctggg gattgtttta ggaattcttt ccattcatgc 13980 catgtggatg aatacgaatt ttttctgggc atggttggtc ctgttaggcg ttttcatcgt 14040 cgatgcgacc tataccctga ttcgtcgctt gctgagaggg gacaaggtgt atgaggctca 14100 tcgaagccat gcctatcaat acgcaagccg atactatgga aagcatgctc ctgttacgat 14160 tggcgtcacg gcattgaacg tcatctggct cctccctata gccttgttgg tcgggagtgg 14220 gtctctagag cctttgatgg gcatcgtcat agcctacgtc cctctcgttt ttctggcagt 14280 gaggttcaag gcgggtaagc tagagtcgtc cgctcaggcc taaaggagta ggggaatgct 14340 agatcgttta agagtaaagt tgttatccat gcctcgtcgc tggaaacgtt tgcttcaagt 14400 ggctacggat atccttctgg tatggctgtc tctgtggctc gcttttgtgg tccgtctagg 14460 cacagacgat atgatcgacg tgttcggcga gcatgcatgg cttttcatca ctgcgccggt 14520 catcgccatt ccactattca ttcgcttcgg catgtatcgc gcggtgatgc gctatctcgg 14580 taacgacgca ttgatcgcca tcgccaaggc ggtgaccatc tcggctctgg tgctgtcgct 14640 ggtggtgtac tggtatcgtg gcgcgccggc gccggtgccg cgttccctgg tgttcaacta 14700 ctggtggttg agcatgctgc tgatcggcgg cttgcgtctg gccatgcgcc agtatttcat 14760 gggcgactgg tactctgctg tgcagtcggt accatttctc aaccgccagg atggcctgcc 14820 cagggtggtt atctatgggg cgggggcggc cggcaaccag ttggttgcgg cgttgcgtct 14880 cggtcgggcg atgcgtccgg tggcgttcat cgatgacgac aagcagatcg ccaaccgggt 14940 cattgccggt ctgcgggtct ataccgccaa gcatatccgc cagatgatcg acgagacggg 15000 cgcgcaggag gttctcctgg cgattccttc cgccactcgg gcccggcgcc gagagattct 15060 cgagtccctg gagccgttcc cgctgcacgt gcgcagcatg cccggcttca tggacctggc 15120 cagcggccgg gtcaaggtgg atgacctgca ggaggtggac atcgctgacc tgctggggcg 15180 cgacagcgtc gcaccgcgca aggagctgct ggaacggtgc atccgcggtc aggtggtgat 15240 ggtgaccggg gcgggcggct ctatcggttc ggaactctgt cggcagatca tgagttgttc 15300 gcctagcgtg ctgatcctgt tcgaacacag cgaatacaac ctctatagca tccatcagga 15360 actggagcgt cggatcaagc gcgagtcgct ttcggtgaac ctgttgccga tcctcggttc 15420 ggtgcgcaat cccgagcgcc tggtggacgt gatgcgtacc tggaaggtca ataccgtcta 15480 ccatgcggcg gcctacaagc atgtgccgat cgtcgagcac aacatcgccg agggcgttct 15540 caacaacgtg ataggcacct tgcatgcggt gcaggccgcg gtgcaggtcg gcgtgcagaa 15600 cttcgtgctg atttccaccg acaaggcggt gcggccgacc aatgtgatgg gcagcaccaa 15660 gcgcctggcg gaaatggtcc ttcaggcgct cagcaacgaa tcggcgccgg tgctgttcgg 15720 cgaccggaag gacgtgcatc acgtcaacaa gacccgtttc accatggtcc gcttcggcaa 15780 cgtcctcggt tcgtccggtt cggtcattcc gctgttccgc gagcagatca agcgcggcgg 15840 cccggtgacg gtcacccacc cgagcatcac ccgttacttc atgaccattc ccgaggcggc 15900 gcagttggtc atccaggccg gttcgatggg gcagggcgga gatgtattcg tgctggacat 15960 ggggccgccg gtgaagatcc tggagctcgc cgagaagatg atccacctgt ccggcctgag 16020 cgtgcgttcc gagcgttcgc cccatggtga catcgccatc gagttcagtg gcctgcgtcc 16080 tggcgagaag ctctacgaag agctgctgat cggtgacaac gtgaatccca ccgaccatcc 16140 gatgatcatg cgggccaacg aggaacacct gagctgggag gccttcaagg tcgtgctgga 16200 gcagttgctg gccgccgtgg agaaggacga ctactcgcgg gttcgccagt tgctgcggga 16260 aaccgtcagc ggctatgcgc ctgacggtga aatcgtcgac tggatctatc gccagaggcg 16320 gcgagaaccc tgagtcatcg ttctccggaa aaggccgcct agcggccttt tttgttttct 16380 ccgtacgatg tttccggtgc cggaccagga agcgactgct ttgctggggc tgtcgatcca 16440 ggtgcgttcc acggcgataa ggtggtttcg tggatgggca acatgtcgcg aaggtaaagt 16500 cagccgcatt gttgaattca tcgaaaaacc ggatcagcca caaacgctgg aatcagacat 16560 catggccgtg ggccgttatg tgctttctgc cgatatttgg ccggaacttg aacgcactca 16620 gccaggtgca tggggacgta ttcagctgac tgatgccatt gccgaactgg cgaaaaaaca 16680 gtctgttgac gccatgctga tgactggtga cagctacgac tgtggtaaaa aaatgggtta 16740 tatgcaggcg tttgtgaagt atggactacg caacctgaaa gaaggagcga agttccgcaa 16800 aggtattgag aaattgctta gcgagtaagt ttaaaaaata gacgccctta tagggcgtaa 16860 taacaaataa cggtagtcaa cattcgacgc ggtgatgcag atatgcccgg aatgctgata 16920 ccgttttttc attctaaaaa actcatcatt tcattgagtt aactacaaaa tttagcactg 16980 ttttttataa tgtttcttct tgtttctggc atcaattggt aagataatta gtgtttgagt 17040 ttagaggctt tgcggcagag aagcggagct taacacgtct gtgagagtac gcagtgcact 17100 ggtagctgta aagccagtgg cggtagcgtg tttaaataaa tacattagta atactacata 17160 ttacatcatt gtaggctatt taagcgctac atgataagcg acagcgctag caatcaaatc 17220 ttttaaagtt acttctcagg aatagtaaaa ggaggacagc tatgttgaaa aaagagtatt 17280 taaaaaaccc ttatttagtt ttgtttgcga tgattatatt agcttatgtt tttagtgtat 17340 tttgcaggtt ttattgggtt tggtgggcaa gtgagtttaa tgagtatttt ttcaataatc 17400 agttaatgat catttcaaat gatggctatg cttttgctga gggcgcaaga gatatgatag 17460 caggttttca tcagcctaat gatttgagtt attatggatc ttctttatcc gcgcttactt 17520 attggcttta taaaatcaca cctttttctt ttgaaagtat cattttatat atgagtactt 17580 ttttatcttc tttggtggtg attcctacta ttttgctagc taacgaatac aaacgtcctt 17640 taatgggctt tgtagctgct cttttagcaa gtatagcaaa cagttattat aatcgcacta 17700 tgagtgggta ttatgatacg gatatgctgg taattgtttt gcctatgttt attttatttt 17760 ttatggtaag aatgatttta aaaaaagact ttttttcatt gattgccttg ccgttattta 17820 taggaattta tctttggtgg tatccttcaa gttatacttt aaatgtagct ttaattggac 17880 tttttttaat ttatacactt atttttcata gaaaagaaaa gattttttat atagctgtga 17940 ttttgtcttc tcttactctt tcaaatatag catggtttta tcaaagtgcc attatagtaa 18000 tactttttgc tttattcgcc ttagagcaaa aacgcttaaa ttttatgatt ataggaattt 18060 taggtagtgc aactttgata tttttgattt taagtggtgg ggttgatcct atactttatc 18120 agcttaaatt ttatattttt agaagtgatg aaagtgcgaa tttaacgcag ggctttatgt 18180 attttaatgt caatcaaacc atacaagaag ttgaaaatgt agatcttagc gaatttatgc 18240 gaagaattag tggtagtgaa attgtttttt tgttttcttt gtttggtttt gtatggcttt 18300 tgagaaaaca taaaagtatg attatggctt tacctatatt ggtgcttggg tttttagcct 18360 taaaaggggg gcttagattt accatttatt ctgtacctgt aatggcctta ggatttggtt 18420 ttttattgag cgagtttaag gctataatgg ttaaaaaata tagccaatta acttcaaatg 18480 tttgtattgt ttttgcaact attttgactt tagctccagt atttatccat atttacaact 18540 ataaagcgcc aacagttttt tctcaaaatg aagcatcatt attaaatcaa ttaaaaaata 18600 tagccaatag agaagattat gtggtaactt ggtgggatta tggttatcct gtgcgttatt 18660 atagcgatgt gaaaacttta gtagatggtg gaaagcattt aggtaaggat aattttttcc 18720 cttcttttgc tttaagcaaa gatgaacaag ctgcagctaa tatggcaaga cttagtgtag 18780 aatatacaga aaaaagcttt tatgctccgc aaaatgatat tttaaaaaca gacattttgc 18840 aagccatgat gaaagattat aatcaaagca atgtggattt gtttctagct tcattatcaa 18900 aacctgattt taaaatcgat acgccaaaaa ctcgtgatat ttatctttat atgcccgcta 18960 gaatgtcttt gattttttct acggtggcta gtttttcttt tattaattta gatacaggag 19020 ttttggataa accttttacc tttagcacag cttatccact tgatgttaaa aatggagaaa 19080 tttatcttag caacggagtg gttttaagcg atgattttag aagttttaaa ataggtgata 19140 atgtggtttc tgtaaatagt atcgtagaga ttaattctat taaacaaggt gaatacaaaa 19200 tcactccaat tgatgataag gctcagtttt atatttttta tttaaaggat agtgctattc 19260 cttacgcaca atttatttta atggataaaa ccatgtttaa tagtgcttat gtgcaaatgt 19320 tttttttagg aaattatgat aagaatttat ttgacttggt gattaattct agagatgcta 19380 aggtttttaa acttaaaatt tacccatacg atgttccaga ttacgcttaa acatgtgaat 19440 tc 19442 <210> 18 <211> 19616 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 18 gaattccctg aggcaattct tctttgatga cggctgatgg tgaggttgac ctggtgaagc 60 tggtcaagga gctttgggtt aacaaggttc tgattcttct gactactctt cttgcattaa 120 tcgggtcttt tacctatgcg tatctgagta agcctgtata tgaatatagg gttgcagtag 180 tgcctcctgc tcttgggtct atcgaaggtt tcaatgttgg tagaagggag aatggcctag 240 atgcatatac tgttagaagt atctatgcga tcttttcgcg caatctgctt tcggatgaga 300 ataaaaaaga gttcttctat aagatatacc ttccccaggt gggtgaggga gcggaaagcg 360 aagatgagca ggaggagttt tataagaagt tctccaaaga ggtaaagatt gatcctgcta 420 acaagccaga tgcagaccgt tatacggtaa ttgtggaggg cacgaagcga gaggttcttg 480 ctacatgggc acaagctttc gtgcgtttgg ctgcggatcg ggccgtgcat gaggttattg 540 atagtgcagg tagagatttc caggtaagaa atgctgcaat gcagagccgc ataaccgtgc 600 tgcagaatat ggcgaagggc cgccgtgatg atagaattgc acgtttgaag gaggcattgc 660 tgattgcgga gtcgctcaag atagatggcc cgccattaat agaaggggcg tccgagcaac 720 aactctcctc gatcatggat ggtgacttga tgtacatgcg aggagctaag gcgctgcgcg 780 ctgaaatcaa caatcttgag tcgcgtagtg tagatgctcc attcattcct gagttgagaa 840 ctctccaaga gaaactatct tggaactcca gtttgtctgt ggattctgat gcggtggctg 900 tctacaagga agacgaggga ctctcttttt caaatcaacc cattaagccg aagaagattc 960 ttatagttac tataggtact ttggcaggat tgataattgg aattctactc gcagtgctcg 1020 ctggttttat aaggaagctt cgtagcgatg gctctcttcg ctaagttttg atctaaaccc 1080 tgatgccact tactggcatc agggcttact tgttgtagtt gttgaattgt attagggggt 1140 atcgagtaga atgtcaataa ggcggggcgt tttctactcc ggtatatcca tgggcagcaa 1200 ctatcttttg cctcttgctg cgattccttt tctcacgaga acattgtcaa gcgaagcgtt 1260 tggccaattg gtgattgccc aggccgtggc tgtcattcta tgtcaactgg tagactttgg 1320 atttattctg gcaggatcaa gaaaggctgc cattatcgat aacaaagttg aactgtctag 1380 tttcttttct gttgtacaga gtgctagatt cttattgttg ctgctttcac ttttagtgct 1440 ggccattttg gctgtatctt ctattttacc aatccccttg cttgtattgg ttgcggctgc 1500 tcttccggca gtagttggaa attatcttca agcagtatgg ttctttcagg gaagagcgct 1560 gtttggatgg ttggcgctta ccaatttttt gtctaaggta ttttatttcc tattggtcgt 1620 tttttttgtc acgaaggatt ctgaccttgt gctggcttcg ttggggtttg gtttttccta 1680 tgtcataggt ggaagtgctc tctgttgtat tttattttct atgggaatac ggtggcgccc 1740 ggttctcgag aaagacagaa ttctcgatat attgcgtgac ggtgctcgat cttttctttc 1800 tctggctttt cttagcttgc acatgcaagt gctcgttgcg gcggttggtg ttgttggtgg 1860 agcctccgcg gccggagtgc tttctactgc ggataaattc cttcgcggga tcgcggctgc 1920 tacttcaccc atagctagcg ctctatttcc gacttttagc aggatgtatg cgagtgccga 1980 cccggcagtc ggcagtttaa gaaggaaagc gctaggtctg atgttactaa tagctattcc 2040 tagttgttta tttcttttct tattttctga atacatttca tatctcctat tcccggaaca 2100 gtccagaggt ctaactgttg taataagaat gttttcgata gtgccagtgt ttgcttgtat 2160 tggtgttctg tatggagggt tgactcttgt tccttctggg tatgatggtg tatatttgcg 2220 agcaattttt tttgcggaat tgggcggggt attaacattt atcctcttgg cgctttgggg 2280 ggatgagctt tttggagcgt ggacgctggt cgttacagag gtctctttgg ggatgggaat 2340 gtttttcctg gccacggtta agttgagaga gaaaagggga ctttgatctt aaggcgatcg 2400 ctaggaggac agctatgcgt attgcgattc tgggcgcgac caacattaaa catatgagcc 2460 tgctgagcca ttatctgaac catattgatc tgaacattaa cgaagtggat attatttata 2520 ccgataaata tgatattgaa gaacatattc agggcatcaa caactactac aaatacaaag 2580 tggatatcaa agaagattgg accttcatca agaaagcgat tgcgtattat cgttttcgtc 2640 cgtatgcgat gaaaattctg aaagaaaacc gttatgattt tgtgattgtg tggggcagct 2700 acaccggcca tctgttcaaa agctttctgg aaaaacatta caaaaacaaa ttcatcctga 2760 acatccgtga ttactttttc gaaaacaaca aactgattaa atatcgtatg aagaaaatcg 2820 tggatgcgag ccgtgtgacc accctgagca gcgaaggctt tctgaaattc ctgccgaaaa 2880 gcgaaaaata ccgtatcatc tacagctaca acatgagcat catccgtgaa agcaacgtga 2940 ccgatggctt taaaaaacgt tggccgatta acattggctt tattggcaac gtgcgtttta 3000 acgaaattaa ccagaaactg attaaagaac tggcgaacga tagccgtttt catatgcagt 3060 attttggcac cggcagcgaa aaactggaag tgtttgcgcg tgaaaacttt attaacaaca 3120 ttacctttag cggcggcttt gatctgaaag aaaccccgaa atatctgaac gaaattgata 3180 ttctgaacaa cctgtttggc aaccagaaca ttgcgctgga taccgcgctg agcattcgta 3240 tgtattatgc gctgtttctg aacaaaccga ttattaccac cgatgatacc tttaccgcga 3300 ccgaagcgaa caaatttggc ctgggcttta gcattaaccc ggaaaacctg aaaggcattg 3360 gcgatgaact gatggattgg tataacaacc tggatgtgat ggatattaac cataaacgtg 3420 aagcgtatcg taacgatgtg attgaaaaca acaaacagtt ttatcaggaa attggccgta 3480 tttttaacga agaacagaaa ctgattagcg aagaagatct gtaacgttta aacaggagga 3540 cagctatgaa caaaatttat aacgtgacca gctatgtgat tgcgattctg atgtttccgt 3600 gcctgatgct gggcgataaa ccgctgctgt ttctggcgcc gattagctat ggcgtgggca 3660 aactgttcat cagcttcagc aacaacccga acttcaaatt cagcaaaatc gtgtacgatg 3720 tgctgggctt tctgcgtctg gtgtttattc cggcgatgat tgtgtttttc caggatagca 3780 ccattgataa cctgccgctg ggccaggcgt attttaacca ggcggtgatt tatatgagcg 3840 tggaatttat tattggcagc ctgtttattc tgattctgag caaactgttc aagcatgaag 3900 ttgtgagccg taacagcttt accctgagcg gcagcagcat ttattatatt gtgtttggcc 3960 tggtgatttg cggcattttt gtggcgtttc cggaagtgcg taaaaacatt agctttctga 4020 ttattaaaac cgatgcgatg ggccgtggca ccgaagcgac cagcggcctg aacgtgctgt 4080 ttgtgatgct gtttcagctg gcgctggcgc tgctgtttct gatcatcgcg tacgcgagct 4140 acaaaaaata caaagaaaac ccgaaaatca tctacgtggt gctgccgctg gcgattggca 4200 ttctgaacat tagcctgatt gtgggcgaac gtcgtagcta tcagctgtat accatggtgg 4260 cggtgctgac cgttgtgagc atcctgttta gcaaacataa acgtcgtatc aacatcatca 4320 tcatcagcgt gggcatcttc gtgctggcgc tgatgaccct gtataaagaa ctgtatgtgt 4380 ttaactatag cagctatagc gaagcgctga acagcaccag cgtgagcaac ctgaaaattg 4440 tggataccct gcagagctat ttttatggcc cgagcaacat tgcggcgagc attgattatc 4500 tgaactatta taacggcagc tttaaacagt atctgtttga taacacccgt gcggtgtttg 4560 gctttaactt tttcctggat aaaaaacagc tgattaccag ccagctgttt aaccagctga 4620 tttatggcag caaacagctg accggccatc tgattagcag cgcgggctat ggcattattt 4680 attttggccc gctgtttttc tacctgaacc tgattgcgaa catctttttc gcgtttctga 4740 gcgaatacat catccgtaaa agccatagcc tggaagtgat cttcatcggc acctacatct 4800 acatgcgtct gattaccagc atttttagcc atccgacccc gctgattacc ctgattagca 4860 tgattctggt ggtgtatgtg attgcgatca tcccgggcat catcatcaag aaattcacca 4920 aaaaagtggg catcgaagat tacaaagatg atgatgataa ataacgttta aacaggagga 4980 cagctatgat tgtgaaaacc tttatgaaaa gcaaaatttt tcgtctgatg aacaccccgc 5040 tgctgctgtt ttataaaaaa gaatatctga ccggctatta ttttgaaaac aaagtggcgg 5100 gctggctgtg ggcgtggaaa gcggtgccat tcaagctgct gggcattaac accagcctgc 5160 cgtttccggc ggatattacc gtgcgtatgc ataacccgaa caacattgtg tttgataaaa 5220 acgatattca tatttttcag agcccgggca cctattttaa caactttagc gcggtgattt 5280 atattggccg tggcgtgtat attgcgccga acgtgggcat tattaccgcg aaccataaca 5340 ttaaaaacct gaaaagccat gcgccgggcg aagatgtgaa aattggcaac tatagctgga 5400 ttggcatgaa cagcgtgatt ctgccgggcg tggaactggg cgaacatacc attgtgggcg 5460 cgggcagcgt ggtgaccaaa agctttccgg aaggcaacgt ggtgattggc ggcaacccgg 5520 cgaaaattat taagaaaatc agctatccgt atgatgtgcc ggattatgcg taattaatta 5580 accaggtgca cgaagaaaat tatgagatta aataaattta ttggcgattc gtttttaatg 5640 attttaagca gtggcatcgc tcaagtcata ttaatcatca ctaccccaat tattacaaga 5700 ctatattcac ctacagaatt tggtgagttt acaatttttt caaatatcgc aatgatttta 5760 ataccaataa taaatgcaag atacgatttg ttgattgtga ataccaaaaa tgaccgtagt 5820 gctaatatac tttcacaaat cagttttttg atatcattgc ttattttatt aatactgata 5880 ccaatatttg cgattagtgc atgtttatac ccaaacttta tattagattt tattttcatt 5940 attattatgt tgtttttggt aagtttaaca aacattttta caaattatct aaataaggaa 6000 agaaagtata aagtgttaag tttgattaat gtgtttagag ctggatcaat ggctttactt 6060 caaatcattt tcggactttt agcattagga agtttaggat taattattgg tttttcatta 6120 tcctatatcg caggcattac actaggatat aaaacgttta aaaagcactt taatattgtg 6180 agagataaag aagaaactaa agcattattt ttagaaaata aaaatcagtt agtttattca 6240 acaccatcaa tattattaaa tagtttgtct ttctcggttg ttgtgttctt tataggtatt 6300 ttgtatacca atacagaagt gggtatttat ggtatggcca taagagtact aggcatacca 6360 gtgacaatta tttcattagg gttatcaaaa atatttatgc aacaagccaa tgactattat 6420 attgaacatg gtaacttccg aaatttatta cttaaattta gttccatact ggttatagtt 6480 tctataattc tttatgtgcc actttatttg ttcagtgaag aattagtcaa tatattatta 6540 ggacatagct gggttgacgc aattacagtt ataaaaattg ttatcccatt atttgttata 6600 aggctgattg tatcaacggt atcactttct gtgattgtat tacaaaaaca acagttagaa 6660 ttaatactac aagcgttatt tttaataggt actactgcaa catttgttat atcaaaaatg 6720 cttaatttaa cttttttaaa ctttgtatct attaatacaa ttgttttaat cgtatcgtac 6780 atgatatttt tcatagcact ctattatttt gctaaaaata aacagttcaa aaattctagt 6840 tatccgtatg atgtgccgga ttatgcgtaa gtgcaccata tgaatatcct ccttagttcc 6900 tattccgaag ttcctattct ctagaaagta taggaacttc ggcgcgccta cctgtgacgg 6960 aagatcactt cgcagaataa ataaatcctg gtgtccctgt tgataccggg aagccctggg 7020 ccaacttttg gcgaaaatga gacgttgatc ggcacgtaag aggttccaac tttcaccata 7080 atgaaataag atcactaccg ggcgtatttt ttgagttgtc gagattttca ggagctaagg 7140 aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 7200 gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 7260 agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg 7320 cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattacgt atggcaatga 7380 aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc 7440 aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac 7500 acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt 7560 ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt 7620 taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata 7680 cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtttgtgatg 7740 gcttccatgt cggcagatgc ttaatgaata caacagtact gcgatgagtg gcagggcggg 7800 gcgtaaggcg cgccatttaa atgaagttcc tattccgaag ttcctattct ctagaaagta 7860 taggaacttc gaagcagctc cagcctacac gtaaagaggt ggtgtatgga taagaactct 7920 gttctgttaa ttaccggtgg aactggttcc tttggaaatg ccgttttgaa gcgttttctg 7980 gatacagata ttggtgaaat acgtgtattc agtcgggatg agaagaagca agatgatatg 8040 cgtaagtgct atgctcaccc caagttgagg ttttatattg gagatgtccg cgactatcaa 8100 agcactctga atgctactcg cggtgtggac tacattttcc atgcggctgc attgaaacag 8160 gttccctctt gtgagttcta cccgatggag gctgtgaaga ccaatgtcat cggaacggaa 8220 aatgtcctcg aatctgctat ccagaatggc gtcaaaaaag tcgtttgtct gagtacggat 8280 aaggcagttt acccaatcaa tgccatgggt atttcaaagg ccatgatgga aaaggtcatg 8340 gtcgccaagt ctcgaaacct ggaacgcact cctaccgtaa tttgtggcac ccgttatggt 8400 aacgtcatgg cttcaagggg ctcggtcatt cctctcttta tcgagcaaat gcgatcaggc 8460 cagcctctca caatcactga tccaaacatg acacgtttca tgatgacgct tacggatgcc 8520 gtagaccttg tgctttatgc tttcgagcat ggtaccaatg gagatctttt tgtacagaaa 8580 gcaccggctg caaccatcga ggtgctggct catgcgctta ctcaattgct tggcaagaat 8640 ggttatccta tcaatgtaat aggtacgcgt catggagaga agctttatga ggcgcttctt 8700 agtcgagagg aaatggcctg tgctgaagac atgggtgact attatcgtat ccccccagat 8760 ttgcgtgatc tgaactatag taagtttgtg gagcaaggcg aggaaaaaat tactcataca 8820 gaggactata attctcataa taccaaacgt ctggatatcg aaggaatgaa aaagctgttg 8880 ctgaagttgg atttcattcg tgctattcag cgtggcgaga gtgccagtcc agaggaataa 8940 acgatgaaag ttcttgtaac tggcgcgaat ggatttgttg gaaggaatct gtgcgctcat 9000 cttgcagagc ggggtggtat cgaggtggtg ccattcaccc gcgagagtag tgttggtaat 9060 ttgcctgagc taattcgttc cgtcgatttt atttttcatc ttgccggggt caatcgtccg 9120 gaaaaaccag aagagtttaa gatcgggaat tccgaactca cgtatgctct gtgtgaggcg 9180 gtaaggtcca atggacgagc cataccactt ctttatactt catccattca ggctgaggtg 9240 gataatgagt acggtttaag caagcgagcc gcagaagagc atctccaagt gctaggtgag 9300 gatattggtt gtcctgtcta catatttcgc cttcctaatg tattcggtaa atggtcgcgt 9360 ccgaattata attcagcggt tgcgactttt tgtcataata ttattcgaga tattccgatt 9420 caaattaaca attcctcggc agagatcact cttgtataca tagatgatgt ggttcgcacc 9480 ttcatgaaag tcatggatgg gaagctatcc aatgcagttt cactacaggt cgagccccag 9540 tatcagattt ctgttggtga gctcgcagaa caattgtatg agtttcgtaa tagtcgaaag 9600 tcactgacta ccgcaagggt tggctcggga ttgacgcgcg ccttgtactc gacttatcta 9660 agtttcttgc cagaagatag ttttagttac gacgtgccaa tgcattcgga tccgcgtggc 9720 acattcgtcg agatgctgaa gaccgcggac tctggccagt tctcgttttt tacggctcat 9780 ccaggtgtta ccaggggcgg gcattaccat cactcgaaaa ccgaaaagtt tctggttatc 9840 aaagggatgg cacgtttcaa gtttagaaac atcctgaccg gggcatttta cgaaatttgc 9900 actaatggtg aaaaggcaga aattgtcgaa acagtacctg gatggactca tgacattact 9960 aatgtcggaa ctgacgatat ggtagtcatg ttgtgggcta acgaagtatt tgatcgggaa 10020 aatccggata cctacgcttg ttcagtaggc gaaggtgcgt aaggtatagt gagataacaa 10080 tgcagaagct aaaagtcgtt acggttgttg gaactcgtcc tgagattatt cgcttgtcta 10140 gggtcatggc gaagcttgat cagtactgcg atcatgtact tgtccatact ggacagaatt 10200 atgattacga acttaatgaa atattttttc aggacctcgg tataagaaag ccggattatt 10260 ttctaaacgc cgccgggtct tccggggctg aaacgatagg gaatgtaata atcgcagtcg 10320 atcgtgttct gggcgaaata gatcccgatg cgctgctcgt gctgggtgat accaatagtt 10380 gtatggcggt actgcctgca aaacggcgta agataccgac ctttcatatg gaagcaggca 10440 atcgctgttt cgatatgcgt gtgcctgaag agataaatcg gcgcattgtc gatcatacag 10500 ctgatgtaaa tttgacctat agtacaattg cgcgtgatta tctcttgcgt gaaggacttt 10560 ctccagacat ggttatcaag actggtagcc ctatgttcga agttctcgag cactatcgtg 10620 acgggatcga gtcctccgat attcttgaaa ggctcgggtt gaaaacagag cggttctttg 10680 tcgtgagtgc gcaccgagag gaaaacatag attcggataa gaatttcttg aagttggttt 10740 ctatgctcaa cgctgtggca gaaaagtact cgctgcccgt catcgtatca actcacccta 10800 gaacaaaaaa gagaattgag gcgacggagg caaagtttca cgagggtatt aaactgctga 10860 aacccctcgg ctttaaggat tacaataaac tgcaaattac agccaaggca gttatttctg 10920 acagtgggac catcagtgag gagtcttcaa tactgaattt tcccgctttg aatattcgtg 10980 aggctcatga acgcccagaa ggcatggaag aggctgtggt gatgatggtc ggactggatt 11040 cggatcgagt actacaagca ctcgaggtgt tggagggaca gaggcgcgac gcagagcgca 11100 tgttacgctt ggtcgctgac tatagcatgc ccaacgtttc tgaaaagatt gttcgcatag 11160 ttcatagcta tcgggactat gtcatgcgaa ctgtctggaa aaaatattaa cttgaggcgt 11220 ggagttgatg gcaaggatat ttgtggtttc tgagtatgtc ggtgccaatc agaactccac 11280 gggatactat tgggagaaga taataggaaa gatgcagcgg gagtttggtg ggctaaccgt 11340 aattttcccg ctgaccgcag gtgaaacccc gcctgtggtt tcaccttccg ttgagcaaga 11400 atgctttaag tttccgagga gcaataagaa taggctcctt tctagaggat tggcgcagat 11460 ttttcaggcg tttctgttct cagtaaaatt gacttctcgt gccagacgag gagatgtggt 11520 attgagtgga accaaccctg ctcttctact gatgacgttt cccttgctaa ggtatgccct 11580 cggtttcaag tgggtgctgc tggtgcatga tgtgtttccc gagaacttgg tgccggcggg 11640 cgttctgaag aaagatagta ttgcctaccg gcttctacgt cgtctctttt ctttcattta 11700 ctcatccgct gatcgtctag tcgtaatagg gcgcgatatg gaagctctta tgaaagagaa 11760 ggtgaatgac ccgcgatctt tggtctttat ttcgaattgg gcctgtgaga aagaggtttt 11820 cccagtaccg agagaggatg ctccttttat caatattcct gaatggaaag gtaaaagggt 11880 tttccaattt tttggtaatg tcggtcgatt acaaggtata gaaaacatac tttctgctat 11940 tcagttggtt aaaaacgaga aggcggcttt tgcttttatt ggagatggtg ccttggtcga 12000 cagtgtaaaa aaacacgcgc tggaagatca gtgtgctcgg ttgaggtatt ttggaaggct 12060 gccattagcc gaaaagaatt ttggtttggc tgcctgtgac gttgccttag ttaccttaga 12120 agaaggaatg ttcgggcttg gggttcccag caaggcatat ttctccatgg cagcagacaa 12180 accgattcta gctgtcatgg aaaaaggggc tgaaatctcc cgtataatag atgagaccgg 12240 aatcggttgg aactgtccgc cgaatgatcc ggttgctttg gcaagattga tcgatgagat 12300 ttgtgaactc gacttgtcta gtttaggcgg agtcccgcgg agtgtccttc agcaaaatta 12360 ttctgaatat atttcattgg aaaaattcgc tgcctgtgtt cgaccgcttc tgtctgagtc 12420 gaaaatatga tgaaggtgct ggtaaccggg gctagcggtt ttgtcgggag tgcgctttgc 12480 aggtcgcttg ctgccgcccc ctttcaggtt gtcggacaag tacgatccct gtacaatccc 12540 gttacggggg ttgagtatgt tcgagcggag ctgaaagaga gcactaagct tgatgctgcg 12600 ctgcggggtg ttgaatgtgt agttcatcta gctggacgag cccatatctt tggaaggcag 12660 cgtgattcac tagatatttt tcggaaggtg aatcgcgatg ctactctggc gcttgctcgg 12720 caggcgatcg aagcatctgt aaagcgtttc atttttgtta gttctattgg tgtaaatggc 12780 gctttaacca aagaaaagcc cttcgatgag aactccaagc cggctcctca tgcagaatat 12840 gcgatttcaa agtttgaggc tgaagtagcg cttcgggagc ttttcaagca ttcctcaaca 12900 gaacttgtta tcgtcaggcc tccactcgtt tacgactgga aagctcctgg aaatttctcg 12960 cgattgttga agctggttgc ttcgggactt cctcttccat ttggttgcat agataaccga 13020 cgaagttttg tttctctgga taatttagtt gactttctag cttgctgtat gacgcaccct 13080 tctgctgccg gcgaactgtt tttggtatcc gatggtcagg agatttctac caagcaactg 13140 gtgactgcgc ttgctgcggg aatggggcgt cgccccatca tgtggcctgt tcctaggttt 13200 attctgaggt ttcttaaatt agtaggaaag ggtgggttat acactcagtt atgctgctca 13260 ctagaggtcg actcgtcgaa aggcaggctt ttgcttggtt gggaaccccg caagagcacc 13320 ctttccgcgt tggaagatgt tggtagaata tatgtcaaac gtactgaatg attatctgca 13380 ggcgctttgc tactagcatg gcgtaccacg cagaacaatc gaatagaacc ctgttgaagg 13440 ggtgagagta tttttgggga taaatttata aatggaagaa tggtatttgt tactcgctgc 13500 agctggggtt tcgggactgc ttacaggcct cttgcgtcgt tatgccttag cgaggagctt 13560 acttgacacc cctaactctc gaagttccca tgtcgttccc actccacgcg gaggaggggt 13620 cgccattgta gttacttttt gtctcatgct gcctatttgg gctgtactgg gaaatatctc 13680 atgggccgtg tcctgggctt tacttctcgc tggcggcggg gttgccatta ttggattcat 13740 ggatgatcac ggtcatatcg ccgcacgctg gcgtctgctg ggacatttta gtgcagcctt 13800 ggtctcattg tactttttga atggcatacc accatttcag attgttggtg tcagttggga 13860 cctggggtgg ttcggaggac ttctctttgc tttctatctc gtgtggttgc tgaatctcta 13920 taacttcatg gatgggatcg atggacttgc tagccttcag gccatttttg tctgtgttgg 13980 tggggcatta ttatactggc tgaatggcca actgacgcag gctttgctcc ccttatcgct 14040 agcttttgcc gtttttggat tcttgttctg gaattttcca cccccaaaaa ttttcatggg 14100 agatgcgggt agtggtcttc tggggattgt tttaggaatt ctttccattc atgccatgtg 14160 gatgaatacg aattttttct gggcatggtt ggtcctgtta ggcgttttca tcgtcgatgc 14220 gacctatacc ctgattcgtc gcttgctgag aggggacaag gtgtatgagg ctcatcgaag 14280 ccatgcctat caatacgcaa gccgatacta tggaaagcat gctcctgtta cgattggcgt 14340 cacggcattg aacgtcatct ggctcctccc tatagccttg ttggtcggga gtgggtctct 14400 agagcctttg atgggcatcg tcatagccta cgtccctctc gtttttctgg cagtgaggtt 14460 caaggcgggt aagctagagt cgtccgctca ggcctaaagg agtaggggaa tgctagatcg 14520 tttaagagta aagttgttat ccatgcctcg tcgctggaaa cgtttgcttc aagtggctac 14580 ggatatcctt ctggtatggc tgtctctgtg gctcgctttt gtggtccgtc taggcacaga 14640 cgatatgatc gacgtgttcg gcgagcatgc atggcttttc atcactgcgc cggtcatcgc 14700 cattccacta ttcattcgct tcggcatgta tcgcgcggtg atgcgctatc tcggtaacga 14760 cgcattgatc gccatcgcca aggcggtgac catctcggct ctggtgctgt cgctggtggt 14820 gtactggtat cgtggcgcgc cggcgccggt gccgcgttcc ctggtgttca actactggtg 14880 gttgagcatg ctgctgatcg gcggcttgcg tctggccatg cgccagtatt tcatgggcga 14940 ctggtactct gctgtgcagt cggtaccatt tctcaaccgc caggatggcc tgcccagggt 15000 ggttatctat ggggcggggg cggccggcaa ccagttggtt gcggcgttgc gtctcggtcg 15060 ggcgatgcgt ccggtggcgt tcatcgatga cgacaagcag atcgccaacc gggtcattgc 15120 cggtctgcgg gtctataccg ccaagcatat ccgccagatg atcgacgaga cgggcgcgca 15180 ggaggttctc ctggcgattc cttccgccac tcgggcccgg cgccgagaga ttctcgagtc 15240 cctggagccg ttcccgctgc acgtgcgcag catgcccggc ttcatggacc tggccagcgg 15300 ccgggtcaag gtggatgacc tgcaggaggt ggacatcgct gacctgctgg ggcgcgacag 15360 cgtcgcaccg cgcaaggagc tgctggaacg gtgcatccgc ggtcaggtgg tgatggtgac 15420 cggggcgggc ggctctatcg gttcggaact ctgtcggcag atcatgagtt gttcgcctag 15480 cgtgctgatc ctgttcgaac acagcgaata caacctctat agcatccatc aggaactgga 15540 gcgtcggatc aagcgcgagt cgctttcggt gaacctgttg ccgatcctcg gttcggtgcg 15600 caatcccgag cgcctggtgg acgtgatgcg tacctggaag gtcaataccg tctaccatgc 15660 ggcggcctac aagcatgtgc cgatcgtcga gcacaacatc gccgagggcg ttctcaacaa 15720 cgtgataggc accttgcatg cggtgcaggc cgcggtgcag gtcggcgtgc agaacttcgt 15780 gctgatttcc accgacaagg cggtgcggcc gaccaatgtg atgggcagca ccaagcgcct 15840 ggcggaaatg gtccttcagg cgctcagcaa cgaatcggcg ccggtgctgt tcggcgaccg 15900 gaaggacgtg catcacgtca acaagacccg tttcaccatg gtccgcttcg gcaacgtcct 15960 cggttcgtcc ggttcggtca ttccgctgtt ccgcgagcag atcaagcgcg gcggcccggt 16020 gacggtcacc cacccgagca tcacccgtta cttcatgacc attcccgagg cggcgcagtt 16080 ggtcatccag gccggttcga tggggcaggg cggagatgta ttcgtgctgg acatggggcc 16140 gccggtgaag atcctggagc tcgccgagaa gatgatccac ctgtccggcc tgagcgtgcg 16200 ttccgagcgt tcgccccatg gtgacatcgc catcgagttc agtggcctgc gtcctggcga 16260 gaagctctac gaagagctgc tgatcggtga caacgtgaat cccaccgacc atccgatgat 16320 catgcgggcc aacgaggaac acctgagctg ggaggccttc aaggtcgtgc tggagcagtt 16380 gctggccgcc gtggagaagg acgactactc gcgggttcgc cagttgctgc gggaaaccgt 16440 cagcggctat gcgcctgacg gtgaaatcgt cgactggatc tatcgccaga ggcggcgaga 16500 accctgagtc atcgttctcc ggaaaaggcc gcctagcggc cttttttgtt ttctccgtac 16560 gatgtttccg gtgccggacc aggaagcgac tgctttgctg gggctgtcga tccaggtgcg 16620 ttccacggcg ataaggtggt ttcgtggatg ggcaacatgt cgcgaaggta aagtcagccg 16680 cattgttgaa ttcatcgaaa aaccggatca gccacaaacg ctggaatcag acatcatggc 16740 cgtgggccgt tatgtgcttt ctgccgatat ttggccggaa cttgaacgca ctcagccagg 16800 tgcatgggga cgtattcagc tgactgatgc cattgccgaa ctggcgaaaa aacagtctgt 16860 tgacgccatg ctgatgactg gtgacagcta cgactgtggt aaaaaaatgg gttatatgca 16920 ggcgtttgtg aagtatggac tacgcaacct gaaagaagga gcgaagttcc gcaaaggtat 16980 tgagaaattg cttagcgagt aagtttaaaa aatagacgcc cttatagggc gtaataacaa 17040 ataacggtag tcaacattcg acgcggtgat gcagatatgc ccggaatgct gataccgttt 17100 tttcattcta aaaaactcat catttcattg agttaactac aaaatttagc actgtttttt 17160 ataatgtttc ttcttgtttc tggcatcaat tggtaagata attagtgttt gagtttagag 17220 gctttgcggc agagaagcgg agcttaacac gtctgtgaga gtacgcagtg cactggtagc 17280 tgtaaagcca gtggcggtag cgtgtttaaa taaatacatt agtaatacta catattacat 17340 cattgtaggc tatttaagcg ctacatgata agcgacagcg ctagcaatca aatcttttaa 17400 agttacttct caggaatagt aaaaggagga cagctatgtt gaaaaaagag tatttaaaaa 17460 acccttattt agttttgttt gcgatgatta tattagctta tgtttttagt gtattttgca 17520 ggttttattg ggtttggtgg gcaagtgagt ttaatgagta ttttttcaat aatcagttaa 17580 tgatcatttc aaatgatggc tatgcttttg ctgagggcgc aagagatatg atagcaggtt 17640 ttcatcagcc taatgatttg agttattatg gatcttcttt atccgcgctt acttattggc 17700 tttataaaat cacacctttt tcttttgaaa gtatcatttt atatatgagt acttttttat 17760 cttctttggt ggtgattcct actattttgc tagctaacga atacaaacgt cctttaatgg 17820 gctttgtagc tgctctttta gcaagtatag caaacagtta ttataatcgc actatgagtg 17880 ggtattatga tacggatatg ctggtaattg ttttgcctat gtttatttta ttttttatgg 17940 taagaatgat tttaaaaaaa gacttttttt cattgattgc cttgccgtta tttataggaa 18000 tttatctttg gtggtatcct tcaagttata ctttaaatgt agctttaatt ggactttttt 18060 taatttatac acttattttt catagaaaag aaaagatttt ttatatagct gtgattttgt 18120 cttctcttac tctttcaaat atagcatggt tttatcaaag tgccattata gtaatacttt 18180 ttgctttatt cgccttagag caaaaacgct taaattttat gattatagga attttaggta 18240 gtgcaacttt gatatttttg attttaagtg gtggggttga tcctatactt tatcagctta 18300 aattttatat ttttagaagt gatgaaagtg cgaatttaac gcagggcttt atgtatttta 18360 atgtcaatca aaccatacaa gaagttgaaa atgtagatct tagcgaattt atgcgaagaa 18420 ttagtggtag tgaaattgtt tttttgtttt ctttgtttgg ttttgtatgg cttttgagaa 18480 aacataaaag tatgattatg gctttaccta tattggtgct tgggttttta gccttaaaag 18540 gggggcttag atttaccatt tattctgtac ctgtaatggc cttaggattt ggttttttat 18600 tgagcgagtt taaggctata atggttaaaa aatatagcca attaacttca aatgtttgta 18660 ttgtttttgc aactattttg actttagctc cagtatttat ccatatttac aactataaag 18720 cgccaacagt tttttctcaa aatgaagcat cattattaaa tcaattaaaa aatatagcca 18780 atagagaaga ttatgtggta acttggtggg attatggtta tcctgtgcgt tattatagcg 18840 atgtgaaaac tttagtagat ggtggaaagc atttaggtaa ggataatttt ttcccttctt 18900 ttgctttaag caaagatgaa caagctgcag ctaatatggc aagacttagt gtagaatata 18960 cagaaaaaag cttttatgct ccgcaaaatg atattttaaa aacagacatt ttgcaagcca 19020 tgatgaaaga ttataatcaa agcaatgtgg atttgtttct agcttcatta tcaaaacctg 19080 attttaaaat cgatacgcca aaaactcgtg atatttatct ttatatgccc gctagaatgt 19140 ctttgatttt ttctacggtg gctagttttt cttttattaa tttagataca ggagttttgg 19200 ataaaccttt tacctttagc acagcttatc cacttgatgt taaaaatgga gaaatttatc 19260 ttagcaacgg agtggtttta agcgatgatt ttagaagttt taaaataggt gataatgtgg 19320 tttctgtaaa tagtatcgta gagattaatt ctattaaaca aggtgaatac aaaatcactc 19380 caattgatga taaggctcag ttttatattt tttatttaaa ggatagtgct attccttacg 19440 cacaatttat tttaatggat aaaaccatgt ttaatagtgc ttatgtgcaa atgttttttt 19500 taggaaatta tgataagaat ttatttgact tggtgattaa ttctagagat gctaaggttt 19560 ttaaacttaa aatttaccca tacgatgttc cagattacgc ttaaacatgt gaattc 19616 <210> 19 <211> 20597 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 19 gaattccctg aggcaattct tctttgatga cggctgatgg tgaggttgac ctggtgaagc 60 tggtcaagga gctttgggtt aacaaggttc tgattcttct gactactctt cttgcattaa 120 tcgggtcttt tacctatgcg tatctgagta agcctgtata tgaatatagg gttgcagtag 180 tgcctcctgc tcttgggtct atcgaaggtt tcaatgttgg tagaagggag aatggcctag 240 atgcatatac tgttagaagt atctatgcga tcttttcgcg caatctgctt tcggatgaga 300 ataaaaaaga gttcttctat aagatatacc ttccccaggt gggtgaggga gcggaaagcg 360 aagatgagca ggaggagttt tataagaagt tctccaaaga ggtaaagatt gatcctgcta 420 acaagccaga tgcagaccgt tatacggtaa ttgtggaggg cacgaagcga gaggttcttg 480 ctacatgggc acaagctttc gtgcgtttgg ctgcggatcg ggccgtgcat gaggttattg 540 atagtgcagg tagagatttc caggtaagaa atgctgcaat gcagagccgc ataaccgtgc 600 tgcagaatat ggcgaagggc cgccgtgatg atagaattgc acgtttgaag gaggcattgc 660 tgattgcgga gtcgctcaag atagatggcc cgccattaat agaaggggcg tccgagcaac 720 aactctcctc gatcatggat ggtgacttga tgtacatgcg aggagctaag gcgctgcgcg 780 ctgaaatcaa caatcttgag tcgcgtagtg tagatgctcc attcattcct gagttgagaa 840 ctctccaaga gaaactatct tggaactcca gtttgtctgt ggattctgat gcggtggctg 900 tctacaagga agacgaggga ctctcttttt caaatcaacc cattaagccg aagaagattc 960 ttatagttac tataggtact ttggcaggat tgataattgg aattctactc gcagtgctcg 1020 ctggttttat aaggaagctt cgtagcgatg gctctcttcg ctaagttttg atctaaaccc 1080 tgatgccact tactggcatc agggcttact tgttgtagtt gttgaattgt attagggggt 1140 atcgagtaga atgtcaataa ggcggggcgt tttctactcc ggtatatcca tgggcagcaa 1200 ctatcttttg cctcttgctg cgattccttt tctcacgaga acattgtcaa gcgaagcgtt 1260 tggccaattg gtgattgccc aggccgtggc tgtcattcta tgtcaactgg tagactttgg 1320 atttattctg gcaggatcaa gaaaggctgc cattatcgat aacaaagttg aactgtctag 1380 tttcttttct gttgtacaga gtgctagatt cttattgttg ctgctttcac ttttagtgct 1440 ggccattttg gctgtatctt ctattttacc aatccccttg cttgtattgg ttgcggctgc 1500 tcttccggca gtagttggaa attatcttca agcagtatgg ttctttcagg gaagagcgct 1560 gtttggatgg ttggcgctta ccaatttttt gtctaaggta ttttatttcc tattggtcgt 1620 tttttttgtc acgaaggatt ctgaccttgt gctggcttcg ttggggtttg gtttttccta 1680 tgtcataggt ggaagtgctc tctgttgtat tttattttct atgggaatac ggtggcgccc 1740 ggttctcgag aaagacagaa ttctcgatat attgcgtgac ggtgctcgat cttttctttc 1800 tctggctttt cttagcttgc acatgcaagt gctcgttgcg gcggttggtg ttgttggtgg 1860 agcctccgcg gccggagtgc tttctactgc ggataaattc cttcgcggga tcgcggctgc 1920 tacttcaccc atagctagcg ctctatttcc gacttttagc aggatgtatg cgagtgccga 1980 cccggcagtc ggcagtttaa gaaggaaagc gctaggtctg atgttactaa tagctattcc 2040 tagttgttta tttcttttct tattttctga atacatttca tatctcctat tcccggaaca 2100 gtccagaggt ctaactgttg taataagaat gttttcgata gtgccagtgt ttgcttgtat 2160 tggtgttctg tatggagggt tgactcttgt tccttctggg tatgatggtg tatatttgcg 2220 agcaattttt tttgcggaat tgggcggggt attaacattt atcctcttgg cgctttgggg 2280 ggatgagctt tttggagcgt ggacgctggt cgttacagag gtctctttgg ggatgggaat 2340 gtttttcctg gccacggtta agttgagaga gaaaagggga ctttgatctt aagatgagag 2400 tagaaaataa taatgtttct gggcaaaacc atgacccgga acagattgat ttgattgatt 2460 tactagtgca gttgtggcgt ggcaagatga caatcatcat ttccgtcatt gtggctattg 2520 ccctagctat tggatatttg gcagtagcga aggagaaatg gacgtcaaca gcaattatca 2580 ctcagcccga tgtggggcaa attgctggct ataacaatgc catgaatgtt atctatggtc 2640 aggctgcacc gaaagtatcg gatttgcagg agacgttaat tggtcgcttc agttctgcct 2700 tctctgcatt agcagaaacg ctggataatc aggaagaacc agaaaaactt accatcgaac 2760 cttctgttaa gaaccagcaa ttaccattga ctgtttctta tgttgggcaa actgcagagg 2820 gcgcacaaat gaagttggcc caatacattc agcaagttga cgataaagtg aatcaagagt 2880 tagaaaagga tctcaaggac aacattgctc tgggacggaa aaacttgcag gactctttaa 2940 gaacgcagga agtggttgcg caggagcaga aagatctgcg tatccgtcag attcaggaag 3000 cgttgcagta tgcgaatcag gcgcaggtga caaaaccgca gattcaacag actggcgaag 3060 atatcacaca agatacgttg ttccttttgg ggagcgaagc gctggagtcg atgattaagc 3120 atgaggcgac ccgtccgttg gtgttctcac caaactacta tcagactcgt caaaacctgc 3180 ttgatatcga aagcttaaag gttgatgatc ttgatattca tgcttaccgc tatgtaatga 3240 aaccgacgtt acctattcgt cgtgatagcc cgaaaaaggc aattaccttg attctggcgg 3300 tgctgctggg tggcatggtt ggcgcgggga ttgtgctggg gcgtaatgct ctacgcaatt 3360 acaacgcgaa gtaagcgatc gctaggagga cagctatgcg tattgcgatt ctgggcgcga 3420 ccaacattaa acatatgagc ctgctgagcc attatctgaa ccatattgat ctgaacatta 3480 acgaagtgga tattatttat accgataaat atgatattga agaacatatt cagggcatca 3540 acaactacta caaatacaaa gtggatatca aagaagattg gaccttcatc aagaaagcga 3600 ttgcgtatta tcgttttcgt ccgtatgcga tgaaaattct gaaagaaaac cgttatgatt 3660 ttgtgattgt gtggggcagc tacaccggcc atctgttcaa aagctttctg gaaaaacatt 3720 acaaaaacaa attcatcctg aacatccgtg attacttttt cgaaaacaac aaactgatta 3780 aatatcgtat gaagaaaatc gtggatgcga gccgtgtgac caccctgagc agcgaaggct 3840 ttctgaaatt cctgccgaaa agcgaaaaat accgtatcat ctacagctac aacatgagca 3900 tcatccgtga aagcaacgtg accgatggct ttaaaaaacg ttggccgatt aacattggct 3960 ttattggcaa cgtgcgtttt aacgaaatta accagaaact gattaaagaa ctggcgaacg 4020 atagccgttt tcatatgcag tattttggca ccggcagcga aaaactggaa gtgtttgcgc 4080 gtgaaaactt tattaacaac attaccttta gcggcggctt tgatctgaaa gaaaccccga 4140 aatatctgaa cgaaattgat attctgaaca acctgtttgg caaccagaac attgcgctgg 4200 ataccgcgct gagcattcgt atgtattatg cgctgtttct gaacaaaccg attattacca 4260 ccgatgatac ctttaccgcg accgaagcga acaaatttgg cctgggcttt agcattaacc 4320 cggaaaacct gaaaggcatt ggcgatgaac tgatggattg gtataacaac ctggatgtga 4380 tggatattaa ccataaacgt gaagcgtatc gtaacgatgt gattgaaaac aacaaacagt 4440 tttatcagga aattggccgt atttttaacg aagaacagaa actgattagc gaagaagatc 4500 tgtaacgttt aaacaggagg acagctatga acaaaattta taacgtgacc agctatgtga 4560 ttgcgattct gatgtttccg tgcctgatgc tgggcgataa accgctgctg tttctggcgc 4620 cgattagcta tggcgtgggc aaactgttca tcagcttcag caacaacccg aacttcaaat 4680 tcagcaaaat cgtgtacgat gtgctgggct ttctgcgtct ggtgtttatt ccggcgatga 4740 ttgtgttttt ccaggatagc accattgata acctgccgct gggccaggcg tattttaacc 4800 aggcggtgat ttatatgagc gtggaattta ttattggcag cctgtttatt ctgattctga 4860 gcaaactgtt caagcatgaa gttgtgagcc gtaacagctt taccctgagc ggcagcagca 4920 tttattatat tgtgtttggc ctggtgattt gcggcatttt tgtggcgttt ccggaagtgc 4980 gtaaaaacat tagctttctg attattaaaa ccgatgcgat gggccgtggc accgaagcga 5040 ccagcggcct gaacgtgctg tttgtgatgc tgtttcagct ggcgctggcg ctgctgtttc 5100 tgatcatcgc gtacgcgagc tacaaaaaat acaaagaaaa cccgaaaatc atctacgtgg 5160 tgctgccgct ggcgattggc attctgaaca ttagcctgat tgtgggcgaa cgtcgtagct 5220 atcagctgta taccatggtg gcggtgctga ccgttgtgag catcctgttt agcaaacata 5280 aacgtcgtat caacatcatc atcatcagcg tgggcatctt cgtgctggcg ctgatgaccc 5340 tgtataaaga actgtatgtg tttaactata gcagctatag cgaagcgctg aacagcacca 5400 gcgtgagcaa cctgaaaatt gtggataccc tgcagagcta tttttatggc ccgagcaaca 5460 ttgcggcgag cattgattat ctgaactatt ataacggcag ctttaaacag tatctgtttg 5520 ataacacccg tgcggtgttt ggctttaact ttttcctgga taaaaaacag ctgattacca 5580 gccagctgtt taaccagctg atttatggca gcaaacagct gaccggccat ctgattagca 5640 gcgcgggcta tggcattatt tattttggcc cgctgttttt ctacctgaac ctgattgcga 5700 acatcttttt cgcgtttctg agcgaataca tcatccgtaa aagccatagc ctggaagtga 5760 tcttcatcgg cacctacatc tacatgcgtc tgattaccag catttttagc catccgaccc 5820 cgctgattac cctgattagc atgattctgg tggtgtatgt gattgcgatc atcccgggca 5880 tcatcatcaa gaaattcacc aaaaaagtgg gcatcgaaga ttacaaagat gatgatgata 5940 aataacgttt aaacaggagg acagctatga ttgtgaaaac ctttatgaaa agcaaaattt 6000 ttcgtctgat gaacaccccg ctgctgctgt tttataaaaa agaatatctg accggctatt 6060 attttgaaaa caaagtggcg ggctggctgt gggcgtggaa agcggtgcca ttcaagctgc 6120 tgggcattaa caccagcctg ccgtttccgg cggatattac cgtgcgtatg cataacccga 6180 acaacattgt gtttgataaa aacgatattc atatttttca gagcccgggc acctatttta 6240 acaactttag cgcggtgatt tatattggcc gtggcgtgta tattgcgccg aacgtgggca 6300 ttattaccgc gaaccataac attaaaaacc tgaaaagcca tgcgccgggc gaagatgtga 6360 aaattggcaa ctatagctgg attggcatga acagcgtgat tctgccgggc gtggaactgg 6420 gcgaacatac cattgtgggc gcgggcagcg tggtgaccaa aagctttccg gaaggcaacg 6480 tggtgattgg cggcaacccg gcgaaaatta ttaagaaaat cagctatccg tatgatgtgc 6540 cggattatgc gtaattaatt aaccaggtgc acgaagaaaa ttatgagatt aaataaattt 6600 attggcgatt cgtttttaat gattttaagc agtggcatcg ctcaagtcat attaatcatc 6660 actaccccaa ttattacaag actatattca cctacagaat ttggtgagtt tacaattttt 6720 tcaaatatcg caatgatttt aataccaata ataaatgcaa gatacgattt gttgattgtg 6780 aataccaaaa atgaccgtag tgctaatata ctttcacaaa tcagtttttt gatatcattg 6840 cttattttat taatactgat accaatattt gcgattagtg catgtttata cccaaacttt 6900 atattagatt ttattttcat tattattatg ttgtttttgg taagtttaac aaacattttt 6960 acaaattatc taaataagga aagaaagtat aaagtgttaa gtttgattaa tgtgtttaga 7020 gctggatcaa tggctttact tcaaatcatt ttcggacttt tagcattagg aagtttagga 7080 ttaattattg gtttttcatt atcctatatc gcaggcatta cactaggata taaaacgttt 7140 aaaaagcact ttaatattgt gagagataaa gaagaaacta aagcattatt tttagaaaat 7200 aaaaatcagt tagtttattc aacaccatca atattattaa atagtttgtc tttctcggtt 7260 gttgtgttct ttataggtat tttgtatacc aatacagaag tgggtattta tggtatggcc 7320 ataagagtac taggcatacc agtgacaatt atttcattag ggttatcaaa aatatttatg 7380 caacaagcca atgactatta tattgaacat ggtaacttcc gaaatttatt acttaaattt 7440 agttccatac tggttatagt ttctataatt ctttatgtgc cactttattt gttcagtgaa 7500 gaattagtca atatattatt aggacatagc tgggttgacg caattacagt tataaaaatt 7560 gttatcccat tatttgttat aaggctgatt gtatcaacgg tatcactttc tgtgattgta 7620 ttacaaaaac aacagttaga attaatacta caagcgttat ttttaatagg tactactgca 7680 acatttgtta tatcaaaaat gcttaattta acttttttaa actttgtatc tattaataca 7740 attgttttaa tcgtatcgta catgatattt ttcatagcac tctattattt tgctaaaaat 7800 aaacagttca aaaattctag ttatccgtat gatgtgccgg attatgcgta agtgcaccat 7860 atgaatatcc tccttagttc ctattccgaa gttcctattc tctagaaagt ataggaactt 7920 cggcgcgcct acctgtgacg gaagatcact tcgcagaata aataaatcct ggtgtccctg 7980 ttgataccgg gaagccctgg gccaactttt ggcgaaaatg agacgttgat cggcacgtaa 8040 gaggttccaa ctttcaccat aatgaaataa gatcactacc gggcgtattt tttgagttgt 8100 cgagattttc aggagctaag gaagctaaaa tggagaaaaa aatcactgga tataccaccg 8160 ttgatatatc ccaatggcat cgtaaagaac attttgaggc atttcagtca gttgctcaat 8220 gtacctataa ccagaccgtt cagctggata ttacggcctt tttaaagacc gtaaagaaaa 8280 ataagcacaa gttttatccg gcctttattc acattcttgc ccgcctgatg aatgctcatc 8340 cggaattacg tatggcaatg aaagacggtg agctggtgat atgggatagt gttcaccctt 8400 gttacaccgt tttccatgag caaactgaaa cgttttcatc gctctggagt gaataccacg 8460 acgatttccg gcagtttcta cacatatatt cgcaagatgt ggcgtgttac ggtgaaaacc 8520 tggcctattt ccctaaaggg tttattgaga atatgttttt cgtctcagcc aatccctggg 8580 tgagtttcac cagttttgat ttaaacgtgg ccaatatgga caacttcttc gcccccgttt 8640 tcaccatggg caaatattat acgcaaggcg acaaggtgct gatgccgctg gcgattcagg 8700 ttcatcatgc cgtttgtgat ggcttccatg tcggcagatg cttaatgaat acaacagtac 8760 tgcgatgagt ggcagggcgg ggcgtaaggc gcgccattta aatgaagttc ctattccgaa 8820 gttcctattc tctagaaagt ataggaactt cgaagcagct ccagcctaca cgtaaagagg 8880 tggtgtatgg ataagaactc tgttctgtta attaccggtg gaactggttc ctttggaaat 8940 gccgttttga agcgttttct ggatacagat attggtgaaa tacgtgtatt cagtcgggat 9000 gagaagaagc aagatgatat gcgtaagtgc tatgctcacc ccaagttgag gttttatatt 9060 ggagatgtcc gcgactatca aagcactctg aatgctactc gcggtgtgga ctacattttc 9120 catgcggctg cattgaaaca ggttccctct tgtgagttct acccgatgga ggctgtgaag 9180 accaatgtca tcggaacgga aaatgtcctc gaatctgcta tccagaatgg cgtcaaaaaa 9240 gtcgtttgtc tgagtacgga taaggcagtt tacccaatca atgccatggg tatttcaaag 9300 gccatgatgg aaaaggtcat ggtcgccaag tctcgaaacc tggaacgcac tcctaccgta 9360 atttgtggca cccgttatgg taacgtcatg gcttcaaggg gctcggtcat tcctctcttt 9420 atcgagcaaa tgcgatcagg ccagcctctc acaatcactg atccaaacat gacacgtttc 9480 atgatgacgc ttacggatgc cgtagacctt gtgctttatg ctttcgagca tggtaccaat 9540 ggagatcttt ttgtacagaa agcaccggct gcaaccatcg aggtgctggc tcatgcgctt 9600 actcaattgc ttggcaagaa tggttatcct atcaatgtaa taggtacgcg tcatggagag 9660 aagctttatg aggcgcttct tagtcgagag gaaatggcct gtgctgaaga catgggtgac 9720 tattatcgta tccccccaga tttgcgtgat ctgaactata gtaagtttgt ggagcaaggc 9780 gaggaaaaaa ttactcatac agaggactat aattctcata ataccaaacg tctggatatc 9840 gaaggaatga aaaagctgtt gctgaagttg gatttcattc gtgctattca gcgtggcgag 9900 agtgccagtc cagaggaata aacgatgaaa gttcttgtaa ctggcgcgaa tggatttgtt 9960 ggaaggaatc tgtgcgctca tcttgcagag cggggtggta tcgaggtggt gccattcacc 10020 cgcgagagta gtgttggtaa tttgcctgag ctaattcgtt ccgtcgattt tatttttcat 10080 cttgccgggg tcaatcgtcc ggaaaaacca gaagagttta agatcgggaa ttccgaactc 10140 acgtatgctc tgtgtgaggc ggtaaggtcc aatggacgag ccataccact tctttatact 10200 tcatccattc aggctgaggt ggataatgag tacggtttaa gcaagcgagc cgcagaagag 10260 catctccaag tgctaggtga ggatattggt tgtcctgtct acatatttcg ccttcctaat 10320 gtattcggta aatggtcgcg tccgaattat aattcagcgg ttgcgacttt ttgtcataat 10380 attattcgag atattccgat tcaaattaac aattcctcgg cagagatcac tcttgtatac 10440 atagatgatg tggttcgcac cttcatgaaa gtcatggatg ggaagctatc caatgcagtt 10500 tcactacagg tcgagcccca gtatcagatt tctgttggtg agctcgcaga acaattgtat 10560 gagtttcgta atagtcgaaa gtcactgact accgcaaggg ttggctcggg attgacgcgc 10620 gccttgtact cgacttatct aagtttcttg ccagaagata gttttagtta cgacgtgcca 10680 atgcattcgg atccgcgtgg cacattcgtc gagatgctga agaccgcgga ctctggccag 10740 ttctcgtttt ttacggctca tccaggtgtt accaggggcg ggcattacca tcactcgaaa 10800 accgaaaagt ttctggttat caaagggatg gcacgtttca agtttagaaa catcctgacc 10860 ggggcatttt acgaaatttg cactaatggt gaaaaggcag aaattgtcga aacagtacct 10920 ggatggactc atgacattac taatgtcgga actgacgata tggtagtcat gttgtgggct 10980 aacgaagtat ttgatcggga aaatccggat acctacgctt gttcagtagg cgaaggtgcg 11040 taaggtatag tgagataaca atgcagaagc taaaagtcgt tacggttgtt ggaactcgtc 11100 ctgagattat tcgcttgtct agggtcatgg cgaagcttga tcagtactgc gatcatgtac 11160 ttgtccatac tggacagaat tatgattacg aacttaatga aatatttttt caggacctcg 11220 gtataagaaa gccggattat tttctaaacg ccgccgggtc ttccggggct gaaacgatag 11280 ggaatgtaat aatcgcagtc gatcgtgttc tgggcgaaat agatcccgat gcgctgctcg 11340 tgctgggtga taccaatagt tgtatggcgg tactgcctgc aaaacggcgt aagataccga 11400 cctttcatat ggaagcaggc aatcgctgtt tcgatatgcg tgtgcctgaa gagataaatc 11460 ggcgcattgt cgatcataca gctgatgtaa atttgaccta tagtacaatt gcgcgtgatt 11520 atctcttgcg tgaaggactt tctccagaca tggttatcaa gactggtagc cctatgttcg 11580 aagttctcga gcactatcgt gacgggatcg agtcctccga tattcttgaa aggctcgggt 11640 tgaaaacaga gcggttcttt gtcgtgagtg cgcaccgaga ggaaaacata gattcggata 11700 agaatttctt gaagttggtt tctatgctca acgctgtggc agaaaagtac tcgctgcccg 11760 tcatcgtatc aactcaccct agaacaaaaa agagaattga ggcgacggag gcaaagtttc 11820 acgagggtat taaactgctg aaacccctcg gctttaagga ttacaataaa ctgcaaatta 11880 cagccaaggc agttatttct gacagtggga ccatcagtga ggagtcttca atactgaatt 11940 ttcccgcttt gaatattcgt gaggctcatg aacgcccaga aggcatggaa gaggctgtgg 12000 tgatgatggt cggactggat tcggatcgag tactacaagc actcgaggtg ttggagggac 12060 agaggcgcga cgcagagcgc atgttacgct tggtcgctga ctatagcatg cccaacgttt 12120 ctgaaaagat tgttcgcata gttcatagct atcgggacta tgtcatgcga actgtctgga 12180 aaaaatatta acttgaggcg tggagttgat ggcaaggata tttgtggttt ctgagtatgt 12240 cggtgccaat cagaactcca cgggatacta ttgggagaag ataataggaa agatgcagcg 12300 ggagtttggt gggctaaccg taattttccc gctgaccgca ggtgaaaccc cgcctgtggt 12360 ttcaccttcc gttgagcaag aatgctttaa gtttccgagg agcaataaga ataggctcct 12420 ttctagagga ttggcgcaga tttttcaggc gtttctgttc tcagtaaaat tgacttctcg 12480 tgccagacga ggagatgtgg tattgagtgg aaccaaccct gctcttctac tgatgacgtt 12540 tcccttgcta aggtatgccc tcggtttcaa gtgggtgctg ctggtgcatg atgtgtttcc 12600 cgagaacttg gtgccggcgg gcgttctgaa gaaagatagt attgcctacc ggcttctacg 12660 tcgtctcttt tctttcattt actcatccgc tgatcgtcta gtcgtaatag ggcgcgatat 12720 ggaagctctt atgaaagaga aggtgaatga cccgcgatct ttggtcttta tttcgaattg 12780 ggcctgtgag aaagaggttt tcccagtacc gagagaggat gctcctttta tcaatattcc 12840 tgaatggaaa ggtaaaaggg ttttccaatt ttttggtaat gtcggtcgat tacaaggtat 12900 agaaaacata ctttctgcta ttcagttggt taaaaacgag aaggcggctt ttgcttttat 12960 tggagatggt gccttggtcg acagtgtaaa aaaacacgcg ctggaagatc agtgtgctcg 13020 gttgaggtat tttggaaggc tgccattagc cgaaaagaat tttggtttgg ctgcctgtga 13080 cgttgcctta gttaccttag aagaaggaat gttcgggctt ggggttccca gcaaggcata 13140 tttctccatg gcagcagaca aaccgattct agctgtcatg gaaaaagggg ctgaaatctc 13200 ccgtataata gatgagaccg gaatcggttg gaactgtccg ccgaatgatc cggttgcttt 13260 ggcaagattg atcgatgaga tttgtgaact cgacttgtct agtttaggcg gagtcccgcg 13320 gagtgtcctt cagcaaaatt attctgaata tatttcattg gaaaaattcg ctgcctgtgt 13380 tcgaccgctt ctgtctgagt cgaaaatatg atgaaggtgc tggtaaccgg ggctagcggt 13440 tttgtcggga gtgcgctttg caggtcgctt gctgccgccc cctttcaggt tgtcggacaa 13500 gtacgatccc tgtacaatcc cgttacgggg gttgagtatg ttcgagcgga gctgaaagag 13560 agcactaagc ttgatgctgc gctgcggggt gttgaatgtg tagttcatct agctggacga 13620 gcccatatct ttggaaggca gcgtgattca ctagatattt ttcggaaggt gaatcgcgat 13680 gctactctgg cgcttgctcg gcaggcgatc gaagcatctg taaagcgttt catttttgtt 13740 agttctattg gtgtaaatgg cgctttaacc aaagaaaagc ccttcgatga gaactccaag 13800 ccggctcctc atgcagaata tgcgatttca aagtttgagg ctgaagtagc gcttcgggag 13860 cttttcaagc attcctcaac agaacttgtt atcgtcaggc ctccactcgt ttacgactgg 13920 aaagctcctg gaaatttctc gcgattgttg aagctggttg cttcgggact tcctcttcca 13980 tttggttgca tagataaccg acgaagtttt gtttctctgg ataatttagt tgactttcta 14040 gcttgctgta tgacgcaccc ttctgctgcc ggcgaactgt ttttggtatc cgatggtcag 14100 gagatttcta ccaagcaact ggtgactgcg cttgctgcgg gaatggggcg tcgccccatc 14160 atgtggcctg ttcctaggtt tattctgagg tttcttaaat tagtaggaaa gggtgggtta 14220 tacactcagt tatgctgctc actagaggtc gactcgtcga aaggcaggct tttgcttggt 14280 tgggaacccc gcaagagcac cctttccgcg ttggaagatg ttggtagaat atatgtcaaa 14340 cgtactgaat gattatctgc aggcgctttg ctactagcat ggcgtaccac gcagaacaat 14400 cgaatagaac cctgttgaag gggtgagagt atttttgggg ataaatttat aaatggaaga 14460 atggtatttg ttactcgctg cagctggggt ttcgggactg cttacaggcc tcttgcgtcg 14520 ttatgcctta gcgaggagct tacttgacac ccctaactct cgaagttccc atgtcgttcc 14580 cactccacgc ggaggagggg tcgccattgt agttactttt tgtctcatgc tgcctatttg 14640 ggctgtactg ggaaatatct catgggccgt gtcctgggct ttacttctcg ctggcggcgg 14700 ggttgccatt attggattca tggatgatca cggtcatatc gccgcacgct ggcgtctgct 14760 gggacatttt agtgcagcct tggtctcatt gtactttttg aatggcatac caccatttca 14820 gattgttggt gtcagttggg acctggggtg gttcggagga cttctctttg ctttctatct 14880 cgtgtggttg ctgaatctct ataacttcat ggatgggatc gatggacttg ctagccttca 14940 ggccattttt gtctgtgttg gtggggcatt attatactgg ctgaatggcc aactgacgca 15000 ggctttgctc cccttatcgc tagcttttgc cgtttttgga ttcttgttct ggaattttcc 15060 acccccaaaa attttcatgg gagatgcggg tagtggtctt ctggggattg ttttaggaat 15120 tctttccatt catgccatgt ggatgaatac gaattttttc tgggcatggt tggtcctgtt 15180 aggcgttttc atcgtcgatg cgacctatac cctgattcgt cgcttgctga gaggggacaa 15240 ggtgtatgag gctcatcgaa gccatgccta tcaatacgca agccgatact atggaaagca 15300 tgctcctgtt acgattggcg tcacggcatt gaacgtcatc tggctcctcc ctatagcctt 15360 gttggtcggg agtgggtctc tagagccttt gatgggcatc gtcatagcct acgtccctct 15420 cgtttttctg gcagtgaggt tcaaggcggg taagctagag tcgtccgctc aggcctaaag 15480 gagtagggga atgctagatc gtttaagagt aaagttgtta tccatgcctc gtcgctggaa 15540 acgtttgctt caagtggcta cggatatcct tctggtatgg ctgtctctgt ggctcgcttt 15600 tgtggtccgt ctaggcacag acgatatgat cgacgtgttc ggcgagcatg catggctttt 15660 catcactgcg ccggtcatcg ccattccact attcattcgc ttcggcatgt atcgcgcggt 15720 gatgcgctat ctcggtaacg acgcattgat cgccatcgcc aaggcggtga ccatctcggc 15780 tctggtgctg tcgctggtgg tgtactggta tcgtggcgcg ccggcgccgg tgccgcgttc 15840 cctggtgttc aactactggt ggttgagcat gctgctgatc ggcggcttgc gtctggccat 15900 gcgccagtat ttcatgggcg actggtactc tgctgtgcag tcggtaccat ttctcaaccg 15960 ccaggatggc ctgcccaggg tggttatcta tggggcgggg gcggccggca accagttggt 16020 tgcggcgttg cgtctcggtc gggcgatgcg tccggtggcg ttcatcgatg acgacaagca 16080 gatcgccaac cgggtcattg ccggtctgcg ggtctatacc gccaagcata tccgccagat 16140 gatcgacgag acgggcgcgc aggaggttct cctggcgatt ccttccgcca ctcgggcccg 16200 gcgccgagag attctcgagt ccctggagcc gttcccgctg cacgtgcgca gcatgcccgg 16260 cttcatggac ctggccagcg gccgggtcaa ggtggatgac ctgcaggagg tggacatcgc 16320 tgacctgctg gggcgcgaca gcgtcgcacc gcgcaaggag ctgctggaac ggtgcatccg 16380 cggtcaggtg gtgatggtga ccggggcggg cggctctatc ggttcggaac tctgtcggca 16440 gatcatgagt tgttcgccta gcgtgctgat cctgttcgaa cacagcgaat acaacctcta 16500 tagcatccat caggaactgg agcgtcggat caagcgcgag tcgctttcgg tgaacctgtt 16560 gccgatcctc ggttcggtgc gcaatcccga gcgcctggtg gacgtgatgc gtacctggaa 16620 ggtcaatacc gtctaccatg cggcggccta caagcatgtg ccgatcgtcg agcacaacat 16680 cgccgagggc gttctcaaca acgtgatagg caccttgcat gcggtgcagg ccgcggtgca 16740 ggtcggcgtg cagaacttcg tgctgatttc caccgacaag gcggtgcggc cgaccaatgt 16800 gatgggcagc accaagcgcc tggcggaaat ggtccttcag gcgctcagca acgaatcggc 16860 gccggtgctg ttcggcgacc ggaaggacgt gcatcacgtc aacaagaccc gtttcaccat 16920 ggtccgcttc ggcaacgtcc tcggttcgtc cggttcggtc attccgctgt tccgcgagca 16980 gatcaagcgc ggcggcccgg tgacggtcac ccacccgagc atcacccgtt acttcatgac 17040 cattcccgag gcggcgcagt tggtcatcca ggccggttcg atggggcagg gcggagatgt 17100 attcgtgctg gacatggggc cgccggtgaa gatcctggag ctcgccgaga agatgatcca 17160 cctgtccggc ctgagcgtgc gttccgagcg ttcgccccat ggtgacatcg ccatcgagtt 17220 cagtggcctg cgtcctggcg agaagctcta cgaagagctg ctgatcggtg acaacgtgaa 17280 tcccaccgac catccgatga tcatgcgggc caacgaggaa cacctgagct gggaggcctt 17340 caaggtcgtg ctggagcagt tgctggccgc cgtggagaag gacgactact cgcgggttcg 17400 ccagttgctg cgggaaaccg tcagcggcta tgcgcctgac ggtgaaatcg tcgactggat 17460 ctatcgccag aggcggcgag aaccctgagt catcgttctc cggaaaaggc cgcctagcgg 17520 ccttttttgt tttctccgta cgatgtttcc ggtgccggac caggaagcga ctgctttgct 17580 ggggctgtcg atccaggtgc gttccacggc gataaggtgg tttcgtggat gggcaacatg 17640 tcgcgaaggt aaagtcagcc gcattgttga attcatcgaa aaaccggatc agccacaaac 17700 gctggaatca gacatcatgg ccgtgggccg ttatgtgctt tctgccgata tttggccgga 17760 acttgaacgc actcagccag gtgcatgggg acgtattcag ctgactgatg ccattgccga 17820 actggcgaaa aaacagtctg ttgacgccat gctgatgact ggtgacagct acgactgtgg 17880 taaaaaaatg ggttatatgc aggcgtttgt gaagtatgga ctacgcaacc tgaaagaagg 17940 agcgaagttc cgcaaaggta ttgagaaatt gcttagcgag taagtttaaa aaatagacgc 18000 ccttataggg cgtaataaca aataacggta gtcaacattc gacgcggtga tgcagatatg 18060 cccggaatgc tgataccgtt ttttcattct aaaaaactca tcatttcatt gagttaacta 18120 caaaatttag cactgttttt tataatgttt cttcttgttt ctggcatcaa ttggtaagat 18180 aattagtgtt tgagtttaga ggctttgcgg cagagaagcg gagcttaaca cgtctgtgag 18240 agtacgcagt gcactggtag ctgtaaagcc agtggcggta gcgtgtttaa ataaatacat 18300 tagtaatact acatattaca tcattgtagg ctatttaagc gctacatgat aagcgacagc 18360 gctagcaatc aaatctttta aagttacttc tcaggaatag taaaaggagg acagctatgt 18420 tgaaaaaaga gtatttaaaa aacccttatt tagttttgtt tgcgatgatt atattagctt 18480 atgtttttag tgtattttgc aggttttatt gggtttggtg ggcaagtgag tttaatgagt 18540 attttttcaa taatcagtta atgatcattt caaatgatgg ctatgctttt gctgagggcg 18600 caagagatat gatagcaggt tttcatcagc ctaatgattt gagttattat ggatcttctt 18660 tatccgcgct tacttattgg ctttataaaa tcacaccttt ttcttttgaa agtatcattt 18720 tatatatgag tactttttta tcttctttgg tggtgattcc tactattttg ctagctaacg 18780 aatacaaacg tcctttaatg ggctttgtag ctgctctttt agcaagtata gcaaacagtt 18840 attataatcg cactatgagt gggtattatg atacggatat gctggtaatt gttttgccta 18900 tgtttatttt attttttatg gtaagaatga ttttaaaaaa agactttttt tcattgattg 18960 ccttgccgtt atttatagga atttatcttt ggtggtatcc ttcaagttat actttaaatg 19020 tagctttaat tggacttttt ttaatttata cacttatttt tcatagaaaa gaaaagattt 19080 tttatatagc tgtgattttg tcttctctta ctctttcaaa tatagcatgg ttttatcaaa 19140 gtgccattat agtaatactt tttgctttat tcgccttaga gcaaaaacgc ttaaatttta 19200 tgattatagg aattttaggt agtgcaactt tgatattttt gattttaagt ggtggggttg 19260 atcctatact ttatcagctt aaattttata tttttagaag tgatgaaagt gcgaatttaa 19320 cgcagggctt tatgtatttt aatgtcaatc aaaccataca agaagttgaa aatgtagatc 19380 ttagcgaatt tatgcgaaga attagtggta gtgaaattgt ttttttgttt tctttgtttg 19440 gttttgtatg gcttttgaga aaacataaaa gtatgattat ggctttacct atattggtgc 19500 ttgggttttt agccttaaaa ggggggctta gatttaccat ttattctgta cctgtaatgg 19560 ccttaggatt tggtttttta ttgagcgagt ttaaggctat aatggttaaa aaatatagcc 19620 aattaacttc aaatgtttgt attgtttttg caactatttt gactttagct ccagtattta 19680 tccatattta caactataaa gcgccaacag ttttttctca aaatgaagca tcattattaa 19740 atcaattaaa aaatatagcc aatagagaag attatgtggt aacttggtgg gattatggtt 19800 atcctgtgcg ttattatagc gatgtgaaaa ctttagtaga tggtggaaag catttaggta 19860 aggataattt tttcccttct tttgctttaa gcaaagatga acaagctgca gctaatatgg 19920 caagacttag tgtagaatat acagaaaaaa gcttttatgc tccgcaaaat gatattttaa 19980 aaacagacat tttgcaagcc atgatgaaag attataatca aagcaatgtg gatttgtttc 20040 tagcttcatt atcaaaacct gattttaaaa tcgatacgcc aaaaactcgt gatatttatc 20100 tttatatgcc cgctagaatg tctttgattt tttctacggt ggctagtttt tcttttatta 20160 atttagatac aggagttttg gataaacctt ttacctttag cacagcttat ccacttgatg 20220 ttaaaaatgg agaaatttat cttagcaacg gagtggtttt aagcgatgat tttagaagtt 20280 ttaaaatagg tgataatgtg gtttctgtaa atagtatcgt agagattaat tctattaaac 20340 aaggtgaata caaaatcact ccaattgatg ataaggctca gttttatatt ttttatttaa 20400 aggatagtgc tattccttac gcacaattta ttttaatgga taaaaccatg tttaatagtg 20460 cttatgtgca aatgtttttt ttaggaaatt atgataagaa tttatttgac ttggtgatta 20520 attctagaga tgctaaggtt tttaaactta aaatttaccc atacgatgtt ccagattacg 20580 cttaaacatg tgaattc 20597 <210> 20 <211> 8815 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 20 agtcgacctg caggatgaga gtagaaaata ataatgtttc tgggcaaaac catgacccgg 60 aacagattga tttgattgat ttactagtgc agttgtggcg tggcaagatg acaatcatca 120 tttccgtcat tgtggctatt gccctagcta ttggatattt ggcagtagcg aaggagaaat 180 ggacgtcaac agcaattatc actcagcccg atgtggggca aattgctggc tataacaatg 240 ccatgaatgt tatctatggt caggctgcac cgaaagtatc ggatttgcag gagacgttaa 300 ttggtcgctt cagttctgcc ttctctgcat tagcagaaac gctggataat caggaagaac 360 cagaaaaact taccatcgaa ccttctgtta agaaccagca attaccattg actgtttctt 420 atgttgggca aactgcagag ggcgcacaaa tgaagttggc ccaatacatt cagcaagttg 480 acgataaagt gaatcaagag ttagaaaagg atctcaagga caacattgct ctgggacgga 540 aaaacttgca ggactcttta agaacgcagg aagtggttgc gcaggagcag aaagatctgc 600 gtatccgtca gattcaggaa gcgttgcagt atgcgaatca ggcgcaggtg acaaaaccgc 660 agattcaaca gactggcgaa gatatcacac aagatacgtt gttccttttg gggagcgaag 720 cgctggagtc gatgattaag catgaggcga cccgtccgtt ggtgttctca ccaaactact 780 atcagactcg tcaaaacctg cttgatatcg aaagcttaaa ggttgatgat cttgatattc 840 atgcttaccg ctatgtaatg aaaccgacgt tacctattcg tcgtgatagc ccgaaaaagg 900 caattacctt gattctggcg gtgctgctgg gtggcatggt tggcgcgggg attgtgctgg 960 ggcgtaatgc tctacgcaat tacaacgcga agtaacctgc aggcatgcaa gcttctgttt 1020 tggcggatga gagaagaaat tcgtcgcccg ccataaactg ccaggcatca aattaagcag 1080 aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctcttcctgt ctagcaggtg 1140 gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 1200 atatgtatcc gctcatgcta gaaatatttt atctgattaa taagatgatc ttcttgagat 1260 cgttttggtc tgcgcgtaat ctcttgctct gaaaacgaaa aaaccgcctt gcagggcggt 1320 ttttcgaagg ttctctgagc taccaactct ttgaaccgag gtaactggct tggaggagcg 1380 cagtcaccaa aacttgtcct ttcagtttag ccttaaccgg cgcatgactt caagactaac 1440 tcctctaaat caattaccag tggctgctgc cagtggtgct tttgcatgtc tttccgggtt 1500 ggactcaaga cgatagttac cggataaggc gcagcggtcg gactgaacgg ggggttcgtg 1560 catacagtcc agcttggagc gaactgccta cccggaactg agtgtcaggc gtggaatgag 1620 acaaacgcgg ccataacagc ggaatgacac cggtaaaccg aaaggcagga acaggagagc 1680 gcacgaggga gccgccaggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1740 ccactgattt gagcgtcaga tttcgtgatg cttgtcaggg gggcggagcc tatggaaaaa 1800 cggctttgcc gcggccctct cacttccctg ttaagtatct tcctggcatc ttccaggaaa 1860 tctccgcccc gttcgtaagc catttccgct cgccgcagtc gaacgaccga gcgtagcgag 1920 tcagtgagcg aggaagcgga atatatcctg tatcacatat tctgctgacg caccggtgca 1980 gccttttttc tcctgccaca tgaagcactt cactgacacc ctcatcagtg ccaacatagt 2040 aagccagtat acactccgct agcgctgatg tccggcggtg cttttgccgt tacgcaccac 2100 cccgtcagta gctgaacagg agggacagct gatagaaaca gaagccactg gagcacctca 2160 aaaacaccat catacactaa atcagtaagt tggcagcatc acccgacgca ctttgcgccg 2220 aataaagtgt aggctggagc tgcttcgaag ttcctatact ttctagagaa taggaacttc 2280 ggaataggaa cttcaagatc ccctcacgct gccgcaagca ctcagggcgc aagggctgct 2340 aaaggaagcg gaacacgtag aaagccagtc cgcagaaacg gtgctgaccc cggatgaatg 2400 tcagctactg ggctatctgg acaagggaaa acgcaagcgc aaagagaaag caggtagctt 2460 gcagtgggct tacatggcga tagctagact gggcggtttt atggacagca agcgaaccgg 2520 aattgccagc tggggcgccc tctggtaagg ttgggaagcc ctgcaaagta aactggatgg 2580 ctttcttgcc gccaaggatc tgatggcgca ggggatcaag atctgatcaa gagacaggat 2640 gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 2700 tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 2760 tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 2820 ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 2880 cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 2940 aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 3000 tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 3060 aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 3120 atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 3180 cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 3240 tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 3300 accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 3360 gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 3420 tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 3480 agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 3540 gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 3600 gctggagttc ttcgcccacc ccagcttcaa aagcgctctg aagttcctat actttctaga 3660 gaataggaac ttcggaatag gaactaagga ggatattcat atggtttttt taaggcagtt 3720 attggtgccc ttaaacgcct ggtgctacgc ctgaataagt gataataagc ggatgaatgg 3780 cagaaattcg aaagcaaatt cgacccggtc gtcggttcag ggcagggtcg ttaaatagcc 3840 gcttatgtct attgctggtt taccggttta ttgactaccg gaagcagtgt gaccgtgtgc 3900 ttctcaaatg cctgaggcca gtttgctcag gctctccccg tggaggtaat aattgacgat 3960 atgatcattt attctgcctc ccagagcctg ataaaaacgg ttagcgcttc gttaatacag 4020 atgtaggtgt tccacagggt agccagcagc atcctgcgat gcagatccgg aacataatgg 4080 tgcagggcgc ttgtttcggc gtgggtatgg tggcaggccc cgtggccggg ggactgttgg 4140 gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 4200 cgatagtcat gccccgcgcc caccggaagg agctaccgga cagcggtgcg gactgttgta 4260 actcagaata agaaatgagg ccgctcatgg cgttgactct cagtcatagt atcgtggtat 4320 caccggttgg ttccactctc tgttgcgggc aacttcagca gcacgtaggg gacttccgcg 4380 tttccagact ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag 4440 acgttttgca gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac 4500 cagtaaggca accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca 4560 cccgtggcca ggacccaacg ctgcccgaga tgcgccgcgt gcggctgctg gagatggcgg 4620 acgcgatgga tatgttctgc caagggttgg tttgcgcatt cacagttctc cgcaagaatt 4680 gattggctcc aattcttgga gtggtgaatc cgttagcgag gtgccgccgg cttccattca 4740 ggtcgaggtg gcccggctcc atgcaccgcg acgcaacgcg gggaggcaga caaggtatag 4800 ggcggcgcct acaatccatg ccaacccgtt ccatgtgctc gccgaggcgg cataaatcgc 4860 cgtgacgatc agcggtccag tgatcgaagt taggctggta agagccgcga gcgatccttg 4920 aagctgtccc tgatggtcgt catctacctg cctggacagc atggcctgca acgcgggcat 4980 cccgatgccg ccggaagcga gaagaatcat aatggggaag gccatccagc ctcgcgtcgc 5040 gaacgccagc aagacgtagc ccagcgcgtc ggccaattcg cgctaactta cattaattgc 5100 gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 5160 cggccaacgc gcggggagag gcggtttgcg tattgggcgc cagggtggtt tttcttttca 5220 ccagtgagac gggcaacagc tgattgccct tcaccgcctg gccctgagag agttgcagca 5280 agcggtccac gctggtttgc cccagcaggc gaaaatcctg tttgatggtg gttgacggcg 5340 ggatataaca tgagctgtct tcggtatcgt cgtatcccac taccgagata tccgcaccaa 5400 cgcgcagccc ggactcggta atggcgcgca ttgcgcccag cgccatctga tcgttggcaa 5460 ccagcatcgc agtgggaacg atgccctcat tcagcatttg catggtttgt tgaaaaccgg 5520 acatggcact ccagtcgcct tcccgttccg ctatcggctg aatttgattg cgagtgagat 5580 atttatgcca gccagccaga cgcagacgcg ccgagacaga acttaatggg cccgctaaca 5640 gcgcgatttg ctggtgaccc aatgcgacca gatgctccac gcccagtcgc gtaccgtctt 5700 catgggagaa aataatactg ttgatgggtg tctggtcaga gacatcaaga aataacgccg 5760 gaacattagt gcaggcagct tccacagcaa tggcatcctg gtcatccagc ggatagttaa 5820 tgatcagccc actgacgcgt tgcgcgagaa gattgtgcac cgccgcttta caggcttcga 5880 cgccgcttcg ttctaccatc gacaccacca cgctggcacc cagttgatcg gcgcgagatt 5940 taatcgccgc gacaatttgc gacggcgcgt gcagggccag actggaggtg gcaacgccaa 6000 tcagcaacga ctgtttgccc gccagttgtt gtgccacgcg gttgggaatg taattcagct 6060 ccgccatcgc cgcttccact ttttcccgcg ttttcgcaga aacgtggctg gcctggttca 6120 ccacgcggga aacggtctga taagagacac cggcatactc tgcgacatcg tataacgtta 6180 ctggtttcac attcaccacc ctgaattgac tctcttccgg gcgctatcat gccataccgc 6240 gaaaggtttt gcaccattcg atggtgtcaa cgtaaatgca tgccgcttcg ccttcgcgcg 6300 cgaattggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt tggtggcggg 6360 accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa gcgacaggcc 6420 gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga gcgctgccgg 6480 cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga cgatagtcat 6540 gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca tcggcggagc 6600 ttatcgactg cacggtgcac caatgcttct ggcgtcaggc agccatcgga agctgtggta 6660 tggctgtgca ggtcgtaaat cactgcataa ttcgtgtcgc tcaaggcgca ctcccgttct 6720 ggataatgtt ttttgcgccg acatcataac ggttctggca aatattctga aatgagctgt 6780 tgacaattaa tcatcggctc gtataatgtg tggaattgtg agcggataac aatttcacac 6840 aggaaacaga attcgagctc atgaaaaaga tttggctggc cctggcagga ctggttctgg 6900 ccttttcagc aagtgcagct gaagaagcct ttgatctgtg gaatgagtgt gcaaaagcat 6960 gtgtactgga tctgaaagat ggtgtgagat ccagcagaat gtcagtggat ccagccattg 7020 cagatacaaa tggccagggt gtactgcatt actctatggt tctggaaggt ggtaatgatg 7080 ccctgaaact ggccattgat aatgcactgt ctatcaccag tgatggtctg acaatcagac 7140 tggagggagg ggtggaaccc aataagcctg tcagatacag ctatacaaga caagccagag 7200 gttcttggag cctgaactgg ctggtgccta ttgggcatga aaaaccatct aacattaaag 7260 tttttattca tgaactgaat gcaggcaatc agctgtctca tatgagccca atttatacca 7320 ttgaaatggg ggatgaactg ctggctaaac tggccagaga tgctacattc tttgtcagag 7380 cccatgaatc aaatgagatg cagcctaccc tggccattag ccatgctggt gtgagtgttg 7440 tcatggcaca aactcagccc aggagagaga aaaggtggtc tgagtggacc agtggcaaag 7500 tgctgtgcct gctggatcct ctggatggtg tttataacta tctggcccaa cagaggtgta 7560 acctggatga tacctgggaa ggtaaaatct atagagtgct ggcaggtaat ccagcaaaac 7620 atgacctgga tatcaaggat aataacaata gcacccctac tgtaatcagc catagactgc 7680 atttcccaga gggaggttca ctggctgccc tgactgctca tcaggcctgt catctgccac 7740 tggaaacttt caccagacac aggcagccaa gaggctggga acagctggaa caatgtggct 7800 atccagttca gaggctggtt gccctgtacc tggcagcaag actgagctgg aatcaggtag 7860 atcaggttat tagaaatgca ctggccagcc cagggagtgg gggtgacctg ggtgaggcaa 7920 ttagagaaca gcctgagcag gccagactgg ccctgactct ggcagcagct gaaagtgaaa 7980 gatttgtgag acaggggaca ggcaatgatg aagcaggtgc agctaatgca gatgttgttt 8040 cactgacttg tcctgttgct aaagatcaga acaggaccaa aggtgaatgt gctggaccag 8100 ctgattcagg agatgcactg ctggagagga actatccaac tggtgcagaa ttcctgggag 8160 atggtggtga tgtttctttt agcaccagag gcacacagaa ctggactgtg gaaagactgc 8220 tgcaggcaca tagacagctg gaagaaagag gctatgtatt tgttggctac catggtactt 8280 tcctggaagc agcacagtcc attgtctttg gaggggttag agccagaagc caggatctgg 8340 atgctatttg gagaggtttt tatattgctg gggatccagc cctggcctat ggatatgcac 8400 aagatcagga acctgatgcc agaggcagaa tcagaaatgg tgccctgctg agggtttatg 8460 ttcctaggtc tagcctgcca ggattttata gaacctctct gaccctggca gcccctgaag 8520 cagcaggtga ggtggagaga ctgattggtc atcctctgcc actgagactg gatgccatta 8580 cagggccaga agaagaaggt ggcagagtga caattctggg ttggcccctg gcagagagga 8640 cagtagttat tccttcagca atccctacag atccaaggaa tgtgggtggg gacctggatc 8700 catcctcaat tccagataag gaacaggcaa tttcagccct gcctgattat gctagtcagc 8760 caggtaaacc acctagagaa gatctgaaac accaccacca ccaccactga tctag 8815 <210> 21 <211> 993 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 21 gaattcatga gagtagaaaa taataatgtt tctgggcaaa accatgaccc ggaacagatt 60 gatttgattg atttactagt gcagttgtgg cgtggcaaga tgacaatcat catttccgtc 120 attgtggcta ttgccctagc tattggatat ttggcagtag cgaaggagaa atggacgtca 180 acagcaatta tcactcagcc cgatgtgggg caaattgctg gctataacaa tgccatgaat 240 gttatctatg gtcaggctgc accgaaagta tcggatttgc aggagacgtt aattggtcgc 300 ttcagttctg ccttctctgc attagcagaa acgctggata atcaggaaga accagaaaaa 360 cttaccatcg aaccttctgt taagaaccag caattaccat tgactgtttc ttatgttggg 420 caaactgcag agggcgcaca aatgaagttg gcccaataca ttcagcaagt tgacgataaa 480 gtgaatcaag agttagaaaa ggatctcaag gacaacattg ctctgggacg gaaaaacttg 540 caggactctt taagaacgca ggaagtggtt gcgcaggagc agaaagatct gcgtatccgt 600 cagattcagg aagcgttgca gtatgcgaat caggcgcagg tgacaaaacc gcagattcaa 660 cagactggcg aagatatcac acaagatacg ttgttccttt tggggagcga agcgctggag 720 tcgatgatta agcatgaggc gacccgtccg ttggtgttct caccaaacta ctatcagact 780 cgtcaaaacc tgcttgatat cgaaagctta aaggttgatg atcttgatat tcatgcttac 840 cgctatgtaa tgaaaccgac gttacctatt cgtcgtgata gcccgaaaaa ggcaattacc 900 ttgattctgg cggtgctgct gggtggcatg gttggcgcgg ggattgtgct ggggcgtaat 960 gctctacgca attacaacgc gaagtaagtc gac 993 <210> 22 <211> 13 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 22 Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg 1 5 10 <210> 23 <211> 4 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 23 Asp Gln Asn Arg 1 <210> 24 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic consensus sequence" <220> <221> VARIANT <222> (1)..(1) <223> /replace="Glu" <220> <221> VARIANT <222> (2)..(2) <223> /replace="Arg" or "Asn" or "Asp" or "Cys" or "Gln" or "Glu" or "Gly" or "His" or "Ile" or "Leu" or "Lys" or "Met" or "Phe" or "Ser" or "Thr" or "Trp" or "Tyr" or "Val" <220> <221> MISC_FEATURE <222> (1)..(2) <223> /note="Residues given in the sequence have no preference with respect to those in the annotations for said positions" <220> <221> MOD_RES <222> (4)..(4) <223> /replace="Arg" or "Asn" or "Asp" or "Cys" or "Gln" or "Glu" or "Gly" or "His" or "Ile" or "Leu" or "Lys" or "Met" or "Phe" or "Ser" or "Thr" or "Trp" or "Tyr" or "Val" <220> <221> VARIANT <222> (5)..(5) <223> /replace="Thr" <220> <221> MISC_FEATURE <222> (4)..(5) <223> /note="Residues given in the sequence have no preference with respect to those in the annotations for said positions" <220> <221> MISC_FEATURE <222> (1)..(5) <223> /note="See specification as filed for detailed description of substitutions and preferred embodiments" <400> 24 Asp Ala Asn Ala Ser 1 5 <210> 25 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 25 Asp Asn Asn Asn Ser 1 5 <210> 26 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 26 Asp Gln Asn Arg Thr 1 5 <210> 27 <211> 2160 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 27 gaattcatgt tgaaaaaaga gtatttaaaa aacccttatt tagttttgtt tgcgatgatt 60 atattagctt atgtttttag tgtattttgc aggttttatt gggtttggtg ggcaagtgag 120 tttaatgagt attttttcaa taatcagtta atgatcattt caaatgatgg ctatgctttt 180 gctgagggcg caagagatat gatagcaggt tttcatcagc ctaatgattt gagttattat 240 ggatcttctt tatccgcgct tacttattgg ctttataaaa tcacaccttt ttcttttgaa 300 agtatcattt tatatatgag tactttttta tcttctttgg tggtgattcc tactattttg 360 ctagctaacg aatacaaacg tcctttaatg ggctttgtag ctgctctttt agcaagtata 420 gcaaacagtt attataatcg cactatgagt gggtattatg atacggatat gctggtaatt 480 gttttgccta tgtttatttt attttttatg gtaagaatga ttttaaaaaa agactttttt 540 tcattgattg ccttgccgtt atttatagga atttatcttt ggtggtatcc ttcaagttat 600 actttaaatg tagctttaat tggacttttt ttaatttata cacttatttt tcatagaaaa 660 gaaaagattt tttatatagc tgtgattttg tcttctctta ctctttcaaa tatagcatgg 720 ttttatcaaa gtgccattat agtaatactt tttgctttat tcgccttaga gcaaaaacgc 780 ttaaatttta tgattatagg aattttaggt agtgcaactt tgatattttt gattttaagt 840 ggtggggttg atcctatact ttatcagctt aaattttata tttttagaag tgatgaaagt 900 gcgaatttaa cgcagggctt tatgtatttt aatgtcaatc aaaccataca agaagttgaa 960 aatgtagatc ttagcgaatt tatgcgaaga attagtggta gtgaaattgt ttttttgttt 1020 tctttgtttg gttttgtatg gcttttgaga aaacataaaa gtatgattat ggctttacct 1080 atattggtgc ttgggttttt agccttaaaa ggggggctta gatttaccat ttattctgta 1140 cctgtaatgg ccttaggatt tggtttttta ttgagcgagt ttaaggctat aatggttaaa 1200 aaatatagcc aattaacttc aaatgtttgt attgtttttg caactatttt gactttagct 1260 ccagtattta tccatattta caactataaa gcgccaacag ttttttctca aaatgaagca 1320 tcattattaa atcaattaaa aaatatagcc aatagagaag attatgtggt aacttgggcg 1380 gcttatggtt atcctgtgcg ttattatagc gatgtgaaaa ctttagtaga tggtggaaag 1440 catttaggta aggataattt tttcccttct tttgctttaa gcaaagatga acaagctgca 1500 gctaatatgg caagacttag tgtagaatat acagaaaaaa gcttttatgc tccgcaaaat 1560 gatattttaa aaacagacat tttgcaagcc atgatgaaag attataatca aagcaatgtg 1620 gatttgtttc tagcttcatt atcaaaacct gattttaaaa tcgatacgcc aaaaactcgt 1680 gatatttatc tttatatgcc cgctagaatg tctttgattt tttctacggt ggctagtttt 1740 tcttttatta atttagatac aggagttttg gataaacctt ttacctttag cacagcttat 1800 ccacttgatg ttaaaaatgg agaaatttat cttagcaacg gagtggtttt aagcgatgat 1860 tttagaagtt ttaaaatagg tgataatgtg gtttctgtaa atagtatcgt agagattaat 1920 tctattaaac aaggtgaata caaaatcact ccaattgatg ataaggctca gttttatatt 1980 ttttatttaa aggatagtgc tattccttac gcacaattta ttttaatgga taaaaccatg 2040 tttaatagtg cttatgtgca aatgtttttt ttaggaaatt atgataagaa tttatttgac 2100 ttggtgatta attctagaga tgctaaggtt tttaaactta aaatttaccc atacgatgtt 2160

Claims

(i) 스타필로코커스 아우레우스인 그람-양성 세균으로부터의 하나 이상의 글리코실트랜스퍼라제(glycosyltransferase)를 코딩하는 뉴클레오타이드 서열;
(ii) 슈도모나스 애루기노사인 그람-음성 세균으로부터의 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열;
(iii) 아미노산 공통 서열 D/E-X-N-Z-S/T를 포함하는 담체 단백질로서, 이때 X 및 Z가 프롤린을 제외한 임의의 천연 아미노산일 수 있는, 담체 단백질을 코딩하는 뉴클레오타이드 서열; 및
(iv) 올리고사카릴 트랜스퍼라제를 코딩하는 뉴클레오타이드 서열
을 포함하는,
에스케리치아 콜라이(Escherichia coli)인 그람-음성 숙주 원핵 유기체.
제1항에 있어서,
스타필로코커스 아우레우스가 캡슐형 폴리사카라이드 5 균주 또는 캡슐형 폴리사카라이드 8 균주인, 그람-음성 숙주 원핵 유기체.
제1항 또는 제2항에 있어서,
스타필로코커스 아우레우스가 메티실린 내성 균주인, 그람-음성 숙주 원핵 유기체.
제1항 또는 제2항에 있어서,
상이한 그람-양성 세균 균주로부터의 2개 이상의 글리코실트랜스퍼라제를 포함하는 그람-음성 숙주 원핵 유기체.
제1항 또는 제2항에 있어서,
담체 단백질이 슈도모나스 애루기노사 외독소, 스타필로코커스 아우레우스 알파 헤모라이신 또는 스타필로코커스 아우레우스 응괴 인자 A인, 그람-음성 숙주 원핵 유기체.
제1항 또는 제2항에 있어서,
올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터의 것인, 그람-음성 숙주 원핵 유기체.
제1항 또는 제2항에 따른 그람-음성 숙주 원핵 유기체를 사용하여 재조합 N-글리코실화된 단백질을 제조하는 방법.
삭제
삭제
삭제
삭제