KR101855380B1

KR101855380B1 - 원핵세포에서 면역원성 폴리사카라이드를 제조하는 생합성 시스템

Info

Publication number: KR101855380B1
Application number: KR1020127015728A
Authority: KR
Inventors: 마이클 바커; 찰스 와처
Original assignee: 글락소스미스클라인 바이오로지칼즈 에스.에이.
Priority date: 2009-11-19
Filing date: 2010-11-16
Publication date: 2018-05-08
Also published as: IL219733A; AU2010322454A1; PL2501406T3; JP5968784B2; EP2501406B1; JP2017018098A; CA2780487C; HUE038456T2; AU2010322454B2; US9764018B2; HRP20180338T1; EP2501406B8; EP2501406A1; PT2501406T; IL219733A0; CN102724997B; EP2501406A4; WO2011062615A1; KR20120102086A; SI2501406T1

Abstract

본 발명은 N-글리코실화된 단백질을 포함하는 생접합체 백신에 관한 것이다. 또한, 본 발명은 환원 말단에서 N-아세틸갈락토스아민을 갖는 올리고사카라이드 또는 폴리사카라이드를 합성하는 에피머라제(epimerase)를 코딩하는 핵산을 포함하는 재조합 원핵 생합성 시스템에 관한 것이다. 추가로, 본 발명은 환원 말단에서 N-아세틸갈락토스아민을 갖는 올리고사카라이드 또는 폴리사카라이드를 함유하는 N-글리코실화된 단백질, 및 이러한 N-글리코실화된 단백질을 제조하는 발현 시스템 및 방법에 관한 것이다.

Description

원핵세포에서 면역원성 폴리사카라이드를 제조하는 생합성 시스템{BIOSYNTHETIC SYSTEM THAT PRODUCES IMMUNOGENIC POLYSACCHARIDES IN PROKARYOTIC CELLS}

본 발명은 백신의 제조를 위한 생합성 시스템 및 단백질의 용도에 관한 것이다. 또한, 본 발명은 환원 말단에서 특정 모노사카라이드를 갖는 올리고사카라이드 또는 폴리사카라이드의 합성을 개시하는 에피머라제(epimerase)를 갖는 재조합 원핵 생합성 시스템에 관한 것이다. 추가로, 본 발명은 발현 시스템에서 글리칸을 사용하여 생성한 N-글리코실화된 단백질, 및 면역원성 글리칸을 포함하는 상기 N-글리코실화된 단백질로부터 제조된 생접합체 백신에 관한 것이고 N-글리코실화된 단백질의 제조 방법을 제공한다.

관련 출원의 교차참조

본원은 전체 내용이 참고로서 본원에 혼입된, 2009년 11월 19일자 출원된 미국 가출원 제61/272,931호의 이익을 미국 특허법 제119(e)조 하에 주장한다.

당단백질은 하나 이상의 공유부착된 당 중합체를 갖는 단백질이다. N-결합 단백질 글리코실화는 진핵 유기체의 소포체(endoplasmic reticulum)에서 일어나는 필수적인 보존된 과정이다. N-결합된 단백질 글리코실화는 분비 단백질 및 막 단백질의 단백질 폴딩(folding), 올리고머화, 안정성, 질 조절, 분류 및 수송에 있어서 중요하다(문헌[Helenius, A., and Aebi, M. (2004). Roles of Ν-linked glycans in the endoplasmic reticulum. Annu. Rev. Biochem. 73, 1019-1049]).

단백질 글리코실화는 단백질의 면역원성, 안정성 및 반감기에 깊은 영향을 미친다. 또한, 글리코실화는 크로마토그래피, 예를 들면, 단백질의 글리코실화된 부분(moiety)과 상호작용하는 고체상(solid phase)에 결합된 렉틴 리간드를 사용한 친화성 크로마토그래피에 의한 단백질의 정제를 보조할 수 있다. 따라서, 생물학적으로 및 약학적으로 유용한 글리코실화 패턴을 생성하기 위해 많은 글리코실화된 단백질을 진핵세포에서 재조합적으로 제조하는 것이 확립된 관행이다.

국제 특허출원 공개 제WO 2003/07467호(애비(Aebi) 등)는 박테리아인 식품 유래의 병원성 캄필로박터 제주니(Campylobacter jejuni)가 그의 단백질을 N-글리코실화할 수 있다는 것을 입증하였는데, 이러한 N-글리코실화는 고세균(archaea)의 일부 종들을 제외하고 공지된 원핵 유기체들 사이의 독특한 특징이었다. 글리코실화를 위해 필요한 기구는 소위 pgl 좌위에 밀집되어 있는 12종의 유전자들에 의해 코딩된다. N-글리코실화의 파괴는 캄필로박터 제주니의 침습 및 병원성에 영향을 미치지만 대부분의 진핵 유기체들에서와 같이 치명적이지는 않다(문헌[Burda P. and M. Aebi, (1999). The dolichol pathway of N-linked glycosylation. Biochem Biophys Acta 1426(2):239-57]). 이. 콜라이(E. coli)에서 pgl 좌위 및 수용체 당단백질을 동시에 재조합적으로 발현시킴으로써 캄필로박터 제주니 단백질의 N-글리코실화를 재구성할 수 있다(문헌[Wacker et al. (2002). N-linked glycosylation in Campylobacter jejuni and its functional transfer into E. coli. Science 298, 1790-1793]).

N-글리칸은 단백질의 컨센서스 서열에 부착된 글리칸을 갖는다. 단백질의 공지된 N-글리코실화 컨센서스 서열은 원핵 유기체들에서 재조합 표적 단백질의 N-글리코실화를 허용한다. 이러한 유기체들은 글리칸을 단백질의 컨센서스 서열에 전달하는 효소인 올리고사카릴 트랜스퍼라제(oligosaccharyl transferase)("OT"; "OTase"), 예를 들면, 캄필로박터 제주니의 올리고사카릴 트랜스퍼라제를 포함한다.

국제 특허출원 공개 제WO 2003/07467호(애비 등)는 (i) 지질 담체 상에서의 올리고사카라이드의 조립을 위한 특정 글리코실트랜스퍼라제(glycosyltrasferase), (ii) 컨센서스 서열 "Ν-X-S/T"를 포함하는 재조합 표적 단백질(이때, X는 프롤린을 제외한 임의의 아미노산일 수 있음), 및 (iii) 올리고사카릴 트랜스퍼라제, 예를 들면, 상기 올리고사카라이드를 표적 단백질의 컨센서스 서열에 공유결합시키는 캄필로박터 제주니의 올리고사카릴 트랜스퍼라제를 코딩하는 핵산이 도입된 원핵 유기체를 교시한다. 원핵 유기체는 상기 특정 글리코실트랜스퍼라제의 종류에 의해 정의된 특정 구조를 갖는 N-글리칸을 생성한다.

국제 특허출원 공개 제WO 2006/119987호(애비 등)는 단백질뿐만 아니라, 원핵 유기체의 생체 내에서의 N-글리코실화에 대한 효율로 단백질을 제조하는 수단 및 방법을 기술한다. 추가로, 상기 국제 특허출원은 상기 단백질의 면역원성, 안정성, 생물학적, 예방적 및/또는 치료적 활성을 변경시키기 위해 N-글리칸을 재조합 단백질 내로 효율적으로 도입하는 것, 및 본 발명의 재조합 N-글리코실화된 단백질을 그의 표면 상에서 효율적으로 표시하는 숙주 세포를 제공하는 것을 기술한다. 또한, 상기 국제 특허출원은 하나 이상의 하기 N-글리코실화된 최적화된 아미노산 서열(들)을 포함하는 재조합 N-글리코실화된 단백질을 기술한다: D/E-X-N-Z-S/T(최적화된 컨센서스 서열). 상기 서열에서, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있고, 하나 이상의 상기 N-글리코실화된 부분적 아미노산 서열(들)이 도입된다. 단백질 내로의 특정 부분적 아미노산 서열(들)(최적화된 컨센서스 서열(들))의 도입은 이 도입된 위치들에서 올리고사카릴 트랜스퍼라제에 의해 효율적으로 N-글리코실화된 단백질을 발생시킨다.

상이한 폴리사카라이드들의 생합성은 박테리아 세포에서 보존되어 있다. 폴리사카라이드들은 정의된 특이성을 갖는 상이한 글리코실트랜스퍼라제들에 의해 세포질 막에서 공통된 전구체(활성화된 당 뉴클레오타이드)로부터 담체 지질 상에서 조립된다. 리포폴리사카라이드("LPS")는 그람 음성 박테리아에서만, 예를 들면, 쉬겔라(Shigella) 종, 슈도모나스(Pseudomonas) 종 및 이. 콜라이(ExPEC, EHEC)에서 제공된다.

LPS의 합성은 막의 세포질 면에서 모노사카라이드가 담체 지질 운데카프레닐 포스페이트("Und-P-P")에 부가되는 것으로 개시된다. 항원은 활성화된 당 뉴클레오타이드로부터의 모노사카라이드가 상이한 글리코실트랜스퍼라제들에 의해 순차적으로 부가됨으로써 구축되고, 지질-결합된 폴리사카라이드는 플립페이즈(flippase)에 의해 상기 막을 통과한다. 항원 반복 유닛(unit)은 효소 반응에 의해 중합된다. 그 다음, 폴리사카라이드는 표면으로 수송되는 LPS를 형성하는 라이게이즈(Ligase) WaaL에 의해 지질 A로 전달되는 반면, 캡슐형 폴리사카라이드는 중합 후 담체 지질로부터 방출되고 표면으로 수송된다. 이 폴리사카라이드들의 생합성 경로는 원형질 막공간(periplasm) 내의 상기 폴리사카라이드들을 단백질 담체에 포획하는 LPS 생접합체(bioconjugate)가 생체 내에서 생성될 수 있게 한다.

올리고사카라이드 또는 폴리사카라이드(즉, 당 잔기)와 단백질(즉, 단백질 담체)의 이러한 합성된 결합체는 다수의 박테리아 감염으로부터 보호하기 위한 접합체 백신으로서 사용될 수 있다. 접합체 백신은 박테리아 감염으로부터 보호하는 데에 성공적으로 사용되고 있다. 폴리사카라이드가 T-세포 독립적 면역원이기 때문에 항원성 폴리사카라이드와 단백질 담체의 접합은 보호성 기억 반응을 위해 필요하다. 폴리사카라이드는 폴리사카라이드 및 단백질 담체의 활성화 반응 기를 사용하는 상이한 화학적 방법들에 의해 단백질 담체에 접합된다.

접합체 백신은 박테리아 감염으로부터 보호하기 위해 소아에게 투여될 수 있고, 성인에게 오래 지속되는 면역 반응을 제공할 수 있다. 국제 특허출원 공개 제WO 2009/104074호(페르난데즈(Fernandez) 등)의 구축물(construct)은 동물에서 IgG 반응을 발생시키는 것이 발견되었다. 인간에서 쉬겔라 O-특이적 폴리사카라이드-단백질 접합체 백신에 대한 IgG 반응은 인간에서의 면역 보호와 상관관계를 갖는다는 것이 발견되었다(문헌[Passwell, J.H. et al., "Safety and Imrnunogenicity of Improved Shigella O-Specific Polysaccharide-Protein Conjugate Vaccines in Adults in Israel" Infection and Immunity, 69(3):1351-1357 (Mar. 2001)]). 폴리사카라이드(즉, 당 잔기)는 당 특이적인 단기 면역 반응을 유발한다고 생각된다. 실제로, 인간 면역 시스템은 박테리아의 특정 폴리사카라이드 표면 구조체, 예컨대, O-항원 및 캡슐형 폴리사카라이드에 대한 강한 반응을 발생시킨다. 그러나, 폴리사카라이드에 대한 면역 반응이 IgM 의존적이기 때문에, 상기 면역 시스템은 기억 반응을 발생시키지 못한다. 폴리사카라이드를 보유하는 단백질 담체는, T-세포 의존적이고 면역 시스템이 기억 반응을 발생시키기 때문에 오래 지속되는 보호를 제공하는 IgG 반응을 유발한다.

에스케리치아 콜라이(Escherichia coli; 이. 콜라이(E. coli)) O157은 최근의 모든 용혈-요독 증후군 케이스의 약 3분의 2의 원인인 장출혈 균주이고 심각한 인간 건강 문제를 발생시킨다(문헌[Law, D. (2000) J. App. Microbiol., 88, 729-745; Wang, L., and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551]).

에스케리치아 콜라이 균주 O157은 반복 테트라사카라이드 유닛(4-N-아세틸 퍼로스아민→푸코스→글루코스→GalNAc)(α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc)을 함유하는 O-항원을 생성한다(문헌[Perry, M. B., MacLean, L. and Griffith, D. W. (1986) Biochem. Cell. Biol., 64, 21-28]). 테트라사카라이드는 운데카프레닐 피로포스페이트 상에서 예비조립된다. 이. 콜라이 세포는 내부 원형질막; 스트레스 지탱 펩티도글리칸 층; 및 인지질 내부 단일층, 및 박테리아 LPS로 구성된 외부 단일층으로 구성된 비대칭 외부 막을 함유한다. LPS는 3개의 성분, 즉 지질 A 고착제(anchor), 3-데옥시-D-만노-옥트-2-울로손산 함유 코어 및 O-항원 영역을 함유한다(문헌[Raetz, C. R. H. and Whitfield, C. (2002) Annu. Rev. Biochem., 71, 635-700]; 문헌[Whitfield, C. (2006) Ann. Rev. Biochem. 75, 39-68]; 문헌[Samuel, G. and Reeves, P. R. (2003) Carbohydrate Research, 338, 2503-2519]; 및 박테리아 LPS의 O-항원의 조립에 대한 상기 문헌들 내의 평론 참조).

박테리아 LPS의 O-항원 성분은 3 내지 6개 당 유닛의 반복체를 10 내지 30개 함유하는, 단일 반복 모노사카라이드로 구성된 단독중합체 또는 이종중합체일 수 있는 매우 다양한 큰 폴리사카라이드이다(문헌[Reeves, P. R., Hobbs, M., Valvano, M. A., Skurnik, M., Whitfield, C, Coplin, D., Kido, N., Klena, J., Maskell, D., Raetz, C. R. H., and Rick, P. D. (1996) Trends Microbiol., 4, 495-503]). 따라서, O-항원은 박테리아 세포 표면의 주요 특징이고 병독성 및 병원성의 중요한 결정인자(determinant)를 구성한다(문헌[Law, D. (2000) J. App. Microbiol., 88, 729-745]; 문헌[Spears, K. J., Roe, A. J. and Gaily, D. L. (2006) FEMS Microbiol. Lett., 255, 187-202]; 문헌[Liu, B., Knirel, Y. A., Feng, L., Perepelov, A. V., Senchenkova, S. N., Wang, Q., Reeves, P. R. and Wang, L (2008) FEMS Microbiol. Rev. 32, 627-653]; 문헌[Stenutz, R., Weintraub, A. and Widmalm, G. (2006) FEMS Microbiol. Rev. 30, 382-403]). 독특한 O-항원 구조체에 기인하는 180종 초과의 개별 O-혈청형을 갖는 이. 콜라이 균주들이 동정되었다(문헌[Stenutz, R., Weintraub, A. and Widmalm, G. (2006) FEMS Microbiol. Rev. 30, 382-403]).

O-항원 반복 유닛은 운데카프레닐 피로포스페이트에 부착된 내부 막의 세포질 면 상에서 예비조립된다. 지질-결합된 반복 유닛은 내부 막의 원형질 막공간 표면으로 가로질러 분산되고(플립-플롭(flip-flop)) 외부 막으로의 수송 및 LPS와의 연결(ligation) 전에 중합된다. 대부분의 이종중합체성 O-항원 반복 유닛은 환원 말단에서 N-아세틸글루코스아민("GlcNAc") 또는 N-아세틸갈락토스아민("GalNAc")을 갖는다.

지질 중간체의 생합성은 WecA에 의해 촉진되는, 각각의 당 뉴클레오타이드 유도체로부터 운데카프레닐 모노포스페이트("Und-P")로의 GlcNAc-P 또는 GalNAc-P의 전달에 의해 개시된다고 추정된다(문헌[Samuel, G. and Reeves, P. R. (2003) Carbohydrate Research, 338, 2503-2519]; 문헌[Alexander, D. C. and Valvano, M. A. (1994) J. Bacteriol., 176, 7079-7084]; 문헌[Zhang, L., Radziejewska-Lebrecht, J., Krajewska-Pietrasik, D., Tolvanen, P. and Skurkik, M. (1997) Mol. Microbiol. 23, 63-76]; 문헌[Amor, P. A. and Whitfield, C. (1997) Mol. Microbiol. 26 (145-161)]; 문헌[Wang, L. and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551]). WecA의 GlcNAc-포스포트랜스퍼라제 활성의 성질 및 특이성이 특징 규명되었지만(문헌[Rush, J. S., Rick, P. D. and Waechter, C. J. (1997) Glycobiology, 7, 315-322]), WecA가 GalNAc-P-P-Und의 합성을 촉진한다는 결론은 유전적 연구에 의거한 것이었다(문헌[Wang, L. and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551]). 이러한 초기 유전적 연구는 지질-결합된 테트라사카라이드 중간체의 생합성이 WecA에 의해 촉진되는, UDP-GalNAc로부터 Und-P로의 GalNAc-P의 효소적 전달에 의해 개시된다는 것을 보여주었다(문헌[Wang, L. and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551]). 그러나, WecA가 GalNAc-P 공여체로서 UDP-GalNAc를 사용한다는 것을 입증하는 직접적인 효소학적 증거는 없었다.

나아가, 이. 콜라이 O55 gne 유전자 및 gne1 유전자가 UDP-GlcNAc 4-에피머라제(epimerase)를 코딩한다는 것은 이미 제안되었다(문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625]; 문헌[Guo, H., Yi, W., Li, L. and Wang, P.G. (2007) Biochem. Biophys. Res. Commun., 356, 604-609]). 종래 보고는 이. 콜라이 O55(문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625]) 및 이. 콜라이 O86(문헌[Guo, H., Yi, W., Li, L. and Wang, P.G. (2007) Biochem. Biophys. Res. Commun., 356, 604-609])으로부터 2종의 유전자, 즉 동일한 유전자 과(family) 내의 Z3206 유전자와 100% 동일한 이. 콜라이 O55 gne 및 이. 콜라이 O86 gne1 유전자를 각각 확인하였다.

따라서, 당업자는 Z3206 유전자가 UDP-GlcNAc/UDP-GalNAc 에피머라제도 코딩한다고 생각할 것이다.

놀랍게도, 본 발명자들은 이. 콜라이 O157의 Z3206 유전자에 의해 코딩된 에피머라제가 올리고사카라이드 또는 폴리사카라이드의 형성을 개시하는, 운데카프레닐 피로포스페이트 상의 N-아세틸갈락토스아민("GalNAc")을 합성하는 반응을 촉진한다는 것을 발견하였다.

한 양태에서, 본 발명은 운데카프레닐 피로포스페이트 상의 GalNAc를 합성하는 에피머라제를 포함하는, 폴리사카라이드의 전부 또는 일부를 생성하는 재조합 원핵 생합성 시스템에 관한 것이다. 또한, 본 발명은 환원 말단에서 GalNAc를 갖는 폴리사카라이드의 전부 또는 일부를 합성하는 글리코실트랜스퍼라제를 포함하고, 환원 말단에서 GalNAc를 갖는 항원성 폴리사카라이드의 전부 또는 일부를 합성하는 글리코실트랜스퍼라제를 추가로 포함한다.

또 다른 양태에서, 본 발명은 운데카프레닐 피로포스페이트 상의 GalNAc를 생성하는 에피머라제에 관한 것이고, 추가 양태에서, 상기 에피머라제는 Z3206 유전자에 의해 코딩된다.

추가 양태에서, 본 발명은 올리고사카릴 트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질 담체를 코딩하는 뉴클레오타이드 서열; 하나 이상의 박테리아로부터 유래된 하나 이상의 올리고사카라이드 또는 폴리사카라이드 유전자 클러스터(cluster)(이때, 상기 폴리사카라이드는 환원 말단에서 GalNAc를 함유함); 및 에피머라제를 코딩하는 핵산 서열을 포함하는, N-글리코실화된 단백질의 제조를 위한 발현 시스템에 관한 것이다.

추가 양태에서, 본 발명은 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 에피머라제를 코딩하는 Z3206 유전자를 포함하는 재조합 원핵 생합성 시스템에 관한 것이다.

추가 양태에서, 본 발명은 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 에피머라제를 코딩하는 이. 콜라이 O55 gne 유전자 또는 이. 콜라이 O86 gne1 유전자를 포함하는 재조합 원핵 생합성 시스템에 관한 것이다.

또 다른 양태에서, 본 발명은 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음), 및 환원 말단에서 N-아세틸갈락토스아민을 갖는 글리칸을 포함하는 N-글리코실화된 단백질에 관한 것이다.

또 다른 양태에서, 본 발명은 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 갖는 N-글리코실화된 단백질; 환원 말단에서 N-아세틸갈락토스아민을 갖는 면역원성 글리칸; 및 보강제(adjuvant)를 포함하는 생접합체 백신에 관한 것이다.

추가 양태에서, 본 발명은 환원 말단에서 GalNAc를 함유하는, 하나 이상의 박테리아로부터 유래된 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 조립하는 글리코실트랜스퍼라제; 단백질 담체; 올리고사카릴 트랜스퍼라제; 및 에피머라제를 코딩하는 핵산을 포함하는 숙주 세포에서 N-결합된 글리코실화된 단백질을 제조하는 방법에 관한 것이다.

추가 양태에서, 본 발명은 생접합체 백신을 제조하기 위한 생합성 시스템 및 단백질의 용도에 관한 것이다.

추가 양태에서, 본 발명은 모노사카라이드, 올리고사카라이드 및 폴리사카라이드의 제조 방법에 관한 것이고, 추가 양태에서, 본 발명은 항원성 글리칸 및 N-글리코실화된 단백질의 제조 방법에 관한 것이다.

도 1은 이. 콜라이 O157로부터 수득된 막 분획에 의한 [³H]GlcNAc/GalNAc-P-P-Und 합성의 시간 경과를 보여준다. 이. 콜라이 균주 O157로부터 수득된 막 분획을 37℃에서 표시된 시간 동안 UDP-[³H]GlcNAc와 함께 항온처리하였다. [³H]지질 생성물을 추출하고, [³H]GlcNAc-P-P-Und(○) 및 [³H]GalNAc-P-P-Und(●) 내로의 [³H]GlcNAc의 도입을 실시예 2에 기재된 바와 같이 분석하였다.
도 2는 GlcNAc-P-P-Und로부터 GalNAc-P-P-Und를 형성하는 제안된 생합성 경로를 보여준다.
도 3은 이. 콜라이 균주 O157로부터 수득된 막 분획에 의해 합성된 [³H]GalNAc-P-P-Und의 정제 및 특징 규명을 보여준다. 이. 콜라이 O157로부터 수득된 막 분획을 UDP-[³H]GlcNAc와 함께 항온처리하고, [³H]GalNAc 지질을 실시예 3에 기재된 바와 같이 정제하였다. 도 3a는 DEAE-셀룰로스 상에서의 정제 후 보레이트-함침된 실리카 겔 G(콴텀(Quantum) 1) 상에서의 [³H]HexNAc 지질의 분취 박층 크로마토그램을 보여준다. 도 3b는 패널 A에서 분취 플레이트로부터의 회수 후 보레이트-함침된 실라카 겔 G(베이커(Baker) Si250) 상에서의 정제된 [³H]GalNAc-P-P-Und의 박층 크로마토그래피를 보여준다. 도 3c는 도 3b에서 정제된 [³H]GalNAc-P-P-Und의 약산 가수분해 후 회수된 [³H]-아미노 당의 하강 종이 크로마토그램(보레이트-함침된 와트만(Whatman) 제1번 종이)을 보여준다. 도 3d는 도 3c의 [³H]-아미노 당을 NaBH₄로 환원시켜 제조한 [³H]HexNAc-알디톨(alditol)의 하강 종이 크로마토그램(와트만 제3MM번)을 보여준다.
도 4는 이. 콜라이 21546 세포, 및 pMLBAD:Z3206으로 형질전환시킨 후 이. 콜라이 21546 세포의 대사적 표지(metabolic labeling)를 보여준다. 이. 콜라이 21546(도 4a) 및 이. 콜라이 21546:pMLBAD/Z3206(도 4b)을 37℃에서 [³H]GlcNAc로 5분 동안 대사적으로 표지하였다. [³H]GlcNAc/GalNAc-P-P-Und를 추출하고, 수용성 오염물질을 제거하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. 방사성 지질을 바이오스캔(Bioscan) 크로마토스캐너를 이용하여 검출하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 5는 이. 콜라이 균주로부터 수득된 막 분획을 UDP-[³H]GlcNAc와 함께 항온처리하여 형성한 [³H]GlcNAc/GalNAc-P-P-Und의 박층 크로마토그래피를 보여준다. 이. 콜라이 균주 K12(도 5a), O157(도 5b), 21546(도 5c) 및 21546:pMLBAD/Z3206(도 5d)으로부터 수득된 막 분획을 37℃에서 UDP-[³H]GlcNAc와 함께 10분 동안 항온처리하고, [³H]지질 생성물을 추출하고, 분배(partitioning)를 통해 수용성 오염물질을 제거하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 6은 UMP와의 항온처리에 의한 GlcNAc-P의 방출을 보여준다. 이. 콜라이 21546:Z3206으로부터 수득된 막 분획을 37℃에서 UDP-[³H]GlcNAc와 함께 10분 동안 예비항온처리하여 GlcNAc-P-P-Und를 효소적으로 표지한 후(도 6a), 1 mM UMP와의 제2 항온처리 기간이 1분(도 6b) 또는 2분(도 6c) 동안 포함되었다. 표시된 항온처리 기간 후, [³H]GlcNAc/GalNAc-P-P-Und를 추출하고 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 7은 Z3206을 발현하는 균주 21546으로부터 수득된 막 분획에 의해 촉진되는, 관련된 [³H]HexNAc-P-P-Und 생성물로의 외인성 [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und의 전환을 보여준다. 이. 콜라이 균주 21546(도 7b 및 7e) 및 21546:pMLBAD/Z3206(도 7c 및 도 7f)으로부터 수득된 막 분획들을 37℃에서 정제된 [³H]GlcNAc-P-P-Und(도 7a, 도 7b 및 도 7c) 또는 [³H]GalNAc-P-P-Und(도 7d, 도 7e 및 도 7f에서의 패널)(1% 트리톤 X-100에서 초음파에 의해 분산됨)와 함께 1분 동안 항온처리하였다. [³H]GlcNAc/GalNAc-P-P-Und를 추출하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 용해하고, 바이오스캔 AR2000 라디오크로마토스캐너(radiochromatoscanner)를 이용하여 검출하였다.
도 8은 비글리코실화된 AcrA 단백질 및 글리코실화된 AcrA 단백질의 SDS-PAGE 분석을 보여준다. AcrA 발현 플라스미드, 및 pMLBAD:Z3206(레인 1), pMLBAD:gne(레인 2) 또는 대조군 벡터 pMLBAD(레인 3)에 의해 보완된(complemented) pgl 오페론 Δ gne를 보유하는 이. 콜라이 DH5α 세포로부터 제조된 원형질 막공간 추출물을 10% SDS-PAGE로 분리하고 니트로셀룰로스 막으로 옮겼다. AcrA 및 이의 글리코실화된 형태를 항-AcrA 항혈청으로 검출하였다. 비글리코실화된 AcrA(AcrA) 및 글리코실화된 AcrA(gAcrA)에 상응하는 밴드의 위치가 표시되어 있다.
도 9는 문헌[Liu B et al., Structure and genetics of Shigella O antigens FEMS Microbiology Review, 2008. 32: p. 27]에 의해 확인된 유전자들을 보여준다.
도 10은 쉬겔라 플렉스네리(Shigella flexneri) 6 O-항원을 합성하는 데 필요한 유전자들을 함유하는 DNA 영역을 보여주는 도면이다.
도 11은 이. 콜라이에서 쉬겔라 플렉스네리 6 O-항원의 발현을 보여준다. LPS는 은 염색에 의해 가시화되었거나, 또한 니트로셀룰로스 막으로의 전달 및 쉬겔라 플렉스네리 6에 대한 항체에 의한 검출에 의해 가시화되었다.
도 12는 O-항원의 HPLC를 보여준다. 쉬겔라 플렉스네리 - Z3206을 함유하는 이. 콜라이 세포(SCM3), 쉬겔라 플렉스네리 + Z3206을 함유하는 이. 콜라이 세포(SCM3) 또는 빈 이. 콜라이 세포(SCM3)의 LLO 분석을 보여준다.
도 13은 EPA, pglB 및 쉬겔라 플렉스네리 6 O-항원 +/- Z3206을 발현하는 이. 콜라이 세포로부터 수득된 니켈 정제된 단백질의 웨스턴 블롯을 보여준다.

본 발명은 환원 말단에서 N-아세틸갈락토스아민을 갖는 올리고사카라이드 또는 폴리사카라이드를 합성하는 에피머라제를 코딩하는 핵산, 및 글리칸의 환원 말단에서 N-아세틸갈락토스아민을 갖는 N-글리코실화된 단백질을 코딩하는 핵산을 포함하는 재조합 원핵 생합성 시스템을 포함한다.

용어 "부분적 아미노산 서열(들)"은 "최적화된 컨센서스 서열(들)" 또는 "컨센서스 서열(들)"로도 지칭된다. 최적화된 컨센서스 서열은 통상의 컨센서스 서열 "Ν-X-S/T"보다 훨씬 더 효율적으로 올리고사카릴 트랜스퍼라제("OST," "OTase")에 의해 N-글리코실화된다.

일반적으로, 용어 "재조합 N-글리코실화된 단백질"은 상기 단백질을 코딩하는 핵산을 천연적으로 포함하지 않는 숙주 세포에서 생성된 임의의 폴리펩타이드 또는 올리고펩타이드를 의미한다. 본 발명의 내용에서, 이 용어는 원핵 숙주 세포, 예를 들면, 에스케리치아 종, 캄필로박터 종, 살모넬라(Salmonella) 종, 쉬겔라 종, 헬리코박터(Helicobacter) 종, 슈도모나스 종, 바실러스(Bacillus) 종, 및 추가 실시양태에서 에스케리치아 콜라이, 캄필로박터 제주니, 살모넬라 티피뮤리움(Salmonella typhimurium) 등에서 재조합적으로 생성된 단백질을 의미하는 것으로서, 이때 상기 단백질을 코딩하는 핵산은 상기 숙주 세포 내로 도입되었고, 코딩된 단백질은 천연적으로 발생되었거나 상기 숙주 세포 내로 재조합적으로 도입된 트랜스퍼라제 효소인 OTase에 의해 N-글리코실화된다.

아미노산에 대한 국제적으로 승인된 1문자 코드에 따라, 약어 D, E, Ν, S 및 T는 각각 아스파르트산, 글루탐산, 아스파라긴, 세린 및 트레오닌을 표시한다.

본 발명에 따른 단백질은 단백질 내로 도입되고 N-글리코실화된 하나 이상의 최적화된 컨센서스 서열(들) D/E-X-N-Z-S/T를 포함한다. 따라서, 본 발명의 단백질은 최적화된 컨센서스 서열을 함유하되 임의의 추가의(도입된) 최적화된 컨센서스 서열을 포함하지 않는 천연적으로 발생하는 캄필로박터 제주지 N-당단백질과 상이하다.

최적화된 컨센서스 서열의 도입은 하나 이상의 아미노산의 부가, 결실 및/또는 치환에 의해 달성될 수 있다. 최적화된 컨센서스 서열을 도입하기 위한 하나 이상의 아미노산의 부가, 결실 및/또는 치환은 본 발명에 비추어 볼 때 당업자에게 잘 공지되어 있을 화학적 합성 방법, 예컨대, 고체상 보조 화학적 펩타이드 합성에 의해 달성될 수 있다. 대안적으로, 보다 큰 폴리펩타이드의 경우 바람직하게는, 본 발명의 단백질은 본 발명에 비추어 볼 때 당업계의 표준 기법일 수 있는 재조합 기법에 의해 제조될 수 있다.

본 발명의 단백질은 임의의 숙주에서 고효율로 제조될 수 있다는 이점을 갖는다. 본 발명의 한 실시양태에서, 상기 숙주는 캄필로박터 종, 예를 들면, 캄필로박터 제주니로부터 유래된 기능적 pgl 오페론을 포함한다. 추가 실시양태에서, 본 발명의 실시를 위한 캄필로박터 종으로부터 유래된 올리고사카릴 트랜스퍼라제는 캄필로박터 콜라이(Campylobacter coli) 또는 캄필로박터 라리(Campylobacter lari)로부터 유래된다. 본 발명에 비추어 볼 때, 올리고사카릴 트랜스퍼라제는 당업자에게 자명할 것이다. 예를 들면, 올리고사카릴 트랜스퍼라제는 참고문헌, 예컨대, 문헌[Szymanski, C.M. and Wren, B.W. (2005) Protein glycosylation in bacterial mucosal pathogens, Nat. Rev. Microbiol. 3:225-237]에 개시되어 있다. 기능적 pgl 오페론은 상기 원핵 숙주가 캄필로박터 종, 또는 예를 들면, 캄필로박털 제주니인 경우 천연적으로 존재할 수 있다. 그러나, 당업계에서 이미 입증된 바와 같이 그리고 상기에서 언급된 바와 같이, pgl 오페론은 세포 내로 전달될 수 있고 상기 새로운 세포 환경에서 기능성을 유지할 수 있다.

용어 "캄필로박터 종, 바람직하게는 캄필로박터 제주니로부터 유래된 기능적 pgl 오페론"은 캄필로박터 종, 예를 들면, 캄필로박터 제주니의 기능적 올리고사카릴 트랜스퍼라제(OTase)를 코딩하는 핵산, 및 지질 담체 상에서 올리고사카라이드를 조립할 수 있는 하나 이상의 특정 글리코실트랜스퍼라제를 코딩하는 핵산으로 구성된 클러스터를 의미하고, 이때 상기 올리고사카라이드는 OTase에 의해 상기 지질 담체로부터 하나 이상의 최적화된 아미노산 서열(들) D/E-X-N-Z-S/T를 갖는 표적 단백질로 전달될 수 있다. 본 발명의 내용에서 용어 "캄필로박터 종, 바람직하게는 캄필로박터 제주니로부터 유래된 기능적 pgl 오페론"은 단일 전사 유닛으로서의 오페론을 의미하는 것이 아님을 이해해야 한다. 용어는 단지 하나의 숙주 세포에서 재조합 단백질의 N-글리코실화를 위한 기능적 성분들의 존재를 필요로 한다. 이 성분들은 하나 이상의 분리된 mRNA로서 전사될 수 있고 함께 또는 따로 조절될 수 있다. 예를 들면, 상기 용어는 하나의 숙주 세포 내의 게놈 DNA 및 플라스미드(들)에 위치하는 기능적 성분들도 포함한다. 효율성을 위해, 한 실시양태에서, 기능적 pgl 오페론의 모든 성분들은 동시에 조절되고 발현된다.

올리고사카릴 트랜스퍼라제는 일부 실시양태에서 캄필로박터 종으로부터 유래될 수 있고, 다른 실시양태에서 캄필로박터 제주니로부터 유래될 수 있다. 추가 실시양태에서, 올리고사카릴 트랜스퍼라제는 올리고사카릴 트랜스퍼라제를 갖는 것으로서 당업자에게 공지되어 있는 다른 유기체, 예를 들면, 올리넬라(Wolinella) 종, 및 진핵 유기체로부터 유래될 수 있다.

지질 담체 상에서 올리고사카라이드를 조립할 수 있는 하나 이상의 특정 글리코실트랜스퍼라제는 숙주 세포로부터 유래될 수 있거나 또는 상기 숙주 세포 내로 재조합적으로 도입될 수 있으나, 유일한 기능적 한계는 상기 글리코실트랜스퍼라제에 의해 조립된 올리고사카라이드가 OTase에 의해 지질 담체로부터 하나 이상의 최적화된 컨센서스 서열을 갖는 표적 단백질로 전달될 수 있다는 것이다. 따라서, 특정 글리코실트랜스퍼라제를 천연적으로 포함하는 숙주 세포의 선별 및/또는 상기 숙주에 천연적으로 존재하는 특정 글리코실트랜스퍼라제의 치환뿐만 아니라 이종 특정 글리코실트랜스퍼라제의 도입은 당업자가 본 발명의 단백질의 최적화된 N-글리코실화 컨센서스 부위에 결합된 N-글리칸을 변경할 수 있게 할 것이다.

결과로서, 본 발명은 본 발명의 단백질 상의 N-글리칸 패턴의 개별 디자인을 제공한다. 따라서, 상기 단백질은 생물학적 요건, 약학적 요건 및 정제 요건을 충족시키도록 그들의 N-글리칸 패턴에서 개별화될 수 있다.

본 발명의 실시양태에서, 상기 단백질은 하나 이상, 예컨대, 2개 이상, 3개 이상 또는 5개 이상의 상기 N-글리코실화된 최적화된 아미노산 서열을 포함할 수 있다.

본 발명의 단백질에서 하나 이상의 N-글리코실화된 최적화된 아미노산 서열(들)의 존재는 그들의 면역원성의 증가, 그들의 안정성의 증가, 그들의 생물학적 활성에 대한 영향, 그들의 생물학적 반감기의 연장 및/또는 그들의 정제의 단순화에 유리할 수 있다.

최적화된 컨센서스 서열은 위치(들) X 및 Z에서 프롤린을 제외한 임의의 아미노산을 포함할 수 있다. 용어 "임의의 아미노산"은 일반 천연 아미노산 및 희귀 천연 아미노산뿐만 아니라 상기 최적화된 컨센서스 서열이 OTase에 의해 N-글리코실화되게 할 수 있는 합성 아미노산 유도체 및 유사체도 포괄한다. 천연적으로 발생하는 일반 아미노산 및 희귀 아미노산이 X 및 Z를 위해 바람직하다. X 및 Z는 동일하거나 상이할 수 있다.

X 및 Z가 본 발명에 따른 단백질에서 각각의 최적화된 컨센서스 서열에 대해 상이할 수 있다는 것이 주목된다.

최적화된 컨센서스 서열에 결합된 N-글리칸은 OTase에 의한 전달을 위해 지질 담체 상에서 올리고사카라이드를 조립할 때 특정 글리코실트랜스퍼라제 및 이들의 상호작용에 의해 결정될 것이다. 본 발명에 비추어 볼 때, 당업자는 원하는 숙주 세포에 존재하는 특정 글리코실트랜스퍼라제의 종류(들) 및 양을 변경함으로써 N-글리칸을 다자인할 수 있다.

본원에서 사용된 바와 같이, "모노사카라이드"는 하나의 당 잔기를 의미한다. "올리고사카라이드 및 폴리사카라이드"는 2개 이상의 당 잔기를 의미한다. 본원에서 사용된 바와 같이, 용어 "글리칸"은 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드를 의미한다. 본원에서 "N-글리칸"은 N-글리코사이드 결합을 통해 단백질 내의 아스파라긴 잔기의 ε-아마이드 질소에 결합되어 있는, 변경가능한 조성의 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드로서 정의된다. 한 실시양태에서, OTase에 의해 전달되는 N-글리칸은 그람 음성 또는 양성 박테리아의 세포질 막에 존재하는 운데카프레놀 피로포스페이트("Und-P-P") 지질-고착제 상에서 조립된다. N-글리칸은 O-항원, O-폴리사카라이드 및 펩타이도글리칸의 합성에 관여한다(문헌[Bugg, T. D., and Brandish, P. E. (1994). From peptidoglycan to glycoproteins: common features of lipid-linked oligosaccharide biosynthesis. FEMS Microbiol Lett 119, 255-262]; 문헌[Valvano, M. A. (2003). Export of O-specific lipopolysaccharide. Front Biosci 8, s452-471]).

지질-결합된 반복 테트라사카라이드(4-N-아세틸 퍼로스아민→푸코스→글루코스→GalNAc)의 생합성이 WecA에 의한 GalNAc-P-P-Und의 형성에 의해 개시되는지를 확인하기 위한 연구를 수행하였다. 이. 콜라이 균주 K12, O157 및 PR4019(WecA 과발현 균주)로부터 수득된 막 분획을 UDP-[³H]GalNAc와 함께 항온처리하였을 때, [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und의 효소적 합성이 검출되지 않았다. 그러나, 균주 O157로부터 수득된 막 분획을 UDP-[³H]GlcNAc와 함께 항온처리하였을 때, [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und의 화학적 성질 및 크로마토그래피 성질을 갖는 2종의 효소적으로 표지된 생성물이 관찰되었는데, 이것은 균주 O157이 GlcNAc-P-P-Und와 GalNAc-P-P-Und를 상호전환시킬 수 있는 에피머라제를 함유한다는 것을 확인시켜주었다. 또한, 에피머라제의 존재는 외인성 [³H]GlcNAc-P-P-Und가 균주 O157로부터 수득된 막과 함께 항온처리되었을 때 [³H]GalNAc-P-P-Und로 전환되었다는 것을 보여줌으로써 확인되었다. 균주 O157을 [³H]GlcNAc로 대사적으로 표지하였을 때, [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und 둘 다 검출되었다. Z3206 유전자를 사용한 이. 콜라이 균주 21546의 형질전환은 이 세포들이 생체 내 및 시험관 내에서 GalNAc-P-P-Und를 합성할 수 있게 하였다. 에피머라제 반응의 가역성은 균주 O157로부터 수득된 막을 외인성 [³H]GalNAc-P-P-Und와 함께 항온처리하였을 때 [³H]GlcNAc-P-P-Und가 재형성되었다는 것을 보여줌으로써 입증되었다. Z3206이 이. 콜라이 내의 캄필로박터 제주니 N-글리코실화 시스템의 발현에서 gne 유전자의 상실을 보완하지 못한다는 것은 Z3206이 UDP-GlcNAc/UDP-GalNAc 에피머라제로서 작용하지 않는다는 것을 암시하였다. 이 결과들에 근거할 때, GalNAc-P-P-Und가 이. 콜라이 O157에서 WecA에 의한 GlcNAc-P-P-Und의 형성 후 GlcNAc-P-P-Und 에피머라제에 의해 가역적으로 합성된다는 것이 확인되었다.

GalNAc-P-P-Und 합성이 WecA에 의해서가 아니라 종래 공지되지 않은 일부의 기작에 의해 촉진된다는 것을 확인하기 위해 이. 콜라이 O157 O-항원 서브유닛 조립의 개시 반응을 연구하였다. 본원에 제시된 증거는 GalNAc-P-P-Und가 WecA에 의해 촉진되는 UDP-GalNAc로부터의 GalNAc-P의 전달에 의해 합성되는 것이 아니라 이. 콜라이 O157 내의 Z3206 유전자에 의해 코딩된 에피머라제에 의해 촉진되는 GlcNAc-P-P-Und의 4-OH의 가역적 에피머화에 의해 합성된다는 것을 보여준다.

따라서, 본 발명은 중요한 박테리아 세포 표면 성분의 조립을 위한 신규 생합성 경로뿐만 아니라 GalNAc-P-P-Und의 합성을 위한 신규 생합성 경로를 포괄한다. 본 발명의 추가 실시양태는 항미생물제를 위한 신규 표적으로서의 박테리아 에피머라제를 포함한다.

이. 콜라이 O157은 반복 테트라사카라이드 구조(4-N-아세틸 퍼로스아민→푸코스→글루코스→GalNAc)를 갖는 O-항원을 합성한다. 종래 유전적 연구(문헌[Wang, L. and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551])와 대조적으로, 본원은 지질-결합된 테트라사카라이드 중간체의 생합성이 WecA에 의해 촉진되는, UDP-GalNAc로부터 Und-P로의 GalNAc-P의 효소적 전달에 의해 개시되지 않는다는 것을 보여준다. 상동성 검색에 의해 수득된 후 유전적, 효소학적 및 대사적 표지 실험의 결과에 의해 확인된, 본원에 기재된 본 발명은 WecA가 기질로서 UDP-GalNAc를 사용하지 않고, WecA가 균주 O157 내의 Z3206 유전자에 의해 코딩된 에피머라제에 의해 GalNAc-P-P-Und로 가역적으로 전환되는 GlcNAc-P-P-Und를 합성하는 데 필요하다는 것을 입증한다.

본 발명의 Z3206 유전자는 환원 말단에서 GalNAc 잔기를 함유하는 표면 O-항원 반복 유닛을 생성하는 여러 균주들에 존재하는 유전자 과에 속한다(표 1). Z3206 유전자 서열은 서열번호 1에 나타나 있다. 종래 보고는 이. 콜라이 O55 (문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625]) 및 이. 콜라이 O86(문헌[Guo, H., Yi, W., Li, L. and Wang, P. G. (2007) Biochem. Biophys. Res. Comm., 356, 604-609])으로부터 2종의 유전자, 즉 Z3206 유전자와 100% 동일한 이. 콜라이 O55 gne 및 이. 콜라이 O86 gne1을 각각 확인하였다(표 1). 이. 콜라이 O55 gne 유전자 서열은 서열번호 3에 나타나 있고, 이. 콜라이 O86 gne1 유전자 서열은 서열번호 5에 나타나 있다.

환원 말단에서 GalNAc를 갖는 O-항원 쇄를 발현하는 박테리아 균주들에서 Z3206 유전자의 상관관계

	Z3206과의 % 동일성	O-항원 반복 유닛의 환원 말단에서 GalNAc
이. 콜라이 O55 gne(서열번호 3)	100	존재
이. 콜라이 O86 gne1(서열번호 5)	100	존재
쉬겔라 보이디이(Shigella boydii) O18 gne(서열번호 7)	88	존재
살모넬라 엔테리카(Salmonella enterica) O30 gne(서열번호 9)	94	존재
캄필로박터 제주니 gne(서열번호 11)	21	부재
이. 콜라이 K12 galE(서열번호 13)	27	부재
이. 콜라이 O86 gne2(서열번호 15)	18	존재

따라서, 본 발명자들은 이. 콜라이 O55 gne 및 이. 콜라이 O86 gne1도 환원 말단에서 GalNAc를 갖는 O-항원 반복 유닛을 생성하는 균주 O55 및 O86에서 각각 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시킬 수 있는 에피머라제를 코딩한다는 결론을 내렸다(표 1).

이 연구에서 2종의 실험적 방법은 Z3206 단백질이 균주 O157에서 UDP-GalNAc로의 UDP-GlcNAc의 에피머화를 촉진하지 않는다는 것을 보여준다. 먼저, 균주 O157로부터 수득된 막을 [³H]UDP-GalNAc와 함께 항온처리하였을 때, [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und 둘 다 검출되지 않았다(표 3). Z3206이 [³H]UDP-GlcNAc로의 [³H]UDP-GalNAc의 전환을 촉진하는 경우, [³H]GlcNAc-P-P-Und가 관찰될 것으로 예측되었다. 둘째, 본 발명자들은 헤마글루티닌 태그로 표지된(hemagglutinin-tagged) Z3206이 UDP-GalNAc 의존적 캄필로박터 제주니 N-글리코실화 레포터(rerporter) 시스템을 보완할 수 없다는 것을 보여준다(도 8).

또한, 조질 추출물을 UDP-GalNAc와 함께 항온처리하고, 산 가수분해 후 p-다이메틸아미노벤즈알데하이드와의 반응성의 증가를 측정하여 UDP-GlcNAc로의 전환을 간접적으로 분석함으로써, 에피머라제 활성에 대하여 균주 O55로부터 유래된 이. 콜라이 O55 gne 유전자(문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625])를 분석하였다. 두 연구에서, 생성물의 형성은 당 뉴클레오타이드 최종 생성물의 명확한 특징 규명에 근거한 것이 아니라, p-다이메틸아미노벤즈알데하이드와의 반응성의 변화에 근거하였다. 90% 순수한 폴리히스티딘 태그로 표지된 이. 콜라이 O86 gne1이 커플링된 분석에서 Gne2에 비해 상대적으로 낮은 수준의 UDP-글루코스 에피머라제 활성을 갖는다는 것도 밝혀졌다.

따라서, 본 발명의 한 실시양태는 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 Z3206 유전자, 이. 콜라이 O55 gne 유전자 또는 이. 콜라이 O86 gne1 유전자를 함유하는 재조합 원핵 생합성 시스템에 관한 것이다.

2개의 GalNAc 잔기를 함유하는 O-항원을 합성하는 이. 콜라이 O86(아마도 추가의 비환원 말단 GalNAc에 대한 글리코실 공여체로서 UDP-GalNAc를 필요로 할 것임)도 O-항원 유전자 클러스터 내에 gne2로 지칭되는 추가의 GlcNAc 4-에피머라제 유전자를 보유한다는 것은 의미 있다(문헌[Guo, H., Yi, W., Li, L. and Wang, P. G. (2007) Biochem. Biophys. Res. Commun., 356, 604-609]). 이 추가의 에피머라제 유전자는 콜란산(colanic acid) 유전자 클러스터의 galE 유전자에 대한 높은 상동성을 갖고 UDP-GalNAc를 합성할 수 있는 UDP-GlcNAc 4-에피머라제인 듯하다.

Z3206 유전자는 GalNAc로 개시되는 이. 콜라이 O-혈청형에서 고도로 보존되어 있는 듯하다. 최근 연구에서, 확립된 O-항원 반복 유닛 구조를 갖는 62종의 이. 콜라이 균주들을 이. 콜라이 O157 Z3206 유전자를 특이적으로 검출하도록 디자인된 뉴클레오타이드 프라이머를 사용하는 중합효소 연쇄 반응 기초 방법을 이용하여, Z3206의 발현에 대해 스크리닝하였다(문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625]). 이 연구에서, Z3206은 GalNAc를 함유하는 것으로 공지되어 있는 22종의 이. 콜라이 균주들 중 16종의 균주들, 및 GalNAc를 결여하는 40종의 균주들 중 단지 4종의 균주들에서 검출되었다. 뿐만 아니라, UDP-GlcNAc 4-에피머라제 활성을 갖는 대안적 에피머라제(이. 콜라이 O113의 GalE 유전자)를 검출하도록 디자인된 프라이머를 사용한 22종의 GalNAc 함유 균주들의 유사한 스크리닝은 이 유전자를 보유하는 균주를 전혀 검출하지 못하였는데, 이것은 Z3206이 이. 콜라이의 O-항원 반복 유닛에서의 환원 말단 GalNAc의 존재와 가장 일반적으로 관련되어 있는 GlcNAc 4-에피머라제 유전자라는 것을 보여준다.

다양한 웹 기초 위상 예측 알고리즘에 의한 Z3206 단백질 서열의 분석은 Z3206 단백질이 높은 소수성을 나타내지 않는다는 것을 보여준다. TMPred(문헌[Hofmann, K., and Stoffel, W. (1993) Biol. Chem. Hoppe-Seyler 374, 166 (abstr.)])가 단일 약한 N-말단 경막 나선을 예측하였지만, 대다수의 위상 예측 알고리즘들은 Z3206이 가용성 37 kDa 단백질임을 보여준다. 그러나, 헤마글루티닌 태그로 표지된 Z3206을 발현하는 이. 콜라이 세포로부터 수득된 세포 분획의 SDS-PAGE 후 웨스턴 블롯팅은 상기 태그로 표지된 단백질이 상기 세포의 저장성(hypotonic) 용해 후 미립자 분획과 회합되어 있다는 것을 보여준다. 예비 실험은 상기 단백질이 막 분획을 1 M KCl과 함께 항온처리한 후 미립자 분획과 회합된 상태로 남아 있으나, 0.1% 트리톤(Triton) X-100과의 항온처리에 의해 활성 형태로 가용화된다는 것을 보여준다.

이. 콜라이 O157 Z3206은 양성자 추출 및 공여에 관여하는 NAD(P) 결합 포켓(문헌[Allard, S. T. M., Giraud, M. F., and Naismith, J. H. (2001) Cell. Mol. Life Sci. 58, 1650-1655]) 및 보존된 SX ₂₄YX ₃K 서열과 일치하는 GXXGXXG 모티프(로스만 폴드(Rossman fold))를 포함하는 옥시도-리덕타제(oxido-reductase)의 단쇄 데하이드로게나제(dehydrogenase)/리덕타제 과에 대한 상당한 서열 상동성을 나타낸다(문헌[Field, R. A. and Naismith, J. H. (2003) Biochemistry 42, 7637-7647]). 단쇄 데하이드로게나제/리덕타제 과의 또 다른 구성원인 UDP-Glc 4-에피머라제의 결정 구조에 근거한 분자 모델링은 하이드라이드 추출 후 4-케토 중간체가 UDP의 β 포스페이트 주변을 회전하여 케토 중간체의 반대 면을 제시하고 반대 면으로부터의 하이드라이드의 재삽입을 허용하여 탄소 4에서 하이드록실의 배치를 역전시킨다는 것을 암시한다. 이 보존된 서열들의 존재는 Z3206이 유사한 기작을 통해 작용할 것임을 암시한다. 도 7에서 보이는 바와 같이, 에피머라제 생성물의 평형 분포가 GlcNAc-P-P-Und의 형성에 유리한 듯하지만, O-항원 반복 유닛 조립을 위한 GalNAc-P-P-Und의 사용은 질량 작용을 통해 에피머화 반응을 GalNAc-P-P-Und 쪽으로 유도할 것이다.

폴리이소프레노이드 지질 중간체의 글리코실 부분의 에피머화는 사실상 널리 보고되어 있지 않다. 한 종래 연구에서, 마이코박테리아에서 아라비노갈락탄 생합성의 아라비노실 공여체인 아라비노실-P-데카프레놀을 형성하는 리보실-P-데카프레놀의 2-에피머화가 보고되었다(문헌[Mikusova, K., Huang, H., Yagi, T., Holsters, M., Vereecke, D., D'Haeze, W., Scherman, M. S., Brennan, P. J., McNeil, M. R., and Crick, D. C. (2005) J. Bacteriol. 187, 8020-8025]). 아라비노실-P-데카프레놀은 2종의 마이코박테리아 단백질인 Rv3790 및 Rv3791을 필요로 하는 2-단계 산화/환원 반응을 통해 형성된다. 에피머화가 NAD 및 NADP의 첨가에 의해 적당하게 자극되었지만, Rv3790 및 Rv3791 둘 다 단쇄 데하이드로게나제/리덕타제 과의 특징인 로스만 폴드 또는 SX ₂₄YXXXK 모티프를 함유하지 않는다(문헌[Allard, S. T. M., Giraud, M.-F. and Naismith, J. H. (2001) Cell. Mol. Life Sci. 58, 1650-1655]; 문헌[Field, R. A. and Naismith, J. H. (2003) Biochemistry 42, 7637-7647]).

요약하건대, GlcNAc-P-P-Und의 에피머화를 통해 GalNAc-P-P-Und를 형성하는 신규 생합성 경로가 기재된다.

여러 항생제들이 GlcNAc-P-P-Und의 합성을 억제하는 것으로 밝혀져 있지만, 이들은 단백질 N-글리코실화 경로의 개시 돌리콜(dolichol)-결합된 중간체인 GlcNAc-P-P-돌리콜의 합성도 차단하기 때문에 그들의 유용성에서 제한된다. GlcNAc-P-P-돌리콜이 박테리아 당지질 중간체인 GlcNAc-P-P-Und의 구조적으로 관련된 포유동물 대응물이지만, 진핵세포에서 GlcNAc-P-P-돌리콜을 GalNAc-P-P-돌리콜로 전환시키는 유사한 에피머화 반응에 대한 증거는 없다. 따라서, 이것은 환원 말단에서 GalNAc를 함유하는 표면 O-항원이 병리학적 과정에 관여하는 균주에서 O-항원 합성이 박테리아 에피머라제를 억제함으로써 잠재적으로 차단될 수 있는 가능성을 증가시킨다.

본 발명의 한 실시양태는 이. 콜라이 O157에서 GlcNAc-P-P-Und(N-아세틸글루코스아미닐피로포스포릴운데카프레놀)를 GalNAc-P-P-Und(N-아세틸갈락토스아미닐피로포스포릴운데카프레놀)로 전환시키는 에피머라제를 포함한다. 본 발명의 추가 예시적 양태는 환원 말단에서 GalNAc를 갖는 지질-결합된 반복 테트라사카라이드의 합성의 개시를 포함한다.

본 발명의 또 다른 양태의 근거는 캄필로박터 제주니가 일반적인 N-결합된 단백질 글리코실화 시스템을 함유한다는 발견을 포함한다. 캄필로박터 제주니의 다양한 단백질들이 헵타사카라이드에 의해 변경될 수 있는 것으로 밝혀졌다. 이 헵타사카라이드는 특정 글리코실트랜스퍼라제에 의해 촉진되는 뉴클레오타이드 활성화된 모노사카라이드의 단계적 부가에 의해 내부 막의 세포질 면에서 담체 지질인 운데카프레닐 피로포스페이트 상에서 조립된다. 그 후, 지질-결합된 올리고사카라이드는 플립페이즈, 예를 들면, PglK에 의해 주변 세포질 내로 플립-플롭된다(가로질러 분산됨). N-결합된 단백질 글리코실화의 최종 단계에서, 올리고사카릴 트랜스퍼라제(예를 들면, PglB)는 올리고사카라이드가 상기 담체 지질로부터 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음) 내의 아스파라긴(Asn) 잔기로 전달되는 것을 촉진한다. 헵타사카라이드에 대한 글리코실화 클러스터는 이. 콜라이 내로 성공적으로 전달되었고, 캄필로박터의 N-결합된 당단백질이 생성되었다.

PglB가 지질-결합된 당 기질에 대한 엄격한 특이성을 나타내지 않는다는 것이 입증되었다. 운데카프레닐 피로포스페이트 상에서 조립된 항원성 폴리사카라이드는 원형질 막공간에서 PglB에 의해 포획되고 단백질 담체로 전달된다(문헌[Feldman, 2005; Wacker, M., et al., Substrate specificity of bacterial oligosaccharyltransferase suggests a common transfer mechanism for the bacterial and eukaryotic systems. Proc. Natl. Acad. Sci. U.S.A., 2006. 103(18): p. 7088-93]). 효소는 운데카프레닐 피로포스페이트(UPP) 결합된 올리고사카라이드가 환원 말단에서 N-아세틸화된 헥소스아민을 함유하는 경우, 상기 운데카프레닐 피로포스페이트(UPP)-결합된 올리고사카라이드의 다양한 어레이를 또한 전달할 것이다. pglB에 대한 뉴클레오타이드 서열 및 PglB에 대한 아미노산 서열은 국제 특허출원 공개 제WO 2009/104074호에서 공개되어 있다.

따라서, 본 발명의 한 실시양태는 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음); 및 환원 말단에서 N-아세틸갈락토스아민을 갖고 N-글리코사이드 결합에 의해 상기 하나 이상의 도입된 컨센서스 서열 각각에 N-결합된 올리고사카라이드 또는 폴리사카라이드를 포함하는, 재조합 N-글리코실화된 단백질을 포함한다.

추가 실시양태에서, 본 발명은 운데카프레닐 피로포스페이트 상에서 N-아세틸갈락토스아민("GalNAc")을 합성하는 에피머라제를 포함하는, 폴리사카라이드의 전부 또는 일부를 제조하는 재조합 원핵 생합성 시스템에 관한 것이다. 추가 실시양태에서, 폴리사카라이드의 전부 또는 일부는 항원성을 나타낸다.

또 다른 실시양태에서, 본 발명은 운데카프레닐 피로포스페이트 상에서 GalNAc를 합성하는 에피머라제; 및 환원 말단에서 GalNAc를 갖는 폴리사카라이드를 합성하는 글리코실트랜스퍼라제를 포함하는, 재조합 원핵 생합성 시스템에 관한 것이다.

본 발명의 한 실시양태는 운데카프레닐 피로포스페이트 상에서 GalNAc를 합성하는 에피머라제, 및 하기 구조를 갖는 폴리사카라이드를 합성하는 글리코실트랜스퍼라제를 포함하는 재조합 원핵 생합성 시스템을 추가로 포함한다: α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc(이때, GalNAc는 상기 폴리사카라이드의 환원 말단에 존재함).

재조합 원핵 생합성 시스템은 다양한 유래의 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드를 제조할 수 있다. 본 발명의 실시양태는 다양한 유래의 올리고사카라이드 및 폴리사카라이드에 관한 것이다. 이러한 올리고사카라이드 또는 폴리사카라이드는 원핵 또는 진핵 유래의 올리고사카라이드 또는 폴리사카라이드일 수 있다. 원핵 유래의 올리고사카라이드 또는 폴리사카라이드는 그람 음성 또는 그람 양성 박테리아로부터 유래될 수 있다. 본 발명의 한 실시양태에서, 올리고사카라이드 또는 폴리사카라이드는 이. 콜라이로부터 유래된다. 본 발명의 추가 양태에서, 상기 올리고사카라이드 또는 폴리사카라이드는 이. 콜라이 O157로부터 유래된다. 또 다른 실시양태에서, 상기 올리고사카라이드 또는 폴리사카라이드는 하기 구조를 포함한다: α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc. 본 발명의 추가 실시양태에서, 올리고사카라이드 또는 폴리사카라이드는 쉬겔라 플렉스네리로부터 유래된다. 추가 실시양태에서, 올리고사카라이드 또는 폴리사카라이드는 쉬겔라 플렉스네리 6으로부터 유래된다. 추가 실시양태에서, 올리고사카라이드 또는 폴리사카라이드는 하기 구조를 포함한다:

본 발명의 실시양태는 다양한 유래의 단백질들을 추가로 포함한다. 이러한 단백질들은 원핵 유기체 및 진핵 유기체에 천연적으로 존재하는 단백질들을 포함한다. 단백질 담체는 예를 들면, AcrA일 수 있거나 단백질 글리코실화를 위한 컨센서스 서열, 즉 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음)를 함유하도록 변경된 단백질 담체(예를 들면, 변경된 외독소 슈도모나스 애루기노사(Pseudomonas aeruginosa)("EPA"))일 수 있다. 본 발명의 한 실시양태에서, 단백질은 슈도모나스 애루기노사 EPA이다.

본 발명의 추가 양태는 N-글리칸의 환원 말단에서 GalNAc를 갖는 신규 생접합체 백신을 포함한다. 본 발명의 추가 실시양태는 운데카프레닐 피로포스페이트 상에서 GalNAc를 생성하는 에피머라제를 함유하는 재조합 박테리아 세포를 사용하여 상기 생접합체 백신을 제조하는 신규 방법을 포함한다. 한 실시양태에서, 생접합체 백신은 박테리아 질환의 치료 또는 예방에 사용될 수 있다. 추가 실시양태에서, 생접합체 백신은 암 또는 다른 질환에 대한 치료 및/또는 예방 잠재력을 가질 수 있다.

인간에 대한 전형적인 백신접종 투여량은 약 1 내지 25 ㎍, 바람직하게는 약 1 내지 약 10 ㎍, 가장 바람직하게는 약 10 ㎍이다. 선택적으로, 본 발명의 백신, 예컨대, 생접합체 백신은 보강제를 포함한다.

추가 실시양태에서, 본 발명은 올리고사카릴 트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질 담체를 코딩하는 뉴클레오타이드 서열; 하나 이상의 박테리아로부터 유래된 하나 이상의 폴리사카라이드 유전자 클러스터(이때, 상기 폴리사카라이드는 환원 말단에서 GalNAc를 함유함); 및 에피머라제를 코딩하는 핵산 서열을 포함하는, 하나 이상의 박테리아에 대한 생접합체 백신을 제조하는 발현 시스템에 관한 것이다. 추가 실시양태에서, 폴리사카라이드 유전자 클러스터는 항원성 폴리사카라이드를 코딩한다.

추가 실시양태에서, 본 발명은 올리고사카릴 트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 하나 이상의 삽입된 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 포함하는 단백질 담체를 코딩하는 뉴클레오타이드 서열; 하나 이상의 박테리아로부터 유래된 하나 이상의 폴리사카라이드 유전자 클러스터(이때, 상기 폴리사카라이드는 환원 말단에서 GalNAc를 함유함); 및 Z3206 유전자를 포함하는, 하나 이상의 박테리아에 대한 생접합체 백신을 제조하는 발현 시스템에 관한 것이다. 추가 실시양태에서, 폴리사카라이드 유전자 클러스터는 항원성 폴리사카라이드를 코딩한다.

또 다른 실시양태에서, 본 발명은 단백질 담체; 단백질 담체에 결합된 하나 이상의 면역원성 폴리사카라이드 쇄(이때, 상기 폴리사카라이드는 환원 말단에서 GalNAc를 갖고, 추가로 상기 GalNAc는 상기 단백질 담체에 직접 결합됨); 및 보강제를 포함하는, 생접합체 백신에 관한 것이다.

추가 실시양태에서, 본 발명은 하나 이상의 삽입된 컨센서스 서열 D/E-X-N-Z-S/T를 포함하는 단백질 담체(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음); 상기 단백질 담체에 결합된, 하나 이상의 박테리아로부터 유래된 하나 이상의 면역원성 폴리사카라이드(이때, 상기 하나 이상의 면역원성 폴리사카라이드는 상기 단백질 담체에 직접 결합된 환원 말단에서 GalNAc를 함유함); 및 선택적으로 보강제를 포함하는, 생접합체 백신에 관한 것이다.

본 발명의 또 다른 실시양태는 글리코실트랜스퍼라제를 사용하여 재조합 유기체 내에서 환원 말단에서 GalNAc를 갖는 폴리사카라이드를 조립하는 단계; 및 상기 재조합 유기체 내에서 상기 GalNAc를 하나 이상의 표적 단백질의 아스파라긴 잔기에 결합시키는 단계(이때, 상기 하나 이상의 표적 단백질은 하나 이상의 T-세포 에피토프를 함유함)를 포함하는, 생접합체 백신의 제조 방법에 관한 것이다.

추가 실시양태에서, 본 발명은 표적 단백질의 N-글리코실화를 수행하는 대사 기구(metabolic apparatus)를 코딩하는 유전정보를 원핵 유기체 내로 도입하여 변경된 원핵 유기체를 제조하는 단계; 상기 변경된 원핵 유기체의 배양물을 제조하는 단계; 및 배양된 배지로부터 글리코실화된 단백질을 수득하는 단계를 포함하는, 생접합체 백신의 제조 방법에 관한 것으로서, 이때 하나 이상의 재조합 표적 단백질의 발현에 필요한 유전정보가 상기 원핵 유기체 내로 도입되고, 이. 콜라이 균주 O157 에피머라제의 발현에 필요한 유전정보가 상기 원핵 유기체 내로 도입되고, 상기 대사 기구가 지질 담체 상에서 환원 말단에서 GalNAc를 갖는 폴리사카라이드를 조립하는 종류의 글리코실트랜스퍼라제, 및 상기 폴리사카라이드의 GalNAc를 표적 단백질의 아스파라긴 잔기에 공유결합시키는 올리고사카릴 트랜스퍼라제를 포함하고, 이때 상기 표적 단백질은 하나 이상의 T-세포 에피토프를 함유한다.

본 발명의 추가 양태는 약학 조성물에 관한 것이다. 본 발명의 추가 양태는 본 발명에 따른 하나 이상의 N-글리코실화된 단백질을 포함하는 약학 조성물을 포함한다. 본원의 개시내용에 비추어 볼 때, 단백질을 포함하는 약제의 제조는 당업자에게 잘 공지되어 있을 것이다. 본 발명의 추가 양태는 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 에피머라제를 억제하는 항생제를 포함하는 약학 조성물에 관한 것이다. 바람직한 실시양태에서, 본 발명의 약학 조성물은 약학적으로 허용가능한 부형제, 희석제 및/또는 보강제를 포함한다.

적합한 부형제, 희석제 및/또는 보강제는 당업계에 잘 공지되어 있다. 부형제 또는 희석제는 활성 성분에 대한 비히클 또는 매질로서 작용할 수 있는 고체, 반고체 또는 액체 물질일 수 있다. 조성물의 제조 분야에서 통상의 기술을 가진 자는 선택된 생성물의 구체적 특징, 치료될 질환 또는 상태, 상기 질환 또는 상태의 단계 및 다른 관련 환경에 따라 적절한 투여 형태 및 방식을 용이하게 선택할 수 있다(문헌[Remington's Pharmaceutical Sciences, Mack Publishing Co. (1990)]). 약학적으로 허용가능한 희석제 또는 부형제의 비율 및 성질은 선택된 약학적 활성 화합물의 가용성 및 화학적 성질, 선택된 투여 경로 및 표준 약학 관행에 의해 결정된다. 약학 제제는 경구, 비경구 또는 국소 사용을 위해 채택될 수 있고, 정제, 캡슐제, 좌제, 용액, 현탁액 등의 형태로 환자에게 투여될 수 있다. 본 발명의 약학적 활성 화합물은 그 자체가 효과적이지만, 안정성, 결정화의 편리성, 증가된 가용성 등을 목적으로 그들의 약학적으로 허용가능한 염, 예컨대, 산 부가염 또는 염기 부가염의 형태로 제제화되고 투여될 수 있다.

특정 뉴클레오타이드 또는 아미노산 서열이 인식되어 있는 경우, 본 발명은 상기 인식된 서열과 동일한 기능성을 구현할 상동 서열을 포괄한다는 것을 또한 이해할 것이다. 본 발명의 한 실시양태에서, 이러한 서열은 85% 이상의 상동성을 나타낸다. 또 다른 실시양태에서, 이러한 서열은 90% 이상의 상동성을 나타낸다. 추가 실시양태에서, 이러한 서열은 95% 이상의 상동성을 나타낸다.

2개의 뉴클레오타이드 또는 아미노산 서열들 사이의 백분율 동일성의 측정은 당업자에게 공지되어 있다.

본원에 기재된 핵산 서열들, 예컨대, 첨부된 서열목록에 기재된 핵산 서열들은 예시적인 서열일 뿐이고, 상기 서열들이 상이한 방식으로 조합될 수 있다는 것이 당업자에게 자명할 것이다. 본 발명의 추가 실시양태는 핵산의 변이체를 포함한다. 핵산의 변이체(예를 들면, 코돈-최적화된 핵산)는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 18, 19, 20, 21, 22, 23, 24, 27, 28 또는 29와 실질적으로 동일할, 즉 80% 이상 동일할, 예를 들면, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.5% 동일할 수 있다. 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 18, 19, 20, 21, 22, 23, 24, 27, 28 또는 29를 함유하는 서열의 핵산 변이체는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 18, 19, 20, 21, 22, 23, 24, 27, 28 또는 29, 또는 이들의 일부를 함유하는 서열로부터의 하나 이상의 뉴클레오타이드(예를 들면, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175 또는 200개의 뉴클레오타이드)의 치환, 변이, 변경, 대체, 결실 및/또는 부가를 갖는 핵산을 포함한다.

예를 들면, 본 발명의 한 실시양태에서, 이러한 변이체는 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 에피머라제를 코딩하고, (i) 숙주 세포, 예컨대, 이. 콜라이에서 발현되고, (ii) 서열번호 1, 3, 5, 7 또는 9, 또는 이들의 일부와 실질적으로 동일한 핵산을 포함한다.

본원에 기재된 핵산은 재조합 DNA 및 합성(예를 들면, 화학적으로 합성된) DNA를 포함한다. 핵산은 이중 가닥 또는 단일 가닥일 수 있다. 단일 가닥 핵산의 경우, 상기 핵산은 센스 가닥 또는 안티센스 가닥일 수 있다. 핵산을 올리고뉴클레오타이드 유사체 또는 유도체를 사용하여 합성할 수 있다.

본원에 기재된 핵산을 포함하는 플라스미드는 발현을 위해 숙주 세포 내로 형질감염되거나 형질전환될 수 있다. 형질감염 및 형질전환 기법은 당업자에게 공지되어 있다.

본원에서 언급된 모든 문헌들은 전체 내용이 참고로서 본원에 혼입된다. 본원에서 사용된 바와 같이 용어 "또는"이 적절한 경우 조합될 수 있는 대체물을 표시한다는 것, 즉 용어 "또는"이 각각의 기재된 대체물을 별도로, 뿐만 아니라 그들의 조합으로 포함한다는 것을 이해해야 한다. 문맥이 명확히 달리 명시하지 않은 한, 본원에서 사용된 바와 같이, 단수, 예컨대, 단수 형태의 언급은 복수를 포함하고, 복수의 언급은 단수를 포함한다.

본 발명은 본 발명의 조성물 및 방법뿐만 아니라 이들의 유용성을 추가로 기술하는 하기 실시예를 참조함으로써 더 정의된다. 본 발명의 범위 내에 있는, 조성물 및 방법 둘 다에 대한 변경을 실시할 수 있다는 것이 당업자에게 자명할 것이다.

실시예

박테리아 균주 및 플라스미드 - 이. 콜라이 균주 PR4019(문헌[Rush, J. S., Rick, P. D. and Waechter, C. J. (1997) Glycobiology, 7, 315-322]) 및 PR21546(문헌[Meier-Dieter, U., Starman, R., Barr, K., Mayer, H. and Rick, P. D. (1990) J. Biol. Chem., 265, 13490-13497])은 폴 릭 박사(Dr. Paul Rick, Bethesda, MD)로부터 제공받았고, 이. 콜라이 O157:H45(문헌[Stephan, R., Borel, N., Zweifel, C, Blanco, M., and Blanco, J.E. (2004) BMC Microbiol 4:10])는 클라우디오 즈웨이펠 박사(Dr. Claudio Zweifel, 취리히 대학 베테리나리 인스티튜트(Veterinary Institute, University of Zurich))로부터 제공받았다. 이. 콜라이 DH5α는 클로닝 실험 및 단백질 글리코실화 분석을 위한 숙주로서 사용되었다. 사용된 플라스미드는 표 2에 기재되어 있다.

실시예에서 사용된 플라스미드

플라스미드	설명	참조
pMLBAD	클로닝 벡터, Tmp^R	문헌(Lefebre & Valvano (2002))
pMLBAD:Z2306(서열번호 23)	pMLBAD 내의 Z3206, Tmp^R, 발현이 아라비노스 유도성 프로모터에 의해 조절됨	본원의 실시예
pMLBAD:gne(서열번호 24)	pMLBAD 내의 gne, Tmp^R, 발현이 아라비노스 유도성 프로모터에 의해 조절됨	본원의 실시예
pACYCpgl	캄필로박터 제주니 pgl 클러스터 Cm^R	문헌(Wacker, et al. (2002))
pACYCgne::kan	gne에 kan 카세트를 함유하는 캄필로박터 제주니 pgl 클러스터, Cm^R, Kan^R	문헌(Linton, et al. (2005))
pWA2	pBR322 내의 Tet 프로모터의 조절 하에 있는 가용성 원형질 막공간 헥사-His 태그로 표지된 AcrA, Amp^R	문헌(Feldman, et al. (2005))

재료 - [1,6-³H]GlcNAc(30 Ci/mmol), UDP-[1-³H]GlcNAc(20 Ci/mmol) 및 UDP-[6-³H]GalNAc(20 Ci/mmol)는 어메리칸 레이디오레이블드 케미칼스(American Radiolabeled Chemicals)(미국 미조리주 세인트 루이스 소재)로부터 입수되었다. 콴텀(Quantum) 1 실리카 겔 G 박층 플레이트는 콴텀 인더스트리스(Quantum Industries)(미국 뉴저지주 페어필드 소재)의 제품이었고, 베이커(Baker) Si250 실리카 겔 G 플레이트는 말린크로츠 케미칼 워크스(Mallinckrodt Chemical Works)에 의해 제조되었다. 효모 추출물 및 박토-펩톤은 비디 바이오사이언시스(BD Biosciences)의 제품이었다. 모든 다른 화학물질들은 표준 상업적 공급원으로부터 입수되었다. 트라이메토프림(Trimethoprim)(50 ㎍/㎖), 클로람페니콜(chloramphenicol)(20 ㎍/㎖), 앰피실린(ampicillin)(100 ㎍/㎖) 및 가나마이신(kanamycin)(50 ㎍/㎖)을 필요에 따라 배지에 첨가하였다.

재조합 플라스미드의 구축 - 이. 콜라이 균주 DH5α를 DNA 클로닝 실험을 위해 사용하였고, 구축된 플라스미드를 DNA 서열분석으로 검증하였다. 올리고뉴클레오타이드 Z3206-Fw 및 Z3206-RvHA(AAACCCGGGATGAACGATAACGTTTTGCTC(서열번호 17) 및 AAATCTAGATTAAGCGTAATCTGGAACATCGTATGGGTACTCAGAAACAAACGTTATGTC(서열번호 18); 제한부위는 밑줄로 표시됨)를 사용하여 PCR로 Z3206 유전자를 이. 콜라이 O157:H45로부터 증폭시켰다. PCR 단편을 SmaI 및 XbaI로 분해하고 SmaI-XbaI 절단된 pMLBAD 벡터(문헌[Lefebre, M. D. and Valvano M. A. (2002) Appl Environ Microbiol 68: 5956-5964]) 내로 연결시켰다. 이것은 C-말단 헤마글루티닌 태그를 갖는 Z3206을 코딩하는 플라스미드 pMLBAD:Z3206(서열번호 23)을 야기시켰다.

올리고뉴클레오타이드 gne-Fw 및 gne-RV(AAACCATGGATGAAAATTCTTATTAGCGG(서열번호 19) 및 AAATCTAGATTAAGCGTAATCTGGAACATCGTATGGGTAGCACTGTTTTTCCCAATC(서열번호 20); 제한부위는 밑줄로 표시됨)를 사용하여 캄필로바터 제주니 pgl 클러스터를 코딩하는 pACYCpgl(문헌[Wacker, M., Linton, D., Hitchen, P.G., Nita-Lazar, M., Haslam, S.M., North, S.J., Panico, M., Morris, H.R., Dell, A., Wrenn, B.W., Aebi, M. (2002) Science 298, 1790-1793])로부터 gne 유전자를 증폭시켰다. PCR 생성물을 NcoI 및 XbaI로 분해하고, pMLBAD의 동일한 부위 내로 연결하여 C-말단 헤마글루티닌 태그를 갖는 Gne를 코딩하는 플라스미드 pMLBAD:gne(서열번호 24)를 발생시켰다(표 2).

성장 조건, 단백질 발현 및 면역검출 - 이. 콜라이 균주를 37℃에서 루리아-버타니(Luria-Bertani) 배지(1% 효모 추출물, 2% 박토-펩톤, 0.6% NaCl) 내에서 격렬히 진탕하면서 배양하였다. 아라비노스를 0.05 내지 0.4의 A₆₀₀까지 성장한 이. 콜라이 세포에 0.02 내지 0.2%(중량/부피)의 최종 농도로 첨가하여 아라비노스 유도성 발현을 달성하였다. 유도 후 5시간에서 동일한 양의 아라비노스를 다시 첨가하고 4 내지 15시간 동안 계속 배양하였다.

분석 절차 - 피어스 바이오테크놀로지(Pierce Biotechnology) 사보("Eliminate Interfering Substances from Samples for BCA Protein Assay")에 따라 데옥시콜레이트 및 트라이클로로아세트산을 사용하여 막 단백질을 침전시킨 후, BCA 단백질 분석(피어스)을 이용하여 단백질 농도를 측정하였다. 0.5 ㎖의 1% SDS 및 4 ㎖의 이코노세이프 이코노믹 생분해성 카운팅 혼합물(Econosafe Economical Biodegradable Counting Mixture)(리서치 프로덕츠 인터내셔날 코포레이션(Research Products International, Corp.); 미국 일리노이주 마운트 프로스펙트 소재)을 첨가한 후, 팩커드 트라이-카브(Tri-Carb) 2100TR 액체 신틸레이션(scintillation) 분광계에서 신틸레이션 분광측정을 수행함으로써 샘플들을 방사성에 대해 분석하였다.

실시예 1: GlcNAc-P-P-Und 4-에피머라제를 코딩하는 이. 콜라이 O157 유전자의 확인

본원에서 본 발명자들은 GalNAc-P-P-Und가 4-에피머라제의 종래 공지되지 않은 작용에 의해 촉진되는 GlcNAc-P-P-Und의 4-OH의 에피머화에 의해 형성되는, 신규 생합성 경로의 놀라운 발견을 기술한다. 이 경로에서, GlcNAc-P-P-Und는 WecA에 의해 촉진되는, UDP-GlcNAc로부터의 GlcNAc-P의 전달에 의해 형성된 후, 종래 공지되지 않은 경로인 GlcNAc-P-P-Und-4-에피머라제에 의해 GalNAc-P-P-Und로 에피머화된다(도 2).

GlcNAc-P-P-Und 4-에피머라제의 후보물질을 코딩하는 유전자는 DNA 유사성 검색에 의해 확인되었다. 유사성 검색은 웹사이트(http://blast.ncbi.nlm.nih.gov/Blast.cgi)에서 발견되는 미국 의학국립도서관 데이터베이스를 사용하여 수행하였다. 환원 말단에서 GalNAc를 갖는 O-항원 반복 유닛을 코딩하는 상이한 박테리아의 게놈 서열들이 스크리닝되었다. 환원 말단에서 GalNAc를 함유하는 반복 유닛을 갖는 제 1 군과 상기 반복 유닛에서 말단 GalNAc를 결여하는 제 2 군을 비교하여 잠재적인 에피머라제를 확인하였다. 이 기준들을 이용하였을 때, Z3206은 후보 GlcNAc-P-P-Und 4-에피머라제로서 확인되었다(표 1).

GalNAc를 함유하는 O-항원 반복 유닛을 갖는 이. 콜라이 균주에 존재하는 GlcNAc 4-에피머라제 유전자를 표 1에 나타낸 바와 같이 2개의 상동성 군으로 분리할 수 있다. 놀랍게도, 하나의 상동성 군(gne1을 함유함)이 O-항원 반복 유닛 상의 개시 당으로서의 GalNAc의 존재와 상관관계를 갖는다는 것이 발견되었다. 추가로 놀랍게도, 제 2 군(gne2을 함유함)이 UDP-Glc 에피머라제인 GalE에 대한 고도의 유사성을 나타내고 GalNAc를 사용하여 O-항원 반복 유닛 합성을 개시하지 않는 이. 콜라이 균주들에서 존재한다는 것이 발견되었다. 이. 콜라이 O157 내의 Z3206(gne1에 대한 고도의 상동성을 나타내는 유전자)은 후보 GlcNAc-P-P-Und 4-에피머라제로서 확인되었다. Z3206 유전자는 O-항원 클러스터의 galF와 콜란산 클러스터에 속하는 wcaM 사이에 존재하기 때문에 Z3206 유전자의 게놈 위치는 이 경로에서 그의 역할과 일치한다.

실시예 2 내지 11에 기재된 연구는 GalNAc-P-P-Und의 형성을 촉진하는 효소로서의 GlcNAc 4-에피머라제(이. 콜라이 O157 Z3206)의 확인을 포함하는 상기 발견을 더 확인시켜준다.

실시예 2: UDP-GalNAc는 이. 콜라이 WecA(GlcNAc-포스포트랜스퍼라제)의 기질이 아니다

이. 콜라이 WecA가 UDP-GalNAc를 GalNAc-P 공여체로서 사용하여 GalNAc-P-P-Und를 형성하는지를 확인하기 위해, 이. 콜라이 균주 K12, PR4019(WecA 과발현 균주), 및 환원 말단에서 GalNAc를 갖는 테트라사카라이드 O-항원 반복 유닛을 합성하는(아마도 GalNAc-P-P-Und의 합성에 의해 개시됨) O157로부터 수득된 막 분획을 UDP-[³H]GalNAc와 함께 항온처리하였다.

이. 콜라이 막의 준비 - 박테리아 세포를 1,000 Xg에서 10분 동안 원심분리하여 수집하고, 빙냉 포스페이트-완충된 식염수로 1회 세척하고 빙수로 1회 세척하고 완충제(10 mM 트라이스-HCl, pH 7.4, 0.25 M 수크로스)로 1회 세척하였다. 세포를 완충제(10 mM 트라이스-HCl, pH 7.4, 0.25 M 수크로스, 0.2 mg/㎖ 라이소자임을 함유하는 10 mM EDTA)에 약 200 A₆₀₀ 유닛/㎖의 밀도로 재현탁시키고, 30℃에서 30분 동안 항온처리하였다. 박테리아 세포를 1,000 Xg에서 10분 동안 원심분리하여 회수하고, 40 부피의 빙냉 10 mM 트라이스-HCl(pH 7.4)에 신속히 재현탁시키고, 얼음 위에 놓았다. 10분 후, 조밀-피팅 다운스(tight-fitting Dounce) 균질화기를 이용한 15회 젓기로 상기 세포를 균질화시키고, 0.1 mM 페닐메틸설포닐 플루오라이드 및 최종 농도 0.25 M의 수크로스로 보충하였다. 파괴되지 않은 세포를 1,000 Xg에서 10분 동안 원심분리하여 제거하고, 세포 외피(envelope)를 40,000 Xg에서 20분 동안 원심분리하여 회수하였다. 막 분획을 완충제(10 mM 트라이스-HCl, pH 7.4, 0.25 M 수크로스, 1 mM EDTA)에 재현탁시키고, 40,000 Xg에서 다시 침강시키고, 동일한 완충제에 약 20 mg/㎖의 단백질 농도로 재현탁시켰다. 필요할 때까지 막 분획을 -20℃에서 저장하였다.

시험관 내에서 이. 콜라이 막에서의 [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und의 생합성에 대한 분석 - GlcNAc-P-P-Und 및 GalNAc-P-P-Und의 합성을 위한 반응 혼합물은 0.05 ㎖의 총 부피로 50 mM 트라이스-HCl(pH 8), 40 mM MgCl₂, 5 mM 다이티오트레이톨, 5 mM 5' AMP, 이. 콜라이 막 분획(50 내지 200 ㎍의 막 단백질) 및 5 μM UDP-[³H]GlcNAc/GalNAc(500 내지 2500 dpm/pmol)를 함유하였다. 37℃에서 항온처리한 후, 40 부피의 CHCl₃/CH₃OH(2:1)를 첨가하여 반응을 종결시키고, [³H]HexNAc-P-P-운데카프레놀을 함유하는 총 지질 추출물을 이미 공지된 바와 같이 제조하였다(문헌[Waechter, C. J., Kennedy, J. L. and Harford, J. B. (1976) Arch. Biochem. Biophys. 174, 726-737]). 분배 후, 유기층을 질소의 스트림 하에서 건조하고 1 ㎖ CHCl₃/CH₃OH(2:1)에 재용해시키고, 분취액(0.2 ㎖)을 제거하고, 신틸레이션 바이알 내에서 건조하고, 팩커드 트라이-카브 2100TR 액체 신틸레이션 분광계에서 액체 신틸레이션 분광측정을 수행하여 방사성에 대해 분석하였다. [³H]GlcNAc-P-P-Und 또는 [³H]GalNAc-P-P-Und의 합성 속도를 측정하기 위해, 지질 추출물을 질소의 스트림 하에서 건조하고, 작은 부피의 CHCl₃/CH₃OH(2:1)에 재용해시키고, 10 X 20 cm 보레이트-함침된 베이커 Si250 실리카 겔 플레이트 상에 점찍고, 상기 플레이트를 CHCl₃, CH₃OH, H₂O 및 0.2 M 나트륨 보레이트(65:25:2:2)로 현상하였다. 바이오스캔 AR2000 이미지화 스캐너(바이오스캔(Bioscan); 미국 워싱톤주 워싱톤 디.씨. 소재)를 이용하여 개별 당지질을 검출하였다. [³H]GlcNAc/GalNAc-P-P-Und에서의 방사성의 총량을 개별 [³H]당지질의 백분율로 곱함으로써 각각의 당지질에 대한 생합성 속도를 계산하였다.

상이한 이. 콜라이 균주(K12, PR4019 및 O157)로부터 수득된 막 분획을 UDP-[³H]GlcNAc 또는 UDP-[³H]GalNAc와 함께 항온처리하고, [³H]GlcNAc/GalNAc-P-P-Und 내로의 도입을 전술한 바와 같이 측정하였다. 표 3에서 알 수 있는 바와 같이, 표지된 당지질은 UDP-[³H]GalNAc와의 항온처리 후 검출되지 않았고, 막 분획이 UDP-[³H]GlcNAc와 함께 항온처리되었을 때 GlcNAc-P-P-Und만이 검출되었다.

UDP-[³H]GlcNAc 또는 UDP-[³H]GalNAc를 기질로서 사용하는, 이. 콜라이 막 분획에서의 [³H]GlcNAc/GalNAc-P-P-운데카프레놀의 합성

막의 공급원	부가된 당 뉴클레오타이드	형성된 [³H]당지질
막의 공급원	부가된 당 뉴클레오타이드	GlcNAc-P-P-Und	GalNAc-P-P-Und
		(pmol/mg)	(pmol/mg)
K12	UDP-[³H]GlcNAc	6.4	<0.01
K12	UDP-[³H]GalNAc	<0.01	<0.01
PR4019	UDP-[³H]GlcNAc	44	<0.01
PR4019	UDP-[³H]GalNAc	<0.01	<0.01
O157	UDP-[³H]GlcNAc	1.5	0.5
O157	UDP-[³H]GalNAc	<0.01	<0.01

나아가, WecA 과다발현 균주인 PR4019로부터 수득된 막과의 항온처리물에의 외인성 Und-P의 첨가 및 O157 세포로부터 수득된 세포질 분획의 첨가 둘 다가 UDP-GalNAc로부터 GalNAc-P-P-Und를 형성하지 못하였다. 이 결과는 UDP-GalNAc가 WecA에 대한 기질이 아님을 입증하고 GalNAc-P-P-Und가 대안적 기작에 의해 형성된다는 것을 암시한다.

균주 K12로부터 수득된 막을 UDP-[³H]GlcNAc와 함께 항온처리하였을 때, [³H]GlcNAc-P-P-Und가 예측된 바와 같이 합성되었다(문헌[Rush, J. S., Rick, P. D. and Waechter, C. J. (1997) Glycobiology, 7, 315-322]). 그러나, 균주 O157로부터 수득된 막을 UDP-[³H]GlcNAc와 함께 항온처리하였을 때, [³H]GlcNAc-P-P-Und 이외에 [³H]GalNAc-P-P-Und인 것으로 밝혀진 제 2 표지된 지질(이하 참조)이 관찰되었다. 2종의 당지질의 형성에 대한 시간 경과를 조사하였을 때, [³H]GlcNAc-P-P-Und 내로의 방사성의 도입(도 1, ○)은 [³H]GalNAc-P-P-Und 내로의 방사성의 도입(도 1, ●)보다 더 신속하고 더 높은 정도로 일어났는데, 이것은 전구체-생성물 관계와 일치한다(도 2).

이. 콜라이 O157 막이 GalNAc-P-P-Und의 합성을 위해 GalNAc-P 공여체로서 UDP-GalNAc를 사용하지 않는다는 관찰 결과는 도 2에 나타낸 GalNAc-P-P-Und의 형성을 위한 생합성 경로를 확인시켜주는 일례이다. 이 경로에서, GlcNAc-P-P-Und는 WecA에 의해 촉진되는, UDP-GlcNAc로부터의 GlcNAc-P의 전달에 의해 형성된 후, 종래 공지되지 않은 4-에피머라제의 작용에 의해 에피머화되어 GalNAc-P-P-Und를 생성한다.

실시예 3: 이. 콜라이 균주 O157 로부터 수득된 막 분획을 사용하여 시험관 내에서 형성한 [ ³ H] GalNAc -P-P- Und 의 특징 규명

도 1에서 GalNAc-P-P-Und로서 검출된 추가의 O157-특이적 당지질 생성물과 일치하여, [³H]GalNAc-P-P-Und는 약알칼리성 메탄올분해(methanolysis)(0.1 N KOH를 함유하는 톨루엔/메탄올 1:3, 0℃, 60분)에 대한 안정성을 나타내었고, CHCl₃/CH₃0H/H₂0(10:10:3)에서 평형화된 DEAE-셀룰로스에 의해 보유되었고, [³H]GlcNAc_1-2-P-P-Dol에 대해 종래 보고된 바와 같이(문헌[Waechter, C. J. and Harford, J. B. (1977) Arch. Biochem. Biophys. 181, 185-198]) 20 mM 암모늄 아세테이트를 함유하는 CHCl₃/CH₃0H/H₂0(10:10:3)에 의해 용출되었다.

[³H]GalNAc-P-P-Und는 보레이트-함침된 실리카 겔 G 상의 박층 크로마토그래피에 의해 [³H]GlcNAc-P-P-Und로부터 명확히 용해되었고(문헌[Kean, E. L. (1966) J. Lipid Res. 7, 449-452]), 도 3a 및 3b에 나타낸 바와 같이 분취 TLC에 의해 정제되었다.

보레이트-함침된 박층 플레이트 및 와트만 제1번 종이의 준비 - 실리카 겔 박층 플레이트를 문헌[Kean, E. L. (1966) J. Lipid Res. 7, 449-452]에 기재된 바와 같이 95% 메탄올 중의 2.5% Na₂B₄O₇·10H₂O에 짧게 침지시킴으로써 나트륨 보레이트로 함침시켰다. 보레이트-함침된 TLC 플레이트를 실온에서 밤새 건조하고, 사용할 때까지 드라이어라이트(Drierite) 상의 진공 건조기 내에서 저장하였다. 크로마토그래피 직전에, 상기 플레이트를 100℃까지 짧은 시간(약 10 내지 15분) 동안 가열함으로써 활성화시켰다. 와트만 제1번 종이의 20 X 30 cm 쉬트(sheet)를 0.2 M Na₂B₄O₇·10H₂O에 침지시킴으로써 상기 와트만 제1번 종이를 나트륨 보레이트로 함침시켰다. 와트만 제1번 종이 쉬트를 문헌[Cardini, C. E. and Leloir, L. F. (1957) J. Biol. Chem. 225, 317-324]에 기재된 바와 같이 2개의 와트만 제3MM번 종이 쉬트 사이에서 단단히 압착시키고, 실온에서 수일 동안 건조하였다.

시험관내 반응에서 형성된 글리칸 생성물의 특징 규명 - 개별 당지질([³H]GalNAc-P-P-Und 및 [³H]GlcNAc-P-P-Und)의 글리칸을 약산 가수분해에 의한 방출 후 하강 종이 크로마토그래피로 특징 규명하였다. GlcNAc/GalNAc 지질을 원추형 나사-캡 튜브 내에서 질소의 스트림 하에서 건조하고, 0.2 ㎖ 0.01 M HCl에서 100℃까지 15분 동안 가열하였다. 가수분해 후, 샘플을 0.4 ㎖의 AG50WX8(H⁺) 및 0.4 ㎖의 AG1X8(아세테이트 형태)을 함유하는 0.8 ㎖의 혼합-층 이온 교환 컬럼에 인가하고, 1.5 ㎖의 물로 용출하였다. 용출물을 질소의 스트림 하에서 건조하고, 작은 부피의 H₂O(0.02 ㎖)에 재용해시키고, 보레이트-함침된 와트만 제1번 종이의 30 cm 스트립 상에 점찍고, 부탄올/피리딘/물(6:4:3)을 사용하여 하강 방식으로 40 내지 50시간 동안 현상하였다. 건조 후, 상기 종이 스트립을 1 cm 띠로 절단하고 신틸레이션 분광측정으로 방사성에 대해 분석하였다. GlcNAc 표준물 및 GalNAc 표준물을 아닐린-다이페닐아민 침지 시약을 사용하여 검출하였다(문헌[Schwimmer, S. and Benvenue, A. (1956) Science 123, 543-544]).

글리칸 생성물을 전술한 바와 같이 약산 가수분해 후 0.1 M NaOH(최종 부피 0.1 ㎖) 중의 0.1 M NaBH₄를 사용하여 환원시킴으로써 그의 상응하는 알디톨로 전환시켰다. 실온에서 밤새 항온처리한 후, 반응물을 몇 방울의 빙초산으로 급랭시키고, 1 방울의 아세트산을 함유하는 메탄올을 사용하여 질소의 스트림 하에서 수회 건조하였다. 알디톨을 물에 용해시키고 AG50WX8(H⁺) 및 AG1X8(아세테이트)의 0.5 ㎖ 컬럼 상에 통과시킴으로써 탈염시키고, 질소 하에서 건조하고, 와트만 제3MM번 종이의 30 cm 스트립 상에 점찍었다. 와트만 제3MM번 종이 스트립을 에틸 아세테이트, 피리딘 및 0.1 M 붕산(65:25:20)을 사용하여 하강 방식으로 밤새 현상하고, 건조하고, 1 cm 띠로 절단하고, 신틸레이션 분광측정으로 방사성에 대해 분석하였다. 페리오데이트-벤지딘 침지 절차의 변형 절차를 이용하여 GlcNAcitol 표준물 및 GalNAcitol 표준물을 가시화하였다(문헌[Gordon, H. T., Thornburg, W. and Werum, L. N. (1956) Anal. Chem. 28, 849-855]). 상기 종이 스트립을 아세톤 및 0.1 M NaIO₄(95:5)에 침지시키고, 3분 동안 공기 건조한 후, 아세톤/아세트산/H₂O/o-톨리딘(96:0.6:4.4:0.2 gm)에 침지시켰다. 시스-다이올을 함유하는 알디톨은 청색 배경 상에서 황색 점으로서 염색된다.

당지질의 질량 분광측정("MS") - 정제된 당지질을 ABI 터보(Turbo) V 전기분무 이온공급원이 장착된 ABI/MDS 사이엑스(Sciex) 4000 Q-트랩 혼성체 삼중 사중극자 선형 이온 트랩 질량 분광계(ABI/MDS-사이엑스; 캐나다 토론토 소재)를 이용하여 분석하였다. 요약하건대, 실험적으로 결정된 이온 공급원 설정을 이용하여 샘플을 10 ㎕/분의 속도로 주입하고, 분자 이온을 선형 이온 트랩 방식으로 단편화함으로써 MS/MS(초 치수의 질량 분광법) 정보를 수득하였다.

당지질을 약산으로 처리하였을 때(0.01 N HC1, 100℃, 15분), 수용성 생성물은 보레이트-함침된 와트만 제1번 종이를 사용하는 하강 종이 크로마토그래피 상에서 [³H]GalNAc와 함께 이동하였다(도 3c). 또한, 표지된 당을 환원시켰을 때, 상기 당은 [³H]알디톨인 GalNAc-OH로 전환되었다(도 3d). 더욱이, 음성 이온 MS 분석은 GalNAc-P-P-Und에 대해 예측된 바와 같이 m/z = 1128의 [M-H]- 이온을 보여주었고, MS/MS 딸이온 스펙트럼은 P-P-Und를 함유하는 당지질에 대해 예측된 바와 같이 m/z = 907에서 뚜렷한 이온을 보여주었다(문헌[Guan, Z., Breazeale, S. D. and Raetz, C. R. (2005) Anal. Biochem. 345, 336-339]). GalNAc-P-P-Und로서 균주 O157에 의해 형성된 당지질 생성물의 확인은 외인성 GlcNAc-P-P-Und로부터의 상기 생성물의 형성에 의해서도 뒷받침된다(실시예 7 참조).

실시예 4: Z3206 유전자를 발현하는 이. 콜라이 세포에서 [ ³ H]GlcNAc를 사용한 [ ³ H]GalNAc-P-P-Und(생체내)의 대사적 표지

이. 콜라이 O157 Z3206 유전자의 발현이 세포로 하여금 GalNAc-P-P-Und를 합성할 수 있게 하는지를 조사하기 위해, Z3206 유전자를 발현하는 이. 콜라이 균주 21546(문헌[Meier-Dieter, U., Starman, R., Barr, K., Mayer, H. and Rick, P. D. (1990) J. Biol. Chem., 265, 13490-13497])을 [³H]GlcNAc로 대사적으로 표지하고 [³H]GlcNAc/GalNAc-P-P-Und 형성에 대해 분석하였다.

박테리아 세포의 대사적 표지 - 이. 콜라이 세포를 37℃에서 루리아-버타니 배지에서 격렬히 진탕하면서 0.5 내지 1의 A₆₀₀까지 배양하였다. [³H]GlcNAc를 1 μCi/㎖의 최종 농도로 첨가하고, 37℃에서 5분 동안 계속 항온처리하였다. 0.5 mg/㎖의 분쇄된 얼음을 첨가하여 당지질 내로의 방사성표지의 도입을 종결하고, 배양물을 철저히 혼합하였다. 박테리아 세포를 4,000 Xg에서 10분 동안 원심분리하여 회수하고, 상청액을 따라 버렸다. 세포를 빙냉 포스페이트-완충된 식염수로 2회 세척하고, 10 부피(세포 펠렛)의 메탄올 중에서 격렬한 보텍스(vortex) 혼합을 수행하여 재현탁시키고, 40% 전체 전력에서 프로브 초음파처리기로 짧게 초음파처리하였다. 초음파처리 후, 20 부피의 클로로포름을 첨가하고, 추출물을 격렬히 혼합하고, 실온에서 15분 동안 세워 두었다. 불용성 물질을 원심분리로 침강시키고, 펠렛을 작은 부피의 CHCl₃/CH₃OH(2:1)로 2회 재추출하였다. 그 다음, 조합된 유기 추출물을 이하에 기재된 바와 같이 가공하였다.

GlcNAc-P-P-Und 및 GalNAc-P-P-Und의 정제 - GlcNAc/GalNAc-P-P-Und를 CHCl₃/CH₃0H(2:1)로 추출하고, 이미 공지된 바와 같이 분배함으로써 수용성 물질을 제거하였다(문헌[Waechter, C. J., Kennedy, J. L. and Harford, J. B. (1976) Arch. Biochem. Biophys. 174, 726-737]). 그 다음, 유기 추출물을 질소의 스트림 하에서 건조하고, 0℃에서 0.1 N KOH를 함유하는 톨루엔/메탄올(1:3)에서 60분 동안 탈아실화(deacylation)하여 벌크 글리세로인지질(glycerophospholipid)을 파괴하였다. 탈아실화 반응을 아세트산으로 중화시키고, 4 부피의 CHCl₃/CH₃0H(2:1)로 희석하고, 1/5 부피의 0.9% NaCl로 세척하였다. 유기(하부)층을 1/3 부피의 CHCl₃, CH₃OH, 0.9% NaCl(3:48:47)로 세척하고, 수층을 따라 버렸다. 잔류 수층을 상기 유기층에 수용시키기에 충분한 메탄올로 상기 유기층을 희석하고, 상기 유기층을 CHCl₃/CH₃0H(2:1)로 평형화시킨 DEAE-셀룰로스 컬럼(5 ㎖)에 인가하였다. 컬럼을 20 컬럼 부피의 CHCl₃/CH₃0H/H₂0(10:10:3)로 세척하고 20 mM 암모늄 아세테이트를 함유하는 CHCl₃/CH₃0H/H₂0(10:10:3)로 용출하였다. 분획(2 ㎖)을 수집하고, (전술된 바와 같이) 보레이트-함침된 실리카 플레이트 상의 박층 크로마토그래피로 분리한 후 아니스알데하이드(anisaldehyde) 분무 시약(문헌[Dunphy, P. J., Kerr, J. D., Pennock, J. F., Whittle, K. J., and Feeney, J. (1967) Biochim. Biophys. Acta 136, 136-147])을 사용하여 방사성 또는 GlcNAc/GalNAc-P-P-Und에 대해 모니터링하였다.

UDP-ManNAcA 합성에서의 돌연변이가 엔테로박테리아의 공통된 항원의 합성을 위한 GlcNAc-P-P-Und의 사용을 차단하기 때문에 이. 콜라이 균주 21546을 Z3206 발현 연구를 위한 숙주로서 선택하였다. 이. 콜라이 21546은 이. 콜라이 K12로부터 유래되었기 때문에 이. 콜라이 21546도 O-항원 반복체를 합성하지 못하므로 (문헌[Stevenson, G., Neal, B., Liu, D., Hobbs, M., Packer, N. H., Batley, M., Redmond, J. W., Lindquist, L. and Reeves, P. (1994) J. Bacteriol., 176, 4144-4156]), 보다 많은 양의 GlcNAc-P-P-Und가 GalNAc-P-P-Und로의 전환을 위해 축적된다. 균주 21546, 및 Z3206 유전자를 발현하는 형질전환체를 [³H]GlcNAc로 표지하고, 방사성표지된 지질을 보레이트-함침된 실리카 겔 플레이트 상의 박층 크로마토그래피로 분석하였을 때, 모균주(도 4a)는 단지 하나의 표지된 지질, 즉 GlcNAc-P-P-Und를 합성하였다. 그러나, Z3206 유전자를 발현하는 21546 세포(도 4b)는 GalNAc-P-P-Und인 것으로 밝혀진 추가의 표지된 지질도 합성하였다.

실시예 5: Z3206 유전자를 발현하는 이. 콜라이 세포로부터 수득된 막 분획은 시험관 내에서 GalNAc -P-P- Und 를 합성한다

이. 콜라이 O157 Z3206 유전자에 의해 코딩된 단백질이 GalNAc-P-P-Und의 합성을 촉진하는 것을 확인하기 위해, Z3206 유전자를 발현하는 이. 콜라이 세포로부터 수득된 막 분획을 [³H]UDP-GlcNAc와 함께 항온처리하였고, [³H]당지질 생성물을 도 5에 나타낸 바와 같이 보레이트-함침된 실리카 겔 플레이트 상의 박층 크로마토그래피(크로마토그래피 준비 및 특징 규명 방법은 실시예 3에 기재되어 있음)로 분석하였다. 이. 콜라이 K12 또는 숙주 균주 이. 콜라이 21546 세포로부터 수득된 막 분획을 UDP-[³H]GlcNAc와 함께 항온처리하였을 때, [³H]GlcNAc-P-P-Und만이 관찰되었다(도 5a 및 5c). 그러나, 이. 콜라이 O157 및 Z3206을 발현하는 이. 콜라이 21546으로부터 수득된 막 분획은 GalNAc-P-P-Und도 형성하였다(도 5b 및 5d).

실시예 6: GlcNAc -P-P- Und 의 형성은 UMP 의 존재 하에서 역행되지만, GalNAc -P-P-Und의 형성은 역행되지 않는다

GalNAc-P-P-Und가 글리코실 공여체로서 UDP-GalNAc를 사용하는 WecA의 작용에 의해서 합성되는 것이 아니라, GlcNAc-P-P-Und로부터 합성된다는 것을 보여주는 추가의 증거를 제공하기 위해, 방출 내인성 예비표지된 [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und의 효과를 UMP를 사용하여 조사하였다. WecA에 의해 촉진되는 GlcNAc-포스포트랜스퍼라제 반응은 UDP-GlcNAc를 재합성하고 Und-P를 방출하는 과량의 UMP의 첨가에 의해 자유롭게 역행될 수 있다.

이 실험에서, Z3206을 발현하는 이. 콜라이 균주 21546으로부터 수득된 막 분획을 UDP-[³H]GlcNAc로 10분 동안 예비표지한 후 1 mM UMP를 첨가하고, 남아 있는 각각의 표지된 당지질의 양을 측정하였다. 도 6a에 나타낸 결과는 10분 표지 시간의 말기에서 [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und의 상대적인 양을 보여준다. 1 mM UMP와 함께 1분 동안 항온처리한 후, [³H]GlcNAc-P-P-Und의 상당한 손실이 있는 반면, [³H]GalNAc-P-P-Und 피크는 상대적으로 변화되지 않는다는 것을 알 수 있다(도 6b)(크로마토그래피 준비 및 특징 규명 방법은 실시예 5에 기재되어 있음). 이 관찰결과는 WecA가 UDP-GalNAc로부터 GalNAc-P-P-Und로의 GalNAc-P의 전달을 촉진하지 않는다는 것을 보여주는 표 3의 결과와 일치한다. UMP와의 항온처리 2분 동안, GlcNAc-P-P-Und의 손실이 느려지고 [³H]GalNAc-P-P-Und의 피크에서의 약간의 감소가 있다는 것이 주목되는데(도 6c), 이것은 [³H]GalNAc-P-P-Und가 에피머화 반응의 역행에 의해 [³H]GlcNAc-P-P-Und 풀(pool)로 재평형화된다는 것을 암시한다(실시예 7 참조).

실시예 7: Z3206 을 발현하는 이. 콜라이 세포로부터 수득된 막에 의해 촉진되는 외인성 정제된 [ ³ H]GlcNAc-P-P-Und와 [ ³ H]GalNAc-P-P-Und의 상호전환

GlcNAc-P-P-Und와 GalNAc-P-P-Und가 Z3206을 발현하는 이. 콜라이 세포로부터 수득된 막 분획에 의해 직접적으로 상호전환될 수 있다는 것을 보여주는 직접적 증거를 제공하기 위해, 정제된 [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und를 외인성 기질로서 시험하였다.

정제된 [³H]GlcNAc-P-P-Und/[³H]GalNAc-P-P-Und를 실시예 4(박테리아 세포의 대사적 표지, 및 GlcNAc-P-P-Und 및 GalNAc-P-P-Und의 정제)에서와 같이 제조하였다. [³H]HexNAc-P-P-운데카프레놀(2000 dpm/pmol, 1% 트라이톤 X-100에 분산됨, 최종 농도 0.1%)을 실시예 2(시험관 내에서 이. 콜라이 막에서 [³H]GlcNAc-P-P-Und 및 [³H] GalNAc-P-P-Und의 생합성을 위한 분석)에서와 같이 이. 콜라이 막과 함께 항온처리하였다.

예비 실험은 외인성 [³H]GlcNAc-P-P-Und가 트라이톤 X-100, CHAPS(3-[(3-콜아마이도프로필)다이메틸암모니오]-1-프로판설폰산), 노니뎃(Nonidet) P-40 또는 옥틸글루코사이드에 분산된 반응 혼합물에 첨가되었을 때 에피머라제가 활성을 나타내고 7 내지 8.5의 범위 내에서 최적 pH를 나타낸다는 것을 보여주었다. 막 분획과의 항온처리 전 정제된 [³H]GlcNAc-P-P-Und 및 [³H]GalNAc-P-P-Und의 크로마토그래피 이동은 도 7a 및 7d에 나타나 있다. 도 7b 및 7e에서 볼 수 있는 바와 같이, 당지질은 이. 콜라이 21546으로부터 수득된 막 분획과의 항온처리에 의해 영향을 받지 않는다. 그러나, Z3206을 발현하는 이. 콜라이 21546으로부터 수득된 막 분획과 상기 정제된 당지질의 항온처리는 [³H]GalNAc-P-P-Und로의 외인성 [³H]GlcNAc-P-P-Und의 전환(도 7c) 및 [³H]GlcNAc-P-P-Und로의 [³H]GalNAc-P-P-Und의 전환(도 7f)을 촉진한다. 이 결과는 GlcNAc-P-P-Und와 GalNAc-P-P-Und가 Z3206을 발현하는 이. 콜라이 균주에서 효소에 의해 상호전환될 수 있다는 것을 직접적으로 입증한다.

실시예 8: 이. 콜라이 Z3206 은 UDP-GlcNAc 4-에피머라제가 아니다.

Z3206이 UDP-GalNAc의 형성을 촉진할 수 있는지를 확인하기 위해, 캄필로박터 제주니로부터 수득된 N-글리코실화 기구를 이. 콜라이에서 발현시켰다. 이 레포터 시스템에서, 표적 단백질 AcrA의 글리코실화는 기능성 Gne UDP-Glc/UDP-GlcNAc 에피머라제(문헌[Bernatchez, S., Szymanski, C.M., Ishiyama, N., Li, J., Jarrell, H.C., Lau, P.C., Berghuis, A.M., Young, N.M., Wakarchuk, W.W. (2005) J. Biol. Chem. 280, 4792-4802])를 포함하는 pgl 좌위(문헌[Wacker, M., Linton, D., Hitchen, P.G., Nita-Lazar, M., Haslam, S.M., North, S.J., Panico, M., Morris, H.R., Dell, A., Wrenn, B.W., Aebi, M. (2002) Science 298, 1790-1793])의 존재에 의존한다. AcrA의 글리코실화는 pgl 클러스터가 gne의 결실을 함유하는 경우 상실된다(문헌[Linton, D., Dorrell, N., Hitchen, P.G., Amber, S., Karlyshev, A.V., Morris, H.R., Dell, A., Valvano, M.A., Aebi, M. and Wren, B.W. (2005) Mol. Microbiol. 55, 1695-1703]). AcrA(pWA2)를 Gne(pMLBAD:gne) 또는 Z3206(pMLBAD:Z3206)에 의해 보완된 pgl 좌위 Δ gne와 함께 발현시킴으로써 pgl 오페론 Δ gne의 존재 하에서 AcrA-글리코실화를 회복하는 Z3206의 능력을 조사하였다.

100 ㎕의 SDS 적재 완충제에 재현탁된 1 A₆₀₀ 유닛과 동등한 농도의 세포를 사용하는 면역검출 분석을 위해 전체 이. 콜라이 세포 추출물을 준비하였다(문헌[Laemmli, U. (1970) Nature 227, 680-685]). 10 ㎕의 분취액을 10% SDS-PAGE 상에 적재하였다. 이. 콜라이 세포의 주변 세포질 추출물을 라이소자임 처리로 준비하고(문헌[Feldman, M.F., Wacker, M., Hernandez, M., Hitchen, P.G., Marolda, C.L., Kowarik, M., Morris, H.R., Dell, A., Valvano, M.A., Aebi, M. (2005) Proc Natl Acad Sci USA 102, 3016-3021]), (0.2 A₆₀₀ 유닛의 세포에 상응하는) 10 ㎕의 최종 샘플을 SDS-PAGE로 분석하였다. 샘플을 니트로셀룰로스 막 상에 블롯팅한 후, 특정 항혈청으로 면역염색하였다(문헌[Aebi, M., Gassenhuber, J., Domdey, H., and te Heesen, S. (1996) Glycobiology 6, 439-444]). 항-AcrA(문헌[Wacker, M., Linton, D., Hitchen, P.G., Nita-Lazar, M., Haslam, S.M., North, S.J., Panico, M., Morris, H.R., Dell, A., Wrenn, B.W., Aebi, M. (2002) Science 298, 1790-1793]) 항체를 사용하였다. 항-토끼 IgG-HRP(바이오-라드(Bio-Rad))를 이차 항체로서 사용하였다. ECL(상표명) 웨스턴 블롯팅 검출 시약(아머샴 바이오사이언시스(Amersham Biosciences))을 사용하여 검출을 수행하였다.

도 8에 나타낸 바와 같이, 비글리코실화된 형태보다 더 느리게 이동하는 글리코실화된 단백질은 pgl 좌위 Δ gne를 발현하는 세포가 Gne에 의해 보완되었을 때에만 형성되었다(레인 2). Z3206은 레포터 당단백질의 글리코실화를 회복시킬 수 없었다(도 8, 레인 1). 따라서, Z3206은 Gne 의존적 글리코실화 시스템에서 AcrA의 글리코실화를 보완하지 않는다. Gne 및 막-회합된 Z3206의 발현은 면역검출에 의해 확인되었다.

실시예 9: 쉬겔라 플렉스네리 6 +/- Z3206 LPS의 분석

도 9에는 쉬겔라 플렉스네리 6 O-항원의 생합성에 필요한 유전자들 중 일부가 표시되어 있다: 뉴클레오타이드 당 전구체의 생합성을 위한 효소를 코딩하는 유전자; 글리코실트랜스퍼라제를 코딩하는 유전자; O-항원 가공 단백질을 코딩하는 유전자; 및 O-아세틸화를 책임지는 단백질을 코딩하는 유전자. O-항원의 구조는 문헌[Dmitriev, B.A., et al., Somatic Antigens of Shigella Eur JBiochem, 1979. 98: p. 8] 및 문헌[Liu B et al., Structure and genetics of Shigella O antigens FEMS Microbiology Review, 2008. 32: p. 27]의 연구자들에 의해 밝혀졌다.

쉬겔라 플렉스네리 6 O-항원의 생합성에 필요한 모든 유전자들을 확인하기 위해, 게놈 라이브러리를 구축하였다.

쉬겔라 플렉스네리 6 게놈 DNA의 클로닝 - 박테리아로부터 DNA를 단리하기 위한 프로토콜에 따라 마처레이-나겔 뉴클레오스핀(Macherey-Nagel NucleoSpin)(등록상표) 조직 키트를 사용하여 쉬겔라 플렉스네리 6 게놈 DNA를 단리하였다. 각각 2 ㎖의 5개 쉬겔라 플렉스네리 6 밤샘 배양물들로부터 DNA를 단리하고, 100 ㎕ 용출 완충제(5 mM 트라이스/HCl, pH 8.5)를 사용하여 최종 용출을 수행하였다. 용출된 분획을 모아 이소프로판올로 침전시키고, 최종 펠렛을 52 ㎕ TE 완충제에 재현탁시켰는데, 상기 TE 완충제의 총 부피는 카피컨트롤(CopyControl)(상표명) 포스미드(Fosmid) 라이브러리 제조 키트(에피센트레(EPICENTRE))에 의해 제공된 프로토콜에 따라 최종 복구 처리되었다. 최종 복구된 DNA를 상기 키트 프로토콜에 기재된 바와 같이 1 X TAE 완충제를 사용하는 1% 저융점 아가로스 겔 전기영동으로 정제하고, 회수하고 에탄올로 침전시켰다. 침전된 DNA의 재현탁을 7 ㎕ TE 완충제에서 수행하고, 현탁된 DNA 중 0.15 ㎕ DNA를 에피센트레 프로토콜에 따라 pCC1FOS(서열번호 27) 내로 연결시켰다. 프로토콜에 따라 연결 생성물을 파지 내로 팩키징하고, 팩키징된 파지를 파지 희석 완충제에서 1:1로 희석하고, 희석된 파지 중 10 ㎕의 파지를 사용하여 에피센트레에 의해 기재된 바와 같이 미리 성장된 100 ㎕ EPI300-T1 세포를 감염시켰다. 6개의 플레이트가 전체 쉬겔라 플렉스네리 6 게놈 라이브러리를 함유하도록 세포(110 ㎕)를 플레이트 당 약 100개 콜로니의 밀도로 6회 플레이팅하였다. 콜로니 블롯팅으로 플레이트를 현상하고, 양성/음성 콜로니를 웨스턴 블롯팅하고 은 염색하였다.

콜로니 블롯팅 - 콜로니 블롯을 위해, 니트로셀룰로스 막을 고체 아가 플레이트 상에 놓고, 제거하고, 1 X PBST로 3회 세척하고 동일한 방식으로 처리하였다. 막을 먼저 실온에서 10% 우유에서 1시간 동안 차단한 후, (PBST 중의) 2 ㎖ 1% 우유에서 항-VI형 항혈청(일차 항체)과 함께 실온에서 1시간 동안 항온처리하였다. PBST에서 각각 10분 동안 3회 세척한 후, 상기 막을 (PBST 중의) 2 ㎖ 1% 우유에서 염소-항-토끼 IgG(바이오-라드)에 접합된 1:20000 퍼록시데이즈(이차 항체)와 함께 실온에서 1시간 동안 항온처리하였다. PBST를 사용하여 (각각 10분 동안) 최종 3회 세척한 후, 상기 막을 수퍼시그날(SuperSignal)(등록상표) 웨스트 듀라 익스텐디드 듀레이션 서브스트레이트 키트(West Dura Extended Duration Substrate Kit)(써모 사이언티픽(Thermo Scientific))에 의해 제공된 루미놀과 퍼록사이드 완충제의 1:1 혼합물을 사용하여 UVP 케미 독 이미징 시스템(Chemi Doc Imaging System)에서 현상하였다.

쉬겔라 플렉스네리 6 게놈 라이브러리의 제조 후 쉬겔라 플렉스네리 6 항혈청과 반응하는 클론을 리우(Liu)와 그 동료들(Liu et al., 2008)에 의해 이미 서열분석된 영역(rmlB부터 wfbZ까지 걸쳐 있음)으로부터 연장하는 프라이머로 서열분석하였다(도 9). 프라이머 rmlB_rev 및 wfbZ_fwd(쉬겔라 플렉스네리 - Z3206)는 rmlB 및 wfbZ에서 어닐링되고, 각각 wcaM 및 hisI/F에 도달될 때까지(쉬겔라 플렉스네리 + Z3206) 상기 클론의 삽입물을 서열분석하는 데에 사용되었다(도 10).

O-항원 합성이 Z3206을 결여하는 클론에서 유지되는지(이로써 und-GalNAc로의 und-GlcNAc의 에피머화를 저해하는지)를 확립하기 위해, 2개의 플라스미드(서열번호 28 및 29)를 구축하고(도 10), 이. 콜라이 세포 내로 형질전환시키고 은 염색 및 웨스턴 블롯으로 분석하였다.

도 11에 나타낸 바와 같이, LPS는 이. 콜라이 세포 + 또는 - Z3206에서 생성된다. O-항원은 Z3206의 부재 하에서 생성될 수 있으나 보다 낮은 생성 수율로 생성될 수 있는데, 이것은 에피머라제(Z3206)의 부재 하에서 폴리사카라이드 생성의 효율이 보다 낮다는 것을 보여준다.

실시예 10: 쉬겔라 플렉스네리 6 +/- Z3206 LLO의 분석

C18 컬럼 크로마토그래피에 의한 운데카프레놀-PP-O 항원의 정제 - 쉬겔라 플렉스네리 항원 +/- Z3206을 발현하는 이. 콜라이 세포를 펠렛화하고, 50 ㎖의 0.9% NaCl로 1회 세척하고, 최종 펠렛을 밤새 동결건조하였다. 펠렛을 30 ㎖의 85 내지 95% 메탄올로 1회 세척하고, 10:10:3 클로로포름-메탄올-물(v/v/v)로 재추출하고, 물을 첨가하여 최종 비가 10:10:9(클로로포름:메탄올:물)가 되게 함으로써 추출물을 2-상 블라이(Bligh)/드와이어(Dyer) 시스템으로 전환시켰다. 상들을 원심분리로 분리하고, 상부 수상을 10 ㎖ 메탄올에 의해 상태조절되고 10 ㎖의 3:48:47(클로로포름:메탄올:물)에 의해 평형화된 C18 셉-팩(Sep-Pak) 카트리지 상에 각각 적재하였다. 적재 후, 카트리지를 10 ㎖의 3:48:47(클로로포름:메탄올:물)로 세척하고, 5 ㎖의 10:10:3(클로로포름:메탄올:물)로 용출하였다. C18 컬럼의 적재물, 유동 관통물, 세척물 및 용출물의 20개 OD 샘플들을 에펜도르프 컨센트레이터 플러스(Eppendorf Concentrator Plus)에서 건조하고, 250 ㎕ 메탄올로 세척하고, 재증발시키고 30 ㎕ ddH₂O로 추가 3회 세척하였다.

당지질 가수분해 - 건조된 샘플을 2 ㎖ n-프로판올:2 M 트라이플루오로아세트산(1:1)에 용해시키고, 50℃로 15분 동안 가열하고 N₂ 하에서 건조될 때까지 증발시킴으로써 상기 C18 컬럼의 세척물로부터 수득된 당지질 샘플을 가수분해하였다.

2-아미노벤조에이트를 사용한 올리고사카라이드 표지 및 HPLC - 표지를 문헌[Bigge et al., 1995]에 따라 수행하고, 문헌[Merry et al., 2002]에 기재된 종이 디스크 방법을 이용하여 글리칸 제거를 수행하였다. 문헌[Royle et al., 2002]에 따라 글리코셉(GlycoSep)-N 정상 상 컬럼을 사용하되, 3 용매 시스템으로 변경된 HPLC를 이용하여 2-AB 표지된 글리칸의 분리를 수행하였다. 용매 A는 80% 아세토니트릴 중의 10 mM 암모늄 포르메이트(pH 4.4)이었다. 용매 B는 40% 아세토니트릴 중의 30 mM 암모늄 포르메이트(pH 4.4)이었다. 용매 C는 0.5% 포름산이었다. 컬럼 온도는 30℃이었고, 2-AB 표지된 글리칸은 형광(λ_ex = 330 nm, λ_em = 420 nm)에 의해 검출되었다. 구배 조건은 0.4 ㎖/분의 유속으로 160분에 걸쳐 100% A 내지 100% B를 사용한 후, 유속을 1 ㎖/분까지 증가시키면서 2분에 걸쳐 100% B 내지 100% C를 사용하는 선형 구배이었다. 컬럼을 100% C로 5분 동안 세척하고, 2분에 걸쳐 100% A로 복귀시키고, 1 ㎖/분의 유속으로 100% A에서 15분 동안 런닝한 후, 상기 유속을 5분 동안 0.4 ㎖/분으로 복귀시킨다. 모든 샘플들을 물 중에서 주입하였다.

Z3206을 갖거나(서열번호 29) 갖지 않는(서열번호 28) 쉬겔라 플렉스네리 O-항원을 발현하는 플라스미드를 SCM3 세포 내로 형질전환시켰다(도 10). 후기 용출 부피에서의 흔적은 쉬겔라 플렉스네리 O-항원 +/- Z3206을 함유하는 2개의 샘플들의 곡선 사이의 차이를 보여준다(도 12). 이러한 용출 패턴의 차이는 환원 말단에서 상이한 모노사카라이드를 보유하는 상이한 올리고사카라이드 구조에 의해 설명될 수 있다: 에피머라제(Z3206)의 존재에 따라 GlcNAc 또는 GalNAc.

실시예 11: 쉬겔라 플렉스네리 6 +/- Z3206 으로부터 생성된 생접합체의 제조 및 특징 규명에 의한 pglB 특이성의 분석

PglB가 환원 말단에서 GlcNAc를 갖는 올리고사카라이드(쉬겔라 플렉스네리 6 O-항원)를 담체 단백질 EPA로 전달할 수 있는지를 평가하기 위해, EPA(서열번호 25), PglB(서열번호 26) 및 쉬겔라 플렉스네리 6 O-항원 +/- Z3206(서열번호 29/서열번호 28)을 발현하는 이. 콜라이 세포로부터 수득된 니켈 정제된 추출물을 항-EPA 및 항-VI형 항체를 사용하는 웨스턴 블롯으로 분석하였다. 환원 말단에서 GalNAc를 갖거나 갖지 않는 쉬겔라 플렉스네리 6 O-항원은 항-EPA 및 항-VI형 항혈청에 의해 검출되는 바와 같이 PglB에 의해 EPA로 전달되었다(도 13).

O-항원은 여전히 생성되고 검출되지만 보다 낮은 생성 수율로 생성되고 검출되는데, 이것은 에피머라제의 부재 하에서의 폴리사카라이드 제조의 효율이 보다 낮다는 것을 보여준다.

본 발명이 그의 실시양태를 참조함으로써 구체적으로 제시되고 기재되어 있지만, 당업자는 특허청구범위에 의해 포괄되는 본 발명의 범위를 벗어나지 않으면서 상기 실시양태에 대한 형태 및 세부사항에서의 다양한 변화를 만들 수 있다는 것을 이해할 것이다. 본 발명의 범위 내에 포함되는, 당업자에게 의해 이해될 이러한 다양한 변화는 특히, 환원 말단에서 GalNAc를 갖는, 이. 콜라이 및 쉬겔라 플렉스네리로부터 수득된 글리칸 이외의 글리칸을 포함하는 N-글리코실화된 단백질 및 생접합체를 포함한다.

서열 목록

서열번호 1 - 이. 콜라이 O157 Z3206 의 뉴클레오타이드 서열

길이: 993

유형: DNA

유기체: 이. 콜라이 O157

서열:

서열번호 2 - Z3206 의 아미노산 서열

길이: 331

유형: PRT

유기체: 이. 콜라이 O157

서열:

서열번호 3 - 이. 콜라이 O55 gne 의 뉴클레오타이드 서열

위치 AF461121_1 BCT 2002년 5월 2일

정의 (UDP-GlcNAc 4-에피머라제 Gne[에스케리치아 콜라이])

수탁번호 AAL67550

길이: 993

유형: DNA

유기체: 이. 콜라이 O55

서열:

서열번호 4 - 이. 콜라이 O55 UDP - GlcNAc 4- 에피머라제 Gne 의 아미노산 서열

위치 AF461121_1

정의 (UDP-GLcNAc 4-에피머라제 Gne[에스케리치아 콜라이])

수탁번호 AAL67550

길이: 331 aa 선형

유형: PRT

유기체: 이. 콜라이 O55

서열:

서열번호 5 - 이. 콜라이 O86 gne1 의 뉴클레오타이드 서열

위치 AAO37706 BCT 2005년 12월 6일

정의 UDP-GlcNAc C4-에피머라제[에스케리치아 콜라이 O86].

수탁번호 AAO37706

길이: 993

유형: DNA

유기체: 이. 콜라이 O86

서열:

서열번호 6 - 이. 콜라이 O86 UDP - GlcNAc C4 - 에피머라제의 아미노 서열

위치 AAO37706

정의 UDP-GlcNAc C4-에피머라제[에스케리치아 콜라이 O86].

수탁번호 AAO37706

길이: 331 aa 선형

유형: PRT

유기체: 이. 콜라이 O86

서열:

서열번호 7 - 쉬겔라 보이디이 O18 gne 의 뉴클레오타이드 서열

위치 ACD09753 BCT 2008년 5월 5일

정의 UDP-N-아세틸클루코스아민 4-에피머라제[쉬겔라 보이디이 CDC 3083-94].

수탁번호 ACD09753

길이: 993

유형: DNA

유기체: 쉬겔라 보이디이 O18

서열:

서열번호 8 - 쉬겔라 보이디이 O18 UDP -N- 아세틸클루코스아민 4- 에피머라제의 아미노산 서열

위치 ACD09753

정의 UDP-N-아세틸글루코스아민 4-에피머라제[쉬겔라 보이디이 CDC 3083-94].

수탁번호 ACD09753

길이: 331 aa 선형

유형: PRT

유기체: 쉬겔라 보이디이 O18

서열:

서열번호 9 - 살모넬라 엔테리카 O30 gne 의 뉴클레오타이드 서열

위치 AAV34516 BCT 2004년 10월 25일

정의 UDP-GlcNAc 4-에피머라제[살모넬라 엔테리카 아종 살라매 혈청형 그린사이드].

수탁번호 AAV34516

길이: 993

유형: DNA

유기체: 살모넬라 엔테리카 O30

서열:

서열번호 10 - 살모넬라 엔테리카 O30 UDP - GlcNAc 4-에피머라제 의 아미노산 서열

위치 AAV34516

수탁번호 AAV34516

길이: 331 aa 선형

유형: PRT

유기체: 살모넬라 엔테리카 O30

서열:

서열번호 11 - 캄필로박터 제주니 gne의 뉴클레오타이드 서열

위치 YP_002344524 BCT 2010년 9월 14일

정의 UDP-GlcNAc/Glc 4-에피머라제[캄필로박터 제주니 아종 제주니

수탁번호 YP_002344524

길이: 987

유형: DNA

유기체: 캄필로박터 제주니

서열:

서열번호 12 - 캄필로박터 제주니 UDP - GlcNAc / Glc 4- 에피머라제의 아미노산 서열

위치 YP_002344524

수탁번호 YP_002344524

길이: 328 aa 선형

유형: PRT

유기체: 캄필로박터 제주니

서열:

서열번호 13 - 이. 콜라이 K12 galE 의 뉴클레오타이드 서열

위치 AP_001390 BCT 2010년 4월 30일

정의 UDP-갈락토스-4-에피머라제[에스케리치아 콜라이 균주 K-12 아균주 3110].

수탁번호 AP_001390

길이: 1,017

유형: DNA

유기체: 이. 콜라니 K12

서열:

서열번호 14 - 이. 콜라이 K12 UDP -갈락토스-4- 에피머라제의 아미노산 서열

위치 AP_001390

수탁번호 AP_001390

길이: 338 aa 선형

유형: PRT

유기체: 이. 콜라이 K12

서열:

서열번호 15 - 이. 콜라이 O86 gne2 의 뉴클레오타이드 서열

위치 AAV85952 BCT 2005년 3월 27일

정의 Gne[에스케리치아 콜라이 O86].

수탁번호 AAV85952

길이: 1,020

유형: DNA

유기체: 이. 콜라이 O86

서열:

서열번호 16 - 이. 콜라이 O86 Gne 의 아미노산 서열

위치 AAV85952

정의 Gne[에스케리치아 콜라이 O86].

수탁번호 AAV85952

길이: 339 aa(gne2) 선형

유형: PRT

유기체: 이. 콜라이 O86

서열:

서열번호 17 - Z3206 의 말단을 코딩하는 합성 올리고뉴클레오타이드 Z3206 -Fw(프 라이 머)의 뉴클레오타이드 서열(제한 부위에 밑줄침)

길이: 30

유형: DNA

서열:

서열번호 18 - 헤모글루티닌 태그( HA 태그)를 갖는 Z3206 의 말단을 코딩하는 합성 올리고뉴클레오타이드 Z3206 - RvHA ( 프라이머 )의 뉴클레오타이드 서열(제한 부위에 밑줄침)

길이: 60

유형: DNA

유기체:

서열:

서열번호 19 - 제한 부위에 밑줄친 합성 올리고뉴클레오타이드 gne -Fw( 프라이머 )의 뉴클레오타이드 서열

길이: 29

유형: DNA

유기체:

서열:

서열번호 20 - 제한 부위에 밑줄친 합성 올리고뉴클레오타이드 gne -RV( 프라이머 )의 뉴클레오타이드 서열

길이: 57

유형: DNA

유기체:

서열:

서열번호 21 - NheI 제한 효소의 제한 부위를 포함하는 올리고뉴클레오타이 드의 뉴클레오타이드 서열

길이: 11

유형: DNA

유기체:

서열: AAAAAGCTAGC

서열번호 22 - AscI 제한 효소의 제한 부위를 포함하는 올리고뉴클레오타이 드의 뉴클레오타이드 서열

길이: 8

유형: DNA

유기체:

서열: CCGCGCGG

서열번호 23 - C-말단 헤마글루티닌 태그를 갖는 Z3206 을 코딩하는 플라스미드 pMLBAD : Z3206 (이. 콜라이 O157 을 플라스미드에 삽입함)의 뉴클레오타이드 서열

정의 Z3206-pMLDAD*로 생성물의 결찰

특징 위치/정성자(qualifier)

CDS 2105..3098

/표지=Z3206

CDS 3098..3127

/표지=HA

길이: 7794 bp

유형: DNA 원형 UNA

서열:

서열번호 24 - C-말단 헤마글루티닌 태그로 Gne 를 코딩하는 pMLBAD :gne(이 콜라이 O157 을 플라스미드에 삽입함)의 뉴클레오타이드 서열

위치 gne-pMLBAD

정의 pmlbad did(NcoI-XbaI)로 dig galE의 결찰

특징 위치/정성자

CDS 2097..3080

/표지=galE

CDS 3081..3107

/표지=HA

영역 3108..3110

/표지=정지

길이: 7776 bp

유형: DNA 원형 UNA

서열:

서열번호 25 - 단일 서열을 갖는 개질된 EPA 의 아미노산 서열

국제특허출원공개 제2009/104074호(서열번호 6)에 기재됨

유형: PRT

유기체: 인공

/주의="인공 서열: 합성 폴리펩타이드의 기술"

길이: 643

서열:

서열번호 26 - PgIB 의 아미노산 서열

국제특허출원공개 제2009/104074호(서열번호 2)에 기재됨

길이: 722

유형: PRT

유기체: 캄필로박터 제주니

서열:

서열번호 27 - pCC1FOS 공 플라스미드의 뉴클레오타이드 서열

위치 MCS 카세트를 가진 pCC1FOS

특징 위치/정성자

영역 230..256

/표지="pCC1/pEpiFOS fwd"

영역 311..330

/표지="T7 프로모터"

영역 보완(504..529)

/표지="pCC1pEpiFOS rv"

CDS 보완(805..529)

/표지=cat

CDS 1683..2030

/표지=redF

CDS 3425..4180

/표지=repE

CDS 4759..5934

/표지=parA

CDS 5934..6905

/표지=parB

기원

길이: 8171 bp

유형: DNA 원형 UNA

유기체: 인공

서열:

서열번호 28 - pCC1FOS 절단( pFOS ) 및 Z3206 없는 쉬겔라 플렉스네리 6 O-항원의 뉴클레오타이드 서열

위치 pFOS 절단 및 O-항원 절단(-Z3206)

정의 NheI 및 AscI를 갖는 galFNheI 및 wzzAscI로 증폭된 쉬겔라 플렉스네리 6 O-항원 클러스터로의 NheI 및 AscI를 갖는 MCS 카세트 절단을 갖는 전환된 pCC1FOS의 결찰

특징 위치/정성자

CDS 3..411

/표지='galF

CDS 784..1869

/표지=rmlB

CDS 1869..2768

/표지=rmlD

CDS 2826..3704

/표지=rmlA

CDS 3709..4266

/표지=rmlC

CDS 4263..5495

/표지=wzx

CDS 5551..6738

/표지=wzy

CDS 6755..7624

/표지=wfbY

CDS 7621..8454

/표지=wfbZ

CDS 8599..9965

/표지=gnd

CDS 10187..11380

/표지=ugd

CDS 보완(11446..12450)

/표지=uge

CDS 12802..12828

/표지=wzz'

영역 보완(12868..12887)

/표지="T7 프로모터"

영역 보완(12942..12968)

/표지="pCC1/pEpiFOS fwd"

CDS 보완(14460..15431)

/표지=parB

CDS 보완(15431..16606)

/표지=parA

CDS 보완(17185..17940)

/표지=repE

CDS 보완(19335..19682)

/표지=redF

CDS 19901..20560

/표지=cat

영역 20836..20861

/표지="pCC1pEpiFOS rv"

길이: 20982 bp

유형: DNA 원형 UNA

서열:

서열번호 29 - pCC1FOS 절단( pFOS ) 및 Z3206 을 갖는 쉬겔라 플렉스네리 6 O-항원의 뉴클레오타이드 서열

위치 pFOS 절단 및 O-항원 절단(Z3206+)

정의 NheI 및 AscI를 갖는 MCS 카세트 절단을 갖는 pCC1FOS로의 NheI 및 AscI를 갖는 Z3206Nhe 및 wzzAscI를 증폭된 전환된 쉬겔라 플렉스네리 6 O 항원 클러스터의 결찰

특징 위치/정성자

CDS 보완(370..396)

/표지=wzz'

CDS 748..1752

/표지=uge

CDS 보완(1818..3011)

/표지=ugd

CDS 보완(3233..4639)

/표지=gnd

CDS 보완(4744..5577)

/표지=wfbZ

CDS 보완(5574..6443)

/표지=wfbY

CDS 보완(6460..7647)

/표지=wzy

CDS 보완(7703..8935)

/표지=wzx

CDS 보완(8932..9489)

/표지=rmlC

CDS 보완(9494..10372)

/표지=rmlA

CDS 보완(10430..11329)

/표지=rmlD

CDS 보완(11329..12414)

/표지=rmlB

CDS 보완(12787..13680)

/표지=galF

CDS 보완(13912..14907)

/표지=Z3206

CDS 보완(15065..15097)

/표지='wcaM

CDS 보완(15525..16184)

/표지=cat

CDS 16403..16750

/표지=redF

CDS 18145..18900

/표지=repE

CDS 19479..20654

/표지=parA

CDS 20654..21625

/표지=parB

길이: 22887 bp

유형: DNA 원형 UNA

서열:

<110> GLYCOVAXYN AG <120> BIOSYNTHETIC SYSTEM THAT PRODUCES IMMUNOGENIC POLYSACCHARIDES IN PROKARYOTIC CELLS <130> 031229.0005-WO01 <140> PCT/US2010/02980 <141> 2010-11-16 <150> US 61/272,931 <151> 2009-11-19 <160> 30 <170> PatentIn version 3.5 <210> 1 <211> 993 <212> DNA <213> Escherichia coli <400> 1 atgaacgata acgttttgct cataggagct tccggattcg taggaacccg actacttgaa 60 acggcaattg ctgactttaa tatcaagaac ctggacaaac agcagagcca cttttatcca 120 gaaatcacac agattggcga tgttcgcgat caacaggcac tcgaccaggc gttagtcggt 180 tttgacactg ttgtactact ggcagcggaa caccgcgatg acgtcagccc tacttctctc 240 tattatgatg tcaacgttca gggtacccgc aatgtgctgg cggccatgga aaaaaatggc 300 gttaaaaata tcatctttac cagttccgtt gctgtttatg gtttgaacaa acacaaccct 360 gacgaaaacc atccacacga ccctttcaac cactacggca aaagtaagtg gcaggcagag 420 gaagtgctgc gtgaatggta taacaaagca ccaacagaac gttcattaac catcatccgt 480 cctaccgtta tcttcggtga acgcaaccgc ggtaacgtct ataacttgct gaaacagatc 540 gctggcggca agtttatgat ggtgggcgca gggactaact ataagtccat ggcttatgtt 600 ggaaacattg ttgagtttat caagtacaaa ctgaagaatg ttgccgcagg ttatgaggtt 660 tataactacg ttgataagcc agacctgaac atgaaccagt tggttgctga agttgaacaa 720 agcctgaaca aaaagatccc ttctatgcac ttgccttacc cactaggaat gctgggtgga 780 tattgctttg atatcctgag caaaattacg ggcaaaaaat acgctgtcag ctcagtgcgc 840 gtgaaaaaat tctgcgcaac aacacagttt gacgcaacga aagtgcattc ttcaggtttt 900 gtggcaccgt atacgctgtc gcaaggtctg gatcgaacac tgcagtatga attcgttcat 960 gccaaaaaag acgacataac gtttgtttct gag 993 <210> 2 <211> 331 <212> PRT <213> Escherichia coli <400> 2 Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr 1 5 10 15 Arg Leu Leu Glu Thr Ala Ile Ala Asp Phe Asn Ile Lys Asn Leu Asp 20 25 30 Lys Gln Gln Ser His Phe Tyr Pro Glu Ile Thr Gln Ile Gly Asp Val 35 40 45 Arg Asp Gln Gln Ala Leu Asp Gln Ala Leu Val Gly Phe Asp Thr Val 50 55 60 Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu 65 70 75 80 Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met 85 90 95 Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val 100 105 110 Tyr Gly Leu Asn Lys His Asn Pro Asp Glu Asn His Pro His Asp Pro 115 120 125 Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg 130 135 140 Glu Trp Tyr Asn Lys Ala Pro Thr Glu Arg Ser Leu Thr Ile Ile Arg 145 150 155 160 Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu 165 170 175 Leu Lys Gln Ile Ala Gly Gly Lys Phe Met Met Val Gly Ala Gly Thr 180 185 190 Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys 195 200 205 Tyr Lys Leu Lys Asn Val Ala Ala Gly Tyr Glu Val Tyr Asn Tyr Val 210 215 220 Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln 225 230 235 240 Ser Leu Asn Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly 245 250 255 Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Ile Thr Gly Lys 260 265 270 Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr 275 280 285 Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr 290 295 300 Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His 305 310 315 320 Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu 325 330 <210> 3 <211> 993 <212> DNA <213> Escherichia coli <400> 3 atgaacgata acgttttgct cataggagct tccggattcg taggaacccg actacttgaa 60 acggcaattg ctgactttaa tatcaagaac ctggacaaac agcagagcca cttttatcca 120 gaaatcacac agattggtga tgttcgtgat caacaggcac tcgaccaggc gttagccggt 180 tttgacactg ttgtgctact ggcagcggaa caccgcgatg acgtcagccc tacttctctc 240 tattatgatg tcaacgttca gggtacccgc aatgtgctgg cggccatgga aaaaaatggc 300 gttaaaaata tcatctttac cagttccgtt gctgtttatg gtttgaacaa acacaaccct 360 gacgaaaacc atccacacga tcctttcaac cactacggca aaagtaagtg gcaggcagag 420 gaagtgctgc gtgaatggta taacaaagca ccaacagaac gttcattaac catcatccgt 480 cctaccgtta tcttcggtga acggaaccgc ggtaacgtct ataacttgct gaaacagatc 540 gctggcggca agtttatgat ggtgggcgca gggactaact ataagtccat ggcttatgtt 600 ggaaacattg ttgagtttat caagtacaaa ctgaagaatg ttgccgcagg ttacgaggtt 660 tataactacg ttgataagcc agacctgaac atgaaccagt tggttgctga agttgaacaa 720 agcctgaaca aaaagatccc ttctatgcac ttgccttacc cactaggaat gctgggtgga 780 tattgctttg atatcctgag caaaattacg ggcaaaaaat acgctgtcag ctctgtgcgc 840 gtgaaaaaat tctgcgcaac aacacagttt gacgcaacga aagtgcattc ttcaggtttt 900 gtggcaccgt atacgctgtc gcaaggtctg gatcgaactc tgcagtatga attcgtccat 960 gccaaaaaag acgacataac gtttgtttct gag 993 <210> 4 <211> 331 <212> PRT <213> Escherichia coli <400> 4 Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr 1 5 10 15 Arg Leu Leu Glu Thr Ala Ile Ala Asp Phe Asn Ile Lys Asn Leu Asp 20 25 30 Lys Gln Gln Ser His Phe Tyr Pro Glu Ile Thr Gln Ile Gly Asp Val 35 40 45 Arg Asp Gln Gln Ala Leu Asp Gln Ala Leu Ala Gly Phe Asp Thr Val 50 55 60 Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu 65 70 75 80 Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met 85 90 95 Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val 100 105 110 Tyr Gly Leu Asn Lys His Asn Pro Asp Glu Asn His Pro His Asp Pro 115 120 125 Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg 130 135 140 Glu Trp Tyr Asn Lys Ala Pro Thr Glu Arg Ser Leu Thr Ile Ile Arg 145 150 155 160 Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu 165 170 175 Leu Lys Gln Ile Ala Gly Gly Lys Phe Met Met Val Gly Ala Gly Thr 180 185 190 Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys 195 200 205 Tyr Lys Leu Lys Asn Val Ala Ala Gly Tyr Glu Val Tyr Asn Tyr Val 210 215 220 Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln 225 230 235 240 Ser Leu Asn Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly 245 250 255 Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Ile Thr Gly Lys 260 265 270 Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr 275 280 285 Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr 290 295 300 Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His 305 310 315 320 Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu 325 330 <210> 5 <211> 993 <212> DNA <213> Escherichia coli <400> 5 atgaacgata acgttttgct cataggagct tccggattcg taggaacccg actacttgaa 60 acggcaattg ctgactttaa tatcaagaac ctggacaaac agcagagcca cttttatcca 120 gaaatcacac agattggtga tgttcgtgat caacaggcac tcgaccaggc gttagccggt 180 tttgacactg ttgtactact ggcagcggaa caccgcgatg acgtcagccc tacttctctc 240 tattatgatg tcaacgttca gggtacccgc aatgtgctgg cggccatgga aaaaaatggc 300 gttaaaaata tcatctttac cagttccgtt gctgtttatg gtttgaacaa acacaaccct 360 gacgaaaacc atccacacga ccctttcaac cactacggca aaagcaagtg gcaggcggag 420 gaagtgctgc gtgaatggta taacaaagca ccaacagaac gttcattaac tatcatccgt 480 cctaccgtta tcttcggtga acgcaaccgc ggtaacgtct ataacttgct gaaacagatc 540 gctggcggca agtttatgat ggtgggcgca gggactaact ataagtccat ggcttatgtt 600 ggaaacattg ttgagtttat caagtacaaa ctgaagaatg ttgccgcagg ttacgaggtt 660 tataactacg ttgataagcc agacctgaac atgaaccagt tggttgctga agttgaacaa 720 agcctgaaca aaaagatccc ttctatgcac ttgccttacc cactaggaat gctgggtgga 780 tattgctttg atatcctgag caaaattacg ggcaaaaaat acgctgtcag ctctgtgcgc 840 gtgaaaaaat tctgcgcaac aacacagttt gacgcaacga aagtgcattc ttcaggtttt 900 gtggcaccgt atacgctgtc gcaaggtctg gatcgaactc tgcagtatga attcgtccat 960 gccaaaaaag acgacataac gtttgtttct gag 993 <210> 6 <211> 331 <212> PRT <213> Escherichia coli <400> 6 Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr 1 5 10 15 Arg Leu Leu Glu Thr Ala Ile Ala Asp Phe Asn Ile Lys Asn Leu Asp 20 25 30 Lys Gln Gln Ser His Phe Tyr Pro Glu Ile Thr Gln Ile Gly Asp Val 35 40 45 Arg Asp Gln Gln Ala Leu Asp Gln Ala Leu Ala Gly Phe Asp Thr Val 50 55 60 Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu 65 70 75 80 Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met 85 90 95 Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val 100 105 110 Tyr Gly Leu Asn Lys His Asn Pro Asp Glu Asn His Pro His Asp Pro 115 120 125 Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg 130 135 140 Glu Trp Tyr Asn Lys Ala Pro Thr Glu Arg Ser Leu Thr Ile Ile Arg 145 150 155 160 Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu 165 170 175 Leu Lys Gln Ile Ala Gly Gly Lys Phe Met Met Val Gly Ala Gly Thr 180 185 190 Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys 195 200 205 Tyr Lys Leu Lys Asn Val Ala Ala Gly Tyr Glu Val Tyr Asn Tyr Val 210 215 220 Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln 225 230 235 240 Ser Leu Asn Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly 245 250 255 Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Ile Thr Gly Lys 260 265 270 Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr 275 280 285 Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr 290 295 300 Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His 305 310 315 320 Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu 325 330 <210> 7 <211> 993 <212> DNA <213> Shigella boydii <400> 7 atgaacgata acgttttgct cataggagct tccggattcg taggaacccg actacttgaa 60 acggcaattg ctgactttaa tatcaagaac ctggacaaac agcagagcca tttttatcca 120 gcaatcacac agattggcga tgttcgtgat caacaggcac tcgaccaggc gttagccggt 180 tttgacactg ttgtactact ggcagcggaa caccgcgatg acgtcagccc tacttctctc 240 tattatgatg tcaacgttca gggtacccgc aatgtgctgg cggccatgga aaaaaatggc 300 gttaaaaata tcatctttac cagttccgtt gctgtttatg gtttgaacaa acacaaccct 360 gacgaaaacc atccacacga ccctttcaac cactacggca aaagtaagtg gcaggcagag 420 gaagtgctgc gtgaatggta taacaaagca ccaacagaac gttcattaac catcatccgt 480 cctaccgtta tcttcggtga acgcaaccgc ggtaacgtct ataacttgct gaaacagatc 540 gctggcggca agtttatgat ggtgggcgca gggactaact ataagtccat ggcttatgtt 600 ggaaacattg ttgagtttat caagtacaaa ctgaagaatg ttgccgcagg ttatgaggtt 660 tataactatg ttgataagcc agacctgaac atgaaccagt tggttgctga agttgaacaa 720 agcctgaaca aaaagatccc ttctatgcac ttgccttacc cactaggaat gctgggtgga 780 tattgctttg atatcctgag caaaattacg ggcaaaaaat acgctgtcag ctctgtgcgc 840 gtgaaaaaat tctgcgcaac aacacagttt gacgcaacga aagtgcattc ttcaggtttt 900 gtggcaccgt atacgctgtc gcaaggtctg gatcgaactc tgcagtatga attcgtccat 960 gccaaaaaag acgacataac gtttgtttct gag 993 <210> 8 <211> 331 <212> PRT <213> Shigella boydii <400> 8 Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr 1 5 10 15 Arg Leu Leu Glu Thr Ala Ile Ala Asp Phe Asn Ile Lys Asn Leu Asp 20 25 30 Lys Gln Gln Ser His Phe Tyr Pro Ala Ile Thr Gln Ile Gly Asp Val 35 40 45 Arg Asp Gln Gln Ala Leu Asp Gln Ala Leu Ala Gly Phe Asp Thr Val 50 55 60 Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu 65 70 75 80 Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met 85 90 95 Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val 100 105 110 Tyr Gly Leu Asn Lys His Asn Pro Asp Glu Asn His Pro His Asp Pro 115 120 125 Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg 130 135 140 Glu Trp Tyr Asn Lys Ala Pro Thr Glu Arg Ser Leu Thr Ile Ile Arg 145 150 155 160 Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu 165 170 175 Leu Lys Gln Ile Ala Gly Gly Lys Phe Met Met Val Gly Ala Gly Thr 180 185 190 Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys 195 200 205 Tyr Lys Leu Lys Asn Val Ala Ala Gly Tyr Glu Val Tyr Asn Tyr Val 210 215 220 Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln 225 230 235 240 Ser Leu Asn Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly 245 250 255 Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Ile Thr Gly Lys 260 265 270 Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr 275 280 285 Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr 290 295 300 Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His 305 310 315 320 Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu 325 330 <210> 9 <211> 993 <212> DNA <213> Salmonella enterica <400> 9 atgaacgata acgttttgct cattggtgct tccggattcg taggaacccg actccttgaa 60 acggcagtgg atgattttaa tatcaagaac ctggataaac agcaaagcca tttctaccca 120 gagattacac acattggcga tgttcgtgac caacaaatcc ttgaccagac gttggtgggt 180 tttgacaccg tagtactatt ggctgcggag catcgtgatg atgttagtcc tacctcgctt 240 tattatgatg tcaacgtcca gggaacgcgt aatgtactgg cggcgatgga aaaaaatggt 300 gtaaaaaata tcatttttac cagttccgtt gcagtttatg gactcaacaa gaaaaatcct 360 gacgaaacgc accctcacga tccctttaat cattacggaa aaagtaaatg gcaagcagaa 420 gaagttctgc gtgagtggca tgctaaagcg ccgaatgagc gttctttgac cataattcgt 480 cctaccgtta ttttcgggga gcgtaaccgc ggtaatgtat acaatctctt gaaacagatc 540 gctggtggta aatttgcgat ggttggtccg ggaactaact ataaatcaat ggcttatgtt 600 ggtaatatcg ttgagtttat caaattcaaa ctcaagaatg ttacggcggg ctatgaagtt 660 tataattatg ttgataaacc tgatctgaat atgaatcaat tggttgctga agtagagcag 720 agcctgggca aaaaaatacc atcgatgcac cttccatatc cattaggtat gctggggggt 780 tactgtttcg atatcctgag caaagtaacg ggcaagaagt acgctgtaag ttcggttcgt 840 gttaaaaaat tctgtgcgac aacgcagttt gatgcaacaa aagtgcattc ttctggtttt 900 gttgcgccat acaccttatc tcaggggttg gatcgtacac tgcaatatga atttgttcat 960 gcaaagaaag atgacattac attcgtttca gag 993 <210> 10 <211> 331 <212> PRT <213> Salmonella enterica <400> 10 Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr 1 5 10 15 Arg Leu Leu Glu Thr Ala Val Asp Asp Phe Asn Ile Lys Asn Leu Asp 20 25 30 Lys Gln Gln Ser His Phe Tyr Pro Glu Ile Thr His Ile Gly Asp Val 35 40 45 Arg Asp Gln Gln Ile Leu Asp Gln Thr Leu Val Gly Phe Asp Thr Val 50 55 60 Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu 65 70 75 80 Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met 85 90 95 Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val 100 105 110 Tyr Gly Leu Asn Lys Lys Asn Pro Asp Glu Thr His Pro His Asp Pro 115 120 125 Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg 130 135 140 Glu Trp His Ala Lys Ala Pro Asn Glu Arg Ser Leu Thr Ile Ile Arg 145 150 155 160 Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu 165 170 175 Leu Lys Gln Ile Ala Gly Gly Lys Phe Ala Met Val Gly Pro Gly Thr 180 185 190 Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys 195 200 205 Phe Lys Leu Lys Asn Val Thr Ala Gly Tyr Glu Val Tyr Asn Tyr Val 210 215 220 Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln 225 230 235 240 Ser Leu Gly Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly 245 250 255 Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Val Thr Gly Lys 260 265 270 Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr 275 280 285 Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr 290 295 300 Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His 305 310 315 320 Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu 325 330 <210> 11 <211> 987 <212> DNA <213> Campylobacter jejuni <400> 11 atgaaaattc ttattagcgg tggtgcaggt tatataggtt ctcatacttt aagacaattt 60 ttaaaaacag atcatgaaat ttgtgtttta gataatcttt ctaagggttc taaaatcgca 120 atagaagatt tgcaaaaaac aagagctttt aaatttttcg aacaagattt aagtgatttt 180 caaggcgtaa aagcattgtt tgagagagaa aaatttgacg ctattgtgca ttttgcagca 240 agcattgaag tttttgaaag tatgcaaaat cctttaaaat attatatgaa caacactgtt 300 aatacgacaa atctcatcga aacttgtttg caaactggag tgaataaatt tatattttct 360 tcaacggcgg ccacttatgg cgaaccacaa actcccgttg tgagcgaaac aagtccttta 420 gcacctatta atccttatgg gcgtagtaag cttatgagtg aagaagtttt gcgtgatgca 480 agtatggcaa atcctgaatt taagcattgt attttaagat attttaatgt tgcaggtgct 540 tgtatggatt atactttagg acaacgctat ccaaaagcga ctttgcttat aaaagttgca 600 gctgaatgtg ccgcaggaaa acgtgataaa cttttcatat ttggcgatga ttatgataca 660 aaagatggta cttgcataag agattttatc catgtagatg atatttcaag tgcacattta 720 gcggctttgg attatttaaa agagaatgaa agcaatgttt ttaatgtagg ttatggacat 780 ggttttagcg taaaagaagt gattgaagcg atgaaaaaag ttagcggagt ggattttaaa 840 gtagaacttg ccccacgccg tgcgggtgat cctagtgtat tgatttctga tgcaagtaaa 900 atcagaaatc ttacttcttg gcagcctaaa tatgatgatt tagagcttat ttgtaaatct 960 gcttttgatt gggaaaaaca gtgttaa 987 <210> 12 <211> 328 <212> PRT <213> Campylobacter jejuni <400> 12 Met Lys Ile Leu Ile Ser Gly Gly Ala Gly Tyr Ile Gly Ser His Thr 1 5 10 15 Leu Arg Gln Phe Leu Lys Thr Asp His Glu Ile Cys Val Leu Asp Asn 20 25 30 Leu Ser Lys Gly Ser Lys Ile Ala Ile Glu Asp Leu Gln Lys Thr Arg 35 40 45 Ala Phe Lys Phe Phe Glu Gln Asp Leu Ser Asp Phe Gln Gly Val Lys 50 55 60 Ala Leu Phe Glu Arg Glu Lys Phe Asp Ala Ile Val His Phe Ala Ala 65 70 75 80 Ser Ile Glu Val Phe Glu Ser Met Gln Asn Pro Leu Lys Tyr Tyr Met 85 90 95 Asn Asn Thr Val Asn Thr Thr Asn Leu Ile Glu Thr Cys Leu Gln Thr 100 105 110 Gly Val Asn Lys Phe Ile Phe Ser Ser Thr Ala Ala Thr Tyr Gly Glu 115 120 125 Pro Gln Thr Pro Val Val Ser Glu Thr Ser Pro Leu Ala Pro Ile Asn 130 135 140 Pro Tyr Gly Arg Ser Lys Leu Met Ser Glu Glu Val Leu Arg Asp Ala 145 150 155 160 Ser Met Ala Asn Pro Glu Phe Lys His Cys Ile Leu Arg Tyr Phe Asn 165 170 175 Val Ala Gly Ala Cys Met Asp Tyr Thr Leu Gly Gln Arg Tyr Pro Lys 180 185 190 Ala Thr Leu Leu Ile Lys Val Ala Ala Glu Cys Ala Ala Gly Lys Arg 195 200 205 Asp Lys Leu Phe Ile Phe Gly Asp Asp Tyr Asp Thr Lys Asp Gly Thr 210 215 220 Cys Ile Arg Asp Phe Ile His Val Asp Asp Ile Ser Ser Ala His Leu 225 230 235 240 Ala Ala Leu Asp Tyr Leu Lys Glu Asn Glu Ser Asn Val Phe Asn Val 245 250 255 Gly Tyr Gly His Gly Phe Ser Val Lys Glu Val Ile Glu Ala Met Lys 260 265 270 Lys Val Ser Gly Val Asp Phe Lys Val Glu Leu Ala Pro Arg Arg Ala 275 280 285 Gly Asp Pro Ser Val Leu Ile Ser Asp Ala Ser Lys Ile Arg Asn Leu 290 295 300 Thr Ser Trp Gln Pro Lys Tyr Asp Asp Leu Glu Leu Ile Cys Lys Ser 305 310 315 320 Ala Phe Asp Trp Glu Lys Gln Cys 325 <210> 13 <211> 1017 <212> DNA <213> Escherichia coli <400> 13 atgagagttc tggttaccgg tggtagcggt tacattggaa gtcatacctg tgtgcaatta 60 ctgcaaaacg gtcatgatgt catcattctt gataacctct gtaacagtaa gcgcagcgta 120 ctgcctgtta tcgagcgttt aggcggcaaa catccaacgt ttgttgaagg cgatattcgt 180 aacgaagcgt tgatgaccga gatcctgcac gatcacgcta tcgacaccgt gatccacttc 240 gccgggctga aagccgtggg cgaatcggta caaaaaccgc tggaatatta cgacaacaat 300 gtcaacggca ctctgcgcct gattagcgcc atgcgcgccg ctaacgtcaa aaactttatt 360 tttagctcct ccgccaccgt ttatggcgat cagcccaaaa ttccatacgt tgaaagcttc 420 ccgaccggca caccgcaaag cccttacggc aaaagcaagc tgatggtgga acagatcctc 480 accgatctgc aaaaagccca gccggactgg agcattgccc tgctgcgcta cttcaacccg 540 gttggcgcgc atccgtcggg cgatatgggc gaagatccgc aaggcattcc gaataacctg 600 atgccataca tcgcccaggt tgctgtaggc cgtcgcgact cgctggcgat ttttggtaac 660 gattatccga ccgaagatgg tactggcgta cgcgattaca tccacgtaat ggatctggcg 720 gacggtcacg tcgtggcgat ggaaaaactg gcgaacaagc caggcgtaca catctacaac 780 ctcggcgctg gcgtaggcaa cagcgtgctg gacgtggtta atgccttcag caaagcctgc 840 ggcaaaccgg ttaattatca ttttgcaccg cgtcgcgagg gcgaccttcc ggcctactgg 900 gcggacgcca gcaaagccga ccgtgaactg aactggcgcg taacgcgcac actcgatgaa 960 atggcgcagg acacctggca ctggcagtca cgccatccac agggatatcc cgattaa 1017 <210> 14 <211> 338 <212> PRT <213> Escherichia coli <400> 14 Met Arg Val Leu Val Thr Gly Gly Ser Gly Tyr Ile Gly Ser His Thr 1 5 10 15 Cys Val Gln Leu Leu Gln Asn Gly His Asp Val Ile Ile Leu Asp Asn 20 25 30 Leu Cys Asn Ser Lys Arg Ser Val Leu Pro Val Ile Glu Arg Leu Gly 35 40 45 Gly Lys His Pro Thr Phe Val Glu Gly Asp Ile Arg Asn Glu Ala Leu 50 55 60 Met Thr Glu Ile Leu His Asp His Ala Ile Asp Thr Val Ile His Phe 65 70 75 80 Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Glu Tyr 85 90 95 Tyr Asp Asn Asn Val Asn Gly Thr Leu Arg Leu Ile Ser Ala Met Arg 100 105 110 Ala Ala Asn Val Lys Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr 115 120 125 Gly Asp Gln Pro Lys Ile Pro Tyr Val Glu Ser Phe Pro Thr Gly Thr 130 135 140 Pro Gln Ser Pro Tyr Gly Lys Ser Lys Leu Met Val Glu Gln Ile Leu 145 150 155 160 Thr Asp Leu Gln Lys Ala Gln Pro Asp Trp Ser Ile Ala Leu Leu Arg 165 170 175 Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Asp Met Gly Glu Asp 180 185 190 Pro Gln Gly Ile Pro Asn Asn Leu Met Pro Tyr Ile Ala Gln Val Ala 195 200 205 Val Gly Arg Arg Asp Ser Leu Ala Ile Phe Gly Asn Asp Tyr Pro Thr 210 215 220 Glu Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala 225 230 235 240 Asp Gly His Val Val Ala Met Glu Lys Leu Ala Asn Lys Pro Gly Val 245 250 255 His Ile Tyr Asn Leu Gly Ala Gly Val Gly Asn Ser Val Leu Asp Val 260 265 270 Val Asn Ala Phe Ser Lys Ala Cys Gly Lys Pro Val Asn Tyr His Phe 275 280 285 Ala Pro Arg Arg Glu Gly Asp Leu Pro Ala Tyr Trp Ala Asp Ala Ser 290 295 300 Lys Ala Asp Arg Glu Leu Asn Trp Arg Val Thr Arg Thr Leu Asp Glu 305 310 315 320 Met Ala Gln Asp Thr Trp His Trp Gln Ser Arg His Pro Gln Gly Tyr 325 330 335 Pro Asp <210> 15 <211> 1020 <212> DNA <213> Escherichia coli <400> 15 atggtgattt tcgtaacagg cggtgcagga tatattggat cccataccat acttgagtta 60 cttaataatg gtcatgatgt cgtttcgata gataattttg tcaattcctc tatagaatca 120 ttaaaaagag tagagcaaat aactaataag aaaattattt cttatcaagg tgatatccgt 180 gataaaaatc tacttgatga gattttttca agacaccata tcgatgctgt aattcacttt 240 gcatcgttaa aatctgtagg tgagtctaag ttaaagccct tagagtatta ttctaataat 300 gttggtggaa ctttagtatt acttgaatgc atgaagagat ataacattaa taaaatgata 360 tttagctctt ctgctactgt ttatgggagt aacagtatcc ctccccatac ggaagataga 420 cgaattggtg aaactacaaa cccatatggg acatcgaaat ttataataga aataattttg 480 agtgattatt gtgatagtga taataataaa tcagtaattg cactgcgtta ctttaatcca 540 atcggagcac ataagtccgg gatgattggt gaaaatccta acgggatccc taataatctg 600 gttccttata tatctaaagt tgcacaaaat caacttcctg tattaaatat ttatggcaac 660 gattatccaa ctaaagatgg tacaggagta agagactata tacatgtctg tgatttggct 720 aaagggcatg ttaaagcatt agaatatatg tttttaaatg atgtcaatta tgaagctttt 780 aatttaggta ctggtcaagg ttattctgtt ttagagattg taaaaatgtt tgagatagtc 840 actaaaaaga gtatacctgt tgctatttgt aatagacgtg agggggatgt tgcggagtca 900 tgggcgtctg ctgatttggc acataaaaag ctttcctgga aagcggaaaa aaatttgaaa 960 gaaatgatcg aagatgtatg gcgttggcaa acaaacaatc caaatggata taaaaaataa 1020 <210> 16 <211> 339 <212> PRT <213> Escherichia coli <400> 16 Met Val Ile Phe Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr 1 5 10 15 Ile Leu Glu Leu Leu Asn Asn Gly His Asp Val Val Ser Ile Asp Asn 20 25 30 Phe Val Asn Ser Ser Ile Glu Ser Leu Lys Arg Val Glu Gln Ile Thr 35 40 45 Asn Lys Lys Ile Ile Ser Tyr Gln Gly Asp Ile Arg Asp Lys Asn Leu 50 55 60 Leu Asp Glu Ile Phe Ser Arg His His Ile Asp Ala Val Ile His Phe 65 70 75 80 Ala Ser Leu Lys Ser Val Gly Glu Ser Lys Leu Lys Pro Leu Glu Tyr 85 90 95 Tyr Ser Asn Asn Val Gly Gly Thr Leu Val Leu Leu Glu Cys Met Lys 100 105 110 Arg Tyr Asn Ile Asn Lys Met Ile Phe Ser Ser Ser Ala Thr Val Tyr 115 120 125 Gly Ser Asn Ser Ile Pro Pro His Thr Glu Asp Arg Arg Ile Gly Glu 130 135 140 Thr Thr Asn Pro Tyr Gly Thr Ser Lys Phe Ile Ile Glu Ile Ile Leu 145 150 155 160 Ser Asp Tyr Cys Asp Ser Asp Asn Asn Lys Ser Val Ile Ala Leu Arg 165 170 175 Tyr Phe Asn Pro Ile Gly Ala His Lys Ser Gly Met Ile Gly Glu Asn 180 185 190 Pro Asn Gly Ile Pro Asn Asn Leu Val Pro Tyr Ile Ser Lys Val Ala 195 200 205 Gln Asn Gln Leu Pro Val Leu Asn Ile Tyr Gly Asn Asp Tyr Pro Thr 210 215 220 Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Cys Asp Leu Ala 225 230 235 240 Lys Gly His Val Lys Ala Leu Glu Tyr Met Phe Leu Asn Asp Val Asn 245 250 255 Tyr Glu Ala Phe Asn Leu Gly Thr Gly Gln Gly Tyr Ser Val Leu Glu 260 265 270 Ile Val Lys Met Phe Glu Ile Val Thr Lys Lys Ser Ile Pro Val Ala 275 280 285 Ile Cys Asn Arg Arg Glu Gly Asp Val Ala Glu Ser Trp Ala Ser Ala 290 295 300 Asp Leu Ala His Lys Lys Leu Ser Trp Lys Ala Glu Lys Asn Leu Lys 305 310 315 320 Glu Met Ile Glu Asp Val Trp Arg Trp Gln Thr Asn Asn Pro Asn Gly 325 330 335 Tyr Lys Lys <210> 17 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 17 aaacccggga tgaacgataa cgttttgctc 30 <210> 18 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 18 aaatctagat taagcgtaat ctggaacatc gtatgggtac tcagaaacaa acgttatgtc 60 <210> 19 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 19 aaaccatgga tgaaaattct tattagcgg 29 <210> 20 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 20 aaatctagat taagcgtaat ctggaacatc gtatgggtag cactgttttt cccaatc 57 <210> 21 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 aaaaagctag c 11 <210> 22 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 22 ccgcgcgg 8 <210> 23 <211> 7794 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 23 tctacggggt ctgacgctca gtggaacgaa atcgatgagc tcgcacgaac ccagttgaca 60 taagcctgtt cggttcgtaa actgtaatgc aagtagcgta tgcgctcacg caactggtcc 120 agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttgttat 180 gactgttttt ttgtacagtc tagcctcggg catccaagct agctaagcgc gttacgccgt 240 gggtcgatgt ttgatgttat ggaacagcaa cgatgttacg cagcagggta gtcgccctaa 300 aacaaagtta ggcagccgtt gtgctggtgc tttctagtag ttgttgtggg gtaggcagtc 360 agagctcgat ttgcttgtcg ccataataga ttcacaagaa ggattcgaca tgggtcaaag 420 tagcgatgaa gccaacgctc ccgttgcagg gcagtttgcg cttcccctga gtgccacctt 480 tggcttaggg gatcgcgtac gcaagaaatc tggtgccgct tggcagggtc aagtcgtcgg 540 ttggtattgc acaaaactca ctcctgaagg ctatgcggtc gagtccgaat cccacccagg 600 ctcagtgcaa atttatcctg tggctgcact tgaacgtgtg gcctaagcga tatcttagga 660 tctcccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat 720 gccggccacg atgcgtccgg cgtagaggat ctgctcatgt ttgacagctt atcatcgatg 780 cataatgtgc ctgtcaaatg gacgaagcag ggattctgca aaccctatgc tactccgtca 840 agccgtcaat tgtctgattc gttaccaatt atgacaactt gacggctaca tcattcactt 900 tttcttcaca accggcacgg aactcgctcg ggctggcccc ggtgcatttt ttaaataccc 960 gcgagaaata gagttgatcg tcaaaaccaa cattgcgacc gacggtggcg ataggcatcc 1020 gggtggtgct caaaagcagc ttcgcctggc tgatacgttg gtcctcgcgc cagcttaaga 1080 cgctaatccc taactgctgg cggaaaagat gtgacagacg cgacggcgac aagcaaacat 1140 gctgtgcgac gctggcgata tcaaaattgc tgtctgccag gtgatcgctg atgtactgac 1200 aagcctcgcg tacccgatta tccatcggtg gatggagcga ctcgttaatc gcttccatgc 1260 gccgcagtaa caattgctca agcagattta tcgccagcag ctccgaatag cgcccttccc 1320 cttgcccggc gttaatgatt tgcccaaaca ggtcgctgaa atgcggctgg tgcgcttcat 1380 ccgggcgaaa gaaccccgta ttggcaaata ttgacggcca gttaagccat tcatgccagt 1440 aggcgcgcgg acgaaagtaa acccactggt gataccattc gcgagcctcc ggatgacgac 1500 cgtagtgatg aatctctcct ggcgggaaca gcaaaatatc acccggtcgg caaacaaatt 1560 ctcgtccctg atttttcacc accccctgac cgcgaatggt gagattgaga atataacctt 1620 tcattcccag cggtcggtcg ataaaaaaat cgagataacc gttggcctca atcggcgtta 1680 aacccgccac cagatgggca ttaaacgagt atcccggcag caggggatca ttttgcgctt 1740 cagccatact tttcatactc ccgccattca gagaagaaac caattgtcca tattgcatca 1800 gacattgccg tcactgcgtc ttttactggc tcttctcgct aaccaaaccg gtaaccccgc 1860 ttattaaaag cattctgtaa caaagcggga ccaaagccat gacaaaaacg cgtaacaaaa 1920 gtgtctataa tcacggcaga aaagtccaca ttgattattt gcacggcgtc acactttgct 1980 atgccatagc atttttatcc ataagattag cggatcctac ctgacgcttt ttatcgcaac 2040 tctctactgt ttctccatac ccgttttttt gggctagcag gaggaattca ccatggtacc 2100 cgggatgaac gataacgttt tgctcatagg agcttccgga ttcgtaggaa cccgactact 2160 tgaaacggca attgctgact ttaatatcaa gaacctggac aaacagcaga gccactttta 2220 tccagaaatc acacagattg gcgatgttcg cgatcaacag gcactcgacc aggcgttagt 2280 cggttttgac actgttgtac tactggcagc ggaacaccgc gatgacgtca gccctacttc 2340 tctctattat gatgtcaacg ttcagggtac ccgcaatgtg ctggcggcca tggaaaaaaa 2400 tggcgttaaa aatatcatct ttaccagttc cgttgctgtt tatggtttga acaaacacaa 2460 ccctgacgaa aaccatccac acgacccttt caaccactac ggcaaaagta agtggcaggc 2520 agaggaagtg ctgcgtgaat ggtataacaa agcaccaaca gaacgttcat taaccatcat 2580 ccgtcctacc gttatcttcg gtgaacgcaa ccgcggtaac gtctataact tgctgaaaca 2640 gatcgctggc ggcaagttta tgatggtggg cgcagggact aactataagt ccatggctta 2700 tgttggaaac attgttgagt ttatcaagta caaactgaag aatgttgccg caggttatga 2760 ggtttataac tacgttgata agccagacct gaacatgaac cagttggttg ctgaagttga 2820 acaaagcctg aacaaaaaga tcccttctat gcacttgcct tacccactag gaatgctggg 2880 tggatattgc tttgatatcc tgagcaaaat tacgggcaaa aaatacgctg tcagctcagt 2940 gcgcgtgaaa aaattctgcg caacaacaca gtttgacgca acgaaagtgc attcttcagg 3000 ttttgtggca ccgtatacgc tgtcgcaagg tctggatcga acactgcagt atgaattcgt 3060 tcatgccaaa aaagacgaca taacgtttgt ttctgagtac ccatacgatg ttccagatta 3120 cgcttaatct agagtcgacc tgcaggcatg caagcttggc tgttttggcg gatgagagaa 3180 gattttcagc ctgatacaga ttaaatcaga acgcagaagc ggtctgataa aacagaattt 3240 gcctggcggc agtagcgcgg tggtcccacc tgaccccatg ccgaactcag aagtgaaacg 3300 ccgtagcgcc gatggtagtg tggggtctcc ccatgcgaga gtagggaact gccaggcatc 3360 aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg 3420 tgaacgctct cctgagtagg acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac 3480 ggcccggagg gtggcgggca ggacgcccgc cataaactgc caggcatcaa attaagcaga 3540 aggccatcct gacggatggc ctttttgcgt ttctacaaac tcttccactc actacagcag 3600 agccatttaa acaacatccc ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc 3660 tacgggcttt ttcatgccct gccctagcgt ccaagcctca cggccgcgct cggcctctct 3720 ggcggccttc tggcgctgag gtctgcctcg tgaagaaggt gttgctgact cataccaggc 3780 ctgaatcgcc ccatcatcca gccagaaagt gagggagcca cggttgatga gagctttgtt 3840 gtaggtggac cagttggtga ttttgaactt ttgctttgcc acggaacggt ctgcgttgtc 3900 gggaagatgc gtgatctgat ccttcaactc agcaaaagtt cgatttattc aacaaagccg 3960 ccgtcccgtc aagtcagcgt aatgctctgc cagtgttaca accaattaac caattctgat 4020 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 4080 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 4140 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 4200 attaatttcc cctcgtcaaa aataaggtta tcaagcgaga aatcaccatg agtgacgact 4260 gaatccggtg agaatggcaa aagctaaaaa ggccgtaata tccagctgaa cggtctggtt 4320 ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 4380 tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 4440 aaatctcgat aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt 4500 ggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc 4560 ggtatcaaca gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat 4620 ttattcgaag acgaaagggc ctcgtgatac gcctattttt ataggttaat gtcatgataa 4680 taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgcc cgcgttcctg 4740 ctggcgctgg gcctgtttct ggcgctggac ttcccgctgt tccgtcagca gcttttcgcc 4800 cacggccttg atgatcgcgg cggccttggc ctgcatatcc cgattcaacg gccccagggc 4860 gtccagaacg ggcttcaggc gctcccgaag gtctcgggcc gtctcttggg cttgatcggc 4920 cttcttgcgc atctcacgcg ctcctgcggc ggcctgtagg gcaggctcat acccctgccg 4980 aaccgctttt gtcagccggt cggccacggc ttccggcgtc tcaacgcgct ttgagattcc 5040 cagcttttcg gccaatccct gcggtgcata ggcgcgtggc tcgaccgctt gcgggctgat 5100 ggtgacgtgg cccactggtg gccgctccag ggcctcgtag aacgcctgaa tgcgcgtgtg 5160 acgtgccttg ctgccctcga tgccccgttg cagccctaga tcggccacag cggccgcaaa 5220 cgtggtctgg tcgcgggtca tctgcgcttt gttgccgatg aactccttgg ccgacagcct 5280 gccgtcctgc gtcagcggca ccacgaacgc ggtcatgtgc gggctggttt cgtcacggtg 5340 gatgctggcc gtcacgatgc gatccgcccc gtacttgtcc gccagccact tgtgcgcctt 5400 ctcgaagaac gccgcctgct gttcttggct ggccgacttc caccattccg ggctggccgt 5460 catgacgtac tcgaccgcca acacagcgtc cttgcgccgc ttctctggca gcaactcgcg 5520 cagtcggccc atcgcttcat cggtgctgct ggccgcccag tgctcgttct ctggcgtcct 5580 gctggcgtca gcgttgggcg tctcgcgctc gcggtaggcg tgcttgagac tggccgccac 5640 gttgcccatt ttcgccagct tcttgcatcg catgatcgcg tatgccgcca tgcctgcccc 5700 tcccttttgg tgtccaaccg gctcgacggg ggcagcgcaa ggcggtgcct ccggcgggcc 5760 actcaatgct tgagtatact cactagactt tgcttcgcaa agtcgtgacc gcctacggcg 5820 gctgcggcgc cctacgggct tgctctccgg gcttcgccct gcgcggtcgc tgcgctccct 5880 tgccagcccg tggatatgtg gacgatggcc gcgagcggcc accggctggc tcgcttcgct 5940 cggcccgtgg acaaccctgc tggacaagct gatggacagg ctgcgcctgc ccacgagctt 6000 gaccacaggg attgcccacc ggctacccag ccttcgacca catacccacc ggctccaact 6060 gcgcggcctg cggccttgcc ccatcaattt ttttaatttt ctctggggaa aagcctccgg 6120 cctgcggcct gcgcgcttcg cttgccggtt ggacaccaag tggaaggcgg gtcaaggctc 6180 gcgcagcgac cgcgcagcgg cttggccttg acgcgcctgg aacgacccaa gcctatgcga 6240 gtgggggcag tcgaaggcga agcccgcccg cctgcccccc gagcctcacg gcggcgagtg 6300 cgggggttcc aagggggcag cgccaccttg ggcaaggccg aaggccgcgc agtcgatcaa 6360 caagccccgg aggggccact ttttgccgga gggggagccg cgccgaaggc gtgggggaac 6420 cccgcagggg tgcccttctt tgggcaccaa agaactagat atagggcgaa atgcgaaaga 6480 cttaaaaatc aacaacttaa aaaagggggg tacgcaacag ctcattgcgg caccccccgc 6540 aatagctcat tgcgtaggtt aaagaaaatc tgtaattgac tgccactttt acgcaacgca 6600 taattgttgt cgcgctgccg aaaagttgca gctgattgcg catggtgccg caaccgtgcg 6660 gcaccctacc gcatggagat aagcatggcc acgcagtcca gagaaatcgg cattcaagcc 6720 aagaacaagc ccggtcactg ggtgcaaacg gaacgcaaag cgcatgaggc gtgggccggg 6780 cttattgcga ggaaacccac ggcggcaatg ctgctgcatc acctcgtggc gcagatgggc 6840 caccagaacg ccgtggtggt cagccagaag acactttcca agctcatcgg acgttctttg 6900 cggacggtcc aatacgcagt caaggacttg gtggccgagc gctggatctc cgtcgtgaag 6960 ctcaacggcc ccggcaccgt gtcggcctac gtggtcaatg accgcgtggc gtggggccag 7020 ccccgcgacc agttgcgcct gtcggtgttc agtgccgccg tggtggttga tcacgacgac 7080 caggacgaat cgctgttggg gcatggcgac ctgcgccgca tcccgaccct gtatccgggc 7140 gagcagcaac taccgaccgg ccccggcgag gagccgccca gccagcccgg cattccgggc 7200 atggaaccag acctgccagc cttgaccgaa acggaggaat gggaacggcg cgggcagcag 7260 cgcctgccga tgcccgatga gccgtgtttt ctggacgatg gcgagccgtt ggagccgccg 7320 acacgggtca cgctgccgcg ccggtagcac ttgggttgcg cagcaacccg taagtgcgct 7380 gttccagact atcggctgta gccgcctcgc cgccctatac cttgtctgcc tccccgcgtt 7440 gcgtcgcggt gcatggagcc gggccacctc gacctgaatg gaagccggcg gcacctcgct 7500 aacggattca ccgtttttat caggctctgg gaggcagaat aaatgatcat atcgtcaatt 7560 attacctcca cggggagagc ctgagcaaac tggcctcagg catttgagaa gcacacggtc 7620 acactgcttc cggtagtcaa taaaccggta aaccagcaat agacataagc ggctatttaa 7680 cgaccctgcc ctgaaccgac gaccgggtcg aatttgcttt cgaatttctg ccattcatcc 7740 gcttattatc acttattcag gcgtagcacc aggcgtttaa gtcgaccaat aacc 7794 <210> 24 <211> 7776 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 24 tctacggggt ctgacgctca gtggaacgaa atcgatgagc tcgcacgaac ccagttgaca 60 taagcctgtt cggttcgtaa actgtaatgc aagtagcgta tgcgctcacg caactggtcc 120 agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttgttat 180 gactgttttt ttgtacagtc tagcctcggg catccaagct agctaagcgc gttacgccgt 240 gggtcgatgt ttgatgttat ggaacagcaa cgatgttacg cagcagggta gtcgccctaa 300 aacaaagtta ggcagccgtt gtgctggtgc tttctagtag ttgttgtggg gtaggcagtc 360 agagctcgat ttgcttgtcg ccataataga ttcacaagaa ggattcgaca tgggtcaaag 420 tagcgatgaa gccaacgctc ccgttgcagg gcagtttgcg cttcccctga gtgccacctt 480 tggcttaggg gatcgcgtac gcaagaaatc tggtgccgct tggcagggtc aagtcgtcgg 540 ttggtattgc acaaaactca ctcctgaagg ctatgcggtc gagtccgaat cccacccagg 600 ctcagtgcaa atttatcctg tggctgcact tgaacgtgtg gcctaagcga tatcttagga 660 tctcccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat 720 gccggccacg atgcgtccgg cgtagaggat ctgctcatgt ttgacagctt atcatcgatg 780 cataatgtgc ctgtcaaatg gacgaagcag ggattctgca aaccctatgc tactccgtca 840 agccgtcaat tgtctgattc gttaccaatt atgacaactt gacggctaca tcattcactt 900 tttcttcaca accggcacgg aactcgctcg ggctggcccc ggtgcatttt ttaaataccc 960 gcgagaaata gagttgatcg tcaaaaccaa cattgcgacc gacggtggcg ataggcatcc 1020 gggtggtgct caaaagcagc ttcgcctggc tgatacgttg gtcctcgcgc cagcttaaga 1080 cgctaatccc taactgctgg cggaaaagat gtgacagacg cgacggcgac aagcaaacat 1140 gctgtgcgac gctggcgata tcaaaattgc tgtctgccag gtgatcgctg atgtactgac 1200 aagcctcgcg tacccgatta tccatcggtg gatggagcga ctcgttaatc gcttccatgc 1260 gccgcagtaa caattgctca agcagattta tcgccagcag ctccgaatag cgcccttccc 1320 cttgcccggc gttaatgatt tgcccaaaca ggtcgctgaa atgcggctgg tgcgcttcat 1380 ccgggcgaaa gaaccccgta ttggcaaata ttgacggcca gttaagccat tcatgccagt 1440 aggcgcgcgg acgaaagtaa acccactggt gataccattc gcgagcctcc ggatgacgac 1500 cgtagtgatg aatctctcct ggcgggaaca gcaaaatatc acccggtcgg caaacaaatt 1560 ctcgtccctg atttttcacc accccctgac cgcgaatggt gagattgaga atataacctt 1620 tcattcccag cggtcggtcg ataaaaaaat cgagataacc gttggcctca atcggcgtta 1680 aacccgccac cagatgggca ttaaacgagt atcccggcag caggggatca ttttgcgctt 1740 cagccatact tttcatactc ccgccattca gagaagaaac caattgtcca tattgcatca 1800 gacattgccg tcactgcgtc ttttactggc tcttctcgct aaccaaaccg gtaaccccgc 1860 ttattaaaag cattctgtaa caaagcggga ccaaagccat gacaaaaacg cgtaacaaaa 1920 gtgtctataa tcacggcaga aaagtccaca ttgattattt gcacggcgtc acactttgct 1980 atgccatagc atttttatcc ataagattag cggatcctac ctgacgcttt ttatcgcaac 2040 tctctactgt ttctccatac ccgttttttt gggctagcag gaggaattca ccatggatga 2100 aaattcttat tagcggtggt gcaggttata taggttctca tactttaaga caatttttaa 2160 aaacagatca tgaaatttgt gttttagata atctttctaa gggttctaaa atcgcaatag 2220 aagatttgca aaaaataaga acttttaaat tttttgaaca agatttaagt gattttcaag 2280 gcgtaaaagc attgtttgag agagaaaaat ttgacgctat tgtgcatttt gcagcgagca 2340 ttgaagtttt tgaaagtatg caaaaccctt taaagtatta tatgaataac actgttaata 2400 cgacaaatct catcgaaact tgtttgcaaa ctggagtgaa taaatttata ttttcttcaa 2460 cggcagccac ttatggcgaa ccacaaactc ccgttgtgag cgaaacaagt cctttagcac 2520 ctattaatcc ttatgggcgt agtaagctta tgagcgaaga ggttttgcgt gatgcaagta 2580 tggcaaatcc tgaatttaag cattgtattt taagatattt taatgttgca ggtgcttgca 2640 tggattatac tttaggacaa cgctatccaa aagcgacttt gcttataaaa gttgcagctg 2700 aatgtgccgc agaaaaacgt aataaacttt tcatatttgg cgatgattat gatacaaaag 2760 atggcacttg cataagagat tttatccatg tggatgatat ttcaagtgcg catttatcgg 2820 ctttggatta tttaaaagag aatgaaagca atgtttttaa tgtaggttat ggacatggtt 2880 ttagcgtaaa agaagtgatt gaagcgatga aaaaagttag cggagtggat tttaaagtag 2940 aacttgcccc acgccgtgcg ggtgatccta gtgtattgat ttctgatgca agtaaaatca 3000 gaaatcttac ttcttggcag cctaaatatg atgatttagg gcttatttgt aaatctgctt 3060 ttgattggga aaaacagtgc tacccatacg atgttccaga ttacgcttaa tctagagtcg 3120 acctgcaggc atgcaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac 3180 agattaaatc agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg 3240 cggtggtccc acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta 3300 gtgtggggtc tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct 3360 cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt 3420 aggacaaatc cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg 3480 gcaggacgcc cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat 3540 ggcctttttg cgtttctaca aactcttcca ctcactacag cagagccatt taaacaacat 3600 cccctccccc tttccaccgc gtcagacgcc cgtagcagcc cgctacgggc tttttcatgc 3660 cctgccctag cgtccaagcc tcacggccgc gctcggcctc tctggcggcc ttctggcgct 3720 gaggtctgcc tcgtgaagaa ggtgttgctg actcatacca ggcctgaatc gccccatcat 3780 ccagccagaa agtgagggag ccacggttga tgagagcttt gttgtaggtg gaccagttgg 3840 tgattttgaa cttttgcttt gccacggaac ggtctgcgtt gtcgggaaga tgcgtgatct 3900 gatccttcaa ctcagcaaaa gttcgattta ttcaacaaag ccgccgtccc gtcaagtcag 3960 cgtaatgctc tgccagtgtt acaaccaatt aaccaattct gattagaaaa actcatcgag 4020 catcaaatga aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag 4080 ccgtttctgt aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg 4140 gtatcggtct gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc 4200 aaaaataagg ttatcaagcg agaaatcacc atgagtgacg actgaatccg gtgagaatgg 4260 caaaagctaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 4320 ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 4380 atccagtgat ttttttctcc attttagctt ccttagctcc tgaaaatctc gataactcaa 4440 aaaatacgcc cggtagtgat cttatttcat tatggtgaaa gttggaacct cttacgtgcc 4500 gatcaacgtc tcattttcgc caaaagttgg cccagggctt cccggtatca acagggacac 4560 caggatttat ttattctgcg aagtgatctt ccgtcacagg tatttattcg aagacgaaag 4620 ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg 4680 tcaggtggca cttttcgggg aaatgtgcgc gcccgcgttc ctgctggcgc tgggcctgtt 4740 tctggcgctg gacttcccgc tgttccgtca gcagcttttc gcccacggcc ttgatgatcg 4800 cggcggcctt ggcctgcata tcccgattca acggccccag ggcgtccaga acgggcttca 4860 ggcgctcccg aaggtctcgg gccgtctctt gggcttgatc ggccttcttg cgcatctcac 4920 gcgctcctgc ggcggcctgt agggcaggct catacccctg ccgaaccgct tttgtcagcc 4980 ggtcggccac ggcttccggc gtctcaacgc gctttgagat tcccagcttt tcggccaatc 5040 cctgcggtgc ataggcgcgt ggctcgaccg cttgcgggct gatggtgacg tggcccactg 5100 gtggccgctc cagggcctcg tagaacgcct gaatgcgcgt gtgacgtgcc ttgctgccct 5160 cgatgccccg ttgcagccct agatcggcca cagcggccgc aaacgtggtc tggtcgcggg 5220 tcatctgcgc tttgttgccg atgaactcct tggccgacag cctgccgtcc tgcgtcagcg 5280 gcaccacgaa cgcggtcatg tgcgggctgg tttcgtcacg gtggatgctg gccgtcacga 5340 tgcgatccgc cccgtacttg tccgccagcc acttgtgcgc cttctcgaag aacgccgcct 5400 gctgttcttg gctggccgac ttccaccatt ccgggctggc cgtcatgacg tactcgaccg 5460 ccaacacagc gtccttgcgc cgcttctctg gcagcaactc gcgcagtcgg cccatcgctt 5520 catcggtgct gctggccgcc cagtgctcgt tctctggcgt cctgctggcg tcagcgttgg 5580 gcgtctcgcg ctcgcggtag gcgtgcttga gactggccgc cacgttgccc attttcgcca 5640 gcttcttgca tcgcatgatc gcgtatgccg ccatgcctgc ccctcccttt tggtgtccaa 5700 ccggctcgac gggggcagcg caaggcggtg cctccggcgg gccactcaat gcttgagtat 5760 actcactaga ctttgcttcg caaagtcgtg accgcctacg gcggctgcgg cgccctacgg 5820 gcttgctctc cgggcttcgc cctgcgcggt cgctgcgctc ccttgccagc ccgtggatat 5880 gtggacgatg gccgcgagcg gccaccggct ggctcgcttc gctcggcccg tggacaaccc 5940 tgctggacaa gctgatggac aggctgcgcc tgcccacgag cttgaccaca gggattgccc 6000 accggctacc cagccttcga ccacataccc accggctcca actgcgcggc ctgcggcctt 6060 gccccatcaa tttttttaat tttctctggg gaaaagcctc cggcctgcgg cctgcgcgct 6120 tcgcttgccg gttggacacc aagtggaagg cgggtcaagg ctcgcgcagc gaccgcgcag 6180 cggcttggcc ttgacgcgcc tggaacgacc caagcctatg cgagtggggg cagtcgaagg 6240 cgaagcccgc ccgcctgccc cccgagcctc acggcggcga gtgcgggggt tccaaggggg 6300 cagcgccacc ttgggcaagg ccgaaggccg cgcagtcgat caacaagccc cggaggggcc 6360 actttttgcc ggagggggag ccgcgccgaa ggcgtggggg aaccccgcag gggtgccctt 6420 ctttgggcac caaagaacta gatatagggc gaaatgcgaa agacttaaaa atcaacaact 6480 taaaaaaggg gggtacgcaa cagctcattg cggcaccccc cgcaatagct cattgcgtag 6540 gttaaagaaa atctgtaatt gactgccact tttacgcaac gcataattgt tgtcgcgctg 6600 ccgaaaagtt gcagctgatt gcgcatggtg ccgcaaccgt gcggcaccct accgcatgga 6660 gataagcatg gccacgcagt ccagagaaat cggcattcaa gccaagaaca agcccggtca 6720 ctgggtgcaa acggaacgca aagcgcatga ggcgtgggcc gggcttattg cgaggaaacc 6780 cacggcggca atgctgctgc atcacctcgt ggcgcagatg ggccaccaga acgccgtggt 6840 ggtcagccag aagacacttt ccaagctcat cggacgttct ttgcggacgg tccaatacgc 6900 agtcaaggac ttggtggccg agcgctggat ctccgtcgtg aagctcaacg gccccggcac 6960 cgtgtcggcc tacgtggtca atgaccgcgt ggcgtggggc cagccccgcg accagttgcg 7020 cctgtcggtg ttcagtgccg ccgtggtggt tgatcacgac gaccaggacg aatcgctgtt 7080 ggggcatggc gacctgcgcc gcatcccgac cctgtatccg ggcgagcagc aactaccgac 7140 cggccccggc gaggagccgc ccagccagcc cggcattccg ggcatggaac cagacctgcc 7200 agccttgacc gaaacggagg aatgggaacg gcgcgggcag cagcgcctgc cgatgcccga 7260 tgagccgtgt tttctggacg atggcgagcc gttggagccg ccgacacggg tcacgctgcc 7320 gcgccggtag cacttgggtt gcgcagcaac ccgtaagtgc gctgttccag actatcggct 7380 gtagccgcct cgccgcccta taccttgtct gcctccccgc gttgcgtcgc ggtgcatgga 7440 gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat tcaccgtttt 7500 tatcaggctc tgggaggcag aataaatgat catatcgtca attattacct ccacggggag 7560 agcctgagca aactggcctc aggcatttga gaagcacacg gtcacactgc ttccggtagt 7620 caataaaccg gtaaaccagc aatagacata agcggctatt taacgaccct gccctgaacc 7680 gacgaccggg tcgaatttgc tttcgaattt ctgccattca tccgcttatt atcacttatt 7740 caggcgtagc accaggcgtt taagtcgacc aataac 7776 <210> 25 <211> 643 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 25 Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser 1 5 10 15 Ala Ser Ala Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys 20 25 30 Ala Cys Val Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser 35 40 45 Val Asp Pro Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr 50 55 60 Ser Met Val Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp 65 70 75 80 Asn Ala Leu Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly 85 90 95 Gly Val Glu Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala 100 105 110 Arg Gly Ser Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys 115 120 125 Pro Ser Asn Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln 130 135 140 Leu Ser His Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu 145 150 155 160 Leu Ala Lys Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu 165 170 175 Ser Asn Glu Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser 180 185 190 Val Val Met Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu 195 200 205 Trp Ala Ser Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val 210 215 220 Tyr Asn Tyr Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu 225 230 235 240 Gly Lys Ile Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu 245 250 255 Asp Ile Lys Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg 260 265 270 Leu His Phe Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln 275 280 285 Ala Cys His Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg 290 295 300 Gly Trp Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val 305 310 315 320 Ala Leu Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val 325 330 335 Ile Arg Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu 340 345 350 Ala Ile Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala 355 360 365 Ala Ala Glu Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu 370 375 380 Ala Gly Ala Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala 385 390 395 400 Lys Asp Gln Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser 405 410 415 Gly Asp Ala Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu 420 425 430 Gly Asp Gly Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp 435 440 445 Thr Val Glu Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly 450 455 460 Tyr Val Phe Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser 465 470 475 480 Ile Val Phe Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile 485 490 495 Trp Arg Gly Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr 500 505 510 Ala Gln Asp Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala 515 520 525 Leu Leu Arg Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg 530 535 540 Thr Gly Leu Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg 545 550 555 560 Leu Ile Gly His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro 565 570 575 Glu Glu Glu Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu 580 585 590 Arg Thr Val Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val 595 600 605 Gly Gly Asp Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile 610 615 620 Ser Ala Leu Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu 625 630 635 640 Asp Leu Lys <210> 26 <211> 722 <212> PRT <213> Campylobacter jejuni <400> 26 Met Leu Lys Lys Glu Tyr Leu Lys Asn Pro Tyr Leu Val Leu Phe Ala 1 5 10 15 Met Ile Ile Leu Ala Tyr Val Phe Ser Val Phe Cys Arg Phe Tyr Trp 20 25 30 Val Trp Trp Ala Ser Glu Phe Asn Glu Tyr Phe Phe Asn Asn Gln Leu 35 40 45 Met Ile Ile Ser Asn Asp Gly Tyr Ala Phe Ala Glu Gly Ala Arg Asp 50 55 60 Met Ile Ala Gly Phe His Gln Pro Asn Asp Leu Ser Tyr Tyr Gly Ser 65 70 75 80 Ser Leu Ser Ala Leu Thr Tyr Trp Leu Tyr Lys Ile Thr Pro Phe Ser 85 90 95 Phe Glu Ser Ile Ile Leu Tyr Met Ser Thr Phe Leu Ser Ser Leu Val 100 105 110 Val Ile Pro Thr Ile Leu Leu Ala Asn Glu Tyr Lys Arg Pro Leu Met 115 120 125 Gly Phe Val Ala Ala Leu Leu Ala Ser Ile Ala Asn Ser Tyr Tyr Asn 130 135 140 Arg Thr Met Ser Gly Tyr Tyr Asp Thr Asp Met Leu Val Ile Val Leu 145 150 155 160 Pro Met Phe Ile Leu Phe Phe Met Val Arg Met Ile Leu Lys Lys Asp 165 170 175 Phe Phe Ser Leu Ile Ala Leu Pro Leu Phe Ile Gly Ile Tyr Leu Trp 180 185 190 Trp Tyr Pro Ser Ser Tyr Thr Leu Asn Val Ala Leu Ile Gly Leu Phe 195 200 205 Leu Ile Tyr Thr Leu Ile Phe His Arg Lys Glu Lys Ile Phe Tyr Ile 210 215 220 Ala Val Ile Leu Ser Ser Leu Thr Leu Ser Asn Ile Ala Trp Phe Tyr 225 230 235 240 Gln Ser Ala Ile Ile Val Ile Leu Phe Ala Leu Phe Ala Leu Glu Gln 245 250 255 Lys Arg Leu Asn Phe Met Ile Ile Gly Ile Leu Gly Ser Ala Thr Leu 260 265 270 Ile Phe Leu Ile Leu Ser Gly Gly Val Asp Pro Ile Leu Tyr Gln Leu 275 280 285 Lys Phe Tyr Ile Phe Arg Ser Asp Glu Ser Ala Asn Leu Thr Gln Gly 290 295 300 Phe Met Tyr Phe Asn Val Asn Gln Thr Ile Gln Glu Val Glu Asn Val 305 310 315 320 Asp Leu Ser Glu Phe Met Arg Arg Ile Ser Gly Ser Glu Ile Val Phe 325 330 335 Leu Phe Ser Leu Phe Gly Phe Val Trp Leu Leu Arg Lys His Lys Ser 340 345 350 Met Ile Met Ala Leu Pro Ile Leu Val Leu Gly Phe Leu Ala Leu Lys 355 360 365 Gly Gly Leu Arg Phe Thr Ile Tyr Ser Val Pro Val Met Ala Leu Gly 370 375 380 Phe Gly Phe Leu Leu Ser Glu Phe Lys Ala Ile Met Val Lys Lys Tyr 385 390 395 400 Ser Gln Leu Thr Ser Asn Val Cys Ile Val Phe Ala Thr Ile Leu Thr 405 410 415 Leu Ala Pro Val Phe Ile His Ile Tyr Asn Tyr Lys Ala Pro Thr Val 420 425 430 Phe Ser Gln Asn Glu Ala Ser Leu Leu Asn Gln Leu Lys Asn Ile Ala 435 440 445 Asn Arg Glu Asp Tyr Val Val Thr Trp Ala Ala Tyr Gly Tyr Pro Val 450 455 460 Arg Tyr Tyr Ser Asp Val Lys Thr Leu Val Asp Gly Gly Lys His Leu 465 470 475 480 Gly Lys Asp Asn Phe Phe Pro Ser Phe Ala Leu Ser Lys Asp Glu Gln 485 490 495 Ala Ala Ala Asn Met Ala Arg Leu Ser Val Glu Tyr Thr Glu Lys Ser 500 505 510 Phe Tyr Ala Pro Gln Asn Asp Ile Leu Lys Thr Asp Ile Leu Gln Ala 515 520 525 Met Met Lys Asp Tyr Asn Gln Ser Asn Val Asp Leu Phe Leu Ala Ser 530 535 540 Leu Ser Lys Pro Asp Phe Lys Ile Asp Thr Pro Lys Thr Arg Asp Ile 545 550 555 560 Tyr Leu Tyr Met Pro Ala Arg Met Ser Leu Ile Phe Ser Thr Val Ala 565 570 575 Ser Phe Ser Phe Ile Asn Leu Asp Thr Gly Val Leu Asp Lys Pro Phe 580 585 590 Thr Phe Ser Thr Ala Tyr Pro Leu Asp Val Lys Asn Gly Glu Ile Tyr 595 600 605 Leu Ser Asn Gly Val Val Leu Ser Asp Asp Phe Arg Ser Phe Lys Ile 610 615 620 Gly Asp Asn Val Val Ser Val Asn Ser Ile Val Glu Ile Asn Ser Ile 625 630 635 640 Lys Gln Gly Glu Tyr Lys Ile Thr Pro Ile Asp Asp Lys Ala Gln Phe 645 650 655 Tyr Ile Phe Tyr Leu Lys Asp Ser Ala Ile Pro Tyr Ala Gln Phe Ile 660 665 670 Leu Met Asp Lys Thr Met Phe Asn Ser Ala Tyr Val Gln Met Phe Phe 675 680 685 Leu Gly Asn Tyr Asp Lys Asn Leu Phe Asp Leu Val Ile Asn Ser Arg 690 695 700 Asp Ala Lys Val Phe Lys Leu Lys Ile Tyr Pro Tyr Asp Val Pro Asp 705 710 715 720 Tyr Ala <210> 27 <211> 8171 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 27 gcggccgcaa ggggttcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 60 cggcatcaga gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat 120 gcgtaaggag aaaataccgc atcaggcgcc attcgccatt cagctgcgca actgttggga 180 agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 240 aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 300 cagtgaattg taatacgact cactataggg cgaattcgag ctcggtaccc ggggatccca 360 cgtggcgcgc cactagtgct agcgacgtcg tgggatcctc tagagtcgac ctgcaggcat 420 gcaagcttga gtattctata gtctcaccta aatagcttgg cgtaatcatg gtcatagctg 480 tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 540 aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 600 ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 660 gaaccccttg cggccgcccg ggccgtcgac caattctcat gtttgacagc ttatcatcga 720 atttctgcca ttcatccgct tattatcact tattcaggcg tagcaaccag gcgtttaagg 780 gcaccaataa ctgccttaaa aaaattacgc cccgccctgc cactcatcgc agtactgttg 840 taattcatta agcattctgc cgacatggaa gccatcacaa acggcatgat gaacctgaat 900 cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg tgaaaacggg 960 ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg 1020 attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg ccaggttttc 1080 accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta 1140 ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg 1200 aacactatcc catatcacca gctcaccgtc tttcattgcc atacgaaatt ccggatgagc 1260 attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt 1320 tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc 1380 aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt 1440 atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc tcgataactc 1500 aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac ctcttacgtg 1560 ccgatcaacg tctcattttc gccaaaagtt ggcccagggc ttcccggtat caacagggac 1620 accaggattt atttattctg cgaagtgatc ttccgtcaca ggtatttatt cgcgataagc 1680 tcatggagcg gcgtaaccgt cgcacaggaa ggacagagaa agcgcggatc tgggaagtga 1740 cggacagaac ggtcaggacc tggattgggg aggcggttgc cgccgctgct gctgacggtg 1800 tgacgttctc tgttccggtc acaccacata cgttccgcca ttcctatgcg atgcacatgc 1860 tgtatgccgg tataccgctg aaagttctgc aaagcctgat gggacataag tccatcagtt 1920 caacggaagt ctacacgaag gtttttgcgc tggatgtggc tgcccggcac cgggtgcagt 1980 ttgcgatgcc ggagtctgat gcggttgcga tgctgaaaca attatcctga gaataaatgc 2040 cttggccttt atatggaaat gtggaactga gtggatatgc tgtttttgtc tgttaaacag 2100 agaagctggc tgttatccac tgagaagcga acgaaacagt cgggaaaatc tcccattatc 2160 gtagagatcc gcattattaa tctcaggagc ctgtgtagcg tttataggaa gtagtgttct 2220 gtcatgatgc ctgcaagcgg taacgaaaac gatttgaata tgccttcagg aacaatagaa 2280 atcttcgtgc ggtgttacgt tgaagtggag cggattatgt cagcaatgga cagaacaacc 2340 taatgaacac agaaccatga tgtggtctgt ccttttacag ccagtagtgc tcgccgcagt 2400 cgagcgacag ggcgaagccc tcggctggtt gccctcgccg ctgggctggc ggccgtctat 2460 ggccctgcaa acgcgccaga aacgccgtcg aagccgtgtg cgagacaccg cggccggccg 2520 ccggcgttgt ggatacctcg cggaaaactt ggccctcact gacagatgag gggcggacgt 2580 tgacacttga ggggccgact cacccggcgc ggcgttgaca gatgaggggc aggctcgatt 2640 tcggccggcg acgtggagct ggccagcctc gcaaatcggc gaaaacgcct gattttacgc 2700 gagtttccca cagatgatgt ggacaagcct ggggataagt gccctgcggt attgacactt 2760 gaggggcgcg actactgaca gatgaggggc gcgatccttg acacttgagg ggcagagtgc 2820 tgacagatga ggggcgcacc tattgacatt tgaggggctg tccacaggca gaaaatccag 2880 catttgcaag ggtttccgcc cgtttttcgg ccaccgctaa cctgtctttt aacctgcttt 2940 taaaccaata tttataaacc ttgtttttaa ccagggctgc gccctgtgcg cgtgaccgcg 3000 cacgccgaag gggggtgccc ccccttctcg aaccctcccg gtcgagtgag cgaggaagca 3060 ccagggaaca gcacttatat attctgctta cacacgatgc ctgaaaaaac ttcccttggg 3120 gttatccact tatccacggg gatattttta taattatttt ttttatagtt tttagatctt 3180 cttttttaga gcgccttgta ggcctttatc catgctggtt ctagagaagg tgttgtgaca 3240 aattgccctt tcagtgtgac aaatcaccct caaatgacag tcctgtctgt gacaaattgc 3300 ccttaaccct gtgacaaatt gccctcagaa gaagctgttt tttcacaaag ttatccctgc 3360 ttattgactc ttttttattt agtgtgacaa tctaaaaact tgtcacactt cacatggatc 3420 tgtcatggcg gaaacagcgg ttatcaatca caagaaacgt aaaaatagcc cgcgaatcgt 3480 ccagtcaaac gacctcactg aggcggcata tagtctctcc cgggatcaaa aacgtatgct 3540 gtatctgttc gttgaccaga tcagaaaatc tgatggcacc ctacaggaac atgacggtat 3600 ctgcgagatc catgttgcta aatatgctga aatattcgga ttgacctctg cggaagccag 3660 taaggatata cggcaggcat tgaagagttt cgcggggaag gaagtggttt tttatcgccc 3720 tgaagaggat gccggcgatg aaaaaggcta tgaatctttt ccttggttta tcaaacgtgc 3780 gcacagtcca tccagagggc tttacagtgt acatatcaac ccatatctca ttcccttctt 3840 tatcgggtta cagaaccggt ttacgcagtt tcggcttagt gaaacaaaag aaatcaccaa 3900 tccgtatgcc atgcgtttat acgaatccct gtgtcagtat cgtaagccgg atggctcagg 3960 catcgtctct ctgaaaatcg actggatcat agagcgttac cagctgcctc aaagttacca 4020 gcgtatgcct gacttccgcc gccgcttcct gcaggtctgt gttaatgaga tcaacagcag 4080 aactccaatg cgcctctcat acattgagaa aaagaaaggc cgccagacga ctcatatcgt 4140 attttccttc cgcgatatca cttccatgac gacaggatag tctgagggtt atctgtcaca 4200 gatttgaggg tggttcgtca catttgttct gacctactga gggtaatttg tcacagtttt 4260 gctgtttcct tcagcctgca tggattttct catacttttt gaactgtaat ttttaaggaa 4320 gccaaatttg agggcagttt gtcacagttg atttccttct ctttcccttc gtcatgtgac 4380 ctgatatcgg gggttagttc gtcatcattg atgagggttg attatcacag tttattactc 4440 tgaattggct atccgcgtgt gtacctctac ctggagtttt tcccacggtg gatatttctt 4500 cttgcgctga gcgtaagagc tatctgacag aacagttctt ctttgcttcc tcgccagttc 4560 gctcgctatg ctcggttaca cggctgcggc gagcgctagt gataataagt gactgaggta 4620 tgtgctcttc ttatctcctt ttgtagtgtt gctcttattt taaacaactt tgcggttttt 4680 tgatgacttt gcgattttgt tgttgctttg cagtaaattg caagatttaa taaaaaaacg 4740 caaagcaatg attaaaggat gttcagaatg aaactcatgg aaacacttaa ccagtgcata 4800 aacgctggtc atgaaatgac gaaggctatc gccattgcac agtttaatga tgacagcccg 4860 gaagcgagga aaataacccg gcgctggaga ataggtgaag cagcggattt agttggggtt 4920 tcttctcagg ctatcagaga tgccgagaaa gcagggcgac taccgcaccc ggatatggaa 4980 attcgaggac gggttgagca acgtgttggt tatacaattg aacaaattaa tcatatgcgt 5040 gatgtgtttg gtacgcgatt gcgacgtgct gaagacgtat ttccaccggt gatcggggtt 5100 gctgcccata aaggtggcgt ttacaaaacc tcagtttctg ttcatcttgc tcaggatctg 5160 gctctgaagg ggctacgtgt tttgctcgtg gaaggtaacg acccccaggg aacagcctca 5220 atgtatcacg gatgggtacc agatcttcat attcatgcag aagacactct cctgcctttc 5280 tatcttgggg aaaaggacga tgtcacttat gcaataaagc ccacttgctg gccggggctt 5340 gacattattc cttcctgtct ggctctgcac cgtattgaaa ctgagttaat gggcaaattt 5400 gatgaaggta aactgcccac cgatccacac ctgatgctcc gactggccat tgaaactgtt 5460 gctcatgact atgatgtcat agttattgac agcgcgccta acctgggtat cggcacgatt 5520 aatgtcgtat gtgctgctga tgtgctgatt gttcccacgc ctgctgagtt gtttgactac 5580 acctccgcac tgcagttttt cgatatgctt cgtgatctgc tcaagaacgt tgatcttaaa 5640 gggttcgagc ctgatgtacg tattttgctt accaaataca gcaatagtaa tggctctcag 5700 tccccgtgga tggaggagca aattcgggat gcctggggaa gcatggttct aaaaaatgtt 5760 gtacgtgaaa cggatgaagt tggtaaaggt cagatccgga tgagaactgt ttttgaacag 5820 gccattgatc aacgctcttc aactggtgcc tggagaaatg ctctttctat ttgggaacct 5880 gtctgcaatg aaattttcga tcgtctgatt aaaccacgct gggagattag ataatgaagc 5940 gtgcgcctgt tattccaaaa catacgctca atactcaacc ggttgaagat acttcgttat 6000 cgacaccagc tgccccgatg gtggattcgt taattgcgcg cgtaggagta atggctcgcg 6060 gtaatgccat tactttgcct gtatgtggtc gggatgtgaa gtttactctt gaagtgctcc 6120 ggggtgatag tgttgagaag acctctcggg tatggtcagg taatgaacgt gaccaggagc 6180 tgcttactga ggacgcactg gatgatctca tcccttcttt tctactgact ggtcaacaga 6240 caccggcgtt cggtcgaaga gtatctggtg tcatagaaat tgccgatggg agtcgccgtc 6300 gtaaagctgc tgcacttacc gaaagtgatt atcgtgttct ggttggcgag ctggatgatg 6360 agcagatggc tgcattatcc agattgggta acgattatcg cccaacaagt gcttatgaac 6420 gtggtcagcg ttatgcaagc cgattgcaga atgaatttgc tggaaatatt tctgcgctgg 6480 ctgatgcgga aaatatttca cgtaagatta ttacccgctg tatcaacacc gccaaattgc 6540 ctaaatcagt tgttgctctt ttttctcacc ccggtgaact atctgcccgg tcaggtgatg 6600 cacttcaaaa agcctttaca gataaagagg aattacttaa gcagcaggca tctaaccttc 6660 atgagcagaa aaaagctggg gtgatatttg aagctgaaga agttatcact cttttaactt 6720 ctgtgcttaa aacgtcatct gcatcaagaa ctagtttaag ctcacgacat cagtttgctc 6780 ctggagcgac agtattgtat aagggcgata aaatggtgct taacctggac aggtctcgtg 6840 ttccaactga gtgtatagag aaaattgagg ccattcttaa ggaacttgaa aagccagcac 6900 cctgatgcga ccacgtttta gtctacgttt atctgtcttt acttaatgtc ctttgttaca 6960 ggccagaaag cataactggc ctgaatattc tctctgggcc cactgttcca cttgtatcgt 7020 cggtctgata atcagactgg gaccacggtc ccactcgtat cgtcggtctg attattagtc 7080 tgggaccacg gtcccactcg tatcgtcggt ctgattatta gtctgggacc acggtcccac 7140 tcgtatcgtc ggtctgataa tcagactggg accacggtcc cactcgtatc gtcggtctga 7200 ttattagtct gggaccatgg tcccactcgt atcgtcggtc tgattattag tctgggacca 7260 cggtcccact cgtatcgtcg gtctgattat tagtctggaa ccacggtccc actcgtatcg 7320 tcggtctgat tattagtctg ggaccacggt cccactcgta tcgtcggtct gattattagt 7380 ctgggaccac gatcccactc gtgttgtcgg tctgattatc ggtctgggac cacggtccca 7440 cttgtattgt cgatcagact atcagcgtga gactacgatt ccatcaatgc ctgtcaaggg 7500 caagtattga catgtcgtcg taacctgtag aacggagtaa cctcggtgtg cggttgtatg 7560 cctgctgtgg attgctgctg tgtcctgctt atccacaaca ttttgcgcac ggttatgtgg 7620 acaaaatacc tggttaccca ggccgtgccg gcacgttaac cgggctgcat ccgatgcaag 7680 tgtgtcgctg tcgacgagct cgcgagctcg gacatgaggt tgccccgtat tcagtgtcgc 7740 tgatttgtat tgtctgaagt tgtttttacg ttaagttgat gcagatcaat taatacgata 7800 cctgcgtcat aattgattat ttgacgtggt ttgatggcct ccacgcacgt tgtgatatgt 7860 agatgataat cattatcact ttacgggtcc tttccggtga tccgacaggt tacggggcgg 7920 cgacctcgcg ggttttcgct atttatgaaa attttccggt ttaaggcgtt tccgttcttc 7980 ttcgtcataa cttaatgttt ttatttaaaa taccctctga aaagaaagga aacgacaggt 8040 gctgaaagcg agctttttgg cctctgtcgt ttcctttctc tgtttttgtc cgtggaatga 8100 acaatggaag tccgagctca tcgctaataa cttcgtatag catacattat acgaagttat 8160 attcgatcca c 8171 <210> 28 <211> 20982 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 28 ctagcggcaa aacgtatgcc gggtgacctc tctgaatact ccgtcatcca gaccaaagaa 60 ccgctggatc gcgaaggtaa agtcagccgc attgttgaat ttatcgaaaa accggatcag 120 ccgcagacgc tggactcaga catcatggcc gttggtcgct atgtgctttc tgccgatatt 180 tggccggaac ttgaacgtac tcagcctggt gcatggggac gtattcagct gactgatgcc 240 attgccgagc tggcgaaaaa acagtccgtt gatgcaatgc tgatgaccgg cgacagctac 300 gactgcggta aaaaaatggg ctatatgcag gcgtttgtga agtatgggct gcgcaacctg 360 aaagaagggg cgaagttccg taaaggtatt gagaagctgt taagcgaata atgaaaatct 420 gaccggatgt aacggttgat aagaaaatta taacggcagt gaagattcgt ggtgaaagta 480 atttgttgcg aatattcctg ccgttgtttt atataaacaa tcagaataac aacgagttag 540 caataggatt ttagtcaaag ttttccagga ttttccttgt ttccagagcg gattggtaag 600 acaattagct tttgaatttt tcgggtttag cgcgagtggg taacgctcgt cacatcgtag 660 gcatgcatgc agtgctctgg tagctgtaaa gccaggggcg gtagcgtgca ttaatacttc 720 tattaatcaa actgagagcc gcttatttca cagcatgctc tgaagcaata tggaataaat 780 taggtgaaaa tacttgttac tggtggcgca ggatttattg gttttgctgt agttcgtcac 840 attataaata atacgcagga tagtgttgtt aatgtcgata aattaacgta cgccggaaac 900 ctggaatcac ttgctgatgt ttctgattct gaacgctatg tttttgaaca tgcggatatt 960 tgcgatgcag ctgcaatggc acggattttt gctcagcatc agccagatgc agtgatgcac 1020 ctggctgctg aaagccatgt tgaccgttca attacaggtc ctgcggcatt tattgaaacc 1080 aatattgttg gtacatatgt ccttttggaa gccgctcgca attattggtc tgctcttgat 1140 agcgacaaga aaactagatt ccgttttcat catatttcta ctgacgaagt ctatggtgat 1200 ttgcctcatc ctgacgaggt aaataataca gaagaattac ccttatttac agagacaaca 1260 gcttacgcgc caagcagccc ttattccgct tcaaaagcat ccagcgatca tttagtccgc 1320 gcgtggaaac gtacctatgg tttaccaacc attgtgacta attgctctaa taattatggt 1380 ccttatcatt tcccggaaaa attgattcca ttggttattc tgaatgctct ggaaggtaag 1440 gcattaccta tttatggcaa aggggatcaa attcgtgact ggctgtatgt tgaagatcat 1500 gcgcgtgcgt tatataccgt cgtaaccgaa ggtaaagcgg gtgaaactta taacattggt 1560 ggacacaacg aaaagaaaaa catcgatgta gtgctcacta tttgtgattt gctggatgag 1620 attgtaccga aagagaaatc ttaccgcgag caaattactt atgttgccga tcgcccggga 1680 cacgatcgcc gttatgcgat tgatgcagag aagattagcc gcgaattggg ctggaaaccg 1740 caggaaacgt ttgagagcgg gattcggaag acattggaat ggtacctgtc caatacaaaa 1800 tgggttgata atgtgaaaag tggtgcttat caatcgtgga ttgaacagaa ctatgagggc 1860 cgccagtaat gaatatcctc cttttcggca aaacagggca ggtaggttgg gaactacagc 1920 gtgctctggc acctttgggt aatttgattg ctcttgatgt tcactccact gattattgtg 1980 gtgattttag taatcctgaa ggtgtagctg aaacagtcaa aagaattcga cctgatgtta 2040 ttgttaatgc tgcggctcac accgcagtag ataaggctga gtcagaaccc gaatttgcac 2100 aattactcaa tgcgactagt gttgaatcaa ttgcaaaaga ggctaatgaa gttggggctt 2160 gggtaattca ttactcaact gactacgtat tccctggaaa tggcgacacg ccatggctgg 2220 agacggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagcc ggagaaaaag 2280 cgttacagga acattgcgcg aagcatctta ttttccgtac cagctgggta tacgcagcta 2340 aaggaaataa cttcgccaaa acgatgttgc gtctggcaaa agagcgcgaa gaactggctg 2400 tgataaatga tcaatttggt gcgccaacag gtgctgagct gctggctgat tgtacggcac 2460 atgctattcg tgtggcactg aataaaccgg aagtcgcagg tttgtaccat ctggtagcca 2520 gtggtaccac aacctggcac gattatgctg cgctggtttt tgaagaggcg cgcaaagcag 2580 gtattcccct tgcactcaac aagctcaacg cagtaccaac aacagcctat cctacaccag 2640 ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac tttgcgcttg 2700 tcttgcctga ctggcaggtt ggtgtgaaac gaatgctcaa cgaattaatt acgactacag 2760 caatttaata gtttttgcat cttgttcgtg atggtggagc aagatgaatt aaaaggaatg 2820 atgaaatgaa aacgcgtaaa ggtattattt tagcgggtgg ttctggtaca cgtctttatc 2880 ctgtgactat ggctgtcagt aaacagctat tacctattta tgataagccg atgatctatt 2940 acccgctctc tacactgatg ttggcgggta ttcgcgatat tctgattatt agtacgccac 3000 aggatactcc tcgttttcaa caactgctag gtgacggtag ccagtggggg ctaaatcttc 3060 agtacaaagt gcaaccgact ccagatgggc ttgcgcaggc gtttattatc ggtgaagagt 3120 ttatcggtgg tgatgattgt gctttggttc ttggtgataa tatcttctac ggtcatgatc 3180 tgccgaagtt aatggatgtc gctgttaaca aagaaagtgg tgcaacggta tttgcctatc 3240 acgttaatga tcctgaacgc tacggcgtcg ttgagtttga taaaaacggt acggcaataa 3300 gcctggaaga aaaaccgcta caaccaaaaa gtaattatgc ggtaaccggg ctttatttct 3360 atgataacga cgttgtcgaa atggcgaaaa accttaagcc ttctgcccgt ggtgaactgg 3420 aaattaccga tattaaccgt atttatatgg aacaggggcg tttatccgtt gccatgatgg 3480 ggcgtggtta tgcatggctg gatacgggga cacatcagag tcttattgaa gcaagcaact 3540 tcattgccac cattgaagag cgccagggac taaaggtttc ctgcccagaa gaaattgctt 3600 accgtaaagg gtttattgat gctgaacagg tgaaagcatt agcggagccg ctgaaaaaaa 3660 atgcttatgg acagtatctg ctgaaaatga ttaaaggtta ttaataaaat gaacgtaatt 3720 aaaacagaaa ttcctgatgt gttaattttc gagccgaaag tttttggtga tgagcgtggt 3780 ttctttatgg aaagctttaa tcagaaagtt ttcgaagaag ctgtaggacg taaggttgaa 3840 tttgttcagg ataaccattc gaagtctagt aaaggtgttt tacgcgggct gcattatcag 3900 ttagaacctt atgcgcaagg gaaactggta cgttgcgttg ttggtgaggt ttttgatgta 3960 gctgttgata ttcgtaaatc gtcgcctacc tttggtaaat gggttggggt gaatttatct 4020 gctgagaata agcggcaatt gtggatccct gagggatttg cacatggttt tttggtgctg 4080 agcgagactg cggaattttt atataaaacg acgaactatt atcatcctga tagtgataga 4140 gggattgtat ggaatgatcc tattctgagc ataaaatggc cgacgataga acataataat 4200 tatattttat cgattaaaga tgcaagggct aaagaattgc ataacatgaa ggaattattt 4260 ttgtgagtat tgtaaagaat actttatgga atataagtgg gtatattata ccatcattaa 4320 tagcaattcc tgcgttaggt atactgtcta gaattctagg gaccgagcaa tttggccttt 4380 ttacgttagc tattgcctta gttggatatg caagtatttt tgatgctgga ttgaccagag 4440 ctgttataag agaagtatca atatataaaa atgttcataa agaattaaga gcgatcattt 4500 caacttcaac ggtaattcta actatattgg gcttgattgg cggtagtgta ctatttttga 4560 gtagcaatgt aattgttaaa ttattaaaca ttaacgcgaa tcatgttgta gaatctgtca 4620 aagcaatata tattatttca gctaccatac ccttatactt gttaaaccaa gtctggttgg 4680 ggatttttga ggggatggaa aagttcagaa aagtaaattt aataaaatca attaacaact 4740 cttttgtggc tggattacca gtgattttct gtttttttca tggaggatta ctaagtgcta 4800 tatatggttt agttatggca agagtcttat cacttatagt gacctttata tttagtcgaa 4860 aactaataat atcatctggg ctgtctgtaa aaattgtaac agttaaaaga ttaatcggct 4920 ttggaagctg gataacagtt agcaatatta ttagccctat tatgacatat atggatcgtt 4980 ttattctttc acacattgtg ggggctgata aagtttcttt ttatactgct ccgtctgaag 5040 gtatacaacg cttaacgata ttaccaagtg cgttgtccag agctattttt ccaagattaa 5100 gttcagaatt gcaatcggta aagcaaacta aaatattatc atattttata atggttattg 5160 gtatacttcc aattgtaatg ttgataatta ttttatcaga ttttataatg tccgcttgga 5220 tgggacctac atatcatggg acgccaggta tagtattaaa aattcttgca ataggtttct 5280 tttttaattg cattgcacaa atcccatttg tttcagttca ggctagtgga agatcaaaaa 5340 ttacagctat tattcatttg ctcgaagtta tcccatattt atgcatatta tatattttta 5400 tttatcattg gggaattgtt ggagccgcaa tagcatggtc tgtaagaaca tcgttagatt 5460 ttttgatatt attattaatt gatacgaaat attaatagcg aattgatttt agggattact 5520 tcctcaagcc catctaatta gagtgcaaac atgacttctg atttttataa ctcaaaagac 5580 aaaagtttaa gtgttctttt gttttttggg tttatatttt tccttacacg tagctttcca 5640 tttattcaat atagttggat tatggagggg tttttatgtc tttgtatcat gtcatttaca 5700 aagaaaattg caaacggaat atatcactat cctgttattt taatatttct attagctctt 5760 tttataaatt ttatttattc ctatatcaag ggtaacgata tagcgataat aattaggttt 5820 tatattatca tattatttat attatgtgct tatttctgct cttatggaac catctcgatt 5880 gttaaaatat ttttatattt aatggtatta caggcggtta ttatatccat cattagtatt 5940 tatatgacaa aaacatatgg tattggtgat tattcagcac taagacatta ttttttggag 6000 aatgattatg gtgatgttta tacatatgga agtggtttct atagagttca aattaaagga 6060 aatgctctca ttccatttgc ctttatgttg catatagtca taaaagatta tttctattat 6120 cgattcaaaa atacaataac cgttattctg gctataggta ctatagtggc tggtaatttt 6180 gcatattttg tttcgatatg cttgtttttt atgtatatta tactatgttc taaatctaac 6240 tcacgatacg ctaaattaag gaaaattatt tttggggttt ttcttactgt gattctccct 6300 ttttttatta catattcaat tgagttgata atcatgaaat caaatggagc tgattcttct 6360 ttaggagtta gatgggatca gtttactgta ttaattaatg atcttacaga gtctgtatca 6420 aattttgtta taggttctgg tttgggtaat gtcatcaaaa ttcaaactcc tatccgtgat 6480 tatagtgcat atatatatta tgaattgcag tcagtttatt ttttaaatca acttggcgtt 6540 attttattta ctttgttttt attaattaat ctccttctca cgattaaaat cataaaatac 6600 agtgagttgt gtgtgctata ttttctatat gtttcttatg caattactaa tccttatatt 6660 ttagactcta accatgttgc tgtaataatt gtattagtga cattaagtaa tgttctaaaa 6720 aagatgaaag ctaaatgaag gttttaaggt gaagatggac actgtatatg ccgttttggt 6780 tgcttacaac ccagaacata atgatttaaa aaatgcggtt gaattattgt tgagacaagt 6840 tactaaagtt gtcgtttgca ataactctac aaatggttat aaatatgctg aaaattcttc 6900 aggcgatgta aaaatattca atttcaatga taatttaggc atagcagaag cccaaagtat 6960 aggaatgaaa tgggcttttg aaaatggcgc tgattttata ttgcaaatgg atcaggatag 7020 tattcctgat cctaagatgg tagagcagtt acttacttgt tacaaaaaat tgcttaaaca 7080 aaatgtcaat gttggtttag ttggttcaca agattttgat aaagtaactg gtgaattaaa 7140 taaagcaagg gtaaaaaaag ggaaaccact tacagaagtt tattatgagg tagatagtac 7200 attaagttct ggcagtctaa taccaaaaaa tagttggttg attgttggag gaatgaaaga 7260 tgagcttttt atcgatgcgg tagaccatga atattgttgg agattaagag ctgctgggtt 7320 taaagtaatt aggaataaaa atgcgttact tgcacataga cttggagatg ggcgatttaa 7380 gatcttaaat attctttctg tcggtttgcc aagcccattt cgtcattatt atgctactcg 7440 aaatatcttt cttttattaa ataaaaatta tgtacccatc tactggaaaa tttctagtct 7500 ggttaaatta attggaaagg tttttttata tcctattttc cttccaaatg gtaataaaag 7560 gttatatttt tttttaaaag gcattaatga cggtttaatg ggtcgaagtg gtaaaatgaa 7620 atgaatcata gattagaaaa attctcagtt ttaattagca tttataaaaa tgatctaccg 7680 caattttttg aggtggctct acgctctatt tttcacgatc aaacacttaa gccagatcaa 7740 atagtaattg ttgcagatgg agaactccat caaacacaca tcgatattat aaattcattc 7800 attgatgatg ttggcaataa aatagtaaca tttgtacctt tacctagaaa tgttggattg 7860 gctaatgcct taaatgaagg attaaaggct tgtaggaatg agttagtggc aagaatggat 7920 gctgatgata tttctttgcc tcatcggttt gagaaacaaa tttcttttat gattaataat 7980 tcagaaatag atgtatgtgg cagttttatt gatgaaattg aaactgttac tgaggagttt 8040 atttcaacac gcaaagtgcc tctcgaacat agagaaatag ttaaattcgc gaggaaacga 8100 agcgcagtta gccatccttc tgtaattttt agaaagaata cagtattagc tgttggtggt 8160 tatcctccat tcagaaaatc tcaagatttt gcattgtgga gcctattaat tgtacataat 8220 gcaagatttg caaatcttcc agatatttta ttaaaaatgc gaactggtcg taatcttatg 8280 gctcgacgtg gattgtcata tttattgtac gagtataaag tattgtatta tcaatataaa 8340 attggtttta ttcgaaaaaa tgaattaata agtaatgcta tgttgagaac attttttcgt 8400 ataatgccat ctaaattaaa ggagctgatg tattcaatcg ttaggaatcg ataataataa 8460 ttttctgatt aagtgttatg gatttatttt tattaggcat attctataat taagcataac 8520 ccgcatacca cccagcggta tcctgacagg agtaaacaat gtcaaagcaa cagatcggcg 8580 tcgtcggtat ggcagtgatg gggcgcaacc ttgcgctcaa tatcgaaagc cgtggttata 8640 ccgtctctat tttcaaccgt tcccgtgaaa agaccgaaga agtgattacc gaaaatccag 8700 gcaagaaact ggttccttac tatacggtga aagaatttgt tgaatctctg gaaacgcctc 8760 gtcgcatcct gttaatggtg aaagcaggtg ctggcacgga tgctgctatt gattccctca 8820 agccatacct cgataaaggt gacatcatca ttgatggtgg taacaccttc ttccatgaca 8880 ccattcgtcg taaccgtgag ctttctgcag aaggctttaa ctttatcggt accggtgttt 8940 ccggtggtga agaaggtgcg ctgaaaggtc cttccattat gcctggtggg cagaaagaag 9000 cttatgaact gattgcgccg atcctgacca aaatcgccgc tgtggctgaa gacggcgaac 9060 cgtgcgttac ctatattggt gccgatggtg caggtcatta tgtgaagatg gttcacaacg 9120 gtattgaata cggtgatatg cagctgattg ctgaagccta ttctctgctt aaaggtggct 9180 tgaacctcac caacgaagaa ctggcgcaga cctttaccga gtggaataac ggtgaactga 9240 gcagctacct gatcgacatc accaaagata tcttcaccaa aaaagatgaa gagggtaact 9300 acctggttga tgtgattctg gatgaagcag caaacaaagg tacgggcaaa tggaccagcc 9360 agagcgcgct ggatctcggc gaaccgctgt cgctgattac cgagtctgtg tttgcacgtt 9420 atatctcttc tctgaaagag cagcgtgttg ccgcatctaa agttctctct ggcccgcaag 9480 cgcagccagc tggcgacaat gctgagttca tcgaaaaagt tcgccgtgcg ctgtatctgg 9540 gcaaaatcgt ttcttacgct cagggcttct ctcagctacg cgctgcgtct gaagagtaca 9600 actgggatct gaactacggt gaaatcgcga agattttccg tgctggctgc atcatccgtg 9660 cgcagttcct gcagaaaatc accgatgctt atgccgaaaa tccgcagatc gctaacctgt 9720 tgctggctcc ttacttcaag caaattgccg atgactacca gcaggcgctg cgcgatgtcg 9780 tcgcttacgc agtacagaac ggtatcccgg tgccgacctt cgccgctgcg gttgcctatt 9840 acgacagcta ccgcgccgct gttctgcctg cgaacctgat ccaggcacag cgtgactatt 9900 tcggtgcgca tacttataag cgcattgata aagaaggtgt gttccatacc gaatggctgg 9960 attaatctga tttaaatcaa ttaatcaaag caaggcccgg agaaaccctc cgggcttttt 10020 tattatacaa agcggcaggt tagggccttt ttttataatt tatagttaaa aacgcgatat 10080 aatacagcgc cgcacagcag gatcgctgcc ttgacagttc atctacatca gcgttaaaaa 10140 tcccgcagta gatgaagctg tggtggtgga ttaatgacca ctctaaatgt ttaaccggaa 10200 gaagtcagag ctaatgaaaa taacaatttc aggaacaggt tatgttggtc tttcaaatgg 10260 tattctgatt gcgcaaaacc acgaagtggt tgcactggat atcgttcagg ccaaagtgga 10320 catgcttaac aagaggcagt caccgcttgt tgataaggag attgaagagt atctggcgac 10380 taaagatctc aatttccgcg ctacgacaga taagtatgac gcgtataaaa atgccgatta 10440 cgttattatt gccacaccta ccgattatga tccgaaaaca aattatttta atacctcaag 10500 cgtggaagcg gtcattcgtg atgtgacaga aattaatccc aacgcggtaa tgattataaa 10560 atcaactatc cctgttggtt ttacagagtc cattaaagaa cgttttggta ttgaaaatgt 10620 gatcttttcg cctgagtttt tgcgtgaagg taaagcactt tatgataact tacacccatc 10680 acgcattgtg attggcgagc agtctgaacg cgctaaacgt tttgctgcgt tattacagga 10740 aggcgccatt aagcaagaca taccaacatt gtttactgac tcaaccgagg ctgaggcgat 10800 taaacttttt gcgaacactt atctggcgat gcgtgtagcg tatttcaatg aacttgatag 10860 ttatgctgaa agcctgggac ttaattcacg ccagattatt gagggcgtat gccttgaccc 10920 gcgtatcggt aatcactaca acaacccgtc attcggttat ggtggttatt gtctgccgaa 10980 agatactaag cagttactgg caaattacca gtctgtgccg aataacctga tctcggcaat 11040 tgttgacgcc aaccgcacgc gcaaagattt tattgccgat tctatccttg cacgtaaacc 11100 gaaagttgtt ggcgtctatc gtttgattat gaagaatggt tcagacaatt ttcgtgcttc 11160 ctcgattcag ggtattatga agcgaatcaa ggcgaaaggt gtgcctgtaa tcgtttatga 11220 gccagctatg aaagaggacg attttttccg gtcgcgcgtg gtacgtgatc tggatgcgtt 11280 caaacaagaa gctgatgtta ttatttctaa ccgtatgtct gccgatctgg ctgatgtagc 11340 agataaagtt tatacgcgcg acttgtttgg caatgattaa ttattttgtt tcattctaag 11400 aaaaggccct aataaattag ggccttttct tatggttttg taaaatcaaa ctttatagaa 11460 gttacgatac cattctacaa agttctttac cccttcttta actgacgttt caggtttgaa 11520 tcctattacg tcatacagtg cttttgtatc agcactggtt tccagtacat caccgggttg 11580 gagaggcatc atatttttgt tggcttcaat acccagagcc tcttctaacg cattgatata 11640 gtccatcaac tccacaggcg aactattacc aatgttatag acacgatatg gtgctgaact 11700 tgttgcaggc gagcctgttt ctacagccca ctgtgggttt ttttctggaa taacatcctg 11760 taagcgaata atagcttcgg caatatcatc aatgtaagta aagtcacgct tcattttgcc 11820 gaagttgtaa acatcaatgc ttttaccttc cagcatggct ttagtgaatt taaataatgc 11880 catatccgga cgtccccatg gaccataaac cgtaaagaaa cgcagccctg tggtcggtaa 11940 gccatacaaa tgagaatatg tatgggccat gagttcattc gcttttttag ttgctgcata 12000 aagcgaaaca ggatgatcta cagagtcatc tgtagagaaa ggcatcttgc ggttcatgcc 12060 ataaacagaa ctggaggaag cgtaaagtag atgctgaaca ttattatggc gacatccttc 12120 tagtatgttc aggaatccaa tcaggtttgc atctgcatat gcattgggat tttcaagaga 12180 gtaacgtaca ccggcttgcg cagcgaggtt tattacgcgt tcgaaccgct cgtctgcaaa 12240 cagtgccgcc attttctcac gatcggccag gtcaatttta taaaaactga agttgtcgtg 12300 cttgagtaaa tcaagtcgtg cttgtttgag gttgacatcg taataatcat ttaagttgtc 12360 aatgcctaca acctgatgac cagctgcaag aagccgttta cttagataga aaccgataaa 12420 gccagcagct cccgtaacca gaaatttcat ttataatcct cgctcaggct agaatatagc 12480 caatcttcat ctggcataac tgaaagttaa attataccgt tagacaagaa aaaaagataa 12540 tcggtatcag ttctaaactt ggctgttttt tctggtaacg tgctcatttt acaatcaaag 12600 ctgttctaag ctgactatac aagccgacgt cattatctcc aaccgtatgg cagaagagct 12660 taaggatgtg gcagacaaag tctacacccg cgatctcttt ggcagtgact aacatcctgt 12720 tatcatggcg attttcgccc tgattctctt atgttccctt tgtaataatt cattattttt 12780 atcatttatc ctatagcatt catggcgatt atcgctaaac tatggcggcg cgccacgtgg 12840 gatccccggg taccgagctc gaattcgccc tatagtgagt cgtattacaa ttcactggcc 12900 gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 12960 gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 13020 caacagttgc gcagctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc 13080 tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 13140 agttaagcca gccccgacac ccgccaacac ccgctgacgc gaaccccttg cggccgcatc 13200 gaatataact tcgtataatg tatgctatac gaagttatta gcgatgagct cggacttcca 13260 ttgttcattc cacggacaaa aacagagaaa ggaaacgaca gaggccaaaa agctcgcttt 13320 cagcacctgt cgtttccttt cttttcagag ggtattttaa ataaaaacat taagttatga 13380 cgaagaagaa cggaaacgcc ttaaaccgga aaattttcat aaatagcgaa aacccgcgag 13440 gtcgccgccc cgtaacctgt cggatcaccg gaaaggaccc gtaaagtgat aatgattatc 13500 atctacatat cacaacgtgc gtggaggcca tcaaaccacg tcaaataatc aattatgacg 13560 caggtatcgt attaattgat ctgcatcaac ttaacgtaaa aacaacttca gacaatacaa 13620 atcagcgaca ctgaatacgg ggcaacctca tgtccgagct cgcgagctcg tcgacagcga 13680 cacacttgca tcggatgcag cccggttaac gtgccggcac ggcctgggta accaggtatt 13740 ttgtccacat aaccgtgcgc aaaatgttgt ggataagcag gacacagcag caatccacag 13800 caggcataca accgcacacc gaggttactc cgttctacag gttacgacga catgtcaata 13860 cttgcccttg acaggcattg atggaatcgt agtctcacgc tgatagtctg atcgacaata 13920 caagtgggac cgtggtccca gaccgataat cagaccgaca acacgagtgg gatcgtggtc 13980 ccagactaat aatcagaccg acgatacgag tgggaccgtg gtcccagact aataatcaga 14040 ccgacgatac gagtgggacc gtggttccag actaataatc agaccgacga tacgagtggg 14100 accgtggtcc cagactaata atcagaccga cgatacgagt gggaccatgg tcccagacta 14160 ataatcagac cgacgatacg agtgggaccg tggtcccagt ctgattatca gaccgacgat 14220 acgagtggga ccgtggtccc agactaataa tcagaccgac gatacgagtg ggaccgtggt 14280 cccagactaa taatcagacc gacgatacga gtgggaccgt ggtcccagtc tgattatcag 14340 accgacgata caagtggaac agtgggccca gagagaatat tcaggccagt tatgctttct 14400 ggcctgtaac aaaggacatt aagtaaagac agataaacgt agactaaaac gtggtcgcat 14460 cagggtgctg gcttttcaag ttccttaaga atggcctcaa ttttctctat acactcagtt 14520 ggaacacgag acctgtccag gttaagcacc attttatcgc ccttatacaa tactgtcgct 14580 ccaggagcaa actgatgtcg tgagcttaaa ctagttcttg atgcagatga cgttttaagc 14640 acagaagtta aaagagtgat aacttcttca gcttcaaata tcaccccagc ttttttctgc 14700 tcatgaaggt tagatgcctg ctgcttaagt aattcctctt tatctgtaaa ggctttttga 14760 agtgcatcac ctgaccgggc agatagttca ccggggtgag aaaaaagagc aacaactgat 14820 ttaggcaatt tggcggtgtt gatacagcgg gtaataatct tacgtgaaat attttccgca 14880 tcagccagcg cagaaatatt tccagcaaat tcattctgca atcggcttgc ataacgctga 14940 ccacgttcat aagcacttgt tgggcgataa tcgttaccca atctggataa tgcagccatc 15000 tgctcatcat ccagctcgcc aaccagaaca cgataatcac tttcggtaag tgcagcagct 15060 ttacgacggc gactcccatc ggcaatttct atgacaccag atactcttcg accgaacgcc 15120 ggtgtctgtt gaccagtcag tagaaaagaa gggatgagat catccagtgc gtcctcagta 15180 agcagctcct ggtcacgttc attacctgac catacccgag aggtcttctc aacactatca 15240 ccccggagca cttcaagagt aaacttcaca tcccgaccac atacaggcaa agtaatggca 15300 ttaccgcgag ccattactcc tacgcgcgca attaacgaat ccaccatcgg ggcagctggt 15360 gtcgataacg aagtatcttc aaccggttga gtattgagcg tatgttttgg aataacaggc 15420 gcacgcttca ttatctaatc tcccagcgtg gtttaatcag acgatcgaaa atttcattgc 15480 agacaggttc ccaaatagaa agagcatttc tccaggcacc agttgaagag cgttgatcaa 15540 tggcctgttc aaaaacagtt ctcatccgga tctgaccttt accaacttca tccgtttcac 15600 gtacaacatt ttttagaacc atgcttcccc aggcatcccg aatttgctcc tccatccacg 15660 gggactgaga gccattacta ttgctgtatt tggtaagcaa aatacgtaca tcaggctcga 15720 accctttaag atcaacgttc ttgagcagat cacgaagcat atcgaaaaac tgcagtgcgg 15780 aggtgtagtc aaacaactca gcaggcgtgg gaacaatcag cacatcagca gcacatacga 15840 cattaatcgt gccgataccc aggttaggcg cgctgtcaat aactatgaca tcatagtcat 15900 gagcaacagt ttcaatggcc agtcggagca tcaggtgtgg atcggtgggc agtttacctt 15960 catcaaattt gcccattaac tcagtttcaa tacggtgcag agccagacag gaaggaataa 16020 tgtcaagccc cggccagcaa gtgggcttta ttgcataagt gacatcgtcc ttttccccaa 16080 gatagaaagg caggagagtg tcttctgcat gaatatgaag atctggtacc catccgtgat 16140 acattgaggc tgttccctgg gggtcgttac cttccacgag caaaacacgt agccccttca 16200 gagccagatc ctgagcaaga tgaacagaaa ctgaggtttt gtaaacgcca cctttatggg 16260 cagcaacccc gatcaccggt ggaaatacgt cttcagcacg tcgcaatcgc gtaccaaaca 16320 catcacgcat atgattaatt tgttcaattg tataaccaac acgttgctca acccgtcctc 16380 gaatttccat atccgggtgc ggtagtcgcc ctgctttctc ggcatctctg atagcctgag 16440 aagaaacccc aactaaatcc gctgcttcac ctattctcca gcgccgggtt attttcctcg 16500 cttccgggct gtcatcatta aactgtgcaa tggcgatagc cttcgtcatt tcatgaccag 16560 cgtttatgca ctggttaagt gtttccatga gtttcattct gaacatcctt taatcattgc 16620 tttgcgtttt tttattaaat cttgcaattt actgcaaagc aacaacaaaa tcgcaaagtc 16680 atcaaaaaac cgcaaagttg tttaaaataa gagcaacact acaaaaggag ataagaagag 16740 cacatacctc agtcacttat tatcactagc gctcgccgca gccgtgtaac cgagcatagc 16800 gagcgaactg gcgaggaagc aaagaagaac tgttctgtca gatagctctt acgctcagcg 16860 caagaagaaa tatccaccgt gggaaaaact ccaggtagag gtacacacgc ggatagccaa 16920 ttcagagtaa taaactgtga taatcaaccc tcatcaatga tgacgaacta acccccgata 16980 tcaggtcaca tgacgaaggg aaagagaagg aaatcaactg tgacaaactg ccctcaaatt 17040 tggcttcctt aaaaattaca gttcaaaaag tatgagaaaa tccatgcagg ctgaaggaaa 17100 cagcaaaact gtgacaaatt accctcagta ggtcagaaca aatgtgacga accaccctca 17160 aatctgtgac agataaccct cagactatcc tgtcgtcatg gaagtgatat cgcggaagga 17220 aaatacgata tgagtcgtct ggcggccttt ctttttctca atgtatgaga ggcgcattgg 17280 agttctgctg ttgatctcat taacacagac ctgcaggaag cggcggcgga agtcaggcat 17340 acgctggtaa ctttgaggca gctggtaacg ctctatgatc cagtcgattt tcagagagac 17400 gatgcctgag ccatccggct tacgatactg acacagggat tcgtataaac gcatggcata 17460 cggattggtg atttcttttg tttcactaag ccgaaactgc gtaaaccggt tctgtaaccc 17520 gataaagaag ggaatgagat atgggttgat atgtacactg taaagccctc tggatggact 17580 gtgcgcacgt ttgataaacc aaggaaaaga ttcatagcct ttttcatcgc cggcatcctc 17640 ttcagggcga taaaaaacca cttccttccc cgcgaaactc ttcaatgcct gccgtatatc 17700 cttactggct tccgcagagg tcaatccgaa tatttcagca tatttagcaa catggatctc 17760 gcagataccg tcatgttcct gtagggtgcc atcagatttt ctgatctggt caacgaacag 17820 atacagcata cgtttttgat cccgggagag actatatgcc gcctcagtga ggtcgtttga 17880 ctggacgatt cgcgggctat ttttacgttt cttgtgattg ataaccgctg tttccgccat 17940 gacagatcca tgtgaagtgt gacaagtttt tagattgtca cactaaataa aaaagagtca 18000 ataagcaggg ataactttgt gaaaaaacag cttcttctga gggcaatttg tcacagggtt 18060 aagggcaatt tgtcacagac aggactgtca tttgagggtg atttgtcaca ctgaaagggc 18120 aatttgtcac aacaccttct ctagaaccag catggataaa ggcctacaag gcgctctaaa 18180 aaagaagatc taaaaactat aaaaaaaata attataaaaa tatccccgtg gataagtgga 18240 taaccccaag ggaagttttt tcaggcatcg tgtgtaagca gaatatataa gtgctgttcc 18300 ctggtgcttc ctcgctcact cgaccgggag ggttcgagaa gggggggcac cccccttcgg 18360 cgtgcgcggt cacgcgcaca gggcgcagcc ctggttaaaa acaaggttta taaatattgg 18420 tttaaaagca ggttaaaaga caggttagcg gtggccgaaa aacgggcgga aacccttgca 18480 aatgctggat tttctgcctg tggacagccc ctcaaatgtc aataggtgcg cccctcatct 18540 gtcagcactc tgcccctcaa gtgtcaagga tcgcgcccct catctgtcag tagtcgcgcc 18600 cctcaagtgt caataccgca gggcacttat ccccaggctt gtccacatca tctgtgggaa 18660 actcgcgtaa aatcaggcgt tttcgccgat ttgcgaggct ggccagctcc acgtcgccgg 18720 ccgaaatcga gcctgcccct catctgtcaa cgccgcgccg ggtgagtcgg cccctcaagt 18780 gtcaacgtcc gcccctcatc tgtcagtgag ggccaagttt tccgcgaggt atccacaacg 18840 ccggcggccg gccgcggtgt ctcgcacacg gcttcgacgg cgtttctggc gcgtttgcag 18900 ggccatagac ggccgccagc ccagcggcga gggcaaccag ccgagggctt cgccctgtcg 18960 ctcgactgcg gcgagcacta ctggctgtaa aaggacagac cacatcatgg ttctgtgttc 19020 attaggttgt tctgtccatt gctgacataa tccgctccac ttcaacgtaa caccgcacga 19080 agatttctat tgttcctgaa ggcatattca aatcgttttc gttaccgctt gcaggcatca 19140 tgacagaaca ctacttccta taaacgctac acaggctcct gagattaata atgcggatct 19200 ctacgataat gggagatttt cccgactgtt tcgttcgctt ctcagtggat aacagccagc 19260 ttctctgttt aacagacaaa aacagcatat ccactcagtt ccacatttcc atataaaggc 19320 caaggcattt attctcagga taattgtttc agcatcgcaa ccgcatcaga ctccggcatc 19380 gcaaactgca cccggtgccg ggcagccaca tccagcgcaa aaaccttcgt gtagacttcc 19440 gttgaactga tggacttatg tcccatcagg ctttgcagaa ctttcagcgg tataccggca 19500 tacagcatgt gcatcgcata ggaatggcgg aacgtatgtg gtgtgaccgg aacagagaac 19560 gtcacaccgt cagcagcagc ggcggcaacc gcctccccaa tccaggtcct gaccgttctg 19620 tccgtcactt cccagatccg cgctttctct gtccttcctg tgcgacggtt acgccgctcc 19680 atgagcttat cgcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 19740 tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 19800 tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 19860 ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 19920 atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 19980 agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 20040 cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 20100 gaatgctcat ccggaatttc gtatggcaat gaaagacggt gagctggtga tatgggatag 20160 tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 20220 tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 20280 cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 20340 caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 20400 cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 20460 ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 20520 attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 20580 gtgcccttaa acgcctggtt gctacgcctg aataagtgat aataagcgga tgaatggcag 20640 aaattcgatg ataagctgtc aaacatgaga attggtcgac ggcccgggcg gccgcaaggg 20700 gttcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg 20760 gcagtgagcg caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac 20820 actttatgct tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag 20880 gaaacagcta tgaccatgat tacgccaagc tatttaggtg agactataga atactcaagc 20940 ttgcatgcct gcaggtcgac tctagaggat cccacgacgt cg 20982 <210> 29 <211> 22887 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 29 gcggccgcaa ggggttcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 60 cggcatcaga gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat 120 gcgtaaggag aaaataccgc atcaggcgcc attcgccatt cagctgcgca actgttggga 180 agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 240 aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 300 cagtgaattg taatacgact cactataggg cgaattcgag ctcggtaccc ggggatccca 360 cgtggcgcgc cgccatagtt tagcgataat cgccatgaat gctataggat aaatgataaa 420 aataatgaat tattacaaag ggaacataag agaatcaggg cgaaaatcgc catgataaca 480 ggatgttagt cactgccaaa gagatcgcgg gtgtagactt tgtctgccac atccttaagc 540 tcttctgcca tacggttgga gataatgacg tcggcttgta tagtcagctt agaacagctt 600 tgattgtaaa atgagcacgt taccagaaaa aacagccaag tttagaactg ataccgatta 660 tctttttttc ttgtctaacg gtataattta actttcagtt atgccagatg aagattggct 720 atattctagc ctgagcgagg attataaatg aaatttctgg ttacgggagc tgctggcttt 780 atcggtttct atctaagtaa acggcttctt gcagctggtc atcaggttgt aggcattgac 840 aacttaaatg attattacga tgtcaacctc aaacaagcac gacttgattt actcaagcac 900 gacaacttca gtttttataa aattgacctg gccgatcgtg agaaaatggc ggcactgttt 960 gcagacgagc ggttcgaacg cgtaataaac ctcgctgcgc aagccggtgt acgttactct 1020 cttgaaaatc ccaatgcata tgcagatgca aacctgattg gattcctgaa catactagaa 1080 ggatgtcgcc ataataatgt tcagcatcta ctttacgctt cctccagttc tgtttatggc 1140 atgaaccgca agatgccttt ctctacagat gactctgtag atcatcctgt ttcgctttat 1200 gcagcaacta aaaaagcgaa tgaactcatg gcccatacat attctcattt gtatggctta 1260 ccgaccacag ggctgcgttt ctttacggtt tatggtccat ggggacgtcc ggatatggca 1320 ttatttaaat tcactaaagc catgctggaa ggtaaaagca ttgatgttta caacttcggc 1380 aaaatgaagc gtgactttac ttacattgat gatattgccg aagctattat tcgcttacag 1440 gatgttattc cagaaaaaaa cccacagtgg gctgtagaaa caggctcgcc tgcaacaagt 1500 tcagcaccat atcgtgtcta taacattggt aatagttcgc ctgtggagtt gatggactat 1560 atcaatgcgt tagaagaggc tctgggtatt gaagccaaca aaaatatgat gcctctccaa 1620 cccggtgatg tactggaaac cagtgctgat acaaaagcac tgtatgacgt aataggattc 1680 aaacctgaaa cgtcagttaa agaaggggta aagaactttg tagaatggta tcgtaacttc 1740 tataaagttt gattttacaa aaccataaga aaaggcccta atttattagg gccttttctt 1800 agaatgaaac aaaataatta atcattgcca aacaagtcgc gcgtataaac tttatctgct 1860 acatcagcca gatcggcaga catacggtta gaaataataa catcagcttc ttgtttgaac 1920 gcatccagat cacgtaccac gcgcgaccgg aaaaaatcgt cctctttcat agctggctca 1980 taaacgatta caggcacacc tttcgccttg attcgcttca taataccctg aatcgaggaa 2040 gcacgaaaat tgtctgaacc attcttcata atcaaacgat agacgccaac aactttcggt 2100 ttacgtgcaa ggatagaatc ggcaataaaa tctttgcgcg tgcggttggc gtcaacaatt 2160 gccgagatca ggttattcgg cacagactgg taatttgcca gtaactgctt agtatctttc 2220 ggcagacaat aaccaccata accgaatgac gggttgttgt agtgattacc gatacgcggg 2280 tcaaggcata cgccctcaat aatctggcgt gaattaagtc ccaggctttc agcataacta 2340 tcaagttcat tgaaatacgc tacacgcatc gccagataag tgttcgcaaa aagtttaatc 2400 gcctcagcct cggttgagtc agtaaacaat gttggtatgt cttgcttaat ggcgccttcc 2460 tgtaataacg cagcaaaacg tttagcgcgt tcagactgct cgccaatcac aatgcgtgat 2520 gggtgtaagt tatcataaag tgctttacct tcacgcaaaa actcaggcga aaagatcaca 2580 ttttcaatac caaaacgttc tttaatggac tctgtaaaac caacagggat agttgatttt 2640 ataatcatta ccgcgttggg attaatttct gtcacatcac gaatgaccgc ttccacgctt 2700 gaggtattaa aataatttgt tttcggatca taatcggtag gtgtggcaat aataacgtaa 2760 tcggcatttt tatacgcgtc atacttatct gtcgtagcgc ggaaattgag atctttagtc 2820 gccagatact cttcaatctc cttatcaaca agcggtgact gcctcttgtt aagcatgtcc 2880 actttggcct gaacgatatc cagtgcaacc acttcgtggt tttgcgcaat cagaatacca 2940 tttgaaagac caacataacc tgttcctgaa attgttattt tcattagctc tgacttcttc 3000 cggttaaaca tttagagtgg tcattaatcc accaccacag cttcatctac tgcgggattt 3060 ttaacgctga tgtagatgaa ctgtcaaggc agcgatcctg ctgtgcggcg ctgtattata 3120 tcgcgttttt aactataaat tataaaaaaa ggccctaacc tgccgctttg tataataaaa 3180 aagcccggag ggtttctccg ggccttgctt tgattaattg atttaaatca gattaatcca 3240 gccattcggt atggaacaca ccttctttat caatgcgctt ataagtatgc gcaccgaaat 3300 agtcacgctg tgcctggatc aggttcgcag gcagaacagc ggcgcggtag ctgtcgtaat 3360 aggcaaccgc agcggcgaag gtcggcaccg ggataccgtt ctgtactgcg taagcgacga 3420 catcgcgcag cgcctgctgg tagtcatcgg caatttgctt gaagtaagga gccagcaaca 3480 ggttagcgat ctgcggattt tcggcataag catcggtgat tttctgcagg aactgcgcac 3540 ggatgatgca gccagcacgg aaaatcttcg cgatttcacc gtagttcaga tcccagttgt 3600 actcttcaga cgcagcgcgt agctgagaga agccctgagc gtaagaaacg attttgccca 3660 gatacagcgc acggcgaact ttttcgatga actcagcatt gtcgccagct ggctgcgctt 3720 gcgggccaga gagaacttta gatgcggcaa cacgctgctc tttcagagaa gagatataac 3780 gtgcaaacac agactcggta atcagcgaca gcggttcgcc gagatccagc gcgctctggc 3840 tggtccattt gcccgtacct ttgtttgctg cttcatccag aatcacatca accaggtagt 3900 taccctcttc atcttttttg gtgaagatat ctttggtgat gtcgatcagg tagctgctca 3960 gttcaccgtt attccactcg gtaaaggtct gcgccagttc ttcgttggtg aggttcaagc 4020 cacctttaag cagagaatag gcttcagcaa tcagctgcat atcaccgtat tcaataccgt 4080 tgtgaaccat cttcacataa tgacctgcac catcggcacc aatataggta acgcacggtt 4140 cgccgtcttc agccacagcg gcgattttgg tcaggatcgg cgcaatcagt tcataagctt 4200 ctttctgccc accaggcata atggaaggac ctttcagcgc accttcttca ccaccggaaa 4260 caccggtacc gataaagtta aagccttctg cagaaagctc acggttacga cgaatggtgt 4320 catggaagaa ggtgttacca ccatcaatga tgatgtcacc tttatcgagg tatggcttga 4380 gggaatcaat agcagcatcc gtgccagcac ctgctttcac cattaacagg atgcgacgag 4440 gcgtttccag agattcaaca aattctttca ccgtatagta aggaaccagt ttcttgcctg 4500 gattttcggt aatcacttct tcggtctttt cacgggaacg gttgaaaata gagacggtat 4560 aaccacggct ttcgatattg agcgcaaggt tgcgccccat cactgccata ccgacgacgc 4620 cgatctgttg ctttgacatt gtttactcct gtcaggatac cgctgggtgg tatgcgggtt 4680 atgcttaatt atagaatatg cctaataaaa ataaatccat aacacttaat cagaaaatta 4740 ttattatcga ttcctaacga ttgaatacat cagctccttt aatttagatg gcattatacg 4800 aaaaaatgtt ctcaacatag cattacttat taattcattt tttcgaataa aaccaatttt 4860 atattgataa tacaatactt tatactcgta caataaatat gacaatccac gtcgagccat 4920 aagattacga ccagttcgca tttttaataa aatatctgga agatttgcaa atcttgcatt 4980 atgtacaatt aataggctcc acaatgcaaa atcttgagat tttctgaatg gaggataacc 5040 accaacagct aatactgtat tctttctaaa aattacagaa ggatggctaa ctgcgcttcg 5100 tttcctcgcg aatttaacta tttctctatg ttcgagaggc actttgcgtg ttgaaataaa 5160 ctcctcagta acagtttcaa tttcatcaat aaaactgcca catacatcta tttctgaatt 5220 attaatcata aaagaaattt gtttctcaaa ccgatgaggc aaagaaatat catcagcatc 5280 cattcttgcc actaactcat tcctacaagc ctttaatcct tcatttaagg cattagccaa 5340 tccaacattt ctaggtaaag gtacaaatgt tactatttta ttgccaacat catcaatgaa 5400 tgaatttata atatcgatgt gtgtttgatg gagttctcca tctgcaacaa ttactatttg 5460 atctggctta agtgtttgat cgtgaaaaat agagcgtaga gccacctcaa aaaattgcgg 5520 tagatcattt ttataaatgc taattaaaac tgagaatttt tctaatctat gattcatttc 5580 attttaccac ttcgacccat taaaccgtca ttaatgcctt ttaaaaaaaa atataacctt 5640 ttattaccat ttggaaggaa aataggatat aaaaaaacct ttccaattaa tttaaccaga 5700 ctagaaattt tccagtagat gggtacataa tttttattta ataaaagaaa gatatttcga 5760 gtagcataat aatgacgaaa tgggcttggc aaaccgacag aaagaatatt taagatctta 5820 aatcgcccat ctccaagtct atgtgcaagt aacgcatttt tattcctaat tactttaaac 5880 ccagcagctc ttaatctcca acaatattca tggtctaccg catcgataaa aagctcatct 5940 ttcattcctc caacaatcaa ccaactattt tttggtatta gactgccaga acttaatgta 6000 ctatctacct cataataaac ttctgtaagt ggtttccctt tttttaccct tgctttattt 6060 aattcaccag ttactttatc aaaatcttgt gaaccaacta aaccaacatt gacattttgt 6120 ttaagcaatt ttttgtaaca agtaagtaac tgctctacca tcttaggatc aggaatacta 6180 tcctgatcca tttgcaatat aaaatcagcg ccattttcaa aagcccattt cattcctata 6240 ctttgggctt ctgctatgcc taaattatca ttgaaattga atatttttac atcgcctgaa 6300 gaattttcag catatttata accatttgta gagttattgc aaacgacaac tttagtaact 6360 tgtctcaaca ataattcaac cgcatttttt aaatcattat gttctgggtt gtaagcaacc 6420 aaaacggcat atacagtgtc catcttcacc ttaaaacctt catttagctt tcatcttttt 6480 tagaacatta cttaatgtca ctaatacaat tattacagca acatggttag agtctaaaat 6540 ataaggatta gtaattgcat aagaaacata tagaaaatat agcacacaca actcactgta 6600 ttttatgatt ttaatcgtga gaaggagatt aattaataaa aacaaagtaa ataaaataac 6660 gccaagttga tttaaaaaat aaactgactg caattcataa tatatatatg cactataatc 6720 acggatagga gtttgaattt tgatgacatt acccaaacca gaacctataa caaaatttga 6780 tacagactct gtaagatcat taattaatac agtaaactga tcccatctaa ctcctaaaga 6840 agaatcagct ccatttgatt tcatgattat caactcaatt gaatatgtaa taaaaaaagg 6900 gagaatcaca gtaagaaaaa ccccaaaaat aattttcctt aatttagcgt atcgtgagtt 6960 agatttagaa catagtataa tatacataaa aaacaagcat atcgaaacaa aatatgcaaa 7020 attaccagcc actatagtac ctatagccag aataacggtt attgtatttt tgaatcgata 7080 atagaaataa tcttttatga ctatatgcaa cataaaggca aatggaatga gagcatttcc 7140 tttaatttga actctataga aaccacttcc atatgtataa acatcaccat aatcattctc 7200 caaaaaataa tgtcttagtg ctgaataatc accaatacca tatgtttttg tcatataaat 7260 actaatgatg gatataataa ccgcctgtaa taccattaaa tataaaaata ttttaacaat 7320 cgagatggtt ccataagagc agaaataagc acataatata aataatatga taatataaaa 7380 cctaattatt atcgctatat cgttaccctt gatataggaa taaataaaat ttataaaaag 7440 agctaataga aatattaaaa taacaggata gtgatatatt ccgtttgcaa ttttctttgt 7500 aaatgacatg atacaaagac ataaaaaccc ctccataatc caactatatt gaataaatgg 7560 aaagctacgt gtaaggaaaa atataaaccc aaaaaacaaa agaacactta aacttttgtc 7620 ttttgagtta taaaaatcag aagtcatgtt tgcactctaa ttagatgggc ttgaggaagt 7680 aatccctaaa atcaattcgc tattaatatt tcgtatcaat taataataat atcaaaaaat 7740 ctaacgatgt tcttacagac catgctattg cggctccaac aattccccaa tgataaataa 7800 aaatatataa tatgcataaa tatgggataa cttcgagcaa atgaataata gctgtaattt 7860 ttgatcttcc actagcctga actgaaacaa atgggatttg tgcaatgcaa ttaaaaaaga 7920 aacctattgc aagaattttt aatactatac ctggcgtccc atgatatgta ggtcccatcc 7980 aagcggacat tataaaatct gataaaataa ttatcaacat tacaattgga agtataccaa 8040 taaccattat aaaatatgat aatattttag tttgctttac cgattgcaat tctgaactta 8100 atcttggaaa aatagctctg gacaacgcac ttggtaatat cgttaagcgt tgtatacctt 8160 cagacggagc agtataaaaa gaaactttat cagcccccac aatgtgtgaa agaataaaac 8220 gatccatata tgtcataata gggctaataa tattgctaac tgttatccag cttccaaagc 8280 cgattaatct tttaactgtt acaattttta cagacagccc agatgatatt attagttttc 8340 gactaaatat aaaggtcact ataagtgata agactcttgc cataactaaa ccatatatag 8400 cacttagtaa tcctccatga aaaaaacaga aaatcactgg taatccagcc acaaaagagt 8460 tgttaattga ttttattaaa tttacttttc tgaacttttc catcccctca aaaatcccca 8520 accagacttg gtttaacaag tataagggta tggtagctga aataatatat attgctttga 8580 cagattctac aacatgattc gcgttaatgt ttaataattt aacaattaca ttgctactca 8640 aaaatagtac actaccgcca atcaagccca atatagttag aattaccgtt gaagttgaaa 8700 tgatcgctct taattcttta tgaacatttt tatatattga tacttctctt ataacagctc 8760 tggtcaatcc agcatcaaaa atacttgcat atccaactaa ggcaatagct aacgtaaaaa 8820 ggccaaattg ctcggtccct agaattctag acagtatacc taacgcagga attgctatta 8880 atgatggtat aatataccca cttatattcc ataaagtatt ctttacaata ctcacaaaaa 8940 taattccttc atgttatgca attctttagc ccttgcatct ttaatcgata aaatataatt 9000 attatgttct atcgtcggcc attttatgct cagaatagga tcattccata caatccctct 9060 atcactatca ggatgataat agttcgtcgt tttatataaa aattccgcag tctcgctcag 9120 caccaaaaaa ccatgtgcaa atccctcagg gatccacaat tgccgcttat tctcagcaga 9180 taaattcacc ccaacccatt taccaaaggt aggcgacgat ttacgaatat caacagctac 9240 atcaaaaacc tcaccaacaa cgcaacgtac cagtttccct tgcgcataag gttctaactg 9300 ataatgcagc ccgcgtaaaa cacctttact agacttcgaa tggttatcct gaacaaattc 9360 aaccttacgt cctacagctt cttcgaaaac tttctgatta aagctttcca taaagaaacc 9420 acgctcatca ccaaaaactt tcggctcgaa aattaacaca tcaggaattt ctgttttaat 9480 tacgttcatt ttattaataa cctttaatca ttttcagcag atactgtcca taagcatttt 9540 ttttcagcgg ctccgctaat gctttcacct gttcagcatc aataaaccct ttacggtaag 9600 caatttcttc tgggcaggaa acctttagtc cctggcgctc ttcaatggtg gcaatgaagt 9660 tgcttgcttc aataagactc tgatgtgtcc ccgtatccag ccatgcataa ccacgcccca 9720 tcatggcaac ggataaacgc ccctgttcca tataaatacg gttaatatcg gtaatttcca 9780 gttcaccacg ggcagaaggc ttaaggtttt tcgccatttc gacaacgtcg ttatcataga 9840 aataaagccc ggttaccgca taattacttt ttggttgtag cggtttttct tccaggctta 9900 ttgccgtacc gtttttatca aactcaacga cgccgtagcg ttcaggatca ttaacgtgat 9960 aggcaaatac cgttgcacca ctttctttgt taacagcgac atccattaac ttcggcagat 10020 catgaccgta gaagatatta tcaccaagaa ccaaagcaca atcatcacca ccgataaact 10080 cttcaccgat aataaacgcc tgcgcaagcc catctggagt cggttgcact ttgtactgaa 10140 gatttagccc ccactggcta ccgtcaccta gcagttgttg aaaacgagga gtatcctgtg 10200 gcgtactaat aatcagaata tcgcgaatac ccgccaacat cagtgtagag agcgggtaat 10260 agatcatcgg cttatcataa ataggtaata gctgtttact gacagccata gtcacaggat 10320 aaagacgtgt accagaacca cccgctaaaa taataccttt acgcgttttc atttcatcat 10380 tccttttaat tcatcttgct ccaccatcac gaacaagatg caaaaactat taaattgctg 10440 tagtcgtaat taattcgttg agcattcgtt tcacaccaac ctgccagtca ggcaagacaa 10500 gcgcaaagtt ctgctgaaat ttttctgtat taaggcgaga gttatgtgga cgacgagctg 10560 gtgtaggata ggctgttgtt ggtactgcgt tgagcttgtt gagtgcaagg ggaatacctg 10620 ctttgcgcgc ctcttcaaaa accagcgcag cataatcgtg ccaggttgtg gtaccactgg 10680 ctaccagatg gtacaaacct gcgacttccg gtttattcag tgccacacga atagcatgtg 10740 ccgtacaatc agccagcagc tcagcacctg ttggcgcacc aaattgatca tttatcacag 10800 ccagttcttc gcgctctttt gccagacgca acatcgtttt ggcgaagtta tttcctttag 10860 ctgcgtatac ccagctggta cggaaaataa gatgcttcgc gcaatgttcc tgtaacgctt 10920 tttctccggc taacttggtt tcaccgtaaa catttagcgg tgcggttgca tccgtctcca 10980 gccatggcgt gtcgccattt ccagggaata cgtagtcagt tgagtaatga attacccaag 11040 ccccaacttc attagcctct tttgcaattg attcaacact agtcgcattg agtaattgtg 11100 caaattcggg ttctgactca gccttatcta ctgcggtgtg agccgcagca ttaacaataa 11160 catcaggtcg aattcttttg actgtttcag ctacaccttc aggattacta aaatcaccac 11220 aataatcagt ggagtgaaca tcaagagcaa tcaaattacc caaaggtgcc agagcacgct 11280 gtagttccca acctacctgc cctgttttgc cgaaaaggag gatattcatt actggcggcc 11340 ctcatagttc tgttcaatcc acgattgata agcaccactt ttcacattat caacccattt 11400 tgtattggac aggtaccatt ccaatgtctt ccgaatcccg ctctcaaacg tttcctgcgg 11460 tttccagccc aattcgcggc taatcttctc tgcatcaatc gcataacggc gatcgtgtcc 11520 cgggcgatcg gcaacataag taatttgctc gcggtaagat ttctctttcg gtacaatctc 11580 atccagcaaa tcacaaatag tgagcactac atcgatgttt ttcttttcgt tgtgtccacc 11640 aatgttataa gtttcacccg ctttaccttc ggttacgacg gtatataacg cacgcgcatg 11700 atcttcaaca tacagccagt cacgaatttg atcccctttg ccataaatag gtaatgcctt 11760 accttccaga gcattcagaa taaccaatgg aatcaatttt tccgggaaat gataaggacc 11820 ataattatta gagcaattag tcacaatggt tggtaaacca taggtacgtt tccacgcgcg 11880 gactaaatga tcgctggatg cttttgaagc ggaataaggg ctgcttggcg cgtaagctgt 11940 tgtctctgta aataagggta attcttctgt attatttacc tcgtcaggat gaggcaaatc 12000 accatagact tcgtcagtag aaatatgatg aaaacggaat ctagttttct tgtcgctatc 12060 aagagcagac caataattgc gagcggcttc caaaaggaca tatgtaccaa caatattggt 12120 ttcaataaat gccgcaggac ctgtaattga acggtcaaca tggctttcag cagccaggtg 12180 catcactgca tctggctgat gctgagcaaa aatccgtgcc attgcagctg catcgcaaat 12240 atccgcatgt tcaaaaacat agcgttcaga atcagaaaca tcagcaagtg attccaggtt 12300 tccggcgtac gttaatttat cgacattaac aacactatcc tgcgtattat ttataatgtg 12360 acgaactaca gcaaaaccaa taaatcctgc gccaccagta acaagtattt tcacctaatt 12420 tattccatat tgcttcagag catgctgtga aataagcggc tctcagtttg attaatagaa 12480 gtattaatgc acgctaccgc ccctggcttt acagctacca gagcactgca tgcatgccta 12540 cgatgtgacg agcgttaccc actcgcgcta aacccgaaaa attcaaaagc taattgtctt 12600 accaatccgc tctggaaaca aggaaaatcc tggaaaactt tgactaaaat cctattgcta 12660 actcgttgtt attctgattg tttatataaa acaacggcag gaatattcgc aacaaattac 12720 tttcaccacg aatcttcact gccgttataa ttttcttatc aaccgttaca tccggtcaga 12780 ttttcattat tcgcttaaca gcttctcaat acctttacgg aacttcgccc cttctttcag 12840 gttgcgcagc ccatacttca caaacgcctg catatagccc atttttttac cgcagtcgta 12900 gctgtcgccg gtcatcagca ttgcatcaac ggactgtttt ttcgccagct cggcaatggc 12960 atcagtcagc tgaatacgtc cccatgcacc aggctgagta cgttcaagtt ccggccaaat 13020 atcggcagaa agcacatagc gaccaacggc catgatgtct gagtccagcg tctgcggctg 13080 atccggtttt tcgataaatt caacaatgcg gctgacttta ccttcgcgat ccagcggttc 13140 tttggtctgg atgacggagt attcagagag gtcacccggc atacgttttg ccagcacctg 13200 gctacggccc gtttcattga agcgcgcaat catggcagca aggttgtagc gtagcgggtc 13260 ggcgctggcg tcgtcgatca caacgtctgg cagcaccacg acaaatggat tgtcaccaat 13320 ggcgggtcgt gcacacaaaa tggagtgacc taaacctaaa ggttcgccct gacgcacgtt 13380 cataatagtc acgcccggcg ggcagataga ttgcacttcc gccagtagtt gacgcttcac 13440 gcgctgctca aggagagatt ctaattcata agaggtgtcg aagtggtttt cgaccgcgtt 13500 cttggacgca tgagttacca ggaggatttc tttgatccct gcagccacaa tctcgtcaac 13560 aatgtactga atcattggct tgtcgacgat cggtagcatc tctttgggta tcgccttagt 13620 ggcaggcaac atatgcatcc caagacccgc taccggtata actgctttta aattcgtcat 13680 tattttccta cctctaaggg gctgatagtg cgtaaattat tgtcataggt tagccaaacg 13740 gtatggctat ataccaagca taactttgat taaaccttac gataacacta cacaccatca 13800 gcatctgggt tactcggatt actcggaaat ccacatactg ataatttaat cagtacctct 13860 ttccgaataa tcgtagtcca acctggtcct tttttctctg actcgtctgc attactcaga 13920 aacaaacgtt atgtcgtctt ttttggcatg gacgaattca tactgcagag ttcgatccag 13980 accttgcgac agcgtatacg gtgcaacaaa acctgaagaa tgcactttcg ttgcgtcaaa 14040 ctgtgttgtt gcgcagaatt ttttcacgcg cacagagctg acagcgtatt ttttgcccgt 14100 aattttgctc aggatatcaa agcaatatcc acccagcatt cctagtgggt aaggcaagtg 14160 catagaaggg atctttttgt tcaggctttg ttcaacttca gcaaccaact ggttcatgtt 14220 caggtctggc ttatcaacat agttataaac ctcataacct gcggcaacat tcttcagttt 14280 gtacttgata aactcaacaa tgtttccaac ataagccatg gacttatagt tagtccctgc 14340 gcccaccatc ataaacttgc cgccagcgat ctgtttcagc aagttataga cgttaccgcg 14400 gttgcgttca ccgaagataa cggtaggacg gatgatggtt aatgaacgtt ctgttggtgc 14460 tttgttatac cattcacgca gcacttcctc tgcctgccac ttacttttgc cgtagtggtt 14520 gaaagggtcg tgtggatggt tttcgtcagg gttgtgtttg ttcaaaccat aaacagcaac 14580 ggaactggta aagatgatat ttttaacgcc atttttttcc atggccgcca gcacattgcg 14640 ggtaccctga acgttgacat cataatagag agaagtaggg ctgacgtcat cgcggtgttc 14700 cgctgccagt agtacaacag tgtcaaaacc ggctaacgcc tggtcgagtg cctgttgatc 14760 acgaacatca ccaatctgtg tgatttctgg ataaaagtgg ctctgccgtt tgtccaggtt 14820 cttgatatta aagtcagcaa ttgccgtttc aagtagtcgg gttcctacga atccggaagc 14880 tcctatgagc aaaacgttat tgttcataaa tcactttagt ctggttgtta cgtaagaaac 14940 acaagataaa gatgagtacc ttccctgagt agtcaatgct gcccagcccc agctttaaca 15000 gttagtgtga ggattataat cttttagaac attatatcca gtaagtttat gaatggtcgc 15060 aaatctactc tctccgttcc ggcaatctaa agttaatgct agcgacgtcg tgggatcctc 15120 tagagtcgac ctgcaggcat gcaagcttga gtattctata gtctcaccta aatagcttgg 15180 cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 15240 acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 15300 cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 15360 attaatgaat cggccaacgc gaaccccttg cggccgcccg ggccgtcgac caattctcat 15420 gtttgacagc ttatcatcga atttctgcca ttcatccgct tattatcact tattcaggcg 15480 tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc 15540 cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa gccatcacaa 15600 acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat 15660 ttgcccatgg tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa 15720 ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta 15780 gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac 15840 tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg 15900 aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc 15960 atacgaaatt ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa 16020 aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc 16080 tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat 16140 tgggatatat caacggtggt atatccagtg atttttttct ccattttagc ttccttagct 16200 cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc attatggtga 16260 aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt ggcccagggc 16320 ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc ttccgtcaca 16380 ggtatttatt cgcgataagc tcatggagcg gcgtaaccgt cgcacaggaa ggacagagaa 16440 agcgcggatc tgggaagtga cggacagaac ggtcaggacc tggattgggg aggcggttgc 16500 cgccgctgct gctgacggtg tgacgttctc tgttccggtc acaccacata cgttccgcca 16560 ttcctatgcg atgcacatgc tgtatgccgg tataccgctg aaagttctgc aaagcctgat 16620 gggacataag tccatcagtt caacggaagt ctacacgaag gtttttgcgc tggatgtggc 16680 tgcccggcac cgggtgcagt ttgcgatgcc ggagtctgat gcggttgcga tgctgaaaca 16740 attatcctga gaataaatgc cttggccttt atatggaaat gtggaactga gtggatatgc 16800 tgtttttgtc tgttaaacag agaagctggc tgttatccac tgagaagcga acgaaacagt 16860 cgggaaaatc tcccattatc gtagagatcc gcattattaa tctcaggagc ctgtgtagcg 16920 tttataggaa gtagtgttct gtcatgatgc ctgcaagcgg taacgaaaac gatttgaata 16980 tgccttcagg aacaatagaa atcttcgtgc ggtgttacgt tgaagtggag cggattatgt 17040 cagcaatgga cagaacaacc taatgaacac agaaccatga tgtggtctgt ccttttacag 17100 ccagtagtgc tcgccgcagt cgagcgacag ggcgaagccc tcggctggtt gccctcgccg 17160 ctgggctggc ggccgtctat ggccctgcaa acgcgccaga aacgccgtcg aagccgtgtg 17220 cgagacaccg cggccggccg ccggcgttgt ggatacctcg cggaaaactt ggccctcact 17280 gacagatgag gggcggacgt tgacacttga ggggccgact cacccggcgc ggcgttgaca 17340 gatgaggggc aggctcgatt tcggccggcg acgtggagct ggccagcctc gcaaatcggc 17400 gaaaacgcct gattttacgc gagtttccca cagatgatgt ggacaagcct ggggataagt 17460 gccctgcggt attgacactt gaggggcgcg actactgaca gatgaggggc gcgatccttg 17520 acacttgagg ggcagagtgc tgacagatga ggggcgcacc tattgacatt tgaggggctg 17580 tccacaggca gaaaatccag catttgcaag ggtttccgcc cgtttttcgg ccaccgctaa 17640 cctgtctttt aacctgcttt taaaccaata tttataaacc ttgtttttaa ccagggctgc 17700 gccctgtgcg cgtgaccgcg cacgccgaag gggggtgccc ccccttctcg aaccctcccg 17760 gtcgagtgag cgaggaagca ccagggaaca gcacttatat attctgctta cacacgatgc 17820 ctgaaaaaac ttcccttggg gttatccact tatccacggg gatattttta taattatttt 17880 ttttatagtt tttagatctt cttttttaga gcgccttgta ggcctttatc catgctggtt 17940 ctagagaagg tgttgtgaca aattgccctt tcagtgtgac aaatcaccct caaatgacag 18000 tcctgtctgt gacaaattgc ccttaaccct gtgacaaatt gccctcagaa gaagctgttt 18060 tttcacaaag ttatccctgc ttattgactc ttttttattt agtgtgacaa tctaaaaact 18120 tgtcacactt cacatggatc tgtcatggcg gaaacagcgg ttatcaatca caagaaacgt 18180 aaaaatagcc cgcgaatcgt ccagtcaaac gacctcactg aggcggcata tagtctctcc 18240 cgggatcaaa aacgtatgct gtatctgttc gttgaccaga tcagaaaatc tgatggcacc 18300 ctacaggaac atgacggtat ctgcgagatc catgttgcta aatatgctga aatattcgga 18360 ttgacctctg cggaagccag taaggatata cggcaggcat tgaagagttt cgcggggaag 18420 gaagtggttt tttatcgccc tgaagaggat gccggcgatg aaaaaggcta tgaatctttt 18480 ccttggttta tcaaacgtgc gcacagtcca tccagagggc tttacagtgt acatatcaac 18540 ccatatctca ttcccttctt tatcgggtta cagaaccggt ttacgcagtt tcggcttagt 18600 gaaacaaaag aaatcaccaa tccgtatgcc atgcgtttat acgaatccct gtgtcagtat 18660 cgtaagccgg atggctcagg catcgtctct ctgaaaatcg actggatcat agagcgttac 18720 cagctgcctc aaagttacca gcgtatgcct gacttccgcc gccgcttcct gcaggtctgt 18780 gttaatgaga tcaacagcag aactccaatg cgcctctcat acattgagaa aaagaaaggc 18840 cgccagacga ctcatatcgt attttccttc cgcgatatca cttccatgac gacaggatag 18900 tctgagggtt atctgtcaca gatttgaggg tggttcgtca catttgttct gacctactga 18960 gggtaatttg tcacagtttt gctgtttcct tcagcctgca tggattttct catacttttt 19020 gaactgtaat ttttaaggaa gccaaatttg agggcagttt gtcacagttg atttccttct 19080 ctttcccttc gtcatgtgac ctgatatcgg gggttagttc gtcatcattg atgagggttg 19140 attatcacag tttattactc tgaattggct atccgcgtgt gtacctctac ctggagtttt 19200 tcccacggtg gatatttctt cttgcgctga gcgtaagagc tatctgacag aacagttctt 19260 ctttgcttcc tcgccagttc gctcgctatg ctcggttaca cggctgcggc gagcgctagt 19320 gataataagt gactgaggta tgtgctcttc ttatctcctt ttgtagtgtt gctcttattt 19380 taaacaactt tgcggttttt tgatgacttt gcgattttgt tgttgctttg cagtaaattg 19440 caagatttaa taaaaaaacg caaagcaatg attaaaggat gttcagaatg aaactcatgg 19500 aaacacttaa ccagtgcata aacgctggtc atgaaatgac gaaggctatc gccattgcac 19560 agtttaatga tgacagcccg gaagcgagga aaataacccg gcgctggaga ataggtgaag 19620 cagcggattt agttggggtt tcttctcagg ctatcagaga tgccgagaaa gcagggcgac 19680 taccgcaccc ggatatggaa attcgaggac gggttgagca acgtgttggt tatacaattg 19740 aacaaattaa tcatatgcgt gatgtgtttg gtacgcgatt gcgacgtgct gaagacgtat 19800 ttccaccggt gatcggggtt gctgcccata aaggtggcgt ttacaaaacc tcagtttctg 19860 ttcatcttgc tcaggatctg gctctgaagg ggctacgtgt tttgctcgtg gaaggtaacg 19920 acccccaggg aacagcctca atgtatcacg gatgggtacc agatcttcat attcatgcag 19980 aagacactct cctgcctttc tatcttgggg aaaaggacga tgtcacttat gcaataaagc 20040 ccacttgctg gccggggctt gacattattc cttcctgtct ggctctgcac cgtattgaaa 20100 ctgagttaat gggcaaattt gatgaaggta aactgcccac cgatccacac ctgatgctcc 20160 gactggccat tgaaactgtt gctcatgact atgatgtcat agttattgac agcgcgccta 20220 acctgggtat cggcacgatt aatgtcgtat gtgctgctga tgtgctgatt gttcccacgc 20280 ctgctgagtt gtttgactac acctccgcac tgcagttttt cgatatgctt cgtgatctgc 20340 tcaagaacgt tgatcttaaa gggttcgagc ctgatgtacg tattttgctt accaaataca 20400 gcaatagtaa tggctctcag tccccgtgga tggaggagca aattcgggat gcctggggaa 20460 gcatggttct aaaaaatgtt gtacgtgaaa cggatgaagt tggtaaaggt cagatccgga 20520 tgagaactgt ttttgaacag gccattgatc aacgctcttc aactggtgcc tggagaaatg 20580 ctctttctat ttgggaacct gtctgcaatg aaattttcga tcgtctgatt aaaccacgct 20640 gggagattag ataatgaagc gtgcgcctgt tattccaaaa catacgctca atactcaacc 20700 ggttgaagat acttcgttat cgacaccagc tgccccgatg gtggattcgt taattgcgcg 20760 cgtaggagta atggctcgcg gtaatgccat tactttgcct gtatgtggtc gggatgtgaa 20820 gtttactctt gaagtgctcc ggggtgatag tgttgagaag acctctcggg tatggtcagg 20880 taatgaacgt gaccaggagc tgcttactga ggacgcactg gatgatctca tcccttcttt 20940 tctactgact ggtcaacaga caccggcgtt cggtcgaaga gtatctggtg tcatagaaat 21000 tgccgatggg agtcgccgtc gtaaagctgc tgcacttacc gaaagtgatt atcgtgttct 21060 ggttggcgag ctggatgatg agcagatggc tgcattatcc agattgggta acgattatcg 21120 cccaacaagt gcttatgaac gtggtcagcg ttatgcaagc cgattgcaga atgaatttgc 21180 tggaaatatt tctgcgctgg ctgatgcgga aaatatttca cgtaagatta ttacccgctg 21240 tatcaacacc gccaaattgc ctaaatcagt tgttgctctt ttttctcacc ccggtgaact 21300 atctgcccgg tcaggtgatg cacttcaaaa agcctttaca gataaagagg aattacttaa 21360 gcagcaggca tctaaccttc atgagcagaa aaaagctggg gtgatatttg aagctgaaga 21420 agttatcact cttttaactt ctgtgcttaa aacgtcatct gcatcaagaa ctagtttaag 21480 ctcacgacat cagtttgctc ctggagcgac agtattgtat aagggcgata aaatggtgct 21540 taacctggac aggtctcgtg ttccaactga gtgtatagag aaaattgagg ccattcttaa 21600 ggaacttgaa aagccagcac cctgatgcga ccacgtttta gtctacgttt atctgtcttt 21660 acttaatgtc ctttgttaca ggccagaaag cataactggc ctgaatattc tctctgggcc 21720 cactgttcca cttgtatcgt cggtctgata atcagactgg gaccacggtc ccactcgtat 21780 cgtcggtctg attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta 21840 gtctgggacc acggtcccac tcgtatcgtc ggtctgataa tcagactggg accacggtcc 21900 cactcgtatc gtcggtctga ttattagtct gggaccatgg tcccactcgt atcgtcggtc 21960 tgattattag tctgggacca cggtcccact cgtatcgtcg gtctgattat tagtctggaa 22020 ccacggtccc actcgtatcg tcggtctgat tattagtctg ggaccacggt cccactcgta 22080 tcgtcggtct gattattagt ctgggaccac gatcccactc gtgttgtcgg tctgattatc 22140 ggtctgggac cacggtccca cttgtattgt cgatcagact atcagcgtga gactacgatt 22200 ccatcaatgc ctgtcaaggg caagtattga catgtcgtcg taacctgtag aacggagtaa 22260 cctcggtgtg cggttgtatg cctgctgtgg attgctgctg tgtcctgctt atccacaaca 22320 ttttgcgcac ggttatgtgg acaaaatacc tggttaccca ggccgtgccg gcacgttaac 22380 cgggctgcat ccgatgcaag tgtgtcgctg tcgacgagct cgcgagctcg gacatgaggt 22440 tgccccgtat tcagtgtcgc tgatttgtat tgtctgaagt tgtttttacg ttaagttgat 22500 gcagatcaat taatacgata cctgcgtcat aattgattat ttgacgtggt ttgatggcct 22560 ccacgcacgt tgtgatatgt agatgataat cattatcact ttacgggtcc tttccggtga 22620 tccgacaggt tacggggcgg cgacctcgcg ggttttcgct atttatgaaa attttccggt 22680 ttaaggcgtt tccgttcttc ttcgtcataa cttaatgttt ttatttaaaa taccctctga 22740 aaagaaagga aacgacaggt gctgaaagcg agctttttgg cctctgtcgt ttcctttctc 22800 tgtttttgtc cgtggaatga acaatggaag tccgagctca tcgctaataa cttcgtatag 22860 catacattat acgaagttat attcgat 22887 <210> 30 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 30 His His His His His His 1 5

Claims

삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
운데카프레닐 피로포스페이트 상에서 N-아세틸갈락토스아민을 합성하는 에피머라제(epimerase);
지질 담체 상에서 올리고사카라이드 또는 폴리사카라이드를 조립하는 글리코실트랜스퍼라제(glycosyltrasferase);
올리고사카릴 트랜스퍼라제(oligosaccharyl transferase); 및
X 및 Z가 프롤린을 제외한 임의의 천연 아미노산일 수 있는 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T를 포함하는 단백질
을 코딩하는 핵산을 포함하고,
상기 에피머라제는 서열번호 2의 아미노산 서열을 포함하는 재조합 원핵 생합성 시스템.
제11항에 있어서,
에피머라제를 코딩하는 핵산이 서열번호 1을 포함하는, 재조합 원핵 생합성 시스템.
제11항에 있어서,
올리고사카릴 트랜스퍼라제가 캄필로박터 제주니(Campylobacter jejuni)로부터 유래되는, 재조합 원핵 생합성 시스템.
제11항에 있어서,
단백질이 슈도모나스 애루기노사 엑소단백질인, 재조합 원핵 생합성 시스템.
제11항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 그람 음성 박테리아로부터 유래되는, 재조합 원핵 생합성 시스템.
제15항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 쉬겔라 플렉스네리로부터 유래되는, 재조합 원핵 생합성 시스템.
제16항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 쉬겔라 플렉스네리 6으로부터 유래되는, 재조합 원핵 생합성 시스템.
삭제
제15항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 에스케리치아 콜라이로부터 유래되는, 재조합 원핵 생합성 시스템.
제19항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 에스케리치아 콜라이 O157로부터 유래되는, 재조합 원핵 생합성 시스템.
제11항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 구조 α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc를 포함하는, 재조합 원핵 생합성 시스템.
(a) (i) 운데카프레닐 피로포스페이트 상에서 N-아세틸갈락토스아민을 합성하는 에피머라제; (ii) 지질 담체 상에서 올리고사카라이드 또는 폴리사카라이드를 조립하는 글리코실트랜스퍼라제; (iii) 올리고사카릴 트랜스퍼라제 및; (iv) X 및 Z가 프롤린을 제외한 임의의 천연 아미노산일 수 있는 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T를 포함하는 단백질을 코딩하는 핵산을 숙주 유기체 내로 도입하는 단계; 및
(b) 하나 이상의 N-글리코실화된 단백질이 제조될 때까지 상기 숙주 유기체를 배양하는 단계
를 포함하고,
상기 에피머라제는 서열번호 2의 아미노산 서열을 포함하는, N-글리코실화된 단백질의 제조 방법.
제22항에 있어서,
에피머라제를 코딩하는 핵산이 서열번호 1을 포함하는, 제조 방법.
제22항에 있어서,
올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터 유래되는, 제조 방법.
제22항에 있어서,
단백질이 슈도모나스 애루기노사 엑소단백질인, 제조 방법.
제22항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 그람 음성 박테리아로부터 유래되는, 제조 방법.
제26항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 쉬겔라 플렉스네리로부터 유래되는, 제조 방법.
제27항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 쉬겔라 플렉스네리 6으로부터 유래되는, 제조 방법.
삭제
제26항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 에스케리치아 콜라이로부터 유래되는, 제조 방법.
제30항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 에스케리치아 콜라이 O157로부터 유래되는, 제조 방법.
제22항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 구조 α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc를 포함하는, 제조 방법.