KR101855380B1 - 원핵세포에서 면역원성 폴리사카라이드를 제조하는 생합성 시스템 - Google Patents
원핵세포에서 면역원성 폴리사카라이드를 제조하는 생합성 시스템 Download PDFInfo
- Publication number
- KR101855380B1 KR101855380B1 KR1020127015728A KR20127015728A KR101855380B1 KR 101855380 B1 KR101855380 B1 KR 101855380B1 KR 1020127015728 A KR1020127015728 A KR 1020127015728A KR 20127015728 A KR20127015728 A KR 20127015728A KR 101855380 B1 KR101855380 B1 KR 101855380B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- val
- ala
- gly
- ser
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/025—Enterobacteriales, e.g. Enterobacter
- A61K39/0258—Escherichia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/025—Enterobacteriales, e.g. Enterobacter
- A61K39/0283—Shigella
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/385—Haptens or antigens, bound to carriers
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/64—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
- A61K47/646—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent the entire peptide or protein drug conjugate elicits an immune response, e.g. conjugate vaccines
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/6068—Other bacterial proteins, e.g. OMP
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Immunology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Mycology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Virology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicinal Preparation (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
Abstract
본 발명은 N-글리코실화된 단백질을 포함하는 생접합체 백신에 관한 것이다. 또한, 본 발명은 환원 말단에서 N-아세틸갈락토스아민을 갖는 올리고사카라이드 또는 폴리사카라이드를 합성하는 에피머라제(epimerase)를 코딩하는 핵산을 포함하는 재조합 원핵 생합성 시스템에 관한 것이다. 추가로, 본 발명은 환원 말단에서 N-아세틸갈락토스아민을 갖는 올리고사카라이드 또는 폴리사카라이드를 함유하는 N-글리코실화된 단백질, 및 이러한 N-글리코실화된 단백질을 제조하는 발현 시스템 및 방법에 관한 것이다.
Description
본 발명은 백신의 제조를 위한 생합성 시스템 및 단백질의 용도에 관한 것이다. 또한, 본 발명은 환원 말단에서 특정 모노사카라이드를 갖는 올리고사카라이드 또는 폴리사카라이드의 합성을 개시하는 에피머라제(epimerase)를 갖는 재조합 원핵 생합성 시스템에 관한 것이다. 추가로, 본 발명은 발현 시스템에서 글리칸을 사용하여 생성한 N-글리코실화된 단백질, 및 면역원성 글리칸을 포함하는 상기 N-글리코실화된 단백질로부터 제조된 생접합체 백신에 관한 것이고 N-글리코실화된 단백질의 제조 방법을 제공한다.
관련 출원의 교차참조
본원은 전체 내용이 참고로서 본원에 혼입된, 2009년 11월 19일자 출원된 미국 가출원 제61/272,931호의 이익을 미국 특허법 제119(e)조 하에 주장한다.
당단백질은 하나 이상의 공유부착된 당 중합체를 갖는 단백질이다. N-결합 단백질 글리코실화는 진핵 유기체의 소포체(endoplasmic reticulum)에서 일어나는 필수적인 보존된 과정이다. N-결합된 단백질 글리코실화는 분비 단백질 및 막 단백질의 단백질 폴딩(folding), 올리고머화, 안정성, 질 조절, 분류 및 수송에 있어서 중요하다(문헌[Helenius, A., and Aebi, M. (2004). Roles of Ν-linked glycans in the endoplasmic reticulum. Annu. Rev. Biochem. 73, 1019-1049]).
단백질 글리코실화는 단백질의 면역원성, 안정성 및 반감기에 깊은 영향을 미친다. 또한, 글리코실화는 크로마토그래피, 예를 들면, 단백질의 글리코실화된 부분(moiety)과 상호작용하는 고체상(solid phase)에 결합된 렉틴 리간드를 사용한 친화성 크로마토그래피에 의한 단백질의 정제를 보조할 수 있다. 따라서, 생물학적으로 및 약학적으로 유용한 글리코실화 패턴을 생성하기 위해 많은 글리코실화된 단백질을 진핵세포에서 재조합적으로 제조하는 것이 확립된 관행이다.
국제 특허출원 공개 제WO 2003/07467호(애비(Aebi) 등)는 박테리아인 식품 유래의 병원성 캄필로박터 제주니(Campylobacter jejuni)가 그의 단백질을 N-글리코실화할 수 있다는 것을 입증하였는데, 이러한 N-글리코실화는 고세균(archaea)의 일부 종들을 제외하고 공지된 원핵 유기체들 사이의 독특한 특징이었다. 글리코실화를 위해 필요한 기구는 소위 pgl 좌위에 밀집되어 있는 12종의 유전자들에 의해 코딩된다. N-글리코실화의 파괴는 캄필로박터 제주니의 침습 및 병원성에 영향을 미치지만 대부분의 진핵 유기체들에서와 같이 치명적이지는 않다(문헌[Burda P. and M. Aebi, (1999). The dolichol pathway of N-linked glycosylation. Biochem Biophys Acta 1426(2):239-57]). 이. 콜라이(E. coli)에서 pgl 좌위 및 수용체 당단백질을 동시에 재조합적으로 발현시킴으로써 캄필로박터 제주니 단백질의 N-글리코실화를 재구성할 수 있다(문헌[Wacker et al. (2002). N-linked glycosylation in Campylobacter jejuni and its functional transfer into E. coli. Science 298, 1790-1793]).
N-글리칸은 단백질의 컨센서스 서열에 부착된 글리칸을 갖는다. 단백질의 공지된 N-글리코실화 컨센서스 서열은 원핵 유기체들에서 재조합 표적 단백질의 N-글리코실화를 허용한다. 이러한 유기체들은 글리칸을 단백질의 컨센서스 서열에 전달하는 효소인 올리고사카릴 트랜스퍼라제(oligosaccharyl transferase)("OT"; "OTase"), 예를 들면, 캄필로박터 제주니의 올리고사카릴 트랜스퍼라제를 포함한다.
국제 특허출원 공개 제WO 2003/07467호(애비 등)는 (i) 지질 담체 상에서의 올리고사카라이드의 조립을 위한 특정 글리코실트랜스퍼라제(glycosyltrasferase), (ii) 컨센서스 서열 "Ν-X-S/T"를 포함하는 재조합 표적 단백질(이때, X는 프롤린을 제외한 임의의 아미노산일 수 있음), 및 (iii) 올리고사카릴 트랜스퍼라제, 예를 들면, 상기 올리고사카라이드를 표적 단백질의 컨센서스 서열에 공유결합시키는 캄필로박터 제주니의 올리고사카릴 트랜스퍼라제를 코딩하는 핵산이 도입된 원핵 유기체를 교시한다. 원핵 유기체는 상기 특정 글리코실트랜스퍼라제의 종류에 의해 정의된 특정 구조를 갖는 N-글리칸을 생성한다.
국제 특허출원 공개 제WO 2006/119987호(애비 등)는 단백질뿐만 아니라, 원핵 유기체의 생체 내에서의 N-글리코실화에 대한 효율로 단백질을 제조하는 수단 및 방법을 기술한다. 추가로, 상기 국제 특허출원은 상기 단백질의 면역원성, 안정성, 생물학적, 예방적 및/또는 치료적 활성을 변경시키기 위해 N-글리칸을 재조합 단백질 내로 효율적으로 도입하는 것, 및 본 발명의 재조합 N-글리코실화된 단백질을 그의 표면 상에서 효율적으로 표시하는 숙주 세포를 제공하는 것을 기술한다. 또한, 상기 국제 특허출원은 하나 이상의 하기 N-글리코실화된 최적화된 아미노산 서열(들)을 포함하는 재조합 N-글리코실화된 단백질을 기술한다: D/E-X-N-Z-S/T(최적화된 컨센서스 서열). 상기 서열에서, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있고, 하나 이상의 상기 N-글리코실화된 부분적 아미노산 서열(들)이 도입된다. 단백질 내로의 특정 부분적 아미노산 서열(들)(최적화된 컨센서스 서열(들))의 도입은 이 도입된 위치들에서 올리고사카릴 트랜스퍼라제에 의해 효율적으로 N-글리코실화된 단백질을 발생시킨다.
상이한 폴리사카라이드들의 생합성은 박테리아 세포에서 보존되어 있다. 폴리사카라이드들은 정의된 특이성을 갖는 상이한 글리코실트랜스퍼라제들에 의해 세포질 막에서 공통된 전구체(활성화된 당 뉴클레오타이드)로부터 담체 지질 상에서 조립된다. 리포폴리사카라이드("LPS")는 그람 음성 박테리아에서만, 예를 들면, 쉬겔라(Shigella) 종, 슈도모나스(Pseudomonas) 종 및 이. 콜라이(ExPEC, EHEC)에서 제공된다.
LPS의 합성은 막의 세포질 면에서 모노사카라이드가 담체 지질 운데카프레닐 포스페이트("Und-P-P")에 부가되는 것으로 개시된다. 항원은 활성화된 당 뉴클레오타이드로부터의 모노사카라이드가 상이한 글리코실트랜스퍼라제들에 의해 순차적으로 부가됨으로써 구축되고, 지질-결합된 폴리사카라이드는 플립페이즈(flippase)에 의해 상기 막을 통과한다. 항원 반복 유닛(unit)은 효소 반응에 의해 중합된다. 그 다음, 폴리사카라이드는 표면으로 수송되는 LPS를 형성하는 라이게이즈(Ligase) WaaL에 의해 지질 A로 전달되는 반면, 캡슐형 폴리사카라이드는 중합 후 담체 지질로부터 방출되고 표면으로 수송된다. 이 폴리사카라이드들의 생합성 경로는 원형질 막공간(periplasm) 내의 상기 폴리사카라이드들을 단백질 담체에 포획하는 LPS 생접합체(bioconjugate)가 생체 내에서 생성될 수 있게 한다.
올리고사카라이드 또는 폴리사카라이드(즉, 당 잔기)와 단백질(즉, 단백질 담체)의 이러한 합성된 결합체는 다수의 박테리아 감염으로부터 보호하기 위한 접합체 백신으로서 사용될 수 있다. 접합체 백신은 박테리아 감염으로부터 보호하는 데에 성공적으로 사용되고 있다. 폴리사카라이드가 T-세포 독립적 면역원이기 때문에 항원성 폴리사카라이드와 단백질 담체의 접합은 보호성 기억 반응을 위해 필요하다. 폴리사카라이드는 폴리사카라이드 및 단백질 담체의 활성화 반응 기를 사용하는 상이한 화학적 방법들에 의해 단백질 담체에 접합된다.
접합체 백신은 박테리아 감염으로부터 보호하기 위해 소아에게 투여될 수 있고, 성인에게 오래 지속되는 면역 반응을 제공할 수 있다. 국제 특허출원 공개 제WO 2009/104074호(페르난데즈(Fernandez) 등)의 구축물(construct)은 동물에서 IgG 반응을 발생시키는 것이 발견되었다. 인간에서 쉬겔라 O-특이적 폴리사카라이드-단백질 접합체 백신에 대한 IgG 반응은 인간에서의 면역 보호와 상관관계를 갖는다는 것이 발견되었다(문헌[Passwell, J.H. et al., "Safety and Imrnunogenicity of Improved Shigella O-Specific Polysaccharide-Protein Conjugate Vaccines in Adults in Israel" Infection and Immunity, 69(3):1351-1357 (Mar. 2001)]). 폴리사카라이드(즉, 당 잔기)는 당 특이적인 단기 면역 반응을 유발한다고 생각된다. 실제로, 인간 면역 시스템은 박테리아의 특정 폴리사카라이드 표면 구조체, 예컨대, O-항원 및 캡슐형 폴리사카라이드에 대한 강한 반응을 발생시킨다. 그러나, 폴리사카라이드에 대한 면역 반응이 IgM 의존적이기 때문에, 상기 면역 시스템은 기억 반응을 발생시키지 못한다. 폴리사카라이드를 보유하는 단백질 담체는, T-세포 의존적이고 면역 시스템이 기억 반응을 발생시키기 때문에 오래 지속되는 보호를 제공하는 IgG 반응을 유발한다.
에스케리치아 콜라이(Escherichia coli; 이. 콜라이(E. coli)) O157은 최근의 모든 용혈-요독 증후군 케이스의 약 3분의 2의 원인인 장출혈 균주이고 심각한 인간 건강 문제를 발생시킨다(문헌[Law, D. (2000) J. App. Microbiol., 88, 729-745; Wang, L., and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551]).
에스케리치아 콜라이 균주 O157은 반복 테트라사카라이드 유닛(4-N-아세틸 퍼로스아민→푸코스→글루코스→GalNAc)(α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc)을 함유하는 O-항원을 생성한다(문헌[Perry, M. B., MacLean, L. and Griffith, D. W. (1986) Biochem. Cell. Biol., 64, 21-28]). 테트라사카라이드는 운데카프레닐 피로포스페이트 상에서 예비조립된다. 이. 콜라이 세포는 내부 원형질막; 스트레스 지탱 펩티도글리칸 층; 및 인지질 내부 단일층, 및 박테리아 LPS로 구성된 외부 단일층으로 구성된 비대칭 외부 막을 함유한다. LPS는 3개의 성분, 즉 지질 A 고착제(anchor), 3-데옥시-D-만노-옥트-2-울로손산 함유 코어 및 O-항원 영역을 함유한다(문헌[Raetz, C. R. H. and Whitfield, C. (2002) Annu. Rev. Biochem., 71, 635-700]; 문헌[Whitfield, C. (2006) Ann. Rev. Biochem. 75, 39-68]; 문헌[Samuel, G. and Reeves, P. R. (2003) Carbohydrate Research, 338, 2503-2519]; 및 박테리아 LPS의 O-항원의 조립에 대한 상기 문헌들 내의 평론 참조).
박테리아 LPS의 O-항원 성분은 3 내지 6개 당 유닛의 반복체를 10 내지 30개 함유하는, 단일 반복 모노사카라이드로 구성된 단독중합체 또는 이종중합체일 수 있는 매우 다양한 큰 폴리사카라이드이다(문헌[Reeves, P. R., Hobbs, M., Valvano, M. A., Skurnik, M., Whitfield, C, Coplin, D., Kido, N., Klena, J., Maskell, D., Raetz, C. R. H., and Rick, P. D. (1996) Trends Microbiol., 4, 495-503]). 따라서, O-항원은 박테리아 세포 표면의 주요 특징이고 병독성 및 병원성의 중요한 결정인자(determinant)를 구성한다(문헌[Law, D. (2000) J. App. Microbiol., 88, 729-745]; 문헌[Spears, K. J., Roe, A. J. and Gaily, D. L. (2006) FEMS Microbiol. Lett., 255, 187-202]; 문헌[Liu, B., Knirel, Y. A., Feng, L., Perepelov, A. V., Senchenkova, S. N., Wang, Q., Reeves, P. R. and Wang, L (2008) FEMS Microbiol. Rev. 32, 627-653]; 문헌[Stenutz, R., Weintraub, A. and Widmalm, G. (2006) FEMS Microbiol. Rev. 30, 382-403]). 독특한 O-항원 구조체에 기인하는 180종 초과의 개별 O-혈청형을 갖는 이. 콜라이 균주들이 동정되었다(문헌[Stenutz, R., Weintraub, A. and Widmalm, G. (2006) FEMS Microbiol. Rev. 30, 382-403]).
O-항원 반복 유닛은 운데카프레닐 피로포스페이트에 부착된 내부 막의 세포질 면 상에서 예비조립된다. 지질-결합된 반복 유닛은 내부 막의 원형질 막공간 표면으로 가로질러 분산되고(플립-플롭(flip-flop)) 외부 막으로의 수송 및 LPS와의 연결(ligation) 전에 중합된다. 대부분의 이종중합체성 O-항원 반복 유닛은 환원 말단에서 N-아세틸글루코스아민("GlcNAc") 또는 N-아세틸갈락토스아민("GalNAc")을 갖는다.
지질 중간체의 생합성은 WecA에 의해 촉진되는, 각각의 당 뉴클레오타이드 유도체로부터 운데카프레닐 모노포스페이트("Und-P")로의 GlcNAc-P 또는 GalNAc-P의 전달에 의해 개시된다고 추정된다(문헌[Samuel, G. and Reeves, P. R. (2003) Carbohydrate Research, 338, 2503-2519]; 문헌[Alexander, D. C. and Valvano, M. A. (1994) J. Bacteriol., 176, 7079-7084]; 문헌[Zhang, L., Radziejewska-Lebrecht, J., Krajewska-Pietrasik, D., Tolvanen, P. and Skurkik, M. (1997) Mol. Microbiol. 23, 63-76]; 문헌[Amor, P. A. and Whitfield, C. (1997) Mol. Microbiol. 26 (145-161)]; 문헌[Wang, L. and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551]). WecA의 GlcNAc-포스포트랜스퍼라제 활성의 성질 및 특이성이 특징 규명되었지만(문헌[Rush, J. S., Rick, P. D. and Waechter, C. J. (1997) Glycobiology, 7, 315-322]), WecA가 GalNAc-P-P-Und의 합성을 촉진한다는 결론은 유전적 연구에 의거한 것이었다(문헌[Wang, L. and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551]). 이러한 초기 유전적 연구는 지질-결합된 테트라사카라이드 중간체의 생합성이 WecA에 의해 촉진되는, UDP-GalNAc로부터 Und-P로의 GalNAc-P의 효소적 전달에 의해 개시된다는 것을 보여주었다(문헌[Wang, L. and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551]). 그러나, WecA가 GalNAc-P 공여체로서 UDP-GalNAc를 사용한다는 것을 입증하는 직접적인 효소학적 증거는 없었다.
나아가, 이. 콜라이 O55 gne 유전자 및 gne1 유전자가 UDP-GlcNAc 4-에피머라제(epimerase)를 코딩한다는 것은 이미 제안되었다(문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625]; 문헌[Guo, H., Yi, W., Li, L. and Wang, P.G. (2007) Biochem. Biophys. Res. Commun., 356, 604-609]). 종래 보고는 이. 콜라이 O55(문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625]) 및 이. 콜라이 O86(문헌[Guo, H., Yi, W., Li, L. and Wang, P.G. (2007) Biochem. Biophys. Res. Commun., 356, 604-609])으로부터 2종의 유전자, 즉 동일한 유전자 과(family) 내의 Z3206 유전자와 100% 동일한 이. 콜라이 O55 gne 및 이. 콜라이 O86 gne1 유전자를 각각 확인하였다.
따라서, 당업자는 Z3206 유전자가 UDP-GlcNAc/UDP-GalNAc 에피머라제도 코딩한다고 생각할 것이다.
놀랍게도, 본 발명자들은 이. 콜라이 O157의 Z3206 유전자에 의해 코딩된 에피머라제가 올리고사카라이드 또는 폴리사카라이드의 형성을 개시하는, 운데카프레닐 피로포스페이트 상의 N-아세틸갈락토스아민("GalNAc")을 합성하는 반응을 촉진한다는 것을 발견하였다.
한 양태에서, 본 발명은 운데카프레닐 피로포스페이트 상의 GalNAc를 합성하는 에피머라제를 포함하는, 폴리사카라이드의 전부 또는 일부를 생성하는 재조합 원핵 생합성 시스템에 관한 것이다. 또한, 본 발명은 환원 말단에서 GalNAc를 갖는 폴리사카라이드의 전부 또는 일부를 합성하는 글리코실트랜스퍼라제를 포함하고, 환원 말단에서 GalNAc를 갖는 항원성 폴리사카라이드의 전부 또는 일부를 합성하는 글리코실트랜스퍼라제를 추가로 포함한다.
또 다른 양태에서, 본 발명은 운데카프레닐 피로포스페이트 상의 GalNAc를 생성하는 에피머라제에 관한 것이고, 추가 양태에서, 상기 에피머라제는 Z3206 유전자에 의해 코딩된다.
추가 양태에서, 본 발명은 올리고사카릴 트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질 담체를 코딩하는 뉴클레오타이드 서열; 하나 이상의 박테리아로부터 유래된 하나 이상의 올리고사카라이드 또는 폴리사카라이드 유전자 클러스터(cluster)(이때, 상기 폴리사카라이드는 환원 말단에서 GalNAc를 함유함); 및 에피머라제를 코딩하는 핵산 서열을 포함하는, N-글리코실화된 단백질의 제조를 위한 발현 시스템에 관한 것이다.
추가 양태에서, 본 발명은 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 에피머라제를 코딩하는 Z3206 유전자를 포함하는 재조합 원핵 생합성 시스템에 관한 것이다.
추가 양태에서, 본 발명은 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 에피머라제를 코딩하는 이. 콜라이 O55 gne 유전자 또는 이. 콜라이 O86 gne1 유전자를 포함하는 재조합 원핵 생합성 시스템에 관한 것이다.
또 다른 양태에서, 본 발명은 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음), 및 환원 말단에서 N-아세틸갈락토스아민을 갖는 글리칸을 포함하는 N-글리코실화된 단백질에 관한 것이다.
또 다른 양태에서, 본 발명은 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 갖는 N-글리코실화된 단백질; 환원 말단에서 N-아세틸갈락토스아민을 갖는 면역원성 글리칸; 및 보강제(adjuvant)를 포함하는 생접합체 백신에 관한 것이다.
추가 양태에서, 본 발명은 환원 말단에서 GalNAc를 함유하는, 하나 이상의 박테리아로부터 유래된 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 조립하는 글리코실트랜스퍼라제; 단백질 담체; 올리고사카릴 트랜스퍼라제; 및 에피머라제를 코딩하는 핵산을 포함하는 숙주 세포에서 N-결합된 글리코실화된 단백질을 제조하는 방법에 관한 것이다.
추가 양태에서, 본 발명은 생접합체 백신을 제조하기 위한 생합성 시스템 및 단백질의 용도에 관한 것이다.
추가 양태에서, 본 발명은 모노사카라이드, 올리고사카라이드 및 폴리사카라이드의 제조 방법에 관한 것이고, 추가 양태에서, 본 발명은 항원성 글리칸 및 N-글리코실화된 단백질의 제조 방법에 관한 것이다.
도 1은 이. 콜라이 O157로부터 수득된 막 분획에 의한 [3H]GlcNAc/GalNAc-P-P-Und 합성의 시간 경과를 보여준다. 이. 콜라이 균주 O157로부터 수득된 막 분획을 37℃에서 표시된 시간 동안 UDP-[3H]GlcNAc와 함께 항온처리하였다. [3H]지질 생성물을 추출하고, [3H]GlcNAc-P-P-Und(○) 및 [3H]GalNAc-P-P-Und(●) 내로의 [3H]GlcNAc의 도입을 실시예 2에 기재된 바와 같이 분석하였다.
도 2는 GlcNAc-P-P-Und로부터 GalNAc-P-P-Und를 형성하는 제안된 생합성 경로를 보여준다.
도 3은 이. 콜라이 균주 O157로부터 수득된 막 분획에 의해 합성된 [3H]GalNAc-P-P-Und의 정제 및 특징 규명을 보여준다. 이. 콜라이 O157로부터 수득된 막 분획을 UDP-[3H]GlcNAc와 함께 항온처리하고, [3H]GalNAc 지질을 실시예 3에 기재된 바와 같이 정제하였다. 도 3a는 DEAE-셀룰로스 상에서의 정제 후 보레이트-함침된 실리카 겔 G(콴텀(Quantum) 1) 상에서의 [3H]HexNAc 지질의 분취 박층 크로마토그램을 보여준다. 도 3b는 패널 A에서 분취 플레이트로부터의 회수 후 보레이트-함침된 실라카 겔 G(베이커(Baker) Si250) 상에서의 정제된 [3H]GalNAc-P-P-Und의 박층 크로마토그래피를 보여준다. 도 3c는 도 3b에서 정제된 [3H]GalNAc-P-P-Und의 약산 가수분해 후 회수된 [3H]-아미노 당의 하강 종이 크로마토그램(보레이트-함침된 와트만(Whatman) 제1번 종이)을 보여준다. 도 3d는 도 3c의 [3H]-아미노 당을 NaBH4로 환원시켜 제조한 [3H]HexNAc-알디톨(alditol)의 하강 종이 크로마토그램(와트만 제3MM번)을 보여준다.
도 4는 이. 콜라이 21546 세포, 및 pMLBAD:Z3206으로 형질전환시킨 후 이. 콜라이 21546 세포의 대사적 표지(metabolic labeling)를 보여준다. 이. 콜라이 21546(도 4a) 및 이. 콜라이 21546:pMLBAD/Z3206(도 4b)을 37℃에서 [3H]GlcNAc로 5분 동안 대사적으로 표지하였다. [3H]GlcNAc/GalNAc-P-P-Und를 추출하고, 수용성 오염물질을 제거하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. 방사성 지질을 바이오스캔(Bioscan) 크로마토스캐너를 이용하여 검출하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 5는 이. 콜라이 균주로부터 수득된 막 분획을 UDP-[3H]GlcNAc와 함께 항온처리하여 형성한 [3H]GlcNAc/GalNAc-P-P-Und의 박층 크로마토그래피를 보여준다. 이. 콜라이 균주 K12(도 5a), O157(도 5b), 21546(도 5c) 및 21546:pMLBAD/Z3206(도 5d)으로부터 수득된 막 분획을 37℃에서 UDP-[3H]GlcNAc와 함께 10분 동안 항온처리하고, [3H]지질 생성물을 추출하고, 분배(partitioning)를 통해 수용성 오염물질을 제거하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 6은 UMP와의 항온처리에 의한 GlcNAc-P의 방출을 보여준다. 이. 콜라이 21546:Z3206으로부터 수득된 막 분획을 37℃에서 UDP-[3H]GlcNAc와 함께 10분 동안 예비항온처리하여 GlcNAc-P-P-Und를 효소적으로 표지한 후(도 6a), 1 mM UMP와의 제2 항온처리 기간이 1분(도 6b) 또는 2분(도 6c) 동안 포함되었다. 표시된 항온처리 기간 후, [3H]GlcNAc/GalNAc-P-P-Und를 추출하고 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 7은 Z3206을 발현하는 균주 21546으로부터 수득된 막 분획에 의해 촉진되는, 관련된 [3H]HexNAc-P-P-Und 생성물로의 외인성 [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und의 전환을 보여준다. 이. 콜라이 균주 21546(도 7b 및 7e) 및 21546:pMLBAD/Z3206(도 7c 및 도 7f)으로부터 수득된 막 분획들을 37℃에서 정제된 [3H]GlcNAc-P-P-Und(도 7a, 도 7b 및 도 7c) 또는 [3H]GalNAc-P-P-Und(도 7d, 도 7e 및 도 7f에서의 패널)(1% 트리톤 X-100에서 초음파에 의해 분산됨)와 함께 1분 동안 항온처리하였다. [3H]GlcNAc/GalNAc-P-P-Und를 추출하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 용해하고, 바이오스캔 AR2000 라디오크로마토스캐너(radiochromatoscanner)를 이용하여 검출하였다.
도 8은 비글리코실화된 AcrA 단백질 및 글리코실화된 AcrA 단백질의 SDS-PAGE 분석을 보여준다. AcrA 발현 플라스미드, 및 pMLBAD:Z3206(레인 1), pMLBAD:gne(레인 2) 또는 대조군 벡터 pMLBAD(레인 3)에 의해 보완된(complemented) pgl 오페론 Δ gne를 보유하는 이. 콜라이 DH5α 세포로부터 제조된 원형질 막공간 추출물을 10% SDS-PAGE로 분리하고 니트로셀룰로스 막으로 옮겼다. AcrA 및 이의 글리코실화된 형태를 항-AcrA 항혈청으로 검출하였다. 비글리코실화된 AcrA(AcrA) 및 글리코실화된 AcrA(gAcrA)에 상응하는 밴드의 위치가 표시되어 있다.
도 9는 문헌[Liu B et al., Structure and genetics of Shigella O antigens FEMS Microbiology Review, 2008. 32: p. 27]에 의해 확인된 유전자들을 보여준다.
도 10은 쉬겔라 플렉스네리(Shigella flexneri) 6 O-항원을 합성하는 데 필요한 유전자들을 함유하는 DNA 영역을 보여주는 도면이다.
도 11은 이. 콜라이에서 쉬겔라 플렉스네리 6 O-항원의 발현을 보여준다. LPS는 은 염색에 의해 가시화되었거나, 또한 니트로셀룰로스 막으로의 전달 및 쉬겔라 플렉스네리 6에 대한 항체에 의한 검출에 의해 가시화되었다.
도 12는 O-항원의 HPLC를 보여준다. 쉬겔라 플렉스네리 - Z3206을 함유하는 이. 콜라이 세포(SCM3), 쉬겔라 플렉스네리 + Z3206을 함유하는 이. 콜라이 세포(SCM3) 또는 빈 이. 콜라이 세포(SCM3)의 LLO 분석을 보여준다.
도 13은 EPA, pglB 및 쉬겔라 플렉스네리 6 O-항원 +/- Z3206을 발현하는 이. 콜라이 세포로부터 수득된 니켈 정제된 단백질의 웨스턴 블롯을 보여준다.
도 2는 GlcNAc-P-P-Und로부터 GalNAc-P-P-Und를 형성하는 제안된 생합성 경로를 보여준다.
도 3은 이. 콜라이 균주 O157로부터 수득된 막 분획에 의해 합성된 [3H]GalNAc-P-P-Und의 정제 및 특징 규명을 보여준다. 이. 콜라이 O157로부터 수득된 막 분획을 UDP-[3H]GlcNAc와 함께 항온처리하고, [3H]GalNAc 지질을 실시예 3에 기재된 바와 같이 정제하였다. 도 3a는 DEAE-셀룰로스 상에서의 정제 후 보레이트-함침된 실리카 겔 G(콴텀(Quantum) 1) 상에서의 [3H]HexNAc 지질의 분취 박층 크로마토그램을 보여준다. 도 3b는 패널 A에서 분취 플레이트로부터의 회수 후 보레이트-함침된 실라카 겔 G(베이커(Baker) Si250) 상에서의 정제된 [3H]GalNAc-P-P-Und의 박층 크로마토그래피를 보여준다. 도 3c는 도 3b에서 정제된 [3H]GalNAc-P-P-Und의 약산 가수분해 후 회수된 [3H]-아미노 당의 하강 종이 크로마토그램(보레이트-함침된 와트만(Whatman) 제1번 종이)을 보여준다. 도 3d는 도 3c의 [3H]-아미노 당을 NaBH4로 환원시켜 제조한 [3H]HexNAc-알디톨(alditol)의 하강 종이 크로마토그램(와트만 제3MM번)을 보여준다.
도 4는 이. 콜라이 21546 세포, 및 pMLBAD:Z3206으로 형질전환시킨 후 이. 콜라이 21546 세포의 대사적 표지(metabolic labeling)를 보여준다. 이. 콜라이 21546(도 4a) 및 이. 콜라이 21546:pMLBAD/Z3206(도 4b)을 37℃에서 [3H]GlcNAc로 5분 동안 대사적으로 표지하였다. [3H]GlcNAc/GalNAc-P-P-Und를 추출하고, 수용성 오염물질을 제거하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. 방사성 지질을 바이오스캔(Bioscan) 크로마토스캐너를 이용하여 검출하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 5는 이. 콜라이 균주로부터 수득된 막 분획을 UDP-[3H]GlcNAc와 함께 항온처리하여 형성한 [3H]GlcNAc/GalNAc-P-P-Und의 박층 크로마토그래피를 보여준다. 이. 콜라이 균주 K12(도 5a), O157(도 5b), 21546(도 5c) 및 21546:pMLBAD/Z3206(도 5d)으로부터 수득된 막 분획을 37℃에서 UDP-[3H]GlcNAc와 함께 10분 동안 항온처리하고, [3H]지질 생성물을 추출하고, 분배(partitioning)를 통해 수용성 오염물질을 제거하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 6은 UMP와의 항온처리에 의한 GlcNAc-P의 방출을 보여준다. 이. 콜라이 21546:Z3206으로부터 수득된 막 분획을 37℃에서 UDP-[3H]GlcNAc와 함께 10분 동안 예비항온처리하여 GlcNAc-P-P-Und를 효소적으로 표지한 후(도 6a), 1 mM UMP와의 제2 항온처리 기간이 1분(도 6b) 또는 2분(도 6c) 동안 포함되었다. 표시된 항온처리 기간 후, [3H]GlcNAc/GalNAc-P-P-Und를 추출하고 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 분리하였다. GalNAc-P-P-Und 및 GlcNAc-P-P-Und의 크로마토그래피 위치는 화살표로 표시되어 있다.
도 7은 Z3206을 발현하는 균주 21546으로부터 수득된 막 분획에 의해 촉진되는, 관련된 [3H]HexNAc-P-P-Und 생성물로의 외인성 [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und의 전환을 보여준다. 이. 콜라이 균주 21546(도 7b 및 7e) 및 21546:pMLBAD/Z3206(도 7c 및 도 7f)으로부터 수득된 막 분획들을 37℃에서 정제된 [3H]GlcNAc-P-P-Und(도 7a, 도 7b 및 도 7c) 또는 [3H]GalNAc-P-P-Und(도 7d, 도 7e 및 도 7f에서의 패널)(1% 트리톤 X-100에서 초음파에 의해 분산됨)와 함께 1분 동안 항온처리하였다. [3H]GlcNAc/GalNAc-P-P-Und를 추출하고, 실시예 3에 기재된 바와 같이 보레이트-함침된 실리카 겔 플레이트(베이커 Si250) 상에서의 박층 크로마토그래피로 용해하고, 바이오스캔 AR2000 라디오크로마토스캐너(radiochromatoscanner)를 이용하여 검출하였다.
도 8은 비글리코실화된 AcrA 단백질 및 글리코실화된 AcrA 단백질의 SDS-PAGE 분석을 보여준다. AcrA 발현 플라스미드, 및 pMLBAD:Z3206(레인 1), pMLBAD:gne(레인 2) 또는 대조군 벡터 pMLBAD(레인 3)에 의해 보완된(complemented) pgl 오페론 Δ gne를 보유하는 이. 콜라이 DH5α 세포로부터 제조된 원형질 막공간 추출물을 10% SDS-PAGE로 분리하고 니트로셀룰로스 막으로 옮겼다. AcrA 및 이의 글리코실화된 형태를 항-AcrA 항혈청으로 검출하였다. 비글리코실화된 AcrA(AcrA) 및 글리코실화된 AcrA(gAcrA)에 상응하는 밴드의 위치가 표시되어 있다.
도 9는 문헌[Liu B et al., Structure and genetics of Shigella O antigens FEMS Microbiology Review, 2008. 32: p. 27]에 의해 확인된 유전자들을 보여준다.
도 10은 쉬겔라 플렉스네리(Shigella flexneri) 6 O-항원을 합성하는 데 필요한 유전자들을 함유하는 DNA 영역을 보여주는 도면이다.
도 11은 이. 콜라이에서 쉬겔라 플렉스네리 6 O-항원의 발현을 보여준다. LPS는 은 염색에 의해 가시화되었거나, 또한 니트로셀룰로스 막으로의 전달 및 쉬겔라 플렉스네리 6에 대한 항체에 의한 검출에 의해 가시화되었다.
도 12는 O-항원의 HPLC를 보여준다. 쉬겔라 플렉스네리 - Z3206을 함유하는 이. 콜라이 세포(SCM3), 쉬겔라 플렉스네리 + Z3206을 함유하는 이. 콜라이 세포(SCM3) 또는 빈 이. 콜라이 세포(SCM3)의 LLO 분석을 보여준다.
도 13은 EPA, pglB 및 쉬겔라 플렉스네리 6 O-항원 +/- Z3206을 발현하는 이. 콜라이 세포로부터 수득된 니켈 정제된 단백질의 웨스턴 블롯을 보여준다.
본 발명은 환원 말단에서 N-아세틸갈락토스아민을 갖는 올리고사카라이드 또는 폴리사카라이드를 합성하는 에피머라제를 코딩하는 핵산, 및 글리칸의 환원 말단에서 N-아세틸갈락토스아민을 갖는 N-글리코실화된 단백질을 코딩하는 핵산을 포함하는 재조합 원핵 생합성 시스템을 포함한다.
용어 "부분적 아미노산 서열(들)"은 "최적화된 컨센서스 서열(들)" 또는 "컨센서스 서열(들)"로도 지칭된다. 최적화된 컨센서스 서열은 통상의 컨센서스 서열 "Ν-X-S/T"보다 훨씬 더 효율적으로 올리고사카릴 트랜스퍼라제("OST," "OTase")에 의해 N-글리코실화된다.
일반적으로, 용어 "재조합 N-글리코실화된 단백질"은 상기 단백질을 코딩하는 핵산을 천연적으로 포함하지 않는 숙주 세포에서 생성된 임의의 폴리펩타이드 또는 올리고펩타이드를 의미한다. 본 발명의 내용에서, 이 용어는 원핵 숙주 세포, 예를 들면, 에스케리치아 종, 캄필로박터 종, 살모넬라(Salmonella) 종, 쉬겔라 종, 헬리코박터(Helicobacter) 종, 슈도모나스 종, 바실러스(Bacillus) 종, 및 추가 실시양태에서 에스케리치아 콜라이, 캄필로박터 제주니, 살모넬라 티피뮤리움(Salmonella typhimurium) 등에서 재조합적으로 생성된 단백질을 의미하는 것으로서, 이때 상기 단백질을 코딩하는 핵산은 상기 숙주 세포 내로 도입되었고, 코딩된 단백질은 천연적으로 발생되었거나 상기 숙주 세포 내로 재조합적으로 도입된 트랜스퍼라제 효소인 OTase에 의해 N-글리코실화된다.
아미노산에 대한 국제적으로 승인된 1문자 코드에 따라, 약어 D, E, Ν, S 및 T는 각각 아스파르트산, 글루탐산, 아스파라긴, 세린 및 트레오닌을 표시한다.
본 발명에 따른 단백질은 단백질 내로 도입되고 N-글리코실화된 하나 이상의 최적화된 컨센서스 서열(들) D/E-X-N-Z-S/T를 포함한다. 따라서, 본 발명의 단백질은 최적화된 컨센서스 서열을 함유하되 임의의 추가의(도입된) 최적화된 컨센서스 서열을 포함하지 않는 천연적으로 발생하는 캄필로박터 제주지 N-당단백질과 상이하다.
최적화된 컨센서스 서열의 도입은 하나 이상의 아미노산의 부가, 결실 및/또는 치환에 의해 달성될 수 있다. 최적화된 컨센서스 서열을 도입하기 위한 하나 이상의 아미노산의 부가, 결실 및/또는 치환은 본 발명에 비추어 볼 때 당업자에게 잘 공지되어 있을 화학적 합성 방법, 예컨대, 고체상 보조 화학적 펩타이드 합성에 의해 달성될 수 있다. 대안적으로, 보다 큰 폴리펩타이드의 경우 바람직하게는, 본 발명의 단백질은 본 발명에 비추어 볼 때 당업계의 표준 기법일 수 있는 재조합 기법에 의해 제조될 수 있다.
본 발명의 단백질은 임의의 숙주에서 고효율로 제조될 수 있다는 이점을 갖는다. 본 발명의 한 실시양태에서, 상기 숙주는 캄필로박터 종, 예를 들면, 캄필로박터 제주니로부터 유래된 기능적 pgl 오페론을 포함한다. 추가 실시양태에서, 본 발명의 실시를 위한 캄필로박터 종으로부터 유래된 올리고사카릴 트랜스퍼라제는 캄필로박터 콜라이(Campylobacter coli) 또는 캄필로박터 라리(Campylobacter lari)로부터 유래된다. 본 발명에 비추어 볼 때, 올리고사카릴 트랜스퍼라제는 당업자에게 자명할 것이다. 예를 들면, 올리고사카릴 트랜스퍼라제는 참고문헌, 예컨대, 문헌[Szymanski, C.M. and Wren, B.W. (2005) Protein glycosylation in bacterial mucosal pathogens, Nat. Rev. Microbiol. 3:225-237]에 개시되어 있다. 기능적 pgl 오페론은 상기 원핵 숙주가 캄필로박터 종, 또는 예를 들면, 캄필로박털 제주니인 경우 천연적으로 존재할 수 있다. 그러나, 당업계에서 이미 입증된 바와 같이 그리고 상기에서 언급된 바와 같이, pgl 오페론은 세포 내로 전달될 수 있고 상기 새로운 세포 환경에서 기능성을 유지할 수 있다.
용어 "캄필로박터 종, 바람직하게는 캄필로박터 제주니로부터 유래된 기능적 pgl 오페론"은 캄필로박터 종, 예를 들면, 캄필로박터 제주니의 기능적 올리고사카릴 트랜스퍼라제(OTase)를 코딩하는 핵산, 및 지질 담체 상에서 올리고사카라이드를 조립할 수 있는 하나 이상의 특정 글리코실트랜스퍼라제를 코딩하는 핵산으로 구성된 클러스터를 의미하고, 이때 상기 올리고사카라이드는 OTase에 의해 상기 지질 담체로부터 하나 이상의 최적화된 아미노산 서열(들) D/E-X-N-Z-S/T를 갖는 표적 단백질로 전달될 수 있다. 본 발명의 내용에서 용어 "캄필로박터 종, 바람직하게는 캄필로박터 제주니로부터 유래된 기능적 pgl 오페론"은 단일 전사 유닛으로서의 오페론을 의미하는 것이 아님을 이해해야 한다. 용어는 단지 하나의 숙주 세포에서 재조합 단백질의 N-글리코실화를 위한 기능적 성분들의 존재를 필요로 한다. 이 성분들은 하나 이상의 분리된 mRNA로서 전사될 수 있고 함께 또는 따로 조절될 수 있다. 예를 들면, 상기 용어는 하나의 숙주 세포 내의 게놈 DNA 및 플라스미드(들)에 위치하는 기능적 성분들도 포함한다. 효율성을 위해, 한 실시양태에서, 기능적 pgl 오페론의 모든 성분들은 동시에 조절되고 발현된다.
올리고사카릴 트랜스퍼라제는 일부 실시양태에서 캄필로박터 종으로부터 유래될 수 있고, 다른 실시양태에서 캄필로박터 제주니로부터 유래될 수 있다. 추가 실시양태에서, 올리고사카릴 트랜스퍼라제는 올리고사카릴 트랜스퍼라제를 갖는 것으로서 당업자에게 공지되어 있는 다른 유기체, 예를 들면, 올리넬라(Wolinella) 종, 및 진핵 유기체로부터 유래될 수 있다.
지질 담체 상에서 올리고사카라이드를 조립할 수 있는 하나 이상의 특정 글리코실트랜스퍼라제는 숙주 세포로부터 유래될 수 있거나 또는 상기 숙주 세포 내로 재조합적으로 도입될 수 있으나, 유일한 기능적 한계는 상기 글리코실트랜스퍼라제에 의해 조립된 올리고사카라이드가 OTase에 의해 지질 담체로부터 하나 이상의 최적화된 컨센서스 서열을 갖는 표적 단백질로 전달될 수 있다는 것이다. 따라서, 특정 글리코실트랜스퍼라제를 천연적으로 포함하는 숙주 세포의 선별 및/또는 상기 숙주에 천연적으로 존재하는 특정 글리코실트랜스퍼라제의 치환뿐만 아니라 이종 특정 글리코실트랜스퍼라제의 도입은 당업자가 본 발명의 단백질의 최적화된 N-글리코실화 컨센서스 부위에 결합된 N-글리칸을 변경할 수 있게 할 것이다.
결과로서, 본 발명은 본 발명의 단백질 상의 N-글리칸 패턴의 개별 디자인을 제공한다. 따라서, 상기 단백질은 생물학적 요건, 약학적 요건 및 정제 요건을 충족시키도록 그들의 N-글리칸 패턴에서 개별화될 수 있다.
본 발명의 실시양태에서, 상기 단백질은 하나 이상, 예컨대, 2개 이상, 3개 이상 또는 5개 이상의 상기 N-글리코실화된 최적화된 아미노산 서열을 포함할 수 있다.
본 발명의 단백질에서 하나 이상의 N-글리코실화된 최적화된 아미노산 서열(들)의 존재는 그들의 면역원성의 증가, 그들의 안정성의 증가, 그들의 생물학적 활성에 대한 영향, 그들의 생물학적 반감기의 연장 및/또는 그들의 정제의 단순화에 유리할 수 있다.
최적화된 컨센서스 서열은 위치(들) X 및 Z에서 프롤린을 제외한 임의의 아미노산을 포함할 수 있다. 용어 "임의의 아미노산"은 일반 천연 아미노산 및 희귀 천연 아미노산뿐만 아니라 상기 최적화된 컨센서스 서열이 OTase에 의해 N-글리코실화되게 할 수 있는 합성 아미노산 유도체 및 유사체도 포괄한다. 천연적으로 발생하는 일반 아미노산 및 희귀 아미노산이 X 및 Z를 위해 바람직하다. X 및 Z는 동일하거나 상이할 수 있다.
X 및 Z가 본 발명에 따른 단백질에서 각각의 최적화된 컨센서스 서열에 대해 상이할 수 있다는 것이 주목된다.
최적화된 컨센서스 서열에 결합된 N-글리칸은 OTase에 의한 전달을 위해 지질 담체 상에서 올리고사카라이드를 조립할 때 특정 글리코실트랜스퍼라제 및 이들의 상호작용에 의해 결정될 것이다. 본 발명에 비추어 볼 때, 당업자는 원하는 숙주 세포에 존재하는 특정 글리코실트랜스퍼라제의 종류(들) 및 양을 변경함으로써 N-글리칸을 다자인할 수 있다.
본원에서 사용된 바와 같이, "모노사카라이드"는 하나의 당 잔기를 의미한다. "올리고사카라이드 및 폴리사카라이드"는 2개 이상의 당 잔기를 의미한다. 본원에서 사용된 바와 같이, 용어 "글리칸"은 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드를 의미한다. 본원에서 "N-글리칸"은 N-글리코사이드 결합을 통해 단백질 내의 아스파라긴 잔기의 ε-아마이드 질소에 결합되어 있는, 변경가능한 조성의 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드로서 정의된다. 한 실시양태에서, OTase에 의해 전달되는 N-글리칸은 그람 음성 또는 양성 박테리아의 세포질 막에 존재하는 운데카프레놀 피로포스페이트("Und-P-P") 지질-고착제 상에서 조립된다. N-글리칸은 O-항원, O-폴리사카라이드 및 펩타이도글리칸의 합성에 관여한다(문헌[Bugg, T. D., and Brandish, P. E. (1994). From peptidoglycan to glycoproteins: common features of lipid-linked oligosaccharide biosynthesis. FEMS Microbiol Lett 119, 255-262]; 문헌[Valvano, M. A. (2003). Export of O-specific lipopolysaccharide. Front Biosci 8, s452-471]).
지질-결합된 반복 테트라사카라이드(4-N-아세틸 퍼로스아민→푸코스→글루코스→GalNAc)의 생합성이 WecA에 의한 GalNAc-P-P-Und의 형성에 의해 개시되는지를 확인하기 위한 연구를 수행하였다. 이. 콜라이 균주 K12, O157 및 PR4019(WecA 과발현 균주)로부터 수득된 막 분획을 UDP-[3H]GalNAc와 함께 항온처리하였을 때, [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und의 효소적 합성이 검출되지 않았다. 그러나, 균주 O157로부터 수득된 막 분획을 UDP-[3H]GlcNAc와 함께 항온처리하였을 때, [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und의 화학적 성질 및 크로마토그래피 성질을 갖는 2종의 효소적으로 표지된 생성물이 관찰되었는데, 이것은 균주 O157이 GlcNAc-P-P-Und와 GalNAc-P-P-Und를 상호전환시킬 수 있는 에피머라제를 함유한다는 것을 확인시켜주었다. 또한, 에피머라제의 존재는 외인성 [3H]GlcNAc-P-P-Und가 균주 O157로부터 수득된 막과 함께 항온처리되었을 때 [3H]GalNAc-P-P-Und로 전환되었다는 것을 보여줌으로써 확인되었다. 균주 O157을 [3H]GlcNAc로 대사적으로 표지하였을 때, [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und 둘 다 검출되었다. Z3206 유전자를 사용한 이. 콜라이 균주 21546의 형질전환은 이 세포들이 생체 내 및 시험관 내에서 GalNAc-P-P-Und를 합성할 수 있게 하였다. 에피머라제 반응의 가역성은 균주 O157로부터 수득된 막을 외인성 [3H]GalNAc-P-P-Und와 함께 항온처리하였을 때 [3H]GlcNAc-P-P-Und가 재형성되었다는 것을 보여줌으로써 입증되었다. Z3206이 이. 콜라이 내의 캄필로박터 제주니 N-글리코실화 시스템의 발현에서 gne 유전자의 상실을 보완하지 못한다는 것은 Z3206이 UDP-GlcNAc/UDP-GalNAc 에피머라제로서 작용하지 않는다는 것을 암시하였다. 이 결과들에 근거할 때, GalNAc-P-P-Und가 이. 콜라이 O157에서 WecA에 의한 GlcNAc-P-P-Und의 형성 후 GlcNAc-P-P-Und 에피머라제에 의해 가역적으로 합성된다는 것이 확인되었다.
GalNAc-P-P-Und 합성이 WecA에 의해서가 아니라 종래 공지되지 않은 일부의 기작에 의해 촉진된다는 것을 확인하기 위해 이. 콜라이 O157 O-항원 서브유닛 조립의 개시 반응을 연구하였다. 본원에 제시된 증거는 GalNAc-P-P-Und가 WecA에 의해 촉진되는 UDP-GalNAc로부터의 GalNAc-P의 전달에 의해 합성되는 것이 아니라 이. 콜라이 O157 내의 Z3206 유전자에 의해 코딩된 에피머라제에 의해 촉진되는 GlcNAc-P-P-Und의 4-OH의 가역적 에피머화에 의해 합성된다는 것을 보여준다.
따라서, 본 발명은 중요한 박테리아 세포 표면 성분의 조립을 위한 신규 생합성 경로뿐만 아니라 GalNAc-P-P-Und의 합성을 위한 신규 생합성 경로를 포괄한다. 본 발명의 추가 실시양태는 항미생물제를 위한 신규 표적으로서의 박테리아 에피머라제를 포함한다.
이. 콜라이 O157은 반복 테트라사카라이드 구조(4-N-아세틸 퍼로스아민→푸코스→글루코스→GalNAc)를 갖는 O-항원을 합성한다. 종래 유전적 연구(문헌[Wang, L. and Reeves, P. R. (1998) Infect. Immun. 66, 3545-3551])와 대조적으로, 본원은 지질-결합된 테트라사카라이드 중간체의 생합성이 WecA에 의해 촉진되는, UDP-GalNAc로부터 Und-P로의 GalNAc-P의 효소적 전달에 의해 개시되지 않는다는 것을 보여준다. 상동성 검색에 의해 수득된 후 유전적, 효소학적 및 대사적 표지 실험의 결과에 의해 확인된, 본원에 기재된 본 발명은 WecA가 기질로서 UDP-GalNAc를 사용하지 않고, WecA가 균주 O157 내의 Z3206 유전자에 의해 코딩된 에피머라제에 의해 GalNAc-P-P-Und로 가역적으로 전환되는 GlcNAc-P-P-Und를 합성하는 데 필요하다는 것을 입증한다.
본 발명의 Z3206 유전자는 환원 말단에서 GalNAc 잔기를 함유하는 표면 O-항원 반복 유닛을 생성하는 여러 균주들에 존재하는 유전자 과에 속한다(표 1). Z3206 유전자 서열은 서열번호 1에 나타나 있다. 종래 보고는 이. 콜라이 O55 (문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625]) 및 이. 콜라이 O86(문헌[Guo, H., Yi, W., Li, L. and Wang, P. G. (2007) Biochem. Biophys. Res. Comm., 356, 604-609])으로부터 2종의 유전자, 즉 Z3206 유전자와 100% 동일한 이. 콜라이 O55 gne 및 이. 콜라이 O86 gne1을 각각 확인하였다(표 1). 이. 콜라이 O55 gne 유전자 서열은 서열번호 3에 나타나 있고, 이. 콜라이 O86 gne1 유전자 서열은 서열번호 5에 나타나 있다.
Z3206과의 % 동일성 | O-항원 반복 유닛의 환원 말단에서 GalNAc | |
이. 콜라이 O55 gne(서열번호 3) | 100 | 존재 |
이. 콜라이 O86 gne1(서열번호 5) | 100 | 존재 |
쉬겔라 보이디이(Shigella boydii) O18 gne(서열번호 7) | 88 | 존재 |
살모넬라 엔테리카(Salmonella enterica) O30 gne(서열번호 9) | 94 | 존재 |
캄필로박터 제주니 gne(서열번호 11) | 21 | 부재 |
이. 콜라이 K12 galE(서열번호 13) | 27 | 부재 |
이. 콜라이 O86 gne2(서열번호 15) | 18 | 존재 |
따라서, 본 발명자들은 이. 콜라이 O55 gne 및 이. 콜라이 O86 gne1도 환원 말단에서 GalNAc를 갖는 O-항원 반복 유닛을 생성하는 균주 O55 및 O86에서 각각 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시킬 수 있는 에피머라제를 코딩한다는 결론을 내렸다(표 1).
이 연구에서 2종의 실험적 방법은 Z3206 단백질이 균주 O157에서 UDP-GalNAc로의 UDP-GlcNAc의 에피머화를 촉진하지 않는다는 것을 보여준다. 먼저, 균주 O157로부터 수득된 막을 [3H]UDP-GalNAc와 함께 항온처리하였을 때, [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und 둘 다 검출되지 않았다(표 3). Z3206이 [3H]UDP-GlcNAc로의 [3H]UDP-GalNAc의 전환을 촉진하는 경우, [3H]GlcNAc-P-P-Und가 관찰될 것으로 예측되었다. 둘째, 본 발명자들은 헤마글루티닌 태그로 표지된(hemagglutinin-tagged) Z3206이 UDP-GalNAc 의존적 캄필로박터 제주니 N-글리코실화 레포터(rerporter) 시스템을 보완할 수 없다는 것을 보여준다(도 8).
또한, 조질 추출물을 UDP-GalNAc와 함께 항온처리하고, 산 가수분해 후 p-다이메틸아미노벤즈알데하이드와의 반응성의 증가를 측정하여 UDP-GlcNAc로의 전환을 간접적으로 분석함으로써, 에피머라제 활성에 대하여 균주 O55로부터 유래된 이. 콜라이 O55 gne 유전자(문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625])를 분석하였다. 두 연구에서, 생성물의 형성은 당 뉴클레오타이드 최종 생성물의 명확한 특징 규명에 근거한 것이 아니라, p-다이메틸아미노벤즈알데하이드와의 반응성의 변화에 근거하였다. 90% 순수한 폴리히스티딘 태그로 표지된 이. 콜라이 O86 gne1이 커플링된 분석에서 Gne2에 비해 상대적으로 낮은 수준의 UDP-글루코스 에피머라제 활성을 갖는다는 것도 밝혀졌다.
따라서, 본 발명의 한 실시양태는 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 Z3206 유전자, 이. 콜라이 O55 gne 유전자 또는 이. 콜라이 O86 gne1 유전자를 함유하는 재조합 원핵 생합성 시스템에 관한 것이다.
2개의 GalNAc 잔기를 함유하는 O-항원을 합성하는 이. 콜라이 O86(아마도 추가의 비환원 말단 GalNAc에 대한 글리코실 공여체로서 UDP-GalNAc를 필요로 할 것임)도 O-항원 유전자 클러스터 내에 gne2로 지칭되는 추가의 GlcNAc 4-에피머라제 유전자를 보유한다는 것은 의미 있다(문헌[Guo, H., Yi, W., Li, L. and Wang, P. G. (2007) Biochem. Biophys. Res. Commun., 356, 604-609]). 이 추가의 에피머라제 유전자는 콜란산(colanic acid) 유전자 클러스터의 galE 유전자에 대한 높은 상동성을 갖고 UDP-GalNAc를 합성할 수 있는 UDP-GlcNAc 4-에피머라제인 듯하다.
Z3206 유전자는 GalNAc로 개시되는 이. 콜라이 O-혈청형에서 고도로 보존되어 있는 듯하다. 최근 연구에서, 확립된 O-항원 반복 유닛 구조를 갖는 62종의 이. 콜라이 균주들을 이. 콜라이 O157 Z3206 유전자를 특이적으로 검출하도록 디자인된 뉴클레오타이드 프라이머를 사용하는 중합효소 연쇄 반응 기초 방법을 이용하여, Z3206의 발현에 대해 스크리닝하였다(문헌[Wang, L., Huskic, S., Cisterne, A., Rothemund, D. and Reeves, P.R. (2002) J. Bacteriol. 184, 2620-2625]). 이 연구에서, Z3206은 GalNAc를 함유하는 것으로 공지되어 있는 22종의 이. 콜라이 균주들 중 16종의 균주들, 및 GalNAc를 결여하는 40종의 균주들 중 단지 4종의 균주들에서 검출되었다. 뿐만 아니라, UDP-GlcNAc 4-에피머라제 활성을 갖는 대안적 에피머라제(이. 콜라이 O113의 GalE 유전자)를 검출하도록 디자인된 프라이머를 사용한 22종의 GalNAc 함유 균주들의 유사한 스크리닝은 이 유전자를 보유하는 균주를 전혀 검출하지 못하였는데, 이것은 Z3206이 이. 콜라이의 O-항원 반복 유닛에서의 환원 말단 GalNAc의 존재와 가장 일반적으로 관련되어 있는 GlcNAc 4-에피머라제 유전자라는 것을 보여준다.
다양한 웹 기초 위상 예측 알고리즘에 의한 Z3206 단백질 서열의 분석은 Z3206 단백질이 높은 소수성을 나타내지 않는다는 것을 보여준다. TMPred(문헌[Hofmann, K., and Stoffel, W. (1993) Biol. Chem. Hoppe-Seyler 374, 166 (abstr.)])가 단일 약한 N-말단 경막 나선을 예측하였지만, 대다수의 위상 예측 알고리즘들은 Z3206이 가용성 37 kDa 단백질임을 보여준다. 그러나, 헤마글루티닌 태그로 표지된 Z3206을 발현하는 이. 콜라이 세포로부터 수득된 세포 분획의 SDS-PAGE 후 웨스턴 블롯팅은 상기 태그로 표지된 단백질이 상기 세포의 저장성(hypotonic) 용해 후 미립자 분획과 회합되어 있다는 것을 보여준다. 예비 실험은 상기 단백질이 막 분획을 1 M KCl과 함께 항온처리한 후 미립자 분획과 회합된 상태로 남아 있으나, 0.1% 트리톤(Triton) X-100과의 항온처리에 의해 활성 형태로 가용화된다는 것을 보여준다.
이. 콜라이 O157 Z3206은 양성자 추출 및 공여에 관여하는 NAD(P) 결합 포켓(문헌[Allard, S. T. M., Giraud, M. F., and Naismith, J. H. (2001) Cell. Mol. Life Sci. 58, 1650-1655]) 및 보존된 SX 24YX 3K 서열과 일치하는 GXXGXXG 모티프(로스만 폴드(Rossman fold))를 포함하는 옥시도-리덕타제(oxido-reductase)의 단쇄 데하이드로게나제(dehydrogenase)/리덕타제 과에 대한 상당한 서열 상동성을 나타낸다(문헌[Field, R. A. and Naismith, J. H. (2003) Biochemistry 42, 7637-7647]). 단쇄 데하이드로게나제/리덕타제 과의 또 다른 구성원인 UDP-Glc 4-에피머라제의 결정 구조에 근거한 분자 모델링은 하이드라이드 추출 후 4-케토 중간체가 UDP의 β 포스페이트 주변을 회전하여 케토 중간체의 반대 면을 제시하고 반대 면으로부터의 하이드라이드의 재삽입을 허용하여 탄소 4에서 하이드록실의 배치를 역전시킨다는 것을 암시한다. 이 보존된 서열들의 존재는 Z3206이 유사한 기작을 통해 작용할 것임을 암시한다. 도 7에서 보이는 바와 같이, 에피머라제 생성물의 평형 분포가 GlcNAc-P-P-Und의 형성에 유리한 듯하지만, O-항원 반복 유닛 조립을 위한 GalNAc-P-P-Und의 사용은 질량 작용을 통해 에피머화 반응을 GalNAc-P-P-Und 쪽으로 유도할 것이다.
폴리이소프레노이드 지질 중간체의 글리코실 부분의 에피머화는 사실상 널리 보고되어 있지 않다. 한 종래 연구에서, 마이코박테리아에서 아라비노갈락탄 생합성의 아라비노실 공여체인 아라비노실-P-데카프레놀을 형성하는 리보실-P-데카프레놀의 2-에피머화가 보고되었다(문헌[Mikusova, K., Huang, H., Yagi, T., Holsters, M., Vereecke, D., D'Haeze, W., Scherman, M. S., Brennan, P. J., McNeil, M. R., and Crick, D. C. (2005) J. Bacteriol. 187, 8020-8025]). 아라비노실-P-데카프레놀은 2종의 마이코박테리아 단백질인 Rv3790 및 Rv3791을 필요로 하는 2-단계 산화/환원 반응을 통해 형성된다. 에피머화가 NAD 및 NADP의 첨가에 의해 적당하게 자극되었지만, Rv3790 및 Rv3791 둘 다 단쇄 데하이드로게나제/리덕타제 과의 특징인 로스만 폴드 또는 SX 24YXXXK 모티프를 함유하지 않는다(문헌[Allard, S. T. M., Giraud, M.-F. and Naismith, J. H. (2001) Cell. Mol. Life Sci. 58, 1650-1655]; 문헌[Field, R. A. and Naismith, J. H. (2003) Biochemistry 42, 7637-7647]).
요약하건대, GlcNAc-P-P-Und의 에피머화를 통해 GalNAc-P-P-Und를 형성하는 신규 생합성 경로가 기재된다.
여러 항생제들이 GlcNAc-P-P-Und의 합성을 억제하는 것으로 밝혀져 있지만, 이들은 단백질 N-글리코실화 경로의 개시 돌리콜(dolichol)-결합된 중간체인 GlcNAc-P-P-돌리콜의 합성도 차단하기 때문에 그들의 유용성에서 제한된다. GlcNAc-P-P-돌리콜이 박테리아 당지질 중간체인 GlcNAc-P-P-Und의 구조적으로 관련된 포유동물 대응물이지만, 진핵세포에서 GlcNAc-P-P-돌리콜을 GalNAc-P-P-돌리콜로 전환시키는 유사한 에피머화 반응에 대한 증거는 없다. 따라서, 이것은 환원 말단에서 GalNAc를 함유하는 표면 O-항원이 병리학적 과정에 관여하는 균주에서 O-항원 합성이 박테리아 에피머라제를 억제함으로써 잠재적으로 차단될 수 있는 가능성을 증가시킨다.
본 발명의 한 실시양태는 이. 콜라이 O157에서 GlcNAc-P-P-Und(N-아세틸글루코스아미닐피로포스포릴운데카프레놀)를 GalNAc-P-P-Und(N-아세틸갈락토스아미닐피로포스포릴운데카프레놀)로 전환시키는 에피머라제를 포함한다. 본 발명의 추가 예시적 양태는 환원 말단에서 GalNAc를 갖는 지질-결합된 반복 테트라사카라이드의 합성의 개시를 포함한다.
본 발명의 또 다른 양태의 근거는 캄필로박터 제주니가 일반적인 N-결합된 단백질 글리코실화 시스템을 함유한다는 발견을 포함한다. 캄필로박터 제주니의 다양한 단백질들이 헵타사카라이드에 의해 변경될 수 있는 것으로 밝혀졌다. 이 헵타사카라이드는 특정 글리코실트랜스퍼라제에 의해 촉진되는 뉴클레오타이드 활성화된 모노사카라이드의 단계적 부가에 의해 내부 막의 세포질 면에서 담체 지질인 운데카프레닐 피로포스페이트 상에서 조립된다. 그 후, 지질-결합된 올리고사카라이드는 플립페이즈, 예를 들면, PglK에 의해 주변 세포질 내로 플립-플롭된다(가로질러 분산됨). N-결합된 단백질 글리코실화의 최종 단계에서, 올리고사카릴 트랜스퍼라제(예를 들면, PglB)는 올리고사카라이드가 상기 담체 지질로부터 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음) 내의 아스파라긴(Asn) 잔기로 전달되는 것을 촉진한다. 헵타사카라이드에 대한 글리코실화 클러스터는 이. 콜라이 내로 성공적으로 전달되었고, 캄필로박터의 N-결합된 당단백질이 생성되었다.
PglB가 지질-결합된 당 기질에 대한 엄격한 특이성을 나타내지 않는다는 것이 입증되었다. 운데카프레닐 피로포스페이트 상에서 조립된 항원성 폴리사카라이드는 원형질 막공간에서 PglB에 의해 포획되고 단백질 담체로 전달된다(문헌[Feldman, 2005; Wacker, M., et al., Substrate specificity of bacterial oligosaccharyltransferase suggests a common transfer mechanism for the bacterial and eukaryotic systems. Proc. Natl. Acad. Sci. U.S.A., 2006. 103(18): p. 7088-93]). 효소는 운데카프레닐 피로포스페이트(UPP) 결합된 올리고사카라이드가 환원 말단에서 N-아세틸화된 헥소스아민을 함유하는 경우, 상기 운데카프레닐 피로포스페이트(UPP)-결합된 올리고사카라이드의 다양한 어레이를 또한 전달할 것이다. pglB에 대한 뉴클레오타이드 서열 및 PglB에 대한 아미노산 서열은 국제 특허출원 공개 제WO 2009/104074호에서 공개되어 있다.
따라서, 본 발명의 한 실시양태는 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음); 및 환원 말단에서 N-아세틸갈락토스아민을 갖고 N-글리코사이드 결합에 의해 상기 하나 이상의 도입된 컨센서스 서열 각각에 N-결합된 올리고사카라이드 또는 폴리사카라이드를 포함하는, 재조합 N-글리코실화된 단백질을 포함한다.
추가 실시양태에서, 본 발명은 운데카프레닐 피로포스페이트 상에서 N-아세틸갈락토스아민("GalNAc")을 합성하는 에피머라제를 포함하는, 폴리사카라이드의 전부 또는 일부를 제조하는 재조합 원핵 생합성 시스템에 관한 것이다. 추가 실시양태에서, 폴리사카라이드의 전부 또는 일부는 항원성을 나타낸다.
또 다른 실시양태에서, 본 발명은 운데카프레닐 피로포스페이트 상에서 GalNAc를 합성하는 에피머라제; 및 환원 말단에서 GalNAc를 갖는 폴리사카라이드를 합성하는 글리코실트랜스퍼라제를 포함하는, 재조합 원핵 생합성 시스템에 관한 것이다.
본 발명의 한 실시양태는 운데카프레닐 피로포스페이트 상에서 GalNAc를 합성하는 에피머라제, 및 하기 구조를 갖는 폴리사카라이드를 합성하는 글리코실트랜스퍼라제를 포함하는 재조합 원핵 생합성 시스템을 추가로 포함한다: α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc(이때, GalNAc는 상기 폴리사카라이드의 환원 말단에 존재함).
재조합 원핵 생합성 시스템은 다양한 유래의 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드를 제조할 수 있다. 본 발명의 실시양태는 다양한 유래의 올리고사카라이드 및 폴리사카라이드에 관한 것이다. 이러한 올리고사카라이드 또는 폴리사카라이드는 원핵 또는 진핵 유래의 올리고사카라이드 또는 폴리사카라이드일 수 있다. 원핵 유래의 올리고사카라이드 또는 폴리사카라이드는 그람 음성 또는 그람 양성 박테리아로부터 유래될 수 있다. 본 발명의 한 실시양태에서, 올리고사카라이드 또는 폴리사카라이드는 이. 콜라이로부터 유래된다. 본 발명의 추가 양태에서, 상기 올리고사카라이드 또는 폴리사카라이드는 이. 콜라이 O157로부터 유래된다. 또 다른 실시양태에서, 상기 올리고사카라이드 또는 폴리사카라이드는 하기 구조를 포함한다: α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc. 본 발명의 추가 실시양태에서, 올리고사카라이드 또는 폴리사카라이드는 쉬겔라 플렉스네리로부터 유래된다. 추가 실시양태에서, 올리고사카라이드 또는 폴리사카라이드는 쉬겔라 플렉스네리 6으로부터 유래된다. 추가 실시양태에서, 올리고사카라이드 또는 폴리사카라이드는 하기 구조를 포함한다:
본 발명의 실시양태는 다양한 유래의 단백질들을 추가로 포함한다. 이러한 단백질들은 원핵 유기체 및 진핵 유기체에 천연적으로 존재하는 단백질들을 포함한다. 단백질 담체는 예를 들면, AcrA일 수 있거나 단백질 글리코실화를 위한 컨센서스 서열, 즉 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음)를 함유하도록 변경된 단백질 담체(예를 들면, 변경된 외독소 슈도모나스 애루기노사(Pseudomonas aeruginosa)("EPA"))일 수 있다. 본 발명의 한 실시양태에서, 단백질은 슈도모나스 애루기노사 EPA이다.
본 발명의 추가 양태는 N-글리칸의 환원 말단에서 GalNAc를 갖는 신규 생접합체 백신을 포함한다. 본 발명의 추가 실시양태는 운데카프레닐 피로포스페이트 상에서 GalNAc를 생성하는 에피머라제를 함유하는 재조합 박테리아 세포를 사용하여 상기 생접합체 백신을 제조하는 신규 방법을 포함한다. 한 실시양태에서, 생접합체 백신은 박테리아 질환의 치료 또는 예방에 사용될 수 있다. 추가 실시양태에서, 생접합체 백신은 암 또는 다른 질환에 대한 치료 및/또는 예방 잠재력을 가질 수 있다.
인간에 대한 전형적인 백신접종 투여량은 약 1 내지 25 ㎍, 바람직하게는 약 1 내지 약 10 ㎍, 가장 바람직하게는 약 10 ㎍이다. 선택적으로, 본 발명의 백신, 예컨대, 생접합체 백신은 보강제를 포함한다.
추가 실시양태에서, 본 발명은 올리고사카릴 트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질 담체를 코딩하는 뉴클레오타이드 서열; 하나 이상의 박테리아로부터 유래된 하나 이상의 폴리사카라이드 유전자 클러스터(이때, 상기 폴리사카라이드는 환원 말단에서 GalNAc를 함유함); 및 에피머라제를 코딩하는 핵산 서열을 포함하는, 하나 이상의 박테리아에 대한 생접합체 백신을 제조하는 발현 시스템에 관한 것이다. 추가 실시양태에서, 폴리사카라이드 유전자 클러스터는 항원성 폴리사카라이드를 코딩한다.
추가 실시양태에서, 본 발명은 올리고사카릴 트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 하나 이상의 삽입된 컨센서스 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 포함하는 단백질 담체를 코딩하는 뉴클레오타이드 서열; 하나 이상의 박테리아로부터 유래된 하나 이상의 폴리사카라이드 유전자 클러스터(이때, 상기 폴리사카라이드는 환원 말단에서 GalNAc를 함유함); 및 Z3206 유전자를 포함하는, 하나 이상의 박테리아에 대한 생접합체 백신을 제조하는 발현 시스템에 관한 것이다. 추가 실시양태에서, 폴리사카라이드 유전자 클러스터는 항원성 폴리사카라이드를 코딩한다.
또 다른 실시양태에서, 본 발명은 단백질 담체; 단백질 담체에 결합된 하나 이상의 면역원성 폴리사카라이드 쇄(이때, 상기 폴리사카라이드는 환원 말단에서 GalNAc를 갖고, 추가로 상기 GalNAc는 상기 단백질 담체에 직접 결합됨); 및 보강제를 포함하는, 생접합체 백신에 관한 것이다.
추가 실시양태에서, 본 발명은 하나 이상의 삽입된 컨센서스 서열 D/E-X-N-Z-S/T를 포함하는 단백질 담체(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음); 상기 단백질 담체에 결합된, 하나 이상의 박테리아로부터 유래된 하나 이상의 면역원성 폴리사카라이드(이때, 상기 하나 이상의 면역원성 폴리사카라이드는 상기 단백질 담체에 직접 결합된 환원 말단에서 GalNAc를 함유함); 및 선택적으로 보강제를 포함하는, 생접합체 백신에 관한 것이다.
본 발명의 또 다른 실시양태는 글리코실트랜스퍼라제를 사용하여 재조합 유기체 내에서 환원 말단에서 GalNAc를 갖는 폴리사카라이드를 조립하는 단계; 및 상기 재조합 유기체 내에서 상기 GalNAc를 하나 이상의 표적 단백질의 아스파라긴 잔기에 결합시키는 단계(이때, 상기 하나 이상의 표적 단백질은 하나 이상의 T-세포 에피토프를 함유함)를 포함하는, 생접합체 백신의 제조 방법에 관한 것이다.
추가 실시양태에서, 본 발명은 표적 단백질의 N-글리코실화를 수행하는 대사 기구(metabolic apparatus)를 코딩하는 유전정보를 원핵 유기체 내로 도입하여 변경된 원핵 유기체를 제조하는 단계; 상기 변경된 원핵 유기체의 배양물을 제조하는 단계; 및 배양된 배지로부터 글리코실화된 단백질을 수득하는 단계를 포함하는, 생접합체 백신의 제조 방법에 관한 것으로서, 이때 하나 이상의 재조합 표적 단백질의 발현에 필요한 유전정보가 상기 원핵 유기체 내로 도입되고, 이. 콜라이 균주 O157 에피머라제의 발현에 필요한 유전정보가 상기 원핵 유기체 내로 도입되고, 상기 대사 기구가 지질 담체 상에서 환원 말단에서 GalNAc를 갖는 폴리사카라이드를 조립하는 종류의 글리코실트랜스퍼라제, 및 상기 폴리사카라이드의 GalNAc를 표적 단백질의 아스파라긴 잔기에 공유결합시키는 올리고사카릴 트랜스퍼라제를 포함하고, 이때 상기 표적 단백질은 하나 이상의 T-세포 에피토프를 함유한다.
본 발명의 추가 양태는 약학 조성물에 관한 것이다. 본 발명의 추가 양태는 본 발명에 따른 하나 이상의 N-글리코실화된 단백질을 포함하는 약학 조성물을 포함한다. 본원의 개시내용에 비추어 볼 때, 단백질을 포함하는 약제의 제조는 당업자에게 잘 공지되어 있을 것이다. 본 발명의 추가 양태는 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 에피머라제를 억제하는 항생제를 포함하는 약학 조성물에 관한 것이다. 바람직한 실시양태에서, 본 발명의 약학 조성물은 약학적으로 허용가능한 부형제, 희석제 및/또는 보강제를 포함한다.
적합한 부형제, 희석제 및/또는 보강제는 당업계에 잘 공지되어 있다. 부형제 또는 희석제는 활성 성분에 대한 비히클 또는 매질로서 작용할 수 있는 고체, 반고체 또는 액체 물질일 수 있다. 조성물의 제조 분야에서 통상의 기술을 가진 자는 선택된 생성물의 구체적 특징, 치료될 질환 또는 상태, 상기 질환 또는 상태의 단계 및 다른 관련 환경에 따라 적절한 투여 형태 및 방식을 용이하게 선택할 수 있다(문헌[Remington's Pharmaceutical Sciences, Mack Publishing Co. (1990)]). 약학적으로 허용가능한 희석제 또는 부형제의 비율 및 성질은 선택된 약학적 활성 화합물의 가용성 및 화학적 성질, 선택된 투여 경로 및 표준 약학 관행에 의해 결정된다. 약학 제제는 경구, 비경구 또는 국소 사용을 위해 채택될 수 있고, 정제, 캡슐제, 좌제, 용액, 현탁액 등의 형태로 환자에게 투여될 수 있다. 본 발명의 약학적 활성 화합물은 그 자체가 효과적이지만, 안정성, 결정화의 편리성, 증가된 가용성 등을 목적으로 그들의 약학적으로 허용가능한 염, 예컨대, 산 부가염 또는 염기 부가염의 형태로 제제화되고 투여될 수 있다.
특정 뉴클레오타이드 또는 아미노산 서열이 인식되어 있는 경우, 본 발명은 상기 인식된 서열과 동일한 기능성을 구현할 상동 서열을 포괄한다는 것을 또한 이해할 것이다. 본 발명의 한 실시양태에서, 이러한 서열은 85% 이상의 상동성을 나타낸다. 또 다른 실시양태에서, 이러한 서열은 90% 이상의 상동성을 나타낸다. 추가 실시양태에서, 이러한 서열은 95% 이상의 상동성을 나타낸다.
2개의 뉴클레오타이드 또는 아미노산 서열들 사이의 백분율 동일성의 측정은 당업자에게 공지되어 있다.
본원에 기재된 핵산 서열들, 예컨대, 첨부된 서열목록에 기재된 핵산 서열들은 예시적인 서열일 뿐이고, 상기 서열들이 상이한 방식으로 조합될 수 있다는 것이 당업자에게 자명할 것이다. 본 발명의 추가 실시양태는 핵산의 변이체를 포함한다. 핵산의 변이체(예를 들면, 코돈-최적화된 핵산)는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 18, 19, 20, 21, 22, 23, 24, 27, 28 또는 29와 실질적으로 동일할, 즉 80% 이상 동일할, 예를 들면, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.5% 동일할 수 있다. 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 18, 19, 20, 21, 22, 23, 24, 27, 28 또는 29를 함유하는 서열의 핵산 변이체는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 18, 19, 20, 21, 22, 23, 24, 27, 28 또는 29, 또는 이들의 일부를 함유하는 서열로부터의 하나 이상의 뉴클레오타이드(예를 들면, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175 또는 200개의 뉴클레오타이드)의 치환, 변이, 변경, 대체, 결실 및/또는 부가를 갖는 핵산을 포함한다.
예를 들면, 본 발명의 한 실시양태에서, 이러한 변이체는 GlcNAc-P-P-Und를 GalNAc-P-P-Und로 전환시키는 에피머라제를 코딩하고, (i) 숙주 세포, 예컨대, 이. 콜라이에서 발현되고, (ii) 서열번호 1, 3, 5, 7 또는 9, 또는 이들의 일부와 실질적으로 동일한 핵산을 포함한다.
본원에 기재된 핵산은 재조합 DNA 및 합성(예를 들면, 화학적으로 합성된) DNA를 포함한다. 핵산은 이중 가닥 또는 단일 가닥일 수 있다. 단일 가닥 핵산의 경우, 상기 핵산은 센스 가닥 또는 안티센스 가닥일 수 있다. 핵산을 올리고뉴클레오타이드 유사체 또는 유도체를 사용하여 합성할 수 있다.
본원에 기재된 핵산을 포함하는 플라스미드는 발현을 위해 숙주 세포 내로 형질감염되거나 형질전환될 수 있다. 형질감염 및 형질전환 기법은 당업자에게 공지되어 있다.
본원에서 언급된 모든 문헌들은 전체 내용이 참고로서 본원에 혼입된다. 본원에서 사용된 바와 같이 용어 "또는"이 적절한 경우 조합될 수 있는 대체물을 표시한다는 것, 즉 용어 "또는"이 각각의 기재된 대체물을 별도로, 뿐만 아니라 그들의 조합으로 포함한다는 것을 이해해야 한다. 문맥이 명확히 달리 명시하지 않은 한, 본원에서 사용된 바와 같이, 단수, 예컨대, 단수 형태의 언급은 복수를 포함하고, 복수의 언급은 단수를 포함한다.
본 발명은 본 발명의 조성물 및 방법뿐만 아니라 이들의 유용성을 추가로 기술하는 하기 실시예를 참조함으로써 더 정의된다. 본 발명의 범위 내에 있는, 조성물 및 방법 둘 다에 대한 변경을 실시할 수 있다는 것이 당업자에게 자명할 것이다.
실시예
박테리아 균주 및 플라스미드 - 이. 콜라이 균주 PR4019(문헌[Rush, J. S., Rick, P. D. and Waechter, C. J. (1997) Glycobiology, 7, 315-322]) 및 PR21546(문헌[Meier-Dieter, U., Starman, R., Barr, K., Mayer, H. and Rick, P. D. (1990) J. Biol. Chem., 265, 13490-13497])은 폴 릭 박사(Dr. Paul Rick, Bethesda, MD)로부터 제공받았고, 이. 콜라이 O157:H45(문헌[Stephan, R., Borel, N., Zweifel, C, Blanco, M., and Blanco, J.E. (2004) BMC Microbiol 4:10])는 클라우디오 즈웨이펠 박사(Dr. Claudio Zweifel, 취리히 대학 베테리나리 인스티튜트(Veterinary Institute, University of Zurich))로부터 제공받았다. 이. 콜라이 DH5α는 클로닝 실험 및 단백질 글리코실화 분석을 위한 숙주로서 사용되었다. 사용된 플라스미드는 표 2에 기재되어 있다.
플라스미드 | 설명 | 참조 |
pMLBAD | 클로닝 벡터, TmpR | 문헌(Lefebre & Valvano (2002)) |
pMLBAD:Z2306(서열번호 23) | pMLBAD 내의 Z3206, TmpR, 발현이 아라비노스 유도성 프로모터에 의해 조절됨 | 본원의 실시예 |
pMLBAD:gne(서열번호 24) | pMLBAD 내의 gne, TmpR, 발현이 아라비노스 유도성 프로모터에 의해 조절됨 | 본원의 실시예 |
pACYCpgl | 캄필로박터 제주니 pgl 클러스터 CmR | 문헌(Wacker, et al. (2002)) |
pACYCgne::kan | gne에 kan 카세트를 함유하는 캄필로박터 제주니 pgl 클러스터, CmR, KanR | 문헌(Linton, et al. (2005)) |
pWA2 | pBR322 내의 Tet 프로모터의 조절 하에 있는 가용성 원형질 막공간 헥사-His 태그로 표지된 AcrA, AmpR | 문헌(Feldman, et al. (2005)) |
재료 - [1,6-3H]GlcNAc(30 Ci/mmol), UDP-[1-3H]GlcNAc(20 Ci/mmol) 및 UDP-[6-3H]GalNAc(20 Ci/mmol)는 어메리칸 레이디오레이블드 케미칼스(American Radiolabeled Chemicals)(미국 미조리주 세인트 루이스 소재)로부터 입수되었다. 콴텀(Quantum) 1 실리카 겔 G 박층 플레이트는 콴텀 인더스트리스(Quantum Industries)(미국 뉴저지주 페어필드 소재)의 제품이었고, 베이커(Baker) Si250 실리카 겔 G 플레이트는 말린크로츠 케미칼 워크스(Mallinckrodt Chemical Works)에 의해 제조되었다. 효모 추출물 및 박토-펩톤은 비디 바이오사이언시스(BD Biosciences)의 제품이었다. 모든 다른 화학물질들은 표준 상업적 공급원으로부터 입수되었다. 트라이메토프림(Trimethoprim)(50 ㎍/㎖), 클로람페니콜(chloramphenicol)(20 ㎍/㎖), 앰피실린(ampicillin)(100 ㎍/㎖) 및 가나마이신(kanamycin)(50 ㎍/㎖)을 필요에 따라 배지에 첨가하였다.
재조합 플라스미드의 구축 - 이. 콜라이 균주 DH5α를 DNA 클로닝 실험을 위해 사용하였고, 구축된 플라스미드를 DNA 서열분석으로 검증하였다. 올리고뉴클레오타이드 Z3206-Fw 및 Z3206-RvHA(AAACCCGGGATGAACGATAACGTTTTGCTC(서열번호 17) 및 AAATCTAGATTAAGCGTAATCTGGAACATCGTATGGGTACTCAGAAACAAACGTTATGTC(서열번호 18); 제한부위는 밑줄로 표시됨)를 사용하여 PCR로 Z3206 유전자를 이. 콜라이 O157:H45로부터 증폭시켰다. PCR 단편을 SmaI 및 XbaI로 분해하고 SmaI-XbaI 절단된 pMLBAD 벡터(문헌[Lefebre, M. D. and Valvano M. A. (2002) Appl Environ Microbiol 68: 5956-5964]) 내로 연결시켰다. 이것은 C-말단 헤마글루티닌 태그를 갖는 Z3206을 코딩하는 플라스미드 pMLBAD:Z3206(서열번호 23)을 야기시켰다.
올리고뉴클레오타이드 gne-Fw 및 gne-RV(AAACCATGGATGAAAATTCTTATTAGCGG(서열번호 19) 및 AAATCTAGATTAAGCGTAATCTGGAACATCGTATGGGTAGCACTGTTTTTCCCAATC(서열번호 20); 제한부위는 밑줄로 표시됨)를 사용하여 캄필로바터 제주니 pgl 클러스터를 코딩하는 pACYCpgl(문헌[Wacker, M., Linton, D., Hitchen, P.G., Nita-Lazar, M., Haslam, S.M., North, S.J., Panico, M., Morris, H.R., Dell, A., Wrenn, B.W., Aebi, M. (2002) Science 298, 1790-1793])로부터 gne 유전자를 증폭시켰다. PCR 생성물을 NcoI 및 XbaI로 분해하고, pMLBAD의 동일한 부위 내로 연결하여 C-말단 헤마글루티닌 태그를 갖는 Gne를 코딩하는 플라스미드 pMLBAD:gne(서열번호 24)를 발생시켰다(표 2).
성장 조건, 단백질 발현 및 면역검출 - 이. 콜라이 균주를 37℃에서 루리아-버타니(Luria-Bertani) 배지(1% 효모 추출물, 2% 박토-펩톤, 0.6% NaCl) 내에서 격렬히 진탕하면서 배양하였다. 아라비노스를 0.05 내지 0.4의 A600까지 성장한 이. 콜라이 세포에 0.02 내지 0.2%(중량/부피)의 최종 농도로 첨가하여 아라비노스 유도성 발현을 달성하였다. 유도 후 5시간에서 동일한 양의 아라비노스를 다시 첨가하고 4 내지 15시간 동안 계속 배양하였다.
분석 절차 - 피어스 바이오테크놀로지(Pierce Biotechnology) 사보("Eliminate Interfering Substances from Samples for BCA Protein Assay")에 따라 데옥시콜레이트 및 트라이클로로아세트산을 사용하여 막 단백질을 침전시킨 후, BCA 단백질 분석(피어스)을 이용하여 단백질 농도를 측정하였다. 0.5 ㎖의 1% SDS 및 4 ㎖의 이코노세이프 이코노믹 생분해성 카운팅 혼합물(Econosafe Economical Biodegradable Counting Mixture)(리서치 프로덕츠 인터내셔날 코포레이션(Research Products International, Corp.); 미국 일리노이주 마운트 프로스펙트 소재)을 첨가한 후, 팩커드 트라이-카브(Tri-Carb) 2100TR 액체 신틸레이션(scintillation) 분광계에서 신틸레이션 분광측정을 수행함으로써 샘플들을 방사성에 대해 분석하였다.
실시예 1: GlcNAc-P-P-Und 4-에피머라제를 코딩하는 이. 콜라이 O157 유전자의 확인
본원에서 본 발명자들은 GalNAc-P-P-Und가 4-에피머라제의 종래 공지되지 않은 작용에 의해 촉진되는 GlcNAc-P-P-Und의 4-OH의 에피머화에 의해 형성되는, 신규 생합성 경로의 놀라운 발견을 기술한다. 이 경로에서, GlcNAc-P-P-Und는 WecA에 의해 촉진되는, UDP-GlcNAc로부터의 GlcNAc-P의 전달에 의해 형성된 후, 종래 공지되지 않은 경로인 GlcNAc-P-P-Und-4-에피머라제에 의해 GalNAc-P-P-Und로 에피머화된다(도 2).
GlcNAc-P-P-Und 4-에피머라제의 후보물질을 코딩하는 유전자는 DNA 유사성 검색에 의해 확인되었다. 유사성 검색은 웹사이트(http://blast.ncbi.nlm.nih.gov/Blast.cgi)에서 발견되는 미국 의학국립도서관 데이터베이스를 사용하여 수행하였다. 환원 말단에서 GalNAc를 갖는 O-항원 반복 유닛을 코딩하는 상이한 박테리아의 게놈 서열들이 스크리닝되었다. 환원 말단에서 GalNAc를 함유하는 반복 유닛을 갖는 제 1 군과 상기 반복 유닛에서 말단 GalNAc를 결여하는 제 2 군을 비교하여 잠재적인 에피머라제를 확인하였다. 이 기준들을 이용하였을 때, Z3206은 후보 GlcNAc-P-P-Und 4-에피머라제로서 확인되었다(표 1).
GalNAc를 함유하는 O-항원 반복 유닛을 갖는 이. 콜라이 균주에 존재하는 GlcNAc 4-에피머라제 유전자를 표 1에 나타낸 바와 같이 2개의 상동성 군으로 분리할 수 있다. 놀랍게도, 하나의 상동성 군(gne1을 함유함)이 O-항원 반복 유닛 상의 개시 당으로서의 GalNAc의 존재와 상관관계를 갖는다는 것이 발견되었다. 추가로 놀랍게도, 제 2 군(gne2을 함유함)이 UDP-Glc 에피머라제인 GalE에 대한 고도의 유사성을 나타내고 GalNAc를 사용하여 O-항원 반복 유닛 합성을 개시하지 않는 이. 콜라이 균주들에서 존재한다는 것이 발견되었다. 이. 콜라이 O157 내의 Z3206(gne1에 대한 고도의 상동성을 나타내는 유전자)은 후보 GlcNAc-P-P-Und 4-에피머라제로서 확인되었다. Z3206 유전자는 O-항원 클러스터의 galF와 콜란산 클러스터에 속하는 wcaM 사이에 존재하기 때문에 Z3206 유전자의 게놈 위치는 이 경로에서 그의 역할과 일치한다.
실시예 2 내지 11에 기재된 연구는 GalNAc-P-P-Und의 형성을 촉진하는 효소로서의 GlcNAc 4-에피머라제(이. 콜라이 O157 Z3206)의 확인을 포함하는 상기 발견을 더 확인시켜준다.
실시예 2: UDP-GalNAc는 이. 콜라이 WecA(GlcNAc-포스포트랜스퍼라제)의 기질이 아니다
이. 콜라이 WecA가 UDP-GalNAc를 GalNAc-P 공여체로서 사용하여 GalNAc-P-P-Und를 형성하는지를 확인하기 위해, 이. 콜라이 균주 K12, PR4019(WecA 과발현 균주), 및 환원 말단에서 GalNAc를 갖는 테트라사카라이드 O-항원 반복 유닛을 합성하는(아마도 GalNAc-P-P-Und의 합성에 의해 개시됨) O157로부터 수득된 막 분획을 UDP-[3H]GalNAc와 함께 항온처리하였다.
이. 콜라이 막의 준비 - 박테리아 세포를 1,000 Xg에서 10분 동안 원심분리하여 수집하고, 빙냉 포스페이트-완충된 식염수로 1회 세척하고 빙수로 1회 세척하고 완충제(10 mM 트라이스-HCl, pH 7.4, 0.25 M 수크로스)로 1회 세척하였다. 세포를 완충제(10 mM 트라이스-HCl, pH 7.4, 0.25 M 수크로스, 0.2 mg/㎖ 라이소자임을 함유하는 10 mM EDTA)에 약 200 A600 유닛/㎖의 밀도로 재현탁시키고, 30℃에서 30분 동안 항온처리하였다. 박테리아 세포를 1,000 Xg에서 10분 동안 원심분리하여 회수하고, 40 부피의 빙냉 10 mM 트라이스-HCl(pH 7.4)에 신속히 재현탁시키고, 얼음 위에 놓았다. 10분 후, 조밀-피팅 다운스(tight-fitting Dounce) 균질화기를 이용한 15회 젓기로 상기 세포를 균질화시키고, 0.1 mM 페닐메틸설포닐 플루오라이드 및 최종 농도 0.25 M의 수크로스로 보충하였다. 파괴되지 않은 세포를 1,000 Xg에서 10분 동안 원심분리하여 제거하고, 세포 외피(envelope)를 40,000 Xg에서 20분 동안 원심분리하여 회수하였다. 막 분획을 완충제(10 mM 트라이스-HCl, pH 7.4, 0.25 M 수크로스, 1 mM EDTA)에 재현탁시키고, 40,000 Xg에서 다시 침강시키고, 동일한 완충제에 약 20 mg/㎖의 단백질 농도로 재현탁시켰다. 필요할 때까지 막 분획을 -20℃에서 저장하였다.
시험관 내에서 이. 콜라이 막에서의 [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und의 생합성에 대한 분석 - GlcNAc-P-P-Und 및 GalNAc-P-P-Und의 합성을 위한 반응 혼합물은 0.05 ㎖의 총 부피로 50 mM 트라이스-HCl(pH 8), 40 mM MgCl2, 5 mM 다이티오트레이톨, 5 mM 5' AMP, 이. 콜라이 막 분획(50 내지 200 ㎍의 막 단백질) 및 5 μM UDP-[3H]GlcNAc/GalNAc(500 내지 2500 dpm/pmol)를 함유하였다. 37℃에서 항온처리한 후, 40 부피의 CHCl3/CH3OH(2:1)를 첨가하여 반응을 종결시키고, [3H]HexNAc-P-P-운데카프레놀을 함유하는 총 지질 추출물을 이미 공지된 바와 같이 제조하였다(문헌[Waechter, C. J., Kennedy, J. L. and Harford, J. B. (1976) Arch. Biochem. Biophys. 174, 726-737]). 분배 후, 유기층을 질소의 스트림 하에서 건조하고 1 ㎖ CHCl3/CH3OH(2:1)에 재용해시키고, 분취액(0.2 ㎖)을 제거하고, 신틸레이션 바이알 내에서 건조하고, 팩커드 트라이-카브 2100TR 액체 신틸레이션 분광계에서 액체 신틸레이션 분광측정을 수행하여 방사성에 대해 분석하였다. [3H]GlcNAc-P-P-Und 또는 [3H]GalNAc-P-P-Und의 합성 속도를 측정하기 위해, 지질 추출물을 질소의 스트림 하에서 건조하고, 작은 부피의 CHCl3/CH3OH(2:1)에 재용해시키고, 10 X 20 cm 보레이트-함침된 베이커 Si250 실리카 겔 플레이트 상에 점찍고, 상기 플레이트를 CHCl3, CH3OH, H2O 및 0.2 M 나트륨 보레이트(65:25:2:2)로 현상하였다. 바이오스캔 AR2000 이미지화 스캐너(바이오스캔(Bioscan); 미국 워싱톤주 워싱톤 디.씨. 소재)를 이용하여 개별 당지질을 검출하였다. [3H]GlcNAc/GalNAc-P-P-Und에서의 방사성의 총량을 개별 [3H]당지질의 백분율로 곱함으로써 각각의 당지질에 대한 생합성 속도를 계산하였다.
상이한 이. 콜라이 균주(K12, PR4019 및 O157)로부터 수득된 막 분획을 UDP-[3H]GlcNAc 또는 UDP-[3H]GalNAc와 함께 항온처리하고, [3H]GlcNAc/GalNAc-P-P-Und 내로의 도입을 전술한 바와 같이 측정하였다. 표 3에서 알 수 있는 바와 같이, 표지된 당지질은 UDP-[3H]GalNAc와의 항온처리 후 검출되지 않았고, 막 분획이 UDP-[3H]GlcNAc와 함께 항온처리되었을 때 GlcNAc-P-P-Und만이 검출되었다.
막의 공급원 | 부가된 당 뉴클레오타이드 | 형성된 [3H]당지질 | |
GlcNAc-P-P-Und | GalNAc-P-P-Und | ||
(pmol/mg) | (pmol/mg) | ||
K12 | UDP-[3H]GlcNAc | 6.4 | <0.01 |
K12 | UDP-[3H]GalNAc | <0.01 | <0.01 |
PR4019 | UDP-[3H]GlcNAc | 44 | <0.01 |
PR4019 | UDP-[3H]GalNAc | <0.01 | <0.01 |
O157 | UDP-[3H]GlcNAc | 1.5 | 0.5 |
O157 | UDP-[3H]GalNAc | <0.01 | <0.01 |
나아가, WecA 과다발현 균주인 PR4019로부터 수득된 막과의 항온처리물에의 외인성 Und-P의 첨가 및 O157 세포로부터 수득된 세포질 분획의 첨가 둘 다가 UDP-GalNAc로부터 GalNAc-P-P-Und를 형성하지 못하였다. 이 결과는 UDP-GalNAc가 WecA에 대한 기질이 아님을 입증하고 GalNAc-P-P-Und가 대안적 기작에 의해 형성된다는 것을 암시한다.
균주 K12로부터 수득된 막을 UDP-[3H]GlcNAc와 함께 항온처리하였을 때, [3H]GlcNAc-P-P-Und가 예측된 바와 같이 합성되었다(문헌[Rush, J. S., Rick, P. D. and Waechter, C. J. (1997) Glycobiology, 7, 315-322]). 그러나, 균주 O157로부터 수득된 막을 UDP-[3H]GlcNAc와 함께 항온처리하였을 때, [3H]GlcNAc-P-P-Und 이외에 [3H]GalNAc-P-P-Und인 것으로 밝혀진 제 2 표지된 지질(이하 참조)이 관찰되었다. 2종의 당지질의 형성에 대한 시간 경과를 조사하였을 때, [3H]GlcNAc-P-P-Und 내로의 방사성의 도입(도 1, ○)은 [3H]GalNAc-P-P-Und 내로의 방사성의 도입(도 1, ●)보다 더 신속하고 더 높은 정도로 일어났는데, 이것은 전구체-생성물 관계와 일치한다(도 2).
이. 콜라이 O157 막이 GalNAc-P-P-Und의 합성을 위해 GalNAc-P 공여체로서 UDP-GalNAc를 사용하지 않는다는 관찰 결과는 도 2에 나타낸 GalNAc-P-P-Und의 형성을 위한 생합성 경로를 확인시켜주는 일례이다. 이 경로에서, GlcNAc-P-P-Und는 WecA에 의해 촉진되는, UDP-GlcNAc로부터의 GlcNAc-P의 전달에 의해 형성된 후, 종래 공지되지 않은 4-에피머라제의 작용에 의해 에피머화되어 GalNAc-P-P-Und를 생성한다.
실시예
3: 이.
콜라이
균주
O157
로부터
수득된
막 분획을 사용하여 시험관 내에서 형성한 [
3
H]
GalNAc
-P-P-
Und
의 특징 규명
도 1에서 GalNAc-P-P-Und로서 검출된 추가의 O157-특이적 당지질 생성물과 일치하여, [3H]GalNAc-P-P-Und는 약알칼리성 메탄올분해(methanolysis)(0.1 N KOH를 함유하는 톨루엔/메탄올 1:3, 0℃, 60분)에 대한 안정성을 나타내었고, CHCl3/CH30H/H20(10:10:3)에서 평형화된 DEAE-셀룰로스에 의해 보유되었고, [3H]GlcNAc1-2-P-P-Dol에 대해 종래 보고된 바와 같이(문헌[Waechter, C. J. and Harford, J. B. (1977) Arch. Biochem. Biophys. 181, 185-198]) 20 mM 암모늄 아세테이트를 함유하는 CHCl3/CH30H/H20(10:10:3)에 의해 용출되었다.
[3H]GalNAc-P-P-Und는 보레이트-함침된 실리카 겔 G 상의 박층 크로마토그래피에 의해 [3H]GlcNAc-P-P-Und로부터 명확히 용해되었고(문헌[Kean, E. L. (1966) J. Lipid Res. 7, 449-452]), 도 3a 및 3b에 나타낸 바와 같이 분취 TLC에 의해 정제되었다.
보레이트-함침된 박층 플레이트 및 와트만 제1번 종이의 준비 - 실리카 겔 박층 플레이트를 문헌[Kean, E. L. (1966) J. Lipid Res. 7, 449-452]에 기재된 바와 같이 95% 메탄올 중의 2.5% Na2B4O7·10H2O에 짧게 침지시킴으로써 나트륨 보레이트로 함침시켰다. 보레이트-함침된 TLC 플레이트를 실온에서 밤새 건조하고, 사용할 때까지 드라이어라이트(Drierite) 상의 진공 건조기 내에서 저장하였다. 크로마토그래피 직전에, 상기 플레이트를 100℃까지 짧은 시간(약 10 내지 15분) 동안 가열함으로써 활성화시켰다. 와트만 제1번 종이의 20 X 30 cm 쉬트(sheet)를 0.2 M Na2B4O7·10H2O에 침지시킴으로써 상기 와트만 제1번 종이를 나트륨 보레이트로 함침시켰다. 와트만 제1번 종이 쉬트를 문헌[Cardini, C. E. and Leloir, L. F. (1957) J. Biol. Chem. 225, 317-324]에 기재된 바와 같이 2개의 와트만 제3MM번 종이 쉬트 사이에서 단단히 압착시키고, 실온에서 수일 동안 건조하였다.
시험관내 반응에서 형성된 글리칸 생성물의 특징 규명 - 개별 당지질([3H]GalNAc-P-P-Und 및 [3H]GlcNAc-P-P-Und)의 글리칸을 약산 가수분해에 의한 방출 후 하강 종이 크로마토그래피로 특징 규명하였다. GlcNAc/GalNAc 지질을 원추형 나사-캡 튜브 내에서 질소의 스트림 하에서 건조하고, 0.2 ㎖ 0.01 M HCl에서 100℃까지 15분 동안 가열하였다. 가수분해 후, 샘플을 0.4 ㎖의 AG50WX8(H+) 및 0.4 ㎖의 AG1X8(아세테이트 형태)을 함유하는 0.8 ㎖의 혼합-층 이온 교환 컬럼에 인가하고, 1.5 ㎖의 물로 용출하였다. 용출물을 질소의 스트림 하에서 건조하고, 작은 부피의 H2O(0.02 ㎖)에 재용해시키고, 보레이트-함침된 와트만 제1번 종이의 30 cm 스트립 상에 점찍고, 부탄올/피리딘/물(6:4:3)을 사용하여 하강 방식으로 40 내지 50시간 동안 현상하였다. 건조 후, 상기 종이 스트립을 1 cm 띠로 절단하고 신틸레이션 분광측정으로 방사성에 대해 분석하였다. GlcNAc 표준물 및 GalNAc 표준물을 아닐린-다이페닐아민 침지 시약을 사용하여 검출하였다(문헌[Schwimmer, S. and Benvenue, A. (1956) Science 123, 543-544]).
글리칸 생성물을 전술한 바와 같이 약산 가수분해 후 0.1 M NaOH(최종 부피 0.1 ㎖) 중의 0.1 M NaBH4를 사용하여 환원시킴으로써 그의 상응하는 알디톨로 전환시켰다. 실온에서 밤새 항온처리한 후, 반응물을 몇 방울의 빙초산으로 급랭시키고, 1 방울의 아세트산을 함유하는 메탄올을 사용하여 질소의 스트림 하에서 수회 건조하였다. 알디톨을 물에 용해시키고 AG50WX8(H+) 및 AG1X8(아세테이트)의 0.5 ㎖ 컬럼 상에 통과시킴으로써 탈염시키고, 질소 하에서 건조하고, 와트만 제3MM번 종이의 30 cm 스트립 상에 점찍었다. 와트만 제3MM번 종이 스트립을 에틸 아세테이트, 피리딘 및 0.1 M 붕산(65:25:20)을 사용하여 하강 방식으로 밤새 현상하고, 건조하고, 1 cm 띠로 절단하고, 신틸레이션 분광측정으로 방사성에 대해 분석하였다. 페리오데이트-벤지딘 침지 절차의 변형 절차를 이용하여 GlcNAcitol 표준물 및 GalNAcitol 표준물을 가시화하였다(문헌[Gordon, H. T., Thornburg, W. and Werum, L. N. (1956) Anal. Chem. 28, 849-855]). 상기 종이 스트립을 아세톤 및 0.1 M NaIO4(95:5)에 침지시키고, 3분 동안 공기 건조한 후, 아세톤/아세트산/H2O/o-톨리딘(96:0.6:4.4:0.2 gm)에 침지시켰다. 시스-다이올을 함유하는 알디톨은 청색 배경 상에서 황색 점으로서 염색된다.
당지질의 질량 분광측정("MS") - 정제된 당지질을 ABI 터보(Turbo) V 전기분무 이온공급원이 장착된 ABI/MDS 사이엑스(Sciex) 4000 Q-트랩 혼성체 삼중 사중극자 선형 이온 트랩 질량 분광계(ABI/MDS-사이엑스; 캐나다 토론토 소재)를 이용하여 분석하였다. 요약하건대, 실험적으로 결정된 이온 공급원 설정을 이용하여 샘플을 10 ㎕/분의 속도로 주입하고, 분자 이온을 선형 이온 트랩 방식으로 단편화함으로써 MS/MS(초 치수의 질량 분광법) 정보를 수득하였다.
당지질을 약산으로 처리하였을 때(0.01 N HC1, 100℃, 15분), 수용성 생성물은 보레이트-함침된 와트만 제1번 종이를 사용하는 하강 종이 크로마토그래피 상에서 [3H]GalNAc와 함께 이동하였다(도 3c). 또한, 표지된 당을 환원시켰을 때, 상기 당은 [3H]알디톨인 GalNAc-OH로 전환되었다(도 3d). 더욱이, 음성 이온 MS 분석은 GalNAc-P-P-Und에 대해 예측된 바와 같이 m/z = 1128의 [M-H]- 이온을 보여주었고, MS/MS 딸이온 스펙트럼은 P-P-Und를 함유하는 당지질에 대해 예측된 바와 같이 m/z = 907에서 뚜렷한 이온을 보여주었다(문헌[Guan, Z., Breazeale, S. D. and Raetz, C. R. (2005) Anal. Biochem. 345, 336-339]). GalNAc-P-P-Und로서 균주 O157에 의해 형성된 당지질 생성물의 확인은 외인성 GlcNAc-P-P-Und로부터의 상기 생성물의 형성에 의해서도 뒷받침된다(실시예 7 참조).
실시예 4:
Z3206
유전자를 발현하는 이. 콜라이 세포에서 [
3
H]GlcNAc를 사용한 [
3
H]GalNAc-P-P-Und(생체내)의 대사적 표지
이. 콜라이 O157 Z3206 유전자의 발현이 세포로 하여금 GalNAc-P-P-Und를 합성할 수 있게 하는지를 조사하기 위해, Z3206 유전자를 발현하는 이. 콜라이 균주 21546(문헌[Meier-Dieter, U., Starman, R., Barr, K., Mayer, H. and Rick, P. D. (1990) J. Biol. Chem., 265, 13490-13497])을 [3H]GlcNAc로 대사적으로 표지하고 [3H]GlcNAc/GalNAc-P-P-Und 형성에 대해 분석하였다.
박테리아 세포의 대사적 표지 - 이. 콜라이 세포를 37℃에서 루리아-버타니 배지에서 격렬히 진탕하면서 0.5 내지 1의 A600까지 배양하였다. [3H]GlcNAc를 1 μCi/㎖의 최종 농도로 첨가하고, 37℃에서 5분 동안 계속 항온처리하였다. 0.5 mg/㎖의 분쇄된 얼음을 첨가하여 당지질 내로의 방사성표지의 도입을 종결하고, 배양물을 철저히 혼합하였다. 박테리아 세포를 4,000 Xg에서 10분 동안 원심분리하여 회수하고, 상청액을 따라 버렸다. 세포를 빙냉 포스페이트-완충된 식염수로 2회 세척하고, 10 부피(세포 펠렛)의 메탄올 중에서 격렬한 보텍스(vortex) 혼합을 수행하여 재현탁시키고, 40% 전체 전력에서 프로브 초음파처리기로 짧게 초음파처리하였다. 초음파처리 후, 20 부피의 클로로포름을 첨가하고, 추출물을 격렬히 혼합하고, 실온에서 15분 동안 세워 두었다. 불용성 물질을 원심분리로 침강시키고, 펠렛을 작은 부피의 CHCl3/CH3OH(2:1)로 2회 재추출하였다. 그 다음, 조합된 유기 추출물을 이하에 기재된 바와 같이 가공하였다.
GlcNAc-P-P-Und 및 GalNAc-P-P-Und의 정제 - GlcNAc/GalNAc-P-P-Und를 CHCl3/CH30H(2:1)로 추출하고, 이미 공지된 바와 같이 분배함으로써 수용성 물질을 제거하였다(문헌[Waechter, C. J., Kennedy, J. L. and Harford, J. B. (1976) Arch. Biochem. Biophys. 174, 726-737]). 그 다음, 유기 추출물을 질소의 스트림 하에서 건조하고, 0℃에서 0.1 N KOH를 함유하는 톨루엔/메탄올(1:3)에서 60분 동안 탈아실화(deacylation)하여 벌크 글리세로인지질(glycerophospholipid)을 파괴하였다. 탈아실화 반응을 아세트산으로 중화시키고, 4 부피의 CHCl3/CH30H(2:1)로 희석하고, 1/5 부피의 0.9% NaCl로 세척하였다. 유기(하부)층을 1/3 부피의 CHCl3, CH3OH, 0.9% NaCl(3:48:47)로 세척하고, 수층을 따라 버렸다. 잔류 수층을 상기 유기층에 수용시키기에 충분한 메탄올로 상기 유기층을 희석하고, 상기 유기층을 CHCl3/CH30H(2:1)로 평형화시킨 DEAE-셀룰로스 컬럼(5 ㎖)에 인가하였다. 컬럼을 20 컬럼 부피의 CHCl3/CH30H/H20(10:10:3)로 세척하고 20 mM 암모늄 아세테이트를 함유하는 CHCl3/CH30H/H20(10:10:3)로 용출하였다. 분획(2 ㎖)을 수집하고, (전술된 바와 같이) 보레이트-함침된 실리카 플레이트 상의 박층 크로마토그래피로 분리한 후 아니스알데하이드(anisaldehyde) 분무 시약(문헌[Dunphy, P. J., Kerr, J. D., Pennock, J. F., Whittle, K. J., and Feeney, J. (1967) Biochim. Biophys. Acta 136, 136-147])을 사용하여 방사성 또는 GlcNAc/GalNAc-P-P-Und에 대해 모니터링하였다.
UDP-ManNAcA 합성에서의 돌연변이가 엔테로박테리아의 공통된 항원의 합성을 위한 GlcNAc-P-P-Und의 사용을 차단하기 때문에 이. 콜라이 균주 21546을 Z3206 발현 연구를 위한 숙주로서 선택하였다. 이. 콜라이 21546은 이. 콜라이 K12로부터 유래되었기 때문에 이. 콜라이 21546도 O-항원 반복체를 합성하지 못하므로 (문헌[Stevenson, G., Neal, B., Liu, D., Hobbs, M., Packer, N. H., Batley, M., Redmond, J. W., Lindquist, L. and Reeves, P. (1994) J. Bacteriol., 176, 4144-4156]), 보다 많은 양의 GlcNAc-P-P-Und가 GalNAc-P-P-Und로의 전환을 위해 축적된다. 균주 21546, 및 Z3206 유전자를 발현하는 형질전환체를 [3H]GlcNAc로 표지하고, 방사성표지된 지질을 보레이트-함침된 실리카 겔 플레이트 상의 박층 크로마토그래피로 분석하였을 때, 모균주(도 4a)는 단지 하나의 표지된 지질, 즉 GlcNAc-P-P-Und를 합성하였다. 그러나, Z3206 유전자를 발현하는 21546 세포(도 4b)는 GalNAc-P-P-Und인 것으로 밝혀진 추가의 표지된 지질도 합성하였다.
실시예 5:
Z3206
유전자를 발현하는 이. 콜라이 세포로부터 수득된 막 분획은 시험관 내에서
GalNAc
-P-P-
Und
를 합성한다
이. 콜라이 O157 Z3206 유전자에 의해 코딩된 단백질이 GalNAc-P-P-Und의 합성을 촉진하는 것을 확인하기 위해, Z3206 유전자를 발현하는 이. 콜라이 세포로부터 수득된 막 분획을 [3H]UDP-GlcNAc와 함께 항온처리하였고, [3H]당지질 생성물을 도 5에 나타낸 바와 같이 보레이트-함침된 실리카 겔 플레이트 상의 박층 크로마토그래피(크로마토그래피 준비 및 특징 규명 방법은 실시예 3에 기재되어 있음)로 분석하였다. 이. 콜라이 K12 또는 숙주 균주 이. 콜라이 21546 세포로부터 수득된 막 분획을 UDP-[3H]GlcNAc와 함께 항온처리하였을 때, [3H]GlcNAc-P-P-Und만이 관찰되었다(도 5a 및 5c). 그러나, 이. 콜라이 O157 및 Z3206을 발현하는 이. 콜라이 21546으로부터 수득된 막 분획은 GalNAc-P-P-Und도 형성하였다(도 5b 및 5d).
실시예
6:
GlcNAc
-P-P-
Und
의 형성은
UMP
의 존재 하에서 역행되지만,
GalNAc
-P-P-Und의 형성은 역행되지 않는다
GalNAc-P-P-Und가 글리코실 공여체로서 UDP-GalNAc를 사용하는 WecA의 작용에 의해서 합성되는 것이 아니라, GlcNAc-P-P-Und로부터 합성된다는 것을 보여주는 추가의 증거를 제공하기 위해, 방출 내인성 예비표지된 [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und의 효과를 UMP를 사용하여 조사하였다. WecA에 의해 촉진되는 GlcNAc-포스포트랜스퍼라제 반응은 UDP-GlcNAc를 재합성하고 Und-P를 방출하는 과량의 UMP의 첨가에 의해 자유롭게 역행될 수 있다.
이 실험에서, Z3206을 발현하는 이. 콜라이 균주 21546으로부터 수득된 막 분획을 UDP-[3H]GlcNAc로 10분 동안 예비표지한 후 1 mM UMP를 첨가하고, 남아 있는 각각의 표지된 당지질의 양을 측정하였다. 도 6a에 나타낸 결과는 10분 표지 시간의 말기에서 [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und의 상대적인 양을 보여준다. 1 mM UMP와 함께 1분 동안 항온처리한 후, [3H]GlcNAc-P-P-Und의 상당한 손실이 있는 반면, [3H]GalNAc-P-P-Und 피크는 상대적으로 변화되지 않는다는 것을 알 수 있다(도 6b)(크로마토그래피 준비 및 특징 규명 방법은 실시예 5에 기재되어 있음). 이 관찰결과는 WecA가 UDP-GalNAc로부터 GalNAc-P-P-Und로의 GalNAc-P의 전달을 촉진하지 않는다는 것을 보여주는 표 3의 결과와 일치한다. UMP와의 항온처리 2분 동안, GlcNAc-P-P-Und의 손실이 느려지고 [3H]GalNAc-P-P-Und의 피크에서의 약간의 감소가 있다는 것이 주목되는데(도 6c), 이것은 [3H]GalNAc-P-P-Und가 에피머화 반응의 역행에 의해 [3H]GlcNAc-P-P-Und 풀(pool)로 재평형화된다는 것을 암시한다(실시예 7 참조).
실시예 7:
Z3206
을 발현하는 이. 콜라이 세포로부터 수득된 막에 의해 촉진되는 외인성 정제된 [
3
H]GlcNAc-P-P-Und와 [
3
H]GalNAc-P-P-Und의 상호전환
GlcNAc-P-P-Und와 GalNAc-P-P-Und가 Z3206을 발현하는 이. 콜라이 세포로부터 수득된 막 분획에 의해 직접적으로 상호전환될 수 있다는 것을 보여주는 직접적 증거를 제공하기 위해, 정제된 [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und를 외인성 기질로서 시험하였다.
정제된 [3H]GlcNAc-P-P-Und/[3H]GalNAc-P-P-Und를 실시예 4(박테리아 세포의 대사적 표지, 및 GlcNAc-P-P-Und 및 GalNAc-P-P-Und의 정제)에서와 같이 제조하였다. [3H]HexNAc-P-P-운데카프레놀(2000 dpm/pmol, 1% 트라이톤 X-100에 분산됨, 최종 농도 0.1%)을 실시예 2(시험관 내에서 이. 콜라이 막에서 [3H]GlcNAc-P-P-Und 및 [3H] GalNAc-P-P-Und의 생합성을 위한 분석)에서와 같이 이. 콜라이 막과 함께 항온처리하였다.
예비 실험은 외인성 [3H]GlcNAc-P-P-Und가 트라이톤 X-100, CHAPS(3-[(3-콜아마이도프로필)다이메틸암모니오]-1-프로판설폰산), 노니뎃(Nonidet) P-40 또는 옥틸글루코사이드에 분산된 반응 혼합물에 첨가되었을 때 에피머라제가 활성을 나타내고 7 내지 8.5의 범위 내에서 최적 pH를 나타낸다는 것을 보여주었다. 막 분획과의 항온처리 전 정제된 [3H]GlcNAc-P-P-Und 및 [3H]GalNAc-P-P-Und의 크로마토그래피 이동은 도 7a 및 7d에 나타나 있다. 도 7b 및 7e에서 볼 수 있는 바와 같이, 당지질은 이. 콜라이 21546으로부터 수득된 막 분획과의 항온처리에 의해 영향을 받지 않는다. 그러나, Z3206을 발현하는 이. 콜라이 21546으로부터 수득된 막 분획과 상기 정제된 당지질의 항온처리는 [3H]GalNAc-P-P-Und로의 외인성 [3H]GlcNAc-P-P-Und의 전환(도 7c) 및 [3H]GlcNAc-P-P-Und로의 [3H]GalNAc-P-P-Und의 전환(도 7f)을 촉진한다. 이 결과는 GlcNAc-P-P-Und와 GalNAc-P-P-Und가 Z3206을 발현하는 이. 콜라이 균주에서 효소에 의해 상호전환될 수 있다는 것을 직접적으로 입증한다.
실시예 8: 이. 콜라이
Z3206
은 UDP-GlcNAc 4-에피머라제가 아니다.
Z3206이 UDP-GalNAc의 형성을 촉진할 수 있는지를 확인하기 위해, 캄필로박터 제주니로부터 수득된 N-글리코실화 기구를 이. 콜라이에서 발현시켰다. 이 레포터 시스템에서, 표적 단백질 AcrA의 글리코실화는 기능성 Gne UDP-Glc/UDP-GlcNAc 에피머라제(문헌[Bernatchez, S., Szymanski, C.M., Ishiyama, N., Li, J., Jarrell, H.C., Lau, P.C., Berghuis, A.M., Young, N.M., Wakarchuk, W.W. (2005) J. Biol. Chem. 280, 4792-4802])를 포함하는 pgl 좌위(문헌[Wacker, M., Linton, D., Hitchen, P.G., Nita-Lazar, M., Haslam, S.M., North, S.J., Panico, M., Morris, H.R., Dell, A., Wrenn, B.W., Aebi, M. (2002) Science 298, 1790-1793])의 존재에 의존한다. AcrA의 글리코실화는 pgl 클러스터가 gne의 결실을 함유하는 경우 상실된다(문헌[Linton, D., Dorrell, N., Hitchen, P.G., Amber, S., Karlyshev, A.V., Morris, H.R., Dell, A., Valvano, M.A., Aebi, M. and Wren, B.W. (2005) Mol. Microbiol. 55, 1695-1703]). AcrA(pWA2)를 Gne(pMLBAD:gne) 또는 Z3206(pMLBAD:Z3206)에 의해 보완된 pgl 좌위 Δ gne와 함께 발현시킴으로써 pgl 오페론 Δ gne의 존재 하에서 AcrA-글리코실화를 회복하는 Z3206의 능력을 조사하였다.
100 ㎕의 SDS 적재 완충제에 재현탁된 1 A600 유닛과 동등한 농도의 세포를 사용하는 면역검출 분석을 위해 전체 이. 콜라이 세포 추출물을 준비하였다(문헌[Laemmli, U. (1970) Nature 227, 680-685]). 10 ㎕의 분취액을 10% SDS-PAGE 상에 적재하였다. 이. 콜라이 세포의 주변 세포질 추출물을 라이소자임 처리로 준비하고(문헌[Feldman, M.F., Wacker, M., Hernandez, M., Hitchen, P.G., Marolda, C.L., Kowarik, M., Morris, H.R., Dell, A., Valvano, M.A., Aebi, M. (2005) Proc Natl Acad Sci USA 102, 3016-3021]), (0.2 A600 유닛의 세포에 상응하는) 10 ㎕의 최종 샘플을 SDS-PAGE로 분석하였다. 샘플을 니트로셀룰로스 막 상에 블롯팅한 후, 특정 항혈청으로 면역염색하였다(문헌[Aebi, M., Gassenhuber, J., Domdey, H., and te Heesen, S. (1996) Glycobiology 6, 439-444]). 항-AcrA(문헌[Wacker, M., Linton, D., Hitchen, P.G., Nita-Lazar, M., Haslam, S.M., North, S.J., Panico, M., Morris, H.R., Dell, A., Wrenn, B.W., Aebi, M. (2002) Science 298, 1790-1793]) 항체를 사용하였다. 항-토끼 IgG-HRP(바이오-라드(Bio-Rad))를 이차 항체로서 사용하였다. ECL(상표명) 웨스턴 블롯팅 검출 시약(아머샴 바이오사이언시스(Amersham Biosciences))을 사용하여 검출을 수행하였다.
도 8에 나타낸 바와 같이, 비글리코실화된 형태보다 더 느리게 이동하는 글리코실화된 단백질은 pgl 좌위 Δ gne를 발현하는 세포가 Gne에 의해 보완되었을 때에만 형성되었다(레인 2). Z3206은 레포터 당단백질의 글리코실화를 회복시킬 수 없었다(도 8, 레인 1). 따라서, Z3206은 Gne 의존적 글리코실화 시스템에서 AcrA의 글리코실화를 보완하지 않는다. Gne 및 막-회합된 Z3206의 발현은 면역검출에 의해 확인되었다.
실시예 9: 쉬겔라 플렉스네리 6 +/- Z3206 LPS의 분석
도 9에는 쉬겔라 플렉스네리 6 O-항원의 생합성에 필요한 유전자들 중 일부가 표시되어 있다: 뉴클레오타이드 당 전구체의 생합성을 위한 효소를 코딩하는 유전자; 글리코실트랜스퍼라제를 코딩하는 유전자; O-항원 가공 단백질을 코딩하는 유전자; 및 O-아세틸화를 책임지는 단백질을 코딩하는 유전자. O-항원의 구조는 문헌[Dmitriev, B.A., et al., Somatic Antigens of Shigella Eur JBiochem, 1979. 98: p. 8] 및 문헌[Liu B et al., Structure and genetics of Shigella O antigens FEMS Microbiology Review, 2008. 32: p. 27]의 연구자들에 의해 밝혀졌다.
쉬겔라 플렉스네리 6 O-항원의 생합성에 필요한 모든 유전자들을 확인하기 위해, 게놈 라이브러리를 구축하였다.
쉬겔라 플렉스네리 6 게놈 DNA의 클로닝 - 박테리아로부터 DNA를 단리하기 위한 프로토콜에 따라 마처레이-나겔 뉴클레오스핀(Macherey-Nagel NucleoSpin)(등록상표) 조직 키트를 사용하여 쉬겔라 플렉스네리 6 게놈 DNA를 단리하였다. 각각 2 ㎖의 5개 쉬겔라 플렉스네리 6 밤샘 배양물들로부터 DNA를 단리하고, 100 ㎕ 용출 완충제(5 mM 트라이스/HCl, pH 8.5)를 사용하여 최종 용출을 수행하였다. 용출된 분획을 모아 이소프로판올로 침전시키고, 최종 펠렛을 52 ㎕ TE 완충제에 재현탁시켰는데, 상기 TE 완충제의 총 부피는 카피컨트롤(CopyControl)(상표명) 포스미드(Fosmid) 라이브러리 제조 키트(에피센트레(EPICENTRE))에 의해 제공된 프로토콜에 따라 최종 복구 처리되었다. 최종 복구된 DNA를 상기 키트 프로토콜에 기재된 바와 같이 1 X TAE 완충제를 사용하는 1% 저융점 아가로스 겔 전기영동으로 정제하고, 회수하고 에탄올로 침전시켰다. 침전된 DNA의 재현탁을 7 ㎕ TE 완충제에서 수행하고, 현탁된 DNA 중 0.15 ㎕ DNA를 에피센트레 프로토콜에 따라 pCC1FOS(서열번호 27) 내로 연결시켰다. 프로토콜에 따라 연결 생성물을 파지 내로 팩키징하고, 팩키징된 파지를 파지 희석 완충제에서 1:1로 희석하고, 희석된 파지 중 10 ㎕의 파지를 사용하여 에피센트레에 의해 기재된 바와 같이 미리 성장된 100 ㎕ EPI300-T1 세포를 감염시켰다. 6개의 플레이트가 전체 쉬겔라 플렉스네리 6 게놈 라이브러리를 함유하도록 세포(110 ㎕)를 플레이트 당 약 100개 콜로니의 밀도로 6회 플레이팅하였다. 콜로니 블롯팅으로 플레이트를 현상하고, 양성/음성 콜로니를 웨스턴 블롯팅하고 은 염색하였다.
콜로니 블롯팅 - 콜로니 블롯을 위해, 니트로셀룰로스 막을 고체 아가 플레이트 상에 놓고, 제거하고, 1 X PBST로 3회 세척하고 동일한 방식으로 처리하였다. 막을 먼저 실온에서 10% 우유에서 1시간 동안 차단한 후, (PBST 중의) 2 ㎖ 1% 우유에서 항-VI형 항혈청(일차 항체)과 함께 실온에서 1시간 동안 항온처리하였다. PBST에서 각각 10분 동안 3회 세척한 후, 상기 막을 (PBST 중의) 2 ㎖ 1% 우유에서 염소-항-토끼 IgG(바이오-라드)에 접합된 1:20000 퍼록시데이즈(이차 항체)와 함께 실온에서 1시간 동안 항온처리하였다. PBST를 사용하여 (각각 10분 동안) 최종 3회 세척한 후, 상기 막을 수퍼시그날(SuperSignal)(등록상표) 웨스트 듀라 익스텐디드 듀레이션 서브스트레이트 키트(West Dura Extended Duration Substrate Kit)(써모 사이언티픽(Thermo Scientific))에 의해 제공된 루미놀과 퍼록사이드 완충제의 1:1 혼합물을 사용하여 UVP 케미 독 이미징 시스템(Chemi Doc Imaging System)에서 현상하였다.
쉬겔라 플렉스네리 6 게놈 라이브러리의 제조 후 쉬겔라 플렉스네리 6 항혈청과 반응하는 클론을 리우(Liu)와 그 동료들(Liu et al., 2008)에 의해 이미 서열분석된 영역(rmlB부터 wfbZ까지 걸쳐 있음)으로부터 연장하는 프라이머로 서열분석하였다(도 9). 프라이머 rmlB_rev 및 wfbZ_fwd(쉬겔라 플렉스네리 - Z3206)는 rmlB 및 wfbZ에서 어닐링되고, 각각 wcaM 및 hisI/F에 도달될 때까지(쉬겔라 플렉스네리 + Z3206) 상기 클론의 삽입물을 서열분석하는 데에 사용되었다(도 10).
O-항원 합성이 Z3206을 결여하는 클론에서 유지되는지(이로써 und-GalNAc로의 und-GlcNAc의 에피머화를 저해하는지)를 확립하기 위해, 2개의 플라스미드(서열번호 28 및 29)를 구축하고(도 10), 이. 콜라이 세포 내로 형질전환시키고 은 염색 및 웨스턴 블롯으로 분석하였다.
도 11에 나타낸 바와 같이, LPS는 이. 콜라이 세포 + 또는 - Z3206에서 생성된다. O-항원은 Z3206의 부재 하에서 생성될 수 있으나 보다 낮은 생성 수율로 생성될 수 있는데, 이것은 에피머라제(Z3206)의 부재 하에서 폴리사카라이드 생성의 효율이 보다 낮다는 것을 보여준다.
실시예 10: 쉬겔라 플렉스네리 6 +/- Z3206 LLO의 분석
C18 컬럼 크로마토그래피에 의한 운데카프레놀-PP-O 항원의 정제 - 쉬겔라 플렉스네리 항원 +/- Z3206을 발현하는 이. 콜라이 세포를 펠렛화하고, 50 ㎖의 0.9% NaCl로 1회 세척하고, 최종 펠렛을 밤새 동결건조하였다. 펠렛을 30 ㎖의 85 내지 95% 메탄올로 1회 세척하고, 10:10:3 클로로포름-메탄올-물(v/v/v)로 재추출하고, 물을 첨가하여 최종 비가 10:10:9(클로로포름:메탄올:물)가 되게 함으로써 추출물을 2-상 블라이(Bligh)/드와이어(Dyer) 시스템으로 전환시켰다. 상들을 원심분리로 분리하고, 상부 수상을 10 ㎖ 메탄올에 의해 상태조절되고 10 ㎖의 3:48:47(클로로포름:메탄올:물)에 의해 평형화된 C18 셉-팩(Sep-Pak) 카트리지 상에 각각 적재하였다. 적재 후, 카트리지를 10 ㎖의 3:48:47(클로로포름:메탄올:물)로 세척하고, 5 ㎖의 10:10:3(클로로포름:메탄올:물)로 용출하였다. C18 컬럼의 적재물, 유동 관통물, 세척물 및 용출물의 20개 OD 샘플들을 에펜도르프 컨센트레이터 플러스(Eppendorf Concentrator Plus)에서 건조하고, 250 ㎕ 메탄올로 세척하고, 재증발시키고 30 ㎕ ddH2O로 추가 3회 세척하였다.
당지질 가수분해 - 건조된 샘플을 2 ㎖ n-프로판올:2 M 트라이플루오로아세트산(1:1)에 용해시키고, 50℃로 15분 동안 가열하고 N2 하에서 건조될 때까지 증발시킴으로써 상기 C18 컬럼의 세척물로부터 수득된 당지질 샘플을 가수분해하였다.
2-아미노벤조에이트를 사용한 올리고사카라이드 표지 및 HPLC - 표지를 문헌[Bigge et al., 1995]에 따라 수행하고, 문헌[Merry et al., 2002]에 기재된 종이 디스크 방법을 이용하여 글리칸 제거를 수행하였다. 문헌[Royle et al., 2002]에 따라 글리코셉(GlycoSep)-N 정상 상 컬럼을 사용하되, 3 용매 시스템으로 변경된 HPLC를 이용하여 2-AB 표지된 글리칸의 분리를 수행하였다. 용매 A는 80% 아세토니트릴 중의 10 mM 암모늄 포르메이트(pH 4.4)이었다. 용매 B는 40% 아세토니트릴 중의 30 mM 암모늄 포르메이트(pH 4.4)이었다. 용매 C는 0.5% 포름산이었다. 컬럼 온도는 30℃이었고, 2-AB 표지된 글리칸은 형광(λex = 330 nm, λem = 420 nm)에 의해 검출되었다. 구배 조건은 0.4 ㎖/분의 유속으로 160분에 걸쳐 100% A 내지 100% B를 사용한 후, 유속을 1 ㎖/분까지 증가시키면서 2분에 걸쳐 100% B 내지 100% C를 사용하는 선형 구배이었다. 컬럼을 100% C로 5분 동안 세척하고, 2분에 걸쳐 100% A로 복귀시키고, 1 ㎖/분의 유속으로 100% A에서 15분 동안 런닝한 후, 상기 유속을 5분 동안 0.4 ㎖/분으로 복귀시킨다. 모든 샘플들을 물 중에서 주입하였다.
Z3206을 갖거나(서열번호 29) 갖지 않는(서열번호 28) 쉬겔라 플렉스네리 O-항원을 발현하는 플라스미드를 SCM3 세포 내로 형질전환시켰다(도 10). 후기 용출 부피에서의 흔적은 쉬겔라 플렉스네리 O-항원 +/- Z3206을 함유하는 2개의 샘플들의 곡선 사이의 차이를 보여준다(도 12). 이러한 용출 패턴의 차이는 환원 말단에서 상이한 모노사카라이드를 보유하는 상이한 올리고사카라이드 구조에 의해 설명될 수 있다: 에피머라제(Z3206)의 존재에 따라 GlcNAc 또는 GalNAc.
실시예
11: 쉬겔라
플렉스네리
6 +/-
Z3206
으로부터 생성된
생접합체의
제조 및 특징 규명에 의한
pglB
특이성의 분석
PglB가 환원 말단에서 GlcNAc를 갖는 올리고사카라이드(쉬겔라 플렉스네리 6 O-항원)를 담체 단백질 EPA로 전달할 수 있는지를 평가하기 위해, EPA(서열번호 25), PglB(서열번호 26) 및 쉬겔라 플렉스네리 6 O-항원 +/- Z3206(서열번호 29/서열번호 28)을 발현하는 이. 콜라이 세포로부터 수득된 니켈 정제된 추출물을 항-EPA 및 항-VI형 항체를 사용하는 웨스턴 블롯으로 분석하였다. 환원 말단에서 GalNAc를 갖거나 갖지 않는 쉬겔라 플렉스네리 6 O-항원은 항-EPA 및 항-VI형 항혈청에 의해 검출되는 바와 같이 PglB에 의해 EPA로 전달되었다(도 13).
O-항원은 여전히 생성되고 검출되지만 보다 낮은 생성 수율로 생성되고 검출되는데, 이것은 에피머라제의 부재 하에서의 폴리사카라이드 제조의 효율이 보다 낮다는 것을 보여준다.
본 발명이 그의 실시양태를 참조함으로써 구체적으로 제시되고 기재되어 있지만, 당업자는 특허청구범위에 의해 포괄되는 본 발명의 범위를 벗어나지 않으면서 상기 실시양태에 대한 형태 및 세부사항에서의 다양한 변화를 만들 수 있다는 것을 이해할 것이다. 본 발명의 범위 내에 포함되는, 당업자에게 의해 이해될 이러한 다양한 변화는 특히, 환원 말단에서 GalNAc를 갖는, 이. 콜라이 및 쉬겔라 플렉스네리로부터 수득된 글리칸 이외의 글리칸을 포함하는 N-글리코실화된 단백질 및 생접합체를 포함한다.
서열 목록
서열번호 1 - 이.
콜라이
O157
Z3206
의
뉴클레오타이드
서열
길이: 993
유형: DNA
유기체: 이. 콜라이 O157
서열:
서열번호 2 -
Z3206
의 아미노산 서열
길이: 331
유형: PRT
유기체: 이. 콜라이 O157
서열:
서열번호 3 - 이.
콜라이
O55
gne
의
뉴클레오타이드
서열
위치 AF461121_1 BCT 2002년 5월 2일
정의 (UDP-GlcNAc 4-에피머라제 Gne[에스케리치아 콜라이])
수탁번호 AAL67550
길이: 993
유형: DNA
유기체: 이. 콜라이 O55
서열:
서열번호 4 - 이.
콜라이
O55
UDP
-
GlcNAc
4-
에피머라제
Gne
의 아미노산 서열
위치 AF461121_1
정의 (UDP-GLcNAc 4-에피머라제 Gne[에스케리치아 콜라이])
수탁번호 AAL67550
길이: 331 aa 선형
유형: PRT
유기체: 이. 콜라이 O55
서열:
서열번호 5 - 이.
콜라이
O86
gne1
의
뉴클레오타이드
서열
위치 AAO37706 BCT 2005년 12월 6일
정의 UDP-GlcNAc C4-에피머라제[에스케리치아 콜라이 O86].
수탁번호 AAO37706
길이: 993
유형: DNA
유기체: 이. 콜라이 O86
서열:
서열번호 6 - 이.
콜라이
O86
UDP
-
GlcNAc
C4
-
에피머라제의
아미노 서열
위치 AAO37706
정의 UDP-GlcNAc C4-에피머라제[에스케리치아 콜라이 O86].
수탁번호 AAO37706
길이: 331 aa 선형
유형: PRT
유기체: 이. 콜라이 O86
서열:
서열번호 7 - 쉬겔라 보이디이
O18
gne
의
뉴클레오타이드
서열
위치 ACD09753 BCT 2008년 5월 5일
정의 UDP-N-아세틸클루코스아민 4-에피머라제[쉬겔라 보이디이 CDC 3083-94].
수탁번호 ACD09753
길이: 993
유형: DNA
유기체: 쉬겔라 보이디이 O18
서열:
서열번호 8 - 쉬겔라
보이디이
O18
UDP
-N-
아세틸클루코스아민
4-
에피머라제의
아미노산 서열
위치 ACD09753
정의 UDP-N-아세틸글루코스아민 4-에피머라제[쉬겔라 보이디이 CDC 3083-94].
수탁번호 ACD09753
길이: 331 aa 선형
유형: PRT
유기체: 쉬겔라 보이디이 O18
서열:
서열번호 9 - 살모넬라
엔테리카
O30
gne
의
뉴클레오타이드
서열
위치 AAV34516 BCT 2004년 10월 25일
정의 UDP-GlcNAc 4-에피머라제[살모넬라 엔테리카 아종 살라매 혈청형 그린사이드].
수탁번호 AAV34516
길이: 993
유형: DNA
유기체: 살모넬라 엔테리카 O30
서열:
서열번호 10 - 살모넬라
엔테리카
O30
UDP
-
GlcNAc
4-에피머라제
의
아미노산 서열
위치 AAV34516
정의 UDP-GlcNAc 4-에피머라제[살모넬라 엔테리카 아종 살라매 혈청형 그린사이드].
수탁번호 AAV34516
길이: 331 aa 선형
유형: PRT
유기체: 살모넬라 엔테리카 O30
서열:
서열번호 11 -
캄필로박터
제주니 gne의
뉴클레오타이드
서열
위치 YP_002344524 BCT 2010년 9월 14일
정의 UDP-GlcNAc/Glc 4-에피머라제[캄필로박터 제주니 아종 제주니
수탁번호 YP_002344524
길이: 987
유형: DNA
유기체: 캄필로박터 제주니
서열:
서열번호 12 -
캄필로박터
제주니
UDP
-
GlcNAc
/
Glc
4-
에피머라제의
아미노산 서열
위치 YP_002344524
정의 UDP-GlcNAc/Glc 4-에피머라제[캄필로박터 제주니 아종 제주니
수탁번호 YP_002344524
길이: 328 aa 선형
유형: PRT
유기체: 캄필로박터 제주니
서열:
서열번호 13 - 이.
콜라이
K12
galE
의
뉴클레오타이드
서열
위치 AP_001390 BCT 2010년 4월 30일
정의 UDP-갈락토스-4-에피머라제[에스케리치아 콜라이 균주 K-12 아균주 3110].
수탁번호 AP_001390
길이: 1,017
유형: DNA
유기체: 이. 콜라니 K12
서열:
서열번호 14 - 이.
콜라이
K12
UDP
-갈락토스-4-
에피머라제의
아미노산 서열
위치 AP_001390
정의 UDP-갈락토스-4-에피머라제[에스케리치아 콜라이 균주 K-12 아균주 3110].
수탁번호 AP_001390
길이: 338 aa 선형
유형: PRT
유기체: 이. 콜라이 K12
서열:
서열번호 15 - 이.
콜라이
O86
gne2
의
뉴클레오타이드
서열
위치 AAV85952 BCT 2005년 3월 27일
정의 Gne[에스케리치아 콜라이 O86].
수탁번호 AAV85952
길이: 1,020
유형: DNA
유기체: 이. 콜라이 O86
서열:
서열번호 16 - 이.
콜라이
O86
Gne
의 아미노산 서열
위치 AAV85952
정의 Gne[에스케리치아 콜라이 O86].
수탁번호 AAV85952
길이: 339 aa(gne2) 선형
유형: PRT
유기체: 이. 콜라이 O86
서열:
서열번호 17 -
Z3206
의 말단을 코딩하는 합성
올리고뉴클레오타이드
Z3206
-Fw(프
라이
머)의
뉴클레오타이드
서열(제한 부위에 밑줄침)
길이: 30
유형: DNA
서열번호 18 -
헤모글루티닌
태그(
HA
태그)를 갖는
Z3206
의 말단을 코딩하는 합성
올리고뉴클레오타이드
Z3206
-
RvHA
(
프라이머
)의
뉴클레오타이드
서열(제한 부위에
밑줄침)
길이: 60
유형: DNA
유기체:
서열:
서열번호 19 - 제한 부위에 밑줄친 합성
올리고뉴클레오타이드
gne
-Fw(
프라이머
)의
뉴클레오타이드
서열
길이: 29
유형: DNA
유기체:
서열번호 20 - 제한 부위에 밑줄친 합성
올리고뉴클레오타이드
gne
-RV(
프라이머
)의
뉴클레오타이드
서열
길이: 57
유형: DNA
유기체:
서열:
서열번호 21 -
NheI
제한 효소의 제한 부위를 포함하는
올리고뉴클레오타이
드의
뉴클레오타이드
서열
길이: 11
유형: DNA
유기체:
서열: AAAAAGCTAGC
서열번호 22 -
AscI
제한 효소의 제한 부위를 포함하는
올리고뉴클레오타이
드의
뉴클레오타이드
서열
길이: 8
유형: DNA
유기체:
서열: CCGCGCGG
서열번호 23 - C-말단
헤마글루티닌
태그를 갖는
Z3206
을 코딩하는 플라스미드
pMLBAD
:
Z3206
(이.
콜라이
O157
을 플라스미드에 삽입함)의
뉴클레오타이드
서열
정의 Z3206-pMLDAD*로 생성물의 결찰
특징 위치/정성자(qualifier)
CDS 2105..3098
/표지=Z3206
CDS 3098..3127
/표지=HA
길이: 7794 bp
유형: DNA 원형 UNA
서열:
서열번호 24 - C-말단
헤마글루티닌
태그로
Gne
를 코딩하는
pMLBAD
:gne(이 콜라이
O157
을 플라스미드에 삽입함)의
뉴클레오타이드
서열
위치 gne-pMLBAD
정의 pmlbad did(NcoI-XbaI)로 dig galE의 결찰
특징 위치/정성자
CDS 2097..3080
/표지=galE
CDS 3081..3107
/표지=HA
영역 3108..3110
/표지=정지
길이: 7776 bp
유형: DNA 원형 UNA
서열:
서열번호 25 - 단일 서열을 갖는
개질된
EPA
의 아미노산 서열
국제특허출원공개 제2009/104074호(서열번호 6)에 기재됨
유형: PRT
유기체: 인공
/주의="인공 서열: 합성 폴리펩타이드의 기술"
길이: 643
서열:
서열번호 26 -
PgIB
의 아미노산 서열
국제특허출원공개 제2009/104074호(서열번호 2)에 기재됨
길이: 722
유형: PRT
유기체: 캄필로박터 제주니
서열:
서열번호 27 -
pCC1FOS
공 플라스미드의
뉴클레오타이드
서열
위치 MCS 카세트를 가진 pCC1FOS
특징 위치/정성자
영역 230..256
/표지="pCC1/pEpiFOS fwd"
영역 311..330
/표지="T7 프로모터"
영역 보완(504..529)
/표지="pCC1pEpiFOS rv"
CDS 보완(805..529)
/표지=cat
CDS 1683..2030
/표지=redF
CDS 3425..4180
/표지=repE
CDS 4759..5934
/표지=parA
CDS 5934..6905
/표지=parB
기원
길이: 8171 bp
유형: DNA 원형 UNA
유기체: 인공
서열:
서열번호 28 -
pCC1FOS
절단(
pFOS
) 및
Z3206
없는 쉬겔라
플렉스네리
6 O-항원의
뉴클레오타이드
서열
위치 pFOS 절단 및 O-항원 절단(-Z3206)
정의 NheI 및 AscI를 갖는 galFNheI 및 wzzAscI로 증폭된 쉬겔라 플렉스네리 6 O-항원 클러스터로의 NheI 및 AscI를 갖는 MCS 카세트 절단을 갖는 전환된 pCC1FOS의 결찰
특징 위치/정성자
CDS 3..411
/표지='galF
CDS 784..1869
/표지=rmlB
CDS 1869..2768
/표지=rmlD
CDS 2826..3704
/표지=rmlA
CDS 3709..4266
/표지=rmlC
CDS 4263..5495
/표지=wzx
CDS 5551..6738
/표지=wzy
CDS 6755..7624
/표지=wfbY
CDS 7621..8454
/표지=wfbZ
CDS 8599..9965
/표지=gnd
CDS 10187..11380
/표지=ugd
CDS 보완(11446..12450)
/표지=uge
CDS 12802..12828
/표지=wzz'
영역 보완(12868..12887)
/표지="T7 프로모터"
영역 보완(12942..12968)
/표지="pCC1/pEpiFOS fwd"
CDS 보완(14460..15431)
/표지=parB
CDS 보완(15431..16606)
/표지=parA
CDS 보완(17185..17940)
/표지=repE
CDS 보완(19335..19682)
/표지=redF
CDS 19901..20560
/표지=cat
영역 20836..20861
/표지="pCC1pEpiFOS rv"
길이: 20982 bp
유형: DNA 원형 UNA
서열:
서열번호 29 -
pCC1FOS
절단(
pFOS
) 및
Z3206
을 갖는 쉬겔라
플렉스네리
6 O-항원의
뉴클레오타이드
서열
위치 pFOS 절단 및 O-항원 절단(Z3206+)
정의 NheI 및 AscI를 갖는 MCS 카세트 절단을 갖는 pCC1FOS로의 NheI 및 AscI를 갖는 Z3206Nhe 및 wzzAscI를 증폭된 전환된 쉬겔라 플렉스네리 6 O 항원 클러스터의 결찰
특징 위치/정성자
CDS 보완(370..396)
/표지=wzz'
CDS 748..1752
/표지=uge
CDS 보완(1818..3011)
/표지=ugd
CDS 보완(3233..4639)
/표지=gnd
CDS 보완(4744..5577)
/표지=wfbZ
CDS 보완(5574..6443)
/표지=wfbY
CDS 보완(6460..7647)
/표지=wzy
CDS 보완(7703..8935)
/표지=wzx
CDS 보완(8932..9489)
/표지=rmlC
CDS 보완(9494..10372)
/표지=rmlA
CDS 보완(10430..11329)
/표지=rmlD
CDS 보완(11329..12414)
/표지=rmlB
CDS 보완(12787..13680)
/표지=galF
CDS 보완(13912..14907)
/표지=Z3206
CDS 보완(15065..15097)
/표지='wcaM
CDS 보완(15525..16184)
/표지=cat
CDS 16403..16750
/표지=redF
CDS 18145..18900
/표지=repE
CDS 19479..20654
/표지=parA
CDS 20654..21625
/표지=parB
길이: 22887 bp
유형: DNA 원형 UNA
서열:
<110> GLYCOVAXYN AG
<120> BIOSYNTHETIC SYSTEM THAT PRODUCES IMMUNOGENIC POLYSACCHARIDES IN
PROKARYOTIC CELLS
<130> 031229.0005-WO01
<140> PCT/US2010/02980
<141> 2010-11-16
<150> US 61/272,931
<151> 2009-11-19
<160> 30
<170> PatentIn version 3.5
<210> 1
<211> 993
<212> DNA
<213> Escherichia coli
<400> 1
atgaacgata acgttttgct cataggagct tccggattcg taggaacccg actacttgaa 60
acggcaattg ctgactttaa tatcaagaac ctggacaaac agcagagcca cttttatcca 120
gaaatcacac agattggcga tgttcgcgat caacaggcac tcgaccaggc gttagtcggt 180
tttgacactg ttgtactact ggcagcggaa caccgcgatg acgtcagccc tacttctctc 240
tattatgatg tcaacgttca gggtacccgc aatgtgctgg cggccatgga aaaaaatggc 300
gttaaaaata tcatctttac cagttccgtt gctgtttatg gtttgaacaa acacaaccct 360
gacgaaaacc atccacacga ccctttcaac cactacggca aaagtaagtg gcaggcagag 420
gaagtgctgc gtgaatggta taacaaagca ccaacagaac gttcattaac catcatccgt 480
cctaccgtta tcttcggtga acgcaaccgc ggtaacgtct ataacttgct gaaacagatc 540
gctggcggca agtttatgat ggtgggcgca gggactaact ataagtccat ggcttatgtt 600
ggaaacattg ttgagtttat caagtacaaa ctgaagaatg ttgccgcagg ttatgaggtt 660
tataactacg ttgataagcc agacctgaac atgaaccagt tggttgctga agttgaacaa 720
agcctgaaca aaaagatccc ttctatgcac ttgccttacc cactaggaat gctgggtgga 780
tattgctttg atatcctgag caaaattacg ggcaaaaaat acgctgtcag ctcagtgcgc 840
gtgaaaaaat tctgcgcaac aacacagttt gacgcaacga aagtgcattc ttcaggtttt 900
gtggcaccgt atacgctgtc gcaaggtctg gatcgaacac tgcagtatga attcgttcat 960
gccaaaaaag acgacataac gtttgtttct gag 993
<210> 2
<211> 331
<212> PRT
<213> Escherichia coli
<400> 2
Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr
1 5 10 15
Arg Leu Leu Glu Thr Ala Ile Ala Asp Phe Asn Ile Lys Asn Leu Asp
20 25 30
Lys Gln Gln Ser His Phe Tyr Pro Glu Ile Thr Gln Ile Gly Asp Val
35 40 45
Arg Asp Gln Gln Ala Leu Asp Gln Ala Leu Val Gly Phe Asp Thr Val
50 55 60
Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu
65 70 75 80
Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met
85 90 95
Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val
100 105 110
Tyr Gly Leu Asn Lys His Asn Pro Asp Glu Asn His Pro His Asp Pro
115 120 125
Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg
130 135 140
Glu Trp Tyr Asn Lys Ala Pro Thr Glu Arg Ser Leu Thr Ile Ile Arg
145 150 155 160
Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu
165 170 175
Leu Lys Gln Ile Ala Gly Gly Lys Phe Met Met Val Gly Ala Gly Thr
180 185 190
Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys
195 200 205
Tyr Lys Leu Lys Asn Val Ala Ala Gly Tyr Glu Val Tyr Asn Tyr Val
210 215 220
Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln
225 230 235 240
Ser Leu Asn Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly
245 250 255
Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Ile Thr Gly Lys
260 265 270
Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr
275 280 285
Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr
290 295 300
Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His
305 310 315 320
Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu
325 330
<210> 3
<211> 993
<212> DNA
<213> Escherichia coli
<400> 3
atgaacgata acgttttgct cataggagct tccggattcg taggaacccg actacttgaa 60
acggcaattg ctgactttaa tatcaagaac ctggacaaac agcagagcca cttttatcca 120
gaaatcacac agattggtga tgttcgtgat caacaggcac tcgaccaggc gttagccggt 180
tttgacactg ttgtgctact ggcagcggaa caccgcgatg acgtcagccc tacttctctc 240
tattatgatg tcaacgttca gggtacccgc aatgtgctgg cggccatgga aaaaaatggc 300
gttaaaaata tcatctttac cagttccgtt gctgtttatg gtttgaacaa acacaaccct 360
gacgaaaacc atccacacga tcctttcaac cactacggca aaagtaagtg gcaggcagag 420
gaagtgctgc gtgaatggta taacaaagca ccaacagaac gttcattaac catcatccgt 480
cctaccgtta tcttcggtga acggaaccgc ggtaacgtct ataacttgct gaaacagatc 540
gctggcggca agtttatgat ggtgggcgca gggactaact ataagtccat ggcttatgtt 600
ggaaacattg ttgagtttat caagtacaaa ctgaagaatg ttgccgcagg ttacgaggtt 660
tataactacg ttgataagcc agacctgaac atgaaccagt tggttgctga agttgaacaa 720
agcctgaaca aaaagatccc ttctatgcac ttgccttacc cactaggaat gctgggtgga 780
tattgctttg atatcctgag caaaattacg ggcaaaaaat acgctgtcag ctctgtgcgc 840
gtgaaaaaat tctgcgcaac aacacagttt gacgcaacga aagtgcattc ttcaggtttt 900
gtggcaccgt atacgctgtc gcaaggtctg gatcgaactc tgcagtatga attcgtccat 960
gccaaaaaag acgacataac gtttgtttct gag 993
<210> 4
<211> 331
<212> PRT
<213> Escherichia coli
<400> 4
Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr
1 5 10 15
Arg Leu Leu Glu Thr Ala Ile Ala Asp Phe Asn Ile Lys Asn Leu Asp
20 25 30
Lys Gln Gln Ser His Phe Tyr Pro Glu Ile Thr Gln Ile Gly Asp Val
35 40 45
Arg Asp Gln Gln Ala Leu Asp Gln Ala Leu Ala Gly Phe Asp Thr Val
50 55 60
Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu
65 70 75 80
Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met
85 90 95
Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val
100 105 110
Tyr Gly Leu Asn Lys His Asn Pro Asp Glu Asn His Pro His Asp Pro
115 120 125
Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg
130 135 140
Glu Trp Tyr Asn Lys Ala Pro Thr Glu Arg Ser Leu Thr Ile Ile Arg
145 150 155 160
Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu
165 170 175
Leu Lys Gln Ile Ala Gly Gly Lys Phe Met Met Val Gly Ala Gly Thr
180 185 190
Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys
195 200 205
Tyr Lys Leu Lys Asn Val Ala Ala Gly Tyr Glu Val Tyr Asn Tyr Val
210 215 220
Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln
225 230 235 240
Ser Leu Asn Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly
245 250 255
Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Ile Thr Gly Lys
260 265 270
Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr
275 280 285
Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr
290 295 300
Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His
305 310 315 320
Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu
325 330
<210> 5
<211> 993
<212> DNA
<213> Escherichia coli
<400> 5
atgaacgata acgttttgct cataggagct tccggattcg taggaacccg actacttgaa 60
acggcaattg ctgactttaa tatcaagaac ctggacaaac agcagagcca cttttatcca 120
gaaatcacac agattggtga tgttcgtgat caacaggcac tcgaccaggc gttagccggt 180
tttgacactg ttgtactact ggcagcggaa caccgcgatg acgtcagccc tacttctctc 240
tattatgatg tcaacgttca gggtacccgc aatgtgctgg cggccatgga aaaaaatggc 300
gttaaaaata tcatctttac cagttccgtt gctgtttatg gtttgaacaa acacaaccct 360
gacgaaaacc atccacacga ccctttcaac cactacggca aaagcaagtg gcaggcggag 420
gaagtgctgc gtgaatggta taacaaagca ccaacagaac gttcattaac tatcatccgt 480
cctaccgtta tcttcggtga acgcaaccgc ggtaacgtct ataacttgct gaaacagatc 540
gctggcggca agtttatgat ggtgggcgca gggactaact ataagtccat ggcttatgtt 600
ggaaacattg ttgagtttat caagtacaaa ctgaagaatg ttgccgcagg ttacgaggtt 660
tataactacg ttgataagcc agacctgaac atgaaccagt tggttgctga agttgaacaa 720
agcctgaaca aaaagatccc ttctatgcac ttgccttacc cactaggaat gctgggtgga 780
tattgctttg atatcctgag caaaattacg ggcaaaaaat acgctgtcag ctctgtgcgc 840
gtgaaaaaat tctgcgcaac aacacagttt gacgcaacga aagtgcattc ttcaggtttt 900
gtggcaccgt atacgctgtc gcaaggtctg gatcgaactc tgcagtatga attcgtccat 960
gccaaaaaag acgacataac gtttgtttct gag 993
<210> 6
<211> 331
<212> PRT
<213> Escherichia coli
<400> 6
Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr
1 5 10 15
Arg Leu Leu Glu Thr Ala Ile Ala Asp Phe Asn Ile Lys Asn Leu Asp
20 25 30
Lys Gln Gln Ser His Phe Tyr Pro Glu Ile Thr Gln Ile Gly Asp Val
35 40 45
Arg Asp Gln Gln Ala Leu Asp Gln Ala Leu Ala Gly Phe Asp Thr Val
50 55 60
Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu
65 70 75 80
Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met
85 90 95
Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val
100 105 110
Tyr Gly Leu Asn Lys His Asn Pro Asp Glu Asn His Pro His Asp Pro
115 120 125
Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg
130 135 140
Glu Trp Tyr Asn Lys Ala Pro Thr Glu Arg Ser Leu Thr Ile Ile Arg
145 150 155 160
Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu
165 170 175
Leu Lys Gln Ile Ala Gly Gly Lys Phe Met Met Val Gly Ala Gly Thr
180 185 190
Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys
195 200 205
Tyr Lys Leu Lys Asn Val Ala Ala Gly Tyr Glu Val Tyr Asn Tyr Val
210 215 220
Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln
225 230 235 240
Ser Leu Asn Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly
245 250 255
Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Ile Thr Gly Lys
260 265 270
Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr
275 280 285
Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr
290 295 300
Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His
305 310 315 320
Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu
325 330
<210> 7
<211> 993
<212> DNA
<213> Shigella boydii
<400> 7
atgaacgata acgttttgct cataggagct tccggattcg taggaacccg actacttgaa 60
acggcaattg ctgactttaa tatcaagaac ctggacaaac agcagagcca tttttatcca 120
gcaatcacac agattggcga tgttcgtgat caacaggcac tcgaccaggc gttagccggt 180
tttgacactg ttgtactact ggcagcggaa caccgcgatg acgtcagccc tacttctctc 240
tattatgatg tcaacgttca gggtacccgc aatgtgctgg cggccatgga aaaaaatggc 300
gttaaaaata tcatctttac cagttccgtt gctgtttatg gtttgaacaa acacaaccct 360
gacgaaaacc atccacacga ccctttcaac cactacggca aaagtaagtg gcaggcagag 420
gaagtgctgc gtgaatggta taacaaagca ccaacagaac gttcattaac catcatccgt 480
cctaccgtta tcttcggtga acgcaaccgc ggtaacgtct ataacttgct gaaacagatc 540
gctggcggca agtttatgat ggtgggcgca gggactaact ataagtccat ggcttatgtt 600
ggaaacattg ttgagtttat caagtacaaa ctgaagaatg ttgccgcagg ttatgaggtt 660
tataactatg ttgataagcc agacctgaac atgaaccagt tggttgctga agttgaacaa 720
agcctgaaca aaaagatccc ttctatgcac ttgccttacc cactaggaat gctgggtgga 780
tattgctttg atatcctgag caaaattacg ggcaaaaaat acgctgtcag ctctgtgcgc 840
gtgaaaaaat tctgcgcaac aacacagttt gacgcaacga aagtgcattc ttcaggtttt 900
gtggcaccgt atacgctgtc gcaaggtctg gatcgaactc tgcagtatga attcgtccat 960
gccaaaaaag acgacataac gtttgtttct gag 993
<210> 8
<211> 331
<212> PRT
<213> Shigella boydii
<400> 8
Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr
1 5 10 15
Arg Leu Leu Glu Thr Ala Ile Ala Asp Phe Asn Ile Lys Asn Leu Asp
20 25 30
Lys Gln Gln Ser His Phe Tyr Pro Ala Ile Thr Gln Ile Gly Asp Val
35 40 45
Arg Asp Gln Gln Ala Leu Asp Gln Ala Leu Ala Gly Phe Asp Thr Val
50 55 60
Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu
65 70 75 80
Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met
85 90 95
Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val
100 105 110
Tyr Gly Leu Asn Lys His Asn Pro Asp Glu Asn His Pro His Asp Pro
115 120 125
Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg
130 135 140
Glu Trp Tyr Asn Lys Ala Pro Thr Glu Arg Ser Leu Thr Ile Ile Arg
145 150 155 160
Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu
165 170 175
Leu Lys Gln Ile Ala Gly Gly Lys Phe Met Met Val Gly Ala Gly Thr
180 185 190
Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys
195 200 205
Tyr Lys Leu Lys Asn Val Ala Ala Gly Tyr Glu Val Tyr Asn Tyr Val
210 215 220
Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln
225 230 235 240
Ser Leu Asn Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly
245 250 255
Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Ile Thr Gly Lys
260 265 270
Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr
275 280 285
Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr
290 295 300
Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His
305 310 315 320
Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu
325 330
<210> 9
<211> 993
<212> DNA
<213> Salmonella enterica
<400> 9
atgaacgata acgttttgct cattggtgct tccggattcg taggaacccg actccttgaa 60
acggcagtgg atgattttaa tatcaagaac ctggataaac agcaaagcca tttctaccca 120
gagattacac acattggcga tgttcgtgac caacaaatcc ttgaccagac gttggtgggt 180
tttgacaccg tagtactatt ggctgcggag catcgtgatg atgttagtcc tacctcgctt 240
tattatgatg tcaacgtcca gggaacgcgt aatgtactgg cggcgatgga aaaaaatggt 300
gtaaaaaata tcatttttac cagttccgtt gcagtttatg gactcaacaa gaaaaatcct 360
gacgaaacgc accctcacga tccctttaat cattacggaa aaagtaaatg gcaagcagaa 420
gaagttctgc gtgagtggca tgctaaagcg ccgaatgagc gttctttgac cataattcgt 480
cctaccgtta ttttcgggga gcgtaaccgc ggtaatgtat acaatctctt gaaacagatc 540
gctggtggta aatttgcgat ggttggtccg ggaactaact ataaatcaat ggcttatgtt 600
ggtaatatcg ttgagtttat caaattcaaa ctcaagaatg ttacggcggg ctatgaagtt 660
tataattatg ttgataaacc tgatctgaat atgaatcaat tggttgctga agtagagcag 720
agcctgggca aaaaaatacc atcgatgcac cttccatatc cattaggtat gctggggggt 780
tactgtttcg atatcctgag caaagtaacg ggcaagaagt acgctgtaag ttcggttcgt 840
gttaaaaaat tctgtgcgac aacgcagttt gatgcaacaa aagtgcattc ttctggtttt 900
gttgcgccat acaccttatc tcaggggttg gatcgtacac tgcaatatga atttgttcat 960
gcaaagaaag atgacattac attcgtttca gag 993
<210> 10
<211> 331
<212> PRT
<213> Salmonella enterica
<400> 10
Met Asn Asp Asn Val Leu Leu Ile Gly Ala Ser Gly Phe Val Gly Thr
1 5 10 15
Arg Leu Leu Glu Thr Ala Val Asp Asp Phe Asn Ile Lys Asn Leu Asp
20 25 30
Lys Gln Gln Ser His Phe Tyr Pro Glu Ile Thr His Ile Gly Asp Val
35 40 45
Arg Asp Gln Gln Ile Leu Asp Gln Thr Leu Val Gly Phe Asp Thr Val
50 55 60
Val Leu Leu Ala Ala Glu His Arg Asp Asp Val Ser Pro Thr Ser Leu
65 70 75 80
Tyr Tyr Asp Val Asn Val Gln Gly Thr Arg Asn Val Leu Ala Ala Met
85 90 95
Glu Lys Asn Gly Val Lys Asn Ile Ile Phe Thr Ser Ser Val Ala Val
100 105 110
Tyr Gly Leu Asn Lys Lys Asn Pro Asp Glu Thr His Pro His Asp Pro
115 120 125
Phe Asn His Tyr Gly Lys Ser Lys Trp Gln Ala Glu Glu Val Leu Arg
130 135 140
Glu Trp His Ala Lys Ala Pro Asn Glu Arg Ser Leu Thr Ile Ile Arg
145 150 155 160
Pro Thr Val Ile Phe Gly Glu Arg Asn Arg Gly Asn Val Tyr Asn Leu
165 170 175
Leu Lys Gln Ile Ala Gly Gly Lys Phe Ala Met Val Gly Pro Gly Thr
180 185 190
Asn Tyr Lys Ser Met Ala Tyr Val Gly Asn Ile Val Glu Phe Ile Lys
195 200 205
Phe Lys Leu Lys Asn Val Thr Ala Gly Tyr Glu Val Tyr Asn Tyr Val
210 215 220
Asp Lys Pro Asp Leu Asn Met Asn Gln Leu Val Ala Glu Val Glu Gln
225 230 235 240
Ser Leu Gly Lys Lys Ile Pro Ser Met His Leu Pro Tyr Pro Leu Gly
245 250 255
Met Leu Gly Gly Tyr Cys Phe Asp Ile Leu Ser Lys Val Thr Gly Lys
260 265 270
Lys Tyr Ala Val Ser Ser Val Arg Val Lys Lys Phe Cys Ala Thr Thr
275 280 285
Gln Phe Asp Ala Thr Lys Val His Ser Ser Gly Phe Val Ala Pro Tyr
290 295 300
Thr Leu Ser Gln Gly Leu Asp Arg Thr Leu Gln Tyr Glu Phe Val His
305 310 315 320
Ala Lys Lys Asp Asp Ile Thr Phe Val Ser Glu
325 330
<210> 11
<211> 987
<212> DNA
<213> Campylobacter jejuni
<400> 11
atgaaaattc ttattagcgg tggtgcaggt tatataggtt ctcatacttt aagacaattt 60
ttaaaaacag atcatgaaat ttgtgtttta gataatcttt ctaagggttc taaaatcgca 120
atagaagatt tgcaaaaaac aagagctttt aaatttttcg aacaagattt aagtgatttt 180
caaggcgtaa aagcattgtt tgagagagaa aaatttgacg ctattgtgca ttttgcagca 240
agcattgaag tttttgaaag tatgcaaaat cctttaaaat attatatgaa caacactgtt 300
aatacgacaa atctcatcga aacttgtttg caaactggag tgaataaatt tatattttct 360
tcaacggcgg ccacttatgg cgaaccacaa actcccgttg tgagcgaaac aagtccttta 420
gcacctatta atccttatgg gcgtagtaag cttatgagtg aagaagtttt gcgtgatgca 480
agtatggcaa atcctgaatt taagcattgt attttaagat attttaatgt tgcaggtgct 540
tgtatggatt atactttagg acaacgctat ccaaaagcga ctttgcttat aaaagttgca 600
gctgaatgtg ccgcaggaaa acgtgataaa cttttcatat ttggcgatga ttatgataca 660
aaagatggta cttgcataag agattttatc catgtagatg atatttcaag tgcacattta 720
gcggctttgg attatttaaa agagaatgaa agcaatgttt ttaatgtagg ttatggacat 780
ggttttagcg taaaagaagt gattgaagcg atgaaaaaag ttagcggagt ggattttaaa 840
gtagaacttg ccccacgccg tgcgggtgat cctagtgtat tgatttctga tgcaagtaaa 900
atcagaaatc ttacttcttg gcagcctaaa tatgatgatt tagagcttat ttgtaaatct 960
gcttttgatt gggaaaaaca gtgttaa 987
<210> 12
<211> 328
<212> PRT
<213> Campylobacter jejuni
<400> 12
Met Lys Ile Leu Ile Ser Gly Gly Ala Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Leu Arg Gln Phe Leu Lys Thr Asp His Glu Ile Cys Val Leu Asp Asn
20 25 30
Leu Ser Lys Gly Ser Lys Ile Ala Ile Glu Asp Leu Gln Lys Thr Arg
35 40 45
Ala Phe Lys Phe Phe Glu Gln Asp Leu Ser Asp Phe Gln Gly Val Lys
50 55 60
Ala Leu Phe Glu Arg Glu Lys Phe Asp Ala Ile Val His Phe Ala Ala
65 70 75 80
Ser Ile Glu Val Phe Glu Ser Met Gln Asn Pro Leu Lys Tyr Tyr Met
85 90 95
Asn Asn Thr Val Asn Thr Thr Asn Leu Ile Glu Thr Cys Leu Gln Thr
100 105 110
Gly Val Asn Lys Phe Ile Phe Ser Ser Thr Ala Ala Thr Tyr Gly Glu
115 120 125
Pro Gln Thr Pro Val Val Ser Glu Thr Ser Pro Leu Ala Pro Ile Asn
130 135 140
Pro Tyr Gly Arg Ser Lys Leu Met Ser Glu Glu Val Leu Arg Asp Ala
145 150 155 160
Ser Met Ala Asn Pro Glu Phe Lys His Cys Ile Leu Arg Tyr Phe Asn
165 170 175
Val Ala Gly Ala Cys Met Asp Tyr Thr Leu Gly Gln Arg Tyr Pro Lys
180 185 190
Ala Thr Leu Leu Ile Lys Val Ala Ala Glu Cys Ala Ala Gly Lys Arg
195 200 205
Asp Lys Leu Phe Ile Phe Gly Asp Asp Tyr Asp Thr Lys Asp Gly Thr
210 215 220
Cys Ile Arg Asp Phe Ile His Val Asp Asp Ile Ser Ser Ala His Leu
225 230 235 240
Ala Ala Leu Asp Tyr Leu Lys Glu Asn Glu Ser Asn Val Phe Asn Val
245 250 255
Gly Tyr Gly His Gly Phe Ser Val Lys Glu Val Ile Glu Ala Met Lys
260 265 270
Lys Val Ser Gly Val Asp Phe Lys Val Glu Leu Ala Pro Arg Arg Ala
275 280 285
Gly Asp Pro Ser Val Leu Ile Ser Asp Ala Ser Lys Ile Arg Asn Leu
290 295 300
Thr Ser Trp Gln Pro Lys Tyr Asp Asp Leu Glu Leu Ile Cys Lys Ser
305 310 315 320
Ala Phe Asp Trp Glu Lys Gln Cys
325
<210> 13
<211> 1017
<212> DNA
<213> Escherichia coli
<400> 13
atgagagttc tggttaccgg tggtagcggt tacattggaa gtcatacctg tgtgcaatta 60
ctgcaaaacg gtcatgatgt catcattctt gataacctct gtaacagtaa gcgcagcgta 120
ctgcctgtta tcgagcgttt aggcggcaaa catccaacgt ttgttgaagg cgatattcgt 180
aacgaagcgt tgatgaccga gatcctgcac gatcacgcta tcgacaccgt gatccacttc 240
gccgggctga aagccgtggg cgaatcggta caaaaaccgc tggaatatta cgacaacaat 300
gtcaacggca ctctgcgcct gattagcgcc atgcgcgccg ctaacgtcaa aaactttatt 360
tttagctcct ccgccaccgt ttatggcgat cagcccaaaa ttccatacgt tgaaagcttc 420
ccgaccggca caccgcaaag cccttacggc aaaagcaagc tgatggtgga acagatcctc 480
accgatctgc aaaaagccca gccggactgg agcattgccc tgctgcgcta cttcaacccg 540
gttggcgcgc atccgtcggg cgatatgggc gaagatccgc aaggcattcc gaataacctg 600
atgccataca tcgcccaggt tgctgtaggc cgtcgcgact cgctggcgat ttttggtaac 660
gattatccga ccgaagatgg tactggcgta cgcgattaca tccacgtaat ggatctggcg 720
gacggtcacg tcgtggcgat ggaaaaactg gcgaacaagc caggcgtaca catctacaac 780
ctcggcgctg gcgtaggcaa cagcgtgctg gacgtggtta atgccttcag caaagcctgc 840
ggcaaaccgg ttaattatca ttttgcaccg cgtcgcgagg gcgaccttcc ggcctactgg 900
gcggacgcca gcaaagccga ccgtgaactg aactggcgcg taacgcgcac actcgatgaa 960
atggcgcagg acacctggca ctggcagtca cgccatccac agggatatcc cgattaa 1017
<210> 14
<211> 338
<212> PRT
<213> Escherichia coli
<400> 14
Met Arg Val Leu Val Thr Gly Gly Ser Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Cys Val Gln Leu Leu Gln Asn Gly His Asp Val Ile Ile Leu Asp Asn
20 25 30
Leu Cys Asn Ser Lys Arg Ser Val Leu Pro Val Ile Glu Arg Leu Gly
35 40 45
Gly Lys His Pro Thr Phe Val Glu Gly Asp Ile Arg Asn Glu Ala Leu
50 55 60
Met Thr Glu Ile Leu His Asp His Ala Ile Asp Thr Val Ile His Phe
65 70 75 80
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Glu Tyr
85 90 95
Tyr Asp Asn Asn Val Asn Gly Thr Leu Arg Leu Ile Ser Ala Met Arg
100 105 110
Ala Ala Asn Val Lys Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Asp Gln Pro Lys Ile Pro Tyr Val Glu Ser Phe Pro Thr Gly Thr
130 135 140
Pro Gln Ser Pro Tyr Gly Lys Ser Lys Leu Met Val Glu Gln Ile Leu
145 150 155 160
Thr Asp Leu Gln Lys Ala Gln Pro Asp Trp Ser Ile Ala Leu Leu Arg
165 170 175
Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Asp Met Gly Glu Asp
180 185 190
Pro Gln Gly Ile Pro Asn Asn Leu Met Pro Tyr Ile Ala Gln Val Ala
195 200 205
Val Gly Arg Arg Asp Ser Leu Ala Ile Phe Gly Asn Asp Tyr Pro Thr
210 215 220
Glu Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala
225 230 235 240
Asp Gly His Val Val Ala Met Glu Lys Leu Ala Asn Lys Pro Gly Val
245 250 255
His Ile Tyr Asn Leu Gly Ala Gly Val Gly Asn Ser Val Leu Asp Val
260 265 270
Val Asn Ala Phe Ser Lys Ala Cys Gly Lys Pro Val Asn Tyr His Phe
275 280 285
Ala Pro Arg Arg Glu Gly Asp Leu Pro Ala Tyr Trp Ala Asp Ala Ser
290 295 300
Lys Ala Asp Arg Glu Leu Asn Trp Arg Val Thr Arg Thr Leu Asp Glu
305 310 315 320
Met Ala Gln Asp Thr Trp His Trp Gln Ser Arg His Pro Gln Gly Tyr
325 330 335
Pro Asp
<210> 15
<211> 1020
<212> DNA
<213> Escherichia coli
<400> 15
atggtgattt tcgtaacagg cggtgcagga tatattggat cccataccat acttgagtta 60
cttaataatg gtcatgatgt cgtttcgata gataattttg tcaattcctc tatagaatca 120
ttaaaaagag tagagcaaat aactaataag aaaattattt cttatcaagg tgatatccgt 180
gataaaaatc tacttgatga gattttttca agacaccata tcgatgctgt aattcacttt 240
gcatcgttaa aatctgtagg tgagtctaag ttaaagccct tagagtatta ttctaataat 300
gttggtggaa ctttagtatt acttgaatgc atgaagagat ataacattaa taaaatgata 360
tttagctctt ctgctactgt ttatgggagt aacagtatcc ctccccatac ggaagataga 420
cgaattggtg aaactacaaa cccatatggg acatcgaaat ttataataga aataattttg 480
agtgattatt gtgatagtga taataataaa tcagtaattg cactgcgtta ctttaatcca 540
atcggagcac ataagtccgg gatgattggt gaaaatccta acgggatccc taataatctg 600
gttccttata tatctaaagt tgcacaaaat caacttcctg tattaaatat ttatggcaac 660
gattatccaa ctaaagatgg tacaggagta agagactata tacatgtctg tgatttggct 720
aaagggcatg ttaaagcatt agaatatatg tttttaaatg atgtcaatta tgaagctttt 780
aatttaggta ctggtcaagg ttattctgtt ttagagattg taaaaatgtt tgagatagtc 840
actaaaaaga gtatacctgt tgctatttgt aatagacgtg agggggatgt tgcggagtca 900
tgggcgtctg ctgatttggc acataaaaag ctttcctgga aagcggaaaa aaatttgaaa 960
gaaatgatcg aagatgtatg gcgttggcaa acaaacaatc caaatggata taaaaaataa 1020
<210> 16
<211> 339
<212> PRT
<213> Escherichia coli
<400> 16
Met Val Ile Phe Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Ile Leu Glu Leu Leu Asn Asn Gly His Asp Val Val Ser Ile Asp Asn
20 25 30
Phe Val Asn Ser Ser Ile Glu Ser Leu Lys Arg Val Glu Gln Ile Thr
35 40 45
Asn Lys Lys Ile Ile Ser Tyr Gln Gly Asp Ile Arg Asp Lys Asn Leu
50 55 60
Leu Asp Glu Ile Phe Ser Arg His His Ile Asp Ala Val Ile His Phe
65 70 75 80
Ala Ser Leu Lys Ser Val Gly Glu Ser Lys Leu Lys Pro Leu Glu Tyr
85 90 95
Tyr Ser Asn Asn Val Gly Gly Thr Leu Val Leu Leu Glu Cys Met Lys
100 105 110
Arg Tyr Asn Ile Asn Lys Met Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Ser Asn Ser Ile Pro Pro His Thr Glu Asp Arg Arg Ile Gly Glu
130 135 140
Thr Thr Asn Pro Tyr Gly Thr Ser Lys Phe Ile Ile Glu Ile Ile Leu
145 150 155 160
Ser Asp Tyr Cys Asp Ser Asp Asn Asn Lys Ser Val Ile Ala Leu Arg
165 170 175
Tyr Phe Asn Pro Ile Gly Ala His Lys Ser Gly Met Ile Gly Glu Asn
180 185 190
Pro Asn Gly Ile Pro Asn Asn Leu Val Pro Tyr Ile Ser Lys Val Ala
195 200 205
Gln Asn Gln Leu Pro Val Leu Asn Ile Tyr Gly Asn Asp Tyr Pro Thr
210 215 220
Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Cys Asp Leu Ala
225 230 235 240
Lys Gly His Val Lys Ala Leu Glu Tyr Met Phe Leu Asn Asp Val Asn
245 250 255
Tyr Glu Ala Phe Asn Leu Gly Thr Gly Gln Gly Tyr Ser Val Leu Glu
260 265 270
Ile Val Lys Met Phe Glu Ile Val Thr Lys Lys Ser Ile Pro Val Ala
275 280 285
Ile Cys Asn Arg Arg Glu Gly Asp Val Ala Glu Ser Trp Ala Ser Ala
290 295 300
Asp Leu Ala His Lys Lys Leu Ser Trp Lys Ala Glu Lys Asn Leu Lys
305 310 315 320
Glu Met Ile Glu Asp Val Trp Arg Trp Gln Thr Asn Asn Pro Asn Gly
325 330 335
Tyr Lys Lys
<210> 17
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 17
aaacccggga tgaacgataa cgttttgctc 30
<210> 18
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 18
aaatctagat taagcgtaat ctggaacatc gtatgggtac tcagaaacaa acgttatgtc 60
<210> 19
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 19
aaaccatgga tgaaaattct tattagcgg 29
<210> 20
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 20
aaatctagat taagcgtaat ctggaacatc gtatgggtag cactgttttt cccaatc 57
<210> 21
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 21
aaaaagctag c 11
<210> 22
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 22
ccgcgcgg 8
<210> 23
<211> 7794
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 23
tctacggggt ctgacgctca gtggaacgaa atcgatgagc tcgcacgaac ccagttgaca 60
taagcctgtt cggttcgtaa actgtaatgc aagtagcgta tgcgctcacg caactggtcc 120
agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttgttat 180
gactgttttt ttgtacagtc tagcctcggg catccaagct agctaagcgc gttacgccgt 240
gggtcgatgt ttgatgttat ggaacagcaa cgatgttacg cagcagggta gtcgccctaa 300
aacaaagtta ggcagccgtt gtgctggtgc tttctagtag ttgttgtggg gtaggcagtc 360
agagctcgat ttgcttgtcg ccataataga ttcacaagaa ggattcgaca tgggtcaaag 420
tagcgatgaa gccaacgctc ccgttgcagg gcagtttgcg cttcccctga gtgccacctt 480
tggcttaggg gatcgcgtac gcaagaaatc tggtgccgct tggcagggtc aagtcgtcgg 540
ttggtattgc acaaaactca ctcctgaagg ctatgcggtc gagtccgaat cccacccagg 600
ctcagtgcaa atttatcctg tggctgcact tgaacgtgtg gcctaagcga tatcttagga 660
tctcccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat 720
gccggccacg atgcgtccgg cgtagaggat ctgctcatgt ttgacagctt atcatcgatg 780
cataatgtgc ctgtcaaatg gacgaagcag ggattctgca aaccctatgc tactccgtca 840
agccgtcaat tgtctgattc gttaccaatt atgacaactt gacggctaca tcattcactt 900
tttcttcaca accggcacgg aactcgctcg ggctggcccc ggtgcatttt ttaaataccc 960
gcgagaaata gagttgatcg tcaaaaccaa cattgcgacc gacggtggcg ataggcatcc 1020
gggtggtgct caaaagcagc ttcgcctggc tgatacgttg gtcctcgcgc cagcttaaga 1080
cgctaatccc taactgctgg cggaaaagat gtgacagacg cgacggcgac aagcaaacat 1140
gctgtgcgac gctggcgata tcaaaattgc tgtctgccag gtgatcgctg atgtactgac 1200
aagcctcgcg tacccgatta tccatcggtg gatggagcga ctcgttaatc gcttccatgc 1260
gccgcagtaa caattgctca agcagattta tcgccagcag ctccgaatag cgcccttccc 1320
cttgcccggc gttaatgatt tgcccaaaca ggtcgctgaa atgcggctgg tgcgcttcat 1380
ccgggcgaaa gaaccccgta ttggcaaata ttgacggcca gttaagccat tcatgccagt 1440
aggcgcgcgg acgaaagtaa acccactggt gataccattc gcgagcctcc ggatgacgac 1500
cgtagtgatg aatctctcct ggcgggaaca gcaaaatatc acccggtcgg caaacaaatt 1560
ctcgtccctg atttttcacc accccctgac cgcgaatggt gagattgaga atataacctt 1620
tcattcccag cggtcggtcg ataaaaaaat cgagataacc gttggcctca atcggcgtta 1680
aacccgccac cagatgggca ttaaacgagt atcccggcag caggggatca ttttgcgctt 1740
cagccatact tttcatactc ccgccattca gagaagaaac caattgtcca tattgcatca 1800
gacattgccg tcactgcgtc ttttactggc tcttctcgct aaccaaaccg gtaaccccgc 1860
ttattaaaag cattctgtaa caaagcggga ccaaagccat gacaaaaacg cgtaacaaaa 1920
gtgtctataa tcacggcaga aaagtccaca ttgattattt gcacggcgtc acactttgct 1980
atgccatagc atttttatcc ataagattag cggatcctac ctgacgcttt ttatcgcaac 2040
tctctactgt ttctccatac ccgttttttt gggctagcag gaggaattca ccatggtacc 2100
cgggatgaac gataacgttt tgctcatagg agcttccgga ttcgtaggaa cccgactact 2160
tgaaacggca attgctgact ttaatatcaa gaacctggac aaacagcaga gccactttta 2220
tccagaaatc acacagattg gcgatgttcg cgatcaacag gcactcgacc aggcgttagt 2280
cggttttgac actgttgtac tactggcagc ggaacaccgc gatgacgtca gccctacttc 2340
tctctattat gatgtcaacg ttcagggtac ccgcaatgtg ctggcggcca tggaaaaaaa 2400
tggcgttaaa aatatcatct ttaccagttc cgttgctgtt tatggtttga acaaacacaa 2460
ccctgacgaa aaccatccac acgacccttt caaccactac ggcaaaagta agtggcaggc 2520
agaggaagtg ctgcgtgaat ggtataacaa agcaccaaca gaacgttcat taaccatcat 2580
ccgtcctacc gttatcttcg gtgaacgcaa ccgcggtaac gtctataact tgctgaaaca 2640
gatcgctggc ggcaagttta tgatggtggg cgcagggact aactataagt ccatggctta 2700
tgttggaaac attgttgagt ttatcaagta caaactgaag aatgttgccg caggttatga 2760
ggtttataac tacgttgata agccagacct gaacatgaac cagttggttg ctgaagttga 2820
acaaagcctg aacaaaaaga tcccttctat gcacttgcct tacccactag gaatgctggg 2880
tggatattgc tttgatatcc tgagcaaaat tacgggcaaa aaatacgctg tcagctcagt 2940
gcgcgtgaaa aaattctgcg caacaacaca gtttgacgca acgaaagtgc attcttcagg 3000
ttttgtggca ccgtatacgc tgtcgcaagg tctggatcga acactgcagt atgaattcgt 3060
tcatgccaaa aaagacgaca taacgtttgt ttctgagtac ccatacgatg ttccagatta 3120
cgcttaatct agagtcgacc tgcaggcatg caagcttggc tgttttggcg gatgagagaa 3180
gattttcagc ctgatacaga ttaaatcaga acgcagaagc ggtctgataa aacagaattt 3240
gcctggcggc agtagcgcgg tggtcccacc tgaccccatg ccgaactcag aagtgaaacg 3300
ccgtagcgcc gatggtagtg tggggtctcc ccatgcgaga gtagggaact gccaggcatc 3360
aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg 3420
tgaacgctct cctgagtagg acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac 3480
ggcccggagg gtggcgggca ggacgcccgc cataaactgc caggcatcaa attaagcaga 3540
aggccatcct gacggatggc ctttttgcgt ttctacaaac tcttccactc actacagcag 3600
agccatttaa acaacatccc ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc 3660
tacgggcttt ttcatgccct gccctagcgt ccaagcctca cggccgcgct cggcctctct 3720
ggcggccttc tggcgctgag gtctgcctcg tgaagaaggt gttgctgact cataccaggc 3780
ctgaatcgcc ccatcatcca gccagaaagt gagggagcca cggttgatga gagctttgtt 3840
gtaggtggac cagttggtga ttttgaactt ttgctttgcc acggaacggt ctgcgttgtc 3900
gggaagatgc gtgatctgat ccttcaactc agcaaaagtt cgatttattc aacaaagccg 3960
ccgtcccgtc aagtcagcgt aatgctctgc cagtgttaca accaattaac caattctgat 4020
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 4080
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 4140
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 4200
attaatttcc cctcgtcaaa aataaggtta tcaagcgaga aatcaccatg agtgacgact 4260
gaatccggtg agaatggcaa aagctaaaaa ggccgtaata tccagctgaa cggtctggtt 4320
ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 4380
tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 4440
aaatctcgat aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt 4500
ggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc 4560
ggtatcaaca gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat 4620
ttattcgaag acgaaagggc ctcgtgatac gcctattttt ataggttaat gtcatgataa 4680
taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgcc cgcgttcctg 4740
ctggcgctgg gcctgtttct ggcgctggac ttcccgctgt tccgtcagca gcttttcgcc 4800
cacggccttg atgatcgcgg cggccttggc ctgcatatcc cgattcaacg gccccagggc 4860
gtccagaacg ggcttcaggc gctcccgaag gtctcgggcc gtctcttggg cttgatcggc 4920
cttcttgcgc atctcacgcg ctcctgcggc ggcctgtagg gcaggctcat acccctgccg 4980
aaccgctttt gtcagccggt cggccacggc ttccggcgtc tcaacgcgct ttgagattcc 5040
cagcttttcg gccaatccct gcggtgcata ggcgcgtggc tcgaccgctt gcgggctgat 5100
ggtgacgtgg cccactggtg gccgctccag ggcctcgtag aacgcctgaa tgcgcgtgtg 5160
acgtgccttg ctgccctcga tgccccgttg cagccctaga tcggccacag cggccgcaaa 5220
cgtggtctgg tcgcgggtca tctgcgcttt gttgccgatg aactccttgg ccgacagcct 5280
gccgtcctgc gtcagcggca ccacgaacgc ggtcatgtgc gggctggttt cgtcacggtg 5340
gatgctggcc gtcacgatgc gatccgcccc gtacttgtcc gccagccact tgtgcgcctt 5400
ctcgaagaac gccgcctgct gttcttggct ggccgacttc caccattccg ggctggccgt 5460
catgacgtac tcgaccgcca acacagcgtc cttgcgccgc ttctctggca gcaactcgcg 5520
cagtcggccc atcgcttcat cggtgctgct ggccgcccag tgctcgttct ctggcgtcct 5580
gctggcgtca gcgttgggcg tctcgcgctc gcggtaggcg tgcttgagac tggccgccac 5640
gttgcccatt ttcgccagct tcttgcatcg catgatcgcg tatgccgcca tgcctgcccc 5700
tcccttttgg tgtccaaccg gctcgacggg ggcagcgcaa ggcggtgcct ccggcgggcc 5760
actcaatgct tgagtatact cactagactt tgcttcgcaa agtcgtgacc gcctacggcg 5820
gctgcggcgc cctacgggct tgctctccgg gcttcgccct gcgcggtcgc tgcgctccct 5880
tgccagcccg tggatatgtg gacgatggcc gcgagcggcc accggctggc tcgcttcgct 5940
cggcccgtgg acaaccctgc tggacaagct gatggacagg ctgcgcctgc ccacgagctt 6000
gaccacaggg attgcccacc ggctacccag ccttcgacca catacccacc ggctccaact 6060
gcgcggcctg cggccttgcc ccatcaattt ttttaatttt ctctggggaa aagcctccgg 6120
cctgcggcct gcgcgcttcg cttgccggtt ggacaccaag tggaaggcgg gtcaaggctc 6180
gcgcagcgac cgcgcagcgg cttggccttg acgcgcctgg aacgacccaa gcctatgcga 6240
gtgggggcag tcgaaggcga agcccgcccg cctgcccccc gagcctcacg gcggcgagtg 6300
cgggggttcc aagggggcag cgccaccttg ggcaaggccg aaggccgcgc agtcgatcaa 6360
caagccccgg aggggccact ttttgccgga gggggagccg cgccgaaggc gtgggggaac 6420
cccgcagggg tgcccttctt tgggcaccaa agaactagat atagggcgaa atgcgaaaga 6480
cttaaaaatc aacaacttaa aaaagggggg tacgcaacag ctcattgcgg caccccccgc 6540
aatagctcat tgcgtaggtt aaagaaaatc tgtaattgac tgccactttt acgcaacgca 6600
taattgttgt cgcgctgccg aaaagttgca gctgattgcg catggtgccg caaccgtgcg 6660
gcaccctacc gcatggagat aagcatggcc acgcagtcca gagaaatcgg cattcaagcc 6720
aagaacaagc ccggtcactg ggtgcaaacg gaacgcaaag cgcatgaggc gtgggccggg 6780
cttattgcga ggaaacccac ggcggcaatg ctgctgcatc acctcgtggc gcagatgggc 6840
caccagaacg ccgtggtggt cagccagaag acactttcca agctcatcgg acgttctttg 6900
cggacggtcc aatacgcagt caaggacttg gtggccgagc gctggatctc cgtcgtgaag 6960
ctcaacggcc ccggcaccgt gtcggcctac gtggtcaatg accgcgtggc gtggggccag 7020
ccccgcgacc agttgcgcct gtcggtgttc agtgccgccg tggtggttga tcacgacgac 7080
caggacgaat cgctgttggg gcatggcgac ctgcgccgca tcccgaccct gtatccgggc 7140
gagcagcaac taccgaccgg ccccggcgag gagccgccca gccagcccgg cattccgggc 7200
atggaaccag acctgccagc cttgaccgaa acggaggaat gggaacggcg cgggcagcag 7260
cgcctgccga tgcccgatga gccgtgtttt ctggacgatg gcgagccgtt ggagccgccg 7320
acacgggtca cgctgccgcg ccggtagcac ttgggttgcg cagcaacccg taagtgcgct 7380
gttccagact atcggctgta gccgcctcgc cgccctatac cttgtctgcc tccccgcgtt 7440
gcgtcgcggt gcatggagcc gggccacctc gacctgaatg gaagccggcg gcacctcgct 7500
aacggattca ccgtttttat caggctctgg gaggcagaat aaatgatcat atcgtcaatt 7560
attacctcca cggggagagc ctgagcaaac tggcctcagg catttgagaa gcacacggtc 7620
acactgcttc cggtagtcaa taaaccggta aaccagcaat agacataagc ggctatttaa 7680
cgaccctgcc ctgaaccgac gaccgggtcg aatttgcttt cgaatttctg ccattcatcc 7740
gcttattatc acttattcag gcgtagcacc aggcgtttaa gtcgaccaat aacc 7794
<210> 24
<211> 7776
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 24
tctacggggt ctgacgctca gtggaacgaa atcgatgagc tcgcacgaac ccagttgaca 60
taagcctgtt cggttcgtaa actgtaatgc aagtagcgta tgcgctcacg caactggtcc 120
agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttgttat 180
gactgttttt ttgtacagtc tagcctcggg catccaagct agctaagcgc gttacgccgt 240
gggtcgatgt ttgatgttat ggaacagcaa cgatgttacg cagcagggta gtcgccctaa 300
aacaaagtta ggcagccgtt gtgctggtgc tttctagtag ttgttgtggg gtaggcagtc 360
agagctcgat ttgcttgtcg ccataataga ttcacaagaa ggattcgaca tgggtcaaag 420
tagcgatgaa gccaacgctc ccgttgcagg gcagtttgcg cttcccctga gtgccacctt 480
tggcttaggg gatcgcgtac gcaagaaatc tggtgccgct tggcagggtc aagtcgtcgg 540
ttggtattgc acaaaactca ctcctgaagg ctatgcggtc gagtccgaat cccacccagg 600
ctcagtgcaa atttatcctg tggctgcact tgaacgtgtg gcctaagcga tatcttagga 660
tctcccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat 720
gccggccacg atgcgtccgg cgtagaggat ctgctcatgt ttgacagctt atcatcgatg 780
cataatgtgc ctgtcaaatg gacgaagcag ggattctgca aaccctatgc tactccgtca 840
agccgtcaat tgtctgattc gttaccaatt atgacaactt gacggctaca tcattcactt 900
tttcttcaca accggcacgg aactcgctcg ggctggcccc ggtgcatttt ttaaataccc 960
gcgagaaata gagttgatcg tcaaaaccaa cattgcgacc gacggtggcg ataggcatcc 1020
gggtggtgct caaaagcagc ttcgcctggc tgatacgttg gtcctcgcgc cagcttaaga 1080
cgctaatccc taactgctgg cggaaaagat gtgacagacg cgacggcgac aagcaaacat 1140
gctgtgcgac gctggcgata tcaaaattgc tgtctgccag gtgatcgctg atgtactgac 1200
aagcctcgcg tacccgatta tccatcggtg gatggagcga ctcgttaatc gcttccatgc 1260
gccgcagtaa caattgctca agcagattta tcgccagcag ctccgaatag cgcccttccc 1320
cttgcccggc gttaatgatt tgcccaaaca ggtcgctgaa atgcggctgg tgcgcttcat 1380
ccgggcgaaa gaaccccgta ttggcaaata ttgacggcca gttaagccat tcatgccagt 1440
aggcgcgcgg acgaaagtaa acccactggt gataccattc gcgagcctcc ggatgacgac 1500
cgtagtgatg aatctctcct ggcgggaaca gcaaaatatc acccggtcgg caaacaaatt 1560
ctcgtccctg atttttcacc accccctgac cgcgaatggt gagattgaga atataacctt 1620
tcattcccag cggtcggtcg ataaaaaaat cgagataacc gttggcctca atcggcgtta 1680
aacccgccac cagatgggca ttaaacgagt atcccggcag caggggatca ttttgcgctt 1740
cagccatact tttcatactc ccgccattca gagaagaaac caattgtcca tattgcatca 1800
gacattgccg tcactgcgtc ttttactggc tcttctcgct aaccaaaccg gtaaccccgc 1860
ttattaaaag cattctgtaa caaagcggga ccaaagccat gacaaaaacg cgtaacaaaa 1920
gtgtctataa tcacggcaga aaagtccaca ttgattattt gcacggcgtc acactttgct 1980
atgccatagc atttttatcc ataagattag cggatcctac ctgacgcttt ttatcgcaac 2040
tctctactgt ttctccatac ccgttttttt gggctagcag gaggaattca ccatggatga 2100
aaattcttat tagcggtggt gcaggttata taggttctca tactttaaga caatttttaa 2160
aaacagatca tgaaatttgt gttttagata atctttctaa gggttctaaa atcgcaatag 2220
aagatttgca aaaaataaga acttttaaat tttttgaaca agatttaagt gattttcaag 2280
gcgtaaaagc attgtttgag agagaaaaat ttgacgctat tgtgcatttt gcagcgagca 2340
ttgaagtttt tgaaagtatg caaaaccctt taaagtatta tatgaataac actgttaata 2400
cgacaaatct catcgaaact tgtttgcaaa ctggagtgaa taaatttata ttttcttcaa 2460
cggcagccac ttatggcgaa ccacaaactc ccgttgtgag cgaaacaagt cctttagcac 2520
ctattaatcc ttatgggcgt agtaagctta tgagcgaaga ggttttgcgt gatgcaagta 2580
tggcaaatcc tgaatttaag cattgtattt taagatattt taatgttgca ggtgcttgca 2640
tggattatac tttaggacaa cgctatccaa aagcgacttt gcttataaaa gttgcagctg 2700
aatgtgccgc agaaaaacgt aataaacttt tcatatttgg cgatgattat gatacaaaag 2760
atggcacttg cataagagat tttatccatg tggatgatat ttcaagtgcg catttatcgg 2820
ctttggatta tttaaaagag aatgaaagca atgtttttaa tgtaggttat ggacatggtt 2880
ttagcgtaaa agaagtgatt gaagcgatga aaaaagttag cggagtggat tttaaagtag 2940
aacttgcccc acgccgtgcg ggtgatccta gtgtattgat ttctgatgca agtaaaatca 3000
gaaatcttac ttcttggcag cctaaatatg atgatttagg gcttatttgt aaatctgctt 3060
ttgattggga aaaacagtgc tacccatacg atgttccaga ttacgcttaa tctagagtcg 3120
acctgcaggc atgcaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac 3180
agattaaatc agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg 3240
cggtggtccc acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta 3300
gtgtggggtc tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct 3360
cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt 3420
aggacaaatc cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg 3480
gcaggacgcc cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat 3540
ggcctttttg cgtttctaca aactcttcca ctcactacag cagagccatt taaacaacat 3600
cccctccccc tttccaccgc gtcagacgcc cgtagcagcc cgctacgggc tttttcatgc 3660
cctgccctag cgtccaagcc tcacggccgc gctcggcctc tctggcggcc ttctggcgct 3720
gaggtctgcc tcgtgaagaa ggtgttgctg actcatacca ggcctgaatc gccccatcat 3780
ccagccagaa agtgagggag ccacggttga tgagagcttt gttgtaggtg gaccagttgg 3840
tgattttgaa cttttgcttt gccacggaac ggtctgcgtt gtcgggaaga tgcgtgatct 3900
gatccttcaa ctcagcaaaa gttcgattta ttcaacaaag ccgccgtccc gtcaagtcag 3960
cgtaatgctc tgccagtgtt acaaccaatt aaccaattct gattagaaaa actcatcgag 4020
catcaaatga aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag 4080
ccgtttctgt aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg 4140
gtatcggtct gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc 4200
aaaaataagg ttatcaagcg agaaatcacc atgagtgacg actgaatccg gtgagaatgg 4260
caaaagctaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 4320
ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 4380
atccagtgat ttttttctcc attttagctt ccttagctcc tgaaaatctc gataactcaa 4440
aaaatacgcc cggtagtgat cttatttcat tatggtgaaa gttggaacct cttacgtgcc 4500
gatcaacgtc tcattttcgc caaaagttgg cccagggctt cccggtatca acagggacac 4560
caggatttat ttattctgcg aagtgatctt ccgtcacagg tatttattcg aagacgaaag 4620
ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg 4680
tcaggtggca cttttcgggg aaatgtgcgc gcccgcgttc ctgctggcgc tgggcctgtt 4740
tctggcgctg gacttcccgc tgttccgtca gcagcttttc gcccacggcc ttgatgatcg 4800
cggcggcctt ggcctgcata tcccgattca acggccccag ggcgtccaga acgggcttca 4860
ggcgctcccg aaggtctcgg gccgtctctt gggcttgatc ggccttcttg cgcatctcac 4920
gcgctcctgc ggcggcctgt agggcaggct catacccctg ccgaaccgct tttgtcagcc 4980
ggtcggccac ggcttccggc gtctcaacgc gctttgagat tcccagcttt tcggccaatc 5040
cctgcggtgc ataggcgcgt ggctcgaccg cttgcgggct gatggtgacg tggcccactg 5100
gtggccgctc cagggcctcg tagaacgcct gaatgcgcgt gtgacgtgcc ttgctgccct 5160
cgatgccccg ttgcagccct agatcggcca cagcggccgc aaacgtggtc tggtcgcggg 5220
tcatctgcgc tttgttgccg atgaactcct tggccgacag cctgccgtcc tgcgtcagcg 5280
gcaccacgaa cgcggtcatg tgcgggctgg tttcgtcacg gtggatgctg gccgtcacga 5340
tgcgatccgc cccgtacttg tccgccagcc acttgtgcgc cttctcgaag aacgccgcct 5400
gctgttcttg gctggccgac ttccaccatt ccgggctggc cgtcatgacg tactcgaccg 5460
ccaacacagc gtccttgcgc cgcttctctg gcagcaactc gcgcagtcgg cccatcgctt 5520
catcggtgct gctggccgcc cagtgctcgt tctctggcgt cctgctggcg tcagcgttgg 5580
gcgtctcgcg ctcgcggtag gcgtgcttga gactggccgc cacgttgccc attttcgcca 5640
gcttcttgca tcgcatgatc gcgtatgccg ccatgcctgc ccctcccttt tggtgtccaa 5700
ccggctcgac gggggcagcg caaggcggtg cctccggcgg gccactcaat gcttgagtat 5760
actcactaga ctttgcttcg caaagtcgtg accgcctacg gcggctgcgg cgccctacgg 5820
gcttgctctc cgggcttcgc cctgcgcggt cgctgcgctc ccttgccagc ccgtggatat 5880
gtggacgatg gccgcgagcg gccaccggct ggctcgcttc gctcggcccg tggacaaccc 5940
tgctggacaa gctgatggac aggctgcgcc tgcccacgag cttgaccaca gggattgccc 6000
accggctacc cagccttcga ccacataccc accggctcca actgcgcggc ctgcggcctt 6060
gccccatcaa tttttttaat tttctctggg gaaaagcctc cggcctgcgg cctgcgcgct 6120
tcgcttgccg gttggacacc aagtggaagg cgggtcaagg ctcgcgcagc gaccgcgcag 6180
cggcttggcc ttgacgcgcc tggaacgacc caagcctatg cgagtggggg cagtcgaagg 6240
cgaagcccgc ccgcctgccc cccgagcctc acggcggcga gtgcgggggt tccaaggggg 6300
cagcgccacc ttgggcaagg ccgaaggccg cgcagtcgat caacaagccc cggaggggcc 6360
actttttgcc ggagggggag ccgcgccgaa ggcgtggggg aaccccgcag gggtgccctt 6420
ctttgggcac caaagaacta gatatagggc gaaatgcgaa agacttaaaa atcaacaact 6480
taaaaaaggg gggtacgcaa cagctcattg cggcaccccc cgcaatagct cattgcgtag 6540
gttaaagaaa atctgtaatt gactgccact tttacgcaac gcataattgt tgtcgcgctg 6600
ccgaaaagtt gcagctgatt gcgcatggtg ccgcaaccgt gcggcaccct accgcatgga 6660
gataagcatg gccacgcagt ccagagaaat cggcattcaa gccaagaaca agcccggtca 6720
ctgggtgcaa acggaacgca aagcgcatga ggcgtgggcc gggcttattg cgaggaaacc 6780
cacggcggca atgctgctgc atcacctcgt ggcgcagatg ggccaccaga acgccgtggt 6840
ggtcagccag aagacacttt ccaagctcat cggacgttct ttgcggacgg tccaatacgc 6900
agtcaaggac ttggtggccg agcgctggat ctccgtcgtg aagctcaacg gccccggcac 6960
cgtgtcggcc tacgtggtca atgaccgcgt ggcgtggggc cagccccgcg accagttgcg 7020
cctgtcggtg ttcagtgccg ccgtggtggt tgatcacgac gaccaggacg aatcgctgtt 7080
ggggcatggc gacctgcgcc gcatcccgac cctgtatccg ggcgagcagc aactaccgac 7140
cggccccggc gaggagccgc ccagccagcc cggcattccg ggcatggaac cagacctgcc 7200
agccttgacc gaaacggagg aatgggaacg gcgcgggcag cagcgcctgc cgatgcccga 7260
tgagccgtgt tttctggacg atggcgagcc gttggagccg ccgacacggg tcacgctgcc 7320
gcgccggtag cacttgggtt gcgcagcaac ccgtaagtgc gctgttccag actatcggct 7380
gtagccgcct cgccgcccta taccttgtct gcctccccgc gttgcgtcgc ggtgcatgga 7440
gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat tcaccgtttt 7500
tatcaggctc tgggaggcag aataaatgat catatcgtca attattacct ccacggggag 7560
agcctgagca aactggcctc aggcatttga gaagcacacg gtcacactgc ttccggtagt 7620
caataaaccg gtaaaccagc aatagacata agcggctatt taacgaccct gccctgaacc 7680
gacgaccggg tcgaatttgc tttcgaattt ctgccattca tccgcttatt atcacttatt 7740
caggcgtagc accaggcgtt taagtcgacc aataac 7776
<210> 25
<211> 643
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser
1 5 10 15
Ala Ser Ala Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys
20 25 30
Ala Cys Val Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser
35 40 45
Val Asp Pro Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr
50 55 60
Ser Met Val Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp
65 70 75 80
Asn Ala Leu Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly
85 90 95
Gly Val Glu Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala
100 105 110
Arg Gly Ser Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys
115 120 125
Pro Ser Asn Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln
130 135 140
Leu Ser His Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu
145 150 155 160
Leu Ala Lys Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu
165 170 175
Ser Asn Glu Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser
180 185 190
Val Val Met Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu
195 200 205
Trp Ala Ser Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val
210 215 220
Tyr Asn Tyr Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu
225 230 235 240
Gly Lys Ile Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu
245 250 255
Asp Ile Lys Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg
260 265 270
Leu His Phe Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln
275 280 285
Ala Cys His Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg
290 295 300
Gly Trp Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val
305 310 315 320
Ala Leu Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val
325 330 335
Ile Arg Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu
340 345 350
Ala Ile Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala
355 360 365
Ala Ala Glu Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu
370 375 380
Ala Gly Ala Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala
385 390 395 400
Lys Asp Gln Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser
405 410 415
Gly Asp Ala Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu
420 425 430
Gly Asp Gly Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp
435 440 445
Thr Val Glu Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly
450 455 460
Tyr Val Phe Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser
465 470 475 480
Ile Val Phe Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile
485 490 495
Trp Arg Gly Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr
500 505 510
Ala Gln Asp Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala
515 520 525
Leu Leu Arg Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg
530 535 540
Thr Gly Leu Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg
545 550 555 560
Leu Ile Gly His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro
565 570 575
Glu Glu Glu Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu
580 585 590
Arg Thr Val Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val
595 600 605
Gly Gly Asp Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile
610 615 620
Ser Ala Leu Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu
625 630 635 640
Asp Leu Lys
<210> 26
<211> 722
<212> PRT
<213> Campylobacter jejuni
<400> 26
Met Leu Lys Lys Glu Tyr Leu Lys Asn Pro Tyr Leu Val Leu Phe Ala
1 5 10 15
Met Ile Ile Leu Ala Tyr Val Phe Ser Val Phe Cys Arg Phe Tyr Trp
20 25 30
Val Trp Trp Ala Ser Glu Phe Asn Glu Tyr Phe Phe Asn Asn Gln Leu
35 40 45
Met Ile Ile Ser Asn Asp Gly Tyr Ala Phe Ala Glu Gly Ala Arg Asp
50 55 60
Met Ile Ala Gly Phe His Gln Pro Asn Asp Leu Ser Tyr Tyr Gly Ser
65 70 75 80
Ser Leu Ser Ala Leu Thr Tyr Trp Leu Tyr Lys Ile Thr Pro Phe Ser
85 90 95
Phe Glu Ser Ile Ile Leu Tyr Met Ser Thr Phe Leu Ser Ser Leu Val
100 105 110
Val Ile Pro Thr Ile Leu Leu Ala Asn Glu Tyr Lys Arg Pro Leu Met
115 120 125
Gly Phe Val Ala Ala Leu Leu Ala Ser Ile Ala Asn Ser Tyr Tyr Asn
130 135 140
Arg Thr Met Ser Gly Tyr Tyr Asp Thr Asp Met Leu Val Ile Val Leu
145 150 155 160
Pro Met Phe Ile Leu Phe Phe Met Val Arg Met Ile Leu Lys Lys Asp
165 170 175
Phe Phe Ser Leu Ile Ala Leu Pro Leu Phe Ile Gly Ile Tyr Leu Trp
180 185 190
Trp Tyr Pro Ser Ser Tyr Thr Leu Asn Val Ala Leu Ile Gly Leu Phe
195 200 205
Leu Ile Tyr Thr Leu Ile Phe His Arg Lys Glu Lys Ile Phe Tyr Ile
210 215 220
Ala Val Ile Leu Ser Ser Leu Thr Leu Ser Asn Ile Ala Trp Phe Tyr
225 230 235 240
Gln Ser Ala Ile Ile Val Ile Leu Phe Ala Leu Phe Ala Leu Glu Gln
245 250 255
Lys Arg Leu Asn Phe Met Ile Ile Gly Ile Leu Gly Ser Ala Thr Leu
260 265 270
Ile Phe Leu Ile Leu Ser Gly Gly Val Asp Pro Ile Leu Tyr Gln Leu
275 280 285
Lys Phe Tyr Ile Phe Arg Ser Asp Glu Ser Ala Asn Leu Thr Gln Gly
290 295 300
Phe Met Tyr Phe Asn Val Asn Gln Thr Ile Gln Glu Val Glu Asn Val
305 310 315 320
Asp Leu Ser Glu Phe Met Arg Arg Ile Ser Gly Ser Glu Ile Val Phe
325 330 335
Leu Phe Ser Leu Phe Gly Phe Val Trp Leu Leu Arg Lys His Lys Ser
340 345 350
Met Ile Met Ala Leu Pro Ile Leu Val Leu Gly Phe Leu Ala Leu Lys
355 360 365
Gly Gly Leu Arg Phe Thr Ile Tyr Ser Val Pro Val Met Ala Leu Gly
370 375 380
Phe Gly Phe Leu Leu Ser Glu Phe Lys Ala Ile Met Val Lys Lys Tyr
385 390 395 400
Ser Gln Leu Thr Ser Asn Val Cys Ile Val Phe Ala Thr Ile Leu Thr
405 410 415
Leu Ala Pro Val Phe Ile His Ile Tyr Asn Tyr Lys Ala Pro Thr Val
420 425 430
Phe Ser Gln Asn Glu Ala Ser Leu Leu Asn Gln Leu Lys Asn Ile Ala
435 440 445
Asn Arg Glu Asp Tyr Val Val Thr Trp Ala Ala Tyr Gly Tyr Pro Val
450 455 460
Arg Tyr Tyr Ser Asp Val Lys Thr Leu Val Asp Gly Gly Lys His Leu
465 470 475 480
Gly Lys Asp Asn Phe Phe Pro Ser Phe Ala Leu Ser Lys Asp Glu Gln
485 490 495
Ala Ala Ala Asn Met Ala Arg Leu Ser Val Glu Tyr Thr Glu Lys Ser
500 505 510
Phe Tyr Ala Pro Gln Asn Asp Ile Leu Lys Thr Asp Ile Leu Gln Ala
515 520 525
Met Met Lys Asp Tyr Asn Gln Ser Asn Val Asp Leu Phe Leu Ala Ser
530 535 540
Leu Ser Lys Pro Asp Phe Lys Ile Asp Thr Pro Lys Thr Arg Asp Ile
545 550 555 560
Tyr Leu Tyr Met Pro Ala Arg Met Ser Leu Ile Phe Ser Thr Val Ala
565 570 575
Ser Phe Ser Phe Ile Asn Leu Asp Thr Gly Val Leu Asp Lys Pro Phe
580 585 590
Thr Phe Ser Thr Ala Tyr Pro Leu Asp Val Lys Asn Gly Glu Ile Tyr
595 600 605
Leu Ser Asn Gly Val Val Leu Ser Asp Asp Phe Arg Ser Phe Lys Ile
610 615 620
Gly Asp Asn Val Val Ser Val Asn Ser Ile Val Glu Ile Asn Ser Ile
625 630 635 640
Lys Gln Gly Glu Tyr Lys Ile Thr Pro Ile Asp Asp Lys Ala Gln Phe
645 650 655
Tyr Ile Phe Tyr Leu Lys Asp Ser Ala Ile Pro Tyr Ala Gln Phe Ile
660 665 670
Leu Met Asp Lys Thr Met Phe Asn Ser Ala Tyr Val Gln Met Phe Phe
675 680 685
Leu Gly Asn Tyr Asp Lys Asn Leu Phe Asp Leu Val Ile Asn Ser Arg
690 695 700
Asp Ala Lys Val Phe Lys Leu Lys Ile Tyr Pro Tyr Asp Val Pro Asp
705 710 715 720
Tyr Ala
<210> 27
<211> 8171
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 27
gcggccgcaa ggggttcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 60
cggcatcaga gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat 120
gcgtaaggag aaaataccgc atcaggcgcc attcgccatt cagctgcgca actgttggga 180
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 240
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 300
cagtgaattg taatacgact cactataggg cgaattcgag ctcggtaccc ggggatccca 360
cgtggcgcgc cactagtgct agcgacgtcg tgggatcctc tagagtcgac ctgcaggcat 420
gcaagcttga gtattctata gtctcaccta aatagcttgg cgtaatcatg gtcatagctg 480
tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 540
aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 600
ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 660
gaaccccttg cggccgcccg ggccgtcgac caattctcat gtttgacagc ttatcatcga 720
atttctgcca ttcatccgct tattatcact tattcaggcg tagcaaccag gcgtttaagg 780
gcaccaataa ctgccttaaa aaaattacgc cccgccctgc cactcatcgc agtactgttg 840
taattcatta agcattctgc cgacatggaa gccatcacaa acggcatgat gaacctgaat 900
cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg tgaaaacggg 960
ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg 1020
attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg ccaggttttc 1080
accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta 1140
ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg 1200
aacactatcc catatcacca gctcaccgtc tttcattgcc atacgaaatt ccggatgagc 1260
attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt 1320
tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc 1380
aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt 1440
atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc tcgataactc 1500
aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac ctcttacgtg 1560
ccgatcaacg tctcattttc gccaaaagtt ggcccagggc ttcccggtat caacagggac 1620
accaggattt atttattctg cgaagtgatc ttccgtcaca ggtatttatt cgcgataagc 1680
tcatggagcg gcgtaaccgt cgcacaggaa ggacagagaa agcgcggatc tgggaagtga 1740
cggacagaac ggtcaggacc tggattgggg aggcggttgc cgccgctgct gctgacggtg 1800
tgacgttctc tgttccggtc acaccacata cgttccgcca ttcctatgcg atgcacatgc 1860
tgtatgccgg tataccgctg aaagttctgc aaagcctgat gggacataag tccatcagtt 1920
caacggaagt ctacacgaag gtttttgcgc tggatgtggc tgcccggcac cgggtgcagt 1980
ttgcgatgcc ggagtctgat gcggttgcga tgctgaaaca attatcctga gaataaatgc 2040
cttggccttt atatggaaat gtggaactga gtggatatgc tgtttttgtc tgttaaacag 2100
agaagctggc tgttatccac tgagaagcga acgaaacagt cgggaaaatc tcccattatc 2160
gtagagatcc gcattattaa tctcaggagc ctgtgtagcg tttataggaa gtagtgttct 2220
gtcatgatgc ctgcaagcgg taacgaaaac gatttgaata tgccttcagg aacaatagaa 2280
atcttcgtgc ggtgttacgt tgaagtggag cggattatgt cagcaatgga cagaacaacc 2340
taatgaacac agaaccatga tgtggtctgt ccttttacag ccagtagtgc tcgccgcagt 2400
cgagcgacag ggcgaagccc tcggctggtt gccctcgccg ctgggctggc ggccgtctat 2460
ggccctgcaa acgcgccaga aacgccgtcg aagccgtgtg cgagacaccg cggccggccg 2520
ccggcgttgt ggatacctcg cggaaaactt ggccctcact gacagatgag gggcggacgt 2580
tgacacttga ggggccgact cacccggcgc ggcgttgaca gatgaggggc aggctcgatt 2640
tcggccggcg acgtggagct ggccagcctc gcaaatcggc gaaaacgcct gattttacgc 2700
gagtttccca cagatgatgt ggacaagcct ggggataagt gccctgcggt attgacactt 2760
gaggggcgcg actactgaca gatgaggggc gcgatccttg acacttgagg ggcagagtgc 2820
tgacagatga ggggcgcacc tattgacatt tgaggggctg tccacaggca gaaaatccag 2880
catttgcaag ggtttccgcc cgtttttcgg ccaccgctaa cctgtctttt aacctgcttt 2940
taaaccaata tttataaacc ttgtttttaa ccagggctgc gccctgtgcg cgtgaccgcg 3000
cacgccgaag gggggtgccc ccccttctcg aaccctcccg gtcgagtgag cgaggaagca 3060
ccagggaaca gcacttatat attctgctta cacacgatgc ctgaaaaaac ttcccttggg 3120
gttatccact tatccacggg gatattttta taattatttt ttttatagtt tttagatctt 3180
cttttttaga gcgccttgta ggcctttatc catgctggtt ctagagaagg tgttgtgaca 3240
aattgccctt tcagtgtgac aaatcaccct caaatgacag tcctgtctgt gacaaattgc 3300
ccttaaccct gtgacaaatt gccctcagaa gaagctgttt tttcacaaag ttatccctgc 3360
ttattgactc ttttttattt agtgtgacaa tctaaaaact tgtcacactt cacatggatc 3420
tgtcatggcg gaaacagcgg ttatcaatca caagaaacgt aaaaatagcc cgcgaatcgt 3480
ccagtcaaac gacctcactg aggcggcata tagtctctcc cgggatcaaa aacgtatgct 3540
gtatctgttc gttgaccaga tcagaaaatc tgatggcacc ctacaggaac atgacggtat 3600
ctgcgagatc catgttgcta aatatgctga aatattcgga ttgacctctg cggaagccag 3660
taaggatata cggcaggcat tgaagagttt cgcggggaag gaagtggttt tttatcgccc 3720
tgaagaggat gccggcgatg aaaaaggcta tgaatctttt ccttggttta tcaaacgtgc 3780
gcacagtcca tccagagggc tttacagtgt acatatcaac ccatatctca ttcccttctt 3840
tatcgggtta cagaaccggt ttacgcagtt tcggcttagt gaaacaaaag aaatcaccaa 3900
tccgtatgcc atgcgtttat acgaatccct gtgtcagtat cgtaagccgg atggctcagg 3960
catcgtctct ctgaaaatcg actggatcat agagcgttac cagctgcctc aaagttacca 4020
gcgtatgcct gacttccgcc gccgcttcct gcaggtctgt gttaatgaga tcaacagcag 4080
aactccaatg cgcctctcat acattgagaa aaagaaaggc cgccagacga ctcatatcgt 4140
attttccttc cgcgatatca cttccatgac gacaggatag tctgagggtt atctgtcaca 4200
gatttgaggg tggttcgtca catttgttct gacctactga gggtaatttg tcacagtttt 4260
gctgtttcct tcagcctgca tggattttct catacttttt gaactgtaat ttttaaggaa 4320
gccaaatttg agggcagttt gtcacagttg atttccttct ctttcccttc gtcatgtgac 4380
ctgatatcgg gggttagttc gtcatcattg atgagggttg attatcacag tttattactc 4440
tgaattggct atccgcgtgt gtacctctac ctggagtttt tcccacggtg gatatttctt 4500
cttgcgctga gcgtaagagc tatctgacag aacagttctt ctttgcttcc tcgccagttc 4560
gctcgctatg ctcggttaca cggctgcggc gagcgctagt gataataagt gactgaggta 4620
tgtgctcttc ttatctcctt ttgtagtgtt gctcttattt taaacaactt tgcggttttt 4680
tgatgacttt gcgattttgt tgttgctttg cagtaaattg caagatttaa taaaaaaacg 4740
caaagcaatg attaaaggat gttcagaatg aaactcatgg aaacacttaa ccagtgcata 4800
aacgctggtc atgaaatgac gaaggctatc gccattgcac agtttaatga tgacagcccg 4860
gaagcgagga aaataacccg gcgctggaga ataggtgaag cagcggattt agttggggtt 4920
tcttctcagg ctatcagaga tgccgagaaa gcagggcgac taccgcaccc ggatatggaa 4980
attcgaggac gggttgagca acgtgttggt tatacaattg aacaaattaa tcatatgcgt 5040
gatgtgtttg gtacgcgatt gcgacgtgct gaagacgtat ttccaccggt gatcggggtt 5100
gctgcccata aaggtggcgt ttacaaaacc tcagtttctg ttcatcttgc tcaggatctg 5160
gctctgaagg ggctacgtgt tttgctcgtg gaaggtaacg acccccaggg aacagcctca 5220
atgtatcacg gatgggtacc agatcttcat attcatgcag aagacactct cctgcctttc 5280
tatcttgggg aaaaggacga tgtcacttat gcaataaagc ccacttgctg gccggggctt 5340
gacattattc cttcctgtct ggctctgcac cgtattgaaa ctgagttaat gggcaaattt 5400
gatgaaggta aactgcccac cgatccacac ctgatgctcc gactggccat tgaaactgtt 5460
gctcatgact atgatgtcat agttattgac agcgcgccta acctgggtat cggcacgatt 5520
aatgtcgtat gtgctgctga tgtgctgatt gttcccacgc ctgctgagtt gtttgactac 5580
acctccgcac tgcagttttt cgatatgctt cgtgatctgc tcaagaacgt tgatcttaaa 5640
gggttcgagc ctgatgtacg tattttgctt accaaataca gcaatagtaa tggctctcag 5700
tccccgtgga tggaggagca aattcgggat gcctggggaa gcatggttct aaaaaatgtt 5760
gtacgtgaaa cggatgaagt tggtaaaggt cagatccgga tgagaactgt ttttgaacag 5820
gccattgatc aacgctcttc aactggtgcc tggagaaatg ctctttctat ttgggaacct 5880
gtctgcaatg aaattttcga tcgtctgatt aaaccacgct gggagattag ataatgaagc 5940
gtgcgcctgt tattccaaaa catacgctca atactcaacc ggttgaagat acttcgttat 6000
cgacaccagc tgccccgatg gtggattcgt taattgcgcg cgtaggagta atggctcgcg 6060
gtaatgccat tactttgcct gtatgtggtc gggatgtgaa gtttactctt gaagtgctcc 6120
ggggtgatag tgttgagaag acctctcggg tatggtcagg taatgaacgt gaccaggagc 6180
tgcttactga ggacgcactg gatgatctca tcccttcttt tctactgact ggtcaacaga 6240
caccggcgtt cggtcgaaga gtatctggtg tcatagaaat tgccgatggg agtcgccgtc 6300
gtaaagctgc tgcacttacc gaaagtgatt atcgtgttct ggttggcgag ctggatgatg 6360
agcagatggc tgcattatcc agattgggta acgattatcg cccaacaagt gcttatgaac 6420
gtggtcagcg ttatgcaagc cgattgcaga atgaatttgc tggaaatatt tctgcgctgg 6480
ctgatgcgga aaatatttca cgtaagatta ttacccgctg tatcaacacc gccaaattgc 6540
ctaaatcagt tgttgctctt ttttctcacc ccggtgaact atctgcccgg tcaggtgatg 6600
cacttcaaaa agcctttaca gataaagagg aattacttaa gcagcaggca tctaaccttc 6660
atgagcagaa aaaagctggg gtgatatttg aagctgaaga agttatcact cttttaactt 6720
ctgtgcttaa aacgtcatct gcatcaagaa ctagtttaag ctcacgacat cagtttgctc 6780
ctggagcgac agtattgtat aagggcgata aaatggtgct taacctggac aggtctcgtg 6840
ttccaactga gtgtatagag aaaattgagg ccattcttaa ggaacttgaa aagccagcac 6900
cctgatgcga ccacgtttta gtctacgttt atctgtcttt acttaatgtc ctttgttaca 6960
ggccagaaag cataactggc ctgaatattc tctctgggcc cactgttcca cttgtatcgt 7020
cggtctgata atcagactgg gaccacggtc ccactcgtat cgtcggtctg attattagtc 7080
tgggaccacg gtcccactcg tatcgtcggt ctgattatta gtctgggacc acggtcccac 7140
tcgtatcgtc ggtctgataa tcagactggg accacggtcc cactcgtatc gtcggtctga 7200
ttattagtct gggaccatgg tcccactcgt atcgtcggtc tgattattag tctgggacca 7260
cggtcccact cgtatcgtcg gtctgattat tagtctggaa ccacggtccc actcgtatcg 7320
tcggtctgat tattagtctg ggaccacggt cccactcgta tcgtcggtct gattattagt 7380
ctgggaccac gatcccactc gtgttgtcgg tctgattatc ggtctgggac cacggtccca 7440
cttgtattgt cgatcagact atcagcgtga gactacgatt ccatcaatgc ctgtcaaggg 7500
caagtattga catgtcgtcg taacctgtag aacggagtaa cctcggtgtg cggttgtatg 7560
cctgctgtgg attgctgctg tgtcctgctt atccacaaca ttttgcgcac ggttatgtgg 7620
acaaaatacc tggttaccca ggccgtgccg gcacgttaac cgggctgcat ccgatgcaag 7680
tgtgtcgctg tcgacgagct cgcgagctcg gacatgaggt tgccccgtat tcagtgtcgc 7740
tgatttgtat tgtctgaagt tgtttttacg ttaagttgat gcagatcaat taatacgata 7800
cctgcgtcat aattgattat ttgacgtggt ttgatggcct ccacgcacgt tgtgatatgt 7860
agatgataat cattatcact ttacgggtcc tttccggtga tccgacaggt tacggggcgg 7920
cgacctcgcg ggttttcgct atttatgaaa attttccggt ttaaggcgtt tccgttcttc 7980
ttcgtcataa cttaatgttt ttatttaaaa taccctctga aaagaaagga aacgacaggt 8040
gctgaaagcg agctttttgg cctctgtcgt ttcctttctc tgtttttgtc cgtggaatga 8100
acaatggaag tccgagctca tcgctaataa cttcgtatag catacattat acgaagttat 8160
attcgatcca c 8171
<210> 28
<211> 20982
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 28
ctagcggcaa aacgtatgcc gggtgacctc tctgaatact ccgtcatcca gaccaaagaa 60
ccgctggatc gcgaaggtaa agtcagccgc attgttgaat ttatcgaaaa accggatcag 120
ccgcagacgc tggactcaga catcatggcc gttggtcgct atgtgctttc tgccgatatt 180
tggccggaac ttgaacgtac tcagcctggt gcatggggac gtattcagct gactgatgcc 240
attgccgagc tggcgaaaaa acagtccgtt gatgcaatgc tgatgaccgg cgacagctac 300
gactgcggta aaaaaatggg ctatatgcag gcgtttgtga agtatgggct gcgcaacctg 360
aaagaagggg cgaagttccg taaaggtatt gagaagctgt taagcgaata atgaaaatct 420
gaccggatgt aacggttgat aagaaaatta taacggcagt gaagattcgt ggtgaaagta 480
atttgttgcg aatattcctg ccgttgtttt atataaacaa tcagaataac aacgagttag 540
caataggatt ttagtcaaag ttttccagga ttttccttgt ttccagagcg gattggtaag 600
acaattagct tttgaatttt tcgggtttag cgcgagtggg taacgctcgt cacatcgtag 660
gcatgcatgc agtgctctgg tagctgtaaa gccaggggcg gtagcgtgca ttaatacttc 720
tattaatcaa actgagagcc gcttatttca cagcatgctc tgaagcaata tggaataaat 780
taggtgaaaa tacttgttac tggtggcgca ggatttattg gttttgctgt agttcgtcac 840
attataaata atacgcagga tagtgttgtt aatgtcgata aattaacgta cgccggaaac 900
ctggaatcac ttgctgatgt ttctgattct gaacgctatg tttttgaaca tgcggatatt 960
tgcgatgcag ctgcaatggc acggattttt gctcagcatc agccagatgc agtgatgcac 1020
ctggctgctg aaagccatgt tgaccgttca attacaggtc ctgcggcatt tattgaaacc 1080
aatattgttg gtacatatgt ccttttggaa gccgctcgca attattggtc tgctcttgat 1140
agcgacaaga aaactagatt ccgttttcat catatttcta ctgacgaagt ctatggtgat 1200
ttgcctcatc ctgacgaggt aaataataca gaagaattac ccttatttac agagacaaca 1260
gcttacgcgc caagcagccc ttattccgct tcaaaagcat ccagcgatca tttagtccgc 1320
gcgtggaaac gtacctatgg tttaccaacc attgtgacta attgctctaa taattatggt 1380
ccttatcatt tcccggaaaa attgattcca ttggttattc tgaatgctct ggaaggtaag 1440
gcattaccta tttatggcaa aggggatcaa attcgtgact ggctgtatgt tgaagatcat 1500
gcgcgtgcgt tatataccgt cgtaaccgaa ggtaaagcgg gtgaaactta taacattggt 1560
ggacacaacg aaaagaaaaa catcgatgta gtgctcacta tttgtgattt gctggatgag 1620
attgtaccga aagagaaatc ttaccgcgag caaattactt atgttgccga tcgcccggga 1680
cacgatcgcc gttatgcgat tgatgcagag aagattagcc gcgaattggg ctggaaaccg 1740
caggaaacgt ttgagagcgg gattcggaag acattggaat ggtacctgtc caatacaaaa 1800
tgggttgata atgtgaaaag tggtgcttat caatcgtgga ttgaacagaa ctatgagggc 1860
cgccagtaat gaatatcctc cttttcggca aaacagggca ggtaggttgg gaactacagc 1920
gtgctctggc acctttgggt aatttgattg ctcttgatgt tcactccact gattattgtg 1980
gtgattttag taatcctgaa ggtgtagctg aaacagtcaa aagaattcga cctgatgtta 2040
ttgttaatgc tgcggctcac accgcagtag ataaggctga gtcagaaccc gaatttgcac 2100
aattactcaa tgcgactagt gttgaatcaa ttgcaaaaga ggctaatgaa gttggggctt 2160
gggtaattca ttactcaact gactacgtat tccctggaaa tggcgacacg ccatggctgg 2220
agacggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagcc ggagaaaaag 2280
cgttacagga acattgcgcg aagcatctta ttttccgtac cagctgggta tacgcagcta 2340
aaggaaataa cttcgccaaa acgatgttgc gtctggcaaa agagcgcgaa gaactggctg 2400
tgataaatga tcaatttggt gcgccaacag gtgctgagct gctggctgat tgtacggcac 2460
atgctattcg tgtggcactg aataaaccgg aagtcgcagg tttgtaccat ctggtagcca 2520
gtggtaccac aacctggcac gattatgctg cgctggtttt tgaagaggcg cgcaaagcag 2580
gtattcccct tgcactcaac aagctcaacg cagtaccaac aacagcctat cctacaccag 2640
ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac tttgcgcttg 2700
tcttgcctga ctggcaggtt ggtgtgaaac gaatgctcaa cgaattaatt acgactacag 2760
caatttaata gtttttgcat cttgttcgtg atggtggagc aagatgaatt aaaaggaatg 2820
atgaaatgaa aacgcgtaaa ggtattattt tagcgggtgg ttctggtaca cgtctttatc 2880
ctgtgactat ggctgtcagt aaacagctat tacctattta tgataagccg atgatctatt 2940
acccgctctc tacactgatg ttggcgggta ttcgcgatat tctgattatt agtacgccac 3000
aggatactcc tcgttttcaa caactgctag gtgacggtag ccagtggggg ctaaatcttc 3060
agtacaaagt gcaaccgact ccagatgggc ttgcgcaggc gtttattatc ggtgaagagt 3120
ttatcggtgg tgatgattgt gctttggttc ttggtgataa tatcttctac ggtcatgatc 3180
tgccgaagtt aatggatgtc gctgttaaca aagaaagtgg tgcaacggta tttgcctatc 3240
acgttaatga tcctgaacgc tacggcgtcg ttgagtttga taaaaacggt acggcaataa 3300
gcctggaaga aaaaccgcta caaccaaaaa gtaattatgc ggtaaccggg ctttatttct 3360
atgataacga cgttgtcgaa atggcgaaaa accttaagcc ttctgcccgt ggtgaactgg 3420
aaattaccga tattaaccgt atttatatgg aacaggggcg tttatccgtt gccatgatgg 3480
ggcgtggtta tgcatggctg gatacgggga cacatcagag tcttattgaa gcaagcaact 3540
tcattgccac cattgaagag cgccagggac taaaggtttc ctgcccagaa gaaattgctt 3600
accgtaaagg gtttattgat gctgaacagg tgaaagcatt agcggagccg ctgaaaaaaa 3660
atgcttatgg acagtatctg ctgaaaatga ttaaaggtta ttaataaaat gaacgtaatt 3720
aaaacagaaa ttcctgatgt gttaattttc gagccgaaag tttttggtga tgagcgtggt 3780
ttctttatgg aaagctttaa tcagaaagtt ttcgaagaag ctgtaggacg taaggttgaa 3840
tttgttcagg ataaccattc gaagtctagt aaaggtgttt tacgcgggct gcattatcag 3900
ttagaacctt atgcgcaagg gaaactggta cgttgcgttg ttggtgaggt ttttgatgta 3960
gctgttgata ttcgtaaatc gtcgcctacc tttggtaaat gggttggggt gaatttatct 4020
gctgagaata agcggcaatt gtggatccct gagggatttg cacatggttt tttggtgctg 4080
agcgagactg cggaattttt atataaaacg acgaactatt atcatcctga tagtgataga 4140
gggattgtat ggaatgatcc tattctgagc ataaaatggc cgacgataga acataataat 4200
tatattttat cgattaaaga tgcaagggct aaagaattgc ataacatgaa ggaattattt 4260
ttgtgagtat tgtaaagaat actttatgga atataagtgg gtatattata ccatcattaa 4320
tagcaattcc tgcgttaggt atactgtcta gaattctagg gaccgagcaa tttggccttt 4380
ttacgttagc tattgcctta gttggatatg caagtatttt tgatgctgga ttgaccagag 4440
ctgttataag agaagtatca atatataaaa atgttcataa agaattaaga gcgatcattt 4500
caacttcaac ggtaattcta actatattgg gcttgattgg cggtagtgta ctatttttga 4560
gtagcaatgt aattgttaaa ttattaaaca ttaacgcgaa tcatgttgta gaatctgtca 4620
aagcaatata tattatttca gctaccatac ccttatactt gttaaaccaa gtctggttgg 4680
ggatttttga ggggatggaa aagttcagaa aagtaaattt aataaaatca attaacaact 4740
cttttgtggc tggattacca gtgattttct gtttttttca tggaggatta ctaagtgcta 4800
tatatggttt agttatggca agagtcttat cacttatagt gacctttata tttagtcgaa 4860
aactaataat atcatctggg ctgtctgtaa aaattgtaac agttaaaaga ttaatcggct 4920
ttggaagctg gataacagtt agcaatatta ttagccctat tatgacatat atggatcgtt 4980
ttattctttc acacattgtg ggggctgata aagtttcttt ttatactgct ccgtctgaag 5040
gtatacaacg cttaacgata ttaccaagtg cgttgtccag agctattttt ccaagattaa 5100
gttcagaatt gcaatcggta aagcaaacta aaatattatc atattttata atggttattg 5160
gtatacttcc aattgtaatg ttgataatta ttttatcaga ttttataatg tccgcttgga 5220
tgggacctac atatcatggg acgccaggta tagtattaaa aattcttgca ataggtttct 5280
tttttaattg cattgcacaa atcccatttg tttcagttca ggctagtgga agatcaaaaa 5340
ttacagctat tattcatttg ctcgaagtta tcccatattt atgcatatta tatattttta 5400
tttatcattg gggaattgtt ggagccgcaa tagcatggtc tgtaagaaca tcgttagatt 5460
ttttgatatt attattaatt gatacgaaat attaatagcg aattgatttt agggattact 5520
tcctcaagcc catctaatta gagtgcaaac atgacttctg atttttataa ctcaaaagac 5580
aaaagtttaa gtgttctttt gttttttggg tttatatttt tccttacacg tagctttcca 5640
tttattcaat atagttggat tatggagggg tttttatgtc tttgtatcat gtcatttaca 5700
aagaaaattg caaacggaat atatcactat cctgttattt taatatttct attagctctt 5760
tttataaatt ttatttattc ctatatcaag ggtaacgata tagcgataat aattaggttt 5820
tatattatca tattatttat attatgtgct tatttctgct cttatggaac catctcgatt 5880
gttaaaatat ttttatattt aatggtatta caggcggtta ttatatccat cattagtatt 5940
tatatgacaa aaacatatgg tattggtgat tattcagcac taagacatta ttttttggag 6000
aatgattatg gtgatgttta tacatatgga agtggtttct atagagttca aattaaagga 6060
aatgctctca ttccatttgc ctttatgttg catatagtca taaaagatta tttctattat 6120
cgattcaaaa atacaataac cgttattctg gctataggta ctatagtggc tggtaatttt 6180
gcatattttg tttcgatatg cttgtttttt atgtatatta tactatgttc taaatctaac 6240
tcacgatacg ctaaattaag gaaaattatt tttggggttt ttcttactgt gattctccct 6300
ttttttatta catattcaat tgagttgata atcatgaaat caaatggagc tgattcttct 6360
ttaggagtta gatgggatca gtttactgta ttaattaatg atcttacaga gtctgtatca 6420
aattttgtta taggttctgg tttgggtaat gtcatcaaaa ttcaaactcc tatccgtgat 6480
tatagtgcat atatatatta tgaattgcag tcagtttatt ttttaaatca acttggcgtt 6540
attttattta ctttgttttt attaattaat ctccttctca cgattaaaat cataaaatac 6600
agtgagttgt gtgtgctata ttttctatat gtttcttatg caattactaa tccttatatt 6660
ttagactcta accatgttgc tgtaataatt gtattagtga cattaagtaa tgttctaaaa 6720
aagatgaaag ctaaatgaag gttttaaggt gaagatggac actgtatatg ccgttttggt 6780
tgcttacaac ccagaacata atgatttaaa aaatgcggtt gaattattgt tgagacaagt 6840
tactaaagtt gtcgtttgca ataactctac aaatggttat aaatatgctg aaaattcttc 6900
aggcgatgta aaaatattca atttcaatga taatttaggc atagcagaag cccaaagtat 6960
aggaatgaaa tgggcttttg aaaatggcgc tgattttata ttgcaaatgg atcaggatag 7020
tattcctgat cctaagatgg tagagcagtt acttacttgt tacaaaaaat tgcttaaaca 7080
aaatgtcaat gttggtttag ttggttcaca agattttgat aaagtaactg gtgaattaaa 7140
taaagcaagg gtaaaaaaag ggaaaccact tacagaagtt tattatgagg tagatagtac 7200
attaagttct ggcagtctaa taccaaaaaa tagttggttg attgttggag gaatgaaaga 7260
tgagcttttt atcgatgcgg tagaccatga atattgttgg agattaagag ctgctgggtt 7320
taaagtaatt aggaataaaa atgcgttact tgcacataga cttggagatg ggcgatttaa 7380
gatcttaaat attctttctg tcggtttgcc aagcccattt cgtcattatt atgctactcg 7440
aaatatcttt cttttattaa ataaaaatta tgtacccatc tactggaaaa tttctagtct 7500
ggttaaatta attggaaagg tttttttata tcctattttc cttccaaatg gtaataaaag 7560
gttatatttt tttttaaaag gcattaatga cggtttaatg ggtcgaagtg gtaaaatgaa 7620
atgaatcata gattagaaaa attctcagtt ttaattagca tttataaaaa tgatctaccg 7680
caattttttg aggtggctct acgctctatt tttcacgatc aaacacttaa gccagatcaa 7740
atagtaattg ttgcagatgg agaactccat caaacacaca tcgatattat aaattcattc 7800
attgatgatg ttggcaataa aatagtaaca tttgtacctt tacctagaaa tgttggattg 7860
gctaatgcct taaatgaagg attaaaggct tgtaggaatg agttagtggc aagaatggat 7920
gctgatgata tttctttgcc tcatcggttt gagaaacaaa tttcttttat gattaataat 7980
tcagaaatag atgtatgtgg cagttttatt gatgaaattg aaactgttac tgaggagttt 8040
atttcaacac gcaaagtgcc tctcgaacat agagaaatag ttaaattcgc gaggaaacga 8100
agcgcagtta gccatccttc tgtaattttt agaaagaata cagtattagc tgttggtggt 8160
tatcctccat tcagaaaatc tcaagatttt gcattgtgga gcctattaat tgtacataat 8220
gcaagatttg caaatcttcc agatatttta ttaaaaatgc gaactggtcg taatcttatg 8280
gctcgacgtg gattgtcata tttattgtac gagtataaag tattgtatta tcaatataaa 8340
attggtttta ttcgaaaaaa tgaattaata agtaatgcta tgttgagaac attttttcgt 8400
ataatgccat ctaaattaaa ggagctgatg tattcaatcg ttaggaatcg ataataataa 8460
ttttctgatt aagtgttatg gatttatttt tattaggcat attctataat taagcataac 8520
ccgcatacca cccagcggta tcctgacagg agtaaacaat gtcaaagcaa cagatcggcg 8580
tcgtcggtat ggcagtgatg gggcgcaacc ttgcgctcaa tatcgaaagc cgtggttata 8640
ccgtctctat tttcaaccgt tcccgtgaaa agaccgaaga agtgattacc gaaaatccag 8700
gcaagaaact ggttccttac tatacggtga aagaatttgt tgaatctctg gaaacgcctc 8760
gtcgcatcct gttaatggtg aaagcaggtg ctggcacgga tgctgctatt gattccctca 8820
agccatacct cgataaaggt gacatcatca ttgatggtgg taacaccttc ttccatgaca 8880
ccattcgtcg taaccgtgag ctttctgcag aaggctttaa ctttatcggt accggtgttt 8940
ccggtggtga agaaggtgcg ctgaaaggtc cttccattat gcctggtggg cagaaagaag 9000
cttatgaact gattgcgccg atcctgacca aaatcgccgc tgtggctgaa gacggcgaac 9060
cgtgcgttac ctatattggt gccgatggtg caggtcatta tgtgaagatg gttcacaacg 9120
gtattgaata cggtgatatg cagctgattg ctgaagccta ttctctgctt aaaggtggct 9180
tgaacctcac caacgaagaa ctggcgcaga cctttaccga gtggaataac ggtgaactga 9240
gcagctacct gatcgacatc accaaagata tcttcaccaa aaaagatgaa gagggtaact 9300
acctggttga tgtgattctg gatgaagcag caaacaaagg tacgggcaaa tggaccagcc 9360
agagcgcgct ggatctcggc gaaccgctgt cgctgattac cgagtctgtg tttgcacgtt 9420
atatctcttc tctgaaagag cagcgtgttg ccgcatctaa agttctctct ggcccgcaag 9480
cgcagccagc tggcgacaat gctgagttca tcgaaaaagt tcgccgtgcg ctgtatctgg 9540
gcaaaatcgt ttcttacgct cagggcttct ctcagctacg cgctgcgtct gaagagtaca 9600
actgggatct gaactacggt gaaatcgcga agattttccg tgctggctgc atcatccgtg 9660
cgcagttcct gcagaaaatc accgatgctt atgccgaaaa tccgcagatc gctaacctgt 9720
tgctggctcc ttacttcaag caaattgccg atgactacca gcaggcgctg cgcgatgtcg 9780
tcgcttacgc agtacagaac ggtatcccgg tgccgacctt cgccgctgcg gttgcctatt 9840
acgacagcta ccgcgccgct gttctgcctg cgaacctgat ccaggcacag cgtgactatt 9900
tcggtgcgca tacttataag cgcattgata aagaaggtgt gttccatacc gaatggctgg 9960
attaatctga tttaaatcaa ttaatcaaag caaggcccgg agaaaccctc cgggcttttt 10020
tattatacaa agcggcaggt tagggccttt ttttataatt tatagttaaa aacgcgatat 10080
aatacagcgc cgcacagcag gatcgctgcc ttgacagttc atctacatca gcgttaaaaa 10140
tcccgcagta gatgaagctg tggtggtgga ttaatgacca ctctaaatgt ttaaccggaa 10200
gaagtcagag ctaatgaaaa taacaatttc aggaacaggt tatgttggtc tttcaaatgg 10260
tattctgatt gcgcaaaacc acgaagtggt tgcactggat atcgttcagg ccaaagtgga 10320
catgcttaac aagaggcagt caccgcttgt tgataaggag attgaagagt atctggcgac 10380
taaagatctc aatttccgcg ctacgacaga taagtatgac gcgtataaaa atgccgatta 10440
cgttattatt gccacaccta ccgattatga tccgaaaaca aattatttta atacctcaag 10500
cgtggaagcg gtcattcgtg atgtgacaga aattaatccc aacgcggtaa tgattataaa 10560
atcaactatc cctgttggtt ttacagagtc cattaaagaa cgttttggta ttgaaaatgt 10620
gatcttttcg cctgagtttt tgcgtgaagg taaagcactt tatgataact tacacccatc 10680
acgcattgtg attggcgagc agtctgaacg cgctaaacgt tttgctgcgt tattacagga 10740
aggcgccatt aagcaagaca taccaacatt gtttactgac tcaaccgagg ctgaggcgat 10800
taaacttttt gcgaacactt atctggcgat gcgtgtagcg tatttcaatg aacttgatag 10860
ttatgctgaa agcctgggac ttaattcacg ccagattatt gagggcgtat gccttgaccc 10920
gcgtatcggt aatcactaca acaacccgtc attcggttat ggtggttatt gtctgccgaa 10980
agatactaag cagttactgg caaattacca gtctgtgccg aataacctga tctcggcaat 11040
tgttgacgcc aaccgcacgc gcaaagattt tattgccgat tctatccttg cacgtaaacc 11100
gaaagttgtt ggcgtctatc gtttgattat gaagaatggt tcagacaatt ttcgtgcttc 11160
ctcgattcag ggtattatga agcgaatcaa ggcgaaaggt gtgcctgtaa tcgtttatga 11220
gccagctatg aaagaggacg attttttccg gtcgcgcgtg gtacgtgatc tggatgcgtt 11280
caaacaagaa gctgatgtta ttatttctaa ccgtatgtct gccgatctgg ctgatgtagc 11340
agataaagtt tatacgcgcg acttgtttgg caatgattaa ttattttgtt tcattctaag 11400
aaaaggccct aataaattag ggccttttct tatggttttg taaaatcaaa ctttatagaa 11460
gttacgatac cattctacaa agttctttac cccttcttta actgacgttt caggtttgaa 11520
tcctattacg tcatacagtg cttttgtatc agcactggtt tccagtacat caccgggttg 11580
gagaggcatc atatttttgt tggcttcaat acccagagcc tcttctaacg cattgatata 11640
gtccatcaac tccacaggcg aactattacc aatgttatag acacgatatg gtgctgaact 11700
tgttgcaggc gagcctgttt ctacagccca ctgtgggttt ttttctggaa taacatcctg 11760
taagcgaata atagcttcgg caatatcatc aatgtaagta aagtcacgct tcattttgcc 11820
gaagttgtaa acatcaatgc ttttaccttc cagcatggct ttagtgaatt taaataatgc 11880
catatccgga cgtccccatg gaccataaac cgtaaagaaa cgcagccctg tggtcggtaa 11940
gccatacaaa tgagaatatg tatgggccat gagttcattc gcttttttag ttgctgcata 12000
aagcgaaaca ggatgatcta cagagtcatc tgtagagaaa ggcatcttgc ggttcatgcc 12060
ataaacagaa ctggaggaag cgtaaagtag atgctgaaca ttattatggc gacatccttc 12120
tagtatgttc aggaatccaa tcaggtttgc atctgcatat gcattgggat tttcaagaga 12180
gtaacgtaca ccggcttgcg cagcgaggtt tattacgcgt tcgaaccgct cgtctgcaaa 12240
cagtgccgcc attttctcac gatcggccag gtcaatttta taaaaactga agttgtcgtg 12300
cttgagtaaa tcaagtcgtg cttgtttgag gttgacatcg taataatcat ttaagttgtc 12360
aatgcctaca acctgatgac cagctgcaag aagccgttta cttagataga aaccgataaa 12420
gccagcagct cccgtaacca gaaatttcat ttataatcct cgctcaggct agaatatagc 12480
caatcttcat ctggcataac tgaaagttaa attataccgt tagacaagaa aaaaagataa 12540
tcggtatcag ttctaaactt ggctgttttt tctggtaacg tgctcatttt acaatcaaag 12600
ctgttctaag ctgactatac aagccgacgt cattatctcc aaccgtatgg cagaagagct 12660
taaggatgtg gcagacaaag tctacacccg cgatctcttt ggcagtgact aacatcctgt 12720
tatcatggcg attttcgccc tgattctctt atgttccctt tgtaataatt cattattttt 12780
atcatttatc ctatagcatt catggcgatt atcgctaaac tatggcggcg cgccacgtgg 12840
gatccccggg taccgagctc gaattcgccc tatagtgagt cgtattacaa ttcactggcc 12900
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 12960
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 13020
caacagttgc gcagctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc 13080
tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 13140
agttaagcca gccccgacac ccgccaacac ccgctgacgc gaaccccttg cggccgcatc 13200
gaatataact tcgtataatg tatgctatac gaagttatta gcgatgagct cggacttcca 13260
ttgttcattc cacggacaaa aacagagaaa ggaaacgaca gaggccaaaa agctcgcttt 13320
cagcacctgt cgtttccttt cttttcagag ggtattttaa ataaaaacat taagttatga 13380
cgaagaagaa cggaaacgcc ttaaaccgga aaattttcat aaatagcgaa aacccgcgag 13440
gtcgccgccc cgtaacctgt cggatcaccg gaaaggaccc gtaaagtgat aatgattatc 13500
atctacatat cacaacgtgc gtggaggcca tcaaaccacg tcaaataatc aattatgacg 13560
caggtatcgt attaattgat ctgcatcaac ttaacgtaaa aacaacttca gacaatacaa 13620
atcagcgaca ctgaatacgg ggcaacctca tgtccgagct cgcgagctcg tcgacagcga 13680
cacacttgca tcggatgcag cccggttaac gtgccggcac ggcctgggta accaggtatt 13740
ttgtccacat aaccgtgcgc aaaatgttgt ggataagcag gacacagcag caatccacag 13800
caggcataca accgcacacc gaggttactc cgttctacag gttacgacga catgtcaata 13860
cttgcccttg acaggcattg atggaatcgt agtctcacgc tgatagtctg atcgacaata 13920
caagtgggac cgtggtccca gaccgataat cagaccgaca acacgagtgg gatcgtggtc 13980
ccagactaat aatcagaccg acgatacgag tgggaccgtg gtcccagact aataatcaga 14040
ccgacgatac gagtgggacc gtggttccag actaataatc agaccgacga tacgagtggg 14100
accgtggtcc cagactaata atcagaccga cgatacgagt gggaccatgg tcccagacta 14160
ataatcagac cgacgatacg agtgggaccg tggtcccagt ctgattatca gaccgacgat 14220
acgagtggga ccgtggtccc agactaataa tcagaccgac gatacgagtg ggaccgtggt 14280
cccagactaa taatcagacc gacgatacga gtgggaccgt ggtcccagtc tgattatcag 14340
accgacgata caagtggaac agtgggccca gagagaatat tcaggccagt tatgctttct 14400
ggcctgtaac aaaggacatt aagtaaagac agataaacgt agactaaaac gtggtcgcat 14460
cagggtgctg gcttttcaag ttccttaaga atggcctcaa ttttctctat acactcagtt 14520
ggaacacgag acctgtccag gttaagcacc attttatcgc ccttatacaa tactgtcgct 14580
ccaggagcaa actgatgtcg tgagcttaaa ctagttcttg atgcagatga cgttttaagc 14640
acagaagtta aaagagtgat aacttcttca gcttcaaata tcaccccagc ttttttctgc 14700
tcatgaaggt tagatgcctg ctgcttaagt aattcctctt tatctgtaaa ggctttttga 14760
agtgcatcac ctgaccgggc agatagttca ccggggtgag aaaaaagagc aacaactgat 14820
ttaggcaatt tggcggtgtt gatacagcgg gtaataatct tacgtgaaat attttccgca 14880
tcagccagcg cagaaatatt tccagcaaat tcattctgca atcggcttgc ataacgctga 14940
ccacgttcat aagcacttgt tgggcgataa tcgttaccca atctggataa tgcagccatc 15000
tgctcatcat ccagctcgcc aaccagaaca cgataatcac tttcggtaag tgcagcagct 15060
ttacgacggc gactcccatc ggcaatttct atgacaccag atactcttcg accgaacgcc 15120
ggtgtctgtt gaccagtcag tagaaaagaa gggatgagat catccagtgc gtcctcagta 15180
agcagctcct ggtcacgttc attacctgac catacccgag aggtcttctc aacactatca 15240
ccccggagca cttcaagagt aaacttcaca tcccgaccac atacaggcaa agtaatggca 15300
ttaccgcgag ccattactcc tacgcgcgca attaacgaat ccaccatcgg ggcagctggt 15360
gtcgataacg aagtatcttc aaccggttga gtattgagcg tatgttttgg aataacaggc 15420
gcacgcttca ttatctaatc tcccagcgtg gtttaatcag acgatcgaaa atttcattgc 15480
agacaggttc ccaaatagaa agagcatttc tccaggcacc agttgaagag cgttgatcaa 15540
tggcctgttc aaaaacagtt ctcatccgga tctgaccttt accaacttca tccgtttcac 15600
gtacaacatt ttttagaacc atgcttcccc aggcatcccg aatttgctcc tccatccacg 15660
gggactgaga gccattacta ttgctgtatt tggtaagcaa aatacgtaca tcaggctcga 15720
accctttaag atcaacgttc ttgagcagat cacgaagcat atcgaaaaac tgcagtgcgg 15780
aggtgtagtc aaacaactca gcaggcgtgg gaacaatcag cacatcagca gcacatacga 15840
cattaatcgt gccgataccc aggttaggcg cgctgtcaat aactatgaca tcatagtcat 15900
gagcaacagt ttcaatggcc agtcggagca tcaggtgtgg atcggtgggc agtttacctt 15960
catcaaattt gcccattaac tcagtttcaa tacggtgcag agccagacag gaaggaataa 16020
tgtcaagccc cggccagcaa gtgggcttta ttgcataagt gacatcgtcc ttttccccaa 16080
gatagaaagg caggagagtg tcttctgcat gaatatgaag atctggtacc catccgtgat 16140
acattgaggc tgttccctgg gggtcgttac cttccacgag caaaacacgt agccccttca 16200
gagccagatc ctgagcaaga tgaacagaaa ctgaggtttt gtaaacgcca cctttatggg 16260
cagcaacccc gatcaccggt ggaaatacgt cttcagcacg tcgcaatcgc gtaccaaaca 16320
catcacgcat atgattaatt tgttcaattg tataaccaac acgttgctca acccgtcctc 16380
gaatttccat atccgggtgc ggtagtcgcc ctgctttctc ggcatctctg atagcctgag 16440
aagaaacccc aactaaatcc gctgcttcac ctattctcca gcgccgggtt attttcctcg 16500
cttccgggct gtcatcatta aactgtgcaa tggcgatagc cttcgtcatt tcatgaccag 16560
cgtttatgca ctggttaagt gtttccatga gtttcattct gaacatcctt taatcattgc 16620
tttgcgtttt tttattaaat cttgcaattt actgcaaagc aacaacaaaa tcgcaaagtc 16680
atcaaaaaac cgcaaagttg tttaaaataa gagcaacact acaaaaggag ataagaagag 16740
cacatacctc agtcacttat tatcactagc gctcgccgca gccgtgtaac cgagcatagc 16800
gagcgaactg gcgaggaagc aaagaagaac tgttctgtca gatagctctt acgctcagcg 16860
caagaagaaa tatccaccgt gggaaaaact ccaggtagag gtacacacgc ggatagccaa 16920
ttcagagtaa taaactgtga taatcaaccc tcatcaatga tgacgaacta acccccgata 16980
tcaggtcaca tgacgaaggg aaagagaagg aaatcaactg tgacaaactg ccctcaaatt 17040
tggcttcctt aaaaattaca gttcaaaaag tatgagaaaa tccatgcagg ctgaaggaaa 17100
cagcaaaact gtgacaaatt accctcagta ggtcagaaca aatgtgacga accaccctca 17160
aatctgtgac agataaccct cagactatcc tgtcgtcatg gaagtgatat cgcggaagga 17220
aaatacgata tgagtcgtct ggcggccttt ctttttctca atgtatgaga ggcgcattgg 17280
agttctgctg ttgatctcat taacacagac ctgcaggaag cggcggcgga agtcaggcat 17340
acgctggtaa ctttgaggca gctggtaacg ctctatgatc cagtcgattt tcagagagac 17400
gatgcctgag ccatccggct tacgatactg acacagggat tcgtataaac gcatggcata 17460
cggattggtg atttcttttg tttcactaag ccgaaactgc gtaaaccggt tctgtaaccc 17520
gataaagaag ggaatgagat atgggttgat atgtacactg taaagccctc tggatggact 17580
gtgcgcacgt ttgataaacc aaggaaaaga ttcatagcct ttttcatcgc cggcatcctc 17640
ttcagggcga taaaaaacca cttccttccc cgcgaaactc ttcaatgcct gccgtatatc 17700
cttactggct tccgcagagg tcaatccgaa tatttcagca tatttagcaa catggatctc 17760
gcagataccg tcatgttcct gtagggtgcc atcagatttt ctgatctggt caacgaacag 17820
atacagcata cgtttttgat cccgggagag actatatgcc gcctcagtga ggtcgtttga 17880
ctggacgatt cgcgggctat ttttacgttt cttgtgattg ataaccgctg tttccgccat 17940
gacagatcca tgtgaagtgt gacaagtttt tagattgtca cactaaataa aaaagagtca 18000
ataagcaggg ataactttgt gaaaaaacag cttcttctga gggcaatttg tcacagggtt 18060
aagggcaatt tgtcacagac aggactgtca tttgagggtg atttgtcaca ctgaaagggc 18120
aatttgtcac aacaccttct ctagaaccag catggataaa ggcctacaag gcgctctaaa 18180
aaagaagatc taaaaactat aaaaaaaata attataaaaa tatccccgtg gataagtgga 18240
taaccccaag ggaagttttt tcaggcatcg tgtgtaagca gaatatataa gtgctgttcc 18300
ctggtgcttc ctcgctcact cgaccgggag ggttcgagaa gggggggcac cccccttcgg 18360
cgtgcgcggt cacgcgcaca gggcgcagcc ctggttaaaa acaaggttta taaatattgg 18420
tttaaaagca ggttaaaaga caggttagcg gtggccgaaa aacgggcgga aacccttgca 18480
aatgctggat tttctgcctg tggacagccc ctcaaatgtc aataggtgcg cccctcatct 18540
gtcagcactc tgcccctcaa gtgtcaagga tcgcgcccct catctgtcag tagtcgcgcc 18600
cctcaagtgt caataccgca gggcacttat ccccaggctt gtccacatca tctgtgggaa 18660
actcgcgtaa aatcaggcgt tttcgccgat ttgcgaggct ggccagctcc acgtcgccgg 18720
ccgaaatcga gcctgcccct catctgtcaa cgccgcgccg ggtgagtcgg cccctcaagt 18780
gtcaacgtcc gcccctcatc tgtcagtgag ggccaagttt tccgcgaggt atccacaacg 18840
ccggcggccg gccgcggtgt ctcgcacacg gcttcgacgg cgtttctggc gcgtttgcag 18900
ggccatagac ggccgccagc ccagcggcga gggcaaccag ccgagggctt cgccctgtcg 18960
ctcgactgcg gcgagcacta ctggctgtaa aaggacagac cacatcatgg ttctgtgttc 19020
attaggttgt tctgtccatt gctgacataa tccgctccac ttcaacgtaa caccgcacga 19080
agatttctat tgttcctgaa ggcatattca aatcgttttc gttaccgctt gcaggcatca 19140
tgacagaaca ctacttccta taaacgctac acaggctcct gagattaata atgcggatct 19200
ctacgataat gggagatttt cccgactgtt tcgttcgctt ctcagtggat aacagccagc 19260
ttctctgttt aacagacaaa aacagcatat ccactcagtt ccacatttcc atataaaggc 19320
caaggcattt attctcagga taattgtttc agcatcgcaa ccgcatcaga ctccggcatc 19380
gcaaactgca cccggtgccg ggcagccaca tccagcgcaa aaaccttcgt gtagacttcc 19440
gttgaactga tggacttatg tcccatcagg ctttgcagaa ctttcagcgg tataccggca 19500
tacagcatgt gcatcgcata ggaatggcgg aacgtatgtg gtgtgaccgg aacagagaac 19560
gtcacaccgt cagcagcagc ggcggcaacc gcctccccaa tccaggtcct gaccgttctg 19620
tccgtcactt cccagatccg cgctttctct gtccttcctg tgcgacggtt acgccgctcc 19680
atgagcttat cgcgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc 19740
tggtgtccct gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga 19800
tcggcacgta agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt 19860
ttttgagtta tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg 19920
atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 19980
agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 20040
cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 20100
gaatgctcat ccggaatttc gtatggcaat gaaagacggt gagctggtga tatgggatag 20160
tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 20220
tgaataccac gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 20280
cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 20340
caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 20400
cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 20460
ggcgattcag gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga 20520
attacaacag tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg 20580
gtgcccttaa acgcctggtt gctacgcctg aataagtgat aataagcgga tgaatggcag 20640
aaattcgatg ataagctgtc aaacatgaga attggtcgac ggcccgggcg gccgcaaggg 20700
gttcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg 20760
gcagtgagcg caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac 20820
actttatgct tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag 20880
gaaacagcta tgaccatgat tacgccaagc tatttaggtg agactataga atactcaagc 20940
ttgcatgcct gcaggtcgac tctagaggat cccacgacgt cg 20982
<210> 29
<211> 22887
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 29
gcggccgcaa ggggttcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 60
cggcatcaga gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat 120
gcgtaaggag aaaataccgc atcaggcgcc attcgccatt cagctgcgca actgttggga 180
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 240
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 300
cagtgaattg taatacgact cactataggg cgaattcgag ctcggtaccc ggggatccca 360
cgtggcgcgc cgccatagtt tagcgataat cgccatgaat gctataggat aaatgataaa 420
aataatgaat tattacaaag ggaacataag agaatcaggg cgaaaatcgc catgataaca 480
ggatgttagt cactgccaaa gagatcgcgg gtgtagactt tgtctgccac atccttaagc 540
tcttctgcca tacggttgga gataatgacg tcggcttgta tagtcagctt agaacagctt 600
tgattgtaaa atgagcacgt taccagaaaa aacagccaag tttagaactg ataccgatta 660
tctttttttc ttgtctaacg gtataattta actttcagtt atgccagatg aagattggct 720
atattctagc ctgagcgagg attataaatg aaatttctgg ttacgggagc tgctggcttt 780
atcggtttct atctaagtaa acggcttctt gcagctggtc atcaggttgt aggcattgac 840
aacttaaatg attattacga tgtcaacctc aaacaagcac gacttgattt actcaagcac 900
gacaacttca gtttttataa aattgacctg gccgatcgtg agaaaatggc ggcactgttt 960
gcagacgagc ggttcgaacg cgtaataaac ctcgctgcgc aagccggtgt acgttactct 1020
cttgaaaatc ccaatgcata tgcagatgca aacctgattg gattcctgaa catactagaa 1080
ggatgtcgcc ataataatgt tcagcatcta ctttacgctt cctccagttc tgtttatggc 1140
atgaaccgca agatgccttt ctctacagat gactctgtag atcatcctgt ttcgctttat 1200
gcagcaacta aaaaagcgaa tgaactcatg gcccatacat attctcattt gtatggctta 1260
ccgaccacag ggctgcgttt ctttacggtt tatggtccat ggggacgtcc ggatatggca 1320
ttatttaaat tcactaaagc catgctggaa ggtaaaagca ttgatgttta caacttcggc 1380
aaaatgaagc gtgactttac ttacattgat gatattgccg aagctattat tcgcttacag 1440
gatgttattc cagaaaaaaa cccacagtgg gctgtagaaa caggctcgcc tgcaacaagt 1500
tcagcaccat atcgtgtcta taacattggt aatagttcgc ctgtggagtt gatggactat 1560
atcaatgcgt tagaagaggc tctgggtatt gaagccaaca aaaatatgat gcctctccaa 1620
cccggtgatg tactggaaac cagtgctgat acaaaagcac tgtatgacgt aataggattc 1680
aaacctgaaa cgtcagttaa agaaggggta aagaactttg tagaatggta tcgtaacttc 1740
tataaagttt gattttacaa aaccataaga aaaggcccta atttattagg gccttttctt 1800
agaatgaaac aaaataatta atcattgcca aacaagtcgc gcgtataaac tttatctgct 1860
acatcagcca gatcggcaga catacggtta gaaataataa catcagcttc ttgtttgaac 1920
gcatccagat cacgtaccac gcgcgaccgg aaaaaatcgt cctctttcat agctggctca 1980
taaacgatta caggcacacc tttcgccttg attcgcttca taataccctg aatcgaggaa 2040
gcacgaaaat tgtctgaacc attcttcata atcaaacgat agacgccaac aactttcggt 2100
ttacgtgcaa ggatagaatc ggcaataaaa tctttgcgcg tgcggttggc gtcaacaatt 2160
gccgagatca ggttattcgg cacagactgg taatttgcca gtaactgctt agtatctttc 2220
ggcagacaat aaccaccata accgaatgac gggttgttgt agtgattacc gatacgcggg 2280
tcaaggcata cgccctcaat aatctggcgt gaattaagtc ccaggctttc agcataacta 2340
tcaagttcat tgaaatacgc tacacgcatc gccagataag tgttcgcaaa aagtttaatc 2400
gcctcagcct cggttgagtc agtaaacaat gttggtatgt cttgcttaat ggcgccttcc 2460
tgtaataacg cagcaaaacg tttagcgcgt tcagactgct cgccaatcac aatgcgtgat 2520
gggtgtaagt tatcataaag tgctttacct tcacgcaaaa actcaggcga aaagatcaca 2580
ttttcaatac caaaacgttc tttaatggac tctgtaaaac caacagggat agttgatttt 2640
ataatcatta ccgcgttggg attaatttct gtcacatcac gaatgaccgc ttccacgctt 2700
gaggtattaa aataatttgt tttcggatca taatcggtag gtgtggcaat aataacgtaa 2760
tcggcatttt tatacgcgtc atacttatct gtcgtagcgc ggaaattgag atctttagtc 2820
gccagatact cttcaatctc cttatcaaca agcggtgact gcctcttgtt aagcatgtcc 2880
actttggcct gaacgatatc cagtgcaacc acttcgtggt tttgcgcaat cagaatacca 2940
tttgaaagac caacataacc tgttcctgaa attgttattt tcattagctc tgacttcttc 3000
cggttaaaca tttagagtgg tcattaatcc accaccacag cttcatctac tgcgggattt 3060
ttaacgctga tgtagatgaa ctgtcaaggc agcgatcctg ctgtgcggcg ctgtattata 3120
tcgcgttttt aactataaat tataaaaaaa ggccctaacc tgccgctttg tataataaaa 3180
aagcccggag ggtttctccg ggccttgctt tgattaattg atttaaatca gattaatcca 3240
gccattcggt atggaacaca ccttctttat caatgcgctt ataagtatgc gcaccgaaat 3300
agtcacgctg tgcctggatc aggttcgcag gcagaacagc ggcgcggtag ctgtcgtaat 3360
aggcaaccgc agcggcgaag gtcggcaccg ggataccgtt ctgtactgcg taagcgacga 3420
catcgcgcag cgcctgctgg tagtcatcgg caatttgctt gaagtaagga gccagcaaca 3480
ggttagcgat ctgcggattt tcggcataag catcggtgat tttctgcagg aactgcgcac 3540
ggatgatgca gccagcacgg aaaatcttcg cgatttcacc gtagttcaga tcccagttgt 3600
actcttcaga cgcagcgcgt agctgagaga agccctgagc gtaagaaacg attttgccca 3660
gatacagcgc acggcgaact ttttcgatga actcagcatt gtcgccagct ggctgcgctt 3720
gcgggccaga gagaacttta gatgcggcaa cacgctgctc tttcagagaa gagatataac 3780
gtgcaaacac agactcggta atcagcgaca gcggttcgcc gagatccagc gcgctctggc 3840
tggtccattt gcccgtacct ttgtttgctg cttcatccag aatcacatca accaggtagt 3900
taccctcttc atcttttttg gtgaagatat ctttggtgat gtcgatcagg tagctgctca 3960
gttcaccgtt attccactcg gtaaaggtct gcgccagttc ttcgttggtg aggttcaagc 4020
cacctttaag cagagaatag gcttcagcaa tcagctgcat atcaccgtat tcaataccgt 4080
tgtgaaccat cttcacataa tgacctgcac catcggcacc aatataggta acgcacggtt 4140
cgccgtcttc agccacagcg gcgattttgg tcaggatcgg cgcaatcagt tcataagctt 4200
ctttctgccc accaggcata atggaaggac ctttcagcgc accttcttca ccaccggaaa 4260
caccggtacc gataaagtta aagccttctg cagaaagctc acggttacga cgaatggtgt 4320
catggaagaa ggtgttacca ccatcaatga tgatgtcacc tttatcgagg tatggcttga 4380
gggaatcaat agcagcatcc gtgccagcac ctgctttcac cattaacagg atgcgacgag 4440
gcgtttccag agattcaaca aattctttca ccgtatagta aggaaccagt ttcttgcctg 4500
gattttcggt aatcacttct tcggtctttt cacgggaacg gttgaaaata gagacggtat 4560
aaccacggct ttcgatattg agcgcaaggt tgcgccccat cactgccata ccgacgacgc 4620
cgatctgttg ctttgacatt gtttactcct gtcaggatac cgctgggtgg tatgcgggtt 4680
atgcttaatt atagaatatg cctaataaaa ataaatccat aacacttaat cagaaaatta 4740
ttattatcga ttcctaacga ttgaatacat cagctccttt aatttagatg gcattatacg 4800
aaaaaatgtt ctcaacatag cattacttat taattcattt tttcgaataa aaccaatttt 4860
atattgataa tacaatactt tatactcgta caataaatat gacaatccac gtcgagccat 4920
aagattacga ccagttcgca tttttaataa aatatctgga agatttgcaa atcttgcatt 4980
atgtacaatt aataggctcc acaatgcaaa atcttgagat tttctgaatg gaggataacc 5040
accaacagct aatactgtat tctttctaaa aattacagaa ggatggctaa ctgcgcttcg 5100
tttcctcgcg aatttaacta tttctctatg ttcgagaggc actttgcgtg ttgaaataaa 5160
ctcctcagta acagtttcaa tttcatcaat aaaactgcca catacatcta tttctgaatt 5220
attaatcata aaagaaattt gtttctcaaa ccgatgaggc aaagaaatat catcagcatc 5280
cattcttgcc actaactcat tcctacaagc ctttaatcct tcatttaagg cattagccaa 5340
tccaacattt ctaggtaaag gtacaaatgt tactatttta ttgccaacat catcaatgaa 5400
tgaatttata atatcgatgt gtgtttgatg gagttctcca tctgcaacaa ttactatttg 5460
atctggctta agtgtttgat cgtgaaaaat agagcgtaga gccacctcaa aaaattgcgg 5520
tagatcattt ttataaatgc taattaaaac tgagaatttt tctaatctat gattcatttc 5580
attttaccac ttcgacccat taaaccgtca ttaatgcctt ttaaaaaaaa atataacctt 5640
ttattaccat ttggaaggaa aataggatat aaaaaaacct ttccaattaa tttaaccaga 5700
ctagaaattt tccagtagat gggtacataa tttttattta ataaaagaaa gatatttcga 5760
gtagcataat aatgacgaaa tgggcttggc aaaccgacag aaagaatatt taagatctta 5820
aatcgcccat ctccaagtct atgtgcaagt aacgcatttt tattcctaat tactttaaac 5880
ccagcagctc ttaatctcca acaatattca tggtctaccg catcgataaa aagctcatct 5940
ttcattcctc caacaatcaa ccaactattt tttggtatta gactgccaga acttaatgta 6000
ctatctacct cataataaac ttctgtaagt ggtttccctt tttttaccct tgctttattt 6060
aattcaccag ttactttatc aaaatcttgt gaaccaacta aaccaacatt gacattttgt 6120
ttaagcaatt ttttgtaaca agtaagtaac tgctctacca tcttaggatc aggaatacta 6180
tcctgatcca tttgcaatat aaaatcagcg ccattttcaa aagcccattt cattcctata 6240
ctttgggctt ctgctatgcc taaattatca ttgaaattga atatttttac atcgcctgaa 6300
gaattttcag catatttata accatttgta gagttattgc aaacgacaac tttagtaact 6360
tgtctcaaca ataattcaac cgcatttttt aaatcattat gttctgggtt gtaagcaacc 6420
aaaacggcat atacagtgtc catcttcacc ttaaaacctt catttagctt tcatcttttt 6480
tagaacatta cttaatgtca ctaatacaat tattacagca acatggttag agtctaaaat 6540
ataaggatta gtaattgcat aagaaacata tagaaaatat agcacacaca actcactgta 6600
ttttatgatt ttaatcgtga gaaggagatt aattaataaa aacaaagtaa ataaaataac 6660
gccaagttga tttaaaaaat aaactgactg caattcataa tatatatatg cactataatc 6720
acggatagga gtttgaattt tgatgacatt acccaaacca gaacctataa caaaatttga 6780
tacagactct gtaagatcat taattaatac agtaaactga tcccatctaa ctcctaaaga 6840
agaatcagct ccatttgatt tcatgattat caactcaatt gaatatgtaa taaaaaaagg 6900
gagaatcaca gtaagaaaaa ccccaaaaat aattttcctt aatttagcgt atcgtgagtt 6960
agatttagaa catagtataa tatacataaa aaacaagcat atcgaaacaa aatatgcaaa 7020
attaccagcc actatagtac ctatagccag aataacggtt attgtatttt tgaatcgata 7080
atagaaataa tcttttatga ctatatgcaa cataaaggca aatggaatga gagcatttcc 7140
tttaatttga actctataga aaccacttcc atatgtataa acatcaccat aatcattctc 7200
caaaaaataa tgtcttagtg ctgaataatc accaatacca tatgtttttg tcatataaat 7260
actaatgatg gatataataa ccgcctgtaa taccattaaa tataaaaata ttttaacaat 7320
cgagatggtt ccataagagc agaaataagc acataatata aataatatga taatataaaa 7380
cctaattatt atcgctatat cgttaccctt gatataggaa taaataaaat ttataaaaag 7440
agctaataga aatattaaaa taacaggata gtgatatatt ccgtttgcaa ttttctttgt 7500
aaatgacatg atacaaagac ataaaaaccc ctccataatc caactatatt gaataaatgg 7560
aaagctacgt gtaaggaaaa atataaaccc aaaaaacaaa agaacactta aacttttgtc 7620
ttttgagtta taaaaatcag aagtcatgtt tgcactctaa ttagatgggc ttgaggaagt 7680
aatccctaaa atcaattcgc tattaatatt tcgtatcaat taataataat atcaaaaaat 7740
ctaacgatgt tcttacagac catgctattg cggctccaac aattccccaa tgataaataa 7800
aaatatataa tatgcataaa tatgggataa cttcgagcaa atgaataata gctgtaattt 7860
ttgatcttcc actagcctga actgaaacaa atgggatttg tgcaatgcaa ttaaaaaaga 7920
aacctattgc aagaattttt aatactatac ctggcgtccc atgatatgta ggtcccatcc 7980
aagcggacat tataaaatct gataaaataa ttatcaacat tacaattgga agtataccaa 8040
taaccattat aaaatatgat aatattttag tttgctttac cgattgcaat tctgaactta 8100
atcttggaaa aatagctctg gacaacgcac ttggtaatat cgttaagcgt tgtatacctt 8160
cagacggagc agtataaaaa gaaactttat cagcccccac aatgtgtgaa agaataaaac 8220
gatccatata tgtcataata gggctaataa tattgctaac tgttatccag cttccaaagc 8280
cgattaatct tttaactgtt acaattttta cagacagccc agatgatatt attagttttc 8340
gactaaatat aaaggtcact ataagtgata agactcttgc cataactaaa ccatatatag 8400
cacttagtaa tcctccatga aaaaaacaga aaatcactgg taatccagcc acaaaagagt 8460
tgttaattga ttttattaaa tttacttttc tgaacttttc catcccctca aaaatcccca 8520
accagacttg gtttaacaag tataagggta tggtagctga aataatatat attgctttga 8580
cagattctac aacatgattc gcgttaatgt ttaataattt aacaattaca ttgctactca 8640
aaaatagtac actaccgcca atcaagccca atatagttag aattaccgtt gaagttgaaa 8700
tgatcgctct taattcttta tgaacatttt tatatattga tacttctctt ataacagctc 8760
tggtcaatcc agcatcaaaa atacttgcat atccaactaa ggcaatagct aacgtaaaaa 8820
ggccaaattg ctcggtccct agaattctag acagtatacc taacgcagga attgctatta 8880
atgatggtat aatataccca cttatattcc ataaagtatt ctttacaata ctcacaaaaa 8940
taattccttc atgttatgca attctttagc ccttgcatct ttaatcgata aaatataatt 9000
attatgttct atcgtcggcc attttatgct cagaatagga tcattccata caatccctct 9060
atcactatca ggatgataat agttcgtcgt tttatataaa aattccgcag tctcgctcag 9120
caccaaaaaa ccatgtgcaa atccctcagg gatccacaat tgccgcttat tctcagcaga 9180
taaattcacc ccaacccatt taccaaaggt aggcgacgat ttacgaatat caacagctac 9240
atcaaaaacc tcaccaacaa cgcaacgtac cagtttccct tgcgcataag gttctaactg 9300
ataatgcagc ccgcgtaaaa cacctttact agacttcgaa tggttatcct gaacaaattc 9360
aaccttacgt cctacagctt cttcgaaaac tttctgatta aagctttcca taaagaaacc 9420
acgctcatca ccaaaaactt tcggctcgaa aattaacaca tcaggaattt ctgttttaat 9480
tacgttcatt ttattaataa cctttaatca ttttcagcag atactgtcca taagcatttt 9540
ttttcagcgg ctccgctaat gctttcacct gttcagcatc aataaaccct ttacggtaag 9600
caatttcttc tgggcaggaa acctttagtc cctggcgctc ttcaatggtg gcaatgaagt 9660
tgcttgcttc aataagactc tgatgtgtcc ccgtatccag ccatgcataa ccacgcccca 9720
tcatggcaac ggataaacgc ccctgttcca tataaatacg gttaatatcg gtaatttcca 9780
gttcaccacg ggcagaaggc ttaaggtttt tcgccatttc gacaacgtcg ttatcataga 9840
aataaagccc ggttaccgca taattacttt ttggttgtag cggtttttct tccaggctta 9900
ttgccgtacc gtttttatca aactcaacga cgccgtagcg ttcaggatca ttaacgtgat 9960
aggcaaatac cgttgcacca ctttctttgt taacagcgac atccattaac ttcggcagat 10020
catgaccgta gaagatatta tcaccaagaa ccaaagcaca atcatcacca ccgataaact 10080
cttcaccgat aataaacgcc tgcgcaagcc catctggagt cggttgcact ttgtactgaa 10140
gatttagccc ccactggcta ccgtcaccta gcagttgttg aaaacgagga gtatcctgtg 10200
gcgtactaat aatcagaata tcgcgaatac ccgccaacat cagtgtagag agcgggtaat 10260
agatcatcgg cttatcataa ataggtaata gctgtttact gacagccata gtcacaggat 10320
aaagacgtgt accagaacca cccgctaaaa taataccttt acgcgttttc atttcatcat 10380
tccttttaat tcatcttgct ccaccatcac gaacaagatg caaaaactat taaattgctg 10440
tagtcgtaat taattcgttg agcattcgtt tcacaccaac ctgccagtca ggcaagacaa 10500
gcgcaaagtt ctgctgaaat ttttctgtat taaggcgaga gttatgtgga cgacgagctg 10560
gtgtaggata ggctgttgtt ggtactgcgt tgagcttgtt gagtgcaagg ggaatacctg 10620
ctttgcgcgc ctcttcaaaa accagcgcag cataatcgtg ccaggttgtg gtaccactgg 10680
ctaccagatg gtacaaacct gcgacttccg gtttattcag tgccacacga atagcatgtg 10740
ccgtacaatc agccagcagc tcagcacctg ttggcgcacc aaattgatca tttatcacag 10800
ccagttcttc gcgctctttt gccagacgca acatcgtttt ggcgaagtta tttcctttag 10860
ctgcgtatac ccagctggta cggaaaataa gatgcttcgc gcaatgttcc tgtaacgctt 10920
tttctccggc taacttggtt tcaccgtaaa catttagcgg tgcggttgca tccgtctcca 10980
gccatggcgt gtcgccattt ccagggaata cgtagtcagt tgagtaatga attacccaag 11040
ccccaacttc attagcctct tttgcaattg attcaacact agtcgcattg agtaattgtg 11100
caaattcggg ttctgactca gccttatcta ctgcggtgtg agccgcagca ttaacaataa 11160
catcaggtcg aattcttttg actgtttcag ctacaccttc aggattacta aaatcaccac 11220
aataatcagt ggagtgaaca tcaagagcaa tcaaattacc caaaggtgcc agagcacgct 11280
gtagttccca acctacctgc cctgttttgc cgaaaaggag gatattcatt actggcggcc 11340
ctcatagttc tgttcaatcc acgattgata agcaccactt ttcacattat caacccattt 11400
tgtattggac aggtaccatt ccaatgtctt ccgaatcccg ctctcaaacg tttcctgcgg 11460
tttccagccc aattcgcggc taatcttctc tgcatcaatc gcataacggc gatcgtgtcc 11520
cgggcgatcg gcaacataag taatttgctc gcggtaagat ttctctttcg gtacaatctc 11580
atccagcaaa tcacaaatag tgagcactac atcgatgttt ttcttttcgt tgtgtccacc 11640
aatgttataa gtttcacccg ctttaccttc ggttacgacg gtatataacg cacgcgcatg 11700
atcttcaaca tacagccagt cacgaatttg atcccctttg ccataaatag gtaatgcctt 11760
accttccaga gcattcagaa taaccaatgg aatcaatttt tccgggaaat gataaggacc 11820
ataattatta gagcaattag tcacaatggt tggtaaacca taggtacgtt tccacgcgcg 11880
gactaaatga tcgctggatg cttttgaagc ggaataaggg ctgcttggcg cgtaagctgt 11940
tgtctctgta aataagggta attcttctgt attatttacc tcgtcaggat gaggcaaatc 12000
accatagact tcgtcagtag aaatatgatg aaaacggaat ctagttttct tgtcgctatc 12060
aagagcagac caataattgc gagcggcttc caaaaggaca tatgtaccaa caatattggt 12120
ttcaataaat gccgcaggac ctgtaattga acggtcaaca tggctttcag cagccaggtg 12180
catcactgca tctggctgat gctgagcaaa aatccgtgcc attgcagctg catcgcaaat 12240
atccgcatgt tcaaaaacat agcgttcaga atcagaaaca tcagcaagtg attccaggtt 12300
tccggcgtac gttaatttat cgacattaac aacactatcc tgcgtattat ttataatgtg 12360
acgaactaca gcaaaaccaa taaatcctgc gccaccagta acaagtattt tcacctaatt 12420
tattccatat tgcttcagag catgctgtga aataagcggc tctcagtttg attaatagaa 12480
gtattaatgc acgctaccgc ccctggcttt acagctacca gagcactgca tgcatgccta 12540
cgatgtgacg agcgttaccc actcgcgcta aacccgaaaa attcaaaagc taattgtctt 12600
accaatccgc tctggaaaca aggaaaatcc tggaaaactt tgactaaaat cctattgcta 12660
actcgttgtt attctgattg tttatataaa acaacggcag gaatattcgc aacaaattac 12720
tttcaccacg aatcttcact gccgttataa ttttcttatc aaccgttaca tccggtcaga 12780
ttttcattat tcgcttaaca gcttctcaat acctttacgg aacttcgccc cttctttcag 12840
gttgcgcagc ccatacttca caaacgcctg catatagccc atttttttac cgcagtcgta 12900
gctgtcgccg gtcatcagca ttgcatcaac ggactgtttt ttcgccagct cggcaatggc 12960
atcagtcagc tgaatacgtc cccatgcacc aggctgagta cgttcaagtt ccggccaaat 13020
atcggcagaa agcacatagc gaccaacggc catgatgtct gagtccagcg tctgcggctg 13080
atccggtttt tcgataaatt caacaatgcg gctgacttta ccttcgcgat ccagcggttc 13140
tttggtctgg atgacggagt attcagagag gtcacccggc atacgttttg ccagcacctg 13200
gctacggccc gtttcattga agcgcgcaat catggcagca aggttgtagc gtagcgggtc 13260
ggcgctggcg tcgtcgatca caacgtctgg cagcaccacg acaaatggat tgtcaccaat 13320
ggcgggtcgt gcacacaaaa tggagtgacc taaacctaaa ggttcgccct gacgcacgtt 13380
cataatagtc acgcccggcg ggcagataga ttgcacttcc gccagtagtt gacgcttcac 13440
gcgctgctca aggagagatt ctaattcata agaggtgtcg aagtggtttt cgaccgcgtt 13500
cttggacgca tgagttacca ggaggatttc tttgatccct gcagccacaa tctcgtcaac 13560
aatgtactga atcattggct tgtcgacgat cggtagcatc tctttgggta tcgccttagt 13620
ggcaggcaac atatgcatcc caagacccgc taccggtata actgctttta aattcgtcat 13680
tattttccta cctctaaggg gctgatagtg cgtaaattat tgtcataggt tagccaaacg 13740
gtatggctat ataccaagca taactttgat taaaccttac gataacacta cacaccatca 13800
gcatctgggt tactcggatt actcggaaat ccacatactg ataatttaat cagtacctct 13860
ttccgaataa tcgtagtcca acctggtcct tttttctctg actcgtctgc attactcaga 13920
aacaaacgtt atgtcgtctt ttttggcatg gacgaattca tactgcagag ttcgatccag 13980
accttgcgac agcgtatacg gtgcaacaaa acctgaagaa tgcactttcg ttgcgtcaaa 14040
ctgtgttgtt gcgcagaatt ttttcacgcg cacagagctg acagcgtatt ttttgcccgt 14100
aattttgctc aggatatcaa agcaatatcc acccagcatt cctagtgggt aaggcaagtg 14160
catagaaggg atctttttgt tcaggctttg ttcaacttca gcaaccaact ggttcatgtt 14220
caggtctggc ttatcaacat agttataaac ctcataacct gcggcaacat tcttcagttt 14280
gtacttgata aactcaacaa tgtttccaac ataagccatg gacttatagt tagtccctgc 14340
gcccaccatc ataaacttgc cgccagcgat ctgtttcagc aagttataga cgttaccgcg 14400
gttgcgttca ccgaagataa cggtaggacg gatgatggtt aatgaacgtt ctgttggtgc 14460
tttgttatac cattcacgca gcacttcctc tgcctgccac ttacttttgc cgtagtggtt 14520
gaaagggtcg tgtggatggt tttcgtcagg gttgtgtttg ttcaaaccat aaacagcaac 14580
ggaactggta aagatgatat ttttaacgcc atttttttcc atggccgcca gcacattgcg 14640
ggtaccctga acgttgacat cataatagag agaagtaggg ctgacgtcat cgcggtgttc 14700
cgctgccagt agtacaacag tgtcaaaacc ggctaacgcc tggtcgagtg cctgttgatc 14760
acgaacatca ccaatctgtg tgatttctgg ataaaagtgg ctctgccgtt tgtccaggtt 14820
cttgatatta aagtcagcaa ttgccgtttc aagtagtcgg gttcctacga atccggaagc 14880
tcctatgagc aaaacgttat tgttcataaa tcactttagt ctggttgtta cgtaagaaac 14940
acaagataaa gatgagtacc ttccctgagt agtcaatgct gcccagcccc agctttaaca 15000
gttagtgtga ggattataat cttttagaac attatatcca gtaagtttat gaatggtcgc 15060
aaatctactc tctccgttcc ggcaatctaa agttaatgct agcgacgtcg tgggatcctc 15120
tagagtcgac ctgcaggcat gcaagcttga gtattctata gtctcaccta aatagcttgg 15180
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 15240
acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 15300
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 15360
attaatgaat cggccaacgc gaaccccttg cggccgcccg ggccgtcgac caattctcat 15420
gtttgacagc ttatcatcga atttctgcca ttcatccgct tattatcact tattcaggcg 15480
tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc 15540
cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa gccatcacaa 15600
acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat 15660
ttgcccatgg tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa 15720
ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta 15780
gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac 15840
tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg 15900
aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc 15960
atacgaaatt ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa 16020
aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc 16080
tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat 16140
tgggatatat caacggtggt atatccagtg atttttttct ccattttagc ttccttagct 16200
cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc attatggtga 16260
aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt ggcccagggc 16320
ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc ttccgtcaca 16380
ggtatttatt cgcgataagc tcatggagcg gcgtaaccgt cgcacaggaa ggacagagaa 16440
agcgcggatc tgggaagtga cggacagaac ggtcaggacc tggattgggg aggcggttgc 16500
cgccgctgct gctgacggtg tgacgttctc tgttccggtc acaccacata cgttccgcca 16560
ttcctatgcg atgcacatgc tgtatgccgg tataccgctg aaagttctgc aaagcctgat 16620
gggacataag tccatcagtt caacggaagt ctacacgaag gtttttgcgc tggatgtggc 16680
tgcccggcac cgggtgcagt ttgcgatgcc ggagtctgat gcggttgcga tgctgaaaca 16740
attatcctga gaataaatgc cttggccttt atatggaaat gtggaactga gtggatatgc 16800
tgtttttgtc tgttaaacag agaagctggc tgttatccac tgagaagcga acgaaacagt 16860
cgggaaaatc tcccattatc gtagagatcc gcattattaa tctcaggagc ctgtgtagcg 16920
tttataggaa gtagtgttct gtcatgatgc ctgcaagcgg taacgaaaac gatttgaata 16980
tgccttcagg aacaatagaa atcttcgtgc ggtgttacgt tgaagtggag cggattatgt 17040
cagcaatgga cagaacaacc taatgaacac agaaccatga tgtggtctgt ccttttacag 17100
ccagtagtgc tcgccgcagt cgagcgacag ggcgaagccc tcggctggtt gccctcgccg 17160
ctgggctggc ggccgtctat ggccctgcaa acgcgccaga aacgccgtcg aagccgtgtg 17220
cgagacaccg cggccggccg ccggcgttgt ggatacctcg cggaaaactt ggccctcact 17280
gacagatgag gggcggacgt tgacacttga ggggccgact cacccggcgc ggcgttgaca 17340
gatgaggggc aggctcgatt tcggccggcg acgtggagct ggccagcctc gcaaatcggc 17400
gaaaacgcct gattttacgc gagtttccca cagatgatgt ggacaagcct ggggataagt 17460
gccctgcggt attgacactt gaggggcgcg actactgaca gatgaggggc gcgatccttg 17520
acacttgagg ggcagagtgc tgacagatga ggggcgcacc tattgacatt tgaggggctg 17580
tccacaggca gaaaatccag catttgcaag ggtttccgcc cgtttttcgg ccaccgctaa 17640
cctgtctttt aacctgcttt taaaccaata tttataaacc ttgtttttaa ccagggctgc 17700
gccctgtgcg cgtgaccgcg cacgccgaag gggggtgccc ccccttctcg aaccctcccg 17760
gtcgagtgag cgaggaagca ccagggaaca gcacttatat attctgctta cacacgatgc 17820
ctgaaaaaac ttcccttggg gttatccact tatccacggg gatattttta taattatttt 17880
ttttatagtt tttagatctt cttttttaga gcgccttgta ggcctttatc catgctggtt 17940
ctagagaagg tgttgtgaca aattgccctt tcagtgtgac aaatcaccct caaatgacag 18000
tcctgtctgt gacaaattgc ccttaaccct gtgacaaatt gccctcagaa gaagctgttt 18060
tttcacaaag ttatccctgc ttattgactc ttttttattt agtgtgacaa tctaaaaact 18120
tgtcacactt cacatggatc tgtcatggcg gaaacagcgg ttatcaatca caagaaacgt 18180
aaaaatagcc cgcgaatcgt ccagtcaaac gacctcactg aggcggcata tagtctctcc 18240
cgggatcaaa aacgtatgct gtatctgttc gttgaccaga tcagaaaatc tgatggcacc 18300
ctacaggaac atgacggtat ctgcgagatc catgttgcta aatatgctga aatattcgga 18360
ttgacctctg cggaagccag taaggatata cggcaggcat tgaagagttt cgcggggaag 18420
gaagtggttt tttatcgccc tgaagaggat gccggcgatg aaaaaggcta tgaatctttt 18480
ccttggttta tcaaacgtgc gcacagtcca tccagagggc tttacagtgt acatatcaac 18540
ccatatctca ttcccttctt tatcgggtta cagaaccggt ttacgcagtt tcggcttagt 18600
gaaacaaaag aaatcaccaa tccgtatgcc atgcgtttat acgaatccct gtgtcagtat 18660
cgtaagccgg atggctcagg catcgtctct ctgaaaatcg actggatcat agagcgttac 18720
cagctgcctc aaagttacca gcgtatgcct gacttccgcc gccgcttcct gcaggtctgt 18780
gttaatgaga tcaacagcag aactccaatg cgcctctcat acattgagaa aaagaaaggc 18840
cgccagacga ctcatatcgt attttccttc cgcgatatca cttccatgac gacaggatag 18900
tctgagggtt atctgtcaca gatttgaggg tggttcgtca catttgttct gacctactga 18960
gggtaatttg tcacagtttt gctgtttcct tcagcctgca tggattttct catacttttt 19020
gaactgtaat ttttaaggaa gccaaatttg agggcagttt gtcacagttg atttccttct 19080
ctttcccttc gtcatgtgac ctgatatcgg gggttagttc gtcatcattg atgagggttg 19140
attatcacag tttattactc tgaattggct atccgcgtgt gtacctctac ctggagtttt 19200
tcccacggtg gatatttctt cttgcgctga gcgtaagagc tatctgacag aacagttctt 19260
ctttgcttcc tcgccagttc gctcgctatg ctcggttaca cggctgcggc gagcgctagt 19320
gataataagt gactgaggta tgtgctcttc ttatctcctt ttgtagtgtt gctcttattt 19380
taaacaactt tgcggttttt tgatgacttt gcgattttgt tgttgctttg cagtaaattg 19440
caagatttaa taaaaaaacg caaagcaatg attaaaggat gttcagaatg aaactcatgg 19500
aaacacttaa ccagtgcata aacgctggtc atgaaatgac gaaggctatc gccattgcac 19560
agtttaatga tgacagcccg gaagcgagga aaataacccg gcgctggaga ataggtgaag 19620
cagcggattt agttggggtt tcttctcagg ctatcagaga tgccgagaaa gcagggcgac 19680
taccgcaccc ggatatggaa attcgaggac gggttgagca acgtgttggt tatacaattg 19740
aacaaattaa tcatatgcgt gatgtgtttg gtacgcgatt gcgacgtgct gaagacgtat 19800
ttccaccggt gatcggggtt gctgcccata aaggtggcgt ttacaaaacc tcagtttctg 19860
ttcatcttgc tcaggatctg gctctgaagg ggctacgtgt tttgctcgtg gaaggtaacg 19920
acccccaggg aacagcctca atgtatcacg gatgggtacc agatcttcat attcatgcag 19980
aagacactct cctgcctttc tatcttgggg aaaaggacga tgtcacttat gcaataaagc 20040
ccacttgctg gccggggctt gacattattc cttcctgtct ggctctgcac cgtattgaaa 20100
ctgagttaat gggcaaattt gatgaaggta aactgcccac cgatccacac ctgatgctcc 20160
gactggccat tgaaactgtt gctcatgact atgatgtcat agttattgac agcgcgccta 20220
acctgggtat cggcacgatt aatgtcgtat gtgctgctga tgtgctgatt gttcccacgc 20280
ctgctgagtt gtttgactac acctccgcac tgcagttttt cgatatgctt cgtgatctgc 20340
tcaagaacgt tgatcttaaa gggttcgagc ctgatgtacg tattttgctt accaaataca 20400
gcaatagtaa tggctctcag tccccgtgga tggaggagca aattcgggat gcctggggaa 20460
gcatggttct aaaaaatgtt gtacgtgaaa cggatgaagt tggtaaaggt cagatccgga 20520
tgagaactgt ttttgaacag gccattgatc aacgctcttc aactggtgcc tggagaaatg 20580
ctctttctat ttgggaacct gtctgcaatg aaattttcga tcgtctgatt aaaccacgct 20640
gggagattag ataatgaagc gtgcgcctgt tattccaaaa catacgctca atactcaacc 20700
ggttgaagat acttcgttat cgacaccagc tgccccgatg gtggattcgt taattgcgcg 20760
cgtaggagta atggctcgcg gtaatgccat tactttgcct gtatgtggtc gggatgtgaa 20820
gtttactctt gaagtgctcc ggggtgatag tgttgagaag acctctcggg tatggtcagg 20880
taatgaacgt gaccaggagc tgcttactga ggacgcactg gatgatctca tcccttcttt 20940
tctactgact ggtcaacaga caccggcgtt cggtcgaaga gtatctggtg tcatagaaat 21000
tgccgatggg agtcgccgtc gtaaagctgc tgcacttacc gaaagtgatt atcgtgttct 21060
ggttggcgag ctggatgatg agcagatggc tgcattatcc agattgggta acgattatcg 21120
cccaacaagt gcttatgaac gtggtcagcg ttatgcaagc cgattgcaga atgaatttgc 21180
tggaaatatt tctgcgctgg ctgatgcgga aaatatttca cgtaagatta ttacccgctg 21240
tatcaacacc gccaaattgc ctaaatcagt tgttgctctt ttttctcacc ccggtgaact 21300
atctgcccgg tcaggtgatg cacttcaaaa agcctttaca gataaagagg aattacttaa 21360
gcagcaggca tctaaccttc atgagcagaa aaaagctggg gtgatatttg aagctgaaga 21420
agttatcact cttttaactt ctgtgcttaa aacgtcatct gcatcaagaa ctagtttaag 21480
ctcacgacat cagtttgctc ctggagcgac agtattgtat aagggcgata aaatggtgct 21540
taacctggac aggtctcgtg ttccaactga gtgtatagag aaaattgagg ccattcttaa 21600
ggaacttgaa aagccagcac cctgatgcga ccacgtttta gtctacgttt atctgtcttt 21660
acttaatgtc ctttgttaca ggccagaaag cataactggc ctgaatattc tctctgggcc 21720
cactgttcca cttgtatcgt cggtctgata atcagactgg gaccacggtc ccactcgtat 21780
cgtcggtctg attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta 21840
gtctgggacc acggtcccac tcgtatcgtc ggtctgataa tcagactggg accacggtcc 21900
cactcgtatc gtcggtctga ttattagtct gggaccatgg tcccactcgt atcgtcggtc 21960
tgattattag tctgggacca cggtcccact cgtatcgtcg gtctgattat tagtctggaa 22020
ccacggtccc actcgtatcg tcggtctgat tattagtctg ggaccacggt cccactcgta 22080
tcgtcggtct gattattagt ctgggaccac gatcccactc gtgttgtcgg tctgattatc 22140
ggtctgggac cacggtccca cttgtattgt cgatcagact atcagcgtga gactacgatt 22200
ccatcaatgc ctgtcaaggg caagtattga catgtcgtcg taacctgtag aacggagtaa 22260
cctcggtgtg cggttgtatg cctgctgtgg attgctgctg tgtcctgctt atccacaaca 22320
ttttgcgcac ggttatgtgg acaaaatacc tggttaccca ggccgtgccg gcacgttaac 22380
cgggctgcat ccgatgcaag tgtgtcgctg tcgacgagct cgcgagctcg gacatgaggt 22440
tgccccgtat tcagtgtcgc tgatttgtat tgtctgaagt tgtttttacg ttaagttgat 22500
gcagatcaat taatacgata cctgcgtcat aattgattat ttgacgtggt ttgatggcct 22560
ccacgcacgt tgtgatatgt agatgataat cattatcact ttacgggtcc tttccggtga 22620
tccgacaggt tacggggcgg cgacctcgcg ggttttcgct atttatgaaa attttccggt 22680
ttaaggcgtt tccgttcttc ttcgtcataa cttaatgttt ttatttaaaa taccctctga 22740
aaagaaagga aacgacaggt gctgaaagcg agctttttgg cctctgtcgt ttcctttctc 22800
tgtttttgtc cgtggaatga acaatggaag tccgagctca tcgctaataa cttcgtatag 22860
catacattat acgaagttat attcgat 22887
<210> 30
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
6xHis tag
<400> 30
His His His His His His
1 5
Claims (32)
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 운데카프레닐 피로포스페이트 상에서 N-아세틸갈락토스아민을 합성하는 에피머라제(epimerase);
지질 담체 상에서 올리고사카라이드 또는 폴리사카라이드를 조립하는 글리코실트랜스퍼라제(glycosyltrasferase);
올리고사카릴 트랜스퍼라제(oligosaccharyl transferase); 및
X 및 Z가 프롤린을 제외한 임의의 천연 아미노산일 수 있는 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T를 포함하는 단백질
을 코딩하는 핵산을 포함하고,
상기 에피머라제는 서열번호 2의 아미노산 서열을 포함하는 재조합 원핵 생합성 시스템. - 제11항에 있어서,
에피머라제를 코딩하는 핵산이 서열번호 1을 포함하는, 재조합 원핵 생합성 시스템. - 제11항에 있어서,
올리고사카릴 트랜스퍼라제가 캄필로박터 제주니(Campylobacter jejuni)로부터 유래되는, 재조합 원핵 생합성 시스템. - 제11항에 있어서,
단백질이 슈도모나스 애루기노사 엑소단백질인, 재조합 원핵 생합성 시스템. - 제11항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 그람 음성 박테리아로부터 유래되는, 재조합 원핵 생합성 시스템. - 제15항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 쉬겔라 플렉스네리로부터 유래되는, 재조합 원핵 생합성 시스템. - 제16항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 쉬겔라 플렉스네리 6으로부터 유래되는, 재조합 원핵 생합성 시스템. - 삭제
- 제15항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 에스케리치아 콜라이로부터 유래되는, 재조합 원핵 생합성 시스템. - 제19항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 에스케리치아 콜라이 O157로부터 유래되는, 재조합 원핵 생합성 시스템. - 제11항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 구조 α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc를 포함하는, 재조합 원핵 생합성 시스템. - (a) (i) 운데카프레닐 피로포스페이트 상에서 N-아세틸갈락토스아민을 합성하는 에피머라제; (ii) 지질 담체 상에서 올리고사카라이드 또는 폴리사카라이드를 조립하는 글리코실트랜스퍼라제; (iii) 올리고사카릴 트랜스퍼라제 및; (iv) X 및 Z가 프롤린을 제외한 임의의 천연 아미노산일 수 있는 하나 이상의 도입된 컨센서스 서열 D/E-X-N-Z-S/T를 포함하는 단백질을 코딩하는 핵산을 숙주 유기체 내로 도입하는 단계; 및
(b) 하나 이상의 N-글리코실화된 단백질이 제조될 때까지 상기 숙주 유기체를 배양하는 단계
를 포함하고,
상기 에피머라제는 서열번호 2의 아미노산 서열을 포함하는, N-글리코실화된 단백질의 제조 방법. - 제22항에 있어서,
에피머라제를 코딩하는 핵산이 서열번호 1을 포함하는, 제조 방법. - 제22항에 있어서,
올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터 유래되는, 제조 방법. - 제22항에 있어서,
단백질이 슈도모나스 애루기노사 엑소단백질인, 제조 방법. - 제22항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 그람 음성 박테리아로부터 유래되는, 제조 방법. - 제26항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 쉬겔라 플렉스네리로부터 유래되는, 제조 방법. - 제27항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 쉬겔라 플렉스네리 6으로부터 유래되는, 제조 방법. - 삭제
- 제26항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 에스케리치아 콜라이로부터 유래되는, 제조 방법. - 제30항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 에스케리치아 콜라이 O157로부터 유래되는, 제조 방법. - 제22항에 있어서,
올리고사카라이드 또는 폴리사카라이드가 구조 α-D-PerNAc-α-L-Fuc-β-D-Glc-α-D-GalNAc를 포함하는, 제조 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US27293109P | 2009-11-19 | 2009-11-19 | |
US61/272,931 | 2009-11-19 | ||
PCT/US2010/002980 WO2011062615A1 (en) | 2009-11-19 | 2010-11-16 | Biosynthetic system that produces immunogenic polysaccharides in prokaryotic cells |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120102086A KR20120102086A (ko) | 2012-09-17 |
KR101855380B1 true KR101855380B1 (ko) | 2018-05-08 |
Family
ID=44059888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127015728A KR101855380B1 (ko) | 2009-11-19 | 2010-11-16 | 원핵세포에서 면역원성 폴리사카라이드를 제조하는 생합성 시스템 |
Country Status (20)
Country | Link |
---|---|
US (2) | US8846342B2 (ko) |
EP (1) | EP2501406B8 (ko) |
JP (2) | JP5968784B2 (ko) |
KR (1) | KR101855380B1 (ko) |
CN (1) | CN102724997B (ko) |
AU (1) | AU2010322454B2 (ko) |
CA (1) | CA2780487C (ko) |
CY (1) | CY1119995T1 (ko) |
DK (1) | DK2501406T3 (ko) |
ES (1) | ES2660227T3 (ko) |
HR (1) | HRP20180338T1 (ko) |
HU (1) | HUE038456T2 (ko) |
IL (1) | IL219733A (ko) |
LT (1) | LT2501406T (ko) |
NO (1) | NO2501406T3 (ko) |
PL (1) | PL2501406T3 (ko) |
PT (1) | PT2501406T (ko) |
SI (1) | SI2501406T1 (ko) |
TR (1) | TR201803015T4 (ko) |
WO (1) | WO2011062615A1 (ko) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090110951A (ko) * | 2002-03-07 | 2009-10-23 | 아이드게노쉬쉐 테흐니쉐 호흐슐레 쥬리히 | 원핵 숙주에서의 재조합 글리코실화 단백질 생산 방법 및 생산계 |
HUE038456T2 (hu) * | 2009-11-19 | 2018-10-29 | Glaxosmithkline Biologicals Sa | Bioszintetikus rendszer, amely immunogén poliszaccharidokat termel prokarióta sejtekben |
EP2742355B1 (en) * | 2011-08-12 | 2018-12-19 | The Governors of the University of Alberta | Method of diagnosing bacterial infections using bacterial glycoproteins |
CA2879272A1 (en) | 2012-07-16 | 2014-01-23 | Robert G.K. DONALD | Saccharides and uses thereof |
US20150353940A1 (en) * | 2013-08-05 | 2015-12-10 | Absci, Llc | Vectors for use in an inducible coexpression system |
EP2724730A1 (en) * | 2012-10-29 | 2014-04-30 | Institut Pasteur | Glycoconjugates and their use as potential vaccines against infection by Shigella Flexneri |
ES2669420T3 (es) | 2013-01-17 | 2018-05-25 | Arsanis Biosciences Gmbh | Anticuerpo específico de E.coli MDR |
GB201301085D0 (en) * | 2013-01-22 | 2013-03-06 | London School Hygiene & Tropical Medicine | Glycoconjugate Vaccine |
EP3055416B1 (en) * | 2013-10-11 | 2020-01-22 | GlaxoSmithKline Biologicals S.A. | Methods of host cell modification |
MX2016011055A (es) | 2014-02-24 | 2017-10-24 | Glycovaxyn Ag | Nuevo polisacarido y usos del mismo. |
ES2939470T3 (es) * | 2014-04-17 | 2023-04-24 | Glaxosmithkline Biologicals Sa | Células hospedadoras modificadas y usos de las mismas |
KR101629656B1 (ko) * | 2014-10-24 | 2016-06-14 | 충남대학교산학협력단 | 면역증강효과를 갖는 수용성 다당체 및 이를 함유하는 조성물 |
WO2016107819A1 (en) * | 2014-12-30 | 2016-07-07 | Glycovaxyn Ag | Compositions and methods for protein glycosylation |
TWI715617B (zh) | 2015-08-24 | 2021-01-11 | 比利時商葛蘭素史密斯克藍生物品公司 | 對抗腸道外病原性大腸桿菌之免疫保護之方法及組合物 |
GB201518668D0 (en) | 2015-10-21 | 2015-12-02 | Glaxosmithkline Biolog Sa | Immunogenic Comosition |
WO2017093291A1 (en) | 2015-11-30 | 2017-06-08 | Limmatech Biologics Ag | Methods of producing glycosylated proteins |
GB201610599D0 (en) | 2016-06-17 | 2016-08-03 | Glaxosmithkline Biologicals Sa | Immunogenic Composition |
AR109621A1 (es) | 2016-10-24 | 2018-12-26 | Janssen Pharmaceuticals Inc | Formulaciones de vacunas contra glucoconjugados de expec |
GB201721582D0 (en) | 2017-12-21 | 2018-02-07 | Glaxosmithkline Biologicals Sa | S aureus antigens and immunogenic compositions |
GB201721576D0 (en) | 2017-12-21 | 2018-02-07 | Glaxosmithkline Biologicals Sa | Hla antigens and glycoconjugates thereof |
EP3894431A2 (en) | 2018-12-12 | 2021-10-20 | GlaxoSmithKline Biologicals SA | Modified carrier proteins for o-linked glycosylation |
WO2020191082A1 (en) | 2019-03-18 | 2020-09-24 | Janssen Pharmaceuticals, Inc. | Bioconjugates of e. coli o-antigen polysaccharides, methods of production thereof, and methods of use thereof |
AR118389A1 (es) | 2019-03-18 | 2021-09-29 | Janssen Pharmaceuticals Inc | Métodos de producción de bioconjugados de polisacáridos de e. coli o-antígeno, sus composiciones y métodos de utilización |
EP3770269A1 (en) | 2019-07-23 | 2021-01-27 | GlaxoSmithKline Biologicals S.A. | Quantification of bioconjugate glycosylation |
JP2023530154A (ja) | 2020-06-18 | 2023-07-13 | グラクソスミスクライン バイオロジカルズ ソシエテ アノニム | 赤痢菌4価(Shigella4V)バイオコンジュゲート |
BR112022023234A2 (pt) | 2020-06-25 | 2023-01-03 | Glaxosmithkline Biologicals Sa | Proteínas de exotoxina a modificada |
CN112877246B (zh) * | 2021-02-23 | 2022-01-18 | 山东省滨州畜牧兽医研究院 | 一种高效制备霍乱弧菌菌影的方法 |
WO2023118033A1 (en) | 2021-12-22 | 2023-06-29 | Glaxosmithkline Biologicals Sa | Vaccine |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009104074A2 (en) * | 2008-02-20 | 2009-08-27 | Glycovaxyn Ag | Bioconjugates made from recombinant n-glycosylated proteins from procaryotic cells |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60142915A (ja) * | 1983-12-28 | 1985-07-29 | Lion Corp | 口腔用組成物 |
EP0170204B1 (de) | 1984-08-01 | 1991-09-25 | BOEHRINGER INGELHEIM INTERNATIONAL GmbH | Neue genetische Sequenzen, die durch sie codierten Interferon-Peptide vom Typ I und diese sie produzierende Organismen |
US5242809A (en) * | 1986-02-28 | 1993-09-07 | Smithkline Beecham Corporation | Gal operon of streptomyces |
US5643758A (en) | 1987-03-10 | 1997-07-01 | New England Biolabs, Inc. | Production and purification of a protein fused to a binding protein |
US5665559A (en) * | 1989-05-18 | 1997-09-09 | The United States Of America As Represented By The Secretary Of The Navy | Production of monoclonal antibodies to bacteroides gingivalis by hybridoma BGII, VF9/2D |
US5280113A (en) * | 1989-08-16 | 1994-01-18 | Monsanto Company | Method for producing synthetic N-linked glycoconjugates |
EP0726318A1 (en) | 1993-05-14 | 1996-08-14 | The Upjohn Company | An acceptor polypeptide for an N-acetylgalactosaminyltransferase |
US6365723B1 (en) * | 1998-12-04 | 2002-04-02 | Wisconsin Alumni Research Foundation | Sequences of E. coli O157 |
US6503744B1 (en) | 1999-02-01 | 2003-01-07 | National Research Council Of Canada | Campylobacter glycosyltransferases for biosynthesis of gangliosides and ganglioside mimics |
JP2003524395A (ja) | 1999-03-02 | 2003-08-19 | ヒューマン ジノーム サイエンシーズ, インコーポレイテッド | 細胞内シアリル化経路の操作 |
JP2004528001A (ja) | 2000-05-12 | 2004-09-16 | ネオーズ テクノロジーズ, インコーポレイテッド | インビトロにおけるフコシル化組換えグリコペプチド |
EP1294910B1 (en) | 2000-06-30 | 2008-11-19 | VIB vzw | Protein glycosylation modification in pichia pastoris |
CN1483077A (zh) * | 2000-12-21 | 2004-03-17 | Э�ͷ���ҵ��ʽ���� | Udp-n-乙酰半乳糖胺和含n-乙酰半乳糖胺的碳水化合物的生产方法 |
US20020150968A1 (en) * | 2001-01-10 | 2002-10-17 | Wang Peng G. | Glycoconjugate and sugar nucleotide synthesis using solid supports |
US20020132320A1 (en) * | 2001-01-10 | 2002-09-19 | Wang Peng George | Glycoconjugate synthesis using a pathway-engineered organism |
US6696814B2 (en) | 2001-07-09 | 2004-02-24 | Tyco Electronics Corporation | Microprocessor for controlling the speed and frequency of a motor shaft in a power tool |
US7265085B2 (en) * | 2001-10-10 | 2007-09-04 | Neose Technologies, Inc. | Glycoconjugation methods and proteins/peptides produced by the methods |
US7541043B2 (en) * | 2002-01-16 | 2009-06-02 | The United States Of America As Represented By The Department Of Health And Human Services | Vaccine for protection against Shigella sonnei disease |
KR100938026B1 (ko) * | 2002-03-07 | 2010-01-21 | 아이드게노쉬쉐 테흐니쉐 호흐슐레 쥬리히 | 원핵 숙주에서 재조합 글리코실화 단백질의 생산방법 및생산계 |
KR20090110951A (ko) | 2002-03-07 | 2009-10-23 | 아이드게노쉬쉐 테흐니쉐 호흐슐레 쥬리히 | 원핵 숙주에서의 재조합 글리코실화 단백질 생산 방법 및 생산계 |
AU2003254665C1 (en) | 2002-08-01 | 2010-08-19 | National Research Council Of Canada | Campylobacter glycans and glycopeptides |
WO2005116063A1 (en) | 2004-05-24 | 2005-12-08 | The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Live, oral vaccine for protection against shigella dysenteriae serotype 1 |
JP5235657B2 (ja) * | 2005-03-24 | 2013-07-10 | バイオジェネリックス ゲーエムベーハー | 原核生物における可溶性活性真核生物グリコシルトランスフェラーゼの発現 |
EP2853600B1 (en) * | 2005-05-11 | 2018-09-19 | ETH Zürich | Recombinant N-glycosylated proteins from procaryotic cells |
US20070202578A1 (en) * | 2005-08-26 | 2007-08-30 | Centre National De La Recherche Scientifique (Cnrs) | Production of globosides oligosaccharides using metabolically engineered microorganisms |
JP5667880B2 (ja) * | 2008-01-03 | 2015-02-12 | コーネル リサーチ ファンデーション インコーポレイテッド | 原核生物におけるグリコシル化されたタンパク質の発現方法 |
JP5647899B2 (ja) * | 2008-01-08 | 2015-01-07 | ラツィオファルム ゲーエムベーハーratiopharm GmbH | オリゴサッカリルトランスフェラーゼを使用するポリペプチドの複合糖質化 |
WO2010108682A1 (en) * | 2009-03-27 | 2010-09-30 | Eidgenoessische Technische Hochschule Zürich | Salmonella enterica presenting c. jejuni n-glycan or derivatives thereof |
GB0915403D0 (en) * | 2009-09-04 | 2009-10-07 | London School Hygiene & Tropical Medicine | Protein glycosylation |
HUE038456T2 (hu) * | 2009-11-19 | 2018-10-29 | Glaxosmithkline Biologicals Sa | Bioszintetikus rendszer, amely immunogén poliszaccharidokat termel prokarióta sejtekben |
CA2789505C (en) * | 2010-02-11 | 2017-12-05 | The Governors Of The University Of Alberta | N-linked glycan compounds |
DK2566507T3 (da) * | 2010-05-06 | 2018-01-29 | Glaxosmithkline Biologicals Sa | Biokonjugatvacciner med kapselformige grampositive bakterier |
JP2013539963A (ja) * | 2010-09-03 | 2013-10-31 | ザ ガバナーズ オブ ザ ユニバーシティ オブ アルバータ | 複数のn結合型グリコシル化シークオンを含んでいるペプチド |
WO2013019625A2 (en) * | 2011-07-29 | 2013-02-07 | The University Of Wyoming | Methods of using a bacterial glcnac-6-p 2'-epimerase to promote sialylation of glycoconjugates |
JP2014526449A (ja) * | 2011-09-06 | 2014-10-06 | グリコヴァキシン アーゲー | 原核細胞において製造されるバイオコンジュゲートワクチン |
ES2713166T3 (es) * | 2012-11-07 | 2019-05-20 | Glaxosmithkline Biologicals Sa | Producción de vacuna recombinante en E. coli mediante conjugación enzimática |
GB201301085D0 (en) * | 2013-01-22 | 2013-03-06 | London School Hygiene & Tropical Medicine | Glycoconjugate Vaccine |
-
2010
- 2010-11-16 HU HUE10831896A patent/HUE038456T2/hu unknown
- 2010-11-16 ES ES10831896.5T patent/ES2660227T3/es active Active
- 2010-11-16 SI SI201031641T patent/SI2501406T1/en unknown
- 2010-11-16 WO PCT/US2010/002980 patent/WO2011062615A1/en active Application Filing
- 2010-11-16 CN CN201080061239.XA patent/CN102724997B/zh active Active
- 2010-11-16 CA CA2780487A patent/CA2780487C/en active Active
- 2010-11-16 LT LTEP10831896.5T patent/LT2501406T/lt unknown
- 2010-11-16 KR KR1020127015728A patent/KR101855380B1/ko active IP Right Grant
- 2010-11-16 AU AU2010322454A patent/AU2010322454B2/en active Active
- 2010-11-16 NO NO10831896A patent/NO2501406T3/no unknown
- 2010-11-16 EP EP10831896.5A patent/EP2501406B8/en active Active
- 2010-11-16 PL PL10831896T patent/PL2501406T3/pl unknown
- 2010-11-16 DK DK10831896.5T patent/DK2501406T3/en active
- 2010-11-16 TR TR2018/03015T patent/TR201803015T4/tr unknown
- 2010-11-16 US US13/510,859 patent/US8846342B2/en active Active
- 2010-11-16 PT PT108318965T patent/PT2501406T/pt unknown
- 2010-11-16 JP JP2012539870A patent/JP5968784B2/ja active Active
-
2012
- 2012-05-10 IL IL219733A patent/IL219733A/en active IP Right Grant
-
2014
- 2014-08-18 US US14/462,261 patent/US9764018B2/en active Active
-
2016
- 2016-07-06 JP JP2016133786A patent/JP2017018098A/ja active Pending
-
2018
- 2018-02-23 HR HRP20180338TT patent/HRP20180338T1/hr unknown
- 2018-03-02 CY CY20181100264T patent/CY1119995T1/el unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009104074A2 (en) * | 2008-02-20 | 2009-08-27 | Glycovaxyn Ag | Bioconjugates made from recombinant n-glycosylated proteins from procaryotic cells |
Also Published As
Publication number | Publication date |
---|---|
IL219733A (en) | 2017-08-31 |
AU2010322454A1 (en) | 2012-06-07 |
PL2501406T3 (pl) | 2018-05-30 |
JP5968784B2 (ja) | 2016-08-10 |
EP2501406B1 (en) | 2017-12-20 |
JP2017018098A (ja) | 2017-01-26 |
CA2780487C (en) | 2019-05-21 |
HUE038456T2 (hu) | 2018-10-29 |
AU2010322454B2 (en) | 2016-05-19 |
US9764018B2 (en) | 2017-09-19 |
HRP20180338T1 (hr) | 2018-04-06 |
EP2501406B8 (en) | 2018-01-24 |
EP2501406A1 (en) | 2012-09-26 |
PT2501406T (pt) | 2018-02-21 |
IL219733A0 (en) | 2012-07-31 |
CN102724997B (zh) | 2016-09-21 |
EP2501406A4 (en) | 2013-04-24 |
WO2011062615A1 (en) | 2011-05-26 |
KR20120102086A (ko) | 2012-09-17 |
SI2501406T1 (en) | 2018-03-30 |
LT2501406T (lt) | 2018-03-26 |
CA2780487A1 (en) | 2011-05-26 |
TR201803015T4 (tr) | 2018-03-21 |
CN102724997A (zh) | 2012-10-10 |
US20130028926A1 (en) | 2013-01-31 |
US8846342B2 (en) | 2014-09-30 |
NO2501406T3 (ko) | 2018-05-19 |
ES2660227T3 (es) | 2018-03-21 |
JP2013511520A (ja) | 2013-04-04 |
US20150190492A1 (en) | 2015-07-09 |
DK2501406T3 (en) | 2018-02-26 |
CY1119995T1 (el) | 2018-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101855380B1 (ko) | 원핵세포에서 면역원성 폴리사카라이드를 제조하는 생합성 시스템 | |
AU2017279688B2 (en) | Production of recombinant vaccine in e. coli by enzymatic conjugation | |
US20150238596A1 (en) | Bioconjugates comprising modified antigens and uses thereof | |
US11376314B2 (en) | Immunogenic composition | |
US20200179505A1 (en) | Immunogenic composition | |
EP1747262B1 (en) | Conserved inner core lipopolysaccharide epitopes as multi-species vaccine candidates | |
US20220054632A1 (en) | Modified carrier proteins for o-linked glycosylation | |
US20220257751A1 (en) | Quantification of bioconjugate glycosylation | |
Compostella et al. | Antibacterial Carbohydrate Vaccines | |
Palmieri | Investigazione di tecnologie alternative per lo sviluppo di vaccini basati su polisaccaridi | |
WO2023118033A1 (en) | Vaccine | |
CN115697396A (zh) | 志贺氏菌-四价(Shigella4V)生物缀合物 | |
Chen | Glycoengineered vesicle vaccines against bacterial pathogens | |
Rodriguez-Valle et al. | Immunization and chemical conjugation of Bm95 obtained from Pichia pastoris enhances the immune response against vaccinal protein and Neisseria meningitidis capsular polysaccharide |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |