KR101916290B1 - 캡슐형 그람-양성 세균 생체접합체 백신 - Google Patents
캡슐형 그람-양성 세균 생체접합체 백신 Download PDFInfo
- Publication number
- KR101916290B1 KR101916290B1 KR1020187004586A KR20187004586A KR101916290B1 KR 101916290 B1 KR101916290 B1 KR 101916290B1 KR 1020187004586 A KR1020187004586 A KR 1020187004586A KR 20187004586 A KR20187004586 A KR 20187004586A KR 101916290 B1 KR101916290 B1 KR 101916290B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- staphylococcus aureus
- gram
- protein
- epa
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/085—Staphylococcus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/21—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/12—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
- C07K16/1267—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria
- C07K16/1271—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria from Micrococcaceae (F), e.g. Staphylococcus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/505—Medicinal preparations containing antigens or antibodies comprising antibodies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/575—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/6037—Bacterial toxins, e.g. diphteria toxoid [DT], tetanus toxoid [TT]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6087—Polysaccharides; Lipopolysaccharides [LPS]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/64—Medicinal preparations containing antigens or antibodies characterised by the architecture of the carrier-antigen complex, e.g. repetition of carrier-antigen units
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/70—Multivalent vaccine
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/70—Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
- C07K2317/73—Inducing cell death, e.g. apoptosis, necrosis or inhibition of cell proliferation
- C07K2317/734—Complement-dependent cytotoxicity [CDC]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/034—Fusion polypeptide containing a localisation/targetting motif containing a motif for targeting to the periplasmic space of Gram negative bacteria as a soluble protein, i.e. signal sequence should be cleaved
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Gastroenterology & Hepatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명의 한 실시양태는 신규 스타필로코커스 아우레우스 생체접합체 백신에 관한 것이다. 보다 일반적으로, 본 발명은 삽입된 핵산 공통 서열을 포함하는 단백질 담체; 상기 공통 서열에 연결된 하나 이상의 폴리사카라이드, 예컨대, 캡슐형 그람-양성 폴리사카라이드; 및 선택적으로 보조제 또는 약학적으로 허용가능한 담체를 포함하는 그람-양성 및 다른 생체접합체 백신에 관한 것이다. 추가 양태에서, 본 발명은 그람-양성 및 다른 생체접합체 백신을 제조하는 방법에 관한 것이다. 또 다른 양태에서, 하나 이상의 폴리사카라이드, 예컨대, 그람-양성 폴리사카라이드를 포함하는 N-글리코실화된 단백질이 제공된다. 또한, 본 발명은 제1 원핵 유기체의 글리코실트랜스퍼라제(glycosyltransferase) 및 제2 원핵 유기체의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열을 포함하는 개조된 원핵 유기체에 관한 것이다. 또한, 본 발명은 N-글리코실화된 단백질 및/또는 생체접합체 백신을 생성하는 폴리사카라이드 및 효소를 코딩하는 플라스미드 및 이 플라스미드로 형질전환된 원핵세포를 포함한다. 추가로, 본 발명은 상기 생체접합체 백신을 투여하는 단계를 포함하는, 포유동물에서 면역 반응을 유도하는 방법에 관한 것이다.
Description
본 발명은 삽입된 핵산 공통 서열(consensus sequence)을 포함하는 단백질 담체; 상기 공통 서열에 연결된, 세균, 예컨대, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드; 및 선택적으로 보조제를 포함하는 생체접합체 백신, 예컨대, 그람-양성 백신에 관한 것이다. 추가로, 본 발명은 변형된 캡슐형 폴리사카라이드 또는 LPS의 생성을 포함하는 변형된 LPS 생합성 경로를 이용하는 글리코실화 시스템에 의해 제조된 그람-양성 세균 백신, 예컨대, 스타필로코커스 아우레우스(Staphylococcus aureus) 백신 또는 다른 세균 백신에 관한 것이다.
관련 출원에 대한 상호참조
본원은 미국 특허법 제119조 제e항(35 U.S.C. §119(e)) 하에서 2010년 5월 6일자로 출원된 미국 가출원 제61/332,170호(전체적으로 본원에 참고로 도입됨)의 이익을 주장한다.
연방 지원 연구에 대한 선언
본 발명의 양태는 미국 국립보건원에 의해 수여된 승인 1R01AI088754-2의 하위승인 105699 하에서 정부 지원으로 만들어졌다. 정부는 본 발명의 이들 양태에 있어서 일정한 권리를 갖는다.
서열목록
본원은 EFS-웹을 통해 ASCII 형식으로 제출되었고 전체적으로 본원에 참고로 도입되는 서열목록을 함유한다. 2011년 5월 2일자로 생성된 상기 ASCII 사본의 파일명은 031229US.txt이고 상기 사본의 크기는 206,590 바이트이다.
백신은 현대 의학의 가장 위대한 공중보건 발명들 중 하나이고 수백만 명의 생명을 구하였다. 면역화는 감염을 예방하고 조절하는 이상적인 수단인 것으로 입증되었다. 매년 백신은 최대 3백만 명의 사망을 예방하고, 750,000명의 소아를 장애로부터 구한다(문헌[Global Alliance for Vaccines and Immunization - Press Releases (March 11, 2006) at www.gavialliance.org/media_centre/press_releases/2006_03_09_en_pr_queenrania_delhi.php]). 1999년, CDC는 면역화를 20세기 최고의 공중보건 성과로 선언하였다(문헌[Ten great public health achievements-United States, 1900-1999. MMWR Morb Mortal Wkly Rep 48:241-3 (April 2, 1999)]). 몇몇 세균, 예컨대, 파상풍 또는 디프테리아를 야기하는 세균은 상기 질환의 주원인인 독소를 생성한다. 이 독소는 해독된 형태로 백신으로서 사용될 수 있다. 그러나, 대다수의 세균에 있어서, 백신을 개발하는 데에 사용될 수 있는 단일 독소가 없다.
가장 성공적인 백신으로는 담체 단백질에 접합된 해모필러스 인플루엔자(Haemophilus influenzae), 네이세리아 메닝기티디스(Neisseria meningitidis) 및 스트렙토코커스 뉴모니아(Streptococcus pneumoniae)와 같은 세균 병원체의 표면 폴리사카라이드가 있다. 이들 세균들은 미생물 병독성 및 식균작용 사멸에 대한 내성을 촉진할 뿐만 아니라 그들이 건조되는 것을 방지하는 캡슐에 의해 둘러싸여 있다.
세균 폴리사카라이드는 T 세포 에피토프를 함유하는 단백질 담체에 커플링되어 있는 경우 인간에서 오래 지속되는 면역 반응을 이끌어낼 수 있다. 이 개념은 80년 전에 고안되었고(문헌[Avery, O. T., and W. F. Goebel. 1929. Chemo-immunological studies on conjugated carbohydrate-proteins. II Immunological specificity of synthetic sugar-proteins. J. Exp. Med. 50:521-533]), 단백질 담체 디프테리아 독소에 커플링된 해모필러스 인플루엔자 B형(HIB)의 폴리사카라이드에 대해 나중에 입증되었다(문헌[Anderson, P. 1983. Antibody responses to Haemophilus influenzae type b and diphtheria toxin induced by conjugates of oligosaccharides of the type b capsule with the nontoxic protein CRM197. Infect Immun 39:233-8; Schneerson, R., O. Barrera, A. Sutton, and J. B. Robbins. 1980. Preparation, characterization, and immunogenicity of Haemophilus influenzae type b polysaccharide-protein conjugates. J Exp Med 152:361-76]). 또한, 이 당접합체는 1987년 미국에서 허가받은 최초의 접합된 백신이었고, 그 직후 미국 유아 면역화 일정 내로 도입되었다. HIB 이외에, 캡슐화된 인간 병원체 네이세리아 메닝기티디스 및 스트렙토코커스 뉴모니아에 대한 접합된 백신이 성공적으로 사용되었다. 이들 백신의 상용은 비인두 콜로니화 및 감염을 감소시켰다. 현재 전세계 백신 시장의 약 25%가 접합된 백신을 포함한다.
그람-양성 세균은 캡슐형 폴리사카라이드에 의해 둘러싸인 세포막을 갖는다. 스타필로코커스는 이러한 그람-양성 세균 중 하나이다.
스타필로코커스 아우레우스는 감염을 야기한다. 스타필로코커스 아우레우스는 다양한 범위의 인간 질환의 원인인 기회감염성 세균 병원체이다. 스타필로코커스 아우레우스는 정상 인간의 점막 표면에서 콜로니화될 수 있지만, 상처 감염의 주원인이기도 하고 골수염, 심내막염, 및 전이성 합병증을 갖는 세균혈증을 포함하는 여러 감염을 유도하는 침윤력을 갖는다(문헌[Lowy, F. D. 1998. Staphylococcus aureus infections. New Engl J Med 339:520-32]). 스타필로코커스 아우레우스는 환기구 관련 폐렴에 관여하는 가장 흔한 병원체들 중 하나이고, 소인성 위험 인자를 갖지 않는 이미 건강한 성인 및 소아에 영향을 미치는 지역사회 획득 폐렴의 중요한 새로운 원인이다(문헌[Kollef, M. H., A. Shorr, Y. P. Tabak, V. Gupta, L. Z. Liu, and R. S. Johannes. 2005. Epidemiology and outcomes of health-care-associated pneumonia: results from a large US database of culture-positive pneumonia. Chest 128:3854-62; Shorr, A. F. 2007. Epidemiology and economic impact of meticillin-resistant Staphylococcus aureus: review and analysis of the literature. Pharmacoeconomics 25:751-68]).
스타필로코커스 아우레우스는 병원내 세균혈증의 두 번째로 가장 흔한 원인이고, 메티실린 내성 스타필로코커스 아우레우스(MRSA) 균주는 미국에서 집중 치료 병동 내의 모든 감염의 50% 이상을 차지한다. 병원 및 지역사회 내에서의 스타필로코커스 아우레우스 감염은 증가하고 있다. MRSA 균주는 1974년에는 스타필로코커스 감염의 2%로부터 단리되었고 2004년에는 스타필로코커스 감염의 63%로부터 단리되었다. 대다수의 병원내 MRSA 균주는 다중약물 내성을 나타내고, 심지어 메티실린 감수성 균주는 치명적일 수 있다. 집단에 근거한 활성 사례 발견을 이용한 최근 보고는 2005년에 미국에서 94,360건의 침윤성 MRSA 감염이 일어났고 이들 감염의 대다수(58%)가 병원 외부에서 일어났다는 것을 보여주었다(문헌[Klevens, R. M., M. A. Morrison, J. Nadle, S. Petit, K. Gershman, S. Ray, L. H. Harrison, R. Lynfield, G. Dumyati, J. M. Townes, A. S. Craig, E. R. Zell, G. E. Fosheim, L. K. McDougal, R. B. Carey, and S. K. Fridkin. 2007. Invasive methicillin-resistant Staphylococcus aureus infections in the United States. JAMA 298: 1763-71]). 이 분석에서, 2005년에 AIDS로 인해 사망한 미국인보다 MRSA로 인해 사망한 미국인(18,000명 초과의 사망)이 더 많았다.
뉴욕/재팬(New York/Japan) 클론으로도 공지되어 있는 스타필로코커스 아우레우스 USA100은 널리 퍼진 미국 병원 획득 MRSA 균주를 대표하는 MRSA 균주이다(문헌[Dougal, L. K., C. D. Steward, G. E. Killgore, J. M. Chaitram, S. K. McAllister, and F. C. Tenover. 2003. Pulsed-field gel electrophoresis typing of oxacillin-resistant Staphylococcus aureus isolates from the United States: establishing a national database. J Clin Microbiol 41:5113-20]).
역학적 분석은 스타필로코커스 아우레우스가 미국에서만 매년 약 2백만 건의 임상 감염을 야기한다는 것을 보여준다(문헌[Fridkin, S. K., J. C. Hageman, M. Morrison, L. T. Sanza, K. Como-Sabetti, J. A. Jernigan, K. Harriman, L. H. Harrison, R. Lynfield, and M. M. Farley. 2005. Methicillin-resistant Staphylococcus aureus disease in three communities. N Engl J Med 352: 1436-44; King, M. D., B. J. Humphrey, Y. F. Wang, E. V. Kourbatova, S. M. Ray, and H. M. Blumberg. 2006. Emergence of community-acquired methicillin-resistant Staphylococcus aureus USA 300 clone as the predominant cause of skin and soft-tissue infections. Ann Intern Med 144:309-17; Klevens, R. M., M. A. Morrison, J. Nadle, S. Petit, K. Gershman, S. Ray, L. H. Harrison, R. Lynfield, G. Dumyati, J. M. Townes, A. S. Craig, E. R. Zell, G. E. Fosheim, L. K. McDougal, R. B. Carey, S. K. Fridkin, and M. I. for the Active Bacterial Core surveillance. 2007. Invasive methicillin-resistant Staphylococcus aureus infections in the United States. JAMA 298: 1763-1771]). 스타필로코커스 아우레우스 감염은 수치에서 증가하고 있을 뿐만 아니라 항생제에 대한 스타필로코커스 아우레우스의 내성도 증가하고 있다. MRSA는 미국에서 병원내 스타필로코커스 아우레우스 감염의 40% 내지 60%를 차지하고, 이들 균주들 중 대다수가 다중약물 내성을 나타낸다. 병원내 감염의 주공급원으로서 악명이 높은 스타필로코커스 아우레우스는 소인성 위험 인자를 갖지 않는 비입원 개체에서 지역사회 획득 감염의 수를 상승시키는 데 있어서 최근에 새로운 역할을 맡았다. 병독성 지역사회 관련된 MRSA(CA-MRSA) 균주는 미국 및 유럽에서 보다 더 널리 퍼지고 있고, 그들의 전염이 전세계적으로 관찰되고 있다(문헌[Baggett, H. C, T. W. Hennessy, K. Rudolph, D. Bruden, A. Reasonover, A. Parkinson, R. Sparks, R. M. Donlan, P. Martinez, K. Mongkolrattanothai, and J. C. Butler. 2004. Community-onset methicillin-resistant Staphylococcus aureus associated with antibiotic use and the cytotoxin Panton-Valentine leukocidin during a furunculosis outbreak in rural Alaska. J Infect Dis 189: 1565-73; Gilbert, M., J. MacDonald, D. Gregson, J. Siushansian, K. Zhang, S. Elsayed, K. Laupland, T. Louie, K. Hope, M. Mulvey, J. Gillespie, D. Nielsen, V. Wheeler, M. Louie, A. Honish, G. Keays, and J. Conly. 2006. Outbreak in Alberta of community-acquired (USA300) methicillin-resistant Staphylococcus aureus in people with a history of drug use, homelessness or incarceration. Canad Med Assoc J 175:149-54; Kazakova, S. V., J. C. Hageman, M. Matava, A. Srinivasan, L. Phelan, B. Garfinkel, T. Boo, S. McAllister, J. Anderson, B. Jensen, D. Dodson, D. Lonsway, L. K. McDougal, M. Arduino, V. J. Fraser, G. Killgore, F. C. Tenover, S. Cody, and D. B. Jernigan. 2005. A clone of methicillin-resistant Staphylococcus aureus among professional football players. N Engl J Med 352:468-75]).
메티실린에 대한 스타필로코커스 아우레우스 내성은 보다 더 흔해지고 있을 뿐만 아니라, 반코마이신에 대한 감소된 감수성을 나타내는 다수의 단리물들도 보고되어 있다. vanA를 보유하고 반코마이신에 대해 완전한 내성을 나타내는 스타필로코커스 아우레우스의 7개 임상 단리물들이 미국에서 단리되었다. 이들 단리물들도 메티실린에 대한 내성을 나타낸다(문헌[Chang, S., D. M. Sievert, J. C. Hageman, M. L. Boulton, F. C. Tenover, F. P. Downes, S. Shah, J. T. Rudrik, G. R. Pupp, W. J. Brown, D. Cardo, and S. K. Fridkin. 2003. Infection with vancomycin-resistant Staphylococcus aureus containing the vanA resistance gene. New Engl J Med 348: 1342-7]). 스타필로코커스 아우레우스가 항생제에 의해 항상 제어될 수 없고 MRSA 단리물이 지역사회에서 점차적으로 널리 퍼지고 있기 때문에, 추가 제어 방법, 예컨대, 백신이 절실히 필요하다.
스타필로코커스 아우레우스 캡슐형 폴리사카리이드는 감염에 관여한다. 표면 관련 부착, 분비된 외부단백질(exoprotein) 및 독소, 및 면역 회피 인자를 포함하는 많은 병독성 인자들이 스타필로코커스 감염의 발병기작에 기여한다(문헌[Foster, T. J. 2005. Immune evasion by staphylococci. Nature Reviews Microbiology 3:948-58]). 많은 침윤성 세균 병원체처럼, 스타필로코커스 아우레우스는 숙주 선천 면역 방어에 의한 제거에 대한 그의 내성을 증강시키는 캡슐형 폴리사카라이드(CP)(도 4)를 생성한다. 스타필로코커스 아우레우스의 대다수의 임상 단리물들은 캡슐화되어 있고, 혈청형 5 및 8 균주가 가장 널리 퍼져있다(문헌[Arbeit, R. D., W. W. Karakawa, W. F. Vann, and J. B. Robbins. 1984. Predominance of two newly described capsular polysaccharide types among clinical isolates of Staphylococcus aureus. Diagn Microbiol Infect Dis 2:85-91]). 5형(CP5) 및 8형(CP8) 캡슐형 폴리사카라이드는 N-아세틸 만노사미뉴론산(ManNAcA), N-아세틸 L-푸코스아민(L-FucNAc) 및 N-아세틸 D-푸코스아민(D-FucNAc)으로 구성된 유사한 트라이사카라이드 반복 단위를 갖는다(문헌[Jones, C. 2005. Revised structures for the capsular polysaccharides from Staphylococcus aureus types 5 and 8, components of novel glycoconjugate vaccines. Carbohydr Res 340: 1097-106]). CP5 및 CP8은 혈청학적으로 상이하고, 이것은 당 사이의 연결 및 O-아세틸화의 부위에서의 차이에 기인할 수 있다(도 4).
종래 연구는 스타필로코커스 아우레우스 캡슐 생성과 시험관내 식균작용 섭취 및 사멸에 대한 내성 사이의 상관관계를 보여주었다(문헌[Fattom, A., R. Schneerson, S. C. Szu, W. F. Vann, J. Shiloach, W. W. Karakawa, and J. B. Robbins. 1990. Synthesis and immunologic properties in mice of vaccines composed of Staphylococcus aureus type 5 and type 8 capsular polysaccharides conjugated to Pseudomonas aeruginosa exotoxin A. Infect Immun 58:2367-74; Thakker, M., J.-S. Park, V. Carey, and J. C. Lee. 1998. Staphylococcus aureus serotype 5 capsular polysaccharide is antiphagocytic and enhances bacterial virulence in a murine bacteremia model. Infect Immun 66:5183-5189; Watts, A., D. Ke, Q. Wang, A. Pillay, A. Nicholson-Weller, and J. C. Lee. 2005. Staphylococcus aureus strains that express serotype 5 or serotype 8 capsular polysaccharides differ in virulence. Infect Immun 73:3502-11]). 인간 호중구는 보체 활성을 갖는 비면역 혈청의 존재 하에서 캡슐-음성 돌연변이체를 식균하는 반면, 캡슐화된 단리물은 최적 옵소닌식균작용(opsonophagocytic) 사멸을 위해 캡슐 특이적 항체 및 보체 둘다를 필요로 한다(문헌[Bhasin, N., A. Albus, F. Michon, P. J. Livolsi, J.-S. Park, and J. C. Lee. 1998. Identification of a gene essential for O-acetylation of the Staphylococcus aureus type 5 capsular polysaccharide. Mol Microbiol 27:9-21; Thakker, M., J.-S. Park, V. Carey, and J. C. Lee. 1998. Staphylococcus aureus serotype 5 capsular polysaccharide is antiphagocytic and enhances bacterial virulence in a murine bacteremia model. Infect Immun 66:5183-5189; Watts, A., D. Ke, Q. Wang, A. Pillay, A. Nicholson-Weller, and J. C. Lee. 2005. Staphylococcus aureus strains that express serotype 5 or serotype 8 capsular polysaccharides differ in virulence. Infect Immun 73:3502-11]). 닐슨(Nilsson) 등은 마우스로부터의 복막 대식세포가 모 균주 레이놀드(Reynold)에 비해 유의하게 더 많은 수의 CP5-음성 돌연변이체를 식균한다고 보고하였다(문헌[Nilsson, I.-M., J. C. Lee, T. Bremell, C. Ryden, and A. Tarkowski. 1997. The role of staphylococcal polysaccharide microcapsule expression in septicemia and septic arthritis. Infect Immun 65:4216-4221]). 일단 식균되면, CP5-양성 균주는 상기 돌연변이체 균주보다 더 높은 정도로 세포내에서 생존하였다. 컨니온(Cunnion) 등은 동질유전자(isogenic) 스타필로코커스 아우레우스 균주의 옵소닌화(opsonization)를 비교하여 CP5-양성 균주가 무캡슐형(acapsular) 돌연변이체보다 42% 더 낮은 정도로 혈청 보체(C')에 결합한다는 것을 입증하였다(문헌[Cunnion, K. M., J. C. Lee, and M. M. Frank. 2001. Capsule production and growth phase influence binding of complement to Staphylococcus aureus. Infect Immun 69:6796-6803]).
스타필로코커스 아우레우스 백신 개발은 통상적으로 표적으로서 캡슐을 수반한다. 스타필로코커스 질환에 대한 보호를 위한 백신 디자인은 인간에서 스타필로코커스 아우레우스 감염의 변화무쌍한 징후 및 임상 복잡성에 의해 복잡해진다. 많은 스타필로코커스 아우레우스 백신 후보물질들이 동물 감염 모델에서 조사되었으나, 2개의 면역화 섭생법만이 III기 임상 시험을 완료하였다고 보고되었다(문헌[Schaffer, A. C, and J. C. Lee. 2008. Vaccination and passive immunisation against Staphylococcus aureus. Int J Antimicrob Agents 32 Suppl 1:S71-8]). 제1 백신은 스타필로코커스 아우레우스의 임상 균주들 중에서 가장 널리 퍼져 있는 2개의 캡슐형 폴리사카라이드(CP)(도 4)를 주성분으로 하는 백신이다. 팻톰(Fattom) 등은 혈청형 5(CP5) 및 혈청형 8(CP8) 폴리사카라이드를 무독성 재조합 슈도모나스 애루기노사(Pseudomonas aeruginosa) 외부단백질(exoprotein) A(rEPA)에 접합시켰다(문헌[Fattom, A.R. Schneerson, S. C. Szu, W. F.Vann, J. Shiloach, W. W. Karakawa and J. B. Robbins. 1990. Synthesis and immunologic properties in mice of vaccines composed of Staphylococcus aureus type 5 and type 8 capsular polysaccharides conjugated to Pseudomonas aeruginosa exotoxin. Infect Immun 58: 2367-74]). 상기 접합체 백신은 마우스 및 인간에서 면역원성을 나타내었고 치사적 및 비치사적 스타필로코커스 감염으로부터 설치류를 보호하는 데 있어서 효능을 보인 옵소닌 활성(opsonic) 항체를 유도하였다(문헌[Fattom, A.R. Schneerson, S. C. Szu, W. F.Vann, J. Shiloach, W. W. Karakawa and J. B. Robbins. 1990. Synthesis and immunologic properties in mice of vaccines composed of Staphylococcus aureus type 5 and type 8 capsular polysaccharides conjugated to Pseudomonas aeruginosa exotoxin. Infect Immun 58: 2367-74; Fattom, A., R. Schneerson, D. C. Watson, W. W. Karakawa, D. Fitzgerald, I. Pastan, X. Li, J. Shiloach, D. A. Bryla, and J. B. Robbins. 1993. Laboratory and clinical evaluation of conjugate vaccines composed of S. aureus type 5 and type 8 capsular polysaccharides bound to Pseudomonas aeruginosa recombinant exoprotein A. Infect Immun 61: 1023-32; Fattom, A. I., J. Sarwar, A. Ortiz, and R. Naso. 1996. A Staphylococcus aureus capsular polysaccharide (CP) vaccine and CP-specific antibodies protect mice against bacterial challenge. Infect Immun 64: 1659-65; Lee, J. C, J. S. Park, S. E. Shepherd, V. Carey, and A. Fattom. 1997. Protective efficacy of antibodies to the Staphylococcus aureus type 5 capsular polysaccharide in a modified model of endocarditis in rats. Infect Immun 65:4146-51]). 수동 면역화 연구는 CP5 특이적 항체 및 CP8 특이적 항체 둘다가 스타필로코커스 아우레우스 유방염의 뮤린 모델에서 감염을 유의하게 감소시킨다는 것을 보여주었다(문헌[Tuchscherr, L. P., F. R. Buzzola, L. P. Alvarez, J. C. Lee, and D. O. Sordelli. 2008. Antibodies to capsular polysaccharide and clumping factor A prevent mastitis and the emergence of unencapsulated and small-colony variants of Staphylococcus aureus in mice. Infect Immun 76:5738-44]). 조합된 CP5 접합체 및 CP8 접합체 백신이 인간에서 안전하고 옵소닌식균작용 활성을 보이는 항체를 이끌어낸다는 것이 밝혀졌다.
스타필로코커스 아우레우스 백신 개발은 표적으로서 표면 단백질도 수반한다. 제2 스타필로코커스 아우레우스 임상 백신 시험은 스타필로코커스 감염을 예방하는 데 있어서 스타필로코커스 부착에 대한 항체의 보호 효능에 근거한 시험이었다. 스타필로코커스 아우레우스 응괴 인자(clumping factor) A는 표면에서 발현되고 스타필로코커스가 피브리노겐에 부착하는 것을 매개하고(문헌[Foster, T. J., and M. Hook. 1998. Surface protein adhesins of Staphylococcus aureus. Trends Microbiol 6:484-8]) 스타필로코커스 아우레우스가 생체물질 표면(문헌[Vaudaux, P. E., P. Francois, R. A. Proctor, D. McDevitt, T. J. Foster, R. M. Albrecht, D. P. Lew, H. Wabers, and S. L. Cooper. 1995. Use of adhesion-defective mutants of Staphylococcus aureus to define the role of specific plasma proteins in promoting bacterial adhesion to canine arteriovenous shunts. Infection & Immunity 63:585-90]), 혈괴 및 손상된 내피 표면(문헌[Moreillon, P., J. M. Entenza, P. Francioli, D. McDevitt, T. J. Foster, P. Francois, and P. Vaudaux. 1995. Role of Staphylococcus aureus coagulase and clumping factor in pathogenesis of experimental endocarditis. Infection & Immunity 63:4738-43])에 부착되는 것을 촉진하는 세포벽 고착 단백질이다. ClfA의 피브리노겐 결합 도메인은 전장 단백질의 영역 A 내에 위치한다(문헌[McDevitt, D., P. Francois, P. Vaudaux, and T. J. Foster. 1995. Identification of the ligand-binding domain of the surface-located fibrinogen receptor (clumping factor) of Staphylococcus aureus. Molecular Microbiology 16:895-907]). ClfA는 카테터에 의해 유도된 스타필로코커스 심내막염의 동물 모델에서 매우 중요한 상호작용인 스타필로코커스 아우레우스와 혈소판의 결합에 있어서 중요한 역할을 수행한다(문헌[Sullam, P. M., A. S. Bayer, W. M. Foss, and A. L. Cheung. 1996. Diminished platelet binding in vitro by Staphylococcus aureus is associated with reduced virulence in a rabbit model of infective endocarditis. Infection & Immunity 64:4915-21]).
난라(Nanra) 등은 ClfA에 대한 항체가 시험관내에서 스타필로코커스 아우레우스의 옵소닌식균작용 사멸을 유도하였다고 보고하였다(문헌[Nanra, J. S., Y. Timofeyeva, S. M. Buitrago, B. R. Sellman, D. A. Dilts, P. Fink, L. Nunez, M. Hagen, Y. V. Matsuka, T. Mininni, D. Zhu, V. Pavliak, B. A. Green, K. U. Jansen, and A. S. Anderson. 2009. Heterogeneous in vivo expression of clumping factor A and capsular polysaccharide by Staphylococcus aureus: Implications for vaccine design. Vaccine 27:3276-80]). 더욱이, ClfA의 결합 영역 A의 재조합 형태로 면역화된 마우스는 스타필로코커스 아우레우스에 의해 유도된 관절염 및 치사율의 감소를 보였다(문헌[Josefsson, E., O. Hartford, L. O'Brien, J. M. Patti, and T. Foster. 2001. Protection against experimental Staphylococcus aureus arthritis by vaccination with clumping factor A, a novel virulence determinant. Journal of Infectious Diseases 184: 1572-80]). 수동 면역화 실험은 ClfA에 대한 특이성을 나타내는 상승된 수준의 항체를 함유하는 인간 다중클론 면역글로불린 제제를 제공받은 토끼에서 수행되었다(문헌[Vernachio, J., A. S. Bayer, T. Le, Y. L. Chai, B. Prater, A. Schneider, B. Ames, P. Syribeys, J. Robbins, J. M. Patti, J. Vernachio, A. S. Bayer, T. Le, Y.-L. Chai, B. Prater, A. Schneider, B. Ames, P. Syribeys, J. Robbins, and J. M. Patti. 2003. Anti-clumping factor A immunoglobulin reduces the duration of methicillin-resistant Staphylococcus aureus bacteremia in an experimental model of infective endocarditis. Antimicrobial Agents & Chemotherapy 47:3400-6]). 카테터에 의해 유도된 스타필로코커스 아우레우스 심내막염을 갖는 토끼의 혈액으로부터의 세균 제거는 반코마이신 치료만을 이용하였을 때보다 조합 요법을 이용하였을 때 더 우수하였다. 추가로, ClfA 특이적 항체의 수동 전달은 스타필로코커스 아우레우스 유방염의 뮤린 모델에서 감염을 유의하게 감소시켰다(문헌[Tuchscherr, L. P., F. R. Buzzola, L. P. Alvarez, J. C. Lee, and D. O. Sordelli. 2008. Antibodies to capsular polysaccharide and clumping factor A prevent mastitis and the emergence of unencapsulated and small-colony variants of Staphylococcus aureus in mice. Infect Immun 76: 5738-44]).
III기 임상 시험은 보고된 바에 의하면 2000년에 낮은 출생 체중 미숙아에서 후발성(late-onset) 패혈증으로부터 보호하기 위해 디자인되었다. 유아는 ClfA 및 SdrG에 대한 상승된 항체 역가를 갖는, 공여자로부터 풀링된 인간 면역글로불린 제제인 베로네이트(Veronate)의 최대 4회 투여를 제공받았다. 유사한 II기 임상 시험으로부터 예상된 결과에도 불구하고, 이 예방적 요법은 신생아에서 스타필로코커스 감염의 빈도를 감소시키지 못하였다(문헌[DeJonge, M., D. Burchfield, B. Bloom, M. Duenas, W. Walker, M. Polak, E. Jung, D. Millard, R. Schelonka, F. Eyal, A. Morris, B. Kapik, D. Roberson, K. Kesler, J. Patti, and S. Hetherington. 2007. Clinical trial of safety and efficacy of INH-A21 for the prevention of nosocomial staphylococcal bloodstream infection in premature infants. J Pediatr 151:260-5]).
원핵 유기체에서 단백질 글리코실화가 일어나지만 천연적으로 거의 일어나지 않는다고 밝혀져 있다. 다른 한편으로, N-연결된 단백질 글리코실화는 진핵 유기체의 소포체에서 일어나는 필수적인 보존된 과정이다. 상기 글리코실화는 분비 단백질 및 막 단백질의 단백질 폴딩, 올리고머화, 안정성, 질 조절, 분류 및 수송에 있어서 중요하다(문헌[Helenius, A., and Aebi, M. (2004). Roles of N-linked glycans in the endoplasmic reticulum. Annu. Rev. Biochem. 73, 1019-1049]). 단백질 글리코실화는 단백질의 항원성, 안정성 및 반감기에 매우 유리한 영향을 미친다. 또한, 글리코실화는 크로마토그래피, 예를 들면, 단백질의 글리코실화된 부분(moiety)과 상호작용하는 고체상에 결합된 렉틴 리간드를 사용하는 친화성 크로마토그래피에 의한 단백질의 정제를 보조할 수 있다. 따라서, 글리코실화는 생물학적으로 및 약학적으로 유용한 글리코실화 패턴을 제공하기 위해 진핵세포에서 많은 글리코실화된 단백질을 재조합적으로 제조하기 위한 확립된 관행이다.
접합체 백신은 세균 감염으로부터 보호하는 데 있어서 성공적으로 사용되고 있다. 폴리사카라이드가 T 세포 독립적 항원이기 때문에, 항원성 폴리사카라이드와 단백질 담체의 접합이 보호 기억 반응을 위해 요구된다. 폴리사카라이드는 폴리사카라이드 및 단백질 담체 내의 활성화 반응성 기를 사용하는 상이한 화학적 방법들에 의해 단백질 담체에 접합되었다(문헌[Qian, F., Y. Wu, O. Muratova, H. Zhou, G. Dobrescu, P. Duggan, L. Lynn, G. Song, Y. Zhang, K. Reiter, N. MacDonald, D. L. Narum, C. A. Long, L. H. Miller, A. Saul, and G. E. Mullen. 2007. Conjugating recombinant proteins to Pseudomonas aeruginosa ExoProtein A: a strategy for enhancing immunogenicity of malaria vaccine candidates. Vaccine 25:3923-3933; Pawlowski, A., G. Kallenius, and S. B. Svenson. 2000. Preparation of pneumococcal capsular polysaccharide-protein conjugates vaccines utilizing new fragmentation and conjugation technologies. Vaccine 18: 1873-1885; Robbins, J. B., J. Kubler-Kielb, E. Vinogradov, C. Mocca, V. Pozsgay, J. Shiloach, and R. Schneerson. 2009. Synthesis, characterization, and immunogenicity in mice of Shigella sonnei O-specific oligosaccharide-core-protein conjugates. Proc Natl Acad Sci USA 106:7974-7978]).
접합체 백신은 소아를 세균 감염으로부터 보호하기 위해 소아에게 투여될 수 있고 성인에게 오래 지속되는 면역 반응을 제공할 수 있다. 본 발명의 구축물은 동물에서 IgG 반응을 발생시키는 것으로 발견되었다. 폴리사카라이드(즉, 당 잔기)는 당 특이적 단기 면역 반응을 유발하는 것으로 생각된다. 실제로, 인간 면역 시스템은 세균의 특정 폴리사카라이드 표면 구조체, 예컨대, O-항원 및 캡슐형 폴리사카라이드에 대한 강한 반응을 발생시킨다. 그러나, 폴리사카라이드에 대한 면역 반응이 IgM 의존적이기 때문에, 면역 시스템은 기억을 발생시키지 못한다. 그러나, 폴리사카라이드를 운반하는 단백질 담체는 T 세포 의존적이고 면역 시스템이 기억을 발생시키기 때문에 오래 지속되는 보호를 제공하는 IgG 반응을 유발한다. 이러한 이유로, 백신을 개발함에 있어서 백신을 단백질 담체-폴리사카라이드 접합체로서 개발하는 것이 유리하다.
원핵 유기체는 글리코실화된 단백질을 거의 생성하지 못한다. 그러나, 식품 유래의 병원체인 캄필로박터 제주니(Campylobacter jejuni)라는 세균은 그의 단백질을 글리코실화할 수 있다는 것이 입증되었다(문헌[Szymanski, et al. (1999). Evidence for a system of general protein glycosylation in Campylobacter jejuni. Mol. Microbiol. 32, 1022-1030]). 글리코실화를 위해 요구되는 수단은 pgl 좌위에 밀집되어 있는 12개의 유전자에 의해 코딩된다. 글리코실화의 파괴는 캄필로박터 제주니의 침윤 및 발병기작에 영향을 미치지만 대다수의 진핵 유기체에서만큼 치명적이지는 않다(문헌[Burda P. and M. Aebi, (1999). The dolichol pathway of N-linked glycosylation. Biochim Biophys Acta 1426(2):239-57]). pgl 좌위는 캄필로박터에서 N-연결된 단백질 글리코실화를 담당한다는 사실, 및 에스케리치아 콜라이(Escherichia coli)에서 pgl 좌위 및 수용체 당단백질을 동시에 재조합적으로 발현시킴으로써 캄필로박터 제주니 단백질의 N-글리코실화를 재구성할 수 있다는 사실이 밝혀져 있다(문헌[Wacker, M., D. Linton, P. G. Hitchen, M. Nita-Lazar, S. M. Haslam, S. J. North, M. Panico, H. R. Morris, A. Dell, B. W. Wren, and M. Aebi. 2002. N-linked glycosylation in C. jejuni and its functional transfer into E. coli. Science 298:1790-3]).
캄필로박터의 N-연결된 단백질 글리코실화 생합성 경로는 세균의 폴리사카라이드 생합성 경로와 상당히 유사하다(문헌[Bugg, T. D., and P. E. Brandish. 1994. From peptidoglycan to glycoproteins: common features of lipid-linked oligosaccharide biosynthesis. FEMS Microbiol Lett 119:255-62]). 세균의 항원성 폴리사카라이드 및 캄필로박터의 올리고사카라이드 둘다가 담체 지질인 운데카프레닐 피로포스페이트(UndPP) 상에서 합성된다는 지식에 근거하여, 상기 2개의 경로를 에스케리치아 콜라이에서 조합하였다(문헌[Feldman, M. F., M. Wacker, M. Hernandez, P. G. Hitchen, C. L. Marolda, M. Kowarik, H. R. Morris, A. Dell, M. A. Valvano, and M. Aebi. 2005. Engineering N-linked protein glycosylation with diverse O antigen Hpopolysaccharide structures in Escherichia coli. Proc Natl Acad Sci USA 102:3016-21]). PglB는 지질-연결된 당 기질에 대한 엄격한 특이성을 나타내지 않는다는 것이 입증되었다. UndPP 상에서 조립된 항원성 폴리사카라이드는 원형질막주위공간(periplasm) 내에서 PglB에 의해 포획되어 단백질 담체로 전달된다(문헌[Feldman, M. F., M. Wacker, M. Hernandez, P. G. Hitchen, C. L. Marolda, M. Kowarik, H. R. Morris, A. Dell, M. A. Valvano, and M. Aebi. 2005. Engineering N-linked protein glycosylation with diverse O antigen Hpopolysaccharide structures in Escherichia coli. Proc Natl Acad Sci USA 102:3016-21; Wacker, M., M. F. Feldman, N. Callewaert, M. Kowarik, B. R. Clarke, N. L. Pohl, M. Hernandez, E. D. Vines, M. A. Valvano, C. Whitfield, and M. Aebi. 2006. Substrate specificity of bacterial oligosaccharyltransferase (OTase) suggests a common transfer mechanism for the bacterial and eukaryotic systems. Proc Natl Acad Sci USA 103:7088-93]). 캄필로박터 PglB는 UndPP-연결된 올리고사카라이드가 환원 말단에서 N-아세틸화된 헥소스아민을 함유하는 경우 다양한 다수의 UndPP-연결된 올리고사카라이드를 전달하여, N-글리코사이드 연결을 통한 항원성 폴리사카라이드와 선택된 단백질의 접합을 가능하게 한다는 것이 밝혀졌다(Wacker et al. (2006)). 이것은 생체내에서 접합된 백신의 제조를 위한 이론적 근거를 제공할 수 있지만, 이 이론적 가능성을 실현하기 위해서는 많은 어려운 과제가 극복되어야 한다.
캄필로박터 제주니가 일반적인 N-연결된 단백질 글리코실화 시스템을 함유한다는 이 종래 발견에 근거하여, 캄필로박터 제주니의 N-연결된 단백질 글리코실화 기구를 포함하도록 에스케리치아 콜라이를 변형시켰다. 이 방식으로, 캄필로박터 제주니에 천연적으로 존재하는 단백질의 글리코실화된 형태가 에스케리치아 콜라이 숙주에서 생성되었다. 이 과정이 백신 생성물로서 사용될 글리코실화된 단백질들을 변형된 에스케리치아 콜라이 숙주 내의 상이한 복제기점들로부터 생성하는 데에 이용될 수 있다는 것도 밝혀졌다. 에스케리치아 콜라이에 의한 생성은 다량의 유용한 백신을 생성할 수 있는 이러한 변형된 에스케리치아 콜라이 숙주의 대규모 배양물이 생성될 수 있기 때문에 유리하다.
이 과정을 이용하여 스타필로코커스 아우레우스에 대한 백신 생성물로서 사용될 글리코실화된 단백질을 변형된 에스케리치아 콜라이 숙주에서 생성하는 것은 극복될 수 없는 것으로 인식된 문제점에 직면한다. 첫째, 에스케리치아 콜라이는 그람-음성 세균이고, 이의 사카라이드 생합성 경로는 중합 단계 후 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스의 사카라이드 생합성 경로와 매우 상이하다. 또한, 종래 기술과 직접적으로 일치하는 스타필로코커스 아우레우스 캡슐형 폴리사카라이드를 생성하도록 에스케리치아 콜라이를 유전적으로 개조하는 것은 실행불가능할 것이다. 예를 들면, 스타필로코커스 아우레우스는 그람-양성 유기체이고, 이의 캡슐 합성은 세포 외피 구조 및 세포 외피의 구축과 관련되어 있다. 캡슐 생성 생합성 기구는 구체적으로 캡슐형 폴리사카라이드(PS)를 세포 및 이의 세포벽의 외부 상에 배열하도록 디자인된다. 에스케리치아 콜라이의 세포 외피가 기본적으로 상이한 방식으로 구축되기 때문에 변형된 에스케리치아 콜라이 유기체에서 이 캡슐을 생성하는 것은 적어도 고도로 자원 집약적일 것이라는 이유로 극히 어려울 것이다. PS 전구체로부터 캡슐을 조립하기 위한 생합성 기구는 상이한 환경으로 인해 작용하지 않을 것이다. 스타필로코커스 아우레우스 캡슐은 단일막을 통과해야 하는 반면, 에스케리치아 콜라이에서는 진정한 캡슐의 최종 위치에 도달하기 위해 횡단되어야 하는 추가 막이 존재한다. 더욱이, 스타필로코커스 아우레우스 캡슐이 매우 크기 때문에, 에스케리치아 콜라이의 2개의 막 사이에서 스타필로코커스 아우레우스 캡슐과 같은 큰 캡슐을 제조하는 것은 실현불가능하다고 생각되었다.
상이한 유기체들로부터의 효소들이 함께 작용할 수 있는 원리는 이전에 밝혀졌다(예를 들면, 문헌[Rubires, X., F. Saigi, N. Pique, N. Climent, S. Merino, S. Alberti, J. M. Tomas and M. Regue. 1997. A gene (wbbL) from Serratia marcescens N28b (04) complements the rfb-50 mutation of Escherichia coli K-12 derivatives. J. Bacteriol 179(23): 7581-6]). 그러나, 그람-양성 유기체로부터의 변형된 LPS 폴리사카라이드가 그람-음성 유기체에서 이전에 생성된 적이 전혀 없다고 생각된다.
본 발명은 신규 스타필로코커스 아우레우스 생체접합체를 제공한다.
본 발명자들은 본원에서 놀랍게도 신규 스타필로코커스 아우레우스 생체접합체 백신을 발견하였다. 이 신규 스타필로코커스 아우레우스 백신은 하나의 그람 균주를 갖는 원핵생물의 올리고사카라이드 또는 폴리사카라이드가 상이한 그람 균주를 갖는 숙주 원핵생물에서 단백질을 글리코실화할 수 있다는 예측되지 않는 신규 발견에 근거한다. 본 발명의 다른 예측되지 않는 신규 특징은 이하에 기재된 실시양태들을 포함하나 이들로 제한되지 않는다.
보다 일반적으로, 본 발명은 삽입된 핵산 공통 서열을 포함하는 단백질 담체; 상기 공통 서열에 연결된, 세균, 예컨대, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드; 및 선택적으로 보조제를 포함하는 생체접합체 백신, 예컨대, 그람-양성 백신에 관한 것이다. 추가로, 본 발명은 변형된 캡슐형 폴리사카라이드 또는 LPS의 생성을 포함하는 변형된 LPS 생합성 경로를 이용하는 글리코실화 시스템에 의해 제조된 그람-양성 세균 백신, 예컨대, 스타필로코커스 아우레우스 백신 또는 다른 세균 백신에 관한 것이다.
추가로, 본 발명은 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 포함하는 단백질; 및 상기 공통 서열에 연결된, 세균, 예컨대, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 포함하는 재조합 N-글리코실화된 단백질에 관한 것이다.
나아가, 본 발명은 N-글리코사이드 연결에 의해 연결된 스타필로코커스 아우레우스의 변형된 캡슐형 폴리사카라이드와 동일한 유기체로부터의 단백질 항원의 조합물에 관한 것이다.
추가로, 본 발명은 제1 원핵 종, 예컨대, 그람-양성 종의 하나 이상의 글리코실트랜스퍼라제(glycosyltransferase)를 코딩하는 뉴클레오타이드 서열; 상이한 원핵 종, 예컨대, 그람-음성 종의 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에 관한 것이다. 또한, 본 발명은 그람-양성 원핵 유기체에만 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 도입된 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 개조된 숙주 원핵 유기체에 관한 것이다.
나아가, 본 발명은 제1 원핵 종, 예컨대, 그람-양성 종, 예를 들면, 스타필로코커스 아우레우스의 하나 이상의 글리코실트랜스퍼라제; 제2 원핵 종의 하나 이상의 글리코실트랜스퍼라제; 단백질; 및 OTase를 코딩하는 핵산을 포함하는 숙주 원핵 유기체에서 생체접합체 백신을 제조하는 방법에 관한 것이다. 추가로, 본 발명은 WaaL에 의해 지질 A 코어로 전달될 수 있고/있거나 OTase에 의해 선택된 담체에 연결될 수 있는 변형된 캡슐형 폴리사카라이드를 그람-음성 세균에서 생성함으로써 생체접합체 백신을 제조하는 것에 관한 것이다.
추가로, 본 발명은 제1 원핵 유기체에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하고 상기 제1 원핵 유기체와 상이한 제2 원핵 유기체에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에서 글리코실화된 단백질을 제조하는 방법에 관한 것이다. 또한, 본 발명은 상이한 유기체들로부터의 상이한 글리코실트랜스퍼라제들의 조합물에 의해 합성된, 그람-양성 세균의 캡슐형 폴리사카라이드로 N-글리코실화된 단백질을 제조하는 것에 관한 것이다. 나아가, 본 발명은 그람-양성 원핵 유기체에만 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 도입된 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에서 글리코실화된 단백질을 제조하는 것에 관한 것이다.
나아가, 본 발명은 플라스미드, 예컨대, 서열번호 2, 서열번호 3 및 서열번호 4 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 또한, 본 발명은 서열번호 6, 서열번호 7, 서열번호 8 및 서열번호 16 중 하나 이상의 서열을 포함하는 플라스미드를 포함한다. 또한, 본 발명은 서열번호 10, 서열번호 11 및 서열번호 12 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 나아가, 본 발명은 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21 및 서열번호 27 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다.
추가로, 본 발명은 형질전환된 세균 세포, 예를 들면, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21 및 서열번호 27 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포에 관한 것이다. 추가로, 본 발명은 서열번호 5, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15 및 서열번호 16 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포에 관한 것이다.
또한, 본 발명은 포유동물에서 그람-양성 세균 및 다른 세균에 의해 야기된 감염에 대한 면역 반응을 유도하는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 포함하는 단백질; 및 상기 공통 서열에 연결된 하나 이상의 올리고사카라이드 또는 폴리사카라이드로서, 그람-양성 세균으로부터의 또 다른 하나 이상의 올리고사카라이드 또는 폴리사카라이드와 동일하거나 상이한 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 포함하는 유효량의 약학 조성물을 상기 포유동물에게 투여하는 단계를 포함한다.
또 다른 양태에서, 본 발명은 표적 폴리사카라이드를 사용하여 단백질을 전체적으로 또는 부분적으로 글리코실화하는 데에 사용되는 상기 표적 폴리사카라이드를 확인하는 방법을 특징으로 한다. 상기 표적 폴리사카라이드를 포함하는 상기 글리코실화된 단백질은 예를 들면, 백신 조성물에서 사용될 수 있다. 한 실시양태에서, 표적 폴리사카라이드를 확인하는 방법은 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스를 표적으로서 확인하는 단계; 3개 이상의 단량체를 포함하는, 상기 그람-양성 세균에 의해 생성된 폴리사카라이드의 제1 반복 단위를 확인하는 단계; 및 상기 제1 반복 단위와 동일한 단량체를 2개 포함하는 제2 반복 단위를 포함하는, 그람-음성 종의 세균에 의해 생성된 폴리사카라이드를 확인하는 단계를 포함한다.
또한, 본 발명은 제1 세균 종, 예컨대, 그람-음성 종의 세균을 변형시키는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 3개의 단량체를 포함하는, 그람-양성 종, 예컨대, 스타필로코커스 아우레우스의 폴리사카라이드의 제1 반복 단위를 확인하는 단계; 제1 반복 단위와 동일한 단량체를 2개 포함하는 또 다른 반복 단위를 포함하는, 제2 그람-음성 종의 세균에 의해 생성된 폴리사카라이드를 확인하는 단계; a) 상기 제2 반복 단위, 및 b) 상기 제2 반복 단위에 존재하지 않는 상기 제1 반복 단위의 단량체를 포함하는 트라이사카라이드를 조립하는 글리코실트랜스퍼라제를 코딩하는 하나 이상의 뉴클레오타이드 서열을 상기 제1 그람-음성 종의 세균 내로 삽입하는 단계; 단백질을 코딩하는 뉴클레오타이드 서열을 삽입하는 단계; 및 OTase를 코딩하는 뉴클레오타이드 서열을 삽입하는 단계를 포함한다.
본 발명자들은 본원에서 놀랍게도 신규 스타필로코커스 아우레우스 생체접합체 백신을 발견하였다. 이 신규 스타필로코커스 아우레우스 백신은 하나의 그람 균주를 갖는 원핵생물의 올리고사카라이드 또는 폴리사카라이드가 상이한 그람 균주를 갖는 숙주 원핵생물에서 단백질을 글리코실화할 수 있다는 예측되지 않는 신규 발견에 근거한다.
도 1은 슈도모나스 애루기노사 O11 O-항원 생합성에 의해 예시된 wzx/wzy 의존성 O-항원 생합성에 대한 경로를 보여준다. 제시된 반응을 담당하는 것으로 추정되는, 유리딘 다이포스페이트(UDP) 및 유리딘 모노포스페이트(UMP)를 비롯한 단백질 명칭이 화살표 위에 또는 아래에 표시되어 있다.
도 2는 에스케리치아 콜라이에서의 개조된 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 혈청형 5(CP5) 생합성에 대한 제안된 경로를 보여준다. 슈도모나스 애루기노사 O11의 O-항원 클러스터(cluster)에 의해 제공된 효소는 도 1에서 표시된 바와 같이 표시된다. 스타필로코커스 아우레우스 CP5로부터의 효소는 Cap5로서 표시된다(도 6과 비교). WecB 및 WecC는 UDP-ManNAcA의 생성에 필요한 에스케리치아 콜라이 효소들이다. 다른 표시된 단백질 및 효소는 유리딘 다이포스페이트(UDP), 유리딘 모노포스페이트(UMP) 및 보조효소 A(CoA)를 포함한다.
도 3은 개조된 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 혈청형 8(CP8) 생합성에 대한 제안된 경로를 보여준다. 유전자 명칭은 화살표로 표시되어 있다(도 1, 2 및 6과 비교)(UDP: 유리딘 다이포스페이트, UMP: 유리딘 모노포스페이트, CoA: 보조효소 A).
도 4는 캡슐형 스타필로코커스 아우레우스 및 슈도모나스 애루기노사 O-항원 반복 단위(RU) 구조체의 구조적 중첩을 보여준다.
도 5a는 스타필로코커스 아우레우스 효소에 의한 불완전한 O11 O-항원 RU(반복 단위)의 연장의 SDS-PAGE 분석을 보여준다.
도 5b는 스타필로코커스 아우레우스 효소에 의한 불완전한 O11 O-항원 RU의 연장의 면역검출을 보여준다.
도 6은 본 발명의 한 실시양태에서 키메라 O11/CP5 및 O11/CP8 유전자 클러스터를 구축하는 방법을 보여준다.
도 7a는 에스케리치아 콜라이 지질 추출물에서 검출된 본 발명의 한 실시양태의 중합된 CP5 LPS를 보여준다.
도 7b는 에스케리치아 콜라이 지질 추출물에서 검출된 본 발명의 한 실시양태의 중합된 CP8 LPS를 보여준다.
도 8a는 W3110 Δ wecA 세포에서 키메라 클러스터를 함유하는 pLAFR 플라스미드 상의 항생제 내성 유전자에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석 및 은 염색으로 확인한 결과를 보여준다.
도 8b는 W3110 Δ wecA 세포에서 키메라 클러스터를 함유하는 pLAFR 플라스미드 상의 항생제 내성 유전자에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석, 은 염색 및 면역검출로 확인한 결과를 보여준다.
도 9는 W3110 Δ wecA 세포에서 키메라 클러스터 앞에 있는 프로모터에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석 및 면역검출로 확인한 결과를 보여준다.
도 10a는 키메라 CP5 클러스터(서열번호 2)를 사용하여 제조한 본 발명의 CP5의 재조합 RU의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 10b는 cap8I 폴리머라제(polymerase)를 결여하는 키메라 CP8 클러스터를 사용하여 제조한 본 발명의 CP8의 재조합 RU의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 11a는 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10a에서 관찰된 37분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11b는 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10a에서 관찰된 40분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11c는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 32분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11d는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 38분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11e는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 45분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11f는 글리칸 구조 최적화의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 11g(도 11ga을 포함함)는 본 발명의 한 실시양태에서 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 전체 CP5 글리칸 레퍼토리의 HPLC 분석 결과를 제시한다.
도 11h는 본 발명의 한 실시양태에서 탈아세틸화된 CP5 글리칸 및 RU 균질성의 HPLC 분석 결과를 제시한다.
도 11i는 본 발명의 한 실시양태에서 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 CP8 글리칸 레퍼토리의 HPLC 분석 결과를 제공한다.
도 11j는 본 발명의 한 실시양태에서 CP8 글리칸의 탈아세틸화 및 RU 균질성의 HPLC 결과를 보여준다.
도 11k는 본 발명의 한 실시양태에서 wzzO7을 CP8 키메라 클러스터와 함께 동시발현시킴으로써 유도된 RU 중합의 감소 및 LLO의 증가를 보여주는 HPLC 결과를 제시한다.
도 12는 본 발명의 실시양태에서 스타필로코커스 아우레우스 플립파제(plippase) 유전자 cap5K(서열번호 2 및 서열번호 3)를 갖거나 갖지 않는 세포로부터 Ni2 + 친화성 크로마토그래피에 의해 정제된 EPA-CP5 생체접합체의 SDS-PAGE 분석 결과를 보여준다.
도 13a는 Ni2 + 친화성 크로마토그래피 및 음이온 교환 크로마토그래피에 의해 정제된 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체의 분석을 제시한다.
도 13b는 본 발명의 한 실시양태에 따라 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DNNNSTPTVISHR 내의 글리코실화 부위에 대해 실측된 M/Z 질량(m/z=2088([M+H]+))을 보여준다. 삽입도는 상기 펩티드에 부착된 RU 구조체를 보여준다.
도 13c는 본 발명의 한 실시양태에 따라 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DQNR 내의 글리코실화 부위에 대해 실측된 M/Z 질량(m/z=1165([M+H]+))을 보여준다. 삽입도는 상기 펩티드에 부착된 RU 구조체를 보여준다.
도 13d는 Ni2 + 친화성 크로마토그래피 및 음이온 교환 크로마토그래피에 의해 정제된 본 발명의 한 실시양태에 따른 CP8-EPA 생체접합체의 분석을 보여준다.
도 13e는 본 발명의 한 실시양태에 따른 당접합체 생성을 위해 3개의 플라스미드(좌측 레인) 또는 2개의 플라스미드(우측 레인)를 함유하는 세포로부터 정제된 CP5-EPA 생체접합체를 보여준다.
도 13f는 Ni2 + 친화성 크로마토그래피에 의해 정제된 본 발명의 한 실시양태 따른 CP8-EPA 생체접합체의 분석을 보여준다.
도 14a는 도 13a로부터의 3 플라스미드 시스템을 사용하여 생성한 본 발명의 한 실시양태의 정제된 CP5-EPA 생체접합체의 고질량 MALDI 분석을 제시한다.
도 14b는 도 13a로부터의 3 플라스미드 시스템을 사용하여 생성한 본 발명의 한 실시양태의 CP5-EPA 생체접합체의 크기 배제 크로마토그래피에 의한 특징규명을 보여준다.
도 14c는 본 발명의 한 실시양태에 따른 정제된 CP5-Hla 생체접합체의 SDS-PAGE 분석 및 면역검출을 보여준다.
도 14d는 본 발명의 한 실시양태에 따른 정제된 CP5-AcrA 생체접합체의 결과를 보여준다.
도 14e는 본 발명의 한 실시양태에 따른 정제된 CP5-ClfA 생체접합체의 결과를 보여준다.
도 15a는 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체에 의해 마우스에서 발생된 특이적 항-CP5 항체를 보여준다.
도 15b는 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체에 의해 토끼에서 발생된 특이적 항-CP5 항체를 보여준다.
도 16a는 본 발명의 한 실시양태에 따른 CP5-EPA를 사용한 토끼의 면역화에 의해 발생된 CP5 특이적 항체의 (스타필로코커스 아우레우스 레이놀드에 대한) 시험관내 옵소닌식균작용 활성을 보여준다.
도 16b는 본 발명의 한 실시양태에 따른 CP5-EPA를 사용한 토끼의 면역화에 의해 발생된 CP5 특이적 항체의 (스타필로코커스 아우레우스 USA100에 대한) 시험관내 옵소닌식균작용 활성을 보여준다.
도 17a는 약 3.6.107 CFU의 스타필로코커스 아우레우스 균주 레이놀드에 의해 복강내로 공격받은(challenged) 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 17b는 2 mg의 CP5-EPA IgG를 주입받은 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 17c는 300 ㎍의 CP5-EPA IgG를 주입받은 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 18은 상이한 투여량의 CP5-EPA를 본 발명의 한 실시양태에 따른 백신으로서 사용하고 공격을 위해 마우스 세균혈증 모델을 사용한 능동 면역화 분석의 결과를 보여준다.
도 2는 에스케리치아 콜라이에서의 개조된 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 혈청형 5(CP5) 생합성에 대한 제안된 경로를 보여준다. 슈도모나스 애루기노사 O11의 O-항원 클러스터(cluster)에 의해 제공된 효소는 도 1에서 표시된 바와 같이 표시된다. 스타필로코커스 아우레우스 CP5로부터의 효소는 Cap5로서 표시된다(도 6과 비교). WecB 및 WecC는 UDP-ManNAcA의 생성에 필요한 에스케리치아 콜라이 효소들이다. 다른 표시된 단백질 및 효소는 유리딘 다이포스페이트(UDP), 유리딘 모노포스페이트(UMP) 및 보조효소 A(CoA)를 포함한다.
도 3은 개조된 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 혈청형 8(CP8) 생합성에 대한 제안된 경로를 보여준다. 유전자 명칭은 화살표로 표시되어 있다(도 1, 2 및 6과 비교)(UDP: 유리딘 다이포스페이트, UMP: 유리딘 모노포스페이트, CoA: 보조효소 A).
도 4는 캡슐형 스타필로코커스 아우레우스 및 슈도모나스 애루기노사 O-항원 반복 단위(RU) 구조체의 구조적 중첩을 보여준다.
도 5a는 스타필로코커스 아우레우스 효소에 의한 불완전한 O11 O-항원 RU(반복 단위)의 연장의 SDS-PAGE 분석을 보여준다.
도 5b는 스타필로코커스 아우레우스 효소에 의한 불완전한 O11 O-항원 RU의 연장의 면역검출을 보여준다.
도 6은 본 발명의 한 실시양태에서 키메라 O11/CP5 및 O11/CP8 유전자 클러스터를 구축하는 방법을 보여준다.
도 7a는 에스케리치아 콜라이 지질 추출물에서 검출된 본 발명의 한 실시양태의 중합된 CP5 LPS를 보여준다.
도 7b는 에스케리치아 콜라이 지질 추출물에서 검출된 본 발명의 한 실시양태의 중합된 CP8 LPS를 보여준다.
도 8a는 W3110 Δ wecA 세포에서 키메라 클러스터를 함유하는 pLAFR 플라스미드 상의 항생제 내성 유전자에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석 및 은 염색으로 확인한 결과를 보여준다.
도 8b는 W3110 Δ wecA 세포에서 키메라 클러스터를 함유하는 pLAFR 플라스미드 상의 항생제 내성 유전자에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석, 은 염색 및 면역검출로 확인한 결과를 보여준다.
도 9는 W3110 Δ wecA 세포에서 키메라 클러스터 앞에 있는 프로모터에 의존하는 본 발명의 한 실시양태의 재조합 CP5 LPS 생성을 SDS-PAGE 분석 및 면역검출로 확인한 결과를 보여준다.
도 10a는 키메라 CP5 클러스터(서열번호 2)를 사용하여 제조한 본 발명의 CP5의 재조합 RU의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 10b는 cap8I 폴리머라제(polymerase)를 결여하는 키메라 CP8 클러스터를 사용하여 제조한 본 발명의 CP8의 재조합 RU의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 11a는 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10a에서 관찰된 37분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11b는 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10a에서 관찰된 40분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11c는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 32분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11d는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 38분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11e는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (도 10b에서 관찰된 45분에 용출된) 특정 피크의 MALDI-MS/MS 분석 결과를 보여준다.
도 11f는 글리칸 구조 최적화의 한 실시양태의 HPLC 분석 결과를 보여준다.
도 11g(도 11ga을 포함함)는 본 발명의 한 실시양태에서 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 전체 CP5 글리칸 레퍼토리의 HPLC 분석 결과를 제시한다.
도 11h는 본 발명의 한 실시양태에서 탈아세틸화된 CP5 글리칸 및 RU 균질성의 HPLC 분석 결과를 제시한다.
도 11i는 본 발명의 한 실시양태에서 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 CP8 글리칸 레퍼토리의 HPLC 분석 결과를 제공한다.
도 11j는 본 발명의 한 실시양태에서 CP8 글리칸의 탈아세틸화 및 RU 균질성의 HPLC 결과를 보여준다.
도 11k는 본 발명의 한 실시양태에서 wzzO7을 CP8 키메라 클러스터와 함께 동시발현시킴으로써 유도된 RU 중합의 감소 및 LLO의 증가를 보여주는 HPLC 결과를 제시한다.
도 12는 본 발명의 실시양태에서 스타필로코커스 아우레우스 플립파제(plippase) 유전자 cap5K(서열번호 2 및 서열번호 3)를 갖거나 갖지 않는 세포로부터 Ni2 + 친화성 크로마토그래피에 의해 정제된 EPA-CP5 생체접합체의 SDS-PAGE 분석 결과를 보여준다.
도 13a는 Ni2 + 친화성 크로마토그래피 및 음이온 교환 크로마토그래피에 의해 정제된 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체의 분석을 제시한다.
도 13b는 본 발명의 한 실시양태에 따라 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DNNNSTPTVISHR 내의 글리코실화 부위에 대해 실측된 M/Z 질량(m/z=2088([M+H]+))을 보여준다. 삽입도는 상기 펩티드에 부착된 RU 구조체를 보여준다.
도 13c는 본 발명의 한 실시양태에 따라 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DQNR 내의 글리코실화 부위에 대해 실측된 M/Z 질량(m/z=1165([M+H]+))을 보여준다. 삽입도는 상기 펩티드에 부착된 RU 구조체를 보여준다.
도 13d는 Ni2 + 친화성 크로마토그래피 및 음이온 교환 크로마토그래피에 의해 정제된 본 발명의 한 실시양태에 따른 CP8-EPA 생체접합체의 분석을 보여준다.
도 13e는 본 발명의 한 실시양태에 따른 당접합체 생성을 위해 3개의 플라스미드(좌측 레인) 또는 2개의 플라스미드(우측 레인)를 함유하는 세포로부터 정제된 CP5-EPA 생체접합체를 보여준다.
도 13f는 Ni2 + 친화성 크로마토그래피에 의해 정제된 본 발명의 한 실시양태 따른 CP8-EPA 생체접합체의 분석을 보여준다.
도 14a는 도 13a로부터의 3 플라스미드 시스템을 사용하여 생성한 본 발명의 한 실시양태의 정제된 CP5-EPA 생체접합체의 고질량 MALDI 분석을 제시한다.
도 14b는 도 13a로부터의 3 플라스미드 시스템을 사용하여 생성한 본 발명의 한 실시양태의 CP5-EPA 생체접합체의 크기 배제 크로마토그래피에 의한 특징규명을 보여준다.
도 14c는 본 발명의 한 실시양태에 따른 정제된 CP5-Hla 생체접합체의 SDS-PAGE 분석 및 면역검출을 보여준다.
도 14d는 본 발명의 한 실시양태에 따른 정제된 CP5-AcrA 생체접합체의 결과를 보여준다.
도 14e는 본 발명의 한 실시양태에 따른 정제된 CP5-ClfA 생체접합체의 결과를 보여준다.
도 15a는 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체에 의해 마우스에서 발생된 특이적 항-CP5 항체를 보여준다.
도 15b는 본 발명의 한 실시양태에 따른 CP5-EPA 생체접합체에 의해 토끼에서 발생된 특이적 항-CP5 항체를 보여준다.
도 16a는 본 발명의 한 실시양태에 따른 CP5-EPA를 사용한 토끼의 면역화에 의해 발생된 CP5 특이적 항체의 (스타필로코커스 아우레우스 레이놀드에 대한) 시험관내 옵소닌식균작용 활성을 보여준다.
도 16b는 본 발명의 한 실시양태에 따른 CP5-EPA를 사용한 토끼의 면역화에 의해 발생된 CP5 특이적 항체의 (스타필로코커스 아우레우스 USA100에 대한) 시험관내 옵소닌식균작용 활성을 보여준다.
도 17a는 약 3.6.107 CFU의 스타필로코커스 아우레우스 균주 레이놀드에 의해 복강내로 공격받은(challenged) 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 17b는 2 mg의 CP5-EPA IgG를 주입받은 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 17c는 300 ㎍의 CP5-EPA IgG를 주입받은 마우스에서 본 발명의 한 실시양태에 따른 항-CP5-EPA 항체를 사용한 수동 면역화의 결과를 보여준다.
도 18은 상이한 투여량의 CP5-EPA를 본 발명의 한 실시양태에 따른 백신으로서 사용하고 공격을 위해 마우스 세균혈증 모델을 사용한 능동 면역화 분석의 결과를 보여준다.
본 발명의 한 실시양태에 따라, 그람-양성 유기체로부터의 LPS 폴리사카라이드는 그람-음성 유기체에서 생성되는 것으로 밝혀졌다. 본 발명자들은 이것이 종래 기술로부터의 중요하고 유의한 발전을 나타내는 새로운 결과라고 생각한다.
본 발명의 범위 내에 있는 핵산은 서열목록에 함유된 본 발명의 핵산에 의해 예시된다. 숙주 세포에서 발현될 수 있는, 면역원성 성분을 코딩하는 임의의 핵산 또는 이의 일부가 본 발명에서 사용될 수 있다. 하기 서열 설명은 본원 전체에서 사용된 일부 용어들의 이해를 돕기 위해 제공되고 본 발명의 실시양태를 제한하는 것으로 해석되어서는 안 된다.
서열번호 1은 (부분적으로 유전자은행 수납번호 AF236052로부터 유래된) 상보적 가닥인, 슈도모나스 애루기노사 PAO103으로부터의 O11 O-항원 서열을 EcoRI 부위 내에 함유하는 pLAFR1(유전자은행 수납번호 AY532632.1)을 나타낸다.
서열번호 2는 상동 재조합에 의해 wbjA-wzy를 치환시키는 cap5HIJ 유전자를 갖는 pLAFR1-O11에 상응하는, CP5 키메라 클러스터를 함유하는 pLAFR1을 나타낸다. 삽입된 서열은 상동 재조합된 클론의 선택을 위한 cat 카세트도 함유한다.
서열번호 3은 상동 재조합에 의해 wbjA-wzy를 치환시키는 cap5HIJ 유전자 및 cap5J와 cat 카세트 사이에 클로닝된 cap5K를 갖는 pLAFR1-O11에 상응하는, cap5K 플립파제 유전자를 갖는 CP5 키메라 클러스터를 함유하는 pLAFR1을 나타낸다.
서열번호 4는 wbjA-wzy를 치환시키는 cap8KHIJ 유전자를 갖는 pLAFR1-O11에 상응하는, 플립파제 유전자를 포함하는 CP8 키메라 클러스터를 함유하는 pLAFR1을 나타낸다. 삽입된 서열은 상동 재조합된 클론의 선택을 위한 cat 카세트도 함유한다.
서열번호 5는 H1a-H35L 생성을 위한 발현 플라스미드를 나타낸다. H1a-H35L을 코딩하는 ORF는 pEC415 내의 NdeI/SacI 내로 클로닝된다.
서열번호 6은 H1a-H35L 부위 202 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 202 주위에 있는 당부위(glycosite) 및 C-말단 His 태그를 코딩한다. 이 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.
서열번호 7은 H1a-H35L 부위 238 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 238 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.
서열번호 8은 H1a-H35L 부위 272 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 272 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.
서열번호 9는 ClfA 생성을 위한 발현 플라스미드를 나타낸다. 상기 유전자는 화학적으로 합성되었고 pEC415 발현 벡터 내의 NdeI/SacI 내로 클로닝되었다.
서열번호 10은 ClfA 부위 290 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 290 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.
서열번호 11은 ClfA 부위 327 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 327 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.
서열번호 12는 ClfA 부위 532 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 532 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 상의 NheI/SalI 내로 클로닝된다.
서열번호 13은 신호 서열을 갖고 위치 260 및 402에서 2개의 글리코실화 부위를 갖는, 재조합 유전적으로 해독된 EPA의 아미노산 서열을 나타낸다.
서열번호 14는 신호 서열을 갖지 않고 위치 241 및 384에서 2개의 글리코실화 부위를 갖지 않는, 재조합 유전적으로 해독된 EPA의 아미노산 서열을 나타낸다.
서열번호 15는 NheI/SalI을 통해 pEC415 내로 클로닝된, AcrA를 코딩하는 ORF를 나타낸다.
서열번호 16은 H1a-H35L 부위 130 생성을 위한 발현 플라스미드를 나타낸다. ORF는 에스케리치아 콜라이로부터의 N-말단 DsbA 신호 펩티드, 아미노산 위치 130 주위에 있는 당부위 및 C-말단 His 태그를 코딩한다. 상기 구축물은 pEC415 내의 NheI/SalI 내로 클로닝된다.
서열번호 17은 cap5K 플립파제를 갖고, 이 플립파제 다음에 에스케리치아 콜라이 혈청형 O121의 galF와 wbqA 사이의 유전자간 DNA 서열 및 pglB ORF로 구성된 pglB 발현 카세트를 갖는 CP5 생성 유전자 클러스터를 나타낸다. 삽입체는 pLAFR1의 EcoRI 부위 내로 클로닝된다.
서열번호 18은 cap8K 플립파제를 갖고, 이 플립파제 다음에 에스케리치아 콜라이 혈청형 O121의 galF와 wbqA 사이의 유전자간 DNA 서열 및 pglB ORF로 구성된 pglB 발현 카세트를 갖는 CP8 생성 유전자 클러스터를 나타낸다. 삽입체는 pLAFR1의 EcoRI 부위 내로 클로닝된다.
서열번호 19는 cap8K 플립파제를 갖고, 이 플립파제 다음에 에스케리치아 콜라이 혈청형 O121의 galF와 wbqA 사이의 유전자간 DNA 서열 및 pglB ORF로 구성된 pglB 발현 카세트를 갖는 CP8 생성 유전자 클러스터를 나타내고, 이 서열은 SfaAI/BspTI 내로, 즉 슈도모나스 애루기노사 O11의 wzx와 cap8H 사이에 클로닝된 에스케리치아 콜라이 혈청형 O7의 wzz에 대한 유전자를 추가로 갖는다. 삽입체는 pLAFR1의 EcoRI 부위 내로 클로닝된다.
서열번호 20은 EPA 및 wzz에 대한 발현 플라스미드를 나타낸다. 골격(backbone)은 내성 카세트가 치환되어 있는(클로람페니콜 대신에 가나마이신) pACT3이다.
서열번호 21은 pext21 Eco/Sal 내로 클로닝된 에스케리치아 콜라이 혈청형 O7의 wzz를 나타낸다.
서열번호 22는 실시예에 기재된 펩티드 서열을 나타낸다.
서열번호 23은 실시예에 기재된 펩티드 서열을 나타낸다.
서열번호 24는 단백질 공통 서열 D/E-X-N-Z-S/T를 나타내고, 이때 X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있다.
서열번호 25는 글리코실화 부위를 나타낸다.
서열번호 26은 글리코실화 부위를 나타낸다.
서열번호 27은 EcoRI/BamHI 부위 내로 클로닝된 pglB ORF를 함유하는 발현 플라스미드를 나타낸다.
본 명세서에서 사용되고 당업계에서 통상의 기술을 가진 자에게 공지된 용법과 일치하는 용어 및 약어의 설명은 이하에 기재되어 있다. 이 설명은 이러한 용어 및 약어의 이해를 돕기 위해 제공되고 본 발명의 실시양태를 제한하는 것으로 해석되어서는 안 된다.
AcrA는 캄필로박터 제주니로부터의 당단백질을 의미한다.
능동 면역화는 항원에 노출시킨 후 면역(항체)을 유도하는 것을 의미한다.
APC는 항원 제시 세포를 의미한다.
Amp는 앰피실린을 의미한다.
세균혈증은 순환 혈액 중의 생존 세균의 존재를 의미한다.
C'는 보체를 의미한다.
CapA는 스타필로코커스 아우레우스 CP5에서 쇄 길이 결정인자(determinant)인 것으로 제안된 효소이다.
CapB는 스타필로코커스 아우레우스 CP5에서 폴리사카라이드 쇄 길이의 조절제인 것으로 제안된 효소이다.
CapC는 스타필로코커스 아우레우스 CP5에서 수송자 단백질을 코딩하는 것으로 제안된 효소이다.
CapD는 4,6-데하이드라타제(dehydratase) 활성을 갖는 효소이고 스타필로코커스 아우레우스 CP5에서 전구체 UDPGlcNAc를 UDP-2-아세트아미도-2,6-다이데옥시-D-자일로-4-헥술로스로 전환시킨다.
CapE는 스타필로코커스 아우레우스 CP5에서 UDP-D-GlcNAc가 UDP-2-아세트아미도-2,6-다이데옥시-D-자일로-4-헥술로스로 에피머화되는 것을 촉진하는 4,6-데하이드라타제 3,5-에피머라제(epimerase)이다.
CapF는 스타필로코커스 아우레우스 CP5에서 UDP-2-아세트아미도-2,6-다이데옥시-D-자일로-4-헥술로스가 UDP-L-6dTalNAc로 환원되는 것을 촉진하는 리덕타제(reductase)이다.
CapG는 스타필로코커스 아우레우스 CP5에서 UDP-L-6dTalNAc가 UDP-LFucNAc로 에피머화되는 것을 촉진하는 2-에피머라제이다.
CapH는 스타필로코커스 아우레우스 CP5에서 O-아세틸트랜스퍼라제(acetyltransferase)이다.
CP8에서 CapH는 스타필로코커스 아우레우스 CP5로부터의 CapI와 유사한 트랜스퍼라제이다.
CapI는 스타필로코커스 아우레우스 CP5에서 UDP-ManNAcA가 담체 지질-D-FucNAc-L-FucNAc-ManNAcA를 생성하는 담체 지질-D-FucNAc-L-FucNAc로 전달되는 것을 촉진하는 글리코실트랜스퍼라제이다.
CP8에서 CapI는 스타필로코커스 아우레우스 CP5의 CapJ와 유사한 폴리머라제이다.
CapJ는 스타필로코커스 아우레우스 CP5에서 폴리머라제이다.
CP8에서 CapJ는 스타필로코커스 아우레우스 CP5의 CapH와 유사한 O-아세틸트랜스퍼라제이다.
CapK는 스타필로코커스 아우레우스 CP5에서 플립파제이다.
스타필로코커스 아우레우스 CP8에서 CapK는 CP5의 CapK와 유사한다.
CapL은 스타필로코커스 아우레우스 CP5에서 UDP-L-FucNAc가 담체 지질-D-FucNAc-L-FucNAc를 생성하는 D-FucNAc-담체 지질로 전달되는 것을 촉진하는 트랜스퍼라제이다.
CapM은 스타필로코커스 아우레우스 CP5에서 UDP-D-FucNAc가 담체 지질-D-FucNAc를 생성하는 담체 지질 상으로 전달되는 것을 촉진하는 트랜스퍼라제이다.
CapN은 스타필로코커스 아우레우스 CP5에서 UDP-2-아세트아미도-2,6-다이데옥시-D-자일로-4-헥술로스가 UDP-D-FucNAc로 환원되는 것을 촉진하는 4-리덕타제(reductase)이다.
CapO는 스타필로코커스 아우레우스 CP5에서 UDP-D-ManNAc가 UDP-ManNAcA로 전환되는 것을 촉진하는 데하이드로게나제(dehydrogenase)이다.
CapP는 스타필로코커스 아우레우스 CP5에서 UDP-D-GlcNAc가 UDP-D-ManNAc로 에피머화되는 것을 촉진하는 2-에피머라제이다.
CFU는 콜로니 형성 단위를 의미한다.
ClfA는 세포벽에 고착된 단백질인 스타필로코커스 아우레우스 응괴 인자 A를 의미한다.
접합체 백신은 폴리사카라이드 항원을 담체 단백질에 공유부착시켜 생성한 백신을 의미한다. 접합체 백신은 항균 면역 반응 및 면역학적 기억을 이끌어낸다. 유아 및 노인에서, 폴리사카라이드 항원들에 대한 보호 면역 반응은 이들 항원들이 T 세포 의존성 반응을 유도하는 단백질과 접합된 경우 유도될 수 있다.
공통 서열은 아미노산 서열 -D/E-X-N-Z-S/T-를 의미하고, 이때 X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있고, 이 서열 내에서 N-연결된 당단백질에 대한 탄수화물 부착 부위가 발견된다.
천연 형태의 캡슐형 폴리사카라이드는 폴리사카라이드의 두꺼운 점막 유사 층을 의미하고 수용성 및 통상적으로 산성을 나타낸다. 천연 캡슐형 폴리사카라이드는 1개 내지 수개의 모노사카라이드/단량체의 규칙적 반복 단위로 구성된다.
CP5는 스타필로코커스 아우레우스 5형 캡슐형 폴리사카라이드 또는 혈청형 5 캡슐형 폴리사카라이드를 의미한다.
CP8은 스타필로코커스 아우레우스 8형 캡슐형 폴리사카라이드 또는 혈청형 8 캡슐형 폴리사카라이드를 의미한다.
D-FucNAc는 N-아세틸 D-푸코스아민을 의미한다.
ECA는 장내세균 공통 항원을 의미한다.
ELISA는 샘플 중의 항체 또는 항원의 존재를 검출하기 위해 면역학에서 주로 이용되는 생화학적 기법인 효소-연결된 면역흡착 분석을 의미한다.
EPA 또는 EPAr은 무독성 재조합 슈도모나스 애루기노사 외부단백질 A를 의미한다.
당접합체 백신은 항원성 또는 면역원성 올리고사카라이드에 연결된 단백질 담체를 포함하는 백신을 의미한다.
글리코실트랜스퍼라제는 모노사카라이드 단위를 활성화된 뉴클레오타이드 당으로부터 글리코실 수용체 분자로 전달하는 촉매로서 작용하는 효소를 의미한다.
그람-양성 균주는 그람 염색(귀중한 진단 수단)에 의해 자주색으로 염색되는 세균 균주를 의미한다. 그람-양성 세균은 펩티도글리칸(세포벽의 약 50% 내지 90%)으로 만들어진 두꺼운 그물망 유사 세포벽을 갖는다.
그람-음성 균주는 분홍색으로 염색되는 보다 얇은 층(세포벽의 약 10%)을 갖는 세균 균주를 의미한다. 그람-음성 세균은 지질을 함유하고 원형질막주위공간에 의해 세포벽으로부터 분리되어 있는 추가 외막도 갖는다.
H1a(알파 독소)는 분비된 공극 형성 독소이자 스타필로코커스 아우레우스의 필수 병독성 인자 항원인 알파 헤모라이신(hemolysin)을 의미한다.
H1a-H35L은 스타필로코커스 아우레우스로부터의 H1a의 돌연변이체 형태인 무독성 알파-독소 돌연변이체를 의미한다.
히스티딘 태그 또는 폴리히스티딘 태그는 5개 이상의 히스티딘(His) 잔기로 구성되어 있고 종종 단백질의 N-말단 또는 C-말단에 존재하고 니켈 친화성 컬럼에 특이적으로 결합함으로써 단순하고 신속한 방식으로 정제하는 데에 사용되는 단백질 내의 아미노산 모티프이다.
IV는 정맥내를 의미한다.
kDa는 킬로달톤을 의미하고 원자 질량 유닛이다.
L-FucNAc는 N-아세틸 L-푸코스아민을 의미한다.
LPS는 리포폴리사카라이드를 의미한다. 리포글리칸으로도 공지되어 있는 리포폴리사카라이드(LPS)는 공유결합에 의해 연결된 지질 및 폴리사카라이드로 구성된 큰 분자이고, 이들은 그람-음성 세균의 외막에서 발견되고 내독소로서 작용하고 동물에서 강한 면역 반응을 이끌어낸다.
ManNAcA는 N-아세틸 만노스아미뉴론산(mannosaminuronic acid)을 의미한다.
메티실린 내성 스타필로코커스 아우레우스 균주(MRSA)는 보다 긴 입원 및 집중 치료 병동에서의 보다 많은 감염과 관련되어 있으므로 더욱 많은 항생제 투여를 초래하는 메티실린 내성 스타필로코커스 아우레우스 균주이다.
N-글리칸 또는 N-연결된 올리고사카라이드는 N-글리코사이드 연결을 통해 단백질 내의 아스파라긴 잔기의 ε-아미드 질소에 연결된, 가변 조성을 갖는 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드를 의미한다.
N-연결된 단백질 글리코실화는 "글리칸"(모노사카라이드, 올리고사카라이드 또는 폴리사카라이드)을 표적 단백질 상의 아스파라긴(N) 측쇄의 질소에 공유연결하는 과정 또는 경로를 의미한다.
O-항원 또는 O-폴리사카라이드는 LPS 내에 함유된 반복 글리칸 중합체를 의미한다. O-항원은 코어 올리고사카라이드에 부착되고 LPS 분자의 최외각 도메인을 포함한다.
올리고사카라이드 또는 폴리사카라이드는 공유결합된 탄수화물(모노사카라이드)에 의해 형성된 동종중합체 또는 이종중합체를 의미하고 글리코사이드 결합에 의해 서로 연결된 반복 단위(모노사카라이드, 다이사카라이드, 트라이사카라이드 등)를 포함하나 이들로 제한되지 않는다.
옵소닌식균작용 활성은 보체 및 특이적 항체의 존재 하에서의 병원체의 식균작용을 의미한다. 혈청 항체의 시험관내 옵소닌식균작용 활성(OPA)은 생체내 항체의 기능적 활성을 대표하므로 보호 면역과 상관관계를 갖는다고 생각된다.
OTase 또는 OST는 올리고사카라이드 또는 폴리사카라이드가 합성중인 단백질 또는 폴딩된 단백질의 공통 서열에 존재하는 아스파라긴(N) 잔기로 기계적으로 독특하게 선택적으로 전달되는 것(글리코실화)을 촉진하는 올리고사카릴 트랜스퍼라제를 의미한다.
수동 면역화는 이미 만들어진 항체 형태의 활성 체액성 면역이 한 개체로부터 또 다른 개체로 전달되는 것을 의미한다.
원형질막주위공간은 그람-음성 세균의 내부 세포질막과 외부 외막 사이의 공간을 의미한다.
PMN은 인간 및 많은 포유동물(모든 포유동물은 아님)의 말초 혈액에서 가장 풍부한 백혈구 세포인 다형핵(polymorphonuclear) 호중구를 의미한다.
단백질 담체는 올리고사카라이드 또는 폴리사카라이드가 부착되는 공통 서열을 포함하는 단백질을 의미한다.
RU는 개별 모노사카라이드가 올리고사카라이드 또는 폴리사카라이드로 조립됨으로써 합성된 특정 폴리사카라이드를 포함하는 반복 단위를 의미한다.
신호 서열은 단백질이 상이한 위치로 이동되도록 유도하는, 상기 단백질의 N-말단에 존재하는 짧은(예를 들면, 약 3개 내지 60개의 아미노산 길이) 펩티드를 의미한다.
UDP-D-ManNAc는 UDP-N-아세틸-D-만노스아민이다.
UDP-D-ManNAcA는 UDP-N-아세틸-D-만노스아미뉴론산이다.
UDP-D-QuiNAc는 UDP-N-아세틸-D-퀴노보스아민이다.
UDP-L-FucNAc는 UDP-N-아세틸-L-푸코스아민이다.
UDP-L-6dTalNAc는 UDPN-아세틸-L-뉴모스아민이다.
Und는 11개의 프레놀(prenol) 단위로 구성된 운데카프레닐 또는 운데카프레놀 지질을 의미한다.
UndP는 세균 세포 외피로 이출되는(exported) 탄수화물 중합체에 대한 글리칸 생합성 중간체의 (Und로부터 유도된) 보편적인 지질 담체인 운데카프레닐 포스페이트를 의미한다.
UndPP는 UndP의 인산화된 버전인 운데카프레닐 피로포스페이트를 의미한다.
wbjA는 슈도모나스 애루기노사 O11의 글루코실트랜스퍼라제이다.
wbjB는 스타필로코커스 아우레우스에서 CP5 및 CP8의 캡슐 생합성에 필요한 효소와 유사한 추정(putative) 에피머라제이다.
wbjC는 슈도모나스 애루기노사 O11의 추정 에피머라제이다.
wbjD는 슈도모나스 애루기노사 O11의 추정 에피머라제이다.
wbjE는 슈도모나스 애루기노사 O11의 추정 에피머라제이다.
wbjF는 슈도모나스 애루기노사 O11의 글리코실트랜스퍼라제이다.
wbpL은 슈도모나스 애루기노사 O11에서 LPS 생합성에 참여하는 글리코실트랜스퍼라제이다.
wbpM은 슈도모나스 애루기노사 O11에서 LPS 생합성에 참여하는 글리코실트랜스퍼라제이다.
본 발명의 실시양태는 캄피로박터 제주니가 원핵 유기체에 대한 독특한 특징인 일반적인 N-연결된 단백질 글리코실화 시스템을 함유한다는 발견에 적어도 부분적으로 근거한다. 캄필로박터 제주니의 다양한 단백질들이 헵타사카라이드에 의해 변형되는 것으로 밝혔다. 이 헵타사카라이드는 특이적 글리코실트랜스퍼라제에 의해 촉진되는, 뉴클레오타이드-활성화된 모노사카라이드의 단계적 부가에 의해 내막의 세포질 쪽에서 지질 담체인 UndPP 상에서 조립된다. 그 다음, 지질-연결된 올리고사카라이드는 플립파제, 예를 들면, PglK에 의해 원형질막주위공간 내로 플립핑된다(즉, 횡단하여 확산된다). N-연결된 단백질 글리코실화의 제1 단계에서, OTase(예를 들면, PglB)는 올리고사카라이드가 담체 지질로부터 공통 서열 Asp/Glu-Xaa-Asn-Zaa-Ser/Thr(즉, D/E-X-N-Z-S/T)(이때, Xaa 및 Zaa는 Pro를 제외한 임의의 아미노산일 수 있음) 내의 Asn 잔기로 전달되는 것을 촉진한다. 본 발명자들은 헵타사카라이드에 대한 글리코실화 클러스터를 에스케리치아 콜라이 내로 성공적으로 전달하였고 캄필로박터의 N-연결된 당단백질을 생성할 수 있었다.
그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에 대한 백신 생성물로서 사용될 글리코실화된 단백질을 생성하기 위해 그람-음성 숙주 세균, 예컨대, 에스케리치아 콜라이를 변형시키는 신규 발명적 방법이 개발되었다. 이 방법의 개발은 많은 면에서 예측되지 않는 상당한 문제점을 극복하고 통상적인 지식 및 종래 기술로부터 실질적으로 벗어날 것을 필요로 하였다.
이 신규 발명적 방법에서, 표적 유기체, 예를 들면, 스타필로코커스 아우레우스의 관심있는 폴리사카라이드와 구조적으로 유사한 폴리사카라이드를 생성하는 또 다른 그람-음성 세균이 확인되었다. 본 발명의 목적을 위해, 구조적 유사성은 확인된 다른 그람-음성 세균의 폴리사카라이드 내의 반복 단위와 부분적으로 동일한 표적(예를 들면, 스타필로코커스 아우레우스)의 폴리사카라이드 내의 반복 단위로서 나타난다. 이 후자 세균이 그람-음성 세균이기 때문에, 예를 들면, 에스케리치아 콜라이 유기체가 숙주인 경우, 본 발명자들은 변형된 에스케리치아 콜라이 유기체에서의 그의 생합성 경로의 이용이 구축된 RU 항원의 생합성, 및 변형된 에스케리치아 콜라이 유기체의 세포질로부터 원형질막주위공간 내로의 상기 항원의 플립핑을 가능하게 할 것이라고 먼저 가정하였다(그 후, 이하에 논의된 바와 같이 실험에 의해 입증됨). 또한, 본 발명자들은 이 생합성 경로를 통해 생성된 폴리사카라이드의 크기가 그람-양성 스타필로코커스 아우레우스의 생합성 경로에 의해 생성된 폴리사카라이드보다 훨씬 더 작을 것이라고 가정하였다(그 후, 이하에 논의된 바와 같이 실험에 의해 입증됨).
결과적으로, 이하에 논의된 바와 같이, 본 발명자들은 전술된 어려운 문제점을 해결하는 신규 혁신적 방법을 개발하였다.
나아가 놀랍게도, 그람-음성 유기체의 LPS 경로의 양태가 이하에 상세히 기재된 바와 같이 그람-양성 세균, 예를 들면, 스타필로코커스 아우레우스에 천연적으로 존재하는 캡슐형 폴리사카라이드와 동일한 몇몇 반복 단위들을 함유하는 폴리사카라이드를 생성하는 데에 사용될 수 있다는 것을 발견하였다.
따라서, 스타필로코커스 아우레우스에 대한 글리코실화된 단백질 백신의 폴리사카라이드 부분을 제조함에 있어서, 한 가지 놀라운 해결책은 그람-음성 세균, 예컨대, 에스케리치아 콜라이에 천연적으로 존재하는 폴리사카라이드에 적어도 부분적으로 근거하여 폴리사카라이드 부분을 구축하는 것이다. 추가로, 본 발명자들은 이를 수행함에 있어서 스타필로코커스 아우레우스에 의해 생성된 관심있는 폴리사카라이드와 가능한 유사한 폴리사카라이드를 생성하는 세균을 찾는 것이 확실히 중요하다는 것도 발견하였다. 슈도모나스 애루기노사는 이러한 세균이다.
도 1은, 본 명세서에 비추어 볼 때 당업자에게 자명할 바와 같이, O-항원 클러스터 내에 제공된 효소 또는 그람-음성 숙주 세포의 하우스 킵핑 효소에 의해 세포질에서 뉴클레오타이드-활성화된 모노사카라이드가 제조되는 한 실시양태의 단계적 도식을 제공한다. 도 1의 도식에서 과정의 단계는 좌측에서 우측으로 진행된다. 도 1에 도시된 실시양태에서, 글리코실포스페이트 트랜스퍼라제((WbpL)는 D-FucNAc 포스페이트를 UndP에 부가하여 UndPP-FucNAc를 형성한다. 그 다음, 특이적 글리코실트랜스퍼라제가 반복 단위(RU) 올리고사카라이드를 형성하는 모노사카라이드를 부가하여 UndPP-D-FucNAc 분자를 추가로 연장시킨다(WbjE, WbjA). 그 다음, RU는 Wzx 단백질에 의해 원형질막주위공간 내로 플립핑된다. Wzy 효소는 원형질막주위공간 내의 RU를 중합하여 O-항원 폴리사카라이드를 형성한다. 중합체 길이는 Wzz 단백질에 의해 조절된다. 많은 세균 올리고사카라이드 및 폴리사카라이드가 UndPP 상에서 조립된 후 다른 분자로 전달된다. 즉, UndPP는 세균에서 당을 위한 일반적인 구축 플랫폼이다. 에스케리치아 콜라이 및 (추측건대) 대다수의 다른 그람-음성 세균에서, O-항원은 에스케리치아 콜라이 효소 WaaL에 의해 UndPP로부터 지질 A 코어로 전달되어 리포폴리사카라이드(LPS)를 형성한다.
도 2는, 본 명세서에 비추어 볼 때 당업자에게 자명할 바와 같이, 슈도모나스 애루기노사 O11의 O-항원 클러스터 내에 제공된 효소, 그람-음성 숙주 세포의 하우스 킵핑 효소, 및 UDP-ManNAcA 생합성에 필요한 것으로 공지되어 있는 스타필로코커스 아우레우스 및/또는 에스케리치아 콜라이 효소(Cap5OP 및/또는 WecBC)에 의해 세포질에서 뉴클레오타이드-활성화된 모노사카라이드가 제조되는 한 실시양태를 보여준다. 도 2의 도식에서 과정의 단계는 좌측에서 우측으로 진행된다. O11 생합성에서와 같이, WbpL 및 WbjE는 코어 다이사카라이드를 합성한다. 그 다음, 스타필로코커스 아우레우스 글리코실트랜스퍼라제 Cap5I가 D-ManNAcA를 부가한다. Cap5H는 아세틸 기를 제2 FucNAc 잔기에 부가한다. 아세틸화는 도 2에 나타낸 바와 같이 RU 합성의 제1 단계일 수 있다. 플립핑은 재조합적으로 발현된 슈도모나스 애루기노사의 Wzx 또는 Cap5K, 또는 예를 들면, 에스케리치아 콜라이 염색체 내에 코딩된 ECA 클러스터의 내재적으로 발현된 Wzx 유사 효소인, 시스템 내의 Wzx 단백질들 중 하나 또는 전부에 의해 가능하다. 중합은 UndPP 상에서 CP5 폴리사카라이드를 형성하는 Cap5J 폴리머라제의 독점적 활성이다. 다른 UndPP-연결된 폴리사카라이드로서 CP5 당이 에스케리치아 콜라이 효소 WaaL에 의해 지질 A 코어로 전달되어 재조합 LPS(LPS 캡슐)를 형성한다.
도 3은, 본 명세서에 비추어 볼 때 당업자에게 자명할 바와 같이, 슈도모나스 애루기노사 O11의 O-항원 클러스터 내에 제공된 효소, 그람-음성 숙주 세포의 하우스 킵핑 효소, 및 UDP-ManNAcA 생합성에 필요한 것으로 공지되어 있는 스타필로코커스 아우레우스 및/또는 에스케리치아 콜라이 효소(Cap8OP 및/또는 WecBC)에 의해 세포질에서 뉴클레오타이드-활성화된 모노사카라이드가 제조되는 것을 보여준다. 도 3의 도식에서 과정의 단계는 좌측에서 우측으로 진행된다. O11 생합성에서와 같이, WbpL 및 WbjE는 코어 다이사카라이드를 합성한다. 그 다음, 스타필로코커스 아우레우스 글리코실트랜스퍼라제 Cap8H가 D-ManNAcA를 부가한다. Cap8J는 아세틸 기를 제2 FucNAc 잔기에 부가한다. 아세틸화가 활성화된 당 상에서 일어나는지 아니면 지질 결합된 RU 상에서 일어나는지는 공지되어 있지 않다. 플립핑은 재조합적으로 발현된 슈도모나스 애루기노사의 Wzx 또는 Cap8K, 또는 예를 들면, 에스케리치아 콜라이 염색체 내에 코딩된 ECA 클러스터의 내재적으로 발현된 Wzx 유사 효소인, 시스템 내의 Wzx 단백질들 중 하나 또는 전부에 의해 가능하다. 중합은 UndPP 상에서 CP8 폴리사카라이드를 형성하는 Cap8I 폴리머라제의 독점적 활성이다. 그 다음, CP8 당이 효소 WaaL에 의해 에스케리치아 콜라이에서 지질 A 코어로 전달된다.
도 4는 O11, CP5 및 CP8 폴리사카라이드의 상이한 구조를 보여준다. RU가 UndPP 및 다이사카라이드 α-D-FucNAc-(1,3)-L-FucNAc로 구성된 동일한 줄기(stem) 구조를 공유한다는 것은 도 4에 나타나 있다. 스타필로코커스 아우레우스 RU들은 중간 L-FucNAc 상에서 또는 ManNAcA 잔기 상에서 단일 O-아세틸 기에 의해 부분적으로 장식되어 있고, 이것은 스타필로코커스 아우레우스 RU의 특징이다. 스타필로코커스 아우레우스 RU에서 제2 당과 제3 당의 연결뿐만 아니라 중합된 RU들 사이의 연결도 그들 사이에 상이하다. 우측에서, 당 구조체는 상이한 표시로 나타나 있다. 역 화살(CP5 및 CP8)에 의해 표시된 숫자는 O-아세틸 기에 의해 변형된 탄소의 위치를 표시한다. RU 구조체의 대안적인 표시는 좌측 하부에 나타나 있다. 도 4에 나타낸 바와 같이, 슈도모나스 애루기노사에 천연적으로 존재하는 폴리사카라이드의 일부인 O11 항원 내의 RU와 스타필로코커스의 각종 균주의 CP5 및 CP8 캡슐의 RU 사이에 상당한 중첩이 존재한다. 구체적으로, 도 4에 나타낸 바와 같이, RU 내의 L-FucNAc-→D-FucNAc 부분이 둘다에서 동일하다.
또 다른 양태에서, 본 발명은 단백질을 표적 폴리사카라이드로 전체적으로 또는 부분적으로 글리코실화하는 데에 사용될 상기 표적 폴리사카라이드를 확인하는 방법을 특징으로 한다. 상기 표적 폴리사카라이드를 포함하는 상기 글리코실화된 단백질은 예를 들면, 백신 조성물에서 사용될 수 있다. 표적 폴리사카라이드를 확인하는 방법은 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스를 표적으로서 확인하는 단계; 3개 이상의 단량체를 포함하는, 상기 그람-양성 세균에 의해 생성된 폴리사카라이드의 제1 반복 단위를 확인하는 단계; 및 상기 제1 반복 단량체 단위와 동일한 단량체를 2개 이상 포함하는 제2 반복 단위를 포함하는, 그람-음성 종의 세균에 의해 생성된 폴리사카라이드를 확인하는 단계를 포함한다.
따라서, 본 발명의 한 실시양태에서, 제1 그람-음성 종의 세균을 변형시키는 방법은 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스를 표적으로서 확인하는 단계; 3개 이상의 단량체를 포함하는, 상기 그람-양성 세균에 의해 생성된 폴리사카라이드의 제1 반복 단위를 확인하는 단계; 상기 제1 반복 단위와 동일한 단량체를 2개 이상 포함하는 제2 반복 단위를 포함하는, 제2 그람-음성 종의 세균에 의해 생성된 폴리사카라이드를 확인하는 단계; a) 상기 제2 반복 단위, 및 b) 상기 제2 반복 단위에 존재하지 않는 상기 제1 반복 단위의 단량체를 함유하는 트라이사카라이드를 조립하는 글리코실트랜스퍼라제를 코딩하는 하나 이상의 뉴클레오타이드 서열을 상기 제1 그람-양성 종의 세균 내로 삽입하는 단계; 단백질, 예컨대, 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)를 포함하는 단백질을 코딩하는 뉴클레오타이드 서열을 삽입하는 단계; 및 OTase를 코딩하는 뉴클레오타이드 서열을 삽입하는 단계를 포함한다.
본 발명의 한 실시양태에서, 상기 방법은 제2 반복 단위에 존재하지 않는 제1 반복 단위의 단량체를 함유하는 트라이사카라이드를 조립하고 상기 제2 반복 단위를 조립하는 글리코실트랜스퍼라제를 코딩하는 하나 이상의 뉴클레오타이드 서열을 숙주 그람-음성 세균 내로 삽입하는 단계를 추가로 포함한다. 본 발명의 추가 실시양태는 제1 반복 단위로부터의 하나 이상의 단량체 단위를 조립하는 그람-음성 세균으로부터의 하나 이상의 글리코실트랜스퍼라제, 및 제2 반복 단위로부터의 2개 이상의 단량체를 조립하는 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스로부터의 하나 이상의 글리코실트랜스퍼라제를 삽입하는 단계를 포함한다. 상기 방법은 단백질을 코딩하는 뉴클레오타이드 서열 및 OTase를 코딩하는 뉴클레오타이드 서열을 그람-음성 숙주 세균 내로 삽입하는 단계를 추가로 포함한다.
본 발명의 하나 이상의 실시양태에서, 반복 단위를 구축하고 구축된 반복 단위를 플립핑하고 중합할, 스타필로코커스 아우레우스의 CP5 균주 및 CP8 균주로부터의 필요한 효소들을 코딩하는 상응하는 핵산을 보유하는 숙주 에스케리치아 콜라이 균주가 발생된다. 한 실시양태에서, 필요한 특이적 글리코실트랜스퍼라제는 슈도모나스 애루기노사에 천연적으로 존재하는, L-FucNAc-→D-FucNAc RU를 형성하는 글리코실트랜스퍼라제, 및 D-ManNAcA 모노사카라이드를 부가하여 스타필로코커스 아우레우스의 CP5 균주 및 CP8 균주 각각에 천연적으로 존재하는 RU를 완성하는 글리코실트랜스퍼라제에 상응하는 글리코실트랜스퍼라제에 상응한다. 이러한 실시양태는 핵산을 숙주 세포 내로 주입하기 위해 플라스미드를 사용하는 단계를 추가로 포함할 수 있다. 추가 실시양태는 한 플라스미드에서 L-FucNAc-→D-FucNAc에 상응하는 글리코실트랜스퍼라제를 코딩하는 핵산을 사용하고, 상이한 플라스미드에서 D-ManNAcA에 상응하는 글리코실트랜스퍼라제를 코딩하는 핵산을 사용하는 단계를 포함한다. 종래 기술에 비추어 볼 때 놀랍게도, 이러한 실시양태의 한 이점은 스타필로코커스 아우레우스 캡슐의 구축된 RU 중합체를 생성하는 것을 담당하는 슈도모나스 애루기노사의 변형된 LPS 생합성 경로가 스타필로코커스 아우레우스의 캡슐보다 훨씬 더 작은 구조체를 발생시킨다는 것이다.
추가로, 본 발명은 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음); 및 상기 공통 서열에 연결된, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 포함하는 재조합 N-글리코실화된 단백질에 관한 것이다. 또 다른 실시양태에서, 상기 재조합 N-글리코실화된 단백질은 2개 이상의 상기 삽입된 공통 서열을 포함한다. 추가 실시양태에서, 상기 재조합 N-글리코실화된 단백질은 2개 이상의 상기 스타필로코커스 아우레우스 올리고사카라이드 또는 폴리사카라이드를 포함한다. 추가 실시양태에서, 상기 재조합 N-글리코실화된 단백질은 2개 이상의 상기 삽입된 공통 서열, 및 상이한 스타필로코커스 아우레우스 균주, 예를 들면, 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 5 균주 및 캡슐형 폴리사카라이드 8 균주로부터의 올리고사카라이드 또는 폴리사카라이드를 포함한다.
나아가, 본 발명은 N-글리코사이드 연결에 의해 조합된, 스타필로코커스 아우레우스의 변형된 캡슐형 폴리사카라이드와 동일한 유기체로부터의 단백질 항원의 조합물에 관한 것이다.
본 발명의 실시양태는 천연적으로 글리코실화된 단백질을 포함한다. 이러한 천연적으로 글리코실화된 단백질(예를 들면, 캄필로박터 제주니 단백질)은 천연 공통 서열을 함유하지만 임의의 추가(즉, 도입된) 최적화된 공통 서열을 포함하지 않는다. 천연적으로 글리코실화된 단백질은 원핵 단백질 및 진핵 단백질을 포함한다. 본 발명의 실시양태는 하기 N-글리코실화된 부분적 아미노산 서열들 중 하나 이상의 서열을 포함하는 재조합 N-글리코실화된 단백질을 추가로 포함하고, 이때 상기 N-글리코실화된 부분적 아미노산 서열 중 하나 이상의 서열이 도입된다: D/E-X-N-Z-S/T(최적화된 공통 서열)(이때, X 및 Z는 Pro를 제외한 임의의 천연 아미노산일 수 있음). 단백질 내로의 특정 부분적 아미노산 서열(최적화된 공통 서열)의 도입은 도입 위치에서 OTase, 예를 들면, 캄필로박터 종으로부터의 OTase, 예를 들면, 캄필로박터 제주니로부터의 OTase에 의해 효율적으로 N-글리코실화되는 단백질을 발생시킨다.
본 발명의 내용에서 사용된 용어 "부분적 아미노산 서열"은 "최적화된 공통 서열" 또는 "공통 서열"로서 지칭될 것이다. 최적화된 공통 서열은 OTase, 예를 들면, 캄필로박터 종으로부터의 OTase, 예를 들면, 캄필로박터 제주니로부터의 OTase에 의해 N-글리코실화된다.
아미노산에 대한 국제적으로 수용된 1 문자 코드에 따라, 약어 D, E, Ν, S 및 T는 각각 아스파르트산, 글루탐산, 아스파라긴, 세린 및 쓰레오닌을 표시한다.
최적화된 공통 서열의 도입은 하나 이상의 아미노산의 부가, 결실 및/또는 치환에 의해 달성될 수 있다. 최적화된 공통 서열을 도입하기 위한 하나 이상의 아미노산의 부가, 결실 및/또는 치환은 당업자에게 잘 공지되어 있는 화학적 합성 방법, 예컨대, 고체상-보조된 화학적 펩티드 합성에 의해 달성될 수 있다. 대안적으로(보다 큰 폴리펩티드의 경우 바람직함), 본 발명의 단백질은 하나 이상의 최적화된 공통 서열을 코딩하는 핵산을 천연적으로 글리코실화된 단백질일 수 있거나 천연적으로 글리코실화되지 않은 단백질일 수 있는 출발 단백질의 핵산 서열 내로 부가함으로써 표준 재조합 기법에 의해 제조될 수 있다.
바람직한 실시양태에서, 본 발명의 단백질은 하나 이상, 바람직하게는 2개 이상 또는 3개 이상, 보다 바람직하게는 5개 이상의 상기 도입된 N-글리코실화된 최적화된 아미노산 서열을 포함할 수 있다.
본 발명의 단백질 내의 하나 이상의 N-글리코실화된 최적화된 아미노산 서열의 존재는 그들의 항원성을 증가시키고/시키거나, 그들의 안정성을 증가시키고/시키거나, 그들의 생물학적 활성에 영향을 미치고/미치거나, 그들의 생물학적 반감기를 연장시키고/시키거나, 그들의 정제를 단순화하는 데에 유리할 수 있다.
최적화된 공통 서열은 위치 X 및 Z에서 프롤린을 제외한 임의의 아미노산을 포함할 수 있다. 용어 "임의의 아미노산"은 일반 천연 아미노산 및 희귀 천연 아미노산뿐만 아니라, 최적화된 공통 서열이 OTase에 의해 여전히 N-글리코실화되게 할 합성 아미노산 유도체 및 유사체도 포함하기 위한 것이다. X 및 Z의 경우 천연 일반 아미노산 및 희귀 아미노산이 바람직하다. X와 Z는 동일할 수 있거나 상이할 수 있다.
X 및 Z가 본 발명에 따른 단백질에서 각각의 최적화된 공통 서열에 대해 상이할 수 있다는 것을 인식해야 한다.
최적화된 공통 서열에 결합된 N-글리칸은 특이적 글리코실트랜스퍼라제; 및 OTase에 의한 전달을 위해 지질 담체 상에서 올리고사카라이드를 조립할 때 그들의 상호작용에 의해 결정될 것이다. 당업자는 원하는 숙주 세포에 존재하는 특이적 글리코실트랜스퍼라제의 종류 및 양을 변경함으로써 N-글리칸을 디자인할 수 있다(문헌[Raetz & Whitfield, Lipopolysaccharide Endotoxins, NIH-PA Author Manuscript 1-57, 19-25 (published in final edited form as: Annual Rev. Biochem., 71: 635-700 (2002)); Reeves et al., Bacterial Polysaccharide Synthesis and Gene Nomenclature, Trends in Microbio. 4(3): 495-503, 497-98 (Dec. 1996); and Whitfield, C. and I. S. Roberts. 1999. Structure, assembly and regulation of expression of capsules in Escherichia coli. Mol Microbiol 31(5): 1307-19]).
본원에서 사용된 "폴리사카라이드"는 2개 이상의 모노사카라이드를 포함하는 사카라이드를 포함한다. 폴리사카라이드는 올리고사카라이드, 트라이사카라이드, 하나 이상의 모노사카라이드(또는 단량체)를 포함하는 반복 단위, 및 당업자에 의해 폴리사카라이드로서 인식되는 다른 사카라이드를 포함한다. 본원에서 N-글리칸은 N-글리코사이드 연결을 통해 단백질 내의 아스파라긴 잔기의 ε-아미드 질소에 연결된, 가변 조성을 갖는 모노사카라이드, 올리고사카라이드 또는 폴리사카라이드로서 정의된다.
본 발명의 실시양태의 폴리사카라이드는 스타필로코커스 아우레우스 폴리사카라이드, 예컨대, CP5 및 CP8을 포함하나 이들로 제한되지 않는다. 본 발명의 실시양태는 세균을 표적으로 하는 스타필로코커스 아우레우스 폴리사카라이드, 예컨대, 스타필로코커스 아우레우스의 메티실린 내성 균주를 표적으로 하는 폴리사카라이드를 추가로 포함한다. 본원에서 폴리사카라이드가 세균 균주를 표적화한다고 언급되어 있는 경우, 이러한 폴리사카라이드는 면역 또는 항원성 반응이 요구되는 세균으로부터 유래된 폴리사카라이드를 포함하고, 면역 또는 항원성 반응이 요구되는 세균과 동일한, 이 세균에 근거한, 이 세균으로부터 유래된, 이 세균에 천연적으로 존재하는, 또는 이 세균으로부터 개조된 폴리사카라이드를 추가로 포함한다.
본 발명의 재조합 단백질의 유래에 대한 제한은 없다. 한 실시양태에서, 상기 단백질은 포유동물, 세균, 바이러스, 진균 또는 식물 단백질로부터 유래된다. 추가 실시양태에서, 상기 단백질은 포유동물, 가장 바람직하게는 인간 단백질로부터 유래된다. 바람직하게는 백신에서 활성 성분으로서 사용될 본 발명에 따른 항원성 재조합 단백질을 제조하기 위해서는, 상기 재조합 단백질이 세균, 바이러스 또는 진균 단백질로부터 유래되는 것이 바람직하다. 다양한 유래의 단백질들의 글리코실화는 당업자에게 공지되어 있다(문헌[Kowarik et al. "Definition of the bacterial N-glycosylation site consensus sequence" EMBO J. (2006) 1-10]).
일례에서, 한 실시양태에서 유전적으로 해독된 슈도모나스 애루기노사 외독소(EPA)가 적합한 단백질 담체이다. 글리코실화될 수 있는 형태의 EPA를 생성하기 위해, EPA를 코딩하는 핵산은 상기 논의된 바와 같이 글리코실화 부위의 삽입에 의해 변형될 필요가 있다.
본 발명의 실시양태에서 사용될 단백질 담체는 바람직하게는 일부 면역학적 및 약리학적 특징을 갖는다. 면역학적 관점에서 볼 때, 바람직하게는 단백질 담체는 (1) T 세포 에피토프를 가져야 하고; (2) 면역 시스템에서 항원을 항원 제시 세포(APC)에 전달할 수 있어야 하고; (3) 강력하고 지속성이 있어야 하고; (4) 항원 특이적 전신 IgG 반응을 발생시킬 수 있어야 한다. 약리학적 관점에서 볼 때, 담백질 담체는 바람직하게는 (1) 무독성을 나타내어야 하고; (2) 온전한 상피 장벽을 가로질러 항원을 효율적으로 전달할 수 있어야 한다. 보다 바람직하게는, 이들 면역학적 특징 및 약리학적 특징 이외에, 세균 생체접합체의 생성에 사용될 것으로 고려되는 단백질 담체는 (1) 원형질막주위공간 내로 용이하게 분비되어야 하고; (2) 그 자신 내로 루프 또는 선형 서열로서 용이하게 도입된 항원 에피토프를 가질 수 있어야 한다. 당업자는 본 개시내용 및 당업자의 지식에 근거하여 본 발명의 구체적인 실시양태에서 사용될 수 있는 적합한 단백질 담체를 상용적으로 검토하고 확인할 수 있다.
본 발명의 한 실시양태에서, 캄필로박터 단백질 AcrA가 단백질 담체이다.
본 발명의 추가 실시양태에서, 유전적으로 해독된 슈도모나스 애루기노사 외독소(EPA)는 백신이 요구되는 표적 유기체가 스타필로코커스 아우레우스인 단백질 담체이다. 천연 글리코실화 부위를 함유하는 AcrA와 달리, EPA는 이러한 천연 글리코실화 부위를 함유하지 않고 글리코실화 부위의 삽입(예를 들면, 상기 논의된 바와 같은 최적화된 공통 서열을 코딩하는 핵산을 EPA를 코딩하는 핵산 서열 내로 삽입)에 의해 변형될 필요가 있다. 추가 실시양태에서, EPA는 스타필로코커스 아우레우스 항원을 사용한 글리코실화를 허용하는 2개의 글리코실화 부위를 도입하도록 변형된다. 추가 실시양태에서, 2개의 공통 서열이 국제특허출원 공보 제WO 2009/104074호의 실시예 10에서 논의된 바와 같이 도입된다.
본 발명의 실시양태에서 2개의 글리코실화 부위를 함유하도록 변형된 EPA의 아미노산 서열은 서열번호 13(신호 서열을 가짐) 및 서열번호 14(신호 서열을 갖지 않음)로서 제공된다. 서열번호 13에서 글리코실화 부위는 위치 260DNNNS 및402DQNRT에 존재하는 DNNNS 및 DQNRT이다. 서열번호 14에서 글리코실화 부위는 위치 241DNNNS 및 383DQNRT에 존재하는 DNNNS 및 DQNRT이다.
단백질 담체, 예컨대, EPA는 세균 생체접합체의 생성에서 N-글리코실화 부위가 부가될 수 있는 단백질이다. N-글리코실화 부위는 상기 논의된 공통 서열의 도입, 즉 D/E-X-N-Z-S/T 서열의 삽입(이때, X 및 Z는 프롤린을 제외한 임의의 천연 아미노산일 수 있음)을 필요로 한다. 본 발명자들은 이러한 공통 서열이 돌연변이보다는 삽입에 의해, 추가로 삽입된 플랭킹(flanking) 잔기의 이용에 의해, 및 N-글리코실화 부위의 작동을 최적화하기 위한 플랭킹 잔기의 돌연변이에 의해 표면 루프 내에 도입된다는 것을 발견하였다.
스타필로코커스 아우레우스의 몇몇 잘 특징규명된 단백질 서브단위 항원은 알파 헤모라이신(알파 독소, H1a), 응괴 인자 알파(ClfA), IsdB 및 판톤-발레틴 류코시딘(Panton-Valentine Leukocidin)(PVL)이다.
H1a는 분비된 공극 형성 독소이고 스타필로코커스 아우레우스 폐렴의 마우스 모델에서 MRSA의 필수 병독성 인자이다. 독립적인 스타필로코커스 아우레우스 균주들에 의한 H1a 발현의 수준은 그들의 병독성과 직접적으로 상관관계를 갖는다. 공극을 형성할 수 없는 돌연변이체 형태의 H1a(Hla-H35L, 서열번호 5)를 사용한 능동 면역화는 항원 특이적 면역글로불린 G 반응을 발생시키고 스트렙토코커스 뉴모니아에 대한 보호를 부여하는 것으로 밝혀졌다(문헌[Menzies, B. E., and D. S. Kernodle. 1996. Passive immunization with antiserum to a nontoxic alpha-toxin mutant from Staphylococcus aureus is protective in a murine model. Infect Immun 64: 1839-41; Jursch, R., A. Hildebrand, G. Hobom, J. Tranum-Jensen, R. Ward, M. Kehoe and S. Bhakdi. 1994. Histidine residues near the N terminus of staphylococcal alpha-toxin as reporters of regions that are critical for oligomerization and pore formation. Infect Immun 62(6): 2249-56]). H1a 특이적 항체의 전달은 스타필로코커스 아우레우스 공격으로부터 무경험(naive) 동물을 보호하고 감염 동안 인간 폐 상피세포의 손상을 예방한다(문헌[Bubeck Wardenburg, J., A. M. Palazzolo-Ballance, M. Otto, O. Schneewind, and F. R. DeLeo. 2008. Panton-Valentine leukocidin is not a virulence determinant in murine models of community-associated methicillin-resistant Staphylococcus aureus disease. J Infect Dis 198: 1166-70]). 백신으로서 사용되기 위해, H1a 내의 H35 돌연변이는 단백질의 독성을 제거할 필요가 있다(문헌[Menzies, B. E., and D. S. Kernodle. 1994. Site-directed mutagenesis of the alpha-toxin gene of Staphylococcus aureus: role of histidines in toxin activity in vitro and in a murine model. Infect Immun 62: 1843-7]). ClfA는 면역화에 사용될 프로테아제 내성 도메인을 함유한다. 항-ClfA 항체 및 항-CP5 항체를 사용한 마우스의 수동 면역화는 유선 감염 모델에서 유선을 효과적으로 멸균한다(문헌[Tuchscherr, L. P., F. R. Buzzola, L. P. Alvarez, J. C. Lee, and D. O. Sordelli. 2008. Antibodies to capsular polysaccharide and clumping factor A prevent mastitis and the emergence of unencapsulated and small-colony variants of Staphylococcus aureus in mice. Infect Immun 76: 5738-44]).
본 발명의 추가 실시양태는 스타필로코커스 아우레우스에 천연적으로 존재하는 단백질, 예를 들면, H1a 및 C1fA의 글리코실화를 포함한다. 본 발명의 추가 예시적 실시양태에서, 사용되는 단백질 담체는 H1a 단백질, 예를 들면, H1a-H35L(예를 들면, 서열번호 6, 서열번호 7, 서열번호 8 또는 서열번호 16)이 되도록 선택될 수 있다. 본 발명의 또 다른 추가 예시적 실시양태에서, 단백질 담체는 ClfA 단백질(예를 들면, 서열번호 10, 서열번호 11 또는 서열번호 12)이다.
추가로, 본 발명은 제1 원핵 종, 예컨대, 그람-양성 종의 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 상이한 원핵 종, 예컨대, 그람-음성 종의 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 숙주 원핵 유기체에 관한 것이다. 또한, 본 발명은 그람-양성 원핵 유기체에만 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 도입된 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 숙주 원핵 유기체에 관한 것이다. 또한, 본 발명은 예를 들면, 숙주 원핵 유기체와 상이한 제1 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 및 상기 제1 원핵 유기체의 종과 상이하고 예를 들면, 상기 숙주와 상이한 제2 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 또는 개조된 숙주 원핵 유기체에 관한 것이다. 상기 개조된 원핵 유기체는 예를 들면, 그람-양성 종인 제1 원핵 종을 포함할 수도 있다. 상기 개조된 원핵 유기체는 예를 들면, 그람-음성 종인 제2 원핵 종을 포함할 수도 있다. 본 발명은 예를 들면, 재조합 또는 개조된 그람-음성 숙주 원핵 유기체와 상이한 그람-음성 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 스타필로코커스 아우레우스에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 또는 개조된 그람-음성 숙주 원핵 유기체를 추가로 포함한다. 추가로, 본 발명은 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 스타필로코커스 아우레우스 CP5 균주 및/또는 스타필로코커스 아우레우스 CP8 균주에 천연적으로 존재하는 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; 슈도모나스 애루기노사 EPA, 스타필로코커스 아우레우스 알파 헤모라이신 또는 스타필로코커스 아우레우스 응괴 인자 A 단백질 담체를 코딩하는 뉴클레오타이드 서열; 및 OTase, 예를 들면, 캄필로박터 제주니에 천연적으로 존재하는 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 또는 개조된 에스케리치아 콜라이 숙주를 포함한다.
추가 실시양태에서, 변형된 숙주 에스케리치아 콜라이 유기체에서 다른 그람-음성 유기체의 생합성 경로를 사용하는 것 이외에 (i) (표적 그람-양성 스타필로코커스 아우레우스 유기체의 관심있는 폴리사카라이드의 반복 단위와 동일한) 다른 그람-음성 유기체의 폴리사카라이드의 반복 단위의 구조를 구축하기 위한 글리코실트랜스퍼라제, (ii) 다른 그람-음성 유기체의 관련 폴리사카라이드에서 발견되지 않는, 표적 그람-양성 스타필로코커스 아우레우스 유기체의 관심있는 폴리사카라이드의 단위를 구축하기 위한 글리코실트랜스퍼라제, 및 (iii) 표적 그람-양성 스타필로코커스 아우레우스 유기체의 관심있는 구축된 RU를 플립핑하고 중합하여 스타필로코커스 아우레우스 캡슐 유사 폴리사카라이드를 형성하기 위한 효소를 코딩하는 핵산도 숙주 에스케리치아 콜라이 유기체 내에 포함된다. 구체적으로, 이 실시양태에서, (i)을 코딩하는 핵산은 다른 그람-음성 세균으로부터 유래되는 반면, (ii) 및 (iii)을 코딩하는 핵산은 표적 그람-양성 스타필로코커스 아우레우스 유기체로부터 유래된다.
본 발명의 또 다른 양태는 i) 그람-양성 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; ii) 단백질을 코딩하는 뉴클레오타이드 서열; 및 iii) OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 개조된 숙주 원핵 유기체에 관한 것이고, 이때 상기 그람-양성 원핵 종의 수송자 유전자를 코딩하는 서열은 결실되어 있다. 이러한 실시양태는 그람-양성 글리코실트랜스퍼라제만을 코딩하는 도입된 핵산 구축물을 포함한다.
하나 이상의 다른 실시양태에서 숙주 내로 도입될 다른 핵산에 관하여, 슈도모나스 애루기노사 및 스타필로코커스 아우레우스 각각으로부터의 글리코실트랜스퍼라제를 코딩하는 핵산 이외에 단백질, 예컨대, AcrA, H1a, ClfA 또는 EPA(서열번호 15, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 16, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14), 및 캄피로박터 제주니의 올리고사카릴트랜스퍼라제(서열번호 27)(상기 유기체의 글리코실화 기구의 일부임)를 코딩하는 핵산이 숙주 내로 주입된다. 그 결과, 변형된 에스케리치아 콜라이 유기체는 AcrA 단백질을 스타필로코커스 아우레우스 및 다른 그람-음성 세균로부터의 글리코실트랜스퍼라제의 작용에 의해 상기 유기체 내에서 생성된 폴리사카라이드로 글리코실화할 수 있다.
본 발명의 한 실시양태는 i) 숙주 원핵 유기체와 상이한 제1 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; ii) 상기 숙주 원핵 유기체와 상이한 제2 원핵 종, 예를 들면, 그람-양성 원핵 종에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열; iii) 단백질을 코딩하는 뉴클레오타이드 서열; 및 OTase를 코딩하는 뉴클레오타이드 서열을 포함하는 개조된 숙주 원핵 유기체를 포함한다. 본 발명의 실시양태에서, 상기 제1 원핵 종은 그람-음성 종, 예를 들면, 슈도모나스 애루기노사이다.
본 발명의 내용에서, 숙주 세포는 임의의 숙주 세포, 예를 들면, 진핵 또는 원핵 숙주 세포를 의미한다. 다른 실시양태에서, 숙주 세포는 원핵 숙주 세포, 예를 들면, 에스케리치아 아종, 캄필로박터 아종, 살모넬라(Salmonella) 아종, 쉬겔라(Shigella) 아종, 헬리코박터(Helicobacter) 아종, 슈도모나스 아종 또는 바실러스(Bacillus) 아종이다. 추가 실시양태에서, 숙주 세포는 에스케리치아 콜라이, 캄필로박터 제주니, 살모넬라 티피뮤리움(Salmonella typhimurium) 등이다.
나아가, 본 발명은 스타필로코커스 아우레우스의 하나 이상의 글리코실트랜스퍼라제; 제2 원핵 종의 하나 이상의 글리코실트랜스퍼라제; 단백질; 및 OTase를 코딩하는 핵산을 숙주 원핵 유기체 내로 도입하는 단계를 포함하는, 생체접합체 백신을 제조하는 방법에 관한 것이다. 또한, 본 발명은 그람-음성 세균에서 운데카프레놀(Und) 상의 변형된 캡슐형 폴리사카라이드를 생성하고 이들 폴리사카라이드 항원들을 선택된 단백질 담체에 연결함으로써 생체접합체 백신을 제조하는 것에 관한 것이다.
추가로, 본 발명은 제1 원핵 유기체에 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하고 상기 제1 원핵 유기체와 상이한 제2 원핵 유기체에 천연적으로 존재하는 글리코실트랜스퍼라제도 코딩하는 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에서 글리코실화된 단백질을 제조하는 방법에 관한 것이다. 추가로, 본 발명은 상이한 유기체로부터의 상이한 글리코실트랜스퍼라제들의 조합물에 의해 합성된 그람-양성 세균의 캡슐형 폴리사카라이드로 N-글리코실화된 단백질을 제조하는 것에 관한 것이다. 나아가, 본 발명은 그람-양성 원핵 유기체에만 천연적으로 존재하는 글리코실트랜스퍼라제를 코딩하는 도입된 뉴클레오타이드 서열을 포함하는 숙주 원핵 유기체에서 글리코실화된 단백질을 제조하는 것에 관한 것이다.
당업계에서 공지되어 있는 바와 같이, 상이한 폴리사카라이드들의 생합성은 세균 세포에서 보존되어 있다. 폴리사카라이드들은 한정된 특이성을 갖는 상이한 글리코실트랜스퍼라제들에 의해 세포질 막에서 담체 지질 상에서 공통 전구체(활성화된 당 뉴클레오타이드)로부터 조립된다(문헌[Whitfield, C., and I. S. Roberts. 1999. Structure, assembly and regulation of expression of capsules in Escherichia coli. Mol Microbiol 31: 1307-19]). 그람-음성 세균에서 O-항원의 폴리사카라이드를 생성하는 생합성 경로 및 그람-양성 세균에서 캡슐형 폴리사카라이드 I형을 생성하는 생합성 경로는 보존되어 있다. 상기 과정은 폴리사카라이드 조립을 위해 동일한 지질 담체, 즉 UndP를 사용한다. 상기 과정은 막의 세포질 쪽에서 모노사카라이드-1-포스페이트를 담체 지질 UndP에 부가하는 것으로 시작된다. 상기 항원은 활성화된 당 뉴클레오타이드로부터의 모노사카라이드가 상이한 글리코실트랜스퍼라제들에 의해 순차적으로 부가됨으로써 구축된다. 그 다음, 지질-연결된 올리고사카라이드 또는 RU가 플립파제에 의해 상기 막을 통해 플립핑된다. RU는 원형질막주위공간에서 효소 Wzy에 의해 중합되어 그람-음성 세균에서 소위 O-항원을 형성하거나 그람-양성 세균에서 캡슐형 폴리사카라이드를 형성한다. 그람-음성 세균은 Wzz 효소를 사용하여 중합체의 길이를 조절하고, 상기 중합체는 지질 A 코어로 전달되어 LPS를 형성한다. LPS는 O-항원을 외부에 노출시키는 외막으로 추가로 전위된다(예를 들면, 도 1에 도시된 바와 같음). 대조적으로, 그람-양성 세균은 상이한 전문화된 효소 기구를 이용한 추가 수송을 통해 이 지질-결합된 전구체로부터 캡슐을 형성한다. 이들 폴리사카라이드들의 생합성 경로는 원형질막주위공간 내의 폴리사카라이드를 단백질 담체 상으로 포획함으로써 생체내에서 생체접합체를 제조할 수 있게 한다.
캡슐형 폴리사카라이드에 대한 폴리사카라이드 구축 과정은 상기 캡슐형 폴리사카라이드가 중합 후 담체 지질로부터 방출되고 표면 상으로 이출된다는 점에서 상이하다. 원형질막주위공간 구획을 함유하지 않는 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에서, 상기 항원의 중합은 막의 외부 쪽에서 일어난다. 또한, 스타필로코커스 아우레우스에서 길이 조절은 캡슐 조립을 담당하는 3종의 효소들로 구성된 기구에 포함된다. 이 조립에서, 폴리사카라이드는 담체 지질로부터 방출되어 효소적 과정에 의해 표면으로 이출된다.
스타필로코커스 아우레우스에서 기능성 캡슐 발현을 위해 필요한 유전자 클러스터에서 발견되는 유전적 요소는 wzy 의존성 O-항원 합성 클러스터에서 발견되는 유전적 기구와 유사하다(문헌[Dean, C. R., C. V. Franklund, J. D. Retief, M. J. Coyne, Jr., K. Hatano, D. J. Evans, G. B. Pier, and J. B. Goldberg. 1999. Characterization of the serogroup O11 O-antigen locus of Pseudomonas aeruginosa PA103. J Bacteriol 181:4275-4284]).
그람-양성 세균에서의 폴리사카라이드 구축과 그람-음성 세균에서의 폴리사카라이드 구축의 이들 차이점들에도 불구하고, 놀랍게도 그람-음성 유기체 내의 LPS 경로의 양태를 이용하여 그람-양성 세균, 예를 들면, 스타필로코커스 아우레우스에 천연적으로 존재하는 캡슐형 폴리사카라이드와 동일한 몇몇 반복 단위들을 함유하는 폴리사카라이드를 생성할 수 있다는 것을 발견하고 검증하였다. 이러한 폴리사카라이드가 그람-음성 숙주에서 LPS 경로 기작에 의해 생성되기 때문에, 이러한 폴리사카라이드의 구조는 LPS 폴리사카라이드 전구체의 구조와 동일하다. 따라서, 본 발명의 그람-음성 시스템에서 생성된 이러한 폴리사카라이드는 본원의 목적을 위해 "변형된 캡슐형 폴리사카라이드" 또는 "LPS 캡슐"로서 특징지워질 수 있다. 나아가, LPS 생합성 경로와 캡슐형 생합성 경로를 조합하는 이 새로이 합성된 발현 시스템 및 생합성 경로는 본원의 목적을 위해 "변형된 LPS 생합성 경로"인 것으로서 특징지워질 수 있다.
본 발명의 한 실시양태에서, 변형된 LPS 생합성 경로에 의해 생성된 변형된 폴리사카라이드는 하기 폴리사카라이드를 포함한다:
본 발명의 추가 실시양태에서, 변형된 LPS 생합성 경로에 의해 생성된 변형된 폴리사카라이드는 하기 폴리사카라이드를 포함한다:
본 발명의 기술을 이용하여, 면역원성을 나타내는 세균 생체접합체를 제조할 수 있다. 원하는 단백질의 원하는 위치에서 세균 폴리사카라이드의 생체내 접합을 가능하게 하는 유전적 변형이 만들어질 수 있다.
본 발명의 또 다른 양태는 상기 논의된 바와 같은 변형된 LPS 생합성 경로를 이용하여 단백질 담체에 접합된 LPS 캡슐 또는 변형된 LPS를 제조하는 것을 포함한다.
본 발명의 추가 실시양태는 Cap5 및 Cap8 완전 폴리사카라이드 생합성 클러스터를 코딩하는 뉴클레오타이드 서열 구축물을 포함하고, 이때 결실된 수송자 유전자는 스타필로코커스 아우레우스의 capA, capB 및 capC이다(도 6 참조).
본 발명의 추가 실시양태는 CP5/O11 키메라 클러스터(서열번호 2, 서열번호 3 또는 서열번호 17) 또는 CP8/O11 키메라 클러스터(서열번호 4, 서열번호 18 또는 서열번호 19)를 숙주 세포의 게놈 내로 삽입하는 것을 포함하다. 본 발명의 추가 실시양태는 (a) CP5/O11 키메라 클러스터(서열번호 2, 서열번호 3 또는 서열번호 17) 또는 CP8/O11 키메라 클러스터(서열번호 4, 서열번호 18 또는 서열번호 19); (b) OTase를 코딩하는 핵산; 및 (c) 도입된 공통 서열을 갖거나 갖지 않는 단백질을 코딩하는 핵산을 숙주 세포의 게놈 내로 삽입하는 것을 포함한다.
본 발명의 또 다른 실시양태는 플라스미드, 예를 들면, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18 및 서열번호 19 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 또한, 본 발명은 서열번호 13, 서열번호 14 및 서열번호 15 중 하나 이상의 서열을 포함하는 플라스미드를 포함한다. 또한, 본 발명은 서열번호 16, 서열번호 6, 서열번호 7 및 서열번호 8 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 또한, 본 발명은 서열번호 10; 서열번호 11 및 서열번호 12 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다. 나아가, 본 발명은 서열번호 20, 서열번호 21 및 서열번호 27 중 하나 이상의 서열을 포함하는 플라스미드에 관한 것이다.
나아가, 본 발명의 실시양태는 예를 들면, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21 및 서열번호 27 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포를 포함하는 형질전환된 세균 세포에 관한 것이다. 서열번호 19 및 서열번호 20 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포도 본 발명에 포함된다. 서열번호 13, 서열번호 19 및 서열번호 21 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포도 본 발명에 포함된다. 추가로, 본 발명은 서열번호 16, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 10, 서열번호 11 및 서열번호 12 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포에 관한 것이다. 또한, 본 발명은 예를 들면, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18 및 서열번호 19 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포를 포함하는 형질전환된 세균 세포에 관한 것으로서, 이때 상기 세균 세포는 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제, 및 스타필로코커스 아우레우스 CP5 및/또는 CP8에 천연적으로 존재하는 글리코실트랜스퍼라제를 발현한다. 서열번호 17, 서열번호 18 및 서열번호 19 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포도 본 발명에 포함되고, 이때 상기 세균 세포는 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제, 스타필로코커스 아우레우스 CP5 및/또는 CP8에 천연적으로 존재하는 글리코실트랜스퍼라제 및 PglB를 발현한다. (a) 서열번호 19를 포함하는 플라스미드로 형질전환된 세균 세포로서, 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제, 스타필로코커스 아우레우스 CP8에 천연적으로 존재하는 글리코실트랜스퍼라제, 에스케리치아 콜라이 혈청형 O7의 Wzz 및 PglB를 발현하는 세균 세포; (b) 서열번호 19 및 서열번호 20 중 하나 이상의 서열을 포함하는 플라스미드로 형질전환된 세균 세포로서, 슈도모나스 애루기노사에 천연적으로 존재하는 글리코실트랜스퍼라제, 스타필로코커스 아우레우스 CP8에 천연적으로 존재하는 글리코실트랜스퍼라제, Wzz(길이 조절제), EPA 및 PglB를 발현하는 세균 세포; 및 (c) 서열번호 16, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 10, 서열번호 11 및 서열번호 12 중 하나 이상의 서열을 포함하는 세균 세포도 본 발명에 포함된다.
추가로, 본 발명의 실시양태는 포유동물, 예를 들면, 인간에서 그람-양성 세균 및 다른 세균에 의해 야기된 감염에 대한 면역 반응을 유도하는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 하나 이상의 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음)를 포함하는 단백질; 및 상기 공통 서열에 연결된, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드로서, 또 다른 하나 이상의 올리고사카라이드 또는 폴리사카라이드와 동일하거나 또는 상이한 하나 이상의 올리고사카라이드 또는 폴리사카라이드를 포함하는 유효량의 약학 조성물을 상기 포유동물에게 투여하는 단계를 포함한다. 본 발명의 추가 실시양태는 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음); 하나 이상의 스타필로코커스 아우레우스 올리고사카라이드 또는 폴리사카라이드, 예컨대, CP5 폴리사카라이드; 및 약학적으로 허용가능한 보조제를 포함하는 유효량의 약학 조성물을 포유동물에게 투여하는 단계를 포함하는, 상기 포유동물에서 스타필로코커스 아우레우스에 의해 야기된 감염에 대한 면역 반응을 유도하는 것에 관한 것이다. 본 발명의 또 다른 실시양태는 삽입된 공통 서열 D/E-X-N-Z-S/T(이때, X 및 Z는 프롤린을 제외한 임의의 아미노산일 수 있음); 하나 이상의 스타필로코커스 아우레우스 CP8 폴리사카라이드; 및 약학적으로 허용가능한 보조제를 포함하는 유효량의 약학 조성물을 포유동물에게 투여하는 단계를 포함하는, 상기 포유동물에서 스타필로코커스 아우레우스에 의해 야기된 감염에 대한 면역 반응을 유도하는 방법을 포함한다. 추가 실시양태는 2개 이상의 공통 서열을 갖는 단백질 및 상이한 그람-양성 세균 균주로부터의 올리고사카라이드 또는 폴리사카라이드를 포함하는 유효량의 약학 조성물을 투여하는 단계를 포함하는, 포유동물에서 스타필로코커스 아우레우스에 의해 야기된 감염에 대한 면역 반응을 유도하는 것에 관한 것이다. 추가 실시양태는 2개 이상의 공통 서열을 갖는 단백질, 및 스타필로코커스 아우레우스 CP5 및 스타필로코커스 아우레우스 CP8을 포함하는 폴리사카라이드를 포함하는 유효량의 약학 조성물을 투여하는 단계를 포함하는, 포유동물에서 스타필로코커스 아우레우스에 의해 야기된 감염에 대한 면역 반응을 유도하는 것에 관한 것이다.
본 명세서에서 특정 뉴클레오타이드 또는 아미노산 서열이 언급되는 경우, 본 발명은 언급된 서열과 동일한 기능을 여전히 구현하는 상동 서열을 포함한다는 것을 이해할 것이다. 본 발명의 한 실시양태에서, 이러한 서열은 85% 이상의 상동성을 나타낸다. 또 다른 실시양태에서, 이러한 서열은 90% 이상의 상동성을 나타낸다. 추가 실시양태에서, 이러한 서열은 95% 이상의 상동성을 나타낸다. 2개의 뉴클레오타이드 또는 아미노산 서열들 사이의 퍼센트 동일성의 측정은 당업자에게 공지되어 있다.
본원에 기재된 핵산 서열, 예컨대, 본 명세서에 수반되는 서열목록에 기재된 핵산 서열은 단지 예이고, 이들 서열들이 상이한 방식으로 조합될 수 있다는 것은 당업자에게 자명할 것이다. 본 발명의 추가 실시양태는 핵산의 변이체를 포함한다. 핵산의 변이체(예를 들면, 코돈-최적화된 핵산)는 실질적으로 동일, 즉 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26 및/또는 서열번호 27과 70% 이상 동일, 예를 들면, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.5% 이상 동일할 수 있다. 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26 및/또는 서열번호 27을 함유하는 서열의 핵산 변이체도 포함된다. 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26 및/또는 서열번호 27을 함유하는 서열, 또는 이의 일부로부터의 하나 이상의 뉴클레오타이드(예를 들면, 2개, 3개, 4개, 5개, 6개, 8개, 10개, 12개, 15개, 20개, 25개, 30개, 35개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개 또는 그 이상의 뉴클레오타이드)의 치환, 변경, 변형, 대체, 결실 및/또는 부가를 갖는 핵산이 포함된다.
이러한 변이체는 원핵 글리코실트랜스퍼라제를 코딩하고 i) 숙주 세포, 예컨대, 에스케리치아 콜라이에서 발현되고 ii) 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 17, 서열번호 18 및/또는 서열번호 19, 및/또는 이들의 일부와 실질적으로 동일한 핵산을 포함한다.
본원에 기재된 핵산은 재조합 DNA 및 합성(예를 들면, 화학적으로 합성된) DNA를 포함한다. 핵산은 이중 가닥 또는 단일 가닥 핵산일 수 있다. 단일 가닥 핵산의 경우, 상기 핵산은 센스 가닥 또는 안티센스 가닥일 수 있다. 핵산은 본 명세서에 비추어 볼 때 당업자에게 공지되어 있는 바와 같이 올리고뉴클레오타이드 유사체 또는 유도체를 사용함으로써 합성될 수 있다.
본원에 기재된 핵산을 포함하는 플라스미드는 발현을 위해 숙주 세포 내로 형질전환될 수 있다. 형질전환 기법은 본 명세서에 비추어 볼 때 당업자에게 공지되어 있다.
본 발명의 추가 실시양태는 단백질 담체에 접합된 LPS 캡슐 또는 변형된 LPS를 함유하는 그람-양성 생체접합체 백신을 제조하는 것을 포함한다.
본 발명의 추가 실시양태는 신규 생체접합체 백신을 포함한다. 본 발명의 추가 실시양태는 면역원성 또는 항원성 생체접합체를 직접적으로 생성하는 재조합 세균 세포를 사용하여 이러한 생체접합체 백신을 제조하는 신규 방법을 포함한다. 한 실시양태에서, 생체접합체 백신은 세균 질환, 예컨대, 설사, 병원내 감염 및 수막염을 치료하거나 예방하는 데에 사용될 수 있다. 추가 실시양태에서, 생체접합체 백신은 암 또는 다른 질환의 치료 및/또는 예방 잠재력을 가질 수 있다.
본 발명의 또 다른 실시양태에서, 폴리사카라이드(즉, 당 잔기)와 단백질(예컨대, 단백질 담체)의 합성된 복합체가 감염, 예컨대, 스타필로코커스 아우레우스 감염으로부터 보호하는 접합체 백신으로서 사용될 수 있다. 한 실시양태에서, 생체접합체 백신, 예컨대, 그람-양성 백신은 삽입된 핵산 공통 서열을 포함하는 단백질 담체; 상기 공통 서열에 연결된, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드; 및 선택적으로 보조제를 포함한다. 추가로, 또 다른 실시양태에서, 본 발명은 삽입된 핵산 공통 서열을 포함하는 단백질 담체; 상기 공통 서열에 연결된, 그람-양성 세균으로부터의 하나 이상의 올리고사카라이드 또는 폴리사카라이드, 예컨대, 캡슐형 폴리사카라이드 또는 LPS 캡슐; 및 선택적으로 보조제를 포함하는 그람-양성 생체접합체 백신, 예컨대, 스타필로코커스 아우레우스 백신에 관한 것이다. 본 발명의 또 다른 실시양태에서, 스타필로코커스 아우레우스 생체접합체 백신은 2개 이상의 이들 삽입된 공통 서열들을 포함한다. 추가 실시양태에서, 스타필로코커스 아우레우스 생체접합체 백신은 2개 이상의 스타필로코커스 아우레우스 올리고사카라이드 또는 폴리사카라이드를 포함한다. 추가 실시양태는 2개 이상의 상기 삽입된 공통 서열; 및 상이한 스타필로코커스 아우레우스 균주, 예를 들면, 스타필로코커스 아우레우스 캡슐형 폴리사카라이드 5 균주(CP5) 및 캡슐형 폴리사카라이드 8 균주(CP8)로부터의 올리고사카라이드 또는 폴리사카라이드를 포함한다.
본 발명의 추가 실시양태는 변형된 캡슐형 폴리사카라이드 또는 LPS 캡슐의 생성을 포함하는, 변형된 LPS 경로를 이용하는 글리코실화 시스템에 의해 제조된 스타필로코커스 아우레우스 백신을 포함한다. 추가 실시양태는 그람-음성 원핵 종의 글리코실트랜스퍼라제를 코딩하지 않는 도입된 핵산으로부터 변형된 캡슐형 폴리사카라이드를 생성하는 것을 포함하는 변형된 LPS 경로를 이용하는 글리코실화 시스템에 의해 제조된 스타필로코커스 아우레우스 백신을 포함한다.
추가 실시양태는 하기 i) 내지 v)를 코딩하는 핵산을 포함하는 글리코실화 시스템에 의해 제조된 스타필로코커스 아우레우스 백신을 포함한다: i) 슈도모나스 애루기노사에 천연적으로 존재하는 O11 항원의 RU의 L-FucNAc-→D-FucNAc를 생성하는 것을 담당하는 하나 이상의 글리코실트랜스퍼라제; ii) 스타필로코커스 아우레우스의 CP5 또는 CP8 균주에 천연적으로 존재하는 D-ManNAcA 함유 RU를 생성하는 것을 담당하는 하나 이상의 글리코실트랜스퍼라제; iii) CP5 또는 CP8 구축된 RU의 플립핑 및 중합을 담당하는 하나 이상의 효소; iv) 도입된 공통 서열을 함유하는 재조합 단백질; 및 v) 캄필로박터 제주니로부터의 올리고사카릴트랜스퍼라제. 이 실시양태에서, 숙주 유기체는 그람-음성 세균, 예를 들면, 에스케리치아 콜라이일 수 있다.
본 발명의 추가 실시양태는 하기 i) 내지 iv)를 코딩하는 핵산을 포함하는 글리코실화 시스템에 의해 제조된 스타필로코커스 아우레우스 백신을 포함한다: i) 슈도모나스 애루기노사에 천연적으로 존재하는 O11 항원의 RU의 L-FucNAc-→D-FucNAc를 생성하는 것을 담당하는 글리코실트랜스퍼라제; ii) 스타필로코커스 아우레우스의 CP5 또는 CP8 균주에 천연적으로 존재하는 D-ManNAcA 함유 RU를 생성하는 것을 담당하는 글리코실트랜스퍼라제; 캄필로박터 제주니의 AcrA 단백질; 및 iv) 캄필로박터 제주니로부터의 올리고사카릴트랜스퍼라제. 이 실시양태에서, 숙주 유기체는 그람-음성 세균, 예를 들면, 에스케리치아 콜라이일 수 있다.
본 발명의 백신은 치료 및 예방 유용성을 갖는다. 본 발명의 백신이 인간 의학 및 수의학 분야에서 유용할 수 있다는 것이 인식될 것이다. 따라서, 면역화될 대상체는 인간 또는 다른 동물, 예를 들면, 소, 양, 돼지, 말, 염소 및 가금류(예를 들면, 닭, 칠면조, 오리 및 거위)를 포함하는 농장 동물, 및 애완 동물, 예컨대, 개 및 고양이일 수 있다.
또 다른 양태에서, 본 발명은 세균, 예컨대, 그람-양성 세균에 대해 포유동물을 면역화시키는 백신을 발생시키는 방법에 관한 것이다. 상기 방법은 대상체를 생체접합체, 예컨대, 그람-양성 폴리사카라이드, 예를 들면, 스타필로코커스 아우레우스 폴리사카라이드 및 약학적으로 허용가능한 담체를 포함하는 생체접합체로 면역화시키는 단계를 포함한다.
또한, 본 발명은 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에 의한 감염으로부터 보호하기 위한, 또는 그람-양성 감염, 예컨대, 스타필로코커스 아우레우스 감염을 치료하기 위한 백신 조성물을 특징으로 한다. 한 실시양태에서, 상기 백신 조성물은 스타필로코커스 아우레우스로부터의 하나 이상의 면역원성 성분, 예컨대, 폴리사카라이드, 또는 이의 단편 또는 일부를 포함한다. 추가 실시양태에서, 상기 백신 조성물은 그람-음성 또는 그람-양성 세균으로부터의 하나 이상의 면역원성 성분, 예컨대, 단백질, 또는 이의 단편 또는 일부를 포함한다.
본 발명의 한 양태는 스타필로코커스 아우레우스 폴리사카라이드의 하나 이상의 면역원성 성분 또는 단편 및 약학적으로 허용가능한 담체를 함유하는, 스타필로코커스 아우레우스에 의한 감염으로부터 보호하기 위한 백신 조성물을 제공한다. 이러한 면역원성 성분 또는 단편은 예를 들면, 약 2개 이상의 단량체 길이 또는 약 3개 이상의 단량체 길이를 갖는 스타필로코커스 아우레우스 폴리사카라이드를 포함할 수 있다. 본 발명의 추가 양태에서, 스타필로코커스 아우레우스 RU는 상기 단량체를 포함한다. 이러한 반복 단위는 예를 들면, 1개(하나) 이상의 단량체 길이를 갖는 스타필로코커스 아우레우스 RU를 포함할 수 있다.
본 발명의 면역원성 성분 또는 단편은 예를 들면, 재조합적으로 또는 화학적 합성을 통해 제조된 폴리사카라이드 또는 폴리펩티드의 스크리닝, 또는 예를 들면, 폴리사카라이드 및 단백질을 포함하는 생체접합체의 스크리닝에 의해 수득될 수 있다. 본 발명의 면역원성 성분 또는 단편의 스크리닝은 하나 이상의 여러 상이한 분석을 이용함으로써 수행될 수 있다. 예를 들면, 스크리닝 분석은 ELISA 및 당업자에게 공지되어 있는 다른 분석을 포함한다.
한 실시양태에서, 면역원성 성분 또는 단편은 예를 들면, 당접합체 백신 후보물질인 CP5-EPA에 대한 특이적 항-CP5 항체(ELISA에 의해 정량됨)를 측정하는, 마우스(도 15a) 및 토끼(도 15b)에서 수득된 면역 반응, 및 당업자에게 공지되어 있는 다른 수단에 의해 측정될 때 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스 CP5 또는 CP8 폴리사카라이드에 대한 IgG 항체를 자극하는 폴리사카라이드 및/또는 단백질의 능력에 의해 확인된다.
한 실시양태에서, 면역원성 성분 또는 단편은 예를 들면, 토끼 항-CP5-EPA 항체(하기 실시예 7에서 수득됨, 도 15b 참조)를 사용한 스타필로코커스 아우레우스 사멸("시험관내" 활성) 및 당업자에게 공지되어 있는 다른 수단에 의해 측정될 때 옵소닌 활성, 예컨대, 옵소닌식균작용 사멸을 자극하는 폴리사카라이드 및/또는 단백질의 능력에 의해 확인된다.
추가 실시양태에서, 면역원성 성분 또는 단편은 예를 들면, 마우스에서 CP5-EPA를 사용한 능동 면역화(도 18)의 이용을 통한 세균 감염("공격")으로부터의 보호 및 당업자에게 공지되어 있는 다른 수단에 의해 측정될 때 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에 대한 체액성 면역 및/또는 세포 매개 면역을 자극하는 폴리사카라이드 및/또는 단백질의 능력에 의해 확인된다.
본 발명의 한 실시양태에서, 본 발명의 백신 조성물은 본 발명의 스타필로코커스 아우레우스 폴리사카라이드의 면역원성 성분 또는 단편을 포함하고 선택적으로 약학적으로 허용가능한 담체 또는 보조제를 추가로 포함하는 당단백질을 주성분으로 할 수 있다. 본 발명의 추가 실시양태에서, 백신 조성물은 본 발명의 스타필로코커스 아우레우스 단백질의 면역원성 성분 또는 단편을 포함하고 선택적으로 약학적으로 허용가능한 담체 또는 보조제를 추가로 포함하는 당단백질을 주성분으로 할 수 있다. 본 발명의 추가 양태에서, 백신 조성물은 본 발명의 슈도모나스 애루기노사 단백질의 면역원성 성분 또는 단편을 포함하고 선택적으로 약학적으로 허용가능한 담체 또는 보조제를 추가로 포함하는 당단백질을 주성분으로 할 수 있다.
1종의 포유동물, 예를 들면, 마우스에게 투여될 백신을 또 다른 종류의 포유동물, 예를 들면, 인간에게 투여하기 위해 변형시키는 방법은 당업자에게 잘 공지되어 있다. 예를 들면, 당업자는 마우스에서 백신 조성물에서 사용된 당단백질의 단백질 담체로부터 히스티딘 태그를 결실시키는 것이 인간에게 투여될 백신 조성물에 적합한 당단백질을 만들 것이라는 것을 용이하게 인식할 것이다. 예를 들면, 단백질 담체, 예를 들면, EPA(서열번호 13), ClfA(서열번호 10, 서열번호 11, 서열번호 12), 및 H1a(서열번호 6, 서열번호 7, 서열번호 8, 서열번호 16)로부터의 히스티딘 태그(His 태그)의 결실이 인간에게 투여될 당단백질에서의 상기 단백질 담체의 사용을 위해 인식될 것이다.
그람-양성 세균에 의해 야기된 감염 또는 질환, 예를 들면, 스타필로코커스 아우레우스에 의해 야기된 감염 또는 질환, 또는 다른 세균에 의해 야기된 감염 또는 질환을 위해 사용되는 약물치료의 투여량의 감소, 또는 환자의 혈청 또는 점액 중의 항체의 생성 증가를 포함하는, 그람-양성, 예를 들면, 스타필로코커스 아우레우스 또는 다른 세균 감염 또는 질환의 증상들 중 임의의 증상의 호전이 원하는 임상 목표라는 것을 이해해야 한다. 본 발명의 백신 조성물들 중 몇몇 백신 조성물은 그람-양성 감염, 예를 들면, 스타필로코커스 아우레우스 감염, 또는 다른 세균 감염의 예방에 유용하고, 몇몇 백신 조성물은 그람-양성 감염, 예를 들면, 스타필로코커스 아우레우스 감염, 또는 다른 세균 감염의 치료에 유용하고, 몇몇 백신 조성물은 이러한 감염의 예방 및 치료 둘다에 유용하다는 것이 당업자에게 자명할 것이다.
본 발명의 실시양태, 예컨대, 백신 및 다른 약제는 선택적으로 당업계에서 잘 공지되어 있고 본 명세서에 비추어 볼 때 자명한 바와 같이 적합한 약학적으로 허용가능한 담체, 부형제, 희석제 및/또는 보조제를 사용함으로써 제조될 수 있다. 부형제, 희석제 또는 보조제는 활성 성분에 대한 비히클 또는 매질로서 작용할 수 있는 고체, 반고체 또는 액체 물질일 수 있다. 본 명세서에 비추어 볼 때, 조성물 제조 분야의 당업자는 선택된 생성물의 구체적인 특징, 치료될 질환 또는 병태, 상기 질환 또는 병태의 단계, 및 다른 관련 환경에 따라 적절한 투여 제형 및 방식을 용이하게 선택할 수 있다(문헌[Remington's Pharmaceutical Sciences, Mack Publishing Co. (1990)]). 약학적으로 허용가능한 희석제, 부형제 또는 보조제의 비율 및 성질은 선택된 약학적 활성 화합물의 가용성 및 화학적 성질, 선택된 투여 경로 및 표준 약학 관행에 의해 결정된다.
따라서, 본 발명의 실시양태에서, 백신 조성물은 면역원성 성분 또는 단편, 예를 들면, 스타필로코커스 아우레우스 폴리사카라이드 또는 이의 단편, 및/또는 스타필로코커스 아우레우스 또는 슈도모나스 애루기노사 단백질 또는 이의 단편을 포함하고, 선택적으로 약학적으로 허용가능한 담체를 포함한다. 용어 "약학적으로 허용가능한 담체"는 무독성 담체를 의미한다. 적합한 약학적으로 허용가능한 담체는 예를 들면, 하나 이상의 물, 식염수, 포스페이트 완충 식염수, 덱스트로스, 글리세롤, 에탄올 등 및 이들의 조합물을 포함한다. 약학적으로 허용가능한 담체는 항체의 저장 수명 또는 효능을 증강시키는 소량의 보조 물질, 예컨대, 습윤화제 또는 유화제, 보존제 또는 완충제를 추가로 포함할 수 있다. 이러한 약학적으로 허용가능한 담체는 예를 들면, 약학적 비히클, 부형제 또는 매질로서 작용하는 액체, 반고체 또는 고체 희석제를 포함한다. 당업계에서 공지되어 있는 임의의 희석제가 사용될 수 있다. 예시적인 희석제는 폴리옥시에틸렌 소르비탄 모노라우레이트, 마그네슘 스테아레이트, 메틸하이드록시벤조에이트 및 프로필하이드록시벤조에이트, 탈크, 알기네이트, 전분, 락토스, 수크로스, 덱스트로스, 소르비톨, 만니톨, 아카시아 검, 칼슘 포스페이트, 미네랄 오일, 코코아 버터 및 테오브로마(theobroma) 오일을 포함하나 이들로 제한되지 않는다.
추가로, 본 발명의 추가 실시양태에서, 백신 조성물은 미립자 보조제, 예컨대, 알루미늄 염(알루미늄 하이드록사이드, 알루미늄 포스페이트, 알루미늄 하이드록시포스페이트 설페이트 등); 유화액, 예컨대, 수중유(MF59, AS03); 액체와 염의 조합물, 예컨대, ASO4; 유중수(몬타나이드(Montanide)); ISCOMS, 리포좀/비로좀; 나노입자 및 마이크로입자 등; 비미립자화된 보조제, 예컨대, 펩티드; 사포닌(QS21); MPL A; 사이토카인; DNA 유도체; 세균 독소 등을 포함하나 이들로 제한되지 않는 보조제 또는 보조제의 조합물을 선택적으로 포함할 수 있다. 추가 실시양태는 동물에서 사용되는 보조제, 예컨대, 프로인트 완전 보조제(Freund's Complete Adjuvant) 및 프로인트 불완전 보조제(Freund's Incomplete Adjuvant), 마이콜레이트계 보조제(예를 들면, 트레할로스 다이마이콜레이트), 세균 리포폴리사카라이드(LPS), 펩티도글리칸(즉, 뮤레인, 뮤코펩티드 또는 당단백질, 예컨대, N-오파카(Opaca), 뮤라밀 다이펩티드[MDP], 또는 MDP 유사체), 프로테오글리칸, 스트렙토코커스 제제(예를 들면, OK432), DEAE-덱스트란, 중성 오일(예컨대, 미글리올(miglyol)), 식물성 오일(예컨대, 아라키스 오일), 플루로닉, 리비(Ribi) 보조제 시스템 또는 인터루킨, 특히 세포 매개 면역을 자극하는 인터루킨을 포함한다. 사용되는 보조제는 부분적으로 당접합체 백신의 조성 및 종류에 의해 좌우될 것이다. 투여될 보조제의 양은 포유동물의 종류 및 크기에 의해 좌우될 것이다. 최적 투여량은 상용적인 방법에 의해 용이하게 결정될 수 있다.
본 발명의 추가 양태는 본 발명에 따른 하나 이상의 당단백질을 포함하는 약학 조성물에 관한 것이다. 당단백질을 포함하는 약제의 제조는 당업계에서 잘 공지되어 있다. 최종 약학 조성물의 제조 방법, 및 그의 투여의 방식 및 세부사항은 사용되는 단백질, 숙주 세포, 핵산 및/또는 벡터에 의해 좌우될 것이다.
본 발명의 폴리사카라이드 또는 당단백질의 치료 유효량이 특히, 투여 일정, 투여되는 항체의 단위 투여량, 폴리사카라이드 또는 당단백질이 다른 치료제와 조합되어 투여되는지 여부, 환자의 면역 상태 및 건강, 및 구체적인 폴리사카라이드 또는 당단백질의 치료 활성에 의해 좌우될 것이라는 것은 당업자에게 자명할 것이다.
본 발명의 백신 조성물 및/또는 약학 제제는 경구, 비경구 또는 국소 사용에 적합하게 만들어질 수 있고 정제, 캡슐제, 좌약제, 용액, 현탁액 또는 임의의 다른 적합한 수단 또는 투약 제형의 형태로 환자에게 투여될 수 있다. 본 발명의 추가 양태에서, 백신 조성물 및/또는 약학 제제는 예를 들면, 정맥내, 피내, 근육내, 유선내, 복강내 또는 피하 주사; 또는 경구, 설하, 비강, 항문 또는 질 전달을 포함하는 임의의 공지된 방법에 의해 면역화될 대상체 내로 도입될 수 있다. 본 발명의 약학적 활성 화합물은 그 자체로 효과적이지만 안정성, 결정화의 편리성, 증가된 가용성 등을 위해 그의 약학적으로 허용가능한 염, 예컨대, 산 부가 염 또는 염기 부가 염의 형태로 제제화되어 투여될 수 있다. 본 발명의 한 실시양태에서, 백신 조성물은 비경구, 예를 들면, 피하 또는 근육내 주사에 의해 투여된다. 근육내 면역화 방법은 문헌(문헌[Wolff et al. (1990) Science 247: 1465-1468 and by Sedegah et al. (1994) Immunology 91: 9866-9870])에 기재되어 있다. 다른 투여 방식은 경구 및 경피를 포함한다.
본 발명의 백신은 예를 들면, 성인 또는 소아에서 일차 예방제로서 투여될 수 있거나, 감염된 숙주에서 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스의 성공적인 박멸 후 이차 예방제로서 투여될 수 있거나, 그람-양성 세균, 예컨대, 스타필로코커스 아우레우스에 의한 감염을 예방하기 위해 숙주에서 면역 반응을 유도할 목적으로 치료제로서 투여될 수 있다. 본 발명의 백신은 당업자에 의해 용이하게 결정되는 양으로 투여된다. 치료는 일정한 기간에 걸친 단회 투약 또는 다회 투약으로 구성될 수 있다. 예를 들면, 몇몇 실시양태에서, 인간의 경우 본 발명의 백신의 전형적인 투여량은 단백질 담체에 결합될(그리고 단백질 담체의 질량을 포함하지 않는) 약 1 ㎍ 내지 25 ㎍의 올리고사카라이드 항원, 추가 실시양태에서 약 1 ㎍ 내지 약 10 ㎍의 폴리사카라이드 항원, 추가 실시양태에서 약 2 ㎍의 폴리사카라이드 항원이다. 추가 실시양태에서, 당접합체 또는 백신에서 당/단백질 비는 약 1:5 내지 약 1:10이다. 선택적으로, 본 발명의 백신, 예컨대, 생체접합체 백신은 보조제를 포함할 수 있다. 당업자는 최적 투여량이 환자의 체중, 질환, 투여 경로 및 다른 인자들에 따라 더 많거나 더 적을 수 있다는 것을 인식할 것이다. 또한, 당업자는 적합한 투여량 수준이 공지된 백신을 사용한 결과에 근거하여 수득될 수 있다는 것을 인식할 것이다. 투약 횟수는 질환, 제제 및 임상 시험으로부터의 효능 데이터에 의해 좌우될 것이다.
백신 조성물은 전달하기 편리한 형태로 포장될 수 있다. 수용자 포유동물 내로의 면역원성 성분 또는 단편의 도입에 적합한 전달 형태가 바람직하다.
본 발명의 한 실시양태는 일반적으로 변형된 LPS 생합성 경로를 이용함으로써 그람-음성 유기체에서 그람-양성 유기체에 대한 백신을 재조합적으로 생성하는 것에 관한 것이다. 이것은 올리고사카릴트랜스퍼라제 및 단백질을 코딩하는 핵산, 및 2종 이상의 상이한 유기체로부터 유래된 글리코실트랜스퍼라제를 코딩하는 핵산을 숙주 내로 삽입함으로써 달성된다. 이 실시양태는 (i) 단백질; (ii) 올리고사카릴트랜스퍼라제 및 (iii) 2종 이상의 상이한 유기체로부터의 글리코실트랜스퍼라제를 코딩하는 핵산이 삽입된 천연 유기체에 근거하여 유기체를 유전적으로 개조하는 것에 관한 것이다.
이러한 실시양태의 일례에서, 글리코실화된 단백질 생성물은 스타필로코커스 아우레우스용 백신으로서 사용되기 위해 제조된다. 본 발명의 백신 생성물은 유전적으로 변형된 에스케리치아 콜라이 숙주에서 제조된다. 스타필로코커스 아우레우스는 그람-양성 세균이고 폴리사카라이드 캡슐을 갖는다. 이 유기체에 대한 백신 생성물은 이 캡슐형 폴리사카라이드와 유사한 구조를 갖는 당 부분을 갖는 글리코실화된 단백질을 주성분으로 할 수 있다.
또 다른 양태에서, 본 발명은 고전적인 화학적 접합 방법에 비해 이점을 제공하는, 면역원성 접합체 백신을 제조하는 신규 생체공학적 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 세균 세포, 예를 들면, 그람-음성 세포, 예컨대, 에스케리치아 콜라이에서의 당단백질의 생체내 제조를 포함한다.
당업자에게 공지되어 있는 바와 같이, 당접합체의 제조 및 정제는 사용되는 백신 후보물질 및 플라스미드의 조합에 따라 달라질 수 있다. 예를 들면, 단백질 담체, 당접합체의 당 성분, 및 예를 들면, 동물 또는 인간에서의 정제된 백신 후보물질의 의도된 용도에 근거하여 어떤 정제 절차를 선택할지는 공지되어 있다. 예를 들면, 인간에서 사용되기 위해, 정제를 용이하게 할 His 태그가 제거되어야 한다는 것은 공지되어 있다.
본원에서 언급된 모든 공개문헌들은 전체적으로 참고로 도입된다. 본원에서 사용된 용어 "또는"이 적절한 경우 조합될 수 있는 대안을 표시한다는 것, 즉 용어 "또는"이 각각의 나열된 대안을 개별적으로 및 그들의 조합물 형태로 포함한다는 것을 이해해야 한다. 본원에서 사용된 바와 같이, 문맥이 달리 명시하지 않는 한, 단수형의 언급은 복수형을 포함하고, 복수형의 언급은 단수형을 포함한다.
본 발명은 본 발명의 조성물 및 방법뿐만 아니라 그의 유용성도 추가로 기술하는 하기 실시예를 참조함으로써 더 정의된다. 본 발명의 범위 내에 있는 조성물 및 방법 둘다에 대한 변형이 실시될 수 있다는 것이 당업자에게 자명할 것이다.
실시예
실시예
1:
에스케리치아
콜라이
세포에서
CP5
및
CP8
폴리사카라이드의
합성
본 발명의 실시양태의 목적은 에스케리치아 콜라이에서 CP5 및 CP8 항원성 폴리사카라이드를 생성하는 것이다. 상기 논의된 바와 같이, 종래 기술에 비추어 볼 때 놀랍게도, 본 발명자들은 CP 생성 경로와 O-항원 생성 경로가 기능적으로 중첩된다는 사실(RU의 구조에서 나타나는 사실)(도 1 내지 4 참조)을 새로운 방식으로 활용하였다. CP5의 캡슐형 글리칸 및 CP8의 캡슐형 글리칸은 2-아세트아미도-2-데옥시-D-만뉴론산(D-ManNAcA), 및 D-입체구조 또는 L-입체구조를 갖는 2개의 2-아세트아미도-2,6-다이데옥시 갈락토스 잔기(D-FucNAc 및 L-FucNAc)로 구성된 유사한 트라이사카라이드 RU로 구성된 중합체이다. ManNAcA 잔기는 2종의 혈청형에서 상이하게 연결되어 있고, 중합된 글리칸의 RU들 사이의 연결도 상이하다. 또한, 2개의 항원에서 상이한 위치에서 면역우성 O-아세틸 변형이 존재한다(문헌[Jones, C. 2005. Revised structures for the capsular polysaccharides from Staphylococcus aureus types 5 and 8, components of novel glycoconjugate vaccines. Carbohydr Res 340: 1097-106]). 슈도모나스 애루기노사 LPS의 O11 항원이 [-3)-α-L-FucNAc-(1,3)-β-D-FucNAc-(1,2)-β-D-Glc-(1-]를 함유하기 때문에, 슈도모나스 애루기노사 LPS의 O11 항원은 그의 구조 면에서 CP5 및 CP8과 유사하다(도 4)(문헌[Knirel, Y. A., V. V. Dashunin, A. S. Shashkov, N. K. Kochetkov, B. A. Dmitriev and I.L. Hofman. 1988. Somatic antigens of Shigella: structure of the O-specific polysaccharide chain of the Shigella dysenteriae type 7 lipopolysaccharide. Carbohydr Res 179: 51-60]). 트라이사카라이드 RU는 스타필로코커스 아우레우스의 D-ManNAcA가 글루코스 단위로 치환되고, 슈도모나스 O11 LPS에서 O-아세틸 변형이 존재하지 않고, RU에서 제2 모노사카라이드와 제3 모노사카라이드 사이의 연결 종류에서의 차이가 존재하는 점에서만 상이하다(도 4).
UndPP 상에서 CP5 및 CP8 글리칸을 합성할 수 있는 유전적 시스템을 발생시키기 위해, 본 발명자들은 딘(Dean) 등의 방법(문헌[Dean, C. R., C. V. Franklund, J. D. Retief, M. J. Coyne, Jr., K. Hatano, D. J. Evans, G. B. Pier, and J. B. Goldberg. 1999. Characterization of the serogroup O1l O-antigen locus of Pseudomonas aeruginosa PA103. J Bacteriol 181:4275-4284])을 이용하여 균주 PA103으로부터의 슈도모나스 애루기노사 O11 O-항원 유전자 클러스터를 변형시켰다. UndPP-D-FucNAc-L-FuncNAc로 구성된 줄기 구조체의 합성을 위한 생합성 기구를 코딩하는 유전자를 스타필로코커스 아우레우스 글리칸의 완성을 위해 필요한 스타필로코커스 아우레우스 효소로 보완하였다(도 1 내지 4)(이것도 본 과정의 신규 용도임). 따라서, 딘 등의 방법을 이용하여 UndPP-FucNAc-FucNAc 생합성에 필요한 슈도모나스 애루기노사 PA103으로부터의 모든 유전적 요소들을 발현시켰다. 제3 당을 부가하는 글리코실트랜스퍼라제를 코딩하는 유전자를 결실시키고 스타필로코커스 아우레우스 Mu50(CP5) 및 MW2(CP8)로부터의 cap5 또는 cap8 클러스터로부터의 상응하는 유전자(약간의 변형을 가짐)로 치환시켰다.
스타필로코커스 아우레우스 캡슐형 폴리사카라이드에 대한 특이적 잔기를 합성하는 효소를 코딩하는 유전자를 사우(Sau) 등(문헌[Sau, S., N. Bhasin, E. R. Wann, J. C. Lee, T. J. Foster, and C. Y. Lee. 1997. The S. aureus allelic genetic loci for serotype 5 and 8 capsule expression contain the type-specific genes flanked by common genes. Microbiology 143: 2395-405.; O'Riordan, K. and J. C. Lee. 2004. Staphylococcus aureus capsular polysaccharides. Clin Microbiol Rev 17(1): 218-34])에 의해 예측된 유전자의 기능에 따라 단계적으로 O11 배경(background) 내로 도입하였다. 이러한 단계들은 이하에 설명되어 있다.
cap5I/cap8H 유전자 생성물은 ManNAcA를 RU의 UndPP-D-FucNAc-L-FuncNAc에 부가하여 각각의 혈청형에 대해 특이적인 연결을 형성하는 글리코실트랜스퍼라제인 것으로 예측되었다(문헌[Sau, S., N. Bhasin, E. R. Wann, J. C. Lee, T. J. Foster, and C. Y. Lee. 1997. The Staphylococcus aureus allelic genetic loci for serotype 5 and 8 capsule expression contain the type-specific genes flanked by common genes. Microbiology 143: 2395-405]). 이를 입증하기 위해, 슈도모나스 애루기노사 O11 O-항원의 생성을 제공하는 플라스미드의 존재 하에서 에스케리치아 콜라이에서 Cap5I 및 Cap8H의 활성을 분석하였다. O11 클러스터를 발현하는 세포는 먼저 UndPP 상에서 O11 O-항원을 합성하고, 상기 항원이 O11 특이적 리포폴리사카라이드(LPS)를 형성하는 에스케리치아 콜라이 효소 Waal(O-항원 리가제(ligase))에 의해 UndPP로부터 지질 A 코어로 전달된다(문헌[Goldberg, J. B., K. Hatano, G. S. Meluleni and G. B. Pier. 1992. Cloning and surface expression of Pseudomonas aeruginosa O antigen in Escherichia coli. Proc Natl Acad Sci USA 89(22): 10716-20]). 이 리포폴리사카라이드를 합성하기 위해, 슈도모나스 애루기노사 PA103으로부터의 O11 O-항원 클러스터를 pLAFR1(서열번호 1) 내로 클로닝하였다. 그 다음, 제3 당을 O11 RU에 부가하는 효소인 글리코실트랜스퍼라제를 코딩하는 wbjA 유전자를 트랜포존(transposon) 돌연변이유발로 결실시켰다. 돌연변이된 클러스터(O11 wbjA ::Tn50<dhfr -1>)를 상동 재조합으로 더 변형시켜 wzy 유전자의 폴리머라제 활성을 제거함으로써, O11 유전자 클러스터의 글리코실트랜스퍼라제 wbjA 및 wzy 폴리머라제에 대한 유전자들이 불활성화되어 있는 O11 wbjA::Tn50<dhfr-1>wzy::cat(돌연변이된 서열번호 1을 나타냄)을 형성하였다. 이 변형된 클러스터를, 타시(Tasi) 등의 문헌(문헌[Tsai, C. M., and C. E. Frasch. 1982. A sensitive silver stain for detecting lipopolysaccharides in polyacrylamide gels. Anal Biochem 119: 115-9])에 개시된 방법에 따라 W3110 ΔwecA 세포에서 발현시켰고, 추출물을 프로테이나제(proteinase) K로 처리하였고 SDS-PAGE 및 은 염색으로 분석하였다. 본원에 기재된 바와 같은 pLAFR1로부터의 돌연변이된 O11 클러스터를 발현시키는 W3110 Δ wecA 추출물의 은 염색을 보여주는 결과는 도 5a에 제공되어 있다. 제2 열은 유도성 플라스미드 pEXT22로부터 발현된 유전자를 표시한다. 별표는 합성된 코돈 최적화된 유전자를 표시한다. 상이한 관련 당형태들이 화살표로 표시되어 있다.
분석은 겔에서 2개의 주요 밴드를 보여주었다(도 5a, 레인 1). 신호는 비변형된 지질 A 코어(도 5a, 하부 밴드), 및 절두된(truncated) O11 RU에서 예측된 바와 같이 지질 A 코어 및 2개의 FucNAc 잔기로 구성된 LPS에 상응한다. 별도의 IPTG 유도성 플라스미드로부터의 wbjA 야생형 카피의 발현 시, 상부 밴드는 보다 느린 전기영동 이동으로 변동되었는데, 이것은 글루코스 잔기가 절두된 O11 LPS에 부가되었음을 암시한다(도 5a, 레인 2). 예측된 스타필로코커스 아우레우스 글리코실트랜스퍼라제 Cap5I(레인 4) 및 Cap8H(도 5a, 레인 3)가 WbjA 대신에 트랜스로(in trans) 발현되었을 경우, 글리코실화된 지질 A 코어 신호의 유사한 변동이 관찰되었는데, 이것은 가능하게는 글루코스보다 훨씬 더 큰 모노사카라이드, 아마도 ManNAcA의 부가를 암시한다. 이 데이터는 스타필로코커스 아우레우스 글리코실트랜스퍼라제가 슈도모나스 애루기노사 효소의 활성에 의해 합성되는 UndPP-D-FucNAc-L-FuncNAc 당지질을 연장시킬 수 있다는 것을 입증한다.
생합성 기구가 슈도모나스 애루기노사의 O11 O-항원 클러스터에 존재하는 것이 아니라 스타필로코커스 아우레우스 CP5/8 클러스터에 존재하기 때문에, 에스케리치아 콜라이에서의 스타필로코커스 아우레우스 RU 조립을 위한 전제조건이 UDP-ManNAcA의 제공이라는 것도 이 방식으로 확인하였다. 모든 다른 필요한 뉴클레오타이드-활성화된 당들이 에스케리치아 콜라이의 하우스 킵핑 기능 및 슈도모나스 애루기노사의 O11 O-항원 클러스터에 의해 제공된다. 에스케리치아 콜라이는 wecB 및 wecC의 발현을 통해 ManNAcA 글리코실트랜스퍼라제에 대한 기질인 UDP-ManNAcA를 생성하는 것으로 공지되어 있다. 상기 유전자들은 장내세균 공통 항원(ECA) 생합성을 담당하는 클러스터에서 항시적으로 발현된다(문헌[Meier-Dieter, U., R. Starman, K. Barr, H. Mayer, and P. D. Rick. 1990. Biosynthesis of enterobacterial common antigen in Escherichia coli. J Biol Chem 265:13490-13497]). 스타필로코커스 아우레우스의 CP 클러스터에서 발견된 UDP-ManMAcA 생합성을 위한 기능성 상동체(homolog)는 종래 보고된 바와 같이 wecBC의 활성을 보완하는 것으로 밝혀졌다(문헌[Kiser, K. B., N. Bhasin, L. Deng and J. C. Lee. 1999. Staphylococcus aureus cap5P encodes a UDP-N-acetylglucosamine 2-epimerase with functional redundancy. J. Bacteriol 181(16): 4818-24]). 이것은 에스케리치아 콜라이에서의 CP 항원의 생성이 숙주 균주의 wecBC 유전자의 기능성 발현에 의존한다는 것을 보여준다. 따라서, 재조합 시스템에서 Cap5I 및 Cap8H에 대한 기질로서 UDP-ManNAcA를 제공하기 위해, WecB 및 WecC가 발현되어야 한다는 것이 확인되었다. 이러한 시스템에서, 장내세균 공통 항원을 발현하는 임의의 원핵 균주, 예컨대, 에스케리치아 콜라이 야생형 균주, 예를 들면, wecA 결실을 갖거나 갖지 않고 추가 wzzE 결실을 갖거나 갖지 않는 W3110계 종류의 세포를 사용할 수 있다.
스타필로코커스 아우레우스 캡슐형 폴리사카라이드의 추가 연장은 글리칸의 최대 면역학적 활성을 위해 필요한 것으로 생각된다. cap5J/cap8I 유전자는 반복 단위를 중합하는 wzy 상동체를 코딩하고, cap5K/cap8K는 UndPP-결합된 트라이사카라이드를 막의 세포질 쪽으로부터 원형질막주위공간 쪽으로 전위시키는 플립파제를 코딩한다. cap5H/cap8I는 RU의 위치 3'에서 L-FucNAc 또는 위치 4'에서 ManNAcA를 변형시키는 O-아세틸트랜스퍼라제를 코딩한다(문헌[Bhasin, N., A. Albus, et al. (1998). "Identification of a gene essential for O-acetylation of the Staphylococcus aureus type 5 capsular polysaccharide." Mol Microbiol 27(1): 9-21]). 아세틸화는 상기 폴리사카라이드의 면역학적 반응성을 차별화하는 중요한 결정인자이다(문헌[Fattom, A. I., J. Sarwar, L. Basham, S. Ennifar, and R. Naso. 1998. Antigenic determinants of S. aureus type 5 and type 8 capsular polysaccharide vaccines. Infect Immun 66:4588-92]). RU가 연장될 수 있고 아세틸화될 수 있다는 것을 보여주기 위해, 중합 및 O-아세틸화를 담당하는 스타필로코커스 아우레우스 효소들을 돌연변이된 O11 클러스터의 존재 하에서 별도의 플라스미드로부터 발현시켰다. O11 wbjA ::Tn50<dhfr -1>wzy::cat 클러스터, 및 CP5 클러스터의 상이한 유전자들을 발현하는 W3110 Δ wecA 세포로부터의 추출물을 프로테이나제 K로 처리하였고 SDS-PAGE, 전기전달(electrotransfer) 및 이어서 항-CP5 당(제이 씨 리(J. C. Lee)(하버드 의과대학 브림감 부인과병원 의학부; 미국 매사추세츠주 보스톤 소재)로부터 입수됨)을 사용한 면역블롯팅으로 분석하였다. 도 5b는 SDS-PAGE 및 전기전달에 의해 분리된 프로테이나제 K 처리된 에스케리치아 콜라이 추출물을 항-CP5 항혈청을 사용하여 면역검출한 결과를 보여준다. 분석된 모든 추출물들이 본원에 기재된 바와 같은 pLAFR 플라스미드로부터 발현되는 wbjA 및 부분적으로 (별표로 표시된) wzy 유전자의 결실을 갖는 슈도모나스 애루기노사 O11 클러스터를 함유하였고 이들 세포들에서 CP5 중합 및 O-아세틸화를 가능하게 하는 (표시된 바와 같은) 상이한 Cap5 단백질들을 발현하는 2개 플라스미드(pEXT22, pACT3)를 더 함유하였다. 실험 세부사항, 예컨대, 유도제 농도 및 발현 배양 항온처리 온도가 표시되어 있다.
도 5b에서, 결과는 고분자량의 O-항원 중합체에 대해 전형적인 신호와 같은 래더를 보여준다. 상이한 밴드들은 프로테이나제 K 분해에 대한 안정성을 나타내는 LPS 또는 UndPP 상의 선형으로 중합된 상이한 수의 RU를 나타낸다. O-아세틸트랜스퍼라제의 존재 또는 부재 하에서 래더 유사 구조의 상이한 강도가 관찰되었다. 강한 신호는 cap5H의 존재에서 검출된 반면(도 5b, 레인 1 내지 4), cap5H를 갖지 않는 레인에서는 사실상 존재하지 않았다(도 5b, 레인 5 및 6). 이것은 O-아세틸화가 특이적 항혈청에 의한 인식을 증가시킨다는 것, 또는 O-아세틸화가 플립핑 또는 중합 자체를 더 효율적으로 가속화시키거나 더 많은 RU 생성을 유도함으로써 중합 활성을 증강시킨다는 것을 의미한다. cap5H가 별도의 플라스미드로부터 단독으로 발현된 경우 신호 강도가 더 강하지만(도 5b의 레인 1을 레인 3과 비교하고, 도 5b의 레인 2를 레인 4와 비교함), cap5H 유전자는 상이한 골격 플라스미드로부터 발현된 경우 기능성을 나타낸다(도 5b, 레인 1, 2, 3 및 4). 스타필로코커스 아우레우스 유전자의 유도를 위해 보다 적은 IPTG가 사용될수록 신호가 보다 강해졌다는 것(도 5b의 레인 1을 레인 2와 비교하고, 도 5b의 레인 3을 레인 4와 비교함)은 놀랍고도 주목할만하다.
실시예 2: 에스케리치아 콜라이 세포에서 지질 상에서의 CP5 및 CP8 중합체의 합성
cap5 특이적 유전자의 높은 발현이 중합체 형성을 낮추기 때문에, 이 문제점을 해결하기 위해 재조합 글리칸에 대한 대안적 발현 시스템을 구축하였다. 구체적으로, 종래 기술에 비추어 볼 때 예측되지 않는 신규 방법에서, O11의 슈도모나스 애루기노사 글리코실트랜스퍼라제(wbjA) 및 폴리머라제(wzy)를, 스타필로코커스 아우레우스 Mu50/MW2의 캡슐형 유전자 클러스터로부터의 CP5/8 특이적 요소(cap5/8 HIJK 및 이의 일부)를 코딩하는 유전자로 치환시켜 슈도모나스 애루기노사 O11 및 스타필로코커스 아우레우스 CP5 또는 CP8 유전자로 구성된 단일 키메라 유전자 클러스터를 생성하였다(도 6). 상기 구축물은 스타필로코커스 아우레우스의 특이적 유전자들을 함유하였다. 다트센코(Datsenko) 등의 방법(문헌[Datsenko, K. A., and B. L. Wanner. 2000. One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc Natl Acad Sci USA 97:6640-5])에 따라, 발현 검출을 위해 각각의 구축물에 태그를 부착시켰고, 각각의 구축물은 도입된 리보좀 결합 부위에 이어서 재조합된 클론의 선택을 위한 클로람페니콜 내성 카세트(cat)를 함유함으로써 서열번호 2, 서열번호 3 및 서열번호 4를 발생시켰다.
도 6은 본 발명의 키메라 O11/CP5 및 O11/CP8 유전자 클러스터를 구축하는 본 발명의 방법의 한 실시양태를 보여준다. 스타필로코커스 아우레우스 CP5 및 CP8 CP 클러스터(상부), 및 슈도모나스 애루기노사 PA103 rfb 클러스터(O11, 중간)는 공개된 바와 같이 표시되어 있다(문헌[Dean, C. R., C. V. Franklund, J. D. Retief, M. J. Coyne, Jr., K. Hatano, D. J. Evans, G. B. Pier, and J. B. Goldberg. 1999. Characterization of the serogroup O11 O-antigen locus of Pseudomonas aeruginosa PA103. J Bacteriol 181:4275-84; Sau, S., N. Bhasin, E. R. Wann, J. C. Lee, T. J. Foster and C. Y Lee. 1997. The S. aureus allelic genetic loci for serotype 5 and 8 capsule expression contain the type-specific genes flanked by common genes. Microbiology 143 (Pt 7): 2395-405]). 상기 유전자들의 상동 기능은 이하에 기재되어 있다. 완전한 정방향 대각선은 상기 2종의 유기체에서 UndPP 상에서의 D-FucNAc-L-FucNAc 다이사카라이드의 합성을 담당하는 유전자를 표시하고; 점선은 제3 모노사카라이드를 RU에 부가하는 글리코실트랜스퍼라제를 표시한다. wzx 유사 플립파제 유전자는 부러진 정방향 대각선으로 표시되어 있고, wzy 유사 RU 폴리머라제 유전자는 부러진 역방향 대각선으로 표시되어 있다. CP5 클러스터는 Wzz 길이 조절제(빈 화살표)를 함유하지 않지만, 스타필로코커스 아우레우스에서 작용하는 길이 조절제를 포함하는, 캡슐형 폴리사카라이드에 대한 이출 기구를 구성하는 3개 유전자의 세트(빈 화살표)를 함유한다. 완전한 정방향 대각선으로 표시된 O-아세틸트랜스퍼라제 유전자는 CP 클러스터에만 존재한다. 스타필로코커스 아우레우스에서 UDP-ManNAcA 생합성에 필요한 유전자들은 흑색으로 표시되어 있다. 이들은 슈도모나스 애루기노사 O-항원의 생성을 위해서는 필요하지 않다. O11, CP5 및 CP8 폴리사카라이드의 구조적 차이의 원인이 되는 유전자들은 각각의 유전자 클러스터의 시작부(O11: wbjA 및 wzy) 또는 중간부(CP5/8: cap5/8 HIJK)에서 함께 밀집되어 있다. CP8 클러스터는 구조적 특이성을 부여하는 중간부(cap5/8 HIJK)를 제외하고 길이 및 DNA 서열을 고려할 때 CP5 클러스터와 거의 동일하다. 상기 키메라 클러스터는 상동 재조합 및 고전적인 클로닝을 이용하여 플라스미드 유래의 O11 클러스터의 wbjA 및 wzy 유전자를 CP5(또는 CP8) 클러스터의 특이성 부분(cap5/8 HIJK) 및 빈 화살표로 표지된 cat로 표시된 클로람페니콜 아세틸트랜스퍼라제 카세트(cat, 선택을 위한 것임)로 치환시켜 서열번호 2, 서열번호 3 및 서열번호 4를 발생시킴으로써 구축되었다. 부러진 화살표에서 별표는 상동 재조합에 사용된 불완전한 유전자 서열을 표시한다. 서열번호 3 및 서열번호 4의 DNA를 나타내는 생성된 2개의 키메라 클러스터는 하부 패널에 제시되어 있다.
본 발명의 키메라 CP5 및 CP8이 놀랍게도 UndPP 상에서 정확한 RU를 조립한다는 것을 입증하고 반복 단위가 중합된다는 것을 확인하기 위해, 전체 키메라 클러스터를 함유하는 에스케리치아 콜라이 세포(W3310 Δ wecA)의 프로테이나제 K 분해물을 SDS-PAGE로 분리하였다. 구체적으로, pLAFR 플라스미드 상에서 키메라 CP5 유전자 클러스터(도 7a) 또는 키메라 CP8 유전자 클러스터(도 7b)를 함유하거나 결여하는 플라스미드를 갖는 세포를 프로테이나제 K로 처리하였고 SDS-PAGE로 분리하였고, 은 염색(도 7a 및 7b의 좌측 패널), 또는 니트로셀룰로스 막으로의 전기전달 후 항-CP5 또는 항-CP8 항혈청을 사용한 면역검출(도 7a 및 7b의 우측 패널)을 이용하여 지질을 가시화하였다. 플립파제 유전자 cap5K를 결여하는 구축물(서열번호 2) 및 플립파제 유전자 cap5K를 함유하는 구축물(서열번호 3)을 시험하였다. 전자는 CP5 LPS 생성에 있어서 보다 낮은 활성을 나타내는 것으로 밝혀졌다.
전기전달, 및 항-CP5 특이적 혈청을 사용한 면역검출 후, 전체 키메라 CP5 클러스터를 발현하는 추출물은 그의 동종 혈청으로 프로빙된 에스케리치아 콜라이로부터의 내재성 O-항원 구조체와 유사한 신호와 같은 래더를 보인다(도 7a, 우측 마지막 2개의 레인). 이것은 CP5 반복 단위가 중합된다는 것, 바람직한 중합체 길이가 있다는 것, 및 CP5 항원이 이들 세포들에서 지질 A 코어로 전달된다는 것을 강하게 암시한다. 동일한 추출물을 SDS-PAGE 후 은 염색으로 가시화하였는데(도면의 좌측 면에 있는 도 7a), 키메라 CP5(cap5K를 갖지 않음) 및 키메라 CP5로 표지된 우측 상의 2개의 레인은 CP5 O-항원 유사 구조체로 장식된 에스케리치아 콜라이의 지질 A 코어로 구성된 LPS가 실제로 형성된다는 것을 보여준다. cap5K 플립파제 유전자를 갖거나 갖지 않는 CP5 키메라 클러스터를 발현하는 세포로부터 유래된 추출물들로부터 강도 차이가 수득되었다. 2개의 추출물의 비교는 Cap5K 발현이 중합체 생성을 상당히 증가시킨다는 것을 보여준다(도 7a의 양쪽 페널에서 중간 레인과 우측 레인을 비교함).
도 7b에 나타낸 바와 같이, CP8 키메라 클러스터를 사용한 경우 동일한 결과가 관찰되었다. pLAFR 플라스미드 상에서 키메라 CP8 유전자 클러스터를 함유하거나 결여하는 플라스미드를 함유하는 세포를 프로테이나제 K로 처리하였고 SDS-PAGE로 분리하였고, 은 염색(좌측 패널), 또는 니트로셀룰로스 막으로의 전기전달 후 항-CP8 항혈청을 사용한 면역검출(우측 패널)을 이용하여 지질을 검출하였다. 플립파제 유전자 cap8K를 함유하는 CP8 키메라 구축물은 서열번호 4에 상응한다.
본 발명의 놀라운 추가 신규 확장은 에스케리치아 콜라이에서 상기 키메라 클러스터의 유지 및 발현을 위해 사용되는 플라스미드 골격을 변화시킴으로써 발생되었다. 키메라 CP5 클러스터를 함유하는 pLAFR1 내의 내성 카세트는 Tet에서 Kan으로 교체하였다. 추가로, cap5K를 함유하는 전체 CP5 키메라 클러스터를 리(Lee) 등의 방법(문헌[Lee, D. J., L. E. Bingle, K. Heurlier, M. J. Pallen, C. W. Penn, S. J. Busby and J. L. Hobman. 2009. Gene doctoring: a method for recombineering in laboratory and pathogenic Escherichia coli strains. BMC Microbiol 9: 252])에 따라 플라스미드 pDOC-C 및 pACYC177(유전자은행 수납번호 #X06402) 내로 서브클로닝하였다.
도 8a 및 8b에 나타낸 바와 같이, SDS-PAGE, 전기전달, 및 항-CP5 특이적 항혈청을 사용한 면역검출로 분석하였을 때 이들 플라스미들 모두가 CP5 중합체 생성을 제공하였다. 도 8a에서, 상이한 키메라 클러스터들을 함유하는 세포들로부터의 총 세포 추출물을 프로테이나제 K로 처리하였고 SDS-PAGE 및 은 염색으로 분석하였다. 플라스미드들은 다음과 같이 표시된 상이한 스타필로코커스 아우레우스 특이적 유전자들, 및 항생제 선택을 위해 사용되는 상이한 내성 유전자들을 함유한다: 테트라사이클린(Tet) 및 HIJ, 서열번호 2; Tet HIJK, 서열번호 3; Tet 및 유전자 부재; 빈 플라스미드 대조군(숫자는 분자량 마커에 상응함). 가나마이신(Kan)으로 표지된 레인은 테트라사이클린 내성 카세트가 가나마이신 내성 유전자로 치환되어 있는 서열번호 3의 변이체를 함유한다.
도 8b에서, 숙주 균주는 도 8a에서와 마찬가지로 에스케리치아 콜라이 W3110 Δ wecA이었다. 도 8b에서 좌측 레인은 도 8a에서와 마찬가지로 분자량 마커에 상응한다. 도 8b에서, 상이한 키메라 클러스터들을 함유하는 세포로부터의 총 세포 추출물을 프로테이나제 K로 처리하였고 SDS-PAGE 및 은 염색으로 분석하였고(좌측 패널) 전기전달 후 항-CP5 면역블롯팅으로 분석하였다(우측 패널). 사용된 플라스미드들은 테트라사이클린 대신에 가나마이신 카세트를 함유하는 변형된 pLAFR1 플라스미드 골격(도 8a 참조)에 존재하거나 클로람페니콜 내성 카세트를 함유하는 pACYC에 존재하는 서열번호 3으로 표시된 키메라 CP5 클러스터를 함유한다.
추가로, 키메라 O11-CP5 LPS를 발현시키기 위해 상이한 프로모터들을 시험하였다. 이들 시험에서, 숙주 균주는 키메라 CP5 클러스터를 보유하는 에스케리치아 콜라이 W3110 Δ wecA이었다. 이 균주에서, 상기 키메라 클러스터는 wecAwzzE 유전자를 치환시켰다. pLAFR1로부터 발현된 상이한 키메라 클러스터들을 함유하는 세포로부터의 총 세포 추출물을 프로테이나제 K로 처리하였고 SDS-PAGE 및 전기전달 후 항-CP5 면역블롯팅으로 분석하였다. 플라스미드는 wbjA 및 wzy가 도 9의 레인 아래에 표시된 바와 같은 상이한 스타필로코커스 아우레우스 특이성 유전자들(cat 카세트를 가짐)로 치환되어 있는 O11 클러스터를 함유하였다. 추가로, cap5 특이성 유전자의 앞에 위치한 DNA를 변화시켰고 지질 글리코실화에 대한 효과를 분석하였다. 이들 상이한 프로모터 영역들의 효과는 도 9에 도시된 바와 같이 분석하였다. wzz/wzx는 초기 상동 재조합 후 cap 유전자 앞에 위치한 원래의 유전자(도 6 참조)를 표시한다(처음 2개의 레인에 상응하는 도 9). 이들 2개의 유전자를 제거하였고(중간 3개의 레인에 상응하는 도 9) 강한 프로모터 서열을 코딩하는 에스케리치아 콜라이 O121 O-항원 클러스터 앞에 있는 0.6 kb 영역(PO121)으로 치환시켰다(마지막 3개의 레인에 상응하는 도 9). 도 9에서 wzz/wzx 및 HIJ로 표시된 레인들은 서열번호 2를 발현하는 세포로부터 유래되었고, wzz/wzx 및 HIJK로 표시된 레인들은 서열번호 3으로부터 유래되었다. 도 9에서 분자량 마커는 겔 프레임의 좌측에 표시되어 있다.
도 9에 나타낸 바와 같이, 결과는 관련 프로모터 활성이 wzx 유전자에 존재하고(도 9의 처음 2개 레인 - wzz/wzx) LPS 생성 기능을 상실하지 않으면서 상기 프로모터가 에스케리치아 콜라이로부터의 항시적 프로모터, 예를 들면, 혈청형 O121 wb 프로모터(PO121, 도 9의 마지막 3개 레인)로 기능적으로 치환될 수 있다는 것을 보여주었다. 종합하건대, 이들 결과들은 본원에 기재된 바와 같은 O11 O-항원 및 CP5 캡슐형 중합체 생성을 위한 O11 및 스타필로코커스 아우레우스 요소들이 많은 상이한 에스케리치아 콜라이 발현 시스템들에서 조합되어 재조합 스타필로코커스 아우레우스 폴리사카라이드를 생성할 수 있다는 것을 의미한다.
이들 결과들은 그람-양성 유기체로부터 유래된 캡슐형 폴리사카라이드 구조체를 에스케리치아 콜라이에서 생성할 수 있다는 것을 처음으로 보여주었다. 이것은 종래 기술 및 통상적인 예측과 대조적으로 O11 클러스터의 효소들을 스타필로코커스 아우레우스 cap 클러스터의 효소들과 조합하여 키메라 폴리사카라이드를 구축할 수 있었다는 것, 즉 상기 효소들이 생체내에서 동일한 구조체에 함께 작용한다는 것을 의미한다.
실시예
3: 재조합
글리칸의
분자 구조 확인
에스케리치아 콜라이에서 키메라 CP5/O11 클러스터의 활성을 분자 수준에서 확인하기 위해, 환원 말단에서 2-아미노벤즈아미드(2-AB)를 사용한 당의 형광 표지를 이용함으로써 UndPP-연결된 당의 분석을 가능하게 하는 신규 방법을 개발하였다. 분석 해상도를 증강시키기 위해, 비중합된 RU의 양을 증가시키는 결실을 함유하는 키메라 클러스터를 사용하였다. pLAFR1 플라스미드에 함유된 키메라 클러스터를 발현하고 cap5K 플립파제를 결여하는(서열번호 2) 상이한 에스케리치아 콜라이 세포들로부터의 당지질을 이하에 기재된 바와 같이 분석하였다.
UndPP-연결된 글리칸을 추출하기 위해, 에스케리치아 콜라이 세포를 0.9% NaCl로 세척하고 동결건조하였다. 건조된 세포를 30 ㎖의 유기 용매(85% 내지 95% 메탄올 = M)로 1회 추출하였다. 동결건조된 세포 펠렛을 5 ㎖ 클로로포름:메탄올:물(C:M:W = 10:10:3; 부피/부피/부피)로 2회 더 추출하였다. (M) 추출물을 클로로포름 및 물을 사용하여 3:48:47(C:M:W)의 최종비로 전환시켰다. 물을 첨가하여 최종 비가 10:10:9(C:M:W)가 되게 함으로써 10:10:3(C:M:W) 추출물을 2상 블라이/드와이어(Bligh/Dyer) 시스템(문헌[Bligh, E. G. and W. J. Dyer. 1959. A rapid method of total lipid extraction and purification. Can J Biochem Physiol 37(8): 911-7])으로 전환시켰다. 층을 원심분리하여 분리하였고, 상부 수층을 추가 가공을 위해 보관하였다.
추출된 당지질을 정제하기 위해, 수층을 tC18 Sep-PAK 카트리지로 처리하였다. 상기 카트리지를 10 ㎖ 메탄올로 컨디셔닝한 후 10 ㎖ 3:48:47(C:M:W)로 평형화시켰다. 샘플을 적재한 후, 상기 카트리지를 10 ㎖ 3:48:47(C:M:W)로 세척하였고 5 ㎖ 메탄올 및 5 ㎖ 10:10:3(C:M:W)으로 용출하였다. 조합된 용출물을 N2 하에서 건조하였다. 상기 건조된 샘플을 2 ㎖ n-프로판올:2 M 트라이플루오로아세트산(1:1)에 용해시키고 50℃에서 15분 동안 가열한 후 N2 하에서 증발시켜 건조함으로써 당지질 샘플을 가수분해하였다(문헌[Glover, K. J., E. Weerapana and B. Imperiali. 2005. In vitro assembly of the UndPP-linked heptasaccharide for prokaryotic N-linked glycosylation. Proc Natl Acad Sci USA 102(40): 14255-9]). 건조된 샘플을 2-AB로 표지하였고, 문헌(문헌[Bigge, J. C, T. P. Patel, J. A. Bruce, P. N. Goulding, S. M. Charles, R. B. Parekh. 1995. Nonselective and efficient fluorescent labeling of glycans using 2-amino benzamide and anthranilic acid. Anal Biochem 230(2): 229-38; Merry, A. H., D. C. Neville, L. Royle, B. Matthews, D. J. Harvey, R. A. Dwek and P. M. Rudd. 2002. Recovery of intact 2-aminobenzamide-labeled O-glycans released from glycoproteins by hydrazinolysis. Anal Biochem 304(1): 91-9])에 기재된 바와 같은 페이퍼 디스크 방법을 이용하여 글리칸 세정을 수행하였다. 로일(Royle) 등에 따른 글리코셉-N 순상 컬럼(GlycoSep-N normal phase column)을 이용하되 3 용매 시스템으로 변형된 HPLC를 이용하여 2-AB 표지된 글리칸을 분리하였다(문헌[Royle, L., T. S. Mattu, E. Hart, J. I. Langridge, A. H. Merry, N. Murphy, D. J. Harvey, R. A. Dwek, P. M. Rudd. 2002. An analytical and structural database provides a strategy for sequencing O-glycans from microgram quantities of glycoproteins. Anal Biochem 304(1): 70-90]). 용매 A는 80% 아세토니트릴 중의 10 mM 암모늄 포르메이트(pH 4.4)이었다. 용매 B는 40% 아세토니트릴 중의 30 mM 암모늄 포르메이트(pH 4.4)이었다. 용매 C는 0.5% 포름산이었다. 컬럼 온도는 30℃이었고, 2-AB 표지된 글리칸은 형광(여기 λex = 330 nm, 방출 λem = 420 nm)에 의해 검출되었다. 구배 조건은 0.4 ㎖/분의 유속으로 160분 동안 100% A 내지 100% B를 사용하는 선형 구배 후, 1 ㎖/분까지 유속을 증가시키면서 2분 동안 100% B 내지 100% C를 사용하는 선형 구배이었다. 상기 컬럼을 100% C로 5분 동안 세척하였고, 2분 동안 100% A로 회복시켰고 1 ㎖/분의 유속으로 100% A에서 15분 동안 런닝한 후, 유속을 5분 동안 0.4 ㎖/분으로 회복시켰다. 물 중의 샘플을 주입하였다.
건조된 분획을 5 ㎕의 10% 아세토니트릴(ACN) 및 0.1% 트라이플루오로아세트산(TFA)에 재현탁시켰고 표적 플레이트 상에서 매트릭스 용액(50% ACN 및 0.1% TFA 중의 40 mg/㎖ DHB)과 1:1로 혼합하였다. MS 및 MS/MS 데이터를 울트라플렉스(Ultraflex)-II MALDI-ToF/ToF 질량 분광계(브룩커 달토닉 게엠베하(Bruker Daltonik GmbH), 독일 브레멘 소재) 상에서 양성 이온 모드로 수동으로 획득하였다. MS/MS를 LIFT 방법을 이용하여 수득하였다. 표준 펩티드 혼합물(브룩커 달토닉 게엠베하)을 외부 보정에 사용하였다. 플렉스 분석 소프트웨어(브룩커 달토닉 게엠베하)를 이용하여 분광을 이출하였고 수동으로 분석하였다.
키메라 클러스터를 갖거나(굵은 선) 갖지 않는(얇은 점선) 플라스미드를 함유하는 에스케리치아 콜라이 W3110 Δ wecA(CP5)로부터의 메탄올 추출물을 tC18 카트리지 상에서 정제하였고 순상 HPLC로 분석하였다. 37', 40' 및 45' 용출에서 발견된, 도 10a에 나타낸 피크들에 상응하는 분획들을 MALDI-MS/MS로 분석하였다. 37분 및 40분에서 용출된 샘플은 각각 부착된 O-아세틸 기를 갖는 재조합 CP5 RU, 및 부착된 O-아세틸 기를 갖지 않는 재조합 CP5 RU로서 확인되었다. 45분에서 용출된 샘플은 1개의 데옥시-N-아세틸헥소스아민(도 1e에 나타낸 바와 같음)에 의해 연장된 비아세틸화된 스타필로코커스 아우레우스 RU 구조체로서 확인되었다. CP5 키메라 클러스터에서, cap5HIJ는 pLAFR 상의 O11 클러스터의 wbjA 및 wzy 유전자들을 치환시켰다. 상기 치환은 cap5HIJ 유전자 이외에 cat 카세트를 수반하였다(서열번호 2).
키메라 클러스터를 갖거나(굵은 선) 갖지 않는(얇은 점선) 플라스미드를 함유하는 에스케리치아 콜라이 W3110 Δ wecAwzzE로부터의 메탄올 추출물을 tC18 카트리지 상에서 정제하였고 순상 HPLC로 분석하였다. 도 10b는 키메라 클러스터(중합효소를 갖지 않는 서열번호 4)를 사용하여 제조한 CP8의 재조합 RU의 HPLC 분석 결과를 보여준다. 재조합 당을 발현하는 세포에 대해 특이적인 피크들을 용출의 23', 32', 38' 및 45'에서 확인하였고 수집하였고 MALDI-MS 및 MALDI-MS/MS로 분석하였다. C8 키메라 클러스터에서, cap8HJK는 O11 클러스터, 즉 폴리머라제를 갖지 않는 구축물의 wbjA 및 wzy 유전자들을 치환시켜 분석을 위한 단일 RU를 축적시켰다. 상기 치환은 cap 유전자 이외에 cat 카세트를 수반하였다.
도 11a는 37분에서 용출된 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태의 발현에 의해 발생된 특이적 피크의 MALDI-MS/MS 분석 결과를 보여준다. 주 질량 m/z=772([M+H]+)를 선택하여 MS/MS로 분석하였는데, 이것은 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 아세틸화된 CP5 RU 구조체와 일치하는 단편화 패턴을 보여준다. O-아세틸화된 종은 상기 RU의 중간 위치에서 42 플러스 모노사카라이드 FucNAc(dHexNAc(OAc))의 질량의 특이적 상실을 특징으로 한다. 단편 이온은 기능성 글리코믹스 협회인 CFG(www.functionalglycomics.org/static/consortium/Nomenclature.shtml)의 명명법에 따라 표시되어 있다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11a의 삽입도에 제시되어 있다.
도 11b는 에스케리치아 콜라이에서 본 발명의 키메라 CP5 클러스터의 한 실시양태를 발현시킴으로써 발생된 (40분에 용출된) 특이적 피크의 MALDI-MS/MS 분석 결과를 보여준다. m/z=730([M+H]+)의 주 질량을 선택하여 MS/MS로 분석하였는데, 이것은 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 비아세틸화된 CP5 RU 구조체와 일치하는 단편화 이온 시리즈를 보여준다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11b의 삽입도에 제시되어 있다.
도 11c는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (32분에 용출된) 특이적 피크의 MALDI-MS/MS 분석 결과를 보여준다. m/z=794([M+Na]+)의 주 질량을 선택하여 MS/MS로 분석하였는데, 이것은 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 아세틸화된 CP8 RU 구조체와 일치하는 단편화 이온 시리즈를 보여준다. O-아세틸화된 종은 42 플러스 상기 RU의 최외각 위치에 존재하는 모노사카라이드 ManNAcA(HexNAcA(OAc))의 질량의 특이적 상실을 특징으로 한다. 단편 이온은 CFG의 명명법에 따라 표시되어 있다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11c의 삽입도에 제시되어 있다.
도 11d는 에스케리치아 콜라이에서 본 발명의 키메라 CP8 클러스터의 한 실시양태를 발현시킴으로써 발생된 (38분에 용출된) 특이적 피크의 MALDI-MS/MS 분석 결과를 보여준다. m/z=730([M+H]+)의 질량을 선택하여 MS/MS로 분석하였는데, 이것은 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 비아세틸화된 CP8 RU 구조체와 일치하는 단편화 이온 시리즈를 보여준다. 추가 분석은 후기 용출 피크들(도 10a에서 40분 및 도 10b에서 38분에 나타남)이 CP5 RU 및 CP8 RU의 비-O-아세틸화된 트라이사카라이드를 함유한다는 것을 보여주었다. 단편 이온은 CFG의 명명법에 따라 표시되어 있다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11d의 삽입도에 제시되어 있다.
MS 결과는 질량 및 단편화 이온 시리즈가 중간 FucNAc 잔기의 O-아세틸화를 갖는 CP5 RU 올리고사카라이드(즉, 도 10a 및 도 11a에서 37'에 나타난 피크) 또는 중간 FucNAc 잔기의 O-아세틸화를 갖지 않는 CP5 RU 올리고사카라이드(즉, 도 10a 및 11b에서 피크 40')의 분자 구조와 일치한다는 것을 보여주었다. 도 10a에서 45분에 나타나는 신호는 이하에 더 분석되는 바와 같이 테트라사카라이드로서 확인되었다. 폴리머라제 유전자를 결여하는 키메라 CP8 클러스터를 사용하여 동일한 분석을 반복하였다. 이러한 추출물에서, 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 O-아세틸화된 RU 구조체와 일치하는 신호가 도 10b 및 11c에 나타낸 바와 같이 용출의 23' 및 32'에서 발견되었다. MALDI-MS/MS에 의해 확인된 바와 같이 동일한 글리칸 서열에 대한 2개의 상이한 용출 시간의 존재는 O-아세틸 이동이 샘플 제조 동안 일어난다는 것을 암시한다. 비아세틸화된 RU는 각각 도 11b 및 11d에 나타낸 바와 같이 40' 및 38'에서 CP5 추출물 및 CP8 추출물에 대해 확인되었다. CP5 RU 구조체 및 CP8 RU 구조체가 예를 들면, W3110, W3310 Δ wecA, W3110 Δw ecAwz zE 및 W3110 Δ wecAwzzE Δ waaL을 포함하는 상이한 에스케리치아 콜라이 균주들에 존재하였다.
실시예
4: 반복 단위 구조체의 개선 및 이의 분석
키메라 CP8 클러스터(서열번호 4)를 발현하지만 wzy 폴리머라제 유전자 cap8I를 결여하는 에스케리치아 콜라이 세포로부터 유래된, 45분에서 용출된 도 10b에 나타낸 HPLC 피크도 MALDI-MS/MS로 분석하였다. 전체 스캔 MS에서 가장 강한 이온은 m/z=939([M+H]+)이었고, 서열 분석을 MS/MS로 수행하였다. 이 MS/MS 분석의 결과는 도 11e에 나타나 있고, 본 명세서에 개시된 본 발명에 비추어 볼 때 예측된 바와 같이 비환원 말단에서 1개의 데옥시-N-아세틸헥소스아민에 의해 연장된 비아세틸화된 스타필로코커스 아우레우스 캡슐형 RU와 일치하는 단편화 이온 시리즈를 제공한다. 가상 구조에 상응하는 단편 이온은 CFG의 명명법에 따라 피크 위에 표시되어 있다. 2-AB는 2-아미노벤즈아미드를 표시한다. 단편 이온에 대한 범례는 도 11e의 삽입도에 제시되어 있다.
도 11e에 나타낸 결과는 에스케리치아 콜라이 글리코실트랜스퍼라제가 CP8 RU의 ManNAcA 잔기를 변형시킬 수 있었다는 것을 암시하였다. 이러한 변경된 RU는 아마도 cap8I에 의해 중합되지 않을 것이다. 에스케리치아 콜라이 숙주 W3110에서의 글리코실트랜스퍼라제 특이성의 분석은 ECA 클러스터로부터의 효소가 재조합 당, 특히 4-N-아세틸푸코스아민 트랜스퍼라제로 추정되는 wecF 유전자 생성물을 방해할 수 있다는 것을 암시하였다. WecF는 4-N-아세틸푸코스아민을 ECA에 포함된 ManNAcA 상으로 천연적으로 부가하고, 아마도 상기 효소는 CP8 및 CP5 RU도 연장시킬 수 있을 것이다.
이 문제점을 해결하기 위해, 또 다른 신규 방법을 개발하였다. 구체적으로, wecC 유전자의 하류에 위치하는 wecF를 포함하는 ECA 클러스터의 유전자들을 결실시켰다. 이것은 문헌[Datsenko, K. A. and B. L. Wanner (2000). "One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products." Proc Natl Acad Sci USA 97(12): 6640-6645]에 기재된 방법을 이용하여 달성하였다. 상이한 에스케리치아 콜라이 발현 숙주들에서 waaL 및 rmlB-wecG 유전자 영역이 결실되었고, 몇몇 균주에서 wecA-wzzECA도 결실되었다. 폴리머라제 돌연변이체 CP8 키메라 클러스터를 발현하는 이들 돌연변이된 세포로부터의 Sep-PAK 정제된 추출물(메탄올 및 10:10:3 추출물)을 전술된 바와 같이 순상 HPLC로 분석하였다.
도 11f는 ECA 클러스터 유전자 rmlB-wecG의 추가 결실을 갖는 세포(W3110 ΔwaaLΔrmlB-wecG ::cat)(굵은 선)와 비교된, 서열번호 4의 폴리머라제 돌연변이체를 발현하는 에스케리치아 콜라이 W3110 Δ waaL 세포(얇은 점선)로부터의 메탄올 추출물의 HPLC 분석 결과를 제공한다. 추출물을 tC18 카트리지 상에서 정제하였고 순상 HPLC로 분석하였다. 도 11f에 나타낸 바와 같이, 도 10b에서 45'에 나타나는 주 피크는 존재하지 않았고, 아세틸화된 CP8 RU 및 비아세틸화된 CP8 RU에 대한 특이적 피크가 발생하였는데(도 11f), 이것은 ECA 글리코실트랜스퍼라제 중 하나(아마도 wecF)가 비정상적인 연장 표현형의 원인이라는 것을 암시한다. CP5 키메라 클러스터를 상이한 균주들에서 시험하였을 때 유사한 결과가 수득되었다. 이것은 에스케리치아 콜라이 유래의 글리코실트랜스퍼라제 및 뉴클레오타이드-활성화된 당 생합성에 필요한 효소들을 결실시키는 것이 에스케리치아 콜라이에서 재조합적으로 생성된 폴리사카라이드의 질 및 양을 최적화하는 가능한 방법이라는 것을 암시한다. 표적 효소는 아마도 O-항원 클러스터, ECA 클러스터, 및 콜란산 또는 캡슐 클러스터 내에 코딩되어 있을 것이다.
UndPP에 연결된 재조합 폴리사카라이드의 질에 대한 추가 증거를, 전술된 바와 같이 염색체적으로 최적화된 발현 숙주로부터 Sep-PAK 정제되고 형광 표지된 당지질 추출물의 최적화된 순상 HPLC 분석으로부터 수득하였다. CP5 및 CP8 올리고사카라이드 및 폴리사카라이드에 연결된 하전된 지질의 정제를 위한 Sep-PAK 컬럼의 최적 성능을 위해, Sep-PAK 카트리지에 적재하기 전에 tert-부틸 암모늄 포스페이트(TBAP)를 상기 추출물에 첨가하였다. 트렌트(Trent) 등에 의해 보고된 바와 같이, 이 염의 양이온은 음 전하를 소수성 부틸 쇄로 차폐시킴으로써 하전된 화합물의 컬럼 결합을 개선시킨다(문헌[Trent, M. S., A. A. Ribeiro, et al. (2001). "Accumulation of a polyisoprene-linked amino sugar in polymyxin-resistant Salmonella typhimurium and Escherichia coli: structural characterization and transfer to lipid A in the periplasm." J Biol Chem 276(46): 43132-43144]). 이 최적화된 방법은 폴리머라제를 함유하는 CP5 또는 CP8 키메라 클러스터를 발현하는 세포로부터 메탄올 추출에 의해 수득된 CP5 및 CP8 샘플에 적용되었다.
도 11g는 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 전체 CP5 글리칸 레퍼토리를 보여주는 HPLC 분석 결과를 제공한다. 키메라 CP5 클러스터 SEQ3(직선) 또는 빈 플라스미드 대조군(점선)을 발현하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlB-wecG ::cat로부터의 메탄올 추출물을 Sep-PAK 카트리지 상에서 고체상 추출하였고 약산으로 처리하여 UndPP로부터 당을 가수분해하였다. 생성된 물질을 환원성 아민화를 통해 2-AB와 반응시켜 글리칸의 환원 말단을 표지하였고 순상 HPLC로 분석하였다. 점선이 아니라 직선으로 제시된 신호는 CP5 특이적 물질을 나타낸다. 대문자는 회수된 분획의 MALDI-MS/MS에 의해 확인되는 바와 같이 아세틸화된 CP5 RU 및/또는 비아세틸화된 CP5 RU의 중합체를 함유하는 피크를 표시한다. 도 11g의 범례는 MS/MS 분석으로부터 유추된 바와 같은 제안된 분자 구조를 표시한다. MS/MS에 의해 확인된 동일한 중합도를 갖는 구조를 보인 아세틸화된 RU 중합체 및 비아세틸화된 RU 중합체가 굵은 막대로 표시되는 바와 같이 크로마토그램에서 함께 군을 이루고 있다는 것을 주목해야 한다. 대문자는 하기 길이를 보여준다: A 및 B: 1개의 RU; C, D 및 E: 2개의 RU; F 및 G: 3개의 RU; 및 H: 4개의 RU. 도 11g에서 95'와 125' 사이의 넓은 피크는 아마도 컬럼에 의해 분리되지 않은 5개 이상의 중합된 RU를 나타낼 것이다.
도 11h는 아세틸화된 CP5 글리칸 및 RU 균질성을 보여주는 추가 HPLC 결과를 제공한다. 이 HPLC 분석을 준비하기 위해, (도 11g를 참조하여 전술된 절차에 따라 제조된) 서열번호 3의 키메라 CP5 클러스터를 발현하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlB-wecG ::cat의 2-AB 표지된 글리칸 샘플을 수용액 중의 NaOH로 처리하였고 다시 표지하였다. 도 11h에 나타낸 바와 같이, 알칼리 처리 전의 샘플(점선) 및 알칼리 처리 후의 샘플(직선)을 HPLC로 분석하였다. 도 11h에서 숫자는 상응하는 피크에서 추정되는 RU의 수를 표시한다. 도 11h에서, 도 11g에 나타낸 아세틸화된 피크들이 비아세틸화된 중합체로부터의 신호에서 단일화되어 있고 탈아세틸화가 95분 후 용출 시간에서 RU 단위들을 분리한다는 것을 주시해야 한다.
도 11i는 에스케리치아 콜라이 세포에서 UndPP 상에 존재하는 CP8 글리칸 레퍼토리를 보여주는 HPLC 분석 결과를 제공한다. 키메라 CP8 클러스터(서열번호 4)(직선) 또는 빈 플라스미드 대조군(점선)을 발현하는 에스케리치아 콜라이 W3110 Δw a aLΔ wecAwzzECA Δ rmlB-wecG ::cat로부터의 메탄올 추출물을 Sep-PAK 카트리지 상에서 고체상 추출하였고 약산으로 처리하여 UndPP로부터 당을 가수분해하였다. 생성된 물질을 환원성 아민화를 통해 2-AB와 반응시켜 글리칸의 환원 말단을 표지하였고 순상 HPLC로 분석하였다. 점선이 아니라 직선으로 제시된 신호는 CP8 특이적 물질을 나타낸다. 회수된 분획의 MALDI-MS/MS에 의해 확인되는 바와 같이, 아세틸화된 CP8 RU 및/또는 비아세틸화된 CP8 RU로 추정되는 구조체들이 표시되어 있다. 도 11g에 나타낸 CP5를 사용한 HPLC 결과에서와 마찬가지로, 동일한 중합도를 갖는 아세틸화된 CP8 RU 중합체 및 비아세틸화된 CP8 RU 중합체가 굵은 막대로 표시되는 바와 같이 도 11h의 크로마토그램에서 함께 군을 이루고 있다는 것을 주목해야 한다. 110' 후에 검출된 물질은 보다 긴 CP8 중합체를 나타낸다.
도 11j는 CP8 글리칸의 탈아세틸화 및 RU 균질성을 보여주는 추가 HPLC 결과를 제공한다. 서열번호 4의 키메라 CP8 클러스터를 발현하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlB-wecG ::cat로부터의 2-AB 표지된 글리칸 샘플을 수용액 중의 NaOH로 처리하였고 다시 표지하였다. 알칼리 처리 전의 샘플(점선) 및 알칼리 처리 후의 샘플(직선)을 HPLC로 분석하였다. 숫자는 상응하는 피크에서 추정되는 RU의 수를 표시한다. 아세틸화된 피크가 많이 사라지고 비아세틸화된 중합체의 신호가 증가하고 탈아세틸화가 110분 후 용출 시간에서 RU 단위들을 분리한다는 것을 주목해야 한다.
도 11h 및 11j는 이들 CP5 샘플 및 CP8 샘플에 대한 알칼리 처리를 수행하여 상기 올리고사카라이드 및 폴리사카라이드로부터 아세틸화 변형을 제거하였을 때 O-항원의 특징적인 래더 유사 밴딩 패턴을 표시하는 HPLC 결과를 보여준다. 상기 결과는 용출 시간 증가를 일정하게 감소시킴에 따라 불연속적인 날카로운 피크를 보여준다. 이것은 이러한 분석된 탄수화물 쇄들이 동일한 RU로 구성된 선형 중합체라는 것을 암시한다. 이 데이터는 에스케리치아 콜라이에서 생성된 재조합 CP5 당 및 CP8 당이 규칙적으로 중합되고 부분적으로 아세틸화된다는 것을 보여준다. 비아세틸화된 CP5 중합체 및 CP8 중합체는 그들의 구조적 유사성으로부터 예측된 바와 같이 HPLC 컬럼으로부터 유사하게 용출되지만, 순상 크로마토그래피는 차이점도 보여준다: 예를 들면, CP5는 CP8보다 더 낮은 정도로 중합되고, 아세틸화는 CP5에서 더 빈번하고, 4 초과의 RU 길이에서 CP5는 7개의 RU로 구성된 중합체의 제조에 대한 명확한 선호를 나타내는 반면, CP8은 더 넓은 중합도로 중합되고, HPLC 및 MS/MS 결과에 의해 암시되는 바와 같이, CP5는 CP8보다 글리칸 생성에 대해 더 효율적이다.
wzy 의존성 중합 경로에서, 특이적 효소(쇄 길이 결정인자에 대한 wzz 또는 cld)가 수행될 RU 중합 단계의 평균 수를 결정하는 것을 담당한다는 것은 모랄다(Marolda) 등에 의해 보고되었다(문헌[Marolda, C. L., L. D. Tatar, et al. (2006). "Interplay of the Wzx translocase and the corresponding polymerase and chain length regulator proteins in the translocation and periplasmic assembly of lipopolysaccharide O antigen." J Bacteriol 188(14): 5124-5135]). Wzz 효소는 특정 반복부 수 평균, 예를 들면, 짧은 당 중합체, 긴 당 중합체 및 매우 긴 당 중합체를 야기하고 그의 길이 특이성을 외재성(exogenous) 폴리사카라이드 경로에 전달하는 것으로 공지되어 있다. CP8 당지질의 길이 및 양을 생성 균주에서 분석하여 보다 길고 보다 적은 양의 상기 당을 발생시켰다. 분자의 양을 증가시켜 단백질 글리코실화를 위한 당 전달 효율을 증가시키기 위해, CP8 당 길이의 하향조절을 특이적 Wzz 효소를 사용하여 수행하였다.
지질 상의 CP8 당의 크기 및 양에 대한 Wzz 단백질의 효과를 시험하기 위해, 에스케리치아 콜라이 wzzO7로부터의 Wzz의 동시발현을 별개의 플라스미드(서열번호 19)로부터 수행하였다. 도 11k는 이 시험의 결과를 제공한다. 키메라 CP8 클러스터(서열번호 4) 및 플라스미드 유래의 IPTG 유도성 wzzO7 카피(서열번호 21, 직선), 또는 빈 플라스미드 대조군(점선)을 발현하는 에스케리치아 콜라이 W3110 Δw a aLΔ wecAwzzECA Δ rmlB-wecG ::cat로부터의 메탄올 추출물을 Sep-PAK 카트리지 상에서 고체상 추출하였고 약산으로 처리하여 UndPP로부터 당을 가수분해하였다. 2-AB 표지된 글리칸을 순상 HPLC로 분석하였다. CP8 샘플의 알칼리 처리는 95'와 115' 사이의 면적의 85% 초과 면적이 CP8의 7개 또는 8개 RU 중합체를 나타낸다는 것을 보여주었는데, 이것은 매우 다양한 아세틸화를 암시한다. 또한, 이들 결과들은 키메라 CP8 클러스터가 a) 가장 풍부한 글리칸의 반복부 수가 7 내지 8에 집중되게 하였고, b) 크로마토그램 하의 면적으로부터 판단된 바와 같이 형광 신호의 전체 강도를 더 높였다는 것을 암시한다.
알칼리 처리는 도 11i 및 11j에서와 마찬가지로 단축된 글리칸의 아세틸화를 확인시켜주었는데, 이것은 재조합 폴리사카라이드의 길이가 외래 Wzz 효소에 의해 조절될 수 있다는 것을 암시한다. O-항원으로부터 유래된 Wzz 효소를 사용하여 캡슐형 당 중합체 길이를 조절하는 것도 가능하다. 나아가, 상기 키메라 클러스터 앞에 위치하는 상이한 프로모터들이 플라스미드 상에서 존재하는 경우 상이한 발현도 및 상이한 중합도를 야기한다.
실시예 5: CP5 및 CP8 글리칸을 사용한 단백질 글리코실화 및 생성물 특징규명
키메라 클러스터의 상이한 변이체들을 생체접합체 생성에 대해 시험하였다. O11 O-항원 클러스터 내에 wbjA 및 wzy 대신에 스타필로코커스 아우레우스 특이성 영역의 상이한 변이체들을 함유하는 키메라 O11/CP5 유전자 클러스터들(서열번호 2 및 서열번호 3)을 PglB(서열번호 27) 및 EPA(서열번호 13)의 존재 하에서 숙주 균주 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzE ::cat에서 발현시켰다. W3110 ΔwaaLΔ wecAwzzE ::cat 숙주 세포는 wbjA 및 wzy 유전자가 상이한 cap5 유전자 세트(및 cat 카세트, 서열번호 2 및 서열번호 3)로 치환되어 있는 O11 O-항원 클러스터를 갖는 pLAFR1 플라스미드 이외에 별도의 플라스미드로부터 2개의 글리코실화 부위를 갖는 EPA(서열번호 13) 및 PglB(서열번호 27)를 발현하였다.
하기 a) 내지 c)를 함유하는 EPA 단백질이 발현된다: a) 원형질막주위공간으로의 이출을 위한 N-말단 신호 펩티드 서열, b) 전체적으로 본원에 참고로 도입되는 국제특허출원 공보 제WO 2009/104074호의 실시예 10에 기재된 바와 같이 단백질 서열(서열번호 13) 내로 도입된 2개의 세균 N-글리코실화 공통 서열, 및 c) 정제를 위한 헥사 His 태그. 세포를 5 ℓ 삼각 플라스크 내의 LB 배지에서 성장시켰다. 밤샘 배양물을 0.05의 OD600nm까지 희석하였다. 약 0.5의 OD600nm에서 1 mM IPTG를 첨가하여 PglB 발현을 유도하였고, 아라비노스(0.2% 최종 농도)를 첨가하여 EPA 발현을 유도하였다. 세포를 4시간 동안 성장시켰고, 유도를 반복하였고, 세포를 추가 약 16시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트(spheroplast)를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. 스타필로코커스 아우레우스 플립파제 유전자 cap5K를 갖지 않는 EPA-CP5 생체접합체 및 스타필로코커스 아우레우스 플립파제 유전자 cap5K를 갖는 EPA-CP5 생체접합체(각각 서열번호 2 및 서열번호 3)를 0.5 M 이미다졸로 용출하였고, 용출된 피크들을 풀링하여 SDS-PAGE로 분석하였고 코마시에 및 은으로 염색하였다(도 12).
도 12는 SDS-PAGE 결과를 제공한다. 좌측 패널은 코마시에 염색을 보여주고, 우측 패널은 은 염색을 보여준다. 중간에 있는 숫자는 분자량 마커의 크기를 표시한다. 레인 아래에 있는 문자는 생체접합체 생성에 사용된 균주들에서 발현된 키메라 클러스터에 존재하는 유전자들을 표시한다. 숙주 균주는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzE ::cat이었다. 결과는 아마도 비글리코실화된 EPA에 상응하는 70 kDa(전기영동 이동)에서 단백질 신호, 및 위에 존재하는 밴드의 래더(100 kDa 내지 170 kDa)를 보여준다. 상기 래더는 아마도 CP5 재조합 스타필로코커스 아우레우스 글리칸으로 글리코실화된 EPA 단백질에 상응한다. 또한, 상기 결과는 플립파제 유전자를 시스템 내에 포함시킨 것이 당단백질 수율을 증가시킨다는 것(중간 레인 및 우측 레인)을 암시한다.
별도의 분석에서, 키메라 CP5 유전자 클러스터(서열번호 3), 플라스미드 pEXT21로부터의 PglB(서열번호 27) 및 별도의 플라스미드로부터의 EPA(2개의 글리코실화 부위를 함유함, 서열번호 13)를 동시발현시킴으로써 CP5-EPA 생체접합체를 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzE ::cat에서 생성하였다. 보다 조절된 생체접합체 제조 방법을 수득하기 위해, 세포를 37℃에서 2 ℓ 생체반응기 내에서 30의 OD600nm까지 성장시켰고, 1 mM IPTG 및 0.2% 아라비노스를 첨가하여 PglB 및 EPA의 발현을 유도하였다. 세포를 산소 제한 조건 하에서 37℃에서 18시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고 세척하였고 200의 OD600nm에서 25% 수크로스 완충제에 재현탁시켰고, 4℃에서 30분 동안 항온처리한 후, 현탁액을 펠렛화하였고, 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 상청액에 존재하는 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 소스큐(SourceQ) 음이온 교환 컬럼 상에 적재하였다. 증가하는 농도의 NaCl의 구배를 인가하여 글리코실화된 EPA를 비글리코실화된 EPA로부터 분리하였다.
도 13a에 나타낸 바와 같이, 정제된 글리코실화된 EPA(CP5-EPA)를 SDS-PAGE로 분리하였고 코마시에(좌측 레인)로 염색하였거나 니트로셀룰로스 막으로 전달한 후 항-CP5 항체(중간 레인) 또는 항-EPA 항체(우측 레인)와 함께 항온처리하였다. 정제된 생체접합체는 EPA 특이적 항체(우측 레인) 및 CP5 특이적 다중클론 항혈청(중간 레인)에 의해 인식되었다. 화살표는 겔에서의 위치를 표시하고, 상기 겔로부터 조각을 절단하여 트립신처리 및 MALDI-MS/MS에 의한 당펩티드의 분석에 사용하였다. 도 13b는 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DNNNSTPTVISHR 내의 글리코실화 부위에 대해 실측된 M/Z 질량의 MALDI-MS/MS(m/z=2088([M+H]+)를 제공한다. m/z=2088의 MS/MS 분석은 표시된 당 부분의 부분적 단편화를 보여준다. 삽입도는 도 13a로부터의 정제된 CP5-EPA의 트립신처리로부터 유도된 펩티드에 부착된 RU 구조체를 보여준다. ManNAcA(HexNAcA, 217 Da) 및 아세틸화된 FucNAc(dHexNAc(0Ac), 229 Da)의 순차적 상실은 예측된 글리칸 구조를 뒷받침한다. 도 13c는 N-글리코사이드 연결에 의해 O-아세틸화된 RU 구조체에 연결된 트립신처리된 펩티드 DQNR 내의 글리코실화 부위에 대해 실측된 M/Z 질량의 MALDI-MS/MS(m/z=1165([M+H]+)를 제공한다. m/z=1165의 MS/MS 분석은 CP5 RU 구조체와 일치하는 전체 Y-이온 단편화 이온 시리즈를 보여준다. 삽입도는 도 13a로부터의 정제된 CP5-EPA의 트립신처리로부터 유도된 펩티드에 부착된 RU 구조체를 보여준다. 펩티드 DQNR(m/z=532 Da([M+H+])) 상의 예측된 글리칸 구조체를 확인시켜주는, ManNAcA(HexNAcA, 217 Da), 아세틸화된 FucNAc(dHexNAc(0Ac), 229 Da) 및 FucNAc(dHexNAc, 187 Da)의 순차적 상실이 나타나 있다.
도 13d에서, CP5 생체접합체의 생성과 동일한 방법을 이용하여 에스케리치아 콜라이에서 CP8 생체접합체를 생성하였다. 키메라 CP8 유전자 클러스터(서열번호 4), (pEXT21 플라스미드(서열번호 27) 내의) PglB, 및 2개의 글리코실화 부위를 함유하는 EPA(서열번호 13)의 동시발현으로 CP8-EPA 생체접합체를 에스케리치아 콜라이에서 생성하였다. 세포를 생체반응기 내에서 글리세롤, 펩톤 및 C 공급원으로서의 효모 추출물을 함유하는 반-한정(semi-defined) 배지에서 7 ℓ의 출발 부피로 성장시켰다. 세포를 37℃에서 회분(batch) 또는 펄스-회분(pulsed-batch) 방식으로 30의 OD600nm까지 성장시켰고, 1 mM IPTG 및 10% 아라비노스를 첨가하여 PglB 및 EPA의 발현을 유도하였다. 유도 후, 세포를 산소 제한 조건 하에서 15시간 동안 유가 방식으로 더 배양하였다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 소스큐 음이온 교환 컬럼 상에 적재하였다. 증가하는 농도의 NaCl의 구배를 인가하여 글리코실화된 EPA를 비글리코실화된 EPA로부터 분리하였다.
도 13d에 나타낸 바와 같이, 정제된 단백질을 SDS-PAGE로 분리하였고 코마시에(좌측 레인)로 염색하였거나 니트로셀룰로스 막으로 전달한 후 항-CP8 항체(우측 레인) 또는 항-EPA 항체(중간 레인)와 함께 항온처리하였다.
글리코실화 시스템을 추가로 개선시키기 위해 상이한 방법들을 시험하였다. 한 방법에서, 생성 시스템에서 플라스미드 수를 감소시켜 추가 항생제의 용량을 낮추고 여분의 플라스미드를 유지하기 위해, pglB에 대한 발현 카세트를 CP5(서열번호 17) 및 CP8(서열번호 18)에 대한 키메라 클러스터가 함유된 플라스미드 내로 클로닝하였다. 발현 카세트는 에스케리치아 콜라이 O121 게놈의 galF와 wbqA 사이에 존재하는 유전자간 영역(프로모터 서열을 위한 것임) 및 이 영역의 하류에 위치한 pglB 서열로 구성된다. 이 발현 카세트를 CP5 및 CP8 키메라 클러스터의 바로 하류에 클로닝하였다. 본 발명자들은 별도의 플라스미드 또는 동일한 플라스미드(서열번호 17) 상에서 키메라 CP5 클러스터(서열번호 3) 및 pglB(서열번호 27)를 함유하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA ::cat를 시험하였다. 추가로, 아라비노스 유도성 프로모터의 조절 하에서 플라스미드로부터 EPA(서열번호 13)를 발현시켰다. 세포를 37℃에서 5 ℓ 삼각 플라스크 내의 LB 배지에서 성장시켰다. 밤샘 배양물을 0.05의 OD600nm까지 희석하였다. 약 0.5의 OD600nm에서 1 mM IPTG를 첨가하여 PglB 발현을 유도하였고, 아라비노스(0.2% 최종 농도)를 첨가하여 EPA 발현을 유도하였다. 세포를 4시간 동안 성장시켰고, 유도를 반복하였고, 세포를 추가 약 16시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. EPA-CP5를 0.5 M 이미다졸로 용출하였고, 용출된 피크들을 풀링하여 SDS-PAGE 및 코마시에로 분석하였다. 도 13e는 SDS-PAGE 결과를 보여준다. 당생체접합체 생성을 위해 3개의 플라스미드(좌측 레인) 또는 2개의 플라스미드(우측 레인)를 함유하는 세포가 나타나 있다. 결과는 CP5-EPA를 위한 당지질 및 접합체 생성이 유지되었다는 것을 보여준다.
시스템의 추가 최적화는 단백질 글리코실화에 사용되는 wzz(중합체 길이 조절제) 단백질 서열을 플라스미드 내로 도입하는 것이었다. CP8-EPA를 생성하는 시스템에 의해 예시되는 바와 같이, wzz를 플라스미드 유래의 키메라 CP8 클러스터 내에 도입하였고(서열번호 19) 담체 단백질에 대한 발현 플라스미드 내의 epa 유전자의 하류에도 도입하였다(서열번호 20). CP8-EPA 생체접합체를 2개의 플라스미드를 포함하는 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlB-wecG ::cat에서 생성하였다: 1개의 플라스미드는 키메라 CP8 유전자 클러스터 이외에 wzzO7 유전자의 카피, 및 pglB 유전자의 항시적 발현을 위한 DNA 카세트를 함유하였고(서열번호 19); 제2 플라스미드는 2개의 글리코실화 부위를 함유하는 해독된 EPA 단백질의 발현 및 분비를 위한 제1 유전자, 및 동일한 프로모터의 조절 하에 있는 제2 wzzO7 카피를 함유하였다(서열번호 20). 언급된 플라스미드들을 함유하는 생성된 균주인 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzECA Δ rmlBCA-wecG ::cat를 생체반응기 내에서 글리세롤, 펩톤 및 C 공급원으로서의 효모 추출물을 함유하는 반-한정 배지에서 7 ℓ의 출발 부피로 성장시켰다. 세포를 회분 또는 펄스-회분 방식으로 30의 OD600nm까지 성장시켰고, PglB 및 EPA의 발현을 유도하였다. 유도 후, 세포를 산소 제한 조건 하에서 15시간 동안 유가 방식으로 더 배양하였고 원심분리로 회수하였다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였다. 코마시에, 및 항-His 항혈청 및 항-CP8 항혈청을 사용한 웨스턴 블롯에 의해 확인된 당접합체 CP8-EPA의 형성은 도 13f에 나타나 있다. 도 13f는 정제된 단백질의 SDS-PAGE 분리 및 코마시에에 의한 분석(좌측 레인) 또는 니트로셀룰로스 막으로의 전달 및 항-His 태그 항체(중간 레인) 또는 항-CP8 항체(우측 레인)를 사용한 프로빙에 의한 분석 결과를 보여준다.
CP5-EPA 당접합체의 특징규명을 다양한 분석 방법으로 더 세밀하게 수행하였다. 코발엑스(CovalX)(스위스, 슐리에렌 소재)는 도 13a에 나타낸 분석에서 사용된 3 플라스미드 시스템을 이용하여 W3110 Δ waaL Δ wecAwzzECA ::cat에서 생성한 정제된 CP5-EPA 샘플의 고질량 MALDI 분석을 수행하였다. 도 14a는 고질량 MALDI 결과를 보여준다. A+ 및 B+는 각각 비글리코실화된 EPA 및 글리코실화된 EPA에 상응하는 단백질 종 질량([M+H]+)을 표시한다. 고분자량의 올리고머 형태가 존재할 수 있고, 낮은 MW 영역에서의 신호는 오염물질 또는 분해 생성물이다. 도 14a에 제시된 결과는 상기 단백질 제제가 EPA 단백질 단독보다 4 kDa 더 크고(5.2개 반복 단위의 중간 당 길이를 표시함) 주로 단량체인 단백질 집합체를 함유하였다는 것을 보여준다. 이것은 SDS-PAGE, 코마시에 브릴리언트 블루 염색, 및 주요 접합체 형태에서의 반복 단위의 카운팅에 의해 분석된 바와 같이 상기 제제 중의 주요 당접합체 형태의 당 길이가 5 내지 7이라는 결과와 일치한다(도 7, 8 및 13a 참조).
CP5-EPA를 크기 배제 크로마토그래피(SEC-HPLC)로 더 특징규명하였다. 본 발명자들은 도 13a에 나타낸 분석에서 사용된 3 플라스미드 시스템을 W3110 Δ waaL Δw ecAwzzE CA::cat에서 사용하였다. 샘플을 음이온 교환 크로마토그래피로 정제하여 비글리코실화된 EPA를 제거하였다. 분석을 수펠코(Supelco) TSK G2000SWXL 컬럼 상에서 수행하였다. 도 14b는 정제된 CP5-EPA 샘플의 SEC-HPLC 분석 결과를 보여준다. 280 nm에서 측정된 UV 기록이 표시되어 있다. 굵은 직선은 3.25 ㎍의 정제된 CP5-EPA의 분석으로부터 수득되었고, 얇은 선은 5 ㎍의 정제된 비글리코실화된 EPA로부터 수득되었다. 용출의 11.5분에서 균질한 주 피크가 나타나는 반면, 비글리코실화된 EPA는 12.9분에서 용출되었다(도 14b). 2개 분자의 수력학적 반경의 계산으로부터 비글리코실화된 EPA에 대한 42 kDa의 크기 및 글리코실화된 EPA에 대한 166 kDa의 크기를 수득하였다. 이것은 글리코실화된 EPA가 글리칸의 선형 구조로 인해 예측된 바와 같이 용액 중에서 연장된 단량체 단백질로서 나타난다는 것을 암시한다.
따라서, 본 발명자들의 분석은 CP5-EPA 생체접합체가 EPA 단백질 및 정확한 O-아세틸화된 글리칸 구조체로 구성된다는 것을 확인시켜주었다. 이들 결과에 근거하여, CP8-EPA 생체접합체도 EPA 단백질 및 정확한 O-아세틸화된 글리칸 구조체로 구성된다는 것을 예측할 수 있었다.
실시예 6: 스타필로코커스 아우레우스 단백질 글리코실화 및 생성물 특징규명
당접합체 백신 후보물질을 발생시키기 위한 "생체내" 글리코실화의 다능성을 입증하기 위해, 여러 담체 단백질들을 CP5로 글리코실화될 기질로서 사용하였다. 스타필로코커스 아우레우스에 대한 생체접합체 백신의 면역 반응을 더 증가시키기 위해, 담체 단백질 EPA를 캄필로박터 제주니로부터의 AcrA 및 스타필로코커스 아우레우스로부터의 2개 단백질(H1a 및 ClfA)로 교체하였다. 담체 단백질로서 사용하기 위해, 세균 N-글리코실화 부위를 삽입하여 H1a 및 ClfA를 변형시켰다. 국제특허출원 공보 제WO 2006/119987호에 기재된 과정을 수행하여 H1a-H35L에 대한 4개의 버전(서열번호 6, 서열번호 7, 서열번호 8 및 서열번호 16) 및 ClfA에 대한 3개의 버전(서열번호 10, 서열번호 11 및 서열번호 12)을 발생시켰다.
H1a-H35L 부위 130의 글리코실화를 위해, 하기 2개의 발현 플라스미드를 포함하는 에스케리치아 콜라이 세포(W3110 Δ waaL Δ wecAwzzE Δ rmlB-wecG)를 사용하였다: 원형질막주위공간 내로의 분비를 위한 N-말단 신호 펩티드, 1개의 N-글리코실화 부위 및 정제를 위한 헥사 His 태그를 함유하는 H1a-H35L의 발현이 ParaBAD 프로모터의 조절 하에 있는, H1a-H35L 생성을 위한 제1 플라스미드(서열번호 16); 및 CP5 키메라 클러스터 및 pglB의 발현을 위한 제2 플라스미드(서열번호 17). 이 시스템은 교체된 단백질 담체 발현 플라스미드를 갖는 상기 최적화된 2 플라스미드 CP5-EPA 발현 시스템에 상응한다. 세포를 12 ℓ 생체반응기 내의 풍부 배지에서 30의 OD600nm까지 성장시켰고, 0.2% 아라비노스를 첨가하여 H1a의 발현을 유도하였다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 상청액 중의 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. 글리코실화된(CP5-H1a) 및 비글리코실화된 H1a를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 음이온 교환 크로마토그래피 상에 적재하였다. 단백질을 0 M 내지 0.7 M NaCl의 선형 구배로 용출하여 H1a로부터 CP5-H1a를 분리하였다. 생성된 단백질을 SDS-PAGE로 분리하였고 코마시에로 염색하였거나, 니트로셀룰로스 막으로 전달한 후 표시된 바와 같이 항-His, 항-H1a 또는 항-CP5 항혈청으로 프로빙하였다(도 14c). 도 14c의 결과는 코마시에(좌측 레인), 및 항-His(중간 좌측 레인), 항-H1a(중간 우측 레인) 및 항-CP5(우측 레인) 항혈청을 사용한 웨스턴 블롯에 의해 확인된 당접합체(CP5-H1a)의 형성을 보여준다.
개조된 글리코실화 부위 130을 갖는 H1a-H35L의 본질(identity)을 인-겔(in-gel) 트립신처리 및 MALDI-MS/MS로 확인하였다.
담체 단백질이 CP5 및 CP8에 의한 글리코실화에 대해 교체될 수 있다는 것을 더 입증하기 위해, 캄필로박터 제주니 AcrA 단백질을 글리코실화 수용체로서 사용하였다(도 14d 참조). 3 플라스미드 시스템(서열번호 3, 서열번호 15 및 서열번호 27)을 사용하였을 때, 이 접합체에 대한 생성 균주는 CP5 키메라 클러스터(서열번호 3), IPTG에 의해 유도되는 PglB 단백질(서열번호 27), 및 별도의 플라스미드 상에서 아라비노스 유도 하에 존재하는 AcrA(서열번호 15)를 보유하는 W3110 ΔwaaL이었다. 세포를 생체반응기 내에서 글리세롤, 펩톤 및 C 공급원으로서의 효모 추출물을 함유하는 반-한정 배지에서 7 ℓ의 출발 부피로 성장시켰다. 세포를 회분 또는 펄스-회분 방식으로 30의 OD600nm까지 성장시켰고, 1 mM IPTG 및 10% 아라비노스를 첨가하여 PglB 및 AcrA의 발현을 유도하였다. 유도 후, 세포를 산소 제한 조건 하에서 15시간 동안 유가 방식으로 더 배양하였고 원심분리로 회수하였다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. CP5-AcrA 당단백질을 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였다. 정제된 단백질을 SDS-PAGE로 분리하였고 코마시에로 염색하였거나, 니트로셀룰로스 막으로 전달한 후 표시된 바와 같이 항-AcrA 또는 항-CP5 항혈청으로 프로빙하였다(도 14d).
ClfA 내로의 세균 N-글리코실화 부위의 삽입을 국제특허출원 공보 제WO 2006/119987호에 기재된 바와 같이 수행하여 서열번호 10, 서열번호 11 및 서열번호 12를 발생시켰다. 담체 단백질을 에스케리치아 콜라이 세포에서 아라비노스 유도성 프로모터로부터 발현시켰다. 원형질막주위공간 내로의 분비를 위한 N-말단 신호 펩티드, 여러 N-글리코실화 부위, 및 정제를 위한 헥사 His 태그를 생성하도록 유전자를 디자인하였다. 에스케리치아 콜라이 세포의 원형질막주위공간 추출물로부터 정제를 시작하였다.
ClfA 327의 글리코실화를 위해, 상기 최적화된 CP5-EPA 발현 시스템을 사용하였다. 2 플라스미드 시스템(서열번호 17 및 서열번호 11)을 사용하였을 때, CP5 키메라 클러스터 및 pglB(항시적 발현 카세트)뿐만 아니라 (ParaBAD 프로모터의 조절 하에 있는) ClfA 327에 대한 발현 플라스미드도 포함하는 에스케리치아 콜라이 세포(W3110 Δ wecAwzzE Δ rmlB-wecG Δ waaL)를 1 ℓ 삼각 플라스크 내의 LB 배지에서 성장시켰다. 밤샘 배양물을 0.05의 OD600nm까지 희석하였다. 약 0.5의 OD600nm에서 아라비노스(0.2% 최종 농도)를 첨가하여 ClfA 발현을 유도하였다. 상기 세포를 20시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni2+ 친화성 크로마토그래피 상에 적재하였다. ClfA-CP5를 0.5 M 이미다졸로 용출하였고, SDS-PAGE로 분리하였고 코마시에로 염색하였거나, 니트로셀룰로스 막으로 전달한 후 항-His 또는 항-CP5 항혈청으로 프로빙하였다. 도 14e는 단백질의 아미노산 위치 327 주위에 삽입된 글리코실화 부위를 갖는 ClfA 변이체(서열번호 11)를 사용하여 수득한 결과를 보여준다. 상기 결과는 코마시에 염색, 및 항-His 웨스턴 블롯에 의해 확인된 ClfA의 형성, 및 항-CP5 항혈청을 사용한 웨스턴 블롯에 의해 확인된 당접합체(CP5-ClfA)의 형성을 보여준다.
실시예
7:
당접합체
백신으로서의
CP5
-EPA의 활성
내부에 cap5K를 갖는 CP5 키메라 클러스터(서열번호 3), PglB 단백질(서열번호 27), 및 2개의 글리코실화 신호 부위를 갖는 (pEC415 상의) EPA를 포함하는 W3110 Δ waaL Δ wecAwzzECA ::cat 세포를 1 ℓ 삼각 플라스크 내의 LB 배지에서 성장시켰다. 밤샘 배양물을 0.05의 OD600nm까지 희석하였다. 약 0.5의 OD600nm에서 각각 아라비노스(0.2% 최종 농도) 및 1 mM IPTG를 첨가하여 EPA 및 PglB 발현을 유도하였다. 상기 세포를 20시간 동안 성장시켰다. 세포를 원심분리로 펠렛화하였고, 상기 세포를 세척하였고 0.2 부피의 수크로스 완충제에 현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 소스큐 음이온 교환 컬럼 상에 적재하였다. 증가하는 농도의 NaCl의 구배를 인가하여 글리코실화된 EPA를 비글리코실화된 EPA로부터 분리하였다. 용출된 단백질의 양을 BCA 분석으로 측정하였고, 코마시에에 의해 염색된 SDS-PAGE 상에서 수득된 밴드의 크기에 근거하여 당의 이론상 질량을 계산하였다. 단백질 측정과 더불어, 제제 중의 폴리사카라이드 항원의 양을 평가하였다. 이 평가된 정량을 고질량 MALDI MS 방법으로 확인하였다(도 14a 참조).
살아있는 동물에서 CP5-EPA의 면역원성을 측정하기 위해, 1 ㎍의 정제된 당접합체를 보조제로서 알루미늄 하이드록사이드의 존재 하에서 1일째 날(제1 주입), 21일째 날(제2 주입) 및 56일째 날(제3 주입)에 IP(복강내) 경로로 마우스 내에 주입하였다. 각각 제2 주입 및 제3 주입으로부터 2주 후 시점인 35일째 날 및 61일째 날 후, 코팅을 위해 폴리-L-라이신-변형된 CP5를 사용하는 ELISA로 IgG 반응을 측정하였다(문헌[Gray, B.M. 1979. ELISA methodology for polysaccharide antigens: protein coupling of polysaccharides for adsorption to plastic tubes. J. Immunol. 28:187-192]). CP5-생체접합체로 면역화된 마우스로부터의 혈액을 CP5 캡슐형 폴리사카라이드에 대한 특이적 IgG 항체에 대해 분석하였다. 도 15a는 마우스에서 CP5-EPA에 의해 발생된 IgG 역가를 제공한다. ELISA 플레이트를 폴리-L-라이신-변형된 CP5로 코팅하였고, 2회 면역화된 마우스(각각의 희석에서 제2 막대(빈 막대)) 또는 3회 면역화된 마우스(각각의 희석에서 제1 막대(정방향 대각선))에서의 IgG 반응을 삼중으로 측정하였다. 대조군인 면역전 혈청을 사용하여 수득한 신호는 각각의 희석에서 제3 막대(역방향 대각선)로 표시되어 있다. 알칼리성 포스파타제-접합된 단백질 G를 사용하여 마우스 IgG 반응을 측정하였다. 도 15a에 나타낸 바와 같이, CP5-EPA 생체접합체는 6.4 x 103의 혈청 항체 역가를 이끌어내었다. 도 15a에 제시된 결과는 CP5-EPA가 마우스에서 CP5 특이적 항체를 발생시킨다는 것을 보여준다. 이 실험은 에스케리치아 콜라이에서 생성된 생체접합체가 마우스에서 면역원성을 나타낸다는 것을 보여준다.
유사한 실험을 숙주 유기체로서 토끼를 사용하여 수행하였다. CP5-EPA(15 ㎍ CP5)를 프로인트 완전 보조제의 존재 하에서 1일째 날에 피내로 토끼 내에 주입하였고 프로인트 불완전 보조제의 존재 하에서 20일째 날, 30일째 날 및 40일째 날에 피하로 토끼 내에 주입하였다. 61일째 날 후, 코팅을 위해 폴리-L-라이신-변형된 CP5를 사용하는 ELISA로 IgG 반응을 측정하였다(문헌[Gray, B.M. 1979. ELISA methodology for polysaccharide antigens: protein coupling of polysaccharides for adsorption to plastic tubes. J. Immunol. 28: 187-192]). 도 15b는 토끼에서 CP5-EPA에 의해 발생된 IgG 역가를 제공한다. 도 15b에 제시된 결과는 CP5-EPA가 토끼에서 CP5 특이적 항체를 발생시킨다는 것을 보여준다. CP5-EPA 생체접합체에 대한 면역 반응은 각각의 희석에서 제2 막대(정방향 대각선)로 표시되어 있다. 대조군 혈청은 사멸된 스타필로코커스 아우레우스에 대해 발생된 CP5 특이적 흡수된 혈청(WC 추출물, 각각의 희석에서 제1 막대(점)) 및 면역전 혈청(각각의 희석에서 제3 막대(빈 막대))을 포함한다. 다양한 항원으로 면역화된 토끼로부터의 혈청을 정제된 CP5에 대한 특이적 항체에 대해 분석하였다. 플레이트를 폴리-L-라이신-변형된 CP5로 코팅하였다. 대조군인 면역전 혈청을 사용하여 수득한 신호는 각각의 희석에서 제3 막대(역방향 대각선)로 표시되어 있다. 알칼리성 포스파타제-접합된 단백질 G를 사용하여 토끼 IgG 반응을 삼중으로 측정하였다. CP5-EPA 생체접합체는 (항혈청이 CP5 특이성을 나타내도록, 완전히 사멸된 후 우드(Wood) 46으로 흡수된 스타필로코커스 아우레우스 및 트립신처리된 동질유전자 무캡슐형 돌연변이체를 사용하여 면역화시킴으로써 제조된) 대조군 혈청의 역가보다 4배 더 높은 1 x 106의 역가를 이끌어내었다. 이 실험은 상기 생체접합체가 고역가의 CP5 특이적 IgG 반응을 이끌어낼 수 있었다는 것을 보여준다.
실시예
8:
CP5
항체의 기능적 활성
시험관내
활성
실시예 7에 기재된 바와 같이 발생된 토끼 다중클론 항혈청을 단백질 A 친화성 컬럼으로 정제하여 IgG 특이적 항체를 풍부하게 하였다. 스타필로코커스 아우레우스 생체접합체 CP5-EPA로 면역화된 토끼로부터 수득된 IgG를 고전적인 시험관내 옵소닌식균작용 사멸 분석에서 기능적 활성에 대해 시험하였다(문헌[Thakker, M., J.-S. Park, V. Carey, and J. C. Lee. 1998. Staphylococcus aureus serotype 5 capsular polysaccharide is antiphagocytic and enhances bacterial virulence in a murine bacteremia model. Infect Immun 66:5183-5189]). 스타필로코커스 아우레우스를 콜롬비아 아가 + 2% NaCl 상에서 25시간 동안 배양하였다. 이 세균을 최소 필수 배지 + 1% BSA(MEM-BSA)에 현탁시켰다. PMN(다형핵 호중구)을 새로 채취된 인간 혈액으로부터 단리하였고 세척하였고 카운팅하였고 MEM-BSA에 현탁시켰다. 스타필로코커스 아우레우스 CP5-EPA로 면역화된 토끼로부터 정제된 IgG 제제, 또는 국제특허출원 공보 제WO 2009/104074호에 기재된 바와 같이 정제된 쉬겔라 O1-EPA로 면역화된 토끼로부터 정제된 IgG 제제(대조군)를 MEM-BSA에서 제조된 연속 10배 희석물 형태로 분석에 첨가하였다. 기니아 피그 혈청(펠-프리즈(Pel-Freez))을 C 공급원으로서 사용하였다. 각각의 분석(0.5 ㎖ 총 부피)은 약 5 x 106 PMN, 1 x 106 CFU 스타필로코커스 아우레우스, 0.5% 내지 1%의 기니아 피그 혈청, 및 140 ㎍/㎖ 내지 1 ㎍/㎖의 다양한 농도의 IgG를 함유하였다. 대조군 샘플들은 1) C' 및 PMN과 함께 항온처리되었으나 항체와 함께 항온처리되지 않은 스타필로코커스 아우레우스; 2) IgG 및 C'와 함께 항온처리되었으나 PMN과 함께 항온처리되지 않은 스타필로코커스 아우레우스; 또는 3) 스타필로코커스 아우레우스만을 함유하였다. 샘플들을 37℃에서 2시간 동안 빙글빙글 회전시켰다(12 rpm). 멸균수 중의 샘플 희석물들을 볼텍싱하였고, 희석된 샘플들을 TSA 상에서 이중으로 플레이팅하여 세균 사멸을 평가하였다. 퍼센트 사멸을 0시간과 비교된 2시간 후 CFU/㎖의 감소로서 정의하였다.
제1 실험 세트에서, 원형 CP5 단리물인 메티실린 감수성 스타필로코커스 아우레우스(MSSA) 균주 레이놀드의 옵소닌식균작용 사멸을 시험하였고, 결과는 도 16a에 제시되어 있다. 토끼에서 발생된 CP5-EPA에 대한 항체의 옵소닌 활성을 스타필로코커스 아우레우스 혈청형 5 균주 레이놀드에 대해 시험하였다. CP5-EPA 항체는 1.4 ㎍/㎖의 농도까지 옵소닌 활성을 보인 반면, O1-EPA 항체는 140 ㎍/㎖에서 약간의 옵소닌 활성을 보였다. 스타필로코커스 아우레우스 전체 세포 추출물(제이 씨 리(J. C. Lee)(하버드 의과대학 브림감 부인과병원 의학부; 미국 매사추세츠주 보스톤 소재)로부터 입수됨)에 대해 발생된 양성 대조군 혈청은 항-CP5-EPA 혈청(WC 항혈청 1%)과 유사한 활성을 보였다.
도 16a에 나타낸 바와 같이, 스타필로코커스 아우레우스 레이놀드의 65% 내지 75%가 CP5-EPA에 대한 항체 및 보체 활성을 갖는 1% 기니아 피그 혈청과 함께 항온처리되었을 때 PMN에 의해 사멸되었다. 본 분석에서 항혈청은 최종 1%의 농도로 사용되었고, 스타필로코커스 아우레우스 접종물의 89%가 이 조건 하에서 사멸되었다. 스타필로코커스 아우레우스가 C'(1% 기니아 피그 혈청) 단독에 의해, 또는 PMN 없이 항체 및 C'에 의해 옵소닌화되었을 때 사멸이 거의 관찰되지 않았다. 나타낸 데이터는 2회 내지 5회 실험의 평균이다. 그래프로 표시된 모든 샘플들은 기니아 피그 혈청 C'를 포함하였고, C'의 부재 하에서는 사멸이 관찰되지 않았다. 항체 단독 및 보체 단독 중 어느 것도 옵소닌 활성을 보이지 않았고, 이 특징은 캡슐화된 세균 병원체의 특징이다. 대조적으로, 대조군 백신(EPA에 커플링된 쉬겔라 O1 항원)에 의해 유도된 항체는 C'의 존재 하에서조차도 옵소닌 활성을 보이지 않았다. 본 발명자들은 본 분석에서 양성 대조군으로서 CP5 특이적 토끼 항혈청(제이 씨 리(하버드 의과대학 브림감 부인과병원 의학부; 미국 매사추세츠주 보스톤 소재)로부터 입수됨)도 시험하였다. 이들 데이터는 CP5-EPA 생체접합체에 대해 발생된 항체가 입증된 옵소닌 활성을 갖는 CP5 항체(문헌[Thakker, M., J.-S. Park, V. Carey, and J. C. Lee. 1998. Staphylococcus aureus serotype 5 capsular polysaccharide is antiphagocytic and enhances bacterial virulence in a murine bacteremia model. Infect Immun 66:5183-5189])에 필적할만한, 캡슐화된 스타필로코커스 아우레우스에 대한 옵소닌 활성을 보였다는 것을 보여준다.
CP5-EPA에 대한 항체의 옵소닌 활성을 CP5-EPA의 MRSA 균주 USA100에 대해 시험하였다. 도 16b는 CP5+ 단리물이고 NRS382로 지칭되는 스타필로코커스 아우레우스 균주 USA100에 대해 시험된 IgG 및 C'의 옵소닌 활성의 결과를 제공한다. 나타낸 데이터는 2회 내지 5회 실험의 평균이다. 그래프로 표시된 모든 샘플들은 기니아 피그 혈청 C'를 포함하였고, C'의 부재 하에서는 사멸이 관찰되지 않았다. 도 16b에 나타낸 바와 같이, USA100 접종물의 약 60%가 0.5% 기니아 피그 보체 및 100 ㎍/㎖ 내지 1 ㎍/㎖ 농도의 CP5-EPA IgG와 함께 항온처리되었을 때 PMN에 의해 사멸되었다. 최소 사멸은 PMN의 부재 하에서 또는 IgG가 분석으로부터 배제되었을 때 관찰되었다. O1-EPA 접합체 백신에 대해 발생된 IgG가 PMN+C'에 첨가되었을 때 사멸이 달성되지 않았다(이 분석 샘플에서 세균이 증식됨). 스타필로코커스 아우레우스가 C' 단독에 의해, 또는 PMN 없이 항체 및 C'에 의해 옵소닌화되었을 때 사멸이 거의 관찰되지 않았다. 따라서, CP5-EPA 항체는 100 ㎍/㎖ 내지 1 ㎍/㎖의 농도에서 옵소닌 활성을 보인 반면, O1-EPA 항체는 100 ㎍/㎖에서 약간의 옵소닌 활성을 보였다. 이 실험은 CP5-EPA 항체가 MSSA 및 MRSA 균주 둘다에 대한 옵소닌 활성을 나타낸다는 것을 보여준다.
생체내
활성
생체접합체 CP5-EPA 백신에 대해 발생된 IgG의 옵소닌 활성이 스타필로코커스 감염의 마우스 모델에서 보호를 예측할 것인지를 확인하기 위해, 수동 면역화 실험을 수행하였다. 초기 연구에서, CP5-EPA 또는 쉬겔라 O1-EPA로 면역화된 토끼로부터 수득된 1.4 mg 내지 2 mg의 IgG를 스위스-웹스터 수컷 마우스(약 6주령)에게 정맥(꼬리 정맥)내로 주입하였다. 24시간 후, 약 3.6 x 107 CFU의 스타필로코커스 아우레우스 레이놀드를 사용하여 상기 마우스를 복강내(IP) 경로를 통해 공격하였다. 공격으로부터 2시간 후 세균혈증도를 측정하여 세균혈증의 항체 매개 치유를 평가하였다. 배양에 의한 검출 하한은 혈액 ㎖ 당 5 CFU이었다. 도 17a는 측정된 세균혈증도를 보여준다. 각각의 점은 세균 접종으로부터 2시간 후 개별 마우스에 대한 꼬리 정맥 천자(puncture)에 의해 수행된 정량 혈액 배양을 나타낸다. 수평선은 중간 CFU/㎖ 값을 나타낸다. 빈 원은 항-CP5-EPA 항체를 수득한 마우스로부터의 혈액 샘플이고, 흑색으로 채워진 원은 상이한 글리칸(쉬겔라 디센테리애(Shigella dysenteriae) O1)에 접합된 EPA에 대해 발생된 대조군 항체 제제를 제공받은 동물로부터의 샘플이다. 도 17a의 결과는 CP5 항체를 제공받은 마우스가 O1 특이적 항체를 제공받은 마우스에 비해 세균혈증도의 유의한(만-휘트니(Mann-Whitney) 분석에 의할 때 P = 0.0006) 감소를 보였다는 것을 보여준다. 실제로, 혈액 ㎖ 당 CFU 단위로 표시되는 감소는 O1-EPA IgG를 제공받은 마우스에 비해 CP5-EPA로 수동 면역화된 마우스에서 98%이었다.
후속 수동 면역화 실험에서, 스타필로코커스 아우레우스 레이놀드의 보다 낮은 접종물(약 5.5 x 106 CFU/마우스)을 사용하여 마우스를 복강내로 공격하였다. CP5-EPA 항체를 사용한 수동 면역화를 5 내지 6 x 106 CFU의 스타필로코커스 아우레우스 레이놀드에 의해 복강내로 공격받은 마우스에서 시험하였다. 세균 공격 24시간 전, 2 mg의 CP5-EPA IgG 또는 O1-EPA IgG를 정맥(IV)내로 마우스 내에 주입하였다. 도 17b는 측정된 세균혈증도를 보여준다. 각각의 점은 세균 접종으로부터 2시간 후 개별 마우스에 대한 꼬리 정맥 천자에 의해 수행된 정량 혈액 배양을 나타낸다. 수평선은 중간 CFU/㎖ 값을 나타낸다. 빈 원은 항-CP5-EPA 항체를 수득한 마우스로부터의 혈액 샘플이고, 흑색으로 채워진 원은 상이한 글리칸(쉬겔라 디센테리애 O1)에 접합된 EPA에 대해 발생된 대조군 항체 제제를 제공받은 동물로부터의 샘플이다. 도 17b에 나타낸 바와 같이, 2 mg의 CP5-EPA IgG를 제공받은 마우스는 2 mg의 O1-EPA IgG를 제공받은 동물보다 유의하게(만-휘트니 분석에 의할 때 P <0.0001) 낮은 세균혈증도를 보였다. 실제로, CP5-EPA 항체로 수동 면역화된 7마리의 마우스 중 6마리의 마우스가 멸균 혈액 배양물을 가졌다(각각의 마우스로부터 채취되고 플레이팅된 혈액 부피에 따라 혈액 ㎖ 당 6 CFU 내지 30 CFU의 검출 하한). O1-EPA IgG를 제공받은 대조군 마우스와 비교될 때 CP5 항체로 인한 세균혈증도의 감소는 98%이었다.
세균혈증으로부터의 보호가 보다 낮은 수준의 IgG에 의해 부여될 수 있는지를 확인하기 위해, 300 ㎍의 CP5-EPA 또는 O1-EPA IgG를 사용하여 IV 경로로 마우스를 수동 면역화시킨 후속 실험을 수행하였다. 24시간 후, 6 x 106 CFU의 스타필로코커스 아우레우스 레이놀드를 사용하여 상기 마우스를 복강내로 접종하였다. 배양에 의한 검출 하한은 혈액 ㎖ 당 13 CFU 내지 67 CFU이었다. 도 17b는 측정된 세균혈증도를 보여준다. 각각의 점은 세균 접종으로부터 2시간 후 개별 마우스에 대한 꼬리 정맥 천자에 의해 수행된 정량 혈액 배양을 나타낸다. 수평선은 중간 CFU/㎖ 값을 나타낸다. 빈 원은 항-CP5-EPA 항체를 수득한 마우스로부터의 혈액 샘플이고, 흑색으로 채워진 원은 상이한 글리칸(쉬겔라 디센테리애 O1)에 접합된 EPA에 대해 발생된 대조군 항체 제제를 제공받은 동물로부터의 샘플이다. 도 17b의 결과와 마찬가지로, 도 17c의 결과는 세균혈증으로부터의 CP5 항체 매개 보호가 상기 보다 낮은 항체 투여량에서 달성되었다는 것을 보여준다. 세균혈증도의 98% 감소는 CP5 생체접합체 백신에 의해 유도된 항체에 의해 달성되었고, 9마리의 마우스 중 8마리의 마우스가 멸균 혈액 배양물을 가졌는데, 이것은 쉬겔라 O1-EPA 항체를 제공받은 8마리의 마우스 중 0 마리의 마우스가 멸균 혈액 배양물을 가졌다는 결과와 비교된다.
실시예
9: 마우스에서의 능동 면역화
생체접합체 CP5-EPA를 사용한 마우스의 백신접종이 수동 면역화 분석에서와 마찬가지로 세균 공격으로부터의 보호를 매개한다는 것을 보여주기 위해, 능동 면역화 연구를 수행하였다.
키메라 CP5 유전자 클러스터(서열번호 3), 플라스미드 pEXT21로부터의 PglB(서열번호 27) 및 별도의 플라스미드로부터의 EPA(2개의 글리코실화 부위를 함유함, 서열번호 13)를 동시발현시킴으로써 CP5-EPA 생체접합체를 에스케리치아 콜라이 W3110 Δ waaL Δ wecAwzzE ::cat에서 생성하였다. 세포를 생체반응기 내에서 글리세롤, 펩톤 및 C 공급원으로서의 효모 추출물을 함유하는 반-한정 배지에서 7 ℓ의 출발 부피로 성장시켰다. 세포를 회분 또는 펄스-회분 방식으로 30의 OD600nm까지 성장시켰고, 1 mM IPTG 및 10% 아라비노스를 첨가하여 PglB 및 EPA의 발현을 유도하였다. 유도 후, 세포를 산소 제한 조건 하에서 15시간 동안 유가 방식으로 더 배양하였고 원심분리로 회수하였다. 상기 세포를 세척하였고 200의 OD600nm까지 25% 수크로스 완충제에 재현탁시켰고 펠렛화하였고 삼투압 충격으로 용해시켰다. 스페로플라스트를 원심분리로 펠렛화하였고, 원형질막주위공간 단백질들을 Ni2 + 친화성 크로마토그래피 상에 적재하였다. 글리코실화된 EPA 및 비글리코실화된 EPA를 0.5 M 이미다졸로 친화성 컬럼으로부터 용출하였고 소스큐 음이온 교환 컬럼 상에 적재하였다. 증가하는 농도의 NaCl의 구배를 인가하여 글리코실화된 EPA를 비글리코실화된 EPA로부터 분리하였다.
CP5-EPA를 CP5 스타필로코커스 아우레우스 균주로부터 보호하기 위한 접합체 백신으로서 사용하고자 한다. 이러한 능동 면역화가 작용하는지를 시험하기 위해, 본 발명자들은 상이한 암컷 스위스-웹스터 마우스 군들을 3개의 상이한 투여량의 CP5-EPA로 면역화시켰고 세균혈증 모델을 이용하여 면역화를 분석하였다. 상기 3개의 투여량을 0일째 날, 14일째 날 및 28일째 날에 피하 주입하였다. 도 18에 나타낸 바와 같이, 42일째 날에 스타필로코커스 아우레우스 균주 JL278을 사용하여 마우스를 복강내로 공격하였다. 5개 마우스 군들을 x-축 아래에 표시된 3개의 상이한 투여량의 CP5-EPA로 면역화시켰다(점선 원; 빈 원; 및 역방향 대각선으로 채워진 원). 2개의 대조군들은 보조제(정방향 대각선으로 채워진 원) 또는 PBS(흑색으로 채워진 원)만을 제공받았다. 각각의 점은 단일 마우스로부터의 혈액 샘플을 나타낸다. 최저 투여량의 백신(0.2 ㎍)이 군으로부터의 모든 마우스에서 보호를 유도하였다. 공격으로부터 2시간 후, 코팅을 위해 폴리-L-라이신-변형된 CP5를 사용하는 ELISA(Gray et al. (1979))를 이용하여 혈액 샘플을 cfu 형성 및 항-CP5 항체에 대해 분석하였다. CP5-EPA로 면역화된 모든 군들에서, 혈액 중의 cfu의 평균 감소가 관찰되었다. 그러나, 최저 투여량의 백신을 제공받은 군에서만 모든 5마리의 마우스에서 세균혈증으로부터의 일반적인 보호가 존재하였다. 항-CP5 항체에 대한 혈액 분석은 상이한 마우스 군들에서 보호와 평균 ELISA 역가 사이의 양의 상관관계를 보여주었다. 도 18에 제시된 상기 결과는 상기 항체가 면역화된 마우스에서 세균혈증으로부터의 보호를 유도하였다는 것을 보여준다.
이들 연구들은 CP5-EPA 생체접합체 백신이 인간 PMN에 의한 식균작용 사멸을 위해 스타필로코커스 아우레우스를 옵소닌화하고 수동 면역화 연구 및 능동 면역화 연구에서 세균혈증으로부터 마우스를 보호하는 항체를 유도하였다는 것을 보여준다. 이들 데이터는 제시된 생체접합체가 다수의 스타필로코커스 아우레우스 균주들에 의해 유발되는 질환으로부터 보호할 것임을 입증하는 강력한 증거를 제공한다.
본 발명이 그의 실시양태들을 참조하면서 구체적으로 제시되고 기재되어 있지만, 당업자는 하기 특허청구범위에 의해 포괄되는 본 발명의 범위를 벗어나지 않으면서 형태 및 세부사항에서의 다양한 변화가 본 발명 내에서 만들어질 수 있다는 것을 이해할 것이다.
SEQUENCE LISTING
<110> GLYCOVAXYN AG
<120> CAPSULAR GRAM-POSITIVE BACTERIA BIOCONJUGATE VACCINES
<130> P51971WO
<140> PCT/EP2011/057111
<141> 2011-05-04
<150> US 61/332,170
<151> 2010-05-06
<160> 27
<170> PatentIn version 3.5
<210> 1
<211> 13369
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 1
aattcacatg ttgcccatcc acgaaaccac cttatcgccg tggaacgcac ctggatcgac 60
agccccagca aagcagtcgc ttcctggtcc ggcaccggaa acatcgtacg gagaaaacaa 120
aaaaggccgc taggcggcct tttccggaga acgatgactc agggttctcg ccgcctctgg 180
cgatagatcc agtcgacgat ttcaccgtca ggcgcatagc cgctgacggt ttcccgcagc 240
aactggcgaa cccgcgagta gtcgtccttc tccacggcgg ccagcaactg ctccagcacg 300
accttgaagg cctcccagct caggtgttcc tcgttggccc gcatgatcat cggatggtcg 360
gtgggattca cgttgtcacc gatcagcagc tcttcgtaga gcttctcgcc aggacgcagg 420
ccactgaact cgatggcgat gtcaccatgg ggcgaacgct cggaacgcac gctcaggccg 480
gacaggtgga tcatcttctc ggcgagctcc aggatcttca ccggcggccc catgtccagc 540
acgaatacat ctccgccctg ccccatcgaa ccggcctgga tgaccaactg cgccgcctcg 600
ggaatggtca tgaagtaacg ggtgatgctc gggtgggtga ccgtcaccgg gccgccgcgc 660
ttgatctgct cgcggaacag cggaatgacc gaaccggacg aaccgaggac gttgccgaag 720
cggaccatgg tgaaacgggt cttgttgacg tgatgcacgt ccttccggtc gccgaacagc 780
accggcgccg attcgttgct gagcgcctga aggaccattt ccgccaggcg cttggtgctg 840
cccatcacat tggtcggccg caccgccttg tcggtggaaa tcagcacgaa gttctgcacg 900
ccgacctgca ccgcggcctg caccgcatgc aaggtgccta tcacgttgtt gagaacgccc 960
tcggcgatgt tgtgctcgac gatcggcaca tgcttgtagg ccgccgcatg gtagacggta 1020
ttgaccttcc aggtacgcat cacgtccacc aggcgctcgg gattgcgcac cgaaccgagg 1080
atcggcaaca ggttcaccga aagcgactcg cgcttgatcc gacgctccag ttcctgatgg 1140
atgctataga ggttgtattc gctgtgttcg aacaggatca gcacgctagg cgaacaactc 1200
atgatctgcc gacagagttc cgaaccgata gagccgcccg ccccggtcac catcaccacc 1260
tgaccgcgga tgcaccgttc cagcagctcc ttgcgcggtg cgacgctgtc gcgccccagc 1320
aggtcagcga tgtccacctc ctgcaggtca tccaccttga cccggccgct ggccaggtcc 1380
atgaagccgg gcatgctgcg cacgtgcagc gggaacggct ccagggactc gagaatctct 1440
cggcgccggg cccgagtggc ggaaggaatc gccaggagaa cctcctgcgc gcccgtctcg 1500
tcgatcatct ggcggatatg cttggcggta tagacccgca gaccggcaat gacccggttg 1560
gcgatctgct tgtcgtcatc gatgaacgcc accggacgca tcgcccgacc gagacgcaac 1620
gccgcaacca actggttgcc ggccgccccc gccccataga taaccaccct gggcaggcca 1680
tcctggcggt tgagaaatgg taccgactgc acagcagagt accagtcgcc catgaaatac 1740
tggcgcatgg ccagacgcaa gccgccgatc agcagcatgc tcaaccacca gtagttgaac 1800
accagggaac gcggcaccgg cgccggcgcg ccacgatacc agtacaccac cagcgacagc 1860
accagagccg agatggtcac cgccttggcg atggcgatca atgcgtcgtt accgagatag 1920
cgcatcaccg cgcgatacat gccgaagcga atgaatagtg gaatggcgat gaccggcgca 1980
gtgatgaaaa gccatgcatg ctcgccgaac acgtcgatca tatcgtctgt gcctagacgg 2040
accacaaaag cgagccacag agacagccat accagaagga tatccgtagc cacttgaagc 2100
aaacgtttcc agcgacgagg catggataac aactttactc ttaaacgatc tagcattccc 2160
ctactccttt aggcctgagc ggacgactct agcttacccg ccttgaacct cactgccaga 2220
aaaacgagag ggacgtaggc tatgacgatg cccatcaaag gctctagaga cccactcccg 2280
accaacaagg ctatagggag gagccagatg acgttcaatg ccgtgacgcc aatcgtaaca 2340
ggagcatgct ttccatagta tcggcttgcg tattgatagg catggcttcg atgagcctca 2400
tacaccttgt cccctctcag caagcgacga atcagggtat aggtcgcatc gacgatgaaa 2460
acgcctaaca ggaccaacca tgcccagaaa aaattcgtat tcatccacat ggcatgaatg 2520
gaaagaattc ctaaaacaat ccccagaaga ccactacccg catctcccat gaaaattttt 2580
gggggtggaa aattccagaa caagaatcca aaaacggcaa aagctagcga taaggggagc 2640
aaagcctgcg tcagttggcc attcagccag tataataatg ccccaccaac acagacaaaa 2700
atggcctgaa ggctagcaag tccatcgatc ccatccatga agttatagag attcagcaac 2760
cacacgagat agaaagcaaa gagaagtcct ccgaaccacc ccaggtccca actgacacca 2820
acaatctgaa atggtggtat gccattcaaa aagtacaatg agaccaaggc tgcactaaaa 2880
tgtcccagca gacgccagcg tgcggcgata tgaccgtgat catccatgaa tccaataatg 2940
gcaaccccgc cgccagcgag aagtaaagcc caggacacgg cccatgagat atttcccagt 3000
acagcccaaa taggcagcat gagacaaaaa gtaactacaa tggcgacccc tcctccgcgt 3060
ggagtgggaa cgacatggga acttcgagag ttaggggtgt caagtaagct cctcgctaag 3120
gcataacgac gcaagaggcc tgtaagcagt cccgaaaccc cagctgcagc gagtaacaaa 3180
taccattctt ccatttataa atttatcccc aaaaatactc tcaccccttc aacagggttc 3240
tattcgattg ttctgcgtgg tacgccatgc tagtagcaaa gcgcctgcag ataatcattc 3300
agtacgtttg acatatattc taccaacatc ttccaacgcg gaaagggtgc tcttgcgggg 3360
ttcccaacca agcaaaagcc tgcctttcga cgagtcgacc tctagtgagc agcataactg 3420
agtgtataac ccaccctttc ctactaattt aagaaacctc agaataaacc taggaacagg 3480
ccacatgatg gggcgacgcc ccattcccgc agcaagcgca gtcaccagtt gcttggtaga 3540
aatctcctga ccatcggata ccaaaaacag ttcgccggca gcagaagggt gcgtcataca 3600
gcaagctaga aagtcaacta aattatccag agaaacaaaa cttcgtcggt tatctatgca 3660
accaaatgga agaggaagtc ccgaagcaac cagcttcaac aatcgcgaga aatttccagg 3720
agctttccag tcgtaaacga gtggaggcct gacgataaca agttctgttg aggaatgctt 3780
gaaaagctcc cgaagcgcta cttcagcctc aaactttgaa atcgcatatt ctgcatgagg 3840
agccggcttg gagttctcat cgaagggctt ttctttggtt aaagcgccat ttacaccaat 3900
agaactaaca aaaatgaaac gctttacaga tgcttcgatc gcctgccgag caagcgccag 3960
agtagcatcg cgattcacct tccgaaaaat atctagtgaa tcacgctgcc ttccaaagat 4020
atgggctcgt ccagctagat gaactacaca ttcaacaccc cgcagcgcag catcaagctt 4080
agtgctctct ttcagctccg ctcgaacata ctcaaccccc gtaacgggat tgtacaggga 4140
tcgtacttgt ccgacaacct gaaagggggc ggcagcaagc gacctgcaaa gcgcactccc 4200
gacaaaaccg ctagccccgg ttaccagcac cttcatcata ttttcgactc agacagaagc 4260
ggtcgaacac aggcagcgaa tttttccaat gaaatatatt cagaataatt ttgctgaagg 4320
acactccgcg ggactccgcc taaactagac aagtcgagtt cacaaatctc atcgatcaat 4380
cttgccaaag caaccggatc attcggcgga cagttccaac cgattccggt ctcatctatt 4440
atacgggaga tttcagcccc tttttccatg acagctagaa tcggtttgtc tgctgccatg 4500
gagaaatatg ccttgctggg aaccccaagc ccgaacattc cttcttctaa ggtaactaag 4560
gcaacgtcac aggcagccaa accaaaattc ttttcggcta atggcagcct tccaaaatac 4620
ctcaaccgag cacactgatc ttccagcgcg tgttttttta cactgtcgac caaggcacca 4680
tctccaataa aagcaaaagc cgccttctcg tttttaacca actgaatagc agaaagtatg 4740
ttttctatac cttgtaatcg accgacatta ccaaaaaatt ggaaaaccct tttacctttc 4800
cattcaggaa tattgataaa aggagcatcc tctctcggta ctgggaaaac ctctttctca 4860
caggcccaat tcgaaataaa gaccaaagat cgcgggtcat tcaccttctc tttcataaga 4920
gcttccatat cgcgccctat tacgactaga cgatcagcgg atgagtaaat gaaagaaaag 4980
agacgacgta gaagccggta ggcaatacta tctttcttca gaacgcccgc cggcaccaag 5040
ttctcgggaa acacatcatg caccagcagc acccacttga aaccgagggc ataccttagc 5100
aagggaaacg tcatcagtag aagagcaggg ttggttccac tcaataccac atctcctcgt 5160
ctggcacgag aagtcaattt tactgagaac agaaacgcct gaaaaatctg cgccaatcct 5220
ctagaaagga gcctattctt attgctcctc ggaaacttaa agcattcttg ctcaacggaa 5280
ggtgaaacca caggcggggt ttcacctgcg gtcagcggga aaattacggt tagcccacca 5340
aactcccgct gcatctttcc tattatcttc tcccaatagt atcccgtgga gttctgattg 5400
gcaccgacat actcagaaac cacaaatatc cttgccatca actccacgcc tcaagttaat 5460
attttttcca gacagttcgc atgacatagt cccgatagct atgaactatg cgaacaatct 5520
tttcagaaac gttgggcatg ctatagtcag cgaccaagcg taacatgcgc tctgcgtcgc 5580
gcctctgtcc ctccaacacc tcgagtgctt gtagtactcg atccgaatcc agtccgacca 5640
tcatcaccac agcctcttcc atgccttctg ggcgttcatg agcctcacga atattcaaag 5700
cgggaaaatt cagtattgaa gactcctcac tgatggtccc actgtcagaa ataactgcct 5760
tggctgtaat ttgcagttta ttgtaatcct taaagccgag gggtttcagc agtttaatac 5820
cctcgtgaaa ctttgcctcc gtcgcctcaa ttctcttttt tgttctaggg tgagttgata 5880
cgatgacggg cagcgagtac ttttctgcca cagcgttgag catagaaacc aacttcaaga 5940
aattcttatc cgaatctatg ttttcctctc ggtgcgcact cacgacaaag aaccgctctg 6000
ttttcaaccc gagcctttca agaatatcgg aggactcgat cccgtcacga tagtgctcga 6060
gaacttcgaa catagggcta ccagtcttga taaccatgtc tggagaaagt ccttcacgca 6120
agagataatc acgcgcaatt gtactatagg tcaaatttac atcagctgta tgatcgacaa 6180
tgcgccgatt tatctcttca ggcacacgca tatcgaaaca gcgattgcct gcttccatat 6240
gaaaggtcgg tatcttacgc cgttttgcag gcagtaccgc catacaacta ttggtatcac 6300
ccagcacgag cagcgcatcg ggatctattt cgcccagaac acgatcgact gcgattatta 6360
cattccctat cgtttcagcc ccggaagacc cggcggcgtt tagaaaataa tccggctttc 6420
ttataccgag gtcctgaaaa aatatttcat taagttcgta atcataattc tgtccagtat 6480
ggacaagtac atgatcgcag tactgatcaa gcttcgccat gaccctagac aagcgaataa 6540
tctcaggacg agttccaaca accgtaacga cttttagctt ctgcattgtt atctcactat 6600
accttacgca ccttcgccta ctgaacaagc gtaggtatcc ggattttccc gatcaaatac 6660
ttcgttagcc cacaacatga ctaccatatc gtcagttccg acattagtaa tgtcatgagt 6720
ccatccaggt actgtttcga caatttctgc cttttcacca ttagtgcaaa tttcgtaaaa 6780
tgccccggtc aggatgtttc taaacttgaa acgtgccatc cctttgataa ccagaaactt 6840
ttcggttttc gagtgatggt aatgcccgcc cctggtaaca cctggatgag ccgtaaaaaa 6900
cgagaactgg ccagagtccg cggtcttcag catctcgacg aatgtgccac gcggatccga 6960
atgcattggc acgtcgtaac taaaactatc ttctggcaag aaacttagat aagtcgagta 7020
caaggcgcgc gtcaatcccg agccaaccct tgcggtagtc agtgactttc gactattacg 7080
aaactcatac aattgttctg cgagctcacc aacagaaatc tgatactggg gctcgacctg 7140
tagtgaaact gcattggata gcttcccatc catgactttc atgaaggtgc gaaccacatc 7200
atctatgtat acaagagtga tctctgccga ggaattgtta atttgaatcg gaatatctcg 7260
aataatatta tgacaaaaag tcgcaaccgc tgaattataa ttcggacgcg accatttacc 7320
gaatacatta ggaaggcgaa atatgtagac aggacaacca atatcctcac ctagcacttg 7380
gagatgctct tctgcggctc gcttgcttaa accgtactca ttatccacct cagcctgaat 7440
ggatgaagta taaagaagtg gtatggctcg tccattggac cttaccgcct cacacagagc 7500
atacgtgagt tcggaattcc cgatcttaaa ctcttctggt ttttccggac gattgacccc 7560
ggcaagatga aaaataaaat cgacggaacg aattagctca ggcaaattac caacactact 7620
ctcgcgggtg aatggcacca cctcgatacc accccgctct gcaagatgag cgcacagatt 7680
ccttccaaca aatccattcg cgccagttac aagaactttc atcgtttatt cctctggact 7740
ggcactctcg ccacgctgaa tagcacgaat gaaatccaac ttcagcaaca gctttttcat 7800
tccttcgata tccagacgtt tggtattatg agaattatag tcctctgtat gagtaatttt 7860
ttcctcgcct tgctccacaa acttactata gttcagatca cgcaaatctg gggggatacg 7920
ataatagtca cccatgtctt cagcacaggc catttcctct cgactaagaa gcgcctcata 7980
aagcttctct ccatgacgcg tacctattac attgatagga taaccattct tgccaagcaa 8040
ttgagtaagc gcatgagcca gcacctcgat ggttgcagcc ggtgctttct gtacaaaaag 8100
atctccattg gtaccatgct cgaaagcata aagcacaagg tctacggcat ccgtaagcgt 8160
catcatgaaa cgtgtcatgt ttggatcagt gattgtgaga ggctggcctg atcgcatttg 8220
ctcgataaag agaggaatga ccgagcccct tgaagccatg acgttaccat aacgggtgcc 8280
acaaattacg gtaggagtgc gttccaggtt tcgagacttg gcgaccatga ccttttccat 8340
catggccttt gaaataccca tggcattgat tgggtaaact gccttatccg tactcagaca 8400
aacgactttt ttgacgccat tctggatagc agattcgagg acattttccg ttccgatgac 8460
attggtcttc acagcctcca tcgggtagaa ctcacaagag ggaacctgtt tcaatgcagc 8520
cgcatggaaa atgtagtcca caccgcgagt agcattcaga gtgctttgat agtcgcggac 8580
atctccaata taaaacctca acttggggtg agcatagcac ttacgcatat catcttgctt 8640
cttctcatcc cgactgaata cacgtatttc accaatatct gtatccagaa aacgcttcaa 8700
aacggcattt ccaaaggaac cagttccacc ggtaattaac agaacagagt tcttatccat 8760
acaccacctc tttactaatg tgttcaacgt cccttttccg cctcaaaata taaagaaagc 8820
gaaaaacaac gagccagaac aatgcagccc ctaccggatg gaaaagccca ccgccgctaa 8880
agacataatt aacgaaccag attataaatg cagagcataa gaagcctaac tctgtacaag 8940
ctgtttttct tcgccggaag acaagcaaaa atacagagta gacaaaaagc aacaatagca 9000
aaagaacagc caagccacca aaaatgaaac catagatgca aagcagctcg acaataccat 9060
tgtgcgccat tggatattgc gcatacccta gaaccccccc tcccccaaaa acgcccgcgc 9120
ccaaaacaag tatctcgcta ccgtagaaag acaatgtttc caaaggcagt gcagttaccc 9180
gatcgaatat ggattcgaag aatggaacat cttgcgagac tgaggaatcg gaggtgagga 9240
gcccgacaat cagtcgatgc acggtttcca gactgccagc cccgaagtct gcaaggaaaa 9300
atacagataa acccagccct gcaagaagga aggtgaaaaa caagtatgtc tttttgatca 9360
gttttagcca ataggcaaag aataagacaa tgacgatatt ggccagagca gctttctgca 9420
gcgacagcat cgcccccaag caaagaagaa ggaaacatac cacgcgcgcc caacccttta 9480
gataaaagag tgaagcaagt gcgggaactc ccaccataac accatatgcg gtcaaacttc 9540
ctaccaatga tgcaaaacgg gcgcccccag cacgctcact ggcttcagcg aaccattcta 9600
taggtccaaa tacatactgc cagagaaaag aaagagccgc cagactgaag aaaaatgaaa 9660
taagttgcat gggcactttt agattatctc tggcaagaac catagcaaca aagagaagag 9720
gtaatgatgc ccacaacctg aaaatcccta tggaatagtc tccatataga tcgaaccata 9780
acaccgaaac gagcgaggca tacgtccaga agaaaataac aaatatacct aatgcgctat 9840
atttaatatc cctccagtta ttaataaata agagaaaaaa cagcccacaa aacccagcaa 9900
gaactaaata atacgcaccg gatagattcc ggagaatatg aaagagaaac acaaaaagga 9960
gaaccagagc aacgcttctc tgcttcatga gtaccaccca tctttgtttg ctttctcttt 10020
ggaaagtttc gactttctat cgagaacccc cttccgatag gatgaggcca aaacgagcct 10080
ataagcagct ctagagtaga gccatcgaat agagtccgtt ttctctagag aatgaataag 10140
aatatttgaa aactttgact ccagcgcaag acacagcact gctctgaata gactctgaaa 10200
cttgcttgac aaagcaaagc ccggctccat ccatcgtata ggaccaagag tctcaaggtc 10260
atcagttgtt gcaactttca tgaattccgg cattccgtca cgggcggcat gatagtactt 10320
gcgacagaac ttcgaaatac tgccttccgg ttcgacatgc tcgatttcag cccgacaagg 10380
aagaacagaa taaccaagct tgccaaccct taacccaaac tccgtatctt caaagccgta 10440
cccaacaaat cgctcatcaa aaagagcatt atcttggagc agaatatccc tctcagcgag 10500
catattcatg gtaacaatag ttttataccc caaggagttg ggcagcggct tgtcagcaga 10560
gaagtgacaa ctatccctat agcgatagta attactcgtc gacaccaatg agcaagaaaa 10620
tctgacacca ccgcaccaga taacgcgttc cccccttcga gagttagcag cgttcagaaa 10680
attcgagaga tgagcaggat ctggcacaca atcatcatca agaagcacta cgtagcgccc 10740
cttcgctaaa cgaacgcctt tatttcgttt tgcactagcc gaattcagct cggcctgctc 10800
aagacggacg ttgaagccct gaaccgcttc gaactcgcgg accacatcgg gtgtttcatc 10860
accactatta ctgtcgacaa caataacttc aaaatcctta aaagccagag actgcgctac 10920
aaggccggcc aggaccaatt ttagttcctt gggacgacgc caagtactaa cgacgacact 10980
caacaacatc aaagtcccct tttctctctc aacttaaccg tggccaggaa aaacattccc 11040
atccccaaag agacctctgt aacgaccagc gtccacgctc caaaaagctc atccccccaa 11100
agcgccaaga ggataaatgt taataccccg cccaattccg caaaaaaaat tgctcgcaaa 11160
tatacaccat catacccaga aggaacaaga gtcaaccctc catacagaac accaatacaa 11220
gcaaacactg gcactatcga aaacattctt attacaacag ttagacctct ggactgttcc 11280
gggaatagga gatatgaaat gtattcagaa aataagaaaa gaaataaaca actaggaata 11340
gctattagta acatcagacc tagcgctttc cttcttaaac tgccgactgc cgggtcggca 11400
ctcgcataca tcctgctaaa agtcggaaat agagcgctag ctatgggtga agtagcagcc 11460
gcgatcccgc gaaggaattt atccgcagta gaaagcactc cggccgcgga ggctccacca 11520
acaacaccaa ccgccgcaac gagcacttgc atgtgcaagc taagaaaagc cagagaaaga 11580
aaagatcgag caccgtcacg caatatatcg agaattctgt ctttctcgag aaccgggcgc 11640
caccgtattc ccatagaaaa taaaatacaa cagagagcac ttccacctat gacataggaa 11700
aaaccaaacc ccaacgaagc cagcacaagg tcagaatcct tcgtgacaaa aaaaacgacc 11760
aataggaaat aaaatacctt agacaaaaaa ttggtaagcg ccaaccatcc aaacagcgct 11820
cttccctgaa agaaccatac tgcttgaaga taatttccaa ctactgccgg aagagcagcc 11880
gcaaccaata caagcaaggg gattggtaaa atagaagata cagccaaaat ggccagcact 11940
aaaagtgaaa gcagcaacaa taagaatcta gcactctgta caacagaaaa gaaactagac 12000
agttcaactt tgttatcgat aatggcagcc tttcttgatc ctgccagaat aaatccaaag 12060
tctaccagtt gacatagaat gacagccacg gcctgggcaa tcaccaattg gccaaacgct 12120
tcgcttgaca atgttctcgt gagaaaagga atcgcagcaa gaggcaaaag atagttgctg 12180
cccatggata taccggagta gaaaacgccc cgccttattg acattctact cgataccccc 12240
taatacaatt caacaactac aacaagtaag ccctgatgcc agtaagtggc atcagggttt 12300
agatcaaaac ttagcgaaga gagccatcgc tacgaagctt ccttataaaa ccagcgagca 12360
ctgcgagtag aattccaatt atcaatcctg ccaaagtacc tatagtaact ataagaatct 12420
tcttcggctt aatgggttga tttgaaaaag agagtccctc gtcttccttg tagacagcca 12480
ccgcatcaga atccacagac aaactggagt tccaagatag tttctcttgg agagttctca 12540
actcaggaat gaatggagca tctacactac gcgactcaag attgttgatt tcagcgcgca 12600
gcgccttagc tcctcgcatg tacatcaagt caccatccat gatcgaggag agttgttgct 12660
cggacgcccc ttctattaat ggcgggccat ctatcttgag cgactccgca atcagcaatg 12720
cctccttcaa acgtgcaatt ctatcatcac ggcggccctt cgccatattc tgcagcacgg 12780
ttatgcggct ctgcattgca gcatttctta cctggaaatc tctacctgca ctatcaataa 12840
cctcatgcac ggcccgatcc gcagccaaac gcacgaaagc ttgtgcccat gtagcaagaa 12900
cctctcgctt cgtgccctcc acaattaccg tataacggtc tgcatctggc ttgttagcag 12960
gatcaatctt tacctctttg gagaacttct tataaaactc ctcctgctca tcttcgcttt 13020
ccgctccctc acccacctgg ggaaggtata tcttatagaa gaactctttt ttattctcat 13080
ccgaaagcag attgcgcgaa aagatcgcat agatacttct aacagtatat gcatctaggc 13140
cattctccct tctaccaaca ttgaaacctt cgatagaccc aagagcagga ggcactactg 13200
caaccctata ttcatataca ggcttactca gatacgcata ggtaaaagac ccgattaatg 13260
caagaagagt agtcagaaga atcagaacct tgttaaccca aagctccttg accagcttca 13320
ccaggtcaac ctcaccatca gccgtcatca aagaagaatt gcctcaggg 13369
<210> 2
<211> 15244
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 2
aattcacatg ttgcccatcc acgaaaccac cttatcgccg tggaacgcac ctggatcgac 60
agccccagca aagcagtcgc ttcctggtcc ggcaccggaa acatcgtacg gagaaaacaa 120
aaaaggccgc taggcggcct tttccggaga acgatgactc agggttctcg ccgcctctgg 180
cgatagatcc agtcgacgat ttcaccgtca ggcgcatagc cgctgacggt ttcccgcagc 240
aactggcgaa cccgcgagta gtcgtccttc tccacggcgg ccagcaactg ctccagcacg 300
accttgaagg cctcccagct caggtgttcc tcgttggccc gcatgatcat cggatggtcg 360
gtgggattca cgttgtcacc gatcagcagc tcttcgtaga gcttctcgcc aggacgcagg 420
ccactgaact cgatggcgat gtcaccatgg ggcgaacgct cggaacgcac gctcaggccg 480
gacaggtgga tcatcttctc ggcgagctcc aggatcttca ccggcggccc catgtccagc 540
acgaatacat ctccgccctg ccccatcgaa ccggcctgga tgaccaactg cgccgcctcg 600
ggaatggtca tgaagtaacg ggtgatgctc gggtgggtga ccgtcaccgg gccgccgcgc 660
ttgatctgct cgcggaacag cggaatgacc gaaccggacg aaccgaggac gttgccgaag 720
cggaccatgg tgaaacgggt cttgttgacg tgatgcacgt ccttccggtc gccgaacagc 780
accggcgccg attcgttgct gagcgcctga aggaccattt ccgccaggcg cttggtgctg 840
cccatcacat tggtcggccg caccgccttg tcggtggaaa tcagcacgaa gttctgcacg 900
ccgacctgca ccgcggcctg caccgcatgc aaggtgccta tcacgttgtt gagaacgccc 960
tcggcgatgt tgtgctcgac gatcggcaca tgcttgtagg ccgccgcatg gtagacggta 1020
ttgaccttcc aggtacgcat cacgtccacc aggcgctcgg gattgcgcac cgaaccgagg 1080
atcggcaaca ggttcaccga aagcgactcg cgcttgatcc gacgctccag ttcctgatgg 1140
atgctataga ggttgtattc gctgtgttcg aacaggatca gcacgctagg cgaacaactc 1200
atgatctgcc gacagagttc cgaaccgata gagccgcccg ccccggtcac catcaccacc 1260
tgaccgcgga tgcaccgttc cagcagctcc ttgcgcggtg cgacgctgtc gcgccccagc 1320
aggtcagcga tgtccacctc ctgcaggtca tccaccttga cccggccgct ggccaggtcc 1380
atgaagccgg gcatgctgcg cacgtgcagc gggaacggct ccagggactc gagaatctct 1440
cggcgccggg cccgagtggc ggaaggaatc gccaggagaa cctcctgcgc gcccgtctcg 1500
tcgatcatct ggcggatatg cttggcggta tagacccgca gaccggcaat gacccggttg 1560
gcgatctgct tgtcgtcatc gatgaacgcc accggacgca tcgcccgacc gagacgcaac 1620
gccgcaacca actggttgcc ggccgccccc gccccataga taaccaccct gggcaggcca 1680
tcctggcggt tgagaaatgg taccgactgc acagcagagt accagtcgcc catgaaatac 1740
tggcgcatgg ccagacgcaa gccgccgatc agcagcatgc tcaaccacca gtagttgaac 1800
accagggaac gcggcaccgg cgccggcgcg ccacgatacc agtacaccac cagcgacagc 1860
accagagccg agatggtcac cgccttggcg atggcgatca atgcgtcgtt accgagatag 1920
cgcatcaccg cgcgatacat gccgaagcga atgaatagtg gaatggcgat gaccggcgca 1980
gtgatgaaaa gccatgcatg ctcgccgaac acgtcgatca tatcgtctgt gcctagacgg 2040
accacaaaag cgagccacag agacagccat accagaagga tatccgtagc cacttgaagc 2100
aaacgtttcc agcgacgagg catggataac aactttactc ttaaacgatc tagcattccc 2160
ctactccttt aggcctgagc ggacgactct agcttacccg ccttgaacct cactgccaga 2220
aaaacgagag ggacgtaggc tatgacgatg cccatcaaag gctctagaga cccactcccg 2280
accaacaagg ctatagggag gagccagatg acgttcaatg ccgtgacgcc aatcgtaaca 2340
ggagcatgct ttccatagta tcggcttgcg tattgatagg catggcttcg atgagcctca 2400
tacaccttgt cccctctcag caagcgacga atcagggtat aggtcgcatc gacgatgaaa 2460
acgcctaaca ggaccaacca tgcccagaaa aaattcgtat tcatccacat ggcatgaatg 2520
gaaagaattc ctaaaacaat ccccagaaga ccactacccg catctcccat gaaaattttt 2580
gggggtggaa aattccagaa caagaatcca aaaacggcaa aagctagcga taaggggagc 2640
aaagcctgcg tcagttggcc attcagccag tataataatg ccccaccaac acagacaaaa 2700
atggcctgaa ggctagcaag tccatcgatc ccatccatga agttatagag attcagcaac 2760
cacacgagat agaaagcaaa gagaagtcct ccgaaccacc ccaggtccca actgacacca 2820
acaatctgaa atggtggtat gccattcaaa aagtacaatg agaccaaggc tgcactaaaa 2880
tgtcccagca gacgccagcg tgcggcgata tgaccgtgat catccatgaa tccaataatg 2940
gcaaccccgc cgccagcgag aagtaaagcc caggacacgg cccatgagat atttcccagt 3000
acagcccaaa taggcagcat gagacaaaaa gtaactacaa tggcgacccc tcctccgcgt 3060
ggagtgggaa cgacatggga acttcgagag ttaggggtgt caagtaagct cctcgctaag 3120
gcataacgac gcaagaggcc tgtaagcagt cccgaaaccc cagctgcagc gagtaacaaa 3180
taccattctt ccatttataa atttatcccc aaaaatactc tcaccccttc aacagggttc 3240
tattcgattg ttctgcgtgg tacgccatgc tagtagcaaa gcgcctgcag ataatcattc 3300
agtacgtttg acatatattc taccaacatc ttccaacgcg gaaagggtgc tcttgcgggg 3360
ttcccaacca agcaaaagcc tgcctttcga cgagtcgacc tctagtgagc agcataactg 3420
agtgtataac ccaccctttc ctactaattt aagaaacctc agaataaacc taggaacagg 3480
ccacatgatg gggcgacgcc ccattcccgc agcaagcgca gtcaccagtt gcttggtaga 3540
aatctcctga ccatcggata ccaaaaacag ttcgccggca gcagaagggt gcgtcataca 3600
gcaagctaga aagtcaacta aattatccag agaaacaaaa cttcgtcggt tatctatgca 3660
accaaatgga agaggaagtc ccgaagcaac cagcttcaac aatcgcgaga aatttccagg 3720
agctttccag tcgtaaacga gtggaggcct gacgataaca agttctgttg aggaatgctt 3780
gaaaagctcc cgaagcgcta cttcagcctc aaactttgaa atcgcatatt ctgcatgagg 3840
agccggcttg gagttctcat cgaagggctt ttctttggtt aaagcgccat ttacaccaat 3900
agaactaaca aaaatgaaac gctttacaga tgcttcgatc gcctgccgag caagcgccag 3960
agtagcatcg cgattcacct tccgaaaaat atctagtgaa tcacgctgcc ttccaaagat 4020
atgggctcgt ccagctagat gaactacaca ttcaacaccc cgcagcgcag catcaagctt 4080
agtgctctct ttcagctccg ctcgaacata ctcaaccccc gtaacgggat tgtacaggga 4140
tcgtacttgt ccgacaacct gaaagggggc ggcagcaagc gacctgcaaa gcgcactccc 4200
gacaaaaccg ctagccccgg ttaccagcac cttcatcata ttttcgactc agacagaagc 4260
ggtcgaacac aggcagcgaa tttttccaat gaaatatatt cagaataatt ttgctgaagg 4320
acactccgcg ggactccgcc taaactagac aagtcgagtt cacaaatctc atcgatcaat 4380
cttgccaaag caaccggatc attcggcgga cagttccaac cgattccggt ctcatctatt 4440
atacgggaga tttcagcccc tttttccatg acagctagaa tcggtttgtc tgctgccatg 4500
gagaaatatg ccttgctggg aaccccaagc ccgaacattc cttcttctaa ggtaactaag 4560
gcaacgtcac aggcagccaa accaaaattc ttttcggcta atggcagcct tccaaaatac 4620
ctcaaccgag cacactgatc ttccagcgcg tgttttttta cactgtcgac caaggcacca 4680
tctccaataa aagcaaaagc cgccttctcg tttttaacca actgaatagc agaaagtatg 4740
ttttctatac cttgtaatcg accgacatta ccaaaaaatt ggaaaaccct tttacctttc 4800
cattcaggaa tattgataaa aggagcatcc tctctcggta ctgggaaaac ctctttctca 4860
caggcccaat tcgaaataaa gaccaaagat cgcgggtcat tcaccttctc tttcataaga 4920
gcttccatat cgcgccctat tacgactaga cgatcagcgg atgagtaaat gaaagaaaag 4980
agacgacgta gaagccggta ggcaatacta tctttcttca gaacgcccgc cggcaccaag 5040
ttctcgggaa acacatcatg caccagcagc acccacttga aaccgagggc ataccttagc 5100
aagggaaacg tcatcagtag aagagcaggg ttggttccac tcaataccac atctcctcgt 5160
ctggcacgag aagtcaattt tactgagaac agaaacgcct gaaaaatctg cgccaatcct 5220
ctagaaagga gcctattctt attgctcctc ggaaacttaa agcattcttg ctcaacggaa 5280
ggtgaaacca caggcggggt ttcacctgcg gtcagcggga aaattacggt tagcccacca 5340
aactcccgct gcatctttcc tattatcttc tcccaatagt atcccgtgga gttctgattg 5400
gcaccgacat actcagaaac cacaaatatc cttgccatca actccacgcc tcaagttaat 5460
attttttcca gacagttcgc atgacatagt cccgatagct atgaactatg cgaacaatct 5520
tttcagaaac gttgggcatg ctatagtcag cgaccaagcg taacatgcgc tctgcgtcgc 5580
gcctctgtcc ctccaacacc tcgagtgctt gtagtactcg atccgaatcc agtccgacca 5640
tcatcaccac agcctcttcc atgccttctg ggcgttcatg agcctcacga atattcaaag 5700
cgggaaaatt cagtattgaa gactcctcac tgatggtccc actgtcagaa ataactgcct 5760
tggctgtaat ttgcagttta ttgtaatcct taaagccgag gggtttcagc agtttaatac 5820
cctcgtgaaa ctttgcctcc gtcgcctcaa ttctcttttt tgttctaggg tgagttgata 5880
cgatgacggg cagcgagtac ttttctgcca cagcgttgag catagaaacc aacttcaaga 5940
aattcttatc cgaatctatg ttttcctctc ggtgcgcact cacgacaaag aaccgctctg 6000
ttttcaaccc gagcctttca agaatatcgg aggactcgat cccgtcacga tagtgctcga 6060
gaacttcgaa catagggcta ccagtcttga taaccatgtc tggagaaagt ccttcacgca 6120
agagataatc acgcgcaatt gtactatagg tcaaatttac atcagctgta tgatcgacaa 6180
tgcgccgatt tatctcttca ggcacacgca tatcgaaaca gcgattgcct gcttccatat 6240
gaaaggtcgg tatcttacgc cgttttgcag gcagtaccgc catacaacta ttggtatcac 6300
ccagcacgag cagcgcatcg ggatctattt cgcccagaac acgatcgact gcgattatta 6360
cattccctat cgtttcagcc ccggaagacc cggcggcgtt tagaaaataa tccggctttc 6420
ttataccgag gtcctgaaaa aatatttcat taagttcgta atcataattc tgtccagtat 6480
ggacaagtac atgatcgcag tactgatcaa gcttcgccat gaccctagac aagcgaataa 6540
tctcaggacg agttccaaca accgtaacga cttttagctt ctgcattgtt atctcactat 6600
accttacgca ccttcgccta ctgaacaagc gtaggtatcc ggattttccc gatcaaatac 6660
ttcgttagcc cacaacatga ctaccatatc gtcagttccg acattagtaa tgtcatgagt 6720
ccatccaggt actgtttcga caatttctgc cttttcacca ttagtgcaaa tttcgtaaaa 6780
tgccccggtc aggatgtttc taaacttgaa acgtgccatc cctttgataa ccagaaactt 6840
ttcggttttc gagtgatggt aatgcccgcc cctggtaaca cctggatgag ccgtaaaaaa 6900
cgagaactgg ccagagtccg cggtcttcag catctcgacg aatgtgccac gcggatccga 6960
atgcattggc acgtcgtaac taaaactatc ttctggcaag aaacttagat aagtcgagta 7020
caaggcgcgc gtcaatcccg agccaaccct tgcggtagtc agtgactttc gactattacg 7080
aaactcatac aattgttctg cgagctcacc aacagaaatc tgatactggg gctcgacctg 7140
tagtgaaact gcattggata gcttcccatc catgactttc atgaaggtgc gaaccacatc 7200
atctatgtat acaagagtga tctctgccga ggaattgtta atttgaatcg gaatatctcg 7260
aataatatta tgacaaaaag tcgcaaccgc tgaattataa ttcggacgcg accatttacc 7320
gaatacatta ggaaggcgaa atatgtagac aggacaacca atatcctcac ctagcacttg 7380
gagatgctct tctgcggctc gcttgcttaa accgtactca ttatccacct cagcctgaat 7440
ggatgaagta taaagaagtg gtatggctcg tccattggac cttaccgcct cacacagagc 7500
atacgtgagt tcggaattcc cgatcttaaa ctcttctggt ttttccggac gattgacccc 7560
ggcaagatga aaaataaaat cgacggaacg aattagctca ggcaaattac caacactact 7620
ctcgcgggtg aatggcacca cctcgatacc accccgctct gcaagatgag cgcacagatt 7680
ccttccaaca aatccattcg cgccagttac aagaactttc atcgtttatt cctctggact 7740
ggcactctcg ccacgctgaa tagcacgaat gaaatccaac ttcagcaaca gctttttcat 7800
tccttcgata tccagacgtt tggtattatg agaattatag tcctctgtat gagtaatttt 7860
ttcctcgcct tgctccacaa acttactata gttcagatca cgcaaatctg gggggatacg 7920
ataatagtca cccatgtctt cagcacaggc catttcctct cgactaagaa gcgcctcata 7980
aagcttctct ccatgacgcg tacctattac attgatagga taaccattct tgccaagcaa 8040
ttgagtaagc gcatgagcca gcacctcgat ggttgcagcc ggtgctttct gtacaaaaag 8100
atctccattg gtaccatgct cgaaagcata aagcacaagg tctacggcat ccgtaagcgt 8160
catcatgaaa cgtgtcatgt ttggatcagt gattgtgaga ggctggcctg atcgcatttg 8220
ctcgataaag agaggaatga ccgagcccct tgaagccatg acgttaccat aacgggtgcc 8280
acaaattacg gtaggagtgc gttccaggtt tcgagacttg gcgaccatga ccttttccat 8340
catggccttt gaaataccca tggcattgat tgggtaaact gccttatccg tactcagaca 8400
aacgactttt ttgacgccat tctggatagc agattcgagg acattttccg ttccgatgac 8460
attggtcttc acagcctcca tcgggtagaa ctcacaagag ggaacctgtt tcaatgcagc 8520
cgcatggaaa atgtagtcca caccgcgagt agcattcaga gtgctttgat agtcgcggac 8580
atctccaata taaaacctca acttggggtg agcatagcac ttacgcatat catcttgctt 8640
cttctcatcc cgactgaata cacgtatttc accaatatct gtatccagaa aacgcttcaa 8700
aacggcattt ccaaaggaac cagttccacc ggtaattaac agaacagagt tcttatccat 8760
acaccacctc tttacgtgta ggctggagct gcttcgaagt tcctatactt tctagagaat 8820
aggaacttcg gaataggaac ttcatttaaa tggcgcgcct tacgccccgc cctgccactc 8880
atcgcagtac tgttgtattc attaagcatc tgccgacatg gaagccatca caaacggcat 8940
gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca 9000
tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga 9060
aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat 9120
aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga 9180
aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 9240
tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgta 9300
attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 9360
gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg gtctggttat 9420
aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc cattgggata 9480
tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta gctcctgaaa 9540
atctcgacaa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg tgaaagttgg 9600
aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg 9660
tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc acaggtaggc 9720
gcgccgaagt tcctatactt tctagagaat aggaacttcg gaataggaac taaggaggat 9780
attcatatgg tgcacggaag tttaaactta tttatcatca tcatctttat aatcaccatg 9840
atgacgccgt ccttttgtaa taaaatagaa caacacaaac caaaattcac ttacaactaa 9900
ataatttgaa ctaaacatta ataatgtgat tggatagatt gctataaaca taacgagtaa 9960
atctatagtg tttggatcat agttcctaat cattttataa actagtagca aaatgcaaat 10020
cattatgata aaaaacccta ataagccaaa tgatagaatc aactcaataa tgatgttatg 10080
tggtatattt ccgattagtt tataatagtt aaatggccca tagcctaata acggactttg 10140
ttgaataaag taaatacctt tttcataaat cggtcctctt ccagaagtac cttctaaatt 10200
aagtgttcca ccttgtagat atgaaaatgt tctagtattc gaaccttttg taaaaagaaa 10260
gtaaatcaat acactagata tgcttaatgc aaaaatatac ataatgcttt ttactgcaat 10320
aggtattcct cttttaaacg taataagtat aaatgcaaat aagccgtaaa gaattaataa 10380
aatagcacct ccacgccctc ctggtataaa cacaataggg atatcaatta ttgtaaatag 10440
aacatatatc cacttatgtt tcactgaacc tttcataatg aaataaatgc ctaatccggc 10500
agtaaatgct gaaaggtacg aagcgttttg atagttcata agtccaaaat tgatatagct 10560
aggtatctca cctgtaagtt ttggtattaa aattacaaaa ataaatgaaa tagaaaatat 10620
gaaaaatact aatttaaaaa atctttctac cgtagccttg tttatatatt taatataaat 10680
accactaatt gccgctggaa ctgcccatgt taaaaagaat agaatattat ttttagctag 10740
tttctcttcc ttatctggtg aaaaataata aaaagctaga taaagcaaac atatagcaat 10800
taataatatt aaccctcgcg gaatttcttg cgtgacaatt atcttataaa tagcaaacac 10860
cgtagtaatt aatgctatac caaccatggt tgagtaatac accggctcta tagggaaccc 10920
taatacttct ttagtaaatg tagagattac tataaatatg ttcatgctga taattgcaca 10980
aagtacaaaa aatttcatag ttcctcctgc tagaggatcc ccgggtcctt acagatcctc 11040
ttctgagatg agtttttgtt caaatttata taattctact aatcgttcac tttctatttg 11100
ccaattcaaa attttagacg ccttaattgc attttgacgt aaatgattaa acaaatcgtg 11160
attatctctt aattttctaa ccgccttttc aatttctaac ggcgtaactt cctttaaaac 11220
aatgccaaat ttatattttt cattgagata aatatgctct ttgacaggag ataaaattac 11280
tggtaaacca gcatgtatac attcaaaaat tttattagat actgtatatt caaaattaat 11340
agatacaggt ttcgtcaaga taacaccaac attactttct gctaacttat caaccaattc 11400
ttttacttca actggtttat ccaacctaat attttccgag ttataactaa tcagttcttt 11460
tatcacttct tcatgcggac caaaccctcg aattatgaat gaaggagcat tttgtttaaa 11520
agctgatgaa gcaataataa actcttcata tcctctgtcc attacaattt gaccttgata 11580
tacgatttct ttaaagtttt cgatttcttt aaattctctg ctatcattta aaataggtgc 11640
attcgtaata acattcgctt ccttcttata tcctttagat tgataatatt cttttgctgc 11700
atgacttact gttacgaagg cattaacacg atgttttact atgtgttttt ctatactttc 11760
tacaaacttt gaaataagtg gaactttatt aataaaggca tttttcgcat atatttcatg 11820
cgcatcataa acaatattag cttttttata attgcttaaa tagaccatta ataatacgtc 11880
gaaatcattt gcatgaatca cgtcaggttt aaaagcttta atttctcgga taacacctgt 11940
tgcaaatctt atacgcttaa ttaatttaga aagaatattt ttgggatcta ccttgctacc 12000
taacaaacga taattacaat ctaaattttc caatcgccta ttagtagctt gtgaattatt 12060
cattccaaca attttataat cattcgtaac gcctttaatt gtttctattt gtttaagtac 12120
ccttgggtct tgaacaatat tactcgatac aatatttaaa attctcattg tacacctcct 12180
gctcattgta cacctcctgt tacgcataat ccggcacatc atacggataa ctagtatcct 12240
ttttatttaa atattcaacc gaaaatcctt ttagtttgtc aggcgttttc tcccaccact 12300
tgctttccaa aagtttttca attgttttat tgtcaaatcg cttcttaatc acttttgcag 12360
gaaccccacc aacaacctca tatgctccta catttttagt aacaactgag ccggctgcta 12420
tgactgcacc agtatttatt gttaatccat ccataataat tacatttgca ccaatccaca 12480
catcattttt aattgttgta cggcttggtt ggtcattaaa gtctataaac ttttgcttta 12540
tgttaaatgg attattatta gaataaaaaa tcggtgatga gctaaaaaag tgtgtaggat 12600
gttttcctaa cccaattttt acatccgaag atatcgaaca atatcttcct acttctacat 12660
tattaaaatc actaccaaat ccaatataac tgtattcacc aatgtgagaa ttcctgattt 12720
tacaccatct atctatatag ttattgccat caaattttga gtttgtaata tacgccaagc 12780
gatgaatctt aacattcgat tctttagagg actggttttt cagcaaacca attatctttt 12840
caatcgctat cctcatctta agatcaaagt ccccttttct ctctcaactt aaccgtggcc 12900
aggaaaaaca ttcccatccc caaagagacc tctgtaacga ccagcgtcca cgctccaaaa 12960
agctcatccc cccaaagcgc caagaggata aatgttaata ccccgcccaa ttccgcaaaa 13020
aaaattgctc gcaaatatac accatcatac ccagaaggaa caagagtcaa ccctccatac 13080
agaacaccaa tacaagcaaa cactggcact atcgaaaaca ttcttattac aacagttaga 13140
cctctggact gttccgggaa taggagatat gaaatgtatt cagaaaataa gaaaagaaat 13200
aaacaactag gaatagctat tagtaacatc agacctagcg ctttccttct taaactgccg 13260
actgccgggt cggcactcgc atacatcctg ctaaaagtcg gaaatagagc gctagctatg 13320
ggtgaagtag cagccgcgat cccgcgaagg aatttatccg cagtagaaag cactccggcc 13380
gcggaggctc caccaacaac accaaccgcc gcaacgagca cttgcatgtg caagctaaga 13440
aaagccagag aaagaaaaga tcgagcaccg tcacgcaata tatcgagaat tctgtctttc 13500
tcgagaaccg ggcgccaccg tattcccata gaaaataaaa tacaacagag agcacttcca 13560
cctatgacat aggaaaaacc aaaccccaac gaagccagca caaggtcaga atccttcgtg 13620
acaaaaaaaa cgaccaatag gaaataaaat accttagaca aaaaattggt aagcgccaac 13680
catccaaaca gcgctcttcc ctgaaagaac catactgctt gaagataatt tccaactact 13740
gccggaagag cagccgcaac caatacaagc aaggggattg gtaaaataga agatacagcc 13800
aaaatggcca gcactaaaag tgaaagcagc aacaataaga atctagcact ctgtacaaca 13860
gaaaagaaac tagacagttc aactttgtta tcgataatgg cagcctttct tgatcctgcc 13920
agaataaatc caaagtctac cagttgacat agaatgacag ccacggcctg ggcaatcacc 13980
aattggccaa acgcttcgct tgacaatgtt ctcgtgagaa aaggaatcgc agcaagaggc 14040
aaaagatagt tgctgcccat ggatataccg gagtagaaaa cgccccgcct tattgacatt 14100
ctactcgata ccccctaata caattcaaca actacaacaa gtaagccctg atgccagtaa 14160
gtggcatcag ggtttagatc aaaacttagc gaagagagcc atcgctacga agcttcctta 14220
taaaaccagc gagcactgcg agtagaattc caattatcaa tcctgccaaa gtacctatag 14280
taactataag aatcttcttc ggcttaatgg gttgatttga aaaagagagt ccctcgtctt 14340
ccttgtagac agccaccgca tcagaatcca cagacaaact ggagttccaa gatagtttct 14400
cttggagagt tctcaactca ggaatgaatg gagcatctac actacgcgac tcaagattgt 14460
tgatttcagc gcgcagcgcc ttagctcctc gcatgtacat caagtcacca tccatgatcg 14520
aggagagttg ttgctcggac gccccttcta ttaatggcgg gccatctatc ttgagcgact 14580
ccgcaatcag caatgcctcc ttcaaacgtg caattctatc atcacggcgg cccttcgcca 14640
tattctgcag cacggttatg cggctctgca ttgcagcatt tcttacctgg aaatctctac 14700
ctgcactatc aataacctca tgcacggccc gatccgcagc caaacgcacg aaagcttgtg 14760
cccatgtagc aagaacctct cgcttcgtgc cctccacaat taccgtataa cggtctgcat 14820
ctggcttgtt agcaggatca atctttacct ctttggagaa cttcttataa aactcctcct 14880
gctcatcttc gctttccgct ccctcaccca cctggggaag gtatatctta tagaagaact 14940
cttttttatt ctcatccgaa agcagattgc gcgaaaagat cgcatagata cttctaacag 15000
tatatgcatc taggccattc tcccttctac caacattgaa accttcgata gacccaagag 15060
caggaggcac tactgcaacc ctatattcat atacaggctt actcagatac gcataggtaa 15120
aagacccgat taatgcaaga agagtagtca gaagaatcag aaccttgtta acccaaagct 15180
ccttgaccag cttcaccagg tcaacctcac catcagccgt catcaaagaa gaattgcctc 15240
aggg 15244
<210> 3
<211> 16483
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 3
tcacatgttg cccatccacg aaaccacctt atcgccgtgg aacgcacctg gatcgacagc 60
cccagcaaag cagtcgcttc ctggtccggc accggaaaca tcgtacggag aaaacaaaaa 120
aggccgctag gcggcctttt ccggagaacg atgactcagg gttctcgccg cctctggcga 180
tagatccagt cgacgatttc accgtcaggc gcatagccgc tgacggtttc ccgcagcaac 240
tggcgaaccc gcgagtagtc gtccttctcc acggcggcca gcaactgctc cagcacgacc 300
ttgaaggcct cccagctcag gtgttcctcg ttggcccgca tgatcatcgg atggtcggtg 360
ggattcacgt tgtcaccgat cagcagctct tcgtagagct tctcgccagg acgcaggcca 420
ctgaactcga tggcgatgtc accatggggc gaacgctcgg aacgcacgct caggccggac 480
aggtggatca tcttctcggc gagctccagg atcttcaccg gcggccccat gtccagcacg 540
aatacatctc cgccctgccc catcgaaccg gcctggatga ccaactgcgc cgcctcggga 600
atggtcatga agtaacgggt gatgctcggg tgggtgaccg tcaccgggcc gccgcgcttg 660
atctgctcgc ggaacagcgg aatgaccgaa ccggacgaac cgaggacgtt gccgaagcgg 720
accatggtga aacgggtctt gttgacgtga tgcacgtcct tccggtcgcc gaacagcacc 780
ggcgccgatt cgttgctgag cgcctgaagg accatttccg ccaggcgctt ggtgctgccc 840
atcacattgg tcggccgcac cgccttgtcg gtggaaatca gcacgaagtt ctgcacgccg 900
acctgcaccg cggcctgcac cgcatgcaag gtgcctatca cgttgttgag aacgccctcg 960
gcgatgttgt gctcgacgat cggcacatgc ttgtaggccg ccgcatggta gacggtattg 1020
accttccagg tacgcatcac gtccaccagg cgctcgggat tgcgcaccga accgaggatc 1080
ggcaacaggt tcaccgaaag cgactcgcgc ttgatccgac gctccagttc ctgatggatg 1140
ctatagaggt tgtattcgct gtgttcgaac aggatcagca cgctaggcga acaactcatg 1200
atctgccgac agagttccga accgatagag ccgcccgccc cggtcaccat caccacctga 1260
ccgcggatgc accgttccag cagctccttg cgcggtgcga cgctgtcgcg ccccagcagg 1320
tcagcgatgt ccacctcctg caggtcatcc accttgaccc ggccgctggc caggtccatg 1380
aagccgggca tgctgcgcac gtgcagcggg aacggctcca gggactcgag aatctctcgg 1440
cgccgggccc gagtggcgga aggaatcgcc aggagaacct cctgcgcgcc cgtctcgtcg 1500
atcatctggc ggatatgctt ggcggtatag acccgcagac cggcaatgac ccggttggcg 1560
atctgcttgt cgtcatcgat gaacgccacc ggacgcatcg cccgaccgag acgcaacgcc 1620
gcaaccaact ggttgccggc cgcccccgcc ccatagataa ccaccctggg caggccatcc 1680
tggcggttga gaaatggtac cgactgcaca gcagagtacc agtcgcccat gaaatactgg 1740
cgcatggcca gacgcaagcc gccgatcagc agcatgctca accaccagta gttgaacacc 1800
agggaacgcg gcaccggcgc cggcgcgcca cgataccagt acaccaccag cgacagcacc 1860
agagccgaga tggtcaccgc cttggcgatg gcgatcaatg cgtcgttacc gagatagcgc 1920
atcaccgcgc gatacatgcc gaagcgaatg aatagtggaa tggcgatgac cggcgcagtg 1980
atgaaaagcc atgcatgctc gccgaacacg tcgatcatat cgtctgtgcc tagacggacc 2040
acaaaagcga gccacagaga cagccatacc agaaggatat ccgtagccac ttgaagcaaa 2100
cgtttccagc gacgaggcat ggataacaac tttactctta aacgatctag cattccccta 2160
ctcctttagg cctgagcgga cgactctagc ttacccgcct tgaacctcac tgccagaaaa 2220
acgagaggga cgtaggctat gacgatgccc atcaaaggct ctagagaccc actcccgacc 2280
aacaaggcta tagggaggag ccagatgacg ttcaatgccg tgacgccaat cgtaacagga 2340
gcatgctttc catagtatcg gcttgcgtat tgataggcat ggcttcgatg agcctcatac 2400
accttgtccc ctctcagcaa gcgacgaatc agggtatagg tcgcatcgac gatgaaaacg 2460
cctaacagga ccaaccatgc ccagaaaaaa ttcgtattca tccacatggc atgaatggaa 2520
agaattccta aaacaatccc cagaagacca ctacccgcat ctcccatgaa aatttttggg 2580
ggtggaaaat tccagaacaa gaatccaaaa acggcaaaag ctagcgataa ggggagcaaa 2640
gcctgcgtca gttggccatt cagccagtat aataatgccc caccaacaca gacaaaaatg 2700
gcctgaaggc tagcaagtcc atcgatccca tccatgaagt tatagagatt cagcaaccac 2760
acgagataga aagcaaagag aagtcctccg aaccacccca ggtcccaact gacaccaaca 2820
atctgaaatg gtggtatgcc attcaaaaag tacaatgaga ccaaggctgc actaaaatgt 2880
cccagcagac gccagcgtgc ggcgatatga ccgtgatcat ccatgaatcc aataatggca 2940
accccgccgc cagcgagaag taaagcccag gacacggccc atgagatatt tcccagtaca 3000
gcccaaatag gcagcatgag acaaaaagta actacaatgg cgacccctcc tccgcgtgga 3060
gtgggaacga catgggaact tcgagagtta ggggtgtcaa gtaagctcct cgctaaggca 3120
taacgacgca agaggcctgt aagcagtccc gaaaccccag ctgcagcgag taacaaatac 3180
cattcttcca tttataaatt tatccccaaa aatactctca ccccttcaac agggttctat 3240
tcgattgttc tgcgtggtac gccatgctag tagcaaagcg cctgcagata atcattcagt 3300
acgtttgaca tatattctac caacatcttc caacgcggaa agggtgctct tgcggggttc 3360
ccaaccaagc aaaagcctgc ctttcgacga gtcgacctct agtgagcagc ataactgagt 3420
gtataaccca ccctttccta ctaatttaag aaacctcaga ataaacctag gaacaggcca 3480
catgatgggg cgacgcccca ttcccgcagc aagcgcagtc accagttgct tggtagaaat 3540
ctcctgacca tcggatacca aaaacagttc gccggcagca gaagggtgcg tcatacagca 3600
agctagaaag tcaactaaat tatccagaga aacaaaactt cgtcggttat ctatgcaacc 3660
aaatggaaga ggaagtcccg aagcaaccag cttcaacaat cgcgagaaat ttccaggagc 3720
tttccagtcg taaacgagtg gaggcctgac gataacaagt tctgttgagg aatgcttgaa 3780
aagctcccga agcgctactt cagcctcaaa ctttgaaatc gcatattctg catgaggagc 3840
cggcttggag ttctcatcga agggcttttc tttggttaaa gcgccattta caccaataga 3900
actaacaaaa atgaaacgct ttacagatgc ttcgatcgcc tgccgagcaa gcgccagagt 3960
agcatcgcga ttcaccttcc gaaaaatatc tagtgaatca cgctgccttc caaagatatg 4020
ggctcgtcca gctagatgaa ctacacattc aacaccccgc agcgcagcat caagcttagt 4080
gctctctttc agctccgctc gaacatactc aacccccgta acgggattgt acagggatcg 4140
tacttgtccg acaacctgaa agggggcggc agcaagcgac ctgcaaagcg cactcccgac 4200
aaaaccgcta gccccggtta ccagcacctt catcatattt tcgactcaga cagaagcggt 4260
cgaacacagg cagcgaattt ttccaatgaa atatattcag aataattttg ctgaaggaca 4320
ctccgcggga ctccgcctaa actagacaag tcgagttcac aaatctcatc gatcaatctt 4380
gccaaagcaa ccggatcatt cggcggacag ttccaaccga ttccggtctc atctattata 4440
cgggagattt cagccccttt ttccatgaca gctagaatcg gtttgtctgc tgccatggag 4500
aaatatgcct tgctgggaac cccaagcccg aacattcctt cttctaaggt aactaaggca 4560
acgtcacagg cagccaaacc aaaattcttt tcggctaatg gcagccttcc aaaatacctc 4620
aaccgagcac actgatcttc cagcgcgtgt ttttttacac tgtcgaccaa ggcaccatct 4680
ccaataaaag caaaagccgc cttctcgttt ttaaccaact gaatagcaga aagtatgttt 4740
tctatacctt gtaatcgacc gacattacca aaaaattgga aaaccctttt acctttccat 4800
tcaggaatat tgataaaagg agcatcctct ctcggtactg ggaaaacctc tttctcacag 4860
gcccaattcg aaataaagac caaagatcgc gggtcattca ccttctcttt cataagagct 4920
tccatatcgc gccctattac gactagacga tcagcggatg agtaaatgaa agaaaagaga 4980
cgacgtagaa gccggtaggc aatactatct ttcttcagaa cgcccgccgg caccaagttc 5040
tcgggaaaca catcatgcac cagcagcacc cacttgaaac cgagggcata ccttagcaag 5100
ggaaacgtca tcagtagaag agcagggttg gttccactca ataccacatc tcctcgtctg 5160
gcacgagaag tcaattttac tgagaacaga aacgcctgaa aaatctgcgc caatcctcta 5220
gaaaggagcc tattcttatt gctcctcgga aacttaaagc attcttgctc aacggaaggt 5280
gaaaccacag gcggggtttc acctgcggtc agcgggaaaa ttacggttag cccaccaaac 5340
tcccgctgca tctttcctat tatcttctcc caatagtatc ccgtggagtt ctgattggca 5400
ccgacatact cagaaaccac aaatatcctt gccatcaact ccacgcctca agttaatatt 5460
ttttccagac agttcgcatg acatagtccc gatagctatg aactatgcga acaatctttt 5520
cagaaacgtt gggcatgcta tagtcagcga ccaagcgtaa catgcgctct gcgtcgcgcc 5580
tctgtccctc caacacctcg agtgcttgta gtactcgatc cgaatccagt ccgaccatca 5640
tcaccacagc ctcttccatg ccttctgggc gttcatgagc ctcacgaata ttcaaagcgg 5700
gaaaattcag tattgaagac tcctcactga tggtcccact gtcagaaata actgccttgg 5760
ctgtaatttg cagtttattg taatccttaa agccgagggg tttcagcagt ttaataccct 5820
cgtgaaactt tgcctccgtc gcctcaattc tcttttttgt tctagggtga gttgatacga 5880
tgacgggcag cgagtacttt tctgccacag cgttgagcat agaaaccaac ttcaagaaat 5940
tcttatccga atctatgttt tcctctcggt gcgcactcac gacaaagaac cgctctgttt 6000
tcaacccgag cctttcaaga atatcggagg actcgatccc gtcacgatag tgctcgagaa 6060
cttcgaacat agggctacca gtcttgataa ccatgtctgg agaaagtcct tcacgcaaga 6120
gataatcacg cgcaattgta ctataggtca aatttacatc agctgtatga tcgacaatgc 6180
gccgatttat ctcttcaggc acacgcatat cgaaacagcg attgcctgct tccatatgaa 6240
aggtcggtat cttacgccgt tttgcaggca gtaccgccat acaactattg gtatcaccca 6300
gcacgagcag cgcatcggga tctatttcgc ccagaacacg atcgactgcg attattacat 6360
tccctatcgt ttcagccccg gaagacccgg cggcgtttag aaaataatcc ggctttctta 6420
taccgaggtc ctgaaaaaat atttcattaa gttcgtaatc ataattctgt ccagtatgga 6480
caagtacatg atcgcagtac tgatcaagct tcgccatgac cctagacaag cgaataatct 6540
caggacgagt tccaacaacc gtaacgactt ttagcttctg cattgttatc tcactatacc 6600
ttacgcacct tcgcctactg aacaagcgta ggtatccgga ttttcccgat caaatacttc 6660
gttagcccac aacatgacta ccatatcgtc agttccgaca ttagtaatgt catgagtcca 6720
tccaggtact gtttcgacaa tttctgcctt ttcaccatta gtgcaaattt cgtaaaatgc 6780
cccggtcagg atgtttctaa acttgaaacg tgccatccct ttgataacca gaaacttttc 6840
ggttttcgag tgatggtaat gcccgcccct ggtaacacct ggatgagccg taaaaaacga 6900
gaactggcca gagtccgcgg tcttcagcat ctcgacgaat gtgccacgcg gatccgaatg 6960
cattggcacg tcgtaactaa aactatcttc tggcaagaaa cttagataag tcgagtacaa 7020
ggcgcgcgtc aatcccgagc caacccttgc ggtagtcagt gactttcgac tattacgaaa 7080
ctcatacaat tgttctgcga gctcaccaac agaaatctga tactggggct cgacctgtag 7140
tgaaactgca ttggatagct tcccatccat gactttcatg aaggtgcgaa ccacatcatc 7200
tatgtataca agagtgatct ctgccgagga attgttaatt tgaatcggaa tatctcgaat 7260
aatattatga caaaaagtcg caaccgctga attataattc ggacgcgacc atttaccgaa 7320
tacattagga aggcgaaata tgtagacagg acaaccaata tcctcaccta gcacttggag 7380
atgctcttct gcggctcgct tgcttaaacc gtactcatta tccacctcag cctgaatgga 7440
tgaagtataa agaagtggta tggctcgtcc attggacctt accgcctcac acagagcata 7500
cgtgagttcg gaattcccga tcttaaactc ttctggtttt tccggacgat tgaccccggc 7560
aagatgaaaa ataaaatcga cggaacgaat tagctcaggc aaattaccaa cactactctc 7620
gcgggtgaat ggcaccacct cgataccacc ccgctctgca agatgagcgc acagattcct 7680
tccaacaaat ccattcgcgc cagttacaag aactttcatc gtttattcct ctggactggc 7740
actctcgcca cgctgaatag cacgaatgaa atccaacttc agcaacagct ttttcattcc 7800
ttcgatatcc agacgtttgg tattatgaga attatagtcc tctgtatgag taattttttc 7860
ctcgccttgc tccacaaact tactatagtt cagatcacgc aaatctgggg ggatacgata 7920
atagtcaccc atgtcttcag cacaggccat ttcctctcga ctaagaagcg cctcataaag 7980
cttctctcca tgacgcgtac ctattacatt gataggataa ccattcttgc caagcaattg 8040
agtaagcgca tgagccagca cctcgatggt tgcagccggt gctttctgta caaaaagatc 8100
tccattggta ccatgctcga aagcataaag cacaaggtct acggcatccg taagcgtcat 8160
catgaaacgt gtcatgtttg gatcagtgat tgtgagaggc tggcctgatc gcatttgctc 8220
gataaagaga ggaatgaccg agccccttga agccatgacg ttaccataac gggtgccaca 8280
aattacggta ggagtgcgtt ccaggtttcg agacttggcg accatgacct tttccatcat 8340
ggcctttgaa atacccatgg cattgattgg gtaaactgcc ttatccgtac tcagacaaac 8400
gacttttttg acgccattct ggatagcaga ttcgaggaca ttttccgttc cgatgacatt 8460
ggtcttcaca gcctccatcg ggtagaactc acaagaggga acctgtttca atgcagccgc 8520
atggaaaatg tagtccacac cgcgagtagc attcagagtg ctttgatagt cgcggacatc 8580
tccaatataa aacctcaact tggggtgagc atagcactta cgcatatcat cttgcttctt 8640
ctcatcccga ctgaatacac gtatttcacc aatatctgta tccagaaaac gcttcaaaac 8700
ggcatttcca aaggaaccag ttccaccggt aattaacaga acagagttct tatccataca 8760
ccacctcttt acgtgtaggc tggagctgct tcgaagttcc tatactttct agagaatagg 8820
aacttcggaa taggaacttc atttaaatgg cgcgccttac gccccgccct gccactcatc 8880
gcagtactgt tgtattcatt aagcatctgc cgacatggaa gccatcacaa acggcatgat 8940
gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg 9000
tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac 9060
tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg 9120
ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat 9180
cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt 9240
aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacgtaatt 9300
ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 9360
tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 9420
tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 9480
caacggtggt atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc 9540
tcgacaactc aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac 9600
ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt ggcccagggc ttcccggtat 9660
caacagggac accaggattt atttattctg cgaagtgatc ttccgtcaca ggtaggcgcg 9720
ccgaagttcc tatactttct agagaatagg aacttcggaa taggaactaa ggaggatatt 9780
catatggtgc acttacgcat aatccggcac atcatacgga taactatcga cgtccttttt 9840
attaatgaat ttagacttta aacctataat atttaaaatc acatacttaa taatgttgct 9900
gaacagcgtt gtccaaaaga atccatttag accaaacgca attgtcatta aaatagttat 9960
gaatataaat gtaatcgtgt gaagcgtcat ataattcgct tgtaatgtta ttgatgcgtg 10020
ttttgtattt aaagtttgga tcataatact cactgcattg aataaaacac ctatattacc 10080
taaaataata aacttcgaat ataaacttga atcaatgtta tacagtaaag agacaataat 10140
taatgtaatt ggataacata taatcatgac taaacatagt gcagctatag caaatagatt 10200
agttttcaaa tattgcttct ttatattgtc gctttcattt acagaaatat atgaaagtac 10260
tacattatta atcggataca gaaatgtagc taacattttc ccaataaatg ttgaaagaaa 10320
tgatatagtt acagctgttc cacctataat tggtaataag attaatctat ctaagtagag 10380
attcaaatta ttaaggctat ttgtactcag tagcatcaca taatctttga ccacattatt 10440
atcttcactt tgatactcgc ctatagttaa tccccgtaat ttaaccaatg tatatatcgt 10500
tgcaaacaat tcactggtaa taaaacaaac aatccagttt tggattaaat aatatagaaa 10560
tagtcctatc agcaaaccta aaaattgaat aagagcaata tacaaaatct gattatattt 10620
taaagtcatc ctaaaaaata cattcagata aatccttaaa cacattaaaa tattaagtag 10680
aattaaaaag ataatatcga tggtgttcaa attaaaaaag taaagaaata caataattaa 10740
agctatactc tcaatcagaa ttgaaattaa aagtatcgac acaaatttcc agtagtaatg 10800
attggatttg tatagattca tattaattaa tcgtatattg ttaagcgtat tgcctaatac 10860
aacactcgtg attgttatta ttgtataaat cgttaaaata gaaccaaacg cttcattacc 10920
tactcgttga ttaataattg gataagctaa aaattgtaat cctaaagcta taagcaacgt 10980
accaattatt gtctttacgc tatccataat aaaaactttc ttaaccatga tgcctcctgt 11040
ttaaacttat ttatcatcat catctttata atcaccatga tgacgccgtc cttttgtaat 11100
aaaatagaac aacacaaacc aaaattcact tacaactaaa taatttgaac taaacattaa 11160
taatgtgatt ggatagattg ctataaacat aacgagtaaa tctatagtgt ttggatcata 11220
gttcctaatc attttataaa ctagtagcaa aatgcaaatc attatgataa aaaaccctaa 11280
taagccaaat gatagaatca actcaataat gatgttatgt ggtatatttc cgattagttt 11340
ataatagtta aatggcccat agcctaataa cggactttgt tgaataaagt aaataccttt 11400
ttcataaatc ggtcctcttc cagaagtacc ttctaaatta agtgttccac cttgtagata 11460
tgaaaatgtt ctagtattcg aaccttttgt aaaaagaaag taaatcaata cactagatat 11520
gcttaatgca aaaatataca taatgctttt tactgcaata ggtattcctc ttttaaacgt 11580
aataagtata aatgcaaata agccgtaaag aattaataaa atagcacctc cacgccctcc 11640
tggtataaac acaataggga tatcaattat tgtaaataga acatatatcc acttatgttt 11700
cactgaacct ttcataatga aataaatgcc taatccggca gtaaatgctg aaaggtacga 11760
agcgttttga tagttcataa gtccaaaatt gatatagcta ggtatctcac ctgtaagttt 11820
tggtattaaa attacaaaaa taaatgaaat agaaaatatg aaaaatacta atttaaaaaa 11880
tctttctacc gtagccttgt ttatatattt aatataaata ccactaattg ccgctggaac 11940
tgcccatgtt aaaaagaata gaatattatt tttagctagt ttctcttcct tatctggtga 12000
aaaataataa aaagctagat aaagcaaaca tatagcaatt aataatatta accctcgcgg 12060
aatttcttgc gtgacaatta tcttataaat agcaaacacc gtagtaatta atgctatacc 12120
aaccatggtt gagtaataca ccggctctat agggaaccct aatacttctt tagtaaatgt 12180
agagattact ataaatatgt tcatgctgat aattgcacaa agtacaaaaa atttcatagt 12240
tcctcctgct agaggatccc cgggtcctta cagatcctct tctgagatga gtttttgttc 12300
aaatttatat aattctacta atcgttcact ttctatttgc caattcaaaa ttttagacgc 12360
cttaattgca ttttgacgta aatgattaaa caaatcgtga ttatctctta attttctaac 12420
cgccttttca atttctaacg gcgtaacttc ctttaaaaca atgccaaatt tatatttttc 12480
attgagataa atatgctctt tgacaggaga taaaattact ggtaaaccag catgtataca 12540
ttcaaaaatt ttattagata ctgtatattc aaaattaata gatacaggtt tcgtcaagat 12600
aacaccaaca ttactttctg ctaacttatc aaccaattct tttacttcaa ctggtttatc 12660
caacctaata ttttccgagt tataactaat cagttctttt atcacttctt catgcggacc 12720
aaaccctcga attatgaatg aaggagcatt ttgtttaaaa gctgatgaag caataataaa 12780
ctcttcatat cctctgtcca ttacaatttg accttgatat acgatttctt taaagttttc 12840
gatttcttta aattctctgc tatcatttaa aataggtgca ttcgtaataa cattcgcttc 12900
cttcttatat cctttagatt gataatattc ttttgctgca tgacttactg ttacgaaggc 12960
attaacacga tgttttacta tgtgtttttc tatactttct acaaactttg aaataagtgg 13020
aactttatta ataaaggcat ttttcgcata tatttcatgc gcatcataaa caatattagc 13080
ttttttataa ttgcttaaat agaccattaa taatacgtcg aaatcatttg catgaatcac 13140
gtcaggttta aaagctttaa tttctcggat aacacctgtt gcaaatctta tacgcttaat 13200
taatttagaa agaatatttt tgggatctac cttgctacct aacaaacgat aattacaatc 13260
taaattttcc aatcgcctat tagtagcttg tgaattattc attccaacaa ttttataatc 13320
attcgtaacg cctttaattg tttctatttg tttaagtacc cttgggtctt gaacaatatt 13380
actcgataca atatttaaaa ttctcattgt acacctcctg ctcattgtac acctcctgtt 13440
acgcataatc cggcacatca tacggataac tagtatcctt tttatttaaa tattcaaccg 13500
aaaatccttt tagtttgtca ggcgttttct cccaccactt gctttccaaa agtttttcaa 13560
ttgttttatt gtcaaatcgc ttcttaatca cttttgcagg aaccccacca acaacctcat 13620
atgctcctac atttttagta acaactgagc cggctgctat gactgcacca gtatttattg 13680
ttaatccatc cataataatt acatttgcac caatccacac atcattttta attgttgtac 13740
ggcttggttg gtcattaaag tctataaact tttgctttat gttaaatgga ttattattag 13800
aataaaaaat cggtgatgag ctaaaaaagt gtgtaggatg ttttcctaac ccaattttta 13860
catccgaaga tatcgaacaa tatcttccta cttctacatt attaaaatca ctaccaaatc 13920
caatataact gtattcacca atgtgagaat tcctgatttt acaccatcta tctatatagt 13980
tattgccatc aaattttgag tttgtaatat acgccaagcg atgaatctta acattcgatt 14040
ctttagagga ctggtttttc agcaaaccaa ttatcttttc aatcgctatc ctcatcttaa 14100
gatcaaagtc cccttttctc tctcaactta accgtggcca ggaaaaacat tcccatcccc 14160
aaagagacct ctgtaacgac cagcgtccac gctccaaaaa gctcatcccc ccaaagcgcc 14220
aagaggataa atgttaatac cccgcccaat tccgcaaaaa aaattgctcg caaatataca 14280
ccatcatacc cagaaggaac aagagtcaac cctccataca gaacaccaat acaagcaaac 14340
actggcacta tcgaaaacat tcttattaca acagttagac ctctggactg ttccgggaat 14400
aggagatatg aaatgtattc agaaaataag aaaagaaata aacaactagg aatagctatt 14460
agtaacatca gacctagcgc tttccttctt aaactgccga ctgccgggtc ggcactcgca 14520
tacatcctgc taaaagtcgg aaatagagcg ctagctatgg gtgaagtagc agccgcgatc 14580
ccgcgaagga atttatccgc agtagaaagc actccggccg cggaggctcc accaacaaca 14640
ccaaccgccg caacgagcac ttgcatgtgc aagctaagaa aagccagaga aagaaaagat 14700
cgagcaccgt cacgcaatat atcgagaatt ctgtctttct cgagaaccgg gcgccaccgt 14760
attcccatag aaaataaaat acaacagaga gcacttccac ctatgacata ggaaaaacca 14820
aaccccaacg aagccagcac aaggtcagaa tccttcgtga caaaaaaaac gaccaatagg 14880
aaataaaata ccttagacaa aaaattggta agcgccaacc atccaaacag cgctcttccc 14940
tgaaagaacc atactgcttg aagataattt ccaactactg ccggaagagc agccgcaacc 15000
aatacaagca aggggattgg taaaatagaa gatacagcca aaatggccag cactaaaagt 15060
gaaagcagca acaataagaa tctagcactc tgtacaacag aaaagaaact agacagttca 15120
actttgttat cgataatggc agcctttctt gatcctgcca gaataaatcc aaagtctacc 15180
agttgacata gaatgacagc cacggcctgg gcaatcacca attggccaaa cgcttcgctt 15240
gacaatgttc tcgtgagaaa aggaatcgca gcaagaggca aaagatagtt gctgcccatg 15300
gatataccgg agtagaaaac gccccgcctt attgacattc tactcgatac cccctaatac 15360
aattcaacaa ctacaacaag taagccctga tgccagtaag tggcatcagg gtttagatca 15420
aaacttagcg aagagagcca tcgctacgaa gcttccttat aaaaccagcg agcactgcga 15480
gtagaattcc aattatcaat cctgccaaag tacctatagt aactataaga atcttcttcg 15540
gcttaatggg ttgatttgaa aaagagagtc cctcgtcttc cttgtagaca gccaccgcat 15600
cagaatccac agacaaactg gagttccaag atagtttctc ttggagagtt ctcaactcag 15660
gaatgaatgg agcatctaca ctacgcgact caagattgtt gatttcagcg cgcagcgcct 15720
tagctcctcg catgtacatc aagtcaccat ccatgatcga ggagagttgt tgctcggacg 15780
ccccttctat taatggcggg ccatctatct tgagcgactc cgcaatcagc aatgcctcct 15840
tcaaacgtgc aattctatca tcacggcggc ccttcgccat attctgcagc acggttatgc 15900
ggctctgcat tgcagcattt cttacctgga aatctctacc tgcactatca ataacctcat 15960
gcacggcccg atccgcagcc aaacgcacga aagcttgtgc ccatgtagca agaacctctc 16020
gcttcgtgcc ctccacaatt accgtataac ggtctgcatc tggcttgtta gcaggatcaa 16080
tctttacctc tttggagaac ttcttataaa actcctcctg ctcatcttcg ctttccgctc 16140
cctcacccac ctggggaagg tatatcttat agaagaactc ttttttattc tcatccgaaa 16200
gcagattgcg cgaaaagatc gcatagatac ttctaacagt atatgcatct aggccattct 16260
cccttctacc aacattgaaa ccttcgatag acccaagagc aggaggcact actgcaaccc 16320
tatattcata tacaggctta ctcagatacg cataggtaaa agacccgatt aatgcaagaa 16380
gagtagtcag aagaatcaga accttgttaa cccaaagctc cttgaccagc ttcaccaggt 16440
caacctcacc atcagccgtc atcaaagaag aattgcctca ggg 16483
<210> 4
<211> 16660
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 4
aattccctga ggcaattctt ctttgatgac ggctgatggt gaggttgacc tggtgaagct 60
ggtcaaggag ctttgggtta acaaggttct gattcttctg actactcttc ttgcattaat 120
cgggtctttt acctatgcgt atctgagtaa gcctgtatat gaatataggg ttgcagtagt 180
gcctcctgct cttgggtcta tcgaaggttt caatgttggt agaagggaga atggcctaga 240
tgcatatact gttagaagta tctatgcgat cttttcgcgc aatctgcttt cggatgagaa 300
taaaaaagag ttcttctata agatatacct tccccaggtg ggtgagggag cggaaagcga 360
agatgagcag gaggagtttt ataagaagtt ctccaaagag gtaaagattg atcctgctaa 420
caagccagat gcagaccgtt atacggtaat tgtggagggc acgaagcgag aggttcttgc 480
tacatgggca caagctttcg tgcgtttggc tgcggatcgg gccgtgcatg aggttattga 540
tagtgcaggt agagatttcc aggtaagaaa tgctgcaatg cagagccgca taaccgtgct 600
gcagaatatg gcgaagggcc gccgtgatga tagaattgca cgtttgaagg aggcattgct 660
gattgcggag tcgctcaaga tagatggccc gccattaata gaaggggcgt ccgagcaaca 720
actctcctcg atcatggatg gtgacttgat gtacatgcga ggagctaagg cgctgcgcgc 780
tgaaatcaac aatcttgagt cgcgtagtgt agatgctcca ttcattcctg agttgagaac 840
tctccaagag aaactatctt ggaactccag tttgtctgtg gattctgatg cggtggctgt 900
ctacaaggaa gacgagggac tctctttttc aaatcaaccc attaagccga agaagattct 960
tatagttact ataggtactt tggcaggatt gataattgga attctactcg cagtgctcgc 1020
tggttttata aggaagcttc gtagcgatgg ctctcttcgc taagttttga tctaaaccct 1080
gatgccactt actggcatca gggcttactt gttgtagttg ttgaattgta ttagggggta 1140
tcgagtagaa tgtcaataag gcggggcgtt ttctactccg gtatatccat gggcagcaac 1200
tatcttttgc ctcttgctgc gattcctttt ctcacgagaa cattgtcaag cgaagcgttt 1260
ggccaattgg tgattgccca ggccgtggct gtcattctat gtcaactggt agactttgga 1320
tttattctgg caggatcaag aaaggctgcc attatcgata acaaagttga actgtctagt 1380
ttcttttctg ttgtacagag tgctagattc ttattgttgc tgctttcact tttagtgctg 1440
gccattttgg ctgtatcttc tattttacca atccccttgc ttgtattggt tgcggctgct 1500
cttccggcag tagttggaaa ttatcttcaa gcagtatggt tctttcaggg aagagcgctg 1560
tttggatggt tggcgcttac caattttttg tctaaggtat tttatttcct attggtcgtt 1620
ttttttgtca cgaaggattc tgaccttgtg ctggcttcgt tggggtttgg tttttcctat 1680
gtcataggtg gaagtgctct ctgttgtatt ttattttcta tgggaatacg gtggcgcccg 1740
gttctcgaga aagacagaat tctcgatata ttgcgtgacg gtgctcgatc ttttctttct 1800
ctggcttttc ttagcttgca catgcaagtg ctcgttgcgg cggttggtgt tgttggtgga 1860
gcctccgcgg ccggagtgct ttctactgcg gataaattcc ttcgcgggat cgcggctgct 1920
acttcaccca tagctagcgc tctatttccg acttttagca ggatgtatgc gagtgccgac 1980
ccggcagtcg gcagtttaag aaggaaagcg ctaggtctga tgttactaat agctattcct 2040
agttgtttat ttcttttctt attttctgaa tacatttcat atctcctatt cccggaacag 2100
tccagaggtc taactgttgt aataagaatg ttttcgatag tgccagtgtt tgcttgtatt 2160
ggtgttctgt atggagggtt gactcttgtt ccttctgggt atgatggtgt atatttgcga 2220
gcaatttttt ttgcggaatt gggcggggta ttaacattta tcctcttggc gctttggggg 2280
gatgagcttt ttggagcgtg gacgctggtc gttacagagg tctctttggg gatgggaatg 2340
tttttcctgg ccacggttaa gttgagagag aaaaggggac tttgatctta aggcgatcgc 2400
taggaggaca gctatgcgta ttgcgattct gggcgcgacc aacattaaac atatgagcct 2460
gctgagccat tatctgaacc atattgatct gaacattaac gaagtggata ttatttatac 2520
cgataaatat gatattgaag aacatattca gggcatcaac aactactaca aatacaaagt 2580
ggatatcaaa gaagattgga ccttcatcaa gaaagcgatt gcgtattatc gttttcgtcc 2640
gtatgcgatg aaaattctga aagaaaaccg ttatgatttt gtgattgtgt ggggcagcta 2700
caccggccat ctgttcaaaa gctttctgga aaaacattac aaaaacaaat tcatcctgaa 2760
catccgtgat tactttttcg aaaacaacaa actgattaaa tatcgtatga agaaaatcgt 2820
ggatgcgagc cgtgtgacca ccctgagcag cgaaggcttt ctgaaattcc tgccgaaaag 2880
cgaaaaatac cgtatcatct acagctacaa catgagcatc atccgtgaaa gcaacgtgac 2940
cgatggcttt aaaaaacgtt ggccgattaa cattggcttt attggcaacg tgcgttttaa 3000
cgaaattaac cagaaactga ttaaagaact ggcgaacgat agccgttttc atatgcagta 3060
ttttggcacc ggcagcgaaa aactggaagt gtttgcgcgt gaaaacttta ttaacaacat 3120
tacctttagc ggcggctttg atctgaaaga aaccccgaaa tatctgaacg aaattgatat 3180
tctgaacaac ctgtttggca accagaacat tgcgctggat accgcgctga gcattcgtat 3240
gtattatgcg ctgtttctga acaaaccgat tattaccacc gatgatacct ttaccgcgac 3300
cgaagcgaac aaatttggcc tgggctttag cattaacccg gaaaacctga aaggcattgg 3360
cgatgaactg atggattggt ataacaacct ggatgtgatg gatattaacc ataaacgtga 3420
agcgtatcgt aacgatgtga ttgaaaacaa caaacagttt tatcaggaaa ttggccgtat 3480
ttttaacgaa gaacagaaac tgattagcga agaagatctg taacgtttaa acaggaggac 3540
agctatgaac aaaatttata acgtgaccag ctatgtgatt gcgattctga tgtttccgtg 3600
cctgatgctg ggcgataaac cgctgctgtt tctggcgccg attagctatg gcgtgggcaa 3660
actgttcatc agcttcagca acaacccgaa cttcaaattc agcaaaatcg tgtacgatgt 3720
gctgggcttt ctgcgtctgg tgtttattcc ggcgatgatt gtgtttttcc aggatagcac 3780
cattgataac ctgccgctgg gccaggcgta ttttaaccag gcggtgattt atatgagcgt 3840
ggaatttatt attggcagcc tgtttattct gattctgagc aaactgttca agcatgaagt 3900
tgtgagccgt aacagcttta ccctgagcgg cagcagcatt tattatattg tgtttggcct 3960
ggtgatttgc ggcatttttg tggcgtttcc ggaagtgcgt aaaaacatta gctttctgat 4020
tattaaaacc gatgcgatgg gccgtggcac cgaagcgacc agcggcctga acgtgctgtt 4080
tgtgatgctg tttcagctgg cgctggcgct gctgtttctg atcatcgcgt acgcgagcta 4140
caaaaaatac aaagaaaacc cgaaaatcat ctacgtggtg ctgccgctgg cgattggcat 4200
tctgaacatt agcctgattg tgggcgaacg tcgtagctat cagctgtata ccatggtggc 4260
ggtgctgacc gttgtgagca tcctgtttag caaacataaa cgtcgtatca acatcatcat 4320
catcagcgtg ggcatcttcg tgctggcgct gatgaccctg tataaagaac tgtatgtgtt 4380
taactatagc agctatagcg aagcgctgaa cagcaccagc gtgagcaacc tgaaaattgt 4440
ggataccctg cagagctatt tttatggccc gagcaacatt gcggcgagca ttgattatct 4500
gaactattat aacggcagct ttaaacagta tctgtttgat aacacccgtg cggtgtttgg 4560
ctttaacttt ttcctggata aaaaacagct gattaccagc cagctgttta accagctgat 4620
ttatggcagc aaacagctga ccggccatct gattagcagc gcgggctatg gcattattta 4680
ttttggcccg ctgtttttct acctgaacct gattgcgaac atctttttcg cgtttctgag 4740
cgaatacatc atccgtaaaa gccatagcct ggaagtgatc ttcatcggca cctacatcta 4800
catgcgtctg attaccagca tttttagcca tccgaccccg ctgattaccc tgattagcat 4860
gattctggtg gtgtatgtga ttgcgatcat cccgggcatc atcatcaaga aattcaccaa 4920
aaaagtgggc atcgaagatt acaaagatga tgatgataaa taacgtttaa acaggaggac 4980
agctatgatt gtgaaaacct ttatgaaaag caaaattttt cgtctgatga acaccccgct 5040
gctgctgttt tataaaaaag aatatctgac cggctattat tttgaaaaca aagtggcggg 5100
ctggctgtgg gcgtggaaag cggtgccatt caagctgctg ggcattaaca ccagcctgcc 5160
gtttccggcg gatattaccg tgcgtatgca taacccgaac aacattgtgt ttgataaaaa 5220
cgatattcat atttttcaga gcccgggcac ctattttaac aactttagcg cggtgattta 5280
tattggccgt ggcgtgtata ttgcgccgaa cgtgggcatt attaccgcga accataacat 5340
taaaaacctg aaaagccatg cgccgggcga agatgtgaaa attggcaact atagctggat 5400
tggcatgaac agcgtgattc tgccgggcgt ggaactgggc gaacatacca ttgtgggcgc 5460
gggcagcgtg gtgaccaaaa gctttccgga aggcaacgtg gtgattggcg gcaacccggc 5520
gaaaattatt aagaaaatca gctatccgta tgatgtgccg gattatgcgt aattaattaa 5580
ccaggtgcac gaagaaaatt atgagattaa ataaatttat tggcgattcg tttttaatga 5640
ttttaagcag tggcatcgct caagtcatat taatcatcac taccccaatt attacaagac 5700
tatattcacc tacagaattt ggtgagttta caattttttc aaatatcgca atgattttaa 5760
taccaataat aaatgcaaga tacgatttgt tgattgtgaa taccaaaaat gaccgtagtg 5820
ctaatatact ttcacaaatc agttttttga tatcattgct tattttatta atactgatac 5880
caatatttgc gattagtgca tgtttatacc caaactttat attagatttt attttcatta 5940
ttattatgtt gtttttggta agtttaacaa acatttttac aaattatcta aataaggaaa 6000
gaaagtataa agtgttaagt ttgattaatg tgtttagagc tggatcaatg gctttacttc 6060
aaatcatttt cggactttta gcattaggaa gtttaggatt aattattggt ttttcattat 6120
cctatatcgc aggcattaca ctaggatata aaacgtttaa aaagcacttt aatattgtga 6180
gagataaaga agaaactaaa gcattatttt tagaaaataa aaatcagtta gtttattcaa 6240
caccatcaat attattaaat agtttgtctt tctcggttgt tgtgttcttt ataggtattt 6300
tgtataccaa tacagaagtg ggtatttatg gtatggccat aagagtacta ggcataccag 6360
tgacaattat ttcattaggg ttatcaaaaa tatttatgca acaagccaat gactattata 6420
ttgaacatgg taacttccga aatttattac ttaaatttag ttccatactg gttatagttt 6480
ctataattct ttatgtgcca ctttatttgt tcagtgaaga attagtcaat atattattag 6540
gacatagctg ggttgacgca attacagtta taaaaattgt tatcccatta tttgttataa 6600
ggctgattgt atcaacggta tcactttctg tgattgtatt acaaaaacaa cagttagaat 6660
taatactaca agcgttattt ttaataggta ctactgcaac atttgttata tcaaaaatgc 6720
ttaatttaac ttttttaaac tttgtatcta ttaatacaat tgttttaatc gtatcgtaca 6780
tgatattttt catagcactc tattattttg ctaaaaataa acagttcaaa aattctagtt 6840
atccgtatga tgtgccggat tatgcgtaag tgcaccatat gaatatcctc cttagttcct 6900
attccgaagt tcctattctc tagaaagtat aggaacttcg gcgcgcctac ctgtgacgga 6960
agatcacttc gcagaataaa taaatcctgg tgtccctgtt gataccggga agccctgggc 7020
caacttttgg cgaaaatgag acgttgatcg gcacgtaaga ggttccaact ttcaccataa 7080
tgaaataaga tcactaccgg gcgtattttt tgagttgtcg agattttcag gagctaagga 7140
agctaaaatg gagaaaaaaa tcactggata taccaccgtt gatatatccc aatggcatcg 7200
taaagaacat tttgaggcat ttcagtcagt tgctcaatgt acctataacc agaccgttca 7260
gctggatatt acggcctttt taaagaccgt aaagaaaaat aagcacaagt tttatccggc 7320
ctttattcac attcttgccc gcctgatgaa tgctcatccg gaattacgta tggcaatgaa 7380
agacggtgag ctggtgatat gggatagtgt tcacccttgt tacaccgttt tccatgagca 7440
aactgaaacg ttttcatcgc tctggagtga ataccacgac gatttccggc agtttctaca 7500
catatattcg caagatgtgg cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt 7560
tattgagaat atgtttttcg tctcagccaa tccctgggtg agtttcacca gttttgattt 7620
aaacgtggcc aatatggaca acttcttcgc ccccgttttc accatgggca aatattatac 7680
gcaaggcgac aaggtgctga tgccgctggc gattcaggtt catcatgccg tttgtgatgg 7740
cttccatgtc ggcagatgct taatgaatac aacagtactg cgatgagtgg cagggcgggg 7800
cgtaaggcgc gccatttaaa tgaagttcct attccgaagt tcctattctc tagaaagtat 7860
aggaacttcg aagcagctcc agcctacacg taaagaggtg gtgtatggat aagaactctg 7920
ttctgttaat taccggtgga actggttcct ttggaaatgc cgttttgaag cgttttctgg 7980
atacagatat tggtgaaata cgtgtattca gtcgggatga gaagaagcaa gatgatatgc 8040
gtaagtgcta tgctcacccc aagttgaggt tttatattgg agatgtccgc gactatcaaa 8100
gcactctgaa tgctactcgc ggtgtggact acattttcca tgcggctgca ttgaaacagg 8160
ttccctcttg tgagttctac ccgatggagg ctgtgaagac caatgtcatc ggaacggaaa 8220
atgtcctcga atctgctatc cagaatggcg tcaaaaaagt cgtttgtctg agtacggata 8280
aggcagttta cccaatcaat gccatgggta tttcaaaggc catgatggaa aaggtcatgg 8340
tcgccaagtc tcgaaacctg gaacgcactc ctaccgtaat ttgtggcacc cgttatggta 8400
acgtcatggc ttcaaggggc tcggtcattc ctctctttat cgagcaaatg cgatcaggcc 8460
agcctctcac aatcactgat ccaaacatga cacgtttcat gatgacgctt acggatgccg 8520
tagaccttgt gctttatgct ttcgagcatg gtaccaatgg agatcttttt gtacagaaag 8580
caccggctgc aaccatcgag gtgctggctc atgcgcttac tcaattgctt ggcaagaatg 8640
gttatcctat caatgtaata ggtacgcgtc atggagagaa gctttatgag gcgcttctta 8700
gtcgagagga aatggcctgt gctgaagaca tgggtgacta ttatcgtatc cccccagatt 8760
tgcgtgatct gaactatagt aagtttgtgg agcaaggcga ggaaaaaatt actcatacag 8820
aggactataa ttctcataat accaaacgtc tggatatcga aggaatgaaa aagctgttgc 8880
tgaagttgga tttcattcgt gctattcagc gtggcgagag tgccagtcca gaggaataaa 8940
cgatgaaagt tcttgtaact ggcgcgaatg gatttgttgg aaggaatctg tgcgctcatc 9000
ttgcagagcg gggtggtatc gaggtggtgc cattcacccg cgagagtagt gttggtaatt 9060
tgcctgagct aattcgttcc gtcgatttta tttttcatct tgccggggtc aatcgtccgg 9120
aaaaaccaga agagtttaag atcgggaatt ccgaactcac gtatgctctg tgtgaggcgg 9180
taaggtccaa tggacgagcc ataccacttc tttatacttc atccattcag gctgaggtgg 9240
ataatgagta cggtttaagc aagcgagccg cagaagagca tctccaagtg ctaggtgagg 9300
atattggttg tcctgtctac atatttcgcc ttcctaatgt attcggtaaa tggtcgcgtc 9360
cgaattataa ttcagcggtt gcgacttttt gtcataatat tattcgagat attccgattc 9420
aaattaacaa ttcctcggca gagatcactc ttgtatacat agatgatgtg gttcgcacct 9480
tcatgaaagt catggatggg aagctatcca atgcagtttc actacaggtc gagccccagt 9540
atcagatttc tgttggtgag ctcgcagaac aattgtatga gtttcgtaat agtcgaaagt 9600
cactgactac cgcaagggtt ggctcgggat tgacgcgcgc cttgtactcg acttatctaa 9660
gtttcttgcc agaagatagt tttagttacg acgtgccaat gcattcggat ccgcgtggca 9720
cattcgtcga gatgctgaag accgcggact ctggccagtt ctcgtttttt acggctcatc 9780
caggtgttac caggggcggg cattaccatc actcgaaaac cgaaaagttt ctggttatca 9840
aagggatggc acgtttcaag tttagaaaca tcctgaccgg ggcattttac gaaatttgca 9900
ctaatggtga aaaggcagaa attgtcgaaa cagtacctgg atggactcat gacattacta 9960
atgtcggaac tgacgatatg gtagtcatgt tgtgggctaa cgaagtattt gatcgggaaa 10020
atccggatac ctacgcttgt tcagtaggcg aaggtgcgta aggtatagtg agataacaat 10080
gcagaagcta aaagtcgtta cggttgttgg aactcgtcct gagattattc gcttgtctag 10140
ggtcatggcg aagcttgatc agtactgcga tcatgtactt gtccatactg gacagaatta 10200
tgattacgaa cttaatgaaa tattttttca ggacctcggt ataagaaagc cggattattt 10260
tctaaacgcc gccgggtctt ccggggctga aacgataggg aatgtaataa tcgcagtcga 10320
tcgtgttctg ggcgaaatag atcccgatgc gctgctcgtg ctgggtgata ccaatagttg 10380
tatggcggta ctgcctgcaa aacggcgtaa gataccgacc tttcatatgg aagcaggcaa 10440
tcgctgtttc gatatgcgtg tgcctgaaga gataaatcgg cgcattgtcg atcatacagc 10500
tgatgtaaat ttgacctata gtacaattgc gcgtgattat ctcttgcgtg aaggactttc 10560
tccagacatg gttatcaaga ctggtagccc tatgttcgaa gttctcgagc actatcgtga 10620
cgggatcgag tcctccgata ttcttgaaag gctcgggttg aaaacagagc ggttctttgt 10680
cgtgagtgcg caccgagagg aaaacataga ttcggataag aatttcttga agttggtttc 10740
tatgctcaac gctgtggcag aaaagtactc gctgcccgtc atcgtatcaa ctcaccctag 10800
aacaaaaaag agaattgagg cgacggaggc aaagtttcac gagggtatta aactgctgaa 10860
acccctcggc tttaaggatt acaataaact gcaaattaca gccaaggcag ttatttctga 10920
cagtgggacc atcagtgagg agtcttcaat actgaatttt cccgctttga atattcgtga 10980
ggctcatgaa cgcccagaag gcatggaaga ggctgtggtg atgatggtcg gactggattc 11040
ggatcgagta ctacaagcac tcgaggtgtt ggagggacag aggcgcgacg cagagcgcat 11100
gttacgcttg gtcgctgact atagcatgcc caacgtttct gaaaagattg ttcgcatagt 11160
tcatagctat cgggactatg tcatgcgaac tgtctggaaa aaatattaac ttgaggcgtg 11220
gagttgatgg caaggatatt tgtggtttct gagtatgtcg gtgccaatca gaactccacg 11280
ggatactatt gggagaagat aataggaaag atgcagcggg agtttggtgg gctaaccgta 11340
attttcccgc tgaccgcagg tgaaaccccg cctgtggttt caccttccgt tgagcaagaa 11400
tgctttaagt ttccgaggag caataagaat aggctccttt ctagaggatt ggcgcagatt 11460
tttcaggcgt ttctgttctc agtaaaattg acttctcgtg ccagacgagg agatgtggta 11520
ttgagtggaa ccaaccctgc tcttctactg atgacgtttc ccttgctaag gtatgccctc 11580
ggtttcaagt gggtgctgct ggtgcatgat gtgtttcccg agaacttggt gccggcgggc 11640
gttctgaaga aagatagtat tgcctaccgg cttctacgtc gtctcttttc tttcatttac 11700
tcatccgctg atcgtctagt cgtaataggg cgcgatatgg aagctcttat gaaagagaag 11760
gtgaatgacc cgcgatcttt ggtctttatt tcgaattggg cctgtgagaa agaggttttc 11820
ccagtaccga gagaggatgc tccttttatc aatattcctg aatggaaagg taaaagggtt 11880
ttccaatttt ttggtaatgt cggtcgatta caaggtatag aaaacatact ttctgctatt 11940
cagttggtta aaaacgagaa ggcggctttt gcttttattg gagatggtgc cttggtcgac 12000
agtgtaaaaa aacacgcgct ggaagatcag tgtgctcggt tgaggtattt tggaaggctg 12060
ccattagccg aaaagaattt tggtttggct gcctgtgacg ttgccttagt taccttagaa 12120
gaaggaatgt tcgggcttgg ggttcccagc aaggcatatt tctccatggc agcagacaaa 12180
ccgattctag ctgtcatgga aaaaggggct gaaatctccc gtataataga tgagaccgga 12240
atcggttgga actgtccgcc gaatgatccg gttgctttgg caagattgat cgatgagatt 12300
tgtgaactcg acttgtctag tttaggcgga gtcccgcgga gtgtccttca gcaaaattat 12360
tctgaatata tttcattgga aaaattcgct gcctgtgttc gaccgcttct gtctgagtcg 12420
aaaatatgat gaaggtgctg gtaaccgggg ctagcggttt tgtcgggagt gcgctttgca 12480
ggtcgcttgc tgccgccccc tttcaggttg tcggacaagt acgatccctg tacaatcccg 12540
ttacgggggt tgagtatgtt cgagcggagc tgaaagagag cactaagctt gatgctgcgc 12600
tgcggggtgt tgaatgtgta gttcatctag ctggacgagc ccatatcttt ggaaggcagc 12660
gtgattcact agatattttt cggaaggtga atcgcgatgc tactctggcg cttgctcggc 12720
aggcgatcga agcatctgta aagcgtttca tttttgttag ttctattggt gtaaatggcg 12780
ctttaaccaa agaaaagccc ttcgatgaga actccaagcc ggctcctcat gcagaatatg 12840
cgatttcaaa gtttgaggct gaagtagcgc ttcgggagct tttcaagcat tcctcaacag 12900
aacttgttat cgtcaggcct ccactcgttt acgactggaa agctcctgga aatttctcgc 12960
gattgttgaa gctggttgct tcgggacttc ctcttccatt tggttgcata gataaccgac 13020
gaagttttgt ttctctggat aatttagttg actttctagc ttgctgtatg acgcaccctt 13080
ctgctgccgg cgaactgttt ttggtatccg atggtcagga gatttctacc aagcaactgg 13140
tgactgcgct tgctgcggga atggggcgtc gccccatcat gtggcctgtt cctaggttta 13200
ttctgaggtt tcttaaatta gtaggaaagg gtgggttata cactcagtta tgctgctcac 13260
tagaggtcga ctcgtcgaaa ggcaggcttt tgcttggttg ggaaccccgc aagagcaccc 13320
tttccgcgtt ggaagatgtt ggtagaatat atgtcaaacg tactgaatga ttatctgcag 13380
gcgctttgct actagcatgg cgtaccacgc agaacaatcg aatagaaccc tgttgaaggg 13440
gtgagagtat ttttggggat aaatttataa atggaagaat ggtatttgtt actcgctgca 13500
gctggggttt cgggactgct tacaggcctc ttgcgtcgtt atgccttagc gaggagctta 13560
cttgacaccc ctaactctcg aagttcccat gtcgttccca ctccacgcgg aggaggggtc 13620
gccattgtag ttactttttg tctcatgctg cctatttggg ctgtactggg aaatatctca 13680
tgggccgtgt cctgggcttt acttctcgct ggcggcgggg ttgccattat tggattcatg 13740
gatgatcacg gtcatatcgc cgcacgctgg cgtctgctgg gacattttag tgcagccttg 13800
gtctcattgt actttttgaa tggcatacca ccatttcaga ttgttggtgt cagttgggac 13860
ctggggtggt tcggaggact tctctttgct ttctatctcg tgtggttgct gaatctctat 13920
aacttcatgg atgggatcga tggacttgct agccttcagg ccatttttgt ctgtgttggt 13980
ggggcattat tatactggct gaatggccaa ctgacgcagg ctttgctccc cttatcgcta 14040
gcttttgccg tttttggatt cttgttctgg aattttccac ccccaaaaat tttcatggga 14100
gatgcgggta gtggtcttct ggggattgtt ttaggaattc tttccattca tgccatgtgg 14160
atgaatacga attttttctg ggcatggttg gtcctgttag gcgttttcat cgtcgatgcg 14220
acctataccc tgattcgtcg cttgctgaga ggggacaagg tgtatgaggc tcatcgaagc 14280
catgcctatc aatacgcaag ccgatactat ggaaagcatg ctcctgttac gattggcgtc 14340
acggcattga acgtcatctg gctcctccct atagccttgt tggtcgggag tgggtctcta 14400
gagcctttga tgggcatcgt catagcctac gtccctctcg tttttctggc agtgaggttc 14460
aaggcgggta agctagagtc gtccgctcag gcctaaagga gtaggggaat gctagatcgt 14520
ttaagagtaa agttgttatc catgcctcgt cgctggaaac gtttgcttca agtggctacg 14580
gatatccttc tggtatggct gtctctgtgg ctcgcttttg tggtccgtct aggcacagac 14640
gatatgatcg acgtgttcgg cgagcatgca tggcttttca tcactgcgcc ggtcatcgcc 14700
attccactat tcattcgctt cggcatgtat cgcgcggtga tgcgctatct cggtaacgac 14760
gcattgatcg ccatcgccaa ggcggtgacc atctcggctc tggtgctgtc gctggtggtg 14820
tactggtatc gtggcgcgcc ggcgccggtg ccgcgttccc tggtgttcaa ctactggtgg 14880
ttgagcatgc tgctgatcgg cggcttgcgt ctggccatgc gccagtattt catgggcgac 14940
tggtactctg ctgtgcagtc ggtaccattt ctcaaccgcc aggatggcct gcccagggtg 15000
gttatctatg gggcgggggc ggccggcaac cagttggttg cggcgttgcg tctcggtcgg 15060
gcgatgcgtc cggtggcgtt catcgatgac gacaagcaga tcgccaaccg ggtcattgcc 15120
ggtctgcggg tctataccgc caagcatatc cgccagatga tcgacgagac gggcgcgcag 15180
gaggttctcc tggcgattcc ttccgccact cgggcccggc gccgagagat tctcgagtcc 15240
ctggagccgt tcccgctgca cgtgcgcagc atgcccggct tcatggacct ggccagcggc 15300
cgggtcaagg tggatgacct gcaggaggtg gacatcgctg acctgctggg gcgcgacagc 15360
gtcgcaccgc gcaaggagct gctggaacgg tgcatccgcg gtcaggtggt gatggtgacc 15420
ggggcgggcg gctctatcgg ttcggaactc tgtcggcaga tcatgagttg ttcgcctagc 15480
gtgctgatcc tgttcgaaca cagcgaatac aacctctata gcatccatca ggaactggag 15540
cgtcggatca agcgcgagtc gctttcggtg aacctgttgc cgatcctcgg ttcggtgcgc 15600
aatcccgagc gcctggtgga cgtgatgcgt acctggaagg tcaataccgt ctaccatgcg 15660
gcggcctaca agcatgtgcc gatcgtcgag cacaacatcg ccgagggcgt tctcaacaac 15720
gtgataggca ccttgcatgc ggtgcaggcc gcggtgcagg tcggcgtgca gaacttcgtg 15780
ctgatttcca ccgacaaggc ggtgcggccg accaatgtga tgggcagcac caagcgcctg 15840
gcggaaatgg tccttcaggc gctcagcaac gaatcggcgc cggtgctgtt cggcgaccgg 15900
aaggacgtgc atcacgtcaa caagacccgt ttcaccatgg tccgcttcgg caacgtcctc 15960
ggttcgtccg gttcggtcat tccgctgttc cgcgagcaga tcaagcgcgg cggcccggtg 16020
acggtcaccc acccgagcat cacccgttac ttcatgacca ttcccgaggc ggcgcagttg 16080
gtcatccagg ccggttcgat ggggcagggc ggagatgtat tcgtgctgga catggggccg 16140
ccggtgaaga tcctggagct cgccgagaag atgatccacc tgtccggcct gagcgtgcgt 16200
tccgagcgtt cgccccatgg tgacatcgcc atcgagttca gtggcctgcg tcctggcgag 16260
aagctctacg aagagctgct gatcggtgac aacgtgaatc ccaccgacca tccgatgatc 16320
atgcgggcca acgaggaaca cctgagctgg gaggccttca aggtcgtgct ggagcagttg 16380
ctggccgccg tggagaagga cgactactcg cgggttcgcc agttgctgcg ggaaaccgtc 16440
agcggctatg cgcctgacgg tgaaatcgtc gactggatct atcgccagag gcggcgagaa 16500
ccctgagtca tcgttctccg gaaaaggccg cctagcggcc ttttttgttt tctccgtacg 16560
atgtttccgg tgccggacca ggaagcgact gctttgctgg ggctgtcgat ccaggtgcgt 16620
tccacggcga taaggtggtt tcgtggatgg gcaacatgtg 16660
<210> 5
<211> 972
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 5
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60
gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120
aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180
agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240
attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300
ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360
tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420
aacggcaacg tgaccggcga tgataccggc aaaattggtg gactgattgg cgcgaacgtg 480
agcattggcc ataccctgaa atatgtgcag ccggatttta aaaccattct ggaaagcccg 540
accgataaaa aagtgggctg gaaagtgatt tttaacaaca tggtgaacca gaactggggc 600
ccgtatgatc gtgatagctg gaacccggtg tatggcaacc agctgtttat gaaaacccgt 660
aacggcagca tgaaagcggc ggataacttt ctggatccga acaaagcgag cagcctgctg 720
agcagcggct ttagcccgga ttttgcgacc gtgattacca tggatcgtaa agcgagcaaa 780
cagcagacca acattgatgt gatttatgaa cgtgtgcgtg atgattatca gctgcattgg 840
accagcacca actggaaagg caccaacacc aaagataaat ggattgatcg tagcagcgaa 900
cgttataaaa ttgattggga aaaagaagaa atgaccaacg gcagccatca tcatcatcat 960
cattaggtcg ac 972
<210> 6
<211> 990
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 6
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60
gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120
aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180
agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240
attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300
ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360
tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420
aacggcaacg tgaccggcga tgataccggc aaaattggtg gactgattgg cgcgaacgtg 480
agcattggcc ataccctgaa atatgtgcag ccggatttta aaaccattct ggaaagcccg 540
accgataaaa aagtgggctg gaaagtgatt tttaacaaca tggtgaacca gaactggggc 600
ccgtatgatc gtgatagctg gaacccggtg tatggcaacc agctgtttat gaaaacccgt 660
aacggcaaag atcaaaatag aactaaaatg aaagcggcgg ataactttct ggatccgaac 720
aaagcgagca gcctgctgag cagcggcttt agcccggatt ttgcgaccgt gattaccatg 780
gatcgtaaag cgagcaaaca gcagaccaac attgatgtga tttatgaacg tgtgcgtgat 840
gattatcagc tgcattggac cagcaccaac tggaaaggca ccaacaccaa agataaatgg 900
attgatcgta gcagcgaacg ttataaaatt gattgggaaa aagaagaaat gaccaacggc 960
agccatcatc atcatcatca ttaagtcgac 990
<210> 7
<211> 990
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 7
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60
gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120
aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180
agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240
attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300
ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360
tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420
aacggcaacg tgaccggcga tgataccggc aaaattggtg gactgattgg cgcgaacgtg 480
agcattggcc ataccctgaa atatgtgcag ccggatttta aaaccattct ggaaagcccg 540
accgataaaa aagtgggctg gaaagtgatt tttaacaaca tggtgaacca gaactggggc 600
ccgtatgatc gtgatagctg gaacccggtg tatggcaacc agctgtttat gaaaacccgt 660
aacggcagca tgaaagcggc ggataacttt ctggatccga acaaagcgag cagcctgctg 720
agcagcggct ttagcccgga ttttgcgacc gtgattacca tggatcgtaa agcgaaagat 780
caaaatagaa ctaaaaaaca gcagaccaac attgatgtga tttatgaacg tgtgcgtgat 840
gattatcagc tgcattggac cagcaccaac tggaaaggca ccaacaccaa agataaatgg 900
attgatcgta gcagcgaacg ttataaaatt gattgggaaa aagaagaaat gaccaacggc 960
agccatcatc atcatcatca ttaagtcgac 990
<210> 8
<211> 990
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 8
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60
gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120
aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180
agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240
attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300
ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360
tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420
aacggcaacg tgaccggcga tgataccggc aaaattggtg gactgattgg cgcgaacgtg 480
agcattggcc ataccctgaa atatgtgcag ccggatttta aaaccattct ggaaagcccg 540
accgataaaa aagtgggctg gaaagtgatt tttaacaaca tggtgaacca gaactggggc 600
ccgtatgatc gtgatagctg gaacccggtg tatggcaacc agctgtttat gaaaacccgt 660
aacggcagca tgaaagcggc ggataacttt ctggatccga acaaagcgag cagcctgctg 720
agcagcggct ttagcccgga ttttgcgacc gtgattacca tggatcgtaa agcgagcaaa 780
cagcagacca acattgatgt gatttatgaa cgtgtgcgtg atgattatca gctgcattgg 840
accagcacca actggaaagg caccaacacc aaagataaag atcaaaatag aactaaatgg 900
attgatcgta gcagcgaacg ttataaaatt gattgggaaa aagaagaaat gaccaacggc 960
agccatcatc atcatcatca ttaagtcgac 990
<210> 9
<211> 1659
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 9
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcc 60
gcgagcgaaa acagcgtgac ccagagcgat agcgcgagca acgaaagcaa aagcaacgat 120
agcagcagcg tgagcgcggc gccgaaaacc gatgatacca acgtgagcga taccaaaacc 180
agcagcaaca ccaacaacgg cgaaaccagc gtggcgcaga acccggcgca gcaggaaacc 240
acccagagca gcagcaccaa cgcgaccacc gaagaaaccc cggtgaccgg tgaagccacc 300
accaccacca ccaaccaggc caacaccccg gcgaccaccc agagcagcaa caccaacgcg 360
gaagaactgg tgaaccagac cagcaacgaa accaccttta acgataccaa caccgtgagc 420
agcgtgaaca gcccgcagaa cagcaccaac gcggaaaacg tgagcaccac ccaggatacc 480
agcaccgaag cgaccccgag caacaacgaa agcgcgccgc agagcaccga tgcgagcaac 540
aaagatgtgg tgaatcaggc cgttaatacc agcgcgccgc gtatgcgtgc ctttagcctg 600
gcggccgtgg ccgccgatgc tccagcagca ggtaccgata ttaccaacca gctgaccaac 660
gtgaccgtgg gcattgatag cggcaccacc gtgtatccgc atcaggcagg ttatgtgaaa 720
ctgaactatg gctttagcgt gccgaacagc gcggtgaaag gcgatacctt taaaattacc 780
gtgccgaaag aactgaacct gaacggcgtg accagcaccg cgaaagtgcc gccgattatg 840
gcaggtgatc aggtgctggc gaacggcgtg attgatagcg atggcaacgt gatttatacc 900
tttaccgatt atgtgaacac caaagatgat gtgaaagcga ccctgaccat gccagcatat 960
attgatccgg aaaacgtgaa gaaaaccggc aacgtgaccc tggcgaccgg cattggcagc 1020
accaccgcga acaaaaccgt tctggtggat tatgaaaaat acggcaaatt ctacaacctg 1080
agcatcaaag gcaccatcga tcagatcgat aaaaccaaca acacctatcg tcagaccatt 1140
tatgtgaacc cgagcggcga taacgtgatt gcgccggtgc tgaccggcaa cctgaaaccg 1200
aacaccgata gcaacgcgct gattgatcag cagaacacca gcattaaagt gtataaagtg 1260
gataacgcgg cggatctgag cgaaagctat tttgtgaacc cggaaaactt tgaagatgtg 1320
accaacagcg tgaacattac ctttccgaac ccgaaccagt ataaagtgga atttaacacc 1380
ccggatgatc agattaccac cccgtatatt gtggtggtga acggccatat tgatccgaac 1440
agcaaaggcg atctggcgct gcgtagcacc ctgtatggct ataacagcaa cattatttgg 1500
cgtagcatga gctgggataa cgaagtggcg tttaacaacg gcagcggcag cggcgatggc 1560
attgataaac cggtggtgcc ggaacagccg gatgaaccgg gcgaaattga accgattccg 1620
gaagatggca gccatcatca tcatcatcat taggtcgac 1659
<210> 10
<211> 1677
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 10
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcc 60
gcgagcgaaa acagcgtgac ccagagcgat agcgcgagca acgaaagcaa aagcaacgat 120
agcagcagcg tgagcgcggc gccgaaaacc gatgatacca acgtgagcga taccaaaacc 180
agcagcaaca ccaacaacgg cgaaaccagc gtggcgcaga acccggcgca gcaggaaacc 240
acccagagca gcagcaccaa cgcgaccacc gaagaaaccc cggtgaccgg tgaagccacc 300
accaccacca ccaaccaggc caacaccccg gcgaccaccc agagcagcaa caccaacgcg 360
gaagaactgg tgaaccagac cagcaacgaa accaccttta acgataccaa caccgtgagc 420
agcgtgaaca gcccgcagaa cagcaccaac gcggaaaacg tgagcaccac ccaggatacc 480
agcaccgaag cgaccccgag caacaacgaa agcgcgccgc agagcaccga tgcgagcaac 540
aaagatgtgg tgaatcaggc cgttaatacc agcgcgccgc gtatgcgtgc ctttagcctg 600
gcggccgtgg ccgccgatgc tccagcagca ggtaccgata ttaccaacca gctgaccaac 660
gtgaccgtgg gcattgatag cggcaccacc gtgtatccgc atcaggcagg ttatgtgaaa 720
ctgaactatg gctttagcgt gccgaacagc gcggtgaaag gcgatacctt taaaattacc 780
gtgccgaaag aactgaacct gaacggcgtg accagcaaag atcaaaatag aactaaagcg 840
aaagtgccgc cgattatggc aggtgatcag gtgctggcga acggcgtgat tgatagcgat 900
ggcaacgtga tttatacctt taccgattat gtgaacacca aagatgatgt gaaagcgacc 960
ctgaccatgc cagcatatat tgatccggaa aacgtgaaga aaaccggcaa cgtgaccctg 1020
gcgaccggca ttggcagcac caccgcgaac aaaaccgttc tggtggatta tgaaaaatac 1080
ggcaaattct acaacctgag catcaaaggc accatcgatc agatcgataa aaccaacaac 1140
acctatcgtc agaccattta tgtgaacccg agcggcgata acgtgattgc gccggtgctg 1200
accggcaacc tgaaaccgaa caccgatagc aacgcgctga ttgatcagca gaacaccagc 1260
attaaagtgt ataaagtgga taacgcggcg gatctgagcg aaagctattt tgtgaacccg 1320
gaaaactttg aagatgtgac caacagcgtg aacattacct ttccgaaccc gaaccagtat 1380
aaagtggaat ttaacacccc ggatgatcag attaccaccc cgtatattgt ggtggtgaac 1440
ggccatattg atccgaacag caaaggcgat ctggcgctgc gtagcaccct gtatggctat 1500
aacagcaaca ttatttggcg tagcatgagc tgggataacg aagtggcgtt taacaacggc 1560
agcggcagcg gcgatggcat tgataaaccg gtggtgccgg aacagccgga tgaaccgggc 1620
gaaattgaac cgattccgga agatggcagc catcatcatc atcatcatta agtcgac 1677
<210> 11
<211> 1677
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 11
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcc 60
gcgagcgaaa acagcgtgac ccagagcgat agcgcgagca acgaaagcaa aagcaacgat 120
agcagcagcg tgagcgcggc gccgaaaacc gatgatacca acgtgagcga taccaaaacc 180
agcagcaaca ccaacaacgg cgaaaccagc gtggcgcaga acccggcgca gcaggaaacc 240
acccagagca gcagcaccaa cgcgaccacc gaagaaaccc cggtgaccgg tgaagccacc 300
accaccacca ccaaccaggc caacaccccg gcgaccaccc agagcagcaa caccaacgcg 360
gaagaactgg tgaaccagac cagcaacgaa accaccttta acgataccaa caccgtgagc 420
agcgtgaaca gcccgcagaa cagcaccaac gcggaaaacg tgagcaccac ccaggatacc 480
agcaccgaag cgaccccgag caacaacgaa agcgcgccgc agagcaccga tgcgagcaac 540
aaagatgtgg tgaatcaggc cgttaatacc agcgcgccgc gtatgcgtgc ctttagcctg 600
gcggccgtgg ccgccgatgc tccagcagca ggtaccgata ttaccaacca gctgaccaac 660
gtgaccgtgg gcattgatag cggcaccacc gtgtatccgc atcaggcagg ttatgtgaaa 720
ctgaactatg gctttagcgt gccgaacagc gcggtgaaag gcgatacctt taaaattacc 780
gtgccgaaag aactgaacct gaacggcgtg accagcaccg cgaaagtgcc gccgattatg 840
gcaggtgatc aggtgctggc gaacggcgtg attgatagcg atggcaacgt gatttatacc 900
tttaccgatt atgtgaacac caaagataaa gatcaaaata gaactaaagt gaaagcgacc 960
ctgaccatgc cagcatatat tgatccggaa aacgtgaaga aaaccggcaa cgtgaccctg 1020
gcgaccggca ttggcagcac caccgcgaac aaaaccgttc tggtggatta tgaaaaatac 1080
ggcaaattct acaacctgag catcaaaggc accatcgatc agatcgataa aaccaacaac 1140
acctatcgtc agaccattta tgtgaacccg agcggcgata acgtgattgc gccggtgctg 1200
accggcaacc tgaaaccgaa caccgatagc aacgcgctga ttgatcagca gaacaccagc 1260
attaaagtgt ataaagtgga taacgcggcg gatctgagcg aaagctattt tgtgaacccg 1320
gaaaactttg aagatgtgac caacagcgtg aacattacct ttccgaaccc gaaccagtat 1380
aaagtggaat ttaacacccc ggatgatcag attaccaccc cgtatattgt ggtggtgaac 1440
ggccatattg atccgaacag caaaggcgat ctggcgctgc gtagcaccct gtatggctat 1500
aacagcaaca ttatttggcg tagcatgagc tgggataacg aagtggcgtt taacaacggc 1560
agcggcagcg gcgatggcat tgataaaccg gtggtgccgg aacagccgga tgaaccgggc 1620
gaaattgaac cgattccgga agatggcagc catcatcatc atcatcatta agtcgac 1677
<210> 12
<211> 1677
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 12
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcc 60
gcgagcgaaa acagcgtgac ccagagcgat agcgcgagca acgaaagcaa aagcaacgat 120
agcagcagcg tgagcgcggc gccgaaaacc gatgatacca acgtgagcga taccaaaacc 180
agcagcaaca ccaacaacgg cgaaaccagc gtggcgcaga acccggcgca gcaggaaacc 240
acccagagca gcagcaccaa cgcgaccacc gaagaaaccc cggtgaccgg tgaagccacc 300
accaccacca ccaaccaggc caacaccccg gcgaccaccc agagcagcaa caccaacgcg 360
gaagaactgg tgaaccagac cagcaacgaa accaccttta acgataccaa caccgtgagc 420
agcgtgaaca gcccgcagaa cagcaccaac gcggaaaacg tgagcaccac ccaggatacc 480
agcaccgaag cgaccccgag caacaacgaa agcgcgccgc agagcaccga tgcgagcaac 540
aaagatgtgg tgaatcaggc cgttaatacc agcgcgccgc gtatgcgtgc ctttagcctg 600
gcggccgtgg ccgccgatgc tccagcagca ggtaccgata ttaccaacca gctgaccaac 660
gtgaccgtgg gcattgatag cggcaccacc gtgtatccgc atcaggcagg ttatgtgaaa 720
ctgaactatg gctttagcgt gccgaacagc gcggtgaaag gcgatacctt taaaattacc 780
gtgccgaaag aactgaacct gaacggcgtg accagcaccg cgaaagtgcc gccgattatg 840
gcaggtgatc aggtgctggc gaacggcgtg attgatagcg atggcaacgt gatttatacc 900
tttaccgatt atgtgaacac caaagatgat gtgaaagcga ccctgaccat gccagcatat 960
attgatccgg aaaacgtgaa gaaaaccggc aacgtgaccc tggcgaccgg cattggcagc 1020
accaccgcga acaaaaccgt tctggtggat tatgaaaaat acggcaaatt ctacaacctg 1080
agcatcaaag gcaccatcga tcagatcgat aaaaccaaca acacctatcg tcagaccatt 1140
tatgtgaacc cgagcggcga taacgtgatt gcgccggtgc tgaccggcaa cctgaaaccg 1200
aacaccgata gcaacgcgct gattgatcag cagaacacca gcattaaagt gtataaagtg 1260
gataacgcgg cggatctgag cgaaagctat tttgtgaacc cggaaaactt tgaagatgtg 1320
accaacagcg tgaacattac ctttccgaac ccgaaccagt ataaagtgga atttaacacc 1380
ccggatgatc agattaccac cccgtatatt gtggtggtga acggccatat tgatccgaac 1440
agcaaaggcg atctggcgct gcgtagcacc ctgtatggct ataacagcaa cattatttgg 1500
cgtagcatga gctgggataa cgaagtggcg tttaacaacg gcaaagatca aaatagaact 1560
aaaggcagcg gcgatggcat tgataaaccg gtggtgccgg aacagccgga tgaaccgggc 1620
gaaattgaac cgattccgga agatggcagc catcatcatc atcatcatta agtcgac 1677
<210> 13
<211> 643
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 13
Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser
1 5 10 15
Ala Ser Ala Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys
20 25 30
Ala Cys Val Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser
35 40 45
Val Asp Pro Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr
50 55 60
Ser Met Val Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp
65 70 75 80
Asn Ala Leu Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly
85 90 95
Gly Val Glu Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala
100 105 110
Arg Gly Ser Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys
115 120 125
Pro Ser Asn Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln
130 135 140
Leu Ser His Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu
145 150 155 160
Leu Ala Lys Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu
165 170 175
Ser Asn Glu Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser
180 185 190
Val Val Met Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu
195 200 205
Trp Ala Ser Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val
210 215 220
Tyr Asn Tyr Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu
225 230 235 240
Gly Lys Ile Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu
245 250 255
Asp Ile Lys Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg
260 265 270
Leu His Phe Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln
275 280 285
Ala Cys His Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg
290 295 300
Gly Trp Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val
305 310 315 320
Ala Leu Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val
325 330 335
Ile Arg Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu
340 345 350
Ala Ile Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala
355 360 365
Ala Ala Glu Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu
370 375 380
Ala Gly Ala Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala
385 390 395 400
Lys Asp Gln Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser
405 410 415
Gly Asp Ala Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu
420 425 430
Gly Asp Gly Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp
435 440 445
Thr Val Glu Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly
450 455 460
Tyr Val Phe Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser
465 470 475 480
Ile Val Phe Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile
485 490 495
Trp Arg Gly Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr
500 505 510
Ala Gln Asp Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala
515 520 525
Leu Leu Arg Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg
530 535 540
Thr Gly Leu Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg
545 550 555 560
Leu Ile Gly His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro
565 570 575
Glu Glu Glu Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu
580 585 590
Arg Thr Val Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val
595 600 605
Gly Gly Asp Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile
610 615 620
Ser Ala Leu Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu
625 630 635 640
Asp Leu Lys
<210> 14
<211> 624
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 14
Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys Ala Cys Val
1 5 10 15
Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser Val Asp Pro
20 25 30
Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr Ser Met Val
35 40 45
Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp Asn Ala Leu
50 55 60
Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly Gly Val Glu
65 70 75 80
Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala Arg Gly Ser
85 90 95
Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys Pro Ser Asn
100 105 110
Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln Leu Ser His
115 120 125
Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu Leu Ala Lys
130 135 140
Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu Ser Asn Glu
145 150 155 160
Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser Val Val Met
165 170 175
Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu Trp Ala Ser
180 185 190
Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val Tyr Asn Tyr
195 200 205
Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu Gly Lys Ile
210 215 220
Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu Asp Ile Lys
225 230 235 240
Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg Leu His Phe
245 250 255
Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His
260 265 270
Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu
275 280 285
Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr
290 295 300
Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg Asn
305 310 315 320
Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg
325 330 335
Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu
340 345 350
Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala
355 360 365
Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Lys Asp Gln
370 375 380
Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser Gly Asp Ala
385 390 395 400
Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu Gly Asp Gly
405 410 415
Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp Thr Val Glu
420 425 430
Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly Tyr Val Phe
435 440 445
Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser Ile Val Phe
450 455 460
Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile Trp Arg Gly
465 470 475 480
Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr Ala Gln Asp
485 490 495
Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala Leu Leu Arg
500 505 510
Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg Thr Gly Leu
515 520 525
Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg Leu Ile Gly
530 535 540
His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro Glu Glu Glu
545 550 555 560
Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu Arg Thr Val
565 570 575
Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val Gly Gly Asp
580 585 590
Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile Ser Ala Leu
595 600 605
Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu Asp Leu Lys
610 615 620
<210> 15
<211> 1148
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 15
taatgaaata cctgctgccg accgctgctg ctggtctgct gctcctcgct gcccagccgg 60
cgatggccat gcatatgagc aaagaagaag caccaaaaat acaaatgccg cctcaacctg 120
taacaaccat gagtgctaaa tctgaagatt taccacttag ttttacttac cctgctaaac 180
ttgtcagtga ttatgatgtc attataaaac ctcaagttag cggcgtaata gtaaataaac 240
tttttaaagc tggagataag gtaaaaaaag gacaaacatt atttattata gaacaagata 300
aatttaaagc tagtgttgat tcagcttacg gacaagcttt aatggctaag gcaactttcg 360
aaaatgcaag caaggatttt aatcgttcta aagctctttt tagcaaaagt gcaatctctc 420
aaaaagaata cgactcttct cttgctacat ttaacaattc aaaagctagt ctagcaagtg 480
ctagagcaca gcttgcaaat gcaagaattg atctagatca taccgagata aaagctcctt 540
ttgatggtac tataggagat gctttagtta atataggaga ttatgtaagt gcttcaacaa 600
ctgaactagt tagagttaca aatttaaatc ctatttacgc agatttcttt atttcagata 660
cagataaact aaatttagtc cgcaatactc aaagtggaaa atgggattta gacagcattc 720
atgcaaattt aaatcttaat ggagaaaccg ttcaaggcaa actttatttt attgattcgg 780
ttatagatgc taatagtgga acagtaaaag ccaaagccgt atttgataac aataactcaa 840
cacttttacc gggtgctttt gcaacaatta cttcagaagg ttttatacaa aaaaatggct 900
ttaaagtgcc tcaaataggt gttaaacaag atcaaaatga tgtttatgtt cttcttgtta 960
aaaatggaaa agtagaaaaa tcttctgtac atataagcta ccaaaacaat gaatacgcca 1020
ttattgacaa aggattgcaa aatggcgata aaatcatttt agataacttt aaaaaaattc 1080
aagttggtag cgaagttaaa gaaattggag cacaactcga gcaccaccac caccaccact 1140
gagtcgac 1148
<210> 16
<211> 990
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 16
catatgaaga aaatctggct ggcgctggcg ggcctggtgc tggcgtttag cgctagcgcg 60
gcggatagcg atattaacat taaaaccggc accaccgata ttggcagcaa caccaccgtg 120
aaaaccggcg atctggtgac ctatgataaa gaaaacggca tgctgaaaaa agtgttttat 180
agcttcatcg atgataaaaa ccataacaaa aaactgctgg tgatccgtac caaaggcacc 240
attgcgggcc agtatcgtgt gtatagcgaa gaaggcgcga acaaaagcgg cctggcgtgg 300
ccgagcgcgt ttaaagtgca gctgcagctg ccggataacg aagtggcgca gattagcgat 360
tattatccgc gtaacagcat tgataccaaa gaatatatga gcaccctgac ctatggcttt 420
aacggcaacg tgaccggcga tgataccggc aaagatcaaa atagaactaa aattggtgga 480
ctgattggcg cgaacgtgag cattggccat accctgaaat atgtgcagcc ggattttaaa 540
accattctgg aaagcccgac cgataaaaaa gtgggctgga aagtgatttt taacaacatg 600
gtgaaccaga actggggccc gtatgatcgt gatagctgga acccggtgta tggcaaccag 660
ctgtttatga aaacccgtaa cggcagcatg aaagcggcgg ataactttct ggatccgaac 720
aaagcgagca gcctgctgag cagcggcttt agcccggatt ttgcgaccgt gattaccatg 780
gatcgtaaag cgagcaaaca gcagaccaac attgatgtga tttatgaacg tgtgcgtgat 840
gattatcagc tgcattggac cagcaccaac tggaaaggca ccaacaccaa agataaatgg 900
attgatcgta gcagcgaacg ttataaaatt gattgggaaa aagaagaaat gaccaacggc 960
agccatcatc atcatcatca ttaagtcgac 990
<210> 17
<211> 19442
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 17
gaattccctg aggcaattct tctttgatga cggctgatgg tgaggttgac ctggtgaagc 60
tggtcaagga gctttgggtt aacaaggttc tgattcttct gactactctt cttgcattaa 120
tcgggtcttt tacctatgcg tatctgagta agcctgtata tgaatatagg gttgcagtag 180
tgcctcctgc tcttgggtct atcgaaggtt tcaatgttgg tagaagggag aatggcctag 240
atgcatatac tgttagaagt atctatgcga tcttttcgcg caatctgctt tcggatgaga 300
ataaaaaaga gttcttctat aagatatacc ttccccaggt gggtgaggga gcggaaagcg 360
aagatgagca ggaggagttt tataagaagt tctccaaaga ggtaaagatt gatcctgcta 420
acaagccaga tgcagaccgt tatacggtaa ttgtggaggg cacgaagcga gaggttcttg 480
ctacatgggc acaagctttc gtgcgtttgg ctgcggatcg ggccgtgcat gaggttattg 540
atagtgcagg tagagatttc caggtaagaa atgctgcaat gcagagccgc ataaccgtgc 600
tgcagaatat ggcgaagggc cgccgtgatg atagaattgc acgtttgaag gaggcattgc 660
tgattgcgga gtcgctcaag atagatggcc cgccattaat agaaggggcg tccgagcaac 720
aactctcctc gatcatggat ggtgacttga tgtacatgcg aggagctaag gcgctgcgcg 780
ctgaaatcaa caatcttgag tcgcgtagtg tagatgctcc attcattcct gagttgagaa 840
ctctccaaga gaaactatct tggaactcca gtttgtctgt ggattctgat gcggtggctg 900
tctacaagga agacgaggga ctctcttttt caaatcaacc cattaagccg aagaagattc 960
ttatagttac tataggtact ttggcaggat tgataattgg aattctactc gcagtgctcg 1020
ctggttttat aaggaagctt cgtagcgatg gctctcttcg ctaagttttg atctaaaccc 1080
tgatgccact tactggcatc agggcttact tgttgtagtt gttgaattgt attagggggt 1140
atcgagtaga atgtcaataa ggcggggcgt tttctactcc ggtatatcca tgggcagcaa 1200
ctatcttttg cctcttgctg cgattccttt tctcacgaga acattgtcaa gcgaagcgtt 1260
tggccaattg gtgattgccc aggccgtggc tgtcattcta tgtcaactgg tagactttgg 1320
atttattctg gcaggatcaa gaaaggctgc cattatcgat aacaaagttg aactgtctag 1380
tttcttttct gttgtacaga gtgctagatt cttattgttg ctgctttcac ttttagtgct 1440
ggccattttg gctgtatctt ctattttacc aatccccttg cttgtattgg ttgcggctgc 1500
tcttccggca gtagttggaa attatcttca agcagtatgg ttctttcagg gaagagcgct 1560
gtttggatgg ttggcgctta ccaatttttt gtctaaggta ttttatttcc tattggtcgt 1620
tttttttgtc acgaaggatt ctgaccttgt gctggcttcg ttggggtttg gtttttccta 1680
tgtcataggt ggaagtgctc tctgttgtat tttattttct atgggaatac ggtggcgccc 1740
ggttctcgag aaagacagaa ttctcgatat attgcgtgac ggtgctcgat cttttctttc 1800
tctggctttt cttagcttgc acatgcaagt gctcgttgcg gcggttggtg ttgttggtgg 1860
agcctccgcg gccggagtgc tttctactgc ggataaattc cttcgcggga tcgcggctgc 1920
tacttcaccc atagctagcg ctctatttcc gacttttagc aggatgtatg cgagtgccga 1980
cccggcagtc ggcagtttaa gaaggaaagc gctaggtctg atgttactaa tagctattcc 2040
tagttgttta tttcttttct tattttctga atacatttca tatctcctat tcccggaaca 2100
gtccagaggt ctaactgttg taataagaat gttttcgata gtgccagtgt ttgcttgtat 2160
tggtgttctg tatggagggt tgactcttgt tccttctggg tatgatggtg tatatttgcg 2220
agcaattttt tttgcggaat tgggcggggt attaacattt atcctcttgg cgctttgggg 2280
ggatgagctt tttggagcgt ggacgctggt cgttacagag gtctctttgg ggatgggaat 2340
gtttttcctg gccacggtta agttgagaga gaaaagggga ctttgatctt aagatgagga 2400
tagcgattga aaagataatt ggtttgctga aaaaccagtc ctctaaagaa tcgaatgtta 2460
agattcatcg cttggcgtat attacaaact caaaatttga tggcaataac tatatagata 2520
gatggtgtaa aatcaggaat tctcacattg gtgaatacag ttatattgga tttggtagtg 2580
attttaataa tgtagaagta ggaagatatt gttcgatatc ttcggatgta aaaattgggt 2640
taggaaaaca tcctacacac ttttttagct catcaccgat tttttattct aataataatc 2700
catttaacat aaagcaaaag tttatagact ttaatgacca accaagccgt acaacaatta 2760
aaaatgatgt gtggattggt gcaaatgtaa ttattatgga tggattaaca ataaatactg 2820
gtgcagtcat agcagccggc tcagttgtta ctaaaaatgt aggagcatat gaggttgttg 2880
gtggggttcc tgcaaaagtg attaagaagc gatttgacaa taaaacaatt gaaaaacttt 2940
tggaaagcaa gtggtgggag aaaacgcctg acaaactaaa aggattttcg gttgaatatt 3000
taaataaaaa ggatactagt tatccgtatg atgtgccgga ttatgcgtaa caggaggtgt 3060
acaatgagca ggaggtgtac aatgagaatt ttaaatattg tatcgagtaa tattgttcaa 3120
gacccaaggg tacttaaaca aatagaaaca attaaaggcg ttacgaatga ttataaaatt 3180
gttggaatga ataattcaca agctactaat aggcgattgg aaaatttaga ttgtaattat 3240
cgtttgttag gtagcaaggt agatcccaaa aatattcttt ctaaattaat taagcgtata 3300
agatttgcaa caggtgttat ccgagaaatt aaagctttta aacctgacgt gattcatgca 3360
aatgatttcg acgtattatt aatggtctat ttaagcaatt ataaaaaagc taatattgtt 3420
tatgatgcgc atgaaatata tgcgaaaaat gcctttatta ataaagttcc acttatttca 3480
aagtttgtag aaagtataga aaaacacata gtaaaacatc gtgttaatgc cttcgtaaca 3540
gtaagtcatg cagcaaaaga atattatcaa tctaaaggat ataagaagga agcgaatgtt 3600
attacgaatg cacctatttt aaatgatagc agagaattta aagaaatcga aaactttaaa 3660
gaaatcgtat atcaaggtca aattgtaatg gacagaggat atgaagagtt tattattgct 3720
tcatcagctt ttaaacaaaa tgctccttca ttcataattc gagggtttgg tccgcatgaa 3780
gaagtgataa aagaactgat tagttataac tcggaaaata ttaggttgga taaaccagtt 3840
gaagtaaaag aattggttga taagttagca gaaagtaatg ttggtgttat cttgacgaaa 3900
cctgtatcta ttaattttga atatacagta tctaataaaa tttttgaatg tatacatgct 3960
ggtttaccag taattttatc tcctgtcaaa gagcatattt atctcaatga aaaatataaa 4020
tttggcattg ttttaaagga agttacgccg ttagaaattg aaaaggcggt tagaaaatta 4080
agagataatc acgatttgtt taatcattta cgtcaaaatg caattaaggc gtctaaaatt 4140
ttgaattggc aaatagaaag tgaacgatta gtagaattat ataaatttga acaaaaactc 4200
atctcagaag aggatctgta aggacccggg gatcctctag caggaggaac tatgaaattt 4260
tttgtacttt gtgcaattat cagcatgaac atatttatag taatctctac atttactaaa 4320
gaagtattag ggttccctat agagccggtg tattactcaa ccatggttgg tatagcatta 4380
attactacgg tgtttgctat ttataagata attgtcacgc aagaaattcc gcgagggtta 4440
atattattaa ttgctatatg tttgctttat ctagcttttt attatttttc accagataag 4500
gaagagaaac tagctaaaaa taatattcta ttctttttaa catgggcagt tccagcggca 4560
attagtggta tttatattaa atatataaac aaggctacgg tagaaagatt ttttaaatta 4620
gtatttttca tattttctat ttcatttatt tttgtaattt taataccaaa acttacaggt 4680
gagataccta gctatatcaa ttttggactt atgaactatc aaaacgcttc gtacctttca 4740
gcatttactg ccggattagg catttatttc attatgaaag gttcagtgaa acataagtgg 4800
atatatgttc tatttacaat aattgatatc cctattgtgt ttataccagg agggcgtgga 4860
ggtgctattt tattaattct ttacggctta tttgcattta tacttattac gtttaaaaga 4920
ggaataccta ttgcagtaaa aagcattatg tatatttttg cattaagcat atctagtgta 4980
ttgatttact ttctttttac aaaaggttcg aatactagaa cattttcata tctacaaggt 5040
ggaacactta atttagaagg tacttctgga agaggaccga tttatgaaaa aggtatttac 5100
tttattcaac aaagtccgtt attaggctat gggccattta actattataa actaatcgga 5160
aatataccac ataacatcat tattgagttg attctatcat ttggcttatt agggtttttt 5220
atcataatga tttgcatttt gctactagtt tataaaatga ttaggaacta tgatccaaac 5280
actatagatt tactcgttat gtttatagca atctatccaa tcacattatt aatgtttagt 5340
tcaaattatt tagttgtaag tgaattttgg tttgtgttgt tctattttat tacaaaagga 5400
cggcgtcatc atggtgatta taaagatgat gatgataaat aagtttaaac aggaggcatc 5460
atggttaaga aagtttttat tatggatagc gtaaagacaa taattggtac gttgcttata 5520
gctttaggat tacaattttt agcttatcca attattaatc aacgagtagg taatgaagcg 5580
tttggttcta ttttaacgat ttatacaata ataacaatca cgagtgttgt attaggcaat 5640
acgcttaaca atatacgatt aattaatatg aatctataca aatccaatca ttactactgg 5700
aaatttgtgt cgatactttt aatttcaatt ctgattgaga gtatagcttt aattattgta 5760
tttctttact tttttaattt gaacaccatc gatattatct ttttaattct acttaatatt 5820
ttaatgtgtt taaggattta tctgaatgta ttttttagga tgactttaaa atataatcag 5880
attttgtata ttgctcttat tcaattttta ggtttgctga taggactatt tctatattat 5940
ttaatccaaa actggattgt ttgttttatt accagtgaat tgtttgcaac gatatataca 6000
ttggttaaat tacggggatt aactataggc gagtatcaaa gtgaagataa taatgtggtc 6060
aaagattatg tgatgctact gagtacaaat agccttaata atttgaatct ctacttagat 6120
agattaatct tattaccaat tataggtgga acagctgtaa ctatatcatt tctttcaaca 6180
tttattggga aaatgttagc tacatttctg tatccgatta ataatgtagt actttcatat 6240
atttctgtaa atgaaagcga caatataaag aagcaatatt tgaaaactaa tctatttgct 6300
atagctgcac tatgtttagt catgattata tgttatccaa ttacattaat tattgtctct 6360
ttactgtata acattgattc aagtttatat tcgaagttta ttattttagg taatataggt 6420
gttttattca atgcagtgag tattatgatc caaactttaa atacaaaaca cgcatcaata 6480
acattacaag cgaattatat gacgcttcac acgattacat ttatattcat aactatttta 6540
atgacaattg cgtttggtct aaatggattc ttttggacaa cgctgttcag caacattatt 6600
aagtatgtga ttttaaatat tataggttta aagtctaaat tcattaataa aaaggacgtc 6660
gatagttatc cgtatgatgt gccggattat gcgtaagtgc accatatgaa tatcctcctt 6720
agttcctatt ccgaagttcc tattctctag aaagtatagg aacttcggcg cgcctacctg 6780
tgacggaaga tcacttcgca gaataaataa atcctggtgt ccctgttgat accgggaagc 6840
cctgggccaa cttttggcga aaatgagacg ttgatcggca cgtaagaggt tccaactttc 6900
accataatga aataagatca ctaccgggcg tattttttga gttgtcgaga ttttcaggag 6960
ctaaggaagc taaaatggag aaaaaaatca ctggatatac caccgttgat atatcccaat 7020
ggcatcgtaa agaacatttt gaggcatttc agtcagttgc tcaatgtacc tataaccaga 7080
ccgttcagct ggatattacg gcctttttaa agaccgtaaa gaaaaataag cacaagtttt 7140
atccggcctt tattcacatt cttgcccgcc tgatgaatgc tcatccggaa ttacgtatgg 7200
caatgaaaga cggtgagctg gtgatatggg atagtgttca cccttgttac accgttttcc 7260
atgagcaaac tgaaacgttt tcatcgctct ggagtgaata ccacgacgat ttccggcagt 7320
ttctacacat atattcgcaa gatgtggcgt gttacggtga aaacctggcc tatttcccta 7380
aagggtttat tgagaatatg tttttcgtct cagccaatcc ctgggtgagt ttcaccagtt 7440
ttgatttaaa cgtggccaat atggacaact tcttcgcccc cgttttcacc atgggcaaat 7500
attatacgca aggcgacaag gtgctgatgc cgctggcgat tcaggttcat catgccgttt 7560
gtgatggctt ccatgtcggc agatgcttaa tgaatacaac agtactgcga tgagtggcag 7620
ggcggggcgt aaggcgcgcc atttaaatga agttcctatt ccgaagttcc tattctctag 7680
aaagtatagg aacttcgaag cagctccagc ctacacgtaa agaggtggtg tatggataag 7740
aactctgttc tgttaattac cggtggaact ggttcctttg gaaatgccgt tttgaagcgt 7800
tttctggata cagatattgg tgaaatacgt gtattcagtc gggatgagaa gaagcaagat 7860
gatatgcgta agtgctatgc tcaccccaag ttgaggtttt atattggaga tgtccgcgac 7920
tatcaaagca ctctgaatgc tactcgcggt gtggactaca ttttccatgc ggctgcattg 7980
aaacaggttc cctcttgtga gttctacccg atggaggctg tgaagaccaa tgtcatcgga 8040
acggaaaatg tcctcgaatc tgctatccag aatggcgtca aaaaagtcgt ttgtctgagt 8100
acggataagg cagtttaccc aatcaatgcc atgggtattt caaaggccat gatggaaaag 8160
gtcatggtcg ccaagtctcg aaacctggaa cgcactccta ccgtaatttg tggcacccgt 8220
tatggtaacg tcatggcttc aaggggctcg gtcattcctc tctttatcga gcaaatgcga 8280
tcaggccagc ctctcacaat cactgatcca aacatgacac gtttcatgat gacgcttacg 8340
gatgccgtag accttgtgct ttatgctttc gagcatggta ccaatggaga tctttttgta 8400
cagaaagcac cggctgcaac catcgaggtg ctggctcatg cgcttactca attgcttggc 8460
aagaatggtt atcctatcaa tgtaataggt acgcgtcatg gagagaagct ttatgaggcg 8520
cttcttagtc gagaggaaat ggcctgtgct gaagacatgg gtgactatta tcgtatcccc 8580
ccagatttgc gtgatctgaa ctatagtaag tttgtggagc aaggcgagga aaaaattact 8640
catacagagg actataattc tcataatacc aaacgtctgg atatcgaagg aatgaaaaag 8700
ctgttgctga agttggattt cattcgtgct attcagcgtg gcgagagtgc cagtccagag 8760
gaataaacga tgaaagttct tgtaactggc gcgaatggat ttgttggaag gaatctgtgc 8820
gctcatcttg cagagcgggg tggtatcgag gtggtgccat tcacccgcga gagtagtgtt 8880
ggtaatttgc ctgagctaat tcgttccgtc gattttattt ttcatcttgc cggggtcaat 8940
cgtccggaaa aaccagaaga gtttaagatc gggaattccg aactcacgta tgctctgtgt 9000
gaggcggtaa ggtccaatgg acgagccata ccacttcttt atacttcatc cattcaggct 9060
gaggtggata atgagtacgg tttaagcaag cgagccgcag aagagcatct ccaagtgcta 9120
ggtgaggata ttggttgtcc tgtctacata tttcgccttc ctaatgtatt cggtaaatgg 9180
tcgcgtccga attataattc agcggttgcg actttttgtc ataatattat tcgagatatt 9240
ccgattcaaa ttaacaattc ctcggcagag atcactcttg tatacataga tgatgtggtt 9300
cgcaccttca tgaaagtcat ggatgggaag ctatccaatg cagtttcact acaggtcgag 9360
ccccagtatc agatttctgt tggtgagctc gcagaacaat tgtatgagtt tcgtaatagt 9420
cgaaagtcac tgactaccgc aagggttggc tcgggattga cgcgcgcctt gtactcgact 9480
tatctaagtt tcttgccaga agatagtttt agttacgacg tgccaatgca ttcggatccg 9540
cgtggcacat tcgtcgagat gctgaagacc gcggactctg gccagttctc gttttttacg 9600
gctcatccag gtgttaccag gggcgggcat taccatcact cgaaaaccga aaagtttctg 9660
gttatcaaag ggatggcacg tttcaagttt agaaacatcc tgaccggggc attttacgaa 9720
atttgcacta atggtgaaaa ggcagaaatt gtcgaaacag tacctggatg gactcatgac 9780
attactaatg tcggaactga cgatatggta gtcatgttgt gggctaacga agtatttgat 9840
cgggaaaatc cggataccta cgcttgttca gtaggcgaag gtgcgtaagg tatagtgaga 9900
taacaatgca gaagctaaaa gtcgttacgg ttgttggaac tcgtcctgag attattcgct 9960
tgtctagggt catggcgaag cttgatcagt actgcgatca tgtacttgtc catactggac 10020
agaattatga ttacgaactt aatgaaatat tttttcagga cctcggtata agaaagccgg 10080
attattttct aaacgccgcc gggtcttccg gggctgaaac gatagggaat gtaataatcg 10140
cagtcgatcg tgttctgggc gaaatagatc ccgatgcgct gctcgtgctg ggtgatacca 10200
atagttgtat ggcggtactg cctgcaaaac ggcgtaagat accgaccttt catatggaag 10260
caggcaatcg ctgtttcgat atgcgtgtgc ctgaagagat aaatcggcgc attgtcgatc 10320
atacagctga tgtaaatttg acctatagta caattgcgcg tgattatctc ttgcgtgaag 10380
gactttctcc agacatggtt atcaagactg gtagccctat gttcgaagtt ctcgagcact 10440
atcgtgacgg gatcgagtcc tccgatattc ttgaaaggct cgggttgaaa acagagcggt 10500
tctttgtcgt gagtgcgcac cgagaggaaa acatagattc ggataagaat ttcttgaagt 10560
tggtttctat gctcaacgct gtggcagaaa agtactcgct gcccgtcatc gtatcaactc 10620
accctagaac aaaaaagaga attgaggcga cggaggcaaa gtttcacgag ggtattaaac 10680
tgctgaaacc cctcggcttt aaggattaca ataaactgca aattacagcc aaggcagtta 10740
tttctgacag tgggaccatc agtgaggagt cttcaatact gaattttccc gctttgaata 10800
ttcgtgaggc tcatgaacgc ccagaaggca tggaagaggc tgtggtgatg atggtcggac 10860
tggattcgga tcgagtacta caagcactcg aggtgttgga gggacagagg cgcgacgcag 10920
agcgcatgtt acgcttggtc gctgactata gcatgcccaa cgtttctgaa aagattgttc 10980
gcatagttca tagctatcgg gactatgtca tgcgaactgt ctggaaaaaa tattaacttg 11040
aggcgtggag ttgatggcaa ggatatttgt ggtttctgag tatgtcggtg ccaatcagaa 11100
ctccacggga tactattggg agaagataat aggaaagatg cagcgggagt ttggtgggct 11160
aaccgtaatt ttcccgctga ccgcaggtga aaccccgcct gtggtttcac cttccgttga 11220
gcaagaatgc tttaagtttc cgaggagcaa taagaatagg ctcctttcta gaggattggc 11280
gcagattttt caggcgtttc tgttctcagt aaaattgact tctcgtgcca gacgaggaga 11340
tgtggtattg agtggaacca accctgctct tctactgatg acgtttccct tgctaaggta 11400
tgccctcggt ttcaagtggg tgctgctggt gcatgatgtg tttcccgaga acttggtgcc 11460
ggcgggcgtt ctgaagaaag atagtattgc ctaccggctt ctacgtcgtc tcttttcttt 11520
catttactca tccgctgatc gtctagtcgt aatagggcgc gatatggaag ctcttatgaa 11580
agagaaggtg aatgacccgc gatctttggt ctttatttcg aattgggcct gtgagaaaga 11640
ggttttccca gtaccgagag aggatgctcc ttttatcaat attcctgaat ggaaaggtaa 11700
aagggttttc caattttttg gtaatgtcgg tcgattacaa ggtatagaaa acatactttc 11760
tgctattcag ttggttaaaa acgagaaggc ggcttttgct tttattggag atggtgcctt 11820
ggtcgacagt gtaaaaaaac acgcgctgga agatcagtgt gctcggttga ggtattttgg 11880
aaggctgcca ttagccgaaa agaattttgg tttggctgcc tgtgacgttg ccttagttac 11940
cttagaagaa ggaatgttcg ggcttggggt tcccagcaag gcatatttct ccatggcagc 12000
agacaaaccg attctagctg tcatggaaaa aggggctgaa atctcccgta taatagatga 12060
gaccggaatc ggttggaact gtccgccgaa tgatccggtt gctttggcaa gattgatcga 12120
tgagatttgt gaactcgact tgtctagttt aggcggagtc ccgcggagtg tccttcagca 12180
aaattattct gaatatattt cattggaaaa attcgctgcc tgtgttcgac cgcttctgtc 12240
tgagtcgaaa atatgatgaa ggtgctggta accggggcta gcggttttgt cgggagtgcg 12300
ctttgcaggt cgcttgctgc cgcccccttt caggttgtcg gacaagtacg atccctgtac 12360
aatcccgtta cgggggttga gtatgttcga gcggagctga aagagagcac taagcttgat 12420
gctgcgctgc ggggtgttga atgtgtagtt catctagctg gacgagccca tatctttgga 12480
aggcagcgtg attcactaga tatttttcgg aaggtgaatc gcgatgctac tctggcgctt 12540
gctcggcagg cgatcgaagc atctgtaaag cgtttcattt ttgttagttc tattggtgta 12600
aatggcgctt taaccaaaga aaagcccttc gatgagaact ccaagccggc tcctcatgca 12660
gaatatgcga tttcaaagtt tgaggctgaa gtagcgcttc gggagctttt caagcattcc 12720
tcaacagaac ttgttatcgt caggcctcca ctcgtttacg actggaaagc tcctggaaat 12780
ttctcgcgat tgttgaagct ggttgcttcg ggacttcctc ttccatttgg ttgcatagat 12840
aaccgacgaa gttttgtttc tctggataat ttagttgact ttctagcttg ctgtatgacg 12900
cacccttctg ctgccggcga actgtttttg gtatccgatg gtcaggagat ttctaccaag 12960
caactggtga ctgcgcttgc tgcgggaatg gggcgtcgcc ccatcatgtg gcctgttcct 13020
aggtttattc tgaggtttct taaattagta ggaaagggtg ggttatacac tcagttatgc 13080
tgctcactag aggtcgactc gtcgaaaggc aggcttttgc ttggttggga accccgcaag 13140
agcacccttt ccgcgttgga agatgttggt agaatatatg tcaaacgtac tgaatgatta 13200
tctgcaggcg ctttgctact agcatggcgt accacgcaga acaatcgaat agaaccctgt 13260
tgaaggggtg agagtatttt tggggataaa tttataaatg gaagaatggt atttgttact 13320
cgctgcagct ggggtttcgg gactgcttac aggcctcttg cgtcgttatg ccttagcgag 13380
gagcttactt gacaccccta actctcgaag ttcccatgtc gttcccactc cacgcggagg 13440
aggggtcgcc attgtagtta ctttttgtct catgctgcct atttgggctg tactgggaaa 13500
tatctcatgg gccgtgtcct gggctttact tctcgctggc ggcggggttg ccattattgg 13560
attcatggat gatcacggtc atatcgccgc acgctggcgt ctgctgggac attttagtgc 13620
agccttggtc tcattgtact ttttgaatgg cataccacca tttcagattg ttggtgtcag 13680
ttgggacctg gggtggttcg gaggacttct ctttgctttc tatctcgtgt ggttgctgaa 13740
tctctataac ttcatggatg ggatcgatgg acttgctagc cttcaggcca tttttgtctg 13800
tgttggtggg gcattattat actggctgaa tggccaactg acgcaggctt tgctcccctt 13860
atcgctagct tttgccgttt ttggattctt gttctggaat tttccacccc caaaaatttt 13920
catgggagat gcgggtagtg gtcttctggg gattgtttta ggaattcttt ccattcatgc 13980
catgtggatg aatacgaatt ttttctgggc atggttggtc ctgttaggcg ttttcatcgt 14040
cgatgcgacc tataccctga ttcgtcgctt gctgagaggg gacaaggtgt atgaggctca 14100
tcgaagccat gcctatcaat acgcaagccg atactatgga aagcatgctc ctgttacgat 14160
tggcgtcacg gcattgaacg tcatctggct cctccctata gccttgttgg tcgggagtgg 14220
gtctctagag cctttgatgg gcatcgtcat agcctacgtc cctctcgttt ttctggcagt 14280
gaggttcaag gcgggtaagc tagagtcgtc cgctcaggcc taaaggagta ggggaatgct 14340
agatcgttta agagtaaagt tgttatccat gcctcgtcgc tggaaacgtt tgcttcaagt 14400
ggctacggat atccttctgg tatggctgtc tctgtggctc gcttttgtgg tccgtctagg 14460
cacagacgat atgatcgacg tgttcggcga gcatgcatgg cttttcatca ctgcgccggt 14520
catcgccatt ccactattca ttcgcttcgg catgtatcgc gcggtgatgc gctatctcgg 14580
taacgacgca ttgatcgcca tcgccaaggc ggtgaccatc tcggctctgg tgctgtcgct 14640
ggtggtgtac tggtatcgtg gcgcgccggc gccggtgccg cgttccctgg tgttcaacta 14700
ctggtggttg agcatgctgc tgatcggcgg cttgcgtctg gccatgcgcc agtatttcat 14760
gggcgactgg tactctgctg tgcagtcggt accatttctc aaccgccagg atggcctgcc 14820
cagggtggtt atctatgggg cgggggcggc cggcaaccag ttggttgcgg cgttgcgtct 14880
cggtcgggcg atgcgtccgg tggcgttcat cgatgacgac aagcagatcg ccaaccgggt 14940
cattgccggt ctgcgggtct ataccgccaa gcatatccgc cagatgatcg acgagacggg 15000
cgcgcaggag gttctcctgg cgattccttc cgccactcgg gcccggcgcc gagagattct 15060
cgagtccctg gagccgttcc cgctgcacgt gcgcagcatg cccggcttca tggacctggc 15120
cagcggccgg gtcaaggtgg atgacctgca ggaggtggac atcgctgacc tgctggggcg 15180
cgacagcgtc gcaccgcgca aggagctgct ggaacggtgc atccgcggtc aggtggtgat 15240
ggtgaccggg gcgggcggct ctatcggttc ggaactctgt cggcagatca tgagttgttc 15300
gcctagcgtg ctgatcctgt tcgaacacag cgaatacaac ctctatagca tccatcagga 15360
actggagcgt cggatcaagc gcgagtcgct ttcggtgaac ctgttgccga tcctcggttc 15420
ggtgcgcaat cccgagcgcc tggtggacgt gatgcgtacc tggaaggtca ataccgtcta 15480
ccatgcggcg gcctacaagc atgtgccgat cgtcgagcac aacatcgccg agggcgttct 15540
caacaacgtg ataggcacct tgcatgcggt gcaggccgcg gtgcaggtcg gcgtgcagaa 15600
cttcgtgctg atttccaccg acaaggcggt gcggccgacc aatgtgatgg gcagcaccaa 15660
gcgcctggcg gaaatggtcc ttcaggcgct cagcaacgaa tcggcgccgg tgctgttcgg 15720
cgaccggaag gacgtgcatc acgtcaacaa gacccgtttc accatggtcc gcttcggcaa 15780
cgtcctcggt tcgtccggtt cggtcattcc gctgttccgc gagcagatca agcgcggcgg 15840
cccggtgacg gtcacccacc cgagcatcac ccgttacttc atgaccattc ccgaggcggc 15900
gcagttggtc atccaggccg gttcgatggg gcagggcgga gatgtattcg tgctggacat 15960
ggggccgccg gtgaagatcc tggagctcgc cgagaagatg atccacctgt ccggcctgag 16020
cgtgcgttcc gagcgttcgc cccatggtga catcgccatc gagttcagtg gcctgcgtcc 16080
tggcgagaag ctctacgaag agctgctgat cggtgacaac gtgaatccca ccgaccatcc 16140
gatgatcatg cgggccaacg aggaacacct gagctgggag gccttcaagg tcgtgctgga 16200
gcagttgctg gccgccgtgg agaaggacga ctactcgcgg gttcgccagt tgctgcggga 16260
aaccgtcagc ggctatgcgc ctgacggtga aatcgtcgac tggatctatc gccagaggcg 16320
gcgagaaccc tgagtcatcg ttctccggaa aaggccgcct agcggccttt tttgttttct 16380
ccgtacgatg tttccggtgc cggaccagga agcgactgct ttgctggggc tgtcgatcca 16440
ggtgcgttcc acggcgataa ggtggtttcg tggatgggca acatgtcgcg aaggtaaagt 16500
cagccgcatt gttgaattca tcgaaaaacc ggatcagcca caaacgctgg aatcagacat 16560
catggccgtg ggccgttatg tgctttctgc cgatatttgg ccggaacttg aacgcactca 16620
gccaggtgca tggggacgta ttcagctgac tgatgccatt gccgaactgg cgaaaaaaca 16680
gtctgttgac gccatgctga tgactggtga cagctacgac tgtggtaaaa aaatgggtta 16740
tatgcaggcg tttgtgaagt atggactacg caacctgaaa gaaggagcga agttccgcaa 16800
aggtattgag aaattgctta gcgagtaagt ttaaaaaata gacgccctta tagggcgtaa 16860
taacaaataa cggtagtcaa cattcgacgc ggtgatgcag atatgcccgg aatgctgata 16920
ccgttttttc attctaaaaa actcatcatt tcattgagtt aactacaaaa tttagcactg 16980
ttttttataa tgtttcttct tgtttctggc atcaattggt aagataatta gtgtttgagt 17040
ttagaggctt tgcggcagag aagcggagct taacacgtct gtgagagtac gcagtgcact 17100
ggtagctgta aagccagtgg cggtagcgtg tttaaataaa tacattagta atactacata 17160
ttacatcatt gtaggctatt taagcgctac atgataagcg acagcgctag caatcaaatc 17220
ttttaaagtt acttctcagg aatagtaaaa ggaggacagc tatgttgaaa aaagagtatt 17280
taaaaaaccc ttatttagtt ttgtttgcga tgattatatt agcttatgtt tttagtgtat 17340
tttgcaggtt ttattgggtt tggtgggcaa gtgagtttaa tgagtatttt ttcaataatc 17400
agttaatgat catttcaaat gatggctatg cttttgctga gggcgcaaga gatatgatag 17460
caggttttca tcagcctaat gatttgagtt attatggatc ttctttatcc gcgcttactt 17520
attggcttta taaaatcaca cctttttctt ttgaaagtat cattttatat atgagtactt 17580
ttttatcttc tttggtggtg attcctacta ttttgctagc taacgaatac aaacgtcctt 17640
taatgggctt tgtagctgct cttttagcaa gtatagcaaa cagttattat aatcgcacta 17700
tgagtgggta ttatgatacg gatatgctgg taattgtttt gcctatgttt attttatttt 17760
ttatggtaag aatgatttta aaaaaagact ttttttcatt gattgccttg ccgttattta 17820
taggaattta tctttggtgg tatccttcaa gttatacttt aaatgtagct ttaattggac 17880
tttttttaat ttatacactt atttttcata gaaaagaaaa gattttttat atagctgtga 17940
ttttgtcttc tcttactctt tcaaatatag catggtttta tcaaagtgcc attatagtaa 18000
tactttttgc tttattcgcc ttagagcaaa aacgcttaaa ttttatgatt ataggaattt 18060
taggtagtgc aactttgata tttttgattt taagtggtgg ggttgatcct atactttatc 18120
agcttaaatt ttatattttt agaagtgatg aaagtgcgaa tttaacgcag ggctttatgt 18180
attttaatgt caatcaaacc atacaagaag ttgaaaatgt agatcttagc gaatttatgc 18240
gaagaattag tggtagtgaa attgtttttt tgttttcttt gtttggtttt gtatggcttt 18300
tgagaaaaca taaaagtatg attatggctt tacctatatt ggtgcttggg tttttagcct 18360
taaaaggggg gcttagattt accatttatt ctgtacctgt aatggcctta ggatttggtt 18420
ttttattgag cgagtttaag gctataatgg ttaaaaaata tagccaatta acttcaaatg 18480
tttgtattgt ttttgcaact attttgactt tagctccagt atttatccat atttacaact 18540
ataaagcgcc aacagttttt tctcaaaatg aagcatcatt attaaatcaa ttaaaaaata 18600
tagccaatag agaagattat gtggtaactt ggtgggatta tggttatcct gtgcgttatt 18660
atagcgatgt gaaaacttta gtagatggtg gaaagcattt aggtaaggat aattttttcc 18720
cttcttttgc tttaagcaaa gatgaacaag ctgcagctaa tatggcaaga cttagtgtag 18780
aatatacaga aaaaagcttt tatgctccgc aaaatgatat tttaaaaaca gacattttgc 18840
aagccatgat gaaagattat aatcaaagca atgtggattt gtttctagct tcattatcaa 18900
aacctgattt taaaatcgat acgccaaaaa ctcgtgatat ttatctttat atgcccgcta 18960
gaatgtcttt gattttttct acggtggcta gtttttcttt tattaattta gatacaggag 19020
ttttggataa accttttacc tttagcacag cttatccact tgatgttaaa aatggagaaa 19080
tttatcttag caacggagtg gttttaagcg atgattttag aagttttaaa ataggtgata 19140
atgtggtttc tgtaaatagt atcgtagaga ttaattctat taaacaaggt gaatacaaaa 19200
tcactccaat tgatgataag gctcagtttt atatttttta tttaaaggat agtgctattc 19260
cttacgcaca atttatttta atggataaaa ccatgtttaa tagtgcttat gtgcaaatgt 19320
tttttttagg aaattatgat aagaatttat ttgacttggt gattaattct agagatgcta 19380
aggtttttaa acttaaaatt tacccatacg atgttccaga ttacgcttaa acatgtgaat 19440
tc 19442
<210> 18
<211> 19616
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 18
gaattccctg aggcaattct tctttgatga cggctgatgg tgaggttgac ctggtgaagc 60
tggtcaagga gctttgggtt aacaaggttc tgattcttct gactactctt cttgcattaa 120
tcgggtcttt tacctatgcg tatctgagta agcctgtata tgaatatagg gttgcagtag 180
tgcctcctgc tcttgggtct atcgaaggtt tcaatgttgg tagaagggag aatggcctag 240
atgcatatac tgttagaagt atctatgcga tcttttcgcg caatctgctt tcggatgaga 300
ataaaaaaga gttcttctat aagatatacc ttccccaggt gggtgaggga gcggaaagcg 360
aagatgagca ggaggagttt tataagaagt tctccaaaga ggtaaagatt gatcctgcta 420
acaagccaga tgcagaccgt tatacggtaa ttgtggaggg cacgaagcga gaggttcttg 480
ctacatgggc acaagctttc gtgcgtttgg ctgcggatcg ggccgtgcat gaggttattg 540
atagtgcagg tagagatttc caggtaagaa atgctgcaat gcagagccgc ataaccgtgc 600
tgcagaatat ggcgaagggc cgccgtgatg atagaattgc acgtttgaag gaggcattgc 660
tgattgcgga gtcgctcaag atagatggcc cgccattaat agaaggggcg tccgagcaac 720
aactctcctc gatcatggat ggtgacttga tgtacatgcg aggagctaag gcgctgcgcg 780
ctgaaatcaa caatcttgag tcgcgtagtg tagatgctcc attcattcct gagttgagaa 840
ctctccaaga gaaactatct tggaactcca gtttgtctgt ggattctgat gcggtggctg 900
tctacaagga agacgaggga ctctcttttt caaatcaacc cattaagccg aagaagattc 960
ttatagttac tataggtact ttggcaggat tgataattgg aattctactc gcagtgctcg 1020
ctggttttat aaggaagctt cgtagcgatg gctctcttcg ctaagttttg atctaaaccc 1080
tgatgccact tactggcatc agggcttact tgttgtagtt gttgaattgt attagggggt 1140
atcgagtaga atgtcaataa ggcggggcgt tttctactcc ggtatatcca tgggcagcaa 1200
ctatcttttg cctcttgctg cgattccttt tctcacgaga acattgtcaa gcgaagcgtt 1260
tggccaattg gtgattgccc aggccgtggc tgtcattcta tgtcaactgg tagactttgg 1320
atttattctg gcaggatcaa gaaaggctgc cattatcgat aacaaagttg aactgtctag 1380
tttcttttct gttgtacaga gtgctagatt cttattgttg ctgctttcac ttttagtgct 1440
ggccattttg gctgtatctt ctattttacc aatccccttg cttgtattgg ttgcggctgc 1500
tcttccggca gtagttggaa attatcttca agcagtatgg ttctttcagg gaagagcgct 1560
gtttggatgg ttggcgctta ccaatttttt gtctaaggta ttttatttcc tattggtcgt 1620
tttttttgtc acgaaggatt ctgaccttgt gctggcttcg ttggggtttg gtttttccta 1680
tgtcataggt ggaagtgctc tctgttgtat tttattttct atgggaatac ggtggcgccc 1740
ggttctcgag aaagacagaa ttctcgatat attgcgtgac ggtgctcgat cttttctttc 1800
tctggctttt cttagcttgc acatgcaagt gctcgttgcg gcggttggtg ttgttggtgg 1860
agcctccgcg gccggagtgc tttctactgc ggataaattc cttcgcggga tcgcggctgc 1920
tacttcaccc atagctagcg ctctatttcc gacttttagc aggatgtatg cgagtgccga 1980
cccggcagtc ggcagtttaa gaaggaaagc gctaggtctg atgttactaa tagctattcc 2040
tagttgttta tttcttttct tattttctga atacatttca tatctcctat tcccggaaca 2100
gtccagaggt ctaactgttg taataagaat gttttcgata gtgccagtgt ttgcttgtat 2160
tggtgttctg tatggagggt tgactcttgt tccttctggg tatgatggtg tatatttgcg 2220
agcaattttt tttgcggaat tgggcggggt attaacattt atcctcttgg cgctttgggg 2280
ggatgagctt tttggagcgt ggacgctggt cgttacagag gtctctttgg ggatgggaat 2340
gtttttcctg gccacggtta agttgagaga gaaaagggga ctttgatctt aaggcgatcg 2400
ctaggaggac agctatgcgt attgcgattc tgggcgcgac caacattaaa catatgagcc 2460
tgctgagcca ttatctgaac catattgatc tgaacattaa cgaagtggat attatttata 2520
ccgataaata tgatattgaa gaacatattc agggcatcaa caactactac aaatacaaag 2580
tggatatcaa agaagattgg accttcatca agaaagcgat tgcgtattat cgttttcgtc 2640
cgtatgcgat gaaaattctg aaagaaaacc gttatgattt tgtgattgtg tggggcagct 2700
acaccggcca tctgttcaaa agctttctgg aaaaacatta caaaaacaaa ttcatcctga 2760
acatccgtga ttactttttc gaaaacaaca aactgattaa atatcgtatg aagaaaatcg 2820
tggatgcgag ccgtgtgacc accctgagca gcgaaggctt tctgaaattc ctgccgaaaa 2880
gcgaaaaata ccgtatcatc tacagctaca acatgagcat catccgtgaa agcaacgtga 2940
ccgatggctt taaaaaacgt tggccgatta acattggctt tattggcaac gtgcgtttta 3000
acgaaattaa ccagaaactg attaaagaac tggcgaacga tagccgtttt catatgcagt 3060
attttggcac cggcagcgaa aaactggaag tgtttgcgcg tgaaaacttt attaacaaca 3120
ttacctttag cggcggcttt gatctgaaag aaaccccgaa atatctgaac gaaattgata 3180
ttctgaacaa cctgtttggc aaccagaaca ttgcgctgga taccgcgctg agcattcgta 3240
tgtattatgc gctgtttctg aacaaaccga ttattaccac cgatgatacc tttaccgcga 3300
ccgaagcgaa caaatttggc ctgggcttta gcattaaccc ggaaaacctg aaaggcattg 3360
gcgatgaact gatggattgg tataacaacc tggatgtgat ggatattaac cataaacgtg 3420
aagcgtatcg taacgatgtg attgaaaaca acaaacagtt ttatcaggaa attggccgta 3480
tttttaacga agaacagaaa ctgattagcg aagaagatct gtaacgttta aacaggagga 3540
cagctatgaa caaaatttat aacgtgacca gctatgtgat tgcgattctg atgtttccgt 3600
gcctgatgct gggcgataaa ccgctgctgt ttctggcgcc gattagctat ggcgtgggca 3660
aactgttcat cagcttcagc aacaacccga acttcaaatt cagcaaaatc gtgtacgatg 3720
tgctgggctt tctgcgtctg gtgtttattc cggcgatgat tgtgtttttc caggatagca 3780
ccattgataa cctgccgctg ggccaggcgt attttaacca ggcggtgatt tatatgagcg 3840
tggaatttat tattggcagc ctgtttattc tgattctgag caaactgttc aagcatgaag 3900
ttgtgagccg taacagcttt accctgagcg gcagcagcat ttattatatt gtgtttggcc 3960
tggtgatttg cggcattttt gtggcgtttc cggaagtgcg taaaaacatt agctttctga 4020
ttattaaaac cgatgcgatg ggccgtggca ccgaagcgac cagcggcctg aacgtgctgt 4080
ttgtgatgct gtttcagctg gcgctggcgc tgctgtttct gatcatcgcg tacgcgagct 4140
acaaaaaata caaagaaaac ccgaaaatca tctacgtggt gctgccgctg gcgattggca 4200
ttctgaacat tagcctgatt gtgggcgaac gtcgtagcta tcagctgtat accatggtgg 4260
cggtgctgac cgttgtgagc atcctgttta gcaaacataa acgtcgtatc aacatcatca 4320
tcatcagcgt gggcatcttc gtgctggcgc tgatgaccct gtataaagaa ctgtatgtgt 4380
ttaactatag cagctatagc gaagcgctga acagcaccag cgtgagcaac ctgaaaattg 4440
tggataccct gcagagctat ttttatggcc cgagcaacat tgcggcgagc attgattatc 4500
tgaactatta taacggcagc tttaaacagt atctgtttga taacacccgt gcggtgtttg 4560
gctttaactt tttcctggat aaaaaacagc tgattaccag ccagctgttt aaccagctga 4620
tttatggcag caaacagctg accggccatc tgattagcag cgcgggctat ggcattattt 4680
attttggccc gctgtttttc tacctgaacc tgattgcgaa catctttttc gcgtttctga 4740
gcgaatacat catccgtaaa agccatagcc tggaagtgat cttcatcggc acctacatct 4800
acatgcgtct gattaccagc atttttagcc atccgacccc gctgattacc ctgattagca 4860
tgattctggt ggtgtatgtg attgcgatca tcccgggcat catcatcaag aaattcacca 4920
aaaaagtggg catcgaagat tacaaagatg atgatgataa ataacgttta aacaggagga 4980
cagctatgat tgtgaaaacc tttatgaaaa gcaaaatttt tcgtctgatg aacaccccgc 5040
tgctgctgtt ttataaaaaa gaatatctga ccggctatta ttttgaaaac aaagtggcgg 5100
gctggctgtg ggcgtggaaa gcggtgccat tcaagctgct gggcattaac accagcctgc 5160
cgtttccggc ggatattacc gtgcgtatgc ataacccgaa caacattgtg tttgataaaa 5220
acgatattca tatttttcag agcccgggca cctattttaa caactttagc gcggtgattt 5280
atattggccg tggcgtgtat attgcgccga acgtgggcat tattaccgcg aaccataaca 5340
ttaaaaacct gaaaagccat gcgccgggcg aagatgtgaa aattggcaac tatagctgga 5400
ttggcatgaa cagcgtgatt ctgccgggcg tggaactggg cgaacatacc attgtgggcg 5460
cgggcagcgt ggtgaccaaa agctttccgg aaggcaacgt ggtgattggc ggcaacccgg 5520
cgaaaattat taagaaaatc agctatccgt atgatgtgcc ggattatgcg taattaatta 5580
accaggtgca cgaagaaaat tatgagatta aataaattta ttggcgattc gtttttaatg 5640
attttaagca gtggcatcgc tcaagtcata ttaatcatca ctaccccaat tattacaaga 5700
ctatattcac ctacagaatt tggtgagttt acaatttttt caaatatcgc aatgatttta 5760
ataccaataa taaatgcaag atacgatttg ttgattgtga ataccaaaaa tgaccgtagt 5820
gctaatatac tttcacaaat cagttttttg atatcattgc ttattttatt aatactgata 5880
ccaatatttg cgattagtgc atgtttatac ccaaacttta tattagattt tattttcatt 5940
attattatgt tgtttttggt aagtttaaca aacattttta caaattatct aaataaggaa 6000
agaaagtata aagtgttaag tttgattaat gtgtttagag ctggatcaat ggctttactt 6060
caaatcattt tcggactttt agcattagga agtttaggat taattattgg tttttcatta 6120
tcctatatcg caggcattac actaggatat aaaacgttta aaaagcactt taatattgtg 6180
agagataaag aagaaactaa agcattattt ttagaaaata aaaatcagtt agtttattca 6240
acaccatcaa tattattaaa tagtttgtct ttctcggttg ttgtgttctt tataggtatt 6300
ttgtatacca atacagaagt gggtatttat ggtatggcca taagagtact aggcatacca 6360
gtgacaatta tttcattagg gttatcaaaa atatttatgc aacaagccaa tgactattat 6420
attgaacatg gtaacttccg aaatttatta cttaaattta gttccatact ggttatagtt 6480
tctataattc tttatgtgcc actttatttg ttcagtgaag aattagtcaa tatattatta 6540
ggacatagct gggttgacgc aattacagtt ataaaaattg ttatcccatt atttgttata 6600
aggctgattg tatcaacggt atcactttct gtgattgtat tacaaaaaca acagttagaa 6660
ttaatactac aagcgttatt tttaataggt actactgcaa catttgttat atcaaaaatg 6720
cttaatttaa cttttttaaa ctttgtatct attaatacaa ttgttttaat cgtatcgtac 6780
atgatatttt tcatagcact ctattatttt gctaaaaata aacagttcaa aaattctagt 6840
tatccgtatg atgtgccgga ttatgcgtaa gtgcaccata tgaatatcct ccttagttcc 6900
tattccgaag ttcctattct ctagaaagta taggaacttc ggcgcgccta cctgtgacgg 6960
aagatcactt cgcagaataa ataaatcctg gtgtccctgt tgataccggg aagccctggg 7020
ccaacttttg gcgaaaatga gacgttgatc ggcacgtaag aggttccaac tttcaccata 7080
atgaaataag atcactaccg ggcgtatttt ttgagttgtc gagattttca ggagctaagg 7140
aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 7200
gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 7260
agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg 7320
cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattacgt atggcaatga 7380
aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc 7440
aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac 7500
acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt 7560
ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt 7620
taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata 7680
cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtttgtgatg 7740
gcttccatgt cggcagatgc ttaatgaata caacagtact gcgatgagtg gcagggcggg 7800
gcgtaaggcg cgccatttaa atgaagttcc tattccgaag ttcctattct ctagaaagta 7860
taggaacttc gaagcagctc cagcctacac gtaaagaggt ggtgtatgga taagaactct 7920
gttctgttaa ttaccggtgg aactggttcc tttggaaatg ccgttttgaa gcgttttctg 7980
gatacagata ttggtgaaat acgtgtattc agtcgggatg agaagaagca agatgatatg 8040
cgtaagtgct atgctcaccc caagttgagg ttttatattg gagatgtccg cgactatcaa 8100
agcactctga atgctactcg cggtgtggac tacattttcc atgcggctgc attgaaacag 8160
gttccctctt gtgagttcta cccgatggag gctgtgaaga ccaatgtcat cggaacggaa 8220
aatgtcctcg aatctgctat ccagaatggc gtcaaaaaag tcgtttgtct gagtacggat 8280
aaggcagttt acccaatcaa tgccatgggt atttcaaagg ccatgatgga aaaggtcatg 8340
gtcgccaagt ctcgaaacct ggaacgcact cctaccgtaa tttgtggcac ccgttatggt 8400
aacgtcatgg cttcaagggg ctcggtcatt cctctcttta tcgagcaaat gcgatcaggc 8460
cagcctctca caatcactga tccaaacatg acacgtttca tgatgacgct tacggatgcc 8520
gtagaccttg tgctttatgc tttcgagcat ggtaccaatg gagatctttt tgtacagaaa 8580
gcaccggctg caaccatcga ggtgctggct catgcgctta ctcaattgct tggcaagaat 8640
ggttatccta tcaatgtaat aggtacgcgt catggagaga agctttatga ggcgcttctt 8700
agtcgagagg aaatggcctg tgctgaagac atgggtgact attatcgtat ccccccagat 8760
ttgcgtgatc tgaactatag taagtttgtg gagcaaggcg aggaaaaaat tactcataca 8820
gaggactata attctcataa taccaaacgt ctggatatcg aaggaatgaa aaagctgttg 8880
ctgaagttgg atttcattcg tgctattcag cgtggcgaga gtgccagtcc agaggaataa 8940
acgatgaaag ttcttgtaac tggcgcgaat ggatttgttg gaaggaatct gtgcgctcat 9000
cttgcagagc ggggtggtat cgaggtggtg ccattcaccc gcgagagtag tgttggtaat 9060
ttgcctgagc taattcgttc cgtcgatttt atttttcatc ttgccggggt caatcgtccg 9120
gaaaaaccag aagagtttaa gatcgggaat tccgaactca cgtatgctct gtgtgaggcg 9180
gtaaggtcca atggacgagc cataccactt ctttatactt catccattca ggctgaggtg 9240
gataatgagt acggtttaag caagcgagcc gcagaagagc atctccaagt gctaggtgag 9300
gatattggtt gtcctgtcta catatttcgc cttcctaatg tattcggtaa atggtcgcgt 9360
ccgaattata attcagcggt tgcgactttt tgtcataata ttattcgaga tattccgatt 9420
caaattaaca attcctcggc agagatcact cttgtataca tagatgatgt ggttcgcacc 9480
ttcatgaaag tcatggatgg gaagctatcc aatgcagttt cactacaggt cgagccccag 9540
tatcagattt ctgttggtga gctcgcagaa caattgtatg agtttcgtaa tagtcgaaag 9600
tcactgacta ccgcaagggt tggctcggga ttgacgcgcg ccttgtactc gacttatcta 9660
agtttcttgc cagaagatag ttttagttac gacgtgccaa tgcattcgga tccgcgtggc 9720
acattcgtcg agatgctgaa gaccgcggac tctggccagt tctcgttttt tacggctcat 9780
ccaggtgtta ccaggggcgg gcattaccat cactcgaaaa ccgaaaagtt tctggttatc 9840
aaagggatgg cacgtttcaa gtttagaaac atcctgaccg gggcatttta cgaaatttgc 9900
actaatggtg aaaaggcaga aattgtcgaa acagtacctg gatggactca tgacattact 9960
aatgtcggaa ctgacgatat ggtagtcatg ttgtgggcta acgaagtatt tgatcgggaa 10020
aatccggata cctacgcttg ttcagtaggc gaaggtgcgt aaggtatagt gagataacaa 10080
tgcagaagct aaaagtcgtt acggttgttg gaactcgtcc tgagattatt cgcttgtcta 10140
gggtcatggc gaagcttgat cagtactgcg atcatgtact tgtccatact ggacagaatt 10200
atgattacga acttaatgaa atattttttc aggacctcgg tataagaaag ccggattatt 10260
ttctaaacgc cgccgggtct tccggggctg aaacgatagg gaatgtaata atcgcagtcg 10320
atcgtgttct gggcgaaata gatcccgatg cgctgctcgt gctgggtgat accaatagtt 10380
gtatggcggt actgcctgca aaacggcgta agataccgac ctttcatatg gaagcaggca 10440
atcgctgttt cgatatgcgt gtgcctgaag agataaatcg gcgcattgtc gatcatacag 10500
ctgatgtaaa tttgacctat agtacaattg cgcgtgatta tctcttgcgt gaaggacttt 10560
ctccagacat ggttatcaag actggtagcc ctatgttcga agttctcgag cactatcgtg 10620
acgggatcga gtcctccgat attcttgaaa ggctcgggtt gaaaacagag cggttctttg 10680
tcgtgagtgc gcaccgagag gaaaacatag attcggataa gaatttcttg aagttggttt 10740
ctatgctcaa cgctgtggca gaaaagtact cgctgcccgt catcgtatca actcacccta 10800
gaacaaaaaa gagaattgag gcgacggagg caaagtttca cgagggtatt aaactgctga 10860
aacccctcgg ctttaaggat tacaataaac tgcaaattac agccaaggca gttatttctg 10920
acagtgggac catcagtgag gagtcttcaa tactgaattt tcccgctttg aatattcgtg 10980
aggctcatga acgcccagaa ggcatggaag aggctgtggt gatgatggtc ggactggatt 11040
cggatcgagt actacaagca ctcgaggtgt tggagggaca gaggcgcgac gcagagcgca 11100
tgttacgctt ggtcgctgac tatagcatgc ccaacgtttc tgaaaagatt gttcgcatag 11160
ttcatagcta tcgggactat gtcatgcgaa ctgtctggaa aaaatattaa cttgaggcgt 11220
ggagttgatg gcaaggatat ttgtggtttc tgagtatgtc ggtgccaatc agaactccac 11280
gggatactat tgggagaaga taataggaaa gatgcagcgg gagtttggtg ggctaaccgt 11340
aattttcccg ctgaccgcag gtgaaacccc gcctgtggtt tcaccttccg ttgagcaaga 11400
atgctttaag tttccgagga gcaataagaa taggctcctt tctagaggat tggcgcagat 11460
ttttcaggcg tttctgttct cagtaaaatt gacttctcgt gccagacgag gagatgtggt 11520
attgagtgga accaaccctg ctcttctact gatgacgttt cccttgctaa ggtatgccct 11580
cggtttcaag tgggtgctgc tggtgcatga tgtgtttccc gagaacttgg tgccggcggg 11640
cgttctgaag aaagatagta ttgcctaccg gcttctacgt cgtctctttt ctttcattta 11700
ctcatccgct gatcgtctag tcgtaatagg gcgcgatatg gaagctctta tgaaagagaa 11760
ggtgaatgac ccgcgatctt tggtctttat ttcgaattgg gcctgtgaga aagaggtttt 11820
cccagtaccg agagaggatg ctccttttat caatattcct gaatggaaag gtaaaagggt 11880
tttccaattt tttggtaatg tcggtcgatt acaaggtata gaaaacatac tttctgctat 11940
tcagttggtt aaaaacgaga aggcggcttt tgcttttatt ggagatggtg ccttggtcga 12000
cagtgtaaaa aaacacgcgc tggaagatca gtgtgctcgg ttgaggtatt ttggaaggct 12060
gccattagcc gaaaagaatt ttggtttggc tgcctgtgac gttgccttag ttaccttaga 12120
agaaggaatg ttcgggcttg gggttcccag caaggcatat ttctccatgg cagcagacaa 12180
accgattcta gctgtcatgg aaaaaggggc tgaaatctcc cgtataatag atgagaccgg 12240
aatcggttgg aactgtccgc cgaatgatcc ggttgctttg gcaagattga tcgatgagat 12300
ttgtgaactc gacttgtcta gtttaggcgg agtcccgcgg agtgtccttc agcaaaatta 12360
ttctgaatat atttcattgg aaaaattcgc tgcctgtgtt cgaccgcttc tgtctgagtc 12420
gaaaatatga tgaaggtgct ggtaaccggg gctagcggtt ttgtcgggag tgcgctttgc 12480
aggtcgcttg ctgccgcccc ctttcaggtt gtcggacaag tacgatccct gtacaatccc 12540
gttacggggg ttgagtatgt tcgagcggag ctgaaagaga gcactaagct tgatgctgcg 12600
ctgcggggtg ttgaatgtgt agttcatcta gctggacgag cccatatctt tggaaggcag 12660
cgtgattcac tagatatttt tcggaaggtg aatcgcgatg ctactctggc gcttgctcgg 12720
caggcgatcg aagcatctgt aaagcgtttc atttttgtta gttctattgg tgtaaatggc 12780
gctttaacca aagaaaagcc cttcgatgag aactccaagc cggctcctca tgcagaatat 12840
gcgatttcaa agtttgaggc tgaagtagcg cttcgggagc ttttcaagca ttcctcaaca 12900
gaacttgtta tcgtcaggcc tccactcgtt tacgactgga aagctcctgg aaatttctcg 12960
cgattgttga agctggttgc ttcgggactt cctcttccat ttggttgcat agataaccga 13020
cgaagttttg tttctctgga taatttagtt gactttctag cttgctgtat gacgcaccct 13080
tctgctgccg gcgaactgtt tttggtatcc gatggtcagg agatttctac caagcaactg 13140
gtgactgcgc ttgctgcggg aatggggcgt cgccccatca tgtggcctgt tcctaggttt 13200
attctgaggt ttcttaaatt agtaggaaag ggtgggttat acactcagtt atgctgctca 13260
ctagaggtcg actcgtcgaa aggcaggctt ttgcttggtt gggaaccccg caagagcacc 13320
ctttccgcgt tggaagatgt tggtagaata tatgtcaaac gtactgaatg attatctgca 13380
ggcgctttgc tactagcatg gcgtaccacg cagaacaatc gaatagaacc ctgttgaagg 13440
ggtgagagta tttttgggga taaatttata aatggaagaa tggtatttgt tactcgctgc 13500
agctggggtt tcgggactgc ttacaggcct cttgcgtcgt tatgccttag cgaggagctt 13560
acttgacacc cctaactctc gaagttccca tgtcgttccc actccacgcg gaggaggggt 13620
cgccattgta gttacttttt gtctcatgct gcctatttgg gctgtactgg gaaatatctc 13680
atgggccgtg tcctgggctt tacttctcgc tggcggcggg gttgccatta ttggattcat 13740
ggatgatcac ggtcatatcg ccgcacgctg gcgtctgctg ggacatttta gtgcagcctt 13800
ggtctcattg tactttttga atggcatacc accatttcag attgttggtg tcagttggga 13860
cctggggtgg ttcggaggac ttctctttgc tttctatctc gtgtggttgc tgaatctcta 13920
taacttcatg gatgggatcg atggacttgc tagccttcag gccatttttg tctgtgttgg 13980
tggggcatta ttatactggc tgaatggcca actgacgcag gctttgctcc ccttatcgct 14040
agcttttgcc gtttttggat tcttgttctg gaattttcca cccccaaaaa ttttcatggg 14100
agatgcgggt agtggtcttc tggggattgt tttaggaatt ctttccattc atgccatgtg 14160
gatgaatacg aattttttct gggcatggtt ggtcctgtta ggcgttttca tcgtcgatgc 14220
gacctatacc ctgattcgtc gcttgctgag aggggacaag gtgtatgagg ctcatcgaag 14280
ccatgcctat caatacgcaa gccgatacta tggaaagcat gctcctgtta cgattggcgt 14340
cacggcattg aacgtcatct ggctcctccc tatagccttg ttggtcggga gtgggtctct 14400
agagcctttg atgggcatcg tcatagccta cgtccctctc gtttttctgg cagtgaggtt 14460
caaggcgggt aagctagagt cgtccgctca ggcctaaagg agtaggggaa tgctagatcg 14520
tttaagagta aagttgttat ccatgcctcg tcgctggaaa cgtttgcttc aagtggctac 14580
ggatatcctt ctggtatggc tgtctctgtg gctcgctttt gtggtccgtc taggcacaga 14640
cgatatgatc gacgtgttcg gcgagcatgc atggcttttc atcactgcgc cggtcatcgc 14700
cattccacta ttcattcgct tcggcatgta tcgcgcggtg atgcgctatc tcggtaacga 14760
cgcattgatc gccatcgcca aggcggtgac catctcggct ctggtgctgt cgctggtggt 14820
gtactggtat cgtggcgcgc cggcgccggt gccgcgttcc ctggtgttca actactggtg 14880
gttgagcatg ctgctgatcg gcggcttgcg tctggccatg cgccagtatt tcatgggcga 14940
ctggtactct gctgtgcagt cggtaccatt tctcaaccgc caggatggcc tgcccagggt 15000
ggttatctat ggggcggggg cggccggcaa ccagttggtt gcggcgttgc gtctcggtcg 15060
ggcgatgcgt ccggtggcgt tcatcgatga cgacaagcag atcgccaacc gggtcattgc 15120
cggtctgcgg gtctataccg ccaagcatat ccgccagatg atcgacgaga cgggcgcgca 15180
ggaggttctc ctggcgattc cttccgccac tcgggcccgg cgccgagaga ttctcgagtc 15240
cctggagccg ttcccgctgc acgtgcgcag catgcccggc ttcatggacc tggccagcgg 15300
ccgggtcaag gtggatgacc tgcaggaggt ggacatcgct gacctgctgg ggcgcgacag 15360
cgtcgcaccg cgcaaggagc tgctggaacg gtgcatccgc ggtcaggtgg tgatggtgac 15420
cggggcgggc ggctctatcg gttcggaact ctgtcggcag atcatgagtt gttcgcctag 15480
cgtgctgatc ctgttcgaac acagcgaata caacctctat agcatccatc aggaactgga 15540
gcgtcggatc aagcgcgagt cgctttcggt gaacctgttg ccgatcctcg gttcggtgcg 15600
caatcccgag cgcctggtgg acgtgatgcg tacctggaag gtcaataccg tctaccatgc 15660
ggcggcctac aagcatgtgc cgatcgtcga gcacaacatc gccgagggcg ttctcaacaa 15720
cgtgataggc accttgcatg cggtgcaggc cgcggtgcag gtcggcgtgc agaacttcgt 15780
gctgatttcc accgacaagg cggtgcggcc gaccaatgtg atgggcagca ccaagcgcct 15840
ggcggaaatg gtccttcagg cgctcagcaa cgaatcggcg ccggtgctgt tcggcgaccg 15900
gaaggacgtg catcacgtca acaagacccg tttcaccatg gtccgcttcg gcaacgtcct 15960
cggttcgtcc ggttcggtca ttccgctgtt ccgcgagcag atcaagcgcg gcggcccggt 16020
gacggtcacc cacccgagca tcacccgtta cttcatgacc attcccgagg cggcgcagtt 16080
ggtcatccag gccggttcga tggggcaggg cggagatgta ttcgtgctgg acatggggcc 16140
gccggtgaag atcctggagc tcgccgagaa gatgatccac ctgtccggcc tgagcgtgcg 16200
ttccgagcgt tcgccccatg gtgacatcgc catcgagttc agtggcctgc gtcctggcga 16260
gaagctctac gaagagctgc tgatcggtga caacgtgaat cccaccgacc atccgatgat 16320
catgcgggcc aacgaggaac acctgagctg ggaggccttc aaggtcgtgc tggagcagtt 16380
gctggccgcc gtggagaagg acgactactc gcgggttcgc cagttgctgc gggaaaccgt 16440
cagcggctat gcgcctgacg gtgaaatcgt cgactggatc tatcgccaga ggcggcgaga 16500
accctgagtc atcgttctcc ggaaaaggcc gcctagcggc cttttttgtt ttctccgtac 16560
gatgtttccg gtgccggacc aggaagcgac tgctttgctg gggctgtcga tccaggtgcg 16620
ttccacggcg ataaggtggt ttcgtggatg ggcaacatgt cgcgaaggta aagtcagccg 16680
cattgttgaa ttcatcgaaa aaccggatca gccacaaacg ctggaatcag acatcatggc 16740
cgtgggccgt tatgtgcttt ctgccgatat ttggccggaa cttgaacgca ctcagccagg 16800
tgcatgggga cgtattcagc tgactgatgc cattgccgaa ctggcgaaaa aacagtctgt 16860
tgacgccatg ctgatgactg gtgacagcta cgactgtggt aaaaaaatgg gttatatgca 16920
ggcgtttgtg aagtatggac tacgcaacct gaaagaagga gcgaagttcc gcaaaggtat 16980
tgagaaattg cttagcgagt aagtttaaaa aatagacgcc cttatagggc gtaataacaa 17040
ataacggtag tcaacattcg acgcggtgat gcagatatgc ccggaatgct gataccgttt 17100
tttcattcta aaaaactcat catttcattg agttaactac aaaatttagc actgtttttt 17160
ataatgtttc ttcttgtttc tggcatcaat tggtaagata attagtgttt gagtttagag 17220
gctttgcggc agagaagcgg agcttaacac gtctgtgaga gtacgcagtg cactggtagc 17280
tgtaaagcca gtggcggtag cgtgtttaaa taaatacatt agtaatacta catattacat 17340
cattgtaggc tatttaagcg ctacatgata agcgacagcg ctagcaatca aatcttttaa 17400
agttacttct caggaatagt aaaaggagga cagctatgtt gaaaaaagag tatttaaaaa 17460
acccttattt agttttgttt gcgatgatta tattagctta tgtttttagt gtattttgca 17520
ggttttattg ggtttggtgg gcaagtgagt ttaatgagta ttttttcaat aatcagttaa 17580
tgatcatttc aaatgatggc tatgcttttg ctgagggcgc aagagatatg atagcaggtt 17640
ttcatcagcc taatgatttg agttattatg gatcttcttt atccgcgctt acttattggc 17700
tttataaaat cacacctttt tcttttgaaa gtatcatttt atatatgagt acttttttat 17760
cttctttggt ggtgattcct actattttgc tagctaacga atacaaacgt cctttaatgg 17820
gctttgtagc tgctctttta gcaagtatag caaacagtta ttataatcgc actatgagtg 17880
ggtattatga tacggatatg ctggtaattg ttttgcctat gtttatttta ttttttatgg 17940
taagaatgat tttaaaaaaa gacttttttt cattgattgc cttgccgtta tttataggaa 18000
tttatctttg gtggtatcct tcaagttata ctttaaatgt agctttaatt ggactttttt 18060
taatttatac acttattttt catagaaaag aaaagatttt ttatatagct gtgattttgt 18120
cttctcttac tctttcaaat atagcatggt tttatcaaag tgccattata gtaatacttt 18180
ttgctttatt cgccttagag caaaaacgct taaattttat gattatagga attttaggta 18240
gtgcaacttt gatatttttg attttaagtg gtggggttga tcctatactt tatcagctta 18300
aattttatat ttttagaagt gatgaaagtg cgaatttaac gcagggcttt atgtatttta 18360
atgtcaatca aaccatacaa gaagttgaaa atgtagatct tagcgaattt atgcgaagaa 18420
ttagtggtag tgaaattgtt tttttgtttt ctttgtttgg ttttgtatgg cttttgagaa 18480
aacataaaag tatgattatg gctttaccta tattggtgct tgggttttta gccttaaaag 18540
gggggcttag atttaccatt tattctgtac ctgtaatggc cttaggattt ggttttttat 18600
tgagcgagtt taaggctata atggttaaaa aatatagcca attaacttca aatgtttgta 18660
ttgtttttgc aactattttg actttagctc cagtatttat ccatatttac aactataaag 18720
cgccaacagt tttttctcaa aatgaagcat cattattaaa tcaattaaaa aatatagcca 18780
atagagaaga ttatgtggta acttggtggg attatggtta tcctgtgcgt tattatagcg 18840
atgtgaaaac tttagtagat ggtggaaagc atttaggtaa ggataatttt ttcccttctt 18900
ttgctttaag caaagatgaa caagctgcag ctaatatggc aagacttagt gtagaatata 18960
cagaaaaaag cttttatgct ccgcaaaatg atattttaaa aacagacatt ttgcaagcca 19020
tgatgaaaga ttataatcaa agcaatgtgg atttgtttct agcttcatta tcaaaacctg 19080
attttaaaat cgatacgcca aaaactcgtg atatttatct ttatatgccc gctagaatgt 19140
ctttgatttt ttctacggtg gctagttttt cttttattaa tttagataca ggagttttgg 19200
ataaaccttt tacctttagc acagcttatc cacttgatgt taaaaatgga gaaatttatc 19260
ttagcaacgg agtggtttta agcgatgatt ttagaagttt taaaataggt gataatgtgg 19320
tttctgtaaa tagtatcgta gagattaatt ctattaaaca aggtgaatac aaaatcactc 19380
caattgatga taaggctcag ttttatattt tttatttaaa ggatagtgct attccttacg 19440
cacaatttat tttaatggat aaaaccatgt ttaatagtgc ttatgtgcaa atgttttttt 19500
taggaaatta tgataagaat ttatttgact tggtgattaa ttctagagat gctaaggttt 19560
ttaaacttaa aatttaccca tacgatgttc cagattacgc ttaaacatgt gaattc 19616
<210> 19
<211> 20597
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 19
gaattccctg aggcaattct tctttgatga cggctgatgg tgaggttgac ctggtgaagc 60
tggtcaagga gctttgggtt aacaaggttc tgattcttct gactactctt cttgcattaa 120
tcgggtcttt tacctatgcg tatctgagta agcctgtata tgaatatagg gttgcagtag 180
tgcctcctgc tcttgggtct atcgaaggtt tcaatgttgg tagaagggag aatggcctag 240
atgcatatac tgttagaagt atctatgcga tcttttcgcg caatctgctt tcggatgaga 300
ataaaaaaga gttcttctat aagatatacc ttccccaggt gggtgaggga gcggaaagcg 360
aagatgagca ggaggagttt tataagaagt tctccaaaga ggtaaagatt gatcctgcta 420
acaagccaga tgcagaccgt tatacggtaa ttgtggaggg cacgaagcga gaggttcttg 480
ctacatgggc acaagctttc gtgcgtttgg ctgcggatcg ggccgtgcat gaggttattg 540
atagtgcagg tagagatttc caggtaagaa atgctgcaat gcagagccgc ataaccgtgc 600
tgcagaatat ggcgaagggc cgccgtgatg atagaattgc acgtttgaag gaggcattgc 660
tgattgcgga gtcgctcaag atagatggcc cgccattaat agaaggggcg tccgagcaac 720
aactctcctc gatcatggat ggtgacttga tgtacatgcg aggagctaag gcgctgcgcg 780
ctgaaatcaa caatcttgag tcgcgtagtg tagatgctcc attcattcct gagttgagaa 840
ctctccaaga gaaactatct tggaactcca gtttgtctgt ggattctgat gcggtggctg 900
tctacaagga agacgaggga ctctcttttt caaatcaacc cattaagccg aagaagattc 960
ttatagttac tataggtact ttggcaggat tgataattgg aattctactc gcagtgctcg 1020
ctggttttat aaggaagctt cgtagcgatg gctctcttcg ctaagttttg atctaaaccc 1080
tgatgccact tactggcatc agggcttact tgttgtagtt gttgaattgt attagggggt 1140
atcgagtaga atgtcaataa ggcggggcgt tttctactcc ggtatatcca tgggcagcaa 1200
ctatcttttg cctcttgctg cgattccttt tctcacgaga acattgtcaa gcgaagcgtt 1260
tggccaattg gtgattgccc aggccgtggc tgtcattcta tgtcaactgg tagactttgg 1320
atttattctg gcaggatcaa gaaaggctgc cattatcgat aacaaagttg aactgtctag 1380
tttcttttct gttgtacaga gtgctagatt cttattgttg ctgctttcac ttttagtgct 1440
ggccattttg gctgtatctt ctattttacc aatccccttg cttgtattgg ttgcggctgc 1500
tcttccggca gtagttggaa attatcttca agcagtatgg ttctttcagg gaagagcgct 1560
gtttggatgg ttggcgctta ccaatttttt gtctaaggta ttttatttcc tattggtcgt 1620
tttttttgtc acgaaggatt ctgaccttgt gctggcttcg ttggggtttg gtttttccta 1680
tgtcataggt ggaagtgctc tctgttgtat tttattttct atgggaatac ggtggcgccc 1740
ggttctcgag aaagacagaa ttctcgatat attgcgtgac ggtgctcgat cttttctttc 1800
tctggctttt cttagcttgc acatgcaagt gctcgttgcg gcggttggtg ttgttggtgg 1860
agcctccgcg gccggagtgc tttctactgc ggataaattc cttcgcggga tcgcggctgc 1920
tacttcaccc atagctagcg ctctatttcc gacttttagc aggatgtatg cgagtgccga 1980
cccggcagtc ggcagtttaa gaaggaaagc gctaggtctg atgttactaa tagctattcc 2040
tagttgttta tttcttttct tattttctga atacatttca tatctcctat tcccggaaca 2100
gtccagaggt ctaactgttg taataagaat gttttcgata gtgccagtgt ttgcttgtat 2160
tggtgttctg tatggagggt tgactcttgt tccttctggg tatgatggtg tatatttgcg 2220
agcaattttt tttgcggaat tgggcggggt attaacattt atcctcttgg cgctttgggg 2280
ggatgagctt tttggagcgt ggacgctggt cgttacagag gtctctttgg ggatgggaat 2340
gtttttcctg gccacggtta agttgagaga gaaaagggga ctttgatctt aagatgagag 2400
tagaaaataa taatgtttct gggcaaaacc atgacccgga acagattgat ttgattgatt 2460
tactagtgca gttgtggcgt ggcaagatga caatcatcat ttccgtcatt gtggctattg 2520
ccctagctat tggatatttg gcagtagcga aggagaaatg gacgtcaaca gcaattatca 2580
ctcagcccga tgtggggcaa attgctggct ataacaatgc catgaatgtt atctatggtc 2640
aggctgcacc gaaagtatcg gatttgcagg agacgttaat tggtcgcttc agttctgcct 2700
tctctgcatt agcagaaacg ctggataatc aggaagaacc agaaaaactt accatcgaac 2760
cttctgttaa gaaccagcaa ttaccattga ctgtttctta tgttgggcaa actgcagagg 2820
gcgcacaaat gaagttggcc caatacattc agcaagttga cgataaagtg aatcaagagt 2880
tagaaaagga tctcaaggac aacattgctc tgggacggaa aaacttgcag gactctttaa 2940
gaacgcagga agtggttgcg caggagcaga aagatctgcg tatccgtcag attcaggaag 3000
cgttgcagta tgcgaatcag gcgcaggtga caaaaccgca gattcaacag actggcgaag 3060
atatcacaca agatacgttg ttccttttgg ggagcgaagc gctggagtcg atgattaagc 3120
atgaggcgac ccgtccgttg gtgttctcac caaactacta tcagactcgt caaaacctgc 3180
ttgatatcga aagcttaaag gttgatgatc ttgatattca tgcttaccgc tatgtaatga 3240
aaccgacgtt acctattcgt cgtgatagcc cgaaaaaggc aattaccttg attctggcgg 3300
tgctgctggg tggcatggtt ggcgcgggga ttgtgctggg gcgtaatgct ctacgcaatt 3360
acaacgcgaa gtaagcgatc gctaggagga cagctatgcg tattgcgatt ctgggcgcga 3420
ccaacattaa acatatgagc ctgctgagcc attatctgaa ccatattgat ctgaacatta 3480
acgaagtgga tattatttat accgataaat atgatattga agaacatatt cagggcatca 3540
acaactacta caaatacaaa gtggatatca aagaagattg gaccttcatc aagaaagcga 3600
ttgcgtatta tcgttttcgt ccgtatgcga tgaaaattct gaaagaaaac cgttatgatt 3660
ttgtgattgt gtggggcagc tacaccggcc atctgttcaa aagctttctg gaaaaacatt 3720
acaaaaacaa attcatcctg aacatccgtg attacttttt cgaaaacaac aaactgatta 3780
aatatcgtat gaagaaaatc gtggatgcga gccgtgtgac caccctgagc agcgaaggct 3840
ttctgaaatt cctgccgaaa agcgaaaaat accgtatcat ctacagctac aacatgagca 3900
tcatccgtga aagcaacgtg accgatggct ttaaaaaacg ttggccgatt aacattggct 3960
ttattggcaa cgtgcgtttt aacgaaatta accagaaact gattaaagaa ctggcgaacg 4020
atagccgttt tcatatgcag tattttggca ccggcagcga aaaactggaa gtgtttgcgc 4080
gtgaaaactt tattaacaac attaccttta gcggcggctt tgatctgaaa gaaaccccga 4140
aatatctgaa cgaaattgat attctgaaca acctgtttgg caaccagaac attgcgctgg 4200
ataccgcgct gagcattcgt atgtattatg cgctgtttct gaacaaaccg attattacca 4260
ccgatgatac ctttaccgcg accgaagcga acaaatttgg cctgggcttt agcattaacc 4320
cggaaaacct gaaaggcatt ggcgatgaac tgatggattg gtataacaac ctggatgtga 4380
tggatattaa ccataaacgt gaagcgtatc gtaacgatgt gattgaaaac aacaaacagt 4440
tttatcagga aattggccgt atttttaacg aagaacagaa actgattagc gaagaagatc 4500
tgtaacgttt aaacaggagg acagctatga acaaaattta taacgtgacc agctatgtga 4560
ttgcgattct gatgtttccg tgcctgatgc tgggcgataa accgctgctg tttctggcgc 4620
cgattagcta tggcgtgggc aaactgttca tcagcttcag caacaacccg aacttcaaat 4680
tcagcaaaat cgtgtacgat gtgctgggct ttctgcgtct ggtgtttatt ccggcgatga 4740
ttgtgttttt ccaggatagc accattgata acctgccgct gggccaggcg tattttaacc 4800
aggcggtgat ttatatgagc gtggaattta ttattggcag cctgtttatt ctgattctga 4860
gcaaactgtt caagcatgaa gttgtgagcc gtaacagctt taccctgagc ggcagcagca 4920
tttattatat tgtgtttggc ctggtgattt gcggcatttt tgtggcgttt ccggaagtgc 4980
gtaaaaacat tagctttctg attattaaaa ccgatgcgat gggccgtggc accgaagcga 5040
ccagcggcct gaacgtgctg tttgtgatgc tgtttcagct ggcgctggcg ctgctgtttc 5100
tgatcatcgc gtacgcgagc tacaaaaaat acaaagaaaa cccgaaaatc atctacgtgg 5160
tgctgccgct ggcgattggc attctgaaca ttagcctgat tgtgggcgaa cgtcgtagct 5220
atcagctgta taccatggtg gcggtgctga ccgttgtgag catcctgttt agcaaacata 5280
aacgtcgtat caacatcatc atcatcagcg tgggcatctt cgtgctggcg ctgatgaccc 5340
tgtataaaga actgtatgtg tttaactata gcagctatag cgaagcgctg aacagcacca 5400
gcgtgagcaa cctgaaaatt gtggataccc tgcagagcta tttttatggc ccgagcaaca 5460
ttgcggcgag cattgattat ctgaactatt ataacggcag ctttaaacag tatctgtttg 5520
ataacacccg tgcggtgttt ggctttaact ttttcctgga taaaaaacag ctgattacca 5580
gccagctgtt taaccagctg atttatggca gcaaacagct gaccggccat ctgattagca 5640
gcgcgggcta tggcattatt tattttggcc cgctgttttt ctacctgaac ctgattgcga 5700
acatcttttt cgcgtttctg agcgaataca tcatccgtaa aagccatagc ctggaagtga 5760
tcttcatcgg cacctacatc tacatgcgtc tgattaccag catttttagc catccgaccc 5820
cgctgattac cctgattagc atgattctgg tggtgtatgt gattgcgatc atcccgggca 5880
tcatcatcaa gaaattcacc aaaaaagtgg gcatcgaaga ttacaaagat gatgatgata 5940
aataacgttt aaacaggagg acagctatga ttgtgaaaac ctttatgaaa agcaaaattt 6000
ttcgtctgat gaacaccccg ctgctgctgt tttataaaaa agaatatctg accggctatt 6060
attttgaaaa caaagtggcg ggctggctgt gggcgtggaa agcggtgcca ttcaagctgc 6120
tgggcattaa caccagcctg ccgtttccgg cggatattac cgtgcgtatg cataacccga 6180
acaacattgt gtttgataaa aacgatattc atatttttca gagcccgggc acctatttta 6240
acaactttag cgcggtgatt tatattggcc gtggcgtgta tattgcgccg aacgtgggca 6300
ttattaccgc gaaccataac attaaaaacc tgaaaagcca tgcgccgggc gaagatgtga 6360
aaattggcaa ctatagctgg attggcatga acagcgtgat tctgccgggc gtggaactgg 6420
gcgaacatac cattgtgggc gcgggcagcg tggtgaccaa aagctttccg gaaggcaacg 6480
tggtgattgg cggcaacccg gcgaaaatta ttaagaaaat cagctatccg tatgatgtgc 6540
cggattatgc gtaattaatt aaccaggtgc acgaagaaaa ttatgagatt aaataaattt 6600
attggcgatt cgtttttaat gattttaagc agtggcatcg ctcaagtcat attaatcatc 6660
actaccccaa ttattacaag actatattca cctacagaat ttggtgagtt tacaattttt 6720
tcaaatatcg caatgatttt aataccaata ataaatgcaa gatacgattt gttgattgtg 6780
aataccaaaa atgaccgtag tgctaatata ctttcacaaa tcagtttttt gatatcattg 6840
cttattttat taatactgat accaatattt gcgattagtg catgtttata cccaaacttt 6900
atattagatt ttattttcat tattattatg ttgtttttgg taagtttaac aaacattttt 6960
acaaattatc taaataagga aagaaagtat aaagtgttaa gtttgattaa tgtgtttaga 7020
gctggatcaa tggctttact tcaaatcatt ttcggacttt tagcattagg aagtttagga 7080
ttaattattg gtttttcatt atcctatatc gcaggcatta cactaggata taaaacgttt 7140
aaaaagcact ttaatattgt gagagataaa gaagaaacta aagcattatt tttagaaaat 7200
aaaaatcagt tagtttattc aacaccatca atattattaa atagtttgtc tttctcggtt 7260
gttgtgttct ttataggtat tttgtatacc aatacagaag tgggtattta tggtatggcc 7320
ataagagtac taggcatacc agtgacaatt atttcattag ggttatcaaa aatatttatg 7380
caacaagcca atgactatta tattgaacat ggtaacttcc gaaatttatt acttaaattt 7440
agttccatac tggttatagt ttctataatt ctttatgtgc cactttattt gttcagtgaa 7500
gaattagtca atatattatt aggacatagc tgggttgacg caattacagt tataaaaatt 7560
gttatcccat tatttgttat aaggctgatt gtatcaacgg tatcactttc tgtgattgta 7620
ttacaaaaac aacagttaga attaatacta caagcgttat ttttaatagg tactactgca 7680
acatttgtta tatcaaaaat gcttaattta acttttttaa actttgtatc tattaataca 7740
attgttttaa tcgtatcgta catgatattt ttcatagcac tctattattt tgctaaaaat 7800
aaacagttca aaaattctag ttatccgtat gatgtgccgg attatgcgta agtgcaccat 7860
atgaatatcc tccttagttc ctattccgaa gttcctattc tctagaaagt ataggaactt 7920
cggcgcgcct acctgtgacg gaagatcact tcgcagaata aataaatcct ggtgtccctg 7980
ttgataccgg gaagccctgg gccaactttt ggcgaaaatg agacgttgat cggcacgtaa 8040
gaggttccaa ctttcaccat aatgaaataa gatcactacc gggcgtattt tttgagttgt 8100
cgagattttc aggagctaag gaagctaaaa tggagaaaaa aatcactgga tataccaccg 8160
ttgatatatc ccaatggcat cgtaaagaac attttgaggc atttcagtca gttgctcaat 8220
gtacctataa ccagaccgtt cagctggata ttacggcctt tttaaagacc gtaaagaaaa 8280
ataagcacaa gttttatccg gcctttattc acattcttgc ccgcctgatg aatgctcatc 8340
cggaattacg tatggcaatg aaagacggtg agctggtgat atgggatagt gttcaccctt 8400
gttacaccgt tttccatgag caaactgaaa cgttttcatc gctctggagt gaataccacg 8460
acgatttccg gcagtttcta cacatatatt cgcaagatgt ggcgtgttac ggtgaaaacc 8520
tggcctattt ccctaaaggg tttattgaga atatgttttt cgtctcagcc aatccctggg 8580
tgagtttcac cagttttgat ttaaacgtgg ccaatatgga caacttcttc gcccccgttt 8640
tcaccatggg caaatattat acgcaaggcg acaaggtgct gatgccgctg gcgattcagg 8700
ttcatcatgc cgtttgtgat ggcttccatg tcggcagatg cttaatgaat acaacagtac 8760
tgcgatgagt ggcagggcgg ggcgtaaggc gcgccattta aatgaagttc ctattccgaa 8820
gttcctattc tctagaaagt ataggaactt cgaagcagct ccagcctaca cgtaaagagg 8880
tggtgtatgg ataagaactc tgttctgtta attaccggtg gaactggttc ctttggaaat 8940
gccgttttga agcgttttct ggatacagat attggtgaaa tacgtgtatt cagtcgggat 9000
gagaagaagc aagatgatat gcgtaagtgc tatgctcacc ccaagttgag gttttatatt 9060
ggagatgtcc gcgactatca aagcactctg aatgctactc gcggtgtgga ctacattttc 9120
catgcggctg cattgaaaca ggttccctct tgtgagttct acccgatgga ggctgtgaag 9180
accaatgtca tcggaacgga aaatgtcctc gaatctgcta tccagaatgg cgtcaaaaaa 9240
gtcgtttgtc tgagtacgga taaggcagtt tacccaatca atgccatggg tatttcaaag 9300
gccatgatgg aaaaggtcat ggtcgccaag tctcgaaacc tggaacgcac tcctaccgta 9360
atttgtggca cccgttatgg taacgtcatg gcttcaaggg gctcggtcat tcctctcttt 9420
atcgagcaaa tgcgatcagg ccagcctctc acaatcactg atccaaacat gacacgtttc 9480
atgatgacgc ttacggatgc cgtagacctt gtgctttatg ctttcgagca tggtaccaat 9540
ggagatcttt ttgtacagaa agcaccggct gcaaccatcg aggtgctggc tcatgcgctt 9600
actcaattgc ttggcaagaa tggttatcct atcaatgtaa taggtacgcg tcatggagag 9660
aagctttatg aggcgcttct tagtcgagag gaaatggcct gtgctgaaga catgggtgac 9720
tattatcgta tccccccaga tttgcgtgat ctgaactata gtaagtttgt ggagcaaggc 9780
gaggaaaaaa ttactcatac agaggactat aattctcata ataccaaacg tctggatatc 9840
gaaggaatga aaaagctgtt gctgaagttg gatttcattc gtgctattca gcgtggcgag 9900
agtgccagtc cagaggaata aacgatgaaa gttcttgtaa ctggcgcgaa tggatttgtt 9960
ggaaggaatc tgtgcgctca tcttgcagag cggggtggta tcgaggtggt gccattcacc 10020
cgcgagagta gtgttggtaa tttgcctgag ctaattcgtt ccgtcgattt tatttttcat 10080
cttgccgggg tcaatcgtcc ggaaaaacca gaagagttta agatcgggaa ttccgaactc 10140
acgtatgctc tgtgtgaggc ggtaaggtcc aatggacgag ccataccact tctttatact 10200
tcatccattc aggctgaggt ggataatgag tacggtttaa gcaagcgagc cgcagaagag 10260
catctccaag tgctaggtga ggatattggt tgtcctgtct acatatttcg ccttcctaat 10320
gtattcggta aatggtcgcg tccgaattat aattcagcgg ttgcgacttt ttgtcataat 10380
attattcgag atattccgat tcaaattaac aattcctcgg cagagatcac tcttgtatac 10440
atagatgatg tggttcgcac cttcatgaaa gtcatggatg ggaagctatc caatgcagtt 10500
tcactacagg tcgagcccca gtatcagatt tctgttggtg agctcgcaga acaattgtat 10560
gagtttcgta atagtcgaaa gtcactgact accgcaaggg ttggctcggg attgacgcgc 10620
gccttgtact cgacttatct aagtttcttg ccagaagata gttttagtta cgacgtgcca 10680
atgcattcgg atccgcgtgg cacattcgtc gagatgctga agaccgcgga ctctggccag 10740
ttctcgtttt ttacggctca tccaggtgtt accaggggcg ggcattacca tcactcgaaa 10800
accgaaaagt ttctggttat caaagggatg gcacgtttca agtttagaaa catcctgacc 10860
ggggcatttt acgaaatttg cactaatggt gaaaaggcag aaattgtcga aacagtacct 10920
ggatggactc atgacattac taatgtcgga actgacgata tggtagtcat gttgtgggct 10980
aacgaagtat ttgatcggga aaatccggat acctacgctt gttcagtagg cgaaggtgcg 11040
taaggtatag tgagataaca atgcagaagc taaaagtcgt tacggttgtt ggaactcgtc 11100
ctgagattat tcgcttgtct agggtcatgg cgaagcttga tcagtactgc gatcatgtac 11160
ttgtccatac tggacagaat tatgattacg aacttaatga aatatttttt caggacctcg 11220
gtataagaaa gccggattat tttctaaacg ccgccgggtc ttccggggct gaaacgatag 11280
ggaatgtaat aatcgcagtc gatcgtgttc tgggcgaaat agatcccgat gcgctgctcg 11340
tgctgggtga taccaatagt tgtatggcgg tactgcctgc aaaacggcgt aagataccga 11400
cctttcatat ggaagcaggc aatcgctgtt tcgatatgcg tgtgcctgaa gagataaatc 11460
ggcgcattgt cgatcataca gctgatgtaa atttgaccta tagtacaatt gcgcgtgatt 11520
atctcttgcg tgaaggactt tctccagaca tggttatcaa gactggtagc cctatgttcg 11580
aagttctcga gcactatcgt gacgggatcg agtcctccga tattcttgaa aggctcgggt 11640
tgaaaacaga gcggttcttt gtcgtgagtg cgcaccgaga ggaaaacata gattcggata 11700
agaatttctt gaagttggtt tctatgctca acgctgtggc agaaaagtac tcgctgcccg 11760
tcatcgtatc aactcaccct agaacaaaaa agagaattga ggcgacggag gcaaagtttc 11820
acgagggtat taaactgctg aaacccctcg gctttaagga ttacaataaa ctgcaaatta 11880
cagccaaggc agttatttct gacagtggga ccatcagtga ggagtcttca atactgaatt 11940
ttcccgcttt gaatattcgt gaggctcatg aacgcccaga aggcatggaa gaggctgtgg 12000
tgatgatggt cggactggat tcggatcgag tactacaagc actcgaggtg ttggagggac 12060
agaggcgcga cgcagagcgc atgttacgct tggtcgctga ctatagcatg cccaacgttt 12120
ctgaaaagat tgttcgcata gttcatagct atcgggacta tgtcatgcga actgtctgga 12180
aaaaatatta acttgaggcg tggagttgat ggcaaggata tttgtggttt ctgagtatgt 12240
cggtgccaat cagaactcca cgggatacta ttgggagaag ataataggaa agatgcagcg 12300
ggagtttggt gggctaaccg taattttccc gctgaccgca ggtgaaaccc cgcctgtggt 12360
ttcaccttcc gttgagcaag aatgctttaa gtttccgagg agcaataaga ataggctcct 12420
ttctagagga ttggcgcaga tttttcaggc gtttctgttc tcagtaaaat tgacttctcg 12480
tgccagacga ggagatgtgg tattgagtgg aaccaaccct gctcttctac tgatgacgtt 12540
tcccttgcta aggtatgccc tcggtttcaa gtgggtgctg ctggtgcatg atgtgtttcc 12600
cgagaacttg gtgccggcgg gcgttctgaa gaaagatagt attgcctacc ggcttctacg 12660
tcgtctcttt tctttcattt actcatccgc tgatcgtcta gtcgtaatag ggcgcgatat 12720
ggaagctctt atgaaagaga aggtgaatga cccgcgatct ttggtcttta tttcgaattg 12780
ggcctgtgag aaagaggttt tcccagtacc gagagaggat gctcctttta tcaatattcc 12840
tgaatggaaa ggtaaaaggg ttttccaatt ttttggtaat gtcggtcgat tacaaggtat 12900
agaaaacata ctttctgcta ttcagttggt taaaaacgag aaggcggctt ttgcttttat 12960
tggagatggt gccttggtcg acagtgtaaa aaaacacgcg ctggaagatc agtgtgctcg 13020
gttgaggtat tttggaaggc tgccattagc cgaaaagaat tttggtttgg ctgcctgtga 13080
cgttgcctta gttaccttag aagaaggaat gttcgggctt ggggttccca gcaaggcata 13140
tttctccatg gcagcagaca aaccgattct agctgtcatg gaaaaagggg ctgaaatctc 13200
ccgtataata gatgagaccg gaatcggttg gaactgtccg ccgaatgatc cggttgcttt 13260
ggcaagattg atcgatgaga tttgtgaact cgacttgtct agtttaggcg gagtcccgcg 13320
gagtgtcctt cagcaaaatt attctgaata tatttcattg gaaaaattcg ctgcctgtgt 13380
tcgaccgctt ctgtctgagt cgaaaatatg atgaaggtgc tggtaaccgg ggctagcggt 13440
tttgtcggga gtgcgctttg caggtcgctt gctgccgccc cctttcaggt tgtcggacaa 13500
gtacgatccc tgtacaatcc cgttacgggg gttgagtatg ttcgagcgga gctgaaagag 13560
agcactaagc ttgatgctgc gctgcggggt gttgaatgtg tagttcatct agctggacga 13620
gcccatatct ttggaaggca gcgtgattca ctagatattt ttcggaaggt gaatcgcgat 13680
gctactctgg cgcttgctcg gcaggcgatc gaagcatctg taaagcgttt catttttgtt 13740
agttctattg gtgtaaatgg cgctttaacc aaagaaaagc ccttcgatga gaactccaag 13800
ccggctcctc atgcagaata tgcgatttca aagtttgagg ctgaagtagc gcttcgggag 13860
cttttcaagc attcctcaac agaacttgtt atcgtcaggc ctccactcgt ttacgactgg 13920
aaagctcctg gaaatttctc gcgattgttg aagctggttg cttcgggact tcctcttcca 13980
tttggttgca tagataaccg acgaagtttt gtttctctgg ataatttagt tgactttcta 14040
gcttgctgta tgacgcaccc ttctgctgcc ggcgaactgt ttttggtatc cgatggtcag 14100
gagatttcta ccaagcaact ggtgactgcg cttgctgcgg gaatggggcg tcgccccatc 14160
atgtggcctg ttcctaggtt tattctgagg tttcttaaat tagtaggaaa gggtgggtta 14220
tacactcagt tatgctgctc actagaggtc gactcgtcga aaggcaggct tttgcttggt 14280
tgggaacccc gcaagagcac cctttccgcg ttggaagatg ttggtagaat atatgtcaaa 14340
cgtactgaat gattatctgc aggcgctttg ctactagcat ggcgtaccac gcagaacaat 14400
cgaatagaac cctgttgaag gggtgagagt atttttgggg ataaatttat aaatggaaga 14460
atggtatttg ttactcgctg cagctggggt ttcgggactg cttacaggcc tcttgcgtcg 14520
ttatgcctta gcgaggagct tacttgacac ccctaactct cgaagttccc atgtcgttcc 14580
cactccacgc ggaggagggg tcgccattgt agttactttt tgtctcatgc tgcctatttg 14640
ggctgtactg ggaaatatct catgggccgt gtcctgggct ttacttctcg ctggcggcgg 14700
ggttgccatt attggattca tggatgatca cggtcatatc gccgcacgct ggcgtctgct 14760
gggacatttt agtgcagcct tggtctcatt gtactttttg aatggcatac caccatttca 14820
gattgttggt gtcagttggg acctggggtg gttcggagga cttctctttg ctttctatct 14880
cgtgtggttg ctgaatctct ataacttcat ggatgggatc gatggacttg ctagccttca 14940
ggccattttt gtctgtgttg gtggggcatt attatactgg ctgaatggcc aactgacgca 15000
ggctttgctc cccttatcgc tagcttttgc cgtttttgga ttcttgttct ggaattttcc 15060
acccccaaaa attttcatgg gagatgcggg tagtggtctt ctggggattg ttttaggaat 15120
tctttccatt catgccatgt ggatgaatac gaattttttc tgggcatggt tggtcctgtt 15180
aggcgttttc atcgtcgatg cgacctatac cctgattcgt cgcttgctga gaggggacaa 15240
ggtgtatgag gctcatcgaa gccatgccta tcaatacgca agccgatact atggaaagca 15300
tgctcctgtt acgattggcg tcacggcatt gaacgtcatc tggctcctcc ctatagcctt 15360
gttggtcggg agtgggtctc tagagccttt gatgggcatc gtcatagcct acgtccctct 15420
cgtttttctg gcagtgaggt tcaaggcggg taagctagag tcgtccgctc aggcctaaag 15480
gagtagggga atgctagatc gtttaagagt aaagttgtta tccatgcctc gtcgctggaa 15540
acgtttgctt caagtggcta cggatatcct tctggtatgg ctgtctctgt ggctcgcttt 15600
tgtggtccgt ctaggcacag acgatatgat cgacgtgttc ggcgagcatg catggctttt 15660
catcactgcg ccggtcatcg ccattccact attcattcgc ttcggcatgt atcgcgcggt 15720
gatgcgctat ctcggtaacg acgcattgat cgccatcgcc aaggcggtga ccatctcggc 15780
tctggtgctg tcgctggtgg tgtactggta tcgtggcgcg ccggcgccgg tgccgcgttc 15840
cctggtgttc aactactggt ggttgagcat gctgctgatc ggcggcttgc gtctggccat 15900
gcgccagtat ttcatgggcg actggtactc tgctgtgcag tcggtaccat ttctcaaccg 15960
ccaggatggc ctgcccaggg tggttatcta tggggcgggg gcggccggca accagttggt 16020
tgcggcgttg cgtctcggtc gggcgatgcg tccggtggcg ttcatcgatg acgacaagca 16080
gatcgccaac cgggtcattg ccggtctgcg ggtctatacc gccaagcata tccgccagat 16140
gatcgacgag acgggcgcgc aggaggttct cctggcgatt ccttccgcca ctcgggcccg 16200
gcgccgagag attctcgagt ccctggagcc gttcccgctg cacgtgcgca gcatgcccgg 16260
cttcatggac ctggccagcg gccgggtcaa ggtggatgac ctgcaggagg tggacatcgc 16320
tgacctgctg gggcgcgaca gcgtcgcacc gcgcaaggag ctgctggaac ggtgcatccg 16380
cggtcaggtg gtgatggtga ccggggcggg cggctctatc ggttcggaac tctgtcggca 16440
gatcatgagt tgttcgccta gcgtgctgat cctgttcgaa cacagcgaat acaacctcta 16500
tagcatccat caggaactgg agcgtcggat caagcgcgag tcgctttcgg tgaacctgtt 16560
gccgatcctc ggttcggtgc gcaatcccga gcgcctggtg gacgtgatgc gtacctggaa 16620
ggtcaatacc gtctaccatg cggcggccta caagcatgtg ccgatcgtcg agcacaacat 16680
cgccgagggc gttctcaaca acgtgatagg caccttgcat gcggtgcagg ccgcggtgca 16740
ggtcggcgtg cagaacttcg tgctgatttc caccgacaag gcggtgcggc cgaccaatgt 16800
gatgggcagc accaagcgcc tggcggaaat ggtccttcag gcgctcagca acgaatcggc 16860
gccggtgctg ttcggcgacc ggaaggacgt gcatcacgtc aacaagaccc gtttcaccat 16920
ggtccgcttc ggcaacgtcc tcggttcgtc cggttcggtc attccgctgt tccgcgagca 16980
gatcaagcgc ggcggcccgg tgacggtcac ccacccgagc atcacccgtt acttcatgac 17040
cattcccgag gcggcgcagt tggtcatcca ggccggttcg atggggcagg gcggagatgt 17100
attcgtgctg gacatggggc cgccggtgaa gatcctggag ctcgccgaga agatgatcca 17160
cctgtccggc ctgagcgtgc gttccgagcg ttcgccccat ggtgacatcg ccatcgagtt 17220
cagtggcctg cgtcctggcg agaagctcta cgaagagctg ctgatcggtg acaacgtgaa 17280
tcccaccgac catccgatga tcatgcgggc caacgaggaa cacctgagct gggaggcctt 17340
caaggtcgtg ctggagcagt tgctggccgc cgtggagaag gacgactact cgcgggttcg 17400
ccagttgctg cgggaaaccg tcagcggcta tgcgcctgac ggtgaaatcg tcgactggat 17460
ctatcgccag aggcggcgag aaccctgagt catcgttctc cggaaaaggc cgcctagcgg 17520
ccttttttgt tttctccgta cgatgtttcc ggtgccggac caggaagcga ctgctttgct 17580
ggggctgtcg atccaggtgc gttccacggc gataaggtgg tttcgtggat gggcaacatg 17640
tcgcgaaggt aaagtcagcc gcattgttga attcatcgaa aaaccggatc agccacaaac 17700
gctggaatca gacatcatgg ccgtgggccg ttatgtgctt tctgccgata tttggccgga 17760
acttgaacgc actcagccag gtgcatgggg acgtattcag ctgactgatg ccattgccga 17820
actggcgaaa aaacagtctg ttgacgccat gctgatgact ggtgacagct acgactgtgg 17880
taaaaaaatg ggttatatgc aggcgtttgt gaagtatgga ctacgcaacc tgaaagaagg 17940
agcgaagttc cgcaaaggta ttgagaaatt gcttagcgag taagtttaaa aaatagacgc 18000
ccttataggg cgtaataaca aataacggta gtcaacattc gacgcggtga tgcagatatg 18060
cccggaatgc tgataccgtt ttttcattct aaaaaactca tcatttcatt gagttaacta 18120
caaaatttag cactgttttt tataatgttt cttcttgttt ctggcatcaa ttggtaagat 18180
aattagtgtt tgagtttaga ggctttgcgg cagagaagcg gagcttaaca cgtctgtgag 18240
agtacgcagt gcactggtag ctgtaaagcc agtggcggta gcgtgtttaa ataaatacat 18300
tagtaatact acatattaca tcattgtagg ctatttaagc gctacatgat aagcgacagc 18360
gctagcaatc aaatctttta aagttacttc tcaggaatag taaaaggagg acagctatgt 18420
tgaaaaaaga gtatttaaaa aacccttatt tagttttgtt tgcgatgatt atattagctt 18480
atgtttttag tgtattttgc aggttttatt gggtttggtg ggcaagtgag tttaatgagt 18540
attttttcaa taatcagtta atgatcattt caaatgatgg ctatgctttt gctgagggcg 18600
caagagatat gatagcaggt tttcatcagc ctaatgattt gagttattat ggatcttctt 18660
tatccgcgct tacttattgg ctttataaaa tcacaccttt ttcttttgaa agtatcattt 18720
tatatatgag tactttttta tcttctttgg tggtgattcc tactattttg ctagctaacg 18780
aatacaaacg tcctttaatg ggctttgtag ctgctctttt agcaagtata gcaaacagtt 18840
attataatcg cactatgagt gggtattatg atacggatat gctggtaatt gttttgccta 18900
tgtttatttt attttttatg gtaagaatga ttttaaaaaa agactttttt tcattgattg 18960
ccttgccgtt atttatagga atttatcttt ggtggtatcc ttcaagttat actttaaatg 19020
tagctttaat tggacttttt ttaatttata cacttatttt tcatagaaaa gaaaagattt 19080
tttatatagc tgtgattttg tcttctctta ctctttcaaa tatagcatgg ttttatcaaa 19140
gtgccattat agtaatactt tttgctttat tcgccttaga gcaaaaacgc ttaaatttta 19200
tgattatagg aattttaggt agtgcaactt tgatattttt gattttaagt ggtggggttg 19260
atcctatact ttatcagctt aaattttata tttttagaag tgatgaaagt gcgaatttaa 19320
cgcagggctt tatgtatttt aatgtcaatc aaaccataca agaagttgaa aatgtagatc 19380
ttagcgaatt tatgcgaaga attagtggta gtgaaattgt ttttttgttt tctttgtttg 19440
gttttgtatg gcttttgaga aaacataaaa gtatgattat ggctttacct atattggtgc 19500
ttgggttttt agccttaaaa ggggggctta gatttaccat ttattctgta cctgtaatgg 19560
ccttaggatt tggtttttta ttgagcgagt ttaaggctat aatggttaaa aaatatagcc 19620
aattaacttc aaatgtttgt attgtttttg caactatttt gactttagct ccagtattta 19680
tccatattta caactataaa gcgccaacag ttttttctca aaatgaagca tcattattaa 19740
atcaattaaa aaatatagcc aatagagaag attatgtggt aacttggtgg gattatggtt 19800
atcctgtgcg ttattatagc gatgtgaaaa ctttagtaga tggtggaaag catttaggta 19860
aggataattt tttcccttct tttgctttaa gcaaagatga acaagctgca gctaatatgg 19920
caagacttag tgtagaatat acagaaaaaa gcttttatgc tccgcaaaat gatattttaa 19980
aaacagacat tttgcaagcc atgatgaaag attataatca aagcaatgtg gatttgtttc 20040
tagcttcatt atcaaaacct gattttaaaa tcgatacgcc aaaaactcgt gatatttatc 20100
tttatatgcc cgctagaatg tctttgattt tttctacggt ggctagtttt tcttttatta 20160
atttagatac aggagttttg gataaacctt ttacctttag cacagcttat ccacttgatg 20220
ttaaaaatgg agaaatttat cttagcaacg gagtggtttt aagcgatgat tttagaagtt 20280
ttaaaatagg tgataatgtg gtttctgtaa atagtatcgt agagattaat tctattaaac 20340
aaggtgaata caaaatcact ccaattgatg ataaggctca gttttatatt ttttatttaa 20400
aggatagtgc tattccttac gcacaattta ttttaatgga taaaaccatg tttaatagtg 20460
cttatgtgca aatgtttttt ttaggaaatt atgataagaa tttatttgac ttggtgatta 20520
attctagaga tgctaaggtt tttaaactta aaatttaccc atacgatgtt ccagattacg 20580
cttaaacatg tgaattc 20597
<210> 20
<211> 8815
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 20
agtcgacctg caggatgaga gtagaaaata ataatgtttc tgggcaaaac catgacccgg 60
aacagattga tttgattgat ttactagtgc agttgtggcg tggcaagatg acaatcatca 120
tttccgtcat tgtggctatt gccctagcta ttggatattt ggcagtagcg aaggagaaat 180
ggacgtcaac agcaattatc actcagcccg atgtggggca aattgctggc tataacaatg 240
ccatgaatgt tatctatggt caggctgcac cgaaagtatc ggatttgcag gagacgttaa 300
ttggtcgctt cagttctgcc ttctctgcat tagcagaaac gctggataat caggaagaac 360
cagaaaaact taccatcgaa ccttctgtta agaaccagca attaccattg actgtttctt 420
atgttgggca aactgcagag ggcgcacaaa tgaagttggc ccaatacatt cagcaagttg 480
acgataaagt gaatcaagag ttagaaaagg atctcaagga caacattgct ctgggacgga 540
aaaacttgca ggactcttta agaacgcagg aagtggttgc gcaggagcag aaagatctgc 600
gtatccgtca gattcaggaa gcgttgcagt atgcgaatca ggcgcaggtg acaaaaccgc 660
agattcaaca gactggcgaa gatatcacac aagatacgtt gttccttttg gggagcgaag 720
cgctggagtc gatgattaag catgaggcga cccgtccgtt ggtgttctca ccaaactact 780
atcagactcg tcaaaacctg cttgatatcg aaagcttaaa ggttgatgat cttgatattc 840
atgcttaccg ctatgtaatg aaaccgacgt tacctattcg tcgtgatagc ccgaaaaagg 900
caattacctt gattctggcg gtgctgctgg gtggcatggt tggcgcgggg attgtgctgg 960
ggcgtaatgc tctacgcaat tacaacgcga agtaacctgc aggcatgcaa gcttctgttt 1020
tggcggatga gagaagaaat tcgtcgcccg ccataaactg ccaggcatca aattaagcag 1080
aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctcttcctgt ctagcaggtg 1140
gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 1200
atatgtatcc gctcatgcta gaaatatttt atctgattaa taagatgatc ttcttgagat 1260
cgttttggtc tgcgcgtaat ctcttgctct gaaaacgaaa aaaccgcctt gcagggcggt 1320
ttttcgaagg ttctctgagc taccaactct ttgaaccgag gtaactggct tggaggagcg 1380
cagtcaccaa aacttgtcct ttcagtttag ccttaaccgg cgcatgactt caagactaac 1440
tcctctaaat caattaccag tggctgctgc cagtggtgct tttgcatgtc tttccgggtt 1500
ggactcaaga cgatagttac cggataaggc gcagcggtcg gactgaacgg ggggttcgtg 1560
catacagtcc agcttggagc gaactgccta cccggaactg agtgtcaggc gtggaatgag 1620
acaaacgcgg ccataacagc ggaatgacac cggtaaaccg aaaggcagga acaggagagc 1680
gcacgaggga gccgccaggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1740
ccactgattt gagcgtcaga tttcgtgatg cttgtcaggg gggcggagcc tatggaaaaa 1800
cggctttgcc gcggccctct cacttccctg ttaagtatct tcctggcatc ttccaggaaa 1860
tctccgcccc gttcgtaagc catttccgct cgccgcagtc gaacgaccga gcgtagcgag 1920
tcagtgagcg aggaagcgga atatatcctg tatcacatat tctgctgacg caccggtgca 1980
gccttttttc tcctgccaca tgaagcactt cactgacacc ctcatcagtg ccaacatagt 2040
aagccagtat acactccgct agcgctgatg tccggcggtg cttttgccgt tacgcaccac 2100
cccgtcagta gctgaacagg agggacagct gatagaaaca gaagccactg gagcacctca 2160
aaaacaccat catacactaa atcagtaagt tggcagcatc acccgacgca ctttgcgccg 2220
aataaagtgt aggctggagc tgcttcgaag ttcctatact ttctagagaa taggaacttc 2280
ggaataggaa cttcaagatc ccctcacgct gccgcaagca ctcagggcgc aagggctgct 2340
aaaggaagcg gaacacgtag aaagccagtc cgcagaaacg gtgctgaccc cggatgaatg 2400
tcagctactg ggctatctgg acaagggaaa acgcaagcgc aaagagaaag caggtagctt 2460
gcagtgggct tacatggcga tagctagact gggcggtttt atggacagca agcgaaccgg 2520
aattgccagc tggggcgccc tctggtaagg ttgggaagcc ctgcaaagta aactggatgg 2580
ctttcttgcc gccaaggatc tgatggcgca ggggatcaag atctgatcaa gagacaggat 2640
gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 2700
tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 2760
tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 2820
ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 2880
cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 2940
aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 3000
tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 3060
aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 3120
atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 3180
cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 3240
tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 3300
accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 3360
gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 3420
tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 3480
agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 3540
gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 3600
gctggagttc ttcgcccacc ccagcttcaa aagcgctctg aagttcctat actttctaga 3660
gaataggaac ttcggaatag gaactaagga ggatattcat atggtttttt taaggcagtt 3720
attggtgccc ttaaacgcct ggtgctacgc ctgaataagt gataataagc ggatgaatgg 3780
cagaaattcg aaagcaaatt cgacccggtc gtcggttcag ggcagggtcg ttaaatagcc 3840
gcttatgtct attgctggtt taccggttta ttgactaccg gaagcagtgt gaccgtgtgc 3900
ttctcaaatg cctgaggcca gtttgctcag gctctccccg tggaggtaat aattgacgat 3960
atgatcattt attctgcctc ccagagcctg ataaaaacgg ttagcgcttc gttaatacag 4020
atgtaggtgt tccacagggt agccagcagc atcctgcgat gcagatccgg aacataatgg 4080
tgcagggcgc ttgtttcggc gtgggtatgg tggcaggccc cgtggccggg ggactgttgg 4140
gcgctgccgg cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga 4200
cgatagtcat gccccgcgcc caccggaagg agctaccgga cagcggtgcg gactgttgta 4260
actcagaata agaaatgagg ccgctcatgg cgttgactct cagtcatagt atcgtggtat 4320
caccggttgg ttccactctc tgttgcgggc aacttcagca gcacgtaggg gacttccgcg 4380
tttccagact ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag 4440
acgttttgca gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac 4500
cagtaaggca accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca 4560
cccgtggcca ggacccaacg ctgcccgaga tgcgccgcgt gcggctgctg gagatggcgg 4620
acgcgatgga tatgttctgc caagggttgg tttgcgcatt cacagttctc cgcaagaatt 4680
gattggctcc aattcttgga gtggtgaatc cgttagcgag gtgccgccgg cttccattca 4740
ggtcgaggtg gcccggctcc atgcaccgcg acgcaacgcg gggaggcaga caaggtatag 4800
ggcggcgcct acaatccatg ccaacccgtt ccatgtgctc gccgaggcgg cataaatcgc 4860
cgtgacgatc agcggtccag tgatcgaagt taggctggta agagccgcga gcgatccttg 4920
aagctgtccc tgatggtcgt catctacctg cctggacagc atggcctgca acgcgggcat 4980
cccgatgccg ccggaagcga gaagaatcat aatggggaag gccatccagc ctcgcgtcgc 5040
gaacgccagc aagacgtagc ccagcgcgtc ggccaattcg cgctaactta cattaattgc 5100
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 5160
cggccaacgc gcggggagag gcggtttgcg tattgggcgc cagggtggtt tttcttttca 5220
ccagtgagac gggcaacagc tgattgccct tcaccgcctg gccctgagag agttgcagca 5280
agcggtccac gctggtttgc cccagcaggc gaaaatcctg tttgatggtg gttgacggcg 5340
ggatataaca tgagctgtct tcggtatcgt cgtatcccac taccgagata tccgcaccaa 5400
cgcgcagccc ggactcggta atggcgcgca ttgcgcccag cgccatctga tcgttggcaa 5460
ccagcatcgc agtgggaacg atgccctcat tcagcatttg catggtttgt tgaaaaccgg 5520
acatggcact ccagtcgcct tcccgttccg ctatcggctg aatttgattg cgagtgagat 5580
atttatgcca gccagccaga cgcagacgcg ccgagacaga acttaatggg cccgctaaca 5640
gcgcgatttg ctggtgaccc aatgcgacca gatgctccac gcccagtcgc gtaccgtctt 5700
catgggagaa aataatactg ttgatgggtg tctggtcaga gacatcaaga aataacgccg 5760
gaacattagt gcaggcagct tccacagcaa tggcatcctg gtcatccagc ggatagttaa 5820
tgatcagccc actgacgcgt tgcgcgagaa gattgtgcac cgccgcttta caggcttcga 5880
cgccgcttcg ttctaccatc gacaccacca cgctggcacc cagttgatcg gcgcgagatt 5940
taatcgccgc gacaatttgc gacggcgcgt gcagggccag actggaggtg gcaacgccaa 6000
tcagcaacga ctgtttgccc gccagttgtt gtgccacgcg gttgggaatg taattcagct 6060
ccgccatcgc cgcttccact ttttcccgcg ttttcgcaga aacgtggctg gcctggttca 6120
ccacgcggga aacggtctga taagagacac cggcatactc tgcgacatcg tataacgtta 6180
ctggtttcac attcaccacc ctgaattgac tctcttccgg gcgctatcat gccataccgc 6240
gaaaggtttt gcaccattcg atggtgtcaa cgtaaatgca tgccgcttcg ccttcgcgcg 6300
cgaattggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt tggtggcggg 6360
accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa gcgacaggcc 6420
gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga gcgctgccgg 6480
cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga cgatagtcat 6540
gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca tcggcggagc 6600
ttatcgactg cacggtgcac caatgcttct ggcgtcaggc agccatcgga agctgtggta 6660
tggctgtgca ggtcgtaaat cactgcataa ttcgtgtcgc tcaaggcgca ctcccgttct 6720
ggataatgtt ttttgcgccg acatcataac ggttctggca aatattctga aatgagctgt 6780
tgacaattaa tcatcggctc gtataatgtg tggaattgtg agcggataac aatttcacac 6840
aggaaacaga attcgagctc atgaaaaaga tttggctggc cctggcagga ctggttctgg 6900
ccttttcagc aagtgcagct gaagaagcct ttgatctgtg gaatgagtgt gcaaaagcat 6960
gtgtactgga tctgaaagat ggtgtgagat ccagcagaat gtcagtggat ccagccattg 7020
cagatacaaa tggccagggt gtactgcatt actctatggt tctggaaggt ggtaatgatg 7080
ccctgaaact ggccattgat aatgcactgt ctatcaccag tgatggtctg acaatcagac 7140
tggagggagg ggtggaaccc aataagcctg tcagatacag ctatacaaga caagccagag 7200
gttcttggag cctgaactgg ctggtgccta ttgggcatga aaaaccatct aacattaaag 7260
tttttattca tgaactgaat gcaggcaatc agctgtctca tatgagccca atttatacca 7320
ttgaaatggg ggatgaactg ctggctaaac tggccagaga tgctacattc tttgtcagag 7380
cccatgaatc aaatgagatg cagcctaccc tggccattag ccatgctggt gtgagtgttg 7440
tcatggcaca aactcagccc aggagagaga aaaggtggtc tgagtggacc agtggcaaag 7500
tgctgtgcct gctggatcct ctggatggtg tttataacta tctggcccaa cagaggtgta 7560
acctggatga tacctgggaa ggtaaaatct atagagtgct ggcaggtaat ccagcaaaac 7620
atgacctgga tatcaaggat aataacaata gcacccctac tgtaatcagc catagactgc 7680
atttcccaga gggaggttca ctggctgccc tgactgctca tcaggcctgt catctgccac 7740
tggaaacttt caccagacac aggcagccaa gaggctggga acagctggaa caatgtggct 7800
atccagttca gaggctggtt gccctgtacc tggcagcaag actgagctgg aatcaggtag 7860
atcaggttat tagaaatgca ctggccagcc cagggagtgg gggtgacctg ggtgaggcaa 7920
ttagagaaca gcctgagcag gccagactgg ccctgactct ggcagcagct gaaagtgaaa 7980
gatttgtgag acaggggaca ggcaatgatg aagcaggtgc agctaatgca gatgttgttt 8040
cactgacttg tcctgttgct aaagatcaga acaggaccaa aggtgaatgt gctggaccag 8100
ctgattcagg agatgcactg ctggagagga actatccaac tggtgcagaa ttcctgggag 8160
atggtggtga tgtttctttt agcaccagag gcacacagaa ctggactgtg gaaagactgc 8220
tgcaggcaca tagacagctg gaagaaagag gctatgtatt tgttggctac catggtactt 8280
tcctggaagc agcacagtcc attgtctttg gaggggttag agccagaagc caggatctgg 8340
atgctatttg gagaggtttt tatattgctg gggatccagc cctggcctat ggatatgcac 8400
aagatcagga acctgatgcc agaggcagaa tcagaaatgg tgccctgctg agggtttatg 8460
ttcctaggtc tagcctgcca ggattttata gaacctctct gaccctggca gcccctgaag 8520
cagcaggtga ggtggagaga ctgattggtc atcctctgcc actgagactg gatgccatta 8580
cagggccaga agaagaaggt ggcagagtga caattctggg ttggcccctg gcagagagga 8640
cagtagttat tccttcagca atccctacag atccaaggaa tgtgggtggg gacctggatc 8700
catcctcaat tccagataag gaacaggcaa tttcagccct gcctgattat gctagtcagc 8760
caggtaaacc acctagagaa gatctgaaac accaccacca ccaccactga tctag 8815
<210> 21
<211> 993
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 21
gaattcatga gagtagaaaa taataatgtt tctgggcaaa accatgaccc ggaacagatt 60
gatttgattg atttactagt gcagttgtgg cgtggcaaga tgacaatcat catttccgtc 120
attgtggcta ttgccctagc tattggatat ttggcagtag cgaaggagaa atggacgtca 180
acagcaatta tcactcagcc cgatgtgggg caaattgctg gctataacaa tgccatgaat 240
gttatctatg gtcaggctgc accgaaagta tcggatttgc aggagacgtt aattggtcgc 300
ttcagttctg ccttctctgc attagcagaa acgctggata atcaggaaga accagaaaaa 360
cttaccatcg aaccttctgt taagaaccag caattaccat tgactgtttc ttatgttggg 420
caaactgcag agggcgcaca aatgaagttg gcccaataca ttcagcaagt tgacgataaa 480
gtgaatcaag agttagaaaa ggatctcaag gacaacattg ctctgggacg gaaaaacttg 540
caggactctt taagaacgca ggaagtggtt gcgcaggagc agaaagatct gcgtatccgt 600
cagattcagg aagcgttgca gtatgcgaat caggcgcagg tgacaaaacc gcagattcaa 660
cagactggcg aagatatcac acaagatacg ttgttccttt tggggagcga agcgctggag 720
tcgatgatta agcatgaggc gacccgtccg ttggtgttct caccaaacta ctatcagact 780
cgtcaaaacc tgcttgatat cgaaagctta aaggttgatg atcttgatat tcatgcttac 840
cgctatgtaa tgaaaccgac gttacctatt cgtcgtgata gcccgaaaaa ggcaattacc 900
ttgattctgg cggtgctgct gggtggcatg gttggcgcgg ggattgtgct ggggcgtaat 960
gctctacgca attacaacgc gaagtaagtc gac 993
<210> 22
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 22
Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg
1 5 10
<210> 23
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 23
Asp Gln Asn Arg
1
<210> 24
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
consensus sequence"
<220>
<221> VARIANT
<222> (1)..(1)
<223> /replace="Glu"
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace="Arg" or "Asn" or "Asp" or "Cys" or "Gln" or "Glu"
or "Gly" or "His" or "Ile" or "Leu" or "Lys" or "Met" or
"Phe" or "Ser" or "Thr" or "Trp" or "Tyr" or "Val"
<220>
<221> MISC_FEATURE
<222> (1)..(2)
<223> /note="Residues given in the sequence have no preference
with respect to those in the annotations for said positions"
<220>
<221> MOD_RES
<222> (4)..(4)
<223> /replace="Arg" or "Asn" or "Asp" or "Cys" or "Gln" or "Glu"
or "Gly" or "His" or "Ile" or "Leu" or "Lys" or "Met" or
"Phe" or "Ser" or "Thr" or "Trp" or "Tyr" or "Val"
<220>
<221> VARIANT
<222> (5)..(5)
<223> /replace="Thr"
<220>
<221> MISC_FEATURE
<222> (4)..(5)
<223> /note="Residues given in the sequence have no preference
with respect to those in the annotations for said positions"
<220>
<221> MISC_FEATURE
<222> (1)..(5)
<223> /note="See specification as filed for detailed description of
substitutions and preferred embodiments"
<400> 24
Asp Ala Asn Ala Ser
1 5
<210> 25
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 25
Asp Asn Asn Asn Ser
1 5
<210> 26
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 26
Asp Gln Asn Arg Thr
1 5
<210> 27
<211> 2160
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 27
gaattcatgt tgaaaaaaga gtatttaaaa aacccttatt tagttttgtt tgcgatgatt 60
atattagctt atgtttttag tgtattttgc aggttttatt gggtttggtg ggcaagtgag 120
tttaatgagt attttttcaa taatcagtta atgatcattt caaatgatgg ctatgctttt 180
gctgagggcg caagagatat gatagcaggt tttcatcagc ctaatgattt gagttattat 240
ggatcttctt tatccgcgct tacttattgg ctttataaaa tcacaccttt ttcttttgaa 300
agtatcattt tatatatgag tactttttta tcttctttgg tggtgattcc tactattttg 360
ctagctaacg aatacaaacg tcctttaatg ggctttgtag ctgctctttt agcaagtata 420
gcaaacagtt attataatcg cactatgagt gggtattatg atacggatat gctggtaatt 480
gttttgccta tgtttatttt attttttatg gtaagaatga ttttaaaaaa agactttttt 540
tcattgattg ccttgccgtt atttatagga atttatcttt ggtggtatcc ttcaagttat 600
actttaaatg tagctttaat tggacttttt ttaatttata cacttatttt tcatagaaaa 660
gaaaagattt tttatatagc tgtgattttg tcttctctta ctctttcaaa tatagcatgg 720
ttttatcaaa gtgccattat agtaatactt tttgctttat tcgccttaga gcaaaaacgc 780
ttaaatttta tgattatagg aattttaggt agtgcaactt tgatattttt gattttaagt 840
ggtggggttg atcctatact ttatcagctt aaattttata tttttagaag tgatgaaagt 900
gcgaatttaa cgcagggctt tatgtatttt aatgtcaatc aaaccataca agaagttgaa 960
aatgtagatc ttagcgaatt tatgcgaaga attagtggta gtgaaattgt ttttttgttt 1020
tctttgtttg gttttgtatg gcttttgaga aaacataaaa gtatgattat ggctttacct 1080
atattggtgc ttgggttttt agccttaaaa ggggggctta gatttaccat ttattctgta 1140
cctgtaatgg ccttaggatt tggtttttta ttgagcgagt ttaaggctat aatggttaaa 1200
aaatatagcc aattaacttc aaatgtttgt attgtttttg caactatttt gactttagct 1260
ccagtattta tccatattta caactataaa gcgccaacag ttttttctca aaatgaagca 1320
tcattattaa atcaattaaa aaatatagcc aatagagaag attatgtggt aacttgggcg 1380
gcttatggtt atcctgtgcg ttattatagc gatgtgaaaa ctttagtaga tggtggaaag 1440
catttaggta aggataattt tttcccttct tttgctttaa gcaaagatga acaagctgca 1500
gctaatatgg caagacttag tgtagaatat acagaaaaaa gcttttatgc tccgcaaaat 1560
gatattttaa aaacagacat tttgcaagcc atgatgaaag attataatca aagcaatgtg 1620
gatttgtttc tagcttcatt atcaaaacct gattttaaaa tcgatacgcc aaaaactcgt 1680
gatatttatc tttatatgcc cgctagaatg tctttgattt tttctacggt ggctagtttt 1740
tcttttatta atttagatac aggagttttg gataaacctt ttacctttag cacagcttat 1800
ccacttgatg ttaaaaatgg agaaatttat cttagcaacg gagtggtttt aagcgatgat 1860
tttagaagtt ttaaaatagg tgataatgtg gtttctgtaa atagtatcgt agagattaat 1920
tctattaaac aaggtgaata caaaatcact ccaattgatg ataaggctca gttttatatt 1980
ttttatttaa aggatagtgc tattccttac gcacaattta ttttaatgga taaaaccatg 2040
tttaatagtg cttatgtgca aatgtttttt ttaggaaatt atgataagaa tttatttgac 2100
ttggtgatta attctagaga tgctaaggtt tttaaactta aaatttaccc atacgatgtt 2160
Claims (11)
- (i) 스타필로코커스 아우레우스인 그람-양성 세균으로부터의 하나 이상의 글리코실트랜스퍼라제(glycosyltransferase)를 코딩하는 뉴클레오타이드 서열;
(ii) 슈도모나스 애루기노사인 그람-음성 세균으로부터의 하나 이상의 글리코실트랜스퍼라제를 코딩하는 뉴클레오타이드 서열;
(iii) 아미노산 공통 서열 D/E-X-N-Z-S/T를 포함하는 담체 단백질로서, 이때 X 및 Z가 프롤린을 제외한 임의의 천연 아미노산일 수 있는, 담체 단백질을 코딩하는 뉴클레오타이드 서열; 및
(iv) 올리고사카릴 트랜스퍼라제를 코딩하는 뉴클레오타이드 서열
을 포함하는,
에스케리치아 콜라이(Escherichia coli)인 그람-음성 숙주 원핵 유기체. - 제1항에 있어서,
스타필로코커스 아우레우스가 캡슐형 폴리사카라이드 5 균주 또는 캡슐형 폴리사카라이드 8 균주인, 그람-음성 숙주 원핵 유기체. - 제1항 또는 제2항에 있어서,
스타필로코커스 아우레우스가 메티실린 내성 균주인, 그람-음성 숙주 원핵 유기체. - 제1항 또는 제2항에 있어서,
상이한 그람-양성 세균 균주로부터의 2개 이상의 글리코실트랜스퍼라제를 포함하는 그람-음성 숙주 원핵 유기체. - 제1항 또는 제2항에 있어서,
담체 단백질이 슈도모나스 애루기노사 외독소, 스타필로코커스 아우레우스 알파 헤모라이신 또는 스타필로코커스 아우레우스 응괴 인자 A인, 그람-음성 숙주 원핵 유기체. - 제1항 또는 제2항에 있어서,
올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터의 것인, 그람-음성 숙주 원핵 유기체. - 제1항 또는 제2항에 따른 그람-음성 숙주 원핵 유기체를 사용하여 재조합 N-글리코실화된 단백질을 제조하는 방법.
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US33217010P | 2010-05-06 | 2010-05-06 | |
US61/332,170 | 2010-05-06 | ||
PCT/EP2011/057111 WO2011138361A1 (en) | 2010-05-06 | 2011-05-04 | Capsular gram-positive bacteria bioconjugate vaccines |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127031847A Division KR20130063510A (ko) | 2010-05-06 | 2011-05-04 | 캡슐형 그람-양성 세균 생체접합체 백신 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180021219A KR20180021219A (ko) | 2018-02-28 |
KR101916290B1 true KR101916290B1 (ko) | 2018-11-09 |
Family
ID=44902091
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187004586A KR101916290B1 (ko) | 2010-05-06 | 2011-05-04 | 캡슐형 그람-양성 세균 생체접합체 백신 |
KR1020127031847A KR20130063510A (ko) | 2010-05-06 | 2011-05-04 | 캡슐형 그람-양성 세균 생체접합체 백신 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127031847A KR20130063510A (ko) | 2010-05-06 | 2011-05-04 | 캡슐형 그람-양성 세균 생체접합체 백신 |
Country Status (20)
Country | Link |
---|---|
US (3) | US8871491B2 (ko) |
EP (2) | EP3281639B1 (ko) |
JP (2) | JP6339366B2 (ko) |
KR (2) | KR101916290B1 (ko) |
CN (1) | CN103079591B (ko) |
AU (2) | AU2011249839B2 (ko) |
CA (1) | CA2798381C (ko) |
CY (1) | CY1119895T1 (ko) |
DK (1) | DK2566507T3 (ko) |
ES (2) | ES2657588T3 (ko) |
HR (1) | HRP20180064T1 (ko) |
HU (1) | HUE037956T2 (ko) |
IL (1) | IL222711B (ko) |
LT (1) | LT2566507T (ko) |
NO (1) | NO2566507T3 (ko) |
PL (1) | PL2566507T3 (ko) |
PT (1) | PT2566507T (ko) |
SG (1) | SG185433A1 (ko) |
SI (1) | SI2566507T1 (ko) |
WO (1) | WO2011138361A1 (ko) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1481057B1 (en) * | 2002-03-07 | 2006-02-15 | Eidgenössische Technische Hochschule Zürich | System and method for the production of recombinant glycosylated proteins in a prokaryotic host |
EP3427749A1 (en) | 2008-02-20 | 2019-01-16 | GlaxoSmithKline Biologicals SA | Bioconjugates made from recombinant n-glycosylated proteins from procaryotic cells |
TR201803015T4 (tr) | 2009-11-19 | 2018-03-21 | Glaxosmithkline Biologicals Sa | Prokaryotik hücrelerde immünojenik polisakaridler üreten biyosentetik sistem. |
US9526775B2 (en) | 2012-04-27 | 2016-12-27 | Washington University | Glycoengineered outer membrane vesicles and use thereof as vaccines |
JP2015522692A (ja) | 2012-07-16 | 2015-08-06 | ファイザー・インク | 糖およびその使用 |
BR112015001390B1 (pt) | 2012-07-26 | 2024-04-30 | The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc | Proteína de fusão, ácido nucleico isolado e uso de uma composição de vacina |
TR201904022T4 (tr) | 2012-10-12 | 2019-04-22 | Glaxosmithkline Biologicals Sa | Konakçı hücre modifikasyon yöntemleri. |
EP2917351B1 (en) | 2012-11-07 | 2018-12-19 | GlaxoSmithKline Biologicals S.A. | Production of recombinant vaccine in e. coli by enzymatic conjugation |
US9931392B2 (en) | 2013-01-18 | 2018-04-03 | London School Of Hygiene And Tropical Medicine | Glycosylation method |
GB201301085D0 (en) | 2013-01-22 | 2013-03-06 | London School Hygiene & Tropical Medicine | Glycoconjugate Vaccine |
SG11201602546RA (en) * | 2013-10-11 | 2016-04-28 | Glycovaxyn Ag | Methods of host cell modification |
JP2016540764A (ja) * | 2013-12-04 | 2016-12-28 | グリコヴァキシン アーゲー | 大腸菌で合成された糖タンパク質ワクチンによる黄色ブドウ球菌感染の予防 |
SI3131577T1 (sl) * | 2014-04-17 | 2020-08-31 | Glaxosmithkline Biologicals S.A. | Modificirane gostiljske celice in uporabe le-teh |
US10307474B2 (en) * | 2014-08-08 | 2019-06-04 | Glaxosmithkline Biologicals S.A. | Modified host cells and hybrid oligosaccharides for use in bioconjugate production |
US9616114B1 (en) | 2014-09-18 | 2017-04-11 | David Gordon Bermudes | Modified bacteria having improved pharmacokinetics and tumor colonization enhancing antitumor activity |
AU2015342943B2 (en) * | 2014-11-05 | 2018-06-28 | The United States Of America As Represented By The Secretary Of The Navy | Synthetic antigen constructs against Campylobacter jejuni |
US10500261B2 (en) | 2014-11-05 | 2019-12-10 | The United States Of America As Represented By The Secretary Of The Navy | Synthetic antigen constructs against campylobacter jejuni |
PT3240895T (pt) | 2014-12-30 | 2022-03-02 | Glaxosmithkline Biologicals Sa | Composições e métodos para glicosilação de proteínas |
WO2017001586A1 (en) * | 2015-07-01 | 2017-01-05 | Glaxosmithkline Biologicals S.A. | Immunogenic compositions |
GB201518668D0 (en) | 2015-10-21 | 2015-12-02 | Glaxosmithkline Biolog Sa | Immunogenic Comosition |
GB201610599D0 (en) | 2016-06-17 | 2016-08-03 | Glaxosmithkline Biologicals Sa | Immunogenic Composition |
US11180535B1 (en) | 2016-12-07 | 2021-11-23 | David Gordon Bermudes | Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria |
US11129906B1 (en) | 2016-12-07 | 2021-09-28 | David Gordon Bermudes | Chimeric protein toxins for expression by therapeutic bacteria |
GB201712678D0 (en) | 2017-08-07 | 2017-09-20 | Glaxosmithkline Biologicals Sa | Process for the manipulation of nucleic acids |
GB201721576D0 (en) | 2017-12-21 | 2018-02-07 | Glaxosmithkline Biologicals Sa | Hla antigens and glycoconjugates thereof |
GB201721582D0 (en) * | 2017-12-21 | 2018-02-07 | Glaxosmithkline Biologicals Sa | S aureus antigens and immunogenic compositions |
CN108330142B (zh) * | 2018-02-09 | 2021-09-17 | 河北科技师范学院 | 一种具有免疫保护作用的美人鱼发光杆菌溶血素Hlych蛋白 |
GB201802339D0 (en) * | 2018-02-13 | 2018-03-28 | Glaxosmithkline Biologicals Sa | Immunogenic composition |
US11260119B2 (en) | 2018-08-24 | 2022-03-01 | Pfizer Inc. | Escherichia coli compositions and methods thereof |
CN109400704B (zh) * | 2018-11-14 | 2020-07-21 | 珠海泰诺麦博生物技术有限公司 | 一种抗金黄色葡萄球菌α-溶血素的抗体及其应用 |
US20220054632A1 (en) | 2018-12-12 | 2022-02-24 | Glaxosmithkline Biologicals Sa | Modified carrier proteins for o-linked glycosylation |
JP2022517981A (ja) * | 2019-01-11 | 2022-03-11 | ノースウェスタン ユニバーシティ | 原核細胞溶解物におけるバイオコンジュゲートワクチンの合成 |
EP3757217A1 (en) | 2019-06-27 | 2020-12-30 | GlaxoSmithKline Biologicals S.A. | Methods for protein purification |
EP3770269A1 (en) | 2019-07-23 | 2021-01-27 | GlaxoSmithKline Biologicals S.A. | Quantification of bioconjugate glycosylation |
EP3777884A1 (en) | 2019-08-15 | 2021-02-17 | GlaxoSmithKline Biologicals S.A. | Immunogenic composition |
CN112575041B (zh) * | 2019-09-30 | 2022-12-13 | 江南大学 | 一种混合碳源高效发酵生产phb的工程菌及其应用 |
CA3185642A1 (en) | 2020-06-25 | 2021-12-30 | Glaxosmithkline Biologicals Sa | Modified exotoxin a proteins |
CN114085255B (zh) * | 2020-08-24 | 2023-08-29 | 山东大学 | 一种苏黎世克罗诺杆菌5型脂多糖o-抗原寡糖片段及其制备方法与应用 |
WO2022171679A2 (en) | 2021-02-11 | 2022-08-18 | Glaxosmithkline Biologicals Sa | Protein |
WO2023118033A1 (en) | 2021-12-22 | 2023-06-29 | Glaxosmithkline Biologicals Sa | Vaccine |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006119987A2 (en) * | 2005-05-11 | 2006-11-16 | ETH Zürich | Recombinant n-glycosylated proteins from procaryotic cells |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1900A (en) | 1840-12-14 | Machine for extracting stumps | ||
ATE67786T1 (de) | 1984-08-01 | 1991-10-15 | Boehringer Ingelheim Int | Neue genetische sequenzen, die durch sie codierten interferon-peptide vom typ i und diese sie produzierende organismen. |
US5643758A (en) | 1987-03-10 | 1997-07-01 | New England Biolabs, Inc. | Production and purification of a protein fused to a binding protein |
WO1994026906A2 (en) | 1993-05-14 | 1994-11-24 | The Upjohn Company | CLONED DNA ENCODING A UDP-GALNAc:POLYPEPTIDE,N-ACETYLGALACTOS AMINYLTRANSFERASE |
US6503744B1 (en) | 1999-02-01 | 2003-01-07 | National Research Council Of Canada | Campylobacter glycosyltransferases for biosynthesis of gangliosides and ganglioside mimics |
CA2363297C (en) | 1999-03-02 | 2011-08-09 | Michael J. Betenbaugh | Engineering intracellular sialylation pathways |
US20020019342A1 (en) | 2000-05-12 | 2002-02-14 | Robert Bayer | In vitro modification of glycosylation patterns of recombinant glycopeptides |
CA2411968C (en) | 2000-06-30 | 2009-12-15 | Flanders Interuniversity Institute For Biotechnology (Vib) | Protein glycosylation modification in pichia pastoris |
EP1481057B1 (en) | 2002-03-07 | 2006-02-15 | Eidgenössische Technische Hochschule Zürich | System and method for the production of recombinant glycosylated proteins in a prokaryotic host |
US20040265954A1 (en) | 2002-03-07 | 2004-12-30 | Markus Aebi | System and method for the production of recombinant proteins |
US7598354B2 (en) | 2002-08-01 | 2009-10-06 | National Research Council Of Canada | Campylobacter glycans and glycopeptides |
EP1756149B1 (en) | 2004-05-24 | 2013-09-04 | THE GOVERNMENT OF THE UNITED STATES OF AMERICA, as represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES | Live, oral vaccine for protection against shigella dysenteriae serotype 1 |
EP2476433A1 (en) | 2006-03-30 | 2012-07-18 | GlaxoSmithKline Biologicals S.A. | Immunogenic composition |
US20100286067A1 (en) * | 2008-01-08 | 2010-11-11 | Biogenerix Ag | Glycoconjugation of polypeptides using oligosaccharyltransferases |
EP3427749A1 (en) * | 2008-02-20 | 2019-01-16 | GlaxoSmithKline Biologicals SA | Bioconjugates made from recombinant n-glycosylated proteins from procaryotic cells |
-
2011
- 2011-05-04 EP EP17192866.6A patent/EP3281639B1/en active Active
- 2011-05-04 LT LTEP11724567.0T patent/LT2566507T/lt unknown
- 2011-05-04 PL PL11724567T patent/PL2566507T3/pl unknown
- 2011-05-04 JP JP2013508489A patent/JP6339366B2/ja active Active
- 2011-05-04 NO NO11724567A patent/NO2566507T3/no unknown
- 2011-05-04 ES ES11724567.0T patent/ES2657588T3/es active Active
- 2011-05-04 AU AU2011249839A patent/AU2011249839B2/en active Active
- 2011-05-04 US US13/100,603 patent/US8871491B2/en active Active
- 2011-05-04 CA CA2798381A patent/CA2798381C/en active Active
- 2011-05-04 ES ES17192866T patent/ES2844596T3/es active Active
- 2011-05-04 SG SG2012081535A patent/SG185433A1/en unknown
- 2011-05-04 DK DK11724567.0T patent/DK2566507T3/da active
- 2011-05-04 EP EP11724567.0A patent/EP2566507B1/en active Active
- 2011-05-04 WO PCT/EP2011/057111 patent/WO2011138361A1/en active Application Filing
- 2011-05-04 KR KR1020187004586A patent/KR101916290B1/ko active IP Right Grant
- 2011-05-04 CN CN201180033560.1A patent/CN103079591B/zh active Active
- 2011-05-04 HU HUE11724567A patent/HUE037956T2/hu unknown
- 2011-05-04 SI SI201131403T patent/SI2566507T1/en unknown
- 2011-05-04 KR KR1020127031847A patent/KR20130063510A/ko active Search and Examination
- 2011-05-04 PT PT117245670T patent/PT2566507T/pt unknown
-
2012
- 2012-10-25 IL IL222711A patent/IL222711B/en active IP Right Grant
-
2014
- 2014-09-23 US US14/494,150 patent/US9585950B2/en active Active
-
2016
- 2016-07-25 AU AU2016208265A patent/AU2016208265A1/en not_active Abandoned
- 2016-10-06 JP JP2016197813A patent/JP6435583B2/ja active Active
-
2017
- 2017-01-25 US US15/414,900 patent/US10307473B2/en active Active
-
2018
- 2018-01-15 HR HRP20180064TT patent/HRP20180064T1/hr unknown
- 2018-02-06 CY CY20181100148T patent/CY1119895T1/el unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006119987A2 (en) * | 2005-05-11 | 2006-11-16 | ETH Zürich | Recombinant n-glycosylated proteins from procaryotic cells |
Non-Patent Citations (2)
Title |
---|
GlycoVaxyn and a Harvard University affiliated hospital receive USD 3.4 Million NIH grant for Staphylococcus aureus Vaccine development. 2010.05.04.* |
Infection and Immunity. 1990, 58(7):2367-2374. |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101916290B1 (ko) | 캡슐형 그람-양성 세균 생체접합체 백신 | |
CA2889767C (en) | Production of recombinant vaccine in e. coli by enzymatic conjugation | |
JPH07504423A (ja) | 熱ショックタンパク質とオリゴ糖または多糖とから形成されるコンジュゲート | |
KR20210141586A (ko) | 대장균 o-항원 다당류의 바이오컨쥬게이트, 이의 제조 방법, 및 이의 사용 방법 | |
KR20140101835A (ko) | 클로스트리듐 디피실레 톡신-기반 백신 | |
KR20210134044A (ko) | 대장균 o-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법 | |
JP2021528059A (ja) | グリコシル化されたComPピリンバリアント、製造方法及びその使用 | |
JP2023531242A (ja) | 改変Exotoxin Aタンパク質 | |
Duke et al. | Development and immunogenicity of a prototype multivalent group B Streptococcus bioconjugate vaccine | |
US20240066109A1 (en) | Klebsiella Pneumoniae O-Antigen Glycosylated Proteins and Methods of Making and Uses Thereof | |
AU739641B2 (en) | Nucleic acid and amino acid sequences relating to helicobacter pylori and vaccine compositions thereof | |
KR20230043157A (ko) | 다가 백신 조성물 및 이의 용도 | |
JP2024517754A (ja) | O-結合型グリコシル化に十分な最小シークオン | |
MXPA99004890A (en) | Nucleic acid and amino acid sequences relating to helicobacter pylori | |
CZ198899A3 (cs) | Sekvence nukleových kyselin a aminokyselin související s Helicobacter pylori a vakcínové kompozice z nich připravené |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) |