KR101754083B1 - 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 - Google Patents

향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 Download PDF

Info

Publication number
KR101754083B1
KR101754083B1 KR1020127010589A KR20127010589A KR101754083B1 KR 101754083 B1 KR101754083 B1 KR 101754083B1 KR 1020127010589 A KR1020127010589 A KR 1020127010589A KR 20127010589 A KR20127010589 A KR 20127010589A KR 101754083 B1 KR101754083 B1 KR 101754083B1
Authority
KR
South Korea
Prior art keywords
plant
nucleic acid
delete delete
polypeptide
sequence
Prior art date
Application number
KR1020127010589A
Other languages
English (en)
Other versions
KR20120125225A (ko
Inventor
최양도
최도일
크리스토페 뢰제
송지영
박연일
Original Assignee
바스프 플랜트 사이언스 컴퍼니 게엠베하
재단법인 작물유전체기능연구사업단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바스프 플랜트 사이언스 컴퍼니 게엠베하, 재단법인 작물유전체기능연구사업단 filed Critical 바스프 플랜트 사이언스 컴퍼니 게엠베하
Publication of KR20120125225A publication Critical patent/KR20120125225A/ko
Application granted granted Critical
Publication of KR101754083B1 publication Critical patent/KR101754083B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/827Flower development or morphology, e.g. flowering promoting factor [FPF]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physiology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 일반적으로 분자생물학 분야에 관한 것이며, SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 해당 야생형 식물 또는 다른 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.

Description

향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 {Plants having enhanced yield-related traits and a method for making the same}
본 발명은 일반적으로 분자생물학 분야에 관한 것이며, SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 해당 야생형 식물 또는 다른 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.
세계 인구의 증가와 농업에 유용한 경작지의 감소는 농업의 효율성을 증가시키는 연구에 박차를 가하게 만들었다. 작물 및 원예농업 향상을 위한 전통적인 방식은 바람직한 특성을 갖는 식물체를 동정하기 위하여 선택적 육종기법을 이용한다. 그러나, 상기 선택적 육종기법에는 몇 약점이 있는데, 즉 노동집약적이며 양친으로부터 원하는 형질이 항상 전해지는 것이 아닌 이종의 유전적 요소를 갖는 식물로 귀착된다는 것이다. 분자생물학의 진보는 인간이 동물 및 식물의 생식질 (germplasm)을 변형하게 허용했다. 식물유전공학은 유전물질 (전형적으로 DNA 또는 RNA 형태)의 분리와 조작 및 이 유전물질을 식물체 내로 도입하게 했다. 상기 기술은 다양한 향상된 경제적, 농업적, 원예적 형질을 갖는 작물 또는 식물을 제공하는 능력이 있다.
특히 경제적으로 중요한 형질은 증가된 수확량이다. 수확량은 보통 작물로부터 경제적 가치의 측정할 수 있는 산물로 정의된다. 이는 양 및/또는 질의 면에서 정의될 수 있다. 수확량은 몇 요인에 직접적으로 의존되는데, 예를 들면 기관의 수와 크기, 식물체 형상 (예를 들면, 가지의 수), 종자 생산, 잎의 노화 등이다. 뿌리 발달, 양분 흡수, 스트레스 내성, 및 초기 활력 또한 수확량 결정에 중요한 요인일 수 있다. 상기 요인들을 최적화하는 것이 작물 수확량 향상에 기여할 수 있다.
많은 식물의 종자는 인간과 동물의 영양에 중요하므로 종자 수확량이 특히 중요한 형질이다. 옥수수, 벼, 밀, 캐놀라 및 대두와 같은 작물이 종자 자체의 직접적인 소비 또는 가공종자로 육성된 육류 소비를 통해서 전체 인간 칼로리 흡수량의 절반 이상을 차지한다. 상기 작물들은 설탕, 기름 및 산업적 가공공정에 사용되는 많은 종류의 대사물의 재료이기도 하다. 종자는 배 (어린 줄기와 뿌리의 근원) 및 배유 (발아 동안 및 실생의 초기 생장 동안 배의 양분의 공급원)를 포함한다. 종자 발달에는 많은 유전자가 관여되며, 뿌리, 잎 및 줄기로부터 생장하는 종자로 대사물의 이동이 필요하다. 특히 배유는 탄수화물, 오일 및 단백질의 대사 전구체를 동화하여, 이들을 알곡을 채우기 위한 저장성 고분자로 합성한다.
많은 작물에 있어 또 하나의 중요한 형질은 초기 활력 (early vigour)이다. 초기 활력을 향상시키는 것은 온대 및 열대 벼 품종에 있어 현대 벼 육종 프로그램의 중요한 목표이다. 긴 뿌리는 물에 파종하는 벼에서는 적절하게 토양에 박히기 위하여 중요하다. 벼를 직접 논에 파종한 곳에서와 식물이 물 밖으로 급속히 나와야 하는 곳에서는 긴 줄기가 활력과 연관되어 있다. 조파지에서는 긴 중배축과 자엽초가 좋은 실생 출현 (seedling emergence)에 있어서 중요하다. 식물체 내로 초기 활력을 부여하는 능력은 농업에서 매우 중요하다. 예를 들면, 불충분한 초기 활력은 대서양 연안 유럽에서 옥수수 지대 생식질에 기초한 옥수수 교배종의 도입에 대해서 제한되어 왔다.
추가의 중요한 형질은 향상된 비생물적 스트레스 내성이다. 비생물적 스트레스는 대다수 주요 작물의 평균 수확량을 50% 이상 감소시키는 전 세계적인 작물 손실의 주요 원인이다 (Wang et al., Planta 218, 1-14, 2003). 비생물적 스트레스는 건조, 염분, 극단적인 기온, 화학적 독성 및 산화적 스트레스에 의해 야기될 수 있다. 비생물적 스트레스에 대한 식물의 내성을 향상시키는 것은 전세계의 농부들에게 매우 경제적 가치가 있는 것이며, 불리한 상황에서 그리고 작물재배가 가능하지 않은 곳에서도 작물재배를 가능하게 한다.
작물 수확량은 따라서 상기 요인들 중 어느 하나를 최적화함으로써 증가시킬 수 있다.
최종 목적에 따라, 임의의 수확량 형질의 변형이 다른 것에 비해 월등히 유리할 수 있다. 사료 또는 목재 생산, 또는 바이오연료 자원과 같은 경우에 적용에 대해 예를 들면, 식물체의 영양기관 부분의 증가가 바람직하며, 곡분, 전분 또는 유지 생산과 같은 경우에는 종자에 관련된 매개변수의 증가가 특히 바람직하다. 종자 매개변수 중에서도 용도에 따라 특정한 일부의 것이 다른 것에 비해 훨씬 중요하다. 종자 크기의 증가 또는 종자 수의 증가의 형태로 다양한 기작이 종자 수확량 증가에 영향을 미칠 수 있다.
식물의 수확량 (종자 수확량 및/또는 생물량 (biomass))의 증가에 대한 하나의 접근은 세포 주기 또는 식물 생장 또는 방어 기작에 관련된 다양한 신호전달 경로와 같은 식물의 내재적 생장 기작의 변형을 통해서 가능하다.
식물에서 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 다양한 수확량 관련 형질이 향상될 수 있다는 것이 밝혀졌다.
1. SGT1 폴리펩티드
SGT1은 skp1 돌연변이체의 억제 대립유전자로 알려져 있다.
Chung 등은 2006년에 SGT1이 발달 과정에서 중요한 역할을 수행한다는 것을 보고했다. SGT1은 단백질 기능에 필요한 독특한 도메인인 테트라트리코펩티드 (tetratricopeptide) 반복 도메인 (TPR), CHORD 및 SGT1 모티프 (CS) 및 SGT1-특이 모티프 (SGS 모티프)를 가진다. TPR 도메인은 샤페론, 세포 주기, 전사, 또는 단백질 수송 복합체로 기능하는 다중복합체 단백질 간의 단백질-단백질 상호작용을 매개하는 것으로 알려져 있다. 예를 들면, SGT1의 TPR 도메인은 열-충격 단백질 70 (HSP70)에 결합하는 것을 보여준다. 그러나, SGT1의 CS 도메인은 HSP90과 상호작용하고 다른 조절 단백질의 접힘에 관여하는 것으로 알려져 있는 인간 p23 단백질의 하나와 유사하다.
2. CLC - pKG 폴리펩티드
원핵 및 진핵 생물에서, 음이온 채널/운반체는 대사의 조절, 전기 화학적 구배 (electrochemical gradient)의 유지 및 비생물적 및 생물적 환경 스트레스에 대한 적응을 초래하는 신호전달 경로에서 중요한 참가자 (player)로 나타난다. 식물에서, 그들은 잎에서의 가스 교환을 조절하는 기공 개폐의 조절, 식물-병원균 상호작용, 뿌리 물관부 로딩 (xylem loading), 대사물질의 분획화 (compartmentation) 및 양성자 구배 커플링 (coupling)과 같은 다양한 생리적 기능에 기여한다(De Angeli et al. 2007 Phil. Trans. R. Soc. B 2009 364, 195-201). 음이온 채널 활성 및 관련된 조절 기작은 주로 전기생리학 기법 (electrophysiological technique)을 사용하여 규명되었다. 그들은 원형질막, 액포막 (tonoplast), 소포체, 미토콘드리아 및 엽록체를 포함하는 모든 식물 막에서 보고되었고, 원형질막 채널은 다른 막에 위치한 것에 비해 가장 잘 규명되었다. 벼 및 애기장대와 같은 모델 식물에는 2개의 다른 서브패밀리에 걸쳐서 분포된 CLC를 코딩하는 유전자가 7개까지 있다 (Marmagne et al. 2007, Journal of Experimental Botany, Vol. 58, No. 12, pp. 3385-3393). AtCLCe 및 AtCLCf 단백질을 포함하는 상기 서브패밀리의 하나는 원핵세포 CLC에 가깝고, 전적으로 클로라이드 채널 원핵세포 그룹에 속하는 반면에 다른 하나의 클래스는 진핵세포 CLC에 가깝다. 애기장대 AtCLCf 단백질은 식물 엽록체의 선조 전구체 (ancestor precursor)를 나타내는 것으로 여겨지는 남세균 CLC의 어떤 CLC들과 같은 유사한 세포내 (subcellular) 분포 및 아마도 유사한 기능을 갖는 것으로 보고되었다.
질산염 (Nitrate) 및 말산염 (malate)은 식물 세포에서 음이온의 대다수를 나타낸다. 질산염은 영양분이지만 신호전달 분자로도 작용할 수 있다. 식물은 저- 및 고- 친화성 운송자가 관련된 복잡한 질산염 흡수 체계를 갖는데, 질산염은 물관부를 통해서 운송된 후에 세포성 대사로 들어가거나 국부적으로 저장된다. 세포는 질산염 환원효소 경로를 통해 질산염을 흡수하거나 액포막에 이것을 저장하며, 세포 외 질산염의 흡수, 액포에서의 저장 및 동화작용에 의해 조절되는 역학적인 균형이 세포질 및 액포의 질산염 수준 사이에 존재한다. 클로라이드 채널 (CLC) 패밀리의 발견은 액포막 및 세포질 사이의 양성자/질산염 교환 기작을 설명할 수 있게 했다. 세포내 위치의 결정, 발현 패턴, 및 넉아웃 (knockout) 돌연변이체 표현형의 규명은 CLC 단백질의 생리적인 역할에 대한 통찰력을 제공했다. 표현형적 분석은 clca-1 및 clca-2 돌연변이체 식물이 뿌리 및 줄기 조직에서 야생형 식물에 비해 감소된 질산염을 갖는다는 것을 보여준다. 또한 clcc 및 clce 돌연변이체는 대조구 식물에 비해 낮은 질산염 수준을 보여준다. 기술의 개요는 De Angeli 등 (Phil. Trans. R. Soc. B 364, 195-201, 2009)에 의해서 제공되었고, 참고문헌은 그 안에 언급되었다. 그러나, 여전히 CLC 단백질의 정확한 역할, 및 식물 표현형에 대한 CLC 유전자 과발현의 영향에 대해서는 거의 알려져 있지 않다.
3. HD - hydrolase - like ( HD - 히드롤라아제 유사) 폴리펩티드
HD 도메인은 2개의 작은 아미노산, 이어서 2개의 소수성 아미노산인 히스티딘 및 아스파르트산, 다시 소수성 아미노산, 작은 아미노산 및 전하를 띤 아미노산의 서열을 포함한다. 그것의 약한 서열 보존 때문에, 이는 최근에 밝혀졌다 (Aravind and Koonin, Trends in Biochemical Sciences, 23: 469-472, 1998). 상기 도메인은 보고에 따르면 핵산 폴리머라아제 및 헬리카아제를 포함하는 금속-의존 포스포하이드롤라아제에 존재한다 (Aravind and Koonin, 1998). HD-도메인을 포함하는 단백질은 포스포하이드롤라아제 활성을 나타내는 것으로 예상되고, 핵산 대사 또는 신호 변환 (signal transduction)에 관련되는 것을 나타내지만 (Galperin et al., J. Mol. Microbiol Biotechnol. 1, 303-305, 1999), HD 도메인의 정확한 생물학적 역할은 밝혀져야 할 것으로 남아있다.
발명의 요약
1. SGT1 폴리펩티드
놀랍게도, 이제 SGT1 폴리펩티드를 코딩하는 핵산의 발현을 조절함으로써 대조구 식물에 비해 향상된 수확량 관련 형질, 특히 증가된 종자 수확량을 갖는 식물을 제공한다는 것이 밝혀졌다.
본 발명의 일 구현예에 따라, SGT1 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법이 제공된다.
2. CLC - pKG 폴리펩티드
놀랍게도, 이제 CLC-pKG 폴리펩티드를 코딩하는 핵산의 발현을 조절함으로써 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 밝혀졌다.
일 구현예에 따라, CLC-pKG 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상 또는 증가시키는 방법이 제공된다.
3. HD - 하이드롤라아제 유사 폴리펩티드
놀랍게도, 이제 HD-하이드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 발현을 조절함으로써 대조구 식물에 비해 향상된 수확량 관련 형질, 특히 증가된 수확량을 갖는 식물을 제공한다는 것이 밝혀졌다.
일 구현예에 따라, HD-하이드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법이 제공된다.
정의
하기 정의들은 본 명세서 전체적으로 이용될 것이다.
폴리펩티드(들)/단백질(들)
용어 "폴리펩티드" 및 "단백질"은 본 발명에서 상호 교체 사용되며, 펩티드 결합으로 연결된 임의의 길이의 아미노산의 중합형을 말한다.
폴리뉴클레오티드(들)/핵산(들)/ 핵산서열 (들)/뉴클레오티드 서열(들)
용어 "폴리뉴클레오티드(들)", "핵산서열(들)", "뉴클레오티드 서열(들)", "핵산(들)", "핵산분자"는 본 발명에서 상호 교체 사용되며, 임의의 길이의 미분지된 중합형인, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 양자의 조합인 뉴클레오티드를 말한다.
상동체 (들)
단백질의 "상동체"는 문제의 변형되지 않은 단백질에 대해 아미노산 치환, 결실 및/또는 삽입을 가지며, 이들이 유래되는 변형되지 않은 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다.
결실은 단백질로부터 하나 또는 하나 이상의 아미노산의 제거를 말한다.
삽입은 단백질 내의 예정된 위치에 하나 이상의 아미노산 잔기가 도입되는 것을 말한다. 삽입은 하나 또는 다수 아미노산의 서열 내 삽입뿐 아니라 N-말단 및/또는 C-말단 융합을 포함할 수 있다. 일반적으로 아미노산 서열 내 삽입은 N- 또는 C-말단 융합보다 작을 것이며, 약 1 내지 10 개 정도의 잔기이다. N- 또는 C-말단 융합 단백질 또는 펩티드의 예는 효모 two-hybrid 시스템에 사용된 전사 활성제의 결합 도메인 또는 활성화 도메인, 파아지 외피 단백질, (히스티딘)-6-태그, 글루타치온 S-전달효소-태그, 단백질 A, 말토스-결합 단백질, 디히드로폴레이트 환원효소, Tag·100 에피토프, c-myc 에피토프, FLAG®-에피토프, lacZ, CMP (칼모둘린-결합 펩티드), HA 에피토프, 단백질 C 에피토프 및 VSV 에피토프를 포함한다.
치환은 유사한 성질 (유사한 소수성, 친수성, 항원성, 알파 나선 또는 베타 병풍 구조를 형성하거나 파괴하는 경향 같은)을 갖는 다른 아미노산으로 단백질의 아미노산의 치환을 말한다. 아미노산 치환은 전형적으로 한 잔기의 치환이나, 폴리펩티드에 부여된 기능적 제약에 따라 클러스터될 수도 있으며, 1 내지 10개의 아미노산일 수 있으며; 삽입은 보통 약 1 내지 10 개 정도의 아미노산 잔기가 삽입된다. 아미노산 치환은 바람직하게는 보존적 아미노산 치환이다. 보존적 치환 표는 당업계에 주지되어 있다 (예를 들면, Creighton (1984) Proteins, W.H. Freeman and Company (Eds) 및 하기 표 1 참고).
보존된 아미노산 치환의 예
잔기 보존적 치환 잔기 보존적 치환
Ala Ser Leu Ile; Val
Arg Lys Lys Arg; Gln
Asn Gln; His Met Leu; Ile
Asp Glu Phe Met; Leu; Tyr
Gln Asn Ser Thr; Gly
Cys Ser Thr Ser; Val
Glu Asp Trp Tyr
Gly Pro Tyr Trp; Phe
His Asn; Gln Val Ile; Leu
Ile Leu, Val
아미노산 치환, 결실 및/또는 삽입은 고체상 펩티드 합성 등과 같은 당업계에 주지된 펩티드 합성 기술을 이용하거나 또는 재조합 DNA 조작에 의해 용이하게 수행될 수 있다. 단백질의 치환, 삽입 또는 결실 변이체를 제조하기 위한 DNA 서열 조작 방법은 당업계에 주지되어 있다. 예를 들면, DNA 상의 예정된 위치에 치환 돌연변이를 제조하기 위한 기술은 당업자에게 주지되어 있으며, M13 돌연변이유발, T7-Gen 시험관 내 돌연변이유발 (USB, Cleveland, OH), QuickChange 자리지정 돌연변이유발 (Stratagene, San Diego, CA), PCR-매개된 자리지정 돌연변이유발 또는 다른 자리지정 돌연변이유발 프로토콜을 포함한다.
유도체
"유도체"는 목적 단백질과 같이 자연발생 형태의 단백질의 아미노산 서열에 비교하여, 자연적으로 발생하지 않는 아미노산 잔기로 아미노산의 치환 또는 자연적으로 발생하지 않는 아미노산 잔기의 첨가를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 단백질의 "유도체"는 또한 자연발생 형인 폴리펩티드의 아미노산 서열에 비교하여 자연적으로 발생하는 변형된 (글리코실화, 아실화, 프레닐화, 인산화, 미리스토일화, 황화 등) 또는 자연적으로 발생하지 않는 변형된 아미노산 잔기를 포함하는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 유도체는 또한 원래의 아미노산 서열에 비교하여 하나 이상의 비아미노산의 치환 또는 첨가를 포함할 수 있는데, 예를 들면, 이의 검출을 용이하게 하기 위해 결합되는 리포터 분자와 같은 아미노산 서열에 공유적으로 또는 비공유적으로 결합한 리포터 분자나 다른 리간드, 및 자연적으로 발생하는 단백질의 아미노산 서열에 대해 비자연적으로 발생하는 아미노산 잔기이다. 더욱이, "유도체"는 또한 단백질의 자연적으로 발생하는 형태와 FLAG, HIS6 또는 티오레독신 같은 태깅 펩티드 (태깅펩티드에 관하여 Terpe, Appl. Microbiol. Biotechnol. 60, 523-533, 2003 참조)와의 융합을 포함한다.
오쏘로그 (들)/ 패럴로그 (들)
오쏘로그 및 패럴로그는 유전자의 조상관계를 기재하는데 사용되는 진화적 개념을 포함한다. 패럴로그는 조상 유전자의 복제로 생긴 동일한 종 내의 유전자이고; 오쏘로그는 종분화로 인하여 공통 조상 유전자로부터 유래한 다른 생물체의 유전자이다.
도메인, 모티프/일치 서열/ 시그너처
용어 "도메인"은 진화적으로 연관된 단백질의 서열 정렬 시 특정 위치에서 보존된 아미노산의 세트이다. 다른 위치의 아미노산은 상동체들 간에 다양할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 기능에 필수적일 것인 아미노산을 나타낸다. 단백질 상동체 패밀리의 정렬된 서열상에서 고도로 보존된 부분은 임의의 문제되는 폴리펩티드가 이전에 동정된 폴리펩티드 패밀리에 속하는지를 결정하는 동정부위로 사용될 수 있다.
용어 "모티프", "일치 서열" 또는 "시그너처"는 진화적으로 연관된 단백질의 서열에 있어 짧은 보존된 영역을 말한다. 모티프는 흔히 도메인의 고도로 보존된 부분뿐만 아니라, 도메인의 일부만을 포함할 수도 있거나 또는 보존된 도메인 외부에 있을 수도 있다 (만일 모티프의 아미노산 모두가 지정된 도메인 외부에 있으면).
전문가 데이터베이스는 예를 들면, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAI Press, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002))이 도메인의 확인을 위해 존재한다. 단백질 서열의 인실리코 분석을 위한 도구 세트는 ExPASy 프로테오믹스 서버에서 이용가능하다 (Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). 도메인 또는 모티프는 또한 서열 정렬과 같은 일상적인 기술을 이용해서도 확인할 수 있다.
비교를 위한 서열정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는 (matches) 수는 최대로, 공백 (gaps)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘을 사용한다. BLAST 알고리즘 (Altschul et al. (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 다중 서열 정렬 알고리즘 (multiple sequence alignment algorithm; version 1.83)을 사용하여, 디폴트 페어와이즈 정렬 매개변수(default pairwise alignment parameters) 및 백분율 평점법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell et al., BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 수행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인 또한 사용될 수 있다. 서열 동일성 값은 핵산 또는 아미노산 전체 서열에 걸쳐, 또는 선정된 도메인 또는 보존된 모티프(들)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default parameters)를 사용하여 결정될 수 있다. 국부적인 정렬을 위해서는, Smith-Waterman 알고리즘이 특히 유용하다 (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7).
상호간 블라스트 ( Reciprocal BLAST )
전형적으로 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 1의 표 10 내지 표 12에 열거된 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열이 유래된 생물체의 서열과 대조하여 다시 BLAST한다 (두 번째 BLAST). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 다시 BLAST (BLAST back)하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 다시 BLAST하면 가장 높은 hits 중에 조회 서열이 있다.
높은 ranking hits은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 더 의미 있다 (또는 다른 말로, 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에다가, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 다음에 neighbour joining tree가 사용된다.
혼성화
본 발명에 정의된 용어 "혼성화"는 사실상 상동인 상보적인 뉴클레오티드 서열이 서로 어닐링하는 과정이다. 혼성화 과정은 전적으로 용액 내에서, 즉 상보적인 두 핵산이 용액 내에 있을 때 일어날 수 있다. 혼성화 과정은 또한 상보적인 핵산의 하나가 자성 비드, Sepharose 비드 또는 어떤 다른 수지(resin) 같은 기질에 고정되었을 때도 일어날 수 있다. 혼성화 과정은 더욱이 상보적인 핵산 중의 하나가 니트로셀룰로스 또는 나일론 막 같은 고체 지지체에 고정되었거나 또는 사진석판술에 의하여 규산질의 유리 지지체 (핵산 어레이, 마이크로어레이 또는 핵산 칩이라 알려짐)에 고정되었을 때에도 일어날 수 있다. 혼성화가 일어나게 하기 위하여, 핵산분자는 일반적으로 열적으로 또는 화학적으로 변성되어 이중 가닥을 2개의 단일가닥으로 녹이고/녹이거나 단일 가닥 핵산으로부터 헤어핀 또는 기타 이차 구조를 제거한다.
용어 "스트린전시"는 혼성화가 일어나는 조건을 말한다. 혼성화의 스트린전시는 온도, 염 농도, 이온 강도 및 혼성화 완충액 조성 같은 조건의 영향을 받는다. 일반적으로 낮은 스트린전시 조건은 정해진 이온강도 및 pH에서 특정 서열에 대한 용해점 (Tm) 보다 약 30℃ 낮은 온도가 선택된다. 중간 스트린전시 조건은 Tm 보다 20℃ 낮은 온도일 때, 높은 스트린전시 조건은 Tm 보다 10℃ 낮은 온도이다. 높은 스트린전시 혼성화 조건은 전형적으로 표적 핵산 서열에 높은 서열 유사성을 갖는 혼성화 서열을 분리하기 위해 사용된다. 그러나, 핵산은 서열 상의 차이가 있더라도 유전암호의 축퇴로 인하여 실제로는 동일한 폴리펩티드를 코딩할 수 있다. 그러므로, 중간 스트린전시 혼성화 조건은 종종 상기 핵산분자를 동정하는데 필요할 수 있다.
Tm은 정해진 이온 강도 및 pH 하에서 표적 서열의 50%가 완벽하게 매치된 탐침에 혼성화하는 온도이다. Tm은 용액 조건, 염기 조성 및 탐침의 길이에 의존적이다. 예를 들면, 보다 긴 서열일수록 보다 높은 온도에서 특이적으로 혼성화한다. 최대 혼성화율은 Tm보다 약 16℃에서 32℃까지 낮을 때 얻어진다. 1가 양이온이 혼성액에 있으면 두 핵산 가닥 간에 정전기적 반발이 감소하여 혼성화가 촉진되고; 이 효과는 0.4M (보다 높은 농도에서는 이 효과가 무시될 수 있다)까지의 나트륨 농도에서 보여진다. 포름아미드는 DNA-DNA 및 DNA-RNA 이중가닥의 용해 온도를 포름아미드 퍼센트 당 0.6 내지 0.7℃ 내리며, 50% 포름아미드의 첨가는 혼성화율은 낮아지더라도 혼성화가 30 내지 45℃에서 일어나게 한다. 염기쌍 미스매치는 혼성화율 및 이중가닥의 온도 안정성을 감소시킨다. 평균적으로 그리고 큰 탐침에 대하여, Tm은 염기 미스매치 % 당 약 1℃ 감소한다. Tm은 혼성체의 유형에 따라 하기의 식으로 계산할 수 있다:
1) DNA-DNA 혼성체 (Meinkoth 및 Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1 -0.61x%포름아미드
2) DNA-RNA 또는 RNA-RNA 혼성체:
Tm= 79.8℃ + 18.5 (log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3) 올리고-DNA 또는 올리고-RNAd 혼성체:
20개 뉴클레오티드 미만에 대해: Tm=2(In)
20-35개 뉴클레오티드에 대해: Tm=22+1.46(In)
a 또는 다른 1가 양이온에 대하여, 0.01-0.4 M 범위 내에서만 정확.
b 30% 내지 75% 범위 내에서 %GC에 대하여만 정확.
c L = bp으로 표시된 이중가닥의 길이.
d 올리고, 올리고뉴클레오티드; In,= 효과적인 프라이머 길이 = 2x(G/C의 수)+(A/T의 수)
비특이적 결합은 예를 들면, 단백질 함유 용액으로 막을 차단하고, 혼성화 완충액에 이종의 RNA, DNA, 및 SDS를 첨가하고, RNAse 처리하는 것과 같은 많은 알려진 기술 중 임의의 하나를 사용하여 조절할 수 있다. 비상동 탐침에 대하여, 일련의 혼성화 과정은 (i) 점차적으로 어닐링 온도를 낮추거나 (예를 들면 68℃에서 42℃까지) (ii) 점차적으로 포름아미드 농도를 낮추거나 (예를 들면 50%에서 0%까지) 중 하나를 변화시킴으로써 수행될 수 있다. 당업자는 혼성화 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
혼성화 조건 외에, 혼성화의 특이성은 또한 전형적으로 혼성화 후 세척 기능에 의존한다. 비특이적 혼성화로 생기는 백그라운드를 제거하기 위하여, 시료를 묽은 염 용액으로 세척한다. 이런 세척의 결정적인 요인은 최종 세척액의 이온 강도 및 온도를 포함한다: 염 농도가 낮고 세척 온도가 높을수록 세척의 스트린전시는 높아진다. 세척 조건은 전형적으로 혼성화 스트린전시에서 또는 보다 낮게 수행된다. 양성 혼성화는 적어도 백그라운드의 2 배의 신호로 나타난다. 일반적으로 핵산 혼성화 분석이나 유전자 증폭 검출 과정에 적절한 스트린전트 조건은 상기와 같다. 다소 스트린전트한 조건 또한 선택될 수 있다. 당업자는 세척 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
예를 들면, 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 전형적인 높은 스트린전시 혼성화 조건은 65℃, 1x SSC에서 또는 42℃, 1x SSC 및 50% 포름아미드에서 혼성화 후 65℃, 0.3x SSC에서 세척하는 것이다. 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 중간 스트린전시 혼성화 조건은 50℃, 4x SSC 또는 40℃, 6x SSC 및 50% 포름아미드에서 혼성화 후, 50℃, 2x SSC에서 세척하는 것이다. 혼성체의 길이는 혼성화하는 핵산에 대해 예측된 길이이다. 알려진 서열의 핵산이 혼성화 될 때 혼성체의 길이는 서열을 정렬하고 본 발명에서 기재된 보존된 영역을 동정하면 결정될 수 있다. 1X SSC는 0.15M NaCl 및 15mM 소듐 시트레이트이며; 혼성액 및 세척액에는 부가적으로 5x Denhardt's reagent, 0.5-1.0% SDS, 100 ㎍/ml 변성된, 단편화된 연어 정자 DNA, 0.5% 소듐 피로포스페이트가 포함된다.
스트린전시 수준을 결정하기 위해서는 [Sambrook 등 (2001) Molecular Cloning: laboratory manual, 3rdEdition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989, 매년 개정됨)]을 참조하면 된다.
스플라이스 변이체
본 발명에서 사용된 용어 "스플라이스 변이체"는 선정된 인트론 및/또는 엑손이 절단되거나, 치환되거나, 대체되거나, 부가된, 또는 인트론이 짧아지거나 길어진 핵산 서열의 변이체를 포함한다. 상기 변이체는 단백질의 생물학적 활성이 사실상 보유되며; 이는 단백질의 기능적 단편을 선택적으로 보유함으로써 달성될 수 있다. 상기 스플라이스 변이체는 자연계에서 발견되거나 인공적으로 만들 수도 있다. 상기 스플라이스 변이체를 예측하고 분리하는 방법은 당업계에 주지되어 있다 (예를 들면 Foissac 및 Schiex (2005) BMC Bioinformatics 6: 25 참고).
대립인자 변이체
대립인자 또는 대립인자 변이체는 동일한 염색체 상에 위치한 해당 유전자의 또 다른 형태이다. 대립인자 변이체는 작은 삽입/결실 다형성 (Insertion/Deletion Polymorphisms, INDELs)뿐 아니라 단일염기다형성 (Single Nucleotide Polymorphisms, SNPs)을 포함한다. INDELs의 크기는 보통 100 bp 미만이다. SNPs 및 INDELs이 대부분의 생물체의 자연적으로 발생하는 다형 균주에 있어 가장 큰 서열 변이체를 형성한다.
내재적 유전자
본 발명에서 "내재적" 유전자는 자연적 형태 (즉, 임의의 인간의 개입이 없는)로 식물에서 발견되는 것으로서 문제의 유전자뿐 아니라, 분리된 형태로 연이어 식물체에 (재)도입된 (외래유전자, transgene) 동일한 유전자 (사실상 상동인 핵산/유전자)를 말한다. 예를 들면, 상기 외래유전자를 갖는 형질전환 식물체에서는 외래유전자 발현의 실질적인 감소 및/또는 내재적 유전자 발현의 실질적인 감소가 있을 수 있다. 분리된 유전자는 생물체로부터 분리되거나, 또는 예를 들면 화학적 합성에 의하여 인위적으로 만들 수도 있다.
유전자 셔플링 ( shuffling )/방향진화 ( directed evolution )
유전자 셔플링 또는 방향진화는 DNA 셔플링의 반복에 이은 변형된 생물학적 활성을 갖는 단백질을 코딩하는 핵산이나 그 일부분의 변이체 생성을 위해 적절한 탐색 및/또는 선발로 구성된다 (Castle 등, (2004) Science 304(5674): 1151-4; 미국 특허 제5,811,238호 및 제6,395,547호).
구축물 ( Construct )
부가적인 조절 인자는 해독뿐 아니라 전사 인핸서를 포함한다. 본 발명을 수행함에 있어 사용하기에 적절한 종결신호 및 인핸서 서열이 당업자에게 공지되어 있다. "정의" 섹션에 기재된 바와 같이, 세포질 내에 축적되는 성숙한 메시지의 양 증가를 위하여 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 코딩 서열에 첨가될 수 있다. 다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.
본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제원점 서열을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.
본 발명의 방법에 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산 서열을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다. 마커 유전자는 더 이상 필요하지 않을 시 형질전환 세포로부터 제거 또는 절단될 수 있다. 마커 제거 기술은 당업계에 공지되어 있으며, 유용한 기술은 상기 정의 섹션에 기재되어 있다.
조절 인자/조절 서열/프로모터
용어 "조절 인자", "조절 서열" 및 "프로모터"는 본 발명에서 상호 호환적으로 사용되며, 결합되는 서열의 발현에 영향을 미칠 수 있는 조절 핵산 서열을 말하는 것으로 사용된다. 용어 "프로모터"는 전형적으로 유전자의 전사 개시점의 업스트림에 있으며, RNA 중합효소 및 다른 단백질의 인지 및 결합에 관여하여 작동가능하게 연결된 핵산의 전사를 지시하는 핵산 조절 서열을 말한다. 상기 언급한 용어에는 전형적인 진핵세포 게놈 유전자 (CCAAT 박스 서열이 있거나 없이 정확한 전사 개시에 필요한 TATA 박스를 포함) 및 발달 및/또는 외부 자극에 반응하여 또는 조직 특이적 방식으로 유전자 발현을 변경하는 부가적인 조절 인자 (즉, 업스트림 활성화 서열, 인핸서 및 사일런서)로부터 유래한 전사 조절 서열이 포함된다. 또한 상기 용어에는 -35 박스 서열 및/또는 -10 박스 전사 조절 서열을 포함하는 전형적인 원핵생물 유전자의 전사 조절 서열이 포함된다. 용어 "조절 인자"는 또한 세포, 조직 또는 기관에 핵산분자의 발현을 하게 하거나 활성화 또는 증가시키는 합성 융합 분자 또는 유도체를 포함한다.
"식물 프로모터"는 식물 세포에 코딩 서열 단편의 발현을 중재하는 조절 인자를 포함한다. 따라서, 식물 프로모터는 식물에서 유래해야 하는 것은 아니며, 예를 들면 식물 세포에 침범하는 바이러스 또는 미생물 기원일 수도 있다. "식물 프로모터"는 식물 세포, 예를 들면, 본 발명의 방법에서 발현되며, 본 발명에 기재된 핵산 서열로 형질전환된 식물 기원일 수 있다. 이는 또한 "식물" 종결신호 같은 "식물" 조절 신호에도 해당된다. 본 발명의 방법에 유용한 뉴클레오티드 서열의 프로모터 업스트림은 프로모터, 개방형해독틀 (ORF) 또는 종결신호 또는 ORF로부터 떨어져 있는 다른 3' 조절 영역 같은 3'-조절 영역의 기능성 또는 활성을 방해하지 않고 하나 또는 그 이상의 뉴클레오티드 치환(들), 삽입(들) 및/또는 결실(들)에 의하여 변형될 수 있다. 더욱이 서열의 변형에 의하여 프로모터 활성은 증가될 수 있거나, 또는 보다 활성이 큰 프로모터, 심지어 이종 생물체의 프로모터로 완전히 대체되는 것도 가능하다. 식물체에서의 발현을 위해서는 상기 언급된 것처럼 핵산분자는 올바른 시점에 요구되는 공간적 발현 양상으로 유전자를 발현하는 적절한 프로모터에 작동가능하게 연결되거나 프로모터를 포함해야 한다.
기능적으로 동등한 프로모터 동정을 위해, 후보 프로모터의 프로모터 강도 및/또는 발현 양상은 예를 들면, 리포터 유전자에 프로모터를 작동하게 연결하여 다양한 식물 조직에서 리포터 유전자의 발현 수준 및 양상을 검정함으로써 분석할 수 있다. 적절한 주지된 리포터 유전자는 예를 들면 베타-글루쿠로니다제 또는 베타-갈락토시다제를 포함한다. 프로모터 활성은 베타-글루쿠로니다제 또는 베타-갈락토시다제의 효소 활성을 측정함으로써 검정된다. 프로모터 강도 및/또는 발현 양상은 기준 프로모터의 것에 비교된다 (본 발명의 방법에 사용된 것과 같은 것). 다르게는, 프로모터 강도는 방사선 사진의 농도계 분석을 이용한 노던 블럿, 정량적 실시간 PCR 또는 RT-PCR 같은 당업계에 공지된 방법을 사용하여, mRNA 수준을 정량화하거나 본 발명의 방법에 사용된 핵산의 mRNA 수준과 18S rRNA 같은 housekeeping 유전자의 mRNA 수준을 비교함으로써 분석될 수 있다 (Heid 등, 1996 Genome Methods 6: 986-994). 일반적으로 "약한 프로모터"는 코딩 서열의 발현을 낮은 수준으로 이끄는 것이다. "낮은 수준"은 세포당 약 1/10,000 전사체 내지 약 1/100,000 전사체, 약 1/500,0000 전사체까지의 수준을 말한다. 역으로, "강력한 프로모터" 는 코딩 서열의 발현을 높은 수준으로 또는 세포당 약 1/10 전사체 내지 약 1/100 전사체 내지 약 1/1000 전사체로 이끄는 것이다. 일반적으로 "중간 강도 프로모터"는 강한 프로모터보다 낮은 수준으로 특히 모든 경우에 있어서 35S CaMV 프로모터의 조절하에 있을 때 얻어지는 것보다 낮은 수준으로 코딩 서열의 발현을 이끄는 프로모터를 의미한다.
작동가능하게 연결된
본 발명에서 사용된 용어 "작동가능하게 연결된"은 프로모터 서열과 해당 유전자 간의 기능적 연관을 말하는 것으로, 그럼으로써 프로모터 서열이 해당 유전자의 전사를 개시할 수 있다.
항시성 프로모터
"항시성 프로모터"는 반드시 항상은 아니더라도 생장 및 발달의 대부분 기간 중에 그리고 대부분의 환경적 조건 하에서 적어도 하나의 세포, 조직 또는 기관에서 전사적으로 활성인 프로모터를 말한다. 하기 표 2가 항시성 프로모터의 예이다.
항시성 프로모터의 예
유전자 출처 참고문헌
액틴 McElroy 등, Plant Cell, 2: 163-171, 1990
HMGP WO 2004/070039
CAMV 35S Odell 등, Nature, 313: 810-812, 1985
CaMV 19S Nilsson 등, Physiol. Plant. 100:456-462, 1997
GOS2 de Pater 등, Plant J Nov;2(6):837-44, 1992, WO 2004/065596
유비퀴틴 Christensen 등, Plant Mol. Biol. 18: 675-689, 1992
벼 사이클로필린 Buchholz 등, Plant Mol Biol. 25(5): 837-43, 1994
옥수수 H3 히스톤 Lepetit 등, Mol. Gen. Genet. 231:276-285, 1992
알팔파 H3 히스톤 Wu 등 Plant Mol. Biol. 11:641-649, 1988
액틴 2 An 등, Plant J. 10(1); 107-121, 1996
34S FMV Sanger 등, Plant. Mol. Biol., 14, 1990: 433-443
Rubisco small subunit US 4,962,028
OCS Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553
SAD1 Jain 등, Crop Science, 39 (6), 1999: 1696
SAD2 Jain 등, Crop Science, 39 (6), 1999: 1696
nos Shaw 등 (1984) Nucleic Acids Res. 12(20):7831-7846
V-ATPase WO 01/14572
Super 프로모터 WO 95/14098
G-box 단백질 WO 94/12015
편재하는 프로모터
편재하는 프로모터는 생물체의 사실상 모든 조직이나 세포에서 활성을 갖는 것이다.
발달적으로 조절된 프로모터
발달적으로 조절된 프로모터는 특정 발달 단계 중에 또는 발달적 변화가 일어나는 식물체의 부위에서 활성을 갖는 것이다.
유도성 프로모터
유도성 프로모터는 화학적 (Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), 환경적 또는 물리적 자극에 반응하여 전사 개시가 유도되거나 증가되거나 또는 식물이 다양한 스트레스 환경에 노출될 때 "스트레스 유도성", 즉 활성화될 수 있거나 또는, 식물이 다양한 병원균에 노출될 때 "병원균 유도성", 즉 활성화될 수 있다.
기관 특이적/조직 특이적 프로모터
기관 특이적 또는 조직 특이적 프로모터는 잎, 뿌리, 종자조직 등과 같이 특정 기관 또는 조직에서 우선적으로 발현 개시가 가능한 것이다. 예를 들면, "뿌리 특이적 프로모터"는 식물의 다른 부위에 약간 누설된(leaky) 발현을 허용하지만, 사실상 식물의 다른 부위를 제외하고 식물 뿌리에서 우세하게 전사적으로 활성이 있는 프로모터이다. 특정 세포에서만 전사를 개시할 수 있는 프로모터는 본 발명에서 "세포 특이적"이라 한다.
뿌리 특이적 프로모터의 예는 하기 표 3에 열거된다:
뿌리 특이적 프로모터의 예
유전자 출처 참고문헌
RCc3 Plant Mol Biol. 1995 Jan;27(2):237-48
애기장대 PHT1 Koyama et al. J Biosci Bioeng. 2005 Jan;99(1):38-42.; Mudge et al. (2002, Plant J. 31:341)
알팔파 인산염 운반자
(Medicago phosphate transporter)
Xiao et al., 2006, Plant Biol (Stuttg). 2006 Jul;8(4): 439-49
애기장대 Pyk10 Nitz et al. (2001) Plant Sci 161(2): 337-346
뿌리 발현성 유전자 Tingey et al., EMBO J. 6: 1, 1987.
담배 옥신 유도성 유전자 Van der Zaal et al., Plant Mol. Biol. 16, 983, 1991.
β-튜불린 Oppenheimer, et al., Gene 63: 87, 1988.
담배 뿌리 특이적 유전자 Conkling, et al., Plant Physiol. 93: 1203, 1990.
B. napus G1-3b 유전자 United States Patent No. 5, 401, 836
SbPRP1 Suzuki et al., Plant Mol. Biol. 21: 109-119, 1993.
LRX1 Baumberger et al. 2001, Genes & Dev. 15:1128
BTG-26 유채 (Brassica napus) US 20050044585
LeAMT1 (토마토) Lauter et al. (1996, PNAS 3:8139)
The LeNRT1-1 (토마토) Lauter et al. (1996, PNAS 3:8139)
Class I 파타틴 유전자 (감자) Liu et al., Plant Mol. Biol. 17(6):1139-1154
KDC1 (Daucus carota) Downey et al. (2000, J. Biol. Chem. 275:39420)
TobRB7 유전자 W Song (1997) PhD Thesis, North Carolina State University, Raleigh, NC USA
OsRAB5a (벼) Wang et al. 2002, Plant Sci. 163:273
ALF5 (애기장대) Diener et al. (2001, Plant Cell 13:1625)
NRT2;1Np (N. plumbaginifolia) Quesada et al. (1997, Plant Mol. Biol. 34:265)
종자 특이적 프로모터는 종자 조직에서만 반드시 배타적으로는 아니지만 (누설 발현의 경우) 종자조직에서 우세하게 전사적으로 활성인 것이다. 종자 특이적 프로모터는 종자발달 및/또는 발아 중에 활성일 것이다. 종자 특이적 프로모터는 배유/호분층/배 특이적일 수 있다. 종자 특이적 프로모터 (배유/호분층/배 특이적)의 예는 하기 표 4 내지 표 7에 제시된다. 종자 특이적 프로모터의 추가적인 예는 Qing Qu 및 Takaiwa (Plant Biotechnol. J. 2, 113-125, 2004)에 제시되며, 이의 개시는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다.
종자 특이적 프로모터의 예
유전자 출처 참고문헌
종자 특이적 유전자 Simon et al., Plant Mol. Biol. 5: 191, 1985;
Scofield et al., J. Biol. Chem. 262: 12202, 1987.;
Baszczynski et al., Plant Mol. Biol. 14: 633, 1990.
Brazil Nut 알부민 Pearson et al., Plant Mol. Biol. 18: 235-245, 1992.
레규민(legumin) Ellis et al., Plant Mol. Biol. 10: 203-214, 1988.
글루텔린(벼) Takaiwa et al., Mol. Gen. Genet. 208: 15-22, 1986;
Takaiwa et al., FEBS Letts. 221: 43-47, 1987.
제인(zein) Matzke et al Plant Mol Biol, 14(3):323-32 1990
napA Stalberg et al, Planta 199: 515-519, 1996.
밀 LMW 및 HMW 글루테닌-1 Mol Gen Genet 216:81-90, 1989; NAR 17:461-2, 1989
밀 SPA Albani et al, Plant Cell, 9: 171-184, 1997
밀 α,β,γ,-글리아딘 EMBO J. 3:1409-15, 1984
보리 Itr1 프로모터 Diaz et al. (1995) Mol Gen Genet 248(5):592-8
보리 B1, C, D, 호데인(hordein) Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-60, 1996
보리 DOF Mena et al, Plant Journal, 116(1): 53-62, 1998
blz2 EP99106056.7
합성 프로모터 Vicente-Carbajosa et al., Plant J. 13: 629-640, 1998.
벼 프롤라민 NRP33 Wu et al, Plant Cell Physiology 39(8) 885-889, 1998
벼 a-글로불린 Glb-1 Wu et al, Plant Cell Physiology 39(8) 885-889, 1998
벼 OSH1 Sato et al, Proc. Natl. Acad. Sci. USA, 93: 8117-8122, 1996
벼 a-글로불린 REB/OHP-1 Nakase et al. Plant Mol. Biol. 33: 513-522, 1997
벼 ADP-글루코스 파이로포스포릴라아제 Trans Res 6:157-68, 1997
옥수수 ESR 유전자 패밀리 Plant J 12:235-46, 1997
수수(Sorghum) α-kafirin DeRose et al., Plant Mol. Biol 32:1029-35, 1996
KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999
벼 올레오신 Wu et al, J. Biochem. 123:386, 1998
해바라기 올레오신 Cummins et al., Plant Mol. Biol. 19: 873-876, 1992
PRO0117, 추정 벼 40S 리보좀 단백질 WO 2004/070039
PRO0136, 벼 알라닌 아미노트랜스퍼라제 미공개
PRO0147, 트립신 저해제 ITR1 (보리) 미공개
PRO0151, 벼 WSI18 WO 2004/070039
PRO0175, 벼 RAB21 WO 2004/070039
PRO005 WO 2004/070039
PRO0095 WO 2004/070039
α-아밀라아제 (Amy32b) Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991
카텝신(cathepsin) β-유사 유전자 Cejudo et al, Plant Mol Biol 20:849-856, 1992
보리 Ltp2 Kalla et al., Plant J. 6:849-60, 1994
Chi26 Leah et al., Plant J. 4:579-89, 1994
옥수수 B-Peru Selinger et al., Genetics 149;1125-38,1998
배유 특이적 프로모터의 예
유전자 출처 참고문헌
글루텔린 (벼) Takaiwa et al. (1986) Mol Gen Genet 208:15-22;
Takaiwa et al. (1987) FEBS Letts. 221:43-47
제인(zein) Matzke et al., (1990) Plant Mol Biol 14(3): 323-32
밀 LMW 및 HMW 글루테닌-1 Colot et al. (1989) Mol Gen Genet 216:81-90;
Anderson et al. (1989) NAR 17:461-2
밀 SPA Albani et al. (1997) Plant Cell 9:171-184
밀 글리아딘 Rafalski et al. (1984) EMBO 3:1409-15
보리 Itr1 프로모터 Diaz et al. (1995) Mol Gen Genet 248(5):592-8
보리 B1, C, D, 호데인(hordein) Cho et al. (1999) Theor Appl Genet 98:1253-62;
Muller et al. (1993) Plant J 4:343-55;
Sorenson et al. (1996) Mol Gen Genet 250:750-60
보리 DOF Mena et al, (1998) Plant J 116(1): 53-62
blz2 Onate et al. (1999) J Biol Chem 274(14):9175-82
합성 프로모터 Vicente-Carbajosa et al. (1998) Plant J 13:629-640
벼 프롤라민 NRP33 Wu et al, (1998) Plant Cell Physiol 39(8) 885-889
벼 글로불린 Glb-1 Wu et al. (1998) Plant Cell Physiol 39(8) 885-889
벼 글로불린 REB/OHP-1 Nakase et al. (1997) Plant Molec Biol 33: 513-522
벼 ADP-글루코스 파이로포스포릴라아제 Russell et al. (1997) Trans Res 6:157-68
옥수수 ESR 유전자 패밀리 Opsahl-Ferstad et al. (1997) Plant J 12:235-46
수수(sorghum) kafirin DeRose et al. (1996) Plant Mol Biol 32:1029-35
배(embryo) 특이적 프로모터의 예
유전자 출처 참고문헌
벼 OSH1 Sato et al, Proc. Natl. Acad. Sci. USA, 93: 8117-8122, 1996
KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999
PRO0151 WO 2004/070039
PRO0175 WO 2004/070039
PRO005 WO 2004/070039
PRO0095 WO 2004/070039
호분층 특이적 프로모터의 예
유전자 출처 참고문헌
α-아밀라아제 (Amy32b) Lanahan et al, Plant Cell 4:203-211, 1992;
Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991
카텝신 β-유사 유전자 Cejudo et al, Plant Mol Biol 20:849-856, 1992
보리 Ltp2 Kalla et al., Plant J. 6:849-60, 1994
Chi26 Leah et al., Plant J. 4:579-89, 1994
옥수수 B-Peru Selinger et al., Genetics 149;1125-38,1998
본 발명에서 정의된 녹색 조직 특이적 프로모터는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 식물의 다른 부위를 제외하고 실질적으로 녹색 조직에서 우세하게 전사적으로 활성이 있는 프로모터이다.
본 발명의 방법을 수행하는데 사용될 수 있는 녹색 조직 특이적 프로모터의 예는 하기의 표 8에 있다.
녹색 조직 특이적 프로모터의 예
유전자 출처 발현 참고문헌
옥수수 오쏘포스페이트 디키나아제
(Orthophosphate dikinase)
잎 특이적 Fukavama et al., Plant Physiol. 2001 Nov;127(3):1136-46
옥수수 포스포에놀피루베이트 카르복실라아제 잎 특이적 Kausch et al., Plant Mol Biol. 2001 Jan;45(1):1-15
벼 포스포에놀피루베이트 카르복실라아제 잎 특이적 Lin et al., 2004 DNA Seq. 2004 Aug;15(4):269-76
벼 작은 서브유닛 루비스코 잎 특이적 Nomura et al., Plant Mol Biol. 2000 Sep;44(1)99-106
벼 베타 익스팬신(expansin) EXBP9 어린줄기 특이적 WO 2004/070039
Pigeonpea 작은 서브유닛 루비스코 잎 특이적 Panguluri et al., Indian J Exp Biol. 2005 Apr;43(4):369-72
완두 RBCS3A 잎 특이적
조직 특이적 프로모터의 다른 예는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 식물의 다른 부위를 제외하고 실질적으로 분열조직에서 우세하게 전사적으로 활성이 있는 분열조직 특이적 프로모터이다. 본 발명의 방법을 수행하는데 사용될 수 있는 녹색 분열조직 특이적 프로모터의 예는 하기의 표 9에 있다.
분열조직 특이적 프로모터의 예
유전자 출처 발현 패턴 참고문헌
벼 OSH1 어린줄기 정단 분열조직,
구상배 단계에서 실생단계까지
Sato et al. (1996) Proc. Natl.
Acad. Sci. USA, 93:8117-8122
벼 메탈로티오네인
(metallothionein)
분열조직 특이적 BAD87835.1
WAK1 & WAK2 어린줄기 및 뿌리, 정단 분열조직,
및 팽창 잎 및 꽃받침
Wagner & Kohorn (2001) Plant Cell
13(2): 303-318
종결신호( Terminator )
용어 "종결신호"는 일차 전사체의 3' 프로세싱 및 폴리아데닐화와 전사 종결의 신호가 되는 전사 단위의 말단에 있는 DNA 서열인 조절 서열이다. 종결신호는 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 첨가된 종결신호는 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
선발 마커 (유전자)/리포터 유전자
"선발 마커", "선발 마커 유전자" 또는 "리포터 유전자"는 본 발명의 핵산 구축물로 감염되거나 형질전환된 세포의 동정 및/또는 선발을 촉진하기 위하여 발현된 세포에 표현형을 부여하는 임의의 유전자를 포함한다. 이들 마커 유전자는 일련의 상이한 원리를 통해 핵산 분자의 성공적인 전달을 확인 가능하게 한다. 적절한 마커는 항생제나 제초제 저항성을 주거나 새로운 대사 형질을 도입하거나 또는 시각적인 선발을 가능하게 하는 마커로부터 선택된다. 선발 마커 유전자의 예는 항생제 (네오마이신 및 카나마이신을 인산화하는 nptII, 하이그로마이신을 인산화하는 hpt, 또는 예를 들면, 블레오마이신, 스트렙토마이신, 테트라사이클린, 클로람페니콜, 앰피실린, 겐타마이신, 제네티신 (G418), 스펙티노마이신, 블라스티시딘에 저항성을 주는 유전자), 제초제 (예를 들면, Basta®에 저항성을 제공하는 bar; 글리포제이트에 대한 저항성을 제공하는 aroA 또는 gox, 또는 예를 들면, 이미다졸리논, 포스피노트리신, 설포닐우레아에 저항성을 주는 유전자)에 저항성을 주는 유전자 또는 대사적 형질을 제공하는 유전자 (식물이 유일한 탄소원으로 만노즈를 이용하게 하는 manA 또는 자일로스 이용을 위한 자일로스 이성화효소, 또는 2-데옥시글루코스에 대한 저항성 같은 반영양적 마커)를 포함한다. 가시적 마커 유전자의 발현으로 발색 (예를 들면 베타-글루쿠로니다제, GUS, 또는 발색된 기질, 예를 들면 X-Gal을 가진 베타-갈락토시다제), 발광 (루시페린/루시파라제 시스템 같은) 또는 형광 (녹색 형광 단백질, GFP, 및 이의 유도체)이 형성된다. 이 목록은 소수의 가능한 마커만을 나타낸다. 당업자는 상기 마커에 친숙하다. 생물체 및 선발 방법에 따라 다른 마커가 선호된다.
식물 세포로 핵산의 안정적인 또는 일시적인 통합에 따라 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 코딩하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 코딩하는 핵산분자는 본 발명의 또는 본 발명의 방법에 사용된 폴리펩티드를 코딩하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산으로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다).
마커 유전자, 특히 항생제 및 제초제에 저항성이 있는 유전자는 일단 핵산이 성공적으로 도입되면 형질전환 숙주 세포에서 더 이상 필요하지 않거나, 바람직하지 않으므로, 핵산 도입을 위한 본 발명의 방법에서는 이들 마커 유전자가 제거 또는 절단되게 하는 기술을 사용한다. 하나의 상기 방법이 동시형질전환 (co-transformation)으로 알려진 것이다. 동시형질전환 방법은 형질전환을 위해 두 벡터를 동시에 사용하여, 하나의 벡터에는 본 발명에 따른 핵산이 있고, 둘째 벡터에는 마커 유전자(들)이 있다. 대부분의 형질전환체는 양 벡터를 받거나, 식물의 경우 (형질전환체의 40% 이상까지) 포함한다. 아그로박테리아로 형질전환한 경우, 형질전환체는 보통 벡터의 일부, 즉 보통 발현 카세트인 T-DNA에 의해 플랭킹된 서열만을 받는다. 마커 유전자는 연이어 교배를 하여 형질전환 식물체로부터 제거된다. 다른 방법에서는, 마커 유전자가 트랜스포손에 통합되어 원하는 핵산과 함께 형질전환에 사용된다 (Ac/Ds 기술로 알려짐). 형질전환체는 트랜스포자제(transposase) 공급원과 교배될 수 있거나 또는 트랜스포자제가 발현되게 하는 핵산 구축물로 일시적으로 또는 안정적으로 형질전환된다. 어떤 경우에 (약 10%), 일단 형질전환이 성공적으로 되면 트랜스포존은 숙주 세포의 게놈 밖으로 튀어나가 소실된다. 더 많은 경우에, 트랜스포존은 다른 구역으로 튄다. 이들 경우에 마커 유전자는 교배에 의하여 제거되어야 한다. 미생물학에서 상기 일이 있어났는지 검출을 가능하게 하거나 용이하게 하는 기술이 개발되었다. 보다 편리한 방법은 재조합 시스템이라 알려진 것에 의존하는 것으로; 이점은 교배에 의한 제거가 면제될 수 있다는 것이다. 이 유형의 가장 잘 알려진 시스템은 Cre/lox 시스템이다. Cre1은 loxP 서열 사이에 위치한 서열을 제거하는 리콤비나아제이다. 만일 마커 유전자가 loxP 서열 사이에 통합되면 리콤비나아제의 발현에 의해서 마커 유전자는 제거된다. 다른 재조합 시스템은 HIN/HIX, FLP/FRT 및 REP/STB 시스템 (Tribble 등, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan 등, J. Cell Biol., 149, 2000: 553-566)이다. 본 발명에 따른 핵산 서열의 식물 게놈 내로 위치 특이적 통합이 가능하다. 자연적으로, 이들 방법은 또한 효모, 균류 또는 세균 같은 미생물에 응용될 수 있다.
형질전환된 ( transgenic )/외래유전자 ( transgene )/재조합
본 발명에서 "형질전환된", "외래유전자" 또는 "재조합"은 예를 들면, 핵산 서열, 발현카세트, 핵산 서열을 포함하는 유전자 구축물 또는 벡터, 또는 본 발명에 따른 핵산 서열, 발현 카세트나 벡터로 형질전환된 생물체, 하기에 기재된 재조합 방법에 의해 생성된 모든 구조물에 관한 의미이다:
(a) 본 발명의 방법에 유용한 단백질을 코딩하는 핵산서열, 또는
(b) 본 발명에 따른 핵산 서열에 작동가능하게 연결된 유전자 조절 서열 (들), 예를 들면 프로모터, 또는
(c) a) 및 b)
가 자연적인 유전적 환경에 있지 않거나, 재조합 방법으로 변형되어 왔으므로 예를 들면, 하나 또는 그 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역위 또는 삽입의 유형의 변형이 가능하다. 자연적인 유전적 환경은 원래의 식물에서 자연적인 게놈 또는 염색체상의 위치나 게놈 라이브러리에서의 존재를 의미하는 것으로 이해된다. 게놈 라이브러리의 경우, 핵산 서열의 자연적인 유전적 환경은 바람직하게는 적어도 부분적으로는 보유된다. 환경은 적어도 한쪽의 핵산 서열을 플랭킹하며 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1000 bp, 가장 바람직하게는 적어도 5000 bp 길이의 서열을 갖는다. 자연적으로 발생하는 발현 카세트, 예를 들면 본 발명의 방법에 유용한 폴리펩티드를 코딩하는 해당 핵산 서열과 핵산 서열의 자연적 프로모터의 자연적으로 생긴 조합은 이 발현 카세트가 예를 들면 돌연변이 처리 같은 비자연적인 합성 ("인위적") 방법으로 변형될 때 형질 전환 발현카세트가 된다. 적절한 방법이 예를 들면 US 5,565,350 또는 WO 00/15815에 기재되어 있다.
본 발명의 목적상, 형질전환된 식물은 상기처럼 본 발명의 방법에서 사용된 핵산이 상기 식물의 게놈에 존재하지 않거나, 상기 식물로부터 유래하지 않거나, 상기 식물의 게놈에 존재할 수 있지만, 상기 식물의 게놈상의 자연적 위치에 있지 않아 핵산이 동종에서 또는 이종에서 발현될 수 있다는 의미로 이해된다. 그러나, 언급된 바와 같이, 형질전환은 또한 본 발명에 있어 또는 본 발명 방법에 사용된 핵산이 식물 게놈 내의 자연적 위치에 있는 반면, 그 서열이 자연적 서열에 대하여 변형되었고 및/또는 자연적 서열의 조절 서열이 변형되었음을 의미한다. 형질전환은 핵산의 동종 또는 바람직하게는 이종 발현이 일어나는 게놈 내의 비자연적 위치에서 본 발명에 따른 핵산의 발현을 의미하는 것으로 바람직하게는 이해된다. 바람직한 형질전환된 식물이 본 발명에서 언급된다.
본 발명의 명세서에서, 용어 "분리된 핵산" 또는 "분리된 폴리펩티드"는 어떤 경우에는 각각 "재조합 핵산" 또는 "재조합 폴리펩티드"와 동의어로서 생각될 수 있으며, 이의 천연 유전적 환경에서 존재하지 않고/않거나 재조합 방법에 의해 변형된 핵산 또는 폴리펩티드를 말한다는 것을 주목해야 할 것이다.
조절( modulation )
용어 "조절"은 발현 또는 유전자 발현에 관한 것으로, 대조구 식물에 비하여 발현 수준이 상기 유전자 발현에 의하여 변화되는, 발현 수준이 증가되거나 감소되는 과정이다. 원래의 조절되지 않은 발현은 구조 RNA (rRNA, tRNA) 또는 연이어 해독되는 mRNA 같이 임의의 종류의 발현일 수 있다. 본 발명의 목적을 위해, 원래의 조절되지 않은 발현은 또한 임의의 발현의 부재일 수 있다. 용어 "활성 조절"은 식물의 증가된 수확량 관련 형질 (예를 들면, 증가된 수확량 및/또는 증가된 생장)로 이끄는, 본 발명의 핵산 서열 또는 코딩된 단백질의 발현의 임의의 변화를 의미한다. 발현은 없는 상태 (zero) (부재, 또는 측정불가능한 발현)에서 특정 양까지 증가하거나, 특정 양에서 측정불가능한 적은 양 또는 없는 상태까지 감소할 수 있다.
발현
용어 "발현" 또는 "유전자 발현"은 특정 유전자 또는 특정 유전자들 또는 특정 유전자 구축물의 전사를 의미한다. 용어 "발현" 또는 "유전자 발현"은 특히 유전자 또는 유전자들 또는 유전자 구축물의 구조 RNA (rRNA, tRNA), 또는 단백질로의 이은 해독이 있거나 없는 mRNA로의 전사를 의미한다. 상기 과정은 DNA의 전사 및 생성된 mRNA 산물의 가공을 포함한다.
증가된 발현/과발현
본 발명에 사용된 용어 "증가된 발현" 또는 "과발현"은 원래의 야생형 발현 수준에 부가적인 임의의 형태의 발현을 의미한다. 본 발명의 목적을 위해, 원래의 야생형 발현 수준은 또한 없는 상태 (zero), 즉 발현의 부재 또는 측정불가능한 발현일 수 있다.
유전자 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문서화되어 있으며, 예를 들면, 적절한 프로모터에 의한 과발현, 전사 인핸서 또는 해독 인핸서의 사용을 포함한다. 프로모터 또는 인핸서 인자로 작용하는 분리된 핵산 서열은 비이질성 형태의 폴리뉴클레오티드의 적절한 위치 (전형적으로 업스트림)에 도입되어 해당 폴리펩티드를 코딩하는 핵산 서열의 발현을 상향 조절한다. 예를 들면, 내재적 프로모터는 돌연변이, 결실, 및/또는 치환에 의해 생체 내에서 변할 수 있거나 (Kmiec, US 5,565,350; Zarling 등, WO9322443), 또는 분리된 프로모터는 본 발명의 유전자로부터 적절한 거리와 방향으로 식물 세포 내에 도입될 수 있어 해당 유전자의 발현을 조절한다.
폴리펩티드 발현을 원한다면, 일반적으로 폴리뉴클레오티드 코딩 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 폴리아데닐화 영역은 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래할 수 있다. 부가된 3' 말단 서열은 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
세포질 내에 축적되는 성숙된 메세지 양의 증가를 위하여 인트론 서열이 또한 부분적인 코딩 서열의 5' 비해독 영역 (UTR) 또는 코딩 서열에 첨가될 수 있다. 식물 및 동물 발현 구축물에 있어 전사 단위 내에 스플라이스 가능한 인트론이 포함되면 mRNA 및 단백질 수준에서 유전자 발현이 1000 배까지 증가함이 보였다 (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis 등 (1987) Genes Dev 1:1183-1200). 인트론에 의한 유전자 발현의 상승효과는 전형적으로 전사 단위의 5' 말단 가까이에 위치하였을 때 가장 컸다. 옥수수 인트론 Adh1-S 인트론 1, 2, 및 6, Bronze-1 인트론의 사용은 당업계에 주지되어 있다. 전반적인 정보는 하기를 참고한다: Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
감소된 발현
본 발명에서 "감소된 발현" 또는 발현의 "감소 또는 실질적인 제거"는 대조구에 비하여 내재적 유전자 발현 및/또는 폴리펩티드 수준 및/또는 폴리펩티드 활성의 감소를 의미한다. 감소 또는 실질적인 제거는 대조구 식물에 비하여 증가하는 순으로 선호되는 적어도 10%, 20%, 30%, 40% 또는 50%, 60%, 70%, 80%, 85%, 90%, 또는 95%, 96%, 97%, 98%, 99% 이상 감소된 것이다.
식물체에 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위해서는 충분한 길이의 핵산 서열의 상당히 연속적인 뉴클레오티드가 필요하다. 유전자 침묵을 수행하기 위한 뉴클레오티드는 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 개 또는 더 소수의 뉴클레오티드만큼 적을 수도 있고, 전체 유전자 (5' 및/또는 3' UTR을 포함하여, 일부분 또는 전체)만큼 많을 수도 있다. 상당한 길이의 연속적인 뉴클레오티드는 관심있는 단백질을 코딩하는 핵산 서열 (표적 유전자)로부터, 또는 관심있는 단백질의 오쏘로그(orthologue), 패럴로그(paralogue) 또는 상동체(homologue)를 코딩하는 것이 가능한 임의의 핵산 서열로부터 유래할 수 있다. 바람직하게는, 상당한 길이의 연속적인 뉴클레오티드는 표적 유전자 (센스 또는 안티센스 가닥)와 수소결합을 형성할 수 있으며, 더욱 바람직하게는, 상당한 길이의 연속적인 뉴클레오티드는 표적 유전자 (센스 또는 안티센스 가닥)에 증가하는 순으로 선호되는, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% 동일한 서열을 갖는다. (기능성) 폴리펩티드를 코딩하는 핵산 서열은 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위해 본 발명에서 논의된 다양한 방법에 대한 필요조건은 아니다.
상기 발현의 감소 또는 실질적인 제거는 통상적인 수단 및 기술을 사용하여 이룰 수 있다. 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위한 바람직한 방법은 핵산 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)이 스페이서 (spacer: non-coding DNA)로 분리되어 역반복 (inverted repeat: 부분적으로 또는 완전히)으로 클로닝된 유전자 구축물의 식물체로의 도입 및 발현이다.
상기 바람직한 방법에 있어, 내재적 유전자의 발현은 핵산 또는 그 일부 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)의, 바람직하게는 헤어핀(hairpin) 구조를 형성하는 것이 가능한 역반복을 사용한 RNA 매개된 침묵에 의해 감소되거나 또는 실질적으로 제거된다. 상기 역반복(inverted repeat)은 조절서열을 포함하는 발현벡터로 클로닝된다. 비코딩 DNA 핵산 서열 (스페이서, 예를 들면 matrix attachment region fragment (MAR), 인트론, 폴리링커 등)은 두 역위 핵산 사이에 위치하여 역반복을 형성한다. 역반복의 전사 후, 자체 상보적인(self-complementary) 구조를 가진 키메릭(chimeric) RNA가 형성된다 (부분적인 또는 완전한). 상기 이중가닥 RNA 구조를 hpRNA (hairpin RNA)라고 한다. 상기 hpRNA는 식물에 의해 RISC (RNA-induced silencing complex)로 통합되는 siRNA로 가공된다. 상기 RISC는 mRNA 전사물로 쪼개어져, 폴리펩티드로 해독될 mRNA 전사물의 수를 실질적으로 감소시킨다. 더욱 상세한 내용은 예를 들면, Grierson 등 (1998) WO 98/53083; Waterhouse 등 (1999) WO 99/53050를 참고하면 된다.
본 발명의 방법의 수행은 핵산이 역반복으로 클로닝된 유전자 구축물의 식물로의 도입 및 발현에 의존하지 않으나, 임의의 하나 이상의 몇 가지 공지된 "유전자 침묵 (gene silencing)" 방법이 동일한 효과를 얻기 위해 사용될 수 있다.
내재적 유전자 발현의 감소를 위한 상기 방법 중 하나는 유전자 발현의 RNA-매개된 침묵 (하향조절 (downregulation))이다. 상기의 경우 침묵 (Silencing)은 목적 내재적 유전자에 실질적으로 유사한 이중가닥 RNA 서열 (dsRNA)에 의해 식물체에서 유발된다. 상기 dsRNA는 식물에 의해 siRNAs (short interfering RNAs)라는 약 20 내지 약 26 개의 뉴클레오티드로 더 가공된다. 상기 siRNAs는 내재적 표적 유전자의 mRNA 전사물을 쪼개는 RISC (RNA-induced silencing complex)로 통합되며, 그로 인하여 실질적으로 폴리펩티드로 해독될 mRNA 전사물의 수를 감소시킨다. 바람직하게는, 이중가닥 RNA 서열이 표적 유전자에 해당한다.
RNA 침묵 방법의 또 다른 예는 핵산 서열 또는 그 일부 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)를 센스 방향으로 식물체로의 도입을 포함한다. "센스 방향"은 해당 mRNA 전사물에 상동인 DNA 서열을 말한다. 식물로 도입되면 따라서 적어도 한 카피의 핵산 서열이다. 부가적인 핵산 서열은 내재적 유전자의 발현을 감소시켜, 공억제 (co-suppression)라 알려진 현상이 생긴다. 높은 전사물 수준 및 공억제 (co-suppression)의 유발 간에는 양의 상관관계가 있으므로 유전자 발현의 감소는 몇 부가적인 카피의 핵산 서열이 식물체 내로 도입되면 더욱 현저해질 것이다.
RNA 침묵 방법의 또 다른 예는 안티센스 (antisense) 핵산 서열의 사용을 포함한다. "안티센스" 핵산 서열은 단백질을 코딩하는 "센스 (sense)" 핵산 서열에 상보적인, 즉 이중가닥 cDNA 분자의 코딩 가닥에 상보적인 또는 mRNA 전사물 서열에 상보적인 뉴클레오티드 서열을 포함한다. 안티센스 핵산 서열은 바람직하게는 침묵 (silencing)하게 될 내재적 유전자에 상보적이다. 상기 상보성은 유전자의 "코딩 영역" 및/또는 "비코딩 영역 (non-coding region)"에 위치할 수 있다. 용어 "코딩 영역"은 아미노산 잔기로 해독되는 코돈 (codon)을 포함하는 뉴클레오티드 서열의 영역을 말한다. "비코딩 영역 (non-coding region)"은 전사는 되나 아미노산으로 해독되지 않는, 코딩 영역을 플랭킹하는 5' 및 3' 서열을 말한다 (또한 5' 및 3' 비해독 영역이라 한다).
안티센스 핵산 서열은 Watson 및 Crick 염기 페어링 (base pairing)의 방식에 따라 디자인될 수 있다. 안티센스 핵산 서열은 전체 핵산 서열 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)에 상보적일 수 있으나, 또한 핵산 서열의 일부 (mRNA 5' 및 3' UTR 포함)에 대해서만 안티센스인 올리고뉴클레오티드일 수 있다. 예를 들면, 안티센스 올리고뉴클레오티드 서열은 폴리펩티드를 코딩하는 mRNA 전사물의 해독 개시부위 주변의 영역에 상보적일 수 있다. 적절한 안티센스 올리고뉴클레오티드 서열의 길이는 당업계에 공지되어 있으며 약 50, 45, 40, 35, 30, 25, 20, 15 또는 10 개의 뉴클레오티드 길이 또는 그 이하일 수 있다. 본 발명에 따른 안티센스 핵산 서열은 당업계에 공지된 방법을 사용하여 화학적 합성 및 효소적 라이게이션 반응으로 구축될 수 있다. 예를 들면, 안티센스 핵산 서열 (예를 들면, 안티센스 올리고뉴클레오티드 서열)은 자연적으로 발생하는 뉴클레오티드 또는 분자의 생물학적 안정성을 증가시키기 위해 또는 안티센스 및 센스 핵산 서열 간에 형성된 이중선 (duplex)의 물리적 안정성을 증가시키기 위해 디자인된 다양하게 변형된 뉴클레오티드를 사용하여 화학적으로 합성될 수 있으며, 예를 들면, 포스포로티오에이트 (phosphorothioate) 유도체 및 아크리딘 (acridine) 치환된 뉴클레오티드가 사용될 수 있다. 안티센스 핵산 서열의 생성에 사용될 수 있는 변형된 뉴클레오티드의 예는 당업계에 주지되어 있다. 알려진 뉴클레오티드 변형은 메틸화 (methylation), 고리화 (cyclization) 및 '캡 (caps)' 및 하나 이상의 자연적으로 발생하는 뉴클레오티드의 이노신 (inosine)과 같은 유사체 (analogue)로의 치환을 포함한다. 뉴클레오티드 변형의 다른 경우는 당업계에 주지되어 있다.
안티센스 핵산 서열은 핵산 서열이 안티센스 방향으로 서브클로닝된 (즉, 삽입된 핵산으로부터 전사된 RNA는 관심있는 목적 핵산에 대해 안티센스 방향일 수 있다) 발현 벡터를 사용하여 생물학적으로 생산될 수 있다. 바람직하게는, 식물에서 안티센스 핵산 서열은 프로모터, 작동가능하게 연결된 안티센스 올리고뉴클레오티드, 및 종결신호 (terminator)를 포함하여 안정적으로 통합된 핵산 구축물을 통해 생산된다.
본 발명의 방법에서 침묵에 사용된 핵산 분자 (식물로 도입되거나 또는 인 시튜로 생성되거나)는 mRNA 전사물 및/또는 폴리펩티드를 코딩하는 게놈 DNA와 혼성화하거나 또는 이들에 결합하여, 그로 인하여 예를 들면, 전사 및/또는 해독을 저해함으로서 단백질의 발현을 저해한다. 상기 혼성화는 안정적인 이중선 (duplex)를 형성하기 위해 전형적인 뉴클레오티드 상보성에 의해 이루어질 수 있거나, 또는, 예를 들면, DNA 이중선 (duplexes)에 결합하는 안티센스 핵산 서열의 경우에, 이중 나선 (double helix)의 깊은 홈 (major groove)에서의 특정 상호작용을 통해 이루어질 수 있다. 안티센스 핵산 서열은 형질전환에 의해 또는 특정 조직 부위에서 직접적인 주입에 의해 식물체로 도입될 수 있다. 대안으로는, 안티센스 핵산 서열은 선발된 세포를 표적화하기 위해 변형되어, 체계적으로 도입될 있다. 예를 들면, 체계적인 도입을 위해, 안티센스 핵산 서열은 변형될 수 있어, 상기 서열은 예를 들면, 안티센스 핵산 서열을 세포 표면 수용체 또는 항원에 결합하는 펩티드 또는 항원에 연결함으로써 선발된 세포 표면상에 발현된 수용체 또는 항원에 특이적으로 결합한다. 상기 안티센스 핵산 서열은 또한 본 발명에서 기재된 벡터를 사용하여 세포로 전달될 수 있다.
추가적인 양상에 따라, 상기 안티센스 핵산 서열은 a-아노머 핵산 서열이다. a-아노머 핵산 서열은 상보적인 RNA와 특정 이중가닥 혼성체 (hybrid)를 형성하며, 상기에서 보통의 b-units와 달리 상기 이중가닥은 서로 평행이다 (Gaultier 등 (1987) Nucl Ac Res 15: 6625-6641). 상기 안티센스 핵산 서열은 또한 2'-o-메틸리보뉴클레오티드 (Inoue 등 (1987) Nucl Ac Res 15, 6131-6148) 또는 키메릭 (chimeric) RNA-DNA 유사체 (analogue) (Inoue 등 (1987) FEBS Lett. 215, 327-330)를 포함할 수 있다.
내재적 유전자 발현의 감소 또는 사실상의 제거는 또한 리보자임 (ribozyme)을 사용하여 수행될 수 있다. 리보자임 (ribozyme)은 상보적인 영역을 갖는 부위에서 mRNA와 같은 단일가닥인 핵산 서열을 절단할 수 있는 리보핵산가수분해효소 (ribonuclease) 활성을 가진 촉매성 RNA 분자이다. 따라서, 리보자임 (예를 들면, 햄머헤드 (hammerhead) 리보자임 (Haselhoff 및 Gerlach (1988) Nature 334, 585-591 참조)은 폴리펩티드를 코딩하는 mRNA 전사물의 촉매적 절단에 사용될 수 있어, 그로 인하여 폴리펩티드로 해독될 mRNA 전사물의 수를 실질적으로 줄인다. 핵산 서열에 대해 특이성을 가진 리보자임이 디자인될 수 있다 (예를 들면: Cech 등 U.S. Patent No. 4,987,071; 및 Cech 등 U.S. Patent No. 5,116,742 참고). 대안으로는, 핵산 서열에 해당하는 mRNA 전사물이 RNA 분자의 풀 (pool)로부터 특정 리보핵산가수분해효소 (ribonuclease) 활성을 가진 촉매성 RNA의 선발에 사용될 수 있다 (Bartel 및 Szostak (1993) Science 261, 1411 -1418). 식물에서 유전자 침묵 (gene silencing)을 위한 리보자임의 사용은 당업계에 공지되어 있다 (예를 들면, Atkins 등 (1994) WO 94/00012; Lenne 등 (1995) WO 95/03404; Lutziger 등 (2000) WO 00/00619; Prinsen 등 (1997) WO 97/13865 및 Scott 등 (1997) WO 97/38116).
유전자 침묵 (gene silencing)은 또한 삽입 돌연변이 유발 (예를 들면, T-DNA 삽입 또는 트렌스포존 삽입)에 의해 또는 Angell 및 Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS WO 98/36083), 또는 Baulcombe (WO 99/15682)에 기재된 전략에 의해서도 수행될 수 있다.
유전자 침묵은 또한 내재적 유전자상에 돌연변이 및/또는 실질적으로 식물체로 도입될 분리된 유전자/핵산에 돌연변이의 존재 시 발생할 수 있다. 상기 감소 또는 사실상의 제거는 기능이 없는 폴리펩티드에 의해서도 야기될 수 있다. 예를 들면, 폴리펩티드가 다양한 상호작용하는 단백질에 결합할 수 있다; 하나 이상의 돌연변이(들) 및/또는 절단(들)은 따라서, 상호작용하는 단백질 (수용체 단백질과 같은)에 결합할 수는 있으나 정상적인 기능을 나타낼 수 없는 (신호전달 리간드와 같은) 폴리펩티드를 제공할 수 있다.
유전자 침묵의 또 다른 방법은 표적 세포 내 유전자의 전사를 막는 3중나선 (triple helical) 구조를 형성하기 위해 유전자의 조절 영역 (예를 들면, 프로모터 및/또는 인핸서)에 상보적인 핵산 서열을 표적화하는 것이다. [Helene, C, Anticancer Drug Res. 6, 569-84, 1991; Helene 등 Ann. N.Y. Acad. Sci. 660, 27-36 1992; 및 Maher, LJ. Bioassays 14, 807-15, 1992]을 참조하면 된다.
식물체 내에서의 기능 저해를 위해 내재적 폴리펩티드에 대한 항체의 사용, 또는 폴리펩티드가 관여되는 신호전달 경로 (signalling pathway)의 방해와 같은 다른 방법들이 당업자에게 주지되어 있다. 특히, 인공합성 분자가 표적 폴리펩티드의 생물학적 기능을 저해하거나 또는 표적 폴리펩티드가 관여되는 신호전달 경로의 방해에 유용할 수 있다는 것을 고려할 수 있다.
대안으로는, 유전자의 식물 개체군 자연 변이체를 동정하기 위해 스크리닝 프로그램이 셋업될 수도 있으며, 상기 변이체는 활성이 감소된 폴리펩티드를 코딩한다. 상기 자연 변이체는 또한 예를 들면, 상동 재조합의 수행에 사용될 수 있다.
인공적인 및/또는 자연적인 miRNAs (microRNAs)가 유전자 발현 및/또는 mRNA 해독을 넉아웃 (knock out)하는 데 사용될 수 있다. 내재적 miRNAs는 전형적으로 19-24 뉴클레오티드 길이의 단일가닥의 작은 RNAs이며, 주로 유전자 발현 및/또는 mRNA 해독을 조절하는 작용을 한다. 대부분의 식물 miRNAs (microRNAs)는 표적 서열에 완전한 또는 완전에 가까운 상보성을 가진다. 그러나, 5 개까지의 미스매치 (mismatches)를 가진 자연적인 표적이 있으며, 다이서 (Dicer) 패밀리의 이중가닥 특정 RNases에 의해 특징적인 폴더백 (fold-back) 구조를 가진 더욱 긴 넌코딩 (non-coding) RNAs로부터 가공될 수 있다. 가공 (processing)으로, 주성분인 Argonaute 단백질에 결합함으로써 RISC (RNA-induced silencing complex)로 통합된다. MiRNAs는 세포질 내에서 표적 핵산, 대개 mRNAs와 염기쌍을 이루므로 RISC의 특이성 요소로서 작용한다. 연이은 조절은 표적 mRNA 절단 및 붕괴 및/또는 해독 저해를 포함한다. miRNA 과발현의 효과는 따라서 표적 유전자의 mRNA 수준의 감소로 흔히 반영된다.
전형적으로 21 뉴클레오티드 길이인 인공적인 microRNAs (amiRNAs)가 하나 또는 다수의 관심 유전자의 유전자 발현을 특이적으로 음성적으로 조절하도록 유전공학적으로 조작될 수 있다. 식물 microRNA 표적 선발의 결정인자는 당업계에 주지되어 있다. 표적 인지에 대한 경험적 매개변수는 정해져 있으며, 특정 amiRNAs의 디자인에 도움이 되게 사용될 수 있다 (Schwab 등 Dev. Cell 8, 517-527, 2005). amiRNAs의 디자인 및 생성을 위한 편리한 수단 및 이의 전구체는 또한 공개되어 있다 (Schwab 등 Plant Cell 18, 1 121-1 133, 2006).
최적의 수행을 위해, 내재적 유전자의 식물에서의 발현을 감소시키는 유전자 침묵 기술에서 단자엽 식물의 형질전환을 위해서는 단자엽 식물 유래의 핵산 서열을, 쌍자엽 식물의 형질전환을 위해서는 쌍자엽 식물 유래의 핵산 서열을 사용할 것이 요구된다. 바람직하게는, 임의의 해당 식물 종의 핵산 서열이 동일 생물종에 도입된다. 예를 들면, 벼 유래의 핵산 서열은 벼 식물로 형질전환된다. 그러나, 도입될 핵산 서열이 도입될 식물과 동일 식물 종으로부터 유래해야 한다는 것은 절대적인 필요조건은 아니다. 내재적 표적 유전자 및 도입될 핵산 간에 실질적인 상동성이 있으면 충분하다.
상기 기재된 것은 내재적 유전자의 식물에서의 발현의 감소 또는 실질적인 제거를 위한 다양한 방법의 예이다. 당업자는 전체 식물 또는 그 일부에서 내재적 유전자의 발현을 감소시키기 위한 침묵을 위해, 예를 들면, 적절한 프로모터를 사용하여 상기 언급된 방법을 용이하게 변형할 수 있다.
형질전환
본 발명에 언급된 용어 "도입" 또는 "형질전환"은 전달에 사용된 방법에 관계없이 외래 폴리뉴클레오티드의 숙주 세포로의 전달을 포함한다. 기관 발생이나 배발생에 의하여 연이은 클론 번식이 가능한 식물 조직은 본 발명의 유전자 구축물로 형질전환될 수 있으며, 전체 식물체가 이로부터 재생된다. 선택된 특정 조직은 형질전환될 특정 종에 이용 가능하며 가장 잘 맞는 클론 번식 시스템에 따라 다양할 것이다. 전형적인 조직 표적은 잎 디스크, 화분, 배, 자엽, 하배축, 대배우체, 캘러스 조직, 분열조직 (예를 들면, 정단 분열조직, 액아, 및 뿌리 분열조직), 및 유도된 분열조직 (예를 들면, 자엽 분열조직 및 하배축 분열조직)을 포함한다. 폴리뉴클레오티드는 일시적으로 또는 안정적으로 숙주 세포에 도입되며 예를 들면, 플라스미드처럼 비통합적으로 유지된다. 다르게는, 숙주 게놈으로 통합된다. 결과적인 형질전환 식물 세포는 당업자에게 주지된 방식으로 형질전환 식물을 재생하는데 사용된다.
외래 유전자의 식물 게놈으로 전달을 형질전환이라 부른다. 식물 종의 형질전환은 일상적인 기술이다. 유리하게도, 임의의 몇 가지 형질전환 방법이 목적 유전자를 적절한 조상 세포로의 도입에 사용될 수 있다. 식물 조직 또는 식물 세포로부터 식물의 형질전환 및 재생에 관하여 기재된 방법은 일시적인 또는 안정한 형질전환에 이용될 수 있다. 형질전환 방법은 리포좀, 전기천공법, 유리 DNA 흡수를 증가시키는 화학물질, 식물체 내로 DNA의 직접적인 주입, 입자총 충격법, 바이러스 또는 화분을 이용한 형질전환 및 미세주입 (microprojection)을 포함한다. 방법은 원형질에 대한 칼슘/폴리에틸렌 글리콜법 (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); 원형질의 전기천공법 (Shillito R.D. et al. (1985) Bio/Technol 3, 1099-1102); 식물로 미세주사 (microinjection) (Crossway et al., (1986) Mol. Gen Genet 202: 179-185); DNA 또는 RNA 코팅된 입자 충격법 (Klein TM et al., (1987) Nature 327: 70) (비통합적) 바이러스로 감염 등으로부터 선택할 수도 있다. 형질전환 작물을 포함한 형질전환 식물은 바람직하게는 아그로박테리움-매개 형질전환을 통해 제조된다. 편리한 형질전환방법은 식물체에서의 형질전환이다. 이를 위해, 예를 들면, 아그로박테리아를 식물 종자 상에 작용하게 하거나 식물 분열조직을 아그로박테리아로 접종하는 것이 가능하다. 형질전환된 아그로박테리아의 현탁액을 손상되지 않은 식물이나 적어도 꽃 원기에 작용하게 하는 것이 본 발명에 따라 특히 편리하다는 것이 입증되었다. 처리된 식물의 종자를 얻을 때까지 식물체를 키운다 (Clough and Bent, Plant J. (1998) 16, 735-743). 벼의 아그로박테리움 매개된 형질전환 방법은 하기 임의의 것에 기재된 것처럼 벼 형질전환에 관한 잘 알려진 방법들을 포함한다: 유럽특허출원 EP 1198985 A1, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan 등 (Plant Mol Biol 22 (3): 491-506, 1993), Hiei 등 (Plant J 6 (2): 271-282, 1994), 상기 명세서는 충분히 설명한 것처럼 본 발명에 참조문헌으로 통합된다. 옥수수 형질전환의 경우에, 바람직한 방법은 Ishida 등 (Nat. Biotechnol 14(6): 745-50, 1996) 또는 Frame 등 (Plant Physiol 129(1): 13-22, 2002)에 기재된 것이며, 상기 명세서는 충분히 설명한 것처럼 본 발명에 참조문헌으로 통합된다. 상기 방법들은 [B. Jenes 등, Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143] 및 [Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225]에 예로서 기재되어 있다. 핵산 또는 발현될 구축물은 바람직하게는 아그로박테리움 투머파시엔스 형질전환에 적절한 벡터, 예를 들면 pBin19 내로 클론된다 (Bevan 등, Nucl. Acids Res. 12 (1984) 8711). 상기 벡터로 형질전환된 아그로박테리아가 애기장대처럼 모델로 사용된 식물 (본 발명의 범위 내의 애기장대 (아라비돕시스 탈리아나)는 작물로 고려되지 않는다)이나 예로서 담배 같은 작물의 예를 들면, 상처 내거나 잘게 썬 잎을 아그로박테리아 용액에 적신 후 적절한 배지에 배양하는 것과 같은 식물 형질전환을 위해 알려진 방식으로 사용될 수 있다. 아그로박테리움 투머파시엔스에 의한 식물의 형질전환은 예를 들면, [Hofgen and Willmitzer in Nucl. Acid Res. (1988) 16, 9877]에 의하여 기재되었거나, 특히 [F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38]에 알려져 있다.
온전한 식물로 재생되는 체세포의 형질전환 외에, 식물의 분열조직 특히 배우자로 발달하는 세포의 형질전환이 가능하다. 이 경우에, 형질전환된 배우자는 자연적인 식물 발달 과정을 거쳐 형질전환 식물이 된다. 따라서 예를 들면, 애기장대의 종자가 아그로박테리아로 처리되고, 발달하는 식물체로부터 취한 종자 중의 일부분이 형질전환되어 형질전환 식물체로 된다 [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:1-9; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. 또 다른 방법은 화서의 반복적인 제거에 근거하며 근생엽 중앙의 절단 부위를 형질전환된 아그로박테리아와 함께 배양하면 형질전환된 종자를 이후에 얻을 수 있다 (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). 그러나, 특히 효과적인 방법은 화서 담그기 ("floral dip") 방법의 변형인 진공 침윤 (vacuum infiltration)이다. 애기장대의 진공 침윤의 경우, 감압 하에 온전한 식물체를 아그로박테리아 현탁액으로 처리하는 것이고 [Bechthold, N (1993). C R Acad Sci Paris Life Sci, 316: 1194-1199], "화서 담그기법"에서는 발달 중인 화서 조직을 계면활성제가 처리된 아그로박테리아 현탁액과 잠깐 배양하는 것이다 [Clough, SJ and Bent AF (1998) Plant J. 16, 735-743]. 양 경우에 특정 비율의 형질전환 종자가 수확되며, 이들 종자는 상기 기재된 선발 조건 하에서 재배함으로써 형질전환되지 않은 종자와 구분된다. 색소체는 모계로 유전되기 때문에 색소체의 안정적인 형질전환의 잇점은 대부분의 작물에서 화분을 통한 외래유전자의 유전이 감소되거나 제거된다는 점이다. 엽록체 게놈의 형질전환은 일반적으로 Klaus 등, 2004 [Nature Biotechnology 22 (2), 225-229]에 체계적으로 표시된 과정에 의하여 수행된다. 간단히, 형질전환될 서열을 선발 마커 유전자와 함께 엽록체 게놈에 상동인 플랭킹 서열 사이에 클로닝한다. 이들 상동 플랭킹 서열이 플라스톰(plastome) 내로 특이적으로 통합된다. 색소체 형질전환은 많은 다른 식물 종에 대해 기술되어 왔으며, 개관은 [Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 or Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28]에 있다. 추가의 생물공학적 진보는 마커 없는 색소체 형질전환체의 형태로 최근 보고되었으며, 이는 일시적인 동시통합된(co-integrated) 마커 유전자에 의해 생성될 수 있다 (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).
유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다.
일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 코딩되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천 판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.
DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 두 기술은 당업자에게 주지되어 있다.
생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다. 생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.
T- DNA 활성화 태깅
T-DNA 활성화 태깅 (Hayashi et al. Science (1992) 1350-1353)은 보통 프로모터 (또한 해독 인핸서 또는 인트론)를 함유하는 T-DNA를 프로모터가 표적 유전자의 발현을 지시하게 배치되어 관심 유전자의 게놈 영역 내로 또는 유전자 코딩 영역의 10 kb 업스트림 또는 다운스트림으로 삽입하는 것을 포함한다. 전형적으로, 자체의 자연 프로모터에 의한 표적 유전자 발현의 조절은 붕괴되고 유전자는 새로 도입된 프로모터의 조절하에 있게 된다. 프로모터는 전형적으로 T-DNA 내에 끼워져 있다. 이 T-DNA는 식물 게놈 내에 예를 들면, 아그로박테리움 감염을 통하여 무작위로 삽입되며 삽입된 T-DNA 인근의 유전자의 발현이 변형되게 된다. 결과적인 형질전환 식물은 도입된 프로모터에 가까운 유전자의 변형된 발현으로 인하여 우성 표현형을 보인다.
틸링 ( TILLING )
용어 "틸링 (TILLING)"은 "Targeted Induced Local Lesions In Genomes"의 약어이며 변형된 발현 및/또는 활성을 갖는 단백질을 코딩하는 핵산을 생성 및/또는 동정하는데 유용한 돌연변이 기술을 말한다. 틸링은 또한 상기 돌연변이체를 갖는 식물의 선발을 가능하게 한다. 이들 돌연변이체는 강도나 위치 또는 시기상의 변형된 발현을 보인다 (만일 돌연변이가 프로모터에 영향을 준다면). 이들 돌연변이체는 자체의 자연적 형태의 유전자에 비하여 훨씬 높은 활성을 나타낸다. 틸링은 고밀도 돌연변이 유발과 고속처리 탐색 방법을 조합한 것이다. 틸링의 전형적인 단계는 하기와 같다: (a) EMS 돌연변이유발 (Redei GP 및 Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chu NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 1682; Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) DNA 준비 및 개체의 풀링(pooling); (c) 관심 영역의 PCR 증폭; (d) 이형 이중가닥 (heteroduplexes)이 되게 변성 및 어닐링; (e) DHPLC로 이형 이중가닥이 있는지를 크로마토그램 상의 여분의 정점으로 검출; (f) 돌연변이체 개체의 동정; (g) 돌연변이 PCR 산물의 염기서열결정. 틸링의 방법은 당업계에 주지되어 있다 (McCallum et al., (2000) Nat Biotechnol 18: 455-457; Stemple (2004) Nat Rev Genet 5(2): 145-50).
상동 재조합
상동 재조합은 정해진 위치에 선택된 핵산이 게놈 내로 도입되게 한다. 상동 재조합은 생물학에서 효모 또는 선류 (Physcomitrella) 같은 하등생물에 대해 일상적으로 사용되는 표준기술이다. 식물에서 상동 재조합을 수행하는 방법은 모델 식물 (Offring et al. (1990) EMBO J 9(10): 3077-84)에 대해서 뿐 아니라 작물 예를 들면, 벼 (Terad et al. (2002) Nat Biotech 20(10): 1030-4; Iid and Terad (2004) Curr Opin Biotech 15(2): 132-8)에 대해서도 기재된 바 있고, 일반적으로 목적 생물체에 구애받지 않고 적용 가능한 접근법이 존재한다(Miller et al, Nature Biotechnol. 25, 778-785, 2007).
수확량 관련 형질
수확량 관련 형질은 식물 수확량에 관련된 형질 또는 특징이다. 수확량 관련 형질은 빠른 개화 시기, 수확량, 생물량 (biomass), 종자 수확량, 초기 활력, 녹색지수, 증가된 성장률, 개선된 재배 형질, 예를 들면 개선된 물 이용 효율 (WUE), 증가된 질소 이용 효율 (NUE) 등과 같은 특징의 제한되지 않는 목록의 하나 이상을 포함할 수 있다.
수확량
일반적인 의미에서의 용어 "수확량"은 경제적 가치 있는 측정 가능한 생산량을 말하며, 전형적으로 특정 작물, 면적, 및 기간에 관련이 있다. 개개 식물체 부분이 직접적으로 수, 크기 및/또는 중량에 근거한 수확량에 기여하거나, 또는 실제 수확량은 작물 및 년에 대해 평방 미터 당 수확량이고, 이는 총생산량 (수확된 및 평가된 생산량을 포함)을 재배된 평방 미터로 나눔으로써 결정된다.
용어 식물의 "수확량" 및 "식물 수확량"은 본 발명에서 호환성 있게 사용되고, 뿌리 및/또는 줄기 생물량과 같은 식물의 생물량, 생식 기관, 및/또는 그 식물의 종자와 같은 번식체 (propagule)로 언급될 수 있다.
옥수수를 예로 들면, 수꽃차례 (male inflorescence, tassel) 및 암꽃차례 (female inflorescence, ear)가 있고, 암꽃차례는 중앙 축 (cob)의 표면에 작은 이삭 쌍을 생성한다. 암꽃 이삭 각각은 2개의 수정가능한 소화 (floret)를 가지며, 그중 하나는 보통 수정되면 옥수수 낱알로 성숙하게 된다. 따라서 옥수수에서 수확량 증가는 다음 중의 하나 이상으로 표시된다: 평방 미터 당 식물체의 수 증가, 식물체 당 이삭 (열매) 수의 증가, 낱알 줄의 수, 줄 당 낱알의 수, 낱알 중량, 천립 중량, 열매 길이/직경의 증가, 종자 충전율 (충전된 소화의 수 (즉, 종자를 함유하는 소화)/전체 소화의 수 x100)의 증가.
벼 식물에서 꽃차례는 원추화서로 불린다. 상기 원추화서는 작은 이삭을 지닌다. 상기 이삭은 원추화서의 기본 단위이고, 소수경 (pedicel) 및 소화로 구성된다. 소화는 소수경 위에 생긴다. 소화는 큰 영포 (gluume, 포엽, lemma) 및 짧은 영포 (내화영, palea)로 이루어지는 2개의 보호적인 포엽에 감싸진 꽃을 포함한다. 따라서, 벼를 예로 들면, 수확량 증가는 다음 중의 하나 이상으로 표시된다: 평방 미터 당 식물체의 수, 식물체 당 원추화서의 수, 원추화서의 길이, 원추화서 당 작은 이삭의 수, 원추화서 당 꽃 (또는 소화)의 수, 충전된 소화 (종자를 함유하는 소화 수/전체 종자 수 x100)의 수인 종자 충전율의 증가, 천립 중량의 증가. 벼에서 침수 내성 또한 증가된 수확량을 나타낼 수 있다.
빠른 개화 시기
본 발명에 사용된 "빠른 개화 시기"를 갖는 식물은 대조구 식물보다 빠르게 개화하기 시작하는 식물이다. 따라서, 상기 용어는 빠른 개화 시작을 나타내는 식물을 의미한다. 식물의 개화 시기는 파종과 첫 번째 꽃의 출현 사이의 일수 (개화하는 시간)를 계산하여 평가될 수 있다. 식물의 "개화 시기"는 예를 들면 WO 2007/093444에 기재된 방법을 사용하여 결정될 수 있다.
초기 활력
"초기 활력" 특히 식물 생장의 초기 단계 중에 활기차고 건강하게 잘 균형을 이룬 생장을 말하며, 예를 들면, 식물이 환경에 보다 잘 적응함으로 인한 (즉, 에너지 자원 사용이 최적화되고 어린 줄기와 뿌리 간에 분배됨) 식물체의 적응성 증가의 결과일 것이다. 초기 활력을 갖는 식물은 또한 증가된 실생 생존 및 보다 나은 작물 생성을 보여주며, 이는 흔히 고도로 균일한 밭 (균일한 양상으로 자라는 작물, 즉 대다수의 식물이 사실상 거의 동시에 다양한 발달단계에 이르는)과 흔히 보다 낫고 보다 높은 수확량이 된다. 따라서, 초기 활력은 천립 중량, 발아율, 출현율, 실생 생장, 실생 높이, 뿌리 길이, 뿌리 및 어린 줄기 생물량 등과 같은 다양한 요인들을 측정함으로써 결정될 수 있다.
증가된 생장 속도
증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 실질적으로 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 성숙된 건종자로부터 식물체가 출발 물질과 유사한 성숙한 건종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 발아의 속도, 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 증가된 생장 속도는 식물의 생활사 중의 하나 이상의 단계에서 또는 실질적으로 전체 식물 생활사 중에 나타날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가하면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가하면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 평방 미터 당 연간 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 임의의 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에 (초기) 또는 수확기에 (후기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.
스트레스 저항성 ( Stress resistance )
식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 스트레스에 노출되든지 간에 수확량 및/또는 생장 속도의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건 하의 대조구 식물에 비하여 40%, 35%, 30% 또는 25% 미만, 더욱 바람직하게는 20% 또는 15% 미만이다. 실제 농업상의 진전 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 순한 스트레스는 식물이 노출되는 매일의 생물적 및/또는 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 동결(freezing) 온도에 의한 것이다.
"생물적 스트레스"는 전형적으로 병원균, 예를 들면, 세균, 바이러스, 균류, 선형동물 및 곤충에 의한 스트레스이다.
"비생물적 스트레스"는 예를 들면 가뭄에 의한 수분 스트레스, 염 스트레스, 또는 동결 스트레스에 의한 삼투 스트레스일 수 있다. 비생물적 스트레스는 또한 산화적 스트레스 또는 저온 스트레스일 수 있다. "동결 스트레스"는 동결 온도, 즉, 이용가능한 물 분자가 동결되어 얼음으로 바뀌는 온도에 의한 스트레스를 의미한다. "냉각 스트레스"로도 불리는 "저온(cold) 스트레스"는 예를 들면 10℃ 미만의 온도 또는 바람직하게는 5℃ 미만의 온도, 그러나 물 분자가 동결되지 않는 차가운 온도를 의미한다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. Rabbani 등 (Plant Physiol (2003) 133: 1755-1767)은 특히 가뭄 스트레스와 고염도 스트레스 간에 고도의 "혼선"을 기재하고 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 이들 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다. 본 발명에서 사용된 용어 "스트레스가 없는" 조건은 식물의 최적 생장을 허용하는 환경 조건이다. 당업자는 주어진 위치에서 정상적인 토양 조건 및 기후 조건을 인식하고 있다. 최적의 성장 조건에서 (스트레스가 없는 조건 하에서 자랄 때) 식물은 일반적으로 주어진 환경에서 그 식물의 평균 생산량의 증가하는 순으로 선호되는 적어도 97%, 95%, 92%, 90%, 87%, 85%, 83%, 80%, 77% 또는 75%를 생산한다. 평균 생산량은 수확 및/또는 계절에 근거해서 계산될 수 있다. 당업자는 작물의 평균 수확량 생산을 인식하고 있다.
특히, 본 발명의 방법은 스트레스가 없는 조건 하에서 수행될 수 있다. 한 예에서 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 순한 가뭄 같은 스트레스가 없는 조건 하에서 수행될 수 있다.
다른 구현예에서, 본 발명의 방법은 스트레스 조건 하에서 수행될 수 있다.
한 예에서, 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 가뭄과 같은 스트레스 조건 하에서 수행될 수 있다. 또 다른 예에서, 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 양분 결핍과 같은 스트레스 조건 하에서 수행될 수 있다.
양분 결핍은 질소, 인산염 및 다른 인 함유 화합물, 칼륨, 칼슘, 마그네슘, 망간, 철 및 붕소 같은 양분 부족의 결과이다.
또 다른 예에서, 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 염분 스트레스와 같은 스트레스 조건 하에서 수행될 수 있다. 용어 염분 스트레스는 통상적인 소금 (NaCl)에 제한되는 것이 아니라, NaCl, KCl, LiCl, MgCl2, CaCl2 중 임의의 하나 이상일 수 있다.
또 다른 예에서, 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 저온 스트레스 또는 동결 스트레스와 같은 스트레스 조건 하에서 수행될 수 있다.
증가/향상/강화
용어 "증가", "향상", 또는 "강화"는 서로 호환성 있게 사용할 수 있으며, 본 발명에서 정의된 대조구 식물과 비교하여 적어도 3%, 4%, 5%, 6%, 7%, 8%, 9% 또는 10%, 바람직하게는 적어도 15% 또는 20%, 더욱 바람직하게는 25%, 30%, 35% 또는 40% 이상의 수확량 및/또는 생장을 의미한다.
종자 수확량
증가된 종자 수확량은 다음 중 하나 이상으로 나타난다:
(a) 개별 종자 당 및/또는 식물체 당 및/또는 평방 미터 당의 종자 생물량 (총 종자 중량)의 증가;
(b) 식물체 당 꽃 수의 증가;
(c) 증가된 종자의 수;
(d) 증가된 종자 충전율 (충전된 소화의 수를 총 소화 수로 나눈 비로 나타냄);
(e) 증가된 수확 지수 (종자 같은 수확할 수 있는 부분의 수확량을 식물 지상부의 생물량으로 나눈 비율); 및
(f) 증가된 천립 중량 (TKW) (계수된 종자의 수 및 이의 총 중량으로부터 외삽됨). 증가된 TKW는 증가된 종자 크기 및/또는 종자 중량, 및 배 및/또는 배유 크기의 증가로 인한다.
증가된 종자 수확량은 또한 종자 크기 및/또는 종자 부피의 증가로 나타낼 수 있다. 더욱이, 종자 수확량의 증가는 또한 종자 면적 및/또는 종자 길이 및/또는 종자 폭 및/또는 종자 주계의 증가로 나타난다.
녹색 지수
본 발명에 사용된 "녹색 지수 (greenness index)"는 식물의 디지털 이미지로부터 계산된다. 이미지 상에 식물 대상에 속하는 각 화소에 대하여, 녹색 값 대 적색 값의 비율 (코딩 색상에 대하여 RGB 모델에서)이 계산된다. 녹색 지수는 녹색 대 적색의 비율이 주어진 역치를 능가하는 화소의 백분율로 표시된다. 정상적인 생장 조건 하에서, 염분 스트레스가 있는 생장 조건 하에서, 양분 이용도가 감소된 생장 조건 하에서 식물의 녹색 지수는 개화 전 마지막 이미지에서 측정된다. 대조적으로, 가뭄 스트레스 생장 조건 하에서 식물의 녹색 지수는 가뭄 후의 첫 번째 이미지에서 측정된다.
생물량 ( Biomass )
본 발명에서 사용된 용어 "생물량"은 식물의 총 중량을 의미한다. 생물량의 정의에서, 하기의 임의의 하나 이상을 포함할 수 있는, 하나 이상의 식물 일부의 생물량 사이에 구별될 수 있다:
- 줄기 생물량, 종자 생물량, 잎 생물량 등과 같은 지상부일 수 있으나, 이에 제한되지 않음;
- 줄기 생물량, 종자 생물량, 잎 생물량 등과 같은 지상부의 수확 가능한 부분일 수 있으나, 이에 제한되지 않음;
- 뿌리 생물량과 같은 지하부일 수 있으나, 이에 제한되지 않음;
- 뿌리 생물량과 같은 지하부의 수확 가능한 부분일 수 있으나, 이에 제한되지 않음;
- 뿌리 생물량, 줄기 생물량과 같은 영양(vegetative) 생물량;
- 생식 기관; 및
- 종자와 같은 번식체.
마커 보조 육종
상기 육종 프로그램은 때때로 예를 들면, EMS 돌연변이 유발을 사용하여 식물에 돌연변이 유발 처리로 대립인자 변이의 도입을 필요로 하며; 다르게는, 그 프로그램은 자연발생적으로 생성된 "자연적인" 대립인자 변이체의 수집물로부터 시작될 수도 있다. 그러면 대립인자 변이체의 동정은 예를 들면, PCR로 한다. 문제되는 서열의 증가된 수확량을 제공하는 우수한 대립인자 변이체의 선발 단계가 잇따른다. 선발은 전형적으로 문제되는 서열의 다른 대립인자 변이체를 함유하는 식물의 생장 능력을 관찰함으로써 이루어진다. 생장 능력은 온실 또는 야외에서 관찰할 수 있다. 추가의 선택 가능한 단계는 우수한 대립인자 변이체가 동정된 식물과 또 다른 식물의 교배를 포함한다. 이는 예를 들면, 흥미로운 표현형적 특징의 조합을 만드는데 사용될 수 있다.
(유전자 지도 제작에서) 탐침으로 사용
상기 유전자에 대한 유전자 및 물리 지도 제작을 위한 관심있는 단백질을 코딩하는 핵산의 사용에는 적어도 15 뉴클레오티드 길이의 핵산 서열만이 필요하다. 이 핵산은 RFLP (restriction fragment length polymorphism) 마커로 사용될 수 있다. 제한효소로 절단된 식물 게놈 DNA의 서던 블럿 (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)은 관심있는 단백질을 코딩하는 핵산으로 프로빙될 수 있다. 생성된 밴드 패턴으로 유전자지도 제작을 위하여 MapMaker (Lander 등 (1987) Genomics 1: 174-181) 같은 컴퓨터 프로그램을 사용하여 유전적 분석을 하게 된다. 또한, 핵산은 지정된 유전적 교배의 양친 및 자손을 나타내는 개체들 세트의 제한 효소 처리된 게놈 DNA를 포함하는 서던 블럿에 탐침으로 사용될 수 있다. DNA 다형성의 분리를 기록하고, 이 집단을 이용하여 이전에 얻었던 유전자 지도상에 관심있는 단백질을 코딩하는 핵산의 위치 계산에 사용한다 (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
유전자 지도 제작에 사용하기 위한 식물 유전자 유래 탐침의 생산 및 사용은 [Bematzky and Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41]에 기재되어 있다. 수많은 공개문헌이 상기 개설된 방법론 또는 이의 변형을 사용하여 특정 cDNA 클론의 유전자 지도 제작을 기술한다. 예를 들면, F2 이종교배 개체군, 역교배 개체군, 무작위 교배 개체군, 근동질유전자계통, 및 다른 세트의 개체가 유전자 지도 제작에 사용될 수 있다. 상기 방법론은 당업자에게 주지되어 있다.
핵산 탐침은 또한 물리 지도에 제작 사용될 수 있다 (즉, 물리 지도상에 서열의 위치 Hoheisel et al. In: Non-mammalian Genomic Analysis: Practical Guide, Academic press 1996, pp. 319-346, 인용된 문헌 참조).
또 다른 구현예에 있어서, 핵산 탐침은 직접적인 형광 인 시투 혼성화 (fluorescence in situ hybridisation, FISH) 지도 제작에 사용될 수 있다 (Trask (1991) Trends Genet. 7:149-154). 비록 현 FISH 지도 제작 방법이 큰 클론에 유리하지만 (수 kb 내지 몇 백 kb; Laan et al. (1995)Genome Res. 5:13-20), 감도가 향상되면 더욱 짧은 탐침으로 FISH 지도 제작이 가능해진다.
유전자지도 및 물리지도 작성을 위한 핵산증폭에 근거한 다양한 방법이 핵산 서열을 사용하여 수행될 수 있다. 예는 대립인자 특이적 증폭 (allele-specific amplification, Kazazian (1989) J. Lab. Clin. Med 11:95-96), CAPS (polymorphism of PCR-amplified fragments; Sheffield 등 (1993) Genomics 16:325-332), 대립인자 특이적 라이게이션 (allele-specific ligation, Landegren 등 (1988) Science 241:1077-1080), 뉴클레오티드 신장 반응 (nucleotide extension reactions, Sokolov (1990) Nucleic Acid Res. 18:3671), Radiation Hybrid Mapping (Walter et al . (1997) Nat. Genet. 7:22-28) 및 Happy Mapping (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807)을 포함한다. 이들 방법을 위해서 증폭 반응 또는 프라이머 연장 반응에 사용하기 위한 프라이머 쌍을 고안하고 제작하기 위해 핵산 서열이 사용된다. 상기 프라이머의 고안은 당업자에게는 주지되어 있다. PCR에 근거한 유전자 지도 제작에 사용하는 방법에서는 핵산 서열에 해당하는 영역에서 교배 양친 간의 DNA 서열 차이를 알 필요가 있다. 그러나 이는 일반적으로 지도제작 방법에는 필요하지 않다.
식물
본 발명에서 사용된 용어 "식물"은 전체식물, 식물 및 종자, 어린 줄기, 줄기, 잎, 뿌리 (괴경 포함), 꽃, 및 조직과 기관을 포함하는 식물 부분의 조상 및 자손을 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다. 용어 "식물"은 또한 식물 세포, 현탁 배양액, 캘러스 조직, 배, 분열조직, 배우체, 포자체, 화분 및 소포자를 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다.
본 발명의 방법에 유용한 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 하기를 포함하는 목록에서 선택된 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다: 에이서 (Acer spp.), 악티니디아 (Actinidia spp.), 아벨모스쿠스 (Abelmoschus spp.), 아가베 시살라나 (Agave sisalana), 아그로피론 (Agropyron spp.), 아그로스티스 스톨로니페라 ( Agrostis stolonifera ), 알리움 (Allium spp.), 아마란투스 (Amaranthus spp.), 암모필라 아레나리아 (Ammophila arenaria), 아나나스 코모수스 ( Ananas comosus ), 안노나 (Annona spp.), 아피움 그라베오렌스 (Apium graveolens), 아라키스 ( Arachis spp.), 알토칼푸스 (Artocarpus spp.), 아스파라거스 오피시날리스 ( Asparagus officinalis ), 아베나 (Avena spp.) (예를 들면, 아베나 사티바 ( Avena sativa ), 아베나 파투아 ( Avena fatua), 아베나 비잔티나 (Avena byzantina), 아베나 파투아 var . 사티바 (Avena fatua var . sativa), 아베나 하이브리다 (Avena hybrida)), 아베로아 카람볼라 (Averrhoa carambola), 뱀부사 (Bambusa sp .), 베닌카사 히스피다 (Benincasa hispida), 벨톨레티아 엑셀세아 (Bertholletia excelsea), 베타 불가리스 (Beta vulgaris), 브라시카 (Brassica spp.) (예를 들면, 브라시카 나푸스 ( Brassica napus), 브라시카 라파 (Brassica rapa ssp.) [캐놀라, 유채, 순무]), 카다바 파리노사 (Cadaba farinosa), 카멜리아 시넨시스 (Camellia sinensis), 칸나 인디카 (Canna indica), 칸나비스 사티바 (Cannabis sativa), 캡시쿰 ( Capsicum spp.), 카렉스 엘라타 (Carex elata), 카리카 파파야 (Carica papaya), 카리사 마크로칼파 (Carissa macrocarpa), 카리야 (Carya spp .), 카르타무스 팅크토리우스 (Carthamus tinctorius), 카스타네아 (Castanea spp.), 케이바 펜탄드라 (Ceiba pentandra), 키코리움 엔디비아 (Cichorium endivia ), 신나모뭄 (Cinnamomum spp .), 시트룰루스 라나투스 (Citrullus lanatus), 시트루스 (Citrus spp.), 코코스 (Cocos spp .), 코페아 ( Coffea spp.), 콜로카시아 에스쿨렌타 (Colocasia esculenta), 콜라 (Cola spp.), 콜코루스 (Corchorus sp.), 코리안드룸 사티붐 (Coriandrum sativum), 코리루스 (Corylus spp.), 크라태구스 (Crataegus spp.), 크로쿠스 사티부스 (Crocus sativus), 쿠쿨비타 (Cucurbita spp .), 쿠쿠미스 ( Cucumis spp.), 키나라 ( Cynara spp.), 다우쿠스 카로타 (Daucus carota), 데스모디움 ( Desmodium spp.), 디모칼푸스 론간 (Dimocarpus longan), 디오스코레아 (Dioscorea spp.), 디오스피로스 (Diospyros spp.), 에키노크로아 (Echinochloa spp .), 엘래이스 ((Elaeis (예를 들면, 엘래이스 귀넨시스 (Elaeis guineensis), 엘레이스 올레이페라 (Elaeis oleifera)), 엘레우신 코라카나 (Eleusine coracana), 에라그로스티스 테프 (Eragrostis tef), 에리안투스 (Erianthus sp .), 에리오보트리아 야포니카 (Eriobotrya japonica), 유카립투스 (Eucalyptus spp.), 유게니아 유니플로라 (Eugenia uniflora), 파고피룸 (Fagopyrum spp.), 파구스 (Fagus spp.), 페스투카 아룬디나케아 (Festuca arundinacea), 피쿠스 카리카 (Ficus carica), 폴투넬라 (Fortunella spp.), 프라가리아 (Fragaria spp.), 깅코 빌로바 (Ginkgo biloba), 글라이신 (Glycine spp.) (예를 들면, 글라이신 맥스 (Glycine max), 소야 히스피다 (Soja hispida) 또는 소야 맥스 (Soja max)), 고시피움 힐수툼 (Gossypium hirsutum), 헬리안투스 (Helianthus spp.) (예를 들면, 헬리안투스 안누스 (Helianthus annuus)), 헤메로칼리스 풀바 (Hemerocallis fulva), 히비스쿠스 (Hibiscus spp.) 홀데움 (Hordeum spp.) (예를 들면, 홀데움 불가레 (Hordeum vulgare)), 이포모에아 바타타스 (Ipomoea batatas ), 주글란스 (Juglans spp.), 락투카 사티바 (Lactuca sativa), 라티루스 (Lathyrus spp.), 렌스 쿨리나리스 (Lens culinaris), 리눔 우시타티시뭄 (Linum usitatissimum), 리치 키넨시스 (Litchi chinensis), 로투스 ( Lotus spp.), 루파 아쿠탄굴라 ( Luffa acutangula ), 루피누스 (Lupinus spp.), 루줄라 실바티카 (Luzula sylvatica), 라이코펠시콘 (Lycopersicon spp.) (예를 들면, 라이코펠시콘 에스쿨렌툼 (Lycopersicon esculentum), 라이코펠시콘 라이코펠시쿰 (Lycopersicon lycopersicum), 라이코펠시콘 피리폴메 (Lycopersicon pyriforme)), 마크로틸로마 (Macrotyloma spp.), 말루스 (Malus spp.), 말피기아 에말기나타 (Malpighia emarginata), 맘메아 아메리카나 (Mammea americana), 망기페라 인디카 (Mangifera indica), 마니호트 (Manihot spp.), 마닐카라 자포타 (Manilkara zapota), 메디카고 사티바 (Medicago sativa), 메릴로투스 (Melilotus spp.), 멘타 ( Mentha spp.), 미스칸투스 시넨시스 (Miscanthus sinensis), 모몰디카 (Momordica spp.), 모루스 니그라 (Morus nigra), 무사 (Musa spp.), 니코티아나 ( Nicotiana spp.), 올레아 ( Olea spp.), 오푼티아 (Opuntia spp.), 오르니토푸스 (Ornithopus spp.), 오리자 (Oryza spp.) (예를 들면, 오리자 사티바 (Oryza sativa ), 오리자 라티포리아 ( Oryza latifolia)), 패니쿰 미리아케움 (Panicum miliaceum), 패니쿰 벌가툼 ( Panicum virgatum), 파시플로라 에둘리스 (Passiflora edulis), 파스티나카 사티바 (Pastinaca sativa), 페니세툼 (Pennisetum sp .), 펠세아 (Persea spp.), 페트로셀리눔 크리스품 (Petroselinum crispum), 파라리스 아룬디나케아 (Phalaris arundinacea), 파세올루스 (Phaseolus spp.), 플레움 프라텐세 (Phleum pratense), 피닉스 (Phoenix spp .), 프라그미테스 오스트라리스 (Phragmites australis), 피사리스 (Physalis spp.), 피누스 ( Pinus spp.,) 피스타키아 베라 (Pistacia vera ), 피숨 (Pisum spp.), 포아 (Poa spp.), 포푸러스 ( Populus spp.), 프로소피스 (Prosopis spp.), 프루누스 (Prunus spp.), 프시디움 ( Psidium spp.), 푸니카 그라나툼 (Punica granatum), 피루스 코무니스 (Pyrus communis), 켈쿠스 (Quercus spp.), 라파누스 사티부스 (Raphanus sativus), 레움 라발바룸 (Rheum rhabarbarum), 리베스 (Ribes spp.), 리키누스 코무니스 ( Ricinus communis ), 루부스 (Rubus spp.), 사카룸 (Saccharum spp.), 살릭스 ( Salix spp.), 삼부쿠스 (Sambucus spp.), 세카레 세레알레 ( Secale cereale ), 세사뭄 ( Sesamum spp.), 시나피스 ( Sinapis sp .), 솔라눔 ( Solanum spp.) (예를 들면, 솔라눔 투베로숨 (Solanum tuberosum ), 솔라눔 인테그리폴리움 (Solanum integrifolium) 또는 솔라눔 라이코펠시쿰 (Solanum lycopersicum)), 솔굼 바이칼라 ( Sorghum bicolor ), 스피나시아 (Spinacia spp.), 시지기움 (Syzygium spp.), 타게테스 ( Tagetes spp.), 타마린두스 인디카 ( Tamarindus indica ), 테오브로마 카카오 (Theobroma cacao ), 트리폴리움 (Trifolium spp.), 트리프사쿰 다크틸로이드 (Tripsacum dactyloides), 트리티코세칼레 림파우이 ( Triticosecale rimpaui ), 트리티쿰 (Triticum spp. (예를 들면, 트리티쿰 아에스티붐 (Triticum aestivum ), 트리티쿰 두룸 (Triticum durum), 트리티쿰 툴기둠 (Triticum turgidum ), 트리티쿰 하이베르눔 (Triticum hybernum), 트리티쿰 마차 (Triticum macha ), 트리티쿰 사티붐 (Triticum sativum), 트리티쿰 모노코쿰 (Triticum monococcum) 또는 트리티쿰 불가레 (Triticum vulgare)), 트로패오룸 미누스 (Tropaeolum minus), 트로패오룸 마주스 (Tropaeolum majus), 박시니움 (Vaccinium spp.), 비시아 (Vicia spp.), 비그나 (Vigna spp.), 비올라 오도라타 (Viola odorata), 비티스 ( Vitis spp.), 제아 메이즈 (Zea mays), 지자니아 팔루스트리스 (Zizania palustris), 지지푸스 (Ziziphus spp.).
대조구 식물(들)
적절한 대조구 식물의 선택은 실험 셋업에서는 통상적인 부분이며, 상기 식물의 야생형 또는 목적 유전자가 없는 해당 식물을 실험에 포함할 수 있다. 대조구 식물은 전형적으로 평가되는 식물과 동일한 식물 종 또는 동일한 변종이다. 대조구 식물은 또한 평가되는 식물의 공접합자(nullizygote)일 수 있다. 공접합자는 분리에 의하여 왜래유전자가 없는 개체이다. 본 발명에서 사용된 "대조구 식물"은 전체 식물뿐 아니라 종자 및 종자의 일부분을 포함한 식물의 일부분을 말한다.
발명의 상세한 설명
놀랍게도, 이제 SGT1 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 발견되었다. 첫 번째 구현예에 따라, 본 발명은 SGT1 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 임의로 향상된 수확량 관련 형질을 갖는 식물의 선발을 포함하는 대조구 식물에 비하여 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명은 또한 대조구 식물에 비해 식물에서 향상된 수확량 관련 형질을 부여하는 지금까지 알려지지 않은 SGT1 코딩 핵산 및 SGT1 폴리펩티드를 제공한다.
게다가, 놀랍게도 이제 CLC-pKG 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절은 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 발견되었다. 첫 번째 구현예에 따라, 본 발명은 CLC-pKG폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 임의로 향상된 수확량 관련 형질을 갖는 식물의 선발을 포함하는 대조구 식물에 비하여 식물에서 수확량 관련 형질을 증가시키는 방법을 제공한다.
게다가, 놀랍게도 이제 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절은 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 발견되었다. 본 발명의 일 구현예에 따라, 본 발명은 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 임의로 향상된 수확량 관련 형질을 갖는 식물의 선발을 포함하는 대조구 식물에 비하여 식물에서 수확량 관련 형질을 증가시키는 방법을 제공한다.
SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 발현 조절 (바람직하게는, 증가)을 위한 바람직한 방법은 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 각각 핵산의 식물체로의 도입 및 발현이다.
일 구현예에서 "본 발명의 방법에 유용한 단백질"은 본 발명에 정의된 SGT1 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 SGT1 폴리펩티드를 코딩하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산 (따라서 본 발명의 방법 수행에 유용한)은 하기에 기재될 유형의 단백질을 코딩하는 임의의 핵산이며, 이후 또한 "SGT1 핵산" 또는 "SGT1 유전자"라고 칭한다.
본 발명에 정의된 "SGT1 폴리펩티드"는 임의의 순서로 하기를 포함하는 임의의 폴리펩티드를 의미한다:
1. 적어도 하나의 테트라트리코펩티드 (TPR) 반복;
2. 적어도 하나의 CS 도메인; 및
3. SGS 도메인.
TPR 은 단백질-단백질 상호작용의 매개 및 다중단백질 복합체의 조합에 관련된 구조 모티프이다. PFam 등록번호 PF00515는 TPR 을 나타낸다. 또한 TPR 에 대한 추가의 정보는 Interpro 등록번호 IPR001440을 참조하면 된다. 본 발명의 방법에 유용한 SGT1 폴리펩티드는 적어도 하나의 TPR, 바람직하게는 2개의 TPR 및 가장 바람직하게는 3개의 TPR 을 포함한다.
첫 번째 TPR 은 유형 1 TPR (TPR1)이며, 하기에 제시된 서열 또는 TPR1의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열로 나타내어진다.
TPR1: SKAYLRKGLACMKLEEYQTAKAALETGASLAPGE (서열번호 37)
두번째 TPR 은 유형 2 TPR (TPR2)이며, 하기에 제시된 서열 또는 TPR2a의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열로 나타내어진다.
TPR2a: ASDLETRAKEAFIDDHFELAVDLYTQAISLSPKN (서열번호 38)
세번째 TPR 은 또한 유형 2 TPR (TPR2)이며, 하기에 제시된 서열 또는 TPR2b의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열로 나타내어진다.
TPR2b: PELFADRAQANIKLNYFTEAVVDANKAIELDPYM (서열번호 39)
PFam 등록번호 PF04969는 CS 도메인을 나타낸다. 또한 CS 도메인에 대한 추가의 정보는 Interpro 등록번호 IPR017447을 참조하면 된다. CS 도메인은 하기의 서열 또는 하기의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열로 나타내어진다.
CS  도메인:YRHEFYQKPEEVVVTIFAKGIPAKNVVVDFGEQILSVSIDLPGGETYSFQPRLFGKITPAKCRYEVMSTKIEIRLAK (서열번호 40)
PFam 등록번호 PF05002는 SGS 도메인을 나타낸다. 또한 SGS 도메인에 대한 추가의 정보는 Interpro 등록번호 IPR007699을 참조하면 된다. SGS 도메인은 하기의 서열 또는 하기의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열로 나타내어진다.
SGS  도메인:NVDWDKLEAQVKKEEKDEKLDGDAALNKFFRDIYKDADEDTRRAMMKSFVESNGTVLSTNWKKVGTKKVEGSPPDGMELKKW (서열번호 41)
본 발명의 바람직한 특징에 따라, 본 발명의 방법에 유용한 SGT1 폴리펩티드는 하기에 정의된 모티프 1 내지 모티프 8의 임의의 하나 이상을 포함할 수 있다:
모티프 1: DLETRAKEAFIDDHFELAVDLYTQAI, 또는 모티프 1 (서열번호 42)의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열.
모티프 2: ADRAQANIKL, 또는 모티프 2 (서열번호 43)의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열.
모티프 3: LEEYQTAKAALETGAS, 또는 모티프 3 (서열번호 44)의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열.
모티프 4: KYRHEFYQKPEEVVVTIFAKGIP, 또는 모티프 4 (서열번호 45)의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열.
모티프 5: QPRLFGKITPAKCRYEVMSTKIEIRLAKAE, 또는 모티프 5 (서열번호 46)의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열.
모티프 6: EAQVKKEEKDEKLDGDA, 또는 모티프 6 (서열번호 47)의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열.
모티프 7: ALNKFFRDIYKDADEDTRRAMMKSFVESNGTVLSTNWKKVGTKKVEG, 또는 모티프 7 (서열번호 48)의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열.
모티프 8: SPPDGMELKKWEI, 또는 모티프 8 (서열번호 49)의 서열에 대해 증가하는 순으로 선호되는 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 그 이상의 서열 동일성을 갖는 서열.
바람직하게는, SGT1 폴리펩티드는 상기에 정의된 증가하는 순으로 선호되는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 또는 8개의 모티프 모두를 포함한다.
게다가, 일반적으로 SGT1 폴리펩티드는 서열번호 2로 표시된 아미노산에 대해 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 전체 서열 동일성을 갖는다.
전체의 서열 동일성은 바람직하게는 디폴트 매개 변수 및 성숙 단백질 서열을 이용하여(즉, 분비 신호 또는 수송 펩티드를 고려하지 않고), GAP 프로그램 (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은, 전체적인 정렬 알고리즘을 이용하여 결정한다. 전체적인 서열 동일성에 비해, 서열 동일성은 일반적으로 보존된 도메인 또는 모티프만 고려되었을 때 더 높을 것이다.
바람직하게는, 도 2에서 도시된 것과 같은 계통수의 구축에 이용시 상기 폴리펩티드 서열은 임의의 다른 그룹보다 서열번호 2로 표시된 아미노산 서열을 포함하는 SGT1 폴리펩티드의 그룹과 함께 클러스터링 된다.
또 다른 구현예에서 "본 발명의 방법에 유용한 단백질"은 본 발명에 정의된 CLC-pKG 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 CLC-pKG 폴리펩티드를 코딩하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산 (따라서 본 발명의 방법 수행에 유용한)은 하기에 기재될 유형의 단백질을 코딩하는 임의의 핵산이며, 이후 또한 "CLC-pKG 핵산" 또는 "CLC-pKG 유전자"라고 칭한다.
본 발명에 정의된 "CLC-pKG 폴리펩티드"는 Voltage_CLC 도메인 (Pfam entry PF00654) 및 C-말단의 CBS 도메인 (Pfam entry PF00571; Interpro entry IPR000644) 및 선택적으로 USP 도메인 (Pfam entry PF00582; Interpro entry IPR006016)을 포함하는 임의의 폴리펩티드를 의미한다. CLC-pKG 폴리펩티드는 생물의 다양한 영역에 걸쳐서 고도로 보존된 전압-게이트 채널 (voltage-gated channel) 패밀리의 일부이고, 다른 알려진 전압-게이트 채널과 구조적으로 관련이 없다. 그들은 세균에서부터 효모 및 식물에 이르는 다양한 개체에서 발견되며, 동물에서도 발견된다. CLC-pKG 폴리펩티드는 일반적으로 10개 또는 12개의 막통과 (TM) 도메인을 가지며, 가끔 10개 미만 TM 도메인 또는 12개 이상, 최대 18개 또는 20개의 TM 도메인이 나타날 수 있다. 애기장대 AtCLCe 및 AtCLCf 단백질로 표시된 CLC-pKG 폴리펩티드는 최대 12개의 막 걸치는 (membrane-spanning) 도메인을 보여준다 (Marmagne et al., 2007). CBS (cystathionine-beta-synthase) 도메인은 작은 세포 내 모듈 (module)로, 대개 단백질 내에 2개 또는 4개 카피가 발견되며 (CLC-pKG 단백질에 대한 2개의 카피), 모든 생물계의 몇 가지 다른 단백질에 존재한다. Baeteman 도메인으로도 불리는 CBS 도메인의 직렬 쌍 (tandem pair)은 아데노신 유도체에 대한 결합 도메인으로 작용하며, 결합된 효소의 또는 다른 도메인의 활성을 조절할 수 있다. 일반적으로 CLC-pKG 폴리펩티드에서 CBS 도메인은 세포의 에너지 상태에 대한 센서 역할을 한다고 제안된다. USP (Universal Stress Protein) 도메인은 단백질에 존재하는 보존된 단백질 영역이며, 일반적으로 자연에서의 발현은 세포가 스트레스 요인에 노출되었을 때 향상된다. 이것은 일반적인 대장균에서 "스트레스 내성 (endurance)" 활성을 갖는 것으로 제안된 공통 스트레스 단백질 UspA에서 처음으로 규명되었다 (Nystrom T, Neidhardt FC. Mol. Microbiol. 11 537-44 1994).
바람직하게는, 본 발명의 방법에 유용한 CLC-pKG 폴리펩티드는 하기에 대해 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 도메인을 포함한다:
(i) 서열번호 54의 77번 아미노산 및 422번 아미노산 사이에 위치한 서열로 표시된 서열번호 54의 CLC;
(ii) 서열번호 54의 455번 내지 510번 아미노산 또는 516번 내지 571번 아미노산 사이에 위치한 서열로 표시된 서열번호 54의 CBS 도메인; 및 선택적으로
(iii) 서열번호 54의 597번 내지 731번 아미노산 사이에 위치한 서열로 표시된 서열번호 54의 USP 도메인.
바람직하게는, 본 발명의 방법에 유용한 CLC-pKG 폴리펩티드는 모티프 9 또는 모티프 10의 하나 이상을 포함한다:
(i) 모티프 9: P(T/S)(V/I)(H/Q)(I/V)GA(A/S/G)LA;
(ii) 모티프 10: (P/S)GG(I/L/V)(F/L)XP(A/S/T)LX(L/M)G(S/A/T)XLG
상기에서 1, 2, 3, 4, 5, 6, 7개까지의 아미노산은 임의의 아미노산으로, 바람직하게는 반보존적인 아미노산으로, 더욱 바람직하게는 보존적인 아미노산으로 대체될 수 있다.
부가적으로 또는 대안적으로, 본 발명의 방법에 유용한 CLC-pKG 폴리펩티드 또는 이의 상동체는 폴리펩티드가 상기에 기술된 보존된 도메인을 포함한다면, 표 11의 폴리펩티드 중 임의의 하나, 바람직하게는 서열번호 54로 표시된 아미노산에 대해, 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 전체 서열 동일성을 갖는다. 전체의 서열 동일성은 바람직하게는 디폴트 매개 변수 및 성숙 단백질 서열을 이용하여(즉, 분비 신호 또는 수송 펩티드를 고려하지 않고), GAP 프로그램 (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은, 전체적인 정렬 알고리즘을 이용하여 결정한다. 전체적인 서열 동일성에 비해, 서열 동일성은 일반적으로 보존된 도메인 또는 모티프만 고려되었을 때 더 높을 것이다.
바람직한 구현예에서 본 발명의 방법에 유용한 CLC-pKG 핵산 및/또는 폴리펩티드는 자연 유래, 더 바람직하게는 식물 유래, 가장 바람직하게는 원핵생물 유래이다. 바람직한 식물 CLC-pKG 폴리펩티드는 Teardo 등 (FEBS Letters 579: 4991-4996, 2005)에 기재된 시금치 CLCf 또는 유전자좌(locus) 번호를 갖는, Marmagne 등 (2007)에 기재된 AtClC-e (At4g35440) 및 AtClC-f (At1g55620)이다. Teardo 등 (2005)에 의해 기재된, AtClC-f 및 AtClC-e는 서열 구조에서 남세균 CIC 채널과 더 가까운 관계가 있다 (Teardo 등 (2005)의 표 1 참고). 특히 시네코시스티스 sp. PCC 6803 단백질인 sll1864와의 서열 유사성은 AtClC-e와 20% 및 AtClC-f와 21%이다. 바람직한 원핵 CLC-pKG 폴리펩티드는 시네코시스티스 종의 폴리펩티드, 더 바람직하게는 시네코시스티스 sp. PCC 6803의, 가장 바람직하게는 본 발명의 서열번호 54 하에 제공된 시네코시스티스 sp. PCC 6803의 sll1864 폴리펩티드이다.
대안적으로 또는 부가적으로, Marmagne 등 (본 발명에서 원용에 의해 포함되는)의 도 1에 도시된 것과 같은 계통수의 구축에 이용시 본 발명의 방법에 유용한 CLC-pKG 폴리펩티드 서열은 임의의 다른 음이온 그룹보다 세균 유래의 CLC 폴리펩티드 그룹과 함께, 바람직하게는 시네코시스티스 sp.의 SCLC(P74477)와 함께; 또는 AtCLCe 및 AtCLCf를 포함하는 식물 유래의 그룹과 함께 클러스터링된다. Marmagne 등 (2007)의 도 1은 본 발명의 도 6에 제시하였다.
게다가, CLC-유사 폴리펩티드 (적어도 그들의 자연적인 형태에서)는 일반적으로 질산염/ H+ 교환 활성을 갖는다. 음이온 수송 활성 측정을 위한 도구 및 기술은 예를 들면 효모 돌연변이체의 상보성 (complementation) (Marmagne et al., J. Exp. Bot. 58, 3385-3393, 2007) 또는 애기장대 돌연변이체의 상보성 (De Angeli, 2009)에 의해 당업계에 잘 알려져 있다. 추가의 상세한 내용은 실시예 섹션에서 제공된다.
다른 음이온에 대한 CLC 염화물 채널 (CLC chloride channel)의 선택성은 CLC 단백질 클래스들 사이에서 다르다. 따라서 진핵생물 유래의 CLC 단백질에 더 가까운 애기장대의 AtCLCa (도 6 참고)는 염화물인 Cl-보다 NO3- 음이온에 대해 더 높은 선택성을 갖는 것을 보여준다. 본 발명의 방법에 유용한 더 바람직한 CLC-pKG 폴리펩티드는 질산염 음이온보다 염화물에 대해 더 높은 선택성을 갖는다.
식물 CLC 폴리펩티드는 다른 막, 예를 들면 원형질, 액포막, 엽록체 또는 골지 막에 위치하는 다른 CLC 클래스와 함께 막에 위치한다. 본 발명의 방법에 유용한 더욱 더 바람직한 CLC-pKG 폴리펩티드는 식물 세포에서 발현될 때, 골지 또는 틸라코이드 막에 위치한다.
게다가 또는 대안적으로, CLC-pKG 폴리펩티드는 본 발명의 실시예 섹션에 기재된 본 발명의 방법에 따라 벼에서 발현되었을 때, 대조구 식물에 비해 증가된 수확량 관련 형질, 특히 스트레스가 없는 조건 하에서 재배 시 종자 수확량, 수확 지수, 식물의 초장, 잎 생물량 중 임의의 하나의 증가를 갖는 식물을 제공한다.
또 다른 구현예에서 "본 발명의 방법에 유용한 단백질"은 본 발명에 정의된 HD-히드롤라아제 유사 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산 (따라서 본 발명의 방법 수행에 유용한)은 하기에 기재될 유형의 단백질을 코딩하는 임의의 핵산이며, 이후 또한 "HD-히드롤라아제 유사 핵산" 또는 "HD-히드롤라아제 유사 유전자"라고 칭한다.
본 발명에 정의된 "HD-히드롤라아제 유사 폴리펩티드"는 CRISPR 연관 단백질 Crm2 도메인 (InterPro accession IPR013407)을 포함하는 단백질을 의미한다. 바람직하게는 HD-히드롤라아제 유사 단백질은 하기 모티프의 하나 이상을 포함한다:
모티프 11 (서열번호 148): (A/G/S/Q)(R/Y/F/L)(L/F/N)H(D/S)(P/S)(A/P/L)
바람직하게는, 모티프 11은 (G/A)LLHDPA이다.
모티프 12 (서열번호 149): P(A/Q)(D/E/H)(T/Y/S)(R/I)(I/F/A/L)P(D/N)
바람직하게는, 모티프 12는 PA(D/E)TR(I/F/A/L)P(D/N)이다.
모티프 13 (서열번호 150): (T/S)(L/I/F)(G/S/N)P(V/I)Q(E/S/Q/D/R)(L/F/Y)I
바람직하게는, 모티프 13은 (T/S)(L/I/F)(G/S)P(V/I)Q(E/S)(L/F/Y)I이다.
모티프 14 (서열번호 151): D(L/F)(W/Y/F)(A/W/M/T)(G/S)S(H/Y/W/F/M)(L/I/ M)L(A/S/H)(R/Y/D)(L/F)
바람직하게는, 모티프 14는 D(L/F)(W/Y/F)(A/W/M/T)GS(H/Y/W)(L/I/M)L(A/S/ H)(R/Y)(L/F)이다.
모티프 15 (서열번호 152): (L/I/V)(F/Y/T)PXL
상기에서 X는 임의의 아미노산일 수 있으나, 바람직하게는 Q, R, E, N, S, C 또는 D 중 하나이다.
모티프 16 (서열번호 153): (L/M/F/I)PN(R/V/T)(F/I/L)
모티프 17 (서열번호 154): (M/L/G/F)DGDX(M/I)
상기에서 X는 임의의 아미노산일 수 있으나, 바람직하게는 R, Y, N, H, G, S 또는 D 중 하나이다.
바람직하게는, 모티프 17은 GDGD(G/S/D)M이다.
모티프 18(서열번호 155): (S/T/G/A)P(A/G/S/T)(R/V/L/T/I)H(L/S/Q/N/V/A) (A/L/T/G/F)(I/L/V)(S/N)(G/E/R/L)
모티프 19 (서열번호 156): G(R/K)(V/L)(L/I/V)Y(A/S)GGDD(L/V)(M/F/L)(A/T)
모티프 20 (서열번호 157): (T/S)(A/M/I/L)S(M/A/F/C/L)G(A/V/I/L)(V/T/A)I (A/V/G)(H/D)(H/Y/K)(K/Q/S)
부가적으로 또는 대안적으로, HD-히드롤라아제 유사 폴리펩티드는 하기 모티프의 하나 이상을 포함한다:
모티프 21 (서열번호 158): IKASRK(F/I/M)(L/R/K)DFWAGS(Y/W)(L/I)LHYLSA
모티프 22 (서열번호 159): L(A/L)TAGFPN
모티프 23 (서열번호 160): GLFDG(S/T/R/I)E(M/K/Q)LNA(L/T)E(L/I/T)(T/V/L) KR
모티프 24 (서열번호 161): KRMGP(A/S)TH(V/S/N)(G/A)L(N/S)RALLDFS
모티프 25 (서열번호 162): Y(S/A)GGDDV
모티프 26 (서열번호 163): LFT(M/L)G(F/K/S/Q/D)(G/C/L/A/N)A(T/S)(M/I)S (L/F)G(I/V/L)(V/T)I(V/A)(D/H)(K/H)S(V/I)PL(P/A)(V/I)ALE(A/S/N)LW(E/Q)AE
더욱 바람직하게는, HD-히드롤라아제 유사 폴리펩티드는 증가하는 순으로 선호되는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 또는 16개 모티프 모두를 포함한다.
부가적으로 또는 대안적으로, HD-히드롤라아제 유사 단백질의 상동체는 상동체 단백질이 상기에 기술된 보존된 모티프 중 임의의 하나 이상을 포함한다면, 서열번호 119로 표시된 아미노산에 대해, 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 전체 서열 동일성을 갖는다. 전체의 서열 동일성은 바람직하게는 디폴트 매개 변수 및 성숙 단백질 서열을 이용하여(즉, 분비 신호 또는 수송 펩티드를 고려하지 않고), GAP 프로그램 (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은, 전체적인 정렬 알고리즘을 이용하여 결정한다. 전체적인 서열 동일성에 비해, 서열 동일성은 일반적으로 보존된 도메인 또는 모티프만 고려되었을 때 더 높을 것이다. 바람직하게는 HD-히드롤라아제 유사 폴리펩티드의 모티프는 서열번호 148 내지 서열번호 163 (모티프 11 내지 26)으로 표시된 모티프 중 임의의 하나 이상에 대해 증가하는 순으로 선호되는, 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는다.
바람직하게는, 도 10에서 도시된 것과 같은 계통수의 구축에 이용시 상기 폴리펩티드 서열은 임의의 다른 그룹보다 서열번호 119로 표시된 아미노산 서열을 포함하는 HD-히드롤라아제 유사 폴리펩티드의 그룹과 함께 클러스터링 된다.
실시예 6 및 실시예 7에서 기술된 본 발명의 방법에 따라 벼에서 HD-히드롤라아제 유사 폴리펩티드가 발현될 때, 증가된 종자 수확량과 같은 증가된 수확량 관련 형질을 갖는 식물을 제공한다.
용어 "도메인", "시그너처" 및 "모티프"는 본원의 "정의" 섹션에서 정의된다.
SGT1 폴리펩티드에 관하여, 본 발명은 서열번호 2의 폴리펩티드 서열을 코딩하는 서열번호 1로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 SGT1 코딩 핵산 또는 SGT1 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
SGT1 폴리펩티드를 코딩하는 핵산의 예는 본 발명의 실시예 섹션의 표 10에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 섹션의 표 10에 제시된 아미노산 서열이 서열번호 2로 표시된 SGT1 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 정의 섹션에 기재된 소위 상호간 블라스트 (reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있으며; 조회 서열은 서열번호 1 또는 서열번호 2에서, 두 번째 BLAST (back-BLAST)는 고추 서열과 대조하는 것이다.
CLC-pKG 폴리펩티드에 관하여, 본 발명은 서열번호 54의 폴리펩티드 서열을 코딩하는 서열번호 53으로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 CLC-pKG 코딩 핵산 또는 CLC-pKG 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
CLC-pKG 폴리펩티드를 코딩하는 핵산의 예는 본 발명의 실시예 섹션의 표 11에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 섹션의 표 11에 제시된 아미노산 서열이 서열번호 54로 표시된 CLC-pKG 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 정의 섹션에 기재된 소위 상호간 블라스트 (reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있으며; 조회 서열은 서열번호 53 또는 서열번호 54에서, 두 번째 BLAST (back-BLAST)는 벼 서열과 대조하는 것이다.
HD-히드롤라아제 유사 폴리펩티드에 관하여, 본 발명은 서열번호 119의 폴리펩티드 서열을 코딩하는 서열번호 118로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 HD-히드롤라아제 유사 코딩 핵산 또는 HD-히드롤라아제 유사 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 예는 본 발명의 실시예 섹션의 표 12에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 섹션의 표 12에 제시된 아미노산 서열이 서열번호 119로 표시된 HD-히드롤라아제 유사 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 정의 섹션에 기재된 소위 상호간 블라스트 (reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있으며; 조회 서열은 서열번호 118 또는 서열번호 119에서, 두 번째 BLAST (back-BLAST)는 시네코시스티스 서열과 대조하는 것이다.
핵산 변이체도 본 발명의 방법의 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 섹션의 표 10 내지 표 12에 제시된 아미노산 서열 중 임의의 하나의 상동체 및 유도체를 코딩하는 핵산을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 본 발명의 방법에는 실시예 섹션의 표 10 내지 표 12에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 코딩하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다. 본 발명의 방법 수행에 유용한 추가의 변이체는 코돈 사용 빈도가 최적화된 또는 miRNA 표적 위치가 제거된 변이체이다.
본 발명의 방법의 수행에 유용한 또 다른 핵산 변이체는 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 일부, SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산에 혼성화하는 핵산, SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 스플라이스 변이체, SGT1 폴리펩티드를 코딩하는 핵산의 대립인자 변이체 및 유전자 셔플링에 의해 얻은 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 변이체를 포함한다. 용어 혼성화하는 서열, 스플라이스 변이체, 대립인자 변이체 및 유전자 셔플링은 본 발명에 기재되어있다.
본 발명의 방법의 수행은 전체 길이 핵산 서열의 사용에 의존하지 않으므로, SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산은 전체 길이의 핵산일 필요는 없다. 본 발명에서는, 실시예 섹션의 표 10 내지 표 12에 제시된 핵산 서열 중 임의의 하나의 일부를 식물에 도입 및 발현, 또는 실시예 섹션의 표 10 내지 표 12에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 핵산의 일부를 식물에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산의 일부분은 예를 들면, 핵산에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 코딩 (또는 비코딩) 서열에 융합될 수도 있다. 다른 코딩 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.
SGT1 폴리펩티드에 관하여, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 SGT1 폴리펩티드를 코딩하며, 실시예 섹션의 표 10에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 섹션의 표 10에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 섹션의 표 10에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 섹션의 표 10에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 섹션의 표 10에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 1의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2로 표시된 아미노산 서열을 포함하는 SGT1 폴리펩티드 그룹과 함께 클러스터링되는 아미노산 서열의 단편을 코딩한다.
CLC-pKG 폴리펩티드에 관하여, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 CLC-pKG 폴리펩티드를 코딩하며, 실시예 섹션의 표 11에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 섹션의 표 11에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 섹션의 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 100, 200, 300, 400, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 섹션의 표 11에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 섹션의 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 53의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 Marmagne 등 (2007)의 도 1 (본 발명에서 원용에 의해 포함되는)에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 음이온 그룹보다 세균 유래의 CLC 폴리펩티드의 그룹과 함께, 바람직하게는 시네코시스티스 sp. 유래의 SCLC (P74477)과 함께; 또는 AtCLCe 및 AtCLCf를 포함하는 식물 유래의 그룹과 함께 클러스터링되는 아미노산 서열의 단편을 코딩한다.
HD-히드롤라아제 유사 폴리펩티드에 관하여, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 HD-히드롤라아제 유사 폴리펩티드를 코딩하며, 실시예 섹션의 표 12에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 섹션의 표 12에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 섹션의 표 12에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 섹션의 표 12에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 섹션의 표 12에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 118의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 도 10에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 119로 표시된 아미노산 서열을 포함하는 HD-히드롤라아제 유사 폴리펩티드 그룹과 함께 클러스터링되고/되거나, 상기에 정의된 모티프 11 내지 모티프 26의 임의의 하나 이상을 포함하는 아미노산 서열의 단편을 코딩한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건 하에서, 바람직하게는 스트린전트 조건 하에서, 본 발명에서 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산이다.
본 발명에 따라, 실시예 섹션의 표 10 내지 표 12에 제시된 핵산 중 임의의 하나와 혼성화가 가능한 핵산의 식물에의 도입 및 발현, 또는 실시예 섹션의 표 10 내지 표 12에 제시된 임의의 핵산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산과 혼성화가 가능한 핵산의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
SGT1 폴리펩티드에 관하여, 본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 SGT1 폴리펩티드를 코딩하며, 실시예 섹션의 표 10에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 섹션의 표 10에 제시된 핵산 중의 임의의 하나의 상보적인 가닥에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 섹션의 표 10에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 상보적인 가닥에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 1로 표시된 핵산의 상보적인 가닥에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 실질적으로 전체 길이 및 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2로 표시된 아미노산 서열을 포함하는 SGT1 폴리펩티드 그룹과 함께 클러스터링되는 아미노산 서열의 폴리펩티드를 코딩한다.
CLC-pKG 폴리펩티드에 관하여, 본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 CLC-pKG 폴리펩티드를 코딩하며, 실시예 섹션의 표 11에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 섹션의 표 11에 제시된 핵산 중의 임의의 하나의 상보적인 가닥에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 섹션의 표 11에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 상보적인 가닥에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 53으로 표시된 핵산의 상보적인 가닥에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 전체 길이 및 Marmagne 등 (2007)의 도 1 (본 발명에서 원용에 의해 포함되는)에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 음이온 그룹보다 세균 유래의 CLC 폴리펩티드의 그룹과 함께, 바람직하게는 시네코시스티스 sp. 유래의 SCLC (P74477)과 함께; 또는 AtCLCe 및 AtCLCf를 포함하는 식물 유래의 그룹과 함께 클러스터링되는 아미노산 서열의 폴리펩티드를 코딩한다.
HD-히드롤라아제 유사 폴리펩티드에 관하여, 본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 HD-히드롤라아제 유사 폴리펩티드를 코딩하며, 실시예 섹션의 표 12에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 섹션의 표 12에 제시된 핵산 중의 임의의 하나의 상보적인 가닥에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 섹션의 표 12에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 상보적인 가닥에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 118으로 표시된 핵산의 상보적인 가닥에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 전체 길이 및 도 10에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 119로 표시된 아미노산 서열을 포함하는 HD-히드롤라아제 유사 폴리펩티드 그룹과 함께 클러스터링되고/되거나, 상기에 정의된 모티프 11 내지 모티프 26의 임의의 하나 이상을 포함하는 아미노산 서열의 폴리펩티드를 코딩한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 상기 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 스플라이스 변이체이며, 스플라이스 변이체는 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 10 내지 표 12에 제시된 핵산 서열의 임의의 하나의 스플라이스 변이체의 식물에의 도입 및 발현, 또는 실시예 섹션의 표 10 내지 표 12에 제시된 임의의 아미노산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산의 스플라이스 변이체의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
SGT1 폴리펩티드에 관하여, 바람직한 스플라이스 변이체는 서열번호 1로 표시된 핵산의 스플라이스 변이체, 또는 서열번호 2의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 스플라이스 변이체이다. 바람직하게는, 상기 스플라이스 변이체에 의해 코딩된 아미노산 서열은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2로 표시된 아미노산 서열을 포함하는 SGT1 폴리펩티드 그룹과 함께 클러스터링된다.
CLC-pKG 폴리펩티드에 관하여, 바람직한 스플라이스 변이체는 서열번호 53으로 표시된 핵산의 스플라이스 변이체, 또는 서열번호 54의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 스플라이스 변이체이다. 바람직하게는, 상기 스플라이스 변이체에 의해 코딩된 아미노산 서열은 Marmagne 등 (2007)의 도 1 (본 발명에서 원용에 의해 포함되는)에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 음이온 그룹보다 세균 유래의 CLC 폴리펩티드의 그룹과 함께, 바람직하게는 시네코시스티스 sp. 유래의 SCLC (P74477)와 함께; 또는 AtCLCe 및 AtCLCf를 포함하는 식물 유래의 그룹과 함께 클러스터링된다.
HD-히드롤라아제 유사 폴리펩티드에 관하여, 바람직한 스플라이스 변이체는 서열번호 118로 표시된 핵산의 스플라이스 변이체, 또는 서열번호 119의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 스플라이스 변이체이다. 바람직하게는, 상기 스플라이스 변이체에 의해 코딩된 아미노산 서열은 도 10에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 119로 표시된 아미노산 서열을 포함하는 HD-히드롤라아제 유사 폴리펩티드 그룹과 함께 클러스터링되고/되거나 상기에 정의된 모티프 11 내지 모티프 26의 임의의 하나 이상을 포함한다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 상기 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 대립인자 변이체이며, 대립인자 변이체는 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 10 내지 표 12에 제시된 핵산의 임의의 하나의 대립인자 변이체의 식물에의 도입 및 발현, 또는 실시예 섹션의 표 10 내지 표 12에 제시된 임의의 아미노산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산의 대립인자 변이체의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
SGT1 폴리펩티드에 관하여, 본 발명의 방법에 유용한 대립인자 변이체에 의해 코딩된 폴리펩티드는 서열번호 2의 SGT1 폴리펩티드 및 실시예 섹션의 표 10에 도시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기의 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 1의 대립인자 변이체 또는 서열번호 2의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 대립인자 변이체이다. 바람직하게는, 상기 대립인자 변이체에 의해 코딩된 아미노산 서열은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2로 표시된 아미노산 서열을 포함하는 SGT1 폴리펩티드와 함께 클러스터링된다.
CLC-pKG 폴리펩티드에 관하여, 본 발명의 방법에 유용한 대립인자 변이체에 의해 코딩된 폴리펩티드는 서열번호 54의 CLC-pKG 폴리펩티드 및 실시예 섹션의 표 11에 도시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기의 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 53의 대립인자 변이체 또는 서열번호 54의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 대립인자 변이체이다. 바람직하게는, 상기 대립인자 변이체에 의해 코딩된 아미노산 서열은 Marmagne 등 (2007)의 도 1 (본 발명에서 원용에 의해 포함되는)에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 음이온 그룹보다 세균 유래의 CLC 폴리펩티드의 그룹과 함께, 바람직하게는 시네코시스티스 sp. 유래의 SCLC (P74477)와 함께; 또는 AtCLCe 및 AtCLCf를 포함하는 식물 유래의 그룹과 함께 클러스터링된다.
HD-히드롤라아제 유사 폴리펩티드에 관하여, 본 발명의 방법에 유용한 대립인자 변이체에 의해 코딩된 폴리펩티드는 서열번호 119의 HD-히드롤라아제 유사 폴리펩티드 및 실시예 섹션의 표 12에 도시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기의 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 118의 대립인자 변이체 또는 서열번호 119의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 대립인자 변이체이다. 바람직하게는, 상기 대립인자 변이체에 의해 코딩된 아미노산 서열은 도 10에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 119로 표시된 아미노산 서열을 포함하는 HD-히드롤라아제 유사 폴리펩티드 그룹과 함께 클러스터링되고/되거나 상기에 정의된 모티프 11 내지 모티프 26의 임의의 하나 이상을 포함한다.
유전자 셔플링 또는 방향진화는 또한 상기에 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 10 내지 표 12에 제시된 핵산 서열 중 임의의 하나의 변이체의 식물에의 도입 및 발현, 또는 실시예 섹션의 표 10 내지 표 12에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 핵산 변이체의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체 핵산은 유전자 셔플링으로 얻어진다.
SGT1 폴리펩티드에 관하여, 바람직하게는 유전자 셔플링으로 얻어진 변이체 핵산에 의해 코딩된 아미노산 서열은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2로 표시된 아미노산 서열을 포함하는 SGT1 폴리펩티드 그룹과 함께 클러스터링된다.
CLC-pKG 폴리펩티드에 관하여, 바람직하게는 유전자 셔플링으로 얻어진 변이체 핵산에 의해 코딩된 아미노산 서열은 Marmagne 등 (2007)의 도 1 (본 발명에서 원용에 의해 포함되는)에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 음이온 그룹보다 세균 유래의 CLC 폴리펩티드의 그룹과 함께, 바람직하게는 시네코시스티스 sp. 유래의 SCLC (P74477)와 함께; 또는 AtCLCe 및 AtCLCf를 포함하는 식물 유래의 그룹과 함께 클러스터링된다.
HD-히드롤라아제 유사 폴리펩티드에 관하여, 바람직하게는 유전자 셔플링으로 얻어진 변이체 핵산에 의해 코딩된 아미노산 서열은 도 10에서 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 119로 표시된 아미노산 서열을 포함하는 HD-히드롤라아제 유사 폴리펩티드 그룹과 함께 클러스터링되고/되거나 상기에 정의된 모티프 11 내지 모티프 26의 임의의 하나 이상을 포함한다.
더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이를 유발하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biology. Wiley Eds).
SGT1 폴리펩티드를 코딩하는 핵산은 임의의 자연적 또는 인공적인 출처로부터 유래될 수 있다. 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 SGT1 폴리펩티드 코딩 핵산은 식물로부터, 더 바람직하게는 고추류 (pepper)로부터, 가장 바람직하게는 핵산은 고추 (Capsicum annuum)로부터 유래한다.
CLC-pKG 폴리펩티드를 코딩하는 핵산은 임의의 자연적 또는 인공적인 출처로부터 유래될 수 있다. 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 CLC-pKG 폴리펩티드 코딩 핵산은 남세균 기원으로부터, 더 바람직하게는 시네코시스티스 종으로부터, 가장 바람직하게는 시네코시스티스 sp. PCC 6803으로부터 유래한다.
HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산은 임의의 자연적 또는 인공적인 출처로부터 유래할 수 있다. 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 HD-히드롤라아제 유사 폴리펩티드 코딩 핵산은 식물 또는 세균으로부터, 더 바람직하게는 남조식물문 (cyanophyte)으로부터, 더욱 바람직하게는 소구균과 (family Chroococcaceae)으로부터, 가장 바람직하게는 핵산은 시네코시스티스 sp. 유래이다.
본 발명의 방법의 수행은 향상된 수확량 관련 형질을 갖는 식물을 제공한다. 특히, 본 발명의 방법의 수행은 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 상세하게 기재되어 있다.
본 발명에서 향상된 수확량 관련 형질에 대한 기준은 (수확 가능한) 지상부 및/또는 (수확 가능한) 지하부를 포함하여 초기 활력 및/또는 하나 이상의 식물체의 일부분의 생물량 (중량)의 증가를 의미한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 갖는 식물이 된다.
본 발명은 대조구 식물에 비하여 수확량 관련 형질, 특히 식물의 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명에 따른 형질전환 식물은 수확량 및/또는 수확량 관련 형질이 증가하므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 (생활사 중 적어도 일부에서) 증가된 생장 속도를 나타낼 것이다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키는 방법을 제공하며, 상기 방법은 본 발명에 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현의 조절을 포함한다.
본 발명의 방법의 수행은 동등한 조건하에서 자란 대조구 식물에 비해 스트레스가 없는 조건 또는 순한 가뭄 조건하에서 자란 식물에서 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 스트레스가 없는 조건 또는 순한 가뭄 조건하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 양분결핍 조건 하에서, 특히 질소 결핍 조건 하에서 자란 식물이 동등한 조건하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 양분 결핍 조건하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 염분 스트레스 조건 하에서 자란 식물이 동등한 조건하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 염분 스트레스 조건하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명은 또한 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에의 도입 및/또는 발현을 용이하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(a) 상기 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산;
(b) (a)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(c) 전사 종결 서열.
바람직하게는, SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산은 상기에 정의된 바와 같다. 용어 "조절 서열" 및 "종결 서열"은 본 발명에서 정의된 바와 같다.
식물은 상기 기재된 임의의 핵산을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 주지하고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다.
SGT1 폴리펩티드에 관하여, 유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있으나, 바람직하게는 프로모터는 식물 유래이다. 뿌리 특이적 프로모터가 본 발명의 방법에 특히 유용하다. 뿌리 특이적 프로모터는 바람직하게는 RCc3 프로모터 (Plant Mol Biol. 1995 Jan;27(2):23748), 더 바람직하게는 벼 유래의 RCc3 프로모터, 더욱 바람직하게는 서열번호 50과 실질적으로 유사한 핵산 서열로 표시된 RCc3 프로모터, 가장 바람직하게는 서열번호 50으로 표시된 프로모터이다. 또한 본 발명의 방법 수행에 사용될 수 있는 다른 뿌리 특이적 프로모터의 예는 상기 "정의" 섹션의 표 3에 나타내었다.
CLC-pKG 폴리펩티드에 관하여, 유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있으나, 바람직하게는 프로모터는 식물 유래이다. 뿌리 특이적 프로모터가 본 발명의 방법에 특히 유용하다. 바람직하게는 뿌리 특이적 프로모터는 뿌리 내에서 편재 (ubiquitous)한다. 또한 본 발명의 방법에 유용한 프로모터는 항시성 (constitutive) 프로모터이다. 바람직하게는 항시성 프로모터는 중간 강도의 편재하는 항시성 프로모터이다. 본 발명의 "정의" 섹션에서 다양한 프로모터 유형에 대해 참고한다.
HD-히드롤라아제 유사 폴리펩티드에 관하여, 유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있으나, 바람직하게는 프로모터는 식물 유래이다. 항시성 프로모터가 본 발명의 방법에 특히 유용하다. 바람직하게는 항시성 프로모터는 중간 강도의 편재하는 항시성 프로모터이다. 본 발명의 "정의" 섹션에서 다양한 프로모터 유형에 대해 참고한다.
SGT1 폴리펩티드에 관하여, 본 발명의 적용은 서열번호 1로 표시된 SGT1 폴리펩티드 코딩 핵산에 제한되지 않으며, 본 발명의 적용은 뿌리 특이적 프로모터에 의해 추진될 때 SGT1 폴리펩티드 코딩 핵산의 발현에 제한되지 않는다는 것은 명백하다.
선택적으로, 하나 이상의 종결 서열이 식물에 도입된 구축물에 사용될 수 있다. 바람직하게는, 구축물은 서열번호 50에 실질적으로 유사한 RCc3 프로모터 및 SGT1 폴리펩티드를 코딩하는 핵산을 포함하는 발현 카세트를 포함한다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문서화되어있으며, 정의 섹션에 예가 제시되어 있다.
CLC-pKG 폴리펩티드에 관하여, 본 발명의 적용은 서열번호 53으로 표시된 CLC-pKG 폴리펩티드 코딩 핵산에 제한되지 않으며, 본 발명의 적용은 뿌리 특이적 프로모터에 의해 추진될 때, 또는 항시성 프로모터에 의해 추진될 때, CLC-pKG 폴리펩티드 코딩 핵산의 발현에 제한되지 않는다는 것은 명백하다.
항시성 프로모터는 바람직하게는 중간 강도의 항시성 프로모터이며, 더 바람직하게는 GOS2 프로모터와 같은 식물 유래의 프로모터로부터 선택되며, 더욱 바람직하게는 벼의 GOS2 프로모터이다.
본 발명의 다른 바람직한 특징에 따라, CLC-pKG 폴리펩티드를 코딩하는 핵산은 뿌리 특이적 프로모터에 작동가능하게 연결되어 있다. 뿌리 특이적 프로모터는 바람직하게는 RCc3 프로모터 (Plant Mol Biol. 1995 Jan;27(2):237-48)이며, 더 바람직하게는 RCc3 프로모터는 벼 유래이고, 더욱 바람직하게는 RCc3 프로모터는 서열번호 115에 실질적으로 유사한 핵산 서열로 나타내었으며, 가장 바람직하게는 상기 프로모터는 서열번호 115로 나타낸 것이다. 본 발명의 방법을 수행하기 위해 사용될 수 있는 다른 뿌리 특이적 프로모터의 예는 상기 "정의" 섹션의 표 3에 제시하였다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문서화되어있으며, 정의 섹션에 예가 제시되어 있다.
HD-히드롤라아제 유사 폴리펩티드에 관하여, 본 발명의 적용은 서열번호 118로 표시된 HD-히드롤라아제 유사 폴리펩티드 코딩 핵산에 제한되지 않으며, 본 발명의 적용은 항시성 프로모터에 의해 추진될 때, HD-히드롤라아제 유사 폴리펩티드 코딩 핵산의 발현에 제한되지 않는다는 것은 명백하다.
항시성 프로모터는 바람직하게는 GOS2 프로모터와 같은 식물 유래의 중간 강도 프로모터이며, 더욱 바람직하게는 벼 유래의 GOS2 프로모터이다. 더욱 바람직하게는 항시성 프로모터는 서열번호 164에 실질적으로 유사한 핵산 서열로 나타내었으며, 가장 바람직하게는 항시성 프로모터는 서열번호 164로 나타낸 것이다. 항시성 프로모터의 추가적인 예는 본 발명의 "정의" 섹션을 참고한다.
선택적으로, 하나 이상의 종결 서열이 식물에 도입된 구축물에 사용될 수 있다. 바람직하게는, 구축물은 서열번호 164에 실질적으로 유사한 GOS2 프로모터 및 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산을 포함하는 발현 카세트를 포함한다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산, 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문서화되어있으며, 정의 섹션에 예가 제시되어 있다.
상기 언급된 바와 같이, SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 발현을 조절하는 바람직한 방법은 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현이다; 그러나 상기 방법의 수행 효과 즉, 수확량 관련 형질을 향상시키는 효과는 T-DNA 활성화 태깅, 틸링(TILLING), 상동 재조합을 포함하여 다른 잘 알려진 기술을 사용하여 행해질 수도 있으나, 이에 제한되지 않는다. 상기 기술의 설명은 정의 섹션에 기재되어 있다.
본 발명은 또한 상기에서 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 임의의 핵산의 식물로의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 형질전환 식물을 생산하는 방법을 제공한다.
더욱 상세하게, 본 발명은 하기 단계를 포함하는 증가된 수확량 관련 형질, 특히 증가된 (종자) 수확량을 갖는 형질전환 식물을 생산하는 방법을 제공한다:
(i) SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산을 식물 또는 식물 세포로 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건하에서 식물 세포를 배양하는 단계.
상기 (i)의 핵산은 본 발명에서 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩할 수 있는 임의의 핵산일 수 있다.
상기 핵산은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 핵산은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그의 부분 (종자 포함)을 포함한다. 식물 또는 그의 일부는 상기에 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산 외래유전자 (transgene)를 포함한다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 분리된 핵산을 함유하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 본 발명에 따른 방법에서 사용된 핵산 또는 벡터에 대한 숙주 식물, 발현 카세트 (cassette) 또는 구축물 또는 벡터는 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에 적용될 수 있다. 본 발명의 방법에 특히 유용한 식물은 비리디플란태 (Viridiplantae) 수퍼패밀리에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다. 본 발명의 바람직한 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 대두, 해바라기, 캐놀라, 알팔파, 유채, 아마, 목화, 토마토, 감자 및 담배를 포함한다. 더욱 바람직하게는, 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다. 더욱 바람직하게는 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 뿌리, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이 부분에 제한되지는 않으며, 상기의 수확가능한 부분은 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 포함하는 재조합 핵산을 포함한다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 상기 식물의 수확 가능한 부분으로부터 바람직하게는 직접적으로 유래된 생산물에 관련된다.
본 발명은 또한 본 발명에 기재된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 용도, 및 식물에서 앞서 언급한 임의의 수확량 관련 형질을 향상시키는 상기 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드의 용도를 포함한다. 예를 들면, 본 발명에서 기재된 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산 또는 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드 그 자체는 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 유전자에 유전적으로 연결될 수 있는 DNA 마커가 동정된 육종 프로그램에서 용도를 찾을 수 있다. 핵산/유전자, 또는 SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드는 분자 마커를 정의하는데 사용될 수 있다. 이 DNA 또는 단백질 마커는 상기 본 발명의 방법에 정의된 향상된 수확량 관련 형질을 갖는 식물을 선발하는 육종 프로그램에서 사용될 수 있다. 게다가, SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산/유전자의 대립인자 변이체는 마커 보조 육종 프로그램에서 용도를 찾을 수 있다. SGT1 폴리펩티드, 또는 CLC-pKG 폴리펩티드, 또는 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산은 또한 이 유전자의 일부에 대한 유전자지도 및 물리지도 제작용 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다.
조항
1. SGT1 폴리펩티드
하나의 양상에서, 본 발명은 하기의 임의의 조항에 의해 규명된다.
1. SGT1 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법으로서, 상기 SGT1 폴리펩티드는 임의의 순서의 하기를 포함하는 것을 특징으로 하는 방법:
(i) 하나 이상의 테트라트리코펩티드 반복서열(TPR);
(ii) 하나 이상의 CS 도메인; 및
(iii) SGS 도메인.
2. 조항 1에 있어서, 상기 조절된 발현은 SGT1 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
3. 조항 1 또는 조항 2에 있어서, 상기 SGT1 폴리펩티드를 코딩하는 핵산은 표 10에 열거된 단백질 중 어느 하나를 코딩하거나, 상기 핵산의 일부이거나, 또는 상기 핵산과 혼성화가 가능한 핵산인 것을 특징으로 하는 방법.
4. 조항 1 내지 조항 3 중 어느 한 조항에 있어서, 상기 핵산 서열은 표 10에 제시된 임의의 단백질의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 것을 특징으로 하는 방법.
5. 조항 1 내지 조항 4 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비해 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
6. 조항 1 내지 조항 5 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건하에서 얻어지는 것을 특징으로 하는 방법.
7. 조항 2 내지 조항 6 중 어느 한 조항에 있어서, 상기 핵산은 뿌리 특이적 프로모터에, 바람직하게는 RCc3 프로모터에, 가장 바람직하게는 벼 유래의 RCc3 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
8. 조항 1 내지 조항 7 중 어느 한 조항에 있어서, 상기 SGT1 폴리펩티드를 코딩하는 핵산은 식물 유래, 바람직하게는 고추(Capsicum annuum) 쌍자엽 식물 유래, 더 바람직하게는 가지과(family Solanaceae) 유래, 더욱 바람직하게는 고추속(genus Capsicum) 유래, 가장 바람직하게는 고추(Capsicum annuum) 유래인 것을 특징으로 하는 방법.
9. SGT1 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 조항 1 내지 조항 8 중 어느 한 조항의 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.
10. 하기를 포함하는 유전자 구축물(construct):
(i) 조항 1에 정의된 SGT1 폴리펩티드를 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
11. 조항 10에 있어서, 상기 하나 이상의 조절 서열은 뿌리 특이적 프로모터, 바람직하게는 RCc3 프로모터, 가장 바람직하게는 벼 유래의 RCc3 프로모터인 것을 특징으로 하는 유전자 구축물.
12. 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물을 생산하는 방법에 대한 조항 10 또는 조항 11에 따른 유전자 구축물의 용도.
13. 조항 10 또는 조항 11에 따른 유전자 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
14. 하기 단계를 포함하는, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 조항 1에서 정의된 SGT1 폴리펩티드를 코딩하는 핵산을 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포를 배양하는 단계.
15. 조항 1에서 정의된 SGT1 폴리펩티드를 코딩하는 핵산의 조절된 발현으로 인하여, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래한 형질전환 식물 세포.
16. 조항 9, 조항 13 또는 조항 15에 있어서, 상기 식물은 작물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래한 형질전환 식물 세포.
17. 수확 가능한 부분이 바람직하게는 줄기 생물량 및/또는 종자인 것을 특징으로 하는, 조항 16에 따른 식물의 수확 가능한 부분.
18. 조항 16에 따른 식물 및/또는 조항 17에 따른 식물의 수확 가능한 부분 유래의 산물.
19. 대조구 식물에 비하여 수확량 증가, 특히 종자 수확량을 증가시키기 위한 SGT1 폴리펩티드를 코딩하는 핵산의 용도.
20. 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물에 대한 분자 마커로서 SGT1 폴리펩티드를 코딩하는 핵산의 용도.
2. CLC - pKG 폴리펩티드
또 다른 양상에서, 본 발명의 하기의 임의의 조항에 의해 규명된다.
1. CLC-pKG 폴리펩티드가 Voltage_CLC 도메인 (Pfam entry PF00654) 및 CBS 도메인 (Pfam entry PF00571) 및 선택적으로 USP 도메인 (PF00582)을 포함하는 것을 특징으로 하는, CLC-pKG 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.
2. 조항 1에 있어서, 상기 CLC-pKG 폴리펩티드는 하기 도메인에 대해 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100 % 서열 동일성을 갖는 도메인을 포함하는 것을 특징으로 하는 방법:
(i) 서열번호 54의 아미노산 77번 내지 422번 사이에 위치한 서열로 표시된 서열번호 54에서 CLC;
(ii) 서열번호 54의 아미노산 455번 내지 510번 사이 또는 516번 내지 571번 사이에 위치한 서열로 표시된 서열번호 54에서 CBS 도메인; 및 선택적으로
(iii) 서열번호 54의 아미노산 597번 내지 731번 사이에 위치한 서열로 표시된 서열번호 54에서 USP 도메인.
3. 조항 1 또는 조항 2에 있어서, 상기 조절된 발현은 CLC-pKG 폴리펩티드를 코딩하는 핵산을 포함하는 유전자 구축물의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
4. 조항 1 내지 조항 3 중 어느 한 조항에 있어서, 상기 CLC-pKG 폴리펩티드를 코딩하는 핵산은 표 11에 열거된 단백질 중 어느 하나를 코딩하거나, 상기 핵산의 일부이거나, 또는 상기 핵산과 혼성화가 가능한 핵산인 것을 특징으로 하는 방법.
5. 조항 1 내지 조항 4 중 어느 한 조항에 있어서, 상기 핵산은 표 11에 제시된 임의의 단백질의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 것을 특징으로 하는 방법.
6. 조항 1 내지 조항 5 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비해 증가된 수확량, 바람직하게는 증가된 생물량 및/또는 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
7. 조항 1 내지 조항 6 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건하 또는 가뭄 스트레스 또는 염분 스트레스 조건하에서 얻어지는 것을 특징으로 하는 방법.
8. 조항 3 내지 조항 7 중 어느 한 조항에 있어서, 상기 핵산은 항시성 프로모터에, 바람직하게는 RCc3 프로모터에, 가장 바람직하게는 벼 유래의 RCc3 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
9. 조항 1 내지 조항 8 중 어느 한 조항에 있어서, 상기 CLC-pKG 폴리펩티드를 코딩하는 핵산은 시아노박테리아 유래, 더 바람직하게는 시네코시스티스 (Synechosystis) 종 유래, 더욱 바람직하게는 시네코시스티스 종 PCC 6803 유래인 것을 특징으로 하는 방법.
10. CLC-pKG 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 조항 1 내지 조항 9 중 어느 한 조항의 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.
11. 하기를 포함하는 유전자 구축물(construct):
(i) 조항 1 또는 조항 2에 정의된 CLC-pKG 폴리펩티드를 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
12. 조항 11에 있어서, 상기 하나 이상의 조절 서열은 항시성 프로모터, 바람직하게는 RCc3 프로모터, 가장 바람직하게는 벼 유래의 RCc3 프로모터인 것을 특징으로 하는 유전자 구축물.
13. 대조구 식물에 비해 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 가진 식물을 생산하는 방법에 대한 조항 11 또는 조항 12에 따른 유전자 구축물의 용도.
14. 조항 11 또는 조항 12에 따른 유전자 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
15. 하기 단계를 포함하는, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 조항 1 또는 조항 2에서 정의된 CLC-pKG 폴리펩티드를 코딩하는 핵산을 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포를 배양하는 단계.
16. 조항 1 또는 조항 2에서 정의된 CLC-pKG 폴리펩티드를 코딩하는 재조합 핵산의 조절된 발현으로 인하여, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래한 형질전환 식물 세포.
17. 조항 10, 조항 14, 또는 조항 16에 있어서, 상기 식물은 작물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래한 형질전환 식물 세포.
18. 수확 가능한 부분이 바람직하게는 줄기 생물량 및/또는 종자인 것을 특징으로 하는, 조항 17에 따른 식물의 수확 가능한 부분.
19. 조항 17에 따른 식물 및/또는 조항 18에 따른 식물의 수확 가능한 부분 유래의 산물.
20. 대조구 식물에 비하여 식물에서 수확량 증가, 특히 종자 수확량 및/또는 줄기 생물량을 증가시키기 위한 CLC-pKG 폴리펩티드를 코딩하는 핵산을 포함하는 유전자 구축물의 용도.
3. HD - 히드롤라아제 유사 폴리펩티드
또 다른 양상에서, 본 발명의 하기의 임의의 조항에 의해 규명된다.
1. HD-히드롤라아제 유사 (HD-hydrolase-like) 폴리펩티드가 CRISPR-연관 (associated) 단백질 Crm2 도메인을 포함하는 것을 특징으로 하는, HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.
2. 조항 1에 있어서, 상기 HD-히드롤라아제 유사 폴리펩티드는 모티프 11 내지 26 중 하나 이상을 포함하는 것을 특징으로 하는 방법.
3. 조항 1 또는 조항 2에 있어서, 상기 조절된 발현은 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
4. 조항 1 내지 조항 3 중 어느 한 조항에 있어서, 상기 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산은 표 12에 열거된 단백질 중 어느 하나를 코딩하거나, 상기 핵산의 일부이거나, 또는 상기 핵산과 혼성화가 가능한 핵산인 것을 특징으로 하는 방법.
5. 조항 1 내지 조항 4 중 어느 한 조항에 있어서, 상기 핵산 서열은 표 12에 제시된 임의의 단백질의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 것을 특징으로 하는 방법.
6. 조항 1 내지 조항 5 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비해 증가된 수확량, 바람직하게는 증가된 생물량 및/또는 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
7. 조항 1 내지 조항 6 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건하에서 얻어지는 것을 특징으로 하는 방법.
8. 조항 3 내지 조항 7 중 어느 한 조항에 있어서, 상기 핵산은 항시성 프로모터에, 바람직하게는 GOS2 프로모터에, 가장 바람직하게는 벼 유래의 GOS2 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
9. 조항 1 내지 조항 8 중 어느 한 조항에 있어서, 상기 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산은 식물 유래, 바람직하게는 남조식물문 (cyanophyte), 더 바람직하게는 소구균과 (family Chroococcaceae), 더욱 바람직하게는 남세균속 (genus Synechocystis) 유래인 것을 특징으로 하는 방법.
10. HD-히드롤라아제 유사 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 조항 1 내지 조항 9 중 어느 한 조항의 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.
11. 하기를 포함하는 유전자 구축물 (construct):
(i) 조항 1 또는 조항 2에 정의된 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
12. 조항 11에 있어서, 상기 하나 이상의 조절 서열은 항시성 프로모터, 바람직하게는 GOS2 프로모터, 가장 바람직하게는 벼 유래의 GOS2 프로모터인 것을 특징으로 하는 유전자 구축물.
13. 대조구 식물에 비해 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 가진 식물을 생산하는 방법에 대한 조항 11 또는 조항 12에 따른 유전자 구축물의 용도.
14. 조항 11 또는 조항 12에 따른 유전자 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
15. 하기 단계를 포함하는, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 조항 1 또는 조항 2에서 정의된 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산을 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포를 배양하는 단계.
16. 조항 1 또는 조항 2에서 정의된 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 조절된 발현으로 인하여, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래한 형질전환 식물 세포.
17. 조항 10, 조항 14, 또는 조항 16에 있어서, 상기 식물은 작물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래한 형질전환 식물 세포.
18. 수확 가능한 부분이 바람직하게는 줄기 생물량 및/또는 종자인 것을 특징으로 하는, 조항 17에 따른 식물의 수확 가능한 부분.
19. 조항 17에 따른 식물 및/또는 조항 18에 따른 식물의 수확 가능한 부분 유래의 산물.
20. 대조구 식물에 비하여 식물에서 수확량 증가, 특히 종자 수확량 및/또는 줄기 생물량을 증가시키기 위한 HD-히드롤라아제 유사 폴리펩티드를 코딩하는 핵산의 용도.
도 1은 다양한 SGT1 폴리펩티드의 다중 정렬을 나타낸다. 폴리펩티드 서열의 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: Gonnet, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW 2.0 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. SGT1 폴리펩티드는 도 2에 정렬되었다.
도 2는 SGT1 폴리펩티드에 공통된 보존된 도메인을 강조한 추가의 정렬을 나타낸다.
도 3은 NTI 벡터 (Invitrogen)로부터 AlignX 프로그램에 제공된 neighbor-joining 클러스터링 알고리즘을 사용하여 구축된 SGT1 폴리펩티드의 계통수를 나타낸다.
도 4는 벼 RCc3 프로모터 (pRCc3)의 조절 하에서 SGT1 코딩 핵산의 벼 (Oryza sativa)에서의 증가된 발현을 위해 사용된 바이너리 (binary) 벡터를 나타낸다.
도 5는 다양한 CLC-pKG 폴리펩티드의 다중 정렬을 나타낸다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프를 정의하는데 이용될 수 있다.
도 6은 CLC-pKG 폴리펩티드의 계통수를 나타낸다.
도 7은 벼 RCc3 프로모터 (pRCc3)의 조절 하에서 CLC-pKG 코딩 핵산의 벼 (Oryza sativa)에서의 증가된 발현을 위해 사용된 바이너리 (binary) 벡터를 나타낸다.
도 8은 밑줄 그어진 및 숫자로 표시된 보존된 모티프 11 내지 26과 서열번호 119의 도메인 구조를 나타낸다. CRISPR-연관 단백질 Crm2 (IPR013407) 도메인은 굵은 글씨로 나타내었다.
도 9는 다양한 HD-히드롤라아제 유사 폴리펩티드의 다중 정렬을 나타낸다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프를 정의하는데 이용될 수 있다.
도 10은 HD-히드롤라아제 유사 폴리펩티드의 계통수를 나타낸다. 식별자는 서열 목록에서 단백질에 대해 제공된 등록 번호이다.
도 11은 벼 GOS2 프로모터 (pGOS2)의 조절 하에서 HD-히드롤라아제 유사 코딩 핵산의 벼 (Oryza sativa)에서의 증가된 발현을 위해 사용된 바이너리 (binary) 벡터를 나타낸다.
실시예
본 발명은 단지 예시인 하기 실시예를 참고하여 기재될 것이다. 하기 실시예는 본 발명의 범위를 완전히 한정하거나 제한할 의도는 아니다.
DNA 조작: 달리 언급되지 않는 한, 재조합 DNA 기술은 Sambrook (2001, Molecular Cloning: laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) 또는 Ausubel 등 (1994, Current Protocols in Molecular Biology, Current Protocols의 Volumes 1 및 2)에 기재된 표준 프로토콜에 따라 수행되었다. 식물 분자작업에 대한 표준 재료 및 방법은 Plant Molecular Biology Labfax (1993, by R.D.D. Croy, published by BIOS Scientific Publications Ltd (UK) 및 Blackwell Scientific Publications (UK))에 기재되어 있다.
실시예 1: 본 발명의 방법에 사용된 핵산 서열에 연관된 서열의 동정
1. SGT1 폴리펩티드
서열번호 1 및 서열번호 2에 연관된 서열 (전체 길이 cDNA, ESTs 또는 게놈)이 BLAST (Basic Local Alignment Tool)같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터베이스에 비교하고, 매치 (match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 서열번호 1의 핵산에 의해 코딩된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 10은 서열번호 1 및 서열번호 2에 연관된 핵산 서열의 목록을 제공한다.
SGT1 핵산 및 폴리펩티드의 예:
명칭 핵산 서열번호 폴리펩티드 서열번호
Pepper_SGT1 1 2
A.thaliana_AT4G23570.1#1 3 4
A.thaliana_AT4G23570.2#1 5 6
A.thaliana_AT4G11260.1#1 7 8
A.thaliana_AT4G23570.3#1 9 10
B.napus_BN06MC26625_51284379@26524#1 11 12
G.max_GM06MC38560_sab91h08@37598#1 13 14
H.vulgare_c62589592hv270303@6491#1 15 16
M.truncatula_CT025844_7.4#1 17 18
O.sativa_LOC_Os01g43540.1#1 19 20
P.trichocarpa_scaff_IV.839#1 21 22
P.trichocarpa_scaff_44.273#1 23 24
S.lycopersicum_TC192025#1 25 26
S.lycopersicum_NP9243669#1 27 28
S.lycopersicum_AW398985#1 29 30
T.aestivum_TC280790#1 31 32
Z.mays_ZM07MC27211_BFb0187N13@27130#1 33 34
Z.mays_ZM07MC23831_BFb0038K08@23765#1 35 36
서열은 TIGR (The Institute for Genomic Research; TA로 시작)과 같은 연구 기관에 의해 시험적으로 조립되어 (assembled), 공개된다. EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다. 특별한 핵산 서열 데이터베이스는 통합 게놈 연구소 (Joint Genome Institute)에 의한 것과 같은 특정한 생물체에 대해 생성된다.
2. CLC - pKG 폴리펩티드
서열번호 53 및 서열번호 54에 연관된 서열 (전체 길이 cDNA, ESTs 또는 게놈)이 BLAST (Basic Local Alignment Tool)같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터베이스에 비교하고, 매치 (match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 서열번호 53의 핵산에 의해 코딩된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 11은 서열번호 53 및 서열번호 54에 연관된 핵산 서열 및 폴리펩티드의 목록을 제공한다.
CLC-pKG 폴리펩티드의 예
생물 핵산 명칭 핵산 서열번호
Synechocystis sp. PCC 6803] gi|16329170:2216476-2219175 53
Cyanothece sp. PCC 7424] gi|218437013:4004295-4006922 55
Cyanothece sp. PCC 7822] gi|196258358:38011-40635 57
Cyanothece sp. CCY0110] gi|126659182:36041-38674 59
Cyanothece sp. ATCC 51142] gi|172034917:71619-74267 61
Cyanothece sp. PCC 8801] gi|218244892:3580780-3583419 63
Crocosphaera watsonii WH 8501] gi|67923302:15782-18430 65
Microcystis aeruginosa PCC 7806] gi|159026870:19707-22334 67
Microcystis aeruginosa NIES-843] gi|166362741:3545508-3548135 69
Synechococcus sp. PCC 7002] gi|170076636:589624-592260 71
Nodularia spumigena CCY9414] gi|119510275:28473-31136 73
Microcoleus chthonoplastes PCC 7420] gi|254413420:221158-223773 75
Nostoc punctiforme PCC 73102] gi|186680550:3804594-3807185 77
Nostoc punctiforme PCC 73102] gi|186680550:2232857-2235448 79
Anabaena variabilis ATCC 29413] gi|75906225:2674416-2677004 81
Nostoc sp. PCC 7120] gi|17227497:5827615-5830230 83
'Nostoc azollae' 0708] gi|225522173:3082-5673 85
Nostoc punctiforme PCC 73102] gi|186680550:2232857-2235448 87
Anabaena variabilis ATCC 29413] gi|75906225:2674416-2677004 89
Nostoc sp. PCC 7120] gi|17227497:5827615-5830230 91
'Nostoc azollae' 0708] gi|225522173:3082-5673 93
Nostoc punctiforme PCC 73102] gi|186680550:1989068-1991719 95
'Nostoc azollae' 0708] gi|225516157:49369-51948 97
Lyngbya sp. PCC 8106] gi|119486739:136813-139515 99
Cyanothece sp. PCC 7425] gi|220905643:4270175-4272766 101
Gloeobacter violaceus PCC 7421] gi|37519569:4380220-4382796 103
Arthrospira maxima CS-328] gi|209525652:71572-74244 105
Acaryochloris marina MBIC11017] gi|158333233:913406-916021 107
Cyanothece sp. PCC 7425] gi|220905643:2873784-2876477 109
Synechococcus elongatus PCC 7942] gi|81298811:1653255-1655834 111
생물 폴리펩티드 명칭 폴리펩티드
서열번호
Synechocystis sp. PCC 6803] gi|16331172|ref|NP_441900 54
Cyanothece sp. PCC 7424] gi|218440518|ref|YP_002378847 56
Cyanothece sp. PCC 7822] gi|196258397|ref|ZP_03156931 58
Cyanothece sp. CCY0110] gi|126659209|ref|ZP_01730347 60
Cyanothece sp. ATCC 51142] gi|172034995|ref|YP_001801496 62
Cyanothece sp. PCC 8801] gi|218248189|ref|YP_002373560 64
Crocosphaera watsonii WH 8501] gi|67923321|ref|ZP_00516804 66
Microcystis aeruginosa PCC 7806] gi|159026894|emb|CAO89145 68
Microcystis aeruginosa NIES-843] gi|166366612|ref|YP_001658885 70
Synechococcus sp. PCC 7002] gi|170077188|ref|YP_001733826 72
Nodularia spumigena CCY9414] gi|119510301|ref|ZP_01629437 74
Microcoleus chthonoplastes PCC 7420] gi|254413597|ref|ZP_05027367 76
Nostoc punctiforme PCC 73102] gi|186683293|ref|YP_001866489 78
Nostoc punctiforme PCC 73102] gi|186682226|ref|YP_001865422 80
Anabaena variabilis ATCC 29413] gi|75908381|ref|YP_322677 82
Nostoc sp. PCC 7120] gi|17232383|ref|NP_488931 84
'Nostoc azollae' 0708] gi|225522175|ref|ZP_03768989 86
Nostoc punctiforme PCC 73102] gi|186682226|ref|YP_001865422 88
Anabaena variabilis ATCC 29413] gi|75908381|ref|YP_322677 90
Nostoc sp. PCC 7120] gi|17232383|ref|NP_488931 92
'Nostoc azollae' 0708] gi|225522175|ref|ZP_03768989 94
Nostoc punctiforme PCC 73102] gi|186682049|ref|YP_001865245 96
'Nostoc azollae' 0708] gi|225516217|ref|ZP_03763190 98
Lyngbya sp. PCC 8106] gi|119486852|ref|ZP_01620827 100
Cyanothece sp. PCC 7425] gi|220909579|ref|YP_002484890 102
Gloeobacter violaceus PCC 7421] gi|37523751|ref|NP_927128 104
Arthrospira maxima CS-328] gi|209525724|ref|ZP_03274261 106
Acaryochloris marina MBIC11017] gi|158334130|ref|YP_001515302 108
Cyanothece sp. PCC 7425] gi|220908306|ref|YP_002483617 110
Synechococcus elongatus PCC 7942] gi|81300397|ref|YP_400605 112
서열은 TIGR (The Institute for Genomic Research; TA로 시작)과 같은 연구 기관에 의해 시험적으로 조립되어 (assembled), 공개된다. EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다. 특별한 핵산 서열 데이터베이스는 통합 게놈 연구소 (Joint Genome Institute)에 의한 것과 같은 특정한 생물체에 대해 생성된다. 더욱이, 사유 데이터베이스에 대한 접근은 새로운 핵산 및 폴리펩티드 서열의 동정에 허용된다.
3. HD - 히드롤라아제 유사 폴리펩티드
서열번호 118 및 서열번호 119에 연관된 서열 (전체 길이 cDNA, ESTs 또는 게놈)이 BLAST (Basic Local Alignment Tool)같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터베이스에 비교하고, 매치 (match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 서열번호 118의 핵산에 의해 코딩된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 12는 서열번호 118 및 서열번호 119에 연관된 핵산 서열의 목록을 제공한다.
HD-히드롤라아제 유사 핵산 및 폴리펩티드의 예
명칭 출처 핵산 서열번호 폴리펩티드 서열번호
NP_942378.1 Synechocystis sp. 118 119
YP_001736234.1 Synechococcus sp. 120 121
YP_477086.1 Synechococcus sp. 122 123
ZP_01732553.1 Cyanothece sp. 124 125
YP_001801768.1 Cyanothece sp. 126 127
YP_475929.1 Synechococcus sp. 128 129
ZP_03274910.1 Arthrospira maxima 130 131
YP_001002214.1 Halorhodospira halophila 132 133
ZP_05334193.1 Thermoanaerobacter italicus 134 135
ZP_05378933.1 Thermoanaerobacter mathranii subsp. Mathranii 136 137
NP_624155.1 Thermoanaerobacter tengcongensis 138 139
ZP_05091540.1 Carboxydibrachium pacificum 140 141
YP_001616323.1 Sorangium cellulosum 142 143
ZP_05335917.1 Thermoanaerobacterium thermosaccharolyticum 144 145
ZP_01125571.1 Nitrococcus mobilis 146 147
서열은 TIGR (The Institute for Genomic Research; TA로 시작)과 같은 연구 기관에 의해 시험적으로 조립되어 (assembled), 공개된다. EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다. 특별한 핵산 서열 데이터베이스는 통합 게놈 연구소 (Joint Genome Institute)에 의한 것과 같은 특정한 생물체에 대해 생성된다. 더욱이, 사유 데이터베이스에 대한 접근은 새로운 핵산 및 폴리펩티드 서열의 동정에 허용된다.
실시예 2: 본 발명의 방법에 사용된 폴리펩티드 서열과 연관된 서열의 정렬
1. SGT1 폴리펩티드
폴리펩티드 서열의 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: Gonnet, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW 2.0 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. SGT1 폴리펩티드는 도 1 및 도 2에 정렬되었다.
SGT1 폴리펩티드의 계통수 (도 3)는 NTI 벡터 (Invitrogen)로부터 AlignX 프로그램에 제공된 neighbor-joining 클러스터링 알고리즘을 사용하여 구축되었다.
2. CLC - pKG 폴리펩티드
폴리펩티드 서열의 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: Blosum 62, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW 1.8 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. CLC-pKG 폴리펩티드는 도 5에 정렬되었다.
CLC-pKG 폴리펩티드의 계통수 (도 6)은 Marmagne 등 (2007)에서 얻어졌다.
3. HD-히드롤라아제 유사 폴리펩티드
폴리펩티드 서열의 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: Gonnet, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW 1.81 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다.
HD-히드롤라아제 유사 폴리펩티드의 계통수 (도 10)는 NTI 벡터 (Invitrogen)의 AlignX 프로그램에 제공된 neighbor-joining 클러스터링 알고리즘을 사용하여 구축되었다.
실시예 3: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열 간에 전체적인 동일성 백분율 계산
1. SGT1 폴리펩티드
본 발명의 방법의 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (Campanella 등, BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences; Ledion Bitincka에 의해 호스팅되는 소프트웨어)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다.
비교에 사용된 매개변수는 스코링 매트릭스 (scoring matrix): Blosum62, 첫째 갭: 12, 연장 갭: 2이다.
특정 도메인의 국부적 정렬을 위한 MATGAT 표, 또는 특정한 도메인 사이의 % 동일성/유사성에 대한 데이터가 또한 수행될 수 있다.
2. CLC - pKG 폴리펩티드
본 발명의 방법의 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (Campanella 등, BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences; Ledion Bitincka에 의해 호스팅되는 소프트웨어)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다.
일반적으로 비교에 사용된 매개변수는 스코링 매트릭스 (scoring matrix): Blosum62, 첫째 갭: 12, 연장 갭: 2이다.
3. HD-히드롤라아제 유사 폴리펩티드
본 발명의 방법의 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (Campanella 등, BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences; Ledion Bitincka에 의해 호스팅되는 소프트웨어)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다. 서열 유사성은 구분선 아래 쪽에 제시하였으며, 서열 동일성은 대각선 구분선 위 쪽에 제시하였다.
비교에 사용된 매개변수는 스코링 매트릭스 (scoring matrix): Blosum62, 첫째 갭: 12, 연장 갭: 2이다.
소프트웨어 분석의 결과는 폴리펩티드 서열의 전체 길이에 걸쳐 전체적인 유사성 및 동일성에 대하여 표 13에 나타내었다. 본 발명의 방법 수행에 유용한 HD-히드롤라아제 유사 폴리펩티드 서열 간의 서열 동일성(%)은 서열번호 118 (NP_942378.1)과 비교하여 17% 만큼 낮을 수 있다.
폴리펩티드 서열의 전체 길이에 걸친 전체적인 유사성 및 동일성에 대한 MatGAT 결과
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1. NP_942378.1 68.1 48.3 51.5 47.2 48.3 27.2 19.6 23.6 23.5 21.5 21.5 17.2 20.5 20.4
2. YP_001736234.1 80.1 46.4 50.7 46.7 49.3 27.9 19.7 25.5 24.5 21.0 20.9 19.9 22.6 22.8
3. ZP_01732553.1 61.8 61.0 44.7 45.5 44.0 25.7 15.4 19.4 18.9 21.2 21.3 22.2 19.0 18.9
4. YP_477086.1 66.7 66.2 59.3 78.1 47.5 28.2 21.2 26.0 24.0 21.2 21.2 18.1 21.5 21.0
5. YP_475929.1 62.6 60.9 61.2 83.8 44.2 27.9 20.8 24.3 23.6 20.1 20.0 17.5 20.6 20.3
6. YP_001801768.1 63.5 64.4 58.2 65.1 59.6 26.7 19.5 23.4 22.4 22.9 21.9 18.7 20.9 20.4
7. ZP_03274910.1 44.6 46.3 40.4 47.1 44.8 47.9 18.7 21.8 19.9 19.3 19.4 17.7 20.5 20.1
8. YP_001616323.1 33.7 34.1 28.4 34.3 32.7 35.1 33.9 24.1 23.4 18.3 18.3 15.4 20.1 20.2
9. YP_001002214.1 42.2 41.8 36.0 41.7 39.4 40.3 37.5 34.6 56.1 25.4 25.5 20.2 26.3 26.6
10. ZP_01125571.1 38.8 40.5 35.4 40.8 40.3 39.1 36.2 35.9 66.8 24.9 24.8 19.6 26.7 27.2
11. ZP_05334193.1 39.4 39.8 39.8 41.2 40.4 41.4 35.6 34.3 42.9 45.5 99.4 29.2 26.3 26.7
12. ZP_05378933.1 39.1 39.7 40.4 40.9 40.5 41.8 35.6 34.2 43.0 45.6 99.8 29.3 26.4 26.7
13. ZP_05335917.1 33.8 36.4 38.7 35.5 35.3 35.2 32.5 28.8 35.1 37.6 47.8 47.8 22.3 22.6
14. NP_624155.1 40.2 40.3 37.2 41.1 41.4 39.4 37.8 33.5 43.3 44.6 48.4 48.4 40.6 97.6
15. ZP_05091540.1 40.2 40.8 36.9 40.1 41.1 39.3 37.6 33.5 43.5 44.4 49.1 49.4 40.4 98.6
실시예 4: 본 발명의 방법 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정
1. SGT1 폴리펩티드
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 문자 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 많은 일반적인 단백질 도메인 및 패밀리를 포함하는 복수 서열 정렬 및 숨겨진 마코브(hidden Markov) 모델의 큰 집합체이다. Pfam는 영국의 생거 연구소 서버에서 호스팅된다. InterPro는 영국의 유럽 생물정보학 연구소 (European Bioinformatics Institute)에서 호스팅된다.
서열번호 2로 표시된 폴리펩티드 서열의 InterPro 스캔의 결과는 표 14에 제시되어 있다.
Figure 112012032818201-pct00001
2. CLC - pKG 폴리펩티드
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 문자 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 많은 일반적인 단백질 도메인 및 패밀리를 포함하는 복수 서열 정렬 및 숨겨진 마코브(hidden Markov) 모델의 큰 집합체이다. Pfam는 영국의 생거 연구소 서버에서 호스팅된다. InterPro는 영국의 유럽 생물정보학 연구소 (European Bioinformatics Institute)에서 호스팅된다.
서열번호 54로 표시된 폴리펩티드 서열의 pfam 스캔의 결과는 표 15에 제시되어 있다.
서열번호 54로 표시된 폴리펩티드 서열의 pfam 스캔 결과 (주요 등록 번호)
데이터베이스 등록 번호 등록 명칭 서열번호 54에 대한 아미노산
좌표 ( coordinate )
Pfam PF00571 Voltage Gate Chloride Channel 77-422
Pfam PF00571 CBS domain 455-510
Pfam PF00571 CBS domain 516-571
Pfam PF00582 Universal Stress Protein Family 597-731
3. HD-히드롤라아제 유사 폴리펩티드
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 문자 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 많은 일반적인 단백질 도메인 및 패밀리를 포함하는 복수 서열 정렬 및 숨겨진 마코브(hidden Markov) 모델의 큰 집합체이다. Pfam는 영국의 생거 연구소 서버에서 호스팅된다. InterPro는 영국의 유럽 생물정보학 연구소 (European Bioinformatics Institute)에서 호스팅된다.
서열번호 119로 표시된 폴리펩티드 서열의 InterPro 스캔의 결과는 표 16에 제시되어 있다.
서열번호 119로 표시된 폴리펩티드 서열의 InterPro 스캔의 결과 (주요 등록 번호)
데이터베이스 등록 번호 등록 명칭 서열번호 119에 대한 아미노산
좌표 ( coordinate )
InterPro IPR013407 CRISPR-associated protein Crm2
HMMTigr TIGR02577 cas_TM1794_Crm2: CRISPR-associated pr [221-842] 8.7e-13
실시예 5: 본 발명의 방법 수행에 유용한 폴리펩티드 서열의 Topology 예측
1. SGT1 폴리펩티드
TargetP 1.1는 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관 관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.
N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.
생물체 집단 (비식물 또는 식물), 컷오프 세트 (없거나, 컷오프의 미리 정의된 세트 또는 컷오프의 사용자 지정 세트) 및 절단 부위 예측의 계산 (유 또는 무)과 같은 많은 매개변수가 선택된다.
하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버상에 호스팅된 TMHMM
● PSORT (URL: psort.org)
● PLOC (Park and Kanehisa, Bioinformatics, 19, 1656-1663, 2003).
2. CLC - pKG 폴리펩티드
TargetP 1.1는 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관 관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.
N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.
게다가 또는 대안적으로, 하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버상에 호스팅된 TMHMM
● PSORT (URL: psort.org)
● PLOC (Park and Kanehisa, Bioinformatics, 19, 1656-1663, 2003).
3. HD-히드롤라아제 유사 폴리펩티드
TargetP 1.1는 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관 관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.
N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.
생물체 집단 (비식물 또는 식물), 컷오프 세트 (없거나, 컷오프의 미리 정의된 세트 또는 컷오프의 사용자 지정 세트) 및 절단 부위 예측의 계산 (유 또는 무)과 같은 많은 매개변수가 선택된다.
서열번호 119로 표시된 폴리펩티드 서열의 TargetP 1.1 분석 결과는 표 17에 제시하였다. "식물" 생물체 집단이 선택되었고, 컷오프는 지정되지 않았고, 운반 펩티드의 예상 길이가 요청되었다. 서열번호 119로 표시된 폴리펩티드 서열의 세포 내 위치는 세포질 또는 핵일 수 있으며, 운반 펩티드가 없는 것으로 예측된다.
서열번호 119로 표시된 폴리펩티드 서열의 TargetP 1.1 분석. 약어: Len, 길이; cTP, 엽록체 운반 펩티드; mTP, 미토콘드리아 운반 펩티드; SP, 분비경로 신호 펩티드; other, 다른 세포내 표적화; Loc, 예상 위치; RC, 신뢰성 등급; TPlen, 예상 운반 펩티드 길이.
명칭 Len cTP mTP SP other Loc RC TPlen
서열번호 119 979 0.103 0.321 0.050 0.554 - 4 -
컷오프 0.000 0.000 0.000 0.000
하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버상에 호스팅된 TMHMM
● PSORT (URL: psort.org)
● PLOC (Park and Kanehisa, Bioinformatics, 19, 1656-1663, 2003).
실시예 6: 본 발명의 방법 수행에 유용한 폴리펩티드 서열에 연관된 분석
1. CLC-pKG 폴리펩티드
Marmagne 등 (2007)에 기재된 방법은 기능적으로 gef1 효모 돌연변이체를 보충해준다. 간단하게, 지정된 균주 W303 (WT), RGY86 (gef1 돌연변이체) 및 각 돌연변이체 (gef1: 목적 CLC)의 현탁액은 DO1 (53108 세포)에서 설정되었다. 일련의 희석액 (d1d16)은 적절한 배지 위에 점 찍어졌다 (spotted). 낮은 철 표현형에서, 각 현탁액의 4배 희석액은 pH 5.8의 0.6 mM 페로진 (ferrozine) (A, B)이 추가된 YPEG 배지 위에 점 찍어졌고, 30℃에서 3일 동안 배양되었다. pH 의존 표현형에서, 8배 희석액은 YPD (C), SD 6 (0.1mM CuSO4, pH 7) (D, E) 및 SGE 6 (0.1 mM CuSO4, pH7) (F, G) 배지 위에 점 찍어졌고, 30℃에서 3일 동안 배양되었다.
게다가 또는 대안적으로 De Angeli (Nature 442, 939942, 2006)에 의해 기재된 방법에 기초한 패치 클램프 (patch clamp)는 액포막을 거치는 전류를 측정하는데 사용될 수 있다. 패치 클램프 기술은 예를 들면 Hamill 등 (Pflugers Archiv (European Journal of Physiology) 391, 85-100, 1981)을 참고하면, 세포의 이온 채널 활성 연구를 위해 당업계에 잘 알려져 있다.
실시예 7: 본 발명의 방법에 사용된 핵산 서열의 클로닝
1. SGT1 폴리펩티드
핵산 서열은 고추 (Capsicum annuum) cDNA 라이브러리 (in pCMV Sport 6.0; Invitrogen, Paisley, UK)를 주형으로 사용하여 PCR로 증폭되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 prm14133 (서열번호 51; 정방향, 개시 코돈은 굵은 글씨): 5'-aaaaagcaggctcacaatggagaatgggaaaagagac-3' 및 prm14134 (서열번호: 52; 역방향, 상보적): 5'-agaaagctgggttggttttaactagttccaccg-3'이며, 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편이 Gateway 용어에 따르면 "엔트리 클론" pSGT1을 생성하기 위해 pDONR201 플라스미드와 생체 내에서 (in vivo) 재조합되었다. 플라스미드 pDONR201은 Gateway® 기술의 일부분으로서, Invitrogen으로부터 구입하였다.
서열번호 1을 포함하는 엔트리 클론 (entry clone)은 벼 (Oryza sativa) 형질전환에 사용된 destination 벡터와의 LR 반응에 사용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린 가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클로닝된 목적 핵산 서열과 LR 생체 내 재조합을 위한 의도된 Gateway 카세트. 뿌리 특이적 발현을 위한 벼 RCc3 프로모터 (서열번호 50)는 이 Gateway 카세트의 업스트림에 위치한다.
LR 재조합 단계 후, 생성된 발현벡터 pRCc3::SGT1 (도 4)로 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044를 형질전환하였다.
2. CLC - pKG 폴리펩티드
핵산 서열은 주문제작한 시네코스티스 (Synechosystis) DNA를 주형으로 사용하여 PCR로 증폭되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcttggtttccctttt-3' (서열번호 116) 및 5'-ggggaccactttgtacaagaaagctgggtttactcgtctagaccgaaatctg-3' (서열번호 117)이며, 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편이 Gateway 용어에 따르면 "엔트리 클론" pCLC-pKG를 생성하기 위해 pDONR201 플라스미드와 생체 내에서 (in vivo) 재조합되었다. 플라스미드 pDONR201은 Gateway® 기술의 일부분으로서, Invitrogen으로부터 구입하였다.
서열번호 53의 가장 긴 ORF (Open Reading Frame)를 포함하는 엔트리 클론 (entry clone)은 벼 (Oryza sativa) 형질전환에 사용된 destination 벡터와의 LR 반응에 사용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린 가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클로닝된 목적 핵산 서열과 LR 생체 내 재조합을 위한 의도된 Gateway 카세트. 뿌리 특이적 발현을 위한 벼 RCc3 프로모터 (서열번호 115)는 이 Gateway 카세트의 업스트림에 위치한다.
LR 재조합 단계 후, 생성된 발현벡터 pRCc3::CLC-pKG (도 7)로 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044를 형질전환하였다.
3. HD-히드롤라아제 유사 폴리펩티드
핵산 서열은 주문제작한 시네코시스티스 (Synechocystis) cDNA 라이브러리 (in pCMV Sport 6.0; Invitrogen, Paisley, UK)를 주형으로 사용하여 PCR로 증폭되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 prm14240 (서열번호 165; 정방향, 개시 코돈은 굵은 글씨): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaa tgtctgaagtttactggcaag-3' 및 prm14239 (서열번호 166; 역방향, 상보적): 5'-ggggaccactttgtacaagaaagctgggtttaattgggaaatttaatgtaacg-3'이며, 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편이 Gateway 용어에 따르면 "엔트리 클론" pHD-Hydrolase-like를 생성하기 위해 pDONR201 플라스미드와 생체 내에서 (in vivo) 재조합되었다. 플라스미드 pDONR201은 Gateway® 기술의 일부분으로서, Invitrogen으로부터 구입하였다.
서열번호 118을 포함하는 엔트리 클론이 벼 (Oryza sativa) 형질전환에 사용된 destination 벡터와의 LR 반응에 사용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 포함한다: 식물 선발 마커; 스크린 가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클로닝된 목적 핵산 서열과 LR 생체 내 재조합 의도된 Gateway 카세트. 항시적인 (constitutive) 특이적 발현을 위한 벼 GOS2 프로모터 (서열번호 164)는 이 Gateway 카세트의 업스트림에 위치한다.
LR 재조합 단계 후, 생성된 발현 벡터 pRCc3::HD-hydrolase-like(도 11)로 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044를 형질전환하였다.
실시예 8: 식물 형질전환
벼 형질전환
발현 벡터를 함유하는 아그로박테리움이 벼(Oryza sativa) 식물의 형질전환에 사용되었다. 벼 야포니카 재배 품종 니폰바레의 성숙한 건조 종자의 껍질을 벗겼다. 70% 에탄올에 1 분, 0.2% HgCl2에 30 분, 멸균된 증류수로 6 회, 15분 세척하여 멸균하였다. 멸균된 종자를 2,4-D 함유 배지 (캘러스 유도배지)에서 발아시켰다. 암소에서 4주간 배양 후, 배, 배반-유래 캘러스를 절단하여 동일한 배지에서 번식시켰다. 2주 후, 캘러스는 계대배양에 의해 동일한 배지 상에서 또 다른 2주간 증식되거나 번식되었다. 배 캘러스 단편은 (세포 분열 활성을 증대시키기 위하여) 공동배양 3일 전에 신선한 배지 상에서 계대배양 되었다.
발현 벡터 함유 아그로박테리움 균주 LBA4404가 공동배양에 사용되었다. 아그로박테리움은 적절한 항생제가 포함된 AB 배지에 접종되어, 28℃에서 3일간 배양되었다. 세균을 수집하여 밀도 (OD600) 약 1이 되게 액체 공동배양 배지에 현탁액을 만들었다. 이 현탁액을 페트리디쉬에 옮겨 캘러스를 현탁액에 15 분간 침지하였다. 캘러스 조직을 필터 페이퍼 상에 옮겨 건조시킨 후, 굳힌 공동배양 배지에 옮겨 25℃, 암소에서 3일간 배양하였다. 공동배양된 캘러스를 선발제의 존재 하에 2,4-D-함유 배지에서 28℃, 암소에서 4주간 키웠다. 이 기간 중에, 급속히 자라는 저항성 캘러스 섬이 발달되었다. 이를 재분화 배지에 옮겨 명소에서 배양 후, 배가 방출되었으며 다음 4 내지 5주 후에 어린 줄기가 발달되었다. 어린 줄기를 캘러스에서 절단하여 옥신 함유 배지에서 2 내지 3주간 배양하여 토양으로 이식하였다. 강해진 어린 줄기를 온실 내 고습도 및 단일에서 키웠다.
약 35 개의 독립적인 T0 벼 형질전환체가 한 구축물당 생성되었다. 일차 형질전환체를 조직 배양실에서 온실로 옮겼다. T-DNA 삽입물의 카피 수를 확인하기 위한 정량적 PCR 분석 후, 선발제에 내성을 보이는 한 카피 형질전환 식물을 T1 종자 수확을 위하여 유지하였다. 이식 3 내지 5 개월 후 종자를 수확하였다. 본 방법으로 한 좌위 형질전환체가 50% 넘는 비율로 생산되었다 (Aldemita and Hodges 1996, Chan 등 1993, Hiei 등 1994).
실시예 9: 다른 작물의 형질전환
옥수수 형질전환
옥수수 (Zea mays) 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법을 변형하여 수행하였다. 옥수수에 있어 형질전환은 유전형에 의존하며, 특정 유전형만이 형질전환 및 재분화를 받아들인다. 근교계통 A188 (University of Minnesota) 또는 양친으로서 A188과의 교배는 형질전환을 위한 공여자의 좋은 원천이나 다른 유전형도 성공적으로 사용될 수 있다. 옥수수 알을 미성숙된 배의 길이가 약 1 내지 1.2mm일 때인 수분 후 약 11일된 옥수수 식물체로부터 수확한다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 절단된 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 옥수수 재분화 배지에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 옥수수 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
밀 형질전환
밀의 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법으로 수행하였다. 재배품종 봅화이트 (Bobwhite; CIMMYT, Mexico로부터 입수 가능)가 형질전환에 흔히 사용된다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 아그로박테리움과의 공배양 후 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 재분화 배지에서 시험관 내에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
대두 형질전환
대두는 Texas A&M 특허 US 5,164,310에 기재된 방법을 변형하여 형질전환되었다. 몇 가지 상업적 대두 변종은 이 방법에 의한 형질전환을 수용한다. 재배품종 잭 (Jack; Illinois Seed foundation으로부터 입수 가능)이 흔히 형질전환에 사용된다. 대두 종자는 시험관 내 파종을 위해 멸균된다. 하배축, 유근 및 자엽 하나를 7일 된 어린 실생으로부터 잘라낸다. 상배축 및 나머지 자엽을 엽액 마디가 발달할 때까지 키운다. 이 엽액 마디를 잘라내어 발현벡터를 함유하는 아그로박테리움 투머파시엔스와 배양한다. 공배양 후 잘라낸 식물체 조각을 수세하여 선발 배지로 옮긴다. 재분화된 어린 줄기를 잘라내어 어린 줄기 신장 배지에 둔다. 1 cm가 되지 않는 어린 줄기를 뿌리가 발달하기까지 발근 배지에 둔다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
유채/ 캐놀라 형질전환
5 내지 6일된 어린 실생의 자엽 엽병 및 하배축이 조직 배양을 위한 식물절편으로 사용되었으며 Babic 등 (1998, Plant Cell Rep 17: 183-188)에 따라 형질전환되었다. 상업적 재배종 웨스타 (Westar; Agriculture Canada)가 형질전환을 위한 표준 변종으로 사용되나, 다른 변종도 사용될 수 있다. 캐놀라 종자는 시험관 내 파종을 위해 표면 멸균된다. 자엽이 붙어 있는 자엽 엽병 식물절편을 시험관 내 실생으로부터 절단하여, 엽병 절편의 잘린 끝 부분을 세균 현탁액에 담구어 아그로박테리움 (발현 벡터 포함)을 접종하였다. 식물절편을 3 mg/l BAP, 3 % 수크로스, 0.7 % Phytagar를 함유하는 MSBAP-3 배지에서 23℃에서, 16 시간의 빛 하에서 2일간 배양하였다. 아그로박테리움과의 공배양 2일 후, 엽병 식물 절편을 3mg/l BAP, 세포탁심, 카베니실린, 또는 티멘틴 (300mg/l)을 함유하는 MSBAP-3 배지에 옮겨 7일간 둔 후, 어린 가 재분화될 때까지 세포탁심, 카베니실린, 또는 티멘틴 및 선발제가 든 MSBAP-3 배지에 배양하였다. 어린 줄기의 길이가 5 내지 10 mm일 때 잘라 어린 줄기 신장 배지 (0.5 mg/l BAP 함유 MSBAP-0.5)로 옮긴다. 길이 약 2 cm인 어린 줄기를 뿌리 유도를 위하여 발근 배지(MS0)로 옮긴다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
알팔파 형질전환
알팔파 (Medicago sativa)의 재생 클론이 (McKersie 등, 1999 Plant Physiol 119: 839-847)의 방법으로 형질전환된다. 알팔파의 재생 및 형질전환은 유전형 의존적이므로 재생식물이 요구된다. 재생식물을 얻는 방법이 기재된다. 예를 들면, 이들은 재배품종 랭그랜더 (Rangelander; Agriculture Canada) 또는 Brown DCW 및 A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112)에 의해 기재된 임의의 다른 상업적 알팔파 변종으로부터 선택할 수 있다. 다르게는, RA3 변종 (University of Wisconsin)이 조직배양에 사용하기 위해 선택되었다 (Walker 등, 1978 Am J Bot 65: 654-659). 엽병 식물절편은 발현 벡터를 가진 아그로박테리움 투머파시엔스 C58C1 pMP90 (McKersie 등, 1999 Plant Physiol 119: 839-847) 또는 LBA4404와 밤새 공배양된다. 식물절편은 288 mg/L Pro, 53 mg/L 티오프롤린, 4.35 g/L K2SO4, 및 100μM 아세토시링원을 함유하는 SH 유도배지 상에서 암소에서 3일간 공배양된다. 식물절편을 절반 강도의 Murashige-Skoog 배지 (Murashige and Skoog, 1962)로 세척하여 아세토시링원은 없으나 적절한 선발제 및 아그로박테리움 생장을 저해하는 적절한 항생제를 포함하는 동일한 SH 유도배지 상에 둔다. 몇 주 후, 체세포 배를 생장조절제 및 항생제는 없고, 50g/L 수크로스가 함유된 BOi2Y 발생 배지로 옮긴다. 체세포 배는 연이어 절반 강도의 Murashige-Skoog 배지 상에서 발아된다. 발근된 실생을 온실의 토양으로 이식하여 키운다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
목화 형질전환
목화는 US 5,159,135에 기재된 방법에 따라 아그로박테리움 투머파시엔스(Agrobacterium tumefaciens)를 사용하여 형질전환된다. 목화 종자는 3% 차아염소산나트륨(sodium hypochlorite) 용액에서 20 분간 표면 살균되어, 500 ㎍/ml 세포탁심(cefotaxime)이 함유된 증류수로 수세되었다. 상기 종자는 발아를 위해 50㎍/ml 베노밀(benomyl)이 함유된 SH 배지로 옮겼다. 4 내지 6일 된 실생의 상배축을 제거하여, 0.5 cm 조각으로 잘라 0.8% 아가에 두었다. 아그로박테리움 현탁액 (목적 유전자 및 적절한 선발 마커로 형질전환되어 밤새 배양된 것으로부터 약 108 세포/ml로 희석된)이 상배축 절편체의 접종에 사용되었다. 상온 및 명소에서 3일 후, 조직을 비타민 B5가 든 Murashige 및 Skoog 염 (Gamborg 등, Exp. Cell Res. 50:151-158 (1968)), 0.1 mg/l 2,4-D, 0.1 mg/l 키네틴(6-furfurylaminopurine) 및 750 ㎍/ml MgCL2, 그리고 잔존 세균을 죽이기 위해 50 내지 100 ㎍/ml 세포탁심 및 400-500 ㎍/ml 카르베니실린이 포함된 고체 배지 (1.6 g/l Gelrite) 로 옮겼다. 개개 세포 라인은 2 내지 3달 후에 (4 내지 6주마다 계대배양) 분리되어 조직 증식을 위해 선발 배지에 배양되었다 (30℃, 16 시간 광주기). 형질전환된 조직은 체세포배를 얻기 위해 2 내지 3 달간 비선발배지에서 연이어 배양되었다. 적어도 4 mm 길이의 건강해 보이는 배를 0.1 mg/l 인돌초산, 키네틴 (6-furfurylaminopurine) 및 지베렐린산이 함유된, 미세한 질석의 SH 배지가 든 관상 용기로 옮겼다. 배를 30℃에서 16 시간의 광주기로 배양하여, 및 2 내지 3 장의 잎이 달린 단계에서 식물체를 질석 및 양분이 든 화분으로 옮겼다. 식물체가 튼튼해 지면 재배를 위해 온실로 옮겼다.
실시예 10: 표현형 평가 절차
10.1. 평가 셋업
약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손의 6개 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자 (이형- 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다. 스트레스가 없는 조건하에서 자란 식물은 물 및 양분이 제한되지 않는 것을 확실히 하게 하고, 성장 및 발달을 완성하기 위해 식물이 필요로 하는 것을 충족시키기 위해 규칙적인 간격으로 급수하였다.
4개의 T1 이벤트는 T1 세대와 동일한 평가 절차에 따라, 그러나 이벤트 당 더 많은 개체를 사용하여 T2 세대에서 추가로 평가되었다. 파종 단계에서부터 성숙 단계까지 식물은 디지털 이미지 캐비닛 (digital imaging cabinet)을 몇 회 통과시켰다. 각 타임 포인트에서 각 식물의 디지털 이미지 (2048x1536 픽셀, 1600만 화소)는 적어도 다른 6 각도에서 촬영되었다.
10. 2. 통계적 분석: F-검정
식물의 표현형적 특징의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 건의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 건에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
중복적인 이벤트의 2 회의 실험 수행에서, 조합된 분석이 수행되었다. 이는 두 실험에 걸친 효과의 일관성을 확인하기에 유용하며, 그렇다면 결론에 대한 자신감을 증가시키기에 양 실험으로부터의 증거를 축적하기에 유용하다. 사용된 방법은 자료의 다층구조 (즉, experiment-event-segregant)를 고려하는 혼합모델 접근 (mixed-model approach)이다. P 값은 우도비 검정 (likelihood ratio test)을 카이 제곱 분포에 비교함으로써 구했다.
10.3. 측정된 매개변수
생물량 관련 매개변수 측정
파종 단계에서부터 성숙 단계까지 식물은 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 화소)를 적어도 6 가지 다른 각도에서 촬영하였다.
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다. 초기 활력은 발아 후 3 주일 때 식물 (실생) 지상부 면적이다. 뿌리 생물량의 증가는 총 뿌리 생물량 (식물체의 수명 동안에 관찰된 뿌리의 최대 생물량으로 측정) 또는 뿌리/줄기(shoot) 지수 (뿌리 및 줄기의 활발한 생장기간에 뿌리 질량 및 줄기 질량 간의 비율로 측정)의 증가로 표현된다.
초기 활력은 백그라운드로부터 구분되는 지상부 식물체 부분으로부터 총 픽셀의 수를 세어 결정되었다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 하기 기재된 결과는 발아 후 3주 된 식물체에 대한 것이다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충만된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충만된 깍지는 분석 저울로 무게를 재었다. 충만된 종자의 수는 분리 단계 후 남은 충만된 깍지의 수를 세어 결정하였다. 총 종자 수확량은 식물체로부터 수확된 모든 충만된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립 중량 (TKW)은 숫자를 센 충전된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확지수 (HI)는 총 종자 수확량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수 간의 비율이다. 본 발명에서 정의된 종자 충전도 (fill rate)는 총 종자 (또는 소화) 수에 대한 충전된 종자 수의 비율 (%)로 표시된다.
실시예 11: 형질전환 식물의 표현형 평가 결과
1. SGT1 폴리펩티드
스트레스가 없는 조건 하에서 서열번호 1의 가장 긴 ORF를 포함하는 핵산을 발현하는 T2 세대의 형질전환 벼 식물체의 평가 결과는 하기 표 18에 나타내었다.
각 매개변수에 대한 형질전환 벼 식물체의 평가 결과
매개변수 전체 %
총 종자 중량 10.5
충전도 10.6
수확지수 10.0
충전된 종자 수 11.3
원추화서당 꽃의 수 6.6
각 매개변수에서, 값이 p<0.05 및 5% 이상의 임계값에 도달하면, 형질전환 및 대조구 식물 (해당 공접합자) 사이의 전체적인 비율 차이가 나타난다.
2. CLC - pKG 폴리펩티드
스트레스가 없는 조건 하에서 서열번호 54의 폴리펩티드를 코딩하는 서열번호 53의 ORF를 포함하는 핵산을 발현하는 T1 세대의 형질전환 벼 식물체의 평가 결과는 하기에 나타내었다. 형질전환된 식물의 세대에 대한 상세한 내용은 이전의 실시예를 참고하면 된다.
스트레스가 없는 조건하에서 형질전환된 벼 식물체의 평가 결과는 하기에 나타내었다. 적어도 5%의 증가가 지상부 생물량 (AreaMax), 식물 초장 (HeightMax), 발생 (emergence) 활력 (early vigour; EmerVigor), 뿌리 생물량 (RootMax), 총 종자 수확량 (totalwgseeds), 수확지수 (harvestindex), 얇은 뿌리와 비교한 굵은 뿌리의 비율 (RootThickMax), 식물 수관의 인력 (gravity) 중심 (GravityYMax)에서 관찰되었다. 마지막 2 가지의 매개변수는 각각 식물의 뿌리 시스템 및 수관의 형태의 변화를 나타낸다.
각 수확량 관련 형질에 대한 형질전환 벼 식물체의 데이터 요약, 전체적인 퍼센트 증가는 T1 세대에 대해 나타내었고, 각 매개변수에 대한 p 값은 <0.05이다.
수확량 관련 형질 대조구 식물에 비해 형질전환체의 % 증가
AreaMax 10.6
EmerVigor 6.0
RootMax 11.1
totalwgseeds 17.4
harvestindex 9.3
HeightMax 5.7
GravityYMax 7.3
RootThickMax 7.8
3. HD-히드롤라아제 유사 폴리펩티드
스트레스가 없는 조건 하에서 서열번호 119의 폴리펩티드를 코딩하는 핵산을 발현하는 T1 세대의 형질전환 벼 식물체의 평가 결과는 하기 표 20에 나타내었다.
각 매개변수에 대한 형질전환 벼 식물체의 데이터 요약, 전체적인 퍼센트 증가는 확인 (T1 세대)을 위해 나타내었고, 각 매개변수에 대한 p 값은 <0.05이다.
매개변수 전체적인 증가
총 종자 중량 15.4
충전도 12.7
수확지수 14.1
원추화서당 꽃 9.2
초장 7.0
<110> BASF Plant Science Company GmbH Crop Functional Genomics Center <120> Plants having enhanced yield-related traits and a method for making the same <130> PF62326_PCT <150> EP 09171364.4 <151> 2009-09-25 <150> US 61/252,215 <151> 2009-10-16 <150> EP 09171385.9 <151> 2009-09-25 <150> US 61/252,220 <151> 2009-10-16 <150> EP 09175989.4 <151> 2009-11-13 <150> US 61/260,942 <151> 2009-11-13 <160> 166 <170> PatentIn version 3.3 <210> 1 <211> 1341 <212> DNA <213> Capsicum annuum <400> 1 cgttgcacaa attgatgagc aatgcttttt tataatgcca actttgtaca aaaaagcagg 60 cttaaacaat ggcgtccgat cttgaaacta gggctaaaga agccttcatt gatgaccact 120 ttgaactcgc cgttgacctt tatactcaag ccatatcgtt gagccctaaa aaccctgagc 180 ttttcgctga ccgtgctcag gccaatatta aactcaatta tttcactgaa gctgttgttg 240 atgcgaacaa ggccattgag ttggatcctt acatgtcaaa agcttatttg cgtaaggggt 300 tggcctgtat gaagctcgaa gaataccaaa ctgcgaaggc agctttggaa actggtgcta 360 gtttagcacc aggagagtct aggttcacaa agctaatgaa agaatgtgat gaaagcattg 420 cagaggaagc tggagaactg cctaatatct ctctggaaaa aacctcggct aatgctgttg 480 cgtcttctgc atctgagttg tcggacaatg ttgctattgc gcctagagat cctcaatcaa 540 ctgtcaacct gtcccatcaa gaatctgctg ccaaaccaaa atacagacat gagttttatc 600 agaaaccaga ggaggtggtt gtgactatat ttgccaaggg cataccagcc aagaatgttg 660 ttgttgactt tggtgaacaa atactaagtg ttagcattga tttgccgggt ggagaaactt 720 attctttcca gcctaggttg tttggcaaga taacacctgc aaaatgcaga tatgaagtaa 780 tgtctaccaa aattgagatc cgccttgcaa aagctgaacc attgcactgg acatctcttg 840 attatacaag ggagcctgtc gtaattcaca ggcctgttgt gtcatcagct gccccgcggc 900 ccagttaccc ttcctcaaaa ctgagaaacg tggattggga taaactagaa gctcaagtga 960 aaaaagagga aaaagatgaa aaattggatg gagatgctgc attgaacaaa tttttccgag 1020 acatttacaa agatgctgac gaggacacca gaagagccat gatgaaatcc tttgtggaat 1080 ctaatgggac tgttctgtcg acaaactgga aaaaagttgg cacaaagaag gttgaaggaa 1140 gccctccgga tggcatggag ttgaagaaat gggagattta gagtcaatct gctgtttatc 1200 ttttgtgacc cagctttctt gtacaaagtt ggcattataa gaaagcattg cttatcaatt 1260 tgttgcaacg aacaggtcac tatcggtcaa aataaaatca ttatttgcca tccagctgat 1320 attcccctat agtgagtcgt a 1341 <210> 2 <211> 370 <212> PRT <213> Capsicum annuum <400> 2 Met Ala Ser Asp Leu Glu Thr Arg Ala Lys Glu Ala Phe Ile Asp Asp 1 5 10 15 His Phe Glu Leu Ala Val Asp Leu Tyr Thr Gln Ala Ile Ser Leu Ser 20 25 30 Pro Lys Asn Pro Glu Leu Phe Ala Asp Arg Ala Gln Ala Asn Ile Lys 35 40 45 Leu Asn Tyr Phe Thr Glu Ala Val Val Asp Ala Asn Lys Ala Ile Glu 50 55 60 Leu Asp Pro Tyr Met Ser Lys Ala Tyr Leu Arg Lys Gly Leu Ala Cys 65 70 75 80 Met Lys Leu Glu Glu Tyr Gln Thr Ala Lys Ala Ala Leu Glu Thr Gly 85 90 95 Ala Ser Leu Ala Pro Gly Glu Ser Arg Phe Thr Lys Leu Met Lys Glu 100 105 110 Cys Asp Glu Ser Ile Ala Glu Glu Ala Gly Glu Leu Pro Asn Ile Ser 115 120 125 Leu Glu Lys Thr Ser Ala Asn Ala Val Ala Ser Ser Ala Ser Glu Leu 130 135 140 Ser Asp Asn Val Ala Ile Ala Pro Arg Asp Pro Gln Ser Thr Val Asn 145 150 155 160 Leu Ser His Gln Glu Ser Ala Ala Lys Pro Lys Tyr Arg His Glu Phe 165 170 175 Tyr Gln Lys Pro Glu Glu Val Val Val Thr Ile Phe Ala Lys Gly Ile 180 185 190 Pro Ala Lys Asn Val Val Val Asp Phe Gly Glu Gln Ile Leu Ser Val 195 200 205 Ser Ile Asp Leu Pro Gly Gly Glu Thr Tyr Ser Phe Gln Pro Arg Leu 210 215 220 Phe Gly Lys Ile Thr Pro Ala Lys Cys Arg Tyr Glu Val Met Ser Thr 225 230 235 240 Lys Ile Glu Ile Arg Leu Ala Lys Ala Glu Pro Leu His Trp Thr Ser 245 250 255 Leu Asp Tyr Thr Arg Glu Pro Val Val Ile His Arg Pro Val Val Ser 260 265 270 Ser Ala Ala Pro Arg Pro Ser Tyr Pro Ser Ser Lys Leu Arg Asn Val 275 280 285 Asp Trp Asp Lys Leu Glu Ala Gln Val Lys Lys Glu Glu Lys Asp Glu 290 295 300 Lys Leu Asp Gly Asp Ala Ala Leu Asn Lys Phe Phe Arg Asp Ile Tyr 305 310 315 320 Lys Asp Ala Asp Glu Asp Thr Arg Arg Ala Met Met Lys Ser Phe Val 325 330 335 Glu Ser Asn Gly Thr Val Leu Ser Thr Asn Trp Lys Lys Val Gly Thr 340 345 350 Lys Lys Val Glu Gly Ser Pro Pro Asp Gly Met Glu Leu Lys Lys Trp 355 360 365 Glu Ile 370 <210> 3 <211> 1387 <212> DNA <213> Arabidopsis thaliana <400> 3 aactccctga acacaagtcg cataaaacga aggaacaatc tagaagaaga acgataacat 60 ccaatctctc tttatattcc ttccttccat tgtggcaata atcaatcgat ggcgaaggag 120 cttgctgata aggctaaaga ggctttcgta gacgatgact tcgatgttgc tgttgacttg 180 tactccaaag ccattgactt ggatcctaat tgcgctgagt tcttcgctga tcgtgctcag 240 gcctatatca aactcgaaag cttcactgag gccgtggcag atgcgaacaa agcaattgag 300 ttggatcctt cattgaccaa agcttaccta agaaaaggaa ctgcctgtat gaagcttgaa 360 gagtatcgga ctgctaaaac agctcttgaa aagggtgcct ctatcacgcc gagtgaatcc 420 aaatttaaga agttgataga tgaatgcaat tttctaatca cagaagaaga gaaagatttg 480 gttcaaccgg tgccttcgac tttgccttca agtgtgacag caccaccagt atctgaactt 540 gatgtcaccc ctacagccaa gtacaggcac gagtactacc aaaagccaga ggaagttgtg 600 gtaactgttt ttgcaaaagg aatacccaag cagaatgtta acatcgactt tggtgaacaa 660 attctgagtg ttgtgattga ggttcctgga gaggatgcgt attatctcca accgagattg 720 tttggaaaga taataccaga taagtgcaaa tatgaagtat tgtcgaccaa aattgagatc 780 tgtcttgcaa aagccgatat aatcacatgg gcctccctcg aacacggcaa agggccagcg 840 gttttgccaa agcctaatgt ctcatcagag gtttcacaga ggccagctta tccatcttct 900 aagaaagtta aggactggga caagctggaa gctgaagtga agaagcagga aaaagatgag 960 aagctggaag gagacgcagc tttgaacaaa ttcttccggg agatatacca gaatgcggat 1020 gaggatatga ggcgagcgat gagcaaatca tttgtggaat cgaatgggac agtgctgtca 1080 acaaactggc aagaggttgg gactaagaca atcgagagta ctcctccgga tggcatggag 1140 ctcaagaaat gggagatctg atctgatatg atatgatgat cctttccttt ttatgcagtt 1200 gtgaattttg cctaaatgta gacaaatctt gaaacctggt ccctttcttc ctgtaatgag 1260 gatcctaagg tttttgcttt tttgttaaat atggctttct acctctgcta tgttgtgact 1320 tgtgagttat attgtcttta ggtctcaact tttttgtttt tgtttttatt tgagtattca 1380 taatttc 1387 <210> 4 <211> 350 <212> PRT <213> Arabidopsis thaliana <400> 4 Met Ala Lys Glu Leu Ala Asp Lys Ala Lys Glu Ala Phe Val Asp Asp 1 5 10 15 Asp Phe Asp Val Ala Val Asp Leu Tyr Ser Lys Ala Ile Asp Leu Asp 20 25 30 Pro Asn Cys Ala Glu Phe Phe Ala Asp Arg Ala Gln Ala Tyr Ile Lys 35 40 45 Leu Glu Ser Phe Thr Glu Ala Val Ala Asp Ala Asn Lys Ala Ile Glu 50 55 60 Leu Asp Pro Ser Leu Thr Lys Ala Tyr Leu Arg Lys Gly Thr Ala Cys 65 70 75 80 Met Lys Leu Glu Glu Tyr Arg Thr Ala Lys Thr Ala Leu Glu Lys Gly 85 90 95 Ala Ser Ile Thr Pro Ser Glu Ser Lys Phe Lys Lys Leu Ile Asp Glu 100 105 110 Cys Asn Phe Leu Ile Thr Glu Glu Glu Lys Asp Leu Val Gln Pro Val 115 120 125 Pro Ser Thr Leu Pro Ser Ser Val Thr Ala Pro Pro Val Ser Glu Leu 130 135 140 Asp Val Thr Pro Thr Ala Lys Tyr Arg His Glu Tyr Tyr Gln Lys Pro 145 150 155 160 Glu Glu Val Val Val Thr Val Phe Ala Lys Gly Ile Pro Lys Gln Asn 165 170 175 Val Asn Ile Asp Phe Gly Glu Gln Ile Leu Ser Val Val Ile Glu Val 180 185 190 Pro Gly Glu Asp Ala Tyr Tyr Leu Gln Pro Arg Leu Phe Gly Lys Ile 195 200 205 Ile Pro Asp Lys Cys Lys Tyr Glu Val Leu Ser Thr Lys Ile Glu Ile 210 215 220 Cys Leu Ala Lys Ala Asp Ile Ile Thr Trp Ala Ser Leu Glu His Gly 225 230 235 240 Lys Gly Pro Ala Val Leu Pro Lys Pro Asn Val Ser Ser Glu Val Ser 245 250 255 Gln Arg Pro Ala Tyr Pro Ser Ser Lys Lys Val Lys Asp Trp Asp Lys 260 265 270 Leu Glu Ala Glu Val Lys Lys Gln Glu Lys Asp Glu Lys Leu Glu Gly 275 280 285 Asp Ala Ala Leu Asn Lys Phe Phe Arg Glu Ile Tyr Gln Asn Ala Asp 290 295 300 Glu Asp Met Arg Arg Ala Met Ser Lys Ser Phe Val Glu Ser Asn Gly 305 310 315 320 Thr Val Leu Ser Thr Asn Trp Gln Glu Val Gly Thr Lys Thr Ile Glu 325 330 335 Ser Thr Pro Pro Asp Gly Met Glu Leu Lys Lys Trp Glu Ile 340 345 350 <210> 5 <211> 1416 <212> DNA <213> Arabidopsis thaliana <400> 5 aacatccaat ctctctttat attccttcct tccattgtgg caataagtaa caaaccttgc 60 cctctacttc attccctcct tgttttgatt tcatcgtctt tgttagctct cctctgtttt 120 tttttcttag tcaatcgatg gcgaaggagc ttgctgataa ggctaaagag gctttcgtag 180 acgatgactt cgatgttgct gttgacttgt actccaaagc cattgacttg gatcctaatt 240 gcgctgagtt cttcgctgat cgtgctcagg cctatatcaa actcgaaagc ttcactgagg 300 ccgtggcaga tgcgaacaaa gcaattgagt tggatccttc attgaccaaa gcttacctaa 360 gaaaaggaac tgcctgtatg aagcttgaag agtatcggac tgctaaaaca gctcttgaaa 420 agggtgcctc tatcacgccg agtgaatcca aatttaagaa gttgatagat gaatgcaatt 480 ttctaatcac agaagaagag aaagatttgg ttcaaccggt gccttcgact ttgccttcaa 540 gtgtgacagc accaccagta tctgaacttg atgtcacccc tacagccaag tacaggcacg 600 agtactacca aaagccagag gaagttgtgg taactgtttt tgcaaaagga atacccaagc 660 agaatgttaa catcgacttt ggtgaacaaa ttctgagtgt tgtgattgag gttcctggag 720 aggatgcgta ttatctccaa ccgagattgt ttggaaagat aataccagat aagtgcaaat 780 atgaagtatt gtcgaccaaa attgagatct gtcttgcaaa agccgatata atcacatggg 840 cctccctcga acacggcaaa gggccagcgg ttttgccaaa gcctaatgtc tcatcagagg 900 tttcacagag gccagcttat ccatcttcta agaaagttaa ggactgggac aagctggaag 960 ctgaagtgaa gaagcaggaa aaagatgaga agctggaagg agacgcagct ttgaacaaat 1020 tcttccggga gatataccag aatgcggatg aggatatgag gcgagcgatg agcaaatcat 1080 ttgtggaatc gaatgggaca gtgctgtcaa caaactggca agaggttggg actaagacaa 1140 tcgagagtac tcctccggat ggcatggagc tcaagaaatg ggagatctga tctgatatga 1200 tatgatgatc ctttcctttt tatgcagttg tgaattttgc ctaaatgtag acaaatcttg 1260 aaacctggtc cctttcttcc tgtaatgagg atcctaaggt ttttgctttt ttgttaaata 1320 tggctttcta cctctgctat gttgtgactt gtgagttata ttgtctttag gtctcaactt 1380 ttttgttttt gtttttattt gagtattcat aatttc 1416 <210> 6 <211> 350 <212> PRT <213> Arabidopsis thaliana <400> 6 Met Ala Lys Glu Leu Ala Asp Lys Ala Lys Glu Ala Phe Val Asp Asp 1 5 10 15 Asp Phe Asp Val Ala Val Asp Leu Tyr Ser Lys Ala Ile Asp Leu Asp 20 25 30 Pro Asn Cys Ala Glu Phe Phe Ala Asp Arg Ala Gln Ala Tyr Ile Lys 35 40 45 Leu Glu Ser Phe Thr Glu Ala Val Ala Asp Ala Asn Lys Ala Ile Glu 50 55 60 Leu Asp Pro Ser Leu Thr Lys Ala Tyr Leu Arg Lys Gly Thr Ala Cys 65 70 75 80 Met Lys Leu Glu Glu Tyr Arg Thr Ala Lys Thr Ala Leu Glu Lys Gly 85 90 95 Ala Ser Ile Thr Pro Ser Glu Ser Lys Phe Lys Lys Leu Ile Asp Glu 100 105 110 Cys Asn Phe Leu Ile Thr Glu Glu Glu Lys Asp Leu Val Gln Pro Val 115 120 125 Pro Ser Thr Leu Pro Ser Ser Val Thr Ala Pro Pro Val Ser Glu Leu 130 135 140 Asp Val Thr Pro Thr Ala Lys Tyr Arg His Glu Tyr Tyr Gln Lys Pro 145 150 155 160 Glu Glu Val Val Val Thr Val Phe Ala Lys Gly Ile Pro Lys Gln Asn 165 170 175 Val Asn Ile Asp Phe Gly Glu Gln Ile Leu Ser Val Val Ile Glu Val 180 185 190 Pro Gly Glu Asp Ala Tyr Tyr Leu Gln Pro Arg Leu Phe Gly Lys Ile 195 200 205 Ile Pro Asp Lys Cys Lys Tyr Glu Val Leu Ser Thr Lys Ile Glu Ile 210 215 220 Cys Leu Ala Lys Ala Asp Ile Ile Thr Trp Ala Ser Leu Glu His Gly 225 230 235 240 Lys Gly Pro Ala Val Leu Pro Lys Pro Asn Val Ser Ser Glu Val Ser 245 250 255 Gln Arg Pro Ala Tyr Pro Ser Ser Lys Lys Val Lys Asp Trp Asp Lys 260 265 270 Leu Glu Ala Glu Val Lys Lys Gln Glu Lys Asp Glu Lys Leu Glu Gly 275 280 285 Asp Ala Ala Leu Asn Lys Phe Phe Arg Glu Ile Tyr Gln Asn Ala Asp 290 295 300 Glu Asp Met Arg Arg Ala Met Ser Lys Ser Phe Val Glu Ser Asn Gly 305 310 315 320 Thr Val Leu Ser Thr Asn Trp Gln Glu Val Gly Thr Lys Thr Ile Glu 325 330 335 Ser Thr Pro Pro Asp Gly Met Glu Leu Lys Lys Trp Glu Ile 340 345 350 <210> 7 <211> 1456 <212> DNA <213> Arabidopsis thaliana <400> 7 aaaacgttct taaaagaaaa aaaaaatccc aaacacagca aaaaaaaaaa aagcctagag 60 gaatagaatc ggtctctttc tctataatct ctctctctct ctgacttgtt tgtgttctct 120 caaatcctct gataagaatc aatggccaag gaattagcag agaaagctaa agaagctttt 180 ctagatgatg acttcgatgt tgctgttgac ttatactcca aagccattga cttggatccc 240 aattgcgccg ccttcttcgc cgatcgtgct caggccaaca tcaaaatcga taacttcact 300 gaagctgttg tagatgcgaa caaagccatt gagttggagc caacgttggc aaaagcctat 360 ctcagaaagg gcactgcttg tatgaagcta gaagaatata gtactgctaa agcagccctg 420 gaaaagggag cttctgttgc accgaatgaa ccaaagttta agaagatgat agatgaatgc 480 gatcttcgta ttgcagaaga agagaaagat ttggttcagc cgatgccacc gagtttgcct 540 tcaagctcta caacaccact agcaacggaa gctgatgctc ctcctgttcc aattcctgca 600 gcacctgcca aaccgatgtt caggcacgag ttctaccaga aaccagaaga agcggtggtg 660 acaattttcg ccaaaaaagt acctaaggag aacgtaactg tcgagtttgg tgagcagatt 720 ctgagtgttg tcattgatgt tgctggagag gaagcttatc atctccagcc gagattgttc 780 gggaagataa taccagagaa gtgcagattt gaagtattgt cgaccaaagt tgagatccgt 840 cttgcgaaag cagagataat cacctgggcc tcccttgaat atggtaaagg gcaaagtgtt 900 ttgcccaaac ccaatgtctc atcagcgctg tcgcagagac cagtgtaccc atcttctaag 960 ccagcaaaag actgggacaa gttggaagct gaagtgaaga aacaggagaa ggatgagaag 1020 cttgatggag atgcagctat gaacaaattt ttcagcgaca tatactcgag tgcagatgaa 1080 gacatgaggc gggcaatgaa caaatcattt gcagagtcga atgggacggt actgtcgaca 1140 aactggaaag aagttgggac taagaaagtg gagagcactc caccagatgg catggagctc 1200 aagaagtggg agtattgatc ttcttaaaat ccccttttct ggtttttgtt aaaaaaaagt 1260 ctgacaaatc ttttgaactt ttaaggtgtt tttctttttt ggtttctgct cgaatttgtc 1320 tctctccatt cttgcgttgt ggtctcaaag aacgttctga tactttgatt ttgtattaga 1380 aaactaaaac tcgcaagtct gttgttttgg aactttgttc ttttatcgag aggcttatct 1440 aaatatttct tgacat 1456 <210> 8 <211> 358 <212> PRT <213> Arabidopsis thaliana <400> 8 Met Ala Lys Glu Leu Ala Glu Lys Ala Lys Glu Ala Phe Leu Asp Asp 1 5 10 15 Asp Phe Asp Val Ala Val Asp Leu Tyr Ser Lys Ala Ile Asp Leu Asp 20 25 30 Pro Asn Cys Ala Ala Phe Phe Ala Asp Arg Ala Gln Ala Asn Ile Lys 35 40 45 Ile Asp Asn Phe Thr Glu Ala Val Val Asp Ala Asn Lys Ala Ile Glu 50 55 60 Leu Glu Pro Thr Leu Ala Lys Ala Tyr Leu Arg Lys Gly Thr Ala Cys 65 70 75 80 Met Lys Leu Glu Glu Tyr Ser Thr Ala Lys Ala Ala Leu Glu Lys Gly 85 90 95 Ala Ser Val Ala Pro Asn Glu Pro Lys Phe Lys Lys Met Ile Asp Glu 100 105 110 Cys Asp Leu Arg Ile Ala Glu Glu Glu Lys Asp Leu Val Gln Pro Met 115 120 125 Pro Pro Ser Leu Pro Ser Ser Ser Thr Thr Pro Leu Ala Thr Glu Ala 130 135 140 Asp Ala Pro Pro Val Pro Ile Pro Ala Ala Pro Ala Lys Pro Met Phe 145 150 155 160 Arg His Glu Phe Tyr Gln Lys Pro Glu Glu Ala Val Val Thr Ile Phe 165 170 175 Ala Lys Lys Val Pro Lys Glu Asn Val Thr Val Glu Phe Gly Glu Gln 180 185 190 Ile Leu Ser Val Val Ile Asp Val Ala Gly Glu Glu Ala Tyr His Leu 195 200 205 Gln Pro Arg Leu Phe Gly Lys Ile Ile Pro Glu Lys Cys Arg Phe Glu 210 215 220 Val Leu Ser Thr Lys Val Glu Ile Arg Leu Ala Lys Ala Glu Ile Ile 225 230 235 240 Thr Trp Ala Ser Leu Glu Tyr Gly Lys Gly Gln Ser Val Leu Pro Lys 245 250 255 Pro Asn Val Ser Ser Ala Leu Ser Gln Arg Pro Val Tyr Pro Ser Ser 260 265 270 Lys Pro Ala Lys Asp Trp Asp Lys Leu Glu Ala Glu Val Lys Lys Gln 275 280 285 Glu Lys Asp Glu Lys Leu Asp Gly Asp Ala Ala Met Asn Lys Phe Phe 290 295 300 Ser Asp Ile Tyr Ser Ser Ala Asp Glu Asp Met Arg Arg Ala Met Asn 305 310 315 320 Lys Ser Phe Ala Glu Ser Asn Gly Thr Val Leu Ser Thr Asn Trp Lys 325 330 335 Glu Val Gly Thr Lys Lys Val Glu Ser Thr Pro Pro Asp Gly Met Glu 340 345 350 Leu Lys Lys Trp Glu Tyr 355 <210> 9 <211> 1334 <212> DNA <213> Arabidopsis thaliana <400> 9 tgatttcatc gtctttgtta gctctcctct gttttttttt cttagtcaat cgatggcgaa 60 ggagcttgct gataaggcta aagaggcttt cgtagacgat gacttcgatg ttgctgttga 120 cttgtactcc aaagccattg acttggatcc taattgcgct gagttcttcg ctgatcgtgc 180 tcaggcctat atcaaactcg aaagcttcac tgcagaggcc gtggcagatg cgaacaaagc 240 aattgagttg gatccttcat tgaccaaagc ttacctaaga aaaggaactg cctgtatgaa 300 gcttgaagag tatcggactg ctaaaacagc tcttgaaaag ggtgcctcta tcacgccgag 360 tgaatccaaa tttaagaagt tgatagatga atgcaatttt ctaatcacag aagaagagaa 420 agatttggtt caaccggtgc cttcgacttt gccttcaagt gtgacagcac caccagtatc 480 tgaacttgat gtcaccccta cagccaagta caggcacgag tactaccaaa agccagagga 540 agttgtggta actgtttttg caaaaggaat acccaagcag aatgttaaca tcgactttgg 600 tgaacaaatt ctgagtgttg tgattgaggt tcctggagag gatgcgtatt atctccaacc 660 gagattgttt ggaaagataa taccagataa gtgcaaatat gaagtattgt cgaccaaaat 720 tgagatctgt cttgcaaaag ccgatataat cacatgggcc tccctcgaac acggcaaagg 780 gccagcggtt ttgccaaagc ctaatgtctc atcagaggtt tcacagaggc cagcttatcc 840 atcttctaag aaagttaagg actgggacaa gctggaagct gaagtgaaga agcaggaaaa 900 agatgagaag ctggaaggag acgcagcttt gaacaaattc ttccgggaga tataccagaa 960 tgcggatgag gatatgaggc gagcgatgag caaatcattt gtggaatcga atgggacagt 1020 gctgtcaaca aactggcaag aggttgggac taagacaatc gagagtactc ctccggatgg 1080 catggagctc aagaaatggg agatctgatc tgatatgata tgatgatcct ttccttttta 1140 tgcagttgtg aattttgcct aaatgtagac aaatcttgaa acctggtccc tttcttcctg 1200 taatgaggat cctaaggttt ttgctttttt gttaaatatg gctttctacc tctgctatgt 1260 tgtgacttgt gagttatatt gtctttaggt ctcaactttt ttgtttttgt ttttatttga 1320 gtattcataa tttc 1334 <210> 10 <211> 351 <212> PRT <213> Arabidopsis thaliana <400> 10 Met Ala Lys Glu Leu Ala Asp Lys Ala Lys Glu Ala Phe Val Asp Asp 1 5 10 15 Asp Phe Asp Val Ala Val Asp Leu Tyr Ser Lys Ala Ile Asp Leu Asp 20 25 30 Pro Asn Cys Ala Glu Phe Phe Ala Asp Arg Ala Gln Ala Tyr Ile Lys 35 40 45 Leu Glu Ser Phe Thr Ala Glu Ala Val Ala Asp Ala Asn Lys Ala Ile 50 55 60 Glu Leu Asp Pro Ser Leu Thr Lys Ala Tyr Leu Arg Lys Gly Thr Ala 65 70 75 80 Cys Met Lys Leu Glu Glu Tyr Arg Thr Ala Lys Thr Ala Leu Glu Lys 85 90 95 Gly Ala Ser Ile Thr Pro Ser Glu Ser Lys Phe Lys Lys Leu Ile Asp 100 105 110 Glu Cys Asn Phe Leu Ile Thr Glu Glu Glu Lys Asp Leu Val Gln Pro 115 120 125 Val Pro Ser Thr Leu Pro Ser Ser Val Thr Ala Pro Pro Val Ser Glu 130 135 140 Leu Asp Val Thr Pro Thr Ala Lys Tyr Arg His Glu Tyr Tyr Gln Lys 145 150 155 160 Pro Glu Glu Val Val Val Thr Val Phe Ala Lys Gly Ile Pro Lys Gln 165 170 175 Asn Val Asn Ile Asp Phe Gly Glu Gln Ile Leu Ser Val Val Ile Glu 180 185 190 Val Pro Gly Glu Asp Ala Tyr Tyr Leu Gln Pro Arg Leu Phe Gly Lys 195 200 205 Ile Ile Pro Asp Lys Cys Lys Tyr Glu Val Leu Ser Thr Lys Ile Glu 210 215 220 Ile Cys Leu Ala Lys Ala Asp Ile Ile Thr Trp Ala Ser Leu Glu His 225 230 235 240 Gly Lys Gly Pro Ala Val Leu Pro Lys Pro Asn Val Ser Ser Glu Val 245 250 255 Ser Gln Arg Pro Ala Tyr Pro Ser Ser Lys Lys Val Lys Asp Trp Asp 260 265 270 Lys Leu Glu Ala Glu Val Lys Lys Gln Glu Lys Asp Glu Lys Leu Glu 275 280 285 Gly Asp Ala Ala Leu Asn Lys Phe Phe Arg Glu Ile Tyr Gln Asn Ala 290 295 300 Asp Glu Asp Met Arg Arg Ala Met Ser Lys Ser Phe Val Glu Ser Asn 305 310 315 320 Gly Thr Val Leu Ser Thr Asn Trp Gln Glu Val Gly Thr Lys Thr Ile 325 330 335 Glu Ser Thr Pro Pro Asp Gly Met Glu Leu Lys Lys Trp Glu Ile 340 345 350 <210> 11 <211> 1284 <212> DNA <213> Brassica napus <400> 11 caaatcctca aaaagagtga ttcaatggcg aaggaactgg cggaaaaagc taaagaggcg 60 ttcttagatg acgacttcga tgtggctgtt gacttatact ccaaagccat tgacttggat 120 ccctcttgcg cctccttctt cgccgatcgt gctcaggcca acatcaaact ccttaacttc 180 accgaagctg ttgcagatgc caacaaagcc atcgagttgg agcctacttt ggccaaagct 240 tatctcagaa agggcactgc ttgtatgaag ctagaagagt atgctactgc taaagcagct 300 cttgagaagg gcgcttccgt tgcacctaat gaatccaagt ttgagaagat gatagatgaa 360 tgcaaccttc tcattgcaga agaagagaaa gatttggttc aacaggtgcc accgactttg 420 ccttcaagct ctacaacacc actagcaatc gcagctgatg ctcctcctgt tccaagtcct 480 gcaccacctg ccaaacctat gttcaggcac gagttctacc agaagccaga ggaggttgtg 540 gtgacaattt tcgctaaagg aataccaaag cagaacgtga atgtagagtt tggtgaccag 600 attctgagtg ttgtgattga tgttgctgga gaagaagctt atcatttcca gccaagattg 660 ttcgggaaga taataccaga gaagtgcagg tatgaggtat tgtcaaccaa agttgagatc 720 cgtctcgcaa aagcagagat agtcacttgg gcctcccttg aatatggcaa agggcaagct 780 cttctgccta aacccaatgt tgcatcagca gtgtctcaga ggccggtgta cccatcctct 840 aagccgggaa aagactggga caagctggaa gctgaagtga agaaacagga gaaggatgag 900 aagctagatg gagatgcagc tatgaacaag tttttcagcg acatatacca gagtgcagat 960 gaggacatga ggcgagccat gaacaaatca tttgcagagt caaatgggac ggtgctgtct 1020 acgaactgga aagaggttgg gacaaagaaa gtggagagca ctccaccaga tggcatggag 1080 ctgaagaagt gggagtattg atgatctttt taaatccttt tatctggtct tttcaaaaat 1140 ctctgacaaa tctttaaagt tccattggtt tttcaagttt gggtctgaga aaacgagtgt 1200 gctagaaaac cgcgcaagtt tgtgctttgt accttttctt ctccctcgag agagggcttc 1260 gaatgacatt cttgcattgt tatc 1284 <210> 12 <211> 358 <212> PRT <213> Brassica napus <400> 12 Met Ala Lys Glu Leu Ala Glu Lys Ala Lys Glu Ala Phe Leu Asp Asp 1 5 10 15 Asp Phe Asp Val Ala Val Asp Leu Tyr Ser Lys Ala Ile Asp Leu Asp 20 25 30 Pro Ser Cys Ala Ser Phe Phe Ala Asp Arg Ala Gln Ala Asn Ile Lys 35 40 45 Leu Leu Asn Phe Thr Glu Ala Val Ala Asp Ala Asn Lys Ala Ile Glu 50 55 60 Leu Glu Pro Thr Leu Ala Lys Ala Tyr Leu Arg Lys Gly Thr Ala Cys 65 70 75 80 Met Lys Leu Glu Glu Tyr Ala Thr Ala Lys Ala Ala Leu Glu Lys Gly 85 90 95 Ala Ser Val Ala Pro Asn Glu Ser Lys Phe Glu Lys Met Ile Asp Glu 100 105 110 Cys Asn Leu Leu Ile Ala Glu Glu Glu Lys Asp Leu Val Gln Gln Val 115 120 125 Pro Pro Thr Leu Pro Ser Ser Ser Thr Thr Pro Leu Ala Ile Ala Ala 130 135 140 Asp Ala Pro Pro Val Pro Ser Pro Ala Pro Pro Ala Lys Pro Met Phe 145 150 155 160 Arg His Glu Phe Tyr Gln Lys Pro Glu Glu Val Val Val Thr Ile Phe 165 170 175 Ala Lys Gly Ile Pro Lys Gln Asn Val Asn Val Glu Phe Gly Asp Gln 180 185 190 Ile Leu Ser Val Val Ile Asp Val Ala Gly Glu Glu Ala Tyr His Phe 195 200 205 Gln Pro Arg Leu Phe Gly Lys Ile Ile Pro Glu Lys Cys Arg Tyr Glu 210 215 220 Val Leu Ser Thr Lys Val Glu Ile Arg Leu Ala Lys Ala Glu Ile Val 225 230 235 240 Thr Trp Ala Ser Leu Glu Tyr Gly Lys Gly Gln Ala Leu Leu Pro Lys 245 250 255 Pro Asn Val Ala Ser Ala Val Ser Gln Arg Pro Val Tyr Pro Ser Ser 260 265 270 Lys Pro Gly Lys Asp Trp Asp Lys Leu Glu Ala Glu Val Lys Lys Gln 275 280 285 Glu Lys Asp Glu Lys Leu Asp Gly Asp Ala Ala Met Asn Lys Phe Phe 290 295 300 Ser Asp Ile Tyr Gln Ser Ala Asp Glu Asp Met Arg Arg Ala Met Asn 305 310 315 320 Lys Ser Phe Ala Glu Ser Asn Gly Thr Val Leu Ser Thr Asn Trp Lys 325 330 335 Glu Val Gly Thr Lys Lys Val Glu Ser Thr Pro Pro Asp Gly Met Glu 340 345 350 Leu Lys Lys Trp Glu Tyr 355 <210> 13 <211> 1458 <212> DNA <213> Glycine max <400> 13 gaattcggca ccagatcatt cattcctatt ccttctttct cttccaattc caaatcacaa 60 cccttcgttt tccctctcta gaatcttctt ctccattcaa ttcctactcc ttttttcctc 120 tctgtccctc tctctctccc tctctcatgg cttccgatct cgaagcaaaa gccaaagagg 180 ccttcgtcga agaccacttc gaactcgccg tggaccttct ctctcaggcc attcatctcg 240 aacccaacaa agccgaattc tacgccgacc gcgcccaagc caacatcaaa ctcaacaact 300 tcactgaggc tgtggctgat gctaacaaag caattgaatt gaatccttct ctaccaaaag 360 catatttgcg gaaaggtact gcttgcatga agcttgagga atatgaaact gcaaaggctg 420 ctctggaggt gggtgcatca ttgtctccag acaactcaag gtttgctact ttgatcaaag 480 aatgtgataa gctcattgca gaagaatctt ataccccacc tattatagag gaaaagacca 540 caacagagga tgctactcca aaagatgttc agcaacaaga tgatcttcta gagaagccaa 600 cagttacagt gactaaacct aaatataggc atgaattcta ccagaaacat gatcagttgg 660 ttgtgaccat atttgcaaag aaaatcccaa aggaaagcat tactgttgac ttcggtgaac 720 aaatactaag tgttagtatt aatgtccctg gagaagacac atatgctttt caacctcgct 780 tatttggaaa gatcatacct tccaattgcc aatatgaagt tttgtccacc aaaattgaaa 840 ttcgtcttgc aaaagcagaa cctattcact ggacatctct agaattcacc agagacatcg 900 ttgttcaaca gagggttaat gcttcttcag ttactggaag tcaaagacct tcttacccat 960 cctcaaaaca aacaagagat tgggacaaga ttgaagctca agtcaagaaa gaggagaaag 1020 atgaaaagct tgatggcgat gctgcgttga acaaattttt ccgtgaaata tatcaagatg 1080 cagatgagga tacaaggagg gcaatgaaaa agtcttttgt tgagtctaat gggacagtgc 1140 tgtctacaaa ctggaaagaa gtgggatcaa agaaggtaga gggaagtgct cctgatggca 1200 tggagttgaa gaaatgggaa tattaagaca ttttctggat caatgttata catattttgg 1260 tgtgagatta tactttggtt tgtttttgtt ggttagctta actgctgaac taaagatact 1320 tattttcttt aattttttat ttattttcat gaggtgtgtc cgtcttcgct aggacctgaa 1380 ttcatggttg ttggttgaga ggacaaggct gttgtctttg gtgaatatat tgcaactttc 1440 tgttgtaaaa aaaaaaaa 1458 <210> 14 <211> 359 <212> PRT <213> Glycine max <400> 14 Met Ala Ser Asp Leu Glu Ala Lys Ala Lys Glu Ala Phe Val Glu Asp 1 5 10 15 His Phe Glu Leu Ala Val Asp Leu Leu Ser Gln Ala Ile His Leu Glu 20 25 30 Pro Asn Lys Ala Glu Phe Tyr Ala Asp Arg Ala Gln Ala Asn Ile Lys 35 40 45 Leu Asn Asn Phe Thr Glu Ala Val Ala Asp Ala Asn Lys Ala Ile Glu 50 55 60 Leu Asn Pro Ser Leu Pro Lys Ala Tyr Leu Arg Lys Gly Thr Ala Cys 65 70 75 80 Met Lys Leu Glu Glu Tyr Glu Thr Ala Lys Ala Ala Leu Glu Val Gly 85 90 95 Ala Ser Leu Ser Pro Asp Asn Ser Arg Phe Ala Thr Leu Ile Lys Glu 100 105 110 Cys Asp Lys Leu Ile Ala Glu Glu Ser Tyr Thr Pro Pro Ile Ile Glu 115 120 125 Glu Lys Thr Thr Thr Glu Asp Ala Thr Pro Lys Asp Val Gln Gln Gln 130 135 140 Asp Asp Leu Leu Glu Lys Pro Thr Val Thr Val Thr Lys Pro Lys Tyr 145 150 155 160 Arg His Glu Phe Tyr Gln Lys His Asp Gln Leu Val Val Thr Ile Phe 165 170 175 Ala Lys Lys Ile Pro Lys Glu Ser Ile Thr Val Asp Phe Gly Glu Gln 180 185 190 Ile Leu Ser Val Ser Ile Asn Val Pro Gly Glu Asp Thr Tyr Ala Phe 195 200 205 Gln Pro Arg Leu Phe Gly Lys Ile Ile Pro Ser Asn Cys Gln Tyr Glu 210 215 220 Val Leu Ser Thr Lys Ile Glu Ile Arg Leu Ala Lys Ala Glu Pro Ile 225 230 235 240 His Trp Thr Ser Leu Glu Phe Thr Arg Asp Ile Val Val Gln Gln Arg 245 250 255 Val Asn Ala Ser Ser Val Thr Gly Ser Gln Arg Pro Ser Tyr Pro Ser 260 265 270 Ser Lys Gln Thr Arg Asp Trp Asp Lys Ile Glu Ala Gln Val Lys Lys 275 280 285 Glu Glu Lys Asp Glu Lys Leu Asp Gly Asp Ala Ala Leu Asn Lys Phe 290 295 300 Phe Arg Glu Ile Tyr Gln Asp Ala Asp Glu Asp Thr Arg Arg Ala Met 305 310 315 320 Lys Lys Ser Phe Val Glu Ser Asn Gly Thr Val Leu Ser Thr Asn Trp 325 330 335 Lys Glu Val Gly Ser Lys Lys Val Glu Gly Ser Ala Pro Asp Gly Met 340 345 350 Glu Leu Lys Lys Trp Glu Tyr 355 <210> 15 <211> 2351 <212> DNA <213> Hordeum vulgare <400> 15 atttcggtac gaggcaggat ttgtcctcct ccacccagcc gccaagcctt ctcgaagctt 60 ccccggcccg cccccgatcc gatcggaccg cctgccatgg ccgacgaggc gaaggccaaa 120 ggtaatgcgg ccttctcggc cggccgcttc gaggaggcgg cggggcactt ctccgacgcc 180 atcgcgctcg ccccggccaa ccacgtgctc tactccaacc gctcggcggc gctcgcctcg 240 atccaccgct actccgacgc gctcgccgac gccgagaaga ccgtcgagct caagcccgac 300 tgggccaagg gctactcgcg cctcggcgcc gcacacctcg gcctcggcga cgcggccagc 360 gccgccgccg cctacgagaa gggcctcgcc ctcgatccca gcaacgaggg cctcaaggcc 420 ggcctcgctg acgccaagaa ggctgcggcc gccccgccgc ggcgcccgcc ttctggcggc 480 gccgacgcga tcggccagat gttccagggc cccgagctct ggaccaagat cgcttccgac 540 cccgctacgc gcgcctacct cgaccagccg gatttcatgc agatgctgcg ggacgtgcag 600 cgggatccca gcagtctcaa catgttccta tccgacccgc gcatgatgca ggtgctcagc 660 ctcatgctta acatcaagat ccagacgccc caggactccg attttccgca gtcctcctcg 720 ccgtcgcagc caccaccgca gcagcagagg caacagcccg agacaaaggc gagggagatg 780 gagcctgagc cacagccgga gcccatggag gtgtctgatg aggacaagga gaagaaggag 840 aggaaagctg ctgctctgaa ggagaaggag gcagggaatg catcgtacaa gaagaaggac 900 ttcgagacgg cgatccagca ttacacaaag gccatggaac ttgatgacga ggacatctcc 960 tacctcacta accgagcagc ggtgtacatc gaaatgggga agtttgatga gtgcattgcg 1020 gactgtgata aagctgtgga gaggggaagg gaacttcgtg ctgatttcaa gatggttgct 1080 agggcactaa caagaaaagg aactgctctg gccaaacttg ctaagaactc caaggactat 1140 gatattgcca ttgagacttt ccagaaggct ctaactgagc accggaatcc agacactctt 1200 aaaaggttaa atgaggctga gaaggcaaag aaagatttgg agcaacaaga gtattatgac 1260 ccaaagatag ctgatgagga gagggagaaa ggtaatgaga tgttcaagca gcagaagtat 1320 ccagaagcaa taaagcatta caatgaggct atcaggagga acccgaagga tgctagggta 1380 tacagcaata gagctgcatg ctataccaag ctgggagcca tgcctgaagg tcttaaagac 1440 gcagagaagt gtattgagct agacccaacc ttctccaaag ggtatacaag gaagggtgca 1500 gttcagtttt ttatgaagga atatgagaag gcaatggaaa cttaccaggc tgggttaaag 1560 cttgacccta ataaccagga actgcttgat ggcataagga ggtgtgttca gcagatcaac 1620 aaggctaaca ggggtgacat aagtcaggag gatttgcagg agaaacagag taaagctatg 1680 caggacccag aaatccagaa catccttacc gatcctatca tgcgacaggt gttgatggat 1740 ttccaggaga accctagggc tgctcaggat catctgaagg accctggagt ggcacagaag 1800 atccaaaagc tcataaacgc tggaatagtc caaacgagat gatcaagcaa gggcgtttgt 1860 gttgagattg tgctcggttg tgtcgtcact gtacactgct tctctgccca gcgtgaactt 1920 cttttgtatg ccatggggca tccatttcag ttggatttgt gagtacagcc tgccacatcg 1980 ttattcctgt gtacggctat tatgttacag ttctatgtgg gcaatgtccc atatattatt 2040 agttgtagcc gttttcgcct tcacagtgga caaacagatg ctagaacaag aacagtagaa 2100 tgttattgta ttttatttct tgctgtgcta gggaaatgct gtcaatggag aaaattcatt 2160 gaaaaaaaaa aaaaaaaaaa aaattcaggg gggggccccg ggacccaata ttgcctttaa 2220 tggagtggga tttcaaattc atgggccggc gttttacaaa cggggggatt gggaaaaacc 2280 ctgggcggtc ccaaaattta tttgcttgtg gaaaattacc ccttttttcc aatggggggt 2340 aaaagcaaaa a 2351 <210> 16 <211> 581 <212> PRT <213> Hordeum vulgare <400> 16 Met Ala Asp Glu Ala Lys Ala Lys Gly Asn Ala Ala Phe Ser Ala Gly 1 5 10 15 Arg Phe Glu Glu Ala Ala Gly His Phe Ser Asp Ala Ile Ala Leu Ala 20 25 30 Pro Ala Asn His Val Leu Tyr Ser Asn Arg Ser Ala Ala Leu Ala Ser 35 40 45 Ile His Arg Tyr Ser Asp Ala Leu Ala Asp Ala Glu Lys Thr Val Glu 50 55 60 Leu Lys Pro Asp Trp Ala Lys Gly Tyr Ser Arg Leu Gly Ala Ala His 65 70 75 80 Leu Gly Leu Gly Asp Ala Ala Ser Ala Ala Ala Ala Tyr Glu Lys Gly 85 90 95 Leu Ala Leu Asp Pro Ser Asn Glu Gly Leu Lys Ala Gly Leu Ala Asp 100 105 110 Ala Lys Lys Ala Ala Ala Ala Pro Pro Arg Arg Pro Pro Ser Gly Gly 115 120 125 Ala Asp Ala Ile Gly Gln Met Phe Gln Gly Pro Glu Leu Trp Thr Lys 130 135 140 Ile Ala Ser Asp Pro Ala Thr Arg Ala Tyr Leu Asp Gln Pro Asp Phe 145 150 155 160 Met Gln Met Leu Arg Asp Val Gln Arg Asp Pro Ser Ser Leu Asn Met 165 170 175 Phe Leu Ser Asp Pro Arg Met Met Gln Val Leu Ser Leu Met Leu Asn 180 185 190 Ile Lys Ile Gln Thr Pro Gln Asp Ser Asp Phe Pro Gln Ser Ser Ser 195 200 205 Pro Ser Gln Pro Pro Pro Gln Gln Gln Arg Gln Gln Pro Glu Thr Lys 210 215 220 Ala Arg Glu Met Glu Pro Glu Pro Gln Pro Glu Pro Met Glu Val Ser 225 230 235 240 Asp Glu Asp Lys Glu Lys Lys Glu Arg Lys Ala Ala Ala Leu Lys Glu 245 250 255 Lys Glu Ala Gly Asn Ala Ser Tyr Lys Lys Lys Asp Phe Glu Thr Ala 260 265 270 Ile Gln His Tyr Thr Lys Ala Met Glu Leu Asp Asp Glu Asp Ile Ser 275 280 285 Tyr Leu Thr Asn Arg Ala Ala Val Tyr Ile Glu Met Gly Lys Phe Asp 290 295 300 Glu Cys Ile Ala Asp Cys Asp Lys Ala Val Glu Arg Gly Arg Glu Leu 305 310 315 320 Arg Ala Asp Phe Lys Met Val Ala Arg Ala Leu Thr Arg Lys Gly Thr 325 330 335 Ala Leu Ala Lys Leu Ala Lys Asn Ser Lys Asp Tyr Asp Ile Ala Ile 340 345 350 Glu Thr Phe Gln Lys Ala Leu Thr Glu His Arg Asn Pro Asp Thr Leu 355 360 365 Lys Arg Leu Asn Glu Ala Glu Lys Ala Lys Lys Asp Leu Glu Gln Gln 370 375 380 Glu Tyr Tyr Asp Pro Lys Ile Ala Asp Glu Glu Arg Glu Lys Gly Asn 385 390 395 400 Glu Met Phe Lys Gln Gln Lys Tyr Pro Glu Ala Ile Lys His Tyr Asn 405 410 415 Glu Ala Ile Arg Arg Asn Pro Lys Asp Ala Arg Val Tyr Ser Asn Arg 420 425 430 Ala Ala Cys Tyr Thr Lys Leu Gly Ala Met Pro Glu Gly Leu Lys Asp 435 440 445 Ala Glu Lys Cys Ile Glu Leu Asp Pro Thr Phe Ser Lys Gly Tyr Thr 450 455 460 Arg Lys Gly Ala Val Gln Phe Phe Met Lys Glu Tyr Glu Lys Ala Met 465 470 475 480 Glu Thr Tyr Gln Ala Gly Leu Lys Leu Asp Pro Asn Asn Gln Glu Leu 485 490 495 Leu Asp Gly Ile Arg Arg Cys Val Gln Gln Ile Asn Lys Ala Asn Arg 500 505 510 Gly Asp Ile Ser Gln Glu Asp Leu Gln Glu Lys Gln Ser Lys Ala Met 515 520 525 Gln Asp Pro Glu Ile Gln Asn Ile Leu Thr Asp Pro Ile Met Arg Gln 530 535 540 Val Leu Met Asp Phe Gln Glu Asn Pro Arg Ala Ala Gln Asp His Leu 545 550 555 560 Lys Asp Pro Gly Val Ala Gln Lys Ile Gln Lys Leu Ile Asn Ala Gly 565 570 575 Ile Val Gln Thr Arg 580 <210> 17 <211> 1125 <212> DNA <213> Medicago vulgare <400> 17 atggcgcaag aactcgaaaa caaagccaaa gaagcttttt tcgacgacga ttttacactc 60 gccgttgatt tctattctca agccatcgaa atcgatccca ccaacgctaa tctctttgcc 120 gatcgagcac aatcgcatat caaactcaac gctttcactg aagctgtttc tgatgctaat 180 aaggctattc aattgaaccc taatttgtct aaagcttatc ttcgcaaagg gactgcttgt 240 attaatcttg aagaatatca tactgctaag gttgcacttg aaaagggggc ttcttttgca 300 cctgatgatt ccagattcac taatttgatt caacaatgtc aacgcttcat tgctgctgag 360 gaatctgaaa gtcttacgag caccctacca ccaaatggac ccaaatcatc tgttgcgtct 420 gttgatgata cccatatgtg tgataagagt gatgaaacat ccaaagaacc tcaaagagac 480 agtcctgcat cccaaacaaa tgcagttgca ccagtcagac caaaatacag gcatgaatat 540 taccagaagc cagaagaagt ggttgtgaca atatttgcaa aagggatacc agcagaaaat 600 gttgttgtgg acttcggcga acagattctg agtgttacca ttgatgttcc tggccaagat 660 gcctaccatt accaacctag attgtttgga aagataatac ctgataagtg caaagttgtg 720 gttttgtcaa ccaaaattga gattcgtctg gcaaaagctg aagcagttaa ttggacatct 780 ctggaatata gcaaggatgt gcttccccaa aagataatcg tgccctcagt tcaatctgaa 840 aggcctgcat atccgtcatc aaagtcaagg actaaggatt gggataagtt ggaagctgaa 900 gtgaaaaaag aggagaaaga agaaaagctt gatggtgatg ctgctttgaa taaattgttc 960 cgtgatattt accaaaatgc agacgaggac atgaggagag cgatgagcaa gtcttttctg 1020 gagtcaaatg gaacagtgct ttcaactgat tggaaagaag tgggatcaaa gaaggtggaa 1080 ggaagtcctc cggaaggcat ggaggtgaag aaatgggagt attga 1125 <210> 18 <211> 374 <212> PRT <213> Medicago vulgare <400> 18 Met Ala Gln Glu Leu Glu Asn Lys Ala Lys Glu Ala Phe Phe Asp Asp 1 5 10 15 Asp Phe Thr Leu Ala Val Asp Phe Tyr Ser Gln Ala Ile Glu Ile Asp 20 25 30 Pro Thr Asn Ala Asn Leu Phe Ala Asp Arg Ala Gln Ser His Ile Lys 35 40 45 Leu Asn Ala Phe Thr Glu Ala Val Ser Asp Ala Asn Lys Ala Ile Gln 50 55 60 Leu Asn Pro Asn Leu Ser Lys Ala Tyr Leu Arg Lys Gly Thr Ala Cys 65 70 75 80 Ile Asn Leu Glu Glu Tyr His Thr Ala Lys Val Ala Leu Glu Lys Gly 85 90 95 Ala Ser Phe Ala Pro Asp Asp Ser Arg Phe Thr Asn Leu Ile Gln Gln 100 105 110 Cys Gln Arg Phe Ile Ala Ala Glu Glu Ser Glu Ser Leu Thr Ser Thr 115 120 125 Leu Pro Pro Asn Gly Pro Lys Ser Ser Val Ala Ser Val Asp Asp Thr 130 135 140 His Met Cys Asp Lys Ser Asp Glu Thr Ser Lys Glu Pro Gln Arg Asp 145 150 155 160 Ser Pro Ala Ser Gln Thr Asn Ala Val Ala Pro Val Arg Pro Lys Tyr 165 170 175 Arg His Glu Tyr Tyr Gln Lys Pro Glu Glu Val Val Val Thr Ile Phe 180 185 190 Ala Lys Gly Ile Pro Ala Glu Asn Val Val Val Asp Phe Gly Glu Gln 195 200 205 Ile Leu Ser Val Thr Ile Asp Val Pro Gly Gln Asp Ala Tyr His Tyr 210 215 220 Gln Pro Arg Leu Phe Gly Lys Ile Ile Pro Asp Lys Cys Lys Val Val 225 230 235 240 Val Leu Ser Thr Lys Ile Glu Ile Arg Leu Ala Lys Ala Glu Ala Val 245 250 255 Asn Trp Thr Ser Leu Glu Tyr Ser Lys Asp Val Leu Pro Gln Lys Ile 260 265 270 Ile Val Pro Ser Val Gln Ser Glu Arg Pro Ala Tyr Pro Ser Ser Lys 275 280 285 Ser Arg Thr Lys Asp Trp Asp Lys Leu Glu Ala Glu Val Lys Lys Glu 290 295 300 Glu Lys Glu Glu Lys Leu Asp Gly Asp Ala Ala Leu Asn Lys Leu Phe 305 310 315 320 Arg Asp Ile Tyr Gln Asn Ala Asp Glu Asp Met Arg Arg Ala Met Ser 325 330 335 Lys Ser Phe Leu Glu Ser Asn Gly Thr Val Leu Ser Thr Asp Trp Lys 340 345 350 Glu Val Gly Ser Lys Lys Val Glu Gly Ser Pro Pro Glu Gly Met Glu 355 360 365 Val Lys Lys Trp Glu Tyr 370 <210> 19 <211> 1518 <212> DNA <213> Oryza sativa <400> 19 ctacccctcc gcgaagtctt cgtctggtct tcccccaccc gcatcccccg gcctcctcac 60 cgcagccgca aaagccaagc cgccatggca accgccgccg cgtcggatct ggagagcaag 120 gccaaggcgg ccttcgtcga cgacgacttc gagctcgccg ccgagctcta cacgcaggca 180 atcgaggcca gccccgccac cgccgagctc tacgccgacc gcgcccaggc ccatatcaag 240 ctaggcaact acactgaggc tgtagctgat gctaacaagg ccattgaact tgacccatca 300 atgcacaagg cttatcttcg taaaggcgct gcatgtatac gactggagga gtatcaaact 360 gcaaaagcag ctcttgaatt gggttactcg ttcgcatctg gtgactcaag gtttactcgc 420 ctaatgaagg agtgtgatga gcgcattgct gaggagctta gtgaagtccc tgttaagaag 480 gctgaagatg gagcagctgc cccctctgtt gcttcttttg ttgaggaaaa ggatgatgct 540 gcaaacatgg ataatacacc accaatggta gaagtgaagc caaaatacag gcacgacttc 600 tacaacagtg ctacagaagt tgtattgaca atttttgcaa agggtgttcc tgctgagaat 660 gttgttgttg attttggtga acaaatgtta agtgtgtcga ttgaagtccc tggagaggag 720 ccgtaccatt ttcagcctcg tctgttttct aagatcatcc ctgagaaaag cagataccaa 780 gtgctatcca cgaaggttga aataagactg gctaaagctg aacagattac atggacctca 840 cttgattatg ataaaaaacc aaaggctgtt ccacaaaaga taatccctcc agctgaatcg 900 gcccagaggc catcatatcc ttcctcaaaa tccaagaaag actgggataa actggaagct 960 gaagttaaaa aggaggagaa ggaggagaag cttgaaggcg atgctgcatt gaacaaattt 1020 ttccgtgaca tctacagtga tgctgatgaa gacatgcgac gagcaatgat gaaatctttt 1080 gttgaatcta acggtactgt tctgtcgacc aattggaaag atgttggctc gaagaaggta 1140 gagggaagcc cacctgatgg gatggagctt aagaaatggg agtactaaga tctcggttcg 1200 tgcatgctgt aaattcgtta tcgtcgtgag tcatcacttg gctggagatt tcgcgcatca 1260 ttgtcaagtt ggattttgtg tgatgctctt cgttgcgttt ccatattgta agctctctgt 1320 gtgacaggct agcttgtcta agactttatc ctagttttgg aagatacatc tggacacaag 1380 aatacgttat ctgaatcttt gctccgaagt gcagaatgct ctgtcgtttt actaatattg 1440 caaagtagtg ctgtatctcc tatcatccct gaaatgcgat gttcgtctta attgtagcct 1500 ctacaatgct cacagtta 1518 <210> 20 <211> 367 <212> PRT <213> Oryza sativa <400> 20 Met Ala Thr Ala Ala Ala Ser Asp Leu Glu Ser Lys Ala Lys Ala Ala 1 5 10 15 Phe Val Asp Asp Asp Phe Glu Leu Ala Ala Glu Leu Tyr Thr Gln Ala 20 25 30 Ile Glu Ala Ser Pro Ala Thr Ala Glu Leu Tyr Ala Asp Arg Ala Gln 35 40 45 Ala His Ile Lys Leu Gly Asn Tyr Thr Glu Ala Val Ala Asp Ala Asn 50 55 60 Lys Ala Ile Glu Leu Asp Pro Ser Met His Lys Ala Tyr Leu Arg Lys 65 70 75 80 Gly Ala Ala Cys Ile Arg Leu Glu Glu Tyr Gln Thr Ala Lys Ala Ala 85 90 95 Leu Glu Leu Gly Tyr Ser Phe Ala Ser Gly Asp Ser Arg Phe Thr Arg 100 105 110 Leu Met Lys Glu Cys Asp Glu Arg Ile Ala Glu Glu Leu Ser Glu Val 115 120 125 Pro Val Lys Lys Ala Glu Asp Gly Ala Ala Ala Pro Ser Val Ala Ser 130 135 140 Phe Val Glu Glu Lys Asp Asp Ala Ala Asn Met Asp Asn Thr Pro Pro 145 150 155 160 Met Val Glu Val Lys Pro Lys Tyr Arg His Asp Phe Tyr Asn Ser Ala 165 170 175 Thr Glu Val Val Leu Thr Ile Phe Ala Lys Gly Val Pro Ala Glu Asn 180 185 190 Val Val Val Asp Phe Gly Glu Gln Met Leu Ser Val Ser Ile Glu Val 195 200 205 Pro Gly Glu Glu Pro Tyr His Phe Gln Pro Arg Leu Phe Ser Lys Ile 210 215 220 Ile Pro Glu Lys Ser Arg Tyr Gln Val Leu Ser Thr Lys Val Glu Ile 225 230 235 240 Arg Leu Ala Lys Ala Glu Gln Ile Thr Trp Thr Ser Leu Asp Tyr Asp 245 250 255 Lys Lys Pro Lys Ala Val Pro Gln Lys Ile Ile Pro Pro Ala Glu Ser 260 265 270 Ala Gln Arg Pro Ser Tyr Pro Ser Ser Lys Ser Lys Lys Asp Trp Asp 275 280 285 Lys Leu Glu Ala Glu Val Lys Lys Glu Glu Lys Glu Glu Lys Leu Glu 290 295 300 Gly Asp Ala Ala Leu Asn Lys Phe Phe Arg Asp Ile Tyr Ser Asp Ala 305 310 315 320 Asp Glu Asp Met Arg Arg Ala Met Met Lys Ser Phe Val Glu Ser Asn 325 330 335 Gly Thr Val Leu Ser Thr Asn Trp Lys Asp Val Gly Ser Lys Lys Val 340 345 350 Glu Gly Ser Pro Pro Asp Gly Met Glu Leu Lys Lys Trp Glu Tyr 355 360 365 <210> 21 <211> 281 <212> DNA <213> Populus trichocarpa <400> 21 tctcgaatcg atttttgttg aattcaatcg atggcggatc tggagaagaa agccaaagaa 60 gcattcatcg acgatcactt cgagttagcc gtcgatctct acacccaagc catcgctctt 120 aaccctacca atcctgacct cctcgctgac cgtgctcagg ccaatatcaa actcaacagt 180 ctcaccggta tgcttaacta accctcgctc caccaccacc acaacatcaa cccctctctc 240 tcctttatat cgcttcactt tctctcgctt gctctctgtt t 281 <210> 22 <211> 56 <212> PRT <213> Populus trichocarpa <400> 22 Met Ala Asp Leu Glu Lys Lys Ala Lys Glu Ala Phe Ile Asp Asp His 1 5 10 15 Phe Glu Leu Ala Val Asp Leu Tyr Thr Gln Ala Ile Ala Leu Asn Pro 20 25 30 Thr Asn Pro Asp Leu Leu Ala Asp Arg Ala Gln Ala Asn Ile Lys Leu 35 40 45 Asn Ser Leu Thr Gly Met Leu Asn 50 55 <210> 23 <211> 1190 <212> DNA <213> Populus trichocarpa <400> 23 tctgtatttc ttggttgttg aaaagaatca atggcggatc tggagaggaa agcgaaagaa 60 gcattcatcg atgaccactt cgagctagcc gtagatctct acacgcaagc catcgcgctt 120 aaccctacca atcctgacct cttcgccgac cgcgcgcaag ccaatatcaa actcaacaat 180 ttcaccgagg ctgttgcgga tgctagcaga gcaattgcgt tggatgcctc cttggctaaa 240 gcttacttgc ggaaaggtat tgcatgtatg aaacttgagg aatatcagac tgctaaggca 300 gcattggaag taggcgcgtc tttggcaccg ggagagtcta gattcactaa cttgatcaag 360 gaatgtgacg agtgcatcgc agaggaaact ggtgggtcga aaaatcatgc agcagatgcc 420 ccagttaaca ctgtttccat agaagatgtc gagccagaag acacttctag tcaggctcca 480 atggtaatac cttccaagcc aaagtacagg catgaattct accaaaagcc agaagaggtg 540 gttgtgagta tatttgcaaa gggcgtacaa gccagttgga ttagtgttga ttttggtgaa 600 cagattctaa gtgttaggat tgaggttcct ggtgaagatg ggtatcattt tcaacctcgc 660 ttatttggga agataatacc cgacaagtgc aagtataaca tcttgtccac caaagttgaa 720 tttcgacttg caaaagctga accaggtctg cactgggcat ctcttgaata caacaaggag 780 acagcagtag tacaaaggat tgctgtatcc tctgaaattg ttcaaaagcc tacctattcc 840 tcatcaaaac caaaacgagt tgattgggac aagattgaag ctcaagtaaa gaaggaggag 900 aaagaagaga agctagatgg ggatgcagct ttgaacaaat ttttccgaga aatttatcaa 960 gatgctgatg aagacacaag aagagccatg aaaaaatctt ttgtggagtc caacggcacg 1020 gtgctgtcga caaactggaa agaagtgggt acgaagaagg tggaaggaag ccctcctgat 1080 gggatggaga tgaggaaatg ggagtactga gcttgtgttt tggtaatggg gaatgcgctg 1140 taaagaacat aacagttaga ttttgttccc tgaatgatga ttgtggttgt 1190 <210> 24 <211> 359 <212> PRT <213> Populus trichocarpa <400> 24 Met Ala Asp Leu Glu Arg Lys Ala Lys Glu Ala Phe Ile Asp Asp His 1 5 10 15 Phe Glu Leu Ala Val Asp Leu Tyr Thr Gln Ala Ile Ala Leu Asn Pro 20 25 30 Thr Asn Pro Asp Leu Phe Ala Asp Arg Ala Gln Ala Asn Ile Lys Leu 35 40 45 Asn Asn Phe Thr Glu Ala Val Ala Asp Ala Ser Arg Ala Ile Ala Leu 50 55 60 Asp Ala Ser Leu Ala Lys Ala Tyr Leu Arg Lys Gly Ile Ala Cys Met 65 70 75 80 Lys Leu Glu Glu Tyr Gln Thr Ala Lys Ala Ala Leu Glu Val Gly Ala 85 90 95 Ser Leu Ala Pro Gly Glu Ser Arg Phe Thr Asn Leu Ile Lys Glu Cys 100 105 110 Asp Glu Cys Ile Ala Glu Glu Thr Gly Gly Ser Lys Asn His Ala Ala 115 120 125 Asp Ala Pro Val Asn Thr Val Ser Ile Glu Asp Val Glu Pro Glu Asp 130 135 140 Thr Ser Ser Gln Ala Pro Met Val Ile Pro Ser Lys Pro Lys Tyr Arg 145 150 155 160 His Glu Phe Tyr Gln Lys Pro Glu Glu Val Val Val Ser Ile Phe Ala 165 170 175 Lys Gly Val Gln Ala Ser Trp Ile Ser Val Asp Phe Gly Glu Gln Ile 180 185 190 Leu Ser Val Arg Ile Glu Val Pro Gly Glu Asp Gly Tyr His Phe Gln 195 200 205 Pro Arg Leu Phe Gly Lys Ile Ile Pro Asp Lys Cys Lys Tyr Asn Ile 210 215 220 Leu Ser Thr Lys Val Glu Phe Arg Leu Ala Lys Ala Glu Pro Gly Leu 225 230 235 240 His Trp Ala Ser Leu Glu Tyr Asn Lys Glu Thr Ala Val Val Gln Arg 245 250 255 Ile Ala Val Ser Ser Glu Ile Val Gln Lys Pro Thr Tyr Ser Ser Ser 260 265 270 Lys Pro Lys Arg Val Asp Trp Asp Lys Ile Glu Ala Gln Val Lys Lys 275 280 285 Glu Glu Lys Glu Glu Lys Leu Asp Gly Asp Ala Ala Leu Asn Lys Phe 290 295 300 Phe Arg Glu Ile Tyr Gln Asp Ala Asp Glu Asp Thr Arg Arg Ala Met 305 310 315 320 Lys Lys Ser Phe Val Glu Ser Asn Gly Thr Val Leu Ser Thr Asn Trp 325 330 335 Lys Glu Val Gly Thr Lys Lys Val Glu Gly Ser Pro Pro Asp Gly Met 340 345 350 Glu Met Arg Lys Trp Glu Tyr 355 <210> 25 <211> 1407 <212> DNA <213> Solanum lycopersicum <400> 25 ccaattgcca tttcactctt gttctagata cttctttgga gttcctctcc atcaccaatg 60 gcgtccgatc tggagactag ggctaaagag gcattcattg acgaccactt tgaactcgcc 120 gttgacctgt acactcaagc cataacgctg agccctaaga accctgaact tttcgccgac 180 cgtgctcagg ccaatatcaa actcaactac ttcactgaag ctgttgttga tgcgaacaag 240 gccattgagt tggatcctac aatgtcaaaa gcatatttac gcaaggggtt ggcctgtatg 300 aagcttgaag aataccaaac tgcaaaggca gctttggaaa ttggtgccag tttagcacca 360 ggagagttaa gattcagtaa gctaatgaaa gaatgtgatg aacatattgc agaggaagct 420 ggcgaattgc ctaatctgtc ggtggataaa acctcagcta gtgttgttgc acatcctgca 480 tctgagttac cggacaatgt tgctattgcg cctgaaggtg ctcaaccaac ggtcaaccag 540 tcccatcaag gatctgctgc caaaccaaaa tacagacatg aattttatca gaaaccagag 600 gaggtggtgg tgactatatt tgccaagggc ataccagcca agaatgttgt tgttgacttt 660 ggtgaacaaa tacttagtgt tagcattgat gtgccaggtg aagaaactta ttctttccag 720 cctaggttgt ttggcaagat aacacctgca aaatgcagat acgaagtgat gtctaccata 780 attgagatcc gccttgcgaa agctgagctg ttacactgga catcgcttga gtatacaacg 840 gaacctgttg taattcagag gcctattgtg tcatcagctg ccccgcggcc cagttatcct 900 tcctcaaaac tgagaaatgt agattgggat aaactagaag ctgaagtgaa aaaagaggaa 960 aaagatgaaa aattggatgg agatgcagca ttgaacaaat ttttcagaga catttaccaa 1020 gatgctgacg aggacactag aagagctatg atgaaatcct ttgtggaatc taatgggact 1080 gttttgtcga caaactggaa agaagttggc acaaagaagg ttgaaggaag ccctccggat 1140 ggcatggagc tgaagaaatg ggagatctag aatcgatcct ctgttgatgt tttttgactt 1200 tgcattttaa gttgtttcat tgctattttt attatagaag aatttgttca tattttcttt 1260 tctaaggttt taagttttgt tctttgctgt tggattgaga taacagtaat atatcttcaa 1320 attgtggaca aagcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaacatgtc ggccgcctcg 1380 gccctcgagg catctatgtc gggtgcg 1407 <210> 26 <211> 370 <212> PRT <213> Solanum lycopersicum <400> 26 Met Ala Ser Asp Leu Glu Thr Arg Ala Lys Glu Ala Phe Ile Asp Asp 1 5 10 15 His Phe Glu Leu Ala Val Asp Leu Tyr Thr Gln Ala Ile Thr Leu Ser 20 25 30 Pro Lys Asn Pro Glu Leu Phe Ala Asp Arg Ala Gln Ala Asn Ile Lys 35 40 45 Leu Asn Tyr Phe Thr Glu Ala Val Val Asp Ala Asn Lys Ala Ile Glu 50 55 60 Leu Asp Pro Thr Met Ser Lys Ala Tyr Leu Arg Lys Gly Leu Ala Cys 65 70 75 80 Met Lys Leu Glu Glu Tyr Gln Thr Ala Lys Ala Ala Leu Glu Ile Gly 85 90 95 Ala Ser Leu Ala Pro Gly Glu Leu Arg Phe Ser Lys Leu Met Lys Glu 100 105 110 Cys Asp Glu His Ile Ala Glu Glu Ala Gly Glu Leu Pro Asn Leu Ser 115 120 125 Val Asp Lys Thr Ser Ala Ser Val Val Ala His Pro Ala Ser Glu Leu 130 135 140 Pro Asp Asn Val Ala Ile Ala Pro Glu Gly Ala Gln Pro Thr Val Asn 145 150 155 160 Gln Ser His Gln Gly Ser Ala Ala Lys Pro Lys Tyr Arg His Glu Phe 165 170 175 Tyr Gln Lys Pro Glu Glu Val Val Val Thr Ile Phe Ala Lys Gly Ile 180 185 190 Pro Ala Lys Asn Val Val Val Asp Phe Gly Glu Gln Ile Leu Ser Val 195 200 205 Ser Ile Asp Val Pro Gly Glu Glu Thr Tyr Ser Phe Gln Pro Arg Leu 210 215 220 Phe Gly Lys Ile Thr Pro Ala Lys Cys Arg Tyr Glu Val Met Ser Thr 225 230 235 240 Ile Ile Glu Ile Arg Leu Ala Lys Ala Glu Leu Leu His Trp Thr Ser 245 250 255 Leu Glu Tyr Thr Thr Glu Pro Val Val Ile Gln Arg Pro Ile Val Ser 260 265 270 Ser Ala Ala Pro Arg Pro Ser Tyr Pro Ser Ser Lys Leu Arg Asn Val 275 280 285 Asp Trp Asp Lys Leu Glu Ala Glu Val Lys Lys Glu Glu Lys Asp Glu 290 295 300 Lys Leu Asp Gly Asp Ala Ala Leu Asn Lys Phe Phe Arg Asp Ile Tyr 305 310 315 320 Gln Asp Ala Asp Glu Asp Thr Arg Arg Ala Met Met Lys Ser Phe Val 325 330 335 Glu Ser Asn Gly Thr Val Leu Ser Thr Asn Trp Lys Glu Val Gly Thr 340 345 350 Lys Lys Val Glu Gly Ser Pro Pro Asp Gly Met Glu Leu Lys Lys Trp 355 360 365 Glu Ile 370 <210> 27 <211> 1110 <212> DNA <213> Solanum lycopersicum <400> 27 atggcgtccg atctggagac tagggctaaa gaagctttca tcgatgacca ctttgagctc 60 gccgttgacc tttacactca agccatagcc atgaccccta agaacgctga gcttttcgcc 120 gaccgtgctc aggccaatat caaactcaac tacttcactg aagctgttgt tgatgcgaac 180 aaggccattg agttagatcc ttcaatgtca aaagcatatt tgcgtaaggg gttggcctgt 240 atgaagcttg aagagtacca aactgcaaaa gcagctttgc aaactggtgc tagtttagca 300 ccggcagagt caaggttcac aaagttaatc aaagaatgtg atgaacgcat tgcagaggaa 360 gctggagaac tacctaatca gtcagtggat aaaacctcgg gaaatgtcgt tacggctccc 420 cctgagtctt tggacaatgt tgctgttgcg cctaaagatg ctcaaccatc tgtcaacctg 480 tcctatcaag gatctgctgc cagaccaaaa tacaggcatg aattttacca gaagccagag 540 gaggtggtgg tgactatatt tgccaagggt ataccagcca agaatgttgt tgttgacttt 600 ggtgaacaaa tacttagtgt tagcattgat gtgccgggcg aggaagctta ttctttccag 660 cctaggttgt ttgggaagat aacacctgca aaatgcagat acgaagtgat gtctaccaaa 720 attgagatcc gccttgcaaa agctgaaccc ttacactgga catctctcga atatacgagg 780 gagcctgctg tagtgcagag gcctaatgtg tcatcagatg ccccccggcc cagttatcct 840 tcctcgaaat tgagacatgt ggattgggat aaattagagg ctgaagtgaa aaaggaggaa 900 aaagacgaaa aattggatgg agatgcagca ttgaacaaat ttttccgaga catttacaaa 960 gacgccgatg aggacaccag aagagccatg atgaaatcct ttgtggaatc taatgggact 1020 gttctttcca caaactggaa agaagtcggt gcaaagaagg tcgaaggaag ccctccagat 1080 ggcatggagc tgaagaaatg ggagatctag 1110 <210> 28 <211> 369 <212> PRT <213> Solanum lycopersicum <400> 28 Met Ala Ser Asp Leu Glu Thr Arg Ala Lys Glu Ala Phe Ile Asp Asp 1 5 10 15 His Phe Glu Leu Ala Val Asp Leu Tyr Thr Gln Ala Ile Ala Met Thr 20 25 30 Pro Lys Asn Ala Glu Leu Phe Ala Asp Arg Ala Gln Ala Asn Ile Lys 35 40 45 Leu Asn Tyr Phe Thr Glu Ala Val Val Asp Ala Asn Lys Ala Ile Glu 50 55 60 Leu Asp Pro Ser Met Ser Lys Ala Tyr Leu Arg Lys Gly Leu Ala Cys 65 70 75 80 Met Lys Leu Glu Glu Tyr Gln Thr Ala Lys Ala Ala Leu Gln Thr Gly 85 90 95 Ala Ser Leu Ala Pro Ala Glu Ser Arg Phe Thr Lys Leu Ile Lys Glu 100 105 110 Cys Asp Glu Arg Ile Ala Glu Glu Ala Gly Glu Leu Pro Asn Gln Ser 115 120 125 Val Asp Lys Thr Ser Gly Asn Val Val Thr Ala Pro Pro Glu Ser Leu 130 135 140 Asp Asn Val Ala Val Ala Pro Lys Asp Ala Gln Pro Ser Val Asn Leu 145 150 155 160 Ser Tyr Gln Gly Ser Ala Ala Arg Pro Lys Tyr Arg His Glu Phe Tyr 165 170 175 Gln Lys Pro Glu Glu Val Val Val Thr Ile Phe Ala Lys Gly Ile Pro 180 185 190 Ala Lys Asn Val Val Val Asp Phe Gly Glu Gln Ile Leu Ser Val Ser 195 200 205 Ile Asp Val Pro Gly Glu Glu Ala Tyr Ser Phe Gln Pro Arg Leu Phe 210 215 220 Gly Lys Ile Thr Pro Ala Lys Cys Arg Tyr Glu Val Met Ser Thr Lys 225 230 235 240 Ile Glu Ile Arg Leu Ala Lys Ala Glu Pro Leu His Trp Thr Ser Leu 245 250 255 Glu Tyr Thr Arg Glu Pro Ala Val Val Gln Arg Pro Asn Val Ser Ser 260 265 270 Asp Ala Pro Arg Pro Ser Tyr Pro Ser Ser Lys Leu Arg His Val Asp 275 280 285 Trp Asp Lys Leu Glu Ala Glu Val Lys Lys Glu Glu Lys Asp Glu Lys 290 295 300 Leu Asp Gly Asp Ala Ala Leu Asn Lys Phe Phe Arg Asp Ile Tyr Lys 305 310 315 320 Asp Ala Asp Glu Asp Thr Arg Arg Ala Met Met Lys Ser Phe Val Glu 325 330 335 Ser Asn Gly Thr Val Leu Ser Thr Asn Trp Lys Glu Val Gly Ala Lys 340 345 350 Lys Val Glu Gly Ser Pro Pro Asp Gly Met Glu Leu Lys Lys Trp Glu 355 360 365 Ile <210> 29 <211> 491 <212> DNA <213> Solanum lycopersicum <400> 29 atcccttttc cctctcttgt tcaagaaact tcttctcatc tgatccatgg cgtccgatct 60 cgtaactaaa gctaaagaag cattcatcga cgaccacttt gagctcgccg ttgacctcta 120 ctctcaagcc attgctatta ctcctaataa tgccgacctt tttgctgacc gtgctcaggc 180 caatatcaaa ctccgtaaat tcactggtaa cttatttgtt aatatggtcc ctttgcattc 240 tcggtaacaa ggacaaacaa atgcatactc tgttttttgt tttttctttt ggttgcgtaa 300 acaaatggat atctatggca tgcatttgtt ccatagtatt tttgtgattg tgattaattt 360 tgagcagaag ctttttctga ttttaacaag gcgattgagt tagatccgtc aacggcaaaa 420 gcatatatgc gcaaggggtg agtatatcaa tcatttctat tggtatgctt ctttgtgacg 480 atgacgttat c 491 <210> 30 <211> 66 <212> PRT <213> Solanum lycopersicum <400> 30 Met Ala Ser Asp Leu Val Thr Lys Ala Lys Glu Ala Phe Ile Asp Asp 1 5 10 15 His Phe Glu Leu Ala Val Asp Leu Tyr Ser Gln Ala Ile Ala Ile Thr 20 25 30 Pro Asn Asn Ala Asp Leu Phe Ala Asp Arg Ala Gln Ala Asn Ile Lys 35 40 45 Leu Arg Lys Phe Thr Gly Asn Leu Phe Val Asn Met Val Pro Leu His 50 55 60 Ser Arg 65 <210> 31 <211> 1104 <212> DNA <213> Triticum aestivum <220> <221> misc_feature <222> (19)..(19) <223> n is a, c, g, or t <220> <221> misc_feature <222> (24)..(24) <223> n is a, c, g, or t <400> 31 cccacgcgtg ccgaagctna cctncggaag ggctctgctt gcatcaagct ggaggaatac 60 caaactgcaa aggctgctct tgaagtgggt tcttcttatg catctggtga ctcgaggttt 120 actcgtctga tgaaggagtg tgatgatcgt attgctgagg agggctagcc aggtgccagt 180 aaagaatgcc gctgcggctg ttgcttcagc tacatcttcg ggggcatctt ccggggctac 240 aactgtggct actgaagctg aggaccagga tggtgcaaat atggagaatg cacagccaac 300 ggtggaagtg ccaagcaagc ccaaatacag gcatgactac tacaatactc ctacagaagt 360 ggtactgact atatttgcta agggtgttcc agctgacagc gtggttgttg actttggtga 420 acagatgctg agtgtctcaa ttgaacttcc cggtgaggaa ccataccatt ttcagcctcg 480 tctgttttca aagatcgtcc cagataagtg caagtatact gtgttgtcta caaaggttga 540 aatgcgcctt gcaaaagctg agccagtaac ttggacatca ttggattata ctggtaaacc 600 aaaggctcct cagaagataa atgtaccagc tgaatcagcc cagaggccat cttatccatc 660 atcaaaatcc aaaaaggact gggataagct tgaagctgaa gtgaaaaaac aggagaagga 720 tgaaaaactt gatggcgatg ctgcattgaa caaatttttc cgtgaaattt acagtgatgc 780 tgatgaagat atgcgtagag caatgatgaa gtcttttgtg gagtctaatg gaaccgttct 840 ctcaaccaac tggaaggatg tcgggaaaaa gacggttgaa ggaagccctc ctgatggaat 900 ggagctcaag aagtgggagt attaatgaat ccagatcatc catgttgtaa atcctggtcg 960 ggtcgtgagt gttaacttgg ttgcagactt gcaaatcttg gcgccggatt tttggggtgg 1020 gcctgaatcg ttcccatatt gaacccgttg gcttcggggt actcttaggt cctttctcaa 1080 tttcggacca aagggggaaa aaaa 1104 <210> 32 <211> 260 <212> PRT <213> Triticum aestivum <400> 32 Met Ile Val Leu Leu Arg Arg Ala Ser Gln Val Pro Val Lys Asn Ala 1 5 10 15 Ala Ala Ala Val Ala Ser Ala Thr Ser Ser Gly Ala Ser Ser Gly Ala 20 25 30 Thr Thr Val Ala Thr Glu Ala Glu Asp Gln Asp Gly Ala Asn Met Glu 35 40 45 Asn Ala Gln Pro Thr Val Glu Val Pro Ser Lys Pro Lys Tyr Arg His 50 55 60 Asp Tyr Tyr Asn Thr Pro Thr Glu Val Val Leu Thr Ile Phe Ala Lys 65 70 75 80 Gly Val Pro Ala Asp Ser Val Val Val Asp Phe Gly Glu Gln Met Leu 85 90 95 Ser Val Ser Ile Glu Leu Pro Gly Glu Glu Pro Tyr His Phe Gln Pro 100 105 110 Arg Leu Phe Ser Lys Ile Val Pro Asp Lys Cys Lys Tyr Thr Val Leu 115 120 125 Ser Thr Lys Val Glu Met Arg Leu Ala Lys Ala Glu Pro Val Thr Trp 130 135 140 Thr Ser Leu Asp Tyr Thr Gly Lys Pro Lys Ala Pro Gln Lys Ile Asn 145 150 155 160 Val Pro Ala Glu Ser Ala Gln Arg Pro Ser Tyr Pro Ser Ser Lys Ser 165 170 175 Lys Lys Asp Trp Asp Lys Leu Glu Ala Glu Val Lys Lys Gln Glu Lys 180 185 190 Asp Glu Lys Leu Asp Gly Asp Ala Ala Leu Asn Lys Phe Phe Arg Glu 195 200 205 Ile Tyr Ser Asp Ala Asp Glu Asp Met Arg Arg Ala Met Met Lys Ser 210 215 220 Phe Val Glu Ser Asn Gly Thr Val Leu Ser Thr Asn Trp Lys Asp Val 225 230 235 240 Gly Lys Lys Thr Val Glu Gly Ser Pro Pro Asp Gly Met Glu Leu Lys 245 250 255 Lys Trp Glu Tyr 260 <210> 33 <211> 1444 <212> DNA <213> Zea mays <400> 33 ctcgattatt ctgtttgctc tcgttcaagt catcgtctgg tcgcgtcggc agcagacgcc 60 cagagccgga gggagcgcca tggccgcgtc ggatctggag agcaaagcca aggaggcctt 120 cgtcgacgac gacttcgagc tggccgccga actctacacg caggccatcg acgccgggcc 180 cgccactgcc gatctctacg ccgaccgcgc ccaggcgcac atcaagctcg gcaactacac 240 tgaggctgtg gcagatgcta acaaagcaat tggtcttgat cctacaatgc ataaagccta 300 ctaccggaaa ggtgctgcat gcattaagct tgaagaatac caaactgcaa aggctgctct 360 tgagttaggt tcttcctatg caccaggcga ttcaaggttt acccgtctat tgaaggaatg 420 tgatgagtgc attgctgagg aatctagcca ggcaccagca aagaatgtcg aggctcctgt 480 agctgctact gttgaggaca aggaggatgt cgcaaatatg gataatacac cgccagtggt 540 agaaccccca agcaaaccta aatataggca tgactactac aacagtgcca cagaagtggt 600 cctcacaata tatgctaagg gtgttcctgc tgatagtgta gtcattgatt ttggtgatca 660 gatgttgagt gtatccattg aagtacctgg tgaagaaccg taccattttc agccccgtct 720 gttttctaag attatccctg agaaatgcaa gtatcaagtt ttatccacca aggtcgaaat 780 acgccttgca aaagctgagc aggtgacatg gacaaccctg gattatagtg gaagaccaaa 840 ggctattccc cagaagataa gcacgccagc tgaaacagcc ccaagacctt catacccatc 900 ttcaaagtca aaaaaggact gggataaact ggaagctgaa gtaaaaaagg aggagaagga 960 agaaaaactt gaaggtgatg ctgcattgaa caagttcttc cgtgatatct acaaggatgc 1020 tgatgaagat atgcggaggg ccatggacaa gtcattcagg gaatctaatg gtaccgttct 1080 ctcaaccaat tggaaagatg ttggatcaaa gacggtggaa gcgagccctc ctgatggtat 1140 ggagctcaag aagtgggaaa tttgaagttt ggactgcccc tcttgtaaat ccaggtcttg 1200 gaagttatga cctagttctg tccacccatt tggtgtcgta agtttggtta agtgtgtgtg 1260 tgtttttggt tcagctgtcg ttcgaggaaa agctattgta agttgtggac tgtgtaaaag 1320 ctgcaataga ttgtgggttg tgaaaaaggt gtatgctgtt taatttaaac aagcataaaa 1380 cttaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaagggggg ggggaaaaaa 1440 aaaa 1444 <210> 34 <211> 361 <212> PRT <213> Zea mays <400> 34 Met Ala Ala Ser Asp Leu Glu Ser Lys Ala Lys Glu Ala Phe Val Asp 1 5 10 15 Asp Asp Phe Glu Leu Ala Ala Glu Leu Tyr Thr Gln Ala Ile Asp Ala 20 25 30 Gly Pro Ala Thr Ala Asp Leu Tyr Ala Asp Arg Ala Gln Ala His Ile 35 40 45 Lys Leu Gly Asn Tyr Thr Glu Ala Val Ala Asp Ala Asn Lys Ala Ile 50 55 60 Gly Leu Asp Pro Thr Met His Lys Ala Tyr Tyr Arg Lys Gly Ala Ala 65 70 75 80 Cys Ile Lys Leu Glu Glu Tyr Gln Thr Ala Lys Ala Ala Leu Glu Leu 85 90 95 Gly Ser Ser Tyr Ala Pro Gly Asp Ser Arg Phe Thr Arg Leu Leu Lys 100 105 110 Glu Cys Asp Glu Cys Ile Ala Glu Glu Ser Ser Gln Ala Pro Ala Lys 115 120 125 Asn Val Glu Ala Pro Val Ala Ala Thr Val Glu Asp Lys Glu Asp Val 130 135 140 Ala Asn Met Asp Asn Thr Pro Pro Val Val Glu Pro Pro Ser Lys Pro 145 150 155 160 Lys Tyr Arg His Asp Tyr Tyr Asn Ser Ala Thr Glu Val Val Leu Thr 165 170 175 Ile Tyr Ala Lys Gly Val Pro Ala Asp Ser Val Val Ile Asp Phe Gly 180 185 190 Asp Gln Met Leu Ser Val Ser Ile Glu Val Pro Gly Glu Glu Pro Tyr 195 200 205 His Phe Gln Pro Arg Leu Phe Ser Lys Ile Ile Pro Glu Lys Cys Lys 210 215 220 Tyr Gln Val Leu Ser Thr Lys Val Glu Ile Arg Leu Ala Lys Ala Glu 225 230 235 240 Gln Val Thr Trp Thr Thr Leu Asp Tyr Ser Gly Arg Pro Lys Ala Ile 245 250 255 Pro Gln Lys Ile Ser Thr Pro Ala Glu Thr Ala Pro Arg Pro Ser Tyr 260 265 270 Pro Ser Ser Lys Ser Lys Lys Asp Trp Asp Lys Leu Glu Ala Glu Val 275 280 285 Lys Lys Glu Glu Lys Glu Glu Lys Leu Glu Gly Asp Ala Ala Leu Asn 290 295 300 Lys Phe Phe Arg Asp Ile Tyr Lys Asp Ala Asp Glu Asp Met Arg Arg 305 310 315 320 Ala Met Asp Lys Ser Phe Arg Glu Ser Asn Gly Thr Val Leu Ser Thr 325 330 335 Asn Trp Lys Asp Val Gly Ser Lys Thr Val Glu Ala Ser Pro Pro Asp 340 345 350 Gly Met Glu Leu Lys Lys Trp Glu Ile 355 360 <210> 35 <211> 1446 <212> DNA <213> Zea mays <400> 35 ttcgattatt ctgttcgctc tcgcccaagt catcgtctgg tcgtcgcccg cagaggcgca 60 gacgcccaaa accggaaggg gcgccatggc cgcgtcggat ctggagagca aggccaagga 120 ggccttcgtc gacgacgact tcgagctggc caccgagctc tacagccagg ccatcgacgc 180 cgggcccgcc accgccgacc tctatgccga ccgcgcccag gcgcacatca agctcggcaa 240 ctacactgag gctgtggcgg atgctaacaa agcaattgag cttgatccta tgatgcataa 300 agcttactac cggaaaggtg ctgcatgcat taagcttgaa gaataccaaa ctgcaaaggc 360 tgctcttgag ttgggttctt cttatgcatc aggcgattca aggtttgctc gtctattgaa 420 ggaatgtgat gagcgcatcg ctgaggaatc tagccaggca ccagtaaaga atgttgaggc 480 tactgtggct gctactattg aggacaagga ggatttcaca aatatggaga atacaccacc 540 agtgatagaa cccccaagca aaccaaaata caggcatgac tactacaaca gtgccacaga 600 agtggtactg acaatatttg ctaagggtgt tcctgctgat agtgtagtca ttgattttgg 660 tgaacagatg ttgagtgtat ccattgaagt tcctggtgaa gaaccatacc attttcagcc 720 ccgtctgttt tctaagatta tccctgagaa atgcaaatat caagtcttat ccaccaaggt 780 tgaaatacgc cttgcaaaag ctgagcaggt gacatggaca accctggatt atagtggaag 840 accaaagact gttccccaga agataagcac gccagctgaa acagccccaa gaccttcata 900 cccatcttca aaggcgaaaa aagactggga taaactggaa gctgaagtca aaaaggagga 960 gaaggaagaa aaacttgatg gtgatgctgc attgaacaaa ttcttccgtg acatctacaa 1020 ggatgctgat gaagatatgc ggagggccat gatgaagtca ttcgtggaat caaatggcac 1080 tgttctctca accaattgga aagatgttgg agcaaagaag gtagaaggga gcccccctga 1140 tggtatggag ctcaagaagt gggaatacta aagtttggac tgcccatctt ttgtaaatcc 1200 aggtcttgga aactatgacc taattccgtc cacccatagt gccatgagct tgcttggtta 1260 agtctctgct tttgtaagct ttctgtatga cagtctagcg tgtgtctgag tgctacttgc 1320 cgtagctttt gatggacata ggtatgctat tatgtggtat cgaccgggaa ccatctgtgg 1380 tatcaaagac agcaaactat aatgtatgga atgcctattc tttttggtcg aaaaaaaaaa 1440 aaaaaa 1446 <210> 36 <211> 361 <212> PRT <213> Zea mays <400> 36 Met Ala Ala Ser Asp Leu Glu Ser Lys Ala Lys Glu Ala Phe Val Asp 1 5 10 15 Asp Asp Phe Glu Leu Ala Thr Glu Leu Tyr Ser Gln Ala Ile Asp Ala 20 25 30 Gly Pro Ala Thr Ala Asp Leu Tyr Ala Asp Arg Ala Gln Ala His Ile 35 40 45 Lys Leu Gly Asn Tyr Thr Glu Ala Val Ala Asp Ala Asn Lys Ala Ile 50 55 60 Glu Leu Asp Pro Met Met His Lys Ala Tyr Tyr Arg Lys Gly Ala Ala 65 70 75 80 Cys Ile Lys Leu Glu Glu Tyr Gln Thr Ala Lys Ala Ala Leu Glu Leu 85 90 95 Gly Ser Ser Tyr Ala Ser Gly Asp Ser Arg Phe Ala Arg Leu Leu Lys 100 105 110 Glu Cys Asp Glu Arg Ile Ala Glu Glu Ser Ser Gln Ala Pro Val Lys 115 120 125 Asn Val Glu Ala Thr Val Ala Ala Thr Ile Glu Asp Lys Glu Asp Phe 130 135 140 Thr Asn Met Glu Asn Thr Pro Pro Val Ile Glu Pro Pro Ser Lys Pro 145 150 155 160 Lys Tyr Arg His Asp Tyr Tyr Asn Ser Ala Thr Glu Val Val Leu Thr 165 170 175 Ile Phe Ala Lys Gly Val Pro Ala Asp Ser Val Val Ile Asp Phe Gly 180 185 190 Glu Gln Met Leu Ser Val Ser Ile Glu Val Pro Gly Glu Glu Pro Tyr 195 200 205 His Phe Gln Pro Arg Leu Phe Ser Lys Ile Ile Pro Glu Lys Cys Lys 210 215 220 Tyr Gln Val Leu Ser Thr Lys Val Glu Ile Arg Leu Ala Lys Ala Glu 225 230 235 240 Gln Val Thr Trp Thr Thr Leu Asp Tyr Ser Gly Arg Pro Lys Thr Val 245 250 255 Pro Gln Lys Ile Ser Thr Pro Ala Glu Thr Ala Pro Arg Pro Ser Tyr 260 265 270 Pro Ser Ser Lys Ala Lys Lys Asp Trp Asp Lys Leu Glu Ala Glu Val 275 280 285 Lys Lys Glu Glu Lys Glu Glu Lys Leu Asp Gly Asp Ala Ala Leu Asn 290 295 300 Lys Phe Phe Arg Asp Ile Tyr Lys Asp Ala Asp Glu Asp Met Arg Arg 305 310 315 320 Ala Met Met Lys Ser Phe Val Glu Ser Asn Gly Thr Val Leu Ser Thr 325 330 335 Asn Trp Lys Asp Val Gly Ala Lys Lys Val Glu Gly Ser Pro Pro Asp 340 345 350 Gly Met Glu Leu Lys Lys Trp Glu Tyr 355 360 <210> 37 <211> 34 <212> PRT <213> Artificial sequence <220> <223> TPR1 <400> 37 Ser Lys Ala Tyr Leu Arg Lys Gly Leu Ala Cys Met Lys Leu Glu Glu 1 5 10 15 Tyr Gln Thr Ala Lys Ala Ala Leu Glu Thr Gly Ala Ser Leu Ala Pro 20 25 30 Gly Glu <210> 38 <211> 34 <212> PRT <213> Artificial sequence <220> <223> TPR2a <400> 38 Ala Ser Asp Leu Glu Thr Arg Ala Lys Glu Ala Phe Ile Asp Asp His 1 5 10 15 Phe Glu Leu Ala Val Asp Leu Tyr Thr Gln Ala Ile Ser Leu Ser Pro 20 25 30 Lys Asn <210> 39 <211> 34 <212> PRT <213> Artificial sequence <220> <223> TPR2b <400> 39 Pro Glu Leu Phe Ala Asp Arg Ala Gln Ala Asn Ile Lys Leu Asn Tyr 1 5 10 15 Phe Thr Glu Ala Val Val Asp Ala Asn Lys Ala Ile Glu Leu Asp Pro 20 25 30 Tyr Met <210> 40 <211> 77 <212> PRT <213> Artificial sequence <220> <223> CS domain <400> 40 Tyr Arg His Glu Phe Tyr Gln Lys Pro Glu Glu Val Val Val Thr Ile 1 5 10 15 Phe Ala Lys Gly Ile Pro Ala Lys Asn Val Val Val Asp Phe Gly Glu 20 25 30 Gln Ile Leu Ser Val Ser Ile Asp Leu Pro Gly Gly Glu Thr Tyr Ser 35 40 45 Phe Gln Pro Arg Leu Phe Gly Lys Ile Thr Pro Ala Lys Cys Arg Tyr 50 55 60 Glu Val Met Ser Thr Lys Ile Glu Ile Arg Leu Ala Lys 65 70 75 <210> 41 <211> 82 <212> PRT <213> Artificial sequence <220> <223> SGS domain <400> 41 Asn Val Asp Trp Asp Lys Leu Glu Ala Gln Val Lys Lys Glu Glu Lys 1 5 10 15 Asp Glu Lys Leu Asp Gly Asp Ala Ala Leu Asn Lys Phe Phe Arg Asp 20 25 30 Ile Tyr Lys Asp Ala Asp Glu Asp Thr Arg Arg Ala Met Met Lys Ser 35 40 45 Phe Val Glu Ser Asn Gly Thr Val Leu Ser Thr Asn Trp Lys Lys Val 50 55 60 Gly Thr Lys Lys Val Glu Gly Ser Pro Pro Asp Gly Met Glu Leu Lys 65 70 75 80 Lys Trp <210> 42 <211> 26 <212> PRT <213> Artificial sequence <220> <223> motif 1 <400> 42 Asp Leu Glu Thr Arg Ala Lys Glu Ala Phe Ile Asp Asp His Phe Glu 1 5 10 15 Leu Ala Val Asp Leu Tyr Thr Gln Ala Ile 20 25 <210> 43 <211> 10 <212> PRT <213> Artificial sequence <220> <223> motif 2 <400> 43 Ala Asp Arg Ala Gln Ala Asn Ile Lys Leu 1 5 10 <210> 44 <211> 16 <212> PRT <213> Artificial sequence <220> <223> motif 3 <400> 44 Leu Glu Glu Tyr Gln Thr Ala Lys Ala Ala Leu Glu Thr Gly Ala Ser 1 5 10 15 <210> 45 <211> 23 <212> PRT <213> Artificial sequence <220> <223> motif 4 <400> 45 Lys Tyr Arg His Glu Phe Tyr Gln Lys Pro Glu Glu Val Val Val Thr 1 5 10 15 Ile Phe Ala Lys Gly Ile Pro 20 <210> 46 <211> 30 <212> PRT <213> Artificial sequence <220> <223> motif 5 <400> 46 Gln Pro Arg Leu Phe Gly Lys Ile Thr Pro Ala Lys Cys Arg Tyr Glu 1 5 10 15 Val Met Ser Thr Lys Ile Glu Ile Arg Leu Ala Lys Ala Glu 20 25 30 <210> 47 <211> 17 <212> PRT <213> Artificial sequence <220> <223> motif 6 <400> 47 Glu Ala Gln Val Lys Lys Glu Glu Lys Asp Glu Lys Leu Asp Gly Asp 1 5 10 15 Ala <210> 48 <211> 47 <212> PRT <213> Artificial sequence <220> <223> motif 7 <400> 48 Ala Leu Asn Lys Phe Phe Arg Asp Ile Tyr Lys Asp Ala Asp Glu Asp 1 5 10 15 Thr Arg Arg Ala Met Met Lys Ser Phe Val Glu Ser Asn Gly Thr Val 20 25 30 Leu Ser Thr Asn Trp Lys Lys Val Gly Thr Lys Lys Val Glu Gly 35 40 45 <210> 49 <211> 13 <212> PRT <213> Artificial sequence <220> <223> motif 8 <400> 49 Ser Pro Pro Asp Gly Met Glu Leu Lys Lys Trp Glu Ile 1 5 10 <210> 50 <211> 1264 <212> DNA <213> Oryza sativa <400> 50 tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60 ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120 tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180 acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240 gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300 ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360 cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420 gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480 aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540 tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600 caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660 ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720 gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780 tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840 cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900 gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960 aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020 aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080 atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140 tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200 taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260 gatc 1264 <210> 51 <211> 51 <212> DNA <213> Artificial sequence <220> <223> primer: prm14133 <400> 51 ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gtccgatctg g 51 <210> 52 <211> 52 <212> DNA <213> Artificial sequence <220> <223> primer: prm14134 <400> 52 ggggaccact ttgtacaaga aagctgggtc acaaaagata aacagcagat tg 52 <210> 53 <211> 2700 <212> DNA <213> Synechocystis sp. <400> 53 ttactcgtct agaccgaaat ctggggccag gggagggacg atcgcctctt cgttggggga 60 gtccactgga ccgcggaaaa taaacacagt ggtgttggtt tggctagcga tttgggtggg 120 taaattgccg tggatgacat ttttgagcaa tccttcccta ctggccccca gcacgattgc 180 cgcacattca cgcatttccg ccaggtcact gagggcatcg gcaatggaag tggagcacac 240 aggaatggga ataatcggtc tttgtaactg ttctgaccac cgttctgcca ggttttttaa 300 atcgtaaaaa gggtcatagc gctgggattg acggggtaga taaactttag aaatcagtag 360 ctgggggtta ttttcctccg ggtaaaggga aaacaacgcc ggcaacagat ttaacatttt 420 ttcaatgttg gggcctcccg ctaccggcat taaccagtgg gccatggggg ataaatagcg 480 gggataggcg tggtcattgg tgccctgttt aaccattaat aaagagcagg gggcttggtc 540 aatcaggcga tccgtgattt ggccaaaaat ttggccgcca atgggcattt ccccttgcca 600 ttcaaggatt agcaggtcgc tatggcgggt ttgaatggta tcaaggatgg tgtcggtaat 660 gctgtaggcc agcttgattt ccgtatggaa taacactctc tggtggcggg caatgcgttc 720 cagtttttgc atcagttgcc gttgcctctg ccattgcacc ctttgcacag aaggggattg 780 agctttagat accttgacca cctgcaaaca gtcaatttcg tagttttgct ttttggcgat 840 tgccgccgca atttgaaaca aaactaaagc actatcggag tcccggatgg gtaataaaat 900 gcgcccttct cccaccaacg gcgatcgggt ttggtatacg ctgtaggcgg gatggggagg 960 atggataatt tgccccccta actgactcac ttcctcccga ataatgtctg tgcgggtgat 1020 aatgcccact aatttgttgt ccccttccac caccggcaac cgggaaagtt gataacggtt 1080 gagcaaatag agcacatcac tgaggggcgc ttccggatct acagtgatgg gattgggggt 1140 cataatttgc ttaagggcaa tgtgcaccga ctcctgggcc gcattggcca aatccgtttg 1200 ggtaaatacc cccaccagtt tgcccccctg caccacggga aagccccggt gatgggaatt 1260 ggacataatc ggtagcacct gggctagggt gagactctgc tccaggcttt ccacctccgt 1320 tttcattacc tggccagctc ggatatcagc gagaaagtca tggtctggct tttcctctgc 1380 caaaaaaatg cccttggttt ccagcaaatg atcgtacaaa gaacggggaa agagactttc 1440 cgccactaga taggacgtgg cacaggccac catcagggga agcaccacgt tgaaattgcc 1500 cgttagctca aaaacaatga tgatcgccgt cactggcacc cgcaccacac tagtgaaaaa 1560 agcgcccatc cccgccaggg caaaggtagt ttgggtaact tgatcttgcc aataactgcc 1620 aaattccccc accagataac ccagggccga ccccatcact aaagccggcg caaataatcc 1680 tcccggcgca tcggtgctgt aggccaggat agtcaaaatg aaatgggcca ctaaggtcaa 1740 aactacctga tgccaactca gttctccgga agtaacaaat tccctcagcc ctgcattgtc 1800 ccgaaaaaag ctcggcaata gggcgatcgc cacgccggaa attaagccca caacaccaat 1860 gcgaataacc agggaaaggt tctgttttct ttgccagttt tgcagggaga gaatactgcg 1920 gttgagcaaa acccccaaaa tgccagccaa aattcccagt aaaagataga aaggaatctc 1980 ccccgtagta aaacgcaccg ttgggctatt gcttaagcta tgggccaggt taaggtcact 2040 ggattggaat accaaagacg tgacagcccc cacgaaggaa gcgacgatcg ccgtttctag 2100 ggtcaagcta gacacatccc gcattaattc ttccaccaca aacaaaaccc cagcaatggg 2160 ggtggtgaag cccgccgcta atcccgccgc cgccccggcc gcaatcattt gccgccgatg 2220 ttccggggaa gtgggaaacc accgactcaa ctgggccgct agagctgcgc caatatgaac 2280 cgtgggagcc cgccgtccca aggtcatgcc tccccccagc actagcactg ttcccaacag 2340 cttgaccacc gccacccgcc aatctagggg aataggatac cgagccaggg ccgctttcac 2400 ctggggaatg ccaccgcccc ccgccggtcg ggaaaattgt tcaattaatg cccccgccaa 2460 acccccaaac accaagccaa aacagggcag cacccaaatg gccccatagg tatccgccag 2520 actcaaacgg ctggacccta accagttgac tccgttttta attactaagg ccgctagggc 2580 agaaacaaat ccgatcacac aggcttcggc gatcgcataa cggctatcga tggcagtgcg 2640 gccatagtgt cgagagcgca accattgttg ccaccgttgc caaaagggaa accaagccat 2700 <210> 54 <211> 899 <212> PRT <213> Synechocystis sp. <400> 54 Met Ala Trp Phe Pro Phe Trp Gln Arg Trp Gln Gln Trp Leu Arg Ser 1 5 10 15 Arg His Tyr Gly Arg Thr Ala Ile Asp Ser Arg Tyr Ala Ile Ala Glu 20 25 30 Ala Cys Val Ile Gly Phe Val Ser Ala Leu Ala Ala Leu Val Ile Lys 35 40 45 Asn Gly Val Asn Trp Leu Gly Ser Ser Arg Leu Ser Leu Ala Asp Thr 50 55 60 Tyr Gly Ala Ile Trp Val Leu Pro Cys Phe Gly Leu Val Phe Gly Gly 65 70 75 80 Leu Ala Gly Ala Leu Ile Glu Gln Phe Ser Arg Pro Ala Gly Gly Gly 85 90 95 Gly Ile Pro Gln Val Lys Ala Ala Leu Ala Arg Tyr Pro Ile Pro Leu 100 105 110 Asp Trp Arg Val Ala Val Val Lys Leu Leu Gly Thr Val Leu Val Leu 115 120 125 Gly Gly Gly Met Thr Leu Gly Arg Arg Ala Pro Thr Val His Ile Gly 130 135 140 Ala Ala Leu Ala Ala Gln Leu Ser Arg Trp Phe Pro Thr Ser Pro Glu 145 150 155 160 His Arg Arg Gln Met Ile Ala Ala Gly Ala Ala Ala Gly Leu Ala Ala 165 170 175 Gly Phe Thr Thr Pro Ile Ala Gly Val Leu Phe Val Val Glu Glu Leu 180 185 190 Met Arg Asp Val Ser Ser Leu Thr Leu Glu Thr Ala Ile Val Ala Ser 195 200 205 Phe Val Gly Ala Val Thr Ser Leu Val Phe Gln Ser Ser Asp Leu Asn 210 215 220 Leu Ala His Ser Leu Ser Asn Ser Pro Thr Val Arg Phe Thr Thr Gly 225 230 235 240 Glu Ile Pro Phe Tyr Leu Leu Leu Gly Ile Leu Ala Gly Ile Leu Gly 245 250 255 Val Leu Leu Asn Arg Ser Ile Leu Ser Leu Gln Asn Trp Gln Arg Lys 260 265 270 Gln Asn Leu Ser Leu Val Ile Arg Ile Gly Val Val Gly Leu Ile Ser 275 280 285 Gly Val Ala Ile Ala Leu Leu Pro Ser Phe Phe Arg Asp Asn Ala Gly 290 295 300 Leu Arg Glu Phe Val Thr Ser Gly Glu Leu Ser Trp His Gln Val Val 305 310 315 320 Leu Thr Leu Val Ala His Phe Ile Leu Thr Ile Leu Ala Tyr Ser Thr 325 330 335 Asp Ala Pro Gly Gly Leu Phe Ala Pro Ala Leu Val Met Gly Ser Ala 340 345 350 Leu Gly Tyr Leu Val Gly Glu Phe Gly Ser Tyr Trp Gln Asp Gln Val 355 360 365 Thr Gln Thr Thr Phe Ala Leu Ala Gly Met Gly Ala Phe Phe Thr Ser 370 375 380 Val Val Arg Val Pro Val Thr Ala Ile Ile Ile Val Phe Glu Leu Thr 385 390 395 400 Gly Asn Phe Asn Val Val Leu Pro Leu Met Val Ala Cys Ala Thr Ser 405 410 415 Tyr Leu Val Ala Glu Ser Leu Phe Pro Arg Ser Leu Tyr Asp His Leu 420 425 430 Leu Glu Thr Lys Gly Ile Phe Leu Ala Glu Glu Lys Pro Asp His Asp 435 440 445 Phe Leu Ala Asp Ile Arg Ala Gly Gln Val Met Lys Thr Glu Val Glu 450 455 460 Ser Leu Glu Gln Ser Leu Thr Leu Ala Gln Val Leu Pro Ile Met Ser 465 470 475 480 Asn Ser His His Arg Gly Phe Pro Val Val Gln Gly Gly Lys Leu Val 485 490 495 Gly Val Phe Thr Gln Thr Asp Leu Ala Asn Ala Ala Gln Glu Ser Val 500 505 510 His Ile Ala Leu Lys Gln Ile Met Thr Pro Asn Pro Ile Thr Val Asp 515 520 525 Pro Glu Ala Pro Leu Ser Asp Val Leu Tyr Leu Leu Asn Arg Tyr Gln 530 535 540 Leu Ser Arg Leu Pro Val Val Glu Gly Asp Asn Lys Leu Val Gly Ile 545 550 555 560 Ile Thr Arg Thr Asp Ile Ile Arg Glu Glu Val Ser Gln Leu Gly Gly 565 570 575 Gln Ile Ile His Pro Pro His Pro Ala Tyr Ser Val Tyr Gln Thr Arg 580 585 590 Ser Pro Leu Val Gly Glu Gly Arg Ile Leu Leu Pro Ile Arg Asp Ser 595 600 605 Asp Ser Ala Leu Val Leu Phe Gln Ile Ala Ala Ala Ile Ala Lys Lys 610 615 620 Gln Asn Tyr Glu Ile Asp Cys Leu Gln Val Val Lys Val Ser Lys Ala 625 630 635 640 Gln Ser Pro Ser Val Gln Arg Val Gln Trp Gln Arg Gln Arg Gln Leu 645 650 655 Met Gln Lys Leu Glu Arg Ile Ala Arg His Gln Arg Val Leu Phe His 660 665 670 Thr Glu Ile Lys Leu Ala Tyr Ser Ile Thr Asp Thr Ile Leu Asp Thr 675 680 685 Ile Gln Thr Arg His Ser Asp Leu Leu Ile Leu Glu Trp Gln Gly Glu 690 695 700 Met Pro Ile Gly Gly Gln Ile Phe Gly Gln Ile Thr Asp Arg Leu Ile 705 710 715 720 Asp Gln Ala Pro Cys Ser Leu Leu Met Val Lys Gln Gly Thr Asn Asp 725 730 735 His Ala Tyr Pro Arg Tyr Leu Ser Pro Met Ala His Trp Leu Met Pro 740 745 750 Val Ala Gly Gly Pro Asn Ile Glu Lys Met Leu Asn Leu Leu Pro Ala 755 760 765 Leu Phe Ser Leu Tyr Pro Glu Glu Asn Asn Pro Gln Leu Leu Ile Ser 770 775 780 Lys Val Tyr Leu Pro Arg Gln Ser Gln Arg Tyr Asp Pro Phe Tyr Asp 785 790 795 800 Leu Lys Asn Leu Ala Glu Arg Trp Ser Glu Gln Leu Gln Arg Pro Ile 805 810 815 Ile Pro Ile Pro Val Cys Ser Thr Ser Ile Ala Asp Ala Leu Ser Asp 820 825 830 Leu Ala Glu Met Arg Glu Cys Ala Ala Ile Val Leu Gly Ala Ser Arg 835 840 845 Glu Gly Leu Leu Lys Asn Val Ile His Gly Asn Leu Pro Thr Gln Ile 850 855 860 Ala Ser Gln Thr Asn Thr Thr Val Phe Ile Phe Arg Gly Pro Val Asp 865 870 875 880 Ser Pro Asn Glu Glu Ala Ile Val Pro Pro Leu Ala Pro Asp Phe Gly 885 890 895 Leu Asp Glu <210> 55 <211> 2628 <212> DNA <213> Cyanothece sp. <400> 55 atgaatattt atctgcccat aaaacgccta cggggttggt ttaaagccag acgctttgga 60 cggagttccg ttgatacccg ctacgccatg ctagaagctt gtttaattgg gattttatcg 120 gctgttgctg ccttagtgtt aaaacaggga gtgggatggt tagggggatg gagactgagc 180 ctgacgagaa catttggagc gctctggata cttcctttag ggggtttaat cttaggatta 240 ctggcaggat gggtcataga aattttatca ccggcagcgg caggaggagg aattccgcaa 300 gttaaggccg ctttagctcg atttcccgtt cccttatctt tgcgggtagc cctcgctaaa 360 ttaatcggag ctattttagt gttaggagcg gggttgacct tgggacggag agcgcctacg 420 gttcatattg gggcagcttt agcagcgcaa ctgagtcaat ggcttcccac ttccccagaa 480 catcgtcgtc aaatgattgc agccggagca gcctccggac tagcagccgg ttttggaact 540 cccatcgccg gagttttatt tgttattgaa gaattgatgc gagatgtttc tgggttgaca 600 ttagagacgg cgattattgc ctcctttact ggggcagtag tgtcgttatt gctagagtct 660 accggtccga ttatccctgc acctctaaac attacctttt ctgcgcgaga aattcctttg 720 tatcttttgc ttggtttttt agccggaatt ctaggggcgt tatttaatgc gggtattctc 780 ttttgtatga gggtacaaaa gcaacttaga ctaagcattc cctggcgcat aggcttagtt 840 tgcatgattt caggggcggt tattgcggta ttacctcctt tttttcgtga caattctgga 900 ttaagagaat ttttaattac aggggaatta ggttggcgta atatcttatt agcgttgatt 960 gcccattttt ttctcactat tttggcctat agttctagcg ctccgggcgg tctatttgca 1020 ccggctttag tgatgggatc agccctaggc tatttagtgg gggatttagg agaattatta 1080 acaggttcag gagcggctac aacttacgct ttagcgggga tgggagggtt ttttaccgca 1140 gtggttcgcg ctccggtgac ggccattgtg attgtctttg aattgagggc taattttaat 1200 attgtgctgc ctttaatgat tacctgtgcg gtgtcttatt tggtggctga aaatgtgttt 1260 agtcggtcta tttatgaaca tttgctcgat gcgagtggga ttcatttaac cgaagaaata 1320 ccggttaatg atttcttgag taaattaaaa gcttctgatg tgatgcaatc tcaggtagaa 1380 accttagata gttatcttag ccttgaggcc gttttacagg ccatgtcgat ttctcgtcat 1440 cgagggtttc cggtagtaga agagggaaaa ttagtgggaa ttgtgactca aagtgatttg 1500 tcgaatctcg gcgatcgctc tgaggagctt accctacgtc agattatgac cccaaaaccg 1560 attactgtgc aaccagaaac ctccttaagt gatgttcttt atttgctcaa ccgttatcaa 1620 ttatcccgtt tacccgtcac cgaaggacat aaattagtcg gcattattac ccgcaccgat 1680 atcattcaag cagaggtgaa gcaattggga gggggaacaa tgcaaggatc taaacctgca 1740 ccttcctatg tcacctatca aacccgttcg ccggccttgg gaaatggccg cattttatta 1800 cccttatctg atggggaaat ggccggaact ttgttgcaaa ttgccgccgc gatcgcccgt 1860 catcgcaact atgaaataga atgtctccaa gtgattaaag ttcccagaca tcaatttccc 1920 tcagaagcta ggatagatat tcatcatagc cgtaagttaa tgcaacggat ggaaagattg 1980 gcgcgtcatc tgaatgttcc cgttcatact caaattagaa tcgctcagga tacagcacaa 2040 tcgatcatag aaacaattca ggaacgacat ataaatttaa tgttgatgag ttggaaagga 2100 ggaggagata ctcaaggggc aatatttggc aatgttactg atacgttaat tcataaagct 2160 ccctgtgatt taatgttagt caaattgggg gcaagtccca ctgcatatcc tcacaactta 2220 gagcataatg cgacttggtt agtgccgatg gcaggagggc caaatgctca acgagccatt 2280 gaattattgc cgagcttaac gacattatat gctaatccta atgcgcctga gctttggtta 2340 tgtaaagtct atcctcctac agaattagaa cctaattccc aagcgttaga agaggcggcg 2400 caaaccttaa cagaaaagct caataaatcc attattccta tttctattcg ttctcattct 2460 gtggctgatg ctttgattca tttagcccaa gcagaagtct gtgatttaat tattttaggg 2520 gcttctagag aagggttatt acaacaggca attcatggta atattcctga tgcgatcgct 2580 tcgggggtgg atagtacggt tattgtcgtc aggggagcaa ttgattaa 2628 <210> 56 <211> 875 <212> PRT <213> Cyanothece sp. <400> 56 Met Asn Ile Tyr Leu Pro Ile Lys Arg Leu Arg Gly Trp Phe Lys Ala 1 5 10 15 Arg Arg Phe Gly Arg Ser Ser Val Asp Thr Arg Tyr Ala Met Leu Glu 20 25 30 Ala Cys Leu Ile Gly Ile Leu Ser Ala Val Ala Ala Leu Val Leu Lys 35 40 45 Gln Gly Val Gly Trp Leu Gly Gly Trp Arg Leu Ser Leu Thr Arg Thr 50 55 60 Phe Gly Ala Leu Trp Ile Leu Pro Leu Gly Gly Leu Ile Leu Gly Leu 65 70 75 80 Leu Ala Gly Trp Val Ile Glu Ile Leu Ser Pro Ala Ala Ala Gly Gly 85 90 95 Gly Ile Pro Gln Val Lys Ala Ala Leu Ala Arg Phe Pro Val Pro Leu 100 105 110 Ser Leu Arg Val Ala Leu Ala Lys Leu Ile Gly Ala Ile Leu Val Leu 115 120 125 Gly Ala Gly Leu Thr Leu Gly Arg Arg Ala Pro Thr Val His Ile Gly 130 135 140 Ala Ala Leu Ala Ala Gln Leu Ser Gln Trp Leu Pro Thr Ser Pro Glu 145 150 155 160 His Arg Arg Gln Met Ile Ala Ala Gly Ala Ala Ser Gly Leu Ala Ala 165 170 175 Gly Phe Gly Thr Pro Ile Ala Gly Val Leu Phe Val Ile Glu Glu Leu 180 185 190 Met Arg Asp Val Ser Gly Leu Thr Leu Glu Thr Ala Ile Ile Ala Ser 195 200 205 Phe Thr Gly Ala Val Val Ser Leu Leu Leu Glu Ser Thr Gly Pro Ile 210 215 220 Ile Pro Ala Pro Leu Asn Ile Thr Phe Ser Ala Arg Glu Ile Pro Leu 225 230 235 240 Tyr Leu Leu Leu Gly Phe Leu Ala Gly Ile Leu Gly Ala Leu Phe Asn 245 250 255 Ala Gly Ile Leu Phe Cys Met Arg Val Gln Lys Gln Leu Arg Leu Ser 260 265 270 Ile Pro Trp Arg Ile Gly Leu Val Cys Met Ile Ser Gly Ala Val Ile 275 280 285 Ala Val Leu Pro Pro Phe Phe Arg Asp Asn Ser Gly Leu Arg Glu Phe 290 295 300 Leu Ile Thr Gly Glu Leu Gly Trp Arg Asn Ile Leu Leu Ala Leu Ile 305 310 315 320 Ala His Phe Phe Leu Thr Ile Leu Ala Tyr Ser Ser Ser Ala Pro Gly 325 330 335 Gly Leu Phe Ala Pro Ala Leu Val Met Gly Ser Ala Leu Gly Tyr Leu 340 345 350 Val Gly Asp Leu Gly Glu Leu Leu Thr Gly Ser Gly Ala Ala Thr Thr 355 360 365 Tyr Ala Leu Ala Gly Met Gly Gly Phe Phe Thr Ala Val Val Arg Ala 370 375 380 Pro Val Thr Ala Ile Val Ile Val Phe Glu Leu Arg Ala Asn Phe Asn 385 390 395 400 Ile Val Leu Pro Leu Met Ile Thr Cys Ala Val Ser Tyr Leu Val Ala 405 410 415 Glu Asn Val Phe Ser Arg Ser Ile Tyr Glu His Leu Leu Asp Ala Ser 420 425 430 Gly Ile His Leu Thr Glu Glu Ile Pro Val Asn Asp Phe Leu Ser Lys 435 440 445 Leu Lys Ala Ser Asp Val Met Gln Ser Gln Val Glu Thr Leu Asp Ser 450 455 460 Tyr Leu Ser Leu Glu Ala Val Leu Gln Ala Met Ser Ile Ser Arg His 465 470 475 480 Arg Gly Phe Pro Val Val Glu Glu Gly Lys Leu Val Gly Ile Val Thr 485 490 495 Gln Ser Asp Leu Ser Asn Leu Gly Asp Arg Ser Glu Glu Leu Thr Leu 500 505 510 Arg Gln Ile Met Thr Pro Lys Pro Ile Thr Val Gln Pro Glu Thr Ser 515 520 525 Leu Ser Asp Val Leu Tyr Leu Leu Asn Arg Tyr Gln Leu Ser Arg Leu 530 535 540 Pro Val Thr Glu Gly His Lys Leu Val Gly Ile Ile Thr Arg Thr Asp 545 550 555 560 Ile Ile Gln Ala Glu Val Lys Gln Leu Gly Gly Gly Thr Met Gln Gly 565 570 575 Ser Lys Pro Ala Pro Ser Tyr Val Thr Tyr Gln Thr Arg Ser Pro Ala 580 585 590 Leu Gly Asn Gly Arg Ile Leu Leu Pro Leu Ser Asp Gly Glu Met Ala 595 600 605 Gly Thr Leu Leu Gln Ile Ala Ala Ala Ile Ala Arg His Arg Asn Tyr 610 615 620 Glu Ile Glu Cys Leu Gln Val Ile Lys Val Pro Arg His Gln Phe Pro 625 630 635 640 Ser Glu Ala Arg Ile Asp Ile His His Ser Arg Lys Leu Met Gln Arg 645 650 655 Met Glu Arg Leu Ala Arg His Leu Asn Val Pro Val His Thr Gln Ile 660 665 670 Arg Ile Ala Gln Asp Thr Ala Gln Ser Ile Ile Glu Thr Ile Gln Glu 675 680 685 Arg His Ile Asn Leu Met Leu Met Ser Trp Lys Gly Gly Gly Asp Thr 690 695 700 Gln Gly Ala Ile Phe Gly Asn Val Thr Asp Thr Leu Ile His Lys Ala 705 710 715 720 Pro Cys Asp Leu Met Leu Val Lys Leu Gly Ala Ser Pro Thr Ala Tyr 725 730 735 Pro His Asn Leu Glu His Asn Ala Thr Trp Leu Val Pro Met Ala Gly 740 745 750 Gly Pro Asn Ala Gln Arg Ala Ile Glu Leu Leu Pro Ser Leu Thr Thr 755 760 765 Leu Tyr Ala Asn Pro Asn Ala Pro Glu Leu Trp Leu Cys Lys Val Tyr 770 775 780 Pro Pro Thr Glu Leu Glu Pro Asn Ser Gln Ala Leu Glu Glu Ala Ala 785 790 795 800 Gln Thr Leu Thr Glu Lys Leu Asn Lys Ser Ile Ile Pro Ile Ser Ile 805 810 815 Arg Ser His Ser Val Ala Asp Ala Leu Ile His Leu Ala Gln Ala Glu 820 825 830 Val Cys Asp Leu Ile Ile Leu Gly Ala Ser Arg Glu Gly Leu Leu Gln 835 840 845 Gln Ala Ile His Gly Asn Ile Pro Asp Ala Ile Ala Ser Gly Val Asp 850 855 860 Ser Thr Val Ile Val Val Arg Gly Ala Ile Asp 865 870 875 <210> 57 <211> 2625 <212> DNA <213> Cyanothece sp. <400> 57 ttaatcaatc gctcctcgta ccacaataac cgtactatca accccacgag caatagcatc 60 aggaatattc ccatgaatag cctgctgtaa taacccttcc cgagacgctc ccaaaacaat 120 cacatcacac tcttcggcgc gagctaattg tattaaagca tcagaaacag aattagaacg 180 aatagaaata ggaaaaatcg gtttattcaa tttatctctt aaaatttgag ccgcttcttc 240 taacccttga gaatccggtt caatctctga aggaggataa actttacaca gccacaactg 300 aggggcatcc ggattagaat ataatcgtgt taaactcggt aataattcaa ttgctcgttg 360 agcatttggc ccccccgcca tcggcactaa ccaagtagca ttatgctcta aatttagggg 420 ataagcatta gcactagctc caagtttaac taacattaaa tcacagggag ctttatgaat 480 caaggtatct gcaacactgc caaaaattgc cccttgacta tcactaattc ctttccaact 540 cattaacatt aaactaatat gccgttgctg aatagtttct ataatggatt cagccgtatc 600 ctgagcgact ctcacttgag tatgaacggc aatattcaaa tgtcgcccta atctttccat 660 acgctgcatc agcttgcggc tatgatgaac ctcaactcga gcttcagaag gaaattgatg 720 tctaggaatc ttaatcactt gcagacattc gatttcatag tggcgatgac gagcgatggt 780 tgcggcaatt tgaaataagg ttgcagccat ctccggatca ctaagcggca ataaaatccg 840 tccattcccc aaagccggcg aacgagtctg ataaaccaca taagacgggg gcggtttagt 900 tccttgagtt ccgcctccga gttgcttaac ttctgcttga ataatatcgg tgcgggtaat 960 aatccccact aaaatatgtc cttctgtcac cggtaaacga gataattgat agcggttgag 1020 taaatagaga acatcactta aagaggtttc cggttgcaca gtaatcggtt ttggggtcat 1080 aatctcacgc agagatacat cgggtgagcg ctcacccaaa ttcgataaat cactctgagt 1140 gacaattccc actaattttc ccgcttctac caccggaaac ccgcgatgac gggatataga 1200 catcgcctgt agcactttat ctagagtaag atgactttct aagctttcta cctgagactg 1260 catcacatca gccgctttta acttactcaa gaaatcatta accggcactt cctcgcttaa 1320 atgaatccca ctcgcatcaa gcaaatgttc ataaatcgaa cgactaaaca cattttctgc 1380 caccaaataa gacaccgcac aagtcagcat caacggcagt acaatattaa aattagcctt 1440 taattcaaag acaatcacaa tcgctgtcac cggagcgcga accaccgccg taaaaaaccc 1500 tcccattccc gccagcgcgt aagtggtagc cgctcctgaa cccgtcaccc atccggctaa 1560 ttctcccacg atatagccca aagcggaacc caacaccagc gccggggcaa ataatcctcc 1620 gggagcgccc gaactataag ctaagatggt taggcaaaaa tgagccacaa aagccaacag 1680 aatactacgc caacctaatt ccccagtgac taaaaactcc ctcagtcccg agttatcgcg 1740 gaaaaaaggc ggtaacaggg caatcactcc cccagaaatc atacagacta agccaacccg 1800 ccaaggcatc ggcaatctca gccgcttttg tacgttcata caaaagagaa ttccccaatt 1860 aaataacgct cctagcattc ccgctaaaaa accgagcaaa agatatagag gaatttctcg 1920 agcggaaaag tttatgttta gaggtgcggg tataatggga ccagcagact cgagtaataa 1980 agataccact gccccagtaa aggaagccac gatggctgtt tctaaagtta acccagagac 2040 atcgcgcatc aattcttcaa ccacaaataa aactcccgct atgggagtcc caaaccccgc 2100 cgctagtcct gaagcggccc cggctgcaat catctgtcgc cgatgttctg gggaagtggg 2160 aacccattga ctcaattgag ccgctaaggc cgcccctata tgaactgtag gcgctcgccg 2220 cccaagggtt aaccctgcgc ctaatactaa ggttgccccc agtaatttag cgatggctac 2280 ccgtaaagac agaggcaccg gaaagcgagc taaagcggct ttgacttggg gaatgcctcc 2340 accggcagcc gccggtgaga tcacttgtat taactgaccg gccagtaatc ctaataataa 2400 tccgccgatg ggaagtagcc agactgcccc aagtttagta gtaatatgaa ctcgccatcc 2460 tcctaaccat cctaccccct gtttaaggag taaggccgcg atcgccgata aaatcccgat 2520 gagacaagat tccagcatgg catagcgggt atcgacggaa ctgcgtccga aacgtctagc 2580 tttaaaccaa ccatgcaggc gttttagggg aaaaggtaaa ttcat 2625 <210> 58 <211> 874 <212> PRT <213> Cyanothece sp. <400> 58 Met Asn Leu Pro Phe Pro Leu Lys Arg Leu His Gly Trp Phe Lys Ala 1 5 10 15 Arg Arg Phe Gly Arg Ser Ser Val Asp Thr Arg Tyr Ala Met Leu Glu 20 25 30 Ser Cys Leu Ile Gly Ile Leu Ser Ala Ile Ala Ala Leu Leu Leu Lys 35 40 45 Gln Gly Val Gly Trp Leu Gly Gly Trp Arg Val His Ile Thr Thr Lys 50 55 60 Leu Gly Ala Val Trp Leu Leu Pro Ile Gly Gly Leu Leu Leu Gly Leu 65 70 75 80 Leu Ala Gly Gln Leu Ile Gln Val Ile Ser Pro Ala Ala Ala Gly Gly 85 90 95 Gly Ile Pro Gln Val Lys Ala Ala Leu Ala Arg Phe Pro Val Pro Leu 100 105 110 Ser Leu Arg Val Ala Ile Ala Lys Leu Leu Gly Ala Thr Leu Val Leu 115 120 125 Gly Ala Gly Leu Thr Leu Gly Arg Arg Ala Pro Thr Val His Ile Gly 130 135 140 Ala Ala Leu Ala Ala Gln Leu Ser Gln Trp Val Pro Thr Ser Pro Glu 145 150 155 160 His Arg Arg Gln Met Ile Ala Ala Gly Ala Ala Ser Gly Leu Ala Ala 165 170 175 Gly Phe Gly Thr Pro Ile Ala Gly Val Leu Phe Val Val Glu Glu Leu 180 185 190 Met Arg Asp Val Ser Gly Leu Thr Leu Glu Thr Ala Ile Val Ala Ser 195 200 205 Phe Thr Gly Ala Val Val Ser Leu Leu Leu Glu Ser Ala Gly Pro Ile 210 215 220 Ile Pro Ala Pro Leu Asn Ile Asn Phe Ser Ala Arg Glu Ile Pro Leu 225 230 235 240 Tyr Leu Leu Leu Gly Phe Leu Ala Gly Met Leu Gly Ala Leu Phe Asn 245 250 255 Trp Gly Ile Leu Phe Cys Met Asn Val Gln Lys Arg Leu Arg Leu Pro 260 265 270 Met Pro Trp Arg Val Gly Leu Val Cys Met Ile Ser Gly Gly Val Ile 275 280 285 Ala Leu Leu Pro Pro Phe Phe Arg Asp Asn Ser Gly Leu Arg Glu Phe 290 295 300 Leu Val Thr Gly Glu Leu Gly Trp Arg Ser Ile Leu Leu Ala Phe Val 305 310 315 320 Ala His Phe Cys Leu Thr Ile Leu Ala Tyr Ser Ser Gly Ala Pro Gly 325 330 335 Gly Leu Phe Ala Pro Ala Leu Val Leu Gly Ser Ala Leu Gly Tyr Ile 340 345 350 Val Gly Glu Leu Ala Gly Trp Val Thr Gly Ser Gly Ala Ala Thr Thr 355 360 365 Tyr Ala Leu Ala Gly Met Gly Gly Phe Phe Thr Ala Val Val Arg Ala 370 375 380 Pro Val Thr Ala Ile Val Ile Val Phe Glu Leu Lys Ala Asn Phe Asn 385 390 395 400 Ile Val Leu Pro Leu Met Leu Thr Cys Ala Val Ser Tyr Leu Val Ala 405 410 415 Glu Asn Val Phe Ser Arg Ser Ile Tyr Glu His Leu Leu Asp Ala Ser 420 425 430 Gly Ile His Leu Ser Glu Glu Val Pro Val Asn Asp Phe Leu Ser Lys 435 440 445 Leu Lys Ala Ala Asp Val Met Gln Ser Gln Val Glu Ser Leu Glu Ser 450 455 460 His Leu Thr Leu Asp Lys Val Leu Gln Ala Met Ser Ile Ser Arg His 465 470 475 480 Arg Gly Phe Pro Val Val Glu Ala Gly Lys Leu Val Gly Ile Val Thr 485 490 495 Gln Ser Asp Leu Ser Asn Leu Gly Glu Arg Ser Pro Asp Val Ser Leu 500 505 510 Arg Glu Ile Met Thr Pro Lys Pro Ile Thr Val Gln Pro Glu Thr Ser 515 520 525 Leu Ser Asp Val Leu Tyr Leu Leu Asn Arg Tyr Gln Leu Ser Arg Leu 530 535 540 Pro Val Thr Glu Gly His Ile Leu Val Gly Ile Ile Thr Arg Thr Asp 545 550 555 560 Ile Ile Gln Ala Glu Val Lys Gln Leu Gly Gly Gly Thr Gln Gly Thr 565 570 575 Lys Pro Pro Pro Ser Tyr Val Val Tyr Gln Thr Arg Ser Pro Ala Leu 580 585 590 Gly Asn Gly Arg Ile Leu Leu Pro Leu Ser Asp Pro Glu Met Ala Ala 595 600 605 Thr Leu Phe Gln Ile Ala Ala Thr Ile Ala Arg His Arg His Tyr Glu 610 615 620 Ile Glu Cys Leu Gln Val Ile Lys Ile Pro Arg His Gln Phe Pro Ser 625 630 635 640 Glu Ala Arg Val Glu Val His His Ser Arg Lys Leu Met Gln Arg Met 645 650 655 Glu Arg Leu Gly Arg His Leu Asn Ile Ala Val His Thr Gln Val Arg 660 665 670 Val Ala Gln Asp Thr Ala Glu Ser Ile Ile Glu Thr Ile Gln Gln Arg 675 680 685 His Ile Ser Leu Met Leu Met Ser Trp Lys Gly Ile Ser Asp Ser Gln 690 695 700 Gly Ala Ile Phe Gly Ser Val Ala Asp Thr Leu Ile His Lys Ala Pro 705 710 715 720 Cys Asp Leu Met Leu Val Lys Leu Gly Ala Ser Ala Asn Ala Tyr Pro 725 730 735 Leu Asn Leu Glu His Asn Ala Thr Trp Leu Val Pro Met Ala Gly Gly 740 745 750 Pro Asn Ala Gln Arg Ala Ile Glu Leu Leu Pro Ser Leu Thr Arg Leu 755 760 765 Tyr Ser Asn Pro Asp Ala Pro Gln Leu Trp Leu Cys Lys Val Tyr Pro 770 775 780 Pro Ser Glu Ile Glu Pro Asp Ser Gln Gly Leu Glu Glu Ala Ala Gln 785 790 795 800 Ile Leu Arg Asp Lys Leu Asn Lys Pro Ile Phe Pro Ile Ser Ile Arg 805 810 815 Ser Asn Ser Val Ser Asp Ala Leu Ile Gln Leu Ala Arg Ala Glu Glu 820 825 830 Cys Asp Val Ile Val Leu Gly Ala Ser Arg Glu Gly Leu Leu Gln Gln 835 840 845 Ala Ile His Gly Asn Ile Pro Asp Ala Ile Ala Arg Gly Val Asp Ser 850 855 860 Thr Val Ile Val Val Arg Gly Ala Ile Asp 865 870 <210> 59 <211> 2634 <212> DNA <213> Cyanothece sp. <400> 59 ctaattatct aactttcctc gcactaaaat gacggtactt ttcacttgtt gagcgatcat 60 tttaggaata tttccttgca tcacttgaac taataaccct tcgcgactga cccctaacat 120 aaccacatca cagctttctg cttcagctaa atgaatgatc gcatctgcga cagactggga 180 acgaacaggg aggggaataa caggacgttc tagttcttct tttaagcgtt tagcttcaat 240 ttctaaggct tgataattag gggtcgattt atggggggga aatacttgac ataaccaaat 300 aataggggat cgaggacgag tatataattt tgttaatccg ggtaacaatt ccatagcccg 360 tttggcattg ggaccaccag caataggaat taaccaagtg gtatctttat ctaaaatttg 420 gggataagct tctttttctt gtcccaattt tactaagatt aattcgcaag tcgctttgcg 480 aattaaaatg tcaatgactg gatcaaaaat ggttcctggg gtgtgatggt catcggtcca 540 ctctaacacc atgagattaa tgtgtcgttc tcgaatggtg tctaaaatgg cttgagcgcg 600 atcgtgggcg acacgaattt gagtatgaac tgggatatga tagtgacggc ctaatctttc 660 agttctttgt aacaattgac gactgtgttg ggtaattacg ggggtttgag caggatcact 720 atgtttggga acggtaatca cctgtagaca ttcaatttct tggttttgtt gttgagcgat 780 cgctgaacta attttaaaca gagacgtagc cgtatcaggg ttaactaaag gtaataaaat 840 acgaccgtct ccagctaagg gggcccgagt ttgataggca atataggaag gatcaggaac 900 cacttcgtta atggtggtat catccccttg taattgattg gcttcaaccc gaataatatc 960 cgttcgagtg ataattccca ctaacttatg accttctgtc acaggaagac gggacaactg 1020 ataacggttc agcagatata aaacatcact cagagacgct tctgcttgca ctgtaatggg 1080 tcttcgggtc ataaactcct gtaaaggagt atatcctggt tcttttttta atttcgccag 1140 atccgtttga gtaacaatgc ccaccagttg accttgctct accacaggaa accctcgatg 1200 actggagtta gacatggctt gtagcacttc atctagcgtt aaatcactag ataaggtttc 1260 gacttgagac tccatcacct gagaagcggt taattttgag agaaaatctt gtcctgtggc 1320 cgcttcgttg atatagatac cccgagcgtg taacatatgt tcgtacagag aaccccgtga 1380 aacactttcg gccacgatat aagacaccgc acaagtgacc attaggggta agactatgtt 1440 aaagtctgta ttcagttcaa agacaaagac gatcgctgtt actggtactc taaccactgc 1500 cgtaaaaaag gctcccattc ctgctagagc ataacttgat tgtgcgccag ttcccgtcac 1560 aaattgttca aaatctccta ccaaatagcc taaagccgat cctaacacca gagccggacc 1620 gaataaccct ccaggagcat tgcaactata ggccaaaatg gtgaggaaaa aatgagccac 1680 aaacgctaat aaaattcgac tcccatctaa ttctcctgta actaaaaaga tgcgaagtcc 1740 tgcattatcc cgaaagaaag gaggcaataa agcgataata atgcctgaca ccattcccat 1800 taagccaata cgccaggata agggtaaatt gaactttctt tgtattgtga cactggttag 1860 gagtccccga ttaaataacg cccctaatag tccggctaaa atgcctagaa gtagataaaa 1920 aggaatgtct gagatagaaa aggtaatatc gggcagttcc agtagtgaag agggaaaatt 1980 gagggtagat gactgtaaaa ttaacgaaac caccgctccg gtaaaggagg caacgatagc 2040 cgtttctaag gttaaccctg aaacatctcg catcaactct tcaatgacaa acaaaacccc 2100 ggcaataggc gttgtaaaac cggctgctag tcctgctgct gctccggctg cgatcatttg 2160 tcgtcgatgt tctggggagg tgggaaccca gttactcagt tgtgctgcta acgctgcccc 2220 aatatgcact gttggtgcgc gacggcctaa ggttaaacct ccgcctaaca ctaaaatggt 2280 tccaataagt ttaaccactg ctacccgtaa ggataaggga actggatatc gagctaaagc 2340 tgcttttact tgagtgatac cgcctcctgt agcagttggg gaaaaggttt caatgatcaa 2400 acccgataaa taacctaaga tcagtccgcc taaaggaagc acccacattg ccccaaactg 2460 gttggctaaa gcgacacgcc aaccccctaa ccaaccgact ccttgtttca gaattaaggc 2520 agcgatcgca gaaagcactc caattaaact ggcttcaact aaggcataac gggtatccgt 2580 ggcattaaat gccaattttc tcgatttgag ccattgataa aaacgtcgag gcat 2634 <210> 60 <211> 877 <212> PRT <213> Cyanothece sp. <400> 60 Met Pro Arg Arg Phe Tyr Gln Trp Leu Lys Ser Arg Lys Leu Ala Phe 1 5 10 15 Asn Ala Thr Asp Thr Arg Tyr Ala Leu Val Glu Ala Ser Leu Ile Gly 20 25 30 Val Leu Ser Ala Ile Ala Ala Leu Ile Leu Lys Gln Gly Val Gly Trp 35 40 45 Leu Gly Gly Trp Arg Val Ala Leu Ala Asn Gln Phe Gly Ala Met Trp 50 55 60 Val Leu Pro Leu Gly Gly Leu Ile Leu Gly Tyr Leu Ser Gly Leu Ile 65 70 75 80 Ile Glu Thr Phe Ser Pro Thr Ala Thr Gly Gly Gly Ile Thr Gln Val 85 90 95 Lys Ala Ala Leu Ala Arg Tyr Pro Val Pro Leu Ser Leu Arg Val Ala 100 105 110 Val Val Lys Leu Ile Gly Thr Ile Leu Val Leu Gly Gly Gly Leu Thr 115 120 125 Leu Gly Arg Arg Ala Pro Thr Val His Ile Gly Ala Ala Leu Ala Ala 130 135 140 Gln Leu Ser Asn Trp Val Pro Thr Ser Pro Glu His Arg Arg Gln Met 145 150 155 160 Ile Ala Ala Gly Ala Ala Ala Gly Leu Ala Ala Gly Phe Thr Thr Pro 165 170 175 Ile Ala Gly Val Leu Phe Val Ile Glu Glu Leu Met Arg Asp Val Ser 180 185 190 Gly Leu Thr Leu Glu Thr Ala Ile Val Ala Ser Phe Thr Gly Ala Val 195 200 205 Val Ser Leu Ile Leu Gln Ser Ser Thr Leu Asn Phe Pro Ser Ser Leu 210 215 220 Leu Glu Leu Pro Asp Ile Thr Phe Ser Ile Ser Asp Ile Pro Phe Tyr 225 230 235 240 Leu Leu Leu Gly Ile Leu Ala Gly Leu Leu Gly Ala Leu Phe Asn Arg 245 250 255 Gly Leu Leu Thr Ser Val Thr Ile Gln Arg Lys Phe Asn Leu Pro Leu 260 265 270 Ser Trp Arg Ile Gly Leu Met Gly Met Val Ser Gly Ile Ile Ile Ala 275 280 285 Leu Leu Pro Pro Phe Phe Arg Asp Asn Ala Gly Leu Arg Ile Phe Leu 290 295 300 Val Thr Gly Glu Leu Asp Gly Ser Arg Ile Leu Leu Ala Phe Val Ala 305 310 315 320 His Phe Phe Leu Thr Ile Leu Ala Tyr Ser Cys Asn Ala Pro Gly Gly 325 330 335 Leu Phe Gly Pro Ala Leu Val Leu Gly Ser Ala Leu Gly Tyr Leu Val 340 345 350 Gly Asp Phe Glu Gln Phe Val Thr Gly Thr Gly Ala Gln Ser Ser Tyr 355 360 365 Ala Leu Ala Gly Met Gly Ala Phe Phe Thr Ala Val Val Arg Val Pro 370 375 380 Val Thr Ala Ile Val Phe Val Phe Glu Leu Asn Thr Asp Phe Asn Ile 385 390 395 400 Val Leu Pro Leu Met Val Thr Cys Ala Val Ser Tyr Ile Val Ala Glu 405 410 415 Ser Val Ser Arg Gly Ser Leu Tyr Glu His Met Leu His Ala Arg Gly 420 425 430 Ile Tyr Ile Asn Glu Ala Ala Thr Gly Gln Asp Phe Leu Ser Lys Leu 435 440 445 Thr Ala Ser Gln Val Met Glu Ser Gln Val Glu Thr Leu Ser Ser Asp 450 455 460 Leu Thr Leu Asp Glu Val Leu Gln Ala Met Ser Asn Ser Ser His Arg 465 470 475 480 Gly Phe Pro Val Val Glu Gln Gly Gln Leu Val Gly Ile Val Thr Gln 485 490 495 Thr Asp Leu Ala Lys Leu Lys Lys Glu Pro Gly Tyr Thr Pro Leu Gln 500 505 510 Glu Phe Met Thr Arg Arg Pro Ile Thr Val Gln Ala Glu Ala Ser Leu 515 520 525 Ser Asp Val Leu Tyr Leu Leu Asn Arg Tyr Gln Leu Ser Arg Leu Pro 530 535 540 Val Thr Glu Gly His Lys Leu Val Gly Ile Ile Thr Arg Thr Asp Ile 545 550 555 560 Ile Arg Val Glu Ala Asn Gln Leu Gln Gly Asp Asp Thr Thr Ile Asn 565 570 575 Glu Val Val Pro Asp Pro Ser Tyr Ile Ala Tyr Gln Thr Arg Ala Pro 580 585 590 Leu Ala Gly Asp Gly Arg Ile Leu Leu Pro Leu Val Asn Pro Asp Thr 595 600 605 Ala Thr Ser Leu Phe Lys Ile Ser Ser Ala Ile Ala Gln Gln Gln Asn 610 615 620 Gln Glu Ile Glu Cys Leu Gln Val Ile Thr Val Pro Lys His Ser Asp 625 630 635 640 Pro Ala Gln Thr Pro Val Ile Thr Gln His Ser Arg Gln Leu Leu Gln 645 650 655 Arg Thr Glu Arg Leu Gly Arg His Tyr His Ile Pro Val His Thr Gln 660 665 670 Ile Arg Val Ala His Asp Arg Ala Gln Ala Ile Leu Asp Thr Ile Arg 675 680 685 Glu Arg His Ile Asn Leu Met Val Leu Glu Trp Thr Asp Asp His His 690 695 700 Thr Pro Gly Thr Ile Phe Asp Pro Val Ile Asp Ile Leu Ile Arg Lys 705 710 715 720 Ala Thr Cys Glu Leu Ile Leu Val Lys Leu Gly Gln Glu Lys Glu Ala 725 730 735 Tyr Pro Gln Ile Leu Asp Lys Asp Thr Thr Trp Leu Ile Pro Ile Ala 740 745 750 Gly Gly Pro Asn Ala Lys Arg Ala Met Glu Leu Leu Pro Gly Leu Thr 755 760 765 Lys Leu Tyr Thr Arg Pro Arg Ser Pro Ile Ile Trp Leu Cys Gln Val 770 775 780 Phe Pro Pro His Lys Ser Thr Pro Asn Tyr Gln Ala Leu Glu Ile Glu 785 790 795 800 Ala Lys Arg Leu Lys Glu Glu Leu Glu Arg Pro Val Ile Pro Leu Pro 805 810 815 Val Arg Ser Gln Ser Val Ala Asp Ala Ile Ile His Leu Ala Glu Ala 820 825 830 Glu Ser Cys Asp Val Val Met Leu Gly Val Ser Arg Glu Gly Leu Leu 835 840 845 Val Gln Val Met Gln Gly Asn Ile Pro Lys Met Ile Ala Gln Gln Val 850 855 860 Lys Ser Thr Val Ile Leu Val Arg Gly Lys Leu Asp Asn 865 870 875 <210> 61 <211> 2649 <212> DNA <213> Cyanothece sp. <400> 61 atgcagcctc atttaatgcc tcaacgtctt tatcaatggt tcaaatcaag aaactttgct 60 cttaatgcca cggacacccg ttatgcctta gtagaagcaa gtttaattgg agtgctttca 120 gcgatcgcag ccttgatcct caaacaaggg gtcggttggt taggaggttg gcgtgttgcc 180 ttagccaatg aattcggcgg aatagtcgtg cttcccttgg gaggacttat tttaggctat 240 ttagccggtt ggatcatcga aaccctgtcc cccacagcga caggaggcgg gatcactcaa 300 gttaaagcag ccttagcccg atatccggtg cctttatctt tacgggtcgc catcgttaaa 360 ttgattggaa ccattttagt cttaggagga gggttaaccc tcggccgtcg tgcgccaact 420 gttcatattg gggccgcttt agcagcgcaa ctaagtagct gggttcctac ctccccagaa 480 catcgacgac aaatgatcgc agccggggca gcagcaggac tcgcagccgg ttttaccacc 540 cccattgccg gggttttatt tgtcattgaa gagttgatgc gggatgtgtc ggggttaacc 600 ctagaaacgg ctattgtcgc ctcttttact ggggcagtgg tgtctttaat tttgcaatcg 660 tctaccctca atttgccctc ctcattatta gaactgcccg atattacctt ttctgcctta 720 gatattccct tttatctgct tctaggcatc ttagccgggg tcttaggggc tttatttaat 780 cgaggactcc tgctaagtgt caaaatacaa catcagttca atttaccctt atcctggcgc 840 attggtttaa tgggaatggt ttcaggtatc atcatcgcag tcctgcctcc cttctttcgc 900 gataatgcag gactgcggat tattttggtc acgggggaat tagattggag tcgcatttta 960 ttggctttcg tcgctcattt tttcctcacc attttggcct atagtgctaa cacccctgga 1020 gggttattcg gtccagcact ggtattggga tcggccttag ggtatttagt gggagatttt 1080 gagcaatttt tgacaggaac gggtactcaa tcgagttatg ccttagccgg aatgggggcg 1140 tttttcaccg cagtcgtcag ggttccggta acagcgatcg tctttgtctt tgaactcaat 1200 acggatttca atattgtttt acccttgatg gtgacttgtg ctgtttctta tatcgtggct 1260 gagagtgtct cgcggggatc tctctacgaa catatgttac acgctcgtgg gatctatatt 1320 aatgaagcgg ccacaggaca ggattttctc tccaaactca ctgcgtctca ggtcatggag 1380 tctcacgttg aaactctatc cagtgatttg tccttagatg aagtcctgca agccatgtct 1440 aactctactc atcgggggtt tcctgtggtt gagcaaggtc aattagtcgg cattgttacc 1500 cagacggatc tagctaaatt gaagaaagtg ccaggatata ctcccttatc agaatttatg 1560 acccgacgac ccattacggt acaagcagag tcctctttaa gtgatgtgtt ataccttctc 1620 aaccgttatc aattgtcccg tcttcccgta acagaaggcc ataaattagt cggaattatt 1680 acccgaacag atattattcg cattgaagct aatcagttac aaggggatga taccaccatc 1740 aatgaggtgg ttcctgatcc atcctatatt gcctatcaaa cacgggcccc cttagctggt 1800 gagggtcgca ttttattgcc gttggttaac cccgatacgg caacctctct gtttaaaatt 1860 agtgcagcga tcgctcaaaa acaaaaccag gaaatcgaat gtttacaggt gattaccgtt 1920 cctaaacaca gtgaccctgc ccaaaccccg gttattaccc aacatagtcg tcaattatta 1980 caaagaaccg aacgattagg ccgtcaatat catcttcctg ttcatactca aattcgtatt 2040 gcccacgatc gcgcccaagc cattttagat accattcgag aacgacacat cgatctcatg 2100 gttttacaat ggaccgatga caatcacagt ccagggacga tttttgaccc agtgattgat 2160 gttttaattc gtaaagctac ttgcgaatta gttctagtta aactaggtca agaaaaagaa 2220 gcgtatcccc aaaccttaga taaagatgcc acttggttac ttcccattgc tggtggtccc 2280 aatgccaaac gagccatgga attgttaccc ggattaatca aattatatac tcgtcctcgt 2340 tcccctatta tttggttatg tcaggtattt tctccccata aagctacccc taattatcaa 2400 tccttagaag ttgcagctaa acgtttaaaa gaagaacttg aacgtcctgt gattcccctt 2460 cctgttcgtt ctcagtctgt ggccgatgcc atcattcatt tagccgaagc agaaacctgt 2520 gatgtggtca tgttgggggt gagtcgagaa ggtttattag tgcaagtaat gcaaggtaat 2580 ctgcctaaaa tgatcgctca acaggtgaaa agtacggtga ttttagtgcg aggaaagtta 2640 gataattag 2649 <210> 62 <211> 882 <212> PRT <213> Cyanothece sp. <400> 62 Met Gln Pro His Leu Met Pro Gln Arg Leu Tyr Gln Trp Phe Lys Ser 1 5 10 15 Arg Asn Phe Ala Leu Asn Ala Thr Asp Thr Arg Tyr Ala Leu Val Glu 20 25 30 Ala Ser Leu Ile Gly Val Leu Ser Ala Ile Ala Ala Leu Ile Leu Lys 35 40 45 Gln Gly Val Gly Trp Leu Gly Gly Trp Arg Val Ala Leu Ala Asn Glu 50 55 60 Phe Gly Gly Ile Val Val Leu Pro Leu Gly Gly Leu Ile Leu Gly Tyr 65 70 75 80 Leu Ala Gly Trp Ile Ile Glu Thr Leu Ser Pro Thr Ala Thr Gly Gly 85 90 95 Gly Ile Thr Gln Val Lys Ala Ala Leu Ala Arg Tyr Pro Val Pro Leu 100 105 110 Ser Leu Arg Val Ala Ile Val Lys Leu Ile Gly Thr Ile Leu Val Leu 115 120 125 Gly Gly Gly Leu Thr Leu Gly Arg Arg Ala Pro Thr Val His Ile Gly 130 135 140 Ala Ala Leu Ala Ala Gln Leu Ser Ser Trp Val Pro Thr Ser Pro Glu 145 150 155 160 His Arg Arg Gln Met Ile Ala Ala Gly Ala Ala Ala Gly Leu Ala Ala 165 170 175 Gly Phe Thr Thr Pro Ile Ala Gly Val Leu Phe Val Ile Glu Glu Leu 180 185 190 Met Arg Asp Val Ser Gly Leu Thr Leu Glu Thr Ala Ile Val Ala Ser 195 200 205 Phe Thr Gly Ala Val Val Ser Leu Ile Leu Gln Ser Ser Thr Leu Asn 210 215 220 Leu Pro Ser Ser Leu Leu Glu Leu Pro Asp Ile Thr Phe Ser Ala Leu 225 230 235 240 Asp Ile Pro Phe Tyr Leu Leu Leu Gly Ile Leu Ala Gly Val Leu Gly 245 250 255 Ala Leu Phe Asn Arg Gly Leu Leu Leu Ser Val Lys Ile Gln His Gln 260 265 270 Phe Asn Leu Pro Leu Ser Trp Arg Ile Gly Leu Met Gly Met Val Ser 275 280 285 Gly Ile Ile Ile Ala Val Leu Pro Pro Phe Phe Arg Asp Asn Ala Gly 290 295 300 Leu Arg Ile Ile Leu Val Thr Gly Glu Leu Asp Trp Ser Arg Ile Leu 305 310 315 320 Leu Ala Phe Val Ala His Phe Phe Leu Thr Ile Leu Ala Tyr Ser Ala 325 330 335 Asn Thr Pro Gly Gly Leu Phe Gly Pro Ala Leu Val Leu Gly Ser Ala 340 345 350 Leu Gly Tyr Leu Val Gly Asp Phe Glu Gln Phe Leu Thr Gly Thr Gly 355 360 365 Thr Gln Ser Ser Tyr Ala Leu Ala Gly Met Gly Ala Phe Phe Thr Ala 370 375 380 Val Val Arg Val Pro Val Thr Ala Ile Val Phe Val Phe Glu Leu Asn 385 390 395 400 Thr Asp Phe Asn Ile Val Leu Pro Leu Met Val Thr Cys Ala Val Ser 405 410 415 Tyr Ile Val Ala Glu Ser Val Ser Arg Gly Ser Leu Tyr Glu His Met 420 425 430 Leu His Ala Arg Gly Ile Tyr Ile Asn Glu Ala Ala Thr Gly Gln Asp 435 440 445 Phe Leu Ser Lys Leu Thr Ala Ser Gln Val Met Glu Ser His Val Glu 450 455 460 Thr Leu Ser Ser Asp Leu Ser Leu Asp Glu Val Leu Gln Ala Met Ser 465 470 475 480 Asn Ser Thr His Arg Gly Phe Pro Val Val Glu Gln Gly Gln Leu Val 485 490 495 Gly Ile Val Thr Gln Thr Asp Leu Ala Lys Leu Lys Lys Val Pro Gly 500 505 510 Tyr Thr Pro Leu Ser Glu Phe Met Thr Arg Arg Pro Ile Thr Val Gln 515 520 525 Ala Glu Ser Ser Leu Ser Asp Val Leu Tyr Leu Leu Asn Arg Tyr Gln 530 535 540 Leu Ser Arg Leu Pro Val Thr Glu Gly His Lys Leu Val Gly Ile Ile 545 550 555 560 Thr Arg Thr Asp Ile Ile Arg Ile Glu Ala Asn Gln Leu Gln Gly Asp 565 570 575 Asp Thr Thr Ile Asn Glu Val Val Pro Asp Pro Ser Tyr Ile Ala Tyr 580 585 590 Gln Thr Arg Ala Pro Leu Ala Gly Glu Gly Arg Ile Leu Leu Pro Leu 595 600 605 Val Asn Pro Asp Thr Ala Thr Ser Leu Phe Lys Ile Ser Ala Ala Ile 610 615 620 Ala Gln Lys Gln Asn Gln Glu Ile Glu Cys Leu Gln Val Ile Thr Val 625 630 635 640 Pro Lys His Ser Asp Pro Ala Gln Thr Pro Val Ile Thr Gln His Ser 645 650 655 Arg Gln Leu Leu Gln Arg Thr Glu Arg Leu Gly Arg Gln Tyr His Leu 660 665 670 Pro Val His Thr Gln Ile Arg Ile Ala His Asp Arg Ala Gln Ala Ile 675 680 685 Leu Asp Thr Ile Arg Glu Arg His Ile Asp Leu Met Val Leu Gln Trp 690 695 700 Thr Asp Asp Asn His Ser Pro Gly Thr Ile Phe Asp Pro Val Ile Asp 705 710 715 720 Val Leu Ile Arg Lys Ala Thr Cys Glu Leu Val Leu Val Lys Leu Gly 725 730 735 Gln Glu Lys Glu Ala Tyr Pro Gln Thr Leu Asp Lys Asp Ala Thr Trp 740 745 750 Leu Leu Pro Ile Ala Gly Gly Pro Asn Ala Lys Arg Ala Met Glu Leu 755 760 765 Leu Pro Gly Leu Ile Lys Leu Tyr Thr Arg Pro Arg Ser Pro Ile Ile 770 775 780 Trp Leu Cys Gln Val Phe Ser Pro His Lys Ala Thr Pro Asn Tyr Gln 785 790 795 800 Ser Leu Glu Val Ala Ala Lys Arg Leu Lys Glu Glu Leu Glu Arg Pro 805 810 815 Val Ile Pro Leu Pro Val Arg Ser Gln Ser Val Ala Asp Ala Ile Ile 820 825 830 His Leu Ala Glu Ala Glu Thr Cys Asp Val Val Met Leu Gly Val Ser 835 840 845 Arg Glu Gly Leu Leu Val Gln Val Met Gln Gly Asn Leu Pro Lys Met 850 855 860 Ile Ala Gln Gln Val Lys Ser Thr Val Ile Leu Val Arg Gly Lys Leu 865 870 875 880 Asp Asn <210> 63 <211> 2640 <212> DNA <213> Cyanothece sp. <400> 63 ctataaagct cctcgaacta aaataaccgt actatcaacc tgtttagcga tcgccttggg 60 aatattacca tgaatcacct gttctaagag tccctctcga ctgaccccca acatgaccac 120 atcgcaagtt tcagccgccg ctagatgaac gactgcatcc gccaccgact gggaacgaat 180 gggtaaagga atcacaggcc gagcaacggc atctttgaca gcttgggcag tttgttcgag 240 aacttggtag tcaggaagag cacccgcagg tggaaacacc ttacaaagcc aaataatcgg 300 cgatcgcgga cgatcataca atccagttaa ccccggtaat aattctagag cccgttgggc 360 attgggtccc ccggcgatgg gaattaacca agtcgcatcc ctgtttaaac tgtcgggata 420 acttggctca cggttgccca atttaaccaa aactaactca cacggagctt tacgaatcag 480 taaatccacc acatgaccaa aaatcgcccc cggagtcccc gtttctccat tccattccat 540 caccattaaa ttgatatggc gttcacgaat cgtatctaaa atgccttggg caatatcatg 600 agcaaccctc acttgcgtat gaactggcag tttttgacga cggcctaagc gttccatgcg 660 atggagtaaa tggcgactat gttgcgactt aaccggggtt tgggctggtt tcttgtgttt 720 aggaacctta attacctgca aacattctaa ttcgtcattt tgttgcctag cgatcgctgc 780 tccaatttga aacaaggccg ttgccgtttt ggggtcagcc aagggtaaca aaattcgtcc 840 ccctcccgtg gccggtgcac gggtttgata ggcgatatag gagggttctg ggatggcttc 900 attgagttta gaatcattcc cctccagttg attcgcttcg acacggataa tatcggtacg 960 ggtgatgatt ccgaccaact tacttccttc ggtcacagga agacgggaca actgataacg 1020 gttcaataaa tagagaacat cactcaataa agcatcagct tcgacgctaa taggacgggg 1080 agtcataaac tgcttgacgg gggtttgact cgacagcttg gcagcgttgg ccacatcggt 1140 ttgggtaaca atgcccacta atttaccttc ttccatcacc ggaaacccgc gatgactcga 1200 taaggacata gcttggatca cctgatctaa ggttaagtca ctgggtaagg tttccacctg 1260 agattgcatg acatcggctg ccgtcaattg agagagaaaa tcctgaacga cagggttatt 1320 atccaggtaa atgccccgcg ctttgagcat tcgttcgtat aaagaccccc gtgaaaaact 1380 gtcggccacc acataggcaa ccgaagaagt aaccattaac ggcagaacga tattaaaatt 1440 gctattcagt tcaaaaacaa tcacaatagc cgtaacagga acgccaacta ctgccgaaaa 1500 aaagcccccc atccccgcta aggcaaaggc tgattggcta ctacttccca tgatgaactg 1560 ctccaaatcc cccactaaat agcctaaggc cgaacccaag actaaggccg gggcaaataa 1620 cccccctgga gcattagaac tataggccaa catggtcaga aaaaaatggg caacaaaggc 1680 taagaaaatt ttctcggtac tgagttcccc cctcaccaag acagtctgaa gtcgggtatt 1740 atcttgaaaa aatgggggca acagagcaat aattaggcca gaaatcattg caactagccc 1800 aatacgccag ggtaggggta atttgagacg actttggata gctaaactga acagtaaccc 1860 ttgtttaaag agagccccca aaaaccctgc gagtatgcct aataataggt aaaagggaat 1920 atcgtccacc gaaaaactaa tattcgggag attcaagagg ggggcaaaag acagcgatcg 1980 cgcttcaaca attaacgaga cgactgcccc agtaaaggag gcaatgatgg aggtttgcag 2040 cgttaaccct gagacatctc gcatcaactc ttctacaacg aacaacacac ctgcaattgg 2100 ggttccaaaa ccggccgcga gtcctgccgc cgcgccggcc gcaatcattt gtcgacgatg 2160 ttcaggggaa gtaggaaccc aactactcaa ctgtgccgct aaggctgcac cgacatgaac 2220 ggttggggct cgccgaccga gggttaatcc tcctcctagg actagaattg tgccaatgag 2280 tttaacgacc gctactcgca gggacaaagg cactggataa cgggctaagg ccgctttaac 2340 ttgggtaata ccgcctcctg cggcggtagg agaggtttgt tcgattaacc atccagccat 2400 cgaacctaaa aagagtcccc ccaagggaag tacccaaatt gctcccaatt gattggctag 2460 actaacccgc catcctccta accagcctac tccctctttt aatattaagg cagcgattcc 2520 tgagagtaat cctagtaaac aagcttctac aaaggcatag cgagaatcag tggcatttac 2580 tcccaagtgg ctagatttga cccattggta gaggcgttta acgattaaat gaggcttcat 2640 <210> 64 <211> 879 <212> PRT <213> Cyanothece sp. <400> 64 Met Lys Pro His Leu Ile Val Lys Arg Leu Tyr Gln Trp Val Lys Ser 1 5 10 15 Ser His Leu Gly Val Asn Ala Thr Asp Ser Arg Tyr Ala Phe Val Glu 20 25 30 Ala Cys Leu Leu Gly Leu Leu Ser Gly Ile Ala Ala Leu Ile Leu Lys 35 40 45 Glu Gly Val Gly Trp Leu Gly Gly Trp Arg Val Ser Leu Ala Asn Gln 50 55 60 Leu Gly Ala Ile Trp Val Leu Pro Leu Gly Gly Leu Phe Leu Gly Ser 65 70 75 80 Met Ala Gly Trp Leu Ile Glu Gln Thr Ser Pro Thr Ala Ala Gly Gly 85 90 95 Gly Ile Thr Gln Val Lys Ala Ala Leu Ala Arg Tyr Pro Val Pro Leu 100 105 110 Ser Leu Arg Val Ala Val Val Lys Leu Ile Gly Thr Ile Leu Val Leu 115 120 125 Gly Gly Gly Leu Thr Leu Gly Arg Arg Ala Pro Thr Val His Val Gly 130 135 140 Ala Ala Leu Ala Ala Gln Leu Ser Ser Trp Val Pro Thr Ser Pro Glu 145 150 155 160 His Arg Arg Gln Met Ile Ala Ala Gly Ala Ala Ala Gly Leu Ala Ala 165 170 175 Gly Phe Gly Thr Pro Ile Ala Gly Val Leu Phe Val Val Glu Glu Leu 180 185 190 Met Arg Asp Val Ser Gly Leu Thr Leu Gln Thr Ser Ile Ile Ala Ser 195 200 205 Phe Thr Gly Ala Val Val Ser Leu Ile Val Glu Ala Arg Ser Leu Ser 210 215 220 Phe Ala Pro Leu Leu Asn Leu Pro Asn Ile Ser Phe Ser Val Asp Asp 225 230 235 240 Ile Pro Phe Tyr Leu Leu Leu Gly Ile Leu Ala Gly Phe Leu Gly Ala 245 250 255 Leu Phe Lys Gln Gly Leu Leu Phe Ser Leu Ala Ile Gln Ser Arg Leu 260 265 270 Lys Leu Pro Leu Pro Trp Arg Ile Gly Leu Val Ala Met Ile Ser Gly 275 280 285 Leu Ile Ile Ala Leu Leu Pro Pro Phe Phe Gln Asp Asn Thr Arg Leu 290 295 300 Gln Thr Val Leu Val Arg Gly Glu Leu Ser Thr Glu Lys Ile Phe Leu 305 310 315 320 Ala Phe Val Ala His Phe Phe Leu Thr Met Leu Ala Tyr Ser Ser Asn 325 330 335 Ala Pro Gly Gly Leu Phe Ala Pro Ala Leu Val Leu Gly Ser Ala Leu 340 345 350 Gly Tyr Leu Val Gly Asp Leu Glu Gln Phe Ile Met Gly Ser Ser Ser 355 360 365 Gln Ser Ala Phe Ala Leu Ala Gly Met Gly Gly Phe Phe Ser Ala Val 370 375 380 Val Gly Val Pro Val Thr Ala Ile Val Ile Val Phe Glu Leu Asn Ser 385 390 395 400 Asn Phe Asn Ile Val Leu Pro Leu Met Val Thr Ser Ser Val Ala Tyr 405 410 415 Val Val Ala Asp Ser Phe Ser Arg Gly Ser Leu Tyr Glu Arg Met Leu 420 425 430 Lys Ala Arg Gly Ile Tyr Leu Asp Asn Asn Pro Val Val Gln Asp Phe 435 440 445 Leu Ser Gln Leu Thr Ala Ala Asp Val Met Gln Ser Gln Val Glu Thr 450 455 460 Leu Pro Ser Asp Leu Thr Leu Asp Gln Val Ile Gln Ala Met Ser Leu 465 470 475 480 Ser Ser His Arg Gly Phe Pro Val Met Glu Glu Gly Lys Leu Val Gly 485 490 495 Ile Val Thr Gln Thr Asp Val Ala Asn Ala Ala Lys Leu Ser Ser Gln 500 505 510 Thr Pro Val Lys Gln Phe Met Thr Pro Arg Pro Ile Ser Val Glu Ala 515 520 525 Asp Ala Leu Leu Ser Asp Val Leu Tyr Leu Leu Asn Arg Tyr Gln Leu 530 535 540 Ser Arg Leu Pro Val Thr Glu Gly Ser Lys Leu Val Gly Ile Ile Thr 545 550 555 560 Arg Thr Asp Ile Ile Arg Val Glu Ala Asn Gln Leu Glu Gly Asn Asp 565 570 575 Ser Lys Leu Asn Glu Ala Ile Pro Glu Pro Ser Tyr Ile Ala Tyr Gln 580 585 590 Thr Arg Ala Pro Ala Thr Gly Gly Gly Arg Ile Leu Leu Pro Leu Ala 595 600 605 Asp Pro Lys Thr Ala Thr Ala Leu Phe Gln Ile Gly Ala Ala Ile Ala 610 615 620 Arg Gln Gln Asn Asp Glu Leu Glu Cys Leu Gln Val Ile Lys Val Pro 625 630 635 640 Lys His Lys Lys Pro Ala Gln Thr Pro Val Lys Ser Gln His Ser Arg 645 650 655 His Leu Leu His Arg Met Glu Arg Leu Gly Arg Arg Gln Lys Leu Pro 660 665 670 Val His Thr Gln Val Arg Val Ala His Asp Ile Ala Gln Gly Ile Leu 675 680 685 Asp Thr Ile Arg Glu Arg His Ile Asn Leu Met Val Met Glu Trp Asn 690 695 700 Gly Glu Thr Gly Thr Pro Gly Ala Ile Phe Gly His Val Val Asp Leu 705 710 715 720 Leu Ile Arg Lys Ala Pro Cys Glu Leu Val Leu Val Lys Leu Gly Asn 725 730 735 Arg Glu Pro Ser Tyr Pro Asp Ser Leu Asn Arg Asp Ala Thr Trp Leu 740 745 750 Ile Pro Ile Ala Gly Gly Pro Asn Ala Gln Arg Ala Leu Glu Leu Leu 755 760 765 Pro Gly Leu Thr Gly Leu Tyr Asp Arg Pro Arg Ser Pro Ile Ile Trp 770 775 780 Leu Cys Lys Val Phe Pro Pro Ala Gly Ala Leu Pro Asp Tyr Gln Val 785 790 795 800 Leu Glu Gln Thr Ala Gln Ala Val Lys Asp Ala Val Ala Arg Pro Val 805 810 815 Ile Pro Leu Pro Ile Arg Ser Gln Ser Val Ala Asp Ala Val Val His 820 825 830 Leu Ala Ala Ala Glu Thr Cys Asp Val Val Met Leu Gly Val Ser Arg 835 840 845 Glu Gly Leu Leu Glu Gln Val Ile His Gly Asn Ile Pro Lys Ala Ile 850 855 860 Ala Lys Gln Val Asp Ser Thr Val Ile Leu Val Arg Gly Ala Leu 865 870 875 <210> 65 <211> 2649 <212> DNA <213> Crocosphaera watsonii <400> 65 ctaattgtcc aactttcctc tcactaaaat catggtactt ttgacctgct gggcgatggt 60 tttaggaata ttgccctgca ttacttgagc taataaccct tctttactca cccccaacat 120 aaccacatca cagctttcgg actcggccaa atgaacgatc gcatcagtga cagactggga 180 acgaatggga aggggaatta cagggcgttc cagttgttct tttaattgtt gtgccttagc 240 ttctaaagat tgatagtcag gagtcggttt atggggagaa aacacctgac ataaccaaat 300 aatgggggaa cggggacgag tatataattg ggttaatcct ggtaataatt ccatggcccg 360 tttagcattg ggaccaccag caataggaat caaccaagtg gtatctttat ctaaagtttg 420 ggggtaagct tctttttctt tgcccaactt aactataact aactcacaag tggccctacg 480 aattaaaata tcaatcaccg gcccaaaaac actaccagga gtctttttgt ctgggttcca 540 ttctaagact atgagattga tatgtcgttc tcgaatggtg tctaaaatag cttgggcgcg 600 atcgtgagca acacgaattt gagtgtgaac agaaatctgg tgttgacggc ctaatctttc 660 tgctctttgt aataattgac gactctgttg ggtgattaca gtggtttgtg ccggatcgct 720 atgtttaggg atcttaatta cctgtaaaca ttcgatttct tggttttgtt gttcggcgat 780 cgctgcacta attttaaaca aagaagttgc tgtatttatg tttgtcaggg gtaacaaaat 840 gcgtcccact cccactaaag gggcgcgggt ttgataagca atataggagg gatcggggac 900 cacttcatta atagtcgtat catccccttg taactggttg gcttcgatgc gaataatatc 960 ggttcgggtg ataattccta ctaatttatg cccttctgtc acaggtagac gggaaagttg 1020 ataacggtta agtaggtata aaacatcgct taaagaagcc tctgcttgta ctgtaatggg 1080 ttttcgagtc atgaattccc ataaaggggt gtatcctggc actttcttca attttgccag 1140 atcagtttga gtgacaatac ccactaattg accttcggcc agcaccggaa accctcgatg 1200 actcgaagcc gacatcgctt gtagtacgtc atctaaagtg aagtcgctgg ataaggtttc 1260 cacctgagac tgcattactt ctgaagcggt taatttagag agaaaatcct gtcctgtagc 1320 cccttcattg atatagatcc ccctagcctt taacatatgt tcgtagagag aacccttgga 1380 gacactttcg gccacgatat aagaaacagc acaagtaacc attaagggta aaacaatatt 1440 aaagttcgta tttagttcaa agacaaagac gatcgccgtt accggaaccc taacaactgc 1500 tgtgaaaaat gctcccattc ctgccagtgc ataggtagtc tctgtgccgg tgccagttaa 1560 taattcttca aaatctccca ctagataccc taaagcagat cccaacacca gcgccggacc 1620 gaataaaccg ccgggggtat tggcactata ggccaaaata gtcaggaaaa aatgagctac 1680 aaaagccaat aaaatgcgac tccattctaa ttctccttgt actaaatcaa tacgcagtcc 1740 tgtattatct cgaaagaaag ggggtagtat ggcaataatt agacccgaag ccatgcccat 1800 taagccaata cgccaggata aaggtaaatt aagatatttt tgtattttga cgctgagtaa 1860 tagtccccga ttaaataaag cccctaagat ccctgctaat attcccagta gtaggtaaaa 1920 gggaatttct gaggcggaga aagcaatatc aggcagatcc aacaaagagg agggaaaatt 1980 gaaggtagaa gattgcaaaa tttgggagac aactgctccg gtaaaagagg ccacgatcgc 2040 cgtttctagg gttaacccag aaacatctcg cattaactct tcaatgacga ataacacccc 2100 ggcgatgggg gtggtaaaac cggccgctag tccggctgct gccccggctg cgatcatttg 2160 tcgtcgatgt tccggggaag tgggaaccca actactcagt tgcgctgcta aggctgcccc 2220 aatgtgtaca gtaggcgcac gacggcctag ggttaagccg ccccctagca ccaaaatggt 2280 tccgattaat ttaaccagtg ctacccgtag agagagggga actggatacc gggctaaagc 2340 ggcttttact tgagtcatcc cgccccctgt agctgtgggg gagagggttt ctatgagcca 2400 accggccatg gaacctaaaa ttagtcctcc caagggtagc acccatattg caccaaattg 2460 attggccaag gccacacgct taccccctaa ccaacctact ccttgtttga gaattaaggc 2520 tgcgatcgcc gataaaatcc caattaaaca ggcttctgct aaggcataac gggtgtcagt 2580 ggcatcaaca gtacgcagtc ttgattttaa ccagcgataa aaacgttgaa atattaaatg 2640 aggccccat 2649 <210> 66 <211> 882 <212> PRT <213> Crocosphaera watsonii <400> 66 Met Gly Pro His Leu Ile Phe Gln Arg Phe Tyr Arg Trp Leu Lys Ser 1 5 10 15 Arg Leu Arg Thr Val Asp Ala Thr Asp Thr Arg Tyr Ala Leu Ala Glu 20 25 30 Ala Cys Leu Ile Gly Ile Leu Ser Ala Ile Ala Ala Leu Ile Leu Lys 35 40 45 Gln Gly Val Gly Trp Leu Gly Gly Lys Arg Val Ala Leu Ala Asn Gln 50 55 60 Phe Gly Ala Ile Trp Val Leu Pro Leu Gly Gly Leu Ile Leu Gly Ser 65 70 75 80 Met Ala Gly Trp Leu Ile Glu Thr Leu Ser Pro Thr Ala Thr Gly Gly 85 90 95 Gly Met Thr Gln Val Lys Ala Ala Leu Ala Arg Tyr Pro Val Pro Leu 100 105 110 Ser Leu Arg Val Ala Leu Val Lys Leu Ile Gly Thr Ile Leu Val Leu 115 120 125 Gly Gly Gly Leu Thr Leu Gly Arg Arg Ala Pro Thr Val His Ile Gly 130 135 140 Ala Ala Leu Ala Ala Gln Leu Ser Ser Trp Val Pro Thr Ser Pro Glu 145 150 155 160 His Arg Arg Gln Met Ile Ala Ala Gly Ala Ala Ala Gly Leu Ala Ala 165 170 175 Gly Phe Thr Thr Pro Ile Ala Gly Val Leu Phe Val Ile Glu Glu Leu 180 185 190 Met Arg Asp Val Ser Gly Leu Thr Leu Glu Thr Ala Ile Val Ala Ser 195 200 205 Phe Thr Gly Ala Val Val Ser Gln Ile Leu Gln Ser Ser Thr Phe Asn 210 215 220 Phe Pro Ser Ser Leu Leu Asp Leu Pro Asp Ile Ala Phe Ser Ala Ser 225 230 235 240 Glu Ile Pro Phe Tyr Leu Leu Leu Gly Ile Leu Ala Gly Ile Leu Gly 245 250 255 Ala Leu Phe Asn Arg Gly Leu Leu Leu Ser Val Lys Ile Gln Lys Tyr 260 265 270 Leu Asn Leu Pro Leu Ser Trp Arg Ile Gly Leu Met Gly Met Ala Ser 275 280 285 Gly Leu Ile Ile Ala Ile Leu Pro Pro Phe Phe Arg Asp Asn Thr Gly 290 295 300 Leu Arg Ile Asp Leu Val Gln Gly Glu Leu Glu Trp Ser Arg Ile Leu 305 310 315 320 Leu Ala Phe Val Ala His Phe Phe Leu Thr Ile Leu Ala Tyr Ser Ala 325 330 335 Asn Thr Pro Gly Gly Leu Phe Gly Pro Ala Leu Val Leu Gly Ser Ala 340 345 350 Leu Gly Tyr Leu Val Gly Asp Phe Glu Glu Leu Leu Thr Gly Thr Gly 355 360 365 Thr Glu Thr Thr Tyr Ala Leu Ala Gly Met Gly Ala Phe Phe Thr Ala 370 375 380 Val Val Arg Val Pro Val Thr Ala Ile Val Phe Val Phe Glu Leu Asn 385 390 395 400 Thr Asn Phe Asn Ile Val Leu Pro Leu Met Val Thr Cys Ala Val Ser 405 410 415 Tyr Ile Val Ala Glu Ser Val Ser Lys Gly Ser Leu Tyr Glu His Met 420 425 430 Leu Lys Ala Arg Gly Ile Tyr Ile Asn Glu Gly Ala Thr Gly Gln Asp 435 440 445 Phe Leu Ser Lys Leu Thr Ala Ser Glu Val Met Gln Ser Gln Val Glu 450 455 460 Thr Leu Ser Ser Asp Phe Thr Leu Asp Asp Val Leu Gln Ala Met Ser 465 470 475 480 Ala Ser Ser His Arg Gly Phe Pro Val Leu Ala Glu Gly Gln Leu Val 485 490 495 Gly Ile Val Thr Gln Thr Asp Leu Ala Lys Leu Lys Lys Val Pro Gly 500 505 510 Tyr Thr Pro Leu Trp Glu Phe Met Thr Arg Lys Pro Ile Thr Val Gln 515 520 525 Ala Glu Ala Ser Leu Ser Asp Val Leu Tyr Leu Leu Asn Arg Tyr Gln 530 535 540 Leu Ser Arg Leu Pro Val Thr Glu Gly His Lys Leu Val Gly Ile Ile 545 550 555 560 Thr Arg Thr Asp Ile Ile Arg Ile Glu Ala Asn Gln Leu Gln Gly Asp 565 570 575 Asp Thr Thr Ile Asn Glu Val Val Pro Asp Pro Ser Tyr Ile Ala Tyr 580 585 590 Gln Thr Arg Ala Pro Leu Val Gly Val Gly Arg Ile Leu Leu Pro Leu 595 600 605 Thr Asn Ile Asn Thr Ala Thr Ser Leu Phe Lys Ile Ser Ala Ala Ile 610 615 620 Ala Glu Gln Gln Asn Gln Glu Ile Glu Cys Leu Gln Val Ile Lys Ile 625 630 635 640 Pro Lys His Ser Asp Pro Ala Gln Thr Thr Val Ile Thr Gln Gln Ser 645 650 655 Arg Gln Leu Leu Gln Arg Ala Glu Arg Leu Gly Arg Gln His Gln Ile 660 665 670 Ser Val His Thr Gln Ile Arg Val Ala His Asp Arg Ala Gln Ala Ile 675 680 685 Leu Asp Thr Ile Arg Glu Arg His Ile Asn Leu Ile Val Leu Glu Trp 690 695 700 Asn Pro Asp Lys Lys Thr Pro Gly Ser Val Phe Gly Pro Val Ile Asp 705 710 715 720 Ile Leu Ile Arg Arg Ala Thr Cys Glu Leu Val Ile Val Lys Leu Gly 725 730 735 Lys Glu Lys Glu Ala Tyr Pro Gln Thr Leu Asp Lys Asp Thr Thr Trp 740 745 750 Leu Ile Pro Ile Ala Gly Gly Pro Asn Ala Lys Arg Ala Met Glu Leu 755 760 765 Leu Pro Gly Leu Thr Gln Leu Tyr Thr Arg Pro Arg Ser Pro Ile Ile 770 775 780 Trp Leu Cys Gln Val Phe Ser Pro His Lys Pro Thr Pro Asp Tyr Gln 785 790 795 800 Ser Leu Glu Ala Lys Ala Gln Gln Leu Lys Glu Gln Leu Glu Arg Pro 805 810 815 Val Ile Pro Leu Pro Ile Arg Ser Gln Ser Val Thr Asp Ala Ile Val 820 825 830 His Leu Ala Glu Ser Glu Ser Cys Asp Val Val Met Leu Gly Val Ser 835 840 845 Lys Glu Gly Leu Leu Ala Gln Val Met Gln Gly Asn Ile Pro Lys Thr 850 855 860 Ile Ala Gln Gln Val Lys Ser Thr Met Ile Leu Val Arg Gly Lys Leu 865 870 875 880 Asp Asn <210> 67 <211> 2628 <212> DNA <213> Microcystus aeruginosa <400> 67 ctaatctgat aattcccctc gcacgagaat cacagtgcaa ttaaccgcac gggcaatcgt 60 cgaggggata ttgccattta agaactgatt gagcaagctt tccctagatg cacccaaaag 120 caccaacgaa cagtcttccg attctaccag attaattatt gcctcggccg gagaggccga 180 acgaatcggt aaaggcacaa tcggctgtgc gatcgctttc tgtaaagatg cttgtaaaac 240 ttccaaaata gacagatctg gcagtaaatc cgtcggagaa tagattttac ataaccaaag 300 tttgggataa tccgaagact cggacaaaga caacaaacta ggcaataatg ctaaagcgcg 360 ttgggcatta ggaccgccgg cggtgggaat cagccaaatc ctttcccgat taggatcatt 420 gggaaaacaa tcctttgtcc ccaattttac caagatggtt tcacagggag cttgggcgat 480 caaagtatcg actaaaaacc caaaaatcgc cccagtagtg gatctttccc ccgtccaacc 540 cataattaat aaattgctgt gtcgttcgcg aatcgtggcc aaaatccctt cggcgatatc 600 ctgagccacc gaaatttgtg tatgaacaga gatattctgc tgtcgcgcta atctttccag 660 acgatgaagt aatttgcgtc cttcccgcgt atctaccttt acttccgccg gagaactaag 720 acgaggtaca gtaatcacat agagacaatc tatctcataa ttgcgttcac gggcgacagc 780 agcagcaatt ttaaacaaag cggtagcggt gtcgggattg gcaatgggta acaaaatccg 840 gcctattccc acagccggag aacgagtttg ataaaccaca taggaagggg tagtgggttg 900 aggcagttga caaacccccc ccaattgatc agcttccacc cggataatat cggtgcgggt 960 gatgatcccc accagttttt gaccatcggt aacgggtaaa cgggaaagct gatagcgatt 1020 taacagaaat aaaacatcgc ttaaggctgc ctggggagcc accgtaatcg gattgggagt 1080 catcatctcc cgtaggacgg tttgactgtt ttttgatcgc catttatcca gatcactttg 1140 ggtaaaaatc cccaatagtc gcccctgttc caccacggga aaaccgcgat gatgggaacg 1200 ggacataatt ttcaccactt cccccagggg taaatccgcc gccagaattt ccacctgcga 1260 ttgcatcaca tccatagccg atagatgggc cagcacatca ttagcagggg tttcctcgtt 1320 gagaataata ccactagcgg aaagtaaatg ctcatagagg gaaccggggc gaatgctttc 1380 ggcagtaata taagaaacgg cacaggtcaa catcaggggc agcacaatat taaaattgcg 1440 atgcagttca aagacaatca cgatcgccgt taccggaacc ctgactactc ccgtaaaaaa 1500 ggcccccata ccggctaaag cataactagg ttcgctgccg aaacccataa ttttcgtctc 1560 gattcccccc accagaaacc ccaaacagga tcccaacacc aaagcggggg cgagcagtcc 1620 tccaggagcg ccggaactat aggagatcat cgtcaggaaa aaatagacca caaaagcgag 1680 ggcggtattc tgccaactta attcccctgc cagcaaaaat tcgcgtaaac ccgtattatc 1740 tcgaaaaaag tcgggtaaaa aagccactac cgttcccgat aggccactga ccagaccgat 1800 gcgccaagct aaagataacc gccaacgccg ctgcatctgg ctacaaaaaa ggatgccttg 1860 attgaataaa gcccccaata agcccgctaa aacccccaaa aggcaataaa tgggtatttc 1920 ttgggcagag aagctaatat tggcatattc agtgatgatc gagggggtat tctgcagcat 1980 catcgaaacc acggccccgg taaaggaagc cacgatcgcc gtttctaggg tcatactgga 2040 aacatcgcgc attaattcct cgatcacaaa gaggactccg gcgatgggcg tagtaaaacc 2100 ggccgctaac ccggcggctg ccccggctgc gatcatctga cgacggtgat cgggactggt 2160 gggcagccag acgcttaact gggccgccag ggctgccccg atgtgtaccg tgggggcccg 2220 acgaccaagg gttaaaccac cgccaaggat caggatcgcc ccgatcattt ttacgacggc 2280 aacgcgccaa gacaggggca aagggtattt agctagggct gcttttactt ggggaatacc 2340 ccccccggcg gctgcggggg agaagtgttc cacaatccag ccggcgctat aaccaagcag 2400 aaaaccgccg aggggcaaaa ctaggaaagg agaggaattg gctactagat gcacccgcca 2460 accacctaac caaccgatgc ccaatttcag gataatagcg gcaagggcgg agagaattcc 2520 gattaaacag gcgaccagta aagcatagcg actatcggtg gcgctacgtc cgaagtgttg 2580 ggatttaaac cactgacgga ggttttggta acgggcaaaa agtcccat 2628 <210> 68 <211> 875 <212> PRT <213> Microcystus aeruginosa <400> 68 Met Gly Leu Phe Ala Arg Tyr Gln Asn Leu Arg Gln Trp Phe Lys Ser 1 5 10 15 Gln His Phe Gly Arg Ser Ala Thr Asp Ser Arg Tyr Ala Leu Leu Val 20 25 30 Ala Cys Leu Ile Gly Ile Leu Ser Ala Leu Ala Ala Ile Ile Leu Lys 35 40 45 Leu Gly Ile Gly Trp Leu Gly Gly Trp Arg Val His Leu Val Ala Asn 50 55 60 Ser Ser Pro Phe Leu Val Leu Pro Leu Gly Gly Phe Leu Leu Gly Tyr 65 70 75 80 Ser Ala Gly Trp Ile Val Glu His Phe Ser Pro Ala Ala Ala Gly Gly 85 90 95 Gly Ile Pro Gln Val Lys Ala Ala Leu Ala Lys Tyr Pro Leu Pro Leu 100 105 110 Ser Trp Arg Val Ala Val Val Lys Met Ile Gly Ala Ile Leu Ile Leu 115 120 125 Gly Gly Gly Leu Thr Leu Gly Arg Arg Ala Pro Thr Val His Ile Gly 130 135 140 Ala Ala Leu Ala Ala Gln Leu Ser Val Trp Leu Pro Thr Ser Pro Asp 145 150 155 160 His Arg Arg Gln Met Ile Ala Ala Gly Ala Ala Ala Gly Leu Ala Ala 165 170 175 Gly Phe Thr Thr Pro Ile Ala Gly Val Leu Phe Val Ile Glu Glu Leu 180 185 190 Met Arg Asp Val Ser Ser Met Thr Leu Glu Thr Ala Ile Val Ala Ser 195 200 205 Phe Thr Gly Ala Val Val Ser Met Met Leu Gln Asn Thr Pro Ser Ile 210 215 220 Ile Thr Glu Tyr Ala Asn Ile Ser Phe Ser Ala Gln Glu Ile Pro Ile 225 230 235 240 Tyr Cys Leu Leu Gly Val Leu Ala Gly Leu Leu Gly Ala Leu Phe Asn 245 250 255 Gln Gly Ile Leu Phe Cys Ser Gln Met Gln Arg Arg Trp Arg Leu Ser 260 265 270 Leu Ala Trp Arg Ile Gly Leu Val Ser Gly Leu Ser Gly Thr Val Val 275 280 285 Ala Phe Leu Pro Asp Phe Phe Arg Asp Asn Thr Gly Leu Arg Glu Phe 290 295 300 Leu Leu Ala Gly Glu Leu Ser Trp Gln Asn Thr Ala Leu Ala Phe Val 305 310 315 320 Val Tyr Phe Phe Leu Thr Met Ile Ser Tyr Ser Ser Gly Ala Pro Gly 325 330 335 Gly Leu Leu Ala Pro Ala Leu Val Leu Gly Ser Cys Leu Gly Phe Leu 340 345 350 Val Gly Gly Ile Glu Thr Lys Ile Met Gly Phe Gly Ser Glu Pro Ser 355 360 365 Tyr Ala Leu Ala Gly Met Gly Ala Phe Phe Thr Gly Val Val Arg Val 370 375 380 Pro Val Thr Ala Ile Val Ile Val Phe Glu Leu His Arg Asn Phe Asn 385 390 395 400 Ile Val Leu Pro Leu Met Leu Thr Cys Ala Val Ser Tyr Ile Thr Ala 405 410 415 Glu Ser Ile Arg Pro Gly Ser Leu Tyr Glu His Leu Leu Ser Ala Ser 420 425 430 Gly Ile Ile Leu Asn Glu Glu Thr Pro Ala Asn Asp Val Leu Ala His 435 440 445 Leu Ser Ala Met Asp Val Met Gln Ser Gln Val Glu Ile Leu Ala Ala 450 455 460 Asp Leu Pro Leu Gly Glu Val Val Lys Ile Met Ser Arg Ser His His 465 470 475 480 Arg Gly Phe Pro Val Val Glu Gln Gly Arg Leu Leu Gly Ile Phe Thr 485 490 495 Gln Ser Asp Leu Asp Lys Trp Arg Ser Lys Asn Ser Gln Thr Val Leu 500 505 510 Arg Glu Met Met Thr Pro Asn Pro Ile Thr Val Ala Pro Gln Ala Ala 515 520 525 Leu Ser Asp Val Leu Phe Leu Leu Asn Arg Tyr Gln Leu Ser Arg Leu 530 535 540 Pro Val Thr Asp Gly Gln Lys Leu Val Gly Ile Ile Thr Arg Thr Asp 545 550 555 560 Ile Ile Arg Val Glu Ala Asp Gln Leu Gly Gly Val Cys Gln Leu Pro 565 570 575 Gln Pro Thr Thr Pro Ser Tyr Val Val Tyr Gln Thr Arg Ser Pro Ala 580 585 590 Val Gly Ile Gly Arg Ile Leu Leu Pro Ile Ala Asn Pro Asp Thr Ala 595 600 605 Thr Ala Leu Phe Lys Ile Ala Ala Ala Val Ala Arg Glu Arg Asn Tyr 610 615 620 Glu Ile Asp Cys Leu Tyr Val Ile Thr Val Pro Arg Leu Ser Ser Pro 625 630 635 640 Ala Glu Val Lys Val Asp Thr Arg Glu Gly Arg Lys Leu Leu His Arg 645 650 655 Leu Glu Arg Leu Ala Arg Gln Gln Asn Ile Ser Val His Thr Gln Ile 660 665 670 Ser Val Ala Gln Asp Ile Ala Glu Gly Ile Leu Ala Thr Ile Arg Glu 675 680 685 Arg His Ser Asn Leu Leu Ile Met Gly Trp Thr Gly Glu Arg Ser Thr 690 695 700 Thr Gly Ala Ile Phe Gly Phe Leu Val Asp Thr Leu Ile Ala Gln Ala 705 710 715 720 Pro Cys Glu Thr Ile Leu Val Lys Leu Gly Thr Lys Asp Cys Phe Pro 725 730 735 Asn Asp Pro Asn Arg Glu Arg Ile Trp Leu Ile Pro Thr Ala Gly Gly 740 745 750 Pro Asn Ala Gln Arg Ala Leu Ala Leu Leu Pro Ser Leu Leu Ser Leu 755 760 765 Ser Glu Ser Ser Asp Tyr Pro Lys Leu Trp Leu Cys Lys Ile Tyr Ser 770 775 780 Pro Thr Asp Leu Leu Pro Asp Leu Ser Ile Leu Glu Val Leu Gln Ala 785 790 795 800 Ser Leu Gln Lys Ala Ile Ala Gln Pro Ile Val Pro Leu Pro Ile Arg 805 810 815 Ser Ala Ser Pro Ala Glu Ala Ile Ile Asn Leu Val Glu Ser Glu Asp 820 825 830 Cys Ser Leu Val Leu Leu Gly Ala Ser Arg Glu Ser Leu Leu Asn Gln 835 840 845 Phe Leu Asn Gly Asn Ile Pro Ser Thr Ile Ala Arg Ala Val Asn Cys 850 855 860 Thr Val Ile Leu Val Arg Gly Glu Leu Ser Asp 865 870 875 <210> 69 <211> 2628 <212> DNA <213> Microcystus aeruginosa <400> 69 ctaatctgat aattcccctc gcacgagaat cacagtgcaa ttaacggcac gggcaatcgt 60 cgaggggata ttgccattta ataactgatt gagcagactc tctctagatg cacccaaaag 120 caccaaggaa caatcttccg attctaccag attaattacc gcctcggccg gagaggccga 180 acgaatcggt aaaggcacga ctggctgtgc gatcgctttt tgtaaagatg cttgtaaaac 240 ttccaaagtg gacagatctg gcagtaactc cgtcggagaa taaattttac ataaccaaag 300 ttcgggatga tccgaagact cggacaaaga cagcaaacta ggcaataatg ctaaagctcg 360 ttgagcattg ggacctccgg cagtgggaat cagccaaatc ctttcccgat taagatcgtt 420 gggaaaacaa tcctttgtcc ccaattttac caagatggtt tcacagggag cctcagcgat 480 caaagtatcg actgaaaacc cgaaaatcgc cccagtagtg gatttttccc ccgtccaacc 540 cataattaat aaattgctgt gtcgttcgcg aatcgtggct aaaatcccgt cggcgatatc 600 ctgagccaca gaaatttgtg tatgaacaga gatatgctgc tgtcgggcta atctttccag 660 acgatgaagt aatttgcgtc cttcccgtgt atctaccttt acttccgccg gagaactaag 720 acgaggcaca gtaatcacat agagacaatc tatctcataa ttgcgttcac tggcgatcgc 780 agcagcaatt ttaaacaaag cagtagcggt gtcaggattg gcaataggta ataaaatccg 840 gcctattccc acagctgggg aacgagtttg ataaaccaca taggaagggg tactgggttg 900 gggcagttga caaactcccc ccaattgatc ggcttccacc cgaataatat cggtgcgggt 960 gatgatcccc accagttttt gaccgtcggt aacgggtaaa cgggaaagct gatagcgatt 1020 taagagaaat aaaacatcgg ttaaagctgc ctggggggcc acagtaatcg gattgggagt 1080 catgatctcc cgtaggactg tttgactgtt ttttgatcgc catttatcca gatcactttg 1140 ggtaaaaatc cccaatagtc gcccctgttc caccacggga aaaccgcgat gatgggaacg 1200 ggacataatt ttcaccactt cccccagggg taaatccgcc ggcagaattt ccacctgcga 1260 ttgcatcaca tccatagccg acagatgggc caacacatca ttagaagggg tttcttcgtt 1320 gagaataata ccactagcgg aaagtaaatg ctgatagagg gaaccggggt gaatgctttc 1380 ggcagtgata taagaaacgg cacaggtcaa catcaggggc agcacaatat taaaattgcg 1440 atgcagttca aagacaatca cgatcgccgt taccggaacc ctgactactc ccgtaaaaaa 1500 agcccccata ccggctaaag tataactagg ttcgctgccg aaacccatca ttttcgtctc 1560 gattcccccc accagaaacc ccaagcagga tcccaacacc aaagcggggg cgaggagtcc 1620 tcccggagcg ccggaactat aggagatcat cgtcaggaaa aaatagacca caaaagcgag 1680 ggcggtattc tgccaactta attcccctgc cagcaaaaat tcgcgtaaac ccgtattatc 1740 ccgaaaaaag tcgggtaaaa aggccactac cgttcccgat aaccagctga ccagaccgat 1800 gcgccaagcc agagataacc gccaacgccg ctgcagctgg ctacaaaaaa ggatgccttg 1860 attgaataaa gcccccaata agcccgctaa aacccccaaa aggcaataaa tgggtatttc 1920 ttgggcagag aagctaatat tggcatattc agtgatgatc gagggggtat tctgcagcat 1980 catcgaaacc acggccccgg taaaggaagc cacaatcgcc gtttctaggg tcatactgga 2040 gacatcgcgc attaattcct cgatcacaaa gaggacgccg gcgatgggag tagtaaaacc 2100 ggcggctaac cccgcggctg ccccggctgc gatcatctga cgacggtgat cgggactggt 2160 gggcagccag acgcttaatt gggccgctag ggctgctccg atgtgtaccg taggggcgcg 2220 acgaccaagg gttaaaccac cgccaaggat caggatcgcc ccgatcattt ttactagggc 2280 gacccgccaa gacaggggca aaggatattt agctaaggcc gcttttactt ggggaatacc 2340 acccccggcg gccgcggggg agaagtgttc gacaatccaa ccggcactgt aaccgagcag 2400 aaaaccgccg aggggcaaaa ctaggaaagg agaggaattg gctactagat gcacccgcca 2460 accacctaac caaccgatac ccaatttcag gataatagcg gcaagggcgg agagaattcc 2520 gattaaacag gctaccagta aagcatagcg actatcggtt gcgctacgtc cgaagtgttg 2580 ggatttaaac cactgacgga ggttttggtg acgggcaaaa agtcccat 2628 <210> 70 <211> 875 <212> PRT <213> Microcystus aeruginosa <400> 70 Met Gly Leu Phe Ala Arg His Gln Asn Leu Arg Gln Trp Phe Lys Ser 1 5 10 15 Gln His Phe Gly Arg Ser Ala Thr Asp Ser Arg Tyr Ala Leu Leu Val 20 25 30 Ala Cys Leu Ile Gly Ile Leu Ser Ala Leu Ala Ala Ile Ile Leu Lys 35 40 45 Leu Gly Ile Gly Trp Leu Gly Gly Trp Arg Val His Leu Val Ala Asn 50 55 60 Ser Ser Pro Phe Leu Val Leu Pro Leu Gly Gly Phe Leu Leu Gly Tyr 65 70 75 80 Ser Ala Gly Trp Ile Val Glu His Phe Ser Pro Ala Ala Ala Gly Gly 85 90 95 Gly Ile Pro Gln Val Lys Ala Ala Leu Ala Lys Tyr Pro Leu Pro Leu 100 105 110 Ser Trp Arg Val Ala Leu Val Lys Met Ile Gly Ala Ile Leu Ile Leu 115 120 125 Gly Gly Gly Leu Thr Leu Gly Arg Arg Ala Pro Thr Val His Ile Gly 130 135 140 Ala Ala Leu Ala Ala Gln Leu Ser Val Trp Leu Pro Thr Ser Pro Asp 145 150 155 160 His Arg Arg Gln Met Ile Ala Ala Gly Ala Ala Ala Gly Leu Ala Ala 165 170 175 Gly Phe Thr Thr Pro Ile Ala Gly Val Leu Phe Val Ile Glu Glu Leu 180 185 190 Met Arg Asp Val Ser Ser Met Thr Leu Glu Thr Ala Ile Val Ala Ser 195 200 205 Phe Thr Gly Ala Val Val Ser Met Met Leu Gln Asn Thr Pro Ser Ile 210 215 220 Ile Thr Glu Tyr Ala Asn Ile Ser Phe Ser Ala Gln Glu Ile Pro Ile 225 230 235 240 Tyr Cys Leu Leu Gly Val Leu Ala Gly Leu Leu Gly Ala Leu Phe Asn 245 250 255 Gln Gly Ile Leu Phe Cys Ser Gln Leu Gln Arg Arg Trp Arg Leu Ser 260 265 270 Leu Ala Trp Arg Ile Gly Leu Val Ser Trp Leu Ser Gly Thr Val Val 275 280 285 Ala Phe Leu Pro Asp Phe Phe Arg Asp Asn Thr Gly Leu Arg Glu Phe 290 295 300 Leu Leu Ala Gly Glu Leu Ser Trp Gln Asn Thr Ala Leu Ala Phe Val 305 310 315 320 Val Tyr Phe Phe Leu Thr Met Ile Ser Tyr Ser Ser Gly Ala Pro Gly 325 330 335 Gly Leu Leu Ala Pro Ala Leu Val Leu Gly Ser Cys Leu Gly Phe Leu 340 345 350 Val Gly Gly Ile Glu Thr Lys Met Met Gly Phe Gly Ser Glu Pro Ser 355 360 365 Tyr Thr Leu Ala Gly Met Gly Ala Phe Phe Thr Gly Val Val Arg Val 370 375 380 Pro Val Thr Ala Ile Val Ile Val Phe Glu Leu His Arg Asn Phe Asn 385 390 395 400 Ile Val Leu Pro Leu Met Leu Thr Cys Ala Val Ser Tyr Ile Thr Ala 405 410 415 Glu Ser Ile His Pro Gly Ser Leu Tyr Gln His Leu Leu Ser Ala Ser 420 425 430 Gly Ile Ile Leu Asn Glu Glu Thr Pro Ser Asn Asp Val Leu Ala His 435 440 445 Leu Ser Ala Met Asp Val Met Gln Ser Gln Val Glu Ile Leu Pro Ala 450 455 460 Asp Leu Pro Leu Gly Glu Val Val Lys Ile Met Ser Arg Ser His His 465 470 475 480 Arg Gly Phe Pro Val Val Glu Gln Gly Arg Leu Leu Gly Ile Phe Thr 485 490 495 Gln Ser Asp Leu Asp Lys Trp Arg Ser Lys Asn Ser Gln Thr Val Leu 500 505 510 Arg Glu Ile Met Thr Pro Asn Pro Ile Thr Val Ala Pro Gln Ala Ala 515 520 525 Leu Thr Asp Val Leu Phe Leu Leu Asn Arg Tyr Gln Leu Ser Arg Leu 530 535 540 Pro Val Thr Asp Gly Gln Lys Leu Val Gly Ile Ile Thr Arg Thr Asp 545 550 555 560 Ile Ile Arg Val Glu Ala Asp Gln Leu Gly Gly Val Cys Gln Leu Pro 565 570 575 Gln Pro Ser Thr Pro Ser Tyr Val Val Tyr Gln Thr Arg Ser Pro Ala 580 585 590 Val Gly Ile Gly Arg Ile Leu Leu Pro Ile Ala Asn Pro Asp Thr Ala 595 600 605 Thr Ala Leu Phe Lys Ile Ala Ala Ala Ile Ala Ser Glu Arg Asn Tyr 610 615 620 Glu Ile Asp Cys Leu Tyr Val Ile Thr Val Pro Arg Leu Ser Ser Pro 625 630 635 640 Ala Glu Val Lys Val Asp Thr Arg Glu Gly Arg Lys Leu Leu His Arg 645 650 655 Leu Glu Arg Leu Ala Arg Gln Gln His Ile Ser Val His Thr Gln Ile 660 665 670 Ser Val Ala Gln Asp Ile Ala Asp Gly Ile Leu Ala Thr Ile Arg Glu 675 680 685 Arg His Ser Asn Leu Leu Ile Met Gly Trp Thr Gly Glu Lys Ser Thr 690 695 700 Thr Gly Ala Ile Phe Gly Phe Ser Val Asp Thr Leu Ile Ala Glu Ala 705 710 715 720 Pro Cys Glu Thr Ile Leu Val Lys Leu Gly Thr Lys Asp Cys Phe Pro 725 730 735 Asn Asp Leu Asn Arg Glu Arg Ile Trp Leu Ile Pro Thr Ala Gly Gly 740 745 750 Pro Asn Ala Gln Arg Ala Leu Ala Leu Leu Pro Ser Leu Leu Ser Leu 755 760 765 Ser Glu Ser Ser Asp His Pro Glu Leu Trp Leu Cys Lys Ile Tyr Ser 770 775 780 Pro Thr Glu Leu Leu Pro Asp Leu Ser Thr Leu Glu Val Leu Gln Ala 785 790 795 800 Ser Leu Gln Lys Ala Ile Ala Gln Pro Val Val Pro Leu Pro Ile Arg 805 810 815 Ser Ala Ser Pro Ala Glu Ala Val Ile Asn Leu Val Glu Ser Glu Asp 820 825 830 Cys Ser Leu Val Leu Leu Gly Ala Ser Arg Glu Ser Leu Leu Asn Gln 835 840 845 Leu Leu Asn Gly Asn Ile Pro Ser Thr Ile Ala Arg Ala Val Asn Cys 850 855 860 Thr Val Ile Leu Val Arg Gly Glu Leu Ser Asp 865 870 875 <210> 71 <211> 2637 <212> DNA <213> Synechocystis sp. <400> 71 tcattcgggg tcagtgacgt ctaaggcccc ccgaataatc accactgtgc ggtttgtccc 60 cttggcgatc gcctccggga tatttccatg gagcgccttt tgaaataagc tttctcggct 120 agctcccaga atgaccagat cgtaggtttc ttctttgatt aggcggatta aactgtcagc 180 aatgtgggac gagcgaatag gtaggggaat aatgggaatt tcgaccaggg gatccaagcc 240 tcgcttggcc ttgacgagca gcggaaaatg ttgggggcgt tgttggggtt gatagacctg 300 acagaggcaa atttgggacg gcagggaata gcgcaccacc tctggggaca ggtgcagcag 360 tgctgggatg aattcctggg cgcgttcggc gttggggccg cccgcaatgg gaacgagggc 420 gcggattttt cctgtttgag ccttaaattg gaggggatgg gcgtggctcg ttttcaccaa 480 aatcacgtca cagggcactt ttttcacgag atattccatt acactcccga acagttgccc 540 ccctgggtgg cgatcgcctt gccaacccaa gattaacccc tgatccttgc tcgaaatttc 600 ctgaagaatg gccccggcca catcgtaggc gaggatcact tgggtgtgga ttgagatccc 660 caatgtctcc ccaaggcgtt ccagtttttc catcagatgc cgttctggat aggtgttcat 720 gtgggcatcg gtgaggggat aggttgctgc cacctgcacc acattcaggc aatagaccat 780 ggcatttttt tccttggcaa tggctgccgc aaaggtgatg agggcttcgg cggtattggg 840 attggcgatc gccacccaga gtttgcgctt gtaattgtcg ctggtgtggg tttgataaac 900 gcaataggac ggcgtgcgct gtactgcatg gtgacttttc ccgaggagtt cctgggcctc 960 ggcacgaata atatctgacc gggtaataat cccctggagc tgatcattat cgacgacagg 1020 taggcgggaa atttgataac gattgagcag gtacaaaaca tcactaaggg aagcccgggg 1080 agagaccgta atcaccttgc gttgcatcac ctgggctacc gttaaattct ttccctgggc 1140 cgccatttgg gccagatccc cttgggtgac aatgccgacg agcttgcctt gttttaaaac 1200 cggaaaaccc cggtggggcg attcagacag gatggggact aaatccttta agttgaggtg 1260 gctttccagg gtttctactt ccggttgcat cacctgggcg gcggtgagat ccgttaacac 1320 ctgggggttt ttttcctcct ctaggtgaat gccgctggct tccaggagat actcgtagat 1380 cgaaccttta aaaatgcttt cggccacgat gagcgctgtc accgaagcca gcattaaggg 1440 gaggactaaa ttaaaatctg tggtcagctc aaagacaatt acaatcgcgg tcactggcac 1500 ccgcgccacc cctgtaaaaa aagcccccat ccccgcaagg gcgtaggtat attgggtcgc 1560 ctctggcaca aagatctcgg cacaggtacc cactaaataa ccgagggccg tgcctaaaac 1620 gagggtcggt gcaaatagtc cccccggtgc gccggagcca taggcaatca agcttaggaa 1680 aaagtgggcg acaaaggcga tcgcaattac ctgccagccc gcatcccccg taagcaaaaa 1740 atcccgtagc cctgcattgt cccggaaaaa aggcggcaaa aacgcgacca cagtgcccga 1800 aatcgccccg gcgatcgcca tccgcacccc caagctcaaa cggagacgac gattaaaccc 1860 caaaaccgtt aagataccgc gattgaataa agcccccaaa acccctgcca agccccccaa 1920 cagcaaatac caggggattt ctgccagata aaaattactt tgattcgccg cgtttaatag 1980 ctctgcgggc aaattcagat ccgaagtgcc aaaccagcgg gagaccaccg cgcccgtaaa 2040 ggaagcaaca attgctgttt ctaaagtcag ccctgacatg tcccgcatca gttcttcgac 2100 cacgaacagt accccagcaa tgggggtatt aaatcccgcc gctaaacccg ccgctgctcc 2160 ggctgcaatc atctgtcgtc ggtggtttgg ggttgtcggc agccattgac tgagttgagc 2220 tgcgagagcc gcaccgatat ggacactggg gccgcgccgt ccgagggtca gtccaccacc 2280 tagaaccaaa atcgtgccaa tggatttagc taaggctacc ttccaattta gcggcagggg 2340 aaattgggcc aggacaacct tgacctgggg gacgccgccc cccttggctt ctggggcaaa 2400 ggtctctagg agatagcccg ccaaccagcc gcaaaccacc ccaaacagag gcaggattaa 2460 ccaggcgccg tattgacgac tcaggatgac ccgatatccc cccacgaaac caatgccttg 2520 tttgaggaaa agggccgcca aaccggagat gacaccaatg aggcaggctt cgattaataa 2580 atagttattg tttaagctgt gctggcctaa ggatcgaaaa atccaccaat ttcgcac 2637 <210> 72 <211> 878 <212> PRT <213> Synechocystis sp. <400> 72 Met Arg Asn Trp Trp Ile Phe Arg Ser Leu Gly Gln His Ser Leu Asn 1 5 10 15 Asn Asn Tyr Leu Leu Ile Glu Ala Cys Leu Ile Gly Val Ile Ser Gly 20 25 30 Leu Ala Ala Leu Phe Leu Lys Gln Gly Ile Gly Phe Val Gly Gly Tyr 35 40 45 Arg Val Ile Leu Ser Arg Gln Tyr Gly Ala Trp Leu Ile Leu Pro Leu 50 55 60 Phe Gly Val Val Cys Gly Trp Leu Ala Gly Tyr Leu Leu Glu Thr Phe 65 70 75 80 Ala Pro Glu Ala Lys Gly Gly Gly Val Pro Gln Val Lys Val Val Leu 85 90 95 Ala Gln Phe Pro Leu Pro Leu Asn Trp Lys Val Ala Leu Ala Lys Ser 100 105 110 Ile Gly Thr Ile Leu Val Leu Gly Gly Gly Leu Thr Leu Gly Arg Arg 115 120 125 Gly Pro Ser Val His Ile Gly Ala Ala Leu Ala Ala Gln Leu Ser Gln 130 135 140 Trp Leu Pro Thr Thr Pro Asn His Arg Arg Gln Met Ile Ala Ala Gly 145 150 155 160 Ala Ala Ala Gly Leu Ala Ala Gly Phe Asn Thr Pro Ile Ala Gly Val 165 170 175 Leu Phe Val Val Glu Glu Leu Met Arg Asp Met Ser Gly Leu Thr Leu 180 185 190 Glu Thr Ala Ile Val Ala Ser Phe Thr Gly Ala Val Val Ser Arg Trp 195 200 205 Phe Gly Thr Ser Asp Leu Asn Leu Pro Ala Glu Leu Leu Asn Ala Ala 210 215 220 Asn Gln Ser Asn Phe Tyr Leu Ala Glu Ile Pro Trp Tyr Leu Leu Leu 225 230 235 240 Gly Gly Leu Ala Gly Val Leu Gly Ala Leu Phe Asn Arg Gly Ile Leu 245 250 255 Thr Val Leu Gly Phe Asn Arg Arg Leu Arg Leu Ser Leu Gly Val Arg 260 265 270 Met Ala Ile Ala Gly Ala Ile Ser Gly Thr Val Val Ala Phe Leu Pro 275 280 285 Pro Phe Phe Arg Asp Asn Ala Gly Leu Arg Asp Phe Leu Leu Thr Gly 290 295 300 Asp Ala Gly Trp Gln Val Ile Ala Ile Ala Phe Val Ala His Phe Phe 305 310 315 320 Leu Ser Leu Ile Ala Tyr Gly Ser Gly Ala Pro Gly Gly Leu Phe Ala 325 330 335 Pro Thr Leu Val Leu Gly Thr Ala Leu Gly Tyr Leu Val Gly Thr Cys 340 345 350 Ala Glu Ile Phe Val Pro Glu Ala Thr Gln Tyr Thr Tyr Ala Leu Ala 355 360 365 Gly Met Gly Ala Phe Phe Thr Gly Val Ala Arg Val Pro Val Thr Ala 370 375 380 Ile Val Ile Val Phe Glu Leu Thr Thr Asp Phe Asn Leu Val Leu Pro 385 390 395 400 Leu Met Leu Ala Ser Val Thr Ala Leu Ile Val Ala Glu Ser Ile Phe 405 410 415 Lys Gly Ser Ile Tyr Glu Tyr Leu Leu Glu Ala Ser Gly Ile His Leu 420 425 430 Glu Glu Glu Lys Asn Pro Gln Val Leu Thr Asp Leu Thr Ala Ala Gln 435 440 445 Val Met Gln Pro Glu Val Glu Thr Leu Glu Ser His Leu Asn Leu Lys 450 455 460 Asp Leu Val Pro Ile Leu Ser Glu Ser Pro His Arg Gly Phe Pro Val 465 470 475 480 Leu Lys Gln Gly Lys Leu Val Gly Ile Val Thr Gln Gly Asp Leu Ala 485 490 495 Gln Met Ala Ala Gln Gly Lys Asn Leu Thr Val Ala Gln Val Met Gln 500 505 510 Arg Lys Val Ile Thr Val Ser Pro Arg Ala Ser Leu Ser Asp Val Leu 515 520 525 Tyr Leu Leu Asn Arg Tyr Gln Ile Ser Arg Leu Pro Val Val Asp Asn 530 535 540 Asp Gln Leu Gln Gly Ile Ile Thr Arg Ser Asp Ile Ile Arg Ala Glu 545 550 555 560 Ala Gln Glu Leu Leu Gly Lys Ser His His Ala Val Gln Arg Thr Pro 565 570 575 Ser Tyr Cys Val Tyr Gln Thr His Thr Ser Asp Asn Tyr Lys Arg Lys 580 585 590 Leu Trp Val Ala Ile Ala Asn Pro Asn Thr Ala Glu Ala Leu Ile Thr 595 600 605 Phe Ala Ala Ala Ile Ala Lys Glu Lys Asn Ala Met Val Tyr Cys Leu 610 615 620 Asn Val Val Gln Val Ala Ala Thr Tyr Pro Leu Thr Asp Ala His Met 625 630 635 640 Asn Thr Tyr Pro Glu Arg His Leu Met Glu Lys Leu Glu Arg Leu Gly 645 650 655 Glu Thr Leu Gly Ile Ser Ile His Thr Gln Val Ile Leu Ala Tyr Asp 660 665 670 Val Ala Gly Ala Ile Leu Gln Glu Ile Ser Ser Lys Asp Gln Gly Leu 675 680 685 Ile Leu Gly Trp Gln Gly Asp Arg His Pro Gly Gly Gln Leu Phe Gly 690 695 700 Ser Val Met Glu Tyr Leu Val Lys Lys Val Pro Cys Asp Val Ile Leu 705 710 715 720 Val Lys Thr Ser His Ala His Pro Leu Gln Phe Lys Ala Gln Thr Gly 725 730 735 Lys Ile Arg Ala Leu Val Pro Ile Ala Gly Gly Pro Asn Ala Glu Arg 740 745 750 Ala Gln Glu Phe Ile Pro Ala Leu Leu His Leu Ser Pro Glu Val Val 755 760 765 Arg Tyr Ser Leu Pro Ser Gln Ile Cys Leu Cys Gln Val Tyr Gln Pro 770 775 780 Gln Gln Arg Pro Gln His Phe Pro Leu Leu Val Lys Ala Lys Arg Gly 785 790 795 800 Leu Asp Pro Leu Val Glu Ile Pro Ile Ile Pro Leu Pro Ile Arg Ser 805 810 815 Ser His Ile Ala Asp Ser Leu Ile Arg Leu Ile Lys Glu Glu Thr Tyr 820 825 830 Asp Leu Val Ile Leu Gly Ala Ser Arg Glu Ser Leu Phe Gln Lys Ala 835 840 845 Leu His Gly Asn Ile Pro Glu Ala Ile Ala Lys Gly Thr Asn Arg Thr 850 855 860 Val Val Ile Ile Arg Gly Ala Leu Asp Val Thr Asp Pro Glu 865 870 875 <210> 73 <211> 2664 <212> DNA <213> Nodularia spumigena <400> 73 atggcgattt ctggtctgac tcagcgcttt cgcctttggt tgcaaccgac aagaggttta 60 gcgatcgccg aagcttgtat tattggactt gtagccgccc tttctgcggt gttcctgaaa 120 ttcggctcag gatttttagg aacatggcga gtccaaacta gccaaattgt accagcattg 180 ttagtcttac ctaccattgg tctgagcttt ggatttatag ctggctcttt ggtgaataga 240 tttgcaccag aagcttcagg gagcggtatc cctcaagtca aagccactct tgctaacgtc 300 ccaattacat tatcctggcg agtggcaacg gtaaagttaa tcagtgctat tatcaccctc 360 ggttcaggaa tggctctggg gcgacaaggc cccaccgttc atgtaggggc gggtttagca 420 gcaggaatga gtcgctgggt tcccacctcc ccagatcatc gacgacagat gattgctgcg 480 ggtgctggtg cgggtttagc ggccgctttc aatgccccaa tcactggtgt attgtttatc 540 gtagaggaat tactccaaga tttatcaggg ctgactttag gaaccgccat tatcgcttcc 600 tttattggtg gtgtagtatc tcggctgttg ggtgggggta gtttgcaact taacctggaa 660 ttgttgcaat acgccagtaa cttcactttg ccagaaattc ccttttttgt cttgttgggg 720 attttagcag ggttcctggg tgcattattt aatcgtggtt taatcgccag tattaaaatt 780 tatcaaaatt tacacctcag cttaccgcta aaaatggctt tagctggatg tatttccggt 840 ttattagtgg caatgcttcc ggaatctttc cgtgattatg cgggcttacg ggagtacatg 900 attatcagtg aagctaatat aacttttgcg gcgatcgcct ttttatctca atttctgctc 960 accctggtgg cctttggttc cggtgcgcct ggggggttat ttgcgccgag tctgattttg 1020 ggttcttgtt taggacatct agttggtgta tccgcctctt atttcttagc agtggattcc 1080 cccacaactt acgctttagc tggtatgggc ggttttttta gtgctgtttc taaagtacca 1140 atcacagcca tagtaattgt ctttgaaatg actacagatt tcaatttggt actacctttg 1200 atgattgtat ctgtagctgc atacttggtt tcggacaaag taatgccggg atctttatat 1260 gacaaactat tacagctaaa aggcatcaca attactaaag ctgtttcccc cgaaggaata 1320 ttaacaaagt taacagctaa cgatgtcatg cagcatcgag tcgaaactct ggatgcagat 1380 atgacattag aagaagcaat gcaagtattt tcccgttccc atcatcgggg ctttccagtg 1440 gtagagaatg gcaaactcat cgggattatc acacaatcgg attttgtcac caaacgcgat 1500 agtgattcct acatcctgag taatagccag tcaccaaagg atgtctcatt aagggagatt 1560 atgatccact cccccataac tgtcaaaccc aagcatcacc tcagtaatgt tttgtatttg 1620 ctagatcgct atcaaattag tcgcttacca gtggtggaag ggcggaaatt agtggggatt 1680 attacccgtg cagacatcat ccgcgcccaa gctgaacatt tgaattatgg caacgttacc 1740 ccagaatcac agccggaacc ttcttatgta gtttatcaaa cgcgatcgcc taatattggc 1800 agaggtcgat tattagtacc agtagccaat cccgaaaccg ccgccattct cttgcaaatg 1860 gccgcagcta ttgcgcgcga tcgccactat gaaatcgagt gtgtgcaaat aatcttagta 1920 tcgcgtcaca attccccctc agaaacatca gtcagaaccg ccaaaagtcg ccgcttacta 1980 cgacaagccg aagttttggc taaaaagtgg aaaattccct tacacaccca aattagagtc 2040 gcccacgacc cagccgaggc aatattggaa accatccacg aacgacatat aaacctgatt 2100 ttaatgggct ggaaaggtga aacttctacc cctgggcgga tttttggcaa tgttgtagat 2160 accatcattc gtcaagccac ctgcgacgta atgctagtaa aactgggtaa tactccccac 2220 tccctactcc ccattcccca ttccccattc cccactccca aattcaaccg ttggctagtc 2280 acaatggctg gcggtcctaa tgtcagagta gcgattaaat tattacctgc tttagcgaca 2340 ttgggggata atccatacat tcggctgacg caggtgttta aaccatctca gttaaagcca 2400 gacatgacag ttttagaaca agccatccgg atattaatgc gtcgccgtaa attatccagc 2460 aatgtagttg ctatccccgt ccaagctgat tcggtggctg aaggagtgat taatctcgtg 2520 aaaaccgaag gttatgatgt tgtggtttta ggggcttctc gtgagggatt attacagcaa 2580 gcagttcaag gtaatattcc cgaagcgatc gcctctggtg tagactgcac agtcatctta 2640 gtcagaggcg cgattagtag ttaa 2664 <210> 74 <211> 887 <212> PRT <213> Nodularia spumigena <400> 74 Met Ala Ile Ser Gly Leu Thr Gln Arg Phe Arg Leu Trp Leu Gln Pro 1 5 10 15 Thr Arg Gly Leu Ala Ile Ala Glu Ala Cys Ile Ile Gly Leu Val Ala 20 25 30 Ala Leu Ser Ala Val Phe Leu Lys Phe Gly Ser Gly Phe Leu Gly Thr 35 40 45 Trp Arg Val Gln Thr Ser Gln Ile Val Pro Ala Leu Leu Val Leu Pro 50 55 60 Thr Ile Gly Leu Ser Phe Gly Phe Ile Ala Gly Ser Leu Val Asn Arg 65 70 75 80 Phe Ala Pro Glu Ala Ser Gly Ser Gly Ile Pro Gln Val Lys Ala Thr 85 90 95 Leu Ala Asn Val Pro Ile Thr Leu Ser Trp Arg Val Ala Thr Val Lys 100 105 110 Leu Ile Ser Ala Ile Ile Thr Leu Gly Ser Gly Met Ala Leu Gly Arg 115 120 125 Gln Gly Pro Thr Val His Val Gly Ala Gly Leu Ala Ala Gly Met Ser 130 135 140 Arg Trp Val Pro Thr Ser Pro Asp His Arg Arg Gln Met Ile Ala Ala 145 150 155 160 Gly Ala Gly Ala Gly Leu Ala Ala Ala Phe Asn Ala Pro Ile Thr Gly 165 170 175 Val Leu Phe Ile Val Glu Glu Leu Leu Gln Asp Leu Ser Gly Leu Thr 180 185 190 Leu Gly Thr Ala Ile Ile Ala Ser Phe Ile Gly Gly Val Val Ser Arg 195 200 205 Leu Leu Gly Gly Gly Ser Leu Gln Leu Asn Leu Glu Leu Leu Gln Tyr 210 215 220 Ala Ser Asn Phe Thr Leu Pro Glu Ile Pro Phe Phe Val Leu Leu Gly 225 230 235 240 Ile Leu Ala Gly Phe Leu Gly Ala Leu Phe Asn Arg Gly Leu Ile Ala 245 250 255 Ser Ile Lys Ile Tyr Gln Asn Leu His Leu Ser Leu Pro Leu Lys Met 260 265 270 Ala Leu Ala Gly Cys Ile Ser Gly Leu Leu Val Ala Met Leu Pro Glu 275 280 285 Ser Phe Arg Asp Tyr Ala Gly Leu Arg Glu Tyr Met Ile Ile Ser Glu 290 295 300 Ala Asn Ile Thr Phe Ala Ala Ile Ala Phe Leu Ser Gln Phe Leu Leu 305 310 315 320 Thr Leu Val Ala Phe Gly Ser Gly Ala Pro Gly Gly Leu Phe Ala Pro 325 330 335 Ser Leu Ile Leu Gly Ser Cys Leu Gly His Leu Val Gly Val Ser Ala 340 345 350 Ser Tyr Phe Leu Ala Val Asp Ser Pro Thr Thr Tyr Ala Leu Ala Gly 355 360 365 Met Gly Gly Phe Phe Ser Ala Val Ser Lys Val Pro Ile Thr Ala Ile 370 375 380 Val Ile Val Phe Glu Met Thr Thr Asp Phe Asn Leu Val Leu Pro Leu 385 390 395 400 Met Ile Val Ser Val Ala Ala Tyr Leu Val Ser Asp Lys Val Met Pro 405 410 415 Gly Ser Leu Tyr Asp Lys Leu Leu Gln Leu Lys Gly Ile Thr Ile Thr 420 425 430 Lys Ala Val Ser Pro Glu Gly Ile Leu Thr Lys Leu Thr Ala Asn Asp 435 440 445 Val Met Gln His Arg Val Glu Thr Leu Asp Ala Asp Met Thr Leu Glu 450 455 460 Glu Ala Met Gln Val Phe Ser Arg Ser His His Arg Gly Phe Pro Val 465 470 475 480 Val Glu Asn Gly Lys Leu Ile Gly Ile Ile Thr Gln Ser Asp Phe Val 485 490 495 Thr Lys Arg Asp Ser Asp Ser Tyr Ile Leu Ser Asn Ser Gln Ser Pro 500 505 510 Lys Asp Val Ser Leu Arg Glu Ile Met Ile His Ser Pro Ile Thr Val 515 520 525 Lys Pro Lys His His Leu Ser Asn Val Leu Tyr Leu Leu Asp Arg Tyr 530 535 540 Gln Ile Ser Arg Leu Pro Val Val Glu Gly Arg Lys Leu Val Gly Ile 545 550 555 560 Ile Thr Arg Ala Asp Ile Ile Arg Ala Gln Ala Glu His Leu Asn Tyr 565 570 575 Gly Asn Val Thr Pro Glu Ser Gln Pro Glu Pro Ser Tyr Val Val Tyr 580 585 590 Gln Thr Arg Ser Pro Asn Ile Gly Arg Gly Arg Leu Leu Val Pro Val 595 600 605 Ala Asn Pro Glu Thr Ala Ala Ile Leu Leu Gln Met Ala Ala Ala Ile 610 615 620 Ala Arg Asp Arg His Tyr Glu Ile Glu Cys Val Gln Ile Ile Leu Val 625 630 635 640 Ser Arg His Asn Ser Pro Ser Glu Thr Ser Val Arg Thr Ala Lys Ser 645 650 655 Arg Arg Leu Leu Arg Gln Ala Glu Val Leu Ala Lys Lys Trp Lys Ile 660 665 670 Pro Leu His Thr Gln Ile Arg Val Ala His Asp Pro Ala Glu Ala Ile 675 680 685 Leu Glu Thr Ile His Glu Arg His Ile Asn Leu Ile Leu Met Gly Trp 690 695 700 Lys Gly Glu Thr Ser Thr Pro Gly Arg Ile Phe Gly Asn Val Val Asp 705 710 715 720 Thr Ile Ile Arg Gln Ala Thr Cys Asp Val Met Leu Val Lys Leu Gly 725 730 735 Asn Thr Pro His Ser Leu Leu Pro Ile Pro His Ser Pro Phe Pro Thr 740 745 750 Pro Lys Phe Asn Arg Trp Leu Val Thr Met Ala Gly Gly Pro Asn Val 755 760 765 Arg Val Ala Ile Lys Leu Leu Pro Ala Leu Ala Thr Leu Gly Asp Asn 770 775 780 Pro Tyr Ile Arg Leu Thr Gln Val Phe Lys Pro Ser Gln Leu Lys Pro 785 790 795 800 Asp Met Thr Val Leu Glu Gln Ala Ile Arg Ile Leu Met Arg Arg Arg 805 810 815 Lys Leu Ser Ser Asn Val Val Ala Ile Pro Val Gln Ala Asp Ser Val 820 825 830 Ala Glu Gly Val Ile Asn Leu Val Lys Thr Glu Gly Tyr Asp Val Val 835 840 845 Val Leu Gly Ala Ser Arg Glu Gly Leu Leu Gln Gln Ala Val Gln Gly 850 855 860 Asn Ile Pro Glu Ala Ile Ala Ser Gly Val Asp Cys Thr Val Ile Leu 865 870 875 880 Val Arg Gly Ala Ile Ser Ser 885 <210> 75 <211> 2616 <212> DNA <213> Microcoleus chthonoplastes <400> 75 ttatgtcgca ctgcgaacta aaataacggt actcttcacc cgccgcgcga tcgcttccgg 60 tatattctcc tgaatcatga gctgtaatag cccttcccga cttgcgccta aaaccacgac 120 atcgcataat tggttattag cgatataaac caccgcatca gaaacctcac tggcgcgaat 180 aggaatccgg cgaatccgac cctcggtttg tttctttaaa aagtcgctag cttcttctat 240 ggcggttgta tccataatcg tatcttctgg atcaaagact tggcataatc gaatatcggg 300 tggcttacta cttaagggaa ttaacgctgg cagaaattcc aaagcgcgtt gcgaattcgg 360 accgcctgcg atgggaatca accaacgctg aaagaaggga gggatataag gcggatgcat 420 catttcaccc aatttaacga ccatcacatc acagggcgct tgtcgaatca ctgcatccac 480 taccccgcca aaaatgcgtc caggggttga ggttgagcct ttccacccca tcatcatcaa 540 attaatatgt cgctctttaa tggtgtctag aatcccttga gtaatatcct gactcacccg 600 tatttgagtg tgaacgggta tattccaatc tcgtccccac ttttccgcct gacgtaataa 660 ccgacgactt tttgtggttg ttactggcgt ttctgcagga gacgtgctgc gggagacgag 720 aatcacttgt agacattcca attcatagtc gcgatcgcgg gcgatggcgg cggcgagttt 780 gactaatatg ggggcggttt ggggattagc gatgggaact aataaccgtc ctcgtcccgt 840 ttctggcgat cgggtttgat aaactacata agagggttct gattgtgatc tagtctgagt 900 tgtcttacta tcaagctgat ccaattccgc ccgaataata tcgctgcggg taataattcc 960 caataacttc cgcccttcag tgactgggag gcgactgagg tgataacggt tgagcagata 1020 aagcacatcg actaaactcg ctgtcggctt caccgttatc gggtgcgatg tcataatctc 1080 tgctagaggt gtggtgccgg gaaacggaca acggggcgga ttgccttgca tttttgtcgc 1140 ctgtgtaaga tctgattgac taataatccc cactagcgtc ccttcatcta ccacaggaaa 1200 cccttggtgc gtcgaacgag ataccatctg caaggcgtca tccagagtca tgtgcagcga 1260 taaggtttct acctgtcgtt gcatcaaatc ctctgctgtt aacccaacca atgaaccctt 1320 gtctactttt tgagtggggg aggtataccc tctccattcc aacagacgct gataaagtga 1380 gcctttggag agttgatcgg caattagata agacaccaca caggtgatca ttaacggtaa 1440 aaccagattg aaatccgccg taatctcaaa tatgatcaca atcgcggtta taggaacctt 1500 agatacagca ctaaaaaacg cccccatccc tgccaaggcg taagtcgtcg gttccccaac 1560 ccctaaaaac gataatttag caacgcccac cagataaccc aaggcagaac ccaaaaccag 1620 tgacgggtga aataaacccc caggagcgcc tgatccataa gaaactaggg tgagaaaaaa 1680 gtaggttact aaagcgaggc tagtgaattg ccaactttct gcgcctgtaa ttaacaactc 1740 ccgcaaccca cgattattgc gaaaatccgg gggtaacaga gaaaccacac aaccacagat 1800 taatcccgct agccccattt ttaccgccaa agagacatga aagcggcgtt gtagcgtcaa 1860 tgaaaacaga atcccacgat taaataaggt tgccagtaat ccggctaaaa gacccaggat 1920 taaataaaag ggaatctccg gagcagaaaa actactggtt gtttgagtta gttccaggtt 1980 caggtcgaga ctacgacccc ctaaaatccg ggaaatcacc gcaccgataa acgaagcgag 2040 aatcgctgtt cctagcgtta agccggaaaa atcatggatt aattcctcaa ccacaaacaa 2100 aatacccgcg attggggtat taaaccccgc cgctaaaccc gccgctgaac ccgccgcaat 2160 gagctggcgt cgatggctcg gagaggtagg aaaccaacgg ctaaactgag ccgctaacgc 2220 tgcaccaata tgaactgtgg gtccttgacg tcccagggtc agtcctgccg cgatcgctaa 2280 aatactactg acgagtttaa ccagcgctac acgcaaatct agagcgatgg gataccctcc 2340 aagtgcggct ttaatctgag gaataccact cccagaagca tcgggtgcca aatactcaac 2400 caagaatcca gacagtgctc ccaataccag tccgaaagcg ggtaaaacta gaaagggcgg 2460 aaattgttca gaagtttgaa cccgccatga accgagccaa ccaatactgt gttggagtaa 2520 cacggcggat agcgcagaaa ccaccccaat taaacaagct tctgcgatcg ccaaacgtcg 2580 cttgggcagt aaccattgac gtatgggatt gatcat 2616 <210> 76 <211> 871 <212> PRT <213> Microcoleus chthonoplastes <400> 76 Met Ile Asn Pro Ile Arg Gln Trp Leu Leu Pro Lys Arg Arg Leu Ala 1 5 10 15 Ile Ala Glu Ala Cys Leu Ile Gly Val Val Ser Ala Leu Ser Ala Val 20 25 30 Leu Leu Gln His Ser Ile Gly Trp Leu Gly Ser Trp Arg Val Gln Thr 35 40 45 Ser Glu Gln Phe Pro Pro Phe Leu Val Leu Pro Ala Phe Gly Leu Val 50 55 60 Leu Gly Ala Leu Ser Gly Phe Leu Val Glu Tyr Leu Ala Pro Asp Ala 65 70 75 80 Ser Gly Ser Gly Ile Pro Gln Ile Lys Ala Ala Leu Gly Gly Tyr Pro 85 90 95 Ile Ala Leu Asp Leu Arg Val Ala Leu Val Lys Leu Val Ser Ser Ile 100 105 110 Leu Ala Ile Ala Ala Gly Leu Thr Leu Gly Arg Gln Gly Pro Thr Val 115 120 125 His Ile Gly Ala Ala Leu Ala Ala Gln Phe Ser Arg Trp Phe Pro Thr 130 135 140 Ser Pro Ser His Arg Arg Gln Leu Ile Ala Ala Gly Ser Ala Ala Gly 145 150 155 160 Leu Ala Ala Gly Phe Asn Thr Pro Ile Ala Gly Ile Leu Phe Val Val 165 170 175 Glu Glu Leu Ile His Asp Phe Ser Gly Leu Thr Leu Gly Thr Ala Ile 180 185 190 Leu Ala Ser Phe Ile Gly Ala Val Ile Ser Arg Ile Leu Gly Gly Arg 195 200 205 Ser Leu Asp Leu Asn Leu Glu Leu Thr Gln Thr Thr Ser Ser Phe Ser 210 215 220 Ala Pro Glu Ile Pro Phe Tyr Leu Ile Leu Gly Leu Leu Ala Gly Leu 225 230 235 240 Leu Ala Thr Leu Phe Asn Arg Gly Ile Leu Phe Ser Leu Thr Leu Gln 245 250 255 Arg Arg Phe His Val Ser Leu Ala Val Lys Met Gly Leu Ala Gly Leu 260 265 270 Ile Cys Gly Cys Val Val Ser Leu Leu Pro Pro Asp Phe Arg Asn Asn 275 280 285 Arg Gly Leu Arg Glu Leu Leu Ile Thr Gly Ala Glu Ser Trp Gln Phe 290 295 300 Thr Ser Leu Ala Leu Val Thr Tyr Phe Phe Leu Thr Leu Val Ser Tyr 305 310 315 320 Gly Ser Gly Ala Pro Gly Gly Leu Phe His Pro Ser Leu Val Leu Gly 325 330 335 Ser Ala Leu Gly Tyr Leu Val Gly Val Ala Lys Leu Ser Phe Leu Gly 340 345 350 Val Gly Glu Pro Thr Thr Tyr Ala Leu Ala Gly Met Gly Ala Phe Phe 355 360 365 Ser Ala Val Ser Lys Val Pro Ile Thr Ala Ile Val Ile Ile Phe Glu 370 375 380 Ile Thr Ala Asp Phe Asn Leu Val Leu Pro Leu Met Ile Thr Cys Val 385 390 395 400 Val Ser Tyr Leu Ile Ala Asp Gln Leu Ser Lys Gly Ser Leu Tyr Gln 405 410 415 Arg Leu Leu Glu Trp Arg Gly Tyr Thr Ser Pro Thr Gln Lys Val Asp 420 425 430 Lys Gly Ser Leu Val Gly Leu Thr Ala Glu Asp Leu Met Gln Arg Gln 435 440 445 Val Glu Thr Leu Ser Leu His Met Thr Leu Asp Asp Ala Leu Gln Met 450 455 460 Val Ser Arg Ser Thr His Gln Gly Phe Pro Val Val Asp Glu Gly Thr 465 470 475 480 Leu Val Gly Ile Ile Ser Gln Ser Asp Leu Thr Gln Ala Thr Lys Met 485 490 495 Gln Gly Asn Pro Pro Arg Cys Pro Phe Pro Gly Thr Thr Pro Leu Ala 500 505 510 Glu Ile Met Thr Ser His Pro Ile Thr Val Lys Pro Thr Ala Ser Leu 515 520 525 Val Asp Val Leu Tyr Leu Leu Asn Arg Tyr His Leu Ser Arg Leu Pro 530 535 540 Val Thr Glu Gly Arg Lys Leu Leu Gly Ile Ile Thr Arg Ser Asp Ile 545 550 555 560 Ile Arg Ala Glu Leu Asp Gln Leu Asp Ser Lys Thr Thr Gln Thr Arg 565 570 575 Ser Gln Ser Glu Pro Ser Tyr Val Val Tyr Gln Thr Arg Ser Pro Glu 580 585 590 Thr Gly Arg Gly Arg Leu Leu Val Pro Ile Ala Asn Pro Gln Thr Ala 595 600 605 Pro Ile Leu Val Lys Leu Ala Ala Ala Ile Ala Arg Asp Arg Asp Tyr 610 615 620 Glu Leu Glu Cys Leu Gln Val Ile Leu Val Ser Arg Ser Thr Ser Pro 625 630 635 640 Ala Glu Thr Pro Val Thr Thr Thr Lys Ser Arg Arg Leu Leu Arg Gln 645 650 655 Ala Glu Lys Trp Gly Arg Asp Trp Asn Ile Pro Val His Thr Gln Ile 660 665 670 Arg Val Ser Gln Asp Ile Thr Gln Gly Ile Leu Asp Thr Ile Lys Glu 675 680 685 Arg His Ile Asn Leu Met Met Met Gly Trp Lys Gly Ser Thr Ser Thr 690 695 700 Pro Gly Arg Ile Phe Gly Gly Val Val Asp Ala Val Ile Arg Gln Ala 705 710 715 720 Pro Cys Asp Val Met Val Val Lys Leu Gly Glu Met Met His Pro Pro 725 730 735 Tyr Ile Pro Pro Phe Phe Gln Arg Trp Leu Ile Pro Ile Ala Gly Gly 740 745 750 Pro Asn Ser Gln Arg Ala Leu Glu Phe Leu Pro Ala Leu Ile Pro Leu 755 760 765 Ser Ser Lys Pro Pro Asp Ile Arg Leu Cys Gln Val Phe Asp Pro Glu 770 775 780 Asp Thr Ile Met Asp Thr Thr Ala Ile Glu Glu Ala Ser Asp Phe Leu 785 790 795 800 Lys Lys Gln Thr Glu Gly Arg Ile Arg Arg Ile Pro Ile Arg Ala Ser 805 810 815 Glu Val Ser Asp Ala Val Val Tyr Ile Ala Asn Asn Gln Leu Cys Asp 820 825 830 Val Val Val Leu Gly Ala Ser Arg Glu Gly Leu Leu Gln Leu Met Ile 835 840 845 Gln Glu Asn Ile Pro Glu Ala Ile Ala Arg Arg Val Lys Ser Thr Val 850 855 860 Ile Leu Val Arg Ser Ala Thr 865 870 <210> 77 <211> 2592 <212> DNA <213> Nostoc punctiforme <400> 77 atgttagcca ggggtaaaat tctctggttg aggctttccc gtcagttggt tcaacccagg 60 cgattggctt tcgtggaagc ttgcctgatt ggtctagttt ctgggttagc ggcagttctg 120 ttaggacagg cagtggattg ggcaggcgca tggcgagtgc atctttctta ccattggtct 180 gcctacttgg tgctaccagg tattggacta gcagggggac ttttagctgg ttggctagta 240 gagcacttcg caccggaagc atcaggtagt ggtatgtcgg aagtgaaagc ggtattggct 300 cgtgtgccga tgccgttaaa tctgcggatt gctttggtaa agttgatcgg cgctacatta 360 gtgttgggtt ctggaatgcc tttaggacgg gaagggccga ctgtgcaaat tggggcagcc 420 ttggcaaatc aacttagtaa ctgggcaccg acttcaccag agcatcgtcg ccaactgatc 480 gccgcaggag ctggggcagg attagctgcg gcttttaatg caccgatcgc aggtgtacta 540 tttgtagtgg aagaattact ccaagatgtg tcaggtatca ctcttggtac tgcgattttg 600 gcttctttca tcgcttcagt catctctagg ctctatggta gccacaacct ggatctaaat 660 catctgaatt taggtcttcc cgatacaact ttcttcgctc aagaaatccc tttctacttg 720 attttgggag tattggcggg acttctaggc attctattta ataaaggtat tcttaagagt 780 ctagcaatta accgccgttt actacacgtg agtttaccct ggcgaattgg aattgctggg 840 ttagtcagtg gtttggcgat cgctttatta cctgctacct ttcgcgatca tgctgggttg 900 agagaaattt tgcttgcggg tagtgctaac tggtcatttg ctgcgatcgc tcttttagtt 960 cagtttatct taattatttt tacctacggc tctggagcgc cagggggttt actagttccc 1020 accttagccc tgggagctgc ccttggttac ttagtgggtg ctgtcgaaca cagtttactg 1080 ggaatgagtg ctgcaacagt ctatgctcat gtcggcatgg ctgccttttt tagcgccgtt 1140 tctaaggttc caattacagc agttgtcatt gtatttgaga tgacaacaga tttcaatctg 1200 gtgctaccgc taatgattgc gtctgtggtt gcctatttag tagcagaaaa aattgaccat 1260 cgatcgctct acgacctttt actagagtgg aaggggattc acatcaccaa agagccaagc 1320 acagaggggc ttctagcgca actgagtgcc ttagatgtga tgcaacggcg tgtggaaact 1380 ctctctagtc aaatgagtac tgatgaagca gtgcaagcat tttcccactc tcaccatcgc 1440 aacttcccgg ttttagagaa tggtaaagtt gttggtattg tcactcaaaa aaatttagtt 1500 aatattgctt cagaacaatt aggcaaagat acaactatcg gcgagattat gacaccagag 1560 ccagtgacag taacccccac ggctacattg gctcatgtac tgcatatact taatcgttat 1620 catctcagct gcttacccgt tacagaaaat cgcaagctca taggaattat tactcgtagt 1680 gatattatcc gtgtagaagc agagcgactc agtggtaatt cccaacaaat agaacgtaaa 1740 tcagcacctt cttatgtagt ttaccaaact cgcgctccag ctacaggcaa aggacgatta 1800 ttagtaccac tttcacatcc tcagacagcc gagactttat tggaaatggc agttgcgatc 1860 gccaaagatc gcaattacga aatagaatgc ctacaagtga ttatcgttcc gtctggccgc 1920 atcccatcgg aaacaccagt acaaatcagc aaaagtcttc aacttttgca acgggcaata 1980 cttttaggag agaattcgcg gattcccgtt cacacccaga tccgagttgc ccataatgtt 2040 gctggagcaa ttttggagac tgtcaaagaa cgacacattg acttggtgtt gatgggatgg 2100 aaaggcagta catcaactcc tggtagagtt tttagccgag tggtggatac cataattcga 2160 caggcaggtt gtgatgttat cttggctaaa ttagatgata aaagatcctt tgaccgttgg 2220 ttgttgccaa tggcaggcgg tcctaactcc agccaagcaa ttaagttatt acctgctctt 2280 tcttctctaa gtacatcgcc ccaaatcaag ctatgtcaag ttttccagcc tactaactcg 2340 attcttgaca caacattatt agataaatct gttcactttc tgcaacgccg agttagcggt 2400 aaagtggtgg ctactccagt tcgtgccaat tctgtttctg atgctgtcct taagtgtgca 2460 gaacttgata acagtgatgt gattgttctg ggagctagcc gtgaaagcct actacaacaa 2520 gcaattcaag gaaatattgc cgagaatatt tctcgcaaga gtaattgtac agttatcatg 2580 gtcaaaactt aa 2592 <210> 78 <211> 863 <212> PRT <213> Nostoc punctiforme <400> 78 Met Leu Ala Arg Gly Lys Ile Leu Trp Leu Arg Leu Ser Arg Gln Leu 1 5 10 15 Val Gln Pro Arg Arg Leu Ala Phe Val Glu Ala Cys Leu Ile Gly Leu 20 25 30 Val Ser Gly Leu Ala Ala Val Leu Leu Gly Gln Ala Val Asp Trp Ala 35 40 45 Gly Ala Trp Arg Val His Leu Ser Tyr His Trp Ser Ala Tyr Leu Val 50 55 60 Leu Pro Gly Ile Gly Leu Ala Gly Gly Leu Leu Ala Gly Trp Leu Val 65 70 75 80 Glu His Phe Ala Pro Glu Ala Ser Gly Ser Gly Met Ser Glu Val Lys 85 90 95 Ala Val Leu Ala Arg Val Pro Met Pro Leu Asn Leu Arg Ile Ala Leu 100 105 110 Val Lys Leu Ile Gly Ala Thr Leu Val Leu Gly Ser Gly Met Pro Leu 115 120 125 Gly Arg Glu Gly Pro Thr Val Gln Ile Gly Ala Ala Leu Ala Asn Gln 130 135 140 Leu Ser Asn Trp Ala Pro Thr Ser Pro Glu His Arg Arg Gln Leu Ile 145 150 155 160 Ala Ala Gly Ala Gly Ala Gly Leu Ala Ala Ala Phe Asn Ala Pro Ile 165 170 175 Ala Gly Val Leu Phe Val Val Glu Glu Leu Leu Gln Asp Val Ser Gly 180 185 190 Ile Thr Leu Gly Thr Ala Ile Leu Ala Ser Phe Ile Ala Ser Val Ile 195 200 205 Ser Arg Leu Tyr Gly Ser His Asn Leu Asp Leu Asn His Leu Asn Leu 210 215 220 Gly Leu Pro Asp Thr Thr Phe Phe Ala Gln Glu Ile Pro Phe Tyr Leu 225 230 235 240 Ile Leu Gly Val Leu Ala Gly Leu Leu Gly Ile Leu Phe Asn Lys Gly 245 250 255 Ile Leu Lys Ser Leu Ala Ile Asn Arg Arg Leu Leu His Val Ser Leu 260 265 270 Pro Trp Arg Ile Gly Ile Ala Gly Leu Val Ser Gly Leu Ala Ile Ala 275 280 285 Leu Leu Pro Ala Thr Phe Arg Asp His Ala Gly Leu Arg Glu Ile Leu 290 295 300 Leu Ala Gly Ser Ala Asn Trp Ser Phe Ala Ala Ile Ala Leu Leu Val 305 310 315 320 Gln Phe Ile Leu Ile Ile Phe Thr Tyr Gly Ser Gly Ala Pro Gly Gly 325 330 335 Leu Leu Val Pro Thr Leu Ala Leu Gly Ala Ala Leu Gly Tyr Leu Val 340 345 350 Gly Ala Val Glu His Ser Leu Leu Gly Met Ser Ala Ala Thr Val Tyr 355 360 365 Ala His Val Gly Met Ala Ala Phe Phe Ser Ala Val Ser Lys Val Pro 370 375 380 Ile Thr Ala Val Val Ile Val Phe Glu Met Thr Thr Asp Phe Asn Leu 385 390 395 400 Val Leu Pro Leu Met Ile Ala Ser Val Val Ala Tyr Leu Val Ala Glu 405 410 415 Lys Ile Asp His Arg Ser Leu Tyr Asp Leu Leu Leu Glu Trp Lys Gly 420 425 430 Ile His Ile Thr Lys Glu Pro Ser Thr Glu Gly Leu Leu Ala Gln Leu 435 440 445 Ser Ala Leu Asp Val Met Gln Arg Arg Val Glu Thr Leu Ser Ser Gln 450 455 460 Met Ser Thr Asp Glu Ala Val Gln Ala Phe Ser His Ser His His Arg 465 470 475 480 Asn Phe Pro Val Leu Glu Asn Gly Lys Val Val Gly Ile Val Thr Gln 485 490 495 Lys Asn Leu Val Asn Ile Ala Ser Glu Gln Leu Gly Lys Asp Thr Thr 500 505 510 Ile Gly Glu Ile Met Thr Pro Glu Pro Val Thr Val Thr Pro Thr Ala 515 520 525 Thr Leu Ala His Val Leu His Ile Leu Asn Arg Tyr His Leu Ser Cys 530 535 540 Leu Pro Val Thr Glu Asn Arg Lys Leu Ile Gly Ile Ile Thr Arg Ser 545 550 555 560 Asp Ile Ile Arg Val Glu Ala Glu Arg Leu Ser Gly Asn Ser Gln Gln 565 570 575 Ile Glu Arg Lys Ser Ala Pro Ser Tyr Val Val Tyr Gln Thr Arg Ala 580 585 590 Pro Ala Thr Gly Lys Gly Arg Leu Leu Val Pro Leu Ser His Pro Gln 595 600 605 Thr Ala Glu Thr Leu Leu Glu Met Ala Val Ala Ile Ala Lys Asp Arg 610 615 620 Asn Tyr Glu Ile Glu Cys Leu Gln Val Ile Ile Val Pro Ser Gly Arg 625 630 635 640 Ile Pro Ser Glu Thr Pro Val Gln Ile Ser Lys Ser Leu Gln Leu Leu 645 650 655 Gln Arg Ala Ile Leu Leu Gly Glu Asn Ser Arg Ile Pro Val His Thr 660 665 670 Gln Ile Arg Val Ala His Asn Val Ala Gly Ala Ile Leu Glu Thr Val 675 680 685 Lys Glu Arg His Ile Asp Leu Val Leu Met Gly Trp Lys Gly Ser Thr 690 695 700 Ser Thr Pro Gly Arg Val Phe Ser Arg Val Val Asp Thr Ile Ile Arg 705 710 715 720 Gln Ala Gly Cys Asp Val Ile Leu Ala Lys Leu Asp Asp Lys Arg Ser 725 730 735 Phe Asp Arg Trp Leu Leu Pro Met Ala Gly Gly Pro Asn Ser Ser Gln 740 745 750 Ala Ile Lys Leu Leu Pro Ala Leu Ser Ser Leu Ser Thr Ser Pro Gln 755 760 765 Ile Lys Leu Cys Gln Val Phe Gln Pro Thr Asn Ser Ile Leu Asp Thr 770 775 780 Thr Leu Leu Asp Lys Ser Val His Phe Leu Gln Arg Arg Val Ser Gly 785 790 795 800 Lys Val Val Ala Thr Pro Val Arg Ala Asn Ser Val Ser Asp Ala Val 805 810 815 Leu Lys Cys Ala Glu Leu Asp Asn Ser Asp Val Ile Val Leu Gly Ala 820 825 830 Ser Arg Glu Ser Leu Leu Gln Gln Ala Ile Gln Gly Asn Ile Ala Glu 835 840 845 Asn Ile Ser Arg Lys Ser Asn Cys Thr Val Ile Met Val Lys Thr 850 855 860 <210> 79 <211> 2592 <212> DNA <213> Nostoc punctiforme <400> 79 ttaagttttg accataataa ctgtgcaatt actcttgcga gaaatatttt ctgcaatatt 60 tccttgaatt acctgttgta gtagactttc acggctagct cccaaaacaa taacatcact 120 gttgtcttgc tgggcgcatt caagtacagc ctcagaaaca gaattggctt ggactggagt 180 cgccaccact ttacctttaa ctcggcgttg gagaaagtga acagatttat ctagtaatgt 240 tgtgtcaggt agagacttag taggctggaa tatttgacat agattgattt ggggggattt 300 acttaaggaa gcaagagcag gtaataaccg aattgcttgg ctggagttag gaccacctgc 360 cattggcaac aaccaacggt caaaagctct tttatcatcc aatttggcca agacaacatc 420 acaacctgcc tgtcgaatta tggtatctac cactcggctg aaaactctac caggagttga 480 tgtagtacct ttccatccca ttaataccaa atcgatatgt cgatctttga cagtctccaa 540 aattgctcca gcgacattat gggtaactcg gatctgggtg tgaacgggaa tccgccactt 600 ttctcctaac agtattgctt tctgtaaaag ctcaaggctt ttggtaattt gtactggtgt 660 ttcagatggg atacggttag atggaacaat aattacttgt aggcattcta tttcgtaatt 720 gttagcttta gcgatcgccc cagccatttc caataaagtc tcggctgtct gtggatgcga 780 aagtggtact agtaaccttc ctttgcctgt agccggagcg cgagtttggt aaatcacata 840 agaagttgct gatttcgatt ctatctgttg ggtgttacca ttcaacctct ctgcttctac 900 acggataata tcactacgag taataattcc tactagcttc cgaccttctg taacaggcaa 960 gcagctgagg tgataacgat tgagtatatg cagcacataa gccagcgtcg ctgtgggact 1020 cgctgttact ggctctggtg tcataatctg gctgatagtt gtatttccac ttaactgttg 1080 cgaggcaaga ttaactaaat ctttctgagt gacaatgcca acaactttac ctttttctaa 1140 aattgggaag ttgcgatgat gagagtcgga aaatgcctgc actgcctcat caatactcat 1200 ctggctagat agggtttcga cacgtcgctg cattacatct gcggcactta tttgtgctaa 1260 aatcccctct gtgcctggct cttttgtaat gtgaatccct ttccactcta gtagaaggtc 1320 atagagcgat cgcgggtcaa ttttttctgc tactaaataa gcaatcacag atacaatcat 1380 taacggtagc accagattga aatctgtcgt catctcaaag acaatgacaa ctgctgtaat 1440 cggcacttta gagacggcgc taaaaagtgc agccattccc acatgagcgt aggttgttgc 1500 agcactcatt cccagcaaac tctgttcggc agcaccaact aagtagccaa gagcagcgcc 1560 caagaccaat gtgggaacca gcaaaccccc tggcgctcct gagccgtagg ttaaaataat 1620 tagggtaaat tggactaaaa gagcgatcgc tgcaaatagc caattcccac tacctacaag 1680 caaaatttct ctcagcccag cattattgcg aaaggtgata ggtaacagag cgatcgcaac 1740 accagttact aaccccacaa ttccaattcg ccagggtaaa ctcagattta gtaaacgccg 1800 attaattgcc agacttgcaa gaatactttt attaaacaga atgcctatta gcccacctag 1860 cacccccaaa atcaagtaga aagggatttc ctgagcgaag aaagtggtat gtgaaaagct 1920 taaatccaga tgattcagat ccaagctgtg actaccatac aaccgggaga tgactgaagc 1980 gatgaaagaa gccaaaatcg cagtgccaag agtgatacct gacacatctt ggagtaattc 2040 ttccactaca aacaggacac ctgcgatcgg tgcattaaaa gccgctgcta atccagcccc 2100 ggctccagcg gcgatcagtt ggcggcgatg ctctggtgaa gtcggtaccc aattactaag 2160 ttgatttgcc aaagctgccc caatttggac agttggccct tcccgtccta aaggcattcc 2220 agaacccagc actagtgtag cgctgaccag cttgaccaga gcgattcgca gatttaatgg 2280 catcggcaca cgagccaata cggctttgac ttcagacatc ccactacctg atgcttcagg 2340 tgcgaagcgc tctactagcc aaccagctaa gattccccct accagtccaa tacctggtag 2400 taccaagtag gcaggccaga tgtaagaaag atgcactcgc catgctcccg cccagtctac 2460 cgcctgtcct aacagaactg ctgctagccc agaaactaaa ccaattatgc aagcttcaac 2520 gaaagccaag cgccttggtc gaagcagctg acgggaaagc ctcaaccaca gaatttttcc 2580 ccttgctaac at 2592 <210> 80 <211> 863 <212> PRT <213> Nostoc punctiforme <400> 80 Met Leu Ala Arg Gly Lys Ile Leu Trp Leu Arg Leu Ser Arg Gln Leu 1 5 10 15 Leu Arg Pro Arg Arg Leu Ala Phe Val Glu Ala Cys Ile Ile Gly Leu 20 25 30 Val Ser Gly Leu Ala Ala Val Leu Leu Gly Gln Ala Val Asp Trp Ala 35 40 45 Gly Ala Trp Arg Val His Leu Ser Tyr Ile Trp Pro Ala Tyr Leu Val 50 55 60 Leu Pro Gly Ile Gly Leu Val Gly Gly Ile Leu Ala Gly Trp Leu Val 65 70 75 80 Glu Arg Phe Ala Pro Glu Ala Ser Gly Ser Gly Met Ser Glu Val Lys 85 90 95 Ala Val Leu Ala Arg Val Pro Met Pro Leu Asn Leu Arg Ile Ala Leu 100 105 110 Val Lys Leu Val Ser Ala Thr Leu Val Leu Gly Ser Gly Met Pro Leu 115 120 125 Gly Arg Glu Gly Pro Thr Val Gln Ile Gly Ala Ala Leu Ala Asn Gln 130 135 140 Leu Ser Asn Trp Val Pro Thr Ser Pro Glu His Arg Arg Gln Leu Ile 145 150 155 160 Ala Ala Gly Ala Gly Ala Gly Leu Ala Ala Ala Phe Asn Ala Pro Ile 165 170 175 Ala Gly Val Leu Phe Val Val Glu Glu Leu Leu Gln Asp Val Ser Gly 180 185 190 Ile Thr Leu Gly Thr Ala Ile Leu Ala Ser Phe Ile Ala Ser Val Ile 195 200 205 Ser Arg Leu Tyr Gly Ser His Ser Leu Asp Leu Asn His Leu Asp Leu 210 215 220 Ser Phe Ser His Thr Thr Phe Phe Ala Gln Glu Ile Pro Phe Tyr Leu 225 230 235 240 Ile Leu Gly Val Leu Gly Gly Leu Ile Gly Ile Leu Phe Asn Lys Ser 245 250 255 Ile Leu Ala Ser Leu Ala Ile Asn Arg Arg Leu Leu Asn Leu Ser Leu 260 265 270 Pro Trp Arg Ile Gly Ile Val Gly Leu Val Thr Gly Val Ala Ile Ala 275 280 285 Leu Leu Pro Ile Thr Phe Arg Asn Asn Ala Gly Leu Arg Glu Ile Leu 290 295 300 Leu Val Gly Ser Gly Asn Trp Leu Phe Ala Ala Ile Ala Leu Leu Val 305 310 315 320 Gln Phe Thr Leu Ile Ile Leu Thr Tyr Gly Ser Gly Ala Pro Gly Gly 325 330 335 Leu Leu Val Pro Thr Leu Val Leu Gly Ala Ala Leu Gly Tyr Leu Val 340 345 350 Gly Ala Ala Glu Gln Ser Leu Leu Gly Met Ser Ala Ala Thr Thr Tyr 355 360 365 Ala His Val Gly Met Ala Ala Leu Phe Ser Ala Val Ser Lys Val Pro 370 375 380 Ile Thr Ala Val Val Ile Val Phe Glu Met Thr Thr Asp Phe Asn Leu 385 390 395 400 Val Leu Pro Leu Met Ile Val Ser Val Ile Ala Tyr Leu Val Ala Glu 405 410 415 Lys Ile Asp Pro Arg Ser Leu Tyr Asp Leu Leu Leu Glu Trp Lys Gly 420 425 430 Ile His Ile Thr Lys Glu Pro Gly Thr Glu Gly Ile Leu Ala Gln Ile 435 440 445 Ser Ala Ala Asp Val Met Gln Arg Arg Val Glu Thr Leu Ser Ser Gln 450 455 460 Met Ser Ile Asp Glu Ala Val Gln Ala Phe Ser Asp Ser His His Arg 465 470 475 480 Asn Phe Pro Ile Leu Glu Lys Gly Lys Val Val Gly Ile Val Thr Gln 485 490 495 Lys Asp Leu Val Asn Leu Ala Ser Gln Gln Leu Ser Gly Asn Thr Thr 500 505 510 Ile Ser Gln Ile Met Thr Pro Glu Pro Val Thr Ala Ser Pro Thr Ala 515 520 525 Thr Leu Ala Tyr Val Leu His Ile Leu Asn Arg Tyr His Leu Ser Cys 530 535 540 Leu Pro Val Thr Glu Gly Arg Lys Leu Val Gly Ile Ile Thr Arg Ser 545 550 555 560 Asp Ile Ile Arg Val Glu Ala Glu Arg Leu Asn Gly Asn Thr Gln Gln 565 570 575 Ile Glu Ser Lys Ser Ala Thr Ser Tyr Val Ile Tyr Gln Thr Arg Ala 580 585 590 Pro Ala Thr Gly Lys Gly Arg Leu Leu Val Pro Leu Ser His Pro Gln 595 600 605 Thr Ala Glu Thr Leu Leu Glu Met Ala Gly Ala Ile Ala Lys Ala Asn 610 615 620 Asn Tyr Glu Ile Glu Cys Leu Gln Val Ile Ile Val Pro Ser Asn Arg 625 630 635 640 Ile Pro Ser Glu Thr Pro Val Gln Ile Thr Lys Ser Leu Glu Leu Leu 645 650 655 Gln Lys Ala Ile Leu Leu Gly Glu Lys Trp Arg Ile Pro Val His Thr 660 665 670 Gln Ile Arg Val Thr His Asn Val Ala Gly Ala Ile Leu Glu Thr Val 675 680 685 Lys Asp Arg His Ile Asp Leu Val Leu Met Gly Trp Lys Gly Thr Thr 690 695 700 Ser Thr Pro Gly Arg Val Phe Ser Arg Val Val Asp Thr Ile Ile Arg 705 710 715 720 Gln Ala Gly Cys Asp Val Val Leu Ala Lys Leu Asp Asp Lys Arg Ala 725 730 735 Phe Asp Arg Trp Leu Leu Pro Met Ala Gly Gly Pro Asn Ser Ser Gln 740 745 750 Ala Ile Arg Leu Leu Pro Ala Leu Ala Ser Leu Ser Lys Ser Pro Gln 755 760 765 Ile Asn Leu Cys Gln Ile Phe Gln Pro Thr Lys Ser Leu Pro Asp Thr 770 775 780 Thr Leu Leu Asp Lys Ser Val His Phe Leu Gln Arg Arg Val Lys Gly 785 790 795 800 Lys Val Val Ala Thr Pro Val Gln Ala Asn Ser Val Ser Glu Ala Val 805 810 815 Leu Glu Cys Ala Gln Gln Asp Asn Ser Asp Val Ile Val Leu Gly Ala 820 825 830 Ser Arg Glu Ser Leu Leu Gln Gln Val Ile Gln Gly Asn Ile Ala Glu 835 840 845 Asn Ile Ser Arg Lys Ser Asn Cys Thr Val Ile Met Val Lys Thr 850 855 860 <210> 81 <211> 2589 <212> DNA <213> Anabaena variabilis <400> 81 atgtactttc gcagttggtt gcagcctaga cggggtttag cgatcgccga agcttgtgtt 60 attggggttt tagctgcatt atctgcggta ttcctcaagg tttgttcggg attattaggt 120 gcatggcggg ttcatagttc tcatgttttg cctgcatggg tagttttacc aatcatcggt 180 ttgggctttg ggtatttggc tggtctgatg gtgcaaagat tagcaccaga ggcggcgggt 240 agtggtatcc cccaagtcaa ggctaccctg gcaaatatac cgatgaaatt gtcttggcgg 300 gtagcggtga ttaagctact gagtgccatt attgctttag gttctggcat cacattagga 360 agacaagggc cgacagtcca agtaggggca ggtttagcgt cggggatgag tcgcttggtt 420 cccacttctc ctgaccatcg gcggcaaatg attgcggctg gtgcgggtgc aggtttggcg 480 gctgctttta atgctcccat tgccggggta ttattcatta ttgaggaatt acttcaagat 540 ttatcgggat tgactctggg aactgccatt atcgcttcat ttattggcgg ggtagtgtcc 600 cggttgttgg gtggtcgcag tctaaattta aatatagaat tactttccta ctccagccgg 660 tttacttttc cagaaattcc cttctttttg cttttgggtg ttttagcggg gttactgggt 720 gcattattta atcgtggctt gatttttagc ctccagtttt atcggagtct gcatattagt 780 ttacctttgc gggtcggttt ggctgggttg gtttcgggga ttgtcgtatc gctgttacct 840 gagtcgtttc gggataatgc tggtttaagg gaatatgtaa ttactggtga tttaaatcca 900 agctttgcag cgatcgcttt tgttgctcag tttaccctaa ctttagtcgc atttggttct 960 ggcgcacccg gaggtttatt tgcgcctagc ttaattttgg gttcggcttt aggacatttg 1020 gtcggtgtat tagagtatca aatcactggt gatggttctc ctgtgactta cgccttagcg 1080 gggatgggag gtttttttag tgccgtttct aaagtaccaa tcactgccat tgtgattatc 1140 tttgaaatga ccacagattt taatttagtg ttgcctttga tgatagtgtc tgtgacggct 1200 tacttggtag cagacaaagt agtacccggt tcactgtatg agaaattatt actgttgaat 1260 ggcattaccc tcactaaaca gatgtcggta gaggggatat taagccaaat gactgcaaaa 1320 gatgtgatgc agcaacgggt agaaacttta gatgcagata ttacccttga agaagccaag 1380 caagcctttg ctagttccca ccatcgcggc ttcccggtag tggaagataa caaattagtc 1440 gggattatta cccaatcaga tttaactaaa agcctcagcc gcaatctaga gaatcatcct 1500 cacctcaggg aaatcatgac cgccaatccc atgacagtca cacccataca taccctgagt 1560 aatgttttat atttgctaga ccgctatcaa atcagtcgcc taccagtagt agacgggcaa 1620 aaactcatcg ggattatcac ccgtgcagat atcattcggg tagaagcaga ccgtctcaac 1680 tgcgaaaacc ccaacccagg cccccaaccg gaaccatcct atgtagttta ccaaacgcgg 1740 agtcccagca ctggcagagg tagaatacta gtcccagtag ccaacccaga aaccgccgca 1800 actctattaa aaatggcagc tgccattgcc cgcgatcgcc attatgaaat agagtgtgta 1860 caagtgatgc tggtttctcg tcacagttcc ccttcagaaa ccaccgtcag aaccgccaaa 1920 agtcgtcgcc ttctgcgaca agccgaagta ttagccaaaa aatggcgcat tcctctacac 1980 acccaaatta gggtcgccca tgatcctgct cacgccattt tagaaaccat caaagaccga 2040 cacatagatt taattctcat gggatggaaa ggcagcacat ctaccccagg caggattttt 2100 ggcaatgttg tagacaccat catccgccaa gccacctgtg acgtagtact agtgaagtta 2160 ggtacttccc caatccccaa tcccccattc aatcgctggc tagtcccaat ggctggcggc 2220 cctaacgcca gaatagccat taaattatta ccggctttag ttactttaag cgatgaccca 2280 caaatccgct tgacaagggt gtttaaacct tgggaattta gaccagatat gacagtttta 2340 gaacaagcca ttcgtcaatt gatgcgtcgc cgccaactat ctagtactgt aattgctgcg 2400 ccggtacaag ctgattcagt agtcgaaggt gtgattaagt tagtgaaaac cgaaggttat 2460 gatgtggtgg ttttaggcgc ttcccgtgaa ggtttattac aacaggctat tcaaggtaat 2520 attccagagg cgatcgcttc tggtgttgat attaccgtaa ttttggtaag gggagcaatt 2580 gaaagttag 2589 <210> 82 <211> 862 <212> PRT <213> Anabaena variabilis <400> 82 Met Tyr Phe Arg Ser Trp Leu Gln Pro Arg Arg Gly Leu Ala Ile Ala 1 5 10 15 Glu Ala Cys Val Ile Gly Val Leu Ala Ala Leu Ser Ala Val Phe Leu 20 25 30 Lys Val Cys Ser Gly Leu Leu Gly Ala Trp Arg Val His Ser Ser His 35 40 45 Val Leu Pro Ala Trp Val Val Leu Pro Ile Ile Gly Leu Gly Phe Gly 50 55 60 Tyr Leu Ala Gly Leu Met Val Gln Arg Leu Ala Pro Glu Ala Ala Gly 65 70 75 80 Ser Gly Ile Pro Gln Val Lys Ala Thr Leu Ala Asn Ile Pro Met Lys 85 90 95 Leu Ser Trp Arg Val Ala Val Ile Lys Leu Leu Ser Ala Ile Ile Ala 100 105 110 Leu Gly Ser Gly Ile Thr Leu Gly Arg Gln Gly Pro Thr Val Gln Val 115 120 125 Gly Ala Gly Leu Ala Ser Gly Met Ser Arg Leu Val Pro Thr Ser Pro 130 135 140 Asp His Arg Arg Gln Met Ile Ala Ala Gly Ala Gly Ala Gly Leu Ala 145 150 155 160 Ala Ala Phe Asn Ala Pro Ile Ala Gly Val Leu Phe Ile Ile Glu Glu 165 170 175 Leu Leu Gln Asp Leu Ser Gly Leu Thr Leu Gly Thr Ala Ile Ile Ala 180 185 190 Ser Phe Ile Gly Gly Val Val Ser Arg Leu Leu Gly Gly Arg Ser Leu 195 200 205 Asn Leu Asn Ile Glu Leu Leu Ser Tyr Ser Ser Arg Phe Thr Phe Pro 210 215 220 Glu Ile Pro Phe Phe Leu Leu Leu Gly Val Leu Ala Gly Leu Leu Gly 225 230 235 240 Ala Leu Phe Asn Arg Gly Leu Ile Phe Ser Leu Gln Phe Tyr Arg Ser 245 250 255 Leu His Ile Ser Leu Pro Leu Arg Val Gly Leu Ala Gly Leu Val Ser 260 265 270 Gly Ile Val Val Ser Leu Leu Pro Glu Ser Phe Arg Asp Asn Ala Gly 275 280 285 Leu Arg Glu Tyr Val Ile Thr Gly Asp Leu Asn Pro Ser Phe Ala Ala 290 295 300 Ile Ala Phe Val Ala Gln Phe Thr Leu Thr Leu Val Ala Phe Gly Ser 305 310 315 320 Gly Ala Pro Gly Gly Leu Phe Ala Pro Ser Leu Ile Leu Gly Ser Ala 325 330 335 Leu Gly His Leu Val Gly Val Leu Glu Tyr Gln Ile Thr Gly Asp Gly 340 345 350 Ser Pro Val Thr Tyr Ala Leu Ala Gly Met Gly Gly Phe Phe Ser Ala 355 360 365 Val Ser Lys Val Pro Ile Thr Ala Ile Val Ile Ile Phe Glu Met Thr 370 375 380 Thr Asp Phe Asn Leu Val Leu Pro Leu Met Ile Val Ser Val Thr Ala 385 390 395 400 Tyr Leu Val Ala Asp Lys Val Val Pro Gly Ser Leu Tyr Glu Lys Leu 405 410 415 Leu Leu Leu Asn Gly Ile Thr Leu Thr Lys Gln Met Ser Val Glu Gly 420 425 430 Ile Leu Ser Gln Met Thr Ala Lys Asp Val Met Gln Gln Arg Val Glu 435 440 445 Thr Leu Asp Ala Asp Ile Thr Leu Glu Glu Ala Lys Gln Ala Phe Ala 450 455 460 Ser Ser His His Arg Gly Phe Pro Val Val Glu Asp Asn Lys Leu Val 465 470 475 480 Gly Ile Ile Thr Gln Ser Asp Leu Thr Lys Ser Leu Ser Arg Asn Leu 485 490 495 Glu Asn His Pro His Leu Arg Glu Ile Met Thr Ala Asn Pro Met Thr 500 505 510 Val Thr Pro Ile His Thr Leu Ser Asn Val Leu Tyr Leu Leu Asp Arg 515 520 525 Tyr Gln Ile Ser Arg Leu Pro Val Val Asp Gly Gln Lys Leu Ile Gly 530 535 540 Ile Ile Thr Arg Ala Asp Ile Ile Arg Val Glu Ala Asp Arg Leu Asn 545 550 555 560 Cys Glu Asn Pro Asn Pro Gly Pro Gln Pro Glu Pro Ser Tyr Val Val 565 570 575 Tyr Gln Thr Arg Ser Pro Ser Thr Gly Arg Gly Arg Ile Leu Val Pro 580 585 590 Val Ala Asn Pro Glu Thr Ala Ala Thr Leu Leu Lys Met Ala Ala Ala 595 600 605 Ile Ala Arg Asp Arg His Tyr Glu Ile Glu Cys Val Gln Val Met Leu 610 615 620 Val Ser Arg His Ser Ser Pro Ser Glu Thr Thr Val Arg Thr Ala Lys 625 630 635 640 Ser Arg Arg Leu Leu Arg Gln Ala Glu Val Leu Ala Lys Lys Trp Arg 645 650 655 Ile Pro Leu His Thr Gln Ile Arg Val Ala His Asp Pro Ala His Ala 660 665 670 Ile Leu Glu Thr Ile Lys Asp Arg His Ile Asp Leu Ile Leu Met Gly 675 680 685 Trp Lys Gly Ser Thr Ser Thr Pro Gly Arg Ile Phe Gly Asn Val Val 690 695 700 Asp Thr Ile Ile Arg Gln Ala Thr Cys Asp Val Val Leu Val Lys Leu 705 710 715 720 Gly Thr Ser Pro Ile Pro Asn Pro Pro Phe Asn Arg Trp Leu Val Pro 725 730 735 Met Ala Gly Gly Pro Asn Ala Arg Ile Ala Ile Lys Leu Leu Pro Ala 740 745 750 Leu Val Thr Leu Ser Asp Asp Pro Gln Ile Arg Leu Thr Arg Val Phe 755 760 765 Lys Pro Trp Glu Phe Arg Pro Asp Met Thr Val Leu Glu Gln Ala Ile 770 775 780 Arg Gln Leu Met Arg Arg Arg Gln Leu Ser Ser Thr Val Ile Ala Ala 785 790 795 800 Pro Val Gln Ala Asp Ser Val Val Glu Gly Val Ile Lys Leu Val Lys 805 810 815 Thr Glu Gly Tyr Asp Val Val Val Leu Gly Ala Ser Arg Glu Gly Leu 820 825 830 Leu Gln Gln Ala Ile Gln Gly Asn Ile Pro Glu Ala Ile Ala Ser Gly 835 840 845 Val Asp Ile Thr Val Ile Leu Val Arg Gly Ala Ile Glu Ser 850 855 860 <210> 83 <211> 2616 <212> DNA <213> Nostoc sp. <400> 83 atgtactttc gcagttggtt gcagcctaga cggggtttag cgatcgcaga agcttgtgtt 60 attggggttt tagctgcatt atctgcggta ttcctcaagg tctgttcggg attattaggt 120 gcatggcggg ttcatagttc tcatattttg ccggcatggg tagttttacc aatcattggt 180 ttgagctttg ggtatttggc tgggctgatg gtgcaaagat tagcaccaga ggcggcgggt 240 agtggtattc cacaagtcaa agctactcta gcaaatatac cgatgaaatt gtcttggcga 300 gtagcaatag ttaagctact gagtgctatt ctggctttgg gttcagggct gacattagga 360 agacaagggc cgacagtcca agtgggggca ggtttagcgg cggggatgag tcgcttggtt 420 cccacttctc ccgaccatcg gcggcaaatg attgcggctg gtgcgggtgc aggtttggcg 480 gctgctttta atgcccctat tgccggggtc ttatttatta ttgaggaatt acttcaagat 540 ttatcagggc tgactctggg aactgccatt atcgcttcat ttattggtgg ggtagtttcc 600 cggctattgg gtggtcgtag tctaaattta aacatagaat tactttccta ctctagtggc 660 ttttcttttc cagaaattcc cttctttttg ctgttgggtg tcttagcagg gttactgggt 720 gcattattta atcgcgggtt gattttcagc ctccagtttt accggaatct gcatattagc 780 ttacctctgc gggtagcctt ggctggtttg gtatcgggga ttgtcgtatc gctgttgcct 840 gagtcttttc gggataacgc tggtttaagg gaatatgtaa tcactggtga tttaaaccca 900 tcctttgcag cgatcgcttt tattgctcag tttatcctaa ctttagtcgc atttggttct 960 ggcgcacccg gaggtttatt tgcgcctagc ctaattttag gttcggcttt agggcatttg 1020 gtgggcgtat tagagtatca aatcacgggg gatggttctc ctgttaccta tgccttagcg 1080 ggaatgggtg gtttttttag tgcggtttct aaagtcccaa tcaccgctat tgtgattgtc 1140 tttgaaatga ccacagactt taacctagtg ttgcctttga tgatagtgtc tgtgacggct 1200 tacttagtag cagacaaagt agtacctggt tcactgtatg agaaattatt acttttaaat 1260 ggcattaccc tcactaaaca gatgtcggta gaggggatat taagccaaat gactgcaaaa 1320 gatgtgatgc agcaacgggt agaaactcta gatgcagaga taactttaga agaagccaag 1380 caagcctttg ctagttccca ccatcgcggc ttcccagtag tagaagataa caaattagtc 1440 gggattatta ctcaatcaga tttaactaaa agcctcagtc gcagtctaga gaataatcct 1500 cacctcaggg aaattatgac agccaatcct atgacagtca cacccataca taccttgagt 1560 aatgttttat atttattaga ccgctatcaa atcagtcgct taccagttgt agaagggcaa 1620 aaactgatcg ggattattac ccgtgcagat atcattcggg tagaagcaga ccgtctcaac 1680 tgcgaaaatc ccaacccagg gccccagcca gaaccatcct atgtagttta ccaaacgcga 1740 agtcccaaca caggcagagg tagaatacta gtaccagtcg ccaacccaga aaccgccgcg 1800 actttattaa aaatggcagc cgccattgcc cgcgatcgcc attatgaaat agagtgtgta 1860 caagtaatgc tggtttcccg ccacagttcc ccatcggaaa ccacggtgag aaccgccaaa 1920 agtcgccgtc ttctgagaca agccgaagtc ttagccaaaa aatggcgcat tcccctacat 1980 acccaaatta gagtcgccca tgatcctgct catgcaattt tagaaaccat taaagaccga 2040 cacatagact taattctcat gggatggaaa ggtagcacat ccaccccagg caggattttt 2100 ggcaacgttg tagataccat catccgccaa gccacctgtg acgtagtgct ggtgaagtta 2160 ggtagttccc cattcccaat ccccaatacc caatacccaa tctccaatcc ccaattcaat 2220 cgctggctag taccaatggc tggtggcccc aacgccagga tagcaattaa actgttacca 2280 gctttagtga ctttaagcga tgacccacaa attcggttga caagggtgtt taaaccttgg 2340 gaatttagac cagatatgac agttttagaa caagccattc gtcaattgat gcgtcgccgc 2400 caactatcta gtactgtaat tgctgcgcca gtacaagctg attcagtagt cgaaggtgtg 2460 attaagctag tggaaactga aggttatgat gtggtggttt taggcgcttc ccgtgagggc 2520 ttattacaac aggctattca aggtaatatt ccagaggcga tcgcttctgg tgtcgatagt 2580 accgtgattt tggtaagggg agcaattgag agttga 2616 <210> 84 <211> 871 <212> PRT <213> Nostoc sp. <400> 84 Met Tyr Phe Arg Ser Trp Leu Gln Pro Arg Arg Gly Leu Ala Ile Ala 1 5 10 15 Glu Ala Cys Val Ile Gly Val Leu Ala Ala Leu Ser Ala Val Phe Leu 20 25 30 Lys Val Cys Ser Gly Leu Leu Gly Ala Trp Arg Val His Ser Ser His 35 40 45 Ile Leu Pro Ala Trp Val Val Leu Pro Ile Ile Gly Leu Ser Phe Gly 50 55 60 Tyr Leu Ala Gly Leu Met Val Gln Arg Leu Ala Pro Glu Ala Ala Gly 65 70 75 80 Ser Gly Ile Pro Gln Val Lys Ala Thr Leu Ala Asn Ile Pro Met Lys 85 90 95 Leu Ser Trp Arg Val Ala Ile Val Lys Leu Leu Ser Ala Ile Leu Ala 100 105 110 Leu Gly Ser Gly Leu Thr Leu Gly Arg Gln Gly Pro Thr Val Gln Val 115 120 125 Gly Ala Gly Leu Ala Ala Gly Met Ser Arg Leu Val Pro Thr Ser Pro 130 135 140 Asp His Arg Arg Gln Met Ile Ala Ala Gly Ala Gly Ala Gly Leu Ala 145 150 155 160 Ala Ala Phe Asn Ala Pro Ile Ala Gly Val Leu Phe Ile Ile Glu Glu 165 170 175 Leu Leu Gln Asp Leu Ser Gly Leu Thr Leu Gly Thr Ala Ile Ile Ala 180 185 190 Ser Phe Ile Gly Gly Val Val Ser Arg Leu Leu Gly Gly Arg Ser Leu 195 200 205 Asn Leu Asn Ile Glu Leu Leu Ser Tyr Ser Ser Gly Phe Ser Phe Pro 210 215 220 Glu Ile Pro Phe Phe Leu Leu Leu Gly Val Leu Ala Gly Leu Leu Gly 225 230 235 240 Ala Leu Phe Asn Arg Gly Leu Ile Phe Ser Leu Gln Phe Tyr Arg Asn 245 250 255 Leu His Ile Ser Leu Pro Leu Arg Val Ala Leu Ala Gly Leu Val Ser 260 265 270 Gly Ile Val Val Ser Leu Leu Pro Glu Ser Phe Arg Asp Asn Ala Gly 275 280 285 Leu Arg Glu Tyr Val Ile Thr Gly Asp Leu Asn Pro Ser Phe Ala Ala 290 295 300 Ile Ala Phe Ile Ala Gln Phe Ile Leu Thr Leu Val Ala Phe Gly Ser 305 310 315 320 Gly Ala Pro Gly Gly Leu Phe Ala Pro Ser Leu Ile Leu Gly Ser Ala 325 330 335 Leu Gly His Leu Val Gly Val Leu Glu Tyr Gln Ile Thr Gly Asp Gly 340 345 350 Ser Pro Val Thr Tyr Ala Leu Ala Gly Met Gly Gly Phe Phe Ser Ala 355 360 365 Val Ser Lys Val Pro Ile Thr Ala Ile Val Ile Val Phe Glu Met Thr 370 375 380 Thr Asp Phe Asn Leu Val Leu Pro Leu Met Ile Val Ser Val Thr Ala 385 390 395 400 Tyr Leu Val Ala Asp Lys Val Val Pro Gly Ser Leu Tyr Glu Lys Leu 405 410 415 Leu Leu Leu Asn Gly Ile Thr Leu Thr Lys Gln Met Ser Val Glu Gly 420 425 430 Ile Leu Ser Gln Met Thr Ala Lys Asp Val Met Gln Gln Arg Val Glu 435 440 445 Thr Leu Asp Ala Glu Ile Thr Leu Glu Glu Ala Lys Gln Ala Phe Ala 450 455 460 Ser Ser His His Arg Gly Phe Pro Val Val Glu Asp Asn Lys Leu Val 465 470 475 480 Gly Ile Ile Thr Gln Ser Asp Leu Thr Lys Ser Leu Ser Arg Ser Leu 485 490 495 Glu Asn Asn Pro His Leu Arg Glu Ile Met Thr Ala Asn Pro Met Thr 500 505 510 Val Thr Pro Ile His Thr Leu Ser Asn Val Leu Tyr Leu Leu Asp Arg 515 520 525 Tyr Gln Ile Ser Arg Leu Pro Val Val Glu Gly Gln Lys Leu Ile Gly 530 535 540 Ile Ile Thr Arg Ala Asp Ile Ile Arg Val Glu Ala Asp Arg Leu Asn 545 550 555 560 Cys Glu Asn Pro Asn Pro Gly Pro Gln Pro Glu Pro Ser Tyr Val Val 565 570 575 Tyr Gln Thr Arg Ser Pro Asn Thr Gly Arg Gly Arg Ile Leu Val Pro 580 585 590 Val Ala Asn Pro Glu Thr Ala Ala Thr Leu Leu Lys Met Ala Ala Ala 595 600 605 Ile Ala Arg Asp Arg His Tyr Glu Ile Glu Cys Val Gln Val Met Leu 610 615 620 Val Ser Arg His Ser Ser Pro Ser Glu Thr Thr Val Arg Thr Ala Lys 625 630 635 640 Ser Arg Arg Leu Leu Arg Gln Ala Glu Val Leu Ala Lys Lys Trp Arg 645 650 655 Ile Pro Leu His Thr Gln Ile Arg Val Ala His Asp Pro Ala His Ala 660 665 670 Ile Leu Glu Thr Ile Lys Asp Arg His Ile Asp Leu Ile Leu Met Gly 675 680 685 Trp Lys Gly Ser Thr Ser Thr Pro Gly Arg Ile Phe Gly Asn Val Val 690 695 700 Asp Thr Ile Ile Arg Gln Ala Thr Cys Asp Val Val Leu Val Lys Leu 705 710 715 720 Gly Ser Ser Pro Phe Pro Ile Pro Asn Thr Gln Tyr Pro Ile Ser Asn 725 730 735 Pro Gln Phe Asn Arg Trp Leu Val Pro Met Ala Gly Gly Pro Asn Ala 740 745 750 Arg Ile Ala Ile Lys Leu Leu Pro Ala Leu Val Thr Leu Ser Asp Asp 755 760 765 Pro Gln Ile Arg Leu Thr Arg Val Phe Lys Pro Trp Glu Phe Arg Pro 770 775 780 Asp Met Thr Val Leu Glu Gln Ala Ile Arg Gln Leu Met Arg Arg Arg 785 790 795 800 Gln Leu Ser Ser Thr Val Ile Ala Ala Pro Val Gln Ala Asp Ser Val 805 810 815 Val Glu Gly Val Ile Lys Leu Val Glu Thr Glu Gly Tyr Asp Val Val 820 825 830 Val Leu Gly Ala Ser Arg Glu Gly Leu Leu Gln Gln Ala Ile Gln Gly 835 840 845 Asn Ile Pro Glu Ala Ile Ala Ser Gly Val Asp Ser Thr Val Ile Leu 850 855 860 Val Arg Gly Ala Ile Glu Ser 865 870 <210> 85 <211> 2592 <212> DNA <213> Nostoc azollae <400> 85 atgttagcca ggagtaaaat tttttggttg aggctttccc gtcagctggt taaaccgagg 60 cgcttggctt tcgtggaagc ttgcgtgatt ggtctagttt ctgggttagc ggcagttctg 120 ttaggacagg cagtggattg ggcaggcgca ttacgagtgc gtgtttctta ccattgtcct 180 gcctacttag tactaccgag tattggacta gtaggaggaa tcttagctgg ttggctagtc 240 gagtgctttg caccggaagc atcaggtagt ggaatgtctg aagtgaaagc agtattggct 300 cgggtaccga tgccgttaaa tctgcggatt gctttggtca agttgatcag cgctacgtta 360 gtgttgggtt cgggaatgcc tttgggacgg gaagggccaa ctgtccaaat tggggcagcc 420 ttggcaaatc aatttagtaa ctgggctccg acttcaccag agcatcgtcg ccaattgatc 480 gccgctggag cgggggcggg attagctgcg gcttttaatg cacctatcgc aggtgtgctt 540 tttgtagtgg aagaattact gcaagatgtg tcaggtatca ctcttgggac tgcgattttg 600 gcttctttca tcgcttcagt catttcccgg ctttatggta gtcacaacct tgatctgaat 660 catctaaatt taggtcttcc cgatacaact ttctttgcgc aggaaatccc attctacttg 720 attttaggag ttctggcggg gtttataggc attctattta ataaaggtat tctcgagagt 780 ctagcaatta accgccgaat ggtaaggttg agtttatcct ggcgaattgg aatcgctggg 840 ttagttagtg gtgtggtgat cgctttatta cctgctacct ttcgcgatca tgctgggttg 900 agagaaattt tgcttgcagg taatactaac tggtcatttg cagcgatcgc tcttttagtt 960 cagtttatcc taattatttt tacctacggt tctggagcgc cagggggttt actagttccc 1020 accttagtct tgggatctgc ccttggttac ttagtcggtg ctatcgaaca cagtttactg 1080 ggaatgagtg ctgcggcagt ctatgctcat gtgggtatgg ctgctttttt tagcgctgta 1140 tctaaggttc caattacggc agttgtcatt gtatttgaga tgacaacaga ttttaacctg 1200 gtactaccgc taatgattgc ttctgtggtt gcctacttag tagcagaaaa aattgaccat 1260 cgatctctct acgacctttt actagagtgg aaaggaattc atataaccaa ggagccaagc 1320 agagaggtgc ttctggcaca actcagtgcc gtagatgtaa tgcaacggcg tttggaaacc 1380 ctctctagcc agatgagtac tgatgaagcg gtacaggcat tttcccactc tcaccatcgc 1440 aacttcccag ttttagagaa tggtaaagtt gttggtattg ttactcagga agatttagtt 1500 aatattgctt cgcaaaagtt aagtggagat acaactatta gcgagattat gacaccagag 1560 ccagtgacag taactcccac agcgacactg gctcatgtac tacatatact taatcgttat 1620 catctcagct gcttgcttgt tacagaaggt cgcaagctta taggaattat tactcgtagt 1680 gatattatcc gtgtagaagc agagcgactt agtggtaata gcgaacaaat ggaacgtaaa 1740 ttagcacctt cttatgtggt ttaccaaagt cgcgctccgg ctacaggcaa aggaagattg 1800 ttagtaccgc tttcacatcc acagacagcc gagactttac tagaaatggc agttgcgatt 1860 gccaaagatc gcaattacga aatagaatcc ctacaagtga ttattgttcc gtctagccgt 1920 attccatcgg aaacaccagt acaaatcagc aaaagtcttc aacttttgca acgggcaata 1980 cttttaggag agaattcgcg gattcccgtt cacaccgaga ttcgagttgc tcataatgtt 2040 gctggggcaa ttttggagac tgtcaaggaa cgacacattg acttggtact gatgggatgg 2100 aaaggcagta catcaactcc tggtagagtt tttagccgag tcgtggatac cataattcga 2160 caggcaggtt gtgatgttat cttggctaaa ttagatgata aaagatcctt tgaccgttgg 2220 ttattgccaa tagcaggtgg acccaactcc agccaagcaa ttaagttatt acctgcgctt 2280 tcttctttaa gtaggtcatc ccaaatcaat ctatgtcaag ttttccagcc taataactct 2340 attcccgata caactttatt agataaatcc gttaactttc tgcaatgccg agttagtggt 2400 aaagtagtgg ctaccccaat tcgtgctaat tctgtttctg atgctgtcct ccagtgtgca 2460 gaacaagata agagtgatgt aattgttctg ggagctagtt gtgagagttt actacaacaa 2520 gcgattcaag gaaatattgc tgaaaatatt tctcgtaaga gtaattgtac agttatcatg 2580 gtcaaaactt aa 2592 <210> 86 <211> 863 <212> PRT <213> Nostoc azollae <400> 86 Met Leu Ala Arg Ser Lys Ile Phe Trp Leu Arg Leu Ser Arg Gln Leu 1 5 10 15 Val Lys Pro Arg Arg Leu Ala Phe Val Glu Ala Cys Val Ile Gly Leu 20 25 30 Val Ser Gly Leu Ala Ala Val Leu Leu Gly Gln Ala Val Asp Trp Ala 35 40 45 Gly Ala Leu Arg Val Arg Val Ser Tyr His Cys Pro Ala Tyr Leu Val 50 55 60 Leu Pro Ser Ile Gly Leu Val Gly Gly Ile Leu Ala Gly Trp Leu Val 65 70 75 80 Glu Cys Phe Ala Pro Glu Ala Ser Gly Ser Gly Met Ser Glu Val Lys 85 90 95 Ala Val Leu Ala Arg Val Pro Met Pro Leu Asn Leu Arg Ile Ala Leu 100 105 110 Val Lys Leu Ile Ser Ala Thr Leu Val Leu Gly Ser Gly Met Pro Leu 115 120 125 Gly Arg Glu Gly Pro Thr Val Gln Ile Gly Ala Ala Leu Ala Asn Gln 130 135 140 Phe Ser Asn Trp Ala Pro Thr Ser Pro Glu His Arg Arg Gln Leu Ile 145 150 155 160 Ala Ala Gly Ala Gly Ala Gly Leu Ala Ala Ala Phe Asn Ala Pro Ile 165 170 175 Ala Gly Val Leu Phe Val Val Glu Glu Leu Leu Gln Asp Val Ser Gly 180 185 190 Ile Thr Leu Gly Thr Ala Ile Leu Ala Ser Phe Ile Ala Ser Val Ile 195 200 205 Ser Arg Leu Tyr Gly Ser His Asn Leu Asp Leu Asn His Leu Asn Leu 210 215 220 Gly Leu Pro Asp Thr Thr Phe Phe Ala Gln Glu Ile Pro Phe Tyr Leu 225 230 235 240 Ile Leu Gly Val Leu Ala Gly Phe Ile Gly Ile Leu Phe Asn Lys Gly 245 250 255 Ile Leu Glu Ser Leu Ala Ile Asn Arg Arg Met Val Arg Leu Ser Leu 260 265 270 Ser Trp Arg Ile Gly Ile Ala Gly Leu Val Ser Gly Val Val Ile Ala 275 280 285 Leu Leu Pro Ala Thr Phe Arg Asp His Ala Gly Leu Arg Glu Ile Leu 290 295 300 Leu Ala Gly Asn Thr Asn Trp Ser Phe Ala Ala Ile Ala Leu Leu Val 305 310 315 320 Gln Phe Ile Leu Ile Ile Phe Thr Tyr Gly Ser Gly Ala Pro Gly Gly 325 330 335 Leu Leu Val Pro Thr Leu Val Leu Gly Ser Ala Leu Gly Tyr Leu Val 340 345 350 Gly Ala Ile Glu His Ser Leu Leu Gly Met Ser Ala Ala Ala Val Tyr 355 360 365 Ala His Val Gly Met Ala Ala Phe Phe Ser Ala Val Ser Lys Val Pro 370 375 380 Ile Thr Ala Val Val Ile Val Phe Glu Met Thr Thr Asp Phe Asn Leu 385 390 395 400 Val Leu Pro Leu Met Ile Ala Ser Val Val Ala Tyr Leu Val Ala Glu 405 410 415 Lys Ile Asp His Arg Ser Leu Tyr Asp Leu Leu Leu Glu Trp Lys Gly 420 425 430 Ile His Ile Thr Lys Glu Pro Ser Arg Glu Val Leu Leu Ala Gln Leu 435 440 445 Ser Ala Val Asp Val Met Gln Arg Arg Leu Glu Thr Leu Ser Ser Gln 450 455 460 Met Ser Thr Asp Glu Ala Val Gln Ala Phe Ser His Ser His His Arg 465 470 475 480 Asn Phe Pro Val Leu Glu Asn Gly Lys Val Val Gly Ile Val Thr Gln 485 490 495 Glu Asp Leu Val Asn Ile Ala Ser Gln Lys Leu Ser Gly Asp Thr Thr 500 505 510 Ile Ser Glu Ile Met Thr Pro Glu Pro Val Thr Val Thr Pro Thr Ala 515 520 525 Thr Leu Ala His Val Leu His Ile Leu Asn Arg Tyr His Leu Ser Cys 530 535 540 Leu Leu Val Thr Glu Gly Arg Lys Leu Ile Gly Ile Ile Thr Arg Ser 545 550 555 560 Asp Ile Ile Arg Val Glu Ala Glu Arg Leu Ser Gly Asn Ser Glu Gln 565 570 575 Met Glu Arg Lys Leu Ala Pro Ser Tyr Val Val Tyr Gln Ser Arg Ala 580 585 590 Pro Ala Thr Gly Lys Gly Arg Leu Leu Val Pro Leu Ser His Pro Gln 595 600 605 Thr Ala Glu Thr Leu Leu Glu Met Ala Val Ala Ile Ala Lys Asp Arg 610 615 620 Asn Tyr Glu Ile Glu Ser Leu Gln Val Ile Ile Val Pro Ser Ser Arg 625 630 635 640 Ile Pro Ser Glu Thr Pro Val Gln Ile Ser Lys Ser Leu Gln Leu Leu 645 650 655 Gln Arg Ala Ile Leu Leu Gly Glu Asn Ser Arg Ile Pro Val His Thr 660 665 670 Glu Ile Arg Val Ala His Asn Val Ala Gly Ala Ile Leu Glu Thr Val 675 680 685 Lys Glu Arg His Ile Asp Leu Val Leu Met Gly Trp Lys Gly Ser Thr 690 695 700 Ser Thr Pro Gly Arg Val Phe Ser Arg Val Val Asp Thr Ile Ile Arg 705 710 715 720 Gln Ala Gly Cys Asp Val Ile Leu Ala Lys Leu Asp Asp Lys Arg Ser 725 730 735 Phe Asp Arg Trp Leu Leu Pro Ile Ala Gly Gly Pro Asn Ser Ser Gln 740 745 750 Ala Ile Lys Leu Leu Pro Ala Leu Ser Ser Leu Ser Arg Ser Ser Gln 755 760 765 Ile Asn Leu Cys Gln Val Phe Gln Pro Asn Asn Ser Ile Pro Asp Thr 770 775 780 Thr Leu Leu Asp Lys Ser Val Asn Phe Leu Gln Cys Arg Val Ser Gly 785 790 795 800 Lys Val Val Ala Thr Pro Ile Arg Ala Asn Ser Val Ser Asp Ala Val 805 810 815 Leu Gln Cys Ala Glu Gln Asp Lys Ser Asp Val Ile Val Leu Gly Ala 820 825 830 Ser Cys Glu Ser Leu Leu Gln Gln Ala Ile Gln Gly Asn Ile Ala Glu 835 840 845 Asn Ile Ser Arg Lys Ser Asn Cys Thr Val Ile Met Val Lys Thr 850 855 860 <210> 87 <211> 2592 <212> DNA <213> Nostoc punctiforme <400> 87 ttaagttttg accataataa ctgtgcaatt actcttgcga gaaatatttt ctgcaatatt 60 tccttgaatt acctgttgta gtagactttc acggctagct cccaaaacaa taacatcact 120 gttgtcttgc tgggcgcatt caagtacagc ctcagaaaca gaattggctt ggactggagt 180 cgccaccact ttacctttaa ctcggcgttg gagaaagtga acagatttat ctagtaatgt 240 tgtgtcaggt agagacttag taggctggaa tatttgacat agattgattt ggggggattt 300 acttaaggaa gcaagagcag gtaataaccg aattgcttgg ctggagttag gaccacctgc 360 cattggcaac aaccaacggt caaaagctct tttatcatcc aatttggcca agacaacatc 420 acaacctgcc tgtcgaatta tggtatctac cactcggctg aaaactctac caggagttga 480 tgtagtacct ttccatccca ttaataccaa atcgatatgt cgatctttga cagtctccaa 540 aattgctcca gcgacattat gggtaactcg gatctgggtg tgaacgggaa tccgccactt 600 ttctcctaac agtattgctt tctgtaaaag ctcaaggctt ttggtaattt gtactggtgt 660 ttcagatggg atacggttag atggaacaat aattacttgt aggcattcta tttcgtaatt 720 gttagcttta gcgatcgccc cagccatttc caataaagtc tcggctgtct gtggatgcga 780 aagtggtact agtaaccttc ctttgcctgt agccggagcg cgagtttggt aaatcacata 840 agaagttgct gatttcgatt ctatctgttg ggtgttacca ttcaacctct ctgcttctac 900 acggataata tcactacgag taataattcc tactagcttc cgaccttctg taacaggcaa 960 gcagctgagg tgataacgat tgagtatatg cagcacataa gccagcgtcg ctgtgggact 1020 cgctgttact ggctctggtg tcataatctg gctgatagtt gtatttccac ttaactgttg 1080 cgaggcaaga ttaactaaat ctttctgagt gacaatgcca acaactttac ctttttctaa 1140 aattgggaag ttgcgatgat gagagtcgga aaatgcctgc actgcctcat caatactcat 1200 ctggctagat agggtttcga cacgtcgctg cattacatct gcggcactta tttgtgctaa 1260 aatcccctct gtgcctggct cttttgtaat gtgaatccct ttccactcta gtagaaggtc 1320 atagagcgat cgcgggtcaa ttttttctgc tactaaataa gcaatcacag atacaatcat 1380 taacggtagc accagattga aatctgtcgt catctcaaag acaatgacaa ctgctgtaat 1440 cggcacttta gagacggcgc taaaaagtgc agccattccc acatgagcgt aggttgttgc 1500 agcactcatt cccagcaaac tctgttcggc agcaccaact aagtagccaa gagcagcgcc 1560 caagaccaat gtgggaacca gcaaaccccc tggcgctcct gagccgtagg ttaaaataat 1620 tagggtaaat tggactaaaa gagcgatcgc tgcaaatagc caattcccac tacctacaag 1680 caaaatttct ctcagcccag cattattgcg aaaggtgata ggtaacagag cgatcgcaac 1740 accagttact aaccccacaa ttccaattcg ccagggtaaa ctcagattta gtaaacgccg 1800 attaattgcc agacttgcaa gaatactttt attaaacaga atgcctatta gcccacctag 1860 cacccccaaa atcaagtaga aagggatttc ctgagcgaag aaagtggtat gtgaaaagct 1920 taaatccaga tgattcagat ccaagctgtg actaccatac aaccgggaga tgactgaagc 1980 gatgaaagaa gccaaaatcg cagtgccaag agtgatacct gacacatctt ggagtaattc 2040 ttccactaca aacaggacac ctgcgatcgg tgcattaaaa gccgctgcta atccagcccc 2100 ggctccagcg gcgatcagtt ggcggcgatg ctctggtgaa gtcggtaccc aattactaag 2160 ttgatttgcc aaagctgccc caatttggac agttggccct tcccgtccta aaggcattcc 2220 agaacccagc actagtgtag cgctgaccag cttgaccaga gcgattcgca gatttaatgg 2280 catcggcaca cgagccaata cggctttgac ttcagacatc ccactacctg atgcttcagg 2340 tgcgaagcgc tctactagcc aaccagctaa gattccccct accagtccaa tacctggtag 2400 taccaagtag gcaggccaga tgtaagaaag atgcactcgc catgctcccg cccagtctac 2460 cgcctgtcct aacagaactg ctgctagccc agaaactaaa ccaattatgc aagcttcaac 2520 gaaagccaag cgccttggtc gaagcagctg acgggaaagc ctcaaccaca gaatttttcc 2580 ccttgctaac at 2592 <210> 88 <211> 863 <212> PRT <213> Nostoc punctiforme <400> 88 Met Leu Ala Arg Gly Lys Ile Leu Trp Leu Arg Leu Ser Arg Gln Leu 1 5 10 15 Leu Arg Pro Arg Arg Leu Ala Phe Val Glu Ala Cys Ile Ile Gly Leu 20 25 30 Val Ser Gly Leu Ala Ala Val Leu Leu Gly Gln Ala Val Asp Trp Ala 35 40 45 Gly Ala Trp Arg Val His Leu Ser Tyr Ile Trp Pro Ala Tyr Leu Val 50 55 60 Leu Pro Gly Ile Gly Leu Val Gly Gly Ile Leu Ala Gly Trp Leu Val 65 70 75 80 Glu Arg Phe Ala Pro Glu Ala Ser Gly Ser Gly Met Ser Glu Val Lys 85 90 95 Ala Val Leu Ala Arg Val Pro Met Pro Leu Asn Leu Arg Ile Ala Leu 100 105 110 Val Lys Leu Val Ser Ala Thr Leu Val Leu Gly Ser Gly Met Pro Leu 115 120 125 Gly Arg Glu Gly Pro Thr Val Gln Ile Gly Ala Ala Leu Ala Asn Gln 130 135 140 Leu Ser Asn Trp Val Pro Thr Ser Pro Glu His Arg Arg Gln Leu Ile 145 150 155 160 Ala Ala Gly Ala Gly Ala Gly Leu Ala Ala Ala Phe Asn Ala Pro Ile 165 170 175 Ala Gly Val Leu Phe Val Val Glu Glu Leu Leu Gln Asp Val Ser Gly 180 185 190 Ile Thr Leu Gly Thr Ala Ile Leu Ala Ser Phe Ile Ala Ser Val Ile 195 200 205 Ser Arg Leu Tyr Gly Ser His Ser Leu Asp Leu Asn His Leu Asp Leu 210 215 220 Ser Phe Ser His Thr Thr Phe Phe Ala Gln Glu Ile Pro Phe Tyr Leu 225 230 235 240 Ile Leu Gly Val Leu Gly Gly Leu Ile Gly Ile Leu Phe Asn Lys Ser 245 250 255 Ile Leu Ala Ser Leu Ala Ile Asn Arg Arg Leu Leu Asn Leu Ser Leu 260 265 270 Pro Trp Arg Ile Gly Ile Val Gly Leu Val Thr Gly Val Ala Ile Ala 275 280 285 Leu Leu Pro Ile Thr Phe Arg Asn Asn Ala Gly Leu Arg Glu Ile Leu 290 295 300 Leu Val Gly Ser Gly Asn Trp Leu Phe Ala Ala Ile Ala Leu Leu Val 305 310 315 320 Gln Phe Thr Leu Ile Ile Leu Thr Tyr Gly Ser Gly Ala Pro Gly Gly 325 330 335 Leu Leu Val Pro Thr Leu Val Leu Gly Ala Ala Leu Gly Tyr Leu Val 340 345 350 Gly Ala Ala Glu Gln Ser Leu Leu Gly Met Ser Ala Ala Thr Thr Tyr 355 360 365 Ala His Val Gly Met Ala Ala Leu Phe Ser Ala Val Ser Lys Val Pro 370 375 380 Ile Thr Ala Val Val Ile Val Phe Glu Met Thr Thr Asp Phe Asn Leu 385 390 395 400 Val Leu Pro Leu Met Ile Val Ser Val Ile Ala Tyr Leu Val Ala Glu 405 410 415 Lys Ile Asp Pro Arg Ser Leu Tyr Asp Leu Leu Leu Glu Trp Lys Gly 420 425 430 Ile His Ile Thr Lys Glu Pro Gly Thr Glu Gly Ile Leu Ala Gln Ile 435 440 445 Ser Ala Ala Asp Val Met Gln Arg Arg Val Glu Thr Leu Ser Ser Gln 450 455 460 Met Ser Ile Asp Glu Ala Val Gln Ala Phe Ser Asp Ser His His Arg 465 470 475 480 Asn Phe Pro Ile Leu Glu Lys Gly Lys Val Val Gly Ile Val Thr Gln 485 490 495 Lys Asp Leu Val Asn Leu Ala Ser Gln Gln Leu Ser Gly Asn Thr Thr 500 505 510 Ile Ser Gln Ile Met Thr Pro Glu Pro Val Thr Ala Ser Pro Thr Ala 515 520 525 Thr Leu Ala Tyr Val Leu His Ile Leu Asn Arg Tyr His Leu Ser Cys 530 535 540 Leu Pro Val Thr Glu Gly Arg Lys Leu Val Gly Ile Ile Thr Arg Ser 545 550 555 560 Asp Ile Ile Arg Val Glu Ala Glu Arg Leu Asn Gly Asn Thr Gln Gln 565 570 575 Ile Glu Ser Lys Ser Ala Thr Ser Tyr Val Ile Tyr Gln Thr Arg Ala 580 585 590 Pro Ala Thr Gly Lys Gly Arg Leu Leu Val Pro Leu Ser His Pro Gln 595 600 605 Thr Ala Glu Thr Leu Leu Glu Met Ala Gly Ala Ile Ala Lys Ala Asn 610 615 620 Asn Tyr Glu Ile Glu Cys Leu Gln Val Ile Ile Val Pro Ser Asn Arg 625 630 635 640 Ile Pro Ser Glu Thr Pro Val Gln Ile Thr Lys Ser Leu Glu Leu Leu 645 650 655 Gln Lys Ala Ile Leu Leu Gly Glu Lys Trp Arg Ile Pro Val His Thr 660 665 670 Gln Ile Arg Val Thr His Asn Val Ala Gly Ala Ile Leu Glu Thr Val 675 680 685 Lys Asp Arg His Ile Asp Leu Val Leu Met Gly Trp Lys Gly Thr Thr 690 695 700 Ser Thr Pro Gly Arg Val Phe Ser Arg Val Val Asp Thr Ile Ile Arg 705 710 715 720 Gln Ala Gly Cys Asp Val Val Leu Ala Lys Leu Asp Asp Lys Arg Ala 725 730 735 Phe Asp Arg Trp Leu Leu Pro Met Ala Gly Gly Pro Asn Ser Ser Gln 740 745 750 Ala Ile Arg Leu Leu Pro Ala Leu Ala Ser Leu Ser Lys Ser Pro Gln 755 760 765 Ile Asn Leu Cys Gln Ile Phe Gln Pro Thr Lys Ser Leu Pro Asp Thr 770 775 780 Thr Leu Leu Asp Lys Ser Val His Phe Leu Gln Arg Arg Val Lys Gly 785 790 795 800 Lys Val Val Ala Thr Pro Val Gln Ala Asn Ser Val Ser Glu Ala Val 805 810 815 Leu Glu Cys Ala Gln Gln Asp Asn Ser Asp Val Ile Val Leu Gly Ala 820 825 830 Ser Arg Glu Ser Leu Leu Gln Gln Val Ile Gln Gly Asn Ile Ala Glu 835 840 845 Asn Ile Ser Arg Lys Ser Asn Cys Thr Val Ile Met Val Lys Thr 850 855 860 <210> 89 <211> 2589 <212> DNA <213> Anabaena variabilis <400> 89 atgtactttc gcagttggtt gcagcctaga cggggtttag cgatcgccga agcttgtgtt 60 attggggttt tagctgcatt atctgcggta ttcctcaagg tttgttcggg attattaggt 120 gcatggcggg ttcatagttc tcatgttttg cctgcatggg tagttttacc aatcatcggt 180 ttgggctttg ggtatttggc tggtctgatg gtgcaaagat tagcaccaga ggcggcgggt 240 agtggtatcc cccaagtcaa ggctaccctg gcaaatatac cgatgaaatt gtcttggcgg 300 gtagcggtga ttaagctact gagtgccatt attgctttag gttctggcat cacattagga 360 agacaagggc cgacagtcca agtaggggca ggtttagcgt cggggatgag tcgcttggtt 420 cccacttctc ctgaccatcg gcggcaaatg attgcggctg gtgcgggtgc aggtttggcg 480 gctgctttta atgctcccat tgccggggta ttattcatta ttgaggaatt acttcaagat 540 ttatcgggat tgactctggg aactgccatt atcgcttcat ttattggcgg ggtagtgtcc 600 cggttgttgg gtggtcgcag tctaaattta aatatagaat tactttccta ctccagccgg 660 tttacttttc cagaaattcc cttctttttg cttttgggtg ttttagcggg gttactgggt 720 gcattattta atcgtggctt gatttttagc ctccagtttt atcggagtct gcatattagt 780 ttacctttgc gggtcggttt ggctgggttg gtttcgggga ttgtcgtatc gctgttacct 840 gagtcgtttc gggataatgc tggtttaagg gaatatgtaa ttactggtga tttaaatcca 900 agctttgcag cgatcgcttt tgttgctcag tttaccctaa ctttagtcgc atttggttct 960 ggcgcacccg gaggtttatt tgcgcctagc ttaattttgg gttcggcttt aggacatttg 1020 gtcggtgtat tagagtatca aatcactggt gatggttctc ctgtgactta cgccttagcg 1080 gggatgggag gtttttttag tgccgtttct aaagtaccaa tcactgccat tgtgattatc 1140 tttgaaatga ccacagattt taatttagtg ttgcctttga tgatagtgtc tgtgacggct 1200 tacttggtag cagacaaagt agtacccggt tcactgtatg agaaattatt actgttgaat 1260 ggcattaccc tcactaaaca gatgtcggta gaggggatat taagccaaat gactgcaaaa 1320 gatgtgatgc agcaacgggt agaaacttta gatgcagata ttacccttga agaagccaag 1380 caagcctttg ctagttccca ccatcgcggc ttcccggtag tggaagataa caaattagtc 1440 gggattatta cccaatcaga tttaactaaa agcctcagcc gcaatctaga gaatcatcct 1500 cacctcaggg aaatcatgac cgccaatccc atgacagtca cacccataca taccctgagt 1560 aatgttttat atttgctaga ccgctatcaa atcagtcgcc taccagtagt agacgggcaa 1620 aaactcatcg ggattatcac ccgtgcagat atcattcggg tagaagcaga ccgtctcaac 1680 tgcgaaaacc ccaacccagg cccccaaccg gaaccatcct atgtagttta ccaaacgcgg 1740 agtcccagca ctggcagagg tagaatacta gtcccagtag ccaacccaga aaccgccgca 1800 actctattaa aaatggcagc tgccattgcc cgcgatcgcc attatgaaat agagtgtgta 1860 caagtgatgc tggtttctcg tcacagttcc ccttcagaaa ccaccgtcag aaccgccaaa 1920 agtcgtcgcc ttctgcgaca agccgaagta ttagccaaaa aatggcgcat tcctctacac 1980 acccaaatta gggtcgccca tgatcctgct cacgccattt tagaaaccat caaagaccga 2040 cacatagatt taattctcat gggatggaaa ggcagcacat ctaccccagg caggattttt 2100 ggcaatgttg tagacaccat catccgccaa gccacctgtg acgtagtact agtgaagtta 2160 ggtacttccc caatccccaa tcccccattc aatcgctggc tagtcccaat ggctggcggc 2220 cctaacgcca gaatagccat taaattatta ccggctttag ttactttaag cgatgaccca 2280 caaatccgct tgacaagggt gtttaaacct tgggaattta gaccagatat gacagtttta 2340 gaacaagcca ttcgtcaatt gatgcgtcgc cgccaactat ctagtactgt aattgctgcg 2400 ccggtacaag ctgattcagt agtcgaaggt gtgattaagt tagtgaaaac cgaaggttat 2460 gatgtggtgg ttttaggcgc ttcccgtgaa ggtttattac aacaggctat tcaaggtaat 2520 attccagagg cgatcgcttc tggtgttgat attaccgtaa ttttggtaag gggagcaatt 2580 gaaagttag 2589 <210> 90 <211> 862 <212> PRT <213> Anabaena variabilis <400> 90 Met Tyr Phe Arg Ser Trp Leu Gln Pro Arg Arg Gly Leu Ala Ile Ala 1 5 10 15 Glu Ala Cys Val Ile Gly Val Leu Ala Ala Leu Ser Ala Val Phe Leu 20 25 30 Lys Val Cys Ser Gly Leu Leu Gly Ala Trp Arg Val His Ser Ser His 35 40 45 Val Leu Pro Ala Trp Val Val Leu Pro Ile Ile Gly Leu Gly Phe Gly 50 55 60 Tyr Leu Ala Gly Leu Met Val Gln Arg Leu Ala Pro Glu Ala Ala Gly 65 70 75 80 Ser Gly Ile Pro Gln Val Lys Ala Thr Leu Ala Asn Ile Pro Met Lys 85 90 95 Leu Ser Trp Arg Val Ala Val Ile Lys Leu Leu Ser Ala Ile Ile Ala 100 105 110 Leu Gly Ser Gly Ile Thr Leu Gly Arg Gln Gly Pro Thr Val Gln Val 115 120 125 Gly Ala Gly Leu Ala Ser Gly Met Ser Arg Leu Val Pro Thr Ser Pro 130 135 140 Asp His Arg Arg Gln Met Ile Ala Ala Gly Ala Gly Ala Gly Leu Ala 145 150 155 160 Ala Ala Phe Asn Ala Pro Ile Ala Gly Val Leu Phe Ile Ile Glu Glu 165 170 175 Leu Leu Gln Asp Leu Ser Gly Leu Thr Leu Gly Thr Ala Ile Ile Ala 180 185 190 Ser Phe Ile Gly Gly Val Val Ser Arg Leu Leu Gly Gly Arg Ser Leu 195 200 205 Asn Leu Asn Ile Glu Leu Leu Ser Tyr Ser Ser Arg Phe Thr Phe Pro 210 215 220 Glu Ile Pro Phe Phe Leu Leu Leu Gly Val Leu Ala Gly Leu Leu Gly 225 230 235 240 Ala Leu Phe Asn Arg Gly Leu Ile Phe Ser Leu Gln Phe Tyr Arg Ser 245 250 255 Leu His Ile Ser Leu Pro Leu Arg Val Gly Leu Ala Gly Leu Val Ser 260 265 270 Gly Ile Val Val Ser Leu Leu Pro Glu Ser Phe Arg Asp Asn Ala Gly 275 280 285 Leu Arg Glu Tyr Val Ile Thr Gly Asp Leu Asn Pro Ser Phe Ala Ala 290 295 300 Ile Ala Phe Val Ala Gln Phe Thr Leu Thr Leu Val Ala Phe Gly Ser 305 310 315 320 Gly Ala Pro Gly Gly Leu Phe Ala Pro Ser Leu Ile Leu Gly Ser Ala 325 330 335 Leu Gly His Leu Val Gly Val Leu Glu Tyr Gln Ile Thr Gly Asp Gly 340 345 350 Ser Pro Val Thr Tyr Ala Leu Ala Gly Met Gly Gly Phe Phe Ser Ala 355 360 365 Val Ser Lys Val Pro Ile Thr Ala Ile Val Ile Ile Phe Glu Met Thr 370 375 380 Thr Asp Phe Asn Leu Val Leu Pro Leu Met Ile Val Ser Val Thr Ala 385 390 395 400 Tyr Leu Val Ala Asp Lys Val Val Pro Gly Ser Leu Tyr Glu Lys Leu 405 410 415 Leu Leu Leu Asn Gly Ile Thr Leu Thr Lys Gln Met Ser Val Glu Gly 420 425 430 Ile Leu Ser Gln Met Thr Ala Lys Asp Val Met Gln Gln Arg Val Glu 435 440 445 Thr Leu Asp Ala Asp Ile Thr Leu Glu Glu Ala Lys Gln Ala Phe Ala 450 455 460 Ser Ser His His Arg Gly Phe Pro Val Val Glu Asp Asn Lys Leu Val 465 470 475 480 Gly Ile Ile Thr Gln Ser Asp Leu Thr Lys Ser Leu Ser Arg Asn Leu 485 490 495 Glu Asn His Pro His Leu Arg Glu Ile Met Thr Ala Asn Pro Met Thr 500 505 510 Val Thr Pro Ile His Thr Leu Ser Asn Val Leu Tyr Leu Leu Asp Arg 515 520 525 Tyr Gln Ile Ser Arg Leu Pro Val Val Asp Gly Gln Lys Leu Ile Gly 530 535 540 Ile Ile Thr Arg Ala Asp Ile Ile Arg Val Glu Ala Asp Arg Leu Asn 545 550 555 560 Cys Glu Asn Pro Asn Pro Gly Pro Gln Pro Glu Pro Ser Tyr Val Val 565 570 575 Tyr Gln Thr Arg Ser Pro Ser Thr Gly Arg Gly Arg Ile Leu Val Pro 580 585 590 Val Ala Asn Pro Glu Thr Ala Ala Thr Leu Leu Lys Met Ala Ala Ala 595 600 605 Ile Ala Arg Asp Arg His Tyr Glu Ile Glu Cys Val Gln Val Met Leu 610 615 620 Val Ser Arg His Ser Ser Pro Ser Glu Thr Thr Val Arg Thr Ala Lys 625 630 635 640 Ser Arg Arg Leu Leu Arg Gln Ala Glu Val Leu Ala Lys Lys Trp Arg 645 650 655 Ile Pro Leu His Thr Gln Ile Arg Val Ala His Asp Pro Ala His Ala 660 665 670 Ile Leu Glu Thr Ile Lys Asp Arg His Ile Asp Leu Ile Leu Met Gly 675 680 685 Trp Lys Gly Ser Thr Ser Thr Pro Gly Arg Ile Phe Gly Asn Val Val 690 695 700 Asp Thr Ile Ile Arg Gln Ala Thr Cys Asp Val Val Leu Val Lys Leu 705 710 715 720 Gly Thr Ser Pro Ile Pro Asn Pro Pro Phe Asn Arg Trp Leu Val Pro 725 730 735 Met Ala Gly Gly Pro Asn Ala Arg Ile Ala Ile Lys Leu Leu Pro Ala 740 745 750 Leu Val Thr Leu Ser Asp Asp Pro Gln Ile Arg Leu Thr Arg Val Phe 755 760 765 Lys Pro Trp Glu Phe Arg Pro Asp Met Thr Val Leu Glu Gln Ala Ile 770 775 780 Arg Gln Leu Met Arg Arg Arg Gln Leu Ser Ser Thr Val Ile Ala Ala 785 790 795 800 Pro Val Gln Ala Asp Ser Val Val Glu Gly Val Ile Lys Leu Val Lys 805 810 815 Thr Glu Gly Tyr Asp Val Val Val Leu Gly Ala Ser Arg Glu Gly Leu 820 825 830 Leu Gln Gln Ala Ile Gln Gly Asn Ile Pro Glu Ala Ile Ala Ser Gly 835 840 845 Val Asp Ile Thr Val Ile Leu Val Arg Gly Ala Ile Glu Ser 850 855 860 <210> 91 <211> 2616 <212> DNA <213> Nostoc sp. <400> 91 atgtactttc gcagttggtt gcagcctaga cggggtttag cgatcgcaga agcttgtgtt 60 attggggttt tagctgcatt atctgcggta ttcctcaagg tctgttcggg attattaggt 120 gcatggcggg ttcatagttc tcatattttg ccggcatggg tagttttacc aatcattggt 180 ttgagctttg ggtatttggc tgggctgatg gtgcaaagat tagcaccaga ggcggcgggt 240 agtggtattc cacaagtcaa agctactcta gcaaatatac cgatgaaatt gtcttggcga 300 gtagcaatag ttaagctact gagtgctatt ctggctttgg gttcagggct gacattagga 360 agacaagggc cgacagtcca agtgggggca ggtttagcgg cggggatgag tcgcttggtt 420 cccacttctc ccgaccatcg gcggcaaatg attgcggctg gtgcgggtgc aggtttggcg 480 gctgctttta atgcccctat tgccggggtc ttatttatta ttgaggaatt acttcaagat 540 ttatcagggc tgactctggg aactgccatt atcgcttcat ttattggtgg ggtagtttcc 600 cggctattgg gtggtcgtag tctaaattta aacatagaat tactttccta ctctagtggc 660 ttttcttttc cagaaattcc cttctttttg ctgttgggtg tcttagcagg gttactgggt 720 gcattattta atcgcgggtt gattttcagc ctccagtttt accggaatct gcatattagc 780 ttacctctgc gggtagcctt ggctggtttg gtatcgggga ttgtcgtatc gctgttgcct 840 gagtcttttc gggataacgc tggtttaagg gaatatgtaa tcactggtga tttaaaccca 900 tcctttgcag cgatcgcttt tattgctcag tttatcctaa ctttagtcgc atttggttct 960 ggcgcacccg gaggtttatt tgcgcctagc ctaattttag gttcggcttt agggcatttg 1020 gtgggcgtat tagagtatca aatcacgggg gatggttctc ctgttaccta tgccttagcg 1080 ggaatgggtg gtttttttag tgcggtttct aaagtcccaa tcaccgctat tgtgattgtc 1140 tttgaaatga ccacagactt taacctagtg ttgcctttga tgatagtgtc tgtgacggct 1200 tacttagtag cagacaaagt agtacctggt tcactgtatg agaaattatt acttttaaat 1260 ggcattaccc tcactaaaca gatgtcggta gaggggatat taagccaaat gactgcaaaa 1320 gatgtgatgc agcaacgggt agaaactcta gatgcagaga taactttaga agaagccaag 1380 caagcctttg ctagttccca ccatcgcggc ttcccagtag tagaagataa caaattagtc 1440 gggattatta ctcaatcaga tttaactaaa agcctcagtc gcagtctaga gaataatcct 1500 cacctcaggg aaattatgac agccaatcct atgacagtca cacccataca taccttgagt 1560 aatgttttat atttattaga ccgctatcaa atcagtcgct taccagttgt agaagggcaa 1620 aaactgatcg ggattattac ccgtgcagat atcattcggg tagaagcaga ccgtctcaac 1680 tgcgaaaatc ccaacccagg gccccagcca gaaccatcct atgtagttta ccaaacgcga 1740 agtcccaaca caggcagagg tagaatacta gtaccagtcg ccaacccaga aaccgccgcg 1800 actttattaa aaatggcagc cgccattgcc cgcgatcgcc attatgaaat agagtgtgta 1860 caagtaatgc tggtttcccg ccacagttcc ccatcggaaa ccacggtgag aaccgccaaa 1920 agtcgccgtc ttctgagaca agccgaagtc ttagccaaaa aatggcgcat tcccctacat 1980 acccaaatta gagtcgccca tgatcctgct catgcaattt tagaaaccat taaagaccga 2040 cacatagact taattctcat gggatggaaa ggtagcacat ccaccccagg caggattttt 2100 ggcaacgttg tagataccat catccgccaa gccacctgtg acgtagtgct ggtgaagtta 2160 ggtagttccc cattcccaat ccccaatacc caatacccaa tctccaatcc ccaattcaat 2220 cgctggctag taccaatggc tggtggcccc aacgccagga tagcaattaa actgttacca 2280 gctttagtga ctttaagcga tgacccacaa attcggttga caagggtgtt taaaccttgg 2340 gaatttagac cagatatgac agttttagaa caagccattc gtcaattgat gcgtcgccgc 2400 caactatcta gtactgtaat tgctgcgcca gtacaagctg attcagtagt cgaaggtgtg 2460 attaagctag tggaaactga aggttatgat gtggtggttt taggcgcttc ccgtgagggc 2520 ttattacaac aggctattca aggtaatatt ccagaggcga tcgcttctgg tgtcgatagt 2580 accgtgattt tggtaagggg agcaattgag agttga 2616 <210> 92 <211> 871 <212> PRT <213> Nostoc sp. <400> 92 Met Tyr Phe Arg Ser Trp Leu Gln Pro Arg Arg Gly Leu Ala Ile Ala 1 5 10 15 Glu Ala Cys Val Ile Gly Val Leu Ala Ala Leu Ser Ala Val Phe Leu 20 25 30 Lys Val Cys Ser Gly Leu Leu Gly Ala Trp Arg Val His Ser Ser His 35 40 45 Ile Leu Pro Ala Trp Val Val Leu Pro Ile Ile Gly Leu Ser Phe Gly 50 55 60 Tyr Leu Ala Gly Leu Met Val Gln Arg Leu Ala Pro Glu Ala Ala Gly 65 70 75 80 Ser Gly Ile Pro Gln Val Lys Ala Thr Leu Ala Asn Ile Pro Met Lys 85 90 95 Leu Ser Trp Arg Val Ala Ile Val Lys Leu Leu Ser Ala Ile Leu Ala 100 105 110 Leu Gly Ser Gly Leu Thr Leu Gly Arg Gln Gly Pro Thr Val Gln Val 115 120 125 Gly Ala Gly Leu Ala Ala Gly Met Ser Arg Leu Val Pro Thr Ser Pro 130 135 140 Asp His Arg Arg Gln Met Ile Ala Ala Gly Ala Gly Ala Gly Leu Ala 145 150 155 160 Ala Ala Phe Asn Ala Pro Ile Ala Gly Val Leu Phe Ile Ile Glu Glu 165 170 175 Leu Leu Gln Asp Leu Ser Gly Leu Thr Leu Gly Thr Ala Ile Ile Ala 180 185 190 Ser Phe Ile Gly Gly Val Val Ser Arg Leu Leu Gly Gly Arg Ser Leu 195 200 205 Asn Leu Asn Ile Glu Leu Leu Ser Tyr Ser Ser Gly Phe Ser Phe Pro 210 215 220 Glu Ile Pro Phe Phe Leu Leu Leu Gly Val Leu Ala Gly Leu Leu Gly 225 230 235 240 Ala Leu Phe Asn Arg Gly Leu Ile Phe Ser Leu Gln Phe Tyr Arg Asn 245 250 255 Leu His Ile Ser Leu Pro Leu Arg Val Ala Leu Ala Gly Leu Val Ser 260 265 270 Gly Ile Val Val Ser Leu Leu Pro Glu Ser Phe Arg Asp Asn Ala Gly 275 280 285 Leu Arg Glu Tyr Val Ile Thr Gly Asp Leu Asn Pro Ser Phe Ala Ala 290 295 300 Ile Ala Phe Ile Ala Gln Phe Ile Leu Thr Leu Val Ala Phe Gly Ser 305 310 315 320 Gly Ala Pro Gly Gly Leu Phe Ala Pro Ser Leu Ile Leu Gly Ser Ala 325 330 335 Leu Gly His Leu Val Gly Val Leu Glu Tyr Gln Ile Thr Gly Asp Gly 340 345 350 Ser Pro Val Thr Tyr Ala Leu Ala Gly Met Gly Gly Phe Phe Ser Ala 355 360 365 Val Ser Lys Val Pro Ile Thr Ala Ile Val Ile Val Phe Glu Met Thr 370 375 380 Thr Asp Phe Asn Leu Val Leu Pro Leu Met Ile Val Ser Val Thr Ala 385 390 395 400 Tyr Leu Val Ala Asp Lys Val Val Pro Gly Ser Leu Tyr Glu Lys Leu 405 410 415 Leu Leu Leu Asn Gly Ile Thr Leu Thr Lys Gln Met Ser Val Glu Gly 420 425 430 Ile Leu Ser Gln Met Thr Ala Lys Asp Val Met Gln Gln Arg Val Glu 435 440 445 Thr Leu Asp Ala Glu Ile Thr Leu Glu Glu Ala Lys Gln Ala Phe Ala 450 455 460 Ser Ser His His Arg Gly Phe Pro Val Val Glu Asp Asn Lys Leu Val 465 470 475 480 Gly Ile Ile Thr Gln Ser Asp Leu Thr Lys Ser Leu Ser Arg Ser Leu 485 490 495 Glu Asn Asn Pro His Leu Arg Glu Ile Met Thr Ala Asn Pro Met Thr 500 505 510 Val Thr Pro Ile His Thr Leu Ser Asn Val Leu Tyr Leu Leu Asp Arg 515 520 525 Tyr Gln Ile Ser Arg Leu Pro Val Val Glu Gly Gln Lys Leu Ile Gly 530 535 540 Ile Ile Thr Arg Ala Asp Ile Ile Arg Val Glu Ala Asp Arg Leu Asn 545 550 555 560 Cys Glu Asn Pro Asn Pro Gly Pro Gln Pro Glu Pro Ser Tyr Val Val 565 570 575 Tyr Gln Thr Arg Ser Pro Asn Thr Gly Arg Gly Arg Ile Leu Val Pro 580 585 590 Val Ala Asn Pro Glu Thr Ala Ala Thr Leu Leu Lys Met Ala Ala Ala 595 600 605 Ile Ala Arg Asp Arg His Tyr Glu Ile Glu Cys Val Gln Val Met Leu 610 615 620 Val Ser Arg His Ser Ser Pro Ser Glu Thr Thr Val Arg Thr Ala Lys 625 630 635 640 Ser Arg Arg Leu Leu Arg Gln Ala Glu Val Leu Ala Lys Lys Trp Arg 645 650 655 Ile Pro Leu His Thr Gln Ile Arg Val Ala His Asp Pro Ala His Ala 660 665 670 Ile Leu Glu Thr Ile Lys Asp Arg His Ile Asp Leu Ile Leu Met Gly 675 680 685 Trp Lys Gly Ser Thr Ser Thr Pro Gly Arg Ile Phe Gly Asn Val Val 690 695 700 Asp Thr Ile Ile Arg Gln Ala Thr Cys Asp Val Val Leu Val Lys Leu 705 710 715 720 Gly Ser Ser Pro Phe Pro Ile Pro Asn Thr Gln Tyr Pro Ile Ser Asn 725 730 735 Pro Gln Phe Asn Arg Trp Leu Val Pro Met Ala Gly Gly Pro Asn Ala 740 745 750 Arg Ile Ala Ile Lys Leu Leu Pro Ala Leu Val Thr Leu Ser Asp Asp 755 760 765 Pro Gln Ile Arg Leu Thr Arg Val Phe Lys Pro Trp Glu Phe Arg Pro 770 775 780 Asp Met Thr Val Leu Glu Gln Ala Ile Arg Gln Leu Met Arg Arg Arg 785 790 795 800 Gln Leu Ser Ser Thr Val Ile Ala Ala Pro Val Gln Ala Asp Ser Val 805 810 815 Val Glu Gly Val Ile Lys Leu Val Glu Thr Glu Gly Tyr Asp Val Val 820 825 830 Val Leu Gly Ala Ser Arg Glu Gly Leu Leu Gln Gln Ala Ile Gln Gly 835 840 845 Asn Ile Pro Glu Ala Ile Ala Ser Gly Val Asp Ser Thr Val Ile Leu 850 855 860 Val Arg Gly Ala Ile Glu Ser 865 870 <210> 93 <211> 2592 <212> DNA <213> Nostoc azollae <400> 93 atgttagcca ggagtaaaat tttttggttg aggctttccc gtcagctggt taaaccgagg 60 cgcttggctt tcgtggaagc ttgcgtgatt ggtctagttt ctgggttagc ggcagttctg 120 ttaggacagg cagtggattg ggcaggcgca ttacgagtgc gtgtttctta ccattgtcct 180 gcctacttag tactaccgag tattggacta gtaggaggaa tcttagctgg ttggctagtc 240 gagtgctttg caccggaagc atcaggtagt ggaatgtctg aagtgaaagc agtattggct 300 cgggtaccga tgccgttaaa tctgcggatt gctttggtca agttgatcag cgctacgtta 360 gtgttgggtt cgggaatgcc tttgggacgg gaagggccaa ctgtccaaat tggggcagcc 420 ttggcaaatc aatttagtaa ctgggctccg acttcaccag agcatcgtcg ccaattgatc 480 gccgctggag cgggggcggg attagctgcg gcttttaatg cacctatcgc aggtgtgctt 540 tttgtagtgg aagaattact gcaagatgtg tcaggtatca ctcttgggac tgcgattttg 600 gcttctttca tcgcttcagt catttcccgg ctttatggta gtcacaacct tgatctgaat 660 catctaaatt taggtcttcc cgatacaact ttctttgcgc aggaaatccc attctacttg 720 attttaggag ttctggcggg gtttataggc attctattta ataaaggtat tctcgagagt 780 ctagcaatta accgccgaat ggtaaggttg agtttatcct ggcgaattgg aatcgctggg 840 ttagttagtg gtgtggtgat cgctttatta cctgctacct ttcgcgatca tgctgggttg 900 agagaaattt tgcttgcagg taatactaac tggtcatttg cagcgatcgc tcttttagtt 960 cagtttatcc taattatttt tacctacggt tctggagcgc cagggggttt actagttccc 1020 accttagtct tgggatctgc ccttggttac ttagtcggtg ctatcgaaca cagtttactg 1080 ggaatgagtg ctgcggcagt ctatgctcat gtgggtatgg ctgctttttt tagcgctgta 1140 tctaaggttc caattacggc agttgtcatt gtatttgaga tgacaacaga ttttaacctg 1200 gtactaccgc taatgattgc ttctgtggtt gcctacttag tagcagaaaa aattgaccat 1260 cgatctctct acgacctttt actagagtgg aaaggaattc atataaccaa ggagccaagc 1320 agagaggtgc ttctggcaca actcagtgcc gtagatgtaa tgcaacggcg tttggaaacc 1380 ctctctagcc agatgagtac tgatgaagcg gtacaggcat tttcccactc tcaccatcgc 1440 aacttcccag ttttagagaa tggtaaagtt gttggtattg ttactcagga agatttagtt 1500 aatattgctt cgcaaaagtt aagtggagat acaactatta gcgagattat gacaccagag 1560 ccagtgacag taactcccac agcgacactg gctcatgtac tacatatact taatcgttat 1620 catctcagct gcttgcttgt tacagaaggt cgcaagctta taggaattat tactcgtagt 1680 gatattatcc gtgtagaagc agagcgactt agtggtaata gcgaacaaat ggaacgtaaa 1740 ttagcacctt cttatgtggt ttaccaaagt cgcgctccgg ctacaggcaa aggaagattg 1800 ttagtaccgc tttcacatcc acagacagcc gagactttac tagaaatggc agttgcgatt 1860 gccaaagatc gcaattacga aatagaatcc ctacaagtga ttattgttcc gtctagccgt 1920 attccatcgg aaacaccagt acaaatcagc aaaagtcttc aacttttgca acgggcaata 1980 cttttaggag agaattcgcg gattcccgtt cacaccgaga ttcgagttgc tcataatgtt 2040 gctggggcaa ttttggagac tgtcaaggaa cgacacattg acttggtact gatgggatgg 2100 aaaggcagta catcaactcc tggtagagtt tttagccgag tcgtggatac cataattcga 2160 caggcaggtt gtgatgttat cttggctaaa ttagatgata aaagatcctt tgaccgttgg 2220 ttattgccaa tagcaggtgg acccaactcc agccaagcaa ttaagttatt acctgcgctt 2280 tcttctttaa gtaggtcatc ccaaatcaat ctatgtcaag ttttccagcc taataactct 2340 attcccgata caactttatt agataaatcc gttaactttc tgcaatgccg agttagtggt 2400 aaagtagtgg ctaccccaat tcgtgctaat tctgtttctg atgctgtcct ccagtgtgca 2460 gaacaagata agagtgatgt aattgttctg ggagctagtt gtgagagttt actacaacaa 2520 gcgattcaag gaaatattgc tgaaaatatt tctcgtaaga gtaattgtac agttatcatg 2580 gtcaaaactt aa 2592 <210> 94 <211> 863 <212> PRT <213> Nostoc azollae <400> 94 Met Leu Ala Arg Ser Lys Ile Phe Trp Leu Arg Leu Ser Arg Gln Leu 1 5 10 15 Val Lys Pro Arg Arg Leu Ala Phe Val Glu Ala Cys Val Ile Gly Leu 20 25 30 Val Ser Gly Leu Ala Ala Val Leu Leu Gly Gln Ala Val Asp Trp Ala 35 40 45 Gly Ala Leu Arg Val Arg Val Ser Tyr His Cys Pro Ala Tyr Leu Val 50 55 60 Leu Pro Ser Ile Gly Leu Val Gly Gly Ile Leu Ala Gly Trp Leu Val 65 70 75 80 Glu Cys Phe Ala Pro Glu Ala Ser Gly Ser Gly Met Ser Glu Val Lys 85 90 95 Ala Val Leu Ala Arg Val Pro Met Pro Leu Asn Leu Arg Ile Ala Leu 100 105 110 Val Lys Leu Ile Ser Ala Thr Leu Val Leu Gly Ser Gly Met Pro Leu 115 120 125 Gly Arg Glu Gly Pro Thr Val Gln Ile Gly Ala Ala Leu Ala Asn Gln 130 135 140 Phe Ser Asn Trp Ala Pro Thr Ser Pro Glu His Arg Arg Gln Leu Ile 145 150 155 160 Ala Ala Gly Ala Gly Ala Gly Leu Ala Ala Ala Phe Asn Ala Pro Ile 165 170 175 Ala Gly Val Leu Phe Val Val Glu Glu Leu Leu Gln Asp Val Ser Gly 180 185 190 Ile Thr Leu Gly Thr Ala Ile Leu Ala Ser Phe Ile Ala Ser Val Ile 195 200 205 Ser Arg Leu Tyr Gly Ser His Asn Leu Asp Leu Asn His Leu Asn Leu 210 215 220 Gly Leu Pro Asp Thr Thr Phe Phe Ala Gln Glu Ile Pro Phe Tyr Leu 225 230 235 240 Ile Leu Gly Val Leu Ala Gly Phe Ile Gly Ile Leu Phe Asn Lys Gly 245 250 255 Ile Leu Glu Ser Leu Ala Ile Asn Arg Arg Met Val Arg Leu Ser Leu 260 265 270 Ser Trp Arg Ile Gly Ile Ala Gly Leu Val Ser Gly Val Val Ile Ala 275 280 285 Leu Leu Pro Ala Thr Phe Arg Asp His Ala Gly Leu Arg Glu Ile Leu 290 295 300 Leu Ala Gly Asn Thr Asn Trp Ser Phe Ala Ala Ile Ala Leu Leu Val 305 310 315 320 Gln Phe Ile Leu Ile Ile Phe Thr Tyr Gly Ser Gly Ala Pro Gly Gly 325 330 335 Leu Leu Val Pro Thr Leu Val Leu Gly Ser Ala Leu Gly Tyr Leu Val 340 345 350 Gly Ala Ile Glu His Ser Leu Leu Gly Met Ser Ala Ala Ala Val Tyr 355 360 365 Ala His Val Gly Met Ala Ala Phe Phe Ser Ala Val Ser Lys Val Pro 370 375 380 Ile Thr Ala Val Val Ile Val Phe Glu Met Thr Thr Asp Phe Asn Leu 385 390 395 400 Val Leu Pro Leu Met Ile Ala Ser Val Val Ala Tyr Leu Val Ala Glu 405 410 415 Lys Ile Asp His Arg Ser Leu Tyr Asp Leu Leu Leu Glu Trp Lys Gly 420 425 430 Ile His Ile Thr Lys Glu Pro Ser Arg Glu Val Leu Leu Ala Gln Leu 435 440 445 Ser Ala Val Asp Val Met Gln Arg Arg Leu Glu Thr Leu Ser Ser Gln 450 455 460 Met Ser Thr Asp Glu Ala Val Gln Ala Phe Ser His Ser His His Arg 465 470 475 480 Asn Phe Pro Val Leu Glu Asn Gly Lys Val Val Gly Ile Val Thr Gln 485 490 495 Glu Asp Leu Val Asn Ile Ala Ser Gln Lys Leu Ser Gly Asp Thr Thr 500 505 510 Ile Ser Glu Ile Met Thr Pro Glu Pro Val Thr Val Thr Pro Thr Ala 515 520 525 Thr Leu Ala His Val Leu His Ile Leu Asn Arg Tyr His Leu Ser Cys 530 535 540 Leu Leu Val Thr Glu Gly Arg Lys Leu Ile Gly Ile Ile Thr Arg Ser 545 550 555 560 Asp Ile Ile Arg Val Glu Ala Glu Arg Leu Ser Gly Asn Ser Glu Gln 565 570 575 Met Glu Arg Lys Leu Ala Pro Ser Tyr Val Val Tyr Gln Ser Arg Ala 580 585 590 Pro Ala Thr Gly Lys Gly Arg Leu Leu Val Pro Leu Ser His Pro Gln 595 600 605 Thr Ala Glu Thr Leu Leu Glu Met Ala Val Ala Ile Ala Lys Asp Arg 610 615 620 Asn Tyr Glu Ile Glu Ser Leu Gln Val Ile Ile Val Pro Ser Ser Arg 625 630 635 640 Ile Pro Ser Glu Thr Pro Val Gln Ile Ser Lys Ser Leu Gln Leu Leu 645 650 655 Gln Arg Ala Ile Leu Leu Gly Glu Asn Ser Arg Ile Pro Val His Thr 660 665 670 Glu Ile Arg Val Ala His Asn Val Ala Gly Ala Ile Leu Glu Thr Val 675 680 685 Lys Glu Arg His Ile Asp Leu Val Leu Met Gly Trp Lys Gly Ser Thr 690 695 700 Ser Thr Pro Gly Arg Val Phe Ser Arg Val Val Asp Thr Ile Ile Arg 705 710 715 720 Gln Ala Gly Cys Asp Val Ile Leu Ala Lys Leu Asp Asp Lys Arg Ser 725 730 735 Phe Asp Arg Trp Leu Leu Pro Ile Ala Gly Gly Pro Asn Ser Ser Gln 740 745 750 Ala Ile Lys Leu Leu Pro Ala Leu Ser Ser Leu Ser Arg Ser Ser Gln 755 760 765 Ile Asn Leu Cys Gln Val Phe Gln Pro Asn Asn Ser Ile Pro Asp Thr 770 775 780 Thr Leu Leu Asp Lys Ser Val Asn Phe Leu Gln Cys Arg Val Ser Gly 785 790 795 800 Lys Val Val Ala Thr Pro Ile Arg Ala Asn Ser Val Ser Asp Ala Val 805 810 815 Leu Gln Cys Ala Glu Gln Asp Lys Ser Asp Val Ile Val Leu Gly Ala 820 825 830 Ser Cys Glu Ser Leu Leu Gln Gln Ala Ile Gln Gly Asn Ile Ala Glu 835 840 845 Asn Ile Ser Arg Lys Ser Asn Cys Thr Val Ile Met Val Lys Thr 850 855 860 <210> 95 <211> 2652 <212> DNA <213> Nostoc punctiforme <400> 95 tcacttgtga attgcacccc tgaccaaaat cactgtactt tctacaccag aggcgatcgc 60 ttcgggaata ttaccttgaa tcgcctgctg caacaatccc tcgcgggaag ctcccaaaac 120 tacaacatcg taaccctcgg ttttcactag gttaatcaca ccttcagcta ctgaatcagc 180 ttgcactggg atcgcaacta cagtactaga taattttcgc cgccgcatca actgacggat 240 ggcttgttct gaaattgaca tatctggctt gagttcagat ggattaaaca cctgtgtcaa 300 gcgaatttgc ggatcgtttc ccaatgtaat taaagcaggt aacaacttaa tcgctagggg 360 agaattggga ccgccagcca ttggaactag ccagcgattg aaagaatgct gagtctggag 420 tgctgtttgc ggatagctat gatttggctt gtgctgagtt ttgcccaatt ttaccaaaac 480 tacttcgcag gtggcttggc gaattatgtt gtctacaacg ctgccaaaaa tccgaccagg 540 ggtagatgtg ttacctttcc atcccattaa aattaggtcg atgtgttgtt cgttgattgt 600 ctctaaaatt gcttgggcga catcgtgggt aactcgaatc tgcgtatgca aggggatttt 660 ccactttttt gctaagactt ctgcctgtct tagcaagcgg cgactttttg ccgttcttac 720 ctgtgtttct gatggagaac tgtggcgggg tatcagcata acttgcacgc aatctatttc 780 ataatggcga tcgcgggcaa tagctgctgc catttgtaat aaaatacctg cagtatcggg 840 attagctact ggtactaata atctacctct accgatgttg ggcgatcgcg tttggtaaac 900 tatgtatgaa ggttctggtt gcagcttagg agttccattt ccacaattga gatgatctgc 960 ttccgcccga ataatatctg cacgggtaat aatcccgata agtttccgtc catttaccac 1020 tggtaagcga ctgatttgat agcgatcgag taaatacaac acattgccca gagtgtgagt 1080 cggtgttacc gtcatcggga cagttgtcat aatttctttt aagaaaatat cggctaaatt 1140 gcgatcgcga aatgtgtggt ttgtactctc gcgtattttc aacaaatctg attgcgtcac 1200 aatccctact aacttgctat cctctaccac aggaaaaccg cgatgatggg aacgagcaaa 1260 ggactgcatt gcttcttcta agctcatctc tgcatccaga gtttccactc gttcttgcat 1320 cacatctttt gcagttaact tggttaatgc tccctccatc ggaacttgtt tggtgagagt 1380 aatacctttt aactccaaaa gtttctcata aagcgaacct gatactacct tatccgcaac 1440 cagataagct gctacagaaa caatcattaa aggtagtacc agattgaaat ctgtagtcat 1500 ttcaaacaca atcacaattg ctgtgattgg cactttggaa acggcgctaa aaaatccacc 1560 catccccgct agggcgtaag tagtcggaga accaactcca gtgatatata actcagctac 1620 accgatgata tgtcctaaac aagaacccaa aatcagactg ggagcgaata acccccccgg 1680 cgctcctgaa ccaaatgcta taagtgtgag gatgaattgg gcggtaaagg cgatcgctgc 1740 tactgtagga tgggaacctc cagtaattaa ggattctcgt aaccccgtat tatcccggaa 1800 cgatggaggg agcatagcca cgacaacacc agaaataaat ccagctaaag ccactcgcaa 1860 cggtaagctg atatgtaatc ttctataaaa tttaatacta aatattaagc cgctattaaa 1920 caatgcaccc agcaaccctg ccaagatgcc taacagtacg aaaaagggaa tttctgggat 1980 agaaaattgg ctggaagatt gcgttaattg caggttaagg tcaaaagagc caccacctaa 2040 gagtcgggat atcaccccac caataaagga ggcgataatg gcagttccca gggtcaatcc 2100 tgataaatct tggagtaact cctcaacgat aaacaataca cctgcgatcg gggcattgaa 2160 agcagcagcc aaacccgcac ctgcaccggc tgcaatcatt tgccgtcgat gatctgggga 2220 agtgggaacc caacgactca tccctgctgc taaacctgcc cccacttgga cagtagggcc 2280 ttgccgtcct agagtcatgc ctgaaccaat ggcgatgata gcactgagta acttcacacc 2340 tgctacccgc caggataaat tcacaggtac attggcaaga ctagctttaa cttgcggaat 2400 accgctacca taagcctctg gtgccaatct atccaccaac catccagcta taaatcccag 2460 aacaagacca attacaggta gtaccagcca tgccggaaaa aggtgggtag tatgtactcg 2520 ccatgtcccc agccatcccg atcctacttt caggaatacc gcagataggg cagcaaccaa 2580 accgataaca caagcttcgg cgatcgctaa acctcttcta ggctgccacc aggtgcgaaa 2640 acgctgattc at 2652 <210> 96 <211> 883 <212> PRT <213> Nostoc punctiforme <400> 96 Met Asn Gln Arg Phe Arg Thr Trp Trp Gln Pro Arg Arg Gly Leu Ala 1 5 10 15 Ile Ala Glu Ala Cys Val Ile Gly Leu Val Ala Ala Leu Ser Ala Val 20 25 30 Phe Leu Lys Val Gly Ser Gly Trp Leu Gly Thr Trp Arg Val His Thr 35 40 45 Thr His Leu Phe Pro Ala Trp Leu Val Leu Pro Val Ile Gly Leu Val 50 55 60 Leu Gly Phe Ile Ala Gly Trp Leu Val Asp Arg Leu Ala Pro Glu Ala 65 70 75 80 Tyr Gly Ser Gly Ile Pro Gln Val Lys Ala Ser Leu Ala Asn Val Pro 85 90 95 Val Asn Leu Ser Trp Arg Val Ala Gly Val Lys Leu Leu Ser Ala Ile 100 105 110 Ile Ala Ile Gly Ser Gly Met Thr Leu Gly Arg Gln Gly Pro Thr Val 115 120 125 Gln Val Gly Ala Gly Leu Ala Ala Gly Met Ser Arg Trp Val Pro Thr 130 135 140 Ser Pro Asp His Arg Arg Gln Met Ile Ala Ala Gly Ala Gly Ala Gly 145 150 155 160 Leu Ala Ala Ala Phe Asn Ala Pro Ile Ala Gly Val Leu Phe Ile Val 165 170 175 Glu Glu Leu Leu Gln Asp Leu Ser Gly Leu Thr Leu Gly Thr Ala Ile 180 185 190 Ile Ala Ser Phe Ile Gly Gly Val Ile Ser Arg Leu Leu Gly Gly Gly 195 200 205 Ser Phe Asp Leu Asn Leu Gln Leu Thr Gln Ser Ser Ser Gln Phe Ser 210 215 220 Ile Pro Glu Ile Pro Phe Phe Val Leu Leu Gly Ile Leu Ala Gly Leu 225 230 235 240 Leu Gly Ala Leu Phe Asn Ser Gly Leu Ile Phe Ser Ile Lys Phe Tyr 245 250 255 Arg Arg Leu His Ile Ser Leu Pro Leu Arg Val Ala Leu Ala Gly Phe 260 265 270 Ile Ser Gly Val Val Val Ala Met Leu Pro Pro Ser Phe Arg Asp Asn 275 280 285 Thr Gly Leu Arg Glu Ser Leu Ile Thr Gly Gly Ser His Pro Thr Val 290 295 300 Ala Ala Ile Ala Phe Thr Ala Gln Phe Ile Leu Thr Leu Ile Ala Phe 305 310 315 320 Gly Ser Gly Ala Pro Gly Gly Leu Phe Ala Pro Ser Leu Ile Leu Gly 325 330 335 Ser Cys Leu Gly His Ile Ile Gly Val Ala Glu Leu Tyr Ile Thr Gly 340 345 350 Val Gly Ser Pro Thr Thr Tyr Ala Leu Ala Gly Met Gly Gly Phe Phe 355 360 365 Ser Ala Val Ser Lys Val Pro Ile Thr Ala Ile Val Ile Val Phe Glu 370 375 380 Met Thr Thr Asp Phe Asn Leu Val Leu Pro Leu Met Ile Val Ser Val 385 390 395 400 Ala Ala Tyr Leu Val Ala Asp Lys Val Val Ser Gly Ser Leu Tyr Glu 405 410 415 Lys Leu Leu Glu Leu Lys Gly Ile Thr Leu Thr Lys Gln Val Pro Met 420 425 430 Glu Gly Ala Leu Thr Lys Leu Thr Ala Lys Asp Val Met Gln Glu Arg 435 440 445 Val Glu Thr Leu Asp Ala Glu Met Ser Leu Glu Glu Ala Met Gln Ser 450 455 460 Phe Ala Arg Ser His His Arg Gly Phe Pro Val Val Glu Asp Ser Lys 465 470 475 480 Leu Val Gly Ile Val Thr Gln Ser Asp Leu Leu Lys Ile Arg Glu Ser 485 490 495 Thr Asn His Thr Phe Arg Asp Arg Asn Leu Ala Asp Ile Phe Leu Lys 500 505 510 Glu Ile Met Thr Thr Val Pro Met Thr Val Thr Pro Thr His Thr Leu 515 520 525 Gly Asn Val Leu Tyr Leu Leu Asp Arg Tyr Gln Ile Ser Arg Leu Pro 530 535 540 Val Val Asn Gly Arg Lys Leu Ile Gly Ile Ile Thr Arg Ala Asp Ile 545 550 555 560 Ile Arg Ala Glu Ala Asp His Leu Asn Cys Gly Asn Gly Thr Pro Lys 565 570 575 Leu Gln Pro Glu Pro Ser Tyr Ile Val Tyr Gln Thr Arg Ser Pro Asn 580 585 590 Ile Gly Arg Gly Arg Leu Leu Val Pro Val Ala Asn Pro Asp Thr Ala 595 600 605 Gly Ile Leu Leu Gln Met Ala Ala Ala Ile Ala Arg Asp Arg His Tyr 610 615 620 Glu Ile Asp Cys Val Gln Val Met Leu Ile Pro Arg His Ser Ser Pro 625 630 635 640 Ser Glu Thr Gln Val Arg Thr Ala Lys Ser Arg Arg Leu Leu Arg Gln 645 650 655 Ala Glu Val Leu Ala Lys Lys Trp Lys Ile Pro Leu His Thr Gln Ile 660 665 670 Arg Val Thr His Asp Val Ala Gln Ala Ile Leu Glu Thr Ile Asn Glu 675 680 685 Gln His Ile Asp Leu Ile Leu Met Gly Trp Lys Gly Asn Thr Ser Thr 690 695 700 Pro Gly Arg Ile Phe Gly Ser Val Val Asp Asn Ile Ile Arg Gln Ala 705 710 715 720 Thr Cys Glu Val Val Leu Val Lys Leu Gly Lys Thr Gln His Lys Pro 725 730 735 Asn His Ser Tyr Pro Gln Thr Ala Leu Gln Thr Gln His Ser Phe Asn 740 745 750 Arg Trp Leu Val Pro Met Ala Gly Gly Pro Asn Ser Pro Leu Ala Ile 755 760 765 Lys Leu Leu Pro Ala Leu Ile Thr Leu Gly Asn Asp Pro Gln Ile Arg 770 775 780 Leu Thr Gln Val Phe Asn Pro Ser Glu Leu Lys Pro Asp Met Ser Ile 785 790 795 800 Ser Glu Gln Ala Ile Arg Gln Leu Met Arg Arg Arg Lys Leu Ser Ser 805 810 815 Thr Val Val Ala Ile Pro Val Gln Ala Asp Ser Val Ala Glu Gly Val 820 825 830 Ile Asn Leu Val Lys Thr Glu Gly Tyr Asp Val Val Val Leu Gly Ala 835 840 845 Ser Arg Glu Gly Leu Leu Gln Gln Ala Ile Gln Gly Asn Ile Pro Glu 850 855 860 Ala Ile Ala Ser Gly Val Glu Ser Thr Val Ile Leu Val Arg Gly Ala 865 870 875 880 Ile His Lys <210> 97 <211> 2580 <212> DNA <213> Nostoc azollae <400> 97 ttaagaatta atttcccctc tgactaaaat cactgtactt tcaacaccag aagcaatagt 60 ttcgggaata ttaccttgaa ttgtctgttg taataatccc tcacgagaag cgcccaaaac 120 tacaacatca tagcgttctg tttgcactaa attaatgact ccttcacaaa cagaatttgc 180 ttgtactggt gcagcaacaa ctgtactttg taaattgcgg tgacgcatta gttgatgagt 240 ggattcttct aaaactgtta tatctggctt taattccgat ggtttaaata cctgagtgag 300 atgaatttgg gtattatttc ccaatgttac taaagccggt aataatttaa cggctttagt 360 aacattgggt cctccagcca tagggactaa ccaacggttg aaatggttag agtcagaaat 420 attaccaaat tttactaaga caacatcaca ggctgcttga cgaatgatag tatctacaac 480 attaccaaaa atacgtcctg gagtagaagt attacctttc caacccataa aaattaggtc 540 aatgtgtcgt tcattgattg tctccaaaat tgcctgggcg atatcatggg cgactcgaat 600 ctgcgtatgg atgggaatat gccatttttt tgctaaagct ttcgcttgcc tgagtaaacg 660 gcgacttttt gtggtgttga cttgggtttc ggacggggaa ctatgacggg agatgaggat 720 tatttgtaag cactctagtt cataatggcg atcgcgggca atagttgcag ccatttgtaa 780 aagagtttcg gctgtatctg gatttgcgac tgtaactaat aatctacctc taccaatgtt 840 aggcgatctc gtttggtaaa ctacataaga aggttctggt tggggtccag aaactccgtt 900 ttcacaatta agatgatctg cttcagccgg aataatatct gcgcgagtaa taatcccgac 960 caatttttgt ctttccacca ctggtaaacg actgatttga taacggtcaa gtaaataaag 1020 cacattactt agagtttgtt taggagtaac tgtgacaggc tggggtctca tgatttctct 1080 taaaggagta tcccgactca caggtatttt ctgtaaatct gattcagtaa caactcctac 1140 caatttacag ttttctacca ccggaaaacc ccgatgatga gaacgagaaa atgcttgaat 1200 aacttcatca acagacatct gtgtttctag agtttccacc cgttcttgca ttacatcttg 1260 ggctgttaat tgagttaaga ctccttctct ggttgcatct tttttgatgc catttaatag 1320 taaaagtttg tcatacagtg aaccaggtac tagctgatct gcaactaaat atgatattac 1380 agaaacaatc atcaaaggta acaccagatt gaaatcagta gtcatttcaa acacaattac 1440 aatagctgta attggtactt tagaaaccgc actaaaaaag ccccccattc cagctaaagc 1500 gtaggtagta ggacaaccta aaccccacag ttgaaactca cacactccta ccaagtgtcc 1560 taaacaagaa cctaaaatca aactgggtgc aaataatcca ccaggtgcgc cagaaccaaa 1620 ggcgattaag gttaaaataa attgagcaat caaagtaatt gcagcaaagc tgggattagg 1680 ttgactggca atcatatatt cccgtaaacc tgtattgtca cggtaatatt cagggagagc 1740 agagacaatt aaaccacaaa ataaaccagt tcgagccact cgtagtggta aacttatatg 1800 taatccgcga taagttttaa cactaaaaat taagcccaga ttaaatattg cacctagtag 1860 acctgcgaaa atacccaata gtaaaaagat cggaatttcc aacaatgaga aactactaaa 1920 atattccatt gattgcaggt ttaattgcaa acttccacca cctaacaacc gggaaattac 1980 cccaccgata aaacaggcga taatggcagt tcctaaagtt agtcctgata aatcttgcag 2040 taactcttca ataataaata atacccccgc aattggggcg ttaaaagcag ccgataaacc 2100 tgcacctgca ccggcagcaa tcatttgtcg gcgatgttct ggagaggtgg gaaaagtgcg 2160 actcattccc gctgctaaac ttgcaccgat ttgaactgtg gggccttgtc ttcctaaagt 2220 tatacccgaa cccaaggaga tgattgtgct gagtaatttt ataccttcca cccgccagga 2280 taacttgatt ggtatattgg caagactggc tttaacttga ggaataccac tacctgcggc 2340 ttctggtgct aacctttgta ccaaccaacc agctaaaaac ccaaaactca tgccaattaa 2400 cggtaaaatg agccaagcag gtacaaattg ggtactatga actcgccatg tacccaagca 2460 tcctgaacct tgtttcagta aaacagcaga taaagcagca actatgccga tcatcgaagc 2520 ttcggcatta gcatatccca ttgaccaaaa agggagacgc aagcccctag ctttagacat 2580 <210> 98 <211> 859 <212> PRT <213> Nostoc azollae <400> 98 Met Ser Lys Ala Arg Gly Leu Arg Leu Pro Phe Trp Ser Met Gly Tyr 1 5 10 15 Ala Asn Ala Glu Ala Ser Met Ile Gly Ile Val Ala Ala Leu Ser Ala 20 25 30 Val Leu Leu Lys Gln Gly Ser Gly Cys Leu Gly Thr Trp Arg Val His 35 40 45 Ser Thr Gln Phe Val Pro Ala Trp Leu Ile Leu Pro Leu Ile Gly Met 50 55 60 Ser Phe Gly Phe Leu Ala Gly Trp Leu Val Gln Arg Leu Ala Pro Glu 65 70 75 80 Ala Ala Gly Ser Gly Ile Pro Gln Val Lys Ala Ser Leu Ala Asn Ile 85 90 95 Pro Ile Lys Leu Ser Trp Arg Val Glu Gly Ile Lys Leu Leu Ser Thr 100 105 110 Ile Ile Ser Leu Gly Ser Gly Ile Thr Leu Gly Arg Gln Gly Pro Thr 115 120 125 Val Gln Ile Gly Ala Ser Leu Ala Ala Gly Met Ser Arg Thr Phe Pro 130 135 140 Thr Ser Pro Glu His Arg Arg Gln Met Ile Ala Ala Gly Ala Gly Ala 145 150 155 160 Gly Leu Ser Ala Ala Phe Asn Ala Pro Ile Ala Gly Val Leu Phe Ile 165 170 175 Ile Glu Glu Leu Leu Gln Asp Leu Ser Gly Leu Thr Leu Gly Thr Ala 180 185 190 Ile Ile Ala Cys Phe Ile Gly Gly Val Ile Ser Arg Leu Leu Gly Gly 195 200 205 Gly Ser Leu Gln Leu Asn Leu Gln Ser Met Glu Tyr Phe Ser Ser Phe 210 215 220 Ser Leu Leu Glu Ile Pro Ile Phe Leu Leu Leu Gly Ile Phe Ala Gly 225 230 235 240 Leu Leu Gly Ala Ile Phe Asn Leu Gly Leu Ile Phe Ser Val Lys Thr 245 250 255 Tyr Arg Gly Leu His Ile Ser Leu Pro Leu Arg Val Ala Arg Thr Gly 260 265 270 Leu Phe Cys Gly Leu Ile Val Ser Ala Leu Pro Glu Tyr Tyr Arg Asp 275 280 285 Asn Thr Gly Leu Arg Glu Tyr Met Ile Ala Ser Gln Pro Asn Pro Ser 290 295 300 Phe Ala Ala Ile Thr Leu Ile Ala Gln Phe Ile Leu Thr Leu Ile Ala 305 310 315 320 Phe Gly Ser Gly Ala Pro Gly Gly Leu Phe Ala Pro Ser Leu Ile Leu 325 330 335 Gly Ser Cys Leu Gly His Leu Val Gly Val Cys Glu Phe Gln Leu Trp 340 345 350 Gly Leu Gly Cys Pro Thr Thr Tyr Ala Leu Ala Gly Met Gly Gly Phe 355 360 365 Phe Ser Ala Val Ser Lys Val Pro Ile Thr Ala Ile Val Ile Val Phe 370 375 380 Glu Met Thr Thr Asp Phe Asn Leu Val Leu Pro Leu Met Ile Val Ser 385 390 395 400 Val Ile Ser Tyr Leu Val Ala Asp Gln Leu Val Pro Gly Ser Leu Tyr 405 410 415 Asp Lys Leu Leu Leu Leu Asn Gly Ile Lys Lys Asp Ala Thr Arg Glu 420 425 430 Gly Val Leu Thr Gln Leu Thr Ala Gln Asp Val Met Gln Glu Arg Val 435 440 445 Glu Thr Leu Glu Thr Gln Met Ser Val Asp Glu Val Ile Gln Ala Phe 450 455 460 Ser Arg Ser His His Arg Gly Phe Pro Val Val Glu Asn Cys Lys Leu 465 470 475 480 Val Gly Val Val Thr Glu Ser Asp Leu Gln Lys Ile Pro Val Ser Arg 485 490 495 Asp Thr Pro Leu Arg Glu Ile Met Arg Pro Gln Pro Val Thr Val Thr 500 505 510 Pro Lys Gln Thr Leu Ser Asn Val Leu Tyr Leu Leu Asp Arg Tyr Gln 515 520 525 Ile Ser Arg Leu Pro Val Val Glu Arg Gln Lys Leu Val Gly Ile Ile 530 535 540 Thr Arg Ala Asp Ile Ile Pro Ala Glu Ala Asp His Leu Asn Cys Glu 545 550 555 560 Asn Gly Val Ser Gly Pro Gln Pro Glu Pro Ser Tyr Val Val Tyr Gln 565 570 575 Thr Arg Ser Pro Asn Ile Gly Arg Gly Arg Leu Leu Val Thr Val Ala 580 585 590 Asn Pro Asp Thr Ala Glu Thr Leu Leu Gln Met Ala Ala Thr Ile Ala 595 600 605 Arg Asp Arg His Tyr Glu Leu Glu Cys Leu Gln Ile Ile Leu Ile Ser 610 615 620 Arg His Ser Ser Pro Ser Glu Thr Gln Val Asn Thr Thr Lys Ser Arg 625 630 635 640 Arg Leu Leu Arg Gln Ala Lys Ala Leu Ala Lys Lys Trp His Ile Pro 645 650 655 Ile His Thr Gln Ile Arg Val Ala His Asp Ile Ala Gln Ala Ile Leu 660 665 670 Glu Thr Ile Asn Glu Arg His Ile Asp Leu Ile Phe Met Gly Trp Lys 675 680 685 Gly Asn Thr Ser Thr Pro Gly Arg Ile Phe Gly Asn Val Val Asp Thr 690 695 700 Ile Ile Arg Gln Ala Ala Cys Asp Val Val Leu Val Lys Phe Gly Asn 705 710 715 720 Ile Ser Asp Ser Asn His Phe Asn Arg Trp Leu Val Pro Met Ala Gly 725 730 735 Gly Pro Asn Val Thr Lys Ala Val Lys Leu Leu Pro Ala Leu Val Thr 740 745 750 Leu Gly Asn Asn Thr Gln Ile His Leu Thr Gln Val Phe Lys Pro Ser 755 760 765 Glu Leu Lys Pro Asp Ile Thr Val Leu Glu Glu Ser Thr His Gln Leu 770 775 780 Met Arg His Arg Asn Leu Gln Ser Thr Val Val Ala Ala Pro Val Gln 785 790 795 800 Ala Asn Ser Val Cys Glu Gly Val Ile Asn Leu Val Gln Thr Glu Arg 805 810 815 Tyr Asp Val Val Val Leu Gly Ala Ser Arg Glu Gly Leu Leu Gln Gln 820 825 830 Thr Ile Gln Gly Asn Ile Pro Glu Thr Ile Ala Ser Gly Val Glu Ser 835 840 845 Thr Val Ile Leu Val Arg Gly Glu Ile Asn Ser 850 855 <210> 99 <211> 2703 <212> DNA <213> Lyngbya sp. <400> 99 atgttgcgaa tttctattcc cgagcaactt tcaaaacggt tcaaaataat cgcgactcaa 60 atcctacaac ctcaatctca gagacgcttg gctatcctgg aagcctgtat gattggttta 120 gtctctggat tggctgcttt ctgcttgcga gtaggagcgg gatggttagg gtcatggcga 180 atctatggtg cccttaatag tcccctaccc gtttgggtgt ttttgccgag tgtgggactg 240 attggcggct ttctcactgg atttttagtt gaacgatttg ctcccgaaac gactggaagc 300 ggagttcccc aggtaaaggc ggctttaagt ggaatgccca tttctctaga ctttcgagtc 360 gctatctcca aactactcgg aacaatgttt acgatgggtt cgggtttaac cctcggacgc 420 caagggccaa ccgttcaaat tggtgccgcc ctcgctgctt ggattgggcg ttgggtgcca 480 acttctccaa actacagccg ccaaatcatc gcttgtgggg cagccgccgg attagccgcc 540 gggtttaacg ctcccattgc aggtgtttta tttgtcgtcg aagacttact ccacgatatt 600 tctggtatta ccttggggcc tgcaattatc gcctccttta tcggggcggt ggtttctcgt 660 ctcttagaag gtcaaaaccc cgactttgaa cccccttcag ctgaagttat ggaacgttcc 720 tatcagcaat ggttaattca accgggtgaa attccctttt acatcatttt gggtattctg 780 gcgggtgtac tgggaacgct atttagtcga agcattgttt ctgccctcca atttagccgc 840 aaagcctttt cattgggact cccggtacga atggcattag cgggattttt gtgtgggtta 900 attgtttctg tcttacctgt ggaatttcgc aacaatgcag gtttgcggga atttcttctg 960 agtggggaac tcaactggac aatcaccgcc ctagcttttg ttgctcactt tgtcctgaca 1020 acaattgcgg cgagttcttc ggcacctggc ggtttatttg ccccctcgct ggttttagga 1080 gcggcgctcg gtaaattgat tgggatatgg gaatttagct taattggctt ggaaccccca 1140 acaaccttcg cctatgcggg aatgggagct ttcttttgtg cggtatctcg aacgccaatt 1200 actgccgttg tgattgtatt tgagattacc cgagatttta acttagtgtt gcaattgatg 1260 atttgttcgg ttgttgccta ctttgtcgct gataaaatcg ataaacattc cctctatgat 1320 cgcctactca aattaaacgg tattgagtta aaagaagatc aacttgatcg cgaagcgttg 1380 agtaaattac tcgccagaga tgtcatgcaa cgtcaggtgg aaaccttatc gagtcagtta 1440 ccgcttttac aagttagaca ggagttttct cgctcccaac atcgagggtt tccggttgta 1500 gaaaatggca aactggtggg gatagttacc caaagagatt tgagtaatgt tagtcagcaa 1560 aatttgcccg aggatacgcc tttacacaag tttatgactt ccaaaccgat tgcggtgact 1620 ccggatgaaa ctcttactca agttctctat ttacttggta aatataaacc tagtcgttta 1680 cctgttgttg aaggtcgtca tctggttggg attattaccc gcagtgatat tattaaagcg 1740 gagttgggca ttcttagcgg tgaagataca caagtcgggt tgcatccaga accttcctat 1800 gttgtctatc aaacccgagc gcctcaagtt ggtcaaggac ggatgttggt ttcccttcat 1860 aaccccaaaa ctgctccctc tctgttggaa attgccgcag cgatcgctcg ggaacgaaat 1920 tatgagatag aatgcttaaa cgtgattacg atacctcgtc accgttcgcc gagtgaaacg 1980 cctgttcgac tcactaaaag tcggcgtttg atgcgacaag ctgaacaaat ggggcgggct 2040 tggaaaattc ccttacatac tcaagttcgg gtgacaaatg atgttgctca agcgattctt 2100 gaaacgacaa aagagcgaca tattgatctg attttgatgg gttggcaagg taaatcttcg 2160 actagcgatc gcgtttttgg taatgtcgta gatatgatta ttcgagcctg tgagtgtgaa 2220 atggttttgg tcaaatggcc gcaaatggtt gatccttttg gttcaaaacg gaagttgcgc 2280 ttacattctc ttttaggttg gcaacggtgg ttagttccga ttcgggatga tgctaaaaag 2340 tcggttgcgg ttcaactttt accagcttta acacacttga gtcatcaagc cgaaattcgt 2400 ttgttaaaag tgatgaataa agaggtttct gtttcggaaa aacgggcttg ggagcatact 2460 tcccaggagt taagttcttt attgaattct aaagtgagaa tcacggcggt gacttctgag 2520 tttgttccgg atgcggtgat tgattttgct tatcaagaac attgtgatgt tgtggttttg 2580 ggggcgagtc gtgaaggaat gctgaaacaa gtgattcaag gaaatattcc cgaagcgatc 2640 gctcgtcatt gtgattgtac tgtgattttg gttcgtcccg caatcggtca tgcagccgat 2700 taa 2703 <210> 100 <211> 900 <212> PRT <213> Lyngbya sp. <400> 100 Met Leu Arg Ile Ser Ile Pro Glu Gln Leu Ser Lys Arg Phe Lys Ile 1 5 10 15 Ile Ala Thr Gln Ile Leu Gln Pro Gln Ser Gln Arg Arg Leu Ala Ile 20 25 30 Leu Glu Ala Cys Met Ile Gly Leu Val Ser Gly Leu Ala Ala Phe Cys 35 40 45 Leu Arg Val Gly Ala Gly Trp Leu Gly Ser Trp Arg Ile Tyr Gly Ala 50 55 60 Leu Asn Ser Pro Leu Pro Val Trp Val Phe Leu Pro Ser Val Gly Leu 65 70 75 80 Ile Gly Gly Phe Leu Thr Gly Phe Leu Val Glu Arg Phe Ala Pro Glu 85 90 95 Thr Thr Gly Ser Gly Val Pro Gln Val Lys Ala Ala Leu Ser Gly Met 100 105 110 Pro Ile Ser Leu Asp Phe Arg Val Ala Ile Ser Lys Leu Leu Gly Thr 115 120 125 Met Phe Thr Met Gly Ser Gly Leu Thr Leu Gly Arg Gln Gly Pro Thr 130 135 140 Val Gln Ile Gly Ala Ala Leu Ala Ala Trp Ile Gly Arg Trp Val Pro 145 150 155 160 Thr Ser Pro Asn Tyr Ser Arg Gln Ile Ile Ala Cys Gly Ala Ala Ala 165 170 175 Gly Leu Ala Ala Gly Phe Asn Ala Pro Ile Ala Gly Val Leu Phe Val 180 185 190 Val Glu Asp Leu Leu His Asp Ile Ser Gly Ile Thr Leu Gly Pro Ala 195 200 205 Ile Ile Ala Ser Phe Ile Gly Ala Val Val Ser Arg Leu Leu Glu Gly 210 215 220 Gln Asn Pro Asp Phe Glu Pro Pro Ser Ala Glu Val Met Glu Arg Ser 225 230 235 240 Tyr Gln Gln Trp Leu Ile Gln Pro Gly Glu Ile Pro Phe Tyr Ile Ile 245 250 255 Leu Gly Ile Leu Ala Gly Val Leu Gly Thr Leu Phe Ser Arg Ser Ile 260 265 270 Val Ser Ala Leu Gln Phe Ser Arg Lys Ala Phe Ser Leu Gly Leu Pro 275 280 285 Val Arg Met Ala Leu Ala Gly Phe Leu Cys Gly Leu Ile Val Ser Val 290 295 300 Leu Pro Val Glu Phe Arg Asn Asn Ala Gly Leu Arg Glu Phe Leu Leu 305 310 315 320 Ser Gly Glu Leu Asn Trp Thr Ile Thr Ala Leu Ala Phe Val Ala His 325 330 335 Phe Val Leu Thr Thr Ile Ala Ala Ser Ser Ser Ala Pro Gly Gly Leu 340 345 350 Phe Ala Pro Ser Leu Val Leu Gly Ala Ala Leu Gly Lys Leu Ile Gly 355 360 365 Ile Trp Glu Phe Ser Leu Ile Gly Leu Glu Pro Pro Thr Thr Phe Ala 370 375 380 Tyr Ala Gly Met Gly Ala Phe Phe Cys Ala Val Ser Arg Thr Pro Ile 385 390 395 400 Thr Ala Val Val Ile Val Phe Glu Ile Thr Arg Asp Phe Asn Leu Val 405 410 415 Leu Gln Leu Met Ile Cys Ser Val Val Ala Tyr Phe Val Ala Asp Lys 420 425 430 Ile Asp Lys His Ser Leu Tyr Asp Arg Leu Leu Lys Leu Asn Gly Ile 435 440 445 Glu Leu Lys Glu Asp Gln Leu Asp Arg Glu Ala Leu Ser Lys Leu Leu 450 455 460 Ala Arg Asp Val Met Gln Arg Gln Val Glu Thr Leu Ser Ser Gln Leu 465 470 475 480 Pro Leu Leu Gln Val Arg Gln Glu Phe Ser Arg Ser Gln His Arg Gly 485 490 495 Phe Pro Val Val Glu Asn Gly Lys Leu Val Gly Ile Val Thr Gln Arg 500 505 510 Asp Leu Ser Asn Val Ser Gln Gln Asn Leu Pro Glu Asp Thr Pro Leu 515 520 525 His Lys Phe Met Thr Ser Lys Pro Ile Ala Val Thr Pro Asp Glu Thr 530 535 540 Leu Thr Gln Val Leu Tyr Leu Leu Gly Lys Tyr Lys Pro Ser Arg Leu 545 550 555 560 Pro Val Val Glu Gly Arg His Leu Val Gly Ile Ile Thr Arg Ser Asp 565 570 575 Ile Ile Lys Ala Glu Leu Gly Ile Leu Ser Gly Glu Asp Thr Gln Val 580 585 590 Gly Leu His Pro Glu Pro Ser Tyr Val Val Tyr Gln Thr Arg Ala Pro 595 600 605 Gln Val Gly Gln Gly Arg Met Leu Val Ser Leu His Asn Pro Lys Thr 610 615 620 Ala Pro Ser Leu Leu Glu Ile Ala Ala Ala Ile Ala Arg Glu Arg Asn 625 630 635 640 Tyr Glu Ile Glu Cys Leu Asn Val Ile Thr Ile Pro Arg His Arg Ser 645 650 655 Pro Ser Glu Thr Pro Val Arg Leu Thr Lys Ser Arg Arg Leu Met Arg 660 665 670 Gln Ala Glu Gln Met Gly Arg Ala Trp Lys Ile Pro Leu His Thr Gln 675 680 685 Val Arg Val Thr Asn Asp Val Ala Gln Ala Ile Leu Glu Thr Thr Lys 690 695 700 Glu Arg His Ile Asp Leu Ile Leu Met Gly Trp Gln Gly Lys Ser Ser 705 710 715 720 Thr Ser Asp Arg Val Phe Gly Asn Val Val Asp Met Ile Ile Arg Ala 725 730 735 Cys Glu Cys Glu Met Val Leu Val Lys Trp Pro Gln Met Val Asp Pro 740 745 750 Phe Gly Ser Lys Arg Lys Leu Arg Leu His Ser Leu Leu Gly Trp Gln 755 760 765 Arg Trp Leu Val Pro Ile Arg Asp Asp Ala Lys Lys Ser Val Ala Val 770 775 780 Gln Leu Leu Pro Ala Leu Thr His Leu Ser His Gln Ala Glu Ile Arg 785 790 795 800 Leu Leu Lys Val Met Asn Lys Glu Val Ser Val Ser Glu Lys Arg Ala 805 810 815 Trp Glu His Thr Ser Gln Glu Leu Ser Ser Leu Leu Asn Ser Lys Val 820 825 830 Arg Ile Thr Ala Val Thr Ser Glu Phe Val Pro Asp Ala Val Ile Asp 835 840 845 Phe Ala Tyr Gln Glu His Cys Asp Val Val Val Leu Gly Ala Ser Arg 850 855 860 Glu Gly Met Leu Lys Gln Val Ile Gln Gly Asn Ile Pro Glu Ala Ile 865 870 875 880 Ala Arg His Cys Asp Cys Thr Val Ile Leu Val Arg Pro Ala Ile Gly 885 890 895 His Ala Ala Asp 900 <210> 101 <211> 2592 <212> DNA <213> Cyanothece sp. <400> 101 atgggatcac ttgcggcact gcggcggtta caacagttgc tccgaccgag gcgggtggcg 60 gttctggaag cttgcttcat tgggctggta tctgcactgg cggcgggggg aatggcctgg 120 ggcgtgggct ggatgggaac ctggcgggtg aatctggcgg aacaatggcc ggactggctt 180 gttcttcccc tgtttggggc gatcggggcc ttgctctccg gggcactggt cttacgagaa 240 gctccagaag ccgctggcag tggtatgtct caggtcaaag cagtgctggc cagagttccc 300 atgcccctca acctgcggat tgccctggtt aaactgatca gtgcggtgct ggcgcttggg 360 tcgggtctgg ccctgggcag ggaagggcca accgtgcagg tgggagctgc tttagctgca 420 caattaagcc actggttacc cacctcgcct gaacaccgcc gtcagctcat tgccgctgga 480 gccggagctg gtttagctgc agcctttaat gcgcccattt ccggggtgtt gtttgtggca 540 gaagaactga tgcaggatgt ttccggtggc accctgggca cagccattct ggcctccttt 600 attggcagta gtgtctctcg tttgctggga ggtaacagtc tggatgtgaa tctggaagcc 660 agcaaaatgc tcaccagctt tacgctgacg gaaattcctg cctatctggt actgggggga 720 ttggctgggc tactgggggc tatttttgat cacgccgttc tgatcagtct caaattgaat 780 cggcgttatc ttcccctgag tttgccttgg cgcatggccc tggccggact gatcaccggg 840 ttgctgattg cccttttgcc ggagtcgttt cgcaactatg ccgaactgaa ggaagccctg 900 ttgtcaggac aaattacctg ggctggggca gcgctctttt ttgtgagcta ctttcccctg 960 atcctgattg cctctggttc cggggcccct ggtgggctgc tcgttcccac cctgttgttg 1020 ggagcaatgc tgggctgctg gctgggggga atgcaacaca gctttttagg tctgggagta 1080 gccgtaagct atgcgcgggt ggggatgggt gcatttatgg ctgctacggc aaaagcaccc 1140 gtgacggcca tcgtcattgt ctttgaacta acccatgact ttaacctggt cttacccctg 1200 atgattgcct ccgtgatcgc ctacctggtc tcggaacgcc tcttccccgg ttccttctac 1260 gacagaattc tagagctgaa tggcatttat ctgaatgagc tcaccaccgt taataccagc 1320 ctggcagaca tgaccgccgc ccaggtgatg caacggcagg tggaaaccct tcgcagtgat 1380 atgcccctag aagaagccgt tcaagccttt tcccgttccc atcaccgtgg ctttcccgtt 1440 ctggaggagg acaaattggt gggaattgtc acccagactg atctaaacac gatcaagcag 1500 cggccgttac cccccaacac ccccctgcag cagatcatga ccccctggcc aatcaccatt 1560 cccccccagg aatccttggc taatgtgctc tatctgctca accgctacaa tctcagccgt 1620 ctccccgtgg tggaaggccg taaactgatc ggcattatta cccgaagcga tattattcga 1680 gcggaagcct ctgaactaag tggggaacga caacaattag ccccccgcgt gcaaccctcc 1740 tacctggtct atcaaacccg ctgcactgct agtggacagg gacggctgct ccttcccctg 1800 gctaatccgg ccaccgccga tcgcttactt cagatgggct tagcgatcgc ccgtgaacgc 1860 cagttagagc tggagtgcct gcaggtgatt gtggtacccc gccacagtga tcccagcact 1920 accccagtcc gcactaccct caatcggcgg ttattgcaac ggatggaacg tctagcccgc 1980 ccagactccg ttccattaca tacccagatc cgggtcgctc aggatgtggc cggggccatt 2040 ctggaaacca ttagcgatcg ccacattgat gtggtgctga tgggctggga aggggaaagc 2100 ctgaccccag gcagcatctt tggctctgtc gtggatacga tcgttcacca ggctgagtgt 2160 gatgtagttc tggtcaaact ggcacaggag aacgtgcggt tcgatcgctg gctcgttccg 2220 atcgccgggg ggccaaatgt ccaacgggcc atgcaactgt tgcccggact cacccgtctc 2280 agcccagctc cccaggtgag gctctgccag gtgtttgacc cggaggcaac cctactggat 2340 acccaggcgc tggaacaggg aatggcatta ctcaaacctc acctgaatgg ggccctcagt 2400 agtctttccc tgcgctctaa atccattgct gaagccatta ttgagctagc ccacgccgaa 2460 caggacgatg tcatcctggt gggagccagc cgggaaggat tactccgtca ggcaattatg 2520 ggcaatattc cctccgcgat cacccgtaat agccattgca gcgtgatcct ggtgcgggga 2580 gcattggagt aa 2592 <210> 102 <211> 863 <212> PRT <213> Cyanothece sp. <400> 102 Met Gly Ser Leu Ala Ala Leu Arg Arg Leu Gln Gln Leu Leu Arg Pro 1 5 10 15 Arg Arg Val Ala Val Leu Glu Ala Cys Phe Ile Gly Leu Val Ser Ala 20 25 30 Leu Ala Ala Gly Gly Met Ala Trp Gly Val Gly Trp Met Gly Thr Trp 35 40 45 Arg Val Asn Leu Ala Glu Gln Trp Pro Asp Trp Leu Val Leu Pro Leu 50 55 60 Phe Gly Ala Ile Gly Ala Leu Leu Ser Gly Ala Leu Val Leu Arg Glu 65 70 75 80 Ala Pro Glu Ala Ala Gly Ser Gly Met Ser Gln Val Lys Ala Val Leu 85 90 95 Ala Arg Val Pro Met Pro Leu Asn Leu Arg Ile Ala Leu Val Lys Leu 100 105 110 Ile Ser Ala Val Leu Ala Leu Gly Ser Gly Leu Ala Leu Gly Arg Glu 115 120 125 Gly Pro Thr Val Gln Val Gly Ala Ala Leu Ala Ala Gln Leu Ser His 130 135 140 Trp Leu Pro Thr Ser Pro Glu His Arg Arg Gln Leu Ile Ala Ala Gly 145 150 155 160 Ala Gly Ala Gly Leu Ala Ala Ala Phe Asn Ala Pro Ile Ser Gly Val 165 170 175 Leu Phe Val Ala Glu Glu Leu Met Gln Asp Val Ser Gly Gly Thr Leu 180 185 190 Gly Thr Ala Ile Leu Ala Ser Phe Ile Gly Ser Ser Val Ser Arg Leu 195 200 205 Leu Gly Gly Asn Ser Leu Asp Val Asn Leu Glu Ala Ser Lys Met Leu 210 215 220 Thr Ser Phe Thr Leu Thr Glu Ile Pro Ala Tyr Leu Val Leu Gly Gly 225 230 235 240 Leu Ala Gly Leu Leu Gly Ala Ile Phe Asp His Ala Val Leu Ile Ser 245 250 255 Leu Lys Leu Asn Arg Arg Tyr Leu Pro Leu Ser Leu Pro Trp Arg Met 260 265 270 Ala Leu Ala Gly Leu Ile Thr Gly Leu Leu Ile Ala Leu Leu Pro Glu 275 280 285 Ser Phe Arg Asn Tyr Ala Glu Leu Lys Glu Ala Leu Leu Ser Gly Gln 290 295 300 Ile Thr Trp Ala Gly Ala Ala Leu Phe Phe Val Ser Tyr Phe Pro Leu 305 310 315 320 Ile Leu Ile Ala Ser Gly Ser Gly Ala Pro Gly Gly Leu Leu Val Pro 325 330 335 Thr Leu Leu Leu Gly Ala Met Leu Gly Cys Trp Leu Gly Gly Met Gln 340 345 350 His Ser Phe Leu Gly Leu Gly Val Ala Val Ser Tyr Ala Arg Val Gly 355 360 365 Met Gly Ala Phe Met Ala Ala Thr Ala Lys Ala Pro Val Thr Ala Ile 370 375 380 Val Ile Val Phe Glu Leu Thr His Asp Phe Asn Leu Val Leu Pro Leu 385 390 395 400 Met Ile Ala Ser Val Ile Ala Tyr Leu Val Ser Glu Arg Leu Phe Pro 405 410 415 Gly Ser Phe Tyr Asp Arg Ile Leu Glu Leu Asn Gly Ile Tyr Leu Asn 420 425 430 Glu Leu Thr Thr Val Asn Thr Ser Leu Ala Asp Met Thr Ala Ala Gln 435 440 445 Val Met Gln Arg Gln Val Glu Thr Leu Arg Ser Asp Met Pro Leu Glu 450 455 460 Glu Ala Val Gln Ala Phe Ser Arg Ser His His Arg Gly Phe Pro Val 465 470 475 480 Leu Glu Glu Asp Lys Leu Val Gly Ile Val Thr Gln Thr Asp Leu Asn 485 490 495 Thr Ile Lys Gln Arg Pro Leu Pro Pro Asn Thr Pro Leu Gln Gln Ile 500 505 510 Met Thr Pro Trp Pro Ile Thr Ile Pro Pro Gln Glu Ser Leu Ala Asn 515 520 525 Val Leu Tyr Leu Leu Asn Arg Tyr Asn Leu Ser Arg Leu Pro Val Val 530 535 540 Glu Gly Arg Lys Leu Ile Gly Ile Ile Thr Arg Ser Asp Ile Ile Arg 545 550 555 560 Ala Glu Ala Ser Glu Leu Ser Gly Glu Arg Gln Gln Leu Ala Pro Arg 565 570 575 Val Gln Pro Ser Tyr Leu Val Tyr Gln Thr Arg Cys Thr Ala Ser Gly 580 585 590 Gln Gly Arg Leu Leu Leu Pro Leu Ala Asn Pro Ala Thr Ala Asp Arg 595 600 605 Leu Leu Gln Met Gly Leu Ala Ile Ala Arg Glu Arg Gln Leu Glu Leu 610 615 620 Glu Cys Leu Gln Val Ile Val Val Pro Arg His Ser Asp Pro Ser Thr 625 630 635 640 Thr Pro Val Arg Thr Thr Leu Asn Arg Arg Leu Leu Gln Arg Met Glu 645 650 655 Arg Leu Ala Arg Pro Asp Ser Val Pro Leu His Thr Gln Ile Arg Val 660 665 670 Ala Gln Asp Val Ala Gly Ala Ile Leu Glu Thr Ile Ser Asp Arg His 675 680 685 Ile Asp Val Val Leu Met Gly Trp Glu Gly Glu Ser Leu Thr Pro Gly 690 695 700 Ser Ile Phe Gly Ser Val Val Asp Thr Ile Val His Gln Ala Glu Cys 705 710 715 720 Asp Val Val Leu Val Lys Leu Ala Gln Glu Asn Val Arg Phe Asp Arg 725 730 735 Trp Leu Val Pro Ile Ala Gly Gly Pro Asn Val Gln Arg Ala Met Gln 740 745 750 Leu Leu Pro Gly Leu Thr Arg Leu Ser Pro Ala Pro Gln Val Arg Leu 755 760 765 Cys Gln Val Phe Asp Pro Glu Ala Thr Leu Leu Asp Thr Gln Ala Leu 770 775 780 Glu Gln Gly Met Ala Leu Leu Lys Pro His Leu Asn Gly Ala Leu Ser 785 790 795 800 Ser Leu Ser Leu Arg Ser Lys Ser Ile Ala Glu Ala Ile Ile Glu Leu 805 810 815 Ala His Ala Glu Gln Asp Asp Val Ile Leu Val Gly Ala Ser Arg Glu 820 825 830 Gly Leu Leu Arg Gln Ala Ile Met Gly Asn Ile Pro Ser Ala Ile Thr 835 840 845 Arg Asn Ser His Cys Ser Val Ile Leu Val Arg Gly Ala Leu Glu 850 855 860 <210> 103 <211> 2577 <212> DNA <213> Gloeobacter violaceus <400> 103 atgcaatcct ggctgcagaa ttttcggcaa ctgctccgtc cccagcgcct cgcgacgctg 60 gaagcgtgcc tgatcggtct ggtggcgggg ctcgcggcgg tcatcctcaa gcagggcgcc 120 gacctcctca gccactggcg cctcgacgct gcgggatcat tcggctggtg ggtgttgccg 180 ctgctcgggc ttttgggggg agtgacggcc ggctggttgg tggagcgctt cgctccggaa 240 gcttccggca gcggcatccc ccaggtcaag gcggtgcttg cccgcgtgcc gatggcgctc 300 gatctgcgcg tcgccctcgt caaactggtg ggcacgatgg tgacgctggg ttcagggttt 360 ccgctcgggc gcgaaggccc gaccattcag atcggcgcgg cgctggccaa ccagctcagc 420 cgctgggtgc ccacttcccc cgcttaccgc cgccagttgg tggccgccgg ggcgggagcg 480 ggattggccg ccgccttcga cgccccgatc gccggggtga tctttgttgt cgagcaactg 540 ctgcagaacg tttcgggcct caccctgggg gtggccatcc tcgcctcgtt tatcggcgcg 600 gtgctctcgc gggtcctggg gggcttcagc ttcgacctca aatcgagcat ggccgatttt 660 cagaccggtt ttacggttca ggagatcccg ttctatctgt tgctcggggt gatggcgggg 720 gtgctcggag cgctctacaa ccgggggcta atcgcgagcc ttacctttaa ccggcgggtg 780 ctgcgtctga acatgccttt gcgggtgggc cttgccggac tggttatggg cgggagcctg 840 gcgctgctac ctgcggtctt tcgcgacggc gaagcgttgc gcgggctgat tatcggcgcg 900 caggaaccct ggcagttcgc cgccctcgcc ttcgtggccc agtttgtgct gacactcatc 960 gcctatggct ccggggcacc gggcggcgtg ttcgccccct cgctggtgct gggggctgcc 1020 ctgggttcgc tggtgggcac gctctcctac agcaccctgg ccgtcaacgc gcccatcacc 1080 tactcgctgg tcgggatggg ggcatttttc tgtgcggtga cccgcgtgcc gattacggcg 1140 gtgatcatta ttttcgagat caccaacgac ttcaacctgg tgctgccctt gatggtcgtc 1200 tgcgtggtcg cttcgctggt ggctgagcgc ctcaacgaag gctcgatcta cgaccaactt 1260 ttggcctgga acggcatccg tctgggcgag gaggcggtga gcgacgagaa gctgctcgct 1320 caactggcgg cgggcgatgt catgcagacg cgcctggaga cgctggagag cacgcttccc 1380 ctcagcgaag tgtcccaggc gttttcgcgc tcgcaccacc ggggctttcc ggtggtcaag 1440 gacgagaagc tggtggggat cgtcacccag accgatctga tgaagatcgc ggcgcgcaat 1500 ctgccgccca ccgccccgct cagcgaactg atgacgccgc agccggtcac cgtcactccc 1560 cgcgacagcc tcaaagaggt gctctatttg ctcaatcgct acgaattgag ccgcctgccg 1620 gtggtcgagg aggccaagct ggtagggatc atcacccgca gcgacatcat ccgcgccgag 1680 gcggatttgc tcagtggcga cacccaggcg gtgggtccgc gccccgaccc gtcctacgtg 1740 gtctaccaga cccgcgctcc ggccttggga ggcggtcgcc tgctgttgcc cctggccaat 1800 ccggacaccg ccccggcgct tttggaattt gccctggcca tcgcccgcgc gcgcaacctc 1860 gaactggagt gtctgcacgt catcgccgta ccccgcacca gcgcaccctc cagcaccccg 1920 gtggcagtgg ccccggcagt caacctcgtg cgccaggccg tgcgcgccgg tcgcgccgtc 1980 ggggtgccgg tacacaccca ggtgcgcgtc gcccacgata tcgcccaggc ggtgctcgaa 2040 acggtcaaag agcggcgcat cggcctggtg ctgatgggtt ggcggggggt gaacacctcc 2100 ccggagcgca tcttcagcaa caccgtggac acgatcatcc gccaggcgcc atgcgaggtg 2160 ctcctggtca agctcaaagg cgacgcgatc ccgcgccgct ggctggtgcc catcggcggc 2220 ggccccaacg cccaggaggc cattaagatt ctgcccgcct tattgcgccg cggccccggc 2280 aagagcgaga tcgccgtctg ccaggtcttc gcccccgaca atccggccca cgacacaggt 2340 ctactcgatg cggacgccga gagcctcggc cgctcgttgg gctaccccgt gcgcgccttg 2400 cctttgttct caaaatccgt tgctcaggcc atcgttcagt gcacctccga aggccacttc 2460 gacggggtga ttattggtgc gagccgcgag agcctgctgc gccaggccat ccggggcaac 2520 atccccgaaa ccgtcgccaa gggcagcgac tgcacggtgg tcgtggtgcg cacttag 2577 <210> 104 <211> 858 <212> PRT <213> Gloeobacter violaceus <400> 104 Met Gln Ser Trp Leu Gln Asn Phe Arg Gln Leu Leu Arg Pro Gln Arg 1 5 10 15 Leu Ala Thr Leu Glu Ala Cys Leu Ile Gly Leu Val Ala Gly Leu Ala 20 25 30 Ala Val Ile Leu Lys Gln Gly Ala Asp Leu Leu Ser His Trp Arg Leu 35 40 45 Asp Ala Ala Gly Ser Phe Gly Trp Trp Val Leu Pro Leu Leu Gly Leu 50 55 60 Leu Gly Gly Val Thr Ala Gly Trp Leu Val Glu Arg Phe Ala Pro Glu 65 70 75 80 Ala Ser Gly Ser Gly Ile Pro Gln Val Lys Ala Val Leu Ala Arg Val 85 90 95 Pro Met Ala Leu Asp Leu Arg Val Ala Leu Val Lys Leu Val Gly Thr 100 105 110 Met Val Thr Leu Gly Ser Gly Phe Pro Leu Gly Arg Glu Gly Pro Thr 115 120 125 Ile Gln Ile Gly Ala Ala Leu Ala Asn Gln Leu Ser Arg Trp Val Pro 130 135 140 Thr Ser Pro Ala Tyr Arg Arg Gln Leu Val Ala Ala Gly Ala Gly Ala 145 150 155 160 Gly Leu Ala Ala Ala Phe Asp Ala Pro Ile Ala Gly Val Ile Phe Val 165 170 175 Val Glu Gln Leu Leu Gln Asn Val Ser Gly Leu Thr Leu Gly Val Ala 180 185 190 Ile Leu Ala Ser Phe Ile Gly Ala Val Leu Ser Arg Val Leu Gly Gly 195 200 205 Phe Ser Phe Asp Leu Lys Ser Ser Met Ala Asp Phe Gln Thr Gly Phe 210 215 220 Thr Val Gln Glu Ile Pro Phe Tyr Leu Leu Leu Gly Val Met Ala Gly 225 230 235 240 Val Leu Gly Ala Leu Tyr Asn Arg Gly Leu Ile Ala Ser Leu Thr Phe 245 250 255 Asn Arg Arg Val Leu Arg Leu Asn Met Pro Leu Arg Val Gly Leu Ala 260 265 270 Gly Leu Val Met Gly Gly Ser Leu Ala Leu Leu Pro Ala Val Phe Arg 275 280 285 Asp Gly Glu Ala Leu Arg Gly Leu Ile Ile Gly Ala Gln Glu Pro Trp 290 295 300 Gln Phe Ala Ala Leu Ala Phe Val Ala Gln Phe Val Leu Thr Leu Ile 305 310 315 320 Ala Tyr Gly Ser Gly Ala Pro Gly Gly Val Phe Ala Pro Ser Leu Val 325 330 335 Leu Gly Ala Ala Leu Gly Ser Leu Val Gly Thr Leu Ser Tyr Ser Thr 340 345 350 Leu Ala Val Asn Ala Pro Ile Thr Tyr Ser Leu Val Gly Met Gly Ala 355 360 365 Phe Phe Cys Ala Val Thr Arg Val Pro Ile Thr Ala Val Ile Ile Ile 370 375 380 Phe Glu Ile Thr Asn Asp Phe Asn Leu Val Leu Pro Leu Met Val Val 385 390 395 400 Cys Val Val Ala Ser Leu Val Ala Glu Arg Leu Asn Glu Gly Ser Ile 405 410 415 Tyr Asp Gln Leu Leu Ala Trp Asn Gly Ile Arg Leu Gly Glu Glu Ala 420 425 430 Val Ser Asp Glu Lys Leu Leu Ala Gln Leu Ala Ala Gly Asp Val Met 435 440 445 Gln Thr Arg Leu Glu Thr Leu Glu Ser Thr Leu Pro Leu Ser Glu Val 450 455 460 Ser Gln Ala Phe Ser Arg Ser His His Arg Gly Phe Pro Val Val Lys 465 470 475 480 Asp Glu Lys Leu Val Gly Ile Val Thr Gln Thr Asp Leu Met Lys Ile 485 490 495 Ala Ala Arg Asn Leu Pro Pro Thr Ala Pro Leu Ser Glu Leu Met Thr 500 505 510 Pro Gln Pro Val Thr Val Thr Pro Arg Asp Ser Leu Lys Glu Val Leu 515 520 525 Tyr Leu Leu Asn Arg Tyr Glu Leu Ser Arg Leu Pro Val Val Glu Glu 530 535 540 Ala Lys Leu Val Gly Ile Ile Thr Arg Ser Asp Ile Ile Arg Ala Glu 545 550 555 560 Ala Asp Leu Leu Ser Gly Asp Thr Gln Ala Val Gly Pro Arg Pro Asp 565 570 575 Pro Ser Tyr Val Val Tyr Gln Thr Arg Ala Pro Ala Leu Gly Gly Gly 580 585 590 Arg Leu Leu Leu Pro Leu Ala Asn Pro Asp Thr Ala Pro Ala Leu Leu 595 600 605 Glu Phe Ala Leu Ala Ile Ala Arg Ala Arg Asn Leu Glu Leu Glu Cys 610 615 620 Leu His Val Ile Ala Val Pro Arg Thr Ser Ala Pro Ser Ser Thr Pro 625 630 635 640 Val Ala Val Ala Pro Ala Val Asn Leu Val Arg Gln Ala Val Arg Ala 645 650 655 Gly Arg Ala Val Gly Val Pro Val His Thr Gln Val Arg Val Ala His 660 665 670 Asp Ile Ala Gln Ala Val Leu Glu Thr Val Lys Glu Arg Arg Ile Gly 675 680 685 Leu Val Leu Met Gly Trp Arg Gly Val Asn Thr Ser Pro Glu Arg Ile 690 695 700 Phe Ser Asn Thr Val Asp Thr Ile Ile Arg Gln Ala Pro Cys Glu Val 705 710 715 720 Leu Leu Val Lys Leu Lys Gly Asp Ala Ile Pro Arg Arg Trp Leu Val 725 730 735 Pro Ile Gly Gly Gly Pro Asn Ala Gln Glu Ala Ile Lys Ile Leu Pro 740 745 750 Ala Leu Leu Arg Arg Gly Pro Gly Lys Ser Glu Ile Ala Val Cys Gln 755 760 765 Val Phe Ala Pro Asp Asn Pro Ala His Asp Thr Gly Leu Leu Asp Ala 770 775 780 Asp Ala Glu Ser Leu Gly Arg Ser Leu Gly Tyr Pro Val Arg Ala Leu 785 790 795 800 Pro Leu Phe Ser Lys Ser Val Ala Gln Ala Ile Val Gln Cys Thr Ser 805 810 815 Glu Gly His Phe Asp Gly Val Ile Ile Gly Ala Ser Arg Glu Ser Leu 820 825 830 Leu Arg Gln Ala Ile Arg Gly Asn Ile Pro Glu Thr Val Ala Lys Gly 835 840 845 Ser Asp Cys Thr Val Val Val Val Arg Thr 850 855 <210> 105 <211> 2673 <212> DNA <213> Arthrospira maxima CS-328 ctg36, whole genome shotgun sequence <400> 105 tcaattcata ataggtgggc gtaccaaaat gacagtacaa ggacaaccac gggcgatcgc 60 ttcggggata ttacccttaa tcgcctgttg cagcatactt tcgccactag cacccaaaac 120 aatcacatca cagtaatcat gattagcaat atccaaaagt acatcaacca cagacctagc 180 acaaacagca gttgccacca cctccccatt aatggggctt ttcaactcct caactaggtg 240 gtctagcttt gccatttccg cctcagacaa agcattttta accacagtta acagtcggat 300 atcggggcgc aaactcaacc tagccaaacc gggtaaaatg cccattgcgg ctggtggagg 360 tcccccagtt cgcagaggaa ctaaccaacg tcgccaaacc ggaaactgga gcgatcgctg 420 atctgagggg tcactaaaaa tggggttaac attttttccc cacttcacca aaacaacctc 480 accgggtact tgtcgaataa tggtatcaac cacagtgcca aaaacccgat tagtggcgga 540 cctttcccct tgccacccaa tcaaagtcaa atcaatattt cgttcttgca cggtctccaa 600 aatcgcccca gacacatcat gactgaccct aatttgagta tgaataggaa cccgccagct 660 tttggcaata cgttcagctt ggcgaagtag acggcgacat ttagtaatgg ataccggagt 720 ttccgccggg gacaaattgc gagcaatggt aataatagtc aagcattcta gctcataatt 780 acgttcagca gcgatcgccg ccgcaatatg tagcaaagcc ggggcggtag tgggattatt 840 caaagccacc aatagtcgcc catgaccgac catggggccg cgagtttgat aaaccacata 900 ggagggggtg gcatgatgcc ccacctggtg actaccgcta atatatccaa gttcaccgcg 960 aataatatcg ctgcgggtaa taattcccac caaatgccgc ccctcgacga cgggaaggcg 1020 actgagtttt tgccgtccca acagatacag aacctcactg aggggagcat cagggtaaat 1080 agtaacaggt tggggagtca tcagcttatg taggggggtt tgttctgata tgtcttgttg 1140 gttaatcttt gccatatcag tttggctgat aataccgacc aatttaccct ggttgactac 1200 gggaaagccg cgatgatggg attgagaaaa agcggaccta acctgttcta gggataactg 1260 atcttcgaga gtttctacct gtcgctgcat aacatcccta gcgtgcaaca tatttaaggc 1320 tacccggtca gcattttggt caggttccaa ttcaatgcca ctcaaagcca ataggcgatc 1380 gtatagggaa tctttttcta tcttttcggc taccaaatag gagaccacag aacagatcat 1440 cagtggcaga accaagttaa aattggtggt gatttcaaag acaatcacca cggcggtgac 1500 cggagtccga gacacggcac agaaaaaggc tcccattccg gcaaaagcaa aagtggtgtg 1560 aggttgtaag gcgatcgttg cctcttccca taagccaata gtattcccca aagccgcgcc 1620 taaaattagg gatggtgcaa ataatccacc cggcgcaccg gaacccgccg ccatggtagt 1680 tagggaaaac tgcactacaa aagctagggc tgtggttgtc cagaggatat tacctttgag 1740 gatatattct cgcaaaccgg cattatctcg aaaagtctct ggtagcacag caataaccat 1800 cccacaaatt agacccgcca cagccatact caggggtagt cctaatttga gggtatggcg 1860 gttaaatttc tgaaaggtaa taattccccg actgaataac accccaaata ctcccgagag 1920 aacacccacc aggatataaa aggggatttc taggggttca attaaccatt gttgatatag 1980 ggcttctggg ggtatgtcta tggtgggagg tagtcccatg gctttgtttc ctaatagccg 2040 ggatactacc gccccagtaa atgaggcgat aatggcgggt ccgagggtta atcctgagat 2100 gtcgtgtagg aggtcttcca ctacgaataa aaccccggct atgggagcgt taaacccggc 2160 ggctagtccg gcggcggctc cacaggcgat tagttgtttg cgatagttgg gagaagtggg 2220 aacccaacga cttacccagg cggcgagggc ggctccgatt tgtactgttg gcccctgtcg 2280 tcctagggtg aatccagaag ccatggtgat catggtgctg atcagtttga ctactgctac 2340 ccgtagatct agggaggttt tgattccccc tagggctgct ttaacttggg ggataccgct 2400 tccggctgct tctggggcta tgcgttcgac taggaaacca gacaacagcc ccccgactac 2460 gcctaatatg ggtaaaaata gccaagctga aaagtgggcg gaaccttgga ctcgccaaga 2520 ccctaaccac ccggctcctg ttctcagaaa aaaggcggct attcctgaaa ttaatccgat 2580 taagccggct tctaaaatgg ccagcctttg ggaaccgcca attatggatt tggcgaggct 2640 ctggaattga ttggttaagg atggccagta cac 2673 <210> 106 <211> 890 <212> PRT <213> Arthrospira maxima CS-328 ctg36, whole genome shotgun sequence <400> 106 Met Tyr Trp Pro Ser Leu Thr Asn Gln Phe Gln Ser Leu Ala Lys Ser 1 5 10 15 Ile Ile Gly Gly Ser Gln Arg Leu Ala Ile Leu Glu Ala Gly Leu Ile 20 25 30 Gly Leu Ile Ser Gly Ile Ala Ala Phe Phe Leu Arg Thr Gly Ala Gly 35 40 45 Trp Leu Gly Ser Trp Arg Val Gln Gly Ser Ala His Phe Ser Ala Trp 50 55 60 Leu Phe Leu Pro Ile Leu Gly Val Val Gly Gly Leu Leu Ser Gly Phe 65 70 75 80 Leu Val Glu Arg Ile Ala Pro Glu Ala Ala Gly Ser Gly Ile Pro Gln 85 90 95 Val Lys Ala Ala Leu Gly Gly Ile Lys Thr Ser Leu Asp Leu Arg Val 100 105 110 Ala Val Val Lys Leu Ile Ser Thr Met Ile Thr Met Ala Ser Gly Phe 115 120 125 Thr Leu Gly Arg Gln Gly Pro Thr Val Gln Ile Gly Ala Ala Leu Ala 130 135 140 Ala Trp Val Ser Arg Trp Val Pro Thr Ser Pro Asn Tyr Arg Lys Gln 145 150 155 160 Leu Ile Ala Cys Gly Ala Ala Ala Gly Leu Ala Ala Gly Phe Asn Ala 165 170 175 Pro Ile Ala Gly Val Leu Phe Val Val Glu Asp Leu Leu His Asp Ile 180 185 190 Ser Gly Leu Thr Leu Gly Pro Ala Ile Ile Ala Ser Phe Thr Gly Ala 195 200 205 Val Val Ser Arg Leu Leu Gly Asn Lys Ala Met Gly Leu Pro Pro Thr 210 215 220 Ile Asp Ile Pro Pro Glu Ala Leu Tyr Gln Gln Trp Leu Ile Glu Pro 225 230 235 240 Leu Glu Ile Pro Phe Tyr Ile Leu Val Gly Val Leu Ser Gly Val Phe 245 250 255 Gly Val Leu Phe Ser Arg Gly Ile Ile Thr Phe Gln Lys Phe Asn Arg 260 265 270 His Thr Leu Lys Leu Gly Leu Pro Leu Ser Met Ala Val Ala Gly Leu 275 280 285 Ile Cys Gly Met Val Ile Ala Val Leu Pro Glu Thr Phe Arg Asp Asn 290 295 300 Ala Gly Leu Arg Glu Tyr Ile Leu Lys Gly Asn Ile Leu Trp Thr Thr 305 310 315 320 Thr Ala Leu Ala Phe Val Val Gln Phe Ser Leu Thr Thr Met Ala Ala 325 330 335 Gly Ser Gly Ala Pro Gly Gly Leu Phe Ala Pro Ser Leu Ile Leu Gly 340 345 350 Ala Ala Leu Gly Asn Thr Ile Gly Leu Trp Glu Glu Ala Thr Ile Ala 355 360 365 Leu Gln Pro His Thr Thr Phe Ala Phe Ala Gly Met Gly Ala Phe Phe 370 375 380 Cys Ala Val Ser Arg Thr Pro Val Thr Ala Val Val Ile Val Phe Glu 385 390 395 400 Ile Thr Thr Asn Phe Asn Leu Val Leu Pro Leu Met Ile Cys Ser Val 405 410 415 Val Ser Tyr Leu Val Ala Glu Lys Ile Glu Lys Asp Ser Leu Tyr Asp 420 425 430 Arg Leu Leu Ala Leu Ser Gly Ile Glu Leu Glu Pro Asp Gln Asn Ala 435 440 445 Asp Arg Val Ala Leu Asn Met Leu His Ala Arg Asp Val Met Gln Arg 450 455 460 Gln Val Glu Thr Leu Glu Asp Gln Leu Ser Leu Glu Gln Val Arg Ser 465 470 475 480 Ala Phe Ser Gln Ser His His Arg Gly Phe Pro Val Val Asn Gln Gly 485 490 495 Lys Leu Val Gly Ile Ile Ser Gln Thr Asp Met Ala Lys Ile Asn Gln 500 505 510 Gln Asp Ile Ser Glu Gln Thr Pro Leu His Lys Leu Met Thr Pro Gln 515 520 525 Pro Val Thr Ile Tyr Pro Asp Ala Pro Leu Ser Glu Val Leu Tyr Leu 530 535 540 Leu Gly Arg Gln Lys Leu Ser Arg Leu Pro Val Val Glu Gly Arg His 545 550 555 560 Leu Val Gly Ile Ile Thr Arg Ser Asp Ile Ile Arg Gly Glu Leu Gly 565 570 575 Tyr Ile Ser Gly Ser His Gln Val Gly His His Ala Thr Pro Ser Tyr 580 585 590 Val Val Tyr Gln Thr Arg Gly Pro Met Val Gly His Gly Arg Leu Leu 595 600 605 Val Ala Leu Asn Asn Pro Thr Thr Ala Pro Ala Leu Leu His Ile Ala 610 615 620 Ala Ala Ile Ala Ala Glu Arg Asn Tyr Glu Leu Glu Cys Leu Thr Ile 625 630 635 640 Ile Thr Ile Ala Arg Asn Leu Ser Pro Ala Glu Thr Pro Val Ser Ile 645 650 655 Thr Lys Cys Arg Arg Leu Leu Arg Gln Ala Glu Arg Ile Ala Lys Ser 660 665 670 Trp Arg Val Pro Ile His Thr Gln Ile Arg Val Ser His Asp Val Ser 675 680 685 Gly Ala Ile Leu Glu Thr Val Gln Glu Arg Asn Ile Asp Leu Thr Leu 690 695 700 Ile Gly Trp Gln Gly Glu Arg Ser Ala Thr Asn Arg Val Phe Gly Thr 705 710 715 720 Val Val Asp Thr Ile Ile Arg Gln Val Pro Gly Glu Val Val Leu Val 725 730 735 Lys Trp Gly Lys Asn Val Asn Pro Ile Phe Ser Asp Pro Ser Asp Gln 740 745 750 Arg Ser Leu Gln Phe Pro Val Trp Arg Arg Trp Leu Val Pro Leu Arg 755 760 765 Thr Gly Gly Pro Pro Pro Ala Ala Met Gly Ile Leu Pro Gly Leu Ala 770 775 780 Arg Leu Ser Leu Arg Pro Asp Ile Arg Leu Leu Thr Val Val Lys Asn 785 790 795 800 Ala Leu Ser Glu Ala Glu Met Ala Lys Leu Asp His Leu Val Glu Glu 805 810 815 Leu Lys Ser Pro Ile Asn Gly Glu Val Val Ala Thr Ala Val Cys Ala 820 825 830 Arg Ser Val Val Asp Val Leu Leu Asp Ile Ala Asn His Asp Tyr Cys 835 840 845 Asp Val Ile Val Leu Gly Ala Ser Gly Glu Ser Met Leu Gln Gln Ala 850 855 860 Ile Lys Gly Asn Ile Pro Glu Ala Ile Ala Arg Gly Cys Pro Cys Thr 865 870 875 880 Val Ile Leu Val Arg Pro Pro Ile Met Asn 885 890 <210> 107 <211> 2616 <212> DNA <213> Acaryochloris marina <400> 107 atgaagctaa tctcggcctt tcaacccctg cgccacctca ctcagtccag tcgctttgcc 60 attattgaag cctgtctgat tggtcttatt tctggtttag cagccgtcgc cttgcaggat 120 gggattgggt ggttaggggg gctacggata tctttggcca accaatttca ttctcctctg 180 atactgccgt taataggggt tatcggcggt ttaattgcag ggttgctgat agaaaccatc 240 gctccggatg cgaaggggag cggcatccct caagtgaagg ctgcactggc acagtttccg 300 attgcgctga attggcaagt cgcgctggtc aaattgttca gcggcatcac tgccctggga 360 actggattac ctctagggcg gcaagggcct acggtacaac taggcgctgc cctggccgct 420 cagctaagct actggttccc tacagctccc aaccaccgac aacaaatgat tgcggcaggg 480 gcaggagctg gactcgcagc agggtttgcg gctcccattg ctggagtgct ttttattgtc 540 gaggagctgc tgcatgactt atctggatta accctgggga ccgccattct gtcctccttt 600 atcggtgcag ttgttgccca tgttttaggg gggcaaaact tatctatcag ctttgagcag 660 gtcaccaccg ccaccagctt ctccgttccg gaaattccct tctttatttt gctggggatt 720 ttggctggag gatttggcgc tatattcaat cgaggtctgc tcctcagcgt tgatctaaac 780 cgccgactca agttccttgg attaccctgg cgcatcagct tagcaggcgg tatttgtggc 840 agcattattg gccaactgcc cagcattttc caggacaata cggggctcag aggactattg 900 ggtttaggag atctgggttg gcagttggcc ctaacagcct tcgttgtcca gtttggacta 960 accctgattg cctatggttc aggggctcca ggcggattat ttgcccccag cctagtcatg 1020 ggggccgcct tagggaattt agtagggcta ggtcaggctc aactactcgg tgctggttta 1080 cccacgactt atgcgtttgt gggcatgggg gcgttttttg gggccgttag tcgtgtccct 1140 gtaactggga tcgtgattat ctttgaaatc acccaggatt tcaatctcgt tctccctctg 1200 atgatcagct ctgtagtcgc ctatctaacc gctgagcaaa tcaatcaaag ttctatctat 1260 gatttgttgc tacagcaaca aggcattcaa ctccaaaatg catccccctc tgcgcaacgg 1320 atgttagatg ccctaacggc agaagacatt atgcagcggc aagtggaaac gttacctagc 1380 gatctgtctt tagatgcagc ccgaaagatt ttttcccgtt cccaccatcg gggttttcca 1440 gtgctcgaag accgacgatt agtggggatc ttgagtcgta cagatcttaa tcgagttacg 1500 caacaacaga aacccggcga taccttaatc cgggatatca tgacgcccca gcctttaacc 1560 gttggtccct cggcatcttt gtctgatgtc ctgtatattc tcaatcgctc ccatatcagt 1620 cgtctacccg tattagatgg acgtaaactc atcggtatca ttacccgtgc cgatattatt 1680 catgctgaat ttgatcacat ttccggccag aagcaacagg ataatcaggc ttttgcgcca 1740 tcctacggcg tctacctaac ccgagggcct gccactggcg aagggcgaat cctcttaccc 1800 ctcgcgaatc ctgacacagc tgaacccctc ctaaaggttg ctgtagccat ggctcaagcc 1860 ctgaactatg agctagagtg cctgcacatt atccgtctac cgcgtaatcg tttaccagct 1920 gagacccccg tccaaaccgt caaaggtcgg cgacttctgc aaaaagcaat tcggtatggc 1980 caacgccacc aagtgtctgt tcatacccaa atcattgcgg ctcaggatgt ggcccaagcc 2040 attttggaag tcgaacagac ggagcatatc aacctcctgc ttatggggtg gcaaggacaa 2100 tttttctccg gtggacagat tggtaatccc acggttcgaa ccatcctcca gcaggccaaa 2160 agccaagttt tagtcattag acctgccacc cacttcaata ctggtaaaaa ccaacgttgg 2220 cttatcccag tgtctggagg gccaaacgtg caacaagcga ttcaactttt gccagccctc 2280 gttcccatca gtaagtcacc caagctgaaa ttgtttcaag tttatccccc cagtagtgat 2340 ctgcccgacc agagtattct cgaacactac tcccagttcc tcaaacaggc ctgcccggat 2400 agtgcagtca aacggacaca aatttgtgct caaaatgtgg cagacgctat tgtggaactg 2460 gcaaggctcc aaaagacaga catcatcgtt attggagcca gcccaactgg gttagtccac 2520 caagcactca aaggaaacat ccccctagcc attgctcaag gaacagaggc gaccatcatt 2580 ttagtgagag gctctggaac caacgttgtg gtttag 2616 <210> 108 <211> 871 <212> PRT <213> Acaryochloris marina <400> 108 Met Lys Leu Ile Ser Ala Phe Gln Pro Leu Arg His Leu Thr Gln Ser 1 5 10 15 Ser Arg Phe Ala Ile Ile Glu Ala Cys Leu Ile Gly Leu Ile Ser Gly 20 25 30 Leu Ala Ala Val Ala Leu Gln Asp Gly Ile Gly Trp Leu Gly Gly Leu 35 40 45 Arg Ile Ser Leu Ala Asn Gln Phe His Ser Pro Leu Ile Leu Pro Leu 50 55 60 Ile Gly Val Ile Gly Gly Leu Ile Ala Gly Leu Leu Ile Glu Thr Ile 65 70 75 80 Ala Pro Asp Ala Lys Gly Ser Gly Ile Pro Gln Val Lys Ala Ala Leu 85 90 95 Ala Gln Phe Pro Ile Ala Leu Asn Trp Gln Val Ala Leu Val Lys Leu 100 105 110 Phe Ser Gly Ile Thr Ala Leu Gly Thr Gly Leu Pro Leu Gly Arg Gln 115 120 125 Gly Pro Thr Val Gln Leu Gly Ala Ala Leu Ala Ala Gln Leu Ser Tyr 130 135 140 Trp Phe Pro Thr Ala Pro Asn His Arg Gln Gln Met Ile Ala Ala Gly 145 150 155 160 Ala Gly Ala Gly Leu Ala Ala Gly Phe Ala Ala Pro Ile Ala Gly Val 165 170 175 Leu Phe Ile Val Glu Glu Leu Leu His Asp Leu Ser Gly Leu Thr Leu 180 185 190 Gly Thr Ala Ile Leu Ser Ser Phe Ile Gly Ala Val Val Ala His Val 195 200 205 Leu Gly Gly Gln Asn Leu Ser Ile Ser Phe Glu Gln Val Thr Thr Ala 210 215 220 Thr Ser Phe Ser Val Pro Glu Ile Pro Phe Phe Ile Leu Leu Gly Ile 225 230 235 240 Leu Ala Gly Gly Phe Gly Ala Ile Phe Asn Arg Gly Leu Leu Leu Ser 245 250 255 Val Asp Leu Asn Arg Arg Leu Lys Phe Leu Gly Leu Pro Trp Arg Ile 260 265 270 Ser Leu Ala Gly Gly Ile Cys Gly Ser Ile Ile Gly Gln Leu Pro Ser 275 280 285 Ile Phe Gln Asp Asn Thr Gly Leu Arg Gly Leu Leu Gly Leu Gly Asp 290 295 300 Leu Gly Trp Gln Leu Ala Leu Thr Ala Phe Val Val Gln Phe Gly Leu 305 310 315 320 Thr Leu Ile Ala Tyr Gly Ser Gly Ala Pro Gly Gly Leu Phe Ala Pro 325 330 335 Ser Leu Val Met Gly Ala Ala Leu Gly Asn Leu Val Gly Leu Gly Gln 340 345 350 Ala Gln Leu Leu Gly Ala Gly Leu Pro Thr Thr Tyr Ala Phe Val Gly 355 360 365 Met Gly Ala Phe Phe Gly Ala Val Ser Arg Val Pro Val Thr Gly Ile 370 375 380 Val Ile Ile Phe Glu Ile Thr Gln Asp Phe Asn Leu Val Leu Pro Leu 385 390 395 400 Met Ile Ser Ser Val Val Ala Tyr Leu Thr Ala Glu Gln Ile Asn Gln 405 410 415 Ser Ser Ile Tyr Asp Leu Leu Leu Gln Gln Gln Gly Ile Gln Leu Gln 420 425 430 Asn Ala Ser Pro Ser Ala Gln Arg Met Leu Asp Ala Leu Thr Ala Glu 435 440 445 Asp Ile Met Gln Arg Gln Val Glu Thr Leu Pro Ser Asp Leu Ser Leu 450 455 460 Asp Ala Ala Arg Lys Ile Phe Ser Arg Ser His His Arg Gly Phe Pro 465 470 475 480 Val Leu Glu Asp Arg Arg Leu Val Gly Ile Leu Ser Arg Thr Asp Leu 485 490 495 Asn Arg Val Thr Gln Gln Gln Lys Pro Gly Asp Thr Leu Ile Arg Asp 500 505 510 Ile Met Thr Pro Gln Pro Leu Thr Val Gly Pro Ser Ala Ser Leu Ser 515 520 525 Asp Val Leu Tyr Ile Leu Asn Arg Ser His Ile Ser Arg Leu Pro Val 530 535 540 Leu Asp Gly Arg Lys Leu Ile Gly Ile Ile Thr Arg Ala Asp Ile Ile 545 550 555 560 His Ala Glu Phe Asp His Ile Ser Gly Gln Lys Gln Gln Asp Asn Gln 565 570 575 Ala Phe Ala Pro Ser Tyr Gly Val Tyr Leu Thr Arg Gly Pro Ala Thr 580 585 590 Gly Glu Gly Arg Ile Leu Leu Pro Leu Ala Asn Pro Asp Thr Ala Glu 595 600 605 Pro Leu Leu Lys Val Ala Val Ala Met Ala Gln Ala Leu Asn Tyr Glu 610 615 620 Leu Glu Cys Leu His Ile Ile Arg Leu Pro Arg Asn Arg Leu Pro Ala 625 630 635 640 Glu Thr Pro Val Gln Thr Val Lys Gly Arg Arg Leu Leu Gln Lys Ala 645 650 655 Ile Arg Tyr Gly Gln Arg His Gln Val Ser Val His Thr Gln Ile Ile 660 665 670 Ala Ala Gln Asp Val Ala Gln Ala Ile Leu Glu Val Glu Gln Thr Glu 675 680 685 His Ile Asn Leu Leu Leu Met Gly Trp Gln Gly Gln Phe Phe Ser Gly 690 695 700 Gly Gln Ile Gly Asn Pro Thr Val Arg Thr Ile Leu Gln Gln Ala Lys 705 710 715 720 Ser Gln Val Leu Val Ile Arg Pro Ala Thr His Phe Asn Thr Gly Lys 725 730 735 Asn Gln Arg Trp Leu Ile Pro Val Ser Gly Gly Pro Asn Val Gln Gln 740 745 750 Ala Ile Gln Leu Leu Pro Ala Leu Val Pro Ile Ser Lys Ser Pro Lys 755 760 765 Leu Lys Leu Phe Gln Val Tyr Pro Pro Ser Ser Asp Leu Pro Asp Gln 770 775 780 Ser Ile Leu Glu His Tyr Ser Gln Phe Leu Lys Gln Ala Cys Pro Asp 785 790 795 800 Ser Ala Val Lys Arg Thr Gln Ile Cys Ala Gln Asn Val Ala Asp Ala 805 810 815 Ile Val Glu Leu Ala Arg Leu Gln Lys Thr Asp Ile Ile Val Ile Gly 820 825 830 Ala Ser Pro Thr Gly Leu Val His Gln Ala Leu Lys Gly Asn Ile Pro 835 840 845 Leu Ala Ile Ala Gln Gly Thr Glu Ala Thr Ile Ile Leu Val Arg Gly 850 855 860 Ser Gly Thr Asn Val Val Val 865 870 <210> 109 <211> 2694 <212> DNA <213> Cyanothece sp. <400> 109 ctattcagcg ctgagggctt tgcggaccag gataaccgtg cagtcagagt ggcgggcaat 60 ttgttcagga atattcccct gaatcacctg ctgcagtaac ccttcccggc tggcccccag 120 tacaatcaca tcacactggt ctttttcgac taaatcgaca atggcatcgg caacggagtc 180 agcacaaagg gtgagggtga tcacgggagc ttgaagttgc tggttcagaa aatcggcatc 240 ctgctccagt aaggtggtgt cgtggtaagg ttctgagggg gaaaatactt gacacagccg 300 aatttggggg tgctggctga gggcaaccag ggctggtagc aaggtgagag catactgggc 360 attgggtcct ccggcaacgg gaaccagcca gcgattgagt gtgaacagcc gcatgagcag 420 tgtgagggcc gattgaccag acaggtctgc tgccttggcc aggggaagaa tcagctgctt 480 gccgggccga accagcacaa cattacaact ggcttcgcgg acgatcgtgt ctaccaccgt 540 gccaaaaatg cgtcctgggg ttaacgttac cccctcccaa cccatgagga ccagatcgat 600 gtgccgatct cgaatggttt ccagaatggc catagcaata tcctgggcaa cgcgaatttg 660 ggtatggacg ggcacctgcc aggtttgtcc cccagcaacc gcatgttcca tcatttggcg 720 gctggccgta atatcgacac tggtttcgga gggccgactg tggcggggaa tcggaataat 780 atgtaaacat tccagatcat agtgatgctg ttgggcgatc gcggcggcca ggcgcaacag 840 ggcatcagtg gtttggggat tactcagcgg taccagtagc cgtccctgag ctgttgtgga 900 ggactgggtt tggtacaccg ggtaggaagg ggcaggtttg actttgaggg gactggcttc 960 accactgaga cgatcgcatt cagcccggat aatatcagca cgggtgataa ttccgaccag 1020 cttgcgtccc tccgtcacag gtagacggct gatctgataa tggttgagca gatacaggac 1080 atgggccaat cgatcgccag gaccaacact gatcaatcgt tgggtcataa tctgactgag 1140 gggtaagtcc gggctcagcc ccctgacgct cactctggcc agatccgact gagtgaccat 1200 ccccactaat ctgccatccg ccactacggg aaacccgcgg tgatgggatt gctcaaaaaa 1260 ctgaatcgct gcagcgatcg tcatgtccgc cggtaaggtt tcgacccgtc gttgcatgat 1320 gtcggctgcc agtaagccct gcaactgctg atccccggcg aacttttgat ccagctgaat 1380 cccccgtaac tctaacagat gggtataaat ggagcctttg gatacctttt cggccaccag 1440 gtaggccacc actgagccga tcatcaaagg cagtacaaca tcaaagtcca tcgtcagctc 1500 aaagacaatc acgatcgctg tgatcggccc gcgggttaca gcactaaaga atgcccccat 1560 gcctgtgagg gtataaatga ccggcgcttg ggagaggacg gttccattca gctccagttg 1620 gactccttga gccatctggc caatcaatcc gcctagggcc gaacccagaa ttagggaggg 1680 tgcaaataac ccaccgggaa cccctgaacc gtaagccagc agcaccagca gaaatttgcc 1740 gacaaaggcg atcgcggtga tctgccagcc aatctccccc agaaccagca aatcctgagt 1800 gccactacta gaccgcagaa tcgggggtaa aaacgccagg atcatcccac tgattgcacc 1860 tgccagcccc atttgccagg atggccgcca gcccggtagg tattgccggt aaaagcgcaa 1920 actggtcaaa atcccacgat taaagctggc ccccagcacc ccagcgatcg ctcccagcag 1980 catcaacacc ggaatatcca tgagcgtaaa gctcagatcg atcccactca gatcgggaat 2040 taagcctctt ccccccagta aacgggaaac aacccccccg acaaaggccg ccagaatagc 2100 cgtgcccagt gttagttccg ataaatcctg aagtaactct tcaatcacga atagcacccc 2160 agcgatcggc gcattaaatc cagccgctaa acccgctgct gcccctgcgg ctattagttg 2220 gcgttgataa gccggtgaag tagctaacca gcggctgaac tgtccggcca gtgccgctcc 2280 aatctgtaca gtgggtccct gtcgccccag ggccaggcca gcccccagcg ccagagttgt 2340 actgaccagt ttgactacag ccacccgcag atcgagggcg atcgaggcat agcccagggc 2400 cgctttcacc tggggaattc cactgcccgt agcctccggg gcggcccact caatcaacca 2460 gccactcagt agccccccca acagtccgat caccggcaaa atcagcaggg gaggcagatc 2520 tgcaccgatc gctgccgtcc agctttccat tgcggcgatc gcctgcttca acaaaacggc 2580 agccagcgcc gagaccaacc caatcaaaca agcttctaag atggcaacag atttggggcg 2640 gagtaagcgt tgcagggatt gggtcagcca gatggttcct ttcataaggg ccat 2694 <210> 110 <211> 897 <212> PRT <213> Cyanothece sp. <400> 110 Met Ala Leu Met Lys Gly Thr Ile Trp Leu Thr Gln Ser Leu Gln Arg 1 5 10 15 Leu Leu Arg Pro Lys Ser Val Ala Ile Leu Glu Ala Cys Leu Ile Gly 20 25 30 Leu Val Ser Ala Leu Ala Ala Val Leu Leu Lys Gln Ala Ile Ala Ala 35 40 45 Met Glu Ser Trp Thr Ala Ala Ile Gly Ala Asp Leu Pro Pro Leu Leu 50 55 60 Ile Leu Pro Val Ile Gly Leu Leu Gly Gly Leu Leu Ser Gly Trp Leu 65 70 75 80 Ile Glu Trp Ala Ala Pro Glu Ala Thr Gly Ser Gly Ile Pro Gln Val 85 90 95 Lys Ala Ala Leu Gly Tyr Ala Ser Ile Ala Leu Asp Leu Arg Val Ala 100 105 110 Val Val Lys Leu Val Ser Thr Thr Leu Ala Leu Gly Ala Gly Leu Ala 115 120 125 Leu Gly Arg Gln Gly Pro Thr Val Gln Ile Gly Ala Ala Leu Ala Gly 130 135 140 Gln Phe Ser Arg Trp Leu Ala Thr Ser Pro Ala Tyr Gln Arg Gln Leu 145 150 155 160 Ile Ala Ala Gly Ala Ala Ala Gly Leu Ala Ala Gly Phe Asn Ala Pro 165 170 175 Ile Ala Gly Val Leu Phe Val Ile Glu Glu Leu Leu Gln Asp Leu Ser 180 185 190 Glu Leu Thr Leu Gly Thr Ala Ile Leu Ala Ala Phe Val Gly Gly Val 195 200 205 Val Ser Arg Leu Leu Gly Gly Arg Gly Leu Ile Pro Asp Leu Ser Gly 210 215 220 Ile Asp Leu Ser Phe Thr Leu Met Asp Ile Pro Val Leu Met Leu Leu 225 230 235 240 Gly Ala Ile Ala Gly Val Leu Gly Ala Ser Phe Asn Arg Gly Ile Leu 245 250 255 Thr Ser Leu Arg Phe Tyr Arg Gln Tyr Leu Pro Gly Trp Arg Pro Ser 260 265 270 Trp Gln Met Gly Leu Ala Gly Ala Ile Ser Gly Met Ile Leu Ala Phe 275 280 285 Leu Pro Pro Ile Leu Arg Ser Ser Ser Gly Thr Gln Asp Leu Leu Val 290 295 300 Leu Gly Glu Ile Gly Trp Gln Ile Thr Ala Ile Ala Phe Val Gly Lys 305 310 315 320 Phe Leu Leu Val Leu Leu Ala Tyr Gly Ser Gly Val Pro Gly Gly Leu 325 330 335 Phe Ala Pro Ser Leu Ile Leu Gly Ser Ala Leu Gly Gly Leu Ile Gly 340 345 350 Gln Met Ala Gln Gly Val Gln Leu Glu Leu Asn Gly Thr Val Leu Ser 355 360 365 Gln Ala Pro Val Ile Tyr Thr Leu Thr Gly Met Gly Ala Phe Phe Ser 370 375 380 Ala Val Thr Arg Gly Pro Ile Thr Ala Ile Val Ile Val Phe Glu Leu 385 390 395 400 Thr Met Asp Phe Asp Val Val Leu Pro Leu Met Ile Gly Ser Val Val 405 410 415 Ala Tyr Leu Val Ala Glu Lys Val Ser Lys Gly Ser Ile Tyr Thr His 420 425 430 Leu Leu Glu Leu Arg Gly Ile Gln Leu Asp Gln Lys Phe Ala Gly Asp 435 440 445 Gln Gln Leu Gln Gly Leu Leu Ala Ala Asp Ile Met Gln Arg Arg Val 450 455 460 Glu Thr Leu Pro Ala Asp Met Thr Ile Ala Ala Ala Ile Gln Phe Phe 465 470 475 480 Glu Gln Ser His His Arg Gly Phe Pro Val Val Ala Asp Gly Arg Leu 485 490 495 Val Gly Met Val Thr Gln Ser Asp Leu Ala Arg Val Ser Val Arg Gly 500 505 510 Leu Ser Pro Asp Leu Pro Leu Ser Gln Ile Met Thr Gln Arg Leu Ile 515 520 525 Ser Val Gly Pro Gly Asp Arg Leu Ala His Val Leu Tyr Leu Leu Asn 530 535 540 His Tyr Gln Ile Ser Arg Leu Pro Val Thr Glu Gly Arg Lys Leu Val 545 550 555 560 Gly Ile Ile Thr Arg Ala Asp Ile Ile Arg Ala Glu Cys Asp Arg Leu 565 570 575 Ser Gly Glu Ala Ser Pro Leu Lys Val Lys Pro Ala Pro Ser Tyr Pro 580 585 590 Val Tyr Gln Thr Gln Ser Ser Thr Thr Ala Gln Gly Arg Leu Leu Val 595 600 605 Pro Leu Ser Asn Pro Gln Thr Thr Asp Ala Leu Leu Arg Leu Ala Ala 610 615 620 Ala Ile Ala Gln Gln His His Tyr Asp Leu Glu Cys Leu His Ile Ile 625 630 635 640 Pro Ile Pro Arg His Ser Arg Pro Ser Glu Thr Ser Val Asp Ile Thr 645 650 655 Ala Ser Arg Gln Met Met Glu His Ala Val Ala Gly Gly Gln Thr Trp 660 665 670 Gln Val Pro Val His Thr Gln Ile Arg Val Ala Gln Asp Ile Ala Met 675 680 685 Ala Ile Leu Glu Thr Ile Arg Asp Arg His Ile Asp Leu Val Leu Met 690 695 700 Gly Trp Glu Gly Val Thr Leu Thr Pro Gly Arg Ile Phe Gly Thr Val 705 710 715 720 Val Asp Thr Ile Val Arg Glu Ala Ser Cys Asn Val Val Leu Val Arg 725 730 735 Pro Gly Lys Gln Leu Ile Leu Pro Leu Ala Lys Ala Ala Asp Leu Ser 740 745 750 Gly Gln Ser Ala Leu Thr Leu Leu Met Arg Leu Phe Thr Leu Asn Arg 755 760 765 Trp Leu Val Pro Val Ala Gly Gly Pro Asn Ala Gln Tyr Ala Leu Thr 770 775 780 Leu Leu Pro Ala Leu Val Ala Leu Ser Gln His Pro Gln Ile Arg Leu 785 790 795 800 Cys Gln Val Phe Ser Pro Ser Glu Pro Tyr His Asp Thr Thr Leu Leu 805 810 815 Glu Gln Asp Ala Asp Phe Leu Asn Gln Gln Leu Gln Ala Pro Val Ile 820 825 830 Thr Leu Thr Leu Cys Ala Asp Ser Val Ala Asp Ala Ile Val Asp Leu 835 840 845 Val Glu Lys Asp Gln Cys Asp Val Ile Val Leu Gly Ala Ser Arg Glu 850 855 860 Gly Leu Leu Gln Gln Val Ile Gln Gly Asn Ile Pro Glu Gln Ile Ala 865 870 875 880 Arg His Ser Asp Cys Thr Val Ile Leu Val Arg Lys Ala Leu Ser Ala 885 890 895 Glu <210> 111 <211> 2580 <212> DNA <213> Synechococcus elongatus <400> 111 ttaacgtctc tgaatgatta cggtttgcgg tgcctgtgct aacagatctt tccagagggt 60 tgtggtgggc agctgttcca aggtcatcga tagcatcacc gcttcgatcc ctcgactttg 120 catcacatcc aatagcactg ctgtcaccga tcgcgcacag atcaagtctg cttggatggg 180 ttgccgcagg cggttctcca gtcgtcgctg cagctgctgg agacggttgg ctgaaacggt 240 ttgtcgaggg aggtcgatct gacagaggga gatatctgga tcggtaatca actgcaggat 300 ttgttccaag ggctcggcca aacctgtctg gggcacctgg gcgctgaggg gaatcagcca 360 atggcgtagc ggcagagtcg ggcgatcgcc ctgcaggagt ggcgccttgg ccaggaatgc 420 agccccgggt ttgaccaaca gcacccggca gggagcctgc tgcaaaatct gatcaatccc 480 ttcgcggaac agccgttggg ctaaggaagc cccgccaccc cagcccatca cgagatcgtt 540 gatgtggcga tcgctaatcg tttctagaat cgcagcagaa agatcgtgac aaacccggac 600 ttgcgtatga accggaatct gccagcgtcg gcccaaccgc tcggcctgcc gcaacattcg 660 ccgtgctcca agagttgaaa ctgctgtttg agagggatcg gcttcgcgag agacaggaat 720 caggtgcaga cattccagct cgtagttccg caaactggcg agccctgccg ccaactgcaa 780 cagagattga gctgtgcgcg gattggccag tagcactagc agacgtcctt ggccggtagc 840 gggcgatcgc gtttcgtagg cgacgtagga gggggcgatc ggcgtcgcag caatatcttg 900 accgcttagg agttccgatt cggcccgaat gatgtcggct cgtgtgatga ttccgaccag 960 cttgcggcca tcgaccacgg gcaaccggct gatttggaag cggttcagca cgtaaagaac 1020 gtgggccaga gtgtcttggg gggcaactgt cagcgggtga ggcgtcatga tttcgctgag 1080 ccgcacggac tcgcctttgc ctttgagggt ttgttcatcc agatcggagc tggtaacaat 1140 gccgactaga gcaccttttt gagtaacagg aaaacctcgg tggtgagtgc ggttgaattg 1200 ctggattact tcagtcaggg gtaggctggc ttccagagtt tccacaggac tagccatcac 1260 ctgggcagca gtcagaccca agctgctgtt gagagttggc aaggcgtcaa ccactgcggc 1320 tgctttgctg ggcgatcgcg ccaagctggc aattccatag gcggtaatcg aggccaccat 1380 cagcggtaac actgcgttga aatcgcgggt catctcgaac acaatcacga tcgccgtgat 1440 cggcccttgg gtgacggcgc taaacatcgc gcccataccc gccaaggcat aggttgccgg 1500 agcatcgatc cgcagcggaa tcccaacctg caaaaagatc gcctgaatgg aaagcaccac 1560 gcccagaccc aaactggaac cgagcaccag cgctggcgca aaaatcccgc cagaagcccc 1620 tgatccagca gccaccagcg tcagaccaaa gttgatcgcc aacatcagca acgcgatcga 1680 gccactgtcc gggatggtca ccctaaaggg gttactcagg ccttgccgca gcgcagcagg 1740 gagcaacagc agtagtaagg ccgagatccc actggcgatc gcaacccgcc aaggcagccc 1800 cttgagcggt aagcgttcat aacagcgttg actgaacgcc aagccgcgat tgaacaaaat 1860 gcctaggccc cctgcaaaca gtcctaaaag taggacaacg ggcagctcag gcacggtcag 1920 ggcggctgga gcagcaacaa tttcagagct gaaactcagg ctttgactgc cgagaattcc 1980 cgaaacaact gccccaataa aggctgcgag gactgctgtc ccaagggtga agctagagac 2040 atcatggagc agttgctcca gcactagcat cacaccggct agcggtgcat taaagccagc 2100 cgcgaggcca gcggcagccc cggaagcaat caactgtcgt cggtagtctg gcgaggtggg 2160 gaaccactgg ctcatctgac ccgcgaggga agcgcccact tgcacggttg ggccttgccg 2220 ccctaggggc agccctgaac caaccaccag catcgtgctg gcaattttga cgatcgcaac 2280 ccgtaggttc aaggcgatgc ggctgcctga cagtgcggct tgcacttggc tgatgccgct 2340 gccctcggct tcgggggcaa accgttgcac cagccaaccg gcgatcgcgc ccagaatcgg 2400 tggcaaaagg agctgcaggc caagtggcag tcccgggcga tcgcgcagat cttgaacacc 2460 cgttgcaccc agtttgagca ggaaggcact cgcccctgaa accagcccga ttgcgcaagc 2520 ttccagcaca gcccactgct gcgctttagc aaaccgtggc ggaaaacgca gacgaaacac 2580 <210> 112 <211> 859 <212> PRT <213> Synechococcus elongatus <400> 112 Met Phe Arg Leu Arg Phe Pro Pro Arg Phe Ala Lys Ala Gln Gln Trp 1 5 10 15 Ala Val Leu Glu Ala Cys Ala Ile Gly Leu Val Ser Gly Ala Ser Ala 20 25 30 Phe Leu Leu Lys Leu Gly Ala Thr Gly Val Gln Asp Leu Arg Asp Arg 35 40 45 Pro Gly Leu Pro Leu Gly Leu Gln Leu Leu Leu Pro Pro Ile Leu Gly 50 55 60 Ala Ile Ala Gly Trp Leu Val Gln Arg Phe Ala Pro Glu Ala Glu Gly 65 70 75 80 Ser Gly Ile Ser Gln Val Gln Ala Ala Leu Ser Gly Ser Arg Ile Ala 85 90 95 Leu Asn Leu Arg Val Ala Ile Val Lys Ile Ala Ser Thr Met Leu Val 100 105 110 Val Gly Ser Gly Leu Pro Leu Gly Arg Gln Gly Pro Thr Val Gln Val 115 120 125 Gly Ala Ser Leu Ala Gly Gln Met Ser Gln Trp Phe Pro Thr Ser Pro 130 135 140 Asp Tyr Arg Arg Gln Leu Ile Ala Ser Gly Ala Ala Ala Gly Leu Ala 145 150 155 160 Ala Gly Phe Asn Ala Pro Leu Ala Gly Val Met Leu Val Leu Glu Gln 165 170 175 Leu Leu His Asp Val Ser Ser Phe Thr Leu Gly Thr Ala Val Leu Ala 180 185 190 Ala Phe Ile Gly Ala Val Val Ser Gly Ile Leu Gly Ser Gln Ser Leu 195 200 205 Ser Phe Ser Ser Glu Ile Val Ala Ala Pro Ala Ala Leu Thr Val Pro 210 215 220 Glu Leu Pro Val Val Leu Leu Leu Gly Leu Phe Ala Gly Gly Leu Gly 225 230 235 240 Ile Leu Phe Asn Arg Gly Leu Ala Phe Ser Gln Arg Cys Tyr Glu Arg 245 250 255 Leu Pro Leu Lys Gly Leu Pro Trp Arg Val Ala Ile Ala Ser Gly Ile 260 265 270 Ser Ala Leu Leu Leu Leu Leu Leu Pro Ala Ala Leu Arg Gln Gly Leu 275 280 285 Ser Asn Pro Phe Arg Val Thr Ile Pro Asp Ser Gly Ser Ile Ala Leu 290 295 300 Leu Met Leu Ala Ile Asn Phe Gly Leu Thr Leu Val Ala Ala Gly Ser 305 310 315 320 Gly Ala Ser Gly Gly Ile Phe Ala Pro Ala Leu Val Leu Gly Ser Ser 325 330 335 Leu Gly Leu Gly Val Val Leu Ser Ile Gln Ala Ile Phe Leu Gln Val 340 345 350 Gly Ile Pro Leu Arg Ile Asp Ala Pro Ala Thr Tyr Ala Leu Ala Gly 355 360 365 Met Gly Ala Met Phe Ser Ala Val Thr Gln Gly Pro Ile Thr Ala Ile 370 375 380 Val Ile Val Phe Glu Met Thr Arg Asp Phe Asn Ala Val Leu Pro Leu 385 390 395 400 Met Val Ala Ser Ile Thr Ala Tyr Gly Ile Ala Ser Leu Ala Arg Ser 405 410 415 Pro Ser Lys Ala Ala Ala Val Val Asp Ala Leu Pro Thr Leu Asn Ser 420 425 430 Ser Leu Gly Leu Thr Ala Ala Gln Val Met Ala Ser Pro Val Glu Thr 435 440 445 Leu Glu Ala Ser Leu Pro Leu Thr Glu Val Ile Gln Gln Phe Asn Arg 450 455 460 Thr His His Arg Gly Phe Pro Val Thr Gln Lys Gly Ala Leu Val Gly 465 470 475 480 Ile Val Thr Ser Ser Asp Leu Asp Glu Gln Thr Leu Lys Gly Lys Gly 485 490 495 Glu Ser Val Arg Leu Ser Glu Ile Met Thr Pro His Pro Leu Thr Val 500 505 510 Ala Pro Gln Asp Thr Leu Ala His Val Leu Tyr Val Leu Asn Arg Phe 515 520 525 Gln Ile Ser Arg Leu Pro Val Val Asp Gly Arg Lys Leu Val Gly Ile 530 535 540 Ile Thr Arg Ala Asp Ile Ile Arg Ala Glu Ser Glu Leu Leu Ser Gly 545 550 555 560 Gln Asp Ile Ala Ala Thr Pro Ile Ala Pro Ser Tyr Val Ala Tyr Glu 565 570 575 Thr Arg Ser Pro Ala Thr Gly Gln Gly Arg Leu Leu Val Leu Leu Ala 580 585 590 Asn Pro Arg Thr Ala Gln Ser Leu Leu Gln Leu Ala Ala Gly Leu Ala 595 600 605 Ser Leu Arg Asn Tyr Glu Leu Glu Cys Leu His Leu Ile Pro Val Ser 610 615 620 Arg Glu Ala Asp Pro Ser Gln Thr Ala Val Ser Thr Leu Gly Ala Arg 625 630 635 640 Arg Met Leu Arg Gln Ala Glu Arg Leu Gly Arg Arg Trp Gln Ile Pro 645 650 655 Val His Thr Gln Val Arg Val Cys His Asp Leu Ser Ala Ala Ile Leu 660 665 670 Glu Thr Ile Ser Asp Arg His Ile Asn Asp Leu Val Met Gly Trp Gly 675 680 685 Gly Gly Ala Ser Leu Ala Gln Arg Leu Phe Arg Glu Gly Ile Asp Gln 690 695 700 Ile Leu Gln Gln Ala Pro Cys Arg Val Leu Leu Val Lys Pro Gly Ala 705 710 715 720 Ala Phe Leu Ala Lys Ala Pro Leu Leu Gln Gly Asp Arg Pro Thr Leu 725 730 735 Pro Leu Arg His Trp Leu Ile Pro Leu Ser Ala Gln Val Pro Gln Thr 740 745 750 Gly Leu Ala Glu Pro Leu Glu Gln Ile Leu Gln Leu Ile Thr Asp Pro 755 760 765 Asp Ile Ser Leu Cys Gln Ile Asp Leu Pro Arg Gln Thr Val Ser Ala 770 775 780 Asn Arg Leu Gln Gln Leu Gln Arg Arg Leu Glu Asn Arg Leu Arg Gln 785 790 795 800 Pro Ile Gln Ala Asp Leu Ile Cys Ala Arg Ser Val Thr Ala Val Leu 805 810 815 Leu Asp Val Met Gln Ser Arg Gly Ile Glu Ala Val Met Leu Ser Met 820 825 830 Thr Leu Glu Gln Leu Pro Thr Thr Thr Leu Trp Lys Asp Leu Leu Ala 835 840 845 Gln Ala Pro Gln Thr Val Ile Ile Gln Arg Arg 850 855 <210> 113 <211> 10 <212> PRT <213> Artificial sequence <220> <223> motif 9 <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Ser" <220> <221> VARIANT <222> (3)..(3) <223> / replace = "Ile" <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Gln" <220> <221> VARIANT <222> (5)..(5) <223> / replace = "Val" <220> <221> VARIANT <222> (8)..(8) <223> / replace = "Ser" / replace = "Gly" <400> 113 Pro Thr Val His Ile Gly Ala Ala Leu Ala 1 5 10 <210> 114 <211> 16 <212> PRT <213> Artificial sequence <220> <223> motif 10 <220> <221> VARIANT <222> (1)..(1) <223> / replace = "Ser" <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Leu" / replace = "Val" <220> <221> VARIANT <222> (5)..(5) <223> / replace = "Leu" <220> <221> UNSURE <222> (6)..(6) <223> Unknown amino acid <220> <221> VARIANT <222> (8)..(8) <223> / replace = "Ser" / replace = "Thr" <220> <221> UNSURE <222> (10)..(10) <223> Unknown amino acid <220> <221> VARIANT <222> (11)..(11) <223> / replace = "Met" <220> <221> VARIANT <222> (13)..(13) <223> / replace = "Ala" / replace = "Thr" <220> <221> UNSURE <222> (14)..(14) <223> Unknown amino acid <400> 114 Pro Gly Gly Ile Phe Xaa Pro Ala Leu Xaa Leu Gly Ser Xaa Leu Gly 1 5 10 15 <210> 115 <211> 1264 <212> DNA <213> Oryza sativa <400> 115 tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60 ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120 tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180 acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240 gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300 ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360 cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420 gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480 aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540 tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600 caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660 ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720 gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780 tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840 cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900 gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960 aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020 aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080 atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140 tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200 taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260 gatc 1264 <210> 116 <211> 54 <212> DNA <213> Artificial sequence <220> <223> primer 1 <400> 116 ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc ttggtttccc tttt 54 <210> 117 <211> 52 <212> DNA <213> Artificial sequence <220> <223> primer 2 <400> 117 ggggaccact ttgtacaaga aagctgggtt tactcgtcta gaccgaaatc tg 52 <210> 118 <211> 2940 <212> DNA <213> Synechocystis sp. <400> 118 ttaattggga aatttaatgt aacggttccg cttcataaat gcggcgactt tgagccaatt 60 ttttgcttcc ttttcccaat tcttctggct agtagtctgc caaagttgaa ttaaaaaaca 120 agctaaacga gacctcaaag tcgattgttg atccttgtcg agggcatcac gccgctctac 180 caaaacattt acccagggca taattgcttc ccgcaccgga atgggatgct gttctaaaac 240 cgtagcggcg gtttcgtagg tggaagcatc aatggtttca atatctagta aatccttcca 300 tgtcttaaat acttcaaatt tgctggtggc ggtcaaaaca ttaccgttgc cgtaaataac 360 ccgtacttgt actgcatcct tggatttttt atcttctcct tctccatact catgttcttt 420 ggcttcctct tccgcttccc aaagatgctc caaggcgatc gccaggggga cagagtggtg 480 ggcaatggta atgccaaagc taatggtggc cccatccccc atggtaaaca agggccgttg 540 gggcaagttt ttgtgggcag tttttgagtg ccaataatgc cccgtgctgt caaattccct 600 gtgttcatcg cgatcgccac gaaaggcttg gcgaatgtcc cacaaccatt gatcccattc 660 ccacaggttg gtgtaggcca gtacatcgtc tccgccgcta taaattaatc tgcctgcata 720 tctttgttcg gtgaggtagg gcaccaattg gttggagaaa tccagcaggg ctcgactcag 780 ggcgttatgg gtagcagggc ccatccgttt aggctgttcg ctaaagggtt gaaaagttgg 840 ctgtaggtct tccggcacag ttaaaacctg gggaaaataa tcgccgtagg ttctcatttt 900 ggtgcccttg agccattcgc tcatgccatc cccatcccca gcagctaaaa cgtaccaact 960 agtgggatta ttctggggat aaaatttttc gatttctgtt tgcaatgctt ggcgataact 1020 aggcaactct gtttggtcga gatcttccaa ttcttccacc aaccaacccg aatttagtag 1080 ccggggatga tattttttct ccatgttttc ttcgacccag ggaattcccc aatcttgggt 1140 gacagaatcg gccactttat ggcgatcgcc aaggattttt tgggagatgg cggagcaggc 1200 ctgctcaaaa atcggtagac catccggttg ggtttttaaa tatcccgcta tgcccaccgt 1260 aagatctggg taataggttt ttaattcctt ggccccccgt cccagtaatg caggcaatac 1320 tttttccaaa ccccgcttca ctgtttccgt ggcatttaac tgttcactgc catcaaataa 1380 ccctgcctgt cgttgccaat atttttgtgt atctccctct gtgacccaat cccgttggtg 1440 actaggggct tggggatgga ccactggccc aaggccggaa atggtggacc gggggccaaa 1500 ggcggtggga attttccagt tgcgagcatt tttaaccgca ctaagggtaa atctggtttg 1560 gccaaagata tctgcccacc aggaacccac attcaagcta ccggcatagt tgcggttccg 1620 ttgctggata aacaaatccg tggatttttc gataaagtcc aattcttcct gggcaaataa 1680 actagcggaa aatgcttcat tttgttccct aacccattgg tctcgttggg ctttactttc 1740 cggtgtttgg gtgggaatgc ccacactttt tagggttttt ccctccgccc cgatcgccat 1800 ggcgctccaa taggtctgcc actgggcatc cagccaatgt ttccaggtgg gatcagttgg 1860 gtttaactgt ttttgccaat gtcgttgttg caattctgca aagactaaat gggcaatatt 1920 tcgccaagcg tttagtagat gatttttggc cgattgcatg gcggcgctaa ctttttcttt 1980 gggcagtacc aacataatta cgttgggaaa tcccgctgtt aacagttggc gatcgcctgg 2040 ctggggtacc cactgactaa agccttgctc accatatttt tctagtagcc aatggtcgat 2100 caagggttga ccgtacaggc tggggtacag gaaacaatcg gggccatact gctgggccaa 2160 ttcccaacaa actttggcgg acaggtagtg caatatccaa gacccagccc aaaagtcttt 2220 gattttacgg ctggctttaa ttagttcttg aatggggcta aaggtgaata cggccagata 2280 agcttgggat ttgggtgtat ttcttgctcc tttggcaata tcttcaatgt tggtgtcata 2340 gcccgccaat gctccggcta aggcggctgt catactgcca tggctccaaa tggaagcatc 2400 gggcaaacgg gtttccgctg gcattaacaa gctctctggg ccaaattgtt cggccactgc 2460 ttcgggcaaa catcgccata accaccaaaa gcattcctgg gctttgtctg taccatggag 2520 aaattccgct ggcatttgct ggatcagttc taattctttt tgctctaaat aagtacggcg 2580 attaccttgg ccaataattt cgctatgatt tgctagtttt aatggcaact tagccccgga 2640 taggagatgg gaaagttcga gccctttgcc gtcatagtct atgggcgtac caatatagtg 2700 aatggctccc cgatcgctgg cggaagcgat tagatcggat aaaccaatat ggtcaagcca 2760 actattgctc agttcaccgt cttttttttc tgtgctggat ttgggtgaca cccagttttg 2820 catacagccc aaggactgcc aagctccctc tcctcctctg ccagagttgt tatgtaaagc 2880 tttgagggcg gggtcgtgga gtagccccca aatttttgct tgccagtaaa cttcagacac 2940 <210> 119 <211> 979 <212> PRT <213> Synechocystis sp. <400> 119 Met Ser Glu Val Tyr Trp Gln Ala Lys Ile Trp Gly Leu Leu His Asp 1 5 10 15 Pro Ala Leu Lys Ala Leu His Asn Asn Ser Gly Arg Gly Gly Glu Gly 20 25 30 Ala Trp Gln Ser Leu Gly Cys Met Gln Asn Trp Val Ser Pro Lys Ser 35 40 45 Ser Thr Glu Lys Lys Asp Gly Glu Leu Ser Asn Ser Trp Leu Asp His 50 55 60 Ile Gly Leu Ser Asp Leu Ile Ala Ser Ala Ser Asp Arg Gly Ala Ile 65 70 75 80 His Tyr Ile Gly Thr Pro Ile Asp Tyr Asp Gly Lys Gly Leu Glu Leu 85 90 95 Ser His Leu Leu Ser Gly Ala Lys Leu Pro Leu Lys Leu Ala Asn His 100 105 110 Ser Glu Ile Ile Gly Gln Gly Asn Arg Arg Thr Tyr Leu Glu Gln Lys 115 120 125 Glu Leu Glu Leu Ile Gln Gln Met Pro Ala Glu Phe Leu His Gly Thr 130 135 140 Asp Lys Ala Gln Glu Cys Phe Trp Trp Leu Trp Arg Cys Leu Pro Glu 145 150 155 160 Ala Val Ala Glu Gln Phe Gly Pro Glu Ser Leu Leu Met Pro Ala Glu 165 170 175 Thr Arg Leu Pro Asp Ala Ser Ile Trp Ser His Gly Ser Met Thr Ala 180 185 190 Ala Leu Ala Gly Ala Leu Ala Gly Tyr Asp Thr Asn Ile Glu Asp Ile 195 200 205 Ala Lys Gly Ala Arg Asn Thr Pro Lys Ser Gln Ala Tyr Leu Ala Val 210 215 220 Phe Thr Phe Ser Pro Ile Gln Glu Leu Ile Lys Ala Ser Arg Lys Ile 225 230 235 240 Lys Asp Phe Trp Ala Gly Ser Trp Ile Leu His Tyr Leu Ser Ala Lys 245 250 255 Val Cys Trp Glu Leu Ala Gln Gln Tyr Gly Pro Asp Cys Phe Leu Tyr 260 265 270 Pro Ser Leu Tyr Gly Gln Pro Leu Ile Asp His Trp Leu Leu Glu Lys 275 280 285 Tyr Gly Glu Gln Gly Phe Ser Gln Trp Val Pro Gln Pro Gly Asp Arg 290 295 300 Gln Leu Leu Thr Ala Gly Phe Pro Asn Val Ile Met Leu Val Leu Pro 305 310 315 320 Lys Glu Lys Val Ser Ala Ala Met Gln Ser Ala Lys Asn His Leu Leu 325 330 335 Asn Ala Trp Arg Asn Ile Ala His Leu Val Phe Ala Glu Leu Gln Gln 340 345 350 Arg His Trp Gln Lys Gln Leu Asn Pro Thr Asp Pro Thr Trp Lys His 355 360 365 Trp Leu Asp Ala Gln Trp Gln Thr Tyr Trp Ser Ala Met Ala Ile Gly 370 375 380 Ala Glu Gly Lys Thr Leu Lys Ser Val Gly Ile Pro Thr Gln Thr Pro 385 390 395 400 Glu Ser Lys Ala Gln Arg Asp Gln Trp Val Arg Glu Gln Asn Glu Ala 405 410 415 Phe Ser Ala Ser Leu Phe Ala Gln Glu Glu Leu Asp Phe Ile Glu Lys 420 425 430 Ser Thr Asp Leu Phe Ile Gln Gln Arg Asn Arg Asn Tyr Ala Gly Ser 435 440 445 Leu Asn Val Gly Ser Trp Trp Ala Asp Ile Phe Gly Gln Thr Arg Phe 450 455 460 Thr Leu Ser Ala Val Lys Asn Ala Arg Asn Trp Lys Ile Pro Thr Ala 465 470 475 480 Phe Gly Pro Arg Ser Thr Ile Ser Gly Leu Gly Pro Val Val His Pro 485 490 495 Gln Ala Pro Ser His Gln Arg Asp Trp Val Thr Glu Gly Asp Thr Gln 500 505 510 Lys Tyr Trp Gln Arg Gln Ala Gly Leu Phe Asp Gly Ser Glu Gln Leu 515 520 525 Asn Ala Thr Glu Thr Val Lys Arg Gly Leu Glu Lys Val Leu Pro Ala 530 535 540 Leu Leu Gly Arg Gly Ala Lys Glu Leu Lys Thr Tyr Tyr Pro Asp Leu 545 550 555 560 Thr Val Gly Ile Ala Gly Tyr Leu Lys Thr Gln Pro Asp Gly Leu Pro 565 570 575 Ile Phe Glu Gln Ala Cys Ser Ala Ile Ser Gln Lys Ile Leu Gly Asp 580 585 590 Arg His Lys Val Ala Asp Ser Val Thr Gln Asp Trp Gly Ile Pro Trp 595 600 605 Val Glu Glu Asn Met Glu Lys Lys Tyr His Pro Arg Leu Leu Asn Ser 610 615 620 Gly Trp Leu Val Glu Glu Leu Glu Asp Leu Asp Gln Thr Glu Leu Pro 625 630 635 640 Ser Tyr Arg Gln Ala Leu Gln Thr Glu Ile Glu Lys Phe Tyr Pro Gln 645 650 655 Asn Asn Pro Thr Ser Trp Tyr Val Leu Ala Ala Gly Asp Gly Asp Gly 660 665 670 Met Ser Glu Trp Leu Lys Gly Thr Lys Met Arg Thr Tyr Gly Asp Tyr 675 680 685 Phe Pro Gln Val Leu Thr Val Pro Glu Asp Leu Gln Pro Thr Phe Gln 690 695 700 Pro Phe Ser Glu Gln Pro Lys Arg Met Gly Pro Ala Thr His Asn Ala 705 710 715 720 Leu Ser Arg Ala Leu Leu Asp Phe Ser Asn Gln Leu Val Pro Tyr Leu 725 730 735 Thr Glu Gln Arg Tyr Ala Gly Arg Leu Ile Tyr Ser Gly Gly Asp Asp 740 745 750 Val Leu Ala Tyr Thr Asn Leu Trp Glu Trp Asp Gln Trp Leu Trp Asp 755 760 765 Ile Arg Gln Ala Phe Arg Gly Asp Arg Asp Glu His Arg Glu Phe Asp 770 775 780 Ser Thr Gly His Tyr Trp His Ser Lys Thr Ala His Lys Asn Leu Pro 785 790 795 800 Gln Arg Pro Leu Phe Thr Met Gly Asp Gly Ala Thr Ile Ser Phe Gly 805 810 815 Ile Thr Ile Ala His His Ser Val Pro Leu Ala Ile Ala Leu Glu His 820 825 830 Leu Trp Glu Ala Glu Glu Glu Ala Lys Glu His Glu Tyr Gly Glu Gly 835 840 845 Glu Asp Lys Lys Ser Lys Asp Ala Val Gln Val Arg Val Ile Tyr Gly 850 855 860 Asn Gly Asn Val Leu Thr Ala Thr Ser Lys Phe Glu Val Phe Lys Thr 865 870 875 880 Trp Lys Asp Leu Leu Asp Ile Glu Thr Ile Asp Ala Ser Thr Tyr Glu 885 890 895 Thr Ala Ala Thr Val Leu Glu Gln His Pro Ile Pro Val Arg Glu Ala 900 905 910 Ile Met Pro Trp Val Asn Val Leu Val Glu Arg Arg Asp Ala Leu Asp 915 920 925 Lys Asp Gln Gln Ser Thr Leu Arg Ser Arg Leu Ala Cys Phe Leu Ile 930 935 940 Gln Leu Trp Gln Thr Thr Ser Gln Lys Asn Trp Glu Lys Glu Ala Lys 945 950 955 960 Asn Trp Leu Lys Val Ala Ala Phe Met Lys Arg Asn Arg Tyr Ile Lys 965 970 975 Phe Pro Asn <210> 120 <211> 2952 <212> DNA <213> Synechococcus sp. <400> 120 ttaaactttg cgagtacgaa gattaaaggc tgcggctttg agccagtttt tggattcttt 60 atcccagtca tctgcgttgg tcgtattcca cagttcttgc aaaaagtgag ctaaatattt 120 ttgcaagccg attttttgtt cttcgttaag gttgctacgc cgctccacaa aagcactgac 180 ccatggggcg atcgccactg aagtcggaat aggatgctgt tctaaaaggg ttgccgccgt 240 ttcaaaggtt gaagcttcca gacctgtgat ttctaagagt tgttgccacg ctcggaaagt 300 atcgaattta caggttgctt tgaggatatt gccattgcca tagatcaccc gcaactgcac 360 cgcatctttc tttttctttc tctccttacc ttctagggcg aaatcttcat attcatgatc 420 tttagctcct tcttctgctt cccagagatt ttcgagggcg atcgccaagg gaacagaatg 480 atgggcaatg actaaaccaa aactaatagt tgcattcttg cccatggtaa aaagagggcg 540 atcaaaccga tcggcttgcc agtaatgacc ttgattatta aattcaccac aatcgtcttt 600 atctcctcga aaagcttggc ggatatccca aagccactga tcccattccc atagatttgt 660 ataagccagg acatcatcac cgccgctgta aatcaagcgt ccggcatagc gttcttcagt 720 gaggtagggg gcaagtttat tagaaaagtc gaggagggca cggcttaggg cattgtgggt 780 ggcggggccc atccgttttg cttcgtcgct aaatttgtca aagctttttt ttaaatcatt 840 aggaacattg agagctttgg ggaaatattc tttgtaggct tccatctttg ttcccttcaa 900 ccaatcgctc atcccatcgc catctccagc ggcgatcgca taccaactgg cgggattatt 960 ttggggatag aatttctgaa tttcgttctg tagatcctga cgataaactt tttgagcttc 1020 cttatcgagg ttttctaact cctccacaag ccagcctgca tttaatagtc ttggatgggg 1080 caaattctca aataacggat catgagtctc atcaatccat ggaatgcccc actcttgccg 1140 gacaaaattc gcgatttcat ggtggtctgc cgtaattttt gtcctaatcg cacgacaagc 1200 atcttgatat tgatttaaag cttctccatt tttctcactt tgggttttga ggtaacccgc 1260 aacgccgacg gttaaatcag gataataagc ctttaattcg gtcggatctc gatccaatag 1320 tttgggtaaa actttttcta aaccgcgctt aacagtttca gtggcgttga gttgctcgat 1380 cccatcaaac aagcctgcat cccgttgcca ataatgttgc gcctctccct cagtgagcca 1440 atcacgatgt tggccattgc cttggggatg gacgacaggc cctaaaccag agatcgtaga 1500 gcgggtgcca aaagcggtcg gcagtttcca gttacgggca tttttaacgg tattgagggc 1560 gagacgagtc tgcccacaaa tatctgccca ccatgagcct gcgtttaagc tgcctgcata 1620 attacggttg cgttgttcgg taaattttgc tgtcgctttc tcaaaaaagt cccgttcagt 1680 atctgtgaaa agcttgccat taaaggcttt attttgttgt tcgatccatt tttcgagatc 1740 agcctttttg tctgaagtct gggtaggaat cccaacactc ttaaagctgc tatttttatc 1800 accgatcgcc accgcactcc aataggtttg ccattgggca tcgagccagc ctttccaact 1860 gggatctgta tcgctcaggt ttgtttgcca atggcgatcg ccttgtaatt ctgcgaggac 1920 ttccttcgca atttcgcgcc atgcatcaag taagaaattc tttgctgatt gcattgctgc 1980 agctacttgg gcttccggta acaccaacat gatgacgttg ggaaatccgg cagtgagcag 2040 ttgacggtca tctggtggct ggatccagtc ctcaaattct gaatgttttt gcaatagcca 2100 atgatcaatt agcggttgtc cataaagact gggatagaga aaacaatctg cgccgtattt 2160 gtgggccaat cgccagcaga ctttcgcaga aagataatgc aaaatccatg accccgccca 2220 aaagtccttc attttacgac tggctttaat gagttcctgg acgggactaa aggtaaacac 2280 cgccagataa gggtgagatt tcggggtatt ttgaccacct tttgggatat cgtctaactc 2340 ggtatcgtat cccgctaagg ctccggctaa ggcagcagtc atactggcat gactccagat 2400 cgaaccgtca ggtaagcgag tttcggcggg cattagaaaa cttgctgcgc caaattcatc 2460 agcgacagct tggggtaaac agcgccatag ccaccagaaa caagcctggg cagcttcagg 2520 atcgtcacga atttcggcgg gcatttgatc aatgagatcg gcttcagtct gttctaggta 2580 agtttttctg ctgctctgcc caaggatttc agcgtggttt tggagtcgga ggggcaattt 2640 ctccccagat aggaggtgcg ataactctag accttctgca ccgtagtcta cggctgtgcc 2700 gatgtagtgg ataatgccgc gatcgctggc tgaagaaatg agatcacata agccgacatg 2760 atctaaccat gtgccactaa gctcagatgc ttgtttttcc tcgctcgatt tcggagaagc 2820 ccagccttcc atacaagcaa gctttttcca taacccttct tcgccacgcc ccggattccc 2880 atagagtgct ttgagggcgg gatcatggag tagaccccaa atttttgctt gccaatatgc 2940 tttacctgcc ac 2952 <210> 121 <211> 983 <212> PRT <213> Synechococcus sp. <400> 121 Met Ala Gly Lys Ala Tyr Trp Gln Ala Lys Ile Trp Gly Leu Leu His 1 5 10 15 Asp Pro Ala Leu Lys Ala Leu Tyr Gly Asn Pro Gly Arg Gly Glu Glu 20 25 30 Gly Leu Trp Lys Lys Leu Ala Cys Met Glu Gly Trp Ala Ser Pro Lys 35 40 45 Ser Ser Glu Glu Lys Gln Ala Ser Glu Leu Ser Gly Thr Trp Leu Asp 50 55 60 His Val Gly Leu Cys Asp Leu Ile Ser Ser Ala Ser Asp Arg Gly Ile 65 70 75 80 Ile His Tyr Ile Gly Thr Ala Val Asp Tyr Gly Ala Glu Gly Leu Glu 85 90 95 Leu Ser His Leu Leu Ser Gly Glu Lys Leu Pro Leu Arg Leu Gln Asn 100 105 110 His Ala Glu Ile Leu Gly Gln Ser Ser Arg Lys Thr Tyr Leu Glu Gln 115 120 125 Thr Glu Ala Asp Leu Ile Asp Gln Met Pro Ala Glu Ile Arg Asp Asp 130 135 140 Pro Glu Ala Ala Gln Ala Cys Phe Trp Trp Leu Trp Arg Cys Leu Pro 145 150 155 160 Gln Ala Val Ala Asp Glu Phe Gly Ala Ala Ser Phe Leu Met Pro Ala 165 170 175 Glu Thr Arg Leu Pro Asp Gly Ser Ile Trp Ser His Ala Ser Met Thr 180 185 190 Ala Ala Leu Ala Gly Ala Leu Ala Gly Tyr Asp Thr Glu Leu Asp Asp 195 200 205 Ile Pro Lys Gly Gly Gln Asn Thr Pro Lys Ser His Pro Tyr Leu Ala 210 215 220 Val Phe Thr Phe Ser Pro Val Gln Glu Leu Ile Lys Ala Ser Arg Lys 225 230 235 240 Met Lys Asp Phe Trp Ala Gly Ser Trp Ile Leu His Tyr Leu Ser Ala 245 250 255 Lys Val Cys Trp Arg Leu Ala His Lys Tyr Gly Ala Asp Cys Phe Leu 260 265 270 Tyr Pro Ser Leu Tyr Gly Gln Pro Leu Ile Asp His Trp Leu Leu Gln 275 280 285 Lys His Ser Glu Phe Glu Asp Trp Ile Gln Pro Pro Asp Asp Arg Gln 290 295 300 Leu Leu Thr Ala Gly Phe Pro Asn Val Ile Met Leu Val Leu Pro Glu 305 310 315 320 Ala Gln Val Ala Ala Ala Met Gln Ser Ala Lys Asn Phe Leu Leu Asp 325 330 335 Ala Trp Arg Glu Ile Ala Lys Glu Val Leu Ala Glu Leu Gln Gly Asp 340 345 350 Arg His Trp Gln Thr Asn Leu Ser Asp Thr Asp Pro Ser Trp Lys Gly 355 360 365 Trp Leu Asp Ala Gln Trp Gln Thr Tyr Trp Ser Ala Val Ala Ile Gly 370 375 380 Asp Lys Asn Ser Ser Phe Lys Ser Val Gly Ile Pro Thr Gln Thr Ser 385 390 395 400 Asp Lys Lys Ala Asp Leu Glu Lys Trp Ile Glu Gln Gln Asn Lys Ala 405 410 415 Phe Asn Gly Lys Leu Phe Thr Asp Thr Glu Arg Asp Phe Phe Glu Lys 420 425 430 Ala Thr Ala Lys Phe Thr Glu Gln Arg Asn Arg Asn Tyr Ala Gly Ser 435 440 445 Leu Asn Ala Gly Ser Trp Trp Ala Asp Ile Cys Gly Gln Thr Arg Leu 450 455 460 Ala Leu Asn Thr Val Lys Asn Ala Arg Asn Trp Lys Leu Pro Thr Ala 465 470 475 480 Phe Gly Thr Arg Ser Thr Ile Ser Gly Leu Gly Pro Val Val His Pro 485 490 495 Gln Gly Asn Gly Gln His Arg Asp Trp Leu Thr Glu Gly Glu Ala Gln 500 505 510 His Tyr Trp Gln Arg Asp Ala Gly Leu Phe Asp Gly Ile Glu Gln Leu 515 520 525 Asn Ala Thr Glu Thr Val Lys Arg Gly Leu Glu Lys Val Leu Pro Lys 530 535 540 Leu Leu Asp Arg Asp Pro Thr Glu Leu Lys Ala Tyr Tyr Pro Asp Leu 545 550 555 560 Thr Val Gly Val Ala Gly Tyr Leu Lys Thr Gln Ser Glu Lys Asn Gly 565 570 575 Glu Ala Leu Asn Gln Tyr Gln Asp Ala Cys Arg Ala Ile Arg Thr Lys 580 585 590 Ile Thr Ala Asp His His Glu Ile Ala Asn Phe Val Arg Gln Glu Trp 595 600 605 Gly Ile Pro Trp Ile Asp Glu Thr His Asp Pro Leu Phe Glu Asn Leu 610 615 620 Pro His Pro Arg Leu Leu Asn Ala Gly Trp Leu Val Glu Glu Leu Glu 625 630 635 640 Asn Leu Asp Lys Glu Ala Gln Lys Val Tyr Arg Gln Asp Leu Gln Asn 645 650 655 Glu Ile Gln Lys Phe Tyr Pro Gln Asn Asn Pro Ala Ser Trp Tyr Ala 660 665 670 Ile Ala Ala Gly Asp Gly Asp Gly Met Ser Asp Trp Leu Lys Gly Thr 675 680 685 Lys Met Glu Ala Tyr Lys Glu Tyr Phe Pro Lys Ala Leu Asn Val Pro 690 695 700 Asn Asp Leu Lys Lys Ser Phe Asp Lys Phe Ser Asp Glu Ala Lys Arg 705 710 715 720 Met Gly Pro Ala Thr His Asn Ala Leu Ser Arg Ala Leu Leu Asp Phe 725 730 735 Ser Asn Lys Leu Ala Pro Tyr Leu Thr Glu Glu Arg Tyr Ala Gly Arg 740 745 750 Leu Ile Tyr Ser Gly Gly Asp Asp Val Leu Ala Tyr Thr Asn Leu Trp 755 760 765 Glu Trp Asp Gln Trp Leu Trp Asp Ile Arg Gln Ala Phe Arg Gly Asp 770 775 780 Lys Asp Asp Cys Gly Glu Phe Asn Asn Gln Gly His Tyr Trp Gln Ala 785 790 795 800 Asp Arg Phe Asp Arg Pro Leu Phe Thr Met Gly Lys Asn Ala Thr Ile 805 810 815 Ser Phe Gly Leu Val Ile Ala His His Ser Val Pro Leu Ala Ile Ala 820 825 830 Leu Glu Asn Leu Trp Glu Ala Glu Glu Gly Ala Lys Asp His Glu Tyr 835 840 845 Glu Asp Phe Ala Leu Glu Gly Lys Glu Arg Lys Lys Lys Lys Asp Ala 850 855 860 Val Gln Leu Arg Val Ile Tyr Gly Asn Gly Asn Ile Leu Lys Ala Thr 865 870 875 880 Cys Lys Phe Asp Thr Phe Arg Ala Trp Gln Gln Leu Leu Glu Ile Thr 885 890 895 Gly Leu Glu Ala Ser Thr Phe Glu Thr Ala Ala Thr Leu Leu Glu Gln 900 905 910 His Pro Ile Pro Thr Ser Val Ala Ile Ala Pro Trp Val Ser Ala Phe 915 920 925 Val Glu Arg Arg Ser Asn Leu Asn Glu Glu Gln Lys Ile Gly Leu Gln 930 935 940 Lys Tyr Leu Ala His Phe Leu Gln Glu Leu Trp Asn Thr Thr Asn Ala 945 950 955 960 Asp Asp Trp Asp Lys Glu Ser Lys Asn Trp Leu Lys Ala Ala Ala Phe 965 970 975 Asn Leu Arg Thr Arg Lys Val 980 <210> 122 <211> 2988 <212> DNA <213> Synechococcus sp. <400> 122 tcatcggccg ttcctcccca atttcacggt gcggttgcgc agcacaaaag ccgccagctt 60 gaaccagttt ttgatctcca gatcccactc ctggggctgg gcgggcaggc tgtgctgcca 120 aaaatgctgg ataaactcca caagcttgtt ctggaagtgc tctttctgct ccgattcctg 180 tttgaagaga tcccggcggc tgcaaaagag cgtggcccag gctggcaccg cctctgggct 240 gggggcagga tgttgctccc acagttgggc tgcctgctca aacaaggagc tttgatcctg 300 ctgctggccc atgagcttcc agtcaaaatc aaggagatcc ttccacttgt cgaacgtgtc 360 gaacttgctg gtgctcacca gttggttgcc attggcaaac agcacccgca cctgcacgct 420 gtctttgggg cagccatggg catagaggtg gcccttggct tcttcttccg cctgccaaag 480 gttttccagg gcaatggcca gaggcaccga gtgatgggca atcaccacgc cgaagctgat 540 ggtggctgcg gatcccaggg taaagagggg gcgccggctc aaaccttcgg gaggccgccc 600 ttttttccac tgccagtagt cccccaggtt ctcaaactcc cgccagtcat cctctccccc 660 ccggaaacac tggcgaatat cccacagcca gccatcccac tcccagaggt tggtgtaggc 720 caaaacgtcg tccccgccgg cgtagatgag cttgcctgcg tagcgttgct ctgttaggta 780 gggcaccaac tggccggaaa aatccagcag ggcgcggctt agggcgctgt gggtggcagg 840 ccccatgcgc ttgcggctgt ttttgacaaa cttctgaaaa gcgtctttga cttgctccag 900 ctcctccttg tccttgccaa agacctcgcc aatggcttcc gtttgcccgt tggccagccg 960 ctgtaggggt tgaggcagat agtcgtagta ggatttcatc ttctcgcccc tgagccattt 1020 gcccatgtcg tccccatccc cggcagccag cacgtaccaa ctggcggggt taacgctggg 1080 gtagtagcgg cctagaagcg tctcgatgtc ctgccggtag cttctttgcg tttcctcgtc 1140 cagctccagg tcttccacca gccaaccggc attgagcaga cggggatggt agcgcaggtt 1200 ctgccggtcg gcccacggga tcccccattt gccccgcatt tcccgcagca cccctctgac 1260 ctccgggtag cgggcctcca ctgcctgaca ggcctgctcg aagtgctctc gttcccgtcg 1320 cccttgggtt ttgaggtagc cggctacgcc agccgtgaga tccgggtagg aagcggcaat 1380 ctggtcttca tccagctcgc ggaagagctc cggcagcact ttgtacaagc cccgcttgag 1440 ggtttcggtg gcattgagct gttcccggcc atcgaagagc ccggcctgcc gttgccaaag 1500 ccgccgactc tccccttctg ttatccaccc ctgccgcggt gagggatgca ccaccggccc 1560 caagcccgaa acggtgctgc gcggcccaaa cgcaacgggg agctgccaat cgcgggcctg 1620 cttacaagcg gcttgtagcc gccgactttg ctccactgcg gctgcccacc aagatcccac 1680 gttgagtccg gccttgtatt ggcggcgctg ttgtctttgg ggatcccaga agctaactcg 1740 caagaactcc agctcctcat ccccgaagag cttttgcttg gcctctaggt gatgggtgcg 1800 gttttgggca ctgacccagg gatccgcatc aatggaaacc tgagggggcc taaggatgcc 1860 ggtatccttg agggcatgag ccggggatcc caggggcacg gctgcccagt agtgctgcca 1920 ctggtgctcc agccatccct gccaggtggg atcctctggg tgcaactgcc tcagccagcg 1980 gcgatccgcc tgcaggtgat ccagcaccct ctgggccaac tgcttccatt cttccttgag 2040 ggtctgctgg gcaaactgca tggccgcctc cacccgctct tctggcagca gcagcaggag 2100 cacattggga aagccggcgg tgagcagggc gttaggcgaa ggctgaggga tccattcttc 2160 aaattcgggg tacttctccc gcagccagta gtcgattaat ggctggccat agaggctggg 2220 gtagagcaga cagtcggggc cgtatttctc ggcaagccgc caacttatgc gagcagaaag 2280 gtagtgcagc agccaggagc cagcccagaa gtcccgcatt ttgcggctgg ctttgatcag 2340 ctcctggatg gggttgaagg taaagctcac caagaaggga cgcgcgaact tgggctcgtc 2400 gtagccggcc aaacatccgg ccaaggctgc ggtgacgctg gcgtggctcc acagggatcc 2460 gtctggcagc cgggtttctg ccggcaacag cagcaagctc tcatccccaa actcctgaca 2520 aatagcttgg ggaaagcacc gccaaaacca ccaaaacact ttttggggat ccgtctcctg 2580 ccgaacccaa tcagggatgg cgttctcctc ccgttccatc aggtagtctg cacgggagtg 2640 ggcattcttg agggcttggt gttgctcatt ggccaattgc caaaagtgct tgcgccccga 2700 gagcagatgg ctcatctcca gtccagagcc taacccctgg ccgcgatcct caacctggta 2760 gtcgatggct acaggcaaat ggccaatggc cgcgcggtcg ctggccgagg cgatgagatc 2820 agcatcgcct atgggagagg atccctcggc tttgggagaa gaccatccct gcatcgccgc 2880 cagtctggtc cacagccctt ccttggagcg gccagtcctg tcgtgtaggg ctttgagggc 2940 gggatcatgt aacagacccc agagcttagc ttgccagtag taagacat 2988 <210> 123 <211> 995 <212> PRT <213> Synechococcus sp. <400> 123 Met Ser Tyr Tyr Trp Gln Ala Lys Leu Trp Gly Leu Leu His Asp Pro 1 5 10 15 Ala Leu Lys Ala Leu His Asp Arg Thr Gly Arg Ser Lys Glu Gly Leu 20 25 30 Trp Thr Arg Leu Ala Ala Met Gln Gly Trp Ser Ser Pro Lys Ala Glu 35 40 45 Gly Ser Ser Pro Ile Gly Asp Ala Asp Leu Ile Ala Ser Ala Ser Asp 50 55 60 Arg Ala Ala Ile Gly His Leu Pro Val Ala Ile Asp Tyr Gln Val Glu 65 70 75 80 Asp Arg Gly Gln Gly Leu Gly Ser Gly Leu Glu Met Ser His Leu Leu 85 90 95 Ser Gly Arg Lys His Phe Trp Gln Leu Ala Asn Glu Gln His Gln Ala 100 105 110 Leu Lys Asn Ala His Ser Arg Ala Asp Tyr Leu Met Glu Arg Glu Glu 115 120 125 Asn Ala Ile Pro Asp Trp Val Arg Gln Glu Thr Asp Pro Gln Lys Val 130 135 140 Phe Trp Trp Phe Trp Arg Cys Phe Pro Gln Ala Ile Cys Gln Glu Phe 145 150 155 160 Gly Asp Glu Ser Leu Leu Leu Leu Pro Ala Glu Thr Arg Leu Pro Asp 165 170 175 Gly Ser Leu Trp Ser His Ala Ser Val Thr Ala Ala Leu Ala Gly Cys 180 185 190 Leu Ala Gly Tyr Asp Glu Pro Lys Phe Ala Arg Pro Phe Leu Val Ser 195 200 205 Phe Thr Phe Asn Pro Ile Gln Glu Leu Ile Lys Ala Ser Arg Lys Met 210 215 220 Arg Asp Phe Trp Ala Gly Ser Trp Leu Leu His Tyr Leu Ser Ala Arg 225 230 235 240 Ile Ser Trp Arg Leu Ala Glu Lys Tyr Gly Pro Asp Cys Leu Leu Tyr 245 250 255 Pro Ser Leu Tyr Gly Gln Pro Leu Ile Asp Tyr Trp Leu Arg Glu Lys 260 265 270 Tyr Pro Glu Phe Glu Glu Trp Ile Pro Gln Pro Ser Pro Asn Ala Leu 275 280 285 Leu Thr Ala Gly Phe Pro Asn Val Leu Leu Leu Leu Leu Pro Glu Glu 290 295 300 Arg Val Glu Ala Ala Met Gln Phe Ala Gln Gln Thr Leu Lys Glu Glu 305 310 315 320 Trp Lys Gln Leu Ala Gln Arg Val Leu Asp His Leu Gln Ala Asp Arg 325 330 335 Arg Trp Leu Arg Gln Leu His Pro Glu Asp Pro Thr Trp Gln Gly Trp 340 345 350 Leu Glu His Gln Trp Gln His Tyr Trp Ala Ala Val Pro Leu Gly Ser 355 360 365 Pro Ala His Ala Leu Lys Asp Thr Gly Ile Leu Arg Pro Pro Gln Val 370 375 380 Ser Ile Asp Ala Asp Pro Trp Val Ser Ala Gln Asn Arg Thr His His 385 390 395 400 Leu Glu Ala Lys Gln Lys Leu Phe Gly Asp Glu Glu Leu Glu Phe Leu 405 410 415 Arg Val Ser Phe Trp Asp Pro Gln Arg Gln Gln Arg Arg Gln Tyr Lys 420 425 430 Ala Gly Leu Asn Val Gly Ser Trp Trp Ala Ala Ala Val Glu Gln Ser 435 440 445 Arg Arg Leu Gln Ala Ala Cys Lys Gln Ala Arg Asp Trp Gln Leu Pro 450 455 460 Val Ala Phe Gly Pro Arg Ser Thr Val Ser Gly Leu Gly Pro Val Val 465 470 475 480 His Pro Ser Pro Arg Gln Gly Trp Ile Thr Glu Gly Glu Ser Arg Arg 485 490 495 Leu Trp Gln Arg Gln Ala Gly Leu Phe Asp Gly Arg Glu Gln Leu Asn 500 505 510 Ala Thr Glu Thr Leu Lys Arg Gly Leu Tyr Lys Val Leu Pro Glu Leu 515 520 525 Phe Arg Glu Leu Asp Glu Asp Gln Ile Ala Ala Ser Tyr Pro Asp Leu 530 535 540 Thr Ala Gly Val Ala Gly Tyr Leu Lys Thr Gln Gly Arg Arg Glu Arg 545 550 555 560 Glu His Phe Glu Gln Ala Cys Gln Ala Val Glu Ala Arg Tyr Pro Glu 565 570 575 Val Arg Gly Val Leu Arg Glu Met Arg Gly Lys Trp Gly Ile Pro Trp 580 585 590 Ala Asp Arg Gln Asn Leu Arg Tyr His Pro Arg Leu Leu Asn Ala Gly 595 600 605 Trp Leu Val Glu Asp Leu Glu Leu Asp Glu Glu Thr Gln Arg Ser Tyr 610 615 620 Arg Gln Asp Ile Glu Thr Leu Leu Gly Arg Tyr Tyr Pro Ser Val Asn 625 630 635 640 Pro Ala Ser Trp Tyr Val Leu Ala Ala Gly Asp Gly Asp Asp Met Gly 645 650 655 Lys Trp Leu Arg Gly Glu Lys Met Lys Ser Tyr Tyr Asp Tyr Leu Pro 660 665 670 Gln Pro Leu Gln Arg Leu Ala Asn Gly Gln Thr Glu Ala Ile Gly Glu 675 680 685 Val Phe Gly Lys Asp Lys Glu Glu Leu Glu Gln Val Lys Asp Ala Phe 690 695 700 Gln Lys Phe Val Lys Asn Ser Arg Lys Arg Met Gly Pro Ala Thr His 705 710 715 720 Ser Ala Leu Ser Arg Ala Leu Leu Asp Phe Ser Gly Gln Leu Val Pro 725 730 735 Tyr Leu Thr Glu Gln Arg Tyr Ala Gly Lys Leu Ile Tyr Ala Gly Gly 740 745 750 Asp Asp Val Leu Ala Tyr Thr Asn Leu Trp Glu Trp Asp Gly Trp Leu 755 760 765 Trp Asp Ile Arg Gln Cys Phe Arg Gly Gly Glu Asp Asp Trp Arg Glu 770 775 780 Phe Glu Asn Leu Gly Asp Tyr Trp Gln Trp Lys Lys Gly Arg Pro Pro 785 790 795 800 Glu Gly Leu Ser Arg Arg Pro Leu Phe Thr Leu Gly Ser Ala Ala Thr 805 810 815 Ile Ser Phe Gly Val Val Ile Ala His His Ser Val Pro Leu Ala Ile 820 825 830 Ala Leu Glu Asn Leu Trp Gln Ala Glu Glu Glu Ala Lys Gly His Leu 835 840 845 Tyr Ala His Gly Cys Pro Lys Asp Ser Val Gln Val Arg Val Leu Phe 850 855 860 Ala Asn Gly Asn Gln Leu Val Ser Thr Ser Lys Phe Asp Thr Phe Asp 865 870 875 880 Lys Trp Lys Asp Leu Leu Asp Phe Asp Trp Lys Leu Met Gly Gln Gln 885 890 895 Gln Asp Gln Ser Ser Leu Phe Glu Gln Ala Ala Gln Leu Trp Glu Gln 900 905 910 His Pro Ala Pro Ser Pro Glu Ala Val Pro Ala Trp Ala Thr Leu Phe 915 920 925 Cys Ser Arg Arg Asp Leu Phe Lys Gln Glu Ser Glu Gln Lys Glu His 930 935 940 Phe Gln Asn Lys Leu Val Glu Phe Ile Gln His Phe Trp Gln His Ser 945 950 955 960 Leu Pro Ala Gln Pro Gln Glu Trp Asp Leu Glu Ile Lys Asn Trp Phe 965 970 975 Lys Leu Ala Ala Phe Val Leu Arg Asn Arg Thr Val Lys Leu Gly Arg 980 985 990 Asn Gly Arg 995 <210> 124 <211> 2563 <212> DNA <213> Cyanothece sp. <400> 124 ttaagctttt cctcctaatt taattttacg gttgcgaaga acaaaagctg ttagtttgaa 60 ccaactttga acgtcttgat ttaattgctc ctctgaagta tttgtccaca aatcttctat 120 aaattttgat agggctgttt gaaagctttt tctgatgtca tcattaaggg tttctcgacg 180 gctacaaaaa gcaactgtcc aaggtttaat cgcctcttga ataggaatag gatgttgagt 240 ccaaagggtg gcggcttgtt caaataagct ggcttctaac tcatttattc tgagtaattt 300 tttccattgt tcaaacactt caaatttgct agtggctttt aggatattac cgttaccata 360 aattactctc acttgaacgg catccttata agttttatgg ttattttcgt taatgtaatg 420 ttctttggct tcttcttctg cttcccaaag attttctaaa gcgatcgcta aaggaactga 480 atgatgagca ataacgattc caaaactaat tgtcgcattt tgacccattg tgaataaggg 540 acgctctgct aaatgattgg gtttattttc ttggttccat tgccaataat ttccttcgtt 600 tttaaattca cttttttcta aattaaatgt cccatcatta ttaaatccta gtggatcttt 660 atctcctcga aaacattgac gtatatccca taaccaatta tcccattccc ataaattagt 720 ataagctaaa acatcatctc ctccactata aattaatcgt cctgcatacc tttcttcggt 780 taaataagga actaattggt tagaaaaatc aagcaaagca cgacttaaag cattgtgagt 840 tgatggcccc attcgtttag gtacggttaa aaattcgtta aaagcttctg caatatctcc 900 ttctacattt aagttttcag gagtgtaatg tccataagat tttagtttgc cacctttcaa 960 ccattcactc attccatccc catcaccagc agcaattata tagcaatcag tgggattatt 1020 actaggataa taatctttga ctaatttttg taatttaagt ctattttcag ccgtcgattc 1080 tttttctaaa tcttcgacta accatcctgc attaagtaaa cgaggatgat atttaatagt 1140 aggattagta tctgcccaag gaatccccca tttgtctgtt atttcatcag gaattttatt 1200 atgttctgct aaatattcgt taataactgc tttagaggtt ttttcaaaat gttctaaatc 1260 ttcacttgtg ccatttttca aatatccggc cattcctgcg gttaaatcag gataactcat 1320 ttgaatttta tcggcttcta attctaataa tttaggtaaa actaaatgaa gtcctctttt 1380 aactgtttct gttgcattca gttgttcaat tccatcaaat aatcctgctt gtcttttcca 1440 taaagctttt gtttttccct cttcaatcca atcatcacta ggatgaacaa cagaacctaa 1500 tccagaaatt gttgaacggg tactaaaagc tgttggtatt tgccaatctc taccattttt 1560 tacggcggtt aaagctaaac gagtttgatc aaatatagct gcccaccaag aacctatatt 1620 agtattaaaa ggatatttgt tttgctggtc ttgacggagt ttggctgctt tttgtaaaaa 1680 agttaattct ttttctaaaa ataaagccgt attttcattt aatccataag cttgattttg 1740 aatggctacc caactacgat ctttttcaat aatttcacta tctttaattt cttcattttc 1800 tcgataaatt tcactactgg ttaaggcaat cttttctaat tgaccttctt gatcttcctg 1860 ttttttatca actccaatag gaaccgccgt ccaataggtt tgccattgag attttaacca 1920 tcctttccaa gttttatggt caaaagatag tgacttcatc cagtatcttt cttctaactc 1980 actaaagact aatttgctaa tatttaacca ttcactaatt aaggtacttt tagctgtttg 2040 catagcagtt tctactttat ctttgggaag taccaagaca agtacattag gaaatcctgc 2100 cgttaataaa ctgcgttgac ttggttgctt aatccattga ttaaatccga atttactata 2160 tttttgtaat aaccaatgat cgattaaagg ttgttgatat aaattaggat atataaaaca 2220 atccggtccg taaatattcg ctaatgtcca agaaactttg gcagaaagat agtgtaaaat 2280 ccaagaccct gcccaaaaat ctcgcatttt tcgactagct ttgattaatt cctgaatagg 2340 ggaaaaggta aaactagcta aataaggatg ggataaaggt ttattggctt ccccattttg 2400 agttaaatct tctgttgtta aatcataccc tgataatgct cctgccatcg ctgcggtaag 2460 actagcatga ctccaatgtg aactatcggg taaacgggtt tctgctggca ttaataatag 2520 tgaagcatca tcaaataatt gacaagttgc ttcgggaaga cat 2563 <210> 125 <211> 853 <212> PRT <213> Cyanothece sp. <400> 125 Cys Leu Pro Glu Ala Thr Cys Gln Leu Phe Asp Asp Ala Ser Leu Leu 1 5 10 15 Leu Met Pro Ala Glu Thr Arg Leu Pro Asp Ser Ser His Trp Ser His 20 25 30 Ala Ser Leu Thr Ala Ala Met Ala Gly Ala Leu Ser Gly Tyr Asp Leu 35 40 45 Thr Thr Glu Asp Leu Thr Gln Asn Gly Glu Ala Asn Lys Pro Leu Ser 50 55 60 His Pro Tyr Leu Ala Ser Phe Thr Phe Ser Pro Ile Gln Glu Leu Ile 65 70 75 80 Lys Ala Ser Arg Lys Met Arg Asp Phe Trp Ala Gly Ser Trp Ile Leu 85 90 95 His Tyr Leu Ser Ala Lys Val Ser Trp Thr Leu Ala Asn Ile Tyr Gly 100 105 110 Pro Asp Cys Phe Ile Tyr Pro Asn Leu Tyr Gln Gln Pro Leu Ile Asp 115 120 125 His Trp Leu Leu Gln Lys Tyr Ser Lys Phe Gly Phe Asn Gln Trp Ile 130 135 140 Lys Gln Pro Ser Gln Arg Ser Leu Leu Thr Ala Gly Phe Pro Asn Val 145 150 155 160 Leu Val Leu Val Leu Pro Lys Asp Lys Val Glu Thr Ala Met Gln Thr 165 170 175 Ala Lys Ser Thr Leu Ile Ser Glu Trp Leu Asn Ile Ser Lys Leu Val 180 185 190 Phe Ser Glu Leu Glu Glu Arg Tyr Trp Met Lys Ser Leu Ser Phe Asp 195 200 205 His Lys Thr Trp Lys Gly Trp Leu Lys Ser Gln Trp Gln Thr Tyr Trp 210 215 220 Thr Ala Val Pro Ile Gly Val Asp Lys Lys Gln Glu Asp Gln Glu Gly 225 230 235 240 Gln Leu Glu Lys Ile Ala Leu Thr Ser Ser Glu Ile Tyr Arg Glu Asn 245 250 255 Glu Glu Ile Lys Asp Ser Glu Ile Ile Glu Lys Asp Arg Ser Trp Val 260 265 270 Ala Ile Gln Asn Gln Ala Tyr Gly Leu Asn Glu Asn Thr Ala Leu Phe 275 280 285 Leu Glu Lys Glu Leu Thr Phe Leu Gln Lys Ala Ala Lys Leu Arg Gln 290 295 300 Asp Gln Gln Asn Lys Tyr Pro Phe Asn Thr Asn Ile Gly Ser Trp Trp 305 310 315 320 Ala Ala Ile Phe Asp Gln Thr Arg Leu Ala Leu Thr Ala Val Lys Asn 325 330 335 Gly Arg Asp Trp Gln Ile Pro Thr Ala Phe Ser Thr Arg Ser Thr Ile 340 345 350 Ser Gly Leu Gly Ser Val Val His Pro Ser Asp Asp Trp Ile Glu Glu 355 360 365 Gly Lys Thr Lys Ala Leu Trp Lys Arg Gln Ala Gly Leu Phe Asp Gly 370 375 380 Ile Glu Gln Leu Asn Ala Thr Glu Thr Val Lys Arg Gly Leu His Leu 385 390 395 400 Val Leu Pro Lys Leu Leu Glu Leu Glu Ala Asp Lys Ile Gln Met Ser 405 410 415 Tyr Pro Asp Leu Thr Ala Gly Met Ala Gly Tyr Leu Lys Asn Gly Thr 420 425 430 Ser Glu Asp Leu Glu His Phe Glu Lys Thr Ser Lys Ala Val Ile Asn 435 440 445 Glu Tyr Leu Ala Glu His Asn Lys Ile Pro Asp Glu Ile Thr Asp Lys 450 455 460 Trp Gly Ile Pro Trp Ala Asp Thr Asn Pro Thr Ile Lys Tyr His Pro 465 470 475 480 Arg Leu Leu Asn Ala Gly Trp Leu Val Glu Asp Leu Glu Lys Glu Ser 485 490 495 Thr Ala Glu Asn Arg Leu Lys Leu Gln Lys Leu Val Lys Asp Tyr Tyr 500 505 510 Pro Ser Asn Asn Pro Thr Asp Cys Tyr Ile Ile Ala Ala Gly Asp Gly 515 520 525 Asp Gly Met Ser Glu Trp Leu Lys Gly Gly Lys Leu Lys Ser Tyr Gly 530 535 540 His Tyr Thr Pro Glu Asn Leu Asn Val Glu Gly Asp Ile Ala Glu Ala 545 550 555 560 Phe Asn Glu Phe Leu Thr Val Pro Lys Arg Met Gly Pro Ser Thr His 565 570 575 Asn Ala Leu Ser Arg Ala Leu Leu Asp Phe Ser Asn Gln Leu Val Pro 580 585 590 Tyr Leu Thr Glu Glu Arg Tyr Ala Gly Arg Leu Ile Tyr Ser Gly Gly 595 600 605 Asp Asp Val Leu Ala Tyr Thr Asn Leu Trp Glu Trp Asp Asn Trp Leu 610 615 620 Trp Asp Ile Arg Gln Cys Phe Arg Gly Asp Lys Asp Pro Leu Gly Phe 625 630 635 640 Asn Asn Asp Gly Thr Phe Asn Leu Glu Lys Ser Glu Phe Lys Asn Glu 645 650 655 Gly Asn Tyr Trp Gln Trp Asn Gln Glu Asn Lys Pro Asn His Leu Ala 660 665 670 Glu Arg Pro Leu Phe Thr Met Gly Gln Asn Ala Thr Ile Ser Phe Gly 675 680 685 Ile Val Ile Ala His His Ser Val Pro Leu Ala Ile Ala Leu Glu Asn 690 695 700 Leu Trp Glu Ala Glu Glu Glu Ala Lys Glu His Tyr Ile Asn Glu Asn 705 710 715 720 Asn His Lys Thr Tyr Lys Asp Ala Val Gln Val Arg Val Ile Tyr Gly 725 730 735 Asn Gly Asn Ile Leu Lys Ala Thr Ser Lys Phe Glu Val Phe Glu Gln 740 745 750 Trp Lys Lys Leu Leu Arg Ile Asn Glu Leu Glu Ala Ser Leu Phe Glu 755 760 765 Gln Ala Ala Thr Leu Trp Thr Gln His Pro Ile Pro Ile Gln Glu Ala 770 775 780 Ile Lys Pro Trp Thr Val Ala Phe Cys Ser Arg Arg Glu Thr Leu Asn 785 790 795 800 Asp Asp Ile Arg Lys Ser Phe Gln Thr Ala Leu Ser Lys Phe Ile Glu 805 810 815 Asp Leu Trp Thr Asn Thr Ser Glu Glu Gln Leu Asn Gln Asp Val Gln 820 825 830 Ser Trp Phe Lys Leu Thr Ala Phe Val Leu Arg Asn Arg Lys Ile Lys 835 840 845 Leu Gly Gly Lys Ala 850 <210> 126 <211> 3084 <212> DNA <213> Cyanothece sp. <400> 126 gtgagtcatc tgtatcatcc gtattggcaa gcaaaaattt gggcattact gcatgatcca 60 gccttaaaac ccttatcgga tcgatatggt tttgcgagag aggggcaatg gcagttattg 120 cgatgtatgc aaggatgtaa gtcccctaaa gataacaaaa aggtgttagg agactgtgta 180 ttgcagggta actggttaaa ccatgtgggg ttatgtgatt tagtcgcttc ggccagcgat 240 cgcagtacca tcggcagact cgatccacaa tatagcgcag ttacctatca acagcaaacc 300 ggcttacaga tccgtcattt attatcagga gaaccccaaa accttaaagt taataataac 360 tggcaagaaa acttaattac taaacggaag aaactagaag caaaagaagc agaattttta 420 gataaaatta gccagtggga agatccaaaa aaagtttttt gggcgttatg gagatgttat 480 gctgaagtct tagaaaaaga agaagcttta atacatttat taccagcaga aactcgttta 540 ccggatggat cattgtggag tcatgtgagt atgacttctg cattagctgg agggttagcc 600 gggtattata aacaagctga aaattatcct attaaaaacc aaaaatttaa tgattattct 660 cgaccgtatt tagttaattt taccttttct cctgtacaag aattgatcaa agcgagtcgc 720 aaaatgcgag atttttgggc aggatcttgg attttacatt atctttctgc taaggtttct 780 tatgcgatcg ctaatgaata tggtcccgat actttactct atccttgtct gtatcaacag 840 ccattaattg ataactggtt attagaagaa tattctgatt tcaaggaatg gatagaacct 900 cataaacccg atcaattatt aacggcaggt ttccctaatg ttattattat gattttaccc 960 aataatcata aatctcaaca ggatctaaaa gataatccta tttatgcagc gactcagtta 1020 gcaaaacgta ctttaaaaga agaatggaaa aagttaggag atcaaagttt agaattttta 1080 caagatagta aacagtggca aaatattaac ccaaatactt gggataaatg gttaaagtgt 1140 caatggcaaa cttattatac agcctttcct attggtgatc ctgagagtga cttaacttgt 1200 tctttaagag tgggtaaaaa tgaaacggaa gagcaaaaaa aagacgcttt tgaagcttgg 1260 tgtcatcaac aaaatcagtt aaccaacccg aaagaatctt tatttgaaac caatgaagag 1320 aaatttttaa aagctatctt taaactaacc gatatagaaa cagaaaaaga accaccaaaa 1380 acaaaatata gtaagcaacc taacttaaat gtaggatcat ggtgggctta tgtttttgat 1440 caattaagaa ccagtttaaa tgcagttaaa aatgctagaa cttgggaact tcccacagcc 1500 tttaccgttc gttctagctt atcaggaatc ggttctgcag ttcatcctat tgtcaatgaa 1560 gagaaacccg atcgcatttc tgaaaaagaa attaacgagt tttggtcaga aaaattcggt 1620 ttatttgatg gtactgaaaa actcaatgca acggaaattg tcaagcgagt gttacataaa 1680 ttattacctg agatattgaa ctatgaagaa caagaaatca gcttatatta tcctgattta 1740 accgccggag tcgccggtta tttaaaaaat gcactattaa acaatcaaca gtcagaaatt 1800 gattattata aacgttcttg tcataagatt tacaaagaaa ttcaaccgct tttagataat 1860 gataacctta gccaaagttg gggtattcct tggattaata ataataaaga attgaaactg 1920 agtaatacca ttcatcatcc tcgtttactc aatgcaggtt ggttactcga agatgtagaa 1980 atatcccatg atagtaatat agagtatcga gaaaaattag aagaattaag tacaaaaaga 2040 acaactatac aacaagttat caataaatat tatcctagta ataatcctac caattggtat 2100 attttagttg ctggtgatgg tgatagtatg agagactggt taagaggtag taaattaaaa 2160 aattatggtg aatatttgcc cgatgaatta agagaaaaaa ttattaatga tagtaatgat 2220 gaaattccta aagaatataa agaaccctta caaaactttc tcgaagttag aaaacgtatg 2280 ggaccatcaa cccatagtgc tttaagtcgt gccttacttg acttttctaa tcaattagtt 2340 ccttatttaa ccgaacaaag atacgcagga agattaattt atagtggtgg cgatgatgtt 2400 ttagcttata caaatttatg ggaatgggac aactggttat gggatattcg tcaatgtttt 2460 aagggtcaag aagatcccta taatgagttt aaaaatgagg gtgactattg gcaatggaat 2520 aaaccaaata aacccaaaaa tatagcccaa agacctttat ttacaatggg aaaatgtgct 2580 actattagct ttggaattgt gattgctcat cactctattc cgttagcgat cgctttagaa 2640 agtttatggg aagcagaaga agaagctaaa gaacattaca cacaaaaaga taataaagac 2700 acttacaaag atgccgtaca agttcgagtt ttgtatggta atggaaacac cttaaaatct 2760 acatcaaaat ttgatatttt taaccagtgg aaacaactgc taaaattaga cttagaaccc 2820 agtttatttg aacaagctgc taccatttgg gaacaacatc ctatcccaga taaaagtgca 2880 attgaaccct ggacaaaagc cttttgtagt cgtcgagata taggagaaga attacaacaa 2940 gactatcaaa aaatattaac cagttttatt caaggattat ggataacgac ccctcaaaat 3000 aacttagata aagaggttaa gaactggcta aaactggcag catttgtgaa acgaaatcgt 3060 aaaattagct taaaccagga gtaa 3084 <210> 127 <211> 1027 <212> PRT <213> Cyanothece sp. <400> 127 Met Ser His Leu Tyr His Pro Tyr Trp Gln Ala Lys Ile Trp Ala Leu 1 5 10 15 Leu His Asp Pro Ala Leu Lys Pro Leu Ser Asp Arg Tyr Gly Phe Ala 20 25 30 Arg Glu Gly Gln Trp Gln Leu Leu Arg Cys Met Gln Gly Cys Lys Ser 35 40 45 Pro Lys Asp Asn Lys Lys Val Leu Gly Asp Cys Val Leu Gln Gly Asn 50 55 60 Trp Leu Asn His Val Gly Leu Cys Asp Leu Val Ala Ser Ala Ser Asp 65 70 75 80 Arg Ser Thr Ile Gly Arg Leu Asp Pro Gln Tyr Ser Ala Val Thr Tyr 85 90 95 Gln Gln Gln Thr Gly Leu Gln Ile Arg His Leu Leu Ser Gly Glu Pro 100 105 110 Gln Asn Leu Lys Val Asn Asn Asn Trp Gln Glu Asn Leu Ile Thr Lys 115 120 125 Arg Lys Lys Leu Glu Ala Lys Glu Ala Glu Phe Leu Asp Lys Ile Ser 130 135 140 Gln Trp Glu Asp Pro Lys Lys Val Phe Trp Ala Leu Trp Arg Cys Tyr 145 150 155 160 Ala Glu Val Leu Glu Lys Glu Glu Ala Leu Ile His Leu Leu Pro Ala 165 170 175 Glu Thr Arg Leu Pro Asp Gly Ser Leu Trp Ser His Val Ser Met Thr 180 185 190 Ser Ala Leu Ala Gly Gly Leu Ala Gly Tyr Tyr Lys Gln Ala Glu Asn 195 200 205 Tyr Pro Ile Lys Asn Gln Lys Phe Asn Asp Tyr Ser Arg Pro Tyr Leu 210 215 220 Val Asn Phe Thr Phe Ser Pro Val Gln Glu Leu Ile Lys Ala Ser Arg 225 230 235 240 Lys Met Arg Asp Phe Trp Ala Gly Ser Trp Ile Leu His Tyr Leu Ser 245 250 255 Ala Lys Val Ser Tyr Ala Ile Ala Asn Glu Tyr Gly Pro Asp Thr Leu 260 265 270 Leu Tyr Pro Cys Leu Tyr Gln Gln Pro Leu Ile Asp Asn Trp Leu Leu 275 280 285 Glu Glu Tyr Ser Asp Phe Lys Glu Trp Ile Glu Pro His Lys Pro Asp 290 295 300 Gln Leu Leu Thr Ala Gly Phe Pro Asn Val Ile Ile Met Ile Leu Pro 305 310 315 320 Asn Asn His Lys Ser Gln Gln Asp Leu Lys Asp Asn Pro Ile Tyr Ala 325 330 335 Ala Thr Gln Leu Ala Lys Arg Thr Leu Lys Glu Glu Trp Lys Lys Leu 340 345 350 Gly Asp Gln Ser Leu Glu Phe Leu Gln Asp Ser Lys Gln Trp Gln Asn 355 360 365 Ile Asn Pro Asn Thr Trp Asp Lys Trp Leu Lys Cys Gln Trp Gln Thr 370 375 380 Tyr Tyr Thr Ala Phe Pro Ile Gly Asp Pro Glu Ser Asp Leu Thr Cys 385 390 395 400 Ser Leu Arg Val Gly Lys Asn Glu Thr Glu Glu Gln Lys Lys Asp Ala 405 410 415 Phe Glu Ala Trp Cys His Gln Gln Asn Gln Leu Thr Asn Pro Lys Glu 420 425 430 Ser Leu Phe Glu Thr Asn Glu Glu Lys Phe Leu Lys Ala Ile Phe Lys 435 440 445 Leu Thr Asp Ile Glu Thr Glu Lys Glu Pro Pro Lys Thr Lys Tyr Ser 450 455 460 Lys Gln Pro Asn Leu Asn Val Gly Ser Trp Trp Ala Tyr Val Phe Asp 465 470 475 480 Gln Leu Arg Thr Ser Leu Asn Ala Val Lys Asn Ala Arg Thr Trp Glu 485 490 495 Leu Pro Thr Ala Phe Thr Val Arg Ser Ser Leu Ser Gly Ile Gly Ser 500 505 510 Ala Val His Pro Ile Val Asn Glu Glu Lys Pro Asp Arg Ile Ser Glu 515 520 525 Lys Glu Ile Asn Glu Phe Trp Ser Glu Lys Phe Gly Leu Phe Asp Gly 530 535 540 Thr Glu Lys Leu Asn Ala Thr Glu Ile Val Lys Arg Val Leu His Lys 545 550 555 560 Leu Leu Pro Glu Ile Leu Asn Tyr Glu Glu Gln Glu Ile Ser Leu Tyr 565 570 575 Tyr Pro Asp Leu Thr Ala Gly Val Ala Gly Tyr Leu Lys Asn Ala Leu 580 585 590 Leu Asn Asn Gln Gln Ser Glu Ile Asp Tyr Tyr Lys Arg Ser Cys His 595 600 605 Lys Ile Tyr Lys Glu Ile Gln Pro Leu Leu Asp Asn Asp Asn Leu Ser 610 615 620 Gln Ser Trp Gly Ile Pro Trp Ile Asn Asn Asn Lys Glu Leu Lys Leu 625 630 635 640 Ser Asn Thr Ile His His Pro Arg Leu Leu Asn Ala Gly Trp Leu Leu 645 650 655 Glu Asp Val Glu Ile Ser His Asp Ser Asn Ile Glu Tyr Arg Glu Lys 660 665 670 Leu Glu Glu Leu Ser Thr Lys Arg Thr Thr Ile Gln Gln Val Ile Asn 675 680 685 Lys Tyr Tyr Pro Ser Asn Asn Pro Thr Asn Trp Tyr Ile Leu Val Ala 690 695 700 Gly Asp Gly Asp Ser Met Arg Asp Trp Leu Arg Gly Ser Lys Leu Lys 705 710 715 720 Asn Tyr Gly Glu Tyr Leu Pro Asp Glu Leu Arg Glu Lys Ile Ile Asn 725 730 735 Asp Ser Asn Asp Glu Ile Pro Lys Glu Tyr Lys Glu Pro Leu Gln Asn 740 745 750 Phe Leu Glu Val Arg Lys Arg Met Gly Pro Ser Thr His Ser Ala Leu 755 760 765 Ser Arg Ala Leu Leu Asp Phe Ser Asn Gln Leu Val Pro Tyr Leu Thr 770 775 780 Glu Gln Arg Tyr Ala Gly Arg Leu Ile Tyr Ser Gly Gly Asp Asp Val 785 790 795 800 Leu Ala Tyr Thr Asn Leu Trp Glu Trp Asp Asn Trp Leu Trp Asp Ile 805 810 815 Arg Gln Cys Phe Lys Gly Gln Glu Asp Pro Tyr Asn Glu Phe Lys Asn 820 825 830 Glu Gly Asp Tyr Trp Gln Trp Asn Lys Pro Asn Lys Pro Lys Asn Ile 835 840 845 Ala Gln Arg Pro Leu Phe Thr Met Gly Lys Cys Ala Thr Ile Ser Phe 850 855 860 Gly Ile Val Ile Ala His His Ser Ile Pro Leu Ala Ile Ala Leu Glu 865 870 875 880 Ser Leu Trp Glu Ala Glu Glu Glu Ala Lys Glu His Tyr Thr Gln Lys 885 890 895 Asp Asn Lys Asp Thr Tyr Lys Asp Ala Val Gln Val Arg Val Leu Tyr 900 905 910 Gly Asn Gly Asn Thr Leu Lys Ser Thr Ser Lys Phe Asp Ile Phe Asn 915 920 925 Gln Trp Lys Gln Leu Leu Lys Leu Asp Leu Glu Pro Ser Leu Phe Glu 930 935 940 Gln Ala Ala Thr Ile Trp Glu Gln His Pro Ile Pro Asp Lys Ser Ala 945 950 955 960 Ile Glu Pro Trp Thr Lys Ala Phe Cys Ser Arg Arg Asp Ile Gly Glu 965 970 975 Glu Leu Gln Gln Asp Tyr Gln Lys Ile Leu Thr Ser Phe Ile Gln Gly 980 985 990 Leu Trp Ile Thr Thr Pro Gln Asn Asn Leu Asp Lys Glu Val Lys Asn 995 1000 1005 Trp Leu Lys Leu Ala Ala Phe Val Lys Arg Asn Arg Lys Ile Ser 1010 1015 1020 Leu Asn Gln Glu 1025 <210> 128 <211> 2826 <212> DNA <213> Synechococcus sp. <400> 128 tcatcgaccg ttcctcccca aagtgacggt gcggttgcgc agcacaaagg ccgccagctt 60 gaaccagttt ttgatggcca gatcccaggc ccccggctgg gcgggcaggc tgtgctgcca 120 aaagtgctga ataaactcga ccagcttggt ctggaaacga tccgtctgct cgctttcgcc 180 gtggaagaga tcccggcggc tgcagaacag gcgggcccaa gcaggcaccg cttccaggct 240 gggggctggg tgctgctccc agagctgggc ggcgtgttca aatagggagc tttgatcctg 300 cttttggccc aacagcttcc agtcaaaatc cagcaggtct ttccacttgt cgaaggtgtc 360 gaacttgcag gtgctcacca gttggttgcc gttggcaaac agtacccgca cctgggcgct 420 gtctttggag ctgccctggg cataggcctg ctctttggcg ccttgttctg cctcccagag 480 attctccagg gcaatggcca ggggcaccga gtggtgggca atcaccaccc caaagctaat 540 gctggccagg gatcccagag taaaaagagg gcgacggctg aggccagccg gcaactgcgc 600 cttttgccac tgccagtagt ccccttcgtt ggcaaactcg cgccagtcgt cttcgccgcc 660 gcggaaacat tggcggatgt cccagagcca gccatcccac tcccagaggt tggtgtaggc 720 caaaacgtcg tctccgccgg cgtagataag cctgccggca tagcgctgct cggtgaggta 780 gggcaccaac tggccggaaa aatccaacag agcccggctg agggcgctgt gggtggccgg 840 gcccatgcgc ttgcggctgg ctttaacaaa ctcgctgaag gcgtccttga cttgcttgag 900 ctcttcagag tcgaggacgc ggccaatagc gtccctctgg ccatccgcta ggcgctgcag 960 cggctggggc aggtagtcgt agtagggctt catcttcccc ccgctcagcc actggcccat 1020 gtcgtcgcca tcgccggcgg ccaccacgta ccaactggcg gggttgatgc tggggtagta 1080 gcggctgagg gtggcttcta tctcctggcg gcagcgcttc tgggttgcct cgtctgcttc 1140 caggtcctcc accagccagc cggcgttgag caggcggggg tggtagcgca ggttttgctg 1200 gtcggcccac gggatccccc acttgccacg catctcccgg atcacctccc gcatgccggg 1260 gtgaatggcc tcaacggcgc ggcaggcctg ctcgaagtgc tccagctcgc gtcgcccgtg 1320 ggttttcagg taaccggcca cgccagcagt gagatctggg taggaagcgg cgacctcgtc 1380 ttcgtcgagg gtggggaaga gctccggcaa caccttgtct agggcccgct taaccgtttc 1440 ggtggcgttg agctgctcgc ggccatcgaa aagccctgcc tggcgctgcc aaagccgccg 1500 gctctcccct tcgctaatcc agcgattcct gggggaaggg tgaaccaccg gccctaggcc 1560 agagacggtg ctgcgcggcc caaaggtcac cggcaactgc caatcgcggg cctgtttgca 1620 ggctgcctgc agccggcgcg tcgcctccac tgccgctgcc caccaggagc ctacgtttag 1680 ccctggcttg tgctggcggc actgctgcct ttcgggatcc cagaagctga tccgcaggaa 1740 cttcagctcc ggatcggcaa aaagctgccg ctttcctttg agatggtagg tgcggttttg 1800 ggcgctgacc cagggatccc gctcaatgga ctcctgggac ctgaggatgg cggtgtcttt 1860 gagcctttgc tggggggatc ccaggggcgc tgccgcccag tagaactgcc actggtgctc 1920 cagccatccc ccccaggtgg gatcttctgg gcgcaactgc accagccagc ggcgctccag 1980 ttgcaggtgc tccagcgctc tttccgccag gtggcgccat tcttctttga gggtctgctg 2040 ggcaaactgc atggccgcct gcagccgctc ttcgggcaac agcaagagga tcacgttggg 2100 gaagccggcg gtgagcagag tgttggcaga aggctgcggg atccactcgg caaagggggg 2160 gtacttctcc agcagccaag cgtcgatcaa aggctggccg tagaggctgg ggtagagcag 2220 gcagtcgggg ccgtatttct ccgccaggcg ccagcaaagc cgcgccgaga ggtagtgcaa 2280 cagccaggat ccggcccaaa agtcccgcat cttgcggctg gctttgatca gctcctggat 2340 ggggttgaag gtcaagctgg ccaaaaaggg ccgcgtgaac ttgggctcgt cgtagccggc 2400 caaacagccc gccagagcgg ccacgacgct agtgtggctc cacagggatc catcgggcag 2460 ccgcgtttct gccggcaaaa gcaggaggct ttcatcgcca aactcccgcg ccagcgcctg 2520 gggaaaacag cgccagaacc accagaacac cttctggata tcctcctgtt cttgccaaat 2580 ccagtcggga actacccttg cttcctgcgc cagcaagtac tcggcgcggg agctggcctg 2640 ccgcagggcg cggtgttctt cttcgggcag ttgccaaaag cgcttgcgcc ccgaaaggag 2700 atggctcatc tctaagcccg gccccaggct ctggctgcaa tcagctacct ggtagtcgat 2760 ggcaaccggc aggtggccga tagcagcccg atcgctggcg gaggcgacca gatccgcatc 2820 tcccac 2826 <210> 129 <211> 941 <212> PRT <213> Synechococcus sp. <400> 129 Met Gly Asp Ala Asp Leu Val Ala Ser Ala Ser Asp Arg Ala Ala Ile 1 5 10 15 Gly His Leu Pro Val Ala Ile Asp Tyr Gln Val Ala Asp Cys Ser Gln 20 25 30 Ser Leu Gly Pro Gly Leu Glu Met Ser His Leu Leu Ser Gly Arg Lys 35 40 45 Arg Phe Trp Gln Leu Pro Glu Glu Glu His Arg Ala Leu Arg Gln Ala 50 55 60 Ser Ser Arg Ala Glu Tyr Leu Leu Ala Gln Glu Ala Arg Val Val Pro 65 70 75 80 Asp Trp Ile Trp Gln Glu Gln Glu Asp Ile Gln Lys Val Phe Trp Trp 85 90 95 Phe Trp Arg Cys Phe Pro Gln Ala Leu Ala Arg Glu Phe Gly Asp Glu 100 105 110 Ser Leu Leu Leu Leu Pro Ala Glu Thr Arg Leu Pro Asp Gly Ser Leu 115 120 125 Trp Ser His Thr Ser Val Val Ala Ala Leu Ala Gly Cys Leu Ala Gly 130 135 140 Tyr Asp Glu Pro Lys Phe Thr Arg Pro Phe Leu Ala Ser Leu Thr Phe 145 150 155 160 Asn Pro Ile Gln Glu Leu Ile Lys Ala Ser Arg Lys Met Arg Asp Phe 165 170 175 Trp Ala Gly Ser Trp Leu Leu His Tyr Leu Ser Ala Arg Leu Cys Trp 180 185 190 Arg Leu Ala Glu Lys Tyr Gly Pro Asp Cys Leu Leu Tyr Pro Ser Leu 195 200 205 Tyr Gly Gln Pro Leu Ile Asp Ala Trp Leu Leu Glu Lys Tyr Pro Pro 210 215 220 Phe Ala Glu Trp Ile Pro Gln Pro Ser Ala Asn Thr Leu Leu Thr Ala 225 230 235 240 Gly Phe Pro Asn Val Ile Leu Leu Leu Leu Pro Glu Glu Arg Leu Gln 245 250 255 Ala Ala Met Gln Phe Ala Gln Gln Thr Leu Lys Glu Glu Trp Arg His 260 265 270 Leu Ala Glu Arg Ala Leu Glu His Leu Gln Leu Glu Arg Arg Trp Leu 275 280 285 Val Gln Leu Arg Pro Glu Asp Pro Thr Trp Gly Gly Trp Leu Glu His 290 295 300 Gln Trp Gln Phe Tyr Trp Ala Ala Ala Pro Leu Gly Ser Pro Gln Gln 305 310 315 320 Arg Leu Lys Asp Thr Ala Ile Leu Arg Ser Gln Glu Ser Ile Glu Arg 325 330 335 Asp Pro Trp Val Ser Ala Gln Asn Arg Thr Tyr His Leu Lys Gly Lys 340 345 350 Arg Gln Leu Phe Ala Asp Pro Glu Leu Lys Phe Leu Arg Ile Ser Phe 355 360 365 Trp Asp Pro Glu Arg Gln Gln Cys Arg Gln His Lys Pro Gly Leu Asn 370 375 380 Val Gly Ser Trp Trp Ala Ala Ala Val Glu Ala Thr Arg Arg Leu Gln 385 390 395 400 Ala Ala Cys Lys Gln Ala Arg Asp Trp Gln Leu Pro Val Thr Phe Gly 405 410 415 Pro Arg Ser Thr Val Ser Gly Leu Gly Pro Val Val His Pro Ser Pro 420 425 430 Arg Asn Arg Trp Ile Ser Glu Gly Glu Ser Arg Arg Leu Trp Gln Arg 435 440 445 Gln Ala Gly Leu Phe Asp Gly Arg Glu Gln Leu Asn Ala Thr Glu Thr 450 455 460 Val Lys Arg Ala Leu Asp Lys Val Leu Pro Glu Leu Phe Pro Thr Leu 465 470 475 480 Asp Glu Asp Glu Val Ala Ala Ser Tyr Pro Asp Leu Thr Ala Gly Val 485 490 495 Ala Gly Tyr Leu Lys Thr His Gly Arg Arg Glu Leu Glu His Phe Glu 500 505 510 Gln Ala Cys Arg Ala Val Glu Ala Ile His Pro Gly Met Arg Glu Val 515 520 525 Ile Arg Glu Met Arg Gly Lys Trp Gly Ile Pro Trp Ala Asp Gln Gln 530 535 540 Asn Leu Arg Tyr His Pro Arg Leu Leu Asn Ala Gly Trp Leu Val Glu 545 550 555 560 Asp Leu Glu Ala Asp Glu Ala Thr Gln Lys Arg Cys Arg Gln Glu Ile 565 570 575 Glu Ala Thr Leu Ser Arg Tyr Tyr Pro Ser Ile Asn Pro Ala Ser Trp 580 585 590 Tyr Val Val Ala Ala Gly Asp Gly Asp Asp Met Gly Gln Trp Leu Ser 595 600 605 Gly Gly Lys Met Lys Pro Tyr Tyr Asp Tyr Leu Pro Gln Pro Leu Gln 610 615 620 Arg Leu Ala Asp Gly Gln Arg Asp Ala Ile Gly Arg Val Leu Asp Ser 625 630 635 640 Glu Glu Leu Lys Gln Val Lys Asp Ala Phe Ser Glu Phe Val Lys Ala 645 650 655 Ser Arg Lys Arg Met Gly Pro Ala Thr His Ser Ala Leu Ser Arg Ala 660 665 670 Leu Leu Asp Phe Ser Gly Gln Leu Val Pro Tyr Leu Thr Glu Gln Arg 675 680 685 Tyr Ala Gly Arg Leu Ile Tyr Ala Gly Gly Asp Asp Val Leu Ala Tyr 690 695 700 Thr Asn Leu Trp Glu Trp Asp Gly Trp Leu Trp Asp Ile Arg Gln Cys 705 710 715 720 Phe Arg Gly Gly Glu Asp Asp Trp Arg Glu Phe Ala Asn Glu Gly Asp 725 730 735 Tyr Trp Gln Trp Gln Lys Ala Gln Leu Pro Ala Gly Leu Ser Arg Arg 740 745 750 Pro Leu Phe Thr Leu Gly Ser Leu Ala Ser Ile Ser Phe Gly Val Val 755 760 765 Ile Ala His His Ser Val Pro Leu Ala Ile Ala Leu Glu Asn Leu Trp 770 775 780 Glu Ala Glu Gln Gly Ala Lys Glu Gln Ala Tyr Ala Gln Gly Ser Ser 785 790 795 800 Lys Asp Ser Ala Gln Val Arg Val Leu Phe Ala Asn Gly Asn Gln Leu 805 810 815 Val Ser Thr Cys Lys Phe Asp Thr Phe Asp Lys Trp Lys Asp Leu Leu 820 825 830 Asp Phe Asp Trp Lys Leu Leu Gly Gln Lys Gln Asp Gln Ser Ser Leu 835 840 845 Phe Glu His Ala Ala Gln Leu Trp Glu Gln His Pro Ala Pro Ser Leu 850 855 860 Glu Ala Val Pro Ala Trp Ala Arg Leu Phe Cys Ser Arg Arg Asp Leu 865 870 875 880 Phe His Gly Glu Ser Glu Gln Thr Asp Arg Phe Gln Thr Lys Leu Val 885 890 895 Glu Phe Ile Gln His Phe Trp Gln His Ser Leu Pro Ala Gln Pro Gly 900 905 910 Ala Trp Asp Leu Ala Ile Lys Asn Trp Phe Lys Leu Ala Ala Phe Val 915 920 925 Leu Arg Asn Arg Thr Val Thr Leu Gly Arg Asn Gly Arg 930 935 940 <210> 130 <211> 3330 <212> DNA <213> Arthrospira maxima <400> 130 atggacaact ttctcggttc tcttaatcat tcctcactgt gcaatatcgt cttccttcgc 60 aaactttgtg ctttagttgg tgatcgccat ctctgtaaca gcctggattg tttgaaaacc 120 tcggagggac aagcggcgct gttttggtgg gaacaaaatc aacatcagct tgaagcgatc 180 gccagttcct cagatcgggt caatttggaa ccaggaagct caacagaacg acaaactaaa 240 gaacggatca ttaaacatcc catcagcgct caacagcaaa ccattcaaac tccagacaac 300 agagaaatcg cctttcccca atgggttcaa caggaacaaa acccccaaaa cgtatttaat 360 tggttgtggc gtatgatgcc ggaactaaga cgacaacagg attcggacgc tctactcgac 420 cctcaacact acattttacc cgactgtccg attcatagct atcgtgccac agtctcagcg 480 atcgccggag cggtagactt tgatgaacgg gggattgtca ctcaataccc ttacttgctg 540 ctgtttacct tttccccgat tcaggacttt atcaaagctt cccgcaaatt tctagacttt 600 tgggcagggt catacttgct acactatcta agcgctcaac tctgttggtt cgtggctgaa 660 acctacggtg tagatgcggt gattaccccc tcgctttggg gacaagaaat catcgacgca 720 ctcttactca aaacctatcc aatttttaga gaaagctttc aagaactcag ccccgatgga 780 acagaccccc tgactcgttt taatgagcgt ttgagtacca ccctagcaac cgcaggcttt 840 cccaatacga taaccatctt agttggaagc tccgaaaccg cacaacaact cggagaaact 900 ttgtgtgaaa aattgcggtc tgaatggagt gcgatcgccc aaaatattag agaaggaatc 960 cccgatcatc ccatacccga acttagacaa ggaattcgcg atcgcaccat cgcatttctg 1020 caaaaccccc aaaatcataa gcggattgag aagatcttag aagaattttc ccagtcggga 1080 ggtcacgacg aacaaaaccg acatgatctc gaaaactgga agcggaaaag ctgctgggaa 1140 tggcggggat tatggaatgc tcaaattgac caaacttggc aaccctactg gacggctgtt 1200 ccgttgggtg atccgaatac ttctctaatg attgagaaaa atgatgacga tcaattgagc 1260 gaagactgga tcaaaaaaca agaaaaagtg gctcaaactc gcgtgatcaa tccccctccc 1320 acaacggcgg aaaaaatgct ctacacaacc ctcaataatg ggacttggtg ggggtcaatt 1380 caatctcgat gcggtcaagc cattcaagcc attaaaaata ctagaacttg ggcaattccc 1440 atttctccgg gtgttcgttc tacattatcg ggacaactga gcgccctaca tcctcaattt 1500 cgatattctg gaaacttccg ggaaggatac ggtttaccta ttgaatcaat gcgattattt 1560 tggcgattaa tagcagaagt ttatccagga ttatttgacg gctcggaaat gctgaacgct 1620 ctagaattaa cgaagcgcat ggcttgggtt tatggtggtg tgggtgagtc tttaggaatt 1680 gattttagca atttagaaaa tgaaaaaata gactatagcc aattaattcg ctttcccaat 1740 ctcagttcta ttgcttcagc ccgatttgct taccaagatt tgcaacaaga tcaaaatcac 1800 ggtaaactca gtcaatattg gcagaaatta caaattaata tcaaacaaca atttgggaaa 1860 accagtcaag aatatcagga ttttctggct caaactcggg gtcgtccttt ccacatccct 1920 aaaaccgata tttgtattaa tcgccaaaat ttaccggggc gatactataa cggcgtgatg 1980 ttttctagca aatggcttgc cgaagatatg ggattagaaa aagaacagag acccgagttg 2040 cgaaagattg tagacctaac tcactccgaa tgtggctttg gcgacagtag cccaacagat 2100 tggtgggtga tgatcttagg agatggggat ggtatggggc aatatgtttc cggtaaaaaa 2160 cttcatcctt accaagaata tttaaccgaa actcatcccg aaactttcat cgatcgcgat 2220 cgctatcccg acctagatga aaaccagtat gagcagaaaa aacggcagtt cattaaagcc 2280 tttagagatg ataaacattc cctgctgaaa acccgtaagc gcatgggacc cgccactcat 2340 gttggtctaa accgcgccct gctagacttc tctaaccgtt tagttccctt tattaccgaa 2400 aagcggtttt gtggtcgcgt ggtctacagt ggcggagatg atgtgatgac ggtactccct 2460 ttagaagatt tacccgatta tctgctctct ctgagagccg cttggtgtgg gggcgacgac 2520 ccctatcaac cccaagcggg cgatccagac ttgaaatttc aatcccaagg cggctactgg 2580 cgacccactt cggatacaaa tgattttcaa ggcttaccag accgatcgct gtttacgatg 2640 ggattcgggg caacgatgag tctgggtatc gtgatcgtcg ataaaagtgt tcccctccca 2700 gtcgccctgg aagccctttg ggaagcagaa tccgaccggg ctaaagaatt atccggtggt 2760 ctactgatgt ccatcgatct gttgcgggga ctgacggaat ggcgatcgct atctttgatg 2820 cgatttgtcc tgtctgaaat tttccgttta tcgagtgttc ccaacaaaaa cggcctatgt 2880 tttcgagttc tctacagttc aggaaacacc ctagaagctc tgatcaaagg agaattatac 2940 gccggttggc gagattggat caccactgaa catcatcaag ccttgagttc tctactctat 3000 cgcctcgccg aagaactccc ccgccatgcg gatttgaccc catcttctta cttaattgct 3060 caagccgcca gagcgatcgc cttacgccga gacgacaaag acttggttca agaaaatatc 3120 gacaaactgt tgatctggct cagatattgg gaagattggg cgcgatcagt ccatgttcaa 3180 tggttaatcg accgggagaa aaaccccgat actcccaaac caattggaat tgaccttaag 3240 gacttaagta atattctgcg tttttcggcg ttttggctcg ataaaatgca gcaacgccaa 3300 caatggcaca gacaggatca ggaggcttag 3330 <210> 131 <211> 1109 <212> PRT <213> Arthrospira maxima <400> 131 Met Asp Asn Phe Leu Gly Ser Leu Asn His Ser Ser Leu Cys Asn Ile 1 5 10 15 Val Phe Leu Arg Lys Leu Cys Ala Leu Val Gly Asp Arg His Leu Cys 20 25 30 Asn Ser Leu Asp Cys Leu Lys Thr Ser Glu Gly Gln Ala Ala Leu Phe 35 40 45 Trp Trp Glu Gln Asn Gln His Gln Leu Glu Ala Ile Ala Ser Ser Ser 50 55 60 Asp Arg Val Asn Leu Glu Pro Gly Ser Ser Thr Glu Arg Gln Thr Lys 65 70 75 80 Glu Arg Ile Ile Lys His Pro Ile Ser Ala Gln Gln Gln Thr Ile Gln 85 90 95 Thr Pro Asp Asn Arg Glu Ile Ala Phe Pro Gln Trp Val Gln Gln Glu 100 105 110 Gln Asn Pro Gln Asn Val Phe Asn Trp Leu Trp Arg Met Met Pro Glu 115 120 125 Leu Arg Arg Gln Gln Asp Ser Asp Ala Leu Leu Asp Pro Gln His Tyr 130 135 140 Ile Leu Pro Asp Cys Pro Ile His Ser Tyr Arg Ala Thr Val Ser Ala 145 150 155 160 Ile Ala Gly Ala Val Asp Phe Asp Glu Arg Gly Ile Val Thr Gln Tyr 165 170 175 Pro Tyr Leu Leu Leu Phe Thr Phe Ser Pro Ile Gln Asp Phe Ile Lys 180 185 190 Ala Ser Arg Lys Phe Leu Asp Phe Trp Ala Gly Ser Tyr Leu Leu His 195 200 205 Tyr Leu Ser Ala Gln Leu Cys Trp Phe Val Ala Glu Thr Tyr Gly Val 210 215 220 Asp Ala Val Ile Thr Pro Ser Leu Trp Gly Gln Glu Ile Ile Asp Ala 225 230 235 240 Leu Leu Leu Lys Thr Tyr Pro Ile Phe Arg Glu Ser Phe Gln Glu Leu 245 250 255 Ser Pro Asp Gly Thr Asp Pro Leu Thr Arg Phe Asn Glu Arg Leu Ser 260 265 270 Thr Thr Leu Ala Thr Ala Gly Phe Pro Asn Thr Ile Thr Ile Leu Val 275 280 285 Gly Ser Ser Glu Thr Ala Gln Gln Leu Gly Glu Thr Leu Cys Glu Lys 290 295 300 Leu Arg Ser Glu Trp Ser Ala Ile Ala Gln Asn Ile Arg Glu Gly Ile 305 310 315 320 Pro Asp His Pro Ile Pro Glu Leu Arg Gln Gly Ile Arg Asp Arg Thr 325 330 335 Ile Ala Phe Leu Gln Asn Pro Gln Asn His Lys Arg Ile Glu Lys Ile 340 345 350 Leu Glu Glu Phe Ser Gln Ser Gly Gly His Asp Glu Gln Asn Arg His 355 360 365 Asp Leu Glu Asn Trp Lys Arg Lys Ser Cys Trp Glu Trp Arg Gly Leu 370 375 380 Trp Asn Ala Gln Ile Asp Gln Thr Trp Gln Pro Tyr Trp Thr Ala Val 385 390 395 400 Pro Leu Gly Asp Pro Asn Thr Ser Leu Met Ile Glu Lys Asn Asp Asp 405 410 415 Asp Gln Leu Ser Glu Asp Trp Ile Lys Lys Gln Glu Lys Val Ala Gln 420 425 430 Thr Arg Val Ile Asn Pro Pro Pro Thr Thr Ala Glu Lys Met Leu Tyr 435 440 445 Thr Thr Leu Asn Asn Gly Thr Trp Trp Gly Ser Ile Gln Ser Arg Cys 450 455 460 Gly Gln Ala Ile Gln Ala Ile Lys Asn Thr Arg Thr Trp Ala Ile Pro 465 470 475 480 Ile Ser Pro Gly Val Arg Ser Thr Leu Ser Gly Gln Leu Ser Ala Leu 485 490 495 His Pro Gln Phe Arg Tyr Ser Gly Asn Phe Arg Glu Gly Tyr Gly Leu 500 505 510 Pro Ile Glu Ser Met Arg Leu Phe Trp Arg Leu Ile Ala Glu Val Tyr 515 520 525 Pro Gly Leu Phe Asp Gly Ser Glu Met Leu Asn Ala Leu Glu Leu Thr 530 535 540 Lys Arg Met Ala Trp Val Tyr Gly Gly Val Gly Glu Ser Leu Gly Ile 545 550 555 560 Asp Phe Ser Asn Leu Glu Asn Glu Lys Ile Asp Tyr Ser Gln Leu Ile 565 570 575 Arg Phe Pro Asn Leu Ser Ser Ile Ala Ser Ala Arg Phe Ala Tyr Gln 580 585 590 Asp Leu Gln Gln Asp Gln Asn His Gly Lys Leu Ser Gln Tyr Trp Gln 595 600 605 Lys Leu Gln Ile Asn Ile Lys Gln Gln Phe Gly Lys Thr Ser Gln Glu 610 615 620 Tyr Gln Asp Phe Leu Ala Gln Thr Arg Gly Arg Pro Phe His Ile Pro 625 630 635 640 Lys Thr Asp Ile Cys Ile Asn Arg Gln Asn Leu Pro Gly Arg Tyr Tyr 645 650 655 Asn Gly Val Met Phe Ser Ser Lys Trp Leu Ala Glu Asp Met Gly Leu 660 665 670 Glu Lys Glu Gln Arg Pro Glu Leu Arg Lys Ile Val Asp Leu Thr His 675 680 685 Ser Glu Cys Gly Phe Gly Asp Ser Ser Pro Thr Asp Trp Trp Val Met 690 695 700 Ile Leu Gly Asp Gly Asp Gly Met Gly Gln Tyr Val Ser Gly Lys Lys 705 710 715 720 Leu His Pro Tyr Gln Glu Tyr Leu Thr Glu Thr His Pro Glu Thr Phe 725 730 735 Ile Asp Arg Asp Arg Tyr Pro Asp Leu Asp Glu Asn Gln Tyr Glu Gln 740 745 750 Lys Lys Arg Gln Phe Ile Lys Ala Phe Arg Asp Asp Lys His Ser Leu 755 760 765 Leu Lys Thr Arg Lys Arg Met Gly Pro Ala Thr His Val Gly Leu Asn 770 775 780 Arg Ala Leu Leu Asp Phe Ser Asn Arg Leu Val Pro Phe Ile Thr Glu 785 790 795 800 Lys Arg Phe Cys Gly Arg Val Val Tyr Ser Gly Gly Asp Asp Val Met 805 810 815 Thr Val Leu Pro Leu Glu Asp Leu Pro Asp Tyr Leu Leu Ser Leu Arg 820 825 830 Ala Ala Trp Cys Gly Gly Asp Asp Pro Tyr Gln Pro Gln Ala Gly Asp 835 840 845 Pro Asp Leu Lys Phe Gln Ser Gln Gly Gly Tyr Trp Arg Pro Thr Ser 850 855 860 Asp Thr Asn Asp Phe Gln Gly Leu Pro Asp Arg Ser Leu Phe Thr Met 865 870 875 880 Gly Phe Gly Ala Thr Met Ser Leu Gly Ile Val Ile Val Asp Lys Ser 885 890 895 Val Pro Leu Pro Val Ala Leu Glu Ala Leu Trp Glu Ala Glu Ser Asp 900 905 910 Arg Ala Lys Glu Leu Ser Gly Gly Leu Leu Met Ser Ile Asp Leu Leu 915 920 925 Arg Gly Leu Thr Glu Trp Arg Ser Leu Ser Leu Met Arg Phe Val Leu 930 935 940 Ser Glu Ile Phe Arg Leu Ser Ser Val Pro Asn Lys Asn Gly Leu Cys 945 950 955 960 Phe Arg Val Leu Tyr Ser Ser Gly Asn Thr Leu Glu Ala Leu Ile Lys 965 970 975 Gly Glu Leu Tyr Ala Gly Trp Arg Asp Trp Ile Thr Thr Glu His His 980 985 990 Gln Ala Leu Ser Ser Leu Leu Tyr Arg Leu Ala Glu Glu Leu Pro Arg 995 1000 1005 His Ala Asp Leu Thr Pro Ser Ser Tyr Leu Ile Ala Gln Ala Ala 1010 1015 1020 Arg Ala Ile Ala Leu Arg Arg Asp Asp Lys Asp Leu Val Gln Glu 1025 1030 1035 Asn Ile Asp Lys Leu Leu Ile Trp Leu Arg Tyr Trp Glu Asp Trp 1040 1045 1050 Ala Arg Ser Val His Val Gln Trp Leu Ile Asp Arg Glu Lys Asn 1055 1060 1065 Pro Asp Thr Pro Lys Pro Ile Gly Ile Asp Leu Lys Asp Leu Ser 1070 1075 1080 Asn Ile Leu Arg Phe Ser Ala Phe Trp Leu Asp Lys Met Gln Gln 1085 1090 1095 Arg Gln Gln Trp His Arg Gln Asp Gln Glu Ala 1100 1105 <210> 132 <211> 2934 <212> DNA <213> Halorhodospira halophila <400> 132 atgacggagg caaccctcat ggacattgat ctggcccgga acaagctgct cgcccgactg 60 cacgacccgg cggagaaggc gctggtcctg ctgcgcgatc ccgccggcca cgaggggggc 120 accgtgcgca ccctcatcga ggagatcctc ggcgaggtgc cgcaggcggc ctgggcgccc 180 gtgcgcaagg ccgaccgctg ggcctcggcg gcggaccggc cgcaattccc ccgtgagcgc 240 gacggcgatc gcttcgcgcg ctggagccag gtgcgcttcg ccgagcagcc ggtgctgcgc 300 catccgctca ccggcgagaa gatcgatctc ggcgagcacg gcaagctgcg ggagatcgag 360 ctcgacacgc tcaaggccgg cagcctcgag catttccggc acctgatcca tcgtgacgag 420 gcggggagcg tcgattcctg gcggaccctg ctcgcgctgt ggcgcttcgg ccccgagccg 480 gcaacgagcg gcgatgcgac cgggctcggc gagctgtggc gctatctgcc ggcggatacc 540 cgcatcccgg accacaccat ctggcagcac ctggacctga gctccgcgct caccggcgcc 600 ttcgcgggcg atggccaggg ccgctgcgcc ctgctcaacg tcaccctcgg cccggtgcag 660 gagctgatcg ccgccgcccg gacgacctcg gacctatggg ccggctcgca cctgctcgcc 720 cggctcgcct gggaggcgat gcgcgtcgtc tgcgagcgcc tcggccccga cgccgtgctc 780 ttcccgcagc tgcgcggcgt cccgcaggtc gacctctggc tcctcgagca ggggctggcg 840 ccggagctct tcgcgaagga gccctggaac gagcgcaccg tcaccgacgc caacccgctg 900 ttcagcgccg ccctgcccaa ccgcttcctc gccgtggtcc cggcggatca ggcggaggcg 960 atcggccgcg ccatcgaggc gcacctgcac gagtgggtcg ccgagaccgc cgagggcgtg 1020 gtcagcgatc tgctcagggc cgtcaacctg cacaccgatc cgacaacacc cgcctatcag 1080 caggcacggg agcagctggc cggattccct gaggtctact ggtcggccgt gggctgggac 1140 gagatcgcca cggacgccaa cggcgagccc gaggcggacc gcctcgccga ggccctgcgc 1200 cccttctatg agccgcaggc cgaggccccc ggcttcctca gctccgaggc ctggcgcgta 1260 ctacagcggc ccatcgaggt catcgatccg gaagcgggga cgccggcgac cttctaccgg 1320 cccaatcccg gcgtgctcta ccccgcgctc tacgagctca gcgagcgagt gatgggcggc 1380 gtcaaggcga cccgcccctt cgccgcgcag cacgagggcg gctatcgctg ctcgctgacc 1440 ggcgaggtgg agtggctgac ccacgatcgc agccacctcg acctgccgcc gggccagcgg 1500 gaagggcacg acaccctctg gagcctcgtt gccaagcgcc acccgagctg ggcgcgcaag 1560 ggtgagcacc tcggggcgct ggccgccctc aagcggctct ggccgcagcg cttctgccgc 1620 gaactcgccg ggaccctcgg gcaggagcag acgccgcgct tcgtcgtctc cacgcacacc 1680 atggcgctgg ccacctccct ggcccgcgct gccgaggagc cgaatcccgc cggcgggctc 1740 agcgccgagc aggccgaggc gatccgcaac gccgatcggg ttgcgctacc gcggcggctg 1800 gcgcagcggc tacaccacct cgagcacggt gagctcctcg cccggttgcc cggctgggtc 1860 gagcagcagc gcgaatccga cgacggcgat gagaccgccg cccggcaggc gatccgcaag 1920 gtcaccggca ccgaggccga ggcctactac gccctgctgc tcatggacgg cgaccgcatg 1980 ggggcctggc tctccggcgg cgacgggacg accatcccct accgggcggc cttccacccc 2040 gacctggcgg acgcagtgga cacacgcttc ggcgaccata cggtcctgca ggcgtacctc 2100 gacacgccgc gggcggtctc accggcccgg cacctggcca tctccggggc gctgaacgac 2160 ttctccacca ccctcgcccg cagggtggtc gaggagtgtc accacggccg cgtcctctat 2220 gccggcggcg acgacctcat ggccatgctg cccactggcg atctgctcag cgccatgcgc 2280 gagctgcgcg acgcttactc gggcacggct accagcggtg aggccgagga agaggacgcc 2340 tggtgccgca acggcttcat ctatcggcag gaccggctgt acctgaccat ggggtcgcag 2400 gccaccgcct cgatgggggc ggtgatcgcc caccataaga cccctctgac cgcggccctc 2460 gctgaactgc gccaggccga gcagcgggcc aagaacgagg gcgggcgcga cgccttcgcc 2520 ctgtccgttc tcaagcgcag cggcggcgcc ctgcgccacg tcggccgctg ggcaccagca 2580 gcgggtatcg acgagatgag cgccctgcgc gacttcgccg aggcgctcca tgccaacccc 2640 gaggcctccc ggcgcgccgc ctacaacgtc gcgggctggc tcgccgatct ccccgagccc 2700 gacaccctcc ccccggagga cggcgtcgcc ggctacctcg aggcggtgct gcactaccaa 2760 ttctgccgcc agggcctcga gcagcagggg cagcccatcc acgcgcggcg gctcggatcg 2820 ctcgccagcg tctcgccaac cggcgacgag ctgagcagcg ccgccaagat ccgcgaccgt 2880 ctcagccacc tcgtcggcgt ggccgagttc ctcgcccgcg agacccggag gtag 2934 <210> 133 <211> 977 <212> PRT <213> Halorhodospira halophila <400> 133 Met Thr Glu Ala Thr Leu Met Asp Ile Asp Leu Ala Arg Asn Lys Leu 1 5 10 15 Leu Ala Arg Leu His Asp Pro Ala Glu Lys Ala Leu Val Leu Leu Arg 20 25 30 Asp Pro Ala Gly His Glu Gly Gly Thr Val Arg Thr Leu Ile Glu Glu 35 40 45 Ile Leu Gly Glu Val Pro Gln Ala Ala Trp Ala Pro Val Arg Lys Ala 50 55 60 Asp Arg Trp Ala Ser Ala Ala Asp Arg Pro Gln Phe Pro Arg Glu Arg 65 70 75 80 Asp Gly Asp Arg Phe Ala Arg Trp Ser Gln Val Arg Phe Ala Glu Gln 85 90 95 Pro Val Leu Arg His Pro Leu Thr Gly Glu Lys Ile Asp Leu Gly Glu 100 105 110 His Gly Lys Leu Arg Glu Ile Glu Leu Asp Thr Leu Lys Ala Gly Ser 115 120 125 Leu Glu His Phe Arg His Leu Ile His Arg Asp Glu Ala Gly Ser Val 130 135 140 Asp Ser Trp Arg Thr Leu Leu Ala Leu Trp Arg Phe Gly Pro Glu Pro 145 150 155 160 Ala Thr Ser Gly Asp Ala Thr Gly Leu Gly Glu Leu Trp Arg Tyr Leu 165 170 175 Pro Ala Asp Thr Arg Ile Pro Asp His Thr Ile Trp Gln His Leu Asp 180 185 190 Leu Ser Ser Ala Leu Thr Gly Ala Phe Ala Gly Asp Gly Gln Gly Arg 195 200 205 Cys Ala Leu Leu Asn Val Thr Leu Gly Pro Val Gln Glu Leu Ile Ala 210 215 220 Ala Ala Arg Thr Thr Ser Asp Leu Trp Ala Gly Ser His Leu Leu Ala 225 230 235 240 Arg Leu Ala Trp Glu Ala Met Arg Val Val Cys Glu Arg Leu Gly Pro 245 250 255 Asp Ala Val Leu Phe Pro Gln Leu Arg Gly Val Pro Gln Val Asp Leu 260 265 270 Trp Leu Leu Glu Gln Gly Leu Ala Pro Glu Leu Phe Ala Lys Glu Pro 275 280 285 Trp Asn Glu Arg Thr Val Thr Asp Ala Asn Pro Leu Phe Ser Ala Ala 290 295 300 Leu Pro Asn Arg Phe Leu Ala Val Val Pro Ala Asp Gln Ala Glu Ala 305 310 315 320 Ile Gly Arg Ala Ile Glu Ala His Leu His Glu Trp Val Ala Glu Thr 325 330 335 Ala Glu Gly Val Val Ser Asp Leu Leu Arg Ala Val Asn Leu His Thr 340 345 350 Asp Pro Thr Thr Pro Ala Tyr Gln Gln Ala Arg Glu Gln Leu Ala Gly 355 360 365 Phe Pro Glu Val Tyr Trp Ser Ala Val Gly Trp Asp Glu Ile Ala Thr 370 375 380 Asp Ala Asn Gly Glu Pro Glu Ala Asp Arg Leu Ala Glu Ala Leu Arg 385 390 395 400 Pro Phe Tyr Glu Pro Gln Ala Glu Ala Pro Gly Phe Leu Ser Ser Glu 405 410 415 Ala Trp Arg Val Leu Gln Arg Pro Ile Glu Val Ile Asp Pro Glu Ala 420 425 430 Gly Thr Pro Ala Thr Phe Tyr Arg Pro Asn Pro Gly Val Leu Tyr Pro 435 440 445 Ala Leu Tyr Glu Leu Ser Glu Arg Val Met Gly Gly Val Lys Ala Thr 450 455 460 Arg Pro Phe Ala Ala Gln His Glu Gly Gly Tyr Arg Cys Ser Leu Thr 465 470 475 480 Gly Glu Val Glu Trp Leu Thr His Asp Arg Ser His Leu Asp Leu Pro 485 490 495 Pro Gly Gln Arg Glu Gly His Asp Thr Leu Trp Ser Leu Val Ala Lys 500 505 510 Arg His Pro Ser Trp Ala Arg Lys Gly Glu His Leu Gly Ala Leu Ala 515 520 525 Ala Leu Lys Arg Leu Trp Pro Gln Arg Phe Cys Arg Glu Leu Ala Gly 530 535 540 Thr Leu Gly Gln Glu Gln Thr Pro Arg Phe Val Val Ser Thr His Thr 545 550 555 560 Met Ala Leu Ala Thr Ser Leu Ala Arg Ala Ala Glu Glu Pro Asn Pro 565 570 575 Ala Gly Gly Leu Ser Ala Glu Gln Ala Glu Ala Ile Arg Asn Ala Asp 580 585 590 Arg Val Ala Leu Pro Arg Arg Leu Ala Gln Arg Leu His His Leu Glu 595 600 605 His Gly Glu Leu Leu Ala Arg Leu Pro Gly Trp Val Glu Gln Gln Arg 610 615 620 Glu Ser Asp Asp Gly Asp Glu Thr Ala Ala Arg Gln Ala Ile Arg Lys 625 630 635 640 Val Thr Gly Thr Glu Ala Glu Ala Tyr Tyr Ala Leu Leu Leu Met Asp 645 650 655 Gly Asp Arg Met Gly Ala Trp Leu Ser Gly Gly Asp Gly Thr Thr Ile 660 665 670 Pro Tyr Arg Ala Ala Phe His Pro Asp Leu Ala Asp Ala Val Asp Thr 675 680 685 Arg Phe Gly Asp His Thr Val Leu Gln Ala Tyr Leu Asp Thr Pro Arg 690 695 700 Ala Val Ser Pro Ala Arg His Leu Ala Ile Ser Gly Ala Leu Asn Asp 705 710 715 720 Phe Ser Thr Thr Leu Ala Arg Arg Val Val Glu Glu Cys His His Gly 725 730 735 Arg Val Leu Tyr Ala Gly Gly Asp Asp Leu Met Ala Met Leu Pro Thr 740 745 750 Gly Asp Leu Leu Ser Ala Met Arg Glu Leu Arg Asp Ala Tyr Ser Gly 755 760 765 Thr Ala Thr Ser Gly Glu Ala Glu Glu Glu Asp Ala Trp Cys Arg Asn 770 775 780 Gly Phe Ile Tyr Arg Gln Asp Arg Leu Tyr Leu Thr Met Gly Ser Gln 785 790 795 800 Ala Thr Ala Ser Met Gly Ala Val Ile Ala His His Lys Thr Pro Leu 805 810 815 Thr Ala Ala Leu Ala Glu Leu Arg Gln Ala Glu Gln Arg Ala Lys Asn 820 825 830 Glu Gly Gly Arg Asp Ala Phe Ala Leu Ser Val Leu Lys Arg Ser Gly 835 840 845 Gly Ala Leu Arg His Val Gly Arg Trp Ala Pro Ala Ala Gly Ile Asp 850 855 860 Glu Met Ser Ala Leu Arg Asp Phe Ala Glu Ala Leu His Ala Asn Pro 865 870 875 880 Glu Ala Ser Arg Arg Ala Ala Tyr Asn Val Ala Gly Trp Leu Ala Asp 885 890 895 Leu Pro Glu Pro Asp Thr Leu Pro Pro Glu Asp Gly Val Ala Gly Tyr 900 905 910 Leu Glu Ala Val Leu His Tyr Gln Phe Cys Arg Gln Gly Leu Glu Gln 915 920 925 Gln Gly Gln Pro Ile His Ala Arg Arg Leu Gly Ser Leu Ala Ser Val 930 935 940 Ser Pro Thr Gly Asp Glu Leu Ser Ser Ala Ala Lys Ile Arg Asp Arg 945 950 955 960 Leu Ser His Leu Val Gly Val Ala Glu Phe Leu Ala Arg Glu Thr Arg 965 970 975 Arg <210> 134 <211> 2721 <212> DNA <213> Thermoanaerobacter italicus <400> 134 ttatttctca cctcctcgat tcaaaaaagc taatatcgtt aagaggctaa taaaattgtc 60 gtattttacc tctttataca gagaatatag taaaatgtat aaatctcttt caactttttc 120 tttttcatct ttacttaagt tctcattcaa tgaacgttta atatttcttt tgagctcact 180 aataaaaatg ccttgtggaa gagaatctac atctagcctt tccaaagctg cttttaattt 240 tccaacaaaa gaaatactta atttgtcttc tttaaaaaag gaatttatat cttttaataa 300 acctattgtt ccttctttat ttcttgcatc atcataattc cacttggctc tggcaatgta 360 attctcacca gaatgcaaaa taagttttat tgcaaaggca tcctttcctt ctactttttt 420 tgcatattct tcctctacct catctacaga agctataaca ttttttaaat cttctttata 480 atgagctata actaccccca ttgacgccgt ggctttgttt cccatcatca catcaatttc 540 ctcttttcgt tccacaaatc cggcatctat tgtaaaatct ggaattatct cattattaac 600 aattaagtgc ccactgaaag ccgccctaag ttttaccata acatctaata aataattaag 660 atttactatt gcaaatacat catctccgcc agaatatatt acttttcctg ctcttgtctc 720 ttccactatt tcttttacat atttcaaaga atagttctta agtgcctcac taattaaaga 780 gtgaacagct ggtgtcatta gtcgcttttt atccttgatt ttttctttaa aatcttctgg 840 taaaaaaccc tgcaatttac tgtggtacat ttctaacata tagggtgcca attctcctgc 900 taaccatttc cccatgttat cgccatcaag ctttataacg gcataatatt tctttttatt 960 cagtcttatg tctttaattc ttttatcaat actctttaat aattctttaa gtttgcctaa 1020 tctttttgaa ttaaaatcat aagttttaaa ataattttca ttgagatttt cctcatacaa 1080 caattcataa tcaaagttat caccgcacca ctttttgaat acttctttgt atctttttat 1140 atttgttttt aggtcattat ctgaattgtt aattatatct agtaatgcta tctctgcagt 1200 agagggaaaa ctttcttcta tgttgttttt cccaaacata tctttaaaat atatttctgc 1260 cgcccttttt gtcaggcatc tgctgcacaa cccttctcct tgtgctaaat acttataagt 1320 aatactttta tcatcacttt ttttgattat tgcattttgt tctctaagaa gtttaatctt 1380 ataactttct ttcccttttt ctatcttttc atcttcttct ctcgtacacc tgtagataat 1440 aacattgtgc tcaccgcata tagaacattt tcgccctatt tcttcatatt gattgaagtt 1500 tcttatgcct tttcttgtcc ccatcatttt ctccataaaa gaataaagta acccataaat 1560 attaccaatg ttaggcccgt attcaccttt atctttaata tatctcaata aatcctttat 1620 ctcttccacc tcatcactgt taaaataatc ctttatctta tccaattgga tttcccaatc 1680 aggcctgttt acatccccat tttctaaagg caacgccacc caatacacat ctggaaagtt 1740 tgataattgg cgtaaaagca attttttttg ctcatcattg ctttttacaa gatgactaaa 1800 aacatattcc ccgattttta tatattcatc ttttactgtt tttttaagat ttagtaacct 1860 aatttcttct acattttttg ttggtaaaat tgcaaaaaat ctgttgggaa gagtaggagt 1920 tttaaggtct ttagtcgtag ttgcactgtt attaaatagc tttgctatcc aaaaatcgca 1980 caaaggctgt tctttaagtt cagggaatat tatagaatct ggtccataag cttctataac 2040 tttttctatt gccacccacg ttaaataaga caaaatataa cttccccaat acaagtcttg 2100 tgtcttcctt gcctgcacaa tatattcttg aacaggacct attgtaaaaa taaatagtgt 2160 catattgttt aaattcaatt cattataaaa atatgcattc accgcagatg ccaatttcaa 2220 atgctcaaat attgtgtgat taggaaatcg agtatcagca ggagctaaat cccaatattt 2280 tctatattca cttggcgtat gtttctttaa aagctctttc aaataacgcc ataaatacac 2340 aaatttttta taactatctt taaagtctag ttttgataac tcatctactg cttcatctac 2400 agccttttta aacacttctt tttctataac aaaattatta tatcgattag ctgcaagagg 2460 atgaacaaac tcaggttgtt cttcaaaaac aacttgtaaa tttttatttt tactggcatc 2520 tttaggtata taatatcttt ccataaatga agctaaaaca tctgaagcaa tagttttgtg 2580 gtaaggaata tctatttttt tagatatttc cttagctctt ttctcatggt tttcacctgt 2640 taacaaaata aatggcttat ctggagaatc atgaaaatat gctttcaatt tattttcaaa 2700 taactcttct ttcttactca t 2721 <210> 135 <211> 906 <212> PRT <213> Thermoanaerobacter italicus <400> 135 Met Ser Lys Lys Glu Glu Leu Phe Glu Asn Lys Leu Lys Ala Tyr Phe 1 5 10 15 His Asp Ser Pro Asp Lys Pro Phe Ile Leu Leu Thr Gly Glu Asn His 20 25 30 Glu Lys Arg Ala Lys Glu Ile Ser Lys Lys Ile Asp Ile Pro Tyr His 35 40 45 Lys Thr Ile Ala Ser Asp Val Leu Ala Ser Phe Met Glu Arg Tyr Tyr 50 55 60 Ile Pro Lys Asp Ala Ser Lys Asn Lys Asn Leu Gln Val Val Phe Glu 65 70 75 80 Glu Gln Pro Glu Phe Val His Pro Leu Ala Ala Asn Arg Tyr Asn Asn 85 90 95 Phe Val Ile Glu Lys Glu Val Phe Lys Lys Ala Val Asp Glu Ala Val 100 105 110 Asp Glu Leu Ser Lys Leu Asp Phe Lys Asp Ser Tyr Lys Lys Phe Val 115 120 125 Tyr Leu Trp Arg Tyr Leu Lys Glu Leu Leu Lys Lys His Thr Pro Ser 130 135 140 Glu Tyr Arg Lys Tyr Trp Asp Leu Ala Pro Ala Asp Thr Arg Phe Pro 145 150 155 160 Asn His Thr Ile Phe Glu His Leu Lys Leu Ala Ser Ala Val Asn Ala 165 170 175 Tyr Phe Tyr Asn Glu Leu Asn Leu Asn Asn Met Thr Leu Phe Ile Phe 180 185 190 Thr Ile Gly Pro Val Gln Glu Tyr Ile Val Gln Ala Arg Lys Thr Gln 195 200 205 Asp Leu Tyr Trp Gly Ser Tyr Ile Leu Ser Tyr Leu Thr Trp Val Ala 210 215 220 Ile Glu Lys Val Ile Glu Ala Tyr Gly Pro Asp Ser Ile Ile Phe Pro 225 230 235 240 Glu Leu Lys Glu Gln Pro Leu Cys Asp Phe Trp Ile Ala Lys Leu Phe 245 250 255 Asn Asn Ser Ala Thr Thr Thr Lys Asp Leu Lys Thr Pro Thr Leu Pro 260 265 270 Asn Arg Phe Phe Ala Ile Leu Pro Thr Lys Asn Val Glu Glu Ile Arg 275 280 285 Leu Leu Asn Leu Lys Lys Thr Val Lys Asp Glu Tyr Ile Lys Ile Gly 290 295 300 Glu Tyr Val Phe Ser His Leu Val Lys Ser Asn Asp Glu Gln Lys Lys 305 310 315 320 Leu Leu Leu Arg Gln Leu Ser Asn Phe Pro Asp Val Tyr Trp Val Ala 325 330 335 Leu Pro Leu Glu Asn Gly Asp Val Asn Arg Pro Asp Trp Glu Ile Gln 340 345 350 Leu Asp Lys Ile Lys Asp Tyr Phe Asn Ser Asp Glu Val Glu Glu Ile 355 360 365 Lys Asp Leu Leu Arg Tyr Ile Lys Asp Lys Gly Glu Tyr Gly Pro Asn 370 375 380 Ile Gly Asn Ile Tyr Gly Leu Leu Tyr Ser Phe Met Glu Lys Met Met 385 390 395 400 Gly Thr Arg Lys Gly Ile Arg Asn Phe Asn Gln Tyr Glu Glu Ile Gly 405 410 415 Arg Lys Cys Ser Ile Cys Gly Glu His Asn Val Ile Ile Tyr Arg Cys 420 425 430 Thr Arg Glu Glu Asp Glu Lys Ile Glu Lys Gly Lys Glu Ser Tyr Lys 435 440 445 Ile Lys Leu Leu Arg Glu Gln Asn Ala Ile Ile Lys Lys Ser Asp Asp 450 455 460 Lys Ser Ile Thr Tyr Lys Tyr Leu Ala Gln Gly Glu Gly Leu Cys Ser 465 470 475 480 Arg Cys Leu Thr Lys Arg Ala Ala Glu Ile Tyr Phe Lys Asp Met Phe 485 490 495 Gly Lys Asn Asn Ile Glu Glu Ser Phe Pro Ser Thr Ala Glu Ile Ala 500 505 510 Leu Leu Asp Ile Ile Asn Asn Ser Asp Asn Asp Leu Lys Thr Asn Ile 515 520 525 Lys Arg Tyr Lys Glu Val Phe Lys Lys Trp Cys Gly Asp Asn Phe Asp 530 535 540 Tyr Glu Leu Leu Tyr Glu Glu Asn Leu Asn Glu Asn Tyr Phe Lys Thr 545 550 555 560 Tyr Asp Phe Asn Ser Lys Arg Leu Gly Lys Leu Lys Glu Leu Leu Lys 565 570 575 Ser Ile Asp Lys Arg Ile Lys Asp Ile Arg Leu Asn Lys Lys Lys Tyr 580 585 590 Tyr Ala Val Ile Lys Leu Asp Gly Asp Asn Met Gly Lys Trp Leu Ala 595 600 605 Gly Glu Leu Ala Pro Tyr Met Leu Glu Met Tyr His Ser Lys Leu Gln 610 615 620 Gly Phe Leu Pro Glu Asp Phe Lys Glu Lys Ile Lys Asp Lys Lys Arg 625 630 635 640 Leu Met Thr Pro Ala Val His Ser Leu Ile Ser Glu Ala Leu Lys Asn 645 650 655 Tyr Ser Leu Lys Tyr Val Lys Glu Ile Val Glu Glu Thr Arg Ala Gly 660 665 670 Lys Val Ile Tyr Ser Gly Gly Asp Asp Val Phe Ala Ile Val Asn Leu 675 680 685 Asn Tyr Leu Leu Asp Val Met Val Lys Leu Arg Ala Ala Phe Ser Gly 690 695 700 His Leu Ile Val Asn Asn Glu Ile Ile Pro Asp Phe Thr Ile Asp Ala 705 710 715 720 Gly Phe Val Glu Arg Lys Glu Glu Ile Asp Val Met Met Gly Asn Lys 725 730 735 Ala Thr Ala Ser Met Gly Val Val Ile Ala His Tyr Lys Glu Asp Leu 740 745 750 Lys Asn Val Ile Ala Ser Val Asp Glu Val Glu Glu Glu Tyr Ala Lys 755 760 765 Lys Val Glu Gly Lys Asp Ala Phe Ala Ile Lys Leu Ile Leu His Ser 770 775 780 Gly Glu Asn Tyr Ile Ala Arg Ala Lys Trp Asn Tyr Asp Asp Ala Arg 785 790 795 800 Asn Lys Glu Gly Thr Ile Gly Leu Leu Lys Asp Ile Asn Ser Phe Phe 805 810 815 Lys Glu Asp Lys Leu Ser Ile Ser Phe Val Gly Lys Leu Lys Ala Ala 820 825 830 Leu Glu Arg Leu Asp Val Asp Ser Leu Pro Gln Gly Ile Phe Ile Ser 835 840 845 Glu Leu Lys Arg Asn Ile Lys Arg Ser Leu Asn Glu Asn Leu Ser Lys 850 855 860 Asp Glu Lys Glu Lys Val Glu Arg Asp Leu Tyr Ile Leu Leu Tyr Ser 865 870 875 880 Leu Tyr Lys Glu Val Lys Tyr Asp Asn Phe Ile Ser Leu Leu Thr Ile 885 890 895 Leu Ala Phe Leu Asn Arg Gly Gly Glu Lys 900 905 <210> 136 <211> 2721 <212> DNA <213> Thermoanaerobacter mathranii <400> 136 atgagtaaga aagaagagtt atttgaaaat aaattgaaag catattttca tgattctcca 60 gataagccat ttattttgtt aacaggtgaa aaccatgaga aaagagctaa ggaaatatct 120 aaaaaaatag atattcctta ccacaaaact attgcttcag atgttttagc ttcatctatg 180 gaaagatatt atatacctaa agatgccagt aaaaataaaa atttacaagt tgtttttgaa 240 gaacaacctg agtttgttca tcctcttgca gctaatcgat ataataattt tgttatagaa 300 aaagaagtgt ttaaaaaggc tgtagatgaa gcagtagatg agttatcaaa actagacttt 360 aaagatagtt ataaaaaatt tgtgtattta tggcgttatt tgaaagagct tttaaaaaaa 420 catacgccaa gtgaatatag aaaatattgg gatttagctc ctgctgatac tcgatttcct 480 aatcacacaa tatttcagca tttaaaattg gcatctgcgg tgaatgcata tttttataat 540 gaattgaatt taaacaatat gacactattt atttttacaa taggtcctgt tcaagaatat 600 atcgtgcagg caaggaagac acaagacttg tattggggaa gttatatttt gtcttattta 660 acgtgggtgg caatagaaaa agttatagaa gcttatggac cagattctat aatattccct 720 gaacttaaag aacagccttt gtgcgatttt tggatagcaa agctatttaa taacagtgca 780 actacgacta aagaccttaa aactcctact cttcccaaca gattttttgc aattttacca 840 acaaaaaatg tagaagaaat taggttacta aatcttaaaa aaacagtaaa agatgaatat 900 ataaaaatcg gggaatatgt ttttagtcat cttgtaaaaa gcaatgatga gcaaaaaaaa 960 ttgcttttac gccaattatc aaactttcca gatgtgtatt gggtggcgtt gcctttagaa 1020 aatggggatg taaacaggcc tgattgggaa atccaattgg ataagataaa ggattatttt 1080 aacagtgatg aggtggaaga gataaaggat ttattgagat atattaaaga taaaggtgaa 1140 tacgggccta acattggtaa tatttatggg ttactttatt cttttatgga gaaaatgatg 1200 gggacaagaa aaggcataag aaacttcaat caatatgaag aaatagggcg aaaatgttct 1260 atatgcggtg agcacaatgt tattatctac aggtgtacga gagaagaaga tgaaaagata 1320 gaaaaaggga aagaaagtta taagattaaa cttcttagag aacaaaatgc aataatcaaa 1380 aaaagtgatg ataaaagtat tacttataag tatttagcac aaggagaagg gttgtgcagc 1440 agatgcctga caaaaagggc ggcagaaata tattttaaag atatgtttgg gaaaaacaac 1500 atagaagaaa gttttccctc tactgcagag atagcattac tagatataat taacaattca 1560 gataatgacc taaaaacaaa tataaaaaga tacaaagaag tattcaaaaa gtggtgcggt 1620 gataactttg attatgaatt gttgtatgag gaaaatctca atgaaaatta ttttaaaact 1680 tatgatttta aatcaaaaag attaggcgaa cttaaagaat tattaaagag tattgataaa 1740 agaattaaag acataagact gaataaaaag aaatattatg ccgttataaa gcttgatggc 1800 gataacatgg ggaaatggtt agcaggagaa ttggcaccct atatgttaga aatgtaccac 1860 agtaaattgc agggtttttt accagaagat tttaaagaaa aaatcaagga taaaaagcga 1920 ctaatgacac cagctgttca ctctttaatt agtgaggcac ttaagaacta ttctttgaaa 1980 tatgtaaaag aaatagtgga agagacaaga gcaggaaaag taatatattc tggcggagat 2040 gatgtatttg caatagtaaa tcttaattat ttattagatg ttatggtaaa acttagggcg 2100 gctttcagtg ggcacttaat tgttaataat aagataattc cagattttac aatagatgcc 2160 ggatttgtgg aacgaaaaga ggaaattgat gtgatgatgg gaaacaaagc cacggcgtca 2220 atgggggtag ttatagctca ttataaagaa gatttaaaaa atgttatagc ttctgtagat 2280 gaggtagagg aagaatatgc aaaaaaagta gaaggaaagg atgcctttgc aataaaactt 2340 attttgcatt ctggtgagaa ttacattgcc agagccaagt ggaattatga tgatgcaaga 2400 aataaagaag gaacaatagg tttattaaaa gatataaatt ccttttttaa agaagacaaa 2460 ttaagtattt cttttgttgg aaaattaaaa gcagctttgg aaaggctaga tgtagattct 2520 cttccacaag gcatttttat tagtgagctc aaaagaaata ttaaacgttc attgaatgag 2580 aacttaagta aagatgaaaa agaaaaagtt gaaagagatt tatacatttt actatattct 2640 ctgtataaag aggtaaaata cgacaatttt attagcctct taacgatatt agcttttttg 2700 aatcgaggag gtgagaaata a 2721 <210> 137 <211> 906 <212> PRT <213> Thermoanaerobacter mathranii <400> 137 Met Ser Lys Lys Glu Glu Leu Phe Glu Asn Lys Leu Lys Ala Tyr Phe 1 5 10 15 His Asp Ser Pro Asp Lys Pro Phe Ile Leu Leu Thr Gly Glu Asn His 20 25 30 Glu Lys Arg Ala Lys Glu Ile Ser Lys Lys Ile Asp Ile Pro Tyr His 35 40 45 Lys Thr Ile Ala Ser Asp Val Leu Ala Ser Ser Met Glu Arg Tyr Tyr 50 55 60 Ile Pro Lys Asp Ala Ser Lys Asn Lys Asn Leu Gln Val Val Phe Glu 65 70 75 80 Glu Gln Pro Glu Phe Val His Pro Leu Ala Ala Asn Arg Tyr Asn Asn 85 90 95 Phe Val Ile Glu Lys Glu Val Phe Lys Lys Ala Val Asp Glu Ala Val 100 105 110 Asp Glu Leu Ser Lys Leu Asp Phe Lys Asp Ser Tyr Lys Lys Phe Val 115 120 125 Tyr Leu Trp Arg Tyr Leu Lys Glu Leu Leu Lys Lys His Thr Pro Ser 130 135 140 Glu Tyr Arg Lys Tyr Trp Asp Leu Ala Pro Ala Asp Thr Arg Phe Pro 145 150 155 160 Asn His Thr Ile Phe Gln His Leu Lys Leu Ala Ser Ala Val Asn Ala 165 170 175 Tyr Phe Tyr Asn Glu Leu Asn Leu Asn Asn Met Thr Leu Phe Ile Phe 180 185 190 Thr Ile Gly Pro Val Gln Glu Tyr Ile Val Gln Ala Arg Lys Thr Gln 195 200 205 Asp Leu Tyr Trp Gly Ser Tyr Ile Leu Ser Tyr Leu Thr Trp Val Ala 210 215 220 Ile Glu Lys Val Ile Glu Ala Tyr Gly Pro Asp Ser Ile Ile Phe Pro 225 230 235 240 Glu Leu Lys Glu Gln Pro Leu Cys Asp Phe Trp Ile Ala Lys Leu Phe 245 250 255 Asn Asn Ser Ala Thr Thr Thr Lys Asp Leu Lys Thr Pro Thr Leu Pro 260 265 270 Asn Arg Phe Phe Ala Ile Leu Pro Thr Lys Asn Val Glu Glu Ile Arg 275 280 285 Leu Leu Asn Leu Lys Lys Thr Val Lys Asp Glu Tyr Ile Lys Ile Gly 290 295 300 Glu Tyr Val Phe Ser His Leu Val Lys Ser Asn Asp Glu Gln Lys Lys 305 310 315 320 Leu Leu Leu Arg Gln Leu Ser Asn Phe Pro Asp Val Tyr Trp Val Ala 325 330 335 Leu Pro Leu Glu Asn Gly Asp Val Asn Arg Pro Asp Trp Glu Ile Gln 340 345 350 Leu Asp Lys Ile Lys Asp Tyr Phe Asn Ser Asp Glu Val Glu Glu Ile 355 360 365 Lys Asp Leu Leu Arg Tyr Ile Lys Asp Lys Gly Glu Tyr Gly Pro Asn 370 375 380 Ile Gly Asn Ile Tyr Gly Leu Leu Tyr Ser Phe Met Glu Lys Met Met 385 390 395 400 Gly Thr Arg Lys Gly Ile Arg Asn Phe Asn Gln Tyr Glu Glu Ile Gly 405 410 415 Arg Lys Cys Ser Ile Cys Gly Glu His Asn Val Ile Ile Tyr Arg Cys 420 425 430 Thr Arg Glu Glu Asp Glu Lys Ile Glu Lys Gly Lys Glu Ser Tyr Lys 435 440 445 Ile Lys Leu Leu Arg Glu Gln Asn Ala Ile Ile Lys Lys Ser Asp Asp 450 455 460 Lys Ser Ile Thr Tyr Lys Tyr Leu Ala Gln Gly Glu Gly Leu Cys Ser 465 470 475 480 Arg Cys Leu Thr Lys Arg Ala Ala Glu Ile Tyr Phe Lys Asp Met Phe 485 490 495 Gly Lys Asn Asn Ile Glu Glu Ser Phe Pro Ser Thr Ala Glu Ile Ala 500 505 510 Leu Leu Asp Ile Ile Asn Asn Ser Asp Asn Asp Leu Lys Thr Asn Ile 515 520 525 Lys Arg Tyr Lys Glu Val Phe Lys Lys Trp Cys Gly Asp Asn Phe Asp 530 535 540 Tyr Glu Leu Leu Tyr Glu Glu Asn Leu Asn Glu Asn Tyr Phe Lys Thr 545 550 555 560 Tyr Asp Phe Lys Ser Lys Arg Leu Gly Glu Leu Lys Glu Leu Leu Lys 565 570 575 Ser Ile Asp Lys Arg Ile Lys Asp Ile Arg Leu Asn Lys Lys Lys Tyr 580 585 590 Tyr Ala Val Ile Lys Leu Asp Gly Asp Asn Met Gly Lys Trp Leu Ala 595 600 605 Gly Glu Leu Ala Pro Tyr Met Leu Glu Met Tyr His Ser Lys Leu Gln 610 615 620 Gly Phe Leu Pro Glu Asp Phe Lys Glu Lys Ile Lys Asp Lys Lys Arg 625 630 635 640 Leu Met Thr Pro Ala Val His Ser Leu Ile Ser Glu Ala Leu Lys Asn 645 650 655 Tyr Ser Leu Lys Tyr Val Lys Glu Ile Val Glu Glu Thr Arg Ala Gly 660 665 670 Lys Val Ile Tyr Ser Gly Gly Asp Asp Val Phe Ala Ile Val Asn Leu 675 680 685 Asn Tyr Leu Leu Asp Val Met Val Lys Leu Arg Ala Ala Phe Ser Gly 690 695 700 His Leu Ile Val Asn Asn Lys Ile Ile Pro Asp Phe Thr Ile Asp Ala 705 710 715 720 Gly Phe Val Glu Arg Lys Glu Glu Ile Asp Val Met Met Gly Asn Lys 725 730 735 Ala Thr Ala Ser Met Gly Val Val Ile Ala His Tyr Lys Glu Asp Leu 740 745 750 Lys Asn Val Ile Ala Ser Val Asp Glu Val Glu Glu Glu Tyr Ala Lys 755 760 765 Lys Val Glu Gly Lys Asp Ala Phe Ala Ile Lys Leu Ile Leu His Ser 770 775 780 Gly Glu Asn Tyr Ile Ala Arg Ala Lys Trp Asn Tyr Asp Asp Ala Arg 785 790 795 800 Asn Lys Glu Gly Thr Ile Gly Leu Leu Lys Asp Ile Asn Ser Phe Phe 805 810 815 Lys Glu Asp Lys Leu Ser Ile Ser Phe Val Gly Lys Leu Lys Ala Ala 820 825 830 Leu Glu Arg Leu Asp Val Asp Ser Leu Pro Gln Gly Ile Phe Ile Ser 835 840 845 Glu Leu Lys Arg Asn Ile Lys Arg Ser Leu Asn Glu Asn Leu Ser Lys 850 855 860 Asp Glu Lys Glu Lys Val Glu Arg Asp Leu Tyr Ile Leu Leu Tyr Ser 865 870 875 880 Leu Tyr Lys Glu Val Lys Tyr Asp Asn Phe Ile Ser Leu Leu Thr Ile 885 890 895 Leu Ala Phe Leu Asn Arg Gly Gly Glu Lys 900 905 <210> 138 <211> 2730 <212> DNA <213> Thermoanaerobacter tengcongensis <400> 138 ttattcatta caggaatgct ccattgcaat tgaccttgct ataatcaaca tattagcaaa 60 atctatcact ctatctggcg tttctttaac tatctcatca aactttggga gcaatatctc 120 actagcatat ttttctaaaa tatctctgtt tccactctga cgaagaaata ttctctttaa 180 ttcatttctc aaaatcccaa taatttgttc tttattttcg tcatcataca atctgtctac 240 tacctcaaaa aattgatagg gaaaagtgga tgaaaattct cctttcttga aatgctctat 300 gagttctctc aaaaaatcca tcaacgccca tttgcccccg cattctttta gtgctccact 360 tccttttata aacttaaggc aaaaagcatt tctattatac tgtctttcgt cttttgcttt 420 cttctgagcc aattgaacct ctttcaaggc aaggtaaaga ggatatttgt gatgaactat 480 tacaatgcct gcactcatgg aggcttcaga acttaaaact tctttaaaag cgttctgcaa 540 ttcataagca cattccaaca cctcttctac aggaagtaat gctagaacgt catctcctcc 600 tgcataaacc aatttcccgt aatgtgtttc ttctacaatt cttcgcactt cttgaagagc 660 aaacgtggaa attttcctac tcaaggtctg gtgaagagaa ggagtagtag ggtgtttctt 720 acaaagtatc gaagataggt tatcttttgc atgttgtttt atatgttctc ccactttggg 780 gtgtaaagtt tccattatag gtggattatt ctctcctttt aaccacttcc ccatgtggtc 840 cccatccatt tgaagaatag cataatatct ggaagggttg accctgtgtt tttctaaaag 900 ctttgttatt ttctgagaca tcttctgaaa ttcctctact ttgaagttct ctgtatgctc 960 acttttaata tattcttctc tataactctc cctcatcaac cactgtccat ctatttcaaa 1020 aagttggtta tcttttaatt tcggaacaga aacagtattg ggaagcaaaa gcttctgttt 1080 aaattctcca aataattcct tgaactctgc aataaactct ttgttgtcag caattctcct 1140 tttttctcca atagttgcca tttcagaagt tgagggaaat ttcatttctt cggaaagatt 1200 tagctcttcc ttcattacct ttgggaataa tcgctttgca agacacactc cacagagttg 1260 ctctttttct tttaccaagc ctttttcctt actcctcaat ttttcccaat ctaatggcaa 1320 aacttcaaac tctccacata aactgcactt acgccctttt tgttctaact gttcaaattc 1380 ccttatgctc ttcctcgctc caagcaattt ttcagttagc tcaagaagta atgaataggc 1440 tatgctaaaa tctctgtatt cctcatcttt ttctttattt ttactccata tcttaggaac 1500 agattctata aactcactta tcgttttgta aagctctgtc tctcctatta tttctttgta 1560 atcatccaaa acctcttttg gagactcttt ctcttcaaac catggcataa ccgcccagta 1620 aacctggaaa taatttaata gctgattttc aatctgcaat tgaattttct ctaaatcccc 1680 ctctagattt aaaatacttt ctaatctttt cactgtcttt tttgctaggc tctttagttg 1740 ttctttaaag tttttctcgc actcttcgcc cagttttaaa gcttcacctt cattaattgg 1800 cgcaattgca agaaatctgt tgggcatatt ggcaatagtc aacttttctt ccaaaccctt 1860 agaccttgga atgttattcc actctttaaa ccattcatca aattcctttt gtgataaatg 1920 agtaagcgaa ttaccaaata cctccgaact aagccataaa tctacaagag gttgacctaa 1980 aagatttggg tacacaatca catctgcccc ataacgttca actacaaact tcatgatttt 2040 ccatataaag taagaaagca tataacttcc agcccataaa tcagaagttt ttctcgccgt 2100 agcaataaag ctctgaacag ggccaattgt aaagagcaaa aatgctggtt tgggaagtgc 2160 tgaaaccaga gtagaagttt ggacaaggtg atcatagatg gagtgattgg gcgcccttgt 2220 atctgcagga tggattctca tccagtgaaa aatttcttgg tagaatctcc atagaaataa 2280 aagcaagatt ttggcttttt cttttttttc ttcttccttt atcctagaaa ggttataatt 2340 ctttgcaagc ttctctacta attctaaaaa acgcttattc tcagtttcat aatctgtttc 2400 tgccagtata tcgtaatata tttttttatt aaacatgtca aaaaatatca catcttctcc 2460 tcttatttta acagccactg ggggaagtat tctatttaca ggataagctt gtgtatctgc 2520 tttttcaata agtttctctt cttcctctgt taaatcttct ccaagaagtg gttcaattac 2580 tttagattta attaaaatct catggcatcg acctttttcc tgaagctgga acttttttat 2640 acattcttca ttgtccatag aaattatcca atgcttatga ggagggtcat gaagaaaagc 2700 tttaagtttc agaagccata ctttttccat 2730 <210> 139 <211> 909 <212> PRT <213> Thermoanaerobacter tengcongensis <400> 139 Met Glu Lys Val Trp Leu Leu Lys Leu Lys Ala Phe Leu His Asp Pro 1 5 10 15 Pro His Lys His Trp Ile Ile Ser Met Asp Asn Glu Glu Cys Ile Lys 20 25 30 Lys Phe Gln Leu Gln Glu Lys Gly Arg Cys His Glu Ile Leu Ile Lys 35 40 45 Ser Lys Val Ile Glu Pro Leu Leu Gly Glu Asp Leu Thr Glu Glu Glu 50 55 60 Glu Lys Leu Ile Glu Lys Ala Asp Thr Gln Ala Tyr Pro Val Asn Arg 65 70 75 80 Ile Leu Pro Pro Val Ala Val Lys Ile Arg Gly Glu Asp Val Ile Phe 85 90 95 Phe Asp Met Phe Asn Lys Lys Ile Tyr Tyr Asp Ile Leu Ala Glu Thr 100 105 110 Asp Tyr Glu Thr Glu Asn Lys Arg Phe Leu Glu Leu Val Glu Lys Leu 115 120 125 Ala Lys Asn Tyr Asn Leu Ser Arg Ile Lys Glu Glu Glu Lys Lys Glu 130 135 140 Lys Ala Lys Ile Leu Leu Leu Phe Leu Trp Arg Phe Tyr Gln Glu Ile 145 150 155 160 Phe His Trp Met Arg Ile His Pro Ala Asp Thr Arg Ala Pro Asn His 165 170 175 Ser Ile Tyr Asp His Leu Val Gln Thr Ser Thr Leu Val Ser Ala Leu 180 185 190 Pro Lys Pro Ala Phe Leu Leu Phe Thr Ile Gly Pro Val Gln Ser Phe 195 200 205 Ile Ala Thr Ala Arg Lys Thr Ser Asp Leu Trp Ala Gly Ser Tyr Met 210 215 220 Leu Ser Tyr Phe Ile Trp Lys Ile Met Lys Phe Val Val Glu Arg Tyr 225 230 235 240 Gly Ala Asp Val Ile Val Tyr Pro Asn Leu Leu Gly Gln Pro Leu Val 245 250 255 Asp Leu Trp Leu Ser Ser Glu Val Phe Gly Asn Ser Leu Thr His Leu 260 265 270 Ser Gln Lys Glu Phe Asp Glu Trp Phe Lys Glu Trp Asn Asn Ile Pro 275 280 285 Arg Ser Lys Gly Leu Glu Glu Lys Leu Thr Ile Ala Asn Met Pro Asn 290 295 300 Arg Phe Leu Ala Ile Ala Pro Ile Asn Glu Gly Glu Ala Leu Lys Leu 305 310 315 320 Gly Glu Glu Cys Glu Lys Asn Phe Lys Glu Gln Leu Lys Ser Leu Ala 325 330 335 Lys Lys Thr Val Lys Arg Leu Glu Ser Ile Leu Asn Leu Glu Gly Asp 340 345 350 Leu Glu Lys Ile Gln Leu Gln Ile Glu Asn Gln Leu Leu Asn Tyr Phe 355 360 365 Gln Val Tyr Trp Ala Val Met Pro Trp Phe Glu Glu Lys Glu Ser Pro 370 375 380 Lys Glu Val Leu Asp Asp Tyr Lys Glu Ile Ile Gly Glu Thr Glu Leu 385 390 395 400 Tyr Lys Thr Ile Ser Glu Phe Ile Glu Ser Val Pro Lys Ile Trp Ser 405 410 415 Lys Asn Lys Glu Lys Asp Glu Glu Tyr Arg Asp Phe Ser Ile Ala Tyr 420 425 430 Ser Leu Leu Leu Glu Leu Thr Glu Lys Leu Leu Gly Ala Arg Lys Ser 435 440 445 Ile Arg Glu Phe Glu Gln Leu Glu Gln Lys Gly Arg Lys Cys Ser Leu 450 455 460 Cys Gly Glu Phe Glu Val Leu Pro Leu Asp Trp Glu Lys Leu Arg Ser 465 470 475 480 Lys Glu Lys Gly Leu Val Lys Glu Lys Glu Gln Leu Cys Gly Val Cys 485 490 495 Leu Ala Lys Arg Leu Phe Pro Lys Val Met Lys Glu Glu Leu Asn Leu 500 505 510 Ser Glu Glu Met Lys Phe Pro Ser Thr Ser Glu Met Ala Thr Ile Gly 515 520 525 Glu Lys Arg Arg Ile Ala Asp Asn Lys Glu Phe Ile Ala Glu Phe Lys 530 535 540 Glu Leu Phe Gly Glu Phe Lys Gln Lys Leu Leu Leu Pro Asn Thr Val 545 550 555 560 Ser Val Pro Lys Leu Lys Asp Asn Gln Leu Phe Glu Ile Asp Gly Gln 565 570 575 Trp Leu Met Arg Glu Ser Tyr Arg Glu Glu Tyr Ile Lys Ser Glu His 580 585 590 Thr Glu Asn Phe Lys Val Glu Glu Phe Gln Lys Met Ser Gln Lys Ile 595 600 605 Thr Lys Leu Leu Glu Lys His Arg Val Asn Pro Ser Arg Tyr Tyr Ala 610 615 620 Ile Leu Gln Met Asp Gly Asp His Met Gly Lys Trp Leu Lys Gly Glu 625 630 635 640 Asn Asn Pro Pro Ile Met Glu Thr Leu His Pro Lys Val Gly Glu His 645 650 655 Ile Lys Gln His Ala Lys Asp Asn Leu Ser Ser Ile Leu Cys Lys Lys 660 665 670 His Pro Thr Thr Pro Ser Leu His Gln Thr Leu Ser Arg Lys Ile Ser 675 680 685 Thr Phe Ala Leu Gln Glu Val Arg Arg Ile Val Glu Glu Thr His Tyr 690 695 700 Gly Lys Leu Val Tyr Ala Gly Gly Asp Asp Val Leu Ala Leu Leu Pro 705 710 715 720 Val Glu Glu Val Leu Glu Cys Ala Tyr Glu Leu Gln Asn Ala Phe Lys 725 730 735 Glu Val Leu Ser Ser Glu Ala Ser Met Ser Ala Gly Ile Val Ile Val 740 745 750 His His Lys Tyr Pro Leu Tyr Leu Ala Leu Lys Glu Val Gln Leu Ala 755 760 765 Gln Lys Lys Ala Lys Asp Glu Arg Gln Tyr Asn Arg Asn Ala Phe Cys 770 775 780 Leu Lys Phe Ile Lys Gly Ser Gly Ala Leu Lys Glu Cys Gly Gly Lys 785 790 795 800 Trp Ala Leu Met Asp Phe Leu Arg Glu Leu Ile Glu His Phe Lys Lys 805 810 815 Gly Glu Phe Ser Ser Thr Phe Pro Tyr Gln Phe Phe Glu Val Val Asp 820 825 830 Arg Leu Tyr Asp Asp Glu Asn Lys Glu Gln Ile Ile Gly Ile Leu Arg 835 840 845 Asn Glu Leu Lys Arg Ile Phe Leu Arg Gln Ser Gly Asn Arg Asp Ile 850 855 860 Leu Glu Lys Tyr Ala Ser Glu Ile Leu Leu Pro Lys Phe Asp Glu Ile 865 870 875 880 Val Lys Glu Thr Pro Asp Arg Val Ile Asp Phe Ala Asn Met Leu Ile 885 890 895 Ile Ala Arg Ser Ile Ala Met Glu His Ser Cys Asn Glu 900 905 <210> 140 <211> 2724 <212> DNA <213> Carboxydibrachium pacificum <400> 140 tcatatcctc gcctccattg caattgacct tgctataatc aacatattag caaaatctat 60 cactctatct ggcgtttctt taactatctc atcaaacttt gggagcaata tctcactagc 120 atatttttct aaaatatctc tgtttccact ctgacgaaga aatattctct ttaattcatt 180 tctcaaaatc ccaataactt gttctttatt ttcgtcatca tacaatctgt ctactacctc 240 aaaaaattga tagggaaaag tggatgaaaa ttctcctttc ttgaaatgct ctatgagtcc 300 tctcaaaaaa tccatcaacg cccatttgcc cccgcattct tttagtgctc cacttccttt 360 tataaactta aggcaaaaag catttctatt atactgtctt tcgtcttttg ctttcttctg 420 agccaattga acctctttca aggcaaggta aagaggatat ttgtgatgaa ctattacaat 480 gcctgcactc atggaggctt cagaacttaa aacttcttta aaagcgttct gcaattcata 540 agcacattcc aacacctctt ctacaggaag taatgctaga acgtcatctc ctcctgcata 600 aaccaatttc ccgtaatgtg tttcttctac aattctttgc acttcttgaa gagcaaacgt 660 ggaaattttc ctactcaagg tctggtgaag agaaggagta gtagggtgtt tcttacaaag 720 tatagaagat aggttatctt ttgcatgttg ctttatatgt tctcccactt tggggtgtaa 780 agtttccatt ataggtggat tattctctcc ttttaaccac ttccccatgt ggtccccatc 840 catttgaaga atagcataat atctggaagg gttgaccctg tgtttttcta aaagctttgt 900 tattttctga gacatcttct gaaattcctc tactttgaag ttttctgtat gctcactttt 960 aatgtattct tctctataac tctccctcat caaccactgt ccatctattt caaaaagttg 1020 gttatctttt aatttcggaa cagaaacagt attgggaagc aaaagcttct gtttaaattc 1080 tccaaataat ttcttgaact ctgcaataaa ctctttgttg tcagcaattc tccttttttc 1140 tccaatagtt gccatttcag aagttgaggg aaatttcatt tcttcggaaa ggcttagctc 1200 ttccttcatt accttaggga ataatcgctt tgcaagacac actccacaga gttgctcttt 1260 ttcttttacc aagccttttt ccttactcct caatttttcc caatctaatg gcaaaacttc 1320 aaattctcca cataaactgc acttacgccc tttttgttct aagtgttcaa attccctcat 1380 gctcttcctc gctccaagca atttttcagt tagctcaaga agtaatgaat aggctatgct 1440 aaaatctctg tattcctcat ctttttcttt atttttactc catatcttag gaacagattc 1500 tataaactca cttatcgttt tgtaaagctc tgtctctcct attatttctt tgtaatcatc 1560 caaaacttct tttggagact ctttcttttc aaaccatggc ataaccaccc agtaaacctg 1620 gaaataattt aatagctgat tttcaatctg caattgaatt ttctctaaat ccccctctag 1680 atttaaaata ctttctaatc ttttcactgt cttttttgct aggctcttta gttgttcttt 1740 aaagtttttc tcgcactttt cgcccagttt taaagcttca ccttcattaa ttggcacaat 1800 tgcaagaaat ctgttgggca tattggcaat actcaacttt tcttccaaac ccttagacct 1860 tggaatgtta ttccactctt taaaccattc atcaaattcc ttttgtgata aatgagtaag 1920 caaattacca aatacctccg aactaagcca taaatctaca agaggttgac ctaaaagatt 1980 tgggtacaca atcacatctg ccccataacg ttcaactaca aacttcatga ttttccatat 2040 aaagtaagaa agcatataac ttccagccca taaatcagaa gtttttctcg ccgtagcaat 2100 aaagctctga acagggccaa ttgtaaagag caaaaatgct ggtttgggaa gtgctgaaac 2160 cagagtagaa gtttggacaa ggtgatcata gatggagtga ttgggcgccc ttgtatctgc 2220 aggatggatt ctcatccagt gaaaaatttc ttggtagaat ctccatagaa ataaaagcaa 2280 gattttggct ttttcttttt tttcttcttc ttttatccta gaaaggttat aattctttgc 2340 aagcttctct actaattcta aaaaacgctt attctcagtt tcataatctg ttgctgccag 2400 tatatcgtaa tatatttttt tattaaacat gtcaaaaaat atcacatctt ctcctcttat 2460 tttaacagcc actgggggaa gtattctatt tacaggataa gcttgtgtat ctgctttttt 2520 aataagtttc tcttcttcct ctgttaaatc ttctccaaaa agtggttcaa ttactttaga 2580 tttaattaaa atctcatggc atcgaccttt ttcgtgaagc tggaactttt ttatacattc 2640 ttcattgtcc atagaaatta tccaatgctt atgaggaggg tcatgaagaa aagctttaag 2700 tttcagaagc catacttttt ccat 2724 <210> 141 <211> 907 <212> PRT <213> Carboxydibrachium pacificum <400> 141 Met Glu Lys Val Trp Leu Leu Lys Leu Lys Ala Phe Leu His Asp Pro 1 5 10 15 Pro His Lys His Trp Ile Ile Ser Met Asp Asn Glu Glu Cys Ile Lys 20 25 30 Lys Phe Gln Leu His Glu Lys Gly Arg Cys His Glu Ile Leu Ile Lys 35 40 45 Ser Lys Val Ile Glu Pro Leu Phe Gly Glu Asp Leu Thr Glu Glu Glu 50 55 60 Glu Lys Leu Ile Lys Lys Ala Asp Thr Gln Ala Tyr Pro Val Asn Arg 65 70 75 80 Ile Leu Pro Pro Val Ala Val Lys Ile Arg Gly Glu Asp Val Ile Phe 85 90 95 Phe Asp Met Phe Asn Lys Lys Ile Tyr Tyr Asp Ile Leu Ala Ala Thr 100 105 110 Asp Tyr Glu Thr Glu Asn Lys Arg Phe Leu Glu Leu Val Glu Lys Leu 115 120 125 Ala Lys Asn Tyr Asn Leu Ser Arg Ile Lys Glu Glu Glu Lys Lys Glu 130 135 140 Lys Ala Lys Ile Leu Leu Leu Phe Leu Trp Arg Phe Tyr Gln Glu Ile 145 150 155 160 Phe His Trp Met Arg Ile His Pro Ala Asp Thr Arg Ala Pro Asn His 165 170 175 Ser Ile Tyr Asp His Leu Val Gln Thr Ser Thr Leu Val Ser Ala Leu 180 185 190 Pro Lys Pro Ala Phe Leu Leu Phe Thr Ile Gly Pro Val Gln Ser Phe 195 200 205 Ile Ala Thr Ala Arg Lys Thr Ser Asp Leu Trp Ala Gly Ser Tyr Met 210 215 220 Leu Ser Tyr Phe Ile Trp Lys Ile Met Lys Phe Val Val Glu Arg Tyr 225 230 235 240 Gly Ala Asp Val Ile Val Tyr Pro Asn Leu Leu Gly Gln Pro Leu Val 245 250 255 Asp Leu Trp Leu Ser Ser Glu Val Phe Gly Asn Leu Leu Thr His Leu 260 265 270 Ser Gln Lys Glu Phe Asp Glu Trp Phe Lys Glu Trp Asn Asn Ile Pro 275 280 285 Arg Ser Lys Gly Leu Glu Glu Lys Leu Ser Ile Ala Asn Met Pro Asn 290 295 300 Arg Phe Leu Ala Ile Val Pro Ile Asn Glu Gly Glu Ala Leu Lys Leu 305 310 315 320 Gly Glu Lys Cys Glu Lys Asn Phe Lys Glu Gln Leu Lys Ser Leu Ala 325 330 335 Lys Lys Thr Val Lys Arg Leu Glu Ser Ile Leu Asn Leu Glu Gly Asp 340 345 350 Leu Glu Lys Ile Gln Leu Gln Ile Glu Asn Gln Leu Leu Asn Tyr Phe 355 360 365 Gln Val Tyr Trp Val Val Met Pro Trp Phe Glu Lys Lys Glu Ser Pro 370 375 380 Lys Glu Val Leu Asp Asp Tyr Lys Glu Ile Ile Gly Glu Thr Glu Leu 385 390 395 400 Tyr Lys Thr Ile Ser Glu Phe Ile Glu Ser Val Pro Lys Ile Trp Ser 405 410 415 Lys Asn Lys Glu Lys Asp Glu Glu Tyr Arg Asp Phe Ser Ile Ala Tyr 420 425 430 Ser Leu Leu Leu Glu Leu Thr Glu Lys Leu Leu Gly Ala Arg Lys Ser 435 440 445 Met Arg Glu Phe Glu His Leu Glu Gln Lys Gly Arg Lys Cys Ser Leu 450 455 460 Cys Gly Glu Phe Glu Val Leu Pro Leu Asp Trp Glu Lys Leu Arg Ser 465 470 475 480 Lys Glu Lys Gly Leu Val Lys Glu Lys Glu Gln Leu Cys Gly Val Cys 485 490 495 Leu Ala Lys Arg Leu Phe Pro Lys Val Met Lys Glu Glu Leu Ser Leu 500 505 510 Ser Glu Glu Met Lys Phe Pro Ser Thr Ser Glu Met Ala Thr Ile Gly 515 520 525 Glu Lys Arg Arg Ile Ala Asp Asn Lys Glu Phe Ile Ala Glu Phe Lys 530 535 540 Lys Leu Phe Gly Glu Phe Lys Gln Lys Leu Leu Leu Pro Asn Thr Val 545 550 555 560 Ser Val Pro Lys Leu Lys Asp Asn Gln Leu Phe Glu Ile Asp Gly Gln 565 570 575 Trp Leu Met Arg Glu Ser Tyr Arg Glu Glu Tyr Ile Lys Ser Glu His 580 585 590 Thr Glu Asn Phe Lys Val Glu Glu Phe Gln Lys Met Ser Gln Lys Ile 595 600 605 Thr Lys Leu Leu Glu Lys His Arg Val Asn Pro Ser Arg Tyr Tyr Ala 610 615 620 Ile Leu Gln Met Asp Gly Asp His Met Gly Lys Trp Leu Lys Gly Glu 625 630 635 640 Asn Asn Pro Pro Ile Met Glu Thr Leu His Pro Lys Val Gly Glu His 645 650 655 Ile Lys Gln His Ala Lys Asp Asn Leu Ser Ser Ile Leu Cys Lys Lys 660 665 670 His Pro Thr Thr Pro Ser Leu His Gln Thr Leu Ser Arg Lys Ile Ser 675 680 685 Thr Phe Ala Leu Gln Glu Val Gln Arg Ile Val Glu Glu Thr His Tyr 690 695 700 Gly Lys Leu Val Tyr Ala Gly Gly Asp Asp Val Leu Ala Leu Leu Pro 705 710 715 720 Val Glu Glu Val Leu Glu Cys Ala Tyr Glu Leu Gln Asn Ala Phe Lys 725 730 735 Glu Val Leu Ser Ser Glu Ala Ser Met Ser Ala Gly Ile Val Ile Val 740 745 750 His His Lys Tyr Pro Leu Tyr Leu Ala Leu Lys Glu Val Gln Leu Ala 755 760 765 Gln Lys Lys Ala Lys Asp Glu Arg Gln Tyr Asn Arg Asn Ala Phe Cys 770 775 780 Leu Lys Phe Ile Lys Gly Ser Gly Ala Leu Lys Glu Cys Gly Gly Lys 785 790 795 800 Trp Ala Leu Met Asp Phe Leu Arg Gly Leu Ile Glu His Phe Lys Lys 805 810 815 Gly Glu Phe Ser Ser Thr Phe Pro Tyr Gln Phe Phe Glu Val Val Asp 820 825 830 Arg Leu Tyr Asp Asp Glu Asn Lys Glu Gln Val Ile Gly Ile Leu Arg 835 840 845 Asn Glu Leu Lys Arg Ile Phe Leu Arg Gln Ser Gly Asn Arg Asp Ile 850 855 860 Leu Glu Lys Tyr Ala Ser Glu Ile Leu Leu Pro Lys Phe Asp Glu Ile 865 870 875 880 Val Lys Glu Thr Pro Asp Arg Val Ile Asp Phe Ala Asn Met Leu Ile 885 890 895 Ile Ala Arg Ser Ile Ala Met Glu Ala Arg Ile 900 905 <210> 142 <211> 3759 <212> DNA <213> Sorangium cellulosum <400> 142 atgagcgagc gggatcgaga ccgagatcga aacctcgctg tcgctcatcc cgtccacggc 60 aggaccggag atgacgagat cgagcaccat gggacggagg cggatcggac ccgcttctgg 120 cagcaaaagc tccttcagct cctgcacgat cccccgggaa aggcgttctt cctccgacag 180 ggcgcgggcg gacacaaggc ggtcgcggcg gatctgttcc aggcgacggc gggcgttccg 240 ctcaagtatg tacggcccgg accggactgg gcggcttcgg gcgcggaccg gccggtcagc 300 tccccgccac gtccagcgca cgtctcggtg gactgggtga agaacccgat cctgacgcac 360 cccctcgcct ccgggaccgc cgccatcgac ctcggccgcc gggacctgcc agcgtcgcgc 420 gagcaggtgc gagcgctcgc cggggacgtc ggccgcacgc tccgcgagct cctcgagcgg 480 cgggtgtccc aggaggacga gctcgacgac ctccccgaag aagaggagcg cgagcgcttc 540 ctgagcgagc gcgccgagca ggtggaaagc gagctcgccg cactgccccg ctggcacgac 600 gacgcgcggc tccagcaggc gtgcttgcag ctctggcgcc gcttgcccga agagccgccg 660 cccggcgtgg ccgaggtggt ctggcggcac cagcccgcag actcgagggc cccggatcac 720 agcctctggg atcacctgcg cgtcacctcg tcgctctcgt tcctgagcgg gaggaggcgc 780 gaggggcccg tcatgccatg gctcctcgcc ttcagcctcg gcccggtgca gcggttcatc 840 gcgcagtcgc ggacatccac cgatctctgg acgtcatcca tgctgctgtc ggatctcgtg 900 tggcacgcca tggtgccgtt cgtcgagcgg tacggtccgg aggcgatcgt gtaccccgat 960 ctgcgggcca acccgcgcgc tgacgtgtgg ctctgggagc aggcgaacgg ggcggacgga 1020 gccgcgccgc cggcgcacgc ggcgcggtac caggacgtcc tgcccgagca gctcaatccg 1080 tgctcctacg ccgggatctt ccccaacacg ttcatcgcgc tggtcccgct cggcggcgag 1140 cgctacctga cgctgctcaa ggatctcgcg ggcgaggcgc gccgcgccgt cctcggccgc 1200 tggagacagc tcgcggacct cgccaggcgc tacttcctgg agcaggccgc gaagcgcccc 1260 gaggccatga gcgactccga gcggaaggcc ttcgaggcca cgtgggcccg ccagcacgag 1320 gacgtgctct tcacgtcctg gtccgcggcg gcgtggccga gcatcgagcg cgtcaacgac 1380 ccggagtcgc tggccatccg tgaggcgctc gtcgcgcagc gccccgccca ggcgctccca 1440 cgcgaggacg cggaggcgct cgcggcgtgg cgcgagcgcc acacgacatg gatcccgggc 1500 gagacgttcg cgcgctacgc ggaggcccgt tatgtctacg cgcggacgaa ccgcaccgtg 1560 caccagtgcg agcgcgggtt cgactatccg ctcctccatc atgcgctggt gtcgcgccac 1620 gggctgcgaa aggcagaggc gcagggcgcg gcgatcgcgg aggagtccgg agagaagtgc 1680 acgctctgcg ggctgcgcca ggccctcggc gccggggacg cgggggcgag cgtggacgcg 1740 cagcgcgaga cagcgcgcgc gttctggcgc cgcttcgacc gcaacagcga cgacggggcg 1800 gagcgcctct gcgccgtgtg cacgatgaag cgcgtcctcg ttcgcgccgg cgtcgccacg 1860 gacgagcgcg gcgctcgtcg ccgggtgggc ctcaccgccg cgtgggcggg gccggcgacg 1920 ccgctcgacg acgtgtgtga tcgcgatgag ctgcgggtgc cgttcccgtc gacggcgacg 1980 atcgctgccc agggctacct gtgcgccgtg gccacccgcc gggagctgca ggcgcaggtc 2040 gccgaggtgg tgcggtgttg cgaggacgcg aggctgccgc gcacgagctt cgtgcggtcg 2100 ctgcgatcgc tggccgaggc ggcgcagcgc gcggacggcg cggggctgcg cttcctcgag 2160 tacgaggcgg agctcacggt cttccccgag gtgctcgcgg cggccgagga gcgcgccccg 2220 gagggcggcg gccgagagca aggcgacggc gccgcgcagc gcggcgggct gcgcgatcgc 2280 gacggcaagc gcgtcccccg gtcgaaggtc gaggccctgc gccgcgccgt ggagagcctg 2340 cgccgggcag cgaaggagct cgatcgaccg gccgggtcgg cgcggcgcgc cggggaccgc 2400 attcccgcgc cgggcagcca ggtcgcgctg atcgcgctgg acggcgaccg gatcagccag 2460 atcctcctgg gcgagaagat cggcgctcgc tggcgcgacg tgatccatcc cgaggccgtc 2520 gcgacgatgg agagcaacga ggtcacccgc gcggcccgct ggccggagct cctcggtcgc 2580 aagcgcctca tggggccatc gacgcacgcc ttcgtcaacc gcgtgctggc cgagttcgcg 2640 cacaccatcg tcccctgggt ggtggagcgg gagttcagcg ggaggctcat ctacgcgggc 2700 ggagacgacg tgctcgccat cgccccggcg ggcgaggcgc tcgacctctg cgcgcggctc 2760 gcgcagctct acagcgccgc gtgggtcctc gacacgtcac ccggcgaagg gccgtgggcg 2820 tggcgcgcga agacctggac gagctccacg tccatccggg ccagcgagcg cttcgtcgtt 2880 gtcgcgccga gcgagaccgg agagccgctc ccctggccga tccccgaggc gtcgaggcgc 2940 gggccgatcc ctgccgggga cgccgcagcg gcgagcgccg ccgagagcgc cgaggagcgc 3000 ctgctcccga tgatgggcgc gggccagacg ctctccgccg ggatcgcgat cggccactac 3060 aagacctctc tcggcggcct ggtgaaggcc gcctgggacg agcgcgatcg ggtgaaaggc 3120 gaggacgagg agcgcgattg cgcgaaggag gacaacgagg agcgcatccg ggtgaagggc 3180 gatgacgagg agcgcgacag ggcgacgagg gaggacctcg ccgtcaagaa cgccttctcg 3240 atccggcggt acacgcgcgg gggcgagaag gcgcggctgc gcctctcctg gggacggcgt 3300 tgcgccgccc ccgggaaggc gctcgcaggc tacctgcggg tgaaggccgt catcgagggt 3360 ttcaagaccg gcgcgctccc cggaaggctt ccgtacaagc tgcgcgaggt cgagggagcc 3420 gtgctcgccg cgtggctcgt cgaggcgaag gcgctgcccg gcggcctgac gagccgcgag 3480 gcccggcgcg agctcgtgaa gcgggtcgag ccctttgcca ggggcctgtt cggggcgcag 3540 tgcgcggcgg aggtggaggg agctttcgag atctggtggc aagggctcct gagcgcgctt 3600 cgcgcgcacg agcgacgatg gagggcgccg gacgcggtgc cccctggcgc gacccccgtc 3660 gacgacggcg cgccgtcgcg cgggctcggc tcggagcagg ggctggcggt gtgtcgcttc 3720 ctgggagcgc tcgcccgcgg ggaggaggac gcgcaatga 3759 <210> 143 <211> 1252 <212> PRT <213> Sorangium cellulosum <400> 143 Met Ser Glu Arg Asp Arg Asp Arg Asp Arg Asn Leu Ala Val Ala His 1 5 10 15 Pro Val His Gly Arg Thr Gly Asp Asp Glu Ile Glu His His Gly Thr 20 25 30 Glu Ala Asp Arg Thr Arg Phe Trp Gln Gln Lys Leu Leu Gln Leu Leu 35 40 45 His Asp Pro Pro Gly Lys Ala Phe Phe Leu Arg Gln Gly Ala Gly Gly 50 55 60 His Lys Ala Val Ala Ala Asp Leu Phe Gln Ala Thr Ala Gly Val Pro 65 70 75 80 Leu Lys Tyr Val Arg Pro Gly Pro Asp Trp Ala Ala Ser Gly Ala Asp 85 90 95 Arg Pro Val Ser Ser Pro Pro Arg Pro Ala His Val Ser Val Asp Trp 100 105 110 Val Lys Asn Pro Ile Leu Thr His Pro Leu Ala Ser Gly Thr Ala Ala 115 120 125 Ile Asp Leu Gly Arg Arg Asp Leu Pro Ala Ser Arg Glu Gln Val Arg 130 135 140 Ala Leu Ala Gly Asp Val Gly Arg Thr Leu Arg Glu Leu Leu Glu Arg 145 150 155 160 Arg Val Ser Gln Glu Asp Glu Leu Asp Asp Leu Pro Glu Glu Glu Glu 165 170 175 Arg Glu Arg Phe Leu Ser Glu Arg Ala Glu Gln Val Glu Ser Glu Leu 180 185 190 Ala Ala Leu Pro Arg Trp His Asp Asp Ala Arg Leu Gln Gln Ala Cys 195 200 205 Leu Gln Leu Trp Arg Arg Leu Pro Glu Glu Pro Pro Pro Gly Val Ala 210 215 220 Glu Val Val Trp Arg His Gln Pro Ala Asp Ser Arg Ala Pro Asp His 225 230 235 240 Ser Leu Trp Asp His Leu Arg Val Thr Ser Ser Leu Ser Phe Leu Ser 245 250 255 Gly Arg Arg Arg Glu Gly Pro Val Met Pro Trp Leu Leu Ala Phe Ser 260 265 270 Leu Gly Pro Val Gln Arg Phe Ile Ala Gln Ser Arg Thr Ser Thr Asp 275 280 285 Leu Trp Thr Ser Ser Met Leu Leu Ser Asp Leu Val Trp His Ala Met 290 295 300 Val Pro Phe Val Glu Arg Tyr Gly Pro Glu Ala Ile Val Tyr Pro Asp 305 310 315 320 Leu Arg Ala Asn Pro Arg Ala Asp Val Trp Leu Trp Glu Gln Ala Asn 325 330 335 Gly Ala Asp Gly Ala Ala Pro Pro Ala His Ala Ala Arg Tyr Gln Asp 340 345 350 Val Leu Pro Glu Gln Leu Asn Pro Cys Ser Tyr Ala Gly Ile Phe Pro 355 360 365 Asn Thr Phe Ile Ala Leu Val Pro Leu Gly Gly Glu Arg Tyr Leu Thr 370 375 380 Leu Leu Lys Asp Leu Ala Gly Glu Ala Arg Arg Ala Val Leu Gly Arg 385 390 395 400 Trp Arg Gln Leu Ala Asp Leu Ala Arg Arg Tyr Phe Leu Glu Gln Ala 405 410 415 Ala Lys Arg Pro Glu Ala Met Ser Asp Ser Glu Arg Lys Ala Phe Glu 420 425 430 Ala Thr Trp Ala Arg Gln His Glu Asp Val Leu Phe Thr Ser Trp Ser 435 440 445 Ala Ala Ala Trp Pro Ser Ile Glu Arg Val Asn Asp Pro Glu Ser Leu 450 455 460 Ala Ile Arg Glu Ala Leu Val Ala Gln Arg Pro Ala Gln Ala Leu Pro 465 470 475 480 Arg Glu Asp Ala Glu Ala Leu Ala Ala Trp Arg Glu Arg His Thr Thr 485 490 495 Trp Ile Pro Gly Glu Thr Phe Ala Arg Tyr Ala Glu Ala Arg Tyr Val 500 505 510 Tyr Ala Arg Thr Asn Arg Thr Val His Gln Cys Glu Arg Gly Phe Asp 515 520 525 Tyr Pro Leu Leu His His Ala Leu Val Ser Arg His Gly Leu Arg Lys 530 535 540 Ala Glu Ala Gln Gly Ala Ala Ile Ala Glu Glu Ser Gly Glu Lys Cys 545 550 555 560 Thr Leu Cys Gly Leu Arg Gln Ala Leu Gly Ala Gly Asp Ala Gly Ala 565 570 575 Ser Val Asp Ala Gln Arg Glu Thr Ala Arg Ala Phe Trp Arg Arg Phe 580 585 590 Asp Arg Asn Ser Asp Asp Gly Ala Glu Arg Leu Cys Ala Val Cys Thr 595 600 605 Met Lys Arg Val Leu Val Arg Ala Gly Val Ala Thr Asp Glu Arg Gly 610 615 620 Ala Arg Arg Arg Val Gly Leu Thr Ala Ala Trp Ala Gly Pro Ala Thr 625 630 635 640 Pro Leu Asp Asp Val Cys Asp Arg Asp Glu Leu Arg Val Pro Phe Pro 645 650 655 Ser Thr Ala Thr Ile Ala Ala Gln Gly Tyr Leu Cys Ala Val Ala Thr 660 665 670 Arg Arg Glu Leu Gln Ala Gln Val Ala Glu Val Val Arg Cys Cys Glu 675 680 685 Asp Ala Arg Leu Pro Arg Thr Ser Phe Val Arg Ser Leu Arg Ser Leu 690 695 700 Ala Glu Ala Ala Gln Arg Ala Asp Gly Ala Gly Leu Arg Phe Leu Glu 705 710 715 720 Tyr Glu Ala Glu Leu Thr Val Phe Pro Glu Val Leu Ala Ala Ala Glu 725 730 735 Glu Arg Ala Pro Glu Gly Gly Gly Arg Glu Gln Gly Asp Gly Ala Ala 740 745 750 Gln Arg Gly Gly Leu Arg Asp Arg Asp Gly Lys Arg Val Pro Arg Ser 755 760 765 Lys Val Glu Ala Leu Arg Arg Ala Val Glu Ser Leu Arg Arg Ala Ala 770 775 780 Lys Glu Leu Asp Arg Pro Ala Gly Ser Ala Arg Arg Ala Gly Asp Arg 785 790 795 800 Ile Pro Ala Pro Gly Ser Gln Val Ala Leu Ile Ala Leu Asp Gly Asp 805 810 815 Arg Ile Ser Gln Ile Leu Leu Gly Glu Lys Ile Gly Ala Arg Trp Arg 820 825 830 Asp Val Ile His Pro Glu Ala Val Ala Thr Met Glu Ser Asn Glu Val 835 840 845 Thr Arg Ala Ala Arg Trp Pro Glu Leu Leu Gly Arg Lys Arg Leu Met 850 855 860 Gly Pro Ser Thr His Ala Phe Val Asn Arg Val Leu Ala Glu Phe Ala 865 870 875 880 His Thr Ile Val Pro Trp Val Val Glu Arg Glu Phe Ser Gly Arg Leu 885 890 895 Ile Tyr Ala Gly Gly Asp Asp Val Leu Ala Ile Ala Pro Ala Gly Glu 900 905 910 Ala Leu Asp Leu Cys Ala Arg Leu Ala Gln Leu Tyr Ser Ala Ala Trp 915 920 925 Val Leu Asp Thr Ser Pro Gly Glu Gly Pro Trp Ala Trp Arg Ala Lys 930 935 940 Thr Trp Thr Ser Ser Thr Ser Ile Arg Ala Ser Glu Arg Phe Val Val 945 950 955 960 Val Ala Pro Ser Glu Thr Gly Glu Pro Leu Pro Trp Pro Ile Pro Glu 965 970 975 Ala Ser Arg Arg Gly Pro Ile Pro Ala Gly Asp Ala Ala Ala Ala Ser 980 985 990 Ala Ala Glu Ser Ala Glu Glu Arg Leu Leu Pro Met Met Gly Ala Gly 995 1000 1005 Gln Thr Leu Ser Ala Gly Ile Ala Ile Gly His Tyr Lys Thr Ser 1010 1015 1020 Leu Gly Gly Leu Val Lys Ala Ala Trp Asp Glu Arg Asp Arg Val 1025 1030 1035 Lys Gly Glu Asp Glu Glu Arg Asp Cys Ala Lys Glu Asp Asn Glu 1040 1045 1050 Glu Arg Ile Arg Val Lys Gly Asp Asp Glu Glu Arg Asp Arg Ala 1055 1060 1065 Thr Arg Glu Asp Leu Ala Val Lys Asn Ala Phe Ser Ile Arg Arg 1070 1075 1080 Tyr Thr Arg Gly Gly Glu Lys Ala Arg Leu Arg Leu Ser Trp Gly 1085 1090 1095 Arg Arg Cys Ala Ala Pro Gly Lys Ala Leu Ala Gly Tyr Leu Arg 1100 1105 1110 Val Lys Ala Val Ile Glu Gly Phe Lys Thr Gly Ala Leu Pro Gly 1115 1120 1125 Arg Leu Pro Tyr Lys Leu Arg Glu Val Glu Gly Ala Val Leu Ala 1130 1135 1140 Ala Trp Leu Val Glu Ala Lys Ala Leu Pro Gly Gly Leu Thr Ser 1145 1150 1155 Arg Glu Ala Arg Arg Glu Leu Val Lys Arg Val Glu Pro Phe Ala 1160 1165 1170 Arg Gly Leu Phe Gly Ala Gln Cys Ala Ala Glu Val Glu Gly Ala 1175 1180 1185 Phe Glu Ile Trp Trp Gln Gly Leu Leu Ser Ala Leu Arg Ala His 1190 1195 1200 Glu Arg Arg Trp Arg Ala Pro Asp Ala Val Pro Pro Gly Ala Thr 1205 1210 1215 Pro Val Asp Asp Gly Ala Pro Ser Arg Gly Leu Gly Ser Glu Gln 1220 1225 1230 Gly Leu Ala Val Cys Arg Phe Leu Gly Ala Leu Ala Arg Gly Glu 1235 1240 1245 Glu Asp Ala Gln 1250 <210> 144 <211> 2181 <212> DNA <213> Thermoanaerobacterium thermosaccharolyticum <400> 144 ctattctccc tcctttccga taaaagcaga tatttcgatt agttttaaga aattgtcaat 60 atcatcatca tatttgtgat ataaattttt aagtacatcg gagatttctt tagaaatatt 120 ctttttttct tctttcccga tatttccact aacagtatcg acggctctta aaacaactct 180 ttttatctcc gtattaataa tacccgtttc ggcaatataa tttccgcatt tatctttaag 240 tttcgcaaat tcttctgcta gagtataaac tattcttcta gaaattcgca ccccactttg 300 attccttcta aagaggtacg ataattcttt caatatctcc agaacatcca tatcaccgta 360 tttccacttg cttactatta ttttttcttc tcctgaacgc ttcaataatg aaatagcaaa 420 actatccttc tcagtattgc ttttggcttt tttttctgtt tctcttactt tatccataac 480 catttttaac ggcgttttat aatgagcaat cactacccca caagacgcag ttgcgttctt 540 gcccattgtt aaaagtaatt ttccatcttt ttcaacaaaa cctgtgttat tactccaatc 600 tactttgatt tcattatttt ctatctttat atgtcctgaa aaggctgctc ttaatcttct 660 catcacttca aatagatctt ttaaattaac gaaagcaagc acatcgtctc cacctgaata 720 aattagttta cctaaatgat catcttcaac tattttcttt acgaactcaa gactataatt 780 tctcaaagat agtgaaatta aagagtggat cgtaggagca agaagtttat tctttataga 840 tgtttttaac tcttctttca ctttattagg taatttattc cataaatcag aaccatatat 900 atgctcaaag ttgtgtaaca atttacctgc aagccattct cccatattat ctccatcaaa 960 taaaacaacg gcgtagtaag gattaggctc ccctactttg tctgtaattt gtttaagtga 1020 ttttctcaaa tcctctattt ctttatcatc tatttcaata ccaaactgct ttttgatatt 1080 ttctgtacat aaattttcct caaaaaacca ttctccctcg atatttacaa cattattaaa 1140 atcaccttca attttgttca aaggcttaac ttgtatttgt cttagcacat tttctccaac 1200 tattttttta atatcatcaa tatatgcatt aaactgtact tctgcatctt tcaaagctct 1260 ctttttaaaa ttagatgaag ccatttctgc agtagatgga aaagtatagt ctataaattt 1320 accatcaacc ttatcaccta aatatttatc caaagctctt ttaacaaaac aaggtataca 1380 aagtgcctct ttttcactta tgtatttacc tacttgtaaa ctccccattc ctgcctttat 1440 tactccctct tttgtaccgc atatattaca tttcttccca tattcattga tttggctaaa 1500 attcctcaaa ttttttctta tacccataga cttttcaagg gcagaatagc caaggtgata 1560 gattaaacca acgttttctt tttggacttc ctcaaagaaa tctttaaagt cctcttcagt 1620 aatatatctt ccatcttttt taaaaggcat agctacccag taaatttcag gaaaatctag 1680 tgtctgtttt tttattactg cattacaatc ctcatctttc ttatctaacc taattttatc 1740 tattaattta aacttattta aaactatatc aaccatctct ttccattttt ttctaacaat 1800 atcctccatt ttatgtgcca attttattat tttactttct tcactttctg gtatcaaagc 1860 cacaaatcta ttaggaatcg taggctgatc aataaatgac gaaatagaag atttcctgtt 1920 tatattacat cttttcaaat gccattccat taaaggctga gcagaaagat taggataaat 1980 tatgctttta ggaccatacc tatcaattac ttcttccata ccaataaaag ttaaatatga 2040 aagcaaaaaa cttcccataa ataaatcctg ggtctttctc gcttgagaaa taaattgctg 2100 tactggccct atagtaaaga gaaaaagaga aacgttgctg ctattctcag cgaaactctc 2160 gtatattttc tcctccatca t 2181 <210> 145 <211> 726 <212> PRT <213> Thermoanaerobacterium thermosaccharolyticum <400> 145 Met Met Glu Glu Lys Ile Tyr Glu Ser Phe Ala Glu Asn Ser Ser Asn 1 5 10 15 Val Ser Leu Phe Leu Phe Thr Ile Gly Pro Val Gln Gln Phe Ile Ser 20 25 30 Gln Ala Arg Lys Thr Gln Asp Leu Phe Met Gly Ser Phe Leu Leu Ser 35 40 45 Tyr Leu Thr Phe Ile Gly Met Glu Glu Val Ile Asp Arg Tyr Gly Pro 50 55 60 Lys Ser Ile Ile Tyr Pro Asn Leu Ser Ala Gln Pro Leu Met Glu Trp 65 70 75 80 His Leu Lys Arg Cys Asn Ile Asn Arg Lys Ser Ser Ile Ser Ser Phe 85 90 95 Ile Asp Gln Pro Thr Ile Pro Asn Arg Phe Val Ala Leu Ile Pro Glu 100 105 110 Ser Glu Glu Ser Lys Ile Ile Lys Leu Ala His Lys Met Glu Asp Ile 115 120 125 Val Arg Lys Lys Trp Lys Glu Met Val Asp Ile Val Leu Asn Lys Phe 130 135 140 Lys Leu Ile Asp Lys Ile Arg Leu Asp Lys Lys Asp Glu Asp Cys Asn 145 150 155 160 Ala Val Ile Lys Lys Gln Thr Leu Asp Phe Pro Glu Ile Tyr Trp Val 165 170 175 Ala Met Pro Phe Lys Lys Asp Gly Arg Tyr Ile Thr Glu Glu Asp Phe 180 185 190 Lys Asp Phe Phe Glu Glu Val Gln Lys Glu Asn Val Gly Leu Ile Tyr 195 200 205 His Leu Gly Tyr Ser Ala Leu Glu Lys Ser Met Gly Ile Arg Lys Asn 210 215 220 Leu Arg Asn Phe Ser Gln Ile Asn Glu Tyr Gly Lys Lys Cys Asn Ile 225 230 235 240 Cys Gly Thr Lys Glu Gly Val Ile Lys Ala Gly Met Gly Ser Leu Gln 245 250 255 Val Gly Lys Tyr Ile Ser Glu Lys Glu Ala Leu Cys Ile Pro Cys Phe 260 265 270 Val Lys Arg Ala Leu Asp Lys Tyr Leu Gly Asp Lys Val Asp Gly Lys 275 280 285 Phe Ile Asp Tyr Thr Phe Pro Ser Thr Ala Glu Met Ala Ser Ser Asn 290 295 300 Phe Lys Lys Arg Ala Leu Lys Asp Ala Glu Val Gln Phe Asn Ala Tyr 305 310 315 320 Ile Asp Asp Ile Lys Lys Ile Val Gly Glu Asn Val Leu Arg Gln Ile 325 330 335 Gln Val Lys Pro Leu Asn Lys Ile Glu Gly Asp Phe Asn Asn Val Val 340 345 350 Asn Ile Glu Gly Glu Trp Phe Phe Glu Glu Asn Leu Cys Thr Glu Asn 355 360 365 Ile Lys Lys Gln Phe Gly Ile Glu Ile Asp Asp Lys Glu Ile Glu Asp 370 375 380 Leu Arg Lys Ser Leu Lys Gln Ile Thr Asp Lys Val Gly Glu Pro Asn 385 390 395 400 Pro Tyr Tyr Ala Val Val Leu Phe Asp Gly Asp Asn Met Gly Glu Trp 405 410 415 Leu Ala Gly Lys Leu Leu His Asn Phe Glu His Ile Tyr Gly Ser Asp 420 425 430 Leu Trp Asn Lys Leu Pro Asn Lys Val Lys Glu Glu Leu Lys Thr Ser 435 440 445 Ile Lys Asn Lys Leu Leu Ala Pro Thr Ile His Ser Leu Ile Ser Leu 450 455 460 Ser Leu Arg Asn Tyr Ser Leu Glu Phe Val Lys Lys Ile Val Glu Asp 465 470 475 480 Asp His Leu Gly Lys Leu Ile Tyr Ser Gly Gly Asp Asp Val Leu Ala 485 490 495 Phe Val Asn Leu Lys Asp Leu Phe Glu Val Met Arg Arg Leu Arg Ala 500 505 510 Ala Phe Ser Gly His Ile Lys Ile Glu Asn Asn Glu Ile Lys Val Asp 515 520 525 Trp Ser Asn Asn Thr Gly Phe Val Glu Lys Asp Gly Lys Leu Leu Leu 530 535 540 Thr Met Gly Lys Asn Ala Thr Ala Ser Cys Gly Val Val Ile Ala His 545 550 555 560 Tyr Lys Thr Pro Leu Lys Met Val Met Asp Lys Val Arg Glu Thr Glu 565 570 575 Lys Lys Ala Lys Ser Asn Thr Glu Lys Asp Ser Phe Ala Ile Ser Leu 580 585 590 Leu Lys Arg Ser Gly Glu Glu Lys Ile Ile Val Ser Lys Trp Lys Tyr 595 600 605 Gly Asp Met Asp Val Leu Glu Ile Leu Lys Glu Leu Ser Tyr Leu Phe 610 615 620 Arg Arg Asn Gln Ser Gly Val Arg Ile Ser Arg Arg Ile Val Tyr Thr 625 630 635 640 Leu Ala Glu Glu Phe Ala Lys Leu Lys Asp Lys Cys Gly Asn Tyr Ile 645 650 655 Ala Glu Thr Gly Ile Ile Asn Thr Glu Ile Lys Arg Val Val Leu Arg 660 665 670 Ala Val Asp Thr Val Ser Gly Asn Ile Gly Lys Glu Glu Lys Lys Asn 675 680 685 Ile Ser Lys Glu Ile Ser Asp Val Leu Lys Asn Leu Tyr His Lys Tyr 690 695 700 Asp Asp Asp Ile Asp Asn Phe Leu Lys Leu Ile Glu Ile Ser Ala Phe 705 710 715 720 Ile Gly Lys Glu Gly Glu 725 <210> 146 <211> 2874 <212> DNA <213> Nitrococcus mobilis <400> 146 tcatgtgtcc aagctccgtg tctcccgagc caggaattcg gctaccgaca gcatgttctc 60 gatgaaatcg gcggccttgg ccgggttctc gacggggcac agcttggcca gccgttcggc 120 atggatcgga gcgccttctt tctccaactt ctggcgctgg aattggtaat gcagcatttg 180 cccgagcagg cgacggaacg gcgcctctcc gcctaccgct acgggcttcg gtagatcccg 240 cagccagccg cggacgttgt aggcggcccg gcgcgaggcg ccggcgtttt tttgcagcgc 300 ggccgagagg gtgcggagtg ctccgatcac gtcctcgccg cccatctgcc agggcagagt 360 gagctcgagg gcgccgccgg cgcgcttgat gatggtgagt gagaaggcat ctcggctgcc 420 gcgattatat gccttggccg ttttctcggc cccccgcagc gcccgcagaa ccgcgcccag 480 cggggcctgg tgatgggcga taacggcgcc catggaggca gtggcgtttt cgcccatggt 540 cagatacagc cgtccgcggc gccgcgcgaa accgttttga aagcgcattt cgtgagccgc 600 ctcgccctcc tccggcgcca gaccggagta ggcaagacgc aggcggcgca tggcggagag 660 cagatcggag acggcgaaca tggccatgag gtcgtcgccg ccggcgtaga gcacccgccc 720 gatgtgctcg cgctccacca cttcgcgggc gatcaccgta gagaaatcgt tcaaggcgcc 780 ggagatcgcc aaatggcggc cgggtgagac ggcgcgttgc gcgtttagat aatcatccag 840 cggggagttg tcctggaagc gcgcttgcaa cccggcctgt atttttggat gaaaggcggc 900 gcggtacggg atggtgaagc gctcatcgcc ggagagccag gcccccatat agtccccgtc 960 catgagcagc agcgcgtaat aggtctcggg tttgtagccg agcgcgtggg ccagccggct 1020 aatggcagcc tccgccttgc cctcgtcacg ctgtgcctcg atccaggccg ggatgcgttc 1080 tatgagctct cgattcgggt gctcgcgcag cttgtcggcc aagcgccggg gcagggccac 1140 acgctcgccg cgttgctcga tttcattgcg caactcggtg tcgatcgcca gtggtgcgtc 1200 gcccagtttg tccaaggtag tggccagcgc catggtgtgg gtcgagacca cgaaccgcga 1260 gaatgacata ttgagcgtgt ccttgagctc ttcgcagaac agcgtcggcc acaggcgctt 1320 gagcgtggcg agcgcgccca gatgctcgcc tttgcgcacc caggtcggcc gcttacggcc 1380 gagccggctc cagagagtgt ccgcttgatc gcgttggccc ggtggtaggc tcagatgtgc 1440 ggggttgtca gtgagccatt ccgcctcggc ggtgagcgag cagcggtagc cgtgctgctc 1500 cagggcgtcg aaagcgcgca cggacttggc ggcgacgagc acccgatcta cgagatcgta 1560 gaccgccggg tacagcacgc cgggattggg ttggtaaaag gtggccgcgc catcgagctc 1620 cagcggccgg cttagcaccc gccaggcgcg gctgccgaga aagccgggct ctatcgggtc 1680 gcccggatag aatgggcgta gcgcctcggc aagcgcgcca gtgcggacct tgcgctcacc 1740 gtcggcggtc agcgcgctgt agggcaccgc cgcccagtgc acctcgggga agccttggag 1800 ttgctcgcgg agttggcgat gagcatgcag gtcgcggcga tcctcgacgc cggcctcttg 1860 cagcacccgc tgcagggcag cctcggtgcg ccccacggtc cactggcgca gttgttcggt 1920 gatgtcttgg gcgatggcct cggccgcgct cgcgggcacc agggccagga aacggttcgg 1980 cagcgcggcg ctgaacagcg ggttgccgtc ggtagggtca cgcatccaat tctgtgcgcc 2040 aaagaggttg cggtcgagcc cgcaatcgcg caacagccac agatccacct gcgggatgcc 2100 gcgcagccgg ggaaatagga tggcctccgg cccgaggcgc tcacagacca cgcgcatggc 2160 ttcccaggac agccgtgcga gcagatgcga accggcccac agatccgagg tggtgcgggc 2220 cgcggcgatg aactcctgca ccgggccgat gcttatatta agcagggcgc actcgccgtt 2280 tgcatccgcc acgaaggcac cggcgaaggc ggagaccaga tcgaggtgat cccagatgct 2340 atggtcgggg atgcgggtat cggccggtag gaagcgccac agctcgccaa gccgcgcggt 2400 atcatccgcg gtgtcgagct ccgggccgaa gcgccacaat gtgagtgcca tccggcgcgg 2460 atcatcaccg ccggcggctt tcagcaagcg cttgaaatgg gcctgacttt ggtccttgac 2520 ggcttcgatc ctggtttcgc gcaacccgcc ctgttggcgc aagtcgaagg ccttgccggt 2580 caacgggtgt atgggcaccg gctgctcggc gaagttgacc tggctccagc gggcataggg 2640 tccttctttg ccgtcacggg gaaactgcgg tcggtcggcg gcggaggccc accagtccgc 2700 cttgcgcaca gtcgcgcgta aatccccggc catgccctgc ggaaacaggc gctcgtgcag 2760 cacgcggctg gtgccgccct cgggaccggc ggggtcgcgc agcagcacca gcgctttctc 2820 ggccggatcg tgcagacgcg cgtgcaactt ggcttgccag agtcggtcgg tcat 2874 <210> 147 <211> 957 <212> PRT <213> Nitrococcus mobilis <400> 147 Met Thr Asp Arg Leu Trp Gln Ala Lys Leu His Ala Arg Leu His Asp 1 5 10 15 Pro Ala Glu Lys Ala Leu Val Leu Leu Arg Asp Pro Ala Gly Pro Glu 20 25 30 Gly Gly Thr Ser Arg Val Leu His Glu Arg Leu Phe Pro Gln Gly Met 35 40 45 Ala Gly Asp Leu Arg Ala Thr Val Arg Lys Ala Asp Trp Trp Ala Ser 50 55 60 Ala Ala Asp Arg Pro Gln Phe Pro Arg Asp Gly Lys Glu Gly Pro Tyr 65 70 75 80 Ala Arg Trp Ser Gln Val Asn Phe Ala Glu Gln Pro Val Pro Ile His 85 90 95 Pro Leu Thr Gly Lys Ala Phe Asp Leu Arg Gln Gln Gly Gly Leu Arg 100 105 110 Glu Thr Arg Ile Glu Ala Val Lys Asp Gln Ser Gln Ala His Phe Lys 115 120 125 Arg Leu Leu Lys Ala Ala Gly Gly Asp Asp Pro Arg Arg Met Ala Leu 130 135 140 Thr Leu Trp Arg Phe Gly Pro Glu Leu Asp Thr Ala Asp Asp Thr Ala 145 150 155 160 Arg Leu Gly Glu Leu Trp Arg Phe Leu Pro Ala Asp Thr Arg Ile Pro 165 170 175 Asp His Ser Ile Trp Asp His Leu Asp Leu Val Ser Ala Phe Ala Gly 180 185 190 Ala Phe Val Ala Asp Ala Asn Gly Glu Cys Ala Leu Leu Asn Ile Ser 195 200 205 Ile Gly Pro Val Gln Glu Phe Ile Ala Ala Ala Arg Thr Thr Ser Asp 210 215 220 Leu Trp Ala Gly Ser His Leu Leu Ala Arg Leu Ser Trp Glu Ala Met 225 230 235 240 Arg Val Val Cys Glu Arg Leu Gly Pro Glu Ala Ile Leu Phe Pro Arg 245 250 255 Leu Arg Gly Ile Pro Gln Val Asp Leu Trp Leu Leu Arg Asp Cys Gly 260 265 270 Leu Asp Arg Asn Leu Phe Gly Ala Gln Asn Trp Met Arg Asp Pro Thr 275 280 285 Asp Gly Asn Pro Leu Phe Ser Ala Ala Leu Pro Asn Arg Phe Leu Ala 290 295 300 Leu Val Pro Ala Ser Ala Ala Glu Ala Ile Ala Gln Asp Ile Thr Glu 305 310 315 320 Gln Leu Arg Gln Trp Thr Val Gly Arg Thr Glu Ala Ala Leu Gln Arg 325 330 335 Val Leu Gln Glu Ala Gly Val Glu Asp Arg Arg Asp Leu His Ala His 340 345 350 Arg Gln Leu Arg Glu Gln Leu Gln Gly Phe Pro Glu Val His Trp Ala 355 360 365 Ala Val Pro Tyr Ser Ala Leu Thr Ala Asp Gly Glu Arg Lys Val Arg 370 375 380 Thr Gly Ala Leu Ala Glu Ala Leu Arg Pro Phe Tyr Pro Gly Asp Pro 385 390 395 400 Ile Glu Pro Gly Phe Leu Gly Ser Arg Ala Trp Arg Val Leu Ser Arg 405 410 415 Pro Leu Glu Leu Asp Gly Ala Ala Thr Phe Tyr Gln Pro Asn Pro Gly 420 425 430 Val Leu Tyr Pro Ala Val Tyr Asp Leu Val Asp Arg Val Leu Val Ala 435 440 445 Ala Lys Ser Val Arg Ala Phe Asp Ala Leu Glu Gln His Gly Tyr Arg 450 455 460 Cys Ser Leu Thr Ala Glu Ala Glu Trp Leu Thr Asp Asn Pro Ala His 465 470 475 480 Leu Ser Leu Pro Pro Gly Gln Arg Asp Gln Ala Asp Thr Leu Trp Ser 485 490 495 Arg Leu Gly Arg Lys Arg Pro Thr Trp Val Arg Lys Gly Glu His Leu 500 505 510 Gly Ala Leu Ala Thr Leu Lys Arg Leu Trp Pro Thr Leu Phe Cys Glu 515 520 525 Glu Leu Lys Asp Thr Leu Asn Met Ser Phe Ser Arg Phe Val Val Ser 530 535 540 Thr His Thr Met Ala Leu Ala Thr Thr Leu Asp Lys Leu Gly Asp Ala 545 550 555 560 Pro Leu Ala Ile Asp Thr Glu Leu Arg Asn Glu Ile Glu Gln Arg Gly 565 570 575 Glu Arg Val Ala Leu Pro Arg Arg Leu Ala Asp Lys Leu Arg Glu His 580 585 590 Pro Asn Arg Glu Leu Ile Glu Arg Ile Pro Ala Trp Ile Glu Ala Gln 595 600 605 Arg Asp Glu Gly Lys Ala Glu Ala Ala Ile Ser Arg Leu Ala His Ala 610 615 620 Leu Gly Tyr Lys Pro Glu Thr Tyr Tyr Ala Leu Leu Leu Met Asp Gly 625 630 635 640 Asp Tyr Met Gly Ala Trp Leu Ser Gly Asp Glu Arg Phe Thr Ile Pro 645 650 655 Tyr Arg Ala Ala Phe His Pro Lys Ile Gln Ala Gly Leu Gln Ala Arg 660 665 670 Phe Gln Asp Asn Ser Pro Leu Asp Asp Tyr Leu Asn Ala Gln Arg Ala 675 680 685 Val Ser Pro Gly Arg His Leu Ala Ile Ser Gly Ala Leu Asn Asp Phe 690 695 700 Ser Thr Val Ile Ala Arg Glu Val Val Glu Arg Glu His Ile Gly Arg 705 710 715 720 Val Leu Tyr Ala Gly Gly Asp Asp Leu Met Ala Met Phe Ala Val Ser 725 730 735 Asp Leu Leu Ser Ala Met Arg Arg Leu Arg Leu Ala Tyr Ser Gly Leu 740 745 750 Ala Pro Glu Glu Gly Glu Ala Ala His Glu Met Arg Phe Gln Asn Gly 755 760 765 Phe Ala Arg Arg Arg Gly Arg Leu Tyr Leu Thr Met Gly Glu Asn Ala 770 775 780 Thr Ala Ser Met Gly Ala Val Ile Ala His His Gln Ala Pro Leu Gly 785 790 795 800 Ala Val Leu Arg Ala Leu Arg Gly Ala Glu Lys Thr Ala Lys Ala Tyr 805 810 815 Asn Arg Gly Ser Arg Asp Ala Phe Ser Leu Thr Ile Ile Lys Arg Ala 820 825 830 Gly Gly Ala Leu Glu Leu Thr Leu Pro Trp Gln Met Gly Gly Glu Asp 835 840 845 Val Ile Gly Ala Leu Arg Thr Leu Ser Ala Ala Leu Gln Lys Asn Ala 850 855 860 Gly Ala Ser Arg Arg Ala Ala Tyr Asn Val Arg Gly Trp Leu Arg Asp 865 870 875 880 Leu Pro Lys Pro Val Ala Val Gly Gly Glu Ala Pro Phe Arg Arg Leu 885 890 895 Leu Gly Gln Met Leu His Tyr Gln Phe Gln Arg Gln Lys Leu Glu Lys 900 905 910 Glu Gly Ala Pro Ile His Ala Glu Arg Leu Ala Lys Leu Cys Pro Val 915 920 925 Glu Asn Pro Ala Lys Ala Ala Asp Phe Ile Glu Asn Met Leu Ser Val 930 935 940 Ala Glu Phe Leu Ala Arg Glu Thr Arg Ser Leu Asp Thr 945 950 955 <210> 148 <211> 7 <212> PRT <213> Artificial sequence <220> <223> motif 11 <220> <221> VARIANT <222> (1)..(1) <223> / replace = "Gly" / replace = "Ser" / replace = "Gln" <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Tyr" / replace = "Phe" / replace = "Leu" <220> <221> VARIANT <222> (3)..(3) <223> / replace = "Phe" / replace = "Asn" <220> <221> VARIANT <222> (5)..(5) <223> / replace = "Ser" <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Ser" <220> <221> VARIANT <222> (7)..(7) <223> / replace = "Pro" / replace = "Leu" <400> 148 Ala Arg Leu His Asp Pro Ala 1 5 <210> 149 <211> 8 <212> PRT <213> Artificial sequence <220> <223> motif 12 <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Gln" <220> <221> VARIANT <222> (3)..(3) <223> / replace = "Glu" / replace = "His" <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Tyr" / replace = "Ser" <220> <221> VARIANT <222> (5)..(5) <223> / replace = "Ile" <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Phe" / replace = "Ala" / replace = "Leu" <220> <221> VARIANT <222> (8)..(8) <223> / replace = "Asn" <400> 149 Pro Ala Asp Thr Arg Ile Pro Asp 1 5 <210> 150 <211> 9 <212> PRT <213> Artificial sequence <220> <223> motif 13 <220> <221> VARIANT <222> (1)..(1) <223> / replace = "Ser" <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Ile" / replace = "Phe" <220> <221> VARIANT <222> (3)..(3) <223> / replace = "Ser" / replace = "Asn" <220> <221> VARIANT <222> (5)..(5) <223> / replace = "Ile" <220> <221> VARIANT <222> (7)..(7) <223> / replace = "Ser" / replace = "Gln" / replace = "Asp" / replace = "Arg" <220> <221> VARIANT <222> (8)..(8) <223> / replace = "Phe" / replace = "Tyr" <400> 150 Thr Leu Gly Pro Val Gln Glu Leu Ile 1 5 <210> 151 <211> 12 <212> PRT <213> Artificial sequence <220> <223> motif 14 <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Phe" <220> <221> VARIANT <222> (3)..(3) <223> / replace = "Tyr" / replace = "Phe" <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Trp" / replace = "Met" / replace = "Thr" <220> <221> VARIANT <222> (5)..(5) <223> / replace = "Ser" <220> <221> VARIANT <222> (7)..(7) <223> / replace = "Tyr" / replace = "Trp" / replace = "Phe" / replace = "Met" <220> <221> VARIANT <222> (8)..(8) <223> / replace = "Ile" / replace = "Met" <220> <221> VARIANT <222> (10)..(10) <223> / replace = "Ser" / replace = "His" <220> <221> VARIANT <222> (11)..(11) <223> / replace = "Tyr" / replace = "Asp" <220> <221> VARIANT <222> (12)..(12) <223> / replace = "Phe" <400> 151 Asp Leu Trp Ala Gly Ser His Leu Leu Ala Arg Leu 1 5 10 <210> 152 <211> 5 <212> PRT <213> Artificial sequence <220> <223> motif 15 <220> <221> VARIANT <222> (1)..(1) <223> / replace = "Ile" / replace = "Val" <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Tyr" / replace = "Thr" <220> <221> misc_feature <222> (4)..(4) <223> Xaa can be any naturally occurring amino acid <400> 152 Leu Phe Pro Xaa Leu 1 5 <210> 153 <211> 5 <212> PRT <213> Artificial sequence <220> <223> motif 16 <220> <221> VARIANT <222> (1)..(1) <223> / replace = "Met" / replace = "Phe" / replace = "Ile" <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Val" / replace = "Thr" <220> <221> VARIANT <222> (5)..(5) <223> / replace = "Ile" / replace = "Leu" <400> 153 Leu Pro Asn Arg Phe 1 5 <210> 154 <211> 6 <212> PRT <213> Artificial sequence <220> <223> motif 17 <220> <221> VARIANT <222> (1)..(1) <223> / replace = "Leu" / replace = "Gly" / replace = "Phe" <220> <221> misc_feature <222> (5)..(5) <223> Xaa can be any naturally occurring amino acid <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Ile" <400> 154 Met Asp Gly Asp Xaa Met 1 5 <210> 155 <211> 10 <212> PRT <213> Artificial sequence <220> <223> motif 18 <220> <221> VARIANT <222> (1)..(1) <223> / replace = "Thr" / replace = "Gly" / replace = "Ala" <220> <221> VARIANT <222> (3)..(3) <223> / replace = "Gly" / replace = "Ser" / replace = "Thr" <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Val" / replace = "Leu" / replace = "Thr" / replace = "Ile" <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Ser" / replace = "Gln" / replace = "Asn" / replace = "Val" / replace = "Ala" <220> <221> VARIANT <222> (7)..(7) <223> / replace = "Leu" / replace = "Thr" / replace = "Gly" / replace = "Phe" <220> <221> VARIANT <222> (8)..(8) <223> / replace = "Leu" / replace = "Val" <220> <221> VARIANT <222> (9)..(9) <223> / replace = "Asn" <220> <221> VARIANT <222> (10)..(10) <223> / replace = "Glu" / replace = "Arg" / replace = "Leu" <400> 155 Ser Pro Ala Arg His Leu Ala Ile Ser Gly 1 5 10 <210> 156 <211> 13 <212> PRT <213> Artificial sequence <220> <223> motif 19 <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Lys" <220> <221> VARIANT <222> (3)..(3) <223> / replace = "Leu" <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Ile" <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Ser" <220> <221> VARIANT <222> (11)..(11) <223> / replace = "Val" <220> <221> VARIANT <222> (12)..(12) <223> / replace = "Phe" / replace = "Leu" <220> <221> VARIANT <222> (13)..(13) <223> / replace = "Thr" <400> 156 Gly Arg Val Leu Tyr Ala Gly Gly Asp Asp Leu Met Ala 1 5 10 <210> 157 <211> 12 <212> PRT <213> Artificial sequence <220> <223> motif 20 <220> <221> VARIANT <222> (1)..(1) <223> / replace = "Ser" <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Met" / replace = "Ile" / replace = "Leu" <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Ala" / replace = "Phe" / replace = "Cys" / replace = "Leu" <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Val" / replace = "Ile" / replace = "Leu" <220> <221> VARIANT <222> (7)..(7) <223> / replace = "Thr" / replace = "Ala" <220> <221> VARIANT <222> (9)..(9) <223> / replace = "Val" / replace = "Gly" <220> <221> VARIANT <222> (10)..(10) <223> / replace = "Asp" <220> <221> VARIANT <222> (11)..(11) <223> / replace = "Tyr" / replace = "Lys" <220> <221> VARIANT <222> (12)..(12) <223> / replace = "Gln" / replace = "Ser" <400> 157 Thr Ala Ser Met Gly Ala Val Ile Ala His His Lys 1 5 10 <210> 158 <211> 22 <212> PRT <213> Artificial sequence <220> <223> motif 21 <220> <221> VARIANT <222> (7)..(7) <223> / replace = "Ile" / replace = "Met" <220> <221> VARIANT <222> (8)..(8) <223> / replace = "Arg" / replace = "Lys" <220> <221> VARIANT <222> (15)..(15) <223> / replace = "Trp" <220> <221> VARIANT <222> (16)..(16) <223> / replace = "Ile" <400> 158 Ile Lys Ala Ser Arg Lys Phe Leu Asp Phe Trp Ala Gly Ser Tyr Leu 1 5 10 15 Leu His Tyr Leu Ser Ala 20 <210> 159 <211> 8 <212> PRT <213> Artificial sequence <220> <223> motif 22 <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Leu" <400> 159 Leu Ala Thr Ala Gly Phe Pro Asn 1 5 <210> 160 <211> 17 <212> PRT <213> Artificial sequence <220> <223> motif 23 <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Thr" / replace = "Arg" / replace = "Ile" <220> <221> VARIANT <222> (8)..(8) <223> / replace = "Arg" / replace = "Lys" <220> <221> VARIANT <222> (12)..(12) <223> / replace = "Thr" <220> <221> VARIANT <222> (14)..(14) <223> / replace = "Ile" / replace = "Thr" <220> <221> VARIANT <222> (15)..(15) <223> / replace = "Val" / replace = "Leu" <400> 160 Gly Leu Phe Asp Gly Ser Glu Met Leu Asn Ala Leu Glu Leu Thr Lys 1 5 10 15 Arg <210> 161 <211> 19 <212> PRT <213> Artificial sequence <220> <223> motif 24 <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Ser" <220> <221> VARIANT <222> (9)..(9) <223> / replace = "Ser" / replace = "Asn" <220> <221> VARIANT <222> (10)..(10) <223> / replace = "Ala" <220> <221> VARIANT <222> (12)..(12) <223> / replace = "Ser" <400> 161 Lys Arg Met Gly Pro Ala Thr His Val Gly Leu Asn Arg Ala Leu Leu 1 5 10 15 Asp Phe Ser <210> 162 <211> 7 <212> PRT <213> Artificial sequence <220> <223> motif 25 <220> <221> VARIANT <222> (2)..(2) <223> / replace = "Ala" <400> 162 Tyr Ser Gly Gly Asp Asp Val 1 5 <210> 163 <211> 34 <212> PRT <213> Artificial sequence <220> <223> motif 26 <220> <221> VARIANT <222> (4)..(4) <223> / replace = "Leu" <220> <221> VARIANT <222> (6)..(6) <223> / replace = "Lys" / replace = "Ser" / replace = "Gln" / replace = "Asp" <220> <221> VARIANT <222> (7)..(7) <223> / replace = "Cys" / replace = "Leu" / replace = "Ala" / replace = "Asn" <220> <221> VARIANT <222> (9)..(9) <223> / replace = "Ser" <220> <221> VARIANT <222> (10)..(10) <223> / replace = "Ile" <220> <221> VARIANT <222> (12)..(12) <223> / replace = "Phe" <220> <221> VARIANT <222> (14)..(14) <223> / replace = "Val" / replace = "Leu" <220> <221> VARIANT <222> (15)..(15) <223> / replace = "Thr" <220> <221> VARIANT <222> (17)..(17) <223> / replace = "Ala" <220> <221> VARIANT <222> (18)..(18) <223> / replace = "His" <220> <221> VARIANT <222> (19)..(19) <223> / replace = "His" <220> <221> VARIANT <222> (21)..(21) <223> / replace = "Ile" <220> <221> VARIANT <222> (24)..(24) <223> / replace = "Ala" <220> <221> VARIANT <222> (25)..(25) <223> / replace = "Ile" <220> <221> VARIANT <222> (29)..(29) <223> / replace = "Ser" / replace = "Asn" <220> <221> VARIANT <222> (32)..(32) <223> / replace = "Gln" <400> 163 Leu Phe Thr Met Gly Phe Gly Ala Thr Met Ser Leu Gly Ile Val Ile 1 5 10 15 Val Asp Lys Ser Val Pro Leu Pro Val Ala Leu Glu Ala Leu Trp Glu 20 25 30 Ala Glu <210> 164 <211> 2194 <212> DNA <213> Oryza sativa <400> 164 aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60 aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140 acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200 tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260 tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320 atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380 gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440 gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500 gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560 gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620 tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680 ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740 actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800 agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860 atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920 gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980 ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040 acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100 aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160 ttggtgtagc ttgccacttt caccagcaaa gttc 2194 <210> 165 <211> 57 <212> DNA <213> Artificial sequence <220> <223> primer: prm14240 <400> 165 ggggacaagt ttgtacaaaa aagcaggctt aaacaatgtc tgaagtttac tggcaag 57 <210> 166 <211> 53 <212> DNA <213> Artificial sequence <220> <223> primer: prm14239 <400> 166 ggggaccact ttgtacaaga aagctgggtt taattgggaa atttaatgta acg 53

Claims (60)

  1. 서열번호 2로 표시된 SGT1 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현을 포함하는, 대조구 식물에 비하여 식물의 수확량을 증가시키는 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 서열번호 2로 표시된 SGT1 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 제1항의 방법에 의해 수득 가능한 종자를 포함하는 식물.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 하기 단계를 포함하는, 대조구 식물에 비하여 증가된 수확량을 갖는 형질전환 식물의 제조 방법:
    (i) 서열번호 2로 표시된 SGT1 폴리펩티드를 코딩하는 핵산을 식물에 도입 및 발현하는 단계; 및
    (ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포를 배양하는 단계.
  13. 서열번호 2로 표시된 SGT1 폴리펩티드를 코딩하는 핵산의 증가된 발현으로 인하여, 대조구 식물에 비하여 증가된 수확량을 갖는 형질전환 식물.
  14. 제13항에 있어서, 상기 식물은 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 또는 귀리인 것을 특징으로 하는 형질전환 식물.
  15. 수확 가능한 부분이 줄기 생물량인 것을 특징으로 하는, 제14항에 따른 식물의 수확 가능한 부분.
  16. 수확 가능한 부분이 종자인 것을 특징으로 하는, 제14항에 따른 식물의 수확 가능한 부분.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
KR1020127010589A 2009-09-25 2010-09-24 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 KR101754083B1 (ko)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
EP09171385.9 2009-09-25
EP09171364.4 2009-09-25
EP09171364 2009-09-25
EP09171385 2009-09-25
US25222009P 2009-10-16 2009-10-16
US25221509P 2009-10-16 2009-10-16
US61/252,215 2009-10-16
US61/252,220 2009-10-16
US26094209P 2009-11-13 2009-11-13
US61/260,942 2009-11-13
EP09175989.4 2009-11-13
EP09175989 2009-11-13
PCT/EP2010/064095 WO2011036232A1 (en) 2009-09-25 2010-09-24 Plants having enhanced yield-related traits and a method for making the same

Publications (2)

Publication Number Publication Date
KR20120125225A KR20120125225A (ko) 2012-11-14
KR101754083B1 true KR101754083B1 (ko) 2017-07-05

Family

ID=43242882

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127010589A KR101754083B1 (ko) 2009-09-25 2010-09-24 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법

Country Status (11)

Country Link
US (2) US9371537B2 (ko)
EP (2) EP2480674A1 (ko)
KR (1) KR101754083B1 (ko)
CN (1) CN102648282A (ko)
AR (1) AR080340A1 (ko)
AU (1) AU2010299857A1 (ko)
CA (1) CA2773879A1 (ko)
DE (1) DE112010003793T5 (ko)
EA (1) EA201290168A1 (ko)
MX (1) MX338065B (ko)
WO (1) WO2011036232A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9157092B2 (en) * 2009-10-22 2015-10-13 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and a method for making the same
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
AU2014235794A1 (en) 2013-03-14 2015-10-22 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
CA3161835A1 (en) 2013-03-15 2014-09-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US10011850B2 (en) 2013-06-21 2018-07-03 The General Hospital Corporation Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
RU2764637C2 (ru) * 2013-07-09 2022-01-19 Президент Энд Фэллоуз Оф Харвард Коллидж Мультиплексная геномная инженерия, направляемая рнк
CN111218447A (zh) 2013-11-07 2020-06-02 爱迪塔斯医药有限公司 使用统治型gRNA的CRISPR相关方法和组合物
US20170145431A1 (en) * 2014-06-25 2017-05-25 Philip Morris Products S.A. Modulation of nitrate content in plants
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
CN107641153B (zh) * 2017-11-16 2020-10-30 河南农业大学 干旱条件下小麦低温胁迫响应蛋白TaCDCP及其编码基因和应用
CN110619131B (zh) * 2018-06-20 2022-11-29 陕西师范大学 一种基于加权模糊Petri网的UUV智能体行为规划方法
CN108950019A (zh) * 2018-08-25 2018-12-07 潍坊德诺泰克生物科技有限公司 肝簇虫的Real-time PCR特异性引物和探针及检测试剂盒与检测方法
CN111363752B (zh) * 2020-04-29 2022-05-20 海南大学 一种橡胶树白粉病抗性相关基因HbSGT1b及其应用

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
WO1989012102A1 (en) 1988-06-01 1989-12-14 The Texas A&M University System Method for transforming plants via the shoot apex
WO1993022443A1 (en) 1992-04-24 1993-11-11 Sri International In vivo homologous sequence targeting in eukaryotic cells
WO1994000012A1 (en) 1992-06-29 1994-01-06 Gene Shears Pty. Ltd. Nucleic acids and methods of use thereof for controlling viral pathogens
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
WO1994012015A1 (en) 1992-11-30 1994-06-09 Chua Nam Hai Expression motifs that confer tissue- and developmental-specific expression in plants
EP0728199A1 (en) 1993-07-22 1996-08-28 Gene Shears Pty Limited Dna virus ribozymes
BR9408093A (pt) 1993-11-19 1997-08-12 Biotechnology Res & Dev Região reguladora quimérica para expressar genes em plantas cassete para expressão de um gene cassete para expressão induzível de um gene estranho processo para expressar um gene em uma planta plasmideo processo para expressão induzível de um gene estranho em uma planta processo para expressão induzível de um gene estranho em uma planta plasmídeo e planta transgênica
DE69425903T2 (de) 1993-12-09 2001-02-15 Thomas Jefferson University Ph Verbindungen und verfahren zur ortsspezifischen mutation in eukaryotischen zellen
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
CA2234222C (en) 1995-10-06 2007-12-04 Plant Genetic Systems, N.V. Seed shattering
US7390937B2 (en) 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
CA2325344C (en) 1998-04-08 2017-12-05 Commonwealth Scientific And Industrial Research Organisation Methods and means for obtaining modified phenotypes
US6764851B2 (en) 1998-06-26 2004-07-20 Iowa State University Research Foundation, Inc. Materials and methods for the alteration of enzyme and acetyl CoA levels in plants
EP0982404A1 (en) * 1998-08-27 2000-03-01 Wallaart, Thorvald Eelco DNA encoding amorpha-4,11-diene synthase
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
CN1279172C (zh) 1999-07-22 2006-10-11 独立行政法人农业生物资源研究所 转化水稻植物的方法
AU780117B2 (en) 1999-08-26 2005-03-03 Basf Plant Science Gmbh Plant gene expression, controlled by constitutive plant V-ATpase promoters
ES2279339T3 (es) 2003-01-21 2007-08-16 Cropdesign N.V. Uso de la secuencia reguladora del gen gos2 del arroz para la expresion genica en plantas o celulas de plantas dicotiledoneas.
EP1532257B1 (en) 2003-02-04 2007-05-16 CropDesign N.V. Rice promoter
BRPI0407514A (pt) * 2003-02-17 2006-02-14 Metanomics Gmbh método para preparar um organismo não humano, polinucleotìdeo, método para preparar um vetor, vetor, célula hospedeira, polipeptìdeo, anticorpo, ácido polinucléico de anti-sentido, método para preparar uma planta, célula vegetal, tecido vegetal transgênicos, célula de um animal útil, animal útil ou um microorganismo transgênico organismo não humano, microorganismo transgênico, rendimento ou um material de propagação de uma planta ou de um animal útil, biomassa de um microorganismo, método para preparar produtos quìmicos finos, e, uso de polipeptìdeo
WO2005113777A1 (en) 2004-05-21 2005-12-01 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Means and methods for producing stress-resistant plants
EP1820391A1 (en) 2006-02-17 2007-08-22 CropDesign N.V. Method and apparatus to determine the start of flowering in plants
CN101415829B (zh) * 2006-03-31 2014-03-12 巴斯福植物科学有限公司 具有增强的产量相关性状的植物和用于产生该植物的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Current Opinion in Biotechnology. Vol. 16, No. 2, 페이지 147-153 (2005.)*
GenBank Accession Number AAU04979 (2006.02.13.)

Also Published As

Publication number Publication date
CA2773879A1 (en) 2011-03-31
US20130145497A1 (en) 2013-06-06
AU2010299857A2 (en) 2013-05-16
CN102648282A (zh) 2012-08-22
EA201290168A1 (ru) 2013-10-30
AU2010299857A1 (en) 2012-04-19
KR20120125225A (ko) 2012-11-14
EP3118320A1 (en) 2017-01-18
DE112010003793T5 (de) 2012-11-22
MX2012003402A (es) 2012-04-30
WO2011036232A1 (en) 2011-03-31
US9371537B2 (en) 2016-06-21
AR080340A1 (es) 2012-04-04
EP2480674A1 (en) 2012-08-01
MX338065B (es) 2016-04-01
US20160002657A1 (en) 2016-01-07

Similar Documents

Publication Publication Date Title
KR101754083B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR101662483B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101495640B (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
EP2069509B1 (en) Plants having enhanced yield-related traits and a method for making the same
EP2004829B1 (en) Plants having enhanced yield-related traits and a method for making the same
KR101255413B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
EP2189534A2 (en) Plants transformed with SYT-polypeptide having increased yield under abiotic stress and a method for making the same
KR20120126061A (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
BRPI0721100A2 (pt) Método para intensificar características relacionadas a rendimentos em plantas, e para a produção de uma planta transgênica, planta ou parte de mesma, molécula de ácido nucleico isolado, polipeptídio isolado, construção, usos de uma construção, de um ácido nucleico e de uma sequência de ácido nucleico, planta, parte de planta ou célula vegetal, partes colhíveis de uma planta, e, produtos
MX2011001475A (es) Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas.
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
KR101429468B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR20100040939A (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101969759A (zh) 具有增强的产量相关性状的植物及其制备方法
AU2011268559A2 (en) Plants having enhanced yield-related traits and method for making the same
US20130019347A1 (en) Plants having enhanced yield-related traits and a method for making the same
EP2539454A1 (en) Plants having enhanced yield-related traits and a method for making the same
US20130025002A1 (en) Plants having enhanced yield-related traits and a method for making the same

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right