BRPI0721100A2 - Método para intensificar características relacionadas a rendimentos em plantas, e para a produção de uma planta transgênica, planta ou parte de mesma, molécula de ácido nucleico isolado, polipeptídio isolado, construção, usos de uma construção, de um ácido nucleico e de uma sequência de ácido nucleico, planta, parte de planta ou célula vegetal, partes colhíveis de uma planta, e, produtos - Google Patents

Método para intensificar características relacionadas a rendimentos em plantas, e para a produção de uma planta transgênica, planta ou parte de mesma, molécula de ácido nucleico isolado, polipeptídio isolado, construção, usos de uma construção, de um ácido nucleico e de uma sequência de ácido nucleico, planta, parte de planta ou célula vegetal, partes colhíveis de uma planta, e, produtos Download PDF

Info

Publication number
BRPI0721100A2
BRPI0721100A2 BRPI0721100-7A2A BRPI0721100A BRPI0721100A2 BR PI0721100 A2 BRPI0721100 A2 BR PI0721100A2 BR PI0721100 A BRPI0721100 A BR PI0721100A BR PI0721100 A2 BRPI0721100 A2 BR PI0721100A2
Authority
BR
Brazil
Prior art keywords
plant
seq
nucleic acid
plants
sequence
Prior art date
Application number
BRPI0721100-7A2A
Other languages
English (en)
Inventor
Christophe Reuzeau
Valerie Frankard
Molinero Ana Isabel Sanz
Willem Broekaert
Original Assignee
Basf Plant Science Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Gmbh filed Critical Basf Plant Science Gmbh
Publication of BRPI0721100A2 publication Critical patent/BRPI0721100A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Botany (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

"MÉTODOS PARA INTENSIFICAR CARACTERÍSTICAS RELACIONADAS A RENDIMENTO EM PLANTAS, E PARA A PRODUÇÃO DE UMA PLANTA TRANSGÊNICA, PLANTA OU PARTE DA MESMA, MOLÉCULA DE ÁCIDO NUCLEICO ISOLADO, POLIPEPTÍDIO ISOLADO, CONSTRUÇÃO, USOS DE UMA CONSTRUÇÃO, DE UM ÁCIDO NUCLEICO E DE UMA SEQÜÊNCIA DE ÁCIDO NUCLEICO, PLANTA, PARTE DE PLANTA OU CÉLULA VEGETAL, PARTES COLHÍVEIS DE UMA PLANTA, E, PRODUTOS"
A presente invenção se relaciona geralmente ao campo de biologia molecular e diz respeito a um método para intensificar várias características relacionadas a rendimento importantes economicamente em plantas. Mais especificamente, a presente invenção diz respeito a um método para intensificar características relacionadas a rendimento em plantas pela modulação da expressão em uma planta de um ácido nucleico que codifica uma Proteína Intensificadora de Rendimento (YEP). A YEP é selecionada a partir de uma Enzima de Processamento Vacuolar (VPE), um polipeptídio semelhante a CCAl, um polipeptídio semelhante a SAP, um polipeptídio de Fator 1 de Promoção de Rendimento em Semente (SYPFl) e um polipeptídio de ribulose-l,5-bifosfato carboxilase/oxigenase (RuBisCO) ativase (RCA). A presente invenção também diz respeito a plantas que têm expressão modulada de um ácido nucleico que codifica tal YEP, tais plantas têm características relacionadas a rendimento intensificado em relação a plantas controle. A invenção também provê ácidos nucleicos que codificam YEP até agora desconhecidos e construções compreendendo os mesmos, úteis na realização dos métodos da invenção.
A sempre crescente população mundial e o suprimento minguante de terra arável disponível para agricultura abastecem a pesquisa voltada para aumentar a eficiência da agricultura. Meios convencionais para melhoras em colheita e horticultura utilizam técnicas de reprodução seletiva para identificar plantas que têm características desejáveis. Entretanto, tais técnicas de reprodução seletiva têm várias desvantagens, a saber, essas técnicas são tipicamente muito trabalhosas e resultam em plantas que freqüentemente contém componentes genéticos heterogêneos que podem nem sempre resultar na característica desejável sendo passada adiante por plantas parentais. Avanços na biologia molecular permitiram que a humanidade modificasse o idioplasma de animais e plantas. Engenharia genética de plantas implica isolamento e manipulação de material genético (tipicamente na forma de DNA ou RNA) e a subsequente introdução deste material genético em uma planta. Tal tecnologia tem a capacidade de distribuir safras ou plantas que têm várias características econômicas, agronômicas ou de horticultura melhoradas.
Uma característica de particular interesse econômico é rendimento aumentado. Rendimento é normalmente definido como a produção mensurável de valor econômico de uma colheita. Isto pode ser definido em termos de quantidade e/ou qualidade. Rendimento é diretamente dependente de vários fatores, por exemplo, do número e tamanho dos órgãos, da arquitetura da planta (por exemplo, do número de ramos), da produção da semente, da senescência foliar e mais. O desenvolvimento de raízes, captação de nutrientes, tolerância a estresse e vigor inicial também podem ser fatores importantes para determinar rendimento. Aperfeiçoar os fatores acima mencionados pode, portanto, contribuir para aumentar rendimento de colheita.
O rendimento de semente é uma característica particularmente importante, visto que as sementes de muitas plantas são importantes para a nutrição humana e animal. Colheitas tais como de, milho, arroz, trigo, colza e soja representam mais de metade do total da ingestão calórica humana, quer através de consumo direto das próprias sementes quer através do consumo de produtos de comida criados com sementes processadas. Elas também são uma fonte de açúcares, óleos e muitos tipos de metabólitos usados em processos industriais. Sementes contém um embrião (a fonte de brotos e raízes novas) e um endosperma (a fonte de nutrientes para o crescimento do embrião durante a germinação e durante o crescimento inicial de plântulas). O desenvolvimento de uma semente envolve muitos genes e requer a transferência de metabólitos das raízes, folhas e caules para a semente crescente. O endosperma, em particular, assimila os precursores metabólicos de carboidratos, óleos e proteínas e os sintetiza em macromolecular de estocagem para preencher o grão.
A biomassa da planta é produto para colheita de forragem como alfafa, milho de silagem e feno. Muitas procurações para rendimento foram usadas em colheitas de grãos. Líderes entre estes são estimativas de tamanho da planta. O tamanho da planta pode ser medido de muitas formas dependendo da espécie e estágio de desenvolvimento, mas inclui peso seco da planta total, peso seco acima do solo, peso fresco acima do solo, área foliar, volume de caule, altura da planta, diâmetro da roseta, comprimento foliar, comprimento da raiz, massa da raiz, número de brotos e número de folhas. Muitas espécies mantém uma proporção conservadora ente o tamanho de partes diferentes da planta em um dado estágio do desenvolvimento. Essas relações alométricas são usadas para extrapolar a partir de uma dessas medidas o tamanho da outra (p. ex., Tittonell et al., 2005 Agric Ecosys & Environ 105: 213). O tamanho da planta em um estágio do desenvolvimento inicial tipicamente se correlacionará ao tamanho da planta posteriormente no desenvolvimento. Uma planta maior com uma maior área foliar pode tipicamente absorver mais luz e dióxido de carbono que uma planta menor e, portanto, provavelmente ganhará um peso maior durante o mesmo período (Fasoula & Tollenaar 2005 Maydica 50: 39). Isto está em adição a potencial continuação da vantagem de microambiente ou genética que a planta tinha para atingir o tamanho maior inicialmente. Há um forte componente genético para o tamanho da planta e taxa de crescimento (p. ex., ter Steege et al., 2005 Plant Physiology 139: 1078) e, portanto, para uma faixa de tamanho de planta de diversos genótipos sob uma condição ambiental provavelmente é correlacionada ao tamanho sob outra (Hittalmani et al, 2003 Theoretical Applied Genetics 107: 679). Deste modo, um ambiente padrão é usado como um procurador para os ambientes diversos e dinâmicos encontrados em diferentes localizações e tempos para colheitas no campo.
O índice de colheita, a razão de rendimento de semente sobre peso seco, é relativamente estável sob muitas condições ambientais e, portanto, uma correlação robusta entre tamanho de planta e rendimento de grão pode freqüentemente ser obtida (p. ex., Rebetzke et al, 2002 Crop Science 42: 739). Esses processos estão intrinsecamente ligados devido à maior parte da biomassa do grão ser dependente da produtividade fotossintética atual ou estocada pelas folhas e caule da planta (Gardener et al, 1985 Physiology of Crop Plants. Prensa da Universidade do Estado do Iowa, pp. 68-73). Portanto, seleção por tamanho de planta, mesmo em estágios iniciais de desenvolvimento, tem sido usada como um indicador para potencial rendimento futuro (p. ex., Tittonell et al, 2005 Agric Ecosys & Environ 105: 213). Ao testar o impacto de diferenças genéticas em tolerância a estresse, a habilidade para padronizar propriedades do solo, temperatura, água e disponibilidade de nutrientes e intensidade luminosa é uma vantagem intrínseca de ambientes de estufa de vegetação ou câmara de crescimento vegetal comparados ao campo. Entretanto, limitações artificiais no rendimento devido à polinização pobre devido à ausência de vento ou insetos, ou espaço insuficiente para raiz madura ou crescimento de dossel, pode restringir o uso desses ambientes controlados para testar diferenças de rendimento. Portanto, medidas de tamanho de planta no desenvolvimento inicial, sob condições padronizadas em uma câmara de crescimento ou estufa de vegetação, são práticas padrões para prover indicação de potenciais vantagens de rendimento genético. Uma característica adicional de importância econômica para muitas colheitas é o vigor inicial. O aperfeiçoamento do vigor inicial é um objetivo importante de programas de criação de arroz moderno tanto em cultivares de arroz temperados como tropicais. Raízes longas são importantes para ancoragem ao solo apropriada em arroz semeado em água. Onde o arroz é semeado diretamente em campos alagados e onde plantas devem emergir rapidamente através da água, raízes mais longas estão associadas com vigor. Onde semeadura por broca é praticada, mesocotilas e coleoptilas são importantes para boa emergência de plântulas. O vigor inicial também pode resultar de aptidão vegetal aumentada devido, por exemplo, às plantas estarem mais bem adaptadas ao seu ambiente (isto é, estarem mais aptas a enfrentar vários fatores de estresse abióticos ou bióticos). Plantas que têm vigor inicial também exibem melhor estabelecimento da colheita (com a colheita crescendo de uma maneira mais uniforme, isto é, com a maioria das plantas atingindo os vários estágios de desenvolvimento consideravelmente ao mesmo tempo) e exibem melhor crescimento e freqüentemente melhor rendimento.
A habilidade para engenheirar vigor inicial em plantas seria de grande importância na agricultura, como seria a habilidade para aumentar rendimento de semente vegetal, quer através do número de sementes, biomassa de sementes, desenvolvimento de sementes, preenchimento de sementes quer por qualquer outra característica relaciona a semente. Com exceção das muitas aplicações em agricultura (incluindo a produção de plantas ornamentais, arboricultura, horticultura e silvicultura), a intensificação de características relacionadas a rendimento também teria muitos usos não agriculturais, tais como a produção biotecnológica de substâncias tais como farmacêuticas, anticorpos ou vacinas. Aumentar o rendimento também pode encontrar utilidade na produção de alga para uso em biorreatores (para a produção biotecnológica de substâncias tais como farmacêuticas, anticorpos ou vacinas, ou para a bioconversão de rejeito orgânico) e em outras de tais áreas.
Surpreendentemente, foi descoberto agora que a modulação da expressão em uma planta de um ácido nucleico que codifica um Polipeptídio Intensificador de Rendimento (YEP) selecionado de Enzima de Processamento Vacuolar (VPE), um polipeptídio semelhante a CCA1, um polipeptídio semelhante a SAP, um polipeptídio de Fator 1 de Promoção de Rendimento em Semente (SYPFl) e um polipeptídio de ribulose-l,5-bifosfato carboxilase/oxigenase (RuBisCO) ativase (RCA) dá plantas que têm características relacionadas a rendimento intensificado em relação a plantas controle.
Antecedentes
I. Enzimas de Processamento Vacuolar (VPEs)
Enzimas de processamento vacuolar (VPEs) são cisteína proteases que clivam uma ligação peptídica no lado C-terminal de asparagina e ácido aspártico. VPE foi originalmente descoberta como uma nova cisteína proteinases responsáveis pela maturação de proteínas de estocagem de sementes. Arabidopsis tem quatro genes de VPE (VPE alfa, VPE beta, VPE gama e VPE delta). Hara-Nishimura et ai, Current Opinion in Plant Biology 2005, 8: 404-408.
Em plantas superiores, precursores de pró-proteína de várias proteínas vacuolares são convertidos pós-traducionalmente nas suas respectivas formas maduras pela ação de VPEs. A estrutura molecular da enzima foi originalmente relatada para VPE de mamona. Homólogos de VPE foram encontrados em plantas (soja, Jack bean, Arabidopsis, ervilhaca e plantas cítricas) e animais (Schistossoma mansoni, humano e camundongo). Um precursor de VPE é composto de um peptídeo sinal, um pró-peptídeo N- terminal, do domínio de VPE maduro e de um pró-peptídeo C-terminal. Um transformante de levedura (Saccharomyces eerevisiae) expressando um precursor de VPE de mamona acumulou a forma madura nos vacúolos. A proteína madura tinha uma atividade de processamento vacuolar; em contraste, o precursor não tinha atividade. A análise de mutantes não tinham atividade sugeriu que a conversão do precursor da pró-proteína de VPE na forma ativa deva ser mediada autocataliticamente. (Hiraiwa et al., FEBS Letters 447, 1999, pp 213-216).
Morte celular programada (PCD) ocorre em animais e plantas sob vários estresses e durante o desenvolvimento. VPE foi identificada como uma executora da PCD vegetal. VPE exibe propriedades enzimáticas similares àquelas de uma caspase, que é uma cisteína protease que media a via de PCD em animais, embora haja limitada identidade de seqüência entre as duas enzimas. VPE foi relatada como tendo atividade de caspase-1 (Hatsugai et al, Science vol. 305 6 August 2004). VPE e caspase-1 compartilham várias propriedades estruturais: as díades catalíticas e três aminoácidos que formam as fendas de substrato (fenda de Asp) são conservadas entre VPE e caspase-1. Em contraste a tais similaridades, VPE está localizada nos vacúolos, enquanto caspases estão localizadas no citosol. VPE funciona como uma molécula chave de PCD vegetal através do rompimento do vacúolo na patogênese e desenvolvimento. Hatsugai et al., Apoptosis 2006; 11: 905-911. VPE gama (VPEg), foi relatada como sendo induzido durante a senescência, uma forma de PCD (veja, Rojo et al, 2004, Current Biology, vol, 14, pp 1897-1906). II. CCAl
Proteínas MYB são uma superfamília de fatores de transcrição que têm funções regulatórias em processos de desenvolvimento e respostas de defesa em plantas. A análise da expressão revelou que a expressão para a maioria dos genes MYB de Arabidopsis respondeu a um ou mais tipos de hormônio e tratamentos de estresse (Yanhui et al., Plan Mol Biol 60, 107-124, 2006). Uma comparação filogenética dos membros desta superfamília em Arabidopsis e arroz sugeriu que a superfamília MYB de Arabidopsis sofreu uma rápida expansão após sua divergência das monocotiledôneas, mas antes de sua divergência de outras dicotiledôneas (Yanhui et al, 2006). Proteínas MYB tipicamente compreendem um domínio de ligação a DNA conservado estruturalmente, o domínio MYB. Elas estão envolvidas no ciclo celular, regulação de formação de meristema, controle de diferenciação celular e na regulação de metabolismo secundário. Fatores de transcrição de domínio MYB constituem uma das maiores famílias de fatores de transcrição em plantas (pelo menos 130 em Arabidopsis thaliana), mas com pouca conservação de seqüência fora do domínio MYB. Eles foram, portanto, reunidos em subgrupos com base em motivos conservados identificados fora da região codificante de MYB (Jiang et al, (2004) Genome Biologu 5: R46). Categorias diferentes de proteínas MYB podem ser identificadas dependendo do número de repetições imperfeitas do domínio MYB que elas contém, agrupadas em 3 famílias: família R2R3-MYB, família R1R2R3-MYB e a família relacionada a MYB. A família R2R3-MYB compreende o maior número de proteínas MYB e é dividida em cinco subfamílias (Yanhui et al, 2006): proteínas semelhantes a CCA1, semelhantes a CPC, semelhantes a TBP, semelhantes a ligação a I-box e MYB tipo R-R. Dessas, a subfamília semelhante a CCAl é a maior e membros desta subfamília contém o motivo conservado SHAQK ou MYADN e a repetição MYB.
O relógio circadiano controla vários processos moleculares e fisiológicos em organismos superiores. Em plantas, esses processos incluem movimento foliar, abertura de estômatos e expressão de grande número de genes. Em Arabidopsis thaliana, vários componentes protéicos associados ao relógio foram identificados. Entre eles, acredita-se que CCAl (ASSOCIADA AO RELÓGIO CIRCADIANO-1)/LHY (HIPOCOTILÉDONE ALONGADO TARDIO) e TOCl (TEMPORIZAÇÃO DE EXPRESSÃO DE CAB 1) sejam componentes essenciais do oscilador central. CCAl e LHY são proteínas de ligação a DNA relacionadas a Myb parcialmente redundantes e homólogas, enquanto TOCl é um membro de uma pequena família de proteínas, designado como PSEUDO-REGULADOR DE RESPOSTA. Também se acredita que esses dois diferentes tipos de componentes do relógio formem uma malha de retroalimentação positiva/negativa auto-regulatória nos níveis de transcrição/tradução que gera ritmos intrínsecos (Nakamichi et al., Plant Cell Physiol. 46, 686-689, 2005). Foi relatado que a expressão constitutiva do gene de CCAl (ASSOCIADA AO RELÓGIO CIRCADIANO-1) em plantas de Arabidopsis (CCAl-ox) resulta em perda de ritmicidade circadiana (Green et al., Plant Physiol 129, 576-584, 2002). Essas plantas CCAl-ox retém a habilidade para responder às alterações diurnas à luz. Assim, níveis de transcrito de vários genes regulados circadianamente, assim como a própria CCAl e a intimamente relacionada LHY, oscilam robustamente se plantas CCAl-ox forem cultivadas sob condições diurnas. Entretanto, em contraste com plantas selvagens em que níveis de transcrito alteram-se em antecipação às transições de escuro/luz, as plantas CCAl-ox perderam a habilidade de antecipar esta alteração diária em seus ambientes. Plantas CCAl-ox floresceram mais tarde, especialmente sob condições de dias longos e foram menos viáveis sob condições de dias muito curtos que seus equivalentes selvagens. Além disso, foi demonstrado que dois outros mutantes de ritmo circadiano, LHY-ox e elf3, tem fenótipos de baixa viabilidade.
W02003013228 e US2004019927 descrevem que plantas que superexpressam CCAl foram late bolting, exibiram biomassa aumentada (tamanho e número de folhas aumentados) e eram de verde mais escuro em tecidos vegetativos e reprodutivos. Foi sugerido que CCAl poderia ser útil no aumento do conteúdo de clorofila permitindo mais crescimento e produtividade em condições de baixa luz. Além disso, foi estipulado que o uso de CCAl para prevenir floração poderia auxiliar a maximizar rendimentos vegetativos e prevenir fuga de pólen de organismo geneticamente modificado (OGM) (US2004045049). Até agora, não há relatos mostrando que expressão de CCAl aumentada resulta em rendimento de semente aumentado, pelo contrário, superexpressadores de CCAl florescem mais tarde, especialmente sob condições de dias longos e foram menos viáveis sob condições de dias muito curtos que seus equivalentes selvagens (Green et al., 2002).
III. SAP
O domínio SAP (recebeu o nome de SAF-A/B, Acinus e PIAS) é um domínio de ligação a DNA que forma uma estrutura hélice- prolongada-hélice. Proteínas com um domínio SAP (também denominadas SAF Box) foram identificadas em levedura, mamíferos e plantas. O domínio SAP é composto de 35 resíduos de aminoácidos e compreende duas hélices anfipáticas separadas por uma região contendo glicina. Algumas posições neste domínio são enriquecidas com aminoácidos carregados positivamente (R, K) que se pensa que entrem em contato com a estrutura de DNA. O domínio SAP forma segundo dizem uma estrutura de hélice-prolongada- hélice (HEH) e que algumas proteínas procarióticas, tal como proteína RHO terminadora de transcrição, também se prevê que tenham domínios SAP. Chen et al., 2003 (Plant Molecular Biology 52: 579-590) relataram que proteínas contendo domínio SAP estavam implicadas em várias funções relacionadas às interações delas com DNA e/ou RNA. Proteínas SAP foram implicadas na arquitetura nuclear e/ou metabolismo de RNA. Por exemplo, o fator A de adesão estrutural humana (SAF-A) é um componente abundante da estrutura nuclear (matriz nuclear) e também está presente em complexos ribonucleoproteicos nucleares heterogêneos, que foram implicados na organização nuclear e processamento de RNA. Acinus é uma proteína ativada por caspase 3 requerida para condensação de cromatina apoptótica. Membros da família de proteínas PIAS combinando domínios SAP e motivos de dedo de Zn MIZ são os inibidores de proteínas de STATs (transdutor de sinal e ativador de transcrição) ativados. A proteína Tholp de levedura, outra proteína contendo SAP, tem uma função na regulação de prolongamento de transcrição pela RNA polimerase II. Chen et al, 2003, descreve a clonagem e caracterização de um gene de arroz, OsBP-7S, que codifica uma proteína de 375 aminoácidos com um domínio semelhante a SAP. Os autores relatam que a análise de transferência de Northern demonstrou que OsBP-73 é expresso fracamente na raiz, folha e semente imatura. Eles também examinaram a expressão do gene OsBP-7S por estudos histoquímicos de plantas de arroz transgênicas portando um gene repórter OsBP-73 5_/GUS. Descobriu-se que o gene repórter é expresso principalmente nos tecidos com altas atividades de divisão celular, tais como ponta de raiz, nó de caule, panícula e semente imatura. Eles relataram adicionalmente que a interferência genética da expressão do gene OsBP-73 por RNA de dupla fita inibe o crescimento da planta inteira, mas não afeta a passagem da fase juvenil para a adulta. Eles sugerem que OsBP-73 possa ter uma função importante na regulação da proliferação celular.
IV. SYPFl
SYPFl é um novo fator de transcrição útil em intensificar características relacionadas a campo em plantas.
Fatores de transcrição geralmente são definidos como proteínas que exibem ligação a DNA de seqüência específica e que são capazes de ativar e/ou reprimir transcrição. O genoma de Arabidopsis codifica pelo menos 1533 reguladores transcricionais, os quais representam -5,9% do seu número total estimado de genes. Cerca de 45% desses fatores de transcrição são relatados como sendo de famílias específicas de vegetais (Riechmann et al, 2000 (Science Vol. 290, 2105-2109)).
Descobriu-se que SYPFl de acordo com o banco de dados PRODOM, compartilha alguma similaridade ao At4gl8650 relacionado a tumor; volta ativador de TGAl bzip Miao et al, 1994 (Plant Mol Biol Apr 25(1): 1-11) relataram que TGAl é um fator de transcrição bem caracterizado que pode mediar a expressão específica de raiz e que responde à auxina de alguns genes vegetais.
V._Polipeptídio_de_ribulose-l,5-bifosfato
carboxilase/oxigenase (RuBisCO) ativase (RCA)
Ribulose-1,5-bifosfato carboxilase/oxigenase (RuBisÇO, EC
4.1.1.39 [EC]) é a mais abundante e uma das mais importantes enzimas na Terra. Ela catalisa a primeira etapa e etapa limitadora de velocidade na fixação de carbono fotossintética, a carboxilação irreversível de ribulose-1,5- bifosfato e CO2 para formar duas moléculas de ácido 3-fosfoglicérico. Entretanto, a velocidade da reação é extremamente baixa e a RuBisCO deve ser ativada e carbamilada para tornar-se cataliticamente competente. A ativação é conseguida pela RuBisCO ativase (RCA), que pode remover inibidores dos sítios catalíticos da RuBisCO, alterar a conformação e ativar a RuBisCO in vivo de uma maneira dependente de ATP (Andrews et al., 1995). RCA é uma proteína de cloroplasto codificada pelo núcleo que
é um membro da família AAA+ (ATPases associadas com atividades celulares diversas) com base em homologias de seqüência e estruturais, cujos membros participam de complexos macromoleculares que realizam diversas funções semelhantes a chaperona. Consistente com a atividade de ATPase de RCA, uma seqüência consenso de malha de ligação a trifosfato de malha P (ou Walker A; Walker et al., (1982) EMBO J 1: 945-951) GXXXGK(S/T), para ligação nucleotídica, é identificada dentro da seqüência polipeptídica de RCA. Vários outros resíduos de aminoácidos críticos necessários para a interação de RCA com e ativação de RuBisCO foram identificados (para revisão: Portis (2003) Photosynthesis Research 75: 11-27).
RCA consiste na maioria das plantas em duas isoformas, de 45-46 kDa (ou forma alfa) e de 41-43 kDa (ou forma beta), que surgem de um único gene através de excisão alternativa (alternative splicing) (para revisão, veja Portis (2003) Photosynthesis Research 75: 11-27). As duas formas diferem apenas na extremidade carbóxi-terminal a forma mais longa compreendendo dois resíduos de cisteína envolvidos na regulação redox dependente de luz (mediada por tiorredoxina-f). Em contraste com a maioria das plantas, um único polipeptídio (sem o prolongamento carbóxi-terminal) foi encontrado na alga verde Chlamydomonas reinhardtii, que também compreende um peptídeo de trânsito de cloroplasto na extremidade amino- terminal do polipeptídio (Roesler & Ogren (1990) Plant Physiol 94(4): 1837- 1841).
Plantas de Arabidopsis mutantes que carecem da atividade de RCA (nomeadas rca-; Sommerville et al., (1982) Plant Physiol 70: 381-387) ou plantas transgênicas que têm um nível muito baixo de atividade de RCA não podem sobreviver em níveis de CO2 atmosférico (Flaveria bidentis-, Von Caemmerer et al, (2005) Plant Physiol 137(2): 747-55) e aquelas expressando níveis reduzidos exibem velocidades reduzidas de fotossíntese e crescimento (em Arabidopsis, Eckhardt et al, (1997) Plant Physiol 113: 575-586; em tabaco, Mate et al, (1996) Planta 198: 604-613). Entretanto, grandes reduções nos níveis de atividade de RCA são requeridos antes da fotossíntese de estado estável ser visivelmente afetada, em temperaturas normais (por exemplo, Arabidopsis, arroz (Jin et al, (2006) Ann Bot (LOnd) 97(5): 739-44), tabaco (He et al, (1997) Plant Physiol 115(4): 1569-80; Hammond et al, (1988) PlantJ 14: 101-110).
Mutantes de Arabidopsis que carecem de RCA (rca-) foram transformados (complementados) com a isoforma de RCA alfa, uma isoforma de RCA alfa mutada (os dois resíduos de Cys envolvidos na regulação redox estão trocados por resíduos de Ala), a isoforma de RCA beta, ou ambas as isoformas de RCA restauraram a habilidade das plantas em crescer sob níveis normais de CO2 (Zhang et al, (2002) PNAS USA 99(5): 3330-3334). Plantas que expressam apenas a isoforma de RCA beta (e assim não reguladas por redox dependente de luz) ou que expressa apenas a isoforma de RCS alfa mutada (insensível a redox) foram incapazes de regular para baixo a RuBisCO sob condições luminosas limitantes.
O pedido de patente US2006/0272044 se relaciona a métodos (por embaralhamento gênico) para obter seqüências polinucleotídicas isoladas que codificam polipeptídios de RCA que tem atividade intensificada.
Surpreendentemente, agora foi descoberto que modular a expressão em uma planta de um ácido nucleico codificando uma YEP selecionada a partir de uma Enzima de Processamento Vacuolar (VPE), um polipeptídio semelhante a CCA1, um polipeptídio semelhante a SAP, um polipeptídio de Fator 1 de Promoção de Rendimento em Semente (SYPFl) e um polipeptídio de ribulose-l,5-bifosfato carboxilase/oxigenase (RuBisCO) ativase (RCA) dá plantas que têm características relacionadas a rendimento intensificado em relação a plantas controle.
Definições
Polipeptídio(s)/proteína(s)
Os termos "proteínas" e "polipeptídio" são usados alternadamente aqui e se referem a aminoácidos em uma forma polimérica de qualquer comprimento.
Polinucleotídio(s)/ácido(s) nucleico(s)/sequência(s) de ácido nucleico/sequência(s) nucleotídica(s)
Os termos "polinucleotídio(s)", "sequência(s) de ácido nucleico", "sequência(s) nucleotídica(s)" são usadas alternadamente aqui e se referem a nucleotídios, quer ribonucleotídios quer desoxirribonucleotídios ou uma combinação de ambos, em uma forma polimérica de qualquer comprimento.
Planta(s) controle
A escolha de plantas controle adequadas é uma parte da rotina de um sistema experimental e pode incluir plantas selvagens correspondentes ou plantas correspondentes sem o gene de interesse. A planta controle é tipicamente da mesma espécie vegetal ou mesmo da mesma variedade da planta a ser avaliada. A planta controle também pode ser um nulizigoto (nullizygote) da planta a ser avaliada. A "planta controle" conforme aqui utilizado se refere não apenas a plantas inteiras, mas também a partes de planta, incluindo sementes e partes de semente.
Homólogo(s)
"Homólogos" de uma proteína abrangem peptídios, oligopeptídios, proteínas e enzimas que têm substituições, deleções e/ou inserções de aminoácidos em relação à proteína não modificada em questão e que tem atividade funcional e biológica similares como a proteína não modificada a partir da qual eles são derivados.
Uma deleção se refere à remoção de um ou mais aminoácidos de uma proteína.
Uma inserção se refere a um ou mais resíduos de aminoácidos sendo introduzidos em um sítio pré-determinado de uma proteína. Inserções podem compreender fusões N-terminais e/ou C-terminais assim como inserções intra-sequência de aminoácidos únicos ou múltiplos. Geralmente, inserções dentro da seqüência de aminoácidos serão menores que fusões Ν- ου C-terminais, da ordem de cerca de 1 até cerca de 10 resíduos. Exemplos de proteínas ou peptídios de fusão N- ou C-terminal incluem o domínio de ligação ou domínio de ativação de um ativador transcricional como usado no sistema de dois híbridos de levedura, proteínas de revestimento de fago, etiqueta de 6 histidinas, etiqueta de glutationa S-transferase, proteína A, proteína de ligação a maltose, diidrofolato redutase, epítopo Tag-100, epítopo de c-myc, epítopo de FLAG®, IacZ, CMP (peptídeo de ligação a calmodulina), epítopo HA, epítopo de proteína C e epítopo VSV.
Uma substituição se refere à substituição de aminoácidos da proteína por outros aminoácidos que têm propriedades similares (tal como hidrofobicidade, hidrofilicidade, antigenicidade, propensidade a formar ou quebrar estruturas de α-hélice ou estruturas de folhas β similares). Substituições de aminoácidos são tipicamente de resíduos únicos, mas podem ser agrupadas dependendo das restrições funcionais localizadas no peptídeo; inserções geralmente serão da ordem de cerca de 1 até 10 resíduos de aminoácidos. As substituições de aminoácidos são de preferência substituições de aminoácidos conservativas. Tabelas de substituição conservativa são bem conhecidas na técnica (veja, por exemplo, Creighton (1984) Proteins. W. H. Freeman and Company e a Tabela 1 abaixo).
Tabela 1: Exemplos de substituições de aminoácidos
conservativas
Resíduo Substituições Conservativas Resíduo Substituições Conservativas Ala Ser Leu lie; Val Arg Lys Lys Arg; Gln Asn Gln; His Met Leu; Ile Asp Glu Phe Met; Leu; Tyr Gln Asn Ser Thr; Gly Cys Ser Thr Ser; Val Glu Asp Trp Tyr Gly Pro Tyr Trp; Phe His Asn; Gln Val lie; Leu Ile Leu, Val
Substituições, deleções e/ou inserções de aminoácidos podem
ser prontamente feitas usando técnicas de síntese peptídica bem conhecidas na técnica, tal como síntese peptídica em fase sólida e semelhantes, ou por manipulação de DNA recombinante. Métodos para a manipulação de seqüências de DNA para produzir variantes de substituição, inserção ou deleção de uma proteína são bem conhecidos na técnica. Por exemplo, técnicas para fazer mutações por substituição em sítios pré-determinados no DNA são bem conhecidas por aqueles versados na técnica e incluem mutagênese com Ml3, mutagênese in vitro com T7-Gen (USB, Cleveland, OH), mutagênese sítio-dirigida QuickChange (Stratagene, San Diego, CA), mutagênese sítio-dirigida mediada por PCR ou outros protocolos de mutagênese sítio-dirigida.
Derivados
"Derivados" incluem peptídios, oligopeptídios, polipeptídios que podem, comparados com a seqüência de aminoácidos da forma que ocorre naturalmente da proteína, tal como a proteína de interesse, compreender substituições de aminoácidos por resíduos de aminoácidos que não ocorrem naturalmente, ou adições de resíduos de aminoácidos que não ocorrem naturalmente. "Derivados" de uma proteína também abrangem peptídios, oligopeptídios, polipeptídios que compreendem resíduos de aminoácidos alterados que ocorrem naturalmente (glicosilados, acilados, prenilados, fosforilados, miristilados, sulfatados, etc.) ou alterados não naturalmente comparados à seqüência de aminoácidos de uma forma que ocorre naturalmente do polipeptídio. Um derivado também pode compreender um ou mais substituintes não aminoácidos ou adições comparadas à seqüência de aminoácidos a partir da qual ele foi derivados, por exemplo, uma molécula repórter ou outro ligante, ligado covalentemente ou não covalentemente à seqüência de aminoácidos, tal como uma molécula repórter que é ligada para facilitar a detecção dele e resíduos de aminoácidos que ocorrem não naturalmente em relação à seqüência de aminoácidos de uma proteína que ocorre naturalmente. Além do mais, "derivados" também incluem fusões da forma que ocorre naturalmente da proteína com peptídios de etiquetagem tal como FLAG, HIS6 ou tiorredoxina (para revisão de peptídios de etiquetagem, veja Terpe, Appl Microbiol Biotechnol 60: 523-533, 2003).
Ortólogo(s)/parálogo(s)
Ortólogos e parálogos abrangem conceitos evolucionários usados para descrever a relações ancestrais de genes. Parálogos são genes dentro da mesma espécie que se originaram através de duplicação de um gene ancestral; ortólogos são genes de organismos diferentes que se originaram através de especiação e também são derivados de um gene ancestral comum. Domínio
O termo "domínio" se refere a um grupo de aminoácidos conservados em posições específicas ao longo de um alinhamento de seqüências de proteínas relacionadas evolutivamente. Embora aminoácidos em outras posições possam variar entre homólogos, aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que são provavelmente essenciais na estrutura, estabilidade ou atividade de uma proteína. Identificados pelo alto grau de conservação deles em seqüências alinhadas de uma família de homólogos protéicos, eles podem ser usados como identificadores para determinar se qualquer polipeptídio em questão pertence a uma família polipeptídica previamente identificada.
Motivo/seqüência consenso/assinatura
O termo "motivo" ou "seqüência consenso" ou "assinatura" se refere a uma região conservada curta na seqüência de proteína relacionadas evolutivamente. Motivos são freqüentemente partes altamente conservadas de domínios, mas também podem incluir apenas parte do domínio, ou estarem localizados fora de domínio conservado (se todos os aminoácidos do motivo caem fora de um domínio definido).
Hibridização
O termo "hibridização" conforme aqui definido é um processo em que seqüências nucleotídicas complementares consideravelmente homólogas se ligam uma a outra. O processo de hibridização pode ocorrer inteiramente em solução, isto é, ambos os ácidos nucleicos complementares estão na solução. O processo de hibridização também pode ocorrer com um dos ácido nucleicos complementares imobilizado em uma matriz tal como microesferas magnéticas, microesferas de sepharose ou qualquer outra resina. O processo de hibridização pode além disso ocorrer com um dos ácidos nucleicos complementares imobilizado em um suporte sólido tal como uma membrana de nitrocelulose ou náilon ou imobilizado por, p. ex., fotolitografia, por exemplo, em um suporte de vidro silicoso (o último conhecido como arranjos ou microarranjos de ácido nucleico ou como chips de ácido nucleico). A fim de permitir que a hibridização ocorra, as moléculas de ácido nucleico são geralmente desnaturadas termicamente ou quimicamente para fundir uma dupla fita em duas fitas simples e/ou remover grampos ou outras estruturas secundárias de ácidos nucleicos de fita simples.
O termo "estringência" se refere às condições sob as quais uma hibridização acontece. A estringência de hibridização é influenciada por condições tal como temperatura, concentração de sal, força iônica e composição de tampão de hibridização. Geralmente, condições de baixa estringência são selecionadas como estando cerca de 3O0C mais baixas que o ponto de desnaturação (Tm) para a seqüência específica em uma força iônica e pH definidos. Condições de média estringência são quando a temperatura está 20°C abaixo da Tm e condições de alta estringência são quando a temperatura está IO0C abaixo da Tm. Condições de hibridização de alta estringência são tipicamente usadas para isolar seqüências de hibridização que têm alta similaridade de seqüência com a seqüência de ácido nucleico alvo. Entretanto, ácidos nucleicos podem divergir em seqüência e ainda codificar um polipeptídio consideravelmente idêntico, devido à degeneração do código genético. Portanto, condições de hibridização de média estringência podem às vezes ser necessárias para identificar tais moléculas de ácido nucleico.
A Tm é a temperatura sob força iônica e pH definidos, em que 50% da seqüência alvo se hibridiza com uma sonda de pareamento perfeito. A Tm é dependente das condições de solução e da composição de bases e comprimento da sonda. Por exemplo, seqüências mais longas se hibridizam especificamente em temperaturas mais altas. A taxa máxima de hibridização é obtida a partir de cerca de 16°C até 32°C abaixo da Tm. A presença de cátions monovalentes na solução de hibridização reduz a repulsão eletrostática entre as duas fitas de ácido nucleico promovendo desse modo formação de híbrido; este efeito é visível para concentrações de sódio de até 0,4M (para concentrações maiores, este efeito pode ser ignorado). Formamida reduz a temperatura de desnaturação de dúplex de DNA-DNA e DNA-RNA em 0,6 ate para cada porcentual de formamida e adição de formamida 50%
permite que a hibridização seja realizada a 30 até 45 C, mas a taxa de hibridização será baixada. Maus pareamentos de par de bases reduzem a taxa de hibridização e a estabilidade térmica dos dúplex. Em média e para sondas grandes, a Tm diminui cerca
de I0C por % de mau pareamento de bases. A Tm pode ser calculada usando as seguintes equações, dependendo dos tipos de híbridos:
1) Híbridos DNA-DNA (Meinkoth e Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm= 81,5°C + 16,6xloglO[Na+]a + 0,41x%[G/Cb] - 500x[Lc]- 1 - 0,6 lx% de formamida 2) Híbridos DNA-DNA ou RNA-RNA:
Tm= 79,8 + 18,5 (loglO[Na+]a) + 0,58 (%G/Cb) + 11,8 (%G/Cb)2 - 820/Lc
3) Híbridos oligo-DNA ou oligo-RNAd: Para <20 nucleotídeos: Tm= 2 (In) Para 20-35 nucleotídeos: Tm= 22 + 1,46 (In)
a ou para outro cátion monovalente, mas apenas preciso na faixa de 0,01-0,4M.
b apenas para % de GC na faixa de 30% até 75% cL = comprimento de dúplex em pares de bases. d Oligo, oligonucleotídeo; ln, comprimento efetivo de
iniciador=2x(no. de G/C)+(no. de A/T).
Ligação não específica pode ser controlada usando qualquer um de várias técnicas conhecidas tal como, por exemplo, bloquear a membrana com soluções contendo proteína, adições de RNA, DNA heterólogos e SDS ao tampão de hibridização e tratamento com Rnase. Para sondas não homólogas, uma série de hibridizações pode ser realizada pela variação de um dentre (i) baixar progressivamente a temperatura de ligação (por exemplo de 68°C para 42°C) ou (ii) baixar progressivamente a concentração de formamida (por exemplo, de 50% para 0%). O técnico versado tem consciência de vários parâmetros que podem ser alterados durantes a hibridização e que ou manterão ou alterarão as condições de estringência.
Além das condições de hibridização, a especificidade de hibridização tipicamente também depende da função de lavagens pós- hibridização. Para remover ruído de marcação resultante de hibridização não específica, amostras são lavadas com soluções salinas diluídas. Fatores críticos de tais lavagens incluem a força iônica e temperatura da solução de lavagem final: quanto mais baixa a concentração salina e quanto mais alta a temperatura de lavagem, maior a estringência da lavagem. Condições de lavagem são tipicamente realizadas em estringência de hibridização ou abaixo. Um hibridização positiva dá um sinal que é pelo menos duas vezes aqueles do ruído. Geralmente, condições estringentes adequadas para ensaios de hibridização de ácido nucleico ou procedimentos de detecção de amplificação gênica são conforme exposto acima. Condições mais ou menos estringentes também podem ser selecionadas. O técnico versado tem consciência de vários parâmetros que podem ser alterados durante a lavagem e que ou manterão ou alterarão as condições de estringência.
Por exemplo, condições de hibridização de alta estringência típicas para híbridos de DNA maiores que 50 nucleotídeos abrangem hibridização a 65°C em SSC Ix ou a 42°C em SSC Ix e formamida 50%, seguida por lavagem a 65°C em SSC 0,3x. Exemplos de condições de hibridização de média estringência para híbridos de DNA maiores que 50 nucleotídeos abrangem hibridização a 5O0C em SSC 4x ou a 40 C em SSC 6x e formamida 50%, seguida por lavagem a 50°C em SSC 2x. O comprimento do híbrido é o comprimento previsto para o ácido nucleico de hibridização. Quando ácidos nucleicos de seqüência conhecida são hibridizados, o comprimento do híbrido pode ser determinado pelo alinhamento das seqüências e identificação das regiões conservadas descritas aqui. SSC Ix é NaCl 0,15M e citrato de sódio 15mM; a solução de hibridização e soluções de lavagem podem incluir adicionalmente reagente de Denhardt 5x, SDS 0,5- 1,0%, 100 μg/mL de DNA de esperma de salmão fragmentado, desnaturado, 0,5% de pirofosfato de sódio. Para fins de definição do nível de estringência, pode ser feita
referência a Sambrook et al., (2001) Molecular Cloning: a laboratory manual, 3a Edição Prensa Cold Spring Harbor Laboratory, CSH, Nova Iorque ou a Current Protocols in Molecular Biology, John Wiley & Sons, NY (1989 e atualizações anuais). Variante de splice
O termo "variante de splice" conforme aqui utilizado abrange variantes de uma seqüência de ácido nucleico em que éxons e/ou íntrons selecionados foram excisados, substituídos, deslocados ou adicionados ou em que íntrons foram encurtados ou alongados. Tais variantes serão umas em que a atividade biológica da proteína é consideravelmente retida; isto pode ser conseguido pela retenção seletiva de segmentos funcionais da proteína. Tais variantes de splice podem ser encontradas na natureza ou podem ser sintéticas. Métodos para prever e isolar tais variantes de Splice são bem conhecidas na técnica (veja, por exemplo, Foissac e Schiex, BMC Bioinformatics. 2005; 6: 25).
Variante alélica
Alelos ou variantes alélicas são formas alternativas de um dado gene, localizado na mesma posição cromossômica. Variantes alélicos abrangem Polimorfismos de Nucleotídeo Único (SNPs), assim como Polimorfismos de Inserção/Deleção Pequenos (INDELs). O tamanho de INDELs geralmente é de menos que 100 pb. SNPs e INDELs formam o maior grupo de variantes de seqüência em cepas polimórficas que ocorrem naturalmente da maioria dos organismos.
Embaralhamento gênico/evolução dirigida
Embaralhamento gênico ou evolução dirigida consiste em interações de embaralhamento de DNA seguido por triagem apropriada e/ou seleção para gerar variantes de ácidos nucleicos ou porções destes codificando proteínas que têm uma atividade biológica modificada (Castle et al., (2004) Science 304(5674): 1151-4; patentes US 5.811.238 e 6.395.547).
Elemento regulatório/sequência de controle/promotor
Os termos "elemento regulatório", "seqüência de controle" e "promotor" são todos usados alternadamente aqui e são para serem tomados em um amplo contexto para referirem-se a seqüências de ácido nucleico regulatórias capazes de promover a expressão das seqüências às quais eles estão ligados. O termo "promotor" se refere tipicamente a uma seqüência de controle de ácido nucleico localizada a montante do início de transcrição de um gene e que está envolvida no reconhecimento e ligação da RNA polimerase e outras proteínas, direcionando desse modo a transcrição de um ácido nucleico ligado operacionalmente. Abrangidas pelos termos acima mencionados são seqüências regulatórias transcricionais derivadas de um gene genômico eucariótico clássico (incluindo a caixa TATA que é requerida para início de transcrição preciso, com ou sem uma seqüência de caixa CCAAT) e elementos regulatórios adicionais (isto é, silenciadores, intensificadores e seqüências ativadoras a montante) que alteram a expressão gênica em resposta a estímulos de desenvolvimento e/ou externos, ou de uma maneira tecido-específica. Também incluído dentro do termo é uma seqüência regulatória transcricional de um gene procariótico clássico, caso em que ela pode incluir uma seqüência de caixa a -35 e/ou seqüências regulatórias transcricionais de caixa a -10. O termo "elemento regulatório" também abrange uma molécula de fusão sintética ou derivado que confere, ativa ou intensifica a expressão de uma molécula de ácido nucleico em uma célula, tecido ou órgão.
Um "promotor vegetal" compreende elementos regulatórios, que mediam a expressão de um segmento de seqüência codificante em células vegetais. Consequentemente, um promotor vegetal não precisa ser de origem vegetal, mas pode se originar de vírus ou microorganismos, por exemplo, de vírus que atacam células vegetais. O "promotor vegetal" também pode se originar de uma célula vegetal, p. ex., da planta que é transformada com a seqüência de ácido nucleico a ser expressa no processo inventivo e descrita aqui. Isto também se aplica a outros sinais regulatórios "vegetais", tais como terminadores "vegetais". Os promotores a montante das seqüências nucleotídicas úteis nos métodos da presente invenção podem ser modificados por uma ou mais de substituição(ões), inserção(ões) e/ou deleção(ões) nucleotídicas sem interferir com a funcionalidade ou atividade dos promotores, da fase de leitura aberta (ORP) ou da região 3'-regulatória tal como terminadores ou outras regiões 3'-regulatórias que estejam localizadas longe da ORF. E além disso possível que a atividade dos promotores seja aumentada pela modificação de suas seqüências, ou que eles sejam substituídos completamente por promotores mais ativos, mesmo promotores de organismos heterólogos. Para expressão em plantas, a molécula de ácido nucleico deve, como descrito acima, estar ligada operacionalmente a ou compreender um promotor adequado que expresse o gene no momento certo e com o padrão de expressão espacial requerido.
Operacionalmente ligado
O termo "operacionalmente ligado" conforme aqui utilizado se refere a uma ligação funcional entre a seqüência promotora e o gene de interesse, tal que a seqüência promotora seja capaz de iniciar a transcrição do gene de interesse.
Promotor regulado no desenvolvimento
Um promotor regulado no desenvolvimento está ativo durante certos estágios do desenvolvimento ou em partes da planta que sofrem alterações de desenvolvimento.
Promotor induzível
Um promotor induzível induziu ou aumentou o início de transcrição em resposta a uma substância química (para revisão veja, Gatz 1997, Annu Rev Plant Physiol Plant Mol Biol, 48: 89-108), estímulo ambiental ou físico, ou pode ser "induzível por estresse", isto é, ativado quando a planta está exposta a várias condições de estresse, ou "induzível por patógeno", isto é, ativado quando a planta está exposta a vários patógenos.
Promotor órgão-específico/tecido-específico
Um promotor órgão-específico ou tecido-específico é um que é capaz de iniciar preferencialmente a transcrição em certos órgãos ou tecidos, tal como as folhas, raízes, tecido de semente, etc. Promotores capazes de iniciar a transcrição em certas células são apenas referidos aqui como "célula- específicos".
Promotor órgão-específíco/tecido-específíco
Um promotor órgão-específico ou tecido-específico é um que é capaz de iniciar preferencialmente a transcrição em certos órgãos ou tecidos, tal como as folhas, raízes, tecido de semente, etc. Por exemplo, um "promotor específico de raiz" é um promotor que está ativo transcricionalmente predominantemente em raízes vegetais, consideravelmente à exclusão de quaisquer outras partes de uma planta, embora ainda permita qualquer expressão que vaze nessas outras partes de planta. Promotores capazes de iniciar a transcrição em certas células são apenas referidos aqui como "célula- específicos".
Exemplos de promotores específicos de raiz são listados na tabela abaixo:
Exemplos de promotores específicos de raiz
Fonte do Gene Referência RCc3 Plant Mol Biol. 1995 Jan; 27(2):237-48 Arabidopsis PHTl Kovama et al.; 2005; Mudge et al. (2002, Plant J. 31:341) Transportados de fosfato Medicago Xiao et al., 2006 Arabidopsis PyklO Nitz et al., (2001) Plant Sci 161(2): 337-346 genes expressáveis em raiz Tingey et al., EMBO J. 6: 1, 1987. gene induzível por auxina de tabaco Yan der Zaal et al., Plant Mol. Biol. 16, 983, 1991. β-tubulina Oppenheimer, et al., Gene 63: 87, 1988. genes específicos de raiz de tabaco Conkling, et al., Plant Physiol. 93: 1203, 1990. gene de Gl-3 b de B. napus Patente dos Estados Unidos No. 5. 401. 836 SbPRPl Suzuki et al., Plant Mol. Biol. 21: 109-119, 1993. LRXl Baumberger et al, 2001, Genes & Dev. 15:1128 BTG-26 de Brassica napus US 20050044585 LeAMTl (tomate) Lauter et al., (1996, PNAS 3:8139) The LeNRTl-I (tomate) Lauter et al. (1996, PNAS 3:8139) Gene de patatina de classe I (batata) Liu et al., Plant Mol. Biol. 153:386-395, 1991. KDC1 (Daucus carota) Downey et al., (2000, J. Biol. Chem. 275:39420) Gene de TobRB 7 W Song (1997) Tese de Doutorado, Universidade do Estado da Carolina do Norte, Raleigh, NC EUA OsRAB5a (arroz) Wang etal., 2002, Plant Sei. 163:273 ALF5 (Arabidopsis) Diener etal, (2001, Plant Cell 13:1625) NRT2;lNp (N. plumbaginifolia) Quesada et al., (1997, Plant Mol. Biol. 34:265) Tabela 2: Exemplos de promotores específicos de semente Fonte do gene Referência genes específicos de semente Simonetal., PlantMol. Biol. 5: 191, 1985; Scofield et al, J. Biol. Chem. 262: 12202, 1987.; Baszczynski et al., Plant Mol. Biol. 14: 633, 1990. Albumina de castanha-do- Pearson et al., Plant Mol. Biol. 18: 235-245, pará 1992. Legumina Ellis et al, Plant Mol. Biol. 10: 203-214, 1988. glutelina (arroz) Takaiwa et al, Mol. Gen. Genet. 208: 15-22, 1986; Takaiwa et al., FEBS Letts. 221: 43-47, 1987. Zeina Matzke et al., Plant Mol Biol, 14(3):323-32 1990 napA Stalberg et al., Planta 199: 515-519, 1996. glutenina-1 de LMW and HMW de trigo Mol Gen Genet 216:81-90, 1989; NAR 17:461-2, 1989 SPA de trigo Albani et al., Plant Cellj 9: 171-184, 1997 α, β, γ-gliadinas de trigo EMBO J. 3:1409-15, 1984 promotor de Itrl de cevada Diaz et al, (1995) Mol Gen Genet 248(5):592-8 hordeína BI, C, D de cevada Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-60, 1996 DOF de cevada Mena et al., The Plant Journal, 116(1): 53-62, 1998 blz2 EP99106056.7 Promotor sintético Yicente-Carbajosa et al., Plant J. 13: 629- 640, 1998. Prolamina de arroz NRP33 Wu et al, Plant Cell Physiology 39(8) 885- 889, 1998 a-globulina de arroz Glb-I Wu et al, Plant Cell Physiology 39(8) 885- 889, 1998 OSHl de arroz Sato et al, Proc. Natl. Acad. Sei. USA, 93: 8117-22, 1996 a-globulin de arroz REB/OHP-1 Nakase et al, Plant Mol. Biol. 33: 513-522, 1997 ADP-glicose pirofosforilase de arroz Trans Res 6:157-68, 1997 Família gênica ESR de milho PlantJ 12:235-46, 1997 α-kafirina de sorgo DeRose et al, Plant Mol. Biol 32:1029-35, 1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 oleosina de arroz Wu et al, J. Biochem. 123:386, 1998 oleosina de girassol Cummins et al, Plant Mol. Biol. 19: 873-876, 1992 PROOl 17, proteína de WO 2004/070039 ribossomo 40 S de arroz putativa PROO136, alanina aminotransferase de arroz Não publicado PROO147, inibidor de tripsina ITRl (cevada) Não publicado PROO151, WSI18 de arroz WO 2004/070039 PROO175, RAB21 de arroz WO 2004/070039 PR0005 WO 2004/070039 PR00095 WO 2004/070039 α-amilase (Amy32b) Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991 gene semelhante a catepsina β Cejudo et al., Plant Mol Biol 20:849-856, 1992 Ltp2 de cevada Kalla et al., Plant J. 6:849-60, 1994 Chi26 Leah etal., Plant J. 4:579-89, 1994 B-Peru de milho Selinger et al., Genetics 149; 1125-38,1998 Tabela 3: Exemplos de promotores específicos de embrião: Fonte de gene Referência OSHl de arroz Sato et al., Proc. Natl. Acad. Sei. USA, 93: 8117-8122, 1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 PROO151 WO 2004/070039 PROO175 WO 2004/070039 PR0005 WO 2004/070039 PR00095 WO 2004/070039 Tabela 4: Exemplos de promotores específicos de aleurona: Fonte de gene Referência α-amilase (Amy32b) Lanahan et al, Plant Cell 4:203-211, 1992/ Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991 gene semelhante a catepsina β Cejudo et al, Plant Mol Biol 20:849-856, 1992 Ltp2 de cevada Kalla et al, Plant J. 6:849-60, 1994 Chi26 Leah etal., Plant J. 4:579-89, 1994 B-Peru de milho Selinger et al, Genetics 149; 1125-38,1998
Promotor constitutivo
Um "promotor constitutivo" se refere a um promotor que está ativo transcricionalmente durante a maioria das, mas não necessariamente todas as, fases de seu crescimento e desenvolvimento e sob a maioria das condições ambientais, em pelo menos um célula, tecido ou órgão.
Tabela 5: Exemplos de promotores constitutivos
Fonte de gene Referência Actina McElroy et al, Plant Cell, 2: 163-171, 1990 HMGP WO 2004/070039 CAMV 35S Odell et al, Nature, 313: 810-812, 1985 CaMV 19S Nilsson et al., Physiol. Plant. 100:456-462, 1997 GOS2 de Pater et al, Plant J Nov;2(6):837-44, 1992, WO 2004/065596 Ubiquitina Christensen et al, Plant Mol. Biol. 18: 675-689, 1992 ciclofilina de arroz Buchholz et al, Plant Mol Biol. 25(5): 837-43, 1994 Histona H3 de milho Lepetit et al, Mol. Gen. Genet. 231:276-285, 1992 Histona H3 de Alfafa Wu et al. Plant Mol. Biol. 11:641-649, 1988 Actina 2 An et al, Plant J. 10(1); 107-121, 1996 34S de FMV Sanger et al., Plant. Mol. Biol., 14, 1990: 433- 443 Subunidade pequena da Rubisco US 4,962,028 OCS Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553 SADl Jain et al., Crop Science, 39 (6), 1999: 1696 SAD2 Jain et al., Crop Science, 39 (6), 1999: 1696 nos Shaw et al. (1984) Nucleic Acids Res. 12(20):7831-7846 V-ATPase WO 01/14572 Super promotor WO 95/14098 Proteínas G-box WO 94/12015
Promotor ubíquo
Um promotor ubíquo está ativo em consideravelmente todos os tecidos ou células de um organismo.
Promotor específico de tecido verde
Um promotor específico de tecido verde conforme aqui definido é um promotor que está ativo transcricionalmente predominantemente em tecido verde, consideravelmente à exclusão de quaisquer outras partes de uma planta, embora ainda permitindo qualquer vazamento de expressão nessas outras partes de planta.
Exemplos de promotores específicos de tecido verde que podem ser usados para realizar os métodos da invenção são mostrados na Tabela 6 abaixo.
Tabela 6: Exemplos de promotores específicos de tecido
verde
Gene Expressão Referência Ortofosfato diquinase de milho Específico de folha Fukavama et al., 2001 fosfoenolpiruvato carboxilase de milho Específico de folha Kausch et al., 2001 fosfoenolpiruvato carboxilase de arroz Específico de folha Liu et al., 2003 Subunidade pequena da Rubisco de arroz Específico de folha Nomura et al., 2000 beta expansina EXBP9 de arroz Shoot specific WO 2004/070039 Subunidade pequena da Rubisco de guandu Específico de folha Panguluri et al., 2005 RBCS3A de ervilha Específico de folha
Outro exemplo de um promotor tecido-específico é um
promotor específico de meristema, que está transcricionalmente ativo predominantemente em tecido meristemático, consideravelmente à exclusão de quaisquer outras partes de uma planta, embora ainda permitindo qualquer vazamento de expressão nessas outras partes de planta. Exemplos de promotores específicos de meristema que podem ser usados para realizar os métodos da invenção são mostrados na Tabela 7 abaixo.
Tabela 7: Exemplos de promotores específicos de meristema
Fonte de gene Padrão de expressão Referência OSHl de arroz Meristema apical de broto, de estágio globular até estágio de plântula do embrião Sato et al. (1996) Proc. Natl. Acad. Sei. USA, 93: 8117-8122 metalotioneína de arroz Específico de meristema BAD87835.1 WAKl & WAK 2 Meristemas apicais de broto e raiz e em folhas e sépalas em expansão Wagner & Kohorn (2001) Plant Cell 13(2): 303-318 Terminador
O termo "terminador" abrange uma seqüência controle que é uma seqüência de DNA no final de uma unidade transcricional que sinaliza o processamento 3' e a poliadenilação de um transcrito primário e término de transcrição. O terminador pode ser derivado do gene natural, de uma variedade de outros genes vegetais ou de T-DNA. O terminador a ser adicionado pode ser derivado, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou senão de outro gene vegetal, ou de menor preferência de qualquer outro gene eucariótico. Marcador (gene) selecionável/gene repórter
"Marcador selecionável", "gene de marcador selecionável" ou "gene repórter" inclui qualquer gene que confira um fenótipo em uma célula em que ele é expresso para facilitar a identificação e/ou seleção de células que são transfectadas ou transformadas com uma construção de ácido nucleico da invenção. Esses genes marcadores permitem que seja feita a identificação de uma transferência bem-sucedida das moléculas de ácido nucleico através de uma série de princípios diferentes. Marcadores adequados podem ser selecionados a partir de marcadores que confiram resistência a antibiótico ou a herbicida, que introduzam uma nova característica metabólica ou que permitam seleção visual. Exemplos de genes de marcador selecionável incluem genes que conferem resistência a antibióticos (tal como nptll que fosforila neomicina e canamicina, ou hpt, que fosforila higromicina, ou genes que conferem resistência a, por exemplo, bleomicina, estreptomicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina), a herbicidas (por exemplo, bar que provê resistência a Basta®; aroA ou gox que provê resistência contra glifosato, ou os genes que conferem resistência a, por exemplo, imidazolinona, fosfinotricina ou sulfoniluréia), ou gene que provêem uma característica metabólica (tal como manA que permite que plantas usem manose como única fonte de carbono ou xilose isomerase para a utilização de xilose, ou marcadores antinutritivos tal como a resistência a 2-desoxiglicose). A expressão de genes de marcadores visuais resulta na formação de cor (por exemplo, β-glicuronidade, GUS ou β-galactosidase com seus substratos coloridos, por exemplo, X-Gal), luminescência (tal como, o sistema luciferina/luciferase) ou fluorescência (Proteína Verde Fluorescente, GFP e seus derivados). Esta lista representa apenas um pequeno número de marcadores possíveis. O trabalhador versado está familiarizado com tais marcadores. Marcadores diferentes são preferidos, dependendo do organismo e do método de seleção.
Transgênico/Transgene/Recombinante
Para as finalidades da invenção, "transgênico", "transgene" ou "recombinante" significa com respeito a, por exemplo, uma seqüência de ácido nucleico, um cassete de expressão, construção gênica ou um vetor compreendendo a seqüência de ácido nucleico ou um organismo transformado com as seqüências de ácido nucleico, cassetes de expressão ou vetores de acordo com a invenção, todas aquelas construções realizadas por métodos recombinantes em que ou
(a) as seqüências de ácido nucleico que codificam proteínas úteis nos métodos da invenção, ou
(b) sequência(s) de controle genético que está(ão) ligada(s) operacionalmente à seqüência de ácido nucleico de acordo com a invenção, por exemplo um promotor, ou
(c) a) e b)
não estão localizadas em seus ambientes genéticos naturais ou foram modificadas por métodos recombinantes, sendo possível para a modificação tomar a forma de, por exemplo, uma substituição, adição, deleção, inversão ou inserção de um ou mais resíduos nucleotídicos. O ambiente genético natural é entendido como significando o loco cromossômico ou genômico natural na planta original ou a presença em uma biblioteca genômica. No caso de uma biblioteca genômica, o ambiente genético natural da seqüência de ácido nucleico é de preferência retido, pelo menos em parte. O ambiente flanqueia a seqüência de ácido nucleico pelo menos de um lado e tem um comprimento de seqüência de pelo menos 50 pb, de preferência pelo menos 500 pb, especialmente de preferência pelo menos 1000 pb, da maior preferência pelo menos 5000 pb. Um cassete de expressão que ocorre naturalmente - por exemplo, a combinação que ocorre naturalmente do promotor natural das seqüências de ácido nucleico com a seqüência de ácido nucleico correspondente codificando um polipeptídio útil nos métodos da presente invenção, conforme definido acima - se torna um cassete de expressão transgênica quando este cassete de expressão é modificado por métodos sintéticos ("artificiais"), não naturais tal como, por exemplo, tratamento mutagênico. Métodos adequados são descritos, por exemplo, em US 5.565.350 ou WO 00/15815.
Uma planta transgênica para as finalidades da invenção é, por conseguinte entendida como significando, como acima, que ácidos nucleicos usados no método da invenção não estão em seu loco natural no genoma da citada planta, sendo possível para os ácidos nucleicos serem expressos homologamente ou heterologamente. Entretanto, como mencionado, transgênico também significa que, embora os ácidos nucleicos de acordo com a invenção ou usados no método inventivo estejam em suas posições naturais no genoma de uma planta, a seqüência foi modificada com respeito à seqüência natural e/ou que as seqüências regulatórias das seqüências naturais foram modificadas. Transgênico é de preferência entendido como significando a expressão dos ácidos nucleicos de acordo com a invenção em um loco artificial no genoma, isto é, a expressão homóloga ou, de preferência, heteróloga dos ácidos nucleicos ocorre. Plantas transgênicas preferidas são mencionadas aqui. Transformação
O termo "introdução" ou "transformação" como referido aqui abrange a transferência de um polinucleotídeo exógeno em uma célula hospedeira, independente do método usado para transferência. Tecido vegetal capaz de subsequente propagação clonal, quer por organogênese quer por embriogênese, pode ser transformado com uma construção genética da presente invenção e uma planta inteira pode ser regenerada a partir daí. O tecido particular escolhido variará dependendo dos sistemas de propagação clonal disponíveis para, e do mais favorável para, as espécies particulares a serem transformadas. Alvos de tecido exemplares incluem discos foliares, pólen, embriões, cotilédones, hipocotilédones, megagametófitos, tecido de calo, tecido meristemático existente (p. ex., meristema apical, botões axilares e meristemas de raiz) e tecido meristemático induzido (p. ex., meristema de cotilédone e meristema de hipocotilédone). O polinucleotídeo pode ser transientemente ou estavelmente introduzido em uma célula hospedeira e pode ser mantido não integrado, por exemplo, como um plasmídeo. Senão, ele pode ser integrado no genoma hospedeiro. A célula vegetal transformada resultante pode então ser usada para regenerar uma planta transformada de uma maneira conhecida por pessoas versada na técnica. A transferência de genes estranhos no genoma de uma planta é
chamada transformação. A transformação de espécies vegetais agora é uma técnica razoavelmente de rotina. Vantajosamente, quaisquer de vários métodos de transformação podem ser usados para introduzir o gene de interesse em uma célula ancestral adequada. Os métodos descritos para a transformação e regeneração de plantas de tecidos vegetais ou células vegetais podem ser utilizados para transformação transiente ou estável. Métodos de transformação incluem o uso de lipossomos, eletroporação, substâncias químicas que aumentam a captação de DNA livre, injeção do DNA diretamente na planta, bombardeio pistola de partículas, transformação usando vírus ou pólen e microprojeção. Métodos podem ser selecionados a partir do método de cálcio/polietileno glicol para protoplastos (Krens, F. A .et al, (1982) 296, 72-74; Negrutiu I et al, (1987) Plant Mol Biol 8: 363-373); eletroporação de protoplastos (Shillito R. D. et al, (1985) Bio/Technol 3: 1099-1102); microinjeção em material vegetal (Crossway A et al, (1986) Mol Gen Genet 202: 179-185); bombardeio de partículas revestidas com DNA ou RNA (Klein Τ. M. et al, (1987) Nature 327: 70) infecção (não integrativa) com vírus e semelhantes. Plantas transgênicas, incluindo plantas de cultivo transgênico, são de preferência produzidas através de transformação mediada por Agrobacterium. Um método de transformação vantajoso é a transformação em planta. Para esta finalidade, é possível, por exemplo, permitir que as agrobactérias ajam em sementes vegetais ou inocular agrobactérias no meristema vegetal. Permitir que a suspensão de agrobactérias transformadas agisse na planta intacta ou pelo menos nos primórdios florais provou-se particularmente conveniente de acordo com a invenção. A planta é subseqüentemente cultivada até que as sementes da planta tratada sejam obtidas (Clough e Bent, Plant J (1998) 16: 735-743). Métodos para transformação mediada por Agrobacterium de arroz incluem métodos bem conhecidos para transformação de arroz, tal como aqueles descrito em qualquer dos seguintes: pedido de patente européia EP 1198985 Al, Aldemita e Hodges (Planta 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), divulgações as quais são incorporadas como referência aqui como se completamente expostas. No caso de transformação de milho, o método preferido é como descrito ou em Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) ou em Frame et al. (Plant Physiol 129(1): 13-22, 2002), divulgações as quais são incorporadas como referência aqui como se completamente expostas. Os métodos citados são adicionalmente descritos por meio de exemplo em B. Jenes et al., Techniques for Gene Transfer, em: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung e R. Wu, Academic Press (1993) 128-143 e em Potrykus Annu Rev Plant Physiol Plant Molec Biol 42: (1991) 205-225). Os ácidos nucleicos ou a construção a ser expressa é de preferência clonada em um vetor, que é adequado para transformar Agrobacterium tumefaciens, por exemplo, pBinl9 (Bevan et al., Nucl. Acids Res. 12: (1984) 8711). Agrobactérias transformadas por tal vetor podem então ser usadas de maneira conhecida para a transformação de plantas, tal como plantas usadas como um modelo, como Arabidopsis (Arabidopsis thaliana está dentro do âmbito da presente invenção não considerada como uma planta de colheita), ou plantas de colheita tal como, por meio de exemplo, plantas de tabaco, por exemplo, pela imersão de folhas amassadas ou folhas picadas em uma solução agrobacteriana e em seguida cultivo delas em meios adequados. A transformação de plantas por meio de Agrobacterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzer em Nucl Acid Res (1988) 16: 9877 ou é conhecida entre outras coisas a partir de F.F. White, Vectors for Gene Transfer in Higher Plants; em Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S-D. Kung e R. Wu, Academic Press, 1993, pp. 15-38.
Além da transformação de células somáticas, que então tem que ser regeneradas em plantas intactas, também é possível transformar as células de meristemas vegetais e em particular aquelas células que se desenvolvem em gametas. Neste caso, os gametas transformados seguem o desenvolvimento da planta natural, dando origem a plantas transgênicas. Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementes são obtidas a partir do desenvolvimento de plantas das quais certa proporção está transformada e assim é transgênica [Feldman, KA e Marks MD (1987) Mol Gen Genet 208:274-289; Feldmann K (1992); Em: C Koncz, N-H Chua e J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapura, pp. 274-289]. Métodos alternativos são baseados na remoção repetida das inflorescências e incubação do sítio de excisão no centro da roseta com agrobactérias transformadas, pelas quais sementes transformadas podem igualmente ser obtidas em um momento posterior (Chang (1994). Plant J 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Entretanto, um método especialmente eficaz é o método de infiltração a vácuo com suas modificações tal como o método de "imersão floral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sob pressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold, N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso do método de "imersão floral" o tecido floral em desenvolvimento seja incubada brevemente com uma suspensão agrobacteriana tratada com tensoativo [Clough, SJ e Bent, AF (1998) The Plant J 16: 735-743]. Uma certa proporção de sementes transgênicas é recuperada em ambos os casos e essas sementes podem ser distinguidas de sementes não transgênicas pelo crescimento sob as condições seletivas acima descritas. Além disso, a transformação estável de plastídios é vantajosa devido aos plastídios serem herdados maternalmente, reduzindo ou eliminando o risco de fluxo transgênico através de pólen. A transformação do genoma do cloroplasto é geralmente conseguida por um processo que foi exibido esquematicamente em Klaus et al., 2004 [Nature Biotechnology 22 (2), 225-229]. Em resumo, as seqüências a serem transformadas são clonadas com um gene de marcador selecionável entre seqüências flanqueadoras homólogas ao genoma do cloroplasto. Essas seqüências flanqueadoras homólogas dirigem integração sítio-específica no plastoma. A transformação plastidial foi descrita para muitas espécies vegetais diferentes e uma descrição geral é dada em Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28. Progresso biotecnológico adicional foi relatada recentemente na forma de transformantes de plastídio livre, que podem ser produzidos por um gene marcador co-integrado transiente (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).
Etiquetagem de ativação de T-DNA
A etiquetagem de ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), envolve a inserção de T-DNA, contendo geralmente um promotor (também pode ser um intensificador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb a montante ou jusante da região codificadora de um gene em uma configuração tal que o promotor dirija a expressão do gene alvo. Tipicamente, a regulação de expressão do gene alvo por seu promotor natural é interrompida e o gene cai sob o controle do promotor recém-introduzido. O promotor está tipicamente incrustado em um T-DNA. Este T-DNA é inserido aleatoriamente no genoma da planta, por exemplo, através de infecção por Agrobacterium e leva à expressão modificada de genes próximos ao T-DNA inserido. As plantas transgênicas resultantes exibem fenótipos dominantes devido à expressão modificada de genes próximos ao promotor induzido.
TILLING
TILLING (Lesões Locais Induzidas Direcionadas em Genomas) é uma tecnologia de mutagênese útil para gerar e/ou identificar ácidos nucleicos codificando proteínas com expressão e/ou atividade modificadas. TILLING também exibe seleção de plantas portando tais variantes mutantes. Essas variantes mutantes podem exibir expressão modificada, ou em força ou em localização ou em temporização (se as mutações afetarem o promotor, por exemplo). Essas variantes mutantes podem exibir atividade maior que aquela exibida pelo gene em sua forma natural. TILLING combina mutagênese de alta densidade com métodos de triagem de alta produtividade. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei GP e Koncz C (1992) em Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al, (1994) em Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J e Caspar T (1998) em J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação de DNA e junção de indivíduos; (c) amplificação por PCR de uma região de interesse; (d) desnaturação e ligação para permitir a formação de heterodúplexes; (e) DHPLC, onde a presença de um heterodúplex em um conjunto é detectada como um pico extra no cromatograma; (f) identificação do indivíduo mutante e (g) seqüenciamento do produto de PCR mutante. Métodos para TILLING são bem conhecidos na técnica (McCallum et al., (2000) Nat Biotechnol 18: 455-457; revisto por Stemple (2004) Nat Rev Genet 5(2): 145-50).
Recombinação homóloga
Recombinação homóloga permite a introdução em um genoma de um ácido nucleico selecionado em uma posição definida. Recombinação homóloga é uma tecnologia padrão usada rotineiramente em ciências biológicas para organismos inferiores tais como levedura ou o musgo Physcomitrella. Métodos para realizar recombinação homóloga em plantas foram descritos não apenas para plantas modelo (Offringa et al. (1990) EMBO J 9(10): 3077-84), mas também para plantas de colheita, por exemplo, arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; Iida e Terada (2004) CurrOpinBiotech 15(2): 132-8).
Rendimento
O termo "rendimento" em geral significa produtos mensuráveis de valor econômico, necessariamente relacionados a uma colheita, a uma área e a um período de tempo específicos. Partes vegetais individuais contribuem diretamente para o rendimento com base no número, tamanho e/ou peso delas, ou o rendimento real é o rendimento por acre para uma colheita e ano, que é determinado pela divisão da produção total (inclui tanto produção colhida como avaliada) por acres plantados. Aumento/Melhora/Intensificação
Os termos "aumentar", "melhorar" ou "acentuar" são permutáveis e devem significar no sentido da aplicação pelo menos 5%, 6%, 7%, 8%, 9% ou 10%, de preferência pelo menos 15% ou 20%, de maior preferência 25%, 30%, 35% ou 40% mais rendimento e/ou crescimento em comparação a plantas controle como aqui definido.
Rendimento de semente
Rendimento de semente aumentado pode manifestar-se como um ou mais dos seguintes: a) um aumento em biomassa de semente (peso de semente total) que pode estar em uma base de semente individual e/ou por planta e/ou por hectare ou acre; b)número aumentado de flores por planta; c) número aumentado de sementes (preenchidas); d) taxa de preenchimento de semente aumentado (que é expresso como a razão entre o número de sementes preenchidas dividido pelo número total de sementes); e) índice de colheita aumentado, que é expresso como uma razão do rendimento de partes colhíveis, tal como sementes, dividido pela biomassa total e f) peso de cem sementes (TKW), que é extrapolado a partir do número de sementes preenchidas contado e do peso total delas. Um TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado e também pode resultar de um aumento no tamanho do embrião e/ou endosperma.
Um aumento no rendimento de semente também pode ser manifestado como um aumento no tamanho de semente e/ou no volume de semente. Além disso, um aumento no rendimento de semente também pode manifestar-se como um aumento na área da semente e/ou no comprimento de semente e/ou na largura de semente e/ou no perímetro de semente. Rendimento aumentado também pode resultar em arquitetura modificada, ou pode ocorrer devido à arquitetura modificada.
Planta
O termo "planta" conforme aqui utilizado abrange plantas inteiras, ancestrais e progênie das plantas e partes de plantas, incluindo sementes, brotos, caules, folhas, raízes (incluindo tubérculos), flores e tecidos e órgãos, em que cada um dos acima mencionados compreende o gene/ácido nucleico de interesse. O termo "planta" também abrange células vegetais, culturas em suspensão, tecido caloso, embriões, regiões meristemáticas, gametófitos, esporófitos, pólen e micrósporos, novamente em que cada um dos acima mencionados compreende o gene/ácido nucleico de interesse.
Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes, plantas ornamentais, colheitas alimentícias, árvores ou arbustos selecionados da lista compreendendo Acer spp., Actinidia spp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera, Allium spp., Amaranthus spp., Ammophila arenaria, Ananas comosus, Annona spp., Apium graveolens, Araehis spp, Artoearpus spp., Asparagus offieinalis, Avena spp. (p. ex., Avena sativa, Avena fatua, Avena hyzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa earambola, Bambusa sp., Benineasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassiea spp. (p. ex., Brassiea napus, Brassiea rapa spp. [canola, colza, colza de nabo]), Cadaba farinosa, Camellia sinensis, Canna indica, Cannabis sativa, Capsicum spp., Carex elata, Carica papaya, Carissa macrocarpa, Carya spp., Carthamus tinctorius, Castanea spp., Ceibapentandra, Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Corchorus sp., Coriandrum sativum, Corylus spp., Crataegus spp., Crocus sativus, Cucurbita spp., Cucumis spp., Cynara spp., Daucus carota, Desmodium spp., Dimocarpus longan, Dioscorea spp., Diospyros spp., Echinochloa spp., Elaeis (p. ex., Elaeis guineensis, Elaeis oleifera), Eleusine coracana, Erianthus sp., Eriobotrya japonica, Eucalyptus sp., Eugenia uniflora, Fagopyrum spp., Fagus spp., Festuca arundinacea, Ficus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glyeine spp. (ρ. ex., Glyeine max, Soja hispida ou Soja max), Gossypium hirsutum, Helianthus spp. (p. ex., Helianthus annuus), Hemerocallis fulva, Hibiseus spp., Hordeum spp. (p. ex., Hordeum vulgare), Ipomoea batatas, Juglans spp., Lactuea sativa, Lathyrus spp., Lens eulinaris, Linum usitatissimum, Litehi ehinensis, Lotus spp., Luffa aeutangula, Lupinus spp., Luzula sylvatica, Lyeopersieon spp. (p. ex., Lyeopersieon eseulentum, Lyeopersieon lyeopersieum, Lyeopersieon pyriforme), Macrotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medieago sativa, Melilotus spp., Mentha spp., Miscanthus sinensis, Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (p. ex., Oryza sativa, Oryza latifolia), Panicum miliaceum, Panieum virgatum, Passiflora edulis, Pastinaca sativa, Pennisetum sp., Persea spp., Petroselinum crispum, Phalaris arundinacea, Phaseolus spp., Phleum pratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Punica granatum, Pyrus communis, Quercus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Ricinus communis, Rubus spp., Saccharum spp., Salix sp., Sambucus spp., Secale cereale, Sesamum spp., Sinapis sp., Solanum spp. (p. ex., Solanum tuberosum, Solanum integrifolium or Solanum lyeopersieum), Sorghum bicolor, Spinacia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticosecale rimpaui, Triticum spp. (p. ex., Triticum aestivum, Triticum durum, Triticum turgidum, Triticum hybernum, Triticum macha, Triticum sativum or Triticum vulgare), Tropaeolum minus, Tropaeolum majus, Vaccinium spp., Vicia spp., Vigna spp., Viola odorata, Vitis spp., Zea mays, Zizaniapalustris, Ziziphus spp., entre outras. Descrição detalhada da invenção
(i) VPE
De acordo com a primeira modalidade, a presente invenção provê um método para intensificar características relacionadas a rendimento em plantas em relação a plantas controle, compreendendo modular a expressão em uma planta de um ácido nucleico codificando uma VPE.
A presente invenção também provê até este ponto ácido nucleicos codificando VPE e VPEs desconhecidos. Essas seqüências também sendo úteis na realização dos métodos da invenção. De acordo com uma modalidade adicional da presente
invenção, é provido, portanto, uma molécula de ácido nucleico isolada compreendendo:
(i) um ácido nucleico representado por SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID
NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171;
(ii) o complemento de qualquer um das SEQ ID Nos dadas em
(0;
(iii) um ácido nucleico que codifica uma VPE que tem, em ordem crescente de preferência, pelo menos 70%, 75%, 80%, 85%, 90%,
95%, 96%, 97%, 98%, 99% ou 100% de identidade de seqüência com qualquer uma das seqüências de aminoácidos dada em SEQ ID NO: 152, SEQ ID NO: 154 e SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172;
(iv) um ácido nucleico capaz de se hibridizar sob condições estringentes com qualquer um dos ácidos nucleicos dados em (i), (ii) ou (iii) acima.
De acordo com uma modalidade adicional da presente invenção, também é provido um polipeptídio isolado compreendendo:
(i) uma seqüência de aminoácidos representada por qualquer uma das SEQ ID NO: 152, SEQ ID NO: 154 e SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID
NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172;
(ii) uma seqüência de aminoácidos que têm, em ordem crescente de preferência, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de seqüência com qualquer uma das seqüências de aminoácidos dada em SEQ ID NO: 152, SEQ ID NO: 154 e
SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172;
(iii) derivados de quaisquer das seqüências de aminoácidos dadas em (i) ou (ii) acima.
Um método preferido para modular (de preferência, aumentar)
a expressão de um ácido nucleico codificando uma VPE é introduzir e expressar em uma planta um ácido nucleico codificando uma VPE.
Qualquer referência daqui por diante a uma "proteína útil nos métodos da invenção" é tomada como significando uma VPE conforme aqui definido. Qualquer referência daqui por diante a um "ácido nucleico útil nos métodos da invenção" é tomada como significando um ácido nucleico capaz de codificar tal VPE. O ácido nucleico a ser introduzido em uma planta (e, portanto, útil na realização dos métodos da invenção) é qualquer ácido nucleico codificando o tipo de proteínas que será descrita agora, daqui em diante também nomeado "ácido nucleico de VPE" ou "gene de VPE".
Uma "VPE" conforme aqui definida se refere a qualquer enzima de processamento vacuolar. VPEs são cisteína proteases que clivam uma ligação peptídica na extremidade C-terminal de asparagina e ácido aspártico (Hiraiwa et al. FEBS Letters 447, 1999, pp.213-216). As proteínas da invenção são identificáveis pela presença dos domínios conservados (veja a Figura 5 exibindo a estrutura do domínio de VPEs gama (VPEg)). VPEg compreende uma ou mais das seguintes características:
- peptídeo sinal para inserção no sistema de endomembranas;
- um domínio inibitório N-terminal;
- um domínio ativo;
- um domínio inibitório C-terminal e
- resíduos de cisteína e histidina conservados.
O termo "domínio" é definido na seção de definições aqui. Bancos de dados de especialista existem para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002)). Um grupo de ferramentas para análise in silico de seqüências de proteínas está disponível no servidor de proteômica ExPASY (hospedado pelo Instituto Suíço de Bioinformática (Gasteiger et al., ExPASy: the proteomies server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). Domínios também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências.
Métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (isto é, abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de intervalos. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula a identidade de seqüência porcentual e desempenha uma análise estatística da similaridade entre as duas seqüências. O programa para desempenhar análise de BLAST está publicamente disponível através do Centro Nacional para Informação em Biotecnologia (NCBI). Homólogos podem prontamente serem identificados usando, por exemplo, o algoritmo de alinhamento de seqüências múltiplas ClustalW (versão 1.83), com os parâmetros de alinhamento para a par padrões e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de programas MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Editoração manual menor pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como seria evidente a uma pessoa vçrsada na técnica. Além disso, em vez de usar seqüências completas para a identificação de homólogos, domínios específicos também podem ser usados. Os valores de identidade de seqüências, que são indicados na seção de Exemplo aqui como um porcentual foram determinados para a seqüência de aminoácidos ou de ácido nucleico inteira e/ou para domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrões.
Além disso, VPEs (pelo menos na forma nativa delas) tem
tipicamente a seguinte atividade. Detalhes adicionais são providos aqui na seção de Exemplos.
A VPE representada pela SEQ ID NO: 150 é uma enzima com um número de Comissão de Enzimas (EC) EC 3.4.22.34 para http://www.ebi.ac.uk/intenz/query?cmd=Search
EC&ec=3.4.22.34&status=OK legumaína (também chamada asparaginil endopeptidase). Asparaginil endopeptidases catalisam a hidrólise de proteínas e substratos de molécula pequena em ligações Asn-|-Xaa. Peptidases nesta classe não são inibidas por composto E-64. Demonstrou-se que VPEg (VPE gama) exibe atividade de protease por resíduos Asp e por uma ligação Asp- Gln para remover o pró-peptídeo N-terminal (Haraiwa et al. 1999, FEBS 447: 213-216). Métodos alternativos para detectar atividade de protease de proteínas VPE foram relatados (veja, por exemplo, Kuroyanagi, The Journal of Biological Chemistry Vol. 280, No. 38, pp. 32914-32920).
VPEs também exibem tipicamente atividade de CASPASE I (veja Hatsugai et al., (Science VOL 305 6 AUGUST 2004) e Rojo et al., 2004 (Current Biology, Vol. 14, pp 1897-1906)). O seguinte sítio de pentapeptídico ativo em caspases é relatado E(AZG)CES (SEQ ID NO: 209). A presente invenção é ilustrada pelas plantas transformantes
com a seqüências de ácido nucleico representada pela SEQ ID NO: 149, que codifica a seqüência polipeptídica de SEQ ID NO: 150. Entretanto, a realização da invenção não está restrita a essas seqüências; os métodos da invenção podem vantajosamente serem realizados usando qualquer ácido nucleico que codifique VPE ou VPE conforme aqui definido.
Exemplos de ácidos nucleicos codificando VPEs são dados aqui na seção de Exemplos. Tais ácidos nucleicos são úteis na realização dos métodos da invenção. As seqüências de aminoácidos dadas nos Exemplos são seqüências de exemplo de ortólogos e parálogos da VPE representada pela SEQ ID NO: 150, os termos "ortólogos" e "parálogos" sendo conforma aqui definido. Ortólogos e parálogos adicionais podem prontamente serem identificados pela realização de uma também chamada pesquisa blast recíproca. Tipicamente, esta envolve um primeiro BLAST envolvendo fazer um BLAST de uma seqüência de dúvida (por exemplo, usando quaisquer das seqüências listadas na tabela nos Exemplos) contra qualquer banco de dados de seqüências, tal como o banco de dados do NCBI disponível publicamente. BLASTN ou BLASTX (usando valores padrões) são usados geralmente quando se parte de uma seqüência nucleotídica e BLASTP ou TBLASTN (usando valores padrões) quando se parte de uma seqüência proteica. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências completas dos resultados filtrados ou dos resultados não filtrados são então submetidas a BLAST reverso (segundo BLAST) contra seqüências do organismo a partir do qual a seqüência de dúvida é derivada (quando a seqüência de dúvida for SEQ ID NO: 149 ou SEQ ID NO: 150, o segundo BLAST seria portanto contra seqüências de Arabidopsis). Os resultados do primeiro e segundo BLASts são então comparados. Um parálogo é identificado se um sucesso de alta classificação do primeiro blast for da mesma espécie que aquela da qual a seqüência de dúvida é derivada, um BLAST reverso então resulta idealmente na seqüência de dúvida como o sucesso mais alto; um ortólogo é identificado se um sucesso de alta classificação no primeiro blast não for da mesma espécie que aquela da qual a seqüência dúvida é derivada e de preferência resulta no BLAST reverso na seqüência de dúvida estando entre os sucessos mais altos. Sucessos de alta classificação são aqueles que tem um baixo
valor de E. Quanto menor o valor de E, mais significativa a pontuação (ou em outras palavras, menor a chance de que o sucesso seja obtido por acaso). A computação do valor de E é bem conhecida na técnica. Além dos valores de E, comparações também são pontuadas por identidade porcentual. Identidade porcentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de neighbour joining, para auxiliar a visualizar o agrupamento de genes relacionados e identificar ortólogos e parálogos. Variantes de ácido nucleico também podem ser úteis na prática dos métodos da invenção. Exemplos de tais variantes incluem ácidos nucleicos que codificam homólogos e derivados de qualquer uma das seqüências de aminoácidos dadas na Tabela Bl da seção de Exemplos, os termos "homólogo" e "derivado" sendo conforme aqui definido. Também úteis nos métodos da invenção são ácidos nucleicos codificando homólogos e derivados de ortólogos ou parálogos de qualquer uma das seqüências de aminoácidos dadas na Tabela Bl da seção de Exemplos. Homólogos e derivados úteis nos métodos da presente invenção tem consideravelmente a mesma atividade biológica e funcional que a proteína não modificada a partir da qual eles foram derivados.
Variantes de ácido nucleico adicionais úteis na prática dos métodos da invenção incluem porções de ácidos nucleicos codificando VPEs, ácidos nucleicos que se hibridizam com ácidos nucleicos codificando VPEs, variantes de splice de ácidos nucleicos codificando VPEs, variantes alélicas de ácidos nucleicos codificando VPEs e variantes de ácidos nucleicos codificando VPEs obtidas por embaralhamento gênico. Os termos seqüência de hibridização, variante de Splice, variante alélica e embaralhamento gênico são conforme aqui descrito. Ácidos nucleicos codificando VPEs não precisam ser ácidos
nucleicos completos, visto que a realização dos métodos da invenção não depende do uso de seqüências de ácido nucleico completas. De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácido nucleico dadas na Tabela Bl na seção de Exemplos, ou uma porção de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas na Tabela B1.
Uma porção de um ácido nucleico pode ser preparada, por exemplo, fazendo-se uma ou mais deleções no ácido nucleico. As porções podem ser usadas de forma isolada ou elas podem ser fiisionadas a outras seqüências codificantes (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combine várias atividades. Quando fusionado a outras 5 seqüências codificantes, o polipeptídio resultante produzido na tradução pode ser maior que aquele previsto para a porção proteica.
Porções úteis nos métodos da invenção codificam uma VPE conforme aqui definido e tem consideravelmente a mesma atividade biológica que as seqüências de aminoácidos dadas na Tabela Bl na seção de Exemplos. 10 De preferência, a porção de qualquer um dos ácidos nucleicos dados na Tabela Bl da seção de Exemplos, é uma porção de um ácido nucleico que codifica ou um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas na Tabela BI. A porção tem tipicamente pelo menos 800 nucleotídeos consecutivos de comprimento, de preferência pelo menos 1.000 15 nucleotídeos consecutivos de comprimento, de maior preferência pelo menos 1.200 nucleotídeos consecutivos de comprimento e da maior preferência pelo menos 1.500 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na Tabela Bl dos Exemplos, ou de um ácido nucleico codificando um 20 ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas na Tabela BI. Da maior preferência a porção é uma porção do ácido nucleico de SEQ ID NO: 149. De preferência, a porção codifica uma seqüência de aminoácidos compreendendo qualquer um ou mais dos domínios aqui definidos. De preferência, a porção codifica uma seqüência de aminoácidos 25 que quando usada na construção de uma árvore filogenética de VPE, tal como aquela retratada na Fig. 6, tende a se aglomerar ao grupo de VPEs gama compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 150 em vez de a qualquer outro grupo.
Outra variante de ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de se hibridizar, sob condições de estringência reduzida, de preferência sob condições estringentes, com um ácido nucleico codificando uma VPE conforme aqui definida, ou com uma porção conforme aqui definida.
5 De acordo com a presente invenção, é provido um método para
intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de se hibridizar com qualquer um dos ácidos nucleicos dados na Tabela B1 da seção de Exemplos, ou compreendendo introduzir e expressar em uma 10 planta um ácido nucleico capaz de se hibridizar com um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de ácidos nucleicos dadas na Tabela Bl dos Exemplos.
Seqüências de hibridização úteis nos métodos da invenção codificam uma VPE conforme aqui definido e tem consideravelmente a 15 mesma atividade biológica que as seqüências de aminoácidos dadas na Tabela B1 dos Exemplos. De preferência, a seqüência de hibridização é capaz de se hibridizar com qualquer um dos ácidos nucleicos dados na Tabela BI, ou com uma porção de quaisquer dessas seqüências, uma porção sendo conforme aqui definida acima, ou em que a seqüência de hibridização é capaz de se 20 hibridizar com um ácido nucleico codificando um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas na Tabela BI. Da maior preferência, a seqüência de hibridização é capaz de se hibridizar com um ácido nucleico representado pela SEQ ID NO: 149 ou com uma porção deste. De preferência a seqüência de hibridização codifica uma seqüência de 25 aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios conforme aqui definidos. De preferência, a seqüência de hibridização codifica uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de VPE, tal como aquela retratada na Fig. 6, tende a se aglomerar ao grupo de VPEs gama compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 150 em vez de a qualquer outro grupo.
Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de splice codificando uma VPE conforme definida aqui acima, uma variante de Splice sendo conforme aqui definida.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de splice de qualquer uma das seqüências de ácido nucleico dadas na Tabela Bl nos 10 Exemplos, ou uma variante de splice de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela B1.
Variantes de Splice preferidas são variantes de Splice de um ácido nucleico representado pela SEQ ID NO: 149, ou uma variante de Splice 15 de um ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 150. De preferência, a seqüência de aminoácidos codificada pela variante de Splice compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos. De preferência, a seqüência de aminoácidos codificada pela variante de splice, quando usada na construção de uma árvore filogenética de 20 VPE, tal como aquela retratada na Fig. 6, tende a se aglomerar ao grupo de VPEs gama compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 150 em vez de a qualquer outro grupo.
Outra variante de ácido nucleico útil na realização dos métodos da invenção é uma variante alélica de um ácido nucleico que codifica uma VPE conforme definida aqui acima, uma variante alélica sendo conforme aqui definida.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados na Tabela Bl dos Exemplos, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela BI.
5 As variantes alélicas úteis nos métodos da presente invenção
tem consideravelmente a mesma atividade biológica que a VPE de SEQ ID NO: 150 e quaisquer dos aminoácidos retratados na Tabela Bl da seção de Exemplos. Variantes alélicas existem na natureza e o uso desses alelos naturais é abrangido pelos métodos da presente invenção. De preferência, a 10 variante alélica é uma variante alélica de SEQ ID NO: 149 ou uma variante alélica de um ácido nucleico que codifica um ortólogo ou parálogo de SEQ ID NO: 150. De preferência, o aminoácido codificado pela variante alélica compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos. De preferência, a seqüência de aminoácidos codificada pela 15 variante alélica, quando usada na construção de uma árvore filogenética de VPE, tal como aquela retratada na Fig. 6, tende a se aglomerar ao grupo de proteínas VPE gama compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 150 em vez de a qualquer outro grupo.
Embaralhamento gênico ou evolução dirigida também podem ser usadas para gerar variantes de ácidos nucleicos codificando VPEs conforme definidas acima; o termo “embaralhamento gênico” sendo conforme aqui definido.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, 25 compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácido nucleico dadas na Tabela Bl do Exemplo, ou compreendendo introduzir e expressar em uma planta uma variante de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela Bl mostrada na seção de Exemplos, tal ácido nucleico variante é obtido por embaralhamento gênico.
De preferência, o ácido nucleico variante obtido por embaralhamento gênico codifica uma seqüência de aminoácidos compreendendo qualquer um dos motivos ou domínios conforme aqui definidos. De preferência, a seqüência de aminoácidos codificada pelo ácido nucleico variante obtido por embaralhamento gênico, quando usada na construção de uma árvore filogenética de VPE, tal como aquela retratada na Fig. 6, tende a se aglomerar ao grupo de VPEs gama compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 150 em vez de a qualquer outro grupo.
Além disso, variantes de ácido nucleico também podem ser obtidas por mutagênese sítio-dirigida. Vários métodos estão disponíveis para alcançar a mutagênese sítio-dirigida, os mais comuns sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Ácidos nucleicos codificando proteínas VPEs podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana intencional. De preferência, o ácido nucleico codificando VPE é de uma planta, de preferência adicional de uma planta dicotiledônea, de maior preferência da família Brassica, da maior preferência o ácido nucleico é de Arabidopsis thaliana.
A realização dos métodos da invenção dá plantas tendo características relacionadas a rendimento intensificado. Em particular, a realização dos métodos da invenção dá plantas tendo rendimento aumentado, especialmente rendimento de semente aumentado em relação a plantas controle. Os termos “rendimento” e “rendimento de semente” são descritos em maiores detalhes aqui na seção de “definições”.
Aqui, referência a características relacionadas a rendimento intensificado é tomada como significando um aumento da biomassa (peso) de uma ou mais partes de uma planta, que podem incluir partes acima do solo (colhíveis) e/ou partes (colhíveis) abaixo do solo. Em particular, tais partes colhíveis são sementes e a realização dos métodos da invenção resulta em 5 plantas que têm rendimento de semente aumentado em relação ao rendimento de semente de plantas controle adequadas.
Tomando milho como exemplo, um aumento de rendimento pode ser manifestados como um ou mais dos seguintes: aumento do número de plantas estabelecidas por hectare ou acre, um aumento do número de IO espigas por planta, um aumento do número de fileiras, número de semente por fileira, peso de semente, peso de cem sementes, comprimento/diâmetro de espiga, aumento na taxa de preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), entre outros. Tomando arroz como exemplo, um aumento de 15 rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculo) por panícula (que é expresso como uma razão do número de sementes preenchidas sobre o número de panículas primárias), aumento na taxa de 20 preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), aumento em peso de cem sementes, entre outros.
A presente invenção provê um método para aumentar rendimento, especialmente rendimento de semente de plantas, em relação a plantas controle, método o qual compreende modular expressão, de preferência aumentar a expressão, em uma planta de um ácido nucleico que codifica uma VPE conforme aqui definida.
Visto que plantas transgênicas de acordo com a presente invenção tem rendimento aumentado, é provável que essas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte do ciclo de vida delas), em relação à taxa de crescimento de plantas controle em um estágio correspondente no ciclo de vida delas.
A taxa de crescimento aumentada pode ser específica para um ou mais partes de uma planta (incluindo sementes), ou pode ser consideravelmente pela planta inteira. Plantas que têm uma taxa de crescimento aumentado podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser tomado como significando o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta tenha produzido sementes maduras secas, similar ao material de partida. O ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, índice de verdor, tempo de floração e velocidade de maturação de semente. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante consideravelmente o ciclo de vida da planta inteira. Taxa de crescimento aumentada durante os estágios iniciais do ciclo de vida de uma planta pode refletir vigor aumentado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo que seria possível de outro modo (um efeito similar pode ser obtido com tempo de floração mais precoce). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz seguida por semeadura e colheita de plantas de arroz adicionais todos dentro de um período de crescimento convencional). De modo similar, se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes de diferentes espécies de plantas (por exemplo, a semeadura e colheita de plantas de milho seguida, por exemplo, pela semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Colher em momentos adicionais o mesmo rizoma no caso de algumas plantas de colheita também pode ser possível. Alterar o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por acre (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento na taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais larga que as equivalentes selvagens delas, visto que as limitações territoriais para crescimento de uma colheita são frequentemente por condições ambientais adversas ou no momento do plantio (estação inicial) ou no momento da colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita for encurtado. A taxa de crescimento pode ser determinada pela derivação de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo tomado por plantas para alcançar 50% do tamanho máximo delas) e T-90 (tempo tomado por plantas para alcançar 90% do tamanho máximo delas) entre outros.
De acordo com uma característica preferida da presente invenção, o desempenho dos métodos da invenção dá plantas que têm uma taxa de crescimento aumentada em relação a plantas controle. Portanto de acordo com a presente invenção, é provido um método para aumentar a taxa 20 de crescimento de plantas, método o qual compreende modular a expressão, de preferência aumentar a expressão, em uma planta de um ácido nucleico que codifica uma VPE conforme aqui definida.
Um aumento no rendimento e/ou taxa de crescimento ocorre quer a planta esteja sob condições de não estresse quer a planta esteja exposta 25 a vários estresses comparada a plantas controle. Plantas tipicamente respondem à exposição a estresse crescendo mais vagarosamente. Em condições de estresse grave, a planta pode mesmo para de crescer totalmente. Estresse leve por outro lado é definido aqui como sendo qualquer estresse ao qual uma planta é exposta que não resulta na cessação total de crescimento pela planta sem a capacidade de retomar o crescimento. Estresse leve no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos de 40%, 35% ou 30%, de preferência menos de 25%), 20% ou 15%), de maior preferência menos de 14%, 13%), 12%, 11% ou 10%) 5 ou menos em comparação com a planta controle sob condições de não estresse. Devido a avanços em práticas da agricultura (irrigação, fertilização, tratamentos com pesticida) estresses graves não são encontrados frequentemente em plantas de colheita cultivadas. Como conseqüência, o crescimento comprometido induzido por estresse leve frequentemente é uma 10 característica indesejável para agricultura. Estresses leves são os estresses bióticos e/ou abióticos (ambientais) de todo dia a que a planta está exposta. Estresses abióticos podem ocorrer devido à seca ou excesso de água, estresses anaeróbico, estresse salino, toxicidade química, estresse oxidativo e calor, frio ou temperaturas de congelamento. O estresse abiótico pode ser um estresse 15 osmótico causado por um estresse aquoso (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tais como bactérias, fungos e insetos.
Em particular, os métodos da presente invenção podem ser 20 realizados sob condições de não estresse ou sob condições de seca leve para dar plantas que têm rendimento aumentado em relação a plantas controle. Como relatado por Wang et al., (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de alterações morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente o crescimento e a produtividade 25 vegetais. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por estarem interligados e podem induzir danos ao crescimento e celulares através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descrevem um grau particularmente alto de “diafonia” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando em interrupção de homeostase e distribuição iônica na célula. Estresse oxidativo, que frequentemente acompanha estresse por seca, salinidade ou temperatura alta ou baixa, pode causar desnaturação de 5 proteínas funcionais e estruturais. Como conseqüência, esses diversos estresses ambientais frequentemente ativam respostas celulares e vias de sinalização celular similares, tais como a produção de proteínas de estresse, regulação para cima de antioxidantes, acúmulo de solutos compatíveis e detenção de crescimento. O termo condições de “não estresse” conforme aqui 10 utilizado se refere àquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na técnica tem consciência de condições de solo normal e condições climáticas para uma dada localização.
A realização dos métodos da invenção dá plantas cultivadas sob condições de não estresse ou sob condições de seca leve com rendimento 15 aumentado em relação a plantas controle adequadas cultivadas sob condições comparáveis. Portanto de acordo com a presente invenção, é provido um método para aumentar o rendimento de plantas cultivadas sob condições de não estresse ou sob condições de seca leve, método que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica VPE.
A presente invenção abrange plantas ou partes destas
(incluindo sementes) obteníveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico que codifica uma VPE conforme definido acima.
A invenção também provê construções genéticas e vetores 25 para facilitar a introdução e/ou a expressão em plantas de ácidos nucleicos codificando VPEs. As construções gênicas podem ser inseridas em vetores, que podem estar disponíveis comercialmente, adequados para transformação em plantas e adequadas para expressão do gene de interesse nas células transformadas. A invenção também provê uso de uma construção gênica conforme aqui definido nos métodos da invenção.
Mais especificamente, a presente invenção provê uma construção compreendendo:
(a) um ácido nucleico codificando uma VPE conforme definido acima;
(b) uma ou mais seqüências controle capazes de direcionar a expressão da seqüências de ácido nucleico de (a) e opcionalmente
(c) uma seqüência de término de transcrição.
Os termos “seqüência controle” e “seqüência de término” são conforme aqui definido.
Plantas são transformadas com um vetor compreendendo quaisquer dos ácidos nucleicos descritos acima. O técnico versado está bem consciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar de modo bem-sucedido células 15 hospedeiras contendo a seqüências de interesse. A seqüência de interesse está ligada operacionalmente a uma ou mais seqüências controle (pelo menos a um promotor).
Vantajosamente, qualquer tipo de promotor pode ser usado para direcionar a expressão da seqüência de ácido nucleico. Um promotor 20 constitutivo é particularmente útil como é um promotor específico de raiz. Entretanto, é particularmente preferido um promotor específico de semente. Um promotor específico de semente está transcricionalmente ativo predominantemente no tecido de semente, mas não necessariamente exclusivamente em tecido de semente (em casos de expressão vazada). O 25 promotor específico de semente pode estar ativo durante o desenvolvimento da semente e/ou durante a germinação. Promotores específicos de semente são bem conhecidos na técnica. Deve estar claro que a aplicabilidade da presente invenção não está restrita ao ácido nucleico que codifica VPE representado pela SEQ ID NO: 149, a aplicabilidade da invenção também não está restrita à expressão de um ácido nucleico que codifica VPE quando direcionado por um promotor específico de semente. Exemplos de outros promotores específicos de semente que também podem ser usados para direcionar a expressão de um ácido nucleico que codifica VPE são mostrados 5 aqui na seção de “Definições”. Exemplos adicionais de promotores específicos de semente são dados em Qing Qu e Takaiwa (Plant Biotechnol. J. 2, 113-125, 2004), cuja divulgação está incorporada aqui como referência como se completamente exposta.
De maior preferência, um promotor está ativo 10 transcricionalmente nas camadas do embrião e/ou alerona de uma semente. De preferência, o promotor específico de semente é um promotor Induzível por Estresse Aquoso (WSI) ou um promotor funcionalmente equivalente. De maior preferência, a seqüência do promotor é como representada pela SEQ ID NO: 205. Exemplos de promotores específicos de embrião que também 15 podem ser usados para direcionar a expressão de um ácido nucleico que codifica VPE são mostrados aqui na seção de “Definições”. Exemplos de Exemplos de outros promotores específicos de aleurona que também podem ser usados para direcionar a expressão de um ácido nucleico que codifica VPE são mostrados aqui na seção de “Definições”.
Para a identificação de promotores funcionalmente
equivalentes, a força do promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, pela ligação operacional do promotor a um gene repórter e avaliando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos 25 adequados incluem, por exemplo, beta-glicuronidase ou beta-galactosidase. A atividade promotora é avaliada pela medição da atividade enzimática da beta- glicuronidase ou beta-galactosidase. A força do promotor e/ou padrão de expressão podem então ser comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Senão, a força do promotor pode ser avaliada pela quantificação de níveis de mRNA ou pela comparação dos níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA dos genes estruturais tal como de rRNA 18S, usando métodos conhecidos na técnica, tal como 5 transferência de Northern com análise densitométrica de auto-radiogramas, PCR em tempo real quantitativo ou RT-PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente, por “promotor fraco” entende-se um promotor que direciona a expressão de uma seqüência codificante para um nível baixo. Por “nível baixo” entende-se níveis de cerca de 1/10.000 10 transcritos até cerca de 1/100.000 transcritos, até cerca de 1/500.000 transcritos por célula. No sentido inverso, um “promotor forte” direciona a expressão de uma seqüência codificante para um nível alto, ou para cerca de 1/10 transcritos até cerca de 1/100 transcritos até cerca de 1/1.000 transcritos por célula.
Opcionalmente, uma ou mais seqüências terminadoras podem
ser usadas na construção introduzida em uma planta. Elementos regulatórios adicionais podem incluir intensificadores transcricionais assim como traducionais. Aqueles versados na técnica terão consciência de seqüências terminadoras e intensificadoras que podem ser adequadas para uso na 20 realização da invenção. Tais seqüências seriam conhecidas ou poderiam ser prontamente obtidas por uma pessoa versada na técnica.
Uma seqüência intrônica também pode ser adicionada na região 5’ não traduzida (UTR) ou na seqüência codificante para aumentar a quantidade da mensagem madura que se acumula no citosol. Demonstrou-se 25 que a inclusão de um íntron processável por splice na unidade de transcrição tanto em construções de expressão vegetais como animais aumenta a expressão gênica tanto em níveis de mRNA como protéicos até 1000 vezes (Buchman e Berg, Mol. Cell Biol. 8:4395-4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal intensificação por íntron da expressão gênica é tipicamente a maior quando colocado próximo da extremidade 5 ’ da unidade de transcrição. Uso dos íntrons de milho íntrons de Adhl-S 1, 2 e 6, o íntron Bronze-I é conhecido na técnica. Para informação geral, veja The Maize Handbook, Capítulo 116, Freeling e Walbot, Eds., Springer, N.Y. (1994).
5 Outras seqüências controle (além de regiões de promotora,
intensificadora, silenciadora, 3’UTR e/ou 5’UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências seriam conhecidas ou podem ser prontamente obtidas por uma pessoa versada na técnica.
As construções genéticas da invenção podem incluir IO adicionalmente uma seqüência de origem de replicação que é necessária para a manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando é necessária que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (p. ex., molécula de plasmídio ou cosmídio). Origens de replicação preferidas incluem, mas não 15 estão limitadas a, o fl-ori e colEl.
Para a detecção da transferência bem-sucedida das seqüências de ácido nucleico conforme usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo esses ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode 20 opcionalmente compreender um gene marcador selecionável. Marcadores selecionáveis são descritos em maiores detalhes aqui na seção de “definições”.
Sabe-se que na integração estável ou transiente de ácidos nucleicos em células vegetais, apenas uma minoria das células pega o DNA 25 estranho e, se desejado, integra ele em seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar esses integrantes, um gene codificante de um marcador selecionável (tal como aqueles descritos acima) geralmente é introduzido nas células hospedeiras junto com o gene de interesse. Esses marcadores podem, por exemplo, ser usados em mutantes em que esses genes não são funcionais, por exemplo, por deleção por métodos convencionais. Além disso, moléculas de ácido nucleico que codificam um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a seqüência que codifica os polipeptídios da invenção ou usados nos métodos da invenção, senão em um vetor separado. Células que foram transfectadas estavelmente com o ácido nucleico introduzido podem ser identificadas, por exemplo, por seleção (por exemplo, células que integraram o marcador selecionável sobrevivem enquanto as outras células morrem).
Visto que genes de marcadores, particularmente genes de resistência a antibióticos e herbicidas, não são mais necessários ou são indesejáveis na célula hospedeira transgênica uma vez que os ácidos nucleicos forem introduzidos satisfatoriamente, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente emprega técnicas que permitem a remoção ou excisão desses genes de marcadores. Um de tais métodos é o que é conhecido como co-transformação. O método de co- transformação emprega dois vetores simultaneamente para a transformação, um vetor portando o ácido nucleico de acordo com a invenção e um segundo portando o(s) gene(s) de marcador(es). Uma grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes) ambos os vetores. No caso de transformação com agrobactérias os transformantes geralmente recebem apenas uma parte do vetor, isto é, a seqüência flanqueada pelo T-DNA, que geralmente representa o cassete de expressão. Os genes marcadores podem subsequentemente ser removidos da planta transformada pela realização de cruzamentos. Em outro método, genes de marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecido como a tecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte de transposase ou os transformantes são transformados com uma construção de ácido nucleico que confere expressão de uma transposase, transientemente ou estável. Em alguns casos (aproximadamente 10%), o transposon salta do genoma da célula hospedeira uma vez que a transformação tenha ocorrido satisfatoriamente e é perdido. Em um número de casos adicionais, o 5 transposon salta para uma localização diferente. Nesses casos o gene de marcador deve ser eliminado pela realização de cruzamentos. Em microbiologia, foram desenvolvidas técnicas que tomam possível, ou facilitam, a detecção de tais eventos. Um método vantajoso adicional depende do que é conhecido como sistemas de recombinação; cuja vantagem é que a 10 eliminação por cruzamento pode ser dispensada. O melhor sistema conhecido deste tipo é aquele conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene de marcador estiver integrado entre as seqüências IoxP, ele é removido uma vez que a transformação tenha ocorrido satisfatoriamente, pela 15 expressão da recombinase. Sistemas de recombinação adicionais são o sistema HIN/HIX, FLP/FRT e REP/STB (Tribble et al, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al, J. Cell Biol., 149, 2000: 553-566). Uma integração sítio-específíca no genoma vegetal das seqüências de ácido nucleico de acordo com a invenção é possível. Naturalmente, esses métodos 20 também podem ser aplicados a microorganismos tais como levedura, fungos ou bactérias.
A invenção também provê um método para a produção das plantas transgênicas que têm características relacionadas a rendimento intensificadas em relação a plantas controle, compreendendo a introdução e expressão em uma planta de qualquer ácido nucleico codificanto uma VPE como definido aqui acima.
Mais especificamente, a presente invenção provê um método para a produção de plantas transgênicas que têm rendimento aumentado, método o qual compreende: (i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico que codifica VPE e
(ii) cultivar a célula vegetal sob condições que promovem crescimento e desenvolvimento vegetal.
5 O ácido nucleico pode ser introduzido diretamente em uma
célula vegetal ou na planta por si só (incluindo a introdução em um tecido, ógão ou qualquer outra parte de uma planta). De acordo com a característica preferida da presente invenção, o ácido nucleico é introduzido de preferência em uma planta por transformação. O termo “transformação” é descrito aqui em maiores detalhes na seção de “definições”.
As células vegetais modificadas geneticamente podem ser regeneradas através de todos os métodos com os quais o trabalhador versado está familiarizado. Métodos adequados podem ser encontrados na publicações acima mencionadas de S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer. Geralmente após a transformação, células vegetais ou
agrupamentos celulares são selecionados pela presença de um ou mais marcadores que são codificados por gene expressáveis em plantas co- transferidos com o gene de interesse, após o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o 20 material vegetal obtido na transformação é, como regra, submetido a condições seletivas para que plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas da maneira acima descrita podem ser plantadas e, após um período de crescimento inicial, submetidas a uma seleção adequada por borrifo. Uma possibilidade adicional 25 consiste em cultivar sementes, se apropriado após esterilização, em placas de Agar usando um agente de seleção adequado para que apenas das sementes transformadas possam crescer plantas. Senão, as plantas transformadas são triadas pela presença de um marcador selecionável tal como aqueles descritos acima. Após a transferência de DNA e regeneração, plantas putativamente transformadas também podem ser avaliadas, por exemplo, usando análise de Southern, pela presença do gene de interesse, número de cópias e/ou organização genômica. Senão ou adicionalmente, níveis de 5 expressão do DNA recém-introduzido podem ser monitorados usando análise de Northern ou Western, ambas as técnicas sendo bem conhecidas por pessoas que têm conhecimento ordinário da técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como por propagação clonal ou técnicas de 10 reprodução clássicas. Por exemplo, uma primeira geração (ou Tl) de plantas transformadas pode ser autocruzadas e segunda geração (ou T2) homozigota de transformantes selecionada e as plantas T2 podem então ser propagadas adicionalmente através de técnicas de reprodução clássicas.
Os organismos transformados gerados podem tomar uma 15 variedade de formas. Por exemplo, eles podem ser quimeras ou células transformadas e células não transformadas; transformantes clonais (p. ex., todas as células transformadas para conter o cassete de expressão); enxertos de tecidos transformados e não transformados (p. ex., em plantas, um rizoma transformado enxertado em um rebento não transformado).
A presente invenção claramente estende-se a qualquer célula
vegetal ou planta produzida por quaisquer dos métodos aqui descritos e a todas as partes e propágulos vegetais dessa. A presente invenção se estende adicionalmente para abranger a progênie de uma planta inteira, órgão, tecido ou célula transfectada ou transformada primária que foi produzida por 25 quaisquer dos métodos acima mencionados, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelos progenitores nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo um ácido nucleico isolado codificando uma VPE conforme definido aqui acima. Células hospedeiras preferidas de acordo com a invenção são células vegetais. Plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, para o cassete ou construção ou vetor de expressão são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídios usados no método inventivo.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta.
Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes de forragem, plantas ornamentais, colheitas alimentícias, árvores ou arbustos. De acordo com uma modalidade preferida da presente invenção, a planta é uma planta de colheita. Exemplos de plantas de colheita incluem soja, girassol, colza, alfafa, canola, algodão, tomate, batata e tabaco. De preferência adicional, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana de açúcar. De maior preferência, a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milhete, centeio, sorgo e aveia.
A invenção também se estende para partes colhíveis de uma planta tal como, mas não limitando a, sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção além disso se relaciona a produtos derivados, de preferência diretamente derivados, de uma parte colhível de tal planta, tal como sedimentados secos ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.
De acordo com uma característica preferida da invenção, a expressão modulada é expressão aumentada. Métodos para aumentar a expressão de ácidos nucleicos ou genes, ou produtos gênicos, são bem documentados na técnica e incluem, por exemplo, superexpressão direcionada por promotores apropriados, o uso de intensificadores de transcrição ou intensificadores de tradução. Ácidos nucleicos isolados que servem como elementos intensificadores ou promotores podem ser introduzidos em uma posição apropriada (tipicamente a montante) de uma forma não heteróloga de um polinucleotídio para supra-regular a expressão. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção e/ou substituição (veja, Kmiec, Pat. U.S. No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada a partir de um gene da presente invenção para controlar a expressão do gene.
Se a expressão polipeptídica é desejada, é geralmente desejável incluir uma região de poliadenilação na extremidade 3’ de uma região codificante polinucleotídica. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência da extremidade 3 ’ a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou senão de outro gene vegetal, ou de menor preferência de qualquer outro gene eucariótico.
Conforme acima mencionado, um método preferido para modular (de preferência, aumentar) a expressão de um ácido nucleico que codifica uma VPE é pela introdução e expressão em uma planta de um ácido nucleico que codifica uma VPE; entretanto, os efeitos da realização do método, isto é, da intensificação de características relacionadas a rendimento também podem ser alcançados usando outras técnicas bem conhecidas. Uma descrição de algumas dessas técnicas se seguirá agora.
Uma de tais técnicas é etiquetagem de ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), que envolve a inserção de T- DNA, geralmente contendo um promotor (também pode ser um intensificador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb a montante ou jusante da região codificante de um gene em uma configuração tal que o promotor direcione a expressão do gene alvo. Tipicamente, a regulação de expressão do gene alvo por seu promotor natural é interrompida e o gene cai sob o controle do promotor recém-introduzido. O promotor está tipicamente incrustado em um T-DNA. Este T-DNA é inserido aleatoriamente 5 no genoma vegetal, por exemplo, através de infecção por Agrobacterium e leva à expressão modificada de gene próximos ao T-DNA inserido. As plantas transgênicas resultantes exibem fenótipos dominantes devido à expressão modificada de genes próximos ao promotor introduzido.
Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Direcionadas em Genomas); para uma descrição da mesma veja a seção de “definições”.
Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga; para uma descrição da mesma veja a seção de “definições”.
A presente invenção também abrange o uso de ácidos
nucleicos que codificam VPEs conforme aqui descrito e o uso dessas VPEs na intensificação de qualquer das características relacionadas a rendimento acima mencionadas em plantas.
Ácidos nucleicos que codificam VPEs descritas aqui, ou as 20 VPEs por elas mesmas, podem ser úteis em programas de reprodução em que é identificado um marcador de DNA que pode estar ligado geneticamente a um gene que codifica VPE. Os ácidos nucleicos/genes, ou as proteínas de VPE por elas mesmas podem ser usadas para definir um marcador molecular. Este marcador protéico ou de DNA pode então ser usado em programas de 25 reprodução para selecionar plantas que têm características relacionadas a rendimento intensificadas conforme definido aqui acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene que codifica uma proteína VPE também podem ser úteis em programas de reprodução assistidos por marcador. Tais programas de reprodução às vezes requerem a introdução de variação alélica por tratamento mutagênico das plantas, usando, por exemplo, mutagênese EMS; senão, o programa pode iniciar-se com uma coleção de variantes alélicas de origem também chamada “natural” causada 5 involuntariamente. A identificação de variantes alélicas então ocorre, por exemplo, por PCR. Esta é seguida por uma etapa para a seleção de variantes alélicas superiores da seqüência em questão e que dão rendimento aumentado. A seleção é tipicamente efetuada por monitoração de desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em 10 questão. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas em que a variante alélica superior foi identificada com outra planta. Isto poderia ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.
Ácidos nucleicos que codificam VPEs também podem ser
usados como sondas para mapear geneticamente e fisicamente os genes dos quais eles fazem parte e como marcadores para características ligadas àqueles genes. Tal informação pode ser útil em reprodução vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos 20 que codificam VPE requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídios de comprimento. Os ácidos nucleicos que codificam VPE podem ser usados como marcadores de polimorfismo por comprimento de fragmento de restrição (RFLP). Transferências de Southern (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de 25 DNA genômico vegetal digerido por restrição podem ser sondadas com os ácidos nucleicos que codificam VPE. Os padrões de bandeamento resultantes podem então ser submetidos a análises genéticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174- 181) a fim de construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar transferências de Southern contendo DNAs genômicos tratados com endonuclease de restrição de um grupo de indivíduos que representam progenitores e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é anotado e usado para calcular a posição do ácido nucleico que codifica VPE no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético é descrito em Bematzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones de DNA específicos usando a metodologia delineada acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações de retrocruzamento, populações acasaladas aleatoriamente, linhagens quase isogênicas e outros grupos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na técnica.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (isto é, colocação de seqüências em mapas físicos; veja Hoheisel et al., em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências citadas a esse respeito).
Em outra modalidade, as sondas de ácido nucleico podem ser usadas em mapeamento por hibridização in situ com fluorescência direta (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora, métodos atuais de mapeamento por FISH favoreçam o uso de clones grandes (vários kb até várias centenas de kb; veja Laan et al., (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir a realização de mapeamento por FISH usando sondas menores.
Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser efetuada usando os ácidos nucleicos. Exemplos incluem amplificação alelo-específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al., (1993) Genomics 16:325-332), ligação alelo-específica (Landegren et al. (1988) Science 241:1077-1080), reações de prolongamento nucleotídico (Sokolov (1990) Nucleic Acid Res. 18:3671), mapeamento híbrido por radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e mapeamento feliz (happy mapping) (Dear e Cook (1989) Nucleic Acid Res. 17:6795-6807). Para esses métodos, a seqüência de um ácido nucleico é usada para desenhar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de prolongamento de iniciador. O desenho de tais iniciadores é bem conhecido por aqueles versados na técnica. Em métodos que empregam mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os progenitores do cruzamento do mapeamento na região correspondente à seqüência do ácido nucleico imediato. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas que têm características relacionadas a rendimento intensificado, como descrito anteriormente. Essas características também pode ser combinadas com outras características vantajosas economicamente tal como características que intensificam rendimento adicionalmente, tolerância a outros estresses abióticos e bióticos, características que modificam várias características arquitetônicas e/ou características bioquímicas e/ou fisiológicas.
(ii) CCAl
Surpreendentemente, descobriu-se agora que modular a expressão de um ácido nucleico que codifica um polipeptídio semelhante a CCAl em uma planta dá plantas que têm características relacionadas a rendimento intensificado em relação a plantas controle, em particular rendimento de semente intensificado. A classe particular de polipeptídios semelhantes a CCAl adequados para intensificar características relacionadas a rendimento em plantas é descrito em detalhe abaixo.
A presente invenção provê um método para intensificar características relacionadas a rendimento, em particular rendimento de semente, em plantas em relação a plantas controle, compreendendo modular a expressão em uma planta de um ácido nucleico que codifica um polipeptídio semelhante a CCAl.
Qualquer referência daqui por diante a uma “proteína útil nos métodos da invenção” é tomada como significando um polipeptídio semelhante a CCAl conforme aqui definido. Qualquer referência daqui por diante a um “ácido nucleico útil nos métodos da invenção” é tomada como significando um ácido nucleico capaz de codificar tal polipeptídio semelhante a CCAl.
Os termos “polipeptídio” e “proteína” são conforme definido aqui na seção de Definições. Os termos “polinucleotídio(s)”, “sequência(s) de ácido nucleico”, “sequência(s) nucleotídica(s)” também são conforme aqui definido. O termo “planta controle” também é definido aqui acima.
Um método preferido para modular (de preferência, aumentar) a expressão de um ácido nucleico que codifica uma proteína útil nos métodos da invenção é introduzir e expressar em uma planta um ácido nucleico que codifica uma proteína útil nos métodos da invenção conforme definido abaixo.
O ácido nucleico a ser introduzido em uma planta (e, portanto, útil na realização dos métodos da invenção) é qualquer ácido nucleico que codifica o tipo de proteína que será descrito agora, daqui em diante também nomeado “ácido nucleico semelhante a CCA7” ou “gene semelhante a CCA7”. Um polipeptídio “semelhante a CCA1” conforme aqui definido se refere a qualquer fator de transcrição MYB da classe SHAQKYF. Fatores de transcrição MYB são bem conhecidos na técnica, uma recente descrição geral de fatores de transcrição MYB em arroz e Arabidopsis thaliana é dada em Yanhui et al. (Plant Mol. Biol 60, 107-124, 2006), divulgação que é incorporada aqui como referência. Fatores de transcrição regulam a expressão 5 gênica e compreendem pelo menos um domínio de ligação a DNA e um domínio de ativação/repressão. O domínio de ligação a DNA MYB geralmente é composto de uma até três repetições imperfeitas, cada uma com cerca de 52 aminoácidos que adotam uma conformação de hélice-volta-hélice que se intercala na fenda principal do DNA. Cada repetição MYB 10 compreende três resíduos de triptofano espaçados regularmente que participam de um agrupamento hidrofóbico e que se postula estejam envolvidos no reconhecimento específico de DNA.
Proteínas semelhantes a CCAl conforme aqui definido compreendem um domínio SANT (definido em SMART como SM00717, InterPro IPR001005, veja a Figura 1), que está envolvido no reconhecimento de um motivo de DNA específico, a seqüência YAAC(G/T)G (em que Y simboliza C ou T).
O domínio SANT compreende de preferência motivo 1 e/ou
motivo 2:
Motivo I, SEQ ID NO: 141:
W(T/S)(E/D/A/P/T/R)(G/E/P/Q/D/A/N/Y)E(H/Q)(D/E/N/R/K/ Q/A/S )(K/R/L/M/T/N/Q)F (L/I/V /M)(E/D/Q/I/L/V /M/T / A/R/H)( A/S/G)(L/I/ M)(Q/H/I/K/R/S/E/D/N)(L/M/K/R/Q/V/T)(F/Y/H/V/L/F)(D/G)(R/K/E)
De preferência, motivo 1 tem a seqüência W(T/S)(E/D/A)(G/E/P/Q/D/A)EH(D/E/N/R/K/Q/A)(K/R/L)F(
L/I/V)(E/D/Q/I)(A/S)(L/I)(Q/H/I/K/R)(L/M/K)(F/Y/H)(D/G)R De maior preferência, motivo 1 tem a seqüência WT(E/D)(E/P/Q/D)EH(D/N/K/Q)(K/R)F(L/I)(E/D/Q)AL(Q/H /I/K/R)L(F/Y/H)(D/G)R Da maior preferência, motivo 1 tem a seqüência WTEEEHNRFIEALRL Y GR Motivo 2, SEQ ID NO: 142
(F/H/Y/C/L)(V/I)(G/A/K/T/V/S/R)(S/T)(K/R)(T/N/S)(V/T/A/
P/S)(I/V/T/M/R/E/A)Q(I/V)(R/A/S)(S/M)(H/Y)(A/Y)(Q/D)(K/Y/N)(Y/H/F)(
F/K/C)(L/T/S/A/I/R/H)
De preferência, motivo 2 tem a seqüência (F/H/Y)(V/I)(G/A)(S/T)K(T/N/S)(V/T/A)(I/V)QIRSHAQK(Y /H/F )F (L/T /S/A)
Da maior preferência, motivo 2 tem a seqüência HV ATKT AV QIRSHAQKFF S
De preferência, a proteína semelhante a CCAl útil nos métodos da presente invenção também compreende motivo 3 e/ou motivo 4: Motivo 3, SEQ ID NO: 143: PP(P/Q)(R/Y/L)(P/H)(K/R/P) Motivo 4, SEQ ID NO: 144: ATVAAA(S/T)AWWA De preferência adicional, a proteína semelhante a CCAl útil nos métodos da presente invenção também compreende motivo 5, SEQ ID NO: 145: DRSS(C/S)GSNT.
Uma pessoa versada na técnica poderia prontamente determinar se uma seqüência de aminoácidos em questão cai dentro da definição de um polipeptídio “semelhante a CCA1” usando técnicas conhecidas e software para a feitura de uma árvore filogenética, tal como um pacote CLUSTAL, EBI ou GCG, usando parâmetros padrões. Um método preferido para construir uma árvore filogenética é o método descrito por Yanhui et al., (2006). Qualquer seqüência que se agrupa com a subfamília semelhante a CCAl conforme definido por Yanhui et al., seria considerada como caindo na definição acima mencionada de um polipeptídio semelhante a CCAl e seria considerada adequada para uso nos métodos da invenção.
Exemplos de proteínas úteis nos métodos da invenção e ácidos nucleicos que codificam as mesmas são dados abaixo na tabela A do Exemplo 1.
Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências de aminoácidos dadas na tabela A do Exemplo 5 1. “Homólogos” são conforme definido na seção de Definições acima aqui.
Também úteis nos métodos da invenção são derivados dos polipeptídios dados na tabela A do Exemplo 1 ou ortólogos ou parálogos de quaisquer das SEQ ID Nos anteriormente mencionadas. O termo “derivados” sendo conforme definido aqui. Particularmente preferidos são derivados de 10 SEQ ID NO: 2 ou derivados dos polipeptídios dados na tabela A do Exemplo 1. Derivados úteis nos métodos da presente invenção de preferência têm atividades biológica e funcional similares à proteína não modificada a partir da qual eles são derivados.
A invenção é ilustrada por plantas transformantes com a 15 seqüência de ácido nucleico de Arabidopsis thaliana representada pela SEQ ID NO: 1, que codifica a seqüência polipeptídica de SEQ ID NO: 2, entretanto, a realização da invenção não está restrita a essas seqüências. Os métodos da invenção podem vantajosamente ser realizados usando qualquer ácido nucleico que codifica uma proteína útil nos métodos da invenção 20 conforme aqui definido, incluindo ortólogos e parálogos, tais como quaisquer seqüências de ácido nucleico dadas na tabela A do Exemplo 1.
As seqüências de aminoácidos dadas na tabela A do Exemplo
1 podem ser consideradas como sendo ortólogas e parálogas ao polipeptídio semelhante a CCAl representado pela SEQ ID NO: 2, ortólogos e parálogos sendo conforme aqui definido.
Ortólogos e parálogos podem facilmente serem encontrados pela realização de uma também chamada pesquisa blast recíproca. Tipicamente, esta envolve um primeiro BLAST envolvendo fazer um BLAST de uma seqüência de dúvida (por exemplo, usando quaisquer das seqüências listadas na tabela A do Exemplo 1) contra qualquer banco de dados de seqüências, tal como o banco de dados do NCBI disponível publicamente. BLASTN ou BLASTX (usando valores padrões) são usados geralmente quando se parte de uma seqüência nucleotídica e BLASTP ou TBLASTN 5 (usando valores padrões) quando se parte de uma seqüência proteica. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências completas dos resultados filtrados ou dos resultados não filtrados são então submetidas a BLAST reverso (segundo BLAST) contra seqüências do organismo a partir do qual a seqüência de dúvida é derivada (quando a 10 seqüência de dúvida for SEQ ID NO: I ou SEQ ID NO: 2, o segundo BLAST seria portanto contra seqüências de Arabidopsis thaliana). Os resultados do primeiro e segundo BLASts são então comparados. Um parálogo é identificado se um sucesso de alta classificação do primeiro blast for da mesma espécie que aquela da qual a seqüência de dúvida é derivada, um 15 BLAST reverso então resulta idealmente na seqüência de dúvida como o sucesso mais alto; um ortólogo é identificado se um sucesso de alta classificação no primeiro blast não for da mesma espécie que aquela da qual a seqüência dúvida é derivada e de preferência resulta no BLAST reverso na seqüência de dúvida estando entre os sucessos mais altos.
Sucessos de alta classificação são aqueles que têm um baixo
valor de E. Quanto menor o valor de E, mais significativa a pontuação (ou em outras palavras, menor a chance de que o sucesso seja obtido por acaso). A computação do valor de E é bem conhecida na técnica. Além dos valores de E, comparações também são pontuadas por identidade porcentual. Identidade 25 porcentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de neighbour joining, para auxiliar a visualizar o agrupamento de genes relacionados e identificar ortólogos e parálogos. A Tabela A do Exemplo 1 dá exemplos de ortólogos e parálogos da proteína semelhante a CCAl representada pela SEQ ID NO: 2. Ortólogos e parálogos adicionais podem prontamente ser identificados usando o procedimento de BLAST descrito acima.
As proteínas da invenção são identificáveis pela presença do domínio SANT conservado e de um ou mais dos motivos 3 até 5 (mostrados na Figura I). O termo “domínio” se refere a um grupo de aminoácidos conservados em posições específicas ao longo de um alinhamento de seqüências de proteínas relacionadas evolutivamente. Embora aminoácidos em outras posições possam variar entre homólogos, aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que são essenciais na estrutura, estabilidade ou atividade de uma proteína. Identificados pelo alto grau de conservação deles em seqüências alinhadas de uma família de homólogos protéicos, eles podem ser usados como identificadores para determinar se qualquer polipeptídio em questão pertence a uma família polipeptídica previamente identificada (neste caso, as proteínas úteis nos métodos da invenção e ácidos nucleicos que codificam as mesmas conforme aqui definido).
O termo “motivo”, “seqüência consenso” e “assinatura” são conforme aqui definido. O termo “domínio” também é definido aqui.
Bancos de dados de especialista existem para a identificação de domínios, por exemplo, SMART (Schultz et al (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242- 244), InterPro (Mulder et al, (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), ou Pfam (Bateman et al., Nueleic Acids Research 30(1): 276-280 (2002)). Um grupo de ferramentas para análise in silico de seqüências de proteínas está disponível no servidor de proteômica ExPASY (hospedado pelo Instituto Suíço de Bioinformática (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)).
Domínios também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (isto é, abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de intervalos. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403- 10) calcula a identidade de seqüência porcentual e desempenha uma análise estatística da similaridade entre as duas seqüências. O programa para desempenhar análise de BLAST está publicamente disponível através do Centro Nacional para Informação em Biotecnologia (NCBI). Homólogos podem prontamente serem identificados usando, por exemplo, o algoritmo de alinhamento de seqüências múltiplas ClustalW (versão 1.83), com os parâmetros de alinhamento para a par padrões e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de programas MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Editoração manual menor pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como seria evidente a uma pessoa versada na técnica. Além disso, em vez de usar seqüências completas para a identificação de homólogos, domínios específicos (tal como o domínio SANT, ou um dos motivos definidos acima) também podem ser usados. Os valores de identidade de seqüências, que são indicados abaixo no Exemplo 3 como um porcentual foram determinados para a seqüência de aminoácidos ou de ácido nucleico inteira e/ou para domínios 5 selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrões.
Além disso, proteínas semelhantes a CCAl (pelo menos na sua forma nativa) tipicamente tem atividade de ligação a DNA. Uma pessoa versada na técnica pode facilmente determinar a presença de atividade de 10 ligação a DNA ou ativação transcricional usando ferramentas e técnicas de rotina. Para determinar a atividade de ligação ao DNA de proteínas semelhantes a CCAl vários ensaios estão disponíveis (por exemplo, Current Protocols in Molecular Biology, Volumes 1 e 2, Ausubel et al., (1994), Current Protocols). Em particular, um ensaio de ligação a DNA para fatores
jje
de transcrição semelhantes a CCAl usando o fragmento A2 do gene Lhcbl 3 é descrito em Wang et al., (Plant Cell 9, 497-507, 1197). Maiores detalhes são providos no Exemplo 6.
Ácidos nucleicos que codificam proteínas úteis nos métodos da invenção não precisam ser ácidos nucleicos completos, visto que a 20 realização dos métodos da invenção não depende do uso de seqüências de ácido nucleico completas. Exemplos de ácidos nucleicos adequados para uso na realização dos métodos da invenção incluem as seqüências de ácido nucleico dadas na tabela A do Exemplo 1, mas não estão limitados àquelas seqüências. Variantes de ácido nucleico também podem ser úteis na prática 25 dos métodos da invenção. Exemplos de tais variantes de ácido nucleico incluem porções de ácidos nucleicos que codificam uma proteína útil nos métodos da invenção, ácidos nucleicos que se hibridizam com ácidos nucleicos que codificam uma proteína útil nos métodos da invenção, variantes de splice de ácidos nucleicos que codificam uma proteína útil nos métodos da invenção, variantes alélicas de ácidos nucleicos que codificam uma proteína útil nos métodos da invenção e variantes de ácidos nucleicos que codificam uma proteína útil nos métodos da invenção que são obtidos por embaralhamento gênico. Os termos porção, seqüência de hibridização, 5 variante de splice, variante alélica e embaralhamento gênico serão agora descritos.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer 10 uma das seqüências de ácido nucleico dadas na Tabela A do Exemplo 1, ou uma porção de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas na Tabela A do Exemplo 1.
Porções úteis nos métodos da invenção codificam um 15 polipeptídio caindo na definição de um ácido nucleico que codifica uma proteína útil nos métodos da invenção conforme aqui definido e que tem consideravelmente a mesma atividade biológica que as seqüências de aminoácidos dadas na Tabela A do Exemplo I. De preferência, a porção é uma porção de qualquer um dos ácidos nucleicos dados na Tabela A do 20 Exemplo I. A porção tem tipicamente pelo menos 1200 nucleotídeos consecutivos de comprimento, de preferência pelo menos 1400 nucleotídeos consecutivos de comprimento, de maior preferência pelo menos 1600 nucleotídeos consecutivos de comprimento e da maior preferência pelo menos 1800 nucleotídeos consecutivos de comprimento, os nucleotídeos 25 consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na Tabela A do Exemplo I. Da maior preferência, a porção é uma porção do ácido nucleico de SEQ ID NO: I. De preferência, a porção codifica uma seqüência de aminoácidos compreendendo um domínio SANT conforme aqui definido. Uma porção de um ácido nucleico que codifica uma proteína semelhante a CCAl conforme aqui definido pode ser preparada, por exemplo, pela feitura de uma ou mais deleções do ácido nucleico. As porções podem ser usadas de forma isolada ou elas podem ser fusionadas a outras seqüências codificantes (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combine várias atividades. Quando fusionado a outras seqüências codificantes, o polipeptídio resultante produzido na tradução pode ser maior que aquele previsto para a porção proteica.
Outra variante de ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de se hibridizar, sob condições de estringência reduzida, de preferência sob condições estringentes, com um ácido nucleico codificando uma proteína semelhante a CCAl conforme aqui definido, ou com uma porção conforme aqui definido. O termo “hibridização” é conforme definido aqui acima.
Seqüências de hibridização úteis nos métodos da invenção codificam um polipeptídio que tem um domínio SANT (veja o alinhamento da Fig. 2) e que tem consideravelmente a mesma atividade biológica que a proteína semelhante a CCAl representada por quaisquer das seqüências de aminoácidos dadas na Tabela A do Exemplo I. A seqüência de hibridização tem tipicamente pelo menos 1200 nucleotídeos consecutivos de comprimento, de preferência pelo menos 1400 nucleotídeos consecutivos de comprimento, de maior preferência pelo menos 1600 nucleotídeos consecutivos de comprimento e da maior preferência pelo menos 1800 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na Tabela A do Exemplo 1. De preferência, a seqüência de hibridização é uma que é capaz de se hibridizar com qualquer um dos ácidos nucleicos dados na Tabela A do Exemplo 1, ou com uma porção de quaisquer dessas seqüências, uma porção sendo conforme definida acima. Da maior preferência, a seqüência de hibridização é capaz de se hibridizar com um ácido nucleico representado pela SEQ ID NO: 1 ou com uma porção desta. De preferência, a seqüência de hibridização codifica uma seqüência de aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios conforme aqui definidos.
5 De acordo com a presente invenção, é provido um método para
intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de se hibridizar com qualquer um dos ácidos nucleicos dados na tabela do Exemplo 1, ou compreendendo introduzir e expressar em uma planta um 10 ácido nucleico capaz de se hibridizar com um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de ácidos nucleicos dadas na tabela do Exemplo 1.
Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de splice codificando uma proteína semelhante a CCAl conforme definida aqui acima, o termo “variante de splice” sendo conforme aqui definida.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de splice 20 de qualquer uma das seqüências de ácido nucleico dadas na Tabela A do Exemplo 1, ou uma variante de splice de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela A do Exemplo 1.
Variantes de splice preferidas são variantes de splice de um 25 ácido nucleico representado pela SEQ ID NO: 1, ou uma variante de splice de um ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2. De preferência, a seqüência de aminoácidos codificada pela variante de splice compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos. Outra variante de ácido nucleico útil na realização dos métodos da invenção é uma variante alélica de um ácido nucleico que codifica uma proteína semelhante a CCAl conforme definida aqui acima, o termo “variante alélica” sendo conforme aqui definido. As variantes alélicas úteis nos métodos da presente invenção têm consideravelmente a mesma atividade biológica que a proteína semelhante a CCAl de SEQ ID NO: 2.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados na Tabela A do Exemplo 1, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela A do Exemplo 1.
De preferência, a variante alélica é uma variante alélica de SEQ ID NO: 1 ou uma variante alélica de um ácido nucleico que codifica um ortólogo ou parálogo de SEQ ID NO: 2. De preferência, a seqüência de aminoácidos codificada pela variante alélica compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos.
Uma variante de ácido nucleico adicional útil nos métodos da invenção é uma variante de ácido nucleico que codifica proteínas semelhantes a CCAl conforme definido acima, variante que é obtida por embaralhamento gênico; “embaralhamento gênico” ou “evolução dirigida” são conforme definido aqui.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácido nucleico dados na Tabela A do Exemplo 1, ou compreendendo introduzir e expressar em uma planta uma variante de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela A do Exemplo 1, ácido nucleico variante que é obtido por embaralhamento gênico. De preferência, o ácido nucleico variante obtido por embaralhamento gênico codifica uma seqüência de aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios conforme aqui definido.
Além disso, variantes de ácido nucleico também podem ser obtidas por mutagênese sítio-dirigida. Vários métodos estão disponíveis para alcançar a mutagênese sítio-dirigida, os mais comuns sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Ácidos nucleicos codificando proteínas semelhantes a CCAl
podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana intencional. De preferência, o ácido nucleico codificando semelhante a CCAl é de uma 15 planta, de preferência adicional de uma planta dicotiledônea, de maior preferência da família Brassicaceae, da maior preferência o ácido nucleico é de Arabidopsis thaliana.
Qualquer referencia aqui a uma proteína semelhante a CCAl é tomada, portanto, como significando uma proteína semelhante a CCAl conforme definido acima. Qualquer ácido nucleico que codifica tal proteína semelhante a CCAl é adequado para uso na realização dos métodos da invenção.
A presente invenção também abrange plantas ou partes (incluindo sementes) obteníveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico que codifica uma proteína semelhante a CCAl conforme definido acima.
A invenção também provê construções genéticas e vetores para facilitar a introdução e/ou a expressão das seqüências de ácido nucleico úteis nos métodos de acordo com a invenção, em uma planta. As construções gênicas podem ser inseridas em vetores, que podem estar disponíveis comercialmente, adequados para transformação em plantas e adequadas para expressão do gene de interesse nas células transformadas. A invenção também provê uso de uma construção gênica conforme aqui definido nos métodos da invenção.
Mais especificamente, a presente invenção provê uma construção compreendendo:
(a) um ácido nucleico codificando uma proteína semelhante a CCAl conforme definido acima;
(b) uma ou mais seqüências controle capazes de direcionar a expressão da seqüência de ácido nucleico de (a) e opcionalmente
(c) uma seqüência de término de transcrição.
Plantas são transformadas com a seqüência de interesse (isto é, um ácido nucleico codificando polipeptídio semelhante a CCAl conforme aqui definido). O técnico versado está bem consciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar de modo bem-sucedido células hospedeiras contendo a seqüências de interesse. A seqüência de interesse está ligada operacionalmente a uma ou mais seqüências controle (pelo menos a um promotor). Os termos “elemento regulatório”, “seqüência controle” e “promotor” são conforme definido aqui acima. O termo “ligado operacionalmente” também é conforme aqui definido.
Vantajosamente, qualquer tipo de promotor pode ser usado para direcionar a expressão da seqüência de ácido nucleico.
O promotor pode ser um promotor constitutivo. O termo “promotor constitutivo” é conforme aqui definido e exemplos de promotores constitutivos também são dados aqui na seção de Definições. Senão, o promotor pode ser um promotor induzível, conforme definido aqui na seção de Definições. Adicionalmente ou senão, o promotor pode ser um promotor órgão-específico ou tecido-específico, também conforme aqui definido.
De preferência, o ácido nucleico semelhante a CCAl ou variante deste está ligado operacionalmente a um promotor constitutivo. Um promotor constitutivo preferido é um que também é consideravelmente e 5 ubiquamente expresso. De preferência adicional, o promotor é derivado de uma planta, de maior preferência de uma planta monocotiledônea. O Mais preferido é o uso de um promotor GOS2 (de preferência de arroz) (SEQ ID NO: 146). Deve estar claro que a aplicabilidade da presente invenção não está restrita ao ácido nucleico semelhante a CCAl representado pela SEQ ID NO: 10 1, nem a aplicabilidade da invenção está restrita à expressão de um ácido nucleico semelhante a CCAl quando direcionado por um promotor GOS2. Exemplos de outros promotores constitutivos que também podem ser usados para direcionar a expressão de um ácido nucleico semelhante a CCAl são mostrados aqui na seção de Definições.
E considerado que o aumento no rendimento também será
obtido quando o ácido nucleico semelhante a CCAl ou variante deste estiver ligado operacionalmente a um promotor específico de tecido verde. Exemplos de promotores específicos de tecido verde são providos aqui na seção de Definições.
Para a identificação de promotores funcionalmente
equivalentes, a força do promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, pela ligação operacional do promotor a um gene repórter e avaliação do nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos 25 adequados incluem, por exemplo, beta-glicuronidase ou beta-galactosidase. A atividade promotora é avaliada pela medição da atividade enzimática da beta- glicuronidase ou beta-galactosidase. A força do promotor e/ou padrão de expressão podem então ser comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Senão, a força do promotor pode ser avaliada pela quantificação de níveis de mRNA ou pela comparação dos níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA dos genes estruturais tal como de rRNA 18S, usando métodos conhecidos na técnica, tal como 5 transferência de Northern com análise densitométrica de auto-radiogramas, PCR em tempo real quantitativo ou RT-PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente, por “promotor fraco” entende-se um promotor que direciona a expressão de uma seqüência codificante para um nível baixo. Por “nível baixo” entendem-se níveis de cerca de 1/10.000 10 transcritos até cerca de 1/100.000 transcritos, até cerca de 1/500.000 transcritos por célula. No sentido inverso, um “promotor forte” direciona a expressão de uma seqüência codificante para um nível alto, ou para cerca de 1/10 transcritos até cerca de 1/100 transcritos até cerca de 1/1.000 transcritos por célula.
Opcionalmente, uma ou mais seqüências terminadoras podem
ser usadas na construção introduzida em uma planta, o termo “terminador” sendo conforme aqui definido. Elementos regulatórios adicionais podem incluir intensificadores transcricionais assim como traducionais. Aqueles versados na técnica terão consciência de seqüências terminadoras e 20 intensificadoras que podem ser adequadas para uso na realização da invenção. Tais seqüências seriam conhecidas ou poderiam ser prontamente obtidas por uma pessoa versada na técnica.
Uma seqüência intrônica também pode ser adicionada na região 5’ não traduzida (UTR) ou na seqüência codificante para aumentar a 25 quantidade da mensagem madura que se acumula no citosol. Demonstrou-se que a inclusão de um íntron processável por splice na unidade de transcrição tanto em construções de expressão vegetais como animais aumenta a expressão gênica tanto em níveis de mRNA como protéicos até 1000 vezes (Buchman e Berg, Mol. Cell Biol. 8:4395-4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal intensificação por íntron da expressão gênica é tipicamente a maior quando colocado próximo da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntrons de Adhl-S 1, 2 e 6, o íntron Bronze-I é conhecido na técnica. Para informação geral, veja The Maize 5 Handbook, Capítulo 116, Freeling e Walbot, Eds., Springer, N.Y. (1994).
Outras seqüências controle (além de regiões promotora, intensificadora, silenciadora, 3’UTR e/ou 5’UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências seriam conhecidas ou podem ser prontamente obtidas por uma pessoa versada na técnica.
As construções genéticas da invenção podem incluir
adicionalmente uma seqüência de origem de replicação que é necessária para a manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando é necessária que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (p. ex., molécula de 15 plasmídio ou cosmídio). Origens de replicação preferidas incluem, mas não estão limitadas a, o fl-ori e colEl.
Para a detecção da transferência bem-sucedida das seqüências de ácido nucleico conforme usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo esses ácidos nucleicos, é vantajoso usar 20 genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Os termos “marcador selecionável”, “gene de marcador selecionável” ou “gene repórter” são conforme definido aqui acima.
Sabe-se que na integração estável ou transiente de ácidos 25 nucleicos em células vegetais, apenas uma minoria das células pega o DNA estranho e, se desejado, integra ele em seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar esses integrantes, um gene codifícante de um marcador selecionável (tal como aqueles descritos acima) geralmente é introduzido nas células hospedeiras junto com o gene de interesse. Esses marcadores podem, por exemplo, ser usados em mutantes em que esses genes não são funcionais, por exemplo, por deleção por métodos convencionais. Além disso, moléculas de ácido nucleico que codificam um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a seqüência que codifica os polipeptídios da invenção ou usados nos métodos da invenção, senão em um vetor separado. Células que foram transfectadas estavelmente com o ácido nucleico introduzido podem ser identificadas, por exemplo, por seleção (por exemplo, células que integraram o marcador selecionável sobrevivem enquanto as outras células morrem).
Visto que genes de marcadores, particularmente genes de resistência a antibióticos e herbicidas, não são mais necessários ou são indesejáveis na célula hospedeira transgênica uma vez que os ácidos nucleicos forem introduzidos satisfatoriamente, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente emprega técnicas que permitem a remoção ou excisão desses genes de marcadores. Um de tais métodos é o que é conhecido como co-transformação. O método de co- transformação emprega dois vetores simultaneamente para a transformação, um vetor portando o ácido nucleico de acordo com a invenção e um segundo portando o(s) gene(s) de marcador(es). Uma grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes) ambos os vetores. No caso de transformação com agrobactérias os transformantes geralmente recebem apenas uma parte do vetor, isto é, a seqüência flanqueada pelo T-DNA, que geralmente representa o cassete de expressão. Os genes marcadores podem subsequentemente ser removidos da planta transformada pela realização de cruzamentos. Em outro método, genes de marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecido como a tecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte de transposase ou os transformantes são transformados com uma construção de ácido nucleico que confere expressão de uma transposase, transientemente ou estável. Em alguns casos (aproximadamente 10%), o transposon salta do genoma da célula hospedeira uma vez que a transformação tenha ocorrido 5 satisfatoriamente e é perdido. Em um número de casos adicionais, o transposon salta para uma localização diferente. Nesses casos o gene de marcador deve ser eliminado pela realização de cruzamentos. Em microbiologia, foram desenvolvidas técnicas que tomam possível, ou facilitam, a detecção de tais eventos. Um método vantajoso adicional depende 10 do que é conhecido como sistemas de recombinação; cuja vantagem é que a eliminação por cruzamento pode ser dispensada. O melhor sistema conhecido deste tipo é aquele conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene de marcador estiver integrado entre as seqüências IoxP, ele é 15 removido uma vez que a transformação tenha ocorrido satisfatoriamente, pela expressão da recombinase. Sistemas de recombinação adicionais são o sistema HIN/HIX, FLP/FRT e REP/STB (Tribble et al, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al, J. Cell Biol., 149, 2000: 553-566). Uma integração sítio-específica no genoma vegetal das seqüências de ácido 20 nucleico de acordo com a invenção é possível. Naturalmente, esses métodos também podem ser aplicados a microorganismos tais como levedura, fungos ou bactérias.
A invenção também provê um método para a produção das plantas transgênicas que têm características relacionadas a rendimento intensificadas em relação a plantas controle, compreendendo a introdução e expressão em uma planta de qualquer ácido nucleico codificanto uma proteína semelhante a CCAl como definido aqui acima.
Para os fins da invenção, “transgênico”, “transgene” ou “recombinante” é conforme definido aqui na seção de Definições. É considerado que a introdução de cópias múltiplas de um cassete de expressão que ocorre naturalmente conforme descrito acima também poderia ser útil nos métodos da presente invenção.
Mais especificamente, a presente invenção provê um método 5 para a produção de plantas transgênicas que têm rendimento aumentado, método o qual compreende:
(i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico semelhante a CCA1 ou variante deste e
(ii) cultivar a célula vegetal sob condições que promovem crescimento e desenvolvimento vegetal.
O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na planta por si só (incluindo a introdução em um tecido, ógão ou qualquer outra parte de uma planta). De acordo com a característica preferida da presente invenção, o ácido nucleico é introduzido de preferência em uma planta por transformação.
O termo “introdução” ou “transformação” é definido aqui na seção de Definições. As células vegetais modificadas geneticamente podem ser regeneradas através de todos os métodos com os quais o trabalhador versado está familiarizado. Métodos adequados podem ser encontrados na 20 publicações acima mencionadas de S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
Geralmente após a transformação, células vegetais ou agrupamentos celulares são selecionados pela presença de um ou mais marcadores que são codificados por genes expressáveis em plantas co- 25 transferidos com o gene de interesse, após o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como regra, submetido a condições seletivas para que plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas da maneira acima descrita podem ser plantadas e, após um período de crescimento inicial, submetidas a uma seleção adequada por borrifo. Uma possibilidade adicional consiste em cultivar sementes, se apropriado após esterilização, em placas de Agar usando um agente de seleção adequado para que apenas das sementes transformadas possam crescer plantas. Senão, as plantas transformadas são tríadas pela presença de um marcador selecionável tal como aqueles descritos acima.
Após a transferência de DNA e regeneração, plantas putativamente transformadas também podem ser avaliadas, por exemplo, usando análise de Southern, pela presença do gene de interesse, número de cópias e/ou organização genômica. Senão ou adicionalmente, níveis de expressão do DNA recém-introduzido podem ser monitorados usando análise de Northern ou Western, ambas as técnicas sendo bem conhecidas por pessoas que têm conhecimento ordinário da técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como por propagação clonal ou técnicas de reprodução clássicas. Por exemplo, uma primeira geração (ou Tl) de plantas transformadas pode ser autocruzadas e transformantes de segunda geração (ou T2) homozigota selecionada e as plantas T2 podem então ser propagadas adicionalmente através de técnicas de reprodução clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, eles podem ser quimeras ou células transformadas e células não transformadas; transformantes clonais (p. ex., todas as células transformadas para conter o cassete de expressão); enxertos de tecidos transformados e não transformados (p. ex., em plantas, um rizoma transformado enxertado em um rebento não transformado).
A presente invenção claramente estende-se a qualquer célula vegetal ou planta produzida por quaisquer dos métodos aqui descritos e a todas as partes e propágulos vegetais dessa. A presente invenção se estende adicionalmente para abranger a progênie de uma planta inteira, órgão, tecido ou célula transfectada ou transformada primária que foi produzida por quaisquer dos métodos acima mencionados, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) 5 que aquelas produzidas pelos progenitores nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo um ácido nucleico isolado codificando uma proteína semelhante a CCAl conforme definido aqui acima. Células hospedeiras preferidas de acordo com a invenção são células vegetais.
Plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, para o cassete ou construção ou vetor de expressão são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídios usados no método inventivo.
Uma planta transgênica para as finalidades da invenção é, por
conseguinte entendida como significando, como acima, que ácidos nucleicos usados no método da invenção não estão em seu loco natural no genoma da citada planta, sendo possível para os ácidos nucleicos serem expressos homologamente ou heterologamente. Entretanto, como mencionado, 20 transgênico também significa que, embora os ácidos nucleicos de acordo com a invenção ou usados no método inventivo estejam em suas posições naturais no genoma de uma planta, a seqüência foi modificada com respeito à seqüência natural e/ou que as seqüências regulatórias das seqüências naturais foram modificadas. Transgênico é de preferência entendido como 25 significando a expressão dos ácidos nucleicos de acordo com a invenção em um loco artificial no genoma, isto é, a expressão homóloga ou, de preferência, heteróloga dos ácidos nucleicos ocorre. Plantas transgênicas preferidas são mencionadas aqui.
A invenção também se estende a partes colhíveis de uma planta tais como, mas não limitando a, sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção, além disso, se relaciona a produtos derivados, de preferência diretamente derivados, de uma parte colhível de tal planta, tal como sedimentados secos ou pós, óleo, gordura e ácidos graxos, 5 amido ou proteínas.
De acordo com uma característica preferida da invenção, a expressão modulada é expressão aumentada. Métodos para aumentar a expressão de ácidos nucleicos ou genes, ou produtos gênicos, são bem documentados na técnica e incluem, por exemplo, superexpressão direcionada 10 por promotores apropriados, o uso de intensificadores de transcrição ou intensificadores de tradução. Ácidos nucleicos isolados que servem como elementos intensificadores ou promotores podem ser introduzidos em uma posição apropriada (tipicamente a montante) de uma forma não heteróloga de um polinucleotídio para supra-regular a expressão. Por exemplo, promotores 15 endógenos podem ser alterados in vivo por mutação, deleção e/ou substituição (veja, Kmiec, Pat. U.S. No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada a partir de um gene da presente invenção para controlar a expressão do gene.
Se a expressão polipeptídica é desejada, é geralmente
desejável incluir uma região de poliadenilação na extremidade 3’ de uma região codificante polinucleotídica. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência da extremidade 3 ’ a ser adicionada pode ser derivada, por 25 exemplo, dos genes de nopalina sintase ou octopina sintase, ou senão de outro gene vegetal, ou de menor preferência de qualquer outro gene eucariótico.
Uma seqüência intrônica também pode ser adicionada conforme acima descrito.
Outras seqüências controle (além de regiões de promotora, intensificadora, silenciadora, 3’UTR e/ou 5’UTR) podem ser elementos estabilizadores de proteína e/ou RNA.
Conforme acima mencionado, um método preferido para modular (de preferência, aumentar) a expressão de um ácido nucleico que 5 codifica uma proteína semelhante a CCAl é pela introdução e expressão em uma planta de um ácido nucleico que codifica uma proteína semelhante a CCA1; entretanto, os efeitos da realização do método, isto é, da intensificação de características relacionadas a rendimento também podem ser alcançados usando outras técnicas bem conhecidas. Uma descrição de algumas dessas 10 técnicas se seguirá agora.
Uma de tais técnicas é etiquetagem de ativação de T-DNA conforme aqui definido. Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Direcionadas em Genomas), técnica que é definida aqui na seção de 15 Definições. Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga, técnica que é conforme aqui definido.
Referência aqui a características relacionadas a rendimento é tomada como significando um aumento em biomassa (peso) de uma ou mais partes de uma planta, que podem incluir partes acima do solo (colhíveis) e/ou partes (colhíveis) abaixo do solo.
Em particular, tais partes colhíveis são sementes e a realização dos métodos da invenção resulta em plantas que têm rendimento de semente aumentado em relação ao rendimento de semente de plantas controle adequadas.
Os termos “rendimento” e “rendimento de semente” conforme
aqui definido e os termos “aumentar”, “melhora” ou “melhorar” também são conforme aqui definido.
Tomando milho como exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento do número de plantas estabelecidas por hectare ou acre, um aumento do número de espigas por planta, um aumento do número de fileiras, número de semente por fileira, peso de semente, peso de cem sementes, comprimento/diâmetro de espiga, aumento na taxa de preenchimento de semente (que é o número de sementes 5 preenchidas dividido pelo número total de sementes e multiplicado por 100), entre outros. Tomando arroz como exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculo) por panícula (que é 10 expresso como uma razão do número de sementes preenchidas sobre o número de panículas primárias), aumento na taxa de preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), aumento em peso de cem sementes, entre outros.
Visto que plantas transgênicas de acordo com a presente
invenção tem rendimento aumentado, é provável que essas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte do ciclo de vida delas), em relação à taxa de crescimento de plantas controle em um estágio correspondente no ciclo de vida delas. A taxa de crescimento 20 aumentada pode ser específica para um ou mais partes de uma planta (incluindo sementes), ou pode ser consideravelmente pela planta inteira. Plantas que têm uma taxa de crescimento aumentado podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser tomado como significando o tempo necessário para crescer de uma semente madura seca até 25 o estágio onde a planta tenha produzido sementes maduras secas, similar ao material de partida. O ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, índice de verdor, tempo de floração e velocidade de maturação de semente. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante consideravelmente o ciclo de vida da planta inteira. Taxa de crescimento aumentada durante os estágios iniciais do ciclo de vida de uma planta pode refletir vigor aumentado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais 5 tarde e/ou colhidas mais cedo que seria possível de outro modo (um efeito similar pode ser obtido com tempo de floração mais precoce). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz seguida por semeadura e colheita de plantas de 10 arroz adicionais todos dentro de um período de crescimento convencional). De modo similar, se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes de diferentes espécies de plantas (por exemplo, a semeadura e colheita de plantas de milho seguida, por exemplo, pela semeadura e colheita opcional de soja, batata ou qualquer outra 15 planta adequada). Colher em momentos adicionais o mesmo rizoma no caso de algumas plantas de colheita também pode ser possível. Alterar o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por acre (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um 20 aumento na taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais larga que as equivalentes selvagens delas, visto que as limitações territoriais para crescimento de uma colheita são frequentemente por condições ambientais adversas ou no momento do plantio (estação inicial) ou no momento da colheita (estação tardia). Tais condições 25 adversas podem ser evitadas se o ciclo de colheita for encurtado. A taxa de crescimento pode ser determinada pela derivação de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo tomado por plantas para alcançar 50% do tamanho máximo delas) e T-90 (tempo tomado por plantas para alcançar 90% do tamanho máximo delas) entre outros.
De acordo com uma característica preferida da presente invenção, o desempenho dos métodos da invenção dá plantas que têm uma taxa de crescimento aumentada em relação a plantas controle. Portanto de 5 acordo com a presente invenção, é provido um método para aumentar a taxa de crescimento de plantas, método o qual compreende modular a expressão, de preferência aumentar a expressão, em uma planta de um ácido nucleico que codifica uma proteína semelhante a CCAl conforme aqui definido.
Um aumento no rendimento e/ou taxa de crescimento ocorre 10 quer a planta esteja sob condições de não estresse quer a planta esteja exposta a vários estresses comparada a plantas controle. Plantas tipicamente respondem à exposição a estresse crescendo mais vagarosamente. Em condições de estresse grave, a planta pode mesmo para de crescer totalmente. Estresse leve por outro lado é definido aqui como sendo qualquer estresse ao 15 qual uma planta é exposta que não resulta na cessação total de crescimento pela planta sem a capacidade de retomar o crescimento. Estresse leve no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos de 40%, 35% ou 30%, de preferência menos de 25%, 20% ou 15%, de maior preferência menos de 14%, 13%, 12%, 11% ou 10% 20 ou menos em comparação com a planta controle sob condições de não estresse. Devido a avanços em práticas da agricultura (irrigação, fertilização, tratamentos com pesticida) estresses graves não são encontrados frequentemente em plantas de colheita cultivadas. Como conseqüência, o crescimento comprometido induzido por estresse leve frequentemente é uma 25 característica indesejável para agricultura. Estresses leves são os estresses bióticos e/ou abióticos (ambientais) de todo dia a que a planta está exposta. Estresses abióticos podem ocorrer devido à seca ou excesso de água, estresses anaeróbico, estresse salino, toxicidade química, estresse oxidativo e calor, frio ou temperaturas de congelamento. O estresse abiótico pode ser um estresse osmótico causado por um estresse aquoso (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tais como bactérias, fungos e insetos.
5 Em particular, os métodos da presente invenção podem ser
realizados sob condições de não estresse ou sob condições de seca leve para dar plantas que têm rendimento aumentado em relação a plantas controle. Como relatado por Wang et al., (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de alterações morfológicas, fisiológicas, bioquímicas e 10 moleculares que afetam adversamente o crescimento e a produtividade vegetais. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por estarem interligados e podem induzir danos ao crescimento e celulares através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descrevem um grau particularmente alto de 15 “diafonia” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando em interrupção de homeostase e distribuição iônica na célula. Estresse oxidativo, que frequentemente acompanha estresse por seca, salinidade ou temperatura alta ou baixa, pode causar desnaturação de 20 proteínas funcionais e estruturais. Como conseqüência, esses diversos estresses ambientais frequentemente ativam respostas celulares e vias de sinalização celular similares, tais como a produção de proteínas de estresse, supra-regularão de antioxidantes, acúmulo de solutos compatíveis e detenção de crescimento. O termo condições de “não estresse” conforme aqui utilizado 25 se refere àquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na técnica têm consciência de condições de solo normal e condições climáticas para uma dada localização.
A realização dos métodos da invenção dá plantas cultivadas sob condições de não estresse ou sob condições de seca leve com rendimento aumentado em relação a plantas controle adequadas cultivadas sob condições comparáveis. Portanto de acordo com a presente invenção, é provido um método para aumentar o rendimento de plantas cultivadas sob condições de não estresse ou sob condições de seca leve, método que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídio semelhante a CCAl.
Em uma modalidade preferida da invenção, o aumento no rendimento e/ou taxa de crescimento ocorre de acordo com os métodos da presente invenção sob condições de não estresse.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta, o termo “planta” sendo conforme aqui definido.
De acordo com uma modalidade preferida da presente invenção, a planta é uma planta de colheita. Exemplos de plantas de colheita incluem soja, girassol, colza, alfafa, canola, algodão, tomate, batata e tabaco. De preferência adicional, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana de açúcar. De maior preferência, a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milhete, centeio, sorgo e aveia.
A presente invenção também abrange o uso de ácidos nucleicos que codificam a proteína semelhante a CCAl aqui descrita e o uso dessas proteínas semelhantes a CCAl na intensificação de características relacionadas a rendimento em plantas.
Ácidos nucleicos que codificam a proteína semelhante a CCAl descrita aqui, ou as proteínas semelhantes por elas mesmas, podem ser úteis em programas de reprodução em que é identificado um marcador de DNA que pode estar ligado geneticamente a um gene que codifica semelhante a CCAl. Os ácidos nucleicos/genes, ou as proteínas semelhantes a CCAl por elas mesmas podem ser usadas para definir um marcador molecular. Este marcador protéico ou de DNA pode então ser usado em programas de reprodução para selecionar plantas que têm características relacionadas a rendimento intensificadas conforme definido aqui acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene que codifica proteína semelhante a CCAl também podem ser úteis em programas de reprodução assistidos por marcador. Tais programas de reprodução às vezes requerem a introdução de variação alélica por tratamento mutagênico das plantas, usando, por exemplo, mutagênese EMS; senão, o programa pode iniciar-se com uma coleção de variantes alélicas de origem também chamada “natural” causada involuntariamente. A identificação de variantes alélicas então ocorre, por exemplo, por PCR. Esta é seguida por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que dão rendimento aumentado. A seleção é tipicamente efetuada por monitoração de desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas em que a variante alélica superior foi identificada com outra planta. Isto poderia ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.
Ácidos nucleicos que codificam proteínas semelhante a CCAl também podem ser usados como sondas para mapear geneticamente e fisicamente os genes dos quais eles fazem parte e como marcadores para características ligadas àqueles genes. Tal informação pode ser útil em reprodução vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos que codificam proteína semelhante a CCAl requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídios de comprimento. Os ácidos nucleicos que codificam proteína semelhante a CCAl podem ser usados como marcadores de polimorfismo por comprimento de fragmento de restrição (RFLP). Transferências de Southern (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição podem ser sondadas com os ácidos nucleicos que codificam proteína semelhante a CCAl. Os padrões de bandeamento resultantes podem então ser submetidos a análises genéticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar transferências de Southern contendo DNAs genômicos tratados com endonuclease de restrição de um grupo de indivíduos que representam progenitores e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é anotado e usado para calcular a posição do ácido nucleico que codifica proteína semelhante a CCAl no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético é descrito em Bematzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones de DNA específicos usando a metodologia delineada acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações de retrocruzamento, populações acasaladas aleatoriamente, linhagens quase isogênicas e outros grupos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na técnica.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (isto é, colocação de seqüências em mapas físicos; veja Hoheisel et al, em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências citadas a esse respeito).
Em outra modalidade, as sondas de ácido nucleico podem ser usadas em mapeamento por hibridização in situ com fluorescência direta (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora, métodos atuais de mapeamento por FISH favoreçam o uso de clones grandes (vários kb até várias centenas de kb; veja Laan et al., (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir a realização de mapeamento por FISH usando sondas menores.
Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser efetuada usando os ácidos nucleicos. Exemplos incluem amplificação alelo-específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al., (1993) Genomics 16:325-332), ligação alelo-específica (Landegren et al. (1988) Science 241:1077-1080), reações de prolongamento nucleotídico (Sokolov (1990) Nucleic Acid Res. 18:3671), mapeamento híbrido por radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e mapeamento feliz (happy mapping) (Dear e Cook (1989) Nucleic Acid Res. 17:6795-6807). Para esses métodos, a seqüência de um ácido nucleico é usada para desenhar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de prolongamento de iniciador. O desenho de tais iniciadores é bem conhecido por aqueles versados na técnica. Em métodos que empregam mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os progenitores do cruzamento do mapeamento na região correspondente à seqüência do ácido nucleico imediato. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas que têm características relacionadas a rendimento intensificado, como descrito anteriormente. Essas características também pode ser combinadas com outras características vantajosas economicamente tal como características que intensificam rendimento adicionalmente, tolerância a outros estresses abióticos e bióticos, características que modificam várias características arquitetônicas e/ou características bioquímicas e/ou fisiológicas.
(iii) SAP
Surpreendentemente, descobriu-se agora que modular a expressão de um ácido nucleico que codifica um polipeptídio semelhante a SAP em uma planta dá plantas que têm características relacionadas a rendimento intensificado em relação a plantas controle.
De acordo com uma primeira modalidade, a presente invenção provê um método para intensificar características relacionadas a rendimento em plantas em relação a plantas controle, compreendendo modular a expressão em uma planta de um ácido nucleico que codifica um polipeptídio semelhante a SAP.
A presente invenção também provê até este ponto ácidos nucleicos que codificam semelhante a SAP e polipeptídios semelhantes a SAP desconhecidos. Essas seqüências também sendo úteis na realização dos métodos da invenção.
De acordo com uma modalidade adicional da presente invenção, é provido, portanto, uma molécula de ácido nucleico isolado compreendendo:
(i) um ácido nucleico representado por SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID
NO: 222, SEQ ID NO: 224 e SEQ ID NO: 226;
(ii) o complemento de qualquer um das SEQ ID Nos dadas em
0);
(iii) um ácido nucleico que codifica um polipeptídio semelhante a SAP que tem, em ordem crescente de preferência, pelo menos
70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de seqüência com qualquer uma das seqüências de aminoácidos dada em SEQ ID NO: 213, SEQ ID NO: 215 e SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225 e SEQ ID NO: 227;
(iv) um ácido nucleico capaz de se hibridizar sob condições estringentes com qualquer um dos ácidos nucleicos dados em (i), (ii) ou (iii) acima.
De acordo com uma modalidade adicional da presente
invenção, também é provido um polipeptídio isolado compreendendo:
(i) uma seqüência de aminoácidos representada por qualquer uma das SEQ ID NO: 213, SEQ ID NO: 215 e SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225 e SEQ ID
10 NO: 227;
(ii) uma seqüência de aminoácidos que têm, em ordem crescente de preferência, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%», 97%), 98%», 99% ou 100% de identidade de seqüência com qualquer uma das seqüências de aminoácidos dada em SEQ ID NO: 213, SEQ ID NO: 215 e
■ 15 SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225 e SEQ ID NO: 227;
(iii) derivados de quaisquer das seqüências de aminoácidos dadas em (i) ou (ii) acima.
Um método preferido para modular (de preferência, aumentar) 20 a expressão de um ácido nucleico codificando um polipeptídio semelhante a SAP é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídio semelhante a SAP.
Qualquer referência daqui por diante a uma “proteína útil nos métodos da invenção” é tomada como significando uma um polipeptídio 25 semelhante a SAP conforme aqui definido. Qualquer referência daqui por diante a um “ácido nucleico útil nos métodos da invenção” é tomada como significando um ácido nucleico capaz de codificar tal polipeptídio semelhante a SAP. O ácido nucleico a ser introduzido em uma planta (e, portanto, útil na realização dos métodos da invenção) é qualquer ácido nucleico codificando o tipo de proteínas que será descrita agora, daqui em diante também nomeado “ácido nucleico semelhante a SAP” ou “gene semelhante a SAP”.
Um “polipeptídio semelhante a SAP” conforme aqui definido se refere a qualquer polipeptídio compreendendo o seguinte domínio de SAP:
(i) Motivo I (SEQ ID NO: 240):
XLS SLKVXELREL AKSRGIKG Y SKMKKXEL VELL S, em que X é qualquer aminoácido; ou
(ii) um motivo que tem em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% ou mais de
identidade de seqüência com o motivo 1; ou
(iii) um motivo que tem em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 100% de identidade de seqüência com o motivo 1 conforme ele aparece na SEQ ID NO: 211: DLSTLKVTELRELAKSRGIKGYSKMKKNDLVELLS (SEQ ID
NO: 243).
Adicionalmente, um polipeptídio semelhante a SAP pode
compreender:
(i) Motivo 2 (SEQ ID NO: 241): EKxEIVELFKKVQxxLRxRAxxKxExKxxxExAKAQxxxExxTVDSLLxLLR
KHSxDQxKK, em que X é qualquer aminoácido; ou
(ii) um motivo que tem em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%», 80%, 85%, 90% ou 95% ou mais de identidade de seqüência com o motivo 2; ou
(iii) um motivo que tem em ordem crescente de preferência
pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 100% de
identidade de seqüência com o motivo 2 conforme ele aparece na SEQ ID NO: 211:
EKEIVELFKRVQAQLRARGKGKEEKKPEQAKAQGERGSVDSLLNLLR KHSVDQRRK (SEQ ID NO: 244); e/ou (iv) Motivo 3 (SEQ ID NO: 242): RPxSxFxRRSPVP, em que X é qualquer aminoácido; ou
(v) um motivo que tem em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% ou mais de identidade de seqüência com o motivo 3; ou
(vi) um motivo que tem em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 100% de identidade de seqüência com o motivo 3 conforme ele aparece na SEQ ID NO: 211: RPASNFRRRSPVP (SEQ ID NO: 245).
Os termos “domínio” e “motivo” são definidos aqui na seção de “definições”. Bancos de dados de especialista existem para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242- 244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002)). Um grupo de ferramentas para análise in silico de seqüências de proteínas está disponível no servidor de proteômica ExPASY (hospedado pelo Instituto Suíço de Bioinformática (Gasteiger et al., ExPASy: the proteomies server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). Domínios também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências.
Métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (isto é, abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de intervalos. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula a identidade de seqüência porcentual e desempenha uma análise estatística da similaridade entre as duas seqüências. O programa para desempenhar análise de BLAST está publicamente disponível através do Centro Nacional para Informação em Biotecnologia (NCBI). Homólogos podem prontamente serem identificados usando, por exemplo, o algoritmo de alinhamento de seqüências múltiplas ClustalW (versão 1.83), com os parâmetros de alinhamento para a par padrões e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de programas MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Editoração manual menor pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como seria evidente a uma pessoa versada na técnica. Além disso, em vez de usar seqüências completas para a identificação de homólogos, domínios específicos também podem ser usados. Os valores de identidade de seqüências, que são indicados abaixo na seção de Exemplos como um porcentual foram determinados para a seqüência de aminoácidos ou de ácido nucleico inteira e/ou para domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrões.
Além disso, polipeptídios semelhantes a SAP (pelo menos na forma nativa delas) tem tipicamente atividade de ligação a DNA. Ferramentas e técnicas para medir a atividade de ligação a DNA são bem conhecidas na técnica; um de tais exemplos é dado aqui na seção de Exemplos.
A presente invenção é ilustrada por plantas transformantes com a seqüência de ácido nucleico representada pela SEQ ID NO: 210, que codifica a seqüência polipeptídica de SEQ ID NO: 211. Entretanto, a realização da invenção não está restrita a essas seqüências; os métodos da invenção podem vantajosamente serem realizados usando qualquer ácido nucleico que codifique semelhante a SAP ou polipeptídio semelhante a SAP conforme aqui definido.
Exemplos de ácidos nucleicos codificando polipeptídio semelhante a SAP são dados aqui na Tabela Cl. Tais ácidos nucleicos são úteis na realização dos métodos da invenção. As seqüências de aminoácidos dadas na Tabela Cl são seqüências de exemplo de ortólogos e parálogos do polipeptídio semelhante a SAP representado pela SEQ ID NO: 211, os termos “ortólogos” e “parálogos” sendo conforme aqui definido. Ortólogos e parálogos adicionais podem prontamente serem identificados pela realização de uma também chamada pesquisa blast recíproca. Tipicamente, esta envolve um primeiro BLAST envolvendo fazer um BLAST de uma seqüência de dúvida (por exemplo, usando quaisquer das seqüências listadas na Tabela Cl) contra qualquer banco de dados de seqüências, tal como o banco de dados do NCBI disponível publicamente. BLASTN ou BLASTX (usando valores padrões) são usados geralmente quando se parte de uma seqüência nucleotídica e BLASTP ou TBLASTN (usando valores padrões) quando se parte de uma seqüência proteica. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências completas dos resultados filtrados ou dos resultados não filtrados são então submetidas a BLAST reverso (segundo BLAST) contra seqüências do organismo a partir do qual a seqüência de dúvida é derivada (quando a seqüência de dúvida for SEQ ID NO: 210 ou SEQ ID NO: 211, o segundo BLAST seria portanto contra seqüências de arroz). Os resultados do primeiro e segundo BLASts são então comparados. Um parálogo é identificado se um sucesso de alta classificação do primeiro blast for da mesma espécie que aquela da qual a seqüência de dúvida é derivada, um BLAST reverso então resulta idealmente na seqüência de dúvida como o sucesso mais alto; um ortólogo é identificado se um sucesso de alta classificação no primeiro blast não for da mesma espécie que aquela da qual a seqüência dúvida é derivada e de preferência resulta no BLAST reverso na seqüência de dúvida estando entre os sucessos mais altos.
Sucessos de alta classificação são aqueles que tem um baixo valor de E. Quanto menor o valor de E, mais significativa a pontuação (ou em outras palavras, menor a chance de que o sucesso seja obtido por acaso). A computação do valor de E é bem conhecida na técnica. Além dos valores de E, comparações também são pontuadas por identidade porcentual. Identidade porcentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de neighbour joining, para auxiliar a visualizar o agrupamento de genes relacionados e identificar ortólogos e parálogos.
Variantes de ácido nucleico também podem ser úteis na prática dos métodos da invenção. Exemplos de tais variantes incluem ácidos nucleicos que codificam homólogos e derivados de qualquer uma das seqüências de aminoácidos dadas na Tabela Cl, os termos “homólogo” e “derivado” sendo conforme aqui definido. Também úteis nos métodos da invenção são ácidos nucleicos codificando homólogos e derivados de ortólogos ou parálogos de qualquer uma das seqüências de aminoácidos dadas na Tabela Cl. Homólogos e derivados úteis nos métodos da presente invenção tem consideravelmente a mesma atividade biológica e funcional que a proteína não modificada a partir da qual eles foram derivados.
Variantes de ácido nucleico adicionais úteis na prática dos métodos da invenção incluem porções de ácidos nucleicos codificando polipeptídios semelhantes a SAP, ácidos nucleicos que se hibridizam com ácidos nucleicos codificando polipeptídios semelhantes a SAP, variantes de splice de ácidos nucleicos codificando polipeptídios semelhantes a SAP, variantes alélicas de ácidos nucleicos codificando polipeptídios semelhantes a SAP e variantes de ácidos nucleicos codificando polipeptídios semelhantes a SAP obtidas por embaralhamento gênico. Os termos seqüência de hibridização, variante de splice, variante alélica e embaralhamento gênico são conforme aqui descrito.
Ácidos nucleicos codificando polipeptídios semelhantes a SAP não precisam ser ácidos nucleicos completos, visto que a realização dos métodos da invenção não depende do uso de seqüências de ácido nucleico completas. De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácido nucleico dadas aqui na Tabela Cl na seção de Exemplos, ou uma porção de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas na Tabela Cl.
Uma porção de um ácido nucleico pode ser preparada, por exemplo, fazendo-se uma ou mais deleções no ácido nucleico. As porções podem ser usadas de forma isolada ou elas podem ser fusionadas a outras seqüências codificantes (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combine várias atividades. Quando fusionado a outras seqüências codificantes, o polipeptídio resultante produzido na tradução pode ser maior que aquele previsto para a porção proteica.
Porções úteis nos métodos da invenção codificam polipeptídios semelhantes a SAP conforme aqui definido e tem consideravelmente a mesma atividade biológica que as seqüências de aminoácidos dadas na Tabela Cl. De preferência, a porção de qualquer um dos ácidos nucleicos dados na Tabela Cl, é uma porção de um ácido nucleico que codifica ou um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas na Tabela Cl. A fim de realizar os métodos da invenção, a porção precisa apenas codificar um domínio SAP conforme aqui definido, isto é, codificar:
(a) Motivo 1, (SEQ ID NO: 240): XLS SLKVXELREL AKSRGIKG Y SKMKKXEL VELL S, em que X é
qualquer aminoácido; ou
(b) um motivo que tem em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% ou mais de identidade de seqüência com o motivo 1; ou
(c) um motivo que tem em ordem crescente de preferência
pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 100% de identidade de seqüência com o motivo 1 conforme ele aparece na SEQ ID NO: 211: DLSTLKVTELRELAKSRGIKGYSKMKKNDLVELLS (SEQ ID NO: 243).
A porção, portanto, precisa apenas estar em cerca de 100
nucleotídios consecutivos de comprimento, contanto que aqueles 100 nucleotídios consecutivos codifiquem um domínio SAP conforme aqui definido. De preferência, a porção codifica um polipeptídio compreendendo o domínio SAP conforme aqui definido e Motivos 2 e Motivos 3 conforme aqui 20 definido. De preferência, a porção tem, em ordem crescente de preferência, pelo menos 200, 300, 400, 500, 600, 700, 800, 900, 1.000, 1.100 nucleotídios consecutivos de comprimento, os nucleotídios consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na Tabela Cl, ou de um ácido nucleico que codifica um ortólogo ou parálogo de qualquer uma das 25 seqüências de aminoácidos dadas na Tabela Cl. Da maior preferência, a porção é uma porção do ácido nucleico de SEQ ID NO: 210. De preferência, a porção codifica uma seqüência de aminoácidos compreendendo (qualquer um ou mais dos domínios aqui definidos). De preferência, a porção codifica uma seqüência de aminoácidos que quando usada na construção de um árvore filogenética, tal como aquela retratada na Fig. 10, tende a se agrupar com o grupo de polipeptídios semelhantes a SAP compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 211 em vez de com qualquer outro grupo.
Outra variante de ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de se hibridizar, sob condições de estringência reduzida, de preferência sob condições estringentes, com um ácido nucleico codificando um polipeptídio semelhante a SAP conforme aqui definido, ou com uma porção conforme aqui definido.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de se hibridizar com qualquer um dos ácidos nucleicos dados na Tabela Cl, ou compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de se hibridizar com um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de ácidos nucleicos dadas na Tabela Cl.
Seqüências de hibridização úteis nos métodos da invenção codificam um polipeptídio semelhante a SAP conforme aqui definido e tem consideravelmente a mesma atividade biológica que as seqüências de aminoácidos dadas na Tabela Cl. De preferência, a seqüência de hibridização é capaz de se hibridizar com qualquer um dos ácidos nucleicos dados na Tabela Cl, ou com uma porção de quaisquer dessas seqüências, uma porção sendo conforme definido acima, ou em que a seqüência de hibridização é capaz de se hibridizar com um ácido nucleico codificando um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas na Tabela C1. Da maior preferência, a seqüência de hibridização é capaz de se hibridizar com um ácido nucleico representado pela SEQ ID NO: 210 ou com uma porção deste. De preferência a seqüência de hibridização codifica uma seqüência de aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios conforme aqui definidos. A fim de realizar os métodos da invenção, a seqüência de hibridização precisa apenas codificar um domínio SAP conforme aqui definido, isto é, codificar:
(a) Motivo 1, (SEQ ID NO: 240): XLSSLKVXELRELAKSRGIKGYSKMKKXELVELLS, em que X é qualquer aminoácido; ou
(b) um motivo que tem em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% ou mais de identidade de seqüência com o motivo 1; ou
(c) um motivo que tem em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 100% de identidade de seqüência com o motivo 1 conforme ele aparece na SEQ ID NO: 211: DLSTLKVTELRELAKSRGIKGYSKMKKNDLVELLS (SEQ ID NO: 243).
De preferência, a seqüência de hibridização codifica uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 10, tende a se aglomerar ao grupo de polipeptídios semelhantes a SAP compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 211 em vez de a qualquer outro grupo.
Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de splice codificando um polipeptídio semelhante a SAP conforme definida aqui acima, uma variante de splice sendo conforme aqui definido.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de splice de qualquer uma das seqüências de ácido nucleico dadas na Tabela Cl, ou uma variante de splice de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela Cl.
Variantes de splice preferidas são variantes de splice de um ácido nucleico representado pela SEQ ID NO: 210, ou uma variante de splice de um ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 211. De preferência, a seqüência de aminoácidos codificada pela variante de splice compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos. A fim de realizar os métodos da invenção, a variante de splice precisa apenas codificar um domínio SAP conforme aqui definido. De preferência, a seqüência de aminoácidos codificada pela variante de splice, quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 10, tende a se aglomerar ao grupo de polipeptídios semelhantes a SAP compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 211 em vez de a qualquer outro grupo.
Outra variante de ácido nucleico útil na realização dos métodos da invenção é uma variante alélica de um ácido nucleico que codifica um polipeptídio semelhante a SAP conforme definida aqui acima, uma variante alélica sendo conforme aqui definido.
De acordo com a presente invenção, é provido um método para
intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados na Tabela Cl, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido 25 nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela Cl.
As variantes alélicas úteis nos métodos da presente invenção tem consideravelmente a mesma atividade biológica que o polipeptídio semelhante a SAP de SEQ ID NO: 211 e quaisquer dos aminoácidos retratados na Tabela Cl. Variantes alélicas existem na natureza e o uso desses alelos naturais é abrangido pelos métodos da presente invenção. De preferência, a variante alélica é uma variante alélica de SEQ ID NO: 210 ou uma variante alélica de um ácido nucleico que codifica um ortólogo ou parálogo de SEQ ID NO: 211. De preferência, o aminoácido codificado pela variante alélica compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos. A fim de realizar os métodos da invenção, a variante alélica precisa apenas codifica um domínio de SAP conforme aqui definido. De preferência, a seqüência de aminoácidos codificada pela variante alélica, quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 10, tende a se aglomerar ao grupo de polipeptídios semelhantes a SAP compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 211 em vez de a qualquer outro grupo.
Embaralhamento gênico ou evolução dirigida também podem ser usadas para gerar variantes de ácidos nucleicos codificando polipeptídios semelhantes a SAP conforme definido acima; o termo “embaralhamento gênico” sendo conforme aqui definido.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácido nucleico dadas na Tabela Cl, ou compreendendo introduzir e expressar em uma planta uma variante de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela Cl, tal ácido nucleico variante é obtido por embaralhamento gênico.
De preferência, o ácido nucleico variante obtido por embaralhamento gênico codifica uma seqüência de aminoácidos compreendendo qualquer um dos motivos ou domínios conforme aqui definido. A fim de realizar os métodos da invenção, o ácido nucleico variante precisa apenas codificar um domínio SAP conforme aqui definido. De preferência, a seqüência de aminoácidos codificada pelo ácido nucleico variante obtido por embaralhamento gênico, quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 10, tende a se aglomerar ao grupo de polipeptídios semelhantes a SAP compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 211 em vez de a qualquer outro grupo.
Além disso, variantes de ácido nucleico também podem ser obtidas por mutagênese sítio-dirigida. Vários métodos estão disponíveis para alcançar a mutagênese sítio-dirigida, os mais comuns sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Ácidos nucleicos codificando polipeptídios semelhantes a SAP podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana intencional. De preferência, o ácido nucleico codificando polipeptídio semelhante a SAP é de uma planta, de preferência adicional de uma planta monocotiledônea, de maior preferência da família Poaceae, da maior preferência o ácido nucleico é de Oryza sativa.
A realização dos métodos da invenção dá plantas tendo características relacionadas a rendimento intensificado. Em particular, a realização dos métodos da invenção dá plantas tendo rendimento aumentado, especialmente rendimento de semente aumentado em relação a plantas controle. Os termos “rendimento” e “rendimento de semente” são descritos em maiores detalhes aqui na seção de “definições”.
Aqui, referência a características relacionadas a rendimento intensificado é tomada como significando um aumento da biomassa (peso) de uma ou mais partes de uma planta, que podem incluir partes acima do solo (colhíveis) e/ou partes (colhíveis) abaixo do solo. Em particular, tais partes colhíveis são sementes e a realização dos métodos da invenção resulta em plantas que têm rendimento de semente aumentado em relação ao rendimento de semente de plantas controle adequadas.
Tomando milho como exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento do número de plantas estabelecidas por hectare ou acre, um aumento do número de espigas por planta, um aumento do número de fileiras, número de semente por fileira, peso de semente, peso de cem sementes, comprimento/diâmetro de espiga, aumento na taxa de preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), entre outros. Tomando arroz como exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculo) por panícula (que é expresso como uma razão do número de sementes preenchidas sobre o número de panículas primárias), aumento na taxa de preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), aumento em peso de cem sementes, entre outros.
A presente invenção provê um método para aumentar rendimento, especialmente rendimento de semente de plantas, em relação a plantas controle, método o qual compreende modular expressão, de preferência aumentar a expressão, em uma planta de um ácido nucleico que codifica um polipeptídio semelhante a SAP conforme aqui definido.
Visto que plantas transgênicas de acordo com a presente invenção tem rendimento aumentado, é provável que essas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte do ciclo de vida delas), em relação à taxa de crescimento de plantas controle em um estágio correspondente no ciclo de vida delas. A taxa de crescimento aumentada pode ser específica para um ou mais partes de uma planta (incluindo sementes), ou pode ser consideravelmente pela planta inteira. Plantas que têm uma taxa de crescimento aumentado podem ter um ciclo de vida mais curto. O ciclo de 5 vida de uma planta pode ser tomado como significando o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta tenha produzido sementes maduras secas, similar ao material de partida. O ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, índice de verdor, tempo de floração e velocidade de maturação 10 de semente. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante consideravelmente o ciclo de vida da planta inteira. Taxa de crescimento aumentada durante os estágios iniciais do ciclo de vida de uma planta pode refletir vigor aumentado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta 15 permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que seria possível de outro modo (um efeito similar pode ser obtido com tempo de floração mais precoce). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz 20 seguida por semeadura e colheita de plantas de arroz adicionais todos dentro de um período de crescimento convencional). De modo similar, se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes de diferentes espécies de plantas (por exemplo, a semeadura e colheita de plantas de milho seguida, por exemplo, pela 25 semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Colher em momentos adicionais o mesmo rizoma no caso de algumas plantas de colheita também pode ser possível. Alterar o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por acre (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento na taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais larga que as equivalentes selvagens delas, visto que as limitações territoriais para crescimento de uma colheita são 5 frequentemente por condições ambientais adversas ou no momento do plantio (estação inicial) ou no momento da colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita for encurtado. A taxa de crescimento pode ser determinada pela derivação de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo tomado 10 por plantas para alcançar 50% do tamanho máximo delas) e T-90 (tempo tomado por plantas para alcançar 90% do tamanho máximo delas) entre outros.
De acordo com uma característica preferida da presente invenção, o desempenho dos métodos da invenção dá plantas que têm uma 15 taxa de crescimento aumentada em relação a plantas controle. Portanto de acordo com a presente invenção, é provido um método para aumentar a taxa de crescimento de plantas, método o qual compreende modular a expressão, de preferência aumentar a expressão, em uma planta de um ácido nucleico que codifica um polipeptídio semelhante a SAP conforme aqui definido.
Um aumento no rendimento e/ou taxa de crescimento ocorre
quer a planta esteja sob condições de não estresse quer a planta esteja exposta a vários estresses comparada a plantas controle. Plantas tipicamente respondem à exposição a estresse crescendo mais vagarosamente. Em condições de estresse grave, a planta pode mesmo para de crescer totalmente. 25 Estresse leve por outro lado é definido aqui como sendo qualquer estresse ao qual uma planta é exposta que não resulta na cessação total de crescimento pela planta sem a capacidade de retomar o crescimento. Estresse leve no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos de 40%, 35% ou 30%, de preferência menos de 25%, 20% ou 15%, de maior preferência menos de 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta controle sob condições de não estresse. Devido a avanços em práticas da agricultura (irrigação, fertilização, tratamentos com pesticida) estresses graves não são encontrados frequentemente em plantas de colheita cultivadas. Como conseqüência, o crescimento comprometido induzido por estresse leve frequentemente é uma característica indesejável para agricultura. Estresses leves são os estresses bióticos e/ou abióticos (ambientais) de todo dia a que a planta está exposta. Estresses abióticos podem ocorrer devido à seca ou excesso de água, estresses anaeróbico, estresse salino, toxicidade química, estresse oxidativo e calor, frio ou temperaturas de congelamento. O estresse abiótico pode ser um estresse osmótico causado por um estresse aquoso (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tais como bactérias, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados sob condições de não estresse ou sob condições de seca leve para dar plantas que têm rendimento aumentado em relação a plantas controle. Como relatado por Wang et al., (Planta (2003) 218: 1-14), estresse abiótico 20 leva a uma série de alterações morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente o crescimento e a produtividade vegetais. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por estarem interligados e podem induzir danos ao crescimento e celulares através de mecanismos similares. Rabbani et al. (Plant Physiol 25 (2003) 133: 1755-1767) descrevem um grau particularmente alto de “diafonia” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando em interrupção de homeostase e distribuição iônica na célula. Estresse oxidativo, que frequentemente acompanha estresse por seca, salinidade ou temperatura alta ou baixa, pode causar desnaturação de proteínas funcionais e estruturais. Como conseqüência, esses diversos estresses ambientais frequentemente ativam respostas celulares e vias de sinalização celular similares, tais como a produção de proteínas de estresse, regulação para cima de antioxidantes, acúmulo de solutos compatíveis e detenção de crescimento. O termo condições de “não estresse” conforme aqui utilizado se refere àquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na técnica tem consciência de condições de solo normal e condições climáticas para uma dada localização.
A realização dos métodos da invenção dá plantas cultivadas sob condições de não estresse ou sob condições de seca leve com rendimento aumentado em relação a plantas controle adequadas cultivadas sob condições comparáveis. Portanto de acordo com a presente invenção, é provido um método para aumentar o rendimento de plantas cultivadas sob condições de não estresse ou sob condições de seca leve, método que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídio semelhante a SAP.
A presente invenção abrange plantas ou partes destas (incluindo sementes) obteníveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico que codifica um polipeptídio semelhante a SAP conforme definido acima.
A invenção também provê construções genéticas e vetores para facilitar a introdução e/ou a expressão em plantas de ácidos nucleicos codificando polipeptídios semelhantes a SAP. As construções gênicas podem ser inseridas em vetores, que podem estar disponíveis comercialmente, adequados para transformação em plantas e adequadas para expressão do gene de interesse nas células transformadas. A invenção também provê uso de uma construção gênica conforme aqui definido nos métodos da invenção. Mais especificamente, a presente invenção provê uma construção compreendendo:
(a) um ácido nucleico codificando um polipeptídio semelhante a SAP conforme definido acima;
(b) uma ou mais seqüências controle capazes de direcionar a expressão da seqüências de ácido nucleico de (a) e opcionalmente
(c) uma seqüência de término de transcrição.
Os termos “seqüência controle” e “seqüência de término” são conforme aqui definido.
Plantas são transformadas com um vetor compreendendo quaisquer dos ácidos nucleicos descritos acima. O técnico versado está bem consciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar de modo bem-sucedido células hospedeiras contendo a seqüências de interesse. A seqüência de interesse está ligada operacionalmente a uma ou mais seqüências controle (pelo menos a um promotor).
Vantajosamente, qualquer tipo de promotor pode ser usado para direcionar a expressão da seqüência de ácido nucleico. Um promotor constitutivo é particularmente útil nos métodos, como é um promotor tecido- específico. Em particular, o promotor tecido-específico é um promotor específico de raiz ou um promotor específico de tecido verde jovem. Veja aqui a seção de “Definições” para definições dos vários tipos de promotores. Deve estar claro que a aplicabilidade da presente invenção não está restrita ao ácido nucleico que codifica polipeptídio semelhante a SAP representado pela SEQ ID NO: 210, a aplicabilidade da invenção também não está restrita à expressão de um ácido nucleico que codifica polipeptídio semelhante a SAP quando direcionado por um promotor constitutivo, um promotor específico de raiz ou um promotor específico de tecido verde jovem.
O promotor específico de tecido verde jovem é de preferência um promotor de protoclorofilídeo redutase (PcR). Exemplos de outros promotores específicos de tecido verde jovem que também podem ser usados para direcionar a expressão de um ácido nucleico que codifica semelhante a SAP são mostrados na Tabela 6 aqui na seção de “Definições”. O promotor 5 constitutivo é de preferência um promotor GOS2, de preferência um promotor GOS2 de arroz. Veja a Tabela 6 aqui na seção de “Definições” para exemplos adicionais de promotores constitutivos. O promotor específico de raiz é de preferência um promotor RCC, de preferência um promotor RCC3 (Plant Mol Biol. 1995 Jan;27(2):237-48), de maior preferência um promotor RCC3 de IO arroz, de preferência adicional como representado por uma seqüência de ácido nucleico consideravelmente similar a SEQ ID NO: 246, da maior preferência o promotor é como representado pela SEQ ID NO: 246. Veja a seção de “Definições” para exemplos adicionais de promotores específicos de raiz.
Para a identificação de promotores funcionalmente 15 equivalentes, a força do promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, pela ligação operacional do promotor a um gene repórter e avaliando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glicuronidase ou beta-galactosidase. A 20 atividade promotora é avaliada pela medição da atividade enzimática da beta- glicuronidase ou beta-galactosidase. A força do promotor e/ou padrão de expressão podem então ser comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Senão, a força do promotor pode ser avaliada pela quantificação de níveis de mRNA 25 ou pela comparação dos níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA dos genes estruturais tal como de rRNA 18S, usando métodos conhecidos na técnica, tal como transferência de Northern com análise densitométrica de auto-radiogramas, PCR em tempo real quantitativo ou RT-PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente, por “promotor fraco” entende-se um promotor que direciona a expressão de uma seqüência codificante para um nível baixo. Por “nível baixo” entende-se níveis de cerca de 1/10.000 transcritos até cerca de 1/100.000 transcritos, até cerca de 1/500.000 5 transcritos por célula. No sentido inverso, um “promotor forte” direciona a expressão de uma seqüência codifícante para um nível alto, ou para cerca de 1/10 transcritos até cerca de 1/100 transcritos até cerca de 1/1.000 transcritos por célula.
Opcionalmente, uma ou mais seqüências terminadoras podem 10 ser usadas na construção introduzida em uma planta. Elementos regulatórios adicionais podem incluir intensificadores transcricionais assim como traducionais. Aqueles versados na técnica terão consciência de seqüências terminadoras e intensificadoras que podem ser adequadas para uso na realização da invenção. Tais seqüências seriam conhecidas ou poderiam ser 15 prontamente obtidas por uma pessoa versada na técnica.
Uma seqüência intrônica também pode ser adicionada na região 5’ não traduzida (UTR) ou na seqüência codifícante para aumentar a quantidade da mensagem madura que se acumula no citosol. Demonstrou-se que a inclusão de um íntron processável por splice na unidade de transcrição 20 tanto em construções de expressão vegetais como animais aumenta a expressão gênica tanto em níveis de mRNA como protéicos até 1000 vezes (Buchman e Berg, Mol. Cell Biol. 8:4395-4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal intensificação por íntron da expressão gênica é tipicamente a maior quando colocado próximo da extremidade 5’ da unidade 25 de transcrição. Uso dos íntrons de milho íntrons de Adhl-S 1, 2 e 6, o íntron Bronze-I é conhecido na técnica. Para informação geral, veja The Maize Handbook, Capítulo 116, Freeling e Walbot, Eds., Springer, N.Y. (1994).
Outras seqüências controle (além de regiões de promotora, intensificadora, silenciadora, 3’UTR e/ou 5’UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências seriam conhecidas ou podem ser prontamente obtidas por uma pessoa versada na técnica.
As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é necessária para a manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando é necessária que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (p. ex., molécula de plasmídio ou cosmídio). Origens de replicação preferidas incluem, mas não estão limitadas a, o fl-ori e colEl.
Para a detecção da transferência bem-sucedida das seqüências de ácido nucleico conforme usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo esses ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Marcadores selecionáveis são descritos em maiores detalhes aqui na seção de “definições”.
Sabe-se que na integração estável ou transiente de ácidos nucleicos em células vegetais, apenas uma minoria das células pega o DNA estranho e, se desejado, integra ele em seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar esses integrantes, um gene codifícante de um marcador selecionável (tal como aqueles descritos acima) geralmente é introduzido nas células hospedeiras junto com o gene de interesse. Esses marcadores podem, por exemplo, ser usados em mutantes em que esses genes não são funcionais, por exemplo, por deleção por métodos convencionais. Além disso, moléculas de ácido nucleico que codificam um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a seqüência que codifica os polipeptídios da invenção ou usados nos métodos da invenção, senão em um vetor separado. Células que foram transfectadas estavelmente com o ácido nucleico introduzido podem ser identificadas, por exemplo, por seleção (por exemplo, células que integraram o marcador selecionável sobrevivem enquanto as outras células morrem).
Visto que genes de marcadores, particularmente genes de resistência a antibióticos e herbicidas, não são mais necessários ou são indesejáveis na célula hospedeira transgênica uma vez que os ácidos nucleicos forem introduzidos satisfatoriamente, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente emprega técnicas que permitem a remoção ou excisão desses genes de marcadores. Um de tais métodos é o que é conhecido como co-transformação. O método de co- transformação emprega dois vetores simultaneamente para a transformação, um vetor portando o ácido nucleico de acordo com a invenção e um segundo portando o(s) gene(s) de marcador(es). Uma grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes) ambos os vetores. No caso de transformação com agrobactérias os transformantes geralmente recebem apenas uma parte do vetor, isto é, a seqüência flanqueada pelo T-DNA, que geralmente representa o cassete de expressão. Os genes marcadores podem subsequentemente ser removidos da planta transformada pela realização de cruzamentos. Em outro método, genes de marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecido como a tecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte de transposase ou os transformantes são transformados com uma construção de ácido nucleico que confere expressão de uma transposase, transientemente ou estável. Em alguns casos (aproximadamente 10%), o transposon salta do genoma da célula hospedeira uma vez que a transformação tenha ocorrido satisfatoriamente e é perdido. Em um número de casos adicionais, o transposon salta para uma localização diferente. Nesses casos o gene de marcador deve ser eliminado pela realização de cruzamentos. Em microbiologia, foram desenvolvidas técnicas que tomam possível, ou facilitam, a detecção de tais eventos. Um método vantajoso adicional depende do que é conhecido como sistemas de recombinação; cuja vantagem é que a eliminação por cruzamento pode ser dispensada. O melhor sistema conhecido deste tipo é aquele conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene de marcador estiver integrado entre as seqüências IoxP, ele é removido uma vez que a transformação tenha ocorrido satisfatoriamente, pela expressão da recombinase. Sistemas de recombinação adicionais são o sistema HIN/HIX, FLP/FRT e REP/STB (Tribble et al, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Uma integração sítio-específica no genoma vegetal das seqüências de ácido nucleico de acordo com a invenção é possível. Naturalmente, esses métodos também podem ser aplicados a microorganismos tais como levedura, fungos ou bactérias.
A invenção também provê um método para a produção das plantas transgênicas que têm características relacionadas a rendimento intensificadas em relação a plantas controle, compreendendo a introdução e expressão em uma planta de qualquer ácido nucleico codificanto um polipeptídio semelhante a SAP como definido aqui acima.
Mais especificamente, a presente invenção provê um método para a produção de plantas transgênicas que têm rendimento aumentado, método o qual compreende:
(i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico que codifica polipeptídio semelhante a SAP e
(ii) cultivar a célula vegetal sob condições que promovem crescimento e desenvolvimento vegetal.
O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na planta por si só (incluindo a introdução em um tecido, ógão ou qualquer outra parte de uma planta). De acordo com a característica preferida da presente invenção, o ácido nucleico é introduzido de preferência em uma planta por transformação. O termo “transformação” é descrito aqui em maiores detalhes na seção de “definições”.
5 As células vegetais modificadas geneticamente podem ser
regeneradas através de todos os métodos com os quais o trabalhador versado está familiarizado. Métodos adequados podem ser encontrados na publicações acima mencionadas de S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
Geralmente após a transformação, células vegetais ou agrupamentos celulares são selecionados pela presença de um ou mais marcadores que são codificados por gene expressáveis em plantas co- transferidos com o gene de interesse, após o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como regra, submetido a condições seletivas para que plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas da maneira acima descrita podem ser plantadas e, após um período de crescimento inicial, submetidas a uma seleção adequada por borrifo. Uma possibilidade adicional consiste em cultivar sementes, se apropriado após esterilização, em placas de Agar usando um agente de seleção adequado para que apenas das sementes transformadas possam crescer plantas. Senão, as plantas transformadas são triadas pela presença de um marcador selecionável tal como aqueles descritos acima.
Após a transferência de DNA e regeneração, plantas 25 putativamente transformadas também podem ser avaliadas, por exemplo, usando análise de Southern, pela presença do gene de interesse, número de cópias e/ou organização genômica. Senão ou adicionalmente, níveis de expressão do DNA recém-introduzido podem ser monitorados usando análise de Northern ou Western, ambas as técnicas sendo bem conhecidas por pessoas que têm conhecimento ordinário da técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como por propagação clonal ou técnicas de reprodução clássicas. Por exemplo, uma primeira geração (ou Tl) de plantas transformadas pode ser auto-cruzadas e segunda geração (ou T2) homozigota de transformantes selecionada e as plantas T2 podem então ser propagadas adicionalmente através de técnicas de reprodução clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, eles podem ser quimeras ou células transformadas e células não transformadas; transformantes clonais (p. ex., todas as células transformadas para conter o cassete de expressão); enxertos de tecidos transformados e não transformados (p. ex., em plantas, um rizoma transformado enxertado em um rebento não transformado).
A presente invenção claramente estende-se a qualquer célula vegetal ou planta produzida por quaisquer dos métodos aqui descritos e a todas as partes e propágulos vegetais dessa. A presente invenção se estende adicionalmente para abranger a progênie de uma planta inteira, órgão, tecido ou célula transfectada ou transformada primária que foi produzida por quaisquer dos métodos acima mencionados, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelos progenitores nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo um ácido nucleico isolado codificando um polipeptídio semelhante a SAP conforme definido aqui acima. Células hospedeiras preferidas de acordo com a invenção são células vegetais. Plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, para o cassete ou construção ou vetor de expressão são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídios usados no método inventivo. Os métodos da invenção são vantajosamente aplicáveis a qualquer planta.
Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes de forragem, plantas ornamentais, colheitas alimentícias, árvores ou arbustos. De acordo com uma modalidade preferida da presente invenção, a planta é uma planta de colheita. Exemplos de plantas de colheita incluem soja, girassol, colza, alfafa, canola, algodão, tomate, batata e tabaco. De preferência adicional, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana de açúcar. De maior preferência, a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milhete, centeio, sorgo e aveia.
A invenção também se estende para partes colhíveis de uma planta tal como, mas não limitando a, sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção, além disso, se relaciona a produtos derivados, de preferência diretamente derivados, de uma parte colhível de tal planta, tal como sedimentados secos ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.
De acordo com uma característica preferida da invenção, a expressão modulada é expressão aumentada. Métodos para aumentar a expressão de ácidos nucleicos ou genes, ou produtos gênicos, são bem documentados na técnica e incluem, por exemplo, superexpressão direcionada por promotores apropriados, o uso de intensificadores de transcrição ou intensificadores de tradução. Ácidos nucleicos isolados que servem como elementos intensificadores ou promotores podem ser introduzidos em uma posição apropriada (tipicamente a montante) de uma forma não heteróloga de um polinucleotídio para supra-regular a expressão. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção e/ou substituição (veja, Kmiec, Pat. U.S. No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada a partir de um gene da presente invenção 5 para controlar a expressão do gene.
Se a expressão polipeptídica é desejada, é geralmente desejável incluir uma região de poliadenilação na extremidade 3’ de uma região codifícante polinucleotídica. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de Τ- Ι 0 DNA. A seqüência da extremidade 3 ’ a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou senão de outro gene vegetal, ou de menor preferência de qualquer outro gene eucariótico.
Conforme acima mencionado, um método preferido para modular (de preferência, aumentar) a expressão de um ácido nucleico que 15 codifica um polipeptídio semelhante a SAP é pela introdução e expressão em uma planta de um ácido nucleico que codifica um polipeptídio semelhante a SAP; entretanto, os efeitos da realização do método, isto é, da intensificação de características relacionadas a rendimento também podem ser alcançados usando outras técnicas bem conhecidas. Uma descrição de algumas dessas 20 técnicas se seguirá agora.
Uma de tais técnicas é etiquetagem de ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), que envolve a inserção de T- DNA, geralmente contendo um promotor (também pode ser um intensificador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb 25 a montante ou jusante da região codifícante de um gene em uma configuração tal que o promotor direcione a expressão do gene alvo. Tipicamente, a regulação de expressão do gene alvo por seu promotor natural é interrompida e o gene cai sob o controle do promotor recém-introduzido. O promotor está tipicamente incrustado em um T-DNA. Este T-DNA é inserido aleatoriamente no genoma vegetal, por exemplo, através de infecção por Agrobacterium e leva à expressão modificada de genes próximos ao T-DNA inserido. As plantas transgênicas resultantes exibem fenótipos dominantes devido à expressão modificada de genes próximos ao promotor introduzido.
5 Os efeitos da invenção também podem ser reproduzidos
usando a técnica de TILLING (Lesões Locais Induzidas Direcionadas em Genomas); para uma descrição da mesma veja a seção de “definições”.
Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga; para uma descrição da mesma veja a seção de “definições”.
A presente invenção também abrange o uso de ácidos nucleicos que codificam polipeptídios semelhantes a SAP conforme aqui descrito e o uso desse polipeptídio semelhante a SAP na intensificação de qualquer das características relacionadas a rendimento acima mencionadas em plantas.
Ácidos nucleicos que codificam polipeptídio semelhante a SAP descrito aqui, ou os polipeptídios semelhantes a SAP por eles mesmos, podem ser úteis em programas de reprodução em que é identificado um marcador de DNA que pode estar ligado geneticamente a um gene que 20 codifica polipeptídio semelhante a SAP. Os ácidos nucleicos/genes, ou os polipeptídios semelhantes a SAP por eles mesmos podem ser usadas para definir um marcador molecular. Este marcador protéico ou de DNA pode então ser usado em programas de reprodução para selecionar plantas que têm características relacionadas a rendimento intensificadas conforme definido 25 aqui acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene que codifica um polipeptídio semelhante a SAP também podem ser úteis em programas de reprodução assistidos por marcador. Tais programas de reprodução às vezes requerem a introdução de variação alélica por tratamento mutagênico das plantas, usando, por exemplo, mutagênese EMS; senão, o programa pode iniciar-se com uma coleção de variantes alélicas de origem também chamada “natural” causada involuntariamente. A identificação de variantes alélicas então ocorre, por exemplo, por PCR. Esta é seguida por uma etapa para a 5 seleção de variantes alélicas superiores da seqüência em questão e que dão rendimento aumentado. A seleção é tipicamente efetuada por monitoração de desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar 10 plantas em que a variante alélica superior foi identificada com outra planta. Isto poderia ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.
Ácidos nucleicos que codificam polipeptídios semelhantes a SAP também podem ser usados como sondas para mapear geneticamente e 15 fisicamente os genes dos quais eles fazem parte e como marcadores para características ligadas àqueles genes. Tal informação pode ser útil em reprodução vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos que codificam VPE requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídios de comprimento. Os ácidos 20 nucleicos que codificam polipeptídio semelhante a SAP podem ser usados como marcadores de polimorfismo por comprimento de fragmento de restrição (RFLP). Transferências de Southern (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição podem ser sondadas com os ácidos 25 nucleicos que codificam semelhante a SAP. Os padrões de bandeamento resultantes podem então ser submetidos a análises genéticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar transferências de Southern contendo DNAs genômicos tratados com endonuclease de restrição de um grupo de indivíduos que representam progenitores e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é anotado e usado para calcular a posição do ácido nucleico que codifica VPE 5 no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético é descrito em Bematzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem 10 mapeamento genético de clones de DNA específicos usando a metodologia delineada acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações de retrocruzamento, populações acasaladas aleatoriamente, linhagens quase isogênicas e outros grupos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem 15 conhecidas por aqueles versados na técnica.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (isto é, colocação de seqüências em mapas físicos; veja Hoheisel et al., em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências citadas a esse respeito).
Em outra modalidade, as sondas de ácido nucleico podem ser
usadas em mapeamento por hibridização in situ com fluorescência direta (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora, métodos atuais de mapeamento por FISH favoreçam o uso de clones grandes (vários kb até várias centenas de kb; veja Laan et al., (1995) Genome Res. 5:13-20), 25 melhoras em sensibilidade podem permitir a realização de mapeamento por FISH usando sondas menores.
Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser efetuada usando os ácidos nucleicos. Exemplos incluem amplificação alelo-específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al., (1993) Genomics 16:325-332), ligação alelo-específica (Landegren et al. (1988) Science 241:1077-1080), reações de prolongamento nucleotídico (Sokolov (1990) Nucleic Acid Res.
18:3671), mapeamento híbrido por radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e mapeamento feliz (happy mapping) (Dear e Cook (1989) Nucleic Acid Res. 17:6795-6807). Para esses métodos, a seqüência de um ácido nucleico é usada para desenhar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de prolongamento de iniciador. O 10 desenho de tais iniciadores é bem conhecido por aqueles versados na técnica. Em métodos que empregam mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os progenitores do cruzamento do mapeamento na região correspondente à seqüência do ácido nucleico imediato. Isto, entretanto, geralmente não é necessário para métodos 15 de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas que têm características relacionadas a rendimento intensificado, como descrito anteriormente. Essas características também pode ser combinadas com outras características vantajosas economicamente tal como 20 características que intensificam rendimento adicionalmente, tolerância a outros estresses abióticos e bióticos, características que modificam várias características arquitetônicas e/ou características bioquímicas e/ou fisiológicas.
(iv) SYPF
Surpreendentemente, descobriu-se agora que modular a
expressão de um ácido nucleico que codifica um polipeptídio SYPF1 em uma planta dá plantas que têm características relacionadas a rendimento intensificado em relação a plantas controle.
De acordo com uma primeira modalidade, a presente invenção provê um método para intensificar características relacionadas a rendimento em plantas em relação a plantas controle, compreendendo modular a expressão em uma planta de um ácido nucleico que codifica um polipeptídio SYPF1.
5 Um método preferido para modular (de preferência, aumentar)
a expressão de um ácido nucleico codificando um polipeptídio SYPFl é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídio SYPF1.
Qualquer referência daqui por diante a uma “proteína útil nos 10 métodos da invenção” é tomada como significando polipeptídio SYPFl conforme aqui definido. Qualquer referência daqui por diante a um “ácido nucleico útil nos métodos da invenção” é tomada como significando um ácido nucleico capaz de codificar tal polipeptídio SYPFI. O ácido nucleico a ser introduzido em uma planta (e, portanto, útil na realização dos métodos da 15 invenção) é qualquer ácido nucleico codificando o tipo de proteínas que será descrita agora, daqui em diante também nomeado “ácido nucléico de SYPF1” ou “gene de SYPF1”.
Um “polipeptídio SYPF1” conforme aqui definido se refere a qualquer polipeptídio que tem, em ordem crescente de preferência, pelo 20 menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% ou mais de identidade de seqüência com qualquer um, de preferência com quaisquer dois, da maior preferência com todos os três Motivos I, II e III conforme mostrado no alinhamento da Figura 19. As regiões de caixa representam regiões ou motivos conservados encontrados em polipeptídios 25 SYPF1.
Um polipeptídio SYPFl pode compreender qualquer um, de preferência quaisquer dois, da maior preferência todos os três Motivos I, II e III conforme mostrado no alinhamento da Figura 19, Motivos que compreendem qualquer alteração conservativa de aminoácidos em qualquer posição.
Um polipeptídio SYPFl pode compreender qualquer um, de preferência quaisquer dois, da maior preferência todos os três Motivos I, II e III conforme mostrado no alinhamento da Figura 19.
Os Motivos são de preferência conforme encontrados na
seqüência de SEQ ID NO: 322 ou no ortólogo de arroz correspondente (SEQ ID NO: 336), isto é
Motivo 1:
SLVSNFLSFIYLQYYEEKS (conforme encontrado em SEQ
ID NO: 322)
RLVNRVLGHYEHYYRTK (conforme encontrado em SEQ
ID NO: 336)
- Os Motivos podem compreender qualquer alteração conservativa de aminoácidos em qualquer posição.
- Os Motivos podem compreender entre uma e nove alterações
não conservativas de aminoácidos em qualquer posição.
Motivo 2:
PPWLS SYEKLILWIGGFKP (conforme encontrado em SEQ
ID NO: 322)
PS WTSTTENL YLWCGG WRP (conforme encontrado em
SEQ ID NO: 336)
- Os Motivos podem compreender qualquer alteração conservativa de aminoácidos em qualquer posição.
- Os Motivos podem compreender entre uma e dez alterações não conservativas de aminoácidos em qualquer posição.
Motivo 3:
NADQLRC VT V GK V VE VLNPRQ SIKLLRA (conforme encontrado em SEQ ID NO: 322)
MADGLRLETMRE V V ALLRP S Q A VHFLIA (conforme encontrado em SEQ ID NO: 336)
- Os Motivos podem compreender qualquer alteração conservativa de aminoácidos em qualquer posição.
- Os Motivos podem compreender entre uma e quatorze 5 alterações não conservativas de aminoácidos em qualquer posição.
Adicionalmente ou senão, o “polipeptídio SYPF1” conforme aqui definido compreende em ordem crescente de preferência, pelo menos 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou mais de identidade de seqüência com o polipeptídio SYPF1 representado pela SEQ ID 10 NO: 322 ou com quaisquer seqüências de aminoácidos dadas aqui na Tabela El.
Além disso, polipeptídios SYPF1 (pelo menos na forma nativa delas)podem ter atividade de ligação a DNA. Ferramentas e técnicas para medir a atividade de ligação a DNA são bem conhecidas na técnica.
Os termos “domínio” e “motivo” são definidos aqui na seção
de “definições”. Bancos de dados de especialista existem para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242- 244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite 20 (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 25 32:D134-D137, (2004)), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002)). Um grupo de ferramentas para análise in silico de seqüências de proteínas está disponível no servidor de proteômica ExPASY (hospedado pelo Instituto Suíço de Bioinformática (Gasteiger et al., ExPASy: the proteomies server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). Domínios também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências.
Análise da seqüência polipeptídica de SEQ ID NO: 322 no banco de dados SMART, revelou haver quatro domínios do também chamado distúrbio intrínseco (veja Fig. 18). Esses domínios são ricos em R, K e S e podem indicar uma função nas interações proteína-proteína. Os quatro domínios são:
Io Domínio de distúrbio intrínseco:
MPNTSSSQSF
2o Domínio de distúrbio intrínseco:
V S V ADLTRHQKDRIS SLKSETRRKERE V
3o Domínio de distúrbio intrínseco:
L VQQS VADPP VM
4o Domínio de distúrbio intrínseco:
HLRLRDRDQERA
Tais domínios de distúrbio intrínseco também podem ser encontrados no ortólogo de arroz correspondente de SEQ ID NO: 336 (NP 909348)
Io Domínio de distúrbio intrínseco:
PPPSPHPPH
2o Domínio de distúrbio intrínseco:
SRDLAALRS AAS AATNP AAPPDDA
3o Domínio de distúrbio intrínseco:
LAGGGLGA GDLGDL
4o Domínio de distúrbio intrínseco:
ELAGGGGMDAEGMEMEM
Além disso, análise da seqüência polipeptídica de SEQ ID NO: 322 no banco de dados PRODOM revelou haver similaridade com: At4gl8650 relacionado a tumor; volta ativador de TGAl bzip. Além disso, polipeptídios SYPFl compreendem regiões ricas em F (ricas em fenilalanina) e ricas em C (ricas em cisteína). Essas regiões são remalhadas na Figura 18 mostrando a seqüência de SEQ ID NO: 322.
Métodos para o alinhamento de seqüências para comparação 5 são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (isto é, abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de intervalos. O algoritmo 10 BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula a identidade de seqüência porcentual e desempenha uma análise estatística da similaridade entre as duas seqüências. O programa para desempenhar análise de BLAST está publicamente disponível através do Centro Nacional para Informação em Biotecnologia (NCBI). Homólogos podem prontamente serem identificados 15 usando, por exemplo, o algoritmo de alinhamento de seqüências múltiplas ClustalW (versão 1.83), com os parâmetros de alinhamento par a par padrões e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de programas MatGAT (Campanella et al., 20 BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Editoração manual menor pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como seria evidente a uma pessoa versada na técnica. Além disso, em vez de usar seqüências completas para a identificação 25 de homólogos, domínios específicos também podem ser usados. Os valores de identidade de seqüências, que são indicados abaixo na seção de Exemplos como um porcentual foram determinados para a seqüência de aminoácidos ou de ácido nucleico inteira e/ou para domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrões. A presente invenção é ilustrada por plantas transformantes com a seqüência de ácido nucleico representada pela SEQ ID NO: 321, que codifica a seqüência polipeptídica de SEQ ID NO: 322. Entretanto, a realização da invenção não está restrita a essas seqüências; os métodos da invenção podem vantajosamente serem realizados usando qualquer ácido nucleico que codifique SYPFl ou polipeptídios SYPFl conforme aqui definido.
Exemplos de ácidos nucleicos codificando polipeptídios SYPFl são dados aqui na Tabela El. Tais ácidos nucleicos são úteis na realização dos métodos da invenção. As seqüências de aminoácidos dadas na Tabela El são seqüências de exemplo de ortólogos e parálogos dos polipeptídios SYPFl representados pela SEQ ID NO: 322, os termos “ortólogos” e “parálogos” sendo conforme aqui definido. Ortólogos e parálogos adicionais podem prontamente serem identificados pela realização de uma também chamada pesquisa blast recíproca. Tipicamente, esta envolve um primeiro BLAST envolvendo fazer um BLAST de uma seqüência de dúvida (por exemplo, usando quaisquer das seqüências listadas na Tabela El) contra qualquer banco de dados de seqüências, tal como o banco de dados do NCBI disponível publicamente. BLASTN ou BLASTX (usando valores padrões) são usados geralmente quando se parte de uma seqüência nucleotídica e BLASTP ou TBLASTN (usando valores padrões) quando se parte de uma seqüência proteica. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências completas dos resultados filtrados ou dos resultados não filtrados são então submetidas a BLAST reverso (segundo BLAST) contra seqüências do organismo a partir do qual a seqüência de dúvida é derivada (quando a seqüência de dúvida for SEQ ID NO: 321 ou SEQ ID NO: 322, o segundo BLAST seria portanto contra seqüências de Arabidopsis). Os resultados do primeiro e segundo BLASts são então comparados. Um parálogo é identificado se um sucesso de alta classificação do primeiro blast for da mesma espécie que aquela da qual a seqüência de dúvida é derivada, um BLAST reverso então resulta idealmente na seqüência de dúvida como o sucesso mais alto; um ortólogo é identificado se um sucesso de alta classificação no primeiro blast não for da mesma espécie que aquela da qual a seqüência dúvida é derivada e de preferência resulta no BLAST reverso na seqüência de dúvida estando entre os sucessos mais altos.
Sucessos de alta classificação são aqueles que tem um baixo valor de E. Quanto menor o valor de E, mais significativa a pontuação (ou em outras palavras, menor a chance de que o sucesso seja obtido por acaso). A computação do valor de E é bem conhecida na técnica. Além dos valores de E, comparações também são pontuadas por identidade porcentual. Identidade porcentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de neighbour joining, para auxiliar a visualizar o agrupamento de genes relacionados e identificar ortólogos e parálogos.
Variantes de ácido nucleico também podem ser úteis na prática dos métodos da invenção. Exemplos de tais variantes incluem ácidos nucleicos que codificam homólogos e derivados de qualquer uma das seqüências de aminoácidos dadas na Tabela El, os termos “homólogo” e “derivado” sendo conforme aqui definido. Também úteis nos métodos da invenção são ácidos nucleicos codificando homólogos e derivados de ortólogos ou parálogos de qualquer uma das seqüências de aminoácidos dadas na Tabela El. Homólogos e derivados úteis nos métodos da presente invenção têm consideravelmente a mesma atividade biológica e funcional que a proteína não modificada a partir da qual eles foram derivados.
Variantes de ácido nucleico adicionais úteis na prática dos métodos da invenção incluem porções de ácidos nucleicos codificando polipeptídios SYPF1, ácidos nucleicos que se hibridizam com ácidos nucleicos codificando polipeptídios SYPF1, variantes de splice de ácidos nucleicos codificando polipeptídios SYPF1, variantes alélicas de ácidos nucleicos codificando polipeptídios SYPFl e variantes de ácidos nucleicos 5 codificando polipeptídios SYPFl obtidas por embaralhamento gênico. Os termos seqüência de hibridização, variante de splice, variante alélica e embaralhamento gênico são conforme aqui descrito.
Ácidos nucleicos codificando polipeptídios SYPFl não precisam ser ácidos nucleicos completos, visto que a realização dos métodos 10 da invenção não depende do uso de seqüências de ácido nucleico completas. De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácido nucleico dadas aqui na Tabela El, ou uma porção de um 15 ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas na Tabela El.
Uma porção de um ácido nucleico pode ser preparada, por exemplo, fazendo-se uma ou mais deleções no ácido nucleico. As porções podem ser usadas de forma isolada ou elas podem ser fusionadas a outras 20 seqüências codificantes (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combine várias atividades. Quando fusionado a outras seqüências codificantes, o polipeptídio resultante produzido na tradução pode ser maior que aquele previsto para a porção proteica.
Porções úteis nos métodos da invenção codificam 25 polipeptídios SYPFl conforme aqui definido e tem consideravelmente a mesma atividade biológica que as seqüências de aminoácidos dadas na Tabela El. De preferência, a porção de qualquer um dos ácidos nucleicos dados na Tabela El, ou é uma porção de um ácido nucleico que codifica ou um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas na Tabela El. De preferência, a porção tem, em ordem crescente de preferência, pelo menos 300, 400, 500 ou 600 nucleotídios consecutivos de comprimento, os nucleotídios consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na Tabela El, ou de um ácido nucleico que codifica um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas na Tabela El. Da maior preferência, a porção é uma porção do ácido nucleico de SEQ ID NO: 321. De preferência, a porção codifica uma seqüência de aminoácidos compreendendo (qualquer um ou mais dos domínios aqui definidos). De preferência, a porção codifica uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 20, tende a se agrupar com o grupo de polipeptídios SYPFl compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 322 em vez de com qualquer outro grupo.
Outra variante de ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de se hibridizar, sob condições de estringência reduzida, de preferência sob condições estringentes, com um ácido nucleico codificando um polipeptídio SYPFl conforme aqui definido, ou com uma porção conforme aqui definido.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de se hibridizar com qualquer um dos ácidos nucleicos dados na Tabela El, ou compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de se hibridizar com um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de ácidos nucleicos dadas na Tabela El.
Seqüências de hibridização úteis nos métodos da invenção codificam um polipeptídio SYPFl conforme aqui definido e têm consideravelmente a mesma atividade biológica que as seqüências de aminoácidos dadas na Tabela El. De preferência, a seqüência de hibridização é capaz de se hibridizar com qualquer um dos ácidos nucleicos dados na Tabela El, ou com uma porção de quaisquer dessas seqüências, uma porção sendo conforme definido acima, ou em que a seqüência de hibridização é 5 capaz de se hibridizar com um ácido nucleico codificando um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas na Tabela El. Da maior preferência, a seqüência de hibridização é capaz de se hibridizar com um ácido nucleico representado pela SEQ ID NO: 321 ou com uma porção deste. De preferência a seqüência de hibridização codifica uma 10 seqüência de aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios conforme aqui definidos. De preferência, a seqüência de hibridização codifica uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 20, tende a se agrupar com o grupo de polipeptídios SYPFl compreendendo a 15 seqüência de aminoácidos representada pela SEQ ID NO: 322 em vez de com qualquer outro grupo.
Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de splice codificando um polipeptídio SYPFl conforme definida aqui acima, uma variante de splice sendo conforme aqui definido.
De acordo com a presente invenção, é provido um método para
intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de splice de qualquer uma das seqüências de ácido nucleico dadas na Tabela El, ou uma variante de splice de um ácido nucleico codificando um ortólogo, 25 parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela El.
Variantes de splice preferidas são variantes de splice de um ácido nucleico representado pela SEQ ID NO: 321, ou uma variante de splice de um ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 322. De preferência, a seqüência de aminoácidos codificada pela variante de splice compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos. De preferência, a seqüência de aminoácidos codificada pela variante de splice, quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 20, tende a se aglomerar ao grupo de polipeptídios SYPFl compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 322 em vez de a qualquer outro grupo.
Outra variante de ácido nucleico útil na realização dos métodos da invenção é uma variante alélica de um ácido nucleico que codifica um polipeptídio SYPFl conforme definida aqui acima, uma variante alélica sendo conforme aqui definido.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados na Tabela El, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela El.
As variantes alélicas úteis nos métodos da presente invenção têm consideravelmente a mesma atividade biológica que o polipeptídio SYPFl de SEQ ID NO: 322 e quaisquer dos aminoácidos retratados na Tabela Dl. Variantes alélicas existem na natureza e o uso desses alelos naturais é abrangido pelos métodos da presente invenção. De preferência, a variante alélica é uma variante alélica de SEQ ID NO: 321 ou uma variante alélica de um ácido nucleico que codifica um ortólogo ou parálogo de SEQ ID NO: 322. De preferência, o aminoácido codificado pela variante alélica compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos. De preferência, a seqüência de aminoácidos codificada pela variante alélica, quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 20, tende a se aglomerar ao grupo de polipeptídios SYPFl compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 322 em vez de a qualquer outro grupo.
Embaralhamento gênico ou evolução dirigida também pode ser 5 usada para gerar variantes de ácidos nucleicos codificando polipeptídios SYPFl conforme definidas acima; o termo “embaralhamento gênico” sendo conforme aqui definido.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, 10 compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácido nucleico dadas na Tabela El, ou compreendendo introduzir e expressar em uma planta uma variante de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de aminoácidos dadas na Tabela El, ácido nucleico variante 15 que é obtido por embaralhamento gênico.
De preferência, o ácido nucleico variante obtido por embaralhamento gênico codifica uma seqüência de aminoácidos compreendendo qualquer um dos motivos ou domínios conforme aqui definidos. De preferência, a seqüência de aminoácidos codificada pelo ácido 20 nucleico variante obtido por embaralhamento gênico, quando usada na construção de uma árvore filogenética, tal como aquela retratada na Fig. 20, tende a se aglomerar ao grupo de polipeptídios SYPFl compreendendo a seqüência de aminoácidos representada pela SEQ ID NO: 322 em vez de a qualquer outro grupo.
Além disso, variantes de ácido nucleico também podem ser
obtidas por mutagênese sítio-dirigida. Vários métodos estão disponíveis para alcançar a mutagênese sítio-dirigida, os mais comuns sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Ácidos nucleicos codificando polipeptídios SYPFl podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana intencional. De preferência, o ácido nucleico codificando polipeptídio SYPFl é de uma planta, de 5 preferência adicional de uma planta dicotiledônea, de maior preferência da família Brassicaceae, de maior preferência do gênero Arabidopsis, da maior preferência de Arabidopsis thaliana.
A realização dos métodos da invenção dá plantas tendo características relacionadas a rendimento intensificado. Em particular, a 10 realização dos métodos da invenção dá plantas tendo rendimento aumentado, especialmente rendimento de semente aumentado em relação a plantas controle. Os termos “rendimento” e “rendimento de semente” são descritos em maiores detalhes aqui na seção de “definições”.
Aqui, referência a características relacionadas a rendimento 15 intensificado é tomada como significando um aumento da biomassa (peso) de uma ou mais partes de uma planta, que podem incluir partes acima do solo (colhíveis) e/ou partes (colhíveis) abaixo do solo. Em particular, tais partes colhíveis são sementes e a realização dos métodos da invenção resulta em plantas que têm rendimento de semente aumentado em relação ao rendimento 20 de semente de plantas controle adequadas.
Tomando milho como exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento do número de plantas estabelecidas por hectare ou acre, um aumento do número de espigas por planta, um aumento do número de fileiras, número de semente por fileira, 25 peso de semente, peso de cem sementes, comprimento/diâmetro de espiga, aumento na taxa de preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), entre outros. Tomando arroz como exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculo) por panícula (que é expresso como uma razão do número de sementes preenchidas sobre o número de panículas primárias), aumento na taxa de preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), aumento em peso de cem sementes, entre outros.
A presente invenção provê um método para aumentar rendimento, especialmente rendimento de semente de plantas, em relação a plantas controle, método o qual compreende modular expressão, de preferência aumentar a expressão, em uma planta de um ácido nucleico que codifica um polipeptídio SYPFl conforme aqui definido.
Visto que plantas transgênicas de acordo com a presente invenção têm rendimento aumentado, é provável que essas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte do ciclo de vida delas), em relação à taxa de crescimento de plantas controle em um estágio correspondente no ciclo de vida delas.
A taxa de crescimento aumentada pode ser específica para um ou mais partes de uma planta (incluindo sementes), ou pode ser consideravelmente pela planta inteira. Plantas que têm uma taxa de crescimento aumentado podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser tomado como significando o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta tenha produzido sementes maduras secas, similar ao material de partida. O ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, índice de verdor, tempo de floração e velocidade de maturação de semente. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante consideravelmente o ciclo de vida da planta inteira. Taxa de crescimento aumentada durante os estágios iniciais do ciclo de vida de uma planta pode refletir vigor aumentado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que seria possível de outro modo (um efeito similar pode ser obtido com 5 tempo de floração mais precoce). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz seguida por semeadura e colheita de plantas de arroz adicionais todos dentro de um período de crescimento convencional). De modo similar, se a taxa de 10 crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes de diferentes espécies de plantas (por exemplo, a semeadura e colheita de plantas de milho seguida, por exemplo, pela semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Colher em momentos adicionais o mesmo rizoma no caso de 15 algumas plantas de colheita também pode ser possível. Alterar o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por acre (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento na taxa de crescimento também pode permitir o cultivo de plantas 20 transgênicas em uma área geográfica mais larga que as equivalentes selvagens delas, visto que as limitações territoriais para crescimento de uma colheita são frequentemente por condições ambientais adversas ou no momento do plantio (estação inicial) ou no momento da colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita for encurtado. A taxa de 25 crescimento pode ser determinada pela derivação de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo tomado por plantas para alcançar 50% do tamanho máximo delas) e T-90 (tempo tomado por plantas para alcançar 90% do tamanho máximo delas) entre outros. De acordo com uma característica preferida da presente invenção, o desempenho dos métodos da invenção dá plantas que têm uma taxa de crescimento aumentada em relação a plantas controle. Portanto de acordo com a presente invenção, é provido um método para aumentar a taxa 5 de crescimento de plantas, método o qual compreende modular a expressão, de preferência aumentar a expressão, em uma planta de um ácido nucleico que codifica um polipeptídio SYPFl conforme aqui definida.
Um aumento no rendimento e/ou taxa de crescimento ocorre quer a planta esteja sob condições de não estresse quer a planta esteja exposta 10 a vários estresses comparada a plantas controle. Plantas tipicamente respondem à exposição a estresse crescendo mais vagarosamente. Em condições de estresse grave, a planta pode mesmo para de crescer totalmente. Estresse leve por outro lado é definido aqui como sendo qualquer estresse ao qual uma planta é exposta que não resulta na cessação total de crescimento 15 pela planta sem a capacidade de retomar o crescimento. Estresse leve no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos de 40%, 35% ou 30%, de preferência menos de 25%, 20% ou 15%, de maior preferência menos de 14%», 13%, 12%, 11% ou 10% ou menos em comparação com a planta controle sob condições de não 20 estresse. Devido a avanços em práticas da agricultura (irrigação, fertilização, tratamentos com pesticida) estresses graves não são encontrados frequentemente em plantas de colheita cultivadas. Como conseqüência, o crescimento comprometido induzido por estresse leve frequentemente é uma característica indesejável para agricultura. Estresses leves são os estresses 25 bióticos e/ou abióticos (ambientais) de todo dia a que a planta está exposta. Estresses abióticos podem ocorrer devido à seca ou excesso de água, estresses anaeróbico, estresse salino, toxicidade química, estresse oxidativo e calor, frio ou temperaturas de congelamento. O estresse abiótico pode ser um estresse osmótico causado por um estresse aquoso (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tais como bactérias, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados sob condições de não estresse ou sob condições de seca leve para dar plantas que têm rendimento aumentado em relação a plantas controle. Como relatado por Wang et al., (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de alterações morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente o crescimento e a produtividade vegetais. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por estarem interligados e podem induzir danos ao crescimento e celulares através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descrevem um grau particularmente alto de “diafonia” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando em interrupção de homeostase e distribuição iônica na célula. Estresse oxidativo, que frequentemente acompanha estresse por seca, salinidade ou temperatura alta ou baixa, pode causar desnaturação de proteínas funcionais e estruturais. Como conseqüência, esses diversos estresses ambientais frequentemente ativam respostas celulares e vias de sinalização celular similares, tais como a produção de proteínas de estresse, regulação para cima de antioxidantes, acúmulo de solutos compatíveis e detenção de crescimento. O termo condições de “não estresse” conforme aqui utilizado se refere àquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na técnica têm consciência de condições de solo normal e condições climáticas para uma dada localização.
A realização dos métodos da invenção dá plantas cultivadas sob condições de não estresse ou sob condições de seca leve com rendimento aumentado em relação a plantas controle adequadas cultivadas sob condições comparáveis. Portanto de acordo com a presente invenção, é provido um método para aumentar o rendimento de plantas cultivadas sob condições de não estresse ou sob condições de seca leve, método que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídio SYPF1.
A presente invenção abrange plantas ou partes destas (incluindo sementes) obteníveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico que codifica um polipeptídio SYPF1 conforme definido acima.
A invenção também provê construções genéticas e vetores
para facilitar a introdução e/ou a expressão em plantas de ácidos nucleicos codificando polipeptídios SYPFl. As construções gênicas podem ser inseridas em vetores, que podem estar disponíveis comercialmente, adequados para transformação em plantas e adequadas para expressão do gene de interesse 15 nas células transformadas. A invenção também provê uso de uma construção gênica conforme aqui definido nos métodos da invenção.
Mais especificamente, a presente invenção provê uma construção compreendendo:
(a) um ácido nucleico codificando um polipeptídio SYPFl conforme definido acima;
(b) uma ou mais seqüências controle capazes de direcionar a expressão da seqüências de ácido nucleico de (a) e opcionalmente
(c) uma seqüência de término de transcrição.
Os termos “seqüência controle” e “seqüência de término” são conforme aqui definido.
Plantas são transformadas com um vetor compreendendo quaisquer dos ácidos nucleicos descritos acima. O técnico versado está bem consciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar de modo bem-sucedido células hospedeiras contendo a seqüências de interesse. A seqüência de interesse está ligada operacionalmente a uma ou mais seqüências controle (pelo menos a um promotor).
Vantajosamente, qualquer tipo de promotor pode ser usado 5 para direcionar a expressão da seqüência de ácido nucleico. Um promotor constitutivo é particularmente útil nos métodos da invenção, particularmente promotores constitutivos de força média. Deve estar claro que a aplicabilidade da presente invenção não está restrita ao ácido nucleico que codifica polipeptídio SYPFl representado pela SEQ ID NO: 321, a aplicabilidade da 10 invenção também não está restrita à expressão de um ácido nucleico que codifica polipeptídio SYPFl quando direcionado por um promotor constitutivo.
O promotor constitutivo é de preferência um promotor HMG (Grupo de Alta Mobilidade). Veja aqui a seção de “Definições” para exemplos adicionais de promotores constitutivos.
Para a identificação de promotores funcionalmente equivalentes, a força do promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, pela ligação operacional do promotor a um gene repórter e avaliando o nível e padrão de expressão do 20 gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glicuronidase ou beta-galactosidase. A atividade promotora é avaliada pela medição da atividade enzimática da beta- glicuronidase ou beta-galactosidase. A força do promotor e/ou padrão de expressão podem então ser comparados com aqueles de um promotor de 25 referência (tal como aquele usado nos métodos da presente invenção). Senão, a força do promotor pode ser avaliada pela quantificação de níveis de mRNA ou pela comparação dos níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA dos genes estruturais tal como de rRNA 18S, usando métodos conhecidos na técnica, tal como transferência de Northern com análise densitométrica de auto-radiogramas, PCR em tempo real quantitativo ou RT-PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente, por “promotor fraco” entende-se um promotor que direciona a expressão de uma seqüência codificante para um 5 nível baixo. Por “nível baixo” entende-se níveis de cerca de 1/10.000 transcritos até cerca de 1/100.000 transcritos, até cerca de 1/500.000 transcritos por célula. No sentido inverso, um “promotor forte” direciona a expressão de uma seqüência codificante para um nível alto, ou para cerca de 1/10 transcritos até cerca de 1/100 transcritos até cerca de 1/1.000 transcritos 10 por célula.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. Elementos regulatórios adicionais podem incluir intensificadores transcricionais assim como traducionais. Aqueles versados na técnica terão consciência de seqüências 15 terminadoras e intensificadoras que podem ser adequadas para uso na realização da invenção. Tais seqüências seriam conhecidas ou poderiam ser prontamente obtidas por uma pessoa versada na técnica.
Uma seqüência intrônica também pode ser adicionada na região 5’ não traduzida (UTR) ou na seqüência codificante para aumentar a 20 quantidade da mensagem madura que se acumula no citosol. Demonstrou-se que a inclusão de um íntron processável por splice na unidade de transcrição tanto em construções de expressão vegetais como animais aumenta a expressão gênica tanto em níveis de mRNA como protéicos até 1000 vezes (Buchman e Berg, Mol. Cell Biol. 8:4395-4405 (1988); Callis et al, Genes 25 Dev. 1:1183-1200 (1987)). Tal intensificação por íntron da expressão gênica é tipicamente a maior quando colocado próximo da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntrons de Adhl-S 1, 2 e 6, o íntron Bronze-I é conhecido na técnica. Para informação geral, veja The Maize Handbook, Capítulo 116, Freeling e Walbot, Eds., Springer, N.Y. (1994). Outras seqüências controle (além de regiões de promotora, intensificadora, silenciadora, 3’UTR e/ou 5’UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências seriam conhecidas ou podem ser prontamente obtidas por uma pessoa versada na técnica.
5 As construções genéticas da invenção podem incluir
adicionalmente uma seqüência de origem de replicação que é necessária para a manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando é necessária que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (p. ex., molécula de 10 plasmídio ou cosmídio). Origens de replicação preferidas incluem, mas não estão limitadas a, o fl-ori e colEl.
Para a detecção da transferência bem-sucedida das seqüências de ácido nucleico conforme usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo esses ácidos nucleicos, é vantajoso usar 15 genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Marcadores selecionáveis são descritos em maiores detalhes aqui na seção de “definições”.
Sabe-se que na integração estável ou transiente de ácidos 20 nucleicos em células vegetais, apenas uma minoria das células pega o DNA estranho e, se desejado, integra ele em seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar esses integrantes, um gene codificante de um marcador selecionável (tal como aqueles descritos acima) geralmente é introduzido nas 25 células hospedeiras junto com o gene de interesse. Esses marcadores podem, por exemplo, ser usados em mutantes em que esses genes não são funcionais, por exemplo, por deleção por métodos convencionais. Além disso, moléculas de ácido nucleico que codificam um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a seqüência que codifica os polipeptídios da invenção ou usados nos métodos da invenção, senão em um vetor separado. Células que foram transfectadas estavelmente com o ácido nucleico introduzido podem ser identificadas, por exemplo, por seleção (por exemplo, células que integraram o marcador selecionável sobrevivem enquanto as outras células morrem).
Visto que genes de marcadores, particularmente genes de resistência a antibióticos e herbicidas, não são mais necessários ou são indesejáveis na célula hospedeira transgênica uma vez que os ácidos nucleicos forem introduzidos satisfatoriamente, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente emprega técnicas que permitem a remoção ou excisão desses genes de marcadores. Um de tais métodos é o que é conhecido como co-transformação. O método de co- transformação emprega dois vetores simultaneamente para a transformação, um vetor portando o ácido nucleico de acordo com a invenção e um segundo portando o(s) gene(s) de marcador(es). Uma grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes) ambos os vetores. No caso de transformação com agrobactérias os transformantes geralmente recebem apenas uma parte do vetor, isto é, a seqüência flanqueada pelo T-DNA, que geralmente representa o cassete de expressão. Os genes marcadores podem subsequentemente ser removidos da planta transformada pela realização de cruzamentos. Em outro método, genes de marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecido como a tecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte de transposase ou os transformantes são transformados com uma construção de ácido nucleico que confere expressão de uma transposase, transientemente ou estável. Em alguns casos (aproximadamente 10%), o transposon salta do genoma da célula hospedeira uma vez que a transformação tenha ocorrido satisfatoriamente e é perdido. Em um número de casos adicionais, o transposon salta para uma localização diferente. Nesses casos o gene de marcador deve ser eliminado pela realização de cruzamentos. Em microbiologia, foram desenvolvidas técnicas que tomam possível, ou facilitam, a detecção de tais eventos. Um método vantajoso adicional depende do que é conhecido como sistemas de recombinação; cuja vantagem é que a eliminação por cruzamento pode ser dispensada. O melhor sistema conhecido deste tipo é aquele conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene de marcador estiver integrado entre as seqüências IoxP, ele é removido uma vez que a transformação tenha ocorrido satisfatoriamente, pela expressão da recombinase. Sistemas de recombinação adicionais são o sistema HIN/HIX, FLP/FRT e REP/STB (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Uma integração sítio-específica no genoma vegetal das seqüências de ácido nucleico de acordo com a invenção é possível. Naturalmente, esses métodos também podem ser aplicados a microorganismos tais como levedura, fungos ou bactérias.
A invenção também provê um método para a produção das plantas transgênicas que têm características relacionadas a rendimento intensificadas em relação a plantas controle, compreendendo a introdução e expressão em uma planta de qualquer ácido nucleico codificanto um polipeptídio SYPF1 como definido aqui acima.
Mais especificamente, a presente invenção provê um método para a produção de plantas transgênicas que têm rendimento aumentado, método o qual compreende:
(i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico que codifica polipeptídio SYPF1 e
(ii) cultivar a célula vegetal sob condições que promovem crescimento e desenvolvimento vegetal. O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na planta por si só (incluindo a introdução em um tecido, ógão ou qualquer outra parte de uma planta). De acordo com a característica preferida da presente invenção, o ácido nucleico é introduzido de preferência 5 em uma planta por transformação. O termo “transformação” é descrito aqui em maiores detalhes na seção de “definições”.
As células vegetais modificadas geneticamente podem ser regeneradas através de todos os métodos com os quais o trabalhador versado está familiarizado. Métodos adequados podem ser encontrados na publicações acima mencionadas de S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
Geralmente após a transformação, células vegetais ou agrupamentos celulares são selecionados pela presença de um ou mais marcadores que são codificados por gene expressáveis em plantas co- transferidos com o gene de interesse, após o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como regra, submetido a condições seletivas para que plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas da maneira acima descrita podem ser plantadas e, após um período de crescimento inicial, submetidas a uma seleção adequada por borrifo. Uma possibilidade adicional consiste em cultivar sementes, se apropriado após esterilização, em placas de Agar usando um agente de seleção adequado para que apenas das sementes transformadas possam crescer plantas. Senão, as plantas transformadas são tríadas pela presença de um marcador selecionável tal como aqueles descritos acima.
Após a transferência de DNA e regeneração, plantas putativamente transformadas também podem ser avaliadas, por exemplo, usando análise de Southern, pela presença do gene de interesse, número de cópias e/ou organização genômica. Senão ou adicionalmente, níveis de expressão do DNA recém-introduzido podem ser monitorados usando análise de Northern ou Western, ambas as técnicas sendo bem conhecidas por pessoas que têm conhecimento ordinário da técnica.
As plantas transformadas geradas podem ser propagadas por 5 uma variedade de meios, tais como por propagação clonal ou técnicas de reprodução clássicas. Por exemplo, uma primeira geração (ou Tl) de plantas transformadas pode ser auto-cruzadas e segunda geração (ou T2) homozigota de transformantes selecionada e as plantas T2 podem então ser propagadas adicionalmente através de técnicas de reprodução clássicas.
Os organismos transformados gerados podem tomar uma
variedade de formas. Por exemplo, eles podem ser quimeras ou células transformadas e células não transformadas; transformantes clonais (p. ex., todas as células transformadas para conter o cassete de expressão); enxertos de tecidos transformados e não transformados (p. ex., em plantas, um rizoma transformado enxertado em um rebento não transformado).
A presente invenção claramente estende-se a qualquer célula vegetal ou planta produzida por quaisquer dos métodos aqui descritos e a todas as partes e propágulos vegetais dessa. A presente invenção se estende adicionalmente para abranger a progênie de uma planta inteira, órgão, tecido 20 ou célula transfectada ou transformada primária que foi produzida por quaisquer dos métodos acima mencionados, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelos progenitores nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo um
ácido nucleico isolado codificando um polipeptídio SYPFl conforme definido aqui acima. Células hospedeiras preferidas de acordo com a invenção são células vegetais. Plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, para o cassete ou construção ou vetor de expressão são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídios usados no método inventivo.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta.
5 Plantas que são particularmente úteis nos métodos da invenção
incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes de forragem, plantas ornamentais, colheitas alimentícias, árvores ou arbustos. De acordo com uma modalidade preferida da presente invenção, a 10 planta é uma planta de colheita. Exemplos de plantas de colheita incluem soja, girassol, colza, alfafa, canola, algodão, tomate, batata e tabaco. De preferência adicional, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana de açúcar. De maior preferência, a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milhete, 15 centeio, sorgo e aveia.
A invenção também se estende para partes colhíveis de uma planta tal como, mas não limitando a, sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção, além disso, se relaciona a produtos derivados, de preferência diretamente derivados, de uma parte colhível de tal 20 planta, tal como sedimentados secos ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.
De acordo com uma característica preferida da invenção, a expressão modulada é expressão aumentada. Métodos para aumentar a expressão de ácidos nucleicos ou genes, ou produtos gênicos, são bem 25 documentados na técnica e incluem, por exemplo, superexpressão direcionada por promotores apropriados, o uso de intensificadores de transcrição ou intensificadores de tradução. Ácidos nucleicos isolados que servem como elementos intensificadores ou promotores podem ser introduzidos em uma posição apropriada (tipicamente a montante) de uma forma não heteróloga de um polinucleotídio para supra-regular a expressão. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção e/ou substituição (veja, Kmiec, Pat. U.S. No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na 5 orientação e distância apropriada a partir de um gene da presente invenção para controlar a expressão do gene.
Se a expressão polipeptídica é desejada, é geralmente desejável incluir uma região de poliadenilação na extremidade 3’ de uma região codifícante polinucleotídica. A região de poliadenilação pode ser 10 derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência da extremidade 3 ’ a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou senão de outro gene vegetal, ou de menor preferência de qualquer outro gene eucariótico.
Conforme acima mencionado, um método preferido para 15 modular (de preferência, aumentar) a expressão de um ácido nucleico que codifica um polipeptídio SYPF1 é pela introdução e expressão em uma planta de um ácido nucleico que codifica um polipeptídio SYPF1; entretanto, os efeitos da realização do método, isto é, da intensificação de características relacionadas a rendimento também podem ser alcançados usando outras 20 técnicas bem conhecidas. Uma descrição de algumas dessas técnicas se seguirá agora.
Uma de tais técnicas é etiquetagem de ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), que envolve a inserção de T- DNA, geralmente contendo um promotor (também pode ser um intensificador 25 de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb a montante ou jusante da região codifícante de um gene em uma configuração tal que o promotor direcione a expressão do gene alvo. Tipicamente, a regulação de expressão do gene alvo por seu promotor natural é interrompida e o gene cai sob o controle do promotor recém-introduzido. O promotor está tipicamente incrustado em um T-DNA. Este T-DNA é inserido aleatoriamente no genoma vegetal, por exemplo, através de infecção por Agrobacterium e leva à expressão modificada de genes próximos ao T-DNA inserido. As plantas transgênicas resultantes exibem fenótipos dominantes devido à expressão modificada de genes próximos ao promotor introduzido.
Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Direcionadas em Genomas); para uma descrição da mesma veja a seção de “definições”.
Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga; para uma descrição da mesma veja a seção de “definições”.
A presente invenção também abrange o uso de ácidos nucleicos que codificam polipeptídios SYPFl conforme aqui descrito e o uso desses polipeptídios SYPF1 na intensificação de qualquer das características relacionadas a rendimento acima mencionadas em plantas.
Ácidos nucleicos que codificam polipeptídio SYPFl descrito aqui, ou os polipeptídios SYPFl por eles mesmos, podem ser úteis em programas de reprodução em que é identificado um marcador de DNA que pode estar ligado geneticamente a um gene que codifica polipeptídio SYPF1. 20 Os ácidos nucleicos/genes, ou os polipeptídios SYPFl por eles mesmos podem ser usados para definir um marcador molecular. Este marcador protéico ou de DNA pode então ser usado em programas de reprodução para selecionar plantas que têm características relacionadas a rendimento intensificadas conforme definido aqui acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene que codifica um
polipeptídio SYPFl também podem ser úteis em programas de reprodução assistidos por marcador. Tais programas de reprodução às vezes requerem a introdução de variação alélica por tratamento mutagênico das plantas, usando, por exemplo, mutagênese EMS; senão, o programa pode iniciar-se com uma coleção de variantes alélicas de origem também chamada “natural” causada involuntariamente. A identificação de variantes alélicas então ocorre, por exemplo, por PCR. Esta é seguida por uma etapa para a seleção de variantes alélicas superiores da seqüência em questão e que dão rendimento aumentado. A seleção é tipicamente efetuada por monitoração de desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas em que a variante alélica superior foi identificada com outra planta. Isto poderia ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.
r _
Acidos nucleicos que codificam polipeptídios SYPFl também podem ser usados como sondas para mapear geneticamente e fisicamente os genes dos quais eles fazem parte e como marcadores para características ligadas àqueles genes. Tal informação pode ser útil em reprodução vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos que codificam polipeptídio SYPF1 requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídios de comprimento. Os ácidos nucleicos que codificam polipeptídio SYPFl podem ser usados como marcadores de polimorfismo por comprimento de fragmento de restrição (RFLP). Transferências de Southern (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição podem ser sondadas com os ácidos nucleicos que codificam polipeptídio SYPFI. Os padrões de bandeamento resultantes podem então ser submetidos a análises genéticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174- 181) a fim de construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar transferências de Southern contendo DNAs genômicos tratados com endonuclease de restrição de um grupo de indivíduos que representam progenitores e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é anotado e usado para calcular a posição do ácido nucleico que codifica polipeptídio SYPF1 no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético é descrito em Bematzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones de DNA específicos usando a metodologia delineada acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações de retrocruzamento, populações acasaladas aleatoriamente, linhagens quase isogênicas e outros grupos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na técnica.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (isto é, colocação de seqüências em mapas físicos; veja Hoheisel et al., em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências citadas a esse respeito).
Em outra modalidade, as sondas de ácido nucleico podem ser usadas em mapeamento por hibridização in situ com fluorescência direta (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora, métodos atuais de mapeamento por FISH favoreçam o uso de clones grandes (vários kb até várias centenas de kb; veja Laan et al., (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir a realização de mapeamento por FISH usando sondas menores.
Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser efetuada usando os ácidos nucleicos. Exemplos incluem amplificação alelo-específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al., (1993) Genomics 16:325-332), ligação alelo-específica (Landegren et al. (1988) Science 241:1077-1080), reações de prolongamento nucleotídico (Sokolov (1990) Nucleic Acid Res. 18:3671), mapeamento híbrido por radiação (Walter et al. (1997) Nat. Genet.
5 7:22-28) e mapeamento feliz (happy mapping) (Dear e Cook (1989) Nueleic Acid Res. 17:6795-6807). Para esses métodos, a seqüência de um ácido nucleico é usada para desenhar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de prolongamento de iniciador. O desenho de tais iniciadores é bem conhecido por aqueles versados na técnica. 10 Em métodos que empregam mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os progenitores do cruzamento do mapeamento na região correspondente à seqüência do ácido nucleico imediato. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em
plantas que têm características relacionadas a rendimento intensificado, como descrito anteriormente. Essas características também podem ser combinadas com outras características vantajosas economicamente tal como características que intensificam rendimento adicionalmente, tolerância a 20 outros estresses abióticos e bióticos, características que modificam várias características arquitetônicas e/ou características bioquímicas e/ou fisiológicas.
(v)RCA
Surpreendentemente, descobriu-se agora que aumentar a 25 expressão de um ácido nucleico que codifica um polipeptídio de ribulose-1,5- bifosfato carboxilase/oxigenase (RuBisCO) ativase (RCA) em uma planta dá plantas que têm características relacionadas a rendimento intensificado em relação a plantas controle. A classe particular de polipeptídios RCA adequados para intensificar características relacionadas a rendimento em plantas é descrita em detalhes abaixo.
A presente invenção provê um método para intensificar características relacionadas a rendimento em plantas em relação a plantas controle, compreendendo aumentar a expressão em uma planta de uma 5 seqüência de ácido nucleico que codifica um polipeptídio RCA.
Qualquer referência daqui por diante a um “polipeptídio útil nos métodos da invenção” é tomada como significando polipeptídio RCA conforme aqui definido. Qualquer referência daqui por diante a uma “seqüência de ácido nucleico útil nos métodos da invenção” é tomada como 10 significando uma seqüência de ácido nucleico capaz de codificar tal polipeptídio RCA. Os termos “polinucleotídio(s)”, “sequência(s) de ácido nucleico”, “sequência(s) nucleotídica(s)” também são conforme aqui definido. O termo “planta controle” também é conforme aqui definido.
Um método preferido para aumentar a expressão de uma seqüência de ácido nucleico que codifica um polipeptídio útil nos métodos da invenção é introduzir e expressar em uma planta uma seqüência de ácido nucleico que codifica um polipeptídio útil nos métodos da invenção conforme definido abaixo.
A seqüência de ácido nucleico a ser introduzido em uma planta 20 (e, portanto, útil na realização dos métodos da invenção) é qualquer seqüência de ácido nucleico que codifica o tipo de polipeptídio que será descrito agora, daqui em diante também nomeada “seqüência de ácido nucleico de RCA” ou “gene de RCA”. Um polipeptídio “RCA” conforme aqui definido se refere a qualquer seqüência polipeptídica que não seja regulada por redox e 25 compreendendo da extremidade N-terminal para a C-terminal: (i) peptídeo de trânsito de plastos; (ii) em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% de identidade de seqüência com o domínio AAA conforme representado pela SEQ ID NO: 311.
Adicionalmente, um polipeptídio RCA pode compreender dentro do domínio AAA um Motivo 1 G(G/R)KG(Q/E)GK(S/T) conforme representado pela SEQ ID NO: 312. Dentro deste motivo, é permitida uma ou mais alterações conservativas em qualquer posição e/ou uma ou duas alterações não conservativas em qualquer posição.
Senão, um polipeptídio “RCA” conforme aqui definido se refere a qualquer seqüência polipeptídica que não seja regulada por redox com, em ordem crescente de preferência, pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% de identidade de seqüência com o polipeptídio RCA conforme representado pela SEQ ID NO: 251.
Um polipeptídio RCA que não é regulado por redox é tomado aqui como significando um polipeptídio RCA que não é regulado por luz através do sistema ferredoxina/tiorredoxina. Exemplos de tais polipeptídios de RCA são os polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou polipeptídios RCA alfa (forma longa, ou LF) que foram truncados ou mutados na extensão C-terminal para prevenir regulação redox.
Exemplos de polipeptídios úteis nos métodos da invenção e seqüências de ácido nucleico que codificam os mesmos são conforme dados abaixo na tabela Dl da seção de Exemplos. Tais polipeptídios RCA são os polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou polipeptídios RCA alfa (forma longa, ou LF) que estão truncados ou mutados na extensão C-terminal para prevenir regulação redox.
Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências polipeptídicas dadas na tabela Dl da seção de Exemplos. “Homólogos” são definidos aqui na seção de Definições.
Também úteis nos métodos da invenção são derivados de qualquer um dos polipeptídios dados na tabela Dl ou ortólogos ou parálogos de quaisquer das SEQ ID NOs anteriormente mencionadas. “Derivados” são conforme definido aqui na seção de Definições. Derivados de SEQ ID NO: 251 ou quaisquer dos polipeptídios dados na tabela Dl são preferidos. A invenção é ilustrada por plantas transformantes com a seqüência de ácido nucleico de Chlamydomonas reinhardtii representada pela SEQ ID NO: 250, que codifica a seqüência polipeptídica de SEQ ID NO: 251, entretanto, a realização da invenção não está restrita a essas seqüências. Os métodos da invenção podem vantajosamente ser realizados usando qualquer ácido nucleico que codifica uma proteína útil nos métodos da invenção conforme aqui definido, incluindo ortólogos e parálogos, tais como quaisquer seqüências de ácido nucleico dadas na tabela Dl. Tais polipeptídios RCA são os polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou polipeptídios RCA alfa (forma longa, ou LF) que estão truncados ou mutados na extensão C-terminal para prevenir regulação redox.
As seqüências polipeptídicas dadas na tabela Dl podem ser consideradas como sendo ortólogas e parálogas ao polipeptídio RCA representado pela SEQ ID NO: 251, os termos “ortólogos” e “parálogos” sendo conforme aqui definido.
Ortólogos e parálogos podem facilmente serem encontrados pela realização de uma também chamada pesquisa blast recíproca. Tipicamente, esta envolve um primeiro BLAST envolvendo fazer um BLAST de uma seqüência de dúvida (por exemplo, usando quaisquer das seqüências listadas na tabela Dl) contra qualquer banco de dados de seqüências, tal como o banco de dados do NCBI disponível publicamente. BLASTN ou BLASTX (usando valores padrões) são usados geralmente quando se parte de uma seqüência nucleotídica e BLASTP ou TBLASTN (usando valores padrões) quando se parte de uma seqüência proteica. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências completas dos resultados filtrados ou dos resultados não filtrados são então submetidas a BLAST reverso (segundo BLAST) contra seqüências do organismo a partir do qual a seqüência de dúvida é derivada (quando a seqüência de dúvida for SEQ ID NO: 250 ou SEQ ID NO: 251, o segundo BLAST seria portanto contra seqüências de Chlamydomonas reinhardtii). Os resultados do primeiro e segundo BLASts são então comparados. Um parálogo é identificado se um sucesso de alta classificação do primeiro blast for da mesma espécie que aquela da qual a seqüência de dúvida é derivada, um BLAST reverso então resulta idealmente na seqüência de dúvida como o sucesso mais alto; um ortólogo é identificado se um sucesso de alta classificação no primeiro blast não for da mesma espécie que aquela da qual a seqüência dúvida é derivada e de preferência resulta no BLAST reverso na seqüência de dúvida estando entre os sucessos mais altos.
Sucessos de alta classificação são aqueles que têm um baixo valor de E. Quanto menor o valor de E, mais significativa a pontuação (ou em outras palavras, menor a chance de que o sucesso seja obtido por acaso). A computação do valor de E é bem conhecida na técnica. Além dos valores de E, comparações também são pontuadas por identidade porcentual. Identidade porcentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de neighbour joining, para auxiliar a visualizar o agrupamento de genes relacionados e identificar ortólogos e parálogos.
A Tabela Dl dá exemplos de ortólogos e parálogos do polipeptídio RCA representado pela SEQ ID NO: 251. Ortólogos e parálogos adicionais podem prontamente ser identificados usando o procedimento de BLAST descrito acima. Tais polipeptídios RCA são os polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou polipeptídios RCA alfa (forma longa, ou LF) que estão truncados ou mutados na extensão C- terminal para prevenir regulação redox.
Os polipeptídios da invenção são identificáveis pela presença do domínio AAA conservado (mostrado na Figura 14), o termo “domínio” sendo conforme aqui definido. O termo “motivo”, “seqüência consenso” e “assinatura” também são conforme aqui definido.
O termo “extensão” conforme aqui definido, se refere aos resíduos de aminoácidos adicionais de polipeptídios que se prolongam além do último aminoácido do polipeptídio mais curto em um alinhamento de 5 seqüências múltiplas. Os resíduos de aminoácidos podem ocorrer naturalmente, ou serem modificados por intervenção humana.
Bancos de dados de especialista existem para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242- 10 244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., 15 Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002)). Um grupo de ferramentas para análise in silico de seqüências de proteínas está disponível no servidor de proteômica ExPASY (hospedado pelo Instituto Suíço de Bioinformática (Gasteiger et al., ExPASy: 20 the proteomies server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). Por exemplo, o domínio AAA de SEQ ID NO: 251 é representado no banco de dados InterPro pelo número de acesso IPR003959.
Domínios também podem ser identificados usando técnicas de 25 rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (isto é, abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de intervalos. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403- 10) calcula a identidade de seqüência porcentual e desempenha uma análise estatística da similaridade entre as duas seqüências. O programa para desempenhar análise de BLAST está publicamente disponível através do Centro Nacional para Informação em Biotecnologia (NCBI). Homólogos podem prontamente serem identificados usando, por exemplo, o algoritmo de alinhamento de seqüências múltiplas ClustalW (versão 1.83), com os parâmetros de alinhamento para a par padrões e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de programas MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Editoração manual menor pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como seria evidente a uma pessoa versada na técnica. Além disso, em vez de usar seqüências completas para a identificação de homólogos, domínios específicos (tal como o domínio AAA, ou um dos motivos definidos acima) também podem ser usados. Os valores de identidade de seqüências, que são indicados abaixo no Exemplo 3 como um porcentual foram determinados para a seqüência de aminoácidos ou de ácido nucleico inteira e/ou para domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrões.
A tarefa de previsão da localização subcelular de proteínas é importante e bem estudada. Conhecer a localização de uma proteína auxilia a elucidar sua função. Métodos experimentais para localização proteica variam de imunolocalização a etiquetagem de proteínas usando proteína verde fluorescente (GFP). Tais métodos são precisos embora trabalhosos comparados com métodos computacionais. Recentemente, muito progresso foi feito em previsão computacional de localização proteica a partir de dados de seqüência. Entre algoritmos bem conhecidos por uma pessoa versada na técnica estão disponíveis nas ferramentas de proteômica do ExPASy hospedado pelo Instituto Suíço de para Bioinformática, por exemplo, PSort, TargetP, ChloroP, Predotar, LipoP, MITOPROT, PATS, PTSI, SignalP e outros. A identificação de localização subcelular do polipeptídio da invenção é descrita aqui na seção de Exemplos. Em particular, SEQ ID NO: 251 da presente invenção é designada para o compartimento plastídico (cloroplastídico) de células fotossintéticas (autotrófícas).
Métodos para direcionamento a plastídios são bem conhecidos na técnica e incluem o uso de peptídios de trânsito. A tabela abaixo mostra exemplos de peptídios de trânsito que podem ser usados para direcionar qualquer polipeptídio RCA a um plastídio, polipeptídio RCA que não é, em sua forma natural, direcionado normalmente a um plastídio, ou polipeptídio RCA que em sua forma natural é direcionado a um plastídio em virtude de um peptídeo de trânsito diferente (por exemplo, seu peptídeo de trânsito natural). Por exemplo, uma seqüência de ácido nucleico que codifica um polipeptídio RCA de cianobactéria (de Anabaena, descrito por Li et al., (1993) Plant Molec Biol 21(5): 753-764; SEQ ID NO: 301) também podem ser adequados para uso nos métodos da invenção contanto que o polipeptídio RCA seja direcionado a um plastídio, de preferência a um cloroplasto e que ele não seja regulado por redox.
Exemplos de seqüências peptídicas de trânsito úteis no direcionamento de polipeptídios a plastídios
Número de Organismo Função Proteica Seqüência Peptídica de Acesso Fonte Trânsito NCBI/ SEQ ID NO SEQ ID NO: Chlamydomo Ferredoxina MAMAMRSTF AARVGAK P07839 nas PAVRGARPASRMSCMA SEQ ID NO: Chlamydomo Rubisco ativase MQVTMKSSAVSGQRVG AAR23425 nas GARVATRSVRRAQLQV SEQ ID NO: Arabidopsis Aspartato amino MASLMLSLGSTSLLPREI CAA56932 thaliana transferase NKDKLKLGTSASNPFLK AKSFSRVTMTVA VKPSR SEQ ID NO: Arabidopsis Proteína 1 acil MATQFSASVSLQTSCLA CAA31991 thaliana carreadora TTRISFQKPALISNHGKT NLSFNLRRSIPSRRLSVSC SEQ ID NO: Arabidopsis Proteína 2 acil MASIAASASISLQARPRQ CAB63798 thaliana carreadora LAIAASQVKSF SNGRRS S LSFNLRQLPTRLTVSCAA KPETVDK V C A V VRKQL SEQ ID NO: Arabidopsis Proteína 3 acil MASIATS ASTSLQARPRQ CAB63799 thaliana carreadora L VIGAKQ VKSF S YGSRS NL SFNLRQLPTRLTV Y C AAKPET VDKV CAVVRK QLSLKE O polipeptídio RCA é direcionado e está ativo no cloroplasto, isto é, o polipeptídio RCA é capaz de realizar i,a atividade dual: (re)-ativação da RuBisCo e hidrólise de ATP, no cloroplasto. Ensaios para testar essas atividades são bem conhecidos na técnica. Detalhes adicionais são providos 5 aqui na seção de Exemplos.
Seqüências de ácido nucleico codificando polipeptídios úteis nos métodos da invenção não precisam ser seqüências de ácido nucleico completas, visto que a realização dos métodos da invenção não depende do uso de seqüências de ácido nucleico completas. Exemplos de seqüências de 10 ácido nucleico adequadas para uso na realização dos métodos da invenção incluem seqüências de ácido nucleico dadas na Tabela Dl, mas não estão limitadas àquelas seqüências. Variantes de ácido nucleico também podem ser úteis na prática dos métodos da invenção. Exemplos de tais variantes incluem porções de seqüências de ácido nucleico que codificam um polipeptídio útil 15 nos métodos da invenção, seqüências de ácido nucleico que se hibridizam a seqüências de ácido nucleico que codificam um polipeptídio útil nos métodos da invenção, variantes de splice de seqüências de ácido nucleico que codificam um polipeptídio útil nos métodos da invenção, variantes alélicas de seqüências de ácido nucleico que codificam um polipeptídio útil nos métodos da invenção e variantes de seqüências de ácido nucleico que codificam um polipeptídio útil nos métodos da invenção que são obtidas por mutagênese sítio-dirigida. Os termos porção, seqüência de hibridização, variante de splice, variante alélica e mutagênese sítio-dirigida serão agora descritos.
5 De acordo com a presente invenção, é provido um método para
intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácido nucleico dadas na Tabela Dl, ou uma porção de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de 10 quaisquer das seqüências polipeptídicas dadas na Tabela Dl. Tais porções de polipeptídios RCA são de polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou de polipeptídios RCA alfa (forma longa, ou LF) que estão truncados ou mutados na extensão C-terminal para prevenir regulação redox.
Porções úteis nos métodos da invenção codificam um
polipeptídio caindo na definição de uma seqüência de ácido nucleico que codifica um polipeptídio útil nos métodos da invenção conforme aqui definido e que tem consideravelmente a mesma atividade biológica que as seqüências polipeptídicas dadas na Tabela Dl. De preferência, a porção é uma porção de 20 qualquer uma das seqüências de ácido nucleico dadas na Tabela Dl. A porção tem tipicamente pelo menos 900 nucleotídeos consecutivos de comprimento, de preferência pelo menos 1000 nucleotídeos consecutivos de comprimento, de maior preferência pelo menos 1100 nucleotídeos consecutivos de comprimento e da maior preferência pelo menos 1227 nucleotídeos 25 consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na Tabela Dl. De preferência, a porção codifica uma seqüência polipeptídica que não é regulada por redox e compreendendo da extremidade N-terminal para a C-terminal: (i) peptídeo de trânsito de plastos; (ii) em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% de identidade de seqüência com o domínio AAA conforme representado pela SEQ ID NO: 311; e que adicionalmente compreende dentro do domínio AAA um Motivo 1 G(G/R)KG(Q/E)GK(S/T) conforme representado pela SEQ ID NO: 312. Da maior preferência, a porção é uma porção da seqüência de ácido nucleico de SEQ ID NO: 250.
Uma porção de uma seqüência de ácido nucleico que codifica um polipeptídio RCA conforme aqui definido pode ser preparada, por exemplo, pela feitura de uma ou mais deleções na seqüência do ácido nucleico. As porções podem ser usadas de forma isolada ou elas podem ser fusionadas a outras seqüências codificantes (ou não codificantes) a fim de, por exemplo, produzir um polipeptídio que combine várias atividades, ou produzir um polipeptídio direcionado a outro compartimento subcelular fora seu compartimento natural. Quando fusionado a outras seqüências codificantes, o polipeptídio resultante produzido na tradução pode ser maior que aquele previsto para a porção polipeptídica de RCA.
Outra variante de ácido nucleico útil nos métodos da invenção é uma seqüência de ácido nucleico capaz de se hibridizar, sob condições de estringência reduzida, de preferência sob condições estringentes, com um ácido nucleico codificando um polipeptídio RCA conforme aqui definido, ou com uma porção conforme aqui definida.
Seqüências de hibridização úteis nos métodos da invenção codificam uma seqüência polipeptídica compreendendo da extremidade N- terminal para a C-terminal: (i) peptídeo de trânsito de plastos; (ii) em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% de identidade de seqüência com o domínio AAA conforme representado pela SEQ ID NO: 311; e que pode adicionalmente compreender dentro do domínio AAA um Motivo 1 G(G/R)KG(Q/E)GK(S/T) conforme representado pela SEQ ID NO: 312. A seqüência de hibridização tem tipicamente pelo menos 900 nucleotídeos consecutivos de comprimento, de preferência pelo menos 1000 nucleotídeos consecutivos de comprimento, de maior preferência pelo menos 1100 nucleotídeos consecutivos de comprimento e da maior preferência pelo menos 1200 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na Tabela Dl. De preferência, a seqüência de hibridização é uma que é capaz de se hibridizar com qualquer uma das seqüências de ácido nucleico dadas na Tabela Dl, ou com uma porção de quaisquer dessas seqüências, uma porção sendo conforme definida acima. Da maior preferência, a seqüência de hibridização é capaz de se hibridizar com uma seqüência de ácido nucleico representada pela SEQ ID NO: 250 ou com uma porção desta.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de se hibridizar com qualquer uma das seqüências de ácido nucleico dados na Tabela Dl, ou compreendendo introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de se hibridizar com uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de ácidos nucleicos dadas na Tabela Dl. Tais seqüências de hibridização codificam polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou de polipeptídios RCA alfa (forma longa, ou LF) que estão truncados ou mutados na extensão C-terminal para prevenir regulação redox. O termo “hibridização” é conforme aqui definido.
Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de splice codificando um polipeptídio RCA conforme definido aqui acima, o termo “variante de splice” sendo conforme aqui definido.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de splice de qualquer uma das seqüências de ácido nucleico dadas na Tabela Dl, ou uma variante de splice de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências polipeptídicas dadas na Tabela Dl. Tais variantes de splice de seqüências de ácido nucleico codificam polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou polipeptídios RCA alfa (forma longa, ou LF) que estão truncados ou mutados na extensão C-terminal para prevenir regulação redox.
Variantes de splice preferidas são variantes de splice de uma seqüência de ácido nucleico representada pela SEQ ID NO: 250, ou uma variante de splice de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 251. De preferência, a seqüência polipeptídica codificada pela variante de splice compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos.
Outra variante de ácido nucleico útil na realização dos métodos da invenção é uma variante alélica de uma seqüência de ácido nucleico que codifica um polipeptídio RCA conforme definida aqui acima. Alelos ou variantes alélicas são formas alternativas de um dado gene, localizado na mesma posição cromossômica. Variantes alélicas existem na natureza e o uso desses alelos naturais é abrangido pelos métodos da presente invenção. Variantes alélicas abrangem Polimorfismos de Nucleotídeo único (SNPs), assim como Polimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho de INDELs geralmente é de menos de 100 pb. SNPs e INDELs formam o maior grupo de variantes de seqüências em cepas polimórficas que ocorrem naturalmente da maioria dos organismos.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante alélica de qualquer uma das seqüências de ácido nucleico dadas na Tabela Dl, ou compreendendo introduzir e expressar em uma planta uma variante alélica de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências polipeptídicas dadas na Tabela Dl. Tais variantes alélicas de seqüências de ácido nucleico codificam polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou codificam polipeptídios RCA alfa (forma longa, ou LF) que estão truncados ou mutados na extensão C-terminal para prevenir regulação redox.
De preferência, a variante alélica é uma variante alélica de SEQ ID NO: 250 ou uma variante alélica de uma seqüência de ácido nucleico que codifica um ortólogo ou parálogo de SEQ ID NO: 251. De preferência, a seqüência polipeptídica codificada pela variante alélica compreende qualquer um ou mais dos motivos ou domínios conforme aqui definidos.
Uma variante de ácido nucleico adicional útil nos métodos da invenção é uma variante de ácido nucleico obtida por mutagênese sítio- dirigida, que é definida aqui na seção de Definições.
De acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácido nucleico dadas na Tabela Dl, ou compreendendo introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de quaisquer das seqüências de polipeptídicas dadas na Tabela Dl, tal seqüência de ácido nucleico variante é obtida por mutagênese sítio-dirigida. Tais variantes de ácido nucleico obtidas por mutagênese sítio-dirigida codificam polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou codificam polipeptídios RCA alfa (forma longa, ou LF) que estão truncados ou mutados na extensão C-terminal para prevenir regulação redox.
De preferência, a seqüência de ácido nucleico variante obtida por mutagênese sítio-dirigida codifica uma seqüência polipeptídica compreendendo qualquer um ou mais dos motivos ou domínios conforme aqui definidos.
As seguintes variante de ácido nucleico que codificam polipeptídios RCA são exemplos de variantes adequadas na prática dos métodos da invenção:
(i) uma porção de uma seqüência de ácido nucleico que codifica um polipeptídio RCA;
(ii) uma seqüência de ácido nucleico capaz de se hibridizar com uma seqüência de ácido nucleico que codifica um polipeptídio RCA;
(iii) uma variante de splice de uma seqüência de ácido nucleico que codifica um polipeptídio RCA;
(iv) uma variante alélica de uma seqüência de ácido nucleico que codifica um polipeptídio RCA;
(v) uma seqüência de ácido nucleico que codifica um polipeptídio RCA obtida por mutagênese sítio-dirigida;
polipeptídio RCA o qual não é regulado por redox.
Seqüências de ácido nucleico que codificam polipeptídios RCA podem ser derivadas de qualquer fonte natural ou artificial. A seqüência de ácido nucleico pode ser modificada a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana intencional. De preferência, a seqüência de ácido nucleico codificando um polipeptídio RCA se origina de uma célula fotossintética (reino Plantae). De preferência adicional a seqüência de ácido nucleico que codifica um polipeptídio RCA se origina de uma célula vegetal. De maior preferência, a seqüência de ácido nucleico que codifica um polipeptídio RCA se origina de uma célula de diatomácea. Da maior preferência, a seqüência de ácido nucleico que codifica um polipeptídio RCA se origina de uma célula de alga (vermelha, parda ou verde). A seqüência de ácido nucleico pode ser isolada da alga verde pertencendo a Chlorophyta ou Charophyta, ou de plantas terrestres, não vasculares ou vasculares. Da maior preferência, a seqüência de ácido nucleico que codifica um polipeptídio RCA é de Chlamydomonas reinhardtii.
Qualquer referência a um polipeptídio RCA é tomada, portanto, como significando um polipeptídio RCA conforme acima definido. Qualquer seqüência de ácido nucleico que codifica tal polipeptídio RCA é adequada para uso na realização dos métodos da invenção.
A presente invenção também abrange plantas ou partes (incluindo sementes) obteníveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico que codifica um polipeptídio RCA conforme definido acima.
A invenção também provê construções genéticas e vetores para facilitar a introdução e/ou a expressão das seqüências de ácido nucleico úteis nos métodos de acordo com a invenção, em uma planta. As construções gênicas podem ser inseridas em vetores, que podem estar disponíveis comercialmente, adequados para transformação em plantas e adequadas para expressão do gene de interesse nas células transformadas. A invenção também provê uso de uma construção gênica conforme aqui definido nos métodos da invenção.
Mais especificamente, a presente invenção provê uma construção compreendendo:
(a) seqüência de ácido nucleico codificando um polipeptídio RCA conforme definido acima;
(b) uma ou mais seqüências controle capazes de direcionar a expressão da seqüência de ácido nucleico de (a) e opcionalmente
(c) uma seqüência de término de transcrição.
Uma construção preferida é uma em que a seqüência de controle é um promotor constitutivo forte, de maior preferência um promotor GOS2, de preferência adicional o promotor GOS2 de arroz, da maior preferência o promotor GOS2 de arroz conforme representado pela SEQ ID NO: 306.
Senão, uma construção preferida é uma em que a seqüência de controle é um promotor constitutivo de média força, de maior preferência um 5 promotor HMGB, de preferência adicional o promotor HMGB de arroz conforme representado pela SEQ ID NO: 307.
Senão, uma construção preferida é uma em que a seqüência de controle é um promotor específico de tecido verde, de maior preferência um promotor de protoclorofilídeo redutase, de preferência adicional o promotor de protoclorofilídeo redutase de arroz conforme representado pela SEQ ID NO: 308.
Plantas são transformadas com um vetor compreendendo a seqüência de interesse (isto é, um ácido nucleico codificando um polipeptídio RCA conforme aqui definido). O técnico versado está bem consciente dos 15 elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar de modo bem-sucedido células hospedeiras contendo a seqüências de interesse. A seqüência de interesse está ligada operacionalmente a uma ou mais seqüências controle (pelo menos a um promotor). Os termos “elemento regulatório”, “seqüência controle” e 20 “promotor” são conforme definido aqui acima. O termo “ligado operacionalmente” também é conforme aqui definido.
Vantajosamente, qualquer tipo de promotor pode ser usado para direcionar a expressão da seqüência de ácido nucleico. O termo “promotor” se refere a uma seqüência de controle de ácido nucleico 25 localizada a montante do início de transcrição de um gene e que está envolvida no reconhecimento e ligação da RNA polimerase e outras proteínas, direcionando desse modo a transcrição de uma seqüência de ácido nucleico ligado operacionalmente. Um promotor “vegetal” compreende elementos regulatórios, que mediam a expressão de um segmento de seqüência codificante em células vegetais. Consequentemente, um promotor vegetal não precisa ser de origem vegetal, mas pode se originar de vírus ou microorganismos, por exemplo de vírus que atacam células vegetais. O “promotor vegetal” também pode se originar de uma célula vegetal, p. ex., da planta que é transformada com a seqüência de ácido nucleico a ser expressa no processo inventivo e aqui descrito. Isto também se aplica a outros sinais regulatórios “vegetais”, tal como terminadores “vegetais”. Os promotores a montante das seqüências nucleotídicas úteis nos métodos da presente invenção podem ser modificados por uma ou mais substituições, inserções e/ou deleções nucleotídicas sem interferir com a funcionalidade ou atividade dos promotores, da fase de leitura aberta (ORF) ou da região regulatória 3’ tal como terminadores ou outras regiões regulatórias 3 ’ que estão localizadas fora da ORF. Além disso, é possível que a atividade dos promotores seja aumentada pela modificação de suas seqüências, ou que eles sejam completamente substituídos por promotores mais ativos, mesmo promotores de organismos heterólogos. Para expressão em plantas, a molécula de ácido nucleico deve, conforme descrito acima, estar ligada operacionalmente a ou compreender um promotor adequado que expresse o gene no momento certo e com o padrão de expressão espacial requerido.
O promotor pode ser um promotor constitutivo ou um promotor induzível, por exemplo, um promotor induzível por estresse. Senão, o promotor pode ser um promotor órgão-específico ou tecido-específico (veja aqui a seção de definições para definições e exemplos de vários tipos de promotores).
Em uma modalidade, a seqüência de ácido nucleico está ligada operacionalmente a um promotor constitutivo forte. De preferência, o promotor é derivado de uma planta, de maior preferência, o promotor é de uma planta monocotiledônea se for para ser transformada uma planta monocotiledônea. Em uma modalidade preferida, o promotor constitutivo é um promotor GOS2, de preferência adicional um promotor GOS2 de arroz. Da maior preferência, o promotor GOS2 é conforme representado pela SEQ ID NO: 306. Deve estar claro que a aplicabilidade da presente invenção não está restrita à seqüência do ácido nucleico que codifica um polipeptídio RCA conforme representado pela SEQ ID NO: 250, a aplicabilidade da invenção também não está restrita à expressão de uma seqüência de ácido nucleico que codifica um polipeptídio RCA quando direcionado por um promotor GOS2.
Senão, a seqüência de ácido nucleico está operacionalmente ligada a um promotor constitutivo, de preferência, um promotor HMGB, de preferência adicional um promotor HMGB de arroz. Da maior preferência, o promotor HMGB é conforme representado pela SEQ ID NO: 307. Deve estar claro que a aplicabilidade da presente invenção não está restrita à seqüência de ácido nucleico que codifica um polipeptídio RCA conforme representado pela SEQ ID NO: 250, a aplicabilidade da invenção também não está restrita à expressão de uma seqüência de ácido nucleico que codifica um polipeptídio RCA quando direcionado por um promotor HMGB.
De acordo com outra modalidade preferida, o ácido nucleico que codifica um polipeptídio RCA está operacionalmente ligado a um promotor específico de tecido verde, de preferência um promotor de protoclorofilídeo redutase, de preferência adicional o promotor de protoclorofilídeo redutase de arroz. Da maior preferência, o um promotor específico de tecido verde é conforme representado pela SEQ ID NO: 308. Deve estar claro que a aplicabilidade da presente invenção não está restrita à seqüência de ácido nucleico que codifica um polipeptídio RCA conforme representado pela SEQ ID NO: 250, a aplicabilidade da invenção também não está restrita à expressão de uma seqüência de ácido nucleico que codifica um polipeptídio RCA quando direcionado por um promotor de protoclorofilídeo redutase. Outros promotores específicos de tecido verde que estão disponíveis para a expressão de genes em plantas são descritos em DE-A 19644478.
Para a identificação de promotores funcionalmente equivalentes, a força do promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, pela ligação operacional do promotor a um gene repórter e avaliando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glicuronidase ou beta-galactosidase. A atividade promotora é avaliada pela medição da atividade enzimática da beta- glicuronidase ou beta-galactosidase. A força do promotor e/ou padrão de expressão podem então ser comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Senão, a força do promotor pode ser avaliada pela quantificação de níveis de mRNA ou pela comparação dos níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA dos genes estruturais tal como de rRNA 18S, usando métodos conhecidos na técnica, tal como transferência de Northern com análise densitométrica de auto-radiogramas, PCR em tempo real quantitativo ou RT-PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente, por “promotor fraco” entende-se um promotor que direciona a expressão de uma seqüência codificante para um nível baixo. Por “nível baixo” entende-se níveis de cerca de 1/10.000 transcritos até cerca de 1/100.000 transcritos, até cerca de 1/500.000 transcritos por célula. No sentido inverso, um “promotor forte” direciona a expressão de uma seqüência codificante para um nível alto, ou para cerca de 1/10 transcritos até cerca de 1/100 transcritos até cerca de 1/1.000 transcritos por célula.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta; o termo “terminador” sendo conforme aqui definido. Elementos regulatórios adicionais podem incluir intensificadores transcricionais assim como traducionais. Aqueles versados na técnica terão consciência de seqüências terminadoras e intensificadoras que podem ser adequadas para uso na realização da invenção. Tais seqüências seriam conhecidas ou poderiam ser prontamente obtidas por uma pessoa versada na técnica.
5 Uma seqüência intrônica também pode ser adicionada na
região 5’ não traduzida (UTR) ou na seqüência codificante para aumentar a quantidade da mensagem madura que se acumula no citosol. Demonstrou-se que a inclusão de um íntron processável por splice na unidade de transcrição tanto em construções de expressão vegetais como animais aumenta a 10 expressão gênica tanto em níveis de mRNA como protéicos até 1000 vezes (Buchman e Berg, Mol. Cell Biol. 8:4395-4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal intensificação por íntron da expressão gênica é tipicamente a maior quando colocado próximo da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntrons de Adhl-S 1, 2 e 6, o íntron 15 Bronze-I é conhecido na técnica. Para informação geral, veja The Maize Handbook, Capítulo 116, Freeling e Walbot, Eds., Springer, N.Y. (1994).
Outras seqüências controle (além de regiões de promotora, intensificadora, silenciadora, 3’UTR e/ou 5’UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências seriam conhecidas ou podem ser prontamente obtidas por uma pessoa versada na técnica.
As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é necessária para a manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando é necessária que uma construção genética seja mantida em uma célula 25 bacteriana como um elemento genético epissomal (p. ex., molécula de plasmídio ou cosmídio). Origens de replicação preferidas incluem, mas não estão limitadas a, o fl-ori e colEl.
Para a detecção da transferência bem-sucedida das seqüências de ácido nucleico conforme usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo esses ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Conforme aqui utilizado, o termo “marcador selecionável”, “gene de marcador selecionável” 5 ou “gene repórter” inclui qualquer gene que confira um fenótipo em uma célula em que ele é expresso para facilitar a identificação e/ou seleção de células que sejam transfectadas ou transformadas com uma construção de ácido nucleico da invenção. Esses genes marcadores permitem a identificação de uma transferência bem-sucedida das moléculas de ácido nucleico através 10 de uma série de princípios diferentes. Marcadores adequados podem ser selecionados de marcadores que conferem resistência a antibiótico ou herbicida, que introduzam uma nova característica metabólica ou que permitam seleção visual. Exemplos de genes de marcador selecionável incluem genes que conferem resistência a antibióticos (tal como nptll que 15 fosforila neomicina e canamicina, ou hpt, que fosforila higromicina, ou genes que conferem resistência a, por exemplo, bleomicina, estreptomicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina), a herbicidas (por exemplo, bar que provê resistência a Basta®; aroA ou gox que provê resistência contra glifosato, ou 20 os genes que conferem resistência a, por exemplo, imidazolinona, fosfinotricina ou sulfoniluréia), ou gene que provêem uma característica metabólica (tal como manA que permite que plantas usem manose como única fonte de carbono ou xilose isomerase para a utilização de xilose, ou marcadores antinutritivos tal como a resistência a 2-desoxiglicose). A 25 expressão de genes de marcadores visuais resulta na formação de cor (por exemplo, β-glicuronidade, GUS ou β-galactosidase com seus substratos coloridos, por exemplo, X-Gal), luminescência (tal como, o sistema luciferina/luciferase) ou fluorescência (Proteína Verde Fluorescente, GFP e seus derivados). Esta lista representa apenas um pequeno número de marcadores possíveis. O trabalhador versado está familiarizado com tais marcadores. Marcadores diferentes são preferidos, dependendo do organismo e do método de seleção.
Sabe-se que na integração estável ou transiente de ácidos 5 nucleicos em células vegetais, apenas uma minoria das células pega o DNA estranho e, se desejado, integra ele em seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar esses integrantes, um gene codificante de um marcador selecionável (tal como aqueles descritos acima) geralmente é introduzido nas 10 células hospedeiras junto com o gene de interesse. Esses marcadores podem, por exemplo, ser usados em mutantes em que esses genes não são funcionais, por exemplo, por deleção por métodos convencionais. Além disso, moléculas de ácido nucleico que codificam um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a 15 seqüência que codifica os polipeptídios da invenção ou usados nos métodos da invenção, senão em um vetor separado. Células que foram transfectadas estavelmente com a seqüência de ácido nucleico introduzida podem ser identificadas, por exemplo, por seleção (por exemplo, células que integraram o marcador selecionável sobrevivem enquanto as outras células morrem).
Visto que genes de marcadores, particularmente genes de
resistência a antibióticos e herbicidas, não são mais necessários ou são indesejáveis na célula hospedeira transgênica uma vez que a seqüência de ácido nucleico for introduzida satisfatoriamente, o processo de acordo com a invenção para introduzir as seqüências de ácidos nucleicos vantajosamente 25 emprega técnicas que permitem a remoção ou excisão desses genes de marcadores. Um de tais métodos é o que é conhecido como co-transformação. O método de co-transformação emprega dois vetores simultaneamente para a transformação, um vetor portando o ácido nucleico de acordo com a invenção e um segundo portando o(s) gene(s) de marcador(es). Uma grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes) ambos os vetores. No caso de transformação com agrobactérias os transformantes geralmente recebem apenas uma parte do vetor, isto é, a seqüência flanqueada pelo T-DNA, que geralmente representa 5 o cassete de expressão. Os genes marcadores podem subsequentemente ser removidos da planta transformada pela realização de cruzamentos. Em outro método, genes de marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecido como a tecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte de 10 transposase ou os transformantes são transformados com uma construção de ácido nucleico que confere expressão de uma transposase, transientemente ou estável. Em alguns casos (aproximadamente 10%), o transposon salta do genoma da célula hospedeira uma vez que a transformação tenha ocorrido satisfatoriamente e é perdido. Em um número de casos adicionais, o 15 transposon salta para uma localização diferente. Nesses casos o gene de marcador deve ser eliminado pela realização de cruzamentos. Em microbiologia, foram desenvolvidas técnicas que tomam possível, ou facilitam, a detecção de tais eventos. Um método vantajoso adicional depende do que é conhecido como sistemas de recombinação; cuja vantagem é que a 20 eliminação por cruzamento pode ser dispensada. O melhor sistema conhecido deste tipo é aquele conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene de marcador estiver integrado entre as seqüências IoxP, ele é removido uma vez que a transformação tenha ocorrido satisfatoriamente, pela 25 expressão da recombinase. Sistemas de recombinação adicionais são o sistema HIN/HIX, FLP/FRT e REP/STB (Tribble et al, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Uma integração sítio-específica no genoma vegetal das seqüências de ácido nucleico de acordo com a invenção é possível. Naturalmente, esses métodos também podem ser aplicados a microorganismos tais como levedura, fungos ou bactérias.
A invenção também provê um método para a produção de plantas transgênicas que têm características relacionadas a rendimento 5 intensificadas em relação a plantas controle, compreendendo a introdução e expressão em uma planta de qualquer seqüência de ácido nucleico codificanto um polipeptídio RCA como definido aqui acima. Os termos “transgênico”, “transgene” ou “recombinante” são conforme aqui definidos.
Mais especificamente, a presente invenção provê um método IO para a produção de plantas transgênicas que têm características relacionadas a rendimento aumentado, método o qual compreende:
(i) introduzir e expressar em uma planta ou célula vegetal uma seqüência de ácido nucleico que codifica um polipeptídio RCA e
(ii) cultivar a célula vegetal sob condições que promovem crescimento e desenvolvimento vegetal.
A seqüência de ácido nucleico pode ser introduzida diretamente em uma célula vegetal ou na planta por si só (incluindo a introdução em um tecido, ógão ou qualquer outra parte de uma planta). De acordo com a característica preferida da presente invenção, a seqüência de 20 ácido nucleico é introduzida de preferência em uma planta por transformação, o termo “introdução” ou “transformação” sendo conforme aqui definido.
Além da transformação de células somáticas, que então tem que ser regeneradas em plantas intactas, também é possível transformar as células de meristemas vegetais e em particular aquelas células que se 25 desenvolvem em gametas. Neste caso, os gametas transformados seguem o desenvolvimento da planta natural, dando origem a plantas transgênicas. Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementes são obtidas a partir do desenvolvimento de plantas das quais certa proporção está transformada e assim é transgênica [Feldman, KA e Marks MD (1987) Mol Gen Genet 208:274-289; Feldmann K (1992); Em: C Koncz, N-H Chua e J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapura, pp. 274-289], Métodos alternativos são baseados na remoção repetida das inflorescências e incubação do sítio de excisão no centro da 5 roseta com agrobactérias transformadas, pelas quais sementes transformadas podem igualmente ser obtidas em um momento posterior (Chang (1994). Plant J 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Entretanto, um método especialmente eficaz é o método de infiltração a vácuo com suas modificações tal como o método de “imersão floral”. No caso de 10 infiltração a vácuo de Arabidopsis, plantas intactas sob pressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold, N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso do método de “imersão floral” o tecido floral em desenvolvimento seja incubada brevemente com uma suspensão agrobacteriana tratada com tensoativo [Clough, SJ e Bent, AF 15 (1998) The Plant J 16: 735-743]. Certa proporção de sementes transgênicas é recuperada em ambos os casos e essas sementes podem ser distinguidas de sementes não transgênicas pelo crescimento sob as condições seletivas acima descritas. Além disso, a transformação estável de plastídios é vantajosa devido aos plastídios serem herdados maternalmente, reduzindo ou 20 eliminando o risco de fluxo transgênico através de pólen. A transformação do genoma do cloroplasto é geralmente conseguida por um processo que foi exibido esquematicamente em Klaus et al., 2004 [Nature Biotechnology 22
(2), 225-229]. Em resumo, as seqüências a serem transformadas são clonadas com um gene de marcador selecionável entre seqüências flanqueadoras 25 homólogas ao genoma do cloroplasto. Essas seqüências flanqueadoras homólogas dirigem integração sítio-específica no plastoma. A transformação plastidial foi descrita para muitas espécies vegetais diferentes e uma descrição geral é dada em Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28. Progresso biotecnológico adicional foi relatado recentemente na forma de transformantes de plastídio livre, que podem ser produzidos por um gene marcador co-integrado transiente (Klaus et al, 2004, Nature Biotechnology 22(2), 225-229).
As células vegetais modificadas geneticamente podem ser regeneradas através de todos os métodos com os quais o trabalhador versado está familiarizado. Métodos adequados podem ser encontrados na publicações acima mencionadas de S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer. Geralmente após a transformação, células vegetais ou
agrupamentos celulares são selecionados pela presença de um ou mais marcadores que são codificados por gene expressáveis em plantas co- transferidos com o gene de interesse, após o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como regra, submetido a condições seletivas para que plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas da maneira acima descrita podem ser plantadas e, após um período de crescimento inicial, submetidas a uma seleção adequada por borrifo. Uma possibilidade adicional consiste em cultivar sementes, se apropriado após esterilização, em placas de Agar usando um agente de seleção adequado para que apenas das sementes transformadas possam crescer plantas. Senão, as plantas transformadas são tríadas pela presença de um marcador selecionável tal como aqueles descritos acima.
Após a transferência de DNA e regeneração, plantas
putativamente transformadas também podem ser avaliadas, por exemplo, usando análise de Southern, pela presença do gene de interesse, número de cópias e/ou organização genômica. Senão ou adicionalmente, níveis de expressão do DNA recém-introduzido podem ser monitorados usando análise de Northern ou Western, ambas as técnicas sendo bem conhecidas por pessoas que têm conhecimento ordinário da técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como por propagação clonal ou técnicas de reprodução clássicas. Por exemplo, uma primeira geração (ou TI) de plantas transformadas pode ser auto-cruzadas e segunda geração (ou T2) homozigota de transformantes selecionada e as plantas T2 podem então ser propagadas adicionalmente através de técnicas de reprodução clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, eles podem ser quimeras ou células transformadas e células não transformadas; transformantes clonais (p. ex., todas as células transformadas para conter o cassete de expressão); enxertos de tecidos transformados e não transformados (p. ex., em plantas, um rizoma transformado enxertado em um rebento não transformado). A presente invenção claramente estende-se a qualquer célula
vegetal ou planta produzida por quaisquer dos métodos aqui descritos e a todas as partes e propágulos vegetais dessa. A presente invenção se estende adicionalmente para abranger a progênie de uma planta inteira, órgão, tecido ou célula transfectada ou transformada primária que foi produzida por quaisquer dos métodos acima mencionados, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelos progenitores nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo uma seqüência de ácido nucleico isolado codificando um polipeptídio RCA conforme definido aqui acima. Células hospedeiras preferidas de acordo com a invenção são células vegetais.
Plantas hospedeiras para as seqüência de ácido nucleico ou o vetor usado no método de acordo com a invenção, para o cassete ou construção ou vetor de expressão são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídios usados no método inventivo.
Uma planta transgênica para as finalidades da invenção é, por conseguinte entendida como significando, como acima, que ácidos nucleicos usados no método da invenção não estão em seu loco natural no genoma da citada planta, sendo possível para as seqüências de ácidos nucleicos serem expressas homologamente ou heterologamente. Entretanto, como mencionado, transgênico também significa que, embora as seqüências de ácidos nucleicos de acordo com a invenção ou usadas no método inventivo estejam em suas posições naturais no genoma de uma planta, a seqüência foi modificada com respeito à seqüência natural e/ou que as seqüências regulatórias das seqüências naturais foram modificadas. Transgênico é de preferência entendido como significando a expressão das seqüências de ácidos nucleicos de acordo com a invenção em um loco artificial no genoma, isto é, a expressão homóloga ou, de preferência, heteróloga dos ácidos nucleicos ocorre. Plantas transgênicas preferidas são mencionadas aqui.
A invenção também se estende a partes colhíveis de uma planta tais como, mas não limitando a, sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção, além disso, se relaciona a produtos derivados, de preferência diretamente derivados, de uma parte colhível de tal planta, tal como sedimentados secos ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.
Métodos para aumentar a expressão de seqüências de ácidos nucleicos ou genes, ou produtos gênicos, são bem documentados na técnica e incluem, por exemplo, superexpressão direcionada por promotores apropriados, o uso de intensificadores de transcrição ou intensificadores de tradução. Seqüências de ácidos nucleicos isolados que servem como elementos intensificadores ou promotores podem ser introduzidas em uma posição apropriada (tipicamente a montante) de uma forma não heteróloga de um polinucleotídio para supra-regular a expressão. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção e/ou substituição (veja, Kmiec, Pat. U.S. No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada a partir de um gene da presente invenção para controlar a expressão do gene.
O termo "expressão" ou "expressão gênica" significa a transcrição de um gene específico ou genes específicos ou construção genética específica. O termo "expressão" ou "expressão gênica" em particular significa a transcrição de um gene ou genes ou construção genética em RNA estrutural (rRNA, tRNA) ou mRNA com ou sem subsequente tradução do último em uma proteína. O processo inclui transcrição de DNA e processamento do produto de mRNA resultante.
O termo "aumentar expressão" deve significar um aumento da expressão da seqüência de ácido nucleico que codifica um polipeptídio RCA, aumento que na expressão leva a características relacionadas a rendimento intensificado das plantas em relação a plantas controle. De preferência, o aumento na expressão do ácido nucleico é de 1,25, 1,5, 1,75, 2, 5, 7,5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais vezes a expressão do polipeptídio RCA vegetal endógeno.
Aumentando a expressão (em um plastídio) de uma seqüência de ácido nucleico que codifica um polipeptídio RCA, um aumento na quantidade de polipeptídio RCA é obtido. Este aumento em quantidade de (em um plastídio) leva ao aumento em atividade de RCA. Senão, a atividade também pode ser aumentada quando não houver alteração na quantidade de um polipeptídio RCA, ou mesmo quando houver uma redução na quantidade de um polipeptídio RCA. Isto pode ocorrer quando as propriedades intrínsecas do polipeptídio foram alteradas, por exemplo, fazendo-se versões mutantes que são mais ativas que o polipeptídio que ocorre naturalmente.
A expressão de uma seqüência de ácido nucleico que codifica um polipeptídio RCA é aumentada em um plastídio usando técnicas bem conhecidas na técnica, tal como por direcionamento de um polipeptídio RCA ao plastídio usado seqüências de peptídeo de trânsito ou por transformação direta de um polipeptídio RCA sem seqüências peptídicas de trânsito, em um plastídio. A expressão pode ser aumentada em qualquer plastídio, entretanto, prefere-se aumentar preferencialmente a expressão em um cloroplasto.
Se a expressão polipeptídica é desejada, é geralmente desejável incluir uma região de poliadenilação na extremidade 3' de uma região codificante polinucleotídica. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência da extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou senão de outro gene vegetal, ou de menor preferência de qualquer outro gene eucariótico.
Uma seqüência intrônica também pode ser adicionada conforme acima descrito.
Outras seqüências controle (além de regiões de promotora, intensificadora, silenciadora, 3'UTR e/ou 5'UTR) podem ser elementos estabilizadores de proteína e/ou RNA.
Conforme acima mencionado, um método preferido para aumentar a expressão de uma seqüência de ácido nucleico que codifica um polipeptídio RCA é pela introdução e expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídio RCA; entretanto, os efeitos da realização do método, isto é, da intensificação de características relacionadas a rendimento também podem ser alcançados usando outras técnicas bem conhecidas. Uma descrição de algumas dessas técnicas se seguirá agora.
Uma de tais técnicas é etiquetagem de ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), que envolve a inserção de T- DNA, geralmente contendo um promotor (também pode ser um intensificador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb a montante ou jusante da região codificante de um gene em uma configuração tal que o promotor direcione a expressão do gene alvo. Tipicamente, a regulação de expressão do gene alvo por seu promotor natural é interrompida e o gene cai sob o controle do promotor recém-introduzido. O promotor está tipicamente incrustado em um T-DNA. Este T-DNA é inserido aleatoriamente no genoma vegetal, por exemplo, através de infecção por Agrobacterium e leva à expressão modificada de gene próximos ao T-DNA inserido. As plantas transgênicas resultantes exibem fenótipos dominantes devido à expressão modificada de genes próximos ao promotor introduzido.
Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Direcionadas em Genomas). Esta é uma tecnologia de mutagênese útil para gerar e/ou identificar uma seqüência de ácido nucleico que codifica um polipeptídio RCA com expressão e/ou atividade modificada. TILLING também exibe seleção de plantas portando tais variantes mutantes. Essas variantes mutantes podem exibir expressão modificada, ou em força ou em localização ou em temporização (se as mutações afetarem o promotor, por exemplo). Essas variantes mutantes podem exibir atividade polipeptídica de RCA maior que aquela exibida pelo gene em sua forma natural. TILLING combina mutagênese de alta densidade com métodos de triagem de alta produtividade. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei GP e Koncz C (1992) em Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16- 82; Feldmann et al., (1994) em Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J e Caspar T (1998) em J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação de DNA e junção de indivíduos; (c) amplificação por PCR de uma região de interesse; (d) desnaturação e ligação para permitir a formação de heterodúplexes; (e) DHPLC, onde a presença de um heterodúplex em um conjunto é detectada como um pico extra no cromatograma; (f) identificação do indivíduo mutante e (g) seqüenciamento do produto de PCR mutante. Métodos para TILLING são bem conhecidos na técnica (McCallum et ai, (2000) Nat Biotechnol 18: 455-457; revisto por Stemple (2004) Nat Rev Genet 5(2): 145-50). Os efeitos da invenção também podem ser reproduzidos
usando recombinação homóloga, que permite a introdução em um genoma de uma seqüência de ácido nucleico selecionado em uma posição selecionada definida. Recombinação homóloga é uma tecnologia padrão usada rotineiramente em ciências biológicas para organismos inferiores tais como levedura ou o musgo Physcomitrella. Métodos para realizar recombinação homóloga em plantas foram descritos não apenas para plantas modelo (Offringa et ai. (1990) EMBO J 9(10): 3077-84), mas também para plantas de colheita, por exemplo, arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; Iida e Terada (2004) Curr Opin Biotech 15(2): 132-8). Referência aqui a características relacionadas a rendimento é
tomada como significando um aumento em biomassa (peso) de uma ou mais partes de uma planta, que podem incluir partes acima do solo (colhíveis) e/ou partes (colhíveis) abaixo do solo. Em particular, tais partes colhíveis são sementes e a realização dos métodos da invenção resulta em plantas que têm rendimento de semente aumentado em relação ao rendimento de semente de plantas controle. Os termos "rendimento" e "rendimento de semente" são conforme aqui definido. Os termos "aumentado", "melhorado", "intensificado" são conforme aqui definido.
Em particular, a característica relacionada a rendimento é selecionada de um ou mais dos seguintes: (i) vigor inicial aumentado, (ii) biomassa acima do solo aumentada; (iii) tempo de floração precoce; (iv) número aumentado de sementes (preenchidas) e (v) TKW aumentado.
Tomando milho como exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento do número de plantas estabelecidas por hectare ou acre, um aumento do número de espigas por planta, um aumento do número de fileiras, número de semente por fileira, peso de semente, peso de cem sementes, comprimento/diâmetro de espiga, aumento na taxa de preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), entre outros. Tomando arroz como exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculo) por panícula (que é expresso como uma razão do número de sementes preenchidas sobre o número de panículas primárias), aumento na taxa de preenchimento de semente (que é o número de sementes preenchidas dividido pelo número total de sementes e multiplicado por 100), aumento em peso de cem sementes, entre outros.
Características relacionadas a rendimento intensificado
também podem resultar em arquitetura modificada, ou podem ocorrer devido a arquitetura modificada.
Visto que plantas transgênicas de acordo com a presente invenção têm características relacionadas a rendimento intensificado, é provável que essas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte do ciclo de vida delas), em relação à taxa de crescimento de plantas controle em um estágio correspondente no ciclo de vida delas. A taxa de crescimento aumentada pode ser específica para um ou mais partes de uma planta (incluindo sementes), ou pode ser consideravelmente pela planta inteira. Plantas que têm uma taxa de crescimento aumentado podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser tomado como significando o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta tenha produzido sementes maduras secas, similar ao material de partida. O ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, índice de verdor, tempo de floração e velocidade de maturação de semente. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante consideravelmente o ciclo de vida da planta inteira. Taxa de crescimento aumentada durante os estágios iniciais do ciclo de vida de uma planta pode refletir vigor aumentado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que seria possível de outro modo (um efeito similar pode ser obtido com tempo de floração mais precoce). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz seguida por semeadura e colheita de plantas de arroz adicionais todos dentro de um período de crescimento convencional). De modo similar, se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes de diferentes espécies de plantas (por exemplo, a semeadura e colheita de plantas de milho seguida, por exemplo, pela semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Colher em momentos adicionais o mesmo rizoma no caso de algumas plantas de colheita também pode ser possível. Alterar o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por acre (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento na taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais larga que as equivalentes selvagens delas, visto que as limitações territoriais para crescimento de uma colheita são freqüentemente por condições ambientais adversas ou no momento do plantio (estação inicial) ou no momento da colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita for encurtado. A taxa de crescimento pode ser determinada pela derivação de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo tomado por plantas para alcançar 50% do tamanho máximo delas) e T-90 (tempo tomado por plantas para alcançar 90% do tamanho máximo delas) entre outros.
De acordo com uma característica preferida da presente invenção, o desempenho dos métodos da invenção dá plantas que têm uma taxa de crescimento aumentada em relação a plantas controle. Portanto de acordo com a presente invenção, é provido um método para aumentar a taxa de crescimento de plantas, método o qual compreende aumentar a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídio RCA conforme aqui definido.
Características relacionadas a rendimento intensificado e/ou taxa de crescimento aumentada ocorre quer a planta esteja sob condições de não estresse quer a planta esteja exposta a vários estresses comparada a plantas controle. Plantas tipicamente respondem à exposição a estresse crescendo mais vagarosamente. Em condições de estresse grave, a planta pode mesmo para de crescer totalmente. Estresse leve por outro lado é definido aqui como sendo qualquer estresse ao qual uma planta é exposta que não resulta na cessação total de crescimento pela planta sem a capacidade de retomar o crescimento. Estresse leve no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos de 40%, 35% ou 30%, de preferência menos de 25%, 20% ou 15%, de maior preferência menos de 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta controle sob condições de não estresse. Devido a avanços em práticas da agricultura (irrigação, fertilização, tratamentos com pesticida) estresses graves não são encontrados freqüentemente em plantas de colheita cultivadas. Como conseqüência, o crescimento comprometido induzido por estresse leve freqüentemente é uma característica indesejável para agricultura. Estresses leves são os estresses bióticos e/ou abióticos (ambientais) de todo dia a que a planta está exposta. Estresses abióticos podem ocorrer devido à seca ou excesso de água, estresses anaeróbico, estresse salino, toxicidade química, estresse oxidativo e calor, frio ou temperaturas de congelamento. O estresse abiótico pode ser um estresse osmótico causado por um estresse aquoso (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tais como bactérias, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados sob condições de não estresse ou sob condições de seca leve para dar plantas que têm características relacionadas a rendimento aumentado em relação a plantas controle. Como relatado por Wang et al., (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de alterações morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente o crescimento e a produtividade vegetais. Seca, salinidade, condições de luz extremas (comprimento de onda baixo ou alto ou variável), temperaturas extremas (alta ou baixa) e estresse oxidativo são conhecidos por estarem interligados e podem induzir danos ao crescimento e celulares através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descrevem um grau particularmente alto de "diafonia" entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando em interrupção de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha estresse por seca, salinidade ou temperatura alta ou baixa, pode causar desnaturação de proteínas funcionais e estruturais. Como conseqüência, esses diversos estresses ambientais freqüentemente ativam respostas celulares e vias de sinalização celular similares, tais como a produção de proteínas de estresse, supra-regulação de antioxidantes, acúmulo de solutos compatíveis e detenção de crescimento. O termo condições de "não estresse" conforme aqui utilizado se refere àquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na técnica têm consciência de condições de solo normal e condições climáticas para uma dada localização.
A realização dos métodos da invenção dá plantas cultivadas
sob condições de não estresse ou sob condições de seca leve com rendimento aumentado em relação a plantas controle adequadas cultivadas sob condições comparáveis. Portanto de acordo com a presente invenção, é provido um método para intensificar características relacionadas a rendimento em plantas cultivadas sob condições de não estresse ou sob condições de seca leve, método que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídio RCA.
Em uma modalidade preferida da invenção, a intensificação de características relacionadas a rendimento e/ou aumento na taxa de crescimento ocorre de acordo com os métodos da presente invenção sob condições de não estresse.
A realização dos métodos de acordo com a presente invenção resulta em plantas cultivadas sob condições de estresse abiótico que tem características relacionadas a rendimento aumentado em relação a plantas controle cultivadas sob condições de estresse comparáveis. Como relatado por Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leve a uma série de alterações morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente o crescimento e a produtividade vegetais. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por estarem interligados e podem induzir danos ao crescimento e celulares através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descrevem um grau particularmente alto de "diafonia" entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando em interrupção de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha estresse por seca, salinidade ou temperatura alta ou baixa, pode causar desnaturação de proteínas funcionais e estruturais. Como conseqüência, esses diversos estresses ambientais freqüentemente ativam respostas celulares e vias de sinalização celular similares, tais como a produção de proteínas de estresse, regulação para cima de antioxidantes, acúmulo de solutos compatíveis e detenção de crescimento. Visto que diversos estresses ambientais ativam vias similares, a exemplificação da presente invenção com estresse por seca não deve ser vista como uma limitação a estresse por seca, mas mais como uma tela para indicar o envolvimento de polipeptídios RCA conforme definido acima, em aumentar características relacionadas a rendimento em relação a plantas controle cultivadas em condições de estresse comparáveis, em estresses abióticos em geral.
O termo "estresse abiótico" conforme aqui definido é tomado
como significando qualquer um ou mais de: estresse aquoso (devido à seca ou excesso de água), estresse anaeróbico, estresse salino, estresse de temperatura (devido a temperaturas quentes, frias ou de congelamento), toxicidade química e estresse oxidativo. De acordo com um aspecto da invenção, o estresse abiótico é um estresse osmótico, selecionado de estresse aquoso, estresse salino, estresse oxidativo e estresse iônico. De preferência, o estresse aquoso é estresse por seca. O termo estresse salino não está restrito ao sal comum (NaCl), mas pode ser qualquer estresse causado por um ou mais de: NaCl, KCl, LiCl, MgCl2, CaCl2 entre outros. A realização dos métodos da invenção dá plantas que têm características relacionadas a rendimento aumentado, sob condições de estresse abiótico em relação a plantas controle cultivadas em condições de estresse comparáveis. Portanto de acordo com a presente invenção, é provido um método para aumentar características relacionadas a rendimento, em plantas cultivadas sob condições de estresse abiótico, método que compreende aumentar a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídio RCA. De acordo com um aspecto da invenção, o estresse abiótico é um estresse osmótico, selecionado de um ou mais dos seguintes: estresse aquoso, estresse salino, estresse oxidativo e estresse iônico.
Outro exemplo de estresse ambiental abiótico é a disponibilidade reduzida de um ou mais nutrientes que precisam ser assimilados pelas plantas para crescimento e desenvolvimento. Devido à forte influência de eficiência de utilização de nutrição no rendimento vegetal qualidade do produto, uma enorme quantidade de fertilizante é espalhada em campos para aperfeiçoar o crescimento e qualidade vegetais. A produtividade de plantas ordinariamente está limitada por três nutrientes primários, fósforo, potássio e nitrogênio, que geralmente é o elemento limitador de taxa de crescimento vegetal desses três. Portanto, o principal elemento nutricional requerido para crescimento vegetal é nitrogênio (N). Ele é um constituinte de numerosos compostos importantes encontrados em células vivas, incluindo aminoácidos, proteínas (enzimas), ácidos nucleicos e clorofila. Da matéria seca vegetal, 1,5% até 2% são nitrogênio e aproximadamente 16% da proteína vegetal total. Assim, a disponibilidade do nitrogênio é um fator limitante principal para crescimento e produção de planta de colheita (Frink et ai. (1999) Proc Natl Acad Sci USA 96(4): 1175-1180) e tem também um impacto principal no acúmulo proteico e composição de aminoácidos. Portanto, de grande interesse são plantas de colheita com características relacionadas a rendimento aumentado, quando cultivadas sob condições limitantes de nitrogênio.
A realização dos métodos da invenção dá plantas cultivadas sob condições de disponibilidade de nutriente reduzida, particularmente sob condições de disponibilidade de nitrogênio reduzida, tendo características relacionadas a rendimento aumentado em relação a plantas controle cultivadas sob condições comparáveis. Portanto de acordo com a presente invenção, é provido um método para aumentar características relacionadas a rendimento em plantas cultivadas sob condições de disponibilidade de nutriente reduzida, de preferência disponibilidade de nitrogênio reduzida, método que compreende aumentar a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídio RCA. A disponibilidade de nutriente reduzida pode resultar de uma deficiência ou excesso de nutrientes tais como nitrogênio, fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio, magnésio, manganês, ferro e boro, entre outros. De preferência, a disponibilidade de nutriente reduzida é disponibilidade de nitrogênio reduzida.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta, o termo "planta" sendo conforme aqui definido.
De acordo com uma modalidade preferida da presente invenção, a planta é uma planta de colheita. Exemplos de plantas de colheita incluem soja, girassol, colza, alfafa, canola, algodão, tomate, batata e tabaco. De preferência adicional, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana de açúcar. De maior preferência, a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milhete, centeio, sorgo e aveia.
A presente invenção também abrange o uso de seqüências de ácido nucleico que codificam um polipeptídio RCA descrito aqui e uso desses polipeptídios RCA na intensificação de características relacionadas a rendimento em plantas. Seqüências de ácido nucleico que codificam um polipeptídio RCA conforme descrito aqui, ou os polipeptídios RCA por eles mesmos, podem ser úteis em programas de reprodução em que é identificado um marcador de DNA que pode estar ligado geneticamente a um gene que codifica um polipeptídio RCA. As seqüências de ácido nucleico/genes, ou os polipeptídios RCA por eles mesmos podem ser usados para definir um marcador molecular. Este marcador protéico ou de DNA pode então ser usado em programas de reprodução para selecionar plantas que têm características relacionadas a rendimento intensificadas conforme definido aqui acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene que codifica um polipeptídio RCA também podem ser úteis em programas de reprodução assistidos por marcador. Tais programas de reprodução às vezes requerem a introdução de variação alélica por tratamento mutagênico das plantas, usando, por exemplo, mutagênese EMS; senão, o programa pode iniciar-se com uma coleção de variantes alélicas de origem também chamada "natural" causada involuntariamente. A identificação de variantes alélicas então ocorre, por exemplo, por PCR. Esta é seguida por uma etapa para a seleção de variantes alélicas superiores da seqüência em questão e que características relacionadas a rendimento intensificado. A seleção é tipicamente efetuada por monitoração de desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas em que a variante alélica superior foi identificada com outra planta. Isto poderia ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.
Ácidos nucleicos que codificam um polipeptídio RCA também podem ser usados como sondas para mapear geneticamente e fisicamente os genes dos quais eles fazem parte e como marcadores para características ligadas àqueles genes. Tal informação pode ser útil em reprodução vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos que codificam um polipeptídio RCA requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídios de comprimento. As seqüências de ácidos nucleicos que codificam um polipeptídio RCA podem ser usadas como marcadores de polimorfismo por comprimento de fragmento de restrição (RFLP). Transferências de Southern (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição podem ser sondadas com as seqüências de ácido nucleico que codificam um polipeptídio RCA. Os padrões de bandeamento resultantes podem então ser submetidos a análises genéticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar transferências de Southern contendo DNAs genômicos tratados com endonuclease de restrição de um grupo de indivíduos que representam progenitores e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é anotado e usado para calcular a posição do ácido nucleico que codifica um polipeptídio RCA no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético é descrito em Bernatzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones de DNA específicos usando a metodologia delineada acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações de retrocruzamento, populações acasaladas aleatoriamente, linhagens quase isogênicas e outros grupos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na técnica. As sondas de ácido nucleico também podem ser usadas para mapeamento físico (isto é, colocação de seqüências em mapas físicos; veja Hoheisel et al., em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências citadas a esse respeito).
Em outra modalidade, as sondas de ácido nucleico podem ser
usadas em mapeamento por hibridização in situ com fluorescência direta (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora, métodos atuais de mapeamento por FISH favoreçam o uso de clones grandes (vários kb até várias centenas de kb; veja Laan et al., (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir a realização de mapeamento por FISH usando sondas menores.
Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser efetuada usando os ácidos nucleicos. Exemplos incluem amplificação alelo-específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al., (1993) Genomics 16:325-332), ligação alelo-específica (Landegren et al. (1988) Science 241:1077-1080), reações de prolongamento nucleotídico (Sokolov (1990) Nucleic Acid Res. 18:3671), mapeamento híbrido por radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e mapeamento feliz {happy mapping) (Dear e Cook (1989) Nucleic Acid Res. 17:6795-6807). Para esses métodos, a seqüência de um ácido nucleico é usada para desenhar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de prolongamento de iniciador. O desenho de tais iniciadores é bem conhecido por aqueles versados na técnica. Em métodos que empregam mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os progenitores do cruzamento do mapeamento na região correspondente à seqüência do ácido nucleico imediato. Isto, entretanto, geralmente não é necessário para métodos de mapeamento. Os métodos de acordo com a presente invenção resultam em plantas que têm características relacionadas a rendimento intensificado, como descrito anteriormente. Essas características também podem ser combinadas com outras características vantajosas economicamente tal como características que intensificam rendimento adicionalmente, tolerância a outros estresses abióticos e bióticos, características que modificam várias características arquitetônicas e/ou características bioquímicas e/ou fisiológicas.
Descrição de figuras
A presente invenção será agora descrita com referência às seguintes figuras em que:
Fig. 1 mostra a estrutura do domínio da proteína CCAl representada pela SEQ ID NO: 2. O domínio SANT é dado em sublinhado em negrito. Motivos 1 e 2 no domínio SANR são indicados em itálico em negrito e sublinhados. Motivos 3, 4 e 5 são indicados em itálico e sublinhado.
Fig. 2 mostra uma árvore filogenética e um alinhamento múltiplo de proteínas CCAl. Os motivos indicados na Figura 1 podem facilmente ser reconhecidos e novos motivos podem ser definidos usando este alinhamento.
Fig. 3 mostra o vetor binário para expressão aumentada em Oryza sativa de um ácido nucleico que codifica proteína semelhante a CCAl de Arabidopsis thaliana sob o controle de um promotor GOS2.
Fig. 4 detalha exemplos de seqüências de CCAl úteis na realização dos métodos de acordo com a presente invenção.
Fig. 5 mostra a estrutura do domínio de uma VPE gama. A Figura 5a é uma representação esquemática em que (da esquerda para direita) a caixa com listras diagonais representa um peptídeo sinal para inserção no sistema de endomembranas; a caixa branca representa um domínio inibitório N-terminal; a caixa pontilhada representa um domínio ativo; e a caixa sombreada cinza representa o domínio inibitório carboxila. As posições da díade catalítica histidina-cisteína são marcadas "H" e "C". A Figura 5B mostra a posição dos domínios por um alinhamento de seqüências entre uma VPE de mamona e SEQ ID NO: 150. A linha dupla representa o peptídeo sinal, a linha preta sólida representa o peptídeo ativo; as setas pretas indicam os resíduos aspárticos putativos em que ocorre o processamento autocatalítico para produzir o peptídeo ativo maduro e os resíduos de Hys e Cys conservados estão em caixas. Está sublinhado com pontos o pentapeptídio ativo conservado em caspases. Fig. 6 mostra (A) uma árvore filogenética de polipeptídios da
superfamília da peptidase. Peptidases VPE se aglomeram separadas em clãs CA, CF ou CE. Polipeptídios VPE se aglomeram em quatro subclasses, alfa, beta, gama e delta, com alfa e gama sendo as mais intimamente relacionadas; (B) é um alinhamento de VPEs; a maior conservação de seqüência é encontrada no domínio de peptidase.
Fig. 7 o vetor binário para expressão aumentada em Oryza sativa de um ácido nucleico que codifica proteína semelhante a VPE de Arabidopsis thaliana sob o controle de um promotor GOS2.
Fig. 8 mostra seqüências de VPE úteis nos métodos da
invenção.
Fig. 9 mostra a estrutura de domínio e suas respectivas posições em um polipeptídio semelhante a SAP, com o Motivo 1 sendo o domínio semelhante a SAP.
Fig. 10 mostra uma árvore filogenética e alinhamento de seqüência de SAP e polipeptídios semelhantes a SAP. O clonado com polipeptídios SAP está em caixa de uma única linha; as caixas de linha dupla contém os ciados com polipeptídios semelhantes a SAP. A Figura IOB mostra um alinhamento de polipeptídios semelhantes a SAP.
Fig. 11 mostra o vetor binário para expressão aumentada em Oryza sativa de um ácido nucleico que codifica proteína semelhante a SAP de Oryza sativa sob o controle do promotor RCC3 de arroz (pRCC3).
Fig. 12 mostra exemplos de seqüências de SAP úteis na realização dos métodos de acordo com a presente invenção.
Fig. 13 mostra um modelo para ativação por RCA da RuBisCO. Os inibidores de fosfato de açúcar se ligam ao sítio ativo das subunidades grandes da RuBisCO, fechando-os desse modo. A RCA através de hidrólise de ATP se oligomerizará e se ligará à RuBisCO para formar um supercomplexo consistindo nas subunidades grande e pequena da RuBisCO circuladas pelas 16 subunidades de RCA. Esta ligação é responsável por alterações conformacionais que levarão à liberação das subunidades de RCA individuais, liberação dos inibidores e abertura dos sítios ativos da RuBisCO (para explicações mais detalhadas, veja Portis (2003) Photosynthesis Research 75:11-27).
Fig. 14 representa um desenho das características importantes compreendidas em um polipeptídio RCA, isto é, um peptídeo de trânsito para direcionamento plastídico, um domínio AAA e um seqüência de consenso de malha de ligação a trifosfato e malha P G(G/R)KG(Q/E)GK(S/T), para ligação nucleotídica, correspondendo ao Motivo 1 como representado pela SEQ ID NO: 312.
Fig. 15 mostra um alinhamento de polipeptídios RCA. Essas seqüências foram alinhadas usando programa AlignX do conjunto Vector NTI (InforMax, Bethesda, MD). Alinhamento múltiplo foi feito com uma penalidade de abertura de interrupção de 10 e uma extensão de interrupção de 0,01. O início de conservação de seqüências entre polipeptídios RCA eucarióticos é remalhado com um parêntese (a seqüência de aminoácidos N- terminal a montante deste parêntese é considerada como compreendendo o peptídeo de trânsito para direcionamento subcelular plastídico), como é o início e fim do domínio AAA. A malha P está em caixa e corresponde ao Motivo 1 como representado pela SEQ ID NO: 312. O início da extensão C- terminal também está marcado com um parêntese.
Fig. 16 mostra o vetor binário para expressão aumentada em Oryza sativa de uma seqüência de ácido nucleico que codifica um polipeptídio RCA de Chlamydomonas reinhardtii sob o controle de um promotor constitutivo, ou sob o controle de um promotor específico de tecido verde.
Fig. 17 detalha exemplos de seqüências de RCA úteis na realização dos métodos de acordo com a presente invenção. Fig. 18 mostra a seqüência de SEQ ID NO: 322 com regiões
ricas em F (rica em fenilalanina) e ricas em C (rica em cisteína) sublinhadas. Dentro das caixas estão quatro regiões do também chamado distúrbio intrínseco.
Fig. 19 mostra um alinhamento múltiplo de seqüências de CLUSTAL W de polipeptídios SYPFl de várias espécies. Regiões conservadas, mostradas como Motivos I, II e II estão em caixas.
Fig. 20 mostra uma árvore filogenética compreendendo seqüências polipeptídicas de SYPF1. Seqüências que se aglomeram com a seqüência de SEQ ID NO: 322 podem ser úteis na realização dos métodos da invenção.
Fig. 21 detalha o vetor binário para expressão aumentada em Oryza sativa de um ácido nucleico que codifica proteína SYPF de Arabidopsis thaliana sob o controle de um promotor HMGB.
Fig. 22 detalha exemplos de seqüências SYPFl úteis na realização dos métodos de acordo com a presente invenção.
EXEMPLOS
A presente invenção será agora descrita com referência aos seguintes exemplos, que são por meio de ilustração sozinha. Os seguintes exemplos não se destinam a definir completamente ou limitar de outro modo o âmbito da invenção.
Parte I. CCAl
Exemplo 1: Identificação de seqüências relacionadas à CCAl de SEQID NO: 1 e SEQID NO: 2
Seqüências (cDNA completo, ESTs ou genômicas)
relacionadas à SEQ ID NO: 1 e/ou seqüências proteicas relacionadas à SEQ ID NO: 2 foram identificadas entre aquelas mantidas no banco de dados Nucleotides Entrez no Centro Nacional para Informação em Biotecnologia (NCBI) usando ferramentas de pesquisa de seqüência em banco de dados, tais como a Ferramenta de Alinhamento Local Básico (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa foi usado para encontrar regiões de similaridade local entre seqüências por comparação de seqüências de ácido nucleico ou polipeptídicas com bancos de dados de seqüências e pelo cálculo da significância estatística de pareamentos. O polipeptídio codificado pela SEQ ID NO: 1 foi usado para algoritmo TBLASTN, com ajustes padrões e o filtro para ignorar seqüências de baixa complexidade desligado. A produção da análise foi vista por comparação par a par e classificada de acordo com a pontuação de probabilidade (valor de E), onde a pontuação reflete a probabilidade que um alinhamento particular ocorra por acaso (quanto menor o valor de E, mais significativo o sucesso). Além dos valores de E, comparações também foram pontuadas por identidade de porcentual. Identidade porcentual se refere ao número de nucleotídeos idênticos (ou de aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. Em alguns casos, os parâmetros padrões podem ser ajustados para modificar a estringência da pesquisa.
A Tabela A provê uma lista de seqüências de ácido nucleico e proteicas relacionadas à seqüência de ácido nucleico como representada pela SEQ ID NO: 1 e à seqüência proteica representada pela SEQ ID NO: 2. Tabela A: Seqüências de ácido nucleico relacionadas à seqüência de ácido nucleico (SEQ ID NO: 1) útil nos métodos da presente
invenção e os polipeptídios deduzidos correspondentes.
Nome Organismo fonte SEQ ID NO: de ácido nucleico SEQ ID NO: de polipeptídi o Número de acesso de banco de dados Condiçã o Semelhante a CCAl Arabidopsis thaliana 1 2 / Completa MYB TF At IgO1060 Arabidopsis thaliana 3 4 AY519507 Completa Icll Arabidopsis thaliana 5 6 AJ937209 Completa lcl2 Arabidopsis thaliana 7 8 AJ937210 Completa lcl3 Arabidopsis thaliana 9 10 AJ937211 Completa lcl4 Arabidopsis thaliana 11 12 AJ937212 Completa lcl5 Arabidopsis thaliana 13 14 AJ937213 Completa MYB TF Atlgl8330 Arabidopsis thaliana 15 16 AY5 50299 Completa Myb-TF At Igl9000 Arabidopsis thaliana 17 18 AY079415 Completa MYB TF Atlg70000 Arabidopsis thaliana 19 20 AY519509 Completa MYB TF Atlg74840 Arabidopsis thaliana 21 22 AY519510 Completa MYB TF AT3G10113 Arabidopsis thaliana 23 24 NM_148701 Completa MYB TF AT3G10580 Arabidopsis thaliana 25 26 NM_111894 Completa MYB TF At3gl0590 Arabidopsis thaliana 27 28 AY550300 Completa MYB TF At3gl6350 Arabidopsis thaliana 29 30 AY519512 Completa MYB TF At4g09450 Arabidopsis thaliana 31 32 AY122911 Completa MYB TF At5g37260 Arabidopsis thaliana 33 34 AY519515 Completa MYB TF At5g47390 Arabidopsis thaliana 35 36 AY519516 Completa MYB TF At5g56840 Arabidopsis thaliana 37 38 AY519517 Completa MYB TF AT5G61620 Arabidopsis thaliana 39 40 NM_125556 Completa MYB TF Oryza sativa 41 42 LOC 0s01g063 20 Completa MYB TF Oryza sativa 43 44 LOC 0s01g092 80 Completa MYB TF Oryza sativa 45 46 LOC 0s01g096 40 Completa MYB TF Oryza sativa 47 48 LOC 0s01g419 00 Completa MYB TF Oryza sativa 49 50 LOC 0s02g307 00 Completa MYB TF Oryza sativa 51 52 LOC 0s05g070 10 Completa MYBTF Oryza sativa 53 54 LOC 0s05gl06 90 Completa MYB TF Oryza sativa 55 56 LOC 0s05g511 60 Completa MYB TF Oryza sativa 57 58 LOC 0s06g076 40 Completa MYB TF Oryza sativa 59 60 LOC 0s06g076 50 Completa MYBTF Oryza sativa 61 62 LOC 0s06g077 00 Completa MYB TF Oryza sativa 63 64 LOC 0s06g077 40 Completa MYB TF Oryza sativa 65 66 LOC 0s06g458 40 Completa MYB TF Oryza sativa 67 68 LOC 0s08g048 40 Completa MYB TF Oryza sativa 69 70 LOC 0s08g055 10 Completa MYB TF Oryza sativa 71 72 LOC 0s08g061 10 Completa MYB TF Oryza sativa 73 74 LOC OslOg412 00 Completa MYB TF Oryza sativa 75 76 LOC OslOg412 60 Completa MYB TF Oryza sativa 77 78 LOC 0s02g460 30 Completa MYB TF Oryza sativa 79 80 LOC 0s04g494 50 Completa MYB TF Oryza sativa 81 82 LOC 0s06g512 60 Completa LpLHY Hl Lemna paucicostata 83 84 AB210845 Completa LgLHY Hl Lemna gibba 85 86 AB210849 Completa MYB TF Castanea sativa 87 88 AY611029 Completa MYB TF Phaseolus vulgaris 89 90 AJ420902 Completa MYBl 14 Glycine max 91 92 DQ822977 parcial Semelhante a CCAl Mesembryanthemum crystallinum 93 94 AY371287 Completa MYB clone 11403OR Lycopersicon eseuleníum 95 96 BTO12912 Completa MYB186 Glyeine max 97 98 DQ822982 parcial LgLHY H2 Lemna gibba 99 100 AB210850 Completa MYB PCO118792 Zea mays 101 102 AY103618 Completa LpLHY H2 Lemna paueieostata 103 104 AB210846 Completa MYB177 Glyeine max 105 106 DQ822925 Completa MYB clone wlm96.pk054 .b21:fis Tritieum aestivum 107 108 BT009406 Completa MYB173 Glyeine max 109 110 DQ822922 Completa MYB140 Glyeine max 111 112 DQ822986 parcial MYBl 31 Glyeine max 113 114 DQ822983 parcial MYB144 Glyeine max 115 116 DQ822987 parcial MYB174 Glyeine max 117 118 DQ822939 parcial Semelhante a LHY Ostreoeoceus tauri 119 120 AY740076 parcial MYB, clone mth2-71ol9 Medieago truneatula 121 122 AC15 0443 parcial MYBR5 Malus χ domestica 123 124 DQ074476 Completa MYB, clone wdklc.pkOl 1 .fl2:fís, Tritieum aestivum 125 126 BT008954 Completa MYB148 Glyeine max 127 128 DQ822956 parcial MYB135 Glyeine max 129 130 DQ822955 parcial Myb2 Pisum sativum 131 132 AY826731 parcial MYB133 Glyeine max 133 134 DQ822916 Completa MYB146 Glycine max 135 136 DQ822984 parcial MYB155 Glyeine max 137 138 DQ822940 parcial MYBl 18 Glyeine max 139 140 DQ822912 Completa
Exemplo 2: Alinhamento e seqüências polipeptídicas relevantes
AlignX do Vector NTI (Invitrogen) é baseado no algoritmo de
Clustal de alinhamento progressivo (Thompson et al. (1997) Nucleic Aeids Res 25:4876-4882; Chenna et al. (2003). Nucleie Aeids Res 31:3497-3500). Uma árvore filogenétiea pode ser construída usando um algoritmo de agrupamento de neighbour-joining. Valores padrões são para penalidade de abertura de interrupção de 10, para a penalidade de extensão de interrupção de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídios foram alinhados).
O resultado do alinhamento múltiplo de seqüências usando
polipeptídios relevantes na identificação daqueles úteis na realização dos métodos da invenção é mostrado na Figura 2. Uma seleção das seqüências usadas para o alinhamento múltiplo foi usada como dados de entrada para cálculo da árvore filogenética. Embora, haja pouca conservação de seqüência geral (veja o exemplo 3), regiões de alta conservação podem ser discriminadas, tais como os motivos de SEQ ID NO: 141 até 145, mas motivos adicionais podem ser derivados para o alinhamento. Exemplo 3: Cálculo de identidade porcentual global entre seqüências polipeptídicas úteis na realização dos métodos da invenção Porcentagens globais de similaridade e identidade entre
seqüências polipeptídicas completas úteis na realização dos métodos da invenção foram determinadas usando um dos métodos disponíveis na técnica, o programa MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). O programa MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteicas sem precisar de pré-alinhamento dos dados. O programa faz uma série de alinhamentos par a par usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de interrupção de 12 e uma penalidade de extensão de interrupção de 2), calcula similaridade e identidade usando, por exemplo, Blosum 62 (para polipeptídios) e então coloca os resultados em uma matriz de distância. A similaridade de seqüência é mostrada na metade inferior da linha de divisão e a identidade de seqüência é mostrada na metade superior da linha de divisão diagonal.
Parâmetros usados na comparação foram: Matriz de pontuação: Blosum 62 Primeira interrupção: 12 Interrupção prolongada: 2
Os resultados da análise do programa são mostrados na Tabela Al para a identidade e similaridade global por todo o comprimento das seqüências polipeptídicas (excluindo as seqüências polipeptídicas parciais). Identidade porcentual é dada acima da diagonal em negrito e similaridade porcentual é dada abaixo da diagonal (face normal).
A identidade porcentual entre as seqüências polipeptídicas úteis na realização dos métodos da invenção pode ser tão baixa quanto 9% de identidade de aminoácidos comparada com SEQ ID NO: 2. Tabela Al: Resultados de MatGAT para identidade e similaridade global por todo o comprimento das seqüências polipeptídicas.
1 2 3 4 5 6 7 8 9 10 11 12 13 1. SEQID2 42,4 17,2 16,3 16,9 17,4 18,8 21,6 12,5 11,9 11,3 19,4 13 2. SEQID4 57,8 16,4 15,3 15,1 14,9 16,4 21,5 12,1 11 11,3 18,8 11,9 3. SEQID6 25,5 25,4 44,2 47,4 43,8 69,8 25,3 17,5 14,4 14,3 25,9 21,3 4. SEQID8 25,7 24,5 57,6 44,9 46,6 47,6 25,9 18,8 18,8 19,2 27,5 19,7 5. SEQID10 25 24,7 61,1 61,8 58,8 47,5 27 17 18,6 19,1 26,3 19,2 6. SEQID12 25,5 24,5 57,6 60,9 73,2 44,8 26,2 15,8 16,7 17,6 26,8 19,8 7. SEQID14 26,3 24,7 78,5 57 59,6 56,6 26,9 15,2 16,6 14,6 26,5 20,6 8. SEQID16 32,6 31,3 41,6 42,5 42,5 44,8 43,1 16,8 17 15,2 88,1 15,5 9. SEQID18 22,2 20,5 29,4 30,9 35,9 29,1 29,8 29,5 39 55,9 16,1 25,9 10. SEQID20 19,4 18 29 30,9 36,2 32,5 31,2 27,7 51,2 40,6 17,7 24,9 11. SEQID22 20,1 19,1 33,1 33,3 34,1 33,1 34,4 31,5 69,8 54 15,2 28 12. SEQID24 30,8 28,7 43,5 44 41,7 42,6 42,6 92,2 29,8 30,7 31,8 18,2 13. SEQID26 20,1 20,5 38,2 32,1 36,6 35,8 36,9 31,8 41,8 41,1 42,5 32,7 14. SEQID28 16,4 17,8 29,7 27 30 27,8 33 23,7 35,8 37,2 37,4 23,5 40,4 15. SEQID30 25,2 22,2 30,5 35,1 27,6 29,7 26,6 29,2 44,7 42,1 42,1 30,2 32,8 16. SEQID32 15,6 16,3 29,4 24,8 26,5 27,8 28 27,5 37,5 33 38,1 28 54,7 17. SEQID34 28,5 28,4 46,1 42,4 46,7 43 46,3 51,7 30 30 28,9 49,1 29,3 18. SEQID36 23,2 23,6 33,7 34 33,2 35,3 34 38,4 43,6 45,2 41,6 33,2 32,6 19. SEQID38 18,8 17,1 27,3 30,3 27,5 34,1 35,1 27,7 44,2 47,9 48,3 26,8 36,2 20. SEQID40 23,2 21,4 30,9 35,8 32,5 37,2 29,3 28,9 43,8 45,7 44,5 36 39,4 21. SEQID42 28,9 25,7 52,3 50,9 52,6 52,6 51,3 41,3 28,8 30,1 28,4 40,5 28,4 22. SEQID44 22,5 23,3 33,3 30,6 31,1 32,5 32,2 33,6 42,9 44,3 41 32 34,7 23. SEQID46 20,9 20,9 35,5 37,3 39 36,5 30,6 30,3 46,5 46,8 47,1 30,7 36,8 24. SEQID48 20,9 19,5 24,6 27,3 25,6 23,8 27,9 27,7 42,5 49,2 43,5 26,5 37,2 25. SEQID50 20,2 20 28 28,5 31,4 29,1 34 30,9 38,6 31,9 29,7 29,8 38,3 26. SEQID52 22,9 22 45,4 41,2 42,5 46 46,1 38,2 29,8 29,5 29,4 37,2 34,1 27. SEQID54 20,2 19,1 30 29,7 30,3 29,8 31,4 30,9 47,4 53 51,2 29,5 40,8 28. SEQID56 21,4 18,4 27 28,8 30,3 28,5 28,7 26 45,3 48,5 48,5 28,9 37,3 29. SEQID58 21,9 20,5 26,5 28,5 30,2 26,2 25,5 25,7 38 38,9 37,4 31,3 35,5 30. SEQID60 24,3 22,5 27,7 27,9 25,6 29,7 25,6 30,7 32,7 29,4 33,5 31,7 32,7 31. SEQID62 20,7 20,8 29,5 30 26,5 27,2 25,8 30,1 36,2 32,6 35,6 30,1 36,9 32. SEQID64 22,7 21,4 29,6 29,6 28,5 28,5 29,8 33,4 29,3 28,5 32,3 30,9 32,9 33. SEQ1D66 13,7 14 30,4 29,1 31,4 33,8 31,6 22 21,8 30,7 28,3 23,5 22,6 34. SEQID68 24,2 24 30,3 32,1 29,2 31,9 32,1 31,3 38,4 39,7 36 32,4 32,6 35. SEQID70 25,2 23,4 33,6 37,2 32,7 37,5 33 34,1 42,2 37,8 41,9 35,4 34,5 36. SEQID72 52,3 54,2 22,5 24,2 21,1 23,1 23,5 27,1 18,2 17,9 17,2 25,9 18,5 37. SEQID74 21,2 21,4 40,6 36,7 30,8 38,7 38,1 33,8 46,5 48,1 47,2 37,8 34 38. SEQID76 21,7 18,1 37,5 34,2 38,3 36,1 37,2 28 43,9 45,7 47,5 33,6 41,5 39. SEQID78 36,8 34,4 30,8 32 31,8 33 31 40,1 24,4 23 22,6 38,3 22,2 40. SEQID80 39,6 36,3 32,8 34,3 29,6 31,7 32,2 41,5 25,7 24,6 21,8 40 24,2 41. SEQID82 37,5 34,4 35,3 37,3 34,4 35,7 35 43,9 27,7 26,6 24,8 42,6 29,5 42. SEQID84 52,6 50,1 28,7 29,4 27,3 28,3 27,2 35,2 21,2 21,3 22,1 33 24,2 43. SEQID86 52 53,3 27,4 26,7 25,6 27,2 27,2 33,9 20,5 20 20,1 30,6 20,1 44. SEQID88 54 58,9 22,3 22,1 19,5 20,2 20,2 25,3 16,8 17,4 18,5 25,4 18,4 45. SEQID90 53,1 61 23,4 22,7 21,3 22,4 21,3 27,7 18,4 16,9 16,2 26,4 18,7 46. SEQID94 52,4 58,1 22,6 23,3 20,4 22,1 20,3 27,2 18,1 18,4 16,9 25,4 16,6 47. SEQID96 50,7 55,1 21,8 22,7 21,3 22,4 20,7 26 19,2 16,7 17,3 24,9 16,9 48. 50 47,9 33,6 34,9 32,4 31,3 32,9 40,5 26,6 25 24,1 38,3 27 SEQID100 49. 30,3 30,4 44,7 44,8 46,3 41,4 48,6 43,6 29,8 36,1 31,8 42,6 30,3 SEQID102 50. 48,5 47,1 31,4 31,6 31,8 33,6 34,3 41,3 26 23,9 21,7 39,3 25,5 SEQID104 51. 35,7 33,6 36,5 38,5 35,1 36,2 33,7 46,6 26,4 24,1 24,1 45,2 27,5 SEQID106 52. 36,5 35,7 32,3 34,7 31,2 32,7 34,1 43,4 25,4 26,9 26,3 42,3 25,2 SEQID108 53. 28,3 25,4 44,7 42,7 44,9 42,1 46 49,4 38,3 37,3 32,1 47,3 39 SEQID110 54. 27,6 25,6 61,6 72,7 60,7 61,9 58,5 47,4 30,3 28,5 32,8 46,1 33,4 SEQID124 55. 26,8 25,1 64,5 62,1 66,2 63,9 65,7 43,4 32,2 32,5 31,8 42,3 31,4 SEQID126 56. 27,1 28,2 55,9 68,6 63,1 63,7 59,8 46,2 32 27,2 34,7 45,2 33,5 SEQID134 57. 24,8 23,3 70,6 55,2 58,2 57 78 40,8 34 29,3 37,6 40,8 39 SEQID140
Tabela Al, continuada
14 15 16 17 18 19 20 21 22 23 24 25 26 1.SEQID2 10 14,1 9 20,2 12,2 12,5 12,5 19,9 13,3 13,7 13,5 12 16,6 2. SEQID4 9,9 11,7 10,5 21 13,3 10,5 13 18,1 12,7 12,4 10,2 11,9 14,9 3. SEQID6 14,7 16,5 15 27,1 19,8 14 16,7 35,3 183 16,2 11,6 17,5 29 4. SEQID8 15,1 22 15,4 25,5 20 19,1 17,2 34,3 18,9 20,5 13,3 15 28,1 5. SEQID10 15,3 17,2 12,9 28,9 18,9 14,6 18,3 32,6 20,1 18,8 13,5 14,7 27,9 6. SEQID12 13,7 17 13,5 27,3 19 17,9 19 34,6 19,3 18,6 11,4 14,5 29 7. SEQID14 18,5 17,6 14,1 29,2 19,7 19,9 15,9 34,4 19,3 15,8 133 14,9 31,4 8. SEQID16 12,7 14,2 14,4 35,1 18,7 17,7 15,3 22,7 16 14,8 13,9 15,9 23,4 9. SEQID18 23,6 30,8 26 12,7 33,3 30,9 29,5 14,1 31,7 31,1 26,8 19,3 19,1 10. SEQID20 23 34,2 23 15,9 32,6 36,1 31,1 14 32,2 34,1 34,5 16,4 16,5 11. SEQID22 20,7 28,9 28 13,4 31,6 30,4 27,6 14,1 29,9 30 28,4 13,9 12,4 12. SEQID24 13,6 14,4 13,4 333 18,9 16,8 17,4 22,2 15,7 143 13,6 14,7 23,1 13. SEQID26 28,4 20,7 48,8 12 19,9 23,9 25,9 14,8 23,5 23,7 23,6 20,5 18,8 14. SEQID28 14,5 38 17,4 16,2 24,8 17,1 15,9 15,1 22 22,1 20,7 16 15. SEQID30 24,5 19,1 13,1 41,4 27,6 29,1 16,7 46,6 33,8 35,8 15,9 15,4 16. SEQID32 56,8 27,9 15,2 19 233 21,8 12,3 193 223 23,5 23,2 14,1 17. SEQID34 33,4 26,6 25,8 17 J 15,3 14,8 26,7 15,6 16,3 12,4 16,2 26 18. SEQID36 26 57,4 27,1 31,8 29,3 32 19,2 44,4 32 28,6 13,2 15,1 19. SEQID38 39,9 37,7 32,6 29,3 37,5 32,6 11,4 29,6 38,9 37 19 12,6 20. SEQID40 29,7 42,9 31,2 26,8 46 44,8 15,7 32,7 32,1 26,4 13 16,1 21. SEQID42 28,4 28,9 24,5 44,4 33,7 28,1 31,2 173 16,2 12,5 15,6 39,9 22. SEQID44 24,9 59,7 24,9 27,9 60,1 41,3 47 31,7 31,1 32,4 15,2 16,9 23. SEQID46 32,9 49,9 31,3 29 47,7 50 47,3 32,6 47,5 46,3 19,1 17,5 24. SEQID48 32,6 45,7 30,9 30,2 45,5 49,8 46,1 23,2 47,3 58,7 17,8 14,4 25. SEQID50 33 26,4 34,4 32,1 24,9 35,9 24,3 30,1 24,6 37,4 33,9 18,4 26. SEQID52 31,7 24,3 25,6 42,2 26,8 26,8 27,4 52,3 27 30 26,2 30,1 27. SEQID54 34,5 44,7 35,5 30,7 43,3 49,8 46,7 30,4 42,3 72,3 58,8 35,5 25,8 28. SEQ1D56 36,3 44,2 35,9 31,7 40,8 48,5 45,1 24,5 41,5 54,2 64,5 39,5 28,9 29. SEQID58 32,1 35,1 32,1 29,3 25,5 33 42,7 24,9 29 41,1 38,9 34 24,6 30. SEQID60 26,6 34,8 27,4 29,7 35 28,2 29,9 27,4 36,8 31,2 34,3 27,4 26,1 31. SEQID62 26,5 31 31,2 28,9 34,8 34,9 36,3 29,1 29,5 38,4 37,9 32,6 26,8 32. SEQID64 24,6 32,3 26,5 28,2 29,3 29,3 35,6 26,5 32 35,4 31,8 27,9 24 33. SEQID66 26,2 19,6 27,5 24 20 33 22,1 29,4 20,8 19,4 23,9 23,6 25,2 34. SEQID68 23,5 50,1 23,2 29,2 53,3 35 47 31,9 50,4 43,1 39,9 25,1 26,4 35. SEQID70 27,1 41,1 27,7 33 43,8 43,4 44,5 36,9 43,7 50,1 41,3 26,5 30,7 36. SEQID72 15,4 23,1 12,9 25.2 23,2 16,4 19,2 22,8 21,6 20,3 19,1 18,4 19,5 37. SEQID74 29,9 56,6 30,5 32,7 65,2 43,7 48,7 32,4 57,1 53,8 51,3 29,9 29,9 38. SEQID76 38,9 39,3 35,8 29,3 38,4 43 43,2 31,7 38,5 43,2 45,2 35,9 38,1 39. SEQID78 17,9 28,7 16,7 38,5 33,4 20 26,5 31,2 27,9 24 22,6 25,3 26,9 40. SEQID80 23,1 27,6 19,9 40,4 31,1 22,9 24,2 33,7 28,5 25,9 24,2 24 26,6 41. SEQID82 20,6 27,9 21,7 40,1 33,3 23,5 27,9 36,6 27,7 28,2 25,1 29,5 30,4 42. SEQID84 18,7 27,3 16,7 31,8 27,2 17,8 24,2 30,1 28,3 23 20,6 22,8 25,1 43. SEQID86 17 23,9 15,7 31,2 23,6 17,9 22,2 27,7 23,6 22,9 20 22,2 23,6 44. SEQID88 14,5 22 13 22,9 22,5 15,2 19,4 22,1 20,2 17,1 17,1 17,3 18,6 45. SEQID90 16,3 23,1 14,2 23,9 21,3 15,5 18,9 23,4 21,2 20,7 19,2 17,4 19,4 46. SEQID94 13,9 22,9 14,6 22,6 21 16,5 18,9 24,5 19,8 18,7 18,9 17,1 19,4 47. SEQID96 14,2 22,6 13 23,8 22,6 15,7 16,4 23,6 20,7 19,7 19,2 15,6 18,8 48. SEQID100 19,8 28,4 20.7 38,1 27,9 21,4 25 35,4 27,3 26,1 23,6 26,8 29,7 49. SEQID102 29,3 30,5 26,4 53,7 27,9 29,6 29,3 43,8 29,2 31,6 33,6 29,3 44,3 50. SEQID104 21,4 28,2 19,9 37 29,6 22,1 27,1 34,5 29,6 26,4 24,2 24,6 29,3 51. SEQID106 23,4 31,2 21,3 43,6 36 24,1 25,5 34,4 26,4 24,5 25 22,7 27,5 52. SEQID108 21,4 29,8 20,7 40,5 29,8 21,6 26,5 34,7 25,8 23,4 23,6 25,6 27,8 53. SEQIDl 10 27,5 30,7 27,2 56,8 33,2 33,8 32,2 36,6 33,3 38,1 32,6 27,9 38 54. SEQID124 26,3 29,2 25,1 44,6 34,5 30,7 37,2 52,3 31,1 38,1 23,5 29,4 42,4 55. SEQID126 28,3 30,2 26,6 46,3 33,2 30,1 30,6 52 28,7 36,1 25,9 30,8 46,9 56. SEQID134 24,8 32,8 23,6 42,9 35,3 29,6 36,6 49,5 32,5 37,5 24,2 29,9 40,5 57. SEQID140 28,6 28,7 28,2 46,7 33,7 30,8 29,7 50 29 27,1 30,9 29,3 53,8
Tabela Al, continuada
27 28 29 30 31 32 33 34 35 36 37 38 39 1. SEQID2 13,3 12,3 13,2 12,6 12,3 13,1 8,6 13,3 13,8 36,1 13,3 12,7 25,6 2. SEQID4 11,6 11,5 11,9 13,2 12,1 12,4 9 13,9 13,2 39,1 12,6 10,9 21,4 3. SEQID6 13,4 13,2 15,1 14,7 13,2 14,2 19 17,7 17,5 15,7 23,1 19,1 21,4 4. SEQID8 16,6 15,9 13,9 13 14,2 14,7 23,1 18,4 20,6 15,6 20,6 20,6 22 5. SEQID10 12,5 12,9 15,4 13,9 13,2 13,8 19,4 16,7 19,4 14,8 16,7 21 20,2 6. SEQID12 13,5 13,3 11,3 14,7 14,2 11,8 21,8 19 20,6 14,5 22,7 18,4 22,6 7. SEQID14 17,5 14 14 14 14,6 13,7 21,2 17,8 19,6 15,4 21,1 18,5 20,5 8. SEQID16 15,1 13 13,4 14,7 14,2 14,1 11 17,1 17,7 19,9 18,9 18,8 28,7 9. SEQID18 29,6 26,1 19,5 203 20,5 18,1 12,6 25,9 28,1 11,8 32,4 29,1 14,9 10. SEQID20 36,8 32,8 22 19,5 19,9 18,3 18,6 27,4 25,7 12,4 35,3 32,6 13,4 11. SEQID22 34 29,1 19,6 18,6 17,5 17,2 14,7 26,8 29,9 9,9 34 30,2 12,8 12. SEQID24 12,9 14,8 13,2 16,2 13,2 13,5 14,3 18,3 17,4 18,9 203 18,6 28,3 13. SEQID26 24,5 24,8 20,2 21 18,2 18,2 13,9 22,6 23,3 10,6 22,9 23,5 13,5 14. SEQID28 21,8 22,7 22 17,8 13,9 14 14,6 13 19,1 8,6 18,5 22,5 10,2 15. SEQID30 32,8 32,8 21,6 19,4 16,6 18,4 11,6 34,1 30,5 13,2 44,6 27,6 17 16. SEQID32 24,4 23,9 19,6 18,5 18,5 17,1 13 19 19,9 8,9 20,4 22,5 11,2 17. SEQID34 16,3 15,6 15,8 15,7 12,4 12,2 14,3 15,8 17,5 17,8 14,5 13,4 27,6 18. SEQID36 28,4 26,5 12,8 17,9 17,9 15,1 12 37,4 30,4 13,1 55,2 26,9 18,4 19. SEQID38 39,9 36,2 18,7 16,2 20,3 16,3 18,9 25,7 30,9 9,8 33,1 32,1 12,6 20. SEQID40 28,9 28 21 18,4 18,1 18,8 12,6 32,9 31,7 11,8 33,3 29,3 15 21. SEQID42 14,5 13,1 11,7 13,4 12,1 12,9 19,8 20 19,3 16,8 15,4 15,8 20,1 22. SEQID44 29,9 29,6 17,2 20,4 17,4 16,3 12,6 36,1 30,9 13,2 45 28,7 15 23. SEQID46 58,7 40,4 23,4 18,5 20,6 17,4 11,9 29,4 33,2 12,4 32,8 303 16 24. SEQID48 46,4 52,4 23,5 18,8 19,9 17,6 14,6 26,9 28,7 11,4 31,5 28,7 14,6 25. SEQID50 16,8 20,9 18,8 18,2 18,5 16,5 12,7 14,5 16,7 11,5 14,2 16,4 16,8 26. SEQID52 11,8 15,6 14,2 13,1 13,8 13,6 15,7 15,9 19,8 14,3 17,3 17,4 20,6 27. SEQID54 41,5 19,9 20,8 20,8 16,7 13,9 26,9 28,8 10,8 31,1 32,7 14,2 28. SEQID56 57,1 21,6 18,8 19,9 19,1 16,7 24,3 27,2 11,3 30,5 31,8 15,4 29. SEQID58 35,5 34,6 24,9 27,1 24,3 13,1 16,7 17,8 11,4 19,7 19,8 16,3 30. SEQID60 34,3 32,7 35,5 37,1 38,9 12,2 18,5 21,9 12 19,3 20,2 15,4 31. SEQID62 37,2 34,9 40,5 48,5 72,8 13,1 19,2 20,8 11,3 18,2 17,6 15,4 32. SEQID64 34 33,7 37,3 54,8 75,7 12,1 19,6 18,3 12,1 17,9 16,3 16,6 33. SEQID66 22,6 28,9 20,9 20,6 23,8 21,3 12 13,2 7,4 13,5 15,6 11 34. SEQID68 39,2 33,9 27,4 33,5 30 36,6 19,6 26,8 13,4 37,7 25,7 15,8 35. SEQID70 45,4 38,6 35,1 35,8 34,2 34,8 22,1 38,4 14,4 29,7 33 16,8 36. SEQID72 19,1 17,9 19,7 21,8 18,8 22,9 12 20,6 22,5 12,2 11 21,5 37. SEQID74 47,8 45,3 35,8 33,5 34 32,6 22,3 51,2 44,5 20,9 30,5 16 38. SEQID76 47,7 47,4 34 29,9 31,2 28,2 24,9 36,8 44,2 17,4 43,1 14,5 39. SEQID78 24 23 25,3 27,9 22,6 26,3 16,5 25,3 25,5 34,4 28,9 23,8 40. SEQID80 23,3 24,8 26,3 30,5 26,6 29,8 17,7 32,2 25,5 32,7 27,4 22,2 59,9 41. SEQID82 27,1 24,4 28,8 28,8 25,9 32,6 20,8 33 27,3 32 30,8 23,3 46,4 42. SEQID84 22,3 21,3 23,4 27,3 21,7 21,9 15 26,8 25,3 45,3 21,2 21,9 39,7 43. SEQID86 20,3 20,8 22 25,5 20,8 22,4 15 27,2 23,8 48,7 21,7 20,3 39,8 44. SEQID88 17,6 16,4 19,1 21,7 17,6 20,3 11,1 21,2 19,9 53,9 18,8 16,8 32,2 45. SEQID90 18,4 18 19,6 22,3 17,2 21 12,7 21,7 20,2 56 18,5 18,5 34,4 46. SEQID94 17.3 18,5 18,1 20,7 17,2 19,8 11,6 22,3 21,2 52,6 19,5 17,1 32,1 47. SEQID96 16,9 16,4 19.3 20,5 18,2 20,3 12,1 22,8 21,7 54,5 20,2 17,7 31,4 48. SEQID100 27 27,3 24,8 27,3 24,3 26,4 18,7 29,3 27,3 43,1 27,7 23,6 39,3 49. SEQID102 31,7 27,1 27,7 26,6 27,5 24 26,4 26,9 31,3 32,4 27,7 32,1 32,8 50. SEQID104 25,3 27,3 27,3 29,8 24,6 27,5 17,4 28,2 25,1 43,3 29,1 26,2 41,3 51. SEQID106 25 25,5 25,9 26,1 23,4 28 17,9 34,2 25 31,7 32,6 25,7 46,6 52. SEQID108 22,7 23,8 24,5 27,2 25,6 27,6 18 28,7 28,1 31,8 27,4 25,2 66,6 53. SEQIDl 10 31,7 33,8 27,7 26,6 27,9 28,7 22,6 31,1 32,4 23,8 38,1 36,2 36 54. SEQID124 31,6 27,6 25,1 26,6 24,8 30,1 28,5 32,1 36 23,5 39,3 35,3 31,4 55. SEQID126 31,4 31,8 29,3 26,9 30,2 29,3 36 32,9 32,4 23,6 37,4 29,7 31,8 56. SEQID134 27,8 25,4 27,5 25,9 32,9 27,6 32,6 30,5 36,3 25,2 37,2 35 35 57. SEQ1D140 33,4 30,4 26,5 24,4 27,9 27,9 32,7 30,3 32,7 22,7 33,3 36,1 31,4
Tabela Al, continuada
40 41 42 43 44 45 46 47 48 49 50 51 52 1. SEQID2 25,3 22,4 39,5 38,3 41,7 41,1 39,7 37,9 38,3 22,4 36,5 23,8 23,8 2. SEQID4 23,7 23,1 38,8 39,6 46,7 46,9 45,1 43,1 37,5 21,2 37,8 22,2 23,5 3. SEQID6 22,7 22,3 17,9 17,9 14,3 15,1 15,6 14,5 22,4 29 20,3 25,2 22,3 4. SEQID8 22,5 25 19,4 18 15,3 15,4 15,4 15,2 23,5 25,1 21 24,7 22 5. SEQID10 21,9 21,9 18,7 15,5 13 12,9 13,4 13,3 20,4 30,3 21,3 23,6 20,8 6. SEQID12 22,8 24,3 17,6 18 14,1 14,6 14,2 15,9 20,9 28 20,7 25,8 21,4 7. SEQID14 22,7 23,9 18,6 17,7 14 14,6 14,1 14,6 22,7 30,1 21,6 23,2 23,8 8. SEQID16 28,2 31 25,7 23,4 17,9 18,4 18,2 18,9 26,9 31,3 25,6 31 30,8 9. SEQID18 14,3 14,4 12,7 12,2 10,5 11,2 12 10,9 14,1 14,9 14,6 13,8 14,5 10. SEQ1D20 14,7 15,9 11,9 12,1 11,2 10,4 12,6 10,6 14,1 17,1 13 13,8 13,3 11. SEQID22 14,2 15,2 13,9 11,5 10,9 9,8 11,2 10,8 15,2 16,6 13,1 15,9 14,3 12. SEQID24 27,5 29,8 23,5 21,4 17,3 17,1 17,2 17,8 25,3 31,1 24 30,2 30,1 13. SEQID26 13,8 16,9 13,5 14,1 11,8 11,6 10,4 10,9 15,3 12,5 15,6 15,3 15,1 14. SEQID28 14 11,5 11,8 11 9,6 9,7 9,5 8,5 13,1 15,3 12,4 12,4 12,2 15. SEQID30 16,1 15,9 13,4 14,2 13,6 13,8 12,7 12,3 14,9 15,9 16,6 13,7 14,7 16. SEQID32 11,7 12,2 11,2 10,7 7,6 8,4 8,8 8,5 11 13,9 12,8 12,4 12,5 17. SEQID34 28 29,4 22,7 21,6 16,8 18 16,8 16,8 28,3 33,2 26,2 33,3 29,5 18. SEQID36 17,4 19,2 14,7 13,4 13 12,6 11,8 13,1 16,4 15,5 15,3 19,5 16,4 19. SEQID38 12,7 12,8 10,5 12,4 9,5 9,4 10,1 10,2 14,2 13,7 14,2 14,4 12,7 20. SEQID40 15,1 14,6 13,4 12,4 12,5 11,2 11,2 9,9 14 16,2 16,1 15,1 14,9 21. SEQID42 22,6 21,5 19,5 18,5 15,5 16,6 16,6 15,7 23,2 28,2 23,2 22 23.1 22. SEQID44 14,4 15,6 15,6 14,8 13,5 12,6 13,1 12,5 13,9 15,5 18,1 13,9 13,5 23. SEQID46 16,1 16,6 14,2 14,8 11,6 13,1 10,1 12,4 14,6 13,5 16,7 14,8 15,8 24. SEQID48 14 14,6 13,2 12,6 10,4 12 10,8 11,9 13,5 16,1 13,1 14,6 14,5 25. SEQID50 14,5 14,5 14 14,1 11,2 11,3 9.6 9,6 12,9 15 13,7 13,1 16,8 26. SEQID52 18,6 19,7 18,3 17 12,6 13,8 13,9 13,9 20,4 26 20,9 19,5 20,9 27. SEQ1D54 14,5 14,4 14,9 13,7 10,6 11,2 10,4 10,5 14,8 11,9 14 12,8 14,3 28. SEQID56 15,9 13,3 12,7 12 11,1 11,5 11,5 9,8 16,4 11,7 17 14,4 15,1 29. SEQID58 15,1 14,4 13,5 13,1 10,5 12 10,8 11,5 13,7 15,3 15,9 16,1 14,3 30. SEQID60 15,5 13,5 12,2 12,1 12,5 11,6 12,6 12,3 11,9 14,1 13,5 12,4 13,7 31. SEQID62 12,5 12 11,8 12 9,8 10,4 10,8 10,9 12,1 12,8 13,9 11,6 14,9 32. SEQID64 15,3 16 11,3 13,4 11,6 12,6 13,4 11,3 13,3 13,2 14,1 13,8 15,8 33. SEQID66 11 12,4 9,9 9,5 7,8 7,7 8,1 8,1 12,2 13,9 10,8 11 11,6 34. SEQID68 18 18,4 15,8 14,3 13,8 13,4 14,2 12,7 17,5 17 17,2 18,7 16,2 35. SEQ1D70 15,9 15,5 13,6 14,6 12,2 10,7 12,8 13,3 15,1 16,8 17,1 13,9 15,5 36. SEQID72 22 21,2 35,1 35,3 40 40 37,9 39,8 34 29 34,4 22,6 22,3 37. SEQID74 16,7 17,2 12,5 13,9 12 12 11,4 11,9 16,6 13 17,3 17,9 15 38. SEQID76 13 11,5 13,9 12,9 10,7 11,5 9,6 11,4 14,2 13,3 16,4 14,6 16,9 39. SEQID78 46,4 32,7 25,1 25,5 22,1 24 21,9 21 26,3 24 26,6 33,5 58,2 40. SEQID80 31,2 27,1 25,2 20,9 22,4 21,9 21,4 29,1 24,6 28,3 34,1 47 41. SEQID82 49,2 24,5 25,9 20 20,3 20,1 19,9 27,6 25,8 26,9 33,1 31,8 42. SEQID84 40,8 38,6 71,1 36 36,3 35,8 36 43,5 26,2 41,9 27,1 27,1 43. SEQID86 38,7 37,7 79,7 35,5 37,9 38 36,8 40 24,4 41 26,2 26,9 44. SEQID88 32,4 30,6 45,6 46,1 64,6 55,8 53,6 34,5 19 33,7 21,1 20,1 45. SEQID90 32,5 32,2 46,6 49,7 73 51,3 51,7 35,1 20,1 34,9 22,3 24 46. SEQID94 31,8 32,9 47,6 51,2 67,6 65,5 49,7 34,8 19,4 33,7 21,5 21,3 47. SEQID96 30,7 30,1 45,8 46,3 66,7 64,2 63,4 34,3 18,9 34,4 21,6 21,7 48. SEQID100 42.1 42,1 54,3 50,1 42,8 43,8 42,4 42,9 29,7 72,2 28,3 28,2 49. SEQID102 35,2 36,4 33 31,2 25,5 25,9 25,2 24,4 41,2 29,6 25,5 26,9 50. SEQID104 44,1 42,6 51,7 49,7 41 44 41,9 42,5 81,3 39,5 27,7 27,3 51. SEQID106 50,3 51,7 39,3 36,7 30,3 31,1 32,3 31,6 43,7 36,2 39,5 34,7 52. SEQID108 61,3 49 38,2 39,1 28,9 33,2 31,3 32,3 43,9 37,2 41,2 48,6 53. SEQIDl 10 34,6 39 30,1 28,2 21,1 23,1 23,5 22,4 34,2 51,6 33,9 51,6 37 54. SEQID124 33,5 35,3 30,7 28,1 22,8 24,3 21,8 24 34 42,4 35,7 37,2 35,9 55. SEQID126 31,7 37 30 28,4 24,1 23,1 22,2 22,2 34,7 50,3 34,8 35,1 34,5 56. SEQID134 36,1 37,5 32,6 30,8 24,3 24,8 24,5 23,8 34,2 41,7 34,1 37,8 36,1 57. SEQID140 31,1 33.5 28,8 27,2 20,1 22,3 22.3 19,2 32,9 50 31,8 33,3 32,7
Tabela Al, continuada
53 54 55 56 57 1. SEQID2 18 19,6 18,5 17 17,6 2. SEQID4 17,2 15,7 15,6 17,1 16,4 3. SEQID6 28,9 47,3 48,4 44,6 59,7 4. SEQID8 26,8 60,2 52,8 53,3 44,8 5. SEQID10 29,8 47,5 49 46,9 46,2 6. SEQID12 28,7 50 46,1 51,1 45,8 7. SEQID14 27,8 46,1 51,8 46,2 65,2 8. SEQID16 34,1 29,2 25,6 27,3 27,1 9. SEQID18 18,7 15,1 15,3 17,9 15,1 10. SEQID20 19,3 15 15,9 13,9 14,2 11. SEQID22 18,5 17,7 16,5 19,2 17,4 12. SEQID24 32,9 30,8 25,7 27,8 26,3 13. SEQ1D26 19,4 20,6 18,1 19,7 19,3 14. SEQID28 13,4 14,2 17 15 13,5 15. SEQID30 19,8 16,7 18,4 18,6 15,6 16. SEQID32 13,1 15,2 14,9 12,4 13,8 17. SEQID34 40,1 27,9 30,1 25,7 30,2 18. SEQID36 19 19,7 17,8 19,7 19,4 19. SEQID38 19 18,8 16,1 18,4 18,1 20. SEQID40 17,9 19,3 13,7 19,4 16,2 21. SEQID42 24,3 36,4 33,9 35,3 35,8 22. SEQID44 19 17,9 16,8 17,9 17,8 23. SEQID46 20,5 19,6 19 18,4 15,6 24. SEQID48 15,1 12,1 14,2 11,4 14,5 25. SEQID50 12,6 14,6 16,1 16,6 16,8 26. SEQID52 25,2 30 30,8 28,6 36,3 27. SEQID54 15,6 14,2 17,2 14,4 15,5 28. SEQID56 18,2 13,9 13,8 14,1 13,1 29. SEQID58 13,2 12,2 15 10,9 14 30. SEQID60 15,8 14 14,2 14,1 13,4 31. SEQID62 12,2 13,9 15,1 14,9 15,2 32. SEQID64 13,9 13,7 14 10,9 14,3 33. SEQID66 12,1 23,1 28,8 22,8 19,5 34. SEQID68 18,7 19 17,4 17,8 17,8 35. SEQID70 18,6 20,1 20,5 20 19,4 36. SEQID72 17 15,2 16 16,3 14,6 37. SEQID74 21,2 19,9 21,6 20,2 20,2 38. SEQID76 21,3 21,5 14,9 20,6 16,8 39. SEQID78 25,9 22,6 21,8 22,5 22,2 40. SEQID80 25,5 22,6 21,6 24,3 23,3 41. SEQID82 29,2 22 22,8 24,2 22,4 42. SEQID84 21,6 19,1 19,9 19,5 18,7 43. SEQID86 19,3 17,9 17,9 18,1 17,2 44. SEQID88 15,6 14,7 15,1 15,3 14,4 45. SEQID90 16,2 14,8 15,9 15,4 14,7 46. SEQID94 17,3 14,5 14,9 15,7 14,1 47. SEQID96 16,8 15 15,1 14,8 13,4 48. SEQID100 24,2 21,2 24 20,7 21,1 49. SEQID102 33,3 26,1 28,2 25,9 30,2 50. SEQID104 22,8 21,8 24 21,5 22 51. SE QID106 46,2 23,5 24,1 25,3 22 52. SEQID108 25,9 22,8 23,8 22,2 23,2 53. SEQIDl 10 27,4 29,2 27,4 27,9 54. SEQID124 44 54,2 54,9 44 55. SEQID126 44,6 64,1 54,5 49,8 56. SEQID134 40,8 68 65,6 43,8 57. SEQID140_ 41,8 55J 59,8 Ysifi
Exemplo 4: Identificação de domínios compreendidos em CCAl
O banco de dados de Recurso Integrado de Famílias, Domínios e Sítios Proteicos (InterPro) é um interface integrada para os banco de dados de assinatura comumente usados para pesquisas baseadas em texto e seqüência. O banco de dados InterPro combina esses banco de dados, que usam metodologias diferentes e graus variantes de informação biológica sobre proteínas bem caracterizadas para derivar assinaturas proteicas. Bancos de dados que colaboram incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom and Pfam, Smart e TIGRFAMs. Interpro é hospedado no Instituto de Bioinformática Europeu no Reino Unido.
Os resultados da varredura do InterPro da seqüência polipeptídica como representada pela SEQ ID NO: 2 são apresentados na Tabela A2.
Tabela A2: Resultados do InterPro da seqüência polipeptídica como representada pela SEQ ID NO: 2
Banco de dados Número de acesso Nome de acesso Interpro IPROO1005 Myb, DNA-binding PFAM PF00249 Myb DNA-binding SMART SM00717 SANT domain PROFILE PS50090 MYB 3 Interpro IPR006447 Myb-Iike DNA-binding region, SHAQKYF class TIGRF AMs TIGRO1557 myb SHAQKYF Interpro IPR009057 Homeodomain-Iike SUPERF AMILY SSF46689 Homeodomain Iike
Exemplo 5: Previsão de topologia das seqüências polipeptídicas úteis na realização dos métodos da invenção (localização subcelular, transmembrana...)
TargetP 1.1 prevê a localização subcelular de proteínas eucarióticas. A atribuição de localização é baseada na presença prevista de qualquer das pré-sequências N-terminais: peptídeo de trânsito para cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Pontuações em que a previsão final é baseada não são probabilidades realmente e elas não necessariamente adicionam a uma. Entretanto, a localização com a pontuação mais alta é a mais provável de acordo com TargetP e a relação entre as pontuações (a classe de confiabilidade) pode ser uma indicação do quão certa a previsão é. A classe de confiabilidade (RC) varia de 1 até 5, em que 1 indica a previsão mais forte. TargetP é mantido no servidor da Universidade Técnica da Dinamarca.
Paras as seqüências previstas como contendo pré-sequências N-terminal um sítio de clivagem potencial também pode ser previsto.
Vários parâmetros foram selecionados, tais como grupo de organismo (não planta ou planta), grupos limiares (nenhum, grupo pré- definido de limiares, ou grupo de limiares especificado pelo usuário) e o cálculo de previsão de sítios de clivagem (sim ou não).
Os resultados de análise de TargetP 1.1 da seqüência polipeptídica como representada pela SEQ ID NO: 2 são apresentados na Tabela A3. O grupo de organismo "planta" foi selecionado, nenhum limiar definido e o comprimento previsto do peptídeo de trânsito requisitado. A localização subcelular da seqüência polipeptídica como representada pela SEQ ID NO: 2 é provavelmente o citoplasma ou núcleo. Entretanto, deve ser notado que os efeitos observados em rendimento como descrito na presente aplicação não são o resultado de uma localização particular da proteína.
Tabela A3: Análise de TargetP 1.1 da seqüência polipeptídica como representada pela SEQ ID NO: 2
Comprimento (AA) 608 Peptídio de trânsito Cloroplastídico 0,160 Peptídio de trânsito mitocondrial 0,149 Peptídio sinal de via secretora 0,027 Outro direcionamento subcelular 0,900 Localização prevista outra Classe de confiabilidade 2 Comprimento de peptídeo de trânsito previsto / Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:
• ChloroP 1.1 hospedado no servidor da Universidade Técnica da Dinamarca;
· Protein Prowler Subcellular Localisation Predictor versão
1.2 hospedado no Instituto para Biociência Molecular, Universidade de Queensland, Brisbane, Austrália;
• Analista de Proteoma PENCE PA-GOSUB 2.5 hospedado no servidor da Universidade de Alberta, Edmonton, Alberta, Canadá;
· TNHMM, hospedado no servidor da Universidade Técnica
da Dinamarca;
Exemplo 6: Ensaio relacionada às seqüências polipeptídicas de CCAl
Proteínas semelhantes a CCAl (pelo menos em sua forma
nativa) tipicamente tem atividade de ligação a DNA. Ensaios de ligação a
DNA são parte do estado da técnica (veja, por exemplo, Current Protocols in
Molecular Biology, Volumes 1 e 2, Ausubel et al. (1994), Current Protocols).
Em particular, um ensaio de ligação a DNA para fatores de transcrição
* 1 ·
semelhantes a CCAl usando o fragmento A2 do gene Lhcbl 3 é descrito em Wang et al., (Plant Cell 9, 497-507, 1197). Em resumo, polipeptídios compreendendo a repetição MYB foram expressos e purificados e usados em Ensaio de Alteração de Mobilidade Eletroforética (EMSA). Os polipeptídios purificados foram incubados com fragmento A2 purificado e radiomarcado do gene Lhcb7*3 e poli (dldC) durante 15 minutos a 30°C. Em seguida, as amostras foram separadas em um gel de poliacrilamida a 8% e auto- radiografadas. Bandas de proteína correspondentes a CCAl claramente se ligaram à sonda radioativa, indicativo da formação de um complexo proteína- DNA.
Além disso, superexpressão de uma proteína semelhante a CCAl em uma planta leva à floração atrasada e abole a expressão circadiana de Lhcb ou outros gene expressos circadianamente em condições de luz contínua ou escuro contínuo. Senão, a expressão de uma proteína semelhante a CCAl de acordo com os métodos da presente invenção resulta em rendimento de semente aumentado como descrito abaixo. Exemplo 7: Clonagem de seqüência de ácido nucleico como representada pela SEQID NO: 1
A menos que estipulado de outro modo, técnicas de DNA recombinante são realizadas de acordo com protocolos padrões descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3a Edição Cold Spring Harbor Laboratory Press, CSH, Nova Iorque) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrões para trabalho molecular vegetal são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
O gene semelhante a CCAl de Arabidopsis thaliana foi amplificado por PCR usando como molde uma biblioteca de cDNA de plântula de Arabidopsis thaliana (Invitrogen, Paisley, UK). Iniciadores prm07263 (SEQ ID NO: 146; em sentido, códon de início em negrito, sítio AttBl em itálico: 5'-
ggggacaagtttgtacaaaaaagcaggcttaaaeaatggagacaaattcgtctgga-3') e
prm07264: (SEQ ID NO: 147; reverso, complementar, sítio AttB2 em itálico: 5'-ggggaecactttgtacaagaaagetgggtgaaaatagagtctcatgtggaagc-3'), que inclui os sítio AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizada usando Taq DNA polimerase Ele em condições padrões. Um fragmento de PCR foi amplificado e purificado também usando métodos padrões. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir de acordo com a terminologia Gateway, um "clone de entrada", pCCAl. O plasmídeo pDC)NR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 8: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada pela SEQID NO: 1 O clone de entrada pCCAl foi subsequentmente usado em
uma reação LC com pGOS2, um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro das bordas de T-DNA: um marcador selecionável vegetal, um cassete de expressão de marcador triável e um cassete Gateway destinado para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID NO: 145) para expressão constitutiva foi localizado a montante deste cassete Gateway.
Após a etapa de recombinação LR, o vetor de expressão resultante pGOS2::CCAl (Figura 3) foi transformado em Agrobacterium cepa LBA4044 de acordo com métodos bem conhecidos na técnica. Exemplo 9: Transformação vegetal
Transformação de arroz
A Agrobacterium contendo o vetor de expressão foi usada para transformar plantas de Oryza sativa. Sementes secas maduras do cultivar japônica de arroz Nippombare foram descascadas. Esterilização foi efetuada por incubação por um minuto em etanol 70%, seguida por 30 minutos em 0,2% de HgCl2, seguida por uma lavagem de 6 vezes por 15 minutos com água destilada estéril. As sementes estéreis foram então germinadas em um meio contendo 2,4-D (meio de indução de calo). Após incubação no escuro por quatro semanas, calos derivados de escutelo, embriogênicos foram excisados e propagados no mesmo meio. Após duas semanas, os calos foram multiplicados ou propagados por subcultivo no mesmo meio por outras 2 semanas. Pedaços de calo embriogênico foram subcultivados em meio fresco 3 dias antes de co-cultivo (para reforçar atividade de divisão celular). Agrobacterium cepa LBA4404 contendo o vetor de expressão foi usada para co-cultivo. Agrobaeterium foi inoculada em meio AB com antibióticos apropriados e cultivada por 3 dias a 28°C. As bactérias foram então coletadas e suspendidas em meio de co-cultivo líquido em uma densidade (OD600) de cerca de 1. A suspensão foi então transferida para uma placa de Petri e os calos imergidos na suspensão por 15 minutos. Os tecidos calosos foram então transferidos secos em um papel de filtro e transferidos para meio solidificado, de co-cultivo e incubados por 3 dias no escuro a 25°C. Os calos co-cultivados foram cultivados em 2,4-D contendo meio por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, ilhas de calo resistente de crescimento rápido se desenvolveram. Após transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e brotos se desenvolveram nas próximas quatro a cinco semanas. Brotos foram excisados dos calos e incubados por 2 até 3 semanas em um meio contendo auxina a partir do qual eles foram transferidos para solo. Brotos endurecidos foram cultivados sob alta umidade e dias curtos em uma estufa.
Aproximadamente 35 transformantes de arroz de TO independentes foram gerados para uma construção. Os transformantes primários foram transferidos de uma câmara de cultura de tecidos para uma estufa. Após uma análise de PCR quantitativa para verificar número de cópias do inserto de T-DNA, apenas plantas transgênicas de cópia única que exibiam tolerância ao agente de seleção foram mantidas para colheita de semente TI. Sementes foram então colhidas três até cinco meses após o transplante. O método rendeu transformantes de loco único em uma taxa de mais de 50% (Aldemita and Hodges 1996, Chan et al. 1993, Hiei et al. 1994).
Transformação de milho
Transformação de milho {Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. Transformação é dependente de genótipo em milho e apenas genótipos específicos são receptivos a transformação e regeneração. A linhagem isogênica Al88 (Universidade de Minnesota) ou híbridos com Al88 como um progenitor são boas fontes de material doador para transformação, mas outros genótipos podem ser usados satisfatoriamente também. Espigas são colhidas de planta de milho de aproximadamente 11 dias após polinização (DAP) quando o comprimento do embrião imatura é de cerca de 1 até 1,2 mm. Embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e plantas transgênicas são recuperadas através de organogênese. Embriões excisados são cultivados em meio de indução de calo, então meio de regeneração de milho, contendo o agente de seleção (por exemplo, imidazolinona, mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25°C por 2-3 semanas, ou até brotos se desenvolverem. Os brotos verdes são transferidos de cada embrião para meio de enraizamento de milho e incubados a 25°C por 2-3 semanas, até raízes se desenvolverem. Os brotos enraizados são transplantados ao solo na estufa. Sementes Tl são produzidas de plantas que exibem tolerância ao agente de seleção e que contém uma única cópia do inserto de T-DNA.
Transformação de trigo
A transformação de trigo é realizada com o método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. O cultivar Bobwhite (disponível de CIMMYT, México) é comumente usado em transformação. Embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e plantas transgênicas são recuperadas através de organogênese. Após incubação com Agrobaeterium, os embriões são cultivados in vitro em meio de indução de calo, então meio de regeneração, contendo o agente de seleção (por exemplo, imidazolinona, mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25 C por 2-3 semanas, ou até brotos se desenvolverem. Os brotos verdes são transferidos de cada embrião para meio de enraizamento e incubados a 25°C por 2-3 semanas, até raízes se desenvolverem. Os brotos enraizados são transplantados ao solo na estufa. Sementes Tl são produzidas de plantas que exibem tolerância ao agente de seleção e que contém uma única cópia do inserto de T-DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação do método descrito na patente da Texas A&M US 5.164.310. Muitas variedades de soja comercial são receptivas a transformação por este método. O cultivar Jack (disponível na fundação de Semente de Illinois) é comumente usado para transformação. Sementes de soja são esterilizadas para semeadura in vitro. O hipocotilédone, a radícula e um cotilédone são excisados de plântulas jovens de sete dias de idade. O epicotilédone e o cotilédone remanescente são cultivados adicionalmente para desenvolver nós auxiliares. Esses nós auxiliares são excisados e incubados com Agrobacterium tumefaciens contendo o vetor de expressão. Após o tratamento de co-cultivo, os explantes são colocados em um meio de alongamento de broto. Brotos não maiores que 1 cm são colocados em meio de enraizamento até raízes se desenvolverem. Os brotos enraizados são transplantados ao solo na estufa. Sementes Tl são produzidas de plantas que exibem tolerância ao agente de seleção e que contém uma única cópia do inserto de T-DNA.
Transformação de colza/canola
Pecíolos de cotilédones e hipocotilédones de plântula jovem de 5-6 dias de idade são usados como explantes para cultura de tecidos e transformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). O cultivar comercial Westar (Agriculture Canada) é a variedade padrão usada para transformação, mas outras variedades também podem ser usadas. Sementes de canola são esterilizadas na superfície para semeadura in vitro. Os explantes de pecíolo de cotilédone com o cotilédone aderido são excisados das plântulas in vitro e inoculados com Agrobacterium (contendo o vetor de expressão) por mergulho da extremidade cortada do explante de pecíolo na suspensão bacteriana. Os explantes são então cultivados por 2 dias em meio MSBAP-3 contendo 3 mg/L de BAP, 3% de sacarose, 0,7% de Phytagar a 23°C, 16h de luz. Após dois dias de co-cultivo com Agrobacterium, os explantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/L de BAP, cefotaxima, carbenicilina ou timentina (300 mg/L) por 7 dias e então cultivados em meio MSBAP-3 com cefotaxima, carbenicilina ou timentina e agente de seleção até regeneração de broto. Quando os brotos têm 5-10 mm de comprimento, eles são cortados e transferidos para meio de alongamento de broto (MSBAP-0,5, contendo 0,5 mg/L de BAP). Brotos de cerca de 2 cm de comprimento são transferidos para meio de enraizamento (MSO) para indução de raiz. Os brotos enraizados são transplantados ao solo na estufa. Sementes Tl são produzidas de plantas que exibem tolerância ao agente de seleção e que contém uma única cópia do inserto de T-DNA.
Transformação de alfafa
Um clone de regeneração e alfafa (Medicago sativa) é transformado usando o método de (McKersie et al., 1999 Plant Physiol 119: 839-847). Regeneração e transformação de alfafa é dependente de genótipo e, portanto, uma planta regenerante é requerida. Métodos para obter plantas regenerantes foram descrito. Por exemplo, essas podem ser selecionados a partir do cultivar Rangelander (Agricultura Canada) ou de qualquer outra variedade de alfafa comercial como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Senão, uma variedade RA3 (Universidade de Wisconsin) foi selecionada para uso em cultura de tecidos (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolo são co-cultivados com uma cultura durante a noite de Agrobaeterium tumefaeiens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 dias no escuro em meio de indução SH contendo 288 mg/L de Pro, 53 mg/L de tioprolina, 4,35 g/L de K2SO4 e 100 μΜ de acetosiringinona. Os explantes são lavados em meio Murashige-Skoog de media força (Murashige and Skoog, 1962) e plaqueados no mesmo meio de indução SH sem acetosiringinona, mas com um agente de seleção adequado e antibiótico adequado para inibir crescimento de Agrobacterium. Após várias semanas, embriões somáticos são transferidos para meio de desenvolvimento Boi2Y contendo nenhum regulador de crescimento, nenhum antibiótico e 50 g/L de sacarose. Embriões somáticos são subseqüentemente germinados em meio Murashige-Skoog de media força. Plântulas enraizadas foram transplantadas em potes e cultivadas em uma estufa. Sementes Tl são produzidas de plantas que exibem tolerância ao agente de seleção e que contém uma única cópia do inserto de T-DNA. Transformação de algodão
Algodão é transformado usando Agrobaeterium tumefaeiens de acordo com o método descrito em US 5.159.135. Sementes de algodão são esterilizadas em superfície em 3% de solução de hipoclorito de sódio durante minutos e lavadas em água destilada com 500 μg/mL de benomyl para germinação. Hipocotilédones de plântulas de 4 até 6 dias de idade são removidos, cortados em pedaços de 0,5 cm e são colocados em Agar 0,8%. Uma suspensão de Agrobaeterium (aprox. 108 células por mL, diluída de uma cultura durante a noite transformada com o gene de interesse e marcadores de seleção adequados) é usada para inoculo dos explantes de hipocotilédone. Após 3 dias em temperatura e iluminação ambiente, os tecidos são transferidos para um meio sólido (1,6 g/L de Gelrite) com sais de Murashige e Skoog com vitaminas B5 (Gamborg et al., Exp. Cell Res. 50:151-158 (1968)), 0,1 mg/L de 2,4-D, 0,1 mg/L de 6-furfurilaminopurina e 750 μg/mL de MgCl2 e com 50 até 100 μg/mL de cefotaxime e 400-500 μg/nlL de carbenicilina para matar bactérias residuais. Linhagens celulares individuais são isoladas após dois até três meses (com subcultivos a cada quatro até seis semanas) e são cultivados adicionalmente em meio seletivo para amplificação de tecido (30°C, 16h de fotoperíodo). Tecidos transformados são subsequente,ente cultivados adicionalmente em meio não seletivo durante 2 até 3 meses para dar origem embriões somáticos. Embriões parecendo saudáveis com pelo menos 4 mm de comprimento são transferidos para tubos com meio SH em vermiculite fina, suplementado com 0,1 mg/L de ácido indol acético, 6 furfúrilaminopurina e ácido giberélico. Os embriões são cultivados em 3 O0C com fotoperíodo de 16h e plântulas no estágio de 2 até 3 folhas são transferidas para potes com vermiculite e nutrientes. As plantas são endurecidas e subseqüentemente movidas para estufa para cultivo adicional. Exemplo 10: Procedimento de avaliação fenotípica 10.1 Sistema de avaliação Aproximadamente 35 transformantes de arroz de TO
independentes foram gerados. Os transformantes primários foram transferidos de uma câmara de cultura de tecidos para uma estufa para crescimento e colheita de semente TI. Sete eventos, dos quais a progênie Tl segregou 3:1 para presença/ausência do transgene, foram retidos. Para cada um desses eventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero- e homozigotos) e aproximadamente 10 plântulas Tl caracendo do transgene (nulizigotos) foram selecionados por monitoramento de expressão de marcador visual. As plantas transgênicas e os nulizigotos correspondentes foram cultivadas lado a lado em posições aleatórias. Condições de estufa foram em dias curtos (12 horas de luz), 28°C na luz e 22°C no escuro e uma umidade relativa de 70%.
Quatro eventos Tl foram avaliados adicionalmente na geração T2 seguindo o mesmo procedimento de avaliação como para a geração TI, mas com mais indivíduos por evento. Do estágio de semeadura até o estágio de maturidade as plantas foram passadas verias vezes através de uma cabine de imagem digital. Em cada ponto de tempo imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
10.2 Análise estatística: teste F
Uma ANOVA de dois fatores (análise de variantes) foi usada como modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi efetuado em todos os parâmetros medidos de todas as plantas de todos os eventos transformados com o gene da presente invenção. O teste F foi efetuado para checar um efeito do gene sobre todos os eventos de transformação e para verificar um efeito geral do gene, também conhecido como um efeito gênico global. O limiar para significância para um efeito gênico global verdadeiro foi ajustado em um nível de probabilidade de 5% para o teste F. Um valor de teste F significativo indica um efeito gênico, significando que não é apenas a mera presença ou posição do gene que causa as diferenças de fenótipo.
10.3 Parâmetros medidos Medição de parâmetro relacionado à biomassa Do estágio de semeadura até o estágio de maturidade as plantas foram passadas várias vezes através de uma cabine de imagem digital. Em cada ponto de tempo imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
A área acima do solo da planta (ou biomassa folhosa) foi determinada pela contagem do número total de pixéis nas imagens digitais das partes da planta acima do solo a partir do chão. Deste valor foi feita média para as fotos tomadas no mesmo momento a partir de diferentes ângulos e foi convertida para um valor de superfície física expresso em mm quadrado por calibração. Experimentos mostram que a área de planta acima do solo medido deste modo está correlacionada à biomassa de partes de planta acima do solo. A área acima do solo é a área medida no momento em que a planta tinha atingido sua biomassa folhosa máxima. O vigor inicial é a área acima do solo da planta (plântula) três semanas pós-germinação.
Medições de parâmetro relacionado a semente As panículas primárias maduras foram colhidas, contadas,
empacotadas, marcadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então debulhadas e todas as sementes foram coletadas e contadas. As cascas preenchidas foram separadas das vazias usando um dispositivo de inflação de ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas preenchidas foram pesadas em uma balança analítica. O número de sementes preenchidas foi determinado pela contagem do número de cascas preenchidas que permaneceram após a etapa de separação. O rendimento de semente total foi medido por contagem do número de cascas colhidas de uma planta. Peso de cem sementes (TKW) é extrapolado do número de sementes preenchidas contado e seus pesos totais. O índice de Colheita (HI) na presente invenção é
definido como a razão entre o rendimento de semente total e a área acima do
2 ^ solo (mm ), multiplicada por um fator 10°. O número total flores por panícula
como definido na presente invenção é a razão entre o número total de
sementes e o número de panículas primárias maduras. A taxa de
preenchimento de semente como definida na presente invenção é a proporção
(expressa como uma %) do número de sementes preenchidas sobre o número
total de sementes (ou flósculos).
Exemplo 11: Resultados da avaliação fenotípica das plantas transgênicas
Os resultados da avaliação de plantas transgênicas de arroz da
seqüência de ácido nucleico CCAl são apresentados na Tabela A4. A diferença porcentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P de teste F abaixo de 0,05.
Rendimento de semente total, número de sementes preenchidas, taxa de preenchimento de semente e índice de colheita são aumentados significativamente nas plantas transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção, comparadas com as plantas controle (neste caso, os nulizigotos).
Tabela A4: Resultados da avaliação de plantas de arroz transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção.
Característica % de % % de aumento na aumento na geração Tl geração T2 Rendimento de semente 26,7 38,6 total Número de sementes 22,9 28,6 preenchidas Taxa de preenchimento 11,2 9,6 índice de colheita 15,4 15,6 Flores por panícula 16,5 16,9 Peso de cem sementes 2,7 7,2
Parte II. VPE
Exemplo 12: Identificação de seqüências relacionadas a seqüências VPE de SEQID NO: 149 E SEQID NO: 150
Seqüências (cDNA completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 149 e/ou seqüências proteicas relacionadas à SEQ ID NO: 150 foram identificadas entre aquelas mantidas no banco de dados Nucleotides Entrez no Centro Nacional para Informação em Biotecnologia (NCBI) usando ferramentas de pesquisa de seqüência em banco de dados, tais como a Ferramenta de Alinhamento Local Básico (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa foi usado para encontrar regiões de similaridade local entre seqüências por comparação de seqüências de ácido nucleico ou polipeptídicas com bancos de dados de seqüências e pelo cálculo da significância estatística de pareamentos. O polipeptídio codificado pela SEQ ID NO: 149 foi usado para algoritmo TBLASTN, com ajustes padrões e o filtro para ignorar seqüências de baixa complexidade desligado. A produção da análise foi vista por comparação par a par e classificada de acordo com a pontuação de probabilidade (valor de E), onde a pontuação reflete a probabilidade que um alinhamento particular ocorra por acaso (quanto menor o valor de E, mais significativo o sucesso). Além dos valores de E, comparações também foram pontuadas por identidade de porcentual (identidade porcentual se referindo ao número de nucleotídeos idênticos (ou de aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular). Em alguns casos, os parâmetros padrões podem ser ajustados para modificar a estringência da pesquisa.
A Tabela B1 provê uma lista de seqüências de ácido nucleico e proteicas relacionadas á seqüência de ácido nucleico como representada pela SEQ ID NO: 149 e à seqüência proteica representada pela SEQ ID NO: 150. Tabela BI: Seqüências de ácido nucleico relacionadas à SEQ
ID NO: 149 e polipeptídios deduzidos correspondentes.
Nome SEQ ID NO: Nucleotídeo (NT) ou proteína (PROT) Origem VPEg SEQ ID NO: 149 Nt Arabidopsis thaliana VPEg SEQ ID NO: 150 PROT Arabidopsis thaliana >TA0704@contig9701 SEQ ID NO:151 Nt Triticum aestivum >TA0704@contig9701 SEQ ID NO: 152 PROT Tritieum aestivum >TA0704@contig 15207 SEQ ID NO: 153 Nt Tritieum aestivum >TA0704@contig 15207 SEQ ID NO: 154 PROT Tritieum aestivum >TA0704@contig 14121 SEQ ID NO: 155 Nt Tritieum aestivum >TA0704@contig 14121 SEQ ID NO: 156 PROT Tritieum aestivum >TA0704@contigl 1093 SEQ ID NO: 157 Nt Tritieum aestivum >TA0704@contig 11093 SEQID NO: 158 PROT Tritieum aestivum >HV0704@contig6924 SEQ ID NO: 159 Nt Hordeum vulgare >HV0704@contig6924 SEQ ID NO: 160 PROT Hordeum vulgare >GM0604@contig24378 SEQ ID NO: 161 Nt Glyeine max >GM0604@contig24378 SEQ ID NO: 162 PROT Glyeine max >GM0604@contig20207 SEQ ID NO: 163 Nt Glyeine max >GM0604@contig20207 SEQ ID NO: 164 PROT Glyeine max >GM0604@contig 13648 SEQ ID NO: 165 Nt Glyeine max >GM0604@contig 13648 SEQ ID NO: 166 PROT Glyeine max >BN0204@contig29409 SEQ ID NO: 167 Nt Brassiea napa >BN0204@contig29409 SEQ ID NO: 168 PROT Brassiea napa >BN0204@contig26590 SEQ ID NO: 169 Nt Brassica napa >BN0204@contig26590 SEQ ID NO: 170 PROT Brassica napa >ZM0404@contig 11971 SEQ ID NO: 171 Nt Zea mays >ZM0404@contig 11971 SEQ ID NO: 172 PROT Zea mays >AT2G25940 Alpha-VPE SEQ ID NO: 173 Nt Arabidopsis thaliana >AT2G25940 Alpha-VPE SEQ ID NO: 174 PROT Arabidopsis thaliana >AT1G62710 BETA-VPE SEQ ID NO: 175 Nt Arabidopsis thaliana >AT1G62710 BETA-VPE SEQ ID NO: 176 PROT Arabidopsis thaliana >AT3G20210 DELTA-VPE SEQ ID NO: 177 Nt Arabidopsis thaliana >AT3G20210 DELTA-VPE SEQ ID NO: 178 PROT Arabidopsis thaliana >0s01g0559600 SEQ ID NO: 179 Nt Oryza sativa >0s01g0559600 SEQ ID NO: 180 PROT Oryza sativa >0s02g0644000 SEQ ID NO: 181 Nt Oryza sativa >0s02g0644000 SEQ ID NO: 182 PROT Oryza sativa >0s04g0537900 SEQ ID NO: 183 Nt Oryza sativa >0s04g0537900 SEQ ID NO: 184 PROT Oryza sativa >0s05g0593900 SEQ ID NO: 185 Nt Oryza sativa >0s05g0593900 SEQ ID NO: 186 PROT Oryza sativa >lcl scaff 127.44 SEQ ID NO: 187 Nt Populus trichocarpa >lcl_scaff_127.44 SEQ ID NO: 188 PROT Populus trichocarpa >lcl scaff VI. 1657 SEQ ID NO: 189 Nt Populus trichocarpa >lcl_scaff_VI. 1657 SEQ ID NO: 190 PROT Populus trichocarpa >lcl scaff VIII.21 SEQ ID NO: 191 Nt Populus trichocarpa >lcl_scaff_VIII.21 SEQ ID NO: 192 PROT Populus trichocarpa >Le_CAH56498.1_VPEg SEQ ID NO: 193 Nt Solanum lycopersicum >Le_CAH56498.1_VPEg SEQ ID NO: 194 PROT Solanum lycopersicum >Nt_BAC54827.1 VPEg SEQ ID NO: 195 Nt Nicotiana tabacum >Nt_BAC54827.1 VPEg SEQ ID NO: 196 PROT Nicotiana tabacum >So_ABF00019. IVPEg SEQ ID NO: 197 Nt Saccharum officinarum >So_ABF00019.1 VPEg SEQ ID NO: 198 PROT Saccharum officinarum >Zm_See2a SEQ ID NO: 199 Nt Zea mays >Zm See2a SEQ ID N0:200 PROT Zea mays >Zm See2b SEQ ID N0:201 Nt Zea mays >Zm_See2b SEQ ID N0:202 PROT Zea mays >Zm VPEl SEQ ID N0:203 Nt Zea mays >Zm_VPE1 SEQ ID N0:204 PROT Zea mays
Exemplo 13: Alinhamento de VPEs
AlignX do Vector NTI (Invitrogen) é baseado no popular algoritmo de Clustal de alinhamento progressivo (Thompson et ai. (1997) Nucleic Aeids Res 25:4876-4882; Chenna et ai. (2003). Nueleie Aeids Res 31:3497-3500) foi usado para alinhamento de seqüências de VPE. Uma árvore filogenétiea pode ser construída usando um algoritmo de agrupamento de neighbour-joining. Valores padrões são para penalidade de abertura de interrupção de 10, para a penalidade de extensão de interrupção de 0,1 e a matriz de peso selecionada é Blosum 62.
O resultado do alinhamento múltiplo de seqüências realizado com AlignX do Vector NTI (Invitrogen) usando parâmetros padrões é mostrado na Figura 6B. Um alinhamento múltiplo de seqüências e a árvore filogenética correspondente de polipeptídios VPE e peptidase representativas de outros clãs proteicos foi realizado usando o AlignX do Vector NTI (Invitrogen) ajustado para parâmetros padrões (Figura 6A). Polipeptídio VPE aglomeram-se juntos, separados de peptidases pertencentes a clã diferente. Polipeptídios VPE se aglomeram em quatro subclasses. VPEs na classe alfa são os mais próximos de VPEs da classes gama, a classe à qual a SEQ ID NO: 150 pertence.
Exemplo 14: Cálculo de identidade porcentual global entre seqüências polipeptídicas úteis na realização dos métodos da invenção
Porcentagens globais de similaridade e identidade entre seqüências polipeptídicas completas úteis na realização dos métodos da invenção foram determinadas usando um dos métodos disponíveis na técnica, o programa MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). O programa MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteicas sem precisar de pré-alinhamento dos dados. O programa faz uma série de alinhamentos par a par usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de interrupção de 12 e uma penalidade de extensão de interrupção de 2), calcula similaridade e identidade usando, por exemplo, Blosum 62 (para polipeptídios) e então coloca os resultados em uma matriz de distância. A similaridade de seqüência é mostrada na metade inferior da linha de divisão e a identidade de seqüência é mostrada na metade superior da linha de divisão diagonal.
Parâmetros usados na comparação foram: Matriz de pontuação: Blosum 62 Primeira interrupção: 12 Interrupção prolongada: 2
Os resultados da análise do programa são mostrados na Tabela B2 para a identidade e similaridade global por todo o comprimento das seqüências polipeptídicas (excluindo as seqüências polipeptídicas parciais). Identidade porcentual é dada acima da diagonal e similaridade porcentual é dada abaixo da diagonal.
A identidade porcentual entre VPEs começa em cerca de 45% de identidade de aminoácidos comparada com SEQ ID NO: 150.
Tabela B2 e B3: Resultados de MatGAT para identidade e similaridade global por todo o comprimento das seqüências polipeptídicas.
Tabela B2: Similaridade global entre polipeptídios de VPE de
plantas dicotiledôneas.
1 2 3 4 5 6 7 8 9 10 11 12 1. SEQ ID NO: 150 73,9 59 71,7 87,1 48,8 73,1 73,3 80 100 58,6 48,1 2. GM0604@contig24378 85 57,9 78,8 75,4 49,5 75,2 75,2 73,3 73,9 57,3 49,9 3. GM0604@contig20207 73,3 70,1 57,5 58,8 44,8 56 56 55,8 59 66,4 43,1 4. GM0604@contig 13 648 82,2 87,4 71,9 74,1 50,4 74,3 73,9 70,5 71,7 58,9 50,5 5. BN0204@contig29409 91,9 86,7 71,3 83,6 48,5 75,8 73,2 79,5 87,1 57,1 47,9 6. BN0204@contig26590 64,2 64,3 59,8 65,1 63,2 50,1 49,2 49,7 48,8 47,5 76,3 7. Le CAH56498. I VPEg 83,8 86,2 70,3 84,6 84,2 66 81,1 73,2 73,1 57,5 50 8. Nt_BAC54827. IVPEg 84,2 87,3 69,5 85,7 84,1 64,5 89 71,1 73,3 55,8 49,9 9. AT2G25940 89,3 85,5 70,5 83 88,1 65,9 85,2 84,9 80 57 48,6 10. AT4G32940 100 85 73,5 82,2 91,9 64,2 83,8 84,2 89,3 58,6 48,1 11. AT1G62710 71,3 72 78,4 72,2 71,9 62,1 71 70,8 71,8 71,3 47,1 12. AT3G20210 64,4 66,5 58,4 65,1 65,1 87,6 66,5 65,9 66,5 64,4 62,8
Tabela B3: Similaridade global entre polipeptídios de VPE de
plantas monocotiledôneas.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 1. SEQ IDNO 150 67,7 41,7 46,6 68,5 55,6 67,5 67,1 67,3 66,3 67,1 49,3 57,6 54,1 2. ZM0404@contig 11971 81,2 48,1 45,7 84,8 54,7 85,4 83,4 92,2 97,3 83,4 50 57,3 60 3. TA0704@contig9701 55,9 58,8 31 47,1 38,6 48 47,4 47,4 47,6 47,4 31 38,1 47,3 4. TA0704@contigl 5207 55,7 58 43,7 47,9 50,9 48,5 45,3 46,5 46,5 45,3 48,1 55,9 41,7 5. TA0704@contig 14121 81,6 92,3 58,6 58,4 53,2 94,1 83,4 83,5 84,6 83,4 49,5 55,9 58,2 6. TA0704@contigll093 70 70,6 53,6 60,5 70 55 54,9 55,6 54,8 54,9 56,9 70,6 46,8 7. HV0704@contig6924 79,6 92,4 57,9 58,3 95,7 70,2 82,4 83 84,8 82,4 49,8 56,5 57,6 8. OS_BAB85400_VPEg 80,8 91 57,5 56,3 89 70,3 87,8 81 83 100 49,1 59,2 57,5 9. So_ABFOOO19.1 VPE 81,6 96,3 59,8 57,8 91,7 71,1 91 88,8 92 81 49,4 57,9 58,4 10. ZM CAC18100.1 VPEg 80,2 97,7 58,1 58,1 91,9 70,4 91,8 90 95,7 83 49,7 57,1 59,3 11. OsOlg0559600 80,8 91 57,5 56,3 89 70,3 87,8 100 88,8 90 49,1 59,2 57,5 12. 0s02g0644000 59,3 61,3 44,3 64,7 60,6 66,4 60,5 59,9 61,9 61,2 59,9 61 43,7 13. 0s04g0537900 71,2 72,8 52,9 63,8 72,2 82,5 71,2 72,9 73 72,4 72,9 69,8 48,6 14. 0s05g0593900 70,2 73,5 58,9 55,7 71,8 63,4 71,5 71,1 73,2 73,4 71,1 57 65,2
Exemplo 15: Identificação de domínios compreendidos em VPEs
O banco de dados de Recurso Integrado de Famílias, Domínios e Sítios Proteicos (InterPro) é um interface integrada para os banco de dados de assinatura comumente usados para pesquisas baseadas em texto e seqüência. O banco de dados InterPro combina esses banco de dados, que usam metodologias diferentes e graus variantes de informação biológica sobre proteínas bem caracterizadas para derivar assinaturas proteicas. Bancos de dados que colaboram incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom and Pfam, Smart e TIGRFAMs. Interpro é hospedado no Instituto de Bioinformática Europeu no Reino Unido.
Os resultados da varredura do InterPro da seqüência polipeptídica como representada pela SEQ ID NO: 150 são apresentados na Tabela B4.
Tabela B4: Resultados da varredura do InterPro da seqüência polipeptídica como representada pela SEQ ID NO: 150
Banco de dados Número de acesso Nome de acesso Valor de E Coordenadas de aa em SEQ ID 150 para o domínio Pfam PF01650 Peptidase C13 1.0E125 54-478
Exemplo 16: Previsão de topologia para VPEs
TargetP 1.1 prevê a localização subcelular de proteínas eucarióticas. A atribuição de localização é baseada na presença prevista de qualquer das pré-sequências N-terminais: peptídeo de trânsito para cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Pontuações em que a previsão final é baseada não são 10
15
20
25
probabilidades realmente e elas não necessariamente adicionam a uma. Entretanto, a localização com a pontuação mais alta é a mais provável de acordo com TargetP e a relação entre as pontuações (a classe de confiabilidade) pode ser uma indicação do quão certa a previsão é. A classe de confiabilidade (RC) varia de 1 até 5, em que 1 indica a previsão mais forte. TargetP é mantido no servidor da Universidade Técnica da Dinamarca.
Paras as seqüências previstas como contendo pré-sequências N-terminal um sítio de clivagem potencial também pode ser previsto.
Vários parâmetros foram selecionados, tais como grupo de organismo (não planta ou planta), grupos limiares (nenhum, grupo pré- defmido de limiares, ou grupo de limiares especificado pelo usuário) e o cálculo de previsão de sítios de clivagem (sim ou não).
Os resultados de análise de TargetP 1.1 da seqüência polipeptídica como representada pela SEQ ID NO: 150 são apresentados na Tabela B5. O grupo de organismo "planta" foi selecionado, nenhum limiar definido e o comprimento previsto do peptídeo de trânsito requisitado. A localização subcelular da seqüência polipeptídica como representada pela SEQ ID NO: 150 é a via secretora e o comprimento previsto do peptídeo de trânsito é de 20 aminoácidos partindo da extremidade N-terminal (não como confiável para a previsão da localização subcelular por si só, pode variar em comprimento de poucos aminoácidos). Pontuação mais alta para o sinal de via secretora indicando que há uma alta probabilidade de que a proteína VPEg seja direcionada para a via secretora.
Tabela B5: Análise de TargetP 1.1 da seqüência polipeptídica
Comprimento (AA) 494 Peptídio de trânsito mitocondrial 0,108 Peptídio sinal de via secretora 0,966 Outro direcionamento subcelular 0,006 Localização prevista Via secretora Classe de confiabilidade 2 Comprimento de peptídeo de trânsito previsto 20
Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:
• ChloroP 1.1 hospedado no servidor da Universidade Técnica da Dinamarca;
· Protein Prowler Subcellular Localisation Predictor versão
1.2 hospedado no Instituto para Biociência Molecular, Universidade de Queensland, Brisbane, Austrália;
• Analista de Proteoma PENCE PA-GOSUB 2.5 hospedado no servidor da Universidade de Alberta, Edmonton, Alberta, Canadá;
· TNHMM, hospedado no servidor da Universidade Técnica
da Dinamarca;
Exemplo 17: Ensaio para VPEs
A atividade de peptidase de VPEg é avaliada pela incubação da proteína com as proteínas substratos e determinação dos produtos clivados como previamente descrito (Rojo et al. 2004 Current Biology 14, 1897-1906; Haraiwa et al. 1999, FEBS 447:213-216; Hatsugai et al. 2004, Science 6: Vol. 305. no. 5685, pp. 855 - 858). O decapeptídio sintético Ser-Glu-Ser-Glu-Asn- Gly-Leu-Glu-Glu-Thr como descrito por Haraiwa et al. 1999, a carboxipeptidase Yea VPEg por si só são escolhidos como substratos na reação de clivagem. Produtos clivados são separados por eletroforese capilar e detectados por absorbância a 200 nm ou por transferência de Western. Exemplo 18: Clonagem de seqüência de ácido nucleico como representada pela SEQID NO: 149
A menos que estipulado de outro modo, técnicas de DNA recombinante são realizadas de acordo com protocolos padrões descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3a Edição Cold Spring Harbor Laboratory Press, CSH, Nova Iorque) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrões para trabalho molecular vegetal são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
O gene VPEg de Arabidopsis thaliana foi amplificado por PCR usando como molde uma biblioteca de cDNA de plântula de Arabidopsis thaliana (Invitrogen, Paisley, UK). Iniciadores SEQ ID NO: 206; em sentido, 5'- ggggacaagtttgtacaaaaaagcaggcttaaacaatggccacaacgatgaca-3' e SEQ ID NO: 207; reverso, complementar, 5'-
ggggaccactttgtacaagaaagctgggtcggtttagggtttctatgcac-3'), que inclui os sítio AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizada usando Taq DNA polimerase Hifi em condições padrões. Um fragmento de PCR do comprimento esperado (incluindo sítios attB) foi amplificado e purificado também usando métodos padrões. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir de acordo com a terminologia Gateway, um "clone de entrada", pVPEg. O plasmídeo pDONR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 19: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada pela SEQID NO: 149
O clone de entrada pVPEg foi subsequentmente usado em uma reação LR com um vetor de destinação usado para transformação de Oiyza sativa. Este vetor contém como elementos funcionais dentro das bordas de T- DNA: um marcador selecionável vegetal, um cassete de expressão de marcador triável e um cassete Gateway destinado para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor WSIl8 de arroz (SEQ ID NO: 205) para expressão específica de semente foi localizado a montante deste cassete Gateway.
Após a etapa de recombinação LR, o vetor de expressão resultante pWSI18::VPE (Figura 7) foi transformado em Agrobacterium cepa LBA4044 de acordo com métodos bem conhecidos na técnica. Exemplo 20: Transformação Vegetal
Veja o Exemplo 9 acima para detalhes de transformação
vegetal.
Exemplo 21: Procedimento de avaliação fenotípica
Para detalhes veja o Exemplo 10 acima. Exemplo 22: Exemplos de triagens de estresse abiótico
Triagem de seca
Plantas de um número selecionado de eventos são cultivadas em solo em pote sob condições normais até elas se aproximarem do estágio de tópico. Elas são então transferidas para uma seção "seca" onde a irrigação é retida. Sondas de umidade são inseridas em potes escolhidos aleatoriamente para monitorar o conteúdo aquoso do solo (SWC). Quando SWC fica abaixo de certos limiares, as plantas são automaticamente regadas continuamente até um nível normal ser atingido novamente. As plantas são então retransferidas para condições normais. O resto do cultivo (maturação da planta, colheita de semente) é o mesmo como para plantas não cultivadas sob condições de estresse abiótico. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento sob condições normais.
Triagem de estresse salino
Plantas são cultivadas em um substrato feito de fibras de coco e argex (proporção 3:1). Uma solução nutriente normal é usada durante as primeiras duas semanas após transplante das plântulas na estufa. Após as primeiras duas semanas, 25 mM de sal (NaCl) são adicionados à solução nutriente, até as plantas serem colhidas. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento sob condições normais.
Triagem de disponibilidade de nutriente (nitrogênio) reduzida Plantas de seis eventos (sementes T2) foram cultivadas em solo em potes sob condições normais exceto pela solução nutriente. Os potes foram regados do transplante até a maturação com uma solução nutriente específica contendo conteúdo de nitrogênio (N) reduzido, geralmente entre 7 até 8 vezes menos. O resto do cultivo (maturação da planta, colheita de semente) foi o mesmo como para plantas não cultivadas sob estresse abiótico. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento sob condições normais (veja o Exemplo 10).
Exemplo 23: Resultados da avaliação fenotípica das plantas transgênicas
Os resultados da avaliação das plantas de arroz transgênicas expressando VPE são apresentados nas Tabelas B6-B9 (a menos que indicado de outro modo, os resultados são obtidos em plantas cultivadas sob condições de não estresse). A diferença porcentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P de teste F abaixo de 0,05.
Rendimento de semente total, número de sementes preenchidas, taxa de preenchimento de semente e índice de colheita são aumentados significativamente comparados com as plantas controle (neste caso, os nulizigotos).
Tabela B6: Resultados da avaliação de plantas de arroz transgênicas pWSI::VPE. __
Característica % de aumento Rendimento de semente total 18 Número de sementes preenchidas 28 Taxa de preenchimento 18 índice de colheita 17 índice de broto e raiz 7
Os resultados da avaliação de plantas de arroz transgênicas cultivadas sob disponibilidade de nitrogênio reduzida e expressando pWSI::VPE de acordo com o Exemplo 19 são dados na Tabela B7 abaixo. Tabela B7: Resultados da avaliação de VPE::pwsil8 sob disponibilidade de nitrogênio reduzida
Parâmetro % de dif, Biomassa acima do solo 16,1 Vigor emergente 43,2 Peso total de sementes 20,7 No. De sementes preenchidas 18,8 índice de colheita 12,3
Os resultados da avaliação de plantas de arroz transgênicas
cultivadas sob disponibilidade de nitrogênio reduzida e expressando uma construção de VPE de acordo com o Exemplo 19 exceto onde o promotor wsil8 é substituído por um promotor GOS2 constitutivo são dados na Tabela B8 abaixo. Esta mesma construção com o promotor GOS2 deu os resultados mostrados na Tabela B9 sob condições de não estresse.
Tabela B8: Resultados da avaliação de VPE::pGOS2 sob disponibilidade de nitrogênio reduzida
Parâmetro % de dif. Biomassa acima do 5 solo Vigor emergente 25 No. De flores por 7 panícula
Tabela B9: Resultados da avaliação de VPE::pGOS2 sob condições de não estresse
Parâmetro % de dif. Biomassa acima do 5 solo Biomassa de raiz 5 Peso total de 8,9 sementes No. De sementes 8,5 preenchidas No. De flores por panícula 6,9 No. Total de sementes 8,3
Parte III. SAP
Exemplo 24: Identificação de seqüências relacionadas à SAP de acordo com a SEQID NO: 210 e SEQID NO: 211
Seqüências (cDNA completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 210 e/ou seqüências proteicas relacionadas à SEQ ID NO: 211 foram identificadas entre aquelas mantidas no banco de dados Nucleotides Entrez no Centro Nacional para Informação em Biotecnologia (NCBI) usando ferramentas de pesquisa de seqüência em banco de dados, tais como a Ferramenta de Alinhamento Local Básico (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa foi usado para encontrar regiões de similaridade local entre seqüências por comparação de seqüências de ácido nucleico ou polipeptídicas com bancos de dados de seqüências e pelo cálculo da significância estatística de pareamentos. O polipeptídio codificado pela SEQ ID NO: 210 foi usado para algoritmo TBLASTN, com ajustes padrões e o filtro para ignorar seqüências de baixa complexidade desligado. A produção da análise foi vista por comparação par a par e classificada de acordo com a pontuação de probabilidade (valor de E), onde a pontuação reflete a probabilidade que um alinhamento particular ocorra por acaso (quanto menor o valor de E, mais significativo o sucesso). Além dos valores de E, comparações também foram pontuadas por identidade de porcentual. Identidade porcentual se refere ao número de nucleotídeos idênticos (ou de aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. Em alguns casos, os parâmetros padrões podem ser ajustados para modificar a estringência da pesquisa.
Além das seqüências de ácido nucleico disponíveis publicamente no NCBI, bancos de dados de seqüências de proprietários também são pesquisadas seguindo o mesmo procedimento como descrito aqui acima.
A Tabela Cl provê uma lista de seqüências de ácido nucleico e proteicas relacionadas à seqüência de ácido nucleico como representada pela SEQ ID NO: 210 e à seqüência proteica representada pela SEQ ID NO: 211. Tabela Cl: Seqüências de ácido nucleico relacionadas à seqüência de ácido nucleico codificando SAP de SEQ ID NO: 210 e os polipeptídios deduzidos
correspondentes.
Nome Organismo fonte r Aeido nucleico SEQ ID NO: Polipeptídio SEQ ID NO: Condição SAP Like Oryza sativa 210 211 Completa GM0604@contig350. Glycine maxima 212 213 Completa TAG01@SIN 31b- CS. Tagetes spp 214 215 Parcial BN0204@contig3 80.. Brassica napa 216 217 Completa HV0704@contigl 95 Hordeum vulgare 218 219 Completa TA0704@54203527. Triticum aestivum 220 221 Parcial TA0704@545 82401 Triticum aestivum 222 223 Parcial TA0704@gi 205507 Triticum aestivum 224 225 Parcial ZM0404@contigl 15 Zea mays 226 227 Parcial ZM0404@contig319. Zea mays 228 229 Parcial OS AAK92634.1 Oryza sativa 230 231 Completa 0s_0s01g0205300 Oryza sativa 232 233 Completa Mb ABF70123.1 Musa balbisiana 234 235 Completa AT1G06190 Arabidopsis thaliana 236 237 Completa AT4g18740 Arabidopsis thaliana 238 239 Completa
Exemplo 25: Alinhamento de seqüências polipeptídicas semelhantes a SAP
Alinhamento de seqüências polipeptídicas foi realizado usando o programa AlignX do Vector NTI (Invitrogen) que é baseado no algoritmo popular de Clustal de alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500). Valores padrões são para penalidade de abertura de interrupção de 10, para a penalidade de extensão de interrupção de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídios foram alinhados). Resultados na Figura 10 mostram que proteínas semelhantes a SAP compartilham regiões de alta conservação de seqüências. Motivo 1, Motivo 2 e Motivo 3 representam as regiões de homologia de seqüências mais altas.
Uma árvore filogenética de SAP e polipeptídios semelhantes a SAP foi construída usando um algoritmo de agrupamento de neighbour- joining como provido no programa AlignX do Vector NTI (Invitrogen). A Figura 11 mostra como polipeptídio semelhante a SAP se aglomera com SEQ ID NO: 211 em vez de com proteínas SAP tal como polipeptídio SAFB2. Exemplo 26: Cálculo de identidade porcentual global entre polipeptídios semelhantes a SAP
Porcentagens globais de similaridade e identidade entre seqüências polipeptídicas completas úteis na realização dos métodos da invenção foram determinadas usando um dos métodos disponíveis na técnica, o programa MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). O programa MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteicas sem precisar de pré-alinhamento dos dados. O programa faz uma série de alinhamentos par a par usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de interrupção de 12 e uma penalidade de extensão de interrupção de 2), calcula similaridade e identidade usando, por exemplo, Blosum 62 (para polipeptídios) e então coloca os resultados em uma matriz de distância. A similaridade de seqüência é mostrada na metade inferior da linha de divisão e a identidade de seqüência é mostrada na metade superior da linha de divisão diagonal. Parâmetros usados na comparação foram: Matriz de pontuação: Blosum 62
Primeira interrupção: 12 Interrupção prolongada: 2
Os resultados da análise do programa são mostrados na Tabela C2 para a identidade e similaridade global por todo o comprimento das seqüências polipeptídicas. Identidade porcentual é dada acima da diagonal e similaridade porcentual é dada abaixo da diagonal.
A identidade porcentual entre as seqüências polipeptídicas semelhantes a SAP começa em 13% de identidade de aminoácidos comparada com SEQ ID NO: 211.
Tabela C2: Resultados de MatGAT para identidade e similaridade global por todo o comprimento das seqüências polipeptídicas.
1 2 3 4 5 6 7 8 9 1. SEQ......ID NO:211 35,3 21,6 15 57,8 14,7 32,3 34,9 20,1 2. SEQ ID NO:213 55,2 23 14,7 22,5 15 30,6 40,2 22,3 3. SEQ ID NO:217 34,1 37 19,7 13,4 18 27,2 43,1 20 4. SEQ ID NO:219 24,5 23,9 30,6 9,6 30,4 19,7 14,4 19,9 5. SEQ ID NO:231 58,5 35,1 21 15,5 8,5 18,9 22,6 13,2 6. SEQ ID NO:233 22,1 23,9 30,2 40,6 13,6 19,3 12 19,5 7. SEQ ID NO:235 46,9 42,9 47,3 31,8 27,8 29,5 28,9 21,3 8. SEQ ID NO:237 52,9 53,6 52,1 23,4 34,3 19,7 40,4 19,9 9. SEQ ID NO:239 35,2 35,7 36,5 33,1 22,4 31,5 40,3 32,2
Exemplo 27: Identificação de domínios compreendidos na SEQID NO: 211
Domínios conservados na seqüência de polipeptídio
semelhante a SAP de SEQ ID NO: 211 foram identificados por pesquisa de similaridade com domínios protéicos e famílias proteicas presentes no banco de dados Pfam. A Tabela C3 resume os domínios encontrados. O começo e final do domínio conservado na SEQ ID NO: 211 são indicados pela coordenada de aminoácido correspondente. Tabela C3: Resultados de varredura de Pfam da seqüência polipeptídica como representada pela SEQ ID NO: 211
Banco de dados/númer o de acesso Seq de Início de coordenada de aa Final de coordenada de aa Pontu ação Valor de E Alinhament 0 Descrição Descrição de acesso Pfam/ DUF1098 DUF1098 212 250 39 9.6 0.037 local Proteína de função desconhecida (DUF1098) Pfam/ PF07498 Rho N 338 371 35 37.7 4.70E-10 local Fator de terminação Rho, domínio N- terminal Pfam/ PF02037 SAP 339 355 17 12.5 0.02 local Domínio SAP Pfam/ PF02037 SAP 359 372 14 1.6 22 local Domínio SAP
Exemplo 28: Ensaio de atividade relacionada a SEQID NO: 211
Atividade de ligação a DNA da proteína semelhante a SAP de arroz na SEQ ID NO: 211 é determinada em um ensaio in vitro como previamente relatado por Chen et al. 2003. SEQ ID NO: 211 é superexpressa em células de E. coli e purificada. A proteína purificada é incubada com DNA substrato. Um fragmento de DNA de 31 pb (pares de base) derivado do gene Waxy de arroz é escolhido como substrato de DNA. Os complexos proteína- DNA podem ser identificados por eletroforese em ensaios de retardo em gel. Exemplo 29: Clonagem de seqüência de ácido nucleico como representada pela SEQID NO: 210
A menos que estipulado de outro modo, técnicas de DNA recombinante são realizadas de acordo com protocolos padrões descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3a Edição Cold Spring Harbor Laboratory Press, CSH, Nova Iorque) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrões para trabalho molecular vegetal são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
O gene semelhante a SAP de Oryza sativa foi amplificado por PCR usando como molde uma biblioteca de cDNA de plântula de Oryza sativa (Invitrogen, Paisley, UK). Iniciadores prm08655 (SEQ ID NO: 247; em sentido: 5'- ggggacaagtttgtacaaaaaagcaggcttaaacaatggccacaacgatgacac -3') e prm08656: (SEQ ID NO: 248; reverso, complementar: 5'- ggggaccactttgtaca agaaagctgggtcggtttagggtttctatgcac-3'), que inclui os sítio AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizada usando Taq DNA polimerase Hifi em condições padrões. Um fragmento de PCR do comprimento esperado (incluindo sítios attB) foi amplificado e purificado também usando métodos padrões. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR2()l para produzir de acordo com a terminologia Gateway, um "clone de entrada". O plasmídeo pDONR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 30: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada pela SEQID NO: 210
O clone de entrada contendo a SEQ ID NO: 210, semelhante a pSAP, foi subsequentmente usado em uma reação LR com pRCC3, um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro das bordas de T-DNA: um marcador selecionável vegetal, um cassete de expressão de marcador triável e um cassete Gateway destinado para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor RCC3 de arroz (SEQ ID NO: 246) para expressão específica de raiz foi localizado a montante deste cassete Gateway.
Após a etapa de recombinação LR, o vetor de expressão resultante pRCC3::semelhante a SAP (Figura 11) foi transformado em Agrobacterium cepa LBA4044 de acordo com métodos bem conhecidos na técnica.
Exemplo 31: Transformação Vegetal
Veja o Exemplo 9 acima. Exemplo 32: Procedimento de avaliação fenotípica
Para detalhes veja o Exemplo 10 e Exemplo 22. Exemplo 33: Resultados da avaliação fenotípica das plantas transgênicas
Os resultados da avaliação das plantas de arroz transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção são apresentados nas Tabelas C4 até C9. A diferença porcentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P de teste F abaixo de 0,1.
Rendimento de semente total, número de sementes preenchidas, taxa de preenchimento de semente, índice de colheita, o número de flores por panícula, peso de cem sementes, a altura da planta e o vigor emergente são aumentados significativamente nas plantas transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção, comparados com as plantas controle (neste caso, os nulizigotos). Tabela C4: Resultados da avaliação de plantas de arroz transformadas com vetor pRCC3::semelhante a SAP. O ácido nucleico semelhante a SAP nessas plantas transgênicas é expresso nas raízes sob o controle do promotor RCC3 de arroz.
Característica % de aumento em plantas transgênicas contra controle Rendimento total de semente 29 Número de sementes preenchidas 26 Taxa de preenchimento 19 índice de colheita 27 Numero de flores por panícula 5 TKW 3 Altura da planta 7 Vigor emergente 28
Tabela C5: Resultados da avaliação de plantas de arroz transformadas com vetor pG0S2:!semelhante a SAP. O ácido nucleico semelhante a SAP nessas plantas transgênicas é expresso constitutivamente sob o controle do promotor GOS2 de arroz (de Pater et al, Plant J Nov;2(6):837-44, 1992, WO 2004/065596).
Característica % de aumento em plantas transgênicas contra controle Rendimento total de semente 7
Tabela C6: Resultados da avaliação de plantas de arroz
transformadas com vetor p(PcR)::semelhante a SAP. O ácido nucleico semelhante a SAP nessas plantas transgênicas é expresso constitutivamente sob o controle do promotor de protoclorofilídeo redutase putativo de arroz (WO 2004/070039).
Característica % de aumento em plantas transgênicas contra controle Rendimento total de semente 12
Tabela Cl: Resultados da avaliação de plantas de arroz
testadas sob condições de seca como descrito no Exemplo 22 e transformadas com vetor pRCC3 "semelhante a SAP.
Parâmetro % de dif. Peso de semente total 14,2 No. De sementes preenchidas 15,5 Taxa de preenchimento 22 índice de Colheita 22,6
Tabela C8: Resultados da avaliação de plantas de arroz testadas sob condições de disponibilidade de nitrogênio reduzida como descrito no Exemplo 22 e transformadas com vetor pRCC3::semelhante a SAP.
Parâmetro % de dif. Biomassa acima do solo 9,1 Vigor emergente 20,1 Tabela C9: Resultados da avaliação de plantas de arroz sob condições de seca como descrito no Exemplo 22 e transformadas com vetor p(PcR): :semelhante a SAP. O ácido nucleico semelhante a SAP nessas plantas transgênicas é expresso constitutivamente sob o controle do promotor de protoclorofilídeo redutase putativo de arroz (WO 2004/070039).
Característica % de aumento em plantas transgênicas contra controle Preenchimento de semente 14
Parte IV. RCA
Exemplo 34: Identificação de seqüências relacionadas à seqüências de RCA de acordo com a SEQID NO: 250 e SEQID NO: 251
Seqüências (cDNA completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 250 e/ou seqüências proteicas relacionadas à SEQ ID NO: 251 foram identificadas entre aquelas mantidas no banco de dados Nucleotides Entrez no Centro Nacional para Informação em Biotecnologia (NCBI) usando ferramentas de pesquisa de seqüência em banco de dados, tais como a Ferramenta de Alinhamento Local Básico (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrar regiões de similaridade local entre seqüências por comparação de seqüências de ácido nucleico ou polipeptídicas com bancos de dados de seqüências e pelo cálculo da significância estatística de pareamentos. O polipeptídio codificado pela SEQ ID NO: 250 foi usado para algoritmo TBLASTN, com ajustes padrões e o filtro para ignorar seqüências de baixa complexidade desligado. A produção da análise foi vista por comparação par a par e classificada de acordo com a pontuação de probabilidade (valor de E), onde a pontuação reflete a probabilidade que um alinhamento particular ocorra por acaso (quanto menor o valor de E, mais significativo o sucesso). Além dos valores de E, comparações também foram pontuadas por identidade de porcentual. Identidade porcentual se refere ao número de nucleotídeos idênticos (ou de aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. Em alguns casos, os parâmetros padrões podem ser ajustados para modificar a estringência da pesquisa.
Além das seqüências de ácido nucleico disponíveis
publicamente no NCBI, bancos de dados de seqüências de proprietários também são pesquisadas seguindo o mesmo procedimento como descrito aqui acima.
A Tabela Dl provê uma lista de seqüências de ácido nucleico e polipeptídicas relacionadas à seqüência de ácido nucleico como representada pela SEQ ID NO: 250 e à seqüência proteica representada pela SEQ ID NO: 251. Tais seqüências de ácido nucleico codificam polipeptídios RCA beta (forma curta, ou SF) que ocorrem naturalmente, ou polipeptídios RCA alfa (forma longa, ou LF) que foram truncados ou mutados na extensão C-terminal para prevenir regulação redox.
Tabela Dl: Seqüências de ácido nucleico relacionadas à seqüência de ácido nucleico (SEQ ID NO: 250) útil nos métodos da presente invenção e os polipeptídios deduzidos correspondentes.
Nome Organismo fonte Ácido nucleico SEQ ID NO: Polipeptídio SEQ ID NO: Número de acesso de banco de dados Condição ChlreRCA Chlamydomonas reinhardtii 250 251 AY461703 Completa ChlliRCA Chlorococcum littorale 252 253 Y10657 Completa Ostta RCA Ostreococcus tauri strain OTTH0595 254 255 CR954204 Completa Arath RCA SF Arabidopsis thaliana 256 257 NM 179989AT2G 39730.2 Completa Arath RCA LF Arabidopsis thaliana 258 259 X14212 Completa Aceru RCA SF Acer rubrum 260 261 DQ915973 Completa Aceru RCA LF Acer rubrum 262 263 DQ915974 Completa Chequ RCA SF Chenopodium quinoa 264 265 AYl 17142 Completa Desan RCA SF Deschampsia antartica 266 267 AY312574 Completa Desan_RCA LF Desehampsia antartica 268 269 AY312573 Completa Glyma RCA LF Glycine max 270 271 Completa Goshi RCA SF Gossypium hirsutum 272 273 AF329934 Completa Horvu RCA SF Hordeum vulgare 274 275 M55447.1 BLYR CAA2 Completa Horvu RCA SFII Hordeum vulgare 276 277 M55448.1 BLYR CAB Completa Lartr RCA SF Larrea Iridentata 278 279 AY312576 Completa Lycpe RCA LF Lycopersicon pennellii 280 281 AF037361 Completa MaIdo RCA SF Malus domestica 282 283 Z21794 Completa Nicta RCA SF Nicotiana tabacum 284 285 U35111 Completa Orysa RCA LF Oryza sativa 286 287 AB034698 Completa Orysa RCA SF Oryza sativa 288 289 AB034748 Completa Phavu RCA SF Phaseolus vulgaris 290 291 AF041068 Completa Triae RCA SF Triticum aestivum 292 293 AF251264 Completa Zeama RCA SF Zea mays 294 295 Contig of EE034185.1BI675 068 Completa DatglRCA Datisca glomerata 296 297 AF047352 Parcial Zanae RCA Partial 3' Zantedeschia aethiopiea 298 299 AF338240 Parcial AnaspRCA Anabaena variabilis ATCC 29413 300 301 CP000117.1 Completa NosspRCA Nostoe sp. PCC 7120 302 303 BA000019.2 Completa SyncoRCA Synechocoeeus sp. JA-3-3Ab 304 305 CP000239 Completa FlabiRCA Flaveria bidentis 313 314 EU202926.1 Completa OstluRCA Ostreoeoeeus lucimarinus 315 316 jgi 0st9901_3 31 184 eugene.04000 10260 Completa VigraRCA Vigna radiata 317 318 AF126870 Completa VolvaRCA VoIvox earteri 319 320 jgi_Volcal_10529 1 estExt fgenesh4 _pg.C_260106 Completa
Em alguns casos, seqüências relacionadas foram montadas
experimentalmente e publicamente divulgadas por instituições de pesquisa, tal como O Instituto para Pesquisa Genômica (TIGR). O banco de dados de Ortólogos de Genes Eucarióticos (EGO) pode ser usado para identificar tais seqüências relacionadas, por pesquisa de palavra chave ou pelo uso do algoritmo BLAST com a seqüência de ácido nucleico ou seqüência polipeptídica de interesse. Em outros casos, banco de dados de seqüência de ácido nucleico especial foram criados para organismos particulares, tal como pelo Joint Genome Institute, por exemplo, para Ostreococcus lucimarinus e Volvox earteri.
Exemplo 35: Alinhamento de seqüênciaspolipeptídicas relevantes
AlignX do Vector NTI (Invitrogen) é baseado no algoritmo popular de Clustal de alinhamento progressivo (Thompson et ai (1997) Nucleic Acids Res 25:4876-4882; Chenna et ai. (2003). Nucleic Acids Res 31:3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de neighbour-joining. Valores padrões são para penalidade de abertura de interrupção de 10, para a penalidade de extensão de interrupção de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídios foram alinhados).
O resultado do alinhamento múltiplo de seqüências usando polipeptídios relevantes na identificação daqueles úteis na realização dos métodos da invenção é mostrado na Figura 15. As seqüências foram alinhadas usando programa AlignX do conjunto Vector NTI (InforMax, Bethesda, MD). Alinhamento múltiplo foi feito com uma penalidade de abertura de interrupção de 10 e uma extensão de interrupção de 0,01. O início de conservação de seqüências entre polipeptídios RCA eucarióticos é remalhado com um parêntese (a seqüência de aminoácidos N-terminal a montante deste parêntese é considerada como compreendendo o peptídeo de trânsito para direcionamento subcelular plastídico), como é o início e fim do domínio AAA. A malha P está em caixa e corresponde ao Motivo 1 como representado pela SEQ ID NO: 312. O início da extensão C-terminal também está marcado com um parêntese. Dentro deste prolongamento C-terminal, os resíduos Cys envolvidos em regulação redox são marcados em negrito nos polipeptídios RCA alfa (forma longa ou LF). Esses são alvos preferidos para mutagênese sítio-dirigida (em resíduos de Ala, por exemplo) para prevenir a formação de pontes dissulfeto e assim, regulação redox.
Exemplo 36: Cálculo de identidade porcentual global entre seqüências polipeptídicas úteis na realização dos métodos da invenção
Porcentagens globais de similaridade e identidade entre seqüências polipeptídicas completas úteis na realização dos métodos da invenção foram determinadas usando um dos métodos disponíveis na técnica, o programa MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). O programa MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteicas sem precisar de pré-alinhamento dos dados. O programa faz uma série de alinhamentos par a par usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de interrupção de 12 e uma penalidade de extensão de interrupção de 2), calcula similaridade e identidade usando, por exemplo, Blosum 62 (para polipeptídios) e então coloca os resultados em uma matriz de distância. A similaridade de seqüência é mostrada na metade inferior da linha de divisão e a identidade de seqüência é mostrada na metade superior da linha de divisão diagonal.
Parâmetros usados na comparação foram: Matriz de pontuação: Blosum 62 Primeira interrupção: 12 Interrupção prolongada: 2 Os resultados da análise do programa são mostrados na Tabela
D2 para a identidade e similaridade global por todo o comprimento das seqüências polipeptídicas (excluindo as seqüências polipeptídicas parciais). Identidade porcentual é dada acima da diagonal e similaridade porcentual é dada abaixo da diagonal. A identidade porcentual entre as seqüências polipeptídicas
úteis na realização dos métodos da invenção pode ser tão baixa quanto 50% de identidade de aminoácidos comparada com SHQ ID NO: 251.
Tabela D2: Resultados de MatGAT para identidade e similaridade global por todo o comprimento das seqüências polipeptídicas RCA.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1. Aceru RCA\LS 92 77 75 55 72 56 66 77 72 85 79 70 71 80 73 78 73 78 73 53 75 71 75 70 2. Aceru RCA\SF 92 72 79 59 78 60 72 71 78 79 85 76 77 86 75 85 79 72 78 56 81 77 81 76 3. Arath RCAVLF 86 80 91 54 70 55 60 75 69 78 74 68 69 73 70 72 71 77 71 54 69 69 70 67 4. Arath RCA\SF 84 88 91 59 76 59 66 72 76 75 81 74 76 80 75 79 77 73 78 58 76 76 76 74 5. Chlre RCA 66 71 64 70 58 76 54 56 59 55 58 59 61 58 54 59 58 56 60 63 58 60 59 59 6. Chequ RCA 81 87 78 85 69 57 66 70 76 73 81 75 75 80 74 80 79 69 74 59 78 74 79 74 7. Chlli RCA 67 72 65 71 87 70 52 57 61 55 58 61 62 59 55 57 58 57 60 64 58 61 58 60 8. Datgl RCA 73 79 67 74 66 73 67 59 65 66 73 63 65 72 63 73 68 61 66 52 69 64 68 64 9. Desan RCAWLF 86 81 84 82 66 80 68 68 91 77 72 88 79 72 70 70 70 90 83 55 67 80 70 77 10. Desan RCA\SF 80 87 77 85 72 86 73 74 91 71 79 95 85 78 72 76 76 83 89 59 73 86 76 84 11. Glyma RCA 93 86 86 83 66 81 67 72 85 79 80 70 71 79 73 79 74 79 74 55 80 71 74 70 12. Goshi RCA 86 93 81 88 72 89 71 78 82 88 85 77 80 88 75 85 80 75 80 59 82 79 81 78 13. Horvu RCA\SF 79 85 76 83 72 85 74 72 89 97 78 87 84 76 71 75 76 82 89 59 72 85 76 82 14. Horvu RCASFII 79 85 76 83 73 83 73 73 85 93 79 87 92 77 71 79 75 79 85 59 75 96 78 83 15. Lartr RCA\SF 87 94 82 89 71 89 72 79 82 88 86 94 87 87 76 84 81 73 78 57 82 77 80 78 16. Lycpe RCA 85 87 81 85 68 82 70 73 82 82 82 84 81 81 85 75 85 72 73 55 71 70 71 70 17. Maldo RCA\SF 86 94 81 88 71 88 72 79 81 87 85 92 85 87 92 85 81 73 78 58 80 78 82 77 18. Nieta RCA 83 89 79 86 70 86 71 76 79 83 82 88 84 84 89 90 89 71 76 56 77 75 77 75 19. Orysa RCA\LF 88 83 84 82 67 79 68 68 95 88 87 84 87 85 83 83 81 80 92 56 70 80 72 78 20. Orysa RCA\SF 81 88 77 84 71 85 73 73 88 95 81 89 94 91 89 83 87 84 92 60 75 86 77 84 21. Ostta RCA 65 69 65 71 78 68 78 66 67 72 66 72 72 72 71 67 72 69 67 72 57 59 58 59 22. Phavu RCA\SF 85 91 81 88 72 87 71 76 82 86 86 90 86 87 92 85 91 88 82 86 70 74 76 77 23. Triae RCA\SF 80 86 77 84 72 85 73 71 86 93 79 87 92 97 87 82 85 84 86 92 72 87 77 84 24. Zanae RCA\SF 83 90 78 85 72 87 72 75 80 86 82 90 86 86 90 83 90 86 82 87 69 88 86 74 25. Zeama RCAVSF 80 86 76 83 73 83 72 73 85 92 79 88 91 91 87 81 87 82 87 93 72 87 92 86
A identidade porcentual entre o domínio AAA das seqüências
polipeptídicas de RCA úteis na realização dos métodos da invenção pode ser aumentada até 60% de identidade de aminoácidos comparada a SEQ ID NO: 311.
Tabela D3: Resultados de MatGAT para identidade e
similaridade global entre o domínio AAA das seqüências polipeptídicas de
RCA.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1. AAAAceru RCA 69 92 93 82 84 93 93 95 93 95 91 94 91 69 94 78 65 2. AAA Anasp RCA 81 68 68 67 68 67 70 69 67 68 66 68 67 99 69 64 76 3. AAA Arath RCA 96 79 92 81 82 92 92 94 92 95 91 92 92 68 94 78 65 4. AAA Chequ RCA 96 81 95 81 82 92 94 96 92 95 94 93 95 68 93 79 64 5. AAA Chlli RCA 91 82 89 88 93 81 80 82 82 81 79 81 80 67 80 80 64 6. AAA Chlre RCA 90 83 89 88 95 83 82 84 83 83 81 82 81 68 81 80 64 7. AAA Desan RCA 97 80 95 95 88 88 93 94 98 95 92 92 92 67 94 78 64 8. AAA Glyma RCA 97 82 95 98 91 91 96 97 93 95 91 95 92 70 96 79 65 9. AAA Goshi RCA 98 81 96 97 90 90 97 99 94 98 93 95 95 69 96 80 65 10. AAA Horvu RCA 97 80 95 96 89 88 98 97 97 94 92 91 92 67 95 78 64 11. AAA Lartr RCA 98 81 97 97 90 89 97 99 99 98 95 95 95 68 97 79 65 12. AAA Lycpe RCA 97 81 96 97 89 89 97 97 97 98 98 91 98 66 94 79 65 13. AAA Maldo RCA 98 82 95 97 91 92 96 99 98 96 98 96 92 68 93 78 67 14. AAA Nicta RCA 96 80 95 96 89 89 95 97 98 96 97 99 96 67 94 79 65 15. AAA Nossp RCA 81 99 79 80 82 83 79 81 81 80 81 80 81 80 69 64 75 16. AAA Orysa RCA 99 81 97 97 90 90 98 99 99 98 99 98 98 98 81 79 65 17. AAA Ostta RCA 89 80 87 88 89 88 87 89 89 88 88 88 89 88 79 89 64 18. AAA Synco RCA 81 85 79 79 81 80 79 81 81 80 81 80 82 80 85 81 82 19. AAA Triae RCA 97 80 95 96 88 88 98 97 98 99 98 98 96 96 79 99 87 79
Exemplo 37: Identificação de domínios compreendidos em seqüências polipeptídicas úteis na realização dos métodos da invenção
O banco de dados de Recurso Integrado de Famílias, Domínios
e Sítios Proteicos (InterPro) é um interface integrada para os banco de dados de assinatura comumente usados para pesquisas baseadas em texto e seqüência. O banco de dados InterPro combina esses banco de dados, que usam metodologias diferentes e graus variantes de informação biológica sobre proteínas bem caracterizadas para derivar assinaturas proteicas. Bancos de dados que colaboram incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom and Pfam, Smart e TIGRFAMs. Interpro é hospedado no Instituto de Bioinformática Europeu no Reino Unido.
Os resultados da varredura do InterPro da seqüência polipeptídica como representada pela SEQ ID NO: 251 são apresentados na Tabela D4.
Tabela D4: Resultados da varredura do InterPro da seqüência polipeptídica como representada pela SEQ ID NO: 251
Banco de dados Número de acesso Nome de acesso InterPro IPR003959 AAA ATPase, core Pfam PF00004 AAA, ATPase family associated with various cellular activities; Clan: P- Ioop containing nucleoside triphosphate hydrolase superfamily; residues 133-331 of SEQ ID NO: 251.
Uma característica chave dos membros da família AAA é que
eles compartilham uma região conservada de cerca de 200 aminoácidos que contém um sítio de ligação a ATP (malha P). Por exemplo, o domínio AAA de SEQ ID NO: 251 é como representado pela SEQ ID NO: 311.
Exemplo 38: Previsão de topologia das seqüências polipeptídicas úteis na realização dos métodos da invenção (localização subcelular, transmembrana...)
TargetP 1.1 prevê a localização subcelular de proteínas eucarióticas. A atribuição de localização é baseada na presença prevista de qualquer das pré-sequências N-terminais: peptídeo de trânsito para cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Pontuações em que a previsão final é baseada não são probabilidades realmente e elas não necessariamente adicionam a uma. Entretanto, a localização com a pontuação mais alta é a mais provável de acordo com TargetP e a relação entre as pontuações (a classe de confiabilidade) pode ser uma indicação do quão certa a previsão é. A classe de confiabilidade (RC) varia de 1 até 5, em que 1 indica a previsão mais forte. TargetP é mantido no servidor da Universidade Técnica da Dinamarca.
Para as seqüências previstas como contendo pré-sequências N- terminais um sítio de clivagem potencial também pode ser previsto.
Vários parâmetros foram selecionados, tais como grupo de organismo (não planta ou planta), grupos limiares (nenhum, grupo pré- definido de limiares, ou grupo de limiares especificado pelo usuário) e o cálculo de previsão de sítios de clivagem (sim ou não).
A localização subcelular da seqüência polipeptídica como representada pela SEQ ID NO: 251 é o cloroplasto e o comprimento previsto do peptídeo de trânsito é de 32 aminoácidos partindo da extremidade N- terminal (não como confiável para a previsão da localização subcelular por si só, pode variar em comprimento de poucos aminoácidos). Quando se alinha polipeptídios RCA com o polipeptídio RCA de SEQ ID NO: 251 é possível deduzir o comprimento do peptídeo de trânsito no último (veja a Figura 15). Senão, em uma definição mais ampla, o peptídeo de trânsito é a seqüência de aminoácidos que precede o início de conservação de seqüência entre polipeptídios de RCA eucarióticos, como mostrado na Figura 15.
Muitos algoritmos podem ser usados para realizar tais análises,
incluindo:
• ChloroP 1.1 hospedado no servidor da Universidade Técnica da Dinamarca;
• Protein Prowler Subcellular Localisation Predictor versão 1.2 hospedado no Instituto para Biociência Molecular, Universidade de Queensland, Brisbane, Austrália;
• Analista de Proteoma PENCE PA-GOSUB 2.5 hospedado no servidor da Universidade de Alberta, Edmonton, Alberta, Canadá;
• TNHMM, hospedado no servidor da Universidade Técnica
da Dinamarca;
Exemplo 39: Ensaio relacionada às seqüências polipeptídicas
Hidrólise de ATP por atividade de RCA é medida pelo acoplamento de produção e ADP para oxidação de NADH como descrito por Li et al ((2005) J Biol Chem 280(26): 24864-24869; e referências incluindo a este respeito), a ativação da RuBisCO pela atividade de RCA é avaliada espectrofotometricamente como relatado por Esau et «/.,((1996) Arch Biochem Biophys 326: 100-105).
Exemplo 40: Clonagem de seqüência de ácido nucleico como representada pela SEQID NO: 250
A menos que estipulado de outro modo, técnicas de DNA recombinante são realizadas de acordo com protocolos padrões descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3a Edição Cold Spring Harbor Laboratory Press, CSH, Nova Iorque) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrões para trabalho molecular vegetal são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
A seqüência de ácido nucleico usada nos métodos da invenção foi amplificado por PCR usando como molde uma biblioteca de cDNA CC- 1690 de Chlamydomonas reinhardtii ("Biblioteca de cerne") (no vetor Lambda ZAP II da Stratagene) adquirido no Chlamy Center (formalmente the Chlamydomonas Genetics Center) na Universidade de Duke, Carolina do Norte, EUA. PCR foi realizada usando Taq DNA polimerase Hifi em condições padrões, usando 200 ng de molde em uma mistura de PCR de 50 μι. Os iniciadores usados foram
- prm08444 SEQ ID NO: 310; em sentido, sítio AttBl em
minúsculas:
5'-
ggggacaagtttgtacaaaaaagcaggcttaaacaATGCAGGTCACCATGAAGAG-3'; e
- prm08445 SEQ ID NO: 311 reverso, complementar, sítio AttB2 em minúsculas:
5'-
ggggaccactttgtacaagaaagctgggtC TCCTAC AGAGGAGGCACATC-3', os quais incluem os sítios AttB para recombinação Gateway. O
fragmento de PCR foi purificado também usando métodos padrões. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir de acordo com a terminologia Gateway, um "clone de entrada", ρ 15972. O plasmídeo pDONR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 41: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada pela SEQID NO: 250
O clone de entrada compreendendo a SEQ ID NO: 250 foi subseqüentemente usado em uma reação LR com três diferentes vetores de destinação usados subseqüentemente e individualmente para transformação de Oryza sativa. Os vetores contém como elementos funcionais dentro das bordas de T-DNA: um marcador selecionável vegetal, um cassete de expressão de marcador triável e um cassete Gateway destinado para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. O primeiro vetor de destinação compreende a montante deste cassete Gateway o promotor GOS2 de arroz (SEQ ID NO: 306) para expressão constitutiva forte, o segundo vetor de destinação compreende o promotor HMGB de arroz para expressão constitutiva (SEQ ID NO: 307) e o terceiro vetor de destinação compreende o promotor de protoclorofílídeo redutase de arroz para expressão específica em tecido verde (SEQ ID NO: 308).
Após a etapa de recombinação LR, os vetores de expressão resultantes (Figura 16) foram transformados separadamente em Agrobacterium cepa LBA4044 de acordo com métodos bem conhecidos na técnica.
Exemplo 42: Transformação Vegetal Veja o Exemplo 9 acima. Exemplo 43: Procedimento de avaliação fenotípica
Para o Exemplo 10 e 22 acima. Exemplo 44: Resultados da avaliação fenotípica das plantas transgênicas expressando SEQ ID NO: 250 sob o controle de um promotor constitutivo forte
Os resultados da avaliação das plantas de arroz transgênicas
expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção, sob o controle de um promotor GOS2 constitutivo forte (SEQ ID NO: 306), são apresentados na Tabelas D5. A diferença porcentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P de teste F abaixo de 0,05.
As plantas transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção tem vigor inicial aumentado e TKW aumentado comparadas com as plantas controle (neste caso, os nulizigotos). Tabela D5: Resultados da avaliação de plantas de arroz transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção, sob o controle de um promotor GOS2 constitutivo forte.
Característica % de % de aumento na aumento na geração Tl geração T2 Vigor inicial 8 17 aumentado TKW 7 28
Exemplo 45: Resultados da avaliação fenotípica das plantas
transgênicas expressando SEQID NO: 250 sob o controle de um promotor constitutivo
Os resultados da avaliação das plantas de arroz transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção, sob o controle de um promotor HMGB constitutivo (SEQ ID NO: 307), são apresentados na Tabelas D6. A diferença porcentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P de teste F abaixo de 0,05.
As plantas transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção tem vigor inicial aumentado, biomassa acima do solo aumentada e número de sementes preenchidas aumentado comparadas com as plantas controle (neste caso, os nulizigotos). Plantas transgênicas florescem mais cedo comparadas com os nulizigotos correspondentes, por até 3 dias. Tabela D6: Resultados da avaliação de plantas de arroz
transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção, sob o controle de um promotor HMGB constitutivo.
Característica % de aumento na geração Tl % de aumento na geração T2 Vigor inicial aumentado 12 8 Aumento em biomassa acima 11 5 do solo Aumento no número de sementes (preenchidas) 11 9
Exemplo 46: Resultados da avaliação fenotípica das plantas transgênicas expressando SEQID NO: 250 sob o controle de um promotor específico de tecido verde
Os resultados da avaliação das plantas de arroz transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção, sob o controle de um promotor de protoclorofilídeo redutase (SEQ ID NO: 308), são apresentados na Tabelas D7. A diferença porcentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P de teste F abaixo de 0,05.
As plantas transgênicas expressando a seqüência de ácido
nucleico útil na realização dos métodos da invenção tem vigor inicial aumentado comparadas com as plantas controle (neste caso, os nulizigotos). Plantas transgênicas florescem mais cedo comparadas com os nulizigotos correspondentes, por até 4 dias.
Tabela D7: Resultados da avaliação de plantas de arroz
transgênicas expressando a seqüência de ácido nucleico útil na realização dos métodos da invenção, sob o controle de um promotor de protoclorofilídeo redutase.
Característica % de aumento na geração Tl % de aumento na geração T2 Vigor inicial aumentado 18 8
Exemplo 4 7: Exemplos de transformação de outras colheitas Veja o Exemplo 9 acima.
Exemplo 48: Exemplos de triagens de estresse abiótico Para o Exemplo 22 acima. Parte V. SYPFl
Exemplo 49: Identificação de seqüências relacionadas a SEQID NO: 321 e SEQID NO: 322
Seqüências (cDNA completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 321 e/ou seqüências proteicas relacionadas à SEQ ID NO: 322 foram identificadas entre aquelas mantidas no banco de dados Nucleotides Entrez no Centro Nacional para Informação em Biotecnologia (NCBI) usando ferramentas de pesquisa de seqüência em banco de dados, tais como a Ferramenta de Alinhamento Local Básico (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa foi usado para encontrar regiões de similaridade local entre seqüências por comparação de seqüências de ácido nucleico ou polipeptídicas com bancos de dados de seqüências e pelo cálculo da significância estatística de pareamentos. O polipeptídio codificado pela SEQ ID NO: 321 foi usado para algoritmo TBLASTN, com ajustes padrões e o filtro para ignorar seqüências de baixa complexidade desligado. A produção da análise foi vista por comparação par a par e classificada de acordo com a pontuação de probabilidade (valor de E), onde a pontuação reflete a probabilidade que um alinhamento particular ocorra por acaso (quanto menor o valor de E, mais significativo o sucesso). Além dos valores de E, comparações também foram pontuadas por identidade de porcentual. Identidade porcentual se refere ao número de nucleotídeos idênticos (ou de aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídicas) comparadas por um comprimento particular. Em alguns casos, os parâmetros padrões podem ser ajustados para modificar a estringência da pesquisa.
A Tabela El provê uma lista de seqüências de ácido nucleico e proteicas relacionadas à seqüência de ácido nucleico como representada pela SEQ ID NO: 321 e à seqüência proteica representada pela SEQ ID NO: 322. Tabela El: Seqüências de ácido nucleíco que codificam polipeptídios SYPFl e polipeptídios SYPFl.
Nome Organismo fonte Ácido nucleíco SEQ ID NO: Polipeptídio SEQ ID NO: SEQ ID NO: 322 Arabidopsis thaliana 321 322 At4g18690 Arabidopsis thaliana 323 324 At4g18680 Arabidopsis thaliana 325 326 At4gl8650 Arabidopsis thaliana 327 328 NP_564730.1 Arabidopsis thaliana 329 330 At5g 10030 Arabidopsis thaliana 331 332 CAA40102.1 Triticum aestivum 333 334 OsOIgO159000 Oryza sativa 335 336 OsOlg0306400 Oryza sativa 337 338 BAA05470.1 Nicotiana glauca χ Nicotiana langsdorfii 339 330 AAT64037.1 Gossypium hirsutum 331 332 At4g18690 Arabidopsis thaliana - 333 NP 193603.1 Arabidopsis thaliana - 334 NP_193600.2 Arabidopsis thaliana - 335 P_564730.1 Arabidopsis thaliana - 336 At5g 10030 Arabidopsis thaliana - 337 CAA40102.1 Tritieum aestivum - 338 OS01g0159000 Oryza sativa 339 0s01g0306400 Oryza sativa 340 BAA05470.1 j Nieotiana glauca χ Nicotiana 341 langsdorfii AAT64037.1 Gossypium hirsutum - 342
Exemplo 50: Alinhamento de seqüências polipeptídicas SYPFl
Alinhamento de seqüências polipeptídicas foi realizado usando o programa AlignX do Vector NTI (Invitrogen) que é baseado no algoritmo popular de Clustal de alinhamento progressivo (Thompson et ai. (1997) Nucleic Acids Res 25:4876-4882; Chenna et ai. (2003). Nucleic Acids Res 31:3497-3500). Valores padrões são para penalidade de abertura de interrupção de 10, para a penalidade de extensão de interrupção de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídios foram alinhados). Resultados na Figura 19 mostram que polipeptídios SYPFl compartilham regiões de alta conservação de seqüências. Motivo 1, Motivo 2 e Motivo 3 representam as regiões de homologia de seqüências mais altas.
Uma árvore filogenética de polipeptídios SYPF1 foi construída usando um algoritmo de agrupamento de neighbour-joining como provido no programa AlignX do Vector NTI (Invitrogen). A Figura 20 mostra como polipeptídios SYPF1 se aglomera com SEQ ID NO: 322.
Exemplo 51: Clonagem de seqüência de ácido nucleico como representada pela SEQID NO: 321
A menos que estipulado de outro modo, técnicas de DNA recombinante são realizadas de acordo com protocolos padrões descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3a Edição Cold Spring Harbor Laboratory Press, CSH, Nova Iorque) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrões para trabalho molecular vegetal são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
O gene SYPFl de Arabidopsis thaliana foi amplificado por PCR usando como molde uma biblioteca de cDNA de Arabidopsis thaliana (Invitrogen, Paisley, UK). Iniciadores (SEQ ID NO: 353; em sentido: 5'- ggggacaagtttgtacaaaaaagcaggcttaaacaatgccaaacactagcagctct-3') e SEQ ID NO: 354; reverso, complementar: 5'-ggggaccactttgtacaag aaagctgggtagaagcagagcaaagcaaatta-3'), que inclui os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizada usando Taq DNA polimerase Hifi em condições padrões. Um fragmento de PCR do comprimento esperado (incluindo sítios attB) foi amplificado e purificado também usando métodos padrões. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir de acordo com a terminologia Gateway, um "clone de entrada". O plasmídeo pDONR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 52: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada pela SEQID NO: 321
O clone de entrada compreendendo a SEQ ID NO: 321 foi subseqüentemente usado em uma reação LR com um vetor de destinação usado para transformação de Oryza sativa. Este vetor continha como elementos funcionais dentro das bordas de T-DNA: um marcador selecionável vegetal, um cassete de expressão de marcador triável e um cassete Gateway destinado para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor HMG de arroz (SEQ ID NO: 355) para expressão específica de raiz foi localizado a montante deste cassete Gateway.
Após a etapa de recombinação LR, o vetor de expressão resultante (Figura 21) foi transformado em Agrobacterium cepa LBA4044 de acordo com métodos bem conhecidos na técnica. Exemplo 53: Transformação Vegetal Veja o Exemplo 9 acima. Exemplo 54: Procedimento de avaliação fenotípica
Para o Exemplo 10 e 22 acima. Exemplo 55: Resultados da avaliação fenotípica das plantas transgênicas
Os resultados da avaliação das plantas de arroz transgênicas expressando o ácido nucleico de SYPF1 são como se seguem.
Houve um aumento significativo estatisticamente na taxa de preenchimento de sementes, no número de semente preenchidas, no peso total de semente e no índice de colheita comparados com nulizigotos correspondentes (controles). No caso da taxa de preenchimento, as melhores 3 linhagens mostraram um aumento de 16% ou mais comparadas com plantas controle. No caso do número de sementes preenchidas, as melhores 4 linhagens deram um aumento de 19% ou mais comparadas com plantas controle. O peso total de sementes foi aumentado nas melhores 4 linhagens por 19% ou mais e, para índice de colheita, as melhores 3 linhagens deram um aumento maior que 20% comparadas com plantas controle. LISTAGEM DE SEQÜÊNCIA <110> BASF Plant Science GmbH
<120> Plantas tendo características relacionadas a rendimento intensificadas e um método para produzir as mesmas
<130> PF58677
<160> 355
<170> PatentIn version 3.3
<210> 1
<211> 1827
<212> DNA
<213> Arabidopsis thaliana
<400> 1 atggagacaa attcgtctgg agaagatctg gttattaaga ctcggaagcc atatacgata 60 acaaagcaac gtgaaaggtg gactgaggaa gaacataata gattcattga agctttgagg 120 ctttatggta gagcatggca gaagattgaa gaacatgtag caacaaaaac tgctgtccag 180 ataagaagtc acgctcagaa atttttctcc aaggtagaga aagaggctga agctaaaggt 240 gtagctatgg gtcaagcgct agacatagct attcctcctc cacggcctaa gcgtaaacca 300 aacaatcctt atcctcgaaa gacgggaagt ggaacgatcc ttatgtcaaa aacgggtgtg 360 aatgatggaa aagagtccct tggatcagaa aaagtgtcgc atcctgagat ggccaatgaa 420 gatcgacaac aatcaaagcc tgaagagaaa actctgcagg aagacaactg ttcagattgt 480 ttcactcatc agtatctctc tgctgcatcc tccatgaata aaagttgtat agagacatca 540 aacgcaagca ctttccgcga gttcttgcct tcacgggaag agggaagtca gaataacagg 600 gtaagaaagg agtcaaactc agatttgaat gcaaaatctc tggaaaacgg taatgagcaa 660 ggacctcaga cttatccgat gcatatccct gtgctagtgc cattggggag ctcaataaca 720 agttctctat cacatcctcc ttcagagcca gatagtcatc cccacacagt tgcaggagat 780 tatcagtcgt ttcctaatca tataatgtca acccttttac aaacaccggc tctttatact 840 gccgcaactt tcgcctcatc attttggcct cccgattcta gtggtggctc acctgttcca 900 gggaactcac ctccgaatct ggctgccatg gccgcagcca ctgttgcagc tgctagtgct 960 tggtgggctg ccaatggatt attaccttta tgtgctcctc ttagttcagg tggtttcact 1020 agtcatcctc catctacttt tggaccatca tgtgatgtag agtacacaaa agcaagcact 1080 ttacaacatg gttctgtgca gagccgagag caagaacact ccgaggcatc aaaggctcga 1140 tcttcactgg actcagagga tgttgaaaat aagagtaaac cagtttgtca tgagcagcct 1200 tctgcaacac ctgagagtga tgcaaagggt tcagatggag caggagacag aaaacaagtt 1260 gaccggtcct cgtgtggctc aaacactccg tcgagtagtg atgatgttga ggcggatgca 1320 tcagaaaggc aagaggatgg caccaatggt gaggtgaaag aaacgaatga agacactaat 1380
aaacctcaaa cttcagagtc caatgcacgc cgcagtagaa tcagctccaa tataaccgat 1440
ccatggaagt ctgtgtctga cgagggtcga attgccttcc aagctctctt ctccagagag 1500
gtattgccgc aaagttttac atatcgagaa gaacacagag aggaagaaca acaacaacaa 1560
gaacaaagat atccaatggc acttgatctt aacttcacag ctcagttaac accagttgat 1620
gatcaagagg agaagagaaa cacaggattt cttggaatcg gattagatgc ttcaaagcta 1680
atgagtagag gaagaacagg ttttaaacca tacaaaagat gttccatgga agccaaagaa 1740
agtagaatcc tcaacaacaa tcctatcatt catgtggaac agaaagatcc caaacggatg 1800
cggttggaaa ctcaagcttc cacatga 1827
<210> 2 <211> 608 <212> PRT
<213> Arabidopsis thaliana <400> 2
Met Glu Thr Asn Ser Ser Gly Glu Asp Leu Val Ile Lys Thr Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Glu Glu His 25 30
Asn Arg Phe Ile Glu Ala Leu Arg Leu Tyr Gly Arg Ala Trp Gln Lys 40 45
Ile Glu Glu His Val Ala Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Ser Lys Val Glu Lys Glu Ala Glu Ala Lys Gly 65 70 75 80
Val Ala Met Gly Gln Ala Leu Asp Ile Ala Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Asn Asn Pro Tyr Pro Arg Lys Thr Gly Ser Gly Thr 100 105 110
Ile Leu Met Ser Lys Thr Gly Val Asn Asp Gly Lys Glu Ser Leu Gly 115 120 125
Ser Glu Lys Val Ser His Pro Glu Met Ala Asn Glu Asp Arg Gln Gln 130 135 140
Ser Lys Pro Glu Glu Lys Thr Leu Gln Glu Asp Asn Cys Ser Asp Cys 145 150 155 160
Phe Thr His Gln Tyr Leu Ser Ala Ala Ser Ser Met Asn Lys Ser Cys 165 170 175
Ile Glu Thr Ser Asn Ala Ser Thr Phe Arg Glu Phe Leu Pro Ser Arg 180 185 190
Glu Glu Gly Ser Gln Asn Asn Arg Val Arg Lys Glu Ser Asn Ser Asp 195 200 205
Leu Asn Ala Lys Ser Leu Glu Asn Gly Asn Glu Gln Gly Pro Gln Thr 210 215 220
Tyr Pro Met His Ile Pro Val Leu Val Pro Leu Gly Ser Ser Ile Thr 225 230 235 240
Ser Ser Leu Ser His Pro Pro Ser Glu Pro Asp Ser His Pro His Thr 245 250 255
Val Ala Gly Asp Tyr Gln Ser Phe Pro Asn His Ile Met Ser Thr Leu 260 265 270
Leu Gln Thr Pro Ala Leu Tyr Thr Ala Ala Thr Phe Ala Ser Ser Phe 275 280 285
Trp Pro Pro Asp Ser Ser Gly Gly Ser Pro Val Pro Gly Asn Ser Pro 290 295 300
Pro Asn Leu Ala Ala Met Ala Ala Ala Thr Val Ala Ala Ala Ser Ala 305 310 315 320
Trp Trp Ala Ala Asn Gly Leu Leu Pro Leu Cys Ala Pro Leu Ser Ser 325 330 335
Gly Gly Phe Thr Ser His Pro Pro Ser Thr Phe Gly Pro Ser Cys Asp 340 345 350
Val Glu Tyr Thr Lys Ala Ser Thr Leu Gln His Gly Ser Val Gln Ser 355 360 365
Arg Glu Gln Glu His Ser Glu Ala Ser Lys Ala Arg Ser Ser Leu Asp 370 375 380
Ser Glu Asp Val Glu Asn Lys Ser Lys Pro Val Cys His Glu Gln Pro 385 390 395 400 Ser Ala Thr Pro Glu Ser Asp Ala Lys Gly Ser Asp Gly Ala Gly Asp 405 410 415
Arg Lys Gln Val Asp Arg Ser Ser Cys Gly Ser Asn Thr Pro Ser Ser 420 425 430
Ser Asp Asp Val Glu Ala Asp Ala Ser Glu Arg Gln Glu Asp Gly Thr 435 440 445
Asn Gly Glu Val Lys Glu Thr Asn Glu Asp Thr Asn Lys Pro Gln Thr 450 455 460
Ser Glu Ser Asn Ala Arg Arg Ser Arg Ile Ser Ser Asn Ile Thr Asp 465 470 475 480
Pro Trp Lys Ser Val Ser Asp Glu Gly Arg Ile Ala Phe Gln Ala Leu 485 490 495
Phe Ser Arg Glu Val Leu Pro Gln Ser Phe Thr Tyr Arg Glu Glu His 500 505 510
Arg Glu Glu Glu Gln Gln Gln Gln Glu Gln Arg Tyr Pro Met Ala Leu 515 520 525
Asp Leu Asn Phe Thr Ala Gln Leu Thr Pro Val Asp Asp Gln Glu Glu 530 535 540
Lys Arg Asn Thr Gly Phe Leu Gly Ile Gly Leu Asp Ala Ser Lys Leu 545 550 555 560
Met Ser Arg Gly Arg Thr Gly Phe Lys Pro Tyr Lys Arg Cys Ser Met 565 570 575
Glu Ala Lys Glu Ser Arg Ile Leu Asn Asn Asn Pro Ile Ile His Val 580 585 590
Glu Gln Lys Asp Pro Lys Arg Met Arg Leu Glu Thr Gln Ala Ser Thr 595 600 605
<210> 3 <211> 1938 <212> DNA
<213> Arabidopsis thaliana <400> 3
atggatacta atacatctgg agaagaatta ttagctaagg oaagaaagcc atatacaata 60
acaaagcagc gagagcgatg gactgaggat gagcatgaga ggtttctaga agccttgagg 120 ctttatggaa gagcttggca acgaattgaa gaacatattg ggacaaagac tgctgttcag 180 atcagaagtc atgcacaaaa gttcttcaca aagttggaga aagaggctga agttaaaggc 240 atccctgttt gccaagcttt ggacatagaa attccgcctc ctcgtcctaa acgaaaaccc 300 aatactcctt atcctcgaaa gcctgggaac aacggtacat cttcctctca agtatcatca 360 gcaaaagatg caaaacttgt ttcatcggcc tcttcttcac agttgaatca ggcgttcttg 420 gatttggaaa aaatgccgtt ctctgagaaa acatcaactg gaaaagaaaa tcaagatgag 480 aattgctcgg gtgtttctac tgtgaacaag tatcccttac caacgaaaca ggtaagtggc 540 gacattgaaa caagtaagac ctcaactgtg gacaacgcgg ttcaagatgt tcccaagaag 600 aacaaagaca aagatggtaa cgatggtact actgtgcaca gcatgcaaaa ctacccttgg 660 catttccacg cagatattgt gaacgggaat atagcaaaat gccctcaaaa tcatccctca 720 ggtatggtat ctcaagactt catgtttcat cctatgagag aagaaactca cgggcacgca 780 aatcttcaag ctacaacagc atctgctact actacagctt ctcatcaagc gtttccagct 840 tgtcattcac aggatgatta ccgttcgttt ctccagatat catctacttt ctccaatctt 900 attatgtcaa ctctcctaca gaatcctgca gctcatgctg cagctacatt cgctgcttcg 960 gtctggcctt atgcgagtgt cgggaattct ggtgattcat caaccccaat gagctcttct 1020 cctccaagta taactgccat tgccgctgct acagtagctg ctgcaactgc ttggtgggct 1080 tctcatggac ttcttcctgt atgcgctcca gctccaataa catgtgttcc attctcaact 1140 gttgcagttc caactccagc aatgactgaa atggataccg ttgaaaatac tcaaccgttt 1200 gagaaacaaa acacagctct gcgagatcaa aacttggctt cgaaatctcc agcttcatca 1260 tctgatgatt cagatgagac tggagtaacc aagctaaatg ccgactcaaa aaccaatgat 1320 gataaaattg aggaggttgt tgttactgcc gctgtgcatg actcaaacac tgcccagaag 1380 aaaaatcttg tggaccgctc atcctgtggc tcaaatacac cttcagggag tgacgcagaa 1440 actgatgcat tagataaaat ggagaaagat aaagaggatg tgaaggagac agatgagaat 1500 cagccagatg ttattgagtt aaataaccgt aagattaaaa tgagagacaa caacagcaac 1560 aacaatgcaa ctactgattc gtggaaggaa gtctccgaag agggtcgtat agcgtttcag 1620 gctctctttg caagggaaag attgcctcaa agcttttcgc ctcctcaagt ggcagagaat 1680 gtgaatagaa aacaaagtga cacgtcaatg ccattggctc ctaatttcaa aagccaggat 1740 tcttgtgctg cagaccaaga aggagtagta atgatcggtg ttggaacatg caagagtctt 1800 aaaacgagac agacaggatt taagccatac aagagatgtt caatggaagt gaaagagagc 1860 caagttggga acataaacaa tcaaagtgat gaaaaagtct gcaaaaggct tcgattggaa 1920 ggagaagctt ctacatga 1938
<210> 4 <211> 645 <212> PRT
<213> Arabidopsis thaliana <400> 4
Met Asp Thr Asn Thr Ser Gly Glu Glu Leu Leu Ala Lys Ala Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Asp Glu His 25 30
Glu Arg Phe Leu Glu Ala Leu Arg Leu Tyr Gly Arg Ala Trp Gln Arg 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Glu Val Lys Gly 65 70 75 80
Ile Pro Val Cys Gln Ala Leu Asp Ile Glu Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Asn Thr Pro Tyr Pro Arg Lys Pro Gly Asn Asn Gly 100 105 110
Thr Ser Ser Ser Gln Val Ser Ser Ala Lys Asp Ala Lys Leu Val Ser 115 120 125
Ser Ala Ser Ser Ser Gln Leu Asn Gln Ala Phe Leu Asp Leu Glu Lys 130 135 140
Met Pro Phe Ser Glu Lys Thr Ser Thr Gly Lys Glu Asn Gln Asp Glu 145 150 155 160
Asn Cys Ser Gly Val Ser Thr Val Asn Lys Tyr Pro Leu Pro Thr Lys 165 170 175
Gln Val Ser Gly Asp Ile Glu Thr Ser Lys Thr Ser Thr Val Asp Asn 180 185 190
Ala Val Gln Asp Val Pro Lys Lys Asn Lys Asp Lys Asp Gly Asn Asp 195 200 205
Gly Thr Thr Val His Ser Met Gln Asn Tyr Pro Trp His Phe His Ala 210 215 220
Asp Ile Val Asn Gly Asn Ile Ala Lys Cys Pro Gln Asn His Pro Ser 225 230 235 240
Gly Met Val Ser Gln Asp Phe Met Phe His Pro Met Arg Glu Glu Thr 245 250 255
His Gly His Ala Asn Leu Gln Ala Thr Thr Ala Ser Ala Thr Thr Thr 260 265 270
Ala Ser His Gln Ala Phe Pro Ala Cys His Ser Gln Asp Asp Tyr Arg 275 280 285
Ser Phe Leu Gln Ile Ser Ser Thr Phe Ser Asn Leu Ile Met Ser Thr 290 295 300
Leu Leu Gln Asn Pro Ala Ala His Ala Ala Ala Thr Phe Ala Ala Ser 305 310 315 320
Val Trp Pro Tyr Ala Ser Val Gly Asn Ser Gly Asp Ser Ser Thr Pro 325 330 335
Met Ser Ser Ser Pro Pro Ser Ile Thr Ala Ile Ala Ala Ala Thr Val 340 345 350
Ala Ala Ala Thr Ala Trp Trp Ala Ser His Gly Leu Leu Pro Val Cys 355 360 365
Ala Pro Ala Pro Ile Thr Cys Val Pro Phe Ser Thr Val Ala Val Pro 370 375 380
Thr Pro Ala Met Thr Glu Met Asp Thr Val Glu Asn Thr Gln Pro Phe 385 390 395 400
Glu Lys Gln Asn Thr Ala Leu Gln Asp Gln Asn Leu Ala Ser Lys Ser 405 410 415
Pro Ala Ser Ser Ser Asp Asp Ser Asp Glu Thr Gly Val Thr Lys Leu 420 425 430
Asn Ala Asp Ser Lys Thr Asn Asp Asp Lys Ile Glu Glu Val Val Val 435 440 445
Thr Ala Ala Val His Asp Ser Asn Thr Ala Gln Lys Lys Asn Leu Val 450 455 460
Asp Arg Ser Ser Cys Gly Ser Asn Thr Pro Ser Gly Ser Asp Ala Glu 465 470 475 480 Thr Asp Ala Leu Asp Lys Met Glu Lys Asp Lys Glu Asp Val Lys Glu 485 490 495
Thr Asp Glu Asn Gln Pro Asp Val Ile Glu Leu Asn Asn Arg Lys Ile 500 505 510
Lys Met Arg Asp Asn Asn Ser Asn Asn Asn Ala Thr Thr Asp Ser Trp 515 520 525
Lys Glu Val Ser Glu Glu Gly Arg Ile Ala Phe Gln Ala Leu Phe Ala 530 535 540
Arg Glu Arg Leu Pro Gln Ser Phe Ser Pro Pro Gln Val Ala Glu Asn 545 550 555 560
Val Asn Arg Lys Gln Ser Asp Thr Ser Met Pro Leu Ala Pro Asn Phe 565 570 575
Lys Ser Gln Asp Ser Cys Ala Ala Asp Gln Glu Gly Val Val Met Ile 580 585 590
Gly Val Gly Thr Cys Lys Ser Leu Lys Thr Arg Gln Thr Gly Phe Lys 595 600 605
Pro Tyr Lys Arg Cys Ser Met Glu Val Lys Glu Ser Gln Val Gly Asn 610 615 620
Ile Asn Asn Gln Ser Asp Glu Lys Val Cys Lys Arg Leu Arg Leu Glu 625 630 635 640
Gly Glu Ala Ser Thr 645
<210> 5
<211> 882
<212> DNA
<213> Arabidopsis thaliana
<400> 5
atgacctcaa ccaatccggt ggtcgccgaa gtaataccgg cggaaacttc tacagatgct 60 acagagacga cgattgcaac gacggaagct ggtgaagcac cggagaagaa ggtgaggaaa 120 gcttacacaa tcaccaagtc tagagagagt tggactgaag gagaacacga caagtttctg 180 gaagctcttc aattgtttga tcgtgactgg aaaaagatag aagattttgt tggttcaaag 240 acagttattc agatcaggag ccatgcccaa aaatactttc taaaggtcca aaaaaatggg 300 actttagcac atgttccacc ccctaggcct aagcgcaaag ctgctcatcc atatcctcaa 360 aaggcatcga aaaatgctca aatgtcgctt cacgtttcca tgtcctttcc tactcaaata 420 aataacctgc ctggatatac tccatgggat gatgatacat ctgcattgtt aaacattgct 480
gtaagtgggg ttattccacc agaagatgaa cttgatactc tttgtggagc agaagttgat 540
gttggatcaa atgacatgat aagtgaaact agtccttcag catctggtat cggaagctca 600
agcagaacac tatcagattc taagggtttg agactggcga aacaagctcc Ctcaatgcat 660
ggtcttcctg attttgctga ggtttataac ttcattggga gtgtgttcga tcctgacagc 720
aaaggccgca tgaaaaagct caaggaaatg gatcctataa atttcgaaac tgttttgctg 780
ttgatgagaa accteacagt gaacttgtca aaccctgact ttgaacctac ttctgaatat 840
gttgatgctg cagaggaagg tcatgaacac ttaagctctt ag 882
<210> 6 <211> 293 <212> PRT
<213> Araibidopsis thaliana <400> 6
Met Thr Ser Thr Asn Pro Val Val Ala Glu Val Ile Pro Ala Glu Thr 10 15
Ser Thr Asp Ala Thr Glu Thr Thr Ile Ala Thr Thr Glu Ala Gly Glu 25 30
Ala Pro Glu Lys Lys Val Arg Lys Ala Tyr Thr Ile Thr Lys Ser Arg 40 45
Glu Ser Trp Thr Glu Gly Glu His Asp Lys Phe Leu Glu Ala Leu Gln 50 55 60
Leu Phe Asp Arg Asp Trp Lys Lys Ile Glu Asp Phe Val Gly Ser Lys 65 70 75 80
Thr Val Ile Gln Ile Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val 85 90 95
Gln Lys Asn Gly Thr Leu Ala His Val Pro Pro Pro Arg Pro Lys Arg 100 105 110
Lys Ala Ala His Pro Tyr Pro Gln Lys Ala Ser Lys Asn Ala Gln Het 115 120 125
Ser Leu His Val Ser Met Ser Phe Pro Thr Gln Ile Asn Asn Leu Pro 130 135 140
Gly Tyr Thr Pro Trp Asp Asp Asp Thr Ser Ala Leu Leu Asn Ile Ala 145 150 155 160 Val Ser Gly Val Ile Pro Pro Glu Asp Glu Leu Asp Thr Leu Cys Gly 165 170 175
Ala Glu Val Asp Val Gly Ser Asn Asp Met Ile Ser Glu Thr Ser Pro 180 185 190
Ser Ala Ser Gly Ile Gly Ser Ser Ser Arg Thr Leu Ser Asp Ser Lys 195 200 205
Gly Leu Arg Leu Ala Lys Gln Ala Pro Ser Met His Gly Leu Pro Asp 210 215 220
Phe Ala Glu Val Tyr Asn Phe Ile Gly Ser Val Phe Asp Pro Asp Ser 225 230 235 240
Lys Gly Arg Met Lys Lys Leu Lys Glu Met Asp Pro Ile Asn Phe Glu 245 250 255
Thr Val Leu Leu Leu Met Arg Asn Leu Thr Val Asn Leu Ser Asn Pro 260 265 270
Asp Phe Glu Pro Thr Ser Glu Tyr Val Asp Ala Ala Glu Glu Gly His 275 280 285
Glu His Leu Ser Ser 290
<210> 7
<211> 993
<212> DNA
<213> Arabidopsis thaliana
<400> 7
atggtctcta gaaattctga cggatatttc ttggatccga ccggtatgac tgttcctggt 60 ctcggacctt cctttacagc cgccgtttct tcttcttctt caccaacgac ttcttctacg 120 gccgtggctg tggcggatgt gacggcgatg gtttcttctt cggaggagga tttgagtaag 180 aagattagga agccttatac tattactaag tctagagaga gctggacgga gcctgagcat 240 gataaattcc ttgaagctct tcaattgttt gatagagact ggaagaaga t tgaagctttt 300 attggttcaa agacagtgat tcagatacga agtcatgctc agaagtattt tcttaaggta 360 caaaagagtg ggaccggtga acatctccct cctcctcgac ctaaaaggaa agccgctcat 420 ccatatcctc agaaggctca caagaatgtg caactgcaag taccagggtc attcaagtca 480 acatctgaac caaatgaccc aagttttatg tttaggcctg agtcttcttc aatgctgatg 540 acttcgccaa ccactgctgc tgcggctcca tggacaaata atgcgcaaac aattagcttc 600 actcccctcc caaaaggagc aggagctaat aacaattgtt ctagtagttc tgaaaatact 660 ccaagaccac gatccaacag ggacgcaaga gaccatggaa atgttggcca ttcattaaga 720 gttttaccgg actttgccca agtatacggc ttcattggaa gtgtgtttga cccatatgca 780 agtaatcatc tacaaaagct gaagaagatg gaccccatag atgttgaaac agtgttacta 840 ttgatgagaa atctatccat caacttgtct agtcctgact ttgaggatca tagacggctt 900 ctttcgtctt atgatatcgg atctgagaca gcaactgatc atggtggagt gaataaaacc 960 11aaacaaag acccacctga aatctctact taa 993
<210> 8 <211> 330 <212> PRT
<213> Arabidopsis thaliana <400> 8
Met Val Ser Arg Asn Ser Asp Gly Tyr Phe Leu Asp Pro Thr Gly Met 10 15
Thr Val Pro Gly Leu Gly Pro Ser Phe Thr Ala Ala Val Ser Ser Ser 25 30
Ser Ser Pro Thr Thr Ser Ser Thr Ala Val Ala Val Ala Asp Val Thr 40 45
Ala Met Val Ser Ser Ser Glu Glu Asp Leu Ser Lys Lys Ile Arg Lys 50 55 60
Pro Tyr Thr Ile Thr Lys Ser Arg Glu Ser Trp Thr Glu Pro Glu His 65 70 75 80
Asp Lys Phe Leu Glu Ala Leu Gln Leu Phe Asp Arg Asp Trp Lys Lys 85 90 95
Ile Glu Ala Phe Ile Gly Ser Lys Thr Val Ile Gln Ile Arg Ser His 100 105 110
Ala Gln Lys Tyr Phe Leu Lys Val Gln Lys Ser Gly Thr Gly Glu His 115 120 125
Leu Pro Pro Pro Arg Pro Lys Arg Lys Ala Ala His Pro Tyr Pro Gln 130 135 140
Lys Ala His Lys Asn Val Gln Leu Gln Val Pro Gly Ser Phe Lys Ser 145 150 155 160 Thr Ser Glu Pro Asn Asp Pro Ser Phe Met Phe Arg Pro Glu Ser Ser 165 170 175
Ser Met Leu Met Thr Ser Pro Thr Thr Ala Ala Ala Ala Pro Trp Thr 180 185 190
Asn Asn Ala Gln Thr Ile Ser Phe Thr Pro Leu Pro Lys Gly Ala Gly 195 200 205
Ala Asn Asn Asn Cys Ser Ser Ser Ser Glu Asn Thr Pro Arg Pro Arg 210 215 220
Ser Asn Arg Asp Ala Arg Asp His Gly Asn Val Gly His Ser Leu Arg 225 230 235 240
Val Leu Pro Asp Phe Ala Gln Val Tyr Gly Phe Ile Gly Ser Val Phe 245 250 255
Asp Pro Tyr Ala Ser Asn His Leu Gln Lys Leu Lys Lys Met Asp Pro 260 265 270
Ile Asp Val Glu Thr Val Leu Leu Leu Met Arg Asn Leu Ser Ile Asn 275 280 285
Leu Ser Ser Pro Asp Phe Glu Asp His Arg Arg Leu Leu Ser Ser Tyr 290 295 300
Asp Ile Gly Ser Glu Thr Ala Thr Asp His Gly Gly Val Asn Lys Thr 305 310 315 320
Leu Asn Lys Asp Pro Pro Glu Ile Ser Thr 325 330
<210> 9
<211> 864
<212> DNA
<213> Arabidopsis thaliana
<400> 9
atggtgactg taaaccctag ccaagctcat tgtttgccta tgaaaatgag tctaccgggt 60 ttcaatactc ttccccacac ggcaacaacg ataccggttt ccatacggag caataggacg 120 atgtcgtttt ttgaggatcc aacaaagaag gttagaaagc cttacactat caccaaatct 180 agagagaac t ggacggagca agaacacgac aagttccttg aagcccttca tctatttgac 240 cgggattgga agaaaataaa ggcctttgtt ggatcaaaaa cagtgataca gatacgaagc 300 cacgcacaga agtactttct caaagttcag aagaatggga ctaaagaaca tctcccacct 360 cctcgaccaa agaggaaagc caatcaccca tatccacaaa aagctcctaa atttactctt 420 tcttcttcaa acgcattatt tcaacatgac tacttataca acactaattc acatccggtg 480 attagcacca cccgtaagca tggattagtg cattgcgatg ttagtatacc aagttctgtt 540 atcaaagagg aatttggtgt ctcagagaac tgttgcagca ctagtagtag tagagataag 600 cagaggacta gaatcgttac agagacaaat gaccaagaaa gttgtggaaa gccacataga 660 gtggcgccaa atttcgctga agtttacaat tttataggaa gtgtgtttga tcctaaaaca 720 acaggtcatg tcaagagatt aaaggaaatg gatccaataa atcttgagac ggttctctta 780 Ctgatgaaaa atttatctgt aaacctgacg agtcccgagt ttgatgaaca acggaagttg 840 atatcatctt acaacgccag ttag 864
<210> 10 <211> 287 <212> PRT
<213> Arabidopsis thaliana <400> 10
Met Val Thr Val Asn Pro Ser Gln Ala His Cys Leu Pro Met Lys Met 10 15
Ser Leu Pro Gly Phe Asn Thr Leu Pro His Thr Ala Thr Thr Ile Pro 25 30
Val Ser Ile Arg Ser Asn Arg Thr Met Ser Phe Phe Glu Asp Pro Thr 40 45
Lys Lys Val Arg Lys Pro Tyr Thr Ile Thr Lys Ser Arg Glu Asn Trp 50 55 60
Thr Glu Gln Glu His Asp Lys Phe Leu Glu Ala Leu His Leu Phe Asp 65 70 75 80
Arg Asp Trp Lys Lys Ile Lys Ala Phe Val Gly Ser Lys Thr Val Ile 85 90 95
Gln Ile Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val Gln Lys Asn 100 105 110
Gly Thr Lys Glu His Leu Pro Pro Pro Arg Pro Lys Arg Lys Ala Asn 115 120 125
His Pro Tyr Pro Gln Lys Ala Pro Lys Phe Thr Leu Ser Ser Ser Asn 130 135 140
Ala Leu Phe Gln His Asp Tyr Leu Tyr Asn Thr Asn Ser His Pro Val 145 150 155 160 Ile Ser Thr Thr Arg Lys His Gly Leu Val His Cys Asp Val Ser Ile
Pro Ser Ser Val Ile Lys Glu Glu Phe Gly Val Ser Glu Asn Cys Cys
Ser Thr Ser Ser Ser Arg Asp Lys Gln Arg Thr Arg Ile Val Thr Glu
Thr Asn Asp Gln Glu Ser Cys Gly Lys Pro His Arg Val Ala Pro Asn
Phe Ala Glu Val Tyr Asn Phe Ile Gly Ser Val Phe Asp Pro Lys Thr
Thr Gly His Val Lys Arg Leu Lys Glu Met Asp Pro Ile Asn Leu Glu
Thr Val Leu Leu Leu Met Lys Asn Leu Ser Val Asn Leu Thr Ser Pro
Glu Phe Asp Glu Gln Arg Lys Leu Ile Ser Ser Tyr Asn Ala Ser
<210> 11 <211> 909 <212> DNA
<213> Arabidopsis thaliana <400> 11
atggtgtccg taaaccctag acctaagggt tttccagttt tcgattcctc gaatatgagt 60
ttaccaagct ccgatggatt tggttcgatt ccggccacgg gacggaccag tacggtgtcg 120
ttttctgagg atcogacgac gaagattcgg aagccgtaca caatcaagaa gtcgagagag 180
aattggacag atcaagagca cgataaattt ctagaagctc ttcacttatt cgatagggat 240
tggaagaaaa tagaagcctt tgttggatca aaaacagtag ttcagatacg aagccacgct 300
cagaaatact ttctcaaagt tcagaagagt ggtgctaacg aacatcttcc acctcctcga 360
cctaagagga aagcgagtca tccttatcct ataaaggctc ctaaaaatgt tgcttatacc 420
tctctcccgt cttcgagtac attaccgttg cttgagcctg gttatttgta tagctctgat 480
tcgaagtcat tgatgggaaa ccaggctgtt tgtgcatcta cctcttcttc gtggaatcat 540
gaatcgacaa atctgccaaa accggtgatt gaagaggaac cgggagtctc ggccacggct 600
cctctcccaa ataatcgctg cagacaggaa gatacagaga gggtacgagc agtgacaaag 660
ccaaataacg aagaaagttg tgaaaagcca catagagtga tgccgaattt tgctgaagtt 720 tacagcttca ttggaagtgt cttcgatccc aacacatcag gccacctcca gagattaaag 780
cagatggatc caataaatat ggaaacggtt cttttactga tgcaaaacct gtctgtaaat 840
ctgacaagtc ccgagtttgc agagcaaagg aggttgatat catcatacag cgctaaagct 900
ttgaaatag 909
<210> 12 <211> 302 <212> PRT
<213> Arabidopsis thaliana <400> 12
Met Val Ser Val Asn Pro Arg Pro Lys Gly Phe Pro Val Phe Asp Ser 10 15
Ser Asn Met Ser Leu Pro Ser Ser Asp Gly Phe Gly Ser Ile Pro Ala 25 30
Thr Gly Arg Thr Ser Thr Val Ser Phe Ser Glu Asp Pro Thr Thr Lys 40 45
Ile Arg Lys Pro Tyr Thr Ile Lys Lys Ser Arg Glu Asn Trp Thr Asp 50 55 60
Gln Glu His Asp Lys Phe Leu Glu Ala Leu His Leu Phe Asp Arg Asp 65 70 75 80
Trp Lys Lys Ile Glu Ala Phe Val Gly Ser Lys Thr Val Val Gln Ile 85 90 95
Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val Gln Lys Ser Gly Ala 100 105 110
Asn Glu His Leu Pro Pro Pro Arg Pro Lys Arg Lys Ala Ser His Pro 115 120 125
Tyr Pro Ile Lys Ala Pro Lys Asn Val Ala Tyr Thr Ser Leu Pro Ser 130 135 140
Ser Ser Thr Leu Pro Leu Leu Glu Pro Gly Tyr Leu Tyr Ser Ser Asp 145 150 155 160
Ser Lys Ser Leu Met Gly Asn Gln Ala Val Cys Ala Ser Thr Ser Ser 165 170 175
Ser Trp Asn His Glu Ser Thr Asn Leu Pro Lys Pro Val Ile Glu Glu 180 185 190 Glu Pro Gly Val Ser Ala Thr Ala Pro Leu Pro Asn Asn Arg Cys Arg 195 200 205
Gln Glu Asp Thr Glu Arg Val Arg Ala Val Thr Lys Pro Asn Asn Glu 210 215 220
Glu Ser Cys Glu Lys Pro His Arg Val Met Pro Asn Phe Ala Glu Val 225 230 235 240
Tyr Ser Phe He Gly Ser Val Phe Asp Pro Asn Thr Ser Gly His Leu 245 250 255
Gln Arg Leu Lys Gln Met Asp Pro Ile Asn Met Glu Thr Val Leu Leu 260 265 270
Leu Met Gln Asn Leu Ser Val Asn Leu Thr Ser Pro Glu Phe Ala Glu 275 280 285
Gln Arg Arg Leu Ile Ser Ser Tyr Ser Ala Lys Ala Leu Lys 290 295 300
<210> 13
<211> 849
<212> DNA
<213> Arabidopsis thaliana
<400> 13
atgagctcgt cgccgtcaag aaatccaacg aacgccgaag cacctccgcc accaccaaca 60 tcgacggatg ctgtggcaga gggttcgtct aagaaagtga ggaaaccata taccatcacc 120 aagtcaagag agagctggac agaggaagag cacgataagt ttcttgaagc acttcaactg 180 tttgatcgtg actggaagaa gattgaagat tttgttggtt caaagactgt gattcagata 240 aggagtcatg ctcaaaaata ctttctcaag gttcagaaaa acgggacatt agctcatgtg 300 ccacctcctc gacctaagcg caaagcagct catccgtatc ctcaaaaggc atcaaagaac 360 gctcaaatgc cacttcaagt ttccacgtct tttactacta cgcgaaatgg cgacatgccg 420 ggatatgctt catgggatga tgcctcaatg ctgctaaaca gagttatttc accacaacat 480 gaacttgcta ctcttcgtgg agcagaagct gatattggat caaagggctt attaaatgtt 540 agtagccctt ctacatctgg catgggaagc tcaagccgaa cagtatcagg ttctgagatt 600 gtaagaaagg ctaaacagcc tccagtgctt cacggtgttc ctgattttgc tgaagtttat 660 aatttcattg ggagtgtctt tgatcctgaa acgagaggcc atgtggaaaa gctcaaggaa 720 atggatccta taaatttcga aactgttctg ttattgatga gaaacctcac agttaactta 780 tcaaaccctg atttagaatc cacttcggat tgtaatgatg ctgcagagga aagtcctctt 840 atcatatga
<210> 14
<211> 282
<212> PRT
<213> Arabidopsis thaliana
<400> 14
Met Ser Ser Ser Pro Ser Arg Asn Pro Thr Asn Ala Glu Ala Pro Pro 10 15
Pro Pro Pro Thr Ser Thr Asp Ala Val Ala Glu Gly Ser Ser Lys Lys 20 25 30
Val Arg Lys Pro Tyr Thr Ile Thr Lys Ser Arg Glu Ser Trp Thr Glu 35 40 45
Glu Glu His Asp Lys Phe Leu Glu Ala Leu Gln Leu Phe Asp Arg Asp 50 55 60
Trp Lys Lys Ile Glu Asp Phe Val Gly Ser Lys Thr Val Ile Gln Ile 65 70 75 80
Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val Gln Lys Asn Gly Thr 85 90 95
Leu Ala His Val Pro Pro Pro Arg Pro Lys Arg Lys Ala Ala His Pro 100 105 110
Tyr Pro Gln Lys Ala Ser Lys Asn Ala Gln Met Pro Leu Gln Val Ser 115 120 125
Thr Ser Phe Thr Thr Thr Arg Asn Gly Asp Met Pro Gly Tyr Ala Ser 130 135 140
Trp Asp Asp Ala Ser Met Leu Leu Asn Arg Val Ile Ser Pro Gln His 145 150 155 160
Glu Leu Ala Thr Leu Arg Gly Ala Glu Ala Asp Ile Gly Ser Lys Gly 165 170 175
Leu Leu Asn Val Ser Ser Pro Ser Thr Ser Gly Met Gly Ser Ser Ser 180 185 190
849
Arg Thr Val Ser Gly Ser Glu Ile Val Arg Lys Ala Lys Gln Pro Pro 195 200 205 Val Leu His Gly Val Pro Asp Phe Ala Glu Val Tyr Asn Phe Ile Gly
Ser Val Phe Asp Pro Glu Thr Arg Gly His Val Glu Lys Leu Lys Glu
Met Asp Pro Ile Asn Phe Glu Thr Val Leu Leu Leu Met Arg Asn Leu
Thr Val Asn Leu Ser Asn Pro Asp Leu Glu Ser Thr Ser Asp Cys Asn
Asp Ala Ala Glu Glu Ser Pro Leu Ile Ile
<210> 15 <211> 1041 <212> DNA
<213> Arabidopsis thaliana <400> 15
atggccgctg aggatcgaag tgaggaacta agcagcaatg tagaaaatgg aagttgcaat 60
tccaatgaag gaattaatcc tgaaaccagc agtcattgga ttgaaaacgt tgtcaaggtt 120
aggaaaccgt acacagtaac taagcagaga gagaagtgga gtgaggaaga gcatgatagg 180
tttcttgaag ctatcaagct ttatggtcgt ggttggcgtc aaatccaaga acacataggt 240
acaaaaaccg ctgtgcagat acgaagccat gctcaaaagt tcttctccaa gatggctcag 300
gaagctgaca gtagaagtga aggatcggtt aaagcgattg tgatcccgcc tcctcgtcca 360
aagagaaaac cggcacatcc ttatcctcgg aaatcgcctg ttccatatac tcagtctcct 420
ccaccaaatt tgtcagctat ggagaaagga accaagtctc caacctcagt gttatcatcg 480
tttggttcag aggatcaagt caatagatgc tcttcgccta attcgtgtac cagtgacatc 540
caatccattg gtgcaacttc cattgataaa aagaataact acacaacatc caagcaacct 600
ttcaaagatg attctgacat tggttcaaca cccatttcaa gcattactct tttcgggaag 660
attgtccttg tcgcggaaga atctcacaaa ccatcctctt acaatgatga tgatcttaaa 720
caaatgacgt gtcaggagaa tcactactca gggatgctag ttgacactaa tttatctctt 780
ggtgtatggg aaacgttttg tactggttct aatgcatttg gctcggttac agaagcatct 840
gagaacttgg agaaaagtgc agagccgata agttcttcat ggaaacggtt aagctcctta 900
gaaaaacaag gatcttgtaa tcctgtaaat gcaagtgggt tcaggccata caagagatgc 960
ctatcagaaa gagaagtaac atcatcattg acgctggtag cttcagatga aaagaaaagc 1020
caaagagcac gtatatgcta g 1041 <210> 16 <211> 346 <212> PRT
<213> Arabidopsis thaliana <400> 16
Met Ala Ala Glu Asp Arg Ser Glu Glu Leu Ser Ser Asn Val Glu Asn 10 15
Gly Ser Cys Asn Ser Asn Glu Gly Ile Asn Pro Glu Thr Ser Ser His 20 25 30
Trp Ile Glu Asn Val Val Lys Val Arg Lys Pro Tyr Thr Val Thr Lys 35 40 45
Gln Arg Glu Lys Trp Ser Glu Glu Glu His Asp Arg Phe Leu Glu Ala 50 55 60
Ile Lys Leu Tyr Gly Arg Gly Trp Arg Gln Ile Gln Glu His Ile Gly 65 70 75 80
Thr Lys Thr Ala Val Gln Ile Arg Ser His Ala Gln Lys Phe Phe Ser 85 90 95
Lys Met Ala Gln Glu Ala Asp Ser Arg Ser Glu Gly Ser Val Lys Ala 100 105 110
Ile Val Ile Pro Pro Pro Arg Pro Lys Arg Lys Pro Ala His Pro Tyr 115 120 125
Pro Arg Lys Ser Pro Val Pro Tyr Thr Gln Ser Pro Pro Pro Asn Leu 130 135 140
Ser Ala Met Glu Lys Gly Thr Lys Ser Pro Thr Ser Val Leu Ser Ser 145 150 155 160
Phe Gly Ser Glu Asp Gln Val Asn Arg Cys Ser Ser Pro Asn Ser Cys 165 170 175
Thr Ser Asp Ile Gln Ser Ile Gly Ala Thr Ser Ile Asp Lys Lys Asn 180 185 190
Asn Tyr Thr Thr Ser Lys Gln Pro Phe Lys Asp Asp Ser Asp Ile Gly 195 200 205
Ser Thr Pro Ile Ser Ser Ile Thr Leu Phe Gly Lys Ile Val Leu Val 210 215 220 Ala Glu Glu Ser His Lys Pro Ser Ser Tyr Asn Asp Asp Asp Leu Lys 225 230 235 240
Gln Met Thr Cys Gln Glu Asn His Tyr Ser Gly Met Leu Val Asp Thr 245 250 255
Asn Leu Ser Leu Gly Val Trp Glu Thr Phe Cys Thr Gly Ser Asn Ala 260 265 270
Phe Gly Ser Val Thr Glu Ala Ser Glu Asn Leu Glu Lys Ser Ala Glu 275 280 285
Pro Ile Ser Ser Ser Trp Lys Arg Leu Ser Ser Leu Glu Lys Gln Gly 290 295 300
Ser Cys Asn Pro Val Asn Ala Ser Gly Phe Arg Pro Tyr Lys Arg Cys 305 310 315 320
Leu Ser Glu Arg Glu Val Thr Ser Ser Leu Thr Leu Val Ala Ser Asp 325 330 335
Glu Lys Lys Ser Gln Arg Ala Arg Ile Cys 340 345
<210> 17
<211> 889
<212> DNA
<213> Arabidopsis thaliana
<400> 17
atggccgccg ttagtagttc gtcggagacc ggagactgcg gcgttacggg aaagagagat 60 gagatcatgt tgttcggagt tagagtcgtg gttgatccga tgagaaagtg tgtgagtttg 120 aacaatctct ctgattatga aaagtcttct ccggaggatg agatccctaa gatagtcacc 180 gccggagctg gagatggtga agataagaac gaaacggatg cgacggtgat tgtcgctgac 240 ggttacgcct ccgccaatga cgctgtccag atttcgtctt cttccggcgg gaggaaacga 300 ggggttccat ggacagagaa cgagcataag aggttcttga ttgggttgca gaaagtagga 360 aaaggagatt ggaaaggaat atcaagaaac tttgtgaaga gtaggactcc tactcaagta 420 gctagtcatg ctcagaaata cttcctccga cgaaccaacc tcaaccgtcg ccgaagaaga 480 tctagccttt ttgatatcac tactgagacg gttacagaaa tggccatgga gcaagatcct 540 a c tcaggaga actcaccact acctgaaacc aacatcagct ctggacagca agcgatgcaa 600 gtttttactg acgtgccgac aaaaactgag aatgcaccag agacatttca tctcaacgat 660 ccatatctgg ttccagtaac cttccaagca aagccaacat tcaatctaaa cacagatgct 720 gctccacttt ctctcaacct ttgtctggca tcctcattta atcttaacga gcaacccaac 780 tcaagacact cggctttcac gatgatgcca agcttcagcg atggagatag caatagcagc atcatcagag ttgcttagag cttaaaccca aggtgaatct acaagacct
<210> 18 <211> 285 <212> PRT
<213> Arabidopsis thaliana <400> 18
Met Ala Ala Val Ser Ser Ser Ser Glu Thr Gly Asp Cys Gly Val Thr 10 15
Gly Lys Arg Asp Glu Ile Met Leu Phe Gly Val Arg Val Val Val Asp 20 25 30
Pro Met Arg Lys Cys Val Ser Leu Asn Asn Leu Ser Asp Tyr Glu Lys 35 40 45
Ser Ser Pro Glu Asp Glu Ile Pro Lys Ile Val Thr Ala Gly Ala Gly 50 55 60
Asp Gly Glu Asp Lys Asn Glu Thr Asp Ala Thr Val Ile Val Ala Asp 65 70 75 80
Gly Tyr Ala Ser Ala Asn Asp Ala Val Gln Ile Ser Ser Ser Ser Gly 85 90 95
Gly Arg Lys Arg Gly Val Pro Trp Thr Glu Asn Glu His Lys Arg Phe 100 105 110
Leu Ile Gly Leu Gln Lys Val Gly Lys Gly Asp Trp Lys Gly Ile Ser 115 120 125
Arg Asn Phe Val Lys Ser Arg Thr Pro Thr Gln Val Ala Ser His Ala 130 135 140
Gln Lys Tyr Phe Leu Arg Arg Thr Asn Leu Asn Arg Arg Arg Arg Arg 145 150 155 160
Ser Ser Leu Phe Asp Ile Thr Thr Glu Thr Val Thr Glu Met Ala Met 165 170 175
Glu Gln Asp Pro Thr Gln Glu Asn Ser Pro Leu Pro Glu Thr Asn Ile 180 185 190
840
889
Ser Ser Gly Gln Gln Ala Met Gln Val Phe Thr Asp Val Pro Thr Lys 195 200 205 Thr Glu Asn Ala Pro Glu Thr Phe His Leu Asn Asp Pro Tyr Leu Val 210 215 220
Pro Val Thr Phe Gln Ala Lys Pro Thr Phe Asn Leu Asn Thr Asp Ala 225 230 235 240
Ala Pro Leu Ser Leu Asn Leu Cys Leu Ala Ser Ser Phe Asn Leu Asn 245 250 255
Glu Gln Pro Asn Ser Arg His Ser Ala Phe Thr Met Met Pro Ser Phe 260 265 270
Ser Asp Gly Asp Ser Asn Ser Ser Ile Ile Arg Val Ala 275 280 285
<210> 19
<211> 786
<212> DNA
<213> Arabidopsis thaliana
<400> 19
atgtcacgta gttgctcaca gtgtggaaac aacggccaca actctcgcac atgtccgacg 60 gacataacta ccaccggtga caacaacgac aaaggcggcg gggagaaagc catcatgctt 120 tttggcgtcc gcgtcacgga agcttcatca tcttgtttta gaaaaagtgt tagtatgaac 180 aatctctctc aattcgatca aactcctgat cccaacccaa ccgatgacgg tggttacgct 240 tcagacgacg tcgttcacgc ctccggtaga aaccgtgaac gcaaacgagg aactccatgg 300 acagaggaag aacatagatt gtttcttact ggattgcata aagttggaaa aggtgattgg 360 agaggaatct ctagaaactt tgttaaaact cgaacaccta ctcaggtagc gagtcatgct 420 cagaaatatt ttctccggcg gactaatcag aatcgtcgtc gtcgtagatc aagcctcttc 480 gatatcactc ccgattcgtt tataggatca tcaaaagaag agaatcagtt acagactcca 540 ttggagctaa tccgtccagt tccgattcct attccgattc caccgtcgcg gaagatggct 600 gatttgaatc ttaacaagaa aaaaactcca gcgacaacgg agatgtttcc gctgtcgctg 660 aatttgcaga ggccgtcttc gtcgacatcg tcatcgtcca atgaacagaa ggcacgtggc 720 tcacgtgcct cctcggggtt cgaggcgatg tcgagtaatg gagatagtat aatgggagtg 780 gcttga 786 <210> 20
<211> 261
<212> PRT
<213> Arabidopsis thaliana
<400> 20 Met Ser Arg Ser Cys Ser Gln Cys Gly Asn Asn Gly His Asn Ser Arg 10 15
Thr Cys Pro Thr Asp Ile Thr Thr Thr Gly Asp Asn Asn Asp Lys Gly 20 25 30
Gly Gly Glu Lys Ala Ile Met Leu Phe Gly Val Arg Val Thr Glu Ala 35 40 45
Ser Ser Ser Cys Phe Arg Lys Ser Val Ser Met Asn Asn Leu Ser Gln 50 55 60
Phe Asp Gln Thr Pro Asp Pro Asn Pro Thr Asp Asp Gly Gly Tyr Ala 65 70 75 80
Ser Asp Asp Val Val His Ala Ser Gly Arg Asn Arg Glu Arg Lys Arg 85 90 95
Gly Thr Pro Trp Thr Glu Glu Glu His Arg Leu Phe Leu Thr Gly Leu 100 105 110
His Lys Val Gly Lys Gly Asp Trp Arg Gly Ile Ser Arg Asn Phe Val 115 120 125
Lys Thr Arg Thr Pro Thr Gln Val Ala Ser His Ala Gln Lys Tyr Phe 130 135 140
Leu Arg Arg Thr Asn Gln Asn Arg Arg Arg Arg Arg Ser Ser Leu Phe 145 150 155 160
Asp Ile Thr Pro Asp Ser Phe Ile Gly Ser Ser Lys Glu Glu Asn Gln 165 170 175
Leu Gln Thr Pro Leu Glu Leu Ile Arg Pro Val Pro Ile Pro Ile Pro 180 185 190
Ile Pro Pro Ser Arg Lys Met Ala Asp Leu Asn Leu Asn Lys Lys Lys 195 200 205
Thr Pro Ala Thr Thr Glu Met Phe Pro Leu Ser Leu Asn Leu Gln Arg 210 215 220
Pro Ser Ser Ser Thr Ser Ser Ser Ser Asn Glu Gln Lys Ala Arg Gly 225 230 235 240
Ser Arg Ala Ser Ser Gly Phe Glu Ala Met Ser Ser Asn Gly Asp Ser 245 250 255 Ile Met Gly Val Ala 260
<210> 21
<211> 798
<212> DNA
<213> Arabidopsis thaliana
<400> 21
atggccgacg gtagtactag ttcttcggag tccactaccg cctgcgctgg aagcggcaca 60 agaagagaga ttatgctgtt cggagtcagg gttgtgcttg acccgatgag aaagtgcgtg 120 agtttgaaca atctgtctga ctatgaacag acggcggaga ctccaaagat cgacggcgaa 180 gatagagatg aacaagatat gaacaaaacc ccggccggtt acgcctcggc ggatgaagct 240 cttcccatgt cttcttctaa cggcaaaatc gagaggaaac gaggagttcc atggactgaa 300 gaagaacaca agctgttctt gcttgggctg cagagagtcg gtaaaggaga ttggaaagga 360 atatcaagaa actttgtcaa gaccagaacc tctacacaag ttgctagtca tgctcagaaa 420 tacttcctca ggcgaagtaa tcttaaccgt cgccgccgaa gatctagcct ttttgacatg 480 actactgata cggtcatacc catggaagaa gatcaccaag tgcttataca ggagaacaca 540 tctcaatcat cttctcctgt accggaaatc aacaacttct ctatacatcc ggttatgcaa 600 gtctttcccg agttcccggt accaacaggg aatcaatcat acggacagct tacttcatcg 660 aatctcatca atttggttcc attaactttt cagtcaagtc cagcaccgct ttctctcaac 720 ctctcactag cttcatctaa tcttaatgaa ccatctcctt caatgcatcc agcattcaac 780 acgattggag tcgcttag 798 <210> 22 <211> 265 <212> PRT
<213> Arabidopsis thaliana <400> 22
Met Ala Asp Gly Ser Thr Ser Ser Ser Glu Ser Thr Thr Ala Cys Ala 10 15
Gly Ser Gly Thr Arg Arg Glu Ile Met Leu Phe Gly Val Arg Val Val 20 25 30
Leu Asp Pro Met Arg Lys Cys Val Ser Leu Asn Asn Leu Ser Asp Tyr 35 40 45
Glu Gln Thr Ala Glu Thr Pro Lys Ile Asp Gly Glu Asp Arg Asp Glu 50 55 60 Gln Asp Met Asn Lys Thr Pro Ala Gly Tyr Ala Ser Ala Asp Glu Ala 65 70 75 80
Leu Pro Met Ser Ser Ser Asn Gly Lys Ile Glu Arg Lys Arg Gly Val 85 90 95
Pro Trp Thr Glu Glu Glu His Lys Leu Phe Leu Leu Gly Leu Gln Arg 100 105 110
Val Gly Lys Gly Asp Trp Lys Gly Ile Ser Arg Asn Phe Val Lys Thr 115 120 125
Arg Thr Ser Thr Gln Val Ala Ser His Ala Gln Lys Tyr Phe Leu Arg 130 135 140
Arg Ser Asn Leu Asn Arg Arg Arg Arg Arg Ser Ser Leu Phe Asp Met 145 150 155 160
Thr Thr Asp Thr Val Ile Pro Met Glu Glu Asp His Gln Val Leu Ile 165 170 175
Gln Glu Asn Thr Ser Gln Ser Ser Ser Pro Val Pro Glu Ile Asn Asn 180 185 190
Phe Ser Ile His Pro Val Met Gln Val Phe Pro Glu Phe Pro Val Pro 195 200 205
Thr Gly Asn Gln Ser Tyr Gly Gln Leu Thr Ser Ser Asn Leu Ile Asn 210 215 220
Leu Val Pro Leu Thr Phe Gln Ser Ser Pro Ala Pro Leu Ser Leu Asn 225 230 235 240
Leu Ser Leu Ala Ser Ser Asn Leu Asn Glu Pro Ser Pro Ser Met His 245 250 255
Pro Ala Phe Asn Thr Ile Gly Val Ala 260 265
<210> 23 <211> 1011 <212> DNA
<213> Arabidopsis thaliana <400> 23
atggtaatga tgattattat atataocgaa cccgaaatca gcttgtttcc acttcaggat cgaagtgagg aactaagcag caatgtagaa aatggaagtt gcaattccaa tgaaggaatt
60
120 aatcctgaaa ccagcagtca ttggattgaa aacgttgtca aggttaggaa accgtacaca 180 gtaactaagc agagagagaa gtggagtgag gaagagcatg ataggtttct tgaagctatc 240 aagctttatg gtcgtgggtg gcgtcaaatc caagaacaca taggtacaaa aaccgctgta 300 cagatacgaa gccatgctca aaagttcttc tccaagatgg ctcaggaagc tgacagtaga 360 agtgaaggat cggttaaagc gattgtgatc ccgcctcctc gtccaaagag aaaaccggca 420 catccttatc ctcggaaatc gcctgttcca tatactcagt ctcctccacc aaatttgtca 480 gctatggaga aaggaaccaa gtctccaacc tcagtgttat catcgtttgg ttcagaggat 540 caaaataact acacaacatc caagcaacct ttcaaagatg attctgacat tggttcaaca 600 cccatttcaa gcattactct tttcgggaag attgtccttg tcgcggaaga atctcacaaa 660 ccatcctctt acaatgatga tgatcttaaa caaatgacgt gtcaggagaa tcactactca 720 gggatgctag ttgacactaa tttatctctt ggtgtatggg aaacgttttg tactggttct 780 aatgcatttg gctcggttac agaagcatct gagaacttgg agaagagtgc agagccgata 840 agttcttcat ggaaacggtt aagctcctta gaaaaacaag gatcttgtaa tcctgtaaat 900 gcaagtgggt tcaggccata caagagatgc ctatcagaaa gagaagtaac atcatcattg 960 acgctggtag cttcagatga aaagaaaagc caaagagcac gtatatgcta g 1011 <210> 24 <211> 336 <212> PRT
<213> Arabidopsis thaliana <400> 24
Met Val Met Met Ile Ile Ile Tyr Thr Glu Pro Glu Ile Ser Leu Phe 10 15
Pro Leu Gln Asp Arg Ser Glu Glu Leu Ser Ser Asn Val Glu Asn Gly 20 25 30
Ser Cys Asn Ser Asn Glu Gly Ile Asn Pro Glu Thr Ser Ser His Trp 35 40 45
Ile Glu Asn Val Val Lys Val Arg Lys Pro Tyr Thr Val Thr Lys Gln 50 55 60
Arg Glu Lys Trp Ser Glu Glu Glu His Asp Arg Phe Leu Glu Ala Ile 65 70 75 80
Lys Leu Tyr Gly Arg Gly Trp Arg Gln Ile Gln Glu His Ile Gly Thr 85 90 95
Lys Thr Ala Val Gln Ile Arg Ser His Ala Gln Lys Phe Phe Ser Lys 100 105 110
Met Ala Gln Glu Ala Asp Ser Arg Ser Glu Gly Ser Val Lys Ala Ile 115 120 125
Val Ile Pro Pro Pro Arg Pro Lys Arg Lys Pro Ala His Pro Tyr Pro 130 135 140
Arg Lys Ser Pro Val Pro Tyr Thr Gln Ser Pro Pro Pro Asn Leu Ser 145 150 155 160
Ala Met Glu Lys Gly Thr Lys Ser Pro Thr Ser Val Leu Ser Ser Phe 165 170 175
Gly Ser Glu Asp Gln Asn Asn Tyr Thr Thr Ser Lys Gln Pro Phe Lys 180 185 190
Asp Asp Ser Asp Ile Gly Ser Thr Pro Ile Ser Ser Ile Thr Leu Phe 195 200 205
Gly Lys Ile Val Leu Val Ala Glu Glu Ser His Lys Pro Ser Ser Tyr 210 215 220
Asn Asp Asp Asp Leu Lys Gln Met Thr Cys Gln Glu Asn His Tyr Ser 225 230 235 240
Gly Met Leu Val Asp Thr Asn Leu Ser Leu Gly Val Trp Glu Thr Phe 245 250 255
Cys Thr Gly Ser Asn Ala Phe Gly Ser Val Thr Glu Ala Ser Glu Asn 260 265 270
Leu Glu Lys Ser Ala Glu Pro Ile Ser Ser Ser Trp Lys Arg Leu Ser 275 280 285
Ser Leu Glu Lys Gln Gly Ser Cys Asn Pro Val Asn Ala Ser Gly Phe 290 295 300
Arg Pro Tyr Lys Arg Cys Leu Ser Glu Arg Glu Val Thr Ser Ser Leu
315 320
330 335
305 310 Thr Leu Val Ala Ser Asp Glu 325 <210> 25 <211> 864 <212> DNA <213> Arabidopsis thaliana <400> 25
atggatgcag caattccgat ttggaagagg gacgatgata agcgttttga gttagctctg 60 gttcgattcc ctgctgaggg ttcgccggat tttttagaga atatcgctca gtttctgcag 120 aaaccgttaa aggaggtgta ctcctactac caagccttgg tcgatgatgt tacgctgatc 180 gaatcgggta agtatccttt gcccaagtac ccggaagatg attacgtgtc actgccggaa 240 gcgactaagt ctaaaaccca gggcacgggg aaaaagaagg gaataccttg gtcaccagaa 300 gaacacagat tgtttttgga tggactaaac aagtatggga aaggagattg gaagagcata 360 tcgagggaat gtgtgacgtc aaggagcccg atgcaagtgg caagccatgc tcagaagtat 420 ttcttaaggc aaaaaaataa gaaggggaaa cgcttcagta tccatgatat gactctggga 480 gatgccgaaa atgtaaccgt ccctgtatcc aacttgaatt ctatgggcca gcagccacat 540 tttgatgacc aaagtcctcc ggatcattat caagactact tctcccagag caatgtaacc 600 atccctggat gcaacatgca ctttatgggc cagcaaccac gttttggtga ccaaattcct 660 ccgggtgaat atcaccccta ctcccgggac aatgtaaccg tcactggatc caacttgaat 720 tctattggcc agcagccaca ttttaatgac caaatttctc cggatcaata tggccgctac 780 ttgcaggaaa acttcgggtt tttcgatgat gatggtgaag atgatgggag tttagcaagc 840 tttcaacaac tatacaaggc ttaa 864 <210> 26 <211> 287 <212> PRT
<213> Arabidopsis thaliana <400> 26
Met Asp Ala Ala Ile Pro Ile Trp Lys Arg Asp Asp Asp Lys Arg Phe 10 15
Glu Leu Ala Leu Val Arg Phe Pro Ala Glu Gly Ser Pro Asp Phe Leu 20 25 30
Glu Asn Ile Ala Gln Phe Leu Gln Lys Pro Leu Lys Glu Val Tyr Ser 35 40 45
Tyr Tyr Gln Ala Leu Val Asp Asp Val Thr Leu Ile Glu Ser Gly Lys 50 55 60
Tyr Pro Leu Pro Lys Tyr Pro Glu Asp Asp Tyr Val Ser Leu Pro Glu 65 70 75 80
Ala Thr Lys Ser Lys Thr Gln Gly Thr Gly Lys Lys Lys Gly Ile Pro 85 90 95 Trp Ser Pro Glu Glu His Arg Leu Phe Leu Asp Gly Leu Asn Lys Tyr 100 105 110
Gly Lys Gly Asp Trp Lys Ser Ile Ser Arg Glu Cys Val Thr Ser Arg 115 120 125
Ser Pro Met Gln Val Ala Ser His Ala Gln Lys Tyr Phe Leu Arg Gln 130 135 140
Lys Asn Lys Lys Gly Lys Arg Phe Ser Ile His Asp Met Thr Leu Gly 145 150 155 160
Asp Ala Glu Asn Val Thr Val Pro Val Ser Asn Leu Asn Ser Met Gly 165 170 175
Gln Gln Pro His Phe Asp Asp Gln Ser Pro Pro Asp His Tyr Gln Asp 180 185 190
Tyr Phe Ser Gln Ser Asn Val Thr Ile Pro Gly Cys Asn Met His Phe 195 200 205
Met Gly Gln Gln Pro Arg Phe Gly Asp Gln Ile Pro Pro Gly Glu Tyr 210 215 220
His Pro Tyr Ser Arg Asp Asn Val Thr Val Thr Gly Ser Asn Leu Asn 225 230 235 240
Ser Ile Gly Gln Gln Pro His Phe Asn Asp Gln Ile Ser Pro Asp Gln 245 250 255
Tyr Gly Arg Tyr Leu Gln Glu Asn Phe Gly Phe Phe Asp Asp Asp Gly 260 265 270
Glu Asp Asp Gly Ser Leu Ala Ser Phe Gln Gln Leu Tyr Lys Ala 275 280 285
<210> 27 <211> 621 <212> DNA
<213> Arabidopsis thaliana <400> 27
atggcttcga gtccacgctg gacggaggac gacaacaggc gttttaagtc agctctgtcg 60
caattccctc cggataacaa gcgtttggtg aatgtcgccc agcatctgcc gaaacctttg 120 gaggaggtga agtactacta cgaaaagttg gtcaacgatg tttatctgcc gaaaccttta 180
gagaatgtca cccagcatct gcagaaacct atggaaatgg aggagatgaa gtacatgtac 240 gaaaagatgg ccaacgatgt taatcagatg cccgagtacg taccactggc ggaatcgagt 300 cagtccaaac gcaggaagaa ggatacgcca aatccttgga cagaagagga acacagattg 360 tttctgcaag gattgaaaaa gtatggggaa ggagcttcga cgttgacatc aacgaatttt 420 gtgaagacaa agactccacg gcaagtgtca agccatgcac agtattacaa aaggcaaaaa 480 tcggacaata agaaggagaa acgccggagt atttttgaca taactttgga gtctaccgag 540 ggcaatccag attctggaaa tcagaaccct ccggatgatg atgatccgtc ccaaggtcaa 600 ggcacttgtc ttggagttta g 621 <210> 28 <211> 206 <212> PRT
<213> Arabidopsis thaliana <400> 28
Met Ala Ser Ser Pro Arg Trp Thr Glu Asp Asp Asn Arg Arg Phe Lys 10 15
Ser Ala Leu Ser Gln Phe Pro Pro Asp Asn Lys Arg Leu Val Asn Val 20 25 30
Ala Gln His Leu Pro Lys Pro Leu Glu Glu Val Lys Tyr Tyr Tyr Glu 35 40 45
Lys Leu Val Asn Asp Val Tyr Leu Pro Lys Pro Leu Glu Asn Val Thr 50 55 60
Gln His Leu Gln Lys Pro Met Glu Met Glu Glu Met Lys Tyr Met Tyr 65 70 75 80
Glu Lys Met Ala Asn Asp Val Asn Gln Met Pro Glu Tyr Val Pro Leu 85 90 95
Ala Glu Ser Ser Gln Ser Lys Arg Arg Lys Lys Asp Thr Pro Asn Pro 100 105 110
Trp Thr Glu Glu Glu His Arg Leu Phe Leu Gln Gly Leu Lys Lys Tyr 115 120 125
Gly Glu Gly Ala Ser Thr Leu Thr Ser Thr Asn Phe Val Lys Thr Lys 130 135 140
Thr Pro Arg Gln Val Ser Ser His Ala Gln Tyr Tyr Lys Arg Gln Lys 145 150 155 160
Ser Asp Asn Lys Lys Glu Lys Arg Arg Ser Ile Phe Asp Ile Thr Leu 165 170 175
Glu Ser Thr Glu Gly Asn Pro Asp Ser Gly Asn Gln Asn Pro Pro Asp 180 185 190
Asp Asp Asp Pro Ser Gln Gly Gln Gly Thr Cys Leu Gly Val 195 200 205
<210> 29
<211> 1164
<212> DNA
<213> Arabidopsis thaliana
<400> 29
atgactcgtc ggtgttcgca ttgtagcaac aatgggcaca attcacgcac gtgtccaacg 60 cgtggtggtg gcacgtgcgg tggaagtggc ggaggaggag gaggtggtgg tggaggaggg 120 tctggttcct cctccgccat gaagttattt ggtgtgaggt taa cgga tgg ctcgattatt 180 aaaaagagtg cgagtatggg taatctctcg gcattggctg ttgcggcggc ggcggcaacg 240 caccaccgtt tatctccgtc gtctcctctg gcgacgtcaa atcttaatga ttcgccgtta 300 tcggatcatg cccgatactc taatttgcat cataatgaag ggtatttatc tgatgatcct 360 gctcatggtt ctgggtctag tcaccgtcgt ggtgagagga agagaggtgt tccttggact 420 gaagaggaac atagactatt cttagtcggt cttcagaaac tcgggaaagg agattggcgc 480 ggtatttcga gaaactatgt aacgtcaaga actcctacac aagtggctag tcatgctcaa 540 aagtatttta ttcgacatac tagttcaagc cgcaggaaaa gacggtctag cctcttcgac 600 atggttacag atgagatggt aaccgattca tcgccaacac aggaagagca gaccttaaac 660 ggttcctctc caagcaagga acctgaaaag aaaagctacc ttccttcact tgagctctca 720 ctcaataata ccacagaagc tgaagaggtc gtagccacgg cgccacgaca ggaaaaatct 780 caagaagcta tagaaccatc aaatggtgtt tcaccaatgc tagtcccggg tggcttcttt 840 cctccttgtt ttccagtgac ttacacgatt tggctccctg cgtcacttca cggaacagaa 900 catgccttaa acgctgagac ttcttctcag cagcatcagg tcctaaaacc aaaacctgga 960 tttgctaaag aacgtgtgaa catggacgag ttggtcggta tgtctcagct tagcatagga 1020 atggcgacaa gacacgaaac cgaaacttcc ccttccccgc tatctttgag actagagccc 1080 tcaaggccat cagcgtttca ctcgaatggc tcggttaatg gtgcagattt gagtaaaggc 1140 aacagcgcga ttcaggctat ctaa 1164 <210> 30
<211> 387
<212> PRT
<213> Arabidopsis thaliana <400> 30
Met Thr Arg Arg Cys Ser His Cys Ser Asn Asn Gly His Asn Ser Arg 10 15
Thr Cys Pro Thr Arg Gly Gly Gly Thr Cys Gly Gly Ser Gly Gly Gly 20 25 30
Gly Gly Gly Gly Gly Gly Gly Gly Ser Gly Ser Ser Ser Ala Met Lys 35 40 45
Leu Phe Gly Val Arg Leu Thr Asp Gly Ser Ile Ile Lys Lys Ser Ala 50 55 60
Ser Met Gly Asn Leu Ser Ala Leu Ala Val Ala Ala Ala Ala Ala Thr 65 70 75 80
His His Arg Leu Ser Pro Ser Ser Pro Leu Ala Thr Ser Asn Leu Asn 85 90 95
Asp Ser Pro Leu Ser Asp His Ala Arg Tyr Ser Asn Leu His His Asn 100 105 110
Glu Gly Tyr Leu Ser Asp Asp Pro Ala His Gly Ser Gly Ser Ser His 115 120 125
Arg Arg Gly Glu Arg Lys Arg Gly Val Pro Trp Thr Glu Glu Glu His 130 135 140
Arg Leu Phe Leu Val Gly Leu Gln Lys Leu Gly Lys Gly Asp Trp Arg 145 150 155 160
Gly Ile Ser Arg Asn Tyr Val Thr Ser Arg Thr Pro Thr Gln Val Ala 165 170 175
Ser His Ala Gln Lys Tyr Phe Ile Arg His Thr Ser Ser Ser Arg Arg 180 185 190
Lys Arg Arg Ser Ser Leu Phe Asp Met Val Thr Asp Glu Met Val Thr 195 200 205
Asp Ser Ser Pro Thr Gln Glu Glu Gln Thr Leu Asn Gly Ser Ser Pro 210 215 220
Ser Lys Glu Pro Glu Lys Lys Ser Tyr Leu Pro Ser Leu Glu Leu Ser 225 230 235 240
Leu Asn Asn Thr Thr Glu Ala Glu Glu Val Val Ala Thr Ala Pro Arg 245 250 255
Gln Glu Lys Ser Gln Glu Ala Xle Glu Pro Ser Asn Gly Val Ser Pro 260 265 270
Met Leu Val Pro Gly Gly Phe Phe Pro Pro Cys Phe Pro Val Thr Tyr 275 280 285
Thr Ile Tirp Leu Pro Ala Ser Leu His Gly Thr Glu His Ala Leu Asn 290 295 300
Ala Glu Thr Ser Ser Gln Gln His Gln Val Leu Lys Pro Lys Pro Gly 305 310 315 320
Phe Ala Lys Glu Arg Val Asn Met Asp Glu Leu Val Gly Met Ser Gln 325 330 335
Leu Ser Ile Gly Met Ala Thr Arg His Glu Thr Glu Thr Ser Pro Ser 340 345 350
Pro Leu Ser Leu Arg Leu Glu Pro Ser Arg Pro Ser Ala Phe His Ser 355 360 365
Asn Gly Ser Val Asn Gly Ala Asp Leu Ser Lys Gly Asn Ser Ala Ile 370 375 380
Gln Ala Ile 385
<210> 31
<211> 634
<212> DNA
<213> Arabidopsis thaliana
<400> 31
atggccgcgt ttccgcagtg gacaagggtc gatgacaaac gttttgagtt agctctgctt 60 caaatcccgg agggttcgcc gaattttata gagaatatcg cctattatct ccagaaaccg 120 gtgaaggagg tggagtacta ctactgcgcg ttggtccatg atattgagcg gatcgaatcg 180 ggtaagtatg ttttgcccaa atacccggaa gacgattacg tgaaactgac ggaagcaggt 240 gagtctaagg gcaatgggaa aaagacggga attccttggt cagaagagga acagaggttg 300 tttctggaag gactaaataa gtttgggaaa ggagac tgga agaacatatc gaggtattgt 360 gtgaagtcaa ggacctcgac gcaagtggca agccatgctc agaagtattt tgcaaggcaa 420 aagcaggaga gtacgaatac taaacgcccg agtattcatg acatgactct gggagttgcg 480 gtcaatgtcc ctggatccaa cttggagtct actggccagc aaccacattt tggtgatcaa 540 attccttcga atcaatatta tccctcccag gaaaactttc ggggttttga tcagcgatgg tgatgggtgt atggcaaact tatactacgc ttaa
<210> 32 <211> 200 <212> PRT
<213> Arabidopsis thaliana <400> 32
Met Ala Ala Phe Pro Gln Trp Thr Arg Val Asp Asp Lys Arg Phe Glu 10 15
Leu Ala Leu Leu Gln Ile Pro Glu Gly Ser Pro Asn Phe Ile Glu Asn 20 25 30
Ile Ala Tyr Tyr Leu Gln Lys Pro Val Lys Glu Val Glu Tyr Tyr Tyr 35 40 45
Cys Ala Leu Val His Asp Ile Glu Arg Ile Glu Ser Gly Lys Tyr Val 50 55 60
Leu Pro Lys Tyr Pro Glu Asp Asp Tyr Val Lys Leu Thr Glu Ala Gly 65 70 75 80
Glu Ser Lys Gly Asn Gly Lys Lys Thr Gly Ile Pro Trp Ser Glu Glu 85 90 95
Glu Gln Arg Leu Phe Leu Glu Gly Leu Asn Lys Phe Gly Lys Gly Asp 100 105 110
Trp Lys Asn Ile Ser Arg Tyr Cys Val Lys Ser Arg Thr Ser Thr Gln 115 120 125
Val Ala Ser His Ala Gln Lys Tyr Phe Ala Arg Gln Lys Gln Glu Ser 130 135 140
Thr Asn Thr Lys Arg Pro Ser Ile His Asp Met Thr Leu Gly Val Ala 145 150 155 160
Val Asn Val Pro Gly Ser Asn Leu Glu Ser Thr Gly Gln Gln Pro His 165 170 175
Phe Gly Asp Gln Ile Pro Ser Asn Gln Tyr Tyr Pro Ser Gln Glu Asn 180 185 190
600
634
Phe Arg Gly Phe Asp Gln Arg Trp 195 200 <210> 33
<211> 864
<212> DNA
<213> Arabidopsis thaliana
<400> 33
atggctatgc aggaacgttg tgagagttta tgttctgatg aacttatatc ttcctcagat 60 gccttttacc tcaagacaag aaagccttat accatcacta aacaaagaga gaaatggaca 120 gaagcagagc atgagaagtt tgtagaagca ttgaaactct atggcagagc ttggagacga 180 atcgaagaac atgttggaac aaaaaetgca gttcagattc gaagccatgc gcagaagttc 240 tttactaagg ttgctcgcga ttttggtgtt agctctgagt ccattgagat cccgcctcca 300 aggccaaaga gaaagccgat gcatccttac cctagaaagc ttgtgattcc tgatgcaaaa 360 gagatggtat acgctgaact aaccggatcc aagctgattc aggatgaaga taaccgatct 420 ccaacatcgg ttttatcagc tcatggctca gatggattag gttccattgg ttcaaattca 480 cctaactctt cttcagctga gttatcatct cacacagagg aatcattgtc tctagaagca 540 gagaccaaac agagccttaa gctctttgga aaaacttttg tagttggtga ttacaactct 600 tcaatgagtt gtgatgatte tgaagatggc aagaagaagc tatactcaga aacacagtct 660 cttcaatgtt Cttettetae ttcagaagac gctgaaacag aagtggtagt gtcggagttc 720 aaaagaagtg agagatcagc tttctctcag ttaaaatcgt cggtgactga gatgaacaac 780 atgagagggt tcatgcctta caaaaagaga gtaaaggtgg aagaaaacat tgacaatgta 840 aaattatcat atcetttgtg gtga 864 <210> 34 <211> 287 <212> PRT
<213> Arabidopsis thaliana <400> 34
Met Ala Met Gln Glu Arg Cys Glu Ser Leu Cys Ser Asp Glu Leu Ile 10 15
Ser Ser Ser Asp Ala Phe Tyr Leu Lys Thr Arg Lys Pro Tyr Thr Ile 20 25 30
Thr Lys Gln Arg Glu Lys Trp Thr Glu Ala Glu His Glu Lys Phe Val 35 40 45
Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Arg Arg Ile Glu Glu His 50 55 60
Val Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His Ala Gln Lys Phe 65 70 75 80 Phe Thr Lys Val Ala Arg Asp Phe Gly Val Ser Ser Glu Ser Ile Glu 85 90 95
Ile Pro Pro Pro Arg Pro Lys Arg Lys Pro Met His Pro Tyr Pro Arg 100 105 110
Lys Leu Val Ile Pro Asp Ala Lys Glu Met Val Tyr Ala Glu Leu Thr 115 120 125
Gly Ser Lys Leu Ile Gln Asp Glu Asp Asn Arg Ser Pro Thr Ser Val 130 135 140
Leu Ser Ala His Gly Ser Asp Gly Leu Gly Ser Ile Gly Ser Asn Ser 145 150 155 160
Pro Asn Ser Ser Ser Ala Glu Leu Ser Ser His Thr Glu Glu Ser Leu 165 170 175
Ser Leu Glu Ala Glu Thr Lys Gln Ser Leu Lys Leu Phe Gly Lys Thr 180 185 190
Phe Val Val Gly Asp Tyr Asn Ser Ser Met Ser Cys Asp Asp Ser Glu 195 200 205
Asp Gly Lys Lys Lys Leu Tyr Ser Glu Thr Gln Ser Leu Gln Cys Ser 210 215 220
Ser Ser Thr Ser Glu Asp Ala Glu Thr Glu Val Val Val Ser Glu Phe 225 230 235 240
Lys Arg Ser Glu Arg Ser Ala Phe Ser Gln Leu Lys Ser Ser Val Thr 245 250 255
Glu Met Asn Asn Met Arg Gly Phe Met Pro Tyr Lys Lys Arg Val Lys 260 265 270
Val Glu Glu Asn Ile Asp Asn Val Lys Leu Ser Tyr Pro Leu Trp 275 280 285
<210> 35 <211> 1098 <212> DNA
<213> Arabidopsis thaliana <400> 35
atgactcgtc gatgttctca ctgoaatcac aatggccaca actctcggac ttgtcccaat cgcggcgtga agctctttgg tgttcggctc accgaaggtt cgatccggaa aagtgcaagt
60
120 atgggtaatc ttagccatta cacgggttct ggatcgggtg ggcatggaac cgggtccaac 180 actccgggtt ctccgggtga tgtccctgac catgtcgctg gtgatggtta cgcttctgag 240 gatttcgttg ctggctcttc ctctagccgc gagagaaaga aaggaactcc atggacagag 300 gaagaacaca ggatgttctt attaggttta cagaagctgg gtaaaggtga ttggagaggt 360 atctcaagaa actatgtgac cactaggaca cctacacaag ttgctagcca tgctcagaag 420 tatttcatca gacaatccaa tgtctctcgt cgcaaaagac gttctagtct ctttgatatg 480 gttcctgatg aggttggaga tattcccatg gatttgcaag aaccagagga agataatatt 540 cctgtggaaa ctgaaatgca aggtgctgac tctattcatc agacacttgc tcctagctca 600 cttcacgcac cgtcaatctt ggaaatcgaa gaatgtgaat caatggactc cacaaactct 660 accaccgggg aaccaaccgc aactgccgct gctgcttctt cttcttccag actagaagaa 720 accacacaac tgcaatcaca actgcaaccg cagccgcaac tacctggctc attccccata 780 ctatatccga cctacttttc accatattac ccgtttccat tcccaatatg gcctgctggt 840 tatgttcctg aaccacccaa gaaagaggaa actcatgaaa ttctcagacc aactgctgtg 900 cactcgaaag ctcctatcaa tgttgacgag cttcttggta tgtctaagct cagccttgca 960 gagtccaaca aacatggaga atccgatcag tctctttcat tgaagctagg tggcgggtca 1020 tcttcaagac aatcagcatt tcacccgaat cctagctctg atagttcaga catcaaaagc 1080 gtgatacacg ctttataa 1098 <210> 36 <211> 365 <212> PRT
<213> Arabidopsis thaliana <400> 36
Met Thr Arg Arg Cys Ser His Cys Asn His Asn Gly His Asn Ser Arg 10 15
Thr Cys Pro Asn Arg Gly Val Lys Leu Phe Gly Val Arg Leu Thr Glu 20 25 30
Gly Ser Ile Arg Lys Ser Ala Ser Met Gly Asn Leu Ser His Tyr Thr 35 40 45
Gly Ser Gly Ser Gly Gly His Gly Thr Gly Ser Asn Thr Pro Gly Ser 50 55 60
Pro Gly Asp Val Pro Asp His Val Ala Gly Asp Gly Tyr Ala Ser Glu 65 70 75 80 Asp Phe Val Ala Gly Ser Ser Ser Ser Arg Glu Arg Lys Lys Gly Thr 85 90 95
Pro Trp Thr Glu Glu Glu His Arg Met Phe Leu Leu Gly Leu Gln Lys 100 105 110
Leu Gly Lys Gly Asp Trp Arg Gly Ile Ser Arg Asn Tyr Val Thr Thr 115 120 125
Arg Thr Pro Thr Gln Val Ala Ser His Ala Gln Lys Tyr Phe Ile Arg 130 135 140
Gln Ser Asn Val Ser Arg Arg Lys Arg Arg Ser Ser Leu Phe Asp Met 145 150 155 160
Val Pro Asp Glu Val Gly Asp Ile Pro Met Asp Leu Gln Glu Pro Glu 165 170 175
Glu Asp Asn Ile Pro Val Glu Thr Glu Met Gln Gly Ala Asp Ser Ile 180 185 190
His Gln Thr Leu Ala Pro Ser Ser Leu His Ala Pro Ser Ile Leu Glu 195 200 205
Ile Glu Glu Cys Glu Ser Met Asp Ser Thr Asn Ser Thr Thr Gly Glu 210 215 220
Pro Thr Ala Thr Ala Ala Ala Ala Ser Ser Ser Ser Arg Leu Glu Glu 225 230 235 240
Thr Thr Gln Leu Gln Ser Gln Leu Gln Pro Gln Pro Gln Leu Pro Gly 245 250 255
Ser Phe Pro Ile Leu Tyr Pro Thr Tyr Phe Ser Pro Tyr Tyr Pro Phe 260 265 270
Pro Phe Pro Ile Trp Pro Ala Gly Tyr Val Pro Glu Pro Pro Lys Lys 275 280 285
Glu Glu Thr His Glu Ile Leu Arg Pro Thr Ala Val His Ser Lys Ala 290 295 300
Pro Ile Asn Val Asp Glu Leu Leu Gly Met Ser Lys Leu Ser Leu Ala 305 310 315 320
Glu Ser Asn Lys His Gly Glu Ser Asp Gln Ser Leu Ser Leu Lys Leu 325 330 335 Gly Gly Gly Ser Ser Ser Arg Gln Ser Ala Phe His Pro Asn Pro Ser 340 345 350
Ser Asp Ser Ser Asp Ile Lys Ser Val Ile His Ala Leu 355 360 365
<210> 37
<211> 702
<212> DNA
<213> Arabidopsis thaliana
<400> 37
atgggcagaa gatgctcaca ctgtggaaac gtaggacata actcaagaac atgttcttct 60 taccaaacaa gagtagttag gctctttggt gttcatctag acaccacaag ctcttctccg 120 ccgcctcctc ctcctccctc gattttggcc gctgcaataa agaaaagttt cagcatggat 180 tgcttgccgg catgttcctc ctcttcctct tcctttgctg gttatctctc cgatggtctc 240 gcccataaaa cacctgaccg caaaaaaggg gttccatgga cggcggaaga gcaccggacg 300 tttctaattg gattagaaaa gcttggaaaa ggagattgga gaggaatctc tagaaacttc 360 gtcgtcacaa aatccccgac acaagtggca agtcatgctc aaaaatactt tctccggcaa 420 actaccactc tccatcacaa gagacgccgc accagcctct ttgatatggt ttcggccggc 480 aatgttgaag aaaatagtac tactaagagg atatgtaatg atcatattgg gtcgagctca 540 aaggttgttt ggaaacaagg attactcaat cctcgtcttg gatatccaga tccgaaagta 600 tcagtatccg gctcgggtaa ctccggtgga ctcgatcttg agctgaagct tgcgtccatt 660 caatctcctg aatcgaatat tagacctatt agcgttacgt ga 702 <210> 38 <211> 233 <212> PRT
<213> Arabidopsis thaliana <400> 38
Met Gly Arg Arg Cys Ser His Cys Gly Asn Val Gly His Asn Ser Arg 10 15
Thr Cys Ser Ser Tyr Gln Thr Arg Val Val Arg Leu Phe Gly Val His 20 25 30
Leu Asp Thr Thr Ser Ser Ser Pro Pro Pro Pro Pro Pro Pro Ser Ile 35 40 45
Leu Ala Ala Ala Ile Lys Lys Ser Phe Ser Met Asp Cys Leu Pro Ala 50 55 60 Cys Ser Ser Ser Ser Ser Ser Phe Ala Gly Tyr Leu Ser Asp Gly Leu 65 70 75 80
Ala His Lys Thr Pro Asp Arg Lys Lys Gly Val Pro Trp Thr Ala Glu 85 90 95
Glu His Arg Thr Phe Leu Ile Gly Leu Glu Lys Leu Gly Lys Gly Asp 100 105 110
Trp Arg Gly Ile Ser Arg Asn Phe Val Val Thr Lys Ser Pro Thr Gln 115 120 125
Val Ala Ser His Ala Gln Lys Tyr Phe Leu Arg Gln Thr Thr Thr Leu 130 135 140
His His Lys Arg Arg Arg Thr Ser Leu Phe Asp Met Val Ser Ala Gly 145 150 155 160
Asn Val Glu Glu Asn Ser Thr Thr Lys Arg Ile Cys Asn Asp His Ile 165 170 175
Gly Ser Ser Ser Lys Val Val Trp Lys Gln Gly Leu Leu Asn Pro Arg 180 185 190
Leu Gly Tyr Pro Asp Pro Lys Val Ser Val Ser Gly Ser Gly Asn Ser 195 200 205
Gly Gly Leu Asp Leu Glu Leu Lys Leu Ala Ser Ile Gln Ser Pro Glu 210 215 220
Ser Asn Ile Arg Pro Ile Ser Val Thr 225 230
<210> 39
<211> 954
<212> DNA
<213> Arabidopsis thaliana
<400> 39
atggtgaagg agacggtgac ggtggcgaaa acgtgctcac actgtggcca taatggccat 60 aacgcacgga cttgtctcaa cggcgttaat aaggcaagtg ttaaactgtt cggcgttaat 120 atatcgtctg atccgattag gccgcctgag gtaacggcgt taaggaagag tcttagtttg 180 ggaaaccttg atgctcttct cgctaacgat gaaagtaacg gtagcggtga tcctatcgcc 240 gccgttgatg ataccggtta tcattccgat ggtcagattc attccaagaa gggtaaaact 300 gctcatgaga agaaaaaggg gaagccatgg acggaagaag aacatcgtaa tttcttaatc 360 ggtttaaaca aac tcggaaa aggagattgg agaggcattg caaagagttt cgtgtcgaca 420 agaacaccaa cacaagtcgc aagtcatgct cagaaatatt ttattaggtt aaacgttaac 480 gacaagagaa aaagacgtgc tagtctcttt gacatctctc tcgaagatca gaaggagaaa 540 gagaggaact ctcaagatgc ttcaacaaag actccaccta aacaaccaat aaccggaatt 600 caacaaccgg tagtacaagg tcatactcaa accgagattt cgaacaggtt tcagaattta 660 tcaatggagt atatgccaat ctaccaaccc ataccacctt actacaactt tccacctatt 720 atgtaccatc caaattatcc aatgtactat gccaaccctc aagtaccggt taggtttgtt 780 catccttctg gtatacctgt tccaagacat ataccgattg gtttgcctct gtctcaaccg 840 agtgaagctt ctaatatgac aaataaagac ggtttggatc ttcatatcgg tttgcctcca 900 caagctactg gagcttctga cttgactggt catggcgtta ttcatgtgaa atga 954 <210> 40 <211> 317 <212> PRT
<213> Arabidopsis thaliana <400> 40
Met Val Lys Glu Thr Val Thr Val Ala Lys Thr Cys Ser His Cys Gly 10 15
His Asn Gly His Asn Ala Arg Thr Cys Leu Asn Gly Val Asn Lys Ala 20 25 30
Ser Val Lys Leu Phe Gly Val Asn Ile Ser Ser Asp Pro Ile Arg Pro 35 40 45
Pro Glu Val Thr Ala Leu Arg Lys Ser Leu Ser Leu Gly Asn Leu Asp 50 55 60
Ala Leu Leu Ala Asn Asp Glu Ser Asn Gly Ser Gly Asp Pro Ile Ala 65 70 75 80
Ala Val Asp Asp Thr Gly Tyr His Ser Asp Gly Gln Ile His Ser Lys 85 90 95
Lys Gly Lys Thr Ala His Glu Lys Lys Lys Gly Lys Pro Trp Thr Glu 100 105 110
Glu Glu His Arg Asn Phe Leu Ile Gly Leu Asn Lys Leu Gly Lys Gly 115 120 125
Asp Trp Arg Gly Ile Ala Lys Ser Phe Val Ser Thr Arg Thr Pro Thr 130 135 140 Gln Val Ala Ser His Ala Gln Lys Tyr Phe Ile Arg Leu Asn Val Asn 145 150 155 160
Asp Lys Arg Lys Arg Arg Ala Ser Leu Phe Asp Ile Ser Leu Glu Asp 165 170 175
Gln Lys Glu Lys Glu Arg Asn Ser Gln Asp Ala Ser Thr Lys Thr Pro 180 185 190
Pro Lys Gln Pro Ile Thr Gly Ile Gln Gln Pro Val Val Gln Gly His 195 200 205
Thr Gln Thr Glu Ile Ser Asn Arg Phe Gln Asn Leu Ser Met Glu Tyr 210 215 220
Met Pro Ile Tyr Gln Pro Ile Pro Pro Tyr Tyr Asn Phe Pro Pro Ile 225 230 235 240
Met Tyr His Pro Asn Tyr Pro Met Tyr Tyr Ala Asn Pro Gln Val Pro 245 250 255
Val Arg Phe Val His Pro Ser Gly Ile Pro Val Pro Arg His Ile Pro 260 265 270
Ile Gly Leu Pro Leu Ser Gln Pro Ser Glu Ala Ser Asn Met Thr Asn 275 280 285
Lys Asp Gly Leu Asp Leu His Ile Gly Leu Pro Pro Gln Ala Thr Gly 290 295 300
Ala Ser Asp Leu Thr Gly His Gly Val Ile His Val Lys 305 310 315
<210> 41
<211> 921
<212> DNA
<213> Oryza sativa
<400> 41
atggatagga acacgaacaa caacagcaac agcagcagca gcagcgagat gccggggaag 60 aaggccagga agccgtacac catcacgaag ccacgggaga gatggagcga ggaggagcac 120 gagaggttcc tcgacgcgct catcatgtac ggccgcgact ggaagaagat cgaggagcac 180 gtcggcacca agaccaccat acagatccgc agccacgcgc agaagtactt cctcaaggtg 240 cagaaga tgg ggctcgccgc cgggctgccg ccgcagtacc cgaggcggag gctcgtcatg 300 cagcagcagc agcagcagag ctcgccggcg gtgagcagct cggtggcggc gacggcgatc 360 ctccacgggc agccgcagtg cttgccgccg catcacaacg tcgctgttca gagctccatc 420 ggttgggagt gtcccggagt tcttcctcct gcaaccaatg acatgcagaa cttggaatgg 480 gcaagtactt caggcactgc agcctggggg aaccatcacg gcctgattga accaccagca 540 gcatttgttt catttcctgg tgaaagttca ttcatggggg cagcaagttt cagtaatacg 600 agcatggact ggactggcac cacaagtgaa atggcaacag ccagcattgt gcaggatgaa 660 acgatcgagc ttccactatc acctgatgat ctgcaatttg cacaagtata caggttcatc 720 ggcgacattt tcgatccaga ctcgccgtgt ccagtggaaa cacaccttca gaaactgaag 780 agcatggatg atatcatcgt gaagacgata ctgttggtgc taagaaatct cgaagacaac 840 ctgttatccc ctcagtttga gcctattaga aggttgctgt cgacgtatga tccgaaccga 900 ggactgtctg gccatttgta g 921 <210> 42
<211> 306
<212> PRT
<213> Oryza sativa
<400> 42
Met Asp Arg Asn Thr Asn Asn Asn Ser Asn Ser Ser Ser Ser Ser Glu 10 15
Met Pro Gly Lys Lys Ala Arg Lys Pro Tyr Thr Ile Thr Lys Pro Arg 20 25 30
Glu Arg Trp Ser Glu Glu Glu His Glu Arg Phe Leu Asp Ala Leu Ile 35 40 45
Met Tyr Gly Arg Asp Trp Lys Lys Ile Glu Glu His Val Gly Thr Lys 50 55 60
Thr Thr Ile Gln Ile Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val 65 70 75 80
Gln Lys Met Gly Leu Ala Ala Gly Leu Pro Pro Gln Tyr Pro Arg Arg 85 90 95
Arg Leu Val Met Gln Gln Gln Gln Gln Gln Ser Ser Pro Ala Val Ser 100 105 110
Ser Ser Val Ala Ala Thr Ala Ile Leu His Gly Gln Pro Gln Cys Leu 115 120 125
Pro Pro His His Asn Val Ala Val Gln Ser Ser Ile Gly Trp Glu Cys 130 135 140 Pro Gly Val Leu Pro Pro Ala Thr Asn Asp Met Gln Asn Leu Glu Trp 145 150 155 160
Ala Ser Thr Ser Gly Thr Ala Ala Trp Gly Asn His His Gly Leu Ile 165 170 175
Glu Pro Pro Ala Ala Phe Val Ser Phe Pro Gly Glu Ser Ser Phe Met 180 185 190
Gly Ala Ala Ser Phe Ser Asn Thr Ser Met Asp Trp Thr Gly Thr Thr 195 200 205
Ser Glu Met Ala Thr Ala Ser Ile Val Gln Asp Glu Thr Ile Glu Leu 210 215 220
Pro Leu Ser Pro Asp Asp Leu Gln Phe Ala Gln Val Tyr Arg Phe Ile 225 230 235 240
Gly Asp Ile Phe Asp Pro Asp Ser Pro Cys Pro Val Glu Thr His Leu 245 250 255
Gln Lys Leu Lys Ser Met Asp Asp Ile Ile Val Lys Thr Ile Leu Leu 260 265 270
Val Leu Arg Asn Leu Glu Asp Asn Leu Leu Ser Pro Gln Phe Glu Pro 275 280 285
Ile Arg Arg Leu Leu Ser Thr Tyr Asp Pro Asn Arg Gly Leu Ser Gly 290 295 300
His Leu 305
<210> 43
<211> 1101
<212> DNA
<213> Oryza sativa
<400> 43
atgacgaggc ggtgctcgca ctgcagcaac aacggccaca acgcgcggac ctgccccgcc 60 cgcggcggcg gtggaggcgg aggcggggtg aggctgttcg gcgtgcggct cacgtcgccg 120 ccggaggtgg cgatgaagaa gagcgcgagc atgagctgca tcgcgtcgtc gctcgggagt 180 ggcggtgggt cagggggttc gtcgccggcg ggaacgggaa ggggaggagg aggaggggga 240 gagggcgcgg ccgggtacgc gtccgacgac cccacgcacg cctcctgctc gacgaatggc 300 cgcggcgagc ggaagaaagg tacaccttgg actgaagaag agcatagaat gtttctaatg 360 ggtctgcaga agcttggtaa aggagactgg cgtgggatct ctcgtaattt tgttgtttcc 420 aggacaccaa ctcaggtggc tagccatgct caaaagtact tcattagaca gacaaactca 480 tcaagaagga agaggaggtc aagcttgttt gacatggtcc cagaaatgcc catggacgaa 540 tccccagtgg tcgtagaaca gcttatgctc catagtactc aagacgaagc cacaagctca 600 aatcaattgc caatatcaca tcttgtgaaa cagaaggaac ctgagtttgc tagacacctg 660 tcggatttgc agctaaggaa gcatgaggaa tctgagttca cagaaccttc actagcagca 720 ctagacttgg agatgaacca tgctgcacct ttcaagacta aatttgttct gacaatgcca 780 acattctacc cggcattaat acctgttcca ctaactcttt ggcctccaaa tgttgctaat 840 gtgggtgaat caggcacaaa tcatgaaatc ctaaagccca ctccagtgaa tggaaaggag 900 gtgatcaata aggctgatga ggttgttggc atgtccaagc ttaccatagg tgacggcagc 960 tctaactcca tagaaccctc tgctctttcc cttcagctta ctggaccgac aaatacaaga 1020 caatcagctt ttcatgtgaa cccaccaatg gctggacctg acctaaataa gagaaacaac 1080 agcccaattc atgcagtttg a 1101 <210> 44
<211> 366
<212> PRT
<213> Oryza sativa
<400> 44
Met Thr Arg Arg Cys Ser His Cys Ser Asn Asn Gly His Asn Ala Arg 10 15
Thr Cys Pro Ala Arg Gly Gly Gly Gly Gly Gly Gly Gly Val Arg Leu 20 25 30
Phe Gly Val Arg Leu Thr Ser Pro Pro Glu Val Ala Met Lys Lys Ser 35 40 45
Ala Ser Met Ser Cys Ile Ala Ser Ser Leu Gly Ser Gly Gly Gly Ser 50 55 60
Gly Gly Ser Ser Pro Ala Gly Thr Gly Arg Gly Gly Gly Gly Gly Gly 65 70 75 80
Glu Gly Ala Ala Gly Tyr Ala Ser Asp Asp Pro Thr His Ala Ser Cys 85 90 95
Ser Thr Asn Gly Arg Gly Glu Arg Lys Lys Gly Thr Pro Trp Thr Glu 100 105 110
Glu Glu His Arg Met Phe Leu Met Gly Leu Gln Lys Leu Gly Lys Gly 115 120 125 Asp Trp Arg Gly Ile Ser Arg Asn Phe Val Val Ser Arg Thr Pro Thr 130 135 140
Gln Val Ala Ser His Ala Gln Lys Tyr Phe Ile Arg Gln Thr Asn Ser 145 150 155 160
Ser Arg Arg Lys Arg Arg Ser Ser Leu Phe Asp Met Val Pro Glu Met 165 170 175
Pro Met Asp Glu Ser Pro Val Val Val Glu Gln Leu Met Leu His Ser 180 185 190
Thr Gln Asp Glu Ala Thr Ser Ser Asn Gln Leu Pro Ile Ser His Leu 195 200 205
Val Lys Gln Lys Glu Pro Glu Phe Ala Arg His Leu Ser Asp Leu Gln 210 215 220
Leu Arg Lys His Glu Glu Ser Glu Phe Thr Glu Pro Ser Leu Ala Ala 225 230 235 240
Leu Asp Leu Glu Met Asn His Ala Ala Pro Phe Lys Thr Lys Phe Val 245 250 255
Leu Thr Met Pro Thr Phe Tyr Pro Ala Leu Ile Pro Val Pro Leu Thr 260 265 270
Leu Trp Pro Pro Asn Val Ala Asn Val Gly Glu Ser Gly Thr Asn His 275 280 285
Glu Ile Leu Lys Pro Thr Pro Val Asn Gly Lys Glu Val Ile Asn Lys 290 295 300
Ala Asp Glu Val Val Gly Met Ser Lys Leu Thr Ile Gly Asp Gly Ser 305 310 315 320
Ser Asn Ser Ile Glu Pro Ser Ala Leu Ser Leu Gln Leu Thr Gly Pro 325 330 335
Thr Asn Thr Arg Gln Ser Ala Phe His Val Asn Pro Pro Met Ala Gly 340 345 350
Pro Asp Leu Asn Lys Arg Asn Asn Ser Pro Ile His Ala Val 355 360 365
<210> 45 <211> 933 <212> DNA <213> Oryza sativa
<400> 45
atggccagga aatgctccag ctgcgggaac aatggccaca actccaggac ttgcaccggc 60 caaaggagcc tgcaggagag tggcggcggt tatggcggcg gtggcgccgg tggcgtgagg 120 ttgttcgggg tgcagttgca cgtcggcggt gcgcctctga agaagtgctt cagcatggag 180 tgcctatcgt cgccgtcgcc gtcgccgtcg ccggcgtact acgccgcggt cgccgccgcc 240 gcctccaact cgtcgccgac cgtgtcgtcg tcgtcgtcgc tggtgtcggt ggaggaggcc 300 ggcgagaaga tggccaacgg gtacctctcc gatggcctca tggcgagagc tcaggagagg 360 aagaagggtg ttccatggac tgaagaggag cacaggaaat tcctggtagg gctcgagaag 420 ctcgggaaag gcgactggcg cggcatttcc cggcacttcg tcacgacaag aacaccgacg 480 caggtggcca gccatgccca gaagtatttc ctcaggcaga gcagcctcac gcagaagaag 540 agaagatcca gcctctttga cgtgattgag ga tgcagaaa aggctccgag tgtgaatgaa 600 cgtctgaaac tgagacacga gacagcctct gtgcctgctg aaatgggatt ccctgcactg 660 tcactgggta tcagcagcat ggcacagcca gaagccatgc tgctgcctcc tccatcctta 720 accctgacgc caagctgttc atcaccagca gtgagcagca gcagcagcga acaaccaaga 780 acaatccatc cttctctgat ggtggcaaag cctcaggtgc aactgcaact ccagccacct 840 gatctggagc tcaagatctc gactgtccgt cagaacgatc agcccagttc gtcgccgagg 900 acgccttttt tggggacaat cagggtcact tga 933 <210> 46
<211> 310
<212> PRT
<213> Oryza sativa
<400> 46
Met Ala Arg Lys Cys Ser Ser Cys Gly Asn Asn Gly His Asn Ser Arg 10 15
Thr Cys Thr Gly Gln Arg Ser Leu Gln Glu Ser Gly Gly Gly Tyr Gly 20 25 30
Gly Gly Gly Ala Gly Gly Val Arg Leu Phe Gly Val Gln Leu His Val 35 40 45
Gly Gly Ala Pro Leu Lys Lys Cys Phe Ser Met Glu Cys Leu Ser Ser 50 55 60
Pro Ser Pro Ser Pro Ser Pro Ala Tyr Tyr Ala Ala Val Ala Ala Ala 65 70 75 80 Ala Ser Asn Ser Ser Pro Thr Val Ser Ser Ser Ser Ser Leu Val Ser 85 90 95
Val Glu Glu Ala Gly Glu Lys Met Ala Asn Gly Tyr Leu Ser Asp Gly 100 105 110
Leu Met Ala Arg Ala Gln Glu Arg Lys Lys Gly Val Pro Trp Thr Glu 115 120 125
Glu Glu His Arg Lys Phe Leu Val Gly Leu Glu Lys Leu Gly Lys Gly 130 135 140
Asp Trp Arg Gly Ile Ser Arg His Phe Val Thr Thr Arg Thr Pro Thr 145 150 155 160
Gln Val Ala Ser His Ala Gln Lys Tyr Phe Leu Arg Gln Ser Ser Leu 165 170 175
Thr Gln Lys Lys Arg Arg Ser Ser Leu Phe Asp Val Ile Glu Asp Ala 180 185 190
Glu Lys Ala Pro Ser Val Asn Glu Arg Leu Lys Leu Arg His Glu Thr 195 200 205
Ala Ser Val Pro Ala Glu Met Gly Phe Pro Ala Leu Ser Leu Gly Ile 210 215 220
Ser Ser Met Ala Gln Pro Glu Ala Met Leu Leu Pro Pro Pro Ser Leu 225 230 235 240
Thr Leu Thr Pro Ser Cys Ser Ser Pro Ala Val Ser Ser Ser Ser Ser 245 250 255
Glu Gln Pro Arg Thr Ile His Pro Ser Leu Met Val Ala Lys Pro Gln 260 265 270
Val Gln Leu Gln Leu Gln Pro Pro Asp Leu Glu Leu Lys Ile Ser Thr 275 280 285
Val Arg Gln Asn Asp Gln Pro Ser Ser Ser Pro Arg Thr Pro Phe Leu 290 295 300
Gly Thr Ile Arg Val Thr 305 310
<210> 47 <211> 906 <212> DNA <213> Oryza sativa
<400> 47
atggcgagga agtgctccta ctgtggcaac tacggccaca actcaagaac ctgcagcagc 60 agcgccagcg ctggacacag ggataccacc atgctctgcg acggcggcga cggaggtggc 120 ggcagtgggc tgaggctgtt cggagtgcag gtccatgtcg ctgccggcgg cggcggtgga 180 ggtggaggtg gaggtttgcc gatgaagaag agctacagca tggactgcct gcagctggcg 240 gcggcggggg cggctccggg ctcgctcgtg tcgccgtcgt cgtcgtcctc gtcgtcgatg 300 ctcctgtcga tcgacgaggg gggcttggag agggcgtcca atgggtacct gtctgatggc 360 ccccatggca gaattgtcca ggagaggaag aaaggagttc cgtggagcga ggaggagcac 420 cggctgttcc tcgtcgggct cgagaagctg ggcaagggcg actggcgagg catctcccgg 480 agctacgtca cgacgaggac cccgacccag gtcgccagcc acgcccagaa gttcttcctc 540 aggcagagca gcatcggcaa gaagaagcgc cgctccagcc tcttcgacat ggtgccgatt 600 tgcgagaacg gtgcgcgcgt ctcggagcag ctgagcggcg aaggcgcggc ggcggcggcg 660 gcggcgtcga cctcactgtc gctgatgaac acgcacgaga cctcctcgga cagagtggcg 720 gcaattgatc tgaattccac cgaggaagat gacacggtgg gcgcgtcagg gaggccgttt 780 ttcccggtgg ttctgatgga gcagcagcag caggcttccc atggacatgg tcaccaccac 840 cactgcacgc cgctcgacct ggagctcggc atgtccgtct cgtcgacgcc gtccatcggc 900 acatga 906 <210> 48
<211> 301
<212> PRT
<213> Oryza sativa
<400> 48
Met Ala Arg Lys Cys Ser Tyr Cys Gly Asn Tyr Gly His Asn Ser Arg 10 15
Thr Cys Ser Ser Ser Ala Ser Ala Gly His Arg Asp Thr Thr Met Leu 20 25 30
Cys Asp Gly Gly Asp Gly Gly Gly Gly Ser Gly Leu Arg Leu Phe Gly 35 40 45
Val Gln Val His Val Ala Ala Gly Gly Gly Gly Gly Gly Gly Gly Gly 50 55 60
Gly Leu Pro Met Lys Lys Ser Tyr Ser Met Asp Cys Leu Gln Leu Ala 65 70 75 80 Ala Ala Gly Ala Ala Pro Gly Ser Leu Val Ser Pro Ser Ser Ser Ser 85 90 95
Ser Ser Ser Met Leu Leu Ser Ile Asp Glu Gly Gly Leu Glu Arg Ala 100 105 110
Ser Asn Gly Tyr Leu Ser Asp Gly Pro His Gly Arg Ile Val Gln Glu 115 120 125
Arg Lys Lys Gly Val Pro Trp Ser Glu Glu Glu His Arg Leu Phe Leu 130 135 140
Val Gly Leu Glu Lys Leu Gly Lys Gly Asp Trp Arg Gly Ile Ser Arg 145 150 155 160
Ser Tyr Val Thr Thr Arg Thr Pro Thr Gln Val Ala Ser His Ala Gln 165 170 175
Lys Phe Phe Leu Arg Gln Ser Ser Ile Gly Lys Lys Lys Arg Arg Ser 180 185 190
Ser Leu Phe Asp Met Val Pro Ile Cys Glu Asn Gly Ala Arg Val Ser 195 200 205
Glu Gln Leu Ser Gly Glu Gly Ala Ala Ala Ala Ala Ala Ala Ser Thr 210 215 220
Ser Leu Ser Leu Met Asn Thr His Glu Thr Ser Ser Asp Arg Val Ala 225 230 235 240
Ala Ile Asp Leu Asn Ser Thr Glu Glu Asp Asp Thr Val Gly Ala Ser 245 250 255
Gly Arg Pro Phe Phe Pro Val Val Leu Met Glu Gln Gln Gln Gln Ala 260 265 270
Ser His Gly His Gly His His His His Cys Thr Pro Leu Asp Leu Glu 275 280 285
Leu Gly Met Ser Val Ser Ser Thr Pro Ser Ile Gly Thr 290 295 300
<210> 49 <211> 831 <212> DNA <213> Oryza sativa <400> 49
atgcctacag atgatgccac ggcgacgggc aacggcgacg gcgccgctcc ccgtccggca 60 gccgccgagc cagcggcgcc gctgtcgtcc gtgtggacgc ggcgggacga aaagctgctg 120 gagatgctgc tctggcgctg gcagctggac ccgcactggg accggctcgc cgcggagctc 180 ggcggcaaga cggcgacgca ggtgttcgac cggtacgtgt gcttggccga cgagctgagg 240 ctcgtcatgg cggcgccggc ggtggacacg ccgcccgcgt gggacgtgca ggacgaacgg 300 gaggccgctg tggcgccact acccgggttg gaggccgacg cggcggccgg cgccggagag 360 tcagcggagg tgacggccat tggcatcgct gccgccgctt ctccgaatgc agctgctacg 420 agcgctccga ccatcggcgg cggggtggta ttgaaatcta gagagctgaa aaatccgcgg 480 aagacgagga tggccggcgg cgggccaagg aagaaggcgg agatgtggac cagggaagag 540 catagccaat tcttgcacgg gattagtacg tacgggaagg ggaattggaa ggcgctggcg 600 agcgagttcg tgaagaccaa gagctcgacc cagatcgcga gccactacca gaagttctgc 660 atcagggaag agaagaggag gctgagcaag tgcaagcggg cgagcatcca cgacatcgtc 720 agcccgacga cgacgacgtc cgcgcctgaa tctgccggcg ccggcccgag tgcaccaccg 780 tgcgcgctga tcgaaagcgg tgcgctgatt gcaggcgacg atgacgcatg a 831 <210> 50
<211> 276
<212> PRT
<213> Oryza sativa
<400> 50
Met Pro Thr Asp Asp Ala Thr Ala Thr Gly Asn Gly Asp Gly Ala Ala 10 15
Pro Arg Pro Ala Ala Ala Glu Pro Ala Ala Pro Leu Ser Ser Val Trp 20 25 30
Thr Arg Arg Asp Glu Lys Leu Leu Glu Met Leu Leu Trp Arg Trp Gln 35 40 45
Leu Asp Pro His Trp Asp Arg Leu Ala Ala Glu Leu Gly Gly Lys Thr 50 55 60
Ala Thr Gln Val Phe Asp Arg Tyr Val Cys Leu Ala Asp Glu Leu Arg 65 70 75 80
Leu Val Met Ala Ala Pro Ala Val Asp Thr Pro Pro Ala Trp Asp Val 85 90 95
Gln Asp Glu Arg Glu Ala Ala Val Ala Pro Leu Pro Gly Leu Glu Ala 100 105 110 Asp Ala Ala Ala Gly Ala Gly Glu Ser Ala Glu Val Thr Ala Ile Gly 115 120 125
Ile Ala Ala Ala Ala Ser Pro Asn Ala Ala Ala Thr Ser Ala Pro Thr 130 135 140
Ile Gly Gly Gly Val Val Leu Lys Ser Arg Glu Leu Lys Asn Pro Arg 145 150 155 160
Lys Thr Arg Met Ala Gly Gly Gly Pro Arg Lys Lys Ala Glu Met Trp 165 170 175
Thr Arg Glu Glu His Ser Gln Phe Leu His Gly Ile Ser Thr Tyr Gly 180 185 190
Lys Gly Asn Trp Lys Ala Leu Ala Ser Glu Phe Val Lys Thr Lys Ser 195 200 205
Ser Thr Gln Ile Ala Ser His Tyr Gln Lys Phe Cys Ile Arg Glu Glu 210 215 220
Lys Arg Arg Leu Ser Lys Cys Lys Arg Ala Ser Ile His Asp Ile Val 225 230 235 240
Ser Pro Thr Thr Thr Thr Ser Ala Pro Glu Ser Ala Gly Ala Gly Pro 245 250 255
Ser Ala Pro Pro Cys Ala Leu Ile Glu Ser Gly Ala Leu Ile Ala Gly 260 265 270
Asp Asp Asp Ala 275
<210> 51
<211> 741
<212> DNA
<213> Oryza sativa
<400> 51
atggcggcaa tggcggcggc ggcggcgggg acgaagaaga aggcgaggaa gccgtacacg 60 atcacgaggc cgcgggagag gtggtccgcc gaggagcacg agcgcttcct tgacgccctg 120 attctgttcg gccgtgactg gaagaggatc gaagcgttcg tcgccaccaa gacggccatc 180 cagattcgca gccatgccca gaagcatttt ctgaaggccc gcaagttcgg cctcgccggt 240 gggctcccgc cgccgcttca ccctcgccgt gccacgctgc tccgggccaa cgccgcggcg 300 gcggacatga tgccgccccc gtggctgcca tcggccggcg gcggctccat cggttgctcg 360 gcgccaccgt ccggcgtgca gcagagcatg gccggcaggt cgccggcgtg ctactcaact 420 gatgaagctt ctttccggcc attgattcat agcaatgaca atgactgttc attcatcgag 480 acaccaagct gcatcggatc aggtggcgaa tcatggatcg gtgatgatgc cttcttcatg 540 caggatgaaa caattcggct cccaatttct ccagatgacc tgggattcgc tcaggtgtac 600 aagttcgtcg gcgacatgtt cggctccggc gagcggcggc cggtggaggc tcacctgcgg 660 aggctgcagg gcatggaccc tgccatctcg gagacgatct tgctggtgct taagaatctc 720 gaagctaatc tatctgctta a 741 <210> 52 <211> 246 <212> PRT <213> Oryza <400> 52 Met Ala Ala Met Ala Ala Ala Ala Ala Gly Thr Lys Lys Lys Ala Arg 10 15
Lys Pro Tyr Thr Ile Thr Arg Pro Arg Glu Arg Trp Ser Ala Glu Glu 20 25 30
His Glu Arg Phe Leu Asp Ala Leu Ile Leu Phe Gly Arg Asp Trp Lys 35 40 45
Arg Ile Glu Ala Phe Val Ala Thr Lys Thr Ala Ile Gln Ile Arg Ser 50 55 60
His Ala Gln Lys His Phe Leu Lys Ala Arg Lys Phe Gly Leu Ala Gly 65 70 75 80
Gly Leu Pro Pro Pro Leu His Pro Arg Arg Ala Thr Leu Leu Arg Ala 85 90 95
Asn Ala Ala Ala Ala Asp Met Met Pro Pro Pro Trp Leu Pro Ser Ala 100 105 110
Gly Gly Gly Ser Ile Gly Cys Ser Ala Pro Pro Ser Gly Val Gln Gln 115 120 125
Ser Met Ala Gly Arg Ser Pro Ala Cys Tyr Ser Thr Asp Glu Ala Ser 130 135 140
Phe Arg Pro Leu Ile His Ser Asn Asp Asn Asp Cys Ser Phe Ile Glu 145 150 155 160 Thr Pro Ser Cys Ile Gly Ser Gly Gly Glu Ser Trp Ile Gly Asp Asp 165 170 175
Ala Phe Phe Met Gln Asp Glu Thr Ile Arg Leu Pro Ile Ser Pro Asp 180 185 190
Asp Leu Gly Phe Ala Gln Val Tyr Lys Phe Val Gly Asp Met Phe Gly
195 200 205
Ser Gly Glu Arg Arg Pro Val Glu Ala His Leu Arg Arg Leu Gln Gly 210 215 220
Met Asp Pro Ala Ile Ser Glu Thr Ile Leu Leu Val Leu Lys Asn Leu
225 230
Glu Ala Asn Leu Ser Ala 245
<210> 53 <211> 864 <212> DNA <213> Oryza sativa <400> 53 agtgctctag ctgtgggaac atggctagga caaagagttc ttgatcacag catcagcagc gctactgcct gtggtggctt gaggttgttt tctcctctga agaagtgcct cagcatggag tctgcctcgc cgtcggtttc gtcgtcgtca gagagggtct ccaatgggta cctctctgat aaaggagttc catggactga ggaagaacac ggaaaaggcg actggcgggg catttctcgg gtcgccagcc atgcccagaa gtacttcctg aggtccagcc tctttgatgt ggttgaaggt ggatctgcat ctgaactgca gatccccggc gaggttgtcc tgcctccatg tctgaacctg tcaccttccc tgacattgct ggcaaatcct ctaaagatgt ccacatcccg gttatctgac ttcgggacca tcagagttac ctga 235 240
aatggccaca actccaggac ttgcagtggc 60 agcaacagtg gtagtactac tgctgctgct 120 ggggtgcagc tgcaggtagg aggaggctca 180 tgcttggcat caccagcata ctatggagct 240 tcttcgcttg tttcgattga ggagaacact 300 gggctcatgg gaagggttca ggagaggaag 360 cagatgttcc tcgccggcct tgacaagctc 420 cacttcgtca ctacccggac tccaacgcag 480 aggcagaaca gtatgacaca gaagaagagg 540 atcaagaggg cagcagcaat gcccatttca 600 atgtcgatcg gtgtcggcgt ggtgaaggag 660 atgagtaaca gttcatcagc atcacagcac 720 caggtgcagc tccagatgcc tgacctggag 780 caatccggtc cgtcgccgag cacgcctttc 840 864 <210> 54 <211> 287 <212> PRT
<213> Oryza sativa
<400> 54
Met Ala Arg Lys Cys Ser Ser Cys Gly Asn Asn Gly His Asn Ser Arg 10 15
Thr Cys Ser Gly Gln Arg Val Leu Asp His Ser Ile Ser Ser Ser Asn 20 25 30
Ser Gly Ser Thr Thr Ala Ala Ala Ala Thr Ala Cys Gly Gly Leu Arg 35 40 45
Leu Phe Gly Val Gln Leu Gln Val Gly Gly Gly Ser Ser Pro Leu Lys 50 55 60
Lys Cys Leu Ser Met Glu Cys Leu Ala Ser Pro Ala Tyr Tyr Gly Ala 65 70 75 80
Ser Ala Ser Pro Ser Val Ser Ser Ser Ser Ser Ser Leu Val Ser Ile 85 90 95
Glu Glu Asn Thr Glu Arg Val Ser Asn Gly Tyr Leu Ser Asp Gly Leu 100 105 110
Met Gly Arg Val Gln Glu Arg Lys Lys Gly Val Pro Trp Thr Glu Glu 115 120 125
Glu His Gln Met Phe Leu Ala Gly Leu Asp Lys Leu Gly Lys Gly Asp 130 135 140
Trp Arg Gly Ile Ser Arg His Phe Val Thr Thr Arg Thr Pro Thr Gln 145 150 155 160
Val Ala Ser His Ala Gln Lys Tyr Phe Leu Arg Gln Asn Ser Met Thr 165 170 175
Gln Lys Lys Arg Arg Ser Ser Leu Phe Asp Val Val Glu Gly Ile Lys 180 185 190
Arg Ala Ala Ala Met Pro Ile Ser Gly Ser Ala Ser Glu Leu Gln Ile 195 200 205
Pro Gly Met Ser Ile Gly Val Gly Val Val Lys Glu Glu Val Val Leu 210 215 220
Pro Pro Cys Leu Asn Leu Met Ser Asn Ser Ser Ser Ala Ser Gln His 225 230 235 240 Ser Pro Ser Leu Thr Leu Leu Ala Asn Pro Gln Val Gln Leu Gln Met 245 250 255
Pro Asp Leu Glu Leu Lys Met Ser Thr Ser Arg Leu Ser Asp Gln Ser 260 265 270
Gly Pro Ser Pro Ser Thr Pro Phe Phe Gly Thr Ile Arg Val Thr 275 280 285
<210> 55
<211> 813
<212> DNA
<213> Oryza sativa
<400> 55
atgcacgcca tcatggcgag gcgatgctct ggtgactact cgactgcagg ccaacgagcc 60 ggcgaggagg gcggcggcgg cggcggcgcc gggctacggc tgttcggggt gcagctccat 120 gctgcggcgg ccagctcgcc ggcgtcctac ttgcacaaga gttacagcat ggattgcctg 180 cggctgcagg tttcttctcc ttcctccttg cagtcgtcgt cgtcgtcgcc gtcgccgttg 240 acgtcctcgt tgttgctgtc catcgacgag ggctgcgaga ggccagccgc cgacggctac 300 ctctccgacg ggcctcacgg cgcggcggca accatgcggg agaggaagaa aggagttcca 360 tggagcgagc aagagcacag gctgttcctg gcggggctgg agaagctggg caagggcgac 420 tggcgaggca tctcccggag cttcgtcacc accaggacgc ccacccaggt cgccagccat 480 gcccagaagt tcttcctccg ccacaacagc gccgccaaga agaccaacaa caagcgccgc 540 tccagcctct tcgacatggt tcaggattgt gacagtggag gaagatctct cgcctcatcc 600 gatcctgcca ctcgctgcaa caacaacatc tctgcttctc tgtctctcca agtttcgcac 660 cacaaatcag gtgacagtgc gtggccttcg tcagaaacac catcagtttc agaagcacaa 720 caaggtcatg gatacggcac tagtcaccat tgctctccgc tggacctgga gctgggcatg 780 tccctgtcca ccacgccatc catcggaacc tag 813 <210> 56
<211> 270
<212> PRT
<213> Oryza sativa
<400> 56
Met His Ala Ile Met Ala Arg Arg Cys Ser Gly Asp Tyr Ser Thr Ala 10 15
Gly Gln Arg Ala Gly Glu Glu Gly Gly Gly Gly Gly Gly Ala Gly Leu 20 25 30 Arg Leu Phe Gly Val Gln Leu His Ala Ala Ala Ala Ser Ser Pro Ala 35 40 45
Ser Tyr Leu His Lys Ser Tyr Ser Met Asp Cys Leu Arg Leu Gln Val 50 55 60
Ser Ser Pro Ser Ser Leu Gln Ser Ser Ser Ser Ser Pro Ser Pro Leu 65 70 75 80
Thr Ser Ser Leu Leu Leu Ser Ile Asp Glu Gly Cys Glu Arg Pro Ala 85 90 95
Ala Asp Gly Tyr Leu Ser Asp Gly Pro His Gly Ala Ala Ala Thr Met 100 105 110
Arg Glu Arg Lys Lys Gly Val Pro Trp Ser Glu Gln Glu His Arg Leu 115 120 125
Phe Leu Ala Gly Leu Glu Lys Leu Gly Lys Gly Asp Trp Arg Gly Ile 130 135 140
Ser Arg Ser Phe Val Thr Thr Arg Thr Pro Thr Gln Val Ala Ser His 145 150 155 160
Ala Gln Lys Phe Phe Leu Arg His Asn Ser Ala Ala Lys Lys Thr Asn 165 170 175
Asn Lys Arg Arg Ser Ser Leu Phe Asp Met Val Gln Asp Cys Asp Ser 180 185 190
Gly Gly Arg Ser Leu Ala Ser Ser Asp Pro Ala Thr Arg Cys Asn Asn 195 200 205
Asn Ile Ser Ala Ser Leu Ser Leu Gln Val Ser His His Lys Ser Gly 210 215 220
Asp Ser Ala Trp Pro Ser Ser Glu Thr Pro Ser Val Ser Glu Ala Gln 225 230 235 240
Gln Gly His Gly Tyr Gly Thr Ser His His Cys Ser Pro Leu Asp Leu 245 250 255
Glu Leu Gly Met Ser Leu Ser Thr Thr Pro Ser Ile Gly Thr 260 265 270
<210> 57 <211> 966 <212> DNA
<213> Oryza sativa
<400> 57
atgggttcaa tagtcattga ggggtggacg gcatctgaga tagaggaggc taggtcactg 60 atcactagcc ccaacaacgg tggcgaaggt ggtgatggag aggggaacaa gcagaagcat 120 tgcggacaca tcgtgatgga actccatgaa tggttccctt ggaagaccat aggccaggta 180 ataggtttgt atatgaagct caatgcgggg aaacccatgg ttatgcatag cttgaataag 240 agtgatgcca acaatagcat cggtgaggtt gatcatgtga gtgccctcgc aaacggtaac 300 cctgtgaggc tagaggaaca tcgacccatg ttgaacaatg tgggcttagt gtttgattat 360 ccattggaag agatggagat ggaaaatcaa acagatcaag agccgaagat ggttgtagag 420 gaggaggtgc agcctaagga gggattagtg atcaaggaga aagaggcggg ggtgtcaaag 480 attcacacta atagtcaaca tgtgacgcca tcaataaaaa gaagggtgat ttggacagag 540 gaagaacaca ggctgttcat ggtggggctg cgcgtgttcg ggcgcggcga ctggaagaac 600 atctccaagc accttgtcac caccaggacg gcggcgcagg tctccagcca cgcgcagaag 660 ttcttcctca agatggaggc ccgcggcgag gccgtccccc cgccggccaa gaggcgccgc 720 cgccgcatca ccggcgacca gcaggcggcg gccgccgagc acgctgccgc cctcaggcgc 780 cgcatgccag tgccaccgcc tccgttcaac cccttcctcc tgcccagcct cgtcgcgccg 840 gtgatgcacc gcctcctccc acctgggagc caggctgccg gcgccgccgc ctccggcagc 900 ggcggccagg gagcttctct tcctcagatg ccatggatca acggcgccaa tggcatgggg 960 cgctag 966 <210> 58
<211> 321
<212> PRT
<213> Oryza sativa
<400> 58
Met Gly Ser Ile Val Ile Glu Gly Trp Thr Ala Ser Glu Ile Glu Glu 10 15
Ala Arg Ser Leu Ile Thr Ser Pro Asn Asn Gly Gly Glu Gly Gly Asp 20 25 30
Gly Glu Gly Asn Lys Gln Lys His Cys Gly His Ile Val Met Glu Leu 35 40 45
His Glu Trp Phe Pro Trp Lys Thr Ile Gly Gln Val Ile Gly Leu Tyr 50 55 60
Met Lys Leu Asn Ala Gly Lys Pro Met Val Met His Ser Leu Asn Lys 65 70 75 80
Ser Asp Ala Asn Asn Ser Ile Gly Glu Val Asp His Val Ser Ala Leu 85 90 95
Ala Asn Gly Asn Pro Val Arg Leu Glu Glu His Arg Pro Met Leu Asn 100 105 110
Asn Val Gly Leu Val Phe Asp Tyr Pro Leu Glu Glu Met Glu Met Glu 115 120 125
Asn Gln Thr Asp Gln Glu Pro Lys Met Val Val Glu Glu Glu Val Gln 130 135 140
Pro Lys Glu Gly Leu Val Ile Lys Glu Lys Glu Ala Gly Val Ser Lys 145 150 155 160
Ile His Thr Asn Ser Gln His Val Thr Pro Ser Ile Lys Arg Arg Val 165 170 175
Ile Trp Thr Glu Glu Glu His Arg Leu Phe Met Val Gly Leu Arg Val 180 185 190
Phe Gly Arg Gly Asp Trp Lys Asn Ile Ser Lys His Leu Val Thr Thr 195 200 205
Arg Thr Ala Ala Gln Val Ser Ser His Ala Gln Lys Phe Phe Leu Lys 210 215 220
Met Glu Ala Arg Gly Glu Ala Val Pro Pro Pro Ala Lys Arg Arg Arg 225 230 235 240
Arg Arg Ile Thr Gly Asp Gln Gln Ala Ala Ala Ala Glu His Ala Ala 245 250 255
Ala Leu Arg Arg Arg Met Pro Val Pro Pro Pro Pro Phe Asn Pro Phe 260 265 270
Leu Leu Pro Ser Leu Val Ala Pro Val Met His Arg Leu Leu Pro Pro 275 280 285
Gly Ser Gln Ala Ala Gly Ala Ala Ala Ser Gly Ser Gly Gly Gln Gly 290 295 300
Ala Ser Leu Pro Gln Met Pro Trp Ile Asn Gly Ala Asn Gly Met Gly 305 310 315 320 Arg
<210> 59
<211> 1185
<212> DNA
<213> Oryza sativa
<400> 59
atggagtgga cggcggcgga gatggacgag gcgaggtcga tcatcgctag gctgaccaac 60 gcttacgact ccggcaccct cgttgccggc gccggcaacg gcgacacgag gcacgaccgc 120 attgtgaggg agctgcaggc gtggctccca tggaggacca tggatcagct aatcgggctg 180 tacattgagc tcatggcgga ggagcccgcg gcggcgcagc cgcagtactt cgacgccggc 240 gccgtcgtcg accctacgtt cgacttcttc aacgaccaca acaacttcct cggcatgccg 300 ccgccgccgg ttcaacaagc tgatgaccat aacatgaaca acgtcgtcgc cgacgccggc 360 atgaactact aotatggcgg cggcggcgcc ggcggtgcca tggtgtttgg tggtgcaccc 420 atgggggaga cggtggagca ggcagctccg ccggtgccgg tggtgccggt ggtgatgaac 480 cgcgacgacg acgaggtgaa caaccagggc ggcggccgtc accgtgctgc accaacaaat 540 actactagga ggttttggac cactgaagag cacaggcagt ttctgagggg gctgcgtgtg 600 tacggacgtg gtgagtggaa gagcatctcc atgaacttcg tcagaagcaa gacgccggtg 660 caggtgtcca gccacgccca gaagtacttc cgccgcgtgg agagcgccgc cgccgacaag 720 cagcgctaca gcatcaacga cgtcggcctc aacgacgaca ccgccgccat ggacggcacc 780 aacagctaca gcaacaataa cttcggtggc tggcagagtc tcgccttcgc cggcggccac 840 ctcgagcccg tcagcggcgg cggcgccgcc aggcaagtca tcgctccggc gagctcctcc 900 gcogctgcca tgaacagcgc cgctcagttc tgggctccta tgctgttcaa cccccagatt 960 cagcagcagt tcatgcagat gcaggcgcag acgcagcagg cgtggaatga tcagcatatg 1020 atgatggctg ctgctccaat ggagggagca actgatacta actttgagcc tgcaggtgca 1080 gttaattatt attattatca acagcagcag gaggaggagg agggaggtgc ttatggtgtt 1140 cctgcggatc agtggatgat gaaccagaac aacaacatgt gctga 1185 <210> 60
<211> 394
<212> PRT
<213> Oryza sativa
<400> 60
Met Glu Trp Thr Ala Ala Glu Met Asp Glu Ala Arg Ser Ile Ile Ala 10 15
Arg Leu Thr Asn Ala Tyr Asp Ser Gly Thr Leu Val Ala Gly Ala Gly 20 25 30
Asn Gly Asp Thr Arg His Asp Arg Ile Val Arg Glu Leu Gln Ala Trp 35 40 45
Leu Pro Trp Arg Thr Met Asp Gln Leu Ile Gly Leu Tyr Ile Glu Leu 50 55 60
Met Ala Glu Glu Pro Ala Ala Ala Gln Pro Gln Tyr Phe Asp Ala Gly 65 70 75 80
Ala Val Val Asp Pro Thr Phe Asp Phe Phe Asn Asp His Asn Asn Phe 85 90 95
Leu Gly Met Pro Pro Pro Pro Val Gln Gln Ala Asp Asp His Asn Met 100 105 110
Asn Asn Val Val Ala Asp Ala Gly Met Asn Tyr Tyr Tyr Gly Gly Gly 115 120 125
Gly Ala Gly Gly Ala Met Val Phe Gly Gly Ala Pro Met Gly Glu Thr 130 135 140
Val Glu Gln Ala Ala Pro Pro Val Pro Val Val Pro Val Val Met Asn 145 150 155 160
Arg Asp Asp Asp Glu Val Asn Asn Gln Gly Gly Gly Arg His Arg Ala 165 170 175
Ala Pro Thr Asn Thr Thr Arg Arg Phe Trp Thr Thr Glu Glu His Arg 180 185 190
Gln Phe Leu Arg Gly Leu Arg Val Tyr Gly Arg Gly Glu Trp Lys Ser 195 200 205
Ile Ser Met Asn Phe Val Arg Ser Lys Thr Pro Val Gln Val Ser Ser 210 215 220
His Ala Gln Lys Tyr Phe Arg Arg Val Glu Ser Ala Ala Ala Asp Lys 225 230 235 240
Gln Arg Tyr Ser Ile Asn Asp Val Gly Leu Asn Asp Asp Thr Ala Ala 245 250 255
Met Asp Gly Thr Asn Ser Tyr Ser Asn Asn Asn Phe Gly Gly Trp Gln 260 265 270 Ser Leu Ala Phe Ala Gly Gly His Leu Glu Pro Val Ser Gly Gly Gly 275 280 285
Ala Ala Arg Gln Val Ile Ala Pro Ala Ser Ser Ser Ala Ala Ala Met 290 295 300
Asn Ser Ala Ala Gln Phe Trp Ala Pro Met Leu Phe Asn Pro Gln Ile 305 310 315 320
Gln Gln Gln Phe Met Gln Met Gln Ala Gln Thr Gln Gln Ala Trp Asn 325 330 335
Asp Gln His Met Met Met Ala Ala Ala Pro Met Glu Gly Ala Thr Asp 340 345 350
Thr Asn Phe Glu Pro Ala Gly Ala Val Asn Tyr Tyr Tyr Tyr Gln Gln 355 360 365
Gln Gln Glu Glu Glu Glu Gly Gly Ala Tyr Gly Val Pro Ala Asp Gln 370 375 380
Trp Met Met Asn Gln Asn Asn Asn Met Cys 385 390
<210> 61
<211> 897
<212> DNA
<213> Oryza sativa
<400> 61
atggagtgga cggcggcaga gctggcggag gcaaggtcgg tcatcgctag ggtcagcgac 60 gcctacaact ccggcgtagg cagcagcagc agcgcctgcg acaccaagca cgaccgcatt 120 atgagggagc tccaggcgag gttcccgtcg aggaccatgg tccaggtaat cgatctgtac 180 gttaatctca cggtggagac ggcggcgcag ccgcaggacg ccggcagcgc cggcgacgcc 240 gccgccgtcg tccaccctac ttttgccggc ggcatgcccg ttgtgaacaa caacgacggc 300 atggtgcatg gtggtgctgc tatggaggtg ggggcggtgg cggtgaacgg cggggacggt 360 gaggtggtga acccggacaa tgctgatgac gatgtgcttt ggactgatta tgagcacagg 420 ctgtttctga ctgggatgcg tgtgtacggg cgtggcgact ggagaaacat ctcgaggtac 480 ttcgtcagaa gcaagacgcc ggagcagatc tccatgtacg ccgacaacta cttccacatg 540 atggagatcg ccgcggccat ggaagccgac ggcggcgacg acgacgacgg ccaccatgaa 600 atcaataaca acaacaacaa cttgggcggc ggccagctgc acgccgtcgt cggcgccgtc 660 gggcacggcc ccggtgccgg gcacattgct ccggcgaccc cctccaacaa caacaccgcc 720 gccgccgccg tgaacaacaa cgtcgacaca ccgttctggg ttccgctgct gtacaacccc 780 gagatagagc agcggatgat ggagatgcag gcgcagtcgc agaaggcctg ggatgatcag cagatgaaga tggctgaagc tgcaactcca aaggaggagg gagcagctga taagtga
<210> 62
<211> 298
<212> PRT
<213> Oryza sativa
<400> 62
Met Glu Trp Thr Ala Ala Glu Leu Ala Glu Ala Arg Ser Val Ile Ala 10 15
Arg Val Ser Asp Ala Tyr Asn Ser Gly Val Gly Ser Ser Ser Ser Ala 20 25 30
Cys Asp Thr Lys His Asp Arg Ile Met Arg Glu Leu Gln Ala Arg Phe 35 40 45
Pro Ser Arg Thr Met Val Gln Val Ile Asp Leu Tyr Val Asn Leu Thr 50 55 60
Val Glu Thr Ala Ala Gln Pro Gln Asp Ala Gly Ser Ala Gly Asp Ala 65 70 75 80
Ala Ala Val Val His Pro Thr Phe Ala Gly Gly Met Pro Val Val Asn 85 90 95
Asn Asn Asp Gly Met Val His Gly Gly Ala Ala Met Glu Val Gly Ala 100 105 110
Val Ala Val Asn Gly Gly Asp Gly Glu Val Val Asn Pro Asp Asn Ala 115 120 125
Asp Asp Asp Val Leu Trp Thr Asp Tyr Glu His Arg Leu Phe Leu Thr 130 135 140
Gly Met Arg Val Tyr Gly Arg Gly Asp Trp Arg Asn Ile Ser Arg Tyr 145 150 155 160
Phe Val Arg Ser Lys Thr Pro Glu Gln Ile Ser Met Tyr Ala Asp Asn 165 170 175
Tyr Phe His Met Met Glu Ile Ala Ala Ala Met Glu Ala Asp Gly Gly 180 185 190
840
897
Asp Asp Asp Asp Gly His His Glu Ile Asn Asn Asn Asn Asn Asn Leu 195 200 205 Gly Gly Gly Gln Leu His Ala Val Val Gly Ala Val Gly His Gly Pro 210 215 220
Gly Ala Gly His Ile Ala Pro Ala Thr Pro Ser Asn Asn Asn Thr Ala 225 230 235 240
Ala Ala Ala Val Asn Asn Asn Val Asp Thr Pro Phe Trp Val Pro Leu 245 250 255
Leu Tyr Asn Pro Glu Ile Glu Gln Arg Met Met Glu Met Gln Ala Gln 260 265 270
Ser Gln Lys Ala Trp Asp Asp Gln Gln Met Lys Met Ala Glu Ala Ala 275 280 285
Thr Pro Lys Glu Glu Gly Ala Ala Asp Lys 290 295
<210> 63
<211> 1089
<212> DNA
<213> Oryza sativa
<400> 63
atgctgctct ctcattgttt tgcagtagca ttcgctctct ctgcgctgct cgccggcctc 60 gccctcgcca tggacgacgc aacgttcggc atggagtgga cggcggcgga gctgggtgag 120 gcgaggtcgg tcatcgctag ggtcagcaac gcctacgact ccggcgccgg cagcagcaac 180 agtgccggcg acaccaagca cgaccgcatt atgagggagc tccaggcgag gttcccgtcg 240 aggaccatgg tccaggtaat cgacttgtac cttaatctca cggcggagac agcagcgcag 300 gcgggggcgg cccagccgca ggacgccggc ggcgccggcg acgccgccgt cgtccaccct 360 acctttggcc tcgcgaacga caacttcggc atgcccgttg cgaacaacaa cgacgacggc 420 gtcgacgccg gcatggtgtt tggtggagct cctatggagg agggggcggt ggcggtgaac 480 ggtggggacg gtgaggtggt gaacccggac aatgctgatg acgatgtgct ttggaccgat 540 tatgagcaca ggctgttcct gactgggatg cgtgtgtacg ggcgtggcga ctggagaaac 600 atcgcgaggt acttcgtcgg aagcaagacg ccggagcagg tctccatgta cgccgataac 660 tacttccaca tgatggagat cgccgcggcc atggaagccg acggcgacga cgatgacgac 720 caccatgaaa acaataacaa caacttgggc ggcgggcagc tgcacgccgt cgtcggcgcc 780 gtcgagcacc atgaaaatta caacaacaac aacttaggcg gcgggcagct gaacgccggc 840 ctcggcgccg tcgggcacgg ccccggtgcc gggcacattg ctccggcgac ctcctccaac 900 aacaacgtcg ccgccgccgc cgcgaacaac aacgtcgacg caccgttctg ggttccgctg 960 ctgtacaacc tcgagataga gcagcgcatg atggagatgc aggcgcagtc gcagaaggcc tgggatgatc agcagatgaa gatggctgaa gctgcaactg atccaaagga gggagcagct gataagtga
<210> 64
<211> 362
<212> PRT
<213> Oiryza sativa
<400> 64
Met Leu Leu Ser His Cys Phe Ala Val Ala Phe Ala Leu Ser Ala Leu 10 15
Leu Ala Gly Leu Ala Leu Ala Met Asp Asp Ala Thr Phe Gly Met Glu 20 25 30
Trp Thr Ala Ala Glu Leu Gly Glu Ala Arg Ser Val Ile Ala Arg Val 35 40 45
Ser Asn Ala Tyr Asp Ser Gly Ala Gly Ser Ser Asn Ser Ala Gly Asp 50 55 60
Thr Lys His Asp Arg Ile Met Arg Glu Leu Gln Ala Arg Phe Pro Ser 65 70 75 80
Arg Thr Met Val Gln Val Ile Asp Leu Tyr Leu Asn Leu Thr Ala Glu 85 90 95
Thr Ala Ala Gln Ala Gly Ala Ala Gln Pro Gln Asp Ala Gly Gly Ala 100 105 110
Gly Asp Ala Ala Val Val His Pro Thr Phe Gly Leu Ala Asn Asp Asn 115 120 125
Phe Gly Met Pro Val Ala Asn Asn Asn Asp Asp Gly Val Asp Ala Gly 130 135 140
Met Val Phe Gly Gly Ala Pro Met Glu Glu Gly Ala Val Ala Val Asn 145 150 155 160
Gly Gly Asp Gly Glu Val Val Asn Pro Asp Asn Ala Asp Asp Asp Val 165 170 175
1020
1080
1089
Leu Trp Thr Asp Tyr Glu His Arg Leu Phe Leu Thr Gly Met Arg Val 180 185 190 Tyr Gly Arg Gly Asp Trp Arg Asn He Ala Arg Tyr Phe Val Gly Ser 195 200 205
Lys Thr Pro Glu Gln Val Ser Met Tyr Ala Asp Asn Tyr Phe His Met 210 215 220
Met Glu Ile Ala Ala Ala Met Glu Ala Asp Gly Asp Asp Asp Asp Asp 225 230 235 240
His His Glu Asn Asn Asn Asn Asn Leu Gly Gly Gly Gln Leu His Ala 245 250 255
Val Val Gly Ala Val Glu His His Glu Asn Tyr Asn Asn Asn Asn Leu 260 265 270
Gly Gly Gly Gln Leu Asn Ala Gly Leu Gly Ala Val Gly His Gly Pro 275 280 285
Gly Ala Gly His Ile Ala Pro Ala Thr Ser Ser Asn Asn Asn Val Ala 290 295 300
Ala Ala Ala Ala Asn Asn Asn Val Asp Ala Pro Phe Trp Val Pro Leu 305 310 315 320
Leu Tyr Asn Leu Glu Ile Glu Gln Arg Met Met Glu Met Gln Ala Gln 325 330 335
Ser Gln Lys Ala Trp Asp Asp Gln Gln Met Lys Met Ala Glu Ala Ala 340 345 350
Thr Asp Pro Lys Glu Gly Ala Ala Asp Lys 355 360
<210> 65
<211> 501
<212> DNA
<213> Oryza sativa
<400> 65
atgtccatgg atacatctcc tgtcatcaga aatacaaatg ccagtgctgt agtaccctcc 60 tgggacaatt ctattgctca acctttaagt gcaagtcgca cgcaaggtac aggtgctgtt 120 gctacaaata actgctctag tagcatagag agtccttcta ctacttggcc aacttctgaa 180 gcagttgaac aagaaaatat gcttcgacca ctacgtgcta tgccagattt tgcacaagta 240 tacagctttc tgggaagcat atttgatcca gatactagtg ggcatttgca gactttaaag 300 gcgatggatc caattgatgt tgaaacggta ctactgctga tgagaaatct gtccatgaac 360 ttaactagcc ccaactttgc ggcacatctg agcttgctgt catcatgtaa ttctggtggg 420 gacccaatta agtctgaagg catggaaaat cttggatctc cacagagttg ccatctcccg ttcatggtaa caagtgagtg a
<210> 66
<211> 166
<212> PRT
<213> Oryza sativa
<400> 66
Met Ser Met Asp Thr Ser Pro Val Ile Arg Asn Thr Asn Ala Ser Ala 10 15
Val Val Pro Ser Trp Asp Asn Ser Ile Ala Gln Pro Leu Ser Ala Ser 20 25 30
Arg Thr Gln Gly Thr Gly Ala Val Ala Thr Asn Asn Cys Ser Ser Ser 35 40 45
Ile Glu Ser Pro Ser Thr Thr Trp Pro Thr Ser Glu Ala Val Glu Gln 50 55 60
Glu Asn Met Leu Arg Pro Leu Arg Ala Met Pro Asp Phe Ala Gln Val 65 70 75 80
Tyr Ser Phe Leu Gly Ser Ile Phe Asp Pro Asp Thr Ser Gly His Leu 85 90 95
Gln Thr Leu Lys Ala Met Asp Pro Ile Asp Val Glu Thr Val Leu Leu 100 105 110
Leu Met Arg Asn Leu Ser Met Asn Leu Thr Ser Pro Asn Phe Ala Ala 115 120 125
His Leu Ser Leu Leu Ser Ser Cys Asn Ser Gly Gly Asp Pro Ile Lys 130 135 140
Ser Glu Gly Met Glu Asn Leu Gly Ser Pro Gln Ser Cys His Leu Pro 145 150 155 160
Phe Met Val Thr Ser Glu 165
<210> 67
<211> 1152
<212> DNA
<213> Oryza sativa
<400> 67
480
501 120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1152
68
atgacgcgtg acggcgcgct gccggcgagc ggcggcggcg gggcggcgga ggggccgagg cggtgctcgc agtgcgggca ccacgggcac aacgcgcgga cgtgcacggc gaggggcccc gtgaagctgt tcggcgtgcg gatcggcgac aagccgccga ccgcggccgc gggcggagga ggagggatga ggaagagcgc cagtatgggg agcctcgcgc agctggcgga ggggggcggc ggcggcggcg ggagggagga ggggtacggc tccgatggga acgacgacaa acggcggaag cgagg tgagg catggtcaga agaggagcac aaaaagtttc tacttgggct tagtaagtta ggaaaaggtg attggcgcgg catatcacgc aattatgttg gttcaaggac gcctactcaa gttgctagcc atgctcaaaa gtacttcatt cgccaaacaa atgtgcacag gagaaaaaga agatcaagcc ttttcgatat ggttatagat gattctgatg accaaccact gtcccgtaca tcttcacaag aagtagaagt agaagagaat ctagaagatg gacatcctgt tactgcacca gtgatcccac ctgctcctgt gcctatgcta tcatcctctt tggttccgcc accagtacca gcaatggcac cagttgctcc aggtcctgtg ttaacatctg cttcggccac actaccagtg tcagcagtgg caccccaaac cgatgaaaag gaacaagttg cctcaggttc aaatacaaca gagacagggg ctgcaattcc agaagtcatg cccccatatg gttatccaat gatgcttcct ccatactacc caccggcatt tgttccaatg ccctactatg gttatgtgcc tgttttctat gcaccaccag gagcagtgca agcacaacat gaggttgtca agcctgtggc cgtgcactca aaacctccag tgcacatcga tgaactctac agcatgtccg aactcagcct gaagggcgag gctggtgtga aaaacggcac tcctaattct ctgttgcctc caagaccaat tggtagacca gacaggcaat ctgcttttca tggaaaagga ccttctgatg gctcttcaaa tggactgatt cctgcaaagt ga <210> 68
<211> 383
<212> PRT
<213> Oryza sativa
<400> 68
Met Thr Arg Asp Gly Ala Leu Pro Ala Ser Gly Gly Gly Gly Ala Ala 10 15
Glu Gly Pro Arg Arg Cys Ser Gln Cys Gly His His Gly His Asn Ala 20 25 30
Arg Thr Cys Thr Ala Arg Gly Pro Val Lys Leu Phe Gly Val Arg Ile 35 40 45
Gly Asp Lys Pro Pro Thr Ala Ala Ala Gly Gly Gly Gly Gly Met Arg 50 55 60 Lys Ser Ala Ser Met Gly Ser Leu Ala Gln Leu Ala Glu Gly Gly Gly 65 70 75 80
Gly Gly Gly Gly Arg Glu Glu Gly Tyr Gly Ser Asp Gly Asn Asp Asp 85 90 95
Lys Arg Arg Lys Arg Gly Glu Ala Trp Ser Glu Glu Glu His Lys Lys 100 105 110
Phe Leu Leu Gly Leu Ser Lys Leu Gly Lys Gly Asp Trp Arg Gly Ile 115 120 125
Ser Arg Asn Tyr Val Gly Ser Arg Thr Pro Thr Gln Val Ala Ser His 130 135 140
Ala Gln Lys Tyr Phe Ile Arg Gln Thr Asn Val His Arg Arg Lys Arg 145 150 155 160
Arg Ser Ser Leu Phe Asp Met Val Ile Asp Asp Ser Asp Asp Gln Pro 165 170 175
Leu Ser Arg Thr Ser Ser Gln Glu Val Glu Val Glu Glu Asn Leu Glu 180 185 190
Asp Gly His Pro Val Thr Ala Pro Val Ile Pro Pro Ala Pro Val Pro 195 200 205
Met Leu Ser Ser Ser Leu Val Pro Pro Pro Val Pro Ala Met Ala Pro 210 215 220
Val Ala Pro Gly Pro Val Leu Thr Ser Ala Ser Ala Thr Leu Pro Val 225 230 235 240
Ser Ala Val Ala Pro Gln Thr Asp Glu Lys Glu Gln Val Ala Ser Gly 245 250 255
Ser Asn Thr Thr Glu Thr Gly Ala Ala Ile Pro Glu Val Met Pro Pro 260 265 270
Tyr Gly Tyr Pro Met Met Leu Pro Pro Tyr Tyr Pro Pro Ala Phe Val 275 280 285
Pro Met Pro Tyr Tyr Gly Tyr Val Pro Val Phe Tyr Ala Pro Pro Gly 290 295 300
Ala Val Gln Ala Gln His Glu Val Val Lys Pro Val Ala Val His Ser 305 310 315 320 Lys Pro Pro Val His Ile Asp Glu Leu Tyr Ser Met Ser Glu Leu Ser
Leu Lys Gly Glu Ala Gly Val Lys Asn Gly Thr Pro Asn Ser Leu Leu
Pro Pro Arg Pro Ile Gly Arg Pro Asp Arg Gln Ser Ala Phe His Gly
Lys Gly Pro Ser Asp Gly Ser Ser Asn Gly Leu Ile Pro Ala Lys
<210> 69
<211> 1020
<212> DNA
<213> Oryza sativa
<400> 69
atgcctcaag attcgcgccc cgccgcgatg cgcctcttcg gcgtcaccat ctegccgccg 60
ccgccgccgc cggagccgga gccggagccg gatccgtccg acccccggga tccgagcccg 120
cggccggcga gggaggacgc gatgcgcaag tgcaagagca tgggcaacct cgccgccgcc 180
gccgccgcct cctccgccgc agccggcggc ggcggcgccg gggacgccgg gggatcgggc 240
gacgggtacc tctccgacgg tgggctgctg ctgtcctccg gcaagcggcg gcgcgcgcag 300
gagaggaaga aagctgtccc ttggactgaa gaagagcacc gaacatttct tgctggtctt 360
gaaaagctag gaaaggggga ctggaggggt atatctaaga actttgttac taccaggact 420
ccaactcaag tggctagtca tgctcagaaa tattttctta gacaaactaa tccaaacaag 480
aagaagcgca gatcaagcct ttttgatatg atggcaactg atatgtcacc agcaccaaac 540
tgccctgtct tgccaccato aatgggaaaa ttacatgata tggtagctat gactaaacaa 600
ctccagaaca gcagtttgga aggagtctca tcttcaagca oagttaatct agcaccacaa 660
gttgcaagag atcttcctcc cccaattcca tcttttaaag caacaaatgt agattcaagt 720
ctcagcaaaa tgaaccacat ggacggtttc ttgagggcgc ccatgctgtt cagaccaatt 780
ccaagaatcg ctgaaggggc atcttcatcg actcctgcaa ctgcaagcat agctgatctg 840
gaatttcaag ctaacotgac tgcatgttct aatgcattat tcgcgagtcc gagaagaaag 900
ccaaagaagg cagatcctcc agcagagaag gatctggatc tgacagttgc cccaccctcc 960
caacaaacca gggccagtat ttcttcccag aacgcagtag gcgtaattca agtcgtatag 1020
<210> 70
<211> 339
<212> PRT
<213> Oryza sativa <400> 70
Met Pro Gln Asp Ser Arg Pro Ala Ala Met Arg Leu Phe Gly Val Thr 10 15
Ile Ser Pro Pro Pro Pro Pro Pro Glu Pro Glu Pro Glu Pro Asp Pro 20 25 30
Ser Asp Pro Arg Asp Pro Ser Pro Arg Pro Ala Arg Glu Asp Ala Met 35 40 45
Arg Lys Cys Lys Ser Met Gly Asn Leu Ala Ala Ala Ala Ala Ala Ser 50 55 60
Ser Ala Ala Ala Gly Gly Gly Gly Ala Gly Asp Ala Gly Gly Ser Gly 65 70 75 80
Asp Gly Tyr Leu Ser Asp Gly Gly Leu Leu Leu Ser Ser Gly Lys Arg 85 90 95
Arg Arg Ala Gln Glu Arg Lys Lys Ala Val Pro Trp Thr Glu Glu Glu 100 105 HO
His Arg Thr Phe Leu Ala Gly Leu Glu Lys Leu Gly Lys Gly Asp Trp 115 120 125
Arg Gly Ile Ser Lys Asn Phe Val Thr Thr Arg Thr Pro Thr Gln Val 130 135 140
Ala Ser His Ala Gln Lys Tyr Phe Leu Arg Gln Thr Asn Pro Asn Lys 145 150 155 160
Lys Lys Arg Arg Ser Ser Leu Phe Asp Met Met Ala Thr Asp Met Ser 165 170 175
Pro Ala Pro Asn Cys Pro Val Leu Pro Pro Ser Met Gly Lys Leu His 180 185 190
Asp Met Val Ala Met Thr Lys Gln Leu Gln Asn Ser Ser Leu Glu Gly 195 200 205
Val Ser Ser Ser Ser Thr Val Asn Leu Ala Pro Gln Val Ala Arg Asp 210 215 220
Leu Pro Pro Pro Ile Pro Ser Phe Lys Ala Thr Asn Val Asp Ser Ser 225 230 235 240 Leu Ser Lys Met Asn His Met Asp Gly Phe Leu Arg Ala Pro Met Leu 245 250 255
Phe Arg Pro Ile Pro Arg Ile Ala Glu Gly Ala Ser Ser Ser Thr Pro 260 265 270
Ala Thr Ala Ser Ile Ala Asp Leu Glu Phe Gln Ala Asn Leu Thr Ala 275 280 285
Cys Ser Asn Ala Leu Phe Ala Ser Pro Arg Arg Lys Pro Lys Lys Ala 290 295 300
Asp Pro Pro Ala Glu Lys Asp Leu Asp Leu Thr Val Ala Pro Pro Ser 305 310 315 320
Gln Gln Thr Arg Ala Ser Ile Ser Ser Gln Asn Ala Val Gly Val Ile 325 330 335
Gln Val Val
<210> 71
<211> 2160
<212> DNA
<213> Oryza sativa
<400> 71
atggagatta attcctctgg tgaggaageg gtggtaaagg tgaggaagcc atacacaatc 60 acaaagcaga gggagcgttg gactgaggca gagcacaaca ggttccttga agccttgaaa 120 ctgtatggga gagcctggca gcgcatagaa gagcatgttg ggacaaagac agctgtgcag 180 atcagaagtc atgctcaaaa gttcttcacc aagttggaaa aggaagetat caacaatggc 240 acttctccag gacaagctca tgacatcgac atacetccac cacgaccaaa aagaaaacct 300 aacagtccat atcotcgaaa aagttgtctc agctctgaga catccaccag ggaagttcaa 360 aatgataagg caacaatatc aaatatgacg aacaatagca ctgcaeaaat ggcaggtgat 420 gcagctcttg agaaacttca aagaaaggag atatctgaaa aaggaagttg ctccgaagtt 480 cttaatctct ttcgagaagt cccatcggca tcattttctt cagttaacaa aagctcttca 540 aatcatggtg catccagggg gctggaaccg actaaaacag aagtcaaaga tgtggtcatc 600 ttggaaaggg attctatttc caatggtgca gggaaggatg caaaagatat caatgatcaa 660 gaaatggaaa ggctcaatgg gatacacatc agctcgaagc ctgatcattc tcatgaaaac 720 tgtttggata cctcaagcca acaatttaag ccaaaatcaa actctgtgga gacaacatat 780 gtggattggt ctgotgcaaa agcttcacac taccaaatgg acagaaatgg ggttactggc 840 tttcaagcca ctggaactga aggaagccat cctgatcaaa caagtgatca aatgggagga 900 gccagcggaa ctatgaatca atgcatccat ccaacacttc ctgtggatcc aaaattcgac 960 ggcaatgccg cagcacagcc ctttcctcac aactatgcag cctttgcacc aatgatgcaa 1020 tgccactgca accaagatgc ctacagatct tttgccaata tgtcatccac cttctccagc 1080 atgcttgtct ccacattgtt gtcaaaccct gcaatccatg cagctgccag gcttgcagca 1140 tcgtactggc ctacagtaga cggcaatact cctgatccaa atcaagaaaa tctttctgag 1200 agtgctcaag gaagccacgc tggctctcct cccaacatgg catctattgt cacagctaca 1260 gttgctgcag catcagcatg gtgggcaaca caaggtcttc tccctctttt tcctccacct 1320 atagcttttc catttgttcc agctcctagt gctccctttt ccacagcaga tgttcagcga 1380 gctcaagaga aagatataga ctgcccaatg gataatgcac agaaggaatt gcaagaaact 1440 cggaaacaag ataattttga agctatgaag gtcatagtgt cttcagagac tgatgagagt 1500 ggaaaaggag aagtgtcgct ccacactgag ttaaagatat ctccagcaga taaggccgac 1560 accaaacctg ccgcaggagc tgaaacaagt gacgtttttg gaaataagaa aaagcaggat 1620 cgctcttcat gtggttccaa cacaccgtca agtagtgata tagaagcaga taatgctcct 1680 gagaatcaag aaaaggctaa cgacaaggca aagcaagcat cttgcagtaa ctcttcagcc 1740 ggtgacaata accaccgtag atttaggagc agtgcaagca caagtgattc atggaaggaa 1800 gtttctgaag agggtcgtct ggcttttgat gcactgttca gtagagaaag gcttccccaa 1860 agcttttctc ctccgcaagt agaaggatca aaggagatta gcaaggagga agaagatgaa 1920 gtaaccacgg tgacggttga cctcaacaag aatgccgcta ttattgatca agaactcgac 1980 acagcggatg agccaagagc ttcctttcct aatgaattgt caaacctgaa gctgaaatct 2040 cgcaggaccg gtttcaaacc atacaagagg tgctcagtgg aagcgaagga gaacagggta 2100 ccggctagcg atgaggttgg taccaagagg attcgtcttg agagcgaagc atcgacatga 2160 <210> 72
<211> 719
<212> PRT
<213> Oryza sativa
<400> 72
Met Glu Ile Asn Ser Ser Gly Glu Glu Ala Val Val Lys Val Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Ala Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Gln Arg 35 40 45 Xle Glu Glu His Val Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Ile Asn Asn Gly 65 70 75 80
Thr Ser Pro Gly Gln Ala His Asp Ile Asp Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Asn Ser Pro Tyr Pro Arg Lys Ser Cys Leu Ser Ser 100 105 110
Glu Thr Ser Thr Arg Glu Val Gln Asn Asp Lys Ala Thr Ile Ser Asn 115 120 125
Met Thr Asn Asn Ser Thr Ala Gln Met Ala Gly Asp Ala Ala Leu Glu 130 135 140
Lys Leu Gln Arg Lys Glu Ile Ser Glu Lys Gly Ser Cys Ser Glu Val 145 150 155 160
Leu Asn Leu Phe Arg Glu Val Pro Ser Ala Ser Phe Ser Ser Val Asn 165 170 175
Lys Ser Ser Ser Asn His Gly Ala Ser Arg Gly Leu Glu Pro Thr Lys 180 185 190
Thr Glu Val Lys Asp Val Val Ile Leu Glu Arg Asp Ser Ile Ser Asn 195 200 205
Gly Ala Gly Lys Asp Ala Lys Asp Ile Asn Asp Gln Glu Met Glu Arg 210 215 220
Leu Asn Gly Ile His Ile Ser Ser Lys Pro Asp His Ser His Glu Asn 225 230 235 240
Cys Leu Asp Thr Ser Ser Gln Gln Phe Lys Pro Lys Ser Asn Ser Val 245 250 255
Glu Thr Thr Tyr Val Asp Trp Ser Ala Ala Lys Ala Ser His Tyr Gln 260 265 270
Met Asp Arg Asn Gly Val Thr Gly Phe Gln Ala Thr Gly Thr Glu Gly 275 280 285
Ser His Pro Asp Gln Thr Ser Asp Gln Met Gly Gly Ala Ser Gly Thr 290 295 300 Met Asn Gln Cys Ile His Pro Thr Leu Pro Val Asp Pro Lys Phe Asp 305 310 315 320
Gly Asn Ala Ala Ala Gln Pro Phe Pro His Asn Tyr Ala Ala Phe Ala 325 330 335
Pro Met Met Gln Cys His Cys Asn Gln Asp Ala Tyr Arg Ser Phe Ala 340 345 350
Asn Met Ser Ser Thr Phe Ser Ser Met Leu Val Ser Thr Leu Leu Ser 355 360 365
Asn Pro Ala Ile His Ala Ala Ala Arg Leu Ala Ala Ser Tyr Trp Pro 370 375 380
Thr Val Asp Gly Asn Thr Pro Asp Pro Asn Gln Glu Asn Leu Ser Glu 385 390 395 400
Ser Ala Gln Gly Ser His Ala Gly Ser Pro Pro Asn Met Ala Ser Ile 405 410 415
Val Thr Ala Thr Val Ala Ala Ala Ser Ala Trp Trp Ala Thr Gln Gly 420 425 430
Leu Leu Pro Leu Phe Pro Pro Pro Ile Ala Phe Pro Phe Val Pro Ala 435 440 445
Pro Ser Ala Pro Phe Ser Thr Ala Asp Val Gln Arg Ala Gln Glu Lys 450 455 460
Asp Ile Asp Cys Pro Met Asp Asn Ala Gln Lys Glu Leu Gln Glu Thr 465 470 475 480
Arg Lys Gln Asp Asn Phe Glu Ala Met Lys Val Ile Val Ser Ser Glu 485 490 495
Thr Asp Glu Ser Gly Lys Gly Glu Val Ser Leu His Thr Glu Leu Lys 500 505 510
Ile Ser Pro Ala Asp Lys Ala Asp Thr Lys Pro Ala Ala Gly Ala Glu 515 520 525
Thr Ser Asp Val Phe Gly Asn Lys Lys Lys Gln Asp Arg Ser Ser Cys 530 535 540
Gly Ser Asn Thr Pro Ser Ser Ser Asp Ile Glu Ala Asp Asn Ala Pro 545 550 555 560 Glu Asn Gln Glu Lys Ala Asn Asp Lys Ala Lys Gln Ala Ser Cys Ser 565 570 575
Asn Ser Ser Ala Gly Asp Asn Asn His Arg Arg Phe Arg Ser Ser Ala 580 585 590
Ser Thr Ser Asp Ser Trp Lys Glu Val Ser Glu Glu Gly Arg Leu Ala 595 600 605
Phe Asp Ala Leu Phe Ser Arg Glu Arg Leu Pro Gln Ser Phe Ser Pro 610 615 620
Pro Gln Val Glu Gly Ser Lys Glu Ile Ser Lys Glu Glu Glu Asp Glu 625 630 635 640
Val Thr Thr Val Thr Val Asp Leu Asn Lys Asn Ala Ala Ile Ile Asp 645 650 655
Gln Glu Leu Asp Thr Ala Asp Glu Pro Arg Ala Ser Phe Pro Asn Glu 660 665 670
Leu Ser Asn Leu Lys Leu Lys Ser Arg Arg Thr Gly Phe Lys Pro Tyr 675 680 685
Lys Arg Cys Ser Val Glu Ala Lys Glu Asn Arg Val Pro Ala Ser Asp 690 695 700
Glu Val Gly Thr Lys Arg Ile Arg Leu Glu Ser Glu Ala Ser Thr 705 710 715
<210> 73
<211> 957
<212> DNA
<213> Oryza sativa
<400> 73
atgacgaggc ggtgctcgca ctgcagccac aacgggcaca actcgcggac gtgccccaac 60 cgcggggtca agatcttcgg ggtgcgcctc accgatggct ccatccgcaa gagcgccagc 120 atggggaacc tctccctcct ctcctccgcc gccggatcca ccagcggcgg cgcctccccc 180 gccgacggcc ccgacgccgc ccccaccgcc gccgacggct acgcctccga cgacttcgtc 240 cagggctcct cctccgccac ccgcgaccgc aagaagggtg ttccttggac tgaagaagaa 300 caccggaggt ttttgcttgg attgcaaaag cttggcaaag gtgattggcg aggaatctct 360 cgtaatttcg tggtctcaag aacacctact caagtagcca gtcatgctca gaaatatttt 420 atacgccaat ccaatatgac cagaaggaaa agaaggtcta gcctttttga catggtgcca 480 gatgagtcta tggaccttcc accacttcct ggaggtcaag aaccagagac ccaagtatta 540 aatcaaccag cactacctcc accgagggag gaggaggagg tagattctat ggagtcagat 600 acttctgccg ttgcagagag ctcttccgct tctgctatca tgccagataa tttgcagtcg 660 acctatccag tgattgttcc agcttatttc tcgccctttt tgcaattctc ggttcctttc 720 tggcaaaatc agaaagatga agatggtcct gtgcaagaaa cacatgagat tgtcaagcct 780 gttccagttc attcaaagag cccaatcaac gttgatgagc ttgttggcat gtcgaagctc 840 agcataggag agtccaatca agagacagtg tctacttctc tttcattaaa tctggtagga 900 ggtcaaaata gacaatcagc tttccatgca aatccaccaa caagggcaca ggcatga 957 <210> 74
<211> 318
<212> PRT
<213> Oryza sativa
<400> 74
Met Thr Arg Arg Cys Ser His Cys Ser His Asn Gly His Asn Ser Arg 10 15
Thr Cys Pro Asn Arg Gly Val Lys Ile Phe Gly Val Arg Leu Thr Asp 20 25 30
Gly Ser Ile Arg Lys Ser Ala Ser Met Gly Asn Leu Ser Leu Leu Ser 35 40 45
Ser Ala Ala Gly Ser Thr Ser Gly Gly Ala Ser Pro Ala Asp Gly Pro 50 55 60
Asp Ala Ala Pro Thr Ala Ala Asp Gly Tyr Ala Ser Asp Asp Phe Val 65 70 75 80
Gln Gly Ser Ser Ser Ala Thr Arg Asp Arg Lys Lys Gly Val Pro Trp 85 90 95
Thr Glu Glu Glu His Arg Arg Phe Leu Leu Gly Leu Gln Lys Leu Gly 100 105 110
Lys Gly Asp Trp Arg Gly Ile Ser Arg Asn Phe Val Val Ser Arg Thr 115 120 125
Pro Thr Gln Val Ala Ser His Ala Gln Lys Tyr Phe Ile Arg Gln Ser 130 135 140
Asn Met Thr Arg Arg Lys Arg Arg Ser Ser Leu Phe Asp Met Val Pro 145 150 155 160 Asp Glu Ser Met Asp Leu Pro Pro Leu Pro Gly Gly Gln Glu Pro Glu 165 170 175
Thr Gln Val Leu Asn Gln Pro Ala Leu Pro Pro Pro Arg Glu Glu Glu 180 185 190
Glu Val Asp Ser Met Glu Ser Asp Thr Ser Ala Val Ala Glu Ser Ser 195 200 205
Ser Ala Ser Ala Ile Met Pro Asp Asn Leu Gln Ser Thr Tyr Pro Val 210 215 220
Ile Val Pro Ala Tyr Phe Ser Pro Phe Leu Gln Phe Ser Val Pro Phe 225 230 235 240
Trp Gln Asn Gln Lys Asp Glu Asp Gly Pro Val Gln Glu Thr His Glu 245 250 255
Ile Val Lys Pro Val Pro Val His Ser Lys Ser Pro Ile Asn Val Asp 260 265 270
Glu Leu Val Gly Met Ser Lys Leu Ser Ile Gly Glu Ser Asn Gln Glu 275 280 285
Thr Val Ser Thr Ser Leu Ser Leu Asn Leu Val Gly Gly Gln Asn Arg 290 295 300
Gln Ser Ala Phe His Ala Asn Pro Pro Thr Arg Ala Gln Ala 305 310 315
<210> 75
<211> 798
<212> DNA
<213> Oryza sativa
<400> 75
atggagcagc atgaggaggc agcggagagg aagccttcgc cgccggtgat attccggctg 60 ttcggcgtcg aggtccgcgg cggcggcggc ggagttgacg aggaggagta cgaggaggag 120 gaggtggagg gtggattgtt catcaagaag agctccagta tgcccaacct cacctccatc 180 gacccgctgc cggtgccggc cgacggcggc aaacggcgcg cctccgacga ctccgagctc 240 gcctccggcc agcagaagcg ccgccgccgc aaggtgcagg agaggaagaa aggggtacca 300 tggactgagg aggagcacaa gaaattcctg gaagggctga ggcagctggg gaaaggggac 360 tggagaggca tctccaagaa ctttgtgacc agcaggacgg cgactcaggt ggccagccac 420 gcccagaagt acttcctccg gcagaccaac cctggcaaaa agaagcgccg ggccagcctc 480 tttgatgttg ttgotgagtg cagtgatgat cagcttccaa gtcctcagag tgttggaact 540 aagcctccta cccaggatat aattcataca gatcgcggcg atgtcccgat actaagctat 600 ccagttgcta gaggctttag aggcgatagc gtgcaggttg atgaactaac tgaatatgtg 660 aagagattaa aggccgccga ggacatgtcg ctctccatga tctctggact ggaaatggca 720 tcatcatcca tcagcagtct agagctcagt atcgcgcctc ctcattgcgc gatcgaggcg 780 gccatcaagg tgctgtga 798 <210> 76
<211> 265
<212> PRT
<213> Oryza sativa
<400> 76
Met Glu Gln His Glu Glu Ala Ala Glu Arg Lys Pro Ser Pro Pro Val 10 15
Ile Phe Arg Leu Phe Gly Val Glu Val Arg Gly Gly Gly Gly Gly Val 20 25 30
Asp Glu Glu Glu Tyr Glu Glu Glu Glu Val Glu Gly Gly Leu Phe Ile 35 40 45
Lys Lys Ser Ser Ser Met Pro Asn Leu Thr Ser Ile Asp Pro Leu Pro 50 55 60
Val Pro Ala Asp Gly Gly Lys Arg Arg Ala Ser Asp Asp Ser Glu Leu 65 70 75 80
Ala Ser Gly Gln Gln Lys Arg Arg Arg Arg Lys Val Gln Glu Arg Lys 85 90 95
Lys Gly Val Pro Trp Thr Glu Glu Glu His Lys Lys Phe Leu Glu Gly 100 105 110
Leu Arg Gln Leu Gly Lys Gly Asp Trp Arg Gly Ile Ser Lys Asn Phe 115 120 125
Val Thr Ser Arg Thr Ala Thr Gln Val Ala Ser His Ala Gln Lys Tyr 130 135 140
Phe Leu Arg Gln Thr Asn Pro Gly Lys Lys Lys Arg Arg Ala Ser Leu 145 150 155 160
Phe Asp Val Val Ala Glu Cys Ser Asp Asp Gln Leu Pro Ser Pro Gln 165 170 175 Ser Val Gly Thr Lys Pro Pro Thr Gln Asp Ile Ile His Thr Asp Arg 180 185 190
Gly Asp Val Pro Ile Leu Ser Tyr Pro Val Ala Arg Gly Phe Arg Gly 195 200 205
Asp Ser Val Gln Val Asp Glu Leu Thr Glu Tyr Val Lys Arg Leu Lys 210 215 220
Ala Ala Glu Asp Met Ser Leu Ser Met Ile Ser Gly Leu Glu Met Ala 225 230 235 240
Ser Ser Ser Ile Ser Ser Leu Glu Leu Ser Ile Ala Pro Pro His Cys 245 250 255
Ala Ile Glu Ala Ala Ile Lys Val Leu 260 265
<210> 77 <211> 1476 <212> DNA <213> Oryza sativa
<400> 77
atggagatgg cctgtttgcc gggaaacgcc atggcaaccg acgaaaacgg tgccgacgat 60 cgcgccggcg gcgagagcac cgtggatcat ctcaggagcc atatgaacta cggcgacatg 120 gatttgtcag gggaagagca cgtgccaaag gcgcgaaagc cgtacacgat cacgaagcag 180 cgcgagaagt ggacggacga ggagcacagg ctgttcttgg aagccctgca gctgcacggc 240 cgcgcatggc gccgtataca agagcacata ggtaccaaga ctgccgtgca aatccgtagc 300 cacgcgcaga agttcttctc taaggtcgtc agagaatctt cggggagtaa caccggctcg 360 ggcggcgcgt ccgccgcggc ggcggcggcg gccatccaga tccctccgcc gcggccgaag 420 aggaagccgg cgcacccgta cccgcgcaag gtggacggcg cggccaagaa gcacgtcccg 480 gcgctcaggc agctggagaa gccgccgttg tggatgcagt ccctgtccga gcaggaggag 540 ggctcgccga cgtcggtgct gacggcggcg cagataggca ccgaggccct gggcggtggg 600 ttctcgaata actcgagcgg cagcgggtcg ctggctccgt cagccgccgg tacggatgag 660 catgtcgacg gtggcggctc gccggcgtcg tcggtggaca gagaggacgg gtgcctctca 720 ccgagcatcc cgactgctga gttggctatg caggcgccaa atactaagat gtcaattgca 780 accacggatg ccaaagaagc atcctcagaa gcatcagtct tcaggctatt cggaaagagc 840 gtagtggtta aggattcaga ccagctgcac ctgcttaatg gcagtaacat tgcaacgagt 900 ggttcagttg agagagcaac cagaaacata ctagtacctt cttttgctgc tgccccagaa 960 gggagctcgt cgaatccatg gccgagcagc atgcaacagt ttctctactt ccttcctcga 1020 tcggatggtt tcgccgcgca acctgtcatg ccatggttga gctacaacgg gagccttcca 1080 tgcgcgctgt tctacccggc ggcggcggcg gctgcgaacc agcagtgcca ccgtgattca 1140 gagggcgtag agttcagagt ctcgcagagg gaaggatcgc tgacgggctc gaacacggcc 1200 tccagcgtcg tgcttggatc gtcggcggcg gtaccggcgg cggcggcggc ggctcagaat 1260 tcggacgtcg cggagtcccg tggccaaggg aacagcaggg aggcggcggc ctcgccacgg 1320 ctgaccaagt gcgagagctc ggcgtccgtc accctgctgc agaggggctt catgccgtac 1380 aagaggtgcg cggcggagag cgagctgctg cgatcggagg ccgccggagg agaggaggcc 1440 gtcgccgacg gtgagctgac aaggctgtgc ttgtga 1476 <210> 78
<211> 491
<212> PRT
<213> Oryza sativa
<400> 78
Met Glu Met Ala Cys Leu Pro Gly Asn Ala Met Ala Thr Asp Glu Asn 10 15
Gly Ala Asp Asp Arg Ala Gly Gly Glu Ser Thr Val Asp His Leu Arg 20 25 30
Ser His Met Asn Tyr Gly Asp Met Asp Leu Ser Gly Glu Glu His Val 35 40 45
Pro Lys Ala Arg Lys Pro Tyr Thr Ile Thr Lys Gln Arg Glu Lys Trp 50 55 60
Thr Asp Glu Glu His Arg Leu Phe Leu Glu Ala Leu Gln Leu His Gly 65 70 75 80
Arg Ala Trp Arg Arg Ile Gln Glu His Ile Gly Thr Lys Thr Ala Val 85 90 95
Gln Ile Arg Ser His Ala Gln Lys Phe Phe Ser Lys Val Val Arg Glu 100 105 110
Ser Ser Gly Ser Asn Thr Gly Ser Gly Gly Ala Ser Ala Ala Ala Ala 115 120 125
Ala Ala Ala Ile Gln Ile Pro Pro Pro Arg Pro Lys Arg Lys Pro Ala 130 135 140 His Pro Tyr Pro Arg Lys Val Asp Gly Ala Ala Lys Lys His Val Pro 145 150 155 160
Ala Leu Arg Gln Leu Glu Lys Pro Pro Leu Trp Met Gln Ser Leu Ser 165 170 175
Glu Gln Glu Glu Gly Ser Pro Thr Ser Val Leu Thr Ala Ala Gln Ile 180 185 190
Gly Thr Glu Ala Leu Gly Gly Gly Phe Ser Asn Asn Ser Ser Gly Ser 195 200 205
Gly Ser Leu Ala Pro Ser Ala Ala Gly Thr Asp Glu His Val Asp Gly 210 215 220
Gly Gly Ser Pro Ala Ser Ser Val Asp Arg Glu Asp Gly Cys Leu Ser 225 230 235 240
Pro Ser Ile Pro Thr Ala Glu Leu Ala Met Gln Ala Pro Asn Thr Lys 245 250 255
Met Ser Ile Ala Thr Thr Asp Ala Lys Glu Ala Ser Ser Glu Ala Ser 260 265 270
Val Phe Arg Leu Phe Gly Lys Ser Val Val Val Lys Asp Ser Asp Gln 275 280 285
Leu His Leu Leu Asn Gly Ser Asn Ile Ala Thr Ser Gly Ser Val Glu 290 295 300
Arg Ala Thr Arg Asn Ile Leu Val Pro Ser Phe Ala Ala Ala Pro Glu 305 310 315 320
Gly Ser Ser Ser Asn Pro Trp Pro Ser Ser Met Gln Gln Phe Leu Tyr 325 330 335
Phe Leu Pro Arg Ser Asp Gly Phe Ala Ala Gln Pro Val Met Pro Trp 340 345 350
Leu Ser Tyr Asn Gly Ser Leu Pro Cys Ala Leu Phe Tyr Pro Ala Ala 355 360 365
Ala Ala Ala Ala Asn Gln Gln Cys His Arg Asp Ser Glu Gly Val Glu 370 375 380
Phe Arg Val Ser Gln Arg Glu Gly Ser Leu Thr Gly Ser Asn Thr Ala 385 390 395 400 Ser Ser Val Val Leu Gly Ser Ser Ala Ala Val Pro Ala Ala Ala Ala
Ala Ala Gln Asn Ser Asp Val Ala Glu Ser Arg Gly Gln Gly Asn Ser
Arg Glu Ala Ala Ala Ser Pro Arg Leu Thr Lys Cys Glu Ser Ser Ala
Ser Val Thr Leu Leu Gln Arg Gly Phe Met Pro Tyr Lys Arg Cys Ala
Ala Glu Ser Glu Leu Leu Arg Ser Glu Ala Ala Gly Gly Glu Glu Ala
Val Ala Asp Gly Glu Leu Thr Arg Leu Cys Leu
<210> 79
<211> 1392
<212> DNA
<213> Oryza sativa
<400> 79
atggcgcgtt ttcaggaaac caaggcgagg aatgatcaag gacctgttgc tgatcatgtt 60
gggcaccaaa acctcatgga aaacctcaca gatcctctgg attccagtgg catggacatg 120
atggacgaag cgcgaattcc taaggcgcgg aagccataca cgataacgaa gcaaagggag 180
aaatggaccg aggacgaaca taagctgttc ttggaagccc tgcagctcca tggccgagcc 240
tggcgacgca tccaagagca cataggoacc aagactgccg tgcagatcag gagccacgca 300
cagaagttct tctccaaggt catcaaagaa tcatctgggg acaattgcaa cagcttgggt 360
gctgcatcat caattcagat tcccccgccg cggccgaagc gtaagcctgt tcatccgtac 420
ccacgcaatc tagggagcac agccagcaag aacgtccctg cactgaaaca gctagagaag 480
cotcagctgc aggtgcagtc tctctacgac caggacaatg ggtcgccgac gtcagtgtta 540
acagtaccac agatacgggc tgatacactg ggaagtgaga gtggtgggtc gccaacctcg 600
acgattgata ttgaagagag atgtcctaca ccaagcatag caactgctga gttagctatg 660
gagttgcctc ctacaaatga cgaggaggtc aagggcaatg gogatcatga agaagttaca 720
tgtgacagat caggagttcc agtccttagg ctatttggca agagggttat ggtgaatgat 780
ttacatcaga tgtcagcccc tgatgccggg aaoctgcaaa ctgtggcaga catggaagtg 840
gacgcttcag ctgagacacc aactagtgga actgggaaat tctcttccca tggtgcagca 900
gaagcaaata catggaacco atggctgact aacacacagc agtttctgta ttatcttcct 960 aacggacaaa ttttctccgt gcattctgct ctcccatgct tcacctacca taatgagggt 1020 gttacttgca cccagttttc aaacccacag gtggtagcct cagatcaaca gcatcaacac 1080 caaacttctg aagctgtaga ttacaagggt atacagaggg aaggatcttg gacggagtca 1140 aatacatcct caagcagtgt gcctgaaaca gcaactcata attcagagac tacagaatca 1200 tatagaaacg gaaacagaaa cgaagatgaa atggtacctt ctccagattc aagaaaatgt 1260 gtgagcccag gttccaactg caggcgaggc tttgtgccgt acaagagatg tgttgctgat 1320 agtgaggcgc tgctgaagtc acaggcgcct caggaggagg cagacggaga gatgacgagg 1380 ctgtgcttat aa 1392 <210> 80
<211> 463
<212> PRT
<213> Oryza sativa
<400> 80
Met Ala Arg Phe Gln Glu Thr Lys Ala Arg Asn Asp Gln Gly Pro Val 10 15
Ala Asp His Val Gly His Gln Asn Leu Met Glu Asn Leu Thr Asp Pro 20 25 30
Leu Asp Ser Ser Gly Met Asp Met Met Asp Glu Ala Arg Ile Pro Lys 35 40 45
Ala Arg Lys Pro Tyr Thr Ile Thr Lys Gln Arg Glu Lys Trp Thr Glu 50 55 60
Asp Glu His Lys Leu Phe Leu Glu Ala Leu Gln Leu His Gly Arg Ala 65 70 75 80
Trp Arg Arg Ile Gln Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile 85 90 95
Arg Ser His Ala Gln Lys Phe Phe Ser Lys Val Ile Lys Glu Ser Ser 100 105 110
Gly Asp Asn Cys Asn Ser Leu Gly Ala Ala Ser Ser Ile Gln Ile Pro 115 120 125
Pro Pro Arg Pro Lys Arg Lys Pro Val His Pro Tyr Pro Arg Asn Leu 130 135 140
Gly Ser Thr Ala Ser Lys Asn Val Pro Ala Leu Lys Gln Leu Glu Lys 145 150 155 160 Pro Gln Leu Gln Val Gln Ser Leu Tyr Asp Gln Asp Asn Gly Ser Pro 165 170 175
Thr Ser Val Leu Thr Val Pro Gln Ile Arg Ala Asp Thr Leu Gly Ser 180 185 190
Glu Ser Gly Gly Ser Pro Thr Ser Thr Ile Asp Ile Glu Glu Arg Cys 195 200 205
Pro Thr Pro Ser Ile Ala Thr Ala Glu Leu Ala Met Glu Leu Pro Pro 210 215 220
Thr Asn Asp Glu Glu Val Lys Gly Asn Gly Asp His Glu Glu Val Thr 225 230 235 240
Cys Asp Arg Ser Gly Val Pro Val Leu Arg Leu Phe Gly Lys Arg Val 245 250 255
Met Val Asn Asp Leu His Gln Met Ser Ala Pro Asp Ala Gly Asn Leu 260 265 270
Gln Thr Val Ala Asp Met Glu Val Asp Ala Ser Ala Glu Thr Pro Thr 275 280 285
Ser Gly Thr Gly Lys Phe Ser Ser His Gly Ala Ala Glu Ala Asn Thr 290 295 300
Trp Asn Pro Trp Leu Thr Asn Thr Gln Gln Phe Leu Tyr Tyr Leu Pro 305 310 315 320
Asn Gly Gln Ile Phe Ser Val His Ser Ala Leu Pro Cys Phe Thr Tyr 325 330 335
His Asn Glu Gly Val Thr Cys Thr Gln Phe Ser Asn Pro Gln Val Val 340 345 350
Ala Ser Asp Gln Gln His Gln His Gln Thr Ser Glu Ala Val Asp Tyr 355 360 365
Lys Gly Ile Gln Arg Glu Gly Ser Trp Thr Glu Ser Asn Thr Ser Ser 370 375 380
Ser Ser Val Pro Glu Thr Ala Thr His Asn Ser Glu Thr Thr Glu Ser 385 390 395 400
Tyr Arg Asn Gly Asn Arg Asn Glu Asp Glu Met Val Pro Ser Pro Asp 405 410 415 Ser Arg Lys Cys Val Ser Pro Gly Ser Asn Cys Arg Arg Gly Phe Val 420 425 430
Pro Tyr Lys Arg Cys Val Ala Asp Ser Glu Ala Leu Leu Lys Ser Gln 435 440 445
Ala Pro Gln Glu Glu Ala Asp Gly Glu Met Thr Arg Leu Cys Leu 450 455 460
<210> 81
<211> 1356
<212> DNA
<213> Oryza sativa
<400> 81
atggcttcca tgccgcagct ggaggaaaag gattcatccg atttggcaat caacaaaggc 60 ccgtcgctgg atcttgtcaa atctcccttg atgatgaatg atgcatctgc aactgtaact 120 gcaatgcagc ccaacgaggg gatggaggag ttccctgtca aggttcggaa gccttacacg 180 atcaccaagc agcgggagaa gtggacggaa gaagagcacg acaagttcct tgaggcattg 240 aagctgtatg gtcgctcttg gcgtcagata caagagcaca ttggcacaaa gactgctgtc 300 caaa ttcgga gccatgccca gaagtttttc tcaaaggtgg tgcgtgagcc cggttccaat 360 aatgcgattg agatccctcc acctaggcca aagagaaaac cacttcatcc gtaccctcga 420 aagtgtgcga attctggatc ggacgcaaat ccagcaacag cgcaattgaa gcttgctcct 480 ggctcatctt catctggctc tgatcaagag aatggttctc ctatatcggt gctatctgcg 540 atgcagtcag atgcttttgg atcgtcagta tccaatccat caaccagatg tacctcccca 600 gcgtcatctg acgatggaaa taacattccc acattcacga gtggggaaga taataatgtg 660 ccttgtgaac caacagtgat agatccgtcc cagtcccaca aggaaataga ccaagataga 720 aaagacgtga ataatatgtc tgaagaggat tcttcagaag aagaggtgca agaaacaagc 780 ttgaagctat ttgggaggac agttgtcatc ccagatccaa ggaagagaag ctcctcagat 840 ccgaagcatg aaagtgagga gcagatatca cagccttcca atgaagaaat gttgcaggct 900 tcttcatcgg ttggggagat tccagcggca tattgtgcac caaatggttg gtttatgtca 960 tacaattctt tcccattcca attcggtgaa tcagcggcag atgctagaat tcccccttta 1020 cacgtgtggt ggccttacta cggttttgct cccattagcc atcctagagg actaagcaca 1080 gtgatgcagc agactgaagg tagtgacgag agtgacggtg tgaagagcca ctcatccgaa 1140 tcaagttcgg actccgggga aaatgtgcag atgaccgctc cccagagctc gagaatagtg 1200 gaatcacttg gagcgattta cgtccgagac tcaggttcaa gttttgagct aaaaccgagc 1260 gcaaattcag cgtttgtaag agtgaagcca agcaacagcg gagatgaaga ggtaataagg 1320 ggatttgtgc cttataaaag atgcaaattt caataa
<210> 82
<211> 451
<212> PRT
<213> Oryza sativa
<400> 82
Met Ala Ser Met Pro Gln Leu Glu Glu Lys Asp Ser Ser Asp Leu Ala 10 15
Ile Asn Lys Gly Pro Ser Leu Asp Leu Val Lys Ser Pro Leu Met Met 20 25 30
Asn Asp Ala Ser Ala Thr Val Thr Ala Met Gln Pro Asn Glu Gly Met 35 40 45
Glu Glu Phe Pro Val Lys Val Arg Lys Pro Tyr Thr Ile Thr Lys Gln 50 55 60
Arg Glu Lys Trp Thr Glu Glu Glu His Asp Lys Phe Leu Glu Ala Leu 65 70 75 80
Lys Leu Tyr Gly Arg Ser Trp Arg Gln Ile Gln Glu His Ile Gly Thr 85 90 95
Lys Thr Ala Val Gln Ile Arg Ser His Ala Gln Lys Phe Phe Ser Lys 100 105 110
Val Val Arg Glu Pro Gly Ser Asn Asn Ala Ile Glu Ile Pro Pro Pro 115 120 125
Arg Pro Lys Arg Lys Pro Leu His Pro Tyr Pro Arg Lys Cys Ala Asn 130 135 140
Ser Gly Ser Asp Ala Asn Pro Ala Thr Ala Gln Leu Lys Leu Ala Pro 145 150 155 160
Gly Ser Ser Ser Ser Gly Ser Asp Gln Glu Asn Gly Ser Pro Ile Ser 165 170 175
Val Leu Ser Ala Met Gln Ser Asp Ala Phe Gly Ser Ser Val Ser Asn 180 185 190
1356
Pro Ser Thr Arg Cys Thr Ser Pro Ala Ser Ser Asp Asp Gly Asn Asn 195 200 205 Ile Pro Thr Phe Thr Ser Gly Glu Asp Asn Asn Val Pro Cys Glu Pro 210 215 220
Thr Val Ile Asp Pro Ser Gln Ser His Lys Glu Ile Asp Gln Asp Arg 225 230 235 240
Lys Asp Val Asn Asn Met Ser Glu Glu Asp Ser Ser Glu Glu Glu Val 245 250 255
Gln Glu Thr Ser Leu Lys Leu Phe Gly Arg Thr Val Val Ile Pro Asp 260 265 270
Pro Arg Lys Arg Ser Ser Ser Asp Pro Lys His Glu Ser Glu Glu Gln 275 280 285
Ile Ser Gln Pro Ser Asn Glu Glu Met Leu Gln Ala Ser Ser Ser Val 290 295 300
Gly Glu Ile Pro Ala Ala Tyr Cys Ala Pro Asn Gly Trp Phe Met Ser 305 310 315 320
Tyr Asn Ser Phe Pro Phe Gln Phe Gly Glu Ser Ala Ala Asp Ala Arg 325 330 335
Ile Pro Pro Leu His Val Trp Trp Pro Tyr Tyr Gly Phe Ala Pro Ile 340 345 350
Ser His Pro Arg Gly Leu Ser Thr Val Met Gln Gln Thr Glu Gly Ser 355 360 365
Asp Glu Ser Asp Gly Val Lys Ser His Ser Ser Glu Ser Ser Ser Asp 370 375 380
Ser Gly Glu Asn Val Gln Met Thr Ala Pro Gln Ser Ser Arg Ile Val 385 390 395 400
Glu Ser Leu Gly Ala Ile Tyr Val Arg Asp Ser Gly Ser Ser Phe Glu 405 410 415
Leu Lys Pro Ser Ala Asn Ser Ala Phe Val Arg Val Lys Pro Ser Asn 420 425 430
Ser Gly Asp Glu Glu Val Ile Arg Gly Phe Val Pro Tyr Lys Arg Cys 435 440 445
Lys Phe Gln 450 <210> 83
<211> 2338
<212> DNA
<213> Lemna paucicostata <220>
<221> misc_feature
<222> (2259) . . (2259)
<223> η é a, c, g, or t
<220>
<221> misc_feature
<222> (2308) . . (2308)
<223> n é a, c, g, or t
<400> 83
ctaatacgac tcactatagg gcaagcagtg gtatcaacgc agagtacgcg ggcggaaaag 60 atcgtggctg agatttatcc acttcgaaga actagagaga gaaagaggga gctcaagcga 120 gcttaagtct gcggcggagg agagattcct ttcttttctc cgctttttcc ttcctcttag 180 agctggagat ctgttgccac ggcttaaatc tcgatccgag cggttttagc cgcggaaatt 240 gcggtttgat tgggcaggga gatgagaaag aagagaagaa gagcggagaa gagatgatta 300 tcggtttttg gcgccggatt tagatatatg ttatatcgag tacagttgta ttaattcctg 360 ttaagtgatc caattaagta gaattactgg attctttaat cgctatggtt tcctttagtt 420 tcttggttca tcccagatta tttgatgcta agccaatttg cagttattat ttgaattctg 480 tgagaaattt tcacggcgaa tcgaaatgga gagaagatgc aggctcgaag aggattgctc 540 gaagtgaact gctccgtctt ttttgctatt tgttactgca cattgcagta atggaaacat 600 gttcttccgg agaggaattg gtcataaagc caaggaaacc ctacaccata accaaacaga 660 gagagaagtg gaccgaggag gaacacaaca gattcctgga agccttgaag ctctatggaa 720 gagcatggca gcgaatcgaa gagcacattg gaacaaagac tgctgtgcag attagaagtc 780 atgcacagaa gttcttcact aagttagaaa aagaagccgt ctccaaaggc gttcccctcg 840 gccaagtcca cgacatcgac atccctcctc cccgccccaa gcggaaaccc aacaaccctt 900 accctcgtaa gctcggtgtg ggtcccacct gcccttctgg ctcggagaga gaagataaca 960 agacgttgac tcaccttcct tctctgaact ccaaggggaa agccgaagat tcccccgagt 1020 cgtcccacga gaaccaagct ggaataaagc cagataagaa aaccccggag agtccagtca 1080 ttctctctct cttccacgtg gcgccacctc cttccacccc ttcctccagc aaatccccgg 1140 tgtcttcctt gggtaaggga atggcagaag aaaacaaccc taaaatctgc cacgttgacc 1200 gagtcaaccc caaactccca tccccgtcag caatctcctc ggtccaccaa tcccatccct 1260 tctcctggcc ccacatcccg cccgcattct ccacacatct gacgtcagcc ctagttcaaa 1320 accctgcagc tcatgcagct gctaacttgg cagcgtctta ttggttgagt gctgacgtgg 1380 aagccgcctc ctcagtagac tccgccagct ctgcgtctcc caccatggcc gccgcagctg 1440 ccgccaccgt ggctgccgcc tccgcctggt gggccaccca agggttgctc cccttctgct 1500 atccttcgtt caacggctgc ttcgccgctt tcgcgccgcc gccgactccc atcacgttga 1560 ctgagtcaac gggagtcaag gttaacccta atgtagaaga acaagaggaa cagggccgtt 1620 caaaggggtc gcctttatcg tccacggact caaaccctag cgagaagaga gaagtcaacg 1680 gcgaggggga ggtcaaagtc caaggtcaaa gcttgaccca acgagaggaa aagtcaaccc 1740 tagaggggaa gaatcagttg gaccggtctt cctccgggtc aaacacacct ggaagcgaag 1800 tggagaa tga aggtgtggag cccacagagg atgaaatgcc caaagaggag gctgttgacc 1860 ctactcgccg cggagttgac ccccgaaaag aagtctccaa agagggccgc ctcgccttcc 1920 aagcgctctt ctcccgggaa gttctaccgc agagcttctc ccccaccgag acagaagacc 1980 aaaaggaaca aaagtcaacg gaagtcaacc ctcacccgga agtcaacccc gttgaccgaa 2040 tccccgcaga gctaagtcaa cacaggctca agcctcactg cacaggattc aagccttaca 2100 agaggtgctc ggtggaggcc aaacagacgg agccgccgcc agaagaagat aaatgtagta 2160 agagaatatg tctggagaga gaggcctcca tttgacttgg tcaacgcttc gaccaagtct 2220 ttctctctct taccctttac ctgtcaaact ttggaaccnc Cttttttttt cttctcatat 2280 tctttcccca ggggactgcc atgattcncg gtaaaaaaaa aaaaaaaaaa aaaaaaaa 2338 <210> 84 <211> 534 <212> PRT
<213> Lemna paucicostata <400> 84
Met Glu Thr Cys Ser Ser Gly Glu Glu Leu Val Ile Lys Pro Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Lys Trp Thr Glu Glu Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Gln Arg 35 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln He Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Val Ser Lys Gly 65 70 75 80
Val Pro Leu Gly Gln Val His Asp Ile Asp Ile Pro Pro Pro Arg Pro 85 90 95 Lys Arg Lys Pro Asn Asn Pro Tyr Pro Arg Lys Leu Gly Val Gly Pro 100 105 110
Thr Cys Pro Ser Gly Ser Glu Arg Glu Asp Asn Lys Thr Leu Thr His 115 120 125
Leu Pro Ser Leu Asn Ser Lys Gly Lys Ala Glu Asp Ser Pro Glu Ser 130 135 140
Ser His Glu Asn Gln Ala Gly Ile Lys Pro Asp Lys Lys Thr Pro Glu 145 150 155 160
Ser Pro Val Ile Leu Ser Leu Phe His Val Ala Pro Pro Pro Ser Thr 165 170 175
Pro Ser Ser Ser Lys Ser Pro Val Ser Ser Leu Gly Lys Gly Met Ala 180 185 190
Glu Glu Asn Asn Pro Lys Ile Cys His Val Asp Arg Val Asn Pro Lys 195 200 205
Leu Pro Ser Pro Ser Ala Ile Ser Ser Val His Gln Ser His Pro Phe 210 215 220
Ser Trp Pro His Ile Pro Pro Ala Phe Ser Thr His Leu Thr Ser Ala 225 230 235 240
Leu Val Gln Asn Pro Ala Ala His Ala Ala Ala Asn Leu Ala Ala Ser 245 250 255
Tyr Trp Leu Ser Ala Asp Val Glu Ala Ala Ser Ser Val Asp Ser Ala 260 265 270
Ser Ser Ala Ser Pro Thr Met Ala Ala Ala Ala Ala Ala Thr Val Ala 275 280 285
Ala Ala Ser Ala Trp Trp Ala Thr Gln Gly Leu Leu Pro Phe Cys Tyr 290 295 300
Pro Ser Phe Asn Gly Cys Phe Ala Ala Phe Ala Pro Pro Pro Thr Pro 305 310 315 320
Ile Thr Leu Thr Glu Ser Thr Gly Val Lys Val Asn Pro Asn Val Glu 325 330 335
Glu Gln Glu Glu Gln Gly Arg Ser Lys Gly Ser Pro Leu Ser Ser Thr 340 345 350
Asp Ser Asn Pro Ser Glu Lys Arg Glu Val Asn Gly Glu Gly Glu Val 355 360 365
Lys Val Gln Gly Gln Ser Leu Thr Gln Arg Glu Glu Lys Ser Thr Leu 370 375 380
Glu Gly Lys Asn Gln Leu Asp Arg Ser Ser Ser Gly Ser Asn Thr Pro 385 390 395 400
Gly Ser Glu Val Glu Asn Glu Gly Val Glu Pro Thr Glu Asp Glu Met 405 410 415
Pro Lys Glu Glu Ala Val Asp Pro Thr Arg Arg Gly Val Asp Pro Arg 420 425 430
Lys Glu Val Ser Lys Glu Gly Arg Leu Ala Phe Gln Ala Leu Phe Ser 435 440 445
Arg Glu Val Leu Pro Gln Ser Phe Ser Pro Thr Glu Thr Glu Asp Gln 450 455 460
Lys Glu Gln Lys Ser Thr Glu Val Asn Pro His Pro Glu Val Asn Pro 465 470 475 480
Val Asp Arg Ile Pro Ala Glu Leu Ser Gln His Arg Leu Lys Pro His 485 490 495
Cys Thr Gly Phe Lys Pro Tyr Lys Arg Cys Ser Val Glu Ala Lys Gln 500 505 510
Thr Glu Pro Pro Pro Glu Glu Asp Lys Cys Ser Lys Arg Ile Cys Leu 515 520 525
Glu Arg Glu Ala Ser Ile 530
<210> 85
<211> 2379
<212> DNA
<213> Lemna gibba
<220>
<221> misc_feature
<222> (2202) . . (2202)
<223> η é a, c, g, or t
<220> <221> misc_feature
<222> (2224) . . (2224) <223> η é a, c, g, or t
<220>
<221> misc_feature
<222> (2226) . . (2226)
<223> n é a, c, g, or t
<220>
<221> misc_feature <222> (2228) . . (2228) <223> n é a, c, g, or t
<220>
<221> miso_feature
<222> (2240) . . (2240)
<223> n é a, o, g, or t
<220>
<221> misc_feature
<222> (2248) . . (2248)
<223> n é a, c, g, or t
<220>
<221> miso_feature
<222> (2250) . . (2250)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2255) . . (2255)
<223> n é a, c, g, or t
<220>
<221> miso_feature
<222> (2259) . . (2259)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2262) .. (2262)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2274) . . (2274)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2280) . . (2280)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2287) . . (2288)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2302) . . (2302)
<223> n é a, c, g, or t <220>
<221> misc_feature
<222> (2313) . . (2313)
<223> η é a, σ, g, or t
<220>
<221> misc_feature
<222> (2318)..(2318)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2320) . . (2320)
<223> n é a, c, g, or t
<220>
<221> nisc_feature
<222> (2323) .. (2323)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2325) .. (2325)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2329) . . (2329)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2331) . . (2331)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2333) . . (2333)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2335) . . (2335)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2337) . . (2337)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2342) . . (2343)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2349) . . (2349)
<223> n é a, c, g, or t
<220>
<221> misc feature <222> (2352)..(2352)
<223> η é a, c, g, or t
<220>
<221> misc_feature
<222> (2359) .. (2359)
<223> n é a, c, g, or t
<400> 85
ctaatacgac tcactatagg gcaagcagtg gtatcaacgc agagtacgcg ggggaggaag 60 aggaggaagc gagccttctc cgagctcgat ttcagcggct tccggagcct ggattactct 120 cttttcttcg ctttttcctc gctctgagca ctggagatca gttcaactag gtcagctctc 180 aatctgacca gttttcccga agaaattggg agattgggga agccaggcga tgagaaagaa 240 gaggagaaga gggaattaga gaagcgcctt gatttttgct gtcagagtta gttcaacgga 300 gttgtgaatt tgattctcca gttattcgtc agtccgatcg aagtcatgga tagaagatgc 360 gccctcgttg gggaatatac gaattgagcc tctccgtgtt ttttgctctt tttttctgcg 420 aattgcagtt atggagacat gttcctccgg agaggaattg atcgtgaagc caaggaaacc 480 gtacacgatt acgaaacagc gagagaagtg gaccgaggaa gaacacaaca gattcctcga 540 agccttgaag ctatacggaa gagcctggca gcgaa tagaa gagcatattg gcacaaagac 600 cgctgtacaa ataagaagtc atgcacaaaa gttcttcact aagttagaaa aagaagcagt 660 atctaaaggc gttcctctgg gtcaagtcca tgatattgag atccctcctc cgcgccctaa 720 acgaaaaccg accaatccct atcctcgaaa gatcggtg tg ggcccctcct acccatctgg 780 aggagagaga gatgataaca gacaattaac gcaccttcct tcttcttctt tacattccaa 840 gggcaaagcc gaagattttt tcgtcgattc ttctcccgag aagcaagcag gaatgaactc 900 ggagaaaatt accaaagagg ccccagttgc cctctctctc ttccacgtgg cgccttcttc 960 tcccacccct tcctcgagca aatccaccgt tcctttacca gatgacgaaa aaaacccaag 1020 catcaatttt gacttgaaca agaagaaccg cccttgcgga gtcaacgcag accctaatac 1080 agtcaaattt ccatccccat cggccatctc ctcggtccac caatccactg ctgcctttcc 1140 tcatccattc agttggcccc acgtcccgcc ggctttctcc agccacctga cgtcagccct 1200 acttcagaat ccggcggcgc atgcggccgc caacatggcc gcgtctttct ggttgactgc 1260 tgacgtggag acttcttcct ccgttgactc cgggaatgcc gccagctcgt cttcccctag 1320 tgtggcggcg gcggcgattg ccaccgtggc ggcggcgtca gcttggtggg ccacccatgg 1380 actcctccct ttctgctacc cttcattcaa cggctgcttc gccgccgttc ctccgcctcc 1440 gacgaccacc ccgacgctga ccgaggcgac ccgagtcaaa gtcaaccctc gcaacggcaa 1500 agaggaagag gaaaaggatc tccgtcaagg tttcgacccg ggcacgtcgt tgaccgcgaa 1560 gggctcacct ctctcgtcaa cagattccaa cccgagtgag aaaagagagg tcaacggcga 1620 gggggaggtc aatgtccacg gtcaaccaca gaaccagcag aagtccacgc cggatgagga 1680 atcttttagg agaaagggaa agaaccagtt agaccgttct tcctccggat ccaacactcc 1740 gggcagcgaa gtggacaacg atggcgcggg gcccacagag gaagaaaagc ccaaagacga 1800 cgacctctcc gttgacccta accgccgagg agttgacccc cgcaaggaag tctccaaaga 1860 ggggcgcctc gcctttcaag cgctcttctc aagaggagtg ctgccgcaga gcttctcccc 1920 cacagaggga gaggcggaga aagatgaagt gttagcgccc gcctcggctc cctcagaagt 1980 caacgccctt caacctcccc aagtcaactc cgttgaccaa acctctgtag atatcggtca 2040 actgaggccg aagcctcact gcatagggtt caagccctac aagcgttgct cagtggaggc 2100 aaaggagacc gagcccccgc cggaggacga caaatgtagc aagagaatgt gtttggagag 2160 agaggcgtcg acttgagccg gtcacgctgt ctcggtctcc antggttttc gacgagtcaa 2220 cggngnanct tggcatatcn ttttcccngn ggaantttng antgcctttt tctncgaatn 2280 tctttcnngg gggaactgcc gnaatccggg gtnaattntn ttntnggcng ngncntngga 2340 annaatttnc cnttctctnc caaaaaaaaa aaaaaaaaa 2379 <210> 86
<211> 581
<212> PRT
<213> Lemna gibba
<400> 86
Met Glu Thr Cys Ser Ser Gly Glu Glu Leu Ile Val Lys Pro Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Lys Trp Thr Glu Glu Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Gln Arg 35 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Val Ser Lys Gly 65 70 75 80
Val Pro Leu Gly Gln Val His Asp Ile Glu Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Thr Asn Pro Tyr Pro Arg Lys Ile Gly Val Gly Pro 100 105 110
Ser Tyr Pro Ser Gly Gly Glu Arg Asp Asp Asn Arg Gln Leu Thr His 115
120
125
Leu Pro Ser Ser Ser Leu His Ser Lys Gly Lys Ala Glu Asp Phe Phe 130 135 140
Val Asp Ser Ser Pro Glu Lys Gln Ala Gly Met Asn Ser Glu Lys Ile 145 150 155 160
Thr Lys Glu Ala Pro Val Ala Leu Ser Leu Phe His Val Ala Pro Ser 165 170 175
Ser Pro Thr Pro Ser Ser Ser Lys Ser Thr Val Pro Leu Pro Asp Asp 180 185 190
Glu Lys Asn Pro Ser Ile Asn Phe Asp Leu Asn Lys Lys Asn Arg Pro 195 200 205
Cys Gly Val Asn Ala Asp Pro Asn Thr Val Lys Phe Pro Ser Pro Ser 210 215 220
Ala Ile Ser Ser Val His Gln Ser Thr Ala Ala Phe Pro His Pro Phe 225 230 235 240
Ser Trp Pro His Val Pro Pro Ala Phe Ser Ser His Leu Thr Ser Ala 245 250 255
Leu Leu Gln Asn Pro Ala Ala His Ala Ala Ala Asn Met Ala Ala Ser 260 265 270
Phe Trp Leu Thr Ala Asp Val Glu Thr Ser Ser Ser Val Asp Ser Gly 275 280 285
Asn Ala Ala Ser Ser Ser Ser Pro Ser Val Ala Ala Ala Ala Ile Ala 290 295 300
Thr Val Ala Ala Ala Ser Ala Trp Trp Ala Thr His Gly Leu Leu Pro 305 310 315 320
Phe Cys Tyr Pro Ser Phe Asn Gly Cys Phe Ala Ala Val Pro Pro Pro 325 330 335
Pro Thr Thr Thr Pro Thr Leu Thr Glu Ala Thr Arg Val Lys Val Asn 340 345 350
Pro Arg Asn Gly Lys Glu Glu Glu Glu Lys Asp Leu Arg Gln Gly Phe 355 360 365 Asp Pro Gly Thr Ser Leu Thr Ala Lys Gly Ser Pro Leu Ser Ser Thr 370 375 380
Asp Ser Asn Pro Ser Glu Lys Arg Glu Val Asn Gly Glu Gly Glu Val 385 390 395 400
Asn Val His Gly Gln Pro Gln Asn Gln Gln Lys Ser Thr Pro Asp Glu 405 410 415
Glu Ser Phe Arg Arg Lys Gly Lys Asn Gln Leu Asp Arg Ser Ser Ser 420 425 430
Gly Ser Asn Thr Pro Gly Ser Glu Val Asp Asn Asp Gly Ala Gly Pro 435 440 445
Thr Glu Glu Glu Lys Pro Lys Asp Asp Asp Leu Ser Val Asp Pro Asn 450 455 460
Arg Arg Gly Val Asp Pro Arg Lys Glu Val Ser Lys Glu Gly Arg Leu 465 470 475 480
Ala Phe Gln Ala Leu Phe Ser Arg Gly Val Leu Pro Gln Ser Phe Ser 485 490 495
Pro Thr Glu Gly Glu Ala Glu Lys Asp Glu Val Leu Ala Pro Ala Ser 500 505 510
Ala Pro Ser Glu Val Asn Ala Leu Gln Pro Pro Gln Val Asn Ser Val 515 520 525
Asp Gln Thr Ser Val Asp Ile Gly Gln Leu Arg Pro Lys Pro His Cys 530 535 540
Ile Gly Phe Lys Pro Tyr Lys Arg Cys Ser Val Glu Ala Lys Glu Thr 545 550 555 560
Glu Pro Pro Pro Glu Asp Asp Lys Cys Ser Lys Arg Met Cys Leu Glu 565 570 575
Arg Glu Ala Ser Thr 580
<210> 87 <211> 2570 <212> DNA
<213> Castanea sativa <400> 87
gcgtgttttc gcatcaattt ttgcgctgta gtgaggattt gaagcagccc tgctggctgc 60 tccgcgtccg gtaatggaca catactcctc tggggaagaa ctggttatta aggctagaaa 120 accatataca ataactaagc aacgggagag atggacggag gacgagcata ataggtttct 180 agaagccttg aagctctatg gacgagcatg gcagcggata gaagaacata taggaacaaa 240 gactgctgtg cagatcagaa gtcatgcaca gaaattcttt tcaaagttgg agaaggaggc 300 tcttgttaaa ggtgttccaa taggccaagc tcttgacata gatattccac ctccacgccc 360 taaaaggaaa ccaagcaatc cttatcctcg aaagacaagc atcggcgttc ctacatcaca 420 ggtgggaacg aaggatggaa aacttttcac atcagcttct tcttcggatt gcaaacaagc 480 actggacttg gagaaagaac cacttcctga gaaacctaat ggagatgaga aaccagaaaa 540 tgcaaaaga t aatcaggatg acaattgctc agaagtcttt acccttcacc aagaagttca 600 ttgttcttct gtttcttcag caaacaggag ttctgtaccg actcccgttg ctctcagaaa 660 tttaaacacg ttaagggagt ttgtcccttc aatgaaaagg tcaataaccc aagatgaaac 720 aaatgaatct tatgtcacta ttgaacttaa aggaaatcag aagttggaga aagctgatgc 780 caaacagaca attcaagata ctggcacaag taatggctca aagttgggga atcataatgt 840 tctacatgag aagccaattc aaggtgacaa gacacaggat ttaaattgtg ctttgccaat 900 ggatgagatg caagccactc agaactaccc aaggcatgtc cctgtgcaag ttgtagatgg 960 aagcttagga acatgtactc aaactccttc ctcagatatg tcattccagg actccatatt 1020 tcacccaatg ggagaggttc acagacacca taatcccttt acaaatccag cagcatctgc 1080 taccactgaa catcaaaata atgttcccag atctgttaat caatcatttc cggctttcca 1140 tcctcccttt accccaattc gccataacca ggacgactac caatcatttc tccacatgtc 1200 ctccacattt tcaagcctta ttgtctctac tttgatgcaa aatcctgcag cccatgctgc 1260 agcaagtttt gcagctacag tttggcccta tgcaaatgtg gaggcttctg cagattctcc 1320 tgcaagcacg caaggggttt ttccaccgag gcaaatgggc tctactccaa gtatggcagc 1380 tattgctgct gctactgtag ctgctgcaac tgcatggtgg gcagcccatg gactggttcc 1440 cttatgtgct cctcttccta ctgcttttac ctgcaatcct gcatctacag ctgcagttcc 1500 accaacagat tctggccaag cccctgcagc caagacagag ggagaagtga atactcttca 1560 aactcctccc ttgcaacaac tcgacccaga atattcagaa gctgttcaag ctcagcattc 1620 agactcaaaa ttgccaattc cgtcatcatc agactctgag gagagtggag gtgcaaagct 1680 aaactctggg ccaaaagcta ctgatcatga gaatgctgta acagctactg agctccatga 1740 ttcaaacaaa acaaaaggca gaaaacaggt tgaccgttcc tcatgtggtt ccaacacagc 1800 ttctagcagt gacagggaga cagatgcatt agagaagcag gagatgggga aggaagagcc 1860 gaaagaacct gatgcaaacc attcagctgc tgatactagt aatcgtcgtt gttgtagtag 1920 tagtagtaga agtttcagct acatgaatga ttcctggaag tcagtctctg aagagggccg 1980 gctggccttt caagcactgt tctctagaga ggtactgcct caaagttttt cacctccaca 2040 tgatctgaag aacatgggga atcaaaagga caataccaca gacgataagc aaaatgcaaa 2100 tgagaatgat ggaaatgcat cactgttaga cctcaacagt caaaaatctg ggtcttgttc 2160 tgtccaacaa ggaatcttaa actttgaacc caacaacaat ggggaggggc tgctgacaat 2220 agggcttgca tatggaaagc ttaaggctcg tcgaacggga tttaagccat acaaaaggtg 2280 ttcagtagag gccaaggaga atagggtggc aaatgctagt ggccaaggtg aagagaaggg 2340 tccaaagagg atacgcttgg aaggggaggc ttcaatttga gatttgatat tgcattcaat 2400 caaaggaaac ctttgttgtg catatcttat tttccccgta actatgttct aatctctttc 2460 atttcaagtc catctcacga aacttgtcgt gcatgtgtgt gtactatatt atgtctacat 2520 ttgctcatat actatgttga accccaggca actgcactag aagactttcc 2570 <210> 88 <211> 768 <212> PRT
<213> Castanea sativa <400> 88
Met Asp Thr Tyr Ser Ser Gly Glu Glu Leu Val Ile Lys Ala Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Asp Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Gln Arg 35 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Ser Lys Leu Glu Lys Glu Ala Leu Val Lys Gly 65 70 75 80
Val Pro Ile Gly Gln Ala Leu Asp Ile Asp Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Ser Asn Pro Tyr Pro Arg Lys Thr Ser Ile Gly Val 100 105 110
Pro Thr Ser Gln Val Gly Thr Lys Asp Gly Lys Leu Phe Thr Ser Ala 115 120 125
Ser Ser Ser Asp Cys Lys Gln Ala Leu Asp Leu Glu Lys Glu Pro Leu 130
135
140
Pro Glu Lys Pro Asn Gly Asp Glu Lys Pro Glu Asn Ala Lys Asp Asn 145 150 155 160
Gln Asp Asp Asn Cys Ser Glu Val Phe Thr Leu His Gln Glu Val His 165 170 175
Cys Ser Ser Val Ser Ser Ala Asn Arg Ser Ser Val Pro Thr Pro Val 180 185 190
Ala Leu Arg Asn Leu Asn Thr Leu Arg Glu Phe Val Pro Ser Met Lys 195 200 205
Arg Ser Ile Thr Gln Asp Glu Thr Asn Glu Ser Tyr Val Thr Ile Glu 210 215 220
Leu Lys Gly Asn Gln Lys Leu Glu Lys Ala Asp Ala Lys Gln Thr Ile 225 230 235 240
Gln Asp Thr Gly Thr Ser Asn Gly Ser Lys Leu Gly Asn His Asn Val 245 250 255
Leu His Glu Lys Pro Ile Gln Gly Asp Lys Thr Gln Asp Leu Asn Cys 260 265 270
Ala Leu Pro Met Asp Glu Met Gln Ala Thr Gln Asn Tyr Pro Arg His 275 280 285
Val Pro Val Gln Val Val Asp Gly Ser Leu Gly Thr Cys Thr Gln Thr 290 295 300
Pro Ser Ser Asp Met Ser Phe Gln Asp Ser Ile Phe His Pro Met Gly 305 310 315 320
Glu Val His Arg His His Asn Pro Phe Thr Asn Pro Ala Ala Ser Ala 325 330 335
Thr Thr Glu His Gln Asn Asn Val Pro Arg Ser Val Asn Gln Ser Phe 340 345 350
Pro Ala Phe His Pro Pro Phe Thr Pro Ile Arg His Asn Gln Asp Asp 355 360 365
Tyr Gln Ser Phe Leu His Met Ser Ser Thr Phe Ser Ser Leu Ile Val 370 375 380 Ser Thr Leu Met Gln Asn Pro Ala Ala His Ala Ala Ala Ser Phe Ala 385 390 395 400
Ala Thr Val Trp Pro Tyr Ala Asn Val Glu Ala Ser Ala Asp Ser Pro 405 410 415
Ala Ser Thr Gln Gly Val Phe Pro Pro Arg Gln Met Gly Ser Thr Pro 420 425 430
Ser Met Ala Ala Ile Ala Ala Ala Thr Val Ala Ala Ala Thr Ala Trp 435 440 445
Trp Ala Ala His Gly Leu Val Pro Leu Cys Ala Pro Leu Pro Thr Ala 450 455 460
Phe Thr Cys Asn Pro Ala Ser Thr Ala Ala Val Pro Pro Thr Asp Ser 465 470 475 480
Gly Gln Ala Pro Ala Ala Lys Thr Glu Gly Glu Val Asn Thr Leu Gln 485 490 495
Thr Pro Pro Leu Gln Gln Leu Asp Pro Glu Tyr Ser Glu Ala Val Gln 500 505 510
Ala Gln His Ser Asp Ser Lys Leu Pro Ile Pro Ser Ser Ser Asp Ser 515 520 525
Glu Glu Ser Gly Gly Ala Lys Leu Asn Ser Gly Pro Lys Ala Thr Asp 530 535 540
His Glu Asn Ala Val Thr Ala Thr Glu Leu His Asp Ser Asn Lys Thr 545 550 555 560
Lys Gly Arg Lys Gln Val Asp Arg Ser Ser Cys Gly Ser Asn Thr Ala 565 570 575
Ser Ser Ser Asp Arg Glu Thr Asp Ala Leu Glu Lys Gln Glu Met Gly 580 585 590
Lys Glu Glu Pro Lys Glu Pro Asp Ala Asn His Ser Ala Ala Asp Thr 595 600 605
Ser Asn Arg Arg Cys Cys Ser Ser Ser Ser Arg Ser Phe Ser Tyr Met 610 615 620
Asn Asp Ser Trp Lys Ser Val Ser Glu Glu Gly Arg Leu Ala Phe Gln 625 630 635 640 Ala Leu Phe Ser Arg Glu Val Leu Pro Gln Ser Phe Ser Pro Pro His 645 650 655
Asp Leu Lys Asn Met Gly Asn Gln Lys Asp Asn Thr Thr Asp Asp Lys 660 665 670
Gln Asn Ala Asn Glu Asn Asp Gly Asn Ala Ser Leu Leu Asp Leu Asn 675 680 685
Ser Gln Lys Ser Gly Ser Cys Ser Val Gln Gln Gly Ile Leu Asn Phe 690 695 700
Glu Pro Asn Asn Asn Gly Glu Gly Leu Leu Thr Ile Gly Leu Ala Tyr 705 710 715 720
Gly Lys Leu Lys Ala Arg Arg Thr Gly Phe Lys Pro Tyr Lys Arg Cys 725 730 735
Ser Val Glu Ala Lys Glu Asn Arg Val Ala Asn Ala Ser Gly Gln Gly 740 745 750
Glu Glu Lys Gly Pro Lys Arg Ile Arg Leu Glu Gly Glu Ala Ser Ile 755 760 765
<210> 89
<211> 2172
<212> DNA
<213> Phaseolus vulgaris
<400> 89
atggacgcat actcctctgg agaagaagtc gttgtaaaga cgagaaaacc gtatacgatc 60 acaaagcaaa gggaacgatg gacagaggag gagcataata ggtttctaga agctttgaaa 120 ctgcacgggc gagcatggca gcgcatagaa gagcatatag gaacaaagac tgccgtgcaa 180 atcaggagtc acgcacagaa gttctttaca aagttggaga aagaggccct tgtaaagggt 240 gttccaattg gacaagctct tgacatagat attccccctc cacggcccaa aagaaaacca 300 agcaatcctt atcctcggaa gaccacgatt ggtaccgcaa cattacatag tggagcaaag 360 gatggaaatt tggttgaatc ttcacataac aaccaagcac tggacttgga aaaagaacca 420 cttccggaga aatatgattt agacgagggg ctaacaacag taaaggaaaa taaggatgag 480 aactgctcaa aagtatttaa agttatccag gaggtaccct gttcctctat atcttcagca 540 aacaggagtt caatatctat gtcagtgccg ctgggaaatt catgcgtatt aaaggagatt 600 acaagttcag tgaaagaggt aataactcga gatgaaaata ctgaatcatt tctgactgtt 660 gaacttggaa acaggaattt ggagatcaat gatggaaaac aggctaatgg cactagtaaa 720 aactccacgt tggagaattc tgatgcttta caaacgaaat tggttcaaaa tgagaaaaca 780 gatggtctcg atagtgcatt aacaatagat gggatgcaag gcaatcagaa ttaccctaga 840 catgtaactg tgcacgttgt tgacgggaaa cttggaacaa gtactcaaaa tccatcacaa 900 gatatgctgt ttcgagactc tatgtttcag ccaataggag gggataatgg gcaaccaaat 960 cttttcacca attcagctcc aacgaacaca agtgaaagtc aaaataatac agcacgatct 1020 tctgttcatc aatcatttct tccgtatcct cccttcacac agcacaatca ggacgattac 1080 caatcatttc ttcacatgtc ttccacgttt tctaatcttg ttgtctctac cttgctgcaa 1140 aacccagcag cccatgttgc agcaagtttc gcagctacat tttggcctta tgcaaatcca 1200 gaaacttcag cagattctcc taggtgctcc caaggaggtt tcacatctag acaaatcggt 1260 tcccctccaa gcgttgcagc tattgcagca gctactgtag ctgctgcaac tgcgtggtgg 1320 gcagctcatg gattgcttcc tttgtgtctt cctcttcatg ctgcttttgc ctgtcctcct 1380 gcatcagtga ctgcagtccc atcaatgaat cctcctgtgc aagatcagaa gcatccagaa 1440 tactcggaag caccgcaagc tcaacattca gattcaaagt cactagctgt catttcatca 1500 gattctgaga ctggaaatgc caagttaaat acttcaccaa aggctactga tcatgtgacg 1560 aacgaaacaa tttctgagca ccttgattcc gacaaaacaa agggcagaaa acaggttgac 1620 cgttcctcgt gtggttccaa cacagcctca agcagcgatg tggaaactga tgcactaggg 1680 aaggatgaga aagggaagga agagcctgaa acacccgacg ctaacaattt agccattgag 1740 tttagtaatc gtcgtagaag catttacaac cttactgatt cttggaaaga ggtctcttca 1800 gaggggagac tagcatttca ggctctattc tccagagagg tgttgcctca aagcttttca 1860 cctcctcatg ctctaaagaa taaggaccaa atggacatca ccaatgatta caagcaaaac 1920 atagccgaca gaaatgaaga ccttgacagc aagaaatgca gttctaatgc actgcataaa 1980 attccgtcgt ttgtagaaaa taacgtggga ctgttaacca ttgggcttgg acaaggaaag 2040 cttaagactc gtcgaacagg ctttaaaccc tacaaaagat gttccgtgga ggccagggaa 2100 aatagggttg gagcgaactg tgaagagaaa ggttgtaaga gaatacgttt ggaaggggat 2160 acttcgactt ga 2172 <210> 90 <211> 723 <212> PRT
<213> Phaseolus vulgaris <400> 90
Met Asp Ala Tyr Ser Ser Gly Glu Glu Val Val Val Lys Thr Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Glu Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Leu Lys Leu His Gly Arg Ala Trp Gln Arg 35 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Leu Val Lys Gly 65 70 75 80
Val Pro Ile Gly Gln Ala Leu Asp Ile Asp Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Ser Asn Pro Tyr Pro Arg Lys Thr Thr Ile Gly Thr 100 105 110
Ala Thr Leu His Ser Gly Ala Lys Asp Gly Asn Leu Val Glu Ser Ser 115 120 125
His Asn Asn Gln Ala Leu Asp Leu Glu Lys Glu Pro Leu Pro Glu Lys 130 135 140
Tyr Asp Leu Asp Glu Gly Leu Thr Thr Val Lys Glu Asn Lys Asp Glu 145 150 155 160
Asn Cys Ser Lys Val Phe Lys Val Ile Gln Glu Val Pro Cys Ser Ser 165 170 175
Ile Ser Ser Ala Asn Arg Ser Ser Ile Ser Met Ser Val Pro Leu Gly 180 185 190
Asn Ser Cys Val Leu Lys Glu Ile Thr Ser Ser Val Lys Glu Val Ile 195 200 205
Thr Arg Asp Glu Asn Thr Glu Ser Phe Leu Thr Val Glu Leu Gly Asn 210 215 220
Arg Asn Leu Glu Ile Asn Asp Gly Lys Gln Ala Asn Gly Thr Ser Lys 225 230 235 240
Asn Ser Thr Leu Glu Asn Ser Asp Ala Leu Gln Thr Lys Leu Val Gln 245 250 255
Asn Glu Lys Thr Asp Gly Leu Asp Ser Ala Leu Thr Ile Asp Gly Met 260 265 270 Gln Gly Asn Gln Asn Tyr Pro Arg His Val Thr Val His Val Val Asp 275 280 285
Gly Lys Leu Gly Thr Ser Thr Gln Asn Pro Ser Gln Asp Met Leu Phe 290 295 300
Arg Asp Ser Met Phe Gln Pro Ile Gly Gly Asp Asn Gly Gln Pro Asn 305 310 315 320
Leu Phe Thr Asn Ser Ala Pro Thr Asn Thr Ser Glu Ser Gln Asn Asn 325 330 335
Thr Ala Arg Ser Ser Val His Gln Ser Phe Leu Pro Tyr Pro Pro Phe 340 345 350
Thr Gln His Asn Gln Asp Asp Tyr Gln Ser Phe Leu His Met Ser Ser 355 360 365
Thr Phe Ser Asn Leu Val Val Ser Thr Leu Leu Gln Asn Pro Ala Ala 370 375 380
His Val Ala Ala Ser Phe Ala Ala Thr Phe Trp Pro Tyr Ala Asn Pro 385 390 395 400
Glu Thr Ser Ala Asp Ser Pro Arg Cys Ser Gln Gly Gly Phe Thr Ser 405 410 415
Arg Gln Ile Gly Ser Pro Pro Ser Val Ala Ala Ile Ala Ala Ala Thr 420 425 430
Val Ala Ala Ala Thr Ala Trp Trp Ala Ala His Gly Leu Leu Pro Leu 435 440 445
Cys Leu Pro Leu His Ala Ala Phe Ala Cys Pro Pro Ala Ser Val Thr 450 455 460
Ala Val Pro Ser Met Asn Pro Pro Val Gln Asp Gln Lys His Pro Glu 465 470 475 480
Tyr Ser Glu Ala Pro Gln Ala Gln His Ser Asp Ser Lys Ser Leu Ala 485 490 495
Val Ile Ser Ser Asp Ser Glu Thr Gly Asn Ala Lys Leu Asn Thr Ser 500 505 510
Pro Lys Ala Thr Asp His Val Thr Asn Glu Thr Ile Ser Glu His Leu 515 520 525 Asp Ser Asp Lys Thr Lys Gly Arg Lys Gln Val Asp Arg Ser Ser Cys 530 535 540
Gly Ser Asn Thr Ala Ser Ser Ser Asp Val Glu Thr Asp Ala Leu Gly 545 550 555 560
Lys Asp Glu Lys Gly Lys Glu Glu Pro Glu Thr Pro Asp Ala Asn Asn 565 570 575
Leu Ala Ile Glu Phe Ser Asn Arg Arg Arg Ser Ile Tyr Asn Leu Thr 580 585 590
Asp Ser Trp Lys Glu Val Ser Ser Glu Gly Arg Leu Ala Phe Gln Ala 595 600 605
Leu Phe Ser Arg Glu Val Leu Pro Gln Ser Phe Ser Pro Pro His Ala 610 615 620
Leu Lys Asn Lys Asp Gln Met Asp Ile Thr Asn Asp Tyr Lys Gln Asn 625 630 635 640
Ile Ala Asp Arg Asn Glu Asp Leu Asp Ser Lys Lys Cys Ser Ser Asn 645 650 655
Ala Leu His Lys Ile Pro Ser Phe Val Glu Asn Asn Val Gly Leu Leu 660 665 670
Thr Ile Gly Leu Gly Gln Gly Lys Leu Lys Thr Arg Arg Thr Gly Phe 675 680 685
Lys Pro Tyr Lys Arg Cys Ser Val Glu Ala Arg Glu Asn Arg Val Gly 690 695 700
Ala Asn Cys Glu Glu Lys Gly Cys Lys Arg Ile Arg Leu Glu Gly Asp 705 710 715 720
Thr Ser Thr
<210> 91
<211> 1036
<212> DNA
<213> Glycine max
<400> 91
gtttcttcct ccgatccctc attgccgcaa atgactcctc ctgctagtgt taggtgaatt ccctcgcttc acatgcatga tcgcaccttc aactctcttc ttcttcttct tctccatggc
60
120 tttttttcaa ggttttggcg ccgtggagtt cgttttggtg aggattctga ttaaagagtt 180 ttcttttatt ctttcggaga agcgtctctg tctctctgtt gcggtggatt cttaaaattt 240 gctaaatctt tttttttctt tttctaatct ctattagtat catcctgcgt gtggcttgtg 300 attggaatgc ttagatttat attttttgtt accaaacaga gacggatctc tacctttcta 360 tttcttttgc agtagcatca ccgtatcatc agcttcagct tgctttcacc aaaacggctt 420 tactatttgg tgtgttccat gtcacaaaaa acgaaaggag atattccttt tacccactcc 480 tcgtcaggga agatctgaag cagcgctagc agcacacgtc ctctaatgga cgccgactcc 540 tctggagaag aagtggttat taaaacaaga aaaccatata ctatcacaaa gcaaagagaa 600 cgatggacag aggaggaaca taacagattt ctagaagcct tgaagctata cgggcgagca 660 tggcagcgca tagaagagca tataggaaca aagactgctg tacaaatcag gagtcatgct 720 cagaaattct ttacaaagtt ggagaaagag gcctttgtaa agggtgttcc aataggacaa 780 gctcttgata tagacatccc ccctccacgg ccaaaaagaa aaccaaacaa tccttatccc 840 cggaagacca atgttggtgg tgccccaaca ttacatagcg gagcaaggca tggaaagcct 900 ctcatttcaa ttgtatcttc acttggtaaa caagcattgg gcttggagaa agaacccctt 960 ccagagaagc atgatgtcga cctaaggcca tcaaccgtaa aagaaaataa ggaccaaagc 1020 tgctcaaaag tattta 1036 <210> 92
<211> 170
<212> PRT
<213> Glycine max
<400> 92
Met Asp Ala Asp Ser Ser Gly Glu Glu Val Val Ile Lys Thr Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Glu Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Gln Arg 35 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Phe Val Lys Gly 65 70 75 80
Val Pro Ile Gly Gln Ala Leu Asp Ile Asp Ile Pro Pro Pro Arg Pro 85 90 95 Lys Arg Lys Pro Asn Asn Pro Tyr Pro Arg Lys Thr Asn Val Gly Gly 100 105 110
Ala Pro Thr Leu His Ser Gly Ala Arg His Gly Lys Pro Leu Xle Ser 115 120 125
Ile Val Ser Ser Leu Gly Lys Gln Ala Leu Gly Leu Glu Lys Glu Pro 130 135 140
Leu Pro Glu Lys His Asp Val Asp Leu Arg Pro Ser Thr Val Lys Glu 145 150 155 160
Asn Lys Asp Gln Ser Cys Ser Lys Val Phe 165 170
<210> 93 <211> 3051 <212> DNA
<213> Mesembryanthemum crystallinum
<400> 93
gggggtgtgg cgcattttct ctctcctcgc gctcgagttc aaacactcct gttcttcttc 60 aattcctttt tagtgttttt tttgagaggt ttaatcaata tactagaaat tcggcaatca 120 aatggggtga gtttattctg tcaatcattt gtatgatcat ttagtggatt gagcgttcga 180 ttgattgttt ctcgtcttct cgatctgcta tggcatcttc agaaggtgtg agcacgttct 240 cgactgtttc ggtgaggatt ctgaacaagg aaatttttac cgctttctag agctggatgg 300 attgtcaatt tgatttggga aacatggggg aagaaaggga gtcttttcat ttttatgacg 360 attagttagg tttcagtata tgaaaatttt attatttttg ttttggaaat ggttgtttaa 420 attgatagta ttatttgggc gacaaaaaag acaggatctc tatcgatttt agttttcttg 480 gtttgctact tgtttgtatt tctgcagtag tgattttact caccagattt caacgagtgt 540 atgttcagta ctactctctg atgtgtggag ggataagagg ccgcttttgt ataccttgct 600 tgttggagag cagctgaaag cagtggtagc ggtagctccg gctaccgcta tggaggctta 660 ttcttccgga gaagagctag ttattaagac aagaaaacct tatacgatca ccaagcaacg 720 agagcgatgg acagaagagg agcataatag gtttttagag gccttgaaac tctatggacg 780 agcttggcag cggatagaag agcatattgg aacaaagacc gctgtccaga tccgaagtca 840 tgcacagaag ttcttttcaa agttggaaaa ggaggctctt gttaaaggtg ttccaataca 900 gcaagcaatc gacatagaaa ttcctcctcc acgacctaag aggaaaccga gcaatcctta 960 tcctcgcaag actggagctg caggttctcc aagtacacag atcaaagtta aggatgggaa 1020 caaagtacca ccaggttctt cacatactgc aaaccagtta ctagacttgg aaaaagaacc 1080 tccaccagag aacactactg gtgatgatgg gaagcaaaat gctaaagaaa cctgtggtgc 1140 ttacaaatgc tcagaaacct ttactctgtt ccaagaagca ccatccacct tgacagcatc 1200 cggtaatgaa aactctgcca taacaacggg tgcaacgaga aagtcatgca aggttgatga 1260 ccctgtgcca aagaaactgt tggtcgatat tgacggaagt gattgtcctg ctgctgatgg 1320 acgacagaga aa tcaaaaac tagataaaac tgatactgtg gagactgctc agaatgacac 1380 agaaaacgaa atgcatgctg ttaagaactt tcctagacat actcctgttc atattcttga 1440 tggaagccta ggagcatgca gtcaagctct ttcctcagac gtatcatatc aagaatctgc 1500 atttcatcgg atgggaatcc caggctatcc tgcaattttt agcaatcctg cagtatcagc 1560 tgctgtggaa agtcaaaata gcacatcaag aaccactaat caacaaatgt ttacaagctt 1620 ccatcctcca tttactccat tccctaacac cccagaagac tattcatcat ttgtgcagat 1680 gtctgctacc ttttcaagtc tgattgtgtc tgctcttctt caaaacccag ctgcacatgc 1740 tgcagcaagt tttgctgctt ccttttggcc ttgctctaat atggaaaatt cagccaattg 1800 tcctgctggt ctaagtggcg gattcccacc acggccaatg aatacggctc caagcatggc 1860 agcaattgct ggagccacag tagcagctgc tactgcttgg tgggcagcac atggtctctt 1920 gcccttatgt gctcctgtac attctggctt caattgtcct cctgcctctg ctaatgcccc 1980 attaactaat gttgcccaaa gtcaagccac taataaggaa agagaggaga acaatttcca 2040 aaatcctggt tcacaagttc agcaacctga tcaggaactc tctgaagctt tgcagccaca 2100 gcattcagca tccaaacctt cagcaacatc gtcatctgat tctggtgaca gtgcaggtgc 2160 aaagatggaa attgaaatac caaccaatga taatgagata aaggtccctg caatgactga 2220 gcaaaaggac tcaagcaagg gcaagagcaa gaaactggtg gaccgctctt cttgtggttc 2280 caacacaccc tcaggtagtg atgttgagac tgatgctttg cagaagaatg ataaaggcaa 2340 ggaagaaccc ctagaacctg atattagtca aattgctggt gaacttaata atcgtcgcaa 2400 tcgaattgca agcaacaact taaatgacag ctggaaggag gtttccgagg ggggacgcct 2460 tgcgtttcaa gcacttttct ctagagagag attgccccag agcttttcac ccccacaaga 2520 cgtaagtatt atggaccagg taatgaataa tggtgttgag agaaatgggc aaaatgcaac 2580 agaaaccaat gaagatgcat cacagttaga tctcaacagc aatacatggg aatcttgttc 2640 aggtgatcaa gggcacctag agaacactgg attaagagag aaggaaaatg gaaaagatca 2700 cttcctgtca attggtcttg ctcaagggaa gccaagggac cgtagaacag gttttaagcc 2760 gtacaaaagg tgctctgttg aagccaggga gagtaggttg aactcaaaca gtcaagacca 2820 agaaaaatgt cccaagagaa tacgcttgga aggggaggct tcaacgtgat atcagattat 2880 gcttgcgttt tgtgctaggg aaaccttggc cacagcaagt ataccccatt tatttttagt 2940 ttctttattt cacttagctt tatttaagtt cttaaaagct cacgagactt ttcgtgttgt 3000 gtgtactata actgactaaa ttggtctttc atttttcatc cttcgtgtta t
<210> 94 <211> 739 <212> PRT
<213> Mesembryanthemum crystallinum <400> 94
Met Glu Ala Tyr Ser Ser Gly Glu Glu Leu Val Ile Lys Thr Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Glu Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Gln Arg 35 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Ser Lys Leu Glu Lys Glu Ala Leu Val Lys Gly 65 70 75 80
Val Pro Ile Gln Gln Ala Ile Asp Ile Glu Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Ser Asn Pro Tyr Pro Arg Lys Thr Gly Ala Ala Gly 100 105 110
Ser Pro Ser Thr Gln Ile Lys Val Lys Asp Gly Asn Lys Val Pro Pro 115 120 125
Gly Ser Ser His Thr Ala Asn Gln Leu Leu Asp Leu Glu Lys Glu Pro 130 135 140
Pro Pro Glu Asn Thr Thr Gly Asp Asp Gly Lys Gln Asn Ala Lys Glu 145 150 155 160
Thr Cys Gly Ala Tyr Lys Cys Ser Glu Thr Phe Thr Leu Phe Gln Glu 165 170 175
Ala Pro Ser Thr Leu Thr Ala Ser Gly Asn Glu Asn Ser Ala Ile Thr 180 185 190
3051
Thr Gly Ala Thr Arg Lys Ser Cys Lys Val Asp Asp Pro Val Pro Lys 195 200 205 Lys Leu Leu Val Asp Ile Asp Gly Ser Asp Cys Pro Ala Ala Asp Gly 210 215 220
Arg Gln Arg Asn Gln Lys Leu Asp Lys Thr Asp Thr Val Glu Thr Ala 225 230 235 240
Gln Asn Asp Thr Glu Asn Glu Met His Ala Val Lys Asn Phe Pro Arg 245 250 255
His Thr Pro Val His Ile Leu Asp Gly Ser Leu Gly Ala Cys Ser Gln 260 265 270
Ala Leu Ser Ser Asp Val Ser Tyr Gln Glu Ser Ala Phe His Arg Met 275 280 285
Gly Ile Pro Gly Tyr Pro Ala Ile Phe Ser Asn Pro Ala Val Ser Ala 290 295 300
Ala Val Glu Ser Gln Asn Ser Thr Ser Arg Thr Thr Asn Gln Gln Met 305 310 315 320
Phe Thr Ser Phe His Pro Pro Phe Thr Pro Phe Pro Asn Thr Pro Glu 325 330 335
Asp Tyr Ser Ser Phe Val Gln Met Ser Ala Thr Phe Ser Ser Leu Ile 340 345 350
Val Ser Ala Leu Leu Gln Asn Pro Ala Ala His Ala Ala Ala Ser Phe 355 360 365
Ala Ala Ser Phe Trp Pro Cys Ser Asn Met Glu Asn Ser Ala Asn Cys 370 375 380
Pro Ala Gly Leu Ser Gly Gly Phe Pro Pro Arg Pro Met Asn Thr Ala 385 390 395 400
Pro Ser Met Ala Ala Ile Ala Gly Ala Thr Val Ala Ala Ala Thr Ala 405 410 415
Trp Trp Ala Ala His Gly Leu Leu Pro Leu Cys Ala Pro Val His Ser 420 425 430
Gly Phe Asn Cys Pro Pro Ala Ser Ala Asn Ala Pro Leu Thr Asn Val 435 440 445
Ala Gln Ser Gln Ala Thr Asn Lys Glu Arg Glu Glu Asn Asn Phe Gln 450 455 460 Asn Pro Gly Ser Gln Val Gln Gln Pro Asp Gln Glu Leu Ser Glu Ala 465 470 475 480
Leu Gln Pro Gln His Ser Ala Ser Lys Pro Ser Ala Thr Ser Ser Ser 485 490 495
Asp Ser Gly Asp Ser Ala Gly Ala Lys Met Glu Ile Glu Ile Pro Thr 500 505 510
Asn Asp Asn Glu Ile Lys Val Pro Ala Met Thr Glu Gln Lys Asp Ser 515 520 525
Ser Lys Gly Lys Ser Lys Lys Leu Val Asp Arg Ser Ser Cys Gly Ser 530 535 540
Asn Thr Pro Ser Gly Ser Asp Val Glu Thr Asp Ala Leu Gln Lys Asn 545 550 555 560
Asp Lys Gly Lys Glu Glu Pro Leu Glu Pro Asp Ile Ser Gln Ile Ala 565 570 575
Gly Glu Leu Asn Asn Arg Arg Asn Arg Ile Ala Ser Asn Asn Leu Asn 580 585 590
Asp Ser Trp Lys Glu Val Ser Glu Gly Gly Arg Leu Ala Phe Gln Ala 595 600 605
Leu Phe Ser Arg Glu Arg Leu Pro Gln Ser Phe Ser Pro Pro Gln Asp 610 615 620
Val Ser Ile Met Asp Gln Val Met Asn Asn Gly Val Glu Arg Asn Gly 625 630 635 640
Gln Asn Ala Thr Glu Thr Asn Glu Asp Ala Ser Gln Leu Asp Leu Asn 645 650 655
Ser Asn Thr Trp Glu Ser Cys Ser Gly Asp Gln Gly His Leu Glu Asn 660 665 670
Thr Gly Leu Arg Glu Lys Glu Asn Gly Lys Asp His Phe Leu Ser Ile 675 680 685
Gly Leu Ala Gln Gly Lys Pro Arg Asp Arg Arg Thr Gly Phe Lys Pro 690 695 700
Tyr Lys Arg Cys Ser Val Glu Ala Arg Glu Ser Arg Leu Asn Ser Asn 705 710 715 720 Ser Gln Asp Gln Glu Lys Cys Pro Lys Arg Xle Arg Leu Glu Gly Glu 725 73Ò 735
Ala Ser Thr
<210> 95
<211> 2735
<212> DNA
<213> Lycopersicon esculentum
<400> 95
aacatggctt tcttcgaagg tttaggcatc atgcggttcg ttttgtagtg ttacattatc 60 aggttctttt gtacaacacc acggatagac tatatttgat agtaactgat gttgtgggga 120 gaatcggaag aagatttgtt ctgtatcccc tgtttgtccc tgaggatttg aagcagagat 180 agctagcttt ggttccttta ttttgatgga cccttattcc tcaggggagg aacttgttgt 240 taagacaagg aaaccttata caatcactaa gcaacgagag cgatggacgg aggaggagca 300 caataggttc ctagaagctt tgaaacttta tgggcgtgct tggcagcgca tagaagaaca 360 cataggaact aaaactgctg tgcagatcag aagtcatgcg caaaagtttt ttacaaagtt 420 agaaaaggag gctcttacaa agggggtccc aacaagtcaa gcacttgaca ttgaaattcc 480 tcctccacga cctaaaagga aaccaagtaa tccttatcct cgtaagacaa gcgcagcagg 540 tcactcatca caggtgggag caaaagatgg gaaatattcg acaacttttt cttccatctg 600 tgaggaaagg aacttatttg acctggagaa agaaccgatt actgagaaac c tggcggaaa 660 cgagaagctg ggcaatgtaa aagaaaccca gaacaagaaa aactgctccc aagggttaac 720 taaggaaggt gcttctgcag cctctatgtc ttcaggaaag tccttgcaag cacatgtggc 780 acctacagat gtgtgtgcct ttagtgagtc tgtgtctgtc accaaaggag tggttaacaa 840 tgataacgca aataaatctt ttctcattgt tgaatccaaa gaacatcaac agtcagaaat 900 actcgatatc agacagtcct ttcaaggtaa cagctcctgt aacacctttg acggggggaa 960 atcttgccag tcgagtgaaa agttggcaca aggtgagaaa aaacatccat cgtttcagcc 1020 aaaccatttg ggggaattct caagaaatga tatgcaagtg ctacacaact atccaagaca 1080 tgtgccagtg catattcttg atggaacaaa tggttctcaa atagccccag atatgtttaa 1140 tcatgaatct acgagtcagc agataaatgg ggtcccgggg ctcccaaatt tgtattctaa 1200 ccctgcttca tccaccacat ctgagcacca cagtaacgct ccacagtcat ccattcatca 1260 gtcattttct tgtttccacc ccatttteac ccctattcgt gatccagatg attaccgatc 1320 gttttttcaa ttatcctcca ecttctccag ccttattgtt tctgctttat tgcaaaaccc 1380 agcagcacat gtcgcagcaa gttttgccgc tagettttgg ccttatgcaa atatggaacg 1440 tccaacggat tctccaactg ataacaccgc tagccagatt aactcagctc ctagtatggc 1500 agcaattgct gctgccacag tagcagctgc aactgcatgg tgggcagccc atgggctctt 1560 accattgtgc tctcaatttc aaagcagttt tacctgtgtt cctacatcag caacatcaat 1620 gcaagtggat gcctgtcaac ctagagtaga caagaacgaa ggaagagagg gaactcatga 1680 ttctccccat gttcaggaac ctgtcccaga atgctctgaa gctttgcaag aacaacaatc 1740 aggttctaag ttgccacctt ctctatcatc agaatcggag gagagtgaag gtaggaagct 1800 aaaaactggg ttaacggcca ctgatactga gcaaggagct gcagttacta aaattaatga 1860 gccaaacgca gaaaagggcg ggaagcaggt agatcgctct tcctgtggat ccaacacacc 1920 ttcaagtagt gaaattgaga cagatgcttt ggagaaggat gagaaaggta aagaagagcc 1980 ccaagaatct aatattaacc ttctagctgg agaggctgcg aatcggcgtt atagaaattt 2040 catcagtcca accgaatctt ggaaagaagt ctccgaagag ggacggatag ctttccaggc 2100 tcttttcacc agagaagtgt tgcctcaaag tttttctcct tcacttgatc tgaaaaataa 2160 gggaaagatc attcttgaaa agttgaagca aaagccagac gagaaagttc aatgtggacc 2220 gcagttagat cttaatgata tggcatccaa tatctgttcc agtcaccaaa caatggaaga 2280 caatgtgtta ttaattggca acaaagaaga tgtagaaaca tgcctaccaa tgatagaact 2340 tggacaagta aggttgaaag ctcgccgtac tggatttaag ccttacaaga ggtgctcatt 2400 ggaggcaaat gatagcaggg tgacaagttc taactgtcag gatgaagaaa aaagctcgaa 2460 aagacttcgg ttggaaggag aagcttctac ttagtgttgt atcaatgtgc aattctacga 2520 gggaacctgt gttgttgcac ggagagctct attctatcct gttattatct tttcccagtt 2580 acgttgtcta gttctaatgt acacgaaact tgtcgtgtag gtgtgtacca tattattttt 2640 atgttctctt ttaattggac ttgtatgcaa gggactttga agtatgaacc taaatgtgga 2700 tgtcttcaac aatcatagca aaaaaaaaaa aaaaa 2735 <210> 96 <211> 762 <212> PRT
<213> Lycopersicon esculentum <400> 96
Met Asp Pro Tyr Ser Ser Gly Glu Glu Leu Val Val Lys Thr Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Glu Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Gln Arg 35 40 45 He Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Leu Thr Lys Gly 65 70 75 80
Val Pro Thr Ser Gln Ala Leu Asp Ile Glu Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Ser Asn Pro Tyr Pro Arg Lys Thr Ser Ala Ala Gly 100 105 110
His Ser Ser Gln Val Gly Ala Lys Asp Gly Lys Tyr Ser Thr Thr Phe 115 120 125
Ser Ser Ile Cys Glu Glu Arg Asn Leu Phe Asp Leu Glu Lys Glu Pro 130 135 140
Ile Thr Glu Lys Pro Gly Gly Asn Glu Lys Leu Gly Asn Val Lys Glu 145 150 155 160
Thr Gln Asn Lys Lys Asn Cys Ser Gln Gly Leu Thr Lys Glu Gly Ala 165 170 175
Ser Ala Ala Ser Met Ser Ser Gly Lys Ser Leu Gln Ala His Val Ala 180 185 190
Pro Thr Asp Val Cys Ala Phe Ser Glu Ser Val Ser Val Thr Lys Gly 195 200 205
Val Val Asn Asn Asp Asn Ala Asn Lys Ser Phe Leu Ile Val Glu Ser 210 215 220
Lys Glu His Gln Gln Ser Glu Ile Leu Asp Ile Arg Gln Ser Phe Gln 225 230 235 240
Gly Asn Ser Ser Cys Asn Thr Phe Asp Gly Gly Lys Ser Cys Gln Ser 245 250 255
Ser Glu Lys Leu Ala Gln Gly Glu Lys Lys His Pro Ser Phe Gln Pro 260 265 270
Asn His Leu Gly Glu Phe Ser Arg Asn Asp Met Gln Val Leu His Asn 275 280 285
Tyr Pro Arg His Val Pro Val His Ile Leu Asp Gly Thr Asn Gly Ser 290 295 300
Gln Ile Ala Pro Asp Met Phe Asn His Glu Ser Thr Ser Gln Gln Ile 305 310 315 320
Asn Gly Val Pro Gly Leu Pro Asn Leu Tyr Ser Asn Pro Ala Ser Ser 325 330 335
Thr Thr Ser Glu His His Ser Asn Ala Pro Gln Ser Ser Ile His Gln 340 345 350
Ser Phe Ser Cys Phe His Pro Ile Phe Thr Pro Ile Arg Asp Pro Asp 355 360 365
Asp Tyr Arg Ser Phe Phe Gln Leu Ser Ser Thr Phe Ser Ser Leu Ile 370 375 380
Val Ser Ala Leu Leu Gln Asn Pro Ala Ala His Val Ala Ala Ser Phe 385 390 395 400
Ala Ala Ser Phe Trp Pro Tyr Ala Asn Met Glu Arg Pro Thr Asp Ser 405 410 415
Pro Thr Asp Asn Thr Ala Ser Gln Ile Asn Ser Ala Pro Ser Met Ala 420 425 430
Ala Ile Ala Ala Ala Thr Val Ala Ala Ala Thr Ala Trp Trp Ala Ala 435 440 445
His Gly Leu Leu Pro Leu Cys Ser Gln Phe Gln Ser Ser Phe Thr Cys 450 455 460
Val Pro Thr Ser Ala Thr Ser Met Gln Val Asp Ala Cys Gln Pro Arg 465 470 475 480
Val Asp Lys Asn Glu Gly Arg Glu Gly Thr His Asp Ser Pro His Val 485 490 495
Gln Glu Pro Val Pro Glu Cys Ser Glu Ala Leu Gln Glu Gln Gln Ser 500 505 510
Gly Ser Lys Leu Pro Pro Ser Leu Ser Ser Glu Ser Glu Glu Ser Glu 515 520 525
Gly Arg Lys Leu Lys Thr Gly Leu Thr Ala Thr Asp Thr Glu Gln Gly 530 535 540 Ala Ala Val Thr Lys Ile Asn Glu Pro Asn Ala Glu Lys Gly Gly Lys 545 550 555 560
Gln Val Asp Arg Ser Ser Cys Gly Ser Asn Thr Pro Ser Ser Ser Glu 565 570 575
Ile Glu Thr Asp Ala Leu Glu Lys Asp Glu Lys Gly Lys Glu Glu Pro 580 585 590
Gln Glu Ser Asn Ile Asn Leu Leu Ala Gly Glu Ala Ala Asn Arg Arg 595 600 605
Tyr Arg Asn Phe Ile Ser Pro Thr Glu Ser Trp Lys Glu Val Ser Glu 610 615 620
Glu Gly Arg Ile Ala Phe Gln Ala Leu Phe Thr Arg Glu Val Leu Pro 625 630 635 640
Gln Ser Phe Ser Pro Ser Leu Asp Leu Lys Asn Lys Gly Lys Ile Ile 645 650 655
Leu Glu Lys Leu Lys Gln Lys Pro Asp Glu Lys Val Gln Cys Gly Pro 660 665 670
Gln Leu Asp Leu Asn Asp Met Ala Ser Asn Ile Cys Ser Ser His Gln 675 680 685
Thr Met Glu Asp Asn Val Leu Leu Ile Gly Asn Lys Glu Asp Val Glu 690 695 700
Thr Cys Leu Pro Met Ile Glu Leu Gly Gln Val Arg Leu Lys Ala Arg 705 710 715 720
Arg Thr Gly Phe Lys Pro Tyr Lys Arg Cys Ser Leu Glu Ala Asn Asp 725 730 735
Ser Arg Val Thr Ser Ser Asn Cys Gln Asp Glu Glu Lys Ser Ser Lys 740 745 750
Arg Leu Arg Leu Glu Gly Glu Ala Ser Thr 755 760
<210> 97
<211> 516
<212> DNA
<213> Glycine max
<220> <221> misc_feature
<222> (340)..(340)
<223> η é a, c, g, or t
<400> 97
acgagcagag acggatctct tcctattgtt ctcgctttgt ttcttttgca gtagcatcat 60 catcatcacc ataccttgtt cagattctgc tcactttcac cacaacggct ttactattta 120 ccgcgtttag ttttcgtgtc accgcaaata atgaaaggag gtgttccctg tatccactcc 180 tcgtcaggga agatctgaag cagtgctagc tgctcacgtc ctgtaatgga cgcatactcc 240 tccggcgaag aagtggttgc taagactaga aaaccatata caatcactaa gcaaagggaa 300 cgatggacag aggaggagca taataggttt ctagaagctn tgaaactaca cgggcgacca 360 tggcagcgca tagaagagca tataggaaca aagactgccg tgcaaataag gagtcatgca 420 cagaagttct ttacaaagct ggagaaagag gcccttgtaa agggtgttcc aattggacat 480 gctcttgata tagacatatc ccctccacgg cccaaa 516 <210> 98
<211> 97
<212> PRT
<213> Glycine max
<220>
<221> INCERTO <222> (39) . . (39)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 98
Met Asp Ala Tyr Ser Ser Gly Glu Glu Val Val Ala Lys Thr Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Glu Glu His 20 25 30
Asn Arg Phe Leu Glu Ala Xaa Lys Leu His Gly Arg Pro Trp Gln Arg 35 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Leu Val Lys Gly 65 70 75 80
Val Pro Ile Gly His Ala Leu Asp Ile Asp Ile Ser Pro Pro Arg Pro 85 90 95
Lys <210> 99
<211> 2290
<212> DNA
<213> Lemna gibba
<220>
<221> misc_£eature <222> (2200) . . (2200)
<223> η é a, c, g, or t
<220>
<221> misc_feature <222> (2217) . . (2217)
<223> n é a, c, g, or t
<220>
<221> misc_feature <222> (2237) . . (2237)
<223> n é a, o, g, or t
<220>
<221> misc_feature
<222> (2266) . . (2269)
<223> n é a, o, g, or t
<220>
<221> misc_feature
<222> (2271) . . (2271)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (2283) . . (2287)
<223> n é a, c, g, or t
<400> 99
ctaatacgac tcactatagg gcaagcagtg gtatcaacgc agagtacgcg ggggttcgtc 60 caggtgcact tcaaaaaaac ttccttcctt ctccattcga ccattgaggt ctcgccacgt 120 ggatccgatt cgcctttcga aagattttcc aggccgagaa atctcctcgc ggatggagtg 180 gcggagagct ctccagaagg tgacttctgg ctggatttag ctggtaatca accactacag 240 taagttcctt ctctgctccc tccgccggcg gatcaccgga ttccgtctat taggtgaaag 300 ccgtccggat ccgtggagga gaagcggcca tgaggaagaa gaagcggagg gatccggaga 360 gctttttccg tttttaagtt cttgattgaa ggttgcgcca aggtctgtgc cttttatttt 420 cctaaattgt tttccctccg aggttctgca ggatgatccg gccgcggtat ccaaggcgcg 480 aggttgaaat gaatctctac gtttcgaatt gatttatcga tggtgtttgg aaacgagttc 540 ttcaggtcga acgtctgatc gaagacctcg tggttgaaga tctgcggtag agagaattcc 600 cgatcctctc ggctctgcga aatggatgca atctcctccg gagaggattt cattttaaag 660 acaaggaaac cgtatacgat aacgaagcag cgggaaaagt ggactgaaga ggagcacaga 720 aaattcctgg aggctttgaa actctatggc cgatcttggc agcgcattga agaacatatc 780 ggcactaaga cagctgttca aataaggagt cacgctcaga aatttttctc taagcttgaa 840 aaggaagcgg taatcaaagg cgttccctta ggacaagctc atggcatcga gatccctcca 900 ccccgcccca agcgcaagcc taacatcccc taccctcgaa aaatctcctc cgacattgat 960 gggtctcacc agaaggtggc atccgacgag gacaagtgct tcatgggcct tgcgctcttt 1020 caagactcgc cttgcacgac aaagcccagt tcggatgttg accttggtag attcgagggc 1080 ctcagcattg attcttgtgt taggaaagga gacgcaaagt caacttccca cggcggctcc 1140 atgtcagggg tcacgagaga tcaacacaag gcgaagtcta tgccattcgc cgcctccgac 1200 ttctccgcat tcttcaacct gtccgcacag ttttcaaacc ttgtcatctc aaccctgttg 1260 cagaatccag ccgcccacgc ggctgccacg ctggcagctt cattctggcc tgctgctggc 1320 atgaagactt ccacgggtac cacgccagac aatcagacaa atccaacccc aagcatggag 1380 gcaatcgtag ccgccacggt ggcggccgca tcagcatggt gggccgccca tggattatta 1440 cccctttgtc ctctggcagg gttattcccg ggtatctctg cattctctcc gggcccgaaa 1500 gtggaagagg cggcaaaccc aagatcaaag tcaatgcctt cgtcatccga ctccgacgag 1560 ctgaacccaa caaagcaggt gagttgtagt aaaccagatg aatctggaag agagaagaag 1620 aaggcggacc gatcctcttg tggctccaac acaccttcca gcagcgatgt ggagacggac 1680 gttgtattgg accttgaaaa ggaggacctt catctgggcc tggcctactc ggcttcctgg 1740 aaagaagtct ctcaccaggg tcgtgaggcg tttcaagcac tgttcaatcg agaggtgctg 1800 ccgcagagct tctcgccccc caaggaagag gaaggccggg ccaagccgcg gcgaaccggg 1860 ttcaagccct acaagaggtg ctccgcgacc ccgacccacg cttccggcga aaacgacagg 1920 aagagaatac gcctccagaa cgagccctca ctctgaaatc tttcattagt ggaatttctc 1980 gactacattt atttatcctt atgttttcta gaaagagaac tcgccgagca gcggtgaaga 2040 tgggattcta tgcaggcgat gtaccaaagt attctctgct ggteggcgta tgagagagaa 2100 aatggaggac tcaagggcag agatggacct tctcttacaa ggaatgagaa gagaatgaca 2160 gcattagaat attccactat agcactatcc aagtttcccn agaattcatc cacctgnaaa 2220 taattaatta aaataantat tatcaccatt ttttttattt cgtaannnna naataagcgc 2280 tgnnnnnagg 2290 <210> 100
<211> 444
<212> PRT
<213> Lemna gibba
<400> 100
Met Asp Ala Ile Ser Ser Gly Glu Asp Phe Ile Leu Lys Thr Arg Lys ίο
15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Lys Trp Thr Glu Glu Glu His 20 25 30
Arg Lys Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ser Trp Gln Arg 35 40 45
Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Ser Lys Leu Glu Lys Glu Ala Val Ile Lys Gly 65 70 75 80
Val Pro Leu Gly Gln Ala His Gly Ile Glu Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Asn Ile Pro Tyr Pro Arg Lys Ile Ser Ser Asp Ile 100 105 110
Asp Gly Ser His Gln Lys Val Ala Ser Asp Glu Asp Lys Cys Phe Met 115 120 125
Gly Leu Ala Leu Phe Gln Asp Ser Pro Cys Thr Thr Lys Pro Ser Ser 130 135 140
Asp Val Asp Leu Gly Arg Phe Glu Gly Leu Ser Ile Asp Ser Cys Val 145 150 155 160
Arg Lys Gly Asp Ala Lys Ser Thr Ser His Gly Gly Ser Met Ser Gly 165 170 175
Val Thr Arg Asp Gln His Lys Ala Lys Ser Met Pro Phe Ala Ala Ser 180 185 190
Asp Phe Ser Ala Phe Phe Asn Leu Ser Ala Gln Phe Ser Asn Leu Val 195 200 205
Ile Ser Thr Leu Leu Gln Asn Pro Ala Ala His Ala Ala Ala Thr Leu 210 215 220
Ala Ala Ser Phe Trp Pro Ala Ala Gly Met Lys Thr Ser Thr Gly Thr 225 230 235 240
Thr Pro Asp Asn Gln Thr Asn Pro Thr Pro Ser Met Glu Ala Ile Val 245 250 255 Ala Ala Thr Val Ala Ala Ala Ser Ala Trp Trp Ala Ala His Gly Leu 260 265 270
Leu Pro Leu Cys Pro Leu Ala Gly Leu Phe Pro Gly Ile Ser Ala Phe 275 280 285
Ser Pro Gly Pro Lys Val Glu Glu Ala Ala Asn Pro Arg Ser Lys Ser 290 295 300
Met Pro Ser Ser Ser Asp Ser Asp Glu Leu Asn Pro Thr Lys Gln Val 305 310 315 320
Ser Cys Ser Lys Pro Asp Glu Ser Gly Arg Glu Lys Lys Lys Ala Asp 325 330 335
Arg Ser Ser Cys Gly Ser Asn Thr Pro Ser Ser Ser Asp Val Glu Thr 340 345 350
Asp Val Val Leu Asp Leu Glu Lys Glu Asp Leu His Leu Gly Leu Ala 355 360 365
Tyr Ser Ala Ser Trp Lys Glu Val Ser His Gln Gly Arg Glu Ala Phe 370 375 380
Gln Ala Leu Phe Asn Arg Glu Val Leu Pro Gln Ser Phe Ser Pro Pro 385 390 395 400
Lys Glu Glu Glu Gly Arg Ala Lys Pro Arg Arg Thr Gly Phe Lys Pro 405 410 415
Tyr Lys Arg Cys Ser Ala Thr Pro Thr His Ala Ser Gly Glu Asn Asp 420 425 430
Arg Lys Arg Ile Arg Leu Gln Asn Glu Pro Ser Leu 435 440
<210> 101
<211> 1466
<212> DNA
<213> Zea mays
<220>
<221> misc feature
<222> (1392) . . (1392)
<223> η é a, e, g, or t
<220>
<221> misc feature
<222> (1406^) . . (1406)
<223> n é a, c, g, or t <220>
<221> misc feature
<222> (141S3) . . (1418)
<223> η é a, c, g, or t
<220>
<221> misc_feature
<222> (1425) . . (1425)
<223> n é a, c, g, or t
<220>
<221> miso_feature
<222> (1444) . . (1444)
<223> n é a, c, g, or t <400> 101 coacgcgtcc gctgcctgct cacttccgtt ccgtagtcca gctagatccc cgggcaaccg 60 atccaccgag aagcttgtgg ttgtggcggc ggcggagagg gaagcgggga gcgggaggtc 120 ggaggcctcc gtgcgtcgga ggtggacgag ggagcgaggc ggcgccagac cgaggttgcg 180 tcgggctcga tttctactgg gctgctgtct gctgagttta cggaagtgtt tggccctaga 240 agagttgaag ataaggagtg gagctaggtt taaactctgg tgacttggtt gttgtgtgca 300 acgaatcaac tatgctgagt ttttctgtag agtaacagaa attggatcaa ttcaagtaga 360 ggtctaggag gagatatgag gtactacttg cgtcaggtcc agcgtttggt tggagatatg 420 gaaggaggag ctctcttgtt tatagacgac ctcaactcca agtgacaaag cgaacagctg 480 ttgaacgttt cccttctatt tctgtttctt tttgccggat ttggagatgg aggtgaattc 540 ctctggcgag gaaactgtgg taaaggtaag aaagccgtac acaataacga agcagcggga 600 gcggtggaca gaggctgaac acaaacggtt ccttgaagcc ttgaaacttt atggcagagc 660 atggcagcgc atagaagagc atgttgggac aaagacagcc gtgcagatca gaagtcacgc 720 tcaaaagttc ttcactaagt tggaaaagga agctatgaac aatggtactt ctccggggca 780 agcccatgac attgacatac ctccaccacg gcctaaaaga aagccaaaca gtccatatcc 840 tcgaaaaagt tgtctcagct ccgagacaca aaccaaagaa cttccaaatg acaagtcaac 900 aaaaccaaat atgcccttga gcaatgggca tgtaaaaatg gtaggcgatg catctcttca 960 gaattttcaa aggaaggagt tgtctgaaaa aggaagtcgc tcggaagttc ttaatctctt 1020 ccgtgatgcc ccatctgcat cattttcttc agttaacaaa agctcttcaa atcatggggc 1080 acccaggagg accgaggcaa gtaaaacaga aagccgagat atgtccatca tggaaaataa 1140 ttcttttaac cccaacaccc aagaggatgt aaaggtgatc agtgatcagg aaatggaaag 1200 gcttaatggt atccagatca gatctaaatg tgaacattct catgaggggt atttggacat 1260 ctcaacgcaa caaatgaagc taatgccaaa gtctgtggag acaacatatg tggatgaaca 1320 aactgcaaga gcttcacaca ccctagcaga gagcaacggg gacagctagc gttccagtga 1380 ctgtacctga anggactcca toctgntcaa acaagtgntc cagtngggat ccatgggagc atgnacccat ggatccatcc catggt
<210> 102 <211> 280 <212> PRT <213> Zea mays <400> 102 Met Glu Val Asn Ser Ser Gly Glu Glu Thr Val Val Lys Val Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Ala Glu His 20 25 30
Lys Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Gln Arg 35 40 45
Ile Glu Glu His Val Gly Thr Lys Thr Ala Val Gln Ile Arg Ser His 50 55 60
Ala Gln Lys Phe Phe Thr Lys Leu Glu Lys Glu Ala Met Asn Asn Gly 65 70 75 80
Thr Ser Pro Gly Gln Ala His Asp Ile Asp Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Asn Ser Pro Tyr Pro Arg Lys Ser Cys Leu Ser Ser 100 105 110
Glu Thr Gln Thr Lys Glu Leu Pro Asn Asp Lys Ser Thr Lys Pro Asn 115 120 125
Met Pro Leu Ser Asn Gly His Val Lys Met Val Gly Asp Ala Ser Leu 130 135 140
Gln Asn Phe Gln Arg Lys Glu Leu Ser Glu Lys Gly Ser Arg Ser Glu 145 150 155 160
Val Leu Asn Leu Phe Arg Asp Ala Pro Ser Ala Ser Phe Ser Ser Val 165 170 175
Asn Lys Ser Ser Ser Asn His Gly Ala Pro Arg Arg Thr Glu Ala Ser 180 185 190
1440
1466
Lys Thr Glu Ser Arg Asp Met Ser Ile Met Glu Asn Asn Ser Phe Asn 195 200 205 Pro Asn Thr Gln Glu Asp Val Lys Val Xle Ser Asp Gln Glu Met Glu 210 215 220
Arg Leu Asn Gly Ile Gln Ile Arg Ser Lys Cys Glu His Ser His Glu 225 230 235 240
Gly Tyr Leu Asp Ile Ser Thr Gln Gln Met Lys Leu Met Pro Lys Ser 245 250 255
Val Glu Thr Thr Tyr Val Asp Glu Gln Thr Ala Arg Ala Ser His Thr 260 265 270
Leu Ala Glu Ser Asn Gly Asp Ser 275 280
<210> 103
<211> 1787
<212> DNA
<213> Lemna paucicostata
<220>
<221> misc_feature
<222> (1757) . . (1758)
<223> η é a, c, g, or t
<220>
<221> misc_feature
<222> (1769) . . (1769)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (1772) . . (1772)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (1778) .. (1778)
<223> n é a, c, g, or t
<400> 103
ctaatacgac tcactatagg gcaagcagtg gtatcaacgc agagtacgcg gaagcagtgg 60 tatcaaccca gagtacgcgg gaaatcttcg caagaatcta gtggcggaga gcgccggcga 120 aattctggct ggtatttagc tggtcgtcga gctccggtgc cattcttttt cgcccccatt 180 ggccgcggct tcagaatcgg ggagaaaggc gccgcggatc cgtggaggca gtcatgagaa 240 agaggaagag gaggaatttg ggatgattaa tccgtgctag tattcccgat cgtctgatct 300 ctgcattatg gatgtgaact cctcgggaga ggacttcgtc ttgaaggcga ggaaaccgta 360 cacgattacg aagcagcggg aaaagtggac tgaagaggag cacaacaagt tcttacaggc 420 tttgaagctc tacggccgat cttggcagcg aattgaagaa cacatcggct ctaagactgc 480 tgtccaaatt gggagccacg cacaaaaatt cttctcaaag cttgaaaagg aagccctcat 540 caaaggtgtt cccttggggc aaggccaagg catcgagatc cctcctcccc gtccgaagcg 600 caagcctaac aacccatacc ctctcaaaac ctccatctct aatggcattg gcgggctcca 660 ccagaagaaa gcttcttcag atgaggactt attgggactt tcactcttcc atgatccatc 720 ctgcaaaaca aagcccagcc cggatgttga acttggcaga tttgagggtc tcagaatcga 780 cacgagtctg aagaaaggtg attcaaagcc aaaatccatc agcggcacca cgtcgggaac 840 aacaacagac cagaatgctg aaaagtcaat gcaattgacc gcttctgcct tccctccatt 900 cttcaacatg tcagcggagt tttccagctt agtagtctca accttgctgc agaacccagc 960 tgcctatgcc actgcaatgc tggcagcttc cttctggcca cctgctgacg tagacacttc 1020 ttcggatccc ggatcagacg gacggataaa ccccactcca agtattgcag ccattgctgc 1080 tgccacagtg gccgccgcgt ctgcatggtg ggctatgcat ggattattac cattttgccc 1140 ccctgcagga ttatttcctg gcgtcttccc cttggctccg agcctgacag tggaagaagc 1200 tggtcaaagg tcaaagtcaa ttccctcgtc ttctgaatcc gacgagcgga atccagcaaa 1260 tgaaacgaat cgcgagccgg acgaacccag aggagagaag aagaaggcgg accggtcctc 1320 ttgtggctcc aacacgccct ccagcagcga tatggagacc aatgctgtat tggaccttga 1380 aaaggaggac cttcatcttg gcccggccca ctctccctcc tggaaggaag tctcccacca 14 40 gggccgtaag gcgttccaag cgctgttctc cagagaggtg ctgccgcaga gcttctcgcc 1500 cccgaaggaa gaggaaggcc ggtctaaacc gcggcgaacc gggttcaaac cttacaagag 1560 atcctctgca tccccggttc atgcttccag tgaaaacgac gtaaagagat tacgcctaca 1620 aaatgagtcc ttcccctgaa cttgcttatt attgctttct tgaaaaagaa ctccttgagc 1680 ctaacagagt aacgtgtata aaagtagtct ctgctttgtt tacttatgaa aggataatga 1740 agaatttaac ggaatannaa aaaaaaaana anaaaaanaa aaaaaaa 1787 <210> 104 <211> 443 <212> PRT
<213> Lemna paucicostata <400> 104
Met Asp Val Asn Ser Ser Gly Glu Asp Phe Val Leu Lys Ala Arg Lys 10 15
Pro Tyr Thr Ile Thr Lys Gln Arg Glu Lys Trp Thr Glu Glu Glu His 20 25 30
Asn Lys Phe Leu Gln Ala Leu Lys Leu Tyr Gly Arg Ser Trp Gln Arg 35 40 45 Ile Glu Glu His Ile Gly Ser Lys Thr Ala Val Gln Ile Gly Ser His 50 55 60
Ala Gln Lys Phe Phe Ser Lys Leu Glu Lys Glu Ala Leu Ile Lys Gly 65 70 75 80
Val Pro Leu Gly Gln Gly Gln Gly Ile Glu Ile Pro Pro Pro Arg Pro 85 90 95
Lys Arg Lys Pro Asn Asn Pro Tyr Pro Leu Lys Thr Ser Ile Ser Asn 100 105 110
Gly Ile Gly Gly Leu His Gln Lys Lys Ala Ser Ser Asp Glu Asp Leu 115 120 125
Leu Gly Leu Ser Leu Phe His Asp Pro Ser Cys Lys Thr Lys Pro Ser 130 135 140
Pro Asp Val Glu Leu Gly Arg Phe Glu Gly Leu Arg Ile Asp Thr Ser 145 150 155 160
Leu Lys Lys Gly Asp Ser Lys Pro Lys Ser Ile Ser Gly Thr Thr Ser 165 170 175
Gly Thr Thr Thr Asp Gln Asn Ala Glu Lys Ser Met Gln Leu Thr Ala 180 185 190
Ser Ala Phe Pro Pro Phe Phe Asn Met Ser Ala Glu Phe Ser Ser Leu 195 200 205
Val Val Ser Thr Leu Leu Gln Asn Pro Ala Ala Tyr Ala Thr Ala Met 210 215 220
Leu Ala Ala Ser Phe Trp Pro Pro Ala Asp Val Asp Thr Ser Ser Asp 225 230 235 240
Pro Gly Ser Asp Gly Arg Ile Asn Pro Thr Pro Ser Ile Ala Ala Ile 245 250 255
Ala Ala Ala Thr Val Ala Ala Ala Ser Ala Trp Trp Ala Met His Gly 260 265 270
Leu Leu Pro Phe Cys Pro Pro Ala Gly Leu Phe Pro Gly Val Phe Pro 275 280 285
Leu Ala Pro Ser Leu Thr Val Glu Glu Ala Gly Gln Arg Ser Lys Ser 290 295 300
Ile Pro Ser Ser Ser Glu Ser Asp Glu Arg Asn Pro Ala Asn Glu Thr 305 310 315 320
Asn Arg Glu Pro Asp Glu Pro Arg Gly Glu Lys Lys Lys Ala Asp Arg 325 330 335
Ser Ser Cys Gly Ser Asn Thr Pro Ser Ser Ser Asp Met Glu Thr Asn 340 345 350
Ala Val Leu Asp Leu Glu Lys Glu Asp Leu His Leu Gly Pro Ala His 355 360 365
Ser Pro Ser Trp Lys Glu Val Ser His Gln Gly Arg Lys Ala Phe Gln 370 375 380
Ala Leu Phe Ser Arg Glu Val Leu Pro Gln Ser Phe Ser Pro Pro Lys 385 390 395 400
Glu Glu Glu Gly Arg Ser Lys Pro Arg Arg Thr Gly Phe Lys Pro Tyr 405 410 415
Lys Arg Ser Ser Ala Ser Pro Val His Ala Ser Ser Glu Asn Asp Val 420 425 430
Lys Arg Leu Arg Leu Gln Asn Glu Ser Phe Pro 435 440
<210> 105
<211> 1439
<212> DNA
<213> Glycine max
<400> 105
cgcggatccg ccaaccacag aggagaagat attcaccaca tggcgataca aggccaaaat 60 gcatttacta gatcacaggg tggtcttcca attggagatg aaatatcttt caattctggt 120 gtgcattctg ttgcagatat tccactacat gatcagttat cttgtggaaa tgactatgcc 180 ttgaaggtta ggaaaccata tactatcaca aagcagagag agaggtggac agatgaagaa 240 cataagaagt tccttgaagc cttaaagcta tatggcaggg cctggcgacg gattgaagaa 300 catgttggca caaagactgc tgttcagatt cgaagtcatg ctcagaagtt tttttctaag 360 attcttcgag agtctagtgg gaacagtaca accttggagg agtcaattga aattccacct 420 ccgcgaccaa aacggaagcc aattcatcct taccctcgta agctagttga gtttccaaag 480 acaggaattt ccaactcaga acacccactg aggtctaatt ctctgaagtc atcagatttt 540 ggtcaagaaa acaattctcc caagtcagtt ttatctacag ttgtttcaga aactgttggt 600 tcctccgatt cagatacatc tagtcgatgt ttgtcaccag cctcatccat tagtggtgtc 660 cccacaaaca gatttccact tgctgagccc aaaacatcat ttaaggaaga agggtctgca 720 ccaagttcag ctcatgatga gcaacctcct gtgaaactgg agtttcttca caaagaaagt 780 gtttctacca gagatgatgc aacagaagaa tcatctggtc gtactctcaa actttttggg 840 accactctac tggtaacaga cacatgcaaa ccttcttccc caacaacgga gccgtgcaaa 900 ccaacacctg cggctgcaat gtatcttatg caacttcaga atggatgttc agatgttaca 960 gaaggtcatg cttctattgt tccttggtgg actcttcccc acaatactcc atttatgcca 1020 ctgcacaagg agccaaaagg gaagcatcta tattctaatc ttggagagtt tgaacataaa 1080 gaagttcaaa aggaaggatc atggactggt tcaaacacta gttcaattga tga tggaga t 1140 aacactgaaa aatcaggtga tcaagccaaa agtcatgtac atggttttag caaaagtgaa 1200 actttaacta tatctgagct aagggtgagg cctaaaacat gtggaaaagg gtttgtacca 1260 tataaaaggt gcatggcaga gagggaaaac cagtgctcat cagtatatta tgaggaaagg 1320 gaagagcaac gtattaagct ttccttatag taccctctta ttggcttttc ttcaaagcag 1380 tttccctttt acaggtataa tgtacctgtt tctgttgctg gatgaccttg ggtaccccg 1439 <210> 106
<211> 436
<212> PRT
<213> Glycine max
<400> 106
Met Ala Ile Gln Gly Gln Asn Ala Phe Thr Arg Ser Gln Gly Gly Leu 10 15
Pro Ile Gly Asp Glu Ile Ser Phe Asn Ser Gly Val His Ser Val Ala 20 25 30
Asp Ile Pro Leu His Asp Gln Leu Ser Cys Gly Asn Asp Tyr Ala Leu 35 40 45
Lys Val Arg Lys Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr 50 55 60
Asp Glu Glu His Lys Lys Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg 65 70 75 80
Ala Trp Arg Arg Ile Glu Glu His Val Gly Thr Lys Thr Ala Val Gln 85 90 95
Ile Arg Ser His Ala Gln Lys Phe Phe Ser Lys Ile Leu Arg Glu Ser 100 105 110
Ser Gly Asn Ser Thr Thr Leu Glu Glu Ser Ile Glu Ile Pro Pro Pro 115 120 125
Arg Pro Lys Arg Lys Pro Ile His Pro Tyr Pro Arg Lys Leu Val Glu 130 135 140
Phe Pro Lys Thr Gly Ile Ser Asn Ser Glu His Pro Leu Arg Ser Asn 145 150 155 160
Ser Leu Lys Ser Ser Asp Phe Gly Gln Glu Asn Asn Ser Pro Lys Ser 165 170 175
Val Leu Ser Thr Val Val Ser Glu Thr Val Gly Ser Ser Asp Ser Asp 180 185 190
Thr Ser Ser Arg Cys Leu Ser Pro Ala Ser Ser Ile Ser Gly Val Pro 195 200 205
Thr Asn Arg Phe Pro Leu Ala Glu Pro Lys Thr Ser Phe Lys Glu Glu 210 215 220
Gly Ser Ala Pro Ser Ser Ala His Asp Glu Gln Pro Pro Val Lys Leu 225 230 235 240
Glu Phe Leu His Lys Glu Ser Val Ser Thr Arg Asp Asp Ala Thr Glu 245 250 255
Glu Ser Ser Gly Arg Thr Leu Lys Leu Phe Gly Thr Thr Leu Leu Val 260 265 270
Thr Asp Thr Cys Lys Pro Ser Ser Pro Thr Thr Glu Pro Cys Lys Pro 275 280 285
Thr Pro Ala Ala Ala Met Tyr Leu Met Gln Leu Gln Asn Gly Cys Ser 290 295 300
Asp Val Thr Glu Gly His Ala Ser Ile Val Pro Trp Trp Thr Leu Pro 305 310 315 320
His Asn Thr Pro Phe Met Pro Leu His Lys Glu Pro Lys Gly Lys His 325 330 335
Leu Tyr Ser Asn Leu Gly Glu Phe Glu His Lys Glu Val Gln Lys Glu 340 345 350 Gly Ser Trp Thr Gly Ser Asn Thr Ser Ser Ile Asp Asp Gly Asp Asn 355 360 365
Thr Glu Lys Ser Gly Asp Gln Ala Lys Ser His Val His Gly Phe Ser 370 375 380
Lys Ser Glu Thr Leu Thr Ile Ser Glu Leu Arg Val Arg Pro Lys Thr 385 390 395 400
Cys Gly Lys Gly Phe Val Pro Tyr Lys Arg Cys Met Ala Glu Arg Glu 405 410 415
Asn Gln Cys Ser Ser Val Tyr Tyr Glu Glu Arg Glu Glu Gln Arg Ile 420 425 430
Lys Leu Ser Leu 435
<210> 107
<211> 1999
<212> DNA
<213> Triticum aestivum
<400> 107
ctcgtgccga attcggcacg agctcgtgcc gcgcctcttc gcctctcttc tcttctcctg 60 cctgcccctc cctcctcgcg ctccatcgac aacgagcacc tcgtcttgtt cttggtcttg 120 gcttttggtg tggcgacgtt gggtagtgtg attatcttgt tctcgctggc aggagatggc 180 ctgtacgcag gagaacgcca tggcaaccga cgaaagcacg gcggatcatc gcgggagtcg 240 tccgagttcc cacgacatgg atttatcagg ggatgaccac gtgccaaagg cacgcaagcc 300 gtacaccatc acgaagcagc gggagaagtg gaccgaggaa gagcacaagc gcttcctgga 360 ggccctgcag ctgcacggcc gcgcctggcg ccgcatacaa gagcacatag gcaccaagac 420 ggcagtgcaa atccggagcc acgcgcagaa gttcttctct aaggtcacca gagagtcgtc 480 cgggagctgc agcggctcgg gcgccgcggc cgcgacggcg acggcggcga tccagatccc 540 cccgccgcgg cccaagagga aaccgacgca cccgtacccg cgcaaagcgg acgacggcgc 600 ggcggccggc ggtaagcacg ccccggggct cacgcatctg gagaggcctc ccgtgcggat 660 gggcgagcag gaggaagggt cgccgacgtc ggtgctgacc gcgtcgcggg tcgaggcctc 720 cggtggccgc ttctcctaca actccagcgg cagcaggtcg ccggttccgt cggccgccgg 780 ctccctctac ggctcgtcgg tggacagagg ggacggctgc ctctcgccta atacgactaa 840 ggcttcagag ttcactgcaa atggtgatgt caaagagggg tcatgtacag gatcagcgac 900 atcagtcctt aagctattcg gcaagaaagt cgtggtgaat gattcattcc agaagccgaa 960 taccagcacc ggcaacccgc agaatggtgg cgacgtcgga actgaagctt cagacgatac 1020 aaccacacaa ggaagcagaa acctaccttc tggcggtgcc acagaaggaa gctcatggaa 1080 tccatggccg agcagcatgc agcagtttgt gtattttgtt cctcaaccgg atggtttcgc 1140 cacacaatct gcggtgccat ggtttggcac cctgcctggt gcaatgttct accagcaagc 1200 catggctcca aatcagcacc agcgccatcg ctcagagacc gcagaccaca agttcatgca 1260 gagggaagga tcctggacag gatcaaacac tggccctgga tcagctgcgc ataattcaga 1320 tgctgccgac tcccgaggga gaggaaacag cagtgagagc gacaaaacgc ctgtgccgcg 1380 gttaacaaag tgcgagagct ctgtttcggt cagtctgcaa agaggtttca tgccatacaa 1440 gagatgcgcg gccgagagcg aatcgctgcg gtcggaggcg cccagagagg agaccgacgg 1500 tgagttgacg aggctgtgct tgtgacagcc gaagattcga cacgctcttc acagtttaga 1560 tgtttgctag ttttgctcta gactcttgag ctggtggtgt gatctgcagt gggaagaagc 1620 gaccactcat cctgctggtt ttgcctgtcg gtatgtcgca cttctccgaa gcagctcgaa 1680 gccgcattag attgagcatt tctggttctt gctcgtgaat atatatagtt ggaatatgta 1740 gtatccatgt ttttgttctc tacagagtgt ctctgcagtt tttaccccaa atcgggaggc 1800 tcagagttca gtgttgttgc ctgtatcaac ctgggcctga gagagggttg tcgtagtctt 1860 aactgcatgt tgtaagctag gcaggcttgt atcactctgt agtctgcatt ctgtaaaaca 1920 tatgataggc agaagacgaa caaaaacgtc gaatgctctg tatatctaaa gtataacata 1980 atataaaaaa aaaaaaaaa 1999 <210> 108 <211> 449 <212> PRT
<213> Triticum aestivum <400> 108
Met Ala Cys Thr Gln Glu Asn Ala Met Ala Thr Asp Glu Ser Thr Ala 10 15
Asp His Arg Gly Ser Arg Pro Ser Ser His Asp Met Asp Leu Ser Gly 20 25 30
Asp Asp His Val Pro Lys Ala Arg Lys Pro Tyr Thr Ile Thr Lys Gln 35 40 45
Arg Glu Lys Trp Thr Glu Glu Glu His Lys Arg Phe Leu Glu Ala Leu 50 55 60
Gln Leu His Gly Arg Ala Trp Arg Arg Ile Gln Glu His Ile Gly Thr 65 70 75 80 Lys Thr Ala Val Gln Ile Arg Ser His Ala Gln Lys Phe Phe Ser Lys 85 90 95
Val Thr Arg Glu Ser Ser Gly Ser Cys Ser Gly Ser Gly Ala Ala Ala 100 105 110
Ala Thr Ala Thr Ala Ala Ile Gln Ile Pro Pro Pro Arg Pro Lys Arg 115 120 125
Lys Pro Thr His Pro Tyr Pro Arg Lys Ala Asp Asp Gly Ala Ala Ala 130 135 140
Gly Gly Lys His Ala Pro Gly Leu Thr His Leu Glu Arg Pro Pro Val 145 150 155 160
Arg Met Gly Glu Gln Glu Glu Gly Ser Pro Thr Ser Val Leu Thr Ala 165 170 175
Ser Arg Val Glu Ala Ser Gly Gly Arg Phe Ser Tyr Asn Ser Ser Gly 180 185 190
Ser Arg Ser Pro Val Pro Ser Ala Ala Gly Ser Leu Tyr Gly Ser Ser 195 200 205
Val Asp Arg Gly Asp Gly Cys Leu Ser Pro Asn Thr Thr Lys Ala Ser 210 215 220
Glu Phe Thr Ala Asn Gly Asp Val Lys Glu Gly Ser Cys Thr Gly Ser 225 230 235 240
Ala Thr Ser Val Leu Lys Leu Phe Gly Lys Lys Val Val Val Asn Asp 245 250 255
Ser Phe Gln Lys Pro Asn Thr Ser Thr Gly Asn Pro Gln Asn Gly Gly 260 265 270
Asp Val Gly Thr Glu Ala Ser Asp Asp Thr Thr Thr Gln Gly Ser Arg 275 280 285
Asn Leu Pro Ser Gly Gly Ala Thr Glu Gly Ser Ser Trp Asn Pro Trp 290 295 300
Pro Ser Ser Met Gln Gln Phe Val Tyr Phe Val Pro Gln Pro Asp Gly 305 310 315 320
Phe Ala Thr Gln Ser Ala Val Pro Trp Phe Gly Thr Leu Pro Gly Ala 325 330 335 Met Phe Tyr Gln Gln Ala Met Ala Pro Asn Gln His Gln Arg His Arg 340 345 350
Ser Glu Thr Ala Asp His Lys Phe Met Gln Arg Glu Gly Ser Trp Thr 355 360 365
Giy Ser Asn Thr Gly Pro Gly Ser Ala Ala His Asn Ser Asp Ala Ala 370 375 380
Asp Ser Arg Gly Arg Gly Asn Ser Ser Glu Ser Asp Lys Thr Pro Val 385 390 395 400
Pro Arg Leu Thr Lys Cys Glu Ser Ser Val Ser Val Ser Leu Gln Arg 405 410 415
Gly Phe Met Pro Tyr Lys Arg Cys Ala Ala Glu Ser Glu Ser Leu Arg 420 425 430
Ser Glu Ala Pro Arg Glu Glu Thr Asp Gly Glu Leu Thr Arg Leu Cys 435 440 445
Leu
<210> 109
<211> 1501
<212> DNA
<213> Glycine max
<400> 109
acgagagaag atcttgattc ttgacaagag attgtttctt ctgcagctat ggcgattcaa 60 gatcaaaatg gatttttcag atcacagggt ggtcctccag aaggaggtgg tgtatctttg 120 agttctgggc attctgtcac acatattcaa cttaatgacc agttttcttg tgggaatgac 180 tatgctctga aggtaaggaa gccgtatact atcactaaac agagagagcg atggacagat 240 gaagaacata agaagttcct tgaagcttta aagctgtatg gacgggcttg gcgacgtatt 300 gaagaaca tg ttggcacaaa gactgctgtt cagattcgaa gtcatgctca gaagtttttt 360 tctaaggttc ttcacgatcc tactgggaac aatacaaaca cagtggagtc aattgaaatt 420 cctcctccaa gaccgaaacg aaagccgatg catccttacc ctcgtaaact agttgagacc 480 ccaaataagg aaatttcgat cccagaacaa cctatgaagt ctaattctct gaagtcgtca 540 gactttgatc aagaaaacca atctccaaaa tcagtattat caggagttgg ttcagacagc 600 cttggctcct ctgattcaga caoaccaaat ggaagtttgt cgcccatgtc atccattagt 660 ggcttccata caagcagttt tacacgtgcc aaacccaaaa caacaacatc tgaggaagaa 720 gctgggatgg acactgattc aactcatgat gagaaacctc ttatgaaatt caagcttcct 780 ccaaatggat gtgtttccat caaagaagac aacaeagcag aagaatcttc cggtcggact 840 ttcaaactct ttggaatgac tctatttgta acagacaect gcaaaccatc tccaacaatc 900 gaggaatgct aaagatacct ctaaacattc gcgcgcaacg cctttcctcc tccatggagg 960 atggcaaatt ggaacttgtt ggacactcta gagcaagtga aacatcagca atatccaagc 1020 taaaggtgag agtggaaect gaagcatgtg ggaaagggtt tgtgccatat aaaagatgca 1080 tatctgttgt gacagctgat gatagagaag agcaatgtat ccatctttcc ttgtagctta 1140 taccccactg gatttttcct tcaaaaagtg ttccctttgt catgatgagc tgtaatggtt 1200 gttttggttg ctgetggatg tgagttggta tgatatagga aggaaaaagg ggtggctgaa 1260 aattttgata tttccgttga attgcactgc actgcaeatt ctccagctgt tcaaatccgt 1320 aaacttgcct tttctatttt tttgacttcc aagtttcaac acattctccg cgggtccaag 1380 ccgtgtctgt gcgcggcact taggagctgt gtccgtgctt cctagtttaa ctgtgaataa 1440 ctgtgaatta tatctagtgc ctttttttta aaaaaaaaaa aaaaaaaaaa aaaaaaactc 1500 g 1501 <210> 110
<211> 287
<212> PRT
<213> Glycine max
<400> 110
Met Ala Ile Gln Asp Gln Asn Gly Phe Phe Arg Ser Gln Gly Gly Pro 10 15
Pro Glu Gly Gly Gly Val Ser Leu Ser Ser Gly His Ser Val Thr His 20 25 30
Ile Gln Leu Asn Asp Gln Phe Ser Cys Gly Asn Asp Tyr Ala Leu Lys 35 40 45
Val Arg Lys Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Asp 50 55 60
Glu Glu His Lys Lys Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala 65 70 75 80
Trp Arg Arg Ile Glu Glu His Val Gly Thr Lys Thr Ala Val Gln Ile 85 90 95
Arg Ser His Ala Gln Lys Phe Phe Ser Lys Val Leu His Asp Pro Thr 100 105 110 Gly Asn Asn Thr Asn Thr Val Glu Ser Ile Glu Ile Pro Pro Pro Arg 115 120 125
Pro Lys Arg Lys Pro Het His Pro Tyr Pro Arg Lys Leu Val Glu Thr 130 135 140
Pro Asn Lys Glu Ile Ser Ile Pro Glu Gln Pro Met Lys Ser Asn Ser 145 150 155 160
Leu Lys Ser Ser Asp Phe Asp Gln Glu Asn Gln Ser Pro Lys Ser Val 165 170 175
Leu Ser Gly Val Gly Ser Asp Ser Leu Gly Ser Ser Asp Ser Asp Thr 180 185 190
Pro Asn Gly Ser Leu Ser Pro Met Ser Ser Ile Ser Gly Phe His Thr 195 200 205
Ser Ser Phe Thr Arg Ala Lys Pro Lys Thr Thr Thr Ser Glu Glu Glu 210 215 220
Ala Gly Met Asp Thr Asp Ser Thr His Asp Glu Lys Pro Leu Met Lys 225 230 235 240
Phe Lys Leu Pro Pro Asn Gly Cys Val Ser Ile Lys Glu Asp Asn Thr 245 250 255
Ala Glu Glu Ser Ser Gly Arg Thr Phe Lys Leu Phe Gly Met Thr Leu 260 265 270
Phe Val Thr Asp Thr Cys Lys Pro Ser Pro Thr Ile Glu Glu Cys 275 280 285
<210> 111
<211> 479
<212> DNA
<213> Glycine max
<400> 111
gtctctgtgg aggtttgggt gttttttgag gcagagctta ttctcatttt gctccaatgg 60 agatgcagga ccaaatagaa agcacaagat caaccatatt tggctcagct agtaacatcc 120 attccaatgc tgaaaagcag gccgaaaatg ttgctcccaa ggtgaggaaa ccatatacca 180 ttactaaaca aagggagaag tggacagagg aagagcatca aaagttcctt gaagctttga 240 aattgtatgg tcgtggctgg cgccaaattg aagagcatat aggtaccaaa actgctgttc 300 agattcgaag ccatgctcaa aagtttttct ctaaggttgt gagggaatct gaggtcagtg 360 atgagggttc tatacaacca attaacatac ctcctcctcg gcctaagagg aaacccctgc afcccatatcc ccgtaaatca gttaattctt tcagaggacc caccatacca aatgaaaca
<210> 112 <211> 141 <212> PRT <213> Glycine max <400> 112 Met Glu Met Gln Asp Gln Ile Glu Ser Thr Arg Ser Thr Ile Phe Gly 10 15
Ser Ala Ser Asn Ile His Ser Asn Ala Glu Lys Gln Ala Glu Asn Val 20 25 30
Ala Pro Lys Val Arg Lys Pro Tyr Thr Ile Thr Lys Gln Arg Glu Lys 35 40 45
Trp Thr Glu Glu Glu His Gln Lys Phe Leu Glu Ala Leu Lys Leu Tyr 50 55 60
Gly Arg Gly Trp Arg Gln Ile Glu Glu His Ile Gly Thr Lys Thr Ala 65 70 75 80
Val Gln Ile Arg Ser His Ala Gln Lys Phe Phe Ser Lys Val Val Arg 85 90 95
Glu Ser Glu Val Ser Asp Glu Gly Ser Ile Gln Pro Ile Asn Ile Pro 100 105 110
Pro Pro Arg Pro Lys Arg Lys Pro Leu His Pro Tyr Pro Arg Lys Ser 115 120 125
Val Asn Ser Phe Arg Gly Pro Thr Ile Pro Asn Glu Thr 130 135 140
<210> 113
<211> 1141
<212> DNA
<213> Glycine max
<220>
<221> misc_feature
<222> (664) . . (664)
<223> η é a, c, g, or t
<220>
<221> misc feature
<222> (IioT) . . (1101)
<223> n é a, c, g, or t
420
479 <400> 113 ggaaaattct tcttttccga gaaatttcgc gtttttactg ttgaatcgat 60 tcattttctc aattcacaaa tcgggggtgt ctgaaattoa aagctgttgt tgttgttggc tgctggggtt 120 agtctctgtg gaggtttggg tgttttctga ggcagagccg attctcattt tgctccaatg 180 gagatgcagg tctcaatcat cttacgttca ctcttctgga gacttttctc ctcttttaat 240 aggaaaaaag agaatttcaa tatgaattca tccagtgact ttatttctaa ggaactgaaa 300 tatattctag accaaataga aagcacaaga tcaaccatat ttggctcagc tagtaacatc 360 cattccaatg gtgaaaagca atccgaaaat gttgctcata taccttctgt tggaaacaac 420 caaactccca aggtgaggaa accatatacc attactaaac aaagggagaa gtggactgag 480 gaagagcatc aaaagttcct tgaagctttg aaattgtatg gtcgtggctg gcgccaaatt 540 gaagagcata taggtaccaa aaatgctgtt cagattcgaa gccatgctca aaagtttttc 600 tctaaggttg tgagggaatc tgagggcagc gctgagagtt ctatacaacc aattaacata 660 cctnctcctc ggcctaagag gaaacccctg catccatatc cccgtaaatc agttaattct 720 ttcagaggac ccaccatacc aaatgaaaca gaaatatctc catctacaaa cctgttggtt 780 gcagagaaag acaccccatc tccaacctcg gtgctatcta cagttggttc ggaagcattt 840 gggtctcaat tttcagagca gactaacaga tgcctttcac caaactcttg caccactgat 900 attcactcag tcagcttatc acctgttgaa aaggaaaatg attgcatgac atccaaagaa 960 tctgaggagg aagagaaagc atcaccagct tcacgtcctt tatccactgt ttctaacoca 1020 aaaatgtgca tgaaacctga gtttagttcc aaggagatag aagatgctac tgatatgcca 1080 caaaccacta gtattaagct ntttggaaga acagtctcta tggtaggtaa tcagaagtca 1140 C 1141 <210> 114
<211> 321
<212> PRT
<213> Glycine max
<220>
<221> INCERTO <222> (163)..(163)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 114
Met Glu Met Gln Val Ser Ile Ile Leu Arg Ser Leu Phe Trp Arg Leu 10 15
Phe Ser Ser Phe Asn Arg Lys Lys Glu Asn Phe Asn Met Asn Ser Ser 20 25 30 Ser Asp Phe Ile Ser Lys Glu Leu Lys Tyr Ile Leu Asp Gln Ile Glu 35 40 45
Ser Thr Arg Ser Thr Ile Phe Gly Ser Ala Ser Asn Ile His Ser Asn 50 55 60
Gly Glu Lys Gln Ser Glu Asn Val Ala His Ile Pro Ser Val Gly Asn 65 70 75 80
Asn Gln Thr Pro Lys Val Arg Lys Pro Tyr Thr Ile Thr Lys Gln Arg 85 90 95
Glu Lys Trp Thr Glu Glu Glu His Gln Lys Phe Leu Glu Ala Leu Lys 100 105 110
Leu Tyr Gly Arg Gly Trp Arg Gln Ile Glu Glu His Ile Gly Thr Lys 115 120 125
Asn Ala Val Gln Ile Arg Ser His Ala Gln Lys Phe Phe Ser Lys Val 130 135 140
Val Arg Glu Ser Glu Gly Ser Ala Glu Ser Ser Ile Gln Pro Ile Asn 145 150 155 160
Ile Pro Xaa Pro Arg Pro Lys Arg Lys Pro Leu His Pro Tyr Pro Arg 165 170 175
Lys Ser Val Asn Ser Phe Arg Gly Pro Thr Ile Pro Asn Glu Thr Glu 180 185 190
Ile Ser Pro Ser Thr Asn Leu Leu Val Ala Glu Lys Asp Thr Pro Ser 195 200 205
Pro Thr Ser Val Leu Ser Thr Val Gly Ser Glu Ala Phe Gly Ser Gln 210 215 220
Phe Ser Glu Gln Thr Asn Arg Cys Leu Ser Pro Asn Ser Cys Thr Thr 225 230 235 240
Asp Ile His Ser Val Ser Leu Ser Pro Val Glu Lys Glu Asn Asp Cys 245 250 255
Met Thr Ser Lys Glu Ser Glu Glu Glu Glu Lys Ala Ser Pro Ala Ser 260 265 270
Arg Pro Leu Ser Thr Val Ser Asn Pro Lys Met Cys Met Lys Pro Glu 275 280 285 Phe Ser Ser Lys Glu Ile Glu Asp Ala Thr Asp Met Pro Gln Thr Thr 290 295 300
Ser Ile Lys Leu Phe Gly Arg Thr Val Ser Met Val Gly Asn Gln Lys 305 310 315 320
Ser
<210> 115 <211> 470 <212> DNA <213> Glycine max <400> 115 gtctcgagtt tttactgttg acgagaacta aaattcaaag gaccaaatag aaagcacaag ccattccaat ggtgaaaagc aatccgaaaa ccaaaactcc caaggtgagg aaaccatata aggaagagca tcaaaagttc cttgaagctt ttgaagagca tataggtacc aaaaatgctg tctctaaggt tgtgagggaa tctgagggca tacctcctcc tcggcctaag aggaaacccc <210> 116
<211> 114
<212> PRT
<213> Glycine max
<400> 116
aatcgataat tcacaaatcg ggggtgtctg 60 atcaaccata tttggctcag ctagtaacat 120 tgttgctcat ataccttctg ttggaaacaa 180 ccattactaa acaaagggag aagtggactg 240 tgaaattgta tggtcgtggc tggcgccaaa 300 ttcagattcg aagccatgct caaaagtttt 360 gcgctgagag ttctatacaa ccaattaaca 420 tgcaatccat attcccccgt 470 Tyr Leu Leu Leu Glu 15
Thr Ile Thr Lys Gln 30
Phe Leu Glu Ala Leu 45
Glu His Ile Gly Thr 60
Met Val Lys Ser Asn Pro Lys Met Leu Leu Ile 10
Thr Thr Lys Thr Pro Lys Val Arg Lys Pro Tyr 20 25
Arg Glu Lys Trp Thr Glu Glu Glu His Gln Lys 35 40
Lys Leu Tyr Gly Arg Gly Trp Arg Gln Ile Glu 50 55
Lys Asn Ala Val Gln Ile Arg Ser His Ala Gln Lys Phe Phe Ser Lys 65 70 75 80 Val Val Arg Glu Ser Glu Gly Ser Ala Glu Ser Ser Ile Gln Pro Ile 85 90 95
Asn Ile Pro Pro Pro Arg Pro Lys Arg Lys Pro Leu Gln Ser Ile Phe 100 105 110
Pro Arg
<210> 117
<211> 1297
<212> DNA
<213> Glycine max
<400> 117
acgaggaaag ccttatacta tcaccaaaca gagagagcga tggacagatg aagaacataa 60 gaagttcctt gaagctttaa agctgtacgg acgggcttgg cgacgtattg aagaacatgt 120 tggcacaaag actgctgttc agattcgaag tcatgctcag aagttttttt ctaagcttct 180 tcgcgatcct actgggaaca atacaaacac agtggagtca attgaaattc ctcctccaag 240 gccgaaacga aagccagtgc atccttaccc tcgtaaacta gttgagaccc ctaataaaga 300 aattttgatc ccagaacaac ttatgaagtc taattctctg aagtcatcag actttgatca 360 agaaaaccaa tctccaaaat cagtattatc aggagttggt tcagacagcc ttggctcctc 420 tgattcagac acaccatatg gaagtttgtc gcccatgtca tccattagtg gcatccatac 480 aagcagtttt acacgtgctg agcacaaaac aacatctgat gaagctggga tggacactga 540 ttcagctcat gatgagaaac ctcttatgaa attcaagctt cctccaaatg aatgtgtttc 600 catcaaagat gacacagcag aagaatcttc cggtcggact ttcaaacttt tcggaatgac 660 tctatttgta acagacacct gcaaaccatc tccaacaatc gaggcatgca aaccgatacc 720 tctaaacatt cgtgtgcgat gcctttcctc ctccatgggg gatgatggca aattggaact 780 tcgtggccac tctacagcaa gtgaaacatc agcaatatcc aagctaaagg tgagagtggg 840 acctgaagca tgtggtaaag ggtttgtgcc atataaaaga tgcatatctg ttgtgacagc 900 tgataataga gaagagcaat gcatccatct ttccttgtag cttaccccac tggatatttc 960 ttcaaaaggg ttccctttga gatgatgagc tgtaatggtt gttttagctg ctggatgtga 1020 gttggcataa aatagggagc tgaaaatttt gacatttctg ttgcattaca ctgcacattc 1080 tccagctgtt caaatccgtg aacttgcctt ttgtattttt ttgactttca agtttcaact 1140 gtgaattata tctagtgttt ttgtttgttt ttttttaaaa actttttatg ctccttaaga 1200 gtatgcaaag tgtaagtcac gtacttgtgc agtgcttatt aacgtacttg ttcatagatt 1260 ctgcatttac taccatgatg ggaatttttt ctaacga 1297 <210> 118 <211> 312 <212> PRT <213> Glycine max <400> 118 Arg Gly Lys Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Asp 10 15
Glu Glu His Lys Lys Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala 20 25 30
Trp Arg Arg Ile Glu Glu His Val Gly Thr Lys Thr Ala Val Gln Ile 35 40 45
Arg Ser His Ala Gln Lys Phe Phe Ser Lys Leu Leu Arg Asp Pro Thr 50 55 60
Gly Asn Asn Thr Asn Thr Val Glu Ser Ile Glu Ile Pro Pro Pro Arg 65 70 75 80
Pro Lys Arg Lys Pro Val His Pro Tyr Pro Arg Lys Leu Val Glu Thr 85 90 95
Pro Asn Lys Glu Ile Leu Ile Pro Glu Gln Leu Met Lys Ser Asn Ser 100 105 110
Leu Lys Ser Ser Asp Phe Asp Gln Glu Asn Gln Ser Pro Lys Ser Val 115 120 125
Leu Ser Gly Val Gly Ser Asp Ser Leu Gly Ser Ser Asp Ser Asp Thr 130 135 140
Pro Tyr Gly Ser Leu Ser Pro Met Ser Ser Ile Ser Gly Ile His Thr 145 150 155 160
Ser Ser Phe Thr Arg Ala Glu His Lys Thr Thr Ser Asp Glu Ala Gly 165 170 175
Met Asp Thr Asp Ser Ala His Asp Glu Lys Pro Leu Met Lys Phe Lys 180 185 190
Leu Pro Pro Asn Glu Cys Val Ser Ile Lys Asp Asp Thr Ala Glu Glu 195 200 205
Ser Ser Gly Arg Thr Phe Lys Leu Phe Gly Met Thr Leu Phe Val Thr 210 215 220 Asp Thr Cys Lys Pro Ser Pro Thr Ile Glu Ala Cys Lys Pro Ile Pro 225 230 235 240
Leu Asn Ile Arg Val Arg Cys Leu Ser Ser Ser Met Gly Asp Asp Gly 245 250 255
Lys Leu Glu Leu Arg Gly His Ser Thr Ala Ser Glu Thr Ser Ala Ile 260 265 270
Ser Lys Leu Lys Val Arg Val Gly Pro Glu Ala Cys Gly Lys Gly Phe 275 280 285
Val Pro Tyr Lys Arg Cys Ile Ser Val Val Thr Ala Asp Asn Arg Glu 290 295 300
Glu Gln Cys Ile His Leu Ser Leu 305 310
<210> 119
<211> 969
<212> DNA
<213> Ostreococcus tauri
<400> 119
ggcgaggccc catcgagtaa tgataccggt gatgaggcca cggtgacgac gaacgacgcc 60 acgagcgatc cgacgacgac ggaggggaag gcggtgaaga cgcgcaagcc gtacaccatt 120 acgaagaagc gcgagcgatg gtccgacgag gagcacgcgt tgttcgtaga gtcgttaaaa 180 aagtacggac gcgcttggaa aaggattgag gagtacattg ggacgaagag tgcggtgcaa 240 attcggtcgc acgcgcagaa atttttcgcc aagctacaaa aggagcagat cgtcgcgagc 300 ggaagcgagg gctctgggag cacgcgaaag cgtggagcgg atcgatcgac gtcgcagagc 360 aagagaagca agtctagcta tgcgacggat atcaatcttg agattccgcc ggcgcggcct 420 aagaagaagc cggcgcatcc gtacccgagg aaggcgacgt ctcagcagcc gagcggcgga 480 agcggagagc gagacaactc tggtgggact ggtaagagct ccggtacggc gcaaaagtgg 540 cctaccgagg cgagtcagga gtttatcgct agtacgtcgt cgagcgccgc gatagcagcc 600 gtgctttcgg tcgcttgcga taagatgcag aacaatttgc atcaagagtt gcggcaagga 660 tattttggaa taccgaccgg catgcaaccg cagcagggaa tgtttgccca gcctgggatg 720 tttccgatga acgcgatgat gagtccgttc gtggcgatga acaccgtctc cggcgcgccg 780 acaccgccgc cgatgaccaa tccacagcaa tttcttaact acgccaactt cttcagcaac 840 tattggcctc agttcgccaa cgccgctaac gccaacgctg tgaatgtgat gttccaacaa 900 caacagcaac agcaacagca acagcaacaa caacaacata aacagcgggc gggtggtgaa 960 accaaataa
<210> 120 <211> 322 <212> PRT
<213> Ostreococcus tauri <400> 120
Gly Glu Ala Pro Ser Ser Asn Asp Thr Gly Asp Glu Ala Thr Val Thr 10 15
Thr Asn Asp Ala Thr Ser Asp Pro Thr Thr Thr Glu Gly Lys Ala Val 20 25 30
Lys Thr Arg Lys Pro Tyr Thr Ile Thr Lys Lys Arg Glu Arg Trp Ser 35 40 45
Asp Glu Glu His Ala Leu Phe Val Glu Ser Leu Lys Lys Tyr Gly Arg 50 55 60
Ala Trp Lys Arg Ile Glu Glu Tyr Ile Gly Thr Lys Ser Ala Val Gln 65 70 75 80
Ile Arg Ser His Ala Gln Lys Phe Phe Ala Lys Leu Gln Lys Glu Gln 85 90 95
Ile Val Ala Ser Gly Ser Glu Gly Ser Gly Ser Thr Arg Lys Arg Gly 100 105 110
Ala Asp Arg Ser Thr Ser Gln Ser Lys Arg Ser Lys Ser Ser Tyr Ala 115 120 125
Thr Asp Ile Asn Leu Glu Ile Pro Pro Ala Arg Pro Lys Lys Lys Pro 130 135 140
Ala His Pro Tyr Pro Arg Lys Ala Thr Ser Gln Gln Pro Ser Gly Gly 145 150 155 160
Ser Gly Glu Arg Asp Asn Ser Gly Gly Thr Gly Lys Ser Ser Gly Thr 165 170 175
Ala Gln Lys Trp Pro Thr Glu Ala Ser Gln Glu Phe Ile Ala Ser Thr 180 185 190
Ser Ser Ser Ala Ala Ile Ala Ala Val Leu Ser Val Ala Cys Asp Lys 195 200 205
969
Met Gln Asn Asn Leu His Gln Glu Leu Arg Gln Gly Tyr Phe Gly Ile 210 215 220
Pro Thr Gly Met Gln Pro Gln Gln Gly Met Phe Ala Gln Pro Gly Met 225 230 235 240
Phe Pro Met Asn Ala Met Met Ser Pro Phe Val Ala Met Asn Thr Val 245 250 255
Ser Gly Ala Pro Thr Pro Pro Pro Met Thr Asn Pro Gln Gln Phe Leu
260 265 270
Asn Tyr Ala Asn Phe Phe Ser Asn Tyr Trp Pro Gln Phe Ala Asn Ala
275 280 285
Ala Asn Ala Asn Ala Val Asn Val Met Phe Gln Gln Gln Gln Gln Gln
290 295 300
Gln Gln Gln Gln Gln Gln Gln Gln His Lys Gln Arg Ala Gly Gly Glu 305 310 315 320
Thr Lys
<210> 121
<211> 330
<212> DNA
<213> Medicago truncatula
<400> 121
atggatgcag cagcatactc ctctggagaa gacgtcgttc tcaagacaag aaagccatat 60 acaatcacaa aacaaagaga acgatggact gaagacgaac ataatcgatt tctagaagcc 120 ctcaagctat atggccgagc atggcagcgt atagaagaac atataggaac aaagactgct 180 gtgcaaatca ggagccatgc gcaaaaattc ttttcaaagg tcgattggta ccctctctca 240 cctcccaatt tatgctcaaa ctttttctta tttctattgg gaaaaaactc aagtcccaca 300 tcggatataa gactcttgat gggagtatag 330 <210> 122 <211> 109 <212> PRT
<213> Medicago truncatula <400> 122
Met Asp Ala Ala Ala Tyr Ser Ser Gly Glu Asp Val Val Leu Lys Thr 10 15
Arg Lys Pro Tyr Thr Ile Thr Lys Gln Arg Glu Arg Trp Thr Glu Asp 20 25 30 Glu His Asn Arg Phe Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp 35 40 45
Gln Arg Ile Glu Glu His Ile Gly Thr Lys Thr Ala Val Gln Ile Arg 50 55 60
Ser His Ala Gln Lys Phe Phe Ser Lys Val Asp Trp Tyr Pro Leu Ser 65 70 75 80
Pro Pro Asn Leu Cys Ser Asn Phe Phe Leu Phe Leu Leu Gly Lys Asn 85 90 95
Ser Ser Pro Thr Ser Asp Ile Arg Leu Leu Met Gly Val 100 105
<210> 123 <211> 1343 <212> DNA
<213> Malus χ domestica
<400> 123
tttcaattta aaaaaaaacc aaggggaatc cgactcttcc gcaatttatg gtatccaaaa 60 acccgaaccc gccagagggc ttgtacttgg atccgaacga aagcggcatg ccgttgcccg 120 gactcgggcc gttcgcctcg gccactgcga cgacgtcaac gacttcgtct tcggcggagg 180 atctgagcaa gaagattcgg aagccctaca caattaccaa gtccagagag agctggagtg 240 agccggagca cgacaagttc ctcgaagccc tccaactctt cgatcgcgat tggaaaaaga 300 ttgaagcttt cattgggtca aagacggtca tacagatacg tagtcatgca cagaagtatt 360 ttctgaaggt tcaaaagaat gggacgagcg agcatctacc tccccctagg ccaaaaagga 420 aagctgctca cccatatcct caaaaagctt caaaaaatgc tctggcactt ccgccagtat 480 cttggtcatg tcagtcttca tctgctttac ttgaatctgg gtttaatcaa aggccagatt 540 catcatcaat gcttatgagt cctatccctg gccctgtagc cccttcctgg cctaatggtt 600 ctgtgcaaac agccaatcca tctcatgagt ccaaagttgt ttcagggcca actgtgctga 660 acaacagttg cagtaccaca gaaagcaccc ctaaagctca accagttggt ggaacaactg 720 atcaagtgaa ccatagccat gcattgagag ttcttcccga ctttactcaa gtatacggat 780 tcattggcag cgtctttgac cctaatgtta caggtcatct tcagaatctg aagaaga tgg 840 atccgataga tgttgaaacg gtgttactgt tgatgagaaa cctgtccatg aatttgacca 900 atcccgaatt cgaggatcat agacagttgc tttcatccta caagatggac gcgaatacag 960 ggaatctcag tgatgcaact aaaacccttt gcgacgatca acatgagaaa gttccttaag 1020 tggttgttct gaaacttcaa cgctttcttc tcatcccgtt ggcagtgctt gaatttcgaa 1080 tctaatcttt gcccaaccgg tgttggcgtc cagcagatga attgctgggg gaaaacctca 1140 attagtagaa agcatcaggt ttcatctagg tattgactcg tcgtgatact gcgttgtaag 1200 tgtagcgagc tcaacgacca caagcatgtc aactggtatg gcgttctggt gtggttgtgt 1260 gtgtgtgtgt atatatatat atcaagataa aggtaatgga tttttgtata gttagttcaa 1320 gttcatcttg taaaaaaaaa aaa 1343 <210> 124 <211> 323 <212> PRT
<213> Malus χ domestica <400> 124
Met Val Ser Lys Asn Pro Asn Pro Pro Glu Gly Leu Tyr Leu Asp Pro 10 15
Asn Glu Ser Gly Met Pro Leu Pro Gly Leu Gly Pro Phe Ala Ser Ala 20 25 30
Thr Ala Thr Thr Ser Thr Thr Ser Ser Ser Ala Glu Asp Leu Ser Lys 35 40 45
Lys Ile Arg Lys Pro Tyr Thr Ile Thr Lys Ser Arg Glu Ser Trp Ser 50 55 60
Glu Pro Glu His Asp Lys Phe Leu Glu Ala Leu Gln Leu Phe Asp Arg 65 70 75 80
Asp Trp Lys Lys Ile Glu Ala Phe Ile Gly Ser Lys Thr Val Ile Gln 85 90 95
Ile Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val Gln Lys Asn Gly 100 105 110
Thr Ser Glu His Leu Pro Pro Pro Arg Pro Lys Arg Lys Ala Ala His 115 120 125
Pro Tyr Pro Gln Lys Ala Ser Lys Asn Ala Leu Ala Leu Pro Pro Val 130 135 140
Ser Trp Ser Cys Gln Ser Ser Ser Ala Leu Leu Glu Ser Gly Phe Asn 145 150 155 160
Gln Arg Pro Asp Ser Ser Ser Met Leu Met Ser Pro Ile Pro Gly Pro 165 170 175 Val Ala Pro Ser Trp Pro Asn Gly Ser Val Gln Thr Ala Asn Pro Ser 180 185 190
His Glu Ser Lys Val Val Ser Gly Pro Thr Val Leu Asn Asn Ser Cys 195 200 205
Ser Thr Thr Glu Ser Thr Pro Lys Ala Gln Pro Val Gly Gly Thr Thr 210 215 220
Asp Gln Val Asn His Ser His Ala Leu Arg Val Leu Pro Asp Phe Thr 225 230 235 240
Gln Val Tyr Gly Phe Ile Gly Ser Val Phe Asp Pro Asn Val Thr Gly 245 250 255
His Leu Gln Asn Leu Lys Lys Met Asp Pro Ile Asp Val Glu Thr Val 260 265 270
Leu Leu Leu Met Arg Asn Leu Ser Met Asn Leu Thr Asn Pro Glu Phe 275 280 285
Glu Asp His Arg Gln Leu Leu Ser Ser Tyr Lys Met Asp Ala Asn Thr 290 295 300
Gly Asn Leu Ser Asp Ala Thr Lys Thr Leu Cys Asp Asp Gln His Glu 305 310 315 320
Lys Val Pro
<210> 125
<211> 1419
<212> DNA
<213> Triticiom aestivum
<400> 125
gcacgagccc aacccggccc ccggcgccac accgcgacgc gacgcgacgc agccaccacg 60 caggcggacg cggccgagct acggacaaaa gcctccctct ccatcccccg gtccagcgag 120 cgagagaccg ccaccggcac cggcacccaa cgggacctgg cacgccgcgc gccctctggc 180 ctccgtgcgt cccccatggt ctccacgaac ccgccgccgc cgccggcgct gtccgaggcg 240 gccgccgccg tgtcgggcga cgacgccagc aagaaggtgc ggaagcccta caccatcacc 300 aagtcgcgcg agagctggac ggagcaggag cacgacaagt tcctcgaggc cctgcagctc 360 tttgatcgtg actggaaaaa gatagaagct tttgttggtt cgaagactgt catccagata 420 aggagccatg cacagaagta ttttttgaag gttcagaaaa atggaaccag cgaacatgtc 480 ccacctccac gaccgaagcg taaagctgcc cacccatacc ctcagaaggc ctccaaaaat 540 gagccaggat atgccctgaa gacagatcca tctgccatgc ttagaaattc aggaatgaac 600 gtggctgttt ctccatggac ccacaattct atcccaccag ttgtcgcctc atctttcatg 660 aaagaagatt taggtgctgg gtctatgggt ccaaacattt tttgctcaag cagtagtgaa 720 ggccctccaa gggcatggca atctggtgaa accaatgacc agataaatca agttccatca 780 ctccgcatta tgccagattt tgcacaagta tacagcttct taggcagtgt tttcgatcca 840 agcacaaagg gccatttgca gaaactgaag gagatgaatc caattgatgt tgaaacagca 900 ctgttgttaa tgagaaatct ctccatcaac ttgaccagtc ctgattttga agatcaaagg 960 aagttgctgt cttcgtacaa ttccacctct gatgggctag agctagggag ctccagaagc 1020 tcacttctta cggataatgc attgagcctt ttttgatagt tcatgattaa aggcagatgg 1080 tgccgcctat agtttcatct cgatctctga atagggggtt ttcctggagc acccatgaag 1140 gcgctttcac cattgtattt ctagctagct tcgaaccgta gaatgtgtaa gggtgcaacc 1200 atgtacagta ggcttccata aggtgagatc tgtctatagc ctgatgtgta tatattttcg 1260 ccccgaagcg tgtatctttc ctcccccgat accttggcca tcaaggtgca tggatgttgc 1320 ttcagtcaaa gcttgaaagt gctgtccttg gtgatggtaa atggaaagga aattttgagt 1380 aatgctggtt actccctttt caaaaaaaaa aaaaaaaaa 1419 <210> 126 <211> 286 <212> PRT
<213> Tritictim aestivum <400> 126
Met Val Ser Thr Asn Pro Pro Pro Pro Pro Ala Leu Ser Glu Ala Ala 10 15
Ala Ala Val Ser Gly Asp Asp Ala Ser Lys Lys Val Arg Lys Pro Tyr 20 25 30
Thr Ile Thr Lys Ser Arg Glu Ser Trp Thr Glu Gln Glu His Asp Lys 35 40 45
Phe Leu Glu Ala Leu Gln Leu Phe Asp Arg Asp Trp Lys Lys Ile Glu 50 55 60
Ala Phe Val Gly Ser Lys Thr Val Ile Gln Ile Arg Ser His Ala Gln 65 70 75 80
Lys Tyr Phe Leu Lys Val Gln Lys Asn Gly Thr Ser Glu His Val Pro 85 90 95 Pro Pro Arg Pro Lys Arg Lys Ala Ala His Pro Tyr Pro Gln Lys Ala 100 105 110
Ser Lys Asn Glu Pro Gly Tyr Ala Leu Lys Thr Asp Pro Ser Ala Met 115 120 125
Leu Arg Asn Ser Gly Met Asn Val Ala Val Ser Pro Trp Thr His Asn 130 135 140
Ser Ile Pro Pro Val Val Ala Ser Ser Phe Met Lys Glu Asp Leu Gly 145 150 155 160
Ala Gly Ser Met Gly Pro Asn Ile Phe Cys Ser Ser Ser Ser Glu Gly 165 170 175
Pro Pro Arg Ala Trp Gln Ser Gly Glu Thr Asn Asp Gln Ile Asn Gln 180 185 190
Val Pro Ser Leu Arg Ile Met Pro Asp Phe Ala Gln Val Tyr Ser Phe 195 200 205
Leu Gly Ser Val Phe Asp Pro Ser Thr Lys Gly His Leu Gln Lys Leu 210 215 220
Lys Glu Met Asn Pro Ile Asp Val Glu Thr Ala Leu Leu Leu Met Arg 225 230 235 240
Asn Leu Ser Ile Asn Leu Thr Ser Pro Asp Phe Glu Asp Gln Arg Lys 245 250 255
Leu Leu Ser Ser Tyr Asn Ser Thr Ser Asp Gly Leu Glu Leu Gly Ser 260 265 270
Ser Arg Ser Ser Leu Leu Thr Asp Asn Ala Leu Ser Leu Phe 275 280 285
<210> 127
<211> 633
<212> DNA
<213> Glycine max
<400> 127
gtcgctcccc ggaatccttc ccttcgccgc cgcagccacc gccaccgcag attcctttga
ggaccctgct aagaagactc gcaagcctta cactattacc aagtctaggg agagttggac 120
cgaacctgag cacgacaagt tcctcgaagc tcttcagtta tttgaccgtg actggaaaaa 180
gattgaagca tttgttggat caaagacagt catccagata cgtagccatg ctcagaaata 240
ctttctaaaa gttcagaaga gtgggacaaa tgaacatctt cctccaccca gaccaaaaag 300
60 aaaagctgct catccatatc ctcagaaagc ttcaaaaact ggttatagtc tfccactatat tttttttttt tgctacacaa tttagtgcat ttgtctctaa taattgttgg tgagatttgg cagctccagt actctcaoaa gtatcaggat cctttcaatc ttcatcagct ttgcttgaac ctggatacat attaaagcat gactcttcag caatgcctaa aactcccatt attaacactg cagtgtcttc ctggtcaaac aactctctgc agaaaaccac cagcgtattg catgggcaaa aacaaaaagt gaataattgt tgcagtagca gta
<210> 128 <211> 127 <212> PRT <213> Glycine max <400> 128 Ser Leu Pro Gly Ile Leu Pro Phe Ala Ala Ala Ala Thr Ala Thr Ala 10 15
Asp Ser Phe Glu Asp Pro Ala Lys Lys Thr Arg Lys Pro Tyr Thr Ile 20 25 30
Thr Lys Ser Arg Glu Ser Trp Thr Glu Pro Glu His Asp Lys Phe Leu 35 40 45
Glu Ala Leu Gln Leu Phe Asp Arg Asp Trp Lys Lys Ile Glu Ala Phe 50 55 60
Val Gly Ser Lys Thr Val Ile Gln Ile Arg Ser His Ala Gln Lys Tyr 65 70 75 80
Phe Leu Lys Val Gln Lys Ser Gly Thr Asn Glu His Leu Pro Pro Pro 85 90 95
Arg Pro Lys Arg Lys Ala Ala His Pro Tyr Pro Gln Lys Ala Ser Lys 100 105 110
Thr Gly Tyr Ser Leu His Tyr Ile Phe Phe Phe Cys Tyr Thr Ile
120 125
115 <210> 129 <211> 646 <212> DNA <213> Glycine max <400> 129 taaacttgga cccctccggc atgtcgctcc ccggaatcct tcccttcgcc gccgcagcca ccgccaccgc agattccttt gaggaccctg ctaagaagac tcgcaagcct tacactatta
360
420
480
540
600
633
60
120 ccaagtctag ggagagttgg accgaacctg agcacgacaa gttcctcgaa gctcttcagt 180 tatttgaccg tgactggaaa aagattgaag catttgttgg atcaaagaca gtcatccaga 240 tacgtagcca tgctcagaaa tactttctaa aagttcagaa gagtgggaca aatgaacatc 300 ttcctccacc cagaccaaaa agaaaagctg ctcatccata tcctcagaaa gcttcaaaaa 360 ctgctccagt actctcacaa gtatcaggat cctttcaatc ttcatcagct ttgcttgaac 420 ctggatacat attaaagcat gactcttcag caatgcctaa aactcccatt attaacactg 480 cagtgtcttc ctggtcaaac aactctctgc agaaaaccac cagcgtattg catgggcaaa 540 aacaaaaagt gaataattgt tgcagtagca gtagaagtcc tagagcgcag ttggttggtg 600 aatctaatgg tcaaaggaat aacagccatc cattgagagt tcttcc 646 <210> 130 <211> 215 <212> PRT <213> Glycine max <400> 130 Asn Leu Asp Pro Ser Gly Met Ser Leu Pro Gly Ile Leu Pro Phe Ala 10 15
Ala Ala Ala Thr Ala Thr Ala Asp Ser Phe Glu Asp Pro Ala Lys Lys 20 25 30
Thr Arg Lys Pro Tyr Thr Ile Thr Lys Ser Arg Glu Ser Trp Thr Glu 35 40 45
Pro Glu His Asp Lys Phe Leu Glu Ala Leu Gln Leu Phe Asp Arg Asp 50 55 60
Trp Lys Lys Ile Glu Ala Phe Val Gly Ser Lys Thr Val Ile Gln Ile 65 70 75 80
Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val Gln Lys Ser Gly Thr 85 90 95
Asn Glu His Leu Pro Pro Pro Arg Pro Lys Arg Lys Ala Ala His Pro 100 105 110
Tyr Pro Gln Lys Ala Ser Lys Thr Ala Pro Val Leu Ser Gln Val Ser 115 120 125
Gly Ser Phe Gln Ser Ser Ser Ala Leu Leu Glu Pro Gly Tyr Ile Leu 130 135 140
Lys His Asp Ser Ser Ala Met Pro Lys Thr Pro Ile Ile Asn Thr Ala 145 150 155 160
Val Ser Ser Trp Ser Asn Asn Ser Leu Gln Lys Thr Thr Ser Val Leu 165 170 175
His Gly Gln Lys Gln Lys Val Asn Asn Cys Cys Ser Ser Ser Arg Ser 180 185 190
Pro Arg Ala Gln Leu Val Gly Glu Ser Asn Gly Gln Arg Asn Asn Ser 195 200 205
His Pro Leu Arg Val Leu Pro 210 215
<210> 131
<211> 206
<212> DNA
<213> Pisiom sativum
<220>
<221> misc_feature
<222> (13)..(13)
<223> η é a, c, g, or t
<220>
<221> misc_feature
<222> (18) . . (18)
<223> n é a, c, g, or t
<400> 131
tttacaaagc agngaganag gtggacagat gaagaacata agaagttcct tgaagcttta aagctgtatg gccgagcctg gcgaaaaatc gaagaacatg ttggcacaaa gactgctgtg cagattcgaa gtcatgctca gaagtttttt tctaagatca atcgagacac taatgggaac gatacgacat tggtggagtc aattga
<210> 132
<211> 68
<212> PRT
<213> Pisum sativum
<220>
<221> INCERTO <222> (5)..(6)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 132
Phe Thr Lys Gln Xaa Xaa Arg Trp Thr Asp Glu Glu His Lys Lys Phe 10 15
60
120
180
206
Leu Glu Ala Leu Lys Leu Tyr Gly Arg Ala Trp Arg Lys Ile Glu Glu 20
25
30
His Val Gly Thr Lys Thr Ala Val Gln He Arg
Ser His Ala Gln Lys 45
35
40
Phe Phe Ser Lys Ile Asn Arg Asp Thr Asn Gly
Asn Asp Thr Thr Leu 60
50
55
Val Glu Ser Ile 65
<210> 133 <211> 1577 <212> DNA <213> Glycine max
<220>
<221> misc_feature
<222> (1573) .. (1573)
<223> η é a, c, g, or t
<400> 133
gggacgagca aatcgaaaga caagagtcac agcgcacccc caaacagaaa cagagttatt 60
gggagcacga aacactaact gactcgattc gattgaggtt acaaaacact aaactgattc 120
gattcgattc gattgaggtt tcggtttggt cttgatggtg tcggtgaacc caagccctgc 180
tcaaggcttc tacttcttcg atccctccaa catggtcctt cccggcgtca acaatcttcc 240
accgcccccg ccgcctgctc cgccttctca cgccgccgtg gaggatccga gtaagaagat 300
caggaaaccc tacacgatta ccaagtccag ggagagctgg actgagcagg agcacgacaa 360
gtttctagaa gctctccaat tatttgatcg ggactggaaa aagattgaag catttgttgg 420
ttcaaaaaca gttatccaga tacgaagtca tgcacagaag tattttctta aagttcagaa 480
gaagggaaca agtgaacatg tacctcctcc ccggccaaag agaaaagctg ctcgcccata 540
ccctcaaaaa gctcctaaaa ctcctactgt atcccaagtt atgggcccat tgcaatcttc 600
atcttcttto attgaacctg catacattta tatcccggat tcttcatctg cgcttggaac 660
tccagttact aacatgcctt cgtcatcttg gaactataat aatacaccac aatctgtcaa 720
tgtgccacaa gtgaccagag atgacatggg attcactgta gctggacaaa cagctcctct 780
taattgttgc tgcagcagta gtaatgagag cacccctcca acttggccaa gtagcaaaag 840
gactaatcaa ggtgaccagg agccaattaa agtaatgcca gattttgcac aagtctacag 900
cttcatcggc agtgtattcg atccaaattc aactaatcac ctacagaaac tacgacagat 960
ggatccatta aatgtggaaa cgatattgtt gttgatgaga aatctctcca tcaatttaat 1020
gagtcctgaa tttgaggatc acaagaggct gctttcttca tatgacaccg actctgacaa 1080 gtcgaagttg gttaatattt gcagcaaatc cctcactaat aaatctgaga gtgctgtttt 1140 gtctgcttag gatgtggcca gtggtttgcc ctcaatatat tttctgaatg cacataaagt 1200 gggagcaaga aggggagaag acataggttt tgctaaaagg aagtgtagta tctagatgct 1260 tgcaagttga atgtgtatat aactatatat aaatatatgt atacattttg gattgagttt 1320 ttgtttgttt taggcactgt tagatcgtag atatgctggt gtgtttggtg tatatctttc 1380 gaagatatga tgattgtcct tggaatgcag gacaatgaga gtcctgttag gtcacttctg 1440 gaggctatac tgtacagtct gttgagtgct tttgtttatt atgctgtgaa gcataggatt 1500 agtataaaag agtggtgtta ggacttaggg gtgccgcgtt gtatatataa agcaataaaa 1560 cagtgcagat aantttc 1577 <210> 134 <211> 331 <212> PRT <213> Glycine max <400> 134 Met Val Ser Val Asn Pro Ser Pro Ala Gln Gly Phe Tyr Phe Phe Asp 10 15
Pro Ser Asn Met Val Leu Pro Gly Val Asn Asn Leu Pro Pro Pro Pro 20 25 30
Pro Pro Ala Pro Pro Ser His Ala Ala Val Glu Asp Pro Ser Lys Lys 35 40 45
Ile Arg Lys Pro Tyr Thr Ile Thr Lys Ser Arg Glu Ser Trp Thr Glu 50 55 60
Gln Glu His Asp Lys Phe Leu Glu Ala Leu Gln Leu Phe Asp Arg Asp 65 70 75 80
Trp Lys Lys Ile Glu Ala Phe Val Gly Ser Lys Thr Val Ile Gln Ile 85 90 95
Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val Gln Lys Lys Gly Thr 100 105 110
Ser Glu His Val Pro Pro Pro Arg Pro Lys Arg Lys Ala Ala Arg Pro 115 120 125
Tyr Pro Gln Lys Ala Pro Lys Thr Pro Thr Val Ser Gln Val Met Gly 130 135 140
Pro Leu Gln Ser Ser Ser Ser Phe Ile Glu Pro Ala Tyr Ile Tyr Ile 145 150 155 160
Pro Asp Ser Ser Ser Ala Leu Gly Thr Pro Val Thr Asn Met Pro Ser 165 170 175
Ser Ser Trp Asn Tyr Asn Asn Thr Pro Gln Ser Val Asn Val Pro Gln 180 185 190
Val Thr Arg Asp Asp Met Gly Phe Thr Val Ala Gly Gln Thr Ala Pro 195 200 205
Leu Asn Cys Cys Cys Ser Ser Ser Asn Glu Ser Thr Pro Pro Thr Trp 210 215 220
Pro Ser Ser Lys Arg Thr Asn Gln Gly Asp Gln Glu Pro Ile Lys Val 225 230 235 240
Met Pro Asp Phe Ala Gln Val Tyr Ser Phe Ile Gly Ser Val Phe Asp 245 250 255
Pro Asn Ser Thr Asn His Leu Gln Lys Leu Arg Gln Met Asp Pro Leu 260 265 270
Asn Val Glu Thr Ile Leu Leu Leu Met Arg Asn Leu Ser Ile Asn Leu 275 280 285
Met Ser Pro Glu Phe Glu Asp His Lys Arg Leu Leu Ser Ser Tyr Asp 290 295 300
Thr Asp Ser Asp Lys Ser Lys Leu Val Asn Ile Cys Ser Lys Ser Leu 305 310 315 320
Thr Asn Lys Ser Glu Ser Ala Val Leu Ser Ala 325 330
<210> 135
<211> 786
<212> DNA
<213> Glycine max
<400> 135
acgagggacg agcgaaaccc aagacaagaa tcacagcgca cagtgacaca tacataaaaa 60 aacgaaacac aaacagaaac agagttattg ggaaacacga aacactaatt gattcgaatt 120 cgattcgatt gaggattgct gtttgggtgt cttgatggtg tcggtgaacc caaaccccgc 180 tcaaggcttc tacttcttcg atccctccaa catgaccctt cccggcgtca acaatcttcc 240 accgccgccg ccgccggctc cggctgctcc ctccgccgtc gaggatccga ataagaagat 300 ccggaaaccc tacacgatta ccaagtccag ggagagctgg accgagcagg agcacgacaa 360 gtttctagaa gctctccaat tatttgatcg ggactggaaa aagattgaag catttgttgg 420 ttcaaaaaca gttatccaga tacgaagtca tgcacaaaag tattttctta aagttcagaa 480 gaatggaaca agtgaacatg tacctcctcc tcggccaaag agaaaagctg ctcacccata 540 ccctcaaaaa gctcctaaaa ctcctactgt atcccaagtt atgggcccat tgcaatcttc 600 atctgctttc attgaacctg catacattta tagcccagat tcttcatctg tgcttggaac 660 tccagttact aacatgcctt tatcatcttg gaattataat actacaccac aaccaggcaa 720 tgtgccacaa gtgaccagag atgacatggg attgactgga gctggacaag ctgctcctct 780 taattg 786 <210> 136 <211> 210 <212> PRT <213> Glycine max <400> 136 Met Val Ser Val Asn Pro Asn Pro Ala Gln Gly Phe Tyr Phe Phe Asp 10 15
Pro Ser Asn Met Thr Leu Pro Gly Val Asn Asn Leu Pro Pro Pro Pro 20 25 30
Pro Pro Ala Pro Ala Ala Pro Ser Ala Val Glu Asp Pro Asn Lys Lys 35 40 45
Ile Arg Lys Pro Tyr Thr Ile Thr Lys Ser Arg Glu Ser Trp Thr Glu 50 55 60
Gln Glu His Asp Lys Phe Leu Glu Ala Leu Gln Leu Phe Asp Arg Asp 65 70 75 80
Trp Lys Lys Ile Glu Ala Phe Val Gly Ser Lys Thr Val Ile Gln Ile 85 90 95
Arg Ser His Ala Gln Lys Tyr Phe Leu Lys Val Gln Lys Asn Gly Thr 100 105 110
Ser Glu His Val Pro Pro Pro Arg Pro Lys Arg Lys Ala Ala His Pro 115 120 125
Tyr Pro Gln Lys Ala Pro Lys Thr Pro Thr Val Ser Gln Val Met Gly 130 135 140
Pro Leu Gln Ser Ser Ser Ala Phe Ile Glu Pro Ala Tyr Ile Tyr Ser 145 150 155 160
Pro Asp Ser Ser Ser Val Leu Gly Thr Pro Val Thr Asn Met Pro Leu 165 170 175
Ser Ser Trp Asn Tyr Asn Thr Thr Pro Gln Pro Gly Asn Val Pro Gln 180 185 190
Val Thr Arg Asp Asp Met Gly Leu Thr Gly Ala Gly Gln Ala Ala Pro 195 200 205
Leu Asn 210
<210> 137
<211> 587
<212> DNA
<213> Glycine max
<220>
<221> misc_feature
<222> (420)..(420)
<223> η é a, c, g, or t
<220>
<221> misc_feature
<222> (529)..(529)
<223> n é a, c, g, or t
<400> 137
atgcactaga gaagggtgag aaagggaagg aagagcctga aacacctgat gctaaccaat 60 tagccattga ctttagtaat cgtcgtagaa gtgttagcaa tcttactgat tcttggaaag 120 aggtctctga agaggggaga ctggcctttc aggctctatt ctccagagag gtgttgcctc 180 aaagcttttc acctcctcat gctttgaaga ataagaatca gcaaatggac aacgccaata 240 ataacaagca aaacatagaa aataacgagg gactgttaac catagggctt ggacaaggaa 300 agcttaagac tcgtcgaaca ggctttaaac cctacaaaag atgttccatg gaggccaagg 360 aaaatagggt tggagcgagc aacaatcaag gtgaagagca aggttgtaag agaatacgtn 420 tggaagggga gacttcgact tgaggtttga tatatgcagt aacataaatg caacctttgg 480 gttttacatg tcatttctta atccccccac aacggtgtaa ctatattgnt tatttctaat 540 tctgcagctc accgaaactg tcgtgtagat gtggtgtcca ttttgaa 587 <210> 138
<211> 146
<212> PRT
<213> Glycine max <220>
<221> INCERTO <222> (140)..(140)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 138
Ala Leu Glu Lys Gly Glu Lys Gly Lys Glu Glu Pro Glu Thr Pro Asp 10 15
Ala Asn Gln Leu Ala Ile Asp Phe Ser Asn Arg Arg Arg Ser Val Ser 20 25 30
Asn Leu Thr Asp Ser Trp Lys Glu Val Ser Glu Glu Gly Arg Leu Ala 35 40 45
Phe Gln Ala Leu Phe Ser Arg Glu Val Leu Pro Gln Ser Phe Ser Pro 50 55 60
Pro His Ala Leu Lys Asn Lys Asn Gln Gln Met Asp Asn Ala Asn Asn 65 70 75 80
Asn Lys Gln Asn Ile Glu Asn Asn Glu Gly Leu Leu Thr Ile Gly Leu 85 90 95
Gly Gln Gly Lys Leu Lys Thr Arg Arg Thr Gly Phe Lys Pro Tyr Lys 100 105 110
Arg Cys Ser Met Glu Ala Lys Glu Asn Arg Val Gly Ala Ser Asn Asn 115 120 125
Gln Gly Glu Glu Gln Gly Cys Lys Arg Ile Arg Xaa Glu Gly Glu Thr 130 135 140
Ser Thr 145
<210> 139
<211> 1187
<212> DNA
<213> Glycine max
<400> 139
ctgcttccca cgccacatcg ttctccctct ccctccctct ctctctctct ctctctctct 60 ctctctctct aagctctttc ttgttgaaac tgtgagtcta tgttatttgt ggcggagcat 120 gaactccacc accaacactt cgaattctca gtcaatggct gcagcagcac cgagtgatgg 180 ttctgggaag aaggtaagaa agccttacac cataaccaag tccagagaga gttggactga 240 ggaagaacat gataagtttc tcgaagctct ccaactattt gacagggact ggaagaaaat 300 tgaagatttt gtaggttcaa aaacagttat tcagattcga agccatgccc agaaatactt 360 cttgaaagtt caaaagaatg ggactgtggc acatgtgcct cctccccgtc caaagcgcaa 420 agctgctcat ccttacccgc aaaaggcatc aaaaaatgtt ttggtgccac taccagcttc 480 cattggttat gcttcatcga gaaatacgct tgcacctggg tttgcctcat gggatgaaac 540 ttccctgctg atgaatgctg gagccgataa acccatgacc tgtcaggatg aactcaacaa 600 tcttcatcat ggaaatgaag ctgatattgg atcaaagggg atagcacaga ttaccaacag 660 cagtctcagt ggtgttggaa attctactag aacactactg acttctgaga taccaaagca 720 agggaaacaa gctccagtgc ttcatggttt gccagatttt gctgaagttt acggtttcat 780 tggaagtgta tttgatccag aaacaaatga ccatgtccag aagctgaagg aaatggatcc 840 tataaatttt gaaactgttt tgttgctaat gagaaacctc actgtcaact tgtctagccc 900 tgacttcgaa cccatttgat agaatgggga gacatcccaa tactactggg caaggcgcca 960 atgacccacc caaaagatta ctgcacaagc ttaaaccaca agtaatttga caactactca 1020 attagtacct agacgtcaag ggatctctct gagaaggccc cagagtgttc tctttttcta 1080 attacatgtg aatgacgtga taggatttcc atgtaataaa tataggctct tgtattaatt 1140 tgtgattagc cccggattac ttgaaaaatt aaagtattta ttagata 1187 <210> 140 <211> 266 <212> PRT <213> Glycine max
<400> 140
Met Asn Ser Thr Thr Asn Thr Ser Asn Ser Gln Ser Met Ala Ala Ala 10 15
Ala Pro Ser Asp Gly Ser Gly Lys Lys Val Arg Lys Pro Tyr Thr Ile 20 25 30
Thr Lys Ser Arg Glu Ser Trp Thr Glu Glu Glu His Asp Lys Phe Leu 35 40 45
Glu Ala Leu Gln Leu Phe Asp Arg Asp Trp Lys Lys Ile Glu Asp Phe 50 55 60
Val Gly Ser Lys Thr Val Ile Gln Ile Arg Ser His Ala Gln Lys Tyr 65 70 75 80
Phe Leu Lys Val Gln Lys Asn Gly Thr Val Ala His Val Pro Pro Pro 85 90 95
Arg Pro Lys Arg Lys Ala Ala His Pro Tyr Pro Gln Lys Ala Ser Lys 100 105 110
Asn Val Leu Val Pro Leu Pro Ala Ser Ile Gly Tyr Ala Ser Ser Arg 115 120 125
Asn Thr Leu Ala Pro Gly Phe Ala Ser Trp Asp Glu Thr Ser Leu Leu 130 135 140
Met Asn Ala Gly Ala Asp Lys Pro Met Thr Cys Gln Asp Glu Leu Asn 145 150 155 160
Asn Leu His His Gly Asn Glu Ala Asp Ile Gly Ser Lys Gly Ile Ala 165 170 175
Gln Ile Thr Asn Ser Ser Leu Ser Gly Val Gly Asn Ser Thr Arg Thr 180 185 190
Leu Leu Thr Ser Glu Ile Pro Lys Gln Gly Lys Gln Ala Pro Val Leu 195 200 205
His Gly Leu Pro Asp Phe Ala Glu Val Tyr Gly Phe Ile Gly Ser Val 210 215 220
Phe Asp Pro Glu Thr Asn Asp His Val Gln Lys Leu Lys Glu Met Asp 225 230 235 240
Pro Ile Asn Phe Glu Thr Val Leu Leu Leu Met Arg Asn Leu Thr Val 245 250 255
Asn Leu Ser Ser Pro Asp Phe Glu Pro Ile 260 265
<210> 141
<211> 18
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo 1
<220>
<221> VARIANTE
<222> (2)..(2)
<223> /substituir = "Thr"
<220>
<221> VARIANTE
<222> (3) . . (3)
<223> /substituir = "Asp" /substituir = "Ala" /substituir = "Pro" /substituir = "Thr" /substituir = "Arg" <220>
<221> VARIANTE
<222> (4) . . (4)
<223> /substituir = "Glu" /substituir = "Pro" /substituir = "Gin" /substituir = "Asp" /substituir = "Ala" /substituir = "Asn" /substituir "Tyr "
<220>
<221> VARIANTE
<222> (6)..(6)
<223> /substituir = "Gin"
<220>
<221> VARIANTE
<222> (7) . . (7)
<223> /substituir = "Glu" /substituir = "Asn" /substituir = "Arg" /substituir = "Lys" /substituir = "Gin" /substituir = "Ala" /substituir "Ser"
<220>
<221> VARIANTE
<222> (8)..(8)
<223> /substituir = "Arg" /substituir = "Leu" /substituir = "Met" /substituir = "Thr" /substituir = "Asn" /substituir = "Gin"
<220>
<221> VARIANTE
<222> (10)..(10)
<223> /substituir = "Ile" /substituir = "Vai" /substituir = "Met"
<220>
<221> VARIANTE
<222> (11)..(11)
<223> /substituir = "Asp" /substituir = "Gin" /substituir = "Ile" /substituir = "Leu" /substituir = "Vai" /substituir = "Met" /substituir
"Thr" /substituir = "Ala" /substituir = "Arg" /substituir = "His"
<220>
<221> VARIANTE
<222> (12)..(12)
<223> /substituir = "Ser" /substituir = "Gly"
<220>
<221> VARIANTE
<222> (13)..(13)
<223> /substituir = "Ile" /substituir = "Met"
<220>
<221> VARIANTE
<222> (14)..(14)
<223> /substituir = "His" /substituir = "Ile" /substituir = "Lys" /substituir = "Arg" /substituir = "Ser" /substituir = "Asp" /substituir
"Glu" /substituir = "Asn"
<220>
<221> VARIANTE
<222> (15)..(15)
<223> /substituir = "Met" /substituir = "Lys" /substituir = "Arg" /substituir = "Gin" /substituir = "Vai" /substituir = "Thr"
<220>
<221> VARIANTE
<222> (16) . . (16) <223> /substituir = "Tyr" /substituir = "His" /substituir = "Vai /substituir = "Leu"
<220>
<221> VARIANTE
<222> (17)..(17)
<223> /substituir = "Gly"
<220>
<221> VARIANTE <222> (18)..(18)
<223> /substituir = "Lys" /substituir = "Glu"
<400> 141
Trp Thr Glu Gly Glu His Asp Lys Phe Leu Glu Ala Leu Gln Leu Phe 10 15
Asp Arg
<210> 142
<211> 19
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo 2
<220>
<221> VARIANTE
<222> (1) . . (1)
<223> /substituir = "His" /substituir = "Tyr" /substituir = "Cys /substituir = "Leu"
<220>
<221> VARIANTE
<222> (2)..(2)
<223> /substituir = "Ile"
<220>
<221> VARIANTE
<222> (3)..(3)
<223> /substituir = "Ala" /substituir = "Lys" /substituir = "Thr /substituir = "Vai" /substituir = "Ser" /substituir = "Arg"
<220>
<221> VARIANTE
<222> (4)..(4)
<223> /substituir = "Thr"
<220>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir = "Arg"
<220>
<221> VARIANTE
<222> (6)..(6)
<223> /substituir = "Asn" /substituir = "Ser" <220>
<221> VARIANTE
<222> (7)..(7)
<223> /substituir = "Thr" /svibstit.uir = "Ala" /substituir = "Pro" /substituir = "Ser"
<220>
<221> VARIANTE
<222> (8)..(8)
<223> /substituir = "Vai" /substituir = "Thr" /substituir = "Met" /substituir ="Arg" /substituir = "Glu" /substituir = "Ala"
<220>
<221> VARIANTE
<222> (10) . . (10)
<223> /substituir = "Vai"
<220>
<221> VARIANTE
<222> (11) . . (11)
<223> /substituir = "Ala" /substituir = "Ser"
<220>
<221> VARIANTE
<222> (12) . . (12)
<223> /substituir = "Met"
<220>
<221> VARIANTE
<222> (13)..(13)
<223> /substituir = "Tyr"
<220>
<221> VARIANTE
<222> (14)..(14)
<223> /substituir = "Tyr"
<220>
<221> VARIANTE
<222> (15)..(15)
<223> /substituir = "Asp"
<220>
<221> VARIANTE
<222> (16)..(16)
<223> /substituir = "Tyr" /substituir = "Asn"
<220>
<221> VARIANTE
<222> (17) . . (17)
<223> /substituir = "His" /substituir = "Phe"
<220>
<221> VARIANTE
<222> (18) . . (18)
<223> /substituir = "Lys" /substituir = "Cys"
<220>
<221> VARIANTE
<222> (19) . . (19)
<223> /substituir = "Thr" /substituir = "Ser" /substituir = "Ala" /substituir = "Ile" /substituir = "Arg" /substituir = "His" <400> 142
Phe Val Gly Ser Lys Thr Val Xle Gln Ile Arg Ser His Ala Gln Lys 10 15
Tyr Phe Leu
<210> 143
<211> 6
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo 3
<220>
<221> VARIANTE
<222> (3)..(3)
<223> /substituir = "Gin"
<220>
<221> VARIANTE
<222> (4)..(4)
<223> /substituir = "Tyr" /substituir = "Leu" <220>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir = "His"
<220>
<221> VARIANTE
<222> (6)..(6)
<223> /substituir = "Arg" /substituir = "Pro"
<400> 143
Pro Pro Pro Arg Pro Lys 1 5
<210> 144
<211> 11
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo 4
<220>
<221> VARIANTE
<222> (7)..(7)
<223> /substituir = "Thr"
<400> 144
Ala Thr Val Ala Ala Ala Ser Ala Trp Trp Ala 10
<210> 145
<211> 9
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo 5 <220>
<221> VARIANTE
<222> (5) . . (5)
<223> /substituir = "Ser"
<400> 145
Asp Arg Ser Ser Cys Gly Ser Asn Thr 1 5
<210> 146
<211> 2193
<212> DNA
<213> Oryza sativa
<400> 146
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caa tataggg aacgtgtgct 60 aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140 cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200 tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260 gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320 ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380 gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440 aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500 ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560 atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620 acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680 cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740 ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800 gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860 tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920 attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980 tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtateta 2040 cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100 agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160 tggtgtagct tgccactttc accagcaaag ttc 2193 <210> 147 <211> 56 <212> DNA <213> Seqüência Artificial <220> <223> iniciador: prm07263 <400> 147 ttgtacaaaa aagcaggctt aaacaatgga gacaaattcg tctgga 56 ggggacaagt <210> 148 <211> 53 <212> DNA <213> Seqüência Artificial <220> <223> iniciador: prm072 64 <400> 148 ttgtacaaga aagctgggtg aaaatagagt ctcatgtgga age 53 ggggaccact <210> 149
<211> 1496
<212> DNA
<213> Arabidopsis thaliana
<400> 149
atggccacaa cgatgacacg tgtctccgtc ggcgtcgtcc tctttgttct cttagtctcg 60 ctggttgccg tctccgccgc gagaagcggt cctgatgatg ttatcaaact cccttcgcag 120 gcttctcgct tcttccgtcc tgctgaaaac gacgacgatt ctaactccgg tactaggtgg 180 gctgttctag tcgccggatc tagcggatat tggaattaca ggcatcaggc tgatatatgc 240 catgcctatc aacttctgag gaaaggtgga ttgaaagagg agaatattgt ggtattcatg 300 tatgatgata ttgctaacaa ttacgagaat ccaaggcctg gaaccattat caacagccct 360 catggaaaag atgtctatca aggagttccc aaggattata ctggagatga tgtcaatgtt 420 gataatctat ttgctgtgat ccttggagac aaaactgctg ttaaaggggg aagtgggaag 480 gttgtggata gtggtcctaa tgatcatatc ttcatattct acagtgacca tggtggtcct 540 ggagttcttg ggatgccaac ttctccttac ctatatgcaa atgatctcaa tgatgtcttg 600 aagaagaaac atgctttagg aacatataaa agcttggtgt tttatctcga agcttgcgaa 660 tctggaagta tctttgaagg gcttcttcct gagggtttga acatctatgc cacaactgca 720 tcaaacgccg aagaaagcag ttggggtacc tattgccctg gagaggaacc cagtcctcca 780 ccggagtatg aaacttgttt aggtgacttg tacagtgttg cttggatgga agatagtggt 840 atgcacaatt tacagactga gactctgcac cagcaatatg aacttgtgaa aaggaggact 900 gcacctgttg ggtactctta tggttctcat gtcatgcaat atggcgatgt aggaattagc 960 aaggataatc tcgatcttta tatgggaaca aaccctgcca atgacaattt tacctttgcg 1020 gatgcgaatt cactaaagcc accttcaaga gttacaaacc agcgtgatgc agatcttgtt 1080 catttttggg aaaagtaccg aaaagcacca gaaggttcag caagaaaaac agaagctcag 1140 aagcaagtac ttgaagccat gtctcacaga cttcatattg acaatagcgt gatactcgtc 1200 ggaaaaatct tgtttggcat ttcgagaggt cctgaagtgc taaacaaagt acggtctgct 1260 gggcaacctc tagtcgatga ctggaactgc cttaaaaatc aggtgagagc tttcgagagg 1320 cactgtggat cgctgtctca gtacggtatc aagcacatga ggtcttttgc aaacatctgc 1380 aatgcaggga ttcaaatgga gcaaatggag gaggcagctt cacaggcttg taccacactg 1440 ccaactggtc cttggagctc gcttaaccgt ggattcagtg catagaaacc ctaaac 1496 <210> 150
<211> 494
<212> PRT
<213> Arabidopsis thaliana <400> 150
Met Ala Thr Thr Met Thr Arg Val Ser Val Gly Val Val Leu Phe Val 10 15
Leu Leu Val Ser Leu Val Ala Val Ser Ala Ala Arg Ser Gly Pro Asp 20 25 30
Asp Val Ile Lys Leu Pro Ser Gln Ala Ser Arg Phe Phe Arg Pro Ala 35 40 45
Glu Asn Asp Asp Asp Ser Asn Ser Gly Thr Arg Tirp Ala Val Leu Val 50 55 60
Ala Gly Ser Ser Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys 65 70 75 80
His Ala Tyr Gln Leu Leu Arg Lys Gly Gly Leu Lys Glu Glu Asn Ile 85 90 95
Val Val Phe Met Tyr Asp Asp Ile Ala Asn Asn Tyr Glu Asn Pro Arg 100 105 110
Pro Gly Thr Ile Ile Asn Ser Pro His Gly Lys Asp Val Tyr Gln Gly 115 120 125
Val Pro Lys Asp Tyr Thr Gly Asp Asp Val Asn Val Asp Asn Leu Phe 130 135 140
Ala Val Ile Leu Gly Asp Lys Thr Ala Val Lys Gly Gly Ser Gly Lys 145 150 155 160
Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Phe Tyr Ser Asp 165 170 175
His Gly Gly Pro Gly Val Leu Gly Met Pro Thr Ser Pro Tyr Leu Tyr 180 185 190
Ala Asn Asp Leu Asn Asp Val Leu Lys Lys Lys His Ala Leu Gly Thr 195 200 205
Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile 210 215 220
Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala 225 230 235 240 Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Glu 245 250 255
Pro Ser Pro Pro Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser 260 265 270
Val Ala Trp Met Glu Asp Ser Gly Met His Asn Leu Gln Thr Glu Thr 275 280 285
Leu His Gln Gln Tyr Glu Leu Val Lys Arg Arg Thr Ala Pro Val Gly 290 295 300
Tyr Ser Tyr Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Ile Ser 305 310 315 320
Lys Asp Asn Leu Asp Leu Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn 325 330 335
Phe Thr Phe Ala Asp Ala Asn Ser Leu Lys Pro Pro Ser Arg Val Thr 340 345 350
Asn Gln Arg Asp Ala Asp Leu Val His Phe Trp Glu Lys Tyr Arg Lys 355 360 365
Ala Pro Glu Gly Ser Ala Arg Lys Thr Glu Ala Gln Lys Gln Val Leu 370 375 380
Glu Ala Met Ser His Arg Leu His Ile Asp Asn Ser Val Ile Leu Val 385 390 395 400
Gly Lys Ile Leu Phe Gly Ile Ser Arg Gly Pro Glu Val Leu Asn Lys 405 410 415
Val Arg Ser Ala Gly Gln Pro Leu Val Asp Asp Trp Asn Cys Leu Lys 420 425 430
Asn Gln Val Arg Ala Phe Glu Arg His Cys Gly Ser Leu Ser Gln Tyr 435 440 445
Gly Ile Lys His Met Arg Ser Phe Ala Asn Ile Cys Asn Ala Gly Ile 450 455 460
Gln Met Glu Gln Met Glu Glu Ala Ala Ser Gln Ala Cys Thr Thr Leu 465 470 475 480
Pro Thr Gly Pro Trp Ser Ser Leu Asn Arg Gly Phe Ser Ala 485 490 <210> 151
<211> 1637
<212> DNA
<213> Triticum aestivum <220>
<221> misc_feature
<222> (14)..(14)
<223> η é a, c, g, or t
<400> 151
ggcggcagag cagnctgact gaagcagaga gcagcagttc accatggctc gcctttcctg 60 ctcacccctc ctcctcctcc tcttcttgtc gtcgcagctc gccctgctcg tcgccggcga 120 gttcctccgc ctgccgtccg agaaggacgt cgtcgggacg agatgggccg tcctcatcgc 180 cggctccaac ggctactaca actaccgcca ccaggcggac gtatgccacg cgtaccagat 240 catgaagaag ggcgggctga aggacgagaa catcatcgtc ttcatgtacg acgacatcgc 300 cggcaaccgc gacaacccca ggcctggggt catcatcaac caccccaaag gcggcgacgt 360 ctacgccgga gtccccaagg actacacggg ggcagacgtc aacgccaaca acttcctcgc 420 cgcgctgctc ggcgacaagt ccaagctcac cggcagcggc agcggcaagg tcgtcagcag 480 cggcccggac gaccacatct tcgtctatta cgcegatcac ggtggcccag ggatccttgg 540 gatgccgggc gacgaggagt acctgtacgc gaacgacctg gtgcggacgc tggagaagaa 600 gcacgccggc ggggccgggt ataagagcct ggtcttctac ctggagggcc tgcgagtccg 660 ggagcatctt cgagggcctc ctcccgggca acatcagcgt gtacgccacc acggcggcca 720 acgcggagga gagcagctgg ggcacctact gccccggcga cgacgagggc gccccgccgc 780 cggagtacga cacctgcctc ggcgacctct acagcgtcgc ctggatggag gacagcgacg 840 cgcacaacct caacgccgag tcccttaagc tgcagtacga gcgggtcagg gaccggacgt 900 cggcgggcgg cacgtacagc ctcggctccc acgtcatgca gtacggcgac ctgggcctca 960 acgaccagag cctcttcgtc tacatcggca ccaaccctgc caacgacaac gcctccttcg 1020 tccagggctc ctcctcgacc tccaggcagc tgccgggcgg cggagtgaac cagcgggacg 1080 ccgacctcgt ccacttctgg cacaagtacc ggagtcggcg gaggggtcgg ccgagaaagg 1140 cgaggcgcgg aggcggctgg tggagacgat ggcgcggcgg tctcgcgtgg acagcagcgt 1200 ggagctcatc ggcggcctcc tcttcggctc agaggaaggt gccaaggtcc tcggcgccgt 1260 gcggccggcg gggcagcctg tggtggatga ctgggactgc ctcaagtctg tggtgcggac 1320 gttccagcag cggtgcgggc cgctgacgca gtacgggatg aagcacatgc gctcgctcgc 1380 caacctctgc aacgccggcg tccgggagga ggccatggac aaggctgcgg ctcaggcgtg 1440 cgctgctaat ccttcctcct tgttctgatc aaactgtgtg atcgatccat gtcgcatcgg 1500 tcacctaaaa tatggtgtga tggatcgatc tatacggtcg tgattgctgt aaatactaat acatgctgca cagcaagtac gtgattgctg taaatactat gtgctattat ttgctataca aagaaaatag ctctctc
<210> 152
<211> 474
<212> PRT
<213> Triticiam aestivum
<220>
<221> INCERTO <222> (275)..(275)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 152
Met Ala Arg Leu Ser Cys Ser Pro Leu Leu Leu Leu Leu Phe Leu Ser 10 15
Ser Gln Leu Ala Leu Leu Val Ala Gly Glu Phe Leu Arg Leu Pro Ser 20 25 30
Glu Lys Asp Val Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser 35 40 45
Asn Gly Tyr Tyr Asn Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr 50 55 60
Gln Ile Met Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile Val Phe 65 70 75 80
Met Tyr Asp Asp Ile Ala Gly Asn Arg Asp Asn Pro Arg Pro Gly Val 85 90 95
Ile Ile Asn His Pro Lys Gly Gly Asp Val Tyr Ala Gly Val Pro Lys 100 105 110
Asp Tyr Thr Gly Ala Asp Val Asn Ala Asn Asn Phe Leu Ala Ala Leu 115 120 125
Leu Gly Asp Lys Ser Lys Leu Thr Gly Ser Gly Ser Gly Lys Val Val 130 135 140
Ser Ser Gly Pro Asp Asp His Ile Phe Val Tyr Tyr Ala Asp His Gly 145 150 155 160
1560
1620
1637
Gly Pro Gly Ile Leu Gly Met Pro Gly Asp Glu Glu Tyr Leu Tyr Ala 165 170 175 Asn Asp Leu Val Arg Thr Leu Glu Lys Lys His Ala Gly Gly Ala Gly 180 185 190
Tyr Lys Ser Leu Val Phe Tyr Leu Glu Gly Leu Arg Val Arg Glu His 195 200 205
Leu Arg Gly Pro Pro Pro Gly Gln His Gln Arg Val Arg His His Gly 210 215 220
Gly Gln Arg Gly Gly Glu Gln Leu Gly His Leu Leu Pro Arg Arg Arg 225 230 235 240
Arg Gly Arg Pro Ala Ala Gly Val Arg His Leu Pro Arg Arg Pro Leu 245 250 255
Gln Arg Arg Leu Asp Gly Gly Gln Arg Arg Ala Gln Pro Gln Arg Arg 260 265 270
Val Pro Xaa Ala Ala Val Arg Ala Gly Gln Gly Pro Asp Val Gly Gly 275 280 285
Arg His Val Gln Pro Arg Leu Pro Arg His Ala Val Arg Arg Pro Gly 290 295 300
Pro Gln Arg Pro Glu Pro Leu Arg Leu His Arg His Gln Pro Cys Gln 305 310 315 320
Arg Gln Arg Leu Leu Arg Pro Gly Leu Leu Leu Asp Leu Gln Ala Ala 325 330 335
Ala Gly Arg Arg Ser Glu Pro Ala Gly Arg Arg Pro Arg Pro Leu Leu 340 345 350
Ala Gln Val Pro Glu Ser Ala Glu Gly Ser Ala Glu Lys Gly Glu Ala 355 360 365
Arg Arg Arg Leu Val Glu Thr Met Ala Arg Arg Ser Arg Val Asp Ser 370 375 380
Ser Val Glu Leu Ile Gly Gly Leu Leu Phe Gly Ser Glu Glu Gly Ala 385 390 395 400
Lys Val Leu Gly Ala Val Arg Pro Ala Gly Gln Pro Val Val Asp Asp 405 410 415
Trp Asp Cys Leu Lys Ser Val Val Arg Thr Phe Gln Gln Arg Cys Gly 420 425 430 Pro Leu Thr Gln Tyr Gly Met Lys His Met Arg Ser Leu Ala Asn Leu 435 440 445
Cys Asn Ala Gly Val Arg Glu Glu Ala Met Asp Lys Ala Ala Ala Gln 450 455 460
Ala Cys Ala Ala Asn Pro Ser Ser Leu Phe 465 470
<210> 153
<211> 1723
<212> DNA
<213> Triticum aestivum
<400> 153
ggcgcctact ttaccccgca ccccgcgccg ctcttctcgc ccgtacgttc cggctccccc 60 gcgcggtgct cttagacagt agtgctactg cgacctcacc tgcgcagacg gatggcgccg 120 cggtggtgct tcgcgttgct cctgctgctg tgtgcggcgg ccggggctga cgcctcgaag 180 gggaagtggg acccggtgat ccggatgccg ggggaggagg agcccgccac gggcgacgag 240 agctccgaga agggggagga cggcgtcggg acgaggtggg cggtgctcgt cgccggatcc 300 tccggctacg gaaactacag gcaccaggcc gatatatgcc atgcctacca gatattgaga 360 aaagggggcg taaaagagga gaacatcgtg gtttttatgt atgatgacat tgccaacaac 420 cctctcaacc cgaggccagg ggttatcatc aaccacccag agggcgaaga tgtatatgct 480 ggcgttccaa aggactacac cggagaggca gttactgcta agaacttcta tgcagttctc 540 ttgggcaaca aaactgcggt cactggaggg agtaagaagg tcatagatag caaaccaaat 600 gaccatatat ttatctacta ctcagatcac gggggtcccg gagtccttgg tatgcccaac 660 ctgccatatc tctatgctgc tgattttatc aaggtcttac aagaaaaaca tgcatccaat 720 acctatgcaa aaatggttat atatgtggaa gcttgtgaaa gtggcagtat ttttgagggt 780 ttgatgcctg cagacctcaa tatttatgtc acaacagcat ctaatgcaga agaaagcagc 840 tggggtacat actgcccagg aatggaacca tcgcctcctt ctgagtatat tacctgctta 900 ggtgatctct acagtatttc ttggatggaa gacagtgaga ctaataatct gaaggaggag 960 acaatcaaga agcagtatga agtggtaaag aagcgaacct cagacatgaa cagctatagt 1020 gccggttctc atgttatgga gtatggcgac aagaccttca aggatgagaa gctttacctt 1080 tatcaaggtt tcaatcctgc aaacaccaac attacaaaca agctattttt gcaagcccaa 1140 aggctgcaat caaccaaaga gacgcagatc ttcttttctt gtggaggagg tatgagctgc 1200 tacatgaaaa gtcgaaagag aagacgaacg ttctgaggga gatcagtgag acagtcaccc 1260 acaggaagca tcttgacagc agcatcgatt ttattgggaa gcttctattt ggcttcgaga 1320 atggaccttc ggtgcttcaa gctgtcagac cttctgggaa gcctctagtg gacgactggg 1380 attgcctgaa gaggatggtg cggatctttg agtctcattg cggatcgctc actcagtacg 1440 gtatgaagca catgcgagca tttgcaaata tatgcaacaa tggtgtttct ggcacgacga 1500 tgaaggaagc aagcatcaat acctgcggcg gtcacaactc ggcaagattg agcaccttga 1560 tccaagggta cagcgcttga tcgatcagtc tgctgaggta catactagta tgttccttgt 1620 cctcagctta cgcgaatgtg aatatgtagt attgtattgt attgtactgt tagtgtatcc 1680 tgaaaataac cttggggccg gctatataag aatgtgccta tgt 1723 <210> 154 <211> 374 <212> PRT
<213> Triticum aestivum <400> 154
Met Ala Pro Arg Trp Cys Phe Ala Leu Leu Leu Leu Leu Cys Ala Ala 10 15
Ala Gly Ala Asp Ala Ser Lys Gly Lys Trp Asp Pro Val Ile Arg Met 20 25 30
Pro Gly Glu Glu Glu Pro Ala Thr Gly Asp Glu Ser Ser Glu Lys Gly 35 40 45
Glu Asp Gly Val Gly Thr Arg Trp Ala Val Leu Val Ala Gly Ser Ser 50 55 60
Gly Tyr Gly Asn Tyr Arg His Gln Ala Asp Ile Cys His Ala Tyr Gln 65 70 75 80
Ile Leu Arg Lys Gly Gly Val Lys Glu Glu Asn Ile Val Val Phe Met 85 90 95
Tyr Asp Asp Ile Ala Asn Asn Pro Leu Asn Pro Arg Pro Gly Val Ile 100 105 110
Ile Asn His Pro Glu Gly Glu Asp Val Tyr Ala Gly Val Pro Lys Asp 115 120 125
Tyr Thr Gly Glu Ala Val Thr Ala Lys Asn Phe Tyr Ala Val Leu Leu 130 135 140
Gly Asn Lys Thr Ala Val Thr Gly Gly Ser Lys Lys Val Ile Asp Ser 145 150 155 160 Lys Pro Asn Asp His Xle Phe Ile Tyr Tyr Ser Asp His Gly Gly Pro 165 170 175
Gly Val Leu Gly Met Pro Asn Leu Pro Tyr Leu Tyr Ala Ala Asp Phe 180 185 190
Ile Lys Val Leu Gln Glu Lys His Ala Ser Asn Thr Tyr Ala Lys Met 195 200 205
Val Ile Tyr Val Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu 210 215 220
Met Pro Ala Asp Leu Asn Ile Tyr Val Thr Thr Ala Ser Asn Ala Glu 225 230 235 240
Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Met Glu Pro Ser Pro Pro 245 250 255
Ser Glu Tyr Ile Thr Cys Leu Gly Asp Leu Tyr Ser Ile Ser Trp Met 260 265 270
Glu Asp Ser Glu Thr Asn Asn Leu Lys Glu Glu Thr Ile Lys Lys Gln 275 280 285
Tyr Glu Val Val Lys Lys Arg Thr Ser Asp Met Asn Ser Tyr Ser Ala 290 295 300
Gly Ser His Val Met Glu Tyr Gly Asp Lys Thr Phe Lys Asp Glu Lys 305 310 315 320
Leu Tyr Leu Tyr Gln Gly Phe Asn Pro Ala Asn Thr Asn Ile Thr Asn 325 330 335
Lys Leu Phe Leu Gln Ala Gln Arg Leu Gln Ser Thr Lys Glu Thr Gln 340 345 350
Ile Phe Phe Ser Cys Gly Gly Gly Met Ser Cys Tyr Met Lys Ser Arg 355 360 365
Lys Arg Arg Arg Thr Phe 370
<210> 155 <211> 1847 <212> DNA
<213> Triticum aestivum <400> 155
acgcgtccgt taaacccctc cttcctcctc cccctcgctt cttcgcggaa tccaaacccc 60 aaacaccagc catggcgatg gcgtccttcc gcccccttcc cctcgctctc ctgctcgccg 120 cgtgcctctc ggcgctcgtg ctggccgtgg cgcacgcgcg gaccctacgg ctggagccca 180 ccatccggct gccgtcgcag cgcgccgccg ggcaggagga cgatgactcc gtcgggacca 240 ggtgggccgt cctcatcgcc ggctccaacg gctactacaa ctaccgccac caggcggata 300 tctgccacgc ctaccagatc atgaagaagg gtggtctcaa ggatgagaac atcatcgtat 360 tcatgtacga cgacattgcg cacaacccgg agaacccgag gccgggcgtc atcatcaacc 420 acccccaggg tggagatgtc tatgctgggg tccctaagga ctacactgga aaggaggtta 480 atgtcaagaa cttctttgct gtcctgctcg gtaataaaac cgctgtgagt ggtgggagcg 540 gcaaagtcgt ggacagtggc cctaatgatc acatttttgt gttttacagt gaccatgggg 600 gtcctggggt ccttgggatg cctacctatc cataccttta cggtgacgat cttgtagatg 660 tcctgaagaa aaagcacgct gctggaacct acaaaagcct ggtattttac cttgaagcct 720 gcgaatctgg gagcatcttt gagggacttc tgccgaatga catcggtgtc tatgcgacca 780 ccgcatcgaa cgcagaggaa agcagttggg gaacgtattg ccccggcgag taccccagcc 840 ctccgccgga atatgacact tgcttgggcg acctgtacag catttcttgg atggaagaca 900 gtgatgtcca caacctgaga actgaatctc tcaagcagca atatgacttg gtcaagaaga 960 gaacagcagc tcaggactca tacagctatg gttcccatgt gatgcaatac ggttctttgg 1020 acctgaatgc tcaacaattc tttttgtaca tcggctcaaa tcctgctaac aataacacta 1080 catttgttga agataactca ctgccgtcct tctcaagagc tgttaatcag agggatgctg 1140 atcttgttta cttctggcag aagtaccgga aattggctga gagctcccct gagaaaaacg 1200 atgctcggaa gcaattgctt gaaatgatgg gtcatagatc tcatattgac aacagcgtcg 1260 agctgattgg aaaccttctg tttggttctg cggatggtcc gatggttcta aagactgttc 1320 gcccagctgg tgagcctctt gttgatgact ggagttgtct caagtctacg gtgcgtactt 1380 ttgaatcaca atgtggctcg ctggcgcagt atggaatgaa gcacatgcgg tcctttgcaa 1440 acatctgcaa tgccggcatt gttcctgaag cgatggcaaa ggttgctgct caggcgtgca 1500 cgagcatccc aaccaacccc tggagtgcca cacacaaggg ttttagtgct taaaccagag 1560 gtgaagcaac ttggtcccta tctcagctat tgtaccatat accaaagtcc cttcctattc 1620 acacagggtt agtagtgctt gaaccaacga accttagatg aataagaatt atgccattat 1680 ttcagctatt ccaccacacc aaattacctt ggctgtgtcc aacttataat gtacatatac 1740 ccgtagtaga aaggtgattt cctgtgattg ctgtacatac tcgtgatagt tcgtgatcag 1800 atgtgtagct ctcaattcca tatacgaatg caatcactgc tatttgt 1847 <210> 156 <211> 493 <212> PRT
<213> Triticum aestivum
<400> 156
Met Ala Met Ala Ser Phe Arg Pro Leu Pro Leu Ala Leu Leu Leu Ala 10 15
Ala Cys Leu Ser Ala Leu Val Leu Ala Val Ala His Ala Arg Thr Leu 20 25 30
Arg Leu Glu Pro Thr Ile Arg Leu Pro Ser Gln Arg Ala Ala Gly Gln 35 40 45
Glu Asp Asp Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly 50 55 60
Ser Asn Gly Tyr Tyr Asn Tyr Arg His Gln Ala Asp Ile Cys His Ala 65 70 75 80
Tyr Gln Ile Met Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile Val 85 90 95
Phe Met Tyr Asp Asp Ile Ala His Asn Pro Glu Asn Pro Arg Pro Gly 100 105 110
Val Ile Ile Asn His Pro Gln Gly Gly Asp Val Tyr Ala Gly Val Pro 115 120 125
Lys Asp Tyr Thr Gly Lys Glu Val Asn Val Lys Asn Phe Phe Ala Val 130 135 140
Leu Leu Gly Asn Lys Thr Ala Val Ser Gly Gly Ser Gly Lys Val Val 145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Val Phe Tyr Ser Asp His Gly 165 170 175
Gly Pro Gly Val Leu Gly Met Pro Thr Tyr Pro Tyr Leu Tyr Gly Asp 180 185 190
Asp Leu Val Asp Val Leu Lys Lys Lys His Ala Ala Gly Thr Tyr Lys 195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu 210 215 220
Gly Leu Leu Pro Asn Asp Ile Gly Val Tyr Ala Thr Thr Ala Ser Asn 225 230 235 240
Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser 245 250 255
Pro Pro Pro Glu Tyr Asp Thr Cys Leu Gly Asp Leu Tyr Ser Ile Ser 260 265 270
Trp Met Glu Asp Ser Asp Val His Asn Leu Arg Thr Glu Ser Leu Lys 275 280 285
Gln Gln Tyr Asp Leu Val Lys Lys Arg Thr Ala Ala Gln Asp Ser Tyr 290 295 300
Ser Tyr Gly Ser His Val Met Gln Tyr Gly Ser Leu Asp Leu Asn Ala 305 310 315 320
Gln Gln Phe Phe Leu Tyr Ile Gly Ser Asn Pro Ala Asn Asn Asn Thr 325 330 335
Thr Phe Val Glu Asp Asn Ser Leu Pro Ser Phe Ser Arg Ala Val Asn 340 345 350
Gln Arg Asp Ala Asp Leu Val Tyr Phe Trp Gln Lys Tyr Arg Lys Leu 355 360 365
Ala Glu Ser Ser Pro Glu Lys Asn Asp Ala Arg Lys Gln Leu Leu Glu 370 375 380
Met Met Gly His Arg Ser His Ile Asp Asn Ser Val Glu Leu Ile Gly 385 390 395 400
Asn Leu Leu Phe Gly Ser Ala Asp Gly Pro Met Val Leu Lys Thr Val 405 410 415
Arg Pro Ala Gly Glu Pro Leu Val Asp Asp Trp Ser Cys Leu Lys Ser 420 425 430
Thr Val Arg Thr Phe Glu Ser Gln Cys Gly Ser Leu Ala Gln Tyr Gly 435 440 445
Met Lys His Met Arg Ser Phe Ala Asn Ile Cys Asn Ala Gly Ile Val 450 455 460
Pro Glu Ala Met Ala Lys Val Ala Ala Gln Ala Cys Thr Ser Ile Pro 465 470 475 480 Thr Asn Pro Trp Ser Ala Thr His Lys Gly Phe Ser Ala 485 490
<210> 157 <211> 1790 <212> DNA
<213> Triticum aestivum <400> 157
ctacgaatat gaggcgctgc gcctgccgtc cgcggagcag aactgccagg cgatcgacga 60 tcacacttta cctcctgcgc gcactgcacg ccgacgcgag tataaaatgc gggcccagcc 120 cccgccggaa cgatcacact tcactctctg ccttctcttc ctttctaggc tctagcacac 180 gcacatgatg aactcgaggg tggcgatggc tgcgtggtgg gtttgtggac tcctcccgct 240 Gctggcggag gcggccaagg ggaactcgga gccgctgatc cggctgccga cggagaatgg 300 gcatgcccct gcccctgcgc ctggccctgc cgcgtcggcg gcggaggaag aggtgacgaa 360 gtgggccgtg ctcgttgccg gctcctccgg ctacgagaac taccggcacc aggccgatgt 420 gtgccacgcg taccagatcc tgaagaaggg gggactcaag gatgagaaca ttgtggtgtt 480 tatgtacgat gacatcgcca acagccctga caacccaagg cgtggagccg tcatcaacca 540 tcctaaaggc aaagatgttt accatggtgt tcccaaggac tacaccggtg accaggtcac 600 tgctaagaac ttgtatgcgg ttctcctggg gaacaaaacc gcggttaccg gagggagtag 660 gaaggtgata aacagcaaac cgaaggatca catcttcatc tactacacgg atcatggggg 720 tcctggttca cttggtatgc ccaacgggcc atatgtttat gctggcgact tcatcaaagt 780 gttacggcaa aagcatgctt ccaaaagcta ttcgaaaatg gtcatatatg ttgaagcgtg 840 tgaaagtggc agcatctttg agggtttgat gccacaagat cacaatattt atgttacagc 900 ggcatcaaat gcggtagaaa gtagctgggc agcatactgc cctgatgatg gaacgccacc 960 tcctcctgaa tattttacct gtttaggtga cttatacagt gtttcttgga tggaagacag 1020 tgaaactcaa aatctaaaga acgaaaccat caagcagcag tacgaggtgg ttaaagcgag 1080 aacggcaccc cgaaatgagt ccattagagg ttctcatgtc atggagtatg gcgacaagac 1140 tttcaaggag gacatgcttt tcctctacca aggtttcgat ccggcgaagt caagcatcag 1200 aaacaggccg ctgcctatgc ccagcctcaa gggtgcaatc aagcaaagag atgccgatat 1260 tctcttcatg tggaagaagt atgggaagtt gaatggggga tcagaagaga agcagagggc 1320 cctcagggag gtcaaagaaa ccgtgctgca caggaagcat ctggacagca gtatcgattt 1380 catcgggaag cttgtctttg ggttcgacaa ggggcctttg gtgctcgagg ctgctagagg 1440 ctctggccag ccattggtcg acgattggga ttgtctgaag acgatggtgc gagtgttcga 1500 gtcGcagtgc ggatcactca ctcagtacgg catgaaacac acgagggcgt tcgcaaacat 1560 gtgcaacaat ggcgtctccg aggccgagat gaaggaggcg agcatcagcg cttgcgacgg 1620 ctacgacatg gggaggtgga gcccgttggt tcgaggctac agcgcctgat ccgcttgcag tgcagtacta ctacatggca gcagcagcag ccagagctcc ggagttccta gctagacctc gtatggtgta catacacaca ttggtatacc gtatacatac aagaaagaag
<210> 158 <211> 494 <212> PRT
<213> Triticum aestivum <400> 158
Met Met Asn Ser Arg Val Ala Met Ala Ala Trp Trp Val Cys Gly Leu 10 15
Leu Pro Leu Leu Ala Glu Ala Ala Lys Gly Asn Ser Glu Pro Leu Ile 20 25 30
Arg Leu Pro Thr Glu Asn Gly His Ala Pro Ala Pro Ala Pro Gly Pro 35 40 45
Ala Ala Ser Ala Ala Glu Glu Glu Val Thr Lys Trp Ala Val Leu Val 50 55 60
Ala Gly Ser Ser Gly Tyr Glu Asn Tyr Arg His Gln Ala Asp Val Cys 65 70 75 80
His Ala Tyr Gln Ile Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile 85 90 95
Val Val Phe Met Tyr Asp Asp Ile Ala Asn Ser Pro Asp Asn Pro Arg 100 105 110
Arg Gly Ala Val Ile Asn His Pro Lys Gly Lys Asp Val Tyr His Gly 115 120 125
Val Pro Lys Asp Tyr Thr Gly Asp Gln Val Thr Ala Lys Asn Leu Tyr 130 135 140
Ala Val Leu Leu Gly Asn Lys Thr Ala Val Thr Gly Gly Ser Arg Lys 145 150 155 160
Val Ile Asn Ser Lys Pro Lys Asp His Ile Phe Ile Tyr Tyr Thr Asp 165 170 175
1680
1740
1790
His Gly Gly Pro Gly Ser Leu Gly Met Pro Asn Gly Pro Tyr Val Tyr 180 185 190 Ala Gly Asp Phe Ile Lys Val Leu Arg Gln Lys His Ala Ser Lys Ser 195 200 205
Tyr Ser Lys Met Val Ile Tyr Val Glu Ala Cys Glu Ser Gly Ser Ile 210 215 220
Phe Glu Gly Leu Met Pro Gln Asp His Asn Ile Tyr Val Thr Ala Ala 225 230 235 240
Ser Asn Ala Val Glu Ser Ser Trp Ala Ala Tyr Cys Pro Asp Asp Gly 245 250 255
Thr Pro Pro Pro Pro Glu Tyr Phe Thr Cys Leu Gly Asp Leu Tyr Ser 260 265 270
Val Ser Trp Met Glu Asp Ser Glu Thr Gln Asn Leu Lys Asn Glu Thr 275 280 285
Ile Lys Gln Gln Tyr Glu Val Val Lys Ala Arg Thr Ala Pro Arg Asn 290 295 300
Glu Ser Ile Arg Gly Ser His Val Met Glu Tyr Gly Asp Lys Thr Phe 305 310 315 320
Lys Glu Asp Met Leu Phe Leu Tyr Gln Gly Phe Asp Pro Ala Lys Ser 325 330 335
Ser Ile Arg Asn Arg Pro Leu Pro Met Pro Ser Leu Lys Gly Ala Ile 340 345 350
Lys Gln Arg Asp Ala Asp Ile Leu Phe Met Trp Lys Lys Tyr Gly Lys 355 360 365
Leu Asn Gly Gly Ser Glu Glu Lys Gln Arg Ala Leu Arg Glu Val Lys 370 375 380
Glu Thr Val Leu His Arg Lys His Leu Asp Ser Ser Ile Asp Phe Ile 385 390 395 400
Gly Lys Leu Val Phe Gly Phe Asp Lys Gly Pro Leu Val Leu Glu Ala 405 410 415
Ala Arg Gly Ser Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys 420 425 430
Thr Met Val Arg Val Phe Glu Ser Gln Cys Gly Ser Leu Thr Gln Tyr 435 440 445 Gly Met Lys His Thr Arg Ala Phe Ala Asn Met Cys Asn Asn Gly Val 450 455 460
Ser Glu Ala Glu Met Lys Glu Ala Ser Ile Ser Ala Cys Asp Gly Tyr 465 470 475 480
Asp Met Gly Arg Trp Ser Pro Leu Val Arg Gly Tyr Ser Ala 485 490
<210> 159 <211> 1897 <212> DNA
<213> Hordeum vulgare <400> 159
gaattaaacc ccttcctcct cccaattcgc gtcttcacgg aatccaaacc ccaaacacca 60 tccatggcga tggcgtcctt ccgcctcctt cctctcgcgc tcctgctctc cgtggcgcac 120 gcgcggaccc cacggcttga gcccacoatc cggctgccgt cgcagcgcgc cgccgggcag 180 gaggacgatg actccgtcgg gaccaggtgg gccgtcctca tcgccggctc caacggctac 240 tacaactacc gccaccaggc cgatatctgc cacgcctacc agatcatgaa gaagggtggt 300 ctcaaggatg aaaacatcat cgttttcatg tacgacgaca ttgcgcgcaa cccagagaac 360 ccaaggccgg gcgtcatcat caaccacccc cagggtggag atgtctatgc tggggtccct 420 aaggactaca ctgggaagga ggttaatgtc aagaacttct ttgctgtcct gctcggtaat 480 aaaactgctg tgaatggtgg gagcggcaaa gtcgtggaca gtggccctaa tgatcacatt 540 tttgtgtttt acagtgacca tgggggtcct ggggtccttg ggatgcctac ctacccatac 600 ctttatggtg acgatcttgt agatgtcctg aagaaaaagc atgctgctgg aacctacaaa 660 agcctggtct tttaccttga agcctgtgaa tctgggagca tctttgaggg gcttctgccg 720 aatgatatcg gtgtctacgc gaccaccgca tcaaacgcag aggagagcag ttggggagcg 780 tattgccctg gcgagtaccc gagccctccg ccggaatatg acacttgctt gggcgaccta 840 tacagcattt cttggatgga agacagtgat gtccacaacc tgaggactga atctctcaag 900 cagcagtata acctggtcaa gaagagaacg gcagctcagg actcatacag ctatggttcc 960 catgtgatgc aatacggttc tttggacctc aatgctgaac atttgttctc gtacattggg 1020 tcaaatcctg ctaacgagaa cactacattt gttgaagata atgcattgcc gtcgttatca 1080 agagctgtta atcagaggga tgctgatctt gtttatttct ggcagaagta ccggaaattg 1140 gctgagagct cccctgcgaa aaacaatgct cgtaagcaat tgctcgaaat gatgggtcat 1200 agatctcata ttgacagcag cgttgagctg attggaaacc ttctgtttgg ttctgcgggt 1260 ggtccaatgg ttctaaagac tgttcgccca gctggtgagc ctcttgtgga tgactggagt 1320 tgtctcaagt ctacggtgcg tacttttgaa tcccaatgtg gctcgttggc gcagtatgga 1380 atgaagcaca tgcggtcctt tgcaaacatg tgtaatgccg gcattgttcc tgaagcgatg 1440 gcaaaggttg ctgctcaggc gtgcacgagc ttcccaacca acccgtggag tgccacacac 1500 aagggtttta gtgcttaaac cagaggtgaa gaagcaacgt aatcactatc tcagctattg 1560 taccatatac caaagtccct tcctattcac acagggttag tagtgcttga acgagcctta 1620 ggtgaataag aattatgcta ttatttcggc tattccatca tactccctct gttcctaaat 1680 acttgttgtt ggggagaact ctccccggca acaaatatta tggtacagag ggagtagtac 1740 caaattatac acttataatg tacatatacc gtggtagaaa ggtggtttcc tgtgattgct 1800 gtacagactc atgatagttt gtgatgaaat gtgtagctcg caattccata tatgaagaat 1860 gaatgcattc gctgctaaaa aaaaaaaaaa aaaaaaa 1897 <210> 160 <211> 484 <212> PRT
<213> Hordeum vulgare <400> 160
Met Ala Met Ala Ser Phe Arg Leu Leu Pro Leu Ala Leu Leu Leu Ser 10 15
Val Ala His Ala Arg Thr Pro Arg Leu Glu Pro Thr Ile Arg Leu Pro 20 25 30
Ser Gln Arg Ala Ala Gly Gln Glu Asp Asp Asp Ser Val Gly Thr Arg 35 40 45
Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Tyr Asn Tyr Arg His 50 55 60
Gln Ala Asp Ile Cys His Ala Tyr Gln Ile Met Lys Lys Gly Gly Leu 65 70 75 80
Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Arg Asn 85 90 95
Pro Glu Asn Pro Arg Pro Gly Val Ile Ile Asn His Pro Gln Gly Gly 100 105 110
Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Lys Glu Val Asn 115 120 125
Val Lys Asn Phe Phe Ala Val Leu Leu Gly Asn Lys Thr Ala Val Asn 130 135 140 Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp His Ile Phe 145 150 155 160
Val Phe Tyr Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Thr 165 170 175
Tyr Pro Tyr Leu Tyr Gly Asp Asp Leu Val Asp Val Leu Lys Lys Lys 180 185 190
His Ala Ala Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys 195 200 205
Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Asn Asp Ile Gly Val 210 215 220
Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly Ala Tyr 225 230 235 240
Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu Tyr Asp Thr Cys Leu 245 250 255
Gly Asp Leu Tyr Ser Ile Ser Trp Met Glu Asp Ser Asp Val His Asn 260 265 270
Leu Arg Thr Glu Ser Leu Lys Gln Gln Tyr Asn Leu Val Lys Lys Arg 275 280 285
Thr Ala Ala Gln Asp Ser Tyr Ser Tyr Gly Ser His Val Met Gln Tyr 290 295 300
Gly Ser Leu Asp Leu Asn Ala Glu His Leu Phe Ser Tyr Ile Gly Ser 305 310 315 320
Asn Pro Ala Asn Glu Asn Thr Thr Phe Val Glu Asp Asn Ala Leu Pro 325 330 335
Ser Leu Ser Arg Ala Val Asn Gln Arg Asp Ala Asp Leu Val Tyr Phe 340 345 350
Trp Gln Lys Tyr Arg Lys Leu Ala Glu Ser Ser Pro Ala Lys Asn Asn 355 360 365
Ala Arg Lys Gln Leu Leu Glu Met Met Gly His Arg Ser His Ile Asp 370 375 380
Ser Ser Val Glu Leu Ile Gly Asn Leu Leu Phe Gly Ser Ala Gly Gly 385 390 395 400 Pro Met Val Leu Lys Thr Val Axg Pro Ala Gly Glu Pro Leu Val Asp 405 410 415
Asp Trp Ser Cys Leu Lys Ser Thr Val Arg Thr Phe Glu Ser Gln Cys 420 425 430
Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg Ser Phe Ala Asn 435 440 445
Met Cys Asn Ala Gly Ile Val Pro Glu Ala Met Ala Lys Val Ala Ala 450 455 460
Gln Ala Cys Thr Ser Phe Pro Thr Asn Pro Trp Ser Ala Thr His Lys 465 470 475 480
Gly Phe Ser Ala
<210> 161
<211> 1853
<212> DNA
<213> Glycine max
<400> 161
gggtaggaga tactctcatt cacctcccat catcattata atcattcatt ccaacctacc 60 cttattcttc ttcttcaatt tcacacccat catggaccgt tttccgatcc tctttctcgt 120 cgccaccctc atcaccctcg cctccggtgc ccgccacgat attctccggt taccctccga 180 agcttccagg ttcttcaaag cacctgctaa tgccgatcaa aacgatgagg gcaccaggtg 240 ggccgtttta gttgccggtt ccaatggcta ctggaattac aggcaccagt ctgatgtttg 300 ccatgcatat caactactga ggaaaggtgg tg tgaaagag gaaaatattg ttgtatttat 360 gtatgatgac attgctttca atgaagagaa cccgcgacct ggagtcatta ttaacagtcc 420 acatggaaat gatgtttaca agggagttcc taaggattac gttggtgaag atgttactgt 480 tgacaacttt tttgctgcta tacttggaaa taagtcagct cttactggtg gcagtgggaa 540 ggttgtggat agtggcccca atgatcatat atttatatac tactctgatc atggcggtcc 600 gggagtgcta gggatgccta ctaatccata catgtatgca tccgatctga ttgaagtctt 660 gaagaagaag catgcttctg gaacttataa aagcctagta ttttatctag aggcatgtga 720 atctgggagt atctttgaag gtcttcttcc agaaggtctg aatatctatg caacaacagc 780 ttcaaatgca gaagaaagca gttggggaac atattgtcct ggggagtatc ctagtcctcc 840 ctctgaatat gaaacctgcc tgggtgacct gtacagtgtt gcttggatgg aagacagtga 900 catacacaat ttgcaaacag aaactttaca tcaacaatac gaattggtca aacaaaggac 960 tatgaatgga aattcaattt atggttccca cgtgatgcag tatggtgaca tagggcttag 1020 cgagaacaat ctcgtcttat atttgggtac aaatcctgct aatgataatt ttacttttgt 1080 gcttaaaaac tcattggtgc caccttcaaa agcagtcaac caacgtgatg cagatctcat 1140 ccatttttgg gataagttcc gcaaagctcc tgtgggttct tctaggaaag ctgcagctga 1200 gaaacaaatt cttgaagcaa tgtctcacag aatgcatata gatgacagca tgaaacttat 1260 tggaaagctc ttctttggca ttgaaaaggg tccagaactg cttagcagtg ttagacctgc 1320 tgggcaacca cttgttgatg actgggactg ccttaaaaca ctggttagga cttttgagac 1380 acattgtgga tctctgtctc agtatgggat gaaacatatg aggtcctttg caaacttctg 1440 caacgctgga atacggaaag agcaaatggc tgaggcctcg gcacaagcat gtgtcagtat 1500 ccctgcaagt tcctggagtt ctctgcacag gggtttcagt gcataattcc tagaatccgc 1560 tccattgaag acagagtata gtcgttgtaa cattattctt tacgagcgtt atggactgta 1620 cctggacatg atttcttata ccaaccctgt aaataagcat gggacgctgg ggaaacctct 1680 ttacattata gtttcctgca aaatagatgc tgtaacaaag acattttact tttacttggg 1740 gagaggcagt ggaaccataa ggacccttgg aacttctaat taatacgaca gggcacaata 1800 ccgtgtttgt aagccaacgc tttgtttcaa tttaatggta accccgttgt gta 1853 <210> 162
<211> 484 <212> PRT <213> Glycine max
<400> 162
Met Asp Arg Phe Pro Ile Leu Phe Leu Val Ala Thr Leu Ile Thr Leu 10 15
Ala Ser Gly Ala Arg His Asp Ile Leu Arg Leu Pro Ser Glu Ala Ser 20 25 30
Arg Phe Phe Lys Ala Pro Ala Asn Ala Asp Gln Asn Asp Glu Gly Thr 35 40 45
Arg Trp Ala Val Leu Val Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg 50 55 60
His Gln Ser Asp Val Cys His Ala Tyr Gln Leu Leu Arg Lys Gly Gly 65 70 75 80
Val Lys Glu Glu Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala Phe 85 90 95 Asn Glu Glu Asn Pro Arg Pro Gly Val Ile Ile Asn Ser Pro His Gly 100 105 110
Asn Asp Val Tyr Lys Gly Val Pro Lys Asp Tyr Val Gly Glu Asp Val 115 120 125
Thr Val Asp Asn Phe Phe Ala Ala Ile Leu Gly Asn Lys Ser Ala Leu 130 135 140
Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp His Ile 145 150 155 160
Phe Ile Tyr Tyr Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro 165 170 175
Thr Asn Pro Tyr Met Tyr Ala Ser Asp Leu Ile Glu Val Leu Lys Lys 180 185 190
Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala 195 200 205
Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn 210 215 220
Ile Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr 225 230 235 240
Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Ser Glu Tyr Glu Thr Cys 245 250 255
Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp Ile His 260 265 270
Asn Leu Gln Thr Glu Thr Leu His Gln Gln Tyr Glu Leu Val Lys Gln 275 280 285
Arg Thr Met Asn Gly Asn Ser Ile Tyr Gly Ser His Val Met Gln Tyr 290 295 300
Gly Asp Ile Gly Leu Ser Glu Asn Asn Leu Val Leu Tyr Leu Gly Thr 305 310 315 320
Asn Pro Ala Asn Asp Asn Phe Thr Phe Val Leu Lys Asn Ser Leu Val 325 330 335
Pro Pro Ser Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Ile His Phe 340 345 350 Trp Asp Lys Phe Arg Lys Ala Pro Val Gly Ser Ser Arg Lys Ala Ala
Ala Glu Lys Gln Ile Leu Glu Ala Met Ser His Arg Met His Ile Asp
Asp Ser Met Lys Leu Ile Gly Lys Leu Phe Phe Gly Ile Glu Lys Gly
Pro Glu Leu Leu Ser Ser Val Arg Pro Ala Gly Gln Pro Leu Val Asp
Asp Trp Asp Cys Leu Lys Thr Leu Val Arg Thr Phe Glu Thr His Cys
Gly Ser Leu Ser Gln Tyr Gly Met Lys His Met Arg Ser Phe Ala Asn
Phe Cys Asn Ala Gly Ile Arg Lys Glu Gln Met Ala Glu Ala Ser Ala
Gln Ala Cys Val Ser Ile Pro Ala Ser Ser Trp Ser Ser Leu His Arg
Gly Phe Ser Ala
<210> 163 <211> 2066 <212> DNA <213> Glycine max
<400> 163
gagagcaatg cttttcccgg aaaaggagag agacataaaa aaagttccaa gaaagaatca 60
cagaattttc gcagaagcag gccaagaata oacgcatccc aaaccgttat taacgtgtca 120
gcctctaaat ttgcatggca tattgtcttt aactgagtca attocttaat aaaccctctg 180
ctttaccaac cctgttctea ctcattcaca tactataata ctacgatagc gtagactctt 240
cccagttctg ttgtgtgagt ctgtgagtct ttcttagctg atatggcggt tgatcgctcc 300
cttacgaggt gctgtagcct cgtactgtgg tcgtggatgt tgctgaggat gatgatggcg 360
cagggtgcag ccgcgagggc caaccggaag gagtgggact cggtcataaa gttaccggct 420
gaaccggtcg atgctgactc ggatcatgaa gtgggaacac gatgggcggt tcttgtggct 480
ggttcaaacg gctatggaaa ctacaggcat caagcagatg tgtgccatgc gtaccagttg 540
ctgataaaag gtgggctaaa agaagagaac atagtggtgt ttatgtacga tgacatagct 600 acagacgagt taaatcccag acctggagtc atcatcaacc accctgaggg acaagatgtg 660 tatgctggtg ttcctaagga ttacaccggt gataatgtga cgacggagaa cctctttgct 720 gttattcttg gagacaagag taaattgaag ggaggaagtg gcaaagtgat caacagcaaa 780 cccgaggaca gaatatttat atactactct gatcatggag gtcctggaat acttgggatg 840 ccaaacatgc cataccttta tgccatggat tttattgatg tcttgaagaa gaaacatgca 900 tctggaagtt acaaggagat ggttatatac gtggaagctt gtgaaagtgg gagcgtgttt 960 gagggtataa tgcctaagga tctgcagatt tatgtcacaa ctgcatccaa tgcacaagag 1020 aatagttggg gaacttattg tcctggaatg gatccttctc cacctccaga gtacatcact 1080 tgcctagggg atttgtacag tgttgcttgg atggaagata gtgagactca taatctaaaa 1140 agggagtccg tgaaacaaca atacaaatcg gtaaagcaac ggacttcaaa tttcaacaac 1200 tatgcgatgg gttctcatgt gatgcaatac ggtgacacaa acatcacagc tgaaaagctt 1260 tatttatacc aaggttttga tcctgccgct gtgaacttcc ctccacaaaa cggaaggcta 1320 gaaactaaaa tggaagttgt taaccaaaga gatgcagaac ttttcttcat gtggcaaatg 1380 tatcagagat caaaccatca gccagaaaag aagacagaca tcctcaaaca ga tagcggag 1440 acagtgaagc ataggaaaca catagatggt agcgtggaat tgattggagt tttattgtat 1500 ggaccaggaa aaggttcttc tgttctacaa tccatgaggg ctcctggtct tgcccttgtt 1560 gatgactgga catgcctaaa atcaatggtt cgggtgtttg agactcactg tgggacactg 1620 actcagtatg gcatgaaaca catgcgagca tttgccaaca tttgcaacag tggcgtttct 1680 gaggcctcca tggaagaggc ttgtttggca gcctgtgaag gctacaatgc tgggctattg 1740 catccatcaa acagaggcta cagtgcttga ttttgggttt tgtacacaaa agctttaaag 1800 cccggttgat gatgtaatat ttctctattg cattctgcct actggtttct gctgcttgtg 1860 tcaaattttc tctaaactag agtagcccaa tagcatacgt gttatgtgca ttggtcatgt 1920 atacaagtgt aatactaaaa ccttctacat aatataagat tagttagttt ggtttaaaaa 1980 aaaaaaaggg tctgttgcaa gctctatttt cttgacggca actccttcta agtcaaggag 2040 atttttccaa aaaaaaaaaa aaaaaa 2066 <210> 164
<211> 495
<212> PRT
<213> Glycine max
<400> 164
Met Ala Val Asp Arg Ser Leu Thr Arg Cys Cys Ser Leu Val Leu Trp 10 15
Ser Trp Met Leu Leu Arg Met Met Met Ala Gln Gly Ala Ala Ala Arg 20 25 30
Ala Asn Arg Lys Glu Trp Asp Ser Val Ile Lys Leu Pro Ala Glu Pro 35 40 45
Val Asp Ala Asp Ser Asp His Glu Val Gly Thr Arg Trp Ala Val Leu 50 55 60
Val Ala Gly Ser Asn Gly Tyr Gly Asn Tyr Arg His Gln Ala Asp Val 65 70 75 80
Cys His Ala Tyr Gln Leu Leu Ile Lys Gly Gly Leu Lys Glu Glu Asn 85 90 95
Ile Val Val Phe Met Tyr Asp Asp Ile Ala Thr Asp Glu Leu Asn Pro 100 105 110
Arg Pro Gly Val Ile Ile Asn His Pro Glu Gly Gln Asp Val Tyr Ala 115 120 125
Gly Val Pro Lys Asp Tyr Thr Gly Asp Asn Val Thr Thr Glu Asn Leu 130 135 140
Phe Ala Val Ile Leu Gly Asp Lys Ser Lys Leu Lys Gly Gly Ser Gly 145 150 155 160
Lys Val Ile Asn Ser Lys Pro Glu Asp Arg Ile Phe Ile Tyr Tyr Ser 165 170 175
Asp His Gly Gly Pro Gly Ile Leu Gly Met Pro Asn Met Pro Tyr Leu 180 185 190
Tyr Ala Met Asp Phe Ile Asp Val Leu Lys Lys Lys His Ala Ser Gly 195 200 205
Ser Tyr Lys Glu Met Val Ile Tyr Val Glu Ala Cys Glu Ser Gly Ser 210 215 220
Val Phe Glu Gly Ile Met Pro Lys Asp Leu Gln Ile Tyr Val Thr Thr 225 230 235 240
Ala Ser Asn Ala Gln Glu Asn Ser Trp Gly Thr Tyr Cys Pro Gly Met 245 250 255
Asp Pro Ser Pro Pro Pro Glu Tyr Ile Thr Cys Leu Gly Asp Leu Tyr 260 265 270 Ser Val Ala Trp Met Glu Asp Ser Glu Thr His Asn Leu Lys Arg Glu 275 280 285
Ser Val Lys Gln Gln Tyr Lys Ser Val Lys Gln Arg Thr Ser Asn Phe 290 295 300
Asn Asn Tyr Ala Met Gly Ser His Val Met Gln Tyr Gly Asp Thr Asn 305 310 315 320
Ile Thr Ala Glu Lys Leu Tyr Leu Tyr Gln Gly Phe Asp Pro Ala Ala 325 330 335
Val Asn Phe Pro Pro Gln Asn Gly Arg Leu Glu Thr Lys Met Glu Val 340 345 350
Val Asn Gln Arg Asp Ala Glu Leu Phe Phe Met Trp Gln Met Tyr Gln 355 360 365
Arg Ser Asn His Gln Pro Glu Lys Lys Thr Asp Ile Leu Lys Gln Ile 370 375 380
Ala Glu Thr Val Lys His Arg Lys His Ile Asp Gly Ser Val Glu Leu 385 390 395 400
Ile Gly Val Leu Leu Tyr Gly Pro Gly Lys Gly Ser Ser Val Leu Gln 405 410 415
Ser Met Arg Ala Pro Gly Leu Ala Leu Val Asp Asp Trp Thr Cys Leu 420 425 430
Lys Ser Met Val Arg Val Phe Glu Thr His Cys Gly Thr Leu Thr Gln 435 440 445
Tyr Gly Met Lys His Met Arg Ala Phe Ala Asn Ile Cys Asn Ser Gly 450 455 460
Val Ser Glu Ala Ser Met Glu Glu Ala Cys Leu Ala Ala Cys Glu Gly 465 470 475 480
Tyr Asn Ala Gly Leu Leu His Pro Ser Asn Arg Gly Tyr Ser Ala 485 490 495
<210> 165 <211> 3065 <212> DNA <213> Glycine max <400> 165 aaaatgccca ctttttttct tccaacgctc ctcctccttc tcatagcctt cgccacctct 60 gtctccggcc gccgtgacct cgtcggagac tttctccggc tgccctccga aactgataac 120 gacgacaact tcaagggcac ccggtgggcc gtcctcctcg ccggttccaa tggttactgg 180 aattacagac atcaggctga tgtttgtcac gcctatcaaa tattgaggaa aggtggtctg 240 aaagaagaaa atattattgt ttttatgtat gatgacattg cattcaatgg ggaaaaccca 300 aggcctggag tcatcattaa caaaccagat ggaggtgatg tttataaagg agttccaaag 360 gattacaccg gcgaagatgt tactgttgat aacttttttg ctgctttact tggaaataag 420 tcagcactga ctggtggcag tgggaaggtt gtggacagtg gtcctgatga tcatatattt 480 gtatactata ctgaccatgg aggtcctggg gtgctcggga tgcctgctgg tccttactta 540 tacgcggatg atctgattga agtcttgaag aaaaagcatg cttctggaac atataaaaac 600 ctagtatttt atctggaggc atgtgaatct gggagtatct ttgaaggtct tcttcctgaa 660 gatatcaata tttatgcaac cactgcttcc aatgcagaag aaagtagttg gggaacatat 720 tgccccgggg agtatcctag tcctccccca gaatatacaa cctgtttggg tgacttgtac 780 agtgttgctt ggatggaaga cagtgacaga cacaatttgc gaacagaaac tctgcaccaa 840 caatataaat tggttaaaga gaggactata tctggagatt catactatgg ctctcacgtg 900 atgcagtatg gtgatgtacg gcttagcagt gatgttctct tccattattt gggtacagat 960 cctgctaatg ataatttcac ttttgtggat gaaaactcct tatggtcacc ttcaaaacca 1020 gtcaaccaac gtgatgctga tctcatccat ttttgggata agttccgcaa agctcctgag 1080 ggttctctca ggaaaaatac agctcagaaa caagttttgg aagcaatgtc tcacagaatg 1140 catgtagaca acagtgtaaa actgattggg aagcttttat ttggcattga aaagggtcca 1200 gaagtactca acgctgttag accggctgga tcggcacttg ttgatgactg gcactgcctg 1260 aaaaccatgg tgaggacttt tgagacacat tgtggatcct tgtctcaata tggcatgaaa 1320 cacatgaggt cctttgcaaa catctgcaat gtagggataa agaatgagca aatggctgag 1380 gcctctgcac aagcttgtgt ctctattcct tccaatcctt ggagttctct gcaaaggggt 1440 ttcagtgcat aataattcct gtaatgtgca ccagtaaaga ccaaagtatg attattgtta 1500 cattatgcta tatgattgta cttgtatata catattttgt cccgcctttg taaatacaat 1560 tgggacacta ctaggattgg gaagaagggt ctttacattt ttagtttggc aaatagatat 1620 tgcaactacc tttgtataaa tctatttctg aagaagcaat tacaactttc aaggga tga t 1680 agcattttgt ggcataagga ttaaggaggc ataaaggacc aattgctttg gaatattcac 1740 tcatgacaag gcacaaggtc atgcgtgtat gccaacacat agtaatgatg tgtgttttta 1800 ttcagtaggc aactggcaga tcgggttttc ccttgtcact tttgtataat tattttggaa 1860 gaatttatga tgtcaaagtt attgtttaat attaatggcg acattgtatt tattatttgt 1920 aaaataagaa aaaaaggtga aatatagagt gaagaagaag aaatagaggg ttttggtgtt 1980
tgaatcgtga aaatgttcag aaaccagtac gacacggacg tgacgacatg gagcccggcg 2040
gggaggctgt tccaggtgga gtacgcgatg gaggcggtga agcagggctc ggcggcgata 2100
gggctccgat ccaagaccca cgtggtcctc gcatgcgtca acaaggctaa ctccgaactc 2160
tcatcgcacc agaagaagat cttcaaggtc gacaaccaca tcggcgtcgc catcgccggc 2220
ctcaccgccg acggccgcgt cctctcccgc tacatgcgat ccgagtgcat caactataac 2280
tacacctacg agtcaccgot ccccgtaggg agactcgtcg ttcagctcgc cgataaggct 2340
caggtttgca cccagcggtc atggaaacgt ccttatggag ttggactcct ggtagctgga 2400
ttagatgaat caggagctca cctctattac aactgtccca gtggaaacta ttttgaatat 24 60
caggcttttg cfcattgggtc tcgctctcaa gctgcaaaga catatttgga acgcaggttt 2520
gagaattttg tgggctcttc acgagaagat ctgatcaaag atgcacttat tgcaactagg 2580
gagtccttgc aaggtgaaaa actcaggagt tctgtgtgca caattgctgt ggttggtgtt 2640
ggtgagccat tccacatttt ggatcaggaa actgttcaac agttgattga tacttttgag 2700
attgtgaggg aggaagaagc tgctccagct gaagaagaag ctcagccagc agccgaacag 2760
gatgctccca cagatccagg tgctgctgct gcagatcaag gtggtggttg ctgctgctgt 2820
agaccaaggt ggttctccta tggacatttg ataatttaaa attaagtact agaggtgttg 2880
aataccaata tttaaagacg agtaggtttc atgtgtcatg ggacaagata tttctttgat 2940
ggaatttttt tccccttaat cctgtttgtt ttttcaattc atccatgcct gatcattgta 3000
aacgatttta tagctgtttg atgaacttga atgcatgatt tacaataatt aattgaaatt 3060 caggc
<210> 166
<211> 482
<212> PRT
<213> Glycine max
<400> 166
Met Pro Thr Phe Phe Leu Pro Thr Leu Leu Leu Leu Leu Ile Ala Phe 10 15
Ala Thr Ser Val Ser Gly Arg Arg Asp Leu Val Gly Asp Phe Leu Arg 25 30
Leu Pro Ser Glu Thr Asp Asn Asp Asp Asn Phe Lys Gly Thr Arg Trp 40 45
3065
Ala Val Leu Leu Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln 50 55 60 Ala Asp Val Cys His Ala Tyr Gln Ile Leu Arg Lys Gly Gly Leu Lys 65 70 75 80
Glu Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Phe Asn Gly 85 90 95
Glu Asn Pro Arg Pro Gly Val Ile Ile Asn Lys Pro Asp Gly Gly Asp 100 105 110
Val Tyr Lys Gly Val Pro Lys Asp Tyr Thr Gly Glu Asp Val Thr Val 115 120 125
Asp Asn Phe Phe Ala Ala Leu Leu Gly Asn Lys Ser Ala Leu Thr Gly 130 135 140
Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asp Asp His Ile Phe Val 145 150 155 160
Tyr Tyr Thr Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Ala Gly 165 170 175
Pro Tyr Leu Tyr Ala Asp Asp Leu Ile Glu Val Leu Lys Lys Lys His 180 185 190
Ala Ser Gly Thr Tyr Lys Asn Leu Val Phe Tyr Leu Glu Ala Cys Glu 195 200 205
Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Glu Asp Ile Asn Ile Tyr 210 215 220
Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys 225 230 235 240
Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu Tyr Thr Thr Cys Leu Gly 245 250 255
Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp Arg His Asn Leu 260 265 270
Arg Thr Glu Thr Leu His Gln Gln Tyr Lys Leu Val Lys Glu Arg Thr 275 280 285
Ile Ser Gly Asp Ser Tyr Tyr Gly Ser His Val Met Gln Tyr Gly Asp 290 295 300
Val Arg Leu Ser Ser Asp Val Leu Phe His Tyr Leu Gly Thr Asp Pro 305 310 315 320 Ala Asn Asp Asn Phe Thr Phe Val Asp Glu Asn Ser Leu Trp Ser Pro 325 330 335
Ser Lys Pro Val Asn Gln Arg Asp Ala Asp Leu Ile His Phe Trp Asp 340 345 350
Lys Phe Arg Lys Ala Pro Glu Gly Ser Leu Arg Lys Asn Thr Ala Gln 355 360 365
Lys Gln Val Leu Glu Ala Met Ser His Arg Met His Val Asp Asn Ser 370 375 380
Val Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly Pro Glu 385 390 395 400
Val Leu Asn Ala Val Arg Pro Ala Gly Ser Ala Leu Val Asp Asp Trp 405 410 415
His Cys Leu Lys Thr Met Val Arg Thr Phe Glu Thr His Cys Gly Ser 420 425 430
Leu Ser Gln Tyr Gly Met Lys His Met Arg Ser Phe Ala Asn Ile Cys 435 440 445
Asn Val Gly Ile Lys Asn Glu Gln Met Ala Glu Ala Ser Ala Gln Ala 450 455 460
Cys Val Ser Ile Pro Ser Asn Pro Trp Ser Ser Leu Gln Arg Gly Phe 465 470 475 480
Ser Ala
<210> 167
<211> 1756
<212> DNA
<213> Brassica napa
<400> 167
tcatcacott attgattggt tgacaaaaaa caaacagata agaaaagaaa agattcatta 60
tttaatagtt cccccgccga ttaaaagatt cgtatccacg tcaocatacg cctctccaac 120
gatgacacct gtcgccgtcg cogttctcgt cctctccttg atcgccgtct ccgccgcaag 180
acaaaacccc gacgacgacg tcatcaaact cccctcgcaa gcttccaggt tcttccgccc 240
caacaacgac gacgaatctt catcgtccgg caccaggtgg gccgttctgg tcgccggatc 300
gagcggttat tggaactaca gacatcaggc tgatgtttgt catgcttatc aactactgag 360 gaaaggagga ttgaaagagg agaatattgt ggttttcatg tatgatgata ttgctgataa 420
tgaagagaat ccgaggaaag ggatcattat caatagccct catgggagtg atgtctatga 480
aggagttccc aaggattaca ctggagatga tgttactgtt gataatctgt ttgctgtgat 540
ccttggagat aaaactgctg ttaagggagg gagtgggaag gttgtggata gtggtcctaa 600
tgatcatatt tttatattct atagtgacca tggtggtcct ggagttcttg ggatgccgac 660
ttctccttac ttatatgctg atgacttgaa tgatgtcttg aagaaaaaac atgcttccgg 720
aacctacaaa agcatggtgt tctatcttga agcttgtgag tctggaagta tctttgaagg 780
gcttcttgaa gagggtttaa acatctacgc cacaactgca tcaaacgcag tggaaagcag 840
ttggggtacc tattgccctg gggaggagcc tagccctcca ccggagtatg aaacttgctt 900
aggtgactta tacagtgttg catggatgga agacagcggt gtgcacaatc tacaaactga 960
gactctacgc caacaatatg agctagtgaa gaggaggact gctggtggtg cgtcggctta 1020
cggttctcat gtgatgcaat atggagatgt aggacttaac aaggataagc tcgaccttta 1080
catgggaaca aaccctgcca atgacaactt cacttttgtg gatgctaatt cactgactcc 1140
accttcagga gttactaacc agcgtgatgc agatcttgtc catttctggg ataagtaccg 1200
aaaggcacca gaaggttcca caaggaaaac agaagctcag aagcaagtcc ttgaagccat 1260
gtctcacaga cttcatgttg acaacagtgt gaaactcgtc ggcaaactct tgtttggtat 1320
ctcagaaggt tctgaagtgc taaacaaagt aaggcctgct ggacaacctc tggccgatga 1380
ctggacttgc cttaaaaaca cggtgagagc ttttgagaga cactgtgggt cgctgtcaca 1440
gtacggtatc aagcacatga ggtcatttgc aaacatctgc aacgcaggga tccaaatgga 1500
gcaaatggaa gaggcagctt cacaggcttg cacctcaatc ccatctggtc cttggagctc 1560
tcttcaccgt ggattcagtg cttaaaaccc ctaaatccct ctttgcattt gtttaatact 1620
agtaccaata cccaaatatt cctatttcga ttcccctgta tatctcatta tcatttccct 1680
cttgattatc taattacaga ttatacatat gctttgtaca aaatgcttgt agaaactcaa 1740
gttaatgtaa acaacg 1756
<210> 168 <211> 487 <212> PRT
<213> Brassica napa <400> 168
Met Thr Pro Val Ala Val Ala Val Leu Val Leu Ser Leu Ile Ala Val 10 15
Ser Ala Ala Arg Gln Asn Pro Asp Asp Asp Val Ile Lys Leu Pro Ser 25 30 Gln Ala Ser Arg Phe Phe Arg Pro Asn Asn Asp Asp Glu Ser Ser Ser 40 45
Ser Gly Thr Arg Trp Ala Val Leu Val Ala Gly Ser Ser Gly Tyr Trp 50 55 60
Asn Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Leu Leu Arg 65 70 75 80
Lys Gly Gly Leu Lys Glu Glu Asn Ile Val Val Phe Met Tyr Asp Asp 85 90 95
Ile Ala Asp Asn Glu Glu Asn Pro Arg Lys Gly Ile Ile Ile Asn Ser 100 105 110
Pro His Gly Ser Asp Val Tyr Glu Gly Val Pro Lys Asp Tyr Thr Gly 115 120 125
Asp Asp Val Thr Val Asp Asn Leu Phe Ala Val Ile Leu Gly Asp Lys 130 135 140
Thr Ala Val Lys Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn 145 150 155 160
Asp His Ile Phe Ile Phe Tyr Ser Asp His Gly Gly Pro Gly Val Leu 165 170 175
Gly Met Pro Thr Ser Pro Tyr Leu Tyr Ala Asp Asp Leu Asn Asp Val 180 185 190
Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Met Val Phe Tyr 195 200 205
Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Glu Glu 210 215 220
Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Val Glu Ser Ser 225 230 235 240
Trp Gly Thr Tyr Cys Pro Gly Glu Glu Pro Ser Pro Pro Pro Glu Tyr 245 250 255
Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser 260 265 270
Gly Val His Asn Leu Gln Thr Glu Thr Leu Arg Gln Gln Tyr Glu Leu 275 280 285
Val Lys Axg Arg Thr Ala Gly Gly Ala Ser Ala Tyr Gly Ser His Val 290 295 300
Met Gln Tyr Gly Asp Val Gly Leu Asn Lys Asp Lys Leu Asp Leu Tyr 305 310 315 320
Met Gly Thr Asn Pro Ala Asn Asp Asn Phe Thr Phe Val Asp Ala Asn 325 330 335
Ser Leu Thr Pro Pro Ser Gly Val Thr Asn Gln Arg Asp Ala Asp Leu 340 345 350
Val His Phe Trp Asp Lys Tyr Arg Lys Ala Pro Glu Gly Ser Thr Arg 355 360 365
Lys Thr Glu Ala Gln Lys Gln Val Leu Glu Ala Met Ser His Arg Leu 370 375 380
His Val Asp Asn Ser Val Lys Leu Val Gly Lys Leu Leu Phe Gly Ile 385 390 395 400
Ser Glu Gly Ser Glu Val Leu Asn Lys Val Arg Pro Ala Gly Gln Pro 405 410 415
Leu Ala Asp Asp Trp Thr Cys Leu Lys Asn Thr Val Arg Ala Phe Glu 420 425 430
Arg His Cys Gly Ser Leu Ser Gln Tyr Gly Ile Lys His Met Arg Ser 435 440 445
Phe Ala Asn Ile Cys Asn Ala Gly Ile Gln Met Glu Gln Met Glu Glu 450 455 460
Ala Ala Ser Gln Ala Cys Thr Ser Ile Pro Ser Gly Pro Trp Ser Ser 465 470 475 480
Leu His Arg Gly Phe Ser Ala 485
<210> 169
<211> 1604
<212> DNA
<213> Brassica napa
<400> 169
tttacacaga gagagcaaaa caacagttct ttagagtaat tttctgacaa tgtcttctct tggtcattta cttgttcttg tgtttctcta tgttctgctt ttttactcag ctgattctcg 120
caaaccccaa gtccttcatg acactggatc tagcgaagat ggtgcaaaag gcacaagatg 180
ggctgttcta attgctggat caagttatta ttataactac aggcatcagg ctgacatatg 240
ccatgcatat caagttctgc gaaaaggggg tctaaaagat gaaaacatta ttgtgtttat 300
gtatgatgat atcgcgttta accctgagaa tcccaggcct ggagttatca tcaatagacc 360
tgatggtgga gatgtttatg aaggcgttcc taaggactac actaaagagg ctgttaatgt 420
gaagaacttt tataatgtga tacttggaaa cgaaagtggc atcacaggag gaagtggcaa 480
agttgtgaaa agtggtccta atgatagtat attcatctac tatgctgacc atggagctcc 540
tggtttacta tcgatgcctg atggtgaaga tatccatgca aaagatttca ttaaagtctt 600
ggagaagatg cataagctta aaagatacaa gaagatggtg atttatgttg aagcatgtga 660
gtctggaagt atgtttgaag ggattttaaa gaccaatcta aacatacttg cagtaactgc 720
ttctaatgcg acagagagca gttttggaat ctactgtcct ggtgaatatc ctcctoctcc 780
tcctgaatat aatggtgttt gtctcggcga tacatttagc gtctcttggc ttgaggacag 840
tgagcttcat gacatgagta aagagacatt gaagcagcaa taccaagctg taaagagaag 900
aacaggtcct gatgctgaac cagggacgag ttctcatgta agccgtttcg gatcaaaggc 960
gcttcttaaa gactatcttg tctcttacat tggaaccaat cctgataacg aaaacttcac 1020
ttttgctgga ttcactgctt caccaatctc tacttcaagc tcggtcaata ctcgcgatat 1080
ccctttgtta tatctcaaga gcaagattca aagatctcca atggagtcac ctgaaagaca 1140
agagcttcag aagaagctgt ttgaagaaat gaatcatagg agacaaatcg atcagaacat 1200
tgtggagatt cttaaacttt cacttaagca aaccaatgtc ttaaatctct taatttccac 1260
aagaacaaca ggacaacctc ttgtagacga ctgggattgc ttcaagactc tggttaatag 1320
cttcaagaat cactgtggag caacgatgga ttacggattg aagtatacag gagcgcttgc 1380
caatatctgc aatatgggag tggatgtgaa gcaaactgtt tcagctattg aacacgcttg 1440
tgcacattaa atgaaatgat gtgcataaat aatgtgatcg acttaaaaaa tatgaaagtt 1500
attgcattaa gatatatgaa ctgtcgagat ggttgatgat gcctattttt actttaataa 1560
aaaatttagt tggtaacgcg aaaaaaaaaa aaaaaaccgc ccct 1604
<210> 170 <211> 466 <212> PRT <213> Brassica napa
<400> 170
Met Ser Ser Leu Gly His Leu Leu Val Leu Val Phe Leu Tyr Val Leu 10 15 Leu Phe Tyr Ser Ala Asp Ser Arg Lys Pro Gln Val Leu His Asp Thr 25 30
Gly Ser Ser Glu Asp Gly Ala Lys Gly Thr Arg Trp Ala Val Leu Xle 40 45
Ala Gly Ser Ser Tyr Tyr Tyr Asn Tyr Arg His Gln Ala Asp Ile Cys 50 55 60
His Ala Tyr Gln Val Leu Arg Lys Gly Gly Leu Lys Asp Glu Asn Ile 65 70 75 80
Ile Val Phe Met Tyr Asp Asp Ile Ala Phe Asn Pro Glu Asn Pro Arg 85 90 95
Pro Gly Val Ile Ile Asn Arg Pro Asp Gly Gly Asp Val Tyr Glu Gly 100 105 110
Val Pro Lys Asp Tyr Thr Lys Glu Ala Val Asn Val Lys Asn Phe Tyr 115 120 125
Asn Val Ile Leu Gly Asn Glu Ser Gly Ile Thr Gly Gly Ser Gly Lys 130 135 140
Val Val Lys Ser Gly Pro Asn Asp Ser Ile Phe Ile Tyr Tyr Ala Asp 145 150 155 160
His Gly Ala Pro Gly Leu Leu Ser Met Pro Asp Gly Glu Asp Ile His 165 170 175
Ala Lys Asp Phe Ile Lys Val Leu Glu Lys Met His Lys Leu Lys Arg 180 185 190
Tyr Lys Lys Met Val Ile Tyr Val Glu Ala Cys Glu Ser Gly Ser Met 195 200 205
Phe Glu Gly Ile Leu Lys Thr Asn Leu Asn Ile Leu Ala Val Thr Ala 210 215 220
Ser Asn Ala Thr Glu Ser Ser Phe Gly Ile Tyr Cys Pro Gly Glu Tyr 225 230 235 240
Pro Pro Pro Pro Pro Glu Tyr Asn Gly Val Cys Leu Gly Asp Thr Phe 245 250 255
Ser Val Ser Trp Leu Glu Asp Ser Glu Leu His Asp Met Ser Lys Glu 260 265 270 Thr Leu Lys Gln Gln Tyr Gln Ala Val Lys Arg Arg Thr Gly Pro Asp 275 280 285
Ala Glu Pro Gly Thr Ser Ser His Val Ser Arg Phe Gly Ser Lys Ala 290 295 300
Leu Leu Lys Asp Tyr Leu Val Ser Tyr Ile Gly Thr Asn Pro Asp Asn 305 310 315 320
Glu Asn Phe Thr Phe Ala Gly Phe Thr Ala Ser Pro Ile Ser Thr Ser 325 330 335
Ser Ser Val Asn Thr Arg Asp Ile Pro Leu Leu Tyr Leu Lys Ser Lys 340 345 350
Ile Gln Arg Ser Pro Met Glu Ser Pro Glu Arg Gln Glu Leu Gln Lys 355 360 365
Lys Leu Phe Glu Glu Met Asn His Arg Arg Gln Ile Asp Gln Asn Ile 370 375 380
Val Glu Ile Leu Lys Leu Ser Leu Lys Gln Thr Asn Val Leu Asn Leu 385 390 395 400
Leu Ile Ser Thr Arg Thr Thr Gly Gln Pro Leu Val Asp Asp Trp Asp 405 410 415
Cys Phe Lys Thr Leu Val Asn Ser Phe Lys Asn His Cys Gly Ala Thr 420 425 430
Met Asp Tyr Gly Leu Lys Tyr Thr Gly Ala Leu Ala Asn Ile Cys Asn 435 440 445
Met Gly Val Asp Val Lys Gln Thr Val Ser Ala Ile Glu His Ala Cys 450 455 460
Ala His 465
<210> 171 <211> 1943 <212> DNA <213> Zea mays <400> 171
tccactctcg ctccctotcc ctcccttccc toccacgcaa atggtggccg ctcgcctocg 60
cctctcgctg ctactctccg tctgcctctc ctccgcgtgg gcgcgcccac gcctcgagcc 120 ggccatccgc ctgccgtcgc agcgcgccgc ggcggccgac gaaacggacg acggcgacgt 180 cgggacccgc tgggccgtgc tcatcgccgg ctccaacggc tactacaact accgccacca 240 ggcggacatc tgccatgcat accagatcat gaagaagggc ggacttaagg acgagaacat 300 cgttgtcttc atgtacgatg acatcgcgca tagcccggaa aatccgaggc ctggtgtcat 360 cataaatcat ccccagggtg gcgacgtcta tgctggggtg ccaaaggatt acactgggcg 420 agaggtcaac gtcgacaatt tcttcgctgt tctgcttggc aacaaaactg ctctcagggg 480 tgggagcggc aaggttgtgg acagtggccc caatgatcat atatttgttt tctacagtga 540 ccatgggggt cctggtgtcc ttggaatgcc tacgtatcca tatctctatg gtgatgacct 600 cgtagatgtc ctgaagaaga agcatgctgc cgggacctac aaaagcctgg tcttttacct 660 tgaagcgtgc gaatctggga gcatctttga gggcctcctg ccgaatgaca tcaatgtgta 720 tgcgaccacc gcgtcaaatg cagaggagag tagctggggg acgtactgcc ctggcgagtt 780 cccgagccct ccaccggagt atgacacttg cttgggagac ctgtatagtg ttgcttggat 840 ggaagacagt gatttccaca atctgcgaac tgaatctctc aagcagcaat acaacttggt 900 caaggatagg acagcggttc aggatacatt cagctatggc tcccatgtga tgcaatatgg 960 ttcattggag ttgaatgtta agcatctgtt ttcgtacatt ggcacaaacc ctgctaacga 1020 tgacaacacg tttatagaag acaactcgtt gccatcattc tcaaaggctg ttaatcagcg 1080 cgacgctgac cttgtctact tctggcagaa gtaccggaaa ttggcagaca gctcacctga 1140 gaaaaatgaa gctcggaggg agttgcttga agtgatggcc cacaggtctc atgttgacag 1200 cagtgttgag ctcattggaa gccttctctt tggctctgag gacggtccaa gggttctgaa 1260 agccgtccgt gcagctggtg agcctctggt cgatgattgg agctgtctca agtccacggt 1320 tcgtactttt gaggcgcaat gtgggtcgtt ggcgcagtat gggatgaagc acatgcggtc 1380 cttcgcaaac atctgcaacg ctggcatcct tcctgaggca gtgtcgaagg tcgctgctca 1440 ggcttgcacc agcattcctt ccaacccctg gagttctatc cacaagggtt ttagcgccta 1500 agaatcataa ggtgaggcga aatatttcag ccgctccacc gcaacgaact ggtttacatt 1560 accagtcctc aggggggtcc tagttcttga accataggtg aagcagactt ataccactat 1620 tatagctgtt ccaccgtcgt tccagattac atagctatgc ccaatttccg gtgtacatat 1680 atagtcggaa agttatttgg caattgtatt ggtcgttgct gtatatattc cctatagttt 1740 gttagcagat gtgtagtttg taattccata aaaatgaagg acgcgttact gctatttcta 1800 tgtagccgac tggtgctcat gtgaaacttt accccattct tgttgggaaa tgtactatcc 1860 gtggtggaat tcttgcatcg aaaacaattc ccgggtggtc ctttattcaa aaaaaaaaaa 1920 aaaaaagcgg ccggtgctag agg 1943 <210> 172 <211> 486 <212> PRT <213> Zea mays <400> 172
Met Val Ala Ala Arg Leu Arg Leu Ser Leu Leu Leu Ser Val Cys Leu 10 15
Ser Ser Ala Trp Ala Arg Pro Arg Leu Glu Pro Ala Ile Arg Leu Pro 25 30
Ser Gln Arg Ala Ala Ala Ala Asp Glu Thr Asp Asp Gly Asp Val Gly 40 45
Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Tyr Asn Tyr 50 55 60
Arg His Gln Ala Asp Ile Cys His Ala Tyr Gln Ile Met Lys Lys Gly 65 70 75 80
Gly Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala 85 90 95
His Ser Pro Glu Asn Pro Arg Pro Gly Val Ile Ile Asn His Pro Gln 100 105 110
Gly Gly Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Arg Glu 115 120 125
Val Asn Val Asp Asn Phe Phe Ala Val Leu Leu Gly Asn Lys Thr Ala 130 135 140
Leu Arg Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp His 145 150 155 160
Ile Phe Val Phe Tyr Ser Asp His Gly Gly Pro Gly Val Leu Gly Met 165 170 175
Pro Thr Tyr Pro Tyr Leu Tyr Gly Asp Asp Leu Val Asp Val Leu Lys 180 185 190
Lys Lys His Ala Ala Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu 195 200 205
Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Asn Asp Ile 210 215 220 Asn Val Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly 225 230 235 240
Thr Tyr Cys Pro Gly Glu Phe Pro Ser Pro Pro Pro Glu Tyr Asp Thr 245 250 255
Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp Phe 260 265 270
His Asn Leu Arg Thr Glu Ser Leu Lys Gln Gln Tyr Asn Leu Val Lys 275 280 285
Asp Arg Thr Ala Val Gln Asp Thr Phe Ser Tyr Gly Ser His Val Met 290 295 300
Gln Tyr Gly Ser Leu Glu Leu Asn Val Lys His Leu Phe Ser Tyr Ile 305 310 315 320
Gly Thr Asn Pro Ala Asn Asp Asp Asn Thr Phe Ile Glu Asp Asn Ser 325 330 335
Leu Pro Ser Phe Ser Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Val 340 345 350
Tyr Phe Trp Gln Lys Tyr Arg Lys Leu Ala Asp Ser Ser Pro Glu Lys 355 360 365
Asn Glu Ala Arg Arg Glu Leu Leu Glu Val Met Ala His Arg Ser His 370 375 380
Val Asp Ser Ser Val Glu Leu Ile Gly Ser Leu Leu Phe Gly Ser Glu 385 390 395 400
Asp Gly Pro Arg Val Leu Lys Ala Val Arg Ala Ala Gly Glu Pro Leu 405 410 415
Val Asp Asp Trp Ser Cys Leu Lys Ser Thr Val Arg Thr Phe Glu Ala 420 425 430
Gln Cys Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg Ser Phe 435 440 445
Ala Asn Ile Cys Asn Ala Gly Ile Leu Pro Glu Ala Val Ser Lys Val 450 455 460
Ala Ala Gln Ala Cys Thr Ser Ile Pro Ser Asn Pro Trp Ser Ser Ile 465 470 475 480 His Lys Gly Phe Ser Ala 485
<210> 173 <211> 1437 <212> DNA
<213> Axabidopsis thaliana <400> 173
atgaccaccg togtttcctt tctcgccctc ttcctctttc tagtcgccgc cgtttctggt 60 gacgtcatca aacttccttc tctagcttct aagttcttcc gcccaactga aaacgacgat 120 gattctacta agtgggctgt tctcgtcgcc ggatccagcg gatactggaa ttatcgtcat 180 caggcggatg tttgtcatgc ttatcagctt ttgaagaaag gtggagtgaa agaggagaat 240
attgtggtgt ttatgtatga tgacattgcg aagaacgagg agaatccaag acctggagtt 300
attatcaata gtcctaatgg agaggatgtc tataatggag ttcccaagga ttacactgga 360
gatgaagtta atgttgataa cttattagct gtgattcttg gaaacaaaac ggctcttaaa 420
ggaggaagtg ggaaagttgt agatagcggt ccaaacgatc atat.ct.ttat atactatagt 480
gatcacggtg gtccgggagt gctcgggatg ccaacttctc oaaacotata tgcaaatgat 540
ctcaatgatg tcttgaagaa aaaatatgct tcaggaacat ataagagctt ggtgttttat 600
ttggaggctt gtgaatctgg aagtattttt gaaggtcttt taccagaggg tttaaatatt 660
tacgcgacaa ctgcatcgaa tgcagaagaa agtagctggg gtacttactg tcctggagag 720
gatcctagtc ctccttctga gtatgagaco tgtttgggtg acttatacag tgttgcttgg 780
atagaagata gtgaaaaaca caatttacaa acagagactt tgcacgagca atatgaattg 840
gtgaaaaaga gaactgcagg ttctggtaag tcttatggtt ctcatgttat ggaatttgga 900
gatataggac tcagcaagga gaagcttgtc ctttttatgg gtacaaatcc agcagatgaa 960
aacttcacct ttgtgaatga gaattcaata aggccgcctt caagagttac aaaccagcgt 1020
gatgcggatc ttgtccattt ctggcataag tatcaaaagg caccggaagg gtcagcaaga 1080
aaagttgaag otcagaagca agtccttgaa gcaatgtctc acagacttca tgttgataat 1140
agcattctgt tgattgggat tcttttgttt ggtttggaag gtcatgcggt gttaaataaa 1200
gtccggcctt ctggagaacc gcttgttgac gattgggact gccttaaatc tctggtgaga 1260
gctttcgaga ggcactgtgg atcgttgtct cagtacggaa taaagcacat gaggtcgatt 1320
gcaaacatgt gcaacgcagg gattcagatg aggcaaatgg aggaggcagc aatgcaggct 1380
tgtcccacca tccctaccag tccttggagc tctcttgacc gtggattcag tgcttga 1437
<210> 174 <211> 478 <212> PRT
<213> Arabidopsis thaliana <400> 174
Met Thr Thr Val Val Ser Phe Leu Ala Leu Phe Leu Phe Leu Val Ala 10 15
Ala Val Ser Gly Asp Val Ile Lys Leu Pro Ser Leu Ala Ser Lys Phe 25 30
Phe Arg Pro Thr Glu Asn Asp Asp Asp Ser Thr Lys Trp Ala Val Leu 40 45
Val Ala Gly Ser Ser Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Val 50 55 60
Cys His Ala Tyr Gln Leu Leu Lys Lys Gly Gly Val Lys Glu Glu Asn 65 70 75 80
Ile Val Val Phe Met Tyr Asp Asp Ile Ala Lys Asn Glu Glu Asn Pro 85 90 95
Arg Pro Gly Val Ile Ile Asn Ser Pro Asn Gly Glu Asp Val Tyr Asn 100 105 110
Gly Val Pro Lys Asp Tyr Thr Gly Asp Glu Val Asn Val Asp Asn Leu 115 120 125
Leu Ala Val Ile Leu Gly Asn Lys Thr Ala Leu Lys Gly Gly Ser Gly 130 135 140
Lys Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Ser 145 150 155 160
Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Thr Ser Pro Asn Leu 165 170 175
Tyr Ala Asn Asp Leu Asn Asp Val Leu Lys Lys Lys Tyr Ala Ser Gly 180 185 190
Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser 195 200 205
Ile Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr 210 215 220
Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu 225 230 235 240 Asp Pro Ser Pro Pro Ser Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr 245 250 255
Ser Val Ala Trp Ile Glu Asp Ser Glu Lys His Asn Leu Gln Thr Glu 260 265 270
Thr Leu His Glu Gln Tyr Glu Leu Val Lys Lys Arg Thr Ala Gly Ser 275 280 285
Gly Lys Ser Tyr Gly Ser His Val Met Glu Phe Gly Asp Ile Gly Leu 290 295 300
Ser Lys Glu Lys Leu Val Leu Phe Met Gly Thr Asn Pro Ala Asp Glu 305 310 315 320
Asn Phe Thr Phe Val Asn Glu Asn Ser Ile Arg Pro Pro Ser Arg Val 325 330 335
Thr Asn Gln Arg Asp Ala Asp Leu Val His Phe Trp His Lys Tyr Gln 340 345 350
Lys Ala Pro Glu Gly Ser Ala Arg Lys Val Glu Ala Gln Lys Gln Val 355 360 365
Leu Glu Ala Met Ser His Arg Leu His Val Asp Asn Ser Ile Leu Leu 370 375 380
Ile Gly Ile Leu Leu Phe Gly Leu Glu Gly His Ala Val Leu Asn Lys 385 390 395 400
Val Arg Pro Ser Gly Glu Pro Leu Val Asp Asp Trp Asp Cys Leu Lys 405 410 415
Ser Leu Val Arg Ala Phe Glu Arg His Cys Gly Ser Leu Ser Gln Tyr 420 425 430
Gly Ile Lys His Met Arg Ser Ile Ala Asn Met Cys Asn Ala Gly Ile 435 440 445
Gln Met Arg Gln Met Glu Glu Ala Ala Met Gln Ala Cys Pro Thr Ile 450 455 460
Pro Thr Ser Pro Trp Ser Ser Leu Asp Arg Gly Phe Ser Ala 465 470 475
<210> 175 <211> 1461 <212> DNA
<213> Arabidopsis thaliana <400> 175
atggctaagt cttgctattt cagaccagct cttcttcttc tgttagttct tttggttcat 60 gccgagtcac gcggtcggtt cgagccaaag attcttatgc cgacagagga agctaacccg 120 gctgaccaag acgaagatgg tgtcggtaca agatgggcgg ttctcgtcgc tggttcttct 180 ggatatggaa actacagaca ccaggctgac gtgtgtcacg catatcaaat actaagaaaa 240 ggaggtttaa aggaagaaaa catagtcgtt ttgatgtatg atgatatcgc aaaccaccca 300 cttaatcctc gtccgggtac tctcatcaac catcctgacg gtgacgatgt ttacgccgga 360 gtccctaagg actatactgg tagtagcgtt acggctgcaa acttctacgc tgtactccta 420 ggcgaccaga aggctgttaa aggtggaagc ggtaaggtca tcgctagcaa gcccaacgat 480 cacattttcg tatattatgc ggatcatggt ggtcccggag ttcttgggat gccaaatacg 540 cctcacatat atgcagctga ttttattgaa acgcttaaga agaagcatgc ttccggaaca 600 tacaaagaga tggttatata cgtagaagcg tgtgaaagtg ggagtatttt cgaagggata 660 atgccaaagg acttgaacat ttacgtaaca acggcttcaa atgcacaaga gagtagttat 720 ggaacatatt gtcctggcat gaatccgtca cccccatctg aatatatcac ttgcttaggg 780 gatttatata gtgttgcttg gatggaagat agtgagactc acaatttaaa gaaagagacc 840 ataaagcaac aataccacac ggtgaagatg aggacatcaa actacaatac ctactcaggt 900 ggctctcatg tgatggaata cggtaacaat agtattaagt cggagaagct ttatctttac 960 caagggtttg atccagccac cgttaatctc ccactaaacg aattaccggt caagtcaaaa 1020 ataggagtcg ttaaccaacg cgacgcggac cttctcttcc tttggcatat gtatcggaca 1080 tcggaagatg ggtcaaggaa gaaggatgac acattgaagg aattaactga gacaacaagg 1140 cataggaaac atttagatgc aagcgtcgaa ttgatagcca caattttgtt tggtccgacg 1200 atgaatgttc ttaacttggt tagagaaccc ggtttgcctt tggttgacga ttgggaatgt 1260 cttaaatcga tggtacgtgt atttgaagag cattgtggat cactaacgca atatgggatg 1320 aaacatatgc gagcgtttgc aaacgtttgt aacaacggtg tgtccaaaga gctgatggag 1380 gaagcttcta ctgcggcatg cggtggttat agtgaggctc gctacacggt gcatccatca 1440 atcttaggct atagcgcctg a 1461
<210> 176
<211> 486
<212> PRT
<213> Arabidopsis thaliana
<400> 176 Met Ala Lys Ser Cys Tyr Phe Arg Pro Ala Leu Leu Leu Leu Leu Val 10 15
Leu Leu Val His Ala Glu Ser Arg Gly Arg Phe Glu Pro Lys Ile Leu 25 30
Met Pro Thr Glu Glu Ala Asn Pro Ala Asp Gln Asp Glu Asp Gly Val 40 45
Gly Thr Arg Trp Ala Val Leu Val Ala Gly Ser Ser Gly Tyr Gly Asn 50 55 60
Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Ile Leu Arg Lys 65 70 75 80
Gly Gly Leu Lys Glu Glu Asn Ile Val Val Leu Met Tyr Asp Asp Ile 85 90 95
Ala Asn His Pro Leu Asn Pro Arg Pro Gly Thr Leu Ile Asn His Pro 100 105 110
Asp Gly Asp Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Ser 115 120 125
Ser Val Thr Ala Ala Asn Phe Tyr Ala Val Leu Leu Gly Asp Gln Lys 130 135 140
Ala Val Lys Gly Gly Ser Gly Lys Val Ile Ala Ser Lys Pro Asn Asp 145 150 155 160
His Ile Phe Val Tyr Tyr Ala Asp His Gly Gly Pro Gly Val Leu Gly 165 170 175
Met Pro Asn Thr Pro His Ile Tyr Ala Ala Asp Phe Ile Glu Thr Leu 180 185 190
Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Glu Met Val Ile Tyr Val 195 200 205
Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Ile Met Pro Lys Asp 210 215 220
Leu Asn Ile Tyr Val Thr Thr Ala Ser Asn Ala Gln Glu Ser Ser Tyr 225 230 235 240
Gly Thr Tyr Cys Pro Gly Met Asn Pro Ser Pro Pro Ser Glu Tyr Ile 245 250 255 Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Glu 260 265 270
Thr His Asn Leu Lys Lys Glu Thr Ile Lys Gln Gln Tyr His Thr Val 275 280 285
Lys Met Arg Thr Ser Asn Tyr Asn Thr Tyr Ser Gly Gly Ser His Val 290 295 300
Met Glu Tyr Gly Asn Asn Ser Ile Lys Ser Glu Lys Leu Tyr Leu Tyr 305 310 315 320
Gln Gly Phe Asp Pro Ala Thr Val Asn Leu Pro Leu Asn Glu Leu Pro 325 330 335
Val Lys Ser Lys Ile Gly Val Val Asn Gln Arg Asp Ala Asp Leu Leu 340 345 350
Phe Leu Trp His Met Tyr Arg Thr Ser Glu Asp Gly Ser Arg Lys Lys 355 360 365
Asp Asp Thr Leu Lys Glu Leu Thr Glu Thr Thr Arg His Arg Lys His 370 375 380
Leu Asp Ala Ser Val Glu Leu Ile Ala Thr Ile Leu Phe Gly Pro Thr 385 390 395 400
Met Asn Val Leu Asn Leu Val Arg Glu Pro Gly Leu Pro Leu Val Asp 405 410 415
Asp Trp Glu Cys Leu Lys Ser Met Val Arg Val Phe Glu Glu His Cys 420 425 430
Gly Ser Leu Thr Gln Tyr Gly Met Lys His Met Arg Ala Phe Ala Asn 435 440 445
Val Cys Asn Asn Gly Val Ser Lys Glu Leu Met Glu Glu Ala Ser Thr 450 455 460
Ala Ala Cys Gly Gly Tyr Ser Glu Ala Arg Tyr Thr Val His Pro Ser 465 470 475 480
Ile Leu Gly Tyr Ser Ala 485
<210> 177 <211> 1401 <212> DNA
<213> Arabidopsis thaliana <400> 177
atgtctagtc ctcttggtca ctttcagatt cttgtttttc ttcatgcttt gcttatcttc 60
tcagctgagt cccgcaaaac ccaattgctg aacgataatg atgttgaatc tagcgacaag 120
agtgcaaaag gcacacgatg ggctgtttta gttgctggat caaatgaata ttataactac 180
aggcatcagg ctgacatatg ccacgcgtat cagatactcc gaaaaggcgg tttaaaagat 240
gaaaacatca ttgtgtttat gtatgatgat atcgcgtttt cctcggagaa tcctaggcct 300
ggagttatca ttaataaacc agatggagaa gatgtttata aaggagttcc taaggactac 360
actaaagaag ctgttaatgt tcaaaacttc tacaatgtgt tacttggaaa tgaaagtggc 420
gtcacaggag gaaatggcaa agttgtgaaa agtggtccta atgataatat cttcatctat 480
tatgctgacc atggagctcc tggcttaata gcgatgccca ctggtgatga agttatggca 540
aaagatttca atgaagtctt ggagaagatg cataagagaa aaaaatacaa caagatggtg 600
atctatgttg aagcatgtga atcaggaagt atgtttgaag ggattttaaa gaaaaatctc 660
aacatatacg cagtgactgc tgctaattct aaagagagca gctggggagt ttactgtcct 720
gagtcatatc ctcctcotcc ttctgagatt ggaacttgtc tcggcgatac atttagcatc 780
tcttggcttg aggacagtga ccttcatgac atgagcaaag agactttgga gcaacaatac 840
cacgttgtaa agagaagagt aggatctgat gtaccagaga cttctcatgt atgccgtttc 900
ggaacagaga agatgcttaa agattatctt tcctcttaca ttggaagaaa tcctgaaaac 960
gataacttca ctttcacgga atccttttcc tcaccaatct ctaattctgg cttggtcaat 1020
ccgcgcgata ttcctctgct atacctccag agaaagattc aaaaagctcc aatgggatca 1080
cttgaaagca aagaagctca gaagaaattg cttgacgaaa agaatcatag gaaacaaatc 1140
gatcagagca ttacagacat tctgcggctt tcagttaaac aaaccaatgt cttaaatctc 1200
ttaacttcca caagaacaac aggacagcct cttgtagacg attgggattg cttcaagact 1260
ctagttaata gcttcaagaa tcactgcggt gcaacggtgc attacggatt gaagtataca 1320
ggagcgcttg ccaatatctg caatatggga gtggatgtga agcaaactgt ttcagccatt 1380
gaacaagctt gttcgatgta a 1401
<210> 178 <211> 466 <212> PRT
<213> Arabidopsis thaliana <400> 178
Met Ser Ser Pro Leu Gly His Phe Gln Ile Leu Val Phe Leu His Ala 10 15 Leu Leu Ile Phe Ser Ala Glu Ser Arg Lys Thr Gln Leu Leu Asn Asp 25 30
Asn Asp Val Glu Ser Ser Asp Lys Ser Ala Lys Gly Thr Arg Trp Ala 40 45
Val Leu Val Ala Gly Ser Asn Glu Tyr Tyr Asn Tyr Arg His Gln Ala 50 55 60
Asp Ile Cys His Ala Tyr Gln Ile Leu Arg Lys Gly Gly Leu Lys Asp 65 70 75 80
Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Phe Ser Ser Glu 85 90 95
Asn Pro Arg Pro Gly Val Ile Ile Asn Lys Pro Asp Gly Glu Asp Val 100 105 110
Tyr Lys Gly Val Pro Lys Asp Tyr Thr Lys Glu Ala Val Asn Val Gln 115 120 125
Asn Phe Tyr Asn Val Leu Leu Gly Asn Glu Ser Gly Val Thr Gly Gly 130 135 140
Asn Gly Lys Val Val Lys Ser Gly Pro Asn Asp Asn Ile Phe Ile Tyr 145 150 155 160
Tyr Ala Asp His Gly Ala Pro Gly Leu Ile Ala Met Pro Thr Gly Asp 165 170 175
Glu Val Met Ala Lys Asp Phe Asn Glu Val Leu Glu Lys Met His Lys 180 185 190
Arg Lys Lys Tyr Asn Lys Met Val Ile Tyr Val Glu Ala Cys Glu Ser 195 200 205
Gly Ser Met Phe Glu Gly Ile Leu Lys Lys Asn Leu Asn Ile Tyr Ala 210 215 220
Val Thr Ala Ala Asn Ser Lys Glu Ser Ser Trp Gly Val Tyr Cys Pro 225 230 235 240
Glu Ser Tyr Pro Pro Pro Pro Ser Glu Ile Gly Thr Cys Leu Gly Asp 245 250 255
Thr Phe Ser Ile Ser Trp Leu Glu Asp Ser Asp Leu His Asp Met Ser 260 265 270 Lys Glu Thr Leu Glu Gln Gln Tyr His Val Val Lys Arg Arg Val Gly 275 280 285
Ser Asp Val Pro Glu Thr Ser His Val Cys Arg Phe Gly Thr Glu Lys 290 295 300
Met Leu Lys Asp Tyr Leu Ser Ser Tyr Ile Gly Arg Asn Pro Glu Asn 305 310 315 320
Asp Asn Phe Thr Phe Thr Glu Ser Phe Ser Ser Pro Ile Ser Asn Ser 325 330 335
Gly Leu Val Asn Pro Arg Asp Ile Pro Leu Leu Tyr Leu Gln Arg Lys 340 345 350
Ile Gln Lys Ala Pro Met Gly Ser Leu Glu Ser Lys Glu Ala Gln Lys 355 360 365
Lys Leu Leu Asp Glu Lys Asn His Arg Lys Gln Ile Asp Gln Ser Ile 370 375 380
Thr Asp Ile Leu Arg Leu Ser Val Lys Gln Thr Asn Val Leu Asn Leu 385 390 395 400
Leu Thr Ser Thr Arg Thr Thr Gly Gln Pro Leu Val Asp Asp Trp Asp 405 410 415
Cys Phe Lys Thr Leu Val Asn Ser Phe Lys Asn His Cys Gly Ala Thr 420 425 430
Val His Tyr Gly Leu Lys Tyr Thr Gly Ala Leu Ala Asn Ile Cys Asn 435 440 445
Met Gly Val Asp Val Lys Gln Thr Val Ser Ala Ile Glu Gln Ala Cys 450 455 460
Ser Met 465
<210> 179
<211> 1506
<212> DNA
<213> Oryza sativa
<400> 179
atggcggcgc gcgctcgcct ccgcctcgtc ctgcccccgc tcgcggcgct gctcctcttc gcgcacctcg ccgccgtcgc ggtggcgcgg ccgcggtggg aggaggaggg cagcaacctc cgcctgccgt cggagcgcgc cgtggcggct ggcgcggcgg cggacgacgc tgccgaggcc 180
gccgagggca ccaggtgggc cgtcctcatc gccggctcca acggctacta caactaccgc 240
caccaggcgg atgtctgcca tgcctaccag atcatgaaga ggggogggct caaggacgag 300
aacatcatcg tcttcatgta cgatgacatc gcgcacaacc cggagaatcc gaggcctggt 360
gtcatcatca accatcccca gggtggcgat gtctatgctg gggtcccgaa ggattacact 420
gggaaggagg ttaatgtcaa aaacttgttt gctgttctgc tcggtaacaa aactgctgtc 480
aaaggtggga gtggcaaagt cctggacagt ggccccaacg atcatatttt cattttttac 540
agtgaccatg ggggtcctgg tgtccttggg atgccaacct atccatacct ctacggtgat 600
gatcttgtag atgttctgaa gaagaagcat gctgctggga cgtacaaaag cctggtcttt 660
taccttgaag cctgtgaatc tggaagcatc tttgagggtc tattgccaaa tggcatcaat 720
gtttatgcca ccactgcatc aaacgctgat gagagcagct ggggaacata ctgccctggg 780
gagtacccga gcccacctcc ggagtacgac acatgcctag gggacttgta cagcgttgct 840
tggatggaag acagcgatgt ccacaacctg agaactgaat cactcaagca gcagtacaat 900
ctcgtcaagg aaaggacatc tgtgcagcac acatattact ctgggtcaca tgtgatggaa 960
tacggttctt tagagctgaa tgcccatcat gtgttcatgt acatgggttc caatccggct 1020
aacgacaatg ctacatttgt ggaagataac tcgttgccat cgttctcaag ggctgttaat 1080
cagcgggatg ctgacctggt ttacttctgg cagaagtacc gcaaattgcc tgagagttct 1140
cctgagaaaa acgaagctcg gaagcaattg cttgaaatga tggcacacag atctcatgtt 1200
gacaacagtg ttgagctgat cggaaacctt ctctttggct ctgaggaagg cccaagggtt 1260
ctaaaggctg ttcgtgcaac tggcgaacct cttgttgatg actggagttg tctcaagtct 1320
atggtacgca ctttcgaagc acaatgcggc tcgctagcgc agtatggaat gaagcatatg 1380
cgttcctttg caaacatctg caatgctggc atctctgctg aagcgatggc aaaggttgct 1440
gcgcaggctt gcaccagcat tccctccaac ccctggagtt ccacccatag gggttttagt 1500
gcttaa 1506
<210> 180 <211> 510 <212> PRT <213> Oryza sativa
<400> 180
Met Ala Ala Arg Ala Arg Leu Arg Leu Val Leu Pro Pro Leu Ala Ala 10 15
Leu Leu Leu Phe Ala His Leu Ala Ala Val Ala Val Ala Arg Pro Arg 25 30 Tirp Glu Glu Glu Gly Ser Asn Leu Arg Leu Pro Ser Glu Arg Ala Val 40 45
Ala Ala Gly Ala Ala Ala Asp Asp Ala Ala Glu Ala Ala Glu Gly Thr 50 55 60
Arg Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Tyr Asn Tyr Arg 65 70 75 80
His Gln Ala Asp Val Cys His Ala Tyr Gln Ile Met Lys Arg Gly Gly 85 90 95
Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala His 100 105 110
Asn Pro Glu Asn Pro Arg Pro Gly Val Ile Ile Asn His Pro Gln Gly 115 120 125
Gly Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Lys Glu Val 130 135 140
Asn Val Lys Asn Leu Phe Ala Val Leu Leu Gly Asn Lys Thr Ala Val 145 150 155 160
Lys Gly Gly Ser Gly Lys Val Leu Asp Ser Gly Pro Asn Asp His Ile 165 170 175
Phe Ile Phe Tyr Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro 180 185 190
Thr Tyr Pro Tyr Leu Tyr Gly Asp Asp Leu Val Asp Val Leu Lys Lys 195 200 205
Lys His Ala Ala Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala 210 215 220
Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Asn Gly Ile Asn 225 230 235 240
Val Tyr Ala Thr Thr Ala Ser Asn Ala Asp Glu Ser Ser Trp Gly Thr 245 250 255
Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu Tyr Asp Thr Cys 260 265 270
Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp Val His 275
280
285
Asn Leu Arg Thr Glu Ser Leu Lys Gln Gln Tyr Asn Leu Val Lys Glu 290 295 300
Arg Thr Ser Val Gln His Thr Tyr Tyr Ser Gly Ser His Val Met Glu 305 310 315 320
Tyr Gly Ser Leu Glu Leu Asn Ala His His Val Phe Met Tyr Met Gly 325 330 335
Ser Asn Pro Ala Asn Asp Asn Ala Thr Phe Val Glu Asp Asn Ser Leu 340 345 350
Pro Ser Phe Ser Arg Ala Val Asn Gln Arg Asp Ala Asp Leu Val Tyr 355 360 365
Phe Trp Gln Lys Tyr Arg Lys Leu Pro Glu Ser Ser Pro Glu Lys Asn 370 375 380
Glu Ala Arg Lys Gln Leu Leu Glu Met Met Ala His Arg Ser His Val 385 390 395 400
Asp Asn Ser Val Glu Leu Ile Gly Asn Leu Leu Phe Gly Ser Glu Glu 405 410 415
Gly Pro Arg Val Leu Lys Ala Val Arg Ala Thr Gly Glu Pro Leu Val 420 425 430
Asp Asp Trp Ser Cys Leu Lys Ser Met Val Arg Thr Phe Glu Ala Gln 435 440 445
Cys Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg Ser Phe Ala 450 455 460
Asn lie Cys Asn Ala Gly Ile Ser Ala Glu Ala Met Ala Lys Val Ala 465 470 475 480
Ala Gln Ala Cys Thr Ser Ile Pro Ser Asn Pro Trp Ser Ser Thr His 485 490 495
Arg Gly Phe Ser Ala Ser Pro Leu Ala Gln Gly Tyr Ser Ala 500 505 510
<210> 181
<211> 1506
<212> DNA
<213> Oryza sativa <400> 181
atggcggcgc gcgctcgcct ccgcctcgtc ctgcccccgc tcgcggcgct gctcctcttc 60
gcgcacctcg ccgccgtcgc ggtggcgcgg ccgcggtggg aggaggaggg cagcaacctc 120
cgcctgccgt cggagcgcgc cgtggcggct ggcgcggcgg cggacgacgc tgccgaggcc 180
gccgagggca ccaggtgggc cgtcctcatc gccggctcca acggctacta caactaccgc 240
caccaggcgg atgtctgcca tgcctaccag atcatgaaga ggggcgggct caaggacgag 300
aacatcatcg tcttcatgta cgatgacatc gcgcacaacc cggagaatcc gaggcctggt 360
gtcatcatca accatcccca gggtggcgat gtctatgctg gggtcccgaa ggattacact 420
gggaaggagg ttaatgtcaa aaacttgttt gctgttctgc tcggtaacaa aactgctgtc 480
aaaggtggga gtggcaaagt cctggacagt ggccccaacg atcatatttt cattttttac 540
agtgaccatg ggggtcctgg tgtccttggg atgccaacct atccatacct ctacggtgat 600
gatcttgtag atgttctgaa gaagaagcat gctgctggga cgtacaaaag cctggtcttt 660
taccttgaag cctgtgaatc tggaagcatc tttgagggtc tattgccaaa tggcatcaat 720
gtttatgcca ccactgcatc aaacgctgat gagagcagct ggggaacata ctgccctggg 780
gagtacccga gcccacctcc ggagtacgac acatgcctag gggacttgta cagcgttgct 840
tggatggaag acagcgatgt ccacaacctg agaactgaat cactcaagca gcagtacaat 900
ctcgtcaagg aaaggacatc tgtgcagcac acatattact ctgggtcaca tgtgatggaa 960
tacggttctt tagagctgaa tgcccatcat gtgttcatgt acatgggttc caatccggct 1020
aacgacaatg ctacatttgt ggaagataac tcgttgccat cgttctcaag ggctgttaat 1080
cagcgggatg ctgacctggt ttacttctgg cagaagtacc gcaaattgcc tgagagttct 1140
cctgagaaaa acgaagctcg gaagcaattg cttgaaatga tggcacacag atctcatgtt 1200
gacaacagtg ttgagctgat cggaaacctt ctctttggct ctgaggaagg cccaagggtt 12 60
ctaaaggctg ttcgtgcaac tggcgaacct cttgttgatg actggagttg tctcaagtct 1320
atggtacgca ctttcgaagc acaatgcggc tcgctagcgc agtatggaat gaagcatatg 1380
cgttcctttg caaacatctg caatgctggc atctctgctg aagcgatggc aaaggttgct 1440
gcgcaggctt gcaccagcat tccctccaac ccctggagtt ccacccatag gggttttagt 1500
gcttaa 1506
<210> 182 <211> 394 <212> PRT <213> Oryza sativa
<400> 182
Met Tyr Asp Asp Ile Ala Asn Asn Ile Leu Asn Pro Arg Pro Gly Val 15
Ile Val Asn His Pro Gln Gly Glu Asp Val Tyr Ala Gly Val Pro Lys 25 30
Asp Tyr Thr Gly Asp Glu Val Thr Ala Lys Asn Phe Tyr Ala Val Leu 40 45
Leu Gly Asn Lys Thr Ala Val Thr Gly Gly Ser Arg Lys Val Ile Asp 50 55 60
Ser Lys Pro Asn Asp His Ile Phe Ile Phe Tyr Ser Asp His Gly Gly 65 70 75 80
Pro Gly Val Leu Gly Met Pro Asn Leu Pro Tyr Leu Tyr Ala Ala Asp 85 90 95
Phe Met Lys Val Leu Gln Glu Lys His Ala Ser Asn Thr Tyr Ala Lys 100 105 110
Met Val Ile Tyr Val Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly 115 120 125
Leu Met Pro Glu Asp Leu Asn Ile Tyr Val Thr Thr Ala Ser Asn Ala 130 135 140
Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Met Glu Pro Ser Pro 145 150 155 160
Pro Ser Glu Tyr Ile Thr Cys Leu Gly Asp Leu Tyr Ser Val Ser Trp 165 170 175
Met Glu Asp Ser Glu Thr His Asn Leu Lys Glu Glu Ser Ile Lys Lys 180 185 190
Gln Tyr Glu Val Val Lys Lys Arg Thr Ser Asp Met Asn Ser Tyr Gly 195 200 205
Ala Gly Ser His Val Met Glu Tyr Gly Asp Arg Thr Phe Lys Asp Asp 210 215 220
Lys Leu Tyr Leu Tyr Gln Gly Phe Asp Pro Ala Asn Ala Glu Val Lys 225 230 235 240
Asn Lys Leu Ser Trp Glu Gly Pro Lys Ala Ala Val Asn Gln Arg Asp 245 250 255 Ala Asp Leu Leu Phe Leu Trp Arg Arg Tyr Glu Leu Leu His Asp Lys
Ser Glu Glu Lys Leu Lys Ala Leu Arg Glu Ile Ser Asp Thr Val Met
His Arg Lys Leu Leu Asp Ser Ser Val Asp Leu Val Gly Lys Leu Leu
Phe Gly Phe Gly Asn Gly Pro Ser Val Leu Gln Ala Val Arg Pro Ser
Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys Arg Met Val Arg
Ile Phe Glu Ser His Cys Gly Pro Leu Thr Gln Tyr Gly Met Lys His
Met Arg Ala Phe Ala Asn Ile Cys Asn Asn Gly Ile Ser Gly Ala Ser
Met Lys Glu Ala Ser Ile Ala Thr Cys Ser Ser His Asn Ser Gly Arg
Trp Ser Ser Leu Val Gln Gly Tyr Ser Ala
<210> 183
<211> 1494
<212> DNA
<213> Oryza sativa
<400> 183
atggctgcgc ggtgctgggt atggggcttc gtcgtcgcgc tcctggctgt ggcggcggcg 60
gcggatgggg aggaggagga ggggaagtgg gagccgctga ttcggatgcc gacggaggaa 120
ggggacgacg ctgaggctgc tgctcccgct cctgctcctg cggcggcgga ttacgggggg 180
acgaggtggg cggtgctcgt cgccggctcc tccggctacg ggaactaccg gcaccaggcc 240
gatgtgtgcc atgcgtacca gattctgcag aagggaggag tgaaggagga gaacattgtg 300
gtgtttatgt atgatgacat tgcccataac attctcaatc caaggcctgg gaccatcatc 360
aaccatocta aaggtggaga tgtttatgct ggtgttccaa aggactacac tggtcaccag 420
gtcaccactg agaacttctt tgctgttctc ttgggcaata aaaccgcagt tactggaggg 480
agtgggaagg ttatagacag caaaccagag gatcacatct tcatctatta ctcagatcat 540
gggggtcctg gagttcttgg tatgcctaac ctgccgtatc tttatgctgg tgattttatt 600
aaagtgttac aaaagaaaca tgcttccaac agctactcga aaatggttat atatgtcgaa 660 gcatgtgaaa gtggcagtat cttcgagggc ttaatgccag aaaatcttaa tatttatgtc 720
acaacagcat ccaatgcagt tgagaatagt tggggaacat actgccctgg ggaggaacca 780
tcacctcctc ctgaatatat tacatgtcta ggtgacatgt acagtgttgc ttggatggag 840
gacagtgaga ctcataatct aaagaaggaa actatcgagg atcagtatga gctggttaaa 900
aaaagaacat caaatgcaaa taagttaaat gagggctctc atgtcatgga atatggtgac 960
aagacattca aggatgagaa gctcttcctc tatcaaggtt ttaatcctgc aaatggcaac 1020
atcacaaatg aattgatttg gccagtacca aaggctacag tcaatcaaag agatgccgat 1080
cttcttttca tgtggaagag gtatgagcag ttgaatgggg tgtctgaaga caagctgagg 1140
gctcttaggg agatagaaga caccatagca cacaggaagc atcttgacag cagtatcgat 1200
ttcatcggga agcttgtgtt tggttttgaa aatgggcctt tagcccttga ggctgcaaga 1260
agctctggtc aaccattagt cgacaactgg gattgtttga agaagatggt gcgaattttt 1320
gaatctcaat gtggatcact cactcagtat ggcatgaaat acatgagagc atttgcaaac 1380
atatgcaaca acggtgtctc tgaggccaaa atgatggaag caagtatcaa cgcttgcggc 1440
cgttacaact cggcgagatg gagcccaatg actgaaggag gacacagtgc ttga 1494
<210> 184
<211> 497
<212> PRT
<213> Oryza sativa
<400> 184
Met Ala Ala Arg Cys Trp Val Trp Gly Phe Val Val Ala Leu Leu Ala 10 15
Val Ala Ala Ala Ala Asp Gly Glu Glu Glu Glu Gly Lys Trp Glu Pro 25 30
Leu Ile Arg Met Pro Thr Glu Glu Gly Asp Asp Ala Glu Ala Ala Ala 40 45
Pro Ala Pro Ala Pro Ala Ala Ala Asp Tyr Gly Gly Thr Arg Trp Ala 50 55 60
Val Leu Val Ala Gly Ser Ser Gly Tyr Gly Asn Tyr Arg His Gln Ala 65 70 75 80
Asp Val Cys His Ala Tyr Gln Ile Leu Gln Lys Gly Gly Val Lys Glu 85 90 95
Glu Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala His Asn Ile Leu 100 105 110 Asn Pro Arg Pro Gly Thr Ile Ile Asn His Pro Lys Gly Gly Asp Val 115 120 125
Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly His Gln Val Thr Thr Glu 130 135 140
Asn Phe Phe Ala Val Leu Leu Gly Asn Lys Thr Ala Val Thr Gly Gly 145 150 155 160
Ser Gly Lys Val Ile Asp Ser Lys Pro Glu Asp His Ile Phe Ile Tyr 165 170 175
Tyr Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Asn Leu Pro 180 185 190
Tyr Leu Tyr Ala Gly Asp Phe Ile Lys Val Leu Gln Lys Lys His Ala 195 200 205
Ser Asn Ser Tyr Ser Lys Met Val Ile Tyr Val Glu Ala Cys Glu Ser 210 215 220
Gly Ser Ile Phe Glu Gly Leu Met Pro Glu Asn Leu Asn Ile Tyr Val 225 230 235 240
Thr Thr Ala Ser Asn Ala Val Glu Asn Ser Trp Gly Thr Tyr Cys Pro 245 250 255
Gly Glu Glu Pro Ser Pro Pro Pro Glu Tyr Ile Thr Cys Leu Gly Asp 260 265 270
Met Tyr Ser Val Ala Trp Met Glu Asp Ser Glu Thr His Asn Leu Lys 275 280 285
Lys Glu Thr Ile Glu Asp Gln Tyr Glu Leu Val Lys Lys Arg Thr Ser 290 295 300
Asn Ala Asn Lys Leu Asn Glu Gly Ser His Val Met Glu Tyr Gly Asp 305 310 315 320
Lys Thr Phe Lys Asp Glu Lys Leu Phe Leu Tyr Gln Gly Phe Asn Pro 325 330 335
Ala Asn Gly Asn Ile Thr Asn Glu Leu Ile Trp Pro Val Pro Lys Ala 340 345 350
Thr Val Asn Gln Arg Asp Ala Asp Leu Leu Phe Met Trp Lys Arg Tyr 355 360 365
Glu Gln Leu Asn Gly Val Ser Glu Asp Lys Leu Arg Ala Leu Arg Glu 370 375 380
Ile Glu Asp Thr Ile Ala His Arg Lys His Leu Asp Ser Ser Ile Asp 385 390 395 400
Phe Ile Gly Lys Leu Val Phe Gly Phe Glu Asn Gly Pro Leu Ala Leu 405 410 415
Glu Ala Ala Arg Ser Ser Gly Gln Pro Leu Val Asp Asn Trp Asp Cys 420 425 430
Leu Lys Lys Met Val Arg Ile Phe Glu Ser Gln Cys Gly Ser Leu Thr 435 440 445
Gln Tyr Gly Met Lys Tyr Met Arg Ala Phe Ala Asn Ile Cys Asn Asn 450 455 460
Gly Val Ser Glu Ala Lys Met Met Glu Ala Ser Ile Asn Ala Cys Gly 465 470 475 480
Arg Tyr Asn Ser Ala Arg Trp Ser Pro Met Thr Glu Gly Gly His Ser 485 490 495
Ala
<210> 185 <211> 1425
<212> DNA
<213> Oryza sativa
<400> 185
atggggcgcg gtctcctctg cctgctgctg ctgcagctcg tcggcctcgt cgtcgccggc 60
ggtgggcggt ggcggtggca ggaggagttc ctccggctgc cgtcgtcgga tgagacgacg 120
aggtgggcgg tgctgatcgc ggggtcgaat gggttctata actaccggca ccaggcggac 180
gtgtgccacg cgtaccagat catgaggaag ggaggcgtgg aggagcaaaa catcgtggtg 240
atgatgtacg acgacatcgc ccacaacccc gacaaoccca ggcctgggct catcttcaac 300
cacccttccg gccccgacgt ctacgccggc gtccccaagg attacaccgg cgacgacgtc 360
aacgtcaaca acttcctcgc cgtcctcctc ggcaaccgct ccgccctcao cggctccggc 420
agcggcaagg tcgtcgccag cggccccaac gaccacgtct tcgtctacta cgccgaccac 480
ggcggccccg gcgtcctgag catgccagcc gacggcgagt acctgtacgc cgacgacctg 540 gtcaaggcgc tcaagaagaa gcacgccggc ggcgggtaca agagcctggt cgtgtacgtg 600 gaggcgtgcg agtccggcag catcttcgag ggcctcctgc cttccgacat ctccgtgtac 660 gccaccacgg cctccaacgc ggaggagagc agctggggca cctactgccc cggcgacgac 720 cacgacgccc cggcggcgga gttcgacacc tgcctcgggg acctctacag cgtggcgtgg 780 atggaggacg cggaggcgca ccaggagggg cgcctcgccg agacgctgcg gcagcagtac 840 aggacggtga agaaccggac gtccgacgag ggcacctaca cgctcggctc ccacgtcatg 900 cagtacggcg acatggcgct cgcaccgcag agcctggacc tctactacat ggatacatca 960 cctgcgacgg cgaacgacca caaattagct gctgctggcg ccaaaggcag ccactcctac 1020 actgtgtctg tgaatcagcg cgacgccgat ctgctctact tgtggcgcaa gtaccggaga 1080 gccggcgagg ggacggcaga gaaggtggag gctcgggagc ggcttgtgca ggagatggga 1140 cggcgatcgc gcgtggacag aagcgtggag atgatcgggg gcctcctctt gggcggcgcc 1200 aagcacaagc agcaggttgt gcgggagcgg gctgcgctgg ttgaggactg ggagtgcctc 1260 aggtcgatgg tgcggacgtt cgaggatcag tgtgggtcgc tgggacagta cgggataaag 1320 cacatgcgct ccttcgccaa catctgcaac gccggcgtcc cccaccacgc catggccaag 1380 gccgcctccc tggcctgtcc atcccctcct ccgttacact tatga 1425 <210> 186 <211> 474 <212> PRT <213> Oryza sativa <400> 186 Met Gly Arg 1 Gly Leu Leu Cys Leu Leu Leu Leu 5 10 Gln Leu Val Gly Leu 15 Val Val Ala Gly Gly Gly Arg Tirp Arg Trp Gln 20 25 Glu Glu Phe 30 Leu Arg Leu Pro Ser 35 Ser Asp Glu Thr Thr Arg Trp Ala 40 Val Leu Ile 45 Ala Gly Ser Asn Gly 50 Phe Tyr Asn Tyr Arg His Gln Ala 55 Asp Val Cys 60 His Ala Tyr Gln Ile 65 Met Arg Lys Gly Gly Val Glu Glu 70 75 Gln Asn Ile Val Val 80 Met Met Tyr Asp Asp Ile Ala His Asn Pro Asp 85 90 Asn Pro Arg Pro Gly 95 Leu Ile Phe Asn His Pro Ser Gly Pro Asp Val Tyr Ala Gly Val Pro 100 105 110
Lys Asp Tyr Thr Gly Asp Asp Val Asn Val Asn Asn Phe Leu Ala Val 115 120 125
Leu Leu Gly Asn Arg Ser Ala Leu Thr Gly Ser Gly Ser Gly Lys Val 130 135 140
Val Ala Ser Gly Pro Asn Asp His Val Phe Val Tyr Tyr Ala Asp His 145 150 155 160
Gly Gly Pro Gly Val Leu Ser Met Pro Ala Asp Gly Glu Tyr Leu Tyr 165 170 175
Ala Asp Asp Leu Val Lys Ala Leu Lys Lys Lys His Ala Gly Gly Gly 180 185 190
Tyr Lys Ser Leu Val Val Tyr Val Glu Ala Cys Glu Ser Gly Ser Ile 195 200 205
Phe Glu Gly Leu Leu Pro Ser Asp Ile Ser Val Tyr Ala Thr Thr Ala 210 215 220
Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Asp Asp 225 230 235 240
His Asp Ala Pro Ala Ala Glu Phe Asp Thr Cys Leu Gly Asp Leu Tyr 245 250 255
Ser Val Ala Trp Met Glu Asp Ala Glu Ala His Gln Glu Gly Arg Leu 260 265 270
Ala Glu Thr Leu Arg Gln Gln Tyr Arg Thr Val Lys Asn Arg Thr Ser 275 280 285
Asp Glu Gly Thr Tyr Thr Leu Gly Ser His Val Met Gln Tyr Gly Asp 290 295 300
Met Ala Leu Ala Pro Gln Ser Leu Asp Leu Tyr Tyr Met Asp Thr Ser 305 310 315 320
Pro Ala Thr Ala Asn Asp His Lys Leu Ala Ala Ala Gly Ala Lys Gly 325 330 335
Ser His Ser Tyr Thr Val Ser Val Asn Gln Arg Asp Ala Asp Leu Leu 340 345 350 Tyr Leu Trp Arg Lys Tyr Arg Arg Ala Gly Glu Gly Thr Ala Glu Lys
Val Glu Ala Arg Glu Arg Leu Val Gln Glu Met Gly Arg Arg Ser Arg
Val Asp Arg Ser Val Glu Met Ile Gly Gly Leu Leu Leu Gly Gly Ala
Lys His Lys Gln Gln Val Val Arg Glu Arg Ala Ala Leu Val Glu Asp
Trp Glu Cys Leu Arg Ser Met Val Arg Thr Phe Glu Asp Gln Cys Gly
Ser Leu Gly Gln Tyr Gly Ile Lys His Met Arg Ser Phe Ala Asn Ile
Cys Asn Ala Gly Val Pro His His Ala Met Ala Lys Ala Ala Ser Leu
Ala Cys Pro Ser Pro Pro Pro Leu His Leu
<210> 187 <211> 1419 <212> DNA
<213> Populus trichocarpa <400> 187
atggagaccc acaaggccta ttttttgtct gctattttag tgcttgcgat gctgtctttt 60
ctacatgtac agagtgttca agccgcccgg ttgagcccgg ttgaaccaag gattcttatg 120
ccaacaggga aagatgagcc agaagtcgat gatgatggtg aagaaattgg ctcgagatgg 180
gcggttcttg tggccggttc aagtggttat ggaaattaca ggcatcaggc ggatgtctgc 240
catgcatatc aactattaag aaaaggcggg ataaaagaag agaacatggt ggtgtttatg 300
tatgatgata tagccatgca tcatttgaac ccaaggcctg gagttatcat caaccatcca 360
caaggagatg atgtttatgc tggtgtgcct aaggattaca ctggtgaaca ggttaataca 420
gagaatctgt atgcagtact tcttggtaac aagagtgctg tcaagggtgg aagtggcaag 480
gttgtggata gcaagcccaa tgacaggatc ttcttgtact attctgatca tggaggtcct 540
ggagttcttg gaatgccaaa tatgcctttt ctatatgcaa tggatttcat cgaggttctg 600
aagaagaaac atgcatctgg gagctacaaa gaaatggtaa tgtatataga agcttgcgag 660
agtgggagca tcttcgaagg gatcatgcct aaggacctaa acatttacgt gacgacagca 720
tcaaatgcgg aagagaggga tctgtacagt gttgcttgga tggaagatag tgaaacacac 780 aatctgaaga aagaaacaat taagcagcaa tatcattcgg tgaaagagag gacttccaat 840 tacaatgcat tcacttctgg atcccatgtg atgcaatatg ggaacgaaag cctcaaagga 900 gagaagcttt ttttgtatca aggtttcgat ccagctagtg taaacttccc tccaaacaat 960 ggccacattg gtgcgcgtat ggatgttgtt aaccagagag atgcagagct tgttttcctc 1020 tggcaaatgt acaaaagagc tgaaggtggg tcagaaaaga agacccaaat cctcaatcag 1080 attaaagaga caatgaggca tagaactcac ttggacagca gcatggaatt gatcggaaca 1140 ctattattag gacctaaaaa aggttccacc atccttaaat ctgttaggga acccgattcg 1200 cccctagtag atgactggag atgcttaaaa tcaatggttc gattgtttga aacacattgt 1260 ggatcactga ctcagtatgg aatgaaacac atgcgagcat ttgccaacat ttgcaatggt 1320 ggcgtctctc tagcctccat ggaggaagct tgtgtggccg cttgtagtgg ccatgatgct 1380 ggggaa c tgc atccttcaaa ccaaggttac agtgcttaa 1419 <210> 188 <211> 472 <212> PRT <213> Populus trichocarpa <400> 188 Met Glu Thr 1 His Lys Ala Tyr Phe Leu Ser Ala 5 10 Ile Leu Val Leu Ala 15 Met Leu Ser Phe Leu His Val Gln Ser Val Gln 20 25 Ala Ala Arg 30 Leu Ser Pro Val Glu 35 Pro Arg Ile Leu Met Pro Thr Gly 40 Lys Asp Glu 45 Pro Glu Val Asp Asp 50 Asp Gly Glu Glu Ile Gly Ser Arg 55 Trp Ala Val 60 Leu Val Ala Gly Ser 65 Ser Gly Tyr Gly Asn Tyr Arg His 70 75 Gln Ala Asp Val Cys 80 His Ala Tyr Gln Leu Leu Arg Lys Gly Gly Ile 85 90 Lys Glu Glu Asn Met 95 Val Val Phe Met Tyr Asp Asp Ile Ala Met His 100 105 His Leu Asn 110 Pro Arg Pro Gly Val 115 Ile Ile Asn His Pro Gln Gly Asp 120 Asp Val Tyr 125 Ala Gly Val Pro Lys Asp Tyr Thr Gly Glu Gln Val Asn Thr Glu Asn Leu Tyr 130 135 140
Ala Val Leu Leu Gly Asn Lys Ser Ala Val Lys Gly Gly Ser Gly Lys 145 150 155 160
Val Val Asp Ser Lys Pro Asn Asp Arg Ile Phe Leu Tyr Tyr Ser Asp 165 170 175
His Gly Gly Pro Gly Val Leu Gly Met Pro Asn Met Pro Phe Leu Tyr 180 185 190
Ala Met Asp Phe Ile Glu Val Leu Lys Lys Lys His Ala Ser Gly Ser 195 200 205
Tyr Lys Glu Met Val Met Tyr Ile Glu Ala Cys Glu Ser Gly Ser Ile 210 215 220
Phe Glu Gly Ile Met Pro Lys Asp Leu Asn Ile Tyr Val Thr Thr Ala 225 230 235 240
Ser Asn Ala Glu Glu Arg Asp Leu Tyr Ser Val Ala Trp Met Glu Asp 245 250 255
Ser Glu Thr His Asn Leu Lys Lys Glu Thr Ile Lys Gln Gln Tyr His 260 265 270
Ser Val Lys Glu Arg Thr Ser Asn Tyr Asn Ala Phe Thr Ser Gly Ser 275 280 285
His Val Met Gln Tyr Gly Asn Glu Ser Leu Lys Gly Glu Lys Leu Phe 290 295 300
Leu Tyr Gln Gly Phe Asp Pro Ala Ser Val Asn Phe Pro Pro Asn Asn 305 310 315 320
Gly His Ile Gly Ala Arg Met Asp Val Val Asn Gln Arg Asp Ala Glu 325 330 335
Leu Val Phe Leu Trp Gln Met Tyr Lys Arg Ala Glu Gly Gly Ser Glu 340 345 350
Lys Lys Thr Gln Ile Leu Asn Gln Ile Lys Glu Thr Met Arg His Arg 355 360 365
Thr His Leu Asp Ser Ser Met Glu Leu Ile Gly Thr Leu Leu Leu Gly 370 375 380 Pro Lys Lys Gly Ser Thr Ile Leu Lys Ser Val Arg Glu Pro Asp Ser
Pro Leu Val Asp Asp Trp Arg Cys Leu Lys Ser Met Val Arg Leu Phe
Glu Thr His Cys Gly Ser Leu Thr Gln Tyr Gly Met Lys His Met Arg
Ala Phe Ala Asn Ile Cys Asn Gly Gly Val Ser Leu Ala Ser Met Glu
Glu Ala Cys Val Ala Ala Cys Ser Gly His Asp Ala Gly Glu Leu His
Pro Ser Asn Gln Gly Tyr Ser Ala
<210> 189 <211> 1512 <212> DNA
<213> Populus trichocarpa <400> 189
atgacgcgac tcattgccgg cgtaattttt cttcttattt ctttctgtgg tatcgccgtc 60
ggtgtccgag acatcgttgg tgacgttctc cggttgccat cggaggcttc taggtttttc 120
cgtcccggta aatttaatga tgataatagt gatgatgatt cttccggaac tagatgggcc 180
atcttgcttg ccggatctaa cggttactgg aattaccggc accaggcaga tgtttgtcat 240
gcatatcaac tgctgagaca aggtggattg aaggaagaaa atataatagt tttcatgtac 300
gatgacattg ctgataaccc agagaaccca aggcctggag tcatcatcaa caatccccaa 360
ggagaagatg tttataaagg agttccaaag gattatactg gtccagatgt caccgttgga 420
aacttttttg cggctatcct tggaaacaag acagctctta ccgggggcag tggaaaagtt 480
attgatagtg ggcccaatga ccatattttc atttattata ctgatcatgg aggtcctggg 540
gtgctaggga tgcctaccaa tccttacctt tatgcggatg atttgattga tgtcttaaaa 600
aagaagcatg catccggaao ctataaaagc ttggtgtttt atcttgaagc ctgtgaatcc 660
ggaagcatct ttgagggtct tcttcctcaa ggtctaaata tctatgcaac cacagcatca 720
aatgcagaag agagcagttg gggaacctat tgtcctggag agtatcctag ccctccccca 780
gaatacgaaa cttgtttggg tgacttgtac agtgttgctt ggatggagga tagtgacata 840
cacaatttac ggacagaaac tctgcaccag caatatgaac tggtaaaaag gaggacttcc 900
tatgacaatt ctccctacgg ttcccatgtc atgcaatatg gtgatgttgg acttagcaag 960 gacgacctct tccagtatat gggtacaaac cctgcaaatg ataactacac tttcgtggag 1020 gagaactcct tgaggccaca ttctaaagtt gttaatcagc gtgatgctga tctcgtccac 1080 ttctggacta agtaccgcaa ggccccagaa ggctcttcta ggaaggttga agctcagaag 1140 cagtttgttg aagcaatgtc acatagaatg catattgacc acagcataaa acttattggg 1200 aagctcctct ttggaattga aaaggcctca gaggcattga acaccgtacg tcctgctggg 1260 caacctcttg ttgatgactg ggtctgcctt aagacactgg taaaatttta cagttctcag 1320 cctctgcttt atcacctcct aaccttatgg gatgaaacac atgcgatctc ttgcaaacct 1380 ttgcaatgcc ggaattgtaa aggaacagat ggccgaggca tcagcacaag cttgtgtaag 1440 ctttccttct ggttcatgga gctctcttca caaagggttc agcgcctaat tgaagcagaa 1500 tgtcctattt aa 1512
<210> 190 <211> 503 <212> PRT
<213> Populus trichocarpa <400> 190
Met Thr Arg Leu Ile Ala Gly Val Ile Phe Leu Leu Ile Ser Phe Cys 10 15
Gly Ile Ala Val Gly Val Arg Asp Ile Val Gly Asp Val Leu Arg Leu 25 30
Pro Ser Glu Ala Ser Arg Phe Phe Arg Pro Gly Lys Phe Asn Asp Asp 40 45
Asn Ser Asp Asp Asp Ser Ser Gly Thr Arg Trp Ala Ile Leu Leu Ala 50 55 60
Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Val Cys His 65 70 75 80
Ala Tyr Gln Leu Leu Arg Gln Gly Gly Leu Lys Glu Glu Asn Ile Ile 85 90 95
Val Phe Met Tyr Asp Asp Ile Ala Asp Asn Pro Glu Asn Pro Arg Pro 100 105 110
Gly Val Ile Ile Asn Asn Pro Gln Gly Glu Asp Val Tyr Lys Gly Val 115 120 125
Pro Lys Asp Tyr Thr Gly Pro Asp Val Thr Val Gly Asn Phe Phe Ala 130 135 140 Ala Ile Leu Gly Asn Lys Thr Ala Leu Thr Gly Gly Ser Gly Lys Val 145 150 155 160
Ile Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His 165 170 175
Gly Gly Pro Gly Val Leu Gly Met Pro Thr Asn Pro Tyr Leu Tyr Ala 180 185 190
Asp Asp Leu Ile Asp Val Leu Lys Lys Lys His Ala Ser Gly Thr Tyr 195 200 205
Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe 210 215 220
Glu Gly Leu Leu Pro Gln Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ser 225 230 235 240
Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro 245 250 255
Ser Pro Pro Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val 260 265 270
Ala Trp Met Glu Asp Ser Asp Ile His Asn Leu Arg Thr Glu Thr Leu 275 280 285
His Gln Gln Tyr Glu Leu Val Lys Arg Arg Thr Ser Tyr Asp Asn Ser 290 295 300
Pro Tyr Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Leu Ser Lys 305 310 315 320
Asp Asp Leu Phe Gln Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Tyr 325 330 335
Thr Phe Val Glu Glu Asn Ser Leu Arg Pro His Ser Lys Val Val Asn 340 345 350
Gln Arg Asp Ala Asp Leu Val His Phe Trp Thr Lys Tyr Arg Lys Ala 355 360 365
Pro Glu Gly Ser Ser Arg Lys Val Glu Ala Gln Lys Gln Phe Val Glu 370 375 380
Ala Met Ser His Arg Met His Ile Asp His Ser Ile Lys Leu Ile Gly 385 390 395 400 Lys Leu Leu Phe Gly Ile Glu Lys Ala Ser Glu Ala Leu Asn Thr Val
Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Val Cys Leu Lys Thr
Leu Val Lys Phe Tyr Ser Ser Gln Pro Leu Leu Tyr His Leu Leu Thr
Leu Trp Asp Glu Thr His Ala Ile Ser Cys Lys Pro Leu Gln Cys Arg
Asn Cys Lys Gly Thr Asp Gly Arg Gly Ile Ser Thr Ser Leu Cys Lys
Leu Ser Phe Trp Phe Met Glu Leu Ser Ser Gln Arg Val Gln Arg Leu
Ile Glu Ala Glu Cys Pro Ile 500
<210> 191 <211> 1590 <212> DNA
<213> Populus trichocarpa <400> 191
atgttgagtc ctggaagttg gaacctctct gtatattgca tgcccctata ttctaatttc 60
tttctagtcg tcagaaagct ggttgattac ttgaattgca gtatgagcag cagctcctat 120
ctgtgtggct atggctatgg cacatttctt ttcctaatcg cattgttaag ttccatagct 180
caaagtcagg gagtgatcat caacagtact agtgcgtcaa gcttgccatc gagtgttaga 240
agagactcca ctaccgctga aggaaaacaa tgggccgttt tggttgccgg atcggctggt 300
tatgaaaatt acaggcatoa ggctgatgta tgccatgcat accaaatact gaagaaaggt 360
gggttgaaag atgaaaacat cattgtttto atgtatgatg acattgcgtt ccatgttgat 420
aatccoaggc ccggcatcat catcaacaaa ccttttggtc atgatgttta tgcaggagtc 480
cccaaggatt atactggaga taactgtaca gtggacaact tatttgctgt acttctggga 540
aacaaatctg ctcttactgg agggagtggc aaggttgtgg atagtggtcc aaatgacaac 600
attttcatat actatgctga tcatggtgct ccaggtttag tcggtatgoc tattgggaaa 660
gacctgtatg ccaaagacct catacaagtg ttgaagaagc agcaggaagc taattcgtat 720
aaaagcatgg tattctacct tgaagcttgt gagtctggga gtatgttcga aggtcttctt 780
ccaagtaact ggagcatata tgcaattact gctgcaaatg gagaggagag tagctatgga 840 atatattgcc caggatacta ccctgctcct cccccagaat ttcttacttg cttgggagat 900 gtatttagca tttcttggat ggaggatagt gatttgcacg acatgagcca ggaaactctg 960 cagcagcaat atgaagtggt tcggagaagg acaggatttg attatgaaga taggtctcat 1020 gtcatgcaat atggaaacat ggagcttagt aaggagctgc tctcttctta cttgggcaca 1080 aacgctgcaa acgataacta cgctaccaac attaatatcg aagaataccc ttctatgatc 1140 ccaagagctt ttgaccaacg cgaagcaact cttcttcatt tctggcacaa gtatcaagaa 1200 gcccccgatg gatctgataa gaaggccgag gctcacaagg acctacttcg catacattct 1260 catataaggc atgtggatcg tagcctaagc catattgctt caactctgtt tggggatgaa 1320 aacgcagcaa atgcaatgaa gcatgttaga ccttctgggc aacctcttgt tgatgactgg 1380 gattgcttga agggccttgt ggaagcttat gagaaacagt gtggaggtct gtcatggtat 1440 ggaaagaagt acacgagagt gatagcaaac atgtgcaatg ctgggataaa tgtggagcaa 1500 atgatcggtg catccaccag agcatgctca tcaaggacca ccaccaccac tcctactaga 1560 ggctcccttc aaaacgaatt tgacaaatag 1590
<210> 192 <211> 529 <212> PRT
<213> Populus trichocarpa <400> 192
Met Leu Ser Pro Gly Ser Trp Asn Leu Ser Val Tyr Cys Met Pro Leu 10 15
Tyr Ser Asn Phe Phe Leu Val Val Arg Lys Leu Val Asp Tyr Leu Asn 25 30
Cys Ser Met Ser Ser Ser Ser Tyr Leu Cys Gly Tyr Gly Tyr Gly Thr 40 45
Phe Leu Phe Leu Ile Ala Leu Leu Ser Ser Ile Ala Gln Ser Gln Gly 50 55 60
Val Ile Ile Asn Ser Thr Ser Ala Ser Ser Leu Pro Ser Ser Val Arg 65 70 75 80
Arg Asp Ser Thr Thr Ala Glu Gly Lys Gln Trp Ala Val Leu Val Ala 85 90 95
Gly Ser Ala Gly Tyr Glu Asn Tyr Arg His Gln Ala Asp Val Cys His 100 105 110 Ala Tyr Gln Ile Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile 115 120 125
Val Phe Met Tyr Asp Asp Ile Ala Phe His Val Asp Asn Pro Arg Pro 130 135 140
Gly Ile Ile Ile Asn Lys Pro Phe Gly His Asp Val Tyr Ala Gly Val 145 150 155 160
Pro Lys Asp Tyr Thr Gly Asp Asn Cys Thr Val Asp Asn Leu Phe Ala 165 170 175
Val Leu Leu Gly Asn Lys Ser Ala Leu Thr Gly Gly Ser Gly Lys Val 180 185 190
Val Asp Ser Gly Pro Asn Asp Asn Ile Phe Ile Tyr Tyr Ala Asp His 195 200 205
Gly Ala Pro Gly Leu Val Gly Met Pro Ile Gly Lys Asp Leu Tyr Ala 210 215 220
Lys Asp Leu Ile Gln Val Leu Lys Lys Gln Gln Glu Ala Asn Ser Tyr 225 230 235 240
Lys Ser Met Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe 245 250 255
Glu Gly Leu Leu Pro Ser Asn Trp Ser Ile Tyr Ala Ile Thr Ala Ala 260 265 270
Asn Gly Glu Glu Ser Ser Tyr Gly Ile Tyr Cys Pro Gly Tyr Tyr Pro 275 280 285
Ala Pro Pro Pro Glu Phe Leu Thr Cys Leu Gly Asp Val Phe Ser Ile 290 295 300
Ser Trp Met Glu Asp Ser Asp Leu His Asp Met Ser Gln Glu Thr Leu 305 310 315 320
Gln Gln Gln Tyr Glu Val Val Arg Arg Arg Thr Gly Phe Asp Tyr Glu 325 330 335
Asp Arg Ser His Val Met Gln Tyr Gly Asn Met Glu Leu Ser Lys Glu 340 345 350
Leu Leu Ser Ser Tyr Leu Gly Thr Asn Ala Ala Asn Asp Asn Tyr Ala 355 360 365 Thr Asn Ile Asn Ile Glu Glu Tyr Pro Ser Met Ile Pro Arg Ala Phe 370 375 380
Asp Gln Arg Glu Ala Thr Leu Leu His Phe Trp His Lys Tyr Gln Glu 385 390 395 400
Ala Pro Asp Gly Ser Asp Lys Lys Ala Glu Ala His Lys Asp Leu Leu 405 410 415
Arg Ile His Ser His Ile Arg His Val Asp Arg Ser Leu Ser His Ile 420 425 430
Ala Ser Thr Leu Phe Gly Asp Glu Asn Ala Ala Asn Ala Met Lys His 435 440 445
Val Arg Pro Ser Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys 450 455 460
Gly Leu Val Glu Ala Tyr Glu Lys Gln Cys Gly Gly Leu Ser Trp Tyr 465 470 475 480
Gly Lys Lys Tyr Thr Arg Val Ile Ala Asn Met Cys Asn Ala Gly Ile 485 490 495
Asn Val Glu Gln Met Ile Gly Ala Ser Thr Arg Ala Cys Ser Ser Arg 500 505 510
Thr Thr Thr Thr Thr Pro Thr Arg Gly Ser Leu Gln Asn Glu Phe Asp 515 520 525
Lys
<210> 193
<211> 1443
<212> DNA
<213> Solanum lycopersicum
<400> 193 atggttcacg tcgccggagt tttcatcctc gtcggaatcg ccgtgcttgc cgccgtcgaa ggacgtaatg ttttgaaact tccgtcggaa gcttccagat tcttcgatga cgcagatgac tctgttggaa ccagatgggc cgtccttctc gccggatcaa atggttattg gaattataga catcaggctg atgtatgcca tgcgtatcag ctattgagaa aaggtggtct caaagatgaa aatattattg tcttcatgta tgatgacatt gctcaccatg aagagaaccc aagaccagga gttattatta atagtcctgc cggtgaggat gtttacgaag gagttcctaa ggattacacg
60 120 180 240 300 360 ggaga tga tg ttaatgtgca caacttttta gctgttctcc ttggtaacaa aactgctctt 420 actggaggta gcggaaaggt ggtgaatagt ggtccaaatg atcatatttt catattctat 480 agtgatcatg gtggccctgg cgtgcttggg atgcctacca atccttatct atatgccgat 540 gatctaattg ctgtgttgaa aaagaagcat gcccctggga catataaaag cttggtattg 600 tacattgaag cttgcgagtc tggaagtata tttgagggac ttcttcctaa tggtctaaat 660 atttatgcca caacagcttc aaatgctgaa gaaagcagct ggggaaccta ttgtcctgga 720 gaatatccta gtcctcctcc tgaatatgag acttgcttgg gtgatttgta tgctgtttcc 780 tggatggagg acagtgaaat gcacaacttg cggactgaaa atttgaggca gcagtatcac 840 ttggtcaaaa agagaactgc aaatggaaat actgcctatg gttcccatgt catgcaattt 900 ggtgatctac aactgagtat ggagtctcta ttcaggttta tgggtacaaa tcctgcaaat 960 gataactaca cttatgtaga tgacaattcc ttgttggcat catcaaaggc tgtcaaccag 1020 cgtgatgcag atcttttaca tttctgggac aagttccgca aggctcctga aggctctgct 1080 cggaaagttg aagctcagaa acaattcact gaagctatgt cacacagaat gcacctagat 1140 gaacgcattg cccttgttgg taagcttctg tttggaattc aaaaaggtcc tgaggtgctg 1200 aagcatgttc gatctgcggg tcagcctctt gttgatgatt gggcctgcct taaatctttt 1260 gtaagaacat ttgagtcgca ctgcggatcg ttatcccaat atggaatgaa acacatgcgt 1320 tccattgcca atatctgcaa tgctggaatt cagatggagc agatggtgga ggcatcagca 1380 caagcttgtc ctagcatccc ttccaatatt tggagttccc tccacagggg ctttagtgcg 1440 taa 1443
<210> 194 <211> 480 <212> PRT
<213> Solaniam Iycopersicum <400> 194
Met Val His Val Ala Gly Val Phe Ile Leu Val Gly Ile Ala Val Leu 10 15
Ala Ala Val Glu Gly Arg Asn Val Leu Lys Leu Pro Ser Glu Ala Ser 25 30
Arg Phe Phe Asp Asp Ala Asp Asp Ser Val Gly Thr Arg Trp Ala Val 40 45
Leu Leu Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp 50 55 60
Val Cys His Ala Tyr Gln Leu Leu Arg Lys Gly Gly Leu Lys Asp Glu 65 70 75 80
Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala His His Glu Glu Asn 85 90 95
Pro Axg Pro Gly Val Ile Ile Asn Ser Pro Ala Gly Glu Asp Val Tyr 100 105 110
Glu Gly Val Pro Lys Asp Tyr Thr Gly Asp Asp Val Asn Val His Asn 115 120 125
Phe Leu Ala Val Leu Leu Gly Asn Lys Thr Ala Leu Thr Gly Gly Ser 130 135 140
Gly Lys Val Val Asn Ser Gly Pro Asn Asp His Ile Phe Ile Phe Tyr 145 150 155 160
Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Thr Asn Pro Tyr 165 170 175
Leu Tyr Ala Asp Asp Leu Ile Ala Val Leu Lys Lys Lys His Ala Pro 180 185 190
Gly Thr Tyr Lys Ser Leu Val Leu Tyr Ile Glu Ala Cys Glu Ser Gly 195 200 205
Ser Ile Phe Glu Gly Leu Leu Pro Asn Gly Leu Asn Ile Tyr Ala Thr 210 215 220
Thr Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly 225 230 235 240
Glu Tyr Pro Ser Pro Pro Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu 245 250 255
Tyr Ala Val Ser Trp Met Glu Asp Ser Glu Met His Asn Leu Arg Thr 260 265 270
Glu Asn Leu Arg Gln Gln Tyr His Leu Val Lys Lys Arg Thr Ala Asn 275 280 285
Gly Asn Thr Ala Tyr Gly Ser His Val Met Gln Phe Gly Asp Leu Gln 290 295 300
Leu Ser Met Glu Ser Leu Phe Arg Phe Met Gly Thr Asn Pro Ala Asn 305 310 315 320 Asp Asn Tyr Thr Tyr Val Asp Asp Asn Ser Leu Leu Ala Ser Ser Lys 325 330 335
Ala Val Asn Gln Arg Asp Ala Asp Leu Leu His Phe Trp Asp Lys Phe 340 345 350
Arg Lys Ala Pro Glu Gly Ser Ala Arg Lys Val Glu Ala Gln Lys Gln 355 360 365
Phe Thr Glu Ala Met Ser His Arg Met His Leu Asp Glu Arg Ile Ala 370 375 380
Leu Val Gly Lys Leu Leu Phe Gly Ile Gln Lys Gly Pro Glu Val Leu 385 390 395 400
Lys His Val Arg Ser Ala Gly Gln Pro Leu Val Asp Asp Trp Ala Cys 405 410 415
Leu Lys Ser Phe Val Arg Thr Phe Glu Ser His Cys Gly Ser Leu Ser 420 425 430
Gln Tyr Gly Met Lys His Met Arg Ser Ile Ala Asn Ile Cys Asn Ala 435 440 445
Gly Ile Gln Met Glu Gln Met Val Glu Ala Ser Ala Gln Ala Cys Pro 450 455 460
Ser Ile Pro Ser Asn Ile Trp Ser Ser Leu His Arg Gly Phe Ser Ala 465 470 475 480
<210> 195
<211> 1473
<212> DNA
<213> Nicotiana tabacum
<400> 195
atgattcgtc acattgccgg tactctgttc ataattggac tcgcacttaa cgtcgccgtt 60 tcagagagcc gtaatgtttt gaaacttccg tcagaagttt ctagattctt cggtgccgat 120 aagagtaatg tcggcgatga teatgatgac gactccgtcg gtaccagatg ggctatcctg 180 ctagccggat ctaacggtta ttggaattac cgtcaccagg ctgatatatg ccacgcatat 240 caactgttga agaagggtgg tctcaaagat gagaacattg ttgtgtttat gtacgatgac 300 attgctaaca atgaagagaa tccaagacca ggagttatca ttaatagccc tcatggtgag 360 gatgtttaca aaggagttcc taaggattac actggggatg atgttactgt taacaacttt 420 tttgctgctc tccttgggaa caaaactgct cttagtggag gcagcggaaa ggtggtgaat 480 agtggtccga atgatcatat cctcatcttc tatagtgatc atggcggccc tggagtgctt 540 gggatgccta ccgatcctta cctctatgca aacgatctga ttgacgtgtt gaagaagaag 600 catgcttccg gaacatataa aagcttggta ttttaccttg aagcttgtga gtctggtagt 660 atatttgagg gtcttcttcc tgaaggttta aatatctatg ccacaacagc atcaaatgct 720 gaagagagta gctggggaac ctattgtcct ggagagtatc ccagtcctcc tattgaatat 780 gagacttgcc tgggtgactt gtacagtatt tcctggatgg aggacagtga attacacaac 840 ctgcggactg aaagtctgaa gcagcagtat cacctggtca gagagagaac tgctactggg 900 aatcctgttt atggttcaca tgtcatgcaa tatggtgatc tacatctcag caaggatgct 960 ctatacttat atatgggtac aaatcctgct aatgataatt atacttttat ggatgacaat 1020 tccttgcgag tatcaaaggc cgttaaccag cgtgatgcag atcttctgca tttttggtac 1080 aagttccgca aggctcctga gggctctgtg aggaaaattg aggctcagaa acagttaaat 1140 gaagcaatat cacatagagt gcacttggac aacagcatag cccttgtcgg taaacttcta 1200 tttggaatta aaaaaggtcc agaggtgcta agtagtgtcc gccctgctgg tcagcctctt 1260 gttgatgact gggactgcct taaatccttt gtaagaacat ttgagacaca ttgtggatcg 1320 ttatcccagt atggaatgaa acatatgcgc tccattgcta acatatgcaa cgttggaatt 1380 aagatggcgc agatggtgga ggcatcagca caagcttgtc ccagctttgc atccaatact 1440 tggagttccc tccagagggg ttttagtgca tga 1473
<210> 196 <211> 490 <212> PRT
<213> Nicotiana tabacum <400> 196
Met Ile Arg His Ile Ala Gly Thr Leu Phe Ile Ile Gly Leu Ala Leu 10 15
Asn Val Ala Val Ser Glu Ser Arg Asn Val Leu Lys Leu Pro Ser Glu 25 30
Val Ser Arg Phe Phe Gly Ala Asp Lys Ser Asn Val Gly Asp Asp His 40 45
Asp Asp Asp Ser Val Gly Thr Arg Trp Ala Ile Leu Leu Ala Gly Ser 50 55 60
Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys His Ala Tyr 65 70 75 80
Gln Leu Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe 85 90 95 Met Tyr Asp Asp Ile Ala Asn Asn Glu Glu Asn Pro Arg Pro Gly Val 100 105 110
Ile Ile Asn Ser Pro His Gly Glu Asp Val Tyr Lys Gly Val Pro Lys 115 120 125
Asp Tyr Thr Gly Asp Asp Val Thr Val Asn Asn Phe Phe Ala Ala Leu 130 135 140
Leu Gly Asn Lys Thr Ala Leu Ser Gly Gly Ser Gly Lys Val Val Asn 145 150 155 160
Ser Gly Pro Asn Asp His Ile Leu Ile Phe Tyr Ser Asp His Gly Gly 165 170 175
Pro Gly Val Leu Gly Met Pro Thr Asp Pro Tyr Leu Tyr Ala Asn Asp 180 185 190
Leu Ile Asp Val Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser 195 200 205
Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly 210 215 220
Leu Leu Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala 225 230 235 240
Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro 245 250 255
Pro Ile Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Ile Ser Trp 260 265 270
Met Glu Asp Ser Glu Leu His Asn Leu Arg Thr Glu Ser Leu Lys Gln 275 280 285
Gln Tyr His Leu Val Arg Glu Arg Thr Ala Thr Gly Asn Pro Val Tyr 290 295 300
Gly Ser His Val Met Gln Tyr Gly Asp Leu His Leu Ser Lys Asp Ala 305 310 315 320
Leu Tyr Leu Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Tyr Thr Phe 325 330 335
Met Asp Asp Asn Ser Leu Arg Val Ser Lys Ala Val Asn Gln Arg Asp 340 345 350
Ala Asp Leu Leu His Phe Trp Tyr Lys Phe Arg Lys Ala Pro Glu Gly 355 360 365
Ser Val Arg Lys Ile Glu Ala Gln Lys Gln Leu Asn Glu Ala Ile Ser 370 375 380
His Arg Val His Leu Asp Asn Ser Ile Ala Leu Val Gly Lys Leu Leu 385 390 395 400
Phe Gly Ile Lys Lys Gly Pro Glu Val Leu Ser Ser Val Arg Pro Ala 405 410 415
Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys Ser Phe Val Arg 420 425 430
Thr Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly Met Lys His 435 440 445
Met Arg Ser Ile Ala Asn Ile Cys Asn Val Gly Ile Lys Met Ala Gln 450 455 460
Met Val Glu Ala Ser Ala Gln Ala Cys Pro Ser Phe Ala Ser Asn Thr 465 470 475 480
Trp Ser Ser Leu Gln Arg Gly Phe Ser Ala 485 490
<210> 197
<211> 1467
<212> DNA
<213> Saccharum officinarum
<400> 197
atggtgaecg ctcgcctccg cctcgcgctg ctactactct ccgtgttcct ctgctccgcg 60 tgggcgcgcc cacgcctcga gccgaccatc cgcctgccgt ccgagcgcgc cgcggcggcg 120 gccggcgacg aaacggacga cgccgtcggg acacggtggg ccgtgctcgt cgccggctcc 180 agcggctact acaactaccg ccaccaggca gacatctgcc atgcgtacca gattatgaag 240 aagggaggac tcaaggacga gaacataatt gtcttcatgt acgatgacat cgcgcatagc 300 gcagagaatc cgaggcccgg tgtcgtcatc aaccatcccc agggtggcga tgtctatgct 360 ggggttccaa aggattacac tgggcgacag gtcagtgtca acaatttctt cgctgttctg 420 cttggcaaca aaactgctct gacaggtggg agcggcaagg ttgtggacag tggccccaat 480 gatcatatct ttgttttcta cagtgaccat ggaggtcctg gtgtccttgg aatgcctacg 540 tatccatatc tctacggtga tgacctcgta gatgtcctga agaagaagca tgctgctggg 600 tcctacaaaa gcctggtctt ttaccttgaa gcatgcgaat ctgggagcat ctttgagggc 660 ctcctgccag atgacatcaa tgtgtatgcg accaccgcgt caaatgcaga ggagagcagc 720 tgggggacgt actgccctgg cgagttccca agccctccac cggagtatga cacttgcttg 780 ggagacctgt atagtgtttc ttggatggaa gacagtgatt tccacaatct gcgaac tgaa 840 tctctcaagc agcagtacaa gttggteaag gataggacag cggctcagga tacatteagc 900 tatggttccc atgtgatgca atatggttca ttggagttga atgttcagaa attgttttcg 960 tacattggca caaaccctgc taacgatggc aacacatttg tagaagataa ctcattgcca 1020 tcattttcaa aagctgttaa teagegtgat gctgatcttg tctacttctg gcagaagtac 1080 cggaaattgg ctgatggctc atctaagaaa aatgaagctc ggaaggaatt gcttgaagtg 1140 atgtcccacc ggtctcatgt tgacaacagt gttgaactca ttggaagcct tctctttggc 1200 tctgaggacg gtccaagggt tctgaaagcc gtccgtgcag ctggtgaacc tctggttgat 1260 gattggagtt gcctcaagtc catggttcgt acttttgagg cgcaatgtgg gtcgttggcg 1320 cagtatggga tgaagcacat gagaaccttc gcaaacatct gcaacgctgg catccttcct 1380 gaagcagtgt caaaggttgc cgcteaggct tgcaccagca ttccttccaa cccctggagc 1440 tctatcgaca agggttttag cgcctaa 1467
<210> 198 <211> 488 <212> PRT
<213> Saccharum officinarum <400> 198
Met Val Thr Ala Arg Leu Arg Leu Ala Leu Leu Leu Leu Ser Val Phe 10 15
Leu Cys Ser Ala Trp Ala Arg Pro Arg Leu Glu Pro Thr Ile Arg Leu 25 30
Pro Ser Glu Arg Ala Ala Ala Ala Ala Gly Asp Glu Thr Asp Asp Ala 40 45
Val Gly Thr Arg Trp Ala Val Leu Val Ala Gly Ser Ser Gly Tyr Tyr 50 55 60
Asn Tyr Arg His Gln Ala Asp Ile Cys His Ala Tyr Gln Ile Met Lys 65 70 75 80
Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp 85 90 95 Ile Ala His Ser Ala Glu Asn Pro Arg Pro Gly Val Val Ile Asn His 100 105 110
Pro Gln Gly Gly Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly 115 120 125
Arg Gln Val Ser Val Asn Asn Phe Phe Ala Val Leu Leu Gly Asn Lys 130 135 140
Thr Ala Leu Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn 145 150 155 160
Asp His Ile Phe Val Phe Tyr Ser Asp His Gly Gly Pro Gly Val Leu 165 170 175
Gly Met Pro Thr Tyr Pro Tyr Leu Tyr Gly Asp Asp Leu Val Asp Val 180 185 190
Leu Lys Lys Lys His Ala Ala Gly Ser Tyr Lys Ser Leu Val Phe Tyr 195 200 205
Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Asp 210 215 220
Asp Ile Asn Val Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser Ser 225 230 235 240
Trp Gly Thr Tyr Cys Pro Gly Glu Phe Pro Ser Pro Pro Pro Glu Tyr 245 250 255
Asp Thr Cys Leu Gly Asp Leu Tyr Ser Val Ser Trp Met Glu Asp Ser 260 265 270
Asp Phe His Asn Leu Arg Thr Glu Ser Leu Lys Gln Gln Tyr Lys Leu 275 280 285
Val Lys Asp Arg Thr Ala Ala Gln Asp Thr Phe Ser Tyr Gly Ser His 290 295 300
Val Met Gln Tyr Gly Ser Leu Glu Leu Asn Val Gln Lys Leu Phe Ser 305 310 315 320
Tyr Ile Gly Thr Asn Pro Ala Asn Asp Gly Asn Thr Phe Val Glu Asp 325 330 335
Asn Ser Leu Pro Ser Phe Ser Lys Ala Val Asn Gln Arg Asp Ala Asp 340 345 350 Leu Val Tyr Phe Trp Gln Lys Tyr Arg Lys Leu Ala Asp Gly Ser Ser 355 360 365
Lys Lys Asn Glu Ala Arg Lys Glu Leu Leu Glu Val Met Ser His Arg 370 375 380
Ser His Val Asp Asn Ser Val Glu Leu Ile Gly Ser Leu Leu Phe Gly 385 390 395 400
Ser Glu Asp Gly Pro Arg Val Leu Lys Ala Val Arg Ala Ala Gly Glu 405 410 415
Pro Leu Val Asp Asp Trp Ser Cys Leu Lys Ser Met Val Arg Thr Phe 420 425 430
Glu Ala Gln Cys Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg 435 440 445
Thr Phe Ala Asn Ile Cys Asn Ala Gly Ile Leu Pro Glu Ala Val Ser 450 455 460
Lys Val Ala Ala Gln Ala Cys Thr Ser Ile Pro Ser Asn Pro Trp Ser 465 470 475 480
Ser Ile Asp Lys Gly Phe Ser Ala 485
<210> 199
<211> 1461
<212> DNA
<213> Zea mays
<400> 199 atggtggccg ctcgcctccg cctcgcgctg ctactctccg tctgcctctg ctccgcgtgg gcgcgcccac gcctcgagac ggccatccgc ctgccgtcgc agcgcgcggc ggcggccgac gaaacggacg acggcgccgt cgggacccgc tgggctgtgc tcatcgcagg ctccagcggc tactacaact accgccacca ggcggacatc tgccatgcat accagatcat gaagaagggc ggactcaagg atgagaacat cattgtcttc atgtacgatg acatcgcgca tagcccggag aatccgaggc ctggtgtcat catcaaccat ccccagggtg gcgacgtcta tgctggggtg ccaaaggatt acacggggcg agatgtcaac gtcgacaatt tcttcgctgt tctgcttggc aacaaaactg ctctcagggg tgggagcggc aaggttgtgg acagtggccc cgatgatcat atctttgttt tctacagtga ccatgggggt cctggtgtcc ttggaatgcc tacgtatcca tatctctatg gtgatgacct cgtagatgtc ctgaagaaga agcatgctgc cgggacctac
60 120 180 240 300 360 420 480 540 600 aaaagcctgg tcttttacct tgaagcatgc gaatctggga gcatctttga gggcctcctg 660 ccgaatgaca tcaatgtgta tgcgaccacc gcgtcaaatg cagaggagag cagctggggg 720 acatactgcc ctggcgagtt cccgagccct ccaccggagt atgacacctg cttgggtgac 780 ctgtacagtg ttgcttggat ggaagacagt gatttccaca atctgcgaac tgaatctctc 840 aagcagcagt acaagttggt caaggatagg acagcggttc atgacacgtt cagctatggt 900 tcccatgtga tgcaatatgg cgcactggag ttgaatgttc agcatttgtt ttcgtacatt 960 ggcacagacc ctgctaacga tggcaacacg tttatagaag ataactcact gccatcgttc 1020 tcaaaagccg tcaatcagcg cgacgctgac cttgtctact tctggcagaa gtaccggaaa 1080 tttgctgata gcccgcctgc gaaaagcgag gctcggaagg aactgcttga agtgatggcc 1140 cacaggtctc atgttgacag cagcgttgag ctcatcggaa gccttctctt tggctctgag 1200 gacggtccaa gggttctgaa agccgtccgt gcacctggtg aacctctggt tgatgattgg 1260 agctgcctca agtccatagt tcgcactttt gaggcgcgat gcgggtcctt ggcgcagtat 1320 gggatgaagc acatgcgatc cttcgcgaac atgtgcaacg ctggcatcct tcctgaagca 1380 gtgtcgaagg tggccgctca ggcctgcagc agcattccgt ccaacccctg gagctctatc 1440 cacaagggtt ttagcgctta a 1461
<210> 200
<211> 486
<212> PRT
<213> Zea mays
<400> 200
Met Val Ala Ala Arg Leu Arg Leu Ala Leu Leu Leu Ser Val Cys Leu 10 15
Cys Ser Ala Trp Ala Arg Pro Arg Leu Glu Thr Ala Ile Arg Leu Pro 25 30
Ser Gln Arg Ala Ala Ala Ala Asp Glu Thr Asp Asp Gly Ala Val Gly 40 45
Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Ser Gly Tyr Tyr Asn Tyr 50 55 60
Arg His Gln Ala Asp Ile Cys His Ala Tyr Gln Ile Met Lys Lys Gly 65 70 75 80
Gly Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala 85 90 95 His Ser Pro Glu Asn Pro Arg Pro Gly Val Ile Xle Asn His Pro Gln 100 105 110
Gly Gly Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Arg Asp 115 120 125
Val Asn Val Asp Asn Phe Phe Ala Val Leu Leu Gly Asn Lys Thr Ala 130 135 140
Leu Arg Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asp Asp His 145 150 155 160
Ile Phe Val Phe Tyr Ser Asp His Gly Gly Pro Gly Val Leu Gly Met 165 170 175
Pro Thr Tyr Pro Tyr Leu Tyr Gly Asp Asp Leu Val Asp Val Leu Lys 180 185 190
Lys Lys His Ala Ala Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu 195 200 205
Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Asn Asp Ile 210 215 220
Asn Val Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly 225 230 235 240
Thr Tyr Cys Pro Gly Glu Phe Pro Ser Pro Pro Pro Glu Tyr Asp Thr 245 250 255
Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp Phe 260 265 270
His Asn Leu Arg Thr Glu Ser Leu Lys Gln Gln Tyr Lys Leu Val Lys 275 280 285
Asp Arg Thr Ala Val His Asp Thr Phe Ser Tyr Gly Ser His Val Met 290 295 300
Gln Tyr Gly Ala Leu Glu Leu Asn Val Gln His Leu Phe Ser Tyr Ile 305 310 315 320
Gly Thr Asp Pro Ala Asn Asp Gly Asn Thr Phe Ile Glu Asp Asn Ser 325 330 335
Leu Pro Ser Phe Ser Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Val 340 345 350 Tyr Phe Trp Gln Lys Tyr Arg Lys Phe Ala Asp Ser Pro Pro Ala Lys 355 360 365
Ser Glu Ala Arg Lys Glu Leu Leu Glu Val Met Ala His Arg Ser His 370 375 380
Val Asp Ser Ser Val Glu Leu Ile Gly Ser Leu Leu Phe Gly Ser Glu 385 390 395 400
Asp Gly Pro Arg Val Leu Lys Ala Val Arg Ala Pro Gly Glu Pro Leu 405 410 415
Val Asp Asp Trp Ser Cys Leu Lys Ser Ile Val Arg Thr Phe Glu Ala 420 425 430
Arg Cys Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg Ser Phe 435 440 445
Ala Asn Met Cys Asn Ala Gly Ile Leu Pro Glu Ala Val Ser Lys Val 450 455 460
Ala Ala Gln Ala Cys Ser Ser Ile Pro Ser Asn Pro Trp Ser Ser Ile 465 470 475 480
His Lys Gly Phe Ser Ala 485
<210> 201 <211> 1446 <212> DNA <213> Zea mays
<400> 201
atggtggccg atcgcctccg cctcgcgctg ctgctctccg cgtgcctctg ctccgcgtgg 60
gcgcgcccac gcctcgagcc gaccatccgc ctgccgtccg accgcgcggc ggccgacgac 120
gccgtcggga cccggtgggc cgtgctcatc gccggctcca acggctacta caactaccgc 180
caccaggcgg acatctgcca tgcataccag atcatgaaga agggcggact taaggacgag 240
aacatcgttg tcttcatgta cgatgacatc gcgcatagcc cggaaaatcc gaggcctggt 300
gtcatcataa atcatcccca gggtggcgac gtctatgctg gggtgccaaa ggattacact 360
gggcgagatg tcaacgtcga caatttcttc gctgttctgc ttggcaacaa aactgctctc 420
a^gggtggga gcggcaaggt tgtggacagt ggccccaatg atcatatatc tgttttctac 480
agtgaccatg ggggtcctgg cgtccttgga atgcctacgt atccatatct ctatggtgat 540
gacctcgtag atgtcctgaa gaagaagcat gctgccggga cctacaaaag cctggtcttt 600 taccttgaag catgcgaatc tgggagcatc tttgagggcc tcctgccgaa tgacataaat 660 gtgtatgcga ccaccgcgtc aaatgcagag gagagtagct gggggacgta ctgccctggc 720 gagttcccga gccctccgcc ggagtatgac acttgcttgg gagacctgta tagtgttgct 780 tggatggaag acagtgattt ccacaatctg cgaactgaat ctctcaagca gcaatacaac 840 ttggtcaagg ataggacagc ggttcaggat acattcagct atggctccca tgtgatgcaa 900 tatggttcat tggggttgaa tgttaagcat ctgttttcgt acattggcac aaaccctgct 960 aacgatgaca acacgttcat agaagacaac tcgttgccat cattctcaaa ggctgttaat 1020 cagcgcgacg ctgaccttgt ctacttctgg cagaagtacc ggaaattggc agacagctca 1080 cctgagaaaa atgaagctcg gagggagttg cttgaagtga tggcccacag gtctcatgtt 1140 gacagcagcg ttgagctcat tggaagcctt ctctttggct ctgaggacgg tccaagggtt 1200 ctgaaagccg tccgtgcagc tggtgagcct ctggtcgatg attggagctg tctcaagtcc 1260 acggttcgta cttttgaggc gcaatgtggg tcgttggcgc agtatgggat gaagcacatg 1320 cggtccttcg caaacatctg caacgctggc atccttcctg aagcagtgtc gaaggtcgct 1380 gctcaggctt gcaccagcat tccttccaac ccctggagtt ctatccacaa gggttttagc 1440 gcctaa 1446
<210> 202
<211> 481
<212> PRT
<213> Zea mays
<400> 202
Met Val Ala Asp Arg Leu Arg Leu Ala Leu Leu Leu Ser Ala Cys Leu 10 15
Cys Ser Ala Trp Ala Arg Pro Arg Leu Glu Pro Thr Ile Arg Leu Pro 25 30
Ser Asp Arg Ala Ala Ala Asp Asp Ala Val Gly Thr Arg Trp Ala Val 40 45
Leu Ile Ala Gly Ser Asn Gly Tyr Tyr Asn Tyr Arg His Gln Ala Asp 50 55 60
Ile Cys His Ala Tyr Gln Ile Met Lys Lys Gly Gly Leu Lys Asp Glu 65 70 75 80
Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala His Ser Pro Glu Asn 85 90 95
Pro Arg Pro Gly Val Ile Ile Asn His Pro Gln Gly Gly Asp Val Tyr IOO 105 lio
Ala Gly Val Pro Lys Asp Tyr Thr Gly Arg Asp Val Asn Val Asp Asn 115 120 125
Phe Phe Ala Val Leu Leu Gly Asn Lys Thr Ala Leu Arg Gly Gly Ser 130 135 140
Gly Lys Val Val Asp Ser Gly Pro Asn Asp His Ile Ser Val Phe Tyr 145 150 155 160
Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Thr Tyr Pro Tyr 165 170 175
Leu Tyr Gly Asp Asp Leu Val Asp Val Leu Lys Lys Lys His Ala Ala 180 185 190
Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly 195 200 205
Ser Ile Phe Glu Gly Leu Leu Pro Asn Asp Ile Asn Val Tyr Ala Thr 210 215 220
Thr Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly 225 230 235 240
Glu Phe Pro Ser Pro Pro Pro Glu Tyr Asp Thr Cys Leu Gly Asp Leu 245 250 255
Tyr Ser Val Ala Trp Met Glu Asp Ser Asp Phe His Asn Leu Arg Thr 260 265 270
Glu Ser Leu Lys Gln Gln Tyr Asn Leu Val Lys Asp Arg Thr Ala Val 275 280 285
Gln Asp Thr Phe Ser Tyr Gly Ser His Val Met Gln Tyr Gly Ser Leu 290 295 300
Gly Leu Asn Val Lys His Leu Phe Ser Tyr Ile Gly Thr Asn Pro Ala 305 310 315 320
Asn Asp Asp Asn Thr Phe Ile Glu Asp Asn Ser Leu Pro Ser Phe Ser 325 330 335
Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Val Tyr Phe Trp Gln Lys 340 345 350 Tyr Arg Lys Leu Ala Asp Ser Ser Pro Glu Lys Asn Glu Ala Arg Arg
Glu Leu Leu Glu Val Met Ala His Arg Ser His Val Asp Ser Ser Val
Glu Leu Ile Gly Ser Leu Leu Phe Gly Ser Glu Asp Gly Pro Arg Val
Leu Lys Ala Val Arg Ala Ala Gly Glu Pro Leu Val Asp Asp Trp Ser
Cys Leu Lys Ser Thr Val Arg Thr Phe Glu Ala Gln Cys Gly Ser Leu
Ala Gln Tyr Gly Met Lys His Met Arg Ser Phe Ala Asn Ile Cys Asn
Ala Gly Ile Leu Pro Glu Ala Val Ser Lys Val Ala Ala Gln Ala Cys
Thr Ser Ile Pro Ser Asn Pro Trp Ser Ser Ile His Lys Gly Phe Ser
Ala
<210> 203 <211> 1485 <212> DNA <213> Zea mays
<400> 203
atggctgtgc ggtggtgcct cctcctgctc gtgttagtgt tggctgcggc cgcggcttgc 60
gcggagaagg gggagtggga cccggtgatt cggatgcctg gggagaagga gcctgcaggg 120
tcgcactcgc acagcggcga gggattcgat ggggaggtgg atgacgccgt cgggacgagg 180
tgggcagtgc tcgttgccgg gtcctccggc tacggcaact acaggcacca ggctgatata 240
tgtcatgcgt accagatact gcaaaaagga ggcataaaag aggagaacat tgtggtgttt 300
atgtatgatg acattgccaa tagcgcactc aacccaaggc agggggttat catcaaccac 360
ccagagggcg aagatgttta tgctggtgtt ccaaaggact acactgggga ccaagtcact 420
actaagaact tctatgcagt totcttgggc aacaaaactg cagtcactgg aggcagcagg 480
aaggtcatca atagcaaacc agatgaccat atttttatct attactcaga tcacgggggc 540
cctggtgttc ttggtatgcc caatctacca tatctttatg ctggtgactt catgaaggtg 600
ttaagagaaa aacatgcttc aaacagctat gccaaaatgg ttatatatat tgaagcatgt 660 gaaagtggca gtatatttga gggattaatg ccagaagacc ttaatattta tgtcacgacg 720 gcatccaatg cagaagaaag tagctggggt acatactgtc caggaatgga accaccgcct 780 ccttctgagt acattacctg cctaggtgat ctatatagtg tctcttggat ggaagacagt 840 gagactaaca atctgaagga ggaaacagta aaggaacaat atgaagtggt gaagaagcgt 900 acttcagact tcaatagcta tggtgcaggc tctcacgtca tggaatatgg tgacaagacc 960 ttoaaggaag agci.ciÇ|Gtt t-ci (.;<-: L L Latcaa ggttttgatc ctgcaaatgc caatgtcaca iü2u aataagctgc tttggtcagg ccaagaggct gtggtcaacc aaagggatgc agatattctc 1080 ttcctatgga agaggtatga gctcttacat gagaagtctg aagagaagca ggaagttctg 1140 agggagatca ccggaacagt aaggcatagg aagcatctgg acaacagcat caacttcatc 1200 ggaaagcttc tcttcggggc tgagaaaggg ccttccacac ttgaggccgt cagacctccc 1260 ggccagccac tcgtcgatga ttgggactgc ttgaagcaaa tggtacggat cttcgaatcc 1320 cattgcggat cgctcactca gtacggtatg aggcatatga gggcgttcgc aaatatatgc 1380 aacagtggca cgcctggcgc ttcgatgaag cgagcgagca tgggtgcttg tggcggctac 1440 aactcggcga gatggagccc gttggctcag ggctacagcg cttga 1485
<210> 204
<211> 494
<212> PRT
<213> Zea mays
<400> 204
Met Ala Val Arg Trp Cys Leu Leu Leu Leu Val Leu Val Leu Ala Ala 10 15
Ala Ala Ala Cys Ala Glu Lys Gly Glu Trp Asp Pro Val Ile Arg Met 25 30
Pro Gly Glu Lys Glu Pro Ala Gly Ser His Ser His Ser Gly Glu Gly 40 45
Phe Asp Gly Glu Val Asp Asp Ala Val Gly Thr Arg Trp Ala Val Leu 50 55 60
Val Ala Gly Ser Ser Gly Tyr Gly Asn Tyr Arg His Gln Ala Asp Ile 65 70 75 80
Cys His Ala Tyr Gln Ile Leu Gln Lys Gly Gly Ile Lys Glu Glu Asn 85 90 95
Ile Val Val Phe Met Tyr Asp Asp Ile Ala Asn Ser Ala Leu Asn Pro 100 105 110 Arg Gln Gly Val Ile Ile Asn His Pro Glu Gly Glu Asp Val Tyr Ala 115 120 125
Gly Val Pro Lys Asp Tyr Thr Gly Asp Gln Val Thr Thr Lys Asn Phe 130 135 140
Tyr Ala Val Leu Leu Gly Asn Lys Thr Ala Val Thr Gly Gly Ser Arg 145 150 15ü 160
Lys Val Ile Asn Ser Lys Pro Asp Asp His Ile Phe Ile Tyr Tyr Ser 165 170 175
Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Asn Leu Pro Tyr Leu 180 185 190
Tyr Ala Gly Asp Phe Met Lys Val Leu Arg Glu Lys His Ala Ser Asn 195 200 205
Ser Tyr Ala Lys Met Val Ile Tyr Ile Glu Ala Cys Glu Ser Gly Ser 210 215 220
Ile Phe Glu Gly Leu Met Pro Glu Asp Leu Asn Ile Tyr Val Thr Thr 225 230 235 240
Ala Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Met 245 250 255
Glu Pro Pro Pro Pro Ser Glu Tyr Ile Thr Cys Leu Gly Asp Leu Tyr 260 265 270
Ser Val Ser Trp Met Glu Asp Ser Glu Thr Asn Asn Leu Lys Glu Glu 275 280 285
Thr Val Lys Glu Gln Tyr Glu Val Val Lys Lys Arg Thr Ser Asp Phe 290 295 300
Asn Ser Tyr Gly Ala Gly Ser His Val Met Glu Tyr Gly Asp Lys Thr 305 310 315 320
Phe Lys Glu Glu Lys Leu Tyr Leu Tyr Gln Gly Phe Asp Pro Ala Asn 325 330 335
Ala Asn Val Thr Asn Lys Leu Leu Trp Ser Gly Gln Glu Ala Val Val 340 345 350
Asn Gln Arg Asp Ala Asp Ile Leu Phe Leu Trp Lys Arg Tyr Glu Leu Leu His Glu Lys Ser Glu Glu Lys Gln Glu Val Leu Arg Glu Ile Thr
Gly Thr Val Arg His Arg Lys His Leu Asp Asn Ser Ile Asn Phe Ile
Gly Lys Leu Ltsu jrhe i=iy Ala uiu J-ys iiiy Fro Ser Thr Leu Glu Ala
Val Arg Pro Pro Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys
Gln Met Val Arg Ile Phe Glu Ser His Cys Gly Ser Leu Thr Gln Tyr
Gly Met Arg His Met Arg Ala Phe Ala Asn Ile Cys Asn Ser Gly Thr
Pro Gly Ala Ser Met Lys Arg Ala Ser Met Gly Ala Cys Gly Gly Tyr
Asn Ser Ala Arg Trp Ser Pro Leu Ala Gln Gly Tyr Ser Ala
<210> 205 <211> 1828 <212> DNA <213> Oryza sativa
<400> 205
gcttgagtca tagggagaaa acaaatcgat catatttgac tcttttccct ccatctctct 60
taccggcaaa aaaagtagta ctggtttata tgtaaagtaa gattctttaa ttatgtgaga 120
tccggcttaa tgcttttctt ttgtcacata tactgcattg caacaattgc catatattca 180
cttctgccat cccattatat agcaactcaa gaatggattg atatatcccc tattactaat 240
ctagacatgt taaggctgag ttgggcagtc catcttocca acccaccacc ttcgtttttc 300
gcgcacatac ttttcaaact actaaatggt gtgtttttta aaaatatttt caatacaaaa 360
gttgctttaa aaaattatat tgatccattt ttttaaaaaa aatagctaat acttaattaa 420
tcacgtgtta aaagaccgct ccgttttgcg tgcaggaggg ataggttcac atcctgcatt 480
accgaacaca gcctaaatct tgttgtctag attcgtagta ctggatatat taaatcatgt 540
tctaagttac tatatactga gatgaataga ataagtaaaa ttagaoccac cttaagtctt 600
gatgaagtta ctactagctg cgtttgggag gacttcccaa aaaaaaaagt attagccatt 660 agcacgtgat taattaagta ctagtttaaa aaacttaaaa aataaattaa tatgattctc 720 ttaagtaact ctcctataga aaacttttac aaaattacac cgtttaatag tttggaaaat 780 atgtcagtaa aaaataagag agtagaagtt atgaaagtta gaaaaagaat tgttttagta 840 gtatacagtt ataaactatt ccctctgttc taaaacataa gggattatgg atggattcga 900 catgtaccag taccatgaat cgaatccaga caagtttttt atgcatattt attctactat 960 aatatatcac atctgctcta aatatcttat atttcgaggt ggagactgtc gctatgtttt 1020 tctgcccgtt gctaagcaca cgccaccccc gatgcgggga cgcctctggc cttcttgcca 1080 cgataattga atggaacttc cacattcaga ttcgataggt gaccgtcgac tccaagtgct 1140 ttgcacaaaa caactccggc ctcccggcca ccagtcacac gactcacggc actaccaccc 1200 ctgactccct gaggcggacc tgccactgtt ctgcatgcga agctatctaa aattctgaag 1260 caaagaaagc acagcacatg ctccgggaca cgcgccaccc ggcggaaaag ggctcggtgt 1320 ggcgatctca cagccgcata tcgcatttca caagccgccc atctccaccg gcttcacgag 1380 gctcatcgcg gcacgaccgc gcacggaacg cacgcggccg acccgcgcgc ctcgatgcgc 1440 gagcccatcc gccgcgtcct ccctttgcct ttgccgctat cctctcggtc gtatcccgtt 1500 tctctgtctt ttgctccccg gcgcgcgcca gttcggagta ccagcgaaac ccggacacct 1560 ggtacacctc cgccggccac aacgcgtgtc ccccctacgt ggccgcgcag cacatgccca 1620 tgcgcgacac gtgcacctcc tcatccaaac tctcaagtct caacggtcct ataaatgcac 1680 ggatagcctc aagctgctcg tcacaaggca agaggcaaga ggcaagagca tccgtattaa 1740 ccagcctttt gagacttgag agtgtgtgtg actcgatcca gcgtagtttc agttcgtgtg 1800 ttggtgagtg attccagcca agtttgcg 1828 <210> 206 <211> 54 <212> DNA <213> Seqüência Artificial <220> <223> iniciador: iniciador direto <400> 206 ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc cacaacgatg acac 54 <210> 207 <211> 50 <212> DNA <213> Seqüência Artificial <220> <223> iniciador: iniciador inverso <400> 207 ggggaccact ttgtacaaga aagctgggtc ggtttagggt ttctatgcac 50 <210> 208 <211> 425 <212> PRT
<213> Arabidopsis thaliana <400> 208
Ser Asn Ser Gly Thr Arg Trp Ala Val Leu Val Ala Gly Ser Ser Gly 10 15
Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys His Ala Tyr Gln Leu 25 30
Leu Arg Lys Gly Gly Leu Lys Glu Glu Asn Ile Val Val Phe Met Tyr 40 45
Asp Asp Ile Ala Asn Asn Tyr Glu Asn Pro Arg Pro Gly Thr Ile Ile 50 55 60
Asn Ser Pro His Gly Lys Asp Val Tyr Gln Gly Val Pro Lys Asp Tyr 65 70 75 80
Thr Gly Asp Asp Val Asn Val Asp Asn Leu Phe Ala Val Ile Leu Gly 85 90 95
Asp Lys Thr Ala Val Lys Gly Gly Ser Gly Lys Val Val Asp Ser Gly 100 105 110
Pro Asn Asp His Ile Phe Ile Phe Tyr Ser Asp His Gly Gly Pro Gly 115 120 125
Val Leu Gly Met Pro Thr Ser Pro Tyr Leu Tyr Ala Asn Asp Leu Asn 130 135 140
Asp Val Leu Lys Lys Lys His Ala Leu Gly Thr Tyr Lys Ser Leu Val 145 150 155 160
Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu 165 170 175
Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu 180 185 190
Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Glu Pro Ser Pro Pro Pro 195 200 205
Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu 210 215 220 Asp Ser Gly Met His Asn Leu Gln Thr Glu Thr Leu His Gln Gln Tyr 225 230 235 240
Glu Leu Val Lys Arg Arg Thr Ala Pro Val Gly Tyr Ser Tyr Gly Ser 245 250 255
His Val Met Gln Tyr Gly Asp Val Gly Ile Ser Lys Asp Asn Leu Asp 260 265 270
Leu Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Phe Thr Phe Ala Asp 275 280 285
Ala Asn Ser Leu Lys Pro Pro Ser Arg Val Thr Asn Gln Arg Asp Ala 290 295 300
Asp Leu Val His Phe Trp Glu Lys Tyr Arg Lys Ala Pro Glu Gly Ser 305 310 315 320
Ala Arg Lys Thr Glu Ala Gln Lys Gln Val Leu Glu Ala Met Ser His 325 330 335
Arg Leu His Ile Asp Asn Ser Val Ile Leu Val Gly Lys Ile Leu Phe 340 345 350
Gly Ile Ser Arg Gly Pro Glu Val Leu Asn Lys Val Arg Ser Ala Gly 355 360 365
Gln Pro Leu Val Asp Asp Trp Asn Cys Leu Lys Asn Gln Val Arg Ala 370 375 380
Phe Glu Arg His Cys Gly Ser Leu Ser Gln Tyr Gly Ile Lys His Met 385 390 395 400
Arg Ser Phe Ala Asn Ile Cys Asn Ala Gly Ile Gln Met Glu Gln Met 405 410 415
Glu Glu Ala Ala Ser Gln Ala Cys Thr 420 425
<210> 209
<211> 5
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo caspases <220>
<221> VARIANTE
<222> (2) . . (2)
<223> /substituir = "Gly"
<400> 209
Glu Ala Cys Glu Ser 1 5
<210> 210
<211> 1128
<212> DNA
<213> Oryza sativa
<400> 210
atgctgcttc cgccgcatcc aggcagaaca ttaccagcct atcatggaga caacagattt 60
cttcttggag cttgtttcct gagtaaactg cctatgctgc gcccaatgaa gttgtctttg 120
gtatgcagtg otaatoccaa caaccatagg tcaagaagtt cggatatcac acgccatcag 180
aagggtggat cagctcggag gaaaagtaag ccttaccagg agaaagatga ctctgagaat 240
attgatgaat tcgatactga tattatgtcc tccaaaaatg gaccaccoat ctctttgaca 300
agcaattccc gtcctcaagc aacatcagtc ccaggggaaa gagagaagga gatagtagag 360
ttgtttaaaa gggttcaagc acaattgcga gcaaggggaa aagggaagga ggagaagaag 420
cctgaacaag caaaagcaca gggtgagagg ggcagtgttg actcccttct aaatctgctt 480
aggaagcact cagtggacca acgaaggaag agcggtgatg agaaagaaca gagtgttgac 540
caaacaaaga gaagcaatga atctggaaat aaacaaaatt caagcatctt cataaagaat 600
gacactcagg aagaacagaa aaagccacat cctgcagcct tcaaaaggcc agcttcaaat 660
tttaggcgaa gatcccctgt tcctaatgta aagttccagc ctgttaccaa tgttgatgcc 720
gaacgagtca tcaataacat caatgatgcc gtacaagagg ctaagccaac tttggaaaat 780
aaggctgcta cagatgaacc agactcggtt tctacattcg aacctaattc tgtaatagaa 840
ccagaaaacc tatctttgga tgaccttgat catatttcag atgatgaacc tgatgcttct 900
gatactgatg aacccagtgg agaatatgat gagccatctt tgcaaatccc aagtgttcca 960
attattgatg aatctcatga taogacactg aaatcttcct taggaggtcc tgatttaagc 1020
actttgaagg tcacagaact aagagaactt gcgaaatctc gaggaatcaa aggatattcc 1080
aagatgaaga agaatgacct ggttgaactg ctgagcaaca tggcttga 1128
<210> 211
<211> 375
<212> PRT
<213> Oryza sativa
<400> 211 Met Leu Leu Pro Pro His Pro Gly Arg Thr Leu Pro Ala Tyr His Gly 10 15
Asp Asn Arg Phe Leu Leu Gly Ala Cys Phe Leu Ser Lys Leu Pro Met 25 30
Leu Arg Pro Met Lys Leu Ser Leu Val Cys Ser Ala Asn Pro Asn Asn 40 45
His Arg Ser Arg Ser Ser Asp Ile Thr Arg His Gln Lys Gly Gly Ser 50 55 60
Ala Arg Arg Lys Ser Lys Pro Tyr Gln Glu Lys Asp Asp Ser Glu Asn 65 70 75 80
Ile Asp Glu Phe Asp Thr Asp Ile Met Ser Ser Lys Asn Gly Pro Pro 85 90 95
Ile Ser Leu Thr Ser Asn Ser Arg Pro Gln Ala Thr Ser Val Pro Gly 100 105 110
Glu Arg Glu Lys Glu Ile Val Glu Leu Phe Lys Arg Val Gln Ala Gln 115 120 125
Leu Arg Ala Arg Gly Lys Gly Lys Glu Glu Lys Lys Pro Glu Gln Ala 130 135 140
Lys Ala Gln Gly Glu Arg Gly Ser Val Asp Ser Leu Leu Asn Leu Leu 145 150 155 160
Arg Lys His Ser Val Asp Gln Arg Arg Lys Ser Gly Asp Glu Lys Glu 165 170 175
Gln Ser Val Asp Gln Thr Lys Arg Ser Asn Glu Ser Gly Asn Lys Gln 180 185 190
Asn Ser Ser Ile Phe Ile Lys Asn Asp Thr Gln Glu Glu Gln Lys Lys 195 200 205
Pro His Pro Ala Ala Phe Lys Arg Pro Ala Ser Asn Phe Arg Arg Arg 210 215 220
Ser Pro Val Pro Asn Val Lys Phe Gln Pro Val Thr Asn Val Asp Ala 225 230 235 240
Glu Arg Val Ile Asn Asn Ile Asn Asp Ala Val Gln Glu Ala Lys Pro 245 250 255 Thr Leu Glu Asn Lys Ala Ala Thr Asp Glu Pro Asp Ser Val Ser Thr
Phe Glu Pro Asn Ser Val Ile Glu Pro Glu Asn Leu Ser Leu Asp Asp
Leu Asp His Ile Ser Asp Asp Glu Pro Asp Ala Ser Asp Thr Asp Glu
Pro Ser Gly Glu Tyr Asp Glu Pro Ser Leu Gln Ile Pro Ser Val Pro
Ile Ile Asp Glu Ser His Asp Thr Thr Leu Lys Ser Ser Leu Gly Gly
Pro Asp Leu Ser Thr Leu Lys Val Thr Glu Leu Arg Glu Leu Ala Lys
Ser Arg Gly Ile Lys Gly Tyr Ser Lys Met Lys Lys Asn Asp Leu Val
Glu Leu Leu Ser Asn Met Ala
<210> 212 <211> 1122 <212> DNA <213> Glycine max
<400> 212
atgtcgcaaa cgctgcacgc tttcgtcgcc aaaaaccttg gatgtggaat ggcatacggc 60
aagtgtctcc catgttcagg tgtttctgga agaactgctg ctgtatattc ctaotcttct 120
ctaggtcatc gcagaattca ttcccatgtc caagttagag gactaaagtg tggctttagg 180
ggtgcatctt ttgtatgtga agcaaagagg aacccagatt tctcaaggca aaacaagcat 240
gggtcctcca gaagcagaaa tcggaatagt gatgggagag acagctttga gagctttgac 300
gacgatatgt tttctttaaa aaatggacca cctgtgtctc tttcaacctc aggaaaattc 360
caggccactt cagcccctgg tcctagggag aaggagattg ttgagctatt taggaaggtc 420
caggctcggc tgcgtgagag ggctgcctcc aaagaagaaa agaaagttga agcctcccga 480
gcacaaagca aagagaacag tactgtggat tcccttctca aactactgaa gaaacattca 540
gttgagcaag tgaagagaag tagtggaggc agaggaaaag attttagttc agaccagttg 600
caagaaagta accaatacaa tggaggacgg aactctaaaa tttctgattt agatagttct 660
ccaaaggatg agccccaaga ggacattgtc ttctcttcct cggtagccag gcctcggtca 720 aatttccaaa gaaggtctcc cgttcctcgt ttaaaatacc agcatgtctc taacgatgag 780 aatgaaatga ctgtagtgcc agtaggtagt gaggatacag agaacaatca ggatcagata 840 gatttgaagc ttgatgacga agctgaatct gactttgaat cggatgttga ttcaaaggat 900 gagtttttct tcccaaacat agggatggct gaattgtctg aggatgatga ttctgagcaa 960 acctataatg atgagagtgt ggaggagcag ccggcagctc aacacaagga tttgagtgca 1020 ctgaagctgt ccgaattgag ggcacttgca aagactcgtg gcctgaaagg attctcaaaa 1080 atgaagaaga gtgacctcgt ggagttgcta actgagacct ga 1122
<210> 213 <211> 373 <212> PRT <213> Glycine max <400> 213
Met Ser Gln Thr Leu His Ala Phe Val Ala Lys Asn Leu Gly Cys Gly 10 15
Met Ala Tyr Gly Lys Cys Leu Pro Cys Ser Gly Val Ser Gly Arg Thr 25 30
Ala Ala Val Tyr Ser Tyr Ser Ser Leu Gly His Arg Arg Ile His Ser 40 45
His Val Gln Val Arg Gly Leu Lys Cys Gly Phe Arg Gly Ala Ser Phe 50 55 60
Val Cys Glu Ala Lys Arg Asn Pro Asp Phe Ser Arg Gln Asn Lys His 65 70 75 80
Gly Ser Ser Arg Ser Arg Asn Arg Asn Ser Asp Gly Arg Asp Ser Phe 85 90 95
Glu Ser Phe Asp Asp Asp Met Phe Ser Leu Lys Asn Gly Pro Pro Val 100 105 110
Ser Leu Ser Thr Ser Gly Lys Phe Gln Ala Thr Ser Ala Pro Gly Pro 115 120 125
Arg Glu Lys Glu Ile Val Glu Leu Phe Arg Lys Val Gln Ala Arg Leu 130 135 140
Arg Glu Arg Ala Ala Ser Lys Glu Glu Lys Lys Val Glu Ala Ser Arg 145 150 155 160
Ala Gln Ser Lys Glu Asn Ser Thr Val Asp Ser Leu Leu Lys Leu Leu 165 170 175
Lys Lys His Ser Val Glu Gln Val Lys Arg Ser Ser Gly Gly Arg Gly 180 185 190
Lys Asp Phe Ser Ser Asp Gln Leu Gln Glu Ser Asn Gln Tyr Asn Gly 195 200 205
Gly Arg Asn Ser Lys Ile Ser Asp Leu Asp Ser Ser Pro Lys Asp Glu 210 215 220
Pro Gln Glu Asp Ile Val Phe Ser Ser Ser Val Ala Arg Pro Arg Ser 225 230 235 240
Asn Phe Gln Arg Arg Ser Pro Val Pro Arg Leu Lys Tyr Gln His Val 245 250 255
Ser Asn Asp Glu Asn Glu Met Thr Val Val Pro Val Gly Ser Glu Asp 260 265 270
Thr Glu Asn Asn Gln Asp Gln Ile Asp Leu Lys Leu Asp Asp Glu Ala 275 280 285
Glu Ser Asp Phe Glu Ser Asp Val Asp Ser Lys Asp Glu Phe Phe Phe 290 295 300
Pro Asn Ile Gly Met Ala Glu Leu Ser Glu Asp Asp Asp Ser Glu Gln 305 310 315 320
Thr Tyr Asn Asp Glu Ser Val Glu Glu Gln Pro Ala Ala Gln His Lys 325 330 335
Asp Leu Ser Ala Leu Lys Leu Ser Glu Leu Arg Ala Leu Ala Lys Thr 340 345 350
Arg Gly Leu Lys Gly Phe Ser Lys Met Lys Lys Ser Asp Leu Val Glu 355 360 365
Leu Leu Thr Glu Thr 370
<210> 214
<211> 640
<212> DNA
<213> tagetes spp
<400> 214
aaagcacaac caccagcaga aacaataaag atttcatgtt agacaaccaa cccgagcaga acagttcatt tacagaagat aaaagtcaaa acgacttgaa taaccaggtc acacacgagg tccaagctac tgaaaaccga tctacaagac ctgtatcaaa tttccaaaag aggtcgccaa tttctagctt caaatacaaa ccagttttga ctggtgaaga gtctttcacc cctgaaccat ttaaaaggaa agaagcaaga catgagcctg agtcaacacc tgaggtcaaa atcaagactg ggtctgagcc agaagttgaa agtcaagcct ttgatgggtt tgatgaaagt tcagatgatg acattgaaga ggttgctgat gagattgacg attcagaaga accaaatgcg attgaagata aggatttgag cagcatgaag ctggttgagt taagagcagt ggctaaatca agaggcatca aggggttgtc taagctgaaa aaagccgagt tattggagtt gctgactagt tgaaagttta catgttatgg aaccttttca ttataatgta ccatagaatt tgagttgttc ttttgatctt ttctatcttt ctatatttat gtgatgttat tatctttatg
<210> 215
<211> 172
<212> PRT
<213> tagetes spp
<400> 215
Ser Arg Asn Asn Lys Asp Phe Met Leu Asp Asn Gln Pro Glu Gln Asn 10 15
Ser Ser Phe Thr Glu Asp Lys Ser Gln Asn Asp Leu Asn Asn Gln Val 25 30
Thr His Glu Val Gln Ala Thr Glu Asn Arg Ser Thr Arg Pro Val Ser 40 45
Asn Phe Gln Lys Arg Ser Pro Ile Ser Ser Phe Lys Tyr Lys Pro Val 50 55 60
Leu Thr Gly Glu Glu Ser Phe Thr Pro Glu Pro Phe Lys Arg Lys Glu 65 70 75 80
Ala Arg His Glu Pro Glu Ser Thr Pro Glu Val Lys Ile Lys Thr Gly 85 90 95
Ser Glu Pro Glu Val Glu Ser Gln Ala Phe Asp Gly Phe Asp Glu Ser 100 105 110
Ser Asp Asp Asp Ile Glu Glu Val Ala Asp Glu Ile Asp Asp Ser Glu 115 120 125
120 180 240 300 360 420 480 540 600 640
Glu Pro Asn Ala Ile Glu Asp Lys Asp Leu Ser Ser Met Lys Leu Val 130 135 140 Glu Leu Arg Ala Val Ala Lys Ser Arg Gly Ile Lys Gly Leu Ser Lys 145 150 155 160
Leu Lys Lys Ala Glu Leu Leu Glu Leu Leu Thr Ser 165 170
<210> 216 <211> 996 <212> DNA <213> Brassica napa
<400> 216
gggtcgacaa cgaaggagct ttttagaata gttcaagctc ggctgcgagc tcgagcagcg 60 accaagatgg aagataaaaa ggcacaagaa gaagaagaag aagcttctaa aggacgggga 120 aaagaaagtg aaactgttga ctctcttctt aagttactaa gaaagcattc gggagagcag 180 agcaaaaaag ttaacagttt taacagccat ggagacagtt cgctacgagg agatcctgtg 240 gacaggaggc aagatcgcag cggaggaaac cttgtcaagt catggaccaa agatcataat 300 gcatcatcat catcatcatc ctttaccagg ccagcgtcaa gcttcagaag aaagtcgcca 360 gtaccaagat ttgaatcacc tcctccgact tattctaatg aggcaacttt tgatgaggca 420 tcgagttaca gcgtgacttg gacccataag aaggatacag cagagtcgca tgacgaacct 480 gaagacgaac ttcaggctga gattgcgcct gagtacgacg aacatgcacc tgaatatgag 540 tcagaacctg accctgtggc agctattctc gaaccagagt cagatctgca tctagacgca 600 tcatcatttt accaagagga ggagcataat gttactttag atgcgttatc cgaggaggag 660 gagtctctgg atgatgctga tgaagaggtt gaggaagaag ctgtaaaaga cgaggacttg 720 agtacattga agctgatgga actgagaggc atagcaaaat caaggggact aaaagggttt 780 tcaaagatga agaaagccca actcgtggag ttgcttagta gtgattccag ctgattcgac 840 ggtgaaagaa tctcaacaaa taataagaac atttactctc gttagtgaca gtgttgaaat 900 gagttaattt ctgtgttctt tcttttacct ggaaatactg gccgtgatca tgtttgttta 960 ctcagatttt aaactttggt ttttgaagat cttcga 996 <210> 217 <211> 255 <212> PRT <213> Brassica napa
<400> 217
Met Glu Asp Lys Lys Ala Gln Glu Glu Glu Glu Glu Ala Ser Lys Gly 10 15
Arg Gly Lys Glu Ser Glu Thr Val Asp Ser Leu Leu Lys Leu Leu Arg 25 30 Lys His Ser Gly Glu Gln Ser Lys Lys Val Asn Ser Phe Asn Ser His 40 45
Gly Asp Ser Ser Leu Arg Gly Asp Pro Val Asp Arg Arg Gln Asp Arg 50 55 60
Ser Gly Gly Asn Leu Val Lys Ser Trp Thr Lys Asp His Asn Ala Ser 65 70 75 80
Ser Ser Ser Ser Ser Phe Thr Arg Pro Ala Ser Ser Phe Arg Arg Lys 85 90 95
Ser Pro Val Pro Arg Phe Glu Ser Pro Pro Pro Thr Tyr Ser Asn Glu 100 105 110
Ala Thr Phe Asp Glu Ala Ser Ser Tyr Ser Val Thr Trp Thr His Lys 115 120 125
Lys Asp Thr Ala Glu Ser His Asp Glu Pro Glu Asp Glu Leu Gln Ala 130 135 140
Glu Ile Ala Pro Glu Tyr Asp Glu His Ala Pro Glu Tyr Glu Ser Glu 145 150 155 160
Pro Asp Pro Val Ala Ala Xle Leu Glu Pro Glu Ser Asp Leu His Leu 165 170 175
Asp Ala Ser Ser Phe Tyr Gln Glu Glu Glu His Asn Val Thr Leu Asp 180 185 190
Ala Leu Ser Glu Glu Glu Glu Ser Leu Asp Asp Ala Asp Glu Glu Val 195 200 205
Glu Glu Glu Ala Val Lys Asp Glu Asp Leu Ser Thr Leu Lys Leu Met 210 215 220
Glu Leu Arg Gly Ile Ala Lys Ser Arg Gly Leu Lys Gly Phe Ser Lys 225 230 235 240
Met Lys Lys Ala Gln Leu Val Glu Leu Leu Ser Ser Asp Ser Ser 245 250 255
<210> 218
<211> 894
<212> DNA
<213> Hordeum vulgare <400> 218
caactctcac tccattagag aacagcaagg aggtcagctt cggttctttg gcagaggaag 60
aagagagaag aaatgggagc aattctcatg cagcatcacc aaatctctcg caatcctcta 120
caaaaagtca tcttccccgg atcatttgct ctccaaagag atattgttct ccatcgcgct 180
ccacgacggg gttctctacc gtgctcatct tcattgacgg tcagagcaga agccaacggg 240
tactcacctt caagaatggc ggtcaagaag cacagcaaag aagagctcat agaattetto 300
ggggccatcc aggccgccat tgccagggac tcgcccaagg cgcccgggag gacgaggaag 360
ccgtcgtcgc cggctgacac gctcgaagag gctggcacga agatgcaacc atacgaggaa 420
ctgcaccaag acgggcagcc aaatttggag gacatgaagg tgcctgagct gagggacatg 480
gcgagggaga gggggatgag aggttactcc aagctgaaga aaggggagct gattgatcgt 540
ctgaggggtg cctggtcgtc tgataattaa caagccttcc tctccgagat aggaacaggc 600
agccgccagt gctggctgtt tggcccaatt ggtgcagctt acaatcgact tttcttgcgt 660
ctgttgtttt ctttgttaga tacagtatct tccaaagagg cagaagctct gcagttggac 720
actaggtctg cattgttttc ttgcatctat cctttgcatg gtctgtttgt actccctccc 780 tacctaaata attgtagttg ggaagtacag agggagtagt tttgttgctt tcattttcgt 840
atcgtcaagt ttctgaattt caacccacct tacgataaaa aaaaaaaaaa aaaa 894
<210> 219 <211> 165 <212> PRT
<213> Hordeiam vulgare <400> 219
Met Gly Ala Ile Leu Met Gln His His Gln Ile Ser Arg Asn Pro Leu
Lys Lys His Ser Lys Glu Glu Leu Ile Glu Phe Phe Gly Ala Ile Gln
Gln Lys Val Ile Phe Pro Gly Ser Phe Ala Leu Gln Arg Asp Ile Val 25 30
Leu His Arg Ala Pro Arg Arg Gly Ser Leu Pro Cys Ser Ser Ser Leu 40 45
Thr Val Arg Ala Glu Ala Asn Gly Tyr Ser Pro Ser Arg Met Ala Val
Ala Ala Ile Ala Arg Asp Ser Pro Lys Ala Pro Gly Arg Thr Arg Lys 85 90 95 Pro Ser Ser Pro Ala Asp Thr Leu Glu Glu Ala Gly Thr Lys Met Gln 100 105 110
Pro Tyr Glu Glu Leu His Gln Asp Gly Gln Pro Asn Leu Glu Asp Met 115 120 125
Lys Val Pro Glu Leu Arg Asp Met Ala Arg Glu Arg Gly Met Arg Gly 130 135 140
Tyr Ser Lys Leu Lys Lys Gly Glu Leu Ile Asp Arg Leu Arg Gly Ala 145 150 155 160
Trp Ser Ser Asp Asn 165
<210> 220
<211> 348
<212> DNA
<213> Triticum aestivum
<400> 220
agcctccccg tacgaacccg actctgtgat agcaccagaa gatgcatctc tggacgactt 60
tgttgtctca gacgatgaat cagacgtgct agataccgat gaacccgatg agtacctgga 120
accattcgat aatgotgatg atgttacaga tagcatccca tcccatgatg acagtctgga 180
aggtagtcct tccgtggaag cttccgacct gagctcgctc aaggtcatgg agctgaggga 240
gctggcgaaa tctcggggac tcaggggcta ctcgaagatg aagaagagcg acctggtcgc 300
actactgagc gacgtgtcct gatccgtcgg tggtggcaat cctgcttg 348
<210> 221
<211> 105
<212> PRT
<213> Triticum aestivum
<400> 221
Ser Pro Tyr Glu Pro Asp Ser Val Ile Ala Pro Glu Asp Ala Ser Leu 10 15
Asp Asp Phe Val Val Ser Asp Asp Glu Ser Asp Val Leu Asp Thr Asp 25 30
Glu Pro Asp Glu Tyr Leu Glu Pro Phe Asp Asn Ala Asp Asp Val Thr 40 45
Asp Ser Ile Pro Ser His Asp Asp Ser Leu Glu Gly Ser Pro Ser Val 50 55 60
Glu Ala Ser Asp Leu Ser Ser Leu Lys Val Met Glu Leu Arg Glu Leu 65 70 75 80
Ala Lys Ser Arg Gly Leu Arg Gly Tyr Ser Lys Met Lys Lys Ser Asp 85 90 95
Leu Val Ala Leu Leu Ser Asp Val Ser 100 105
<210> 222 <211> 398 <212> DNA
<213> Triticum aestivum <400> 222
cggaaacaaa tgccccagca cggcttacag ttcagctaat cgactaacaa agctaggaoa cgaacaacgg agaaaaggtt aaccctgctc gcagaatagg aaatgggagg tcgtgcacat gctcgagcag gattgccacc accggcggat tcgctcttct tcatcttcga gtaaccccgg tccgtcacct tgagcgagct caggtcggaa
<210> 223 <211> 64 <212> PRT
<213> Triticiom aestivum <400> 223
Ala Ser Asp Leu Ser Ser Leu Lys Val Thr Glu Leu Arg Glu Leu Ala 10 15
Lys Ser Arg Gly Leu Arg Gly Tyr Ser Lys Met Lys Lys Ser Asp Leu 25 30
Val Ala Leu Leu Ser Asp Val Ser Asp Pro Pro Val Val Ala Ile Leu 40 45
Leu Glu Pro Thr Val Leu Leu Pro Phe Cys His Gly His Val His Asp 50 55 60
<210> 224
<211> 701
<212> DNA
<213> Zea mays
<400> 224
atctggacac tgatgacgat cgcaagtcca tcggcagtaa tgccgtggat gccgtacaga 60
ctttacttat ttttaactct aataacaggg 60
tgacagcaaa agggaccagc aagagatcaa 120
atttacaacg ttctatctaa aagggacttg 180
ggccatggca gaaggggagc aaaacggtgg 240
caggacacgt cgctcagtag cgcgaccagg 300
agtccccgag atttcgccag ctccctcagc 360
gcttctgc 398 aagctaagac agctcttgat gagaggactg ctacagatga gcctgactcc atgtctccat 120 atgagccaga ttctgtaata gaaccaggaa acatttcttt gaatgacctc gatgacattt 180 tagatgacga cgaagaattc gatgcagatg aaccagacga cgagtatcca gaaccttctt 240 tgggaatctc tgatgtcaca gatacggatg agtcgcacga gaacgactcc acccccacgg 300 gaagtgcgga tctaagctct ctgaaggttg cggagctgag agagctcgca aagtctcgag 360 gaatcaaagg gtactcgaag aagaagaaaa acgagctggt tgaagtgttg agcagcagca 420 tggattgatg ataaagtggg tgacctggcg ctctgtttga agtttgaacc cactttgctt 480 ggccccctct agaaaattgt aaatgagcaa ggctaactct gttccggtct gtgctgatct 540 tttgctggtt cattttgtac gcctagcttg gtagccgttt agctgaattc tgtggtgagt 600 ggagtaaggt agctgagagc cttagctgtt tgtgtactaa atcaatgcac tgcatccgtt 660 ctagggtgtt gctcgtctgt tttccgatat tgtcttgttc t 701
<210> 225
<211> 151
<212> PRT
<213> Zea mays
<220>
<221> INCERTO <222> (1) . . (1)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 225
Xaa Leu Asp Thr Asp Asp Asp Arg Lys Ser Ile Gly Ser Asn Ala Val 10 15
Asp Ala Val Gln Lys Ala Lys Thr Ala Leu Asp Glu Arg Thr Ala Thr 25 30
Asp Glu Pro Asp Ser Met Ser Pro Tyr Glu Pro Asp Ser Val Ile Glu 40 45
Pro Gly Asn Ile Ser Leu Asn Asp Leu Asp Asp Ile Leu Asp Asp Asp 50 55 60
Glu Glu Phe Asp Ala Asp Glu Pro Asp Asp Glu Tyr Pro Glu Pro Ser 65 70 75 80
Leu Gly Ile Ser Asp Val Thr Asp Thr Asp Glu Ser His Glu Asn Asp 85 90 95
Ser Thr Pro Thr Gly Ser Ala Asp Leu Ser Ser Leu Lys Val Ala Glu 100 105 110 Leu Arg Glu Leu Ala Lys Ser Arg Gly Ile Lys Gly Tyr Ser Lys Lys
Lys Lys Asn Glu Leu Val Glu Val Leu Ser Ser Ser Met Asp Asp Asp
Lys Val Gly Asp Leu Ala Leu
<210> 226
<211> 1014
<212> DNA
<213> Zea mays
<400> 226
atcaagacta gcttgtttga ccaccagctt ccctaccttc tcctgcaatc ccaagagaag 60
atgaattggt ttgtatcatc attcatttgc ctgtggcagg aagtggatgg aagcaggcgg 120
tcattggaag gcaggaacag ggggctttgc ttggtgttct ttggaggaga aagaagagca 180
aagaaatggg aggcttgctc ttgtcgcatc accaaacctt tccaaattct ttgcaagctt 240
ccatccccgg acctotctct cttcacaaag gcgaccgcaa aaacctccat tgcttggcac 300
ctgatgtgca cctcctctgt tccctgcggc aaggctttcc acgctoatct tggtcggccg 360
tcatcagatc agaagccagc ggcaacgcgg tggcgtcgcc aggcacggtc atcaagcgta 420
gcaaggagga gctoatcacc ttcttcagag acatacagac atccattgcc gagtgctcgc 480
gtaaagcttc caagaggacg aggaagcagc cgcctgatct gttccaagag gtccgcagga 540
gggaggaaca gtcacacggt ggaggagata gcggcaccga cgacgtttca gagggaccga 600
ggaaagtgaa gagtcttgag gacatgaacg tggctggatt gagagagttg gcgagggcca 660
gaaggatgag gggttactoc aagcttaaga agggcgagct cattgatcgg ttgagagggg 720
ctactacgta ataaactacc atgatgcaga gcagcttcgc agttaatagg gacacatgtt 780
cttttcgaac gtatgatgag attaccgatc aaaaaattgt atgatgatga gattaccgac 840
tttccaaacg atctagtcag ttcattgata agaactagaa caatgtgtgt agttattata 900
ctatagaacc ggtggagctg tattgttgta ctacgcogaa acttttgfcgt aggcatggca 960
atctcctgtt gttacgtaag ttactttgtt atgtacggaa ttagtttctc taaa 1014
<210> 227
<211> 189
<212> PRT
<213> Zea mays
<220>
<221> INCERTO <222> (22) . . (22) <223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO <222> (146)..(146)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO <222> (172) . . (172)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 227
Ser Cys Arg Ile Thr Lys Pro Phe Gln Ile Leu Cys Lys Leu Pro Ser 3-5 10 15
Pro Asp Leu Ser Leu Xaa His Lys Gly Asp Arg Lys Asn Leu His Cys 25 30
Leu Ala Pro Asp Val His Leu Leu Cys Ser Leu Arg Gln Gly Phe Pro 40 45
Arg Ser Ser Trp Ser Ala Val Ile Arg Ser Glu Ala Ser Gly Asn Ala 50 55 60
Val Ala Ser Pro Gly Thr Val Ile Lys Arg Ser Lys Glu Glu Leu Ile 65 70 75 80
Thr Phe Phe Arg Asp Ile Gln Thr Ser Ile Ala Glu Cys Ser Arg Lys 85 90 95
Ala Ser Lys Arg Thr Arg Lys Gln Pro Pro Asp Leu Phe Gln Glu Val 100 105 110
Arg Arg Arg Glu Glu Gln Ser His Gly Gly Gly Asp Ser Gly Thr Asp 115 120 125
Asp Val Ser Glu Gly Pro Arg Lys Val Lys Ser Leu Glu Asp Met Asn 130 135 140
Val Xaa Trp Ile Glu Arg Val Gly Glu Gly Gln Lys Asp Glu Gly Tyr 145 150 155 160
Ser Lys Leu Lys Lys Gly Glu Leu Ile Asp Arg Xaa Glu Arg Gly Tyr 165 170 175
Tyr Val Ile Asn Tyr His Asp Ala Glu Gln Leu Arg Ser 180 185
<210> 228 <211> 688 <212> DNA
<213> Triticiam aestivum
<400> 228 gaggcagaaa gctaagacag ttcttgatga gaggactgtt acagatgagc ctgactccat gtctccgtat gaacctgatt ctgtaataga accagaaaat atttctttgg aagaccttga tgacatttta gatgacgatg aagaatctga tacagatgaa ccagacgatg agtatccaga accttctttg gaaatcactg atgttacaga tacagatgaa ttgcacgaga acaactccac ggaaagttca gatctaacct ctctgaaggt tgcagagctg agagagcttg caaagtcccg aggaatcaaa ggctattcaa agatgaagaa aaacgagctg attgaagtgg tgagcagcag catggcttga tgataagcgg gtgatattgt caacctttca gtcccacttt gctgattgaa gtggtgagca gcagcatggc tattccattt gaacccactt tgcttggcct gatccgctgc ctttcagtcc cgtagaaaat tgtaaatgag cgaggctaac attgttctgg tctgtgctga tcttttgctg gttctcattt tgtacgccta gtttgctaga catttagctg aattgtgtgc cgagtggagt aaggtagctg agagcctgag atgctgtttg tgtactaaat gaatgcacca catctgttct aggtgttgtt aaaaaaaa
<210> 229 <211> 122 <212> PRT
<213> Triticum aestivum <400> 229
Arg Gln Lys Ala Lys Thr Val Leu Asp Glu Arg Thr Val Thr Asp Glu 10 15
Pro Asp Ser Met Ser Pro Tyr Glu Pro Asp Ser Val Ile Glu Pro Glu 25 30
Asn Ile Ser Leu Glu Asp Leu Asp Asp Ile Leu Asp Asp Asp Glu Glu 40 45
Ser Asp Thr Asp Glu Pro Asp Asp Glu Tyr Pro Glu Pro Ser Leu Glu 50 55 60
Ile Thr Asp Val Thr Asp Thr Asp Glu Leu His Glu Asn Asn Ser Thr 65 70 75 80
Glu Ser Ser Asp Leu Thr Ser Leu Lys Val Ala Glu Leu Arg Glu Leu 85 90 95
60 120 180 240 300 360 420 480 540 600 660 688
Ala Lys Ser Arg Gly Ile Lys Gly Tyr Ser Lys Met Lys Lys Asn Glu 100 105 HO Leu Ile Glu Val Val Ser Ser Ser Met Ala 115 120
<210> 230
<211> 1902
<212> DNA
<213> Oryza sativa
<400> 230
atggccatct gtatgtccaa cttctatgta tctatatatc ttgtgtactg cgaacccttc 60 aatctgaaac atttagtttt cgtccttatt cattactatg ctattgtttc ttgggtttca 120 ggcagaacat taccagccta tcatggagac aacagatttc ttcttggagc ttgtttcctg 180 agtaaactgc ctatgctgcg cccaatgaag ttgtctttgg tatgcagtgc taatcccaac 240 aaccataggt caagaagttc ggatatcaca cgccatcaga agggtggatc agctcggagg 300 aaaagtaagc cttaccagga gaaagatgac tctgagaata ttgatgaatt cgatactgat 360 attatgtcct ccaaaaatgg accacccatc tctttgacaa gcaattcccg tcctcaagca 420 acatcagtcc caggggaaag agagaaggag atagtagagt tgtttaaaag ggttcaagca 480 caattgcgag caaggggaaa agggaaggag gagaagaagc ctgaacaagc aaaagcacag 540 ggtgagaggg gcagtgttga ctcccttcta aatctgctta ggaagcactc agtggaccaa 600 cgaaggaaga gcggtgatga gaaagaacag agtgttgacc aaacaaagag aagcaatgaa 660 tctggaaata aacaaaattc aagcatcttc ataaagaatg acactcagga agaacagaaa 720 aagccacatc ctgcagcctt caaaaggcca gcttcaaatt ttaggcgaag atcccctgtt 780 cctaatgtaa agttccagcc tgttaccaat gttgatgccg aacgagtcat caataacatc 840 aatgatgccg tacaagaggc taagccaact ttggaaaata aggctgctac agatgaacca 900 gactcggttt ctacattcga acctaattct gtaatagaac cagaaaacct atctttggat 960 gaccttgatc atatttcaga tgatgaacct gatgcttctg atactgatga acccagtgga 1020 gaatatgatg agccatcttt gcaaatccca agtgttccaa ttattgatga atctcatgat 1080 acgactctga aatcttcctt aggaggtcct gatttaagca ctttgaaggt cacagaacta 1140 agagaacttg cgaaatctcg aggaatcaaa ggatattcca agatgaagaa gaatgacctg 1200 agccaaggta ctgattggga ggatttcctg ggaattgtct gcctcccgat tatcaattca 1260 acaatcagct tcattaagga aaacaatgca ggcgatgcag ctgctgcact catgtcccgg 1320 ttggcgctaa aaacaaaggt tcttagagat gagcagtggc aagagcttga tgcttccaca 1380 ttggtacotg gggatataat cagcatcagg tttggtgaca ttgtccctgc agatgcgtgc 1440 ctacttgagg gagatcctct gaaaatgaat tgccacacgc cgttcatgcg aaagatgtcg 1500 atcactggaa ttcagctctc actggtgaat cccttcctgt caccaaaaga accggggacc 1560 atagtgttca ctggctcaac atgcaagcat ggtgagattg aagctgttgt cattgcaact 1620 gggatacact ctttctttgg caaggcagct catctagtgg actccactga ggttgttggg 1680 cattttcaga agctttgcgt tttcttctcc ttatcacaaa gaatgcaagg actgccccag 1740 agcttccacc aaaacatgaa ccaccattgt cttgacctgg gctgtttgga cggtttggtg 1800 gaggggggag ctgtatatga tggaggtggt ggatttccgt caattctgta cacaaggatc 1860 ataataggtc agtgtacaac tctcattttt gcatgttcat aa 1902
<210> 231 <211> 633 <212> PRT <213> Oryza sativa <400> 231
Met Ala Ile Cys Met Ser Asn Phe Tyr Val Ser Ile Tyr Leu Val Tyr 10 15
Cys Glu Pro Phe Asn Leu Lys His Leu Val Phe Val Leu Ile His Tyr 25 30
Tyr Ala Ile Val Ser Trp Val Ser Gly Arg Thr Leu Pro Ala Tyr His 40 45
Gly Asp Asn Arg Phe Leu Leu Gly Ala Cys Phe Leu Ser Lys Leu Pro 50 55 60
Met Leu Arg Pro Met Lys Leu Ser Leu Val Cys Ser Ala Asn Pro Asn 65 70 75 80
Asn His Arg Ser Arg Ser Ser Asp Ile Thr Arg His Gln Lys Gly Gly 85 90 95
Ser Ala Arg Arg Lys Ser Lys Pro Tyr Gln Glu Lys Asp Asp Ser Glu 100 105 110
Asn Ile Asp Glu Phe Asp Thr Asp Ile Met Ser Ser Lys Asn Gly Pro 115 120 125
Pro Ile Ser Leu Thr Ser Asn Ser Arg Pro Gln Ala Thr Ser Val Pro 130 135 140
Gly Glu Arg Glu Lys Glu Ile Val Glu Leu Phe Lys Arg Val Gln Ala 145 150 155 160
Gln Leu Arg Ala Arg Gly Lys Gly Lys Glu Glu Lys Lys Pro Glu Gln 165 170 175 Ala Lys Ala Gln Gly Glu Arg Gly Ser Val Asp Ser Leu Leu Asn Leu 180 185 190
Leu Arg Lys His Ser Val Asp Gln Arg Arg Lys Ser Gly Asp Glu Lys 195 200 205
Glu Gln Ser Val Asp Gln Thr Lys Arg Ser Asn Glu Ser Gly Asn Lys 210 215 220
Gln Asn Ser Ser Ile Phe Ile Lys Asn Asp Thr Gln Glu Glu Gln Lys 225 230 235 240
Lys Pro His Pro Ala Ala Phe Lys Arg Pro Ala Ser Asn Phe Arg Arg 245 250 255
Arg Ser Pro Val Pro Asn Val Lys Phe Gln Pro Val Thr Asn Val Asp 260 265 270
Ala Glu Arg Val Ile Asn Asn Ile Asn Asp Ala Val Gln Glu Ala Lys 275 280 285
Pro Thr Leu Glu Asn Lys Ala Ala Thr Asp Glu Pro Asp Ser Val Ser 290 295 300
Thr Phe Glu Pro Asn Ser Val Ile Glu Pro Glu Asn Leu Ser Leu Asp 305 310 315 320
Asp Leu Asp His Ile Ser Asp Asp Glu Pro Asp Ala Ser Asp Thr Asp 325 330 335
Glu Pro Ser Gly Glu Tyr Asp Glu Pro Ser Leu Gln Ile Pro Ser Val 340 345 350
Pro Ile Ile Asp Glu Ser His Asp Thr Thr Leu Lys Ser Ser Leu Gly 355 360 365
Gly Pro Asp Leu Ser Thr Leu Lys Val Thr Glu Leu Arg Glu Leu Ala 370 375 380
Lys Ser Arg Gly Ile Lys Gly Tyr Ser Lys Met Lys Lys Asn Asp Leu 385 390 395 400
Ser Gln Gly Thr Asp Trp Glu Asp Phe Leu Gly Ile Val Cys Leu Pro 405 410 415
Ile Ile Asn Ser Thr Ile Ser Phe Ile Lys Glu Asn Asn Ala Gly Asp 420
425
430
Ala Ala Ala Ala Leu Met Ser Arg Leu Ala Leu Lys Thr Lys Val Leu 435 440 445
Arg Asp Glu Gln Trp Gln Glu Leu Asp Ala Ser Thr Leu Val Pro Gly 450 455 460
Asp Ile Ile Ser Ile Arg Phe Gly Asp Ile Val Pro Ala Asp Ala Cys 465 470 475 480
Leu Leu Glu Gly Asp Pro Leu Lys Met Asn Cys His Thr Pro Phe Met 485 490 495
Arg Lys Met Ser Ile Thr Gly Ile Gln Leu Ser Leu Val Asn Pro Phe 500 505 510
Leu Ser Pro Lys Glu Pro Gly Thr Ile Val Phe Thr Gly Ser Thr Cys 515 520 525
Lys His Gly Glu Ile Glu Ala Val Val Ile Ala Thr Gly Ile His Ser 530 535 540
Phe Phe Gly Lys Ala Ala His Leu Val Asp Ser Thr Glu Val Val Gly 545 550 555 560
His Phe Gln Lys Leu Cys Val Phe Phe Ser Leu Ser Gln Arg Met Gln 565 570 575
Gly Leu Pro Gln Ser Phe His Gln Asn Met Asn His His Cys Leu Asp 580 585 590
Leu Gly Cys Leu Asp Gly Leu Val Glu Gly Gly Ala Val Tyr Asp Gly 595 600 605
Gly Gly Gly Phe Pro Ser Ile Leu Tyr Thr Arg Ile Ile Ile Gly Gln 610 615 620
Cys Thr Thr Leu Ile Phe Ala Cys Ser 625 630
<210> 232 <211> 411 <212> DNA <213> Oryza sativa <400> 232
atgggattct gctttgtcct ccacggaata gcttctcatg ctcatcgttg gggagcatca ggtcagaagc aaatggatct ccgttgccaa gaacggttaa taggcgtagc aaagaagagc 120 tcattgagtt cttcaaaagc atccagacct ccattgccga ggaatcgcca agaacttcga 180 ggaggacgag gaagcaatca tctgacccgt tcgaagaggt tgagaggagg aagcagtcat 240 acgctaggca tagctgatgt ttcggaggaa catgcagatg gggagccaaa ggcgctggat 300 ctgaatgata tgaaggtggc tgagctgaga gaattggcga gggcgagaag gatgaaaggt 360 tactcgaggc tgaagaagag tgagctgatt gatcgtctga agggtgtctg a 411
<210> 233
<211> 136
<212> PRT
<213> Oryza sativa
<400> 233
Met Gly Phe Cys Phe Val Leu His Gly Ile Ala Ser His Ala His Arg 10 15
Trp Gly Ala Ser Gly Gln Lys Gln Met Asp Leu Arg Cys Gln Glu Arg 25 30
Leu Ile Gly Val Ala Lys Lys Ser Ser Leu Ser Ser Ser Lys Ala Ser 40 45
Arg Pro Pro Leu Pro Arg Asn Arg Gln Glu Leu Arg Gly Gly Arg Gly 50 55 60
Ser Asn His Leu Thr Arg Ser Lys Arg Leu Arg Gly Gly Ser Ser His 65 70 75 80
Thr Leu Gly Ile Ala Asp Val Ser Glu Glu His Ala Asp Gly Glu Pro 85 90 95
Lys Ala Leu Asp Leu Asn Asp Met Lys Val Ala Glu Leu Arg Glu Leu 100 105 110
Ala Arg Ala Arg Arg Met Lys Gly Tyr Ser Arg Leu Lys Lys Ser Glu 115 120 125
Leu Ile Asp Arg Leu Lys Gly Val 130 135
<210> 234
<211> 777
<212> DNA
<213> Musa balbisiana
<400> 234
atggatttta tgtccaaaaa tgggtcattg ctttctccaa gtactaatac tagatatcag
60 gctactgcaa cttcaggaca aagagagaga gaaatagttg agctgtttcg gaaagttcaa 120 gcacaattac gagagcgggc tgcaatcaag gaagagaaga agattgaagc cgcacaacag 180 ggtcaaagca agaagggaac tgtcgattcg gttctcaaat tattaaggag gcattcaggg 240 gatcagaaga agacaactag tccaggagag gaattttctg ttgaccaagt agaaagaagc 300 aacacatttg aggatgagca gaatataaat ccctttggcc ctagtgatag caagtcacag 360 gagtctgatg tacgaggccc tcttccttct gctaggcctg cctcaaattt tggtagaaaa 420 tctcctgttc Ctagaatgga gttccaagct gtactttcag cagaggagga tatcaactct 480 gctccttcca agtcacgagg gagaaggaag aagactggcg attatgagtg tgtgcaagca 540 gcacctgcgg agtctgttgt gttggatggt ccagatgagt tatcatcaga tgatcagttg 600 gatcattctg gttctgatga aacagctgaa gaaactatag aatcatcttc tacggaagct 660 tctcctgatt tgggttcctt gaaactttca gaattgaggg atcttgcaag gtatcgaggg 720 gtcaaagggt attccaaact caagaaagga gaactggctg aattattgag tgcttga 777
<210> 235 <211> 258 <212> PRT
<213> Musa balbisiana <400> 235
Met Asp Phe Met Ser Lys Asn Gly Ser Leu Leu Ser Pro Ser Thr Asn 10 15
Thr Arg Tyr Gln Ala Thr Ala Thr Ser Gly Gln Arg Glu Arg Glu Ile 25 30
Val Glu Leu Phe Arg Lys Val Gln Ala Gln Leu Arg Glu Arg Ala Ala 40 45
Ile Lys Glu Glu Lys Lys Ile Glu Ala Ala Gln Gln Gly Gln Ser Lys 50 55 60
Lys Gly Thr Val Asp Ser Val Leu Lys Leu Leu Arg Arg His Ser Gly 65 70 75 80
Asp Gln Lys Lys Thr Thr Ser Pro Gly Glu Glu Phe Ser Val Asp Gln 85 90 95
Val Glu Arg Ser Asn Thr Phe Glu Asp Glu Gln Asn Ile Asn Pro Phe 100 105 110
Gly Pro Ser Asp Ser Lys Ser Gln Glu Ser Asp Val Arg Gly Pro Leu 115 120 125 Pro Ser Ala Arg Pro Ala Ser Asn Phe Gly Arg Lys Ser Pro Val Pro
Arg Met Glu Phe Gln Ala Val Leu Ser Ala Glu Glu Asp Ile Asn Ser
Ala Pro Ser Lys Ser Arg Gly Arg Arg Lys Lys Thr Gly Asp Tyr Glu
Cys Val Gln Ala Ala Pro Ala Glu Ser Val Val Leu Asp Gly Pro Asp
Glu Leu Ser Ser Asp Asp Gln Leu Asp His Ser Gly Ser Asp Glu Thr
Ala Glu Glu Thr Ile Glu Ser Ser Ser Thr Glu Ala Ser Pro Asp Leu
Gly Ser Leu Lys Leu Ser Glu Leu Arg Asp Leu Ala Arg Tyr Arg Gly
Val Lys Gly Tyr Ser Lys Leu Lys Lys Gly Glu Leu Ala Glu Leu Leu
Ser Ala
<210> 236 <211> 1206 <212> DNA
<213> Arabidopsis thaliana <400> 236
atggcgatgt cgggaacttt ccatttgact tctgactatg tccctggtta cacactttca 60
gacagccgtt gcttctttaa ctctgctgtt tcaagaagaa cacttgccat attaccttgc 120
tcttcctgtc tcgatcacaa gaatgggcgt ctgaaatctg tccccaatag aagttctttt 180
gtgtgccgag caagttctgg cggctatagg agaaatcctg atttctcaag acttaataag 240
catggttacc ggggaaacaa caggcaaagc ggagggagag aagattttga tatcgaaaac 300
tctgatatgt tgtcttcaag aaatgggcct ttattcaacc tgtctagttc ccccaaattc 360
caagctacct catcccctgg acctagagag aaagagatcg tggagctttt cagaaaggtt 420
caagctcagc tccgagctcg tgctgcagca aagaaagaag aaaaaaagat tgaagaagct 480
tctaaagggc agggaaaaga aagtgaaact gttgactctc ttcttaagtt actaaggaag 540
cactcgggag agcaaagcaa gaggcaagtt agcaaattta gcagccaggg agaagtacaa 600 ggagatactg ttgacaaaca agatcgcacc ggaaatcttg tcacttcagg gaacaaagat aataatgcat catcctttac cagaccaaca tcaagcttca gaagaaagtc gccagtacca agatctcaat caccgccagc ttattctagc gaggcaactt ttgatcaatc atcaagttac agtgtaacct ggacccagaa gaaggataca gtagagttgc atgatgagcc tgaacatgag cctgcgtatg agcatgagca tgagcctgaa aatgagtcag aacctgggcc tgtgacaact atgcttgaac cagattcaga gctgaaacca gagtcatcat cattttatca agaggaggag gatgatgatg ttacttttga tgtgttatca caggatgatg gtattttaga tgtgttatca gatgatgatg agtctctcga tgatgctgat gaagatagtg atgaagctga ggaagaagcc gtgaaagact tgagtgaatt gaagctggtc gaacttagag gcatagcaaa gtcacgggga ctaaaagggt tgtcaaagat gaagaaagcc gaattagtgg agttgcttgg tagtgattcc agctga
<210> 237 <211> 401 <212> PRT
<213> Arabidopsis thaliana <400> 237
Met Ala Met Ser Gly Thr Phe His Leu Thr Ser Asp Tyr Val Pro Gly 10 15
Tyr Thr Leu Ser Asp Ser Arg Cys Phe Phe Asn Ser Ala Val Ser Arg 25 30
Arg Thr Leu Ala Ile Leu Pro Cys Ser Ser Cys Leu Asp His Lys Asn 40 45
Gly Arg Leu Lys Ser Val Pro Asn Arg Ser Ser Phe Val Cys Arg Ala 50 55 60
Ser Ser Gly Gly Tyr Arg Arg Asn Pro Asp Phe Ser Arg Leu Asn Lys 65 70 75 80
His Gly Tyr Arg Gly Asn Asn Arg Gln Ser Gly Gly Arg Glu Asp Phe 85 90 95
Asp Ile Glu Asn Ser Asp Met Leu Ser Ser Arg Asn Gly Pro Leu Phe 100 105 HO
660 720 780 840 900 960 1020 1080 1140 1200 1206
Asn Leu Ser Ser Ser Pro Lys Phe Gln Ala Thr Ser Ser Pro Gly Pro 115 120 125 Arg Glu Lys Glu Ile Val Glu Leu Phe Arg Lys Val Gln Ala Gln Leu 130 135 140
Arg Ala Arg Ala Ala Ala Lys Lys Glu Glu Lys Lys Ile Glu Glu Ala 145 150 155 160
Ser Lys Gly Gln Gly Lys Glu Ser Glu Thr Val Asp Ser Leu Leu Lys 165 170 175
Leu Leu Arg Lys His Ser Gly Glu Gln Ser Lys Arg Gln Val Ser Lys 180 185 190
Phe Ser Ser Gln Gly Glu Val Gln Gly Asp Thr Val Asp Lys Gln Asp 195 200 205
Arg Thr Gly Asn Leu Val Thr Ser Gly Asn Lys Asp Asn Asn Ala Ser 210 215 220
Ser Phe Thr Arg Pro Thr Ser Ser Phe Arg Arg Lys Ser Pro Val Pro 225 230 235 240
Arg Ser Gln Ser Pro Pro Ala Tyr Ser Ser Glu Ala Thr Phe Asp Gln 245 250 255
Ser Ser Ser Tyr Ser Val Thr Trp Thr Gln Lys Lys Asp Thr Val Glu 260 265 270
Leu His Asp Glu Pro Glu His Glu Pro Ala Tyr Glu His Glu His Glu 275 280 285
Pro Glu Asn Glu Ser Glu Pro Gly Pro Val Thr Thr Met Leu Glu Pro 290 295 300
Asp Ser Glu Leu Lys Pro Glu Ser Ser Ser Phe Tyr Gln Glu Glu Glu 305 310 315 320
Asp Asp Asp Val Thr Phe Asp Val Leu Ser Gln Asp Asp Gly Ile Leu 325 330 335
Asp Val Leu Ser Asp Asp Asp Glu Ser Leu Asp Asp Ala Asp Glu Asp 340 345 350
Ser Asp Glu Ala Glu Glu Glu Ala Val Lys Asp Leu Ser Glu Leu Lys 355 360 365
Leu Val Glu Leu Arg Gly Ile Ala Lys Ser Arg Gly Leu Lys Gly Leu 370 375 380 Ser Lys Met Lys Lys Ala Glu Leu Val Glu Leu Leu Gly Ser Asp Ser 385 390 395 400
Ser
<210> 238
<211> 756
<212> DNA
<213> Arabidopsis thaliana
<400> 238 atggacttgg ctcttcattg tcattgtgct tacccgttga tcaaactagg attcatgaga gctaaatcag ccaatcatct tcatgttcga gatactcatt cactgccgtt tgcgttgcgc tttgagcaga gtctttcgag aacaacgatt aatggagata gaagtatttg gtttcaagag aaaggtggtt cttcttatac ttcaatggga agatccaaga aaggatgtgt ttgttgcaag aaaccgtctg atagacgaac gtcaaaccca agtaaatcga accaagagga gatcatttcg ctcttgaaac ggattcaatc ttcgatctct aaaggagagt ctcgaggagt cgaggaagag aagaacagcg atgagtcttc taaggaaaag ccgctgacca aagctattct tgacgttctt gagaaatcaa gaaaaaaaac tgagggtaat caactatgct ttggagatac tagtgtgaag gagaagccac caaagagaca agtagagctt cctcgaccac cgtctagttt tgtcaagaga actcctttat cttcttctgc ctcaggtcca agaggtaagc tcccagtatc aaacagcgat aaagctttag gaaaattgac aaagaaggaa gagaaagctt cactgataga aactatgaaa cttgcagagc tcaaagaagt tgcaaagaac agaggaatca aaggatactc aaagttgagg aagagtgaac tattggagct gataagatcg tcctga
<210> 239 <211> 251 <212> PRT
<213> Arabidopsis thaliana <400> 239
Met Asp Leu Ala Leu His Cys His Cys Ala Tyr Pro Leu Ile Lys Leu 10 15
Gly Phe Met Arg Ala Lys Ser Ala Asn His Leu His Val Arg Asp Thr 25 30
His Ser Leu Pro Phe Ala Leu Arg Phe Glu Gln Ser Leu Ser Arg Thr 40 45
60 120 180 240 300 360 420 480 540 600 660 720 756
Thr Ile Asn Gly Asp Arg Ser Ile Trp Phe Gln Glu Lys Gly Gly Ser 50 55 60 Ser Tyr Thr Ser Met Gly Arg Ser Lys Lys Gly Cys Val Cys Cys Lys 65 70 75 80
Lys Pro Ser Asp Arg Arg Thr Ser Asn Pro Ser Lys Ser Asn Gln Glu 85 90 95
Glu Ile Ile Ser Leu Leu Lys Arg Ile Gln Ser Ser Ile Ser Lys Gly 100 105 110
Glu Ser Arg Gly Val Glu Glu Glu Lys Asn Ser Asp Glu Ser Ser Lys 115 120 125
Glu Lys Pro Leu Thr Lys Ala Ile Leu Asp Val Leu Glu Lys Ser Arg 130 135 140
Lys Lys Thr Glu Gly Asn Gln Leu Cys Phe Gly Asp Thr Ser Val Lys 145 150 155 160
Glu Lys Pro Pro Lys Arg Gln Val Glu Leu Pro Arg Pro Pro Ser Ser 165 170 175
Phe Val Lys Arg Thr Pro Leu Ser Ser Ser Ala Ser Gly Pro Arg Gly 180 185 190
Lys Leu Pro Val Ser Asn Ser Asp Lys Ala Leu Gly Lys Leu Thr Lys 195 200 205
Lys Glu Glu Lys Ala Ser Leu Ile Glu Thr Met Lys Leu Ala Glu Leu 210 215 220
Lys Glu Val Ala Lys Asn Arg Gly Ile Lys Gly Tyr Ser Lys Leu Arg 225 230 235 240
Lys Ser Glu Leu Leu Glu Leu Ile Arg Ser Ser 245 250
<210> 240
<211> 35
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo 1: SAP-consenso
<220>
<221> INCERTO
<222> (1)..(1)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO <222> (8)..(8)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO <222> (28) . . (28)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 240
Xaa Leu Ser Ser Leu Lys Val Xaa Glu Leu Arg Glu Leu Ala Lys Ser 10 15
Arg Gly Ile Lys Gly Tyr Ser Lys Met Lys Lys Xaa Glu Leu Val Glu 25 30
Leu Leu Ser 35
<210> 241
<211> 61
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo 2: consenso
<220>
<221> INCERTO
<222> (3) . . (3)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO
<222> (14)..(15)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO
<222> (18)..(18)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO
<222> (21)..(22)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO
<222> (24) . . (24)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO
<222> (26) . . (26)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO
<222> (28)..(30)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente
<220>
<221> INCERTO
<222> (32)..(32)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente
<220>
<221> INCERTO
<222> (37)..(39)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente
<220>
<221> INCERTO
<222> (41)..(42)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente
<220>
<221> INCERTO
<222> (49) . . (49)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente
<220>
<221> INCERTO
<222> (56)..(56)
<223> Xaa pode ser qualquer
<220>
<221> INCERTO
<222> (59)..(59)
<223> Xaa pode ser qualquer
aminoácido que ocorre naturalmente
aminoácido que ocorre naturalmente
<400> 241
Glu Lys Xaa Glu Ile Val Glu Leu Phe Lys Lys Val Gln Xaa Xaa Leu 10 15
Arg Xaa Arg Ala Xaa Xaa Lys Xaa Glu Xaa Lys Xaa Xaa Xaa Glu Xaa 25 30
Ala Lys Ala Gln Xaa Xaa Xaa Glu Xaa Xaa Thr Val Asp Ser Leu Leu 40 45
Xaa Leu Leu Arg Lys His Ser Xaa Asp Gln Xaa Lys Lys 50 55 60
<210> 242
<211> 13
<212> PRT
<213> Seqüência Artificial <220>
<223> motivo 3: consenso <220>
<221> INCERTO <222> (3)..(3)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO
<222> (5)..(5)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <220>
<221> INCERTO
<222> (7) . . (7)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente
<400> 242
Arg Pro Xaa Ser Xaa Phe Xaa Arg Arg Ser Pro Val Pro 10
<210> 243 <211> 35 <212> PRT
<213> Seqüência Artificial <220>
<223> motivo 1 of SEQ ID NO: 02 <400> 243
Asp Leu Ser Thr Leu Lys Val Thr Glu Leu Arg Glu Leu Ala Lys Ser 10 15
Arg Gly Ile Lys Gly Tyr Ser Lys Met Lys Lys Asn Asp Leu Val Glu 25 30
Leu Leu Ser 35
<210> 244 <211> 56 <212> PRT
<213> Seqüência Artificial <220>
<223> motivo 2 of SEQ ID NO: 02 <400> 244
Glu Lys Glu Ile Val Glu Leu Phe Lys Arg Val Gln Ala Gln Leu Arg 10 15
Ala Arg Gly Lys Gly Lys Glu Glu Lys Lys Pro Glu Gln Ala Lys Ala 25 30
Gln Gly Glu Arg Gly 35
Ser Val Asp Ser Leu Leu Asn Leu Leu Arg Lys 40 45 His Ser Val Asp Gln Arg Arg Lys 50 55
<210> 245 <211> 13 <212> PRT
<213> Seqüência Artificial <220>
<223> motivo 3 of SEQ ID NO: 02 <400> 245
Arg Pro Ala Ser Asn Phe Arg Arg Arg Ser Pro Val Pro 10
<210> 246
<211> 1264
<212> DNA
<213> Oryza sativa
<400> 246
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140 tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200 taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 12 60 gatc 12 64
<210> 247
<211> 54
<212> DNA
<213> Seqüência Artificial <220>
<223> iniciador: iniciador a montante
<400> 247
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc cacaacgatg acac 54
<210> 248
<211> 50
<212> DNA
<213> Seqüência Artificial <220>
<223> iniciador: iniciador a jusante
<400> 248
ggggaccact ttgtacaaga aagctgggtc ggtttagggt ttctatgcac 50
<210> 249
<211> 1568
<212> DNA
<213> Oryza sativa
<400> 249
cccacgcgtc cgcccacgcg tccgggacac cagaaacata gtacacttga gctcactcca 60
aactcaaaca ctcacaccaa tggctctcca agttcaggcc gcactcctgc cctctgctct 120
ctctgtcccc aagaagggta acttgagcgc ggtggtgaag gagccggggt tccttagcgt 180
gagcagaagg ccaagaagcc gtcgctggtg gtgagggcgg tggcgacgcg gcgggccggt 240
ggcgagcccc ggcgcgggca cgtcgaaggc ggacgggaag aagacgctgc ggcagggggt 300
ggtggtgatc accggcgcgt cgtcggggct cgggctcgcg gcggcgaagg cgcttggcgg 360
agacggggaa gtggcacgtg gtgatggcgt tccgcgactt tcctgaaggc ggcgacggcg 420
gcgaaggcgg cggggatggc ggcggggagc tacaccgtca tgcacctgga cctcgcctcc 480
ctcgacagcg tccgccagtt cgtggacaac ttccggcgct ccggcatgcc gctcgacgcg 540
ctggtgtgca acgccgcaca tctaccggcc gacggcgcgg caaccgacgt tcaacgccga 600
cgggtacgag atgagcgtcg gggtgaacca cctgggccac ttcctcctcg cccgcctcat 660
gctcgacgac ctcaagaaat ccgactaccc gtcgcggcgg ctcatcatcc tcggctccat 720
caccggcaac accaacacct tcgccggcaa cgtccctccc aaggccgggc taggcgacct 780 ccgggggctc gccggcgggc tccgcgggca gaacgggtcg gcgatgatcg acggcgcgga 840 gagcttcgac ggcgccaagg cgtacaagga cagcaagatc tgtaacatgc tgacgatgca 900 ggagttccac cggagattcc acgaggagac cgggatcacg ttcgcgtcgc tgtacccggg 960 gtgcatcgeg acgacgggct tgttccgcga gcacatcccg ctgttccggc tgctgttccc 1020 gcegttccag cggttcgtga cgaaggggtt cgtgtcggag gcggagtccg ggaagcggct 1080 ggcgcaggtg gtgggcgacc cgagcctgac caagtccggc gtgtactgga gctggaacaa 1140 ggactcggcg tcgttcgaga accagctctc gcaggaggcc agcgacccgg agaaggccag 1200 gaagctctgg gacctcagcg agaagctcgt cggcctcgtc tgagtttatt atttacccat 1260 tcgtttcaac tgttaatttc ttcggggttt agggggtttc agctttcagt gagagaggcc 1320 tgtcaagtga tgtacaatta gtaatttttt tttacccgac aaatcatgca ataaaaccac 1380 aggcttacat tatcgatttg tccacctaaa ttaagtttca actgttaatt tcttcggggt 1440 ttagggggtt tcagctttca gtgagagagg cctgtcaagt gatgtacaat tagtaatttt 1500 tttttacccg acaaatcatg caataaaacc acaggcttac attatcgatt tgtccaccta 1560 aattaagt 1568
<210> 250 <211> 1227 <212> DNA
<213> Chlamydomonas reinhardtii <400> 250
atgcaggtca ccatgaagag cagcgccgtc agcggccagc gcgtgggcgg tgcccgcgtc 60
gccacccgta gcgtgcgccg ggcgcagctg caggttgtgg cctctagccg caagcagatg 120
ggccgctggc ggtcgatcga cgcgggcgtc gacgcgtccg atgaccagca agacatcact 180
cgcggccgcg agatggtgga cgacctgttc cagggcggct tcggtgccgg cggcacccac 240
aacgcagtgc tgtccagcca ggagtaoctg agccagagcc gcgcctcgtt caacaacatt 300
gaggacggct tctacatctc gcccgctttc ctggacaaga tgaccatcca cattgccaag 360
aacttcatgg acctgcccaa gatcaaggtg cccctcattc tgggtatctg gggtggcaag 420
ggccagggca agaccttcca gtgcgcgctc gcctacaaga agctgggcat tgcccccatc 480
gtcatgtccg ctggtgagct ggagtccggc aacgccggtg agcccgccaa gctgatccgc 540
acccgctacc gggaggcctc cgacatcatc aagaagggcc gcatgtgctc gctgttcatc 600
aacgatctgg acgccggtgc cggccgcatg ggcgacacca cccagtacac cgtgaacaac 660
cagatggtga acgccaccct gatgaacatc gccgacaacc cgaccaacgt ccagctgccc 720
ggtgtgtaca agaacgagga gatccctcgc gtgcccattg tgtgcacggg caacgacttc 780
tccaccctgt acgcgcccct gatccgcgat ggccgcatgg agaagtacta Ctggaaoccc 840 acccgcgagg accgcatcgg cgtgtgcatg ggcatcttcc aggaggacaa cgttcagcgc 900 cgcgaggtgg agaacctggt ggacaccttc cccggccagt ccattgactt cttcggcgcc 960 ctgcgtgccc gcgtgtacga cgacatggtg cgccagtgga tcaccgacac cggcgtggac 1020 aagatcggcc agcagctggt caacgcccgc cagaaggtgg ccatgcccaa ggtgtccatg 1080 gacctgaacg tgctgatcaa gtacggcaag tcgctggtgg acgagcagga gaacgtcaag 1140 cgcgtgcagc tggccgatgc ctacctgtcg ggcgccgagc tggccggcca cggcggctct 1200 tccctgcccg aggcctacag ccgctaa 1227
<210> 251 <211> 408 <212> PRT
<213> Chlamydomonas reinhardtii <400> 251
Met Gln Val Thr Met Lys Ser Ser Ala Val Ser Gly Gln Arg Val Gly 10 15
Gly Ala Arg Val Ala Thr Arg Ser Val Arg Arg Ala Gln Leu Gln Val 25 30
Val Ala Ser Ser Arg Lys Gln Met Gly Arg Trp Arg Ser Ile Asp Ala 40 45
Gly Val Asp Ala Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Arg Glu 50 55 60
Met Val Asp Asp Leu Phe Gln Gly Gly Phe Gly Ala Gly Gly Thr His 65 70 75 80
Asn Ala Val Leu Ser Ser Gln Glu Tyr Leu Ser Gln Ser Arg Ala Ser 85 90 95
Phe Asn Asn Ile Glu Asp Gly Phe Tyr Ile Ser Pro Ala Phe Leu Asp 100 105 110
Lys Met Thr Ile His Ile Ala Lys Asn Phe Met Asp Leu Pro Lys Ile 115 120 125
Lys Val Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys 130 135 140
Thr Phe Gln Cys Ala Leu Ala Tyr Lys Lys Leu Gly Ile Ala Pro Ile 145 150 155 160 Val Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala 165 170 175
Lys Leu Ile Arg Thr Arg Tyr Arg Glu Ala Ser Asp Ile Ile Lys Lys 180 185 190
Gly Arg Met Cys Ser Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly 195 200 205
Arg Met Gly Asp Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn 210 215 220
Ala Thr Leu Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro 225 230 235 240
Gly Val Tyr Lys Asn Glu Glu Ile Pro Arg Val Pro Ile Val Cys Thr 245 250 255
Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg 260 265 270
Met Glu Lys Tyr Tyr Trp Asn Pro Thr Arg Glu Asp Arg Ile Gly Val 275 280 285
Cys Met Gly Ile Phe Gln Glu Asp Asn Val Gln Arg Arg Glu Val Glu 290 295 300
Asn Leu Val Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala 305 310 315 320
Leu Arg Ala Arg Val Tyr Asp Asp Met Val Arg Gln Trp Ile Thr Asp 325 330 335
Thr Gly Val Asp Lys Ile Gly Gln Gln Leu Val Asn Ala Arg Gln Lys 340 345 350
Val Ala Met Pro Lys Val Ser Met Asp Leu Asn Val Leu Ile Lys Tyr 355 360 365
Gly Lys Ser Leu Val Asp Glu Gln Glu Asn Val Lys Arg Val Gln Leu 370 375 380
Ala Asp Ala Tyr Leu Ser Gly Ala Glu Leu Ala Gly His Gly Gly Ser 385 390 395 400
Ser Leu Pro Glu Ala Tyr Ser Arg 405 <210> 252
<211> 1212
<212> DNA
<213> Chloroccum Iittorale
<400> 252
atgcagatgc agatgaagaa caccgccttc aaggccaccg gcgccaagac tgctcccaag 60 gccgtcaggg tgcccgcctg caaggcttcc aagagccagg ccggccgctg ggcagccatc 120 gacgctggca atgatatgtc cgacgaccag caagatatca cgcgcgggcg cgacatggtt 180 gactctctgt tccagggtcc tggcagcggt ggtggcaccc actctgctgt gctgtcctct 240 gaggactacc tgtccactgc ctcccgcaac ttcaacaacg ttgaggacgg cttctacatc 300 tctcctgctt tcctggataa gatgaccatc catgttgcca agaacttcat ggacctgccc 360 aagatcaagg ttcccctcat cctgggtatc tggggtggca agggccaggg aaagaccttc 420 cagtgcgccc tggcttacaa gaagctgggc atcagcccca tcgtcatgtc tgccggtgag 48Ó ctggagtctg gtaacgccgg tgagcccgcc aagctcatcc gccagcgcta ccgcgaggct 540 tccgacagcg tgaagaaggg caagatgtgc tccctcttca tcaacgatct ggacgctggt 600 gctggccgca tgggcatggg cacccagtac actgtcaaca accagatggt caacgctacc 660 ctcatgaaca tcgctgataa ccctaccaac gtgcagctgc ccggcgtgta caaggaggtg 720 cagattcccc gtgttcccat tgtctgcacg ggtaacgatt tctccaccct gtacgccccc 780 ctcatccgtg acggccgcat ggagaagtac tactggaacc ccacccgtga ggaccgcatc 840 ggcgtctgca tgggaatctt ccaggaggac aacgtcaacc gtggcgaggt cgaggtgctt 900 gtggatgcct tccccgggca gtcgatcgac ttcttcggtg ccctccgcgc ccgcgtctat 960 gatgacaagg tccgtgaatt cgtcaagaac actggtgtcg agaacctgtc caagcgcctg 1020 attaacagcc gcgagggcaa ggttgtcttc gagaagccct ctatgaacct ggatatcctg 1080 atgaagtatg gaaagttcct gaccaacgag caggagaatg tcaagcgcgt gcagctcgca 1140 gaggagtata tgatgggggc atccctggca ggcgaccacg gaacctccct ccccgagaac 1200 tacacccgct aa 1212 <210> 253 <211> 403 <212> PRT
<213> Chloroccum Iittorale <400> 253
Met Gln Met Gln Met Lys Asn Thr Ala Phe Lys Ala Thr Gly Ala Lys 10 15
Thr Ala Pro Lys Ala Val Arg Val Pro Ala Cys Lys Ala Ser Lys Ser 20 25 30 Gln Ala Gly Arg Trp Ala Ala Ile Asp Ala Gly Asn Asp Met Ser Asp 35 40 45
Asp Gln Gln Asp Ile Thr Arg Gly Arg Asp Met Val Asp Ser Leu Phe 50 55 60
Gln Gly Pro Gly Ser Gly Gly Gly Thr His Ser Ala Val Leu Ser Ser 65 70 75 80
Glu Asp Tyr Leu Ser Thr Ala Ser Arg Asn Phe Asn Asn Val Glu Asp 85 90 95
Gly Phe Tyr Ile Ser Pro Ala Phe Leu Asp Lys Met Thr Ile His Val 100 105 110
Ala Lys Asn Phe Met Asp Leu Pro Lys Ile Lys Val Pro Leu Ile Leu 115 120 125
Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Thr Phe Gln Cys Ala Leu 130 135 140
Ala Tyr Lys Lys Leu Gly Ile Ser Pro Ile Val Met Ser Ala Gly Glu 145 150 155 160
Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln Arg 165 170 175
Tyr Arg Glu Ala Ser Asp Ser Val Lys Lys Gly Lys Met Cys Ser Leu 180 185 190
Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Met Gly Thr 195 200 205
Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn Ile 210 215 220
Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Val Tyr Lys Glu Val 225 230 235 240
Gln Ile Pro Arg Val Pro Ile Val Cys Thr Gly Asn Asp Phe Ser Thr 245 250 255
Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Tyr Tyr Trp 260 265 270
Asn Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Met Gly Ile Phe Gln 275 280 285
Glu Asp Asn Val Asn Arg Gly Glu Val Glu Val Leu Val Asp Ala Phe 290 295 300
Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val Tyr 305 310 315 320
Asp Asp Lys Val Arg Glu Phe Val Lys Asn Thr Gly Val Glu Asn Leu 325 330 335
Ser Lys Arg Leu Ile Asn Ser Arg Glu Gly Lys Val Val Phe Glu Lys 340 345 350
Pro Ser Met Asn Leu Asp Ile Leu Met Lys Tyr Gly Lys Phe Leu Thr 355 360 365
Asn Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Glu Glu Tyr Met 370 375 380
Met Gly Ala Ser Leu Ala Gly Asp His Gly Thr Ser Leu Pro Glu Asn 385 390 395 400
Tyr Thr Arg
<210> 254
<211> 1224
<212> DNA
<213> Ostreococcus tauri
<400> 254
atgcgacagg ctaatgcgac gacgaagcgc gccgtcgcgc cgaagacttt cttgggcgcg 60 cgcgtgtcct ccgtctccaa cggctccaag gttgagatga gccgctggaa gggcatggac 120 atggacatct ccgacgacca acaagacatc gcgcgcggta agaacatggt tgactccaag 180 ttccaaggtg gtgccggtat cggtggtacc cacaacgccg ttatgtcttc ccaagactac 240 ttgtccgcgg gcatgaagac gtacgacggt cacgacaaca tcaccgccga aaacttctac 300 atctccaagt cttacatgga taaggtcgtc gtgcacatcg cgaagaactt catgcaactc 360 ccgaagatca aggtcccgct catcctcggt gtgtggggtg gtaagggtca aggtaagact 420 ttccagtccg acttgatctt ccgcaagctc ggtatcaace cgattgtgat gtccgctggt 480 gagctcgaat ccggcaacgc cggtgagccc gccaagctcg ttcgtcaacg ttaccgcgag 540 gcgtccgaca tcgtcaagaa gggccgtatg tccacgctct tcatcaacga tctcgatgcc 600 ggtgccggtc gtatgggcgg cacgacgcag tacaccgtga acaaccaaat ggtgaacgcg 660 acgctcatga acatcgccga caaccctacc aacgtccagt tgccgggcca atacgaagtc 720 atcgagatcc cgcgtgtgcc gatcatcgcc accggtaacg atttctccac cctttacgcg 780 ccgctcgttc gtgacggccg tatggacaag ttctactggt ccccgacctt tgaagatcgc 840 gtcggcattg ccaacggtat cttcatggct gacggcgtct ccccggaaga cgtcgaagtc 900 cttgtctcca ccttcgaagg ccagtccatt gacttcttcg gtgccctccg tgcccgcgtg 960 tacgacgaca aggtccgtga cttcatcctc tctgttggct atgatcaact cggcaagcgc 1020 ctcatcaacc cgcgcaaggg tgaagaagtt gtcttcgaac cgccggccat gaccctcgaa 1080 gtcctcttgg cctacggtaa ggagatcgaa aacgagcaag aaaacatcaa gcgcatccaa 1140 ttggccgatg cctacttgga cggtgctgtg ttggcgggct ctggcggttc ctcgaacact 1200 gacaagtctc tcaacacgaa gtaa 1224 <210> 255 <211> 407 <212> PRT
<213> Ostreococcus tauri <400> 255
Met Arg Gln Ala Asn Ala Thr Thr Lys Arg Ala Val Ala Pro Lys Thr 10 15
Phe Leu Gly Ala Arg Val Ser Ser Val Ser Asn Gly Ser Lys Val Glu 20 25 30
Met Ser Arg Trp Lys Gly Met Asp Met Asp Ile Ser Asp Asp Gln Gln 35 40 45
Asp Ile Ala Arg Gly Lys Asn Met Val Asp Ser Lys Phe Gln Gly Gly 50 55 60
Ala Gly Ile Gly Gly Thr His Asn Ala Val Met Ser Ser Gln Asp Tyr 65 70 75 80
Leu Ser Ala Gly Met Lys Thr Tyr Asp Gly His Asp Asn Ile Thr Ala 85 90 95
Glu Asn Phe Tyr Ile Ser Lys Ser Tyr Met Asp Lys Val Val Val His 100 105 110
Ile Ala Lys Asn Phe Met Gln Leu Pro Lys Ile Lys Val Pro Leu Ile 115 120 125
Leu Gly Val Trp Gly Gly Lys Gly Gln Gly Lys Thr Phe Gln Ser Asp 130 135 140 Leu Ile Phe Arg Lys Leu Gly Ile Asn Pro Ile Val Met Ser Ala Gly 145 150 155 160
Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Val Arg Gln 165 170 175
Arg Tyr Arg Glu Ala Ser Asp Ile Val Lys Lys Gly Arg Met Ser Thr 180 185 190
Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr 195 200 205
Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn 210 215 220
Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Gln Tyr Glu Val 225 230 235 240
Ile Glu Ile Pro Arg Val Pro Ile Ile Ala Thr Gly Asn Asp Phe Ser 245 250 255
Thr Leu Tyr Ala Pro Leu Val Arg Asp Gly Arg Met Asp Lys Phe Tyr 260 265 270
Trp Ser Pro Thr Phe Glu Asp Arg Val Gly Ile Ala Asn Gly Ile Phe 275 280 285
Met Ala Asp Gly Val Ser Pro Glu Asp Val Glu Val Leu Val Ser Thr 290 295 300
Phe Glu Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val 305 310 315 320
Tyr Asp Asp Lys Val Arg Asp Phe Ile Leu Ser Val Gly Tyr Asp Gln 325 330 335
Leu Gly Lys Arg Leu Ile Asn Pro Arg Lys Gly Glu Glu Val Val Phe 340 345 350
Glu Pro Pro Ala Met Thr Leu Glu Val Leu Leu Ala Tyr Gly Lys Glu 355 360 365
Ile Glu Asn Glu Gln Glu Asn Ile Lys Arg Ile Gln Leu Ala Asp Ala 370 375 380
Tyr Leu Asp Gly Ala Val Leu Ala Gly Ser Gly Gly Ser Ser Asn Thr 385 390 395 400 Asp Lys Ser Leu Asn Thr Lys 405
<210> 256 <211> 1341 <212> DNA
<213> Arabidopsis thaliana <400> 256
atggccgccg cagtttccac cgtcggtgcc atcaacagag ctccgttgag cttgaacggg 60 tcaggatcag gagctgtatc agccccagct tcaaccttct tgggaaagaa agttgtaact 120 gtgtcgagat tcgcacagag caacaagaag agcaacggat cattcaaggt gttggctgtg 180 aaagaagaca aacaaaccga tggagacaga tggagaggtc ttgcctacga cacttctgat 240 gatcaacaag acatcaccag aggcaagggt atggttgact ctgtcttcca agctcctatg 300 ggaaccggaa ctcaccacgc tgtccttagc tcatacgaat acgttagcca aggccttagg 360 cagtacaact tggacaacat gatggatggg ttttacattg ctcctgcttt catggacaag 420 cttgttgttc acatcaccaa gaacttcttg actctgccta acatcaaggt tccacttatt 480 ttgggtatat ggggaggcaa aggtcaaggt aaatccttcc agtgtgagct tgtcatggcc 540 aagatgggta tcaacccaat catgatgagt gctggagagc ttgagagtgg aaacgcagga 600 gaacccgcaa agcttatccg tcagaggtac cgtgaggcag ctgacttgat caagaaggga 660 aagatgtgtt gtctcttcat caacgatctt gacgctggtg cgggtcgtat gggtggtact 720 actcagtaca ctgtcaacaa ccagatggtt aacgcaacac tcatgaacat tgctgataac 780 ccaaccaacg tccagctccc aggaatgtac aacaaggaag agaacgcacg tgtccccatc 840 atttgcactg gtaacgattt ctccacccta tacgctcctc tcatccgtga tggacgtatg 900 gagaagttct actgggcccc gacccgtgaa gaccgtatcg gtgtctgcaa gggtatcttc 960 agaactgaca agatcaagga cgaagacatt gtcacacttg ttgatcagtt ccctggtcaa 1020 tctatcgatt tcttcggtgc tttgagggcg agagtgtacg atgatgaagt gaggaagttc 1080 gttgagagcc ttggagttga gaagatcgga aagaggctgg ttaactcaag ggaaggacct 1140 cccgtgttcg agcaacccga gatgacttat gagaagctta tggaatacgg aaacatgctt 1200 gtgatggaac aagagaatgt caagagagtc caacttgccg agacctacct cagccaggct 1260 gctttgggag acgcaaacgc tgacgccatc ggccgcggaa ctttctacgg taaaacagag 1320 gaaaaggagc ccagcaagta a 1341 <210> 257
<211> 446
<212> PRT
<213> Araiiidopsis thaliana <400> 257
Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Arg Ala Pro Leu 10 15
Ser Leu Asn Gly Ser Gly Ser Gly Ala Val Ser Ala Pro Ala Ser Thr 20 25 30
Phe Leu Gly Lys Lys Val Val Thr Val Ser Arg Phe Ala Gln Ser Asn 35 40 45
Lys Lys Ser Asn Gly Ser Phe Lys Val Leu Ala Val Lys Glu Asp Lys 50 55 60
Gln Thr Asp Gly Asp Arg Trp Arg Gly Leu Ala Tyr Asp Thr Ser Asp 65 70 75 80
Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Met Val Asp Ser Val Phe 85 90 95
Gln Ala Pro Met Gly Thr Gly Thr His His Ala Val Leu Ser Ser Tyr 100 105 110
Glu Tyr Val Ser Gln Gly Leu Arg Gln Tyr Asn Leu Asp Asn Met Met 115 120 125
Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His 130 135 140
Ile Thr Lys Asn Phe Leu Thr Leu Pro Asn Ile Lys Val Pro Leu Ile 145 150 155 160
Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu 165 170 175
Leu Val Met Ala Lys Met Gly Ile Asn Pro Ile Met Met Ser Ala Gly 180 185 190
Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln 195 200 205
Arg Tyr Arg Glu Ala Ala Asp Leu Ile Lys Lys Gly Lys Met Cys Cys 210 215 220
Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr 225 230 235 240 Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn 245 250 255
Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys 260 265 270
Glu Glu Asn Ala Arg Val Pro Ile Ile Cys Thr Gly Asn Asp Phe Ser 275 280 285
Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr 290 295 300
Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Lys Gly Ile Phe 305 310 315 320
Arg Thr Asp Lys Ile Lys Asp Glu Asp Ile Val Thr Leu Val Asp Gln 325 330 335
Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val 340 345 350
Tyr Asp Asp Glu Val Arg Lys Phe Val Glu Ser Leu Gly Val Glu Lys 355 360 365
Ile Gly Lys Arg Leu Val Asn Ser Arg Glu Gly Pro Pro Val Phe Glu 370 375 380
Gln Pro Glu Met Thr Tyr Glu Lys Leu Met Glu Tyr Gly Asn Met Leu 385 390 395 400
Val Met Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Glu Thr Tyr 405 410 415
Leu Ser Gln Ala Ala Leu Gly Asp Ala Asn Ala Asp Ala Ile Gly Arg 420 425 430
Gly Thr Phe Tyr Gly Lys Thr Glu Glu Lys Glu Pro Ser Lys 435 440 445
<210> 258 <211> 1422 <212> DNA
<213> Arabidopsis thaliana <400> 258
atggccgccg cagtttccac cgtcggtgcc atcaacagag ctccgttgag cttgaacggg tcaggatcag gagctgtatc agccccagct tcaaccttct tgggaaagaa agttgtaact
60
120
gtgtcgagat tcgcacagag caacaagaag agcaacggat cattcaaggt gttggctgtg 180 aaagaagaca aacaaaccga tggagacaga tggagaggtc ttgcctacga cacttctgat 240 ga tcaacaag acatcaccag aggcaagggt atggttgact ctgtcttcca agctcctatg 300 ggaaccggaa ctcaccacgc tgtccttagc tcatacgaat acgttagcca aggccttagg 360 cagtacaact tggacaacat gatggatggg ttttacattg ctcctgcttt catggacaag 420 cttgttgttc acatcaccaa gaacttcttg actctgccta acatcaaggt tccacttatt 480 ttgggctctc ggggaggcaa aggtcaaggt aaatccttcc agtgtgagct tgtcatggcc 540 aagatgggta tcaacccaat catgatgagt gctggagagc ttgagagtgg aaacgcagga 600 gaagtccgca agcttatccg tcagaggtac cgtgaggcag ctgacttgat caagaaggga 660 aagatgtgtt gtctcttcat caacgatctt gacgctggtg cgggtcgtat gggtggtact 720 actcagtaca ctgtcaacaa ccagatggtt aacgcaacac tcatgaacat tgctgataac 780 ccaaccaacg tccagctccc aggaatgtac aacaaggaag agaacgcacg tgtccccatc 840 atttgcactg gtaacgattt ctccacctta tacggtcctc tcatccttga tggacgtatg 900 gagaagttct tgactggccc gacccgtgaa gaccgtatcg gtgtctgggg tatcttcaga 960 actgacaaga tcaaggacga agacattgtc acacttgttg atcagttccc tggtcaatct 1020 atcgatttct tcggtgcttt gagggcgaga gtgtacgatg atgaagtgag gaagttcgtt 1080 gagagccttg gagttgagaa gatcggaaag aggctcgtta actcaaggga aggacctccc 1140 gtgttcgagc aacccgagat gacttatgag aagcttatgg aatacggaaa catgcttgtg 1200 atggaacaag agaatgtcaa gagagtccaa cttgccgaga cctacctcag ccaggctgct 1260 ttgggagacg caaacgctga cgccatcggc cgcggaactt tctacggaaa aggagcccac 1320 gaagtaaacc tgccagttcc tgaagggtgt actgatcctg tggctgaaaa ctttgatcca 1380 acggctagaa gtgacgatgg aacctgtgtc tacaactttt ga 1422 <210> 259 <211> 473 <212> PRT
<213> Arabidopsis thaliana <400> 259
Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Arg Ala Pro Leu 10 15
Ser Leu Asn Gly Ser Gly Ser Gly Ala Val Ser Ala Pro Ala Ser Thr 20 25 30
Phe Leu Gly Lys Lys Val Val Thr Val Ser Arg Phe Ala Gln Ser Asn 35 40 45 Lys Lys Ser Asn Gly Ser Phe Lys Val Leu Ala Val Lys Glu Asp Lys 50 55 60
Gln Thr Asp Gly Asp Arg Trp Arg Gly Leu Ala Tyr Asp Thr Ser Asp 65 70 75 80
Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Met Val Asp Ser Val Phe 85 90 95
Gln Ala Pro Met Gly Thr Gly Thr His His Ala Val Leu Ser Ser Tyr 100 105 110
Glu Tyr Val Ser Gln Gly Leu Arg Gln Tyr Asn Leu Asp Asn Met Met 115 120 125
Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His 130 135 140
Ile Thr Lys Asn Phe Leu Thr Leu Pro Asn Ile Lys Val Pro Leu Ile 145 150 155 160
Leu Gly Ser Arg Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu 165 170 175
Leu Val Met Ala Lys Met Gly Ile Asn Pro Ile Met Met Ser Ala Gly 180 185 190
Glu Leu Glu Ser Gly Asn Ala Gly Glu Val Arg Lys Leu Ile Arg Gln 195 200 205
Arg Tyr Arg Glu Ala Ala Asp Leu Ile Lys Lys Gly Lys Met Cys Cys 210 215 220
Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr 225 230 235 240
Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn 245 250 255
Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys 260 265 270
Glu Glu Asn Ala Arg Val Pro Ile Ile Cys Thr Gly Asn Asp Phe Ser 275 280 285
Thr Leu Tyr Gly Pro Leu Ile Leu Asp Gly Arg Met Glu Lys Phe Leu 290 295 300 Thr Gly Pro Thr Arg Glu Asp Arg Ile Gly Val Trp Gly Ile Phe Arg 305 310 315 320
Thr Asp Lys Ile Lys Asp Glu Asp Ile Val Thr Leu Val Asp Gln Phe 325 330 335
Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val Tyr 340 345 350
Asp Asp Glu Val Arg Lys Phe Val Glu Ser Leu Gly Val Glu Lys Ile 355 360 365
Gly Lys Arg Leu Val Asn Ser Arg Glu Gly Pro Pro Val Phe Glu Gln 370 375 380
Pro Glu Het Thr Tyr Glu Lys Leu Met Glu Tyr Gly Asn Met Leu Val 385 390 395 400
Met Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Glu Thr Tyr Leu 405 410 415
Ser Gln Ala Ala Leu Gly Asp Ala Asn Ala Asp Ala Ile Gly Arg Gly 420 425 430
Thr Phe Tyr Gly Lys Gly Ala His Glu Val Asn Leu Pro Val Pro Glu 435 440 445
Gly Cys Thr Asp Pro Val Ala Glu Asn Phe Asp Pro Thr Ala Arg Ser 450 455 460
Asp Asp Gly Thr Cys Val Tyr Asn Phe 465 470
<210> 260
<211> 1314
<212> DNA
<213> Acer rubrum
<400> 260
atggctgctg ctgtctcgac tgttggtgct atcaacagtg caccgctgag cttgaatggc 60 tctggtgctg ctggatccac tgtcccaacc tcagctttct tcggcacaag cttgaagaag 120 gtggcctcaa gattccccaa cccgaaggtc cactccggga gcttcaaagt tgtagcagaa 180 atagacgaga ataagcagac cgaaaaggat aaatggagag gccttgctta tgacacatcc 240 gatgaccaac aagacatcac cagaggaaag ggtttggtgg actctctctt ccaggccccc 300 agcgggaccg gaactcacta cgctgtcatg agctcttacg actacatcag cactggtctt 360 cgaacttact tggaaaacag catggatgga ttttacattg ctcccgcttt catggacaag 420 cttgttgttc acatcaccaa gaacttcatg tctctgccta acatcaagat tcctttgatc 480 ttgggtattt ggggaggcaa aggtcaggga aaatcattcc aatgtgagct tgttttcgca 540 aagatgggta ttacccctat tatgatgagt gccggagaac tggaaagtgg aaacgcggga 600 gaacccgcga agcttatcag gcaaagatat cgtgaggcag ctgatataat caagaaggga 660 aagatgtgct gcctcttcat caatgatctt gatgccggag ctggacgtat gggcggaacc 720 actcaataca cagttaacaa ccagatggtt aatgctactc tcatgaacat tgctgataat 780 ccaaccagtg tccagctccc tggaatgtac aacaaggagg aaaacccccg tgtcccaatc 840 attgtcactg gtaacgactt ttcaaccttg tatgctcctc ttatccgtga tggtcgtatg 900 gagaaattct actgggctcc taccagggaa gaccgcattg gtgtctgcaa aggaattttc 960 aggagtgaca atgttgctga tggtgaacta atcaagcttg tcgacacctt ccctggccaa 1020 tcaatcgact ttttcggtgc cctgagggcc agagtgtacg acgatgaagt gaggaagtgg 1080 atctctggca taggcgttga tagcattggg aagaaccttg tgaactcaaa gaacggaccc 1140 ccaaccttcg agcaacccaa aatgacaatc gacaagctcc ttgagtacgg aaacatgctt 1200 gtccaggagc aagagaacgt caagagagtc caattagccg acaagtacct gagcgaggct 1260 gcccttggcg atgctaacga tgatgctatc aagcgtggat ctttctacgg ttag 1314 <210> 261
<211> 437
<212> PRT
<213> Acer rubrum
<400> 261
Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Ser Ala Pro Leu 10 15
Ser Leu Asn Gly Ser Gly Ala Ala Gly Ser Thr Val Pro Thr Ser Ala 20 25 30
Phe Phe Gly Thr Ser Leu Lys Lys Val Ala Ser Arg Phe Pro Asn Pro 35 40 45
Lys Val His Ser Gly Ser Phe Lys Val Val Ala Glu Ile Asp Glu Asn 50 55 60
Lys Gln Thr Glu Lys Asp Lys Trp Arg Gly Leu Ala Tyr Asp Thr Ser 65 70 75 80
Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Leu Val Asp Ser Leu 85 90 95 Phe Gln Ala Pro Ser Gly Thr Gly Thr His Tyr Ala Val Met Ser Ser 100 105 110
Tyr Asp Tyr Ile Ser Thr Gly Leu Arg Thr Tyr Leu Glu Asn Ser Met 115 120 125
Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His 130 135 140
Ile Thr Lys Asn Phe Met Ser Leu Pro Asn Ile Lys Ile Pro Leu Ile 145 150 155 160
Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu 165 170 175
Leu Val Phe Ala Lys Met Gly Ile Thr Pro Ile Met Met Ser Ala Gly 180 185 190
Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln 195 200 205
Arg Tyr Arg Glu Ala Ala Asp Ile Ile Lys Lys Gly Lys Met Cys Cys 210 215 220
Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr 225 230 235 240
Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn 245 250 255
Ile Ala Asp Asn Pro Thr Ser Val Gln Leu Pro Gly Met Tyr Asn Lys 260 265 270
Glu Glu Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser 275 280 285
Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr 290 295 300
Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Lys Gly Ile Phe 305 310 315 320
Arg Ser Asp Asn Val Ala Asp Gly Glu Leu Ile Lys Leu Val Asp Thr 325 330 335
Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val 340 345 350 Tyr Asp Asp Glu Val Arg Lys Trp Ile Ser Gly Ile Gly Val Asp Ser 355 360 365
Ile Gly Lys Asn Leu Val Asn Ser Lys Asn Gly Pro Pro Thr Phe Glu 370 375 380
Gln Pro Lys Met Thr Ile Asp Lys Leu Leu Glu Tyr Gly Asn Met Leu 385 390 395 400
Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Asp Lys Tyr 405 410 415
Leu Ser Glu Ala Ala Leu Gly Asp Ala Asn Asp Asp Ala Ile Lys Arg 420 425 430
Gly Ser Phe Tyr Gly 435
<210> 262
<211> 1425
<212> DNA
<213> Acer rubrum
<400> 262
atggctgctg ctgtctcgac tgttggtgct atcaacagtg caccgctgag cttgaatggc 60 tctggtgctg ctggatccac tgtcccaacc tcagctttct tcggcacaag cttgaagaag 120 gtggcctcaa gattccccaa cccgaaggtc cactccggga gcttcaaagt tgtagcagaa 180 atagacgaga ataagcagac cgaaaaggat aaatggagag gccttgctta tgacacatcc 240 gatgaccaac aagacatcac cagaggaaag ggtttggtgg actctctctt ccaggccccc 300 agcgggaccg gaactcacta cgctgtcatg agctcttacg actacatcag cactggtctt 360 cgaacttact tggaaaacag catggatgga ttttacattg ctcccgcttt catggacaag 420 cttgttgttc acatcaccaa gaacttcatg tctctgccta acatcaagat tcctttgatc 480 ttgggtattt ggggaggcaa aggtcaggga aaatcattcc aatgtgagct tgttttcgca 540 aagatgggta ttacccctat tatgatgagt gccggagaac tggaaagtgg aaacgcggga 600 gaacccgcga agcttatcag gcaaagatat cgtgaggcag ctgatataat caagaaggga 660 aagatgtgct gcctcttcat caatgatctt gatgccggag ctggacgtat gggcggaacc 720 actcaataca cagttaacaa ccagatggtt aatgctactc tcatgaacat tgctgataat 780 ccaaccagtg tccagctccc tggaatgtac aacaaggagg aaaacccccg tgtcccaatc 840 attgtcactg gtaacgactt ttcaaccttg tatgctcctc ttatccgtga tggtcgtatg 900 gagaaattct actgggctcc taccagggaa gaccgcattg gtgtctgcaa aggaattttc 960 aggagtgaca atgttgctga tggtgaacta atcaagcttg tcgacacctt ccctggccaa 1020 tcaatcgact ttttcggtgc cctgagggcc agagtgtacg acgatgaagt gaggaagtgg 1080 atctctggca taggcgttga tagcattggg aagaaccttg tgaactcaaa gaacggaccc 1140 ccaaccttcg agcaacccaa aatgacaatc gacaagctcc ttgagtacgg aaacatgctt 1200 gtccaggagc aagagaacgt caagagagtc caattagccg acaagtacct gagcgaggct 1260 gcccttggcg atgctaacga tgatgctatc aagcgtggat ctttctacgg caaagcagct 1320 cagcaagtga atgttcctgt ccctgaaggt tgtactgatc gaaatgcagc aaactatgat 1380 ccaacggcaa ggagtgatga cggaagctgc cagtatacac tctag 1425 <210> 263 <211> 474 <212> PRT <213> Acer rubrum <400> 263 Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Ser Ala Pro Leu 10 15
Ser Leu Asn Gly Ser Gly Ala Ala Gly Ser Thr Val Pro Thr Ser Ala 20 25 30
Phe Phe Gly Thr Ser Leu Lys Lys Val Ala Ser Arg Phe Pro Asn Pro 35 40 45
Lys Val His Ser Gly Ser Phe Lys Val Val Ala Glu Ile Asp Glu Asn 50 55 60
Lys Gln Thr Glu Lys Asp Lys Trp Arg Gly Leu Ala Tyr Asp Thr Ser 65 70 75 80
Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Leu Val Asp Ser Leu 85 90 95
Phe Gln Ala Pro Ser Gly Thr Gly Thr His Tyr Ala Val Met Ser Ser 100 105 110
Tyr Asp Tyr Ile Ser Thr Gly Leu Arg Thr Tyr Leu Glu Asn Ser Met 115 120 125
Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His 130 135 140
Ile Thr Lys Asn Phe Met Ser Leu Pro Asn Ile Lys Ile Pro Leu Ile 145 150 155 160 Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu 165 170 175
Leu Val Phe Ala Lys Met Gly Ile Thr Pro Ile Met Met Ser Ala Gly 180 185 190
Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln 195 200 205
Arg Tyr Arg Glu Ala Ala Asp Ile Ile Lys Lys Gly Lys Met Cys Cys 210 215 220
Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr 225 230 235 240
Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn 245 250 255
Ile Ala Asp Asn Pro Thr Ser Val Gln Leu Pro Gly Met Tyr Asn Lys 260 265 270
Glu Glu Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser 275 280 285
Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr 290 295 300
Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Lys Gly Ile Phe 305 310 315 320
Arg Ser Asp Asn Val Ala Asp Gly Glu Leu Ile Lys Leu Val Asp Thr 325 330 335
Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val 340 345 350
Tyr Asp Asp Glu Val Arg Lys Trp Ile Ser Gly Ile Gly Val Asp Ser 355 360 365
Ile Gly Lys Asn Leu Val Asn Ser Lys Asn Gly Pro Pro Thr Phe Glu 370 375 380
Gln Pro Lys Met Thr Ile Asp Lys Leu Leu Glu Tyr Gly Asn Met Leu 385 390 395 400
Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Asp Lys Tyr 405
410
415
Leu Ser Glu Ala Ala Leu Gly Asp Ala Asn Asp
Asp Ala Ile Lys Arg 430
420
425
Gly Ser Phe Tyr Gly Lys Ala Ala Gln Gln Val Asn Val Pro Val Pro
435
440
445
Glu Gly Cys Thr Asp Arg Asn Ala Ala Asn Tyr
Asp Pro Thr Ala Arg 460
450
455
Ser Asp Asp Gly Ser Cys Gln Tyr Thr Leu
465
470
<210> 264 <211> 1317 <212> DNA
<213> Chenopodium quinoa <400> 264
atggctactg ctgtctcaac cgtcggagct gctaccaagg cacctttgaa cttgaatggc 60
tcgagcgctg gggcatcagt cccaacctca gctttcttag ggagcagctt aaagaagcat 120
acaagtgtga gattcccaag cagctctagg gcgagctcaa tgaccgtcaa ggcggctgac 180
tacgaggaga gcaagcagtc caacacggac agatgggctc atttggctac agacatctct 240
gatgatcaac tcgacatccg taggggtaag ggtatggttg actccctctt ccaagctccg 300
atggactccg gcacccacgt tccagttcag agttcactcg aatacgagag tcaaggtctt 360
aggaagtaca acatcgacaa catgttgggt aacttctaca ttgccccttc tttcatggac 420
aagattgttg ttcacatcac caagaactac ttgaacttgc ctaacatcaa ggttcccctg 480
atcttgggta tttggggagg caaaggtcaa ggtaaatcct tccaatgtga gcttgtgttc 540
gccaagatgg gaatcaaccc catcatgatg agtgcgggag aattggaaag tggaaacgca 600
ggagagccag caaagttgat caggcaaagg taccgtgagg cagcagacat aattgccaag 660
ggaaagatgt gtgctctgtt catcaacgat ctcgacgcgg gtgctggacg tatgggaggc 720
accacacaat acaccgtgaa caaccagatg gttaacgcca ccctcatgaa cattgctgac 780
aaccccacca atgtccaact ccctggtatg tacaacaagc aagagaacgc ccgtgttccc 840
attatcgtca ctggtaacga cttctccacc ttgtacgctc cccttatccg tgatggtcgt 900
atggagaagt tctactgggc tcccacccgt gaggaccgta tcggtgttgc caccggtatc 960
ttcaggaccg acaatgttcc tgaggaccac gttgtcaagc tcgtcgacac cttccctggc 1020
caatctattg atttcttcgg tgccttgagg gctcgtgtat acgatgatga agtaaggaag 1080
tgggtttctg aagtaggaat tgacgccgta ggaaagaagc tcgtaaactc aagggacgga 1140 ccaccagtgt tcgaacaacc aaaaatgacc ttggaaaagt tgcttgaata cggaaacatg cttgtgcaag agcaagagaa tgtoaagaga gtccaacttg ctgacaagta cttgagcgag gctgctcttg gagatgctaa caaagatgct attgcatccg gagctttctt cggttaa
<210> 265 <211> 438 <212> PRT
<213> Chenopodium quinoa <400> 265
Met Ala Thr Ala Val Ser Thr Val Gly Ala Ala Thr Lys Ala Pro Leu 10 15
Asn Leu Asn Gly Ser Ser Ala Gly Ala Ser Val Pro Thr Ser Ala Phe 20 25 30
Leu Gly Ser Ser Leu Lys Lys His Thr Ser Val Arg Phe Pro Ser Ser 35 40 45
Ser Arg Ala Ser Ser Met Thr Val Lys Ala Ala Asp Tyr Glu Glu Ser 50 55 60
Lys Gln Ser Asn Thr Asp Arg Trp Ala His Leu Ala Thr Asp Ile Ser 65 70 75 80
Asp Asp Gln Leu Asp Ile Arg Arg Gly Lys Gly Met Val Asp Ser Leu 85 90 95
Phe Gln Ala Pro Met Asp Ser Gly Thr His Val Pro Val Gln Ser Ser 100 105 110
Leu Glu Tyr Glu Ser Gln Gly Leu Arg Lys Tyr Asn Ile Asp Asn Met 115 120 125
Leu Gly Asn Phe Tyr Ile Ala Pro Ser Phe Met Asp Lys Ile Val Val 130 135 140
His Ile Thr Lys Asn Tyr Leu Asn Leu Pro Asn Ile Lys Val Pro Leu 145 150 155 160
Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys 165 170 175
Glu Leu Val Phe Ala Lys Met Gly Ile Asn Pro Ile Met Met Ser Ala 180 185 190
1200
1260
1317
Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg 195 200 205
Gln Arg Tyr Arg Glu Ala Ala Asp Xle Ile Ala Lys Gly Lys Met Cys 210 215 220
Ala Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly 225 230 235 240
Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met 245 250 255
Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn 260 265 270
Lys Gln Glu Asn Ala Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe 275 280 285
Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe 290 295 300
Tyr Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Ala Thr Gly Ile 305 310 315 320
Phe Arg Thr Asp Asn Val Pro Glu Asp His Val Val Lys Leu Val Asp 325 330 335
Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg 340 345 350
Val Tyr Asp Asp Glu Val Arg Lys Trp Val Ser Glu Val Gly Ile Asp 355 360 365
Ala Val Gly Lys Lys Leu Val Asn Ser Arg Asp Gly Pro Pro Val Phe 370 375 380
Glu Gln Pro Lys Met Thr Leu Glu Lys Leu Leu Glu Tyr Gly Asn Met 385 390 395 400
Leu Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Asp Lys 405 410 415
Tyr Leu Ser Glu Ala Ala Leu Gly Asp Ala Asn Lys Asp Ala Ile Ala 420 425 430
Ser Gly Ala Phe Phe Gly 435 <210> 266
<211> 1287
<212> DNA
<213> Deschampsia antartica
<220>
<221> misc_feature
<222> (48)..(48)
<223> η é a, c, g, or t
<22 0>
<221> aisc_feature
<222> (282)..(282)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (306)..(306)
<223> n é a, c, g, or t
<220>
<221> misc_feature
<222> (981)..(981)
<223> n é a, c, g, or t
<400> 266
atggctgctg ccttctcctc caccgtcgga gctccggctt ccacgccnac cagcttcctc 60 ggcaacaagc tcaagaagca ggtgacctcg gcagtgaact accatggcaa gagcttcaag 120 gccaacaggt tcaccgtcat ggccaaggat atcgacgagg gcaagcagac cgacggggac 180 aagtggaagg gcctcgccta cgatatctcc gacgaccagc aggacatcac caggggtaag 240 ggtatcgtcg actccttgtt ccaggcgccc atgggcgatg gnacccacga ggccgtcctc 300 agctcntacg agtacgtcag ccagggcctc aagaagtacg acttcgacaa caccatggga 360 ggcttctaca tcgccccggc tttcatggac aagctcgttg tccacctctc caagaacttc 420 atgaccctgc ccaacatcaa gatcccactc atcttgggta tctggggagg aaagggtcag 480 gggaaatcct tccagtgtga gcttgtcttc gccaagatgg gcatcaaccc aatcatgatg 540 agtgccggag agctggagag cggcaacgcc ggagagccag ccaagctcat caggcagcgg 600 taccgcgagg ccgcagacat gatcaagaag ggcaagatgt gctgcctctt catcaacgac 660 ctcgacgccg gcgcgggtcg gatgggcggg accacccagt acaccgtgaa caaccagatg 720 gtgaacgcca ccctgatgaa catcgccgac gcgcccacca acgtgcagct cccggggatg 780 tacaacaagg aggagaaccc ccgtgtcccc atcatcgtca ccggcaacga cttctcgacg 840 ctgtacgcgc ccctcatccg tgacggtcgt atggagaagt tctactgggc gcccacccgc 900 gaggaccgta tcggcgtctg caagggtatc ttccagaccg acaacgtcag cgacgagtct 960 gtcgtcaaga tcgtcgacac nttcccagga cagtccatcg acttcttcgg tgctctgcgt 1020 gctcgggtgt acgacgttga ggtgcgcaag tgggtgtcgt ccaccggaat tgagaacatc 1080 ggcaagaggc tggtgaactc gcgggacgga cccgtcacct tcgagcagcc caagatgacg 1140 gtggagaagt tgctggagta cggccacatg cttgtccagg agcaggacaa tgtcaagcgt 1200 gtgcagcttg cggacactta catgagccag gcagctctgg gtgatgcgaa caaggatgcc 1260 atgaagactg gttccttcta cggttag 1287 <210> 267 <211> 428 <212> PRT
<213> Deschampsia antartioa <400> 267
Met Ala Ala Ala Phe Ser Ser Thr Val Gly Ala Pro Ala Ser Thr Pro 10 15
Thr Ser Phe Leu Gly Asn Lys Leu Lys Lys Gln Val Thr Ser Ala Val 20 25 30
Asn Tyr His Gly Lys Ser Phe Lys Ala Asn Arg Phe Thr Val Met Ala 35 40 45
Lys Asp Ile Asp Glu Gly Lys Gln Thr Asp Gly Asp Lys Trp Lys Gly 50 55 60
Leu Ala Tyr Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys 65 70 75 80
Gly Ile Val Asp Ser Leu Phe Gln Ala Pro Met Gly Asp Gly Thr His 85 90 95
Glu Ala Val Leu Ser Ser Tyr Glu Tyr Val Ser Gln Gly Leu Lys Lys 100 105 110
Tyr Asp Phe Asp Asn Thr Met Gly Gly Phe Tyr Ile Ala Pro Ala Phe 115 120 125
Met Asp Lys Leu Val Val His Leu Ser Lys Asn Phe Met Thr Leu Pro 130 135 140
Asn Ile Lys Ile Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln 145 150 155 160
Gly Lys Ser Phe Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn 165 170 175
Pro Ile Met Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu 180 185 190 Pro Ala Lys Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ala Asp Met Ile 195 200 205
Lys Lys Gly Lys Met Cys Cys Leu Phe Ile Asn Asp Leu Asp Ala Gly 210 215 220
Ala Gly Arg Met Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met 225 230 235 240
Val Asn Ala Thr Leu Met Asn Ile Ala Asp Ala Pro Thr Asn Val Gln 245 250 255
Leu Pro Gly Met Tyr Asn Lys Glu Glu Asn Pro Arg Val Pro Ile Ile 260 265 270
Val Thr Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp 275 280 285
Gly Arg Met Glu Lys Phe Tyr Trp Ala Pro Thr Arg Glu Asp Arg Ile 290 295 300
Gly Val Cys Lys Gly Ile Phe Gln Thr Asp Asn Val Ser Asp Glu Ser 305 310 315 320
Val Val Lys Ile Val Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe 325 330 335
Gly Ala Leu Arg Ala Arg Val Tyr Asp Val Glu Val Arg Lys Trp Val 340 345 350
Ser Ser Thr Gly Ile Glu Asn Ile Gly Lys Arg Leu Val Asn Ser Arg 355 360 365
Asp Gly Pro Val Thr Phe Glu Gln Pro Lys Met Thr Val Glu Lys Leu 370 375 380
Leu Glu Tyr Gly His Met Leu Val Gln Glu Gln Asp Asn Val Lys Arg 385 390 395 400
Val Gln Leu Ala Asp Thr Tyr Met Ser Gln Ala Ala Leu Gly Asp Ala 405 410 415
Asn Lys Asp Ala Met Lys Thr Gly Ser Phe Tyr Gly 420 425
<210> 268 <211> 1398 <212> DNA
<213> Deschampsia antartica <220>
<221> misc feature
<222> (816)..(816)
<223> η é a, c, g, or t
<400> 268
atggctgctg ccttctcctc caccgtcgga gctccggctt ccacgccgac cagcttcctc 60 ggcaacaagc tcaagaagca ggtgacctcg gcagtgaact accatggcaa gagcttcaag 120 gccaacaggt tcaccgtcat ggccaaggat atcgacgagg gcaagcagac cgacggggac 180 aagtggaagg gcctcgccta cgatatctcc gacgaccagc aggacatcac caggggtaag 240 ggtatcgtcg actccctgtt ccaggcgccc atgggcgatg gcacccacga ggccgtcctc 300 agctcctacg agtacgtcag ccagggcctc aagaagtacg acttcgacaa caccatggga 360 ggcttctaca tcgccccggc tttcatggac aagctcgttg tccacctctc caagaacttc 420 atgaccctgc ccaacatcaa gatcccactc atcttgggta tctggggagg aaagggtcag 480 gggaaatcct tccagtgtga gcttgtcttc gccaagatgg gcatcaaccc aatcatgatg 540 agtgccggag agctggagag cggcaacgcc ggagagccag ccaagctcat caggcagcgg 600 taccgcgagg ccgcagacat gatcaagaag ggcaagatgt gctgcctctt catcaacgac 660 ctcgacgccg gcgcgggtcg gatgggcggg accacccagt acaccgtgaa caaccagatg 720 gtgaacgcca ccctgatgaa catcgccgac gcgcccacca acgtgcagct tccggggatg 780 tacaacaagg aggagaaccc ccgtgttccc attatngtca ccggcaacga cttttcgacg 840 ctgtacgccc cccttattcc tgacggtcgt atggagaagt tttactgggc gcccacccgc 900 gaggaccgta tcggcgtctg caagggtatc ttccagaccg acaacgtcag cgacgagtct 960 gtcgtcaaga tcgtcgacac cttcccagga cagtccatcg acttcttcgg tgctctgcgt 1020 gctcgggtgt acgacgacga ggtgcgcaag tgggtgtcgt ccaccggaat tgagaacatc 1080 ggcaagaggc tggtgaactc gcgggacgga cccgtcacct tcgagcagcc caagatgacg 1140 gtggagaagt tgctggagta cggccacatg cttgtccagg agcaggacaa tgtcaagcgt 1200 gtgcagcttg cggacactta catgagccag gcagctctgg gtgatgcgaa caaggatgcc 1260 atgaagactg gttccttcta cggtaaagga gcacaacaag gcactttgcc tgtgccggaa 1320 ggttgtaccg accgggatgc caagaacttc gacccaaccg cgaggagcga cgacggcagc 1380 tgcctttaca ccttttaa 1398 <210> 269
<211> 465
<212> PRT
<213> Deschampsia antartica <220>
<221> misc_feature <222> (272) . . (272)
<223> Xaa pode ser qualquer aminoácido que ocorre naturalmente <400> 269
Met Ala Ala Ala Phe Ser Ser Thr Val Gly Ala Pro Ala Ser Thr Pro 10 15
Thr Ser Phe Leu Gly Asn Lys Leu Lys Lys Gln Val Thr Ser Ala Val 20 25 30
Asn Tyr His Gly Lys Ser Phe Lys Ala Asn Arg Phe Thr Val Met Ala 35 40 45
Lys Asp Ile Asp Glu Gly Lys Gln Thr Asp Gly Asp Lys Trp Lys Gly 50 55 60
Leu Ala Tyr Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys 65 70 75 80
Gly Ile Val Asp Ser Leu Phe Gln Ala Pro Met Gly Asp Gly Thr His 85 90 95
Glu Ala Val Leu Ser Ser Tyr Glu Tyr Val Ser Gln Gly Leu Lys Lys 100 105 110
Tyr Asp Phe Asp Asn Thr Met Gly Gly Phe Tyr Ile Ala Pro Ala Phe 115 120 125
Met Asp Lys Leu Val Val His Leu Ser Lys Asn Phe Met Thr Leu Pro 130 135 140
Asn Ile Lys Ile Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln 145 150 155 160
Gly Lys Ser Phe Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn 165 170 175
Pro Ile Met Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu 180 185 190
Pro Ala Lys Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ala Asp Met Ile 195 200 205
Lys Lys Gly Lys Met Cys Cys Leu Phe Ile Asn Asp Leu Asp Ala Gly 210 215 220 Ala Gly Arg Met Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met 225 230 235 240
Val Asn Ala Thr Leu Met Asn Ile Ala Asp Ala Pro Thr Asn Val Gln 245 250 255
Leu Pro Gly Met Tyr Asn Lys Glu Glu Asn Pro Arg Val Pro Ile Xaa 260 265 270
Val Thr Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Pro Asp 275 280 285
Gly Arg Met Glu Lys Phe Tyr Trp Ala Pro Thr Arg Glu Asp Arg Ile 290 295 300
Gly Val Cys Lys Gly Ile Phe Gln Thr Asp Asn Val Ser Asp Glu Ser 305 310 315 320
Val Val Lys Ile Val Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe 325 330 335
Gly Ala Leu Arg Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Val 340 345 350
Ser Ser Thr Gly Ile Glu Asn Ile Gly Lys Arg Leu Val Asn Ser Arg 355 360 365
Asp Gly Pro Val Thr Phe Glu Gln Pro Lys Met Thr Val Glu Lys Leu 370 375 380
Leu Glu Tyr Gly His Met Leu Val Gln Glu Gln Asp Asn Val Lys Arg 385 390 395 400
Val Gln Leu Ala Asp Thr Tyr Met Ser Gln Ala Ala Leu Gly Asp Ala 405 410 415
Asn Lys Asp Ala Met Lys Thr Gly Ser Phe Tyr Gly Lys Gly Ala Gln 420 425 430
Gln Gly Thr Leu Pro Val Pro Glu Gly Cys Thr Asp Arg Asp Ala Lys 435 440 445
Asn Phe Asp Pro Thr Ala Arg Ser Asp Asp Gly Ser Cys Leu Tyr Thr 450 455 460
Phe 465
<210> 270
<211> 1440
<212> DNA
<213> Glycine max
<400> 270
atggctgcct ccgtctccac tgtcggagct gtcaacagag ctcttttgaa cctgaatggt 60 tctggagctg gagcttcagc tcccagttca gccttctttg ggaccagctt gaagaaggtt 120 attgcctcaa gggtccccaa cagcaaggtt tccggtggaa gcttcaagat tgttgctgta 180 gaagagaaga aagagattga agagacccag cagaccgaca aggacagatg gaagggtctt 240 gcctatgata tctcagacga ccaacaagac atcacaagag gaaagggttt ggttgactcc 300 cttttccaag ctccacagga tgctggaact cactatgcag tcatgagctc ctacgagtac 360 cttagcactg gacttcgcca gtacttggac aacaacatgg atggatttta cattgctcca 420 gcttttatgg acaagcttgt tgttcacatc agcaagaact tcatgaccct gcccaacatc 480 aaggttcctc tcattcttgg tatctgggga ggcaaaggtc aaggaaaatc tttccaatgc 540 gagcttgtct ttgccaagat gggaatcaac cocatcatga tgagtgctgg agagttggaa 600 agtggaaatg caggagagcc agcaaaactg atcagacaga gataccgtga agccgcagac 660 atgatcaaga agggaaagat gtgtgctctc ttcatcaacg atcttgatgc aggagctggt 720 cgtcttggtg gaactacaca atacactgtc aacaaccaga tggtgaatgc caccctcatg 780 aacattgctg ataaccccac caatgtgcag cttcctggta tgtacaacaa ggaagagaac 840 ccccgtgtgc ccatcatcgt caccggtaac gatttctcaa cactgtatgc tcctctcatc 900 cgtgatgggc gtatggagaa gttctactgg gcacctacaa gggacgatcg tgttggcgtc 960 tgcaatggaa ttttccgcac tgacaatgtt cctaaggatg acattgtcaa gcttgttgac 1020 accttccccg gccaatctat tgatttcttt ggtgcactca gggctagagt atatgatgat 1080 gaggtgagga agtggatttc tgttgttggt gttgacttca ttgggaagaa gcttgtgaac 1140 tccaaggaag gacctccaac ctttgaccaa ccgaagatga ctttgagcaa gctcttggag 1200 tatggtaaca tgcttgtcca agaacaagag aatgtgaaga gagtacaact ggcagacaag 1260 tacttgaaag aggctgctct tggtgatgct aatcaagatg ccatcaaaag aggaactttc 1320 tatggcaaag cagcccagca agtaaaaatt cccgttcctg aaggttgtac tgatccaaat 1380 gcctcaaact tcgacccaac tgcaagaagt gatgatggaa cctgcttata cacaccctga 1440 <210> 271
<211> 479
<212> PRT
<213> Glycine max <400> 271
Met Ala Ala Ser Val Ser Thr Val Gly Ala Val Asn Arg Ala Leu Leu 10 15
Asn Leu Asn Gly Ser Gly Ala Gly Ala Ser Ala Pro Ser Ser Ala Phe 20 25 30
Phe Gly Thr Ser Leu Lys Lys Val Ile Ala Ser Arg Val Pro Asn Ser 35 40 45
Lys Val Ser Gly Gly Ser Phe Lys Ile Val Ala Val Glu Glu Lys Lys 50 55 60
Glu Ile Glu Glu Thr Gln Gln Thr Asp Lys Asp Arg Trp Lys Gly Leu 65 70 75 80
Ala Tyr Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly 85 90 95
Leu Val Asp Ser Leu Phe Gln Ala Pro Gln Asp Ala Gly Thr His Tyr 100 105 110
Ala Val Met Ser Ser Tyr Glu Tyr Leu Ser Thr Gly Leu Arg Gln Tyr 115 120 125
Leu Asp Asn Asn Met Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp 130 135 140
Lys Leu Val Val His Ile Ser Lys Asn Phe Met Thr Leu Pro Asn Ile 145 150 155 160
Lys Val Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys 165 170 175
Ser Phe Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn Pro Ile 180 185 190
Met Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala 195 200 205
Lys Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ala Asp Met Ile Lys Lys 210 215 220
Gly Lys Met Cys Ala Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly 225 230 235 240
Arg Leu Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn 245 250 255
Ala Thr Leu Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro 260 265 270
Gly Met Tyr Asn Lys Glu Glu Asn Pro Arg Val Pro Ile Ile Val Thr 275 280 285
Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg 290 295 300
Met Glu Lys Phe Tyr Trp Ala Pro Thr Arg Asp Asp Arg Val Gly Val 305 310 315 320
Cys Asn Gly Ile Phe Arg Thr Asp Asn Val Pro Lys Asp Asp Ile Val 325 330 335
Lys Leu Val Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala 340 345 350
Leu Arg Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Ile Ser Val 355 360 365
Val Gly Val Asp Phe Ile Gly Lys Lys Leu Val Asn Ser Lys Glu Gly 370 375 380
Pro Pro Thr Phe Asp Gln Pro Lys Met Thr Leu Ser Lys Leu Leu Glu 385 390 395 400
Tyr Gly Asn Met Leu Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln 405 410 415
Leu Ala Asp Lys Tyr Leu Lys Glu Ala Ala Leu Gly Asp Ala Asn Gln 420 425 430
Asp Ala Ile Lys Arg Gly Thr Phe Tyr Gly Lys Ala Ala Gln Gln Val 435 440 445
Lys Ile Pro Val Pro Glu Gly Cys Thr Asp Pro Asn Ala Ser Asn Phe 450 455 460
Asp Pro Thr Ala Arg Ser Asp Asp Gly Thr Cys Leu Tyr Thr Pro 465 470 475
<210> 272
<211> 1317
<212> DNA
<213> Gossypium hirsutum <400> 272 ccgtctccac catcggtgct gtcaaccgag caccgttgag tttgaatgga 60 atggcggctg tcaggtgccg gagcttctgc tccaagctca gctttcatgg ggaacagctt gaagaaagtg 120 agcgctaggt tcaacaacaa cggcaaggct ccagtgggaa gtttcaagat tgtggctgcc 180 aaagaaa tcg acgaagacac acagaccgac caggaccgat ggaagggtct tgcttatgat 240 atctccgatg accaacaaga cattaccaga gggaaaggta tggtcgactc attgttccaa 300 gctcccatga acgatggtac tcactatgct gtcatgagct cctatgagta cattagccaa 360 ggccttcgca catacgactt ggacaacaac atggatggat tctacattgc cccagctttc 420 atggacaagc ttgttgttca catcaccaag aactacatga cccttcctaa cattaaggtt 480 cctcttatct tgggtatttg gggaggcaaa ggtcaaggaa aatctttcca atgtgagctt 540 gtctttgcca agatgggaat caaccccatt atgatgagtg ccggagaatt ggaaagtggg 600 aacgccggag aaccagccaa gttgatcagg caaaggtacc gtgaggccgc cgacattatc 660 aagaaaggga aaatgtgttg cctctttatc aacgatctcg acgctggagc cggtcgtatg 720 ggaggaacca cacaatacac agtgaacaac caaatggtga acgccacact catgaacatc 780 gctgataacc ccaccaacgt tcagctcccc ggtatgtaca acaaggaaga gaaccctcgt 840 gttccgatca ttgtcaccgg taacgatttc tcgacgctgt acgcgccgct catccgtgac 900 ggtcgtatgg agaagtttta ctgggcaccc accagggaag ataggatcgg tgtttgcaca 960 ggtattttca ggaccgacaa tgttcccgtt gatgacattg ttaagcttgt tgacaccttc 1020 ccgggccaat ccattgactt tttcggtgct ctgagggcca gagtttacga tgacgaagtg 1080 aggaaatgga tcggagaggt aggagtcaat agtgtcggga aaaagctcgt gaactcgagg 1140 gaagggccac catctttcga gcaacctacg atgaccattg agaagctgtt ggagtatgga 1200 aacatgcttg ttgctgaaca agagaacgtg aagagggttc aattggctga caaatatttg 1260 agtgaagctg cccttggaaa tgctaatgac gatgctatca agagaggagc tttctaa 1317 <210> 273 <211> 438 <212> PRT
<213> Gossypium hirsutum <400> 273
Met Ala Ala Ala Val Ser Thr Ile Gly Ala Val Asn Arg Ala Pro Leu 10 15
Ser Leu Asn Gly Ser Gly Ala Gly Ala Ser Ala Pro Ser Ser Ala Phe 20 25 30
Met Gly Asn Ser Leu Lys Lys Val Ser Ala Arg Phe Asn Asn Asn Gly 35 40 45
Lys Ala Pro Val Gly Ser Phe Lys Ile Val Ala Ala Lys Glu Ile Asp 50 55 60
Glu Asp Thr Gln Thr Asp Gln Asp Arg Trp Lys Gly Leu Ala Tyr Asp 65 70 75 80
Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Met Val Asp 85 90 95
Ser Leu Phe Gln Ala Pro Met Asn Asp Gly Thr His Tyr Ala Val Met 100 105 110
Ser Ser Tyr Glu Tyr Ile Ser Gln Gly Leu Arg Thr Tyr Asp Leu Asp 115 120 125
Asn Asn Met Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu 130 135 140
Val Val His Ile Thr Lys Asn Tyr Met Thr Leu Pro Asn Ile Lys Val 145 150 155 160
Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe 165 170 175
Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn Pro Ile Met Met 180 185 190
Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu 195 200 205
Ile Arg Gln Arg Tyr Arg Glu Ala Ala Asp Ile Ile Lys Lys Gly Lys 210 215 220
Met Cys Cys Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met 225 230 235 240
Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr 245 250 255
Leu Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met 260 265 270
Tyr Asn Lys Glu Glu Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn 275 280 285 Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu 290 295 300
Lys Phe Tyr Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Thr 305 310 315 320
Gly Ile Phe Arg Thr Asp Asn Val Pro Val Asp Asp Ile Val Lys Leu 325 330 335
Val Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg 340 345 350
Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Ile Gly Glu Val Gly 355 360 365
Val Asn Ser Val Gly Lys Lys Leu Val Asn Ser Arg Glu Gly Pro Pro 370 375 380
Ser Phe Glu Gln Pro Thr Met Thr Ile Glu Lys Leu Leu Glu Tyr Gly 385 390 395 400
Asn Met Leu Val Ala Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala 405 410 415
Asp Lys Tyr Leu Ser Glu Ala Ala Leu Gly Asn Ala Asn Asp Asp Ala 420 425 430
Ile Lys Arg Gly Ala Phe 435
<210> 274 <211> 1284 <212> DNA <213> Hordeum vulgare <400> 274 ccttctcctc caccgtcggg gctccggctt ctacgccgac caacttcctc 60 atggctgctg gggaagaagc tcaagaagca ggtgacctcg gccgtgaact accatggcaa gagctccaag 120 gccaacaggt tcacagtcat ggcagcggag aacatcgacg agaagaggaa caccgacaag 180 tggaagggtc ttgctaccga tatctccgac gaccagcagg acatcaccag agggaagggc 240 atcgtggact cgctcttcca ggcgcccacg ggcgacggca cccacgaggc cgtcctcagc 300 tcctacgagt acgtcagcca gggcctgcgg aagtacgact tcgacaacac catgggaggc 360 ttctacatcg ctcctgcttt catggacaag cttgttgtcc atctctccaa aaacttcatg 420 accctgccca acatcaagat cccactcatc ttgggtatct ggggaggcaa gggtcaagga 480 aaatcattcc agtgtgagct tgtgttcgcc aagatgggca tcaaccccat catgatgagt 540 gccggagagc tggagagtgg gaacgctgga gagccagcca agctcatcag gcagcggtac 600 cgtgaggctg cagacatgat caagaagggt aagatgtgct gcctcttcat caacgatctt 660 gacgctggtg cgggtaggat gggcggaacc acgcagtaca ccgtcaacaa ccagatggtg 720 aacgccaccc tgatgaacat cgccgatgcc cccaccaacg tgcagctccc tggcatgtac 780 aacaagaggg agaacccccg tgtgcccatc gtcgtcaccg gtaacgattt ctcgacgctc 840 tacgctcctc tgatccgtga tggtcgtatg gagaagttct actgggctcc cacccgtgac 900 gaccgtatcg gtgtctgcaa gggtatcttc cagaccgaca atgtctgtga cgagtctgtc 960 gtaaagatcg tcgacacctt cccaggacaa tccattgact ttttcggtgc tctgcgtgct 1020 cgggtgtacg acgatgaggt gcgcaagtgg gtcggctcta ccggaatcga gaacattggc 1080 aagaggctgg tgaactcgcg ggacgggccc gtgaccttcg agcagccaaa gatgacagtc 1140 gagaagctgc tagagtacgg gcacatgctc gtccaggagc aggacaatgt caagcgtgtg 1200 cagcttgctg acacctacat gagccaggca gctctgggtg atgctaacca ggatgcgatg 1260 aagactggtt ccttctacgg ttag 1284 <210> 275 <211> 427 <212> PRT
<213> Hordeum vulgare <400> 275
Met Ala Ala Ala Phe Ser Ser Thr Val Gly Ala Pro Ala Ser Thr Pro 10 15
Thr Asn Phe Leu Gly Lys Lys Leu Lys Lys Gln Val Thr Ser Ala Val 20 25 30
Asn Tyr His Gly Lys Ser Ser Lys Ala Asn Arg Phe Thr Val Met Ala 35 40 45
Ala Glu Asn Ile Asp Glu Lys Arg Asn Thr Asp Lys Trp Lys Gly Leu 50 55 60
Ala Thr Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly 65 70 75 80
Ile Val Asp Ser Leu Phe Gln Ala Pro Thr Gly Asp Gly Thr His Glu 85 90 95
Ala Val Leu Ser Ser Tyr Glu Tyr Val Ser Gln Gly Leu Arg Lys Tyr 100 105 110 Asp Phe Asp Asn Thr Met Gly Gly Phe Tyr Ile Ala Pro Ala Phe Met 115 120 125
Asp Lys Leu Val Val His Leu Ser Lys Asn Phe Met Thr Leu Pro Asn 130 135 140
Ile Lys Ile Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly 145 150 155 160
Lys Ser Phe Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn Pro 165 170 175
Ile Met Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro 180 185 190
Ala Lys Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ala Asp Met Ile Lys 195 200 205
Lys Gly Lys Met Cys Cys Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala 210 215 220
Gly Arg Met Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val 225 230 235 240
Asn Ala Thr Leu Met Asn Ile Ala Asp Ala Pro Thr Asn Val Gln Leu 245 250 255
Pro Gly Met Tyr Asn Lys Arg Glu Asn Pro Arg Val Pro Ile Val Val 260 265 270
Thr Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly 275 280 285
Arg Met Glu Lys Phe Tyr Trp Ala Pro Thr Arg Asp Asp Arg Ile Gly 290 295 300
Val Cys Lys Gly Ile Phe Gln Thr Asp Asn Val Cys Asp Glu Ser Val 305 310 315 320
Val Lys Ile Val Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly 325 330 335
Ala Leu Arg Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Val Gly 340 345 350
Ser Thr Gly Ile Glu Asn Ile Gly Lys Arg Leu Val Asn Ser Arg Asp 355 360 365 Gly Pro Val Thr Phe Glu Gln Pro Lys Met Thr Val Glu Lys Leu Leu
370
375
380
Glu Tyr Gly His Met Leu Val Gln Glu Gln Asp Asn Val Lys Arg Val
385
390
395
400
Gln Leu Ala Asp Thr Tyr Met Ser Gln Ala Ala Leu Gly Asp Ala Asn
405
410
415
Gln Asp Ala Met Lys Thr Gly Ser Phe Tyr Gly
420
425
<210> 276 <211> 1278 <212> DNA
<213> Hordeum vulgare <400> 276
atggcttctg ctttctcgtc caccgttgga gctccggcgt cgaccccgac catcttcctg 60
ggcaagaagg tgaagaacta ctaccatggt ggcaacaaga tgaagagcag ggtggtgagg 120
gtcatggcgg ccaaaaagga acttgaccag ggcaagcaga ccgatgcgga ccggtggaag 180
ggtctggcct acgacatctc ggacgaccag caggacatca ctcgggggaa aggcatcgtg 240
gactccctgt tccaggcccc catgggcgac ggcacccacg aggccatcct aagctcctac 300
gagtacatca gccagggcct gcggaagtac gacttcgaca acaccatgga cgggctgtac 360
atcgcgccgg cattcatgga caagctcatc gtccacctcg ccaagaactt catgacactc 420
cccaacatca aggttcctct catcctgggt atctggggag gcaagggaca gggcaagtcg 480
ttccagtgtg agctggtgtt cgccaagatg ggcatcaacc ccatcatgat gagcgccggt 540
gagctggaga gcggcaacgg cgagccggcc aagctgatcc ggcagaggta ccgcgaggcg 600
gccgacatta tcaacaaggg caagatgtgc tgcctcttca tcaacgacct ggacgccggc 660
gcgggccgga tgggcgggac gacgcagtac acggtgaaca accagatggt gaacgccacc 720
ctgatgaaca tcgcggacgc gcccaccaac gtgcagctcc cggggatgta caacaaggag 780
gagaaccccc gcgtgcccat catcgtcacc ggcaacgact tctcgacgct gtacgctccc 840
ctgatccgtg acgggcgcat ggagaagttc tactgggcgc ocacccgcga ggaccgcatc 900
ggcgtgtgca agggcatctt ccgcaccgac aacgtcccgg acgaggccgt ggtgaggctg 960
gtggacacct tcccggggca gtccatcgac ttcttcggcg cgctgcgggc acgggtgtac 1020
gacgacgagg tgcgcaagtg ggtcggcgag atcggcgtgg agaacatctc caagcgcctc 1080
gtcaactcca gggaggggcc gcccacgttc gaccagccca agatgaccat agagaagctc 1140
atggagtacg gccacatgct ggtccaggag caggagaacg tcaagcgtgt gcagctcgcc 1200 gacaagtacc tcagcgaggc ggcgctcggc caagccaacg acgacgccat gaagaccggt gccttctacg gcaagtag
<210> 277 <211> 425 <212> PRT
<213> Hordeiain vulgare <400> 277
Met Ala Ser Ala Phe Ser Ser Thr Val Gly Ala Pro Ala Ser Thr Pro 10 15
Thr Ile Phe Leu Gly Lys Lys Val Lys Asn Tyr Tyr His Gly Gly Asn 20 25 30
Lys Met Lys Ser Arg Val Val Arg Val Met Ala Ala Lys Lys Glu Leu 35 40 45
Asp Gln Gly Lys Gln Thr Asp Ala Asp Arg Trp Lys Gly Leu Ala Tyr 50 55 60
Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Ile Val 65 70 75 80
Asp Ser Leu Phe Gln Ala Pro Met Gly Asp Gly Thr His Glu Ala Ile 85 90 95
Leu Ser Ser Tyr Glu Tyr Ile Ser Gln Gly Leu Arg Lys Tyr Asp Phe 100 105 110
Asp Asn Thr Met Asp Gly Leu Tyr Ile Ala Pro Ala Phe Met Asp Lys 115 120 125
Leu Ile Val His Leu Ala Lys Asn Phe Met Thr Leu Pro Asn Ile Lys 130 135 140
Val Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser 145 150 155 160
Phe Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn Pro Ile Met 165 170 175
Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Gly Glu Pro Ala Lys Leu 180 185 190
1260
1278
Ile Arg Gln Arg Tyr Arg Glu Ala Ala Asp Ile Ile Asn Lys Gly Lys 195 200 205 Met Cys Cys Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met 210 215 220
Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr 225 230 235 240
Leu Met Asn Ile Ala Asp Ala Pro Thr Asn Val Gln Leu Pro Gly Met 245 250 255
Tyr Asn Lys Glu Glu Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn 260 265 270
Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu 275 280 285
Lys Phe Tyr Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Lys 290 295 300
Gly Ile Phe Arg Thr Asp Asn Val Pro Asp Glu Ala Val Val Arg Leu 305 310 315 320
Val Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg 325 330 335
Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Val Gly Glu Ile Gly 340 345 350
Val Glu Asn Ile Ser Lys Arg Leu Val Asn Ser Arg Glu Gly Pro Pro 355 360 365
Thr Phe Asp Gln Pro Lys Met Thr Ile Glu Lys Leu Met Glu Tyr Gly 370 375 380
His Met Leu Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala 385 390 395 400
Asp Lys Tyr Leu Ser Glu Ala Ala Leu Gly Gln Ala Asn Asp Asp Ala 405 410 415
Met Lys Thr Gly Ala Phe Tyr Gly Lys 420 425
<210> 278
<211> 1308
<212> DNA
<213> Larrea tridentata <220>
<221> misc_feature
<222> (60) . . (60)
<223> η é a, c, g, or t
<220>
<221> misc_feature
<222> (1110) . . (1110)
<223> n é a, c, g, or t
<400> 278
atggctgctg cctactccac cgtcggagct gtcaacaggg caccgctgag cttgaatggn 60 tctggtgcga gagcttcatt ggttccaagc actgccttct tcggcagcag cttgaagaaa 120 tctgctgcga aattccccaa ggcgtcatca ggaaacttca agattgttgc acaagaaatt 180 agtgaggatc agcagaccga caaggacaaa tggaagggtc ttgcctatga catttctgat 240 gatcaacagg atatcactag aggaaagggt atggttgata ctctcttcca agctcccatg 300 caatctggca ctcactatgc tgtcatgagt tcttacgact acatcagtca aggacttcgc 360 cagtacaact tggacaacaa catggacggt ttctacatag caccagcctt catggacaag 420 cttgtcgtcc acatcaccaa gaacttcttg agtctcccta acatcaagat tcctctgatc 480 ttgggtatct ggggaggcaa aggtcaagga aaatctttcc aatgtgaact tgtttttgcc 540 aagatgggaa tcaaccccat catgatgagt gctggagagc tggaaagtgg aaatgcagga 600 gaacctgcca agctgatcag gcaaaggtac cgtgaagctg ctgacattat caagaagggt 660 aaaatgtgct gcctgttcat caacgatctc gacgctggag ctggtcgtat gggtggaaca 720 actcaataca ctgttaacaa ccagatggtg aatgccaccc tcatgaacat tgctgacaac 780 ccaacaaatg tccagctccc tggtatgtac aacaaggaag agaaccctcg tgtgcctatc 840 attgtcactg gtaacgactt ctcgacattg tacgctcctc ttatccgtga tggtcgtatg 900 gaaaaattct actgggctcc taccagggaa gaccgtattg gtgtctgcaa gggtattttc 960 aggactgaca atgttcctga agaagacatt gtcaaggttg tagaccaatt ccctggtcaa 1020 tctattgatt tctttggagc cctgagggca agagtgtacg atgatgaagt gaggaagtgg 1080 gtttccgaag tcggtgtcga caccatcggn aagaagctgg tgaactcaaa ggaaggaccc 1140 ccaacatttg agcagcccaa gatgaccatt gataagctcc tgcaatatgg aaacatgctt 1200 gtggaagagc aagaaaatgt gaagagagtc caattggctg acaagtacat gagtgaggct 1260 gcccttggtg atgctaacca ggatgctatt aagaggggaa ctttctaa 1308 <210> 279
<211> 435
<212> PRT
<213> Larrea tridentata
<400> 279 Met Ala Ala Ala Tyr Ser Thr Val Gly Ala Val Asn Arg Ala Pro Leu 10 15
Ser Leu Asn Gly Ser Gly Ala Arg Ala Ser Leu Val Pro Ser Thr Ala 20 25 30
Phe Phe Gly Ser Ser Leu Lys Lys Ser Ala Ala Lys Phe Pro Lys Ala 35 40 45
Ser Ser Gly Asn Phe Lys Ile Val Ala Gln Glu Ile Ser Glu Asp Gln 50 55 60
Gln Thr Asp Lys Asp Lys Trp Lys Gly Leu Ala Tyr Asp Ile Ser Asp 65 70 75 80
Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Met Val Asp Thr Leu Phe 85 90 95
Gln Ala Pro Met Gln Ser Gly Thr His Tyr Ala Val Met Ser Ser Tyr 100 105 110
Asp Tyr Ile Ser Gln Gly Leu Arg Gln Tyr Asn Leu Asp Asn Asn Met 115 120 125
Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His 130 135 140
Ile Thr Lys Asn Phe Leu Ser Leu Pro Asn Ile Lys Ile Pro Leu Ile 145 150 155 160
Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu 165 170 175
Leu Val Phe Ala Lys Met Gly Ile Asn Pro Ile Met Met Ser Ala Gly 180 185 190
Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln 195 200 205
Arg Tyr Arg Glu Ala Ala Asp Ile Ile Lys Lys Gly Lys Met Cys Cys 210 215 220
Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr 225 230 235 240
Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn 245 250 255 Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys 260 265 270
Glu Glu Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser 275 280 285
Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr 290 295 300
Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Lys Gly Ile Phe 305 310 315 320
Arg Thr Asp Asn Val Pro Glu Glu Asp Ile Val Lys Val Val Asp Gln 325 330 335
Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val 340 345 350
Tyr Asp Asp Glu Val Arg Lys Trp Val Ser Glu Val Gly Val Asp Thr 355 360 365
Ile Gly Lys Lys Leu Val Asn Ser Lys Glu Gly Pro Pro Thr Phe Glu 370 375 380
Gln Pro Lys Met Thr Ile Asp Lys Leu Leu Gln Tyr Gly Asn Met Leu 385 390 395 400
Val Glu Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Asp Lys Tyr 405 410 415
Met Ser Glu Ala Ala Leu Gly Asp Ala Asn Gln Asp Ala Ile Lys Arg 420 425 430
Gly Thr Phe 435
<210> 280
<211> 1380
<212> DNA
<213> Lycopersicon pennellii
<400> 280
atggctgcct cagtgtcaac cattggagct gccagcaaag caccattgag tttgaacaac 60 tcagttgctg gaacttccgt tccaagcaca gccttctttg gaaaatcctt gaaaaaagtg 120 tatgcaaaag gtgtttccag ccccaaggtt tcaaacagga acttgagggt tgtagctcaa 180 gaagtagacg aaacgaaaga ggacagatgg aagggtcttt atgataacac atcggatgac 240 caacaggaca ttgcaagggg taagggtctg gtcgacagtc ttttccaggc tcctaccggt 300 actggtactc accacgccat catgaattcc tacgaatacg tcagccaggc tcttaaaacg 360 taccaattgg acaacaaatt ggacggcttc tacattgccc ctgctttcat ggacaaactt 420 gttgttcaca tcaccaagaa cttcttgaca ttgcccaaca tcaaggttcc actcatcttg 480 ggtgtatggg gaggcaaagg tcaaggtaaa tcattccaat gtgagcttgt cttcagaaag 540 atgggaatca accccattat gatgagtgct ggagaattgg aaagtggaaa tgcaggagag 600 ccagctaaat tgattaggca aaggtacaga gaggcagctg aaatcatcag gaaaggaaac 660 atgtgttgtc tcttcatcaa cgatctcgat gcaggagctg gtagaatggg tggaactacc 720 caatacaccg tcaacaacca gatggtgaat gccaccctca tgaacattgc tgacaaccca 780 acaaatgtcc agctccccgg tatgtacaac aagcaagaga acgccagggt acccattatt 840 gtcactggta acgacttctc cacattgtat gctcctctta tccgtgatgg tcgtatggag 900 aagttctact gggcaccaac tagggaggat agaattggtg tttgcaaggg tattttcaga 960 actgacaacg tccctgagga agctgttgta aagattgtcg attccttccc tggacaatct 1020 attgatttct ttggtgcttt gagggcccga gtatatgacg atgaagtgag gaaatgggtt 1080 tcaggaactg gaattgaact cattggtgaa aaacttttga actctagaga tggaccccca 1140 acttttgagc aaccaaaaat gacccttgag aagctccttg agtatggtaa catgcttgtt 1200 caagagcaag agaatgtcaa gagagtccag ttggctgaaa cctatcttaa agaggcagct 1260 ctcggagatg ctaacgctga tgccatcaac actggaattt ctaagaactt caccaatctc 1320 aaaagtcgtc taaacaatga agaggcgaaa aaagcgcgac atgtcaactt ccaggagtga 1380 <210> 281 <211> 459 <212> PRT
<213> Lycopersicon pennellii <400> 281
Met Ala Ala Ser Val Ser Thr Ile Gly Ala Ala Ser Lys Ala Pro Leu 10 15
Ser Leu Asn Asn Ser Val Ala Gly Thr Ser Val Pro Ser Thr Ala Phe 20 25 30
Phe Gly Lys Ser Leu Lys Lys Val Tyr Ala Lys Gly Val Ser Ser Pro 35 40 45
Lys Val Ser Asn Arg Asn Leu Arg Val Val Ala Gln Glu Val Asp Glu 50 55 60
Thr Lys Glu Asp Arg Trp Lys Gly Leu Tyr Asp Asn Thr Ser Asp Asp 65 70 75 80
Gln Gln Asp Ile Ala Arg Gly Lys Gly Leu Val Asp Ser Leu Phe Gln 85 90 95
Ala Pro Thr Gly Thr Gly Thr His His Ala Ile Met Asn Ser Tyr Glu 100 105 110
Tyr Val Ser Gln Ala Leu Lys Thr Tyr Gln Leu Asp Asn Lys Leu Asp 115 120 125
Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His Ile 130 135 140
Thr Lys Asn Phe Leu Thr Leu Pro Asn Ile Lys Val Pro Leu Ile Leu 145 150 155 160
Gly Val Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu Leu 165 170 175
Val Phe Arg Lys Met Gly Ile Asn Pro Ile Met Met Ser Ala Gly Glu 180 185 190
Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln Arg 195 200 205
Tyr Arg Glu Ala Ala Glu Ile Ile Arg Lys Gly Asn Met Cys Cys Leu 210 215 220
Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr Thr 225 230 235 240
Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn Ile 245 250 255
Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys Gln 260 265 270
Glu Asn Ala Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser Thr 275 280 285
Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr Trp 290 295 300
Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Lys Gly Ile Phe Arg 305 310 315 320 Thr Asp Asn Val Pro Glu Glu Ala Val Val Lys Ile Val Asp Ser Phe
Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val Tyr
Asp Asp Glu Val Arg Lys Trp Val Ser Gly Thr Gly Ile Glu Leu Ile
Gly Glu Lys Leu Leu Asn Ser Arg Asp Gly Pro Pro Thr Phe Glu Gln
Pro Lys Met Thr Leu Glu Lys Leu Leu Glu Tyr Gly Asn Met Leu Val
Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Glu Thr Tyr Leu
Lys Glu Ala Ala Leu Gly Asp Ala Asn Ala Asp Ala Ile Asn Thr Gly
Ile Ser Lys Asn Phe Thr Asn Leu Lys Ser Arg Leu Asn Asn Glu Glu
Ala Lys Lys Ala Arg His Val Asn Phe Gln Glu
<210> 282 <211> 1314 <212> DNA
<213> Malus domestica <400> 282
atggccactg ctgtctctac cattggatct gtcaacagag caccgccgaa cctgaatggc 60
tctagcagca gtgcttcagt tccaagctca acctttttgg gaagcagctt gaagaaagtg 120
aactcaaggt tcacgaactc caaggtttcc tccgggagtc tcaggattgt cgcgagtgtg 180
gacgaagata agcagaccga caaggacaga tggaaaggcc ttgccttcga cacctccgac 240
gaccaacaag acatcacaag aggaaagggt aaggtggact ccctcttcca ggcacctcaa 300
ggatcaggaa ctcactttgc catcatgagc tcttatgaat acatcagcac gggccttcgc 360
cagtacaact ttgacaataa catggacggt tattatattg ctcccgcttt tatggacaag 420
cttgttgttc acatcaccaa gaacttcatg acccttccta acatgaaggt tcctctcatc 480
ttgggtattt ggggaggcaa aggtcagggc aagtctttcc agtgcgagct tgtctttgcc 540
aagatgagaa tcagccctat catgatgagt gccggagaat tggaaagtgg aaacgcagga 600
gaacccgcga agctgatcag gcaaaggtac cgtgaagcag ccgacattat caggaagggt 660 aaaatgtgtg cactcttcat caacgatctt gatgcaggag ctggtcggct tggtggaacc 720 acccaataca ctgtcaacaa ccaaatggtg aatgccaccc tcatgaacat tgctgataac 780 ccgacaaacg tccagcttcc aggtatgtac aacaaggagg agaacccccg tgtcccaatc 840 attgtcaccg gtaacgattt ctcaacattg tacgctcctc tcatccgtga cggtcgtatg 900 gagaagttct actgggctcc cacccgcgaa gatcgtattg gagtctgcat tgggatcttc 960 aggagtgaca atgttgctaa ggaagacatt gtcaagcttg ttgacacctt cccaggccaa 1020 tctattgatt tctttggtgc cttgagggct agggtttacg acgatgaagt gaggaagtgg 1080 attacgggtg ttggcgtgga tagcattggg aagaagcttg tgaactcaaa ggaaggaccc 1140 ccaactttcg agcagccgaa gatgactatc gaaaagctcc tcgagtacgg aaacatgctt 1200 gtccaagagc aagagaatgt gaagagagtt caattggctg ataagtactt gagcgaggct 1260 gctcttggtg atgctaactc agatgctatg aatacaggaa ctttctatgg ttag 1314 <210> 283 <211> 437 <212> PRT
<213> Malus domestica <400> 283
Met Ala Thr Ala Val Ser Thr Ile Gly Ser Val Asn Arg Ala Pro Pro 10 15
Asn Leu Asn Gly Ser Ser Ser Ser Ala Ser Val Pro Ser Ser Thr Phe 20 25 30
Leu Gly Ser Ser Leu Lys Lys Val Asn Ser Arg Phe Thr Asn Ser Lys 35 40 45
Val Ser Ser Gly Ser Leu Arg Ile Val Ala Ser Val Asp Glu Asp Lys 50 55 60
Gln Thr Asp Lys Asp Arg Trp Lys Gly Leu Ala Phe Asp Thr Ser Asp 65 70 75 80
Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Lys Val Asp Ser Leu Phe 85 90 95
Gln Ala Pro Gln Gly Ser Gly Thr His Phe Ala Ile Met Ser Ser Tyr 100 105 110
Glu Tyr Ile Ser Thr Gly Leu Arg Gln Tyr Asn Phe Asp Asn Asn Met 115 120 125 Asp Gly Tyr Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His 130 135 140
Ile Thr Lys Asn Phe Met Thr Leu Pro Asn Met Lys Val Pro Leu Ile 145 150 155 160
Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu 165 170 175
Leu Val Phe Ala Lys Met Arg Ile Ser Pro Ile Met Met Ser Ala Gly 180 185 190
Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln 195 200 205
Arg Tyr Arg Glu Ala Ala Asp Ile Ile Arg Lys Gly Lys Met Cys Ala 210 215 220
Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Leu Gly Gly Thr 225 230 235 240
Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn 245 250 255
Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys 260 265 270
Glu Glu Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser 275 280 285
Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr 290 295 300
Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Ile Gly Ile Phe 305 310 315 320
Arg Ser Asp Asn Val Ala Lys Glu Asp Ile Val Lys Leu Val Asp Thr 325 330 335
Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val 340 345 350
Tyr Asp Asp Glu Val Arg Lys Trp Ile Thr Gly Val Gly Val Asp Ser 355 360 365
Ile Gly Lys Lys Leu Val Asn Ser Lys Glu Gly Pro Pro Thr Phe Glu 370 375 380 Gln Pro Lys Met Thr Ile Glu Lys Leu Leu Glu Tyr Gly Asn Met Leu 385 390 395 400
Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Asp Lys Tyr 405 410 415
Leu Ser Glu Ala Ala Leu Gly Asp Ala Asn Ser Asp Ala Met Asn Thr 420 425 430
Gly Thr Phe Tyr Gly 435
<210> 284
<211> 1329
<212> DNA
<213> Nicotiana tabacum
<400> 284
atggctacct ctgtctcaac cattggagct gttaacaaaa caccgttgag tttgaacaac 60 tcagttgctg gaacttcagt tccaagcaca gccttctttg gcaaaacttt gaagaaagtg 120 tatggaaaag gtgtttcaag ccccaaggtt acaaacaaga gcttgaggat tgtagctgaa 180 caaatagatg ttgatccgaa gaaacagacc gacagtgaca gatggaaggg tcttgtccaa 240 gacttctccg atgatcaaca ggacatcacc cggggtaagg gtatggttga cagtcttttc 300 caggctccaa cgggtactgg tactcaccac gctgtgttgc aatcctacga atacgtcagc 360 caaggtcttc gccagtacaa cttggacaac aagttggacg gattctacat cgctcctgct 420 ttcatggaca agcttgttgt tcacatcacc aagaacttct tgaaattgcc caacatcaag 480 gttecactta tcttgggtat ctggggaggc aaaggtcaag gcaaatcatt ccagtgtgaa 540 cttgtcttca gaaagatggg aatcaacccc attatgatga gtgctggaga attggaaagt 600 ggaaatgcag gagagccagc caagttgatt aggcaaaggt acagagaagc agcagaaatc 660 atcagaaagg gaaatatgtg ttgcctcttc atcaacgatc tcgatgcagg agctggtaga 720 atgggtggaa ctacccaata cactgtcaac aaccaaatgg tgaatgccac tctcatgaac 780 attgctgaca acccgacaaa tgtccagctc cccggtatgt acaacaagca agagaatgcc 840 agggtcccta ttatcgtcac tggtaacgat ttctccacat tgtatgctcc acttatccgt 900 gatggtcgta tggagaagtt ctactgggca ccaactaggg aagacagaat tggtgtttgc 960 acaggtattt tcaggaccga caatgttcct gctgaagacg ttgtcaagat tgttgataac 1020 ttccctggac aatctatcga cttttttggt gcactgaggg cgagagtata cgatgatgaa 1080 gtaaggaagt gggtatcagg cactggaatt gaaaagattg gagacaaact tttgaactct 1140 tttgacggac caccaacttt tgagcaacca aagatgacca ttgagaagct cctcgagtac 1200 ggtaatatgc ttgtacaaga gcaagaaaat gtgaagagag ttcagttggc tgacaaatac ctcaaagagg ctgcacttgg tgatgccaat gctgatgcca ttaacaatgg atccttcttt gctagttag
<210> 285 <211> 442 <212> PRT
<213> Nicotiana tabacum <400> 285
Met Ala Thr Ser Val Ser Thr Ile Gly Ala Val Asn Lys Thr Pro Leu 10 15
Ser Leu Asn Asn Ser Val Ala Gly Thr Ser Val Pro Ser Thr Ala Phe 20 25 30
Phe Gly Lys Thr Leu Lys Lys Val Tyr Gly Lys Gly Val Ser Ser Pro 35 40 45
Lys Val Thr Asn Lys Ser Leu Arg Ile Val Ala Glu Gln Ile Asp Val 50 55 60
Asp Pro Lys Lys Gln Thr Asp Ser Asp Arg Trp Lys Gly Leu Val Gln 65 70 75 80
Asp Phe Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Met Val 85 90 95
Asp Ser Leu Phe Gln Ala Pro Thr Gly Thr Gly Thr His His Ala Val 100 105 110
Leu Gln Ser Tyr Glu Tyr Val Ser Gln Gly Leu Arg Gln Tyr Asn Leu 115 120 125
Asp Asn Lys Leu Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys 130 135 140
Leu Val Val His Ile Thr Lys Asn Phe Leu Lys Leu Pro Asn Ile Lys 145 150 155 160
Val Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser 165 170 175
Phe Gln Cys Glu Leu Val Phe Arg Lys Met Gly Ile Asn Pro Ile Met 180 185 190
1260
1320
1329
Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys 195 200 205
Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ala Glu Ile Ile Arg Lys Gly 210 215 220
Asn Met Cys Cys Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg 225 230 235 240
Met Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala 245 250 255
Thr Leu Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly 260 265 270
Met Tyr Asn Lys Gln Glu Asn Ala Arg Val Pro Ile Ile Val Thr Gly 275 280 285
Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met 290 295 300
Glu Lys Phe Tyr Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys 305 310 315 320
Thr Gly Ile Phe Arg Thr Asp Asn Val Pro Ala Glu Asp Val Val Lys 325 330 335
Ile Val Asp Asn Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu 340 345 350
Arg Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Val Ser Gly Thr 355 360 365
Gly Ile Glu Lys Ile Gly Asp Lys Leu Leu Asn Ser Phe Asp Gly Pro 370 375 380
Pro Thr Phe Glu Gln Pro Lys Met Thr Ile Glu Lys Leu Leu Glu Tyr 385 390 395 400
Gly Asn Met Leu Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu 405 410 415
Ala Asp Lys Tyr Leu Lys Glu Ala Ala Leu Gly Asp Ala Asn Ala Asp 420 425 430
Ala Ile Asn Asn Gly Ser Phe Phe Ala Ser 435 440 <210> 286 <211> 1401 <212> DNA
<213> Oryza sativa <400> 286
atggctgctg ccttctcctc caccgttgga gctccggcgt ccactccgac caacttcctg 60 gggaagaagc tgaagaagca ggtgacatcg gcggtgaact accatggcaa gagctccaac 120 atcaacaggt tcaaggtgat ggccaaggag ctggacgagg gcaagcagac cgaccaggac 180 aggtggaagg gtctcgccta cgacatctcc gatgaccagc aggacatcac cagggggaag 240 ggtttcgtcg actccctttt ccaggctccc acgggtgatg gcacccacga ggccgtcctc 300 agctcctacg agtacctcag ccagggtctc agaacgtacg acttcgacaa caccatggga 360 ggcttctaca tcgcccctgc tttcatggac aagctcgtcg tccacatctc caagaacttc 420 atgaccctcc ccaacatcaa ggtcccactc atcctgggta tctggggagg caagggtcag 480 ggaaaatcct tccagtgtga gctcgtcttc gccaagatgg ggatcaaccc catcatgatg 540 agcgccggag agctggagag cggcaacgcc ggagagccgg cgaagctgat caggcagcgg 600 taccgtgagg cggcagacat catcaagaag gggaagatgt gctgcctctt catcaacgat 660 ctggacgcgg gtgcaggtcg catgggaggc accacccagt acacggtgaa caaccagatg 720 gtgaacgcca ccctgatgaa catcgccgac aacccaacca acgtgcagct ccccgggatg 780 tacaacaagg aggacaaccc ccgtgtcccc atcatcgtca ccggcaacga cttctccacg 840 ctgtacgcgc cgctcatccg tgacgggcgt atggagaagt tctactgggc tcccacccgc 900 gacgaccgtg tcggcgtctg caagggtatc ttccgcaccg acaacgtccc cgacgaggac 960 atcgtcaaga tcgtcgacag cttcccaggc caatccatcg atttcttcgg cgctcttcgt 1020 gcccgtgttt acgacgacga ggtgcgcaag tgggtgtcgg acacgggtgt ggagaacatt 1080 ggcaagaggc tggtgaactc gagggagggc ccaccggagt tcgagcagcc caagatgacg 1140 atcgaaaagc tcatggagta cggatacatg cttgtgaagg agcaggagaa cgtcaagcgt 1200 gtgcagctgg ctgagcagta cttgagcgag gctgctcttg gtgacgctaa ctccgacgcc 1260 atgaagactg gttccttcta cgggcaagga gcacagcaag caggtaacct gcctgtgccg 1320 gaaggttgca ccgaccctgt tgccaagaac ttcgacccaa cggcgaggag cgacgacggc 1380 agctgccttt acacctttta a 1401 <210> 287
<211> 466
<212> PRT
<213> Oryza sativa
<400> 287
Met Ala Ala Ala Phe Ser Ser Thr Val Gly Ala Pro Ala Ser Thr Pro 10 15
Thr Asn Phe Leu Gly Lys Lys Leu Lys Lys Gln Val Thr Ser Ala Val 20 25 30
Asn Tyr His Gly Lys Ser Ser Asn Ile Asn Arg Phe Lys Val Met Ala 35 40 45
Lys Glu Leu Asp Glu Gly Lys Gln Thr Asp Gln Asp Arg Trp Lys Gly 50 55 60
Leu Ala Tyr Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys 65 70 75 80
Gly Phe Val Asp Ser Leu Phe Gln Ala Pro Thr Gly Asp Gly Thr His 85 90 95
Glu Ala Val Leu Ser Ser Tyr Glu Tyr Leu Ser Gln Gly Leu Arg Thr 100 105 110
Tyr Asp Phe Asp Asn Thr Met Gly Gly Phe Tyr Ile Ala Pro Ala Phe 115 120 125
Met Asp Lys Leu Val Val His Ile Ser Lys Asn Phe Met Thr Leu Pro 130 135 140
Asn Ile Lys Val Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln 145 150 155 160
Gly Lys Ser Phe Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn 165 170 175
Pro Ile Met Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu 180 185 190
Pro Ala Lys Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ala Asp Ile Ile 195 200 205
Lys Lys Gly Lys Met Cys Cys Leu Phe Ile Asn Asp Leu Asp Ala Gly 210 215 220
Ala Gly Arg Met Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met 225 230 235 240
Val Asn Ala Thr Leu Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln 245 250 255 Leu Pro Gly Met Tyr Asn Lys Glu Asp Asn Pro Arg Val Pro Ile Ile 260 265 270
Val Thr Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp 275 280 285
Gly Arg Met Glu Lys Phe Tyr Trp Ala Pro Thr Arg Asp Asp Arg Val 290 295 300
Gly Val Cys Lys Gly Ile Phe Arg Thr Asp Asn Val Pro Asp Glu Asp 305 310 315 320
Ile Val Lys Ile Val Asp Ser Phe Pro Gly Gln Ser Ile Asp Phe Phe 325 330 335
Gly Ala Leu Arg Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Val 340 345 350
Ser Asp Thr Gly Val Glu Asn Ile Gly Lys Arg Leu Val Asn Ser Arg 355 360 365
Glu Gly Pro Pro Glu Phe Glu Gln Pro Lys Met Thr Ile Glu Lys Leu 370 375 380
Met Glu Tyr Gly Tyr Met Leu Val Lys Glu Gln Glu Asn Val Lys Arg 385 390 395 400
Val Gln Leu Ala Glu Gln Tyr Leu Ser Glu Ala Ala Leu Gly Asp Ala 405 410 415
Asn Ser Asp Ala Met Lys Thr Gly Ser Phe Tyr Gly Gln Gly Ala Gln 420 425 430
Gln Ala Gly Asn Leu Pro Val Pro Glu Gly Cys Thr Asp Pro Val Ala 435 440 445
Lys Asn Phe Asp Pro Thr Ala Arg Ser Asp Asp Gly Ser Cys Leu Tyr 450 455 460
Thr Phe 465
<210> 288
<211> 1302
<212> DNA
<213> Oryza sativa
<400> 288
atggctgctg ccttctcctc caccgttgga gctccggcgt ccactccgac caacttcctg 60 gggaagaagc tgaaaaagca ggtgacatcg gcggtgaact accatggcaa gagctccaac 120 atcaacaggt tcaaggtgat ggccaaggag ctggacgagg gcaagcagac cgaccaggac 180 aggtggaagg gtctcgccta cgacatctcc gatgaccagc aggacatcac cagggggaag 240 ggtttcgtcg actccctttt ccaggctccc acgggtgatg gcacccacga ggccgtcctc 300 agctcctacg agtacctcag ccagggtctc agaacgtacg acttcgacaa caccatggga 360 ggcttctaca tcgcccctgc tttcatggac aagctcgtcg tccacatctc caagaacttc 420 atgaccctcc ccaacatcaa ggtcccactc atcctgggta tctggggagg caagggtcag 480 ggaaaatcct tccagtgtga gctcgtcttc gccaagatgg ggatcaaccc catcatgatg 540 agcgccggag agctggagag cggcaacgcc ggagagccgg cgaagctgat caggcagcgg 600 taccgtgagg cggcagacat catcaagaag gggaagatgt gctgcctctt catcaacgat 660 ctggacgcgg gtgcaggtcg catgggaggc accacccagt acacggtgaa caaccagatg 720 gtgaacgcca ccctgatgaa catcgccgac aacccaacca acgtgcagct ccccgggatg 780 tacaacaagg aggacaaccc ccgtgtcccc atcatcgtca ccggcaacga cttctccacg 840 ctgtacgcgc cgctcatccg tgacgggcgt atggagaagt tctactgggc tcccacccgc 900 gacgaccgtg tcggcgtctg caagggtatc ttccgcaccg acaacgtccc cgacgaggac 960 atcgtcaaga tcgtcgacag cttcccaggc caatccatcg atttcttcgg cgctcttcgt 1020 gcccgtgttt acgacgacga ggtgcgcaag tgggtgtcgg acacgggtgt ggagaacatt 1080 ggcaagaggc tggtgaactc gagggagggc ccaccggagt tcgagcagcc caagatgacg 1140 atcgaaaagc tcatggagta cggatacatg cttgtgaagg agcaggagaa cgtcaagcgt 1200 gtgcagctgg ctgagcagta cttgagcgag gctgctcttg gtgacgctaa ctccgacgcc 1260 atgaagactg gttccttcta cggttctgcg ccatccagct ga 1302 <210> 289
<211> 433
<212> PRT
<213> Oryza sativa
<400> 289
Met Ala Ala Ala Phe Ser Ser Thr Val Gly Ala Pro Ala Ser Thr Pro 10 15
Thr Asn Phe Leu Gly Lys Lys Leu Lys Lys Gln Val Thr Ser Ala Val 20 25 30
Asn Tyr His Gly Lys Ser Ser Asn He Asn Arg Phe Lys Val Met Ala 35 40 45 Lys Glu Leu Asp Glu Gly Lys Gln Thr Asp Gln Asp Arg Trp Lys Gly 50 55 60
Leu Ala Tyr Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys 65 70 75 80
Gly Phe Val Asp Ser Leu Phe Gln Ala Pro Thr Gly Asp Gly Thr His 85 90 95
Glu Ala Val Leu Ser Ser Tyr Glu Tyr Leu Ser Gln Gly Leu Arg Thr 100 105 110
Tyr Asp Phe Asp Asn Thr Met Gly Gly Phe Tyr Ile Ala Pro Ala Phe 115 120 125
Met Asp Lys Leu Val Val His Ile Ser Lys Asn Phe Met Thr Leu Pro 130 135 140
Asn Ile Lys Val Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln 145 150 155 160
Gly Lys Ser Phe Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn 165 170 175
Pro Ile Met Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu 180 185 190
Pro Ala Lys Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ala Asp Ile Ile 195 200 205
Lys Lys Gly Lys Met Cys Cys Leu Phe Ile Asn Asp Leu Asp Ala Gly 210 215 220
Ala Gly Arg Met Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met 225 230 235 240
Val Asn Ala Thr Leu Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln 245 250 255
Leu Pro Gly Met Tyr Asn Lys Glu Asp Asn Pro Arg Val Pro Ile Ile 260 265 270
Val Thr Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp 275 280 285
Gly Arg Met Glu Lys Phe Tyr Trp Ala Pro Thr Arg Asp Asp Arg Val 290 295 300 Gly Val Cys Lys Gly Ile Phe Arg Thr Asp Asn Val Pro Asp Glu Asp
Ile Val Lys Ile Val Asp Ser Phe Pro Gly Gln Ser Ile Asp Phe Phe
Gly Ala Leu Arg Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Val
Ser Asp Thr Gly Val Glu Asn Ile Gly Lys Arg Leu Val Asn Ser Arg
Glu Gly Pro Pro Glu Phe Glu Gln Pro Lys Met Thr Ile Glu Lys Leu
Met Glu Tyr Gly Tyr Met Leu Val Lys Glu Gln Glu Asn Val Lys Arg
Val Gln Leu Ala Glu Gln Tyr Leu Ser Glu Ala Ala Leu Gly Asp Ala
Asn Ser Asp Ala Met Lys Thr Gly Ser Phe Tyr Gly Ser Ala Pro Ser
Ser
<210> 290 <211> 1326 <212> DNA
<213> Phaseolus vulgaris <400> 290
atggctgcct ccctctccac tgtcggcgct gtcaacagaa cccttttgaa tctgaatgga 60
tctggaggcg gagcttcagg tcccagttca gctttctttg gcacaagctt gaagaaggtt 120
attagctcaa gggtccctaa cagcaagttg acatctggaa gcttcaaaat tgttgctgca 180
gacaaagaga tcgaggagac ccagcagaco gagggggaca gatggagggg tctagcctac 240
gatgtttctg atgaccaaca agacatcaca agagggaagg gtttggttga ttctcttttc 300
caagctccaa tggatgctgg aactcactat gcagtcatca gctcccacaa gtacctcagc 360
gctggactac gccagtacaa ctttgacaac atcaaggatg gtttctacat tgctccagct 420
tttttggaca agcttgttgt tcacatcgcc aagaacttca tgaccttgcc caacatcaag 480
gttcctctca ttcttggtgt ctggggaggc aagggacaag gaaaatcttt ccaatgtgag 540
cttgtctttg ccaagatggg aatcaacccc atcatgatga gtgctggaga gttggaaagt 600 720
780
840
900
960
1020
1080
1140
1200
1260
1320
1326
345
ggaaatgccg gagagccagc aaaattgatt aggcagagat accgtgaagc ctcagactta atcaagaagg gaaagatgtg tgttctgttc atcaatgatc ttgatgcagg agcaggtcgt cttggtggaa ccacccaata cactgtgaac aaccagatgg tgaatgccac tctcatgaac attgctgata accccacaaa tgtgcagctt cctggtatgt acaacaagga agataacgcc cgtgtgccca tcattgtcac tggtaacgat ttctcaacac tttatgctcc tctcatccgt gatggtcgta tggagaagtt ctactgggca ccaacaaggg aagaccgcat tggtgtttgc aagggaattt tccggaccga tggtgttcct gaaaaggaca ttgtcgagct tgttgacaaa caccctggcc aatccattga tttctttggt gcactgaggg ccagagtgta tgatgatgaa gtaaggaagt ggatttctgg tgttggtgtt gattctgttg ggaagaagct tgtgaactca aaggaaggac ctcctacctt tgaccagccc aagatgactc tggacaagct cttgctgtat gctagcatgc ttgtccaaga acaagagaat gtgaagagag tccaattggc tgaccagtac ttgaatgagg ctgctcttgg aaatgccaac gaggatgcta tcaagagtgg atctttcttc aaatag
<210> 291 <211> 441 <212> PRT
<213> Phaseolus vulgaris <400> 291
Met Ala Ala Ser Leu Ser Thr Val Gly Ala Val Asn Arg Thr Leu Leu 10 15
Asn Leu Asn Gly Ser Gly Gly Gly Ala Ser Gly Pro Ser Ser Ala Phe 20 25 30
Phe Gly Thr Ser Leu Lys Lys Val Ile Ser Ser Arg Val Pro Asn Ser 35 40 45
Lys Leu Thr Ser Gly Ser Phe Lys Ile Val Ala Ala Asp Lys Glu Ile 50 55 60
Glu Glu Thr Gln Gln Thr Glu Gly Asp Arg Trp Arg Gly Leu Ala Tyr 65 70 75 80
Asp Val Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Leu Val 85 90 95
Asp Ser Leu Phe Gln Ala Pro Met Asp Ala Gly Thr His Tyr Ala Val 100 105 110
Ile Ser Ser His Lys Tyr Leu Ser Ala Gly Leu Arg Gln Tyr Asn Phe 115 120 125
Asp Asn Ile Lys Asp Gly Phe Tyr Ile Ala Pro Ala Phe Leu Asp Lys 130 135 140
Leu Val Val His Ile Ala Lys Asn Phe Met Thr Leu Pro Asn Ile Lys 145 150 155 160
Val Pro Leu Ile Leu Gly Val Trp Gly Gly Lys Gly Gln Gly Lys Ser 165 170 175
Phe Gln Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn Pro Ile Met 180 185 190
Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys 195 200 205
Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ser Asp Leu Ile Lys Lys Gly 210 215 220
Lys Met Cys Val Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg 225 230 235 240
Leu Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala 245 250 255
Thr Leu Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly 260 265 270
Met Tyr Asn Lys Glu Asp Asn Ala Arg Val Pro Ile Ile Val Thr Gly 275 280 285
Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met 290 295 300
Glu Lys Phe Tyr Trp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys 305 310 315 320
Lys Gly Ile Phe Arg Thr Asp Gly Val Pro Glu Lys Asp Ile Val Glu 325 330 335
Leu Val Asp Lys His Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu 340 345 350
Arg Ala Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Ile Ser Gly Val 355 360 365 Gly Val Asp Ser Val Gly Lys Lys Leu Val Asn Ser Lys Glu Gly Pro 370 375 380
Pro Thr Phe Asp Gln Pro Lys Met Thr Leu Asp Lys Leu Leu Leu Tyr 385 390 395 400
Ala Ser Met Leu Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu 405 410 415
Ala Asp Gln Tyr Leu Asn Glu Ala Ala Leu Gly Asn Ala Asn Glu Asp 420 425 430
Ala Ile Lys Ser Gly Ser Phe Phe Lys 435 440
<210> 292
<211> 1299
<212> DNA
<213> Triticum aestivum
<400> 292
atggcttctg ctttctcgtc caccgttgga gctccggcgt cgaccccgac caccttcctc 60 gggaagaagg tgaagaagca ggccggtgcg ttgaactact accatggtgg caacaagatc 120 aacaataggg tggtcagggc catggcggcc aaaaaggaac ttgacgaggg caagcagacc 180 gatgccgatc ggtggaaggg tctcgcttac gacatctccg atgaccagca ggacatcacg 240 agggggaaag gcatcgtgga ctccctgttc caggccccca tgggcgacgg cacccacgag 300 gccatcctga gctcctacga gtacatcagc cagggcctgc gcaagtacga cttcgacaac 360 accatggacg ggctgtacat cgccccggcg ttcatggaca agctcatcgt ooacctcgcc 420 aagaacttca tgacactccc caacatcaag gtccctctca tcctgggtat ctggggaggc 480 aagggacagg gcaagtcgtt ccagtgcgag ctggtgttcg ccaagatggg catcaacccc 540 atcatgatga gcgccggaga gctggagagc ggcaacgccg gcgagccggc caagctgatc 600 cggcagaggt accgcgaggc tgccgacatt atcaagaagg gcaagatgtg ctgcctcttc 660 atcaacgacc tggacgccgg cgcggggcgg atgggcggga cgacgcagta cacggtgaac 720 aaccagatgg tgaacgccac cctgatgaac atcgcggacg cgcccaccaa cgtgcagttc 780 ccggggatgt acaacaagga ggagaaccca cgcgtgccca tcatcgtcac cggcaacgac 840 ttctcgacgc tgtacgcgcc cctcatccgg gacggccgca tggagaagtt ctactgggcg 900 cccacccggg aggaccgcat cggcgtgtgc aagggcatct tccgcaccga caacgtcccc 960 gacgaggccg tggtgaggct ggtggacacc ttcccggggc agtccatcga cttcttcggc 1020 gcgctgcggg cgcgggtgta cgacgacgag gtgcgcaagt gggtcggcga gatcggcgtc 1080 gagaacatct ccaagcggct cgtcaactcc agggaggggc cgccgacgtt cgaccagccc 1140 aagatgacca tcgagaagct catggagtac ggccacatgc tggtccagga gcaggagaac gtgaagcgcg tgcagctcgc cgacaagtac ctcagcgagg cggcgctcgg ccaagccaac gacgacgcca tggcgaccgg cgccttctac ggcaagtag
<210> 293 <211> 432 <212> PRT
<213> Triticum aestivum <400> 293
Met Ala Ser Ala Phe Ser Ser Thr Val Gly Ala Pro Ala Ser Thr Pro 10 15
Thr Thr Phe Leu Gly Lys Lys Val Lys Lys Gln Ala Gly Ala Leu Asn 20 25 30
Tyr Tyr His Gly Gly Asn Lys Ile Asn Asn Arg Val Val Arg Ala Met 35 40 45
Ala Ala Lys Lys Glu Leu Asp Glu Gly Lys Gln Thr Asp Ala Asp Arg 50 55 60
Trp Lys Gly Leu Ala Tyr Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr 65 70 75 80
Arg Gly Lys Gly Ile Val Asp Ser Leu Phe Gln Ala Pro Met Gly Asp 85 90 95
Gly Thr His Glu Ala Ile Leu Ser Ser Tyr Glu Tyr Ile Ser Gln Gly 100 105 110
Leu Arg Lys Tyr Asp Phe Asp Asn Thr Met Asp Gly Leu Tyr Ile Ala 115 120 125
Pro Ala Phe Met Asp Lys Leu Ile Val His Leu Ala Lys Asn Phe Met 130 135 140
Thr Leu Pro Asn Ile Lys Val Pro Leu Ile Leu Gly Ile Trp Gly Gly 145 150 155 160
Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu Leu Val Phe Ala Lys Met 165 170 175
1200
1260
1299
Gly Ile Asn Pro Ile Met Met Ser Ala Gly Glu Leu Glu Ser Gly Asn 180 185 190 Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln Arg Tyr Arg Glu Ala Ala 195 200 205
Asp Ile Ile Lys Lys Gly Lys Met Cys Cys Leu Phe Ile Asn Asp Leu 210 215 220
Asp Ala Gly Ala Gly Arg Met Gly Gly Thr Thr Gln Tyr Thr Val Asn 225 230 235 240
Asn Gln Met Val Asn Ala Thr Leu Met Asn Ile Ala Asp Ala Pro Thr 245 250 255
Asn Val Gln Phe Pro Gly Met Tyr Asn Lys Glu Glu Asn Pro Arg Val 260 265 270
Pro Ile Ile Val Thr Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu 275 280 285
Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr Trp Ala Pro Thr Arg Glu 290 295 300
Asp Arg Ile Gly Val Cys Lys Gly Ile Phe Arg Thr Asp Asn Val Pro 305 310 315 320
Asp Glu Ala Val Val Arg Leu Val Asp Thr Phe Pro Gly Gln Ser Ile 325 330 335
Asp Phe Phe Gly Ala Leu Arg Ala Arg Val Tyr Asp Asp Glu Val Arg 340 345 350
Lys Trp Val Gly Glu Ile Gly Val Glu Asn Ile Ser Lys Arg Leu Val 355 360 365
Asn Ser Arg Glu Gly Pro Pro Thr Phe Asp Gln Pro Lys Met Thr Ile 370 375 380
Glu Lys Leu Met Glu Tyr Gly His Met Leu Val Gln Glu Gln Glu Asn 385 390 395 400
Val Lys Arg Val Gln Leu Ala Asp Lys Tyr Leu Ser Glu Ala Ala Leu 405 410 415
Gly Gln Ala Asn Asp Asp Ala Met Ala Thr Gly Ala Phe Tyr Gly Lys 420 425 430
<210> 294 <211> 1299 <212> DNA <213> Zea mays <400> 294
atggccgcct tctcctccac cgtcggagct ccggcctcca ccccgaccag gagcagcttc 60 ctcgggaaga agctcaacaa gccgcaggtg tccgcggccg tgacctacca tggcaagagc 120 tccagcagca acagcaggtt caaggcgatg gctgccaagg aggtggacga gacgaagcag 180 accgacgagg acaggtggaa gggcctggcc tacgacatct cggacgacca gcaggacatc 240 accaggggca agggcctcgt cgacaacctc ttccaggcgc ctatggggga cggcacccac 300 gtcgccgtgc tcagctccta cgactacatc agccagggcc aaaagtctta caacttcgac 360 aacatgatgg atggcttcta catagccaag ggcttcatgg acaagctcgt cgtccacctc 420 tccaagaact tcatgaccct gccaaacatc aaggttcccc tcatcctggg tatctgggga 480 ggcaaaggcc agggaaaatc gttccaatgc gagctggtct tcgccaagat gggcatcacc 540 cccatcatga tgagcgccgg cgagctggag agcggcaacg ccggagagcc cgccaagctc 600 atcaggcagc gctaccgtga ggcctccgac ctcatcaaga agggcaagat gtcctgcctc 660 ttcatcaacg acctcgacgc cggcgcgggt cgcatgggcg gcaccaccca gtacacggtg 720 aacaaccaga tggtcaacgc caccctgatg aacatcgccg acaaccccac caacgtgcag 780 ctcccgggga tgtacaacaa ggaggacaac ccccgcgtgc ccatcatcgt caccggcaac 840 gacttctcca cgctctacgc gccgctcatc cgcgacggcc gcatggagaa gttctactgg 900 gcgcccaccc gcgaggaccg catcggcgtc tgcaagggca tcttccgcac cgacggcgtc 960 gacgaggagc acgtcgtcca gctggtcgac accttccctg gccagtccat cgacttcttc 1020 ggcgcgctgc gtgcccgggt ctacgacgac gaggtccgac ggtgggtgag cgagaccggc 1080 gtcgagaaca tcgccaggaa gctcgtcaac tccaaggagg gcccgcccac gttcgagcag 1140 cccaagataa cgatcgagaa gctcttggag tacggacaca tgctggtggc ggagcaggag 1200 aacgtcaagc gtgtgcagct tgctgacaag tacctcaacg aggctgctct tggtgaagcc 1260 aacgaggacg ccatgaagac tggctccttc ttcaagtag 1299 <210> 295
<211> 432
<212> PRT
<213> Zea mays
<400> 295
Met Ala Ala Phe Ser Ser Thr Val Gly Ala Pro Ala Ser Thr Pro Thr 10 15
Arg Ser Ser Phe Leu Gly Lys Lys Leu Asn Lys Pro Gln Val Ser Ala 20 25 30 Ala Val Thr Tyr His Gly Lys Ser Ser Ser Ser Asn Ser Arg Phe Lys 35 40 45
Ala Met Ala Ala Lys Glu Val Asp Glu Thr Lys Gln Thr Asp Glu Asp 50 55 60
Arg Trp Lys Gly Leu Ala Tyr Asp Ile Ser Asp Asp Gln Gln Asp Ile 65 70 75 80
Thr Arg Gly Lys Gly Leu Val Asp Asn Leu Phe Gln Ala Pro Met Gly 85 90 95
Asp Gly Thr His Val Ala Val Leu Ser Ser Tyr Asp Tyr Ile Ser Gln 100 105 110
Gly Gln Lys Ser Tyr Asn Phe Asp Asn Met Met Asp Gly Phe Tyr Ile 115 120 125
Ala Lys Gly Phe Met Asp Lys Leu Val Val His Leu Ser Lys Asn Phe 130 135 140
Met Thr Leu Pro Asn Ile Lys Val Pro Leu Ile Leu Gly Ile Trp Gly 145 150 155 160
Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu Leu Val Phe Ala Lys 165 170 175
Met Gly Ile Thr Pro Ile Met Met Ser Ala Gly Glu Leu Glu Ser Gly 180 185 190
Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln Arg Tyr Arg Glu Ala 195 200 205
Ser Asp Leu Ile Lys Lys Gly Lys Met Ser Cys Leu Phe Ile Asn Asp 210 215 220
Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr Thr Gln Tyr Thr Val 225 230 235 240
Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn Ile Ala Asp Asn Pro 245 250 255
Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys Glu Asp Asn Pro Arg 260 265 270
Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro 275 280 285 Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr Trp Ala Pro Thr Arg
Glu Asp Arg Ile Gly Val Cys Lys Gly Ile Phe Arg Thr Asp Gly Val
Asp Glu Glu His Val Val Gln Leu Val Asp Thr Phe Pro Gly Gln Ser
Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val Tyr Asp Asp Glu Val
Arg Arg Trp Val Ser Glu Thr Gly Val Glu Asn Ile Ala Arg Lys Leu
Val Asn Ser Lys Glu Gly Pro Pro Thr Phe Glu Gln Pro Lys Ile Thr
Ile Glu Lys Leu Leu Glu Tyr Gly His Met Leu Val Ala Glu Gln Glu
Asn Val Lys Arg Val Gln Leu Ala Asp Lys Tyr Leu Asn Glu Ala Ala
Leu Gly Glu Ala Asn Glu Asp Ala Met Lys Thr Gly Ser Phe Phe Lys
<210> 296 <211> 1122 <212> DNA
<213> Datisca glomerata <400> 296
atggcttctt ccgctgtctc aaccattgga gcagtcaaca gatccccttt aaatttgaac 60
aacaatggaa ctggagggtt gctgccaaac acagccttct ttggcagcag tctgaagaag 120
atgaactcaa gattgaccaa tccgaggatt gctgctggca acattaaggc tgttgctgac 180
gatgacgagg aaaaacaaac atcgaaggac aggtggggag gccttgcctt tgacacatct 240
gatgaccaac aagacattac cagaggaaag ggaatggttg attccctttt ccaagctccc 300
atgcaaactg gaactcacta tgctgtcatg agctcttatg aatacctcag cactggtctt 360
cgccaatact tggataacaa tatggatgga ttctacatag ctccagcttt catggacaag 420
cttgtcgttc acatcaccaa aaacttcatg actctcccca acataaaggt tcctctcatt 480
ttgggtatct ggggaggtaa aggtcaaggt aaatctttcc agtgtgagct tgtctttgcc 540
aagatgggaa tcaaccccat catgatgagt gccggagaat tggagagcgg caacgcagga 600 gagcccgcga agttgatcag gcaacggtgt cgtgaggcgg ccgacatcat caagaaggga 660 aagatgtctt gcctatttat caatgatctt gatgcaggtg ccggtaggct tggtgggaca 720 actcaataca ctgtgaacaa ccaaatggtg aatgctaccc tcatgaacat tgctgacaat 780 ccaaccaatg ttcagctccc gggtatgtac aacaaggaag agaatccacg tgtaccgatc 840 atcgtcacag gtaatgactt ctcgacattg tacgctcctc tcattcgtga tggtcgtatg 900 gagaaattct actgggcgcc caccagagaa gaccgaattg gtgtctgcac tggtatcttc 960 agaagtgaca atgtggctaa ggaagatatt gtcaagcttg ttgacacatt ccctggtcaa 1020 tctattgatt tcttcggggc gctaagagca cgggtttacg acgacgaagt gaggaagtgg 1080 atatcgggtg tcggagtaca ggacgttgga aaaagcttgt ga 1122 <210> 297 <211> 373 <212> PRT
<213> Datisca glomerata <400> 297
Met Ala Ser Ser Ala Val Ser Thr Ile Gly Ala Val Asn Arg Ser Pro 10 15
Leu Asn Leu Asn Asn Asn Gly Thr Gly Gly Leu Leu Pro Asn Thr Ala 20 25 30
Phe Phe Gly Ser Ser Leu Lys Lys Met Asn Ser Arg Leu Thr Asn Pro 35 40 45
Arg Ile Ala Ala Gly Asn Ile Lys Ala Val Ala Asp Asp Asp Glu Glu 50 55 60
Lys Gln Thr Ser Lys Asp Arg Trp Gly Gly Leu Ala Phe Asp Thr Ser 65 70 75 80
Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Met Val Asp Ser Leu 85 90 95
Phe Gln Ala Pro Met Gln Thr Gly Thr His Tyr Ala Val Met Ser Ser 100 105 110
Tyr Glu Tyr Leu Ser Thr Gly Leu Arg Gln Tyr Leu Asp Asn Asn Met 115 120 125
Asp Gly Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His 130 135 140
Ile Thr Lys Asn Phe Met Thr Leu Pro Asn Ile Lys Val Pro Leu Ile 145 150 155 160
Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu 165 170 175
Leu Val Phe Ala Lys Met Gly Ile Asn Pro Ile Met Met Ser Ala Gly 180 185 190
Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln 195 200 205
Arg Cys Arg Glu Ala Ala Asp Ile Ile Lys Lys Gly Lys Met Ser Cys 210 215 220
Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Leu Gly Gly Thr 225 230 235 240
Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn 245 250 255
Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys 260 265 270
Glu Glu Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser 275 280 285
Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr 290 295 300
Tjrp Ala Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Thr Gly Ile Phe 305 310 315 320
Arg Ser Asp Asn Val Ala Lys Glu Asp Ile Val Lys Leu Val Asp Thr 325 330 335
Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val 340 345 350
Tyr Asp Asp Glu Val Arg Lys Trp Ile Ser Gly Val Gly Val Gln Asp 355 360 365
Val Gly Lys Ser Leu 370
<210> 298
<211> 1308
<212> DNA
<213> Zantedeschia aethiopica <400> 298 gcgtcggtgc cgtgaacagg gtccggccta gcctacatgg gtctggttcg 60 gccgtctcca ggagcctcgg tgacgaggtc cggcttcctg ggcaccagcc tgaagacggt gaaccccagc 120 ttgggtcatg gcaggacctc cactgggacc ttgaaggtca tggctgctga cctcgacgag 180 agcaagcaga ccaagacaga caggtgggct gggctgtaca ccgacacctc ggatgaccag 240 caggacatca ccagggggaa gggcatggtc gactccctgt tccaggctcc catgggcgac 300 ggaacccaca accccgtcct gagctcctac gagtacatca gcaccggtct ccgctcgttc 360 aacttggaca acaccgtgaa tggtttatac atcgctccgg ccttcatgga caagcttgtc 420 gttcacatca ccaagaactt catgaacttg cccaacatca agattcctct cattttgggt 480 atctggggag gcaaaggtca agggaaatcc ttccaatgtg aacttgtgtt cgccaagatg 540 ggaatcaacc ccatcatgat gagcgccggt gagctggaga gcggcaacgc cggagagccg 600 gcgaagctga tccggcagcg gtaccgtgag gccgccgaca tcatcaggaa ggggaagatg 660 tgctgcctct tcatcaacga tctcgatgcc ggtgccggcc ggatgggcgg caccacccag 720 tacaccgtca acaaccagat ggtgaacgcc accctcatga acatcgccga caaccccacc 780 aacgtccagc tccccggcat gtacaacaag caagagaacc cccgcgtgcc catcatcgtc 840 accggcaacg acttctccac cctctacgcc cccctcatcc gtgacggtcg tatggagaag 900 ttctactggg ctcccaccag ggatgaccgg gtcggcgtct gcaccggtat cttcaggtcc 960 gacaacgtcc ccaaggagga tgtcatcaag ctcgtcgaca ccttccccgg ccaatccatt 1020 gacttcttcg gtgcactgag ggcgagggtc tacgacgacg aggtgaggaa gtggattgcc 1080 gaaatcggcg tcgacggcgt ggggaagagg ctggtgaact cgctggaggg gccgccgacg 1140 ttcgcgcagc ccaagatgac cctggacaag ctgctggagt acggcaatat gctggtgcag 1200 gaacaggaga acgtgaagag ggtgcagctg gccgacaagt acctgagcga ggcagctctt 1260 ggtgacgcca atcaggacgc gatcaagact ggatccttct atggttag 1308 <210> 299 <211> 435 <212> PRT
<213> Zantedeschia aethiopica <400> 299
Ala Val Ser Ser Val Gly Ala Val Asn Arg Val Arg Pro Ser Leu His 10 15
Gly Ser Gly Ser Gly Ala Ser Val Thr Arg Ser Gly Phe Leu Gly Thr 20 25 30
Ser Leu Lys Thr Val Asn Pro Ser Leu Gly His Gly Arg Thr Ser Thr 35 40 45
Gly Thr Leu Lys Val Met Ala Ala Asp Leu Asp Glu Ser Lys Gln Thr 50 55 60
Lys Thr Asp Arg Trp Ala Gly Leu Tyr Thr Asp Thr Ser Asp Asp Gln 65 70 75 80
Gln Asp Ile Thr Arg Gly Lys Gly Met Val Asp Ser Leu Phe Gln Ala 85 90 95
Pro Met Gly Asp Gly Thr His Asn Pro Val Leu Ser Ser Tyr Glu Tyr 100 105 110
Ile Ser Thr Gly Leu Arg Ser Phe Asn Leu Asp Asn Thr Val Asn Gly 115 120 125
Leu Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His Ile Thr 130 135 140
Lys Asn Phe Met Asn Leu Pro Asn Ile Lys Ile Pro Leu Ile Leu Gly 145 150 155 160
Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu Leu Val 165 170 175
Phe Ala Lys Met Gly Ile Asn Pro Ile Met Met Ser Ala Gly Glu Leu 180 185 190
Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln Arg Tyr 195 200 205
Arg Glu Ala Ala Asp Ile Ile Arg Lys Gly Lys Met Cys Cys Leu Phe 210 215 220
Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr Thr Gln 225 230 235 240
Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn Ile Ala 245 250 255
Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys Gln Glu 260 265 270
Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser Thr Leu 275 280 285 Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr Trp Ala 290 295 300
Pro Thr Arg Asp Asp Arg Val Gly Val Cys Thr Gly Ile Phe Arg Ser 305 310 315 320
Asp Asn Val Pro Lys Glu Asp Val Ile Lys Leu Val Asp Thr Phe Pro 325 330 335
Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg Val Tyr Asp 340 345 350
Asp Glu Val Arg Lys Trp Ile Ala Glu Ile Gly Val Asp Gly Val Gly 355 360 365
Lys Arg Leu Val Asn Ser Leu Glu Gly Pro Pro Thr Phe Ala Gln Pro 370 375 380
Lys Met Thr Leu Asp Lys Leu Leu Glu Tyr Gly Asn Met Leu Val Gln 385 390 395 400
Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Asp Lys Tyr Leu Ser 405 410 415
Glu Ala Ala Leu Gly Asp Ala Asn Gln Asp Ala Ile Lys Thr Gly Ser 420 425 430
Phe Tyr Gly 435
<210> 300
<211> 1245
<212> DNA
<213> Anabaena variabilis
<400> 300
atgagttatt atatcgctcc gcgctttctg gataaacttg ctgttcacat caccaaaaac 60 tttttaaata ttcctggtgt gcgagttccc ttaattttag ggattcatgg acgtaaagga 120 gaagggaaaa cctttcagtg tgagttagct tttgagaaga tgggtattga agtcacactc 180 atctccggcg gtgaattgga aagtcccgat gcgggagacc cagcccggtt gattcggctg 240 cgctatcggg aaacggcaga actgattaaa gtgcggggta aaatgtgcgt gctgatgatt 300 aacgatttag atgcaggtgc aggacgcttt gatgaaggta cgcaatatac tgtaaatact 360 cagttggtaa atgccacact gatgaatatt gccgataatc ccacagatgt acagttaccc 420 ggtagttatg attccaaccc gatacggcgt gtccccatta tcgtgacagg taatgatttt 480 tctactctct acgcaccatt gattcgggat ggacggatgg agaaattcta ttgggaaccc 540 aaccgcgatg ataaggtggg aattgtcggg gggatttttg ctgaggatgg actctcaaaa 600 cgagaaattg aacaattagt tgatactttc cccaagcaat cgattgactt ttttagcgct 660 ttacgttctc gaatttacga cgaacaaatc cgcgacttta tccatcaagt tgggtttgaa 720 cgtatatctc tacgtgttgt gaacagcgta gaagcgccgc cagaatttaa aaagccagat 780 ttcagccttg ctcatttgat cgagtctggt aacttggtgt tgggtgaaca acaacgggta 840 gacaattctc agctagtgga tgagtataat cgattgaatc gcgggagggg ttatcaagca 900 gcgccaccgc ctgaagcgcc catgattcag ccagtcaata atagttctca caagcgagag 960 acatctaata ctcatttgag tttagaaacc caagaacaaa tccggcaaat cttgtctcaa 1020 ggtcacaaaa ttacttttga acacgtagat gcacgccgct tccgcacggg ttcttggcaa 1080 agttgcggta ctctgcatat tgatgcagag tcagatgcta tttcaacact agaggcttgc 1140 ttagttgatt atgagggtga gtatgtgcgc ttggtaggga tagacccgaa aggtaagcgg 1200 cgggttgtgg agacaattat tcaacgacca aatgacaaaa actaa 1245 <210> 301 <211> 414 <212> PRT
<213> Anabaena variabilis <400> 301
Met Ser Tyr Tyr Ile Ala Pro Arg Phe Leu Asp Lys Leu Ala Val His 10 15
Ile Thr Lys Asn Phe Leu Asn Ile Pro Gly Val Arg Val Pro Leu Ile 20 25 30
Leu Gly Ile His Gly Arg Lys Gly Glu Gly Lys Thr Phe Gln Cys Glu 35 40 45
Leu Ala Phe Glu Lys Met Gly Ile Glu Val Thr Leu Ile Ser Gly Gly 50 55 60
Glu Leu Glu Ser Pro Asp Ala Gly Asp Pro Ala Arg Leu Ile Arg Leu 65 70 75 80
Arg Tyr Arg Glu Thr Ala Glu Leu Ile Lys Val Arg Gly Lys Met Cys 85 90 95
Val Leu Met Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Phe Asp Glu 100 105 110
Gly Thr Gln Tyr Thr Val Asn Thr Gln Leu Val Asn Ala Thr Leu Met 115 120 125 Asn Ile Ala Asp Asn Pro Thr Asp Val Gln Leu Pro Gly Ser Tyr Asp 130 135 140
Ser Asn Pro Ile Arg Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe 145 150 155 160
Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe 165 170 175
Tyr Trp Glu Pro Asn Arg Asp Asp Lys Val Gly Ile Val Gly Gly Ile 180 185 190
Phe Ala Glu Asp Gly Leu Ser Lys Arg Glu Ile Glu Gln Leu Val Asp 195 200 205
Thr Phe Pro Lys Gln Ser Ile Asp Phe Phe Ser Ala Leu Arg Ser Arg 210 215 220
Ile Tyr Asp Glu Gln Ile Arg Asp Phe Ile His Gln Val Gly Phe Glu 225 230 235 240
Arg Ile Ser Leu Arg Val Val Asn Ser Val Glu Ala Pro Pro Glu Phe 245 250 255
Lys Lys Pro Asp Phe Ser Leu Ala His Leu Ile Glu Ser Gly Asn Leu 260 265 270
Val Leu Gly Glu Gln Gln Arg Val Asp Asn Ser Gln Leu Val Asp Glu 275 280 285
Tyr Asn Arg Leu Asn Arg Gly Arg Gly Tyr Gln Ala Ala Pro Pro Pro 290 295 300
Glu Ala Pro Met Ile Gln Pro Val Asn Asn Ser Ser His Lys Arg Glu 305 310 315 320
Thr Ser Asn Thr His Leu Ser Leu Glu Thr Gln Glu Gln Ile Arg Gln 325 330 335
Ile Leu Ser Gln Gly His Lys Ile Thr Phe Glu His Val Asp Ala Arg 340 345 350
Arg Phe Arg Thr Gly Ser Trp Gln Ser Cys Gly Thr Leu His Ile Asp 355 360 365
Ala Glu Ser Asp Ala Ile Ser Thr Leu Glu Ala Cys Leu Val Asp Tyr 370 375 380
Glu Gly Glu Tyr Val Arg Leu Val Gly Ile Asp Pro Lys Gly Lys Arg 385 390 395 400
Arg Val Val Glu Thr Ile Ile Gln Arg Pro Asn Asp Lys Asn
405 410 <210> 302 <211> 1245 <212> DNA <213> Nostoc sp. <400> 302 atatcgctcc gcgttttctg gataaacttg ctgttcacat cactaaaaac 60 atgagttatt tttttgaata ttcctggtgt gcgagttccc ttaattttag ggattcatgg acgtaaagga 120 gaagggaaaa cctttcaatg tgagttagct tttgaaaaga tgggtattga agtcacactc 180 atctctggcg gtgaattgga aagtcccgat gcgggagacc cagcacggtt gattcggctg 240 cgttatcggg aaacggcaga actgatcaaa gtgcgcggta aaatgtgcgt gctgatgatt 300 aacgatttag atgcaggtgc aggacgcttt gatgaaggta cgcaatatac tgtaaatact 360 cagttggtaa atgccacgct gatgaatatt gctgataatc ctacagatgt gcagttaccg 420 ggtagttatg attccaaccc gatacggcgt gtccccatta tcgtcacagg taatgatttt 480 tctactctct acgcgccatt gattcgggat ggacggatgg agaaattcta ttgggaaccc 540 aaccgtgatg ataaggtggg aattgttggg gggatttttg cggaagatgg actgtcacaa 600 cgggaaattg agcaattagt tgatactttc cccaagcaat cgattgactt ttttagcgct 660 ttacgttctc gaatttacga tatccaaatc cgcgacttca tccataaagt cgggtttgaa 720 cggatatctt tgcgcgtagt gaacagccta gaagcgccgc cagaatttaa aaagccagat 780 ttcagcctgg ctcatttaat cgagtctggt aacttggtgt tgggtgaaca acaacgggta 840 gataattctc agttagtgga tgagtataat cgattaaatc gcgggagagg ttatcaaaca 900 gcgccacccc ccgaagcacc agtgattcag ccagtcaata atagttctca caagcaaaag 960 acatctaata ctcatttgag tttagaaacc caagaacaaa tccggcaaat cttgtctcaa 1020 ggtcacaaaa ttacctttga acacgtagat gcacgccgtt tccgcacggg ttcttggcag 1080 agttgcggta ctctgcatat tgatgcagag tcagatgcta tttcaacttt agaggcttgc 1140 ttagttgatt atgacggtga gtatgtgcgg atggtaggga tagacccgaa aggcaagcgg 1200 cgggttgtag agacaattat tcaacgacca aatggcaaaa attaa 1245 <210> 303 <211> 414 <212> PRT <213> Nostoc sp.
<400> 303
Met Ser Tyr Tyr Ile Ala Pro Arg Phe Leu Asp Lys Leu Ala Val His 10 15
Ile Thr Lys Asn Phe Leu Asn Ile Pro Gly Val Arg Val Pro Leu Ile 20 25 30
Leu Gly Ile His Gly Arg Lys Gly Glu Gly Lys Thr Phe Gln Cys Glu 35 40 45
Leu Ala Phe Glu Lys Met Gly Ile Glu Val Thr Leu Ile Ser Gly Gly 50 55 60
Glu Leu Glu Ser Pro Asp Ala Gly Asp Pro Ala Arg Leu Ile Arg Leu 65 70 75 80
Arg Tyr Arg Glu Thr Ala Glu Leu Ile Lys Val Arg Gly Lys Met Cys 85 90 95
Val Leu Met Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Phe Asp Glu 100 105 110
Gly Thr Gln Tyr Thr Val Asn Thr Gln Leu Val Asn Ala Thr Leu Met 115 120 125
Asn Ile Ala Asp Asn Pro Thr Asp Val Gln Leu Pro Gly Ser Tyr Asp 130 135 140
Ser Asn Pro Ile Arg Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe 145 150 155 160
Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe 165 170 175
Tyr Trp Glu Pro Asn Arg Asp Asp Lys Val Gly Ile Val Gly Gly Ile 180 185 190
Phe Ala Glu Asp Gly Leu Ser Gln Arg Glu Ile Glu Gln Leu Val Asp 195 200 205
Thr Phe Pro Lys Gln Ser Ile Asp Phe Phe Ser Ala Leu Arg Ser Arg 210 215 220
Ile Tyr Asp Ile Gln Ile Arg Asp Phe Ile His Lys Val Gly Phe Glu 225 230 235 240 Arg Ile Ser Leu Arg Val Val Asn Ser Leu Glu Ala Pro Pro Glu Phe 245 250 255
Lys Lys Pro Asp Phe Ser Leu Ala His Leu Ile Glu Ser Gly Asn Leu 260 265 270
Val Leu Gly Glu Gln Gln Arg Val Asp Asn Ser Gln Leu Val Asp Glu 275 280 285
Tyr Asn Arg Leu Asn Arg Gly Arg Gly Tyr Gln Thr Ala Pro Pro Pro 290 295 300
Glu Ala Pro Val Ile Gln Pro Val Asn Asn Ser Ser His Lys Gln Lys 305 310 315 320
Thr Ser Asn Thr His Leu Ser Leu Glu Thr Gln Glu Gln Ile Arg Gln 325 330 335
Ile Leu Ser Gln Gly His Lys Ile Thr Phe Glu His Val Asp Ala Arg 340 345 350
Arg Phe Arg Thr Gly Ser Trp Gln Ser Cys Gly Thr Leu His Ile Asp 355 360 365
Ala Glu Ser Asp Ala Ile Ser Thr Leu Glu Ala Cys Leu Val Asp Tyr 370 375 380
Asp Gly Glu Tyr Val Arg Met Val Gly Ile Asp Pro Lys Gly Lys Arg 385 390 395 400
Arg Val Val Glu Thr Ile Ile Gln Arg Pro Asn Gly Lys Asn 405 410
<210> 304
<211> 1224
<212> DNA
<213> Synechococcus sp.
<400> 304
atgagctact acatcccccc cacctttctt aaagttgtcg ccctgcacct gaccaaaaat 60 catcttcctc tgcccgacgt gcccgttccg ctcatcttgg gcatccacgg gcgcaagggg 120 gagggcaaga ccttccaatg caacctcatc tttgagcgca tgaaggtcta tgccgtccac 180 atctcggggg gcgagctgga aagtcccgac gccggggatc ccgcccgtat gattcgcctg 240 cgctaccgtg aagctgccga gcacatccgc aaatttggcσ agatggccgt gctgatgatc 300 aacgacctgg atgccggege cggtcgcctg aacagcatga cccagtacac cgtcaacacc 360 caactggtga gcgccaccct gatgaacatc gccgacaacc ccaccaacgt gcagcttccc 420 ggcagctacg atcccaagcc cctgccgcgg gtgcccatca tcgccaccgg caacgacttt 480 tccaccctct atgcccccct catccgcgat gggcgcatgc gcaagttcta ctgggagccc 540 agccgcaccg accgcatcca catcgttcac ggcatttttc aagccgacgg gctgtctctt 600 gaggagattg agcgcctggt ggacgccttt cccgagcagg ccatcgactt tttcggcgcc 660 ctgcgcgccc agctctacga cgagcaggta tggcaattta tccaagaagt cggcctggaa 720 gggattgcct ttcgcctgct caaaagcaaa gagggcgccc cccagtttcc gccaccgcga 780 ttttctctgg agcagttgat ccaggccggc caccagctca aagccgagca acaccaagta 840 gaagcccgtc gcctctccga ggaatacctt ggcctccggc gctccgctcc tcaagagccg 900 ccccccgctt ccccgccatc ccctcctcct gtggctgcca actcggccga tcctgcccca 960 gtctccctca acccagacgt gcaggcccag cttcgccaga tcctggccca aggctatgag 1020 atcctggtgg agcatgcgga tccgcgccgc taccgcgttc attcctggca ggagtgtgga 1080 gttgcccacc tgagagaatg ggccgctgcc tgtcaggctg tcgagcagtg cctcagccgt 1140 tttcccaagg actacatccg gctggtgggc gtagatccgg tgaaaaaaca acggcgggtc 1200 gaggccatca tccaccgccc ctga 1224 <210> 305 <211> 407 <212> PRT
<213> Synechoooccus sp.
<400> 305
Met Ser Tyr Tyr Ile Pro Pro Thr Phe Leu Lys Val Val Ala Leu His 10 15
Leu Thr Lys Asn His Leu Pro Leu Pro Asp Val Pro Val Pro Leu Ile 20 25 30
Leu Gly Ile His Gly Arg Lys Gly Glu Gly Lys Thr Phe Gln Cys Asn 35 40 45
Leu Ile Phe Glu Arg Met Lys Val Tyr Ala Val His Ile Ser Gly Gly 50 55 60
Glu Leu Glu Ser Pro Asp Ala Gly Asp Pro Ala Arg Met Ile Arg Leu 65 70 75 80
Arg Tyr Arg Glu Ala Ala Glu His Ile Arg Lys Phe Gly Gln Met Ala 85 90 95
Val Leu Met Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Leu Asn Ser 100 105 110
Met Thr Gln Tyr Thr Val Asn Thr Gln Leu Val Ser Ala Thr Leu Met 115 120 125
Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Ser Tyr Asp 130 135 140
Pro Lys Pro Leu Pro Arg Val Pro Ile Ile Ala Thr Gly Asn Asp Phe 145 150 155 160
Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Arg Lys Phe 165 170 175
Tyr Trp Glu Pro Ser Arg Thr Asp Arg Ile His Ile Val His Gly Ile 180 185 190
Phe Gln Ala Asp Gly Leu Ser Leu Glu Glu Ile Glu Arg Leu Val Asp 195 200 205
Ala Phe Pro Glu Gln Ala Ile Asp Phe Phe Gly Ala Leu Arg Ala Gln 210 215 220
Leu Tyr Asp Glu Gln Val Trp Gln Phe Ile Gln Glu Val Gly Leu Glu 225 230 235 240
Gly Ile Ala Phe Arg Leu Leu Lys Ser Lys Glu Gly Ala Pro Gln Phe 245 250 255
Pro Pro Pro Arg Phe Ser Leu Glu Gln Leu Ile Gln Ala Gly His Gln 260 265 270
Leu Lys Ala Glu Gln His Gln Val Glu Ala Arg Arg Leu Ser Glu Glu 275 280 285
Tyr Leu Gly Leu Arg Arg Ser Ala Pro Gln Glu Pro Pro Pro Ala Ser 290 295 300
Pro Pro Ser Pro Pro Pro Val Ala Ala Asn Ser Ala Asp Pro Ala Pro 305 310 315 320
Val Ser Leu Asn Pro Asp Val Gln Ala Gln Leu Arg Gln Ile Leu Ala 325 330 335
Gln Gly Tyr Glu Ile Leu Val Glu His Ala Asp Pro Arg Arg Tyr Arg 340 345 350 Val His Ser Trp Gln Glu Cys Gly Val Ala His Leu Arg Glu Trp Ala 355 360 365
Ala Ala Cys Gln Ala Val Glu Gln Cys Leu Ser Arg Phe Pro Lys Asp 370 375 380
Tyr Ile Arg Leu Val Gly Val Asp Pro Val Lys Lys Gln Arg Arg Val 385 390 395 400
Glu Ala Ile Ile His Arg Pro 405
<210> 306
<211> 2193
<212> DNA
<213> Oryza sativa
<400> 306
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60 aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140 cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200 tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260 gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320 ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380 gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440 aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500 ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560 atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620 acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680 cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740 ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800 gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860 tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920 attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980 tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040 cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100 agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160 tggtgtagct tgccactttc accagcaaag ttc 2193 <210> 307
<211> 1130
<212> DNA
<213> Oryza sativa
<400> 307
catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa 60 tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca 120 caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca 180 catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa 240 gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg 300 gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca 360 tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac 420 gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg 480 acaccccggg cccacccacc tgtcacgttg gcacatgttg gttatggttc ccggccgcac 540 caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc cgcccaagcc cctggcgcgt 600 gccgctcttc cacccaggtc cctctcgtaa tccataatgg cgtgtgtacc ctcggctggt 660 tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc 720 cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac 780 gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata 840 tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc 900 ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc tgtctcccct 960 ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca 1020 gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc 1080 gcctcgcgcg gatctgaccg cttccctcgc ccttctcgca ggattcagcc 1130 <210> 308
<211> 1179
<212> DNA
<213> Oryza sativa
<400> 308
ttgcagttgt gaccaagtaa gctgagcatg cccttaactt cacctagaaa aaagtatact 60 tggcttaact gctagtaaga catttcagaa ctgagactgg tgtacgcatt tcatgcaagc 120 cattaccact ttacctgaca ttttggacag agattagaaa tagtttcgta ctacctgcaa 180 gttgcaactt gaaaagtgaa atttgttcct tgctaatata ttggcgtgta attcttttat 240 gcgttagcgt aaaaagttga aatttgggtc aagttactgg tcagattaac cagtaactgg 300 ttaaagttga aagatggtct tttagtaatg gagggagtac tacactatcc tcagctgatt 360 taaatcttat tccgtcggtg gtgatttcgt caatctccca acttagtttt tcaatatatt 420 cataggatag agtgtgcata tgtgtgttta tagggatgag tctacgcgcc ttatgaacac 480 ctacttttgt actgtatttg tcaatgaaaa gaaaatctta ccaatgctgc gatgctgaca 540 ccaagaagag gcgatgaaaa gtgcaacgga tatcgtgcca cgtcggttgc caagtcagca 600 cagacccaat gggcctttcc tacgtgtctc ggccacagcc agtcgtttac cgcacgttca 660 catgggcacg aactcgcgtc atcttcccac gcaaaacgac agatctgccc tatctggtcc 720 cacccatcag tggcccacac ctcccatgct gcattatttg cgactcccat cccgtcctcc 780 acgcccaaac accgcacacg ggtcgcgata gccacgaccc aatcacacaa cgccacgtca 840 ccatatgtta cgggcagcca tgcgcagaag atcccgcgac gtcgctgtcc cccgtgtcgg 900 ttacgaaaaa atatcccacc acgtgtcgct ttcacaggac aatatctcga aggaaaaaaa 960 tcgtagcgga aaatccgagg cacgagctgc gattggctgg gaggcgtcca gcgtggtggg 1020 gggcccaccc ccttatcctt agcccgtggc gctcctcgct cctcgggtcc gtgtataaat 1080 accctccgga actcactctt gctggtcacc aacacgaagc aaaaggacac cagaaacata 1140 gtacacttga gctcactcca aactcaaaca ctcacacca 1179 <210> 309 <211> 55 <212> DNA <213> Seqüência Artificial <220> <223> iniciador: ρπα08444 <400> 309 ggggacaagt ttgtacaaaa aagcaggctt aaacaatgca ggtcaccatg aagag 55
<210> 310 <211> 50 <212> DNA <213> Seqüência Artificial <220> <223> iniciador: prm08445 <400> 310 ggggaccact ttgtacaaga aagctgggtc tcctacagag gaggcacatc 50
<210> 311 <211> 199 <212> PRT <213> Seqüência Artificial <220> <223> dominio Chlre RCA <400> 311 Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Thr Phe Gln Cys 10 15
Ala Leu Ala Tyr Lys Lys Leu Gly Ile Ala Pro Ile Val Met Ser Ala 20 25 30
Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg 35 40 45
Thr Arg Tyr Arg Glu Ala Ser Asp Ile Ile Lys Lys Gly Arg Met Cys 50 55 60
Ser Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Asp 65 70 75 80
Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met 85 90 95
Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Val Tyr Lys 100 105 HO
Asn Glu Glu Ile Pro Arg Val Pro Ile Val Cys Thr Gly Asn Asp Phe 115 120 125
Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Tyr 130 135 140
Tyr Trp Asn Pro Thr Arg Glu Asp Arg Ile Gly Val Cys Met Gly Ile 145 150 155 160
Phe Gln Glu Asp Asn Val Gln Arg Arg Glu Val Glu Asn Leu Val Asp 165 170 175
Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala Arg 180 185 190
Val Tyr Asp Asp Met Val Arg 195
<210> 312
<211> 8
<212> PRT
<213> Seqüência Artificial <220>
<223> Motif 1
<220>
<221> VARIANTE
<222> (2)..(2)
<223> /substituir = "Arg"
<220>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir = "Glu"
<220>
<221> VARIANTE
<222> (8)..(8)
<223> /substituir = "Thr"
<400> 312
Gly Gly Lys Gly Gln Gly Lys Ser 1 5
<210> 313 <211> 1317 <212> DNA <213> Flaveria bidentis
<400> 313
atggccaccg ccgccatcgg agccaccttc aaccgcaccc cgttgagcag tggtgttgct gcggtcccga gttcgagctt cttaggcact agcttgaaga agattgtgaa ctcgagacat
60
120 gcagtcaaca acaacaagtt ttccactttc aagatctttg cagccgagaa agagatcgaa 180 gagaccaaac aaaccgacaa agatagatgg agaggactcg cgtatgatat gtcggatgat 240 caacaagaca tcactagagg taagggtatg gttgattctc tcttccaggc tccacaagat 300 tctggaaccc atttcgctgt catgagttcc tacgaataca tcagcactgg tcttcgcaca 360 tatttggaca acaacatgga tggattctat atcgcgcctg cgtttatgga caagctcgtt 420 gttcacatca ccaagaactt catgactttg cccaacatta aggtccctct aattttgggt 480 gtttggggag gcaaaggtca gggtaaatct ttccaatgtg aacttgtgtt tgccaagatg 540 ggaatcacac cgattatgat gagtgctgga gaattggaaa gtggaaacgc cggagagccc 600 gcgaagctca tcagacagcg gtaccgtgag gcggccgata tcatcaagaa ggggaaaatg 660 tgttgcctct tcatcaatga tcttgatgca ggagcaggta gaatgggtgg aacaacacaa 720 tacacagtca acaaccagat ggtcaacgct accctcatga acattgctga taaccccacc 780 aatgtgcaac tgcctggaat gtacaacaag gaggagaacc cgcgtgtccc gatcatcgtc 840 acaggaaacg acttttcgac actctatgct cccctcattc gtgacggtcg tatggaaaag 900 ttctattggg ctcccactag agatgaccga attggcgtgt gtattggtat tttccgcact 960 gacaatgtcc cgaaagaaga cattgtcaaa ctcgtcgata ctttccctgg acaatccatt 1020 gatttctttg gcgcgttgag ggctagagtg tacgacgatg aagtgaggaa gtggatcgga 1080 gaagttggtg ttgaaaccat tggaaagaag cttgtgaact caagggaagg acccccgaca 1140 ttcgagcaac ccaaaatgac aatcgataag ctccttgagt acggatacat gcttgttcag 1200 gaacaagaga a tgtgaagag agtccagttg gccgatacct atttggattc tgcggcgctt 1260 ggtgacgcta acaaggatgc catggagact ggcaaattct ttgccggaaa agaatag 1317 <210> 314 <211> 438 <212> PRT
<213> Flaveria bidentis <400> 314
Met Ala Thr Ala Ala Ile Gly Ala Thr Phe Asn Arg Thr Pro Leu Ser 10 15
Ser Gly Val Ala Ala Val Pro Ser Ser Ser Phe Leu Gly Thr Ser Leu 20 25 30
Lys Lys Ile Val Asn Ser Arg His Ala Val Asn Asn Asn Lys Phe Ser 35 40 45
Thr Phe Lys Ile Phe Ala Ala Glu Lys Glu Ile Glu Glu Thr Lys Gln 50 55 60 Thr Asp Lys Asp Arg Trp Arg Gly Leu Ala Tyr Asp Met Ser Asp Asp 65 70 75 80
Gln Gln Asp Ile Thr Arg Gly Lys Gly Met Val Asp Ser Leu Phe Gln 85 90 95
Ala Pro Gln Asp Ser Gly Thr His Phe Ala Val Met Ser Ser Tyr Glu 100 105 110
Tyr Ile Ser Thr Gly Leu Arg Thr Tyr Leu Asp Asn Asn Met Asp Gly 115 120 125
Phe Tyr Ile Ala Pro Ala Phe Met Asp Lys Leu Val Val His Ile Thr 130 135 140
Lys Asn Phe Met Thr Leu Pro Asn Ile Lys Val Pro Leu Ile Leu Gly 145 150 155 160
Val Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln Cys Glu Leu Val 165 170 175
Phe Ala Lys Met Gly Ile Thr Pro Ile Met Met Ser Ala Gly Glu Leu 180 185 190
Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile Arg Gln Arg Tyr 195 200 205
Arg Glu Ala Ala Asp Ile Ile Lys Lys Gly Lys Met Cys Cys Leu Phe 210 215 220
Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Met Gly Gly Thr Thr Gln 225 230 235 240
Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu Met Asn Ile Ala 245 250 255
Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr Asn Lys Glu Glu 260 265 270
Asn Pro Arg Val Pro Ile Ile Val Thr Gly Asn Asp Phe Ser Thr Leu 275 280 285
Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys Phe Tyr Trp Ala 290 295 300
Pro Thr Arg Asp Asp Arg Ile Gly Val Cys Ile Gly Ile Phe Arg Thr 305 310 315
Asp Asn Val Pro Lys Glu Asp Ile Val Lys Leu 325 330
Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg 340 345
Asp Glu Val Arg Lys Trp Ile Gly Glu Val Gly 355 360
Lys Lys Leu Val Asn Ser Arg Glu Gly Pro Pro 370 375
Lys Met Thr Ile Asp Lys Leu Leu Glu Tyr Gly 385 390 395
Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala 405 410
Ser Ala Ala Leu Gly Asp Ala Asn Lys Asp Ala 420 425
Phe Phe Ala Gly Lys Glu 435
<210> 315 <211> 1248 <212> DNA <213> Ostreocoocus Iucimarinus <400> 315 tcacgcagcc gcgatgcggc atgtccacga gtcgcgccga agaccttcct cggcgcgcgc gagatgagcc gatggaaggg catggacatg cgcggccgca acatggttga ctccaagttc aacgccgtca tgtcctcgca agattacttg gacaacatca ccacggagaa cttctacatc cacgtcgcga agaacttcat gaagttgccg tggggtggta agggtcaagg taagactttc atctccccga tcgtcatgtc cgccggtgag aagctcgtgc gtcagcgtta ccgcgaagcg accctcttca tcaacgatct tgacgctggt 320
Val Asp Thr Phe Pro 335
Ala Arg Val Tyr Asp 350
Val Glu Thr Ile Gly 365
Thr Phe Glu Gln Pro 380
Tyr Met Leu Val Gln 400
Asp Thr Tyr Leu Asp 415
Met Glu Thr Gly Lys 430
gtcaaggcga acgccacggc gaagcgcgcc 60 gtctcctccg tgtcgaacgg ttccaaggtt 120 gacatttccg acgaccagca agacatcgct 180 caaggcgcga ccggaatcgg tggtacgcac 240 tccgcgggca tgaagacgta ctctgcgcac 300 tccccgtcgt acatggacaa ggtgatcgtg 360 aagatcaagg tgccggtcat tctcggtgtc 420 cagtctgatt tgatcttcaa gaagctcggc 480 ctcgaatccg gcaacgccgg tgaaccggcc 540 tccgacatcg tcaagaaggg tcgcatgtct 600 gccggtcgta tgggtggcac gacgcaatac 660 accgtcaaca accaaatggt gaacgcgacg ctcatgaaca tcgcggataa ccccacgaac 720 gttcagttgc cgggccaata cgaagtcatc gaaatcccgc gtgtgccgat catcgccacc 780 ggtaacgatt tctccaccct ttacgcgccg ctcgtccgtg atggccgtat ggacaagttc 840 tactggtccc cgacccgcga agaccgcgtc ggcatcgcca acggtatctt catggcggat 900 ggcatcgaga aggaagacgt cgaagtcctc gtcgatacgt tcgaaggtca atccattgac 960 ttcttcggcg cgcttcgctc ccgtgtctac gatgacttgg tgcgtgactt catcctcgaa 1020 gtcggctacg aagctctcgg cccgcgcctc atcaacccgc gcaagggtga agaagtcaac 1080 ttcaacccgc cgaaaatgac gctcgaagtc ctcttggcgt acggtaagga attggagaac 1140 gagcaagaga acatcaagcg catccagttg gccgatgcct acttggacgg cgccgtgctc 1200 gcgggcgaag gcggttcctc gaacaccgag aagtcgctca accagtaa 1248 <210> 316 <211> 415 <212> PRT
<213> Ostreocoocus Iucimarinus <400> 316
Met Ser Thr Ile Thr Gln Pro Arg Cys Gly Val Lys Ala Asn Ala Thr 10 15
Ala Lys Arg Ala Val Ala Pro Lys Thr Phe Leu Gly Ala Arg Val Ser 20 25 30
Ser Val Ser Asn Gly Ser Lys Val Glu Met Ser Arg Trp Lys Gly Met 35 40 45
Asp Met Asp Ile Ser Asp Asp Gln Gln Asp Ile Ala Arg Gly Arg Asn 50 55 60
Met Val Asp Ser Lys Phe Gln Gly Ala Thr Gly Ile Gly Gly Thr His 65 70 75 80
Asn Ala Val Met Ser Ser Gln Asp Tyr Leu Ser Ala Gly Met Lys Thr 85 90 95
Tyr Ser Ala His Asp Asn Ile Thr Thr Glu Asn Phe Tyr Ile Ser Pro 100 105 110
Ser Tyr Met Asp Lys Val Ile Val His Val Ala Lys Asn Phe Met Lys 115 120 125
Leu Pro Lys Ile Lys Val Pro Val Ile Leu Gly Val Trp Gly Gly Lys 130 135 140 Gly Gln Gly Lys Thr Phe Gln Ser Asp Leu Ile Phe Lys Lys Leu Gly 145 150 155 160
Ile Ser Pro Ile Val Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala 165 170 175
Gly Glu Pro Ala Lys Leu Val Arg Gln Arg Tyr Arg Glu Ala Ser Asp 180 185 190
Ile Val Lys Lys Gly Arg Met Ser Thr Leu Phe Ile Asn Asp Leu Asp 195 200 205
Ala Gly Ala Gly Arg Met Gly Gly Thr Thr Gln Tyr Thr Val Asn Asn 210 215 220
Gln Met Val Asn Ala Thr Leu Met Asn Ile Ala Asp Asn Pro Thr Asn 225 230 235 240
Val Gln Leu Pro Gly Gln Tyr Glu Val Ile Glu Ile Pro Arg Val Pro 245 250 255
Ile Ile Ala Thr Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Val 260 265 270
Arg Asp Gly Arg Met Asp Lys Phe Tyr Trp Ser Pro Thr Arg Glu Asp 275 280 285
Arg Val Gly Ile Ala Asn Gly Ile Phe Met Ala Asp Gly Ile Glu Lys 290 295 300
Glu Asp Val Glu Val Leu Val Asp Thr Phe Glu Gly Gln Ser Ile Asp 305 310 315 320
Phe Phe Gly Ala Leu Arg Ser Arg Val Tyr Asp Asp Leu Val Arg Asp 325 330 335
Phe Ile Leu Glu Val Gly Tyr Glu Ala Leu Gly Pro Arg Leu Ile Asn 340 345 350
Pro Arg Lys Gly Glu Glu Val Asn Phe Asn Pro Pro Lys Met Thr Leu 355 360 365
Glu Val Leu Leu Ala Tyr Gly Lys Glu Leu Glu Asn Glu Gln Glu Asn 370 375 380
Ile Lys Arg Ile Gln Leu Ala Asp Ala Tyr Leu Asp Gly Ala Val Leu 385 390 395 400 Ala Gly Glu Gly Gly Ser Ser Asn Thr Glu Lys Ser Leu Asn Gln 405 410 415
<210> 317
<211> 1320
<212> DNA
<213> Vigna radiata
<400> 317
atggctgcct ccgtctccac tgtcggagct gtcaacagag ctattttgaa cctgaatgga 60 tcaggagcag gagcttcagc tcccacttca gctttctttg gcacaagctt gaagaaggct 120 gttgcctcaa gggtccctaa cagcaaggtg acgaatggaa gcttcaaaat tgttgctgct 180 gagaaagaga ttgaggagag ccagcagacc aacaaggaca gatggaaggg tctggcctac 240 gatatctctg atgaccaaca agacatcaca agggggaagg gtatggttga tcctcttttc 300 caagctccaa tggatgctgg aacacactat gccgtcatga gctcctacga ataccttagc 360 actggactcc gacagcttga caacataaag gatggtttct acattgctcc tgcttttctg 420 gacaagcttg ttgttcacat caccaagaac ttcatgacct tgcccaacat caaggttcct 480 ctcattcttg gtatctgggg aggcaaggga caaggaaagt ctttccaatg tgagcttgtc 540 tttgccaaga tgggaatcaa ccccatcatg atgagtgctg gagagttgga aagtggaaat 600 gccggagagc cagcaaaatt gatcaggcag agataccgtg aagctgcaga tttgatcgcc 660 aagggaaaga tgtgtgctct attcatcaac gatcttgatg caggagcagg tcgtcttggt 720 ggaaccaccc aatacactgt gaacaaccag atggtgaatg ccactctcat gaacattgct 780 gataacccta caaatgtgca gcttcctggt atgtacaaca aggaagagaa cgcccgtgtg 840 cccatcattg tcaccggtaa tgatttctca acgctgtatg ctcctctcat tcgtgatggg 900 cg t a t ggaga agttctactg ggcaccaaca agggacgacc gcgttggtgt ttgcaaggga 960 attttccgca ccgatggtgt tcctgaagag gacattacaa agcttgttga caccttccca 1020 ggccaatcta ttgatttctt tggtgcactg agggccagag tgtatgatga tgaagtgagg 1080 aagtggattt ctggtgttgg tgttgatgct actgggaaga agcttgtgaa ctcaaaggaa 1140 ggacctccta cctttgatca gcccaagatg agtctggaca agctcttgca gtatggtaac 1200 atgcttgtcc aagaacaaga aaatgtgaag agagtccaat tggctgacaa gtacttgaat 1260 gaggctgctc ttggaaatgc taacgaagat gctattaaga gtggatcttt cttcaaatag 1320 <210> 318
<211> 439
<212> PRT
<213> Vigna radiata
<400> 318 Met Ala Ala Ser Val Ser Thr Val Gly Ala Val Asn Arg Ala Ile Leu 10 15
Asn Leu Asn Gly Ser Gly Ala Gly Ala Ser Ala Pro Thr Ser Ala Phe 20 25 30
Phe Gly Thr Ser Leu Lys Lys Ala Val Ala Ser Arg Val Pro Asn Ser 35 40 45
Lys Val Thr Asn Gly Ser Phe Lys Ile Val Ala Ala Glu Lys Glu Ile 50 55 60
Glu Glu Ser Gln Gln Thr Asn Lys Asp Arg Trp Lys Gly Leu Ala Tyr 65 70 75 80
Asp Ile Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Lys Gly Met Val 85 90 95
Asp Pro Leu Phe Gln Ala Pro Met Asp Ala Gly Thr His Tyr Ala Val 100 105 110
Met Ser Ser Tyr Glu Tyr Leu Ser Thr Gly Leu Arg Gln Leu Asp Asn 115 120 125
Ile Lys Asp Gly Phe Tyr Ile Ala Pro Ala Phe Leu Asp Lys Leu Val 130 135 140
Val His Ile Thr Lys Asn Phe Met Thr Leu Pro Asn Ile Lys Val Pro 145 150 155 160
Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys Ser Phe Gln 165 170 175
Cys Glu Leu Val Phe Ala Lys Met Gly Ile Asn Pro Ile Met Met Ser 180 185 190
Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala Lys Leu Ile 195 200 205
Arg Gln Arg Tyr Arg Glu Ala Ala Asp Leu Ile Ala Lys Gly Lys Met 210 215 220
Cys Ala Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly Arg Leu Gly 225 230 235 240
Gly Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn Ala Thr Leu 245 250 255 Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro Gly Met Tyr 260 265 270
Asn Lys Glu Glu Asn Ala Arg Val Pro Ile Ile Val Thr Gly Asn Asp 275 280 285
Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg Met Glu Lys 290 295 300
Phe Tyr Tirp Ala Pro Thr Arg Asp Asp Arg Val Gly Val Cys Lys Gly 305 310 315 320
Ile Phe Arg Thr Asp Gly Val Pro Glu Glu Asp Ile Thr Lys Leu Val 325 330 335
Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala Leu Arg Ala 340 345 350
Arg Val Tyr Asp Asp Glu Val Arg Lys Trp Ile Ser Gly Val Gly Val 355 360 365
Asp Ala Thr Gly Lys Lys Leu Val Asn Ser Lys Glu Gly Pro Pro Thr 370 375 380
Phe Asp Gln Pro Lys Met Ser Leu Asp Lys Leu Leu Gln Tyr Gly Asn 385 390 395 400
Met Leu Val Gln Glu Gln Glu Asn Val Lys Arg Val Gln Leu Ala Asp 405 410 415
Lys Tyr Leu Asn Glu Ala Ala Leu Gly Asn Ala Asn Glu Asp Ala Ile 420 425 430
Lys Ser Gly Ser Phe Phe Lys 435
<210> 319
<211> 1230
<212> DNA
<213> Volvox carteri
<400> 319
atgcagacca ccatgaaggg cagcgccatc tctggccagc gcgtgggcag cgcccgcgtc 60 gccgcacgta gcgtgcgcag ggctcagctt caggttgtag ctgctagccg ctctcaggtt 120 ggtcgctggc gcaatatcga cgccgatgtt gacacctcgg acgaccagca agacatcacc 180 cgcggtcgcc agatggtcga cgacctcttc cagggtggct tcggcgccgg tggcacgcac 240 aacgccgtgc tgtcgtccac cgagtacctg agccaggccc gcgcctcgtt caacaacatt 300 gaggatggtt tctacatctc accggctttc cttgacaaga tgaccatcca cattgctaag 360 aacttcatgg atctgccgaa gattaaagtc ccactcattc tcggcatctg gggtggcaag 420 ggtcagggca agactttcca gtgcgctctg gcgtacaaga agctcggcat ctcacccatt 480 gtcatgtcgg ctggtgagct cgagtccggc aatgctggtg agcctgccaa gctgatccgc 540 acccgctacc gggaggcgtc cgacatcatc aagaagggca agatgtgctc cctgttcatc 600 aacgatctgg atgctggtgc tggccgtatg ggtgacacca cccagtacac cgtcaacaac 660 cagatggtca acgcaacgct gatgaacatt gccgataacc cgaccaacgt gcagctgccg 720 ggtgtctaca agaacgagga gatcccccgc gtgccaatcg tctgcacggg taacgacttc 780 tcgaccctgt acgctcccct cattcgtgat ggccgtatgg agaagtacta ctggaacccc 840 acccgcgagg accgcattgg tgtgtgcatg ggcatcttcc aggaggacaa cgtcagccgt 900 ggcgacgttg agcgcctggt cgacaccttc cctggccaat ccattgattt cttcggcgcc 960 ctccgcgctc gcgtctacga tgacatggtg cgcaagtgga ttgccgaggt cggcattgag 1020 ggcatcggca gcaagctggt caacggcagg cagaaggtgt cgttccctaa ggtgtcgatg 1080 tcgctggacg tgctgctgaa gtacggccgc gccctggttg acgagcagga gaacgtcaag 1140 cgcgtgcagc tggccgatgc ctacctgtct ggtgccgagc tggctggccg tgagggctcg 1200 tcgctgccgg aggagtactc tcgccggtaa 1230 <210> 320 <211> 409 <212> PRT
<213> Volvox carteri <400> 320
Met Gln Thr Thr Met Lys Gly Ser Ala Ile Ser Gly Gln Arg Val Gly 10 15
Ser Ala Arg Val Ala Ala Arg Ser Val Arg Arg Ala Gln Leu Gln Val 20 25 30
Val Ala Ala Ser Arg Ser Gln Val Gly Arg Trp Arg Asn Ile Asp Ala 35 40 45
Asp Val Asp Thr Ser Asp Asp Gln Gln Asp Ile Thr Arg Gly Arg Gln 50 55 60
Met Val Asp Asp Leu Phe Gln Gly Gly Phe Gly Ala Gly Gly Thr His 65 70 75 80 Asn Ala Val Leu Ser Ser Thr Glu Tyr Leu Ser Gln Ala Arg Ala Ser 85 90 95
Phe Asn Asn Ile Glu Asp Gly Phe Tyr Ile Ser Pro Ala Phe Leu Asp 100 105 110
Lys Met Thr Ile His Ile Ala Lys Asn Phe Met Asp Leu Pro Lys Ile 115 120 125
Lys Val Pro Leu Ile Leu Gly Ile Trp Gly Gly Lys Gly Gln Gly Lys 130 135 140
Thr Phe Gln Cys Ala Leu Ala Tyr Lys Lys Leu Gly Ile Ser Pro Ile 145 150 155 160
Val Met Ser Ala Gly Glu Leu Glu Ser Gly Asn Ala Gly Glu Pro Ala 165 170 175
Lys Leu Ile Arg Thr Arg Tyr Arg Glu Ala Ser Asp Ile Ile Lys Lys 180 185 190
Gly Lys Met Cys Ser Leu Phe Ile Asn Asp Leu Asp Ala Gly Ala Gly 195 200 205
Arg Met Gly Asp Thr Thr Gln Tyr Thr Val Asn Asn Gln Met Val Asn 210 215 220
Ala Thr Leu Met Asn Ile Ala Asp Asn Pro Thr Asn Val Gln Leu Pro 225 230 235 240
Gly Val Tyr Lys Asn Glu Glu Ile Pro Arg Val Pro Ile Val Cys Thr 245 250 255
Gly Asn Asp Phe Ser Thr Leu Tyr Ala Pro Leu Ile Arg Asp Gly Arg 260 265 270
Met Glu Lys Tyr Tyr Trp Asn Pro Thr Arg Glu Asp Arg Ile Gly Val 275 280 285
Cys Met Gly Ile Phe Gln Glu Asp Asn Val Ser Arg Gly Asp Val Glu 290 295 300
Arg Leu Val Asp Thr Phe Pro Gly Gln Ser Ile Asp Phe Phe Gly Ala 305 310 315 320
Leu Arg Ala Arg Val Tyr Asp Asp Met Val Arg Lys Trp Ile Ala Glu 325 330 335 Val Gly Ile Glu Gly Ile Gly Ser Lys Leu Val 340 345
Val Ser Phe Pro Lys Val Ser Met Ser Leu Asp 355 360
Gly Arg Ala Leu Val Asp Glu Gln Glu Asn Val 370 375
Ala Asp Ala Tyr Leu Ser Gly Ala Glu Leu Ala 385 390 395
Ser Leu Pro Glu Glu Tyr Ser Arg Arg 405
<210> 321
<211> 693
<212> DNA
<213> Arabidopsis thaliana
<220> "t" <221> variation <222> (143)..(143) <223> /substituir = ' <400> 321 ctagcagctc tcaaagcttc atgccaaaca cacaggtatt tcgttgaaca gcttatgtgt tctctcgaag aacaacaatc tcccgtggcc caagagaaat tcgcctccgt ttccctcgcc ccgtggttta actcctacgc taaacttatt gtgtttaaac tcaccgaggt ctccgtggcc tcgagtctta agtcggagac taggaggaaa gtgcaacaaa gcgtggcgga tccgccggtg ggaatggtgg acggagaaga aacggatttg atggcggcag cgatgaacaa cgctgatcag gagattctta ctccgccgca agcgattaaa cgtctgagag acagagacca agaaagagct <210> 322
<211> 230
<212> PRT
<213> Arabidopsis thaliana
Asn Gly Arg Gln Lys 350
Val Leu Leu Lys Tyr 365
Lys Arg Val Gln Leu 380
Gly Arg Glu Gly Ser 400
actatcttcg ttgatggttg gttaatccgt 60 gcttcttcct tggatgaaac taatcgtatc 120 cagtttctat ctcactgtct tcaatactac 180 ggggacaacg ttttcacttt cttctgccca 240 ttatgggtcg gcgatttcaa gccttctctt 300 gacctcacgc gccaccagaa agaccggatc 360 gagagagaag ttatgcgaga tttcgccctc 420 atgctcgcgg cgaggcgcgt gggagcggtg 480 gaggaggcga tggaggtgct taaagctggg 540 ctacggtgtt cgacggtggg gaaagtggtg 600 gtgttgagga caatcggaca gcttcacctc 660 taa 693 <220>
<221> VARIANTE
<222> (48)..(48)
<223> /substituir = "Pro"
<400> 322
Met Pro Asn Thr Ser Ser Ser Gln Ser Phe Thr Ile Phe Val Asp Gly 10 15
Trp Leu Ile Arg His Arg Tyr Phe Val Glu Gln Leu Met Cys Ala Ser 20 25 30
Ser Leu Asp Glu Thr Asn Arg Ile Ser Leu Glu Glu Gln Gln Ser Leu 35 40 45
Val Ala Gln Phe Leu Ser His Cys Leu Gln Tyr Tyr Gln Glu Lys Phe 50 55 60
Ala Ser Val Ser Leu Ala Gly Asp Asn Val Phe Thr Phe Phe Cys Pro 65 70 75 80
Pro Trp Phe Asn Ser Tyr Ala Lys Leu Ile Leu Trp Val Gly Asp Phe 85 90 95
Lys Pro Ser Leu Val Phe Lys Leu Thr Glu Val Ser Val Ala Asp Leu 100 105 110
Thr Arg His Gln Lys Asp Arg Ile Ser Ser Leu Lys Ser Glu Thr Arg 115 120 125
Arg Lys Glu Arg Glu Val Met Arg Asp Phe Ala Leu Val Gln Gln Ser 130 135 140
Val Ala Asp Pro Pro Val Met Leu Ala Ala Arg Arg Val Gly Ala Val 145 150 155 160
Gly Met Val Asp Gly Glu Glu Thr Asp Leu Glu Glu Ala Met Glu Val 165 170 175
Leu Lys Ala Gly Met Ala Ala Ala Met Asn Asn Ala Asp Gln Leu Arg 180 185 190
Cys Ser Thr Val Gly Lys Val Val Glu Ile Leu Thr Pro Pro Gln Ala 195 200 205
Ile Lys Val Leu Arg Thr Ile Gly Gln Leu His Leu Arg Leu Arg Asp 210 215 220 Arg Asp Gln Glu Arg Ala 225 230
<210> 323
<211> 849
<212> DNA
<213> Arabidopsis thaliana
<400> 323
atggcgacta gttcttcgag ttatgggatt gaacaacttc aaaaaggatg ttactatgag 60 tggatgagtg tgcaggctaa acacatagtt gatctcaaag aagcactcat gagtcatcga 120 tccaaagaag atcacaagct tgaagaactc gttggtaaaa tcgtcaatga cttccaaaaa 180 tacaccgaaa aacgatctga gctctctcgc cgaagctgct caagctactt tgcaccgtcg 240 tggaactctc ctctagagaa cggtttacta tggatgggag gatgtcgtcc atcgtctttc 300 attagagtta tttactctct ttgtggatcc caagccgaaa cgcagctttc tcagtatctt 360 ctaaagatcg atgaaaatgt cgaagtaaac catggtggtt ccatgagtga tctaaacgcg 420 tcgcagcttg caaaaatcaa tgatttgcat ataaaggtta tagagaaaga ggacaagata 480 acaaagaaat cggcgaattt gcaagagaat gttgcggata tgcctatagc catcgcggct 540 tatgccacgg acttgatgaa tggtgacgtg gtggtggaag atgctttaga taagtatgag 600 gagggcatgg cggttttaat ggtggaagct gataaactga ggtttgagac gcttaggaag 660 atcgtggatg ttgttacgcc ggttcaagcg gcggagtttt tgctcgcagg gaaaagatta 720 cacatatcat tgcacgagtg gggaagagtt agagaagagc aacgttttgg gtgtgtacgt 780 acggatgcag cggctgccac gggaggagcg ggaaccgaga agtcaaagag gtcaagcttg 840 ttgatgtga 849 <210> 324 <211> 282 <212> PRT
<213> Arabidopsis thaliana <400> 324
Met Ala Thr Ser Ser Ser Ser Tyr Gly Ile Glu Gln Leu Gln Lys Gly 10 15
Cys Tyr Tyr Glu Trp Met Ser Val Gln Ala Lys His Ile Val Asp Leu 20 25 30
Lys Glu Ala Leu Met Ser His Arg Ser Lys Glu Asp His Lys Leu Glu 35 40 45
Glu Leu Val Gly Lys Ile Val Asn Asp Phe Gln Lys Tyr Thr Glu Lys 50 55 60 Arg Ser Glu Leu Ser Arg Arg Ser Cys Ser Ser Tyr Phe Ala Pro Ser 65 70 75 80
Trp Asn Ser Pro Leu Glu Asn Gly Leu Leu Trp Met Gly Gly Cys Arg 85 90 95
Pro Ser Ser Phe Ile Arg Val Ile Tyr Ser Leu Cys Gly Ser Gln Ala 100 105 110
Glu Thr Gln Leu Ser Gln Tyr Leu Leu Lys Ile Asp Glu Asn Val Glu 115 120 125
Val Asn His Gly Gly Ser Met Ser Asp Leu Asn Ala Ser Gln Leu Ala 130 135 140
Lys Ile Asn Asp Leu His Ile Lys Val Ile Glu Lys Glu Asp Lys Ile 145 150 155 160
Thr Lys Lys Ser Ala Asn Leu Gln Glu Asn Val Ala Asp Met Pro Ile 165 170 175
Ala Ile Ala Ala Tyr Ala Thr Asp Leu Met Asn Gly Asp Val Val Val 180 185 190
Glu Asp Ala Leu Asp Lys Tyr Glu Glu Gly Met Ala Val Leu Met Val 195 200 205
Glu Ala Asp Lys Leu Arg Phe Glu Thr Leu Arg Lys Ile Val Asp Val 210 215 220
Val Thr Pro Val Gln Ala Ala Glu Phe Leu Leu Ala Gly Lys Arg Leu 225 230 235 240
His Ile Ser Leu His Glu Trp Gly Arg Val Arg Glu Glu Gln Arg Phe 245 250 255
Gly Cys Val Arg Thr Asp Ala Ala Ala Ala Thr Gly Gly Ala Gly Thr 260 265 270
Glu Lys Ser Lys Arg Ser Ser Leu Leu Met 275 280
<210> 325
<211> 708
<212> DNA
<213> Arabidopsis thaliana <400> 325
atgagtttac aaactaaaca catagatgat ctcaaagaag cactcatgtg tcaacgaaac 60 aacgatgaca aactcgaaga cctcgttggt aaaatcgtca atgactacca cacatatgcg 120 ggaaaacgat cagagctctc gtaccgatgc tgcgctcact actttgcacc gtcgtggaac 180 actcctatag agaacagtat gctatggatg ggaggatgtc gtccttcttc tttcattaga 240 cttatatacg cactttgtgg atcccaggcc gaaactcagc tttctcaata tcttcttaag 300 atcgatgacg acttcgatat aaaccatggt ggtttcatga gtgatcttac cgcgacacag 360 cttggaaaac tcaatgactt gcatttggag gtaataaaga aag aag acaa gattacgaag 420 acatctgcga attttcaaga cgatgtggcg gatttgccaa tcgcggatgt ggtgcatgct 480 gatgtagcgg tggaggatgc tttggataag catgaagagg gaatggcggt tttactggcg 540 gaggctgata aactgaggtt tgagacgctt aggaagattg tggacgttgt cacaccgctt 600 caagcggtgg agtttttgct tgccggaaaa agattacagc tgtcgttgca cgaccgggga 660 agagttagag cagatgtttg tggaggagtg gggggcgccg ctgtctga 708 <210> 326 <211> 235 <212> PRT
<213> Arabidopsis thaliana <400> 326
Met Ser Leu Gln Thr Lys His Ile Asp Asp Leu Lys Glu Ala Leu Met 10 15
Cys Gln Arg Asn Asn Asp Asp Lys Leu Glu Asp Leu Val Gly Lys Ile 20 25 30
Val Asn Asp Tyr His Thr Tyr Ala Gly Lys Arg Ser Glu Leu Ser Tyr 35 40 45
Arg Cys Cys Ala His Tyr Phe Ala Pro Ser Trp Asn Thr Pro Ile Glu 50 55 60
Asn Ser Met Leu Trp Met Gly Gly Cys Arg Pro Ser Ser Phe Ile Arg 65 70 75 80
Leu Ile Tyr Ala Leu Cys Gly Ser Gln Ala Glu Thr Gln Leu Ser Gln 85 90 95
Tyr Leu Leu Lys Ile Asp Asp Asp Phe Asp Ile Asn His Gly Gly Phe 100 105 110
Met Ser Asp Leu Thr Ala Thr Gln Leu Gly Lys Leu Asn Asp Leu His 115 120 125 Leu Glu Val Ile Lys Lys Glu Asp Lys Ile Thr Lys Thr Ser Ala Asn
Phe Gln Asp Asp Val Ala Asp Leu Pro Ile Ala Asp Val Val His Ala
Asp Val Ala Val Glu Asp Ala Leu Asp Lys His Glu Glu Gly Met Ala
Val Leu Leu Ala Glu Ala Asp Lys Leu Arg Phe Glu Thr Leu Arg Lys
Ile Val Asp Val Val Thr Pro Leu Gln Ala Val Glu Phe Leu Leu Ala
Gly Lys Arg Leu Gln Leu Ser Leu His Asp Arg Gly Arg Val Arg Ala
Asp Val Cys Gly Gly Val Gly Gly Ala Ala Val
<210> 327 <211> 790 <212> DNA
<213> Arabidopsis thaliana <400> 327
atagaatata accactaatg agcaaaatga gaaacctagt agaagaaaag ttcctagagt 60
tctatgagag ttgggttatt caacttgagc tatatcttca tcaactttta attgctcata 120
acaataacac tatgagtgag accgagcttc gacatttgat ctcgaagcta actacacatc 180
acaaagctta ttatacagcc aaatgggcag ccataagaga agatgtctta gcttttttcg 240
gatcagtttg gttaaacccg ttagagaatg cttgctcttg gttaaccgga tggaaaccgt 300
cgatggtgtt tcggatggtt gataggctga ggaagtcgag agtggtgctt gtggaggctc 360
aggtgaagaa attggaggag ctgagagtta agaccaagtt cgatgagcaa aaaattgaga 420
gagagatgga gcggtatcag gtggctatgg ctgatcggaa aatggtagag ctggcgaggc 480
ttggatgtca cgtcggagga gaatcggtga tggtggtgga ggcagcggtg agaggattat 540
cgatgggtct tgagaaaatg gtgaaggctg cggattgtgt gcggctgaaa acgcttaaag 600
gtatattaga cattttaact ccaccgcaat gcgttgagtt tttggcagcg gcggctacgt 660
ttcaggttca gttacgtcgg tggggaaacc gaagacatta tgtcactcac tcctgacaca 720
aacttaagag ttattttctc tgttctgttt tttttttttt tcatattaca ataagaatga 780
aatttttaac 790 <210> 328 <211> 232 <212> PRT
<213> Arabidopsis thaliana <400> 328
Met Ser Lys Met Arg Asn Leu Val Glu Glu Lys Phe Leu Glu Phe Tyr 10 15
Glu Ser Trp Val Ile Gln Leu Glu Leu Tyr Leu His Gln Leu Leu Ile 20 25 30
Ala His Asn Asn Asn Thr Met Ser Glu Thr Glu Leu Arg His Leu Ile 35 40 45
Ser Lys Leu Thr Thr His His Lys Ala Tyr Tyr Thr Ala Lys Trp Ala 50 55 60
Ala Ile Arg Glu Asp Val Leu Ala Phe Phe Gly Ser Val Trp Leu Asn 65 70 75 80
Pro Leu Glu Asn Ala Cys Ser Trp Leu Thr Gly Trp Lys Pro Ser Met 85 90 95
Val Phe Arg Met Val Asp Arg Leu Arg Lys Ser Arg Val Val Leu Val 100 105 110
Glu Ala Gln Val Lys Lys Leu Glu Glu Leu Arg Val Lys Thr Lys Phe 115 120 125
Asp Glu Gln Lys Ile Glu Arg Glu Met Glu Arg Tyr Gln Val Ala Met 130 135 140
Ala Asp Arg Lys Met Val Glu Leu Ala Arg Leu Gly Cys His Val Gly 145 150 155 160
Gly Glu Ser Val Met Val Val Glu Ala Ala Val Arg Gly Leu Ser Met 165 170 175
Gly Leu Glu Lys Met Val Lys Ala Ala Asp Cys Val Arg Leu Lys Thr 180 185 190
Leu Lys Gly Ile Leu Asp Ile Leu Thr Pro Pro Gln Cys Val Glu Phe 195 200 205
Leu Ala Ala Ala Ala Thr Phe Gln Val Gln Leu Arg Arg Trp Gly Asn 210 215 220 Arg Arg His Tyr Val Thr His Ser 225 230
<210> 329
<211> 905
<212> DNA
<213> Arabidopsis thaliana
<400> 329
cttggaacta tatatgagtc atgccaatca ctagcagctc tgaaactttt gcgagcttct 60 tcaatgactg gctctgccgt cacaggcaat tcgtccaaca acttgcacac cttgctgatg 120 aaacaaccat tgtaactcca atagaagaag aatctcttgt gagtaacttt ctttctcact 180 atctccaata ctacgaagag aaatcagttg ccatgtccgt ggccggtgac gatatatatg 240 atttcttctc tccaccatgg ctcagctcat acgagaaact catcctctgg atcggaggtt 300 ttaaaccagg tatggttttt aagctcataa ccacttctgt taatgacctt acgagccacc 360 aaatagacca actcgagagc attcggttag agactaaacg gagggagaga gatttgatgc 420 gaaggttcgc gcttctacaa cagagcgtgg gggatccact tctgatggtt ccatttaggc 480 gcatcggagt gttgaggctt ggcgaaggag agcagccaga aatggaggat gcaatggagg 540 ttttgaaggt agagatgatt aaagcgatga agaacgctga tcaactccgg tgtgtgacgg 600 ttgggaaagt ggtggaggtt ctgaatccac ggcagtcgat caagctgcta agagccgctg 660 gagagtttta tctccggctg agagatttag gtgtgtagag agaaacagtt ctttgctagg 720 actttaatgt tctttttttt tttttttgag tgttctaagt atttcgaaat caggtttggt 780 cttataagtg aacaacattt gttctacaat aaaaacaaat ccggtagtgc ttatgtatag 840 gtttgggctt tggacatgag ttttgtatgt aattacgttt catgccatcg tacttttagt 900 tctct 905 <210> 330 <211> 225 <212> PRT
<213> Arabidopsis thaliana <400> 330
Met Pro Ile Thr Ser Ser Ser Glu Thr Phe Ala Ser Phe Phe Asn Asp 10 15
Trp Leu Cys Arg His Arg Gln Phe Val Gln Gln Leu Ala His Leu Ala 20 25 30
Asp Glu Thr Thr Ile Val Thr Pro Ile Glu Glu Glu Ser Leu Val Ser 35 40 45 Asn Phe Leu Ser His Tyr Leu Gln Tyr Tyr Glu Glu Lys Ser Val Ala 50 55 60
Met Ser Val Ala Gly Asp Asp Ile Tyr Asp Phe Phe Ser Pro Pro Trp 65 70 75 80
Leu Ser Ser Tyr Glu Lys Leu Ile Leu Trp Ile Gly Gly Phe Lys Pro 85 90 95
Gly Met Val Phe Lys Leu Ile Thr Thr Ser Val Asn Asp Leu Thr Ser 100 105 110
His Gln Ile Asp Gln Leu Glu Ser Ile Arg Leu Glu Thr Lys Arg Arg 115 120 125
Glu Arg Asp Leu Met Arg Arg Phe Ala Leu Leu Gln Gln Ser Val Gly 130 135 140
Asp Pro Leu Leu Met Val Pro Phe Arg Arg Ile Gly Val Leu Arg Leu 145 150 155 160
Gly Glu Gly Glu Gln Pro Glu Met Glu Asp Ala Met Glu Val Leu Lys 165 170 175
Val Glu Met Ile Lys Ala Met Lys Asn Ala Asp Gln Leu Arg Cys Val 180 185 190
Thr Val Gly Lys Val Val Glu Val Leu Asn Pro Arg Gln Ser Ile Lys 195 200 205
Leu Leu Arg Ala Ala Gly Glu Phe Tyr Leu Arg Leu Arg Asp Leu Gly 210 215 220
Val
225
<210> 331
<211> 1095
<212> DNA
<213> Arabidopsis thaliana
<400> 331
atgaatacaa cctcgacaca ttttgttcca ccgagaaggt ttgaagttta cgagcctctc 60 aaccaaatcg gtatgtggga agaaagtttc aagaacaatg gagacatgta tacgcctggc 120 tctatcataa tcccgactaa cgaaaaacca gacagcttgt cagaggatac ttctcatggg 180 acagaaggaa ctcctcacaa gtttgaccaa gaggcttcca catctagaca tcctgataag 240 atacagagaa ggctagcaca gaatcgagag gcagctagga aaagtcgttt gcgcaagaaa 300 gcttatgttc agcagctaga gactagccgg ttaaagctaa ttcatttaga gcaagaactc 360 gatcgtgcta gacaacaggg tttctatgtg gggaacggag tagataccaa tgctcttagt 420 ttctcagata acatgagctc agggattgtt gcatttgaga tggaatatgg acattgggtg 480 gaagaacaga acaggcaaat atgtgaacta agaacggttt tacatggaca agttagtgat 540 atagagcttc gttctctagt cgagaatgcc atgaaacatt actttcaact cttccgaatg 600 aagtcagccg ctgcaaaaat cgatgttttc tatgtcatgt ccggaatgtg gaaaacttca 660 gcagagcggt ttttcttgtg gataggcgga tttagaccct cagagcttct caaggttctg 720 ttaccgcatt ttgatccttt gacggatcaa caacttttgg atgtatgtaa tctgaggcaa 780 tcatgtcaac aagcagaaga tgcgttatcc caaggtatgg agaaactgca acatacatta 840 gcagagagtg tagcagccgg gaaacttggt gaaggaagtt atattcctca aatgacttgt 900 gctatggaga gattggaggc tttggtcagc tttgtaaatc aagctgatca tctgagacat 960 gagacattgc aacagatgca tcggatctta accacgcgac aagcggctag aggtttgtta 1020 gcattagggg agtatttcca aaggcttcga gctttgagtt cgagttgggc ggctaggcaa 1080 cgtgaaccaa cgtaa 1095 <210> 332 <211> 364 <212> PRT
<213> Arabidopsis thaliana <400> 332
Met Asn Thr Thr Ser Thr His Phe Val Pro Pro Arg Arg Phe Glu Val 10 15
Tyr Glu Pro Leu Asn Gln Ile Gly Met Trp Glu Glu Ser Phe Lys Asn 20 25 30
Asn Gly Asp Met Tyr Thr Pro Gly Ser Ile Ile Ile Pro Thr Asn Glu 35 40 45
Lys Pro Asp Ser Leu Ser Glu Asp Thr Ser His Gly Thr Glu Gly Thr 50 55 60
Pro His Lys Phe Asp Gln Glu Ala Ser Thr Ser Arg His Pro Asp Lys 65 70 75 80
Ile Gln Arg Arg Leu Ala Gln Asn Arg Glu Ala Ala Arg Lys Ser Arg 85 90 95
Leu Arg Lys Lys Ala Tyr Val Gln Gln Leu Glu Thr Ser Arg Leu Lys 100 105 110
Leu Ile His Leu Glu Gln Glu Leu Asp Arg Ala Arg Gln Gln Gly Phe 115 120 125
Tyr Val Gly Asn Gly Val Asp Thr Asn Ala Leu Ser Phe Ser Asp Asn 130 135 140
Met Ser Ser Gly Ile Val Ala Phe Glu Met Glu Tyr Gly His Trp Val 145 150 155 160
Glu Glu Gln Asn Arg Gln Ile Cys Glu Leu Arg Thr Val Leu His Gly 165 170 175
Gln Val Ser Asp Ile Glu Leu Arg Ser Leu Val Glu Asn Ala Met Lys 180 185 190
His Tyr Phe Gln Leu Phe Arg Met Lys Ser Ala Ala Ala Lys Ile Asp 195 200 205
Val Phe Tyr Val Met Ser Gly Met Trp Lys Thr Ser Ala Glu Arg Phe 210 215 220
Phe Leu Trp Ile Gly Gly Phe Arg Pro Ser Glu Leu Leu Lys Val Leu 225 230 235 240
Leu Pro His Phe Asp Pro Leu Thr Asp Gln Gln Leu Leu Asp Val Cys 245 250 255
Asn Leu Arg Gln Ser Cys Gln Gln Ala Glu Asp Ala Leu Ser Gln Gly 260 265 270
Met Glu Lys Leu Gln His Thr Leu Ala Glu Ser Val Ala Ala Gly Lys 275 280 285
Leu Gly Glu Gly Ser Tyr Ile Pro Gln Met Thr Cys Ala Met Glu Arg 290 295 300
Leu Glu Ala Leu Val Ser Phe Val Asn Gln Ala Asp His Leu Arg His 305 310 315 320
Glu Thr Leu Gln Gln Met His Arg Ile Leu Thr Thr Arg Gln Ala Ala 325 330 335
Arg Gly Leu Leu Ala Leu Gly Glu Tyr Phe Gln Arg Leu Arg Ala Leu 340 345 350 Ser Ser Ser Trp Ala Ala Arg Gln Arg Glu Pro Thr 355 360
<210> 333
<211> 2204
<212> DNA
<213> Triticvim aestivum
<400> 333
gaattccggc gacggcggca gtctactacc ccgtagttcg gatagaggcc cctcttccta 60 tcgagtgttt aggcatatat ctgcagcttt gtcacaacaa aggaatctct ctgggagtta 120 cattgagcac tatgaataat ctgcaatggc agaggccagc cctagaacag aaacgtcaac 180 agatgatact gatgaaaatc ttatgcttga accagggaat gctgctcttg ctgttgtttc 240 tgactctagt gacagatcca gagacaaaaa cggagatcaa aagacaatgc gtcggcttgc 300 tcaaaatcgc gaggctgcta ggaaaagtcg tttgaggaaa aaggcatatg ttcaacaatt 360 ggagaacagc aggctaaagc ttacccagct agagcaggag ttgcaacgag ctcgtcaaca 420 aggcattttt atatctagtt cagcagacca gtcccattcc atgagtggaa atggggcgtt 480 ggcttttgac acggagtacg cacggtggtt ggaagaacac aatcgacaag ttaatgagct 540 gagagctgca gttaatgctc atgcaggcga tactgagctg cgtagtgttg ttgagaagat 600 catgtcacac tatgatgaga tttttaagca aaaaggaaat gcagccaaag cagatgtctt 660 tcatgtgtta tcaggcatgt ggaagacacc agctgagagg tgtttcctat ggcttggagg 720 tttccgacct tctgagcttt taaagcttct ttcgacccag cttgaacccc taactgagca 780 gcagctgtca gggatatgca accttcagca atcatcacaa caagctgagg atgctctttc 840 acaaggaatg gaggctcttc agcagtcttt ggcagaaacg ttggctgggt ctatcggctc 900 ttctggatct ggatcaacag gaaatgtggc aaactacatg gggcaaatgg ccatggccat 960 gggaaagctt ggaacccttg aaaatttcct tagtcaggct gacaacctgc ggcagcagac 1020 tcttcagcag atgcaaagga tcctgaccac aaggcagtct gcccgtgcac ttcttgtgat 1080 aagtgattac tcatcccggc ttcgtgccct aagttctctt tggcttgctc gaccgaagga 1140 ataacaagcg cgtgtgattt gactgcaata cattttcgca atttgggggt gatggtggtg 1200 gcagtcatgc aacagacttg attcagagaa acttgcacat actataatcc aaagagatgc 1260 tgtgttcagg tagcttagcc atatagtgaa gttgagtgca ttagggaagg gtccttgttg 1320 taccgttaac cgctgtaaaa ttggcatcta atggttgcca agtaatcttt aagatactaa 1380 tttgcagaga gccatccctt tagatgtgca tttataactc ttttgttgct aatcggaaaa 1440 aaaaaaggag gaagagcgag ctaggcaaga ggctatcgcg aaaaaggctg cagaagacaa 1500 caaggatcag ccctcaagct ctaccgatgc tattatggct gaagcggaac ttaccttaaa 1560 tgctcctgct gatcttgacg cagatctact caaggatgat gatgatgctc agctactaca 1620 gcaagcactt gctatgtcaa tggatgaggg tgcttcagga gctgcagccg tggctgatgc 1680 tgctatggca gaagctgctg cagatgacca ggatttggca ttggctcttc aaatgtctgt 1740 ccaggacgct gaggcggctg gtcaatctga tatgagcaaa gtgtttgaag acagatcatt 1800 tgtgacatcc atccttaatt cgcttcctgg tgttgacccc aatgacccat ctgtgaaaga 1860 tctactggca tctttgcatg gccaaggaga gcaggaggag aagaaagata aggaggacaa 1920 gccagacatt tctgaagatg ggaagaactg aaggcaatga acatctattt tctcggaaaa 1980 gtgcaggcgc atgaagtgaa gaagattgcc tgcattagct gcttttacac tcgggctcta 2040 tgaatttact taatcctctt gtaactgcgt tgatgataac tgccgagaga acttgtatta 2100 tgtctgctct cacgaatgct ccttcatgtt tgtcttaagt gattacatgt tgcaaattca 2160 tttgtacact ttatgtctgt tgaaggtgaa attgaacgga attc 2204 <210> 334 <211> 332 <212> PRT
<213> Triticum aestivum <400> 334
Met Ala Glu Ala Ser Pro Arg Thr Glu Thr Ser Thr Asp Asp Thr Asp 10 15
Glu Asn Leu Met Leu Glu Pro Gly Asn Ala Ala Leu Ala Val Val Ser 20 25 30
Asp Ser Ser Asp Arg Ser Arg Asp Lys Asn Gly Asp Gln Lys Thr Met 35 40 45
Arg Arg Leu Ala Gln Asn Arg Glu Ala Ala Arg Lys Ser Arg Leu Arg 50 55 60
Lys Lys Ala Tyr Val Gln Gln Leu Glu Asn Ser Arg Leu Lys Leu Thr 65 70 75 80
Gln Leu Glu Gln Glu Leu Gln Arg Ala Arg Gln Gln Gly He Phe Ile 85 90 95
Ser Ser Ser Ala Asp Gln Ser His Ser Met Ser Gly Asn Gly Ala Leu 100 105 110
Ala Phe Asp Thr Glu Tyr Ala Arg Trp Leu Glu Glu His Asn Arg Gln 115 120 125
Val Asn Glu Leu Arg Ala Ala Val Asn Ala His Ala Gly Asp Thr Glu 130 135 140 Leu Arg Ser Val Val Glu Lys He Met Ser His Tyr Asp Glu Ile Phe 145 150 155 160
Lys Gln Lys Gly Asn Ala Ala Lys Ala Asp Val Phe His Val Leu Ser 165 170 175
Gly Met Trp Lys Thr Pro Ala Glu Arg Cys Phe Leu Trp Leu Gly Gly 180 185 190
Phe Arg Pro Ser Glu Leu Leu Lys Leu Leu Ser Thr Gln Leu Glu Pro 195 200 205
Leu Thr Glu Gln Gln Leu Ser Gly Ile Cys Asn Leu Gln Gln Ser Ser 210 215 220
Gln Gln Ala Glu Asp Ala Leu Ser Gln Gly Met Glu Ala Leu Gln Gln 225 230 235 240
Ser Leu Ala Glu Thr Leu Ala Gly Ser Ile Gly Ser Ser Gly Ser Gly 245 250 255
Ser Thr Gly Asn Val Ala Asn Tyr Met Gly Gln Met Ala Met Ala Met 260 265 270
Gly Lys Leu Gly Thr Leu Glu Asn Phe Leu Ser Gln Ala Asp Asn Leu 275 280 285
Arg Gln Gln Thr Leu Gln Gln Met Gln Arg Ile Leu Thr Thr Arg Gln 290 295 300
Ser Ala Arg Ala Leu Leu Val Ile Ser Asp Tyr Ser Ser Arg Leu Arg 305 310 315 320
Ala Leu Ser Ser Leu Trp Leu Ala Arg Pro Lys Glu
330
325 <210> 335 <211> 1259 <212> DNA <213> Oryza sativa <400> 335 ctccaccaca ggttcagctc gcctcctccc gtagccaact tccacgcaga gatcgccaac
caccatgccg ccgccgtcgc ogcacccacc tcaccgcaac ggcaaccacg tcccggcgcc
ctccggcgag tcgttcgcoa agttcttcga gtgctggatc tccgagcagt cccgcgacct
cgccgcgctc cgctccgccg cgtcggcggc gacgaacccc gcggcgccgc ccgacgacgc
60
120
180
240 cgagctccac cgcctcgtca accgggtcct cggccactac gagcactact accggaccaa 300 gtccgccgcc gcctccaccg acgtgctccg catgttctcc ccgtcgtgga cctccaccac 360 cgagaacctc tacctctggt gcggcggatg gcgccccact gccgcgctcc acctgctcta 420 ctccaagtcc ggcgcgcagc tcgagaccca gctcccggtg ttcctcgccg gcggcggcct 480 cggggcgggc gacctcggcg acctctccgc cgagcagctc caggccgccg accagcttca 540 gcggataacc gtcagcaagg aacgggagat cgagaacgcc gccgcgagtg cacaggagtc 600 gttggcgacg gtgaagatgg tggagctagc cggaggcggc gggatggacg cggaggggat 660 ggagatggag atgaggagca aggcggacgg gatgaggcgc gtgctggaga tggcagacgg 720 gctgaggctg gagacgatga gggaggtggt ggcgctgctc cgcccgtcgc aggccgtgca 780 cttcctcatc gccgccgccg agctccacct cgccgtgcac gagttcggca ggcgcaagga 840 cggcgacggc gccgcgtcgc cgccgccggc gtgacgcgtg cgcgctcgtg tcgtgtcgtt 900 gccgttccaa gtgcgcggcg tggtctccga tgcgtaggct cgtcgtctag ctctggtcaa 960 ctcaagtcgt cgcgataagc tttgaccgat atttatttat gcagtactcg tacactagta 1020 tttctctctc tctctctttt ttttctgcga tgaagccgat gatacctgta gggttttttt 1080 tttctttctt ttttgcgttt gcatgtgatg gaattttact accgtacttt ggagcagctg 1140 tttctatata gacagtgagc taacctgcgt gatatttcta atcaattcgg gaagggaagg 1200 ataaaattgt tttttgttgc tatgtgttcg aatcttaatg ttaatcacac cgcttaacc 1259 <210> 336
<211> 269
<212> PRT
<213> Oryza sativa
<400> 336
Met Pro Pro Pro Ser Pro His Pro Pro His Arg Asn Gly Asn His Val 10 15
Pro Ala Pro Ser Gly Glu Ser Phe Ala Lys Phe Phe Glu Cys Trp Ile 20 25 30
Ser Glu Gln Ser Arg Asp Leu Ala Ala Leu Arg Ser Ala Ala Ser Ala 35 40 45
Ala Thr Asn Pro Ala Ala Pro Pro Asp Asp Ala Glu Leu His Arg Leu 50 55 60
Val Asn Arg Val Leu Gly His Tyr Glu His Tyr Tyr Arg Thr Lys Ser 65 70 75 80 Ala Ala Ala Ser Thr Asp Val Leu Arg Met Phe Ser Pro Ser Trp Thr 85 90 95
Ser Thr Thr Glu Asn Leu Tyr Leu Trp Cys Gly Gly Trp Arg Pro Thr 100 105 110
Ala Ala Leu His Leu Leu Tyr Ser Lys Ser Gly Ala Gln Leu Glu Thr 115 120 125
Gln Leu Pro Val Phe Leu Ala Gly Gly Gly Leu Gly Ala Gly Asp Leu 130 135 140
Gly Asp Leu Ser Ala Glu Gln Leu Gln Ala Ala Asp Gln Leu Gln Arg 145 150 155 160
Ile Thr Val Ser Lys Glu Arg Glu Ile Glu Asn Ala Ala Ala Ser Ala 165 170 175
Gln Glu Ser Leu Ala Thr Val Lys Met Val Glu Leu Ala Gly Gly Gly 180 185 190
Gly Met Asp Ala Glu Gly Met Glu Met Glu Met Arg Ser Lys Ala Asp 195 200 205
Gly Met Arg Arg Val Leu Glu Met Ala Asp Gly Leu Arg Leu Glu Thr 210 215 220
Met Arg Glu Val Val Ala Leu Leu Arg Pro Ser Gln Ala Val His Phe 225 230 235 240
Leu Ile Ala Ala Ala Glu Leu His Leu Ala Val His Glu Phe Gly Arg 245 250 255
Arg Lys Asp Gly Asp Gly Ala Ala Ser Pro Pro Pro Ala 260 265
<210> 337
<211> 834
<212> DNA
<213> Oryza sativa
<400> 337
atgcgaaccc ccgcggcgcc gtgcgcgcgc gcgtgtccgc cgcacgccaa gaaaccgcgc 60 ccgatttatg ccggcccagg gtgggagggg caaagaatgc cggcgtcgta cctgcagccg 120 cgccgcggga cgaacgggcg gcgtattatg gagcacggcg cgggcgagga gatggtggcg 180 ttctacgagg cgtgggtggg gcgcgaggag cggatcgtcg cggacctcac ggacgcgctc 240 ctcccggcgc ggcggcggcg ggacgtgctc gccccgctcg tggacgccgc ggtgggccac 300 gtgtoggagt actacgagcg caaggcccgc ctcgccgacc gcgacgtggt ggcggcgctg 360 gacccgcgct ggctcaaccc gctcgagcgc accttcctct gggcgtgggg ctggaagccc 420 gcgctggtgt tccgcttcgc ggacggcgcc gtcgccggcg gctcgtcgca ccagcagcag 480 cgccgcgcgc tggagcgcgt gcgcgccgcc accgcggagg ccgagcggga ggtggaccgg 540 gaggtggcgg tcgtgcagga gtcgctcgcc ggaccccgcg tgctggcggc gctgcggagg 600 cagcacccgc ggaacggcga ggccgacgag gccgtcgccg cggtcgggcg ctcgctccgc 660 gtgctgctcg ccgcggccga cgcgctccgc gagcgcacgg tgcgggacgt cgtcgggacg 720 ctcgcgccag accaggccgg cgcgttcctc gcggccatgc tgaggttcca cctcggcgtg 780 caccgcgccg gccgcaactg gggctccggc aacggcggcc ggcggggcct ctag 834 <210> 338 <211> 277 <212> PRT <213> Oryza sativa <400> 338 Met Arg Thr Pro Ala Ala Pro Cys Ala Arg Ala Cys Pro Pro His Ala 10 15
Lys Lys Pro Arg Pro Ile Tyr Ala Gly Pro Gly Trp Glu Gly Gln Arg 20 25 30
Met Pro Ala Ser Tyr Leu Gln Pro Arg Arg Gly Thr Asn Gly Arg Arg 35 40 45
Ile Met Glu His Gly Ala Gly Glu Glu Met Val Ala Phe Tyr Glu Ala 50 55 60
Trp Val Gly Arg Glu Glu Arg Ile Val Ala Asp Leu Thr Asp Ala Leu 65 70 75 80
Leu Pro Ala Arg Arg Arg Arg Asp Val Leu Ala Pro Leu Val Asp Ala 85 90 95
Ala Val Gly His Val Ser Glu Tyr Tyr Glu Arg Lys Ala Arg Leu Ala 100 105 110
Asp Arg Asp Val Val Ala Ala Leu Asp Pro Arg Trp Leu Asn Pro Leu 115 120 125
Glu Arg Thr Phe Leu Trp Ala Trp Gly Trp Lys Pro Ala Leu Val Phe 130 135 140 Arg Phe Ala Asp Gly Ala Val Ala Gly Gly Ser Ser His Gln Gln Gln 145 150 155 160
Arg Arg Ala Leu Glu Arg Val Arg Ala Ala Thr Ala Glu Ala Glu Arg 165 170 175
Glu Val Asp Arg Glu Val Ala Val Val Gln Glu Ser Leu Ala Gly Pro 180 185 190
Arg Val Leu Ala Ala Leu Arg Arg Gln His Pro Arg Asn Gly Glu Ala 195 200 205
Asp Glu Ala Val Ala Ala Val Gly Arg Ser Leu Arg Val Leu Leu Ala 210 215 220
Ala Ala Asp Ala Leu Arg Glu Arg Thr Val Arg Asp Val Val Gly Thr 225 230 235 240
Leu Ala Pro Asp Gln Ala Gly Ala Phe Leu Ala Ala Met Leu Arg Phe 245 250 255
His Leu Gly Val His Arg Ala Gly Arg Asn Trp Gly Ser Gly Asn Gly 260 265 270
Gly Arg Arg Gly Leu 275
<210> 339
<211> 1093
<212> DNA
<213> Nicotiana glauca X Nicotiana Iangsdorffii
<400> 339
cttaaataaa tggcttccte gttaatgaag agaaacggag tggaaaaaaa cgacaagacg 60 tttcacgagt tttttgaaac atggctagct gagcagaagc aagaattgaa agagctggtt 120 tctgcctcga gagatgtaag taaaggtaat aataatgtgg tggaagagag ggtgttggtg 180 ccactcatta aacgggttat acaacactat gaggggtatt atgaggagaa gtcaaaatat 240 acagaggaag atgtttttgg gatgttaaat cctacatgga ggagtaatct tgagggagct 300 ttcttatgga ttggaggttg gagaccaagc atggcctttc acttgctcta ttcaaaatca 360 gggttgcaat tcgaagctcg tcttccccag ttgattagag gaatcacaac gggtgactta 420 gggtacctct ctccggacca aatagataag gttgatgaac tgcaaaagaa aactataagg 480 gaggaaaaaa aatcgagtga gaaactagcc agggttcaag aaactgttgc agatgcatca 540 atggtggagt tatcccatat tgtgactcag ctgatgatga ttagtggaag ccgaggagga 600 ggaggaggag gaggaaaaa t actcgatgaa gaagtggaag caaatctggc aacaaaggag 660 gaaggtctaa taataatcct gcaaaaggca gataatctaa ggctaaacac tctcaaggaa 720 attttagcca ttttgacacc aactcaagca attcatttcc tgattgctgc tgctgagctc 780 catttaaggc ttcacgagtg gggcaagata gaggatgcaa ccgcctcgcg aacaccagcc 840 cgccgctact accaccacca tcaccaactt taatcacttg atctaaacac actcatcaat 900 tgtgctagtt tgggatgccc cactattata agtatgatct agtttgcgtt cggtcttatg 960 ttagtttgta tgtgtgtcca cgtgcagcaa atagtactag tacctaaaaa tgatgggaaa 1020 aaaaaattag tttaatttgg ttgtagaaac atgcttgtta catttcagaa gcctttcatt 1080 tgtaatagaa ttc 1093 <210> 340 <211> 287 <212> PRT
<213> Nicotiana glauca X Nicotiana Iangsdorffii <400> 340
Met Ala Ser Ser Leu Met Lys Arg Asn Gly Val Glu Lys Asn Asp Lys 10 15
Thr Phe His Glu Phe Phe Glu Thr Trp Leu Ala Glu Gln Lys Gln Glu 20 25 30
Leu Lys Glu Leu Val Ser Ala Ser Arg Asp Val Ser Lys Gly Asn Asn 35 40 45
Asn Val Val Glu Glu Arg Val Leu Val Pro Leu Ile Lys Arg Val Ile 50 55 60
Gln His Tyr Glu Gly Tyr Tyr Glu Glu Lys Ser Lys Tyr Thr Glu Glu 65 70 75 80
Asp Val Phe Gly Met Leu Asn Pro Thr Trp Arg Ser Asn Leu Glu Gly 85 90 95
Ala Phe Leu Trp Ile Gly Gly Trp Arg Pro Ser Met Ala Phe His Leu 100 105 110
Leu Tyr Ser Lys Ser Gly Leu Gln Phe Glu Ala Arg Leu Pro Gln Leu 115 120 125
Ile Arg Gly Ile Thr Thr Gly Asp Leu Gly Tyr Leu Ser Pro Asp Gln 130 135 140
Ile Asp Lys Val Asp Glu Leu Gln Lys Lys Thr Ile Arg Glu Glu Lys 145 150 155 160 Lys Ser Ser Glu Lys Leu Ala Arg Val Gln Glu Thr Val Ala Asp Ala 165 170 175
Ser Met Val Glu Leu Ser His Ile Val Thr Gln Leu Met Met Ile Ser 180 185 190
Gly Ser Arg Gly Gly Gly Gly Gly Gly Gly Lys Ile Leu Asp Glu Glu 195 200 205
Val Glu Ala Asn Leu Ala Thr Lys Glu Glu Gly Leu Ile Ile Ile Leu 210 215 220
Gln Lys Ala Asp Asn Leu Arg Leu Asn Thr Leu Lys Glu Ile Leu Ala 225 230 235 240
Ile Leu Thr Pro Thr Gln Ala Ile His Phe Leu Ile Ala Ala Ala Glu 245 250 255
Leu His Leu Arg Leu His Glu Trp Gly Lys Ile Glu Asp Ala Thr Ala 260 265 270
Ser Arg Thr Pro Ala Arg Arg Tyr Tyr His His His His Gln Leu 275 280 285
<210> 341
<211> 762
<212> DNA
<213> Gossypium hirsutum
<400> 341
atgacgagtc cggtcggtga acggttctcg gagttttttg ataagtggat atgtcaactt 60 gatgggtatt tacaacagtt agtaagggtg tctagggaag gtttaagtga aagtgagcat 120 caaactttgg tttcgaaact gactgctcat tataaagaat attacactgt taaatgggca 180 gctgcacatg aagatgtgct tgtgttttat tgtccggttt ggttaagtaa gttagagaat 240 gcttgttcat ggttaaccgg ttggaaaccg tctatgatat tcggtgtagt tgagtcaatg 300 aggaggaaga gtgtggctga gttgacggag gagcaagtgc gaaagataga acagttgagg 360 g tgaaga taa agttggaaga agagaaagtg gaaagggaaa tggagaggca acaagtggca 420 atggctgatc ggaaaatggt tgagttggtt cgtacggcga ggcggataag gaatgaggag 480 ctggtggtgg tggttgggaa tcatcaggtg gagggtttag ttgaagtggc gctgaagggt 540 gtacttgcag ggctagaaag ggtgatgaaa gcggccgatt gtgtgagact caaggccttg 600 aaaggtgttt tggatgtttt gaatccatca cagtcactgg atttcttggc tgggatctgc 660 atgcttcaga ttcagatcag gaaatggggc caaaacaggg ataaccaaaa gggttcgaat 720 ccgataatat taggagaact acacaacaat gtcatttttt aa
<210> 342 <211> 253 <212> PRT
<213> Gossypium hirsutum <400> 342
Met Thr Ser Pro Val Gly Glu Arg Phe Ser Glu Phe Phe Asp Lys Trp 10 15
Ile Cys Gln Leu Asp Gly Tyr Leu Gln Gln Leu Val Arg Val Ser Arg 20 25 30
Glu Gly Leu Ser Glu Ser Glu His Gln Thr Leu Val Ser Lys Leu Thr 35 40 45
Ala His Tyr Lys Glu Tyr Tyr Thr Val Lys Trp Ala Ala Ala His Glu 50 55 60
Asp Val Leu Val Phe Tyr Cys Pro Val Trp Leu Ser Lys Leu Glu Asn 65 70 75 80
Ala Cys Ser Trp Leu Thr Gly Trp Lys Pro Ser Met Ile Phe Gly Val 85 90 95
Val Glu Ser Met Arg Arg Lys Ser Val Ala Glu Leu Thr Glu Glu Gln 100 105 110
Val Arg Lys Ile Glu Gln Leu Arg Val Lys Ile Lys Leu Glu Glu Glu 115 120 125
Lys Val Glu Arg Glu Met Glu Arg Gln Gln Val Ala Met Ala Asp Arg 130 135 140
Lys Met Val Glu Leu Val Arg Thr Ala Arg Arg Ile Arg Asn Glu Glu 145 150 155 160
Leu Val Val Val Val Gly Asn His Gln Val Glu Gly Leu Val Glu Val 165 170 175
Ala Leu Lys Gly Val Leu Ala Gly Leu Glu Arg Val Met Lys Ala Ala 180 185 190
7 62
Asp Cys Val Arg Leu Lys Ala Leu Lys Gly Val Leu Asp Val Leu Asn 195 200 205 Pro Ser Gln Ser Leu Asp Phe Leu Ala Gly Ile Cys Met Leu Gln Ile 210 215 220
Gln Ile Arg Lys Trp Gly Gln Asn Arg Asp Asn Gln Lys Gly Ser Asn 225 230 235 240
Pro Ile Ile Leu Gly Glu Leu His Asn Asn Val Ile Phe 245 250
<210> 343 <211> 282 <212> PRT
<213> Arabidopsis thaliana <400> 343
Met Ala Thr Ser Ser Ser Ser Tyr Gly Ile Glu Gln Leu Gln Lys Gly 10 15
Cys Tyr Tyr Glu Trp Met Ser Val Gln Ala Lys His Ile Val Asp Leu 20 25 30
Lys Glu Ala Leu Met Ser His Arg Ser Lys Glu Asp His Lys Leu Glu 35 40 45
Glu Leu Val Gly Lys Ile Val Asn Asp Phe Gln Lys Tyr Thr Glu Lys 50 55 60
Arg Ser Glu Leu Ser Arg Arg Ser Cys Ser Ser Tyr Phe Ala Pro Ser 65 70 75 80
Trp Asn Ser Pro Leu Glu Asn Gly Leu Leu Trp Met Gly Gly Cys Arg 85 90 95
Pro Ser Ser Phe Ile Arg Val Ile Tyr Ser Leu Cys Gly Ser Gln Ala 100 105 110
Glu Thr Gln Leu Ser Gln Tyr Leu Leu Lys Ile Asp Glu Asn Val Glu 115 120 125
Val Asn His Gly Gly Ser Met Ser Asp Leu Asn Ala Ser Gln Leu Ala 130 135 140
Lys Ile Asn Asp Leu His Ile Lys Val Ile Glu Lys Glu Asp Lys Ile 145 150 155 160
Thr Lys Lys Ser Ala Asn Leu Gln Glu Asn Val Ala Asp Met Pro Ile 165 170 175 Ala Ile Ala Ala Tyr Ala Thr Asp Leu Met Asn Gly Asp Val Val Val 180 185 190
Glu Asp Ala Leu Asp Lys Tyr Glu Glu Gly Met Ala Val Leu Met Val 195 200 205
Glu Ala Asp Lys Leu Arg Phe Glu Thr Leu Arg Lys Ile Val Asp Val 210 215 220
Val Thr Pro Val Gln Ala Ala Glu Phe Leu Leu Ala Gly Lys Arg Leu 225 230 235 240
His Ile Ser Leu His Glu Trp Gly Arg Val Arg Glu Glu Gln Arg Phe 245 250 255
Gly Cys Val Arg Thr Asp Ala Ala Ala Ala Thr Gly Gly Ala Gly Thr 260 265 270
Glu Lys Ser Lys Arg Ser Ser Leu Leu Met 275 280
<210> 344 <211> 235 <212> PRT
<213> Arabidopsis thaliana <400> 344
Met Ser Leu Gln Thr Lys His Ile Asp Asp Leu Lys Glu Ala Leu Met 10 15
Cys Gln Arg Asn Asn Asp Asp Lys Leu Glu Asp Leu Val Gly Lys Ile 20 25 30
Val Asn Asp Tyr His Thr Tyr Ala Gly Lys Arg Ser Glu Leu Ser Tyr 35 40 45
Arg Cys Cys Ala His Tyr Phe Ala Pro Ser Trp Asn Thr Pro Ile Glu 50 55 60
Asn Ser Met Leu Trp Met Gly Gly Cys Arg Pro Ser Ser Phe Ile Arg 65 70 75 80
Leu Ile Tyr Ala Leu Cys Gly Ser Gln Ala Glu Thr Gln Leu Ser Gln 85 90 95
Tyr Leu Leu Lys Ile Asp Asp Asp Phe Asp Ile Asn His Gly Gly Phe 100 105 110 Met Ser Asp Leu Thr Ala Thr Gln Leu Gly Lys Leu Asn Asp Leu His 115 120 125
Leu Glu Val Ile Lys Lys Glu Asp Lys Ile Thr Lys Thr Ser Ala Asn 130 135 140
Phe Gln Asp Asp Val Ala Asp Leu Pro Ile Ala Asp Val Val His Ala 145 150 155 160
Asp Val Ala Val Glu Asp Ala Leu Asp Lys His Glu Glu Gly Met Ala 165 170 175
Val Leu Leu Ala Glu Ala Asp Lys Leu Arg Phe Glu Thr Leu Arg Lys 180 185 190
Ile Val Asp Val Val Thr Pro Leu Gln Ala Val Glu Phe Leu Leu Ala 195 200 205
Gly Lys Arg Leu Gln Leu Ser Leu His Asp Arg Gly Arg Val Arg Ala 210 215 220
Asp Val Cys Gly Gly Val Gly Gly Ala Ala Val
235
225 230 <210> 345 <211> 232 <212> PRT <213> Arabidopsis thaliana <400> 345 Met Ser Lys Met Arg Asn Leu Val Glu Glu Lys Phe Leu Glu Phe Tyr 10 15
Glu Ser Trp Val Ile Gln Leu Glu Leu Tyr Leu His Gln Leu Leu Ile 20 25 30
Ala His Asn Asn Asn Thr Met Ser Glu Thr Glu Leu Arg His Leu Ile 35 40 45
Ser Lys Leu Thr Thr His His Lys Ala Tyr Tyr Thr Ala Lys Trp Ala 50 55 60
Ala Ile Arg Glu Asp Val Leu Ala Phe Phe Gly Ser Val Trp Leu Asn 65 70 75 80
Pro Leu Glu Asn Ala Cys Ser Trp Leu Thr Gly Trp Lys Pro Ser Met 85 90 95 Val Phe Arg Met Val Asp Arg Leu Arg Lys Ser Arg Val Val Leu Val IOO 105 110
Glu Ala Gln Val Lys Lys Leu Glu Glu Leu Arg Val Lys Thr Lys Phe 115 120 125
Asp Glu Gln Lys Ile Glu Arg Glu Met Glu Arg Tyr Gln Val Ala Met 130 135 140
Ala Asp Arg Lys Met Val Glu Leu Ala Arg Leu Gly Cys His Val Gly 145 150 155 160
Gly Glu Ser Val Met Val Val Glu Ala Ala Val Arg Gly Leu Ser Met 165 170 175
Gly Leu Glu Lys Met Val Lys Ala Ala Asp Cys Val Arg Leu Lys Thr 180 185 190
Leu Lys Gly Ile Leu Asp Ile Leu Thr Pro Pro Gln Cys Val Glu Phe 195 200 205
Leu Ala Ala Ala Ala Thr Phe Gln Val Gln Leu Arg Arg Trp Gly Asn 210 215 220
Arg Arg His Tyr Val Thr His Ser
225 230 <210> 346 <211> 225 <212> PRT <213> Arabidopsis thaliana <400> 346 Met Pro Ile Thr Ser Ser Ser Glu Thr Phe Ala Ser Phe Phe Asn Asp 10 15
Trp Leu Cys Arg His Arg Gln Phe Val Gln Gln Leu Ala His Leu Ala 20 25 30
Asp Glu Thr Thr Ile Val Thr Pro Ile Glu Glu Glu Ser Leu Val Ser 35 40 45
Asn Phe Leu Ser His Tyr Leu Gln Tyr Tyr Glu Glu Lys Ser Val Ala 50 55 60
Met Ser Val Ala Gly Asp Asp Ile Tyr Asp Phe Phe Ser Pro Pro Trp 65 70 75 80 Leu Ser Ser Tyr Glu Lys Leu Ile Leu Trp Ile Gly Gly Phe Lys Pro 85 90 95
Gly Met Val Phe Lys Leu Ile Thr Thr Ser Val Asn Asp Leu Thr Ser 100 105 110
His Gln Ile Asp Gln Leu Glu Ser Ile Arg Leu Glu Thr Lys Arg Arg 115 120 125
Glu Arg Asp Leu Met Arg Arg Phe Ala Leu Leu Gln Gln Ser Val Gly 130 135 140
Asp Pro Leu Leu Met Val Pro Phe Arg Arg Ile Gly Val Leu Arg Leu 145 150 155 160
Gly Glu Gly Glu Gln Pro Glu Met Glu Asp Ala Met Glu Val Leu Lys 165 170 175
Val Glu Met Ile Lys Ala Met Lys Asn Ala Asp Gln Leu Arg Cys Val 180 185 190
Thr Val Gly Lys Val Val Glu Val Leu Asn Pro Arg Gln Ser Ile Lys 195 200 205
Leu Leu Arg Ala Ala Gly Glu Phe Tyr Leu Arg Leu Arg Asp Leu Gly 210 215 220
Val
225
<210> 347 <211> 364 <212> PRT
<213> Arabidopsis thaliana <400> 347
Met Asn Thr Thr Ser Thr His Phe Val Pro Pro Arg Arg Phe Glu Val 10 15
Tyr Glu Pro Leu Asn Gln Ile Gly Met Trp Glu Glu Ser Phe Lys Asn 20 25 30
Asn Gly Asp Met Tyr Thr Pro Gly Ser Ile Ile Ile Pro Thr Asn Glu 35 40 45
Lys Pro Asp Ser Leu Ser Glu Asp Thr Ser His Gly Thr Glu Gly Thr 50 55 60 Pro His Lys Phe Asp Gln Glu Ala Ser Thr Ser Arg His Pro Asp Lys 65 70 75 80
Ile Gln Arg Arg Leu Ala Gln Asn Arg Glu Ala Ala Arg Lys Ser Arg 85 90 95
Leu Arg Lys Lys Ala Tyr Val Gln Gln Leu Glu Thr Ser Arg Leu Lys 100 105 110
Leu Ile His Leu Glu Gln Glu Leu Asp Arg Ala Arg Gln Gln Gly Phe 115 120 125
Tyr Val Gly Asn Gly Val Asp Thr Asn Ala Leu Ser Phe Ser Asp Asn 130 135 140
Het Ser Ser Gly Ile Val Ala Phe Glu Met Glu Tyr Gly His Trp Val 145 150 155 160
Glu Glu Gln Asn Arg Gln Ile Cys Glu Leu Arg Thr Val Leu His Gly 165 170 175
Gln Val Ser Asp Ile Glu Leu Arg Ser Leu Val Glu Asn Ala Met Lys 180 185 190
His Tyr Phe Gln Leu Phe Arg Met Lys Ser Ala Ala Ala Lys Ile Asp 195 200 205
Val Phe Tyr Val Met Ser Gly Met Trp Lys Thr Ser Ala Glu Arg Phe 210 215 220
Phe Leu Trp Ile Gly Gly Phe Arg Pro Ser Glu Leu Leu Lys Val Leu 225 230 235 240
Leu Pro His Phe Asp Pro Leu Thr Asp Gln Gln Leu Leu Asp Val Cys 245 250 255
Asn Leu Arg Gln Ser Cys Gln Gln Ala Glu Asp Ala Leu Ser Gln Gly 260 265 270
Met Glu Lys Leu Gln His Thr Leu Ala Glu Ser Val Ala Ala Gly Lys 275 280 285
Leu Gly Glu Gly Ser Tyr Ile Pro Gln Met Thr Cys Ala Met Glu Arg 290 295 300
Leu Glu Ala Leu Val Ser Phe Val Asn Gln Ala Asp His Leu Arg His 305 310 315 320 Glu Thr Leu Gln Gln Met His Arg Ile Leu Thr Thr Arg Gln Ala Ala 325 330 335
Arg Gly Leu Leu Ala Leu Gly Glu Tyr Phe Gln Arg Leu Arg Ala Leu 340 345 350
Ser Ser Ser Trp Ala Ala Arg Gln Arg Glu Pro Thr 355 360
<210> 348 <211> 332 <212> PRT
<213> Triticum aestivum <400> 348
Met Ala Glu Ala Ser Pro Arg Thr Glu Thr Ser Thr Asp Asp Thr Asp 10 15
Glu Asn Leu Met Leu Glu Pro Gly Asn Ala Ala Leu Ala Val Val Ser 20 25 30
Asp Ser Ser Asp Arg Ser Arg Asp Lys Asn Gly Asp Gln Lys Thr Met 35 40 45
Arg Arg Leu Ala Gln Asn Arg Glu Ala Ala Arg Lys Ser Arg Leu Arg 50 55 60
Lys Lys Ala Tyr Val Gln Gln Leu Glu Asn Ser Arg Leu Lys Leu Thr 65 70 75 80
Gln Leu Glu Gln Glu Leu Gln Arg Ala Arg Gln Gln Gly Ile Phe Ile 85 90 95
Ser Ser Ser Ala Asp Gln Ser His Ser Met Ser Gly Asn Gly Ala Leu 100 105 110
Ala Phe Asp Thr Glu Tyr Ala Arg Trp Leu Glu Glu His Asn Arg Gln 115 120 125
Val Asn Glu Leu Arg Ala Ala Val Asn Ala His Ala Gly Asp Thr Glu 130 135 140
Leu Arg Ser Val Val Glu Lys Ile Met Ser His Tyr Asp Glu Ile Phe 145 150 155 160
Lys Gln Lys Gly Asn Ala Ala Lys Ala Asp Val Phe His Val Leu Ser 165 170 175 Gly Met Trp Lys Thr Pro Ala Glu Arg Cys Phe Leu Trp Leu Gly Gly 180 185 190
Phe Arg Pro Ser Glu Leu Leu Lys Leu Leu Ser Thr Gln Leu Glu Pro 195 200 205
Leu Thr Glu Gln Gln Leu Ser Gly Ile Cys Asn Leu Gln Gln Ser Ser 210 215 220
Gln Gln Ala Glu Asp Ala Leu Ser Gln Gly Met Glu Ala Leu Gln Gln 225 230 235 240
Ser Leu Ala Glu Thr Leu Ala Gly Ser Ile Gly Ser Ser Gly Ser Gly 245 250 255
Ser Thr Gly Asn Val Ala Asn Tyr Met Gly Gln Met Ala Met Ala Met 260 265 270
Gly Lys Leu Gly Thr Leu Glu Asn Phe Leu Ser Gln Ala Asp Asn Leu 275 280 285
Arg Gln Gln Thr Leu Gln Gln Met Gln Arg Ile Leu Thr Thr Arg Gln 290 295 300
Ser Ala Arg Ala Leu Leu Val Ile Ser Asp Tyr Ser Ser Arg Leu Arg 305 310 315 320
Ala Leu Ser Ser Leu Trp Leu Ala Arg Pro Lys Glu
330
325 <210> 349 <211> 269 <212> PRT <213> Oryza sativa <400> 349 Met Pro Pro Pro Ser Pro His Pro Pro His Arg Asn Gly Asn His Val 10 15
Pro Ala Pro Ser Gly Glu Ser Phe Ala Lys Phe Phe Glu Cys Trp Ile 20 25 30
Ser Glu Gln Ser Arg Asp Leu Ala Ala Leu Arg Ser Ala Ala Ser Ala 35 40 45
Ala Thr Asn Pro Ala Ala Pro Pro Asp Asp Ala Glu Leu His Arg Leu 50 55 60 Val Asn Arg Val Leu Gly His Tyr Glu His Tyr Tyr Arg Thr Lys Ser 65 70 75 80
Ala Ala Ala Ser Thr Asp Val Leu Arg Met Phe Ser Pro Ser Trp Thr 85 90 95
Ser Thr Thr Glu Asn Leu Tyr Leu Trp Cys Gly Gly Trp Arg Pro Thr 100 105 110
Ala Ala Leu His Leu Leu Tyr Ser Lys Ser Gly Ala Gln Leu Glu Thr 115 120 125
Gln Leu Pro Val Phe Leu Ala Gly Gly Gly Leu Gly Ala Gly Asp Leu 130 135 140
Gly Asp Leu Ser Ala Glu Gln Leu Gln Ala Ala Asp Gln Leu Gln Arg 145 150 155 160
Ile Thr Val Ser Lys Glu Arg Glu Ile Glu Asn Ala Ala Ala Ser Ala 165 170 175
Gln Glu Ser Leu Ala Thr Val Lys Met Val Glu Leu Ala Gly Gly Gly 180 185 190
Gly Met Asp Ala Glu Gly Met Glu Met Glu Met Arg Ser Lys Ala Asp 195 200 205
Gly Met Arg Arg Val Leu Glu Met Ala Asp Gly Leu Arg Leu Glu Thr 210 215 220
Met Arg Glu Val Val Ala Leu Leu Arg Pro Ser Gln Ala Val His Phe 225 230 235 240
Leu Ile Ala Ala Ala Glu Leu His Leu Ala Val His Glu Phe Gly Arg 245 250 255
Arg Lys Asp Gly Asp Gly Ala Ala Ser Pro Pro Pro Ala
265
260 <210> 350 <211> 277 <212> PRT <213> Oryza sativa <400> 350 Met Arg Thr Pro Ala Ala Pro Cys Ala Arg Ala Cys Pro Pro His Ala 10 15 Lys Lys Pro Arg Pro Ile Tyr Ala Gly Pro Gly Trp Glu Gly Gln Arg 20 25 30
Met Pro Ala Ser Tyr Leu Gln Pro Arg Arg Gly Thr Asn Gly Arg Arg 35 40 45
Ile Met Glu His Gly Ala Gly Glu Glu Met Val Ala Phe Tyr Glu Ala 50 55 60
Trp Val Gly Arg Glu Glu Arg Ile Val Ala Asp Leu Thr Asp Ala Leu 65 70 75 80
Leu Pro Ala Arg Arg Arg Arg Asp Val Leu Ala Pro Leu Val Asp Ala 85 90 95
Ala Val Gly His Val Ser Glu Tyr Tyr Glu Arg Lys Ala Arg Leu Ala 100 105 110
Asp Arg Asp Val Val Ala Ala Leu Asp Pro Arg Trp Leu Asn Pro Leu 115 120 125
Glu Arg Thr Phe Leu Trp Ala Trp Gly Trp Lys Pro Ala Leu Val Phe 130 135 140
Arg Phe Ala Asp Gly Ala Val Ala Gly Gly Ser Ser His Gln Gln Gln 145 150 155 160
Arg Arg Ala Leu Glu Arg Val Arg Ala Ala Thr Ala Glu Ala Glu Arg 165 170 175
Glu Val Asp Arg Glu Val Ala Val Val Gln Glu Ser Leu Ala Gly Pro 180 185 190
Arg Val Leu Ala Ala Leu Arg Arg Gln His Pro Arg Asn Gly Glu Ala 195 200 205
Asp Glu Ala Val Ala Ala Val Gly Arg Ser Leu Arg Val Leu Leu Ala 210 215 220
Ala Ala Asp Ala Leu Arg Glu Arg Thr Val Arg Asp Val Val Gly Thr 225 230 235 240
Leu Ala Pro Asp Gln Ala Gly Ala Phe Leu Ala Ala Met Leu Arg Phe 245 250 255
His Leu Gly Val His Arg Ala Gly Arg Asn Trp Gly Ser Gly Asn Gly 260 265 270 Gly Arg Arg Gly Leu 275
<210> 351 <211> 287 <212> PRT
<213> Nicotiana glauca χ Nicotiana Iangsdorffii <400> 351
Met Ala Ser Ser Leu Met Lys Arg Asn Gly Val Glu Lys Asn Asp Lys 10 15
Thr Phe His Glu Phe Phe Glu Thr Trp Leu Ala Glu Gln Lys Gln Glu 20 25 30
Leu Lys Glu Leu Val Ser Ala Ser Arg Asp Val Ser Lys Gly Asn Asn 35 40 45
Asn Val Val Glu Glu Arg Val Leu Val Pro Leu Ile Lys Arg Val Ile 50 55 60
Gln His Tyr Glu Gly Tyr Tyr Glu Glu Lys Ser Lys Tyr Thr Glu Glu 65 70 75 80
Asp Val Phe Gly Met Leu Asn Pro Thr Trp Arg Ser Asn Leu Glu Gly 85 90 95
Ala Phe Leu Trp Ile Gly Gly Trp Arg Pro Ser Met Ala Phe His Leu 100 105 110
Leu Tyr Ser Lys Ser Gly Leu Gln Phe Glu Ala Arg Leu Pro Gln Leu 115 120 125
Ile Arg Gly Ile Thr Thr Gly Asp Leu Gly Tyr Leu Ser Pro Asp Gln 130 135 140
Ile Asp Lys Val Asp Glu Leu Gln Lys Lys Thr Ile Arg Glu Glu Lys 145 150 155 160
Lys Ser Ser Glu Lys Leu Ala Arg Val Gln Glu Thr Val Ala Asp Ala 165 170 175
Ser Met Val Glu Leu Ser His Ile Val Thr Gln Leu Met Met Ile Ser 180 185 190
Gly Ser Arg Gly Gly Gly Gly Gly Gly Gly Lys Ile Leu Asp Glu Glu 195 200 205 Val Glu Ala Asn Leu Ala Thr Lys Glu Glu Gly Leu Ile Ile Ile Leu 210 215 220
Gln Lys Ala Asp Asn Leu Arg Leu Asn Thr Leu Lys Glu Ile Leu Ala 225 230 235 240
Ile Leu Thr Pro Thr Gln Ala Ile His Phe Leu Ile Ala Ala Ala Glu 245 250 255
Leu His Leu Arg Leu His Glu Trp Gly Lys Ile Glu Asp Ala Thr Ala 260 265 270
Ser Arg Thr Pro Ala Arg Arg Tyr Tyr His His His His Gln Leu 275 280 285
<210> 352 <211> 253 <212> PRT
<213> Gossypivim hirsutum <400> 352
Met Thr Ser Pro Val Gly Glu Arg Phe Ser Glu Phe Phe Asp Lys Trp 10 15
Ile Cys Gln Leu Asp Gly Tyr Leu Gln Gln Leu Val Arg Val Ser Arg 20 25 30
Glu Gly Leu Ser Glu Ser Glu His Gln Thr Leu Val Ser Lys Leu Thr 35 40 45
Ala His Tyr Lys Glu Tyr Tyr Thr Val Lys Trp Ala Ala Ala His Glu 50 55 60
Asp Val Leu Val Phe Tyr Cvs Pro Val Trp Leu Ser Lys Leu Glu Asn 65 70 75 80
Ala Cys Ser Trp Leu Thr Gly Trp Lys Pro Ser Met Ile Phe Gly Val 85 90 95
Val Glu Ser Met Arg Arg Lys Ser Val Ala Glu Leu Thr Glu Glu Gln 100 105 110
Val Arg Lys Ile Glu Gln Leu Arg Val Lys Ile Lys Leu Glu Glu Glu 115 120 125
Lys Val Glu Arg Glu Met Glu Arg Gln Gln Val Ala Met Ala Asp Arg 130 135 140 Lys Met Val Glu Leu Val Arg Thr Ala Arg Arg Ile Arg Asn Glu Glu 145 150 155 160
Leu Val Val Val Val Gly Asn His Gln Val Glu Gly Leu Val Glu Val 165 170 175
Ala Leu Lys Gly Val Leu Ala Gly Leu Glu Arg Val Met Lys Ala Ala 180 185 190
Asp Cys Val Arg Leu Lys Ala Leu Lys Gly Val Leu Asp Val Leu Asn 195 200 205
Pro Ser Gln Ser Leu Asp Phe Leu Ala Gly Ile Cys Met Leu Gln Ile 210 215 220
Gln Ile Arg Lys Trp Gly Gln Asn Arg Asp Asn Gln Lys Gly Ser Asn 225 230 235 240
Pro Ile Ile Leu Gly Glu Leu His Asn Asn Val Ile Phe 245 250
<210> 353 <211> 56 <212> DNA <213> Seqüência Artificial <220> <223> iniciador: prm09230 <400> 353 ggggacaagt ttgtacaaaa aagcaggctt aaaoaatgcc aaacactagc agctct 56
<210> 354 <211> 51 <212> DNA <213> Seqüência Artificial <220> <223> iniciador: prm09231 <400> 354 ggggaccact ttgtacaaga aagctgggta gaagcagagc aaagcaaatt a 51
<210> 355 <211> 1130 <212> DNA <213> Oryza sativa <400> 355 catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa 60
tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca 120 caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca 180 catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa 240 gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg 300 gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca 360 tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac 420 gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg 480 acaccccggg cccacccacc tgtcacgttg gcacatgttg gttatggttc ccggccgcac 540 caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc cgcccaagcc cctggcgcgt 600 gccgctcttc cacccaggtc cctctcgtaa tccataatgg cgtgtgtacc ctcggctggt 660 tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc 720 cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac 780 gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata 840 tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc 900 ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc tgtctcccct 960 ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca 1020 gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc 1080 gcctcgcgcg gatctgaccg cttccctcgc ccttctcgca ggattcagcc 1130

Claims (21)

1. Método para intensificar características relacionadas a rendimento em plantas em relação a plantas controle, caracterizado pelo fato de compreender modular a expressão em uma planta de um ácido nucleico codificando uma Enzima de Processamento Vacuolar (VPE).
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a citada expressão modulada é efetuada pela introdução e expressão em uma planta de um ácido nucleico codificando uma VPE.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a citada VPE tem um Número de Classificação de Enzimas EC3.4.22.34.
4. Método de acordo com qualquer reivindicação precedente, caracterizado pelo fato de que a citada VPE tem atividade de caspase-I.
5. Método de acordo com qualquer reivindicação precedente, caracterizado pelo fato de que a citada VPE é uma VPE gama.
6. Método de acordo com qualquer reivindicação precedente, caracterizado pelo fato de que a citada VPE tem as seguintes características: (a) peptídeo sinal para inserção no sistema de endomembranas; (b) um domínio inibitório N-terminal; (c) um domínio ativo; (d) um domínio inibitório C-terminal e (e) resíduos de cisteína e histidina conservados.
7. Método de acordo com qualquer reivindicação precedente, caracterizado pelo fato de que o citado ácido nucleico codificando uma VPE é representado por qualquer uma das SEQ ID NOs de ácidos nucleicos dadas na Tabela Bl ou uma porção das mesmas, ou uma seqüência capaz de se hibridizar com qualquer uma das SEQ ID NOs de ácidos nucleicos dadas na Tabela BI.
8. Método de acordo com qualquer reivindicação precedente, caracterizado pelo fato de que a citada seqüência de ácido nucleico codifica um ortólogo ou parálogo de quaisquer das SEQ ID NOs dadas na Tabela BI.
9. Método de acordo com qualquer reivindicação precedente, caracterizado pelo fato de que a citada característica relacionada a rendimento intensificado é rendimento aumentado, de preferência rendimento de semente aumentado em relação a plantas controle.
10. Método de acordo com qualquer uma das reivindicações 2 a 9, caracterizado pelo fato de que o citado ácido nucleico está operacionalmente ligado a um promotor constitutivo, de preferência um promotor GOS2.
11. Método de acordo com qualquer uma das reivindicações 2 a 9, caracterizado pelo fato de que o citado ácido nucleico está operacionalmente ligado a um promotor específico de raiz, de preferência a um promotor RCC3.
12. Método de acordo com qualquer uma das reivindicações 2 a 9, caracterizado pelo fato de que o citado ácido nucleico está operacionalmente ligado a um promotor específico de semente, de preferência a um promotor WSIl 8, de preferência adicional a um promotor WSI18 de arroz.
13. Método de acordo com qualquer reivindicação precedente, caracterizado pelo fato de que o citado ácido nucleico codificando uma VPE é de origem vegetal, de preferência de uma planta dicotiledônea, de preferência adicional da família Brassicaceae, de maior preferência do gênero Arabidopsis, da maior preferência de Arabidopsis thaliana.
14. Molécula de ácido nucleico isolado, caracterizada pelo fato de compreender: (i) um ácido nucleico representado por SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171; (ii) o complemento de qualquer um das SEQ ID NOs dadas em (i); (iii) um ácido nucleico que codifica uma VPE que tem, em ordem crescente de preferência, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de seqüência com qualquer uma das seqüências de aminoácidos dada em SEQ ID NO: 152, SEQ ID NO: 154 e SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172; (iv) um ácido nucleico capaz de se hibridizar sob condições estringentes com qualquer um dos ácidos nucleicos dados em (i), (ii) ou (iii) acima.
15. Polipeptídio isolado, caracterizado pelo fato de compreender: (i) uma seqüência de aminoácidos representada por qualquer uma das SEQ ID NO: 152, SEQ ID NO: 154 e SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172; (ii) uma seqüência de aminoácidos que têm, em ordem crescente de preferência, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%), 98%, 99% ou 100% de identidade de seqüência com qualquer uma das seqüências de aminoácidos dada em SEQ ID NO: 152, SEQ ID NO: 154 e SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172; (iii) derivados de quaisquer das seqüências de aminoácidos dadas em (i) ou (ii) acima.
16. Construção, caracterizada pelo fato de compreender: (i) um ácido nucleico codificando uma VPE; (ii) uma ou mais seqüências controle capazes de direcionar a expressão da seqüência de ácido nucleico de (a) e opcionalmente (iii) uma seqüência de término de transcrição.
17. Construção de acordo com a reivindicação 16, caracterizada pelo fato de que o citado ácido nucleico codificando uma VPE é um ácido nucleico como definido na reivindicação 15.
18. Construção de acordo com a reivindicação 16 ou 17, caracterizada pelo fato de que a citada uma ou mais seqüências de controle são um promotor específico de semente, de preferência um promotor WSI18, de preferência adicional um promotor WSI18 de arroz.
19. Uso de uma construção como definida em qualquer uma das reivindicações 16 a 18, caracterizado pelo fato de ser um método para fazer plantas que têm rendimento aumentado, particularmente rendimento de semente aumentado em relação a plantas controle.
20. Método para a produção de uma planta transgênica que tem rendimento aumentado, particularmente rendimento de semente aumentado em relação a plantas controle, caracterizado pelo fato de compreender: (i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico que codifica VPE e (ii) cultivar a célula vegetal sob condições que promovem crescimento e desenvolvimento vegetal.
21. Uso de um ácido nucleico codificando uma VPE, caracterizado pelo fato de ser em aumento de rendimento, particularmente em aumento de rendimento de semente, em plantas em relação a plantas controle.
BRPI0721100-7A2A 2006-12-21 2007-12-21 Método para intensificar características relacionadas a rendimentos em plantas, e para a produção de uma planta transgênica, planta ou parte de mesma, molécula de ácido nucleico isolado, polipeptídio isolado, construção, usos de uma construção, de um ácido nucleico e de uma sequência de ácido nucleico, planta, parte de planta ou célula vegetal, partes colhíveis de uma planta, e, produtos BRPI0721100A2 (pt)

Applications Claiming Priority (21)

Application Number Priority Date Filing Date Title
EP06126891.8 2006-12-21
EP06126852 2006-12-21
EP06126950.2 2006-12-21
EP06126891 2006-12-21
EP06126852.0 2006-12-21
EP06126950 2006-12-21
EP06127101.1 2006-12-22
EP06127112 2006-12-22
EP06127112.8 2006-12-22
EP06127101 2006-12-22
US88335507P 2007-01-04 2007-01-04
US88335307P 2007-01-04 2007-01-04
US60/883355 2007-01-04
US60/883353 2007-01-04
US88610507P 2007-01-23 2007-01-23
US88610607P 2007-01-23 2007-01-23
US88610407P 2007-01-23 2007-01-23
US60/886105 2007-01-23
US60/886104 2007-01-23
US60/886106 2007-01-23
PCT/EP2007/064510 WO2008074891A2 (en) 2006-12-21 2007-12-21 Plants having enhanced yield-related traits and a method for method for making the same

Publications (1)

Publication Number Publication Date
BRPI0721100A2 true BRPI0721100A2 (pt) 2014-02-11

Family

ID=44951558

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0721100-7A2A BRPI0721100A2 (pt) 2006-12-21 2007-12-21 Método para intensificar características relacionadas a rendimentos em plantas, e para a produção de uma planta transgênica, planta ou parte de mesma, molécula de ácido nucleico isolado, polipeptídio isolado, construção, usos de uma construção, de um ácido nucleico e de uma sequência de ácido nucleico, planta, parte de planta ou célula vegetal, partes colhíveis de uma planta, e, produtos

Country Status (8)

Country Link
US (2) US8569575B2 (pt)
EP (5) EP2395092A3 (pt)
CN (2) CN102676575B (pt)
AR (1) AR064512A1 (pt)
BR (1) BRPI0721100A2 (pt)
CA (1) CA2671401A1 (pt)
MX (1) MX2009005524A (pt)
WO (1) WO2008074891A2 (pt)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2708506A1 (en) * 2007-12-20 2009-07-02 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same
WO2010012760A2 (en) * 2008-07-31 2010-02-04 Basf Plant Science Gmbh Plants having modified growth characteristics and a method for making the same
WO2010031312A1 (en) * 2008-09-16 2010-03-25 Institute Of Genetics And Development Biology, Chinese Academy Of Sciences Regulation of nitrogen starvation response
AU2014200651B2 (en) * 2009-06-04 2015-07-09 Toyota Jidosha Kabushiki Kaisha Gene for increasing plant weight and method for using the same
JP5519192B2 (ja) 2009-06-04 2014-06-11 トヨタ自動車株式会社 種子のタンパク質含量を増産させる遺伝子及びその利用方法
JP5718554B2 (ja) * 2009-06-04 2015-05-13 トヨタ自動車株式会社 植物の植物重量を増産させる遺伝子及びその利用方法
EP2525658B1 (de) 2010-01-22 2017-03-01 Bayer Intellectual Property GmbH Akarizide und/oder insektizide wirkstoffkombinationen
US9388423B2 (en) 2010-02-24 2016-07-12 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and a method for making the same
MX2012010749A (es) * 2010-03-19 2012-10-15 Basf Plant Science Co Gmbh Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
US9265252B2 (en) 2011-08-10 2016-02-23 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
EP2814944A4 (en) * 2012-02-14 2016-02-17 Sapphire Energy Inc BIOMASS YIELD GENES
TW201341398A (zh) * 2012-03-05 2013-10-16 Univ Pontificia Catolica Chile 與硝酸根位準有關的植物轉錄因子及其使用方法
AR092810A1 (es) * 2012-04-02 2015-05-06 Basf Plant Science Co Gmbh Plantas que tienen uno o mas rasgos mejorados relacionados con el rendimiento y un metodo para producirlas
CN103374585A (zh) * 2013-06-28 2013-10-30 西北农林科技大学 萝卜花蕾败育相关的液泡加工酶基因RsVPE1
JP5845306B2 (ja) * 2014-04-10 2016-01-20 トヨタ自動車株式会社 種子のタンパク質含量を増産させる遺伝子及びその利用方法
CN105075767B (zh) * 2014-05-15 2018-01-02 中国热带农业科学院海口实验站 一种促进山竹开花的种植方法
AU2016209022B2 (en) * 2015-01-22 2021-10-07 Macquarie University Thermostable rubisco activase complexes
WO2018009632A1 (en) * 2016-07-08 2018-01-11 The United States Of America, As Represented By The Secretary Of Agriculture Mutated rubisco activase
WO2018027048A1 (en) * 2016-08-05 2018-02-08 Bio-Rad Laboratories, Inc. Second strand direct
CN106244596A (zh) * 2016-08-29 2016-12-21 南京农业大学 一种水稻种子休眠基因OsDOG1L3及其应用
US10487368B2 (en) 2016-09-30 2019-11-26 Uchicago Argonne, Llc Stabilization of rubisco activase for enhanced photosynthesis and crop yields
CN106480068B (zh) * 2016-12-16 2019-07-09 农业部沼气科学研究所 浮萍转录因子LmMYB基因及其应用
CN109750046A (zh) * 2017-11-02 2019-05-14 未名生物农业集团有限公司 非生物胁迫耐性提高的植物和提高植物非生物胁迫耐性的多聚核苷酸及方法
CN108504769B (zh) * 2018-06-08 2021-03-30 南京农业大学 一种与光周期敏感的白菜类作物开花时间紧密连锁的InDel分子标记及其应用
BR112020026543A2 (pt) * 2018-06-27 2021-04-06 Basf Se Métodos para aumentar a razão de uma proteína, para aumentar a termotolerância, aumentar o rendimento, para produzir uma planta, para aumentar a termoestabilidade e produzir uma variante de proteína, variante de proteína, ácido nucleico, genes recombinantes, vetores, células, alelos nocaute e termoestável, planta, parte de planta ou semente, uso da variante de proteína, método de produção de alimentos e planta de cereal
CN109232726B (zh) * 2018-11-07 2020-11-24 中国农业科学院农业资源与农业区划研究所 蛋白质OsVPE2在调控植物液泡无机磷输出能力中的应用
CN109576284B (zh) * 2018-12-21 2021-09-17 中国农业科学院北京畜牧兽医研究所 一个多功能的myb转录因子基因及其用途
CN110204601B (zh) * 2019-05-28 2021-06-29 华南农业大学 药用野生稻OoMYB2蛋白及其编码基因、表达载体与应用
CN111778258B (zh) * 2020-01-18 2022-09-16 西南科技大学 Myb140基因、构建的载体、表达的转基因烟草植株
CN111499711B (zh) * 2020-05-20 2022-06-07 中国农业科学院作物科学研究所 一种与植物氮的吸收利用相关的SiTGAL5蛋白质及其相关生物材料与应用
CN112266412B (zh) * 2020-11-02 2022-03-25 北京市农林科学院 二系杂交小麦产量杂种优势相关蛋白TaCCA1-7D及其编码基因和应用
CN112322617A (zh) * 2020-11-27 2021-02-05 中国科学院成都生物研究所 一种可鉴定大麦籽粒糯性的kasp分子标记及其应用
CN114621976B (zh) * 2020-12-11 2023-05-02 华南农业大学 稻瘟病抗性相关基因OsMYB1R的应用
CN117730153A (zh) * 2021-05-26 2024-03-19 伊利诺伊大学理事会 具有提高的光合作用效率的c4植物
CN113788888B (zh) * 2021-09-18 2022-11-11 浙江大学 时钟基因rve5在调控植物生长和开花时间中的应用
CN114195872B (zh) * 2021-11-02 2022-11-11 四川农业大学 Fot1基因在水稻花时改良育种中的应用
CN113980979B (zh) * 2021-11-19 2024-02-09 云南省烟草农业科学研究院 一种可调控烟叶钾含量的NtLHY1基因及其应用
CN116410279A (zh) * 2021-12-31 2023-07-11 中国科学院植物研究所 与调控水稻非生物胁迫耐受性相关的蛋白及其相关生物材料与应用
CN114959106A (zh) * 2022-06-30 2022-08-30 中国农业科学院棉花研究所 陆地棉d12号染色体与棕榈油酸关联的snp分子标记及其应用

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
WO1989012102A1 (en) 1988-06-01 1989-12-14 The Texas A&M University System Method for transforming plants via the shoot apex
DE69425903T2 (de) 1993-12-09 2001-02-15 Thomas Jefferson University Ph Verbindungen und verfahren zur ortsspezifischen mutation in eukaryotischen zellen
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
GB9613132D0 (en) * 1996-06-21 1996-08-28 Innes John Centre Innov Ltd Genetic control of flowering
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
BR9806854A (pt) * 1997-01-08 2000-03-14 Univ Florida Polinucleotìdeos que codificam colina monooxigenase e plantas transformadas com eles
US6388172B1 (en) * 1997-04-18 2002-05-14 The Regents Of The University Of California Phytochrome regulated transcription factor for control of higher plant development
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US7345217B2 (en) 1998-09-22 2008-03-18 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
US7135616B2 (en) * 2001-04-18 2006-11-14 Mendel Biotechnology, Inc. Biochemistry-related polynucleotides and polypeptides in plants
US7511190B2 (en) 1999-11-17 2009-03-31 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
EP1033405A3 (en) 1999-02-25 2001-08-01 Ceres Incorporated Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US20100293669A2 (en) 1999-05-06 2010-11-18 Jingdong Liu Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
US6268488B1 (en) * 1999-05-25 2001-07-31 Barbas, Iii Carlos F. Prodrug activation using catalytic antibodies
EP1063297B1 (en) * 1999-06-22 2008-12-17 Korea Kumho Petrochemical Co. Ltd. Farnesyl pyrophosphate synthase (FPS) derived from seedlings of sunflower (Helianthus annus)
CN1279172C (zh) 1999-07-22 2006-10-11 独立行政法人农业生物资源研究所 转化水稻植物的方法
PT1230345E (pt) * 1999-11-17 2008-09-23 Mendel Biotechnology Inc Genes de tolerância a stress ambiental
US6512167B1 (en) * 2000-02-04 2003-01-28 Rustica Prograin Genetique Hybrid maize seed and plant RPG824
WO2001068805A2 (en) * 2000-03-13 2001-09-20 Senomyx, Inc. Human olfactory receptors and genes encoding same
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
DE60144021D1 (de) * 2000-05-12 2011-03-24 Cropdesign Nv Für zellzyklusproteine kodierende nukleinsäure und deren verwendung
WO2002016655A2 (en) * 2000-08-24 2002-02-28 The Scripps Research Institute Stress-regulated genes of plants, transgenic plants containing same, and methods of use
CA2456979C (en) 2001-08-09 2014-06-17 Mendel Biotechnology, Inc. Yield-related polynucleotides and polypeptides in plants
US20030073135A1 (en) 2001-10-12 2003-04-17 Maxygen, Inc. Methods for improving a photosynthetic carbon fixation enzyme
JP2005185101A (ja) * 2002-05-30 2005-07-14 National Institute Of Agrobiological Sciences 植物の全長cDNAおよびその利用
US7847156B2 (en) * 2003-10-20 2010-12-07 Cropdesign N.V. Plants having improved growth characteristics and methods for making the same
AU2003287825A1 (en) * 2002-12-31 2004-07-22 Affinium Pharmaceuticals, Inc. Crystal structures of nh3-dependent nad synthetases
ES2279339T3 (es) * 2003-01-21 2007-08-16 Cropdesign N.V. Uso de la secuencia reguladora del gen gos2 del arroz para la expresion genica en plantas o celulas de plantas dicotiledoneas.
EP1532257B1 (en) 2003-02-04 2007-05-16 CropDesign N.V. Rice promoter
JP2004283078A (ja) 2003-03-20 2004-10-14 Japan Science & Technology Agency 植物における病原菌及びウイルスの感染の防御方法
US7544860B2 (en) * 2003-04-22 2009-06-09 Agrinomics, Llc Generation of plants with altered oil content
AU2004295086A1 (en) * 2003-12-02 2005-06-16 Basf Aktiengesellschaft Clp-protease as target for herbicides
US20060015970A1 (en) 2003-12-12 2006-01-19 Cers, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics
EP1774006A2 (en) * 2004-07-14 2007-04-18 Mendel Biotechnology, Inc. Plant polynucleotides for improved yield and quality
AU2005337132B2 (en) * 2004-12-21 2011-01-20 Monsanto Technology, Llc Transgenic plants with enhanced agronomic traits
AR051865A1 (es) 2004-12-24 2007-02-14 Cropdesign Nv Plantas teniendo mayor rendimiento y metodo para producirlas
BRPI0615073A2 (pt) * 2005-08-24 2011-05-10 Pioneer Hi Bred Int molÉcula de Ácido nuclÉico isolada, vetor, cÉlula hospedeira, polipeptÍdeo isolado, planta transgÊnica e mÉtodo de aumento da tolerÂncia ao calor em plantas
EP2090662A3 (en) * 2006-04-05 2012-10-31 Metanomics GmbH Process for the production of a fine chemical
BRPI0713598A2 (pt) * 2006-06-13 2012-10-30 Agrinomics Llc geração de plantas com resistência patogênica aperfeiçoada
WO2008070179A2 (en) * 2006-12-06 2008-06-12 Monsanto Technology, Llc Genes and uses for plant improvement
NL1033850C2 (nl) 2007-05-15 2008-11-18 3Force B V Brandersysteem met voorgemengde branders en vlam-overdrachtsmiddelen.

Also Published As

Publication number Publication date
CN101583720A (zh) 2009-11-18
WO2008074891A2 (en) 2008-06-26
AR064512A1 (es) 2009-04-08
US9428761B2 (en) 2016-08-30
EP2395093A3 (en) 2012-08-01
CN102676575A (zh) 2012-09-19
EP2069505A2 (en) 2009-06-17
EP2405011A3 (en) 2012-07-25
US20140182015A1 (en) 2014-06-26
EP2395092A2 (en) 2011-12-14
CA2671401A1 (en) 2008-06-26
WO2008074891A3 (en) 2008-09-04
EP2395091A3 (en) 2012-08-01
CN102676575B (zh) 2015-09-30
EP2405011A2 (en) 2012-01-11
MX2009005524A (es) 2009-06-08
EP2395093A2 (en) 2011-12-14
EP2395092A3 (en) 2012-08-01
US8569575B2 (en) 2013-10-29
US20100077502A1 (en) 2010-03-25
EP2395091A2 (en) 2011-12-14

Similar Documents

Publication Publication Date Title
BRPI0721100A2 (pt) Método para intensificar características relacionadas a rendimentos em plantas, e para a produção de uma planta transgênica, planta ou parte de mesma, molécula de ácido nucleico isolado, polipeptídio isolado, construção, usos de uma construção, de um ácido nucleico e de uma sequência de ácido nucleico, planta, parte de planta ou célula vegetal, partes colhíveis de uma planta, e, produtos
KR101662483B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101495640B (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
CN101842489B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
KR101647732B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR101754083B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101365786B (zh) 具有改良的生长特征的植物及其生产方法
BRPI0718977A2 (pt) Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
CN101952441B (zh) 具有增强的产量相关性状的植物及其制备方法
KR20120126061A (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101868544A (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
CN102027120A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101688214A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
BRPI0618328A2 (pt) método para melhorar caracterìsticas de crescimento de planta em relação às plantas do tipo selvagem correspondentes, construção, célula hospedeira, método para produzir uma planta transgênnica, parte de planta ou célula de planta tendo caracterìsticas de crescimento de planta melhoradas em relação às plantas do tipo selvagem correspondentes, e, usos de uma construção e de um ácido nucleico
CN101351556B (zh) 具有改良生长特性的植物及其制备方法
KR101429469B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101605902A (zh) 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
CN101969759A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101778942A (zh) 产率相关性状增强的植物及制备其的方法
CN101595222B (zh) 具有改良的种子产量相关性状的植物及其制备方法
CN101668859A (zh) 具有增强的产量相关性状的植物及其制备方法
AU2008327899A1 (en) Plants having increased yield-related traits and a method for making the same
CN101541970A (zh) 包含作为转基因的a类itcp或clavata1(clv1)或cah3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法
BRPI0619242A2 (pt) proteìna, métodos para aumentar produção de semente e/ou aumentar taxa de crescimento de plantas e taxa de crescimento, célula vegetal, construção, e, métodos para produzir uma planta transgenica, para melhorar caracterìsticas de crescimento de plantas e caracterìsticas de crescimento em relação a correspondentes plantas do tipo selvagem, para aumentar produção vegetal, número de sementes em plantas e produção de semente em plantas

Legal Events

Date Code Title Description
B07A Technical examination (opinion): publication of technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]

Free format text: MANTIDO O INDEFERIMENTO UMA VEZ QUE NAO FOI APRESENTADO RECURSO DENTRO DO PRAZO LEGAL