BRPI0712304A2 - método e processo para melhorar caracterìsticas de crescimento de planta em relação ás plantas de controle correspondentes, planta, parte de planta ou célula de planta, molécula de ácido nucleico isolada, construto de gene, vetor, planta transgênica, e, uso de uma molécula de ácido nucleico ou do construto de gene ou do vetor - Google Patents

método e processo para melhorar caracterìsticas de crescimento de planta em relação ás plantas de controle correspondentes, planta, parte de planta ou célula de planta, molécula de ácido nucleico isolada, construto de gene, vetor, planta transgênica, e, uso de uma molécula de ácido nucleico ou do construto de gene ou do vetor Download PDF

Info

Publication number
BRPI0712304A2
BRPI0712304A2 BRPI0712304-3A BRPI0712304A BRPI0712304A2 BR PI0712304 A2 BRPI0712304 A2 BR PI0712304A2 BR PI0712304 A BRPI0712304 A BR PI0712304A BR PI0712304 A2 BRPI0712304 A2 BR PI0712304A2
Authority
BR
Brazil
Prior art keywords
leu
plant
nucleic acid
glu
val
Prior art date
Application number
BRPI0712304-3A
Other languages
English (en)
Inventor
Stefan Henkes
Christian Dammann
Original Assignee
Basf Plant Science Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Gmbh filed Critical Basf Plant Science Gmbh
Publication of BRPI0712304A2 publication Critical patent/BRPI0712304A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

MéTODO E PROCESSO PARA MELHORAR CARACTERìSTICAS DE CRESCIMENTO DE PLANTA EM RELAçãO àS PLANTAS DE CONTROLE CORRESPONDENTES, PLANTA, PARTE DE PLANTA OU CéLULA DE PLANTA, MOLéCULA DE ACIDO NUCLEICO ISOLADA, CONSTRUTO DE GENE, VETOR, PLANTA TRANSGêNICA, E, USO DE UMA MOLéCULA DE áCIDO NUCLEICO OU DO CONSTRUTO DE GENE OU DO VETOR A presente invenção refere-se em geral ao campo de biologia molecular e conceme a um método para melhorar as características de crescimento de planta. Mais especificamente, a presente invenção conceme a um método para melhorar as características de crescimento de planta pela modulação da expressão em uma planta de um ácido nucleico de planta codificador de uma quinase dependente de ciclina (CDK) e/ou pela modulação da atividade em uma planta de uma proteína CDK de planta, cuja proteína CDK compreende motivos diferentes ou cujo ácido nucleico CDK codifica tal proteína. A presente invenção também conceme às plantas tendo expressão modulada de um ácido nucleico CDK de planta e/ou atividade modulada de uma proteína CDK de planta, cuja proteína CDK compreende diferentes motivos de sequência ou cujo ácido nucleico codifica tal proteína e cujas plantas têm características de crescimento melhoradas em relação às plantas de tipo selvagem correspondentes. A invenção adicionalmente se refere às sequências de ácido nucleico específicas codificadoras das proteínas anteriormente mencionadas tendo atividade melhorada de crescimento de planta, aos construtos de ácido nucleico, aos vetores e às plantas contendo ditas sequências de ácido nucleico.

Description

"MÉTODO E PROCESSO PARA MELHORAR CARACTERÍSTICAS DE CRESCIMENTO DE PLANTA EM RELAÇÃO ÀS PLANTAS DE CONTROLE CORRESPONDENTES, PLANTA, PARTE DE PLANTA OU CÉLULA DE PLANTA, MOLÉCULA DE ÁCIDO NUCLEICO ISOLADA, CONSTRUTO DE GENE, VETOR, PLANTA TRANSGÊNICA, E, USO DE UMA MOLÉCULA DE ÁCIDO NUCLEICO OU DO CONSTRUTO DE GENE OU DO VETOR"
A presente invenção refere-se em geral ao campo da biologia molecular e concerne a um método para melhorar as características de crescimento de planta. Mais especificamente, a presente invenção concerne a um método para melhorar as características de crescimento de planta pela modulação de expressão em uma planta de um ácido nucleico de planta codificador de uma quinase dependente de cicliná (CDK) e/ou pela modulação da atividade em uma planta de uma proteína CDK de planta, cuja proteína CDK compreende motivos diferentes ou cujo ácido nucleico CDK codifica tal proteína. A presente invenção também concerne às plantas tendo expressão modulada de um ácido nucleico CDK de planta e/ou atividade modulada de uma proteína CDK de planta, cuja proteína CDK compreende motivos de seqüência diferentes ou cujo ácido nucleico codifica tal proteína e cujas plantas possuem características de crescimento melhoradas em relação às plantas de tipo selvagem correspondentes.
A invenção adicionalmente se refere às seqüências de ácido nucleico específicas codificadoras das proteínas anteriormente mencionadas tendo a atividade melhoradora de crescimento de planta acima citada, aos construtos de ácido nucleico, aos vetores e às plantas contendo as ditas seqüências de ácido nucleico.
A população mundial sempre crescente e o fornecimento decrescente de terra arável disponível para agricultura estimulam a pesquisa na direção do melhoramento da eficiência de agricultura. Meios convencionais para melhoramentos de colheita e horticulturais utilizam técnicas de geração seletivas para identificar plantas tendo características desejáveis. Contudo, tais técnicas de geração seletivas têm várias desvantagens, isto é estas técnicas são tipicamente laboriosamente intensas e resultam em plantas que muitas vezes contêm componentes genéticos heterogêneos que nem sempre podem resultar na feição desejável sendo transferidas das plantas parentais. Avanços em biologia molecular têm permitido que a humanidade modifique o plasma germinativo de animais e plantas. Engenharia genética de plantas exige o isolamento e a manipulação de material genético (tipicamente na forma de DNA ou RNA) e a subseqüente introdução daquele material genético em uma planta. Tal tecnologia tem a capacidade para dar colheitas ou plantas tendo várias feições econômicas, agronômicas ou horticulturais melhoradas. Uma feição de um interesse econômico particular é o rendimento. O rendimento é normalmente definido como o produto mensurável de valor econômico de uma colheita. Isto pode ser definido em termos de quantidade e/ou qualidade. Rendimento de colheita é influenciado pelos estresses atípicos aos quais as plantas ou colheitas estão sujeitas. Tais estresses incluem estresses ambientais (abióticos) (tais como estresses de temperatura causados por temperaturas altas ou baixas atípicas; estresses causados por deficiência de nutriente; estresses causados pela falta de água (estiagem)) e estresses bióticos (que podem ser infligidos às plantas por outras plantas (ervas daninhas), pestes animais e patógenos). Rendimento de colheita pode não apenas ser aumentado pelo combate de um ou mais dos estresses aos quais a colheita ou planta é submetida, mas também pode ser aumentado pela modificação dos mecanismos de crescimento inerentes de uma planta. Biomassa de planta é o rendimento para colheitas de forragem como alfafa, feno e milho de silagem. Muitos substitutos para rendimento têm sido usados em colheitas de grãos. Mais importantes dentre estes são as estimativas do tamanho de planta. O tamanho de planta pode ser medido em muitas maneiras dependendo da espécie e do estágio desenvolvente, mas incluem peso seco de planta total, peso seco acima do solo, peso fresco acima do solo, área foliar, volume de caule, altura de planta, diâmetro de invólucro de flor composta, comprimento foliar, comprimento de raiz, massa de raiz, número de brotos e número de folhas. Muitas espécies mantêm uma razão conservativa entre o tamanho de partes diferentes da planta em um dado estágio desenvolvente. Estas relações alométricas são usadas para extrapolar de uma destas medições de tamanho para outra (e.g. TittonelI et al 2005 Agric Ecosys & Environ 105: 213). Tamanho de planta em um estágio desenvolvente inicial tipicamente se correlacionará com o tamanho de planta mais tarde no desenvolvimento. Uma planta maior com uma área foliar maior pode tipicamente absorver mais luz e dióxido de carbono do que uma planta menor e portanto provavelmente ganhará um peso maior durante o mesmo período (Fasoula & Tollenaar 2005 Maydica 50:39). Isto está além da continuação potencial da vantagem genética ou microambiental que a planta tinha para alcançar o tamanho maior inicialmente. Há um componente genético forte para a taxa de crescimento e o tamanho da planta (e.g. ver Steege et al 2005 Plant Physiology 139:1078), e assim para uma variedade de genótipos diversos tamanho de planta sob condição ambiental provavelmente está correlacionado com o tamanho sob outra (Hittalmani et al 2003 Theoretical Applied Genetics 107:679). Nesta maneira um ambiente padrão é usado como um substituto dos ambientes diversos e dinâmicos encontrados em localizações e tempos diferentes pelas colheitas no campo.
índice de colheita, a razão de rendimento de sementes para peso seco acima do solo, é relativamente estável sob muitas condições ambientais e assim pode ser muitas vezes obtida uma correlação robusta entre tamanho de planta e rendimento de grãos (e.g. Rebetzke et al 2002 Crop Science 42:739). Estes processos estão intrinsecamente ligados porque a maioria da biomassa de grão é dependente da produtividade fotossintética armazenada ou corrente pelas folhas e caule da planta (Gardener et al 1985 Physiology of Crop Plants. Iowa State University Press, pp68-73) Portanto, seleção do tamanho de planta, mesmo em estágios de desenvolvimentos iniciais, tem sido usada como um indicador para rendimento potencial futuro (e.g. Tittonell et al 2005 Agric Ecosys & Environ 105: 213). Quando se testa o impacto de diferenças genéticas sobre tolerância ao estresse, a capacidade para padronizar propriedades de solo, temperatura, disponibilidade de água e nutriente e intensidade de luz é uma vantagem intrínseca de ambientes de câmara de crescimento de planta ou estufa comparado com o campo. Contudo, limitações artificiais sobre rendimento devido à polinização insatisfatória por causa da ausência de vento ou insetos, ou espaço insuficiente para maturação de raiz ou crescimento de copa, podem restringir o uso destes ambientes controlados para testar diferenças de rendimento. Por isso, medições de tamanho de planta em desenvolvimento inicial, sob condições padronizadas em uma câmara de crescimento ou estufa, são práticas padrão para proporcionar indicação de vantagens de rendimento genético potencial.
Os mecanismos de crescimento inerentes de uma planta residem em uma seqüência elevadamente ordenada de eventos coletivamente conhecida como o 'ciclo celular'. A capacidade para influenciar o ciclo celular em uma planta (quer usando tecnologia de DNA recombinante quer usando meio não-recombinante), e para deste modo modificar as características de crescimento de uma planta, teria muitas aplicações em áreas tais como aumento de colheita, geração de planta, produção de plantas ornamentais, arboricultura, horticultura, silvicultura, a produção de algas ou plantas (por exemplo para uso como biorreatores, para a produção de substâncias tais como fármacos, anticorpos, ou vacinas, ou para a bioconversão de resíduo orgânico ou para uso como combustível no caso de plantas e algas de rendimento alto). Avanço através do ciclo celular é fundamental para o crescimento e o desenvolvimento de organismos multicelulares e é crucial para proliferação de células. Os componentes maiores do ciclo celular estão elevadamente conservados em levedura, mamíferos, e plantas. O ciclo celular é tipicamente dividido nas seguintes fases seqüenciais: G0-G1-S-G2-M. Síntese ou replicação de DNA geralmente ocorre durante a fase S ("S" é para síntese de DNA) e segregação mitótica dos cromossomos ocorre durante a fase M (o "M" é para mitose), com fases de intervalo {gap) interpostas, Gl (durante a qual as células crescem antes da replicação de DNA) e G2 (um período após a replicação de DNA durante o qual a célula se prepara para divisão). Divisão celular é completada após a citocinese, a última etapa da fase M. Células que têm saído do ciclo celular e que têm se tornado quiescentes são ditas em estarem na fase GO. Células nesta fase podem ser estimuladas para reentrarem no ciclo celular na fase Gl. O "G" em Gl, G2 e GO representa "gap" (intervalo). Completitude do processo de ciclo celular permite que cada célula filha durante a divisão celular receba uma cópia completa do genoma parental.
Divisão celular é controlada por dois eventos de ciclo celular principais, a saber iniciação de síntese de DNA e iniciação de mitose. Cada transição para cada um destes eventos chave é controlada por um ponto de checagem representado por complexos de proteína específicos (envolvidos em replicação de DNA e divisão). A expressão de genes necessários para síntese de DNA no limite Gl/S é regulada pela família E2F de fatores de transcrição em células de planta e mamíferos (WO 96/25494; Muller et al., Genes and Development 15, 267-285, 2001; De Veylder et al., EMBO J. 21, 13602- 1368, 2002). Entrada no ciclo celular é regulada/ativada por um complexo E2F/Rb que integra sinais e permite ativação de transcrição de genes de ciclo celular. A transição entre as fases diferentes do ciclo celular, e portanto o avanço através do ciclo celular, é conduzida pela formação e ativação de serina/treonina proteína quinases heterodiméricas diferentes, geralmente chamadas de quinases dependentes de ciclina (CDK). Um pré-requisito para atividade destas quinases é a associação física com uma ciclina específica, a regulação do tempo de ativação sendo grandemente dependente da expressão de ciclina. Ligação de ciclina induz mudanças conformacionais no lobo N- terminal da CDK associada e contribui para a localização e a especificidade de substrato do complexo. CDKs monoméricas são ativadas quando estão associadas com ciclinas e assim têm atividade de quinase. Níveis de proteína ciclina flutuam no ciclo celular e portanto representam um fator maior na determinação da regulação do tempo de ativação de CDK. A ativação periódica destes complexos contendo ciclinas e CDK durante o ciclo celular medeia a regulação temporal de transições do ciclo celular (pontos de checagem). Outros fatores reguladores da atividade de CDK incluem inibidores de CDK (CKIs or ICKs, KIPs, CIPs, INKs), quinase ativadora de CDK (CAK), CDK fosfatase (Cdc25) e subunidade de CDK (CKS) (Mironov et al. Plant Cell 11, 509-522, 1999; Reed, S.I. Progress in Cell Cycle Research 2, 5-27, 1996).
Em plantas, duas classes maiores de CDKs, conhecidas como CDKs de tipo-A e de tipo-B, têm sido estudadas até o presente. As CDKs de tipo-A regulam ambas as transições de Gl-para-S e de G2-para-M, enquanto que as CDKs de tipo-B parecem controlar apenas o ponto de checagem de G2-para-M (Hemerly et al., 1995; Magyar et al., 1997; Porceddu et al., 2001). Em adição, a presença de CDKs de tipo-C e de quinases ativadoras de CDK (CAKs) tem sido relatada (Magyar et al., 1997; Umeda et al., 1998; Joubès et al., 2001), do mesmo modo a presença de CDKs de tipo-D, tipo-E e tipo-F (Vandepoele et al. Plant Cell 14, 903-916, 2002).
É sabido que as CDKs de tipo-A têm uma estrutura terciária conservada (Goldsmith e Cobb, Curr. Opin. Struct. Biol. 4, 833-840), incluindo um motivo PSTAIRE elevadamente conservado que está envolvido em ligação de ciclina. O núcleo catalítico de uma CDK é composto de um lobo N-terminal e um lobo C-terminal. O lobo C-terminal inclui uma fenda catalítica (responsável pela ligação de substrato e ATP) e adicionalmente compreende uma denominada alça-T, chamada segundo um resíduo de treonina que está conservado em várias famílias de quinase. Em CDK2 de humano, este resíduo de treonina está na posição 161, enquanto que em Saccharomyces cerevisiae cdc28 e em Schizosaccharomyces pombe cdc2 está localizado em posição 169 e 167 respectivamente. Fosforilação deste resíduo de treonina é relatada em causar uma mudança de conformação estrutural na alça-T que é necessária para mudar a quinase para um estado ativo (Gu et al., EMBO J. 11, 3995-4005). Vários estudos descrevem mutações da treonina conservada na alça-T (Ducommun et al. EMBO J. 10, 3311-3319, 1991; Gould et al. EMBO J. 10, 3297-3309; Marcote et al. Mol. Cell. Biol. 13, 5122-5131, 1993; Ducommun et al. Mol Cell. Biol. 11, 6177-6184, 1991; 1Coleman et al. J. Biol. Chem. 272, 18869-18874, 1997; Martinez et al. EMBO J. 16, 343-354, 1997; Gould et al. Mol. Gen. Genet. 259, 437-448, 1998; Booher et al. Mol. Cell. Biol. 6, 3523-3530, 1986; Solomon et al. Mol. Biol. Cell 3, 13-27, 1992; Lim et al. Mol. Cell. Biol. 16, 4573-4583, 1996), foi mostrado que todas as mutações testadas têm um impacto sério sobre a ligação de ligantes (tal como ciclina ou Sucl/ICK) e/ou sobre atividade de quinase, resultando em fenótipos letais ou defectivos em experimentos de complementação de levedura (de acordo com a numeração de levedura cdc28), e por analogia também a mutação T169D, imita uma fosforilação, foi demonstrado que nenhumas das CDKs com tais mutações foram capazes de totalmente complementar levedura.
Outros resíduos que desempenham um papel importante em atividade de proteína CDK de tipo-A são treonina na posição 14 e tirosina na posição 15. Sob fosforilação de pelo menos um destes aminoácidos, a CDK se torna inativada. WO 99/54489 descreve o uso de uma CDK com treonina 14 e tirosina 15 substituídas por alanina e fenilalanina respectivamente para aumentar a tolerância de plantas ao estresse salino. WO 00/52171 descreve um método de modificar uma ou mais características ou propriedades fisiológicas, bioquímicas e morfológicas mediadas por citocinina compreendendo expressão de uma Cdc25 fosfoproteína fosfatase em uma planta.
Como mencionado acima CDKs são pontos de checagem de ciclo celular, que estão envolvidos em cascatas de transdução de sinal que garantem integridade genômica durante a divisão celular. Como pontos de checagem em mitose CDKs são reguladas por ciclina A ou ciclina B. As CDKs são apenas ativas durante o ciclo celular em conexão com sua respectiva ciclina. Embora seus papéis mitóticos essenciais estejam claros, os mecanismos moleculares pelos quais estas proteína quinases atuam na célula viva precisam ser clarificados. Em particular, as funções de diferentes isoformas de CDK e subunidades de CDK permanecem não esclarecidas. Análises genéticas e bioquímicas em vários microorganismos têm mostrado que as CDKs elevadamente conservadas são exigidas para entrada e saída mitóticas. Estudos bioquímicos e estruturais predizem que CDKs coordenam reconhecimento de substrato específico, mas atualmente os efetores a jusantes diretos de CDKs são desconhecidos. A situação é ainda mais difícil porque a maioria das CDKs existe em isoformas diferente cada uma tendo mais provavelmente uma função diferente. Isto significa que outros estudos bioquímicos são necessários para clarificar as rotas moleculares pelas quais CDKs atuam.
Portanto ainda há uma grande demanda por genes novos e mais adequados, que codificam CDKs, que participam na diferenciação de plantas. Conseqüentemente ditos genes novos devem ter tanto quanto possível as seguintes características:
• participação no ciclo celular e/ou na divisão celular; • participação na organogênese;
• participação na morfogênese;
• influência na anatomia das plantas;
• aumento da atividade metabólica;
· aumento do tamanho de órgãos diferentes das plantas, de preferência de sementes ou grãos; e/ou
• uma ampla atividade em diferentes órgãos e/ou compartimentos celulares.
Portanto um objetivo foi obter outros genes CDK, que são adequados para aumento de rendimento em plantas. Este objetivo foi alcançado pelo processo de acordo com a invenção para a produção de compostos de fórmula I.
Portanto, de acordo com uma modalidade da presente invenção é proporcionado um método para melhorar as características de crescimento de planta em relação às plantas de tipo selvagem correspondentes, compreendendo modular a atividade em uma planta de um gene CDK de preferência de uma CDK de tipo-A e/ou modular a expressão de um ácido nucleico codificador de tal CDK de preferência de CDK de tipo-A, e opcionalmente selecionar plantas tendo características de crescimento melhoradas.
Vantajosamente, desempenho do método de acordo com a presente invenção resulta em plantas tendo uma variedade de características de crescimento melhoradas em relação às plantas de tipo selvagem correspondentes e cujas características de crescimento melhoradas compreendem pelo menos rendimento aumentado em relação às plantas de tipo selvagem correspondentes.
O termo "rendimento aumentado" como aqui definido é adotado para significar um aumento em qualquer um ou mais dos seguintes, cada um em relação às plantas de tipo selvagem correspondentes: (i) biomassa (peso) aumentada de uma ou mais partes de uma planta, particularmente partes acima do solo (capazes de serem colhidas), biomassa de raiz aumentada ou biomassa aumentada de qualquer outra parte capaz de ser colhida;
(ii) rendimento de sementes total aumentado, que inclui um aumento em biomassa de sementes (peso de sementes) e que pode ser um aumento no peso de sementes por planta ou em uma base de semente individual;
(iii) número aumentado de flores ("flósculos") por panícula
(iv) número aumentado de sementes (cheias);
(v) tamanho de semente aumentado, que também pode influenciar a composição das sementes;
(vi) volume de semente aumentado, que também pode influenciar a composição das sementes (incluindo composição e teor total de óleo, proteína e carboidrato);
(vii) área de semente individual aumentada;
(viii) largura e/ou área de semente individual aumentada;
(ix) índice de colheita aumentado, que é expressado como uma razão do rendimento de partes capazes de serem colhidas, tais como sementes, sobre a biomassa total; e
(x) peso de mil grãos aumentado (TKW), que é extrapolado do número de sementes cheias contadas e seu peso total. Um TKW aumentado pode resultar de um aumento em tamanho de embrião e/ou tamanho de endosperma.
Tomando-se milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas por hectare ou acre, um aumento no número de espigas por planta, um aumento no número de filas, número de grãos por fila, peso de grãos, TKW, comprimento/diâmetro de espiga, dentre outros. Tomando-se arroz como um exemplo, um amento de rendimento pode ser manifestado por um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguetas por panícula, número de flores por panícula, aumento na taxa de enchimento de semente, expressada (em %) como a proporção do número de sementes cheias sobre o número de flósculos (número total de sementes), aumento em TKW, dentre outros. Um aumento em rendimento também pode resultar em arquitetura modificada, ou pode ocorrer como resultado de arquitetura modificada.
De acordo com um aspecto preferido, o desempenho dos métodos de acordo com a presente invenção resulta em plantas tendo rendimento aumentado e mais particularmente, biomassa aumentada e/ou rendimento de sementes aumentado. De preferência, o rendimento de sementes aumentado compreende um aumento em um ou mais dos seguintes: número de sementes (cheias), peso de semente total, tamanho de semente, volume de semente, peso de mil grãos e índice de colheita, cada um em relação às plantas de controle.
Portanto, de acordo com a presente invenção, é proporcionado um método para aumentar rendimento de planta em relação às plantas de controle correspondentes, cujo método compreende modular atividade de uma CDK ou de um seu homólogo em uma planta, cuja CDK ou homólogo possui um dos motivos aqui mencionados, e/ou modular a expressão de um ácido nucleico codificador de uma tal CDK ou de seu homólogo.
Visto que as plantas de acordo com a presente invenção têm rendimento aumentado, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte de seu ciclo de vida), relativo à taxa de crescimento de plantas de tipo selvagem correspondentes em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica para uma ou mais partes de uma planta ou tipos de célula, incluindo sementes, de uma planta, ou pode ser completamente substancialmente a planta inteira. Plantas tendo uma taxa de crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotado para significar o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta tem produzido sementes maduras secas, similar ao material inicial. Este ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, tempo de floração e velocidade de maturação de semente. Um aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro das planta. Taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode refletir vigor aumentado. O aumento em taxa de crescimento pode alterar o ciclo de safra de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outra forma seria possível. Se a taxa de crescimento for suficientemente aumentada, ela pode permitir a semeadura de outras sementes de mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguidas por semeadura e colheita de outras plantas de arroz tudo dentro de um período de crescimento convencional). Similarmente, se a taxa de crescimento for suficientemente aumentada, ela pode permitir outra semeadura de sementes de espécies de planta diferentes (por exemplo a semeadura e a colheita de plantas de arroz seguidas por, por exemplo, a semeadura e a colheita opcional de feijão-soja, batatas ou qualquer outra planta adequada). Tempos adicionais de colheita do mesmo rizoma no caso de algumas plantas também pode ser possível. Alteração do ciclo de colheita de uma planta pode levar a um aumento em produção de biomassa anual por acre (devido a um aumento no número de vezes (a dizer em um ano) que qualquer planta particular pode ser crescida e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que a de suas contra-partes de tipo selvagem, porque as limitações territoriais para crescimento de uma colheita são muitas vezes determinadas pelas condições ambientais adversas quer no momento do plantio (estação inicial) quer no momento da colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita for encurtado. A taxa de crescimento pode ser determinada pela derivação de vários parâmetros de curvas de crescimento plotando experimentos de crescimento, tais parâmetros podem ser: T-Mid (o tempo demorado para as plantas alcançarem 50% de seu tamanho máximo) e T-90 (tempo demorado para as plantas alcançarem 90% de seu tamanho máximo), dentre outros.
Desempenho dos métodos da invenção dá plantas tendo uma taxa de crescimento aumentada. Portanto, de acordo com a presente invenção, é proporcionado um método para aumentar a taxa de crescimento de plantas, cujo método compreende modular atividade de uma CDK, de suas isoformas ou de um seu homólogo em uma planta, cuja CDK ou homólogo possui um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE ou outro motivo aqui mencionado, e/ou modular a expressão de um ácido nucleico codificador de uma tal CDK ou de seu homólogo.
O termo "isoforma" como aqui usado deve significar versões diferentes de uma proteína com algumas diferenças pequenas, que também conhecido como uma isoenzima se a proteína for uma enzima. Isoformas podem ser normalmente separadas por eletroforese ou alguma outra técnica de separação. Existem por mecanismos múltiplos: diferentes Ioci de gene, alelos múltiplos (também chamado de alelomorfos, alelozimas, ou alozimas), interação de subunidades diferentes, formas de união diferentes, ou modificação de pós-tradução diferente.
Um aumento em rendimento e/ou taxa de crescimento ocorre se a planta estiver sob condições de não-estresse ou se a planta for exposta a vários estresses comparada com as plantas de controle. Plantas tipicamente respondem à exposição ao estresse pelo crescimento mais lento. Em condições de estresse severo, a planta pode até mesmo parar inteiramente de crescer. Estresse suave por outro lado é aqui definido como sendo qualquer estresse ao qual uma planta é exposta que não resulta na cessação da planta em crescer inteiramente sem a capacidade para continuar a crescer. Devido às vantagens em práticas agrícolas (irrigação, fertilização, tratamentos com pesticida) estresses severos não são muitas vezes encontrados em plantas de colheita cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse suave é muitas vezes um aspecto indesejável para agricultura. Estresses suaves são os estresses típicos aos quais uma planta pode ser exposta. Estes estresses podem ser estresses bióticos e/ou abióticos (ambientais) diários aos quais uma planta é exposta. Estresses abióticos ou ambientais típicos incluem estresses de temperatura causados por temperaturas congelantes / frias ou quentes atípicas; estresse salino, estresse aquoso (estiagem ou excesso de água). Estresses abióticos também podem ser causados por compostos químicos. Estresses bióticos são tipicamente aqueles causados por patógenos, tais como bactérias, vírus, fungos e insetos. O termo "condições não-estressantes" como aqui usado são aquelas condições ambientais que não significativamente vão além das condições climáticas ou outras condições abióticas diárias que as plantas podem encontrar. Pessoas experientes na técnica estão cientes das condições de solo normais e das condições climáticas para uma dada localização geográfica.
Os termos "aumentar", "melhorar" ou "melhora" são intercambiáveis e devem significar no sentido do pedido pelo menos 10%, 20%, 30%, 40% ou 50%, de preferência pelo menos 60%, 70%, 80%, 90% ou 100%, mais preferivelmente 150%, 200%, 300%, 400% ou 500% mais crescimento em comparação com a planta de tipo selvagem como aqui definido, e.g. que significa em comparação com uma planta sem a introdução da seqüência de ácido nucleico codificadora de CDK de acordo com a invenção. O aumento referido à atividade do polipeptídeo totaliza em uma célula, um tecido, uma organela, um órgão ou um organismo ou uma sua parte preferivelmente pelo menos 5%, preferivelmente pelo menos 20% ou pelo menos 50%, especialmente preferivelmente pelo menos 70%, 80%, 90% ou mais, muito especialmente preferivelmente pelo menos 200%, 300% ou 400%, mais preferivelmente pelo menos 500% ou mais em comparação com o controle, a referência ou tipo selvagem.
O termo "modular a atividade" deve significar qualquer mudança da expressão das seqüências de ácido nucleico ou proteínas codificadas da invenção, que leva a um aumento no crescimento da plantas.
As características de crescimento acima mencionadas podem ser vantajosamente modificadas em qualquer planta.
O termo "planta" como aqui usado inclui plantas inteiras, ancestrais e progênie das plantas e partes de planta, incluindo sementes, rebentos, caules, folhas, raízes (incluindo tubérculos), frutas, pedúnculo, mudas, tubérculos, flores, e tecidos e órgãos, sendo que cada um dos acima mencionados compreendem o gene / ácido nucleico de interesse ou a modificação específica no gene / ácido nucleico de interesse. O termo "planta" também inclui células de planta, culturas em suspensão, tecido de calo, embriões, regiões meristemáticas, gametófitos, esporófitos, pólen, e microesporos, de novo sendo que cada um dos acima mencionados compreendem o gene / ácido nucleico de interesse.
Um(a) "referência", "controle" ou "tipo selvagem" é em particular uma célula, um tecido, um órgão, um organismo, ou uma sua parte, que não era produzida de acordo com o processo da invenção. Conseqüentemente, o termos "tipo selvagem", "controle" ou "referência" são intercambiáveis e podem ser uma célula ou uma parte da planta tal como uma organela ou um tecido, ou uma planta, que não foi modificada ou tratada de acordo com o processo aqui descrito conforme a invenção. Conseqüentemente, a célula ou uma parte da planta tal como uma organela ou uma planta usada como tipo selvagem, controle ou referência corresponde à célula, planta ou parte da mesma tanto quanto possível e é em qualquer outra propriedade exceto no resultado do processo da invenção tão idêntica quanto possível ao tema da invenção. Assim, o tipo selvagem, controle ou a referência é tratado(a) identicamente ou tão identicamente quanto possível, dizendo que podem ser diferentes apenas condições ou propriedades que não influenciam a qualidade da propriedade testada. Isto significa que em outras palavras que o tipo selvagem denota (1) uma planta, que transporta a forma inalterada de um gene ou alelo ou (2) o material/planta inicial do(a) qual as plantas produzidas pelo processo ou método da invenção são derivadas.
Preferivelmente, qualquer comparação entre as planta de tipo selvagem e as plantas produzidas pelo processo da invenção é realizada sob condições análogas. O termo "condições análogas" significa que todas as condições tais como, por exemplo, condições de crescimento ou cultura, condições de ensaio (tais como composição de tampão, temperatura, substratos, cepa patogênica, concentrações e semelhante) são mantidas idênticas entre os experimentos a serem comparados.
A "referência", "controle", ou "tipo selvagem" é preferivelmente um tema, e.g. uma organela, uma célula, um tecido, uma planta, que não foi modificado ou tratado de acordo com o processo aqui descrito da invenção e é em qualquer outra propriedade tão similar quanto possível ao tema da invenção. A referência, controle ou tipo selvagem é em seu genoma, transcriptoma, proteoma ou metaboloma tão similar quanto possível ao tema da presente invenção. Preferivelmente, o termo organela, célula, tecido ou planta de "referência", "controle" ou "tipo selvagem", refere-se a uma organela, célula, tecido ou planta, que é quase geneticamente idêntica(o) à organela, célula, tecido ou planta, da presente invenção ou uma sua parte preferivelmente em 95%, mais preferido são em 98%, ainda mais preferido são em 99,00%, em particular em 99,10%, 99,30%, 99,50%, 99,70%, 99,90%, 99,99%, 99,999% ou mais. Mais preferível a "referência", "controle", ou "tipo selvagem" é preferivelmente um tema, e.g. uma organela, uma célula, um tecido, uma planta, que é geneticamente idêntica(o) à planta, célula, organela usada de acordo com o processo da invenção exceto que as moléculas de ácido nucleico ou o produto de gene codificado por elas são modificadas ou mudadas de acordo com o processo da invenção.
Se, um controle, uma referência ou um tipo selvagem diferindo do tema da presente invenção apenas por não ser tema do processo da invenção não puder ser obtido(a), um controle, uma referência ou um tipo selvagem pode ser um organismo no qual a causa para a modulação da atividade conferindo o aumento de composto de química fina como aqui descrito tem sido retornada à situação anterior ou desligada, e.g. por complementação de produto de gene reduzido confiável, e.g. por (sobre)expressão transiente ou estável, por ativação de um ativador ou agonista, por inativação de um inibidor ou antagonista, por adição de compostos ativos como e.g. hormônios, por introdução de intensificadores etc.
Plantas que são particularmente úteis nos métodos ou processos da invenção incluem algas, samambaias, e todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas, incluindo leguminosas para forragem ou ração de animais, plantas ornamentais, colheitas alimentícias, árvores, ou arbustos selecionados da lista compreendendo Abelmoschus spp., Acer spp., Actinidia spp., Agropyron spp., Allium spp., Amaranthus spp., Ananas comosus, Annona spp., Apium graveolens, Arabidopsis thaliana, Arachis spp, Artocarpus spp., Asparagus officinalis, Avena sativa, Averrhoa carambola, Benincasa hispida, Bertholletia excelsea, Beta vulgaris, Brassica spp., Cadaba farinosa, Camellia sinensis, Canna indica, Capsicum spp., Carica papaya, Carissa macrocarpa, Carthamus tinctorius, Carya spp., Castanea spp., Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Cola spp., Colocasia esculenta, Corylus spp., Crataegus spp., Cueumis spp., Cueurbita spp., Cynara spp., Daueus carota, Desmodium spp., Dimoearpus longan, Dioseorea spp., Diospyros spp., Echinoehloa spp., Eleusine coracana, Eriobotrya japonica, Eugenia uniflora, Fagopyrum spp., Fagus spp., Fieus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glyeine spp., Gossypium hirsutum, Helianthus spp., Hibiseus spp., Hordeum spp., Ipomoea batatas, Juglans spp., Laetuea sativa, Lathyrus spp., Lemna spp., Lens culinaris, Linum usitatissimum, Litehi chinensis, Lotus spp., Luffa acutangula, Lupinus spp., Maerotyloma spp., Malpighia emarginata, Malus spp., Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Mentha spp., Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp., Panicum miliaceum, Passiflora edulis, Pastinaca sativa, Persea spp., Petroselinum crispum, Phaseolus spp., Phoenix spp., Physalis spp., Pinus spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Punica granatum, Pyrus communis, Quercus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Rubus spp., Saccharum spp., Sambucus spp., Secale cereale, Sesamum spp., Solanum spp., Sorghum bicolor, Spinacia spp., Syzygium spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticosecale rimpaui, Triticum spp., Vaccinium spp., Vicia spp., Vigna spp., Vitis spp., Zea mays, Zizania palustris, Ziziphus spp., dentre outras.
De acordo com um aspecto preferido da presente invenção, a planta é uma planta de colheita compreendendo feijão-soja, girassol, canola, alfafa, colza, algodão, tomate, batata ou tabaco. Mais preferivelmente, a planta de acordo com a presente invenção é uma planta monocotiledônea tal como cana-de-açúcar, mais preferivelmente um cereal, tal como arroz, milho, trigo, painço, cevada, centeio, aveia ou sorgo.
Plantas preferidas particulares são plantas selecionadas do grupo consistindo de Asteraceae tais como dos gêneros Helianthus, Tagetes e.g. as espécies Helianthus annus [girassol], Tagetes lúcida, Tagetes erecta ou Tagetes tenuifolia [cravo-de-defunto], Brassicaceae tais como dos gêneros Brassica, Arabadopsis e.g.as espécies Brassica napus, Brassica rapa ssp. [canola, colza de semente oleosa, nabo silvestre] ou Arabidopsis thaliana. Fabaceae tal como o gênero Glycine e.g. as espécies Glycine max, Soja hispida ou Soja max [feijão-soja] (como eu não estou seguro, se , Soja max de fato existe, que realmente se chama Glycine max). Linaceae tal como o gênero Linum e.g. a espécie Linum usitatissimum, [linho, linhaça]; Poaceae tais como os gêneros Hordeum, Secale, Avena, Sorgo, Oryza, Zea, Triticum e.g. as espécies Hordeum vulgare [cevada]; Secale cereale [centeio], Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida [aveia], Sorgo bicolor [Sorgo, painço], Oryza sativa, Oryza latifolia [arroz], Zea mays [milho] Triticum aestivum, Triticum durum, Triticum turgidum, Triticum hybernum, Triticum macha, Triticum sativum ou Triticum vulgare [trigo, trigo de pão, trigo comum]; Solanaceae tais como os gêneros Solanum, Lycopersicon e.g. as espécies Solanum tuberosum [batateira], Lycopersicon esculentum, Lycopersicon lycopersicum., Lycopersicon py ri forme, Solanum integrifolium ou Solanum lycopersicum [tomateiro],
A atividade de uma proteína CDKA pode ser modulada por modulação dos níveis da proteína CDKA. Alternativamente, atividade também pode ser modulada quando não houver mudança nos níveis de uma proteína CDKA, isto pode ocorrer quando as propriedades intrínsecas do polipeptídeo são alteradas, por exemplo por preparação de um mutante. De acordo com um aspecto preferido da invenção, atividade modulada da proteína CDKA e/ou expressão moduladas de um ácido nucleico codificador desta CDKA é atividade introduzida e/ou aumentada de uma proteína CDKA e/ou expressão aumentada de um ácido nucleico codificador desta CDKA.
Os termos "CDK de tipo-A" ou "CDKA" como aqui definidos podem ser usados intercambiavelmente e incluem qualquer seqüência de aminoácidos tendo atividade de quinase dependente de ciclina e cuja seqüência quando usada na construção de uma árvore filogenética de CDK5 tal como aquela mostrada no protocolo de seqüência de preferência de SEQ ID NO: 45, 47, 49, 51, 53 e/ou SEQ ID NO: 55, agrupamentos ao redor de CDKs de tipo-A em vez de qualquer dos outros grupos de CDK e cuja seqüência de aminoácidos compreende uma seqüência de aminoácidos (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE são preferidos. Uma pessoa experiente na técnica poderia prontamente determinar se qualquer seqüência de aminoácidos em questão cai dentro da definição de uma "CDK de tipo-A" usando técnicas e programas de computador conhecidos para a preparação de uma tal árvore filogenética, tais como o pacote GCG, EBI ou CLUSTAL, usando parâmetros pré-estabelecidos (veja por exemplo Vandepoele et al. 2002). Sob construção de uma tal árvore filogenética, seqüências agrupando no grupo de CDK de tipo-A serão consideradas caindo dentro da definição de uma "CDK de tipo-A" ou "CDKA", e portanto serão úteis na realização dos métodos da invenção. Preferivelmente a CDK adicionalmente compreende em ordem crescente de preferência pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de seqüência total ao aminoácido mostrado em SEQ ID NO: 2. Portanto programas baseados nos algoritmos acima mencionados são preferidos. Vantajosamente as comparações de seqüências podem ser feitas com o programa PileUp (J. Mol. Evolution., 25, 351-360, 1987, Higgins et al., CABIOS, 5 1989: 151-153) ou preferivelmente com os programas Gap e BestFit, que são respectivamente baseados nos algoritmos de Needleman e Wunsch [J. Mol. Biol. 48; 443-453 (1970)] e Smith e Waterman [Adv. Appl. Math. 2; 482-489 (1981)]. Ambos os programas são parte do pacote de programas de computador GCG [Genetics Computer Group, 575 Science Drive, Madison, Wisconsin, USA 53711 (1991); Altschul et al. (1997) Nucleic Aeids Res. 25:3389 et seq.]. Portanto preferivelmente os cálculos para determinar as percentagens de homologia de seqüência são feitos com o programa Gap sobre a extensão inteira das seqüências. Os seguintes ajustes padrão para a comparação de seqüências de ácido nucleico foram usados: peso de intervalo: 50, peso de comprimento: 3, combinação média: 10.000, não-combinação média: 0.000.
Homologia entre dois polipeptídeos é entendida com o significado de a identidade da seqüência de aminoácidos sobre, em cada caso, o comprimento inteiro da seqüência que é calculada por comparação com o auxílio do algoritmo de programa GAP (Wisconsin Package Version 10.0, University of Wisconsin, Genetics Computer Group (GCG), Madison, USA), ajustando os seguintes parâmetros:
Peso de intervalo: 8 Peso de comprimento: 2
Combinação média: 2,912 Não-combinação média:-2,003.
Em ambos os casos (comparação de seqüência de ácido nucleico ou de seqüência de aminoácidos) dos parâmetros mencionados Combinação Média e Não-Combinação Média os números dados acima são os resultados do cálculo.
Os vários domínios estruturais em uma proteína CDKA são bem conhecidos (De Bondt et al., Nature 363, 595-602, 1993) e podem ser identificados usando banco de dados especializados e.g. SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318; http://www.ebi.ac.uk/interpro/), Prosite (Bucher e Bairoch (1994), Uma sintaxe de perfil generalizada para motivos de seqüências biomoleculares e sua função em interpretação de seqüência automática. (Em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAJPress, Menlo Park; Hulo et ai., Nucl. Acids. Res. 32:D134-D137, (2004), http://www.expasy.org/prosite/) ou Pfam (Bateman et al., Nucleic Acids Research 30(l):276-280 (2002), http ://www. sanger. ac.uk/Software/Pfam/).
O domínio quinase de CDK é de um TKc de tipo-S (Número de Acesso em SMART de SM00220, Número de Acesso em InterPro de IPR002290), e tem atividade de Ser/Thr quinase. O sítio ativo predito (VLHRDLKPQNLLI, sendo que D é o resíduo catalítico predito) corresponde à assinatura PS00108 de PROSITE. Em posição 1 do sítio ativo em vez de uma Valina pode existir uma Fenilalanina. Em posição 6 uma troca de Leucina por Metionina pode ocorrer e em posição 9 Gln pode ser trocada por Asn. O sítio de ligação de ATP (IGEGTYGVVYRARDKVTNETIALK) corresponde à assinatura PSOO107 de PROSITE. Também no sítio de ligação de ATP podem ocorrer algumas mutações. Elas são as seguintes: posição 11 Arg -> Lys; posição 12 Ala -> Gly, posição 13 Arg -> Leu, posição 15 Lys Arg e posição 16 Val Leu, Ala, Ser, Thr ou Asn.
Métodos para a pesquisa e a identificação de homólogos de CDK de tipo-A estariam dentro do domínio de pessoas experientes na técnica. Tais métodos compreendem comparação das seqüências representadas por SEQ ID NO 1 ou 2, ou pelo Número de Acesso em GenBank de CAA42922, em um formato legível por computador, com seqüências que estão disponíveis em bancos de dados públicos tais como MTPS (http://mips.gsf.de/), GenBank (http://www.ncbi.nlm.nih.gov/Genbank/index.html) ou EMBL Nucleotide Sequence Database (http://www.ebi.ac.uk/embl/index.html), usando algoritmos bem conhecidos na técnica para o alinhamento ou a comparação de seqüências, tais como GAP (Needleman e Wunsch5 J. Mol. Biol. 48; 443- 453 (1970)), BESTFIT (usando o algoritmo de homologia local de Smith e Waterman (Advances in Applied Mathematics 2; 482-489 (1981))), BLAST (Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J., J. Mol. Biol. 215:403-410 (1990)), FASTA e TFASTA (W. R. Pearson e D. J. Lipman Proc.Natl.Acad.Sci. USA 85:2444- 2448 (1988)). O programa de computador para realizar análise BLAST está disponível para o público através do National Centre for Biotechnology Information (NCBI). Os homólogos mencionados abaixo foram identificados usando parâmetros pré- estabelecidos de BLAST (matriz BLOSUM62, penalidade de abertura de intervalo lie penalidade de extensão de intervalo 1) e são preferivelmente usadas para análise as seqüências de comprimento total. Estes métodos de alinhamento também facilmente permitem a identificação da treonina conservada que corresponde à treonina 161 em CDC2 de humano ou CDKA de arroz; 1 (SEQ ID NO: 8).
E para ser entendido que o termo "CDK ou de preferência CDK de tipo-A ou um seu homólogo" não é para ser limitado às seqüências como representadas no protocolo de seqüência, mas que qualquer polipeptídeo atendendo aos critérios de ter atividade de quinase dependente de ciclina, ter um domínio (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE ou outro domínio como aqui descrito, e ter pelo menos 80%, 85% or 90%, preferivelmente 91%, 92%, 93%, 94% ou 95%, mais preferivelmente 96%, 97%, 98%, 99% ou 100% de identidade de seqüência em relação às seqüências descritas no protocolo de seqüência preferivelmente em relação às seqüências de SEQ ID NO: 45, 47, 49, 51, 53 e/ou SEQ ID NO: 55, pode ser adequado para uso nos métodos da invenção, desde que as CDKs tenham a propriedade de aumento de rendimento.
Para determinar a atividade de quinase de CDKs de tipo-A, vários ensaios estão disponíveis e são bem conhecidos na técnica (por exemplo Current Protocols in Molecular Biology, Volumes 1 e 2, Ausubel et al. (1994), Current Protocols; ou online, tal como http://www.protocol- online.org). Em resumo, o ensaio de quinase geralmente envolve: (1) contatar a proteína quinase com um polipeptídeo substrato contendo o sítio alvo a ser fosforilado; (2) permitir fosforilação do sítio alvo em um tampão quinase apropriado sob condições adequadas; (3) separar produtos fosforilados de substrato não-fosforilado após um período de reação adequado. A presença ou ausência de atividade de quinase é determinada pela presença ou ausência do alvo fosforilado. Também, medições quantitativas podem ser realizadas. Proteína CDK purificada, ou extratos de célula contendo ou enriquecidos com a proteína CDK podem ser usados como uma fonte de proteína quinase. Histona Hl ou peptídeos pequenos são particularmente bem adequados como um substrato. O peptídeo precisa compreender um ou mais resíduos de serina, treonina, ou tirosina em um motivo de sítio de fosforilação. Uma compilação de sítios de fosforilação pode ser encontrada em Biochimica et Biophysica Acta 1314, 191-225, (1996). Também, os substratos de peptídeo podem ter vantajosamente uma carga positiva efetiva para facilitar ligação em filtros de fosfocelulose, (permitindo separação dos peptídeos fosforilados dos não-fosforilados e detecção dos peptídeos fosforilados). Se um motivo de sítio de fosforilação não é conhecido, um substrato geral de Ser/Thr quinase pode ser usado. Por exemplo, o peptídeo "ADAQHATPPKKKRKVEDPKDF" (Marshak et al. J. Cell. Biochem. 45, 391, 1991) é um substrato específico para CDK de tipo-A. Para determinar os parâmetros cinéticos para fosforilação do peptídeo sintético, uma faixa de concentrações de peptídeo é exigida. Para reações iniciais, uma concentração de peptídeo de 0,7-1,5 mM pode ser usada. Para cada enzima quinase, é importante determinar os ótimos tampão, força iônica, e pH para atividade. Um Tampão Quinase 5x padrão geralmente contém BSA 5 mg/ml (Albumina de Soro Bovino prevenindo a adsorção de quinase no tubo de ensaio), Tris-Cl 150 mM (pH 7,5), MgCl2 100 mM. As concentrações ótimas de cátions divalentes precisam ser determinadas empiricamente para cada proteína quinase. Tampões adequados para ensaios de CDK são conhecidos na técnica (por exemplo John et al., Protoplasma 161, 70-74, 1991). Um doador comumente usado do grupo fosforila é [gama-32 P]ATP radiomarcado (normalmente em concentração final de 0,2 mM). A quantidade de 32P incorporado nos peptídeos pode ser determinada pela medição da atividade sobre as almofadas secas de nitrocelulose em um contador de cintilação.
Adicionalmente, tal "CDK ou seu homólogo ou derivado", quando expressada sob o controle de um promotor específico para broto em Oryza sativa, aumenta o rendimento de sementes comparado com as plantas de tipo selvagem. Este aumento em rendimento de semente pode ser medido em várias maneiras, por exemplo como um aumento no peso total de sementes, como um aumento no número de sementes cheias colhidas de uma planta ou como um aumentado índice de colheita.
A atividade biológica e/ou funcional de uma CDK ou de um seu homólogo de acordo com a presente invenção inclui pelo menos uma tendo atividade de quinase dependente de ciclina ou tendo atividade aumentadora de rendimento em plantas como descrito acima.
"Fragmentos ativos" de uma CDK de preferência de uma proteína CDK de tipo-A incluem pelo menos 100, 110, 120, 130, 140 ou 150, de preferência 160, 170, 180, 190 ou 200 resíduos de aminoácido de uma proteína CDK, cujos resíduos contíguos retêm atividade biológica e/ou funcional em relação à proteína naturalmente ocorrente.
Uma CDK ou um seu homólogo como definido aqui acima é codificada por uma molécula de ácido nucleico CDK. O ácido nucleico codificador de uma CDK ou de um seu homólogo pode ser qualquer ácido nucleico natural ou sintético. Portanto o termo "molécula de ácido nucleico CDK" ou "gene CDK" como aqui definido é qualquer molécula de ácido nucleico (incluindo aquelas como um resultado da degeneração do código genético) codificadora de um polipeptídeo CDK ou de um seu homólogo como descrito aqui acima. Exemplos de moléculas de ácido nucleico CDK incluem aquelas no protocolo de seqüência, e aquelas codificadoras dos homólogos mencionados acima. Ácidos nucleicos CDK e suas variantes funcionais podem ser adequados na prática dos métodos da invenção. Tais ácidos nucleicos CDK variantes funcionais incluem porções de uma molécula de ácido nucleico CDK, variantes alélicas e/ou ácidos nucleicos capazes de hibridizarem com uma molécula de ácido nucleico CDK. O termo "funcional" no contexto de uma variante funcional refere-se a uma variante (i.e. uma porção ou uma seqüência de hibridização), que codifica um polipeptídeo tendo atividade de quinase dependente de ciclina.
Uma outra modalidade da invenção é uma molécula de ácido nucleico isolada compreendendo uma molécula de ácido nucleico selecionada do grupo consistindo de:
a) uma molécula de ácido nucleico isolada como representada em SEQ ID NO: 45, 47, 49, 51, 53 ou 55;
b) uma molécula de ácido nucleico isolada codificadora da seqüência de aminoácidos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56;
c) uma molécula de ácido nucleico isolada cuja seqüência pode ser deduzida de uma seqüência de polipeptídeos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56 como um resultado da degeneração do código genético;
d) uma molécula de ácido nucleico isolada que codifica um polipeptídeo que tem pelo menos 80% de identidade com a seqüência de aminoácidos do polipeptídeo codificado pela molécula de ácido nucleico de (i) a (iii);
e) uma molécula de ácido nucleico isolada codificadora de um homólogo, derivado ou fragmento ativo da molécula de aminoácido como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56, cujo homólogo, derivado ou fragmento é de uma origem de planta ou compreende vantajosamente um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I);
f) uma molécula de ácido nucleico isolada codificadora de uma proteína compreendendo uma seqüência de aminoácidos selecionada do grupo consistindo de:
aa) (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE;
ab) (V/F/I)(L/I)HRD(L/M)K(P/S/T)(Q/N/S/G)N(L/I)L(V/L/I);
ac) (I/L)(G/N)(E/R)G(T/A)YG(V/I)V(Y/C)(R/K/S)(A/G/S) (R/L/T/I)(D/N)(K/R/E)(V/K/A/S/T/N)T(N/S/G)(E/K/Q) (T/L/I/K)(I/V)A(L/V/I)KK;
ad) LK(I/L)(C/A)DFGL(A/S)R;
ae) WYRAPE(L/I)L(L/F)(C/G);
af) GCI(F/M)AE(I/L/M); e
ag) DLL(QzNzszR)(KzQzR)(LzM)(LzF)(IZTZIZC)(FArZL)DP (TZEZDZRZS)(KZQ)RI;
g) uma molécula de ácido nucleico isolada capaz de hibridizar com um ácido nucleico de (i) a (iii) acima, ou seu complemento, sendo que a seqüência de hibridização ou o seu complemento codifica uma proteína CDK de planta que compreende vantajosamente um motivo (PZNZA)(SZLZMZF)(TZSZR)(TZSZA)(LZI);
pelo qual a molécula de ácido nucleico tem atividades intensificadoras de crescimento em plantas.
A presente invenção também proporciona uma molécula de ácido nucleico isolada (= seqüência de ácido nucleico) selecionada do grupo consistindo de:
a) uma molécula de ácido nucleico isolada como representada em SEQ ID NO: 45, 47, 49, 51, 53 ou 55; uma molécula de ácido nucleico isolada codificadora da seqüência de aminoácidos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56;
uma molécula de ácido nucleico isolada cuja seqüência pode ser deduzida de uma seqüência de polipeptídeos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56 como um resultado da degeneração do código genético;
uma molécula de ácido nucleico isolada que codifica um polipeptídeo que tem pelo menos 80% de identidade com a seqüência de aminoácidos do polipeptídeo codificado pela molécula de ácido nucleico de (a) a (c);
uma molécula de ácido nucleico isolada codificadora de um homólogo, derivado ou fragmento ativo da molécula de aminoácido como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56, cujo homólogo, derivado ou fragmento é de uma origem de planta ou compreende vantajosamente um motivo um (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE;
uma molécula de ácido nucleico isolada codificadora de uma proteína compreendendo uma seqüência de aminoácidos selecionada do grupo consistindo de:
i) (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE, preferivelmente PSTAIRE;
ii) (V/F/I)(L/I)HRD(L/M)K(P/S/T)(Q/N/S/G)N(L/I)L(V/L/I); preferivelmente HRDXKXXNXL;
iii) (I/L)(G/N)(E/R)G(T/A)YG(V/I)V(Y/C)(R/K/S)(A/G/S) (R/L/T/I)(D/N)(K/R/E)(V/K/A/S/T/N)T(N/S/G)(E/K/Q)(T/ L/I/K)(I/V)A(L/V/I)KK; preferivelmente GXVXXXXXXXTXXXXAXKK;
iv) LK(I/L)(C/A)DFGL(A/S)R, preferivelmente LKXXDFGLXR;
v) WYRAPE(L/I)L(L/F)(C/G), preferivelmente WYRAPE;
vi) GCI(F/M)AE(I/L/M), preferivelmente GCIXAEX; e
vii) DLL(Q/N/S/R)(K7Q/R)(L/M)(L/F)(I/T/I/C)(FAf/L)DP (T/E/D/R/S)(K/Q)RI, preferivelmente DLLXXXXXXDPXXRI.
g) uma molécula de ácido nucleico isolada capaz de hibridizar com um ácido nucleico de (a) a (c) acima, ou seu complemento, sendo que a seqüência de hibridização ou o seu complemento codifica uma proteína CDK de planta que compreende vantajosamente um motivo um (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE;
h) variantes alélicas de um ácido nucleico de acordo com qualquer um de (a) a (d) acima, cujas variantes alélicas codificam uma CDK de planta;e
i) variantes de união alternativas de um ácido nucleico de acordo com qualquer um de (a) a (d), cujas variantes de união alternativas codificam uma proteína CDK de planta compreendendo vantajosamente um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE;
pelo qual a variável X significa qualquer aminoácido e pelo qual a proteína codificada confere um aumento em rendimento.
Com relação à seqüência de ácido nucleico como representada por um construto de ácido nucleico que contém uma seqüência de ácido nucleico aqui mencionada ou um organismo (= organismo transgênico) que está transformado com a dita seqüência de ácido nucleico ou o dito construto de ácido nucleico, "transgene" significa todos os construtos que têm sido preparados por métodos de manipulação genética, preferivelmente nos quais quer a) a seqüência de ácido nucleico como mostrada em tabela I A e/ou I B, aplicação N211, colunas 5 e 7 ou um seu derivado, quer
b) um elemento regulatório genético, por exemplo um promotor, que está funcionalmente ligado na seqüência de ácido nucleico como mostrado em tabela I A e/ou I B, aplicação N211, colunas 5 e 7 ou um seu derivado, ou
c) (a) e (b)
está/estão não presente(s) em seu ambiente genético natural ou tem/têm sido modifícado(s) por meio de métodos de manipulação genética, sendo possível que a modificação seja, por intermédio de exemplo, uma substituição, adição, deleção, inversão ou inserção de um ou mais nucleotídeos. "Ambiente genético natural" significa o locus cromossômico natural no organismo de origem ou a presença em uma biblioteca genômica.
No caso de uma biblioteca genômica, o ambiente genético, natural, da seqüência de ácido nucleico está preferivelmente pelo menos parcialmente ainda preservado. O ambiente flanqueia a seqüência de ácido nucleico pelo menos em um lado e tem um comprimento de seqüência de pelo menos 50 pb, preferivelmente pelo menos 500 pb, particularmente preferivelmente pelo menos 1.000 pb, muito particularmente preferivelmente pelo menos 5000 pb.
A não ser se descritos de outro modo, os termos "polinucleotídeos", "ácido nucleico" e "molécula de ácido nucleico" como aqui usados são intercambiáveis. A não ser se descritos de outro modo, os termos "peptídeo", "polipeptídeo" e "proteína" são intercambiáveis no presente contexto. O termo "seqüência" pode se referir aos polinucleotídeos, ácido nucleicos, moléculas de ácido nucleico, peptídeos, polipeptídeos e proteínas, dependendo do contexto no qual o termo "seqüência" é usado. Os termos "gene(s)", "polinucleotídeo", "seqüência de ácido nucleico", "seqüência de nucleotídeos", ou "molécula(s) de ácido nucleico" como aqui usados referem-se a uma forma polimérica de nucleotídeos de qualquer comprimento, quer ribonucleotídeos quer desoxirribonucleotídeos. Os termos referem-se apenas à estrutura primária da molécula.
Assim, os termos "gene(s)", "polinucleotídeo", "seqüência de ácido nucleico", "seqüência de nucleotídeos", ou "molécula(s) de ácido nucleico" como aqui usados incluem RNA e DNA de fita simples ou dupla. Também incluem tipos conhecidos de modificações, por exemplo, metilação, "bloqueios", substituições de um ou mais nucleotídeos naturalmente ocorrentes por um análogo. Preferivelmente, a seqüência de DNA ou RNA da invenção compreende uma seqüência codificadora do polipeptídeo aqui definido.
Uma "seqüência codificadora" é uma seqüência de nucleotídeos, que é transcrita em mRNA e/ou traduzida em um polipeptídeo quando posta sob o controle das seqüências regulatórias apropriadas. Os limites da seqüência codificadora são determinados por um códon de iniciação de tradução na terminação-5' e um códon de terminação de tradução na terminação-31. Uma seqüência codificadora pode incluir, mas não é limitada a mRNA, cDNA, seqüências de nucleotídeos recombinantes ou DNA genômico, embora íntrons possam estar presentes igualmente sob certas circunstâncias.
Um(a) polinucleotídeo ou molécula de ácido nucleico "isolado(a)" está separado(a) de outros(as) polinucleotídeos ou moléculas de ácido nucleico, que estão presentes na fonte natural da molécula de ácido nucleico. Uma molécula de ácido nucleico isolada pode ser um fragmento cromossômico de vários kb, ou preferivelmente, uma molécula apenas compreendendo a região codificadora do gene. Conseqüentemente, uma molécula de ácido nucleico isolada da invenção pode compreender regiões cromossômicas, que são 5' e 3' adjacentes ou outras regiões cromossômicas adjacentes, mas preferivelmente não compreende tais seqüências que naturalmente flanqueiam a seqüência de molécula de ácido nucleico no contexto genômico ou cromossômico no organismo do qual a molécula de ácido nucleico se origina (por exemplo seqüências que são adjacentes às regiões codificadoras de 5'- e 3'-UTRs da molécula de ácido nucleico). Em várias modalidades, a molécula de ácido nucleico isolada usada no processo de acordo com a invenção pode, por exemplo compreender menos do que aproximadamente 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb ou 0,1 kb de seqüências de nucleotídeos que naturalmente flanqueiam a molécula de ácido nucleico no DNA genômico da célula da qual a molécula de ácido nucleico se origina.
Uma molécula de ácido nucleico incluindo uma seqüência completa das moléculas de ácido nucleico usadas no processo, por exemplo o polinucleotídeo da invenção, ou uma sua parte pode ser adicionalmente isolada por reação em cadeia da polimerase, iniciadores oligonucleotídeo baseados nesta seqüência ou em suas partes sendo usadas. Por exemplo, a molécula de ácido nucleico compreendendo a seqüência completa ou sua parte pode ser isolada por reação em cadeia da polimerase usando iniciadores oligonucleotídeo que têm sido gerados baseando-se nesta seqüência completa. Por exemplo, mRNA pode se isolado de células (por exemplo por intermédio do método de extração com tiocianato de guanidínio de Chirgwin et al. (1979) Biochemistry 18:5294-5299) e cDNA pode ser gerado por intermédio de transcriptase reversa (por exemplo transcriptase reversa de Moloney MLV, disponível da Gibco/BRL, Bethesda, MD, ou transcriptase reversa AMV, obtenível da Seikagaku America, Inc., St.Petersburg, FL).
Moléculas de ácido nucleico que são vantajosamente para o processo de acordo com a invenção podem ser isoladas baseando-se em sua homologia em relação às moléculas de ácido nucleico aqui descritas usando as seqüências ou sua parte como sonda de hibridização e segundo técnicas de hibridização padrão sob condições de hibridização estringentes. Neste contexto, é possível usar, por exemplo, moléculas de ácido nucleico isoladas de pelo menos 15, 20, 25, 30, 35, 40, 50, 60 ou mais nucleotídeos, de preferência de pelo menos 15, 20 ou 25 nucleotídeos em comprimento que hibridizam sob condições estringentes com as moléculas de ácido nucleico acima descritas, em particular com aquelas que incluem uma seqüência de nucleotídeos da molécula de ácido nucleico usada no processo da invenção ou codificadora de uma proteína usada na invenção ou da molécula de ácido nucleico da invenção. Moléculas de ácido nucleico com 30, 50, 100, 250 ou mais nucleotídeos também podem ser usadas.
As seqüências de ácido nucleico usadas no processo da invenção, que são mostradas no protocolo de seqüência em particular SEQ ID NO: 45, 47, 49, 51, 53 ou 55 são vantajosamente introduzidas em um construto de ácido nucleico, preferivelmente um cassete de expressão, que torna possível a expressão de moléculas de ácido nucleico em uma planta.
Conseqüentemente, a invenção também se refere a um construto de ácido nucleico, preferivelmente a um construto de expressão, compreendendo a molécula de ácido nucleico da presente invenção funcionalmente ligada em um ou mais sinais ou elementos regulatórios.
Como aqui descrito, o construto de ácido nucleico também pode compreender outros genes, que são para serem introduzidos nos organismos ou nas células. É possível e vantajoso introduzir nos, e expressar nos, organismos hospedeiros genes regulatórios tais como genes para indutores, repressores ou enzimas, que, devido à sua atividade enzimática, participam na regulação de um ou mais genes de uma rota biossintética. Estes genes podem ser de origem heteróloga ou homóloga. Além disso, outros genes de biossíntese podem estar vantajosamente presentes, ou então estes genes podem estar localizados em um ou mais outros construtos de ácido nucleico. Genes, que são vantajosamente empregados são genes, que influenciam o crescimento de plantas tais como fatores ou seqüências reguladores(as). Uma intensificação de elementos reguladores pode ocorrer vantajosamente em nível de transcrição pelo uso de sinais de transcrição tais como promotores e/ou intensificadores. Em adição, contudo, uma intensificação de tradução também é possível, por exemplo pelo aumento de estabilidade de mRNA ou pela inserção de uma seqüência intensificadora de tradução.
Em princípio, o construto de ácido nucleico pode compreender as seqüências reguladoras aqui descritas e outras seqüências relevantes para a expressão dos genes incluídos. Assim, o construto de ácido nucleico da invenção pode ser usado como cassete de expressão e portanto pode ser utilizado diretamente para introdução na planta, ou então podem ser introduzidos em um vetor. Conseqüentemente em uma modalidade o construto de ácido nucleico é um cassete de expressão compreendendo um promotor de microorganismo ou um terminador de microorganismo ou ambos. Em outra modalidade o cassete de expressão inclui um promotor de planta ou um terminador de planta ou ambos.
Para introduzir uma molécula de ácido nucleico em um construto de ácido nucleico, e.g. como parte de um cassete de expressão, o segmento de gene codogênico é vantajosamente submetido a uma reação de amplificação ou ligação na maneira conhecida por uma pessoa experiente na técnica. E preferido seguir um procedimento similar ao protocolo para uma Pfu DNA polimerase ou uma mistura de Pfu/Taq DNA polimerases. Os iniciadores são selecionados de acordo com a seqüência a ser amplificada. Os iniciadores devem ser expedientemente escolhidos em uma tal maneira que o amplificado compreenda a seqüência codogênica do códon de iniciação para o códon de terminação. Após a amplificação, o amplificado é expedientemente analisado. Por exemplo, a análise pode considerar qualidade e quantidade e ser realizada após separação por eletroforese em gel. Depois, o amplificado pode ser purificado seguindo um protocolo padrão (por exemplo Qiagen). Uma alíquota do amplificado purificado está então disponível para a etapa de clonagem subseqüente. O técnico experiente geralmente conhece vetores de clonagem adequados.
Incluem, em particular, vetores que são capazes de replicação em sistemas de clonagem fáceis de manusear como sistemas baseados em levedura bacteriana ou células de inseto (e.g. expressão em baculovírus), quer dizer especialmente vetores que garantem clonagem eficiente em E. coli, e que tornam possível a transformação estável de plantas. Vetores, que precisam ser mencionados, em particular são vários sistemas de vetor binário ou co-integrado, que são adequados para a transformação mediada por T- DNA. Tais sistemas de vetor são geralmente caracterizados pelo fato de conterem pelo menos os genes vir, que são exigidos para a transformação mediada por Agrobacterium, e as seqüências de borda de T-DNA.
Em geral, sistemas de vetor preferivelmente também compreendem outras regiões cis-regulatórias tais como promotores e terminadores e/ou marcadores de seleção por meio dos quais organismos adequadamente transformados podem ser identificados. Embora os genes vir e as seqüências de T-DNA estejam localizados no mesmo vetor no caso de sistemas de vetor co-integrado, sistemas binários são baseados em pelo menos dois vetores, um dos quais possui genes vir, mas não T-DNA, enquanto que um segundo tem T-DNA, mas não gene vir. Devido a este fato, os últimos vetores mencionados são relativamente pequenos, fáceis de manipular e capazes de replicação em E. coli e em Agrobacterium. Estes vetores binários incluem os vetores das séries pBIB-HYG, pPZP, pBecks, pGreen. Aqueles que são preferivelmente usados de acordo com a invenção são Bin 19, pBIlOl, pBinAR, pGPTV e pCAMBIA. Um resumo de vetores binários e seu uso é dado por Hellens et al., Trends in Plant Science (2000) 5, 446-451. Os vetores são preferivelmente modificados em uma tal maneira, que já contêm o ácido nucleico codificador do peptídeo de trânsito e que os ácidos nucleicos da invenção, preferivelmente as seqüências de ácido nucleico codificadoras dos polipeptídeos mostradas em tabela II, aplicação N- 1, colunas 5 e 7 podem ser clonados 3' iniciador da seqüência codificadora de peptídeo de trânsito, dando uma preproteína funcional, que é direcionada para os plastídeos e que significa que a proteína madura cumpre com sua atividade biológica.
Em um vetor de expressão recombinante, "ligação operável" significa que a molécula de ácido nucleico de interesse está ligada nos sinais regulatórios em uma tal maneira que é possível a expressão da molécula de ácido nucleico: são ligadas uma na outra em um tal modo que duas seqüências cumprem com a função predita atribuída à seqüência (por exemplo em um sistema de transcrição/tradução in-vitro, ou em uma célula hospedeira se o vetor for introduzido na célula hospedeira).
O termo porção como aqui definido refere-se a um pedaço de um DNA codificador de uma CDK, compreendendo pelo menos 300, 350, 400, 450 ou 500, preferivelmente 550, 600, 650 ou 700 nucleotídeos e cuja porção codifica um polipeptídeo tendo atividade de quinase dependente de ciclina, tendo um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE e tendo um sítio ativo da seguinte seqüência VLHRDLKPQNLLI, sendo que D é o resíduo catalítico predito e sendo que as seguintes modificações de dita seqüência podem ocorrer: posição 1: Val Phe; posição 6: Leu Met; posição 9: Gln Asn. Ademias, dita seqüência CDK pode ter vantajosamente um sítio de ligação de ATP do seguinte IGEGTYGWYRARDKVTNETIALK. Também, no sítio de ligação de ATP algumas mutações podem ocorrer. Elas são as seguintes: posição 11 Arg Lys; posição 12 Ala -> Gly, posição 13 Arg -> Leu, posição 15 Lys Arg e posição 16 Val Leu, Ala, Ser, Thr ou Asn.. Uma porção pode ser preparada, por exemplo, pela realização de uma ou mais deleções em um ácido nucleico CDK. As porções podem ser usadas em forma isolada ou podem ser íusionadas em outras seqüências codificadoras (ou não- codificadoras) com o propósito de, por exemplo, produzir uma proteína que combina várias atividades, uma delas sendo atividade de quinase dependente de ciclina. Quando fusionado em outras seqüências codificadoras, o polipeptídeo resultante produzido da tradução pode ser maior do que aquele predito para o fragmento de CDK. Preferivelmente, a porção funcional é uma porção de um ácido nucleico CDK, mais preferivelmente uma porção da molécula de ácido nucleico conforme representada por SEQ ID NO: 45, 47, 49,51,53 ou 55.
Os termos "fragmento", "fragmento de uma seqüência" ou "parte de uma seqüência", "porção" ou "sua porção" significam uma seqüência truncada da seqüência original mencionada. A seqüência trancada (seqüência de ácido nucleico ou proteína) pode variar amplamente em comprimento; o tamanho mínimo sendo uma seqüência de tamanho suficiente para obter uma seqüência com pelo menos uma atividade e/ou função comparável da seqüência original citada ou hibridizar com a molécula de ácido nucleico da invenção ou usada no processo da invenção sob condições estringentes, enquanto que o tamanho máximo não é crítico. Em algumas aplicações, o tamanho máximo normalmente não é substancialmente maior do que aquele exigido para proporcionar a atividade e/ou função(ões) da seqüência original.
Tipicamente, a seqüência de aminoácidos truncada variará de cerca de 5 a cerca de 310 aminoácidos em comprimento. Mais tipicamente, contudo, a seqüência terá um máximo de cerca de 250 aminoácidos em comprimento, preferivelmente um máximo de cerca de 200 ou 100 aminoácidos. É normalmente desejável a seleção de seqüências de pelo menos cerca de 10, 12 ou 15 aminoácidos, a até um máximo de cerca de 20 ou 25 aminoácidos.
Outra variante de uma molécula de ácido nucleico CDK é uma molécula de ácido nucleico capaz de hibridizar sob condições de estringência reduzida, preferivelmente sob condições estringentes, com uma molécula de ácido nucleico CDK como definida aqui antes, cuja seqüência de hibridização codifica um polipeptídeo CDK compreendendo os motivos acima mencionados. Preferivelmente, a seqüência de hibridização é uma que é capaz de hibridizar com a molécula de ácido nucleico de SEQ ID NO: 45, 47, 49, 51, 53 ou 55, ou com um ácido nucleico codificador de um dos homólogos mencionados acima, ou com uma porção de qualquer uma das seqüências acima citadas. Mais preferivelmente, a seqüência de hibridização é capaz de hibridizar com a molécula de ácido nucleico de SEQ ID NO: 45, 47, 49, 51, 53 ou 55.
O termo "hibridização" como aqui definido é um processo no qual seqüências de nucleotídeos complementares substancialmente homólogas anelam-se umas nas outras. O processo de hibridização pode ocorrer inteiramente em solução, i.e. ambos os ácidos nucleicos complementares estão em solução. O processo de hibridização também pode ocorrer com um dos ácidos nucleicos complementares imobilizado em uma matriz tal como glóbulos magnéticos, glóbulos de Sepharose ou qualquer outra resina. O processo de hibridização pode adicionalmente ocorrer com um dos ácidos nucleicos complementares imobilizado em um suporte sólido tal como uma membrana de nitrocelulose ou de náilon ou imobilizado e.g. por fotolitografia em, por exemplo, um suporte de vidro silicoso (o último também conhecido como microarranjos ou arranjos de ácido nucleico ou como pastilhas de ácido nucleico). Com o objetivo de permitir ocorrência de hibridização, as moléculas de ácido nucleico são geralmente térmica ou quimicamente desnaturadas para fusionar uma fita dupla em duas fitas únicas e/ou para remover grampos-de-cabelo ou outras estruturas secundárias dos ácidos nucleicos de fita única. A estringência de hibridização é influenciada por condições tais como temperatura, concentração de sal, força iônica e composição de tampão de hibridização.
"Condições hibridização estringentes" e "condições estringentes de lavagem em hibridização" no contexto de experimentos de hibridização de ácido nucleico hibridização tais como hibridizações de Southern e Northern são dependentes de seqüência são diferentes sob parâmetros ambientais diferentes. O técnico experiente está ciente dos vários parâmetros que podem ser alterados durante hibridização e lavagem e que quer manterão quer mudarão as condições de estringência.
A Tm é a temperatura sob força iônica e pH definidos, na qual 50% da seqüência alvo hibridiza com uma sonda perfeitamente combinada. A Tm é dependente das condições de solução e da composição de base e do comprimento da sonda. Por exemplo, seqüências mais longas hibridizam especialmente em temperaturas mais altas. A taxa de hibridização máxima é obtida de cerca de 16°C a até 32°C abaixo de Tm. A presença de cátions monovalentes na solução de hibridização reduz a repulsão eletrostática entre as duas fitas de ácido nucleico favorecendo deste modo a formação de híbrido; este efeito é visível para concentrações de sódio de até 0,4M.
Formamida reduz a temperatura de fusão de dúplices de DNA-DNA e DNA- RNA em 0,6 a 0,7°C para cada percentagem de formamida, e adição de formamida 50% permite que hibridização seja realizada a de 30 a 45°C, embora a taxa de hibridização seja abaixada Não-combinações de pares de bases reduzem a taxa de hibridização e a estabilidade térmica dos dúplices.
Em média e para sondas grandes, a Tm diminui cerca de 1°C por % de não- combinação de base. A Tm pode ser calculada usando as seguintes equações, dependendo dos tipos de híbridos:
• Híbridos de DNA-DNA (Meinkoth e Wahl, Anal. Biochem., 138: 267-284, 1984): Tm= 81,5°C + 16,6xlog[Na+]a + 0,41x%[G/Cb] - SOOxtLc]"1 - 0,61x% formamida
• Híbridos de DNA-RNA ou RNA-RNA: Tm= 79,8 + 18,5 (log10[Na+]a) + 0,58 (%G/Cb) + 11,8 (%G/Cb)2 - 820/Lc
• Híbridos de oligo-DNA ou oligo-RNAd: Para <20 nucleotídeos: Tm= 2 (/n) Para 20-35 nucleotídeos: Tm= 22 + 1,46 (/n)
a ou para outro cátion mono valente, mas apenas exato na faixa de 0,01-0,4 M.
h apenas exato para %GC na faixa de 30% a 75%.
cL = comprimento do duplex de pares de bases.
d Oligo, oligonucleotídeo; ln, comprimento efetivo de iniciador = (no. de G/C)+(no. de A/T).
Nota: para cada 1 % de formamida, a Tm é reduzida em cerca de 0,6 a 0,7°C, enquanto que a presença de uréia 6M reduz a Tm em cerca de 30°C.
Especificidade de hibridização é tipicamente a função de lavagens após hibridização. Para remover genótipo residual resultante de hibridização não específica, amostras são lavadas com soluções de sal diluídas. Fatores críticos de tais lavagens incluem a força iônica e a temperatura da solução de lavagem final: quanto menor a concentração de sal e maior a temperatura ambiente de lavagem, maior será a estringência de lavagem. Condições de lavagem são tipicamente realizadas em ou abaixo de estringência de hibridização. Geralmente, condições estringentes adequadas para ensaios de hibridização de ácido nucleico ou procedimentos de detecção de amplificação de gene são como descritas acima. Condições mais ou menos estringentes também podem ser selecionadas. Geralmente, condições de estringência baixa são selecionadas para serem cerca de 50°C mais baixas do que o ponto de fusão térmico (Tm) para a seqüência específica em um pH e em uma força iônica definidos. Condições de estringência média são quando a temperatura está 20°C abaixo de Tm, e condições de estringência alta são quando a temperatura está 10°C abaixo de Tm. Por exemplo, condições estringentes são aquelas que são pelo menos tão estringentes quanto, por exemplo, condições A-L; e condições de estringência reduzida são pelo menos tão estringentes quanto, por exemplo, condições M-R. Ligação não- específica pode ser controlada usando qualquer uma de numerosas técnicas conhecidas tais como, por exemplo, bloqueio da membrana com soluções contendo proteína, adições de RNA, DNA heterólogos, e SDS no tampão de hibridização, e tratamento com Rnase.
Exemplos de condições de hibridização e de lavagem são listadas em Tabela 1:
Tabela 1:
<table>table see original document page 42</column></row><table>
* O "comprimento do híbrido" é o comprimento previsto para o ácido nucleico hibridizando. Quando ácidos nucleicos de seqüência conhecida são hibridizados, o comprimento do híbrido pode ser determinado pelo alinhamento das seqüências e identificação das regiões conservadas aqui descritas.
T SSPE (lxSSPE é NaCl 0,15M, NaH2PO4 IOmM, e EDTA l,25mM, pH7,4) pode substituir SSC (1 xSSC é NaCl 0,15M e citrato de sódio 15mM) nos tampões de hibridização e lavagem; lavagens são realizadas por 15 minutos após completitude da hibridização. As hibridizações e lavagens podem adicionalmente incluir reagente de Denhard 5 x, SDS 0,5-1,0%, DNA de esperma de salmão fragmentado, desnaturado 100 μg/ml, pirofosfato de sódio 0,5%, e formamida até 50%.
* Tb-Tr: A temperatura de hibridização para híbridos previstos em serem menores do que 50 pares de base em comprimento deve ser 5-10°C mais baixa do que a temperatura de fusão Tm dos híbridos; a Tm é determinada de acordo com as equações mencionadas acima. ± A presente invenção também inclui a substituição de qualquer um, ou mais parceiros de híbrido de DNA ou RNA quer com um PNA3 quer com um ácido nucleico modificado.
Para os propósitos de definição do nível de estringência, referência pode ser convenientemente feita a Sambrook et ai. (2001) Molecular Cloning: a laboratoiy manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York ou a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989).
Após hibridização e lavagem, os dúplices podem ser detectados por auto-radiografia (quando sondas radiomarcadas foram usadas) ou por quimioluminescência, imunodetecção, por detecção fluorescente ou cromogênica, dependendo do tipo de marcação de sonsa. Alternativamente, um ensaio de proteção de ribonuclease pode ser realizado para detecção de híbridos RNA:RNA.
A molécula de ácido nucleico CDK ou sua variante pode ser derivada de qualquer planta ou fonte artificial. Este ácido nucleico pode ser modificado de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana deliberada. O ácido nucleico é de preferência de origem de planta, da mesma espécie de planta (por exemplo em relação a uma na qual é para ser introduzido) ou de uma espécie de planta diferente. O ácido nucleico pode ser isolado de uma espécie monocotiledônea, preferivelmente da família Poaceae, mais preferivelmente de Oryza sativa ou Zea mays. Mais preferivelmente, a CDK isolada de Oryza sativa é SEQ ID NO: 45 ou de Zea mays e é SEQ ID NO: 53. Em outra modalidade da invenção o ácido nucleico pode ser isolado de uma espécie dicotiledônea, preferivelmente da família Brassicaceae, Aceraceae, Linaceae ou Asteraceae adicionalmente preferivelmente de Brassica napus, Glycine max, Linum usitatissimum ou Helianthus annuus. Mais preferivelmente, a CDK isolada de Brassica napus é SEQ ID NO: 47, Glycine max é SEQ ID NO: 49, Linum usitatissimum é SEQ ID NO: 51 ou Helianthus annuus é SEQ ID NO: 55.
A atividade de um polipeptídeo CDK ou de um seu homólogo e/ou expressão de um ácido nucleico codificador de uma tal CDK pode ser modulada por introdução de uma modificação genético (preferivelmente no locus de um gene CDK). O locus de um gene como aqui definido é adotado para significar uma região genômica, que inclui o gene de interesse e 10 kb a montante ou a jusante da região codificadora.
A modificação genética pode ser introduzida, por exemplo, por qualquer um (ou mais) dos seguintes métodos: TILLING, mutagênese sítio- direcionada, evolução dirigida e recombinação homóloga ou por introdução e expressão em uma planta de um ácido nucleico codificador de um polipeptídeo CDK ou de um seu homólogo, cuja(o) CDK ou homólogo compreende um motivo como mencionado acima. Após introdução da modificação genética segue uma etapa de seleção da expressão aumentada de um ácido nucleico codificador de um polipeptídeo CDK com um motivo como mencionado acima e/ou seleção de atividade aumentada de dito polipeptídeo CDK, com aumento em expressão e/ou atividade dá plantas tendo características de crescimento melhoradas.
Uma modificação genética também pode ser introduzida no locus de um gene CDK usando a técnica de TILLING ("Targeted Induced Local Lesions In Genomes"). Esta é uma tecnologia de mutagênese útil para gerar e/ou identificar, e para eventualmente isolar variantes mutadas de uma molécula de ácido nucleico codificadora de uma CDK com seqüências como aqui mencionadas capazes de exibirem atividade de quinase dependente de ciclina. TILLING também permite seleção de plantas trazendo tais variantes mutantes. TILLING combina mutagênese de densidade alta com métodos de seleção de produtividade elevada. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei e Koncz (1992), em: C Koncz, N- H Chua, J Schell, eds, Methods in Arabidopsis Research. World Scientific, Singapore, pp 16-82; Feldmann et al., (1994) em: EM Meyerowitz, CR Somerville, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY5 pp 137-172; Lightner e Caspar (1998), em: J Martinez- Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação de DNA e agrupamento de indivíduos; (c) amplificação por PCR de uma região de interesse; (d) desnaturação e anelamento para permitir formação de heterodúplices; (e) DHPLC, onde a presença de um heteroduplex em um agrupamento é detectada como um pico extra no cromatograma; (f) identificação de indivíduo mutante; e (g) seqüenciamento do produto mutante de PCR. Métodos para TILLEsJG são bem conhecidos na técnica (McCallum Nature Biotechnol. 18, 455-457, 2000, Stemple Nature Rev. Genet. 5, 145-150, 2004).
Mutagênese sítio-direcionada pode ser usada para gerar variantes de ácido nucleicos CDK ou suas porções que retêm atividade (tal como atividade de quinase dependente de ciclina). Estão disponíveis vários métodos para realizar mutagênese sítio-direcionada, os mais comuns sendo métodos baseados em PCR (veja por exemplo Ausubel et al., Current Protocols in Molecular Biology. Wiley Eds. http://www,4ulr.com/products/currentprotocols/index.html).
Evolução dirigida também pode ser usada para gerar variantes de ácidos nucleicos CDK. Esta consiste de iterações de rearranjo de DNA seguidas por triagem e/ou seleção apropriada para gerar variantes de ácidos nucleicos CDK ou suas porções codificadores de polipeptídeos CDK ou seus homólogos ou suas porções tendo uma atividade biológica modificada (Castle et al., (2004) Science 304(5674): 1151-4; US 5,811,238 e US 6,395,547).
TILLING, mutagênese sítio-direcionada e evolução dirigida são exemplos de tecnologias que permitem a geração de novos alelos e variantes de CDK que retêm a função de CDK e que são portanto úteis nos métodos da invenção.
Recombinação homóloga permite a introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida. Recombinação homóloga é uma tecnologia padrão usada rotineiramente em ciência biológica para organismos inferiores tais como levedura ou o musgo Physcomitrella. Métodos para realizar recombinação homóloga em plantas têm sido descritos não apenas para plantas modelo (Offringa et ai. (1990) EMBO J. 9, 3077-3084) mas também para plantas de colheita, por exemplo arroz (Terada et al., (2002) Nature Biotechnol. 20, 1030-1034; ou lida e Terada (2004) Curr. Opin. Biotechnol. 15, 132-138). O ácido nucleico a ser selecionado (que pode ser uma molécula de ácido nucleico CDK ou sua variante como definido aqui acima) não precisa ser selecionado para o locus de um gene CDK, mas pode ser introduzido, por exemplo, nas regiões de expressão alta. O ácido nucleico a ser selecionado pode ser um alelo melhorado usado para substituir genes endógenos ou pode ser introduzido em adição ao gene endógeno.
Um método preferido para introdução de uma modificação genética (que neste caso não precisa estar no locus de um gene CDK) é introdução e expressão em uma planta de um ácido nucleico codificador de um polipeptídeo CDK, ou de um seu homólogo. Um polipeptídeo CDK ou um seu homólogo como mencionado acima, e adequado para praticar a presente invenção, é um tendo atividade de quinase dependente de ciclina e, em ordem crescente de preferência, tendo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de seqüência em relação à seqüência de aminoácidos representada por 46, 48, 50, 52, 54 ou 56, e cujo polipeptídeo CDK compreende um motivo como aqui descrito. O ácido nucleico a ser introduzido em uma planta pode ser uma porção ou uma seqüência de hibridização como definida aqui anteriormente.
"Homólogos" de uma proteína incluem peptídeos, oligopeptídeos, polipeptídeos, proteínas e enzimas tendo substituições, deleções e/ou inserções de aminoácido em relação à proteína não modificada em questão e tendo atividade biológica e funcional similar à da proteína não modificada da qual são derivados. Isto significa que têm um antepassado comum.
Estão incluídas no termo "homólogos" as seqüências parálogas e ortólogas, duas formas especiais de homologia, que incluem conceitos evolucionários usados para descrever relações ancestrais de genes. Preferivelmente ortólogos ou parálogos úteis na presente invenção têm as mesmas estrutura e atividade que as de uma CDK e têm a similaridade mais SEQ ID NO: 46, 48, 50, 52, 54 ou 56 em uma pesquisa BLAST recíproca.
O termo "parálogos" refere-se aos genes homólogos que resultam de uma ou mais duplicações de gene dentro do genoma de uma espécie. Parálogos de uma CDK podem ser facilmente identificados por realização de análise BLAST contra um conjunto de seqüências de mesma espécie que a seqüência em questão.
O termo "ortólogos" refere-se aos genes homólogos em organismos diferentes devido à relação antepassado destes genes. Ortólogos, por exemplo, em espécies de plantas monocotiledôneas ou dicotiledôneas podem ser facilmente encontrados pela realização de pesquisa blast recíproca. Esta pode ser feita por um primeiro blast envolvendo blasting da seqüência em questão (por exemplo, SEQ ID NO 45, 47, 49, 51, 53 ou 55, sendo de espécie monocotiledônea Oryza sativa ou Zea mays ou de espécie dicotiledônea Brassica napus, Glycine max, Linum usitatissimum ou Helianthus annuus) contra qualquer banco de dados de seqüências, tal como o banco de dados publicamente disponível NCBI que pode ser encontrado em: http://www.ncbi.nlm.nih.gov. BLASTn ou tBLASTX pode ser usado quando se começa dos nucleotídeos ou BLASTP ou TBLASTN quando se começa da proteína, com valores pré-estabelecidos padrão. Os resultados de blast podem ser filtrados. As seqüências de comprimento total quer de resultados filtrados quer de resultados não filtrados são então blasted de volta (segundo blast) contra as seqüências do organismo do qual a seqüência em questão é derivada, no caso Oryza sativa, Zea mays, Brassica napus, Glycine max, Linum usitatissimum ou Helianthus annuus. Os resultados dos primeiro e segundo blasts são então comparados. Um parálogo é identificado se um êxito de classificação alta do segundo blast for de mesma espécie que aquela da qual a seqüência em questão é derivada; um ortólogo é identificado se um êxito de classificação mais alta não for da mesma espécie que aquela da qual a seqüência em questão é derivada. Um tal parálogo ou ortólogo também é considerado um homólogo de CDK, desde que este homólogo compreenda um domínio de serina/treonina quinase e compreenda um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE. No caso de famílias grandes, ClustalW pode ser usado, seguido pela construção de uma árvore de junção de vizinhos, para ajudar a visualizar o agrupamento de genes relacionados e identificar ortólogos e parálogos.
Um homólogo pode estar na forma de uma "variante substituinte" de uma proteína, i.e. onde pelo menos um resíduo nem uma seqüência de aminoácidos tem sido removido e um resíduo diferente inserido em seu lugar. Substituições de aminoácido são tipicamente de resíduos únicos, mas podem ser agrupados dependendo das restrições funcionais aplicadas ao polipeptídeo; inserções normalmente serão da ordem de cerca de 1, 2, 3, 4 ou 5, preferivelmente 6, 7, 8, 9 ou 10 resíduos de aminoácido.
Preferivelmente, substituições de aminoácido compreendem substituições de aminoácido conservativas (Tabela 2). Para produzir tais homólogos, aminoácidos da proteína podem ser substituídos por outros aminoácidos tendo propriedades similares (tais como similares hidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ou quebrar estruturas α-helicoidais ou estruturas de folha-β). Tabelas de substituições conservativas são bem conhecidas na técnica (veja por exemplo Creighton (1984) Proteins. W.H. Freeman and Company). A variante substituinte útil nos métodos da presente invenção é uma variante substituinte de um polipeptídeo CDK e compreende um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE e os outros motivos acima mencionados.
Tabela 2: Exemplos de substituições de aminoácido conservativas:
<table>table see original document page 49</column></row><table>
Substituições menos conservativas podem ser feitas no caso de as propriedades dos aminoácidos acima mencionados não serem tão críticas.
Um homólogo também pode estar na forma de uma "variante de inserção" de uma proteína, i.e. onde um ou mais resíduos de aminoácido são introduzidos em um sítio predeterminado na proteína. Inserções podem compreender fusões amino-terminais e/ou carbóxi-terminais bem como inserções de intra-seqüência de único aminoácido ou de múltiplos aminoácidos. Geralmente, inserções dentro da seqüência de aminoácidos serão menores do que as fusões amino- ou carbóxi-terminais, da ordem de cerca de 1 a 10 resíduos. Exemplos de peptídeos ou proteínas de fusão amino- ou carbóxi-terminal incluem o domínio de ligação ou o domínio de ativação de um ativador de transcrição como usado no sistema bi-híbrido de levedura, proteínas de capa de fago, etiqueta (histidina)6, etiqueta glutationa S- transferase, proteína A, proteína ligante de maltose, di-hidro-folato-redutase, epitopo Tag-100, epitopo c-myc, epitopo FLAG®, lacZ, CMP (peptídeo ligante de calmodulina), epitopo HA, epitopo de proteína C e epitopo VSV. A variante de inserção útil nos métodos da presente invenção é uma variante de inserção de um polipeptídeo CDK e compreende os motivos aqui mencionados. Homólogos na forma de "variantes de deleção" de uma proteína são caracterizados pela remoção de um ou mais aminoácidos de uma proteína, e incluem fragmentos ativos.
Variantes de aminoácido de uma proteína podem ser prontamente preparadas usando técnicas de síntese de peptídeo bem conhecidas na técnica, tais como síntese de peptídeo em fase sólida e semelhante, ou por manipulações de DNA recombinante. Métodos para manipulação de uma seqüência de DNA para produzir variantes de substituição, inserção ou deleção de uma proteína são bem conhecidos na técnica. Por exemplo, técnicas para realizar mutações em sítios predeterminados em DNA são bem conhecidos por aqueles pessoas experientes na técnica e incluem mutagênese Ml 3, mutagênese T7-Gen in vitro (USB, Cleveland, OH), mutagênese Sitio-Direcionada QuickChange (Stratagene, San Diego, CA), mutagênese sítio-direcionada mediada por PCR ou outros protocolos de mutagênese sítio-direcionada.
O polipeptídeo CDK ou seu homólogo com um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE, também podem ser um derivado. "Derivados" incluem peptídeos, oligopeptídeos, polipeptídeos, proteínas e enzimas que podem compreender substituições, deleções ou adições de resíduos de aminoácido naturalmente e não-naturalmente ocorrentes comparados com a seqüência de aminoácidos de uma forma naturalmente ocorrente da proteína, por exemplo, como apresentado em seqüências 46, 48, 50, 52, 54 ou 56. "Derivados" de uma proteína incluem peptídeos, oligopeptídeos, polipeptídeos, proteínas e enzimas que podem compreender resíduos de aminoácido naturalmente ocorrentes alterados, glicosilados, acetilados ou não-naturalmente ocorrentes comparados com a seqüência de aminoácidos de uma forma naturalmente ocorrente da qual é derivado, por exemplo uma molécula repórter ou outro ligante, covalente ou não- covalentemente ligado na seqüência de aminoácidos, tal como uma molécula repórter que é ligada para facilitar sua detecção, e resíduos de aminoácido não-naturalmente ocorrentes em relação à seqüência de aminoácidos de uma proteína naturalmente ocorrente. O derivado útil nos métodos da presente invenção é um derivado de um polipeptídeo CDK, tendo a atividade biológica das CDKs e os motivos aqui mencionados.
As quinases do tipo CDK em plantas têm uma estrutura modular, consistindo de um lobo-N e um lobo-C compreendendo uma fenda catalítica e uma alça-T (De Bondt et al. 1993). Portanto, é imaginado que engenharia dos domínios da quinase em uma tal maneira que a atividade da proteína CDK é mantida ou modificada, pode resultar na criação de um mutante CDKA que é útil para realizar os métodos da invenção. Um tipo preferido de variante inclui aquelas geradas por deleção, empilhamento ou rearranjo de domínio (veja por exemplo He et al., Science 288, 2360-2363, 2000; ou patetes US 5.811.238 e 6.395.547), desde que a CDK resultante compreenda (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE, motivo central ativo e ligante de ATP.
O polipeptídeo CDK ou seu homólogo pode ser codificado por uma variante de união alternativa de uma molécula de ácido nucleico CDK ou gene. O termo "variante de união alternativa" como aqui usado inclui variantes de uma seqüência de ácido nucleico nas quais éxons e/ou íntrons selecionados têm sido excisados, substituídos ou adicionados. Tais variantes serão aquelas que codificam polipeptídeos que compreendem mutações e nas quais a atividade biológica da proteína é mantida, o que pode ser alcançado pela retenção seletiva de segmentos funcionais da proteína. Tais variantes de união podem ser encontradas em natureza ou podem ser preparadas. Métodos de preparação de tais variantes de união são bem conhecidas na técnica. Variantes de união preferidas são variantes de união derivadas do ácido nucleico representado por SEQ ID NO 45, 47, 49, 51, 53 ou 55. Mais preferidas são as variantes de união codificadoras de um polipeptídeo mantendo a atividade de quinase dependente de ciclina e tendo os motivos como aqui mencionados.
O homólogo também pode ser codificado por uma variante alélica de um ácido nucleico codificador de um polipeptídeo CDK ou de um seu homólogo, preferivelmente uma variante alélica do ácido nucleico representado por SEQ ID NO 45, 47, 49, 51, 53 ou 55, desde que o polipeptídeo codificado pela variante alélica tem atividade de quinase dependente de ciclina e compreende os motivos como mencionados acima.
Variantes alélicas existem na natureza, e o uso destes alelos naturais está incluído nos métodos da presente invenção. Variantes alélicas incluem Polimorfismos de Nucleotídeo Único (SNPs), bem como Polimorfismos de Inserção/Deleção Pequena (INDELs). O tamanho de INDELs é normalmente menor do que 100 pb. SNPs e INDELs formam o maior conjunto de variantes de seqüência em cepas polimórficas da maioria dos organismos.
De acordo com um aspecto preferido da presente invenção, é considerada a expressão intensificada ou aumentada da molécula de ácido nucleico CDK ou de sua variante de acordo com a invenção. Métodos para obter expressão intensificada ou aumentada (sobreexpressão) de genes ou de produtos de gene estão bem documentados na técnica e incluem, por exemplo, sobreexpressão conduzida por promotores apropriados, o uso de intensificadores de transcrição e de intensificadores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou intensificadores podem ser introduzidos em uma posição apropriada (tipicamente a montante) de uma forma não-heteróloga de modo a supra- regular a expressão de um ácido nucleico CDK ou de sua variante de acordo com a invenção. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Pat. U.S. Na 5,565,350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula de planta nas apropriadas orientação e distância de um gene modificado de acordo com a presente invenção de maneira a controlar a expressão do gene.
Se expressão de polipeptídeo é desejada, é geralmente desejável incluir uma região de poliadenilação na extremidade- 3' de uma região codificadora de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes de planta, ou de T-DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada de, por exemplo, os genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, ou menos preferivelmente de qualquer outro gene eucariótico.
Uma seqüência de íntron também pode ser adicionada na região não-traduzida 5' ou na seqüência codificadora da seqüência codificadora parcial para aumentar a quantidade da mensagem madura que acumula no citosol. Tem sido mostrado que a inclusão de um íntron editorável na unidade de transcrição em construtos de expressão tanto de planta quanto de animal aumenta a expressão de gene em ambos os níveis de mRNA e de proteína em até 1.000 vezes (Buchman e Berg, Mol. Cell Biol. 8, 4395-4405 (1988); Callis et al., Genes Dev. 1, 1183-1200 (1987)). Tal intensificação de íntron da expressão de gene é tipicamente mais elevada quando posicionada próxima da extremidade 5! da unidade de transcrição. São conhecidos na técnica os usos dos íntrons de milho: íntrons 1, 2, e 6 de Adhl-S, íntron Bronze-1. Veja geralmente, The Maize Handbook, Chapter 116, Freeling e Walbot, Eds., Springer, N.Y. (1994).
A invenção também proporciona construtos e vetores genéticos para facilitar a introdução e/ou a expressão das seqüências de nucleotídeos úteis nos métodos de acordo com a invenção.
Portanto, é proporcionado um construto de gene compreendendo:
(i) a molécula de ácido nucleico CDK ou sua variante funcional, cujo(a) ácido nucleico ou variante codifica uma CDK compreendendo motivo de sítio ativo e de ligação de ATP, (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE;
(ii) uma ou mais seqüência(s) de controle capaz(es) de conduzir expressão em uma planta de uma seqüência de ácido nucleico de (i); e opcionalmente
(iii) uma seqüência de terminação de transcrição.
Construtos úteis nos métodos de acordo com a presente invenção podem ser construídos usando tecnologia de DNA recombinante bem conhecida pelas pessoas experientes na técnica. Os construtos de gene podem ser inseridos em vetores, que podem ser comercialmente disponíveis, adequados para transformação em plantas e apropriados para expressão do gene de interesse nas células transformadas.
Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico CDK ou sua variante de acordo com a presente invenção). A seqüência de interesse é operacionalmente ligada em uma ou mais seqüências de controle (pelo menos em um promotor). Os termos "elemento regulatório", "seqüência(s) regulatória(s)", "seqüência de controle" e "promoter" são todos usados intercambiavelmente aqui e são para serem considerados em um contexto amplo para se referirem às seqüências regulatórias de ácido nucleico capazes de efetuarem expressão das seqüências nas quais são ligadas. Incluídas pelos termos acima mencionados estão as seqüências regulatórias de transcrição derivadas de um gene genômica eucariótico clássico (incluindo o box TATA que é exigido para iniciação de transcrição exata, com ou sem uma seqüência de box CCAAT) e elementos regulatórios adicionais (i.e. silenciadores, intensificadores e seqüências ativadoras a montante) que modulam expressão de gene em resposta aos estímulos desenvolventes e/ou externos, ou em uma maneira tecido- específica. Também está incluída dentro do termo uma seqüência regulatória de transcrição de um gene procariótico clássico, em cujo caso pode incluir uma seqüência de box -35 e/ou seqüências regulatórias de transcrição de box - 10. O termo "elemento regulatório" também inclui um derivado ou uma molécula de fusão sintética(o), que confere, ativa ou intensifica a expressão de uma molécula de ácido nucleico em uma célula, um tecido ou um órgão. O termo "operacionalmente ligado" como aqui usado refere-se a uma ligação funcional entre a seqüência de promotor e o gene de interesse, de tal modo que a seqüência de promotor é capaz de iniciar a transcrição do gene de interesse.
Seqüências regulatórias podem ser operacionalmente ligadas na seqüência codificadora de uma proteína transgênica ou endógena e controlam sua transcrição e/ou tradução ou a estabilidade ou deterioração do mRNA codificador ou da proteína expressada. Com o objetivo de modificar e controlar a expressão de uma seqüência codificadora seus elementos regulatórios tais como promotores, UTRs, sítios de união, sinais de processamento, sítios de poliadenilação, terminadores, intensificadores, indutores, repressores, sítios de modificação de pós-transcrição ou de pós- tradução podem ser modificados, adicionados ou emendados. As seqüências regulatórias incluem, em particular, seqüências de planta como os promotores e terminadores aqui descritos. Por exemplo, a ativação de genes de planta por integrações aleatórias de elementos intensificadores tem sido descrita por Hayashi et al., 1992 (Science 258:1350-1353) ou Weigel et al., 2000 (Plant Physiol. 122, 1003-1013) e outros aqui citados. Por exemplo, o nível de expressão da proteína endógena pode ser modulado por substituição do promotor endógeno por um promotor transgênico mais forte ou pela substituição de 3'UTR endógeno por um 3'UTR, que proporciona maior estabilidade sem emendar a região codificadora. Adicionalmente, a regulação de transcrição pode ser modulada pela introdução de um fator de transcrição artificial como descrito nos exemplos. Promotores, terminadores e UTR alternativos são descritos abaixo.
Seqüências regulatórias são intencionadas para permitir a expressão específica dos genes e a expressão de proteína. Dependendo da planta hospedeira, isto pode significar, por exemplo, que o gene é expressado e/ou sobreexpressado após indução apenas, ou que ele é expressado e/ou sobreexpressado constitutivamente. Estas seqüências regulatórias são, por exemplo, seqüências nas quais os indutores ou repressores se ligam e que portanto regulam a expressão do ácido nucleico. Em adição às seqüências regulatórias novas, ou em vez destas seqüências, a regulação natural destas seqüências ainda pode estar presente antes dos genes estruturais reais e, se apropriado, podem ter sido geneticamente modificadas de modo que a regulação natural tenha sido desligada e a expressão de gene tenha sido aumentada. Como uma regra, citadas seqüências regulatórias estão localizadas a montante (5'), dentro, e/ou a jusante (3') em relação à seqüência codificadora de uma seqüência de ácido nucleico, que deve ser expressada. Contudo, o construto de ácido nucleico (= cassete de expressão, construto de expressão ou construto de gene) usado no processo da invenção e aqui descrito também pode ser mais simples em construção, isto é sem sinais regulatórios adicionais tendo sido inseridos antes de uma seqüência de ácido nucleico ou seus derivados, e o promoter natural junto com sua regulação não tem sido removido. Em vez disso, a seqüência regulatória natural tem sido mutada em uma tal maneira que uma regulação não mais ocorre e/ou a expressão de gene é aumentada. Estes promotores modificados também podem ser introduzidos independentemente antes do gene natural na forma de seqüências de parte (= promotor com partes de uma seqüências de ácido nucleico de acordo com a invenção) com o propósito de aumentar a atividade. Além disso, o construto de gene também pode vantajosamente compreender uma ou mais do que é conhecido como seqüências intensificadoras em ligação operável com o promotor, e estas permitem uma expressão aumentada de uma seqüência de ácido nucleico. Também, é possível inserir seqüências vantajosas adicionais na extremidade 3' da seqüência de DNA, tais como, por exemplo, outros terminadores ou elementos regulatórios.
Seqüências regulatórias incluem sinais ou seqüências regulatórias de transcrição e tradução, e.g. seqüências localizadas a montante (5'), que concernem em particular a regulação de iniciação de transcrição ou de tradução, tais como promotores ou códons de iniciação, e seqüências localizadas a jusante (3'), que concernem em particular a regulação de terminação de transcrição ou de tradução e estabilidade de transcrito, tais como códons de terminação e sinais de poliadenilação. Seqüências regulatórias também podem estar presentes em regiões codificadoras transcritas bem como em regiões não-codificadoras transcritas, e.g. em íntrons, como por exemplo sítios de união, promotores para a regulação de expressão da molécula de ácido nucleico de acordo com a invenção em uma célula e que podem ser empregadas, em princípio, todas aquelas que são capazes de estimular a transcrição de genes nas plantas em questão.
A "seqüência codificadora" é uma seqüência de nucleotídeos, que é transcrita em mRNA e/ou traduzida em um polipeptídeo quando posta sob o controle de seqüências regulatórias apropriadas. Os limites da seqüência codificadora são determinados por um códon de iniciação de tradução na terminação-51 e um códon de terminação de tradução na terminação-3'. Uma seqüência codificadora pode incluir, mas não é limitada a mRNA, cDNA, seqüências de nucleotídeos recombinantes ou DNA genômico, enquanto que íntrons podem estar presentes também sob certas circunstâncias.
Os fatores ou as seqüências regulatórias, como descritos acima, possuem um efeito positivo sobre, a expressão dos genes introduzidos, aumentando assim a sua expressão. Portanto, uma intensificação da expressão pode vantajosamente ocorrer em nível de transcrição pelo uso de sinais de transcrição fortes tais como promotores fortes e/ou intensificadores fortes. Em adição, intensificação de expressão em nível de tradução também é possível, por exemplo pela introdução de seqüências intensificadoras de tradução, e.g., o intensificador Ω e.g. melhorando a ligação ribossômica no transcrito, ou pelo aumento da estabilidade do mRNA, e.g. pela substituição de região codificadora de 3'UTR por uma região codificadoras de uma 3'UTR conhecida em conferir uma estabilidade alta do transcrito ou por estabilização do transcrito através da eliminação de instabilidade de transcrito, de modo que a molécula de mRNA é traduzida mais freqüentemente do que a de tipo selvagem. Por exemplo em plantas elementos ricos em AU (AREs) e elementos DST (a jusante) desestabilizaram transcritos. Estudos de mutagênese têm demonstrado que resíduos dentro de dois dos domínios conservados, as regiões ATAGAT e GTA, são necessários para função de instabilidade. Portanto remoção ou mutação de tais elemento obviamente levaria a transcritos mais estáveis, taxas de transcrição maiores e atividade de proteína mais elevada. Intensificadores de tradução também são a "seqüência overdrive", que compreende a seqüência líder 5'-não-traduzida do vírus do mosaico do tabaco e que aumenta a razão de proteína/RNA (Gallie et al., 1987, Nucl. Acids Research 15:8693-8711).
Intensificadores são geralmente definidos como elementos ativos-cis, que podem estimular transcrição de gene independente de posição e orientação. Intensificadores diferentes têm sido identificados em plantas, que podem estimular transcrição constitutivamente, ou tecido ou estímulos específicos. Exemplos bem conhecidos de intensificadores constitutivos são o intensificador do promotor 35S (Odell et al., 1985, Nature 313:810-812) ou o intensificador ocs (Fromm et al., 1989, Plant Cell 1: 977:984). Outros exemplos são o tetrâmero de motivo de box-G que confere expressão constitutiva de nível alto em plantas dicotiledôneas e monocotiledôneas (Ishige et al., 1999, Plant Journal, 18, 443-448) ou petE, uma seqüência rica em A/T que atuam como intensificadores quantitativos de expressão de gene em plantas transgênicas batateira e tabaco (Sandhu et al., 1998; Plant Mol Biol. 37(5):885-96). Além disso, tem sido descrita uma grande variedade de elementos ativos-cis que contribuem para padrão de expressão específica, como expressão específica em órgão ou expressão induzida em resposta a estresse biótico ou abiótico. Exemplos são elementos, que proporcionam expressão induzida por ferimento ou patógeno (Rushton, 2002, Plant Cell, 14, 749-762) ou expressão específica em célula-guarda (Plesch, 2001, Plant Journal 28, 455-464).
Vantajosamente, qualquer tipo de promotor pode ser usado para conduzir a expressão de uma seqüência de ácido nucleico. O promotor pode ser um promotor induzível, i.e. tendo iniciação de transcrição induzida ou aumentada em resposta a um estímulo desenvolvente, químico, ambiental ou físico. Adicional ou alternativamente, o promotor pode ser um promotor constitutivo, i.e. um promotor que é expressado predominantemente em pelo menos um tecido ou um órgão e predominantemente em qualquer estágio de vida da planta. Adicional ou alternativamente, o promotor pode ser um promotor preferido de tecido ou preferido de célula, i.e. um que é capaz de preferivelmente iniciar transcrição em certos tecidos, tais como as folhas, raízes, tecido de semente etc., ou até mesmo em células específicas. Promotores capazes de iniciar transcrição apenas em certos tecidos são respectivamente aqui chamados de "tecido-específicos", e "célula- específicos".
Promotores adequados, que são funcionais nestas plantas, são geralmente conhecidos. Podem tomar a forma de promotores constitutivos ou induzíveis. Promotores adequados podem ser capazes de expressão desenvolvente e/ou tecido-específica em eucariotos multicelulares; assim, promotores folha-, raiz-, flor-, semente-, estorna-, tubérculo- ou fruta- específicos podem ser vantajosamente usados em plantas.
Promotores de planta diferentes utilizáveis em plantas são promotores tais como, por exemplo, o promotor USP, o promotor LegB4-, o promotor DC3 ou o promotor de ubiquitina de salsa.
Um promotor de "planta" compreende elementos regulatórios, que medeiam a expressão de um segmento de seqüência codificadora em células de planta. Conseqüentemente, um promotor de planta não precisa ser de origem de planta, mas pode se originar de vírus ou microorganismos, em particularmente por exemplo de vírus que atacam células de planta.
O promotor de "planta" também pode se originar de uma célula de planta, e.g. da planta, que é transformada com uma seqüência de ácido nucleico a ser expressada no processo da invenção e aqui descrita. Isto também se aplica a outros sinais regulatórios de "planta", por exemplo em terminadores de "planta".
Para expressão em plantas, a molécula de ácido nucleico precisa, como descrito acima, estar ligada operacionalmente em ou compreender um promotor adequado que expressa o gene no instante de tempo certo e em uma maneira célula- ou tecido-específica. Promotores utilizáveis são promotores constitutivos (Benfey et al., EMBO J. 8 (1989) 2195-2202), tais como aqueles que se originam de vírus de planta, tais como 35S CAMV (Franck et al., Cell 21 (1980) 285-294), 19S CaMV (veja também US 5352605 e WO 84/02913), 34S FMV (Sanger et al., Plant. Mol. Biol., 14, 1990: 433-443), o promotor de ubiquitina de salsa, ou promotores de planta tais como o promotor de subunidade pequena Rubisco descritos em US 4.962.028 ou um promotor plantum PRPl [Ward et al., Plant. Mol. Biol. 22 (1993)], SSU, PGELl, OCS [Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553-2557], lib4, usp, mas [Cornai (1990) Plant Mol Biol 15 (3):373-381], STLS1, ScBV (Schenk (1999) Plant Mol Biol 39(6):1221-1230), B33, SADl ou SAD2 (promotores de linho, Jain et al., Crop Science, 39 (6), 1999: 1696- 1701) ou nos [Shaw et al. (1984) Nucleic Acids Res. 12(20):7831-7846], Outros exemplos de promotores constitutivos de planta são os promotores de V-ATPase de beterraba (WO 01/14572). Exemplos de promotores constitutivos sintéticos são o promotor Super (WO 95/14098) e promotores derivados de boxes-G (WO 94/12015). Se apropriados, promotores induzíveis por compostos químicos também podem ser adicionalmente usados, comparar EP-A 388186, EP-A 335528, WO 97/06268. Expressão constitutiva, estável das proteínas de acordo com a invenção de uma planta pode ser vantajosa. Contudo, expressão induzível do polipeptídeo da invenção é vantajosa, se uma expressão tardia antes da colheita for vantajosa, porque manipulação metabólica pode levar à retardação de crescimento de planta.
A expressão de genes de planta também pode ser facilitada via um promotor induzível por composto químico (para uma revisão, veja Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108). Promotores quimicamente induzíveis são particularmente adequados quando for desejado expressar o gene em uma maneira tempo-específica. Exemplos de tais promotores são um promotor induzível por ácido salicílico (WO 95/19443), e promotor induzível por ácido abscísico (EP 335 528), um promotor induzível por tetraciclina (Gatz et al. (1992) Plant J. 2, 397-404), um promotor induzível por ciclo-hexanol ou etanol (WO 93/21334) ou outros como aqui descrito.
Outros promotores adequados são aqueles que reagem às condições de estresse biótico ou abiótico, por exemplo o promotor de gene PRPl induzido por patógeno (Ward et al., Plant. Mol. Biol. 22 (1993) 361- 366), o promotor hsp80 de tomateiro induzível por calor (US 5.187.267), o promotor de alfa-amilase de batateira induzível por frio (WO 96/12814) ou o promotor pinll induzível por ferimento (EP-A-0 375 091) ou outros como aqui descrito.
Promotores preferidos são em particular aqueles que conduzem expressão de gene em tecidos e órgãos, em células de semente, tais como células de endosperma e células do embrião em desenvolvimento. Promotores adequados são o promotor de gene de napina de colza de semente oleosa (US 5.608.152), the Vicia faba USP promotor (Baeumlein et al., Mol Gen Genet, 1991, 225 (3): 459-67), o promotor de oleosina de Arabidopsis (WO 98/45461), o promotor de faseolina de Phaseolus vulgaris (US 5.504.200), o promotor Bce4 de Brassica (WO 91/13980), o promotor arc5 de feijão, o promotor DcG3 de cenoura, ou o promotor de Legumina B4 (LeB4; Baeumlein et al., 1992, Plant Journal, 2 (2): 233-9), e promotores que conduzem a expressão semente-específica em plantas monocotoledôneas tais como milho, cevada, trigo, centeio, arroz e semelhante. Promotores semente- específicos vantajosos são o promotor de proteína ligante de sacarose (WO 00/26388), o promotor de faseolina e o promotor de napina. Promotores adequados que precisam ser considerados são o promotor de gene lpt2 ou Iptl de cevada (WO 95/15389 e WO 95/23230), e os promotores descritos em WO 99/16890 (promotores do gene de hordeína de cevada, o gene de glutelina de arroz, o gene de orizina de arroz, o gene prolamina de arroz, o gene de gliadina de trigo, o gene de glutelina de trigo, o gene de zeína de milho, o gene de glutelina de aveia, o gene de casirina de sorgo e o gene de secalina de centeio). Outros promotores adequados são Amy32b, Amy 6-6 e Aleurain [US 5.677.474], Bce4 (colza de semente oleosa) [US 5.530.149], glicinina (soja) [EP 571.741], fosfoenolpiruvato carboxilase (soja) [JP 06/62870], ADRl2-2 (soja) [WO 98/08962], isocitrato liase (colza de semente oleosa) [US 5.689.040] ou α-amilase (cevada) [EP 781.849]. Outros promotores que estão disponíveis para a expressão de genes em plantas são promotores folha- específicos tais como aqueles descritos em DE-A 19644478 ou promotores luz-regulados tais como, por exemplo, o promotor petE de ervilha.
Outros promotores de planta adequados são o promotor FBPase citosólico ou o promotor ST-LSI de batateira (Stockhaus et al., EMBO J. 8, 1989, 2445), O promotor de fosfo-ribosil-pirofosfato amidotransferase de Glycine max (N~ de Acesso no GenBank de U87999) ou o promotor nodo-específico descrito em EP-A-0.249.676.
Preferivelmente, o ácido nucleico CDK ou sua variante de acordo com a invenção é operacionalmente ligado em um promotor broto- específico. O termo "broto-específico" como aqui definido refere-se a um promotor que é expressado predominantemente no broto e em qualquer estágio na vida da planta. O termo "broto" como aqui usado inclui todas as partes aéreas da planta, incluindo caules e galhos, folhas, botões de flor, órgãos reprodutivos, incluindo estruturas derivadas de broto tais como estolhos, cormos, rizomas ou tubérculos. Preferivelmente, o promotor broto- específico capaz de preferencialmente expressar o ácido nucleico em todo o broto é um promotor fraco. Padrão de expressão e/ou força de promotor pode ser analisado por exemplo por copulação do promotor em um gene repórter e ensaiando a expressão do gene repórter em vários tecidos da planta. Um gene repórter adequado bem conhecido pelas pessoas experientes na técnica é beta- glicuronidase. Padrão de expressão e/ou força de promotor pode ser comparado com aquele de um promotor de referência broto-específico bem caracterizado, tal como o promotor Cab27 (expressão fraca, GenBank AP004700), ou o promotor de protoclorofilida redutase putativa (expressão forte, GenBank AL606456). Referência a um "promotor fraco" indica um promotor que conduz a expressão de uma seqüência codificadora em um nível baixo, a saber em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos, a cerca de 1/5.000.000 transcritos por célula. De modo inverso, um "promotor forte" conduz a expressão de uma seqüência codificadora em um nível alto, ou a cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1.000 transcritos por célula. Mais preferivelmente, o promotor capaz de preferencialmente expressar o ácido nucleico em toda a planta é um promotor de metalotioneína de arroz. Deve ficar claro que a aplicabilidade da presente invenção não é restrita aos ácidos nucleicos CDK como representados no protocolo de seqüência, preferivelmente como representados em SEQ ID NO: 45, 47, 49, 51, 53 ou 55.
Opcionalmente, uma um mais seqüências de terminador também podem ser usadas no construto introduzido em uma planta. O termo "terminador" inclui uma seqüência de controle que é uma seqüência de DNA na extremidade de unidade de transcrição que sinaliza processamento 3' (atrás do códon de terminação) e poliadenilação de um transcrito primário e terminação de transcrição. Um terminador, que pode ser usado no processo da invenção é, por exemplo, o terminador OCS1, o terminador nos3 ou o terminador 35S. Como é o caso com os promotores, seqüências de terminador diferentes devem ser usadas para cada gene. Terminadores, que são úteis em microorganismos são por exemplo o terminador fimA, terminador txn ou terminador trp. Tais terminadores também podem ser rho-dependentes ou rho- independentes. Elementos regulatórios adicionais podem incluir intensificadores de transcrição e de tradução. Aqueles pessoas experientes na técnica estão cientes das seqüências de terminador e intensificador que podem ser adequadas para uso na realização da invenção. Tais seqüências seriam conhecidas ou poderiam ser prontamente obtidas por uma pessoa experiente na técnica.
Os construtos genéticos da invenção podem adicionalmente incluir uma origem de seqüência de replicação, que é exigida para manutenção e/ou replicação em um tipo de célula específico. Um exemplo é quando um construto de gene é exigido para ser mantido em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, fl-ori e colEl.
Para a detecção e/ou seleção da transferência bem sucedida de uma seqüências de ácido nucleico como representada no protocolo de seqüência e usada no processo da invenção, é vantajoso usar genes marcadores (=genes repórter). Estes genes marcadores permitem a identificação de uma transferência bem sucedida das moléculas de ácido nucleico via uma série de princípios diferentes, por exemplo via identificação visual com o auxílio de fluorescência, luminescência ou na faixa de comprimento de ondas de luz que é discernível para o olho humano, por uma resistência aos herbicidas ou antibióticos, via o que são conhecidos como marcadores nutritivos (marcadores auxotrofismo) ou marcadores antinutritivos, via ensaios de enzima ou via fito-hormônios. Exemplos de tais marcadores que podem ser mencionados são GFP (= proteína fluorescente verde); o sistema de luciferina/luciferase , a β-galactosidase com seus substratos coloridos, por exemplo X-Gal, as resistências a herbicida, por exemplo, imidazolinona, glifosato, fosfinotricina ou sulfonil-uréia, as resistências a antibióticos, por exemplo, a bleomicina, higromicina, estreptomicina, canamicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina, para mencionar apenas uns poucos, marcadores nutritivos tal como a utilização de manose ou xilose, ou marcadores antinutritivos tal como a resistência a 2- desóxi-glicose. Esta lista é um número pequeno de marcadores possíveis. O técnico experiente está muito familiarizado com tais marcadores. Marcadores diferentes são preferidos, dependendo do organismo e do método de seleção.
Portanto o construto genético pode opcionalmente compreender um gene marcador selecionável. Como aqui usado, o termo "marcador selecionável ou gene marcador selecionável" inclui qualquer gene, que confere um fenótipo a uma célula na qual ele é expressado para facilitar a identificação e/ou seleção de células que são transfectadas ou transformadas com um construto de ácido nucleico da invenção. Exemplos de genes marcadores selecionáveis codificadores de proteínas que conferem resistência a antibióticos (tais como nptll que fosforila neomicina e canamicina, ou hpt, fosforilação de higromicina), a herbicidas (por exemplo bar que proporciona resistência a Basta; aroA ou gox proporcionando resistência contra glifosato), ou genes que proporcionam uma feição metabólica (tal como manA que permite que as plantas usem manose como única fonte de carbono). Genes codificadores de proteínas marcadoras visuais resultam na formação de cor (por exemplo β-glicuronidase, GUS), luminescência (tal como luciferase) ou fluorescência (Proteína Fluorescente Verde, GFP, e seus derivados).
É sabido da integração transiente ou estável de ácidos nucleicos em células de planta que apenas uma minoria das células captura DNA estranho e, se desejado, o integra em seu genoma, dependendo do vetor de expressão usado e da técnica de expressão utilizada. Para identificar e selecionar estes integrantes, um gene codificador de um marcador selecionável (como descrito acima, por exemplo resistência a antibióticos) é normalmente introduzido nas células hospedeiras junto com o gene de interesse. Marcadores selecionáveis preferidos em plantas compreendem aqueles, que conferem resistência a um herbicida tal como glifosato ou glifosinato. Outros marcadores adequados são, por exemplo, marcadores que codificam genes envolvidos em rotas biossintéticas de, por exemplo, açúcares ou aminoácidos, tais como β-galactosidase, ura3 ou ilv2. Marcadores, que codificam genes tais como luciferase, gfp ou outros genes de fluorescência, são igualmente adequados. Estes marcadores e os marcadores acima mencionados podem ser usados em mutantes nos quais estes genes não são funcionais porque, por exemplo, têm sido deletados por métodos convencionais. Adicionalmente, moléculas de ácido nucleico, que codificam um marcador selecionável, podem ser introduzidas em uma célula hospedeira no mesmo vetor que aqueles, que codificam os polipeptídeos da invenção ou usadas no processo ou então em um vetor separado. Células que têm sido transfectadas estavelmente com o ácido nucleico introduzido podem ser identificadas por exemplo por seleção (por exemplo células que têm integrado o marcador selecionável sobrevivem enquanto que as outras células morrem).
Visto que os genes marcadores, como uma regra especificamente o gene para resistência aos antibióticos e aos herbicidas, não são mais exigidos ou são indesejados em célula hospedeira transgênica uma vez os ácidos nucleicos tendo sido introduzidos com sucesso, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente utiliza técnicas que permitem a remoção, ou excisão, destes genes marcadores. Um tal método é o que é conhecido como cotransformação. O método de cotransformação usa dois vetores simultaneamente para a transformação, um vetor possuindo o ácido nucleico de acordo com a invenção e um segundo possuindo o(s) gene(s) marcador(es). Uma proporção grande dos transformantes recebe ou, no caso de plantas, compreende (até 40% dos transformantes e acima), ambos vetores. No caso de transformação com Agrobactérias, os transformantes normalmente recebem apenas uma pare do vetor, a seqüência flanqueada pelo T-DNA, que normalmente representa o cassete de expressão. Os genes marcadores podem ser subseqüentemente removidos da planta transformada por realização de cruzamentos. Em outro método, genes marcadores integrados em um transposon são usados para a transformação juntos com o ácido nucleico desejado (conhecido como a tecnologia Ac/Ds technology). Os transformantes podem ser cruzados com um recurso de transposase ou os transformantes são transformados com um construto de ácido nucleico que confere expressão de uma transposase, transientemente ou estável. Em alguns casos (aprox. 10%), o transposon pula para fora do genoma da célula hospedeira uma vez tendo ocorrido a transformação com sucesso e é perdido. Em outros casos numerosos, o transposon pula para uma localização diferente. Nestes casos, o gene marcador precisa ser eliminado por realização de cruzamentos. Em microbiologia, oram desenvolvidas técnicas que tornam possível, ou facilitam, a detecção de tais eventos. Um outro método vantajoso baseia-se no que são conhecidos como sistemas de recombinação; cuja vantagem é que eliminação por cruzamento pode ser abolida. O sistema melhor conhecido deste tipo é o que é conhecido como o sistema Cre/lox. Crel é uma recombinase, que remove as seqüências localizadas entre as seqüências IoxP. Se o gene marcador estiver integrado entre as seqüências IoxP, ele é removido, uma vez tendo ocorrido com sucesso a transformação, pela expressão da recombinase. Outros sistemas de recombinação são os sistemas HIN/KX, FLP/FRT e REP/STB (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Uma integração sítio-específica em um genoma de planta de uma seqüências de ácido nucleico de acordo com a invenção é possível. Naturalmente, estes métodos também podem ser aplicados aos microorganismos tais como levedura, fungos ou bactérias.
A presente invenção também inclui plantas ou células de planta obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto proporciona plantas ou células de planta obteníveis pelo método de acordo com a presente invenção, cujas plantas ou células de planta têm introduzido nelas um ácido nucleico CDK ou sua variante, codificador de uma CDK compreendendo motivo de sítio ativo e de ligação de ATP, (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE como aqui descrito.
A invenção também proporciona um método para a produção de células de planta transgênicas ou plantas transgênicas tendo características de crescimento melhoradas, compreendendo introdução e expressão em uma planta de um ácido nucleico CDK ou a sua variante, codificador de uma CDK que compreende motivo de sítio ativo e de ligação de ATP, (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE como aqui descrito.
Mais especificamente, a presente invenção proporciona um método para a produção de plantas transgênicas tendo características de crescimento melhoradas, cujo método compreende:
(i) introduzir em uma planta ou célula de planta um ácido nucleico codificador de uma CDK ou de um seu homólogo; e
(ii) cultivar uma célula de planta sob condições promotoras de crescimento e desenvolvimento de planta.
O ácido nucleico pode ser diretamente introduzido em uma célula de planta ou em uma própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com um aspecto preferido da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.
Os termos "transformação" ou "introdução" como aqui referidos incluem a transferência de um polinucleotídeo exógeno em uma célula hospedeira, independente do método usado para transferência. Tecido de planta capaz de subseqüente propagação clonal, quer por organogênese quer por embriogênese, pode ser transformado com um construto genético da presente invenção e uma planta inteiro pode ser regenerada do mesmo. O tecido particular escolhido variará dependendo dos sistemas de propagação clonal disponíveis, e melhor adaptados para, a espécie particular sendo transformada. Alvos de tecido exemplares incluem discos de folha, pólen, embriões, cotilédones, hipocótilos, megagametófitos, tecido de calo, tecido meristemático existente (e.g., meristema apical, botões auxiliares, e meristemas de raiz), e tecido de meristema induzido) (e.g., meristema de cotilédone e meristema de hipocótilo). O polinucleotídeo pode ser transiente ou estavelmente introduzido em uma célula hospedeira e pode ser mantido não-integrado, por exemplo, como um plasmídeo. Alternativamente, pode ser integrado no genoma hospedeiro. A célula de planta transformada pode ser então usada para regenerar uma planta transformada em uma maneira conhecida pelas pessoas experientes na técnica.
A transferência de genes estranhos para dentro do genoma de uma planta é chamada de transformação. Assim fazendo os métodos descritos para a transformação e a regeneração de plantas a partir de tecidos de planta ou de células de planta são utilizados para transformação transiente ou estável. Um método de transformação vantajoso é a transformação em planta. Para este fim, é possível, por exemplo, permitir que agrobactéria atue sobre sementes de planta ou inocular um meristema de planta com Agrobactérias.
Tem se mostrado particularmente expediente de acordo com a invenção permitir que uma suspensão de agrobactérias transformadas atue sobre planta intacta ou pelo menos outros estágios iniciais de flor. A planta é subseqüentemente crescida até que as sementes da planta tratada sejam obtidas (Clough e Bent, Plant J. (1998) 16, 735-743). Para selecionar plantas transformadas, um material de planta obtido na transformação é, como uma regra, submetido às condições seletivas de modo que plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas na maneira descrita acima podem ser plantadas e, após um período de crescimento inicial, submetida a uma seleção adequada por pulverização. Uma outra possibilidade consiste em crescimento das sementes, se apropriado após esterilização, sobre placas de ágar usando um agente de seleção adequado de modo que apenas as sementes transformadas possam crescer em plantas. Outros métodos de transformação vantajosos, em particular para plantas, são conhecidos pelo técnico experiente e são descritos aqui abaixo.
Transformação de espécie de planta é agora uma técnica bastante rotineira. Vantajosamente, qualquer um dos vários métodos de transformação podem ser usados para introduzir o gene de interesse em um vetor antepassado adequado. Métodos de transformação incluem o uso de lipossomos, eletroporação, compostos químicos que aumentam a captação de DNA livre, injeção de DNA diretamente na planta, bombardeio por canhão de partículas, transformação usando vírus ou pólen ou microprojeção. Métodos podem ser selecionados do método de cálcio/poli(etileno-glicol) para protoplastos (Krens et al. (1982) Nature 296, 72-74; Negrutiu et al. (1987) Plant Mol. Biol. 8, 363-373); eletroporação para protoplastos (Shillito et al. (1985) Bio/Technol 3, 1099-1102); microinjeção em material de planta (Crossway et al. (1986) Mol. Gen. Genet. 202, 179-185); bombardeio de partícula revestida com DNA ou RNA (Klein et al. (1987) Nature 327, 70) infecção com vírus (não-integrativo) e semelhante. Plantas transgênicas expressando uma CDK de acordo com a presente invenção são preferivelmente produzidas via transformação mediada por Agrobacterium usando qualquer um dos métodos bem conhecidos por exemplo para transformação de Brassica, feijão-soja, milho ou arroz, tais como descritos em qualquer um dos seguintes: pedido de patente européia publicada EP 1198985 Al, Aldemita e Hodges (Planta 199, 612-617, 1996); Chan et al. (Plant Mol. Biol. 22, 491-506, 1993), Hiei et al. (Plant J. 6, 271-282, 1994), cujas descrições são aqui incorporadas como referências se totalmente descritas. No caso de transformação de milho, o método preferido é como descrito em Ishida et al. (Nature Biotechnol. 14, 745-50, 1996) ou Frame et al. (Plant Physiol. 129, 13-22, 2002), cujas descrições são aqui incorporadas como referências se totalmente descritas. Ditos métodos são adicionalmente descritos por meio de exemplo em B. Jenes et al., Techniques for Gene Transfer, em: Transgenic Plants, Vol. 1, Engineering e Utilization, eds. S.D. Kung e R. Wu, Academic Press (1993) 128-143 e em Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225). O ácidos nucleicos ou o construto a serem expressados é preferivelmente clonado em um vetor, que é adequado para transformação de Agrobacterium tumefaciens, por exemplo pBinl9 (Bevan et al., Nucl. Acids Res. 12 (1984) 8711). Agrobactérias transformadas por um tal vetor podem ser então usadas em maneira conhecida para a transformação de plantas, em particular de plantas de colheita tais como por exemplo plantas de tabaco, por exemplo, pelo banho de folhas esmagadas ou folhas cortadas em uma solução agrobacteriana e então pelo cultivo delas em meios adequados. A transformação de plantas por meio de Agrobacterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzer em Nucl. Acid Res. (1988) 16, 9877 ou é conhecida inter alia de F.F. White, Vectors for Gene Transfer in Higher Plants; em Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung e R. Wu, Academic Press, 1993, pp. 15-38.
Geralmente após transformação, células de planta ou agrupamentos de células de planta são selecionadas para a presença de um ou mais marcadores que são codificados por genes expressáveis em planta co- transferidos com gene de interesse, após o qual o material transformado é regenerado em uma planta inteira.
Como mencionado Agrobactérias transformadas com um vetor de expressão de acordo com a invenção também pode ser usado na maneira por si conhecida para a transformação de plantas tais como plantas experimentai como plantas Arabidopsis ou de colheita, tais como, por exemplo, cereais, milho, aveia, centeio, cevada, trigo, soja, arroz, algodoeiro, beterraba, canola, girassol, linho, cânhamo, batateira, tabaco, tomateiro, cenoura, pimentões, colza de semente oleosa, tapioca, mandioca, araruta, tagetes, alfafa, alface e as várias árvores, nogueiras, e espécies de parreira, em particular plantas de colheita contendo óleo tais como soja, amendoim, planta de óleo de rícino, girassol, milho, algodoeiro, linho, colza de semente oleosa, coqueiro, palma oleosa, cártamo (Carthamus tinctorius) ou amêndoas de cacau, por exemplo, pelo banho de folhas ou segmentos de folha escarificados em uma solução agrobacteriana e subseqüentemente crescimento delas em meios adequados.
Em adição à transformação de células somáticas, que então têm que ser regeneradas em plantas intactas, também é possível transformar as células de meristemas de planta e em particular aquelas células que desenvolvem em gametas. Neste caso, os gametas transformados seguem o desenvolvimento natural da planta, originando as plantas transgênicas. Assim, por exemplo, sementes de Arabidopsis são tratadas com Agrobactérias e sementes são obtidas das plantas desenvolventes das quais uma certa proporção é transformada e assim transgênica (Feldman, KA e Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua e J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289). Métodos alternativos são baseados na remoção repetida das inflorescências e incubação do sítio de excisão no centro do invólucro de flor composta com Agrobactérias transformadas, pelo qual sementes transformadas podem ser igualmente obtidas em um instante de tempo posterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Contudo, um método especialmente eficaz é o método de infiltração a vácuo com suas modificações tal como o método de "banho floral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sob pressão reduzida são tratadas com uma suspensão agrobacteriana (Bechthold, N (1993). C R Acad Sci Paris Life Sci, 316: 1194-1199), enquanto que no caso do método de "banho floral" o tecido floral desenvolvente é incubado brevemente com uma suspensão agrobacteriana tratada com tensoativo (Clough, SJ und Bent, AF (1998). The Plant J. 16, 735-743). Uma certa proporção de sementes transgênicas é colhida em ambos os casos, e estas sementes podem ser distinguidas de sementes não-transgênicas pelo crescimento sob as condições seletivas descritas acima. Em adição a transformação estável de plastídeos é vantajosa porque plastídeos são maternalmente herdados na maioria das colheitas reduzindo ou eliminando o risco de fluxo de transgene através de pólen. A transformação do genoma de cloroplasto é geralmente realizada por um processo, quantidade efetiva tem sido esquematicamente exibido em Klaus et al., 2004 (Nature Biotechnology 22(2), 225-229). Resumidamente as seqüências a serem transformadas são clonadas juntas com um gene marcador selecionável entre seqüências flanqueadoras homólogas ao genoma de cloroplasto. Estas seqüências flanqueadoras homólogas conduzem integração sítio-específica para dentro do plastoma. Transformação plastidal tem sido descrita para muitas espécies diferentes de planta e um resumo pode ser obtido de Bock (2001) "Transgenic plastids in basic research and plant biotechnology". J Mol Biol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) "Progress towards commercialization of plastid transformation technology". Trends Biotechnol. 21, 20-28. Progresso biotecnológico adicional tem sido recentemente relatado em forma de transformantes de plastídeo livres de marcador, que podem ser produzidos por um gene marcador cointegrado transiente (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).
As células de planta geneticamente modificadas podem se regeneradas via todos os métodos com os quais um técnico experiente está familiarizado. Métodos adequados podem ser encontrados nas publicações acima mencionadas de S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
Após transferência de DNA e regeneração, as plantas putativamente transformadas podem ser avaliadas. Análise de Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativa ou genomicamente, níveis de expressão de DNA recém introduzido podem ser monitorados usando análise de Northern e/ou Western, ambas técnicas bem conhecidas pelas pessoas tendo experiência ordinária na técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como por propagação clonal ou técnicas de geração clássicas. Por exemplo, a planta transformada de primeira geração (ou T1) pode ser fertilizada para dar transformantes homozigóticos de segunda geração (ou T2), e as plantas T2 são posteriormente propagadas através de técnicas de geração clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, podem ser quimeras de células transformadas e células não-transformadas; transformantes clonais (e.g., todas células transformadas para conterem o cassete de expressão); enxertos de tecidos transformados e não-transformados (e.g., em plantas, um rizoma transformado enxertado em um rebento não-transformado).
A presente invenção claramente se estende a qualquer planta ou célula de planta produzida ou obtenível por qualquer um dos métodos aqui descritos, e a todas as plantas e seus propágulos A presente invenção se estende adicionalmente para incluir a progênie de uma célula, tecido, órgão ou planta inteira primária transformada ou transfectada que tem sido produzida por quaisquer métodos acima mencionados, a única exigência sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) como aquelas produzidas na planta parental pelos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo um ácido nucleico CDK isolado de planta ou sua variante, codificador de uma CDK compreendendo as características aqui descritas. Células hospedeiras preferidas de acordo com a invenção são células de planta.
A invenção também se estende às partes capazes de serem colhidas de uma planta de acordo com a invenção tais como mas não limitadas a sementes, folhas, flores, caules, rizomas, tubérculos e bulbos. A invenção adicionalmente se refere aos produtos derivados, preferivelmente diretamente derivados, de uma parte capaz de ser colhida de uma tal planta, tal como pós ou pétalas secas, óleo, gordura e ácidos graxos, amido e proteínas.
A presente invenção adicionalmente inclui o uso de um gene CDK e da proteína codificada para melhorar as características de crescimento de plantas; tais características de crescimento melhoradas são como definidas aqui acima.
A presente invenção também inclui o uso de ácidos nucleicos CDK ou suas variantes, e ao uso de polipeptídeos CDK ou seus homólogos, cuja CDK ou cujo homólogo compreende motivo de sítio ativo e de ligação de ATP, (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE como aqui descrito, ou cujo ácido nucleico CDK ou variante codifica uma tal proteína. Um tal uso refere-se ao melhoramento de características de crescimento de plantas, em particular ao melhoramento de rendimento, especialmente de rendimento de sementes. O rendimento de sementes pode incluir qualquer um ou mais dos seguintes: número total de sementes aumentado, número aumentado de sementes cheias, peso de semente aumentado, índice de colheita aumentado, dentre outros.
Ácidos nucleicos CDK ou suas variantes, ou polipeptídeos CDK ou seus homólogos, podem encontrar uso em programas de geração nos quais um marcador de DNA é identificado o qual pode ser geneticamente ligado em um gene CDK ou sua variante. A CDK ou suas variantes, ou CDKA ou seus homólogos, pode ser usada para definir um marcador molecular. Este marcador de DNA ou proteína pode ser então usado em programas de geração para selecionar plantas tendo características de crescimento melhoradas. O gene CDK ou sua variante pode, por exemplo, ser um ácido nucleico como representado no protocolo de seqüência preferivelmente como representado em SEQ ID NO: 45, 47, 49, 51, 53 ou 55, ou um ácido nucleico codificador de qualquer um dos homólogos como aqui definido.
Variantes alélicas de uma CDK também podem encontrar uso em programas de geração auxiliados por marcador. Tais programas de geração algumas vezes exigem a introdução de variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode iniciar com uma coleção de variantes alélicas de denominada origem "natural" não intencionalmente. Identificação de variantes alélicas então ocorrem por, por exemplo, PCR. Esta é seguida por uma etapa de seleção para seleção de variantes alélicas superiores da seqüência em questão e que dá características de crescimento melhoradas em uma planta. Seleção tipicamente realizada por monitoração de desempenho de crescimento de plantas contendo variantes alélicas diferentes da seqüência em questão por exemplo, variantes alélicas de SEQ ID NO: 45, 47, 49, 51, 53 ou 55, ou de ácidos nucleicos codificadores de qualquer um dos homólogos acima mencionados. Desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Outras etapas opcionais incluem cruzamento de plantas, nas quais a variante alélica foi identificada, com outra planta. Isto poderia ser usado, por exemplo, para preparar uma combinação de características fenotípicas interessantes.
Ácidos nucleicos CDK ou suas variantes de acordo com a invenção também podem ser usados como sondas para genética e fisicamente mapear os genes dos quais são uma parte, e como marcadores para feições ligadas àqueles genes. Tal informação pode ser útil em geração de planta com o propósito de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos CDK ou suas variantes requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos em comprimento. Os ácidos nucleicos CDK ou suas variantes podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots de DNA genômico de planta digerido por enzima de restrição podem ser sondados com os ácidos nucleicos CDK ou suas variantes. Os padrões de banda resultantes podem ser então submetidos às análises genéticas usando programas de computador tal como MapMaker (Lander et al. (1987) Genomics 1, 174-181) com o objetivo de construir um mapa genético. Em adição, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando pais e progênie de um cruzamento definido. Segregação dos polimorfismos de DNA é anotada e usada para calcular a posição do ácido nucleico CDK ou sua variante no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32,314-331).
A produção e o uso de sondas derivadas de gene de planta para uso em mapeamento genético são descritos em Bernatzky e Tanksley (Genetics 112, 887-898, 1986). Numerosas publicações descrevem mapeamento genético de clones de cDNA específicos usando a metodologia descrita acima ou suas variações. Por exemplo, populações de intercruzamento F2, populações de retro-cruzamento, populações aleatoriamente acasaladas, linhagens isogênicas próximas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles pessoas experientes na técnica.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., posicionamento de seqüências sobre mapas físicos; veja Hoheisel et al. em: Nonmammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e as referências lá citadas).
Em outra modalidade, as sondas de ácido nucleico podem ser usadas em mapeamento de hibridização in sito com fluorescência direta (FISH) (Trask (1991) Trends Genet. 7, 149-154). Embora métodos correntes de FISH favoreçam o uso de clones grandes (várias a várias centenas de kb; veja Laan et al. (1995) Genome Res. 5, 13-20), melhoramentos em sensibilidade podem permitir execução de mapeamento de FISH usando sondas mais curtas.
Uma variedade de métodos de mapeamento genético e físico baseados em amplifícação de ácido nucleico podem ser realizados usando os ácidos nucleicos. Exemplos incluem amplifícação alelo-específíca (Kazazian (1989) J. Lab. Clin. Med. 11, 95-96), polimorfismo de fragmentos amplificador por PCR (CAPS; Sheffield et al. (1993) Genomics 16, 325-332), ligação alelo-específíca (Landegren et al. (1988) Science 241, 1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18, 3671), Mapeamento de Híbridos por Radição (Walter et al. (1997) Nat. Genet. 7, 22-28) e Happy Mapping (Dear e Cook (1989) Nucleic Acid Res. 17, 6795- 6807). Para estes métodos, a seqüência e um ácido nucleico é usada para planejar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. O planejamento de tais iniciadores é bem conhecido por aqueles pessoas experientes na técnica. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar as diferenças de seqüência de DNA entre os pais do cruzamento de mapeamento na região correspondendo à presente seqüência de ácido nucleico. Isto, contudo geralmente não é necessário para métodos de mapeamento.
Nesta maneira, podem ser realizadas geração, identificação, e/ou isolamento de plantas melhoradas com atividade modulada de quinase dependente de ciclina exibindo características de crescimento melhoradas.
Ácidos nucleicos CDK ou suas variantes ou polipeptídeos CDK ou seus homólogos de acordo com a presente invenção também podem encontrar uso como reguladores de crescimento. Visto que tem sido mostrado que estas moléculas são úteis no melhoramento de características de crescimento de plantas, também seriam reguladores de crescimento úteis, tais como herbicidas ou estimuladores de crescimento. A presente invenção portanto proporciona uma composição compreendendo uma CDK ou sua variante ou um polipeptídeo CDK ou seu homólogo, junto com um veículo, diluente ou excipiente adequado, para uso como um regulador de crescimento, cuja(o) CDK ou homólogo compreende o motivo de sítio ativo e de ligação de ATP, (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE como aqui descrito, ou cuja CDK ou variante codifica tal proteína.
Os métodos de acordo com a presente invenção resultam em plantas tendo características de crescimento melhoradas, como descrito aqui anteriormente. Estas características de crescimento vantajosas também podem ser combinadas com outras feições economicamente vantajosas, tais como outras feições intensificadoras de rendimento, tolerância aos vários estresses, feições modificadoras de várias características arquitetônicas e/ou características bioquímicas e/ou fisiológicas.
Descrição das figuras
A presente invenção agora será descrita com referência às seguintes figuras nas quais:
Fig. 1 mostra o vetor EG073qcz, que também é representado no protocolo de seqüência como SEQ ID NO: 57.
Fig. 2 mostra o vetor EG065qcz, que também é representado no protocolo de seqüência como SEQ ID NO: 58.
Fig. 3 mostra o vetor pMME0607, que também é representado no protocolo de seqüência como SEQ ID NO: 59.
Fig. 4 mostra as seqüências de vetor de EG073qcz, EG065qcz e pMME0607, que também são representadas no protocolo de seqüência como SEQ ID NO: 57 a 59.
Outras modalidades da invenção são:
O uso de uma seqüência de ácido nucleico de acordo com a invenção ou do construto de ácido nucleico de acordo com a invenção para a geração de plantas transgênicas.
Exemplos
A presente invenção agora será descrita com referência aos seguintes exemplos, que são apenas como via de ilustração.
Manipulação de DNA: a não ser que seja enunciado de outra maneira, técnicas de DNA recombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols (http://www,4ulr.com/products/currentprotoeols/index.html). Métodos e materiais padrão para trabalho molecular de planta são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
Exemplo 1: Clonagem de gene
SEQ ID NO: 45 pode ser clonada nos plasmídeos pBR322 (Sutcliffe, J.G. (1979) Proc. Natl Acad. Sei. USA, 75: 3737-3741); pACYC177 (Change & Cohen (1978) J. Bacteriol. 134: 1141-1156); plasmídeos da série pBS (pBSSK+, pBSSK- e outros; Stratagene, LaJolla, USA) ou cosmídeos tal como SuperCosl (Stratagene, LaJolla5 USA) ou Loristó (Gibson, T.J. Rosenthal, A., e Waterson, R.H. (1987) Gene 53: 283- 286) para expressão em E. coli usando procedimentos bem estabelecidos, conhecidos (veja, por exemplo, Sambrook, J. et al. (1989) "Molecular Cloning: A Laboratory Manual". Cold Spring Harbor Laboratory Press ou Ausubel, F.M. et al. (1994) "Current Protocols in Molecular Biology", John Wiley & Sons).
Exemplo 2: Seqüenciamento de DNA e análise funcional computadorizada
O DNA foi seqüenciado por procedimentos padrão, em particular pelo método de determinação de cadeia, usando seqüenciadores ABI377 (veja, por exemplo, Fleischman, R.D. etal. (1995) "Whole-genome Random Sequencing and Assembly of Haemophilus Influenzae Rd.", Science 269; 496-512.
Exemplo 3: Transferência de DNA entre microorganismos diferentes tais como Escherichia coli e Agrobacterium tumefaciens
Vetores bifuncionais tais como pYE22m, pPAC-ResQ, pClasper, pAUR224, pAMHIO, pAMLIO, pAMTIO, pAMUlO, pGMHIO, pGMLIO, pGMTIO, pGMUlO, pPGALl, pPADHl, pTADHl, pTAex3, pNGA142, pHT3101 e seus derivados que permitem a transferência de seqüências de ácido nucleico entre microorganismos diferentes estão disponíveis para o técnico experiente. Um método fácil para isolar tais vetores bifiincionais é descrito por Soni R. e Murray J.A.H. [Nucleic Acid Research, vol. 20 no. 21, 1992: 5852]: se necessário tais vetores bifuncionais podem ser construídos facilmente usando vetores padrão para E. coli (Sambrook, J. et al., (1989), "Molecular Cloning: A Laboratory Manual", Cold Spring Harbor Laboratory Press ou Ausubel, F.M. et al. (1994) "Current Protocols in Molecular Biology", John Wiley & Sons) e/ou os vetores acima mencionados, que têm uma origem de replicação para, e marcador adequado de, Escherichia coli ou Agrobacterium tumefaciens adicionados. Tais origens de replicação são preferivelmente obtidas de plasmídeos endógenos, que têm sido isolados de espécies usadas para a produção de plantas usadas no processo da invenção. Genes, que são usados em particular como marcadores de transformação para estas espécies são genes para resistência à canamicina (tais como aqueles que se origina do transposon Tn5 ou Tn-903) ou para resistência a cloranfenicol (Winnacker, E.L. (1987) "From Genes to Clones - Introduction to Gene Technology", VCH, Weinheim) ou para outros genes de resistência a antibiótico tais como para resistência a G418, gentamicina, neomicina, higromicina ou tetraciclina.
Usando métodos padrão, é possível clonar um gene de interesse em um dos vetores bifuncionais acima descritos e introduzir tais vetores híbridos nas cepas de microorganismo usadas no processo da invenção.
Exemplo 4: Determinação da expressão de proteína mutante / transgênica
As observações da atividade de uma proteína mutada, ou transgênica, em uma célula hospedeira transformada são baseadas no fato de que a proteína é expressada em uma maneira similar e em uma quantidade similar à da proteína de tipo selvagem. Um método adequado para determinar a quantidade de transcrição do gene mutante, ou transgênico (um sinal para a quantidade de mRNA que está disponível para a tradução do produto de gene) é realizado por um Northern blot (veja, por exemplo, Ausubel et ai., (1988) Current Protocols in Molecular Biology, Wiley: New York), onde um iniciador que está planejado em uma maneira que se liga no gene de interesse é obtido com um marcador detectável (normalmente um marcador radioativo ou quimioluminescente) e modo que, quando o RNA total de uma cultura do organismo é extraído, separado sobre um gel, aplicado em uma matriz estável e incubado com esta sonda, a ligação e a quantidade da ligação da sonda indicam a presença e também a quantidade de mRNA para este gene. Outro método é uma PCR quantitativa. Esta informação detecta a extensão na qual o gene tem sido transcrito. RNA celular total pode ser isolado por exemplo de leveduras ou E. coli por uma variedade de métodos, que são conhecidos na técnica, por exemplo com o kit Ambion de acordo com as instruções do fabricante ou como descrito em Edgington et ai., Promega Notes Magazine Number 41, 1993, p. 14.
Técnicas padrão, tal como Western blot, podem ser empregadas para determinar a presença ou quantidade relativa de proteína traduzida deste mRNA (veja, por exemplo, Ausubel et al. (1988) "Current Protocols in Molecular Biology", Wiley, New York). Neste método, proteínas celulares totais são extraídas, separadas por eletroforese em gel, transferidas para uma matriz tal como nitrocelulose e incubadas com uma sonda, tal como um anticorpo, que se liga especificamente na proteína desejada. Esta sonda é normalmente proporcionada direta ou indiretamente com um marcador quimioluminescente ou colorimétrico, que pode ser detectado prontamente. A presença e a quantidade observada de marcador indicam a presença e a quantidade da proteína mutante almejada na célula. Contudo, também outros métodos também são conhecidos.
Exemplo 5: Crescimento de microorganismo geneticamente modificado: meios e condições de cultura Microorganismos geneticamente modificados tal como Escherichia coli podem ser crescidos em meios de crescimento sintéticos ou naturais conhecidos pelo técnico experiente. Numerosos meios de crescimento diferentes para microorganismos tal como Escherichia coli são bem conhecidos e estão amplamente disponíveis.
Exemplo 6: Transformação de Agrobactérias
Plasmídeos podem ser transformados em Agrobacterium tumefaciens (GV3101pMP90; Koncz e Schell5 1986, Mol. Gen. Genet. 204: 383-396) usando protocolos de choque calorífico e ou eletroporação. Colônias transformadas podem ser crescidas sobre meio YEP e selecionadas por anticorpos respectivos (Rif7Gent/Km) por 2d a 28°C. Estas culturas de Agrobacterium foram usadas para transformação de planta.
Arabidopsis thaliana pode ser crescida e transformada de acordo com condições padrão Bechtold 1993 (Bechtold, N., Ellis, J., Pelletier, G. 1993, em "plant Agrobacterium mediated gene transfer by infiltration of Arabidopsis thaliana plants" C.R. Acad.Sci.Paris. 316:1194-1199); Bent et al. 1994 (Bent, A., Kunkel, B.N., Dahlbeck, D., Brown, K.L., Schmidt, R., Giraudat, J., Leung, J., e Staskawicz, B.J. 1994; "PPCS2 of Arabidopsis thaliana: A leucin-rich repeat class of plant disease resistant genes"; Science 265: 1856-1860).
Plantas A. thaliana transgênicas podem ser crescidas individualmente em potes contendo uma mistura 4:1 (v/v) de solo e areia de quartzo em uma câmara de crescimento York. Condições de crescimento padrão são: fotoperíodo de 16 h de luz e 8 h de escuro, 20°C, 60% de umidade relativa, e uma densidade de fluxo de fótons de 150 μΕ. Para induzir germinação, sementes semeadas são mantidas a 4°C, no escuro, por 3 dias. Plantas são regadas diariamente até estarem com aproximadamente 3 semanas de idade em cujo momento estiagem é imposta pelo fechamento da água. Paralelamente, a umidade relativa foi reduzida em incrementos de 10% a cada dois dias para 20%. As plantas podem ser ensaiadas para crescimento melhorado sob ditas condições.
Em geral é útil conduzir os ditos experimentos em três experimentos independentes sucessivos. No primeiro experimento, 10 linhagens T2 independentes devem ser semeadas para cada gene sendo testado. A percentagem de planta não mostrando sintomas visuais de lesão é determinada. No segundo experimento as linhagens positivas devem ser então confirmadas em um procedimento experimental idêntico. Em um terceiro experimento, pelo menos 7 linhagens positivas devem ser então confirmadas em um procedimento experimental idêntico. Em um terceiro experimento, pelo menos 7 replicados das melhores linhagens mostrando crescimento melhorado devem ser então de novo confirmados.
Em um outro experimento, para linhagens maiores individuais, outras linhagens contendo o mesmo construto de gene, mas resultantes de um evento de transformação diferente devem ser de novo testadas. Todos os resultados são resumidos e analisados.
Exemplo 6: Construção de vetor e transformação de arroz
Para a expressão em arroz um vetor tal como aqueles mostrados em Figuras 1 a 4 contendo o cassete de expressão SEQ ID NO: 60 é útil. No citado vetor SEQ ID NO: lcomo mostrado em protocolo de seqüência pode ser introduzido. Dito vetor pode ser transformado na cepa LBA4404 de Agrobacterium e subseqüentemente em plantas Oryza sativa. Plantas de arroz transformadas são permitidas crescer e são então examinadas para os parâmetros descritos em Exemplo 7.
Exemplo 7: Avaliação de transformantes: medições de crescimento
Aproximadamente 15 a 20 transformantes TO independentes são comumente gerados. Os transformantes primários são transferidos de câmaras de cultura de tecido para uma estufa para crescimento e colhidos de semente TL São retidos quatro eventos dos quais a progênie Tl segregou 3:1 para presença/ausência do transgene. Para cada um destes eventos, 10 mudas T1 contendo o transgene (hetero- e homo-zigotos), e 10 mudas T1 faltantes de transgene (nulizigotos), são selecionadas por seleção de marcador visual. As plantas T1 selecionadas são transferidas para uma estufa. Cada planta recebeu um rótulo de código de barras único para claramente ligar os dados de fenotipificação à planta correspondente. As plantas T1 selecionadas são crescidas sobre solo em potes de diâmetro de 10 cm sob as condições ambientais: fotoperíodo = 11,5 h, intensidade de luz de dia = 30,000 lux ou mais, temperatura durante o dia = 28°C ou mais alta, temperatura durante a noite = 22°C, umidade relativa = 60-70%. As plantas transgênicas e os nulizigotos correspondentes são crescidos lado a lado em posições aleatórias.
Do estágio de semeadura até o estágio de maturidade as plantas são passadas várias vezes através de uma cabina de imagem digital. Em cada instante de tempo imagens digitais (2048x1536 pixéis, 16 milhões de cores) são tiradas de cada planta de pelo menos 6 ângulos diferentes.
As panículas primárias maduras são colhidas, ensacadas, rotuladas com código de barras e então secas por três dias no forno a 37°C.
As panículas são então debulhadas e todas as sementes colhidas. As cascas cheias são separadas das vazias usando um dispositivo de sopro de ar. Após separação, ambos os lotes de semente são então contados usando uma máquina contadora comercialmente disponível. As cascas vazias são jogadas fora. As cascas cheias são pesadas em uma balança analítica e a área de seção transversal das sementes foi medida usando imagem digital. Este procedimento resulta no conjunto de parâmetros relacionados com semente descritos abaixo.
Estes parâmetros são derivados em um modo automático das imagens digitais usando programa de computador de análise de imagem e são analisados estatisticamente. Uma ANOVA (análise de variância) de dois fatores é corrigida para o planejamento desequilibrado e é usada como modelo estatístico para a avaliação total das características fenotípicas de planta. Um teste-F é realizado sobre todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com aquele gene. O teste-F é realizado para checar um efeito do gene, também aqui chamado de um "efeito de gene global". Se o valor do teste-F mostra que os dados são significativos, então é concluído que há um efeito de "gene", significando que não apenas a presença ou a posição do gene causa o efeito. O limite para significância para um efeito de gene global verdadeiro é ajustado em nível de probabilidade de 5% para o teste-F.
Para checar um efeito dos genes dentro de um evento, i.e., para um efeito linhagem-específico, um teste-t é realizado dentro de cada evento usando conjuntos de dados das plantas transgênicas e das plantas nulas correspondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" referem-se às plantas tratadas na mesma maneira que a planta transgênica, mas da qual o transgene tem sido segregado. Plantas nulas também podem ser descritas como as plantas transformadas negativas homozigóticas. O limite para significâncias para o teste-t é ajustado em um nível de probabilidade de 10%. Os resultados para alguns dos eventos podem estar acima ou abaixo deste limite. Isto é baseado na hipótese de que um gene poderia apenas ter um efeito em certas posições no genoma, e que a ocorrência deste efeito dependente de posição não é incomum. Este tipo de efeito de gene é também aqui chamado de um "efeito de linhagem do gene". O valor-p é obtido por comparação do valor-t com a distribuição-t ou alternativamente, por comparação de valor-F com a distribuição-F. O valor-p então dá a probabilidade na qual a hipótese nula (i.e., não há efeito do transgene) está correta.
Os dados obtidos no primeiro experimento são confirmados em um segundo experimento com plantas T2. Três linhagens são selecionadas para análise adicional. Bateladas de sementes das plantas positivas (de hetero- e homo-zigotos) em T1, são selecionadas por monitoração da expressão de marcador. Para cada evento escolhido, as bateladas de sementes heterozigóticas são então retidas para avaliação T2. Dentro de cada batelada de semente um número igual de plantas positivas e negativas é crescido na estufa para avaliação.
Um número total de 120 plantas transformadas é avaliado na geração T2, isto é 40 plantas por evento das quais 20 são positivas para o transgene e 20 negativas.
Devido ao fato de serem realizados dois experimentos com eventos sobrepostos, uma análise combinada foi conduzida. Esta é útil para checar a consistência dos efeitos sobre os dois experimentos, e se este for o caso, para acumular evidência de ambos os experimentos com o propósito de aumentar a confiança na conclusão. O método usado é uma abordagem de modelo misto que leva em consideração a estrutura de múltiplos níveis dos dados (i.e. experimento - evento - segregantes). Valores-p são obtidos por comparação do teste de razão de probabilidade com distribuições de qui- quadrado.
Exemplo 8: Avaliação de transformantes: medição de parâmetros relacionados com rendimento
Com a análise das sementes descrita acima, os inventores são capazes de verificar que as plantas transformadas com o construto de gene CDK codificador de uma CDK com os motivos aqui mencionados têm um número aumentado de sementes cheias, um peso total aumentado de sementes e um índice de colheita aumentado comparadas com as plantas faltantes do transgene CDK.
Resultados positivos são obtidos para plantas na geração T1 e são de novo obtidos na geração T2. Estes dados T2 são reavaliados em uma análise combinada com os resultados para a geração T1, e os valores-p obtidos mostram que os efeitos observados são significativos. Número de sementes cheias
O número de sementes cheias é determinado pela contagem do número de cascas cheias que permanecem após a etapa de separação. Tipicamente 3 das 4 linhagens testadas estão mostrando um aumento significativo em números de sementes cheias.
Rendimento total de sementes
O rendimento total de sementes (peso total de sementes) por planta é medido pela pesagem de todas as cascas cheias colhidas de uma planta. Tipicamente 3 das 4 linhagens Tl transgênicas estão mostrando um aumento no peso total de sementes.
Indice de colheita
O índice de colheita na presente invenção é aqui definido como a razão entre o peso total de sementes e a área acima do solo (mm2), multiplicada por um fator de 10^6. Todas as linhagens testadas estão mostrando um índice de colheita aumentado.
Adicionalmente, há uma tendência geral para um número total de sementes aumentado.
Exemplo 9: Cultura de planta para análises bioanalíticas
Para análises bioanalíticas das plantas transgênicas, as últimas são crescidas como descrito acima.
Exemplo 10: Análise metabólica de plantas transgênicas
As modificações identificadas de acordo com a invenção são identificadas pelo seguinte procedimento:
a) Homogeneização das amostras
Homogeneização das amostras é realizada usando um moinho de bolas (Retsch). Dez a trinta grãos de arroz são transferidos para dentro de tubos plásticos (Eppendorf, Safe-Lock, 2 mL) e homogeneizados com uma bola de aço inoxidável sob esfriamento com nitrogênio líquido.
b) Liofilização Durante o experimento, cuidado é tomado para que as amostras quer permaneçam no estado profundamente congelado (temperaturas <-40°C) quer estejam livres de água por liofilização do material homogeneizado até o primeiro contato com solventes.
As amostras são transferidas para secador por congelamento pré-esfriado (- 40°C). A temperatura inicial durante a fase de secagem principal é -35°C e a pressão é 12 Pa. Durante a fase de secagem, os parâmetros são alterados seguindo um programa de pressão e temperatura. A temperatura final após 12 horas é +30°C e a pressão final é final is 0, la 0,4 Pa. Após a bomba de vácuo e a máquina de refrigeração terem sido desligadas, o sistema é submetido ao fluxo de ar (seco via um tubo de secagem) ou argônio.
c) Extração
Imediatamente após o aparelho de liofilização ter sido submetido ao fluxo, os tubos com o material de planta liofilizado são hermeticamente vedados para proteger o material da umidade do ar. Para a extração uma porção de 50 mg do material de planta homogeneizado seco é pesada em tubos de extração de fibra de vidro para dentro de cartuchos de extração de 5 ml do dispositivo ASE (Accelerated Solvent Extractor ASE 200 com Solvent Controller e AutoASE software (DIONEX)).
As 24 posições de amostra de um dispositivo ASE (Accelerated Solvent Extractor ASE 200 com Solvent Controller e AutoASE software (DIONEX)) são cheias com as amostras de planta, incluindo algumas amostras para teste de controle de qualidade.
As substâncias polares são extraídas com aproximadamente 10 ml de metanol/água (80/20, v/v) a T = 70°C e ρ = 14.000 kPa, fase de aquecimento de 5 minutos, extração estática de 1 minuto. As substâncias mais lipofílicas são extraídas com aproximadamente 10 ml de metanol/diclorometano(40/60, v/v) a T = 70°C e ρ = 14.000 ka, fase de aquecimento de 5 minutos, extração estática de 1 minuto. As duas misturas de solventes são extraídas para dentro dos mesmos tubos de vidro (tubos de centrífuga, 50 ml, equipados com tampa rosqueada e septo perfurável para o ASE (DIONEX)).
A solução é tratada com padrões internos comercialmente disponíveis, tais como ribitol, L-glicina-2,2-d2, L-alanina-2,3,3,3-d4, metionina-d3; Arginina (13C), Triptofano-d5, e α-metil-glicopiranosídeo e nonadecanoato de metila, undecanoato de metila, tridecanoato de metila, pentadecanoato de metila, nonacosanoato de metila.
O extrato total é extraído com 8 ml de água. O resíduo sólido da amostra de planta e a luva de extração são rejeitados.
O extrato é agitado e então centrifugado por 5 a 10 minutos pelo menos a 1.400 g com o propósito de acelerar a separação de fases. 1 ml do sobrenadante metanol/água ("fase polar", incolor) é removido para análise por GC posterior. O restante da fase de metanol/água é rejeitado. 0,75 ml da fase orgânica ("fase lipídica", verde escura) é removido para análise por GC posterior e 0,75 ml é removido para análise por LC. Todas as porções removidas são evaporadas até a secura usando o evaporador a vácuo em infravermelho IR Dancer (Hettich). A temperatura máxima durante o processo de evaporação não ultrapassou 40°C. Pressão no aparelho não é menor do que 1,0 kPa.
d) Processamento das fases lipídica e polar para a análise por LC/MS ou LC/MS/MS
O extrato lipídico, que tem sido evaporado até a secura é recolhido na fase móvel. O extrato polar, que tem sido evaporado até a secura é recolhido na fase móvel.
e) Análise por LC-MS
A parte LC é realizada em um sistema LCMS comercialmente disponível da Agilent Technologies, USA. Para extratos polares 10 μΐ são injetados no sistema em uma vazão de fluxo de 200μ1/min. A coluna de separação (Fase Reversa C18) é mantida a 15°C durante a cromatografia. Para extratos lipídicos 5 μl são injetados no sistema em uma vazão de fluxo de 200 μl/min. A coluna de separação (Fase Reversa Cl8) é mantida a 30°C. HPLC é realizada com eluição em gradiente.
A análise espectrométrica de massa é conduzida em um instrumento de quadrupolo triplo Applied Biosystems API 4000 com fonte de pulverização iônica turbo. Para extratos polares o instrumento mede no modo de íon negativo no modo de varredura total de 100-1.000 amu. Para extratos lipídicos o instrumento mede no modo de íon positivo no modo de varredura total de 100-1.000 amu
f) Derivação da fase lipídica para análise por GC/MS
Para a transmetanólise, uma mistura de 140 μl de clorofórmio, 37 μl de ácido clorídrico (37% em peso de HCl em água), 320 μl de metanol e 20 μl de tolueno é adicionada no extrato evaporado. O vaso é vedado hermeticamente e aquecido por 2 horas a 100°C, com agitação. A solução é subseqüentemente evaporada até a secura. O resíduo é seco completamente.
A metoximação dos grupos carbonila é realizada pela reação com cloridrato de metóxi-amina (5 mg/ml em piridina, 100 μl por 1,5 horas a 60°C) em um vaso hermeticamente fechado. 20 μl de uma solução de ácidos graxos de cadeia linear, de número ímpar (solução de cada 0,3 mg/mL de ácidos graxos de 7 a 25 átomos de carbono e cada 0,6 mg/mL de ácidos graxos com 27, 29 e 31 átomos de carbono em piridina/tolueno 3/7 (v/v)) são adicionados como padrões de tempo. Finalmente, a derivação com 100 μl de N-metil-N-(trimetil-silil)-2,2,2-trifluoro-acetamida (MSTFA) é realizada por 30 minutos a 60°C, de novo no vaso hermeticamente fechado. O volume final antes da injeção no GC foi 220 μl.
g) Derivação da fase polar para a análise por GC/MS
A metoximação dos grupos carbonila é realizada pela reação com cloridrato de metóxi-amina (5 mg/ml em piridina, 50 μl por 1,5 horas a 60°C) em um vaso hermeticamente fechado. 10 μl de uma solução de ácidos graxos de cadeia linear, de número ímpar (solução de cada 0,3 mg/mL de ácidos graxos de 7 a 25 átomos de carbono e cada 0,6 mg/mL de ácidos graxos com 27, 29 e 31 átomos de carbono em piridina/tolueno 3/7 (v/v)) são adicionados como padrões de tempo. Finalmente, a derivação com 50 μl de N-metil-N-(trimetil-silil)-2,2,2-trifluoro-acetamida (MSTFA) é realizada por 30 minutos a 60°C, de novo no vaso hermeticamente fechado. O volume final antes da injeção no GC foi 110 μl..
h) Análise por GC-MS
Os sistemas de GC-MS consistem de um Agilent 6890 GC acoplado em um Agilent 5973 MSD. Os autoamostradores são CompiPal ou GCPal de CTC. Para análise colunas de separação capilares comerciais normais (30 m χ 0,25 mm χ 0,25 μπι) com fases estacionárias diferentes de poli(metil-siloxano) contendo 0 % a até 35% de grupos aromáticos, dependendo dos materiais de amostra analisados e das frações da etapa de separação de fases, são usadas (por exemplo: DB-lms, HP-5ms, DB-XLB, DB-35ms, Agilent Technologies). Até 1 μl do volume final é injetado sem divisão e o programa de temperatura de forno é iniciado em 70°C e terminado em 340°C com taxas de aquecimento diferentes dependendo do material da amostra e da fração da etapa de separação de fases com o propósito de obter uma separação cromatográfica suficiente e número de varreduras suficiente dentro de cada pico de analito. São usadas condições padrão normais de GC- MS, por exemplo fluxo constante com 1 a 1,7 ml/min. nominal e hélio como gás de fase móvel. Ionização é feita por impacto de elétrons com 70 eV, varredura dentro de uma faixa de m/z de 15 a 600 com velocidades de varredura de 2,5 a 3 varreduras/segundo e condições de ajuste padrão,
i) Análise de várias amostras de planta
As amostras são medidas em série individual de 20 amostras de planta cada (também chamadas de seqüências). Nos experimentos cada seqüência continha pelo menos 3 replicados por linhagem transgênica mais pelo menos 3 plantas da respectiva linhagem segregante nula como controles. As áreas de pico para cada analito são ajustadas para o peso seco estabelecido para a planta (área normalizada). Valores de razão são calculados para normalização adicional em relação ao controle. Nos experimentos valores de razão são calculados pela divisão da área normalizada pela média dos dados correspondentes do grupo de controle da mesma seqüência. Os valores obtidos são chamados de razão_por_controle. São comparáveis entre seqüências e indicam quanto de concentração de analito no mutante difere do grupo de controle, que são as plantas das linhagens segregantes nulas respectivas em uma dada seqüência. Controles apropriados são feitos antes de provar que os próprios vetor e procedimento de transformação não têm influência significativa sobre a composição metabólica das plantas. Portanto as mudanças descritas em comparação com o grupo de controle são indubitavelmente causadas pela mutação.
Os resultados das diferentes análises de planta podem ser vistos na seguinte tabela 3:
São analisadas as sementes de plantas de arroz contendo genes codificadores de proteínas CDK como aqui descritas.
Tabela 3: Resultados da análise metabólica de proteínas CDK em plantas de arroz
<table>table see original document page 94</column></row><table>
Coluna 1 mostra o metabólito analisado. Colunas 2 e 3 estão mostrando a faixa de aumento do metabólico analisado como verificado entre as plantas transgênicas em comparação com as linhagens de controle. Coluna 4 indica o método analítico. LISTAGEM DE SEQÜÊNCIAS
<110> BASF Plant Science GmbH
<120> Plantas tendo características de crescimento melhoradas e método de preparar as mesmas
<130> PF58042
<140> 20060503
<141> 2007 05 24
<160> 60
<170> Biomax PatentTool de acordo com PatentIN de formato 3.1
<210> 1
<211> 885
<212> DNA
<213> Oryza sativa
<220>
<221> CDS
<222> (1)..(885)
<223> quinase cdc2
<4 00> 1
atg gag cag tac gag aag gag gag aag att ggg gag ggc acg tac ggg 48
Met Glu Gln Tyr Glu Lys Glu Glu Lys Ile Gly Glu Gly Thr Tyr Gly
15 10 15
gtg gtg tac agg gcg cgg gac aag gtc acc aac gag acg ate gcg ctc 96
Val Val Tyr Arg Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
aag aag ate cgg ctt gag cag gag gat gag ggc gtc ccc tcc acc gea 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
ate cgc gag ate tcg ctc ctc aag gag atg cat cac ggc aac ate gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met His His Gly Asn Ile Val
50 55 60
agg tta cac gat gtt ate cac agt gag aag cgc ata tat ctt gtc ttt 240
Arg Leu His Asp Val Ile His Ser Glu Lys Arg Ile Tyr Leu Val Phe 65 70 75 80
gag tat ctg gat ctg gac cta aag aag ttc atg gac tet tgt cca gag 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu
85 90 95
ttt gcg aaa aac ccc act tta att aag tca tat ctc tat cag ata ctc 336
Phe Ala Lys Asn Pro Thr Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu
100 105 110
cgc ggc gtt gct tac tgt cat tet cat aga gtt ctt cat cga gat ttg 384
Arg Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aaa cct cag aat tta ttg ata gat cgg cgt act aat gea ctg aag ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
gea gac ttt ggt tta gcc agg gea ttt gga att cct gtc cgc acg ttt 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
gat cac gag gtt gta acc ttg tgg tat aga gct cca gag ate ctt ctt 528
Asp His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
gga tca agg cag tat tet aca cca gtt gat atg tgg tca gtt ggt tgt 576
Gly Ser Arg Gln Tyr Ser Thr Pro Val Asp Met Trp Ser Val Gly Cys
180 185 190 ate ttt gea gaa atg gtg aac cag aaa cca ctg ttc cct ggt gat tet 624
Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag att gat gaa tta ttt aag ata ttc agg gta cta gga act cca aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn
210 215 220
gaa caa agt tgg cca gga gtt age tca tta cct gac tac aag tet gct 720
Glu Gln Ser Trp Pro Gly Val Ser Ser Leu Pro Asp Tyr Lys Ser Ala 225 230 235 240
ttc ccc aag tgg cag gea cag gat ctt gea act att gtc cct act ctt 768
Phe Pro Lys Trp Gln Ala Gln Asp Leu Ala Thr Ile Val Pro Thr Leu
245 250 255
gac cct gct ggt ttg gac ctt ctc tet aaa atg ctt cgg tac gag cca 816
Asp Pro Ala Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Tyr Glu Pro
260 265 270
aac aaa agg ate aca gct aga cag gct ctt gag cat gaa tac ttc aag 864
Asn Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys
275 280 285 gac ctt gag atg gta caa tga 885 Asp Leu Glu Met Val Gln 290 294
<210> 2 <211> 294 <212> PRT
<213> Oryza sativa <400> 2
Met Glu Gln Tyr Glu Lys Glu Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15
Val Val Tyr Arg Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met His His Gly Asn Ile Val
50 55 60
Arg Leu His Asp Val Ile His Ser Glu Lys Arg Ile Tyr Leu Val Phe 65 70 75 80
Glu Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu
85 90 95
Phe Ala Lys Asn Pro Thr Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu
100 105 110
Arg Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
Asp His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
Gly Ser Arg Gln Tyr Ser Thr Pro Val Asp Met Trp Ser Val Gly Cys
180 185 190
Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser
195 200 205
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn
210 215 220
Glu Gln Ser Trp Pro Gly Val Ser Ser Leu Pro Asp Tyr Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Gln Ala Gln Asp Leu Ala Thr Ile Val Pro Thr Leu
245 250 255
Asp Pro Ala Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Tyr Glu Pro
260 265 270
Asn Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
Asp Leu Glu Met Val Gln 290 <210> 3 <211> 882 <212> DNA
<213> Oryza sativa (grupo-cultivar japonica)
<220>
<221> CDS
<222> (1)..(882)
<400> 3
atg gag cag tac gag gag gag aag att gga gag ggc acg tac ggg gta 48
Met Glu Gln Tyr Glu Glu Glu Lys Ile Gly Glu Gly Thr Tyr Gly Val 15 10 15
gtg tac aag gcg cgg gac aag gtc acc aac gag acg ate gcg ctc aag 96
Val Tyr Lys Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu Lys
20 25 30
aag ate cgg ctt gag cag gag gat gag ggt gtc ccc tcc acc gcc ate 144
Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala Ile
35 40 45
cgc gag ate tcg ctc ctc aag gag atg cat cac cgc aac ate gtc agg 192
Arg Glu Ile Ser Leu Leu Lys Glu Met His His Arg Asn Ile Val Arg
50 55 60
tta cac gat gtt ate cac agt gag aag cgc ata ggt ctt gtc ttt gag 240
Leu His Asp Val Ile His Ser Glu Lys Arg Ile Gly Leu Val Phe Glu
65 70 75 80
tat ctg gat ctg gac ctg aag aag ttc atg gac tet tgt cca gag ttt 288
Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu Phe
85 90 95
gea aaa aac ccc act tta att aag tca tat ctc tat cag ata ctc cgc 336
Ala Lys Asn Pro Thr Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu Arg
100 105 110
ggc gtt gct tac tgt cat tet cat aga gtt ctt cat cga gat ttg aaa 384
Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu Lys
115 120 125
cct cag aat tta ttg ata gat cgg cgt act aat aca ctg aag ctt gea 432
Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Thr Leu Lys Leu Ala
130 135 140
gac ttt ggt tta gcc agg gea ttt gga att cct gtc cgc aca ttt act 480
Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe Thr
145 150 155 160
cat gag gtt gta acc ttg tgg tat aga gct cca gag ate ctt ctt gga 528
His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu Gly
165 170 175
tca agg cag tat tet aca cca gtt gat atg tgg tca gtt ggt tgt ate 576
Ser Arg Gln Tyr Ser Thr Pro Val Asp Met Trp Ser Val Gly Cys Ile
180 185 190
ttt gea gaa atg gtg aac cag aaa cca ctg ttc cct ggt gat tet gag 624
Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser Glu
195 200 205
att gat gaa tta ttt aag ata ttc agg gta cta gga act cca aat gaa 672
Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn Glu
210 215 220
caa agt tgg cca gga gtt age tca tta cct gac tac aag tet gct ttc 720
Gln Ser Trp Pro Gly Val Ser Ser Leu Pro Asp Tyr Lys Ser Ala Phe
225 230 235 240
ccc aag tgg cag gea cag gct ctt gea act att gtc cct act ctt gac 768
Pro Lys Trp Gln Ala Gln Ala Leu Ala Thr Ile Val Pro Thr Leu Asp
245 250 255
cct gct ggt ttg gac ctt ctc tet aaa atg ctt cgg tac gag cca aac 816
Pro Ala Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Tyr Glu Pro Asn
260 265 270
aaa agg ate aca gct aga cag gct ctt gag cat gag tac ttc aag gac 864
Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys Asp
275 280 285 ctt gag atg gaa cgc taa 882
Leu Glu Met Glu Arg 290
<210> 4 <211> 293 <212> PRT
<213> Oryza sativa (grupo-cultivar japonica)
<400> 4 Met Glu Gln Tyr Glu Glu Glu Lys Ile Gly Glu Gly Thr Tyr Gly Val 1 5 10 15 Val Tyr Lys Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu Lys 20 25 30 Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala Ile 35 40 45 Arg Glu Ile Ser Leu Leu Lys Glu Met His His Arg Asn Ile Val Arg 50 55 60 Leu His Asp Val Ile His Ser Glu Lys Arg Ile Gly Leu Val Phe Glu 65 70 75 80 Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu Phe 85 90 95 Ala Lys Asn Pro Thr Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu Arg 100 105 110 Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu Lys 115 120 125 Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Thr Leu Lys Leu Ala 130 135 140 Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe Thr 145 150 155 160 His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu Gly 165 170 175 Ser Arg Gln Tyr Ser Thr Pro Val Asp Met Trp Ser Val Gly Cys Ile 180 185 190 Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser Glu 195 200 205 Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn Glu 210 215 220 Gln Ser Trp Pro Gly Val Ser Ser Leu Pro Asp Tyr Lys Ser Ala Phe 225 230 235 240 Pro Lys Trp Gln Ala Gln Ala Leu Ala Thr Ile Val Pro Thr Leu Asp 245 250 255 Pro Ala Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Tyr Glu Pro Asn 260 265 270 Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys Asp 275 280 285 Leu Glu Met Glu Arg 290
<210> 5
<211> 885
<212> DNA
<213> cepa Allium
<220>
<221> CDS
<222> (1)..(885)
<400> 5
atg gat cag tat gag aaa gtg gag aag att gga gaa gga act tat gga 48
Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 15 10 15
gtt gtt tac aaa gca cgt gat cgg ctg act aat gaa acg att gct ttg 96
Val Val Tyr Lys Ala Arg Asp Arg Leu Thr Asn Glu Thr Ile Ala Leu
20 25 30
aag aag att agg ttg gag cag gaa gat gag gga gtt cct agt act gcc 144 Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
att aga gaa ata tca ctg ttg aag gaa atg cag cat gct aac att gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Ala Asn Ile Val
50 55 60
agg ctg caa gac gta gtt cat agt gag aag cga ata tat ctt gtg ttc 240
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Ile Tyr Leu Val Phe
65 70 75 80
gag tat cta gat ctg gac ctt aag aag cat atg gat tca tgc cca gat 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Asp
85 90 95
ttt gct aaa gat tct cgt ttg gct aaa aca ttt ctc tat cag ctt ctc 336
Phe Ala Lys Asp Ser Arg Leu Ala Lys Thr Phe Leu Tyr Gln Leu Leu
100 105 110
cga gga att gct tat tgt cac tca cac cga gtt ctt cat cgt gac tta 384
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aag cct caa aat tta ttg ate gac aga cgt acc aat tca tta aag ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ser Leu Lys Leu
130 135 140
gct gac ttt gga ctt gea agg gea ttt ggt ate cca gtc cga acc ttc 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe
145 150 155 160
aca cac gag gtt gtg aca ctg tgg tat agg gea cct gaa ate ctc tta 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
ggt gct cgt cag tat tct act cct gta gac ata tgg tct gtg gga tgt 576
Gly Ala Arg Gln Tyr Ser Thr Pro Val Asp Ile Trp Ser Val Gly Cys
180 185 190
ate ttt gct gaa atg gtg aac caa cga cct cta ttc cct ggg gac tct 624
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag ate gac gag ctg ttc aaa ata ttt aga att atg ggt acc cca aac 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Met Gly Thr Pro Asn
210 215 220
gaa gac aca tgg cca ggt gtt act tcc ttg ccc gac ttc aag tct gct 720
Glu Asp Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala
225 230 235 240
ttt cca aag tgg ccg gea aag gac ttg gea act ata gtt cca aag ctt 768
Phe Pro Lys Trp Pro Ala Lys Asp Leu Ala Thr Ile Val Pro Lys Leu
245 250 255
gat tca gct gga att gat ctt ctt tat aaa atg ctg cac ctt gaa ccg 816
Asp Ser Ala Gly Ile Asp Leu Leu Tyr Lys Met Leu His Leu Glu Pro
260 265 270
age aaa aga ate act gct cgg aag gct ctt gag cat gaa tac ttc agg 864
Ser Lys Arg Ile Thr Ala Arg Lys Ala Leu Glu His Glu Tyr Phe Arg
275 280 285
gat ctt ggg aca att cca tga 885
Asp Leu Gly Thr Ile Pro 290
<210> 6
<211> 294
<212> PRT
<213> cepa Allium
<400> 6
Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 15 10 15
Val Val Tyr Lys Ala Arg Asp Arg Leu Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Ala Asn Ile Val
50 55 60
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Ile Tyr Leu Val Phe 65 70 75 80
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Asp
85 90 95
Phe Ala Lys Asp Ser Arg Leu Ala Lys Thr Phe Leu Tyr Gln Leu Leu
100 105 110
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ser Leu Lys Leu
130 135 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
Gly Ala Arg Gln Tyr Ser Thr Pro Val Asp Ile Trp Ser Val Gly Cys
180 185 190
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Met Gly Thr Pro Asn
210 215 220
Glu Asp Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Pro Ala Lys Asp Leu Ala Thr Ile Val Pro Lys Leu
245 250 255
Asp Ser Ala Gly Ile Asp Leu Leu Tyr Lys Met Leu His Leu Glu Pro
260 265 270
Ser Lys Arg Ile Thr Ala Arg Lys Ala Leu Glu His Glu Tyr Phe Arg
275 280 285
Asp Leu Gly Thr Ile Pro 290
<210> 7 <211> 885 <212> DNA
<213> Lycopersicon esculentum
<220>
<221> CDS
<222> (1)..(885)
<400> 7 atg gac cag tat gaa aaa Met Asp Gln Tyr Glu Lys 1 5 gta gtg tac aag gct cgt Val Val Tyr Lys Ala Arg 20 aag aaa ata agg ttg gag Lys Lys Ile Arg Leu Glu 35 att aga gaa ata tct CtC Ile Arg Glu Ile Ser Leu 50 agg ttg cag gat gtg gtg Arg Leu Gln Asp Val Val 65 70 gaa tat Ctt gac ttg gac Glu Tyr Leu Asp Leu Asp 85 ttc tct aag gat cca cgt Phe Ser Lys Asp Pro Arg 100 cgt ggt att gct tat tgt Arg Gly Ile Ala Tyr Cys 115 aag CCt cag aac tta cta
gtt gag aag att ggg gaa Val Glu Lys Ile Gly Glu 10
gat cgt gta act aat gaa Asp Arg Val Thr Asn Glu 25
cag gaa gac gag ggg gta Gln Glu Asp Glu Gly Val 40
ttg aaa gag atg caa cat Leu Lys Glu Met Gln His 55 60
cac agt gaa aag cga ttg His Ser Glu Lys Arg Leu 75
ttg aag aag cac atg gat Leu Lys Lys His Met Asp 90
ctg gtt aaa atg ttc ttg Leu Val Lys Met Phe Leu 105
cat tct cat aga gtt ctt His Ser His Arg Val Leu 120
ata gat cga cgt aca aat
gga aca tat ggt 4 8
Gly Thr Tyr Gly 15
act att gca ctg 96
Thr Ile Ala Leu 30
cca age aca gct 144
Pro Ser Thr Ala 45
gct aat att gtg 192
Ala Asn Ile Val
tat cta gtg ttt 240
Tyr Leu Val Phe 80
tcg tgt cct gaa 288
Ser Cys Pro Glu 95
tat caa ata ctc 336
Tyr Gln Ile Leu 110
cat aga gat ttg 384
His Arg Asp Leu
125
gct tta aag ctg 432 Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
gca gac ttt ggt ttg gct aga gca ttt ggt att cct gtc aga act ttc 4 80
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe
145 150 155 160
act cat gag gtg gtg aca ttg tgg tac agg gca cca gaa ata ctg ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
gga tca cgc cat tac tct act cct gtt gat gtg tgg tca gtt ggt tgc 576
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys 180 185 190
ata ttt gct gag atg gtg Ile Phe Ala Glu Met Val 195
gag att gat gaa ctt ttc Glu Ile Asp Glu Leu Phe 210
gag gat aca tgg cct gga Glu Asp Thr Trp Pro Gly 225 230
ttc cca aaa tgg cct cct Phe Pro Lys Trp Pro Pro 245
gat gga gca ggc ctt gat Asp Gly Ala Gly Leu Asp 260
agt aag aga ate acc gcg Ser Lys Arg Ile Thr Ala 275
gat att ggg tat gtg ccg Asp Ile Gly Tyr Val Pro 290
aat cag ccg cct ctg ttt Asn Gln Pro Pro Leu Phe 200
aag att ttc aga gta ttg Lys Ile Phe Arg Val Leu 215 220
gtg act tct ctg cct gat Val Thr Ser Leu Pro Asp 235
aag gac ctg gca att att Lys Asp Leu Ala Ile Ile 250
ctt ctt ggt aaa atg ctc Leu Leu Gly Lys Met Leu 265
agg aat gcc ctt gag cat Arg Asn Ala Leu Glu His 280
tga
cct ggt gac tct 624
Pro Gly Asp Ser
205
ggt act cca aat 672
Gly Thr Pro Asn
tac aaa tct gcc 720
Tyr Lys Ser Ala 240
gta cca aat gtt 768
Val Pro Asn Val 255
tcc ttg gat ccc 816
Ser Leu Asp Pro 270
gag tac ttc aag 864
Glu Tyr Phe Lys
285
885
<210> 8 <211> 294 <212> PRT
<213> Lycopersicon esculentum
<400> 8 Met Asp 1
Val Val
Lys Lys
Ile Arg
50 Arg Leu 65
Glu Tyr
Phe Ser
Arg Gly
Lys Pro 130 Ala Asp 145
Thr His Gly Ser Ile Phe
Gln Tyr
Tyr Lys 20 Ile Arg 35
Glu Ile
Gln Asp
Leu Asp
Lys Asp 100 Ile Ala 115
Gln Asn
Phe Gly
Glu Val
Arg His 180 Ala Glu 195
Glu 5
Ala
Leu
Ser
Val
Leu
85
Pro
Tyr
Leu
Leu
Val 165 Tyr
Met
Lys
Arg
Glu
Leu
Val
70
Asp
Arg
Cys
Leu
Ala 150 Thr
Ser
Val
Val
Asp
Gln
Leu
55
His
Leu
Leu
His
Ile 135 Arg
Leu
Thr
Asn
Glu
Arg
Glu
40
Lys
Ser
Lys
Val
Ser 120 Asp
Ala
Trp
Pro
Gln 200
Lys Ile 10
Val Thr 25
Asp Glu
Glu Met
Glu Lys
Lys His 90
Lys Met 105
His Arg
Arg Arg
Phe Gly
Tyr Arg 170 Val Asp 185
Pro Pro
Gly Glu Gly Thr Asn Glu Gly Val
Gln His 60
Arg Leu 75
Met Asp
Phe Leu
Val Leu
Thr Asn 140 Ile Pro 155
Ala Pro Val Trp Leu Phe
Thr Ile
30 Pro Ser 45
Ala Asn
Tyr Leu
Ser Cys
Tyr Gln 110 His Arg 125
Ala Leu
Val Arg
Glu Ile
Ser Val 190 Pro Gly 205
Tyr
15
Ala
Thr
Ile
Val
Pro
95
Ile
Asp
Lys
Thr
Leu 175 Gly
Asp
Gly
Leu
Ala
Val
Phe
80
Glu
Leu
Leu
Leu
Phe 160 Leu
Cys
Ser Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn
210 215 220
Glu Asp Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Tyr Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Pro Pro Lys Asp Leu Ala Ile Ile Val Pro Asn Val
245 250 255
Asp Gly Ala Gly Leu Asp Leu Leu Gly Lys Met Leu Ser Leu Asp Pro
260 265 270
Ser Lys Arg Ile Thr Ala Arg Asn Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
Asp Ile Gly Tyr Val Pro 290
<210> 9 <211> 885 <212> DNA
<213> Pisum sativum
<220>
<221> CDS
<222> (1)..(885)
<400> 9
atg gaa cag tat gag aag Met Glu Gln Tyr Glu Lys 1 5
gtg gtg tac aag gct agg Val Val Tyr Lys Ala Arg 20
aag aag att cga ctc gaa Lys Lys Ile Arg Leu Glu 35
ata aga gag att tct ctt Ile Arg Glu Ile Ser Leu 50
agg ttg cag gat gtt gtg Arg Leu Gln Asp Val Val 65 70
gag tac ctt gac tta gat Glu Tyr Leu Asp Leu Asp 85
ttt tcc aaa gat caa cgt Phe Ser Lys Asp Gln Arg 100
tgt ggc att gct tac tgt Cys Gly Ile Ala Tyr Cys 115
aaa cca caa aat ctg ttg
Lys Pro Gln Asn Leu Leu 130
gca gat ttt ggg ttg gct Ala Asp Phe Gly Leu Ala 145 150
aca cat gag gtg gtg aca Thr His Glu Val Val Thr 165
ggg tcc cgt cat tat tct Gly Ser Arg His Tyr Ser 180
ata ttt gca gag atg ata Ile Phe Ala Glu Met Ile 195
gag att gat gaa ttg ttt Glu Ile Asp Glu Leu Phe 210
gtt gag aaa ata gga gaa Val Glu Lys Ile Gly Glu 10
gac cgt gtt acc aat gag Asp Arg Val Thr Asn Glu 25
cag gaa gat gag ggg gtt Gln Glu Asp Glu Gly Val 40
ttg aaa gaa atg cag cat Leu Lys Glu Met Gln His 55 60
cat agt gag aag cga ttg His Ser Glu Lys Arg Leu 75
cta aag aag cat atg gat Leu Lys Lys His Met Asp 90
caa gta aaa atg ttc ctc Gln Val Lys Met Phe Leu 105
cat tct cat aga gtt ctt His Ser His Arg Val Leu 120
ata gat cgc age tct aat
Ile Asp Arg Ser Ser Asn 135 140
aga gca ttt gga att cct Arg Ala Phe Gly Ile Pro 155
cta tgg tac aga gct cca Leu Trp Tyr Arg Ala Pro 170
acc cca gtt gat gtt tgg Thr Pro Val Asp Val Trp 185
aac cag cga cca ctt ttc Asn Gln Arg Pro Leu Phe 200
aaa ata ttc aga ate acg Lys Ile Phe Arg Ile Thr 215 220
ggt aca tac ggt 48
Gly Thr Tyr Gly 15
acc att gct ttg 96
Thr Ile Ala Leu 30
cct age act gcc 144
Pro Ser Thr Ala 45
cgg aac att gtt 192
Arg Asn Ile Val
tat ctt gtt ttt 240
Tyr Leu Val Phe 80
tca tct ccg gaa 288
Ser Ser Pro Glu 95
tat caa att ctc 336
Tyr Gln Ile Leu 110
cac cga gac ctg 384
His Arg Asp Leu
125
gcg cta aag ctt 432
Ala Leu Lys Leu
gtt agg aca ttt 480
Val Arg Thr Phe 160
gaa ata ttg ctt 528
Glu Ile Leu Leu 175
tca gtg gga tgc 576
Ser Val Gly Cys 190
cct ggg gat tct 624
Pro Gly Asp Ser
205
ggt aca cca aat 672
Gly Thr Pro Asn gaa gat aca tgg cct gga gtg act tca ttg cct gat ttt aaa tcc gcc 720
Glu Asp Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala
225 230 235 240
ttt ccc aag tgg cca tct aag gac ctg gca act ctg gtc cca agt ctt 7 68
Phe Pro Lys Trp Pro Ser Lys Asp Leu Ala Thr Leu Val Pro Ser Leu
245 250 255
gag cca tct ggt ctt gat ctg tta tct agt atg ctt cgc ttg gat ccc 816
Glu Pro Ser Gly Leu Asp Leu Leu Ser Ser Met Leu Arg Leu Asp Pro
260 265 270
age aga aga att act gcc agg ggc gct ctt gag cac gaa tac ttc aaa 864
Ser Arg Arg Ile Thr Ala Arg Gly Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gac att aaa ttt gtc ccc tga 885
Asp Ile Lys Phe Val Pro 290
<210> 10 <211> 294 <212> PRT
<213> Pisum sativum <400> 10
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15
Val Val Tyr Lys Ala Arg Asp Arg Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Arg Asn Ile Val
50 55 60
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Ser Pro Glu
85 90 95
Phe Ser Lys Asp Gln Arg Gln Val Lys Met Phe Leu Tyr Gln Ile Leu
100 105 110
Cys Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
Lys Pro Gln Asn Leu Leu Ile Asp Arg Ser Ser Asn Ala Leu Lys Leu
130 135 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
Ile Phe Ala Glu Met Ile Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Thr Gly Thr Pro Asn
210 215 220
Glu Asp Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Pro Ser Lys Asp Leu Ala Thr Leu Val Pro Ser Leu
245 250 255
Glu Pro Ser Gly Leu Asp Leu Leu Ser Ser Met Leu Arg Leu Asp Pro
260 265 270
Ser Arg Arg Ile Thr Ala Arg Gly Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
Asp Ile Lys Phe Val Pro 290
<210> 11 <211> 885 <212> DNA
<213> Camellia sinensis <220>
<221> CDS
<222> (1)..(885)
<400> 11 atg gag cag tac gaa aaa Met Glu Gln Tyr Glu Lys 1 5 gtg gtc tat aag gct cgg Val Val Tyr Lys Ala Arg 20 aag aag att cgt ttg gag Lys Lys Ile Arg Leu Glu 35 att aga gaa att tet cta Ile Arg Glu Ile Ser Leu 50 agg tta cag gat gta gtg Arg Leu Gln Asp Val Val 65 70 gag tat ctg gac ttg gat Glu Tyr Leu Asp Leu Asp 85 ttc tet aag gat cca cgt Phe Ser Lys Asp Pro Arg 100 cgt ggt att gct tat tgt Arg Gly Ile Ala Tyr Cys 115 aaa cct cag aat ctg ctg Lys Pro Gln Asn Leu Leu 130 gca gat ttt gga ttg gcc Ala Asp Phe Gly Leu Ala 145 150 aca cat gag gtg gtg act Thr His Glu Val Val Thr 165 gga tcc cgc cac tat tcg Gly Ser Arg His Tyr Ser 180 ata ttt gct gaa atg gtg Ile Phe Ala Glu Met Val 195 gag att gat gaa cta ttc Glu Ile Asp Glu Leu Phe 210 gag gat acg tgg cct gga Glu Asp Thr Trp Pro Gly 225 230 ttt cca aaa tgg cct tet Phe Pro Lys Trp Pro Ser 245 gac tca gct ggc att gat Asp Ser Ala Gly Ile Asp 260 age aga aga att aca gct Ser Arg Arg Ile Thr Ala 275 gat att ggg ttt gta cct Asp Ile Gly Phe Val Pro 290
gtt gag aag att ggt gaa Val Glu Lys Ile Gly Glu 10
gac cga gtg acc aat gaa Asp Arg Val Thr Asn Glu 25
cag gaa gat gag ggt gta Gln Glu Asp Glu Gly Val 40
ttg aaa gag atg aag cat Leu Lys Glu Met Lys His 55 60
cac agt gag aag cgt ttg His Ser Glu Lys Arg Leu 75
ttg aag aaa cac atg gat Leu Lys Lys His Met Asp 90
ctg ata aaa atg ttc ctg Leu Ile Lys Met Phe Leu 105
cac tcc cat aga gtt ctg His Ser His Arg Val Leu 120
ata gat cgc cgt aca aat Ile Asp Arg Arg Thr Asn 135 140
aga gca ttt ggt att ccc Arg Ala Phe Gly Ile Pro 155
cta tgg tac agg gca cca Leu Trp Tyr Arg Ala Pro 170
act cct gtg gat gtg tgg Thr Pro Val Asp Val Trp 185
aat cag cgg cca ttg ttt Asn Gln Arg Pro Leu Phe 200
aaa ate ttc aga ate ttg Lys Ile Phe Arg Ile Leu 215 220
gtg act tet ttg gct gat Val Thr Ser Leu Ala Asp 235
aag gac ctg gcc act gtg Lys Asp Leu Ala Thr Val 250
ctt ctt agt aaa atg ctc Leu Leu Ser Lys Met Leu 265
aga agt gcc ctt gaa cat Arg Ser Ala Leu Glu His 280
tga
gga acc tat ggt 4 8
Gly Thr Tyr Gly 15
act ata gct tta 96
Thr Ile Ala Leu 30
cca age acg gca 144
Pro Ser Thr Ala 45
gga aat gtt gtc 192
Gly Asn Val Val
tat ctg gtt ttt 240
Tyr Leu Val Phe 80
tca tgt ccg gag 288
Ser Cys Pro Glu 95
tat caa att ctt 336
Tyr Gln Ile Leu 110
cat cga gat ctg 384
His Arg Asp Leu
125
gct tta aag ctt 432
Ala Leu Lys Leu
gtc agg aca ttt 480
Val Arg Thr Phe 160
gaa ata ctc ctt 528
Glu Ile Leu Leu 175
tca gtg ggt tgt 576
Ser Val Gly Cys 190
cct ggg gac tet 624
Pro Gly Asp Ser
205
ggt act cca aat 672
Gly Thr Pro Asn
ttt aaa tet gcc 720
Phe Lys Ser Ala 240
gtc cca aat ctt 768
Val Pro Asn Leu 255
tgt ctg gat cca 816
Cys Leu Asp Pro 270
gaa tac ttc aag 864
Glu Tyr Phe Lys
285
885
<210> 12 <211> 294 <212> PRT <213> Camellia sinensis
<400> 12 Met Glu Gln 1
Val Val Tyr
Lys Lys Ile 35
Ile Arg Glu 50
Arg Leu Gln 65
Glu Tyr Leu
Phe Ser Lys
Arg Gly Ile 115
Lys Pro Gln
130 Ala Asp Phe 145
Thr His Glu
Gly Ser Arg
Ile Phe Ala 195
Glu Ile Asp 210 Glu Asp Thr 225
Phe Pro Lys
Asp Ser Ala
Ser Arg Arg 275
Asp Ile Gly 290
Tyr Glu 5
Lys Ala 20
Arg Leu
Ile Ser
Asp Val
Asp Leu 85
Asp Pro 100
Ala Tyr
Asn Leu
Gly Leu
Val Val 165 His Tyr 180
Glu Met
Glu Leu
Trp Pro
Trp Pro 245 Gly Ile 260
Ile Thr
Lys Val
Arg Asp
Glu Gln
Leu Leu
55 Val His 70
Asp Leu
Arg Leu
Cys His
Leu Ile 135 Ala Arg 150
Thr Leu
Ser Thr
Val Asn
Phe Lys 215 Gly Val 230
Ser Lys
Asp Leu Ala Arg Phe Val Pro
Glu
Arg
Glu
40
Lys
Ser
Lys
Ile
Ser 120 Asp
Ala
Trp
Pro
Gln 200 Ile
Thr
Asp
Leu
Ser 280
Lys
Val
25
Asp
Glu
Glu
Lys
Lys 105 His
Arg
Phe
Tyr
Val 185 Arg
Phe
Ser
Leu
Ser 265 Ala
Ile
10
Thr
Glu
Met
Lys
His
90
Met
Arg
Arg
Gly
Arg 170 Asp
Pro
Arg
Leu
Ala 250 Lys
Leu
Gly
Asn
Gly
Lys
Arg
75
Met
Phe
Val
Thr
Ile 155 Ala
Val
Leu
Ile
Ala 235 Thr
Met
Glu
Glu
Glu
Val
His 60 Leu
Asp
Leu
Leu
Asn 140 Pro
Pro
Trp
Phe
Leu 220 Asp
Val
Leu
His
Gly
Thr
Pro
45
Gly
Tyr
Ser
Tyr
His 125 Ala
Val
Glu
Ser
Pro 205 Gly
Phe
Val
Cys
Glu 285
Thr
Ile
30
Ser
Asn
Leu
Cys
Gln 110 Arg
Leu
Arg
Ile
Val 190 Gly
Thr
Lys
Pro
Leu 270 Tyr
Tyr
15
Ala
Thr
Val
Val
Pro
95
Ile
Asp
Lys
Thr
Leu 175 Gly
Asp
Pro
Ser
Asn 255 Asp
Phe
Gly
Leu
Ala
Val
Phe 80 Glu
Leu
Leu
Leu
Phe 160 Leu
Cys
Ser
Asn
Ala 240 Leu
Pro
Lys
<210> 13 <211> 885 <212> DNA
<213> Pinus contorta
<220>
<221> CDS
<222> (1)..(885)
<4 00> 13
atg gaa cag tat gag aaa Met Glu Gln Tyr Glu Lys 1 5 gtg gtt tac aag gcc cgt Val Val Tyr Lys Ala Arg 20 aag aaa att cgt ttg gag Lys Lys Ile Arg Leu Glu 35 att aga gaa att tet Ctt Ile Arg Glu Ile Ser Leu 50 agg ttg caa gat gtt gtc Arg Leu Gln Asp Val Val
gtt gag aag ata gga gaa Val Glu Lys Ile Gly Glu 10
gat cgc ttg aca aat gag Asp Arg Leu Thr Asn Glu 25
caa gaa gat gag ggt gta Gln Glu Asp Glu Gly Val 40
ctt aaa gaa atg caa cat Leu Lys Glu Met Gln His 55 60
cat agt gaa aag cgg ctc His Ser Glu Lys Arg Leu
gga aca tat ggt 4 8
Gly Thr Tyr Gly 15
acc ata gct ctc 96
Thr Ile Ala Leu 30
cca age act gcg 144
Pro Ser Thr Ala 45
ggg aac ate gta 192
Gly Asn Ile Val
tat ttg gtt ttc 240
Tyr Leu Val Phe 65 70 75 80
gag tat ttg gat ttg gac ctc aag aag cat atg gat tct tgc cct gag 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu
85 90 95
cta gca aag gat cct cgt cta ate aaa aca ttt ctg tat cag att ctg 336
Leu Ala Lys Asp Pro Arg Leu Ile Lys Thr Phe Leu Tyr Gln Ile Leu
100 105 110
cgt ggc att gcc tat tgt cat tct cat cgg gtt ctt cat cgt gat ctg 384
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aag ccg caa aat ttg ctt att gac cgc aaa acc aat gcg ttg aaa ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Lys Thr Asn Ala Leu Lys Leu
130 135 140
gcc gac ttt gga ctt gcc agg gca ttt gga att cca gtg agg acc ttt 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
act cat gag gtg gtt aca ttg tgg tat cgt gca ccc gag ate tta ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
ggt tcc cgg cat tat tcg act cct gtt gat gtt tgg tct gtt gga tgt 576
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ate ttt gct gaa atg gtc aat cag cga cca ctt ttc cca gga gac tca 624
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag att gat gag ctc ttt aag ata ttt aga gtg ctg ggg acg cca aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn
210 215 220
gaa gaa aca tgg cca gga gtc acc tct ctg cct gac ttc aag tca gcc 720
Glu Glu Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
ttc cca aag tgg cca gcc aag gat ttg gca act gtg gtt tca ggt ctt 768
Phe Pro Lys Trp Pro Ala Lys Asp Leu Ala Thr Val Val Ser Gly Leu
245 250 255
gag cca gca gga att gat att ctc tcg aaa atg ctg tgc ctg gag ccc 816
Glu Pro Ala Gly Ile Asp Ile Leu Ser Lys Met Leu Cys Leu Glu Pro
260 265 270
agt aga cgc ate act gct cgt agt gct ctg gag cac gag tat ttc aaa 864
Ser Arg Arg Ile Thr Ala Arg Ser Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gat cta ggt ttt gta ccc tga 885
Asp Leu Gly Phe Val Pro 290
<210> 14 <211> 294 <212> PRT
<213> Pinus contorta <400> 14
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 15 10 15
Val Val Tyr Lys Ala Arg Asp Arg Leu Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val
50 55 60
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu
85 90 95
Leu Ala Lys Asp Pro Arg Leu Ile Lys Thr Phe Leu Tyr Gln Ile Leu
100 105 110
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 Lys
Ala 145 Thr
Gly
Ile
Glu
Glu 225 Phe
Glu
Ser
Asp
Pro 130 Asp
His
Ser
Phe
Ile 210 Glu
Pro
Pro
Arg
Leu 290
Gln
Phe
Glu
Arg
Ala 195 Asp
Thr
Lys
Ala
Arg 275 Gly
Asn Leu
Gly Leu
Val Val 165 His Tyr 180
Glu Met
Glu Leu
Trp Pro
Trp Pro 245 Gly Ile 260
Ile Thr
Leu
Ala 150 Thr
Ser
Val
Phe
Gly 230 Ala
Asp Ala Phe Val Pro
Ile 135 Arg
Leu
Thr
Asn
Lys 215 Val
Lys
Ile
Arg
Asp
Ala
Trp
Pro
Gln 200 Ile
Thr
Asp
Leu
Ser 280
Arg Lys Thr Phe Tyr
Val 185 Arg
Phe
Ser
Leu
Ser 265 Ala
Gly Ile 155 Arg Ala 170
Asp Val
Pro Leu Arg Val
Leu Pro 235 Ala Thr 250
Lys Met
Asn 140 Pro
Pro
Trp
Phe
Leu 220 Asp
Val Leu Leu Glu His
Ala
Val
Glu
Ser
Pro 205 Gly
Phe
Val
Cys
Glu 285
Leu Lys Leu Arg Ile
Val 190 Gly
Thr
Lys
Ser
Leu 270 Tyr
Thr Phe 160 Leu Leu 175
Gly Cys
Asp Ser
Pro Asn
Ser Ala 240 Gly Leu 255
Glu Pro Phe Lys
<210> 15 <211> 885 <212> DNA <213> Picea abies
<220>
<221> CDS
<222> (1)..(885)
<4 00> 15
atg gag cag tat gag aaa Met Glu Gln Tyr Glu Lys 1 5
gtg gtc tac aag gcc cgt Val Val Tyr Lys Ala Arg 20
aag aaa att cgt ttg gag Lys Lys Ile Arg Leu Glu 35
att aga gaa att tct ctt Ile Arg Glu Ile Ser Leu 50
agg ttg cag gat gtt gtc Arg Leu Gln Asp Val Val 65 70
gag tat ttg gac ttg gac Glu Tyr Leu Asp Leu Asp 85
cta gca aag gat cct cgt Leu Ala Lys Asp Pro Arg 100
cgt ggc att gcc tat tgt Arg Gly Ile Ala Tyr Cys 115
aaa cca caa aat ttg ctt Lys Pro Gln Asn Leu Leu 130
gcc gac ttt gga ctt gca Ala Asp Phe Gly Leu Ala 145 150
act cat gag gtg gtt aca Thr His Glu Val Val Thr 165
gtt gag aag ata gga gaa Val Glu Lys Ile Gly Glu 10
gat cgc ttg aca aat gag
Asp Arg Leu Thr Asn Glu 25
caa gaa gat gag ggt gta
Gln Glu Asp Glu Gly Val 40
ctc aaa gaa atg caa cat
Leu Lys Glu Met Gln His
55 60
cac agt gaa aag cgt ctc
His Ser Glu Lys Arg Leu 75
ctc aag aag cat atg gat
Leu Lys Lys His Met Asp 90
cta ate aaa aca ttt ctg
Leu Ile Lys Thr Phe Leu 105
cat tct cat cga gtt ctt
His Ser His Arg Val Leu 120
att gac cgc aaa acc aat
Ile Asp Arg Lys Thr Asn
135 140
agg gca ttt gga att cca
Arg Ala Phe Gly Ile Pro 155
ttg tgg tac cgt gca cca
Leu Trp Tyr Arg Ala Pro 170
gga aca tat ggt 4 8
Gly Thr Tyr Gly 15
acc ata gct ctc 96
Thr Ile Ala Leu 30
cca age act gca 144
Pro Ser Thr Ala 45
ggg aac ate gta 192
Gly Asn Ile Val
tat tta gtt ttt 240
Tyr Leu Val Phe 80
tct tgc ccc gag 288
Ser Cys Pro Glu 95
tat cag att ctg 336
Tyr Gln Ile Leu 110
cat cgt gat ttg 384
His Arg Asp Leu
125
gcg ttg aaa ctt 432
Ala Leu Lys Leu
gtg agg acc ttt 480
Val Arg Thr Phe 160
gag ate ttg ctt 528
Glu Ile Leu Leu 175 ggg tcc cga cat tat tcg Gly Ser Arg His Tyr Ser 180
ate ttt gct gaa atg gtg Ile Phe Ala Glu Met Val 195
gag att gat gaa etc ttt Glu Ile Asp Glu Leu Phe 210
gaa gaa aca tgg cca gga Glu Glu Thr Trp Pro Gly 225 230
ttc cca aag tgg cca gcc Phe Pro Lys Trp Pro Ala 245
gag cca gea gga att gat Glu Pro Ala Gly Ile Asp 260
agt aaa cgc ate act gct Ser Lys Arg Ile Thr Ala 275
gat cta ggt ttt gta ccc Asp Leu Gly Phe Val Pro 290
act cct gtt gat gtt tgg Thr Pro Val Asp Val Trp 185
aat cag cga cca ctt ttc Asn Gln Arg Pro Leu Phe 200
aag ata ttt aga gtg ctg Lys Ile Phe Arg Val Leu 215 220
gtc acc tet ctg cca gac Val Thr Ser Leu Pro Asp 235
aag gat ttg gea act gtg Lys Asp Leu Ala Thr Val 250
ctt ctc tcg aaa atg ttg Leu Leu Ser Lys Met Leu 265
cgt agt gct ctg gag cat Arg Ser Ala Leu Glu His 280
tga
tet gtg ggg tgt 576
Ser Val Gly Cys 190
cca gga gac tca 624
Pro Gly Asp Ser
205
ggg aca cca aat 672
Gly Thr Pro Asn
ttc aag tca gcc 720
Phe Lys Ser Ala 240
gtt cca ggt ctt 768
Val Pro Gly Leu 255
tgc ctg gag ccc 816
Cys Leu Glu Pro 270
gag tat ttc aaa 864
Glu Tyr Phe Lys
285
885
<210> 16
<211> 294
<212> PRT
<213> Picea abies
<400> 16 Met Glu Gln 1
Val Val Tyr
Lys Lys Ile 35
Ile Arg Glu 50
Arg Leu Gln 65
Glu Tyr Leu
Leu Ala Lys
Arg Gly Ile 115
Lys Pro Gln 130
Ala Asp Phe 145
Thr His Glu
Gly Ser Arg
Ile Phe Ala 195
Glu Ile Asp 210 Glu Glu Thr 225
Phe Pro Lys Glu Pro Ala Ser Lys Arg
Tyr
Lys
20
Arg
Ile
Asp
Asp
Asp 100 Ala
Asn
Gly
Val
His 180 Glu
Glu
Trp
Trp
Gly 260 Ile
Glu 5
Ala
Leu
Ser
Val
Leu
85
Pro
Tyr
Leu
Leu
Val 165 Tyr
Met
Leu
Pro
Pro 245 Ile
Thr
Lys Val
Arg Asp
Glu Gln
Leu Leu
55 Val His 70
Asp Leu
Arg Leu
Cys His
Leu Ile 135 Ala Arg 150
Thr Leu
Ser Thr
Val Asn
Phe Lys 215 Gly Val 230
Ala Lys Asp Leu Ala Arg
Glu
Arg
Glu
40
Lys
Ser
Lys
Ile
Ser 120 Asp
Ala
Trp
Pro
Gln 200 Ile
Thr
Asp
Leu
Ser
Lys
Leu
25
Asp
Glu
Glu
Lys
Lys 105 His
Arg
Phe
Tyr
Val 185 Arg
Phe
Ser
Leu
Ser 265 Ala
Ile
10
Thr
Glu
Met
Lys
His
90
Thr
Arg
Lys
Gly
Arg 170 Asp
Pro
Arg
Leu
Ala 250 Lys
Leu
Gly Glu
Asn Glu
Gly Val
Gln His 60
Arg Leu 75
Met Asp
Phe Leu
Val Leu
Thr Asn 140 Ile Pro 155
Ala Pro
Val Trp
Leu Phe
Val Leu 220 Pro Asp 235
Thr Val Met Leu Glu His
Gly
Thr
Pro
45
Gly
Tyr
Ser
Tyr
His 125 Ala
Val
Glu
Ser
Pro 205 Gly
Phe
Val
Cys
Glu
Thr
Ile
30
Ser
Asn
Leu
Cys
Gln 110 Arg
Leu
Arg
Ile
Val 190 Gly
Thr
Lys
Pro
Leu 270 Tyr
Tyr Gly 15
Ala Leu
Thr Ala
Ile Val
Val Phe 80 Pro Glu 95
Ile Leu
Asp Leu
Lys Leu
Thr Phe 160 Leu Leu 175
Gly Cys
Asp Ser
Pro Asn
Ser Ala 240 Gly Leu 255
Glu Pro Phe Lys 275 280 285
Asp Leu Gly Phe Val Pro 290
<210> 17
<211> 885
<212> DNA
<213> Saccharum officinarum
<220>
<221> CDS
<222> (1)..(885)
<400> 17
atg gag cag tac gag aag gtg gag aag ate ggg gag ggc acg tac ggg 48
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly
15 10 15
gtg gtg tac aag ggg ctg gac aag gcc acc aac gag acg ate gcg etc 96
Val Val Tyr Lys Gly Leu Asp Lys Ala Thr Asn Glu Thr Ile Ala Leu
20 25 30
aag aag ate cgc ctc gag cag gag gac gag ggc gtc ccg tcc acc gcc 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
ate cgc gag ate tet ctc ctc aag gag atg aac cac gac aac ate gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Asn His Asp Asn Ile Val
50 55 60
agg tta cat gat gtt ate cac age gag aag cgc ata tat ctt gtc ttc 240
Arg Leu His Asp Val Ile His Ser Glu Lys Arg Ile Tyr Leu Val Phe 65 70 75 80
gag ttc ctg gat ctg gac ctg aag aag ttc atg gac tet tgc ccg gag 288
Glu Phe Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu
85 90 95
ttt gct aag aat ccc act ttg att aag tca tac ctc tac cag ata ctc 336
Phe Ala Lys Asn Pro Thr Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu
100 105 110
cgt ggt gtt gct tac tgc cat tet cat aga ttt ctt cat cga gat ttg 384
Arg Gly Val Ala Tyr Cys His Ser His Arg Phe Leu His Arg Asp Leu
115 120 125
aaa cct cag aac tta ttg ata gat cgg cgt act aat aca ctg aag ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Thr Leu Lys Leu
130 135 140
gea gac ttt ggt tta tcc agg gea ttt gga att cct gtc cgt aca ttc 480
Ala Asp Phe Gly Leu Ser Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
act cat gag gta gtg aca tta tgg tac aga gct cca gaa att ctg ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
gga gcg aaa cag tat tcc aca cca gtc gat gta tgg tet gtg ggc tgt 576
Gly Ala Lys Gln Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ate ttt gcg gaa atg gtg aac caa aag cca cta ttc cct ggt gat tet 624
Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag ate gac gaa ctg ttt aag ata ttc agg gta cta ggt aca cca aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn
210 215 220
gaa caa agt tgg cca gga gtc agt tgt ttg cct gac ttc aag act gct 720
Glu Gln Ser Trp Pro Gly Val Ser Cys Leu Pro Asp Phe Lys Thr Ala 225 230 235 240
ttc ccc agg tgg cag gct cag gac ctg gea aca att gtc cca aat ctt 768
Phe Pro Arg Trp Gln Ala Gln Asp Leu Ala Thr Ile Val Pro Asn Leu
245 250 255
gaa cct gct ggt ttg gac ctt ctc tcg aaa atg ctt cga tac gag cca 816
Glu Pro Ala Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Tyr Glu Pro
260 265 270
age aaa aga ate aca gct agg caa gea ctt gag cat gag tac ttc aag 864 Ser Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gac ctt gaa atg gta cag tga 885
Asp Leu Glu Met Val Gln 290
<210> 18 <211> 294 <212> PRT
<213> Saccharum officinarum
<4 00> 18 Met Glu Gln 1
Val Val Tyr
Lys Lys Ile 35
Ile Arg Glu 50
Arg Leu His 65
Glu Phe Leu
Phe Ala Lys
Arg Gly Val 115
Lys Pro Gln 130
Ala Asp Phe 145
Thr His Glu
Gly Ala Lys
Ile Phe Ala 195
Glu Ile Asp 210 Glu Gln Ser 225
Phe Pro Arg
Glu Pro Ala
Ser Lys Arg 275
Asp Leu Glu 290
Tyr
Lys 20 Arg
Ile
Asp
Asp
Asn 100 Ala
Asn
Gly
Val
Gln 180 Glu
Glu
Trp
Trp
Gly 260 Ile
Met
Glu Lys Val 5
Gly Leu Asp
Leu Glu Gln
Ser Leu Leu 55
Val Ile His 70
Leu Asp Leu 85
Pro Thr Leu
Tyr Cys His
Leu Leu Ile 135
Leu Ser Arg 150
Val Thr Leu 165
Tyr Ser Thr
Met Val Asn
Leu Phe Lys 215
Pro Gly Val
230 Gln Ala Gln 245
Leu Asp Leu Thr Ala Arg Val Gln
Glu
Lys
Glu
40
Lys
Ser
Lys
Ile
Ser 120 Asp
Ala
Trp
Pro
Gln 200 Ile
Ser
Asp
Leu
Gln 280
Lys
Ala
25
Asp
Glu
Glu
Lys
Lys 105 His
Arg
Phe
Tyr
Val 185 Lys
Phe
Cys
Leu
Ser 265 Ala
Ile
10
Thr
Glu
Met
Lys
Phe
90
Ser
Arg
Arg
Gly
Arg 170 Asp
Pro
Arg
Leu
Ala 250 Lys
Leu
Gly
Asn
Gly
Asn
Arg
75
Met
Tyr
Phe
Thr
Ile 155 Ala
Val
Leu
Val
Pro 235 Thr
Met
Glu
Glu
Glu
Val
His 60 Ile
Asp
Leu
Leu
Asn 140 Pro
Pro
Trp
Phe
Leu 220 Asp
Ile
Leu
His
Gly
Thr
Pro
45
Asp
Tyr
Ser
Tyr
His 125 Thr
Val
Glu
Ser
Pro 205 Gly
Phe
Val
Arg
Glu 285
Thr
Ile
30
Ser
Asn
Leu
Cys
Gln 110 Arg
Leu
Arg
Ile
Val 190 Gly
Thr
Lys
Pro
Tyr 270 Tyr
Tyr Gly 15
Ala Leu
Thr Ala
Ile Val
Val Phe 80 Pro Glu 95
Ile Leu
Asp Leu
Lys Leu
Thr Phe 160 Leu Leu 175
Gly Cys
Asp Ser
Pro Asn
Thr Ala 240 Asn Leu 255
Glu Pro Phe Lys
<210> 19 <211> 885 <212> DNA
<213> Helianthus tuberosus
<220>
<221> CDS
<222> (1)..(885)
<400> 19
atg gag cag tac gag aag gtt gag aag att ggt gaa gga aca tac ggt 48 Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 gtg gtc tac aag gct cgt gac aaa gtg acc aat gaa aca att gct ttg 96 Val Val Tyr Lys Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu 20 25 30
aaa aag ate cgt ctg gaa caa gaa gat gag ggt gtc ccg age acg gct 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
ate aga gag att tca ctg ttg aag gag atg caa cat gga aac att gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val
50 55 60
agg tta cag gat gtt gtg cac agt gac aaa cga ttg tat cta gtt ttt 240
Arg Leu Gln Asp Val Val His Ser Asp Lys Arg Leu Tyr Leu Val Phe
65 70 75 80
gag tat ctg gac ctt gat ttg aag aag cac atg gac tcg tgt cca gag 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu
85 90 95
ttt tca aag gat cca cgc ctt gta aaa acg ttt ctt tat caa ate cta 336
Phe Ser Lys Asp Pro Arg Leu Val Lys Thr Phe Leu Tyr Gln Ile Leu
100 105 110
cgt ggc att gct tat tgt cat tcc cat aga gtt ctc cac aga gat cta 384
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aaa cct caa aac ttg tta att gat cgc cgt acc aat gea cta aaa ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
gcc gat ttt gga ttg gcc agg gcc ttt ggt ate cct gtc agg acg ttc 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe
145 150 155 160
aca cat gag gtg gtg aca ctg tgg tat aga gcc ccc gaa att ctt ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
ggg tcc cgt cac tat tet act cct gtt gat gtg tgg tcc gtt ggt tgt 576
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ata ttt gct gag atg gtg aac cag cga cca ctc ttt cct gga gac tca 624
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag att gat gaa ctt ttc aag att ttc agg ate atg gga act cca aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Met Gly Thr Pro Asn
210 215 220
gaa gag aca tgg cct ggt gtc act tet ctg cct gac ttt aag tcc gcc 720
Glu Glu Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala
225 230 235 240
ttt cca aag tgg tca tca aag gat ctg gea acc gtg gtc ccg aat ctt 768
Phe Pro Lys Trp Ser Ser Lys Asp Leu Ala Thr Val Val Pro Asn Leu
245 250 255
gaa aaa gcc ggt ctc gat ctc tta tgt aaa atg ctg tgg ctt gat ccc 816
Glu Lys Ala Gly Leu Asp Leu Leu Cys Lys Met Leu Trp Leu Asp Pro
260 265 270
agt aaa agg att aca gcc cgg acc gea ctg gag cat gaa tac ttc aaa 864
Ser Lys Arg Ile Thr Ala Arg Thr Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gat ate gga ttc gtg cca taa 885
Asp Ile Gly Phe Val Pro 290
<210> 20 <211> 294 <212> PRT
<213> Helianthus tuberosus <400> 20
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15
Val Val Tyr Lys Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val 50 55 60
Arg Leu Gln Asp Val Val His Ser Asp Lys Arg Leu Tyr Leu Val Phe 65 70 75 80
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu
85 90 95
Phe Ser Lys Asp Pro Arg Leu Val Lys Thr Phe Leu Tyr Gln Ile Leu
100 105 110
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Met Gly Thr Pro Asn
210 215 220
Glu Glu Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Ser Ser Lys Asp Leu Ala Thr Val Val Pro Asn Leu
245 250 255
Glu Lys Ala Gly Leu Asp Leu Leu Cys Lys Met Leu Trp Leu Asp Pro
260 265 270
Ser Lys Arg Ile Thr Ala Arg Thr Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
Asp Ile Gly Phe Val Pro 290
<210> 21
<211> 885
<212> DNA
<213> Daucus carota
<220>
<221> CDS
<222> (1)..(885)
<400> 21
atg gac cag tat gaa aag gtt gag aag att ggg gag ggg acg tat ggg 48
Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly
15 10 15
gta gtt tat aag gct cgt gac cgc gtt aca aat gaa act att gct tta 96
Val Val Tyr Lys Ala Arg Asp Arg Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
aag aaa att cgt tta gag cag gaa gat gag gga gtg cca age act gct 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
att aga gaa att tet tta ctg aag gag atg cag cat gaa aat att gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Glu Asn Ile Val
50 55 60
agg cta caa gat gtt gtg cat age gag aaa cgg ctg tat ctg gta ttt 240
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe
65 70 75 80
gaa tat ctg gac ctg gat ctg aag aaa cat atg gat tca tgt cca gag 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu
85 90 95
ttt gea aag gat cca cgt ctg att aaa atg ttt ctg tat caa ata ctg 336
Phe Ala Lys Asp Pro Arg Leu Ile Lys Met Phe Leu Tyr Gln Ile Leu
100 105 110
cgt ggt att gct tat tgt cat tcc cat aga gtt ctg cat cgc gat ctc 384
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 aaa ccc caa aac ctg ctc Lys Pro Gln Asn Leu Leu 130
gca gat ttt gga ctt gcc Ala Asp Phe Gly Leu Ala 145 150
acc cac gag gtg gtg aca Thr His Glu Val Val Thr 165
gga tcc cgc cac tac tcc Gly Ser Arg His Tyr Ser 180
att ttt gct gag atg gtg Ile Phe Ala Glu Met Val 195
gag att gat gaa tta ttt Glu Ile Asp Glu Leu Phe 210
gag gat acc tgg cct gga Glu Asp Thr Trp Pro Gly 225 230
ttc cca aaa tgg cca tct Phe Pro Lys Trp Pro Ser 245
gat gtg gcc ggt ctc aat Asp Val Ala Gly Leu Asn 260
age aga aga att act gcc Ser Arg Arg Ile Thr Ala 275
gat ate ggg att gtt cct Asp Ile Gly Ile Val Pro 290
ata gat cgc cgt acc aat Ile Asp Arg Arg Thr Asn 135 140
agg gca ttt gga att cca Arg Ala Phe Gly Ile Pro 155
ctt tgg tac agg gcc cca Leu Trp Tyr Arg Ala Pro 170
aca cca gtt gat gtg tgg Thr Pro Val Asp Val Trp 185
aac caa cag cca ttg ttt Asn Gln Gln Pro Leu Phe 200
aag att ttc aga att gtg Lys Ile Phe Arg Ile Val 215 220
gta aca gct ctt cct gat Val Thr Ala Leu Pro Asp 235
aag gaa ctg gga aac gta Lys Glu Leu Gly Asn Val 250
ctc ctc aaa aaa atg ctt Leu Leu Lys Lys Met Leu 265
agg agt gca ctt gag cat Arg Ser Ala Leu Glu His 280
taa
gct cta aag ctt 432
Ala Leu Lys Leu
gtc agg aca ttt 480
Val Arg Thr Phe 160
gag ata ctc ctt 528
Glu Ile Leu Leu 175
tca gtt ggt tgt 576
Ser Val Gly Cys 190
ccg ggc gat tct 624
Pro Gly Asp Ser
205
ggt acc cca aat 672
Gly Thr Pro Asn
ttt aag tct gcc 720
Phe Lys Ser Ala 240
gtc cca aat ctc 768
Val Pro Asn Leu 255
tgc ttg gat ccc 816
Cys Leu Asp Pro 270
gaa tac ttc aag 864
Glu Tyr Phe Lys
285
885
<210> 22 <211> 294 <212> PRT
<213> Daucus carota
<400> 22
Met Asp Gln Tyr Glu 1 5 Val Val Tyr Lys Ala 20 Lys Lys Ile Arg Leu 35 Ile Arg Glu Ile Ser 50 Arg Leu Gln Asp Val 65 Glu Tyr Leu Asp Leu 85 Phe Ala Lys Asp Pro 100 Arg Gly Ile Ala Tyr 115 Lys Pro Gln Asn Leu 130 Ala Asp Phe Gly Leu 145 Thr His Glu Val Val 165 Gly Ser Arg His Tyr 180 Ile Phe Ala Glu Met 195
Lys Val Glu Lys Ile 10
Arg Asp Arg Val Thr 25
Glu Gln Glu Asp Glu 40
Leu Leu Lys Glu Met 55
Val His Ser Glu Lys 70
Asp Leu Lys Lys His 90
Arg Leu Ile Lys Met 105
Cys His Ser His Arg 120
Leu Ile Asp Arg Arg 135
Ala Arg Ala Phe Gly 150
Thr Leu Trp Tyr Arg 170
Ser Thr Pro Val Asp 185
Val Asn Gln Gln Pro 200
Gly Glu Gly Thr Tyr Gly 15
Asn Glu Thr Ile Ala Leu 30
Gly Val Pro Ser Thr Ala 45
Gln His Glu Asn Ile Val 60
Arg Leu Tyr Leu Val Phe 75 80
Met Asp Ser Cys Pro Glu 95
Phe Leu Tyr Gln Ile Leu 110
Val Leu His Arg Asp Leu 125
Thr Asn Ala Leu Lys Leu 140
Ile Pro Val Arg Thr Phe 155 160
Ala Pro Glu Ile Leu Leu 175
Val Trp Ser Val Gly Cys 190
Leu Phe Pro Gly Asp Ser 205 Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Val Gly Thr Pro Asn
210 215 220
Glu Asp Thr Trp Pro Gly Val Thr Ala Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Pro Ser Lys Glu Leu Gly Asn Val Val Pro Asn Leu
245 250 255
Asp Val Ala Gly Leu Asn Leu Leu Lys Lys Met Leu Cys Leu Asp Pro
260 265 270
Ser Arg Arg Ile Thr Ala Arg Ser Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
Asp Ile Gly Ile Val Pro 290
<210> 23 <211> 885 <212> DNA
<213> Coffea arabica
<220>
<221> CDS
<222> (1)..(885)
<400> 23
atg gat cag tat gag aag Met Asp Gln Tyr Glu Lys 1 5
gtg gtg tac aag gca cgt Val Val Tyr Lys Ala Arg 20
aag aag att cgt ctg gag Lys Lys Ile Arg Leu Glu 35
att aga gaa att tct ctc Ile Arg Glu Ile Ser Leu 50
agg ttg cag gat gtg gtg Arg Leu Gln Asp Val Val 65 70
gag tat ctg gac ttg gat Glu Tyr Leu Asp Leu Asp 85
ttc tct aag gac cca cgc Phe Ser Lys Asp Pro Arg 100
cgt ggt ate gca tat tgc Arg Gly Ile Ala Tyr Cys 115
aaa cca caa aac ttg ctc Lys Pro Gln Asn Leu Leu 130
gca gat ttt gga ttg gcc Ala Asp Phe Gly Leu Ala 145 150
act cat gag gtt gtt acg Thr His Glu Val Val Thr 165
gga tca cgc cac tat tct Gly Ser Arg His Tyr Ser 180
ata ttt gct gag atg gtg Ile Phe Ala Glu Met Val 195
gag ata gat gaa ctc ttc Glu Ile Asp Glu Leu Phe 210
gag gat act tgg cct gga
gtg gag aag ata ggg gaa Val Glu Lys Ile Gly Glu 10
gac aag tcg act aat gaa Asp Lys Ser Thr Asn Glu 25
cag gaa gat gaa ggt gtg Gln Glu Asp Glu Gly Val 40
ttg aaa gag atg cag cat Leu Lys Glu Met Gln His 55 60
cac age gag aag cgc tta His Ser Glu Lys Arg Leu 75
ctg aag aag cac atg gat Leu Lys Lys His Met Asp 90
ctt gta aaa atg ttt ctg Leu Val Lys Met Phe Leu 105
cat tct cac aga gtt ctt His Ser His Arg Val Leu 120
ata gat cgc cgt act aat Ile Asp Arg Arg Thr Asn 135 140
cgt gcc ttt ggt att cct Arg Ala Phe Gly Ile Pro 155
ctg tgg tac agg gca cca Leu Trp Tyr Arg Ala Pro 170
act cct gtt gac gtg tgg Thr Pro Val Asp Val Trp 185
aac cag cgg cct ttg ttc Asn Gln Arg Pro Leu Phe 200
aaa att ttc aga gtt atg Lys Ile Phe Arg Val Met 215 220
gta acc tct ctg cct gat
gga acg tat gga 48
Gly Thr Tyr Gly 15
act att gct ttg 96
Thr Ile Ala Leu 30
ccg age act gct 144
Pro Ser Thr Ala 45
gga aac att gtc 192
Gly Asn Ile Val
tat ctt gta ttt 240
Tyr Leu Val Phe 80
tcc tgt cca gaa 288
Ser Cys Pro Glu 95
tat caa ate ctt 336
Tyr Gln Ile Leu 110
cat aga gac ttg 384
His Arg Asp Leu
125
gca ctg aag ctt 432
Ala Leu Lys Leu
gtc agg aca ttt 480
Val Arg Thr Phe 160
gaa ata cta ctt 528
Glu Ile Leu Leu 175
tca gtt ggc tgc 576
Ser Val Gly Cys 190
cct ggg gat tct 624
Pro Gly Asp Ser
205
ggc act cca aat 672
Gly Thr Pro Asn
ttc aag tct gca 720 Glu Asp Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala
225 230 235 240
ttt cca agg tgg ctt tca cag gat ctg gca act gtg gtt ccc aat ctt 7 68
Phe Pro Arg Trp Leu Ser Gln Asp Leu Ala Thr Val Val Pro Asn Leu
245 250 255
gat gct gct ggt ctt gat ctc ctg cgt aaa atg ctg tgc ctg gat ccc 816
Asp Ala Ala Gly Leu Asp Leu Leu Arg Lys Met Leu Cys Leu Asp Pro
260 265 270
age aag aga ate aca gct agg aat gca ctt gag cat gag tac ttc aaa 8 64
Ser Lys Arg Ile Thr Ala Arg Asn Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gat ate ggt ttt gtc cct taa 885
Asp Ile Gly Phe Val Pro 290
<210> 24 <211> 294 <212> PRT
<213> Coffea arabica <400> 24
Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 15 10 15
Val Val Tyr Lys Ala Arg Asp Lys Ser Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val
50 55 60
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu
85 9.0 95
Phe Ser Lys Asp Pro Arg Leu Val Lys Met Phe Leu Tyr Gln Ile Leu
100 105 110
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Met Gly Thr Pro Asn
210 215 220
Glu Asp Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
Phe Pro Arg Trp Leu Ser Gln Asp Leu Ala Thr Val Val Pro Asn Leu
245 250 255
Asp Ala Ala Gly Leu Asp Leu Leu Arg Lys Met Leu Cys Leu Asp Pro
260 265 270
Ser Lys Arg Ile Thr Ala Arg Asn Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
Asp Ile Gly Phe Val Pro 290
<210> 25 <211> 885 <212> DNA
<213> Helianthus annuus
<220> <221> CDS <222> (1) . . (885)
<400> 25
atg gag cag tac gag aag gtt gag aag att ggt gaa gga aca tat ggt 48
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly
1 5 10 15
gtg gtc tac aag gct cgt gac aaa gtg acc aat gaa aca att gct ttg 96
Val Val Tyr Lys Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
aaa aag ate cgt ttg gag caa gaa gat gag ggt gtc ccg age acg gct 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
ate aga gag att tca ctg ttg aag gag atg caa cat gga aac att gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val
50 55 60
agg tta cag gat gtt gtg cac agt gac aaa cga ttg tat cta gtt ttt 240
Arg Leu Gln Asp Val Val His Ser Asp Lys Arg Leu Tyr Leu Val Phe 65 70 75 80
gag tat ctg gac ctt gat ttg aag aag cac atg gac tcg tgt cca gag 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu
85 90 95
ttt tca aag gat cca cgc ctt gta aaa acg ttt ctt tat caa ate cta 336
Phe Ser Lys Asp Pro Arg Leu Val Lys Thr Phe Leu Tyr Gln Ile Leu
100 105 110
cgt ggc att gct tat tgt cat tcc cat aga gtt ctc cac aga gat cta 384
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aaa cct caa aac ttg tta att gat cgc cgt acc aat gea cta aaa ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
gcc gat ttt gga ttg gcc agg gcc ttt ggt ate cct gtc agg aca ttc 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
aca cat gag gtg gtg aca ctg tgg tat aga gcc ccc gaa att ctt ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
ggg tcc cgt cac tat tet act cct gtt gat gtg tgg tcc gtt ggt tgt 576
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ata ttt gct gag atg gtg aac cag cga cca ctc ttt cct gga gac tca 624
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag att gat gaa ctt ttc aag att ttc agg ate atg gga act cca aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Met Gly Thr Pro Asn
210 215 220
gaa gag aca tgg cct ggc gtc act tet ctg cct gac ttt aag tcc gcc 720
Glu Glu Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
ttt cca aag tgg tca tca aag gat ctg gea acc gtg gtc ccg aat ctt 768
Phe Pro Lys Trp Ser Ser Lys Asp Leu Ala Thr Val Val Pro Asn Leu
245 250 255
gaa aaa acc ggt ctc gat ctc tta cgt aaa atg ctg tgc ttg gat ccc 816
Glu Lys Thr Gly Leu Asp Leu Leu Arg Lys Met Leu Cys Leu Asp Pro
260 265 270
agt aaa aga att aca gcc cgg acc gea ctg gag cat gaa tac ttc aaa 864
Ser Lys Arg Ile Thr Ala Arg Thr Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gat ate gga ttc gtg cca taa 885
Asp Ile Gly Phe Val Pro 290
<210> 26 <211> 294 <212> PRT
<213> Helianthus annuus <400> 26 Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu 20 25 30 Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val 50 55 60 Arg Leu Gln Asp Val Val His Ser Asp Lys Arg Leu Tyr Leu Val Phe 65 70 75 80 Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu 85 90 95 Phe Ser Lys Asp Pro Arg Leu Val Lys Thr Phe Leu Tyr Gln Ile Leu 100 105 110 Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu 130 135 140 Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160 Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu 165 170 175 Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys 180 185 190 Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser 195 200 205 Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Met Gly Thr Pro Asn 210 215 220 Glu Glu Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240 Phe Pro Lys Trp Ser Ser Lys Asp Leu Ala Thr Val Val Pro Asn Leu 245 250 255 Glu Lys Thr Gly Leu Asp Leu Leu Arg Lys Met Leu Cys Leu Asp Pro 260 265 270 Ser Lys Arg Ile Thr Ala Arg Thr Ala Leu Glu His Glu Tyr Phe Lys 275 280 285 Asp Ile Gly Phe Val Pro 290 <210> 27 <211> 885 <212> DNA <213> Populus tremula χ Populus tremuloides <220> <221> CDS <222> (l)..l !885) <400> 27 atg gat cag tat gag aaa gtg gaa aaa att ggt gaa gga acc tac gga Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 gtg gtc tac aaa gct cgt gat cgt gtc acc aat gag acc att gct ttg Val Val Tyr Lys Ala Arg Asp Arg Val Thr Asn Glu Thr Ile Ala Leu 20 25 30 aag aag ate cgt ttg gag cag gaa gac gag ggc gta CCC age act gct Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala 35 40 45 ate cga gaa att tet CtC ttg aaa gag atg cag cat ggt aac att gtc Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val 50 55 60 aga Ctg cag gat gtg gtg cac agt gag aag cgc Ctt tac ttg gtt ttt Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80 gag tat cta gac ttg gat Glu Tyr Leu Asp Leu Asp 85
ttt gct aag gat cca cgc Phe Ala Lys Asp Pro Arg 100
cgt ggc att gct tac tgc Arg Gly Ile Ala Tyr Cys 115
aaa cct cag aat ttg ctt Lys Pro Gln Asn Leu Leu 130
gca gat ttt ggt ctg gct Ala Asp Phe Gly Leu Ala 145 150
aca cat gag gtt gtt acc Thr His Glu Val Val Thr 165
gga tct cgc cat tac tca Gly Ser Arg His Tyr Ser 180
ata ttt gct gag atg gtg Ile Phe Ala Glu Met Val 195
gag att gat gaa cta ttc Glu Ile Asp Glu Leu Phe 210
gag gac acg tgg cct gga Glu Asp Thr Trp Pro Gly 225 230
ttc cct aag tgg cct tct Phe Pro Lys Trp Pro Ser 245
gaa aaa gct ggt gtg gat Glu Lys Ala Gly Val Asp 260
act aaa aga att act gcc Thr Lys Arg Ile Thr Ala 275
gat att ggt ttt gta cca Asp Ile Gly Phe Val Pro 290
ttg aag aag cac atg gat Leu Lys Lys His Met Asp 90
ctt gtg aaa aca ttt ctt Leu Val Lys Thr Phe Leu 105
cat tct cat aga gtt ctg His Ser His Arg Val Leu 120
att gat cgc cgt acc aac Ile Asp Arg Arg Thr Asn 135 140
aga gca ttt ggt ata cct Arg Ala Phe Gly Ile Pro 155
ctg tgg tat aga gcc cct Leu Trp Tyr Arg Ala Pro 170
act cca gtt gat gtg tgg Thr Pro Val Asp Val Trp 185
aac cag aag cca tta ttc Asn Gln Lys Pro Leu Phe 200
aaa att ttc aga ate ttg Lys Ile Phe Arg Ile Leu 215 220
gtt act tct ttg ccc gac Val Thr Ser Leu Pro Asp 235
aag gat ttg gca act gta Lys Asp Leu Ala Thr Val 250
ctt ctc tct aaa atg ctt Leu Leu Ser Lys Met Leu 265
agg agt gct ttg gag cat Arg Ser Ala Leu Glu His 280
taa
tct tct cct gaa 288
Ser Ser Pro Glu 95
tat caa att ctc 336
Tyr Gln Ile Leu 110
cat cga gat ttg 384
His Arg Asp Leu
125
gct ctg aag ctt 432
Ala Leu Lys Leu
gtt agg aca ttt 480
Val Arg Thr Phe 160
gaa att ctg ctt 528
Glu Ile Leu Leu 175
tcg gtg gga tgt 576
Ser Val Gly Cys 190
cca ggg gat tcc 624
Pro Gly Asp Ser
205
ggt act cca aat 672
Gly Thr Pro Asn
ttc aag agt gca 720
Phe Lys Ser Ala 240
gtt cca acc ctt 768
Val Pro Thr Leu 255
ttc ttg gat ccc 816
Phe Leu Asp Pro · 270
gaa tac ttc aag 864
Glu Tyr Phe Lys
285
885
<210> 28 <211> 294 <212> PRT
<213> Populus tremula χ Populus tremuloides
<400> 28
Met Asp Gln Tyr Glu Lys Val Glu 1 5 Val Val Tyr Lys Ala Arg Asp Arg 20 Lys Lys Ile Arg Leu Glu Gln Glu 35 40 Ile Arg Glu Ile Ser Leu Leu Lys 50 55 Arg Leu Gln Asp Val Val His Ser 65 70 Glu Tyr Leu Asp Leu Asp Leu Lys 85 Phe Ala Lys Asp Pro Arg Leu Val 100 Arg Gly Ile Ala Tyr Cys His Ser 115 120 Lys Pro Gln Asn Leu Leu Ile Asp
Lys Ile Gly Glu Gly Thr Tyr Gly
10 15
Val Thr Asn Glu Thr Ile Ala Leu 25 30
Asp Glu Gly Val Pro Ser Thr Ala 45
Glu Met Gln His Gly Asn Ile Val 60
Glu Lys Arg Leu Tyr Leu Val Phe
75 80
Lys His Met Asp Ser Ser Pro Glu
90 95
Lys Thr Phe Leu Tyr Gln Ile Leu 105 110
His Arg Val Leu His Arg Asp Leu 125
Arg Arg Thr Asn Ala Leu Lys Leu 130 135 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser
195 200 205
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Leu Gly Thr Pro Asn
210 215 220
Glu Asp Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Pro Ser Lys Asp Leu Ala Thr Val Val Pro Thr Leu
245 250 255
Glu Lys Ala Gly Val Asp Leu Leu Ser Lys Met Leu Phe Leu Asp Pro
260 265 270
Thr Lys Arg Ile Thr Ala Arg Ser Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
Asp Ile Gly Phe Val Pro 290
<210> 29
<211> 882
<212> DNA
<213> Nicotiana tabacum
<220> <221> CDS <222> (1)..(882)
<400> 29
atg gac cag tat gaa aaa gtt gag aag att ggg gaa gga aca tac ggt 4 8
Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly
15 10 15
gta gtg tac aag gct cgt gat cgt gta act aat gaa aca att gcg ctg 96
Val Val Tyr Lys Ala Arg Asp Arg Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
aag aaa ata agg ctg gag cag gaa gat gag gga gta cca age aca gct 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
att aga gaa ate tet ctt ttg aaa gag atg cag cat gct aat att gtg 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Ala Asn Ile Val
50 55 60
agg ttg cag gat gtt gtg cac agt gaa aag cga ttg tat cta gtt ttt 240
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe
65 70 75 80
gaa tat ctt gac ttg gac ttg aag aag cac atg gat tca tet cct gaa 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Ser Pro Glu
85 90 95
ttc tet aag gat cca cgt ctg gtt aaa atg ttt ttg tat caa ata ctc 336
Phe Ser Lys Asp Pro Arg Leu Val Lys Met Phe Leu Tyr Gln Ile Leu
100 105 110
cgt ggt att gct tat tgt cat tet cat aga gtt ctt cat cga gat ttg 384
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aag cct caa aac ttg ctg ata gat cga cgt aca aat gct tta aag ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
gea gac ttt gga ttg gct aga gea ttt ggt att cct gtc aga act ttc 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe
145 150 155 160
act cat gag gtg gtg aca ttg tgg tac agg gea cca gaa ata ctg ctg 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
gga tca cgc cat tat tet act cct gtt gat gtg tgg tca gtt ggt tgc 576 Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ata ttt gct gag atg gtg act cag cgc cct ctg ttt cct ggt gac tcc 624
Ile Phe Ala Glu Met Val Thr Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag att gat gaa ctt ttc aag att ttc aga gtg atg ggt act cca aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Met Gly Thr Pro Asn
210 215 220
gag gat aca tgg cct gga gtg act act ctg cct gat ttt aaa tct gcc 720
Glu Asp Thr Trp Pro Gly Val Thr Thr Leu Pro Asp Phe Lys Ser Ala
225 230 235 240
ttc cca aaa tgg cct tct aag gac ctg gca act att gtc cca aat ctt 768
Phe Pro Lys Trp Pro Ser Lys Asp Leu Ala Thr Ile Val Pro Asn Leu
245 250 255
gat gga gca ggc ctt gat ctt ctt gat aaa atg ctc cgc ttg gat ccc 816
Asp Gly Ala Gly Leu Asp Leu Leu Asp Lys Met Leu Arg Leu Asp Pro
260 265 270
age aag aga ate act gcc agg aat gcc ctt gag cat gag tac ttc aag 864
Ser Lys Arg Ile Thr Ala Arg Asn Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gat att ggg tat gtt ccg 882
Asp Ile Gly Tyr Val Pro 290
<210> 30 <211> 294 <212> PRT
<213> Nicotiana tabacum
<400> 30 Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Ala Arg Asp Arg Val Thr Asn Glu Thr Ile Ala Leu 20 25 30 Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Ala Asn Ile Val 50 55 60 Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80 Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Ser Pro Glu 85 90 95 Phe Ser Lys Asp Pro Arg Leu Val Lys Met Phe Leu Tyr Gln Ile Leu 100 105 110 Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu 130 135 140 Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160 Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu 165 170 175 Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys 180 185 190 Ile Phe Ala Glu Met Val Thr Gln Arg Pro Leu Phe Pro Gly Asp Ser 195 200 205 Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Met Gly Thr Pro Asn 210 215 220 Glu Asp Thr Trp Pro Gly Val Thr Thr Leu Pro Asp Phe Lys Ser Ala 225 230 235 240 Phe Pro Lys Trp Pro Ser Lys Asp Leu Ala Thr Ile Val Pro Asn Leu 245 250 255 Asp Gly Ala Gly Leu Asp Leu Leu Asp Lys Met Leu Arg Leu Asp Pro 260 265 270 Ser Lys Arg Ile Thr Ala Arg Asn Ala Leu Glu His Glu Tyr Phe Lys 275 280 285 Asp Ile Gly Tyr Val Pro 290
<210> 31 <211> 885 <212> DNA
<213> Triticum aestivum <220> <221> CDS <222> (1)..(885)
<400> 31
atg gag cag tac gag aag gtg gag aag ate ggg gag ggc acg tac ggg 48
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15
gtg gtg tac aag gcc cgg gac agg acc acc aac gag acc ate gcg ctc 96
Val Val Tyr Lys Ala Arg Asp Arg Thr Thr Asn Glu Thr Ile Ala Leu
20 25 30
aag aag ate cgc ctg gag cag gag gac gag ggc gtc ccc tcc acc gcc 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
ate cgc gag ate tcg ctc ctc aag gag atg cag cac ggc aac ate gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val
50 55 60
aag ctg cac gat gtt gtc cac age gag aag cgc ata tgg ctc gtc ttt 240
Lys Leu His Asp Val Val His Ser Glu Lys Arg Ile Trp Leu Val Phe
65 70 75 80
gag tac ctg gat ctg gac ctg aag aag ttc atg gac tcc tgt cca gag 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu
85 90 95
ttt gcc aag age ccc gcc ttg ate aag tca tat ctc tat cag ata ctc 336
Phe Ala Lys Ser Pro Ala Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu
100 105 110
cgc ggc gtt gct tac tgt cat tet cat aga gtt ctt cat cga gat ttg 384
Arg Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aaa cct cag aat tta ttg ata gac cgg cgt act aat gea ctg aag ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
gea gac ttt ggt tta gea agg gea ttt gga att cct gtc cgt aca ttt 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe
145 150 155 160
act cat gag gta gta aca tta tgg tac aga gct cct gaa ate ctt ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
gga gea agg cag tat tcc aca cca gtt gac gtg tgg tca gtg ggc tgt 576
Gly Ala Arg Gln Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ate ttt gea gaa atg gtg aac cag aaa cca ctg ttc cct ggc gat tet 624
Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag att gat gag cta ttt aag ata ttc agg gta ctc ggc act cca aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn
210 215 220
gaa caa act tgg cca ggc gtg agt tcc ttg cct gac tac aag tcc gcc 720
Glu Gln Thr Trp Pro Gly Val Ser Ser Leu Pro Asp Tyr Lys Ser Ala
225 230 235 240
ttc ccc agg tgg cag gea gag gac ctt gea acc gtt gtc ccc aat ctt 768
Phe Pro Arg Trp Gln Ala Glu Asp Leu Ala Thr Val Val Pro Asn Leu
245 250 255
gaa cct gtt ggc ctg gac ctt ctc tcg aaa atg ctt cgg ttc gag cca 816
Glu Pro Val Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Phe Glu Pro
260 265 270
aac aag agg ate acg gct agg cag gct ctt gag cat gag tac ttc aag 864
Asn Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys 275 280 285 gac atg gag atg gta cag tga 885
Asp Met Glu Met Val Gln 290
<210> 32 <211> 294 <212> PRT
<213> Triticum aestivum <400> 32 Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Ala Arg Asp Arg Thr Thr Asn Glu Thr Ile Ala Leu 20 25 30 Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val 50 55 60 Lys Leu His Asp Val Val His Ser Glu Lys Arg Ile Trp Leu Val Phe 65 70 75 80 Glu Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu 85 90 95 Phe Ala Lys Ser Pro Ala Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu 100 105 110 Arg Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu 130 135 140 Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160 Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu 165 170 175 Gly Ala Arg Gln Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys 180 185 190 Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser 195 200 205 Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn 210 215 220 Glu Gln Thr Trp Pro Gly Val Ser Ser Leu Pro Asp Tyr Lys Ser Ala 225 230 235 240 Phe Pro Arg Trp Gln Ala Glu Asp Leu Ala Thr Val Val Pro Asn Leu 245 250 255 Glu Pro Val Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Phe Glu Pro 260 265 270 Asn Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys 275 280 285 Asp Met Glu Met Val Gln 290 <210> 33 <211> 885 <212> DNA <213> Medicago sativa <220> <221> CDS <222> (1)..( !885) <400> 33 atg gaa cag tac gag aaa gtt gag aag ata gga gaa ggt act tac ggt Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 gtg gtt tac aag gct cgt gac cgt gct acc aat gag acg ata gct ttg Val Val Tyr Lys Ala Arg Asp Arg Ala Thr Asn Glu Thr Ile Ala Leu 20 25 30 aag aag att cgt Ctt gag cag gaa gat gag gga gtt ccg agt acc gct Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
att cga gag att tct ctc ttg aag gaa atg cag cac agg aac att gtt 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Arg Asn Ile Val
50 55 60
agg ttg cag gat gtg gtg cac agt gag aag cga ttg tat ctg gtt ttt 240
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80
gag tac ctt gac ttg gat cta aag aag ttt atg gat tca tct cca gaa 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Ser Pro Glu
85 90 95
ttt gca aaa gat caa cgg caa ata aag atg ttc ctt tat caa att ctc 336
Phe Ala Lys Asp Gln Arg Gln Ile Lys Met Phe Leu Tyr Gln Ile Leu
100 105 110
tgt ggc att gct tac tgt cat tct cat aga gtt ctt cat aga gac ttg 384
Cys Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aaa cca cag aat ctg ctg att gat cgc age tct aat gcc gta aag ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Ser Ser Asn Ala Val Lys Leu
130 135 140
gca gat ttt gga ttg gcc agg gca ttt gga att cct gtc agg aca ttt 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
aca cat gag gtg gtg aca ctc tgg tac aga gct cca gaa ata ttg ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
ggg tct cgt cat tat tct acc ccg gtt gat gtc tgg tca gtg gga tgc 576
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ata ttt gca gag atg ata aac caa cgg cca ctt ttc cca ggg gac tct 624
Ile Phe Ala Glu Met Ile Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag att gat gaa ttg ttt aaa ata ttc aga ate acg ggt aca ccg aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Thr Gly Thr Pro Asn
210 215 220
gag gaa aca tgg cct gga gtg act tca ttg cct gat ttt aaa tca gcc 720
Glu Glu Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
ttt ccc aag tgg cca gct aag gac ctg gca act caa gtc cca aat ctg 768
Phe Pro Lys Trp Pro Ala Lys Asp Leu Ala Thr Gln Val Pro Asn Leu
245 250 255
gag cca gct ggt ctt gat ctt cta tcc agt act tgt cgc ttg gat ccc 816
Glu Pro Ala Gly Leu Asp Leu Leu Ser Ser Thr Cys Arg Leu Asp Pro
260 265 270
acc aga aga att act gcc agg gga gct ctt gag cat gaa tac ttc aaa 864
Thr Arg Arg Ile Thr Ala Arg Gly Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gac att aag ttt gtc cca tga 885
Asp Ile Lys Phe Val Pro 290
<210> 34 <211> 294 <212> PRT
<213> Medicago sativa
<400> 34
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 15 10 15
Val Val Tyr Lys Ala Arg Asp Arg Ala Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Arg Asn Ile Val
50 55 60
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65
Glu Tyr Leu Asp Leu 85
Phe Ala Lys Asp Gln 100
Cys Gly Ile Ala Tyr 115
Lys Pro Gln Asn Leu 130
Ala Asp Phe Gly Leu 145
Thr His Glu Val Val 165
Gly Ser Arg His Tyr 180
Ile Phe Ala Glu Met 195
Glu Ile Asp Glu Leu 210
Glu Glu Thr Trp Pro 225
Phe Pro Lys Trp Pro 245
Glu Pro Ala Gly Leu 260
Thr Arg Arg Ile Thr 275
Asp Ile Lys Phe Val 290
70 75
Asp Leu Lys Lys Phe Met 90
Arg Gln Ile Lys Met Phe 105
Cys His Ser His Arg Val 120
Leu Ile Asp Arg Ser Ser 135
Ala Arg Ala Phe Gly Ile 150 155
Thr Leu Trp Tyr Arg Ala 170
Ser Thr Pro Val Asp Val 185
Ile Asn Gln Arg Pro Leu 200
Phe Lys Ile Phe Arg Ile 215
Gly Val Thr Ser Leu Pro 230 235
Ala Lys Asp Leu Ala Thr 250
Asp Leu Leu Ser Ser Thr 265
Ala Arg Gly Ala Leu Glu 280
Pro
80
Asp Ser Ser Pro Glu 95
Leu Tyr Gln Ile Leu 110
Leu His Arg Asp Leu 125
Asn Ala Val Lys Leu 140
Pro Val Arg Thr Phe 160
Pro Glu Ile Leu Leu 175
Trp Ser Val Gly Cys 190
Phe Pro Gly Asp Ser 205
Thr Gly Thr Pro Asn 220
Asp Phe Lys Ser Ala 240
Gln Val Pro Asn Leu 255
Cys Arg Leu Asp Pro 270
His Glu Tyr Phe Lys 285
<210> 35 <211> 1283 <212> DNA
<213> Antirrhinum majus
<220>
<221> CDS
<222> (29)..(913)
<223> η significa a ou g ou c ou t/u, s significa g ou c
<400> 35
gtacatggtt tcatctcatc gatctctg atg gag cag tat gaa aag gtt gag 52
Met Glu Gln Tyr Glu Lys Val Glu 1 5
aag att ggg gag gga acg tat gga gtg gta tac aag gct cgt gat cgt 100
Lys Ile Gly Glu Gly Thr Tyr Gly Val Val Tyr Lys Ala Arg Asp Arg
10 15 20
gta aca aat gag act ata gcc ttg aag aaa ate cgt cta gag cag gaa 148
Val Thr Asn Glu Thr Ile Ala Leu Lys Lys Ile Arg Leu Glu Gln Glu
25 30 35 40
gat gag gga gtg ccc age aca gct ate aga gag att tet ctc ttg aaa 196
Asp Glu Gly Val Pro Ser Thr Ala Ile Arg Glu Ile Ser Leu Leu Lys
45 50 55
gag atg caa cat ggg aat ate gtg agg ttg cag gat gtg gtg cac agt 244
Glu Met Gln His Gly Asn Ile Val Arg Leu Gln Asp Val Val His Ser
60 65 70
gag aag cgc ttg tac ctg gtg ttt gaa tat ctg gac ttg gat ttg aaa 292
Glu Lys Arg Leu Tyr Leu Val Phe Glu Tyr Leu Asp Leu Asp Leu Lys
75 80 85
aaa cat atg gat tca tgc cca gaa ttc tcc cag gat cct cgt ttg gtt 340
Lys His Met Asp Ser Cys Pro Glu Phe Ser Gln Asp Pro Arg Leu Val
90 95 100
aaa atg ttt ctg tat caa ata cta cgt ggt ate gcc tac tgt cat tet 388
Lys Met Phe Leu Tyr Gln Ile Leu Arg Gly Ile Ala Tyr Cys His Ser
105 110 115 120
cat cgt gtc ctt cat cga gat ttg aag cct caa aac ttg ctg ata gac 436 His Arg Val Leu His Arg Asp Leu Lys Pro Gln Asn Leu Leu Ile Asp
125 130 135
cgc cgt acc aat gca tta aag ctt gct gac ttt gga ttg gcc aga gca 484
Arg Arg Thr Asn Ala Leu Lys Leu Ala Asp Phe Gly Leu Ala Arg Ala
140 145 150
ttt ggt att cca gtc agg act ttt aca cat gag gtt gtg aca ctg tgg 532
Phe Gly Ile Pro Val Arg Thr Phe Thr His Glu Val Val Thr Leu Trp
155 160 165
tac agg gct cca gaa ata cta ctt gga tct cgc cat tat tct act cca 580
Tyr Arg Ala Pro Glu Ile Leu Leu Gly Ser Arg His Tyr Ser Thr Pro
170 175 180
gtg gat gtc tgg tca gtt ggt tgt ata ttt gct gaa atg gtt aac caa 628
Val Asp Val Trp Ser Val Gly Cys Ile Phe Ala Glu Met Val Asn Gln 185 190 195 200
cgg cct ttg ttt cct ggg gac tct gag att gat gaa cta ttc aaa att 676
Arg Pro Leu Phe Pro Gly Asp Ser Glu Ile Asp Glu Leu Phe Lys Ile
205 210 215
ttt aga gtc atg ggt acc cca aat gaa gaa aca tgg cca gga gtg act 724
Phe Arg Val Met Gly Thr Pro Asn Glu Glu Thr Trp Pro Gly Val Thr
220 225 230
tct ttg cct gat ttt aag tca gca ttt cca aaa tgg cca gct aag gag 772
Ser Leu Pro Asp Phe Lys Ser Ala Phe Pro Lys Trp Pro Ala Lys Glu
235 240 245
ctg gct gct gta gtt ccg aat ctt gat gca tct ggc ctt gat ctc ctt 820
Leu Ala Ala Val Val Pro Asn Leu Asp Ala Ser Gly Leu Asp Leu Leu
250 255 260
gat aaa atg ctt cgt ttg gac ccc age aaa aga att acg gcc agg aat 868
Asp Lys Met Leu Arg Leu Asp Pro Ser Lys Arg Ile Thr Ala Arg Asn 265 270 275 280
gct ctt cag cat gag tac ttc aag gat att ggt ttt gta ccc tgattggtgc 920 Ala Leu Gln His Glu Tyr Phe Lys Asp Ile Gly Phe Val Pro
285 290
ccctcattct ggtacgagta tatattgtta tatgacgtct ggggttttat tctgttccat 980
aggaattcgt gacagacgaa cgttatctct tgtttttgat tccttgggtg taattccatt 1040
tatattgaag ctgtgttggt tgaagcaagt taggantggc ctctgctggt gctttcactt 1100
gctttaaacc ccttgtgtga ttttgtcgat tttttgttcc ttttccattt ttaatttccc 1160
tgtaacatca tgctgatgta taacgtttga gtttttgtta tctggtttaa tatataaata 1220
tggtgtgcct tttagttgtt caaaaaaaaa aaaaaaaaaa aaaaaaccat ggtacccgga 1280
tcc 1283
<210> 36 <211> 294 <212> PRT
<213> Antirrhinum majus <400> 36
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15
Val Val Tyr Lys Ala Arg Asp Arg Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val
50 55 60
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu
85 90 95
Phe Ser Gln Asp Pro Arg Leu Val Lys Met Phe Leu Tyr Gln Ile Leu
100 105 110
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Asp Ser
195 200 205
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Met Gly Thr Pro Asn
210 215 220
Glu Glu Thr Trp Pro Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Pro Ala Lys Glu Leu Ala Ala Val Val Pro Asn Leu
245 250 255
Asp Ala Ser Gly Leu Asp Leu Leu Asp Lys Met Leu Arg Leu Asp Pro
260 265 270
Ser Lys Arg Ile Thr Ala Arg Asn Ala Leu Gln His Glu Tyr Phe Lys
275 280 285
Asp Ile Gly Phe Val Pro 290
<210> 37 <211> 885 <212> DNA
<213> Chenopodium rubrum
<220> <221> CDS <222> (1)..(885) <400> 37.
atg gat cag tat gaa aaa gtt gag aag ata ggg gaa gga acc tat gga 48
Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 15 10 15
gtg gtt tat aag gcg cgg gac aag gtt acg aac gag act ata gct ttg 96
Val Val Tyr Lys Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
aag aaa att cgg ttg gaa cag gag gat gag gga gtt ccg age acg gcg 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
ate aga gaa ata tca ctt ttg aag gag atg cag cat ggc aac att gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val
50 55 60
agg ttg cag gat gtg gtg cat agt gag aag cgc tta tat ctg gtt ttt 240
Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80
gag tat ttg gac ctt gat ttg aag aaa cac atg gat tca tgc cct gat 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Asp
85 90 95
ttt gea aag gat cca cgt atg att aaa agg ttt ctt tat cag att ctt 336
Phe Ala Lys Asp Pro Arg Met Ile Lys Arg Phe Leu Tyr Gln Ile Leu
100 105 110
cgt ggt ate gct tat tgt cac tet cat agg gtc ctg cac cga gat ctg 384
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 aag ccg cag aat ctg ttg Lys Pro Gln Asn Leu Leu 130
gca gat ttt gga ttg gca Ala Asp Phe Gly Leu Ala 145 150
aca cat gag gtg gtg aca Thr His Glu Val Val Thr 165
gga tct cga cat tac tct Gly Ser Arg His Tyr Ser 180
ate ttt gct gag atg gtg Ile Phe Ala Glu Met Val 195
gag att gat gaa ctt ttc Glu Ile Asp Glu Leu Phe 210
gag gag aca tgg cct gga Glu Glu Thr Trp Pro Gly 225 230
ttt cct aaa tgg ate tcc Phe Pro Lys Trp Ile Ser 245
gat cca gct ggt att gat Asp Pro Ala Gly Ile Asp 260
age aaa agg att aca gcc Ser Lys Arg Ile Thr Ala 275
gac att ggt ttt gta ccc Asp Ile Gly Phe Val Pro 290
ata gat cgc caa act aat Ile Asp Arg Gln Thr Asn 135 140
agg gca ttt ggt att cct Arg Ala Phe Gly Ile Pro 155
ttg tgg tac aga gct cca Leu Trp Tyr Arg Ala Pro 170
act cct gtg gat gtg tgg Thr Pro Val Asp Val Trp 185
aat cag aag cca tta ttt Asn Gln Lys Pro Leu Phe 200
aag att ttc agg acc ttg Lys Ile Phe Arg Thr Leu 215 220
gtg acc tcc ctt ccc gat Val Thr Ser Leu Pro Asp 235
aag gat ttg tct gca gta Lys Asp Leu Ser Ala Val 250
ctt cta aat aaa atg ctt Leu Leu Asn Lys Met Leu 265
agg aat gct ctt gaa cat Arg Asn Ala Leu Glu His 280
tga
gca cta aaa ctt 432
Ala Leu Lys Leu
gtg agg act ttt 480
Val Arg Thr Phe 160
gaa ata ttg ctt 528
Glu Ile Leu Leu 175
tct gtg ggt tgt 576
Ser Val Gly Cys 190
cct gga gat tcc 624
Pro Gly Asp Ser
205
ggt aca cca aat 672
Gly Thr Pro Asn
ttc aaa tct tca 720
Phe Lys Ser Ser 240
gta cca aat ctt 768
Val Pro Asn Leu 255
tgc ttg gat ccg 816
Cys Leu Asp Pro 270
gaa tac ttc aag 864
Glu Tyr Phe Lys
285
885
<210> 38 <211> 294 <212> PRT
<213> Chenopodium rubrum
<400> 38 Met Asp Gln 1
Val Val Tyr
Lys Lys Ile 35
Ile Arg Glu 50
Arg Leu Gln 65
Glu Tyr Leu
Phe Ala Lys
Arg Gly Ile 115
Lys Pro Gln 130
Ala Asp Phe 145
Thr His Glu
Gly Ser Arg
Ile Phe Ala 195
Tyr Glu 5
Lys Ala 20
Arg Leu
Ile Ser
Asp Val
Asp Leu
85 Asp Pro 100
Ala Tyr
Asn Leu
Gly Leu
Val Val 165 His Tyr 180
Glu Met
Lys
Arg
Glu
Leu
Val
70
Asp
Arg
Cys
Leu
Ala 150 Thr
Ser
Val
Val
Asp
Gln
Leu
55
His
Leu
Met
His
Ile 135 Arg
Leu
Thr
Asn
Glu Lys Ile 10
Lys Val Thr 25
Glu Asp Glu 40
Lys Glu Met
Ser Glu Lys
Lys Lys His 90
Ile Lys Arg
105 Ser His Arg 120
Asp Arg Gln
Ala Phe Gly
Trp Tyr Arg 170
Pro Val Asp 185
Gln Lys Pro 200
Gly Glu
Asn Glu
Gly Val
Gln His 60
Arg Leu 75
Met Asp
Phe Leu
Val Leu
Thr Asn 140 Ile Pro 155
Ala Pro Val Trp Leu Phe
Gly
Thr
Pro
45
Gly
Tyr
Ser
Tyr
His 125 Ala
Val
Glu
Ser
Pro 205
Thr
Ile
30
Ser
Asn
Leu
Cys
Gln 110 Arg
Leu
Arg
Ile
Val 190 Gly
Tyr
15
Ala
Thr
Ile
Val
Pro
95
Ile
Asp
Lys
Thr
Leu 175 Gly
Asp
Gly
Leu
Ala
Val
Phe
80
Asp
Leu
Leu
Leu
Phe 160 Leu
Cys
Ser Glu Ile Asp Glu Leu Phe 210
Glu Glu Thr Trp Pro Gly 225 230
Phe Pro Lys Trp Ile Ser 245
Asp Pro Ala Gly Ile Asp 260
Ser Lys Arg Ile Thr Ala 275
Asp Ile Gly Phe Val Pro 290
Lys Ile Phe Arg Thr 215
Val Thr Ser Leu Pro 235
Lys Asp Leu Ser Ala 250
Leu Leu Asn Lys Met 265
Arg Asn Ala Leu Glu 280
Leu Gly Thr Pro Asn 220
Asp Phe Lys Ser Ser 240
Val Val Pro Asn Leu 255
Leu Cys Leu Asp Pro 270
His Glu Tyr Phe Lys 285
<210> 39 <211> 885 <212> DNA <213> Zea mays
<220>
<221> CDS
<222> (1)..(885)
<400> 39
atg gag cag tac gag aag gtg gag aag ate ggg gag ggc acg tac ggg 48
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly
1 5 10 15
gtg gtg tac aag gcg ctg gac aag gcc acc aac gag acg ate gcg ctc 96
Val Val Tyr Lys Ala Leu Asp Lys Ala Thr Asn Glu Thr Ile Ala Leu
20 25 30
aag aag ate cgc ctc gag cag gag gac gag ggc gtc ccg tcc acc gcc 144
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
ate cgc gag ate tet ctc ctc aag gag atg aac cac ggc aac ate gtc 192
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Asn His Gly Asn Ile Val
50 55 60
aga tta cat gat gtt gtc cac age gag aag cgc ata tac ctt gtc ttc 240
Arg Leu His Asp Val Val His Ser Glu Lys Arg Ile Tyr Leu Val Phe
65 70 75 80
gag tac ctg gat ctg gac ctc aag aag ttc atg gac tcc tgc ccg gag 288
Glu Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu
85 90 95
ttt gct aag aat ccc act ttg ate aag tca tac ctc tac cag ata ctc 336
Phe Ala Lys Asn Pro Thr Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu
100 105 110
cac ggt gtt gcg tac tgc cat tet cat aga gtt ctt cat cga gac ttg 384
His Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aaa cct caa aac tta ttg ata gat cgg cgc act aat gea ctg aag ctt 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
gea gac ttt ggt tta gcc agg gea ttt gga att cct gtc cgt aca ttt 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe
145 150 155 160
act cat gag gta gtg aca tta tgg tac aga gct cca gaa att ctg ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
gga gcg cgg cag tat tcc aca cca gtt gat gtg tgg tet gtg ggc tgt 576
Gly Ala Arg Gln Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ate ttt gcg gaa atg gtg aac caa aag cca cta ttc cct ggc gat tet 624
Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser
195 200 205
gag ate gac gaa ctt ttt aag ata ttc agg ata cta ggt aca ccg aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Leu Gly Thr Pro Asn
210 215 220
gag cag agt tgg cca gga gtc agt tgt ttg cct gac ttc aag aca gct 720 Glu Gln Ser Trp Pro Gly Val Ser Cys Leu Pro Asp Phe Lys Thr Ala
225 230 235 240
ttc ccc agg tgg caa gct cag gac ctg gca aca gta gtc cca aat ctt 7 68
Phe Pro Arg Trp Gln Ala Gln Asp Leu Ala Thr Val Val Pro Asn Leu
245 250 255
gac cct gct ggg ttg gac ctt ctc tct aaa atg ctt cga tac gag cca 816
Asp Pro Ala Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Tyr Glu Pro
260 265 270
age aaa aga ate aca gcg agg caa gca ctt gag cat gag tac ttc aag 864
Ser Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gac ctt gaa gtg gta cag tga 885
Asp Leu Glu Val Val Gln 290
<210> 40 <211> 294 <212> PRT <213> Zea mays
<400> 40
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Ala Leu Asp Lys Ala Thr Asn Glu Thr Ile Ala Leu 20 25 30 Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Asn His Gly Asn Ile Val 50 55 60 Arg Leu His Asp Val Val His Ser Glu Lys Arg Ile Tyr Leu Val Phe 65 70 75 80 Glu Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu 85 90 95 Phe Ala Lys Asn Pro Thr Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu 100 105 110 His Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu 130 135 140 Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160 Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu 165 170 175 Gly Ala Arg Gln Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys 180 185 190 Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser 195 200 205 Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Leu Gly Thr Pro Asn 210 215 220 Glu Gln Ser Trp Pro Gly Val Ser Cys Leu Pro Asp Phe Lys Thr Ala 225 230 235 240 Phe Pro Arg Trp Gln Ala Gln Asp Leu Ala Thr Val Val Pro Asn Leu 245 250 255 Asp Pro Ala Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Tyr Glu Pro 260 265 270 Ser Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys 275 280 285 Asp Leu Glu Val Val Gln 290
<210> 41 <211> 885 <212> DNA
<213> Vigna aconitifolia
<220> <221> CDS <222> (1)..(885)
<400> 41 atg gaa cag tac gag aag Met Glu Gln Tyr Glu Lys 1 5 gtc gtt tac aag gct cgc Val Val Tyr Lys Ala Arg 20 aag aag att cgc ctc gag Lys Lys Ile Arg Leu Glu 35 att cgt gag att tcg ctc Ile Arg Glu Ile Ser Leu 50 agg ttg cag gat gta gtg Arg Leu Gln Asp Val Val 65 70 gag tat ctg gac ttg gat Glu Tyr Leu Asp Leu Asp 85 ttt gtg aaa gat cca cgg Phe Val Lys Asp Pro Arg 100 tgt ggc att gct tac tgc Cys Gly Ile Ala Tyr Cys 115 aaa cca cag aat ttg ttg Lys Pro Gln Asn Leu Leu 130 gca gat ttt gga ttg gct Ala Asp Phe Gly Leu Ala 145 150 act cat gag gtg gtg aca Thr His Glu Val Val Thr 165 ggg tct cgt cat tat tct Gly Ser Arg His Tyr Ser 180 ata ttt gca gag atg gta Ile Phe Ala Glu Met Val 195 gag att gat gaa tta ttt Glu Ile Asp Glu Leu Phe 210 gaa gaa aca tgg cct gga Glu Glu Thr Trp Pro Gly 225 230 ttt ccc aaa tgg cca cct Phe Pro Lys Trp Pro Pro 245 gat gca gcg ggt ctt aat Asp Ala Ala Gly Leu Asn 260 age aaa aga att act gcc Ser Lys Arg Ile Thr Ala 275 gac att aaa ttt gta ccc Asp Ile Lys Phe Val Pro 290
gtg gag aag ata ggg gag Val Glu Lys Ile Gly Glu 10
gac cgc gtc acc aat gag Asp Arg Val Thr Asn Glu 25
cag gaa gac gag ggg gtt Gln Glu Asp Glu Gly Val 40
ctc aaa gag atg cag cat Leu Lys Glu Met Gln His 55 60
cac agt gag aag cga ttg His Ser Glu Lys Arg Leu 75
cta aag aaa cac atg gat Leu Lys Lys His Met Asp 90
caa gta aaa atg ttc ctc Gln Val Lys Met Phe Leu 105
cat tcg cac aga gtt ctt His Ser His Arg Val Leu 120
ata gac cgt cgt aca aat Ile Asp Arg Arg Thr Asn 135 140
agg gca ttt ggc att cct Arg Ala Phe Gly Ile Pro 155
tta tgg tac aga gct cca Leu Trp Tyr Arg Ala Pro 170
acc cca gtt gat gtt tgg Thr Pro Val Asp Val Trp 185
aac cga cga cct cta ttc Asn Arg Arg Pro Leu Phe 200
aaa ata ttc aga ata ttg Lys Ile Phe Arg Ile Leu 215 220
gtt act gca tta ccg gat Val Thr Ala Leu Pro Asp 235
aag gat tta gca act gtg Lys Asp Leu Ala Thr Val 250
ctt ctt tct agt atg cta Leu Leu Ser Ser Met Leu 265
agg ate gct gtg gag cac Arg Ile Ala Val Glu His 280
taa
gga aca tac ggc 48
Gly Thr Tyr Gly 15
acc ate gct ctt 96
Thr Ile Ala Leu 30
ccc age acc gcc 144
Pro Ser Thr Ala 45
agg aac att gtt 192
Arg Asn Ile Val
tat ctg gtt ttc 240
Tyr Leu Val Phe 80
tca tct cca gag 288
Ser Ser Pro Glu 95
tat caa att ctc 336
Tyr Gln Ile Leu 110
cat cga gac ttg 384
His Arg Asp Leu
125
tcc tta aaa ctt 432
Ser Leu Lys Leu
gtc agg aca ttt 480
Val Arg Thr Phe 160
gaa ata ttg ctt 528
Glu Ile Leu Leu 175
tca gtg gga tgt 576
Ser Val Gly Cys 190
cca ggg gac tct 624
Pro Gly Asp Ser
205
ggt aca cct aat 672
Gly Thr Pro Asn
ttt aaa tca aca 720
Phe Lys Ser Thr 240
gtt cca aat ctt 768
Val Pro Asn Leu 255
tgc ttg gat ccc 816
Cys Leu Asp Pro 270
gaa tac ttc aaa 864
Glu Tyr Phe Lys
285
885
<210> 42 <211> 294 <212> PRT
<213> Vigna aconitifolia <400> 42 Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Ala Arg Asp Arg Val Thr Asn Glu Thr Ile Ala Leu 20 25 30 Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Arg Asn Ile Val 50 55 60 Arg Leu Gln Asp Val Val His Ser Glu Lys Arg Leu Tyr Leu Val Phe 65 70 75 80 Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Ser Pro Glu 85 90 95 Phe Val Lys Asp Pro Arg Gln Val Lys Met Phe Leu Tyr Gln Ile Leu 100 105 110 Cys Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ser Leu Lys Leu 130 135 140 Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160 Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu 165 170 175 Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys 180 185 190 Ile Phe Ala Glu Met Val Asn Arg Arg Pro Leu Phe Pro Gly Asp Ser 195 200 205 Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Leu Gly Thr Pro Asn 210 215 220 Glu Glu Thr Trp Pro Gly Val Thr Ala Leu Pro Asp Phe Lys Ser Thr 225 230 235 240 Phe Pro Lys Trp Pro Pro Lys Asp Leu Ala Thr Val Val Pro Asn Leu 245 250 255 Asp Ala Ala Gly Leu Asn Leu Leu Ser Ser Met Leu Cys Leu Asp Pro 260 265 270 Ser Lys Arg Ile Thr Ala Arg Ile Ala Val Glu His Glu Tyr Phe Lys 275 280 285 Asp Ile 9 Qn Lys Phe Val Pro
<210> 43
<211> 885
<212> DNA
<213> Oryza sativa
<220>
<221> CDS
<222> (1)..(885)
<400> 43 atg gag cag tac Met Glu Gln Tyr 1
gtg gtg tac agg Val Val Tyr Arg 20
aag aag ate cgg Lys Lys Ile Arg 35
ate cgc gag ate Ile Arg Glu Ile 50
agg tta cac gat Arg Leu His Asp 65
gag aag gag gag aag Glu Lys Glu Glu Lys 5
gcg cgg gac aag gtc Ala Arg Asp Lys Val 25
ctt gag cag gag gat Leu Glu Gln Glu Asp 40
tcg ctc ctc aag gag Ser Leu Leu Lys Glu 55
gtt ate cac agt gag Val Ile His Ser Glu
70
att ggg gag ggc acg Ile Gly Glu Gly Thr 10
acc aac gag acg ate Thr Asn Glu Thr Ile 30
gag ggc gtc ccc tcc Glu Gly Val Pro Ser 45
atg cat cac ggc aac Met His His Gly Asn 60
aag cgc ata tat ctt Lys Arg Ile Tyr Leu 75
tac ggg 4 8
Tyr Gly 15
gcg ctc 96
Ala Leu
acc gea 144
Thr Ala
ate gtc 192
Ile Val
gtc ttt 240
Val Phe 80 gag tat ctg gat ctg gac Glu Tyr Leu Asp Leu Asp 85 ttt gcg aaa aac CCC act Phe Ala Lys Asn Pro Thr 100 cgc ggc gtt gct tac tgt Arg Gly Val Ala Tyr Cys 115 aaa cct cag aat tta ttg Lys Pro Gln Asn Leu Leu 130 gca gac ttt ggt tta gcc Ala Asp Phe Gly Leu Ala 145 150 act cac gag gtt gta acc Thr His Glu Val Val Thr 165 gga tca agg cag tat tct Gly Ser Arg Gln Tyr Ser 180 ate ttt gca gaa atg gtg Ile Phe Ala Glu Met Val 195 gag att gat gaa tta ttt Glu Ile Asp Glu Leu Phe 210 gaa caa agt tgg cca gga Glu Gln Ser Trp Pro Gly 225 230 ttc CC c aag tgg caa gca Phe Pro Lys Trp Gln Ala 245 gac cct gct ggt ttg gac Asp Pro Ala Gly Leu Asp 260 aac aaa agg ate aca gct Asn Lys Arg Ile Thr Ala 275 gac ctt gag atg gta caa Asp Leu Glu Met Val Gln 290 294
cta aag aag ttc atg gac Leu Lys Lys Phe Met Asp 90
tta att aag tca tat ctc Leu Ile Lys Ser Tyr Leu 105
cat tct cat aga gtt ctt His Ser His Arg Val Leu 120
ata gat cgg cgt act aat Ile Asp Arg Arg Thr Asn 135 140
agg gca ttt gga att cct Arg Ala Phe Gly Ile Pro 155
ttg tgg tat aga gct cca Leu Trp Tyr Arg Ala Pro 170
aca cca gtt gat atg tgg Thr Pro Val Asp Met Trp 185
aac cag aaa cca ctg ttc Asn Gln Lys Pro Leu Phe 200
aag ata ttc agg gta cta Lys Ile Phe Arg Val Leu 215 220
gtt age tca tta cct gac Val Ser Ser Leu Pro Asp 235
cag gat ctt gca act att Gln Asp Leu Ala Thr Ile 250
ctt ctc tct aaa atg ctt Leu Leu Ser Lys Met Leu 265
aga cag gct ctt gag cat Arg Gln Ala Leu Glu His 280
tga
tct tgt cca gag 288
Ser Cys Pro Glu 95
tat cag ata ctc 336
Tyr Gln Ile Leu 110
cat cga gat ttg 384
His Arg Asp Leu
125
gca ctg aag ctt 432
Ala Leu Lys Leu
gtc cgc acg ttt 480
Val Arg Thr Phe 160
gag ate ctt ctt 528
Glu Ile Leu Leu 175
tca gtt ggt tgt 576
Ser Val Gly Cys 190
cct ggt gat tct 624
Pro Gly Asp Ser
205
gga act cca aat 672
Gly Thr Pro Asn
tac aag tct gct 720
Tyr Lys Ser Ala 240
gtc cct act ctt 768
Val Pro Thr Leu 255
cgg tac gag cca 816
Arg Tyr Glu Pro 270
gaa tac ttc aag 8 64
Glu Tyr Phe Lys
285
885
<210> 44 <211> 294 <212> PRT
<213> Oryza sativa <400> 44
Met Glu Gln Tyr Glu Lys Glu Glu Lys Ile Gly Glu Gly Thr Tyr Gly 15 10 15
Val Val Tyr Arg Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu
20 25 30
Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Met His His Gly Asn Ile Val
50 55 60
Arg Leu His Asp Val Ile His Ser Glu Lys Arg Ile Tyr Leu Val Phe 65 70 75 80
Glu Tyr Leu Asp Leu Asp Leu Lys Lys Phe Met Asp Ser Cys Pro Glu
85 90 95
Phe Ala Lys Asn Pro Thr Leu Ile Lys Ser Tyr Leu Tyr Gln Ile Leu
100 105 110
Arg Gly Val Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu 130 135 140 Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
Gly Ser Arg Gln Tyr Ser Thr Pro Val Asp Met Trp Ser Val Gly Cys
180 185 190
Ile Phe Ala Glu Met Val Asn Gln Lys Pro Leu Phe Pro Gly Asp Ser
195 200 205
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Val Leu Gly Thr Pro Asn
210 215 220
Glu Gln Ser Trp Pro Gly Val Ser Ser Leu Pro Asp Tyr Lys Ser Ala 225 230 235 240
Phe Pro Lys Trp Gln Ala Gln Asp Leu Ala Thr Ile Val Pro Thr Leu
245 250 255
Asp Pro Ala Gly Leu Asp Leu Leu Ser Lys Met Leu Arg Tyr Glu Pro
260 265 270
Asn Lys Arg Ile Thr Ala Arg Gln Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
Asp Leu Glu Met Val Gln 290
<210> 45
<211> 1113
<212> DNA
<213> Oryza sativa
<220> <221> CDS <222> (1)..(1113) <400> 45
atg gcg ate atg gtg gat cct cca aat ggg atg ggt aac caa ggg aag 48
Met Ala Ile Met Val Asp Pro Pro Asn Gly Met Gly Asn Gln Gly Lys
1 5 10 15
tat tac tac tcg atg tgg caa act ttg ttt gag ata gac act aag tat 96
Tyr Tyr Tyr Ser Met Trp Gln Thr Leu Phe Glu Ile Asp Thr Lys Tyr
20 25 30
gtg cca ate aag ccc ate ggg cga gga gct tat ggg att gtt tgt tca 144
Val Pro Ile Lys Pro Ile Gly Arg Gly Ala Tyr Gly Ile Val Cys Ser
35 40 45
tcc ata aat cgt gag acc aac gag aaa gta gea ata aag aag ata cac 192
Ser Ile Asn Arg Glu Thr Asn Glu Lys Val Ala Ile Lys Lys Ile His
50 55 60
aat gtt ttt gac aac cgt gtt gat gea cta agg act ttg cgg gag ctg 240
Asn Val Phe Asp Asn Arg Val Asp Ala Leu Arg Thr Leu Arg Glu Leu
65 70 75 80
aaa ctt ctc cgg cat ctc cgc cat gag aat gtt att gct ttg aag gat 288
Lys Leu Leu Arg His Leu Arg His Glu Asn Val Ile Ala Leu Lys Asp
85 90 95
ata atg atg cca gta cac agg agg agt ttt aaa gat gtg tac tta gtt 336
Ile Met Met Pro Val His Arg Arg Ser Phe Lys Asp Val Tyr Leu Val
100 105 110
tat gaa ctc atg gat act gac ctg cat cag ata ate aag tca cct cag 384
Tyr Glu Leu Met Asp Thr Asp Leu His Gln Ile Ile Lys Ser Pro Gln
115 120 125
ggt ctt tcc aat gat cac tgc caa tat ttt ctt ttt cag ttg ctt cga 432
Gly Leu Ser Asn Asp His Cys Gln Tyr Phe Leu Phe Gln Leu Leu Arg
130 135 140
gga ctg aaa tat ctc cat tca gea gag ata ctc cac aga gac ctg aaa 480
Gly Leu Lys Tyr Leu His Ser Ala Glu Ile Leu His Arg Asp Leu Lys
145 150 155 160
cct gga aat cta ctg gtt aat gea aac tgt gat ctc aag ata tgt gat 528
Pro Gly Asn Leu Leu Val Asn Ala Asn Cys Asp Leu Lys Ile Cys Asp
165 170 175
ttt ggt ctt gea cgc aca aac agt agt aaa ggt cag ttt atg act gag 576
Phe Gly Leu Ala Arg Thr Asn Ser Ser Lys Gly Gln Phe Met Thr Glu 180 185 190 tat gtt gtc acc cgc tgg tat aga gct cct gag ttg ctc ctt tgc tgt 624
Tyr Val Val Thr Arg Trp Tyr Arg Ala Pro Glu Leu Leu Leu Cys Cys
195 200 205
gac aac tat ggc act tcc att gat gtt tgg tct gtt ggt tgc ate ttc 672
Asp Asn Tyr Gly Thr Ser Ile Asp Val Trp Ser Val Gly Cys Ile Phe
210 215 220
gct gag cta ctt ggt cgg aaa cct att ttc cca gga act gag tgc cta 720
Ala Glu Leu Leu Gly Arg Lys Pro Ile Phe Pro Gly Thr Glu Cys Leu 225 230 235 240
aat cag ctc aag ctc att gtc aat gtt ctt ggc acc atg age gag tct 768
Asn Gln Leu Lys Leu Ile Val Asn Val Leu Gly Thr Met Ser Glu Ser
245 250 255
gac ttg gag ttc att gac aac cca aaa gct cgc aga tat ate aaa tcc 816
Asp Leu Glu Phe Ile Asp Asn Pro Lys Ala Arg Arg Tyr Ile Lys Ser
260 265 270
ctc ccc tac act ccc ggt gtg ccc ctc gcg agt atg tat ccg cat gea 864
Leu Pro Tyr Thr Pro Gly Val Pro Leu Ala Ser Met Tyr Pro His Ala
275 280 285
cac cct ctt gcc att gat ctt tta cag aag atg ctc ata ttt gat cct 912
His Pro Leu Ala Ile Asp Leu Leu Gln Lys Met Leu Ile Phe Asp Pro
290 295 300
acc aaa aga ate agt gtc acc gag gct ctt gag cac cct tac atg tcc 960
Thr Lys Arg Ile Ser Val Thr Glu Ala Leu Glu His Pro Tyr Met Ser 305 310 315 320
cct ctg tat gat cca agt gea aat cct ccc gcg caa gtg cct ate gat 1008
Pro Leu Tyr Asp Pro Ser Ala Asn Pro Pro Ala Gln Val Pro Ile Asp
325 330 335
ctg gac ata gac gag aac ate agt gea gat atg ate agg gaa atg atg 1056
Leu Asp Ile Asp Glu Asn Ile Ser Ala Asp Met Ile Arg Glu Met Met
340 345 350
tgg cac gag atg ctc cac tac cac cct gaa gtt gtt gea gea atg agt 1104
Trp His Glu Met Leu His Tyr His Pro Glu Val Val Ala Ala Met Ser
355 360 365
gcc cga tga 1113
Ala Arg 370 <210> 46 <211> 370 <212> PRT
<213> Oryza sativa <400> 46
Met Ala Ile Met Val Asp Pro Pro Asn Gly Met Gly Asn Gln Gly Lys 15 10 15
Tyr Tyr Tyr Ser Met Trp Gln Thr Leu Phe Glu Ile Asp Thr Lys Tyr
20 25 30
Val Pro Ile Lys Pro Ile Gly Arg Gly Ala Tyr Gly Ile Val Cys Ser
35 40 45
Ser Ile Asn Arg Glu Thr Asn Glu Lys Val Ala Ile Lys Lys Ile His
50 55 60
Asn Val Phe Asp Asn Arg Val Asp Ala Leu Arg Thr Leu Arg Glu Leu 65 70 75 80
Lys Leu Leu Arg His Leu Arg His Glu Asn Val Ile Ala Leu Lys Asp
85 90 95
Ile Met Met Pro Val His Arg Arg Ser Phe Lys Asp Val Tyr Leu Val
100 105 110
Tyr Glu Leu Met Asp Thr Asp Leu His Gln Ile Ile Lys Ser Pro Gln
115 120 125
Gly Leu Ser Asn Asp His Cys Gln Tyr Phe Leu Phe Gln Leu Leu Arg
130 135 140
Gly Leu Lys Tyr Leu His Ser Ala Glu Ile Leu His Arg Asp Leu Lys 145 150 155 160
Pro Gly Asn Leu Leu Val Asn Ala Asn Cys Asp Leu Lys Ile Cys Asp
165 170 175
Phe Gly Leu Ala Arg Thr Asn Ser Ser Lys Gly Gln Phe Met Thr Glu 180 185 190 Tyr Val Val Thr Arg Trp Tyr Arg Ala Pro Glu Leu Leu Leu Cys Cys
195 200 205
Asp Asn Tyr Gly Thr Ser Ile Asp Val Trp Ser Val Gly Cys Ile Phe
210 215 220
Ala Glu Leu Leu Gly Arg Lys Pro Ile Phe Pro Gly Thr Glu Cys Leu 225 230 235 240
Asn Gln Leu Lys Leu Ile Val Asn Val Leu Gly Thr Met Ser Glu Ser
245 250 255
Asp Leu Glu Phe Ile Asp Asn Pro Lys Ala Arg Arg Tyr Ile Lys Ser
260 265 270
Leu Pro Tyr Thr Pro Gly Val Pro Leu Ala Ser Met Tyr Pro His Ala
275 280 285
His Pro Leu Ala Ile Asp Leu Leu Gln Lys Met Leu Ile Phe Asp Pro
290 295 300
Thr Lys Arg Ile Ser Val Thr Glu Ala Leu Glu His Pro Tyr Met Ser 305 310 315 320
Pro Leu Tyr Asp Pro Ser Ala Asn Pro Pro Ala Gln Val Pro Ile Asp
325 330 335
Leu Asp Ile Asp Glu Asn Ile Ser Ala Asp Met Ile Arg Glu Met Met
340 345 350
Trp His Glu Met Leu His Tyr His Pro Glu Val Val Ala Ala Met Ser 355 360 365
Ala Arg 370
<210> 47 <211> 1044 <212> DNA
<213> Brassica napus
<220>
<221> CDS
<222> (1)..(1044)
<400> 47
atg tcg aaa tcg ggc gga aac caa ccc gta gat cga tac cta aga cgc
Met Ser Lys Ser Gly Gly Asn Gln Pro Val Asp Arg Tyr Leu Arg Arg
15 10 15
caa gtg ctc gga gaa gga aca tac ggt gtc gtt tac aaa gcc acc gac
Gln Val Leu Gly Glu Gly Thr Tyr Gly Val Val Tyr Lys Ala Thr Asp
20 25 30
acc aag aca ggt aag acc gta gca gtg aag aag ate agg tta gga aac
Thr Lys Thr Gly Lys Thr Val Ala Val Lys Lys Ile Arg Leu Gly Asn
35 40 45
cag aaa gaa ggc gtc aat ttc acg gcc ctt agg gag ate aag ctc cta
Gln Lys Glu Gly Val Asn Phe Thr Ala Leu Arg Glu Ile Lys Leu Leu
50 55 60
aaa gag ctg aac cat ccc cac ate gtc gag ctc ate gac gcg ttt cct
Lys Glu Leu Asn His Pro His Ile Val Glu Leu Ile Asp Ala Phe Pro
65 70 75 80
cac gac ggg age ttg cat ctg gtt ttc gag tat atg cag acg gat ttg
His Asp Gly Ser Leu His Leu Val Phe Glu Tyr Met Gln Thr Asp Leu
85 90 95
gaa gct gtg att cgt gac cgt aac att ttt ctt tet cct ggt gat ate
Glu Ala Val Ile Arg Asp Arg Asn Ile Phe Leu Ser Pro Gly Asp Ile
100 105 110
aag tet tat atg ttg atg act ctt aag ggt tta gct tat tgt cac aag
Lys Ser Tyr Met Leu Met Thr Leu Lys Gly Leu Ala Tyr Cys His Lys
115 120 125
aaa tgg gtt ctt cat agg gat atg aag cct aat aat cta ctg att gga
Lys Trp Val Leu His Arg Asp Met Lys Pro Asn Asn Leu Leu Ile Gly
130 135 140
gag aat ggt ctg ttg aag tta gct gat ttt ggt ttg gcg aga gtg ttt
Glu Asn Gly Leu Leu Lys Leu Ala Asp Phe Gly Leu Ala Arg Val Phe
145 150 155 160
ggg agt ccg aat cgg agg ttt act cat cag gta ttt gcg acg tgg tac Gly Ser Pro Asn Arg Arg Phe Thr His Gln Val Phe Ala Thr Trp Tyr
165 170 175
aga gcc ccc gag ttg ctg ttt ggg agt aga cag tat ggt gca gga gtt 576
Arg Ala Pro Glu Leu Leu Phe Gly Ser Arg Gln Tyr Gly Ala Gly Val
180 185 190
gat gtc tgg gct gca ggc tgt ate ttt gct gag cta tta ctt cgt cga 624
Asp Val Trp Ala Ala Gly Cys Ile Phe Ala Glu Leu Leu Leu Arg Arg
195 200 205
ccc ttt cta cct ggt tcc act gag ata gat caa ctg gga aag ate ttt 672
Pro Phe Leu Pro Gly Ser Thr Glu Ile Asp Gln Leu Gly Lys Ile Phe
210 215 220
caa gct ttt gga act cca aca caa tcc caa tgg tet gac atg ate tat 720
Gln Ala Phe Gly Thr Pro Thr Gln Ser Gln Trp Ser Asp Met Ile Tyr 225 230 235 240
ctc cca gag tac atg gag ttc tcc tac aca cct gct cca cca cta cgt 768
Leu Pro Glu Tyr Met Glu Phe Ser Tyr Thr Pro Ala Pro Pro Leu Arg
245 250 255
acc att ttc cct atg gca age gac gac gct ttg gat ctt cta tcc aaa 816
Thr Ile Phe Pro Met Ala Ser Asp Asp Ala Leu Asp Leu Leu Ser Lys
260 265 270
atg ttc ate tac gac cca cgc caa cgt ate acc ata cag caa gct ttg 864
Met Phe Ile Tyr Asp Pro Arg Gln Arg Ile Thr Ile Gln Gln Ala Leu
275 280 285
gac cac agg tat ttc tcg tet tet cca tca cca act gag cca ggg aag 912
Asp His Arg Tyr Phe Ser Ser Ser Pro Ser Pro Thr Glu Pro Gly Lys
290 295 300
ctt cag att cca gct tcg aaa gga gac gcc ctc gaa cca aag gca tet 960
Leu Gln Ile Pro Ala Ser Lys Gly Asp Ala Leu Glu Pro Lys Ala Ser 305 310 315 320
gag caa aac aac caa cac gga aac age ccc gcc gtg cta tca cct cct 1008
Glu Gln Asn Asn Gln His Gly Asn Ser Pro Ala Val Leu Ser Pro Pro
325 330 335
gga aaa atg agg aga gtg atg ggt cct gag gga taa 1044
Gly Lys Met Arg Arg Val Met Gly Pro Glu Gly 340 345
<210> 48 <211> 347 <212> PRT
<213> Brassica napus <400> 48
Met Ser Lys Ser Gly Gly Asn Gln Pro Val Asp Arg Tyr Leu Arg Arg 15 10 15
Gln Val Leu Gly Glu Gly Thr Tyr Gly Val Val Tyr Lys Ala Thr Asp
20 25 30
Thr Lys Thr Gly Lys Thr Val Ala Val Lys Lys Ile Arg Leu Gly Asn
35 40 45
Gln Lys Glu Gly Val Asn Phe Thr Ala Leu Arg Glu Ile Lys Leu Leu
50 55 60
Lys Glu Leu Asn His Pro His Ile Val Glu Leu Ile Asp Ala Phe Pro 65 70 75 80
His Asp Gly Ser Leu His Leu Val Phe Glu Tyr Met Gln Thr Asp Leu
85 90 95
Glu Ala Val Ile Arg Asp Arg Asn Ile Phe Leu Ser Pro Gly Asp Ile
100 105 110
Lys Ser Tyr Met Leu Met Thr Leu Lys Gly Leu Ala Tyr Cys His Lys
115 120 125
Lys Trp Val Leu His Arg Asp Met Lys Pro Asn Asn Leu Leu Ile Gly
130 135 140
Glu Asn Gly Leu Leu Lys Leu Ala Asp Phe Gly Leu Ala Arg Val Phe 145 150 155 160
Gly Ser Pro Asn Arg Arg Phe Thr His Gln Val Phe Ala Thr Trp Tyr
165 170 175
Arg Ala Pro Glu Leu Leu Phe Gly Ser Arg Gln Tyr Gly Ala Gly Val 180 185 190 Asp
Pro
Gln 225 Leu
Thr
Met
Asp
Leu 305 Glu
Gly
Val
Phe 210 Ala
Pro
Ile
Phe
His 290 Gln
Gln
Lys
Trp 195 Leu
Phe
Glu
Phe
Ile 275 Arg
Ile
Asn
Met
Ala
Pro
Gly
Tyr
Pro 260 Tyr
Tyr
Pro
Asn
Arg 340
Ala Gly
Gly Ser
Thr Pro 230 Met Glu 245
Met Ala
Asp Pro
Phe Ser
Ala Ser 310 Gln His 325
Arg Val
Cys
Thr 215 Thr
Phe
Ser
Arg
Ser 295 Lys
Gly
Met
Ile 200 Glu
Gln
Ser
Asp
Gln 280 Ser
Gly
Asn
Gly
Phe
Ile
Ser
Tyr
Asp 2 65 Arg
Pro
Asp
Ser
Pro 345
Ala
Asp
Gln
Thr 250 Ala
Ile
Ser
Ala
Pro 330 Glu
Glu
Gln
Trp 235 Pro
Leu
Thr
Pro
Leu 315 Ala
Gly
Leu Leu 205 Leu Gly 220
Ser Asp
Ala Pro
Asp Leu
Ile Gln 285 Thr Glu 300
Glu Pro Val Leu
Leu Arg Arg
Lys Ile Phe
Met Ile Tyr 240
Pro Leu Arg
255 Leu Ser Lys 270
Gln Ala Leu
Pro Gly Lys
Lys Ala Ser 320
Ser Pro Pro 335
<210> 49 <211> 1353 <212> DNA <213> Glycine max
<220>
<221> CDS
<222> (1)..(1353)
<400> 49
atg gag gag cct ttg aca Met Glu Glu Pro Leu Thr 1 5
gaa gac aaa gat gtg caa Glu Asp Lys Asp Val Gln 20
tgt gat gtt cgt ccc tca Cys Asp Val Arg Pro Ser 35
ggc aaa gtg age tcc agt Gly Lys Val Ser Ser Ser 50
act tca gag age aca ate Thr Ser Glu Ser Thr Ile 65 70
cat tat ttg ggt gct tet His Tyr Leu Gly Ala Ser 85
ctt atg gac tcc atg gtc Leu Met Asp Ser Met Val 100
tet cca tca gat tet gat Ser Pro Ser Asp Ser Asp 115
aac ata aac atg ctt cag Asn Ile Asn Met Leu Gln 130
att aag aaa ata aac gaa Ile Lys Lys Ile Asn Glu 145 150
gat aag aag act gga gaa Asp Lys Lys Thr Gly Glu 165
ata gag agg gat gga ttt Ile Glu Arg Asp Gly Phe
gat tcg gga age tac cca Asp Ser Gly Ser Tyr Pro 10
gga tgg aca ate aca aag Gly Trp Thr Ile Thr Lys 25
cca aga ggt gct gat gat Pro Arg Gly Ala Asp Asp 40
cct gaa att ggt gaa ttc Pro Glu Ile Gly Glu Phe 55 60
act aga tca tca gga agt Thr Arg Ser Ser Gly Ser 75
tet gat gac act gat tet Ser Asp Asp Thr Asp Ser 90
aat gtt gag gaa caa agt Asn Val Glu Glu Gln Ser 105
gag tgt ggt gga ttg atg Glu Cys Gly Gly Leu Met 120
agt tgc aga agt gtg tgt Ser Cys Arg Ser Val Cys 135 140
gga act tat ggt gtt gtc Gly Thr Tyr Gly Val Val 155
cta gta gea ttg aag aag Leu Val Ala Leu Lys Lys 170
cca atg tca tcc ttg aga Pro Met Ser Ser Leu Arg
cac gat ttg gag 48
His Asp Leu Glu 15
tca aga tgg gct 96
Ser Arg Trp Ala 30
gaa cag aag cac 144
Glu Gln Lys His 45
cat ggc ggt gga 192
His Gly Gly Gly
agt ggt aga gat 240
Ser Gly Arg Asp 80
gaa aag gac ttc 288
Glu Lys Asp Phe 95
gat gat ggt gat 336
Asp Asp Gly Asp 110
cat gtg ctg aga 384
His Val Leu Arg
125
gag ttt gag atg 432
Glu Phe Glu Met
tac aag gct agg 480
Tyr Lys Ala Arg 160
gtg aag atg aac 528
Val Lys Met Asn 175
gaa ata aac att 576
Glu Ile Asn Ile 180 185 190
ctc ttg tct ttt aat cat ccc tcc att gtg aat gtt aaa gaa gta gtt 624
Leu Leu Ser Phe Asn His Pro Ser Ile Val Asn Val Lys Glu Val Val
195 200 205
gtt gat gat ttt gat ggt act ttt atg gta atg gag cac atg gag tat 672
Val Asp Asp Phe Asp Gly Thr Phe Met Val Met Glu His Met Glu Tyr
210 215 220
gac ctg aag ggg ctg atg gag gtt aag aag cat ccc ttt age atg agt 720
Asp Leu Lys Gly Leu Met Glu Val Lys Lys His Pro Phe Ser Met Ser 225 230 235 240
gaa att aaa tcc ttg gta cgg caa ctt ctt gaa ggt gtc aag tat ctc 768
Glu Ile Lys Ser Leu Val Arg Gln Leu Leu Glu Gly Val Lys Tyr Leu
245 250 255
cat gat aat tgg gtt ate cat agg gac ttg aaa tca tca aac ate ctg 816
His Asp Asn Trp Val Ile His Arg Asp Leu Lys Ser Ser Asn Ile Leu
260 265 270
ctg aac cat gat ggg gag ctt aaa ata tgc gac ttt ggg ttg tca agg 864
Leu Asn His Asp Gly Glu Leu Lys Ile Cys Asp Phe Gly Leu Ser Arg
275 280 285
cag tat gga age ccg ctg aag cca tat act cct gtt gtg gtt aca cta 912
Gln Tyr Gly Ser Pro Leu Lys Pro Tyr Thr Pro Val Val Val Thr Leu
290 295 300
tgg tac aga gea cct gaa ctt ttg ctg ggt gct aaa gaa tac tca act 960
Trp Tyr Arg Ala Pro Glu Leu Leu Leu Gly Ala Lys Glu Tyr Ser Thr 305 310 315 320
gea att gac atg tgg tca gtg ggt tgc ata atg gct gaa tta att gcc 1008
Ala Ile Asp Met Trp Ser Val Gly Cys Ile Met Ala Glu Leu Ile Ala
325 330 335
aag gaa cct ctg ttc agg ggt aaa agt gaa ctt gaa caa ctt gat aag 1056
Lys Glu Pro Leu Phe Arg Gly Lys Ser Glu Leu Glu Gln Leu Asp Lys
340 345 350
att ttt cga acc ctg ggt acg cct gat gag aaa att tgg cca gga tta 1104
Ile Phe Arg Thr Leu Gly Thr Pro Asp Glu Lys Ile Trp Pro Gly Leu
355 360 365
tcc aaa tta cct ggg gct aaa gea aat ttt gtt aag caa ctg ttt aat 1152
Ser Lys Leu Pro Gly Ala Lys Ala Asn Phe Val Lys Gln Leu Phe Asn
370 375 380
aca cta agg aag aag ttt cca gct gcg tcg ttt att ggt ttg cca gtt 1200
Thr Leu Arg Lys Lys Phe Pro Ala Ala Ser Phe Ile Gly Leu Pro Val 385 390 395 400
tta tct gag ctt gga ttt gac ttg ttg cag cag ctg cta act tat gac 1248
Leu Ser Glu Leu Gly Phe Asp Leu Leu Gln Gln Leu Leu Thr Tyr Asp
405 410 415
cct gaa aag agg ata aca gea gaa gat gct ctc ctt cat gat tgg ttc 1296
Pro Glu Lys Arg Ile Thr Ala Glu Asp Ala Leu Leu His Asp Trp Phe
420 425 430
cat gaa gcc cct ctt ccc aaa tct gat ttc aag cca att ttt cct tct 1344
His Glu Ala Pro Leu Pro Lys Ser Asp Phe Lys Pro Ile Phe Pro Ser
435 440 445
tgg cag tga 1353
Trp Gln 450
<210> 50
<211> 450
<212> PRT
<213> Glycine max
<400> 50
Met Glu Glu Pro Leu Thr Asp Ser Gly Ser Tyr Pro His Asp Leu Glu 1 5 10 15 Glu Asp Lys Asp 20 Val Gln Gly Trp Thr 25 Ile Thr Lys Ser Arg 30 Trp Ala Cys Asp Val 35 Arg Pro Ser Pro Arg 40 Gly Ala Asp Asp Glu 45 Gln Lys His Gly Lys Val Ser Ser Ser Pro Glu Ile Gly Glu Phe His Gly Gly Gly 50 55 60 Thr Ser Glu Ser Thr Ile Thr Arg Ser Ser Gly Ser Ser Gly Arg Asp 65 70 75 80 His Tyr Leu Gly Ala Ser Ser Asp Asp Thr Asp Ser Glu Lys Asp Phe 85 90 95 Leu Met Asp Ser Met Val Asn Val Glu Glu Gln Ser Asp Asp Gly Asp 100 105 110 Ser Pro Ser Asp Ser Asp Glu Cys Gly Gly Leu Met His Val Leu Arg 115 120 125 Asn Ile Asn Met Leu Gln Ser Cys Arg Ser Val Cys Glu Phe Glu Met 130 135 140 Ile Lys Lys Ile Asn Glu Gly Thr Tyr Gly Val Val Tyr Lys Ala Arg 145 150 155 160 Asp Lys Lys Thr Gly Glu Leu Val Ala Leu Lys Lys Val Lys Met Asn 165 170 175 Ile Glu Arg Asp Gly Phe Pro Met Ser Ser Leu Arg Glu Ile Asn Ile 180 185 190 Leu Leu Ser Phe Asn His Pro Ser Ile Val Asn Val Lys Glu Val Val 195 200 205 Val Asp Asp Phe Asp Gly Thr Phe Met Val Met Glu His Met Glu Tyr 210 215 220 Asp Leu Lys Gly Leu Met Glu Val Lys Lys His Pro Phe Ser Met Ser 225 230 235 240 Glu Ile Lys Ser Leu Val Arg Gln Leu Leu Glu Gly Val Lys Tyr Leu 245 250 255 His Asp Asn Trp Val Ile His Arg Asp Leu Lys Ser Ser Asn Ile Leu 260 265 270 Leu Asn His Asp Gly Glu Leu Lys Ile Cys Asp Phe Gly Leu Ser Arg 275 280 285 Gln Tyr Gly Ser Pro Leu Lys Pro Tyr Thr Pro Val Val Val Thr Leu 290 295 300 Trp Tyr Arg Ala Pro Glu Leu Leu Leu Gly Ala Lys Glu Tyr Ser Thr 305 310 315 320 Ala Ile Asp Met Trp Ser Val Gly Cys Ile Met Ala Glu Leu Ile Ala 325 330 335 Lys Glu Pro Leu Phe Arg Gly Lys Ser Glu Leu Glu Gln Leu Asp Lys 340 345 350 Ile Phe Arg Thr Leu Gly Thr Pro Asp Glu Lys Ile Trp Pro Gly Leu 355 360 365 Ser Lys Leu Pro Gly Ala Lys Ala Asn Phe Val Lys Gln Leu Phe Asn. 370 375 380 Thr Leu Arg Lys Lys Phe Pro Ala Ala Ser Phe Ile Gly Leu Pro Val 385 390 395 400 Leu Ser Glu Leu Gly Phe Asp Leu Leu Gln Gln Leu Leu Thr Tyr Asp 405 410 415 Pro Glu Lys Arg Ile Thr Ala Glu Asp Ala Leu Leu His Asp Trp Phe 420 425 430 His Glu Ala Pro Leu Pro Lys Ser Asp Phe Lys Pro Ile Phe Pro Ser 435 440 445 Trp Gln 450 <210> 51 <211> 885 <212> DNA <213> Linum usitatissimum <220> <221> CDS <222> (1)..| !885) <400> 51 atg gag cag tac gag aaa gtg gag aag att ggg gag gga act tac gga Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 gtg gta tat aag gcc cgt gat cga aac acc aat cag act att gct ttg Val Val Tyr Lys Ala Arg 20
aag aag att cgc ctt gaa Lys Lys Ile Arg Leu Glu 35 att aga gaa att tcg ctt Ile Arg Glu Ile Ser Leu 50 agg ttg cag gat gtg gtg Arg Leu Gln Asp Val Val 65 70 gag tac ctg gac tta gat Glu Tyr Leu Asp Leu Asp 85 ttt gct aag gat ccg cgt Phe Ala Lys Asp Pro Arg 100 cgt ggc att tct tat tgc Arg Gly Ile Ser Tyr Cys 115 aag cca cag aat ctg ctt Lys Pro Gln Asn Leu Leu 130 gea gat ttt ggt ctg gcc Ala Asp Phe Gly Leu Ala 145 150 acc cat gag gtg gtg act Thr His Glu Val Val Thr 165 gga tct cac cac tac tct Gly Ser His His Tyr Ser 180 att ttc gcc gaa atg gtg Ile Phe Ala Glu Met Val 195 gag att gat gag cta ttt Glu Ile Asp Glu Leu Phe 210 gaa gac acc tgg gcc gga Glu Asp Thr Trp Ala Gly 225 230 ttc cca aag tgg cct tca Phe Pro Lys Trp Pro Ser 245 gag tca acc ggt gtt gac Glu Ser Thr Gly Val Asp 260 age aaa aga att aca gcc Ser Lys Arg Ile Thr Ala
275
gac att gga ttt gtg cca Asp Ile Gly Phe Val Pro 290 294
Asp Arg Asn Thr Asn Gln 25
cag gaa gat gag ggc gtg Gln Glu Asp Glu Gly Val 40
ctg aaa gaa atg cag cat Leu Lys Glu Met Gln His 55 60
cac agt gag aaa cgg cta His Ser Glu Lys Arg Leu 75
ttg aaa aag cac atg gac Leu Lys Lys His Met Asp 90
ata gtc aaa act ttc cta Ile Val Lys Thr Phe Leu 105
cac tct cac agg gtt ctt His Ser His Arg Val Leu 120
att gat cgt cgt acc aat Ile Asp Arg Arg Thr Asn 135 140
aga gct ttt ggt ata cct Arg Ala Phe Gly Ile Pro 155
ctc tgg tat aga gcc cca Leu Trp Tyr Arg Ala Pro 170
act cca gtt gat gtg tgg Thr Pro Val Asp Val Trp 185
aac cag cgc ccc tta ttc Asn Gln Arg Pro Leu Phe 200
aag att ttc aga ate atg Lys Ile Phe Arg Ile Met 215 220
gta aca tct tta ccc gat Val Thr Ser Leu Pro Asp 235
aag gac ctg gea acc atg Lys Asp Leu Ala Thr Met 250
ctc tta cga aaa atg ctg Leu Leu Arg Lys Met Leu 265
agg act gcc cta gag cat Arg Thr Ala Leu Glu His 280
taa
Thr Ile Ala Leu 30
cca age acc gcc 144
Pro Ser Thr Ala 45
ggt aac att gtg 192
Gly Asn Ile Val
tat ttg gtt ttt 240
Tyr Leu Val Phe 80
tca agt ccg gag 288
Ser Ser Pro Glu 95
tac caa ate ctc 336
Tyr Gln Ile Leu 110
cat cga gat cta 384
His Arg Asp Leu
125
gea ctc aag ctt 432
Ala Leu Lys Leu
gtc agg aca ttc 480
Val Arg Thr Phe 160
gag att ctt ctc 528
Glu Ile Leu Leu 175
tct ata gga tgt 576
Ser Ile Gly Cys 190
ccc ggg gac tct 624
Pro Gly Asp Ser
205
ggg acg ccc aat 672
Gly Thr Pro Asn
ttc aag tcc acc 720
Phe Lys Ser Thr 240
gtt caa act ctc 768
Val Gln Thr Leu 255
tgc ttg gat cca 816
Cys Leu Asp Pro 270
gaa tac ttc aag 864
Glu Tyr Phe Lys
285
885
<210> 52 <211> 294 <212> PRT
<213> Linum usitatissimum
<400> 52
Met Glu Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys 20 Ala Arg Asp Arg Asn 25 Thr Asn Gln Thr Ile 30 Ala Leu Lys Lys Ile 35 Arg Leu Glu Gln Glu 40 Asp Glu Gly Val Pro 45 Ser Thr Ala Ile
Arg
65
Glu
Phe
Arg
Lys
Ala 145 Thr
Gly
Ile
Glu
Glu 225 Phe
Glu
Ser
Asp
Arg Glu 50
Leu Gln
Tyr Leu
Ala Lys
Gly Ile 115 Pro Gln 130
Asp Phe
His Glu
Ser His
Phe Ala 195 Ile Asp 210
Asp Thr
Pro Lys
Ser Thr
Lys Arg 275 Ile Gly 290
Ile Ser
Asp Val
Asp Leu 85
Asp Pro 100
Ser Tyr
Asn Leu
Gly Leu
Val Val 165 His Tyr 180
Glu Met
Glu Leu
Trp Ala
Trp Pro 245 Gly Val 260
Ile Thr
Leu Leu
55 Val His 70
Asp Leu
Arg Ile
Cys His
Leu Ile 135 Ala Arg 150
Thr Leu
Ser Thr
Val Asn
Phe Lys 215 Gly Val 230
Ser Lys
Asp Leu Ala Arg Phe Val Pro
Lys
Ser
Lys
Val
Ser 120 Asp
Ala
Trp
Pro
Gln 200 Ile
Thr
Asp
Leu
Thr 280
Glu
Glu
Lys
Lys 105 His
Arg
Phe
Tyr
Val 185 Arg
Phe
Ser
Leu
Arg 265 Ala
Met
Lys
His
90
Thr
Arg
Arg
Gly
Arg 170 Asp
Pro
Arg
Leu
Ala 250 Lys
Leu
Gln
Arg
75
Met
Phe
Val
Thr
Ile 155 Ala
Val
Leu
Ile
Pro 235 Thr
Met
Glu
His 60 Leu
Asp
Leu
Leu
Asn 140 Pro
Pro
Trp
Phe
Met 220 Asp
Met
Leu
His
Gly
Tyr
Ser
Tyr
His 125 Ala
Val
Glu
Ser
Pro 205 Gly
Phe
Val
Cys
Glu 285
Asn
Leu
Ser
Gln 110 Arg
Leu
Arg
Ile
Ile 190 Gly
Thr
Lys
Gln
Leu 270 Tyr
Ile
Val
Pro
95
Ile
Asp
Lys
Thr
Leu 175 Gly
Asp
Pro
Ser
Thr 255 Asp
Phe
Val
Phe
80
Glu
Leu
Leu
Leu
Phe 160 Leu
Cys
Ser
Asn
Thr 240 Leu
Pro
Lys
<210> 53 <211> 1152 <212> DNA <213> Zea mays
<220>
<221> CDS
<222> (1)..(1152)
<400> 53
atg tca gat act gac Met Ser Asp Thr Asp 1 5
gaa aga gag aag gca Glu Arg Glu Lys Ala 20
aga agt gtt gat gag Arg Ser Val Asp Glu 35
tat ggt gtt gta tac Tyr Gly Val Val Tyr 50
gca ttg aag aag gta Ala Leu Lys Lys Val 65
acc tct ctt agg gaa Thr Ser Leu Arg Glu 85
att gtg gat gtt aag Ile Val Asp Val Lys 100
ttt atg gtt atg gag Phe Met Val Met Glu
tca gac aat gaa ata cac Ser Asp Asn Glu Ile His 10
cca cac agg tgt ate aat Pro His Arg Cys Ile Asn 25
ttt gag agg ctc aac aaa Phe Glu Arg Leu Asn Lys 40
aga gca agg gat aag aag Arg Ala Arg Asp Lys Lys 55
aag atg gag aag gag cga Lys Met Glu Lys Glu Arg 70 75
ata aat ate ctc ttg tct Ile Asn Ile Leu Leu Ser 90
gaa gta gta gtt gga agt Glu Val Val Val Gly Ser 105
tac atg gaa cat gat ctt Tyr Met Glu His Asp Leu
aga cct gaa acc cct Arg Pro Glu Thr Pro 15
atg ctt caa gat tgc Met Leu Gln Asp Cys 30
att aac gag ggc aca Ile Asn Glu Gly Thr 45
aca agt gag att gtt Thr Ser Glu Ile Val 60
gaa ggt ttc cca tta Glu Gly Phe Pro Leu 80
ttc cac aat cct tca Phe His Asn Pro Ser 95
agt cta gat agt att Ser Leu Asp Ser Ile 110
aaa ggt gtc atg gag Lys Gly Val Met Glu 115 120 125
acc atg aaa caa cca tat acc caa age gag gta aag tgt ttg atg ctt 432
Thr Met Lys Gln Pro Tyr Thr Gln Ser Glu Val Lys Cys Leu Met Leu
130 135 140
cag ctg cta gaa ggt gta aaa tat cta cat gac aat tgg gtg ctt cat 480
Gln Leu Leu Glu Gly Val Lys Tyr Leu His Asp Asn Trp Val Leu His 145 150 155 160
agg gat ctg aag acc tca aat ctt ttg ttg aat aac cgt ggt gag tta 528
Arg Asp Leu Lys Thr Ser Asn Leu Leu Leu Asn Asn Arg Gly Glu Leu
165 170 175
aaa ata tgt gat ttt gga ctg tet cgt caa tat gga age cca tta aaa 576
Lys Ile Cys Asp Phe Gly Leu Ser Arg Gln Tyr Gly Ser Pro Leu Lys
180 185 190
cct tat act caa ctg gtt gtg act ttg tgg tac agg gcc cca gaa ttg 624
Pro Tyr Thr Gln Leu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Leu
195 200 205
ttg tta gga aca aag gag tat tet act gct att gat atg tgg tet gtg 672
Leu Leu Gly Thr Lys Glu Tyr Ser Thr Ala Ile Asp Met Trp Ser Val
210 215 220
ggc tgt ata atg gct gag ctt ctt gcc aaa gaa ccg tta ttc aat gga 720
Gly Cys Ile Met Ala Glu Leu Leu Ala Lys Glu Pro Leu Phe Asn Gly 225 230 235 240
aaa aca gag ttt gaa cag cta gat aag att ttt aga aca ctc ggc aca 768
Lys Thr Glu Phe Glu Gln Leu Asp Lys Ile Phe Arg Thr Leu Gly Thr
245 250 255
cct aat gag aag att tgg cct ggc tat gct aaa tta cca ggt gtg aaa 816
Pro Asn Glu Lys Ile Trp Pro Gly Tyr Ala Lys Leu Pro Gly Val Lys
260 265 270
gta aat ttt gtt aaa caa ccg tat aat aga cta agg gat aag ttc cca 864
Val Asn Phe Val Lys Gln Pro Tyr Asn Arg Leu Arg Asp Lys Phe Pro
275 280 285
gcc gct tet ttt tet ggg cga cca ate ctg tet gaa gct ggt ttt gat 912
Ala Ala Ser Phe Ser Gly Arg Pro Ile Leu Ser Glu Ala Gly Phe Asp
290 295 300
cta ttg aac aga ctg ctg act tat gac cct gat aag cgc ata tca gea 960
Leu Leu Asn Arg Leu Leu Thr Tyr Asp Pro Asp Lys Arg Ile Ser Ala 305 310 315 320
gac gat gct ctt aag cac aaa tgg ttc tet gaa gtt cct ctg cct aaa 1008
Asp Asp Ala Leu Lys His Lys Trp Phe Ser Glu Val Pro Leu Pro Lys
325 330 335
tca aag gac ttc atg cca aca ttc cct gct ctt aat gaa ctt gac agg 1056
Ser Lys Asp Phe Met Pro Thr Phe Pro Ala Leu Asn Glu Leu Asp Arg
340 345 350
cgt tcc aga agg tat ctg aag agt cct gat cct ctg gaa gag caa cgt 1104
Arg Ser Arg Arg Tyr Leu Lys Ser Pro Asp Pro Leu Glu Glu Gln Arg
355 360 365
ttg aaa gaa ctg caa ggg aac ata ggc aac cat ggg ctt ttt ggg tga 1152
Leu Lys Glu Leu Gln Gly Asn Ile Gly Asn His Gly Leu Phe Gly 370 375 380
<210> 54 <211> 383 <212> PRT <213> Zea mays
<400> 54 Met 1 Ser Asp Thr Asp 5 Ser Asp Asn Glu Arg Glu Lys 20 Ala Pro His Arg Arg Ser Val 35 Asp Glu Phe Glu Arg 40 Tyr Gly 50 Val Val Tyr Arg Ala 55 Arg Ala 65 Leu Lys Lys Val Lys 70 Met Glu
Glu Ile His Arg Pro Glu Thr Pro
10 15
Cys Ile Asn Met Leu Gln Asp Cys 25 30
Leu Asn Lys Ile Asn Glu Gly Thr 45
Asp Lys Lys Thr Ser Glu Ile Val 60
Lys Glu Arg Glu Gly Phe Pro Leu 75 80 Thr Ser Leu Arg Glu Ile Asn Ile Leu Leu Ser Phe His Asn Pro Ser
85 90 95
Ile Val Asp Val Lys Glu Val Val Val Gly Ser Ser Leu Asp Ser Ile
100 105 110
Phe Met Val Met Glu Tyr Met Glu His Asp Leu Lys Gly Val Met Glu
115 120 125
Thr Met Lys Gln Pro Tyr Thr Gln Ser Glu Val Lys Cys Leu Met Leu
130 135 140
Gln Leu Leu Glu Gly Val Lys Tyr Leu His Asp Asn Trp Val Leu His 145 150 155 160
Arg Asp Leu Lys Thr Ser Asn Leu Leu Leu Asn Asn Arg Gly Glu Leu
165 170 175
Lys Ile Cys Asp Phe Gly Leu Ser Arg Gln Tyr Gly Ser Pro Leu Lys
180 185 190
Pro Tyr Thr Gln Leu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Leu
195 200 205
Leu Leu Gly Thr Lys Glu Tyr Ser Thr Ala Ile Asp Met Trp Ser Val
210 215 220
Gly Cys Ile Met Ala Glu Leu Leu Ala Lys Glu Pro Leu Phe Asn Gly 225 230 235 240
Lys Thr Glu Phe Glu Gln Leu Asp Lys Ile Phe Arg Thr Leu Gly Thr
245 250 255
Pro Asn Glu Lys Ile Trp Pro Gly Tyr Ala Lys Leu Pro Gly Val Lys
260 265 270
Val Asn Phe Val Lys Gln Pro Tyr Asn Arg Leu Arg Asp Lys Phe Pro
275 280 285
Ala Ala Ser Phe Ser Gly Arg Pro Ile Leu Ser Glu Ala Gly Phe Asp
290 295 300
Leu Leu Asn Arg Leu Leu Thr Tyr Asp Pro Asp Lys Arg Ile Ser Ala 305 310 315 320
Asp Asp Ala Leu Lys His Lys Trp Phe Ser Glu Val Pro Leu Pro Lys
325 330 335
Ser Lys Asp Phe Met Pro Thr Phe Pro Ala Leu Asn Glu Leu Asp Arg
340 345 350
Arg Ser Arg Arg Tyr Leu Lys Ser Pro Asp Pro Leu Glu Glu Gln Arg
355 360 365
Leu Lys Glu Leu Gln Gly Asn Ile Gly Asn His Gly Leu Phe Gly 370 375 380
<210> 55 <211> 885 <212> DNA
<213> Helianthus annuus
<220>
<221> CDS
<222> (1)..(885)
<400> 55 atg gac cag tat gag aag Met Asp Gln Tyr Glu Lys 1 5 gtg gtc tac aag gct cgt Val Val Tyr Lys Ala Arg 20 aag aag att cgt ctg gag Lys Lys Ile Arg Leu Glu 35 att aga gaa ate tcg tta Ile Arg Glu Ile Ser Leu 50 aag tta cag gat gtt gtg Lys Leu Gln Asp Val Val 65 70 gag tat ctg gac ctg gat Glu Tyr Leu Asp Leu Asp
gtt gag aag att ggt gaa Val Glu Lys Ile Gly Glu 10
gac aaa gtt acc aat gaa Asp Lys Val Thr Asn Glu 25
caa gaa gac gag ggt gtc Gln Glu Asp Glu Gly Val 40
ttg aaa gag atg caa cat Leu Lys Glu Met Gln His 55 60
cac agt gac aaa cga ttg His Ser Asp Lys Arg Leu 75
ttg aag aag cat atg gac Leu Lys Lys His Met Asp
gga aca tat ggt 48
Gly Thr Tyr Gly 15
aca ate gct ttg 96
Thr Ile Ala Leu 30
cca age aca gct 144
Pro Ser Thr Ala 45
gga aat att gtc 192
Gly Asn Ile Val
tat ctg gtt ttc 240
Tyr Leu Val Phe 80
tca tgt ccc gag 288
Ser Cys Pro Glu 85 90 95
ttt tca aag gat cca cac att gta aaa atg ttt cta tat cag ate cta 336
Phe Ser Lys Asp Pro His Ile Val Lys Met Phe Leu Tyr Gln Ile Leu
100 105 110
cgt ggc att gct tat tgc cat tcc cat aga gtt ctc cat aga gac tta 384
Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu
115 120 125
aaa cct caa aac ctt ttg att gat cgc cgt acc aat gea cta aag ctc 432
Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu
130 135 140
gea gat ttt gga ttg gcc agg gcc ttt ggc att cct gtc agg aca ttc 480
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160
aca cac gag gtg gtt aca ctg tgg tat aga gea cca gaa att ctt ctt 528
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ala Pro Glu Ile Leu Leu
165 170 175
gga tcg cgt cat tat tet act cct gtt gat gtg tgg tcg gtc ggt tgt 576
Gly Ser Arg His Tyr Ser Thr Pro Val Asp Val Trp Ser Val Gly Cys
180 185 190
ata ttt gct gag atg gtg aac caa cgg cca ctc ttc cct ggt gaa tet 624
Ile Phe Ala Glu Met Val Asn Gln Arg Pro Leu Phe Pro Gly Glu Ser
195 200 205
gag att gat gag ctg ttc aaa att ttc aga ate atg gga act cca aat 672
Glu Ile Asp Glu Leu Phe Lys Ile Phe Arg Ile Met Gly Thr Pro Asn
210 215 220
gaa gat aca tgg cat ggt gtg aca tca ctg cct gac ttt aag tcc gcc 720
Glu Asp Thr Trp His Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala
225 230 235 ' 240
ttt cca aaa tgg tca tca aag gac ctt gcg act ate gtc ccg aat ctt 768
Phe Pro Lys Trp Ser Ser Lys Asp Leu Ala Thr Ile Val Pro Asn Leu
245 250 255
gaa aag ccc ggt ctt gat ctc cta cgt aaa atg ctg tgc ttg gat ccc 816
Glu Lys Pro Gly Leu Asp Leu Leu Arg Lys Met Leu Cys Leu Asp Pro
260 265 270
agt aga aga att aca gcc cgg gcc gea ctg gaa cac gaa tac ttt aaa 864
Ser Arg Arg Ile Thr Ala Arg Ala Ala Leu Glu His Glu Tyr Phe Lys
275 280 285
gat ate ggg ttt gtg cca taa 885
Asp Ile Gly Phe Val Pro 290 294
<210> 56 <211> 294 <212> PRT
<213> Helianthus annuus
<400> 56
Met Asp Gln Tyr Glu Lys Val Glu Lys Ile Gly Glu Gly Thr Tyr Gly 1 5 10 15 Val Val Tyr Lys Ala Arg Asp Lys Val Thr Asn Glu Thr Ile Ala Leu 20 25 30 Lys Lys Ile Arg Leu Glu Gln Glu Asp Glu Gly Val Pro Ser Thr Ala 35 40 45 Ile Arg Glu Ile Ser Leu Leu Lys Glu Met Gln His Gly Asn Ile Val 50 55 60 Lys Leu Gln Asp Val Val His Ser Asp Lys Arg Leu Tyr Leu Val Phe 65 70 75 80 Glu Tyr Leu Asp Leu Asp Leu Lys Lys His Met Asp Ser Cys Pro Glu 85 90 95 Phe Ser Lys Asp Pro His Ile Val Lys Met Phe Leu Tyr Gln Ile Leu 100 105 110 Arg Gly Ile Ala Tyr Cys His Ser His Arg Val Leu His Arg Asp Leu 115 120 125 Lys Pro Gln Asn Leu Leu Ile Asp Arg Arg Thr Asn Ala Leu Lys Leu 130 135 140 Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Val Arg Thr Phe 145 150 155 160 Thr His Glu Val Val 165 Thr Leu Trp Tyr Arg 170 Ala Pro Glu Ile Leu 175 Leu Gly Ser Arg His 180 Tyr Ser Thr Pro Val 185 Asp Val Trp Ser Val 190 Gly Cys Ile Phe Ala 195 Glu Met Val Asn Gln 200 Arg Pro Leu Phe Pro 205 Gly Glu Ser Glu Ile 210 Asp Glu Leu Phe Lys 215 Ile Phe Arg Ile Met 220 Gly Thr Pro Asn Glu Asp Thr Trp His Gly Val Thr Ser Leu Pro Asp Phe Lys Ser Ala 225 230 235 240 Phe Pro Lys Trp Ser 245 Ser Lys Asp Leu Ala 250 Thr Ile Val Pro Asn 255 Leu Glu Lys Pro Gly 260 Leu Asp Leu Leu Arg 265 Lys Met Leu Cys Leu 270 Asp Pro Ser Arg Arg 275 Ile Thr Ala Arg Ala 280 Ala Leu Glu His Glu 285 Tyr Phe Lys Asp Ile Gly Phe Val Pro
290
<210> 57 <211> 11449 <212> DNA <213> Desconhecido
<220> <221>
<222> (1)..(11449) <223> vetor
<400> 57
gtttacccgc caatatatcc tgtcaaacac tgatagtttg tggaattcga gctcggtacc 60
cggggatcct ctagagtcga cctgcaggca tgcaagcttt gcagtgcagc gtgacccggt 120
cgtgcccctc tctagagata atgagcattg catgtctaag ttataaaaaa ttaccacata 180
ttttttttgt cacacttgtt tgaagtgcag tttatctatc tttatacata tatttaaact 240
ttactctacg aataatataa tctatagtac tacaataata tcagtgtttt agagaatcat 300
ataaatgaac agttagacat ggtctaaagg acaattgagt attttgacaa caggactcta 360
cagttttatc tttttagtgt gcatgtgttc tccttttttt ttgcaaatag cttcacctat 420
ataatacttc atccatttta ttagtacatc catttagggt ttagggttaa tggtttttat 480
agactaattt ttttagtaca tctattttat tctattttag cctctaaatt aagaaaacta 540
aaactctatt ttagtttttt tatttaatag tttagatata aaatagaata aaataaagtg 600
actaaaaatt aaacaaatac cctttaagaa attaaaaaaa ctaaggaaac atttttcttg 660
tttcgagtag ataatgccag cctgttaaac gccgtcgacg agtctaacgg acaccaacca 720
gcgaaccagc agcgtcgcgt cgggccaagc gaagcagacg gcacggcatc tctgtcgctg 780
cctctggacc cctctcgaga gttccgctcc accgttggac ttgctccgct gtcggcatcc 840
agaaattgcg tggcggagcg gcagacgtga gccggcacgg caggcggcct cctcctcctc 900
tcacggcacc ggcagctacg ggggattcct ttcccaccgc tccttcgctt tcccttcctc 960
gcccgccgta ataaatagac accccctcca caccctcttt ccccaacctc gtgttgttcg 1020
gagcgcacac acacacaacc agatctcccc caaatccacc cgtcggcacc tccgcttcaa 1080
ggtacgccgc tcgtcctccc cccccccccc cctctctacc ttctctagat cggcgttccg 1140
gtccatggtt agggcccggt agttctactt ctgttcatgt ttgtgttaga tccgtgtttg 1200
tgttagatcc gtgctgctag cgttcgtaca cggatgcgac ctgtacgtca gacacgttct 1260
gattgctaac ttgccagtgt ttctctttgg ggaatcctgg gatggctcta gccgttccgc 1320
agacgggatc gatttcatga ttttttttgt ttcgttgcat agggtttggt ttgccctttt 1380
cctttatttc aatatatgcc gtgcacttgt ttgtcgggtc atcttttcat gctttttttt 1440
gtcttggttg tgatgatgtg gtctggttgg gcggtcgttc tagatcggag tagaattctg 1500
tttcaaacta cctggtggat ttattaattt tggatctgta tgtgtgtgcc atacatattc 1560
atagttacga attgaagatg atggatggaa atatcgatct aggataggta tacatgttga 1620
tgcgggtttt actgatgcat atacagagat gctttttgtt cgcttggttg tgatgatgtg 1680
gtgtggttgg gcggtcgttc attcgttcta gatcggagta gaatactgtt tcaaactacc 1740
tggtgtattt attaattttg gaactgtatg tgtgtgtcat acatcttcat agttacgagt 1800
ttaagatgga tggaaatatc gatctaggat aggtatacat gttgatgtgg gttttactga 1860
tgcatataca tgatggcata tgcagcatct attcatatgc tctaaccttg agtacctatc 1920
tattataata aacaagtatg ttttataatt atttcgatct tgatatactt ggatgatggc 1980
atatgcagca gctatatgtg gattttttta gccctgcctt catacgctat ttatttgctt 2040 ggtactgttt cttttgtcga tgctcaccct gttgtttggt gttacttctg cagggtaccc 2100
ccggggatcc actagttcta gaaaccatgg ccaccgccgc cgccgcgtct accgcgctca 2160
ctggcgccac taccgctgcg cccaaggcga ggcgccgggc gcacctcctg gccacccgcc 2220
gcgccctcgc cgcgcccatc aggtgctcag cggcgtcacc cgccatgccg atggctcccc 2280
cggccacccc gctccggccg tggggcccca ccgatccccg caagggcgcc gacatcctcg 2340
tcgagtccct cgagcgctgc ggcgtccgcg acgtcttcgc ctaccccggc ggcgcgtcca 2400
tggagatcca ccaggcactc acccgctccc ccgtcatcgc caaccacctc ttccgccacg 2460
agcaagggga ggcctttgcg gcctccggct acgcgcgctc ctcgggccgc gtcggcgtct 2520
gcatcgccac ctccggcccc ggcgccacca accttgtctc cgcgctcgcc gacgcgctgc 2580
tcgattccgt ccccatggtc gccatcacgg gacaggtgcc gcgacgcatg attggcaccg 2640
acgccttcca ggagacgccc atcgtcgagg tcacccgctc catcaccaag cacaactacc 2700
tggtcctcga cgtcgacgac atcccccgcg tcgtgcagga ggctttcttc ctcgcctcct 2760
ctggtcgacc ggggccggtg cttgtcgaca tccccaagga catccagcag cagatggcgg 2820
tgcctgtctg ggacaagccc atgagtctgc ctgggtacat tgcgcgcctt cccaagcccc 2880
ctgcgactga gttgcttgag caggtgctgc gtcttgttgg tgaatcccgg cgccctgttc 2940
tttatgttgg cggtggctgc gcagcatctg gtgaggagtt gcgacgcttt gtggagctga 3000
ctggaatccc ggtcacaact actcttatgg gcctcggcaa cttccccagc gacgacccac 3060
tgtctctgcg catgctaggt atgcatggca cggtgtatgc aaattatgca gtggataagg 3120
ccgatctgtt gcttgcactt ggtgtgcggt ttgatgatcg tgtgacaggg aagattgagg 3180
cttttgcaag cagggctaag attgtgcacg ttgatattga tccggctgag attggcaaga 3240
acaagcagcc acatgtgtcc atctgtgcag atgttaagct tgctttgcag ggcatgaatg 3300
ctcttcttga aggaagcaca tcaaagaaga gctttgactt tggctcatgg aacgatgagt 3360
tggatcagca gaagagggaa ttcccccttg ggtataaaac atctaatgag gagatccagc 3420
cacaatatgc tattcaggtt cttgatgagc tgacgaaagg cgaggccatc atcggcacag 3480
gtgttgggca gcaccagatg tgggcggcac agtactacac ttacaagcgg ccaaggcagt 3540
ggttgtcttc agctggtctt ggggctatgg gatttggttt gccggctgct gctggtgctt 3600
ctgtggccaa cccaggtgtt actgttgttg acatcgatgg agatggtagc tttctcatga 3660
acgttcagga gctagctatg atccgaattg agaacctccc ggtgaaggtc tttgtgctaa 3720
acaaccagca cctggggatg gtggtgcagt gggaggacag gttctataag gccaacagag 3780
cgcacacata cttgggaaac ccagagaatg aaagtgagat atatccagat ttcgtgacga 3840
tcgccaaagg gttcaacatt ccagcggtcc gtgtgacaaa gaagaacgaa gtccgcgcag 3900
cgataaagaa gatgctcgag actccagggc cgtacctctt ggatataatc gtcccacacc 3960
aggagcatgt gttgcctatg atccctaatg gtggggcttt caaggatatg atcctggatg 4020
gtgatggcag gactgtgtac tgatctaaaa tccagcaagc aactgatcta aaatccagca 4080
agcaccgcct ccctgctagt acaagggtga tatgttttta tctgtgtgat gttctcctgt 4140
attctatctt tttttgtagg ccgtcagcta tctgttatgg taatcctatg tagcttccga 4200
ccttgtaatt gtgtagtctg ttgttttcct tctggcatgt gtcataagag atcatttaag 4260
tgccttttgc tacatataaa taagataata agcactgcta tgcagtggtt ctgaattggc 4320
ttctgttgcc aaatttaagt gtccaactgg tccttgcttt tgttttcgct atttttttcc 4380
ttttttagtt attattatat tggtaatttc aactcaacat atgatgtatg gaataatgct 4440
agggctgcaa tttcaaacta ttttacaaac cagaatggca ttttcgtggt ttgaggggag 4500
tgaaaaaaaa tgaggcattt gactgaatta gttacctgat ccattttcgt ggtttggatc 4560
attggaatta aattccattc taataatagt aattttggca tatatcaatt aagttaattc 4620
ggttttatgc aaaatatatt tgtatactat tattatcaag atgtcggaga tatttatatg 4680
ctacattttt actatacagg agtgagatga agagtgtcat gtaagttaca cagtagaaac 4740
aaattctatt aatgcataaa atcatttcca tcatccaccc tatgaatttg agatagacct 4800
atatctaaac tttgaaaagt ggttgaatat caaattccaa attaaataag ttattttatt 4860
gagtgaattc taatttctct aaaacgaagg gatctaaacg ccctctaaag ctaatttgga 4920
aactcaaact ttcttagcat tggaggggat tgagaaaaaa tattaattca ttttcatctc 4980
aatcattcaa tctccaaaga gatttgagtt ccttattagt ctgttccatg catcaaatcg 5040
gctcaatgtg tcattatttg ccatgacgat tgacgagttg ttctggggcc tagcgctttc 5100
cacgccgatg tgctggggcc tggtcctgga gaagacagct tgatatttaa agctatcaat 5160
tgtttcaatt gattcccact tcatttttct aaatgtagaa aacggtgacg tataagaaaa 5220
agaatgaatt aggactttta ttccgtacac taatctagag cggcccctta aggcgctgcg 5280
atcgcgttaa cagcttgctg aggaggcctc ggaccgttaa ttaacacgtg ggcgcgccac 5340
tagtcaattc agtacattaa aaacgtccgc aatgtgttat taagttgtct aagcgtcaat 5400
ttgtttacac cacaatatat cctgccacca gccagccaac agctccccga ccggcagctc 5460
ggcacaaaat caccactcga tacaggcagc ccatcagtcc gggacggcgt cagcgggaga 5520
gccgttgtaa ggcggcagac tttgctcatg ttaccgatgc tattcggaag aacggcaact 5580
aagctgccgg gtttgaaaca cggatgatct cgcggagggt agcatgttga ttgtaacgat 5640
gacagagcgt tgctgcctgt gatcaaatat catctccctc gcagagatcc gaattatcag 5700
ccttcttatt catttctcgc ttaaccgtga caggctgtcg atcttgagaa ctatgccgac 5760
ataataggaa atcgctggat aaagccgctg aggaagctga gtggcgctat ttctttagaa 5820
gtgaacgttg acgatcgtcg accgtacccc gatgaattaa ttcggacgta cgttctgaac 5880
acagctggat acttacttgg gcgattgtca tacatgacat caacaatgta cccgtttgtg 5940
taaccgtctc ttggaggttc gtatgacact agtggttccc ctcagcttgc gactagatgt 6000 tgaggcctaa cattttatta gagagcaggc tagttgctta gatacatgat cttcaggccg 6060
ttatctgtca gggcaagcga aaattggcca tttatgacga ccaatgcccc gcagaagctc 6120
ccatctttgc cgccatagac gccgcgcccc ccttttgggg tgtagaacat ccttttgcca 6180
gatgtggaaa agaagttcgt tgtcccattg ttggcaatga cgtagtagcc ggcgaaagtg 6240
cgagacccat ttgcgctata tataagccta cgatttccgt tgcgactatt gtcgtaattg 6300
gatgaactat tatcgtagtt gctctcagag ttgtcgtaat ttgatggact attgtcgtaa 6360
ttgcttatgg agttgtcgta gttgcttgga gaaatgtcgt agttggatgg ggagtagtca 6420
tagggaagac gagcttcatc cactaaaaca attggcaggt cagcaagtgc ctgccccgat 6480
gccatcgcaa gtacgaggct tagaaccacc ttcaacagat cgcgcatagt cttccccagc 6540
tctctaacgc ttgagttaag ccgcgccgcg aagcggcgtc ggcttgaacg aattgttaga 6600
cattatttgc cgactacctt ggtgatctcg cctttcacgt agtgaacaaa ttcttccaac 6660
tgatctgcgc gcgaggccaa gcgatcttct tgtccaagat aagcctgcct agcttcaagt 6720
atgacgggct gatactgggc cggcaggcgc tccattgccc agtcggcagc gacatccttc 6780
ggcgcgattt tgccggttac tgcgctgtac caaatgcggg acaacgtaag cactacattt 6840
cgctcatcgc cagcccagtc gggcggcgag ttccatagcg ttaaggtttc atttagcgcc 6900
tcaaatagat cctgttcagg aaccggatca aagagttcct ccgccgctgg acctaccaag 6960
gcaacgctat gttctcttgc ttttgtcagc aagatagcca gatcaatgtc gatcgtggct 7020
ggctcgaaga tacctgcaag aatgtcattg cgctgccatt ctccaaattg cagttcgcgc 7080
ttagctggat aacgccacgg aatgatgtcg tcgtgcacaa caatggtgac ttctacagcg 7140
cggagaatct cgctctctcc aggggaagcc gaagtttcca aaaggtcgtt gatcaaagct 7200
cgccgcgttg tttcatcaag ccttacggtc accgtaacca gcaaatcaat atcactgtgt 7260
ggcttcaggc cgccatccac tgcggagccg tacaaatgta cggccagcaa cgtcggttcg 7320
agatggcgct cgatgacgcc aactacctct gatagttgag tcgatacttc ggcgatcacc 7380
gcttccctca tgatgtttaa ctcctgaatt aagccgcgcc gcgaagcggt gtcggcttga 7440
atgaattgtt aggcgtcatc ctgtgctccc gagaaccagt accagtacat cgctgtttcg 7500
ttcgagactt gaggtctagt tttatacgtg aacaggtcaa tgccgccgag agtaaagcca 7560
cattttgcgt acaaattgca ggcaggtaca ttgttcgttt gtgtctctaa tcgtatgcca 7620
aggagctgtc tgcttagtgc ccactttttc gcaaattcga tgagactgtg cgcgactcct 7680
ttgcctcggt gcgtgtgcga cacaacaatg tgttcgatag aggctagatc gttccatgtt 7740
gagttgagtt caatcttccc gacaagctct tggtcgatga atgcgccata gcaagcagag 7800
tcttcatcag agtcatcatc cgagatgtaa tccttccggt aggggctcac acttctggta 7860
gatagttcaa agccttggtc ggataggtgc acatcgaaca cttcacgaac aatgaaatgg 7920
ttctcagcat ccaatgtttc cgccacctgc tcagggatca ccgaaatctt catatgacgc 7980
ctaacgcctg gcacagcgga tcgcaaacct ggcgcggctt ttggcacaaa aggcgtgaca 8040
ggtttgcgaa tccgttgctg ccacttgtta acccttttgc cagatttggt aactataatt 8100
tatgttagag gcgaagtctt gggtaaaaac tggcctaaaa ttgctgggga tttcaggaaa 8160
gtaaacatca ccttccggct cgatgtctat tgtagatata tgtagtgtat ctacttgatc 8220
gggggatctg ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc 8280
tcccggagac ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg 8340
gcgcgtcagc gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata 8400
gcggagtgta tactggctta actatgcggc atcagagcag attgtactga gagtgcacca 8460
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc 8520
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 8580
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 8640
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 8700
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 8760
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 8820
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 8880
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 8940
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 9000
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 9060
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 9120
ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 9180
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 9240
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 9300
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 9360
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 9420
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 9480
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 9540
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 9600
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 9660
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 9720
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctgcaggggg 9780
gggggggggg ggggacttcc attgttcatt ccacggacaa aaacagagaa aggaaacgac 9840
agaggccaaa aagcctcgct ttcagcacct gtcgtttcct ttcttttcag agggtatttt 9900
aaataaaaac attaagttat gacgaagaag aacggaaacg ccttaaaccg gaaaattttc 9960 ataaatagcg aaaacccgcg aggtcgccgc cccgtaacct gtcggatcac cggaaaggac
ccgtaaagtg ataatgatta tcatctacat atcacaacgt gcgtggaggc catcaaacca
cgtcaaataa tcaattatga cgcaggtatc gtattaattg atctgcatca acttaacgta
aaaacaactt cagacaatac aaatcagcga cactgaatac ggggcaacct catgtccccc
cccccccccc ccctgcaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct
cttgcccggc gtcaacacgg gataataccg cgccacatag cagaacttta aaagtgctca
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat
taacctataa aaataggcgt atcacgaggc cctttcgtct tcaagaattg gtcgacgatc
ttgctgcgtt cggatatttt cgtggagttc ccgccacaga cccggattga aggcgagatc
cagcaactcg cgccagatca tcctgtgacg gaactttggc gcgtgatgac tggccaggac
gtcggccgaa agagcgacaa gcagatcacg cttttcgaca gcgtcggatt tgcgatcgag
gatttttcgg cgctgcgcta cgtccgcgac cgcgttgagg gatcaagcca cagcagccca
ctcgaccttc tagccgaccc agacgagcca agggatcttt ttggaatgct gctccgtcgt
caggctttcc gacgtttggg tggttgaaca gaagtcatta tcgtacggaa tgccaagcac
tcccgagggg aaccctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt
cacgcccttt taaatatccg ttattctaat aaacgctctt ttctcttag
10020 10080 10140 10200 10260 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280 11340 11400 11449
<210> 58
<211> 4510
<212> DNA
<213> Desconhecido
<220> <221>
<222> (1)..(4510) <223> vetor
<400> 58
acacaggaaa cagctatgac catgattacg ccaagctatc gtttaaacct taaggcgatc 60
gcgctgaggc ggaccgcacg tggaattagc ttggcgcgcc aattcccgat ctagtaacat 120
agatgacacc gcgcgcgata atttatccta gtttgcgcgc tatattttgt tttctatcgc 180
gtattaaatg tataattgcg ggactctaat cataaaaacc catctcataa ataacgtcat 240
gcattacatg ttaattatta catgcttaac gtaattcaac agaaattata tgataatcat 300
cgcaagaccg gcaacaggat tcaatcttaa gaaactttat tgccaaatgt ttgaacgatc 360
ggggaaattc gagctccacc gcggtggcgg ccgctctaga actagtggat cccccgggct 420
gcaggaattc gatatcaagc ttatcgatac cgtcgacctc gagggggggc ccggtacctt 480
ggtgaactac cgatgatcgt aagagcttac agacggtgcc ttatataggc agagcgtcgg 540
aaggggggtg gtgtcacaca cgcactgcga tccttgctta caagctaagc aaaggcatcg 600
tggcagacaa ggaataaagt ggcacaggtg ccaaaagaaa gtggacagca cacttgtccg 660
aaaagcacac aataatacaa ctcagtggag catccactga atgggcccag tactctccgc 720
tgcggtcatc cctgacgtca atgcctcctc aatcgtcatt gcttacgtct tggagatcta 780
gcacatcttc tgcggctact ggcgacatag cccttggtgt ggcctggtat tcctcgaact 840 cctgctcttc tatcttcagc ttggtgactt ccttcataag ttcctcctcc attgtttgca 900
cgccaccggt cttcagaact tcaagattct tgagaaattc atcaattctg tcttgaatgt 960
gttcttcaat gagatctgcc cagtaccagc aatggcattt gttcattgcg cacttgaaga 1020
atttccttcc tgggttggca gatgttctgg acactaactg aattgcaggc ttcctgcatg 1080
cacagagtag aactggttcc tctgttagca taaaagcttg ctctgttctt tcgaacatgt 1140
ccttcttgaa tgtggggaat ggatccagaa ttttgtttcc ccattctctg agttgctcag 1200
tgtatggatg atctggataa ggaattactt cccttatggc ttgtgtaagc aggatcatct 1260
cttccgttgg ttcattctga gctaatttgg ctttgagcct ggacaagatg tcagctaaac 1320
cattgctctt cccttttatg tgttcaatga ctatctctgg tcctgcacca gtgatgtagt 1380
ccatgaacct gatccatctg atctcagaag gcttgtgttc agcactcttg ttgtagaacc 1440
tttcgattgc actactgtca gttctgactg tgatctctct tttgtccaag tagaacaatc 1500
tcatcttttc taagccattc ataaccccat agatttctgc atcacaggtt ccttttggct 1560
tatcaaattt tccactggca tacctacaga tttgctctgt atttcttggg tctgccttgt 1620
ttttcttcca cttgcatact gctccccatc cagttgcaca tgcatctgtt tcaatgataa 1680
tgtatgcatc ttctggtgga atagtgagat ttggaagcgt tctcaccatt gtcttgatcc 1740
tattgatcag cttccaatct tctgaattga gccttcgctc acctttctct gaggtctttg 1800
gatataatgg gccaagaagc ttgcccatat ctttgatgtg gtttctggca tagttcagtg 1860
ttgctagcca ggattaatta aaggcctgtt aacagcgctg ggcccgataa ttcactggcc 1920
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 1980
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 2040
caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct ccttacgcat 2100
ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 2160
tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2220
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2280
ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 2340
taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 2400
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 2460
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 2520
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 2580
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 2640
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 2700
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 2760
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 2820 ccagtcacag aaaagcatct ataaccatga gtgataacac gagctaaccg cttttttgca ccggagctga atgaagccat gcaacaacgt tgcgcaaact ttaatagact ggatggaggc gctggctggt ttattgctga gcagcactgg ggccagatgg caggcaacta tggatgaacg cattggtaac tgtcagacca ttttaattta aaaggatcta taacgtgagt tttcgttcca tgagatcctt tttttctgcg gcggtggttt gtttgccgga agcagagcgc agataccaaa aagaactctg tagcaccgcc gccagtggcg ataagtcgtg gcgcagcggt cgggctgaac tacaccgaac tgagatacct agaaaggcgg acaggtatcc cttccagggg gaaacgcctg gagcgtcgat ttttgtgatg gcggcctttt tacggttcct ttatcccctg attctgtgga cgcagccgaa cgaccgagcg cgcaaaccgc ctctccccgc cccgactgga aagcgggcag gcaccccagg ctttacactt taacaatttc
<210> 59 <211> 13170 <212> DNA <213> Desconhecido
tacggatggc atgacagtaa gagaattatg cagtgctgcc 2880
tgcggccaac ttacttctga caacgatcgg aggaccgaag 2940
caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 3000
accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 3060
attaactggc gaactactta ctctagcttc ccggcaacaa 3120
ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 3180
taaatctgga gccggtgagc gtgggtctcg cggtatcatt 3240
taagccctcc cgtatcgtag ttatctacac gacggggagt 3300
aaatagacag atcgctgaga taggtgcctc actgattaag 3360
agtttactca tatatacttt agattgattt aaaacttcat 3420
ggtgaagatc ctttttgata atctcatgac caaaatccct 3480
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 3540
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 3600
tcaagagcta ccaactcttt ttccgaaggt aactggcttc 3660
tactgttctt ctagtgtagc cgtagttagg ccaccacttc 3720
tacatacctc gctctgctaa tcctgttacc agtggctgct 3780
tcttaccggg ttggactcaa gacgatagtt accggataag 3840
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 3900
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 3960
ggtaagcggc agggtcggaa caggagagcg cacgagggag 4020
gtatctttat agtcctgtcg ggtttcgcca cctctgactt 4080
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 4140
ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 4200
taaccgtatt accgcctttg agtgagctga taccgctcgc 4260
cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 4320
gcgttggccg attcattaat gcagctggca cgacaggttt 4380
tgagcgcaac gcaattaatg tgagttagct cactcattag 4440
tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga 4500
4510
<220> <221>
<222> (1)..(13170)
<223> vetor <400> 59 gtttacccgc caatatatcc tgtcaaacac tgatagtttg tggaattcga gctcggtacc 60 cggggatcct ctagagtcga cctgcaggca tgcaagcttc cggctgcagt gcagcgtgac 120 ccggtcgtgc ccctctctag agataatgag cattgcatgt ctaagttata aaaaattacc 180 acatattttt tttgtcacac ttgtttgaag tgcagtttat ctatctttat acatatattt 240 aaactttact ctacgaataa tataatctat agtactacaa taatatcagt gttttagaga 300 atcatataaa tgaacagtta gacatggtct aaaggacaat tgagtatttt gacaacagga 360 ctctacagtt ttatcttttt agtgtgcatg tgttctcctt tttttttgca aatagcttca 420 cctatataat acttcatcca ttttattagt acatccattt agggtttagg gttaatggtt 480 tttatagact aattttttta gtacatctat tttattctat tttagcctct aaattaagaa 540 aactaaaact ctattttagt ttttttattt aatagtttag atataaaata gaataaaata 600 aagtgactaa aaattaaaca aatacccttt aagaaattaa aaaaactaag gaaacatttt 660 tcttgtttcg agtagataat gccagcctgt taaacgccgt cgacgagtct aacggacacc 720 aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg gcatctctgt 780 cgctgcctct ggacccctct cgagagttcc gctccaccgt tggacttgct ccgctgtcgg 840 catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc ggcctcctcc 900 tcctctcacg gcaccggcag ctacggggga ttcctttccc accgctcctt cgctttccct 960 tcctcgcccg ccgtaataaa tagacacccc ctccacaccc tctttcccca acctcgtgtt 1020 gttcggagcg cacacacaca caaccagatc tcccccaaat ccacccgtcg gcacctccgc 1080 ttcaaggtac gccgctcgtc ctcccccccc ccccccctct ctaccttctc tagatcggcg 1140 ttccggtcca tggttagggc ccggtagttc tacttctgtt catgtttgtg ttagatccgt 1200 gtttgtgtta gatccgtgct gctagcgttc gtacacggat gcgacctgta cgtcagacac 1260 gttctgattg ctaacttgcc agtgtttctc tttggggaat cctgggatgg ctctagccgt 1320 tccgcagacg ggatcgattt catgattttt tttgtttcgt tgcatagggt ttggtttgcc 1380 cttttccttt atttcaatat atgccgtgca cttgtttgtc gggtcatctt ttcatgcttt 1440 tttttgtctt ggttgtgatg atgtggtctg gttgggcggt cgttctagat cggagtagaa 1500 ttctgtttca aactacctgg tggatttatt aattttggat ctgtatgtgt gtgccataca 1560 tattcatagt tacgaattga agatgatgga tggaaatatc gatctaggat aggtatacat 1620 gttgatgcgg gttttactga tgcatataca gagatgcttt ttgttcgctt ggttgtgatg 1680 atgtggtgtg gttgggcggt cgttcattcg ttctagatcg gagtagaata ctgtttcaaa 1740 ctacctggtg tatttattaa ttttggaact gtatgtgtgt gtcatacatc ttcatagtta 1800 cgagtttaag atggatggaa atatcgatct aggataggta tacatgttga tgtgggtttt 1860 actgatgcat atacatgatg gcatatgcag catctattca tatgctctaa ccttgagtac 1920
ctatctatta taataaacaa gtatgtttta taattatttc gatcttgata tacttggatg 1980
atggcatatg cagcagctat atgtggattt ttttagccct gccttcatac gctatttatt 2040
tgcttggtac tgtttctttt gtcgatgctc accctgttgt ttggtgttac ttctgcaggg 2100
tacccccggg gatccactag ttctagaaac catggccacc gccgccgccg cgtctaccgc 2160
gctcactggc gccactaccg ctgcgcccaa ggcgaggcgc cgggcgcacc tcctggccac 2220
ccgccgcgcc ctcgccgcgc ccatcaggtg ctcagcggcg tcacccgcca tgccgatggc 2280
tcccccggcc accccgctcc ggccgtgggg ccccaccgat ccccgcaagg gcgccgacat 2340
cctcgtcgag tccctcgagc gctgcggcgt ccgcgacgtc ttcgcctacc ccggcggcgc 2400
gtccatggag atccaccagg cactcacccg ctcccccgtc atcgccaacc acctcttccg 2460
ccacgagcaa ggggaggcct ttgcggcctc cggctacgcg cgctcctcgg gccgcgtcgg 2520
cgtctgcatc gccacctccg gccccggcgc caccaacctt gtctccgcgc tcgccgacgc 2580
gctgctcgat tccgtcccca tggtcgccat cacgggacag gtgccgcgac gcatgattgg 2640
caccgacgcc ttccaggaga cgcccatcgt cgaggtcacc cgctccatca ccaagcacaa 2700
ctacctggtc ctcgacgtcg acgacatccc ccgcgtcgtg caggaggctt tcttcctcgc 2760
ctcctctggt cgaccggggc cggtgcttgt cgacatcccc aaggacatcc agcagcagat 2820
ggcggtgcct gtctgggaca agcccatgag tctgcctggg tacattgcgc gccttcccaa 2880
gccccctgcg actgagttgc ttgagcaggt gctgcgtctt gttggtgaat cccggcgccc 2940
tgttctttat gttggcggtg gctgcgcagc atctggtgag gagttgcgac gctttgtgga 3000
gctgactgga atcccggtca caactactct tatgggcctc ggcaacttcc ccagcgacga 3060
cccactgtct ctgcgcatgc taggtatgca tggcacggtg tatgcaaatt atgcagtgga 3120
taaggccgat ctgttgcttg cacttggtgt gcggtttgat gatcgtgtga cagggaagat 3180
tgaggctttt gcaagcaggg ctaagattgt gcacgttgat attgatccgg ctgagattgg 3240
caagaacaag cagccacatg tgtccatctg tgcagatgtt aagcttgctt tgcagggcat 3300
gaatgctctt cttgaaggaa gcacatcaaa gaagagcttt gactttggct catggaacga 3360
tgagttggat cagcagaaga gggaattccc ccttgggtat aaaacatcta atgaggagat 3420
ccagccacaa tatgctattc aggttcttga tgagctgacg aaaggcgagg ccatcatcgg 3480
cacaggtgtt gggcagcacc agatgtgggc ggcacagtac tacacttaca agcggccaag 3540
gcagtggttg tcttcagctg gtcttggggc tatgggattt ggtttgccgg ctgctgctgg 3600
tgcttctgtg gccaacccag gtgttactgt tgttgacatc gatggagatg gtagctttct 3660
catgaacgtt caggagctag ctatgatccg aattgagaac ctcccggtga aggtctttgt 3720
gctaaacaac cagcacctgg ggatggtggt gcagtgggag gacaggttct ataaggccaa 3780
cagagcgcac acatacttgg gaaacccaga gaatgaaagt gagatatatc cagatttcgt 3840 gacgatcgcc aaagggttca acattccagc ggtccgtgtg acaaagaaga acgaagtccg 3900
cgcagcgata aagaagatgc tcgagactcc agggccgtac ctcttggata taatcgtccc 3960
acaccaggag catgtgttgc ctatgatccc taatggtggg gctttcaagg atatgatcct 4020
ggatggtgat ggcaggactg tgtactgatc taaaatccag caagcaactg atctaaaatc 4080
cagcaagcac cgcctccctg ctagtacaag ggtgatatgt ttttatctgt gtgatgttct 4140
cctgtattct atcttttttt gtaggccgtc agctatctgt tatggtaatc ctatgtagct 4200
tccgaccttg taattgtgta gtctgttgtt ttccttctgg catgtgtcat aagagatcat 4260
ttaagtgcct tttgctacat ataaataaga taataagcac tgctatgcag tggttctgaa 4320
ttggcttctg ttgccaaatt taagtgtcca actggtcctt gcttttgttt tcgctatttt 4380
tttccttttt tagttattat tatattggta atttcaactc aacatatgat gtatggaata 4440
atgctagggc tgcaatttca aactatttta caaaccagaa tggcattttc gtggtttgag 4500
gggagtgaaa aaaaatgagg catttgactg aattagttac ctgatccatt ttcgtggttt 4560
ggatcattgg aattaaattc cattctaata atagtaattt tggcatatat caattaagtt 4620
aattcggttt tatgcaaaat atatttgtat actattatta tcaagatgtc ggagatattt 4680
atatgctaca tttttactat acaggagtga gatgaagagt gtcatgtaag ttacacagta 4740
gaaacaaatt ctattaatgc ataaaatcat ttccatcatc caccctatga atttgagata 4800
gacctatatc taaactttga aaagtggttg aatatcaaat tccaaattaa ataagttatt 4860
ttattgagtg aattctaatt tctctaaaac gaagggatct aaacgccctc taaagctaat 4920
ttggaaactc aaactttctt agcattggag gggattgaga aaaaatatta attcattttc 4980
atctcaatca ttcaatctcc aaagagattt gagttcctta ttagtctgtt ccatgcatca 5040
aatcggctca atgtgtcatt atttgccatg acgattgacg agttgttctg gggcctagcg 5100
ctttccacgc cgatgtgctg gggcctggtc ctggagaaga cagcttgata tttaaagcta 5160
tcaattgttt caattgattc ccacttcatt tttctaaatg tagaaaacgg tgacgtataa 5220
gaaaaagaat gaattaggac ttttattccg tacactaatc tagagcggcc ccttaaggcg 5280
ctgcgatcgc gttaacagct tgctgaggag gcctcggacc gttaattaat cctggctagc 5340
aacactgaac tatgccagaa accacatcaa agatatgggc aagcttcttg gcccattata 5400
tccaaagacc tcagagaaag gtgagcgaag gctcaattca gaagattgga agctgatcaa 5460
taggatcaag acaatggtga gaacgcttcc aaatctcact attccaccag aagatgcata 5520
cattatcatt gaaacagatg catgtgcaac tggatgggga gcagtatgca agtggaagaa 5580
aaacaaggca gacccaagaa atacagagca aatctgtagg tatgccagtg gaaaatttga 5640
taagccaaaa ggaacctgtg atgcagaaat ctatggggtt atgaatggct tagaaaagat 5700
gagattgttc tacttggaca aaagagagat cacagtcaga actgacagta gtgcaatcga 5760
aaggttctac aacaagagtg ctgaacacaa gccttctgag atcagatgga tcaggttcat 5820 ggactacatc actggtgcag gaccagagat agtcattgaa cacataaaag ggaagagcaa 5880
tggtttagct gacatcttgt ccaggctcaa agccaaatta gctcagaatg aaccaacgga 5940
agagatgatc ctgcttacac aagccataag ggaagtaatt ccttatccag atcatccata 6000
cactgagcaa ctcagagaat ggggaaacaa aattctggat ccattcccca cattcaagaa 6060
ggacatgttc gaaagaacag agcaagcttt tatgctaaca gaggaaccag ttctactctg 6120
tgcatgcagg aagcctgcaa ttcagttagt gtccagaaca tctgccaacc caggaaggaa 6180
attcttcaag tgcgcaatga acaaatgcca ttgctggtac tgggcagatc tcattgaaga 6240
acacattcaa gacagaattg atgaatttct caagaatctt gaagttctga agaccggtgg 6300
cgtgcaaaca atggaggagg aacttatgaa ggaagtcacc aagctgaaga tagaagagca 6360
ggagttcgag gaataccagg ccacaccaag ggctatgtcg ccagtagccg cagaagatgt 6420
gctagatctc caagacgtaa gcaatgacga ttgaggaggc attgacgtca gggatgaccg 6480
cagcggagag tactgggccc attcagtgga tgctccactg agttgtatta ttgtgtgctt 6540
ttcggacaag tgtgctgtcc actttctttt ggcacctgtg ccactttatt ccttgtctgc 6600
cacgatgcct ttgcttagct tgtaagcaag gatcgcagtg cgtgtgtgac accacccccc 6660
ttccgacgct ctgcctatat aaggcaccgt ctgtaagctc ttacgatcat cggtagttca 6720
ccaaggtacg cccgggtcgc tcctacgcgt caatgatccg cggacgccga gcccgagctc 6780
gaatttcccc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 6840
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 6900
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 6960
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 7020
ggtgtcatct atgttactag atcgggaatt ggcgcgccac tagtcaattc agtacattaa 7080
aaacgtccgc aatgtgttat taagttgtct aagcgtcaat ttgtttacac cacaatatat 7140
cctgccacca gccagccaac agctccccga ccggcagctc ggcacaaaat caccactcga 7200
tacaggcagc ccatcagtcc gggacggcgt cagcgggaga gccgttgtaa ggcggcagac 7260
tttgctcatg ttaccgatgc tattcggaag aacggcaact aagctgccgg gtttgaaaca 7320
cggatgatct cgcggagggt agcatgttga ttgtaacgat gacagagcgt tgctgcctgt 7380
gatcaaatat catctccctc gcagagatcc gaattatcag ccttcttatt catttctcgc 7440
ttaaccgtga caggctgtcg atcttgagaa ctatgccgac ataataggaa atcgctggat 7500
aaagccgctg aggaagctga gtggcgctat ttctttagaa gtgaacgttg acgatcgtcg 7560
accgtacccc gatgaattaa ttcggacgta cgttctgaac acagctggat acttacttgg 7620
gcgattgtca tacatgacat caacaatgta cccgtttgtg taaccgtctc ttggaggttc 7680
gtatgacact agtggttccc ctcagcttgc gactagatgt tgaggcctaa cattttatta 7740
gagagcaggc tagttgctta gatacatgat cttcaggccg ttatctgtca gggcaagcga 7800 aaattggcca tttatgacga ccaatgcccc gcagaagctc ccatctttgc cgccatagac 7860
gccgcgcccc ccttttgggg tgtagaacat ccttttgcca gatgtggaaa agaagttcgt 7920
tgtcccattg ttggcaatga cgtagtagcc ggcgaaagtg cgagacccat ttgcgctata 7980
tataagccta cgatttccgt tgcgactatt gtcgtaattg gatgaactat tatcgtagtt 8040
gctctcagag ttgtcgtaat ttgatggact attgtcgtaa ttgcttatgg agttgtcgta 8100
gttgcttgga gaaatgtcgt agttggatgg ggagtagtca tagggaagac gagcttcatc 8160
cactaaaaca attggcaggt cagcaagtgc ctgccccgat gccatcgcaa gtacgaggct 8220
tagaaccacc ttcaacagat cgcgcatagt cttccccagc tctctaacgc ttgagttaag 8280
ccgcgccgcg aagcggcgtc ggcttgaacg aattgttaga cattatttgc cgactacctt 8340
ggtgatctcg cctttcacgt agtgaacaaa ttcttccaac tgatctgcgc gcgaggccaa 8400
gcgatcttct tgtccaagat aagcctgcct agcttcaagt atgacgggct gatactgggc 8460
cggcaggcgc tccattgccc agtcggcagc gacatccttc ggcgcgattt tgccggttac 8520
tgcgctgtac caaatgcggg acaacgtaag cactacattt cgctcatcgc cagcccagtc 8580
gggcggcgag ttccatagcg ttaaggtttc atttagcgcc tcaaatagat cctgttcagg 8640
aaccggatca aagagttcct ccgccgctgg acctaccaag gcaacgctat gttctcttgc 8700
ttttgtcagc aagatagcca gatcaatgtc gatcgtggct ggctcgaaga tacctgcaag 8760
aatgtcattg cgctgccatt ctccaaattg cagttcgcgc ttagctggat aacgccacgg 8820
aatgatgtcg tcgtgcacaa caatggtgac ttctacagcg cggagaatct cgctctctcc 8880
aggggaagcc gaagtttcca aaaggtcgtt gatcaaagct cgccgcgttg tttcatcaag 8940
ccttacggtc accgtaacca gcaaatcaat atcactgtgt ggcttcaggc cgccatccac 9000
tgcggagccg tacaaatgta cggccagcaa cgtcggttcg agatggcgct cgatgacgcc 9060
aactacctct gatagttgag tcgatacttc ggcgatcacc gcttccctca tgatgtttaa 9120
ctcctgaatt aagccgcgcc gcgaagcggt gtcggcttga atgaattgtt aggcgtcatc 9180
ctgtgctccc gagaaccagt accagtacat cgctgtttcg ttcgagactt gaggtctagt 9240
tttatacgtg aacaggtcaa tgccgccgag agtaaagcca cattttgcgt acaaattgca 9300
ggcaggtaca ttgttcgttt gtgtctctaa tcgtatgcca aggagctgtc tgcttagtgc 9360
ccactttttc gcaaattcga tgagactgtg cgcgactcct ttgcctcggt gcgtgtgcga 9420
cacaacaatg tgttcgatag aggctagatc gttccatgtt gagttgagtt caatcttccc 9480
gacaagctct tggtcgatga atgcgccata gcaagcagag tcttcatcag agtcatcatc 9540
cgagatgtaa tccttccggt aggggctcac acttctggta gatagttcaa agccttggtc 9600
ggataggtgc acatcgaaca cttcacgaac aatgaaatgg ttctcagcat ccaatgtttc 9660
cgccacctgc tcagggatca ccgaaatctt catatgacgc ctaacgcctg gcacagcgga 9720
tcgcaaacct ggcgcggctt ttggcacaaa aggcgtgaca ggtttgcgaa tccgttgctg 9780 ccacttgtta acccttttgc cagatttggt aactataatt tatgttagag gcgaagtctt 9840 gggtaaaaac tggcctaaaa ttgctgggga tttcaggaaa gtaaacatca ccttccggct 9900 cgatgtctat tgtagatata tgtagtgtat ctacttgatc gggggatctg ctgcctcgcg 9960 cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct 10020 tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc 10080 gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta 10140 actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc 10200 acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact 10260 cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 10320 ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 10380 aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 10440 acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 10500 gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 10560 ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 10620 gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 10680 cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 10740 taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 10800 atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 10860 cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 10920 cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 10980 ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 11040 ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 11100. tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 11160 aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 11220 tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 11280 gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 11340 atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 11400 tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 11460 ttaatagttt gcgcaacgtt gttgccattg ctgcaggggg gggggggggg ggggacttcc 11520 attgttcatt ccacggacaa aaacagagaa aggaaacgac agaggccaaa aagcctcgct 11580 ttcagcacct gtcgtttcct ttcttttcag agggtatttt aaataaaaac attaagttat 11640 gacgaagaag aacggaaacg ccttaaaccg gaaaattttc ataaatagcg aaaacccgcg 11700 aggtcgccgc cccgtaacct gtcggatcac cggaaaggac ccgtaaagtg ataatgatta 11760 tcatctacat atcacaacgt gcgtggaggc catcaaacca cgtcaaataa tcaattatga 11820 cgcaggtatc gtattaattg atctgcatca acttaacgta aaaacaactt cagacaatac 11880 aaatcagcga cactgaatac ggggcaacct catgtccccc cccccccccc ccctgcaggc 11940 atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 12000 aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 12060 atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 12120 aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 12180 aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaacacgg 12240 gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 12300 gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 12360 gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 12420 ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 12480 ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 12540 atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 12600 gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 12660 atcacgaggc cctttcgtct tcaagaattg gtcgacgatc ttgctgcgtt cggatatttt 12720 cgtggagttc ccgccacaga cccggattga aggcgagatc cagcaactcg cgccagatca 12780 tcctgtgacg gaactttggc gcgtgatgac tggccaggac gtcggccgaa agagcgacaa 12840 gcagatcacg cttttcgaca gcgtcggatt tgcgatcgag gatttttcgg cgctgcgcta 12900 cgtccgcgac cgcgttgagg gatcaagcca cagcagccca ctcgaccttc tagccgaccc 12960 agacgagcca agggatcttt ttggaatgct gctccgtcgt caggctttcc gacgtttggg 13020 tggttgaaca gaagtcatta tcgtacggaa tgccaagcac tcccgagggg aaccctgtgg 13080 ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt taaatatccg 13140 attattctaa taaacgctct tttctcttag 13170 <210> 60
<211> 2709
<212> DNA
<213> desconhecido
<220>
<223> seqüência artificial <220> <221>
<222> (1)..(2709) <223> vetor
<400> 60
cgtagtggct ggctgggcga cgtgggttta aaggaagagt gacctgctca agtgctcagt 60
agattaatta agggatttga attctggtcg tacgataaat taacttgagt tcaaaaatac 120
aagaaacatc agtttatatt tcatttcgtg taggacctat caatccaatt cgtacaagag 180
gaattgcata tttcaactca tagtcttaac taccattcaa attgatattt gcacgatgat 240
gattgtctgg tatagatttg actttttggg aactgaatca aatccagcat gattcatgca 300
agaaacttga attcaactca tacaagaaac atattcaatt tcaagctgtg caataatgca 360
cgtatcttaa gcaaagagta gtacgtctgc atcatatagt actcatgcaa gattgaaaca 420
gctaagaact tgatcaaatt caaagttttt ttgtgatcga agtttaaatc cagttcatac 480
aagaaacgca ttaaaaataa tcgatttaaa tatgagcaat aatgcatcta ctttaagcat 540
agggtttgac atcacggtat ggaagcaaat ttgaattaga cgcaaacttg gatctcattt 600
ttccagaaac tttgttcgat tggtaattaa aacagtgcaa cctttgcacg caaccaaata 660
tataaaaatc cctggttgct aggactgttg taatcctgac aaatttcctc taatcttaaa 720
acacttgggt cggctttctt tgccaacccg gcgaaaaaaa actatataaa aatcataatt 780
attactacct tcatttcagg ttataagact ttctaacatt gtccatattt atatatatgt 840
taatgaatct agacatatat ttgtgtctgg attcattaac atctatatga atgtggacaa 900
tgctagaaag ttttataacc tgaaacggag aagtatattt ttttgggtac ttgtgtcâta 960
ttgtcatgtc atcaatgtgt atagtactaa ggttcaatga gaaatgatac aattgcaagc 1020
caaacaaatt gccgttacag aaatctgacg tcaacgacat tctggcaaga taatgcttga 1080
tacaatttgt gcagctatgc tactataaat aggggggggg ggggcgttat atctgcactg 1140
agttcatatc aagctttcaa tctctcattg catacaagtc cctgaagagt ttacaagaga 1200
cccagaagat cattttttca ccagcaaagt tcatttaaat caactaggga tatcacaagt 1260
ttgtacaaaa aagcaggctt cacaatggag cagtacgaga aggaggagaa gattggggag 1320
ggcacgtacg gggtggtgta cagggcgcgg gacaaggtca ccaacgagac gatcgcgctc 1380
aagaagatcc ggcttgagca ggaggatgag ggcgtcccct ccaccgcaat ccgcgagatc 1440
tcgctcctca aggagatgca tcacggcaac atcgtcaggt tacacgatgt tatccacagt 1500
gagaagcgca tatatcttgt ctttgagtat ctggatctgg acctaaagaa gttcatggac 1560
tcttgtccag agtttgcgaa aaaccccact ttaattaagt catatctcta tcagatactc 1620
cgcggcgttg cttactgtca ttctcataga gttcttcatc gagatttgaa acctcagaat 1680
ttattgatag atcggcgtac taatgcactg aagcttgcag actttggttt agccagggca 1740 tttggaattc ctgtccgcac gtttgatcac gaggttgtaa ccttgtggta tagagctcca 1800 gagatccttc ttggatcaag gcagtattct acaccagttg atatgtggtc agttggttgt 1860 atctttgcag aaatggtgaa ccagaaacca ctgttccctg gtgattctga gattgatgaa 1920 ttatttaaga tattcagggt actaggaact ccaaatgaac aaagttggcc aggagttagc 1980 tcattacctg actacaagtc tgctttcccc aagtggcagg cacaggatct tgcaactatt 2040 gtccctactc ttgaccctgc tggtttggac cttctctcta aaatgcttcg gtacgagcca 2100 aacaaaagga tcacagctag acaggctctt gagcatgaat acttcaagga ccttgagatg 2160 gtacaatgaa cccagctttc ttgtacaaag tggtgatatc acaagcccgg gcggtcttct 2220 agggataaca gggtaattat atccctctag atcacaagcc cgggcggtct tctacgatga 2280 ttgagtaata atgtgtcacg catcaccatg ggtggcagtg tcagtgtgag caatgacctg 2340 aatgaacaat tgaaatgaaa agaaaaaaag tactccatct gttccaaatt aaaattcatt 2400 ttaacctttt aataggttta tacaataatt gatatatgtt ttctgtatat gtctaatttg 2460 ttatcatccg ggcggtcttc tagggataac agggtaatta tatccctcta gacaacacac 2520 aacaaataag agaaaaaaca aataatatta atttgagaat gaacaaaagg accatatcat 2580 tcattaactc ttctccatcc atttccattt cacagttcga tagcgaaaac cgaataaaaa 2640 acacagtaaa ttacaagcac aacaaatggt acaagaaaaa cagttttccc aatgccataa 2700 tactcgaac 2709

Claims (25)

1. Método para melhorar características de crescimento de planta em relação às plantas de controle correspondentes, caracterizado pelo fato de compreender as seguintes etapas: (a) introduzir, dentro de uma planta, pelo menos uma seqüência de ácido nucleico, que codifica uma quinase dependente de ciclina selecionada do grupo consistindo de: i) uma molécula de ácido nucleico isolada como representada em SEQ ID NO: 45, 47, 49, 51, 53 ou 55; ii) uma molécula de ácido nucleico isolada codificadora da seqüência de aminoácidos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56; iii) uma molécula de ácido nucleico isolada cuja seqüência pode ser deduzida de uma seqüência de polipeptídeos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56 como um resultado da degeneração do código genético; iv) uma molécula de ácido nucleico isolada que codifica um polipeptídeo que tem pelo menos 80% de identidade com uma seqüência de aminoácidos do polipeptídeo codificado pela molécula de ácido nucleico de (i) a (iii); v) uma molécula de ácido nucleico isolada codificadora de um homólogo, derivado ou fragmento ativo da molécula de aminoácido como representada em SEQ ID NO: 46, 48, 50, 52, - 54 ou 56, cujo homólogo, derivado ou fragmento é de uma origem de planta ou compreende vantajosamente um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I); vi) uma molécula de ácido nucleico isolada codificadora de uma proteína compreendendo uma seqüência de aminoácidos selecionada do grupo consistindo de: aa) (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE; ab) (V/F/I)(L/I)HRD(L/M)K(P/S/T)(Q/N/S/G)N(L/I)L(V/L/I); ac) (I/L)(G/N)(E/R)G(T/A)YG(V/I)V(Y/C)(R/K/S)(A/G/S) (R/L/T/I)(D/N)(K/R/E)(V/K/A7S/T/N)T(N/S/G)(E/K/Q) (T/L/I/K)(I/V)A(L/V/I)KK; ad) LK(I/L)(C/A)DFGL(A/S)R; ae) WYRAPE(L/I)L(L/F)(C/G); af) GCI(F/M)AE(I/L/M); e ag) DLL(Q/N/S/R)(K/Q/R)(L/M)(L/F)(I/T/I/C)(F/Y/L)DP (T/E/D/R/S)(K/Q)RI; vii) uma molécula de ácido nucleico isolada capaz de hibridizar com um ácido nucleico de (i) a (iii) acima, ou seu complemento, sendo que uma seqüência de hibridização ou o seu complemento codifica uma proteína CDK de planta que compreende vantajosamente um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I); viii) variantes alélicas de um ácido nucleico de acordo com qualquer um de (i) a (iv) acima, cujas variantes alélicas codificam uma CDK de planta; e ix) variantes de união alternativas de um ácido nucleico de acordo com qualquer um de (iii) a (iv), cujas variantes de união alternativas codificam uma proteína CDK de planta compreendendo vantajosamente a motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I); (b) selecionar plantas tendo características de crescimento melhoradas em relação às plantas de controle correspondentes.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que dita atividade modulada é efetuada pela introdução de uma seqüência de ácido nucleico codificadora de uma CDK que é derivada de plantas.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que dita seqüência de ácido nucleico codificadora de uma CDK é derivada de uma planta monocotiledônea ou dicotiledônea.
4. Método de acordo com qualquer uma das reivindicações 1 a -3, caracterizado pelo fato de que uma seqüência de ácido nucleico codificadora de quinase dependente de ciclina é derivada das espécies Oryza sativa, Brassica napus, Glycine max, Linum usitatissimum, Zea mays ou Helianthus annuus.
5. Método de acordo com qualquer uma das reivindicações 1 a -4, caracterizado pelo fato de que dito ácido nucleico codificador de uma CDK está operacionalmente ligado em uma seqüência regulatória.
6. Método de acordo com qualquer uma das reivindicações 1 a -5, caracterizado pelo fato de que dita característica de crescimento de planta melhorada é rendimento aumentado em relação às plantas de controle correspondentes.
7. Método de acordo com qualquer uma das reivindicações 1 a -6, caracterizado pelo fato de que dito rendimento aumentado é rendimento de semente aumentado.
8. Método de acordo com qualquer uma das reivindicações 1 a -7, caracterizado pelo fato de que dito rendimento de semente aumentado é selecionado de qualquer um ou mais de: (i) peso de semente aumentado; (ii) número total de sementes aumentado; (iii) número de sementes cheias aumentado; (iv) índice de colheita aumentado.
9. Planta, parte de planta ou célula de planta, caracterizada pelo fato de ser obtida pelo método como definido em qualquer uma das reivindicações 1 a 8.
10. Processo para melhorar características de crescimento de planta em relação às plantas de controle correspondentes, caracterizado pelo fato de compreender: (c) introduzir, em uma planta, pelo menos uma seqüência de ácido nucleico, que codifica uma quinase dependente de ciclina (= CDK) selecionada do grupo consistindo de: i) uma molécula de ácido nucleico isolada como representada em SEQ ID NO: 45, 47, 49, 51, 53 ou 55; ii) uma molécula de ácido nucleico isolada codificadora da seqüência de aminoácidos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56; iii) uma molécula de ácido nucleico isolada cuja seqüência pode ser deduzida de uma seqüência de polipeptídeos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56 como um resultado da degeneração do código genético; iv) uma molécula de ácido nucleico isolada que codifica um polipeptídeo que tem pelo menos 80% de identidade com uma seqüência de aminoácidos do polipeptídeo codificado pela molécula de ácido nucleico de (i) a (iii); v) uma molécula de ácido nucleico isolada codificadora de um homólogo, derivado ou fragmento ativo da molécula de aminoácido como representada em SEQ ID NO: 46, 48, 50, 52, - 54 ou 56, cujo homólogo, derivado ou fragmento é de uma origem de planta ou compreende vantajosamente um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I); vi) uma molécula de ácido nucleico isolada codificadora de uma proteína compreendendo uma seqüência de aminoácidos selecionada do grupo consistindo de: aa) (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE; ab) (V/F/I)(L/I)HRD(L/M)K(P/S/T)(Q/N/S/G)N(L/I)L(V/L/I); ac) (I/L)(G/N)(E/R)G(T/A)YG(V/I)V(Y/C)(R/K/S)(A/G/S) (R/L/T/I)(D/N)(K/R/E)(V/KyA/S/T/N)T(N/S/G)(E/K/Q) (T/L/I/K)(I/V)A(L/V/I)KK; ad) LK(I/L)(C/A)DFGL(A/S)R; ae) WYRAPE(L/I)L(L/F)(C/G); af) GCI(F/M)AE(I/L/M); e ag) DLL(QzNzszR)(KyQzR)(LzM)(LzF)(IZTZIZC)(FArZL)DP (TZEZDZR/S)(KZQ)RI; vii) uma molécula de ácido nucleico isolada capaz de hibridizar com um ácido nucleico de (i) a (iii) acima, ou seu complemento, sendo que uma seqüência de hibridização ou o seu complemento codifica uma proteína CDK de planta que compreende vantajosamente um motivo (PZNZA)(SZLZMZF)(TZSZR)(TZSZA)(LZI); viii) variantes alélicas de um ácido nucleico de acordo com qualquer um de (i) a (iv) acima, cujas variantes alélicas codificam uma CDK de planta; e ix) variantes de união alternativas de um ácido nucleico de acordo com qualquer um de (iii) a (iv), cujas variantes de união alternativas codificam uma proteína CDK de planta compreendendo vantajosamente a motivo (PZNZA)(SZLZMZF)(TZSZR)(TZSZA)(LZI); (d) selecionar plantas tendo características de crescimento melhoradas em relação às plantas de controle correspondentes; e (e) cultivar uma planta sob condições que permitem o crescimento e o desenvolvimento da planta.
11. Processo de acordo com a reivindicação 10, caracterizado pelo fato de que a seqüência de ácido nucleico codificadora de quinase dependente de ciclina é derivada de uma planta.
12. Processo de acordo com a reivindicação 10 ou 11, caracterizado pelo fato de que dita seqüência de ácido nucleico codificadora de uma CDK é derivada de uma planta monocotiledônea ou dicotiledônea.
13. Processo de acordo com qualquer uma das reivindicações -10 a 12, caracterizado pelo fato de que dita seqüência de ácido nucleico codificadora de quinase dependente de ciclina é derivada das espécies Oryza sativa, Brassica napus, Glycine max, Linum usitatissimum, Zea mays ou Helianthus annuus.
14. Processo de acordo com qualquer uma das reivindicações -10 a 13, caracterizado pelo fato de que dita seqüência de ácido nucleico codificadora de CDK está operacionalmente ligada em uma seqüência regulatória.
15. Processo de acordo com qualquer uma das reivindicações -10 a 14, caracterizado pelo fato de que citada característica de crescimento melhorada é rendimento aumentado em relação às plantas de controle correspondentes.
16. Processo de acordo com a reivindicação 15, caracterizado pelo fato de que dito rendimento aumentado é rendimento de semente aumentado.
17. Processo de acordo com a reivindicação 15 ou 16, caracterizado pelo fato de que dito rendimento de semente aumentado é selecionado de qualquer um ou mais de: (i) peso de semente aumentado; (ii) número total de sementes aumentado; (iii) número de sementes cheias aumentado; (iv) índice de colheita aumentado.
18. Planta, parte de planta ou célula de planta, caracterizada pelo fato de ser obtida pelo processo como definido em qualquer uma das reivindicações 10 a 17.
19. Molécula de ácido nucleico isolada, caracterizada pelo fato de compreender uma molécula de ácido nucleico selecionada do grupo consistindo de: a) uma molécula de ácido nucleico isolada como representada em SEQ ID NO: 45, 47, 49, 51, 53 ou 55; b) uma molécula de ácido nucleico isolada codificadora da seqüência de aminoácidos como representada em SEQ ID NO: 46, 48, 50, 52, -54 ou 56; uma molécula de ácido nucleico isolada cuja seqüência pode ser deduzida de uma seqüência de polipeptídeos como representada em SEQ ID NO: 46, 48, 50, 52, 54 ou 56 como um resultado da degeneração do código genético; uma molécula de ácido nucleico isolada que codifica um polipeptídeo que tem pelo menos 80% de identidade com uma seqüência de aminoácidos do polipeptídeo codificado pela molécula de ácido nucleico de (i) a (iii); uma molécula de ácido nucleico isolada codificadora de um homólogo, derivado ou fragmento ativo da molécula de aminoácido como representada em SEQID NO: 46, 48, 50, 52, 54 ou 56, cujo homólogo, derivado ou fragmento é de uma origem de planta ou compreende vantajosamente um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I); uma molécula de ácido nucleico isolada codificadora de uma proteína compreendendo uma seqüência de aminoácidos selecionada do grupo consistindo de: aa) (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I)RE; ab) (V/F/I)(L/I)HRD(L/M)K(P/S/T)(Q/N/S/G)N(L/I)L(V/L/I); ac) (I/L)(G/N)(E/R)G(T/A)YG(V/I)V(Y/C)(R/K/S)(A/G/S) (R/L/T/I)(D/N)(K/R/E)(V/K/A/S/T/N)T(N/S/G)(E/K/Q) (T/L/I/K)(W)A(L/V/I)KK; ad) LK(I/L)(C/A)DFGL(A/S)R; ae) WYRAPE(L/I)L(L/F)(C/G); af) GCI(F/M)AE(I/L/M); e ag) DLL(Q/N/S/R)(K/Q/R)(L/M)(L/F)(I/T/I/C)(F/Y/L)DP (T/E/D/R/S)(K/Q)RI; uma molécula de ácido nucleico isolada capaz de hibridizar com um ácido nucleico de (i) a (iii) acima, ou seu complemento, sendo que uma seqüência de hibridização ou o seu complemento codifica uma proteína CDK de planta que compreende vantajosamente um motivo (P/N/A)(S/L/M/F)(T/S/R)(T/S/A)(L/I); pelo qual a molécula de ácido nucleico tem atividades intensificadoras de crescimento em plantas.
20. Construto de gene, caracterizado pelo fato de compreender uma molécula de ácido nucleico isolada tendo uma seqüência de ácido nucleico como definida na reivindicação 19, onde o ácido nucleico está funcionalmente ligado em um ou mais sinais regulatórios.
21. Vetor, caracterizado pelo fato de compreender um ácido nucleico como definido na reivindicação 19 ou um construto de gene como definido na reivindicação 20.
22. Planta transgênica, caracterizada pelo fato de compreender pelo menos um ácido nucleico como definido na reivindicação 19, um construto de gene como definido na reivindicação 20 ou um vetor como definido na reivindicação 21
23. Planta transgênica de acordo com a reivindicação 22, caracterizada pelo fato de ser uma planta dicotiledônea ou monocotiledônea.
24. Planta transgênica de acordo com a reivindicação 22 ou 23, caracterizada pelo fato de ser selecionada do grupo consistindo de cana-de- açúcar, canola/colza de semente oleosa, feijão-soja, arroz, algodão, batata, milho, trigo, cevada, painço, centeio aveia, palma oleosa, beterraba, girassol ou sorgo.
25. Uso de uma molécula de ácido nucleico como definida na reivindicação 19 ou do construto de gene como definido na reivindicação 20 ou do vetor como definido na reivindicação 21, caracterizado pelo fato de ser para melhorar as características de crescimento de plantas, em particularmente para melhorar o rendimento, especialmente o rendimento de semente.
BRPI0712304-3A 2006-06-08 2007-05-31 método e processo para melhorar caracterìsticas de crescimento de planta em relação ás plantas de controle correspondentes, planta, parte de planta ou célula de planta, molécula de ácido nucleico isolada, construto de gene, vetor, planta transgênica, e, uso de uma molécula de ácido nucleico ou do construto de gene ou do vetor BRPI0712304A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06115168 2006-06-08
EP06115168.4 2006-06-08
PCT/EP2007/055336 WO2007141189A2 (en) 2006-06-08 2007-05-31 Plants having improved growth characteristics and method for making the same

Publications (1)

Publication Number Publication Date
BRPI0712304A2 true BRPI0712304A2 (pt) 2012-01-17

Family

ID=38461111

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0712304-3A BRPI0712304A2 (pt) 2006-06-08 2007-05-31 método e processo para melhorar caracterìsticas de crescimento de planta em relação ás plantas de controle correspondentes, planta, parte de planta ou célula de planta, molécula de ácido nucleico isolada, construto de gene, vetor, planta transgênica, e, uso de uma molécula de ácido nucleico ou do construto de gene ou do vetor

Country Status (8)

Country Link
US (1) US8273952B2 (pt)
EP (3) EP2436761A1 (pt)
CN (2) CN103215288A (pt)
AR (1) AR061294A1 (pt)
BR (1) BRPI0712304A2 (pt)
CA (1) CA2649341A1 (pt)
MX (1) MX2008014097A (pt)
WO (1) WO2007141189A2 (pt)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2708094A1 (en) * 2007-12-19 2009-06-25 Basf Plant Science Gmbh Plants with increased yield and/or increased tolerance to environmental stress (iy-bm)
CN102016048A (zh) * 2008-02-27 2011-04-13 巴斯夫植物科学有限公司 产量增加的植物
HUE048666T2 (hu) 2013-09-04 2020-08-28 Indigo Ag Inc Mezõgazdasági endofita-növény kompozíciók és alkalmazási eljárások
CN104388447A (zh) * 2014-11-28 2015-03-04 山东大学 拟南芥细胞周期依赖性蛋白激酶基因AtCDKG2在调控植物花期转换中的应用
CA2970260A1 (en) * 2014-12-29 2016-07-07 Swetree Technologies Ab Woody plants having improved growth properties
CN108728576B (zh) * 2018-08-14 2022-05-17 中国农业科学院作物科学研究所 一种小麦叶绿素含量相关基因的标记及应用
CN110183524B (zh) * 2019-06-11 2022-06-14 扬州大学 一个促进大豆主根伸长的基因GmKRP2a、蛋白及其应用
CN114752579B (zh) * 2020-12-25 2024-03-19 中国农业大学 ZmMAPK蛋白及其编码基因在调控植物低温胁迫耐性中的应用
CN115125259A (zh) * 2021-03-26 2022-09-30 中国农业大学 矮20蛋白、其编码基因及应用
BR112023025095A2 (pt) * 2021-06-03 2024-02-20 Dyno Therapeutics Inc Variantes de capsídeo e métodos para usar as mesmas
CN114672583B (zh) * 2022-04-12 2024-04-26 江西农业大学 一种用于鉴定毛花猕猴桃叶片AsA含量高低的SNP分子标记及其开发和应用方法

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1984002913A1 (en) 1983-01-17 1984-08-02 Monsanto Co Chimeric genes suitable for expression in plant cells
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
DK162399C (da) 1986-01-28 1992-03-23 Danisco Fremgangsmaade til ekspression af gener i baelgplanteceller, dna-fragment, rekombineret dna-fragment samt plasmid til brug ved udoevelsen af fremgangsmaaden
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
NZ228320A (en) 1988-03-29 1991-06-25 Du Pont Nucleic acid promoter fragments of the promoter region homologous to the em gene of wheat, dna constructs therefrom and plants thereof
CA1341467C (en) 1988-07-29 2004-12-07 John C. Rogers Producing commercially valuable polypeptides with genetically transformed endosperm tissue
DE3843628A1 (de) 1988-12-21 1990-07-05 Inst Genbiologische Forschung Wundinduzierbare und kartoffelknollenspezifische transkriptionale regulation
JP3046063B2 (ja) 1989-03-17 2000-05-29 イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー 遺伝子の発現の外部の調節
DE69132725T2 (de) 1990-03-16 2002-07-11 Calgene Llc Davis Neue sequenzen vorzugsweise exprimiert während der frühen keimentwicklung und darauf bezogene methoden
US5187267A (en) 1990-06-19 1993-02-16 Calgene, Inc. Plant proteins, promoters, coding sequences and use
DE4208050A1 (de) 1992-03-13 1993-09-23 Bayer Ag Azolylmethyl-fluorcyclopropyl-derivate
CA2092069A1 (en) 1992-03-27 1993-09-28 Asako Iida An expression plasmid for seeds
WO1993021334A1 (en) 1992-04-13 1993-10-28 Zeneca Limited Dna constructs and plants incorporating them
JPH0662870A (ja) 1992-08-18 1994-03-08 Mitsui Giyousai Shokubutsu Bio Kenkyusho:Kk 大豆ホスホエノールピルビン酸カルボキシラーゼ遺伝子のプロモーター領域及び5’非翻訳領域
WO1994012015A1 (en) 1992-11-30 1994-06-09 Chua Nam Hai Expression motifs that confer tissue- and developmental-specific expression in plants
CN1061376C (zh) 1993-11-19 2001-01-31 生物技术研究及发展有限公司 用于植物体内基因表达的嵌合调节区和基因盒
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
CA2178729A1 (en) 1993-12-09 1995-06-15 Eric B. Kmiec Compounds and methods for site-directed mutations in eukaryotic cells
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
GB9421286D0 (en) 1994-10-21 1994-12-07 Danisco Promoter
GB9502873D0 (en) 1995-02-14 1995-04-05 Medical Res Council Transcription factor
US5689040A (en) 1995-02-23 1997-11-18 The Regents Of The University Of California Plant promoter sequences useful for gene expression in seeds and seedlings
DK0781849T3 (da) 1995-07-05 2008-01-14 Sapporo Breweries Fremgangsmåde, hvor der anvendes en vævsspecifik promotor
GB9516241D0 (en) 1995-08-08 1995-10-11 Zeneca Ltd Dna constructs
US5981841A (en) 1996-08-30 1999-11-09 Monsanto Company Early seed 5' regulatory sequence
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
WO1999016890A2 (en) 1997-09-30 1999-04-08 The Regents Of The University Of California Production of proteins in plant seeds
CA2326689A1 (en) 1998-04-21 1999-10-28 Cropdesign N.V. Stress tolerant plants
DE19852195C2 (de) 1998-11-04 2000-11-02 Inst Pflanzengenetik & Kultur Neue Expressionskassette zur Expression von beliebigen Genen in Pflanzensamen
CA2263067A1 (en) 1999-02-26 2000-08-26 The Australian National University Method of modifying plant morphology, biochemistry and physiology
EP1163341A2 (en) * 1999-03-19 2001-12-19 CropDesign N.V. Method for enhancing and/or improving plant growth and/or yield or modifying plant architecture
CN1279172C (zh) 1999-07-22 2006-10-11 独立行政法人农业生物资源研究所 转化水稻植物的方法
AU780117B2 (en) 1999-08-26 2005-03-03 Basf Plant Science Gmbh Plant gene expression, controlled by constitutive plant V-ATpase promoters
WO2003027299A2 (en) * 2001-09-17 2003-04-03 Cropdesign Nv A plant cyclin dependent kinase-like protein, its interactors and uses thereof
WO2005024017A1 (en) * 2002-03-15 2005-03-17 Monsanto Technology Llc Nucleic acid molecules associated with oil in plants
CA2536650C (en) 2003-09-05 2016-08-16 Cropdesign N.V. Transformed plants with improved growth characteristics due to increased expression of b-type cdk and methods for making same
RU2384621C2 (ru) 2004-03-01 2010-03-20 КРОПДИЗАЙН Н.Фи. Растения с повышенной урожайностью и способ их получения
US7847157B2 (en) * 2004-12-01 2010-12-07 Cropdesign N.V. Plants having improved growth characteristics and method for making the same
CN101668860B (zh) 2007-04-23 2014-02-12 巴斯夫欧洲公司 组合化学剂和转基因修饰增强植物生产力
NL1033850C2 (nl) 2007-05-15 2008-11-18 3Force B V Brandersysteem met voorgemengde branders en vlam-overdrachtsmiddelen.

Also Published As

Publication number Publication date
EP2436761A1 (en) 2012-04-04
MX2008014097A (es) 2008-11-14
WO2007141189A3 (en) 2008-02-14
CA2649341A1 (en) 2007-12-13
US20100229259A1 (en) 2010-09-09
EP2436760A1 (en) 2012-04-04
CN101460611B (zh) 2013-04-24
US8273952B2 (en) 2012-09-25
AR061294A1 (es) 2008-08-20
CN101460611A (zh) 2009-06-17
WO2007141189A2 (en) 2007-12-13
CN103215288A (zh) 2013-07-24
EP2035555A2 (en) 2009-03-18

Similar Documents

Publication Publication Date Title
CN101460611B (zh) 具有改良生长特性的植物及其制备方法
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
ES2502415T3 (es) Protección de proteínas KRP mutantes negativas dominantes contra la inhibición activa del complejo ciclina-CDK por parte de KRP de tipo salvaje
CA2763792C (en) Expression cassettes derived from maize
AU2021204330A1 (en) Materials and methods for PUFA production, and PUFA-containing compositions
BRPI0612710A2 (pt) método para aumentar o rendimento de plantas com relação às plantas de controle, e para produzir uma planta transgênica tendo rendimento aumentado, planta, construção, partes coletáveis de uma planta, produtos, e, uso de um ácido nucleico / gene de tipo ste20 ou variante do mesmo, ou uso de um polipeptìdeo de tipo ste20 ou seu homólogo
BRPI0814098A2 (pt) método para obtenção de uma planta com maior resistência ao estresse, com tempo de florescimento alterado, com fenótipo foliar alterado, método para investigar uma planta, plantas, parte de uma planta ou semente mutante ou transgênica
BRPI0615941A2 (pt) método para aumentar o rendimento de planta em relação às plantas de controle, planta, construção, método para a produção de uma planta transgênica, planta transgênica, partes colhìveis de uma planta, produtos, uso de um ácido nucleico/gene oslea3a ou variante do mesmo ou uso de um polipeptìdeo oslea3a ou um homólogo do mesmo, e, semente de planta
BRPI0713039A2 (pt) molécula de ácido nucléico e polipeptìdeo isolados, vetor, célula hospedeira, planta e semente transgênicas e métodos para produzir um polipeptìdeo com atividade de resistência a herbicidas, para conferir resistência a um herbicida em uma planta e para gerar um polinucleotìdeo variante de um polinucleotìdeo parental grg33, grg35, grg37, grg38, grg39, ou grgr50.
BRPI0712398A2 (pt) minicromossomo artificial de planta, planta de milho, polinucleotìdeo isolado, construção recombinante, planta transgênica de milho e método para produzir uma planta transgênica de milho compreendendo um minicromossomo artificial de planta tendo centrÈmero funcional
EP1893760A1 (en) Plants having improved growth characteristics and method for making the same
CN111647574B (zh) 苦荞来源的鼠李糖基转移酶及其编码基因和应用
CN107105626B (zh) 光合作用和/或生物质生成增加的经基因修饰的高等植物、其方法和用途
CN106947779A (zh) 利用乳腺生物反应器提高乳汁中褪黑素含量的方法
BRPI0610816B1 (pt) Method of producing a transgenic maize plant with enhanced asparagin, corn flour with increased protein and food made from themselves
CN115190912A (zh) Rna指导核酸酶及其活性片段与变体以及使用方法
CN110004163B (zh) 多基因编辑提高水稻抗旱性的方法
KR20210138563A (ko) 식물 nin-유전자를 사이토킨에 반응성이 되도록 유전적으로 변경시키는 방법
ES2672349T3 (es) Secuencia de nucleótidos que codifica la proteína homeobox4 relacionada con wuschel (WOX4) de corchorus olitorius y corchorus capsularis y métodos de uso de los mismos
CN101061228B (zh) 异戊烯基转移酶序列及其使用方法
KR102143644B1 (ko) 웅성불임유발 방법
KR102416059B1 (ko) 에레모테시움의 발효를 통한 리보플라빈의 더 높은 생성을 위한 베타-산화 경로의 효소를 엔코딩하는 유전자 및 지방산 수송체 유전자의 과-발현
CN112646820B (zh) 改变玉米开花期的基因及方法
BR112016008172B1 (pt) Método para modulação do crescimento de plantas
CN110452914B (zh) 一个调控油菜素内酯信号转导的基因BnC04BIN2-like1及其应用

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 8A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2310 DE 14-04-2015 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.