ES2926323T3 - Generación de plantas haploides - Google Patents

Generación de plantas haploides Download PDF

Info

Publication number
ES2926323T3
ES2926323T3 ES15817864T ES15817864T ES2926323T3 ES 2926323 T3 ES2926323 T3 ES 2926323T3 ES 15817864 T ES15817864 T ES 15817864T ES 15817864 T ES15817864 T ES 15817864T ES 2926323 T3 ES2926323 T3 ES 2926323T3
Authority
ES
Spain
Prior art keywords
amino acid
seq
cenh3
substituted
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15817864T
Other languages
English (en)
Inventor
Christof Bolduan
Frank Breuer
Monika Kloiber-Maitz
Markus Niessen
Milena Ouzunova
Britta Schulz
Silke Wieckhorst
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KWS SAAT SE and Co KGaA
Original Assignee
KWS SAAT SE and Co KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KWS SAAT SE and Co KGaA filed Critical KWS SAAT SE and Co KGaA
Application granted granted Critical
Publication of ES2926323T3 publication Critical patent/ES2926323T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • A01H1/08Methods for producing changes in chromosome number
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • A01H1/021Methods of breeding using interspecific crosses, i.e. interspecies crosses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • A01H1/022Genic fertility modification, e.g. apomixis
    • A01H1/023Male sterility
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/06Roots
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/20Brassicaceae, e.g. canola, broccoli or rucola
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Botany (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Physiology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Animal Husbandry (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

La presente invención se refiere a plantas no transgénicas y transgénicas, preferiblemente plantas de cultivo, que tienen actividad biológica de inductor de haploides y que comprenden un polinucleótido que comprende una secuencia de nucleótidos que codifica una proteína centrómero histona H3 (CENH3), en donde el polinucleótido comprende al menos una mutación provocando una alteración de la secuencia de aminoácidos de la proteína CENH3, y a una parte de la parte. Además, la invención proporciona métodos para generar plantas inductoras, métodos para generar plantas haploides y doble haploides utilizando plantas inductoras, así como métodos para facilitar el intercambio de citoplasma. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Generación de plantas haploides
La presente invención se refiere a plantas no transgénicas, preferiblemente plantas de cultivo, que tienen actividad biológica de un inductor haploide y que comprenden un polinucleótido que comprende una secuencia de nucleótidos que codifica una proteína centrómero de histona H3 (CENH3), en donde el polinucleótido comprende al menos una mutación que causa una alteración de la secuencia de aminoácidos de la proteína CENH3 y dicha alteración confiere la actividad biológica de un inductor de haploides.
La generación y uso de haploides es uno de los medios biotecnológicos más poderosos para mejorar las plantas cultivadas. La ventaja de los haploides para los cultivadores es que la homocigosidad puede lograrse ya en la primera generación después de la dihaploidización, creando plantas doblemente haploides, sin necesidad de varias generaciones de retrocruzamiento requeridas para obtener un alto grado de homocigosidad. Además, el valor de los haploides en la investigación y la reproducción de plantas radica en el hecho de que las células fundadoras de los haploides dobles son productos de la meiosis, de modo que las poblaciones resultantes constituyen grupos de diversos individuos recombinantes y al mismo tiempo fijados genéticamente. Por lo tanto, la generación de haploides duplicados proporciona no solo una variabilidad genética perfectamente útil para seleccionar con respecto a la mejora de cultivos, sino que también es un medio valioso para producir poblaciones de mapeo, endogamia recombinante, así como mutantes homocigóticos instantáneos y líneas transgénicas.
Los haploides se pueden obtener mediante enfoques in vitro o in vivo. Sin embargo, muchas especies y genotipos son recalcitrantes a estos procesos. Alternativamente, los cambios sustanciales de la variante de histona H3 específica del centrómero (CENH3, también llamada CENP-A), al intercambiar sus regiones N-terminales y fusionarlas con GFP ("GFP-tailswap" CENH3), crean líneas inductoras haploides en la planta modelo Arabidopsis thaliana (Ravi and Chan, Nature, 464 (2010), 615-618; Comai, L, "Genome elimination: translating basic research into a future tool for plant breeding.", PLoS biology, 12.6 (2014)). Las proteínas CENH3 son variantes de las proteínas histonas H3 que son miembros del complejo cinetocoro de centrómeros activos. Con estas líneas inductoras de haploides "GFP-tailswap", la haploidización se produjo en la progenie cuando se cruzó una planta inductora de haploides con una planta de tipo salvaje. Curiosamente, la línea inductora haploide se mantuvo estable tras la autofecundación, lo que sugiere que una competencia entre el centrómero modificado y el tipo salvaje en el embrión híbrido en desarrollo da como resultado la inactivación del centrómero del progenitor inductor y, en consecuencia, la eliminación del cromosoma uniparental. Como resultado, los cromosomas que contienen la proteína CENH3 alterada se pierden durante el desarrollo embrionario temprano, lo que produce una progenie haploide que contiene solo los cromosomas del progenitor de tipo salvaje.
Por lo tanto, pueden obtenerse plantas haploides cruzando plantas transgénicas "GFP-tailswap" como inductoras de haploides con plantas de tipo salvaje. Sin embargo, como se describió anteriormente, esta técnica requiere cambios sustanciales de la proteína CENH3 y las plantas comprenden un transgén heterólogo, que es económicamente problemático debido a la creciente renuencia del público hacia los cultivos modificados genéticamente.
Por lo tanto, un objeto de la presente invención es superar los problemas antes mencionados y, en particular, proporcionar plantas inductoras de haploides alternativas que no comprendan modificaciones sustanciales de su proteína CENH3 y/o que no estén modificadas genéticamente.
Este problema se resuelve mediante el objeto de las reivindicaciones independientes. En el contexto de la presente invención, el término "alteración" significa cualquier modificación de la secuencia de aminoácidos de la proteína CENH3 (incluidas las modificaciones múltiples) causada por al menos una mutación en el polinucleótido que comprende una secuencia de nucleótidos que codifica una proteína centrómero de histona H3 (CENH3). El polinucleótido puede ser un ADN genómico del gen CENH3, el ADNc de CENH3 o regiones no traducidas en 5' o 3' del gen CENH3 o una mezcla de los mismos que comprende, por ejemplo, una parte del ADN genómico y una parte del ADNc, Una alteración es una sustitución de uno o más aminoácidos. Las mutaciones a nivel de ADN que pueden alterar la secuencia de aminoácidos de la proteína CENH3 son mutaciones puntuales que conducen a una sustitución de aminoácidos.
La al menos una mutación provoca la alteración de la secuencia de aminoácidos de la proteína CENH3 lo que le confiere la actividad biológica de un inductor haploide en al menos un segmento de la secuencia de aminoácidos de la proteína CENH3, en donde el segmento de secuencia es el dominio de la cola N-terminal. El dominio de cola N-terminal de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 1 hasta la posición 82 como se establece en SEQ ID NO: 11 derivado de Arabidopsis thaliana y/o el dominio de cola N-terminal de la proteína CENH3 está codificado por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 1 a la posición 246 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. El dominio CATD de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 113 hasta la posición 155 como se establece en SEQ ID NO: 11 derivado de Arabidopsis thaliana y/o el dominio CATD de la proteína CENH3 está codificado por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 337 hasta la posición 465 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. La hélice aN de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la hélice aN de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 83 a la posición 97 como se establece en SEQ ID NO: 11 derivada de Arabidopsis thaliana y/o la hélice aN de la proteína CENH3 está codificada por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 247 a la posición 291 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. La hélice a1 de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 103 hasta la posición 113 como se establece en SEQ ID NO: 11 derivado de Arabidopsis thaliana y/o la hélice a1 de la proteína CENH3 está codificada por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 307 hasta la posición 339 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. El bucle1 de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 114 hasta la posición 126 como se establece en SEQ ID NO: 11 derivado de Arabidopsis thaliana y/o el bucle1 de la proteína CENH3 está codificado por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 340 hasta la posición 378 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. La hélice a2 de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 127 hasta la posición 155 como se establece en SEQ ID NO: 11 derivado de Arabidopsis thaliana y/o la hélice a2 de la proteína CENH3 está codificada por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 379 hasta la posición 465 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. El bucle2 de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 156 hasta la posición 162 como se establece en SEQ ID NO: 11 derivado de Arabidopsis thaliana y/o el bucle2 de la proteína CENH3 está codificado por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 466 a la posición 486 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. La hélice a3 de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 163 hasta la posición 172 como se establece en SEQ ID NO: 11 derivado de Arabidopsis thaliana y/o la hélice a3 de la proteína CENH3 está codificada por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 487 hasta la posición 516 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. El dominio C-terminal de la proteína CENH3 corresponde a la secuencia de aminoácidos desde la posición 173 a la posición 178 como se establece en SEQ ID NO: 11 derivado de Arabidopsis thaliana y/o el dominio C-terminal de la proteína CENH3 está codificado por una secuencia de nucleótidos correspondiente a los nucleótidos desde la posición 517 a la posición 534 como se establece en SEQ ID NO: 10 derivados de Arabidopsis thaliana. Las secuencias de A. thaliana sirven solo como referencias y no limitan la invención a las secuencias particulares de A. thaliana. Debido al alto nivel de conservación, los expertos en la materia pueden encontrar la secuencia de nucleótidos y la secuencia de aminoácidos correspondientes a las secuencias de A thaliana en cualquier otro material vegetal o especie vegetal.
Las proteínas CENH3 son variantes de las proteínas histonas H3 que son miembros del complejo cinetocoro de centrómeros activos, es decir, la estructura de la proteína en los cromosomas donde se unen las fibras del huso durante la división celular. Básicamente, las proteínas CENH3 se caracterizan por un dominio de cola N-terminal variable, que no forma una estructura secundaria rígida, y un dominio de pliegue de histona conservado que consiste en tres regiones a-helicoidales, denominadas a1 a a3, que están conectadas por dos secciones de bucle. El dominio de la cola N-terminal está sujeto principalmente a la modificación posterior a la traducción por enzimas. Tales modificaciones incluyen metilación, citrulinación, fosforilación, SUMOilación, ubiquitinación y ADP-ribosilación y afectan la función de regulación del gen CENH3. Dentro del dominio de plegamiento de histonas se encuentra el dominio CATD altamente conservado (dominio de direccionamiento CENP-A), que está formado por partes de la hélice a1, la hélice a2 completa y el bucle1 de conexión. El dominio CATD conservado es necesario para que las chaperonas carguen CENH3 y, por lo tanto, es vital para la localización del cinetocoro y la función del centrómero. El dominio de cola N-terminal y el dominio de pliegue de histona están unidos por la hélice aN.
Los presentes inventores encontraron sorprendentemente que una planta que posee la capacidad de producir una progenie haploide, es decir, un inductor haploide, puede obtenerse no solo mediante la alteración de la secuencia de aminoácidos de la proteína CENH3 conservada, sino también mediante la alteración de la secuencia de aminoácidos de cualquier otro dominio y regiones estructurales del gen CENH3 y la proteína CENH3. Además, la capacidad para producir descendencia haploide puede mejorarse además mediante la combinación de dos o más alteraciones de la secuencia de aminoácidos de la proteína CENH3 en diferentes dominios, segmentos o regiones estructurales de la proteína CENH3. Por lo tanto, la eficiencia de la producción de haploides puede incrementarse significativamente. Ventajosamente, esto puede lograrse mediante métodos transgénicos así como no transgénicos. Se prefieren los métodos no transgénicos debido a los enormes costes de la desregulación de los organismos genéticamente modificados (GMO), así como al creciente rechazo público de los organismos genéticamente modificados (GMO) o las plantas generadas por medio de GMO, en particular los cultivos para consumo humano, y los amplios procesos de autorización de comercialización que incluyen evaluaciones de seguridad rigurosas de tales GMO.
La presente invención proporciona una planta como se define en la reivindicación 1. Lo mismo se aplica en consecuencia a las secuencias de la lista de secuencias que forman parte de la solicitud presentada originalmente.
El dominio de la cola N-terminal no mutado de la proteína CENH3 se conserva parcialmente entre las especies de plantas (véase la Figura).
En la presente divulgación, cualquier posición de aminoácido dada con respecto a estas dos partes conservadas del dominio de la cola N-terminal (parte A y parte B) o la secuencia consenso descrita a continuación se refiere al siguiente sistema de numeración. La parte A y la parte B conservadas del dominio de la cola N-terminal pueden estar separadas por uno o más aminoácidos. El número específico varía de una especie de planta a otra. Para eso en la secuencia consenso un "*" se ha introducido como marcador de posición. Preferiblemente, el dominio de la cola N-terminal no mutado presenta la secuencia de aminoácidos que se indica en la Tabla 1.
Tabla 1: Aminoácidos especificados en el dominio de cola N-terminal de la proteína CENH3
Figure imgf000004_0001
Más preferiblemente, el dominio de la cola N terminal tiene las secuencias consenso de SEQ ID NO: 1 (parte A, antes *) y SEQ ID NO: 2 (parte B, más allá *), que es
MARTK HXXAR RSRKR * QSQTQ XKKKH RYRP,
5 1 0 1 5 5 1 0 1 4
Como se indicó anteriormente, el dominio de la cola N-terminal comprende aminoácidos no especificados [marcados como X] y especificados [marcados como código de una letra]. En lugar de un aminoácido no especificado, la "X" también puede ser una brecha de al menos un aminoácido.
La hélice aN no mutada de la proteína CENH3 está muy conservada entre las especies de plantas y tiene una longitud de 15 aminoácidos que comienza en la posición 1 y termina en la posición 15. En la presente divulgación, cualquier posición de aminoácido dada con respecto a la hélice aN o la secuencia consenso descrita a continuación de SEQ ID NO: 3 se refiere a este sistema de numeración. Preferiblemente, la hélice aN no mutada presenta la secuencia de aminoácidos que se indica en la Tabla 2.
Tabla 2: Aminoácidos especificados en la hélice aN de la proteína CENH3
Figure imgf000005_0001
Más preferiblemente, la hélice aN tiene la secuencia consenso de SEQ ID NO: 3, que es
GTVAL REIRX FQKTT.
5 1 0 1 5
Como se indicó anteriormente, la hélice aN comprende aminoácidos no especificados [marcados como X] y especificados [marcados como código de una letra].
La hélice a l no mutada de la proteína CENH3 se conserva entre las especies de plantas y tiene una longitud de 11 aminoácidos que comienza en la posición 1 y termina en la posición 11. En la presente divulgación, cualquier posición de aminoácido dada con respecto a la hélice a1 o la secuencia consenso descrita a continuación de SEQ ID NO: 4 se refiere a este sistema de numeración. Preferiblemente, la hélice a1 no mutada presenta la secuencia de aminoácidos que se indica en la Tabla 3.
Tabla 3: Aminoácidos especificados en la hélice a1 de la proteína CENH3
Figure imgf000005_0002
Figure imgf000006_0001
Más preferiblemente, la hélice a l tiene la secuencia consenso de SEQ ID NO: 4, que es
AAPFI RLVRE I .
b 10
Como se indicó anteriormente, la hélice a 1 comprende aminoácidos específicos [marcados como un código de una letra],
El bucle1 no mutado de la proteína CENH3 está muy conservado entre las especies de plantas y tiene 13 aminoácidos de longitud, comenzando en la posición 1 y terminando en la posición 13. En la presente divulgación, cualquier posición de aminoácido proporcionada con respecto al bucle1 o la secuencia consenso descrita a continuación de SEQ ID NO: 5 se refiere a este sistema de numeración. Preferiblemente, el bucle1 no mutado presenta la secuencia de aminoácidos que se indica en la Tabla 4.
Tabla 4: Aminoácidos especificados en el bucle1 de la proteína CENH3
Figure imgf000006_0002
Más preferiblemente, el bucle1 tiene la secuencia consenso de SEQ ID NO: 5, que es
TNFLA PXEVT RWT.
5 1 0 1 3
Como se indicó anteriormente, el bucle1 comprende aminoácidos no especificados [marcados como X] y aminoácidos especificados [marcados como código de una letra].
La hélice a2 no mutada de la proteína CENH3 está muy conservada entre las especies de plantas y tiene una longitud de 29 aminoácidos que comienza en la posición 1 y termina en la posición 29. En la presente divulgación, cualquier posición de aminoácido dada con respecto a la hélice a2 o la secuencia consenso descrita a continuación de SEQ ID NO: 6 se refiere a este sistema de numeración. Preferiblemente, la hélice a2 no mutada presenta la secuencia de aminoácidos que se indica en la Tabla 5.
Tabla 5: Aminoácidos especificados en la hélice a2 de la proteína CENH3
Figure imgf000006_0003
Figure imgf000007_0001
Más preferiblemente, la hélice a2 tiene la secuencia consenso de SEQ ID NO: 6, que es
AEAJ.il, ALQEA AEDFL VULFE DAMI.C AII1A.
5 1 0 1 5 2 0 2 5 2 9
Como se indicó anteriormente, la hélice a2 comprende aminoácidos específicos [marcados como un código de una letra].
El bucle2 no mutado de la proteína CENH3 está altamente conservado entre las especies de plantas y tiene 7 aminoácidos de longitud, comenzando en la posición 1 y terminando en la posición 7. En la presente divulgación, cualquier posición de aminoácido dada con respecto al bucle2 o la secuencia consenso descrita a continuación de SEQ ID NO: 7 se refiere a este sistema de numeración. Preferiblemente, el bucle2 no mutado presenta la secuencia de aminoácidos que se indica en la Tabla 6.
Tabla 6: Aminoácidos especificados en el bucle2 de la proteína CENH3
Figure imgf000007_0002
Figure imgf000008_0001
Más preferiblemente, el bucle2 tiene la secuencia consenso de SEQ ID NO: 7, que es
KRVTL MIC.
5 7
Como se indicó anteriormente, el bucle2 comprende aminoácidos específicos [marcados como un código de una letra]. La hélice a3 no mutada de la proteína CENH3 está altamente conservada entre las especies de plantas y tiene una longitud de 10 aminoácidos que comienza en la posición 1 y termina en la posición l0. En la presente divulgación, cualquier posición de aminoácido dada con respecto a la hélice a3 o la secuencia consenso descrita a continuación de SEQ ID NO: 8 se refiere a este sistema de numeración. Preferiblemente, la hélice a3 no mutada presenta la secuencia de aminoácidos que se indica en la Tabla 7.
Tabla 7: Aminoácidos especificados en la hélice a3 de la proteína CENH3
Figure imgf000008_0002
Más preferiblemente, la hélice a3 tiene la secuencia consenso de SEQ ID NO: 8, que es
KDFEL ARRLG.
5 1 0
Como se indicó anteriormente, la hélice a3 comprende aminoácidos específicos [marcados como un código de una letra].
El dominio C-terminal no mutado de la proteína CENH3 varía en longitud. Bajo la consideración de numerosas especies de plantas (ver más abajo) identificamos una longitud de hasta 7 aminoácidos. En la presente divulgación, cualquier posición de aminoácido dada con respecto al dominio C-terminal o la secuencia consenso descrita a continuación de SEQ ID NO: 9 se refiere a este sistema de numeración. Preferiblemente, el dominio C-terminal no mutado presenta la secuencia de aminoácidos que se indica en la Tabla 8.
Tabla 8: Aminoácidos especificados en el dominio C-terminal de la proteína CENH3
Figure imgf000008_0003
Figure imgf000009_0001
Más preferiblemente, el dominio C-terminal tiene la secuencia consenso de SEQ ID NO: 9, que es
G K G R P W .
5 6
Como se indicó anteriormente, el dominio C-terminal comprende aminoácidos específicos [marcados como un código de una letra].
Un aminoácido no especificado como se indica en la Tabla 1 o en SEQ ID NO: 1 o 2, o en la Tabla 2 o en SEQ ID NO: 3, o en la Tabla 3 o en SEQ ID NO: 4, o en la Tabla 4 o en SEQ ID NO: 5, o en la Tabla 5 o en SEQ ID NO: 6, o en la Tabla 6 o en SEQ ID NO: 7, en la Tabla 7 o en SEQ ID NO: 8, o en la Tabla 8 o en SEQ ID NO: 9 es un aminoácido que, aunque se especifica en un grupo de especies de plantas particulares, en un género de plantas particular o en una especie de planta particular, no se conserva en una gama más amplia de especies de plantas. Por lo tanto, un aminoácido no especificado de SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8 o 9 o como se indica en la Tabla 1, Tabla 2, Tabla 3, Tabla 4, Tabla 5, Tabla 6, Tabla 7 o Tabla 8 está en un grupo de particular especie de planta, en un género de planta particular o en una especie de planta particular un aminoácido específico bien definido, que, sin embargo, posiblemente no se encuentre en el mismo lugar en otra especie de planta. Por lo tanto, una sustitución de aminoácido de un aminoácido no especificado de SEQ ID NO: 1 o como se indica en la Tabla 1 significa que en una planta, es decir, en una especie de planta específica, el aminoácido específico pero no conservado se sustituye por otro aminoácido que no se encuentra naturalmente en ese lugar en este grupo de especies de plantas en particular, en este particular género de planta o en esta especie de planta particular en la proteína CENH3 nativa codificada endógenamente de dicha especie de planta. Además, un aminoácido no especificado así como un aminoácido especificado pueden ser esenciales con respecto a los procesos de plegamiento de proteínas o estabilidad de proteínas. La alteración de dicho aminoácido puede conducir a que un CENH3 mutante tenga una estabilidad deteriorada o un plegamiento incorrecto.
Aminoácidos especificados dados en la Tabla 1, Tabla 2, Tabla 3, Tabla 4, Tabla 5, Tabla 6, Tabla 7 o Tabla 8 y en particular aminoácidos especificados de SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8 o 9 son las que se encuentran en un amplio rango de especies de plantas, preferiblemente como las enumeradas a continuación, y que por lo tanto están bien conservadas.
La secuencia consenso de SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8 y 9 se ha compilado a partir de las secuencias de los segmentos proteicos derivados de especies seleccionadas del grupo que consiste en Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Mains domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicerjudaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum, y Allium tuberosum.
La sustitución de un aminoácido especificado como se define en la Tabla 1 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) metionina en la posición 1 de la parte A,
b) alanina en la posición 2 de la parte A,
c) arginina en la posición 3 de la parte A,
d) treonina, valina, isoleucina o alanina en la posición 4 de la parte A,
e) lisina o arginina en la posición 5 de la parte A,
f) histidina, treonina, glutamina o lisina en la posición 6 de la parte A,
g) valina, alanina, prolina, glicina, asparagina, prolina, arginina, serina o histidina en la posición 9 de la parte A, h) treonina, arginina, serina, leucina, lisina, histidina, asparagina, alanina o prolina en la posición 10 de la parte A, i) arginina, lisina, alanina, asparagina o treonina en la posición 11 de la parte A,
j) serina, alanina, treonina, leucina, lisina, arginina, ácido aspártico, asparagina o ácido glutámico en la posición 12 de la parte A,
k) glutamina, treonina, arginina, alanina, prolina, serina, glicina, asparagina, valina, lisina o arginina en la posición 13 de la parte A,
l) prolina, treonina, ácido aspártico, ácido glutámico, glutamina, serina, asparagina, glicina, alanina, lisina, arginina en la posición 14 de la parte A, y
m) arginina, asparagina, histidina, valina, glicina, lisina, serina, alanina, treonina, ácido glutámico, prolina en la posición 15 de la parte A;
n) arginina, ácido aspártico, lisina, valina, glicina, prolina, serina, glutamina, treonina o alanina en la posición 1 de la parte B,
o) glicina, alanina, serina, lisina, arginina, valina, treonina, prolina o glutamina en la posición 2 de la parte B, p) serina, treonina, lisina, valina, arginina, glutamina, alanina, ácido glutámico, glicina, prolina y ácido aspártico en la posición 3 de la parte B,
q) glutamina, prolina, asparagina, treonina, ácido glutámico, lisina, glicina, serina, arginina, alanina o ácido aspártico en la posición 4 de la parte B,
r) lisina, glutamina, prolina, glicina, asparagina, treonina, histidina o arginina en la posición 5 de la parte B, s) lisina, arginina, glutamina o histidina en la posición 7 de la parte B,
t) lisina, glutamina o arginina en la posición 8 de la parte B,
u) serina, alanina, treonina, lisina, prolina o arginina en la posición 9 de la parte B,
v) tirosina, fenilalanina, histidina, treonina, lisina, arginina, fenilalanina o glutamina en la posición 10 de la parte B, w) arginina en la posición 11 de la parte B,
x) tirosina, arginina, triptófano, fenilalanina, leucina, asparagina o serina en la posición 12 de la parte B, y) arginina o lisina en la posición 13 de la parte B, y
z) prolina, alanina o serina en la posición 14 de la parte B.
La sustitución de un aminoácido especificado como se define en la Tabla 2 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) glicina en la posición 1,
b) treonina en la posición 2,
c) valina en la posición 3,
d) alanina en la posición 4,
e) leucina en la posición 5,
f) lisina, triptófano o arginina en la posición 6,
g) ácido glutámico o glutamina en la posición 7,
h) isoleucina en la posición 8,
i) arginina en la posición 9,
j) fenilalanina, tirosina o leucina en la posición 11,
k) glutamina o arginina en la posición 12,
l) lisina en la posición 13,
m) glutamina, serina o treonina en la posición 14, y
n) treonina, fenilalanina, triptófano, valina, cisteína o alanina en la posición 15.
La sustitución de un aminoácido especificado como se define en la Tabla 3 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) alanina, fenilalanina, arginina o serina en la posición 1,
b) alanina, metionina o serina en la posición 2,
c) serina, prolina, treonina, alanina o cisteína en la posición 3,
d) fenilalanina en la posición 4,
e) isoleucina, valina, metionina, leucina, serina o alanina en la posición 5,
f) arginina en la posición 6,
g) ácido glutámico, treonina, valina, leucina, cisteína, glutamina o alanina en la posición 7,
h) valina o isoleucina en la posición 8,
i) arginina o lisina en la posición 9,
j) serina, ácido glutámico, metionina, treonina, ácido glutámico, glutamina, glicina o ácido aspártico en la posición 10, y
k) isoleucina, valina, leucina o treonina en la posición 11.
La sustitución de un aminoácido especificado como se define en la Tabla 4 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) treonina, serina o alanina en la posición 1,
b) histidina, glutamina, asparagina, alanina, tirosina, fenilalanina, glicina, ácido aspártico o ácido glutámico en la posición 2,
c) metionina, glutamina, isoleucina, fenilalanina, tirosina, alanina, ácido glutámico, asparagina, arginina, leucina, histidina o glicina en la posición 3,
d) leucina, fenilalanina, valina, isoleucina o tirosina en la posición 4,
e) alanina, treonina, serina, cisteína o metionina en la posición 5,
f) prolina, asparagina, ácido aspártico, arginina, alanina, treonina, fenilalanina, arginina, histidina, serina o lisina en la posición 6,
g) glutamina, tirosina, ácido aspártico, lisina, arginina, ácido glutámico, glicina, serina, prolina, histidina, asparagina o alanina en la posición 8,
h) isoleucina, valina o prolina en la posición 9,
i) asparagina, glicina, treonina, ácido glutámico o serina en la posición 10,
j) arginina o prolina en la posición 11,
k) triptófano o tirosina en la posición 12, y
l) treonina, glutamina o serina en la posición 13.
La sustitución de un aminoácido especificado como se define en la Tabla 5 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) alanina, prolina, valina o leucina en la posición 1,
b) ácido glutámico, ácido aspártico, glutamina, histidina o leucina en la posición 2,
c) alanina en la posición 3,
d) leucina o valina en la posición 4,
e) valina, leucina, metionina, isoleucina, arginina, tirosina o treonina en la posición 5,
f) serina o alanina en la posición 6,
g) isoleucina o leucina en la posición 7,
h) glutamina en la posición 8,
i) ácido glutámico en la posición 9,
j) alanina o serina en la posición 10,
k) alanina o treonina en la posición 11,
l) ácido glutámico en la posición 12,
m) ácido aspártico, asparagina, fenilalanina, isoleucina o tirosina en la posición 13,
n) tirosina, fenilalanina o histidina en la posición 14,
o) leucina, isoleucina o valina en la posición 15,
p) valina o isoleucina en la posición 16,
q) glicina, arginina, ácido glutámico, histidina, asparagina, treonina, ácido glutámico, ácido aspártico o glutamina en la posición 17,
r) leucina, metionina o isoleucina en la posición 18,
s) fenilalanina, metionina o leucina en la posición 19,
t) serina, ácido glutámico, ácido aspártico o glicina en la posición 20,
u) ácido aspártico, metionina, valina, asparagina, ácido glutámico, alanina, arginina, lisina en la posición 21, v) serina, glicina, alanina o treonina en la posición 22,
w) metionina, triptófano, asparagina o histidina en la posición 23,
x) leucina o histidina en la posición 24,
y) cisteína o leucina en la posición 25,
z) alanina o treonina en la posición 26,
aa) leucina o isoleucina en la posición 27,
bb) histidina en la posición 28, y
cc) alanina o serina en la posición 29.
La sustitución de un aminoácido especificado como se define en la Tabla 6 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) arginina, lisina o histidina en la posición 1,
b) arginina en la posición 2,
c) valina o isoleucina en la posición 3,
d) treonina en la posición 4,
e) leucina, isoleucina o valina en la posición 5,
f) metionina o leucina en la posición 6, y
g) arginina, lisina, glutamina, leucina o treonina en la posición 7.
La sustitución de un aminoácido especificado como se define en la Tabla 7 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) lisina o arginina en la posición 1,
b) ácido aspártico en la posición 2,
c) fenilalanina, leucina, isoleucina, metionina o triptófano en la posición 3,
d) ácido glutámico, glutamina o arginina en la posición 4,
e) leucina en la posición 5,
f) alanina o treonina en la posición 6,
g) arginina en la posición 7,
h) arginina en la posición 8,
i) leucina o isoleucina en la posición 9, y
j) glicina, arginina o treonina en la posición 10.
La sustitución de un aminoácido especificado como se define en la Tabla 8 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) glicina, lisina, alanina, serina o treonina en la posición 1,
b) lisina, arginina, isoleucina o alanina en la posición 2,
c) glicina, ácido glutámico o alanina en la posición 3,
d) arginina, glutamina o valina en la posición 4,
e) prolina, glicina, isoleucina, glutamina, leucina, serina o histidina en la posición 5, y
f) triptófano, leucina, fenilalanina o valina en la posición 6.
La sustitución de un aminoácido especificado de SEQ ID NO: 1 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) metionina en la posición 1,
b) alanina en la posición 2,
c) arginina en la posición 3,
d) treonina en la posición 4,
e) lisina en la posición 5,
f) histidina en la posición 6,
g) alanina en la posición 9,
h) arginina en la posición 10,
i) arginina en la posición 11,
j) serina en la posición 12,
k) arginina en la posición 13,
l) lisina en la posición 14, y
m) arginina en la posición 15.
La sustitución de un aminoácido especificado de SEQ ID NO: 2 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) glutamina en la posición 1,
b) serina en la posición 2,
c) glutamina en la posición 3,
d) treonina en la posición 4,
e) glutamina en la posición 5,
f) lisina en la posición 7,
g) lisina en la posición 8,
h) lisina en la posición 9,
i) histidina en la posición 10,
j) arginina en la posición 11,
k) tirosina en la posición 12,
l) arginina en la posición 13, y
m) prolina en la posición 14.
La sustitución de un aminoácido especificado de SEQ ID NO: 3 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) glicina en la posición 1,
b) treonina en la posición 2,
c) valina en la posición 3,
d) alanina en la posición 4,
e) leucina en la posición 5,
f) arginina en la posición 6,
g) ácido glutámico en la posición 7,
h) isoleucina en la posición 8,
i) arginina en la posición 9,
j) fenilalanina en la posición 11,
k) glutamina o arginina en la posición 12,
l) lisina en la posición 13,
m) treonina en la posición 14, y
n) treonina en la posición 15.
La sustitución de un aminoácido especificado de SEQ ID NO: 4 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) alanina en la posición 1,
b) alanina en la posición 2,
c) prolina en la posición 3,
d) fenilalanina en la posición 4,
e) isoleucina en la posición 5,
f) arginina en la posición 6,
g) ácido leucina en la posición 7,
h) valina en la posición 8,
i) arginina en la posición 9,
j) ácido glutámico en la posición 10, y
k) isoleucina en la posición 11.
La sustitución de un aminoácido especificado de SEQ ID NO: 5 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) treonina en la posición 1,
b) asparagina en la posición 2,
c) fenilalanina en la posición 3,
d) leucina en la posición 4,
e) alanina en la posición 5,
f) prolina en la posición 6,
g) ácido glutámico en la posición 8,
h) valina en la posición 9,
i) treonina en la posición 10,
j) arginina en la posición 11,
k) triptófano en la posición 12, y
l) treonina en la posición 13.
La sustitución de un aminoácido especificado de SEQ ID NO: 6 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) alanina en la posición 1,
b) ácido glutámico en la posición 2,
c) alanina en la posición 3,
d) leucina en la posición 4,
e) leucina en la posición 5,
f) alanina en la posición 6,
g) leucina en la posición 7,
h) glutamina en la posición 8,
i) ácido glutámico en la posición 9,
j) alanina en la posición 10,
k) alanina en la posición 11,
l) ácido glutámico en la posición 12,
m) ácido aspártico en la posición 13,
n) fenilalanina en la posición 14,
o) leucina en la posición 15,
p) valina en la posición 16,
q) histidina en la posición 17,
r) leucina en la posición 18,
s) fenilalanina en la posición 19,
t) ácido glutámico en la posición 20,
u) ácido aspártico en la posición 21,
v) alanina en la posición 22,
w) metionina en la posición 23,
x) leucina en la posición 24,
y) cisteína en la posición 25,
z) alanina en la posición 26,
aa) isoleucina en la posición 27,
bb) histidina en la posición 28, y
cc) alanina en la posición 29.
La sustitución de un aminoácido especificado de SEQ ID NO: 7 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) lisina en la posición 1,
b) arginina en la posición 2,
c) valina en la posición 3,
d) treonina en la posición 4,
e) leucina en la posición 5,
f) metionina en la posición 6, y
g) lisina en la posición 7.
La sustitución de un aminoácido especificado de SEQ ID NO: 8 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) lisina en la posición 1,
b) ácido aspártico en la posición 2,
c) fenilalanina en la posición 3,
d) ácido glutámico en la posición 4,
e) leucina en la posición 5,
f) alanina en la posición 6,
g) arginina en la posición 7,
h) arginina en la posición 8,
i) leucina en la posición 9, y
j) glicina en la posición 10.
La sustitución de un aminoácido especificado de SEQ ID NO: 9 significará la sustitución de un aminoácido seleccionado del grupo que consiste en:
a) glicina en la posición 1,
b) lisina en la posición 2,
c) glicina en la posición 3,
d) ácido de arginina en la posición 4,
e) prolina en la posición 5, y
f) triptófano en la posición 6.
En una realización preferida de la presente invención, en un segmento de la proteína CENH3 están presentes 1, 1 o 2, 1 a 3, 1 a 4, 1 a 5, preferiblemente 1 a 6 y más preferiblemente 1 a 7 sustituciones de aminoácidos.
En particular, la presente invención se refiere a mutaciones que provocan o conducen a una sustitución de aminoácidos dentro de un segmento de la proteína CENH3. Por tanto, en este contexto, una mutación es preferiblemente una mutación puntual no sinónima o sustitución en la secuencia de ADN que codifica la proteína CENH3 que da como resultado un cambio en el aminoácido. Esto también se llama una mutación de sentido contrario. Además, el cambio de aminoácido o la sustitución de aminoácido puede ser conservadora, es decir, un cambio a un aminoácido con propiedades fisicoquímicas similares, semiconservador, por ejemplo negativo a un aminoácido cargado positivamente, o radical, es decir, un cambio a un aminoácido muy diferente.
En una realización preferida de la presente invención, la presente planta que tiene actividad biológica de un inductor de haploides es homocigótica con respecto a al menos una mutación. En una realización adicional de la presente invención, la presente planta que tiene actividad biológica de un inductor de haploides es heterocigota con respecto a al menos una mutación.
La planta según la presente invención tiene la actividad biológica de un inductor de haploides. Esto significa que el cruce entre la planta según la presente invención y una planta de tipo salvaje o una planta que expresa la proteína CENH3 de tipo salvaje produce al menos 0.1 %, 0.2 %, 0.3 %, 0.4 %, 0.5 %, 0.6 %, 0.7 %, 0.8 %, 0.9 %, preferiblemente al menos 1 %, preferiblemente al menos 2 %, preferiblemente al menos 3 %, preferiblemente al menos 4 %, preferiblemente al menos 5 %, preferiblemente al menos 6 %, preferiblemente al menos 7 %, preferiblemente al menos 8 % , preferiblemente al menos el 9 %, lo más preferiblemente al menos el 10 %, al menos el 15 %, al menos el 20 % o más progenie haploide. Por lo tanto, una planta de tipo salvaje es preferiblemente una planta de la misma especie que no comprende al menos una mutación de la planta según la presente invención dentro del gen CENH3 endógeno correspondiente, es decir, la planta es capaz de expresar la proteína CENH3 nativa, y una planta que expresa CENH3 de tipo salvaje es preferiblemente una planta de la misma especie que comprende i) un polinucleótido que comprende una secuencia de nucleótidos que codifica la proteína CENH3 sin el al menos una mutación de la planta según la presente invención y es capaz de expresar dicha proteína CENH3 nativa o ii) un polinucleótido que comprende una secuencia de nucleótidos que codifica una proteína CENH3 de otra especie vegetal que muestra una funcionalidad comparable a la CENH3 nativa, por ejemplo, tal proteína CENH3 derivada de otra especie vegetal puede introducirse como un transgén.
Por lo tanto, la presente invención proporciona de forma más ventajosa medios y métodos para generar líneas inductoras de haploides en un amplio rango de especies de eudicotiledóneas, dicotiledóneas y monocotiledóneas. La presente invención también permite el intercambio de citoplasma materno y crear, por ejemplo, plantas de esterilidad masculina citoplasmática con un genotipo deseado en un solo paso de proceso. La presente invención es ventajosa en la medida en que se puede generar una mutación de un solo aminoácido mediante mutagénesis o cualquier otro enfoque no basado en GMO.
Así, todo el proceso de haploidización mediante la aplicación de una línea inductora de haploides caracterizada por un gen CENH3 endógeno mutado con una alteración del aminoácido en al menos una de las posiciones proporcionadas por la presente invención es no transgénico.
En el contexto de la presente invención, un gen, alelo o proteína "endógenos" se refiere a una secuencia no recombinante de una planta tal como la secuencia se presenta en la planta respectiva, en particular en la planta de tipo salvaje. El término "mutado" se refiere a una secuencia alterada por humanos. Los ejemplos de mutación no transgénica inducida por humanos incluyen la exposición de una planta a una dosis alta de mutágeno químico, radiológico u otro con el fin de seleccionar mutantes. Alternativamente, las mutaciones transgénicas inducidas por humanos, es decir, alteraciones recombinantes o ingeniería genómica, por ejemplo mediante nucleasas TALE, nucleasas con dedos de zinc o un sistema CRISPR/Cas, incluyen fusiones, inserciones, deleciones y/o cambios en la secuencia de ADN o de aminoácidos.
Una secuencia de polinucleótidos o polipéptidos es "heteróloga o exógena a" un organismo si se origina a partir de una especie extraña o, si es de la misma especie, se modifica a partir de su forma original.
"Recombinante" se refiere a una secuencia polinucleotídica o polipeptídica alterada por humanos, es decir, transgénica. Un "transgén" se usa como se entiende el término en la técnica y se refiere a un ácido nucleico, preferiblemente heterólogo, introducido en una célula mediante manipulación molecular humana del genoma de la célula, por ejemplo por transformación molecular. Así, una "planta transgénica" es una planta que comprende un transgén, es decir, es una planta modificada genéticamente. La planta transgénica puede ser la planta inicial en la que se introdujo el transgén, así como su descendencia cuyo genoma también contiene el transgén.
El término "codificación de secuencia de nucleótidos" se refiere a un ácido nucleico que dirige la expresión de una proteína específica, en particular la proteína CENH3 o partes de la misma. Las secuencias de nucleótidos incluyen tanto la secuencia de la cadena de ADN que se transcribe en ARN como la secuencia de ARN que se traduce en la proteína. Las secuencias de nucleótidos incluyen tanto las secuencias de ácido nucleico de longitud completa como las secuencias de longitud no completa derivadas de las secuencias de longitud completa.
El término "gen" se refiere a una secuencia de nucleótidos codificante y secuencias de nucleótidos reguladoras asociadas, intrones, 5' UTR y/o 3' UTR.
El término 'elemento regulador' se refiere a una secuencia, preferiblemente una secuencia de nucleótidos, ubicada corriente arriba (5'), dentro y/o corriente abajo (3') de una secuencia de nucleótidos, preferiblemente una secuencia codificante, cuya transcripción y expresión están controladas por el elemento regulador, potencialmente en conjunción con el aparato biosintético de proteínas de la célula. 'Regulación' o 'regular' se refieren a la modulación de la expresión génica inducida por elementos de la secuencia de ADN ubicados principalmente, pero no exclusivamente, corriente arriba (5') desde el inicio de la transcripción del gen de interés. La regulación puede resultar en una respuesta de todo o nada a una estimulación, o puede resultar en variaciones en el nivel de expresión génica.
Se dice que un elemento regulador, en particular una secuencia de ADN, como un promotor, está "operablemente enlazado a" o "asociado con" una secuencia de ADN que codifica un ARN o una proteína, si las dos secuencias están situadas y orientadas de manera que la secuencia de ADN reguladora afecta la expresión de la secuencia de ADN codificante.
Un 'promotor' es una secuencia de ADN que inicia la transcripción de una secuencia de ADN asociada, en particular que se ubica corriente arriba (5') desde el comienzo de la transcripción y que está involucrada en el reconocimiento y que es de la ARN-polimerasa. Dependiendo de la región promotora específica, también puede incluir elementos que actúan como reguladores de la expresión génica, tales como activadores, potenciadores y/o represores.
Un elemento regulador '3' (o extremo '3') se refiere a la porción de un gen que comprende un segmento de ADN, excluyendo la secuencia 5' que impulsa el inicio de la transcripción y la porción estructural del gen, que determina el correcto sitio de terminación y contiene una señal de poliadenilación y cualquier otra señal reguladora capaz de efectuar el procesamiento del ARN mensajero (ARNm) o la expresión génica. La señal de poliadenilación generalmente se caracteriza por efectuar la adición de tramos de ácido poliadenílico al extremo 3' del precursor de ARNm. Las señales de poliadenilación a menudo se reconocen por la presencia de homología con la forma canónica 5'-AATAAA-3'.
El término "secuencia codificante" se refiere a la porción de un gen que codifica una proteína, un polipéptido o una porción del mismo, y que excluye las secuencias reguladoras que impulsan el inicio o la terminación de la transcripción.
El gen, la secuencia de codificación o el elemento regulador puede ser uno que normalmente se encuentra en la célula, en cuyo caso se denomina 'autólogo' o 'endógeno', o puede ser uno que normalmente no se encuentra en una ubicación celular, en cuyo caso es denominado 'heterólogo', 'transgénico' o 'transgén'.
Un gen, una secuencia de codificación o un elemento regulador 'heterólogos' también pueden ser autólogos de la célula pero, sin embargo, están dispuestos en un orden y/u orientación o en una posición o entorno genómico que normalmente no se encuentra o no ocurre en la célula en la que se transfiere.
El término "vector" hace referencia a un constructo de ADN recombinante que puede ser un plásmido, un virus, una secuencia de replicación autónoma, un cromosoma artificial, tal como el cromosoma artificial bacteriano BAC, un fago u otra secuencia de nucleótidos, en la que al menos dos secuencias de nucleótidos, al menos al menos uno de los cuales es una molécula de ácido nucleico de la presente invención, se han unido o recombinado. Un vector puede ser lineal o circular. Un vector puede estar compuesto por un ADN o ARN monocatenario o bicatenario.
El término "expresión" se refiere a la transcripción y/o traducción de un gen endógeno o un transgén en plantas.
'Transformación', 'que transforman' y 'que transfieren' se refieren a métodos para transferir moléculas de ácido nucleico, en particular ADN, a las células, incluidos, pero no limitados a, enfoques biolísticos tales como el bombardeo de partículas, la microinyección, la permeabilización de la membrana celular con diversos tratamientos físicos, por ejemplo electroporación, o tratamientos químicos, por ejemplo tratamientos con polietilenglicol o PEG; la fusión de protoplastos o Agrobacterium tumefaciens o transformación mediada por rizogenes. Para la inyección y electroporación de ADN en células vegetales no existen requisitos específicos para los plásmidos utilizados. Pueden usarse plásmidos tales como derivados de pUC. Si se van a regenerar plantas completas a partir de tales células transformadas, se prefiere el uso de un marcador seleccionable. Dependiendo del método para la introducción de los genes deseados en la célula vegetal, pueden ser necesarias más secuencias de ADN; si, por ejemplo, el plásmido Ti o Ri se usa para la transformación de la célula vegetal, al menos el borde derecho, a menudo, sin embargo, los bordes derecho e izquierdo del plásmido Ti y Ri T-ADN tienen que estar unidos como región flanqueante a los genes a introducir. Preferiblemente, las moléculas de ácido nucleico transferidas se integran de forma estable en el genoma o plastoma de la planta receptora.
En el contexto de la presente invención, el término "actividad biológica de un inductor de haploides" o "inductor de haploides" o "línea de inductores de haploides" se refiere a una planta o línea de plantas que tiene la capacidad de producir progenie o genotipia haploide en al menos un 0.1 %. al menos 0.2 %, 0.3 %, 0.4 %, 0.5 %, 0.6 %, 0.7 %, 0.8 %, 0.9 %, preferiblemente al menos 1 %, preferiblemente al menos 2 %, preferiblemente al menos 3 %, preferiblemente al menos 4 %, preferiblemente al menos el 5 %, preferiblemente al menos el 6 %, preferiblemente al menos el 7 %, preferiblemente al menos el 8 %, preferiblemente al menos el 9 %, lo más preferiblemente al menos el 10 %, lo más preferiblemente al menos el 15 %, lo más preferiblemente al menos el 20 % de casos cuando se cruza con una planta de tipo salvaje o una planta que expresa al menos la proteína CENH3 de tipo salvaje. Dado que los cromosomas del inductor haploide se eliminan durante la meiosis, la progenie haploide resultante solo comprende los cromosomas del progenitor de tipo salvaje. Sin embargo, en caso de que el inductor haploide fuera el progenitor del óvulo del cruce, la progenie haploide posee el citoplasma del inductor y los cromosomas del progenitor de tipo salvaje.
El término "planta" según la presente invención incluye plantas enteras o partes de tal planta entera.
Las plantas enteras son preferiblemente plantas con semillas o un cultivo. Las partes de una planta son, por ejemplo órganos/estructuras vegetativas de brotes, por ejemplo, hojas, tallos y tubérculos; raíces, flores y órganos/estructuras florales, por ejemplo brácteas, sépalos, pétalos, estambres, carpelos, anteras y óvulos; semilla, incluidos el embrión, el endospermo y la cubierta de la semilla; fruto y el ovario maduro; tejido vegetal, por ejemplo tejido vascular, tejido triturado y similares; y células, por ejemplo células protectoras, óvulos, tricomas y similares; y progenie de la misma.
En cualquier caso, la planta de la presente invención comprende al menos una célula que comprende un polinucleótido que comprende una secuencia de nucleótidos que codifica una proteína centrómero de histona H3 (CENH3), en donde el polinucleótido comprende al menos una mutación que provoca una alteración de la secuencia de aminoácidos de la proteína CENH3 y dicha alteración le confiere la actividad biológica de un inductor haploide como se especifica en la reivindicación 1. Más preferiblemente, la mayoría o en particular todas las células de la planta de la presente invención comprenden las mutaciones como se define en la reivindicación 1.
Las especies de plantas que se pueden usar en el método de la invención son preferiblemente plantas eudicotiledóneas, dicotiledóneas y monocotiledóneas.
El término "planta" en una realización preferida se refiere únicamente a una planta completa, es decir, una planta que exhibe el fenotipo completo de una planta desarrollada y capaz de reproducirse, una etapa anterior de desarrollo de la misma, por ejemplo, un embrión de planta, o ambos.
En una realización de la presente invención, el término "planta" se refiere a una parte de una planta completa, en particular material de la planta, células vegetales o cultivos de células vegetales.
El término "célula vegetal" describe la unidad estructural y fisiológica de la planta y comprende un protoplasto y una pared celular. La célula vegetal puede estar en forma de una sola célula aislada, como células protectoras estomáticas o células cultivadas, o como parte de una unidad organizada superior como, por ejemplo, un tejido vegetal o un órgano vegetal.
El término "material vegetal" incluye partes de plantas, en particular células vegetales, tejidos vegetales, en particular material de propagación vegetal, preferiblemente hojas, tallos, raíces, radículas emergidas, flores o partes de flores, pétalos, frutos, polen, tubos polínicos, filamentos de anteras, óvulos, sacos embrionarios, células fecundables, ovarios, cigotos, embriones, embriones cigóticos per se, embriones somáticos, secciones de hipocótilo, meristemas apicales, haces vasculares, periciclos, semillas, raíces, esquejes, cultivos de células o tejidos, o cualquier otra parte o producto de una planta.
Por tanto, la presente invención también proporciona material de propagación vegetal de las plantas de la presente invención. Por dicho “material de propagación vegetal” se entiende cualquier material vegetal susceptible de ser reproducido sexual o asexualmente in vivo o in vitro. Particularmente preferidos dentro del alcance de la presente invención son protoplastos, células, callos, tejidos, órganos, semillas, embriones, polen, células fecundables, cigotos, junto con cualquier otro material de propagación obtenido de plantas transgénicas. Partes de plantas, tales como por ejemplo flores, tallos, frutos, hojas, raíces que se originan en plantas mutadas o su progenie previamente mutada, preferiblemente transformadas, mediante los métodos de la presente invención y que por lo tanto consisten al menos en parte en células mutadas, son también objeto de la presente invención.
La planta de acuerdo con la presente invención se selecciona del grupo que consiste en sorgo (Sorghum bicolor), maíz (zea mays), Beta vulgaris, colza (Brassica napus), brócoli (Brassiea olerácea), y Brassica rapa.,
La planta según la presente invención contiene el polinucleótido que comprende la secuencia de nucleótidos que codifica el CENH3 como gen endógeno.
La al menos una sustitución de aminoácido se introduce en la secuencia de nucleótidos que codifica CENH3 de forma no transgénica.
Por tanto, preferiblemente en una realización, en la que al menos una mutación se efectúa en el gen CENH3 endógeno, la planta obtenida no es transgénica. Preferiblemente, la mutación se efectúa a través de mutagénesis no transgénica, mutagénesis de transposón, en particular mutagénesis química, preferiblemente a través de TILLING inducido por EMS (etilmetanosulfonato) o edición dirigida del genoma.
Así, la presente invención se refiere a una planta, en la que la introducción no transgénica de al menos una mutación que provoca una alteración de la secuencia de aminoácidos de la proteína CENH3 y dicha alteración confiere la actividad biológica de un inductor haploide se efectúa mediante mutagénesis química, en particular a través de TILLING.
Sin estar ligado a la teoría, un posible modelo de cómo funciona la eliminación cromosómica uniparental en el inductor CENH3 x embriones híbridos interespecíficos CENH3 de tipo salvaje podría funcionar de la siguiente manera: (A) Las células fecundables probablemente derivados del inductor haploide contienen menos CENH3 o, en comparación con el tipo salvaje, una "firma requerida de transgeneración de CENH3" desconocida y reducida. Una cantidad reducida de CENH3 materno es menos probable según los estudios realizados con un reportero CENH3-GFP en los núcleos de espermas de plantas A. thaliana, pero no en las células fecundables, están marcados por CENH3. Sin embargo, todavía es posible que los CENH3 maternos residuales, que generan una "impresión centromérica", se transmitan a la progenie. (B) Dentro de unas pocas horas después de la fertilización, también el CENH3 de tipo salvaje paterno se elimina activamente del núcleo del cigoto, y (C) la recarga centromérica de CENH3-GFP en el cigoto ocurre en la etapa de 16 núcleos del desarrollo del endospermo en A. thaliana. (D) En los embriones que experimentan haploidización, la recarga centromérica de los cromosomas maternos está alterada o retrasada, lo que causa retrasos en los cromosomas debido a la inactividad del centrómero durante la anafase. Posteriormente, los cromosomas inductores de haploides micronucleados se degradarán y (E) se desarrollará un embrión haploide. Los embriones haploides contienen cromosomas derivados del padre en el fondo del citoplasma derivado de la madre.
La presente invención también se refiere a un polinucleótido como se define en la reivindicación 4.
En el contexto de la presente invención, el término "que comprende" como se usa aquí tiene el significado de "que incluye" o "que contiene", lo que significa que, además del elemento mencionado explícitamente, posiblemente estén presentes otros elementos.
En una realización preferida de la presente invención, el término 'que comprende' como se usa aquí también se entiende que significa 'que consiste en excluir de ese modo la presencia de otros elementos además del elemento mencionado explícitamente.
En una realización preferida adicional, el término "que comprende", tal como se usa en el presente documento, también se entiende que significa "que consiste esencialmente en excluir de ese modo la presencia de otros elementos que proporcionen una contribución significativa a la enseñanza divulgada además del elemento mencionado explícitamente".
Otras realizaciones preferidas de la presente invención son el objeto de las subreivindicaciones.
La invención se describirá ahora con algo más de detalle por medio de ejemplos no limitativos y una figura.
El protocolo de secuencia muestra:
SEQ ID NO: 1: la secuencia consenso de aminoácidos del dominio de la cola N-terminal del CENH3 (parte A),
SEQ ID NO: 2: la secuencia consenso de aminoácidos del dominio de la cola N-terminal del CENH3 (parte B),
SEQ ID NO: 3: la secuencia consenso de aminoácidos de la hélice aN del CENH3,
SEQ ID NO: 4: la secuencia consenso de aminoácidos de la hélice a l del CENH3,
SEQ ID NO: 5: la secuencia consenso de aminoácidos del bucle1 del CENH3,
SEQ ID NO: 6: la secuencia consenso de aminoácidos de la hélice a2 del CENH3,
SEQ ID NO: 7: la secuencia consenso de aminoácidos del bucle2 del CENH3,
SEQ ID NO: 8: la secuencia consenso de aminoácidos de la hélice a3 del CENH3,
SEQ ID NO: 9: la secuencia consenso de aminoácidos del dominio C-terminal del CENH3,
SEQ ID NO: 10: la secuencia de nucleótidos de la secuencia codificante de tipo salvaje (ADNc) de A. thaliana CENH3,
SEQ ID NO: 11: la secuencia de aminoácidos del tipo salvaje A. thaliana CENH3,
SEQ ID NO: 12: la secuencia de nucleótidos de la secuencia genómica de tipo salvaje (ADN genómico) de B. napus CENH3,
SEQ ID NO: 13: la secuencia de nucleótidos de la secuencia de codificación de tipo salvaje (ADNc) de B. napus CENH3,
SEQ ID NO: 14: la secuencia de aminoácidos del tipo salvaje B. napus CENH3,
SEQ ID NO: 15: la secuencia de nucleótidos de la secuencia genómica de tipo salvaje (ADN genómico) de S. bicolor CENH3,
SEQ ID NO: 16: la secuencia de nucleótidos de la secuencia de codificación de tipo salvaje (ADNc) de S. bicolor CENH3,
SEQ ID NO: 17: la secuencia de aminoácidos del tipo salvaje S. bicolor CENH3,
SEQ ID NO: 18: la secuencia de nucleótidos de la secuencia genómica de tipo salvaje (ADN genómico) de Z. mays CENH3,
SEQ ID NO: 19: la secuencia de nucleótidos de la secuencia codificante de tipo salvaje (ADNc) de Z. mays CENH3,
SEQ ID NO: 20: la secuencia de aminoácidos del tipo salvaje Z. Mays CENH3,
SEQ ID NO: 21: la secuencia de nucleótidos de la secuencia genómica de tipo salvaje (ADN genómico) de B. vulgaris CENH3,
SEQ ID NO: 22: la secuencia de nucleótidos de la secuencia de codificación de tipo salvaje (ADNc) de B. vulgaris CENH3,
SEQ ID NO: 23: la secuencia de aminoácidos del tipo salvaje B. vulgaris CENH3, y
SEQ ID NO: 24: la secuencia de nucleótidos de la secuencia genómica (ADN genómico) de Z. mays CENH3-Mumutación.
La figura muestra una alineación de las secuencias de aminoácidos de Arabidopsis thaliana (primera fila), Beta vulgaris (segunda fila), Brassica napus (tercera fila), zea mays (cuarta fila), Sorghum bicolor (quinta fila), así como un diagrama que muestra el nivel de conservación de estas cinco especies de plantas.
Ejemplos
Identificación de mutantes CENH3
Para la identificación de mutaciones dentro del gen de CENH3 que provocan una alteración de la secuencia de aminoácidos del CENH3 traducido, en donde la alteración es capaz de conferir la actividad biológica de un inductor haploide a una planta, se han investigado todos los segmentos del gen CENH3 con respecto a las mutaciones adecuadas, incluso si Ravi und Chan 2010 destacaron solo la importancia particular del dominio N terminal. La primera investigación propia sobre mutantes en otros segmentos como la hélice a2 (aún no publicada) dio indicaciones de que, además, la modificación de otros segmentos puede provocar una desestabilización de las capacidades de unión de CENH3 al ADN.
Con el fin de encontrar genes CENH3 mutantes en diferentes especies de plantas, se han generado poblaciones de labranza con altas tasas de mutación para el maíz (zea mays), semilla de colza (Brassica napus), sorgo (Sorghum bicolor) y remolacha azucarera (Beta vulgaris) y han sido cribados para detectar mutaciones en CENH3. Para ello, tras el desarrollo de amplicones que cubren todos los exones de los genes CENH3, se han analizado 1000-10000 plantas por especie vegetal mediante el método de secuenciación de Sanger. Además, las plantas de remolacha azucarera M2 han sido analizadas para detectar mutaciones utilizando PCR específico.
Además, el efecto de la mutación identificada dentro del gen CENH3 en la estructura primaria y secundaria de la proteína codificada se evaluó utilizando, entre otros, el software Prof (Rost, B. and Sander, C. (1994a). Combinando información evolutiva y redes neuronales para predecir la estructura secundaria de proteínas. Proteins, 19(1), 55-72. Rost, B. and Sander, C. (1994b). Conservación y predicción de la accesibilidad de disolventes en familias de proteínas. Proteins, 20(3), 216-26. Rost, B., Casadio, R., Fariselli, P., and Sander, C. (1995). Hélices transmembrana predichas con un 95 % de precisión. Protein Sci, 4(3), 521-33.). Las tablas 9 a 12 muestran las mutaciones identificadas en B. napus, Z. mays, S. bicolor y B. vulgaris, respectivamente, que se separan en mutaciones que provocan un error de empalme y en mutaciones que provocan una sustitución de aminoácidos. Una mutación dentro de un sitio de empalme es de particular interés. Dichas mutaciones pueden causar un mal funcionamiento del sitio de empalme (error de empalme), lo que luego da como resultado una mayor producción de traducción celular de proteína CENH3 no completamente funcional, lo que muestra, por ejemplo una estabilidad deteriorada, una afinidad de unión reducida al ADN, una forma geométrica cambiada de la proteína, preferiblemente una estructura secundaria o terciaria cambiada, o un plegamiento desordenado de la proteína en comparación con la proteína CENH3 de tipo salvaje totalmente funcional. Las plantas que tenían un genoma que era heterocigoto para tales mutaciones eran viables.
Tabla 9: mutación del CENH3 derivada de Brassica napus (aa: aminoácido; nd: no determinado, y: sí, n: no). La sustitución de aminoácidos se da como X#Y, es decir, el aminoácido X (código de una letra) se sustituye por el aminoácido Y en la posición #.
Figure imgf000022_0001
Figure imgf000023_0002
Tabla 10: mutación del CENH3 derivada de zea mays (aa: aminoácido; nd: no determinado, y: sí, n: no). La sustitución de aminoácidos se da como X#Y, es decir, el aminoácido X (código de una letra) se sustituye por el aminoácido Y en la posición #.
Figure imgf000023_0001
Tabla 11: mutación del CENH3 derivada de Sorghum bicolor (aa: aminoácido; nd: no determinado, y: sí, n: no). La sustitución de aminoácidos se da como X#Y, es decir, el aminoácido X (código de una letra) se sustituye por el aminoácido Y en la posición #.
Figure imgf000023_0003
Figure imgf000024_0002
Tabla 12: mutación del CENH3 derivada de Beta vulgaris (nd: no determinado, y: sí, n: no). La sustitución de aminoácidos se da como X#Y, es decir, el aminoácido X (código de una letra) se sustituye por el aminoácido Y en la posición #.
Figure imgf000024_0001
Además de las mutaciones de los sitios de empalme y las mutaciones puntuales que causan sustituciones de aminoácidos dentro de la secuencia de aminoácidos de la proteína CENH3, se ha identificado un mutante de maíz (llamado mutante Mu) que contiene una inserción de transposón dentro de la región 5' no traducida del gen CENH3 (véase SEQ ID: 24). Esta mutación provoca una extensión del dominio de la cola N terminal. Por lo tanto, el efecto de esta mutación en CENH3 es muy similar a la mutación descrita por Ravi & Chan (2010), excepto que la mutación no es transgénica.
Prueba de mutantes CENH3
Para evaluar la actividad biológica de un inductor haploide en los mutantes identificados y para probar el desempeño materno y paterno de la inducción haploide, las plantas mutantes deben cruzarse con otra planta de prueba de la misma especie (portadora de la forma de tipo salvaje de CENH3) que pueda usarse como padre de óvulo o padre de polen, respectivamente. La supuesta progenie haploide de este cruce se puede determinar rápidamente si las líneas de prueba usadas portan una mutación recesiva no CENH3. Entonces, las plantas haploides muestran el fenotipo recesivo. Por ejemplo, en el maíz se puede usar la manifestación de la mutación glossy (Mutants of maize, Neuffer, MG et al. 1997.Cold Spring Harbor Laboratory, Nueva York).
Los análisis citogenéticos de la mitosa y la meiosis con los inductores dan indicaciones sobre la idoneidad de los mutantes como inductores de haploides. La homocigosidad se determina mediante el uso de marcadores moleculares, polimorfo para probador e inductor potencial. La haploidía como tal se analiza citogenéticamente.
En los cruces con las plantas de prueba, las plantas TILLING con el gen CENH3 endógeno mutado, como se describió anteriormente, producen al menos un 0.4 % de progenie haploide. Con frecuencia, pero no siempre, la tasa de inducción era más alta si la prueba se usaba como progenitor femenino en el cruce.
Por ejemplo, en Brassica napus las mutaciones que se basan en sustituciones de aminoácidos en el dominio de la cola N-terminal dan como resultado tasas de inducción de al menos el 0.5 % y en parte hasta más del 2 %. Por lo tanto, las ubicaciones de las mutaciones no son específicas de una determinada región en este dominio, sino que se distribuyen por todo el dominio. El dominio de la cola N-terminal en Brassica napus va desde la posición de aminoácido 1 a la 84. Las mutaciones que confieren la actividad biológica de un inductor haploide se pueden encontrar, por ejemplo, en las posiciones 9, 16, 24, 29, 30, 33, 41,43, 50, 55, 57 y 61, por lo que no todas estas mutaciones conducen necesariamente a una oportunidad en la estructura secundaria de la proteína (calculado sobre silicio).
Se han logrado resultados comparables para el dominio de plegamiento de histonas más conservado que contiene las tres hélices y los dos bucles. Aunque en todo el dominio de plegamiento de histonas se pueden encontrar mutaciones adecuadas, específicamente sustituciones de aminoácidos en la hélice a2, el dominio c At D y el bucle2 produjeron en promedio tasas de inducción significativamente más altas. Debido a estas observaciones sobre el dominio de la cola N-terminal y el dominio de plegamiento de histonas, se puede suponer que también otras posiciones no probadas y otras sustituciones de amino no probadas conferirán la misma o incluso una inductividad haploide mejorada. Además, otro tipo de modificación del gen CENH3 endógeno es la sustitución de nucleótidos en los sitios de empalme, lo que

Claims (4)

REIVINDICACIONES
1. Planta que tiene actividad biológica de un inductor haploide y que comprende un polinucleótido que comprende una secuencia de nucleótidos que codifica una proteína centrómero de histona H3 (CENH3), en donde el polinucleótido comprende una mutación que causa una alteración de la secuencia de aminoácidos de la proteína CENH3 en el dominio N-terminal y en donde dicha alteración confiere la actividad biológica de un inductor haploide, en donde la alteración es una sustitución de 1 a 7 aminoácidos, en donde el polinucleótido que comprende la mutación es un gen endógeno, y en donde la mutación provoca una sustitución de
1. el aminoácido arginina en la posición 2 de SEQ ID NO: 23 se sustituye, preferiblemente por lisina, o
ii. el aminoácido serina en la posición 9 de SEQ ID NO: 14 se sustituye, preferiblemente por fenilalanina, o iii. el aminoácido arginina en la posición 16 de SEQ ID NO: 14 se sustituye, preferiblemente por glutamina, o iv. el aminoácido serina en la posición 24 de SEQ ID NO: 14 se sustituye, preferiblemente por leucina, o
v. el aminoácido alanina en la posición 25 de SEQ ID NO: 17 se sustituye, preferiblemente por treonina, o vi. el aminoácido ácido glutámico en la posición 29 de SEQ ID NO: 14 se sustituye, preferiblemente por lisina, o vii. el aminoácido glicina en la posición 30 de SEQ ID NO: 14 se sustituye, preferiblemente por ácido aspártico, o viii. el aminoácido alanina en la posición 33 de SEQ ID NO: 14 o en la posición 32 de SEQ ID NO: 20 se sustituye, preferiblemente por treonina, o
ix. el aminoácido prolina en la posición 35 de SEQ ID NO: 14 se sustituye, preferiblemente por leucina, o x. el aminoácido ácido glutámico en la posición 35 de SEQ ID NO: 20 se sustituye, preferiblemente por lisina, o xi. el aminoácido serina en la posición 41 de SEQ ID NO: 14 se sustituye, preferiblemente por asparagina, o xii. el aminoácido glicina en la posición 43 de SEQ ID NO: 14 se sustituye, preferiblemente por ácido glutámico, o xiii. el aminoácido prolina en la posición 50 de SEQ ID NO: 14 se sustituye, preferiblemente por serina, o xiv. el aminoácido prolina en la posición 55 de SEQ 1D NO: 14 se sustituye, preferiblemente por leucina, o xv. el aminoácido glicina en la posición 57 de SEQ ID NO: 14 se sustituye, preferiblemente por ácido aspártico, o xvi. el aminoácido glicina en la posición 61 de SEQ ID NO: 14 se sustituye, preferiblemente por ácido glutámico, o xvii. el aminoácido arginina en la posición 65 de SEQ 1D NO: 14 se sustituye, preferiblemente por glutamina, o xviii. el aminoácido arginina en la posición 65 de SEQ ID NO: 14 se sustituye, preferiblemente por señal de parada, o xix. el aminoácido prolina en la posición 71 de SEQ ID NO: 14 se sustituye, preferiblemente por serina, o xx. el aminoácido ácido aspártico en la posición 46 de SEQ ID NO: 23 se sustituye, preferiblemente por asparagina o glicina, o
xxi. el aminoácido prolina en la posición 56 de SEQ ID NO: 20 se sustituye, preferiblemente por serina, o xxii. el aminoácido alanina en la posición 62 de SEQ ID NO: 17 se sustituye, preferiblemente por valina.
2. Planta de acuerdo con la reivindicación 1, en la que el cruce entre la planta y una planta de tipo salvaje o una planta que expresa la proteína CENH3 de tipo salvaje produce al menos un 0.1% de progenie haploide.
3. Parte de la planta de acuerdo con la reivindicación 1 o 2, que es preferiblemente un órgano vegetativo del brote, raíz, flor u órgano floral, semilla, fruto, óvulo, embrión, tejido vegetal o célula, en la que la parte de la planta comprende el polinucleótido como se define en la reivindicación 1.
4. Polinucleótido que comprende una secuencia de nucleótidos que codifica una proteína CENH3 en el que el polinucleótido comprende una mutación que causa una alteración de la secuencia de aminoácidos del dominio N-terminal como se define en la reivindicación 1, en el que la alteración es una sustitución de 1 a 7 aminoácidos.
ES15817864T 2014-12-23 2015-12-23 Generación de plantas haploides Active ES2926323T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14004389.4A EP3037540A1 (en) 2014-12-23 2014-12-23 Haploid inducer
PCT/EP2015/081158 WO2016102665A2 (en) 2014-12-23 2015-12-23 Haploid inducer

Publications (1)

Publication Number Publication Date
ES2926323T3 true ES2926323T3 (es) 2022-10-25

Family

ID=52434478

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15817864T Active ES2926323T3 (es) 2014-12-23 2015-12-23 Generación de plantas haploides

Country Status (15)

Country Link
US (2) US10844401B2 (es)
EP (9) EP3037540A1 (es)
CN (1) CN107205354A (es)
AR (1) AR103226A1 (es)
AU (2) AU2015370904B2 (es)
BR (1) BR112017013406B1 (es)
CA (1) CA2970123A1 (es)
CL (1) CL2017001665A1 (es)
DK (1) DK3237623T3 (es)
EA (3) EA202193164A1 (es)
ES (1) ES2926323T3 (es)
HU (1) HUE059654T2 (es)
MX (2) MX2017008283A (es)
PL (1) PL3237623T3 (es)
WO (1) WO2016102665A2 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180116141A1 (en) * 2015-02-24 2018-05-03 The Regents Of The University Of California Haploid induction
UY37335A (es) * 2016-07-21 2018-02-28 Kaiima Bio Agritech Ltd Composiciones y métodos para generar un haploide de una planta objeto
WO2018015956A1 (en) * 2016-07-21 2018-01-25 Kaiima Bio Agritech Ltd. Compositions and methods for generating a haploid of a target plant
WO2018102816A1 (en) * 2016-12-02 2018-06-07 Syngenta Participations Ag Simultaneous gene editing and haploid induction
EP3366778A1 (de) 2017-02-28 2018-08-29 Kws Saat Se Haploidisierung in sorghum
WO2019234129A1 (en) 2018-06-05 2019-12-12 KWS SAAT SE & Co. KGaA Haploid induction with modified dna-repair
EP3660164A1 (en) 2018-11-30 2020-06-03 KWS SAAT SE & Co. KGaA Screening of germplasm for desired polymorphisms by assays tested on synthetic dna
EP3689135A1 (en) * 2019-01-30 2020-08-05 KWS SAAT SE & Co. KGaA Haploid inducers
CN112725374A (zh) * 2019-10-29 2021-04-30 中国种子集团有限公司 创制植物单倍体诱导系的方法及其应用
UY39237A (es) * 2020-05-29 2021-12-31 Kws Saat Se & Co Kgaa Inducción de haploides en plantas
BR112022025102A2 (pt) * 2020-06-09 2023-02-07 Univ Georgia Monocotiledôneas heterozigotas para cenh3 e métodos de uso das mesmas para indução haploide e edição simultânea de genoma
CN113801891B (zh) * 2021-09-13 2023-06-09 内蒙古自治区农牧业科学院 甜菜BvCENH3基因单倍体诱导系的构建方法与应用
CN114957422A (zh) * 2022-06-15 2022-08-30 中国水稻研究所 一种诱导单倍体的方法及其在植物育种中的应用
CN116463348B (zh) * 2023-05-26 2024-05-14 中国农业科学院作物科学研究所 利用CRISPR/Cas9***编辑玉米ZmCENH3基因的sg RNA及其应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2012003981A (es) * 2009-10-06 2012-06-12 Univ California Generacion de plantas haploides y cruza de plantas mejorada.
WO2014110274A2 (en) * 2013-01-09 2014-07-17 Regents Of The University Of California A California Corporation Generation of haploid plants
EA037899B1 (ru) 2014-08-28 2021-06-03 Квс Заат Се Создание гаплоидных растений
US20180116141A1 (en) * 2015-02-24 2018-05-03 The Regents Of The University Of California Haploid induction

Also Published As

Publication number Publication date
EP4144853A1 (en) 2023-03-08
CL2017001665A1 (es) 2018-01-26
BR112017013406B1 (pt) 2024-03-19
EP4144854A1 (en) 2023-03-08
CA2970123A1 (en) 2016-06-30
WO2016102665A2 (en) 2016-06-30
US10844401B2 (en) 2020-11-24
EP4141123A1 (en) 2023-03-01
EP3237623B1 (en) 2022-07-13
EA201791414A1 (ru) 2018-02-28
EA202193164A1 (ru) 2022-03-01
AU2021225142B2 (en) 2023-06-29
BR112017013406A2 (pt) 2018-02-06
EA202193165A1 (ru) 2022-03-01
EP4144852A1 (en) 2023-03-08
EP4144851A1 (en) 2023-03-08
AU2015370904B2 (en) 2021-07-22
EP4144855A1 (en) 2023-03-08
CN107205354A (zh) 2017-09-26
DK3237623T3 (da) 2022-09-12
AR103226A1 (es) 2017-04-26
PL3237623T3 (pl) 2022-10-31
EP4144850A1 (en) 2023-03-08
US20180139917A1 (en) 2018-05-24
EP3237623A2 (en) 2017-11-01
WO2016102665A3 (en) 2017-03-16
AU2021225142A1 (en) 2021-09-30
US20210079419A1 (en) 2021-03-18
HUE059654T2 (hu) 2022-12-28
EA039590B1 (ru) 2022-02-14
MX2017008283A (es) 2017-10-02
MX2022015112A (es) 2023-01-18
AU2015370904A1 (en) 2017-06-08
EP3037540A1 (en) 2016-06-29

Similar Documents

Publication Publication Date Title
ES2926323T3 (es) Generación de plantas haploides
US11895960B2 (en) Generation of haploid plants
US20230337611A1 (en) Generation of hapoloid plants based on knl2
JP2012514467A (ja) 2n配偶子またはアポマイオシス性配偶子を産生する植物
WO2020239984A1 (en) Gene for parthenogenesis
ES2949396T3 (es) Generación de plantas haploides
CN113557408A (zh) 用于使用基因组编辑产生显性矮株型等位基因的方法和组合物
CN113939189A (zh) 用于使用基因组编辑产生显性矮株型等位基因的方法和组合物