CN107205354A - 单倍体诱导物 - Google Patents

单倍体诱导物 Download PDF

Info

Publication number
CN107205354A
CN107205354A CN201580075644.XA CN201580075644A CN107205354A CN 107205354 A CN107205354 A CN 107205354A CN 201580075644 A CN201580075644 A CN 201580075644A CN 107205354 A CN107205354 A CN 107205354A
Authority
CN
China
Prior art keywords
seq
substituted
amino acid
plant
preferably substituted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580075644.XA
Other languages
English (en)
Inventor
C·博尔杜安
F·布鲁尔
M·克洛伊贝尔-迈茨
M·尼森
M·奥祖诺娃
B·舒尔茨
S·维克霍斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KWS SAAT SE and Co KGaA
Original Assignee
KWS SAAT SE and Co KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KWS SAAT SE and Co KGaA filed Critical KWS SAAT SE and Co KGaA
Publication of CN107205354A publication Critical patent/CN107205354A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • A01H1/08Methods for producing changes in chromosome number
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • A01H1/021Methods of breeding using interspecific crosses, i.e. interspecies crosses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • A01H1/022Genic fertility modification, e.g. apomixis
    • A01H1/023Male sterility
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/06Roots
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/20Brassicaceae, e.g. canola, broccoli or rucola
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Botany (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Physiology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Animal Husbandry (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及非转基因和转基因植物,优选作物植物,其具有单倍体诱导物的生物活性且包含多核苷酸,所述多核苷酸包含编码着丝粒组蛋白H3(CENH3)蛋白的核苷酸序列,其中所述多核苷酸包含引起CENH3蛋白的氨基酸序列改变的至少一个突变,以及所述植物的部分。进一步地,本发明提供产生诱导物植物的方法、利用诱导物植物产生单倍体和双单倍体植物的方法以及促进细胞质交换的方法。

Description

单倍体诱导物
本发明涉及非转基因和转基因植物,优选作物植物,其具有单倍体诱导物的生物活性且包含多核苷酸,所述多核苷酸包含编码着丝粒组蛋白H3(CENH3)蛋白的核苷酸序列,其中所述多核苷酸包含至少一个突变,所述突变引起CENH3蛋白的氨基酸序列改变并且所述改变赋予单倍体诱导物的生物活性。进一步地,本发明提供产生本发明植物的方法和可通过将本发明植物与野生型植物杂交获得的单倍体和双单倍体植物,以及促进细胞质交换的方法。
单倍体的产生和使用是改良栽培植物的最有效的生物技术手段之一。单倍体对于育种者的优势是在双单倍体化,产生双单倍体植物之后的第一代中已经可以实现纯合性,不需要获得高度纯合性所要求的若干回交世代。进一步地,单倍体在植物研究和育种中的价值在于双单倍体的生成细胞(founder cell)是减数***的产物,由此所得群体组成了多样性重组体及同时是遗传固定的个体的集合。因此,双单倍体的产生不仅提供了极有用的遗传变异性(从中选择用于作物改良),而且还是产生作图群体、重组近交系以及直接纯合(instantly homozygous)的突变体以及转基因株系的有价值的手段。
单倍体可以通过体外或体内方法获得。然而,许多物种和基因型对于这些方法是难实现的。或者,通过交换其N末端区并将其与GFP融合(“GFP-尾部交换(GFP-tailswap)”CENH3),着丝粒特异性组蛋白H3变体(CENH3,也称作CENP-A)的实质改变在模式植物拟南芥(Arabidopsis thaliana)中产生单倍体诱导物株系(Ravi and Chan,Nature,464(2010),615-618;Comai,L,"Genome elimination:translating basic research into a futuretool for plant breeding.",PLoS biology,12.6(2014))。CENH3蛋白是H3组蛋白的变体,其是活性着丝粒的着丝点复合物的成员。使用这些“GFP-尾部交换”单倍体诱导物株系,当单倍体诱导物植物与野生型植物杂交时在后代中发生单倍体化。令人感兴趣的是,所述单倍体诱导物株系在自交时是稳定的,提示在发育中的杂交胚中经修饰的着丝粒与野生型着丝粒之间的竞争导致诱导物亲本的着丝粒失活,并因此导致单亲本染色体消除。结果,含有改变的CENH3蛋白的染色体在早期胚发育期间丢失,产生仅含有野生型亲本染色体的单倍体后代。
因此,可以通过将作为单倍体诱导物的“GFP-尾部交换”转基因植物与野生型植物杂交而获得单倍体植物。然而,如上所述,这种技术需要CENH3蛋白的实质改变,并且所述植物包含异源转基因,这样由于增加了关于遗传工程化作物的公众阻碍而存在经济学问题。
因此,本发明的一个目的是克服前述问题及特别提供了替代的单倍体诱导物植物,其不含对其CENH3蛋白的实质修饰和/或其不是遗传工程化的。
这个问题通过独立权利要求的主题得以解决,特别是通过具有单倍体诱导物生物活性且包含多核苷酸的植物来解决,所述多核苷酸包含编码着丝粒组蛋白H3(CENH3)蛋白的核苷酸序列,其中所述多核苷酸包含至少一个突变,所述突变引起CENH3蛋白的氨基酸序列改变并且所述改变赋予单倍体诱导物的生物活性。在本发明的上下文中,术语“改变”是指对蛋白CENH3的氨基酸序列的任何修饰(包括多重修饰),其是由包含编码着丝粒组蛋白H3(CENH3)蛋白的核苷酸序列的多核苷酸中的至少一个突变所致。所述多核苷酸可以是CENH3基因的基因组DNA、CENH3的cDNA,或者CENH3基因的5’-或3’-的非翻译区或者它们的混合物,所述混合物包含例如一部分基因组DNA和一部分cDNA。改变可以是一个或多个氨基酸取代、一个或多个氨基酸***或者一个或多个氨基酸缺失。能够改变蛋白CENH3的氨基酸序列的DNA水平的突变可以是导致氨基酸取代或终止密码子的点突变、移动CENH3基因的读框的***或缺失,或者是在剪接位点的突变。
在一优选实施方案中,所述至少一个突变在CENH3蛋白的氨基酸序列的至少一个片段中引起蛋白CENH3的氨基酸序列改变,所述改变赋予单倍体诱导物的生物活性。所述序列片段选自N-末端尾部结构域、CATD结构域、αN-螺旋、α1-螺旋、环1、α2-螺旋、环2、α3-螺旋和C-末端结构域。CENH3蛋白的N-末端尾部结构域对应于源自拟南芥的SEQ ID NO:11所示的位置1-位置82的氨基酸序列和/或CENH3蛋白的N-末端尾部结构域由对应于源自拟南芥的SEQ ID NO:10所示的位置1-位置246的核苷酸的核苷酸序列编码。CENH3蛋白的CATD结构域对应于源自拟南芥的SEQ ID NO:11所示的位置113-位置155的氨基酸序列和/或CENH3蛋白的CATD结构域由对应于源自拟南芥的SEQ ID NO:10所示的位置337-位置465的核苷酸的核苷酸序列编码。CENH3蛋白的αN-螺旋对应于源自拟南芥的SEQ ID NO:11所示的位置83-位置97的氨基酸序列和/或CENH3蛋白的αN-螺旋由对应于源自拟南芥的SEQ ID NO:10所示的位置247-位置291的核苷酸的核苷酸序列编码。CENH3蛋白的α1-螺旋对应于源自拟南芥的SEQ ID NO:11所示的位置103-位置113的氨基酸序列和/或CENH3蛋白的α1-螺旋由对应于源自拟南芥的SEQ ID NO:10所示的位置307-位置339的核苷酸的核苷酸序列编码。CENH3蛋白的环1对应于源自拟南芥的SEQ ID NO:11所示的位置114-位置126的氨基酸序列和/或CENH3蛋白的环1由对应于源自拟南芥的SEQ ID NO:10所示的位置340-位置378的核苷酸的核苷酸序列编码。CENH3蛋白的α2-螺旋对应于源自拟南芥的SEQ ID NO:11所示的位置127-位置155的氨基酸序列和/或CENH3蛋白的α2-螺旋由对应于源自拟南芥的SEQ ID NO:10所示的位置379-位置465的核苷酸的核苷酸序列编码。CENH3蛋白的环2对应于源自拟南芥的SEQ ID NO:11所示的位置156-位置162的氨基酸序列和/或CENH3蛋白的环2由对应于源自拟南芥的SEQ ID NO:10所示的位置466-位置486的核苷酸的核苷酸序列编码。CENH3蛋白的α3-螺旋对应于源自拟南芥的SEQ ID NO:11所示的位置163-位置172的氨基酸序列和/或CENH3蛋白的α3-螺旋由对应于源自拟南芥的SEQ ID NO:10所示的位置487-位置516的核苷酸的核苷酸序列编码。CENH3蛋白的C-末端结构域对应于源自拟南芥的SEQ ID NO:11所示的位置173-位置178的氨基酸序列和/或CENH3蛋白的C-末端结构域由对应于源自拟南芥的SEQ ID NO:10所示的位置517-位置534的核苷酸的核苷酸序列编码。拟南芥(A.thaliana)序列仅用作参考且不将本发明限制于特定的拟南芥序列。由于高水平的保守,本领域技术人员能够在任何其他植物材料或植物物种中找到对应于所述拟南芥序列的核苷酸序列和氨基酸序列。
CENH3蛋白是H3组蛋白的变体,其是活性着丝粒的着丝点复合物的成员,即染色体上的在细胞***期间纺锤丝所附着的蛋白结构。基本上,CENH3蛋白的特征在于不形成刚性(rigid)二级结构的可变的N-末端尾部结构域,以及由通过两个环部分连接的三个α-螺旋区(称作α1-α3)组成的保守的组蛋白折叠结构域。N-末端尾部结构域主要经历通过酶的翻译后修饰。这类修饰包括甲基化、瓜氨酸化、磷酸化、SUMO化(SUMOylation)、泛素化和ADP-核糖基化,并且影响CENH3基因的调节功能。高度保守的CATD结构域(CENP-A靶向结构域)位于组蛋白折叠结构域内,其由部分α1-螺旋、完整的α2-螺旋和连接环1组成。保守的CATD结构域为伴侣蛋白装载CENH3所需要的,因此对于其着丝点定位和着丝粒功能至关重要。N-末端尾部结构域和组蛋白折叠结构域通过αN-螺旋连接。
本发明人令人惊奇地发现不仅可以通过改变保守CENH3蛋白的氨基酸序列,而且还可以通过改变CENH3基因和CENH3蛋白的任何其他结构域和结构区的氨基酸序列来获得具有产生单倍体后代能力的植物,即单倍体诱导物。此外,产生单倍体后代的能力可以通过在CENH3蛋白的不同结构域、片段或结构区中的CENH3蛋白氨基酸序列的两个或更多个改变的组合进一步增强。因此,单倍体生成的效率可以显著增加。有利地,这可以通过转基因以及非转基因方法实现。由于违反遗传改造的生物体(GMO)的规定以及增加公众对于遗传改造的生物体(GMO)或者通过GMO产生的植物特别是用于人类消费的作物的抗拒以及大量的市场授权过程(包括这种GMO的严格安全性评价)的巨额成本,优选非转基因方法。
本发明提供包含且表达CENH3蛋白的植物,其中所述植物包含多核苷酸,并且包含编码CENH3蛋白的基因的核苷酸的所述多核苷酸包含至少一个突变,所述突变在CENH3蛋白氨基酸序列的至少一个片段中引起CENH3蛋白氨基酸序列的改变,其中所述片段选自N-末端尾部结构域,最优选具有SEQ ID NO:1和SEQ ID NO:2的共有序列的N-末端尾部结构域;αN-螺旋,最优选具有SEQ ID NO:3的共有序列的αN-螺旋;α1-螺旋,最优选具有SEQ ID NO:4的共有序列的α1-螺旋;环1,最优选具有SEQ ID NO:5的共有序列的环1;α2-螺旋,最优选具有SEQ ID NO:6的共有序列的α2-螺旋;环2,最优选具有SEQ ID NO:7的共有序列的环2;α3-螺旋,最优选具有SEQ ID NO:8的共有序列的α3-螺旋;以及C-末端结构域,最优选具有SEQID NO:9的共有序列的C-末端结构域。CENH3蛋白氨基酸序列的改变可以赋予植物单倍体诱导物的生物活性。在一优选实施方案中,本发明涉及包含多核苷酸的植物,所述多核苷酸包含编码着丝粒组蛋白H3(CENH3)蛋白的核苷酸序列,其中所述多核苷酸包含至少一个突变,并且其中所述至少一个突变在CENH3蛋白氨基酸序列的至少一个片段中引起CENH3蛋白氨基酸序列的改变。所述片段可以是a)N-末端尾部结构域,其由对应于源自拟南芥的SEQ IDNO:10所示的位置1-位置246的核苷酸,对应于源自拟南芥的SEQ ID NO:11所示的位置1-位置82的氨基酸序列的核苷酸序列编码,或者由对应于源自甜菜(Beta vulgaris)的SEQ IDNO:22所示的位置1-位置177的核苷酸,对应于源自甜菜的SEQ ID NO:23所示的位置1-位置59的氨基酸序列的核苷酸序列编码,或者由对应于源自甘蓝型油菜(Brassica napus)的SEQ ID NO:13所示的位置1-位置252的核苷酸,对应于源自甘蓝型油菜的SEQ ID NO:14所示的位置1-位置84的氨基酸序列的核苷酸序列编码,或者由对应于源自玉米(Zea mays)的SEQ ID NO:19所示的位置1-位置186的核苷酸,对应于源自玉米的SEQ ID NO:20所示的位置1-位置62的氨基酸序列的核苷酸序列编码,或者由对应于源自高粱(Sorghum bicolor)的SEQ ID NO:16所示的位置1-位置186的核苷酸,对应于源自高粱的SEQ ID NO:17所示的位置1-位置62的氨基酸序列的核苷酸序列编码,或者具有SEQ ID NO:1和SEQ ID NO:2的共有序列;b)αN-螺旋,其由对应于源自拟南芥的SEQ ID NO:10所示的位置247-位置291的核苷酸,对应于源自拟南芥的SEQ ID NO:11所示的位置83-位置97的氨基酸序列的核苷酸序列编码,或者由对应于源自甜菜的SEQ ID NO:22所示的位置178-位置222的核苷酸,对应于源自甜菜的SEQ ID NO:23所示的位置60-位置74的氨基酸序列的核苷酸序列编码,或者由对应于源自甘蓝型油菜的SEQ ID NO:13所示的位置253-位置297的核苷酸,对应于源自甘蓝型油菜的SEQ ID NO:14所示的位置85-位置99的氨基酸序列的核苷酸序列编码,或者由对应于源自玉米的SEQ ID NO:19所示的位置187-位置231的核苷酸,对应于源自玉米的SEQID NO:20所示的位置63-位置77的氨基酸序列的核苷酸序列编码,或者由对应于源自高粱的SEQ ID NO:16所示的位置187-位置231的核苷酸,对应于源自高粱的SEQ ID NO:17所示的位置63-位置77的氨基酸序列的核苷酸序列编码,或者具有SEQ ID NO:3的共有序列;c)α1-螺旋,其由对应于源自拟南芥的SEQ ID NO:10所示的位置307-位置339的核苷酸,对应于源自拟南芥的SEQ ID NO:11所示的位置103-位置113的氨基酸序列的核苷酸序列编码,或者由对应于源自甜菜的SEQ ID NO:22所示的位置238-位置270的核苷酸,对应于源自甜菜的SEQ ID NO:23所示的位置80-位置90的氨基酸序列的核苷酸序列编码,或者由对应于源自甘蓝型油菜的SEQ ID NO:13所示的位置313-位置345的核苷酸,对应于源自甘蓝型油菜的SEQ ID NO:14所示的位置105-位置115的氨基酸序列的核苷酸序列编码,或者由对应于源自玉米的SEQ ID NO:19所示的位置247-位置279的核苷酸,对应于源自玉米的SEQ IDNO:20所示的位置83-位置93的氨基酸序列的核苷酸序列编码,或者由对应于源自高粱的SEQ ID NO:16所示的位置247-位置279的核苷酸,对应于源自高粱的SEQ ID NO:17所示的位置83-位置93的氨基酸序列的核苷酸序列编码,或者具有SEQ ID NO:4的共有序列;d)环1,其由对应于源自拟南芥的SEQ ID NO:10所示的位置340-位置378的核苷酸,对应于源自拟南芥SEQ ID NO:11所示的位置114-位置126的氨基酸序列的核苷酸序列编码,或者由对应于源自甜菜的SEQ ID NO:22所示的位置271-位置306的核苷酸,对应于源自甜菜的SEQID NO:23所示的位置91-位置102的氨基酸序列的核苷酸序列编码,或者由对应于源自甘蓝型油菜的SEQ ID NO:13所示的位置346-位置384的核苷酸,对应于源自甘蓝型油菜的SEQID NO:14所示的位置116-位置128的氨基酸序列的核苷酸序列编码,或者由对应于源自玉米的SEQ ID NO:19所示的位置280-位置318的核苷酸,对应于源自玉米的SEQ ID NO:20所示的位置94-位置106的氨基酸序列的核苷酸序列编码,或者由对应于源自高粱的SEQ IDNO:16所示的位置280-位置318的核苷酸,对应于源自高粱的SEQ ID NO:17所示的位置94-位置106的氨基酸序列的核苷酸序列编码,或者具有SEQ ID NO:5的共有序列;e)α2-螺旋,其由对应于源自拟南芥的SEQ ID NO:10所示的位置379-位置465的核苷酸,对应于源自拟南芥的SEQ ID NO:11所示的位置127-位置155的氨基酸序列的核苷酸序列编码,或者由对应于源自甜菜的SEQ ID NO:22所示的位置307-位置393的核苷酸,对应于源自甜菜的SEQID NO:23所示的位置103-位置131的氨基酸序列的核苷酸序列编码,或者由对应于源自甘蓝型油菜的SEQ ID NO:13所示的位置385-位置471的核苷酸,对应于源自甘蓝型油菜的SEQID NO:14所示的位置129-位置157的氨基酸序列的核苷酸序列编码,或者由对应于源自玉米的SEQ ID NO:19所示的位置319-位置405的核苷酸,对应于源自玉米的SEQ ID NO:20所示的位置107-位置135的氨基酸序列的核苷酸序列编码,或者由对应于源自高粱的SEQ IDNO:16所示的位置319-位置405的核苷酸,对应于源自高粱的SEQ ID NO:17所示的位置107-位置135的氨基酸序列的核苷酸序列编码,或者具有SEQ ID NO:6的共有序列;f)环2,其由对应于源自拟南芥的SEQ ID NO:10所示的位置466-位置486的核苷酸,对应于源自拟南芥的SEQ ID NO:11所示的位置156-位置162的氨基酸序列的核苷酸序列编码,或者由对应于源自甜菜的SEQ ID NO:22所示的位置394-位置414的核苷酸,对应于源自甜菜的SEQ IDNO:23所示的位置132-位置138的氨基酸序列的核苷酸序列编码,或者由对应于源自甘蓝型油菜的SEQ ID NO:13所示的位置472-位置492的核苷酸,对应于源自甘蓝型油菜的SEQ IDNO:14所示的位置158-位置164的氨基酸序列的核苷酸序列编码,或者由对应于源自玉米的SEQ ID NO:19所示的位置406-位置426的核苷酸,对应于源自玉米的SEQ ID NO:20所示的位置136-位置142的氨基酸序列的核苷酸序列编码,或者由对应于源自高粱的SEQ ID NO:16所示的位置406-位置426的核苷酸,对应于源自高粱的SEQ ID NO:17所示的位置136-位置142的氨基酸序列的核苷酸序列编码,或者具有SEQ ID NO:7的共有序列;g)α3-螺旋,其由对应于源自拟南芥的SEQ ID NO:10所示的位置487-位置516的核苷酸,对应于源自拟南芥的SEQ ID NO:11所示的位置163-位置172的氨基酸序列的核苷酸序列编码,或者由对应于源自甜菜的SEQ ID NO:22所示的位置415-位置444的核苷酸,对应于源自甜菜的SEQ IDNO:23所示的位置139-位置148的氨基酸序列的核苷酸序列编码,或者由对应于源自甘蓝型油菜的SEQ ID NO:13所示的位置493-位置522的核苷酸,对应于源自甘蓝型油菜的SEQ IDNO:14所示的位置165-位置174的氨基酸序列的核苷酸序列编码,或者由对应于源自玉米的SEQ ID NO:19所示的位置427-位置456的核苷酸,对应于源自玉米的SEQ ID NO:20所示的位置143-位置152的氨基酸序列的核苷酸序列编码,或者由对应于源自高粱的SEQ ID NO:16所示的位置427-位置456的核苷酸,对应于源自高粱的SEQ ID NO:17所示的位置143-位置152的氨基酸序列的核苷酸序列编码,或者具有SEQ ID NO:8的共有序列;或者h)C-末端结构域,其由对应于源自拟南芥的SEQ ID NO:10所示的位置517-位置534的核苷酸,对应于源自拟南芥的SEQ ID NO:11所示的位置173-位置178的氨基酸序列的核苷酸序列编码,或者由对应于源自甜菜的SEQ ID NO:22所示的位置445-位置462的核苷酸,对应于源自甜菜的SEQ ID NO:23所示的位置149-位置154的氨基酸序列的核苷酸序列编码,或者由对应于源自甘蓝型油菜的SEQ ID NO:13所示的位置523-位置540的核苷酸,对应于源自甘蓝型油菜的SEQ ID NO:14所示的位置175-位置180的氨基酸序列的核苷酸序列编码,或者由对应于源自玉米的SEQ ID NO:19所示的位置457-位置471的核苷酸,对应于源自玉米的SEQ IDNO:20所示的位置153-位置157的氨基酸序列的核苷酸序列编码,或者由对应于源自高粱的SEQ ID NO:16所示的位置457-位置471的核苷酸,对应于源自高粱的SEQ ID NO:17所示的位置153-位置157的氨基酸序列的核苷酸序列编码,或者具有SEQ ID NO:9的共有序列。部分的α1-螺旋、完整的环1和完整的α2-螺旋位于如上文定义的CENH3蛋白的CATD结构域内。
CENH3蛋白的非突变的N-末端尾部结构域在植物物种中是部分保守的(见图)。在本发明中,关于N-末端尾部结构域的这两个保守部分(部分A和部分B)或下述共有序列给出的任何氨基酸位置均是指以下编号***。N-末端尾部结构域的保守部分A和部分B可以通过一个或多个氨基酸分开。具体编号从植物物种到植物物种不同。在共有序列中,已引入“*”作为占位符。优选地,非突变的N-末端尾部结构域表现出表1中给出的氨基酸序列。
表1:CENH3蛋白的N-末端尾部结构域中的确定的(specified)氨基酸
更优选地,N末端尾部结构域具有SEQ ID NO:1(部分A,*之前)和SEQ ID NO:2(部分B,*之后)的共有序列,其是
如上所示,N-末端尾部结构域包含不确定的氨基酸[标记为X]和确定的氨基酸[标记为单字母代码]。除了不确定的氨基酸,“X”还可以是至少一个氨基酸的缺口。
CENH3蛋白的非突变的αN-螺旋在植物物种中是高度保守的,其长度为15个氨基酸,从位置1开始并且在位置15结束。在本发明中,关于αN-螺旋或下述SEQ ID NO:3的共有序列给出的任何氨基酸位置均是指这个编号***。优选地,非突变的αN-螺旋表现出表2中给出的氨基酸序列。
表2:CENH3蛋白的αN-螺旋中的确定的氨基酸
αN-螺旋内的位置 氨基酸
1 G
2 T
3 V
4 A
5 L
6 K、W或R
7 E或Q
8 I
9 R
10 X
11 F、Y或L
12 Q或R
13 K
14 Q、S或T
15 T、F、W、V、C或A
更优选地,αN-螺旋具有SEQ ID NO:3的共有序列,其是
如上所示,αN-螺旋包含不确定的氨基酸[标记为X]和确定的氨基酸[标记为单字母代码]。
CENH3蛋白的非突变的α1-螺旋在植物物种中是保守的,其长度为11个氨基酸,从位置1开始并且在位置11结束。在本发明中,关于α1-螺旋或下述SEQ ID NO:4的共有序列给出的任何氨基酸位置均是指这个编号***。优选地,非突变的α1-螺旋表现出表3中给出的氨基酸序列。
表3:CENH3蛋白的α1-螺旋中的确定的氨基酸
更优选地,α1-螺旋具有SEQ ID NO:4的共有序列,其是
如上所示,α1-螺旋包含确定的氨基酸[标记为单字母代码]。
CENH3蛋白的非突变的环1在植物物种中是高度保守的,其长度为13个氨基酸,从位置1开始并且在位置13结束。在本发明中,关于环1或下述SEQ ID NO:5的共有序列给出的任何氨基酸位置均是指这个编号***。优选地,非突变的环1表现出表4中给出的氨基酸序列。
表4:CENH3蛋白的环1中的确定的氨基酸
更优选地,环1具有SEQ ID NO:5的共有序列,其是
如上所示,环1包含不确定的氨基酸[标记为X]和确定的氨基酸[标记为单字母代码]。
CENH3蛋白的非突变的α2-螺旋在植物物种中是高度保守的,其长度为29个氨基酸,从位置1开始并且在位置29结束。在本发明中,关于α2-螺旋或下述SEQ ID NO:6的共有序列给出的任何氨基酸位置均是指这个编号***。优选地,非突变的α2-螺旋表现出表5中给出的氨基酸序列。
表5:CENH3蛋白的α2-螺旋中的确定的氨基酸
更优选地,α2-螺旋具有SEQ ID NO:6的共有序列,其是
如上所示,α2-螺旋包含确定的氨基酸[标记为单字母代码]。
CENH3蛋白的非突变的环2在植物物种中是高度保守的,其长度为7个氨基酸,从位置1开始并且在位置7结束。在本发明中,关于环2或下述SEQ ID NO:7的共有序列给出的任何氨基酸位置均是指这个编号***。优选地,非突变的环2表现出表6中给出的氨基酸序列。
表6:CENH3蛋白的环2中的确定的氨基酸
环2内的位置 氨基酸
1 R、K或H
2 R
3 V或I
4 T
5 L、I或V
6 M或L
7 R、K、Q、L或T
更优选地,环2具有SEQ ID NO:7的共有序列,其是
如上所示,环2包含确定的氨基酸[标记为单字母代码]。
CENH3蛋白的非突变的α3-螺旋在植物物种中是高度保守的,其长度为10个氨基酸,从位置1开始并且在位置10结束。在本发明中,关于α3-螺旋或下述SEQ ID NO:8的共有序列给出的任何氨基酸位置均是指这个编号***。优选地,非突变的α3-螺旋表现出表7中给出的氨基酸序列。
表7:CENH3蛋白的α3-螺旋中的确定的氨基酸
更优选地,α3-螺旋具有SEQ ID NO:8的共有序列,其是
如上所示,α3-螺旋包含确定的氨基酸[标记为单字母代码]。
CENH3蛋白的非突变的C-末端结构域的长度是变化的。在众多植物物种的考虑下(见下文),我们鉴定了长达7个氨基酸的长度。在本发明中,关于C-末端结构域或下述SEQID NO:9的共有序列给出的任何氨基酸位置均是指这个编号***。优选地,非突变的C-末端结构域表现出表8中给出的氨基酸序列。
表8:CENH3蛋白的C-末端结构域中的确定的氨基酸
C-末端结构域内的位置 氨基酸
1 G、K、A、S或T
2 K、R、I或A
3 G、E或A
4 R、Q或V
5 P、G、I、Q、L、S或H
6 W、L、F或V
7 X
更优选地,C-末端结构域具有SEQ ID NO:9的共有序列,其是
如上所示,C-末端结构域包含确定的氨基酸[标记为单字母代码]。
根据本发明的一个优选实施方案,引起表1或者SEQ ID NO:1或2、或者表2或SEQID NO:3、或者表3或SEQ ID NO:4、或者表4或SEQ ID NO:5、或者表5或SEQ ID NO:6、或者表6或SEQ ID NO:7、或者表7或SEQ ID NO:8、或者表8或SEQ ID NO:9中定义的任何不确定或确定的氨基酸改变(优选所述氨基酸的取代或缺失)的突变,可以产生具有产生单倍体后代能力的期望植物。
表1或者SEQ ID NO:1或2、或者表2或SEQ ID NO:3、或者表3或SEQ ID NO:4、或者表4或SEQ ID NO:5、或者表5或SEQ ID NO:6、或者表6或SEQ ID NO:7、或者表7或SEQ IDNO:8、或者表8或SEQ ID NO:9中给出的不确定的氨基酸是这样的氨基酸,虽然其在一组特定的植物物种中、在特定的植物属中或在一特定的植物物种中是确定的,但是在更大范围的植物物种中不是保守的。因此,SEQ ID NO:1、2、3、4、5、6、7、8或9或者表1、表2、表3、表4、表5、表6、表7或表8中给出的不确定的氨基酸在一组特定的植物物种中、在特定的植物属中或在一特定的植物物种中是明确限定的特定的氨基酸,然而在另一植物物种中的相同位置可能未发现。因此,SEQ ID NO:1或表1所示的不确定的氨基酸的氨基酸取代是指在植物中、即在特定植物物种中,该特定的但不保守的氨基酸被另一氨基酸取代,所述另一氨基酸与在这组特定的植物物种、在这个特定的植物属或在这个特定的植物物种中在所述植物物种的内源性编码的天然CENH3蛋白中在该位置天然存在的氨基酸不同。此外,不确定的氨基酸以及确定的氨基酸可以是蛋白折叠过程或蛋白稳定性必需的氨基酸。这种氨基酸的改变可以导致具有削弱的稳定性或不正确折叠的突变体CENH3。
表1、表2、表3、表4、表5、表6、表7或表8中给出的确定的氨基酸,特别是SEQ ID NO:1、2、3、4、5、6、7、8或9的确定的氨基酸是在广泛的植物物种中存在的那些氨基酸,优选如下文列出的那些,因此其是非常保守的。
在一优选实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8和9的共有序列编译自来源于选自以下组的物种的蛋白片段的序列:大麦(Hordeum vulgare)、Hordeum bulbusom、高粱、甘蔗(Saccharum officinarium)、玉米、小米(Setaria italica)、小粒野生稻(Oryzaminuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryzaalta)、小麦(Triticum aestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、Hordeum marinum、山羊草(Aegilops tauschii)、Daucus glochidiatus、甜菜、Daucus pusillus、Daucus muricatus、胡萝卜(Daucuscarota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛烟草(Nicotiana tomentosiformis)、烟草(Nicotiana tabacum)、番茄(Solanumlycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitisvinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morusnotabilis)、Arabidopsis arenosa、深山南芥(Arabidopsis lyrata)、拟南芥、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursapastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassicajuncea)、黒芥菜(Brassica nigra)、芝麻菜苜蓿亚种(Eruca vesicaria subsp.sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicerarietinum)、野生鹰嘴豆(Cicer reticulatum)、Cicer judaicum、Cajanus cajanifolius、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、蒜(Allium sativum)和韭菜(Alliumtuberosum)。
在一特别优选的实施方案中,所述至少一个突变引起表1、表2、表3、表4、表5、表6、表7或表8中定义的确定的氨基酸的取代。因此,本发明的植物包含表1、表2、表3、表4、表5、表6、表7或表8中定义的确定的氨基酸(即在表1、表2、表3、表4、表5、表6、表7或表8中保守及命名的那些氨基酸)的至少一个取代。表1中定义的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在部分A的位置1的甲硫氨酸,
b)在部分A的位置2的丙氨酸,
c)在部分A的位置3的精氨酸,
d)在部分A的位置4的苏氨酸、缬氨酸、异亮氨酸或丙氨酸,
e)在部分A的位置5的赖氨酸或精氨酸,
f)在部分A的位置6的组氨酸、苏氨酸、谷氨酰胺或赖氨酸,
g)在部分A的位置9的缬氨酸、丙氨酸、脯氨酸、甘氨酸、天冬酰胺、脯氨酸、精氨酸、丝氨酸或组氨酸,
h)在部分A的位置10的苏氨酸、精氨酸、丝氨酸、亮氨酸、赖氨酸、组氨酸、天冬酰胺、丙氨酸或脯氨酸,
i)在部分A的位置11的精氨酸、赖氨酸、丙氨酸、天冬酰胺或苏氨酸,
j)在部分A的位置12的丝氨酸、丙氨酸、苏氨酸、亮氨酸、赖氨酸、精氨酸、天冬氨酸、天冬酰胺或谷氨酸,
k)在部分A的位置13的谷氨酰胺、苏氨酸、精氨酸、丙氨酸、脯氨酸、丝氨酸、甘氨酸、天冬酰胺、缬氨酸、赖氨酸或精氨酸,
l)在部分A的位置14的脯氨酸、苏氨酸、天冬氨酸、谷氨酸、谷氨酰胺、丝氨酸、天冬酰胺、甘氨酸、丙氨酸、赖氨酸、精氨酸,以及
m)在部分A的位置15的精氨酸、天冬酰胺、组氨酸、缬氨酸、甘氨酸、赖氨酸、丝氨酸、丙氨酸、苏氨酸、谷氨酸、脯氨酸,
n)在部分B的位置1的精氨酸、天冬氨酸、赖氨酸、缬氨酸、甘氨酸、脯氨酸、丝氨酸、谷氨酰胺、苏氨酸或丙氨酸,
o)在部分B的位置2的甘氨酸、丙氨酸、丝氨酸、赖氨酸、精氨酸、缬氨酸、苏氨酸、脯氨酸或谷氨酰胺,
p)在部分B的位置3的丝氨酸、苏氨酸、赖氨酸、缬氨酸、精氨酸、谷氨酰胺、丙氨酸、谷氨酸、甘氨酸、脯氨酸和天冬氨酸,
q)在部分B的位置4的谷氨酰胺、脯氨酸、天冬酰胺、苏氨酸、谷氨酸、赖氨酸、甘氨酸、丝氨酸、精氨酸、丙氨酸或天冬氨酸,
r)在部分B的位置5的赖氨酸、谷氨酰胺、脯氨酸、甘氨酸、天冬酰胺、苏氨酸、组氨酸或精氨酸,
s)在部分B的位置7的赖氨酸、精氨酸、谷氨酰胺或组氨酸,
t)在部分B的位置8的赖氨酸、谷氨酰胺或精氨酸,
u)在部分B的位置9的丝氨酸、丙氨酸、苏氨酸、赖氨酸、脯氨酸或精氨酸,
v)在部分B的位置10的酪氨酸、苯丙氨酸、组氨酸、苏氨酸、赖氨酸、精氨酸、苯丙氨酸或谷氨酰胺,
w)在部分B的位置11的精氨酸,
x)在部分B的位置12的酪氨酸、精氨酸、色氨酸、苯丙氨酸、亮氨酸、天冬酰胺或丝氨酸,
y)在部分B的位置13的精氨酸或赖氨酸,
z)在部分B的位置14的脯氨酸、丙氨酸或丝氨酸。
表2中定义的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的甘氨酸,
b)在位置2的苏氨酸,
c)在位置3的缬氨酸,
d)在位置4的丙氨酸,
e)在位置5的亮氨酸,
f)在位置6的赖氨酸、色氨酸或精氨酸,
g)在位置7的谷氨酸或谷氨酰胺,
h)在位置8的异亮氨酸,
i)在位置9的精氨酸,
j)在位置11的苯丙氨酸、酪氨酸或亮氨酸,
k)在位置12的谷氨酰胺或精氨酸,
l)在位置13的赖氨酸,
m)在位置14的谷氨酰胺、丝氨酸或苏氨酸,以及
n)在位置15的苏氨酸、苯丙氨酸、色氨酸、缬氨酸、半胱氨酸或丙氨酸。
表3中定义的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的丙氨酸、苯丙氨酸、精氨酸或丝氨酸,
b)在位置2的丙氨酸、甲硫氨酸或丝氨酸,
c)在位置3的丝氨酸、脯氨酸、苏氨酸、丙氨酸或半胱氨酸,
d)在位置4的苯丙氨酸,
e)在位置5的异亮氨酸、缬氨酸、甲硫氨酸、亮氨酸、丝氨酸或丙氨酸,
f)在位置6的精氨酸,
g)在位置7的谷氨酸、苏氨酸、缬氨酸、亮氨酸、半胱氨酸、谷氨酰胺或丙氨酸,
h)在位置8的缬氨酸或异亮氨酸,
i)在位置9的精氨酸或赖氨酸,
j)在位置10的丝氨酸、谷氨酸、甲硫氨酸、苏氨酸、谷氨酸、谷氨酰胺、甘氨酸或天冬氨酸,以及
k)在位置11的异亮氨酸、缬氨酸、亮氨酸或苏氨酸。
表4中定义的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的苏氨酸、丝氨酸或丙氨酸,
b)在位置2的组氨酸、谷氨酰胺、天冬酰胺、丙氨酸、酪氨酸、苯丙氨酸、甘氨酸、天冬氨酸或谷氨酸,
c)在位置3的甲硫氨酸、谷氨酰胺、异亮氨酸、苯丙氨酸、酪氨酸、丙氨酸、谷氨酸、天冬酰胺、精氨酸、亮氨酸、组氨酸或甘氨酸,
d)在位置4的亮氨酸、苯丙氨酸、缬氨酸、异亮氨酸或酪氨酸,
e)在位置5的丙氨酸、苏氨酸、丝氨酸、半胱氨酸或甲硫氨酸,
f)在位置6的脯氨酸、天冬酰胺、天冬氨酸、精氨酸、丙氨酸、苏氨酸、苯丙氨酸、精氨酸、组氨酸、丝氨酸或赖氨酸,
g)在位置8的谷氨酰胺、酪氨酸、天冬氨酸、赖氨酸、精氨酸、谷氨酸、甘氨酸、丝氨酸、脯氨酸、组氨酸、天冬酰胺或丙氨酸,
h)在位置9的异亮氨酸、缬氨酸或脯氨酸,
i)在位置10的天冬酰胺、甘氨酸、苏氨酸、谷氨酸或丝氨酸,
j)在位置11的精氨酸或脯氨酸,
k)在位置12的色氨酸或酪氨酸,以及
l)在位置13的苏氨酸、谷氨酰胺或丝氨酸。
表5中定义的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的丙氨酸、脯氨酸、缬氨酸或亮氨酸,
b)在位置2的谷氨酸、天冬氨酸、谷氨酰胺、组氨酸或亮氨酸,
c)在位置3的丙氨酸,
d)在位置4的亮氨酸或缬氨酸,
e)在位置5的缬氨酸、亮氨酸、甲硫氨酸、异亮氨酸、精氨酸、酪氨酸或苏氨酸,
f)在位置6的丝氨酸或丙氨酸,
g)在位置7的异亮氨酸或亮氨酸,
h)在位置8的谷氨酰胺,
i)在位置9的谷氨酸,
j)在位置10的丙氨酸或丝氨酸,
k)在位置11的丙氨酸或苏氨酸,
l)在位置12的谷氨酸,
m)在位置13的天冬氨酸、天冬酰胺、苯丙氨酸、异亮氨酸或酪氨酸,
n)在位置14的酪氨酸、苯丙氨酸或组氨酸,
o)在位置15的亮氨酸、异亮氨酸或缬氨酸,
p)在位置16的缬氨酸或异亮氨酸,
q)在位置17的甘氨酸、精氨酸、谷氨酸、组氨酸、天冬酰胺、苏氨酸、谷氨酸、天冬氨酸或谷氨酰胺,
r)在位置18的亮氨酸、甲硫氨酸或异亮氨酸,
s)在位置19的苯丙氨酸、甲硫氨酸或亮氨酸,
t)在位置20的丝氨酸、谷氨酸、天冬氨酸或甘氨酸,
u)在位置21的天冬氨酸、甲硫氨酸、缬氨酸、天冬酰胺、谷氨酸、丙氨酸、精氨酸、赖氨酸,
v)在位置22的丝氨酸、甘氨酸、丙氨酸或苏氨酸,
w)在位置23的甲硫氨酸、色氨酸、天冬酰胺或组氨酸,
x)在位置24的亮氨酸或组氨酸,
y)在位置25的半胱氨酸或亮氨酸,
z)在位置26的丙氨酸或苏氨酸,
aa)在位置27的亮氨酸或异亮氨酸,
bb)在位置28的组氨酸,以及
cc)在位置29的丙氨酸或丝氨酸。
表6中定义的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的精氨酸、赖氨酸或组氨酸,
b)在位置2的精氨酸,
c)在位置3的缬氨酸或异亮氨酸,
d)在位置4的苏氨酸,
e)在位置5的亮氨酸、异亮氨酸或缬氨酸,
f)在位置6的甲硫氨酸或亮氨酸,以及
g)在位置7的精氨酸、赖氨酸、谷氨酰胺、亮氨酸或苏氨酸。
表7中定义的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的赖氨酸或精氨酸,
b)在位置2的天冬氨酸,
c)在位置3的苯丙氨酸、亮氨酸、异亮氨酸、甲硫氨酸或色氨酸,
d)在位置4的谷氨酸、谷氨酰胺或精氨酸,
e)在位置5的亮氨酸,
f)在位置6的丙氨酸或苏氨酸,
g)在位置7的精氨酸,
h)在位置8的精氨酸,
i)在位置9的亮氨酸或异亮氨酸,以及
j)在位置10的甘氨酸、精氨酸或苏氨酸。
表8中定义的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的甘氨酸、赖氨酸、丙氨酸、丝氨酸或苏氨酸,
b)在位置2的赖氨酸、精氨酸、异亮氨酸或丙氨酸,
c)在位置3的甘氨酸、谷氨酸或丙氨酸,
d)在位置4的精氨酸、谷氨酰胺或缬氨酸,
e)在位置5的脯氨酸、甘氨酸、异亮氨酸、谷氨酰胺、亮氨酸、丝氨酸或组氨酸,以及
f)在位置6的色氨酸、亮氨酸、苯丙氨酸或缬氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:1的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:1的确定的氨基酸(即在SEQ ID NO:1的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:1的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的甲硫氨酸,
b)在位置2的丙氨酸,
c)在位置3的精氨酸,
d)在位置4的苏氨酸,
e)在位置5的赖氨酸,
f)在位置6的组氨酸,
g)在位置9的丙氨酸,
h)在位置10的精氨酸,
i)在位置11的精氨酸,
j)在位置12的丝氨酸,
k)在位置13的精氨酸,
l)在位置14的赖氨酸,以及
m)在位置15的精氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:2的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:2的确定的氨基酸(即在SEQ ID NO:2的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:2的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的谷氨酰胺,
b)在位置2的丝氨酸,
c)在位置3的谷氨酰胺,
d)在位置4的苏氨酸,
e)在位置5的谷氨酰胺,
f)在位置7的赖氨酸,
g)在位置8的赖氨酸,
h)在位置9的赖氨酸,
i)在位置10的组氨酸,
j)在位置11的精氨酸,
k)在位置12的酪氨酸,
l)在位置13的精氨酸,以及
m)在位置14的脯氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:3的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:3的确定的氨基酸(即在SEQ ID NO:3的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:3的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的甘氨酸,
b)在位置2的苏氨酸,
c)在位置3的缬氨酸,
d)在位置4的丙氨酸,
e)在位置5的亮氨酸,
f)在位置6的精氨酸,
g)在位置7的谷氨酸,
h)在位置8的异亮氨酸,
i)在位置9的精氨酸,
j)在位置11的苯丙氨酸,
k)在位置12的谷氨酰胺或精氨酸,
l)在位置13的赖氨酸,
m)在位置14的苏氨酸,以及
n)在位置15的苏氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:4的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:4的确定的氨基酸(即在SEQ ID NO:4的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:4的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的丙氨酸,
b)在位置2的丙氨酸,
c)在位置3的脯氨酸,
d)在位置4的苯丙氨酸,
e)在位置5的异亮氨酸,
f)在位置6的精氨酸,
g)在位置7的亮氨酸,
h)在位置8的缬氨酸,
i)在位置9的精氨酸,
j)在位置10的谷氨酸,以及
k)在位置11的异亮氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:5的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:5的确定的氨基酸(即在SEQ ID NO:5的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:5的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的苏氨酸,
b)在位置2的天冬酰胺,
c)在位置3的苯丙氨酸,
d)在位置4的亮氨酸,
e)在位置5的丙氨酸,
f)在位置6的脯氨酸,
g)在位置8的谷氨酸,
h)在位置9的缬氨酸,
i)在位置10的苏氨酸,
j)在位置11的精氨酸,
k)在位置12的色氨酸,以及
l)在位置13的苏氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:6的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:6的确定的氨基酸(即在SEQ ID NO:6的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:6的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的丙氨酸,
b)在位置2的谷氨酸,
c)在位置3的丙氨酸,
d)在位置4的亮氨酸,
e)在位置5的亮氨酸,
f)在位置6的丙氨酸,
g)在位置7的亮氨酸,
h)在位置8的谷氨酰胺,
i)在位置9的谷氨酸,
j)在位置10的丙氨酸,
k)在位置11的丙氨酸,
l)在位置12的谷氨酸,
m)在位置13的天冬氨酸,
n)在位置14的苯丙氨酸,
o)在位置15的亮氨酸,
p)在位置16的缬氨酸,
q)在位置17的组氨酸,
r)在位置18的亮氨酸,
s)在位置19的苯丙氨酸,
t)在位置20的谷氨酸,
u)在位置21的天冬氨酸,
v)在位置22的丙氨酸,
w)在位置23的甲硫氨酸,
x)在位置24的亮氨酸,
y)在位置25的半胱氨酸,
z)在位置26的丙氨酸,
aa)在位置27的异亮氨酸,
bb)在位置28的组氨酸,以及
cc)在位置29的丙氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:7的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:7的确定的氨基酸(即在SEQ ID NO:7的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:7的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的赖氨酸,
b)在位置2的精氨酸,
c)在位置3的缬氨酸,
d)在位置4的苏氨酸,
e)在位置5的亮氨酸,
f)在位置6的甲硫氨酸,以及
g)在位置7的赖氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:8的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:8的确定的氨基酸(即在SEQ ID NO:8的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:8的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的赖氨酸,
b)在位置2的天冬氨酸,
c)在位置3的苯丙氨酸,
d)在位置4的谷氨酸,
e)在位置5的亮氨酸,
f)在位置6的丙氨酸,
g)在位置7的精氨酸,
h)在位置8的精氨酸,
i)在位置9的亮氨酸,以及
j)在位置10的甘氨酸。
在一特别优选的实施方案中,所述至少一个突变引起SEQ ID NO:9的确定的氨基酸的取代。因此,本发明的植物包含SEQ ID NO:9的确定的氨基酸(即在SEQ ID NO:9的共有序列中高度保守及命名的那些氨基酸)的至少一个取代。SEQ ID NO:9的确定的氨基酸的取代应当表示选自以下组的氨基酸的取代:
a)在位置1的甘氨酸,
b)在位置2的赖氨酸,
c)在位置3的甘氨酸,
d)在位置4的精氨酸,
e)在位置5的脯氨酸,以及
f)在位置6的色氨酸。
在进一步特别优选的实施方案中,所述至少一个突变引起N-末端尾部结构域中确定的氨基酸的取代,其中在SEQ ID NO:1的位置3的氨基酸精氨酸被取代,优选取代为赖氨酸,或者在SEQ ID NO:23的位置2的氨基酸精氨酸被取代,优选取代为赖氨酸,或者在SEQID NO:1的位置10的氨基酸精氨酸被取代,优选取代为苯丙氨酸,或者在SEQ ID NO:14的位置9的氨基酸丝氨酸被取代,优选取代为苯丙氨酸,或者在SEQ ID NO:14的位置16的氨基酸精氨酸被取代,优选取代为谷氨酰胺,或者在SEQ ID NO:14的位置24的氨基酸丝氨酸被取代,优选取代为亮氨酸,或者在SEQ ID NO:14的位置24的氨基酸丝氨酸被取代,优选取代为亮氨酸,或者在SEQ ID NO:17的位置25的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者在SEQ ID NO:14的位置29的氨基酸谷氨酸被取代,优选取代为赖氨酸,或者在SEQ ID NO:14的位置30的氨基酸甘氨酸被取代,优选取代为天冬氨酸,或者在SEQ ID NO:14的位置33或在SEQ ID NO:20的位置32的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者在SEQ ID NO:14的位置35的氨基酸脯氨酸被取代,优选取代为亮氨酸,或者在SEQ ID NO:20的位置35的氨基酸谷氨酸被取代,优选取代为赖氨酸,或者在SEQ ID NO:14的位置41的氨基酸丝氨酸被取代,优选取代为天冬酰胺,或者在SEQ ID NO:14的位置43的氨基酸甘氨酸被取代,优选取代为谷氨酸,或者在SEQ ID NO:14的位置50的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者在SEQ ID NO:14的位置55的氨基酸脯氨酸被取代,优选取代为亮氨酸,或者在SEQ IDNO:14的位置57的氨基酸甘氨酸被取代,优选取代为天冬氨酸,或者在SEQ ID NO:14的位置61的氨基酸甘氨酸被取代,优选取代为谷氨酸,或者在SEQ ID NO:14的位置65的氨基酸精氨酸被取代,优选取代为谷氨酰胺,或者在SEQ ID NO:14的位置65的氨基酸精氨酸被取代,优选取代为终止信号,或者在SEQ ID NO:14的位置71的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者在SEQ ID NO:23的位置46的氨基酸天冬氨酸被取代,优选取代为天冬酰胺或甘氨酸,或者在SEQ ID NO:2的位置7的氨基酸赖氨酸被取代,优选取代为丝氨酸,或者在SEQ ID NO:20的位置56的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者在SEQ ID NO:2的位置14的氨基酸脯氨酸被取代,优选取代为缬氨酸,或者在SEQ ID NO:17的位置62的氨基酸丙氨酸被取代,优选取代为缬氨酸。
在进一步特别优选的实施方案中,所述至少一个突变引起αN-螺旋中确定的氨基酸的取代,其中在SEQ ID NO:3的位置2的氨基酸苏氨酸被取代,优选取代为丝氨酸,或者在SEQ ID NO:17的位置64的氨基酸苏氨酸被取代,优选取代为丝氨酸。
在进一步特别优选的实施方案中,所述至少一个突变引起α1-螺旋中确定的氨基酸的取代,其中在SEQ ID NO:4的位置1的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者在SEQ ID NO:14的位置105的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者在SEQ ID NO:4的位置6的氨基酸精氨酸被取代,优选取代为谷氨酰胺,或者在SEQ ID NO:14的位置110的氨基酸精氨酸被取代,优选取代为谷氨酰胺,或者在SEQ ID NO:20的位置89的氨基酸缬氨酸被取代,优选取代为甲硫氨酸,或者在SEQ ID NO:4的位置10的氨基酸谷氨酸被取代,优选取代为天冬酰胺,或者在SEQ ID NO:14的位置114的氨基酸丝氨酸被取代,优选取代为天冬酰胺。
在进一步特别优选的实施方案中,所述至少一个突变引起环1中确定的氨基酸的取代,其中在SEQ ID NO:5的位置2的氨基酸天冬酰胺被取代,优选取代为缬氨酸,或者在SEQ ID NO:17的位置95的氨基酸丙氨酸被取代,优选取代为缬氨酸,或者在SEQ ID NO:5的位置6的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者在SEQ ID NO:14的位置121的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者在SEQ ID NO:5的位置12的氨基酸色氨酸被取代,优选取代为终止信号,或者在SEQ ID NO:14的位置127的氨基酸色氨酸被取代,优选取代为终止信号。
在进一步特别优选的实施方案中,所述至少一个突变引起α2-螺旋中确定的氨基酸的取代,其中在SEQ ID NO:6的位置1的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者在SEQ ID NO:20的位置107的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者在SEQ ID NO:6的位置4的氨基酸亮氨酸被取代,优选取代为苯丙氨酸或谷氨酰胺,或者在SEQ ID NO:14的位置132或在SEQ ID NO:23的位置106的氨基酸亮氨酸被取代,优选取代为苯丙氨酸或谷氨酰胺,或者在SEQ ID NO:6的位置7的氨基酸亮氨酸被取代,优选取代为脯氨酸,或者在SEQID NO:23的位置109的氨基酸亮氨酸被取代,优选取代为脯氨酸,或者在SEQ ID NO:6的位置8的氨基酸谷氨酰胺被取代,优选取代为终止信号或亮氨酸,或者在SEQ ID NO:20的位置114或在SEQ ID NO:23的位置110的氨基酸谷氨酰胺被取代,优选取代为终止信号或亮氨酸,或者在SEQ ID NO:6的位置10的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者在SEQID NO:14的位置138的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者在SEQ ID NO:6的位置25的氨基酸半胱氨酸被取代,优选取代为酪氨酸,或者在SEQ ID NO:14的位置153的氨基酸半胱氨酸被取代,优选取代为酪氨酸,或者在SEQ ID NO:6的位置26的氨基酸丙氨酸被取代,优选取代为缬氨酸,或者在SEQ ID NO:14的位置154的氨基酸丙氨酸被取代,优选取代为缬氨酸。
在进一步特别优选的实施方案中,所述至少一个突变引起环2中确定的氨基酸的取代,其中在SEQ ID NO:7的位置2的氨基酸精氨酸被取代,优选取代为组氨酸,或者在SEQID NO:14的位置159的氨基酸精氨酸被取代,优选取代为组氨酸,或者在SEQ ID NO:7的位置3的氨基酸缬氨酸被取代,优选取代为异亮氨酸,或者在SEQ ID NO:14的位置160的氨基酸缬氨酸被取代,优选取代为异亮氨酸,或者在SEQ ID NO:7的位置4的氨基酸苏氨酸被取代,优选取代为异亮氨酸,或者在SEQ ID NO:20的位置139的氨基酸苏氨酸被取代,优选取代为异亮氨酸。
在进一步特别优选的实施方案中,所述至少一个突变引起α3-螺旋中确定的氨基酸的取代,其中在SEQ ID NO:8的位置2的氨基酸天冬氨酸被取代,优选取代为天冬酰胺,或者在SEQ ID NO:14的位置166的氨基酸天冬氨酸被取代,优选取代为天冬酰胺,或者在SEQID NO:8的位置4的氨基酸谷氨酸被取代,优选取代为赖氨酸,或者在SEQ ID NO:14的位置168的氨基酸谷氨酸被取代,优选取代为赖氨酸,或者在SEQ ID NO:8的位置8的氨基酸精氨酸被取代,优选取代为组氨酸,或者在SEQ ID NO:14的位置172的氨基酸精氨酸被取代,优选取代为组氨酸,或者在SEQ ID NO:8的位置9的氨基酸亮氨酸被取代,优选取代为苯丙氨酸,或者在SEQ ID NO:14的位置173的氨基酸亮氨酸被取代,优选取代为苯丙氨酸,或者在SEQ ID NO:8的位置10的氨基酸甘氨酸被取代,优选取代为谷氨酸,或者在SEQ ID NO:14的位置174或在SEQ ID NO:20的位置152的氨基酸甘氨酸被取代,优选取代为谷氨酸。
在进一步特别优选的实施方案中,所述至少一个突变引起C-末端结构域中确定的氨基酸的取代,其中在SEQ ID NO:9的位置3的氨基酸甘氨酸被取代,优选取代为组氨酸,或者在SEQ ID NO:20的位置155的氨基酸精氨酸被取代,优选取代为组氨酸,或者在SEQ IDNO:9的位置4的氨基酸精氨酸被取代,优选取代为赖氨酸,或者在SEQ ID NO:14的位置178的氨基酸精氨酸被取代,优选取代为赖氨酸,或者在SEQ ID NO:17的位置157的氨基酸丝氨酸被取代,优选取代为亮氨酸。
在一可选的优选实施方案中,所述至少一个突变位于编码CENH3蛋白的基因组核苷酸序列的剪接位点中和/或所述至少一个突变在外显子内产生新的剪接位点。优选地,对于这样的突变是杂合的植物是能够存活的。这样的突变可以引起功能障碍的剪接位点(剪接错误),然后其导致非完全功能CENH3蛋白的细胞翻译产生增加,所述非完全功能CENH3蛋白与完全功能野生型CENH3蛋白相比表现出例如稳定性受损,对DNA的结合亲和力减少,蛋白的几何形状改变(优选二级或三级结构改变),或者混乱的蛋白折叠。
在一特别优选的实施方案中,所述至少一个突变引起剪接错误,优选在SEQ IDNO:12的内含子1中,导致在SEQ ID NO:14的位置18的氨基酸之后的甘蓝型油菜CENH3蛋白的氨基酸序列改变;剪接错误,优选在SEQ ID NO:12的内含子2中,导致在SEQ ID NO:14的位置33的氨基酸之后的甘蓝型油菜CENH3蛋白的氨基酸序列改变;剪接错误,优选在SEQ IDNO:12的外显子3中,导致在SEQ ID NO:14的位置37的氨基酸之后的甘蓝型油菜CENH3蛋白的氨基酸序列改变;或者剪接错误,优选在SEQ ID NO:12的内含子8中,导致在SEQ ID NO:14的位置163的氨基酸之后的甘蓝型油菜CENH3蛋白的氨基酸序列改变;或者所述至少一个突变引起剪接错误,优选在SEQ ID NO:18的内含子4中,导致在SEQ ID NO:20的位置89的氨基酸之后的玉米CENH3蛋白的氨基酸序列改变;剪接错误,优选在SEQ ID NO:18的内含子5中,导致在SEQ ID NO:20的位置115的氨基酸之后的玉米CENH3蛋白的氨基酸序列改变;或者剪接错误,优选在SEQ ID NO:18的内含子6中,导致在SEQ ID NO:20的位置141的氨基酸之后的玉米CENH3蛋白的氨基酸序列改变;或者所述至少一个突变引起剪接错误,优选在SEQ ID NO:15的内含子1中,导致在SEQ ID NO:17的位置26的氨基酸之后的高粱CENH3蛋白的氨基酸序列改变。
在一额外可选的优选实施方案中,所述至少一个突变引起CENH3蛋白的氨基酸序列改变并且所述改变赋予单倍体诱导物的生物活性,其中所述改变是一个或多个氨基酸的***或缺失。***可以例如通过转座子诱变引入,并且缺失可以例如通过基因组工程化产生。***和缺失可以发生在编码上述片段之一的任何核苷酸序列中,在内含子的核苷酸序列中或者在CENH3基因的5’非翻译区(UTR)或3’UTR的核苷酸序列中,其中5’UTR位于编码N末端尾部结构域的核苷酸序列的上游,而3’UTR位于编码C-末端结构域的核苷酸序列的下游。在任何情况下,***或缺失引起CENH3蛋白的氨基酸序列改变,并且所述改变赋予单倍体诱导物的生物活性。***可以具有至少1个核苷酸、至少2个核苷酸、至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少12个核苷酸、至少14个核苷酸、至少16个核苷酸、至少18个核苷酸、至少20个核苷酸、至少25个核苷酸、至少30个核苷酸、至少40个核苷酸、至少50个核苷酸、至少75个核苷酸、至少100个核苷酸、至少200个核苷酸、至少300个核苷酸或至少500个核苷酸的长度。
在本发明的上下文中,术语“至少一个突变”优选是指一个突变,特别是仅一个突变。在进一步优选的实施方案中,术语“至少一个突变”是指两个突变,特别是仅两个突变。在进一步优选的实施方案中,术语“至少一个突变”是指三个突变,特别是仅三个突变。在进一步优选的实施方案中,术语“至少一个突变”是指四个突变,特别是仅四个突变。在进一步优选的实施方案中,术语“至少一个突变”是指五个突变,特别是仅五个突变。在多于一个突变的情况下,突变还可以发生在不同的多核苷酸中,导致不同CENH3蛋白(如果对于特定的植物物种存在的话)的氨基酸序列改变。例如,大麦具有两个不同的CENH3蛋白。
在本发明的一优选实施方案中,所述至少一个突变是至少一个突变、至少两个突变、至少三个突变、至少四个突变或至少五个突变。
在进一步优选的实施方案中,在CENH3蛋白的一个片段中,存在一个氨基酸取代,特别是仅一个氨基酸取代。
在进一步优选的实施方案中,在CENH3蛋白的一个片段中,存在两个氨基酸取代,特别是仅两个氨基酸取代。
在进一步优选的实施方案中,在CENH3蛋白的一个片段中,存在三个氨基酸取代,特别是仅三个氨基酸取代。
在进一步优选的实施方案中,在CENH3蛋白的一个片段中,存在四个氨基酸取代,特别是仅四个氨基酸取代。
在进一步优选的实施方案中,在CENH3蛋白的一个片段中,存在五个氨基酸取代,特别是仅五个氨基酸取代。
在本发明的一优选实施方案中,在CENH3蛋白的一个片段中,存在1个、1个或2个、1-3个、1-4个、1-5个、优选1-6个及更优选1-7个氨基酸取代。
特别地,本发明部分涉及在CENH3蛋白的片段内引起或导致氨基酸取代的突变。因此,在本发明中,突变优选是编码CENH3蛋白的DNA序列中的非同义点突变或取代,其导致氨基酸改变。这也称作错义突变。进一步地,氨基酸改变或氨基酸取代可以是保守的,即改变为具有相似物理化学性质的氨基酸;半保守的,例如负电荷氨基酸改变为正电荷氨基酸;或者是彻底改变,即改变为极为不同的氨基酸。
在本发明的一优选实施方案中,具有单倍体诱导物生物活性的本发明的植物关于所述至少一个突变是纯合的。在本发明的进一步的实施方案中,具有单倍体诱导物生物活性的本发明的植物关于所述至少一个突变是杂合的。
本发明的植物具有单倍体诱导物生物活性。这表示在本发明的植物与野生型植物或表达野生型CENH3蛋白的植物之间杂交时产生至少0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、优选至少1%、优选至少2%、优选至少3%、优选至少4%、优选至少5%、优选至少6%、优选至少7%、优选至少8%、优选至少9%、最优选至少10%、至少15%、至少20%或更多的单倍体后代。因此,野生型植物优选是相同物种的植物,其在相应内源性CENH3基因内不含根据本发明的植物的突变,即所述植物能够表达天然CENH3蛋白,并且表达野生型CENH3的植物优选是相同物种的植物,其包含i)包含无根据本发明的植物的至少一个突变的编码CENH3蛋白的核苷酸序列的多核苷酸,并且能够表达所述天然CENH3蛋白,或者ii)包含编码来自另一植物物种的CENH3蛋白的核苷酸序列的多核苷酸,所述来自另一植物物种的CENH3蛋白表现出与天然CENH3相当的功能性,例如来源于另一植物物种的这种CENH3蛋白可以作为转基因导入。
因此,本发明最有利地提供了在广泛的真双子叶植物(eudicot)、双子叶植物和单子叶植物物种中产生单倍体诱导物株系的手段和方法。本发明还允许母本细胞质的交换及在单一程序步骤中产生例如具有期望基因型的细胞质雄性不育植物。在单一氨基酸突变可以通过诱变或任何其它非基于GMO的方法产生的范围内,本发明是有利的。
因此,在一优选实施方案中,通过应用单倍体诱导物株系单倍体化的整个过程是非转基因的,所述单倍体诱导物株系特征在于突变的内源CENH3基因,其具有本发明提供的在至少一个位置的氨基酸改变。
在本发明的上下文中,“内源”基因、等位基因或蛋白是指当序列出现在各自的植物、特别是野生型植物中时植物的非重组序列。术语“突变的”是指人为改变的序列。人为诱导的非转基因突变的实例包括将植物暴露于高剂量的化学、放射性或其它诱变剂以选择突变体。或者,人为诱导的转基因突变,即例如利用TALE核酸酶、锌指核酸酶或者CRISPR/Cas***进行的重组改变或基因组工程,包括DNA或氨基酸序列的融合、***、缺失和/或改变。
多核苷酸或多肽序列对于生物体而言,如果其源自外来物种或者源自相同物种但是从其原来形式加以修饰,则其是“异源或外源的”。“重组”是指人为改变的,即转基因的多核苷酸或多肽序列。“转基因”作为在本领域理解的术语使用且是指通过对细胞基因组进行人为分子操纵如通过分子转化而引入细胞中的(优选异源的)核酸。因此,“转基因植物”是包含转基因的植物,即是经遗传修饰的植物。转基因植物可以是其中引入转基因的起始植物及其后代,所述后代的基因组也包含转基因。
术语“编码……的核苷酸序列”是指指导特定蛋白,特别是CENH3蛋白或其部分的表达的核酸。核苷酸序列包括转录为RNA的DNA链序列以及翻译为蛋白的RNA序列。核苷酸序列包括全长核酸序列以及衍生自全长序列的非全长序列。
术语“基因”是指编码核苷酸序列和相关的调节核苷酸序列、内含子、5’UTR和/或3’UTR。
术语“调节元件”是指位于核苷酸序列,优选编码序列(其转录和表达由调节元件控制,潜在地与细胞的蛋白生物合成装置结合)的上游(5')、内部和/或下游(3')的序列,优选核苷酸序列。“调节(regulation)”或“调节(regulate)”是指通过主要位于但不只是位于所关注的基因的转录起始处上游(5')的DNA序列元件诱导的基因表达的调节。调节可以导致对于刺激全部应答或者无应答,或者其可以导致基因表达水平的变化。
如果两个序列的位置和朝向使得调节DNA序列影响编码DNA序列的表达,则调节元件,特别是DNA序列如启动子被称作“可操作地连接至”编码RNA或蛋白的DNA序列或者与编码RNA或蛋白的DNA序列“关联”。
“启动子”是起始相关DNA序列转录的DNA序列,特别是位于转录起始处上游(5’)及参与RNA聚合酶识别和结合。取决于特定启动子区域,其还可以包含作为基因表达调节物的元件,如激活子、增强子和/或阻抑子。
“3'调节元件”(或“3'末端”)是指基因部分,其包含确定正确的终止位点且包含聚腺苷酸化信号和能够实现信使RNA(mRNA)加工或基因表达的任何其它调节信号的DNA片段,不包含驱动转录起始的5'序列和基因的结构部分。聚腺苷酸化信号通常特征在于实现在mRNA前体的3'末端加入聚腺苷酸。通常通过存在与规范化形式5'-AATAAA-3'的同源性识别聚腺苷酸化信号。
术语“编码序列”是指编码蛋白、多肽或其部分的基因部分,并且不包括驱动转录起始或终止的调节序列。
基因、编码序列或调节元件可以是在细胞中正常发现的,在这种情况下称作“自体的”或者“内源的”,或者其可以是在细胞定位中不是正常发现的,在这种情况下称作“异源的”、“转基因的”或“转基因”。
“异源”基因、编码序列或调节元件还可以是细胞自体的,但是排列顺序和/或方向或者在基因组中位置或环境在其转移进的细胞中不是正常发现或者发生的。
术语“载体”是指重组DNA构建体,其可以是质粒、病毒、自主复制序列、人工染色体,如细菌人工染色体BAC、噬菌体或其它核苷酸序列,其中已经结合或重组了至少两个核苷酸序列,其中至少一个序列是本发明的核酸分子。载体可以是线性或环形的。载体可以包括单链或双链DNA或RNA。
术语“表达”是指内源基因或转基因在植物中转录和/或翻译。
“转化(transformation)”、“转化(transforming)”和“转移”是指将核酸分子,特别是DNA转移入细胞中的方法,包括但不限于基因枪方法如粒子轰击、显微注射、用各种物理处理例如电穿孔或者化学处理如聚乙二醇或PEG透过细胞膜;原生质体融合或者根癌农杆菌或发根农杆菌介导的转化。对于在植物细胞中的DNA注射或电穿孔,使用的质粒没有特殊要求。可以使用质粒如pUC衍生物。如果要从这种转化的细胞再生完整植物,优选使用可选择标记。取决于将期望基因引入植物细胞中的方法,可能需要其它的DNA序列;如果例如Ti或Ri质粒用于植物细胞的转化,Ti和Ri质粒T-DNA的至少右侧边界、通常是右侧和左侧边界必须作为侧翼区与待引入的基因连接。优选地,转移的核酸分子稳定地整合在受体植物的基因组或质体基因组中。
在本发明的上下文中,术语“单倍体诱导物生物活性”或“单倍体诱导物”或“单倍体诱导物株系”是指在与野生型植物或至少表达野生型CENH3蛋白的植物杂交时,具有在至少0.1%、至少0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、优选至少1%、优选至少2%、优选至少3%、优选至少4%、优选至少5%、优选至少6%、优选至少7%、优选至少8%、优选至少9%、最优选至少10%、最优选至少15%、最优选至少20%的情况下产生单倍体后代或子代的能力的植物或植物株系。由于单倍体诱导物的染色体在减数***期间被消除,因此所得的单倍体后代仅包含野生型亲本的染色体。然而,在单倍体诱导物是杂交的胚珠亲本的情况下,单倍体后代具有诱导物的细胞质及野生型亲本的染色体。
根据本发明,术语“植物”包括完整植物或者这样的完整植物的部分。
完整植物优选是种子植物或作物。植物的部分是例如地上部分(shoot)营养器官/结构,如叶、茎和块茎;根,花和花器官(floral organ)/结构,例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠;种子,包括胚、胚乳和种皮;果实和成熟子房;植物组织,例如维管组织、基本组织等;以及细胞,例如保卫细胞、***、毛状体等;以及其后代。
在任何情况下,本发明的植物包含至少一个细胞,所述细胞包含多核苷酸,所述多核苷酸包含编码着丝粒组蛋白H3(CENH3)蛋白的核苷酸序列,其中所述多核苷酸包含引起CENH3蛋白的氨基酸序列改变的至少一个突变,并且所述改变赋予单倍体诱导物的生物活性,优选如在本文中更详细描述的。最优选地,本发明植物的大多数或特别是所有细胞均包含如本文所述的突变。
可用于本发明方法的植物的物种优选是真双子叶植物、双子叶植物和单子叶植物。
在一优选实施方案中,术语“植物”仅涉及完整植物,即呈现出已发育植物的全部表型且能够繁殖的植物、其发育早期阶段(例如植物胚),或者是指这二者。
在本发明的一实施方案中,术语“植物”是指完整植物的一部分,特别是植物材料、植物细胞或植物细胞培养物。
术语“植物细胞”描述植物的结构和生理学单元,并且包含原生质体和细胞壁。植物细胞可以是分离的单细胞形式,如气孔保卫细胞或培养的细胞,或者作为更高级组织单元(higher organized unit)例如植物组织或植物器官的部分。
术语“植物材料”包括植物的部分,特别是植物细胞、植物组织,特别是植物繁殖材料,优选叶、茎、根、萌发的(emerged)胚根、花或花部分、花瓣、果实、花粉、花粉管、花药花丝(anther filaments)、胚珠、胚囊、***、子房、合子、胚、合子胚本身、体细胞胚、下胚轴部分、顶端分生组织、维管束、中柱鞘、种子、根、插枝、细胞或组织培养物,或者植物的任何其它部分或产物。
因此,本发明还提供了本发明植物的植物繁殖材料。所述“植物繁殖材料”应理解为可以在体内或体外有性或无性繁殖的任何植物材料。在本发明的范围内特别优选原生质体、细胞、愈伤组织、组织、器官、种子、胚、花粉、***、合子,以及获得自转基因植物的任何其它繁殖材料。起源于先前通过本发明的方法突变的、优选转化的并因此至少包含部分经突变的细胞的突变的植物或它们的后代的植物部分如花、茎、果实、叶、根,也是本发明的目的。
优选地,本发明的植物选自如下一组:大麦(Hordeum vulgare)、高粱(Sorghumbicolor)、黑麦(Secale cereale)、小黑麦、甘蔗(Saccharum officinarum)、玉米(Zeamays)、粟(Setaria italic)、水稻(Oryza sativa)、小粒野生稻、澳洲野生稻、野生稻、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、Hordeum bulbosum、紫色假雀麦(二穗短柄草)、海大麦(Hordeum marinum)、山羊草(Aegilops tauschii)、苹果(Malusdomestica)、甜菜、向日葵(Helianthus annuus)、澳大利亚胡萝卜(Daucus glochidiatus)、美国野胡萝卜(Daucus pusillus)、Daucus muricatus、胡萝卜(Daucus carota)、桉树(巨桉)、Erythranthe guttata、Genlisea aurea、林地烟草(Nicotiana sylvestris)、烟草(Nicotiana tabacum)、绒毛烟草、番茄(Solanum lycopersicum)、马铃薯(Solanumtuberosum)、咖啡(Coffea canephora)、葡萄(Vitis vinifera)、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、拟南芥(Arabidopsis thaliana)、深山南芥、沙石水芹(Arabidopsis arenosa)、须弥芥、卵叶须弥芥、波状野荠菜(Cardamine flexuosa)、胡椒草(Lepidium virginicum)、荠菜(Capsella bursa-pastoris)、Olmarabidopsis pumila、毛状石水芹(Arabis hirsuta)、油菜(Brassica napus)、花椰菜(Brassica oleracea)、芜菁、Brassica juncacea、黑芥(Brassica nigra)、萝卜(Raphanus sativus)、芝麻菜苜蓿(Erucavesicaria sativa)、橙(Citrus sinensis)、麻风树(Jatropha curcas)、大豆(Glycinemax)、以及黑三角叶杨(Populus trichocarpa)。
特别优选所述植物选自如下一组:大麦(Hordeum vulgare)、高粱(Sorghumbicolor)、黑麦(Secale cereale)、小黑麦、甘蔗(Saccharum officinarum)、玉米(Zeamays)、水稻(Oryza sativa)、小麦(Triticum aestivum)、硬粒小麦、燕麦(Avena sativa)、Hordeum bulbosum、甜菜、向日葵(Helianthus annuus)、胡萝卜(Daucus carota)、烟草(Nicotiana tabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、咖啡(Coffea canephora)、葡萄(Vitis vinifera)、黄瓜(Cucumis sativus)、拟南芥(Arabidopsis thaliana)、油菜(Brassica napus)、花椰菜(Brassica oleracea)、芜菁、Brassica juncacea、黑芥(Brassica nigra)、萝卜(Raphanus sativus)和大豆。
在一优选实施方案中,本发明的植物包含多核苷酸,所述多核苷酸包含作为内源基因或转基因的编码CENH3的核苷酸序列。
在一优选实施方案中,本发明涉及根据本发明教导的植物,其中所述至少一个氨基酸取代被非转基因或转基因地引入编码CENH3的核苷酸序列。
因此,优选在一实施方案中,其中所述至少一个突变是在内源CENH3基因中产生,获得的植物是非转基因的。优选地,所述突变是通过非转基因诱变、转座子诱变、特别是化学诱变实现的,优选通过EMS(甲基磺酸乙酯)诱导的TILLING或靶向基因组编辑方法实现。
因此,本发明涉及一种植物,其中非转基因引入所述至少一个突变是通过化学诱变、特别是通过TILLING实现的,所述至少一个突变引起CENH3蛋白的氨基酸序列改变,并且所述改变赋予单倍体诱导物的生物活性。
在另一优选实施方案中,将所述至少一个突变以转基因形式引入植物中。优选地,这是通过转化包含多核苷酸的载体实现的,所述多核苷酸包含编码至少CENH3蛋白片段的核苷酸序列,所述CENH3蛋白片段包含氨基酸序列的至少一个改变,优选如本文所述。转化植物及将转基因引入植物基因组中的方法为本领域熟知。
因此,在一优选实施方案中提供了一种植物,其中将改变转基因引入CENH3蛋白的氨基酸序列是通过载体转化实现的,所述载体包含多核苷酸,所述多核苷酸包含编码至少CENH3蛋白片段或CENH3蛋白的CADT结构域(包含氨基酸序列的至少一个改变)的核苷酸序列,优选包含共有序列SEQ ID NO:1、2、3、4、5、6、7、8或9的确定的氨基酸之一的至少一个氨基酸取代,或者如表1、表2、表3、表4、表5、表6、表7或表8中定义。
优选地,农杆菌介导的转化、蘸花法或者粒子轰击法用于进行转化。
在一优选实施方案中,其中将包含编码根据本发明改变的CENH3蛋白的核苷酸序列的多核苷酸以转基因形式转化入植物中,并且优选将内源CENH3基因的一个或两个等位基因失活或敲除。在另一优选实施方案中,其中将包含编码根据本发明的CENH3蛋白的改变的氨基酸序列的核苷酸序列的多核苷酸以转基因形式转化入植物中,所述转基因是过表达的,以便比内源CENH3蛋白更有竞争力,优选在着丝点复合物产生期间更有竞争力。
本发明还提供通过本发明的方法可获得、特别是通过本发明的方法获得的植物,其特征在于具有单倍体诱导物的生物活性。
在本发明的一优选实施方案中,产生根据本发明的具有单倍体诱导物生物活性的植物的方法本质上不是生物学方法。
进一步地,本发明还提供一种产生根据本发明的具有单倍体生物活性的植物的方法,包括以下步骤:
i)使植物的种子经受足量的诱变剂甲基磺酸乙酯(EMS)以获得M1植物,
ii)使得足量产生可育的M2植物,
iii)分离M2植物的基因组DNA,以及
iv)选择至少具有引起CENH3的氨基酸序列改变的突变的个体。
在一优选实施方案中,本发明进一步涉及一种产生根据本发明的具有单倍体诱导物生物活性的植物的方法,包括以下步骤:
xx)提供包含多核苷酸的载体,所述多核苷酸包含编码至少CENH3蛋白的氨基酸序列片段的核苷酸序列,其中所述多核苷酸包含引起CENH3蛋白的氨基酸序列改变的至少一个突变,
yy)用所述载体转化植物细胞,其中优选包含CENH3基因的一个或两个内源等位基因失活或敲除的植物细胞,以及
zz)从所述植物细胞再生具有单倍体诱导物生物活性的植物。
在一优选实施方案中,本发明进一步涉及一种产生根据本发明的具有单倍体诱导物生物活性的植物的方法,包括以下步骤:
yy)用包含编码至少CENH3蛋白的氨基酸序列片段的核苷酸序列的多核苷酸转化植物细胞,其中所述多核苷酸包含引起CENH3蛋白的氨基酸序列改变的至少一个突变,或者用包含多核苷酸的载体转化植物细胞,所述多核苷酸包含编码至少CENH3蛋白的氨基酸序列片段的核苷酸序列,其中所述多核苷酸包含引起CENH3蛋白的氨基酸序列改变的至少一个突变,以及
zz)从所述植物细胞再生具有单倍体诱导物生物活性的植物。
特别地,本发明涉及通过以下方法可获得、特别是通过以下方法获得的单倍体植物:
a)将根据本发明的具有单倍体诱导物生物活性的植物与表达野生型CENH3蛋白的植物杂交,任选地,
b)鉴定从所述杂交步骤产生的单倍体后代。
优选地,鉴定的单倍体植物可以转变为双单倍体植物,优选通过秋水仙素处理转变,这也是本发明的一部分。因此,本发明还涉及将根据本发明的单倍体植物转变为双单倍体植物可获得、特别是获得的双单倍体植物,优选通过秋水仙素处理或通过染色体自然加倍方法转变。
因此,本发明还提供一种产生单倍体植物的方法,包括以下步骤:
a)将根据本发明的具有单倍体诱导物生物活性的植物与表达野生型CENH3蛋白的植物杂交,以及
b)鉴定从所述杂交步骤产生的单倍体后代。
在进一步的步骤c)中,将所选择的单倍体植物转变为双单倍体植物,优选通过秋水仙素处理转变。因此,本发明还涉及一种产生双单倍体植物的方法。
在本发明的一优选实施方案中,本发明提供的方法本质上不是生物学方法。
特别地,本发明的方法不是仅依赖于自然现象如杂交或选择,特别是不是由自然现象如杂交或选择组成,事实上是基本基于这样的技术教导以提供通过人为制备的特异性突变的核苷酸序列。因此,本发明将称作突变的一种特定结构特征引入本发明的核苷酸序列和植物,该突变不是由任何自然现象如杂交或选择导致或与其相关。
在本发明的一特定实施方案中,提供一种包括杂交步骤的方法,所述杂交步骤不提供-如通常的杂交提供的-杂合后代,事实上提供纯合后代。进一步地,后代的单倍性不是用于有性杂交的植物的基因混合所致。此外,在自然界找不到本发明权利要求的产生双单倍体植物的方法。
进一步地,本发明还提供一种促进细胞质交换的方法,包括以下步骤:
x)将本发明的植物作为胚珠亲本与作为花粉亲本的表达野生型CENH3蛋白的植物杂交,以及
y)获得包含花粉亲本染色体和胚珠亲本细胞质的单倍体后代植物。
在本发明的一优选实施方案中,本发明提供的方法本质上不是生物学方法。所述方法由于上述相同原因而本质上不是生物学方法,特别是由于其不是完全由自然现象如杂交和选择组成,而是包括一种显著的技术教导的基本特征,由此提供本发明的核苷酸序列和植物中的特定突变。进一步地,后代的单倍性不是用于有性杂交的植物的基因混合所致。
所述方法可以有利地用于产生细胞质雄性不育(CMS)。CMS是由细胞核外基因组(线粒体或叶绿体)所致,并且表现出母系遗传性。因此,本发明的植物必须呈现出CMS,并且是杂交的胚珠亲本。以此方式,可以将CMS引入杂交配体中,优选是作物良种株系。
在一优选实施方案中,本发明的植物还可以用于恢复雄性生育力的方法,为CMS的杂交亲本提供正常的细胞质。通过这种杂交,将CMS植物的染色体引入非CMS的本发明的单倍体诱导物的正常细胞质中。然而,CMS植物的花粉产生需要通过温度、光照、日照长度等诱导。
不受理论限制,本发明的方法,特别是单亲染色体消除方法怎样在诱导物CENH3x野生型CENH3种间杂交胚中工作的可能的模型可以工作如下:(A)可能单倍体诱导物衍生的***含有较少的CENH3或者与野生型相比降低的未知“CENH3-跨世代需要的特征(transgeneration required signature)”。母本CENH3的量减少不太可能,因为根据用CENH3-GFP报告蛋白在拟南芥植物中进行的研究,由CENH3标记的是***核而不是***。然而,仍可能的是产生“着丝粒印迹”的剩余的母本CENH3传递至后代。(B)在受精后几小时内,还将父本野生型CENH3从受精卵核中主动除去,以及(C)在拟南芥中在胚乳发育的16核阶段发生合子中的CENH3-GFP的着丝粒再荷载。(D)在经历单倍体化的胚中,母本染色体的着丝粒再荷载被削弱或延迟,由于在细胞***后期期间着丝粒失活而导致滞后的染色体。随后,微核化的单倍体诱导物染色体降解以及(E)单倍体胚将产生。单倍体胚在源自母本的细胞质背景中包含源自父本的染色体。
本发明还涉及多核苷酸,其包含编码至少CENH3蛋白的氨基酸序列片段或CENH3蛋白的核苷酸序列,其中所述多核苷酸包含引起CENH3蛋白的氨基酸序列改变的至少一个突变。
本发明还涉及载体,特别是病毒载体、构建体或质粒,其包含所述多核苷酸以及如果存在的话优选如本文所示的相关序列。
在本发明的一特别优选的实施方案中,包含编码CENH3蛋白片段的核苷酸序列的多核苷酸优选包含至少CENH3的完整编码区,特别是CENH3的基因。
在本发明进一步优选的实施方案中,CENH3的多核苷酸或编码序列可以与调节元件如5’-和/或3’-调节元件关联,最优选与启动子、优选组成型或诱导型启动子关联。
此外,本发明提供包含所述多核苷酸的植物细胞或包含所述多核苷酸作为转基因的载体。
在本发明的上下文中,如本文所用的术语“包含”理解为具有“包括”或“含有”的含义,是指除了明确提及的要素之外也可能存在其它要素。
在本发明的一优选实施方案中,如本文所用的术语“包含”也应理解为是指“由…组成”,从而不包括除了明确提及的要素之外的其它要素。
在进一步优选的实施方案中,如本文所用的术语“包含”也应理解为是指“基本上由…组成”,从而不包括除了明确提及的要素之外显著有助于公开的教导的其它要素。
本发明的进一步优选的实施方案是从属权利要求的主题。
本发明现在通过非限制性实例和图得以更详细阐述。
序列方案示出:
SEQ ID NO:1:CENH3的N-末端尾部结构域的氨基酸共有序列(部分A),
SEQ ID NO:2:CENH3的N-末端尾部结构域的氨基酸共有序列(部分B),
SEQ ID NO:3:CENH3的αN-螺旋的氨基酸共有序列,
SEQ ID NO:4:CENH3的α1-螺旋的氨基酸共有序列,
SEQ ID NO:5:CENH3的环1的氨基酸共有序列,
SEQ ID NO:6:CENH3的α2-螺旋的氨基酸共有序列,
SEQ ID NO:7:CENH3的环2的氨基酸共有序列,
SEQ ID NO:8:CENH3的α3-螺旋的氨基酸共有序列,
SEQ ID NO:9:CENH3的C-末端结构域的氨基酸共有序列,
SEQ ID NO:10:拟南芥CENH3的野生型编码序列(cDNA)的核苷酸序列,
SEQ ID NO:11:野生型拟南芥CENH3的氨基酸序列,
SEQ ID NO:12:甘蓝型油菜(B.napus)CENH3的野生型基因组序列(基因组DNA)的核苷酸序列,
SEQ ID NO:13:甘蓝型油菜CENH3的野生型编码序列(cDNA)的核苷酸序列,
SEQ ID NO:14:野生型甘蓝型油菜CENH3的氨基酸序列,
SEQ ID NO:15:高粱(S.bicolor)CENH3的野生型基因组序列(基因组DNA)的核苷酸序列,
SEQ ID NO:16:高粱CENH3的野生型编码序列(cDNA)的核苷酸序列,
SEQ ID NO:17:野生型高粱CENH3的氨基酸序列,
SEQ ID NO:18:玉米(Z.mays)CENH3的野生型基因组序列(基因组DNA)的核苷酸序列,
SEQ ID NO:19:玉米CENH3的野生型编码序列(cDNA)的核苷酸序列,
SEQ ID NO:20:野生型玉米CENH3的氨基酸序列,
SEQ ID NO:21:甜菜(B.vulgaris)CENH3的野生型基因组序列(基因组DNA)的核苷酸序列,
SEQ ID NO:22:甜菜CENH3的野生型编码序列(cDNA)的核苷酸序列,
SEQ ID NO:23:野生型甜菜CENH3的氨基酸序列,以及
SEQ ID NO:24:玉米CENH3-Mu-突变的基因组序列(基因组DNA)的核苷酸序列。
图示出拟南芥(第一行)、甜菜(第二行)、甘蓝型油菜(第三行)、玉米(第四行)、高粱(第五行)的氨基酸序列的比对以及示出这五个植物物种的保守水平的图表。
实施例
CENH3突变体的鉴定
为了鉴定引起翻译的CENH3的氨基酸序列改变的CENH3基因内的突变,其中所述改变能够赋予植物单倍体诱导物的生物活性,在合适的突变方面研究CENH3基因的所有片段,即使Ravi和Chan 2010仅强调N末端结构域的特殊重要性。对其他片段如α2-螺旋中的突变体的第一次自己的研究(尚未公开)表明此外其他片段的修饰可以导致CENH3与DNA的结合能力不稳定。
为了发现不同植物物种中的突变CENH3基因,对玉米(Zea mays)、油菜(Brassicanapus)、高粱(Sorghum bicolor)和甜菜(Beta vulgaris)产生了具有高突变比率的TILLING种群,并且已筛选CENH3突变。为此,在开发覆盖CENH3基因的所有外显子的扩增子之后,通过Sanger测序方法分析每个植物物种的1000-10000个植物。此外,使用特异性PCR检测M2甜菜植物的突变。
此外,CENH3基因内鉴定的突变对编码蛋白的初级结构和二级结构的影响已使用Prof软件等评估(Rost,B.and Sander,C.(1994a).Combining evolutionary informationand neural networks to predict protein secondary structure.Proteins,19(1),55-72.Rost,B.and Sander,C.(1994b).Conservation and prediction of solventaccessibility in protein families.Proteins,20(3),216-26.Rost,B.,Casadio,R.,Fariselli,P.,and Sander,C.(1995).Transmembrane helices predicted at 95%accuracy.Protein Sci,4(3),521-33.)。表9-12分别示出甘蓝型油菜、玉米、高粱和甜菜中鉴定的突变,其在引起剪接错误的突变中和在引起氨基酸取代的突变中分开的。特别关注剪接位点内的突变。这样的突变可以引起失常的剪接位点(剪接错误),然后其导致非完全功能CENH3蛋白的细胞翻译产生增加,所述非完全功能CENH3蛋白表现出例如稳定性受损,对DNA的结合亲和力减少,蛋白的几何形状改变,优选二级或三级结构改变,或者与完全功能野生型CENH3蛋白相比混乱的蛋白折叠。具有对于这样的突变是杂合的基因组的植物是能够存活的。
表9:来源于甘蓝型油菜的CENH3的突变(aa:氨基酸;nd:未确定,y:是,n:否)。氨基酸取代以X#Y示出,即在位置#氨基酸X(单字母代码)由氨基酸Y取代。
表10:来源于玉米的CENH3的突变(aa:氨基酸;nd:未确定,y:是,n:否)。氨基酸取代以X#Y示出,即在位置#氨基酸X(单字母代码)由氨基酸Y取代。
表11:来源于高粱的CENH3的突变(aa:氨基酸;nd:未确定,y:是,n:否)。氨基酸取代以X#Y示出,即在位置#氨基酸X(单字母代码)由氨基酸Y取代。
表12:来源于甜菜的CENH3的突变(nd:未确定,y:是,n:否)。氨基酸取代以X#Y示出,即在位置#氨基酸X(单字母代码)由氨基酸Y取代。
除了剪接位点的突变和引起CENH3蛋白氨基酸序列内的氨基酸取代的点突变,已鉴定玉米突变体(称作Mu-突变体)在CENH3基因的5’非翻译区内包含转座子***(见SEQ IDNO:24)。这个突变引起N末端尾部结构域的延长。因此,这个突变对CENH3的影响与Ravi&Chan(2010)描述的突变非常相似,除了这个突变是非转基因的。
CENH3突变体的测试
为了评价鉴定的突变体中单倍体诱导物的生物活性以及测试单倍体诱导的母本和父本表现,必须将突变体植物与可以分别用作胚珠亲本或花粉亲本的相同物种的另一测试植物(携带CENH3的野生型形式)杂交。如果使用的测试株系携带隐性非CENH3突变,则可以快速确定来自这个杂交的推定的单倍体后代。因此,单倍体植物表现出隐性表型。例如,在玉米中,可以使用突变glossy的表现(玉米的突变体,Neuffer,MG et al.1997.ColdSpring Harbor Laboratory,New York)。
用诱导物的有丝***和减数***的细胞遗传学分析显示突变体作为单倍体诱导物的适合性。通过使用分子标记、测试物和潜在的诱导物的多态性确定纯合性。照此细胞遗传学测试单倍性。
在与测试植物杂交中,如上文所述具有突变的内源CENH3基因的TILLING植物获得至少0.4%单倍体后代。经常但不总是,如果测试物在杂交中用作母本,则诱导率较高。
例如,在甘蓝型油菜中,基于N-末端尾部结构域中的氨基酸取代的突变导致至少0.5%的诱导率且部分高达超过2%。因此,突变的位置对这个结构域中的某个区域不是特异性的,而是分布在整个结构域中。甘蓝型油菜中的N-末端尾部结构域从氨基酸位置1至84。赋予单倍体诱导物生物活性的突变可以例如在位置9、16、24、29、30、33、41、43、50、55、57和61找到,其中并非所有这些突变必需导致蛋白的二级结构改变(生物信息学计算)。对包含3个螺旋和2个环的更保守的组蛋白折叠结构域已获得可比结构。尽管在整个组蛋白折叠结构域中可以找到合适的突变,但是α2-螺旋、CATD结构域和环2中的氨基酸取代特别获得平均显著较高的诱导率。由于对N-末端尾部结构域和组蛋白折叠结构域的这些观察,可以假设其他未测试的位置和其他未测试的氨基取代也会赋予相同或甚至提高的单倍体诱导率。此外,内源CENH3基因的另一种修饰是剪接位点中的核苷酸的取代,结果其导致剪接错误。这类突变也适合赋予单倍体诱导物的生物活性。观察的诱导率显示至少0.5%单倍体后代。甚至这里可以假设其他未测试的剪接位点也会赋予相同或甚至提高的单倍体诱导率。
例如,在玉米中,基于N-末端尾部结构域中的氨基酸取代的突变导致至少0.4%的诱导率。因此,突变的位置对这个结构域中的某个区域不是特异性的,而是分布在整个结构域中。玉米中的N-末端尾部结构域从氨基酸位置1至62。赋予单倍体诱导物生物活性的突变可以例如在位置32、35和56中找到。对包含3个螺旋和2个环的更保守的组蛋白折叠结构域已获得可比结构。由于对N-末端尾部结构域和组蛋白折叠结构域的这些观察,可以假设其他未测试的位置和其他未测试的氨基取代也会赋予相同或甚至提高的单倍体诱导率。此外,内源CENH3基因的另一种修饰是剪接位点中的核苷酸的取代,结果其导致剪接错误。这类突变也适合赋予单倍体诱导物的生物活性。观察的诱导率显示至少0.4%单倍体后代。甚至这里可以假设其他未测试的剪接位点也会赋予相同或甚至提高的单倍体诱导率。
此外,已测试在CENH3基因的5’非翻译区内包含转座子***(SEQ ID NO:24)的Mu-突变体的单倍体诱导物生物活性。这个非转基因突变引起超过1.0%的诱导率。
此外,在不同作物间杂交的结果证实鉴定和显示的突变甚至在其它植物物种中也可以具有功能性。因此,通过诸如TILLING、诱变或基因组编辑(例如CRISPR/Cas,TALENs,锌指核酸酶等)的技术可以将突变引入其它植物物种中。此外,单倍体诱导物的生物活性和效率可以通过在一个植物中组合不同的鉴定的突变和/或修饰单倍体诱导物的遗传背景而进一步改进。不同突变的组合可以通过基因组编辑有效实现,或者将突变体单倍体诱导物再次诱变。
序列表
<110> KWS种子欧洲股份公司
<120> 单倍体诱导物
<130> KWS0223PCT
<150> EP 14004389.4
<151> 2014-12-23
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the N-terminal tail domain of
the CENH3 (part A)
<220>
<221> misc_feature
<222> (7)..(8)
<223> Xaa can be any naturally occurring amino acid
<400> 1
Met Ala Arg Thr Lys His Xaa Xaa Ala Arg Arg Ser Arg Lys Arg
1 5 10 15
<210> 2
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the N-terminal tail domain of
the CENH3 (part B)
<220>
<221> misc_feature
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 2
Gln Ser Gln Thr Gln Xaa Lys Lys Lys His Arg Tyr Arg Pro
1 5 10
<210> 3
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the Alpha-N-helix of the CENH3
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa can be any naturally occurring amino acid
<400> 3
Gly Thr Val Ala Leu Arg Glu Ile Arg Xaa Phe Gln Lys Thr Thr
1 5 10 15
<210> 4
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the Alpha-1-helix of the CENH3
<400> 4
Ala Ala Pro Phe Ile Arg Leu Val Arg Glu Ile
1 5 10
<210> 5
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the loop1 of the CENH3
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa can be any naturally occurring amino acid
<400> 5
Thr Asn Phe Leu Ala Pro Xaa Glu Val Thr Arg Trp Thr
1 5 10
<210> 6
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the Alpha-2-helix of the CENH3
<400> 6
Ala Glu Ala Leu Leu Ala Leu Gln Glu Ala Ala Glu Asp Phe Leu Val
1 5 10 15
His Leu Phe Glu Asp Ala Met Leu Cys Ala Ile His Ala
20 25
<210> 7
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the loop2 of the CENH3
<400> 7
Lys Arg Val Thr Leu Met Lys
1 5
<210> 8
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the Alpha-3-helix of the CENH3
<400> 8
Lys Asp Phe Glu Leu Ala Arg Arg Leu Gly
1 5 10
<210> 9
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid consensus sequence of the C-terminal domain of the
CENH3
<400> 9
Gly Lys Gly Arg Pro Trp
1 5
<210> 10
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Arabidopsis thaliana - cDNA coding for CENH3
<400> 10
atggcgagaa ccaagcatcg cgttaccagg tcacaacctc ggaatcaaac tgatgccgcc 60
ggtgcttcat cttctcaggc ggcaggtcca actacgaccc cgacaaggag aggcggtgaa 120
ggtggagata atactcaaca aacaaatcct acaacttcac cagctactgg tacaaggaga 180
ggggctaaga gatccagaca ggctatgcca cgaggctcac agaagaagtc ttatcgatac 240
aggccaggaa ccgttgctct aaaagagatt cgccatttcc agaagcagac aaaccttctt 300
attccggctg ccagtttcat aagagaagtg agaagtataa cccatatgtt ggcccctccc 360
caaatcaatc gttggacagc tgaagctctt gttgctcttc aagaggcggc agaagattac 420
ttggttggtt tgttctcaga ttcaatgctc tgtgctatcc atgcaagacg tgttactcta 480
atgagaaaag actttgaact tgcacgccgg cttggaggaa aaggcagacc atggtga 537
<210> 11
<211> 178
<212> PRT
<213> Arabidopsis thaliana
<400> 11
Met Ala Arg Thr Lys His Arg Val Thr Arg Ser Gln Pro Arg Asn Gln
1 5 10 15
Thr Asp Ala Ala Gly Ala Ser Ser Ser Gln Ala Ala Gly Pro Thr Thr
20 25 30
Thr Pro Thr Arg Arg Gly Gly Glu Gly Gly Asp Asn Thr Gln Gln Thr
35 40 45
Asn Pro Thr Thr Ser Pro Ala Thr Gly Thr Arg Arg Gly Ala Lys Arg
50 55 60
Ser Arg Gln Ala Met Pro Arg Gly Ser Gln Lys Lys Ser Tyr Arg Tyr
65 70 75 80
Arg Pro Gly Thr Val Ala Leu Lys Glu Ile Arg His Phe Gln Lys Gln
85 90 95
Thr Asn Leu Leu Ile Pro Ala Ala Ser Phe Ile Arg Glu Val Arg Ser
100 105 110
Ile Thr His Met Leu Ala Pro Pro Gln Ile Asn Arg Trp Thr Ala Glu
115 120 125
Ala Leu Val Ala Leu Gln Glu Ala Ala Glu Asp Tyr Leu Val Gly Leu
130 135 140
Phe Ser Asp Ser Met Leu Cys Ala Ile His Ala Arg Arg Val Thr Leu
145 150 155 160
Met Arg Lys Asp Phe Glu Leu Ala Arg Arg Leu Gly Gly Lys Gly Arg
165 170 175
Pro Trp
<210> 12
<211> 4001
<212> DNA
<213> Brassica napus
<220>
<221> Intron
<222> (1892)..(1972)
<220>
<221> Intron
<222> (2020)..(2104)
<220>
<221> Intron
<222> (2148)..(2208)
<220>
<221> Intron
<222> (2264)..(2358)
<220>
<221> Intron
<222> (2399)..(2507)
<220>
<221> Intron
<222> (2624)..(2755)
<220>
<221> Intron
<222> (2832)..(2933)
<220>
<221> Intron
<222> (3012)..(3091)
<400> 12
tgtccgggag gatccaccgg cggtggtcgt tactccattt taacttgatg tcttgaaagc 60
agaggacatg gtatggtggc ggcagaatct atttttagtt gttaattttt cttttcctct 120
gattcttttt atttttttcg aatgaactaa ctttgggttt attcagaaga attatcatct 180
aaaaactgat tcaataaaca aaataattta catatttcac aatgagccat tagtaaacaa 240
gtcgaaagtg aaaccaaatg ggaagagaac aattttaata aaaatatgtt ctaatttcct 300
actttttatg aattgaactc ccgaagagaa tggccgaaga acggagtaaa agctcaatga 360
ttgtaaaagc tatgtattct cttgctttga ggaaaaagct ttttgtttgc actcataggc 420
ctgatatgtt gtgatggctc tttacatatt gggtcttttg tggtctatta aacggttact 480
gaagaattag tttatcgcat ttaaaaaaaa atatttgaaa accacatatc taaaatctca 540
atatattatt tattgataga tgaaaagaaa aatagtttat aaaataatat taattggtaa 600
atggaagtca aaattttaca tttaatacat gactagttcg attctccggc tgaaacccat 660
ttaccactga gccaagacca cttgattata tatatcaagc tcttgttttt tgcattaaca 720
aaagttgcat ccaaaatttc aaaacaacaa ctaaattaat gtctttctat tttcaaagtt 780
ttatctccaa acctattaat agtttaattt ttttttttaa aattaggaaa ccggttaaaa 840
tatattttaa atacaaaaaa cttaaacaat gaatcattta tttatttatt cttcaaaatt 900
taaatatccg aacccggccc aaaatatccg aacccgaaca taaaatatcc gaacccgact 960
cgaagtgtag aaaatatccg aacgggtttt atacctttat actgaaatac cctatacgaa 1020
cccgaatgtg tatccgaacg ccccctacaa tatatgatca tcatttgtat cttgattgaa 1080
caaaaaaaaa gttaaactat tgatcacaaa attttcaatg tgagactttt accattttta 1140
gtcatttata gtcgttttta aaaattcaaa atataactta taagaaaaaa tctaattttt 1200
tttattatat gcttaatgtg attgtttaat ttcttttaat aatataaaat taaacaaaaa 1260
atgagaggtt aaaaaaattg ttatcaaata tgtattattc ataatcatta attgtcatat 1320
atatgttaat tatattaggt aatttcgtag tttttattta agaaaagaaa aaaatattat 1380
tttgtacact actaattaat ttgatagtta gtttaataaa aaatatatta tattattata 1440
tggaccaact tatttttcta aaaaaaaacc actgttttaa aaaccaaacc aactataaac 1500
cggagatata ccggattgag tggctaaaac actctttgta tatatgtgct gagcaaaccc 1560
tctgagtgag atggcgtgtt aagaagtagg aggaccattc atgcctctta tgagttgtag 1620
tctgtgtgta caaaaaagaa gcgttggtgt gaaagaaagc agaaggattt gaaaatcaaa 1680
aaaattgaag gagaagcggg aaaacaaata atctctccct ccgctttttt ttctccaaat 1740
aatcaatctc tcatttcatt tgttaaccca agtttttgat aattatttca aaggggttta 1800
tttatctttt attcctccgg cggcagtaag tagtaatcaa tggcgagaac caaacatttc 1860
gcttccaggg cacgagatcg caatcgaact agttagtact ctctctctct ctgccttttt 1920
tttgatattt attttctagg ttaaacccta atttggcatc tgaaatttgt agatgcgact 1980
gcttcatctt cggcggcggc ggcggaaggt ccgagtgcgg tacgtcatct attttctttt 2040
cccgttttag gtttttacgc aaatctcgtt actgtttttt tgacgaatcg attgaaatgt 2100
gtagaccccg acgagaagag aaggcagcca aggagaagct caacagagtg agtctttcta 2160
tttcattttc tgagatccat gaatcctttt catctctcgt gtgttgtgac atgaatcaat 2220
tgcagcagca actcctacta cgactccacc agccggtaga aaagtaagtt acatttccat 2280
ttcacaccat tcatttgctt ctttatcaac aaactgctct ctcatctgtt ttttttgttt 2340
tgttttggtt ttgtgaagaa aggagggact aagcgaacta aacaagctat gcctaaaagt 2400
tagtgacaga ttttaaaatc tctattttgg atcatcattc tctcaggaca tgtctatttg 2460
catttgttct tattatgtct gtctgtctgt ctttgtcccc cttgtaggtt ccaacaagaa 2520
gaagacattc cgttacaagc ctggaaccgt tgccctcaga gagattcgcc atttccagaa 2580
gaccaccaaa cttcttatcc ctgccgctag tttcatccga gaagttagta atgaactttg 2640
ttattcatac attcccgctt acttgttttc aatgactctg caattactga tatagaattt 2700
ggagcaacca ttatggggtg atttctctaa ctacaaatta ctaatactat cccaggtgag 2760
aagtgtcacc cagatctttg cccctcccga tgttacccgt tggactgctg aagctcttat 2820
ggctattcaa gaggtacgtg tactccttcc ctcttttgtt tcctattttc cacttgatgt 2880
ctaatttaaa ctgatcgttt tttttttata tttcttttgg tgtggggcgg ggcaggcggc 2940
tgaagatttt ttaattggct tgttctctga tgctatgctt tgcgctatcc atgcaaggcg 3000
tgttactcta agtaagtagt actccccaaa ataaggaaac ccattttata tacaacattg 3060
cctcatccat gtctgcttct cttcatatca gtgagaaaag attttgagct tgcacgccgt 3120
cttggaggaa aaggcagacc attgtgatcg tttcgcaggt tgtataactt tgttcactcc 3180
ttatgtcttg tcatttgtga tctgactgac actttctttt gaaacataac tgcttgattc 3240
aatatctagg ctgtaaaact tatccctcct tgtttactat cttatatgct ttttccttgg 3300
aattgatagt ttccattgag atttcacttg cacgaaacat atctgctttc tcaatatctc 3360
tcagtcttag aaagggctat tgactaaaag aaaagaaaat ttagaggaag atttgtaaag 3420
acatgtgttt agagagggct taattaaaaa cacacgcttc tgctagcctt gctatttgat 3480
tcccaatttc aacttttttc gaggcatatt ataaagtttt taaatgtact tggcacttca 3540
acttttataa tttatataac gattttattc taatagagca tttgtgattt catagtgttg 3600
tcatgaaact caagtaattc acaccgtccg atgttgctat tgtctaataa aatgttgaaa 3660
aaattgtcaa aacagaacaa aaaacaacat agttgtctct atggtataaa actatcacta 3720
agttgtctct atagtataat atttttcgca atcccaaaac taatttttct ttaatcaaat 3780
taaacataaa ctaaaaccat ttttaaaaag tttaatggaa aaagataaaa aaataaggta 3840
atctcgtaat gttttaaaaa ggaaaaaaaa tgtaaaaaca atttaaaaaa aagaacacac 3900
gacacagatc aaaaatatca tgtaatctaa ttgcatttgg tttctaaaat cttccaaaac 3960
tattctttta aaattctcta aggtaaaact tgattccaat a 4001
<210> 13
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Brassica napus - cDNA coding for CENH3
<400> 13
atggcgagaa ccaaacattt cgcttccagg gcacgagatc gcaatcgaac taatgcgact 60
gcttcatctt cggcggcggc ggcggaaggt ccgagtgcga ccccgacgag aagagaaggc 120
agccaaggag aagctcaaca gacaactcct actacgactc caccagccgg tagaaaaaaa 180
ggagggacta agcgaactaa acaagctatg cctaaaagtt ccaacaagaa gaagacattc 240
cgttacaagc ctggaaccgt tgccctcaga gagattcgcc atttccagaa gaccaccaaa 300
cttcttatcc ctgccgctag tttcatccga gaagtgagaa gtgtcaccca gatctttgcc 360
cctcccgatg ttacccgttg gactgctgaa gctcttatgg ctattcaaga ggcggctgaa 420
gattttttaa ttggcttgtt ctctgatgct atgctttgcg ctatccatgc aaggcgtgtt 480
actctaatga gaaaagattt tgagcttgca cgccgtcttg gaggaaaagg cagaccattg 540
<210> 14
<211> 180
<212> PRT
<213> Brassica napus
<400> 14
Met Ala Arg Thr Lys His Phe Ala Ser Arg Ala Arg Asp Arg Asn Arg
1 5 10 15
Thr Asn Ala Thr Ala Ser Ser Ser Ala Ala Ala Ala Glu Gly Pro Ser
20 25 30
Ala Thr Pro Thr Arg Arg Glu Gly Ser Gln Gly Glu Ala Gln Gln Thr
35 40 45
Thr Pro Thr Thr Thr Pro Pro Ala Gly Arg Lys Lys Gly Gly Thr Lys
50 55 60
Arg Thr Lys Gln Ala Met Pro Lys Ser Ser Asn Lys Lys Lys Thr Phe
65 70 75 80
Arg Tyr Lys Pro Gly Thr Val Ala Leu Arg Glu Ile Arg His Phe Gln
85 90 95
Lys Thr Thr Lys Leu Leu Ile Pro Ala Ala Ser Phe Ile Arg Glu Val
100 105 110
Arg Ser Val Thr Gln Ile Phe Ala Pro Pro Asp Val Thr Arg Trp Thr
115 120 125
Ala Glu Ala Leu Met Ala Ile Gln Glu Ala Ala Glu Asp Phe Leu Ile
130 135 140
Gly Leu Phe Ser Asp Ala Met Leu Cys Ala Ile His Ala Arg Arg Val
145 150 155 160
Thr Leu Met Arg Lys Asp Phe Glu Leu Ala Arg Arg Leu Gly Gly Lys
165 170 175
Gly Arg Pro Leu
180
<210> 15
<211> 3088
<212> DNA
<213> Sorghum bicolor
<220>
<221> Intron
<222> (377)..(487)
<220>
<221> Intron
<222> (514)..(618)
<220>
<221> Intron
<222> (662)..(1094)
<220>
<221> Intron
<222> (1217)..(1312)
<220>
<221> Intron
<222> (1391)..(2087)
<220>
<221> Intron
<222> (2164)..(2556)
<400> 15
catctctcac tgccatccgg gtccactact cccaacgttc ggcacgccag gtatagccgt 60
taccccggta ggccccactg gtacacggac aaaggttagc ggtcaccgcg aatcgtgaat 120
acttgtgact acggggtgct aattataaaa acgccgcaca tcctttcgtt tcgccatttc 180
accccccttc ccttcccgta gagaggaaaa aaacccaccg tcgacccgcc cggccgcccg 240
agagttctga atcgaaaccg tcggccgcga ccgcgagagc agcgcggggc gcccaccgtg 300
atggctcgaa ccaagcacca ggccgtgagg aagctgccgc agaagcccaa gaagaagctc 360
cagttcgagc gcgcaggtaa gcccgcgtcc ccgcgctgaa cccccctccg cctcgcgagc 420
agacgctgcc gctgctctcc gtcgcccctg gtgctaagcg cgttcctttt ttttccttct 480
tttgcaggtg gggcgagtac gtcggcgacc ccggtgagtg cgtgcgtgcg tgcgggaatt 540
ggttttagcc ctccttttgc ggtttcgcct tttgttgggc tggtctcact tgcttgcaat 600
ctgtttgatg gaatgcagga gaggaggaat gctgggaccg ggggaggagc cgcggctcgc 660
ggtgaggatc tctttgtcgt tgctgggttt gggaatttcc ggcgcgaaat tatgtggatt 720
tctaggttta tctgccgtct ttcttcttgt cttctctttt ggctctgggg tgagaagtta 780
gggtggttgg gcggacatgg tgcgttattt cgccgtatcg tttggtttgg tgctttctca 840
tccttttaat tccaacatgc cttgtaaaaa ttgcacaaga tttgtttttt catgcatgtc 900
tcagtgttgc taatttgctt ttccggttcg gttggtagaa ttcaatttct tggcgcaata 960
tgcatcttct tttgttgcaa catgagggcg aatgtgccag ttccatatgg gcgtcgcggt 1020
tttgaagtta ctaccttgct tgctcttcgt attataggcg tcattcacaa tagtatgttt 1080
tcttggagat gcagttgcac gggggcgtgt ggagaagaag catcgctggc gggcagggac 1140
tgtagcgctg cgggagatca ggaagtacca gaagtccact gagccgctca tcccctttgc 1200
gcccttcgta cgtgtggtgg gtgcatcttg taccaattgt tgtccactcc atagaatggg 1260
tttgttctgc agtctgtctg atggaaagtt attcttctga gaaaaaatgc aggtcaaaga 1320
gttaactgca ttcataacag actggaggat agggcgctac acccctgaag ccctccttgc 1380
gctgcaagag gtcagttatg aaacatgtct tgtgtatcag ttaagatcat cttctataga 1440
cataattgtt atcatgaagt ctttttctgt taatcggtct ggtactactt aataatcagg 1500
atttcagatt gctgcctttc ctagtggtgt agtcaaaagg gaatttaagt gctgttaggt 1560
actgtttgtt ttggtgtttt gaaccctgcc gcgatcggtt gttgttattc catgtttgtt 1620
tctgtggcag cggacgttca cggtgagatg ggatacgggc gtgtgaaaca tagttacggt 1680
ccatcttcat ggcttatcca tttacgctgc tcgtccgctc acttgttatg tgcggcaacc 1740
aaacttttgt tactagtgta actggtagcg ttgcaaatct ttccatttgc gttaccactc 1800
cctatgggag ccaaacagca ccttagtgta gattccattt gtattacttg agctagcttc 1860
cttgctattg gtgcctcgat tgtactgtta tgatcgaagt gctgaaaact ttgtcgcctg 1920
catagcatga ttagagaact tgagtttaca tttattcaat accttaagac tgcatttcgt 1980
atagataaat tatttttcct aattgttctg gttaactgtt ttaggtttcc atatttttgt 2040
atgtgtatca tttaaattat tgtgttgttt ttcctccctg tctacaggca gcagaattcc 2100
acttgataga actgtttgaa gtggcgaatc tgtgtgccat ccatgccaag cgcgtaacag 2160
tcagtaagtt atcactgaat gaactccttt tcctctgtac tattacgcct aatggagatg 2220
tgtgatgcat ttttggttac acgattcttt agtgattctg cttcagttgg atatgataaa 2280
tctagatgtt atttaaagtg gcaaattgct tacgagtgga aatagtaatg ttcaaatagt 2340
gaaaagtgca attaaacttt taataggcca ttatatggtt tgattgtcaa caaatgcatc 2400
aagaaatagt aaatattata acagttatgg cttagagagt ggacaaaaaa tcggtaatgg 2460
tgagctttgt ataaacacta aaactggctg agaaatctga taactcaagg atctatagga 2520
aatgtattat cctaaatgtt ttccttcctg ctgcagtgca aaaggacata caacttgcaa 2580
ggcgtatcgg aggaaggcgt tggtcgtgat atccattctg attctgatta ccttgttcgg 2640
gtggaatttg tttagaggag ttagacatta gtcttgttga atgctgtgca tggttcctaa 2700
tctgtttcac agttagtggg ctcttctggg atgatctgtt aacacctgtg gagtatgtta 2760
tgtaggaaac acctgaactg aacaacccaa agttgttttg gttgctcttc aaccatttgt 2820
ttgcttcaga gatcgattct aaactgcatg ctaattagtc tatggttgaa caaaaattat 2880
caaatataaa tgaaagtgat atagtagcaa aatccaaaaa aaaaaggatc caaacaaggc 2940
ctaaaatcat ggttctttct ccttttgaac tgggtgcaag tatggacagg cacagaagaa 3000
aaccgcctag caaaccgttt gttttttttt cttcgttgta ccacacgaca ctgttcgttc 3060
ctagttgcgc ctttttgttg tagaagtc 3088
<210> 16
<211> 471
<212> DNA
<213> Artificial Sequence
<220>
<223> Sorghum bicolor - cDNA coding for CENH3
<400> 16
atggctcgaa ccaagcacca ggccgtgagg aagctgccgc agaagcccaa gaagaagctc 60
cagttcgagc gcgcaggtgg ggcgagtacg tcggcgaccc cggagaggag gaatgctggg 120
accgggggag gagccgcggc tcgcgttgca cgggggcgtg tggagaagaa gcatcgctgg 180
cgggcaggga ctgtagcgct gcgggagatc aggaagtacc agaagtccac tgagccgctc 240
atcccctttg cgcccttcgt acgtgtggtc aaagagttaa ctgcattcat aacagactgg 300
aggatagggc gctacacccc tgaagccctc cttgcgctgc aagaggcagc agaattccac 360
ttgatagaac tgtttgaagt ggcgaatctg tgtgccatcc atgccaagcg cgtaacagtc 420
atgcaaaagg acatacaact tgcaaggcgt atcggaggaa ggcgttggtc g 471
<210> 17
<211> 157
<212> PRT
<213> Sorghum bicolor
<400> 17
Met Ala Arg Thr Lys His Gln Ala Val Arg Lys Leu Pro Gln Lys Pro
1 5 10 15
Lys Lys Lys Leu Gln Phe Glu Arg Ala Gly Gly Ala Ser Thr Ser Ala
20 25 30
Thr Pro Glu Arg Arg Asn Ala Gly Thr Gly Gly Gly Ala Ala Ala Arg
35 40 45
Val Ala Arg Gly Arg Val Glu Lys Lys His Arg Trp Arg Ala Gly Thr
50 55 60
Val Ala Leu Arg Glu Ile Arg Lys Tyr Gln Lys Ser Thr Glu Pro Leu
65 70 75 80
Ile Pro Phe Ala Pro Phe Val Arg Val Val Lys Glu Leu Thr Ala Phe
85 90 95
Ile Thr Asp Trp Arg Ile Gly Arg Tyr Thr Pro Glu Ala Leu Leu Ala
100 105 110
Leu Gln Glu Ala Ala Glu Phe His Leu Ile Glu Leu Phe Glu Val Ala
115 120 125
Asn Leu Cys Ala Ile His Ala Lys Arg Val Thr Val Met Gln Lys Asp
130 135 140
Ile Gln Leu Ala Arg Arg Ile Gly Gly Arg Arg Trp Ser
145 150 155
<210> 18
<211> 5834
<212> DNA
<213> Zea mays
<220>
<221> Intron
<222> (1820 )..(1917)
<220>
<221> Intron
<222> (1944 )..(2035)
<220>
<221> Intron
<222> (2085 )..(2239)
<220>
<221> Intron
<222> (2356 )..(2446)
<220>
<221> Intron
<222> (2525 )..(4530)
<220>
<221> Intron
<222> (4607 )..(5346)
<400> 18
ttatgtagag gcaattgcag tagtgcctct gttttagagt gtaactacag atttgtccct 60
atttttttag agtttgcgtg tttgtccctg ttttttcaaa tcaaactatt gtatacccct 120
actccattag ttatacttaa caatgttaag tcttgataaa aagacaaggg ataattggat 180
tagtgaccct gttttagagt gtaattatag ctttgcccga tgttttagac ttcacatgtt 240
tttatgacaa ttcaaattgt ttccataaca tcttaaatta ttttgacaac atttagaatt 300
gttttgcaat aatttaaatt atttccaaaa taaaaatatt ttgacaatta ttttatcaac 360
aaattaaatt atttttttta caaaataatt tgtcaaggta cttttttaaa attttgaaaa 420
taatcaaatt attgtaaata taatttgaat tgttgcgaaa ataatttgga ttgtcataaa 480
aacacgtaag tctaaaaatt aggcgtaaaa ctacaattat actctaaaaa ggtggtaatg 540
gcgtagttgt tccttgtcta ttttatcaag acatagcacc gtgcagtaca actaatggag 600
tagtgacata caacaatttt gttttaaata ataggggtaa atacgcaaag tctaaaaaac 660
agaggtaaat ctacaattac atgttaaaat agaggcatcg atacaattgt accttttata 720
tagcagcatg cgccctgttg ggatacaatt gtacctttca catgtcttct agatggttcc 780
caaccctttg gccaagatcg tacagataat attgcgagga gcccaaatca acggtgtcca 840
tatgttatgt tgatgtggat ggtttaccta ggcgcaaaag tgcgctggtt tcgtccgtac 900
aaatatactt taagtatggt tttgattttt ttctattttt cattttttaa ataaaacgag 960
acaatcaaat ctgatataaa aatcaaatga attataaata gagacggaaa gagtatatat 1020
atttgttttg ctattattta aagtattaaa agatagtgga cgaatgaacg tcctctatgt 1080
ttaaaagaac gttttagagg acgttgtgtt gttgaaggaa atatgaaaaa aaaatcttct 1140
gcatatttag aagggaggag cgtttacaca ttactttcgg gacttcaacc caaatatgtc 1200
aaggtttgtg agtggctcag tgcggaaaaa aaatcctata tataccagat gtaaacacta 1260
tcttttacag cctatcacat tcacatttag aggttcacaa agatagatca aaatttataa 1320
aataatcatt taatattttt tttattttat ttatatggat aagcagctgg tgtatgtgag 1380
gagctgtaaa agatattttt tacatccgag atgtaaagat tttttttaac tcaatgctgg 1440
ttaccggctg ggaggacgat gataaagaaa gcatctctca ctgcattccg ggcccactac 1500
tcaaacgttc ggcacgccag gttggcaggt agccgttaca tcgataggca ctcggccact 1560
cgcacgcaga caccacacca gtgtgctcag tgctcactgc tcaccataat aacgctgcac 1620
ctcttttcat ttcaccatct cctgccccct taaaaaaaag actcaccgtc gacacgccct 1680
cccgtcccga gagttctgaa tcgaaaccgt cggccacgag agcagtgcga ggcgcccacc 1740
gcgatggctc gaaccaagca ccaggccgtg aggaagacgg cggagaagcc caagaagaag 1800
ctccagttcg agcgctcagg taacccgggt cccgcgctcc cccccgcttc gcaagcagac 1860
gctgtcgctt ctctccgacc ctggtgctaa gcacgttcct tgttccgtct tttgcaggtg 1920
gtgcgagtac ctcggcgacg ccggtgagcg cgtgcgtgcg gggatcagtt ccctcctttt 1980
gccttttttt gttgggctgc tcttacttgc ttgcaagctg tttgatggaa tgcaggaaag 2040
ggctgctggg accgggggaa gagcggcgtc tggaggtgac tcaggtgagg acctatttgt 2100
cgttgctgga tgctgggttt cgcttgcaat ctaattttgt tgcaagatga gggcgaatgt 2160
gccagttcca tgtgggtgtc atggtctcgg agttactacc ttaattgctc accatagtat 2220
gttttcttaa aaaaaacagt taagaagacg aaaccacgcc accgctggcg gccagggact 2280
gtagcgctgc gggagatcag gaagtaccag aagtccactg aaccgctcat cccctttgcg 2340
cctttcgtcc gtgtggtggg tgcaggcgtg tttgtcctct gcatagtatg gggttgttcc 2400
gcattctgtc taatggaaag ttattcttct gagaaaaaaa atgcaggtga gggagttaac 2460
caatttcgta acaaacggga aagtagagcg ctataccgca gaagccctcc ttgcgctgca 2520
agaggtcagt tatgaaaaat gtcttatctc tctgttaaga tcctcttcat atacatagtt 2580
gctattgcta tcgtgaagtc ttttttttct gttaattggt ctggtactac ttactagtca 2640
ggatttcata ttgcggtttt tcctagtggt gtgtagttaa aaagtagttt aattgctttt 2700
agttaaaagg ggtgttcagg gctaaagatc aactatgaga aaacagaaat tttcccaatt 2760
cgatacccga cagcattatg gcctgcgcta atggaggtgt ttccgggcaa atactctagc 2820
ctacctggga agtaccttgg gttgcccctt catttcagga aagtaaaaag gaatgatctt 2880
caacctctaa tcgaaaaaat caacaacagg ctggccttgc tggaaaggca agatgttgtc 2940
caaggctggt atagaaactc ttgtaaaatc gatgctatcc gcacaaccaa tctaccatct 3000
aatggttttt ccacctcaaa aatggctgct gcaaacaatt gacaaaatac gaagaaactt 3060
cctgtggaga gggagcaatc cagaagtttg cagcgggggt cactgcctcg tcaactggcc 3120
cgtaacttgc ctcccaaaga acaagggagg tcttggaatt ctggaccttg atcgttttgc 3180
gagggggcta agactaagat ggctgtggct acgatggaag agcaaagata gggcgtggac 3240
tgccttgaag cttccttgtg acaaaactga tgaagatctc ttcaatgctt ccacaactgt 3300
cacggtaggc aatggaaaga tagctgaatt ctggaattct agttggatcc aaggccaagc 3360
ccctaagaac attgcgccaa cactgttcaa gaaggaaaag aggaagaaca tcacggtcgc 3420
caaagcgctc actaacaaca attggattcg tttatgctca ccatacacgg gtgaggggga 3480
gtttagagag gtcgtctctc tttggcaggc cataggtaac atgcaagagc ttaacggttt 3540
ggaagacaac atctcttgga gatggacggc agatgggcag tacagtgcta gcagtgcata 3600
caaaatccag ttcgcatcca atttcactaa aatgaacctc tgccctattt ggaaggctaa 3660
agtggaaccg aaatgccgat tttttgcttg gacactactt cataagagaa ttctgactgc 3720
cgataacctt cataaaagag gttgcaactc agcctcagaa acaattcccc acttatgcaa 3780
ggattgcccc tttagtagag aggtgtggaa caaagttttg tctcgggcca actttccttt 3840
actgactggg tctcccagtg acacttcttt gtatgattgg tggacggaca tgtgcagcct 3900
ttgcagcaga caggcaagaa gaggtttcga cggtctgcta tttcactttt ggtggaactt 3960
atggctggaa agaaataaca gaatctttca aaggcagcgt agaagtgtag atcaagttgc 4020
tctggcagtc aaggattatg ctagtagctg aagtctagtt ggtttggact agtggttttg 4080
ttgcttttct ttttaatttc tttttagttc tttttatgtt gttttcgttt ccttaagttg 4140
cttggagtct gtattatcct ctttcttcta atatagatcg gagcgacaaa ccttttgccc 4200
cttcctttca aaaaaaagtt aaaagggaat ttaactgctt tcctagtggt gtagttaaaa 4260
tggatttcat attgcggcct ttcctagctt gcttgctatt gattggacta tagtgatcca 4320
aatgctgata actttgtcgc ttgtgtaggc atggttagag agcttagagt ttgcatttat 4380
tcaatacctt gagactgcat ttcatataca taaattattc atgattattt cttttctcta 4440
tttgttctgg ttaattaaga gttttaggtt tccatatttt tgtacgtgca tcatttaaat 4500
tcttgtattg tttttcgttc ttgtctacag gcagcagaat tccacttgat agaactgttt 4560
gaaatggcga atctgtgtgc catccatgcc aagcgtgtca caatcagtaa gttatcactg 4620
agtgaactcc tttttctctg tagcattact cctaatgaat atgtgtgatg cattttggtt 4680
gcacgattct ttagtgattc tgcttcagat ggatatgata aatctagatg ttattttgaa 4740
gtggcgaatt gcttacgagc ggaaatagta atgttcaaat agcgcaaagt gcaactgttg 4800
acttttagta ggccatttat atggtttgat taccaacaaa tacgtcaatc atatgatttg 4860
attatcaaca aaggaatcag ctatatggtt tgattatcaa caaaggaatc agctaggttt 4920
gcttatcaac attcaacaaa ggcatcaagt aatactccat ccgtttcaat ttataattcg 4980
tttgactttt tttatctaag tttgatcggc tcgacttatt aaaaaaaatc ataattattg 5040
ttaatttttg ttgtgatatt gtttagtata atatacttta aatgtgactt tgagtttttc 5100
attttttcgc aaaaaaaaat gaataggacg agccggtcaa acgtgacaca aaaaagtcaa 5160
acgaattata atttgggaca cacggagtag taaataatgt aacaacttag agagtgggac 5220
aaaaaaatct ctagtggtgc taaatttagt tcagctttgt ataaacacaa gcattgattg 5280
agaaatctga caactcaagg atctgtagga aatgtgttac cctaaatgtt ttccttactg 5340
atgcagtgca aaaggacata caacttgcaa ggcgtatcgg aggaaggcgt tgggcatgat 5400
atataatatc cattctgatt gcatcattct tgtgaatttg tttgtaggag ctagacatta 5460
gtgttgttga atgctgcatg gttcctaatc cttttcgcag tctaacatct gtggagttag 5520
tatgttacat ggcaacagct gaacatctgt ggactatatg gcaacagccg aagattgtgt 5580
ctgtgggata actggttgtt ttggttgctc ttcagtagtt tgtttgcttc aggtaaccat 5640
gctgcgaact atgatgtttt cattctcggt ttgcttcagc taaccgagat cgattcagtc 5700
tgcagtatgg actatggagt aaactgcatg ctgaaacccg aaccactgct gaaactgcat 5760
gctgaaaccc gaaccactgc tacggcagtt gccaggatag caggagggcc tttatgcaca 5820
gtggaattga gtag 5834
<210> 19
<211> 471
<212> DNA
<213> Artificial Sequence
<220>
<223> Zea mays - cDNA coding for CENH3
<400> 19
atggctcgaa ccaagcacca ggccgtgagg aagacggcgg agaagcccaa gaagaagctc 60
cagttcgagc gctcaggtgg tgcgagtacc tcggcgacgc cggaaagggc tgctgggacc 120
gggggaagag cggcgtctgg aggtgactca gttaagaaga cgaaaccacg ccaccgctgg 180
cggccaggga ctgtagcgct gcgggagatc aggaagtacc agaagtccac tgaaccgctc 240
atcccctttg cgcctttcgt ccgtgtggtg agggagttaa ccaatttcgt aacaaacggg 300
aaagtagagc gctataccgc agaagccctc cttgcgctgc aagaggcagc agaattccac 360
ttgatagaac tgtttgaaat ggcgaatctg tgtgccatcc atgccaagcg tgtcacaatc 420
atgcaaaagg acatacaact tgcaaggcgt atcggaggaa ggcgttgggc a 471
<210> 20
<211> 157
<212> PRT
<213> Zea mays
<400> 20
Met Ala Arg Thr Lys His Gln Ala Val Arg Lys Thr Ala Glu Lys Pro
1 5 10 15
Lys Lys Lys Leu Gln Phe Glu Arg Ser Gly Gly Ala Ser Thr Ser Ala
20 25 30
Thr Pro Glu Arg Ala Ala Gly Thr Gly Gly Arg Ala Ala Ser Gly Gly
35 40 45
Asp Ser Val Lys Lys Thr Lys Pro Arg His Arg Trp Arg Pro Gly Thr
50 55 60
Val Ala Leu Arg Glu Ile Arg Lys Tyr Gln Lys Ser Thr Glu Pro Leu
65 70 75 80
Ile Pro Phe Ala Pro Phe Val Arg Val Val Arg Glu Leu Thr Asn Phe
85 90 95
Val Thr Asn Gly Lys Val Glu Arg Tyr Thr Ala Glu Ala Leu Leu Ala
100 105 110
Leu Gln Glu Ala Ala Glu Phe His Leu Ile Glu Leu Phe Glu Met Ala
115 120 125
Asn Leu Cys Ala Ile His Ala Lys Arg Val Thr Ile Met Gln Lys Asp
130 135 140
Ile Gln Leu Ala Arg Arg Ile Gly Gly Arg Arg Trp Ala
145 150 155
<210> 21
<211> 8441
<212> DNA
<213> Beta vulgaris
<220>
<221> Intron
<222> (99 )..(203)
<220>
<221> Intron
<222> (245 )..(331)
<220>
<221> Intron
<222> (344)..(488)
<220>
<221> Intron
<222> (591)..(3263)
<220>
<221> Intron
<222> (3339)..(4377)
<220>
<221> Intron
<222> (4458)..(8130)
<400> 21
ctactctttc tctctctctc tctctccatt tctgtttgaa atcatgagag ttaaacacac 60
tgctgccagg aaatcaacca ccaacggtcc tcgttcaagt tagtttcctc tctcttcttc 120
ttttttgttc gcattctctc aatctatatt tcaaatttga aaaaaattgt gatgctcata 180
aaccctaaaa ttttcttgta cagaggctca gaaatctccg cgcagtttgc aatcaccaca 240
atcggttctc tctttgtact tttgatttgt ttttccttca tttgttcgat gaatggctct 300
taattgtctt ttatttactt gaaaattgca gccttctagt agttcaaagc gcaaatcact 360
cagaaacact gatgcaactc ctcaaagtaa ctttttcttt aatattaggt ttaattttac 420
tgctgtttgc caaattctgt tgaaattgta aaatattttt tttcttaaat ttgacggttt 480
cagagaagaa ggcttaccgc cgtaagccgg gcactgtggc actctgggaa atacgcaaat 540
ttcagaagtc attcaagccc ttgattcctg ctgcgccttt cattcgaaca gtatgtattt 600
tttttgtttg tacttaataa atgaattttg gactggtgtt tgtgtggctg catagaaata 660
tatttccata caactgaaat tgtcctagga ggtatcgatg aatgtttgct acaaaataaa 720
taaatataag tgattatatc ttgttaaaaa gccattataa ttgcaactta tatgtatgtt 780
gtaatgaggt caactagcta ttttgtgcaa agtcacccac actttaacat aattttgtgc 840
tctcgtaacc ttaaaaaaat ataagtaaag ggttgatttg gtctaattag agctgatgaa 900
acccaattag attgaaacat aaggtgaaat caggtggtga tcagcttcaa ttagatctaa 960
taagtgcagt ttagtttagc ttcggtgaaa tgaacacacc cttaaagata gaaaatcgac 1020
actatatatg gtccttttta gatatgatag ttcgatattc tgttttgggg tgtgttgaat 1080
gattaaatgg agtggtgaat agctgatggg aactagagaa gatgctcagt agacagttat 1140
tgtggagact atattactga ttacccctgt ttctgagtgg ttaggacaat gtgacaattg 1200
attttgggta ttatttgtag atgtttttct ttttgttaaa agtgccaaga taggtgtgca 1260
gttgctgatt ctcagtttgc taagaattag ctgtgtctgt atttcgtacc tcagttgatt 1320
ctaagtgaac atttctttga attgatgctt tgttcttgca tcatgcaact tggtgaagct 1380
ttcttgtagt tgctccagtg gcaatctagt ctggtatgtt tagaactctt gtgatggtat 1440
gagttcatca agatattggt gatccaatta gcctaaccaa tgttttttac cccctattgt 1500
cactgactta tactccctta tctataaaaa taattgtgac attgatccat ctcctcacaa 1560
tcattaatat tatatgtact gaccatcttt acactctcaa cactgaatct aagtagggga 1620
attttgggaa attcaatgat gaactagtac acccttcttc ccaataatat tgttgacctt 1680
tttattttga tttgtcccat attgtcctct ttggtaattt aatgtatatt cacccaattt 1740
tcttttcaat acccactata ccaacatata attggttaat tcatttttat taattatatt 1800
tcctaagagc ttgttgtgta aacgtggatg aatttgtagg catggatgaa gtattgttat 1860
aatgaggtga caacattact taatttcgaa ctgagggaca gagggatatg atgataaaac 1920
aacttttgct tgcttcttaa actcagaaga tagggtttac accaagtggc atgtaaaagt 1980
cactagatga ttatctatta caagggcttg tacaatctga agtacgatag gatttgaagt 2040
taacaacatt catcgaaagc tcataacttg tccttatatc aatataagtt gctggcatgt 2100
gaaattgcgt tgcaagcatc catgagctag ctcaactatt aactattaaa ctttatattt 2160
ttgcttgatc tagtatgagt cctactattt agtttctcca tctaccttaa tatgtcgcat 2220
acaccaacta atcattatcg ctagaatcaa taaacaaagc tttctttcct taggtgtatt 2280
agtacctagc tcctgtaata ccaagagcac ccaaattggg aagaaaaagt agaattggct 2340
catatctcta atcctacatt gatcattgaa aaggacctta aggttctcat actgaaacat 2400
catctttttg agcaggatat ctacgtagac gacaagaaag actactttgg ttgcccgtgc 2460
atttgagtgc atcagacaac ttctttacca ctgtctaacg gcttgctttg gccatattgt 2520
ggtcttctat gccaaaatta atgatatttc ttggcaccgc gctaatgata ttactgaatg 2580
cggatatcgt acgattagaa tttattcaaa gtaggtagca attactagtt ttgagcattg 2640
agtttcaata attagtaaat taagtgctaa acttgtacat tttggctaca tgtatttgaa 2700
ttagaattgg tacgaggaaa tatagcaaca ttacgggcaa tgttcactca agtagaagcc 2760
attacatcaa atagtactag ttgaagtatt agttctcata atactaatca ttgtcattaa 2820
tggaatattg gaacgtaaat gcctttaagg tgctgtagtt ttagtagaaa ttctactatt 2880
ctagtatgat aatgcaattt attgaaactg tttgtaagat agcttggatc ccacatcagt 2940
cttgatgcta aataaatgga tgtccataat cttctaatct ttaatttgtg tctcttacca 3000
aacgagaaaa aataggagaa atccaatttg catgacctca ataaggaaat gttgttaatg 3060
tgtgatgctt gtttctcatt tatagtctag agagagttat catgtccaag attgcagtct 3120
tggtactgag aaagtttgat tgttggttgg ctgcttcttg agcctctttt ttttagagta 3180
agacacttcc tagatataat tttctttatt tttttgtaaa ttccatatat actactacat 3240
taacaggttt aagtttatat taggtgagag agattactca ccagtttgct ccttatgttg 3300
gtcgttggca agctgaagct ctgatggccc ttcaagaggt gcagaccaac tcttttagcc 3360
tttttttttc tggcatgtca agtgtggcta ttagattttc tgtgtgattc tcactcccat 3420
atatctatat atgtacatat taaagcacat tgatacctat cttgtcagat gtggtctttt 3480
caattctttt ctaagttgag attcttctct tggtcgtaga tatgctcctg ccgaaatata 3540
ctgctgtctt gttatccatc atgacttggt tatgcttgta tctgggcatt atcttggcat 3600
gcttaaaaac aagtattgaa cgagcctcct attgataaat tttactatta atattggatg 3660
gcttctcaaa ttctaatggc agtgagatac tgttaagttg ggagaaatag attaagaaac 3720
agaaagatgt ttaccatgag agcaattgaa atagaaaata gagtaacttt ttgcaaagat 3780
tttggtcctt tagattgttg aatactacct gataatgaag cattttctaa atttatgtgc 3840
tttctatcta tcagatactg gaatacaatc aaattcctat cacgtactga gcattgtgat 3900
cagattcttg cttgcttcct atcacatact ggaatccttt tgattgttga atacaaagat 3960
aatgaagcat tctctaactt tatgtgctgt aactacttat aatgattctt gcttgcctcc 4020
tatcacgtac tcaaatcctt tgtttgattt gtctcttata agaggaactt cctgtctttc 4080
tttgtcatga cttagtattt atagaggtgc caacttatgg ccttgacaac tgaagctttt 4140
atgcaaactc cggattttgt tgatggaagt acaagtaaca ctttagcatg tggattcagg 4200
tctaacggtt aagacttttt aatgaatgtt ttaactgtag tagtttattg atataaaaaa 4260
agtggtctct caaacttttt atgagatcat atcgaagtaa tcaaatttat gattcaggtg 4320
cttctgctat tattcttggt taagcatgtg ctatttttga cagtctgtca attgtaggct 4380
gcagagaatt ttattgtccg tttgtttgaa gatggtatgc tttgtgcaat tcatgccaaa 4440
cgagttacac tcagtgagta tctgatttcc ttcggtggtg ctgctattat gcattatata 4500
cactttgcct caatatcgtt atataaggag tccttgtttt catatttgtt tgatgcatat 4560
gttatatcct gtttagtggc tgctgcagtt gtgaacttac ggcctgtttg attagtggtc 4620
ataaatgatg gtaatactaa tataatttag tataaatttg taaaaaaaat gctaatatca 4680
atatttatgg taatgaaatt ttatcataaa acatgagttc tcttttataa gttttcatta 4740
ctatccaata ccaccttccc aagtggtaat gaacggtaat gaaattttag gaagaaaatg 4800
gatatttggg gattagatag cattaccatg ggtaatgaca tgagattttc tttacaactt 4860
tatactacga tgcattatca ttaccaccat ttatgaccca taaccaaaaa aaccataatg 4920
tgttaggttc atttttcatt tttctaataa tttgcttcat gaattttttc tggagatatc 4980
ttatctagat atttcttgcc aacatgtttc acctgataat tgatcgattt aatagttcag 5040
aactttccaa aaactatgct gctcggtgtt ggctgtcatc catcagttta agaaaactat 5100
tgacatgatt taagcctcgt cctgtactac taggaagggt aaactattgt tgcttccaaa 5160
aatgtctttt aagggcgtgt tcagcaacaa tagttgtagt agtagctttt agctgttagt 5220
tgtgctcgta gctgttagtg gttagtgtgt aactgttagc tgttcaagta gcggtataag 5280
atattgatgt tcggtaaaag aagctgtcaa aatagctgtt tacaaagaat taataaaaaa 5340
ctcaaacaaa gctttaatat ataatttatg caccactaaa gctaccccaa aagctacaaa 5400
ttgtagcttt ttacaaacac tactaaaaca ctacttgtaa cactaaaagc tacttatact 5460
actattttgc caaacattat tattttttct taattagtgt tttgacctag tcaagacact 5520
aaaagctact tgaaaagctt ttgccgaaca cgcccttagt agacaagagg ggggaggggg 5580
tcatcaagaa aatatgatta tactctcaac aaaaaaaaaa tgtaacttaa aaaaaataaa 5640
aataaataat tgactacttc aattaagaaa agaatagaat aaaaacatta cagtggatgt 5700
ctcatccaca tccctaattt aatggcacaa tagaataatt gttttaaatt ttagaaatta 5760
caacacaaga tgtaaattac tcttatcttc ctcttcgtaa tctttttact cttcctttac 5820
ctcttccttt acctctacat aaaatagaga attagagatt gattaagata attataagat 5880
tttagaaaca ttggttaaga aattcttcaa caaacataat caagtaactc cattatttta 5940
gtttagtgac ttgctattta tcaccctaat ttcaccatct accgccctcc ttggacaata 6000
ttgccccttc cactttcttc actcttcctt cctcacgcat cttatcatct ccttccacta 6060
tcacctttaa aaaagtgtgt caggcacaac aaaaacgctt ttatcaaccc acgcgaggcg 6120
aagtacgtca ggcgcaacaa ggcgcgcacc taattctgtc ttttgccaag gctgatggtg 6180
cacttagttt taaaaagcgc agcaaagatg tgcctaggcg caaggcggtg aaaaaattgc 6240
atccgtcagc agcggagtag aggctcacaa caataggtgc gaagaggcgt gcacgtacaa 6300
aagaagcaaa aataagaaac tcaaatatga gacccagtgt ttaacatgta aattcgatac 6360
ccagtgttta acatgtaaat tcgattaaaa gcccttaatt aattgcatga aattaattca 6420
ttttaaccta tactaaaagc cctaatatta gaaaatccta gtttgcaggt tgaggaattt 6480
ggaaaattga tgattgttgg atttgaaaaa attgttgccg gcgatgaatg tgaggtggtt 6540
tatggcacta gagaggttgg cgttcgttgc cgatgaagct ttccaaggtc attctctcct 6600
tgtcttcttc ctatgcctag ctctcttccc tctccttaat cttctcttct tttctattct 6660
ctctctttat cactacatta tgtttatttc tcgttcttcc cctatgtctt tcacttggac 6720
acttcggggg tatcttcatc ttttatctgc aatttgaagt ttgagaagct tccagagtcg 6780
agtgttaaac ttttgcttct ttttttttaa tcttttgccc ttttttctta gtggcccttg 6840
actagtgatg cacatgtgac caattactaa atgagctttt attttgtctc tcttcttttt 6900
caagcaattt tttttaagta aatcatctaa aacaaagtac tatccatttt agttgtgtaa 6960
atggtgctat tttaaaaccg cacaaaaatt aaaaacataa aaataaaggt gtgcttcgca 7020
tacaagatgt atgcgccttc gtcttgcccc ttttgagact aagactacca taagaactta 7080
gtcacttgag aatggaatgg gtgcaagatg gacgacgata attctaaaga cctctagaag 7140
gatagtgtat agtaactaat acgaaccgaa atataagttt aactaaaatt ttaaagtcta 7200
tatttccata tggtatatgc tggaatacac gaaatgtcca gaatttgtag tggaccacga 7260
tccacacgtc ttttcaggat tctaggtgta ttccaacgaa aaatataaga aaaccatatt 7320
ctactatctg gttgttgtca tcctttcctt gccggcgtga cttctcatcc ttttattttt 7380
gtccggtgct ggtgacacac tttcctatga tagtgtggtg caaagtaagg tgatgatatg 7440
gtgttttgta gaggtgtggt gatttttgtg gtggtgggtg gaagaggggt ggttgcatat 7500
agaaaggggt aagagtcaat gaggggtgga aggggacaag gggtatattg gtaaatgcat 7560
gtaacattag ggtggtgttg agtaattttt gggaagttaa tataaactac ccccttttgg 7620
tacaagagag aatacccgaa ctactgctct gatatttttg ttcacgttat ttgatgtaat 7680
tacgcaatta atttgttttc tataagcttc cgcacacaat tgtgcatata aggctagtct 7740
aatatgagac accaacataa ctgactttct tttgcaacga aggtaccttg tcagatttag 7800
aacatagcat caggatttta tttgttgtat ctgtcatcct tgtttattgc tttaattatg 7860
ctttgtatga tgcattttac cacttcgtat gaaaaaaagt gaaatttcat ttagtggtca 7920
tttacatatt acgagttgtg gacatgtttg aacatttgat tttggaaatt ttaagcctca 7980
tattatggag atttattgga cacaaatata gccataattc tccatcaact tgtttctaga 8040
agtgttgctc ttcctgatgt acttgaattc taattaggtt ttatcagaca ttatattata 8100
atgatatgat ttacaatttg ttgtagtgaa aaaggatttg gagctcgcgc gaaggattgg 8160
gggcagagag aggggatggt aactaaacaa cacagatgac tcatttattt aagggccaac 8220
aattgaattc gctgttgatt tcatctgtat atactgctct aggcttctat tccaatgtaa 8280
tttataaatc caaggttagt agcatgttaa gctttgtatt cagtataatg agacttatat 8340
tttgcagttg agattttagt tgtttgatgt gacttgtaaa ttgtaacttg taagtgacgt 8400
cttgaggatt atcgggacaa tatactattt tttttttcaa a 8441
<210> 22
<211> 462
<212> DNA
<213> Artificial Sequence
<220>
<223> Sorghum bicolor - cDNA coding for CENH3
<400> 22
atgagagtta aacacactgc tgccaggaaa tcaaccacca atggtcctcg ttcaaaggct 60
cagaaatctc cgcgcagttt gcaatcacca caatcgcctt ctagtagttc aaagcgcaaa 120
tcacgcagaa acactgatgc aactcctcaa aagaagaagg cttaccgccg taagccgggc 180
actgtggcac tctgggaaat acgcaaattt cagaagtcat tcaagccctt gattcctgct 240
gcgcctttca ttcgaacagt gagagagatt actcaccagt ttgctcctta tgttggtcgt 300
tggcaagctg aagctctgat ggcccttcaa gaggctgcag agaattttat tgtccgtttg 360
tttgaagatg gtatgctttg tgcaattcat gccaaacgag ttacactcat gaaaaaggat 420
ttggagctcg cgcgaaggat tgggggcaga gagaggggat gg 462
<210> 23
<211> 154
<212> PRT
<213> Beta vulgaris
<400> 23
Met Arg Val Lys His Thr Ala Ala Arg Lys Ser Thr Thr Asn Gly Pro
1 5 10 15
Arg Ser Lys Ala Gln Lys Ser Pro Arg Ser Leu Gln Ser Pro Gln Ser
20 25 30
Pro Ser Ser Ser Ser Lys Arg Lys Ser Arg Arg Asn Thr Asp Ala Thr
35 40 45
Pro Gln Lys Lys Lys Ala Tyr Arg Arg Lys Pro Gly Thr Val Ala Leu
50 55 60
Trp Glu Ile Arg Lys Phe Gln Lys Ser Phe Lys Pro Leu Ile Pro Ala
65 70 75 80
Ala Pro Phe Ile Arg Thr Val Arg Glu Ile Thr His Gln Phe Ala Pro
85 90 95
Tyr Val Gly Arg Trp Gln Ala Glu Ala Leu Met Ala Leu Gln Glu Ala
100 105 110
Ala Glu Asn Phe Ile Val Arg Leu Phe Glu Asp Gly Met Leu Cys Ala
115 120 125
Ile His Ala Lys Arg Val Thr Leu Met Lys Lys Asp Leu Glu Leu Ala
130 135 140
Arg Arg Ile Gly Gly Arg Glu Arg Gly Trp
145 150
<210> 24
<211> 4597
<212> DNA
<213> Artificial Sequence
<220>
<223> Z. mays CENH3-Mu-mutation
<220>
<221> misc_recomb
<222> (676)..(685)
<223> transposon insertion
<400> 24
agagacggaa agagtatata tatttgtttt gctattattt aaagtattaa aagatagtgg 60
acgaatgaac gtcctctatg tttaaaagaa cgttttagag gacgttgtgt tgttgaagga 120
aatatgaaaa aaaaatcttc tgcatattta gaagggagga gcgtttacac attactttcg 180
ggacttcaac ccaaatatgt caaggtttgt gagtggctca gtgcggaaaa aaaatcctat 240
atataccaga tgtaaacact atcttttaca gcctatcaca ttcacattta gaggttcaca 300
aagatagatc aaaatttata aaataatcat ttaatatttt ttttatttta tttatatgga 360
taagcagctg gtgtatgtga ggagctgtaa aagatatttt ttacatccga gatgtaaaga 420
ttttttttaa ctcaatgctg gttaccggct gggaggacga tgataaagaa agcatctctc 480
actgcattcc gggcccacta ctcaaacgtt cggcacgcca ggttggcagg tagccgttac 540
atcgataggc actcggccac tcgcacgcag acaccacacc agtgtgctca gtgctcactg 600
ctcaccataa taacgctgca cctcttttca tttcaccatc tcctgccccc ttaaaaaaaa 660
gactcaccgt cgacacgccc tcccgtcccg agagttctga atcgaaaccg tcggccacga 720
gagcagtgcg aggcgcccac cgcgatggct cgaaccaagc accaggccgt gaggaagacg 780
gcggagaagc ccaagaagaa gctccagttc gagcgctcag gtaacccggg tcccgcgctc 840
ccccccgctt cgcaagcaga cgctgtcgct tctctccgac cctggtgcta agcacgttcc 900
ttgttccgtc ttttgcaggt ggtgcgagta cctcggcgac gccggtgagc gcgtgcgtgc 960
ggggatcagt tccctccttt tgcctttttt tgttgggctg ctcttacttg cttgcaagct 1020
gtttgatgga atgcaggaaa gggctgctgg gaccggggga agagcggcgt ctggaggtga 1080
ctcaggtgag gacctatttg tcgttgctgg atgctgggtt tcgcttgcaa tctaattttg 1140
ttgcaagatg agggcgaatg tgccagttcc atgtgggtgt catggtctcg gagttactac 1200
cttaattgct caccatagta tgttttctta aaaaaaacag ttaagaagac gaaaccacgc 1260
caccgctggc ggccagggac tgtagcgctg cgggagatca ggaagtacca gaagtccact 1320
gaaccgctca tcccctttgc gcctttcgtc cgtgtggtgg gtgcaggcgt gtttgtcctc 1380
tgcatagtat ggggttgttc cgcattctgt ctaatggaaa gttattcttc tgagaaaaaa 1440
aatgcaggtg agggagttaa ccaatttcgt aacaaacggg aaagtagagc gctataccgc 1500
agaagccctc cttgcgctgc aagaggtcag ttatgaaaaa tgtcttatct ctctgttaag 1560
atcctcttca tatacatagt tgctattgct atcgtgaagt cttttttttc tgttaattgg 1620
tctggtacta cttactagtc aggatttcat attgcggttt ttcctagtgg tgtgtagtta 1680
aaaagtagtt taattgcttt tagttaaaag gggtgttcag ggctaaagat caactatgag 1740
aaaacagaaa ttttcccaat tcgatacccg acagcattat ggcctgcgct aatggaggtg 1800
tttccgggca aatactctag cctacctggg aagtaccttg ggttgcccct tcatttcagg 1860
aaagtaaaaa ggaatgatct tcaacctcta atcgaaaaaa tcaacaacag gctggccttg 1920
ctggaaaggc aagatgttgt ccaaggctgg tatagaaact cttgtaaaat cgatgctatc 1980
cgcacaacca atctaccatc taatggtttt tccacctcaa aaatggctgc tgcaaacaat 2040
tgacaaaata cgaagaaact tcctgtggag agggagcaat ccagaagttt gcagcggggg 2100
tcactgcctc gtcaactggc ccgtaacttg cctcccaaag aacaagggag gtcttggaat 2160
tctggacctt gatcgttttg cgagggggct aagactaaga tggctgtggc tacgatggaa 2220
gagcaaagat agggcgtgga ctgccttgaa gcttccttgt gacaaaactg atgaagatct 2280
cttcaatgct tccacaactg tcacggtagg caatggaaag atagctgaat tctggaattc 2340
tagttggatc caaggccaag cccctaagaa cattgcgcca acactgttca agaaggaaaa 2400
gaggaagaac atcacggtcg ccaaagcgct cactaacaac aattggattc gtttatgctc 2460
accatacacg ggtgaggggg agtttagaga ggtcgtctct ctttggcagg ccataggtaa 2520
catgcaagag cttaacggtt tggaagacaa catctcttgg agatggacgg cagatgggca 2580
gtacagtgct agcagtgcat acaaaatcca gttcgcatcc aatttcacta aaatgaacct 2640
ctgccctatt tggaaggcta aagtggaacc gaaatgccga ttttttgctt ggacactact 2700
tcataagaga attctgactg ccgataacct tcataaaaga ggttgcaact cagcctcaga 2760
aacaattccc cacttatgca aggattgccc ctttagtaga gaggtgtgga acaaagtttt 2820
gtctcgggcc aactttcctt tactgactgg gtctcccagt gacacttctt tgtatgattg 2880
gtggacggac atgtgcagcc tttgcagcag acaggcaaga agaggtttcg acggtctgct 2940
atttcacttt tggtggaact tatggctgga aagaaataac agaatctttc aaaggcagcg 3000
tagaagtgta gatcaagttg ctctggcagt caaggattat gctagtagct gaagtctagt 3060
tggtttggac tagtggtttt gttgcttttc tttttaattt ctttttagtt ctttttatgt 3120
tgttttcgtt tccttaagtt gcttggagtc tgtattatcc tctttcttct aatatagatc 3180
ggagcgacaa accttttgcc ccttcctttc aaaaaaaagt taaaagggaa tttaactgct 3240
ttcctagtgg tgtagttaaa atggatttca tattgcggcc tttcctagct tgcttgctat 3300
tgattggact atagtgatcc aaatgctgat aactttgtcg cttgtgtagg catggttaga 3360
gagcttagag tttgcattta ttcaatacct tgagactgca tttcatatac ataaattatt 3420
catgattatt tcttttctct atttgttctg gttaattaag agttttaggt ttccatattt 3480
ttgtacgtgc atcatttaaa ttcttgtatt gtttttcgtt cttgtctaca ggcagcagaa 3540
ttccacttga tagaactgtt tgaaatggcg aatctgtgtg ccatccatgc caagcgtgtc 3600
acaatcagta agttatcact gagtgaactc ctttttctct gtagcattac tcctaatgaa 3660
tatgtgtgat gcattttggt tgcacgattc tttagtgatt ctgcttcaga tggatatgat 3720
aaatctagat gttattttga agtggcgaat tgcttacgag cggaaatagt aatgttcaaa 3780
tagcgcaaag tgcaactgtt gacttttagt aggccattta tatggtttga ttaccaacaa 3840
atacgtcaat catatgattt gattatcaac aaaggaatca gctatatggt ttgattatca 3900
acaaaggaat cagctaggtt tgcttatcaa cattcaacaa aggcatcaag taatactcca 3960
tccgtttcaa tttataattc gtttgacttt ttttatctaa gtttgatcgg ctcgacttat 4020
taaaaaaaat cataattatt gttaattttt gttgtgatat tgtttagtat aatatacttt 4080
aaatgtgact ttgagttttt cattttttcg caaaaaaaaa tgaataggac gagccggtca 4140
aacgtgacac aaaaaagtca aacgaattat aatttgggac acacggagta gtaaataatg 4200
taacaactta gagagtggga caaaaaaatc tctagtggtg ctaaatttag ttcagctttg 4260
tataaacaca agcattgatt gagaaatctg acaactcaag gatctgtagg aaatgtgtta 4320
ccctaaatgt tttccttact gatgcagtgc aaaaggacat acaacttgca aggcgtatcg 4380
gaggaaggcg ttgggcatga tatataatat ccattctgat tgcatcattc ttgtgaattt 4440
gtttgtagga gctagacatt agtgttgttg aatgctgcat ggttcctaat ccttttcgca 4500
gtctaacatc tgtggagtta gtatgttaca tggcaacagc tgaacatctg tggactatat 4560
ggcaacagcc gaagattgtg tctgtgggat aactggt 4597

Claims (16)

1.具有单倍体诱导物的生物活性且包含多核苷酸的植物,所述多核苷酸包含编码着丝粒组蛋白H3(CENH3)蛋白的核苷酸序列,其中所述多核苷酸包含至少一个突变,所述突变引起CENH3蛋白的氨基酸序列改变,并且所述改变赋予单倍体诱导物的生物活性。
2.权利要求1的植物,其中引起所述改变的至少一个突变是点突变、至少一个核苷酸的***或缺失,或者剪接位点中的突变,和/或所述改变是一个或多个氨基酸的取代、一个或多个氨基酸的***或者一个或多个氨基酸的缺失。
3.权利要求1或2的植物,其中所述至少一个突变在选自以下的至少一个CENH3蛋白氨基酸序列片段中引起CENH3蛋白的氨基酸序列改变:
a)对应于SEQ ID NO:11中示出的源自拟南芥(Arabidopsis thaliana)的CENH3蛋白的SEQ ID NO:10中示出的位置1-位置246的核苷酸的N-末端结构域,
b)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置247-位置291的核苷酸的αN-螺旋,
c)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置307-位置339的核苷酸的α1-螺旋,
d)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置340-位置378的核苷酸的环1,
e)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置379-位置465的核苷酸的α2-螺旋,
f)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置466-位置486的核苷酸的环2,
g)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置487-位置516的核苷酸的α3-螺旋,或者
h)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置517-位置534的核苷酸的C-末端结构域。
4.前述权利要求中任一项的植物,其中所述至少一个突变引起表1、表2、表3、表4、表5、表6、表7或表8中定义的确定或不确定的氨基酸的氨基酸取代或缺失,或者SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8或SEQ ID NO:9的确定或不确定的氨基酸的氨基酸取代或缺失。
5.前述权利要求中任一项的植物,其中所述至少一个突变引起选自以下片段中的确定或不确定的氨基酸的取代:
a)N-末端尾部结构域,其中
i.在SEQ ID NO:1的位置3的氨基酸精氨酸被取代,优选取代为赖氨酸,或者
ii.在SEQ ID NO:23的位置2的氨基酸精氨酸被取代,优选取代为赖氨酸,或者
iii.在SEQ ID NO:1的位置10的氨基酸精氨酸被取代,优选取代为苯丙氨酸,或者
iv.在SEQ ID NO:14的位置9的氨基酸丝氨酸被取代,优选取代为苯丙氨酸,或者
v.在SEQ ID NO:14的位置16的氨基酸精氨酸被取代,优选取代为谷氨酰胺,或者
vi.在SEQ ID NO:14的位置24的氨基酸丝氨酸被取代,优选取代为亮氨酸,或者
vii.在SEQ ID NO:14的位置24的氨基酸丝氨酸被取代,优选取代为亮氨酸,或者
viii.在SEQ ID NO:17的位置25的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者
ix.在SEQ ID NO:14的位置29的氨基酸谷氨酸被取代,优选取代为赖氨酸,或者
x.在SEQ ID NO:14的位置30的氨基酸甘氨酸被取代,优选取代为天冬氨酸,或者
xi.在SEQ ID NO:14的位置33或在SEQ ID NO:20的位置32的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者
xii.在SEQ ID NO:14的位置35的氨基酸脯氨酸被取代,优选取代为亮氨酸,或者
xiii.在SEQ ID NO:20的位置35的氨基酸谷氨酸被取代,优选取代为赖氨酸,或者
xiv.在SEQ ID NO:14的位置41的氨基酸丝氨酸被取代,优选取代为天冬酰胺,或者
xv.在SEQ ID NO:14的位置43的氨基酸甘氨酸被取代,优选取代为谷氨酸,或者
xvi.在SEQ ID NO:14的位置50的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者
xvii.在SEQ ID NO:14的位置55的氨基酸脯氨酸被取代,优选取代为亮氨酸,或者
xviii.在SEQ ID NO:14的位置57的氨基酸甘氨酸被取代,优选取代为天冬氨酸,或者
xix.在SEQ ID NO:14的位置61的氨基酸甘氨酸被取代,优选取代为谷氨酸,或者
xx.在SEQ ID NO:14的位置65的氨基酸精氨酸被取代,优选取代为谷氨酰胺,或者
xxi.在SEQ ID NO:14的位置65的氨基酸精氨酸被取代,优选取代为终止信号,或者
xxii.在SEQ ID NO:14的位置71的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者
xxiii.在SEQ ID NO:23的位置46的氨基酸天冬氨酸被取代,优选取代为天冬酰胺或甘氨酸,或者
xxiv.在SEQ ID NO:2的位置7的氨基酸赖氨酸被取代,优选取代为丝氨酸,或者
xxv.在SEQ ID NO:20的位置56的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者
xxvi.在SEQ ID NO:2的位置14的氨基酸脯氨酸被取代,优选取代为缬氨酸,或者
xxvii.在SEQ ID NO:17的位置62的氨基酸丙氨酸被取代,优选取代为缬氨酸,或者
b)αN-螺旋,其中
i.在SEQ ID NO:3的位置2的氨基酸苏氨酸被取代,优选取代为丝氨酸,或者
ii.在SEQ ID NO:17的位置64的氨基酸苏氨酸被取代,优选取代为丝氨酸,或者
c)α1-螺旋,其中
i.在SEQ ID NO:4的位置1的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者
ii.在SEQ ID NO:14的位置105的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者
iii.在SEQ ID NO:4的位置6的氨基酸精氨酸被取代,优选取代为谷氨酰胺,或者
iv.在SEQ ID NO:14的位置110的氨基酸精氨酸被取代,优选取代为谷氨酰胺,或者
v.在SEQ ID NO:20的位置89的氨基酸缬氨酸被取代,优选取代为甲硫氨酸,或者
vi.在SEQ ID NO:4的位置10的氨基酸谷氨酸被取代,优选取代为天冬酰胺,或者
vii.在SEQ ID NO:14的位置114的氨基酸丝氨酸被取代,优选取代为天冬酰胺,或者
d)环1,其中
i.在SEQ ID NO:5的位置2的氨基酸天冬酰胺被取代,优选取代为缬氨酸,或者
ii.在SEQ ID NO:17的位置95的氨基酸丙氨酸被取代,优选取代为缬氨酸,或者
iii.在SEQ ID NO:5的位置6的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者
iv.在SEQ ID NO:14的位置121的氨基酸脯氨酸被取代,优选取代为丝氨酸,或者
v.在SEQ ID NO:5的位置12的氨基酸色氨酸被取代,优选取代为终止信号,或者
vi.在SEQ ID NO:14的位置127的氨基酸色氨酸被取代,优选取代为终止信号,或者
e)α2-螺旋,其中
i.在SEQ ID NO:6的位置1的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者
ii.在SEQ ID NO:20的位置107的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者
iii.在SEQ ID NO:6的位置4的氨基酸亮氨酸被取代,优选取代为苯丙氨酸或谷氨酰胺,或者
iv.在SEQ ID NO:14的位置132或SEQ ID NO:23的位置106的氨基酸亮氨酸被取代,优选取代为苯丙氨酸或谷氨酰胺,或者
v.在SEQ ID NO:6的位置7的氨基酸亮氨酸被取代,优选取代为脯氨酸,或者
vi.在SEQ ID NO:23的位置109的氨基酸亮氨酸被取代,优选取代为脯氨酸,或者
vii.在SEQ ID NO:6的位置8的氨基酸谷氨酰胺被取代,优选取代为终止信号或亮氨酸,或者
viii.在SEQ ID NO:20的位置114或SEQ ID NO:23的位置110的氨基酸谷氨酰胺被取代,优选取代为终止信号或亮氨酸,或者
ix.在SEQ ID NO:6的位置10的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者
x.在SEQ ID NO:14的位置138的氨基酸丙氨酸被取代,优选取代为苏氨酸,或者
xi.在SEQ ID NO:6的位置25的氨基酸半胱氨酸被取代,优选取代为酪氨酸,或者
xii.在SEQ ID NO:14的位置153的氨基酸半胱氨酸被取代,优选取代为酪氨酸,或者
xiii.在SEQ ID NO:6的位置26的氨基酸丙氨酸被取代,优选取代为缬氨酸,或者
xiv.在SEQ ID NO:14的位置154的氨基酸丙氨酸被取代,优选取代为缬氨酸,或者
f)环2,其中
i.在SEQ ID NO:7的位置2的氨基酸精氨酸被取代,优选取代为组氨酸,或者
ii.在SEQ ID NO:14的位置159的氨基酸精氨酸被取代,优选取代为组氨酸,或者
iii.在SEQ ID NO:7的位置3的氨基酸缬氨酸被取代,优选取代为异亮氨酸,或者
iv.在SEQ ID NO:14的位置160的氨基酸缬氨酸被取代,优选取代为异亮氨酸,或者
v.在SEQ ID NO:7的位置4的氨基酸苏氨酸被取代,优选取代为异亮氨酸,或者
vi.在SEQ ID NO:20的位置139的氨基酸苏氨酸被取代,优选取代为异亮氨酸,或者
g)α3-螺旋,其中
i.在SEQ ID NO:8的位置2的氨基酸天冬氨酸被取代,优选取代为天冬酰胺,或者
ii.在SEQ ID NO:14的位置166的氨基酸天冬氨酸被取代,优选取代为天冬酰胺,或者
iii.在SEQ ID NO:8的位置4的氨基酸谷氨酸被取代,优选取代为赖氨酸,或者
iv.在SEQ ID NO:14的位置168的氨基酸谷氨酸被取代,优选取代为赖氨酸,或者
v.在SEQ ID NO:8的位置8的氨基酸精氨酸被取代,优选取代为组氨酸,或者
vi.在SEQ ID NO:14的位置172的氨基酸精氨酸被取代,优选取代为组氨酸,或者
vii.在SEQ ID NO:8的位置9的氨基酸亮氨酸被取代,优选取代为苯丙氨酸,或者
viii.在SEQ ID NO:14的位置173的氨基酸亮氨酸被取代,优选取代为苯丙氨酸,或者
ix.在SEQ ID NO:8的位置10的氨基酸甘氨酸被取代,优选取代为谷氨酸,或者
x.在SEQ ID NO:14的位置174或SEQ ID NO:20的位置152的氨基酸甘氨酸被取代,优选取代为谷氨酸,或者
h)C-末端结构域,其中
i.在SEQ ID NO:9的位置3的氨基酸甘氨酸被取代,优选取代为组氨酸,或者
ii.在SEQ ID NO:20的位置155的氨基酸精氨酸被取代,优选取代为组氨酸,或者
iii.在SEQ ID NO:9的位置4的氨基酸精氨酸被取代,优选取代为赖氨酸,或者
iv.在SEQ ID NO:14的位置178的氨基酸精氨酸被取代,优选取代为赖氨酸,或者
v.在SEQ ID NO:17的位置157的氨基酸丝氨酸被取代,优选取代为亮氨酸。
6.前述权利要求中任一项的植物,其中所述植物与野生型植物或表达野生型CENH3蛋白的植物之间的杂交产生至少0.1%单倍体后代。
7.前述权利要求中任一项的植物,其中包含所述至少一个突变的多核苷酸是内源基因或转基因。
8.前述权利要求中任一项的植物的部分,其优选是地上部分营养器官、根、花或花器官、种子、果实、胚珠、胚、植物组织或细胞。
9.一种产生单倍体植物的方法,所述方法包括以下步骤:
a)将权利要求1-7的植物与表达野生型CENH3蛋白的植物杂交,以及
b)鉴定从所述杂交步骤产生的单倍体后代植物。
10.一种产生双单倍体植物的方法,所述方法包括以下步骤:
a)将权利要求1-7的植物与表达野生型CENH3蛋白的植物杂交,
b)鉴定从所述杂交步骤产生的单倍体后代植物,以及
c)将所述单倍体后代植物转变为双单倍体植物,优选通过秋水仙素处理或通过染色体自然加倍法转变。
11.一种促进细胞质交换的方法,所述方法包括以下步骤:
x)将权利要求1-7的植物作为胚珠亲本与作为花粉亲本的表达野生型CENH3蛋白的植物杂交,以及
y)获得包含花粉亲本染色体和胚珠亲本细胞质的单倍体后代植物。
12.一种产生权利要求1-7的植物的方法,所述方法包括以下步骤:
i)使植物的种子经受足量的诱变剂,优选甲基磺酸乙酯,以获得M1植物,
ii)使得可育的M2植物足量产生,
iii)分离M2植物的基因组DNA,以及
iv)选择在包含编码着丝粒组蛋白H3(CENH3)蛋白的核苷酸序列的多核苷酸中具有至少一个突变的个体,其中所述至少一个突变在至少一个选自以下的CENH3蛋白氨基酸序列片段中引起CENH3蛋白的氨基酸序列改变:
a)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置1-位置246的核苷酸的N-末端结构域,
b)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置247-位置291的核苷酸的αN-螺旋,
c)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置307-位置339的核苷酸的α1-螺旋,
d)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置340-位置378的核苷酸的环1,
e)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置379-位置465的核苷酸的α2-螺旋,
f)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置466-位置486的核苷酸的环2,
g)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置487-位置516的核苷酸的α3-螺旋,
h)对应于SEQ ID NO:11中示出的源自拟南芥的CENH3蛋白的SEQ ID NO:10中示出的位置517-位置534的核苷酸的C-末端结构域。
13.包含编码CENH3的编码氨基酸序列的至少一个片段的核苷酸序列的多核苷酸,其中所述多核苷酸包含引起所述至少一个片段的氨基酸序列改变的至少一个突变。
14.包含权利要求13的多核苷酸的载体。
15.植物细胞或宿主细胞,包含权利要求13的多核苷酸作为转基因或者权利要求14的载体作为转基因。
16.一种产生权利要求1-7的植物的方法,所述方法包括以下步骤:
yy)用权利要求13的多核苷酸或权利要求14的载体转化植物细胞,以及
zz)从所述植物细胞再生具有单倍体诱导物生物活性的植物。
CN201580075644.XA 2014-12-23 2015-12-23 单倍体诱导物 Pending CN107205354A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14004389.4 2014-12-23
EP14004389.4A EP3037540A1 (en) 2014-12-23 2014-12-23 Haploid inducer
PCT/EP2015/081158 WO2016102665A2 (en) 2014-12-23 2015-12-23 Haploid inducer

Publications (1)

Publication Number Publication Date
CN107205354A true CN107205354A (zh) 2017-09-26

Family

ID=52434478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580075644.XA Pending CN107205354A (zh) 2014-12-23 2015-12-23 单倍体诱导物

Country Status (15)

Country Link
US (2) US10844401B2 (zh)
EP (9) EP3037540A1 (zh)
CN (1) CN107205354A (zh)
AR (1) AR103226A1 (zh)
AU (2) AU2015370904B2 (zh)
BR (1) BR112017013406B1 (zh)
CA (1) CA2970123A1 (zh)
CL (1) CL2017001665A1 (zh)
DK (1) DK3237623T3 (zh)
EA (3) EA202193164A1 (zh)
ES (1) ES2926323T3 (zh)
HU (1) HUE059654T2 (zh)
MX (2) MX2017008283A (zh)
PL (1) PL3237623T3 (zh)
WO (1) WO2016102665A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112725374A (zh) * 2019-10-29 2021-04-30 中国种子集团有限公司 创制植物单倍体诱导系的方法及其应用
CN113645840A (zh) * 2019-01-30 2021-11-12 科沃施种子欧洲股份两合公司 单倍体诱导物
CN113801891A (zh) * 2021-09-13 2021-12-17 内蒙古自治区农牧业科学院 甜菜BvCENH3基因单倍体诱导系的构建方法与应用
CN114957422A (zh) * 2022-06-15 2022-08-30 中国水稻研究所 一种诱导单倍体的方法及其在植物育种中的应用
CN116463348A (zh) * 2023-05-26 2023-07-21 中国农业科学院作物科学研究所 利用CRISPR/Cas9***编辑玉米ZmCENH3基因的sg RNA及其应用
CN116782762A (zh) * 2020-05-29 2023-09-19 科沃施种子欧洲股份两合公司 植物单倍体诱导

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180116141A1 (en) * 2015-02-24 2018-05-03 The Regents Of The University Of California Haploid induction
UY37335A (es) * 2016-07-21 2018-02-28 Kaiima Bio Agritech Ltd Composiciones y métodos para generar un haploide de una planta objeto
WO2018015956A1 (en) * 2016-07-21 2018-01-25 Kaiima Bio Agritech Ltd. Compositions and methods for generating a haploid of a target plant
WO2018102816A1 (en) * 2016-12-02 2018-06-07 Syngenta Participations Ag Simultaneous gene editing and haploid induction
EP3366778A1 (de) 2017-02-28 2018-08-29 Kws Saat Se Haploidisierung in sorghum
WO2019234129A1 (en) 2018-06-05 2019-12-12 KWS SAAT SE & Co. KGaA Haploid induction with modified dna-repair
EP3660164A1 (en) 2018-11-30 2020-06-03 KWS SAAT SE & Co. KGaA Screening of germplasm for desired polymorphisms by assays tested on synthetic dna
BR112022025102A2 (pt) * 2020-06-09 2023-02-07 Univ Georgia Monocotiledôneas heterozigotas para cenh3 e métodos de uso das mesmas para indução haploide e edição simultânea de genoma

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011044132A1 (en) * 2009-10-06 2011-04-14 The Regents Of The University Of California Generation of haploid plants and improved plant breeding
WO2014110274A2 (en) * 2013-01-09 2014-07-17 Regents Of The University Of California A California Corporation Generation of haploid plants

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA037899B1 (ru) 2014-08-28 2021-06-03 Квс Заат Се Создание гаплоидных растений
US20180116141A1 (en) * 2015-02-24 2018-05-03 The Regents Of The University Of California Haploid induction

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011044132A1 (en) * 2009-10-06 2011-04-14 The Regents Of The University Of California Generation of haploid plants and improved plant breeding
WO2014110274A2 (en) * 2013-01-09 2014-07-17 Regents Of The University Of California A California Corporation Generation of haploid plants

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MARUTHACHALAM R等: "Haploid plants produced by centromere-mediated genome elimination", 《NATURE》 *
UNIPROTKB: "Q8RVQ9", 《UNIPROTKB》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113645840A (zh) * 2019-01-30 2021-11-12 科沃施种子欧洲股份两合公司 单倍体诱导物
CN112725374A (zh) * 2019-10-29 2021-04-30 中国种子集团有限公司 创制植物单倍体诱导系的方法及其应用
CN116782762A (zh) * 2020-05-29 2023-09-19 科沃施种子欧洲股份两合公司 植物单倍体诱导
CN113801891A (zh) * 2021-09-13 2021-12-17 内蒙古自治区农牧业科学院 甜菜BvCENH3基因单倍体诱导系的构建方法与应用
CN114957422A (zh) * 2022-06-15 2022-08-30 中国水稻研究所 一种诱导单倍体的方法及其在植物育种中的应用
CN116463348A (zh) * 2023-05-26 2023-07-21 中国农业科学院作物科学研究所 利用CRISPR/Cas9***编辑玉米ZmCENH3基因的sg RNA及其应用
CN116463348B (zh) * 2023-05-26 2024-05-14 中国农业科学院作物科学研究所 利用CRISPR/Cas9***编辑玉米ZmCENH3基因的sg RNA及其应用

Also Published As

Publication number Publication date
EP4144853A1 (en) 2023-03-08
CL2017001665A1 (es) 2018-01-26
BR112017013406B1 (pt) 2024-03-19
EP4144854A1 (en) 2023-03-08
CA2970123A1 (en) 2016-06-30
WO2016102665A2 (en) 2016-06-30
US10844401B2 (en) 2020-11-24
EP4141123A1 (en) 2023-03-01
ES2926323T3 (es) 2022-10-25
EP3237623B1 (en) 2022-07-13
EA201791414A1 (ru) 2018-02-28
EA202193164A1 (ru) 2022-03-01
AU2021225142B2 (en) 2023-06-29
BR112017013406A2 (pt) 2018-02-06
EA202193165A1 (ru) 2022-03-01
EP4144852A1 (en) 2023-03-08
EP4144851A1 (en) 2023-03-08
AU2015370904B2 (en) 2021-07-22
EP4144855A1 (en) 2023-03-08
DK3237623T3 (da) 2022-09-12
AR103226A1 (es) 2017-04-26
PL3237623T3 (pl) 2022-10-31
EP4144850A1 (en) 2023-03-08
US20180139917A1 (en) 2018-05-24
EP3237623A2 (en) 2017-11-01
WO2016102665A3 (en) 2017-03-16
AU2021225142A1 (en) 2021-09-30
US20210079419A1 (en) 2021-03-18
HUE059654T2 (hu) 2022-12-28
EA039590B1 (ru) 2022-02-14
MX2017008283A (es) 2017-10-02
MX2022015112A (es) 2023-01-18
AU2015370904A1 (en) 2017-06-08
EP3037540A1 (en) 2016-06-29

Similar Documents

Publication Publication Date Title
AU2021225142B2 (en) Generation of haploid plants
CN106164272B (zh) 修饰的植物
CN106998665B (zh) 单倍体植物的产生
CN109321582B (zh) 粗山羊草Yr4DS基因在麦族植物抗条锈病育种的应用
CN102057045B (zh) 转基因糖用甜菜植物
CN107164401A (zh) 一种基于CRISPR/Cas9技术制备水稻OsPIL15突变体的方法及应用
CN108822194B (zh) 一个植物淀粉合成相关蛋白OsFLO10及其编码基因与应用
CN108291234A (zh) 倍数孢子体形成基因
CN101379080B (zh) 用于产生胚中具有母体基因组的全二倍体组的种子的核酸和方法
CN107759676B (zh) 一种植物直链淀粉合成相关蛋白Du15与其编码基因及应用
CN110892074A (zh) 用于增加香蕉的保质期的组成物及方法
US20090031444A1 (en) Homologous recombination in plants
CN108642065B (zh) 一种水稻胚乳粉质相关基因OsSecY2及其编码蛋白质和应用
WO2023065966A1 (zh) Bfne基因在番茄株型改良和生物产量提高中的应用
CN109912702B (zh) 蛋白质OsARE1在调控植物抗低氮性中的应用
KR102254956B1 (ko) 백색 구피색 양파를 판별할 수 있는 분자 마커 및 그 용도
CN107163113B (zh) 水稻半卷叶控制基因srl9及其叶形改良的用途
CN108864266A (zh) 一种与水稻落粒性及粒型相关的蛋白ssh1及其编码基因与应用
CN108441571A (zh) 玉米分子标记在鉴定和调控玉米粗缩病抗性性状中的应用
CN113646326A (zh) 用于抗植物病害的基因
WO2019161151A1 (en) Compositions and methods for improving crop yields through trait stacking
CN106589085B (zh) 一种植物淀粉合成相关蛋白OsFLO8及其编码基因与应用
CN106749571B (zh) 一种植物淀粉合成相关蛋白OsNPPR及其编码基因与应用
CN109971763A (zh) 花期调控基因cmp1和相关的载体及其应用
EP3752620A1 (en) Compositions and methods for improving crop yields through trait stacking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination