CN111868075A - 包含雄性育性恢复等位基因的小麦 - Google Patents

包含雄性育性恢复等位基因的小麦 Download PDF

Info

Publication number
CN111868075A
CN111868075A CN201880083682.3A CN201880083682A CN111868075A CN 111868075 A CN111868075 A CN 111868075A CN 201880083682 A CN201880083682 A CN 201880083682A CN 111868075 A CN111868075 A CN 111868075A
Authority
CN
China
Prior art keywords
seq
wheat
restorer
plant
fertility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880083682.3A
Other languages
English (en)
Inventor
P·瓦雷纳
J·科玛德兰
S·斯皮瑟尔
A·穆里格纽
J·梅洛内克
I·斯玛尔
P·佩雷兹
J·杜阿尔特
J-P·皮尚
S·勒瓦杜克斯
J·马丁
F·托尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Limagrain Europe SA
Vilmorin SA
Original Assignee
Limagrain Europe SA
Vilmorin SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Limagrain Europe SA, Vilmorin SA filed Critical Limagrain Europe SA
Publication of CN111868075A publication Critical patent/CN111868075A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • C12N15/8289Male sterility

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明属于植物遗传学和植物育种领域。本发明更具体地涉及携带对提莫菲维小麦CMS细胞质具有特异性的育性基因的恢复子的小麦转基因植物。

Description

包含雄性育性恢复等位基因的小麦
技术领域
本发明属于植物遗传学和植物育种领域。更具体地,本发明涉及携带对提莫菲维小麦(T.timopheevii)CMS细胞质具有特异性的育性基因的恢复子的小麦植物。
背景技术
杂交生产基于杂交两个亲本系以增加杂交种优势并事实上增加遗传变异性,从而产生具有更高产量并更好地适应环境胁迫的新品种或基因型。甚至在主要自花受精物种(如小麦)中,研究也表明杂交种品系表现出改进的品质和对环境和生物胁迫的更大耐受性。
为了促进商业上可行的杂交生产速度,必须避免自花受精,即同一植物的花粉对雌性器官的受精。期望雌性亲本的雌性器官仅与雄性亲本的花粉受精。为了获得可靠和有效的***来生产杂交生产所需的种子,通常需要三个基本要素:诱导雄性不育的手段、繁殖不育的手段和恢复育性的手段。例如,完全基于遗传的***由雄性不育系(雌性亲本)、可育维持系(允许雄性不育系繁殖的雄性亲本)和育性恢复系(用于杂交生产的雄性亲本)组成。
雄性不育可以通过三种不同方式来实现。手动去雄是最简单的一种,并且仍然在一些将雄花和雌花分开的物种(例如玉米)中使用。但是,在花中包含雌性和雄性器官两者的物种(如小麦)中,这是不切实际的。也可以通过具有杀配子作用的化学杂交剂(CHA)诱导雄性不育。目前,只有少数商业化杂交小麦品种基于该技术,因为它能够承受显著的金融风险。
最后,也可以通过遗传手段诱导雄性不育。在玉米或高粱中存在许多基于通过遗传手段诱导的雄性不育的杂交***的实例,表明与之前提到的两种技术相比,该技术占优势。但是,在主要自花授粉的其他物种(如小麦)中,杂交生产仍然是一个挑战(Longin etal,2012)。
1951年在小麦中观察到第一例雄性不育(Kihara,1951),其中观察到不育由尾状山羊草(Aegilops caudata L.)的细胞质和普通小麦的erythrospermum变种的细胞核之间的不相容性引起。随后对提莫菲维小麦细胞质的研究表明,该细胞质能够诱导普通小麦(T.aestivum)的不育(Wilson and Ross,1961,Crop Sci,1:191-193)。Orf256之前被鉴定为是对提莫菲维小麦线粒体基因组具有特异性的基因(Rathburn and Hedgcoth,1991;Song and Hedgcoth,1994),但是,尚需证明orf256是提莫菲维小麦CMS的遗传决定因子。预期这种细胞质可用于杂交生产***。但是,主要的局限性是难以发现完全显性且没有负性副作用(特别是对产量)的稳定的育性恢复基因。
已经报道了携带提莫菲维小麦CMS细胞质(T-CMS细胞质)的雄性不育植物的育性恢复,并且八个主要的恢复基因座(命名为Rf1-Rf8)已被鉴定并大致位于小麦基因组中。最有效的恢复基因座之一是Rf3(Ma and Sorrells,1995;Kojima et al,1997;Ahmed et al2001;Geyer et al 2016)。两个SNP标记允许Rf3基因座在染色体1B上的2cM片段内定位(Geyer et al,2016)。作者指出,这些标记不是诊断标记。
尽管理解恢复正常的花粉育性可能需要两个或更多个Rf基因座,但众所周知,取决于环境条件,存在修饰子基因座,其具有带有较低外显率的较小作用(Zhou et al 2005,Stojalowski et al 2013),或对育性具有抑制作用(Wilson,1984)。尚不清楚在不同的遗传背景和环境条件下需要哪种基因或基因座的组合以完全恢复T-CMS。
在这种情况下,开发能够完全恢复花粉育性的技术对小麦至关重要。因此,本发明的目的是提出小麦中合适的育性恢复基因,以开发可用于种子工业的杂交生产***。
发明概述
本公开的第一目的涉及编码提莫菲维小麦CMS细胞质的育性的Rf1蛋白恢复子的分离的Rf1核酸,其中相应的氨基酸序列与SEQ ID NO:361具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性。Rf1核酸的实例包含SEQ ID NO:3119。
本公开还涉及包含这种Rf1核酸和任选的一种或多种包含Rf3、Rf4和/或Rf7恢复等位基因的核酸作为转基因元件的转基因小麦植物。
另一方面涉及包含这种Rf1核酸和任选的一种或多种包含Rf3、Rf4和/或Rf7恢复等位基因的核酸作为基因工程化元件的基因工程化小麦植物。
在特定实施方案中,与不含这种转基因元件或基因工程化元件的亲本植物相比,所述转基因元件或基因工程化元件表达恢复或改进所述植物的雄性育性的多肽。
另一方面涉及提莫菲维小麦CMS细胞质的育性的小麦植物恢复子,其包含这种Rf1恢复等位基因,和在恢复基因座内的至少两个选自Rf3、Rf4和Rf7的育性恢复等位基因,其中,
·Rf3基因座位于距SEQ ID NO:3205的标记cfn1249269或SEQ ID NO:3228的标记BS00090770至多10cM,
·Rf7基因座位于距SEQ ID NO:3231的标记cfn0919993至多10cM,并且,
·Rf4基因座位于距SEQ ID NO:3233的标记cfn0393953至多10cM。
本公开还提供了生产如上所述的转基因小麦植物的方法,其中所述方法包括以下步骤:用一种或多种编码提莫菲维小麦CMS细胞质的蛋白恢复子的Rf1核酸转化亲本小麦植物,选择包含所述一种或多种核酸作为转基因的植物,再生和生长所述小麦转基因植物。
本公开的一部分还在于生产如上所述的遗传修饰的小麦植物的方法,其中所述方法包括以下步骤:优选通过基因组编辑对亲本小麦植物进行遗传修饰以在其基因组中获得编码提莫菲维小麦CMS细胞质的Rf1蛋白恢复子的一个或多个核苷酸序列,选择包含所述一个或多个核苷酸序列作为基因工程化元件的植物,再生和生长所述基因工程化小麦植物。
本发明还涉及通过杂交生产小麦植物的方法,所述方法包括以下:
·提供第一小麦植物,所述第一小麦植物包含一个或两个选自Rf1、Rf3和Rf7恢复等位基因的恢复等位基因,
·使所述第一小麦植物与第二小麦植物杂交,所述第二小麦植物包含一个或两个选自Rf1、Rf3和Rf7恢复等位基因的恢复等位基因,其中Rf1、Rf3和Rf7恢复等位基因在所述第一植物和所述第二植物提供的一组恢复等位基因中出现至少一次,
·收集F1杂交种种子,
·从F1植物获得纯合植物,
·任选检测所述杂交种种子中和/或每一代中Rf1、Rf3和Rf7恢复等位基因的存在。
优选地,在这种方法中,所获得的小麦植物的育性得分高于亲本小麦植物的育性得分。
本公开还涉及用于生产转基因或基因工程化小麦植物的方法,其中改变所述植物的育性水平,包括敲低Rf1恢复等位基因表达的步骤,其中所述Rf1恢复等位基因包含Rf1核酸。
本公开还涉及用于生产小麦杂交种植物的方法,包括以下步骤:
·将包含提莫菲维小麦细胞质的不育雌性与如上所述的可育雄性小麦植物杂交;
·收集杂交种种子;
·任选检测所述杂交种种子的杂交种性水平。
通过上述方法获得的小麦杂交种植物也是本公开的一部分。
本公开还涉及鉴定如上所述的小麦植物的方法,其中所述小麦植物通过检测至少一个恢复等位基因Rf1和任选的一个或多个选自Rf3、Rf4和Rf7的其他恢复等位基因的存在来鉴定。
因此,本文还公开了用于特异性检测小麦植物中的恢复等位基因Rf1和任选的一个或多个Rf3、Rf4和Rf7恢复等位基因的核酸探针或引物。
本公开的另一方面涉及重组核酸,其包含与调控元件可操作地连接的编码提莫菲维小麦CMS细胞质的Rf1蛋白恢复子的Rf1核酸,和用于转化包含这种重组核酸的小麦植物的载体。
发明详述
本公开的核酸
本公开的一方面涉及编码在小麦植物中对提莫菲维小麦CMS细胞质起作用的育性蛋白的恢复子的基因(以下称为Rf基因或核酸)的克隆和表征,以及相应的Rf核酸用于生产转基因小麦植物、用于通过基因组编辑修饰小麦植物、和/或用于检测小麦植物中的此类Rf基因的用途。
每当提及“植物”时,应理解植物部分(细胞、组织或器官、种子荚、种子、分离部分,例如根、叶、花、花粉等),保留亲本的区别特征(特别是与要求保护的Rf核酸相关的雄性育性)的植物后代,例如通过自交或杂交获得的种子,例如,除非另有说明,否则本文涵盖杂交种种子(通过使两个近交亲本植物杂交获得)、杂交种植物和由其衍生的植物部分。
如本文所用,术语“小麦植物”是指小麦属的物种,例如普通小麦(T.aestivum)、埃塞俄比亚小麦(T.aethiopicum)、阿拉拉特小麦(T.araraticum)、野生一粒小麦(T.boeoticum)、波斯小麦(T.carthlicum)、密穗小麦(T.compactum)、野生二粒小麦(T.dicoccoides)、二粒小麦(T.dicoccon)、硬粒小麦(T.durum)、伊斯帕汗小麦(T.ispahanicum)、科尔希二粒小麦(T.karamyschevii)、莫迦小麦(T.macha)、密利提奈小麦(T.militinae)、一粒小麦(T.monococcum)、波兰小麦(T.polonicum)、斯卑尔脱小麦(T.spelta)、印度圆粒小麦(T.sphaerococcum)、提莫菲维小麦、东方小麦(T.turanicum)、圆锥小麦(T.turgidum)、乌拉尔图小麦(T.urartu)、瓦维洛夫小麦(T.vavilovii)、茹科夫斯基小麦(T.zhukovskyi Faegi)。小麦植物也指埃吉洛普属和黑小麦属的物种。
如本文所用,术语“提莫菲维小麦CMS细胞质的育性恢复子”是指其在包含提莫菲维小麦CMS细胞质的小麦植物中的表达有助于在提莫菲维小麦CMS***中恢复花粉产生的蛋白质。
如本文所用,术语“等位基因”是指在特定基因座的基因的一种或多种替代形式中的任何一种。在二倍体中,给定基因的等位基因位于染色体上的特定位置或基因座。一个等位基因存在于这对同源染色体的每个染色体上。对于携带较高倍性水平的植物(像在例如其中普通小麦是六倍体植物的小麦性别中),使用相同的定义。
如本文所用,术语“提莫菲维小麦CMS细胞质的恢复等位基因”是指有助于在CMS提莫菲维小麦***中恢复花粉产生的等位基因。
花粉育性的恢复可以是部分的或完全的。可以通过以下实施例中所述的花粉育性测试来评估花粉育性。特别地,具有CMS-T提莫菲维小麦细胞质的F1小麦植株的育性得分(来自具有CMS杂交种的测试恢复系)可以通过将从穗打谷的种子总数除以计数的小穗数来计算,并可以与在相同区域和相同农业环境条件下生长的一组对照可育植物(例如携带正常小麦细胞质的优良近交系)的育性得分相比较。优选的是,这组品系包括一组至少5个优良的近交系,其中这些品系代表完成育性测试的区域。此外,优选的是,对于给定实验,评估来自不同单个F1植物的至少10个穗。
如果育性得分不为零,则植物已获得部分或完全的育性恢复。对于每个育性得分,计算统计检验以获得p值。统计检验的实例是方差分析或均值比较检验。低于5%阈值的p值将表明两个分布在统计上是不同的。因此,与完全可育的对照植物的育性得分相比,测试的小麦植物的育性得分的显著降低表明F1植物未获得完全的育性恢复(即部分恢复)。类似或更高的育性得分表明F1植物已获得完全的育性恢复。在优选的实施方案中,根据本公开的小麦植物,例如转基因或基因工程化小麦植物,已经获得完全的育性恢复。
在本公开中已经绘制了Rf1、Rf3、Rf4和Rf7内提莫菲维小麦CMS细胞质的恢复等位基因的基因座。相应的恢复等位基因被命名为Rf1、Rf3、Rf4和Rf7恢复等位基因,并且已经在本领域中描述。特别地,Rf3恢复等位基因的小麦植物来源包括以下商业化品系:Allezy、Altigo、Altamira,参见表15。Rf4恢复等位基因的小麦植物来源包括以下品系:R113或L13。
在特定实施方案中,Rf1、Rf3、Rf4和Rf7恢复等位基因的代表性等位基因由选自以下的种子样品提供:NCIMB 42811、NCIMB 42812、NCIMB 42813、NCIMB 42814、NCIMB 42815、NCIMB 42816和NCIMB 42817。
如本文所用,术语“厘摩”(“cM”)是重组频率的测量单位。一cM等于经过单代杂交在一个遗传基因座上的标记将与第二基因座上的标记分离的可能性为1%。
如本文所用,术语“染色体区间”是指位于植株单个染色体上的基因组DNA的连续线性范围。位于单个染色体区间的遗传元件或基因在物理上连锁。不特别限定染色体区间的大小。在一些方面,位于单个染色体区间内的遗传元件在遗传上连锁,例如遗传重组距离典型地为小于或等于20cM,或者小于或等于10cM。即,位于单个染色体区间内的两个遗传元件以小于或等于20%或10%的频率进行重组。
本公开提供了核酸和其重组形式,其包含在提莫菲维小麦CMS细胞质中活性的育性蛋白的Rf1、Rf3、Rf4、Rf7或Rf-黑麦恢复子的编码序列。
如本文所用,“重组核酸”是核酸分子,优选包含不会天然一起出现并且是人为干预的结果的核酸分子的组合的DNA分子,例如,由至少两个彼此异源的DNA分子的组合组成的DNA分子和/或人工合成并且包含与自然界中通常存在的多核苷酸序列不同的多核苷酸序列的DNA分子。
如下面的实施例中所述,已经分离了编码提莫菲维小麦CMS细胞质的育性蛋白的候选恢复子的这种核酸。因此,本公开的第一方面是编码提莫菲维小麦的育性的蛋白恢复子的核酸,其具有与选自SEQ ID NO:1-SEQ ID NO:1554的任一氨基酸序列至少95%同一性,典型地至少96%同一性的氨基酸序列。
本文所用的序列同一性百分比通过计算比对的氨基酸序列中的匹配位置的数目,将比对的位置的数目除以比对的氨基酸的总数,并乘以100来测定。匹配位置是指在比对的氨基酸序列中相同氨基酸出现在相同位置的位置。例如,可以使用CD命中来比对氨基酸序列(设置-c 0.96 -n 5 -G 0 -d 0 -AS 60 -A 105 -g 1,参见http://weizhongli- lab.org/cd-hit/)。
编码多肽SEQ ID NO:1-1554的任一个的上述候选核酸可如下所述进一步评估其恢复不育小麦植物的育性的能力。
因此,本文公开了一种评估核酸恢复育性的能力的方法,其中所述方法包括以下步骤:
a.将编码与SEQ ID NO1-SEQ ID NO1554的任一个至少95%同一性的假定氨基酸序列的一个或多个候选Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸引入亲本小麦不育植物和提莫菲维小麦CMS细胞质中,
b.选择携带一种或多种候选核酸作为转基因的转基因植物,和
c.基于育性恢复分析评估与亲本小麦不育植物相比的转基因植物的育性,
其中育性恢复的改进表明所述核酸具有恢复育性的能力。
在特定实施方案中,亲本小麦不育植物是携带提莫菲维小麦CMS细胞质的Fielder品系。
在上述方法的另一个具体实施方案中,Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦候选核酸序列选自编码与SEQ ID NO1-SEQ ID NO1554的任一个具有至少95%同一性,或至少96%同一性,例如100%同一性的氨基酸序列的那些。
典型地,Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦候选核酸选自以下核酸:SEQ ID NO:1555-SEQ ID NO:3107和3133。
在进一步的具体实施方案中,适当时,可以优化核酸序列以增加在转化植物中的表达。通过将一个密码子替换为另一个编码相同氨基酸的密码子的保守的密码子交换,可以在DNA水平上进行许多优化,而无需改变蛋白质序列。此外,可以修饰核酸序列以用于克隆目的。像优化一样,无需改变蛋白质序列即可实现这种修饰。
Rf1核酸
在特定实施方案中,本公开的核酸是Rf1核酸。
如本文所用,术语“Rf1核酸”是指包含编码提莫菲维小麦CMS细胞质的育性的Rf1蛋白恢复子的基因的核酸,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选96%、97%、98%、99%或100%同一性:SEQ ID NOs1-2、SEQ ID NOs288-290、SEQ ID NOs293-296、SEQ ID NOs343-346、SEQ ID NOs349-354、SEQ ID NOs359、361和362、SEQ ID NOs 396和397、SEQ ID NOs428-430、SEQ ID NO517和519、SEQ ID NOs752-754、SEQID NOs1092、1093和1095,典型地是SEQ ID NOs359、361和362和SEQ ID NO428-430。在特别优选的实施方案中,Rf1核酸编码与SEQ ID NO:361具有至少95%同一性,优选96%、97%、98%、99%或100%同一性的氨基酸序列。相应的特定Rf1核酸的实例在表7中提及。
特别地,并且如实施例6所示,发明人已经鉴定出SEQ ID NO:361的RFL79序列(如表7所示)可以恢复CMS-Fielder植物的雄性育性。因此,在优选实施方案中,Rf1核酸的实例包括所公开的Rf1核酸序列SEQ ID NO:1913、SEQ ID NO:1914、SEQ ID NO:1915、SEQ IDNO:1916或SEQ ID NO:3119,优选地,Rf1核酸包含SEQ ID NO:3119。
Rf3核酸
在特定实施方案中,本公开的核酸是Rf3核酸。
如本文所用,术语“Rf3核酸”是指包含编码提莫菲维小麦CMS细胞质的育性的Rf3蛋白恢复子的基因的核酸,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选96%、97%、98%、99%或100%同一性:SEQ ID NOs:124和125、SEQ ID NO:147、SEQ ID NO:150、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:297、SEQ ID NO:299、SEQID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:553和554、SEQ ID NOs:557和558、SEQID NOs:676和677、SEQ ID NOs:684和685、SEQ ID NOs:696和697、SEQ ID NOs:938和939和SEQ ID NOs:1038和1039,典型地是SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ IDNOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299。优选的Rf3核酸编码提莫菲维小麦CMS细胞质的育性的Rf3蛋白恢复子,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选96%、97%、98%、99%或100%同一性:SEQ ID NO:158、SEQ IDNO:676和SEQ ID NO:684。相应的特异性Rf3核酸的实例在表7中提及或在实施例12中进一步描述。典型地,特异性Rf3核酸的实例包括SEQ ID NO:1712、SEQ ID NO:2230、SEQ ID NO:2238、SEQ ID NO:3146、SEQ ID NO:3147或SEQ ID NO:3148。
Rf4核酸
在特定实施方案中,本公开的核酸是Rf4核酸。
如本文所用,术语“Rf4核酸”是指包含编码提莫菲维小麦CMS细胞质的育性的Rf4蛋白恢复子的基因的核酸,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选96%、97%、98%、99%或100%同一性:SEQ ID NO:477和SEQ ID NOs3135-3138,典型地是SEQ ID NO:477和SEQ ID NOs3136-3138。相应的特异性Rf4核酸的实例在表7中列出并进一步包括SEQ ID NO:2031和SEQ ID NO:3140-3142的任一个。
Rf7核酸
在特定实施方案中,本公开的核酸是Rf7核酸。
如本文所用,术语“Rf7核酸”是指包含编码提莫菲维小麦CMS细胞质的育性的Rf7蛋白恢复子的基因的核酸,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选96%、97%、98%、99%或100%同一性:SEQ ID NOs:240-243、SEQ ID NOs303-305、SEQ ID NO:363、SEQ ID NOs375-377、SEQ ID NOs497-499、SEQ ID NO:516、SEQ IDNOs709-711、SEQ ID NO:768,典型地是SEQ ID NO:363、SEQ ID NO:516和SEQ ID NO:768。相应的特异性Rf7核酸的实例在表7中提及。
Rf-黑麦核酸
在特定实施方案中,本公开的核酸是Rf-黑麦核酸。
如本文所用,术语“Rf-黑麦核酸”是指包含编码提莫菲维小麦CMS细胞质的育性的Rf-黑麦蛋白恢复子的基因的核酸,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选96%、97%、98%、99%或100%同一性:SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859。相应的特异性Rf-黑麦核酸的实例在表7中提及。
Rf核酸作为转基因
本公开更具体地涉及包括一个或多个Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸的DNA分子。特别地,本公开涉及由转基因***小麦植物而产生的任何DNA分子,所述转基因包括一个或多个上述Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸,并且所述***导致小麦植物中相应RNA和/或蛋白质的表达。
本公开内容的一部分还是从细胞或组织或来自植物或种子或植物组织的均浆中提取的核酸;或可以作为从细胞或组织或来自植物或种子或植物组织的均浆中提取的DNA或RNA的扩增子来生产,其中任何一种均衍生自来自包含上述核酸的植物的此类材料。
如本文所用,术语“转基因”或“转基因元件”是指掺入宿主细胞的基因组中的核酸(例如DNA分子)。术语“转基因”或“转基因元件”特别是指在当前发现该序列的遗传环境中通常不存在于给定宿主基因组中的序列。在这方面,序列可以相对于宿主基因组而言是天然的,但是相对于宿主基因组序列内的其他遗传序列而言是重排的。例如,与天然基因相比,转基因在不同的基因座处重排。
与不包含转基因元件的亲本植物相比,所述一种或多种转基因元件能够表达恢复或改进具有提莫菲维小麦CMS细胞质的植物的雄性育性的多肽。
具体的转基因元件是如上定义的重组核酸,例如如上定义的Rf1核酸。在特定实施方案中,转基因元件包括在组成型启动子(例如ZmUbi启动子)控制下的Rf核酸。
用于转化小麦植物的重组核酸
如上定义的此类Rf核酸还可用于转化或遗传修饰小麦植物,特别是不具有一个或多个育性恢复等位基因Rf1、Rf3、Rf4、Rf7和Rf-黑麦的小麦植物。
本公开的另一方面涉及用于转化小麦植物的载体,其包含一个或多个如上所述的Rf1、Rf3、Rf4、Rf7和Rf-黑麦核酸。
用于转化小麦植物的载体至少包括相应的育性蛋白恢复子的编码序列(天然存在的编码序列或改进序列,例如密码子优化的序列),这种编码序列与调控元件(例如启动子)可操作地连接。
如本文所用,术语“启动子”是指编码序列的的DNA上游区域(起始密码子上游),并且包括用于识别和结合RNA聚合酶和其他蛋白质以启动起始密码子的转录的DNA区域。用于表达的组成型启动子的实例包括35S启动子或19S启动子(Kay et al,1987)、水稻肌动蛋白启动子(McElroy et al,1990)、pCRV启动子(Depigny-This et al,1992)、CsVMV启动子(Verdaguer et al.1996)、玉米的泛素1启动子(Christensen和Quail,1996)、根癌农杆菌T-DNA的调控序列,包括甘露碱合酶、胭脂碱合酶、章鱼碱合酶。
启动子可以是“组织优选的”,即在某些组织中启动转录,或者是“组织特异的”,即仅在某些组织中启动转录。这种启动子的实例是胚胎特异的DHN12、LTR1、LTP1,韧皮部特异的SS1,绒毡层特异的OSG6B(Gotz et al 2011 and Jones 2015)。
可以使用其他合适的启动子。它可以是诱导型启动子、发育调控的启动子。“诱导型”启动子在某些环境控制或任何胁迫诱导下启动转录,例如非生物胁迫诱导的RD29、COR14b(Gotz et al,2011)。
可以使用组成型启动子,例如ZmUbi启动子,典型地是SEQ ID NO:3134的ZmUbi启动子。最后,也可以使用对应于pTaRFL46、79和104的SEQ ID NO:3114、SEQ ID NO:3123和SEQ ID NO:3113的启动子。
在特定的实施方案中,本公开的Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸与异源启动子(即不是小麦中发现的相应Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸的天然启动子的启动子)可操作地连接。具有异源启动子的Rf3核酸的典型重组构建体包括SEQ ID NO:3150-3153的任何一个,以及SEQ ID NO:3156-SEQ ID NO:3159的任何一个。具有异源启动子的Rf1核酸的典型重组构建体包括SEQ ID NO:3122,或在启动子SEQ ID NO:2123调控下的核酸SEQ ID NO:3119。
载体可以进一步包括与调控元件可操作地连接的包括选择基因标记的其他元件,其允许选择包含载体的转化植物细胞,其包含本公开的核酸作为转基因。
载体可以进一步包含与调控元件可操作地连接的包括逆向选择基因标记的其他元件,其允许对其基因组中未保留逆向选择基因标记的转化植物细胞进行逆向选择。
在一个具体的实施方案中,根据本发明的载体可以是适用于农杆菌介导的转化的载体,特别是根癌农杆菌(Agrobacterium tumefaciens)或发根农杆菌(Agrobacteriumrhizogenes)介导的转化的载体,如下一章节所述。
生产小麦转基因植物的方法
本公开的另一方面涉及上述核酸在生产表达育性蛋白恢复子的小麦转基因植物中的用途。
术语“转基因植物”是指包含这种转基因的植物。“转基因植物”包括其基因组已通过重组DNA的稳定整合而改变的植物、植物部分、植物细胞或种子。转基因植物包括从初始转化的植物细胞再生的植物和来自转化植物的后代或杂交种的转基因植物的后代。由于这种基因组的改变,转基因植物与相关的野生型植物明显不同。转基因植物的实例是本文描述的植物,其包含一个或多个Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸,典型地作为转基因元件。例如,转基因植物包括一个或多个Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸作为转基因,其***与相应Rf基因的天然基因座不同的基因座处。因此,本文公开了生产小麦转基因植物的方法,其中所述方法包括以下步骤:
(i)用Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸转化亲本小麦植物,
(ii)选择包含所述一个或多个核酸作为转基因的植物,
(iii)再生和
(iv)生长所述小麦转基因植物。
对于植物细胞内的转化方法,可以举例直接转移基因的方法,例如直接显微注射入植物胚中、真空渗入或电穿孔、通过PEG法直接沉淀或用枪轰击覆盖有目标质粒DNA的颗粒。
优选用细菌菌株,特别是农杆菌,特别是根癌农杆菌转化植物细胞。特别地,可以使用Ishida等人(Nature Biotechnology,14,745-750,1996)描述的方法来转化单子叶植物。
农杆菌介导的基因转移的农杆菌载体***和方法的描述由Moloney et al.,Plant Cell Reports 8:238(1989)提供。还可参见1997年1月7日批准的U.S.Pat.No.5,591,616。
或者,可以使用直接基因转移。一种普遍适用的植物转化方法是微粒介导的转化,其中将DNA携带在大小为1-4微米的微粒表面上。通过基因枪装置将表达载体引入植物组织,所述装置可将微粒加速至足以穿透植物细胞壁和膜的300-600m/s的速度。Sanford etal.,Part.Sci.Technol.5:27(1987),Sanford,J.C.,Trends Biotech.6:299(1988),Kleinet al.,BioTechnology 6:559-563(1988),Sanford,J.C.,Physiol Plant 7:206(1990),Klein et al.,BioTechnology 10:268(1992)。可以用包被有DNA的微粒轰击几个靶组织以生产转基因植物,包括例如愈伤组织(I型或II型)、未成熟的胚胎和分生组织。
转化小麦靶组织之后,使用本领域目前众所周知的再生和选择方法,选择标记基因的表达允许优先选择转化的细胞、组织和/或植物。
前述转化方法典型地将用于生产包括一个或多个Rf1、Rf3、Rf4、Rf7或Rf黑麦核酸作为转基因元件的转基因植物。
然后,可以将转基因植物与另一个(未转化或转化的)近交系杂交,以产生新的转基因系。或者,可以使用植物育种领域公知的传统回交技术将利用上述转化技术工程化为特定品系的遗传性状转移入另一品系。例如,回交途径可用于将工程化性状从公共的非优良近交系转移入优良近交系,或从其基因组中包含外源基因的近交系转移入不包含该基因的一种或多种近交系中。如本文所使用,取决于上下文,“杂交”可以指简单的X被Y杂交或回交的过程。
当在本公开内容的上下文中使用术语转基因小麦植物时,其还包括任何小麦植物,该小麦植物包含一个或多个Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸作为转基因元件,并且其中一种或多种所需性状通过回交方法进一步引入,无论这种性状是天然存在的性状还是转基因性状。回交方法可以与本发明一起使用以改进一种或多种特性或将一种或多种特性引入近交。如本文所用,术语回交是指杂交后代重复杂交回亲本小麦植物之一。为所需特性贡献一个或多个基因的亲本小麦植物称为非轮回或供体亲本。该术语是指非轮回亲本在回交方案中使用一次,因此不会再轮回的事实。向其转移来自非轮回亲本的一个或多个基因的亲本小麦植物称为轮回亲本,因为它在回交方案中使用数轮(Fehr et al,1987)。
在典型的回交方案中,轮回亲本与携带待转移的一个或多个目的基因的第二非轮回亲本杂交。然后,将该杂交产生的后代再次与轮回亲本杂交,并重复该过程直到获得小麦植物,其中除了转移自非轮回亲本的一个或多个基因外,在转化植物中恢复轮回亲本的所有所需形态和生理特性。应该注意的是,在两个连续的回交之间可能包括一些、一个、两个、三个或更多个自花授粉和群体生长。
生产小麦基因工程化植物的方法
本公开内容的一方面涉及与基因组编辑工具(例如TALEN、CRISPR-Cas、Cpf1或锌指核酸酶工具)组合的相应育性蛋白恢复子的DNA片段(天然存在的编码序列或改进的序列,例如密码子优化的序列),以通过在基因组中的任何基因座处***或通过在相应基因座处进行部分或全部等位基因替换来靶向小麦植物基因组内的相应Rf恢复等位基因。
特别地,本公开涉及基因修饰的(或工程化的)小麦植物,其中所述方法包括以下步骤:基因修饰亲本小麦植物,以在其基因组中获得编码如本文所公开的提莫菲维小麦CMS细胞质的蛋白恢复子Rf1、Rf3、Rf4或Rf7的一个或多个核苷酸序列,优选通过基因组编辑,选择包含所述一个或多个核苷酸序列作为基因工程化元件的植物,再生和生长所述小麦基因工程化植物。
如本文所用,术语“基因工程化元件”是指存在于植物基因组中并且已经通过诱变或通过基因组编辑工具,优选通过基因组编辑工具而修饰的核酸序列。在特定实施方案中,基因工程化元件是指在目前发现该序列的遗传背景中通常不存在于给定宿主基因组中,但通过使用基因组编辑工具引入植物基因组中的核酸序列。在这方面,该序列可以相对于宿主基因组而言是天然的,但是相对于宿主基因组序列内的其他遗传序列而言是重排的。例如,基因工程化元件是与天然基因相比在不同基因座处重排的基因。或者,该序列是已置于异源调节序列控制下的天然编码序列。下文描述了其他特定实例。
术语“基因工程化植物”或“基因修饰植物”是指包含这种基因工程化元件的植物。“基因工程化植物”包括其基因组已通过重组DNA的稳定整合而改变的植物、植物部分、植物细胞或种子。如本文所用,术语“基因工程化植物”还包括其基因组已通过基因组编辑技术改变的植物、植物部分、植物细胞或种子。基因工程化植物包括从初始工程化植物细胞再生的植物和基因工程化植物的后代或杂交种的基因工程化植物的后代。这种基因组改变的结果是,基因工程化植物与相关的野生型植物明显不同。基因工程化植物的实例是本文描述的植物,其包含一个或多个Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸。例如,基因工程化植物包括一个或多个Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸作为基因工程化元件,其***与相应Rf基因的天然基因座不同的基因座处。
在特定实施方案中,所述基因工程化植物不包括可以仅通过基本生物学过程获得的植物。
与不包含基因工程化元件的亲本植物相比,所述一种或多种基因工程化元件能够表达恢复或改进具有提莫菲维小麦CMS细胞质的植物的雄性育性的多肽。
特定基因工程化元件是如上定义的Rf核酸,例如如上定义的Rf1核酸。在特定实施方案中,遗传工程化元件包括在表达元件控制下的Rf核酸作为启动子和/或终止子。合适的启动子可以是组成型启动子,例如ZmUbi启动子或天然的或修饰的内源Rf启动子。
本公开的另一方面涉及基因工程化小麦植物,其包括通过任何基因组编辑工具(包括WO2015089406中所述的碱基编辑工具)或通过诱变,通过将等位基因序列rf或Rf的一个或几个核苷酸(作为基因工程化元件)点突变***或缺失到分别的Rf或rf等位基因中来进行修饰。
本公开进一步包括用于通过基因组编辑来改变植物的育性水平的方法,包括提供基因组编辑工具,该工具能够将小麦植物中的rf1、rf3、rf4、rf7或rf-黑麦非恢复等位基因序列或形式部分或完全替换为本文所公开的其相应的Rf1、Rf3、Rf4、Rf7或Rf-黑麦恢复等位基因序列。
术语“rf非恢复等位基因序列或形式”可以与在基因组中存在rf非恢复等位基因或与基因组中不存在任何rf或Rf等位基因有关。例如,在rf3/Rf3***中,一个小麦非恢复品系的特征可以在于存在rf3等位基因序列,而另一个非恢复品系的特征在于不存在任何Rf3或rf3等位基因序列。Rf3恢复子植物的特征将在于基因组中存在Rf3等位基因序列。在rf4/Rf4***的情况下,非恢复子植物的特征在于不存在任何rf4或Rf4等位基因形式,而Rf4恢复子植物的特征在于基因组中存在Rf4基因序列。
在特定实施方案中,用于通过基因组编辑来改变植物的育性水平的方法包括提供基因组编辑工具,该工具能够替换或修饰rf3非恢复等位基因以获得包含SEQ ID NO:3146(RFL29a)的Rf3恢复等位基因。在其他特定实施方案中,rf3非恢复等位基因可以包含RFL29c,其特征在于与实施例22和图12以及SEQ ID NO:3457所示的RFL29a核苷酸序列相比的移码。
本公开进一步包括通过基因组编辑或诱变引入恢复子Rf基因的内源性启动子以增加相应的内源性Rf基因的表达来改变植物的育性水平的方法。
在特定实施方案中,本公开包括通过修饰Rf3“弱”RFL29b等位基因的5'UTR序列通过基因组编辑弱可育植物来改变植物的育性水平的方法,该5'UTR区域包括如实施例15所示待缺失的163bp的***。
在进一步的特定实施方案中,本发明包括通过诱变或通过基因组编辑恢复子Rf基因的内源性启动子以增加内源性Rf基因的表达来改变植物的育性水平的方法。例如,可以突变或编辑SEQ ID N°3123中所示的proTaRFL79的序列以增加RFL79蛋白水平。
在另一个特定实施方案中,每当较强的启动子位于Rf恢复基因的启动子的上游时,就可以实现该启动子和上游区域的缺失,以便将较强的启动子与Rf基因并置。
在具体的实施方案中,将一个rf非恢复等位基因部分或完全替换为Rf1、Rf3、Rf4、Rf7或Rf-黑麦恢复等位基因中的任何一个。在此公开中,例如,非恢复子rf1等位基因可以替换为Rf3或Rf4或Rf7或Rf-黑麦等位基因。
在本公开的另一方面,可以将Rf1、Rf3、Rf4、Rf7和Rf-黑麦中的至少一个恢复等位基因整合在小麦植物基因组的一个或多个靶位点处,以典型地获得所述恢复等位基因的表达。可以通过利用启动子(更具体地强启动子)和/或终止子在靶基因座处的存在,以及通过用Rf等位基因靶向所述表达元件来实现所述表达。在特定实施方案中,将内源性Rf等位基因从一个第一基因座中缺失,并进一步将合适的启动子下游整合到同一植物基因组的第二基因座处。
在本发明的特定实施方案中,靶位点可以位于如实施例17中所定义的Rf1、Rf3、Rf4和/或Rf7基因座中。在更特定的实施方案中,靶位点可以是Rf1、Rf3、Rf4、Rf7或Rf-黑麦内源性基因序列或不同于Rf1、Rf3、Rf4、Rf7或Rf-黑麦内源性基因序列的任何其他靶位点。
在本公开的优选方面,小麦植物可以在其基因组中仅在一个基因座处包含Rf1、Rf3和Rf7恢复等位基因。
该基因组编辑工具包括但不限于由双链断裂技术提供的靶向序列修饰,基于使用工程核酸酶的双链断裂技术,所述双链断裂技术例如但不限于大范围核酸酶、ZFN、TALEN(WO2011072246)或CRISPR CAS***(包括CRISPR Cas9、WO2013181440)、Cpf1或其下一代。
降低小麦植物育性水平的方法:
或者,本公开进一步包括用于通过将包含Rf等位基因的恢复品系恢复为包含rf等位基因的维持品系来改变植物的育性水平的方法。该方法可以用于包含Rf等位基因(包括Rf1)的任何植物。在基于Rf3恢复等位基因的杂交生产***的情况下是令人特别感兴趣的,其中例如Rf3序列为RFL29a而rf3序列为RFL29c。
可以通过如下所述敲低Rf基因或等位基因来降低育性。
更具体地,该方法首先可以对应于通过针对目标Rf等位基因的RNAi或通过诱变或通过基因组编辑削弱Rf等位基因的启动子功能抑制表达。
另一方面,通过诱变,经典地用诱变剂诱导,或通过基因组编辑技术削弱蛋白功能,通过全部或部分缺失基因,或通过修饰基因序列阅读框以削弱蛋白质翻译,来获得育性水平的降低。
在另一方面,本公开涉及通过上述方法获得的育性水平降低的转基因或基因工程化小麦植物。
本公开的转基因或基因工程化小麦植物
本公开的另一方面涉及转基因或基因工程化小麦植物,其包含如前一章节中所述的一个或多个Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸,分别作为转基因或基因工程化元件。
可以通过上一章节中描述的方法获得所述转基因或基因工程化植物。
本公开的转基因或基因工程化植物可以有利地用作亲本植物以生产提莫菲维小麦CMS细胞质的可育小麦转基因或基因工程化植物恢复子。特别地,在特定实施方案中,小麦转基因或基因工程化植物是提莫菲维小麦CMS细胞质的可育小麦转基因或基因工程化植物恢复子。典型地,根据本公开的转基因或基因工程化小麦植物包含选自Rf1、Rf3、Rf4、Rf7和Rf-黑麦编码核酸的至少两种不同转基因或基因工程化元件的组合。
由于转基因表达或基因工程化元件的表达,本文公开的转基因或基因工程化小麦植物可以一起表达育性Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦的这种蛋白恢复子,并且由于天然存在的等位基因,还可以表达其他育性蛋白恢复子。
在一个实施方案中,在转基因或基因工程化植物的基因组中的相同基因座中发现至少两个、三个或四个Rf1、Rf3、Rf4、Rf7和Rf-黑麦核酸的所述组合。在其他实施方案中,组合的相应核酸位于不同的基因座中。在一个特定实施方案中,可以通过使本公开的转基因植物杂交而获得所述组合,所述转基因植物的每一个在不同的基因座携带所述组合的一种核酸作为转基因。
典型地,所述转基因或基因工程化植物包括以下核酸组合作为转基因或基因工程化元件:
a.Rf1核酸,优选编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个(优选SEQ ID NO:361)具有至少95%同一性或至少96%同一性的氨基酸序列,典型地,Rf1核酸包含SEQ ID NO:3119,和Rf3核酸,优选编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,
b.Rf1核酸,优选编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个(优选SEQ ID NO:361)具有至少95%同一性或至少96%同一性的氨基酸序列,典型地,Rf1核酸包含SEQ ID NO:3119,和Rf7核酸,优选编码与SEQ ID NO:363、SEQ ID NO:516和SEQID NO:768的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,
c.Rf1核酸,优选编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个(优选SEQ ID NO:361)具有至少95%同一性或至少96%同一性的氨基酸序列,典型地,Rf1核酸包含SEQ ID NO:3119,和Rf-黑麦核酸,优选编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,
d.Rf3核酸,优选编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,和Rf7核酸,优选编码与SEQ ID NO:363、SEQ ID NO:516和SEQ ID NO:768的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,
e.Rf3核酸,优选编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,和Rf-黑麦核酸,优选编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,
f.Rf7核酸,优选编码与SEQ ID NO:363、SEQ ID NO:516和SEQ ID NO:768的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,和Rf-黑麦核酸,优选编码与SEQID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,
g.Rf1核酸,优选编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个(优选SEQ ID NO:361)具有至少95%同一性或至少96%同一性的氨基酸序列,典型地,Rf1核酸包含SEQ ID NO:3119,和Rf3核酸,优选编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,和Rf7核酸,优选编码与SEQ ID NO:363、SEQ ID NO:516和SEQ ID NO:768的任一个具有至少95%同一性或至少96%同一性的氨基酸序列;
h.Rf1核酸,优选编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个(优选SEQ ID NO:361)具有至少95%同一性或至少96%同一性的氨基酸序列,典型地,Rf1核酸包含SEQ ID NO:3119,和Rf3核酸,优选编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,和Rf-黑麦核酸,优选编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性或至少96%同一性的氨基酸序列;
i.Rf1核酸,优选编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个(优选SEQ ID NO:361)具有至少95%同一性,例如至少96%同一性的氨基酸序列,典型地,Rf1核酸包含SEQ ID NO:3119,和权利要求4的Rf7核酸,优选编码与SEQ ID NO:363、SEQ IDNO:516和SEQ ID NO:768的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,和Rf-黑麦核酸,优选编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性或至少96%同一性的氨基酸序列;或
j.Rf3核酸,优选编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,和Rf7核酸,优选编码与SEQ ID NO:363、SEQ ID NO:516和SEQ ID NO:768的任一个具有至少95%同一性或至少96%同一性的氨基酸序列,和Rf-黑麦核酸,优选编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性或至少96%同一性的氨基酸序列。
在其他的特定实施方案中,除如之前段落限定的Rf1、Rf3、Rf7和/或Rf-黑麦核酸的上述定义的组合的任一项作为转基因元件外,所述转基因或基因工程化植物还包括Rf4核酸,其编码与SEQ ID NOs:477和SEQ IDNOs3135-3138的任一个具有至少95%同一性的氨基酸序列。
本公开还涉及杂交小麦植物,其可以通过使如上所述的根据本公开的转基因或基因工程化育性的小麦植物恢复子与第二植物杂交而产生。
在某些实施方案中,根据本发明的小麦植物是异质的,并且包含提莫菲维小麦细胞质。
例如,杂交小麦植物可以通过使如上所述的根据本公开的育性的小麦植物恢复子(优选包含Rf1、Rf3、Rf4、Rf7或Rf-黑麦核酸)与不表达相应的育性的Rf1、Rf3、Rf4、Rf7或Rf-黑麦蛋白恢复子的小麦植物杂交而获得。
本文还公开了一种生产小麦杂交种转基因或基因工程化植物的方法,包括以下步骤:
a.使包含提莫菲维小麦细胞质的不育雌性小麦植物与如上所述本公开的可育雄性转基因或基因工程化小麦植物的育性恢复子杂交;
b.收集杂交种种子;
c.任选检测作为转基因元件或基因工程化元件的杂交种种子中提莫菲维小麦细胞质和/或选自Rf1、Rf3、Rf4、Rf7和Rf-黑麦中的至少一个或多个Rf核酸的存在;和,
d.任选检测杂交种种子的杂交水平。
因此,本文还公开了被开发以获得此类杂交种植物的根据本公开的小麦转基因或基因工程化植物或品系。此类转基因或基因工程化植物或品系典型地包含实施相应杂交***所需的细胞质元件。优选地,转基因或基因工程化植物或品系包含至少两个、三个或四个Rf1、Rf3、Rf4、Rf7和Rf-黑麦核酸,以及提莫菲维小麦细胞质的组合。
或者,可以在亲本系上检测提莫菲维小麦细胞质和至少一种或多种选自Rf1、Rf3、Rf4、Rf7和Rf-黑麦的Rf核酸的存在(上述方法的步骤“c”)以在开始杂交(步骤“a”)前检查其基因型。
在本公开的某个实施方案中,雄性小麦植物比雌性小麦植物高。这可以通过使用允许获得大小差异的携带Rht等位基因的雄性植物实现。任选地,本公开进一步包括将除草剂施用于站在较短雌性植物高度之上的可育植物上的步骤,并且任选地,进一步包括收获种子并选择种子以去除不需要的自体受精的雄性种子,使用形态特征和/或表型特征,例如大小、形状、颜色等……的步骤。这种用于杂交种生产的方法的实例描述于WO2015135940。
可以在表型上(其中携带rf基因和T-CMS细胞质的植物将是不育的)或通过能够检测orf256基因的分子手段(如Rathburn和Hedgcoth,1991以及Song和Hedgcoth,1994所述)检测T-CMS细胞质。
本公开还涉及一种用于改进具有低于完全恢复水平的育性水平的亲本小麦植物的育性恢复水平的方法,包括用包含如上所述的Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸的载体转化所述亲本小麦植物,或对所述小麦植物中的所述Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸进行基因工程化的步骤。所述方法进一步包括选择包含所述Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸(优选Rf1、Rf3和Rf4)作为转基因或基因工程化元件的转基因或基因工程化小麦植物,再生和生长所述转基因或基因工程化小麦植物的步骤,其中所述转基因或基因工程化小麦植物与亲本植物相比具有改进的育性恢复水平。
本公开还提供了一种用于恢复携带提莫菲维小麦CMS细胞质的不育小麦植物的育性的方法,包括以下步骤:用如上所述的Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸转化携带提莫菲维小麦CMS细胞质的亲本不育小麦植物,或对所述不育植物进行基因工程化以表达Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸。
本公开的核酸在鉴定Rf1、Rf3、Rf4、Rf7和Rf-Rye恢复等位基因或转基因元件中的用途
本公开进一步提供了鉴定如之前章节公开的各自的Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦恢复等位基因和/或Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸的方法,和更一般地,针对是否存在Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦育性恢复等位基因和/或相应的Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸来选择或育种小麦植物的方法。
此类鉴定、选择或育种小麦植物的方法包括获得一种或多种小麦植物并评估其DNA以确定是否存在Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦育性恢复等位基因和/或相应的Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸。
例如,该方法可用于确定杂交产生的哪个后代具有所需的育性恢复等位基因或Rf核酸(或其组合),并相应地结合是否存在其他所需性状指导具有所需的育性恢复等位基因或Rf核酸的植物的制备。
该方法将包括鉴定在可育植物中存在Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦等位基因或核酸,所述植物是可育转基因植物或非转基因植物。任选地,该方法进一步包括鉴定非恢复子植物和/或不育植物中不存在Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦等位基因或核酸。
因此,本文公开了用于特异性检测小麦植物中的Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸的手段。
例如,此类手段包括用于特异性扩增来自植物小麦基因组DNA的Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸的片段核苷酸序列的一对引物。
如本文所用,引物涵盖能够在模板依赖性过程(例如PCR)中引发新生核酸合成的任何核酸。典型地,引物是10至30个核苷酸的寡核苷酸,但是可以采用更长的序列。引物可以以双链形式提供,尽管单链形式是优选的。
或者,核酸探针可以用于特异性检测Rf1、Rf3、Rf4、Rf7和/或Rf-黑麦核酸的任一种。
如本文所用,核酸探针涵盖至少30个核苷酸的任何核酸,并且其可以在标准严格条件下与限定的核酸特异性杂交。如本文所用,标准严格条件是指例如在Sambrook等人1989中描述的杂交条件,其可包含1)将植物基因组DNA片段或文库DNA固定在过滤器上;2)在65℃下于6x SSC 5x Denhardt试剂,0.5%SDS和20mg/ml变性载体DNA中将过滤器预杂交1-2小时;3)添加探针(标记的);4)孵育16-24小时;5)在68℃下于6x SSC,0.1%SDS中洗涤过滤器一次30分钟;6)在68℃下于2x SSC 0.1%SDS中洗涤过滤器三次(在30ml中,两次30分钟,以及在500ml中,一次10分钟)。核酸探针可以进一步包含标记剂,例如共价连接至探针的核酸部分的荧光剂。
生产携带育性的修饰的Rf3恢复子的小麦植物的方法
发明人还鉴定了育性的两种类型的Rf3恢复子,一种具有强的育性恢复能力,例如,能够提供育性得分高于1.0(例如1.0-2.0)的植物,而另一种具有弱的育性恢复能力,例如,能够提供育性得分低于0.1(例如0.5-1.0)的植物。
出人意料的是,强的育性恢复与携带Rf3的小麦植物的基因组中缺少位于Rf3编码序列的5’UTR中的SEQ ID NO:3174的163bp片段有关。
因此,本公开内容涉及生产携带育性的Rf3恢复子的小麦植物的方法,所述方法包括(i)提供在其基因组中包含至少SEQ ID NO:3174的163bp片段的亲本小麦植物,和(ii)在所述小麦植物的基因组中缺失所述SEQ ID NO:3174的至少10bp的片段,例如至少20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、110bp、120bp、130bp、140bp、150bp、160bp或SEQ ID NO:3174的整个片段,从而获得所述携带育性的Rf3恢复子的小麦植物。
有利地,由于缺失SEQ ID NO:3174中所述的片段,所获得的小麦植物的育性得分高于亲本小麦植物。与在其基因组中具有SEQ ID NO:3174的完整片段的亲本小麦植物相比,本领域技术人员可以选择缺失以便获得育性恢复的增加。
在特定实施方案中,亲本小麦植物的育性得分低于1,例如0.5-1.0,并且所获得的小麦植物的育性得分高于1.0,例如1.0-2.0。
还可以恢复具有rf3非恢复等位基因的植物的育性,该rf3非恢复等位基因与SEQID NO:3146的Rf3恢复等位基因RLF29a序列相比,由于核苷酸缺失或***而出现移码(还参见实施例22)。
该基因组片段的缺失或移码的校正可以通过本领域技术人员已知的任何合适的方法来获得,包括基因组编辑工具,例如但不限于大范围核酸酶、ZFN、TALEN(WO2011072246)或CRISPR CAS***(包括CRISPR Cas9、WO2013181440)或其采用工程化核酸酶的基于双链断裂技术的下一代。实施例15和实施例22中也描述了这些方法的实例。
通过上述方法获得的小麦植物也是本公开的一部分。典型地,通过上述方法获得或可通过该方法获得的这种小麦植物携带Rf3育性恢复子,其中在所述小麦植物的基因组中仅部分而非全部的SEQ ID NO:3174的基因组片段被缺失。典型地,在所述小麦植物的基因组中缺失SEQ ID NO:3174的10bp-162bp的片段。期望获得的具有基因组缺失的小麦植物具有的育性得分高于除了其基因组中的SEQ ID NO:3174的完整序列之外具有相同基因组的亲本小麦植物中测得的育性得分。或者,通过上述方法获得或可通过这种方法获得的这种小麦植物携带育性的Rf3恢复子,其中RFL29c的核苷酸已被缺失或添加以恢复框内翻译。
评估小麦植物育性恢复的方法
本公开还包括用于评估小麦植物的育性恢复的方法,所述方法包括确定所述植物基因组中是否存在SEQ ID NO:3174片段,其中完整片段的存在指示弱的育性恢复,并且至少一部分此类片段的缺失指示强的育性恢复。典型地,所述方法在易携带育性的Rf3恢复子的小麦植物中进行。
本文还公开了用于评估小麦植物的育性恢复的上述方法中的核酸探针,其中所述核酸探针由SEQ ID NO:3174内至少10个核苷酸的核酸组成。
典型地,所述核酸探针是至少20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、110bp、120bp、130bp、140bp、150bp、160bp的片段或SEQ ID NO:3174的完整片段。
具有至少三个特异性的育性恢复等位基因的提莫菲维小麦CMS细胞质的育性的小麦植物恢复子
发明人已经表明,在恢复基因座Rf1、Rf3、Rf4和Rf7内的至少3个特异性的育性恢复等位基因的组合使得能够获得完全恢复提莫菲维小麦CMS细胞质的育性的植物。
因此,本公开内容的第一方面涉及提莫菲维小麦CMS细胞质的育性的小麦植物恢复子,其中所述植物在选自Rf1、Rf3、Rf4和Rf7的恢复基因座内包含至少三个育性恢复等位基因。
在特定实施方案中,植物至少包含三个育性恢复等位基因Rf1、Rf3、Rf4。
在特定实施方案中,植物至少包含三个育性恢复等位基因Rf1、Rf4、Rf7。
在特定实施方案中,植物至少包含三个育性恢复等位基因Rf1、Rf3、Rf7。
在特定实施方案中,植物至少包含三个育性恢复等位基因Rf3、Rf4、Rf7。
如本文所用,Rf1基因座是指Rf1恢复等位基因的基因座,该基因座位于距离SEQID NO:4的标记cfn0522096和/或距离SEQ ID NO:10的标记cfn05277067至多10cM,优选至多7cM,更优选至多2cM。在特定实施方案中,根据本公开的育性的小麦植物恢复子包括至少一个Rf1恢复等位基因,所述Rf1恢复等位基因位于SEQ ID NO:3190的SNP标记cfn0522096和SEQ ID NO:3196的cfn05277067之间的染色体区间内。在特定实施方案中,育性的小麦植物恢复子在Rf1基因座处包括一个Rf1恢复等位基因,所述Rf1基因座的特征在于存在如表1所示的一个或多个SNP等位基因。
Figure GDA0002682210720000291
表1:用于定位Rf1基因座的SNP标记
优选地,根据本公开的育性的小麦植物恢复子在Rf1基因座处包括一个Rf1恢复等位基因,所述Rf1基因座的特征在于存在如表1中所述的SNP3和/或SNP7恢复等位基因。更优选地,育性的小麦植物恢复子的特征在于SNP3和SNP7恢复等位基因“C”和“A”的单倍型。在特定实施方案中,具有Rf1恢复等位基因的育性的小麦植物恢复子包含如上所述的本公开的Rf1核酸。Rf1核酸的实例包括所公开的Rf1核酸序列SEQ ID NO:1913、SEQ ID NO:1914、SEQ ID NO:1915、SEQ ID NO:1916或SEQ ID NO:3119,优选地,Rf1核酸包含SEQ ID NO:3119。
如本文所用,Rf3基因座是指Rf3恢复等位基因的基因座,该基因座位于距离SEQID NO:3205的标记cfn1249269和/或距离SEQ ID NO:3228的标记BS00090770至多10cM,优选至多7cM,更优选至多2cM。在特定实施方案中,育性的小麦植物恢复子在Rf3基因座内包括至少一个Rf3恢复等位基因,所述Rf3恢复等位基因位于SNP标记cfn1249269和BS00090770之间的染色体片段内。在特定实施方案中,育性的小麦植物恢复子在Rf3基因座处包括一个Rf3恢复等位基因,所述Rf3基因座的特征在于存在如表2所示的一个或多个SNP等位基因。
Figure GDA0002682210720000301
Figure GDA0002682210720000311
表2:用于定位Rf3基因座的SNP标记
优选地,根据本公开的育性的小麦植物恢复子在Rf3基因座处包括一个Rf3恢复等位基因,所述Rf3基因座的特征在于存在如表2中所述的SNP29和/或SNP31恢复等位基因。更优选地,育性的小麦植物恢复子的特征分别在于SNP29和SNP31恢复等位基因“T”和“A”的单倍型。
在可与之前实施方案组合的另一具体实施方案中,根据本公开的育性的小麦植物恢复子在Rf3基因座处包括一个Rf3恢复等位基因,所述Rf3基因座的特征在于分别存在SNP38和SNP41恢复等位基因“A”和“A”。
优选地,根据本公开的育性的小麦植物恢复子包括Rf3核酸,其包含SEQ ID NO:1712、SEQ ID NO:2230、SEQ ID NO:2238、SEQ ID NO:3146、SEQ ID NO:3147或SEQ ID NO:3148,优选SEQ ID NO:3146。
如本文所用,Rf7基因座位于距离SEQ ID NO:3231的标记cfn0919993至多10cM。在特定实施方案中,育性的小麦植物恢复子在Rf7基因座处包括一个Rf7恢复等位基因,所述Rf7基因座的特征在于存在如表3所示的一个或多个SNP等位基因。
Figure GDA0002682210720000321
表3:Rf7基因座的SNP标记
优选地,根据本公开的育性的小麦植物恢复子在Rf7基因座处包括一个Rf7恢复等位基因,所述Rf7基因座的特征在于存在如表3中所述“恢复等位基因”单倍型的九个SNP恢复等位基因SNP44-SNP46和SNP49-54。
如本文所用,Rf4基因座位于距离SEQ ID NO:3233的标记cfn0393953至多10cM。在特定实施方案中,育性的小麦植物恢复子在Rf4基因座处包括一个Rf4恢复等位基因,所述Rf4基因座的特征在于存在如表4所示的一个或多个SNP等位基因。
Figure GDA0002682210720000322
Figure GDA0002682210720000331
表4:Rf4基因座的SNP标记
根据本公开的育性的小麦植物恢复子在Rf4基因座处包括一个Rf4恢复等位基因,所述Rf4基因座的特征在于如表4所述分别存在单倍型“C”和“G”的两个SNP恢复等位基因SNP47和SNP48。
在特定实施方案中,具有Rf4恢复等位基因的育性的小麦植物恢复子包含如上所述的本公开的Rf4核酸。Rf4核酸的实例包括公开的Rf4核酸序列,SEQ ID NO:2031、SEQ IDNO:3140-3142。
在具体实施方案中,提莫菲维小麦CMS细胞质的育性的小麦植物恢复子包括一个Rf3恢复等位基因和两个选自Rf1、Rf4和Rf7恢复等位基因其他育性恢复等位基因。优选地,根据本公开的提莫菲维小麦CMSCMS细胞质的育性的小麦植物恢复子包含Rf1、Rf3和Rf7恢复等位基因。
具体地,本文包括包含由种子样品提供的Rf1、Rf3和Rf7恢复等位基因的小麦植物,所述种子样品于2017年9月25日以保藏号NCIMB 42811、NCIMB 42812、NCIMB 42813、NCIMB 42814、NCIMB 42815、NCIMB 42816和NCIMB 42817保藏于NCIMB保藏中心。
本发明还涉及杂交小麦植物,其可以通过使如上所述的根据本公开的育性的小麦植物恢复子与第二植物杂交而产生。
在某些实施方案中,根据本公开的小麦植物是异质的,并且包含提莫菲维小麦细胞质。
例如,杂交小麦植物可以通过使如上所述的根据本公开的育性的小麦植物恢复子(优选包含Rf1、Rf3和Rf7恢复等位基因)与不具有所述育性恢复等位基因的小麦植物杂交而获得。
本文还公开了一种生产小麦杂交种植物的方法,包括以下步骤:
a.使包含提莫菲维小麦细胞质的不育雌性小麦植物与如上所述本公开的可育雄性小麦植物杂交;
b.收集杂交种种子;
c.任选检测杂交种种子中提莫菲维小麦细胞质和/或至少三个选自Rf1、Rf3、Rf4和Rf7的Rf基因座的存在;和,
d.任选检测杂交种种子的杂交水平。
因此,本文还公开了被开发以获得此类杂交种植物的根据本公开的小麦植物或品系。此类植物或品系典型地包含实施相应杂交***所需的细胞质元件。优选地,植物或品系包含育性恢复等位基因Rf1、Rf3和Rf7和提莫菲维小麦细胞质。在特定实施方案中,此类植物或品系包含育性恢复等位基因Rf1,其包含如上所述的本公开的Rf1核酸。
或者,可以在亲本系上检测提莫菲维小麦细胞质和至少三个选自Rf1、Rf3、Rf4和Rf7的Rf基因座的存在(上述方法的步骤“c”)以在开始杂交(步骤“a”)前检查其基因型。
可以在表型上(其中携带rf基因和T-CMS细胞质的植物将是不育的)或通过能够检测orf256基因的分子手段(如Rathburn和Hedgcoth,1991以及Song和Hedgcoth,1994所述)检测T-CMS细胞质。
生产和选择本公开的小麦植物的方法
本公开还涉及生产具有如之前章节中所述的育性恢复等位基因的小麦植物的方法。
在一个实施方案中,所述生产小麦植物的方法包括以下步骤:
a.提供第一小麦植物,所述第一小麦植物包含一个或两个选自Rf1、Rf3和Rf7恢复等位基因的恢复等位基因,
b.使所述第一小麦植物与第二小麦植物杂交,所述第二小麦植物包含一个或两个选自Rf1、Rf3和Rf7恢复等位基因的恢复等位基因,其中Rf1、Rf3和Rf7恢复等位基因在所述第一植物和所述第二植物提供的一组恢复等位基因中出现至少一次,
c.收集F1杂交种种子,
d.从F1植物获得纯合植物,
e.任选检测杂交种种子中和/或每一代中Rf1、Rf3和Rf7恢复等位基因的存在。
优选地,步骤b)中的雌性植物携带T-CMS细胞质。在这种情况下,通过使用标记并任选通过进一步评估育性水平,在步骤b)至步骤d)的每一代中评估恢复等位基因的存在。
产生纯合植物的方法通常是本领域技术人员众所周知的。这可以通过重复回交或通过双单倍体发育或通过单种子后代(SSD)方法进行。
申请人已根据布达佩斯条约于2017年9月25日在NCIMB保藏中心以保藏号NCIMB42811、NCIMB 42812、NCIMB 42813、NCIMB 42814、NCIMB 42815、NCIMB 42816和NCIMB42817保藏了所公开的具有所述Rf1、Rf3和Rf7恢复等位基因的小麦植物的种子样品。
本公开进一步包括并提供鉴定在之前章节中公开的各Rf1、Rf3、Rf4和/或Rf7恢复等位基因的方法,以及更一般地,针对是否存在Rf1、Rf3、Rf4和/或Rf7育性恢复等位基因来选择或育种小麦植物的方法。此类鉴定、选择或育种小麦植物的方法包括获得一种或多种小麦植物并评估其DNA以确定是否存在包含在相应基因座中的Rf1、Rf3,Rf4和/或Rf7育性恢复等位基因。
例如,可以使用这种方法来确定由杂交产生的哪个后代具有所需的育性恢复等位基因的组合,并相应地结合是否存在其他所需性状指导具有所需组合的植物的制备。
因此,可以通过评估植物中上表1、2、3和4中出现的一种或多种单个SNP以及表19中的SNP的存在来鉴定或选择植物,以分别评估恢复等位基因Rf1、Rf3、Rf7或Rf4的存在。
更一般地,本文公开了用于检测小麦植物中的恢复等位基因,更具体地Rf1、Rf3、Rf4和Rf7恢复等位基因及其组合的特定手段。
因此,所述手段包括适合于在以下一个或多个标记:SEQ ID NOs3187-3235中检测以下SNP标记的任何手段。
可以使用本领域中任何已知的方法来评估SNP的存在或不存在。一些合适的方法包括但不限于测序、杂交测定、聚合酶链反应(PCR)、连接酶链反应(LCR)和通过测序基因分型(GBS),或其组合。
不同的基于PCR的方法对于本领域技术人员是可用的。可以使用RT-PCR方法或KBioscience的Kaspar方法(LGC Group,Teddington,Middlesex,UK)。
KASPTM基因分型***使用三种靶标特异性引物:两种引物,它们中的每一种对SNP(单核苷酸多态性)的每种等位基因形式具有特异性,并且另一种引物可实现反向扩增,这被两种等位基因形式共享。每一种靶标特异性引物还具有对应于两个FRET探针之一的尾序列:带有
Figure GDA0002682210720000362
染料的一个标签和带有
Figure GDA0002682210720000361
染料的另一个标签。
进行连续的PCR反应。发射荧光的性质用于从研究的DNA鉴别混合物中存在的一种或多种等位基因形式。
表5中鉴定的引物特别适用于KASPTM基因分型***。当然,技术人员可以使用表5中鉴定的引物的变体引物或核酸探针,所述变体引物或核酸探针与表5所鉴定的任何一种引物或与通过表5中鉴定的相应引物组扩增的DNA基因组片段具有至少90%,优选95%的序列同一性。
通过计算比对的核酸序列中的匹配位置的数目,将匹配位置的数目除以比对的核苷酸的总数,并乘以100,来测定本文所用的序列同一性的百分比。匹配位置是指其中相同的核苷酸出现在比对的核酸序列中的相同位置的位置。例如,可以使用BLASTN算法(www.ncbi.nlm.nih.gov)使用BLAST 2序列(Bl2seq)比对核酸序列。
如本文所用,引物涵盖能够在模板依赖性过程(例如PCR)中引发新生核酸合成的任何核酸。典型地,引物是10至30个核苷酸的寡核苷酸,但是可以采用更长的序列。引物可以以双链形式提供,尽管单链形式是优选的。或者,可以使用核酸探针。核酸探针涵盖至少30个核苷酸的任何核酸,并且其可以在标准严格条件下与限定的核酸特异性杂交。如本文所用,标准严格条件是指例如在Sambrook等人1989中描述的杂交条件,其可包含1)将植物基因组DNA片段或文库DNA固定在过滤器上;2)在65℃下于6x SSC 5x Denhardt试剂,0.5%SDS和20mg/ml变性载体DNA中将过滤器预杂交1-2小时;3)添加探针(标记的);4)孵育16-24小时;5)在68℃下于6x SSC,0.1%SDS中洗涤过滤器一次30分钟;6)在68℃下于2x SSC0.1%SDS中洗涤过滤器三次(在30ml中,两次30分钟,以及在500ml中,一次10分钟)。
在特定实施方案中,所述用于检测本公开的SNP标记的引物(特异于每个等位基因“X”或“Y”或共同)如下表5所示:
表5:用于检测本发明的育性恢复子SNP标记的引物(如引物名称所示)
Figure GDA0002682210720000371
Figure GDA0002682210720000381
Figure GDA0002682210720000391
Figure GDA0002682210720000401
Figure GDA0002682210720000411
Figure GDA0002682210720000421
Figure GDA0002682210720000431
Figure GDA0002682210720000441
本公开的小麦植物的用途
可以将根据本公开的植物与任何其他自交系杂交,以产生包含育性水平升高或降低的新品系。或者,可以使用植物育种领域公知的传统回交技术将利用上述转化技术工程化为特定品系的遗传性状转移入另一品系。例如,回交途径可用于将工程化性状从公共的非优良近交系转移入优良近交系,或从其基因组中包含外源基因的近交系转移入不包含该基因的一种或多种近交系中。如本文所用,取决于上下文,“杂交”可以指简单的X被Y杂交或回交的过程。
本公开的小麦植物还是这样的小麦植物,其中通过回交方法进一步引入一个或多个所需性状,无论这种性状是否是天然存在的。
本发明还涉及如上所述的小麦植物或其种子在食品应用,优选在面粉生产和饲料应用,或在育种应用中的用途,例如在育种中用作亲本植物以改进小麦植物、品系、杂交种或品种的农学价值。
如本文所用,育种应用涵盖谱系育种以改进植物、品系、杂交种或品种的农学价值。
例如,本文公开的小麦植物可进一步用于生产面粉或用于饲料应用。
从本文描述的植物收获的种子可以通过本领域中任何可用的技术用于制备面粉。小麦植物或其面粉也可用作人或动物的食物组合物。
仅用于说明目的而提供以下实施例。
特定实施方案
1.一种分离的核酸,其编码提莫菲维小麦的育性的蛋白恢复子,其中相应的氨基酸序列与选自SEQ ID NO:1至SEQ ID NO:1554任一个的氨基酸序列具有至少95%同一性。
2.实施方案1的核酸,其编码提莫菲维小麦CMS细胞质的育性的Rf1蛋白恢复子,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQ ID NOs1-2、SEQ ID NOs288-290、SEQ ID NOs293-296、SEQID NOs343-346、SEQ ID NOs349-354、SEQ ID NOs359、361和362、SEQ ID NOs 396和397、SEQ ID NOs428-430、SEQ ID NO517和519、SEQ ID NOs752-754、SEQ ID NOs1092、1093和1095。
3.实施方案1的核酸,其编码提莫菲维小麦CMS细胞质的育性的Rf1蛋白恢复子,其中相应的氨基酸序列与SEQ ID NO:361具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性。
4.实施方案1的核酸,其编码提莫菲维小麦CMS细胞质的育性的Rf3蛋白恢复子,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQ ID NOs:124和125、SEQ ID NO:147、SEQ ID NO:150、SEQ IDNO:156、SEQ ID NO:158、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NOs:315-321、SEQ IDNOs:379-381、SEQ ID NOs:553和554、SEQ ID NOs:557和558、SEQ ID NOs:676和677、SEQID NOs:684和685、SEQ ID NOs:696和697、SEQ ID NOs:938和939和SEQ ID NOs:1038和1039。
5.实施方案4的核酸,其编码提莫菲维小麦CMS细胞质的育性的Rf3蛋白恢复子,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQ ID NO:158、SEQ ID NO:676和SEQ ID NO:684。
6.实施方案1的核酸,其编码提莫菲维小麦CMS细胞质的育性的Rf4蛋白恢复子,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQ ID NO:477和SEQ ID NOs3135-3138。
7.实施方案1的核酸,其编码提莫菲维小麦CMS细胞质的育性的Rf7蛋白恢复子,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQ ID NOs:240-243、SEQ ID NOs303-305、SEQ ID NO:363、SEQID NOs375-377、SEQ ID NOs497-499、SEQ ID NO:516、SEQ ID NOs709-711、SEQ ID NO:768。
8.实施方案1的核酸,其编码提莫菲维小麦CMS细胞质的育性的Rf-黑麦蛋白恢复子,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859。
9.一种重组核酸,其包含与调控元件可操作地连接的实施方案1-8任一项的编码提莫菲维小麦CMS细胞质的蛋白恢复子的核酸。
10.载体在转化包含实施方案9的重组核酸的小麦植物中的用途。
11.一种小麦转基因植物,其包含实施方案1-9任一项的一种或多种核酸作为转基因元件。
12.实施方案11的小麦转基因植物,其为提莫菲维小麦CMS细胞质的可育小麦植物恢复子,并且包含至少两种选自实施方案1-9任一项的Rf1、Rf3、Rf7和Rf-黑麦核酸的不同的转基因元件的组合。
13.实施方案11或12的转基因小麦植物,其中所述转基因植物包括以下核酸组合作为转基因元件:
a.Rf1核酸,编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个具有至少95%同一性的氨基酸序列,和Rf3核酸,编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性的氨基酸序列,
b.Rf1核酸,编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个具有至少95%同一性的氨基酸序列,和Rf7核酸,编码与SEQ ID NO:363、SEQ ID NO:516和SEQID NO:768的任一个具有至少95%同一性的氨基酸序列,
c.Rf1核酸,编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个具有至少95%同一性的氨基酸序列,和Rf-黑麦核酸,编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性的氨基酸序列,
d.Rf3核酸,编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性的氨基酸序列,和Rf7核酸,编码与SEQ ID NO:363、SEQ ID NO:516和SEQ ID NO:768的任一个具有至少95%同一性的氨基酸序列,
e.Rf3核酸,编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性的氨基酸序列,和Rf-黑麦核酸,编码与SEQ ID NO:227、SEQ IDNO:378和SEQ ID NO:859的任一个具有至少95%同一性的氨基酸序列,
f.Rf7核酸,编码与SEQ ID NO:363、SEQ ID NO:516和SEQ ID NO:768的任一个具有至少95%同一性的氨基酸序列,和Rf-黑麦核酸,编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性的氨基酸序列,
g.Rf1核酸,编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个具有至少95%同一性的氨基酸序列,和Rf3核酸,编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性的氨基酸序列,和Rf7核酸,编码与SEQ IDNO:363、SEQ ID NO:516和SEQ ID NO:768的任一个具有至少95%同一性的氨基酸序列;
h.Rf1核酸,编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个具有至少95%同一性的氨基酸序列,和Rf3核酸,编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性的氨基酸序列,和Rf-黑麦核酸,编码与SEQID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性的氨基酸序列;
i.Rf1核酸,编码与SEQ ID NOs359、361、362或SEQ ID NOs428-430的任一个具有至少95%同一性的氨基酸序列,和实施方案4的Rf7核酸,编码与SEQ ID NO:363、SEQ IDNO:516和SEQ ID NO:768的任一个具有至少95%同一性的氨基酸序列,和Rf-黑麦核酸,编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性的氨基酸序列;或
j.Rf3核酸,编码与SEQ ID NOs:315-321、SEQ ID NOs:379-381、SEQ ID NOs:147和150、SEQ ID NOs:156和158、SEQ ID NOs297和299、SEQ ID NO:676和SEQ ID NO:684的任一个具有至少95%同一性的氨基酸序列,和Rf7核酸,编码与SEQ ID NO:363、SEQ ID NO:516和SEQ ID NO:768的任一个具有至少95%同一性的氨基酸序列,和Rf-黑麦核酸,编码与SEQ ID NO:227、SEQ ID NO:378和SEQ ID NO:859的任一个具有至少95%同一性的氨基酸序列。
14.实施方案13的转基因小麦植物,其进一步包含编码提莫菲维小麦CMS细胞质的育性的Rf4蛋白恢复子的Rf4核酸,与一、二、三或四种编码Rf1、Rf3、Rf7或Rf-黑麦蛋白的任一种恢复核酸组合,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQ ID NO:477和SEQ ID NOs3135-3138。
15.实施方案11-14任一项的转基因小麦植物,其中与不含这种转基因元件的亲本植物相比,所述一种或多种转基因元件表达恢复或改进所述植物的雄性育性的多肽。
16.生产实施方案11-15任一项的小麦转基因植物的方法,其中所述方法包括以下步骤:用一种或多种根据实施方案1-9任一项的编码提莫菲维小麦CMS细胞质的蛋白恢复子的核酸转化亲本小麦植物,选择包含所述一种或多种核酸作为转基因的植物,再生和生长所述小麦转基因植物。
17.生产携带育性的Rf3恢复子的小麦植物的方法,所述方法包括(i)提供在其基因组中包含至少SEQ ID NO:3174的163bp片段的亲本小麦植物,和(ii)在所述小麦植物的基因组中缺失所述SEQ ID NO:3174的片段中至少10bp的区域,例如至少20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、110bp、120bp、130bp、140bp、150bp、160bp或SEQ IDNO:3174的整个片段,从而获得所述携带育性的Rf3恢复子的小麦植物。
18.实施方案17的方法,其中所获得的小麦植物的育性得分高于所述亲本小麦植物的育性得分。
19.实施方案17或18的方法,其中所述亲本小麦植物的育性得分低于1,例如0.5-1.0,并且所获得的小麦植物的育性得分高于1.0,例如1.0-2.0。
20.可通过实施方案17-19任一项的方法获得的携带育性的Rf3恢复子的小麦植物,其中在所述小麦植物的基因组中仅部分而非全部的SEQ ID NO:3174的基因组片段被缺失。
21.一种用于评估小麦植物的育性恢复的方法,所述方法包括确定所述植物基因组中是否存在SEQ ID NO:3174片段,其中完整片段的存在指示弱的育性恢复,并且至少一部分SEQ ID NO:3174的此类片段或完整片段的缺失指示强的育性恢复。
22.一种用于实施方案17-21任一项的方法的核酸探针,其特征在于它由SEQ IDNO:3174内至少10个核苷酸的核酸组成。
23.一种提莫菲维小麦CMS细胞质的育性的小麦植物恢复子,其中所述植物在选自Rf1、Rf3、Rf4和Rf7的恢复基因座内包含至少三个育性恢复等位基因,其中:
a.Rf1基因座位于距SEQ ID NO:3190的标记cfn0522096或SEQ ID NO:3196的标记cfn05277067至多10cM处,
b.Rf3基因座位于距SEQ ID NO:3205的标记cfn1249269或SEQ ID NO:3228的标记BS00090770至多10cM处,
c.Rf7基因座位于距SEQ ID NO:3231的标记cfn0919993至多10cM处,和
d.Rf4基因座位于距SEQ ID NO:3233的标记cfn0393953至多10cM处。
24.实施方案23的小麦植物,其中所述植物包含Rf1、Rf3和Rf7恢复等位基因。
25.实施方案23-24任一项的小麦植物,其特征在于其在Rf1基因座内包含至少一个Rf1恢复等位基因,所述Rf1恢复等位基因位于SEQ ID NO:3190的SNP标记cfn0522096和SEQ ID NO:3196的cfn05277067之间的染色体区间内。
26.实施方案25的小麦植物,其中所述Rf1基因座的特征在于存在一个或多个以下SNP等位基因:
Figure GDA0002682210720000501
Figure GDA0002682210720000511
27.实施方案26的小麦植物,其中Rf1基因座的特征在于如实施方案5的表中所述的SNP3和SNP7恢复等位基因的单倍型“C”和“A”。
28.实施方案23-27任一项的小麦植物,其特征在于其在Rf3基因座内包括至少一个Rf3恢复等位基因,所述Rf3恢复等位基因位于SNP标记cfn1249269和BS00090770之间的染色体片段内。
29.实施方案28的小麦植物,其中所述Rf3基因座的特征在于存在一个或多个以下SNP等位基因:
Figure GDA0002682210720000512
Figure GDA0002682210720000521
30.实施方案29的小麦植物,其中Rf3基因座的特征在于如实施方案7的表中所述的SNP29和SNP31恢复等位基因的单倍型“T”和“A”。
31.实施方案23-30任一项的小麦植物,其中所述Rf7基因座的特征在于存在一个或多个以下恢复子SNP等位基因:
Figure GDA0002682210720000522
Figure GDA0002682210720000531
32.实施方案23-31任一项的小麦植物,其中所述Rf4基因座的特征在于存在一个或多个以下SNP等位基因,优选通过SNP47和SNP48恢复等位基因的单倍型“C”和“G”:
Figure GDA0002682210720000532
33.实施方案23-32任一项的小麦植物,其中Rf1、Rf3、Rf4和Rf7恢复等位基因的代表性等位基因由选自以下的种子样品提供:NCIMB 42811、NCIMB 42812、NCIMB 42813、NCIMB 42814、NCIMB 42815、NCIMB 42816和NCIMB 42817。
34.实施方案23-33任一项的小麦植物,其中所述小麦植物是异质的并且包含提莫菲维小麦细胞质。
35.一种鉴定实施方案23-34任一项的小麦植物的方法,其中所述小麦植物通过检测与选自Rf1、Rf3、Rf4和Rf7基因座的恢复基因座遗传相关的至少一种恢复等位基因的存在来鉴定。
36.检测一种或多种SEQ ID NOs 3187-3235的SNP的手段。
37.实施方案36的手段,其由一种或多种引物组成,所述引物包括以下任一项:SEQID NOs 3253-3444。
38.一种生产小麦杂交种植物的方法,包括以下步骤:
a.使包含提莫菲维小麦细胞质的不育雌性小麦植物与根据实施方案23-34任一项的可育雄性小麦植物杂交;
b.收集杂交种种子;
c.任选检测杂交种种子中提莫菲维小麦细胞质和/或选自Rf1、Rf3、Rf4和Rf7的至少三个Rf基因座的存在;和,
d.任选检测杂交种种子的杂交水平。
附图说明
图1A和1B是显示该研究中所用植物基因组和鉴定的RFL数量的概要的表格。总的来说,这些分析分别涵盖来自小麦的16个基因组数据和来自稻科的13个基因组数据,以及来自二穗短柄草(Brachypodium distachyon)、tef(Eragrostis tef)、黑麦(Secalecereale)、粟(Setaria italica)、高粱(Sorghum bicolor)和玉米(Zea mays)。还使用了黑麦草(Lolium perenne)和圆锥小麦(Triticum turgidum)转录组数据集。
图2:T-CMS小麦线粒体中orf256的加工(A)在提莫菲维小麦线粒体基因组中鉴定的orf256的结构。显示了用于Northern印迹分析的WORF256探针(Song和Hedgoth 1994)的结合位点。(B)在具有不同恢复能力的小麦品系中对orf256的差异处理。在普通小麦、Primepii、Anapurna和小麦-黑麦-6R(WR_6R)品系中未检测到orf256转录物。在R197和R0934F登录号中检测到的另一个第三条带用星号表示。作为凝胶上样的对照,显示了溴化乙锭(EtBr)染色的琼脂糖凝胶的图片。
图3:图3显示潜在对应于Rf4基因的RFL组列表。
图4a和4b:图4A和4B分别显示了RFL120-spelt(Subject)和RFL120-timo(Query)的核苷酸和氨基酸序列之间的比对。
图5A:图5A显示RFL29a、RFL29b、RFL29c_1和RFL29c_2的蛋白序列比对。
图5B和5C:图5B和5C分别显示RFL164a和RFL164b以及RFL166a和RFL166b的蛋白序列比对。
图6:图6显示在RFL29a和RFL29b基因中鉴定的5'UTR区的比对。
图7:图7显示针对不同核酸内切酶鉴定的163bp区域周围和内部的不同靶序列的位置。
图8:图8显示在我们内部共有遗传图谱上鉴定的Rf1定位区间的相对位置。
图9:图9显示在我们内部共有遗传图谱上鉴定的Rf3定位区间的相对位置。
图10:图10A显示Rf1基因座的染色体区间内标记的位置。左和右是指相对于cfn0522096和cfn0527067SNP标记定义的区间的标记位置。区间是指位于定位区间内的标记。物理位置对应于IWGSC全基因组组装的支架的LG内部顺序,‘IWGSC WGA’。
图10B、10C、10D显示多样性组的子集,显示用于遗传作图的恢复品系(R197、R204、R0932E)、衍生品系LGWR16-0016和LGWR16-0026以及维持品系集合的Rf1基因座处的单倍型。“-”:对应于在几个维持品系中没有扩增的显性标记。“H”:是指其中检测到两个等位基因的杂合子状态。
图11:图11A显示Rf3基因座的染色体区间内标记的位置。左和右是指相对于cfn1249269和BS00090770标记定义的区间的标记位置。区间是指位于定位区间内的标记。物理位置对应于IWGSC全基因组组装的支架的LG内部顺序,‘IWGSC WGA’。*IWB14060和IWB72107在Geyer等2016中描述。
图11B、11C、11D显示多样性组的子集,其显示用于恢复品系LGWR16-0016和LGWR16-0026的Rf3基因座处的单倍型,TJB155品系用作Rf3 QTL定位中的恢复亲本品系和一系列维持品系。
“-”对应于在几个维持品系中没有扩增的显性标记。“H”是指其中检测到两个等位基因的杂合子状态。
图12:图12显示RFL29a和RFL29c片段序列之间的核苷酸序列比对。CRISPR版本的PAM基序和靶序列分别为粗体和带下划线。
具体实施方案
实施例1:谷物中1188个RFL-PPR序列的鉴定
从公共序列库中下载并分析了来自27种谷物植物物种及其野生近缘种的32个基因组和两个转录组数据集。图1显示了从其下载文件和数据库的完整列表。
使用EMBOSS 6.6.0软件包的getorf程序(Rice et al.,2000)以六读码框翻译筛选DNA序列的开放阅读框(ORF)。使用来自HMMER 3.1b软件包(hmmer.org)的hmmsearch和hmmbuild定义的隐马尔可夫模型(Cheng et al.,2016)针对是否存在P和PLS类三角状五肽重复序列(PPR)基序筛选了超过92个密码子的预测ORF。根据之前描述的规则(Cheng etal.,2016)进行hmmsearch结果的后处理。保留了包含10个或更多个P类PPR基序的序列以进行进一步分析,因为之前的研究表明,育性恢复子样(RFL)基因主要由15-20个PPR基序的串联阵列组成(Fujii et al.,2011)。
为了鉴定P类PPR中的RFL序列,经由OrthoMCL-DB网站使用OrthoMCL算法(Li etal.,2003)对来自每个数据集的P类PPR蛋白进行聚类(http://www.orthomcl.org/ orthomcl/)。筛选结果输出文件中包含参考RFL的组(Fujii et al.,2011)。
通过OrthoMCl分析,在34个谷物数据集中总共鉴定了633个RFL(参见图1A和1B的表)。此外,分析了包括地方品种和野生近缘种的44个高粱登录品的WGS数据集(Mace etal.,2013),并鉴定了517个额外RFL序列并纳入研究(参见图1A和B的表)。
实施例2:通过靶向捕获RFL基因鉴定潜在地与小麦中的提莫菲维小麦CMS的育性恢复有关的全长RFL PPR基因。
A.种质登录品的选择:
六个小麦登录品被鉴定为提莫菲维型CMS(T-CMS)的潜在恢复品系,所述品系衍生自提莫菲维小麦和普通小麦之间的种间杂交。
第一个登录品是小麦-黑麦加成系“小麦-黑麦-6R”,其中Rf基因定位于黑麦Secale cereale的6R染色体的额外长臂上(Curtis and Lukaszewski,1993)。其他四个小麦品种的特征在于小麦中存在至少一个定位的恢复基因:Rf1、Rf3和Rf7。商业品种Primepii携带Rf3基因,并且三个Limagrain品系R197、R0934F和R0932E分别携带Rf1和Rf7基因两者、Rf3或Rf1。
名为Anapurna的第六个登录品是不能恢复T-CMS且不携带已知Rf基因的维持品系。Anapurna被认为是该实验的阴性对照。此外,这项研究还包括了提莫菲维小麦品系,因为它是期望携带一个以上能够恢复T型CMS的Rf基因的可育品系(Wilson和Ross,1962)。在某种程度上,认为该品系是该实验的阳性对照。
通过遗传分析验证了所有六个登录品的恢复状态。
使用orf256特异性探针对修复子和不育登录品进行Northern印迹分析(图2A)。Orf256之前被鉴定为对提莫菲维小麦线粒体基因组具有特异性的基因(Rathburn和Hedgcoth,1991;Song和Hedgcoth,1994)。orf256的-228至+33序列(相对于起始密码子编号)与普通小麦中coxI基因(编码线粒体复合体IV的亚基1)的同源区域相同,而orf256的其余部分(包括3'侧翼区域)与coxI无关(图2A)。当与不育CMS品系模式比较(与基因分析一致)时,观察到可育提莫菲维小麦品系和携带提莫菲维小麦细胞质的可育恢复品系中orf256转录物加工的不同模式(图2B)。不同的加工模式与导致CMS涉及的orf256一致(但不是确定性证明)。
B.不同小麦基因型的诱饵设计和RFL捕获:
通过我们的生物信息学分析鉴定的1188个RFL PPR序列经过预处理,所述预处理包括针对小麦线粒体和叶绿体基因组序列(登录号NC_007579.1和AB042240)以及小麦基因组的重复元件对目标序列进行屏蔽。屏蔽的靶序列用于捕获探针设计。简而言之,探针设计为使用频率屏蔽算法覆盖靶序列,所述算法旨在排除与靶向基因组中高拷贝数序列匹配的探针。将最终的探针合成为探针库。
播种每个登录品的种子,并在黄化条件下生长小苗。DNA提取后,根据制造商的建议使用KAPA Biosystems化学方法从约600bp的DNA片段制备Illumina库(称为NGS库)。
然后,使用探针库和捕获方案将NGS库特异性富集于RFL序列中。捕获的效率通过特定的qPCR测定确认,最终将文库合并并且在MiSeq平台上以配对末端模式和300nt的阅读长度进行测序。
C.装配编码RFL蛋白的全长基因序列并鉴定假定的直系同源组:
如下所述,将来自RFL捕获实验的序列读长组装成跨越一个或多个编码RFL蛋白的序列的全长重叠群。使用来自bbmap软件包(https://sourceforge.net/projects/bbmap/)的参数为qtrim2=ttrimq=10,15,20 minq=12 mininsert=150的bbmerge将重叠配对读长合并为单个序列。弃去无法合并的读长对。使用bbmap软件包中的Reformat.sh将合并的读长降低取样为300,000个读长(samplereadstarget=300000)。将合并和降低取样的读长与Geneious 8(设置为Medium Sensitivity/Fast)(http://www.geneious.com/)一起组装。最后,保留了由多于100个合并读长组成的重叠群以进行进一步分析,其中大多数由超过1000个读长组成。以此方式,总共产生了1457个重叠群(表6)。
从每个登录品获得约220个重叠群,除了提莫菲维小麦,其仅组装了138个重叠群。这与提莫菲维小麦基因组的四倍体性质一致。结果的一致性表明RFL捕获实验在先验上是详尽的。
Figure GDA0002682210720000581
Figure GDA0002682210720000591
表6:每个登录品鉴定的RFL重叠群和ORF的数目以及以CD-hit分配ORF的直系同源组的数目。
在这些重叠群中鉴定编码RFL蛋白的序列如下。
使用参数-minsize 630-find 0-reverse true用EMBOSS软件包中的getorf(Riceet al.2000)鉴定重叠群中的开放阅读框(ORF)。因此,仅将长于210个氨基酸的ORF用于进一步的分析。在七个登录品中鉴定出总共1554个ORF(表6)。每个登录品的ORF数目范围从提莫菲维小麦中的143个ORF到R0934F中的245个(表6)。使用来自HMMER软件包(v3.1b1)的hmmsearch(参数-E 0.1--domE 100)进一步分析ORF,以使用Cheng等人(2016)开发的隐马尔可夫模型和同一论文中描述的后加工步骤检测PPR基序。最后,为了鉴定所有七个登录品的推定直系同源的RFL序列,使用CD-hit(设置-c 0.96-n 5-G 0-d 0-AS 60-A 105-g 1)将1554个RFL ORF聚类。在所有登录品中,获得了397个推定直系同源组的非冗余RFL簇(表6)。我们将直系同源RFL组定义为来自至少一个登录品的至少一组RFL ORF,其中,如果存在至少两个序列,则这些序列在比对长度内共享至少96%的序列同一性。在所有七个登录品中都存在一些高度保守的RFL基因,而仅在登录品子集或单个登录品中发现其他。在大多数情况下,每个直系同源RFL组仅包含来自每个登录品的一个RFL蛋白。
下表7显示了不同的RFL基团、相应的ORF名称以及相应的蛋白质序列号和DNA编码蛋白质序列号。
但是,我们发现编码RFL-PPR蛋白的基因通常会因***缺失而失活,从而产生破坏ORF的连续性的移码,导致两个较短的ORF对应于另一个登录品的单个较长的ORF。在这些情况下,两个较短的ORF可能在相同的直系同源组内。在我们的分析中,认为仅编码超过350个氨基酸的ORF可能具有功能。使用此阈值是因为它对应于10个PPR基序(每35个氨基酸),并且所有已知的活性Rf蛋白都包含至少该数目的基序(通常为15-20)。
最后,鉴定了一组397个直系同源RFL组,并且编号从1到397(参见下表7)。
Figure GDA0002682210720000601
Figure GDA0002682210720000611
Figure GDA0002682210720000621
Figure GDA0002682210720000631
Figure GDA0002682210720000641
Figure GDA0002682210720000651
Figure GDA0002682210720000661
Figure GDA0002682210720000671
Figure GDA0002682210720000681
Figure GDA0002682210720000691
Figure GDA0002682210720000701
Figure GDA0002682210720000711
Figure GDA0002682210720000721
Figure GDA0002682210720000731
Figure GDA0002682210720000741
Figure GDA0002682210720000751
Figure GDA0002682210720000761
Figure GDA0002682210720000771
Figure GDA0002682210720000781
Figure GDA0002682210720000791
Figure GDA0002682210720000801
Figure GDA0002682210720000811
Figure GDA0002682210720000821
Figure GDA0002682210720000831
Figure GDA0002682210720000841
Figure GDA0002682210720000851
Figure GDA0002682210720000861
Figure GDA0002682210720000871
Figure GDA0002682210720000881
Figure GDA0002682210720000891
Figure GDA0002682210720000901
Figure GDA0002682210720000911
Figure GDA0002682210720000921
Figure GDA0002682210720000931
Figure GDA0002682210720000941
表7
实施例3:与育性恢复相关的染色体区间中编码候选Rf蛋白的基因的定位
A.包含Rf1遗传决定因子的基因组区域的精细定位
分别对涵盖210、218和212个个体的Rf1隔离的三个F2定位群(R197xKalahari、R204xAlixan和R0932ExAltigo)进行表型分型,并使用Limagrain的内部基因分型平台,用18100个SNP标记进行基因分型。
育性测试在室内(在生长室或在温室中)在可控的生长条件下进行,使得被测试的小麦植物具有正常的育性。所指示的育性得分通过从穗打谷的种子总数除以计数的小穗数来计算。通过比较用恢复子获得的F1的育性得分与在相同条件下生长的一组优良自交系的育性得分来进行t检验。
Rf1首先定位到Limagrain内部共有图谱上4cM-10.9cM的染色体1A的短臂上,并通过SNP标记cfn1087371和cfn0530841物理地界定。这两个SNP标记界定了三个定位群限定的最大可能区间。
随后,对这三个定位群的联合分析以及衍生的F3家族中各个F2重组植物的表型分析验证了QTL位置,并在Limagrain的内部共有图谱上界定了7cM-8.9cM的Rf1区间,并通过SNP标记cfn1082074和cfn0523990物理地界定。我们使用了IWGSC全基因组组装的基因组资源“IWGSC WGA”(2016年6月从URGI IWGSC仓库中获得)以将基因座固定在小麦基因组参考物理图上。左边框(cfn1082074)固定在IWGSCWGAV02_1AS_scaffold44309支架上,并且右边框(cfn0523990)固定在IWGSCWGAV02_1AS_scaffold47238支架上。
接下来,通过从基因座处杂合的F2植物衍生的R197xKalahari和R204xAlixan筛选2976和3072F3品系,对基因座进行精细定位。在该区间内的重组植物后代的表型分型和分析重新限定了7.5-8.8cM的较小的定位区间,其分别由IWGSCWGAV02_1AS_scaffold44309支架和IWGSCWGAV02_1AS_scaffold47238支架上的cfn0522096和cfn0527067 SNP标记界定。
B.包含Rf3遗传决定因子的基因组区域的精细定位
如实施例1所述,对分别涵盖217、135和246个个体的三个F2定位群(TJB155xAnapurna、2852xAltamira和AH46xR0946E)以及由140个个体植物组成的Rf3隔离的双单倍体(DH)群(H46xR934F)进行表型分型,并使用Limagrain的内部基因分型平台用18100个SNP标记进行基因分型。Rf3首先定位到Limagrain内部共有图谱上18.9cM-24.2cM的染色体1B的短臂上,并在物理上由SNP标记cfn0554333和cfn0560679界定。这两个SNP标记界定了四个定位群限定的最大可能区间。
随后,对这四个定位群的联合分析以及衍生的F3家族中各个F2/DH重组植物的表型分析的证实验证了QTL,并在Limagrain的内部共有图谱上遗传界定了22.2cM-22.7cM的基因座,并物理地界定了SNP标记cfn0436720和cfn0238384之间的Rf3区间。我们使用了IWGSC全基因组组装的基因组资源“IWGSC WGA”(2016年6月从URGI IWGSC资料库中获得)以将基因座固定在物理图上。左边框(cfn0436720)固定在IWGSCWGAV02_1BS_scaffold35219支架上,并且右边框(cfn0238384)固定在IWGSCWGAV02_1BS_scaffold5117支架上。
接下来,通过从该基因座处杂合的TJB155xAnapurna和AH46xR0946E F2植物筛选2496和672个植物,对基因座进行精细定位。在该区间内的重组F3植物后代的分析重新限定了22.5-22.7cM的较小的定位区间,其分别由IWGSCWGAV02_1BS_scaffold35219支架和IWGSCWGAV02_1BS_scaffold5117支架上的cfn1249269和BS00090770 SNP标记界定。
C.包含Rf7遗传决定因子的基因组区域的定位
我们将R197和Primepii杂交,然后从作为rf1和rf3的个体(即在基因座Rf1和Rf3上不携带恢复等位基因)衍生出176种植物的群体。使用Limagrain的内部基因分型平台用18100个SNP标记对植物进行基因分型,并按实施例1所述对其进行表型分析。我们将Rf7基因座定位在染色体7BL上。此外,内部基因分型数据显示出很强的遗传差异,表明存在稳定地世代传播的外来染色体片段。我们在Limagrain的内部共有图谱上的染色体7B上鉴定出45cM-88cM的大QTL,其峰值为46.7cM(cfn0919993,LOD得分为3.37E-40)。对重组植物的初步分析表明,Rf7基因可能位于cfn3407185和W90K_RAC875_c33564_120标记之间,从而在Limagrain的内部共有图谱上的46.7cM-47cM之间界定了0.3cM的定位区间。
实施例4:候选直系同源RFL组的鉴定
对于在实施例2中鉴定的282个RFL组中的每一个,鉴定了捕获的RFL ORF(下文中称为蛋白序列),并报告了每个登录品的RFL蛋白序列的总数(表7、表8)。
仅考虑以下RFL簇:
1.RFL簇包含所有七个登录品的蛋白质代表,并且序列显示多态性和/或长度差异。
2.RFL簇仅包含其遗传特性表明它们可包含相同的一个或多个Rf基因的这些登录品的代表。
表8A、9A、10和11显示在第一次筛选后分别与Rf1、Rf3、Rf7和Rf-黑麦-6R基因相关的直系同源RFL组的列表。已知提莫菲维小麦可育并因此能够恢复T-CMS。在本文中添加该品系是因为它可能包含任何靶标Rf1、Rf3、Rf7或Rf-黑麦靶基因。
最后,仅考虑将在小麦普通小麦中国春参考基因组的染色体区间中定位的直系同源RFL组作为进一步分析的候选。这些直系同源的RFL组将被选择作为“候选Rf组”。
使用来自BLAST+Suite的工具tblastn实现定位(https:// blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastDocs&DOC_TYPE=Download)。使用特定参数(-evalue 1e-25-best_hit_score_edge0.05-best_hit_overhang 0.25)以保持所有最佳命中。
A.Rf1登录品的结果:
表8A显示直系同源的RFL组,其包含至少一个从表征为携带Rf1基因的登录品中捕获的序列(R197、R0932E和Timopheevii)。实施例3中描述的定位允许我们弃去定位在与染色体1A短臂上的Rf1育性遗传相关的染色体区间之外的直系同源RFL组。以此方式,四个RFL簇(79、104、185和268)鉴定为潜在地对应于由Rf1基因编码的Rf蛋白。
RFL185组中的所有蛋白序列均包含约500个氨基酸和仅8.5个PPR基序。典型地,全长功能性RFL蛋白预期包含15-20个PPR基序。此外,RFL185的最后一个PPR基序仅由15个氨基酸组成。这表明RFL185被截短了。RFL268也被截短(382个氨基酸)。详细的序列分析表明,RFL185和RFL268是被移码***的同一基因的残余物。因此,两种蛋白质都不太可能具有功能。
因此,认为RFL79和RFL104是Rf1的最佳候选Rf组。
Figure GDA0002682210720000981
表8A:基于Rf1的登录品CMS信息选择RFL。
从表8A可以注意到,在这些候选Rf组中缺少包含Rf1的序列的唯一登录品是登录品R0934F。
Figure GDA0002682210720000991
表8B列出了候选Rf组79和104中的蛋白质。
用BWA-MEM软件(Li H.and Durbin R.,2010)比对来自实施例2中鉴定的重叠群并编码来自候选Rf组79和104的RFL蛋白的DNA序列。观察到,与R0932E和R197相比,这些序列在R0934F的5'UTR区域有所不同。一种假设是R0934F中的DNA序列是由候选Rf组79和104中的DNA序列之间的重组事件产生的。该重组序列可能在R0934F中不起作用,因为已知该品系仅携带Rf3。
B.Rf3登录品的结果:
将与Rf1登录品相同的基本原理应用于特征为携带Rf3基因的登录品(Primepii和R0934F)。表9A显示直系同源RFL基团67、89、140、166和252是由Rf3编码的Rf蛋白的候选Rf组,因为它们含有在Primepii和R0934中鉴定的蛋白,这两个登录品的特征在于携带Rf3恢复基因并且位于染色体1B短臂上的定位遗传区间中。
Figure GDA0002682210720001001
表9A:基于Rf3种质CMS信息选择RFL簇
为了实现选择Rf3候选者的详尽分析,仔细分析了所有282个RFL簇的与Rf3基因型信息相关的RFL的数目、长度和起源。筛选由多个登录品的RFL序列组成的RFL簇的仅源自Primepii和R0934F基因型的全长蛋白质序列,以及非携带Rf3基因型的部分/较短序列。该分析允许鉴定另外四个Rf3候选RFL簇:RFL28、RFL29、RFL60和RFL170。
Figure GDA0002682210720001002
Figure GDA0002682210720001011
表9B:RFL簇28、29、60和170中存在的蛋白质的详细信息,包括蛋白质长度(aa=氨基酸)和名称。
表9B显示:
在候选RFL 28中,来自Rf3基因型(Primepii和R0934F)的序列长度为857个氨基酸,而来自所有其他种质(非Rf3)的序列被截短(大小为323-479个氨基酸),因此很可能是无功能的。
在候选组RFL 29中,来自Rf3登录品(Primepii和R0934F)的序列长度为828个氨基酸,而来自所有其他(非Rf3)种质的序列被截短,因此很可能是无功能的。
在候选组RFL 60中,不存在非Rf3基因型(R197和R0932E)的序列(R0932E)或由于其氨基酸长度(287个氨基酸)而被认为是无功能的。Rf3基因型Primepii和R0934F的序列基于其序列长度似乎是全长且具有功能。此外,我们的定位分析将RFL60簇定位在Rf3区间内。
在簇RFL 170中,Rf3基因型(Primepii和R0934F)的序列(560个氨基酸)明显大于似乎被截短(低于370个氨基酸)并且被认为是无功能的非Rf3基因型的序列。我们的详细序列分析表明,除了RFL288之外,RFL170实际上是由同一重叠群编码的第二个ORF。这两个ORF都来自其中连续性被移码破坏的相同的RFL基因。
C.Rf7和Rf-黑麦登录品:
将用于分析携带Rf1和Rf3登录品相同的原理应用于携带Rf7恢复基因的登录品(R197和提莫菲维小麦)。Rf7基因定位在染色体7BL上。
表10显示RFL 80、128和191是Rf7基因编码的Rf蛋白的候选Rf组,因为仅在R197或提莫菲维小麦中发现了分配给这些簇的蛋白质。
关于源自黑麦染色体6R基因渗入小麦基因组的恢复基因,由小麦-黑麦-6R恢复品系衍生的单个蛋白质组成的簇被认为是黑麦-6R特异性恢复基因的良好候选者。这些标准适用于表6中列出的RFL 46、87和208直系同源基团。由于与小麦序列相比它们高序列分歧,因此这些基因是源自黑麦的恢复基因的极好候选者。
Figure GDA0002682210720001021
表10:基于Rf7种质CMS信息选择RFL
Figure GDA0002682210720001031
表11:基于Rf-黑麦种质CMS信息选择RFL
实施例5:用于提莫菲维小麦CMS育性恢复的候选基因的克隆
编码来自候选Rf组的任何RFL蛋白的核酸序列可用于克隆和转化。但是,在本实验中,出于克隆和转化目的,优先使用编码最长RFL蛋白的DNA序列,其特征在于具有起始密码子、线粒体靶向序列和15-20的PPR基序数。如果至少两个最长RFL蛋白恰好具有相同的长度,则将优先选择编码此类RFL蛋白并呈现最长5'-UTR序列的核酸以进行克隆和转化步骤。
优化了衍生自小麦-黑麦-6R.300k_组装_重叠群_35_1的小麦-黑麦-6R RFL46序列以提供SEQ ID N°3115。经由金门反应将该序列克隆入具有玉米泛素内含子(SEQ ID N°3109所示的intZmUbi,Christensen et al 1992)的组成型玉米泛素启动子(SEQ ID N°3134所示的proZmUbi)以及编码高粱热休克蛋白的基因的3'终止序列(登录号:Sb03g006880)之间的目的二元质粒pBIOS10746中;称为terSbHSP的终止序列如SEQ ID N°3110所示。重组构建体的序列如SEQ ID N°3125所示。
与上述类似,将分别如SEQ ID N°3117-3120中所示的TaRFL104序列(衍生自R0932E.300k_组装_重叠群_82_1)、TaRFL67序列(衍生自Primepii.300k_组装_重叠群_2_1)、TaRFL79序列(衍生自R197.300k_组装_重叠群_120_1)和TaRFL89序列(衍生自R0934F.300k_组装_重叠群_99_1)用于克隆目的。经由金门反应将这些序列克隆入目的二元质粒pBIOS10746中。重组构建体的序列分别如SEQ ID N°3131、3128、3129和3130所示。
经由限制性酶反应,将TaRFL104序列(SEQ ID N°3117所示)克隆入天然普通小麦启动子(proTaRFL104,SEQ ID N°3113)和普通小麦RFL104编码基因的3'终止序列(terTaRFL104,如SEQ ID N°3112所示)之间的目的二元质粒pBIOS10747中。重组构建体的序列如SEQ ID N°3126所示。
经由限制性酶反应,将TaRFL79序列(SEQ ID N°3119所示)克隆入天然普通小麦启动子(proTaRFL79,SEQ ID N°3123)和普通小麦RFL79编码基因的3'终止序列(terTaRFL79,SEQ ID N°3124所示)之间的目的二元质粒pBIOS10747中。重组构建体的序列如SEQ ID N°3122所示。
还经由限制性酶反应将小麦-黑麦RFL46序列克隆入天然普通小麦启动子(proTaRFL46,SEQ ID N°3114)和普通小麦RFL46编码基因的3'终止序列(terTaRFL46,如SEQ ID N°3111所示)之间的目的二元质粒pBIOS10747中。对于此构建体,小麦-黑麦RFL46序列衍生自小麦-黑麦-6R.300k_组装_重叠群_35_1编码序列,并修饰用于克隆目的,而无需任何优化步骤。编码序列如SEQ ID N°3116所示。重组构建体的序列如SEQ ID N°3127所示。
二元目标载体pBIOS10746和pBIOS10747是二元载体pMRT(WO2001018192A3)的衍生物。
将上述所有二元质粒转化到农杆菌EHA105中。
实施例6:转化&育性恢复表型分析
为了筛选与育性恢复有关的候选基因,开发了具有细胞质雄性不育和强转化性以及再生潜力两者的BGA_Fielder_CMS小麦品种。基本上如WO 2000/063398所述,用实施例5获得的农杆菌菌株转化BGA_Fielder_CMS小麦品种。对于上述每个构建体产生小麦转基因事件。
对于包含RFL46的构建体,还用栽培种Fielder进行转化。
将实施例6中产生的所有小麦转基因植物和对照可育植物在标准小麦生长条件下在温室中生长(20℃下光照时段16小时,15℃下黑暗时段8小时,恒定60%湿度),直到对照野生型Fielder品种的谷粒达到成熟阶段。
通过计数每株植物上每个穗的种子数和空颖数并与野生型Fielder和BGA_Fielder_CMS对照植物进行比较来评估转基因植物的育性。还通过观察花药挤出来评估植物。
分析了衍生自11个独立转化事件的ZmUbi启动子下过表达SEQ ID N°361(如表7中所列)所示的RFL79序列的16个转化的CMS-Fielder植物。
所有植物均表现出雄性育性的恢复,而平行生长的100%未转化的CMS-Fielder植物完全不育,没有花药挤出,也没有种子产生,并且100%的WT-Fielder植物可育。
这些结果证实,RFL79可以恢复CMS-T植物的育性,并且CMS-Fielder的遗传转化是测试育性恢复基因功能的有效***。
实施例7:Rf基因启动子的克隆、转化和GUS分析:
优化了大肠杆菌β-葡萄糖醛酸苷酶(EcGUS)序列(如SEQ ID N°3121所示),并经由限制性酶反应克隆入天然普通小麦小麦启动子(proTaRFL46,SEQ ID N°3114)和编码RFL46的普通小麦基因的3'末端序列(terTaRFL46,如SEQ ID N°3111所示)之间的目的二元质粒pBIOS10743中,形成pBIOS11468。
基本上如WO 2000/063398所述,用这些农杆菌菌株转化Fielder小麦品种。对于上述每个构建体产生小麦转基因事件。
在孕穗期直至开花期之后,解剖头部和花器官,并在37℃下于X-Gluc溶液(Jefferson,1987)中孵育16小时,以评估GUS表达。
实施例8:潜在地参与Rf4育性恢复的全长RFL PPR基因的鉴定
与在实施例2中进行的捕获相比,使用一组不同的登录品实现第二次捕获。使用以下登录品:
-两个维持品系(Anapurna,Fielder)
-如实施例2所述的提莫菲维小麦登录品。
-鉴定为提莫菲维小麦型CMS的恢复品系的四个登录品,其特征在于存在Rf4恢复基因座:L13、R113、17F3R-0377和GSTR435。
-Rf1、Rf3和Rf7恢复登录品,其特征在于不存在Rf4恢复基因座:R197、R0934F。
GSTR435衍生自将Aegilops
Figure GDA0002682210720001061
基因渗入普通小麦中,并且可在USDA上获得(https://npgsweb.ars-grin.gov/gringlobal/search.aspx)。三个其他登录品R113(可通过Australian Grains Genebank:90819获得)、L13(可通过Australian GrainsGenebank:90821获得)和17F3R-0377(衍生自R113)都衍生自将提莫菲维小麦基因渗入普通小麦中。
如实施例2所述进行诱饵设计并与来自登录品的DNA片段杂交。然后,使用Novoalign(3.04.06版本,http://www.novocraft.com/products/novoalign/)将来自每个登录品的100K读长对的子集定位至表7中鉴定的RFL组,其中设置允许具有约97%同一性的多次命中(选项:-r all-t 240)。然后,使用Bedtools实用程序(2.26.0版本,http:// github.com/arq5x/bedtools2)coverageBed(选项:-d)和groupBy(选项:-o mean)来计算每个RFL的平均覆盖。
评估所有RFL的相对覆盖率以及每个登录品的读长。根据其被衍生自提莫菲维小麦登录品的读长覆盖评估RFL的第一等级。仅考虑显示不被来自“非Rf”(维持子)或非Rf4登录品的读长覆盖(值从0-10),但显示被来自Rf4登录品的读长的显著覆盖(值>30)的RFL组。图3显示了潜在地对应于Rf4基因的这些RFL组的列表。
还评估了登录号GSTR435的覆盖。图3显示,只有RFL120在登录号GSTR435中显示显著覆盖,尽管低于其他登录号。这可通过普通小麦和Aegilops
Figure GDA0002682210720001062
之间的***发育距离大于普通小麦和提莫菲维小麦的***发育距离来解释。
为了进一步研究与RFL120组有关的序列,然后在两个步骤中组装针对每个Rf4登录品定位到RFL120的读长。第一步包括将重叠的读长对与BBMAP软件包中的实用程序bbmerge.sh(36.59版本https://sourceforge.net/projects/bbmap/)合并,并且使用同一软件包中的实用程序tadwrapper.sh组装它们(选项:k=150,180,210,240,270,300,330,360,390,420,450bisect=t)。来自第一步的重叠群也使用相同软件包的工具dedupe.sh进行重复数据删除,并作为“可信重叠群”和来自相同登录品的所有读长对(选项:--cov-cutoff 5–careful)一起提供给另一个汇编程序SPADES(版本3.10.1http://bioinf.spbau.ru/spades)以生成该登录品的最终组装。然后,对于每个登录品,使用来自BLAST+软件包的tblastn实用程序(版本2.2.30https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastDocs&DOC_TYPE=Download)使用默认设置检索最佳命中的蛋白质序列RFL120(表7中所列的SEQ ID N°477)。
最终鉴定以下序列包含在RFL120组中:
SEQ ID N°3138所示并由SEQ ID N°3142编码的RFL120-R113、SEQ ID N°3137所示并由SEQ ID N°3141编码的RFL120-L13、SEQ ID N°3135所示并由SEQ ID N°3139编码的RFL120-17F3R-0377、和最后如SEQ ID N°3136所示并由SEQ ID N°3140编码的RFL120-GSTR435(本文称为RFL120-spelt)。
SEQ ID N°477和SEQ ID N°2031(参见表7)中记载的上述氨基酸或核苷酸序列与来自RFL120的相应序列(本文称为“RFL120_timo”)的比对表明RFL120-17F3R-0377被截短。关于RFL120-R113和RFL120-L13,核苷酸序列均与RFL120-timo相同,除了在5'UTR区域分别长357和349个核苷酸。
图4a和4b分别显示RFL120-spelt与RFL120-timo的核苷酸和氨基酸序列之间的比对。这表明RFL120-timo核苷酸序列与“RFL120_spelt”序列具有95%同一性,这解释了之前在图3中用GSTR435观察到的低覆盖。
总之,结果证实RFL120组是Rf4的最强候选者。
实施例9:克隆、转化和育性恢复测定
按照与实施例5和6中所述相同的方法,在合适的情况下,对RFL120-timo、RFL120-spelt、RFL120-R113和RFLK120-L13的核苷酸序列进行优化,以确保在小麦中的适当表达并适于克隆目的。
经由金门反应将这些序列克隆入具有玉米泛素内含子(intZmUbi,如SEQ ID N°3109所示,Christensen et al 1992)的组成型玉米泛素启动子(SEQ ID N°3134所示的proZmUbi)和编码高粱热休克蛋白的基因的3'终止序列(登录号:Sb03g006880)之间的目的二元质粒pBIOS10746中;称为terSbHSP的终止序列如SEQ ID N°3110所示。
如实施例6进行转化和育性测定。
实施例10:CMS提莫菲维小麦Rf3恢复品系育性的评估
评估了十一个分类为携带已知参与恢复提莫菲维小麦(T-CMS)中T型细胞质雄性不育的Rf3恢复基因的小麦优良品系恢复T-CMS细胞质的能力,并表征了其育性基因型。研究了由用作雌性亲本的不育CMS小麦品系和用作花粉供体的给定小麦恢复品系之间的杂交产生的杂交种产生谷物的能力。优良品系包括可商购品系,例如Altigo、Aristote、Cellule、Altamira、Rubisko、Primepii或Premio,以及Limagrain专有品系(表12)。此外,所述研究包括中国春品系(表12)。
育性测试在室内(生长室或在温室)在可控的生长条件下进行,使得被测试的小麦植物能够正常表达育性表型。使植物在15℃-20℃的温度下16小时光照时段和20-25℃的温度下8小时黑暗时段生长,其中湿度为50%-70%。观察到的花粉育性恢复可以是部分的或完全的。
携带T-CMS细胞质的F1小麦植物的育性得分可以通过将从穗打谷的种子总数除以计数的小穗数来计算,并可以与在相同区域和相同农业环境条件下生长的一组对照可育植物(其在这项研究中,由携带正常小麦细胞质的优良近交系组成)的育性得分相比较。优选的是,这组品系包括一组至少5个优良的近交系。此外,优选的是,对于给定实验,评估来自不同单个F1植物的至少10个穗。
育性得分i大于零(>0)表示植物已获得部分或完全的育性恢复。对于每个育性得分,计算统计检验以获得p值。统计检验的实例是方差分析或均值比较检验。低于5%阈值的p值将表明两个分布在统计上是不同的。因此,与可育对照植物的育性得分相比,测试小麦植物的显著降低的育性得分表明F1植物未获得完全的育性恢复(即部分恢复)。明显类似或更高的育性得分表明F1植物已获得完全的育性恢复。指定的育性得分通过将从穗打谷的种子总数除以计数的小穗数来计算。
通过比较携带Rf3恢复基因的F1植物的育性得分和在相同条件下生长的一组优良自交系的育性得分来进行t检验(来自37个冬季和春季优良品系的633个穗;μ=2.36,α=0.59)。
表12中显示的结果表明,CMS杂交种中存在两种类型的部分Rf3育性恢复子。一种可以称为“Rf3”,其育性得分为1-1.8,第二种称为“Rf3弱”,其育性得分小于1。例如,用Primepii获得的CMS杂交种在10个单独的F1穗(“Rf3”表型)中的平均育性得分为1.7粒谷粒/小穗,而用Altigo获得的杂交种在47个单独的F1穗(“Rf3弱”表型)中的平均育性得分为0.7粒谷粒/小穗(表12)。通过遗传作图和标记辅助选择显示不同中国春品系带有Rf3恢复基因座(数据未显示)。评估用中国春品系获得的CMS杂交种的育性得分。它们显示出平均估计的育性得分为0.6粒谷粒/小穗和“Rf3弱”表型。
表12.研究中使用的小麦优良品系以及由其花粉产生的CMS杂交种的育性得分。
Figure GDA0002682210720001091
Figure GDA0002682210720001101
*NA:不可用,STD:标准偏差
实施例11:分析的Rf3恢复品系之间的基因型比较
如实施例2所述,用表12列出的登录品实现RFL基因捕获。对于实施例4B中鉴定的每个RFL,比对来自每个登录品的相应蛋白序列以进行比较。
结果表明,对于RFL29、RFL164和RFL166,在表型和基因型之间存在强关联。对于RFL29,鉴定了称为“a”、“b”和“c”的三个不同的等位基因,而对于RFL164或RFL166,鉴定了两个不同的等位基因“a”和“b”。所有具有“Rf3”表型的登录品均携带RFL29a、RFL164a和RFL166a等位基因,而所有“Rf3弱”登录品在基因型中均携带RFL29b、RFL166b和RFL164b等位基因。
对于RFL29,维持品系Atomo的特征在于存在两个截短的ORF,这可能是由于移码突变RFL29c_1和RFL29c_2所致,其分别编码由258和535个氨基酸组成的蛋白质。该基因型形式仅存在于维持品系中(数据未显示)。
图5A显示了RFL29a、RFL29b、RFL29c_1和RFL29c_2的蛋白质序列比对。图5B和5C分别示出了RFL164a和RFL164b(如SEQ ID N°3144所示)以及RFL166a和RFL166b(如SEQ ID N°3145所示)的蛋白质序列比对。
实施例12:克隆、转化和育性恢复测定
按照与实施例5和6所述相同的方法,经由门反应将RFL29a(示于SEQ ID N°3146或SEQ ID N°1712并且编码与SEQ ID N°158相同的序列)、RFL29b(示于SEQ ID N°3149并且编码与SEQ ID N°3143相同的序列)、RFL164a(示于SEQ ID N°3147或SEQ ID NO°2230并编码与SEQ ID N°676相同的序列)和RFL166a(示于SEQ ID N°3148或SEQ ID NO:2238并编码与SEQ ID N°684相同的序列)的核苷酸序列克隆入具有玉米泛素内含子(SEQ ID N°3109所示的intZmUbi,Christensen et al 1992)的组成型玉米泛素启动子(SEQ ID N°3134所示的proZmUbi)以及编码高粱热休克蛋白的基因的3'终止序列(登录号:Sb03g006880,如SEQ IDN°3110所示的terSbHSP)之间的目的二元质粒pBIOS10746中。每种重组构建体的序列分别如SEQ ID N°3150、SEQ ID N°3151、3152和3153所示。
类似地,将RFL29a和RFL29b序列克隆到其内源启动子pRFL29a(示于SEQ IDN°3154)和pRFL29b(示于SEQ IDN°3155)和终止子序列terSbHSP的下游。每个重组构建体的序列分别示于SEQ ID N°3156和SEQ ID N°3157。
最后,与前述相同地制备两个其他盒,唯一的不同是使用了相应的内源性终止子序列terRFL29a(示于SEQ ID N°3160)和terRFL29b(示于SEQ ID N°3161)。相应的表达盒分别示于SEQ ID N°3158和SEQ ID N°3159。如实施例6所述进行转化和育性测定。
实施例13:比较RFL29a和RFL29b编码基因的5’UTR序列
为了分析是否可以通过基因表达水平的变化来解释育性水平的变化,从分类为“Rf3”的TJB155品系(表12)产生的BAC中分离了RFL29a基因的5'UTR序列,并从分类为“Rf3弱”品系的中国春中鉴定了RFL29b的5'UTR序列(IWGSC RefSeq v1.0组件)。
图6显示了RFL29a和RFL29b基因中鉴定的5'UTR区域的比对。
序列比较表明,RFL29a基因的5'UTR序列包含RFL29b相应序列(SEQ ID NO:3174)的5'UTR中鉴定的163bp长区域的缺失。该区域的一部分在专利申请WO2018015403中鉴定为推定参与了miRNA介导的下游鉴定的PPR基因表达的抑制。
表12中列出的不同登录品之间的序列比较显示,所有“Rf3弱”登录品带有163bp,所有“Rf3”登录品带有163bp缺失。
由于RFL29a基因的5'UTR序列中的163bp缺失,预期163bp区域削弱RFL29b基因的表达,从而与具有RFL29a等位基因的品系相比,具有RFL29b等位基因的品系的育性水平较弱。
实施例14:缺失的TaRFL29b启动子的克隆、转化和育性分析
按照与实施例5所述相同的方法,RFL29b的核苷酸序列在修饰的启动子pRFL29bdel(示于SEQ ID N°3162)下表达,该启动子携带163bp区域的缺失,从SEQ ID N°3155所示的RFL29b启动子序列的核苷酸1876到核苷酸2038。使用SEQ ID N°3110所示的终止序列terSbHSP。重组构建体示于SEQ ID N°3163。
按照实施例6的方法进行CMS*Fielder小麦品系的转化(不是“Rf3”或“Rf3弱”),不同之处在于增加以下对照:表12列出的所有“Rf3”表型品系、表12中列出的所有“Rf3弱”品系,最后是如实施例12中所述的转化品系,其表达盒在RFL29b上游具有pTaRFL29b启动子。
实施例15:通过CRISPR技术修饰RFL29b的内源启动子以将“Rf3弱”品系恢复为“Rf3”品系:
为了增加RL29b的表达,使用内切核酸酶在RFL29b的启动子中进行了163bp的不同缺失,以进行定点诱变。
表13提供了具有相关PAM基序和相应靶序列的不同核酸内切酶。
图7显示了针对不同核酸内切酶鉴定的163bp区域周围和内部的不同靶序列的位置。表13列出了可组合使用以在163bp区域进行缺失的设计的向导序列。
表13.
Figure GDA0002682210720001121
Figure GDA0002682210720001131
优化了编码LbCpf1核酸内切酶的核苷酸序列(如SEQ ID N°3164所示),并经由金门反应将其克隆入具有玉米泛素内含子(SEQ ID N°3109所示的intZmUbi,Christensen etal 1992)的组成型玉米泛素启动子(SEQ ID N°3134所示的proZmUbi)以及小鼠核输入NLS序列(如SEQ ID N°3172所示)的3'区域和SEQ ID N°3170所示的3'末端序列terZmHSP之间的目的二元质粒pBIOS10746中。
优化了编码SpCas9核酸内切酶的核苷酸序列(如SEQ ID N°3165所示),并经由金门反应将其克隆入位于具有玉米泛素内含子(SEQ ID N°3109所示的intZmUbi,Christensen et al 1992)的组成型玉米泛素启动子(SEQ ID N°3134所示的proZmUbi)和SV40NLS序列(如SEQ ID N°3173所示)的下游以及小鼠核输入NLS序列和SEQ ID N°3171所示的3'终止序列terAtNos的上游的目的二元质粒pBIOS10746中。
将每个向导序列克隆在pTaU6启动子(示于SEQ ID N°3168)和终止序列TerRNApolIII(示于SEQ ID N°3169)之间。
将每个表达内切核酸酶的盒连续克隆到表达相应向导序列的盒上。SEQ ID N°3167显示表达LbCpf1和针对靶-23和靶-71的向导序列的重组盒。SEQ ID N°3166显示表达SpCas9和针对靶-58和靶-54的向导序列的重组盒。
如实施例6进行转化,除了转化表12中列出的所有“Rf3弱”品系。如实施例14进行育性测定以选择具有“Rf3”表型的品系。
实施例16:CMS提莫菲维小麦恢复品系育性的评估
一些小麦优良品系具有部分恢复细胞质雄性不育提莫菲维小麦(T-CMS)的育性的能力。雌性不育CMS小麦品系和雄性小麦恢复品系之间形成的杂交种可以产生谷粒。已测试了商购品系Allezy、Altamira、Altigo、Aristote、Osado、Cellule或Premio和Limagrain专有品系恢复T-CMS的能力。所有品系的特征还在于其育性基因型。
育性测试在室内(在生长室或在温室中)在可控的生长条件下进行,使得被测试的小麦植物能够正常表达育性。所指示的育性得分通过从穗打谷的种子总数除以计数的小穗数来计算。通过比较由恢复子生产的F1的育性得分和在相同条件下生长的一组优良自交系的育性得分来进行t检验(来自37个冬季和春季优良品系的633个穗;μ=2.36,α=0.59)。
表14的结果表明,这些品系在CMS杂交种中充当部分育性恢复子。例如,用Allezy生产的杂交种在33个单独的F1穗上产生的平均育性为0.99粒谷粒/小穗。这种能够部分恢复CMS提莫菲维小麦育性的天然能力之前在小麦登录品中被鉴定为Primepii或MarisHunstmann(Bahl和Maan,1973),并由我们自己的内部数据证实(见表14)。除了推测的小麦的内在恢复来源外,Wilson(Wilson and Ross1962)进行的提莫菲维小麦和普通小麦之间的杂交有助于将其染色体臂定位通过单体分析鉴定的进一步的恢复基因引入小麦中(Bahland Maan,1973;Maan and al,1984)。
遵循这些初始工作,全世界实施了许多旨在为T-CMS(如TJB155)(BBSRC SmallGrain Cereals Collection:2072-2075)创建恢复品系的育种计划,其恢复能力也通过我们自己的内部数据被证实(表14)。
L13(可经由澳大利亚谷物基因库获得:90821)是选自R113(可通过澳大利亚谷物基因库获得的:90819)的小麦恢复品系,其携带恢复等位基因Rf4。与CMS品系杂交后,它产生低水平育性恢复(平均0.85粒种子/小穗)。当与在相同条件下生长的一组优良品系的育性得分比较时,似乎没有一个测试的推定恢复子能够使杂交种的育性完全恢复(p值<0.05,表14)。
表14还显示携带两个不同Rf基因座的恢复品系不能完全恢复由T-CMS诱导的不育。因此,所有测试的具有单个或两个Rf基因座的恢复品系仅是部分T-CMS恢复品系。
Figure GDA0002682210720001151
表14:指定穗数的平均育性得分和标准差。第一列表示用作F1杂交的传粉者的雄性品系的名称。显示的所有数据(优良自交系除外)均来自列出的品系和CMS测试者之间产生的F1杂交。“优良自交系”数据是指由37个冬季和春季优良品系组成的一组品系。进行t检验,比较每个F1杂交的育性平均值与一组带有可育细胞质的优良近交系的633个穗的育性得分的平均值。
实施例17:包含Rf1、Rf3的基因组区域的精细定位以及Rf4和Rf7遗传决定因子的遗传定位
A.包含Rf1遗传决定因子的基因组区域的精细定位
如实施例1所述分别对涵盖210、218和212个个体的Rf1隔离的三个F2定位群(R197xKalahari、R204xAlixan和R0932ExAltigo)进行表型分型,并使用Limagrain的内部基因分型平台,用18100个SNP标记进行基因分型。R204和R197品系的育性与Rf1和Rf7基因座遗传相关。R0932E品系的育性与Rf1基因座相关。
Rf1首先定位到Limagrain内部共有图谱上4cM-10.9cM的染色体1A的短臂上,并通过SNP标记cfn1087371和cfn0530841物理地界定。这两个SNP标记界定了三个定位群限定的最大可能区间(参见图8)。
随后,对这三个定位群的联合分析以及衍生的F3家族中各个F2重组植物的表型分析验证了QTL位置,并在Limagrain的内部共有图谱上界定了7cM-8.9cM的Rf1区间,并通过SNP标记cfn1082074和cfn0523990物理地界定。我们使用了IWGSC全基因组组装的基因组资源“IWGSC WGA”(2016年6月从URGI IWGSC资料库中获得)以将基因座固定在小麦基因组参考物理图上。左边框(cfn1082074)固定在IWGSCWGAV02_1AS_scaffold44309支架上,并且右边框(cfn0523990)固定在IWGSCWGAV02_1AS_scaffold47238支架上。
接下来,我们决定扩大群体规模以精确定位基因座,并分别从该基因座的F2植物杂合子衍生的R197xKalahari和R204xAlixan筛选2976和3072F3品系。在该区间内的重组植物后代的表型分型和分析重新限定了7.5-8.8cM的较小的定位区间,其分别由IWGSCWGAV02_1AS_scaffold44309支架和IWGSCWGAV02_1AS_scaffold47238支架上的cfn0522096和cfn0527067SNP标记界定。
B.包含Rf3遗传决定因子的基因组区域的精细定位
如实施例1所述,对分别涵盖217、135和246个个体的三个F2定位群(TJB155xAnapurna、2852xAltamira和AH46xR0946E)以及由140个个体植物组成的Rf3隔离的双单倍体(DH)群(H46xR934F)进行表型分型,并使用Limagrain的内部基因分型平台用18100个SNP标记进行基因分型。Rf3基因座的来源是TJB155、Altamira和R0946E。
Rf3首先定位到Limagrain内部共有图谱上18.9cM-24.2cM的染色体1B的短臂上,并通过SNP标记cfn0554333和cfn0560679物理地界定。这两个SNP标记界定了四个定位群限定的最大可能区间(参见图9)。
随后,对这四个定位群的联合分析以及衍生的F3家族中各个F2/DH重组植物的表型分析的证实验证了QTL,并在Limagrain的内部共有图谱上遗传界定了22.2cM-22.7cM的基因座,并物理地界定了SNP标记cfn0436720和cfn0238384之间的Rf3区间。我们使用了IWGSC全基因组组装的基因组资源“IWGSC WGA”(2016年6月从URGI IWGSC资料库中获得)以将基因座固定在物理图上。左边框(cfn0436720)固定在IWGSCWGAV02_1BS_scaffold35219支架上,并且右边框(cfn0238384)固定在IWGSCWGAV02_1BS_scaffold5117支架上。
接下来,我们决定扩大群体大小以精确定位基因座,并从该基因座的F2植物杂合子衍生的TJB155xAnapurna和AH46xR0946E筛选2496和672种植物。在该区间内的重组F3植物后代的分析重新限定了22.5-22.7cM的较小的定位区间,其分别由IWGSCWGAV02_1BS_scaffold35219支架和IWGSCWGAV02_1BS_scaffold5117支架上的cfn1249269和BS00090770SNP标记界定。
C.包含Rf7遗传决定因子的基因组区域的定位
我们将R197(具有Rf1和Rf7基因座)和Primepii杂交(具有Rf3基因座),然后从作为rf1和rf3的个体(这意味着在基因座Rf1和Rf3上不携带恢复等位基因)衍生出176种植物的群体。使用Limagrain的内部基因分型平台用18100个SNP标记对植物进行基因分型,并按实施例1所述进行表型分析。我们将Rf7基因座定位在染色体7BL上。此外,内部基因分型数据显示出很强的遗传差异,表明存在稳定地世代传播的外来染色体片段。我们在Limagrain的内部共有图谱上的染色体7B上鉴定出45cM-88cM的大QTL,其峰值为46.7cM(cfn0919993,LOD得分为3.37E-40)。对重组植物的初步分析表明,Rf7基因可能位于cfn3407185和W90K_RAC875_c33564_120标记之间,从而在Limagrain的内部共有图谱上的46.7cM-47cM之间界定了0.3cM的定位区间。
D.包含Rf4遗传决定因子的基因组区域的定位
使用Limagrain内部基因分型平台用18100个SNP标记对来自由124个个体植物组成的Rf4隔离的AH46和L13(包含Rf4基因座)之间的杂交的定位群进行基因分型,并如实施例1所述进行表型分型。在Limagrain的内部共有图谱上在染色体6B的0cM-65cM鉴定我们称为Rf4的QTL,其中峰值在43.3cM(cfn0393953,LOD得分为1.08E-13)。此外,内部基因分型数据显示出很强的遗传差异,表明存在稳定地世代传播的外来染色体片段。预期在该染色体区域内重组率非常低,因此认为与cfn0393953连锁的任何标记与Rf4基因座相关。
实施例18:与Rf基因相关的SNP的鉴定及其在MAS中的用途
我们用包含Rf1、Rf3和Rf7等位基因的DH品系构建BAC文库。该文库用于鉴定Rf1和Rf3 QTL区间内的BAC克隆。更具体地,我们鉴定和测序和遗传验证了Rf1区域内的3个BAC克隆和Rf3区域内的3个BAC克隆。将BAC序列与中国春参考基因组进行比较用于SNP发现。然后,我们通过从公共基因组资源中挖掘可用的SNP和从已测序的BAC克隆中新发现的SNP,来饱和Rf1和Rf3定位区间。
在由83个小麦优良植物和Rf1、Rf3、Rf4和Rf7的已知恢复子组成的多样性组上筛选多态性和有益的SNP标记,鉴定了位于Rf1、Rf3、Rf4和Rf7定位区间的侧翼区域之内或之中的一组紧密连接的标记。这些SNP标记可以单独使用和/或用于单倍型,以在MAS育种方案中选择Rf或rf植物(图10A和图11A)。表15中提供了等位基因信息、标记序列和引物信息。随后,选择高质量的2-3个标记的较小组以跟踪MAS育种方案中的性状。
例如,通过使用标记276I13_96B22_97797或104A4_105588来鉴定植物基因组中Rf1基因座的存在(图10A和B)。
类似地,通过使用标记136H5_3M5_7601或136H5_3M5_89176来鉴定植物基因组中Rf3基因座的存在(图11A、11B、11C、11D和表15)。但是,如果图11A中列出的任何标记在种质中是多态性的,则它们可以用来将这些维持品系区分于恢复品系。例如,在表16中,通过使用标记cfn1246088或IWB72107可以确定Rf3基因座的存在与否。
通过使用标记cfn0917304、cfn0919993和cfn0920459(表17)来鉴定植物基因组中Rf7基因座的存在。在这种情况下,可以在单倍型中使用这3种标记来区分恢复植物和维持植物。因此,单倍型TGC将鉴定恢复植物。
最后,通过使用标记cfn0393953和cfn0856945(表18)来鉴定植物基因组中Rf4基因座的存在。
Figure GDA0002682210720001201
Figure GDA0002682210720001211
表15:Rf3基因座处针对2个SNP标记的一系列恢复品系和维持品系的单倍型。这两个SNP标记使得可以完全区分维持品系和恢复品系(包括优良品系Altamira、Cellule、Premio以及登录品TJB155和Primepi)。
Figure GDA0002682210720001212
Figure GDA0002682210720001221
表16:在基因座Rf3处针对2个SNP标记的一系列恢复品系和维持品系的单倍型。这2个SNP标记使得可以将维护品系与恢复品系完全区分开。
Figure GDA0002682210720001222
Figure GDA0002682210720001231
表17:Rf7基因座处针对恢复品系LGWR16-0016和LGWR16-0026和一系列维持品系的单倍型。“-”得分对应于显性标记,其中在几个维持品系中没有扩增。
Figure GDA0002682210720001241
表18:Rf4基因座处针对恢复品系L13和R113以及维持品系的单倍型。
SNP标记序列
Figure GDA0002682210720001251
Figure GDA0002682210720001261
Figure GDA0002682210720001271
Figure GDA0002682210720001281
Figure GDA0002682210720001291
表19.标记序列和序列中的SNP位置。
实施例19:Rf基因的累积效应的测试
为了测试恢复等位基因累积效应的假设并鉴定可在CMS杂交种中产生完全育性的Rf基因的组合,使用与4个定位的主要基因座连锁的SNP来创建结合不同的恢复等位基因的恢复品系。可以采用不同的育种技术(例如谱系育种、回交、单种子后代或双单倍体)创建2个Rf等位基因、3个Rf等位基因和4个Rf等位基因组合(Rf1+Rf3、Rf1+Rf4、Rf1+Rf7、Rf3+Rf4、Rf3+Rf7、Rf4+Rf7、Rf1+Rf3+Rf4、Rf1+Rf3+Rf7、Rf3+Rf4+Rf7和Rf1+Rf3+Rf4+Rf7)。
在该实施例中创建了来自杂交TJB155/R204的2个双单倍体品系:LGWR16-0016和LGWR16-0026。这两个品系携带恢复等位基因Rf1、Rf7(供体R204)和Rf3(供体TJB155),并且与来自提莫菲维小麦(供体TJB155)的细胞质异质。
LGWR16-0016和LGWR16-0026具有冬季生长***均值。LGWR16-0026:2.33粒种子/小穗,40个单穗的平均值)。LGWR16-0016和LGWR16-0026在一系列具有优良背景的A品系杂交中用作授粉者(对于LGWR16-0016为14个A品系,对于LGWR16-0026为16个A品系)。室内评估了来自那些杂交的F1植物的育性。
主要分蘖的育性评估
用恢复品系LGWR16-0016生产的杂交种的穗的平均产量为45.4粒谷粒,并且确实显示出平均育性为2.44粒谷粒/小穗。用恢复品系LGWR16-0026生产的杂交种的穗的平均产量为44.7粒谷粒,并且确实显示出平均育性为2.37粒谷粒/小穗。这两组的育性分布均与优良品系组成的组无显著差异(表20.T检验,P值<0.05)。结果,各组之间的育性得分分布相对相似(参见表20)。
Figure GDA0002682210720001301
表20:来自用恢复品系LGWR16-0016和LGWR16-0026生产的杂交种和来自一组优良品系的一系列穗的育性(表示为种子数/小穗)。每个穗的平均种子数示于“种子”列中。三组中的每组均提供标准偏差“STD.DEV.”。对于使用LGWR16-0016和LGWR16-0026生产的两组杂交种,给出了T检验的p值“P值”:它表示杂交种组和优良品系组之间“育性”值差异的统计显著性。穗来自最高的分蘖。
来自F1植物的所有分蘖的育性评估
想被认为是完整的,必须在杂交种植物形成的所有穗中观察到育性的恢复。为此目的,评估了用LRWG16-0016生产的56株F1植物、用LGWR16-0026生产的61株F1植物和52个优良品系的穗的完整性,每组分别代表294、262和288个单穗(表21)。用LGWR16-0016生产的56株F1植物平均产生41.4粒谷粒/穗,确实显示出平均育性为2.21粒谷粒/小穗(标准偏差0.32)。用LGWR16-0026生产的61株F1植物平均产生42.8粒谷粒/穗,确实显示出平均育性为2.27粒谷粒/小穗(表5.标准偏差0.32)。这两组的育性分布显著不同于由优良品系组成的组的育性分布(每个穗的平均种子数:38.4。平均育性:2.01。标准偏差为0.44。参见表21)。
Figure GDA0002682210720001311
表21:来自用恢复品系LGWR16-0016和LGWR16-0026生产的杂交种的单个植物和来自一组优良品系的单个植物的平均穗育性(表示为种子数/小穗)。每个穗的平均种子数示于“种子”列中。三组中的每组均提供标准偏差“STD.DEV.”。对于使用LGWR16-0016和LGWR16-0026生产的两组杂交种,给出了T检验的p值“P值”:它表示杂交种组和优良品系组之间“育性”值统计差异的显著性。用恢复品系LGWR16-0016和LGWR16-0026生产的F1植物分别平均形成了5.25和4.3个穗,而来自优良品系的植物平均形成了4.35个穗。
实施例20:从不同来源开发恢复品系:
借助于在之前实施例中开发的标记,使用不同来源的恢复基因座获得了包含Rf1、Rf3和Rf7基因座的新恢复品系。表22列出了这些恢复品系及其特性。
LGWR17-0015是由F1植物通过复杂杂交产生的冬小麦双单倍体品系:首先将R0934F用Altigo授粉,然后将创建的F1 R0934F/Altigo与雄性F1 R197/Apache杂交,随后将得到的四元F1“R0934F/ALTIGO//R197/APACHE”用Altamira品系授粉。LGWR17-0015从恢复品系R0934F继承了T-CMS细胞质。LGWR17-0015已在当地环境下选择,并且是完全可育的小麦品系。
LGWR17-0022和LGWR17-0157是通过复杂杂交产生的冬小麦双单倍体品系:将由恢复品系R204和R213之间的杂交形成的F1用Aristote授粉,然后将得到的三元杂交“R204/R213//Aristote”用品系NIC07-5520授粉。LGWR17-0022和LGWR17-0157从恢复品系R204继承了T-CMS细胞质。它们已在当地环境下选择,并且是完全可育的小麦品系。
LGWR17-0096和LGWR17-0154是通过常规谱系育种技术从三元杂交R204/R213//ARISTOTE开发的冬小麦品系。LGWR17-0096和LGWR17-0154从恢复品系R204继承了T-CMS细胞质。它们已在当地环境下选择,并且是完全可育的小麦品系。
所有品系均已用如上所述的标记进行基因分型以检查Rf1、Rf3和Rf7单倍型的存在。
每个品系的代表性种子样品已保藏于NCIMB保藏中心。
Figure GDA0002682210720001321
表22:关于谱系、选择过程、通过标记鉴定的Rf单倍型和NCIMB保藏号的完整恢复品系数据,“HD”:经过双单倍体过程获得的纯合植物,“F6”:经过六代自交获得的纯合植物。
实施例21:室外Rf1、Rf3和Rf7基因的累积效应的测试
如实施例19中所述,在田间评估了用恢复品系LGWR17-0022、LGWR17-0153、LGWR17-0154和LGWR17-0157生产的4个杂交种的育性,以评估主要分蘖的育性。恢复品系具有表23中所述的谱系和单倍型。
该测定法在三个不同国家法国、德国和英国使用农学适应的杂交种进行。总共测试了28个杂交种,并与26个对照优良自交系比较。结果表明,在田间,包含三个等位基因Rf1、Rf3和Rf7恢复子的组合的杂交种与优良近交系表现一样好(表24)。还应注意的是,在此组合中,Rf3弱或Rf3对育性水平没有任何影响。
Figure GDA0002682210720001331
表23:恢复品系的谱系和单倍型
Figure GDA0002682210720001332
表24:用恢复品系LGWR17-0022、LGWR17-0153、LGWR17-0154和LGWR17-0157以及一组优良品系生产的杂交种的一系列穗的育性(表示为种子数/小穗)。每个穗都来自最高的分蘖。三组中的每组都给出了标准偏差“STD.DEV.”。
实施例22:通过CRISPR技术修饰内源RFL29c基因序列以将rf3等位基因恢复为Rf3等位基因。
如实施例11、图5A和图12所示,与RFL29a核苷酸序列相比,RFL29c核苷酸序列的特征在于缺失2个核苷酸,从而产生移码并导致无活性的截短蛋白。图12中的序列比对显示,可以去除RFL29c基因序列中的一个“T”核苷酸或增加2个核苷酸以将RFL29c基因序列重组为完整的功能性RFL29蛋白。
这样的修饰可在Fielder中实现,如实施例15中所述,Fielder包含SEQ ID NO3457中所示的RFL29c,其设计为靶向移码的合适的向导序列并与诸如WO2015089406所述的剪辑编辑技术结合使用。图12显示了适用于CRISPR cas9版的PAM基序和靶序列。
参考文献
Ahmed et al,2001.QTL analysis of fertility restoration againstcytoplasmic male sterility in wheat.Genes Genet Syst,76:33-38.
Bahl PN,Maan SS,1973.Chromosomal location of fertility restoringgenes in six lines of common wheat.Crop Sci 13:317-320.
Bennetzen JL et al,2012.Reference genome sequence of the model plantSetaria.Nat Biotechnol 30(6):555-+.doi:10.1038/nbt.2196
Brenchley R,et al,2012.Analysis of the bread wheat genome usingwhole-genome shotgun sequencing.Nature 491(7426):705-710.doi:10.1038/nature11650
Cannarozzi G,et al,2014.Genome and transcriptome sequencingidentifies breeding targets in the orphan crop tef(Eragrostis tef).BmcGenomics 15.doi:Artn 58110.1186/1471-2164-15-581
Chen JF et al,2013.Whole-genome sequencing of Oryza brachyanthareveals mechanisms underlying Oryza genome evolution.Nature Communications4.doi:ARTN 159510.1038/ncomms2596
Cheng SF,Gutmann B,Zhong X,Ye YT,Fisher MF,Bai FQ,Castleden I,Song Y,Song B,Huang JY,Liu X,Xu X,Lim BL,Bond CS,Yiu SM,Small I(2016)Redefining thestructural motifs that determine RNA binding and RNA editing bypentatricopeptide repeat proteins in land plants.Plant Journal 85(4):532-547.doi:10.1111/tpj.13121.
Christensen AH and Quail PH,1996.Ubiquitin promoter-based vectors forhigh-level expression of selectable and/or screenable marker genes inmonocotyledonous plants.Transgenic Res,May;5(3):213-8.
Christian et al,1992.Maize polyubiquitin genes:structure,thermalperturbation of expression and transcript splicing,and promoter activityfollowing transfer to protoplasts by electroporation.Plant Mol Biol.18(4):675-89.
Curtis and Lukaszewski,1993.Localization of genes in Rye that restoremale fertility to hexaploid wheat with timopheevii cytoplasm.Plant breeding,11:106-112.
Depigny-This D et al,1992.The cruciferin gene family in radish.PlantMolecular Biology,20:467-479.
Fehr WR et al,1987.Principles of Cultivar Development Vol.1Theory andTechnique.Macmillan,New York..
Fujii S,Bond CS,Small ID(2011)Selection patterns on restorer-likegenes reveal a conflict between nuclear and mitochondrial genomes throughoutangiosperm evolution.P Natl Acad Sci USA 108(4):1723-1728.doi:DOI 10.1073/pnas.1007667108.
Geyer M et al,2016.Distribution of the fertility-restoring gene Rf3in common and spelt wheat determined by an informative SNP marker.MolBreeding,36:167.DOI 10.1007/s11032-016-0592-6.
Figure GDA0002682210720001351
H et al,2011.Transgene Expression Systems in the TriticeaeCereals.Journal of Plant Physiology 168,no.1:30–44.doi:10.1016/j.jplph.2010.07.007.
International Brachypodium I(2010)Genome sequencing and analysis ofthe model grass Brachypodium distachyon.Nature 463(7282):763-768.doi:10.1038/nature08747
Jacquemin J,et al,2013.The International Oryza Map Alignment Project:development of a genus-wide comparative genomics platform to help solve the 9billion-people question.Curr Opin Plant Biol 16(2):147-156.doi:10.1016/j.pbi.2013.02.014.
Jefferson,R.A.,1987.Assaying chimeric genes in plants:The GUS genefusion system.Plant Mol.Biol.Report.5,387–405.DOI:10.1007/BF02667740
Jia J,et al,2013.Aegilops tauschii draft genome sequence reveals agene repertoire for wheat adaptation.Nature 496(7443):91-95.doi:10.1038/nature12028.
Jones HD,2015.Wheat Biotechnology:Current Status and FutureProspects.K.Azhakanandam et al.(eds.),Recent Advancements in Gene ExpressionandEnabling Technologies in Crop Plants,DOI 10.1007/978-1-4939-2202-4_8.
Kay R,et al 1987.Duplication of CaMV 35S promoter sequences creates astrong enhancer for plant genes.Science 236:1299–1302.
Kawahara Y et al,2013.Improvement of the Oryza sativa Nipponbarereference genome using next generation sequence and optical map data.Rice6.doi:Artn 410.1186/1939-8433-6-4.
Kihara,1951,Genome analysis in Triticum and Aegilops X.Concludingreview.Cytologia,16:101-123.
Kojima et al,1997,High-resolution RFLP mapping of the fertilityrestoration(Rf3)gene against Triticum timopheevii cytoplasm located onchromosome 1BS of common wheat.Genes Genet Syst,72:353-359.
Krasileva KV et al,2013.Separating homeologs by phasing in thetetraploid wheat transcriptome.Genome Biol 14(6).doi:ARTN R66 10.1186/gb-2013-14-6-r66.
Li et al,2003.OrthoMCL:Identification of Ortholog Groups forEukaryotic Genomes.Genome Res.2003 Sep;13(9):2178–2189.
Li H.and Durbin R,2010.Fast and accurate long-read alignment withBurrows-Wheeler Transform.Bioinformatics,Epub.[PMID:20080505]
Ling HQ et al,2013.Draft genome of the wheat A-genome progenitorTriticum urartu.Nature 496(7443):87-90.doi:10.1038/nature11997
Longin et al,2012,Hybrid breeding in autogamous cereals.Theor ApplGenet.:125:1007-1096.DOI 10.1007/s00122012-1967-7.
Ma ZQ and Sorrells ME,1995,Genetic analysis of fertility restorationin wheat using RFLP.Crop Sci.,35:1137-1143.
Mace ES et al,2013.Whole-genome sequencing reveals untapped geneticpotential in Africa's indigenous cereal crop sorghum.Nat Commun 4:2320.doi:10.1038/ncomms3320.
McElroy D et al,1990.lsolation of an Efficient Actin Promoter for Usein Rice Transformation.The Plant Cell,Vol.2,163-171.
Martis MM et al,2013.Reticulate Evolution of the Rye Genome.PlantCell 25(10):3685-3698.doi:10.1105/tpc.113.114553
Mayer KFX,et al,2014.A chromosome-based draft sequence of thehexaploid bread wheat(Triticum aestivum)genome.Science 345(6194).doi:ARTN125178810.1126/science.1251788
Mayer KFX et al,Conso IBGS,2012.A physical,genetic and functionalsequence assembly of the barley genome.Nature 491(7426):711-+.doi:10.1038/nature11543.
Ouyang S et al,2007.The TIGR Rice Genome Annotation Resource:Improvements and new features.Nucleic Acids Res 35:D883-D887.doi:10.1093/nar/gkl976.
Pallavi Sinha P et al 2013.Genetic analysis and molecular mapping ofa new fertility restorer gene Rf8 for Triticum timopheevii cytoplasm in wheat(Triticum aestivum L.)using SSR markers.Genetica,141:131-141.
Paterson AH et al,2009.The Sorghum bicolor genome and thediversification of grasses.Nature 457(7229):551-556.doi:10.1038/nature07723.
Rathburn and Hedgcoth,1991.Chimeric open reading frame in the 5'flanking region of coxI mitochondrial DNA from cytoplasmic male-sterilewheat.Plant Mol.Biol.,16:909-912.
Rice P et al,2000.A.EMBOSS:The European molecular biology opensoftware suite.Trends Genet 16,276–277,10.1016/S0168-9525(00)02024-2.
Sakai H,et al,2013.Rice Annotation Project Database(RAP-DB):AnIntegrative and Interactive Database for Rice Genomics.Plant Cell Physiol 54(2):E6-+.doi:10.1093/pcp/pcs183.
Schnable PS,et al,2009.The B73 Maize Genome:Complexity,Diversity,andDynamics.Science 326(5956):1112-1115.doi:10.1126/science.1178534.
Singh SK et al,2010.Perspective of hybrid wheat research:areview.Indian J Agric Sci 80:1013–1027.
Song and Hedgcoth,1994.Influence of nuclear background ontranscription of a chimeric gene orf256 and cox1 in fertile and cytoplasmicmale sterile wheats.Genome,vol.37
Stojalowski S et al,2013.The importance of chromosomes from the sixthhomeologic group in the restoration of male fertility in winter triticalewith Triticum tomopheevii cytoplasm.J.Appl.Genetics,54:179-184.
Verdaguer et al,1996.Isolation and expression in transgenic tobaccoand rice plants,of the cassava vein mosaic virus(CVMV)promoter.PlantMolecular Biology 31:1129–1139.
Wang MH et al,2014.The genome sequence of African rice(Oryzaglaberrima)and evidence for independent domestication.Nat Genet 46(9):982-+.doi:10.1038/ng.3044Wilson JA,Ross WM.1962.Male sterility interaction of theTriticum aestivum nucleus and Triticum timopheevii cytoplasm.WheatInformation Service(Kyoto)14:29–30.
Wilson JA,Ross WM.1962.Male sterility interaction of the Triticumaestivum nucleus and Triticum timopheevii cytoplasm.Wheat Information Service(Kyoto)14,29–30.
Wilson,1984.Hybrid wheat breeding and commercial seeddevelopment.Plant Breeding Rev.,2:303-319.2
Whitford R et al,2013.Hybrid breeding in wheat:technologies toimprove hybrid wheat seed production.Journal of Experimental Botany.doi:10.1093/jxb/ert333.
Zhou et al,2005.SSR marker associated with fertility restorationgenes against Triticum timopheevii cytoplasm in Triticum aestivum.Euphytica,141:33-40.
Figure GDA0002682210720001401
Figure GDA0002682210720001411
Figure GDA0002682210720001421

Claims (26)

1.一种分离的Rf1核酸,其编码提莫菲维小麦CMS细胞质的育性的Rf1蛋白恢复子,其中相应的氨基酸序列与SEQ ID NO:361具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性。
2.权利要求1的分离的核酸,其包含SEQ ID NO:3119。
3.一种转基因小麦植物,其包含权利要求1或2的Rf1核酸,和任选的一种或多种包含Rf3、Rf4和/或Rf7恢复等位基因的核酸作为转基因元件。
4.一种基因工程化小麦植物,其包含权利要求1或2的Rf1核酸,和任选的一种或多种包含Rf3、Rf4和/或Rf7恢复等位基因的核酸作为基因工程化元件。
5.权利要求3或4的小麦植物,其中与不含这种转基因元件或基因工程化元件的亲本植物相比,所述转基因元件或基因工程化元件表达恢复或改进所述植物的雄性育性的多肽。
6.一种提莫菲维小麦CMS细胞质的育性的小麦植物恢复子,其包含权利要求1或2所述的Rf1恢复等位基因,和在恢复基因座内的至少两个选自Rf3、Rf4和Rf7的育性恢复等位基因,其中,
i.Rf3基因座位于距SEQ ID NO:3205的标记cfn1249269或SEQ ID NO:3228的标记BS00090770至多10cM处,
ii.Rf7基因座位于距SEQ ID NO:3231的标记cfn0919993至多10cM处,和
iii.Rf4基因座位于距SEQ ID NO:3233的标记cfn0393953至多10cM处。
7.权利要求3-6任一项所述的小麦植物,其中所述植物包含Rf1、Rf3和Rf7恢复等位基因。
8.权利要求3-7任一项所述的小麦植物,其特征在于,其在Rf3基因座内包括至少一个Rf3恢复等位基因,所述Rf3恢复等位基因位于SNP标记cfn1249269和BS00090770之间的染色体片段内。
9.权利要求8所述的小麦植物,其中Rf3恢复等位基因的相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQID NO:158、SEQ ID NO:676和SEQ ID NO:684。
10.权利要求8或9所述的小麦植物,其中所述Rf3基因座包含SEQ ID NO:1712、SEQ IDNO:3147或SEQ ID NO:2230、SEQ ID NO:3148或SEQ ID NO:2238。
11.权利要求3-10任一项所述的小麦植物,其特征在于,其在Rf7基因座内包括至少一个Rf7恢复等位基因,所述Rf7基因座的特征在于存在一个或多个以下恢复子SNP等位基因:
Figure FDA0002553732470000021
12.权利要求3-11任一项所述的小麦植物,其特征在于其包括至少一个编码提莫菲维小麦CMS细胞质的育性的Rf4蛋白恢复子的Rf4恢复等位基因,其中相应的氨基酸序列与选自下组的氨基酸序列具有至少95%同一性,优选至少96%、97%、98%、99%或100%同一性:SEQ ID NO:477和SEQ ID NOs3135-3138。
13.权利要求3-5和7-12中任一项所述的小麦植物,其在相同基因座包含Rf1、Rf3和Rf7恢复等位基因。
14.一种生产权利要求3和5-13任一项所述的转基因小麦植物的方法,其中所述方法包括以下步骤:用根据权利要求1或2所述的一种或多种编码提莫菲维小麦CMS细胞质的蛋白恢复子的核酸转化亲本小麦植物,选择包含所述一种或多种核酸作为转基因的植物,再生和生长所述小麦转基因植物。
15.一种生产权利要求4-13任一项所述的遗传修饰的小麦植物的方法,其中所述方法包括以下步骤:优选通过基因组编辑对亲本小麦植物进行遗传修饰以在其基因组中获得如权利要求1或2所定义的编码提莫菲维小麦CMS细胞质的蛋白恢复子的一个或多个核苷酸序列,选择包含所述一个或多个核苷酸序列作为基因工程化元件的植物,再生和生长所述基因工程化小麦植物。
16.一种生产权利要求6所述的小麦植物的方法,所述方法包括以下步骤:
a.提供第一小麦植物,所述第一小麦植物包含一个或两个选自Rf1、Rf3和Rf7恢复等位基因的恢复等位基因,
b.使所述第一小麦植物与第二小麦植物杂交,所述第二小麦植物包含一个或两个选自Rf1、Rf3和Rf7恢复等位基因的恢复等位基因,其中Rf1、Rf3和Rf7恢复等位基因在所述第一植物和所述第二植物提供的一组恢复等位基因中出现至少一次,
c.收集F1杂交种种子,
d.从F1植物获得纯合植物,
e.任选检测所述杂交种种子中和/或每一代中Rf1、Rf3和Rf7恢复等位基因的存在。
17.权利要求14、15或16所述的方法,其中所获得的小麦植物的育性得分高于亲本小麦植物的育性得分。
18.一种生产转基因或基因工程化小麦植物的方法,其中改变所述植物的育性水平,包括敲低Rf1恢复等位基因表达的步骤,其中所述Rf1恢复等位基因包含权利要求1或2所述的核酸。
19.一种通过基因组编辑改变小麦植物的育性水平的方法,包括提供能够调节Rf1恢复等位基因表达的基因组编辑工具,其中Rf1恢复等位基因包含如权利要求1或2所定义的核苷酸序列。
20.一种生产小麦杂交种植物的方法,包括以下步骤:
a.将包含提莫菲维小麦细胞质的不育雌性与权利要求3-13任一项所述的可育雄性小麦植物杂交;
b.收集杂交种种子;
c.任选检测所述杂交种种子的杂交种性水平。
21.权利要求20所述的方法,进一步包括以下步骤:检测所述杂交种种子中提莫菲维小麦细胞质和/或至少三个选自Rf1、Rf3、Rf4和Rf7的Rf基因座的存在。
22.通过权利要求20或21所述的方法获得的小麦杂交种植物。
23.一种鉴定根据权利要求3-13任一项所述的小麦植物的方法,其中所述小麦植物通过检测至少一个恢复等位基因Rf1和任选的一个或多个选自Rf3、Rf4和Rf7的其他恢复等位基因的存在来鉴定。
24.用于特异性检测小麦植物中的恢复等位基因Rf1和任选的一个或多个Rf3、Rf4和Rf7恢复等位基因的核酸探针或引物。
25.一种重组核酸,其包含与调控元件可操作地连接的权利要求1或2所述的编码提莫菲维小麦CMS细胞质的蛋白恢复子的核酸。
26.用于转化小麦植物的载体,其包含权利要求25所述的重组核酸。
CN201880083682.3A 2017-10-31 2018-10-31 包含雄性育性恢复等位基因的小麦 Pending CN111868075A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
EP17306501.2 2017-10-31
EP17306500 2017-10-31
EP17306500.4 2017-10-31
EP17306501 2017-10-31
EP18305027 2018-01-12
EP18305027.7 2018-01-12
EP18306114 2018-08-14
EP18306114.2 2018-08-14
PCT/EP2018/079816 WO2019086510A1 (en) 2017-10-31 2018-10-31 Wheat comprising male fertility restorer alleles

Publications (1)

Publication Number Publication Date
CN111868075A true CN111868075A (zh) 2020-10-30

Family

ID=64049265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880083682.3A Pending CN111868075A (zh) 2017-10-31 2018-10-31 包含雄性育性恢复等位基因的小麦

Country Status (8)

Country Link
US (1) US20200347104A1 (zh)
EP (1) EP3704140A1 (zh)
CN (1) CN111868075A (zh)
AR (1) AR114025A1 (zh)
AU (1) AU2018357926B2 (zh)
BR (1) BR112020011273A2 (zh)
CA (1) CA3080454A1 (zh)
WO (1) WO2019086510A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112166192A (zh) * 2018-05-25 2021-01-01 巴斯夫欧洲公司 包含小麦g型胞质雄性不育恢复基因的植物及其用途

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12018271B2 (en) 2016-03-16 2024-06-25 Basf Se Plants comprising wheat g-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof
CA3017997A1 (en) 2016-03-16 2017-09-21 Antje ROHDE Plants comprising wheat g-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof
US12016281B2 (en) 2016-03-16 2024-06-25 Basf Se Plants comprising wheat G-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof
US20210214746A1 (en) * 2018-05-25 2021-07-15 Basf Se Plants comprising wheat g-type cytoplasmic male sterility restorer genes and uses thereof
WO2019224359A1 (en) * 2018-05-25 2019-11-28 Basf Se Plants comprising wheat g-type cytoplasmic male sterility restorer genes and uses thereof
WO2019234231A1 (en) * 2018-06-08 2019-12-12 Basf Se Plants comprising wheat g-type cytoplasmic male sterility restorer genes and uses thereof
US20220098612A1 (en) 2019-02-06 2022-03-31 Vilmorin & Cie New gene responsible for cytoplasmic male sterility
EP3718397A1 (en) * 2019-04-03 2020-10-07 German Seed Alliance GmbH Wheat cytoplasmic male sterility restorer genes, molecular markers and uses thereof
CN112779266A (zh) 2019-11-06 2021-05-11 青岛清原化合物有限公司 在生物体内创制新基因的方法及应用
EP4288551A1 (en) 2021-02-02 2023-12-13 Limagrain Europe Linkage of a distal promoter to a gene of interest by gene editing to modify gene expression
EP4094572A1 (en) 2021-05-28 2022-11-30 Limagrain Europe Wheat comprising male fertility restorer alleles
WO2023067020A1 (en) 2021-10-19 2023-04-27 Limagrain Europe Targeted gene integration in plants
WO2023118541A1 (en) 2021-12-22 2023-06-29 Basf Se Regulatory nucleic acid molecules for modifying gene expression in cereal plants

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030237112A1 (en) * 2001-07-12 2003-12-25 Brown Gregory G. Nuclear fertility restorer genes and methods of use in plants
CN103249845A (zh) * 2010-10-06 2013-08-14 陶氏益农公司 玉米细胞质雄性不育(cms)c型恢复系rf4基因、分子标志物及其用途
CN106062192A (zh) * 2013-12-31 2016-10-26 美国陶氏益农公司 玉米细胞质雄性不育(cms)s型恢复基因rf3
WO2017158128A1 (en) * 2016-03-16 2017-09-21 Bayer Cropscience Nv Plants comprising wheat g-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof
WO2017158126A1 (en) * 2016-03-16 2017-09-21 Bayer Cropscience Nv Plants comprising wheat g-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69334225D1 (de) 1992-07-07 2008-07-31 Japan Tobacco Inc Verfahren zur transformation einer monokotyledon pflanze
ES2252008T3 (es) 1999-04-19 2006-05-16 Biogemma Metodo para la transformacion de plantas.
FR2798139B1 (fr) 1999-09-03 2004-04-16 Meristem Therapeutics Vecteurs synthetiques propres, plasmides, plantes et parties de plantes transgeniques les contenant, et leurs methodes d'obtention
AU2010327998B2 (en) 2009-12-10 2015-11-12 Iowa State University Research Foundation, Inc. TAL effector-mediated DNA modification
JP2015523860A (ja) 2012-05-30 2015-08-20 ベイラー カレッジ オブ メディスンBaylor College Of Medicine DNAの修復、変更および置き換えのための道具としてのスーパーコイルMiniVector
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
EP2918164A1 (en) 2014-03-10 2015-09-16 Limagrain Europe Hybrid Cereal Seed Production
BR112019000881A2 (pt) 2016-07-18 2019-04-30 Basf Se molécula de ácido nucleico, ácido nucleico, polipeptídeo, gene quimérico, célula de planta de cereais ou planta de cereal ou semente da mesma, métodos para produzir uma célula de planta de cereais ou planta ou semente da mesma, uma planta de cereais e semente híbrida, para converter uma planta de cereal não restauradora em uma planta restauradora e para identificar e/ou selecionar uma planta de cereal, e, usos do ácido nucleico e de uma planta

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030237112A1 (en) * 2001-07-12 2003-12-25 Brown Gregory G. Nuclear fertility restorer genes and methods of use in plants
CN103249845A (zh) * 2010-10-06 2013-08-14 陶氏益农公司 玉米细胞质雄性不育(cms)c型恢复系rf4基因、分子标志物及其用途
CN106062192A (zh) * 2013-12-31 2016-10-26 美国陶氏益农公司 玉米细胞质雄性不育(cms)s型恢复基因rf3
WO2017158128A1 (en) * 2016-03-16 2017-09-21 Bayer Cropscience Nv Plants comprising wheat g-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof
WO2017158126A1 (en) * 2016-03-16 2017-09-21 Bayer Cropscience Nv Plants comprising wheat g-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SOTA FUJII,ET AL.: "Selection patterns on restorer-like genes reveal a conflict between nuclear and mitochondrial genomes throughout angiosperm evolution", 《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112166192A (zh) * 2018-05-25 2021-01-01 巴斯夫欧洲公司 包含小麦g型胞质雄性不育恢复基因的植物及其用途

Also Published As

Publication number Publication date
AU2018357926A1 (en) 2020-05-14
AU2018357926B2 (en) 2023-04-06
AR114025A1 (es) 2020-07-15
CA3080454A1 (en) 2019-05-09
WO2019086510A1 (en) 2019-05-09
BR112020011273A2 (pt) 2020-11-17
US20200347104A1 (en) 2020-11-05
EP3704140A1 (en) 2020-09-09

Similar Documents

Publication Publication Date Title
AU2018357926B2 (en) Wheat comprising male fertility restorer alleles
US11371104B2 (en) Gene controlling shell phenotype in palm
US20210269822A1 (en) Plants comprising wheat g-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof
US20220186238A1 (en) Diplospory gene
US20190185879A1 (en) Plants comprising wheat g-type cytoplasmic male sterility restorer genes, molecular markers and uses thereof
EP3718397A1 (en) Wheat cytoplasmic male sterility restorer genes, molecular markers and uses thereof
US20220106607A1 (en) Gene for parthenogenesis
AU2020396217A1 (en) CCA gene for virus resistance
US20190200554A1 (en) Compositions and Methods for Plant Haploid Induction
EP3920687A1 (en) New gene responsible for cytoplasmic male sterility
CN114449889A (zh) 赋予对锈病病害的抗性的组合物和方法
US20220275383A1 (en) Sterile genes and related constructs and applications thereof
CN113544277A (zh) 用于驱动t1事件多样性的组合物和方法
EP4346385A1 (en) Wheat comprising male fertility restorer alleles
WO2022038536A1 (en) Methods of increasing outcrossing rates in gramineae

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination