CN117441015A - 用于修饰植物中细胞***素氧化酶水平的方法和组合物 - Google Patents

用于修饰植物中细胞***素氧化酶水平的方法和组合物 Download PDF

Info

Publication number
CN117441015A
CN117441015A CN202280027661.6A CN202280027661A CN117441015A CN 117441015 A CN117441015 A CN 117441015A CN 202280027661 A CN202280027661 A CN 202280027661A CN 117441015 A CN117441015 A CN 117441015A
Authority
CN
China
Prior art keywords
gene
ckx
plant
endogenous
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280027661.6A
Other languages
English (en)
Inventor
L·G·马修
S·戴
H·拉吕
B·朱利叶斯
B·D·布鲁沃-托兰德
T·L·斯勒文斯基
H·金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pairing Plant Service Co ltd
Monsanto Technology LLC
Original Assignee
Pairing Plant Service Co ltd
Monsanto Technology LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pairing Plant Service Co ltd, Monsanto Technology LLC filed Critical Pairing Plant Service Co ltd
Publication of CN117441015A publication Critical patent/CN117441015A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/54Leguminosae or Fabaceae, e.g. soybean, alfalfa or peanut
    • A01H6/542Glycine max [soybean]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本发明涉及用于通过修饰植物中的细胞***素氧化酶(CKX)水平来改善/提高产量性状的组合物和方法。本发明进一步涉及使用本发明的方法和组合物生产的植物。

Description

用于修饰植物中细胞***素氧化酶水平的方法和组合物
关于序列表电子提交的声明
根据37C.F.R.§1.821,经由EFS-Web提交了文件名为1499.48.WO_ST25.txt的ASCII文本格式的序列表,以代替其纸质副本。序列表大小为1,990,040字节,于2022年1月14日生成。该序列表在此通过引用将其公开内容并入说明书中。
优先权声明
本申请根据35U.S.C.§119(e)要求2021年2月11日提交的美国临时申请No.63/148,439的权益,其全部内容通过引用并入本文。
技术领域
本发明涉及通修饰植物中细胞***素氧化酶(CKX)水平来改善或提高产量性状的组合物和方法。本发明进一步涉及使用本发明的方法和组合物生产的植物。
背景技术
大豆是全球食品安全的关键组成部分,能够提供高蛋白动物饲料以及世界油籽产量的一半以上。随着需要养活的人口增加,不断需要提高作物产量。目前,包括大豆在内的主要主粮作物每年仅增产0.9-1.6%,这种增产幅度不足以满足未来食品生产的需求。本发明通过提供用于改善/提高包括大豆在内的植物的产量性状的新组合物和方法来解决本领域中的这些缺点。
发明概述
本发明的一个方面提供了一种植物或其植物部分,其在编码CKX蛋白的至少一个内源性细胞***素氧化酶/脱氢酶(Cytokinin Oxidase/Dehydrogenase,CKX)基因中包含至少一个非天然突变。
本发明的另一个方面提供了一种包含编辑***的植物细胞,该编辑***包含(a)CRISPR相关的效应子蛋白;和(b)引导核酸(gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其包含与所述植物细胞中编码CKX蛋白的内源性靶基因具有互补性的间隔区序列。
本发明的另一个方面提供了一种植物细胞,所述植物细胞在内源性细胞***素氧化酶/脱氢酶(CKX)基因内包含至少一个非天然突变,所述非天然突变导致表达水平改变的新等位基因或无效等位基因或者CKX基因的敲除,其中所述至少一个非天然突变是碱基取代、碱基***或碱基缺失,这是通过使用包含与CKX基因中的靶位点结合的核酸结合结构域的编辑***引入的。
还提供了一种提供具有改进的产量性状的多个植物的方法,该方法包括在生长区域中种植两个或多个本发明的植物,从而提供与不包含所述至少一个非天然突变的多个对照植物相比具有至少一种改进的产量性状的多个植物。
本发明进一步提供了一种生产/培育无转基因的基因组被编辑的植物的方法,包括:(a)使本发明的植物与无转基因的植物杂交,从而将所述突变引入无转基因的植物中;和(b)选择包含所述突变但不含转基因的后代植物,从而产生不含转基因的基因组被编辑的植物。
本发明的另一个方面提供了一种编辑植物细胞的基因组中的特定位点的方法,该方法包括:以位点特异性方式切割所述植物细胞中内源性细胞***素氧化酶/脱氢酶(CKX)基因内的靶位点,其中所述内源性CKX基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽,从而在所述植物细胞的内源性CKX基因中产生编辑并产生在所述内源性CKX基因中包含编辑的植物细胞。
本发明的另一个方面提供了一种制造植物的方法,包括:(a)使包含至少一种内源性细胞***素氧化酶/脱氢酶(CKX)基因的植物细胞的群体与靶向所述内源性CKX基因的核酸酶接触,其中所述核酸酶与结合所述至少一种内源性CKX基因中的靶位点的核酸结合结构域(例如DNA结合结构域)(例如编辑***)连接,其中所述至少一种内源性CKX基因(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(iii)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽;(b)从所述群体中选择在所述至少一种内源性CKX基因中包含突变的植物细胞,其中所述突变是取代和/或缺失;和(c)将所选择的植物细胞生长成在所述至少一种内源性CKX基因中包含所述突变的植物。
在另一个方面,提供了一种改善植物或其部分的产量性状的方法,包括(a)使包含内源性细胞***素氧化酶/脱氢酶(CKX)基因的植物细胞与靶向所述内源性CKX基因的核酸酶接触,其中所述核酸酶与结合所述内源性CKX基因中的靶位点的核酸结合结构域(例如DNA结合结构域)连接,其中所述内源性CKX基因:(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(iii)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽;和(b)将所述植物细胞生长成包含所述内源性CKX基因中的所述突变的植物,从而改善植物或其部分的产量性状(例如增加的种子数量、增加的种子大小、增加的荚数、增加的产量或在增加的种植密度下改善的产量性状)。
在另一个方面,提供了一种生产植物或其部分的方法,所述植物或其部分包括至少一个在内源性细胞***素氧化酶/脱氢酶(CKX)基因中具有突变的细胞,所述方法包括使所述植物或植物部分中的内源性CKX基因中的靶位点与包含切割结构域和核酸结合结构域(例如DNA结合结构域)的核酸酶接触,其中所述核酸酶的核酸结合结构域结合所述内源性CKX基因中的靶位点,所述内源性CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽,从而产生包含在所述内源性CKX基因中具有突变的至少一个细胞的植物或其部分。
在另一个方面,提供了一种生产植物或其部分的方法,所述植物或其部分包括内源性细胞***素氧化酶/脱氢酶(CKX)基因中的突变和改进的产量性状,该方法包括使所述植物或植物部分中的内源性CKX基因中的靶位点与包含切割结构域和核酸结合结构域(例如DNA结合结构域)的核酸酶接触,其中所述核酸结合结构域结合所述内源性CKX基因中的靶位点,所述内源性CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽,从而产生在所述内源性CKX基因中包含突变、并表现出改进的产量性状的植物或其部分。
本发明的另一个方面提供了一种与细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点结合的引导核酸,所述CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ IDNO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽。
本发明的另一个方面提供了一种包含本发明的引导核酸和与该引导核酸缔合的CRISPR-Cas效应子蛋白的***。
本发明的另一个方面提供了包含与引导核酸缔合的CRISPR-Cas效应子蛋白的基因编辑***,其中所述引导核酸包含与细胞***素氧化酶/脱氢酶(CKX)基因互补并与之结合的间隔区序列。
本发明的另一方面提供了包含CRISPR-Cas效应子蛋白和引导核酸的复合物,其中所述CRISPR-Cas效应子蛋白包含切割结构域,所述引导核酸结合内源性细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点,其中所述CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽,其中所述切割结构域切割CKX基因中的靶链。
另一方面提供了一种表达盒,其包含(a)编码包含切割结构域的CRISPR-Cas效应子蛋白的多核苷酸,和(b)结合内源性细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点的引导核酸,其中所述引导核酸包含与所述内源性CKX基因的一部分互补并与之结合的间隔区序列,所述内源性CKX基因与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性,或编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的序列,任选地,其中所述间隔区序列与和SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的内源性CKX基因的部分互补并与之结合。
本发明的另一个方面提供了一种核酸,其包含突变的细胞***素氧化酶/脱氢酶(CKX)基因,其中所述突变的CKX基因产生截短的CKX蛋白或不产生蛋白。
进一步提供了在其基因组中包含通过本发明的方法产生的具有非天然突变的一个或多个细胞***素氧化酶/脱氢酶(CKX)基因的植物以及用于制造本发明的植物的多肽、多核苷酸、核酸构建体、表达盒和载体。
在下面的本发明描述中更详细地阐述了本发明的这些和其他方面。
序列的简要描述
SEQ ID NO:1-17是可用于本发明的示例性Cas12a氨基酸序列。
SEQ ID NO:18-20是可用于本发明的示例性Cas12a核苷酸序列。
SEQ ID NO:21-22是编码启动子和内含子的示例性调节序列。
SEQ ID NO:23-29是可用于本发明的示例性胞嘧啶脱氨酶序列。
SEQ ID NO:30-40是可用于本发明的示例性腺嘌呤脱氨酶氨基酸序列。
SEQ ID NO:41是可用于本发明的示例性尿嘧啶-DNA糖基化酶抑制剂(UGI)序列。
SEQ ID NO:42-44提供V型CRISPR-Cas12a核酸酶的原间隔区邻近基序位置的实例。
SEQ ID NO:45-47提供可用于本发明的示例性肽标签和亲和多肽。
SEQ ID NO:48-58提供可用于本发明的示例性RNA募集基序和相应的亲和多肽。
SEQ ID NO:59-60是可用于本发明的示例性Cas9多肽序列。
SEQ ID NO:61-71是可用于本发明的示例性Cas9多核苷酸序列。
SEQ ID NO:72、75、78、81、84、87或90是示例性CKX基因组序列(分别为CKX1、CKX2、CKX3、CKX4、CKX5、CKX6和CKX5)。
SEQ ID NO:73、76、79、82、85、88或91是示例性CKX编码(cds)序列(分别为CKX1、CKX2、CKX3、CKX4、CKX5、CKX6和CKX5)。
SEQ ID NO:74、77、80、83、86、89或92是示例性CKX多肽序列(分别为CKX1、CKX2、CKX3、CKX4、CKX5、CKX6和CKX5)。
SEQ ID NO:92-98是来自CKX多核苷酸的示例性核酸序列(区域)(分别来自CKX1、CKX2、CKX3、CKX4、CKX5、CKX6和CKX5的示例性区域(例如示例性靶位点))。
SEQ ID NO:99-101是CKX1基因的示例性间隔区序列。
SEQ ID NO:102-104是CKX2基因的示例性间隔区序列。
SEQ ID NO:105-107是CKX3基因的示例性间隔区序列。
SEQ ID NO:108和SEQ ID NO:109是CKX4基因的示例性间隔区序列。
SEQ ID NO:110和SEQ ID NO:111是CKX5基因的示例性间隔区序列。
SEQ ID NO:112和SEQ ID NO:123是CKX6基因的示例性间隔区序列。
SEQ ID NO:114-284是示例性的经编辑的序列。
具体实施方式
现在将在下文中参考实施例描述本发明,其中示出了本发明的一些实施方式。该描述并非意在详细列出可以执行本发明的所有不同方式或者可以添加到本发明中的所有特征。例如,关于一个实施方式示出的特征可以并入其他实施方式中,并且关于一个特定实施方式示出的特征可以从该实施方式中缺失。因此,本发明中包括,在本发明的一些实施方式中,可以排除或省略本文示出的任何特征或特征组合。另外,基于本公开,对本文提出的各种实施方式的许多变化和添加对于本领域技术人员将是显而易见的,它们并不背离本发明。因此,以下描述旨在说明本发明的一些具体实施方式,而不是详尽地指明其所有排列、组合和变化。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。本文在对本发明的描述中所使用的术语仅出于描述具体实施方式的目的,并不意图限制本发明。
本文引用的所有出版物、专利申请、专利和其他参考文献通过引用整体并入本文,以获得与呈现参考文献的句子和/或段落相关的教导。
除非上下文另有说明,否则本文描述的本发明的各种特征可以任何组合使用。此外,本发明还预期在本发明的一些实施方式中,可以排除或省略本文阐述的任何特征或特征组合。举例来说,如果说明书中陈述组合物包含组分A、B和C,则其具体地表明可以单独地或以任何组合省略和具体放弃A、B或C中的任何一个或其组合。
如在本发明的说明书和所附权利要求书中所使用的,单数形式“一种”、“一个”和“该”/“所述”旨在也包括其复数形式,除非上下文另有明确说明。
同样如本文所使用的,“和/或”是指示并且涵盖相关联的所列项目中的一个或多个的任何和所有可能组合,以及当以备选方式(“或”)理解时指没有组合。
当提及诸如量或浓度等的可测量值时,如本文所用的术语“约”意在涵盖指定值以及指定值的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。例如,“约X”(其中X是可测量值)是指包括X以及X的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。本文中针对可测量值提供的范围可包含其中的任何其它范围及/或具体值。
如本文所用,诸如“在X和Y之间”/“X-Y”和“在约X和Y之间”/“约X-Y”的短语应被解释为包括X和Y。如本文所用,短语诸如“在约X与Y之间”/“约X-Y”意指“在约X与约Y之间”,短语诸如“从约X至Y”意指“从约X至约Y”。
除非本文另有说明,否则本文中对数值范围的叙述仅旨在用作单独提及落入该范围内的每个单独值的简写方法,并且每个单独的值并入本说明书中,如同其在本文中被单独记载一样。例如,如果公开了范围10到15,则还公开了11、12、13和14。
如本文中所使用的术语“包括”、“具有”和“包含”等是指存在所陈述的特征、整数、步骤、操作、要素和/或组分,但不排除一个或多个其它特征、整数、步骤、操作、要素、组分和/或其群组的存在或添加。
如本文所用,连接短语“基本上由……组成”是指权利要求的范围应被解释为涵盖权利要求中所述的指定材料或步骤以及不实质上影响所要求保护的本发明的基本和新颖特征的那些材料或步骤。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”不旨在被解释为等同于“包括”。
如本文所用,术语“增加”、“增加的”、“增强”、“增强的”(及其语法变型)描述了与对照相比至少约15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%或更多的升高。
如本文所用,术语“减少”、“减少的”、“降低”、“降低的”(及其语法变体)描述了例如与对照相比至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的减少。在一些实施方式中,该减少可以导致没有或基本上没有(即,不显著的量,例如小于约10%或甚至5%)可检测的活性或量。
如本文所用,关于核酸分子和/或核苷酸序列(例如RNA或DNA)使用的术语“表达”、“表达的”等表示核酸分子和/或核苷酸序列被转录并任选地被翻译。因此,核酸分子和/或核苷酸序列可以表达感兴趣的多肽或例如功能性的非翻译RNA。
“异源”或“重组”核苷酸序列是不与其被引入的宿主细胞天然关联的核苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。
“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源的核酸、核苷酸序列、多肽或氨基酸序列。因此,例如,“野生型mRNA”是指在参考生物体中天然存在的或内源性的mRNA。
如本文所用,术语“杂合”是指其中不同等位基因存在于同源染色体上的相应基因座处的遗传状态。
如本文所用,术语“纯合”是指其中相同等位基因存在于同源染色体上的相应基因座处的遗传状态。
如本文所用,术语“等位基因”是指在特定基因座处出现的两个或更多个不同核苷酸或核苷酸序列中的一个。
“无效等位基因”是由基因突变引起的非功能性等位基因,其导致完全缺乏相应蛋白质的产生或产生非功能性的蛋白质。
“隐性突变”是基因中当纯合时产生表型、但当基因座为杂合时表型不可观察的突变。
“显性负突变”(dominant negative mutation)是产生改变的基因产物(例如相对于野生型而言具有异常功能)的突变,该基因产物不利地影响野生型等位基因或基因产物的功能。例如,“显性负突变”可以阻断野生型基因产物的功能。显性负突变也可以被称为“反效等位基因突变”(anti-morphic mutation)。
“半显性突变”是指杂合生物体中表型的渐渗小于对纯合生物体观察到的渐渗的突变。
“弱的功能丧失突变”(weak loss-of-function mutation)是导致与野生型基因产物相比具有部分功能或功能降低(部分失活)的基因产物的突变。
“亚效突变”(hypomorphic mutation)是导致基因功能的部分损失的突变,其可以通过降低的表达(例如降低的蛋白质和/或降低的RNA)或降低的功能性能(例如降低的活性)而不是功能/活性的完全丧失而发生。“亚效”等位基因是由遗传突变引起的半功能性等位基因,所述遗传突变导致产生以正常效率的1%与99%之间的任何水平发挥功能的对应蛋白质。
“超形态突变”(hypermorphic mutation)是导致基因产物表达增加和/或基因产物活性增加的突变。
“基因座”是染色体上基因或标记或等位基因所在的位置。在一些实施方式中,基因座可以涵盖一或多个核苷酸。
如本文所用,术语“所需等位基因”、“靶等位基因”和/或“感兴趣的等位基因”可互换使用,以指代与所需性状相关的等位基因。在一些实施方案中,取决于所需表型的性质,所需等位基因可以与给定性状的增加或减少(相对于对照)相关联。在本发明的一些实施方案中,短语“期望的等位基因”、“靶等位基因”或“感兴趣的等位基因”是指在非水分胁迫条件下,相对于不具有所述一个或多个所述靶等位基因的对照植物,在植物中与产量增加相关的一个或多个等位基因。
当性状与标记连锁时以及当标记的存在是所需性状或性状形式是否存在于和/或在何种程度上将存在于包含所述标记的植物/种质中的指标时,则所述标记与所述性状“相关联”。类似地,当标记与等位基因或染色体间隔连锁时以及当标记的存在是所述等位基因或染色体间隔是否存在于包含该标记的植物/种质中的指标时,则所述标记与所述等位基因或所述染色体间隔“相关联”。
如本文所用,术语“回交”和“进行回交”是指后代植物与其亲本之一进行一次或多次(例如1、2、3、4、5、6、7、8次等)回交的过程。在回交方案中,“供体”亲本是指具有待渐渗的所需基因或基因座的亲本植物。“接受者”亲本(使用一次或多次)或“回交”亲本(使用两次或更多次)是指基因或基因座被渐渗其中的亲本植物。例如参见Ragot,M.等人,Marker-assisted Backcrossing:A Practical Example,in Techniques et Utilisations desMarqueurs Moleculaires Les Colloques,Vol.72,pp.45-56(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding,in Proceedings of theSymposium"Analysis of Molecular Marker Data,"pp.41-43(1994)。初始杂交产生F1代。术语“BC1”是指回交亲本的第二次使用,“BC2”是指回交亲本的第三次使用,等等。
如本文所用,术语“杂交”或“杂交的”是指通过授粉而配子融合以产生后代(例如细胞、种子或植物)。该术语包括有性杂交(一株植物被另一株植物授粉)和自交(自花授粉,例如当花粉和胚珠来自同一植物时)。术语“杂交”是指通过授粉融合配子以产生后代的动作。
如本文中所用,术语“渐渗(introgression)”、“进行渐渗(introgressing)”和“渐渗的(introgressed)”是指一个或多个基因座的所需等位基因或所需等位基因的组合从一个遗传背景到另一个遗传背景的自然和人工传递。例如,指定基因座处的所需等位基因可以通过同一物种的两个亲本间的有性杂交而传递给至少一个后代,其中至少一个亲本在其基因组中具有所需等位基因。或者,例如,等位基因的传递可以例如在融合的原生质体中通过两个供体基因组之间的重组发生,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需等位基因可以是标记、QTL、转基因等的选定等位基因。包含所需等位基因的后代可以与具有所需遗传背景的品系回交一次或多次(例如1次、2次、3次、4次或更多次),选择所需等位基因,结果是所需等位基因变成固定在所需遗传背景中。例如,与非水分胁迫条件下产量增加相关联的标记可从供体渐渗到不包含该标记且在非水分胁迫条件下不显示产量增加的回交亲本中。然后可以将得到的后代回交一次或多次,并进行选择,直至后代具有与在回交亲本背景下非水分胁迫条件下产量增加相关联的遗传标记。
“遗传图谱”是对给定物种中一条或多条染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格的形式描述。对于每个遗传图谱,基因座之间的距离通过它们之间的重组频率来测量。可以使用多种标记来检测基因座之间的重组。遗传图谱是作图群体、所用标记类型和不同群体间每个标记的多态性潜力的产物。基因座之间的顺序和遗传距离在不同遗传图谱之间可能是不同的。
如本文中所用,术语“基因型”是指个体(或个体组)在一个或多个基因座处的遗传组成,与可观察和/或可检测和/或表现的性状(表型)形成对比。基因型由个体从其亲本遗传的一个或多个已知基因座的等位基因定义。术语基因型可用于指个体在单个基因座、多个基因座的遗传组成,或者更一般地,术语基因型可用于指个体基因组中所有基因的个体遗传组成。基因型可以例如使用标记间接表征和/或通过核酸测序直接表征。
如本文中所用,术语“种质”指个体(例如植物)、个体群(例如植物品系、品种或家族)或源自品系、品种、物种或培养物的克隆的遗传物质,或来自其的遗传物质。种质可以是生物体或细胞的一部分,或者可以与生物体或细胞分开。一般来说,种质提供了具有特定遗传组成的遗传物质,所述遗传物质为生物体或细胞培养物的一些或全部遗传性质提供了基础。如本文中所用,种质包括可从其生长出新植物的细胞、种子或组织,以及可培养成完整植物的植物部分(例如叶、茎、芽、根、花粉、细胞等)。
如本文中所用,术语“栽培品种”和“品种”是指一组相似的植物,它们通过结构或遗传特征和/或性能可以与同一物种内的其它品种相区别。
如本文中所用,术语“外来的”、“外来品系”和“外来种质”是指任何非优良的植物、品系或种质。一般来说,外来植物/种质不源自任何已知的优良植物或种质,而是被选择来将一种或多种所需遗传元件引入育种程序(例如以将新等位基因引入育种程序)。
如本文中所用,植物育种上下文中的术语“杂种”是指通过不同品系或品种或物种的植物杂交(包括但不限于两个近交系之间的杂交)产生的遗传上相异的亲本的后代。
如本文中所用,术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上纯合的植物或植物品种,或者就特别感兴趣的基因组部分而言基本上纯合的植物或植物品种。
“单倍型”是个体在多个基因座的基因型,即等位基因的组合。通常,确定单倍型的遗传基因座是物理和遗传连锁的,即在同一染色体区段上。术语“单倍型”可以指特定基因座处的多态性,诸如单个标记基因座,或沿染色体区段的多个基因座处的多态性。
如本文中所用,术语“异源的”是指这样的核苷酸/多肽,其源自外来物种,或者,如果源自同一物种,则是通过有意的人为干预而在组成和/或基因组基因座上由其天然形式进行了实质性的修饰。
与不包含CKX活性的修饰(例如增加或降低)的植物相比,其中至少一种CKX多肽的活性如本文所述被修饰的植物可具有改善的产量性状。如本文所用,“改善的产量性状”是指与生长相关联的任何植物性状,例如生物量、产量、氮利用效率(NUE)、花序尺寸/重量、果实产量、果实质量、果实尺寸、种子尺寸、种子数量、叶组织重量、结瘤数、结瘤质量、结瘤活性、种子头数、分蘖数、分枝数、花数、块茎数、块茎质量、球茎质量、种子数、总种子质量、出叶率、分蘖/分枝出现率(rate of tiller/branch emergence)、出苗率、根的长度、根的数量、根团的尺寸和/或重量,或其任意组合。因此,在一些方面,“改善的产量性状”可包括但不限于与对照植物或其部分(例如不包含突变的内源CKX核酸(例如突变的CKX1基因、突变的CKX2基因、突变的CKX3基因、突变的CKX4基因、突变的CKX5基因和/或突变的CKX6基因)的植物)相比,具有增加的花序产生,增加的果实产生(例如增加的果实的数量、重量和/或尺寸;例如增加的穗的数量、重量和/或尺寸,例如对于玉米)、增加的果实品质、增加的根的数量、尺寸和/或重量、增加的分生组织尺寸、增加的种子尺寸、增加的生物量、增加的叶尺寸、增加的氮利用效率、增加的高度、增加的节间数和/或增加的节间长度。改善的产量性状也可以由本发明的植物的增加的种植密度产生。因此,在一些方面,本发明的植物能够以增加的密度种植(由于由所述内源性突变引起的植物结构改变所致),与以相同密度种植的对照植物相比,这导致改善的产量性状。在一些方面,改善的产量性状可以表示为每土地面积生产的谷粒量(例如每英亩土地的蒲式耳)。
如本文所用,“对照植物”意指不含有如本文所述的一个或多个经编辑的CKX基因的植物,其赋予增强/改善的性状(例如产量性状)或改变的表型。对照植物用于鉴定和选择如本文所述进行编辑、并且具有增强的性状或改变的表型的植物。合适的对照植物可以是用于产生包含突变的CKX基因的植物的亲本系的植物,例如,没有如本文所述在内源CKX基因中的编辑的野生型植物。合适的对照植物也可以是含有赋予其它性状的重组核酸的植物,例如具有增强的除草剂耐受性的转基因植物。在一些情况下,合适的对照植物可以是不含本文所述的突变CKX基因的杂合或半合转基因植物系的后代,称为阴性分离株(negativesegregant)或阴性等基因系(negative isogenic line)。
增强的性状可以是例如与对照植物相比,从种植到成熟的天数减少、茎秆尺寸增加、叶子数量增加、营养阶段的植物高度生长速率增加、穗尺寸增加、每个植物的穗干重增加、每个穗的谷粒数量增加、每个谷粒的重量增加、每个植物的谷粒数量增加、穗空隙减少、谷粒填充期延长、植物高度降低、根分枝数量增加、总根长增加、产量增加、氮使用效率增加和水使用效率增加。改变的表型可以是例如植物高度、生物质、冠层面积、花色素苷含量、叶绿素含量、施用的水、水含量和水使用效率。
如本文所用,“性状”是植物或特定植物材料或细胞的生理、形态、生物化学或物理特征。在一些情况下,该特征对于人眼是可见的,并且可以机械地测量,例如种子或植物尺寸、重量、形状、形式、长度、高度、生长速率和发育阶段,或者可以通过生物化学技术测量,例如检测种子或叶子的蛋白质、淀粉、某些代谢物或者油含量,或者通过观察代谢或生理过程,例如通过测量对缺水或者特定盐或糖浓度的耐受性,或者通过测量一个或多个基因的表达水平,例如通过采用Northern分析、RT-PCR、微阵列基因表达测定或报道基因表达***,或者通过农业观察,例如高渗胁迫耐受性或产量。然而,可以使用任何技术来测量转基因植物中任何选择的化合物或大分子的量、比较水平或差异。
如本文所用,“增强的性状”意指由如本文所述的CKX基因中的突变产生的植物的特征。这样的性状包括但不限于以增强的植物形态、生理学、生长和发育、产量、营养增强、疾病或害虫抗性或者环境或化学耐受性为特征的增强的农学性状。在一些实施方案中,增强的性状/改变的表型可以是例如从种植到成熟的天数减少、茎秆大小增加、叶的数量增加、生长阶段的植物高度生长速率增加、穗大小增加、每个植物的穗干重增加、每个穗的谷粒数量增加、每个谷粒的重量增加、每个植物的谷粒数量增加、穗空隙减少、谷粒填充期延长、植物高度减少、根分枝数量增加、总根长增加、干旱耐受性、水使用效率增加、寒冷耐受性、氮使用效率增加和产量增加。在一些实施方案中,性状是在非胁迫条件下的产量增加或在环境胁迫条件(environmental stress conditions)下的产量增加。胁迫条件可包括生物胁迫和非生物胁迫,例如干旱、阴影、真菌疾病、病毒疾病、细菌疾病、昆虫侵袭、线虫侵袭、寒冷温度暴露、热暴露、渗透胁迫、氮养分可用性降低、磷养分可用性降低和高植物密度。“产量”可受许多性质的影响,包括但不限于植物高度、植物生物质、荚数目、植物上的荚位置、节间数目、荚破碎的发生率、谷粒尺寸、穗尺寸、穗尖填充、籽粒败育(kernelabortion)、结瘤和氮固定的效率、营养物同化的效率、对生物和非生物胁迫的抗性、碳同化、植物结构、对倒伏的抗性、种子萌发百分比、幼苗活力和早期性状。产量还可能受到出芽效率(包括在胁迫条件下的发芽)、生长速率(包括在胁迫条件下的生长速率)、开花时间和持续时间、穗数目、穗尺寸、穗重量、每只穗或荚的种子数、种子尺寸、种子组成(淀粉、油、蛋白质)和种子填充特性影响。
本文中还使用的术语“性状修饰”包括相对于不包含所述突变的植物(例如野生型植物或阴性分离物)而言,通过在包含如本文所述的内源CKX基因中的突变的植物中导致特征的可检测差异来改变天然性状。在一些情况下,可以定量评估所述性状修饰。例如,性状修饰可能是与对照植物相比,观察的性状特征或表型的增加或减少。已知修饰的性状可以存在自然变化。因此,与对照植物相比,观察到的性状修饰包括植物中的性状特征或表型的正态分布和幅度的改变。
本公开涉及具有改进的经济上重要的特性、更具体地提高的产量的植物。更具体地,本公开涉及包含本文所述的CKX基因中的突变的植物,其中与没有所述突变的对照植物相比,所述植物具有增加的产量。在一些实施方案中,与对照植物相比,如本文所述生产的植物表现出增加的产量或改善的产量性状组分。在一些实施方案中,本公开的植物表现出与产量相关的改进的性状,包括但不限于增加的氮使用效率、增加的氮胁迫耐受性、增加的水使用效率和增加的干旱耐受性,如下文所定义和讨论的。
产量(yield)可定义为作物的经济价值的可测量产量。产量可以在数量和/或质量的范围内定义。产量可以直接取决于若干因素,例如器官的数量和尺寸、植物结构(例如分枝的数量、植物生物质等)、开花时间和持续时间、谷物填充时间。根结构和发育、光合效率、营养物摄取、胁迫耐受性、早期活力、延迟衰老和功能保持绿色表型可以是确定产量的因素。因此,优化上述因素可以有助于增加作物产量。
本文提及产量相关性状的增加/改善也可以表示植物的一个或多个部分的生物质(重量)的增加,其可以包括地上和/或地下(可收获的)植物部分。特别地,这种可收获的部分是种子,并且本公开的方法的执行导致相对于合适对照植物而言产量、特别是种子产量增加的植物。术语植物的“产量”可以涉及该植物的营养生物质(根和/或芽生物质)、繁殖器官和/或繁殖体(例如种子)。
本公开的植物的增加的产量可以以多种方式测量,包括测试重量、每个植物的种子数、种子重量、每单位面积的种子数(例如每英亩的种子或种子重量)、每英亩的蒲式耳、每英亩的吨数或每公顷的千数。增加的产量可以因关键生化化合物(例如氮、磷和碳水化合物)的利用改进引起,或者因对环境胁迫(例如冷、热、干旱、盐、阴影、高植物密度和害虫或病原体的攻击)的响应改善引起。
“增加的产量”可以表现为以下中的一个或多个:(i)植物的一个或多个部分的增加的植物生物质(重量),特别是植物的地上(可收获)部分,增加的根生物质(增加的根数量,增加的根厚度,增加的根长度)或任何其他可收获部分的增加的生物质;或(ii)增加的早期活力,本文定义为在萌发后大约三周的改进的幼苗地上区域。
“早期活力”是指特别是在植物生长的早期阶段期间的活性健康植物生长,可以由由于例如植物更好地适应其环境(例如优化能源的使用、营养物的摄取以及在芽和根之间的碳分配)而引起的植物适应性增加导致。例如,早期的活力可以是种子在种植后发芽和出苗的能力和幼小植物在出苗后生长和发育的能力的组合。具有早期活力的植物还显示出增加的幼苗存活和更好的作物长成,这通常导致高度均匀的田地,其中大多数植物基本上同时达到各种发育阶段,这通常导致产量增加。因此,早期活力可以通过测量各种因素来确定,例如谷粒重量、发芽百分比、出苗百分比、幼苗生长、幼苗高度、根长度、根和芽生物量、冠幅尺寸和颜色等。
此外,增加的产量也可以表现为增加的总种子产量,其可以由以下中的一个或多个引起:由于每个植物和/或基于单个种子的种子重量增加而导致的种子生物质(种子重量)的增加,例如每个植物的花/圆锥花序的数量增加;荚的数量增加;节点的数量增加;每个花序/植物的花(“小花”)的数量增加;种子填充速率增加;填充种子的数量增加;种子尺寸(长度、宽度、面积、周长)增加,其也可以影响种子的组成;和/或种子体积增加,其也可以影响种子的组成。在一个实施方案中,增加的产量可以是增加的种子产量,例如增加的种子重量;增加的填充种子数量;以及增加的收获指数。
增加的产量也可能导致修饰的结构,或者可能由于改进的植物结构而发生。
增加的产量也可以表现为收获指数增加,表示为可收获部分诸如种子的收率与总生物质的比率。
本公开还扩展到植物的可收获部分,例如但不限于种子、叶、果实、花、棉铃(boll)、荚、角果(siliques)、坚果、茎、根茎、块茎和球茎。本公开还涉及源自这种植物的可收获部分的产品,例如干颗粒、粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本公开提供了一种用于增加植物的“产量”或者植物或植物部分的“宽英亩产量”的方法,其被定义为每单位面积的可收获植物部分,例如每英亩的种子或种子重量、每英亩的磅数、每英亩的蒲式耳数、每英亩的吨数(tones per acre)、每英亩的吨数、每公顷的千克数。
如本文所用,“氮使用效率”是指导致所施加的每个氮单位的植物产量、生物质、活力和生长速率增加的过程。所述过程可包括植物对氮的摄取、同化、积累、信号传导、感测、重新易位(在植物内)和使用。
如本文所用,“增加的氮使用效率”是指当经受与正常或标准条件下相同量的可用/施加的氮时,植物比正常更快或更好地生长、发育或收益的能力;当经受少于最佳量的可用/施加的氮时,或在氮限制条件下,植物正常地生长、发育或收益的能力,或者更快或更好地生长、发育或收益的能力。
如本文所用,“氮限制条件”是指提供比足够或成功植物代谢、生长、繁殖成功和/或活力所需的最佳量更少量的氮的生长条件或环境。
如本文所用,“增加的氮胁迫耐受性”(increased nitrogen stress tolerance)是指当经受少于最佳量的可用/施加的氮时,或在氮限制条件下,植物正常生长、发育或收益,或者生长、发育或收益更快或更好的能力。
增加的植物氮使用效率在本领域中可以理解为供应较少的氮而收获相似量的产量,或通过供应最佳/足够量的氮获得增加的产量。增加的氮使用效率可以改善植物氮胁迫耐受性,并且还可以改善种子的作物质量和生化成分,例如蛋白质产量和油产量。术语“提高的氮使用效率”、“增加的氮使用效率”和“氮胁迫耐受性”在本公开中可互换地用于指在氮限制条件下具有提高的生产量的植物。
如本文所用,“水使用效率”是指蒸腾的每单位水蒸气被叶同化的二氧化碳的量。它构成了控制干燥环境中植物生产力的最重要特性之一。“干旱耐受性”是指植物适应干旱或干旱条件的程度。植物对水缺乏的生理反应包括叶萎缩、叶面积的减小、叶脱裂和通过将营养物引导到植物的地下部分来刺激根生长。通常,植物在开花和种子发育(生殖阶段)期间对干旱更易感,因为植物的资源被偏向支持根生长。此外,脱落酸(ABA),一种植物胁迫激素,诱导叶气孔(涉及气体交换的微观孔隙)闭合,从而减少通过蒸腾的水损失,并降低光合作用的速率。这些响应在短期内提高了植物的用水效率。术语“增加的水使用效率”、“提高的水使用效率”和“增加的干旱耐受性”在本公开中可互换地用于指在水限制性条件下具有改善的生产力的植物。
如本文所用,“增加的水使用效率”是指当经受与正常或标准条件下相同量的可用/施加的水时,植物比正常更快或更好地生长、发育或收益的能力;当经受减少量的可用/施加的水(水输入)或在水分胁迫或水不足胁迫的条件下,植物正常地生长、发育或收益或者更快或更好地生长、发育或收益的能力。
如本文所用,“增加的干旱耐受性”是指当经受减少量的可用/施加的水和/或在急性或慢性干旱的条件下时,植物正常生长、发育或收益,或者比正常更快或更好地生长、发育或收益的能力;或者当经受减少量的可用/施加的水(水输入)或在缺水胁迫的条件下或在急性或慢性干旱的条件下时,植物正常生长、发育或收益的能力。
如本文所用,“干旱胁迫”是指导致缺水和使植物经受对植物组织的胁迫和/或损害和/或负面地影响谷物/作物产量的干燥期(急性或慢性/长期);导致缺水和/或更高温度和使植物经受对植物组织的胁迫和/或损害和/或负面地影响谷物/作物产量的干燥期(急性或慢性/长期)。
如本文所用,“缺水”是指提供的水少于植物充分/成功生长和发育所需的最佳量的条件或环境。
如本文所用,“水分胁迫”(water stress)是指提供的水量比植物/作物的充分/成功生长和发育所需的量更不适当(更少/不足或更多/过量)的条件或环境,从而使植物经受对植物组织的胁迫和/或损害和/或不利地影响谷粒/作物产量。
如本文所用,“缺水胁迫”(water deficit stress)是指提供的水量比植物/作物的充分/成功生长和发育所需的水量更少/不足、从而使植物经受对植物组织的胁迫和/或损害和/或不利地影响谷粒产量的条件或环境。
如本文中所用,术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”指线性或分支的、单链或双链的RNA或DNA,或其杂交体。该术语还包括RNA/DNA杂交体。当合成产生dsRNA时,不太常见的碱基,诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsRNA和核酶配对。例如,含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已经显示出以高亲和力结合RNA,并且是基因表达的强效反义抑制剂。也可以进行其他修饰,诸如对磷酸二酯骨架或RNA的核糖基团中的2’-羟基的修饰。
如本文中所用,术语“核苷酸序列”是指核苷酸的杂聚物或这些核苷酸从核酸分子的5’末端至3'末端的序列,包括DNA或RNA分子,包括cDNA、DNA片段或部分、基因组DNA、合成的(例如化学合成的)DNA、质粒DNA、mRNA和反义RNA,其中任一种都可以是单链或双链的。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用,是指核苷酸的杂多聚体。本文提供的核酸分子和/或核苷酸序列在本文中以从左至右的5’至3’方向呈现,并且使用美国序列规则37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中阐述的用于表示核苷酸特征的标准代码来表示。如本文中所用,“5’区”可以指多核苷酸的最靠近多核苷酸5’末端的区域。因此,例如,多核苷酸的5’区中的元件可以位于从位于所述多核苷酸的5’末端的第一个核苷酸至位于该多核苷酸中间的核苷酸的任何位置。如本文中所用,“3’区”可以指多核苷酸的最靠近多核苷酸3’末端的区域。因此,例如,多核苷酸的3’区中的元件可以位于从位于所述多核苷酸的3’末端的第一个核苷酸至位于该多核苷酸中间的核苷酸的任何位置。
如本文中关于核酸所使用的,术语“片段”或“部分”是指相对于参考核酸而言长度缩短(例如缩短1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、400、450、500、550、600、650、700、750、800、850、900、950或1000个或更多个核苷酸或者其间的任何范围或数值)的核酸,并且其包含与所述参考核酸的相应部分相同或几乎相同(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列、基本上由所述核苷酸序列组成和/或由所述核苷酸序列组成。例如,编码CKX多肽的核酸可以减少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175或180或更多个核苷酸或其中的任何范围或数值,这种减少可以导致植物产量性状的改善。如果合适,这种核酸片段可以包含在更大的多核苷酸中作为其组分。作为进一步的实例,本发明的引导核酸的重复序列可以包含野生型CRISPR-Cas重复序列(例如野生型CRISPR-Cas重复序列;例如来自例如Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c等的CRISPR Cas***的重复)的“部分”。
在一些实施方案中,核酸片段或部分可包含下述、基本由其组成或由其组成:CKX核酸的约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、660、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2150、2200、2300、2400、2500、2600、2700、2800、2900、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8100、8185个或更多个连续核苷酸,任选地从3’端起约2800个连续碱基对至约8190个连续碱基对,或从3’端起约650个连续碱基对至约1620个连续碱基对;任选地长达CKX核酸的全长,所述减少可导致植物中产量性状的改善。
在一些实施方案中,核酸片段或部分可能是CKX1核酸的截短的结果,其中可以从基因组序列中缺失5516个连续核苷酸,例如从核苷酸1884至7399的整个3’端,和/或从编码序列(cds)中缺失1605个连续核苷酸,例如从核苷酸28-1632的整个3′端。因此,在一些实施方案中,缺失导致CKX1基因组序列的截短,起始于针对SEQ ID NO:72的核苷酸位置编号而言约核苷酸1880、1881、1882、1883、1884、1885、1886、1887、1888、1889、1890、1895、1900、1905、1910、1915、1920、1925、1930、1935、1940、1945、1950、1960、1970、1980、1990、2000、2010、2020、2030、2040、2041、2045、2050或2060直至基因组序列的全长(例如直至核苷酸7399)。在一些实施方案中,缺失导致CKX1编码序列的截短,起始于针对SEQ ID NO:73的核苷酸位置编号而言约核苷酸25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200或205直至编码序列的全长(例如直至核苷酸1632)。
在一些实施方案中,核酸片段或部分可以是CKX2核酸的截短的结果,其中可以从基因组序列中缺失5115个连续核苷酸,例如从核苷酸803至5917的整个3’端,和/或从编码序列(cds)中缺失1610个连续核苷酸(例如从核苷酸38至1647的整个3’端)。因此,在一些实施方案中,缺失导致CKX2基因组序列的截短,起始于针对SEQ ID NO:75的核苷酸位置编号而言约核苷酸800、801、802、803、804、805、806、807、808、809、810、815、820、830、840、850、860、870、880、890、900、905、910、915、920、925、930、935、940、945、950或955直至基因组序列的全长(例如直至核苷酸5917)。在一些实施方案中,缺失导致CKX2编码序列的截短,起始于针对SEQ ID NO:76的核苷酸位置编号而言约核苷酸35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185或190直至编码序列的全长(例如直至核苷酸1647)。
在一些实施方案中,核酸片段或部分可以是CKX3核酸的截短的结果,其中5076个连续核苷酸可以从基因组序列中缺失,例如,从核苷酸692至5768的整个3’端,和/或从编码序列(cds)中缺失1574个连续核苷酸,例如从核苷酸35至1608的整个3’端。因此,在一些实施方案中,缺失导致CKX3基因组序列的截短,起始于针对SEQ ID NO:78的核苷酸位置编号而言约核苷酸690、691、692、693、694、695、670、680、690、700、710、715、720、730、740、750、760、770、780、790、800、805、810、815、820、825或862直至基因组序列的全长(例如直至核苷酸5768)。在一些实施方案中,缺失导致CKX3编码序列的截短,起始于针对SEQ ID NO:79的核苷酸位置编号而言约核苷酸35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、166、167、168或169直至编码序列的全长(例如直至核苷酸1608)。
在一些实施方案中,核酸片段或部分可以是CKX4核酸的截短的结果,其中8186个连续核苷酸可以从基因组序列中缺失,例如从核苷酸1540-9725的整个3’端,和/或从编码序列(cds)中缺失1574个连续核苷酸,例如从第2至1575位核苷酸的整个3’端。因此,在一些实施方案中,缺失导致CKX4基因组序列的截短,起始于针对SEQ ID NO:81的核苷酸位置编号而言约核苷酸1540、1541、1542、1543、1544、1545、1546、1547、1548、1549、1550、1555、1560、1570、1580、1590、1600、1610、1620、1630、1640、1645、1650、1660、1670、1680、1685、1686、1687、1688、1689、1690、1700、1800、2000、2500、3000直至基因组序列的全长(例如直至核苷酸9725)。在一些实施方案中,缺失导致CKX4编码序列的截短,起始于针对SEQ IDNO:82的核苷酸位置编号而言约核苷酸2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、105、110、115、120、125、130、135、140、145、150、151、151、152、153、154或155直至编码序列的全长(例如直至核苷酸1575)。
在一些实施方案中,核酸片段或部分可以是CKX5(错误)核酸的截短的结果,其中2972个连续核苷酸可以从基因组序列中缺失,例如,从核苷酸690-3661的整个3’端),和/或从编码序列(cds)中缺失678个连续核苷酸,例如核苷酸43-720的整个3‘端。因此,在一些实施方案中,缺失导致CKX5基因组序列的截短,起始于针对SEQ ID NO:84的核苷酸位置编号而言约核苷酸690、691、692、693、695、696、697、698、699、700、705、710、715、720、725、730、735、740、745、750、755、760、765、770、775、780、785或790直至基因组序列的全长(例如直至核苷酸3661)。在一些实施方案中,缺失导致CKX5编码序列的截短,起始于针对SEQ ID NO:91的核苷酸位置编号而言约核苷酸40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、100、105、110、25、30、35、40、45、50、60、70、80、90、100、105、110、115、120、125、130、135、140、141、142、143、144或145直至编码序列的全长(例如直至核苷酸720)。
在一些实施方案中,核酸片段或部分可以是CKX5核酸的截短的结果,其中3338个连续核苷酸可以从基因组序列中缺失,例如,从核苷酸658-3995的整个3’端,和/或从编码序列(cds)的1563个连续核苷酸,例如从核苷酸43至1605的整个3′端。因此,在一些实施方案中,缺失导致CKX5基因组序列的截短,起始于针对SEQ ID NO:84的核苷酸位置编号而言约核苷酸655、656、657、658、659、660、665、670、675、680、685、690、691、692、693、695、696、697、698、699、700、705、710、715、720、725、730、735、740、745、750、755、756、757或758直至基因组序列的全长(例如直至核苷酸3995)。在一些实施方案中,缺失导致CKX5编码序列的截短,起始于针对SEQ ID NO:91的核苷酸位置编号而言约核苷酸40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、100、105、110、25、30、35、40、45、50、60、70、80、90、100、105、110、115、120、125、130、135、140、141、142或143直至编码序列的全长(例如直至核苷酸1605)。
在一些实施方案中,核酸片段或部分可以是CKX6核酸的截短的结果,其中可以从基因组序列中缺失6716个连续核苷酸,例如,从核苷酸31至1494的整个3’端,和/或从编码序列(cds)中缺失678个连续核苷酸(例如从核苷酸31至1494的整个3′端)。因此,在一些实施方案中,缺失导致CKX6基因组序列的截短,起始于针对SEQ ID NO:87的核苷酸位置编号而言约核苷酸1560、1561、1562、1563、1565、1566、1567、1568、1569、1570、1575、1580、1585、1590、1595、1600、1610、1620、1630、1640、1645、1650、1655、1660、1665、1670、1675、1680、1685、1690、1695、1700、1705、1706、1707、1708或1709直至基因组序列的全长(例如直至核苷酸8277)。在一些实施方案中,缺失导致CKX6编码序列的截短,起始于针对SEQ ID NO:88的核苷酸位置编号而言约核苷酸30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、25、30、35、40、45、50、60、70、80、90、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、176、177、178直至编码序列的全长(例如直至核苷酸1494)。
如本文关于多肽所使用的,术语“片段”或“部分”可指相对于参考多肽而言长度缩短的多肽,其包含与所述参考多肽的相应部分相同或几乎相同(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列或基本上由所述氨基酸序列组成或由所述氨基酸序列组成。在适当的情况下,这种多肽片段可以包含在一个更大的多肽中作为其构成部分。在一些实施方案中,所述多肽片段包含参考多肽的至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400个或更多个连续氨基酸,基本上由所述连续氨基酸组成或由所述连续氨基酸组成。
在一些实施方案中,“部分”可以与从多肽中缺失的氨基酸的数量有关。因此,例如,CKX多肽的缺失“部分”可包含从SEQ ID NO:74、77、80、83、89或92中任一个的氨基酸序列(或从与SEQ ID NO:74、77、80、83、89或92中任一个的氨基酸序列具有至少80%序列同一性(例如至少80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%同一性)的序列)缺失至少一个氨基酸残基(例如至少1个,或至少2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、100个、150个、200个、250个、300个、350个、400个、450个、500个或更多个连续氨基酸残基)。
在一些实施方案中,如本文所述的从CKX多肽缺失氨基酸残基(截短的CKX多肽或丧失CKX多肽)可导致显性负突变、半显性突变、弱功能丧失突变、低效突变(hypomorphicmutation)或无效突变,当其被包含在植物中时,与不包含所述缺失的植物相比,所述缺失可导致所述植物表现出改进的产量性状。
多核苷酸或多肽的“区域”分别指该多核苷酸或多肽的连续核苷酸或连续氨基酸残基的部分。例如,CKX多核苷酸序列的区域可以包括但不限于SEQ ID NO:72的连续核苷酸1884-2060、SEQ ID NO:73的连续核苷酸28-204、SEQ ID NO:75的连续核苷酸803-955、SEQID NO:76的连续核苷酸38-190、SEQ ID NO:78的连续核苷酸692-826,SEQ ID NO:79的连续核苷酸35-169,SEQ ID NO:81的连续核苷酸1540-1689,SEQ ID NO:82的连续核苷酸2-151,SEQ ID NO:84的连续核苷酸690-790,SEQ ID NO:87的连续核苷酸1562-1709,SEQ ID NO:88的连续核苷酸31-178,和/或SEQ ID NO:91的连续核苷酸43-143(参见例如SEQ ID NO:78、79、80或81),并且CKX多肽的区域可以包括、但不限于SEQ ID NO:74或SEQ ID NO:77的氨基酸残基588-601(参见例如,SEQ ID NO:93、94、95、96、97、98或99)。
在一些实施方案中,“序列特异性核酸结合结构域”或“序列特异性DNA结合结构域”可结合CKX基因(例如SEQ ID NO:72,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:76,SEQID NO:78,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:87,SEQID NO:88,或SEQ ID NO:91),和/或CKX核酸的一个或多个片段、部分或区域(例如SEQ IDNO:93-97)。
如本文关于核酸所使用的,术语“功能性片段”是指编码多肽的功能性片段的核酸。
如本文中所用,术语“基因”是指能够用于产生mRNA、反义RNA、miRNA、抗微小RNA反义寡脱氧核糖核苷酸(AMO)等的核酸分子。基因可以能够用于或不能够用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区(例如内含子、调控元件、启动子、增强子、终止序列和/或5’和3’非翻译区)。基因可以是“分离的”,其是指核酸实质性或基本上不含通常被发现与以其天然状态存在的所述核酸相关联的组分。此类组分包括来自重组生产的其他细胞材料、培养基和/或用于化学合成所述核酸的各种化学物质。
术语“突变”是指点突变(例如错义或无义,或导致移框的单个碱基对的***或缺失)、***、缺失和/或截短。当突变是氨基酸序列中的残基被另一个残基取代,或者序列中一个或多个残基的缺失或***时,通常通过列出原始残基、随后是该残基在所述序列中的位置以及新取代的残基的身份来描述突变。在一些实施方案中,缺失或***是框内缺失或框内***。在一些实施方案中,缺失可导致产生提前终止密码子的移框突变,从而截短所述蛋白质。在一些实施方案中,缺失可导致产生提前终止密码子的移框突变,从而截短所述蛋白质。在一些实施例中,移框突变是框外突变(out-of-frame mutation)。在一些实施方案中,移框突变可以是框内突变(in-frame mutation)。截短可包括在多肽的C末端或在多肽的N末端的截短。多肽的截短可以是编码所述多肽的基因的相应5’端或3’端中的缺失的结果。在一些实施方案中,CKX多肽的截短是由在CKX基因的5’端发生/起始的缺失(例如导致提前终止密码子的突变)引起的C端截短,其中所述截短产生CKX多肽的N端片段,任选地不产生多肽。在一些实施方案中,内源性CKX基因中的突变可导致无活性的CKX多肽。在一些实施方案中,内源性CKX基因的启动子中的突变(例如启动子攻击(promoter bashing))可导致CKX基因表达的改变(增加/减少),并因此导致CKX多肽量的增加。在一些实施方案中,内源性CKX基因中的突变可导致CKX基因的表达减少,并因此导致作为无效或无活性多肽的CKX多肽的量减少。如本文所述突变的内源性CKX基因可以具有与WT CKX基因相同的表达水平,但突变基因产生无效或无活性的CKX多肽。
如本文中所用,术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如,序列“A-G-T”(5’至3’)与互补序列“T-C-A”(3’至5’)结合。两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者互补性可以是完全的,其中单链分子之间存在完全互补性。核酸链之间的互补性程度对核酸链之间杂交的效率和强度有显著影响。
如本文中所用,“互补”可以指与比较者核苷酸序列有100%互补性,或者其可以指与比较者核苷酸序列有小于100%互补性(例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等的互补性,例如实质性互补性)。
具有同源性的不同核酸或蛋白质在本文中被称为“同源物”。术语同源物包括来自相同物种和其他物种的同源序列以及来自相同物种和其他物种的直向同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间以位置同一性百分比(即,序列相似性或同一性)表示的相似性水平。同源性也指不同核酸或蛋白质之间相似功能特性的概念。因此,本发明的组合物和方法还包含与本发明核苷酸序列和多肽序列的同源物。如本文中所用,“直向同源”是指在物种形成期间从共同的祖先基因产生的不同物种中的同源核苷酸序列和/或氨基酸序列。本发明核苷酸序列的同源物与本发明的所述核苷酸序列具有实质性的序列同一性(例如至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
如本文中所用,“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在组分(例如核苷酸或氨基酸)比对窗口中不变的程度。“同一性”可以通过已知的方法容易地计算,所述方法包括、但不限于在以下文献中描述的方法:Computational MolecularBiology(Lesk,A.M.编辑)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.编辑)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(vonHeinje,G.编辑)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.编辑)Stockton Press,New York(1991)。
如本文中所用,术语“序列同一性百分比”或“同一性百分比”是指当两个序列最佳比对时,与测试(“受试”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中,“序列同一性百分比”可以指与参照多肽相比,氨基酸序列中相同氨基酸的百分比。
如本文中所用,在两个核酸分子、核苷酸序列或多肽序列的上下文中,短语“实质性同一”/“实质性相同”或“实质性同一性”是指两个或更多个序列或亚序列在就最大对应性进行比较和比对时,具有如使用以下序列比较算法之一或通过目测检查所测量的至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%核苷酸或氨基酸残基同一性。在本发明的一些实施方案中,实质性同一性存在于本发明核苷酸序列的连续核苷酸区域中,所述连续核苷酸区域的长度为约10个核苷酸至约20个核苷酸、约10个核苷酸至约25个核苷酸、约10个核苷酸至约30个核苷酸、约15个核苷酸至约25个核苷酸、约30个核苷酸至约40个核苷酸、约50个核苷酸至约60个核苷酸、约70个核苷酸至约80个核苷酸、约90个核苷酸至约100个核苷酸、约100个核苷酸至约200个核苷酸、约100个核苷酸至约300个核苷酸、约100个核苷酸至约400个核苷酸、约100个核苷酸至约500个核苷酸、约100个核苷酸至约600个核苷酸、约100个核苷酸至约800个核苷酸、约100个核苷酸至约900个核苷酸,或更多个核苷酸,以及其间的任何范围,直至序列的全长。在一些实施方案中,核苷酸序列可以在至少约20个连续核苷酸(例如约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2500、3000、3500、4000个或更多个连续核苷酸)上实质性相同。在一些实施方案中,两个或多个CKX基因可以在SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:87、SEQ ID NO:88或SEQ ID NO:91的至少约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400或1500至约2000、2050、2100、2150、2200、2250、2300、2350、2400、2450、2500、2510、2520、2530、2540、2550、2600、2650、2700、2750、2800、2850、2900、2950、3000、3050、3100、3150、3200、3250、3300、3350、3400、3410或3420个或更多个连续核苷酸上彼此实质性相同,或者在SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:75、SEQ IDNO:76、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:87、SEQ ID NO:88或SEQ ID NO:91的至少约100、110、120、130、140或150个至约200、210、220、230、240、250、260、270、280、290、300、400、500、600、700、750、800、810、820、830、840、850、900、1000、1250、1500、1750、2000、2500、3000或3500个或更多个连续核苷酸上彼此实质性相同。
在本发明的一些实施方案中,实质性同一性存在于本发明多肽的连续氨基酸残基区域上,所述连续氨基酸残基区域的长度为约3个氨基酸残基至约10、11、12、13、14、15、16、17、18、19或20个氨基酸残基、约5个氨基酸残基至约25、30、35、40、45、50或60个氨基酸残基、约15个氨基酸残基至约30个氨基酸残基、约20个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约40个氨基酸残基、约25个氨基酸残基至约50个氨基酸残基、约30个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约50个氨基酸残基、约40个氨基酸残基至约70个氨基酸残基、约50个氨基酸残基至约70个氨基酸残基、约60个氨基酸残基至约80个氨基酸残基、约70个氨基酸残基至约80个氨基酸残基、约90个氨基酸残基至约100个氨基酸残基,或更多个氨基酸残基,以及其中的任何范围,直至序列的全长。在一些实施方案中,多肽序列可以在至少约8、9、10、11、12、13、14个或更多个连续氨基酸残基(例如长度约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、130、140、150、175、200、225、250、275、300、325、350、400、450、500个或更多个氨基酸,或更多连续氨基酸残基)上彼此实质性相同。在一些实施方式中,两种或多种CKX多肽可以在SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个的至少约10至约500个连续氨基酸残基上彼此实质性相同;例如在SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任一个的至少约10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、71、72、73、74、75、76、77、78、79、80、85、90、95、100、105、110、120、125、130、135、140、150、155、160、165、170、175、200、225、250、275、300、325、350、400、450或500个连续氨基酸残基上彼此实质性相同。在一些实施方案中,实质性相同的核苷酸或蛋白质序列可以执行与和其实质性相同的核苷酸(或编码的蛋白质序列)基本相同的功能。
对于序列比较,通常一个序列作为参考序列与测试序列进行比较。当使用序列比较算法时,将测试序列和参考序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法基于指定的程序参数来计算所述测试序列相对于参考序列的序列同一性百分比。
用于比对比较窗口的序列的最佳比对是本领域技术人员公知的,并且可以通过诸如以下的工具进行:Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法,以及任选地通过这些算法的计算机化执行(诸如GAP、BESTFIT、FASTA和TFASTA(可作为Wisconsin/>(AccelrysInc.,San Diego,CA)的一部分获得))进行。测试序列和参考序列的比对区段的“同一性分数”是两个比对的序列共有的相同组分的数目除以参考序列区段(例如整个参考序列或参考序列的较小的确定部分)中组分的总数。序列同一性百分比表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是与全长多核苷酸序列或其一部分的比较,或者是与更长的多核苷酸序列的比较。出于本发明的目的,“同一性百分比”对于翻译的核苷酸序列也可以使用BLASTX 2.0版、对于多核苷酸序列可以使用BLASTN 2.0版来确定。
当两个核苷酸序列在严格条件下相互杂交时,也可以认为这两个序列是实质性互补的。在一些实施方案中,被认为实质性互补的两个核苷酸序列在高度严格条件下相互杂交。
核酸杂交实验如Southern和Northern杂交上下文中的“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。核酸杂交的详细指南可见于Laboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes第I部分第2章"Overview of principles of hybridizationand the strategy of nucleic acid probe assays”,Elsevier,New York(1993)。通常,在确定的离子强度和pH下,高度严格的杂交和洗涤条件被选择为比具体序列的热熔点(Tm)低约5℃。
Tm是50%的靶序列与完全匹配的探针杂交时的温度(在确定的离子强度和pH下)。非常严格的条件选择为等于具体探针的Tm。在Southern或Northern印迹中,用于具有超过100个互补残基的互补核苷酸序列在滤膜上杂交的严格杂交条件的一个实例是42℃下的50%甲酰胺和1mg肝素,其中杂交进行过夜。高度严格洗涤条件的一个实例是在72℃下用0.1 5M NaCl洗涤约15分钟。严格洗涤条件的一个实例是在65℃下用0.2x SSC洗涤15分钟(关于SSC缓冲液的描述,参见Sambrook,同下)。通常,高严格洗涤之前是低严格性洗涤,以去除背景探针信号。对于双链体、例如超过100个核苷酸的双链体,中等严格洗涤的一个实例是在45℃下用1x SSC洗涤15分钟。对于双链体、例如超过100个核苷酸的双链体,低严格洗涤的一个实例是在40℃下用4-6x SSC洗涤15分钟。对于短探针(例如约10至50个核苷酸),严格条件通常涉及小于约1.0M Na离子的盐浓度,在pH 7.0至8.3下通常为约0.01至1.0M Na离子浓度(或其他盐),并且温度通常为至少约30℃。还可通过加入诸如甲酰胺等去稳定剂来达到严格条件。一般来说,信噪比为在该具体杂交测定中对于无关探针观察的信噪比的2倍(或更高)表明检测到了特异性杂交。如果在严格条件下不相互杂交的核苷酸序列编码的蛋白质实质性相同,则所述核苷酸序列仍然是实质性相同的。这可以在例如使用遗传密码所允许的最大密码子简并性产生核苷酸序列的拷贝时发生。
可以对本发明的多核苷酸和/或重组核酸构建体(例如表达盒和/或载体)进行密码子优化以用于表达。在一些实施方案中,可以对本发明编辑***的多核苷酸、核酸构建体、表达盒和/或载体(例如包含/编码序列特异性核酸结合结构域(例如来自多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)、Argonaute蛋白和/或CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)(例如I型CRISPR-Cas效应子蛋白、II型CRISPR-Cas效应子蛋白、III型CRISPR-Cas效应子蛋白、IV型CRISPR-Cas效应子蛋白、V型CRISPR-Cas效应子蛋白或VI型CRISPR-Cas效应子蛋白)、核酸酶(例如核酸内切酶(例如Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN))、脱氨酶蛋白/结构域(例如腺嘌呤脱氨酶、胞嘧啶脱氨酶)、编码逆转录酶蛋白或结构域的多核苷酸、编码5'-3’核酸外切酶多肽的多核苷酸和/或亲和多肽、肽标签等的序列特异性DNA结合结构域)进行密码子优化,以用于在植物中表达。在一些实施方案中,本发明的经密码子优化的核酸、多核苷酸、表达盒和/或载体与未经密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70%至约99.9%(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)同一性或更高同一性。
本发明的多核苷酸或核酸构建体可以与多种启动子和/或其它调控元件可操作地连接,用于在植物和/或植物细胞中表达。因此,在一些实施方案中,本发明的多核苷酸或核酸构建体还可包含与一个或多个核苷酸序列可操作地连接的一个或多个启动子、内含子、增强子和/或终止子。在一些实施方案中,启动子可以与内含子(例如Ubi1启动子和内含子)可操作地相关联。在一些实施方案中,与内含子相关联的启动子可被称为“启动子区”(例如Ubi1启动子和内含子)(参加例如SEQ ID NO:21和SEQ ID NO:22)。
如本文中提及多核苷酸时使用的“可操作地连接”或“可操作地相关联的”是指所示元件在功能上彼此相关,并且通常在物理上也相关。因此,如本文中所用,术语“可操作地连接”或“可操作地相关联的”是指单个核酸分子上功能上相关联的核苷酸序列。因此,与第二核苷酸序列可操作连接的第一核苷酸序列意指第一核苷酸序列被放置成与第二核苷酸序列处于功能关系中时的情况。例如,如果启动子实现核苷酸序列的转录或表达,则所述启动子与所述核苷酸序列可操作地相关联。本领域技术人员将会理解,控制序列(例如启动子)不需要与与其可操作地相关联的核苷酸序列毗邻,只要控制序列能够指导其表达即可。因此,例如居间的不翻译、但仍转录的核酸序列可存在于启动子与所述核苷酸序列之间,并且所述启动子仍然可以被认为是可与该核苷酸序列“可操作地连接”。
如本文中所用,涉及多肽时,术语“连接的”是指一个多肽与另一个多肽的附接。多肽可以直接(例如通过肽键)或通过接头与另一多肽(在N-末端或C-末端)连接。
术语“接头”是本领域公认的,是指连接两个分子或部分(例如融合蛋白的两个结构域,例如核酸/DNA结合多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽;或DNA核酸内切酶多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽)的化学基团或分子。接头可以由单个连接分子组成,或者可以包含不止一个连接分子。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。在一些实施方案中,接头可以是氨基酸或者其可以是肽。在一些实施方案中,接头是肽。
在一些实施方案中,可用于本发明的肽接头的长度可为约2至约100个或更多个氨基酸,例如,约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸(例如长度为约2至约40、约2至约50、约2至约60、约4至约40、约4至约50、约4至约60、约5至约40、约5至约50、约5至约60、约9至约40、约9至约50、约9至约60、约10至约40、约10至约50、约10至约60个氨基酸,或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个氨基酸至约26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸(例如长度为约105、110、115、120、130、140、150个或更多个氨基酸))。在一些实施方案中,肽接头可以是GS接头。
如本文中所用,关于多核苷酸的术语“连接的”或“融合的”是指一个多核苷酸与另一个多核苷酸的附接。在一些实施方案中,两个或更多个多核苷酸分子可以通过接头连接,所述接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。多核苷酸可以通过共价或非共价键联或结合(包括例如Watson-Crick碱基对)或通过一个或多个连接核苷酸与另一个多核苷酸(在5’末端或3’末端)连接或融合。在一些实施方案中,某一结构的多核苷酸基序可***另一多核苷酸序列中(例如指导RNA中发夹结构的延伸)。在一些实施方案中,连接核苷酸可以是天然存在的核苷酸。在一些实施方案中,连接核苷酸可以是非天然存在的核苷酸。
“启动子”是控制或调节与所述启动子可操作地相关联的核苷酸序列(例如编码序列)的转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性RNA。通常,“启动子”是指含有RNA聚合酶II的结合位点并指导转录起始的核苷酸序列。通常,相对于相应编码序列的编码区的起始,启动子位于5’或上游。启动子可包含作为基因表达的调控子的其它元件;例如启动子区域。这些包括TATA盒共有序列,并且通常有CAAT盒共有序列(Breathnach和Chambon,(1981)Annu.Rev.Biochem.50:349)。在植物中,CAAT盒可用AGGA盒代替(Messing等,(1983)于Genetic Engineering of Plants,T.Kosuge,C.Meredith和A.Hollaender(编辑),Plenum Press,第211-227页中)。
可用于本发明的启动子可包括例如组成型、诱导型、时间调控型、发育调控型、化学调控型、组织偏好型和/或组织特异性启动子,用于制备重组核酸分子,例如“合成核酸构建体”或“蛋白质-RNA复合物”。这些不同类型的启动子是本领域已知的。
启动子的选择可以根据表达的时间和空间要求而变化,也可以根据待转化的宿主细胞而变化。用于许多不同生物体的启动子是本领域公知的。基于本领域的广泛知识,可以为特定目标宿主生物选择合适的启动子。因此,例如,对模式生物中高度组成型表达的基因上游的启动子了解很多,此类知识可以容易地访问并在适当的情况下应用于其它***中。
在一些实施方案中,在植物中有功能的启动子可以与本发明的构建体一起使用。可用于在植物中驱动表达的启动子的非限制性实例包括RubisCo小亚基基因1的启动子(PrbcS1)、肌动蛋白基因的启动子(Pactin)、硝酸还原酶基因的启动子(Pnr)和重复碳酸酐酶基因1的启动子(Pdca1)(参见Walker等人,Plant Cell Rep.23:727-735(2005);Li等人,Gene 403:132-142(2007);Li等人,Mol Biol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成型启动子,Pnr和Pdca1是诱导型启动子。Pnr受硝酸盐诱导,受铵抑制(Li等人,Gene403:132-142(2007)),Pdca1受盐诱导(Li等人,Mol Biol.Rep.37:1143-1154(2010))。在一些实施方案中,可用于本发明的启动子是RNA聚合酶II(Pol II)启动子。在一些实施方案中,来自玉米的U6启动子或7SL启动子可用于本发明的构建体。在一些实施方案中,来自玉米的U6c启动子和/或7SL启动子可用于驱动引导核酸的表达。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可用于本发明的构建体。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可用于驱动引导核酸的表达。
可用于植物的组成型启动子的实例包括但不限于,叶香树病毒启动子(cestrumvirus promotet,cmp)(美国专利第7,166,770号)、水稻肌动蛋白1启动子(Wang等人(1992)Mol.Cell.Biol.12:3399-3406;以及美国专利第5,641,876号)、CaMV 35S启动子(Odell等人(1985)Nature313:810-812)、CaMV 19S启动子(Lawton等人(1987)Plant Mol.Biol.9:315-324)、nos启动子(Ebert等人(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adh启动子(Walker等人(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)和遍在蛋白启动子。来源于遍在蛋白的组成型启动子在许多细胞类型中积累。已经从几种植物物种中克隆了遍在蛋白启动子用于转基因植物,例如向日葵(Binet等人,1991.Plant Science 79:87-94)、玉米(Christensen等人,1989,Plant Molec.Biol.12:619-632)和拟南芥(Norris等人1993.Plant Molec.Biol.21:895-906)。已经在转基因单子叶植物***中开发了玉米遍在蛋白启动子(UbiP),专利公开EP 0 342 926中公开了其序列和构建用于单子叶植物转化的载体。遍在蛋白启动子适用于在转基因植物,尤其是单子叶植物中表达本发明的核苷酸序列。另外,由McElroy等人描述的启动子表达盒(Mol.Gen.Genet.231:150-160(1991))可被容易地修饰以表达本发明的核苷酸序列,并且特别适用于单子叶宿主。
在一些实施方案中,组织特异性/组织偏好启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或偏好性表达模式包括但不限于绿色组织特异性或偏好性、根特异性或偏好性、茎特异性或偏好性、花特异性或偏好性或者花粉特异性或偏好性表达模式。适于在绿色组织中表达的启动子包括许多调节参与光合作用的基因的启动子,这些启动子中的许多启动子已被从单子叶植物和双子叶植物中克隆出来。在一个实施方案中,可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula,PlantMolec.Biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括那些与编码种子贮藏蛋白(诸如β-伴大豆球蛋白、十字花科蛋白(cruciferin)、油菜籽蛋白(napin)和菜豆蛋白)、玉米蛋白或油体蛋白(诸如油质蛋白)、或参与脂肪酸生物合成的蛋白(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因以及在胚胎发育期间表达的其它核酸(诸如Bce4,参见例如Kridl等人(1991)Seed Sci.Res.1:209-219;以及欧洲专利第255378号)相关联的启动子。可用于在植物,特别是玉米中表达本发明核苷酸序列的组织特异性或组织偏好性启动子包括但不限于在根、髓、叶或花粉中指导表达的启动子。此类启动子公开于例如WO 93/07278(通过引用以其整体并入本文)中。可用于本发明的组织特异性或组织偏好性启动子的其它非限制性实例:美国专利6,040,504中公开的棉花rubisco启动子;美国专利5,604,121中公开的水稻蔗糖合酶启动子;de Framond(FEBS290:103-106(1991);属于Ciba-Geigy的EP 0 452 269)描述的根特异性启动子;美国专利5,625,136(属于Ciba-Geigy)中描述的茎特异性启动子,其驱动玉米trpA基因的表达;WO 01/73087中公开的夜香树黄叶卷曲病毒启动子;和花粉特异性或偏好性启动子,包括但不限于来自水稻的ProOsLPS10和ProOsLPS11(Nguyen等人,Plant Biotechnol.Reports 9(5):297-306(2015))、来自玉米的ZmSTK2_USP(Wang等人,Genome 60(6):485-495(2017))、来自番茄的LAT52和LAT59(Twell等人,Development 109(3):705-713(1990))、Zm13(美国专利第10,421,972号)、来自拟南芥的PLA2-δ启动子(美国专利第7,141,424号)和/或来自玉米的ZmC5启动子(国际PCT公布第WO1999/042587号)。
植物组织特异性/组织偏好性启动子的其他实例包括但不限于根毛特异性顺式元件(RHE)(Kim等人,The Plant Cell 18:2958-2970(2006))、根特异性启动子RCc3(Jeong等人,Plant Physiol.153:185-197(2010))和RB7(美国专利第5459252号)、植物凝集素启动子(Lindstrom等人(1990)Der.Genet.11:160-167;和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98)、玉米醇脱氢酶1启动子(Dennis等人(1984)NucleicAcids Res.12:3983-4000)、S-腺苷-L-甲硫氨酸合成酶(SAMS)(Vander Mijnsbrugge等人(1996)Plant and Cell Physiology,37(8):1108-1115)、玉米光收获复合物启动子(Bansal等人(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、玉米热休克蛋白启动子(O'Dell等人(1985)EMBO J.5:451-458;和Rochester等人(1986)EMBO J.5:451-458)、豌豆小亚基RuBP羧化酶启动子(Cashmore,"Nuclear genes encoding the small subunit ofribulose-l,5-bisphosphate carboxylase”第29-39页:Genetic Engineering of Plants(Hollaender编辑,Plenum Press 1983;和Poulsen等人(1986)Mol.Gen.Genet.205:193-200)、Ti质粒甘露碱合酶启动子(Langridge等人(1989)Proc.Natl.Acad.Sci.USA 86:3219-3223)、Ti质粒胭脂氨酸合酶启动子(Langridge等人(1989),同上),矮牵牛查尔酮异构酶启动子(van Tunen等人(1988)EMBO J.7:1257-1263)、大豆富含甘氨酸蛋白1启动子(Keller等人(1989)Genes Dev.3:1639-1646)、截短的CaMV 35S启动子(O'Dell等人(1985)Nature 313:810-812)、马铃薯块茎储藏蛋白(patatin)启动子(Wenzler等人(1989)PlantMol.Biol.13:347-354)、根细胞启动子(Yamamoto等人(1990)Nucleic Acids Res.18:7449)、玉米醇溶蛋白启动子(Kriz等人(1987)Mol.Gen.Genet.207:90-98;Langridge等人(1983)Cell 34:1015-1022;Reina等人(1990)Nuleic Acids Res.18:6425;Reina等人(1990)Nucleic Acids Res.18:7449;和Wandelt等人(1989)Nucleic Acids Res.17:2354)、球蛋白-1启动子(Belanger等人(1991)Genetics 129:863-872)、α-微管蛋白cab启动子(Sullivan等人(1989)Mol.Gen.Genet.215:431-440)、PEPCase启动子(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R基因复合物相关启动子(Chandler等人(1989)Plant Cell 1:1175-1183)和查尔酮合酶启动子(Franken等人(1991)EMBO J.10:2605-2612)。
对种子特异性表达有用的是豌豆的豌豆球蛋白启动子(Czako等人(1992)Mol.Gen.Genet.235:33-40);以及美国专利第5,625,136号中公开的种子特异性启动子。用于在成熟叶中表达的有用启动子是那些在衰老开始时被转换的启动子,诸如来自拟南芥的SAG启动子(Gan等人(1995)Science 270:1986-1988)。
另外,可以使用在叶绿体中有功能的启动子。此类启动子的非限制性实例包括噬菌体T3基因9的5’UTR和美国专利第7,579,516号中公开的其他启动子。可用于本发明的其它启动子包括但不限于S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制剂基因启动子(Kti3)。
可用于本发明的其它调控元件包括但不限于内含子、增强子、终止序列和/或5’和3’非翻译区。
可用于本发明的内含子可以是从植物中鉴定和分离的内含子,然后被***到用于植物转化的表达盒。如本领域技术人员所理解的,内含子可以包含自我切除所需的序列,并被框内整合到核酸构建体/表达盒中。内含子可以用作间隔区来分隔一个核酸构建体中的多个蛋白质编码序列,或者可在一个蛋白质编码序列内部使用内含子来例如稳定mRNA。如果它们被用在蛋白质编码序列中,则它们被***“框内”,其中包括切除位点。还可将内含子与启动子结合以改善或修饰表达。例如,可用于本发明的启动子/内含子组合包括但不限于玉米Ubi1启动子和内含子的组合(参见例如SEQ ID NO:21和SEQ ID NO:22)。
可用于本发明的内含子的非限制性实例包括来自ADHI基因(例如Adh1-S内含子1、2和6)、遍在蛋白基因(Ubi1)、RuBisCO小亚基(rbcS)基因、RuBisCO大亚基(rbcL)基因、肌动蛋白基因(例如肌动蛋白-1内含子)、丙酮酸脱氢酶激酶基因(pdk)、硝酸还原酶基因(nr)、重复碳酸酐酶基因1(Tdca1)、psbA基因、atpA基因或其任意组合的内含子。
在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”或可以包含在表达盒内。如本文中所用,“表达盒”意指包含例如一种或多种本发明的多核苷酸的重组核酸分子(例如编码序列特异性核酸结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸、编码逆转录酶蛋白或结构域的多核苷酸、编码5’-3’核酸外切酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(RT)模板),其中一种或多种多核苷酸与一种或多种控制序列(例如启动子、终止子等)可操作地相关联。因此,在一些实施方案中,可以提供一个或多个表达盒,其被设计成表达例如本发明的核酸构建体(例如编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶蛋白/结构域的多核苷酸、编码5’-3’核酸外切酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等,或者包含引导核酸、延伸的引导核酸和/或RT模板等)。当本发明的表达盒包含不止一个多核苷酸时,所述多核苷酸可以与驱动所有多核苷酸表达的单个启动子可操作地连接,或者所述多核苷酸可以与一个或多个分开的启动子可操作地连接(例如三个多核苷酸可以由一个、两个或三个启动子以任意组合驱动)。当使用两个或更多个不同的启动子时,所述启动子可以是相同的启动子,也可以是不同的启动子。因此,当包含在单个表达盒中时,编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码CRISPR-Cas效应子蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域的多核苷酸(例如RNA依赖性DNA聚合酶)、和/或编码5’-3’核酸外切酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或RT模板可以各自与单个启动子或任意组合的分开启动子可操作地连接。
包含本发明的核酸构建体的表达盒可以是嵌合的,意味着其至少一个组分相对于其至少一个其它组分是异源的(例如来自宿主生物的启动子可操作地连接到将在该宿主生物中表达的感兴趣多核苷酸,其中所述感兴趣多核苷酸来自不同于宿主的生物体,或者通常被发现不与该启动子相关联)。表达盒也可以是天然存在的、但已经以用于异源表达的重组形式获得的表达盒。
表达盒可以任选地包括转录和/或翻译终止区(即终止区)和/或在所选宿主细胞中有功能的增强子区。多种转录终止子和增强子是本领域已知的,并且可获得用于表达盒中。转录终止子负责转录的终止和正确的mRNA多聚腺苷酸化。终止区和/或增强子区对于转录起始区可以是天然的,对于例如编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等可以是天然的,或者可以是宿主细胞天然的,或者可以是另一来源天然的(例如对于例如启动子、编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或对于宿主细胞或其任意组合是外来的或异源的)。
本发明的表达盒还可包括编码选择标记的多核苷酸,其可用于选择转化的宿主细胞。如本文中所用,“选择标记”是指这样的多核苷酸序列,当其被表达时,对表达该标记的宿主细胞赋予独特的表型,从而使此类转化的细胞与那些不具有该标记的细胞相区别。这种多核苷酸序列可以编码选择标记或可筛选的标记,这取决于该标记是否赋予可通过化学手段,诸如通过使用选择剂(例如抗生素等)选择的性状,或者取决于该标记是否只是可通过观察或测试,诸如通过筛选(例如荧光)鉴定的性状。合适的选择标记的许多实例是本领域已知的,并且可用于本文所述的表达盒中。
除了表达盒之外,本文所述的核酸分子/构建体和多核苷酸序列也可与载体结合使用。术语“载体”是指用于将核酸(或多种核酸)转移、递送或引入细胞的组合物。载体包含含有待转移、递送或引入的一种或多种核苷酸序列的核酸构建体(例如表达盒)。用于转化宿主生物体的载体是本领域公知的。一般类别的载体的非限制性实例包括呈双链或单链线性或环状形式的病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、微环或土壤杆菌(Agrobacterium)二元载体,其可以是或可以不是自我传递的或可移动的。在一些实施方案中,病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合入细胞基因组或存在于染色体外(例如具有复制起点的自主复制质粒)来转化原核或真核宿主。另外还包括穿梭载体,所述穿梭载体是指天然地或通过设计能够在两种不同的宿主生物体中复制的DNA媒介物,所述宿主生物体可选自放线菌(actinomycetes)和相关物种、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞)。在一些实施方案中,载体中的核酸处于合适的启动子或用于在宿主细胞中转录的其他调控元件的控制之下,并与其可操作地连接。载体可以是在多种宿主中起作用的双功能表达载体。在基因组DNA的情况下,这可能包含其自身的启动子和/或其它调控元件,而在cDNA的情况下,这可能处于合适的启动子和/或其它调控元件的控制之下,以便在宿主细胞中表达。因此,本发明的核酸或多核苷酸和/或包含其的表达盒可以包括在本文所述和本领域已知的载体中。
如本文中所用,“接触(contact)”、“接触(contacting)”、“接触(contacted)”及其语法变型是指在适于进行所需反应(例如转化、转录控制、基因组编辑、产生切口和/或切割)的条件下,将所需反应的组分放置在一起。例如,可在一定条件下将靶核酸与序列特异性核酸结合蛋白(例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)、锌指核酸酶、转录激活因子样效应核酸酶(TALEN)和/或Argonaute蛋白))和脱氨酶或编码其的核酸构建体接触,所述条件能够使得所述序列特异性核酸结合蛋白、逆转录酶和脱氨酶被表达并且序列特异性核酸结合蛋白与靶核酸结合,逆转录酶和/或脱氨酶可以与序列特异性核酸结合蛋白融合,或者募集到序列特异性核酸结合蛋白处(例如通过与序列特异性核酸结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签),因此,脱氨酶和/或逆转录酶被置于靶核酸附近,从而修饰所述靶核酸。可以使用利用其他蛋白质-蛋白质相互作用募集逆转录酶和/或脱氨酶的其他方法。此外,可将RNA-蛋白质相互作用和化学相互作用用于蛋白质-蛋白质和蛋白质-核酸募集。
如本文中所用,涉及靶核酸的“修饰(modifying)”或“修饰(modification)”包括对靶核酸的编辑(例如突变)、共价修饰、交换/取代核酸/核苷酸碱基、缺失、切割、切刻和/或改变其转录控制。在一些实施方案中,修饰可以包括任何类型的一个或多个单碱基改变(SNP)。
在多肽“调节”表型(例如植物中非活性和活性细胞***素之间的平衡)的上下文中使用的术语“调节”,是指多肽影响一个或多个基因表达的能力,使得诸如细胞***蛋白平衡的表型被修饰。
在感兴趣多核苷酸的上下文中,“引入/导入”、“引入/导入的”、“被引入/导入”(及其语法变型)是指将感兴趣核苷酸序列(例如多核苷酸、RT模板、核酸构建体和/或引导核酸)以使得该核苷酸序列能够进入细胞内部的方式呈递至植物、其植物部分或其细胞。
术语“转化”或“转染”可以互换使用,并且如本文中所用,是指将异源核酸导入细胞。细胞的转化可以是稳定的或瞬时的。因此,在一些实施方案中,可用本发明的多核苷酸/核酸分子稳定转化宿主细胞或宿主生物体(例如植物)。在一些实施方案中,可用本发明的多核苷酸/核酸分子瞬时转化宿主细胞或宿主生物体。
多核苷酸上下文中的“瞬时转化”意指多核苷酸被引入细胞,但不整合到细胞的基因组中。
在引入细胞的多核苷酸的上下文中,“稳定地引入/导入”或“被稳定地引入/导入”旨在指引入/导入的多核苷酸被稳定整合到细胞的基因组中,因此细胞被所述多核苷酸稳定地转化。
如本文中所用,“稳定的转化”或“被稳定地转化”意指将核酸分子引入细胞并整合到细胞的基因组中。因此,整合的核酸分子能够被其后代遗传,更具体地,被多个连续世代的后代遗传。如本文中所用,“基因组”包括细胞核和质体基因组,因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文中所用,稳定的转化也可指保持在染色体外的转基因(例如作为微小染色体或质粒)。
瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或蛋白质印迹来检测,所述测定或蛋白质印迹可以检测由引入生物体的一种或多种转基因编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列的Southern印迹杂交分析来检测,所述核酸序列与导入生物体(例如植物)的转基因的核苷酸序列特异性杂交。细胞的稳定转化可以通过例如细胞的RNA与核酸序列的Northern印迹杂交测定来检测,所述核酸序列与引入宿主生物体的转基因的核苷酸序列特异性杂交。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域公知的其它扩增反应来检测,所述聚合酶链式反应或其它扩增反应使用与转基因的靶序列杂交的特异性引物序列,导致转基因序列的扩增,这可以根据标准方法来检测。转化也可以通过本领域公知的直接测序和/或杂交方案来检测。
因此,在一些实施方案中,本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以瞬时表达,并且/或者它们可被稳定地整合到宿主生物体的基因组中。因此,在一些实施方案中,本发明的核酸构建体(例如包含如本文所述用于编辑的多核苷酸的一个或多个表达盒)可被瞬时引入具有引导核酸的细胞中,因此,细胞中不保留DNA。
可以通过本领域技术人员已知的任何方法将本发明的核酸构建体引入植物细胞。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如通过土壤杆菌)、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、浸润、PEG介导的核酸摄取以及导致核酸引入植物细胞的任何其他电、化学、物理(机械)和/或生物机制(包括其任意组合)的转化。转化真核生物体和原核生物体的方法是本领域公知的常规方法,并在整个文献中有描述(参见例如Jiang等人2013.Nat.Biotechnol.31:233-239;Ran等人Nature Protocols 8:2281-2308(2013))。本领域已知的各种植物转化方法的一般指南包括Miki等人("Procedures for Introducing Foreign DNA into Plants",Methodsin Plant Molecular Biology and Biotechnology,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.,Boca Raton,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))。
在本发明的一些实施方案中,细胞的转化可以包括核转化。在其他实施方案中,细胞的转化可以包括质体转化(例如叶绿体转化)。在又一另外的实施方案中,可以通过常规育种技术将本发明的核酸引入细胞。在一些实施方案中,可以通过土壤杆菌转化将多核苷酸、表达盒和/或载体中的一种或多种引入植物细胞。
因此,可以以本领域公知的许多方式将多核苷酸引入植物、植物部分、植物细胞。本发明的方法不依赖于将一种或多种核苷酸序列引入植物的特定方法,仅要它们进入细胞内部即可。当要引入不止一种多核苷酸时,它们可以作为单个核酸构建体的一部分装配,或者作为单独的核酸构建体装配,并且可以位于同一或不同的核酸构建体上。因此,所述多核苷酸可以在单个转化事件中或在分开的转化事件中被引入感兴趣细胞中,或者,多核苷酸可以被整合到植物中作为育种方案的一部分。
细胞***素是一种植物激素,参与植物的许多生理过程,其水平可能是改变植物产量的靶标。例如,植物中的细胞***素氧化酶(CKX)活性在非生物胁迫期间增加,这导致无活性细胞***素的增加和植物生产力的降低。通过修饰编码CKX多肽的内源性基因在被靶向的组织类型和发育阶段来靶向调控细胞***素平衡(例如活性和无活性细胞***素的相对平衡),有可能提供更高的生产力(例如改善的产量性状)。CKX是一种黄素蛋白,其中FAD辅因子与组氨酸残基共价连接。通过诸如增加细胞***、诱导气孔开放、抑制器官衰老和/或抑制顶端优势等机制,这种生产力的提高甚至在非生物胁迫条件下也是可能的。
因此,在一些实施方案中,本发明涉及在内源性CKX基因中产生突变,任选地,其中所述突变导致产生改变量的CKX多肽、截短的CKX多肽或不产生CKX多肽。在一些实施方案中,内源性CKX基因或者两个或多个内源性CKX基因中的突变能够导致改变非活性细胞***素与活性细胞***素之间的平衡有利于活性细胞***素,从而改善植物中的产量性状。因此,在一些实施方案中,本文所述的突变导致活性细胞***素向感兴趣的组织(例如植物的繁殖器官)的供应增加。在一些实施方案中,活性细胞***素向组织的供应在特定发育阶段或特定组织类型中可能增加或改变(例如增加或减少)。
在一些实施方案中,本发明提供一种植物或其植物部分,其包含编码CKX蛋白的至少一种内源性细胞***素氧化酶/脱氢酶(CKX)基因中的至少一个非天然突变。在一些实施方案中,内源性CKX基因中的突变导致无活性的CKX多肽。在一些实施方案中,内源性CKX基因的启动子中的突变(例如启动子攻击)可导致CKX基因表达的改变(增加/减少),并因此导致CKX多肽量的增加。在一些实施方案中,与WT CKX基因相比,内源性CKX基因中的突变可导致该基因的表达减少,并因此导致无效或无活性CKX多肽的量减少。在一些实施方案中,如本文所述的突变的CKX基因可以具有与WT CKX基因相同的表达水平,但是突变的CKX基因产生无效或无活性的CKX多肽。在一些实施方案中,所述CKX基因是CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因。在一些实施方案中,所述至少一个非天然突变是两个或多个CKX基因(例如2、3、4、5或6个CKX基因)中的突变,例如CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因中两个或更多个的突变,以任何组合。在一些实施方案中,所述至少一个非天然突变是CKX1、CKX2、CKX3、CKX4、CKX5和/或CKX6基因的内源性CKX基因中的至少三个(例如3、4、5或6个)中以任何组合的突变。在一些实施方案中,在编码CKX蛋白的至少一个内源性CKX基因中包含至少一个非天然突变的植物或其植物部分包含:(a)内源性CKX1基因、内源性CKX2基因和内源性CKX3基因中的突变;(b)内源性CKX1基因、内源性CKX3、内源性CKX5基因和内源性CKX6基因中的突变;或(c)内源性CKX1基因、内源性CKX2基因、内源性CKX3基因和内源性CKX4基因中的突变。
在一些实施方案中,在编码CKX蛋白的至少一个内源性CKX基因中包含至少一个非天然突变的植物与不包含该突变的等基因植物(例如野生型的未编辑植物或空的分离体)相比具有改进的产量性状。
在一些实施方案中,内源性CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽。在一些实施方案中,内源性CKX基因是CKX1基因,其(a)包含与SEQ ID NO:72或SEQ ID NO:73的核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:93的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:74的氨基酸序列具有至少80%序列同一性的序列的多肽。在一些实施方案中,内源性CKX基因是CKX2基因,其(a)包含与SEQ ID NO:75或SEQ IDNO:76的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:94的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:77的氨基酸序列具有至少80%序列同一性的序列的多肽。在一些实施方案中,内源性CKX基因是CKX3基因,其(a)包含与SEQ ID NO:78或SEQ ID NO:79的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:95的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:80的氨基酸序列具有至少80%序列同一性的序列的多肽。在一些实施方案中,内源性CKX基因是CKX4基因,其(a)包含与SEQ ID NO:81或SEQ ID NO:82的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽。在一些实施方案中,内源性CKX基因是CKX5基因,其(a)包含与SEQ ID NO:84或SEQ ID NO:91的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:97的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:92的氨基酸序列具有至少80%序列同一性的序列的多肽。在一些实施方案中,内源性CKX基因是CKX6基因,其(a)包含与SEQ ID NO:87或SEQ ID NO:88的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:98的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:89的氨基酸序列具有至少80%序列同一性的序列的多肽。
因此,在一些实施方案中,本发明的植物或植物部分在内源性CKX基因中包含至少一个非天然突变,其中所述内源性CKX基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽。
植物中内源性细胞***素氧化酶/脱氢酶(CKX)基因内的非天然突变可以是任何类型的突变,包括、但不限于点突变、碱基取代、碱基缺失和/或碱基***,任选地,其中所述至少一个非天然突变导致提前终止密码子。在一些实施方案中,与在CKX基因中不包含所述至少一个非天然突变的植物相比,本文所述包含CKX基因中具有至少一个所述非天然突变的内源性CKX基因的植物表现出改进的产量性状。
可用于本发明的突变可以包括、但不限于CKX基因的一个或多个碱基的取代、缺失和/或***,或者CKX多肽的一个或者多个氨基酸残基的缺失或取代。在一些实施方案中,所述至少一个非天然突变导致提前终止密码子。在一些实施方案中,至少一个非天然突变可包括向A、T、G或C的碱基取代,其导致提前终止密码子,从而产生截短的CKX多肽。在一些实施方案中,提前终止密码子导致CKX多肽的截短,使得不产生CKX多肽。在一些实施方案中,与野生型CKX基因相比,内源性CKX基因中的突变可能导致该基因的表达改变(例如表达增加或减少),并因此导致CKX多肽的量与相应的野生型CKX基因(例如未如本文所述修饰的CKX基因)相比改变。在一些实施方案中,内源性CKX基因的启动子中的突变(例如启动子攻击)可导致CKX基因表达的改变(增加/减少),并因此导致CKX多肽量的增加。在一些实施方案中,与野生型CKX基因相比,内源性CKX基因中的突变可导致该基因的表达减少,并因此导致作为无效或无活性多肽的CKX多肽的量减少。在一些实施方案中,如本文所述的突变的CKX基因可以具有与野生型CKX基因相同的表达水平,但是突变的CKX基因产生无效或无活性的CKX多肽。
在一些实施方案中,内源性CKX基因中的所述至少一个非天然突变可能是缺失(例如SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91中任一个的一个或多个连续碱基对、例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31,32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000或8000个或更多个连续碱基对的缺失)。在一些实施方案中,内源性CKX基因包括至少一个或两个或多个连续碱基对,或至少三个连续碱基对的缺失。在一些实施方案中,内源性CKX基因包括至少一个碱基对的缺失,其导致截短的CKX多肽(例如C末端截短)或没有CKX多肽。
在一些实施方案中,至少一个非天然突变可以产生显性负突变、半显性突变、弱的功能丧失突变、低效突变或无效突变。在一些实施方案中,所述至少一个非天然突变是无效突变。在一些实施方案中,所述至少一个非天然突变是显性负突变。在一些实施方案中,所述至少一个非天然突变是半显性突变。在一些实施方案中,编码可用于本发明的CKX多肽的内源性基因中的非天然突变可以是显性隐性突变。在一些实施方案中,与对照植物(例如不包含所述显性负突变和/或无效突变的植物)相比,包含无效突变和/或显性负突变的植物表现出改善的产量性状(例如增加的荚产量、增加的种子产量、增加的种子大小、增加的种子重量、增加的结瘤数量(nodule number)、增加的结瘤活性(nodule activity)和/或增加的氮固定)。
在一些实施方案中,提供了包括编辑***的植物细胞,该编辑***包括:(a)CRISPR相关的效应子蛋白;和(b)引导核酸(gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其包含与所述植物细胞中编码CKX蛋白的内源性靶基因互补的间隔区序列。在一些实施方案中,所述编辑***在编码CKX蛋白的内源性靶基因中产生突变。编码CKX蛋白的内源性靶基因可以是参与(例如能够影响或调节)活性和非活性细胞***素之间的相对平衡的任何CKX蛋白(任选地,相对于非活性细胞***素,增加活性细胞***素),并且可以被修饰以增加产量组分,例如荚产量/数目、种子产量和/或数目、种子大小和/或种子重量。在一些实施方案中,编码CKX蛋白的内源性靶基因是内源性CKX1基因、内源性CKX2基因、内源性CKX3基因、内源性CKX4基因、内源性CKX5基因或内源性CKX6基因,或其任何组合。在一些实施方案中,编码CKX蛋白且引导核酸的间隔区序列与其互补的内源性基因包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列,和/或包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域。在一些实施方案中,由所述内源性基因编码的CKX蛋白与氨基酸序列SEQ ID NO:74、77、80、83、89或92中的任何一个具有至少80%的序列同一性。在一些实施方案中,可用于本发明的间隔区序列可以包括、但不限于SEQ ID NO:99-113中任何一个的核苷酸序列。
在一些实施方案中,提供了一种植物细胞,所述植物细胞包含内源性细胞***素氧化酶/脱氢酶(CKX)基因内的至少一个非天然突变,所述非天然突变导致CKX基因的无效等位基因或敲除,其中所述至少一个非天然突变是碱基取代、碱基***或碱基缺失,其是使用编辑***引入的,所述编辑***包括与所述CKX基因中的靶位点结合的核酸结合结构域。在一些实施方案中,所述核酸酶是锌指核酸酶、转录激活物样效应核酸酶(TALEN)、核酸内切酶(例如Fok1)或CRISPR-Cas效应子蛋白。在一些实施方案中,所述编辑***的核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)、锌指核酸酶、转录激活子样效应核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,所述内源性CKX基因是CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因,或其任何组合,任选地,其中所述至少一个非天然突变是至少两个(例如2、3、4、5或6个)不同内源性CKX基因中的突变,以任何组合(例如CKX1、CKX2、CKX3、CKX4、CKX5或CKX6中的至少两个的任何组合)。在一些实施方案中,所述至少一个非天然突变是(a)内源性CKX1基因、内源性CKX2基因和内源性CKX3基因中的突变;(b)内源性CKX1基因、内源性CKX3、内源性CKX5基因和内源性CKX6基因中的突变;或(c)内源性CKX1基因、内源性CKX2基因、内源性CKX3基因和内源性CKX4基因中的突变。
在一些实施方案中,所述内源性CKX基因包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列,包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域和/或编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任一个具有至少80%同一性的多肽。在一些实施方案中,CKX基因中的靶位点在CKX基因的区域内,所述区域包含与以下序列具有至少80%序列同一性的序列:(a)SEQ ID NO:72(CKX1)的核苷酸序列的约核苷酸1884至约核苷酸2060或SEQ ID NO:73(CKX1)的核苷酸序列的约核苷酸28至约核苷酸204(例如SEQID NO:93);(b)SEQ ID NO:75(CKX2)的核苷酸序列的约核苷酸803至约核苷酸955或SEQ IDNO:76(CKX2)的核苷酸序列的约核苷酸38至约核苷酸190(例如SEQ ID NO:94);(c)SEQ IDNO:78(CKX3)的核苷酸序列的约核苷酸692至约核苷酸826或SEQ ID NO:79(CKX3)的核苷酸序列的约核苷酸35至约核苷酸169(例如SEQ ID NO:95);(d)SEQ ID NO:81(CKX4)的核苷酸序列的约核苷酸1540至约核苷酸1689或SEQ ID NO:82(CKX4)的核苷酸序列的约核苷酸2至约核苷酸151(例如SEQ ID NO:95);(e)SEQ ID NO:84(CKX5)的核苷酸序列的约核苷酸690至约核苷酸790或SEQ ID NO:91(CKX5)的核苷酸序列的约核苷酸43至约核苷酸143(例如SEQ ID NO:97);和/或(f)SEQ ID NO:87(CKX6)的核苷酸序列的约核苷酸1562至约核苷酸1709或SEQ ID NO:88(CKX6)的核苷酸序列的约核苷酸31至约核苷酸178(例如SEQ ID NO:98)。
在一些实施方案中,所述编辑***进一步包含核酸酶,并且所述核酸结合结构域结合CKX基因中的靶位点,其中所述CKX基因包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列,包含与SEQ IDNO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域,和/或编码与SEQID NO:74、77、80、83、89或92的氨基酸序列中的任一个具有至少80%同一性的多肽,并且所述至少一个非天然突变在被所述核酸酶切割后产生。在一些实施方案中,靶位点包含与SEQID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的序列。
在一些实施方案中,所述至少一个非天然突变是点突变。在一些实施方案中,非天然突变可以是向A、T、G或C的碱基取代,任选地,其中所述碱基取代导致氨基酸取代。在一些实施方案中,所述至少一个非天然突变可以是至少一个或至少两个(例如2、3、4、5、6、7、8、9、10、50、100、150或200个或更多个)连续碱基的碱基缺失或碱基***。在一些实施方案中,所述至少一个非天然突变导致CKX基因的5’区的全部或一部分的缺失,从而导致截短的CKX蛋白。在一些实施方案中,所述至少一个非天然突变导致CKX基因的3’端截短,其产生截短的CKX蛋白或不产生CKX蛋白。在一些实施方案中,所述至少一个非天然突变是无效等位基因或显性负突变。
可用于本发明的植物或其部分的非限制性实例包括玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、土豆、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、核桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜、黑莓、树莓、黑树莓或芸苔属种。在一些实施方案中,所述植物或其部分可以是大豆植物或大豆植物的部分。
在一些实施方案中,所述植物部分可以来自包括、但不限于下述的植物:玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、树莓、黑树莓或芸苔属种。在一些实施方案中,植物可以从本发明的植物部分(包括例如细胞)再生。在一些实施方案中,本发明的在CKX基因中包含至少一个非天然突变的植物包含改进的产量性状。
在一些实施方案中,提供了大豆植物或其部分,其在具有基因鉴定号(基因ID)Glyma15g18560、Glyma09g07360、Glyma17g06220、Glyma04g03130、Glyma09g35950和/或Glyma09g07190的内源性细胞***素氧化酶/脱氢酶(CKX)基因中包含至少一个非天然突变。
本文还提供了一种提供具有改进的产量性状(例如增加的荚数、增加的种子数、增加的种子重量、增加的结瘤数、增加的结瘤活性、由于增加结瘤而增加固氮或由于增加的种植密度而改进的产量性状)的多个植物的方法,所述方法包括在生长区域中种植两个或多个本发明的植物,从而提供与不包含所述至少一个非天然突变的多个对照植物相比(例如与不包含该突变的等基因野生型植物相比)具有改进的产量性状的多个植物。生长区域可以是可以将多个植物一起种植的任何区域,包括、但不限于田地(例如耕地、农田)、生长室、温室、娱乐区、草坪和/或路边等。
在一些实施方案中,提供了一种生产/培育无转基因的经编辑的植物的方法,该方法包括:将本发明的植物(例如包含CKX基因中的突变并且具有改进的产量性状的植物,所述改进的产量性状是例如增加的种植密度、增加的荚数、增加的种子数(例如粒数),和/或增加的种子重量(例如粒重))与无转基因的植物杂交,从而将所述至少一个非天然突变引入所述不含转基因的植物中(例如引入后代植物中);以及选择包含所述至少一个非天然突变并且不含转基因的后代植物,从而产生不含转基因的经编辑(例如经碱基编辑)的植物。
在一些实施方案中,提供了一种编辑植物细胞基因组中特定位点的方法,该方法包括以位点特异性方式切割植物细胞中内源性细胞***素氧化酶/脱氢酶(CKX)基因内的靶位点,其中所述内源性CKX基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ IDNO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽,从而在所述植物细胞的内源性CKX基因中产生编辑并产生在所述内源性CKX基因中包含编辑的植物细胞。在一些实施方案中,植物可以从在所述内源性CKX基因中包含所述编辑的植物细胞再生,以产生在其基因组中(即在其内源性CKX基因中)包含所述编辑的植物。与在内源性CKX基因中不包含编辑的对照植物相比,在所述内源性CKX基因中包含所述编辑的植物可以表现出改进的产量性状。在一些实施方案中,所述内源性CKX基因是CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因,或其任何组合。在一些实施方案中,在所述内源性CKX基因中包含所述编辑的植物包含在至少两个(例如2、3、4、5或6)不同的内源性CKX基因组中的编辑,在任何组合中(例如CKX1、CKX2、CKX3、CKX4、CKX5或CKX6中的至少两个的任何组合),任选地,其中所述编辑是(a)在内源性CKX1基因、内源性CKX2基因和内源性CKX3基因中;(b)在内源性CKX1基因、内源性CKX3、内源性CKX5基因和内源性CKX6基因中;或(c)在内源性CKX1基因、内源性CKX2基因、内源性CKX3基因和内源性CKX4基因中。
在一些实施方案中,所述编辑导致非天然突变,任选地,其中所述非天然突变是点突变。在一些实施方案中,所述编辑产生至少一个非天然突变,其中所述非天然突变是碱基***和/或碱基缺失,任选地,其中所述碱基缺失是导致至少约1个氨基酸残基至约540个氨基酸残基的C端截短的截短(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、50、60、70、80、90、100、110、120、130、150、160、170、180、190、191、192、193、194、195、200、210、220、225、230、240、250、275、300、325、350、400、410、420、430、435、436、437、439、440、450、455、460、465、470、475、476、477、478 479、480、485、486、487、488、489、490、495、500、505、510、515、520,521、523、524、525、526、527、528、529、530、531、532、534、535、536、537、538、539或540个氨基酸残基的C-末端截短),所述CKX多肽与SEQ ID NO:74、77、80、83、89或92的任何一个氨基酸序列具有至少80%的序列同一性。
在一些实施方案中,碱基缺失可导致CKX基因的如下3’端截短:从(a)SEQ ID NO:72(CKX1)的核苷酸序列的约核苷酸1884、1885、1895、1900、1950、2000或2050至约核苷酸7399或者SEQ ID NO:73(CKX1)的核苷酸序列的约核苷酸28、29、30、35、40、45、50、60、70、80、90、100、120、140、160、180、190、200、204、205、210、215或220至约核苷酸1632;(b)SEQID NO:75(CKX2)的核苷酸序列的约核苷酸803、804、805、810、820、830、840、850、860、870、880、890、900、910、920、930、940或950至约核苷酸5917,或SEQ ID NO:76(CKX2)的核苷酸序列的约核苷酸38、39、40、45、50、60、70、80、90、100、120、160或180至约核苷酸1647;(c)SEQID NO:78(CKX3)的核苷酸序列的约核苷酸692、693、694、695、700、710、720、730、740、750、760、770、780、790、800、810或820至约核苷酸5768,或SEQ ID NO:79(CKX3)的约核苷酸35、40、50、60、70、80、90、100、110、120、130、140、150或160至约核苷酸1608;(d)SEQ ID NO:81(CKX4)的核苷酸序列的约核苷酸1540、1550、1560、1570、1580、1590、1600、1610、1620、1630、1640、1650、1660、1670或1680至约核苷酸9725,或SEQ ID NO:82(CKX4)的核苷酸序列的约核苷酸2、3、4、5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150至约核苷酸1575;(e)SEQ ID NO:84(CKX5)的核苷酸序列的约核苷酸690、700、710、720、730、740、750、780或790至约核苷酸3661,或SEQ ID NO:91(CKX5)的核苷酸序列的约核苷酸43、44、45、50、60、70、80、90、100、110、120、130或140至约核苷酸1605;和/或(f)SEQ ID NO:87(CKX6)的核苷酸序列的约核苷酸1562、1563、1564、1565、1570、1580、1590、1600、1620、1640、1660、1680或1700至约核苷酸8277,或SEQ ID NO:88(CKX6)的核苷酸序列的约核苷酸31、32、33、34、35、40、50、60、70、80、90、100、110、120、130、140、150、160或170至约核苷酸1494(CKX6)。
在一些实施方案中,编辑方法产生非天然突变,其为无效等位基因和/或显性负突变。
在一些实施方案中,提供了一种制造植物的方法,该方法包括:(a)使包含至少一个内源性细胞***素氧化酶/脱氢酶(CKX)基因的植物细胞的群体与靶向内源性CKX基因的核酸酶接触,其中所述核酸酶连接到核酸结合结构域(例如编辑***),所述核酸结合域结合所述至少一个内源性CKX基因中的靶位点,其中所述至少一个内源性CKX基因:(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(iii)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽;(b)从所述群体中选择在所述至少一个内源性CKX基因中包含突变的植物细胞,其中所述突变是取代和/或缺失;和(c)将所选择的植物细胞生长成在所述至少一个内源性CKX基因包含所述突变的植物。在一些实施方案中,所述缺失导致内源性CKX基因的无效等位基因;并且生长所选择的植物细胞提供了包含内源性CKX基因的无效等位基因的植物。
在一些实施方案中,提供了一种改善植物或其部分的产量性状的方法,所述方法包括(a)使包含内源性细胞***素氧化酶/脱氢酶(CKX)基因的植物细胞与靶向内源性CKX基因的核酸酶接触,其中所述核酸酶连接到与所述内源性CKX基因中的靶位点结合的核酸结合结构域,其中所述内源性CKX基因:(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(iii)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽;和(b)将所述植物细胞生长成在所述内源性CKX基因中包含所述突变的植物,从而改善所述植物或其部分的产量性状(例如增加的种子数量、增加的种子大小、增加的荚数;或由于能够增加种植密度而增加的产量或改善的产量性状)。
在一些实施方案中,提供了一种生产包含在内源性细胞***素氧化酶/脱氢酶(CKX)基因中具有突变的至少一个细胞(例如一个或多个细胞)的植物或其部分的方法,所述方法包括使所述植物或植物部分中的内源性CKX基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸酶的核酸结合结构域结合所述内源性CKX基因中的靶位点,所述内源性CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ IDNO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽,从而产生包含在所述内源性CKX基因中具有突变的至少一个细胞的植物或其部分。
在一些实施方案中,一种生产包含内源性细胞***素氧化酶/脱氢酶(CKX)基因中的突变并具有改进的产量性状的植物或其部分的方法,所述方法包括使所述植物或植物部分中的内源性CKX基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域结合所述内源性CKX基因中的靶位点,所述内源性CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽,从而产生在所述内源性CKX基因中包含突变、并表现出改进的产量性状的植物或其部分。
在一些实施方案中,接触植物细胞、植物细胞群体和/或靶位点的核酸酶切割内源性CKX基因,从而将突变引入所述内源性CKX基因。可用于本发明的核酸酶可以是可用于编辑/修饰靶核酸的任何核酸酶。此类核酸酶包括、但不限于锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如Fok1)和/或CRISPR-Cas效应子蛋白。同样,可用于本发明的核酸结合结构域可以是能够用于编辑/修饰靶核酸的任何DNA结合结构域或RNA结合结构域。此类核酸结合结构域包括、但不限于锌指、转录激活因子样DNA结合结构域(TAL)、argonaute和/或CRISPR-Cas效应物DNA结合结构域。
在一些实施方案中,提供了一种编辑植物或植物部分中的内源CKX基因的方法,该方法包括使所述植物或植物部分中的CKX基因中的靶位点与胞嘧啶碱基编辑***接触,该胞嘧啶碱基编辑***包含胞嘧啶脱氨酶和与所述CKX基因中的靶位点结合的核酸结合结构域,所述CKX基因包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列,包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域和/或编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任一个具有至少80%同一性的多肽,从而产生包含具有突变的内源性CKX基因的植物或其部分,所述突变是由与胞嘧啶碱基编辑***的接触引起的,并且任选地其中所述植物表现出改进的产量性状。
在一些实施方案中,提供了一种编辑植物或植物部分中的内源性CKX基因的方法,该方法包括使所述植物或植物部分中的CKX基因中的靶位点与腺苷碱基编辑***接触,该腺苷碱基编辑***包含腺嘌呤脱氨酶和结合CKX基因内的靶位点的核酸结合结构域,其中所述CKX基因包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列,包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域和/或编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任一个具有至少80%同一性的多肽,从而产生包含具有突变的内源性CKX基因的植物或其部分,所述突变是由与腺苷碱基编辑***的接触引起的,并且任选地其中所述植物表现出改进的产量性状。
在一些实施方案中,提供了一种检测突变CKX基因(内源性CKX基因中的突变)的方法,该方法包括在植物基因组中检测编码例如SEQ ID NO:74、77、80、83、89或92的氨基酸序列的内源性CKX核酸中的突变,该突变导致编码的多肽序列的氨基酸残基中的取代或编码的多肽序列的一部分(例如至少一个残基或2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400或500个或更多个连续残基)的缺失。
在一些实施方案中,提供了一种检测突变CKX基因(内源性CKX基因中的突变)的方法,该方法包括在植物基因组中检测例如SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个内的突变,任选地,其中所述突变是***,缺失或取代至少一个核苷酸(例如至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、1000、1500、2000、2500、3000、4000、5000或6000个或更多个连续碱基的缺失)。
在一些实施方案中,本发明提供了检测内源CKX基因中的突变的方法,其包括在植物的基因组中检测根据本文所述产生的突变的CKX基因。
在一些实施方案中,本发明提供了产生包含内源CKX基因中的突变和至少一个(例如一个或多个)感兴趣多核苷酸的植物的方法,所述方法包括使在内源CKX基因中包含至少一个突变(例如一个或多个突变)的本发明植物(第一植物)与包含所述至少一个感兴趣多核苷酸的第二植物杂交以产生后代植物;以及选择包含所述CKX基因中的至少一个突变和所述至少一个感兴趣多核苷酸的后代植物,从而产生包含内源CKX基因中的突变和至少一个感兴趣多核苷酸的植物。
本发明还提供了一种产生包含内源CKX基因中的突变和至少一个感兴趣多核苷酸的植物的方法,所述方法包括将至少一个感兴趣多核苷酸引入包含CKX基因中的至少一个突变(例如一个或多个突变)的本发明植物中,从而产生包含CKX基因中的至少一个突变和至少一个感兴趣多核苷酸的植物。
感兴趣的多核苷酸可以是能够赋予所需表型或以其它方式修饰植物的表型或基因型的任何多核苷酸。在一些实施方式中,感兴趣多核苷酸可以是赋予除草剂耐受性、昆虫抗性、疾病抗性、产量性状改善、营养物使用效率增加和/或非生物胁迫抗性的多核苷酸。
可用于本发明的CKX基因包括产生多肽的任何CKX基因,所述多肽能够调节植物或其部分中活性细胞***素和非活性细胞***素之间的细胞***素平衡(任选地增加活性细胞***素超过非活性细胞***素),并且其中如本文所述的突变可在包括所述突变的植物或其部分中赋予改进的产量性状。在一些实施方案中,所述CKX基因是CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因。在一些实施方案中,至少一个非天然突变(例如一个或多个非天然突变)包括两个或更多个CKX基因(例如2、3、4、5或6个CKX基因)中的突变,例如CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因中的两个或更多个基因中的突变,以任何组合。
在一些实施方案中,内源性CKX基因中的突变可以是非天然突变。在一些实施方案中,至少一个非天然突变(例如一个或多个非天然突变)可以是CKX1、CKX2、CKX3、CKX4、CKX5和/或CKX6基因的内源性CKX基因中的至少三个(例如三个或更多个,例如,3、4、5或6个)基因内的突变,以任何组合。在一些实施方案中,包含编码CKX蛋白的至少一个内源性CKX基因(例如一个或多个内源性CKX基因)中的至少一个非天然突变的植物或其植物部分包含(a)内源性CKX1基因、内源性CKX2基因和内源性CKX3基因中的突变;(b)内源性CKX1基因、内源性CKX3、内源性CKX5基因和内源性CKX6基因中的突变;或(c)内源性CKX1基因、内源性CKX2基因、内源性CKX3基因和内源性CKX4基因中的突变。在一些实施方案中,与不包含所述突变的等基因植物相比,在编码CKX蛋白的至少一个内源性CKX基因中包含至少一个非天然突变的植物表现出改进的产量性状。
在一些实施方案中,所述非天然突变可以是内源性CKX基因中当包含在植物中时导致产量性状改善的任何突变。在一些实施方案中,内源性CKX基因(例如一个或多个内源性CKX基因)中的所述至少一个非天然突变可以是点突变,任选地碱基取代、碱基***和/或碱基缺失。在一些实施方案中,内源性CKX基因中的所述至少一个非天然突变是无效突变和/或显性负突变。在一些实施方案中,植物中内源性CKX基因中的所述至少一个非天然突变可以是导致植物表现出改进的产量性状的取代、缺失和/或***。在一些实施方案中,植物中内源性CKX基因中的所述至少一个非天然突变可以是导致显性负突变或无效突变以及具有改进的产量性状的植物的取代、缺失和/或***。在一些实施方案中,所述至少一个非天然突变可以是对A、T、G或C的碱基取代。在一些实施方案中,所述至少一个非天然突变可以是部分或整个CKX基因或CKX蛋白(例如CKX1、CKX2、CKX3、CKX4、CKX5或CKX6基因或多肽)的缺失。
在一些实施方案中,本发明提供了与细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点结合的引导核酸(例如gRNA、gDNA、crRNA、crDNA),所述CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽。
可用于本发明的引导的示例性间隔区序列可包含与下述片段或部分的互补性:与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的核苷酸序列的片段或部分;或编码包含与氨基酸序列SEQ ID NO:93-98中的任何一个具有至少80%序列同一性的序列的多肽的核苷酸序列的片段或部分。
在一些实施方案中,靶核酸是内源性CKX基因,其能够调节植物中活性细胞***素和非活性细胞***素之间的细胞***素平衡,任选地增加活性细胞***素超过非活性细胞***素。在一些实施方案中,靶核酸中的靶位点可包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88、91或93-98的区域、部分或片段具有至少80%序列同一性的序列,或者靶核酸中的靶位点可编码与SEQ ID NO:74、77、80、83、89或92具有至少80%序列同一性的氨基酸序列的区域。
在一些实施方案中,引导核酸包含具有SEQ ID NO:99-113中任一所示的核苷酸序列的间隔区。在一些实施方案中,CKX多肽可以是CKX1、CKX2、CKX3、CKX4、CKX5和/或CKX6多肽。
在一些实施方案中,提供了包含本发明的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应子蛋白的***。在一些实施方案中,该***可进一步包含与所述引导核酸缔合的tracr核酸和CRISPR-Cas效应子蛋白,任选地,其中tracr核酸与引导核酸共价连接。
如本文所用,“与引导核酸缔合的CRISPR-Cas效应子蛋白”是指在CRISPR-Cas效应子蛋白和引导核酸之间形成的复合物,以将CRISPR-Cas效应子蛋白引导到基因中的靶位点。
在一些实施方案中,提供了基因编辑***,所述基因编辑***包含与引导核酸缔合的CRISPR-Cas效应子蛋白,其中所述引导核酸包含与CKX基因结合的间隔区序列。在一些实施方案中,可用于所述基因编辑***的CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽。在一些实施方案中,CKX多肽可以是CKX1、CKX2、CKX3、CKX4、CKX5和/或CKX6多肽。
在一些实施方案中,基因编辑***的引导核酸可以包含与和SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88、91或93-98的核苷酸序列中的任何一个具有至少80%序列同一性的核苷酸序列的区域、部分或片段具有互补性的间隔区序列,或者可以编码与SEQID NO:74、77、80、83、89或92具有至少80%序列同一性的氨基酸序列的区域、部分或片段。在一些实施方案中,基因编辑***可进一步包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应子蛋白,任选地,其中tracr核酸与引导核酸共价连接。
在一些实施方案中,提供了一种引导核酸,其结合具有Glyma15g18560、Glyma09g07360、Glyma17g06220、Glyma04g03130、Glyma09g35950和/或Glyma09g07190的基因鉴定号(基因ID)的内源性细胞***素氧化酶/脱氢酶(CKX)基因中的靶核酸。
本发明进一步提供一种包含含有切割结构域的CRISPR-Cas效应子蛋白和引导核酸的复合物,其中所述引导核酸结合内源性细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点,其中所述CKX基因:(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽,其中所述切割结构域切割CKX基因中的靶链。在一些实施方案中,CKX基因可以是CKX1、CKX2、CKX3、CKX4、CKX5和/或CKX6基因。
本文还提供了一种表达盒,其包含(a)编码包含切割结构域的CRISPR-Cas效应子蛋白的多核苷酸和(b)结合内源性细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点的引导核酸,其中所述引导核酸包含与内源性CKX基因的一部分互补并与之结合的间隔区序列,所述内源性CKX基因与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性,或者编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的序列,任选地,其中所述间隔区序列与和SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的内源性CKX基因的一部分互补并与之结合。在一些实施方案中,CKX基因可以是CKX1、CKX2、CKX3、CKX4、CKX5和/或CKX6基因。
可用于本发明的编辑***可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑***,所述***可以以靶特异性方式引入突变。例如,编辑***(例如位点特异性或序列特异性编辑***)可以包括、但不限于CRISPR-Cas编辑***、大范围核酸酶编辑***、锌指核酸酶(ZFN)编辑***、转录激活因子样效应子核酸酶(TALEN)编辑***、碱基编辑***和/或先导编辑***,其中的每一种都可以包含一种或多种多肽和/或一种或多种多核苷酸,当它们在细胞中作为***表达时,可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中,编辑***(例如位点特异性或序列特异性编辑***)可以包含一种或多种多核苷酸和/或一种或多种多肽,包括但不限于核酸结合结构域(DNA结合结构域)、核酸酶和/或其他多肽和/或多核苷酸,和/或引导核酸(包括与靶位点具有实质互补性或完全互补性的间隔区)。
在一些实施方案中,编辑***可以包含一个或多个序列特异性核酸结合结构域(DNA结合结构域),其可以来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)、锌指核酸酶、转录激活因子样效应子核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,编辑***可包含一个或多个切割结构域(例如核酸酶),包括、但不限于核酸内切酶(例如Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)、锌指核酸酶和/或转录激活因子样效应核酸酶(TALEN)。在一些实施方案中,编辑***可包含一种或多种多肽,所述多肽包括但不限于脱氨酶(例如胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5’flap核酸内切酶(FEN)。在一些实施方案中,编辑***可以包含一种或多种多核苷酸,包括但不限于CRISPR阵列(CRISPR引导)核酸、延伸的引导核酸和/或逆转录酶模板。
在一些实施方案中,修饰或编辑CKX多肽的方法可包括将靶核酸(例如编码CKX多肽的核酸)与和脱氨酶结构域(例如腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)融合的碱基编辑融合蛋白(例如序列特异性DNA结合蛋白(例如CRISPR-Cas效应子蛋白或结构域))和引导核酸接触,其中所述引导核酸能够将所述碱基编辑融合蛋白引导/靶向靶核酸,从而编辑所述靶核酸内的基因座。在一些实施方案中,碱基编辑融合蛋白和引导核酸可以包含在一种或多种表达盒中。在一些实施方案中,可将靶核酸与碱基编辑融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,所述序列特异性DNA结合融合蛋白和引导核酸可以以核糖核蛋白(RNP)的形式提供。在一些实施方案中,可将细胞与不止一种碱基编辑融合蛋白和/或一种或多种引导核酸接触,所述引导核酸可以靶向细胞中的一种或多种靶核酸。
在一些实施方案中,修饰或编辑CKX基因的方法可包括将靶核酸(例如编码CKX多肽的核酸)与和肽标签融合的序列特异性DNA结合融合蛋白(例如序列特异性DNA结合蛋白(例如CRISPR-Cas效应子蛋白或结构域)、脱氨酶融合蛋白(其包含与能够与肽标签结合的亲和多肽融合的脱氨酶结构域(例如腺嘌呤脱氨酶和/或胞嘧啶脱氨酶))和引导核酸接触,其中所述引导核酸能够将序列特异性DNA结合融合蛋白引导至/靶向靶核酸,序列特异性DNA结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集到靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,可将序列特异性DNA结合融合蛋白与结合肽标签的亲和多肽融合,以及可将脱氨酶与肽标签融合,从而将脱氨酶募集到所述序列特异性DNA结合融合蛋白和靶核酸处。在一些实施方案中,所述序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,可将靶核酸与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,所述序列特异性DNA结合融合蛋白、脱氨酶融合蛋白和引导核酸可以以核糖核蛋白(RNP)的形式提供。
在一些实施方案中,诸如先导编辑(prime editing)等方法可用于在内源CKX基因中产生突变。在先导编辑中,将RNA依赖性DNA聚合酶(逆转录酶,RT)和逆转录酶模板(RT模板)与序列特异性核酸结合结构域组合使用,所述序列特异性核酸结合结构域赋予以序列特异性方式识别并结合靶标的能力,并且也能够在靶标内引起含PAM链的切口。所述序列特异性核酸结合结构域可以是CRISPR-Cas效应子蛋白,并且在该情况下,CRISPR阵列或指导RNA可以是包含延伸部分的延伸的引导核酸,所述延伸部分包含引物结合位点(primerbinding site,PSB)和待整合到基因组(模板)中的编辑。类似于碱基编辑,先导编辑可以利用各种将用于编辑的蛋白质募集到靶位点的方法,此类方法包括在基因组编辑的选定过程中使用的蛋白质与核酸之间的非共价和共价相互作用。
在一些实施方案中,CKX基因的突变或修饰可以是***、缺失和/或点突变,其产生具有例如C末端截短的CKX多肽(例如突变的CKX多肽),或者CKX基因的突变可能不产生CKX多肽。在一些实施方案中,包含具有如本文所述的突变(例如内源性CKX基因中的至少一个突变(例如一个或多个突变),任选地其中不产生CKX多肽或所产生的CKX多肽是截短的)的内源性CKX基因的植物与在内源性CKX基因中不包含所述至少一个非天然突变的对照植物相比可以包括改善的产量性状。
在一些实施方案中,植物部分可以是细胞。在一些实施方案中,所述植物或其植物部分可以是本文所述的任何植物或其部分。在一些实施方案中,可用于本发明的植物可以是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、土豆、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、核桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜或芸苔属植物。在一些实施方案中,所述植物可以是大豆植物,并且植物部分,包括细胞,可以来自大豆植物。
在一些实施方案中,引入内源性CKX基因多肽内的突变是非天然突变。在一些实施方案中,引入内源性CKX基因中的突变可以是本文所述一个或多个核苷酸的取代、***和/或缺失。在一些实施方案中,引入到内源性CKX基因中的突变可以是缺失,任选地CKX基因的全部或部分的缺失,例如所述基因的导致具有C末端截短的CKX多肽或没有CKX多肽的3’截短。在一些实施方案中,内源性CKX基因中的突变可导致与CKX基因相比所述基因的表达改变(例如表达增加或减少),并因此导致CKX多肽的量与相应CKX基因(例如未如本文所述修饰的CKX基因)相比发生改变。在一些实施方案中,内源性CKX基因的启动子中的突变(例如启动子攻击)可导致CKX基因表达的改变(增加/减少),并因此导致CKX多肽的量增加。在一些实施方案中,与CKX基因相比,内源性CKX基因中的突变可导致该基因的表达减少,并因此导致作为无效或无活性多肽的CKX多肽的量减少。在一些实施方案中,如本文所述的突变的CKX基因可能具有与CKX基因相同的表达水平,但是突变的CKX基因产生无效或无活性的CKX多肽。
在一些实施方案中,CKX基因可以是CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因或CKX6基因。在一些实施方案中,CKX多肽可以是CKX1多肽、CKX2多肽、CKX3多肽、CKX4多肽、CKX5多肽或CKX6多肽。在一些实施方案中,植物或其部分可以包含两个或多个内源性CKX基因中的突变。例如,植物或其部分可包含(a)CKX1基因、CKX2基因和CKX3基因中的非天然突变;(b)CKX1基因、CKX3、CKX5基因和CKX6基因中的非天然突变;或(c)CKX1基因、CKX2基因、CKX3基因和CKX4基因中的非天然突变。本文所述的包含非天然突变的CKX基因的进一步组合被认为可用于生产表现出产量成分改善的植物。
在一些实施方案中,可用于本发明的编辑***的序列特异性核酸结合结构域(DNA结合结构域)可以来自例如多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)、锌指核酸酶、转录激活物样效应核酸酶(TALEN)和/或Argonaute蛋白。
在一些实施方案中,序列特异性核酸结合结构域可以是CRISPR-Cas效应子蛋白,任选地其中所述CRISPR-Cas效应子蛋白可以来自I型CRISPR-Cas***、II型CRISPR-Cas***、III型CRISPR-Cas***、IV型CRISPR-Cas***、V型CRISPR-Cas***或VI型CRISPR-Cas***。在一些实施方案中,本发明的CRISPR-Cas效应子蛋白可以来自II型CRISPR-Cas***或V型CRISPR-Cas***。在一些实施方案中,CRISPR-Cas效应子蛋白可以是II型CRISPR-Cas效应子蛋白,例如Cas9效应子蛋白。在一些实施方案中,CRISPR-Cas效应子蛋白可以是V型CRISPR-Cas效应子蛋白,例如Cas12效应子蛋白。
如本文所用,“CRISPR-Cas效应子蛋白”是切割或切开核酸、结合核酸(例如靶核酸和/或引导核酸)和/或鉴定、识别或结合如本文所定义的引导核酸的蛋白或多肽或其结构域。在一些实施方式中,CRISPR-Cas效应子蛋白可以是酶(例如核酸酶、内切核酸酶、切口酶等)或其部分,和/或可作为酶发挥功能。在一些实施方案中,CRISPR-Cas效应子蛋白是指CRISPR-Cas核酸酶多肽或其结构域,其包含核酸酶活性或其中核酸酶活性已被降低或消除,和/或包含切口酶活性或其中切口酶已被降低或消除,和/或包含单链DNA切割活性(ssDNAse活性)或其中ssDNAse活性已被降低或消除,和/或包含自加工RNAse活性或其中自加工RNAse活性已被降低或消除。CRISPR-Cas效应子蛋白可以与靶核酸结合。
在一些实施方案中,CRISPR-Cas效应子蛋白可包括、但不限于Cas9、C2c1、C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5核酸酶,任选地其中CRISPR-Cas效应子蛋白可以是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c效应子蛋白。
在一些实施方案中,可用于本发明的CRISPR-Cas效应子蛋白可在其核酸酶活性位点(例如RuvC、HNH,例如Cas12a核酸酶结构域的RuvC位点,例如Cas9核酸酶结构域的RuvC位点和/或HNH位点)包含突变。在其核酸酶活性位点具有突变、因此不再包含核酸酶活性的CRISPR-Cas效应子蛋白通常被称为“无活力的(dead)”,例如dCas。在一些实施方案中,与无突变的相同CRISPR-Cas效应子蛋白(例如切口酶,例如Cas9切口酶、Cas12a切口酶)相比,在其核酸酶活性位点中具有突变的CRISPR-Cas效应子蛋白结构域或多肽可具有受损的活性或降低的活性。
可用于本发明的CRISPR Cas9效应子蛋白或CRISPR Cas9效应结构域可以是任何已知的或以后鉴定的Cas9核酸酶。在一些实施方案中,CRISPR Cas9多肽可以是来自例如链球菌属某些种(Streptococcus spp.)(例如化脓性链球菌(S.pyogenes)、嗜热链球菌(S.thermophilus))、乳杆菌属某些种(Lactobacillus spp.)、双歧杆菌属某些种(Bifidobacterium spp.)、坎德勒氏菌某些种(Kandleria spp.)、明串珠菌属某些种(Leuconostoc spp.)、酒球菌属某些种(Oenococcus spp.)、片球菌属某些种(Pediococcusspp.)、魏斯氏菌属某些种(Weissella spp.)和/或欧陆森氏菌属某些种(Olsenella spp.)的Cas9多肽。示例性的Cas9序列包括、但不限于SEQ ID NO:59-60的氨基酸序列或者SEQ IDNO:61-71的多核苷酸序列。
在一些实施方案中,CRISPR-Cas效应子蛋白可以是源自化脓性链球菌的Cas9多肽,其识别PAM序列基序NGG、NAG、NGA(Mali等人,Science 2013;339(6121):823-826)。在一些实施方案中,CRISPR-Cas效应子蛋白可以是来源于嗜热链球菌的Cas9多肽,其识别PAM序列基序NGGNG和/或NNAGAAW(W=A或T)(参见例如Horvath等人,Science,2010;327(5962):167-170,以及Deveau等人,J Bacteriol 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应子蛋白可以是源自变形链球菌(Streptococcus mutans)的Cas9多肽,其识别PAM序列基序NGG和/或NAAR(R=A或G)(参见例如Deveau等人,J BACTERIOL 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应子蛋白可以是源自金黄色葡萄球菌(Streptococcus aureus)的Cas9多肽,其识别PAM序列基序NNGRR(R=A或G)。在一些实施方案中,CRISPR-Cas效应子蛋白可以是源自金黄色葡萄球菌(S.aureus)的Cas9蛋白,其识别PAM序列基序N GRRT(R=A或G)。在一些实施方案中,CRISPR-Cas效应子蛋白可以是源自金黄色葡萄球菌的Cas9多肽,其识别PAM序列基序N GRRV(R=A或G)。在一些实施方案中,CRISPR-Cas效应子蛋白可以是源自脑膜炎奈瑟氏球菌(Neisseria meningitidis)的Cas9多肽,其识别PAM序列基序N GATT或N GCTT(R=A或G,V=A、G或C)(参见,例如Hou等人,2013,1-6)。在上述实施方案中,N可以是任何核苷酸残基,例如A、G、C或T中的任一个。在一些实施方案中,CRISPR-Cas效应子蛋白可以是源自沙氏纤毛菌(Leptotrichia shahii)的Cas13a蛋白,其识别单个3’A、U或C的原间隔区侧翼序列(PFS)(或RNA PAM(rPAM))序列基序,所述序列基序可以位于靶核酸内。
在一些实施方案中,CRISPR-Cas效应子蛋白可源自Cas12a,其是V型成簇的规律间隔的短回文重复序列(CRISPR)-Cas核酸酶(参见例如SEQ ID NO:1-20)。Cas12a在几个方面不同于更广为人知的II型CRISPR Cas9核酸酶。例如,Cas9识别位于其引导RNA(gRNA、sgRNA、crRNA、crDNA、CRISPR阵列)结合位点(原间隔区、靶核酸、靶DNA)3’的富含G的原间隔区邻近基序(PAM)(3’-NGG),而Cas12a识别位于靶核酸5’的富含T的PAM(5’-TTN、5’-TTTN)。事实上,Cas9和Cas12a结合其引导RNA的方向与它们的N和C末端几乎相反。此外,Cas12a酶使用单引导RNA(gRNA,CRISPR阵列,crRNA),而不是天然Cas9***中发现的双引导RNA(sgRNA(例如crRNA和tracrRNA)),并且Cas12a加工其自身的gRNA。另外,Cas12a核酸酶活性产生交错的DNA双链断裂,而不是由Cas9核酸酶活性产生的平端,并且Cas12a依赖于单个RuvC结构域来切割两条DNA链,而Cas9利用HNH结构域和RuvC结构域来切割。
可用于本发明的CRISPR Cas12a效应子蛋白/结构域可以是任何已知或后来鉴定的Cas12a多肽(以前称为Cpf1)(参见,例如美国专利第9,790,490号,就其中Cpf1(Cas12a)序列的公开内容将其通过引用并入本文)。术语“Cas12a”、“Cas12a多肽”或“Cas12a结构域”是指包含Cas12a多肽或其片段的RNA引导的核酸酶,其包含Cas12a的引导核酸结合结构域和/或Cas12a的活性、无活性或部分活性的DNA切割结构域。在一些实施方案中,可用于本发明的Cas12a可在核酸酶活性部位(例如Cas12a结构域的RuvC位点)中包含突变。在其核酸酶活性部位具有突变并因此不再包含核酸酶活性的Cas12a结构域或Cas12a多肽通常被称为deadCas12a(例如dCas12a)。在一些实施方案中,在其核酸酶活性部位中具有突变的Cas12a结构域或Cas12a多肽可能具有受损的活性,例如可能具有切口酶活性。
任何可用于碱基编辑的脱氨酶结构域/多肽都可以用于本发明。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见,例如美国专利第10,167,457号和Thuronyi等人Nat.Biotechnol.37:1070-1079(2019),其中每一篇都就其胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此,在一些实施方案中,可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域,催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶(包括但不限于灵长类动物(例如人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠)的变体。因此,在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶具有约70%至约100%同一性(例如与天然存在的胞嘧啶脱氨酶具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,以及其中的任何范围或数值)。
在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白B mRNA编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、人活化诱导脱氨酶(hAID)、rAPOBEC1、FERNY和/或CDA1,任选地是pmCDA1、atCDA1(例如At2g 19570)及其进化形式(例如SEQ ID NO:27,SEQ ID NO:28或SEQ ID NO:29)。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:23的氨基酸序列的APOBEC1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:24的氨基酸序列的APOBEC3A脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是CDA1脱氨酶,任选地是具有SEQ ID NO:25的氨基酸序列的CDA1。在一些实施方案中,胞嘧啶脱氨酶可以是FERNY脱氨酶,任选地是具有SEQ ID NO:26的氨基酸序列的FERNY。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如进化的脱氨酶)的氨基酸序列具有约70%至约100%同一性(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性)。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25或SEQ ID NO:26的氨基酸序列具有约70%至约99.5%同一性(例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%同一性)(例如与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29的氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性)。在一些实施方案中,可以为了在植物中表达而对编码胞嘧啶脱氨酶的多核苷酸进行密码子优化,并且经密码子优化的多肽可与参考多核苷酸具有约70%至99.5%同一性。
在一些实施方案中,本发明的核酸构建体还可编码尿嘧啶糖基化酶抑制剂(UGI)(例如尿嘧啶-DNA糖基化酶抑制剂)多肽/结构域。因此,在一些实施方案中,编码CRISPR-Cas效应子蛋白和胞嘧啶脱氨酶结构域(例如编码包含与胞嘧啶脱氨酶结构域融合的CRISPR-Cas效应子蛋白结构域,和/或与肽标签或能够结合肽标签的亲和多肽融合的CRISPR-Cas效应子蛋白结构域,和/或与肽标签或能够结合肽标签的亲和多肽融合的脱氨酶蛋白结构域的融合蛋白)的核酸构建体还可编码尿嘧啶-DNA糖基化酶抑制剂(UGI),任选地其中可以对UGI进行密码子优化用于在植物中表达。在一些实施方案中,本发明提供了包含CRISPR-Cas效应多肽、脱氨酶结构域和UGI的融合蛋白和/或编码其的一种或多种多核苷酸,任选地,其中可以对所述一种或多种多核苷酸进行密码子优化以用于在植物中表达。在一些实施方案中,本发明提供了融合蛋白,其中可将CRISPR-Cas效应多肽、脱氨酶结构域和UGI与本文所述的肽标签和亲和多肽的任意组合融合,从而将脱氨酶结构域和UGI募集到CRISPR-Cas效应多肽和靶核酸。在一些实施方案中,可将引导核酸与募集RNA基序连接,并且可将一个或多个脱氨酶结构域和/或UGI与能够与募集RNA基序相互作用的亲和多肽融合,从而将脱氨酶结构域和UGI募集到靶核酸上。
可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-DNA糖基化酶碱基-切除修复酶的任何蛋白质。在一些实施方案中,UGI结构域包含野生型UGI或其片段。在一些实施方案中,可用于本发明的UGI结构域可以与天然存在的UGI结构域的氨基酸序列具有约70%至约100%同一性(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性,以及其中的任何范围或数值)。在一些实施方案中,UGI结构域可包含SEQ ID NO:41的氨基酸序列或与SEQ ID NO:41的氨基酸序列具有约70%至约99.5%序列同一性(例如与SEQ ID NO:41的氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性)的多肽。例如,在一些实施方案中,UGI结构域可包含SEQ ID NO:41的氨基酸序列的片段,所述片段与SEQ ID NO:41的氨基酸序列的一部分连续核苷酸(例如10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个连续核苷酸;例如约10、15、20、25、30、35、40、45个至约50、55、60、65、70、75、80个连续核苷酸)具有100%同一性。在一些实施方案中,UGI结构域可以是已知UGI(例如SEQ ID NO:41)的变体,其与已知UGI具有约70%至约99.5%序列同一性(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%序列同一性,以及其中的任何范围或数值)。在一些实施方案中,可以对编码UGI的多核苷酸进行密码子优化以用于在植物(例如植物)中表达,并且所述经密码子优化的多肽可与参考多核苷酸具有约70%至约99.5%同一性。
可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是来自任何生物体的任何已知的或后来鉴定的腺嘌呤脱氨酶(参见,例如美国专利第10,113,163号,其就其腺嘌呤脱氨酶的公开内容通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨。在一些实施方案中,腺嘌呤脱氨酶可以分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶可以催化DNA中腺嘌呤或腺苷的水解脱氨。在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶可在靶核酸的有义(例如“+”;模板)链中产生A→G转换或在靶核酸的反义(如“-”,互补)链中产生T→C转换。
在一些实施方案中,腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此,在一些实施方案中,腺苷脱氨酶可以与野生型腺嘌呤脱氨酶具有约70%至100%同一性(例如与天然存在的腺嘌吟脱氨酶具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,以及其中的任何范围或数值)。在一些实施方案中,所述脱氨酶不是天然存在的,并且可以被称为工程化的、突变的或进化的腺苷脱氨酶。因此,例如,工程化的、突变的或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域具有约70%至99.9%同一性(例如与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域具有约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%同一性,以及其中的任何范围或数值)。在一些实施方案中,腺苷脱氨酶可以来自细菌(例如大肠杆菌、金黄色葡萄球菌、流感嗜血杆菌(Haemophilus influenzae)、新月柄杆菌(Caulobacter crescentus)等)。在一些实施方案中,可以对编码腺嘌呤脱氨酶多肽/结构域的多核苷酸进行密码子优化以用于在植物中表达。
在一些实施方案中,腺嘌呤脱氨酶结构域可以是野生型tRNA特异性腺苷脱氨酶结构域,例如tRNA特异性腺苷脱氨酶(TadA)和/或突变/进化的腺苷脱氨酶结构域,例如突变/进化的tRNA特异性腺苷脱氨酶结构域(TadA*)。在一些实施方案中,TadA结构域可来自大肠杆菌。在一些实施方案中,TadA可以被修饰,例如被截短,可以相对于全长TadA缺失一个或多个N-末端和/或C-末端氨基酸(例如可以相对于全长TadA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N-末端和/或C-末端氨基酸残基)。在一些实施方案中,TadA多肽或TadA结构域不包含N-末端甲硫氨酸。在一些实施方案中,野生型大肠杆菌TadA包含SEQ ID NO:30的氨基酸序列。在一些实施方案中,突变/进化的大肠杆菌TadA*包含SEQID NO:31-40(例如SEQ ID NO:31、32、33、34、35、36、37、38、39或40)的氨基酸序列。在一些实施方案中,可以对编码TadA/TadA*的多核苷酸进行密码子优化以用于植物中表达。
胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体),引起基因组中C至T的转换或互补链内G至A的转换。因此,在一些实施方案中,由本发明的多核苷酸编码的胞嘧啶脱氨酶在靶核酸的有义(例如“+”;模板)链中产生C→T的转换或在靶核酸的反义(如“-”,互补)链中产生G→A的转换。
在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶在靶核酸的有义(例如“+”;模板)链中产生A→G的转换或在靶核酸的反义(如“-”,互补)链中产生T→C的转换。
编码包含序列特异性DNA结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的本发明核酸构建体,以及编码它们的核酸构建体/表达盒/载体,可以与引导核酸组合用于修饰靶核酸,包括但不限于在靶核酸中产生C→T或G→A突变,所述靶核酸包括但不限于质粒序列;在编码序列中产生C→T或G→A突变以改变氨基酸身份;在编码序列中产生C→T或G→A突变以产生终止密码子;在编码序列中产生C→T或G→A突变以破坏起始密码子;在基因组DNA中产生点突变以产生截短的CKX多肽。
编码包含序列特异性DNA结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的本发明的核酸构建体,以及编码它们的表达盒和/或载体可以与引导核酸组合用于修饰靶核酸,包括但不限于在靶核酸中产生A→G或T→C突变,所述靶核酸包括但不限于质粒序列;在编码序列中产生A→G或T→C突变以改变氨基酸身份;在编码序列中产生A→G或T→C突变以产生终止密码子;在编码序列中产生A→G或T→C突变以破坏起始密码子;在基因组DNA中产生点突变以破坏功能;和/或在基因组DNA中产生点突变以破坏剪接点。
包含CRISPR-Cas效应子蛋白或其融合蛋白的本发明核酸构建体可与引导RNA(gRNA、CRISPR阵列、CRISPR RNA、crRNA)组合使用,以修饰靶核酸,所述引导RNA被设计成与编码的CRISPR-Cas效应子蛋白或结构域一起发挥作用。可用于本发明的引导核酸包含至少一个间隔区序列和至少一个重复序列。引导核酸能够与由本发明的核酸构建体编码和表达的CRISPR-Cas核酸酶结构域形成复合物,并且所述间隔区序列能够与靶核酸杂交,从而将复合物(例如CRISPR-Cas效应子融合蛋白(例如与脱氨酶结构域融合的CRISPR-Cas效应子结构域,和/或与肽标签或亲和多肽融合的CRISPR-Cas效应子结构域,以募集脱氨酶结构域和任选地UGI)引导至靶核酸,其中靶核酸可以被脱氨酶结构域修饰(例如切割或编辑)或调节(例如调节转录)。
例如,编码与胞嘧啶脱氨酶结构域连接的Cas9结构域(例如融合蛋白)的核酸构建体可与Cas9引导核酸组合使用,以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨化,从而编辑靶核酸。在另一个实例中,编码与腺嘌呤脱氨酶结构域连接的Cas9结构域(例如融合蛋白)的核酸构建体可与Cas9引导核酸组合使用,以修饰靶核酸,其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨化,从而编辑靶核酸。
同样,编码与胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域连接的Cas12a结构域(或其他选定的CRISPR-Cas核酸酶,例如C2c1、C2c3、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5)(例如融合蛋白)的核酸构建体可与Cas12a引导核酸(或用于其它选定的CRISPR-Cas核酸酶的引导核酸)组合使用,以修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨化,从而编辑所述靶核酸。
如本文中所用,“指导/引导核酸”、“指导/引导RNA”、“gRNA”、“CRISPR RNA/DNA”、“crRNA”或“crDNA”意指包含至少一个与靶DNA互补(并与之杂交)的间隔区序列(例如原间隔区)和至少一个重复序列(例如V型Cas12a CRISPR-Cas***的重复序列,或其片段或部分;II型Cas9 CRISPR-Cas***的重复序列,或其片段;V型C2c1CRISPR Cas***的重复序列或其片段;例如C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)和/或Csf5的CRISPR-Cas***的重复序列或其片段)的核酸,其中重复序列可与间隔区序列的5’末端和/或3’末端连接。本发明的gRNA的设计可以基于I型、II型、III型、IV型、V型或VI型CRISPR-Cas***。
在一些实施方案中,Cas12a gRNA可以从5’至3’包含重复序列(全长或其部分(“柄(handle)”);例如假结样结构)和间隔区序列。
在一些实施方案中,引导核酸可包含不止一个重复序列-间隔区序列(例如2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个重复序列-间隔区序列)(例如重复序列-间隔区序列-重复序列,例如重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列-重复序列-间隔区序列,等等)。本发明的引导核酸是合成的、人造的和不是在自然界中发现的。gRNA可以相当长,可以用作适体(如在MS2募集策略中那样)或其他从间隔区垂悬的RNA结构。
如本文中所用,“重复序列”是指例如野生型CRISPR Cas基因座(例如Cas9基因座、Cas12a基因座、C2c1基因座等)的任何重复序列或与本发明核酸构建体编码的CRISPR-Cas效应子蛋白一起发挥功能的合成crRNA的重复序列。可用于本发明的重复序列可以是CRISPR-Cas基因座(例如I型、II型、III型、IV型、V型或VI型)的任何已知或后来鉴定的重复序列,或者其可以是被设计成在I型、II型、III型、IV型、V型或VI型CRISPR-Cas***中起作用的合成重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中,重复序列可以在其5’末端形成假结样结构(即,“柄”)。因此,在一些实施方案中,重复序列可以与来自野生型I型CRISPR-Cas基因座、II型CRISPR-Cas基因座、III型CRISPR-Cas基因座、IV型CRISPR-Cas基因座、V型CRISPR-Cas基因座和/或VI型CRISPR-Cas基因座的重复序列相同或实质性相同。来自野生型CRISPR-Cas基因座的重复序列可以通过已建立的算法,诸如使用通过CRISPRdb提供的CRISPRfinder(参见,Grissa等人Nucleic Acids Res.35(网络服务器发行):W52-7)来确定。在一些实施方案中,重复序列或其部分在其3’末端与间隔区序列的5’末端连接,从而形成重复序列-间隔区序列(例如引导核酸、引导RNA/DNA、crRNA、crDNA)。
在一些实施方案中,重复序列包含至少10个核苷酸,或基本上由至少10个核苷酸组成,或由至少10个核苷酸组成,这取决于具体的重复序列和包含该重复序列的引导核酸被加工还是未被加工(例如约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50至100个或更多个核苷酸,或其中的任何范围或数值)。在一些实施方案中,重复序列包含约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸,基本由其组成,或由其组成。
与间隔区序列的5’末端连接的重复序列可以包含重复序列的一部分(例如野生型重复序列的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个或更多个连续核苷酸)。在一些实施方案中,与间隔区序列的5’末端连接的重复序列的一部分在长度上可以是约5至约10个连续核苷酸(例如约5、6、7、8、9、10个核苷酸),并且与野生型CRISPR Cas重复核苷酸序列的相同区域(例如5’末端)具有至少90%序列同一性(例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)。在一些实施方案中,重复序列的一部分可在其5’末端包含假结样结构(例如“柄”)。
本文所用的“间隔区序列”是与靶核酸(例如靶DNA)(例如原间隔区)(例如CKX基因的连续核苷酸的一部分)互补的核苷酸序列,其中所述CKX基因(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽。间隔区序列可以与靶核酸完全互补或实质性互补(例如至少约70%(例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高)互补)。在一些实施方案中,与靶核酸相比,所述间隔区序列可具有一个、两个、三个、四个或五个错配,所述错配可以是连续的或不连续的。在一些实施方案中,间隔区序列可以与靶核酸具有70%的互补性。在其他实施方案中,间隔区核苷酸序列可以与靶核酸具有80%的互补性。在其他实施方案中,间隔区核苷酸序列可与靶核酸(原间隔区)具有85%、90%、95%、96%、97%、98%、99%或99.5%的互补性等。在一些实施方案中,间隔区序列与靶核酸100%互补。间隔区序列可具有约15个核苷酸至约30个核苷酸(例如15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸,或其中的任何范围或数值)的长度。因此,在一些实施方案中,间隔区序列可以在靶核酸(例如原间隔区)的长度为至少约15个核苷酸至约30个核苷酸的区域上具有完全互补性或实质性互补性。在一些实施方案中,所述间隔区的长度约为20个核苷酸。在一些实施方案中,所述间隔区的长度为约21个、22个或23个核苷酸。
在一些实施方案中,引导核酸的间隔区序列的5’区域可以与靶DNA相同,而所述间隔区的3’区域可以与靶DNA(例如V型CRISPR-Cas***)实质性互补,或者引导核酸的间隔区序列的3’区域可与靶DNA相同,而所述间隔区的5’区域可以与靶DNA(例如II型CRISPR-Cas***)实质性互补,因此,间隔区序列与靶DNA的总体互补性可以小于100%。因此,例如,在V型CRISPR-Cas***的引导核酸中,例如20个核苷酸的间隔区序列的5’区域(即,种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔区序列的3’区中的其余核苷酸与靶DNA实质性互补(例如至少约70%互补)。在一些实施方案中,间隔区序列5’末端的前1至8个核苷酸(例如前1、2、3、4、5、6、7、8个核苷酸以及其中的任何范围)可以与靶DNA 100%互补,而间隔区序列3’区域的其余核苷酸与靶DNA实质性互补(例如至少约50%(例如50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高)互补)。
作为另外的实例,在II型CRISPR-Cas***的引导核酸中,例如20个核苷酸的间隔区序列的3’区域(即种子区)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔区序列的5’区域中的其余核苷酸与靶DNA实质性互补(例如至少约70%互补)。在一些实施方案中,间隔区序列3’端的前1至10个核苷酸(例如前1、2、3、4、5、6、7、8、9、10个核苷酸以及其中的任何范围)可以与靶DNA 100%互补,而间隔区序列5’区中的其余核苷酸与靶DNA实质性互补(例如至少约50%(例如至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或其中的任何范围或数值)互补)。
在一些实施方案中,间隔区的种子区长度可为约8至约10个核苷酸,长度可为约5至约6个核苷酸,或长度可为约6个核苷酸。
如本文中所用,“靶核酸”、“靶DNA”、“靶核苷酸序列”、“靶区域”或“基因组中的靶区域”是指植物基因组中与本发明的引导核酸中的间隔区序列完全互补(100%互补)或实质性互补(例如至少70%(例如70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高)互补)的区域。对CRISPR-Cas***有用的靶区域可以紧邻生物体基因组(例如植物基因组)中PAM序列的3’(例如V型CRISPR-Cas***)或5’(例如II型CRISPR-Cas***)。靶区域可以选自紧邻PAM序列定位的至少15个连续核苷酸(例如16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸等)的任何区域。
“原间隔区序列”是指靶双链DNA,特别地指与CRISPR重复-间隔区序列(例如引导核酸、CRISPR阵列、crRNA)的间隔区序列完全互补或实质性互补(并杂交)的靶DNA的部分(例如或基因组中的靶区域)。
在V型CRISPR-Cas(例如Cas12a)***和II型CRISPR-Cas(Cas9)***的情况下,原间隔区序列侧接(例如紧邻)原间隔区邻近基序(protospacer adjacent motif,PAM)。对于IV型CRISPR-Cas***,PAM位于非靶链的5’末端和靶链的3’末端(例如参见下文)。
5'-NNNNNNNNNNNNNNNNNNN-3'RNA间隔区(SEQ ID NO:42)
||||||||||||||||||||
3'AAANNNNNNNNNNNNNNNNNNN-5'靶链(SEQ ID NO:43)
||||
5'TTTNNNNNNNNNNNNNNNNNNN-3'非靶链(SEQ ID NO:44)
在II型CRISPR-Cas(例如Cas9)***的情况下,PAM紧邻靶区域的3’。I型CRISPR-Cas***的PAM位于靶链的5’。III型CRISPR-Cas***没有已知的PAM。Makarova等人描述了CRISPR***的所有类别、类型和亚型的命名法(Nature Reviews Microbiology13:722-736(2015))。指导结构和PAM描述于R.Barrangou(GenomeBiol.16:247(2015))描述。
典型的Cas12a PAM富含T。在一些实施方案中,典型的Cas12aPAM序列可以是5’-TTN、5’-TTTN或5’-TTTV。在一些实施方案中,典型的Cas9(例如化脓性链球菌)PAM可以是5’-NGG-3’。在一些实施方案中,可以使用非典型的PAM,但是可能效率更低一些。
本领域技术人员可以通过已建立的实验和计算方法确定其他PAM序列。因此,例如,实验方法包括靶向两侧为所有可能的核苷酸序列的序列,并鉴定不经历靶向的序列成员,诸如通过靶质粒DNA的转化(Esvelt等人2013.Nat.Methods 10:1116-1121;Jiang等人2013.Nat.Biotechnol.31:233-239)。在一些方面,计算方法可包括对天然间隔区进行BLAST检索以鉴定噬菌体或质粒中的原始靶DNA序列,并比对这些序列以确定邻近靶序列的保守序列(Briner和Barrangou 2014.Appl.Environ.Microbiol.80:994-1001;Mojica等人2009.Microbiology 155:733-740)。
在一些实施方案中,本发明提供了包含本发明核酸构建体(例如本发明编辑***的一个或多个组分)的表达盒和/或载体。在一些实施方案中,可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中,编码碱基编辑器的本发明的核酸构建体(例如包含CRISPR-Cas效应子蛋白和脱氨酶结构域的构建体(例如融合蛋白))或用于碱基编辑的组分(例如与肽标签或亲和多肽融合的CRISPR-Cas效应子蛋白,与肽标签或亲和多肽融合的脱氨酶结构域,和/或与肽标签或亲和多肽融合的UGI),可以包含在与包含所述一种或多种引导核酸的表达盒或载体相同的表达盒或载体上或者分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含引导核酸的表达盒或载体分开的表达盒或载体上时,可以例如在提供(例如与靶核酸接触)包含引导核酸的表达盒之前、与之同时或之后,将靶核酸以彼此之间的任何顺序与编码碱基编辑器或用于碱基编辑的组分的表达盒或载体和引导核酸接触(例如与其一起提供)。
如本领域已知的,本发明的融合蛋白可包含序列特异性核酸结合结构域、CRISPR-Cas多肽和/或与肽标签或与肽标签相互作用的亲和多肽融合的脱氨酶结构域,用于将脱氨酶募集到靶核酸。募集方法还可包括与RNA募集基序和脱氨酶(其与能够与RNA募集基序相互作用的亲和多肽融合)连接的引导核酸,从而将脱氨酶募集到靶核酸上。或者,化学相互作用可用于将多肽(例如脱氨酶)募集到靶核酸处。
可用于本发明的肽标签(例如表位)可包括、但不限于GCN4肽标签(例如Sun标签)、c-Myc亲和标签、HA亲和标签、His亲和标签、S亲和标签、甲硫氨酸-His亲和标签、RGD-His亲和标签、FLAG八肽、strep标签或strep标签II、V5标签和/或VSV-G表位。在一些实施方案中,肽标签还可以包括由SH2结构域识别的特定序列环境中的磷酸化酪氨酸、包含由14-3-3蛋白识别的磷酸丝氨酸的特征性共有序列、由SH3结构域、PDZ蛋白相互作用结构域或PDZ信号序列识别的富含脯氨酸的肽基序、以及来自植物的AGO钩基序。肽标签公开于WO2018/136783和美国专利申请公开号2017/0219596中,其中关于肽标签的公开内容通过引用并入本文。任何可以与多肽连接并且存在可以与另一多肽连接的相应亲和多肽的表位可以作为肽标签与本发明一起应用。肽标签可以包含肽标签的一个拷贝或者2个或多个拷贝,或以肽标签的1个拷贝或者2个或多个拷贝(例如多聚肽标签或多聚表位)(例如约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、9、20、21、22、23、24或25个或更多个肽标签)存在。当多聚化时,肽标签可以直接彼此融合,或者它们可以通过一个或多个氨基酸(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个氨基酸,任选地约3至约10个、约4至约10个,约5至约10个、约5至约15个或约5至约20个氨基酸等等,以及其中的任何值或范围)彼此连接。在一些实施方案中,与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中,所述抗体可以是scFv抗体。在一些实施方案中,与肽标签结合的亲和多肽可以是合成的(例如针对亲和相互作用进行进化),包括但不限于亲和体(affibody)、anticalin、单抗体(monobody)和/或DARPin(参见例如Sha等人,Protein Sci.26(5):910-924(2017));Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013)),美国专利第9,982,053号,就与亲和体、抗anticalin、单抗体和/或DARPin相关的教导将它们均通过引用整体并入本文。肽标签序列及其亲和多肽的实例包括、但不限于氨基酸序列SEQ ID NO:45-47。
在一些实施方案中,引导核酸可与RNA募集基序连接,待募集的多肽(例如脱氨酶)可与和所述RNA募集基序结合的亲和多肽融合,其中所述引导核酸与靶核酸结合,并且所述RNA募集基序与亲和多肽结合,从而将多肽募集到引导核酸处,并使靶核酸与所述多肽(例如脱氨酶)接触。在一些实施方案中,两种或更多种多肽可被募集到引导核酸处,从而使靶核酸与两种或更多种多肽(例如脱氨酶)接触。示例性RNA募集基序及其亲和多肽包括但不限于SEQ ID NO:48-58的序列。
在一些实施方案中,与亲和多肽融合的多肽可以是逆转录酶,引导核酸可以是与RNA募集基序连接的延伸的引导核酸。在一些实施方案中,RNA募集基序可以位于延伸的引导核酸的延伸部分的3’末端(例如5’-3’,重复序列-间隔区-延伸的部分(RT模板-引物结合位点)-RNA募集基序)。在一些实施方案中,RNA募集基序可以被嵌入延伸的部分。
在本发明的一些实施方案中,可将延伸的引导RNA和/或引导RNA与一个或两个或更多个RNA募集基序(例如1、2、3、4、5、6、7、8、9、10个或更多个基序,例如至少10至约25个基序)连接,任选地,其中所述两个或更多个RNA募集基序可以是相同的RNA募集基序或是不同的RNA募集基序。在一些实施方案中,RNA募集基序和相应的亲和多肽可以包括、但不限于端粒酶Ku结合基序(例如Ku结合发夹)和相应的亲和多肽Ku(例如Ku异二聚体)、端粒酶Sm7结合基序和相应的亲和多肽Sm7、MS2噬菌体操纵子茎环和相应的亲和多肽MS2衣壳蛋白(MCP)、PP7噬菌体操纵子茎环和相应的亲和多肽PP7衣壳蛋白(PCP)、SfMu噬菌体Com茎环和相应的亲和多肽Com RNA结合蛋白、PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF),和/或合成的RNA-适体和适体配体作为相应的亲和多肽。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是MS2噬菌体操纵子茎环和亲和多肽MS2衣壳蛋白(MCP)。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF)。
在一些实施方案中,用于募集多肽和核酸的组分可以是通过化学相互作用起作用的那些组分,包括但不限于:雷帕霉素诱导的FRB-FKBP的二聚化;生物素-链霉抗生物素蛋白;SNAP标签;Halo标签;CLIP标签;由化合物诱导的DmrA-DmrC异二聚体;双功能配体(例如两种蛋白结合化学物质融合在一起,例如二氢叶酸还原酶(DHFR))。
在一些实施方案中,被优化以在植物中表达的本发明的核酸构建体、表达盒或载体可以与包含相同多核苷酸(但其未针对在植物中表达而进行过密码子优化)的核酸构建体、表达盒或载体具有约70%至100%(例如约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)同一性。
本文还提供了包含本发明的一种或多种多核苷酸、引导核酸、核酸构建体、表达盒或载体的细胞。
本发明的核酸构建体(例如包含序列特异性核酸结合结构域、CRISPR-Cas效应子结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸的构建体,等等)以及包含其的表达盒/载体可以用作本发明的编辑***,用于修饰靶核酸和/或其表达。
可以使用本发明的多肽、多核苷酸、核糖核蛋白(RNP)、核酸构建体、表达盒和/或载体修饰(例如突变,例如碱基编辑、切割、缺刻等)任何植物或植物部分(或植物分组,例如属或更高级的分类)的靶核酸,包括被子植物、裸子植物、单子叶植物、双子叶植物、C3、C4、CAM植物、苔藓植物、蕨类植物和/或拟蕨类植物、微藻和/或大型藻类。可以如本文所述进行修饰的植物和/或植物部分可以是任何植物物种/品种/栽培品种的植物和/或植物部分。在一些实施方案中,可以如本文所述进行修饰的植物是单子叶植物。在一些实施方案中,可以如本文所述进行修饰的植物是双子叶植物。
如本文中所用,术语“植物部分”包括、但不限于繁殖组织(例如花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花芽、胚珠、种子、胚、坚果、果仁、果穗、穗轴和果壳);营养组织(例如叶柄、茎(stem)、根、根毛、根尖、髓、胚芽鞘、茎(stalk)、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶);维管组织(例如韧皮部和木质部);特化细胞,诸如表皮细胞、薄壁细胞、厚角细胞、厚壁细胞、气孔、保卫细胞、角质层、叶肉细胞;愈伤组织;和插枝。术语“植物部分”还包括植物细胞,包括在植物和/或植物部分中完整的植物细胞、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等。如本文中所用,“芽”是指包括叶和茎在内的地上部分。如本文中所用,术语“组织培养物”包括组织、细胞、原生质体和愈伤组织的培养物。
如本文中所用,“植物细胞”是指植物的结构和生理单位,其通常包括细胞壁,但也包括原生质体。本发明的植物细胞可呈分离的单细胞形式,或者可以是培养的细胞,或者可以是更高组织化单位的一部分,例如植物组织(包括愈伤组织)或植物器官。在一些实施方案中,植物细胞可以是藻类细胞。“原生质体”是没有细胞壁或只有部分细胞壁的分离的植物细胞。因此,在本发明的一些实施方案中,包含本发明核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞,包括但不限于根细胞、叶细胞、组织培养物细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的一些方面,植物部分可以是植物种质。在一些方面,植物细胞可以是不能再生为植物的非繁殖植物细胞。
“植物细胞培养物”意指植物单位例如原生质体、细胞培养细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、合子和不同发育阶段的胚的培养物。
如本文中所用,“植物器官”是植物的独特且可见地结构化和分化的部分,例如根、茎、叶、花蕾或胚。
如本文中所用,“植物组织”是指组织成结构和功能单位的一群植物细胞。包括在植物中或培养中的任何植物组织。该术语包括、但不限于完整植物、植物器官、植物种子、组织培养物和组织化成结构和/或功能单位的任何植物细胞群。该术语在结合上面列出的或以其它方式由本定义包含的任何特定类型的植物组织使用时,或者在不提及上面列出的或以其它方式由本定义包含的任何特定类型的植物组织而使用时,并不意图排除任何其他类型的植物组织。
在本发明的一些实施方案中,提供了转基因组织培养物或转基因植物细胞培养物,其中所述转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中,可以通过将所述转基因植物与非转基因植物杂交,并在后代中选择包含所需基因编辑但不包含用于产生所述编辑的转基因的植物,从由所述转基因组织或细胞发育的植物中消除所述转基因。
任何含有能够调节植物中的细胞***素平衡以有利于活性细胞***素的内源性CKX基因的植物都可以如本文所述进行修饰,以提高植物的产量(例如增加的种子数量,增加的种子大小,增加的荚数,或与以增加的密度种植对照植物相比,由于本发明植物的种植密度增加而引起的产量性状改善)。
可以如本文所述进行修饰的植物的非限制性实例可包括、但不限于草坪草(turfgrasses)(例如早熟禾(bluegrass)、翦股颖(bentgrass)、黑麦草(ryegrass)、羊茅草(fescue))、羽状苇草(feather reed grass)、丛生毛草(tufted hair grass)、芒草(miscanthus)、芦竹(arundo)、柳枝稷(switchgrass)、蔬菜作物(vegetable crops),包括洋蓟(artichokes)、大头菜(kohlrabi)、芝麻菜(arugula)、韭菜(leeks)、芦笋(asparagus)、莴苣(lettuce)(例如结球莴苣(head lettuce)、散叶莴苣(leaf lettuce)、长叶莴苣(romaine lettuce))、暗绿叶黄体芋(malanga)、瓜类(例如甜瓜(muskmelon)、西瓜(watermelon)、克伦肖瓜(crenshaw)、白兰瓜(honeydew)、罗马甜瓜(cantaloupe))、油菜作物(cole crops)(例如球芽甘蓝(brussels sprouts)、卷心菜(cabbage)、花椰菜(cauliflower)、西兰花(broccoli)、羽衣甘蓝(collards)、无头甘蓝(kale)、大白菜(chinese cabbage)、小白菜(bok choy))、刺菜蓟(cardoni)、胡萝卜、纳帕(napa)、秋葵(okra)、洋葱(onions)、芹菜(celery)、欧芹(parsley)、鹰嘴豆(chick peas)、欧洲萝卜(parsnips)、菊苣(chicory)、辣椒(peppers)、马铃薯、葫芦科植物(cucurbits)(例如西葫芦(marrow)、黄瓜(cucumber)、密生西葫芦(zucchini)、倭瓜(squash)、南瓜(pumpkin)、蜜瓜(honeydew melon)、西瓜(watermelon)、罗马甜瓜(cantaloupe))、水萝卜(radishes)、干球洋葱(dry bulb onions)、芜菁甘蓝(rutabaga)、茄子(eggplant)、婆罗门参(salsify)、宽叶苦苣(escarole)、青葱(shallots)、菊苣(endive)、大蒜(garlic)、菠菜(spinach)、大葱(green onions)、南瓜(squash)、绿叶蔬菜(greens)、甜菜(beet)(糖用甜菜(sugarbeet)和饲料用甜菜(fodder beet))、甘薯(sweet potatoes)、牛皮菜(chard)、山葵(horseradish)、番茄、芜菁(turnips)和香料(spices);水果作物,诸如苹果、杏(apricots)、樱桃(cherries)、油桃(nectarines)、桃(peaches)、梨(pears)、李子(plums)、梅子(prunes)、樱桃(cherry)、榅桲(quince)、无花果(fig)、坚果(例如栗子(chestnuts)、山核桃(pecans)、开心果(pistachios)、榛子(hazelnuts)、开心果(pistachios)、花生(peanuts)、核桃(walnuts)、澳洲坚果(macadamia nuts)、杏仁(almonds)等)、柑橘(例如克莱门氏小柑橘(clementine)、金橘(kumquat)、橙子(orange)、葡萄柚(grapefruit)、橘子(tangerine)、柑橘(mandarin)、柠檬(lemon)、酸橙(lime)等)、蓝莓(blueberries)、黑树莓(black raspberries)、波森莓(boysenberries)、蔓越莓(cranberries)、醋栗果(currants)、醋栗(gooseberries)、罗甘莓(loganberries)、覆盆子(raspberries)、草莓(strawberries)、黑莓(blackberries)、葡萄(酿酒葡萄(wine grapes)和鲜食葡萄(tablegrapes))、鳄梨(avocados)、香蕉(bananas)、奇异果(kiwi)、柿子(persimmons)、石榴(pomegranate)、菠萝(pineapple)、热带水果(tropical fruits)、梨果(pomes)、甜瓜(melon)、芒果(mango)、木瓜(papaya)和荔枝(lychee),大田作物诸如三叶草(clover)、苜蓿(alfalfa)、梯牧草(timothy)、月见草(evening primrose)、草地泡沫(meadow foam)、玉米/玉蜀黍(大田玉米(field corn)、甜玉米(sweet corn)、爆米花(popcorn))、啤酒花(hops)、霍霍巴(jojoba)、荞麦(buckwheat)、红花(safflower)、藜麦(quinoa)、小麦、水稻、大麦、黑麦、小米、高粱、燕麦、黑小麦(triticale)、高粱(sorghum)、烟草、木棉(kapok)、豆科植物(豆类(例如四季豆(green bean)和干燥的豆(dried bean))、扁豆(lentils)、豌豆(peas)、大豆(soybeans))、油料植物(油菜(rape)、油菜(canola)、芥菜(mustard)、罂粟(poppy)、橄榄(olive)、向日葵(sunflower)、椰子(coconut)、蓖麻油植物(castor oilplant)、可可豆(cocoa bean)、落花生(groundnut)、油棕(oil palm))、浮萍(duckweed)、拟南芥(Arabidopsis)、纤维植物(棉花、亚麻(flax)、***(hemp)、黄麻(jute))、***(Cannabis)(例如***(Cannabis sativa)、印度***(Cannabis indica)和莠草***(Cannabis ruderalis))、樟科(lauraceae)(肉桂(cinnamon)、樟脑(camphor))或诸如咖啡、甘蔗(sugar cane)、茶和天然橡胶植物等植物;和/或花坛植物,诸如开花植物、仙人掌(cactus)、肉质植物(succulent plant)等和/或观赏植物(例如玫瑰(roses)、郁金香(tulips)、紫罗兰(violets)),以及诸如森林树木(阔叶树(broad-leaved trees)和常绿植物(evergreens),诸如针叶树(conifers);例如榆树(elm)、白蜡树(ash)、橡树(oak)、枫树(maple)、冷杉(fir)、云杉(spruce)、雪松(cedar)、松树(pine)、桦树(birch)、柏树(cypress)、桉树(eucalyptus)、柳树(willow))以及灌木(shrubs)和其他苗木等树木。在一些实施方案中,本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰玉米、大豆、小麦、芸苔、水稻、番茄、辣椒或向日葵。
在一些实施方案中,可以如本文所述进行修饰的植物可包括但不限于玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、糖用甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、甘薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜或芸苔属某些种(例如欧洲油菜(B.napus)、甘蓝(B.oleracea)、芜菁(B.rapa)、芥菜型油菜(B.juncea)和/或黑芥(B.nigra))。在一些实施方案中,可以如本文所述进行修饰的植物是大豆(即Glycinemax)。
因此,根据本发明优先处理的植物或植物栽培品种包括通过遗传修饰获得遗传物质的所有植物,所述遗传物质赋予这些植物特别有利的有用特性(“性状”)。此类特性的实例是更好的植物生长、活力、胁迫耐受性、站立能力、抗倒伏性、营养吸收、植物营养和/或产量,特别是改善的生长、对高温或低温的增强的耐受性、对干旱或者水或土壤盐度水平的增强的耐受性、增强的开花性能、更容易收获、加速成熟、更高产量、收获产品的更高品质和/或更高营养价值、收获产品的更好储存寿命和/或可加工性。
此类性质的进一步实例是对动物和微生物害虫,诸如对昆虫、蛛形类、线虫类、螨虫类、蛞蝓和蜗牛的增强的抗性,这归因于例如植物中形成的毒素。在编码赋予对此类动物和微生物害虫(特别是昆虫)的耐受性的蛋白质的DNA序列中,将特别提及来自苏云金芽孢杆菌(Bacillus thuringiensis)的编码Bt蛋白质的遗传物质,其广泛描述于文献中并且为本领域技术人员所熟知。还将提及从细菌诸如发光杆菌属(Photorhabdus)中提取的蛋白质(WO97/17432和WO98/08932)。具体而言,将提及Bt Cry或VIP蛋白质,其包括CrylA、CryIAb、CryIAc、CryIIA、CryIIIA、CryIIIB2、Cry9c Cry2Ab、Cry3Bb和CryIF蛋白或其毒性片段,以及还有其杂合体或组合,尤其是CrylF蛋白或衍生自CrylF蛋白质的杂合体(例如杂合CrylA-CrylF蛋白或其毒性片段)、CrylA型蛋白或其毒性片段,优选地,CrylAc蛋白或衍生自CrylAc蛋白的杂合体(例如杂合CrylAb-CrylAc蛋白)或CrylAb或Bt2蛋白或其毒性片段、Cry2Ae、Cry2Af或Cry2Ag蛋白或其毒性片段、CrylA.105蛋白或其毒性片段、VIP3Aa19蛋白、VIP3Aa20蛋白、COT202或COT203棉花事件中产生的VIP3A蛋白、如Estruch等人(1996),ProcNatl Acad Sci USA.28;93(11):5389-94中所描述的VIP3Aa蛋白或其毒性片段、如WO2001/47952中所述的Cry蛋白、来自致病杆菌属(Xenorhabdus)(如WO98/50427中所述的)、沙雷氏菌属(Serratia)(特别是来自嗜虫沙雷氏菌(S.entomophila))或发光杆菌属(Photorhabdus)物种菌株的杀虫蛋白,诸如WO98/08932中所述的来自发光杆菌属的Tc蛋白。此外,在某些氨基酸(1-10个,优选1-5个)上不同于任何上述序列(特别是它们的毒性片段的序列)或者与转运肽(诸如质体转运肽)或另一种蛋白质或肽融合的这些蛋白质中任一种的任何变体或突变体,也包括在本文中。
此类性质的另一个特别强调的实例是赋予对一种或多种除草剂(例如咪唑啉酮类、磺酰脲类、草甘膦或草胺膦)的耐受性。在编码赋予转化的植物细胞和植物对某些除草剂的耐受性的蛋白质的DNA序列(即目标多核苷酸)中,将特别提及WO2009/152359中描述的bar或PAT基因或天蓝色链霉菌(Streptomyces coelicolor)基因(所述基因赋予对草铵膦除草剂的耐受性)、编码合适的EPSPS(5-烯醇丙酮酰莽草酸-3-磷酸合酶)的基因(其赋予对以EPSPS为靶标的除草剂,特别是诸如草甘膦及其盐等除草剂的耐受性)、编码草甘膦-n-乙酰基转移酶的基因或编码草甘膦氧化还原酶的基因。其他合适的除草剂耐受性性状包括至少一种ALS(乙酰乳酸合酶)抑制剂(例如WO2007/024782)、突变的拟南芥ALS/AHAS基因(例如美国专利6,855,533)、编码赋予对2,4-D(2,4-二氯苯氧基乙酸)耐受性的2,4-D-单加氧酶的基因和编码赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性的麦草畏单加氧酶的基因。
此类性质的进一步实例是对植物病原性真菌、细菌和/或病毒的增强的抗性,这归因于例如***获得性抗性(SAR)、***素、植物抗毒素、诱发剂(elicitor)以及还有抗性基因和相应地表达的蛋白质和毒素。
可以根据本发明优先处理的转基因植物或植物栽培品种中特别有用的转基因事件包括事件531/PV-GHBK04(棉花,昆虫控制,于WO2002/040677中描述的),事件1143-14A(棉花,昆虫控制,未保藏,于WO2006/128569中描述的);事件1143-51B(棉花,昆虫控制,未保藏,于WO2006/128570中描述的);事件1445(棉花,除草剂耐受性,未保藏,于US-A 2002-120964或WO2002/034946中描述);事件17053(水稻,除草剂耐受性,以PTA-9843保藏,于WO2010/117737中描述的);事件17314(水稻,除草剂耐受性,以PTA-9844保藏,于WO2010/117735中描述的);事件281-24-236(棉花,昆虫控制-除草剂耐受性,以PTA-6233保藏,于WO2005/103266或US-A 2005-216969中描述的);事件3006-210-23(棉花,昆虫控制-除草剂耐受性,以PTA-6233保藏,于US-A 2007-143876或WO2005/103266中描述的);事件3272(玉米,品质性状,以PTA-9972保藏,于WO2006/098952或US-A 2006-230473中描述的);事件33391(小麦,除草剂耐受性,以PTA-2347保藏,于WO2002/027004中描述的),事件40416(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-11508保藏,于WO 11/075593中描述的);事件43A47(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-11509保藏,于WO2011/075595中描述的);事件5307(玉米,昆虫控制,以ATCC PTA-9561保藏,于WO2010/077816中描述的);事件ASR-368(翦股颖,除草剂耐受性,以ATCC PTA-4816保藏,于US-A 2006-162007或WO2004/053062中描述的);事件B16(玉米,除草剂耐受性,未保藏,于US-A 2003-126634中描述的);事件BPS-CV127-9(大豆,除草剂耐受性,以NCIMB号41603保藏的,于WO2010/080829中描述的);事件BLRl(欧洲油菜,雄性不育的恢复,NCIMB 41193保藏,于WO2005/074671中描述的),事件CE43-67B(棉花,昆虫控制,以DSMACC2724保藏的,于US-A 2009-217423或WO2006/128573中描述的);事件CE44-69D(棉花,昆虫控制,未保藏,于US-A 2010-0024077中描述的);事件CE44-69D(棉花,昆虫控制,未保藏,于WO2006/128571中描述的);事件CE46-02A(棉花,昆虫控制,未保藏,于WO2006/128572中描述的);事件COT102(棉花,昆虫控制,未保藏,于US-A 2006-130175或WO2004/039986中描述的);事件COT202(棉花,昆虫控制,未保藏,于US-A 2007-067868或WO2005/054479中描述的);事件COT203(棉花,昆虫控制,未保藏,于WO2005/054480中描述的);事件DAS21606-3/1606(大豆,除草剂耐受性,以PTA-11028保藏,于WO2012/033794中描述的),事件DAS40278(玉米,除草剂耐受性,以ATCC PTA-10244保藏,于WO2011/022469中描述的);事件DAS-44406-6/pDAB8264.44.06.l(大豆,除草剂耐受性,以PTA-11336保藏,于WO2012/075426中描述的),事件DAS-14536-7/pDAB8291.45.36.2(大豆,除草剂耐受性,以PTA-11335保藏,于WO2012/075429中描述的),事件DAS-59122-7(玉米,昆虫控制-除草剂耐受性,以ATCC PTA 11384保藏,于US-A 2006-070139中描述的)、事件DAS-59132(玉米,昆虫控制-除草剂耐受性,未保藏,于WO2009/100188中描述的);事件DAS68416(大豆,除草剂耐受性,以ATCC PTA-10442保藏,于WO2011/066384或WO2011/066360中描述的);事件DP-098140-6(玉米,除草剂耐受性,以ATCC PTA-8296保藏,于US-A 2009-137395或WO08/112019中描述的);事件DP-305423-1(大豆,质量性状,未保藏,于US-A 2008-312082或WO2008/054747中描述的);事件DP-32138-1(玉米,杂交***,以ATCC PTA-9158保藏,于US-A 2009-0210970或WO2009/103049中描述的);事件DP-356043-5(大豆,除草剂耐受性,以ATCC PTA-8287保藏,于US-A 2010-0184079或WO2008/002872中描述的);事件EE-I(brinjal,昆虫控制,未保藏,于WO07/091277中描述的);事件Fil 17(玉米,除草剂耐受性,以ATCC 209031保藏,于US-A 2006-059581或WO98/044140中描述的);事件FG72(大豆,除草剂耐受性,以PTA-11041保藏,于WO2011/063413中描述的),事件GA21(玉米,除草剂耐受性,以ATCC 209033保藏,于US-A 2005-086719或WO98/044140中描述的);事件GG25(玉米,除草剂耐受性,以ATCC 209032保藏,于US-A 2005-188434或WO98/044140中描述的);事件GHB119(棉花,昆虫控制-除草剂耐受性,以ATCC PTA-8398保藏,于WO2008/151780中描述的);事件GHB614(棉花,除草剂耐受性,以ATCC PTA-6878保藏,于US-A 2010-050282或WO2007/017186中描述的);事件GJ11(玉米,除草剂耐受性,以ATCC209030保藏,于US-A 2005-188434或WO98/044140中描述的);事件GM RZ13(糖用甜菜,病毒抗性,以NCIMB-41601保藏,于WO2010/076212中描述的);事件H7-l(糖用甜菜,除草剂耐受性,以NCIMB 41158或NCIMB 41159保藏,于US-A 2004-172669或WO2004/074492中描述的);事件JOPLINl(小麦,疾病耐受性,未保藏,于US-A 2008-064032中描述的);事件LL27(大豆,除草剂耐受性,以NCIMB41658保藏,于WO2006/108674或US-A 2008-320616中描述的);事件LL55(大豆,除草剂耐受性,以NCIMB 41660保藏,于WO2006/108675或US-A 2008-196127中描述的);事件LLcotton25(棉花,除草剂耐受性,以ATCC PTA-3343保藏,于WO2003/013224或USA 2003-097687中描述的);事件LLRICE06(水稻,除草剂耐受性,以ATCC 203353保藏,于US 6,468,747或WO2000/026345中描述的);事件LLRice62(水稻,除草剂耐受性,以ATCC20335保藏,于WO2000/026345中描述的),事件LLRICE601(水稻,除草剂耐受性,以ATCCPTA-2600保藏,于US-A 2008-2289060或WO2000/026356中描述的);事件LY038(玉米,品质性状,以ATCC PTA-5623保藏,于US-A 2007-028322或WO2005/061720中描述的);事件MIR162(玉米,昆虫控制,以PTA-8166保藏,于US-A 2009-300784或WO2007/142840中描述的);事件MIR604(玉米,昆虫控制,未保藏,于US-A 2008-167456或WO2005/103301中描述的);事件MON15985(棉花,昆虫控制,以ATCC PTA-2516保藏,于US-A 2004-250317或WO2002/100163中描述的);事件MON810(玉米,昆虫控制,未保藏,于US-A 2002-102582中描述的);事件MON863(玉米,昆虫控制,以ATCC PTA-2605保藏,于WO2004/011601或US-A2006-095986中描述的);事件MON87427(玉米,授粉控制,以ATCC PTA-7899保藏,于WO2011/062904中描述的);事件MON87460(玉米,胁迫耐受性,以ATCC PTA-8910保藏,于WO2009/111263或US-A 2011-0138504中描述的);事件MON87701(大豆,昆虫控制,以ATCC PTA-8194保藏,于US-A 2009-130071或WO2009/064652中描述的);事件MON87705(大豆,品质性状-除草剂耐受性,以ATCC PTA-9241保藏,于US-A 2010-0080887或WO2010/037016中描述的);事件MON87708(大豆,除草剂耐受性,以ATCC PTA-9670保藏,于WO2011/034704中描述的);事件MON87712(大豆,产量,以PTA-10296保藏,于WO2012/051199中描述的),事件MON87754(大豆,品质性状,以ATCC PTA-9385保藏,于WO2010/024976中描述的);事件MON87769(大豆,品质性状,以ATCC PTA-8911保藏,于US-A 2011-0067141或WO2009/102873中描述的);事件MON88017(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-5582保藏,于US-A2008-028482或WO2005/059103中描述的);事件MON88913(棉花,除草剂耐受性,以ATCC PTA-4854保藏,于WO2004/072235或US-A 2006-059590中描述的);事件MON88302(油籽油菜,除草剂耐受性,以PTA-10955保藏,于WO2011/153186中描述的),事件MON88701(棉花,除草剂耐受性,以PTA-11754保藏,于WO2012/134808中描述的),事件MON89034(玉米,昆虫控制,以ATCC PTA-7455保藏,于WO 07/140256或US-A 2008-260932中描述的);事件MON89788(大豆,除草剂耐受性,以ATCC PTA-6708保藏,于US-A 2006-282915或WO2006/130436中描述的);事件MSl1(油籽油菜,授粉控制-除草剂耐受性,以ATCC PTA-850或PTA-2485保藏,于WO2001/031042中描述的);事件MS8(油籽油菜,授粉控制-除草剂耐受性,以ATCC PTA-730保藏,于WO2001/041558或US-A 2003-188347中描述的);事件NK603(玉米,除草剂耐受性,以ATCC PTA-2478保藏,于US-A 2007-292854中描述的);事件PE-7(水稻,昆虫控制,未保藏,于WO2008/114282中描述的);事件RF3(油籽油菜,授粉控制-除草剂耐受性,以ATCC PTA-730保藏,于WO2001/041558或US-A 2003-188347中描述的);事件RT73(油籽油菜,除草剂耐受性,未保藏,于WO2002/036831或US-A 2008-070260中描述的);事件SYHT0H2/SYN-000H2-5(大豆,除草剂耐受性,以PTA-11226保藏,于WO2012/082548中描述的),事件T227-1(糖用甜菜,除草剂耐受性,未保藏,于WO2002/44407或US-A2009-265817中描述的);事件T25(玉米,除草剂耐受性,未保藏,于US-A 2001-029014或WO2001/051654中描述的);事件T304-40(棉花,昆虫控制-除草剂耐受性,以ATCC PTA-8171保藏,于US-A 2010-077501或WO2008/122406中描述的);事件T342-142(棉花,昆虫控制,未保藏,于WO2006/128568中描述的);事件TC1507(玉米,昆虫控制-除草剂耐受性,未保藏,于US-A 2005-039226或WO2004/099447中描述的);事件VIP1034(玉米,昆虫控制-除草剂耐受性,以ATCC PTA-3925保藏,于WO2003/052073中描述的),事件32316(玉米,昆虫控制-除草剂耐受性,以PTA-11507保藏,于WO2011/084632中描述的),事件4114(玉米,昆虫控制-除草剂耐受性,以PTA-11506保藏,于WO2011/084621中描述的),任选地与事件EE-GM1/LL27或事件EE-GM2/LL55(WO2011/063413A2)叠加的事件EE-GM3/FG72(大豆,除草剂耐受性,ATCC登录号PTA-11041),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号PTA-10442,WO2011/066360Al),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号PTA-10442,WO2011/066384Al),事件DP-040416-8(玉米,昆虫控制,ATCC登录号PTA-11508,WO2011/075593Al),事件DP-043A47-3(玉米,昆虫控制,ATCC登录号PTA-11509,WO2011/075595Al),事件DP-004114-3(玉米,昆虫控制,ATCC登录号PTA-11506,WO2011/084621Al),事件DP-032316-8(玉米,昆虫控制,ATCC登录号PTA-11507,WO2011/084632A1)、事件MON-88302-9(油籽油菜,除草剂耐受性,ATCC登录号PTA-10955,WO2011/153186Al),事件DAS-21606-3(大豆,除草剂耐受性,ATCC登录号PTA-11028,WO2012/033794A2),事件MON-87712-4(大豆,品质性状,ATCC登录号PTA-10296,WO2012/051199A2),事件DAS-44406-6(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11336,WO2012/075426Al),事件DAS-14536-7(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11335,WO2012/075429Al),事件SYN-000H2-5(大豆,除草剂耐受性,ATCC登录号PTA-11226,WO2012/082548A2),事件DP-061061-7(油籽油菜,除草剂耐受性,无保藏号可用,WO2012071039Al),事件DP-073496-4(油籽油菜,除草剂耐受性,无保藏号可用,US2012131692),事件8264.44.06.1(大豆,叠加的除草剂耐受性,登录号PTA-11336,WO2012075426A2),事件8291.45.36.2(大豆,叠加的除草剂耐受性,登录号PTA-11335,WO2012075429A2),事件SYHT0H2(大豆,ATCC登录号PTA-11226,WO2012/082548A2),事件MON88701(棉花,ATCC登录号PTA-11754,WO2012/134808Al),事件KK179-2(苜蓿,ATCC登录号PTA-11833,WO2013/003558Al),事件pDAB8264.42.32.1(大豆,叠加的除草剂耐受性,ATCC登录号PTA-11993,WO2013/010094Al),事件MZDT09Y(玉米,ATCC登录号PTA-13025,WO2013/012775Al)。
赋予所述所需性状的基因/事件(例如目标多核苷酸)也可以在转基因植物中彼此组合存在。可以提及的转基因植物的实例是重要的作物植物,诸如谷类(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、糖用甜菜、甘蔗、番茄、豌豆和其他类型的蔬菜、棉花、烟草、油籽油菜(oilseed rape)以及水果植物(水果苹果、梨、柑橘类水果和葡萄),其中特别强调的是玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和油籽油菜。特别强调的性状是植物对昆虫、蛛形类、线虫类、蛞蝓和蜗牛的增强的抗性,以及植物对一种或多种除草剂的增强的抗性。
可根据本发明优先处理的此类植物、植物部分或植物种子的商购可得的实例包括以 RIBROUNDUP/>VT DOUBLE/>VT TRIPLE/>BOLLGARD/>ROUNDUP READY 2/> ROUNDUP2XTENDTM、INTACTA RR2/>VISTIVE/>和/或XTENDFLEXTM商品名销售或分销的商品,诸如植物种子。
现在将参考以下实施例描述本发明。应该理解的是,这些实施例并不旨在限制本发明的权利要求的范围,而是意图作为某些实施方案的示例。技术人员想到的示例性方法的任何变化都落入本发明的范围内。
实施例
实施例1.基因编辑与经编辑植物的选择
使用解除武装的根癌土壤杆菌来引入表达选择性标记和CRISPR-Cas基因编辑组分的T-DNA盒,所述组分被靶向在CKX基因编码序列中产生双链断裂,从而产生CKX敲除。所述T-DNA进一步表达包含选自SEQ ID No.99-113(表1)的间隔区的crRNA。这些间隔区被编程为靶向CKX编码基因。间隔区的不同组合用于产生所需CKX敲除的特定组合,包括CKX1/2/3、CKX1/2/3/4和CKX1/3/5/6,如表2所示。
使用PCR和下一代测序(NGS)来确认预期的遗传变化已经实现。从叶片组织中分离基因组DNA,并在使用被靶向的CKX基因特异的引物的PCR反应中用作模板。随后对扩增产物进行测序和表征,以确认基因变化。SEQ ID NOs:114-284提供了使用本文所述的编辑***实现的突变的实例。表3提供了每个实例编辑以及植物识别号(CEID)、对应于被编辑的CKX基因的被编辑的基因座(表4)、与野生型基因组序列相关的缺失的起始位置和缺失长度。
对感兴趣的第一代编辑事件(E0)进行自交,并从分离群体中选择后代(E1代)。种植和生长在所需CKX基因的编码区中包含框外缺失的E1植物,并收获E2种子。种植E2种子用于表型测试。
表1.大豆中的间隔区序列和被靶向的CKX基因
表2用于靶向大豆中CKX基因的构建体和间隔区
表3大豆中CKX基因内获得的编辑
/>
/>
/>
/>
/>
表4基因座-CKX相关性
基因座 CKX基因 SEQ ID NO:(基因组)
115 1 72
113 2 75
116 3 78
105 4 81
114 5 84
107 6 87
实施例2表型评价E0植物CE20600、CKX2和CKX3敲除
选择E0植物CE20600进行进一步的表型评估。将E0植物自花授粉以产生E1群体,使E1群体中的单个植物自花授粉来产生E2群体。实施例1中描述的CE20600植物在CKX基因(SEQ ID NO:116-118)中具有编辑,其预期敲除基因CKX2(SEQ ID NO:75)和CKX3(SEQ IDNO:78)。
收集的表型数据包括每株植物的节数(植株、主干和分枝)、分枝数、种子数、株高和干种子重量的计数测量。根据这些平均值,计算出每个荚的种子、每个分枝的节数、每个节(植物、主干和分枝)的荚数和100粒种子的重量。当将CE20600(E2代)与转化对照进行比较时,在每荚的平均种子数量上观察到10%水平的统计学显著差异(p=0.06),CE20600植物每荚含有比转化对照更多的种子数量。
在CE20600(E2代)和转化对照之间观察到植株高度的高度统计学显著差异(p<0.05),CE20600植株比转化对照高。在CE20600和转化对照之间,主干上的荚数和主干上的节数也存在统计学差异,其中CE20600植株的荚数增加,主干上的节数增加,后一特征预期由于植株高度的差异而出现。
没有强有力的统计证据表明CE20600和转化对照之间在每株植物的种子数量、分枝数量、节数量或荚数存在差异。
CE20600(E2代)和转化对照之间的100粒种子重量差异具有高度统计学上显著的(p<0.05)差异,其中CE20600的100粒种子重量小于转化对照的100粒种子重量。
这些数据总体表明,当CE20600在田间环境中生长时,敲除CKX2和CKX3的组合可能导致产量增加。
实施例3:CE48101和CE48659的温室表型分析
选择E0植物CE48101和CE48659进行进一步的表型评估,使E0植物进行自花授粉以产生E1群体。实施例1中描述的CE48101植物在CKX基因(SEQ ID NO:165-168)中具有编辑,其预期敲除基因CKX1(SEQ ID NO:72)、CKX3(SEQ ID NO:78)和CKX6(SEQ ID NO:87)。实施例1中描述的CE48659植物在CKX基因(SEQ ID NO:120-122)中具有编辑,其预期敲除基因CKX1(SEQ ID NO:72)、CKX3(SEQ ID NO:78)和CKX5(SEQ ID NO:84)。发现CE48101和CE48659中CKX基因的被编辑等位基因在E1代中分离,从而鉴定了各种编辑组合。
在播种后110天评估E1代的各种表型,并与转化对照植物进行比较,数据总结如下表5。总的来说,CE48101、CE48659和对照植物具有大量的营养生物量(比平时多)和很少的固定荚。
表5:
与野生型对照相比,双尾T检验没有检测到CE48101和CE48659之间的任何显著差异,除了CE48659(CKX1、3;CKX1、3、5;和CKX3、5)家族主干上的节数减少之外。
实施例4:CE28077,敲除CKX1和CKX6的温室表型分析
选择E0植物CE28077进行进一步的表型评估,将E0植物进行自花授粉以产生E1群体。实施例1中描述的CE28077植物在CKX基因(SEQ ID NO:209-211)中具有编辑,预期敲除基因CKX1(SEQ ID NO:72)和CKX6(SEQ ID NO:87)。
在转化对照和CE28077之间,每个荚的平均种子数量没有发现统计学上显著的差异(p值=0.38)。此外,对任何基于产量的性状都没有观察到统计学上的显著增加,包括每株植物的节数(植株、主干和分枝)、分枝数、种子数、株高和干种子重量的计数测量。根据这些平均值,计算转化对照和CE28077之间每荚的种子、每分枝的节数、每节的荚数(植物、主干和分枝)和100粒种子的重量。然而,对于植物上的节数和植物上的分枝数,CE28077的观测值有所增加。这些观察结果表明,CKX1和CKX6的敲除等位基因组合可能会引起结构变化,从而提高总产量,这可以在田间种植环境而不是温室环境中进行评估。
实施例5.CE29267、CE27443和CE29257的温室表型分析
收集了CE29267、CE27443和CE29257的E2群体的表型确定数据。E2群体是通过使E0代自花授粉产生E1群体而产生的。使来自E1群体的单个植物自花授粉以产生E2群体,该群体在温室中进行表型评估。CE29267植物含有经编辑的CKX基因(SEQ ID NO:253-255),使得基因CKX3(SEQ ID NO:78)和CKX4(SEQ ID NO:81)预计被敲除。CE27443植物含有经编辑的CKX基因(SEQ ID NO:268-269),使得基因CKX2(SEQ ID NO:75)和CKX3(SEQ ID NO:78)预计被敲除。CE29257植物含有经编辑的CKX基因(SEQ ID NO:256-260),使得基因CKX2(SEQ IDNO:75)、CKX3(SEQ ID NO:78)和CKX4(SEQ ID NO:81)预计被敲除。
通过将CE29267、CE27443和CE29257与转化对照系进行比较来评估表型。对每株植物的主干节数、荚数(植物、主干和分枝)和每株植物的种子数进行计数测量。此外,还对植株高度进行了定量测量。根据这些数据,计算了两个额外的表型性状用于分析,即主干的每荚种子数和每节荚数。
当将CE29267、CE27443或CE29257与野生型的未被编辑对照进行比较时,没有统计学上显著的证据支持(即,p<0.05)植物总产量或每荚的平均种子数存在差异。
与转化对照相比,CE29267主干上每节的荚数和主干上的总荚数在统计学上显著增加(p值=0.061);然而,这种增加并没有转化为每株植物的荚的总数。关于CE29267,与转化对照相比,分枝上的荚数有强的统计学上显著下降。至于主干上的荚,这种减少可能归因于CE29267种群中高大植物的存在。CE29267分枝上荚的减少转化为与转化对照相比该品系的总荚数较低。
与转化对照相比,没有观察到CE29267、CE27443或CE29257中任一品系的总荚数有统计学显著增加。此外,CE29267、CE27443或CE29257中任何品系与转化对照之间的株高没有统计学上显著的差异;然而,在CE29267(敲除CKX3和CKX4)中有观测证据表明植物习性可能发生结构变化,当植物在田间环境中生长时,其可能会导致产量增加。
实施例6:CKX1、CKX3和CKX6中敲除编辑的温室表型评估
收集CE31532和CE31492的E2群体的表型确定数据。E2群体是通过允许E0植物自花授粉产生E1群体而产生的。允许来自E1群体的单个植物自花授粉以产生E2群体,该群体用于温室中表型评估。CE31532植物包含经编辑的CKX基因SEQ ID NO:199-203,而CE31492植物包含经编辑的CKX基因组SEQ ID NO:204-208。在CE31532和CE31492中的经编辑的CKX基因预计会引起CKX1(SEQ ID NO:72)、CKX3(SEQ ID NO:78)和CKX6(SEQ ID NO:87)三个基因全部被敲除。
通过将CE31532和CE31492与转化对照系进行比较来评估表型。对每株植物的主干节数、荚数(植物、主干和分枝)和每株植物的种子数进行计数测量。此外,还对植株高度进行了定量测量。根据这些数据,计算了两个额外的表型性状用于分析,即主干的每荚种子数和每节荚数。
当将CE31532或CE31492与野生型的未编辑对照进行比较时,每荚的平均种子数量没有统计学上的显著差异(p<0.05)。与野生型的未编辑对照相比,CE31532和CE31492的每株总种子数较低,这一点得到了强有力的统计支持;然而,这种较低的种子数量也被统计上更低的荚数所平衡。
分枝和主干的荚数表明,与对照相比,CE31532和CE31492品系的分枝上的荚数在统计学上显著减少(p值>0.001)。当比较主干上的荚数时,没有观察到荚的这种减少。主干上每个节的平均荚数没有统计学上的显著增加。
观察到统计学上的显著差异,与未编辑的对照相比,CE31532的主干上的节数增加(p值=0.01)。同时,观察到CE31532的高度有统计学上显著的增加(p值=0),这将解释节数的增加。
观察到的结构变化表明,CKX1、CKX3和CKX6的敲除组合可能导致产量变化,这可以在田间环境中测量。
实施例7:CKX1、CKX3、CKX5和CKX6敲除的温室表型评估
选择植物CE48618、CE48108和CE48637进行进一步的表型分析。所有这三种植物都含有所有4个基因CKX1(SEQ ID NO:72)、CKX3(SEQ ID NO:78)、CKX5(SEQ ID NO:84)和CKX6(SEQ ID NO:87)的编辑版本,这些基因预计在这些植物中被敲除。对E0植株CE48618、CE48108和CE48637进行自花授粉,产生E1群体。如实施例1中所述,CE48618植物具有被编辑序列SEQ ID NO:130-137,CE48108具有被编辑序列SEQ ID NO:159-164,CE48637具有被编辑序列SEQ ID NO:123-129。
E1群体在温室内的盆中生长,并在R6阶段进行评估,这个R6阶段是种子已经形成但尚未干燥的生长阶段。R6阶段是绿豆阶段,其中总荚重达到峰值,种子生长处于快速阶段。植物最下面的节上的叶子开始变黄。该阶段是在种子播种后大约110天。
每个基因型的植物数量太少,无法进行统计分析;然而观察到,与野生型的未编辑的对照植物相比,CE48108 E1植物中的分枝数量有减少的趋势,主干上的荚数量有增加的趋势。没有观察到每株植物的种子数量或每荚的种子数量的差异;然而,应该注意的是,样本量非常小。
在CE48108中观察到的结构变化表明,当在田间环境中生长时,敲除CKX1、CKX3、CKX5和CKX6可能导致产量增加。
实施例8:CE20753的温室表型分析
收集CE20753的E2群体的表型确定数据。通过允许E0代自花授粉产生E1群体而产生E2群体。允许来自E1群体的单个植物自花授粉以产生E2群体,该群体在温室中进行表型评估。如实施例1中所述,CE20753含有编辑的CKX基因(SEQ ID NO:114-115),其预期引起CKX1(SEQ ID NO:72)和CKX3(SEQ ID NO:78)的敲除。
通过将CE20753与转化对照系进行比较来评估表型。对每株植物的主干节数、荚数(植物、主干和分枝)和每株植物的种子数进行计数测量。此外,还对植株高度进行了定量测量。根据这些数据,计算了两个额外的表型性状用于分析,即主干的每荚种子数和每节荚数。
与转化对照系相比,CE20753中每荚的平均种子数和每株的种子数的表型值更低,这一点得到了强有力的统计支持。就荚数性状而言,与转化对照相比,CE20753的每株荚总数、主干上每个节的平均荚数或主干上的荚数没有统计学上显著的差异。在CE20753被编辑后代和转化对照之间,在分枝上的荚数或株高方面没有观察到统计学上显著的差异。
实施例9:温室表型分析CE29233
收集了CE29233的E2群体的表型确定数据。E2群体是通过允许E0代自花授粉产生E1群体而产生的。允许来自E1群体的单个植物自花授粉以产生E2群体,该群体在温室中进行表型评估。如实施例1中所述,CE29233包含经编辑的CKX基因(SEQ ID NO:261-267),其预期引起CKX1(SEQ ID NO:72)、CKX3(SEQ ID NO:78)、CKX2(SEQ ID NO:75)和CKX4(SEQ IDNO:81)的敲除。发现CE29233中CKX基因的被编辑等位基因在E1代中分离,从而在评估的E2群体中鉴定出各种编辑组合。
通过将CE29233与转化对照系进行比较来评估表型。对每株植物的主干节数、荚数(植物、主干和分枝)和每株植物种子数进行计数测量。此外,还对植株高度进行了定量测量。根据这些数据,计算了两个额外的表型性状用于分析,即主干的每荚种子数和每节荚数。
观察到与转化对照系相比,在CXK2和CKX4基因中具有编辑的CE29233植物的主干上每节的平均荚数、主干上的荚数和主干上的节数有统计学上显著的增加。这是通过与转化对照进行比较来确定的,并且这些表型的差异显著到0.05水平(p值<=0.01)。
CXK2和CKX4内具有编辑的CE29233植物的分枝上的荚数减少的证据有限(p值=0.094)。
在CKX1、CKX2和CKX4基因中具有编辑的CE29233植物中,有证据表明主干上的节数增加(p值0.00)。然而,有力的证据表明,这些植物表现出每荚平均种子数、每株种子数和分枝上荚数的减少(p值=0.00)。
我们确实发现证据表明在具有CXK2和CKX4缺失的编辑的CE29233植物中主干上的荚数和节数增加,而分枝上的荚数减少的证据有限。然而,植物上的种子数量没有相关的显著差异。
我们还发现证据表明,在CKX1、CKX2和CKX4基因中具有编辑的CE29233植物的主干上节数增加,分枝上荚数减少。
实施例10:温室表型分析CE31638
收集了CE31638的E2群体的表型确定数据。E2群体是通过允许E0代自花授粉产生E1群体而产生的。允许来自E1群体的单个植物自花授粉以产生E2群体,该群体用于在温室中进行表型评估。如实施例1中所述,CE31638包含经编辑的CKX基因(SEQ ID NO:190-196),其预期引起CKX1(SEQ ID NO:72)、CKX3(SEQ ID NO:78)、CKX5(SEQ ID NO:84)和CKX6(SEQID NO:87)的敲除。CE31638中CKX基因的经编辑等位基因在E1代中分离,并且在E2群体中鉴定了这些经编辑的等位基因的各种组合。
通过将CE31638与转化对照系进行比较来评估表型。对每株植物收集主干节数、荚数(植物、主干和分枝)和每株植物的种子数的计数测量值。此外,还对植株高度进行了定量测量。根据这些数据,计算了两个额外的表型性状用于分析,即主干的每荚种子数和每节荚数。
当将CE31638中的各种CKX敲除等位基因组合与野生型的未编辑对照进行比较时,没有统计学上显著的证据表明任何性状在p<0.05水平上增加。对于CKX1、CKX3、CKX5和CKX6敲除组合的主干上每节平均荚数增加的证据非常有限(p值0.156)。对于CKX1、CKX5和CKX6的敲除组合,有证据表明分枝上的荚数和每株的荚数减少(p值分别为0.019和0.021)。
有观测证据表明,CKX1、CKX3、CKX5和CKX6的敲除组合可能会改变主干上每节的平均荚数,与野生型的未编辑对照相比,每株植物的种子数也可能呈上升趋势。此外,两种基因型(例如敲除CKX1、CKX3、CKX5、CKX6,以及敲除CKX1、CKX5和CKX6)在主干上每节的平均荚数和主干上的荚数方面均高于野生型的未编辑对照。总之,这些数据表明CKX1、CKX3、CKX5和CKX6以及CKX1、CKX5和CKX6敲除均可以提高在田间环境中生长时的植物产量。
实施例11:温室苗圃表型评价
将选定的E2种子家族放入温室苗圃中,以增加一组细胞***素氧化酶基因编辑事件的种子。为了利用苗圃的生长,对这些植物进行了单株表型观察。评估的E2种子家族如下表5所示。
在每个家族中,观察到的在事件的不同植株之间最为一致的表型变化包括株高变化、结荚增强、节间长度缩短、分枝数量和位置的变化以及延迟的叶片老化。此外,在比较单个E2家族时,还观察到一些额外的表型变化,包括小叶的数量和每荚的种子数量。
总体而言,这些表型观察是在单株植物水平上进行的。超过一半的E2种子家族产生的种子数量与对照植物相似或更高。然而,由于一些苗圃实践,如苗圃种植设计没有随机化,一些过高的植物进行打顶,以及生长条件的变化,表5中列出的种子数量数据只是用于监测非典型类型(off-type),而不是用于量化或比较。与同一环境中的未编辑/对照植物相比,E2家族CE43708、CE55653和CE59145的种子数量平均增加了5%。
表5.E2种子家族
构建体# E2家族名称 平均种子数/植株 植株数
对照 781 6
PWISE1092 CE43708 956 6
PWISE1336 CE55549 587 6
PWISE1336 CE55634 572 5
PWISE1336 CE55653 820 6
PWISE1336 CE55653 555 5
PWISE1336 CE55704 559 6
PWISE1336 CE55799 645 5
PWISE1336 CE59145 896 6
PWISE1336 CE64036 800 5
PWISE1335 CE48974 496 6
PWISE1335 CE49021 783 5
PWISE1335 CE73381 732 6
PWISE1335 CE76573 764 5
PWISE1335 CE76674 791 5
PWISE1335 CE76755 724 6
前述内容对本发明进行了说明,它们不应被解释为对本发明的限制。本发明由所附权利要求书限定,其中各权利要求的等同方式被包括在其中。

Claims (116)

1.一种植物或其植物部分,其在编码CKX蛋白的至少一个内源性细胞***素氧化酶/脱氢酶(CKX)基因中包含至少一个非天然突变。
2.根据权利要求1所述的植物或其部分,其中所述至少一个非天然突变是碱基取代、缺失和/或***。
3.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个非天然突变导致提前终止密码子。
4.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个非天然突变包括向A、T、G或C的碱基取代。
5.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个非天然突变是至少一个碱基对的缺失或***。
6.根据权利要求5中任一项所述的植物或其部分,其中所述缺失为约1个碱基对、约2、3、4、5、10、20、30、40、50、60、70、80、90或100个连续碱基对至约500、750、1000、1250、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8100、8185个或更多连续碱基对,任选地从3’端起约2800个连续碱基对至约8190个连续碱基对,或从3’端起约650个连续碱基对至约1620个连续碱基对。
7.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个非天然突变导致截短的CKX蛋白。
8.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个非天然突变导致CKX基因的3’端截短,其产生截短的CKX蛋白或不产生蛋白。
9.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个非天然突变导致无效等位基因或是显性负突变。
10.根据前述权利要求中任一项所述的植物或其部分,其中所述内源性CKX基因是编码CKX1蛋白的内源性CKX1基因、编码CKX2蛋白的内源性CKX2基因、编码CKX3蛋白的内源性CKX3基因、编码CKX4蛋白的内源性CKX4基因、编码CKX5蛋白的内源性CKX5基因、或编码CKX6蛋白的内源性CKX6基因,或其任何组合。
11.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个非天然突变是CKX1、CKX2、CKX3、CKX4、CKX5或CKX6基因的至少两个(例如2、3、4、5或6个)内源性CKX基因以任何组合的突变。
12.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个非天然突变是CKX1、CKX2、CKX3、CKX4、CKX5或CKX6基因的内源性CKX基因中的至少三个(例如3、4、5或6个)以任何组合的突变。
13.根据前述权利要求中任一项所述的植物或其部分,其中所述内源突变位于(a)内源性CKX1基因、内源性CKX2基因和内源性CKX3基因中;(b)内源性CKX1基因、内源性CKX3、内源性CKX5基因和内源性CKX6基因中;或(c)内源性CKX1基因、内源性CKX2基因、内源性CKX3基因和内源性CKX4基因中。
14.根据前述权利要求中任一项所述的植物或其部分,其中所述内源性CKX基因是:
CKX1基因,其(a)包含与SEQ ID NO:72或SEQ ID NO:73的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:93的任何一个核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:74的氨基酸序列具有至少80%序列同一性的序列的多肽;
CKX2基因,其(a)包含与SEQ ID NO:75或SEQ ID NO:76的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:94的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:77的氨基酸序列具有至少80%序列同一性的序列的多肽;
CKX3基因,其(a)包含与SEQ ID NO:78或SEQ ID NO:79的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:95的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:80的氨基酸序列具有至少80%序列同一性的序列的多肽;
CKX4基因,其(a)包含与SEQ ID NO:81或SEQ ID NO:82的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:96的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:83的氨基酸序列具有至少80%序列同一性的序列的多肽;
CKX5基因,其(a)包含与SEQ ID NO:84或SEQ ID NO:91的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:97的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:92的氨基酸序列具有至少80%序列同一性的序列的多肽;和/或
CKX6基因,其(a)包含与SEQ ID NO:87或SEQ ID NO:88的核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:98的核苷酸序列具有至少80%序列同一性的区域;和/或(c)编码包含与SEQ ID NO:89的氨基酸序列具有至少80%序列同一性的序列的多肽。
15.根据前述权利要求中任一项所述的植物或其部分,其中与没有所述至少一个非天然突变的植物相比,在至少一个内源性细胞***素氧化酶/脱氢酶(CKX)基因中包含所述至少另一个非天然突变的所述植物表现出改进的产量性状,任选地,其中所述改进的产量性状是增加的种子数量、增加的种子大小;荚数增加;和/或在增加的种植密度下提高的产量或改善的产量性状。
16.根据前述权利要求中任一项所述的植物或其部分,其中所述植物是双子叶植物。
17.根据权利要求1-15中任一项所述的植物或其部分,其中所述植物是单子叶植物。
18.根据前述权利要求中任一项所述的植物或其部分,其中所述植物是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、核桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、树莓、黑树莓或芸苔属植物。
19.根据权利要求1-16中任一项所述的植物或其部分,其中所述植物是大豆。
20.一种植物细胞,其包括编辑***,所述编辑***包括:
(a)CRISPR相关的效应子蛋白;和
(b)引导核酸(gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其包含与所述植物细胞中编码CKX蛋白的内源性靶基因互补的间隔区序列。
21.根据权利要求20所述的植物细胞,其中所述CKX蛋白为CKX1、CKX2、CKX3、CKX4、CKX5或CKX6。
22.根据权利要求20或权利要求21所述的植物细胞,其中所述内源靶基因是内源性CKX1基因、内源性CKX2基因、内源性CKX3基因、内源性CKX4基因、内源性CKX5基因或内源性CKX6基因,或其任意组合。
23.根据权利要求20-22中任一项所述的植物细胞,其中所述编辑***在编码CKX蛋白的内源靶基因中产生突变。
24.根据权利要求20-23中任一项所述的植物细胞,其中所述内源性靶基因包含与SEQID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列,和/或包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域。
25.根据权利要求20-23中任一项所述的植物细胞,其中所述CKX蛋白与氨基酸序列SEQID NO:74、77、80、83、89或92中的任何一个具有至少80%序列同一性。
26.根据权利要求20-25中任一项所述的植物细胞,其中所述引导核酸包含SEQ ID NO:99-113的核苷酸序列中的任一个。
27.一种由权利要求1-19中任一项所述的植物部分或权利要求20-26中任一项所述的植物细胞再生的植物。
28.根据权利要求27所述的植物,其中所述植物包含突变的CKX基因,所述基因包含与SEQ ID NO:114-284中任一个具有至少90%序列同一性的核苷酸序列。
29.根据权利要求27或权利要求28所述的植物,其中与缺乏所述突变CKX基因的对照植物相比,所述植物包括改良的产量性状的表型,任选地,其中所述改良的产量性状是增加的种子数量、增加的种子大小;荚数增加;和/或在增加的种植密度下提高的产量或改善的产量性状。
30.一种植物细胞,其在内源性细胞***素氧化酶/脱氢酶(CKX)基因内包含至少一个非天然突变,导致CKX基因的无效等位基因或敲除,其中所述至少一个非天然突变是使用编辑***引入的碱基取代、碱基***或碱基缺失,所述编辑***包括与所述CKX基因中的靶位点结合的核酸结合结构域。
31.根据权利要求30所述的植物细胞,其中所述内源性CKX基因是CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因,或其任意组合。
32.根据权利要求30或权利要求31所述的植物细胞,其中所述至少一个非天然突变是任何组合(例如CKX1、CKX2、CKX3、CKX4、CKX5或CKX6中的至少两个的任何组合)的至少两个(例如2、3、4、5或6个)不同内源性CKX基因中的突变。
33.根据权利要求30-32中任一项所述的植物细胞,其中所述至少一个非天然突变是(a)内源性CKX1基因、内源性CKX2基因和内源性CKX3基因中的突变;(b)内源性CKX1基因、内源性CKX3、内源性CKX5基因和内源性CKX6基因中的突变;或(c)内源性CKX1基因、内源性CKX2基因、内源性CKX3基因和内源性CKX4基因中的突变。
34.根据权利要求30-33中任一项所述的植物细胞,其中所述内源性CKX基因包含与SEQID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列,包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域,和/或编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任一个具有至少80%同一性的多肽。
35.根据权利要求30-34中任一项所述的植物细胞,其中所述靶位点在所述CKX基因的区域内,所述区域包含与包含以下的序列具有至少80%序列同一性的序列:
(a)SEQ ID NO:72(CKX1)的核苷酸序列中的约核苷酸1884至约核苷酸2060或SEQ IDNO:73(CKX1)的核苷酸序列的约核苷酸28至约核苷酸204(例如SEQ ID NO:93);
(b)SEQ ID NO:75(CKX2)的核苷酸序列的约核苷酸803至约核苷酸955或SEQ ID NO:76(CKX2)的核苷酸序列的约核苷酸38至约核苷酸190(例如SEQ ID NO:94);
(c)SEQ ID NO:78(CKX3)的核苷酸序列的约核苷酸692至约核苷酸826或SEQ ID NO:79(CKX3)的核苷酸序列的约核苷酸35至约核苷酸169(例如SEQ ID NO:95);
(d)SEQ ID NO:81(CKX4)的核苷酸序列的约核苷酸1540至约核苷酸1689或SEQ ID NO:82(CKX4)的核苷酸序列的约核苷酸2至约核苷酸151(例如SEQ ID NO:95);
(e)SEQ ID NO:84(CKX5)的核苷酸序列的约核苷酸690至约核苷酸790或SEQ ID NO:91(CKX5)的核苷酸序列的约核苷酸43至约核苷酸143(例如SEQ ID NO:97);和/或
(f)SEQ ID NO:87的核苷酸序列(CKX6)的约核苷酸1562至约核苷酸1709或SEQ ID NO:88的核苷酸序列(CKX6)的约核苷酸31至约核苷酸178(例如SEQ ID NO:98)。
36.根据权利要求30-35中任一项所述的植物细胞,其中所述编辑***进一步包含核酸酶,并且所述核酸结合结构域结合所述CKX基因中的靶位点,其中所述CKX基因包含与SEQID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列,包含与SEQ ID NOs:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域,和/或编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任一个具有至少80%同一性的多肽,并且所述至少一个非天然突变在被所述核酸酶切割后产生。
37.根据权利要求36所述的植物细胞,其中所述靶位点包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的序列。
38.根据权利要求20-37中任一项所述的植物细胞,其中所述至少一个非天然突变是碱基***和/或碱基缺失。
39.根据权利要求20-38中任一项所述的植物细胞,其中所述至少一个非天然突变是点突变。
40.根据权利要求20-39中任一项所述的植物细胞,其中所述至少一个非天然突变导致截短的CKX蛋白。
41.根据权利要求20-40中任一项所述的植物细胞,其中所述至少一个非天然突变导致CKX基因的3’端截短,其产生截短的蛋白质或不产生蛋白质。
42.根据权利要求20-41中任一项所述的植物细胞,其中所述至少一个非天然突变是无效等位基因或显性负突变。
43.根据权利要求36-42中任一项所述的植物细胞,其中所述核酸酶是锌指核酸酶、转录激活子样效应核酸酶(TALEN)、核酸内切酶(例如Fok1)或CRISPR-Cas效应子蛋白。
44.根据权利要求30-43中任一项所述的植物细胞,其中所述编辑***的核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)、锌指核酸酶、转录激活子样效应核酸酶(TALEN)和/或Argonaute蛋白。
45.根据权利要求20-44中任一项所述的植物细胞,其中所述植物细胞来自玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、树莓、黑树莓或芸苔属植物。
46.根据权利要求20-45中任一项所述的植物细胞,其中所述植物细胞来自大豆。
47.由权利要求1-19中任一项所述的植物部分或权利要求20-46中任一项所述的植物细胞再生的植物。
48.根据权利要求47所述的植物,其中与缺乏所述至少一个非天然突变的植物相比,所述植物表现出改进的产量性状,任选地,其中所述改进的产量性状是增加的种子数量、增加的种子大小;荚数增加;和/或在增加的种植密度下提高的产量或改善的产量性状。
49.一种生产/培育无转基因的经编辑的植物的方法,包括:
使权利要求1-19、47或48中任一项所述的植物与不含转基因的植物杂交,从而将所述至少一个非天然突变引入所述不含转基因的植物中;和
选择包含所述至少一个非天然突变并且不含转基因的后代植物,从而产生不含转基因的经编辑的植物。
50.一种提供具有改进的产量性状的多个植物的方法,所述方法包括在生长区域中种植两株或更多株根据权利要求1-19、47或48中任一项所述的植物,从而提供与不包含所述至少一个非天然突变的多个对照植物相比具有改进的产量性状的多个植物。
51.一种编辑植物细胞基因组中的特定位点的方法,所述方法包括:以位点特异性方式切割所述植物细胞中内源性细胞***素氧化酶/脱氢酶(CKX)基因内的靶位点,其中所述内源性CKX基因:
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或
(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽,从而在所述植物细胞的内源性CKX基因中产生编辑并产生在该内源性CKX基因中包含编辑的植物细胞。
52.根据权利要求51所述的方法,其进一步包含从在所述内源性CKX基因中包含所述编辑的植物细胞再生植物,从而产生在所述内源性CKX基因中包含所述编辑的植物。
53.根据权利要求51或权利要求52所述的方法,其中所述内源性CKX基因是CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因,或其任何组合。
54.根据权利要求51-53中任一项所述的方法,其中在所述内源性CKX基因中包含所述编辑的所述植物在至少两个(例如2、3、4、5或6个)不同的内源性CKX基因中以任何组合(例如CKX1、CKX2、CKX3、CKX4、CKX5或CKX6中的至少两个的任何组合)包含所述编辑。
55.根据权利要求54所述的方法,其中所述编辑是(a)在内源性CKX1基因、内源性CKX2基因和内源性CKX3基因中;(b)在内源性CKX1基因、内源性CKX3、内源性CKX5基因和内源性CKX6基因中;或(c)在内源性CKX1基因、内源性CKX2基因、内源性CKX3基因和内源性CKX4基因中。
56.根据权利要求51-55中任一项所述的方法,其中在所述内源性CKX基因中包含所述编辑的所述植物表现出改进的产量性状,任选地,其中所述改进的产量性状是增加的种子数量、增加的种子大小;荚数增加;和/或在增加的种植密度下提高的产量或改善的产量性状。
57.根据权利要求51-56中任一项所述的方法,其中所述编辑导致非天然突变。
58.根据权利要求57所述的方法,其中所述非天然突变是点突变。
59.根据权利要求57或58所述的方法,其中所述一个非天然突变是碱基***和/或碱基缺失。
60.根据权利要求54-59中任一项所述的方法,其中所述碱基缺失是导致从CKX多肽的C-末端至少约1个氨基酸残基至约540个氨基酸残基(例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、191、192、193、194、195、200、210、220、225、230、240、250、275、300、325、350、400、410、420、430、435、436、437、438、439、440、450、455、460、465、470、475、476、477、478、479、480、485、486、487、488、489、490、495、500、505、510、515、520、521、523、524、525、526、527、528、529、530、531、532、534、535、536、537、538、539或540个氨基酸残基)的C端截短的截短,所述CKX多肽与SEQ ID NO:74、77、80、83、89或92的任何一个氨基酸序列具有至少80%的序列同一性。
61.根据权利要求57-60中任一项所述的方法,其中所述碱基缺失导致CKX基因的3’端截短:
(a)SEQ ID NO:72(CKX1)的核苷酸序列的约核苷酸1884、1885、1890、1895、1900、1950、2000或2050至约核苷酸7399或者SEQ ID NO:73(CKX1)的核苷酸序列的约核苷酸28、29、30、35、40、45、50、60、70、80、90、100、120、140、160、180、190、200、204、205、210、215或220至约核苷酸1632;
(b)SEQ ID NO:75(CKX2)的核苷酸序列的约核苷酸803、804、805、810、820、830、840、850、860、870、880、890、900、910、920、930、940或950至约核苷酸5917,或者SEQ ID NO:76(CKX2)的核苷酸序列的约核苷酸38、39、40、45、50、60、70、80、90、100、120、160或180至约核苷酸1647;
(c)SEQ ID NO:78(CKX3)的核苷酸序列的约核苷酸692、693、694、695、700、710、720、730、740、750、760、770、780、790、800、810或820至约核苷酸5768,或者SEQ ID NO:79(CKX3)的核苷酸序列的约核苷酸35、40、50、60、70、80、90、100、110、120、130、140、150或160至约核苷酸1608;
(d)SEQ ID NO:81(CKX4)的核苷酸序列的约核苷酸1540、1550、1560、1570、1580、1590、1600、1610、1620、1630、1640、1650、1660、1670或1680至约核苷酸9725,或者SEQ ID NO:82(CKX4)的核苷酸序列的约核苷酸2、3、4、5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150至约核酸1575;
(e)SEQ ID NO:84(CKX5)的核苷酸序列的约核苷酸690、700、710、720、730、740、750、780或790至约核苷酸3661,或者SEQ ID NO:91的核苷酸序列(CKX5)的约核苷酸43、44、45、50、60、70、80、90、100、110、120、130或140至约核苷酸1605;和/或
(f)SEQ ID NO:87(CKX6)的核苷酸序列的约核苷酸1562、1563、1564、1565、1570、1580、1590、1600、1620、1640、1660、1680或1700至约核苷酸8277,或者SEQ ID NO:88(CKX6)的核苷酸序列的约核苷酸31、32、33、34、35、40、50、60、70、80、90、100、110、120、130、140、150、160或170至约核苷酸1494(CKX6)。
62.根据权利要求57-61中任一项所述的方法,其中所述非天然突变是无效等位基因。
63.根据权利要求57-62中任一项所述的方法,其中所述非天然突变是显性负突变。
64.一种用于制造植物的方法,包括:
(a)使包含至少一个内源性细胞***素氧化酶/脱氢酶(CKX)基因的植物细胞的群体与靶向所述内源性CKX基因的核酸酶接触,其中所述核酸酶连接到核酸结合域(例如编辑***),所述核酸结合域结合所述至少一个内源性CKX基因中的靶位点,其中所述至少一个内源性CKX基因:
(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(ii)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或
(iii)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽;
(b)从所述群体中选择在所述至少一个内源性CKX基因中包含突变的植物细胞,其中所述突变是取代和/或缺失;和
(c)将所述选择的植物细胞生长成在所述至少一个内源性CKX基因中包含所述突变的植物。
65.根据权利要求64所述的方法,其中所述缺失导致所述内源性CKX基因的无效等位基因;并且生长所选择的植物细胞提供了包含所述内源性CKX基因的无效等位基因的植物。
66.一种用于改善植物或其部分的产量性状的方法,包括:
(a)使包含内源性细胞***素氧化酶/脱氢酶(CKX)基因的植物细胞与靶向所述内源性CKX基因的核酸酶接触,其中所述核酸酶连接与所述内源性CKX基因中的靶位点结合的核酸结合结构域,其中所述内源性CKX基因:
(i)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(ii)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或
(iii)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽;和
(b)将所述植物细胞生长成在所述内源性CKX基因中包含所述突变的植物,从而改善所述植物或其部分的产量性状(例如增加的种子数量,增加的种子大小;荚数增加;产量增加,在增加的种植密度下增加的产量)。
67.一种生产植物或其部分的方法,所述植物或其部分包含在内源性细胞***素氧化酶/脱氢酶(CKX)基因中具有突变的至少一个细胞,所述方法包括使所述植物或植物部分中的内源性CKX基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸酶的核酸结合结构域与所述内源性CKX基因中的靶位点结合,所述内源性CKX基因:
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或
(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽,从而产生包含在所述内源性CKX基因中具有突变的至少一个细胞的植物或其部分。
68.一种生产植物或其部分的方法,所述植物或其部分包括内源性细胞***素氧化酶/脱氢酶(CKX)基因中的突变和改进的产量性状,所述方法包括使所述植物或植物部分中的内源性CKX基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中所述核酸结合结构域与所述内源性CKX基因中的靶位点结合,所述内源性CKX基因:
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或
(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽,从而产生在所述内源性CKX基因中包含突变、并表现出改进的产量性状的植物或其部分。
69.根据权利要求64-68中任一项所述的方法,其中所述内源性CKX基因是内源性CKX1基因、内源性CKX2基因、内源性CKX3基因、内源性CKX4基因、内源性CKX5基因和/或内源性CKX6基因,或其任何组合。
70.根据权利要求64-69中任一项所述的方法,其中所述突变包括在至少两个(例如2、3、4、5或6个)不同的内源性CKX基因中任何组合形式(例如CKX1、CKX2、CKX3、CKX4、CKX5或CKX6中的至少两个的任何组合)的突变。
71.根据权利要求70所述的方法,其中在至少两个(例如2、3、4、5或6个)不同的内源性CKX基因中的突变位于(a)内源性CKX1基因、内源性CKX2基因和内源性CKX3基因中;(b)内源性CKX1基因、内源性CKX3、内源性CKX5基因和内源性CKX6基因中;或(c)内源性CKX1基因、内源性CKX2基因、内源性CKX3基因和内源性CKX4基因中。
72.根据权利要求64-71中任一项所述的方法,其中所述核酸酶切割所述内源性CKX基因,并且将突变引入所述内源性CKX基因中。
73.根据权利要求64-72中任一项所述的方法,其中所述突变是非天然突变。
74.根据权利要求64-73中任一项所述的方法,其中所述突变是取代、***和/或缺失。
75.根据权利要求64-74中任一项所述的方法,其中所述突变是缺失。
76.根据权利要求73-72中任一项所述的方法,其中所述突变导致截短的CKX蛋白。
77.根据权利要求73-76中任一项所述的方法,其中所述突变导致CKX基因的3’端截短,其产生截短的蛋白质或不产生蛋白质。
78.根据权利要求73-77中任一项所述的方法,其中所述突变是所述CKX基因中的缺失,所述缺失导致从所述CKX基因编码的CKX多肽的C末端至少约1个氨基酸残基至约540个连续氨基酸残基的C末端截短,其中所述CKX多肽与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性。
79.根据权利要求64-78中任一项所述的方法,其中所述核酸酶是锌指核酸酶、转录激活子样效应核酸酶(TALEN)、核酸内切酶(例如Fok1)或CRISPR-Cas效应子蛋白。
80.根据权利要求64-79中任一项所述的方法,其中所述核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应子蛋白)、锌指核酸酶、转录激活子样效应核酸酶(TALEN)和/或Argonaute蛋白。
81.根据权利要求64或66-80中任一项所述的方法,其中所述突变是显性负突变、半显性突变、弱的功能丧失突变、低效突变(hypomorphic mutation)或无效突变,任选地其中所述突变是无效突变。
82.根据权利要求64-81中任一项所述的方法,其中与在所述内源性CKX基因中不包含所述突变的对照植物相比,在所述内源性CKX基因中具有突变的所述植物表现出改进的产量性状,任选为增加的种子数、增加的荚数和/或增加的种子重量。
83.根据权利要求64-82中任一项所述的方法,其中所述植物是双子叶植物或单子叶植物。
84.根据权利要求64-83中任一项所述的方法,其中所述植物是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、胡桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、树莓、黑树莓或芸苔属植物。
85.根据权利要求64-84中任一项所述的方法,其中所述植物是大豆。
86.一种通过权利要求64-85中任一项所述的方法生产的植物。
87.一种与细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点结合的引导核酸,所述CKX基因:
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或
(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%同一性的多肽。
88.根据权利要求87所述的引导核酸,其中所述引导核酸包含具有SEQ ID NO:99-113中任一项所述的核苷酸序列的间隔区。
89.一种***,其包含权利要求87或权利要求88的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应子蛋白。
90.根据权利要求89所述的***,其进一步包含与所述引导核酸缔合的tracr核酸和CRISPR-Cas效应子蛋白,任选地,其中所述tracr核酸与所述引导核酸共价连接。
91.一种基因编辑***,其包含与引导核酸缔合的CRISPR-Cas效应子蛋白,其中所述引导核酸包含与细胞***素氧化酶/脱氢酶(CKX)基因结合的间隔区序列。
92.根据权利要求91所述的基因编辑***,其中所述CKX基因:
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或
(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽。
93.根据权利要求91或权利要求92所述的基因编辑***,其中所述引导核酸包含具有SEQ ID NO:99-113中任一所示的核苷酸序列的间隔区序列。
94.根据权利要求91-93中任一项所述的基因编辑***,其进一步包含与所述引导核酸缔合的tracr核酸和CRISPR-Cas效应子蛋白,任选地,其中所述tracr核酸与所述引导核酸共价连接。
95.根据权利要求91-94中任一项所述的基因编辑***,其进一步包含核酸酶,并且在所述核酸酶切割后产生至少一个非天然突变。
96.根据权利要求91-95中任一项所述的基因编辑***,其中所述CKX基因是CKX1基因、CKX2基因、CKX3基因、CKX4基因、CKX5基因和/或CKX6基因,或其任何组合。
97.根据权利要求95或权利要求96所述的基因编辑***,其中所述至少一个非天然突变是在至少两个(例如2、3、4、5或6个)不同的内源性CKX基因中以任何组合(例如CKX1、CKX2、CKX3、CKX4、CKX5或CKX6中的至少两个的任何组合)的突变。
98.根据权利要求97所述的基因编辑***,其中所示在至少两个(例如2、3、4、5或6个)不同的内源性CKX基因中的突变是(a)在CKX1基因、CKX2基因和CKX3基因中;(b)在CKX1基因、CKX3、CKX5基因和CKX6基因中;或(c)在CKX1基因、CKX2基因、CKX3基因和CKX4基因中。
99.一种包含CRISPR-Cas效应子蛋白的复合物,所述CRISPR-Cas效应子蛋白包含切割结构域和引导核酸,其中所述引导核酸结合内源性细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点,其中所述CKX基因:
(a)包含与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的区域;和/或
(c)编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的多肽,其中所述切割结构域切割所示CKX基因中的靶链。
100.一种表达盒,其包含:(a)编码包含切割结构域的CRISPR-Cas效应子蛋白的多核苷酸和(b)与内源性细胞***素氧化酶/脱氢酶(CKX)基因中的靶位点结合的引导核酸,其中所述引导核酸包含与所述内源性CKX基因的一部分互补并结合的间隔区序列,所述内源性CKX基因与SEQ ID NO:72、73、75、76、78、79、81、82、84、87、88或91的核苷酸序列中的任何一个具有至少80%序列同一性,或者编码与SEQ ID NO:74、77、80、83、89或92的氨基酸序列中的任何一个具有至少80%序列同一性的序列,任选地,其中所述间隔区序列与所述内源性CKX基因中与SEQ ID NO:93-98的核苷酸序列中的任何一个具有至少80%序列同一性的部分互补并与之结合。
101.根据权利要求99所述的复合物或根据权利要求100所述的表达盒,其中所述内源性CKX基因是内源性CKX1基因、内源性CKX2基因、内源性CKX3基因、内源性CKX4基因、内源性CKX5基因和/或内源性CKX6基因,或其任意组合。
102.一种核酸,其包含突变的细胞***素氧化酶/脱氢酶(CKX)基因,其中所述突变的CKX基因产生截短的CKX蛋白或不产生蛋白。
103.一种植物或其部分,其包含权利要求99或101所述的复合物、权利要求100或101所述的表达盒和/或权利要求102所述的核酸。
104.根据权利要求103所述的植物或其部分,其中所述植物为玉米、大豆、油菜籽、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、杏仁、核桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜、黑莓、树莓、黑树莓或芸苔属植物。
105.根据权利要求104所述的植物或其部分,其中所述植物是大豆。
106.根据权利要求103-105中任一项所述的植物或其部分,其中所述植物或其部分包含至少一个CKX基因中的突变,并且与不包含所述突变的植物或其部分相比表现出改进的产量性状,任选地,其中所述改进的产量性状是增加的种子数量、增加的种子大小;荚数增加;和/或在增加的种植密度下提高的产量或改善的产量性状。
107.一种大豆植物,其在具有Glyma15g18560、Glyma09g07360、Glyma17g06220、Glyma04g03130、Glyma09g35950和/或Glyma09g07190的基因鉴定号(基因ID)的内源性细胞***素氧化酶/脱氢酶(CKX)基因中具有至少一个非天然突变。
108.一种引导核酸,其与具有Glyma15g18560、Glyma09g07360、Glyma17g06220、Glyma04g03130、Glyma09g35950和/或Glyma09g07190的基因鉴定号(基因ID)的内源性细胞***素氧化酶/脱氢酶(CKX)基因中的靶核酸结合。
109.一种生产植物的方法,所述植物包括内源性细胞***素氧化酶/脱氢酶(CKX)基因中的突变和至少一种感兴趣的多核苷酸,所述方法包括:
使第一植物与包含所述至少一种感兴趣的多核苷酸的第二植物杂交以产生后代植物,其中所述第一植物为权利要求1-19、27-29、47、48或103-107中任一项所述的植物;和
选择包含所述CKX基因中的所述突变和所述至少一种感兴趣的多核苷酸的后代植物,从而产生包含内源性CKX基因中的突变和至少一种所感兴趣的多核苷酸的植物。
110.一种生产植物的方法,所述植物包括内源性CKX基因中的突变和至少一种感兴趣的多核苷酸,所述方法包括
将至少一种感兴趣的多核苷酸引入权利要求1-19、27-29、47、48或103-107中任一项所述的植物中,从而产生包含CKX基因中的突变和至少一种所兴趣的多核苷酸的植物。
111.一种生产植物的方法,所述植物在内源性CKX基因中包含突变并且表现出改进的产量性状、改进的植物结构和/或改进的防御性状的表型,所述方法包括:
使第一植物与第二植物杂交,其中所述第一植物是权利要求1-19、27-29、47、48或103-107中任一项所述的植物,所述第二植物表现出改进的产量性状、改进的植物结构和/或改进的防御性状的表型;和
选择包含所述CKX基因中的所述突变和改进的产量性状、改进的植物结构和/或改进的防御性状的表型的后代植物,从而产生包含内源性CKX基因中的突变、并且与对照植物相比表现出改进的产量性状、改进的植物结构和/或者改进的防御性状的表型的植物。
112.一种控制容器(例如盆或种子托盘等)、生长室、温室、田地、娱乐区、草坪或路边的杂草的方法,包括:
向生长在容器、生长室、温室、田地、娱乐区、草坪或路边的根据权利要求1-19、27-29、47、48或103-107中任一项所述的一个或多个(多个)植物施用除草剂,从而控制其中所述一个或多个植物进行生长的所述容器、生长室、温室、田地、娱乐区、草坪或路边的杂草。
113.一种减少昆虫对植物的捕食的方法,包括向根据权利要求1-19、27-29、47、48或103-107中任一项所述的一个或多个植物施用杀虫剂,从而减少昆虫对所述一个或多个植物的捕食。
114.一种减少植物上真菌病的方法,包括将杀真菌剂施用于根据权利要求1-19、27-29、47、48或103-107中任一项所述的一个或多个植物,从而减少所述一个或多个植物上的真菌病。
115.根据权利要求113或权利要求114所述的方法,其中所述一个或多个植物生长在容器、生长室、温室、田地、娱乐区、草坪中或路边。
116.根据权利要求110-115中任一项所述的方法,其中所述感兴趣的多核苷酸是赋予除草剂耐受性、昆虫抗性、抗病性、增加的产量、增加的养分利用效率或非生物胁迫抗性的多核苷酸。
CN202280027661.6A 2021-02-11 2022-02-10 用于修饰植物中细胞***素氧化酶水平的方法和组合物 Pending CN117441015A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163148439P 2021-02-11 2021-02-11
US63/148,439 2021-02-11
PCT/US2022/015893 WO2022173885A1 (en) 2021-02-11 2022-02-10 Methods and compositions for modifying cytokinin oxidase levels in plants

Publications (1)

Publication Number Publication Date
CN117441015A true CN117441015A (zh) 2024-01-23

Family

ID=80446103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280027661.6A Pending CN117441015A (zh) 2021-02-11 2022-02-10 用于修饰植物中细胞***素氧化酶水平的方法和组合物

Country Status (8)

Country Link
US (1) US20220259612A1 (zh)
EP (1) EP4291641A1 (zh)
CN (1) CN117441015A (zh)
AR (1) AR124859A1 (zh)
BR (1) BR112023015909A2 (zh)
CA (1) CA3210785A1 (zh)
UY (1) UY39631A (zh)
WO (1) WO2022173885A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023052562A1 (en) * 2021-10-01 2023-04-06 Basf Se Wheat plants with an increased yield

Family Cites Families (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US137395A (en) 1873-04-01 Improvement in nuts
US24077A (en) 1859-05-17 Window-sash supporter
US2009A (en) 1841-03-18 Improvement in machines for boring war-rockets
US2010A (en) 1841-03-18 Machine foe
NZ221259A (en) 1986-07-31 1990-05-28 Calgene Inc Seed specific transcriptional regulation
US6040504A (en) 1987-11-18 2000-03-21 Novartis Finance Corporation Cotton promoter
DE68918494T2 (de) 1988-05-17 1995-03-23 Lubrizol Genetics Inc Pflanzliches Ubiquitinpromotorsystem.
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
ATE225853T1 (de) 1990-04-12 2002-10-15 Syngenta Participations Ag Gewebe-spezifische promotoren
US6395966B1 (en) 1990-08-09 2002-05-28 Dekalb Genetics Corp. Fertile transgenic maize plants containing a gene encoding the pat protein
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
WO1993004177A1 (en) 1991-08-27 1993-03-04 Agricultural Genetics Company Limited Proteins with insecticidal properties against homopteran insects and their use in plant protection
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
DE69636637T2 (de) 1995-04-20 2007-08-23 Basf Ag Auf basis ihrer struktur entworfene herbizid-resistente produkte
WO1997017432A1 (en) 1995-11-06 1997-05-15 Wisconsin Alumni Research Foundation Insecticidal protein toxins from photorhabdus
CA2263819A1 (en) 1996-08-29 1998-03-05 Dow Agrosciences Llc Insecticidal protein toxins from photorhabdus
CA2888685C (en) 1997-04-03 2017-05-09 T. Michael Spencer Glyphosate resistant maize lines
IL128165A0 (en) 1997-05-05 1999-11-30 Dow Agrosciences Llc Insecticidal protein toxins from xenorhabdus
AU751438B2 (en) 1998-02-20 2002-08-15 Syngenta Limited Pollen specific promoter
AU1336200A (en) 1998-11-03 2000-05-22 Aventis Cropscience N.V. Glufosinate tolerant rice
US6333449B1 (en) 1998-11-03 2001-12-25 Plant Genetic Systems, N.V. Glufosinate tolerant rice
US6509516B1 (en) 1999-10-29 2003-01-21 Plant Genetic Systems N.V. Male-sterile brassica plants and methods for producing same
US6506963B1 (en) 1999-12-08 2003-01-14 Plant Genetic Systems, N.V. Hybrid winter oilseed rape and methods for producing same
CA2685457A1 (en) 1999-12-28 2001-07-05 Bayer Bioscience N.V. Insecticidal proteins from bacillus thuringiensis
US6395485B1 (en) 2000-01-11 2002-05-28 Aventis Cropscience N.V. Methods and kits for identifying elite event GAT-ZM1 in biological samples
US7166770B2 (en) 2000-03-27 2007-01-23 Syngenta Participations Ag Cestrum yellow leaf curling virus promoters
AR044724A1 (es) 2000-03-27 2005-10-05 Syngenta Participations Ag Promotores del virus de la rizadura amarilla del cestrum
BR122013026754B1 (pt) 2000-06-22 2018-02-27 Monsanto Company Molécula de dna e processos para produzir uma planta de milho tolerante à aplicação do herbicida glifosato
US6713259B2 (en) 2000-09-13 2004-03-30 Monsanto Technology Llc Corn event MON810 and compositions and methods for detection thereof
AU2001293044B2 (en) 2000-09-29 2006-07-13 Monsanto Technology Llc Glyphosate tolerant wheat plant 33391 and compositions and methods for detection thereof
EP1366070A2 (en) 2000-10-25 2003-12-03 Monsanto Technology LLC Cotton event pv-ghgt07(1445) and compositions and methods for detection thereof
AU3089902A (en) 2000-10-30 2002-05-15 Monsanto Technology Llc Canola event pv-bngt04(rt73) and compositions and methods for detection thereof
AR035215A1 (es) 2000-11-20 2004-05-05 Monsanto Technology Llc Polinucleotido aislado, primer y segundo polinucleotido cebador, metodo para detectar el suceso vegetal de algodon 531, molecula de polinucleotido aislado obtenida por dicho metodo, equipo de deteccion de acido nucleico y metodo para determinar la cigosidad del genoma de una planta de algodon.
US7241567B2 (en) 2000-11-30 2007-07-10 Ses Europe N.V./S.A. T227-1 flanking sequence
EG26529A (en) 2001-06-11 2014-01-27 مونسانتو تكنولوجى ل ل سى Prefixes for detection of DNA molecule in cotton plant MON15985 which gives resistance to damage caused by insect of squamous lepidoptera
US6818807B2 (en) 2001-08-06 2004-11-16 Bayer Bioscience N.V. Herbicide tolerant cotton plants having event EE-GH1
AU2002361696A1 (en) 2001-12-17 2003-06-30 Syngenta Participations Ag Novel corn event
AU2003254099A1 (en) 2002-07-29 2004-02-16 Monsanto Technology, Llc Corn event pv-zmir13 (mon863) plants and compositions and methods for detection thereof
GB0225129D0 (en) 2002-10-29 2002-12-11 Syngenta Participations Ag Improvements in or relating to organic compounds
CA2508032C (en) 2002-12-05 2014-09-16 Monsanto Technology Llc Bentgrass event asr-368 and compositions and methods for detection thereof
BRPI0407397B1 (pt) 2003-02-12 2020-04-14 Monsanto Technology Llc métodos de produção de planta de algodão tolerante ao glifosato compreendendo evento mon 88913, de detecção de dna, de determinação de zigosidade de planta de algodão e de controle de ervas daninhas
EA011923B1 (ru) 2003-02-20 2009-06-30 Квс Саат Аг Устойчивое к глифосату растение сахарной свеклы
US7335816B2 (en) 2003-02-28 2008-02-26 Kws Saat Ag Glyphosate tolerant sugar beet
HUE028375T2 (en) 2003-05-02 2016-12-28 Dow Agrosciences Llc TC 1507 corn and a method for detecting it
ATE495264T1 (de) 2003-10-06 2011-01-15 Syngenta Participations Ag In pflanzenplastiden funktionsfähiger promotor
KR100537955B1 (ko) 2003-10-29 2005-12-20 학교법인고려중앙학원 꽃가루 특이적 유전자 발현 프로모터
US7521550B2 (en) 2003-12-01 2009-04-21 Syngenta Participations Ag Insect resistant cotton plants and methods of detecting the same
WO2005054480A2 (en) 2003-12-01 2005-06-16 Syngenta Participations Ag Insect resistant cotton plants and methods of detecting the same
US7157281B2 (en) 2003-12-11 2007-01-02 Monsanto Technology Llc High lysine maize compositions and event LY038 maize plants
PT1708560E (pt) 2003-12-15 2015-06-03 Monsanto Technology Llc Planta de milho mon88017 e composições e métodos para a sua detecção
GB0402106D0 (en) 2004-01-30 2004-03-03 Syngenta Participations Ag Improved fertility restoration for ogura cytoplasmic male sterile brassica and method
EP2289311B1 (en) 2004-03-25 2016-02-10 Syngenta Participations AG. Corn event MIR604
ES2531980T3 (es) 2004-03-26 2015-03-23 Dow Agrosciences Llc Líneas de algodón transgénico Cry1F y Cry1Ac y su identificación específica de evento
AU2005292090B2 (en) 2004-09-29 2011-02-03 Corteva Agriscience Llc Corn event DAS-59122-7 and methods for detection thereof
ES2667677T3 (es) 2005-03-16 2018-05-14 Syngenta Participations Ag Evento de maíz 3272 y métodos para su detección
CA2603944C (en) 2005-04-08 2015-06-23 Bayer Bioscience N.V. Elite event a2704-12 comprising the integration of the phosphinothricin acetyltransferase (pat) gene into soybeans, and methods and kits for identifying such event in biological samples
EP1871901B1 (en) 2005-04-11 2011-06-29 Bayer BioScience N.V. Elite event a5547-127 and methods and kits for identifying such event in biological samples
PT1885176T (pt) 2005-05-27 2016-11-28 Monsanto Technology Llc Evento mon89788 de soja e métodos para a sua deteção
WO2006128568A2 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag T342-142, insecticidal transgenic cotton expressing cry1ab
WO2006128572A1 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag Ce46-02a insecticidal cotton
CN101184847B (zh) 2005-06-02 2015-02-25 先正达参股股份有限公司 表达cry1ab的杀昆虫转基因棉ce43-67b
MX2007014832A (es) 2005-06-02 2008-02-15 Syngenta Participations Ag Algodon transgenico insecticida ce44-69d que expresa cry1ab.
WO2006128569A2 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag 1143-14a, insecticidal transgenic cotton expressing cry1ab
WO2006128570A1 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag 1143-51b insecticidal cotton
EP2295587A1 (en) 2005-08-08 2011-03-16 Bayer BioScience N.V. Herbicide tolerant cotton plants and methods for identifying same
MX2008002616A (es) 2005-08-24 2008-03-14 Pioneer Hi Bred Int Composiciones que proporcionan tolerancia a multiples herbicidas y metodos de uso de las mismas.
WO2007091277A2 (en) 2006-02-10 2007-08-16 Maharashtra Hybrid Seeds Company Limited (Mahyco) TRANSGENIC BRINJAL (SOLANUM MELONGENA) EXPRESSING THE CRYlAC GENE
WO2007140256A1 (en) 2006-05-26 2007-12-06 Monsanto Technology, Llc Corn plant and seed corresponding to transgenic event mon89034 and methods for detection and use thereof
ES2546255T3 (es) 2006-06-03 2015-09-22 Syngenta Participations Ag Evento de Maíz MIR162
US7951995B2 (en) 2006-06-28 2011-05-31 Pioneer Hi-Bred International, Inc. Soybean event 3560.4.3.5 and compositions and methods for the identification and detection thereof
US7928295B2 (en) 2006-08-24 2011-04-19 Bayer Bioscience N.V. Herbicide tolerant rice plants and methods for identifying same
US20080064032A1 (en) 2006-09-13 2008-03-13 Syngenta Participations Ag Polynucleotides and uses thereof
US7928296B2 (en) 2006-10-30 2011-04-19 Pioneer Hi-Bred International, Inc. Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof
PT2078089T (pt) 2006-10-31 2016-08-05 Du Pont Evento de soja dp-305423-1 e composições e métodos para a identificação e/ou deteção deste
WO2008114282A2 (en) 2007-03-19 2008-09-25 Maharashtra Hybrid Seeds Company Limited Transgenic rice (oryza sativa) comprising pe-7 event and method of detection thereof
EA025296B1 (ru) 2007-04-05 2016-12-30 Байер Кропсайенс Н.В. Устойчивые против насекомых растения хлопчатника и способы их идентификации
MX2009013493A (es) 2007-06-11 2010-01-18 Bayer Bioscience Nv Plantas de algodon con tolerancia a insectos que comprenden el evento elite ee-gh6 y metodos para identificarlas.
MX2010005352A (es) 2007-11-15 2010-07-02 Monsanto Technology Llc Plantas y semillas de soya correspondientes al evento transgenico mon87701 y metodos de deteccion del mismo.
US8273535B2 (en) 2008-02-08 2012-09-25 Dow Agrosciences, Llc Methods for detection of corn event DAS-59132
BRPI0908831A2 (pt) 2008-02-14 2015-08-04 Pioneer Hi Bred Int Métodos para identificar o evento e6611.32.1.38 em amostra biológica, para detectar a presença do evento e6611.32.1.38 ou a progênie deste em uma amostra biológica, para detectar a presença de dna correspondente ao evento e6611.32.1.38 em uma amostra, para selecionar sementes com a presença do evento e6611.32.1.38, molécula de dna isolada, sequência de nucleotídeos de primer de dna, par de sequências de dna isoladas, planta, célula, tecido, semente transgênicos ou partes destes contendo dna.
US8692076B2 (en) 2008-02-15 2014-04-08 Monsanto Technology Llc Soybean plant and seed corresponding to transgenic event MON87769 and methods for detection thereof
BRPI0908267B8 (pt) 2008-02-29 2019-02-05 Monsanto Technology Llc método de produção de uma planta de milho tolerante a seca
CA2727430C (en) 2008-06-11 2018-10-02 Dow Agrosciences Llc Constructs for expressing herbicide tolerance genes, related plants, and related trait combinations
US9078406B2 (en) 2008-08-29 2015-07-14 Monsanto Technology Llc Soybean plant and seed corresponding to transgenic event MON87754 and methods for detection thereof
JP5767585B2 (ja) 2008-09-29 2015-08-19 モンサント テクノロジー エルエルシー 大豆遺伝子組換え事象mon87705およびその検出方法
AU2009333348B2 (en) 2008-12-16 2014-08-21 Syngenta Participations Ag Corn event 5307
EP2367414A1 (en) 2008-12-19 2011-09-28 Syngenta Participations AG Transgenic sugar beet event gm rz13
MX355477B (es) 2009-01-07 2018-04-19 Basf Agrochemical Products Bv Soja de evento 127 y metodos relacionados con la misma.
JP5762400B2 (ja) 2009-03-30 2015-08-12 モンサント テクノロジー エルエルシー イネ遺伝子組換え事象17053およびその使用方法
JP5769698B2 (ja) 2009-03-30 2015-08-26 モンサント テクノロジー エルエルシー 遺伝子組換えイネ事象17314およびその使用方法
EP2467010B1 (en) 2009-08-19 2018-11-28 Dow AgroSciences LLC Aad-1 event das-40278-9, related transgenic corn lines, and event-specific identification thereof
DK2478000T3 (en) 2009-09-17 2018-07-16 Monsanto Technology Llc TRANSGEN SOYBEAN EVENT MON 87708 AND PROCEDURES FOR USING IT
CN104969853B (zh) 2009-11-23 2017-10-31 孟山都技术公司 转基因玉米事件mon87427和相对发育尺度
PL2503873T3 (pl) 2009-11-23 2017-09-29 Bayer Cropscience Nv Rośliny soi tolerujące herbicyd i sposoby ich identyfikowania
KR101906605B1 (ko) 2009-11-24 2018-10-10 다우 아그로사이언시즈 엘엘씨 Aad-12 이벤트 416, 관련된 트랜스제닉 대두 계통, 및 이의 이벤트-특이적 확인
BR112012012494A2 (pt) 2009-11-24 2020-11-03 Dow Agrosciences Llc detecção de evento de soja aad-12 416
US8581046B2 (en) 2010-11-24 2013-11-12 Pioneer Hi-Bred International, Inc. Brassica gat event DP-073496-4 and compositions and methods for the identification and/or detection thereof
WO2011084621A1 (en) 2009-12-17 2011-07-14 Pioneer Hi-Bred International, Inc. Maize event dp-004114-3 and methods for detection thereof
WO2011075595A1 (en) 2009-12-17 2011-06-23 Pioneer Hi-Bred International, Inc. Maize event dp-043a47-3 and methods for detection thereof
WO2011084632A1 (en) 2009-12-17 2011-07-14 Pioneer Hi-Bred International, Inc. Maize event dp-032316-8 and methods for detection thereof
US20110154525A1 (en) 2009-12-17 2011-06-23 Pioneer Hi-Bred International, Inc. Maize event DP-040416-8 and methods for detection thereof
EA033088B1 (ru) 2010-06-04 2019-08-30 Монсанто Текнолоджи Ллс Трансгенное событие mon 88302 у вида brassica и способы его применения
WO2012033794A2 (en) 2010-09-08 2012-03-15 Dow Agrosciences Llc Aad-12 event 1606 and related transgenic soybean lines
WO2012051199A2 (en) 2010-10-12 2012-04-19 Monsanto Technology Llc Soybean plant and seed corresponding to transgenic event mon87712 and methods for detection thereof
CA2818918A1 (en) 2010-11-24 2012-05-31 Pioneer Hi-Bred International, Inc. Brassica gat event dp-061061-7 and compositions and methods for the identification and/or detection thereof
US9540656B2 (en) 2010-12-03 2017-01-10 Dow Agrosciences Llc Stacked herbicide tolerance event 8291.45.36.2, related transgenic soybean lines, and detection thereof
UA115766C2 (uk) 2010-12-03 2017-12-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Трансгенна стійка до гербіцидів рослина сої, яка містить пакетовану подію 8264.44.06.1
TWI667347B (zh) 2010-12-15 2019-08-01 瑞士商先正達合夥公司 大豆品種syht0h2及偵測其之組合物及方法
ES2743728T3 (es) 2011-03-30 2020-02-20 Monsanto Technology Llc Evento transgénico MON 88701 del algodón y procedimientos de uso del mismo
BR112013033652A2 (pt) 2011-06-30 2017-01-24 Forage Genetics International Llc planta e semente de alfafa correspondentes ao evento transgênico kk 179-2 e métodos para detecção do mesmo
AU2012280941B2 (en) 2011-07-13 2017-06-22 Dow Agrosciences Llc Stacked herbicide tolerance event 8264.42.32.1, related transgenic soybean lines, and detection thereof
WO2013012643A1 (en) 2011-07-15 2013-01-24 Syngenta Participations Ag Polynucleotides encoding trehalose-6-phosphate phosphatase and methods of use thereof
TW201341394A (zh) 2012-02-01 2013-10-16 Dow Agrosciences Llc 合成之葉綠體輸送胜肽
US20140380526A1 (en) * 2012-02-11 2014-12-25 Thomas Schmülling Disruption of CKX3 and at least one other CKX gene in a plant or plant cell leads to improved traits
CA2954920A1 (en) 2014-07-14 2016-01-21 The Regents Of The University Of California A protein tagging system for in vivo single molecule imaging and control of gene transcription
WO2016020856A2 (en) 2014-08-05 2016-02-11 MabQuest SA Immunological reagents
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
JP7067793B2 (ja) 2015-10-23 2022-05-16 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸塩基編集因子およびその使用
JP7231935B2 (ja) 2016-08-03 2023-03-08 プレジデント アンド フェローズ オブ ハーバード カレッジ アデノシン核酸塩基編集因子およびそれらの使用
WO2018136783A1 (en) 2017-01-20 2018-07-26 The Regents Of The University Of California Targeted gene activation in plants

Also Published As

Publication number Publication date
AR124859A1 (es) 2023-05-10
UY39631A (es) 2022-09-30
EP4291641A1 (en) 2023-12-20
WO2022173885A1 (en) 2022-08-18
CA3210785A1 (en) 2022-08-18
BR112023015909A2 (pt) 2023-11-21
US20220259612A1 (en) 2022-08-18

Similar Documents

Publication Publication Date Title
CN117441015A (zh) 用于修饰植物中细胞***素氧化酶水平的方法和组合物
CN118076742A (zh) 修饰油菜素内酯受体基因以改善产量性状
US11959072B2 (en) Suppression of shade avoidance response in plants
US20230212600A1 (en) Methods for controlling meristem size for crop improvement
US20210395767A1 (en) Methods for controlling meristem size for crop improvement
US20230284577A1 (en) Suppression of shade avoidance response in plants
EP4298118A1 (en) Methods and compositions for modifying root architecture in plants
EP4359516A1 (en) Modification of hect e3 ubiquitin ligase genes to improve yield traits
WO2023205714A1 (en) Methods and compositions for improving yield traits
WO2024054880A1 (en) Methods and compositions for improving yield characteristics in plants
WO2023168217A1 (en) Modification of brassinosteroid receptor genes to improve yield traits
WO2023060028A1 (en) Methods for improving floret fertility and seed yield
WO2023034731A1 (en) Modification of ubiquitin binding peptidase genes in plants for yield trait improvement
WO2023034891A1 (en) Methods and compositions for improving plant architecture and yield traits
WO2023215809A1 (en) Methods and compositions for modifying root architecture and/or improving plant yield traits
US20240060081A1 (en) Methods and compositions for controlling meristem size for crop improvement
WO2023215704A1 (en) Methods and compositions for enhancing yield and disease resistance
US20230116819A1 (en) Methods for improving floret fertility and seed yield
WO2023023496A1 (en) Methods and compositions for modifying cytokinin receptor histidine kinase genes in plants
CN117794358A (zh) 用于增强根系发育的方法和组合物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination