CN101218347A - 产率增加的植物及其制备方法 - Google Patents

产率增加的植物及其制备方法 Download PDF

Info

Publication number
CN101218347A
CN101218347A CNA2006800248227A CN200680024822A CN101218347A CN 101218347 A CN101218347 A CN 101218347A CN A2006800248227 A CNA2006800248227 A CN A2006800248227A CN 200680024822 A CN200680024822 A CN 200680024822A CN 101218347 A CN101218347 A CN 101218347A
Authority
CN
China
Prior art keywords
plant
nucleic acid
polypeptide
wrky
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800248227A
Other languages
English (en)
Other versions
CN101218347B (zh
Inventor
V·弗兰卡德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CropDesign NV
Original Assignee
CropDesign NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CropDesign NV filed Critical CropDesign NV
Publication of CN101218347A publication Critical patent/CN101218347A/zh
Application granted granted Critical
Publication of CN101218347B publication Critical patent/CN101218347B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及通过调节植物中核酸的表达来增加植物产率的方法,所述核酸编码具有两个WRKY结构域的多肽或此类多肽的同源物。一类这样的方法包括向植物中引入两WRKY结构域核酸或其变体。本发明也涉及已向其中引入了两WRKY结构域核酸或其变体的转基因植物,所述植物相对于对照植物产率增加。本发明也涉及在本发明方法中有用的构建体。另外,本发明还涉及编码具有前述植物生长改进活性的前述蛋白质的特定核酸序列、含有所述核酸序列的核酸构建体、载体和植物。

Description

产率增加的植物及其制备方法
发明领域
本发明总体上涉及分子生物学领域,并且涉及相对于对照植物而言增加植物产率的方法。更具体地,本发明涉及增加植物产率的方法,包括调节植物中编码具有两个WRKY结构域的多肽或此类多肽同源物的核酸的表达。本发明还涉及编码具有两个WRKY结构域的多肽或此类多肽同源物的核酸的表达受到调节的植物,所述植物相对于对照植物具有增加的产率。本发明还提供了在本发明方法中有用的构建体。
另外,本发明还涉及编码具有前述植物生长改进活性的前述蛋白质的特定核酸序列、含有所述核酸序列的核酸构建体、载体和植物。
发明背景
不断增加的世界人口和逐渐减少的农用耕地供应迫使人们朝着提高农业效率的方向进行研究。传统的作物和园艺学改良方法利用选育技术来鉴定具有期望性状的植物。然而,此类选育技术有一些缺陷,即这些技术一般为劳动密集型的,而且产生的植物通常包含异质的遗传组分,当这些异质的遗传组分从亲本植物传递时不一定总是产生期望的性状。分子生物学的进展已经允许人类修饰动物和植物的种质。植物基因工程需要分离和操作遗传物质(一般以DNA或RNA的形式)以及随后将遗传物质引入植物。这类技术能够产生具多种改良的经济、农业或园艺性状的作物或植物。一种具有特殊经济利益的性状是产率。产率通常定义为具有经济价值的可测量产出,其必然是与特定作物、面积和/或时期相关的。这可以以数量和/或质量的方式进行定义。产率直接取决于若干因素,如器官的数量和大小、植物构造(例如,分枝的数量)、种子产量等等。根的发育、营养吸收和胁迫耐受性也是决定产率的重要因素。因此优化上述因素之一也可以促进作物产率的增加。
植物生物量为饲料作物如苜蓿、青贮谷物和干草的产率。在谷物作物中使用产率的许多替代参数。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座植物直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等2005 Agric Ecosys & Environ 105:213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula & Tollenaar 2005 Maydica50:39)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组件(如terSteege等2005 Plant Physiology 139:1078),且迄今为止,种种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003 Theoretical Applied Genetics 107:679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的替代参数。
收获指数为种子产率与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产率之间通常能够获得比较稳固的相关性(如Rebetzke等2002 Crop Science 42:739)。这些方法固有地联系在一起,因为大多数谷物生物量取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.Iowa State University Press,pp68-73)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产率的指标(如Tittonell等2005 Agric Ecosys & Environ105:213)。当测试遗传差异对胁迫耐受性的影响时,温室或植物培养室与田地相比具有固有的优势:即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或冠层生长等等,对产率造成的这些人工局限性会限制这些控制环境在测试产率差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产率优势指标的标准方法。
增加植物产率能力将在诸如农业[包括观赏植物的产量]、树木栽培(aboriculture)、园艺学和林业等领域具有许多应用。增加产率,也可以用于在生物反应器中进行藻类生产(用于诸如药物、抗体或疫苗物质的生物技术生产,或用于有机废物的生物转化)及其它这类领域。
转录因子多肽通常定义为表现出序列特异性DNA结合亲和力且能够激活和/或抑制转录的蛋白质。WRKY蛋白质为一个大家族植物特异性转录因子,单独地或者作为多聚体蛋白质-DNA复合物的以部分发挥功能。这些蛋白质大多参与防御各种病原的攻击(Eulgem等,EMBO J.18,1999:4689-4699,Deslandes等,Proc.Natl.Acad.Sci,USA,99,2002:2404-2409,Li等,Plant Cell 16,2004:319-331)。此外,WRKY蛋白质参与应答非生物胁迫如创伤(Yoda等,Mol.Genet.Genomics,267,2002:154-161)、干旱、热和冷(Fowler等,Plant Cell,14,2002:1675-1690,Maré等,Plant Mol.Biol.55,2004:399-416)。已经表明,此家族的有些成员在毛状体的形成(Johnson等,Plant Cell,14,2002:1359-1375)、衰老(Hinderhofer等,Planta,213,2001:469-473,Guo等,Plant Cell Environ.27,2004:521-549)、休眠和代谢通路中起着重要的调控作用。
WRKY蛋白质为多基因家族。在拟南芥(Arabidopsis thaliana)中已知该家族的74个成员(Uelker等,Curr.Op.in Plant Biol.7,2004:491-498)。它们含有至少一个高度保守的WRKY结构域,该结构域通常包括大约60个保守的氨基酸。WRKY结构域在其氨基末端含有标志性的七肽WRKYGQK(其中Q在稀有的情况下可替换为E或K),并在羧基末端含有不同于其他已知锌指基序的锌指基序。为调控基因表达(通过激活和/或抑制),WRKY结构域与靶基因启动子中的顺式作用元件结合,优选与W-box,但是也与其他元件如SURE或SP8元件结合(有关综述,参见Eulgem等(2000)TrendsPlant Sci 5(5):199-206)。所述DNA结合能够用金属螯合剂如EDTA或邻菲罗啉(o-phenatrolin)阻断,并通过添加锌离子恢复。WRKY转录因子属于所谓的“即早期应答”基因,这意味着他们参与植物对创伤、对病原或对疾病抗性诱导剂的快速应答。
已基于WRKY结构域的数目及其相关锌指基序的特点将WRKY蛋白质归为三大类。
-I类包括这样的蛋白质:其具有两个WRKY结构域,以及Cys2His2(或C2-H2)锌指基序(更确切地为C-X4-5-C-X22-23-H-X1-H)或Cys2HisCys(或C2-HC)锌指基序(更确切地为C-X7-C-X23-H-X1-C,其中C为Cys,H为His,而X为任意氨基酸);
-II类(最大的一类)包括这样的蛋白质:其具有一个WRKY结构域,以及与I类相同的Cys2His2锌指基序;
-III类包括这样的蛋白质:其具有一个WRKY结构域,但是具有Cys2HisCys(或C2-HC)锌指基序(更确切地为C-X4-5-C-X22-23-H-X1-C或C-X7-C-X23-H-X1-C,其中C为Cys,H为His,而X为任意氨基酸)而非Cys2His2
稻基因组据认为编码100多个具有至少一个完整WRKY结构域的蛋白质,其中至少12个据报道含有两个WRKY结构域(Zhang & Wang(2005)BMC Evolutionary Biology 5:1)。在这12个蛋白质中,羧基末端的WRKY结构域为主要DNA结合活性的位点,而氨基末端的WRKY结构域促进DNA结合或参与蛋白质-蛋白质相互作用。每个WRKY结构域中的锌指基序可能参与与DNA或者蛋白质的结合。
同其他转录因子一样,WRKY蛋白质具有丰富的潜在的转录激活或抑制结构域。影响转录的许多结构域的共同特点是某些氨基酸占主导地位,包括丙氨酸(Ala)、谷氨酰胺(Glu)、脯氨酸(Pro)、丝氨酸(Ser)、苏氨酸(Thr)以及带电荷的氨基酸。在WRKY蛋白质中很可能看到的另一共同特点是碱性核定位信号(NLS),其通常由短链碱性氨基酸残基组成。
现已发现,相对于对照植物,调节植物中编码具有两个WRKY结构域的多肽或此类多肽同源物的核酸的表达,使植物产率增加。
发明内容
根据本发明的一个实施方案,提供了增加植物产率的方法,包括调节编码具有两个WRKY结构域的多肽或此类多肽同源物的核酸的表达。
有利地,实施根据本发明的方法产生相对于对照植物产率增加、特别是种子产率增加的植物。
优选本发明方法使用的具有两个WRKY结构域的多肽或所述同源物从氨基端到羧基端包含:(i)Pro-Ser富含结构域;和(ii)两个WRKY结构域,包括锌指C2-H2基序。
选择有利的对照植物是实验设置的常规部分,并且可以包括,对应的野生型植物或者不合目的基因的对应植物。对照植物还可以是待比较植物的无效合子。无效合子是转基因由于分离而丢失的个体。优选对照植物与待比较植物属于相同的物种,更优选为相同的品种。文中所用的“对照植物”不仅指整株植物,而且还指植物部分,包括种子和种子部分。
“参照”、“参照植物”、“对照”、“对照植物”、“野生型”或“野生型植物”尤其是细胞、组织、器官、植物或其部分,它们未按照本发明的方法生产。从而,术语“野生型”、“对照”或“参照”可互换,并且可以是细胞或植物的部分,如细胞器、组织或植物,它们未按照文中所述的本发明方法修饰或处理。从而,用作为野生型、对照或参照的细胞或植物部分如细胞器或组织,尽可能地对应于本发明的细胞或植物部分,而且除了本发明方法所致结果以外的任何其他特性都与本发明的主题对象(subject)尽可能地相同。因而,对野生型、对照或参照进行相同的处理,或者尽可能地进行相同处理,即条件或特性仅仅是可能有差异,但并不影响所测特性的品质。换言之,这意味着野生型代表(1)携带不变或非调节形式的基因或等位基因的植物,或者(2)由之获得本发明方法生产的植物的起始材料/植物。
优选在类似条件下对野生型植物和本发明方法生产的植物进行任何比较。术语“类似条件”是指在待比较的实验之间,所有的条件都保持相同:例如培养或生长条件、测定条件(如缓冲液组成、温度、底物、病原株、浓度等等)。
术语“参照”、“对照”或“野生型”优选为比较对象,如细胞器、细胞、组织、植物,其未按照本发明方法调节、修饰或处理,并且任何其他特性都与本发明的主题对象尽可能地相似。参照、对照或野生型在其基因组、转录物组(transcriptome)、蛋白质组或代谢物组(metabolome)方面与本发明的主题对象尽可能地相似。优选术语“参照-”、“对照-”或“野生型-”-细胞器、细胞、组织或植物与细胞器、细胞、组织或植物相关,与本发明的细胞器、细胞、组织或植物、或其部分在遗传上几乎相同,优选95%,更优选98%,甚至更优选99,00%,特别是99,10%,99,30%,99,50%,99,70%,99,90%,99,99%,99,999%或更高。最优选“参照”、“对照”或“野生型”为比较对象,如细胞器、细胞、组织、植物,其与本发明方法的植物、组织、细胞、细胞器在遗传上相同,根据本发明方法核酸分子或由其编码的基因产物经改变、调节或修饰除外。
在不能提供[与本发明主题对象的差异仅在于不是本发明主题对象的]对照、参照或野生型的情况下,对照、参照或野生型可以是这样的植物,其中导致代谢物增加的活性调节原因如实施例中所述。
术语“产率”通常定义为具有经济价值的可测量产出,其必然是与特定作物、面积以及时期相关的。植物各部分基于其数量、大小和/或重量对产率直接做出共享。而真正的产率是作物年亩产率,用总产量(既包括收获产量也包括评估产量)除以种植的英亩数予以确定。
术语“增加”“改进”或“提高”可互换,且在本发明意义上应理解为与文中所定义的野生型植物相比,产率和/或生长多出至少5%、6%、7%、8%、9%或10%,优选至少15%或20%,更优选25%、30%、35%或40%。
与对照、参照或野生型相比,就多肽活性而言的增加在细胞、组织、细胞器、器官或生物或其部分中达优选至少多出5%,优选至少10%或至少15%,特别优选至少20%、25%、30%或以上,及其优选至少40%、50%或60%,最优选至少70%或以上。
文中所定义的术语“增加的产率”是指各自相对于对照植物而言的如下任意一项或多项参数的增加:
(i)植物一个或多个部分,特别是地上(可收获)部分增加的生物量(重量)、增加的根生物量或任何其它可收获部分增加的生物量;
(ii)增加的种子总产率,这包括种子生物量(种子重量)的增加,并且其可以是每棵植株或单粒种子基础上的种子重量增加;
(iii)增加的每个圆锥花序的花朵(“小穗floret”)数量;
(iv)增加的(饱满)种子数量;
(v)增加的种子大小,这也可影响种子的组成;
(vi)增加的种子体积,这也可影响种子的组成(包括油类、蛋白质和糖类的总含量和组成);
(vii)增加的单个种子面积;
(viii)增加的单个种子长度和/或宽度;
(ix)增加的收获指数,其表达为可收获部分[如种子]的产率与总生物量的比率;和
(x)增加的千粒重(TKW),这通过计数饱满种子数量及其总重量,进行外推得到。TKW增加可源于种子大小和/或种子重量的增加。TKW增加可源于胚大小和/或胚乳大小的增加。
术语“表达”或“基因表达”指一种或多种特定基因的转录。优选这种表达导致出现表型性状。术语“表达”或“基因表达”特别指一种或多种基因转录为结构RNA(rRNA、tRNA)或mRNA,后者随后翻译为蛋白质。该过程包括DNA的转录、所产生mRNA产物的加工,以及其翻译为活性蛋白质。
就表达或基因表达而言的术语“调节”指与对照植物相比,因所述基因表达而改变表达水平的过程,优选表达水平增加。原始未调节的表达可以是随后翻译的结构RNA(rRNA、tRNA)或mRNA的任何类型的表达。术语“调节...活性”应理解为本发明核酸序列或编码蛋白质的任何表达改变,导致植物产率增加和/或生长增加。
以谷物为例,产率增加可以表现为下列一种或多种情况:每公顷或每英亩植物数量的增加、每棵植株谷穗数量的增加、行数、行粒数、粒重量、千粒重、谷穗长度/直径的增加等等。以稻为例,产率增加可以表现为下列一种或多种情况:每公顷或每英亩的植物数量、每棵植株的圆锥花序数量、每个圆锥花序的小穗数量、每个圆锥花序的花朵数量、种子充实率的增加、千粒重的增加,等等。产率的增加也可以导致改良的构造,或可以作为改良的构造的结果发生。
根据优选的方面,实施本发明的方法产生相对于对照植物种子产率增加的植物。
特别地,这样的种子产率的增加包括各自相对于对照植物而言增加的TKw、增加的单个种子面积、增加的单个种子长度、增加的单个种子宽度、增加的种子数量以及增加的每个圆锥花序的花朵数量。
由于本发明的转基因植物具有增加的产率,相对于相应对照植物在其生命周期相应阶段的生长速率而言,这些植物可能呈现增加的生长速率(至少在其部分生命周期中)。增加的生长速率可以是对植物的一个或多个部分(包括种子)特异性的,或者可以基本上遍及整株植物。具有增加生长速率的植物可以呈现出早期开花。通常延迟开花并不是期望的农业性状。生长速率的增加可以出现在植物生命周期的一个或多个阶段,或者出现在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可以表现为增强的活力。生长速率的增加可以改变植物的收获周期,使植物能够比其他可能的情况更晚播种和/或更快收获。如果生长速率充分增加,可以允许播种同种植物物种更多的种子(例如完全在一个常规的生长期内,播种和收获稻植物、接着播种和收获更多的稻植物)。与之类似,如果生长速率充分地增加,可能允许播种不同植物物种更多的种子(例如播种和收获稻植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其他植物)。在一些作物植物的情况下,也有可能从同一根茎收获增加的次数。改变植物的收获周期可以导致每英亩年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获次数的增加)。与野生型对应物相比,生长速率的增加还能够在更广阔的地域栽培转基因植物,因为种植农作物的地域限制通常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期,可以避免这类不利条件。可以由生长曲线获取多种参数,来确定生长速率,这类参数可以是:T-Mid (植物达到其最大大小的50%所需时间)和T-90(植物达到其最大大小90%所需时间)等等。
实施本发明的方法产生优选具有增加的生长速率的植物。因此,本发明提供了增加植物生长速率的方法,所述方法包括调节植物中编码具有两个WRKY结构域的多肽或此类多肽同源物的核酸的表达。
无论植物处于非胁迫条件下,还是植物相对于对照植物接触多种胁迫,都发生产率和/或生长速率的增加。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长丧失重新开始生长能力的任何胁迫。本发明意义上的轻度胁迫导致胁迫植物的生长与非胁迫条件下的对照植物相比,下降不到40%、35%或30%,优选不到25%、20%或15%,更优选不到14%、13%、12%、11%或10%或更低。由于耕作方法(灌溉、施肥、杀虫剂处理)的发展,栽培的作物植物常常不会遇到重度胁迫。因此,由轻度胁迫诱导的受损的生长通常成为农业中不期望的因素。轻度胁迫是植物可能接触的典型胁迫,如日常的生物和/或非生物(环境)胁迫。典型的非生物或环境胁迫包括由反常的热或冷/冰冻温度产生的温度胁迫;盐胁迫;水胁迫(干旱或过量的水)。化学物质也可以引起非生物胁迫。生物胁迫一般是由病原如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。优选根据本发明方法在非胁迫或者轻度非生物或生物胁迫条件、优选非生物胁迫条件下发生产率和/或生长速率的增加。
有利地,可以在任何植物中改良上述特征。
本文所用术语“植物”包含整株植物、植物的祖先和后代以及植物部分,包括种子、枝条、茎、叶、根(包括块茎)、果实、茎秆(stalk)、幼苗、花以及细胞、组织和器官,其中上述每一种都包含未见于相同物种、变种或栽培种野生型植物的遗传物质。遗传物质可以是转基因、***诱变事件、激活的标签序列、突变序列或同源重组事件。术语“植物”也包含悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样其中上述每一种都包含未见于相同物种、变种或栽培种野生型植物的遗传物质。
在本发明方法中尤其有用的植物包括所有属于植物界(Viridiplantae)超家族的植物,特别是单子叶和双子叶植物,包括选自下列清单的饲料或饲料豆科植物、观赏植物、粮食作物、乔木或灌木:金合欢属物种(Acaciaspp.)、槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、七叶树属物种(Aesculus spp.)、新西兰贝壳杉(Agathis australis)、Albizia amara、三色桫椤(Alsophila tricolor)、须芒草属物种(Andropogon spp.)、落花生属物种(Arachis spp)、槟榔(Areca catechu)、Astelia fragrans、黄芪(Astragalus cicer)、Baikiaea plurijuga、桦木属物种(Betula spp.)、芸苔属物种(Brassica spp.)、木榄(Bruguiera gymnorrhiza)、Burkea africana、紫铆(Butea frondosa)、Cadaba farinosa、朱缨花属物种(Calliandra spp)、茶(Camellia sinensis)、美人蕉(Canna indica)、辣椒属物种(Capsicum spp.)、决明属物种(Cassia spp.)、距瓣豆(Centroema pubescens)、木瓜属物种(Chaenomeles spp.)、肉桂(Cinnamomum cassia)、小果咖啡(Coffea arabica)、Colophospermummopane、变异小冠花(Coronillia varia)、枸子(Cotoneaster serotina)、山楂属物种(Crataegus spp.)、香瓜属物种(Cucumis spp.)、柏木属物种(Cupressusspp.)、Cyathea dealbata、木梨(Cydonia oblonga)、圆球柳杉(Cryptomeriajaponica)、香茅属物种(Cymbopogon spp.)、Cynthea dealbata、木梨(Cydoniaoblonga)、Dalbergia monetaria、大叶骨碎补(Davallia divaricata)、山马蝗属物种(Desmodium spp.)、迪卡兰(Dicksonia squarosa)、Diheteropogonamplectens、Dioclea spp、镰扁豆属物种(Dolichos spp.)、Dorycnium rectum、锥穗稗(Echinochloa pyramidalis)、Ehrartia spp.、穇子(Eleusine coracana)、Eragrestis spp.、刺桐属物种(Erythrina spp.)、桉属物种(Eucalyptus spp.)、Euclea schimperi、金茅(Eulalia villosa)、荞麦属物种(Fagopyrum spp.)、费约罗(Feija sellowiana)、草雷属物种(Fragaria spp.)、千斤拔属物种(Flemingia spp)、Freycinetia banksii、Geranium thunbergii、银杏(Ginkgobiloba)、Glycine javanica、Gliricidia spp、陆地棉(Gossypium hirsutum)、银桦属物种(Grevillea spp.)、Guibourtia coleosperma、岩黄芪属物种(Hedysarum spp.)、牛鞭草(Hemarthia altissima)、扭黄茅(Heteropogoncontortus)、大麦(Hordeum vulare)、Hyparrhenia rufa、小连翅(Hypericumerectum)、Hyperthelia dissoluta、白花庭蓝(Indigo incarnata)、鸢尾属物种(Iris spp.)、Leptarrhena pyrolifolia、胡枝子属物种(Lespediza spp.)、莴苣属物种(Lettuca spp.)、Leucaena leucocephala、Loudetia simplex、Lotonusbainesii、百脉根属物种(Lotus spp.)、硬皮豆(Macrotyloma axillare)、苹果属物种(Malus spp.)、Manihot esculenta、紫苜蓿(Medicago sativa)、水杉(Metasequoia glyptostroboides)、大蕉(Musa sapientum)、烟草属物种(Nicotianum spp.)、驴食草属物种(Onobrychis spp.)、Ornithopus spp.、稻属物种(Oryza spp.)、非洲双翼豆(Peltophorum africanum)、狼尾草属物种(Pennisetum spp.)、鳄梨(Persea gratissima)、碧冬茄属物种(Petunia spp.)、菜豆属物种(Phaseolus spp.)、槟榔竹(Phoenix canariensis)、Phormiumcookianum、石楠属物种(Photinia spp.)、白云杉(Picea glauca)、松属物种(Pinus spp.)、豌豆(Pisum sativum)、新西兰罗汉松(Podocarpus totara)、Pogonarthria fleckii、Pogonarthria squarrosa、杨属物种(Populus spp.)、牧豆树(Prosopis cineraria)、花旗松(Pseudotsuga menziesii)、Pterolobiumstellatum、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、Rhaphiolepsisumbellata、美味棒花棕(Rhopalostylis sapida)、Rhus natalensis、欧洲醋粟(Ribes grossularia)、茶藨子属物种(Ribes spp.)、洋槐(Robinia pseudoacacia)、蔷薇属物种(Rosa spp.)、悬钩子属物种(Rubus spp.)、柳属物种(Salix spp.)、Schyzachyrium sanguineum、金松(Sciadopitys verticillata)、北美红杉(Sequoia sempervirens)、巨杉(Sequoiadendron giganteum)、两色蜀黍(Sorghum bicolor)、菠菜属物种(spinacia spp.)、Sporobolus fimbriatus、Stiburus alopecuroides、Stylosanthos humilis、葫芦茶属物种(Tadehagi spp)、落羽杉(Taxodium distich um)、***黄背草(Themeda triandra)、车轴草属物种(Trifolium spp.)、小麦属物种(Triticum spp.)、异叶铁杉(Tsugaheterophylla)、越桔属物种(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、葡萄(Vitis yinifera)、锥穗沃森花(Watsonia pyramidata)、马蹄莲(Zantedeschiaaethiopica)、玉蜀黍(Zea mays)、苋属植物(amaranth)、洋蓟(artichoke)、天门冬属(asparagus)、椰菜(broccoli)、孢子甘蓝(Brussels sprouts)、甘蓝、芸苔(canola)、胡萝卜、花椰菜、芹菜、羽衣甘蓝(collard greens)、亚麻、无头甘蓝(kale)、兵豆属(lentil)、油菜籽油菜(oilseed rape)、秋葵(okra)、洋葱、马铃薯、稻、大豆、草莓、甜菜、甘蔗、向日葵、番茄、南瓜(squash)、茶和藻类等等。根据本发明优选的实施方案,植物为作物植物如大豆、向日葵、芸苔、苜蓿、油菜籽、棉花、番茄、马铃薯或烟草。还优选植物为单子叶植物如甘蔗。更优选植物是谷类,例如稻、玉米、小麦、大麦、粟、黑麦、高梁或燕麦。
其他有利的植物选自下组:菊科[Asteraceae]如向日葵属[Helianthus]、万寿菊属[Tagetes],例如物种向日葵[Helianthus annus]、香叶万寿菊[Tagetes lucida]、万寿菊[Tagetes erecta]或细叶万寿菊[Tagetes tenuifolia];十字花科[Brassicaceae]如芸苔属[Brassica]、拟南芥属[Arabadopsis],例如物种欧洲芸苔[Brassica napus]、甘蓝型油菜[Brasstca rapa ssp.][芸苔、油菜籽油菜、芜菁]或拟南芥;豆科[Fabaceae]如大豆属[Glycine],例如物种大豆[Glycine max]、黄豆[Soja hispida]或大豆[Soja max];亚麻科[Linaceae]如亚麻属[Linum],例如物种亚麻或亚麻籽[Linum usitatissimum];禾本科[Poaceae]如大麦属[Hordeum]、黑麦属[Secale]、燕麦属[Avena]、高粱属[Sorghum]、稻属[Oryza]、玉蜀黍[Zea]、小麦属[Triticum],例如物种大麦[Hordeum vulgare]、黑麦[Secale cereale]、燕麦[Avena sativa]、野燕麦[Avenafatua]、红燕麦[Avena byzantina]、野燕麦[Avena fatua var.sativa]、Avenahybrida、高粱或粟[Sorghum bicolor]、稻[Oryza sativa],阔叶稻[Oryzalatifolia]、玉米或玉蜀黍[Zea mays]、小麦[Triticum aestivum]、硬粒小麦[Triticum durum]、圆锥小麦[Triticum turgidum]、Triticum hybernum、马卡小麦[Triticum macha]、面包小麦[Triticum sativum]or普通小麦[Triticumvulgare];茄科[Solanaceae]如茄属[Solanum]、番茄属[Lycopersicon],例如物种马铃薯[Solanum tuberosum]、番茄[Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersicon pyrifrme、Solanumlycopersicum]、红茄[Solanum integrifolium]。
本文定义的术语“具有两个WRKY结构域的多肽或此类多肽的同源物”指这样的多肽,其从氨基端到羧基端包含:(i) Pro-Ser富含结构域;和(ii)两个WRKY结构域,包括锌指C2-H2基序。
通常,具有两个WRKY结构域的多肽或此类多肽的同源物可能还包含如下一项或多项:(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和(iii)保守结构域,其与SEQ ID NO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性。
具有两个WRKY结构域的多肽或此类多肽的同源物可以在Pro-Ser富含结构域中还包含LXSP基序(其中L为Leu,S为Ser,P为Pro,而X为任意氨基酸)。此外,与Swiss-Prot蛋白质序列数据库蛋白质的平均氨基酸组成(以%表示)相比,Pro-Ser富含结构域富含的Pro和Ser至少为其两倍。
此外,具有两个WRKY结构域的多肽或此类多肽的同源物是指任何这样的氨基酸序列,当其用于构建含有一个或两个WRKY结构域多肽的***发生树时,其落入这样的组别,该组所包括的多肽具有两个WRKY结构域和Pro-Ser富含结构域(见图2)。
具有两个WRKY结构域的多肽或此类多肽的同源物由两WRKY结构域核酸/基因编码。因此文中定义的术语“两WRKY结构域核酸/基因”是编码上文所定义的具有两个WRKY结构域的多肽或此类多肽的同源物的任何核酸/基因。
可以利用本领域内众所周知的常规技术,如通过序列比对,容易地鉴定具有两个WRKY结构域的多肽或此类多肽的同源物。序列比对的方法是本领域众所周知的,这类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP应用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两个完整序列的比对,使匹配数最大化和空位数最小化。BLAST算法[Altschul等(1990)J Mol Biol 215:403-10]计算百分比序列同一性,并对两序列之间的相似性进行统计分析。执行BLAST分析的软件可从生物技术信息国家中心公开地获得。例如,可利用可由京都大学生物信息学中心(Kyoto University Bioinformatics Center)获得的ClustalW多重序列比对算法(版本1.83)容易地鉴定具有两个WRKY结构域的多肽的同源物,使用默认的两两比对参数以及百分比的记分方法。在有些情况下为了优化特定基序比对,可能需要一些小的人工编辑,这是本领域技术人员普遍进行的。序列同一性值,如上所述为百分比,是利用默认参数通过上述程序在整个保守结构域中确定的。
利用制作***发生树的已知技术和软件,如GCG、EBI或CLUSTAL软件包,使用默认参数,本领域技术人员能够容易地确定所讨论的任何氨基酸序列是否落入上文所述定义“具有两个WRKY结构域的多肽或此类多肽的同源物”。***发生树一经构建,与具有两个WRKY结构域和Pro-Ser富含结构域的多肽组别聚类在一起的序列(见图2的箭头,依照Eulgem等,2000,Trends Plant Sci 5(5):199-206)视为落入定义“具有两个WRKY结构域的多肽或此类多肽的同源物”。编码此类序列的核酸可用于实施本发明的方法。
术语“结构域”是指在进化相关蛋白质序列的比对中,在特定位置上保守的一组氨基酸。尽管其他位置上的氨基酸可能因同源物不同而改变,但是在特定位置上高度保守的氨基酸意味着对于蛋白质结构、稳定性或活性非常重要的氨基酸。“结构域”因其在所比对的家族蛋白质同源物序列中高度保守而得以鉴定,能够用作为标识符以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族(在本案中为具有两个WRKY结构域的多肽家族)。术语“基序”是指蛋白质序列中短的保守区域。基序常常是高度保守的结构域部分,但也可以仅仅包括部分结构域,或者在保守结构域之外(若基序的所有氨基酸都在所定义的结构域之外的话)。
存在用于鉴定结构域的特殊数据库。例如,多肽中的WRKY结构域可以利用SMART(Schultz等 (1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244;由位于德国海德堡的EMBL主办)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;由位于英国的欧洲生物信息学学院(EBI)主办)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation.(In)ISMB-94;Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology.Altman R.Brutlag D.Karp P.Lathrop R.Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004),提供ExPASy蛋白质组学服务器以服务于科学界(由位于瑞士的瑞士生物信息学学院(SIB)主办)或者Pfam(Bateman等,NucleicAcids Research 30(1):276-280(2002),由英国Sanger学院主办)来鉴定。WRKY结构域在InterPro数据库被命名为IPR003657,Pfam数据库中为PF03106,而PROSITE数据库中为PS50811。
此外,也可以容易地鉴定Pro-Ser富含结构域的存在。决定多肽结构域是否富含特定氨基酸的一级氨基酸组成(以%表示)可以利用来自ExPASy服务器的软件程序,特别是ProtParam工具进行计算(Gasteiger E等(2003)ExPASy:the proteomics server for in-depth protein knowledge andanalysis.Nucleic Acids Res 31:3784-3788)。然后可以将目的蛋白质的组成与Swiss-Prot蛋白质序列数据库中的平均氨基酸组成(以%表示)进行比较。在该数据库内,平均Pro(P)含量为4.85%,平均Ser(S)含量为6.89%。作为实例,SEQ ID NO:2的Pro-Ser富含结构域含有22.03%的Pro(超过5倍地富含)和0.34%的Ser(超过3倍地富含)。如本文所定义的那样,Pro-Ser富含结构域具有高于Swiss-Prot蛋白质序列数据库平均氨基酸组成(以%表示)的Pro和Ser含量(以%表示)。还优选如本文所定义的Pro-Ser富含结构域的Pro和Ser含量(以%表示)至少为Swiss-Prot蛋白质序列数据库平均氨基酸组成(以%表示)的两倍。更优选如本文所定义的Pro-Ser富含结构域的Pro和Ser含量(以%表示)至少为Swiss-Prot蛋白质序列数据库中所包括的该类蛋白质序列的平均氨基酸组成(以%表示)的2.1、2.2、2.3、2.4或2.5倍,更优选2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0倍或更多倍。
具有两个WRKY结构域的多肽或此类多肽的同源物的实例包括(由括号中登录号所示的多核苷酸序列编码,参见表1):稻(Oryza sativa)Orysa_WRKY53(BK005056) SEQ ID NO:2,稻Orysa_WRKY24(BK005027)SEQ ID NO:4,稻Orysa_WRKY70(BK005073)SEQ ID NO:6,稻Orysa_WRKY78(AK070537)SEQ ID NO:8,稻Orys_WRKY30(AY870610)SEQ ID NO:10,稻Orysa_WRKY35(BK005038)SEQ ID NO:12,拟南芥(Arabidopsis thaliana)Arath_WRKY25(NM_128578)SEQ IDNO:14,拟南芥Arath_WRKY26(AK117545)SEQ ID NO:16,拟南芥Arath_WRKY33(NM_129404)SEQ ID NO:18,拟南芥Arath_WRKY2(AF418308)SEQ ID NO:20,拟南芥Arath_WRKY34(AY052649)SEQ IDNO:22,以南芥Arath_WRKY20(AF425837)SEQ ID NO:24,大豆Glyma_WRKY 2X(数个EST的重叠群,其中有BM143621.1、BU578260.1、CO036102.1)SEQ ID NO:26,恰柯薯(Solanum chacoense)Solca_WRKY2X(AY366389)SEQ ID NO:28,金叶甘薯(Ipomoea batatas)Ipoba_WRKY2X(D30038)SEQ ID NO:30,野生烟草(Nicotiana attenuata)Nicta_WRKY2X(AY456272)SEQ ID NO:32,甘蔗(Saccharum officinarum)Sacof_WRKY 2X SEQ ID NO:34,小麦(Triticum aestivum)Triae_WRKY2X(数个EST的重叠群,其中有BM135197.1、BM138255.1、BT009257.1)SEQ ID NO:36,大麦(Hordeum vulgare)Horvu_WRKY 2X(AY323206)SEQ ID NO:38,玉蜀黍Zeama_WRKY 2X (重叠群CG310251.1、DR959456.1、DY235298.1)SEQ ID NO:45,番茄Lyces_WRKY 2X(重叠群CN385869.1、BI422509.1、CN38497745)SEQ ID NO:47和番茄LycesWRKY 2X II(重叠群BI422692.1、BI923269.1、BI422137.1)SEQ ID NO:49,以及在序列表(sequence protocol)中提到的来自玉蜀黍的以SEQ ID NO:51所示的那个序列。
表1:
归入“具有两个WRKY结构域的多肽或此类多肽的同源物”定义的序列
名称 NCBI登录号 核苷酸SEQ ID NO 翻译的多肽SEQ ID NO 来源
Orysa_WRKY53 BK005056 1 2
Orysa_WRKY24 BK005027 3 4
Orysa_WRKY70 BK005073 5 6
Orysa_WRKY78 AK070537 7 8
Orysa_WRKY30 AY870610 9 10
Orysa_WRKY35 BK005038 11 12
Arath_WRKY25 NM_128578 13 14 拟南芥
Arath_WRKY26 AK117545 15 16 拟南芥
Arath_WRKY33 NM_129404 17 18 拟南芥
Arath_WRKY2 AF418308 19 20 拟南芥
Arath_WRKY34 AY052649 21 22 拟南芥
Arath_WRKY20 AF425837 23 24 拟南芥
Glyma_WRKY2X *数个EST的重叠群,其中有BM143621.1,BU578260.1,CO036102.1 25 26 大豆
Solca_WRKY2X AY366389 27 28 恰柯薯
名称 NCBI登录号 核苷酸SEQ ID NO 翻译的多肽SEQ ID NO 来源
Ipoba_WRKY2X D30038 29 30 金叶甘薯
Nicat_WRKY2X AY456272 31 32 野生烟草
Sacof_WRKY2X *数个EST的重叠群,其中有CA096820.1,CA119395.1,CA139234.1 33 34 甘蔗
Triae_WRKY2X 数个EST的重叠群,其中有CA731195.1.CV764859.1,BT009257.1 35 36 小麦
Horvu_WRKY2X AY323206 37 38 大麦
Zeama_WRKY2X 重叠群CG310251.1DR959456.1DY235298.1 44 45 玉蜀黍
Lyces_WRKY2X 重叠群CN385869.1BI422509.1CN384977 46 47 番茄
Lyces  WRKY2X II 重叠群BI422692.1BI923269.1BI422137.1 48 49 番茄
应该理解的是,落入“具有两个WRKY结构域的多肽或此类多肽的同源物”定义的序列不限于表1中所给出的以及序列表中所提到的氨基酸序列,而是任何这样的多肽,其从氨基末端到羧基末端包含:(i)Pro-Ser富含结构域,和(ii)两个WRKY结构域,包括锌指C2-H2基序,均适用于实施本发明的方法。
此外,具有两个WRKY结构域的多肽或此类多肽的同源物可以还包含如下一项或多项:(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和(iii)保守结构域,其与SEQ ID NO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性(进一步在实施例4中例证)。甚至更优选地,具有两个WRKY结构域的多肽或此类多肽的同源物可以在Pro-Ser富含结构域中还包含LXSP基序(其中L为Leu,S为Ser,P为Pro,而X为任意氨基酸)。最优选地,与Swiss-Prot蛋白质序列数据库蛋白质的平均氨基酸组成(以%表示)相比,具有两个WRKY结构域的多肽或此类多肽的同源物包含的Pro-Ser富含结构域中所富含的Pro和Ser至少为其两倍。更优选地,本文所定义的Pro-Ser富含结构域的Pro和Ser含量(以%表示)至少为Swiss-Prot蛋白质序列数据库中所包括的该类蛋白质序列的平均氨基酸组成(以%表示)的2.1、2.2、2.3、2.4或2.5倍,更优选2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0倍或更多倍。
两WRKY结构域核酸的实例包括但不限于表1中所给出的以及序列表中所提到的核酸。两WRKY结构域核酸/基因及其变体可用于实施本发明的方法。两WRKY结构域核酸/基因的变体两WRKY结构域核酸/基因的部分和/或能够与两WRKY结构域核酸/基因杂交的核酸。本发明的方法优选使用SEQ ID NO:1、SEQ ID NO:50或其变体。
本发明另一实施方案为分离的核酸分子,其包含选自下组的核酸分子:
(a)分离的核酸分子,如SEQ ID NO:50所示;
(b)分离的核酸分子,编码如SEQ ID NO:51所示的氨基酸序列;
(c)分离的核酸分子,作为遗传密码简并性的结果,其序列能够根据如SEQ ID NO:51所示的多肽序列推断出来;
(d)分离的核酸分子,其编码的多肽与(a)至(c)中核酸分子所编码的多肽的氨基酸序列具有至少80%的同一性;
(e)分离的核酸分子,编码如SEQ ID NO:51所示的氨基酸分子的同源物、衍生物或活性片段,所述同源物、衍生物或活性片段为植物来源,且有利地包含:
(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);
(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和
(iii)保守结构域,其与SEQ ID NO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性;
(f)分离的核酸分子或其互补物,能够与上述(a)至(c)中核酸分子杂交,其中所述杂交序列或其互补物编码(a)至(e)中的植物蛋白质;
其中所述核酸分子在植物中具有增加产率和/或生长的活性。
出于本发明的目的,“转基因的”、“转基因”或“重组”是指,例如,核酸序列、含有所述核酸序列的表达盒(=基因构建体)或载体或用所述核酸序列转化的生物体、根据本发明的表达盒或载体、通过重组方法产生的所有那些构建体,其中:
(a)根据本发明的核酸序列,或
(b)有效连接于根据本发明核酸序列的遗传控制序列,例如启动子,或
(c)(a)和(b)
不存在于其天然遗传环境中,或者已通过重组方法修饰,有可能修饰采取的形式为例如一个或多个核苷酸残基的取代、添加、缺失、倒换或***。天然遗传环境应理解为原始植物中天然的基因组或染色体座位或者存在于基因组文库之中。在基因组文库的情况下,优选维持核酸序列的天然遗传环境,至少部分地维持。至少在核酸序列一侧侧接的环境序列长度至少为50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp。当天然存在的表达盒——例如核酸序列的启动子与编码具有两个WRKY结构域的多肽或此类多肽的同源物的相应核酸之间天然存在着的组合——经非天然的合成(“人工”)方法如诱变处理修饰时,此表达盒变成转基因表达盒。例如,合适的方法描述在US 5,565,350或WO 00/15815中,
因此,如上文所述,用于本发明目的的转基因植物应理解为表示:在所述植物的基因组中,本发明方法中所用的核酸不其天然基因座上,有可能核酸将要进行同源或异源表达。不过,正如所提到的那样,转基因的也表示:尽管在植物基因组中,根据本发明的核酸或本发明方法中所用的核酸在其天然位置上,但是所述序列已相对于天然序列而被修饰,和/或天然序列的调控序列已被修饰。转基因的表达优选理解为表示:根据本发明的核酸在基因组中非天然的座位上表达,即同源表达,或者优选地发生核酸的异源表达。优选的转基因植物在本文提及。
用于本发明方法中所用核酸、表达盒或载体的宿主植物或者用于本发明核酸、表达盒、构建体或载体的宿主植物原则上有利地为所有植物,它们能够合成本发明方法中所用的多肽。
除非另行指出,术语“多核苷酸”、“核酸”及“核酸分子”在文中互换使用。除非另行指出,术语“肽”、“多肽”及“蛋白质”在本文中互换使用。术语“序列”可能涉及多核苷酸、核酸、核酸分子、氨基酸、肽、多肽和蛋白质,取决于使用术语“序列”的上下文。术语“基因”、“多核苷酸”、“核酸序列”“核苷酸序列”或“核酸分子”在文中用于指任何长度的多聚体形式的核苷酸,或者为核糖核苷酸或者为脱氧核糖核苷酸。这些术语仅述及分子的一级结构。
因此,如本文所用的术语“基因”、“多核苷酸”、“核酸序列”“核苷酸序列”或“核酸分子”包括双链和单链DNA及RNA。它们还包括已知类型的修饰,例如甲基化、“加帽”、用类似物取代一个或多个天然存在的核苷酸。优选本发明的DNA或RNA序列包含编码本文定义多肽的编码序列。
“编码序列”为核苷酸序列,当将其置于合适的调控序列的控制之下时,转录为结构RNA或mRNA和/或翻译为多肽。编码序列的边界确定为5’-末端的翻译起始密码子和3’-末端的翻译终止密码子。编码序列可以包括但不局限于:mRNA、cDNA、重组核苷酸序列或基因组DNA,而且在一定的情形下也可以存在内含子。
“分离的”多核苷酸或核酸分子与存在于所述核酸分子天然来源中的其他多核苷酸或核酸分子分离开。分离的核酸分子可以是几kb的染色体片段,或者优选为仅包含基因编码区的分子。从而,本发明分离的核酸分子可以包含染色体区域,其为邻近的5’和3’或其他邻近的染色体区域,但是优选基本上不含在所述核酸分子来源生物体的基因组或染色体环境中天然侧接此核酸分子序列的序列(例如,邻近编码核酸分子5’-UTR和3’-UTR区域的序列)。在多种实施方案中,根据本发明方法中所使用的分离的核酸分子可以例如包含少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb所述核酸分子来源细胞的基因组DNA中天然侧接此核酸分子的核苷酸序列。
包含本发明方法中所用核酸分子例如本发明多核苷酸的完整序列或其部分的核酸分子,可以利用基于所用序列或其部分的寡核苷酸引物通过聚合酶链式反应进行分离。例如,包含所述完整序列或其部分的核酸分子可以利用基于此序列所产生的寡核苷酸引物通过聚合酶链式反应进行分离。例如,可以从细胞中分离mRNA(例如通过Chirgwin等(1979)Biochemistry 18:5294-5299的异硫氰酸胍提取法),并且可以通过逆转录酶(例如莫洛尼(Moloney)MLV逆转录酶,可购自Gibco/BRL,Bethesda,MD;或AMV逆转录酶,可获自Seikagaku America,Inc.St.Petersburg,FL)产生cDNA。
对根据本发明的方法有利的核酸分子可基于其与本文公开的核酸分子的同源性,利用所述序列或其部分作为杂交探针,在严格杂交条件下按照标准杂交技术进行分离。就此而言,有可能使用,例如,具有至少15、20、25、30、35、40、50、60或更多个核苷酸、优选长度至少为15、20或25个核苷酸的分离的核酸分子,其在严格条件下与上述核酸分子杂交,特别是与那些包含这样的核苷酸序列的核酸分子杂交,所述核苷酸序列为本发明方法中所用的核酸分子、编码本发明的蛋白质、或者为本发明的核酸分子。也可以使用具有30、50、100、250个或更多个核苷酸的核酸分子。
本发明方法中所用的核酸序列,如序列表中特别是SEQ ID NO:1或50所示,最好引入核酸构建体,优选表达盒中,这使得所述核酸分子在植物中的表达成为可能。
从而,本发明还涉及核酸构建体,优选表达载体,含有本发明的核酸分子,功能性连接于一个或多个调控元件或信号。
如本文所述,核酸构建体也可以含有其他欲引入生物体或细胞的基因。有可能并且最好在宿主生物体中引入并表达调控基因,如诱导物、抑制物或酶的基因,它们通过其酶促活性参与调控代谢通路中的一个或多个基因。这些基因可以是异源或同源来源。而且,最好可能存在其他生物合成基因,或者这些基因可以位于一个或多个其他核酸构建体中。最好采用这样的基因,其影响植物的生长,例如调控序列或因子。通过使用强转录信号如启动子和/或增强子,可以有利地在转录水平产生调控元件的增强作用。不过,此外,也有可能利用翻译增强作用,例如通过增加mRNA稳定性或通过***翻译增强子序列。
原则上,核酸构建体可以含有本文所述的调控序列以及与所包含基因的表达相关的其他序列。从而,本发明的核酸构建体可用作为表达盒,从而可用于直接引入到植物中,或者将其引入到载体中。相应地,在一个实施方案中,核酸构建体为表达盒,包含微生物启动子或微生物终止子或两者兼而有之。在一个实施方案中,表达盒包括病毒启动子或病毒终止子或两者兼而有之。在另一个实施方案中,表达盒包括植物启动子或植物终止子或两者兼而有之。
为将核酸分子引入到核酸构建体中,例如,作为表达盒的一部分,最好以技术人员已知的方式对基因区段进行扩增和连接反应。优选按照类似于Pfu DNA聚合酶或Pfu/Taq DNA聚合酶混合物方案的方法。根据待扩增的序列选择引物。应当有利地选择引物,从而扩增物包含从起始到终止密码子的符号性(codogenic)序列。扩增之后,最好分析扩增物。例如,所述分析可以考虑质量和数量,并在凝胶电泳分离之后进行。其后,可以按照标准方案(例如Qiagen)纯化扩增物。然后可利用小份纯化的扩增物进行随后的克隆步骤。技术人员通常知晓合适的克隆载体。
它们尤其包括能够在易于操作的克隆***像基于细菌、酵母或昆虫细胞(如杆状病毒表达)的***中复制的载体,也即特别是确保在大肠杆菌(E.coli)或农杆菌属(Agrobacterium)菌株中有效克隆的载体,其使得有可能稳定转化植物。必需要提及的载体为多种双元和共合体载体***,它们适用于T-DNA介导的转化。通常此类载体***的特征在于,它们至少含有vir基因和T-DNA边界序列,其中vir基因式农杆菌属介导的转化所必需的。
通常,载体***优选还包含其他顺式调控区域,如启动子和终止子和/或选择标记,借助于它们能够鉴定适当转化的生物体。在共合体载体***的情况下,vir基因和T-DNA序列位于同一载体上,而双元***基于至少两个载体,其中一个携带vir基因而非T-DNA,而第二个携带T-DNA而非vir基因。因为这个事实,后述的载体相对较小,易于操作,并能够在大肠杆菌和农杆菌属菌株中复制。这些双元载体包括来自pBIB-HYG、pPZP、pBecks、pGreen系列的载体。根据本发明优选使用的双元载体有Bin19、pBI101、pBinAR、pGPTV和pCAMBIA。有关双元载体及其用途的综述由Hellens等,Trends in Plant Science(2000)5,446-451提供。所述载体优选以这样的方式修饰,从而它们已经含有本发明的核酸,优选编码如SEQ IDNO:1及SEQ ID NO:50所示多肽的核酸序列。
在重组表达载体中,“有效连接”表示目的核酸分子以这样的方式连接于调控信号,从而使所述所述核酸分子的表达成为可能:它们以这样的方式彼此连接,从而两种序列均实现归属于序列的预测功能(例如在体外转录/翻译***中,或者如果载体被引入宿主细胞则在宿主细胞中)。
如本文所定义的术语“部分”是指DNA片段,其编码执行与完整多肽相同或相似生物学功能的多肽。例如,两WRKY结构域部分可以编码这样的多肽,所述多肽包含可识别的结构基序和/或功能性结构域,如DNA结合位点或与DNA启动子区结合的结构域、激活或抑制结构域、蛋白质-蛋白质相互作用结构域、定位结构域,并且还可能具有起始或抑制转录的能力。例如,可以通过对两WRKY结构域核酸进行一个或多个缺失来制备“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,生产组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的两WRKY结构域部分要大。“部分”的实例可以包括编码多肽的核苷酸,所述多肽从氨基末端到羧基末端包含:(i)Pro-Ser富含结构域,和(ii)两个WRKY结构域,包括锌指C2-H2基序。“部分”可任选地包含如下一项或多项:(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和(iii)保守结构域,其与SEQ ID NO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性。“部分”可以在Pro-Ser富含结构域中还包含LXSP基序(其中L为Leu,S为Ser,P为Pro,而X为任意氨基酸)。“部分”通常长度至少为300、400、500、600或700个核苷酸,优选长度至少为750、900、850、900或950个核苷酸,更优选长度至少为1000、1100、1200或1300个核苷酸,且最优选长度至少为1350、1400、1450、1500、1550或1600或更多个核苷酸。优选“部分”为如表1中所给出的和/或序列表中所述的任一核酸的“部分”。最优选“部分”为SEQ ID NO:1或SEQ ID NO:50所示核酸的“部分”。
术语“片段”、“序列片段”或“序列的一部分”、“部分”或“其部分”是指所参照原始序列的截短序列。截短序列(核酸或蛋白质序列)长度可变;最低长度为这样的序列,其大小足以提供具有与所参照原始序列相当的功能和/或活性的序列,或者在严格条件下与本发明的或本发明方法所用的核酸分子杂交,而最高长度并不重要。在有些应用中,最高长度通常并不比提供期望的原始序列活性和/或功能所需的大小长多少。相当的功能表示至少为原始序列的40%、45%或50%、优选至少60%、70%、80%或90%或以上。
两WRKY结构域核酸/基因的其他变体为在降低的严格条件下、优选在严格条件下、最优选在高严格条件下,能够与上文所定义的两WRKY结构域核酸/基因杂交的核酸。杂交序列可以包括编码多肽的核苷酸,所述多肽从氨基末端到羧基末端包含:(i)Pro-Ser富含结构域,和(ii)两个WRKY结构域,包括锌指C2-H2基序。杂交序列可任选地包含如下一项或多项:(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和(iii)保守结构域,其与SEQ ID NO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性。杂交序列可以在Pro-Ser富含结构域中还包含LXSP基序(其中L为Leu,S为Ser,P为Pro,而X为任意氨基酸)。杂交序列通常长度至少为100、125、150、175、200或225个核苷酸,优选长度至少为250、275、300、325、350、375、400、425、450或475个核苷酸,还优选长度至少为500、525、550、575、600、625、650、675、700或725个核苷酸,更优选长度至少为750、800、900、1000、1100、1200或1300个核苷酸,且最优选长度至少为1400个或更多个核苷酸。优选杂交序列为能够与表1中所给出的和/或序列表中所述的任一核酸杂交的杂交序列。最优选核酸序列的杂交序列与SEQ ID NO:1或SEQ ID NO:50所示核酸的杂交。
本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂交过程能够完全在溶液中发生,即互补的核酸都在溶液中。杂交过程也可以在如下情况下进行,即互补核酸之一固定于基质上,如磁珠、琼脂糖珠或任何其它树脂上。此外,杂交过程也可以如此进行,即其中互补核酸之一固定在固相支持物如硝酸纤维素或尼龙膜上,或者例如用照相平板印刷固定在例如硅质玻璃支持物上(后者称为核酸阵列或微阵列,或称为核酸芯片)。为了使杂交发生,通常使核酸分子热变性或化学变性,以使双链解链成两条单链,和/或除去单链核酸中的发夹结构或其它二级结构。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。
在核酸杂交实验如Southern和Northern杂交的情况中,“严格杂交条件”和“严格杂交洗涤条件”依赖于序列,并且在不同的环境参数下不同。熟练的技术人员知晓可以在杂交和洗涤过程中改变的多种参数,从而保持或者改变严格条件。
Tm是在确定的离子强度和pH值下,50%的靶序列与完全匹配的探针杂交的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性杂交。在低于Tm值16℃到32℃获得最大杂交率。在杂交溶液中存在一价阳离子会减少两核酸链之间的静电排斥作用,从而促进杂合体形成;当钠浓度高达0.4M时,这一作用明显。每个百分点的甲酰胺可使DNA-DNA和DNA-RNA双链体的解链温度降低0.6到0.7℃,加入50%甲酰胺能够使杂交在30到45℃完成,不过这将降低杂交率。碱基对错配降低杂交率和双链体的热稳定性。平均而言,对于大的探针,每个百分点碱基错配使Tm值下降约1℃。Tm值可以用取决于杂合体类型的下列方程式计算:
1.DNA-DNA杂合体(Meinkoth和Wahl,Anal.Biochem.138:267-284,1984):
Tm=81.5℃+16.6xlog[Na+]a+0.41x%[G/Cb]-500x[Lc]-1-0.61×%甲酰胺
2.DNA-RNA或RNA-RNA杂合体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3.寡DNA或寡RNAd杂合体:
<20个核苷酸:Tm=2(ln)
20-35个核苷酸:Tm=22+1.46(ln)
a或对于其它一价阳离子,但是仅在0.01-0.4 M范围内精确。
b仅对于范围30%到75%的%GC精确。
cL=双链体的碱基对长度。
d寡,寡核苷酸;ln,引物的有效长度=2×(G/C数)+(A/T数)。
注释:对于每1%甲酰胺,Tm值降低约0.6到0.7℃,而6M尿素的存在可使Tm值降低约30℃。
杂交特异性通常是杂交后洗涤的函数。为了除去非特异杂交产生的背景,用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低、洗涤温度越高,洗涤的严格性就越高。洗涤条件通常在等于或低于杂交严格性的条件下进行。通常,进行核酸杂交测定或基因扩增检测操作的合适的严格条件如上文所示。也可以选择更高或更低的严格性条件。通常,对于在确定的离子强度和pH值下的特定序列,选择比热解链温度(Tm)低大约50℃的低严格条件。中等严格条件温度比Tm低20℃,而高严格条件温度比Tm低10℃。例如,严格条件是至少像如条件A-L一样严格;降低的严格条件是至少像如条件M-R一样严格。可以通过许多已知技术中的任一来控制非特异性结合,所述技术诸如,例如用含蛋白质的溶液封闭膜,在杂交缓冲液中添加异源RNA、DNA和SDS,以及用RNA酶处理。下表2中列出了杂交和洗涤条件的实例。
表2:杂交和洗涤条件的实例
严格条件 多核苷酸杂合体± 杂合体长度(bp) 杂交温度和缓冲液 洗涤温度和缓冲液
A DNA:DNA >或等于50 65℃1×SSC;或42℃,1×SSC和50%甲酰胺 65℃;0.3×SSC
B DNA:DNA <50 Tb*;1×SSC Tb*;1×SSC
C DNA:RNA >或等于50 67℃1×SSC;或45℃,1×SSC和50%甲酰胺 67℃;0.3×SSC
D DNA:RNA <50 Td*;1×SSC Td*;1×SSC
严格条件 多核苷酸杂合体± 杂合体长度(bp) 杂交温度和缓冲液 洗涤温度和缓冲液
E RNA:RNA >或等于50 70℃1×SSC;或50℃,1×SSC和50%甲酰胺 70℃;0.3×SSC
F RNA:RNA <50 Tf*;1×SSC Tf*;1×SSC
G DNA:DNA >或等于50 65℃4×SSC;或45℃,4×SSC和50%甲酰胺 65℃;1×SSC
H DNA:DNA <50 Th*;4×SSC Th*;4×SSC
I DNA:RNA >或等于50 67℃4×SSC;或45℃,4×SSC和50%甲酰胺 67℃;1×SSC
J DNA:RNA <50 Tj*;4×SSC Tj*;4×SSC
K RNA:RNA >或等于50 70℃4×SSC;或40℃,6×SSC和50%甲酰胺 67℃;1×SSC
L RNA:RNA <50 Tl*;2×SSC Tl*;2×SSC
M DNA:DNA >或等于50 50℃4×SSC;或40℃,6×SSC和50%甲酰胺 50℃;2×SSC
N DNA:DNA <50 Tn*;6×SSC Tn*;6×SSC
O DNA:RNA >或等于50 55℃4×SSC;或42℃,6×SSC和50%甲酰胺 55℃;2×SSC
严格条件 多核苷酸杂合体± 杂合体长度(bp) 杂交温度和缓冲液 洗涤温度和缓冲液
P DNA:RNA <50 Tp*;6×SSC Tp*;6×SSC
Q RNA:RNA >或等于50 60℃4×SSC;或45℃,6×SSC和50%甲酰胺 60℃;2×SSC
R RNA:RNA <50 Tr*;4 ×SSC Tr*;4×SSC
“杂合体长度”是杂交核酸的预期长度。当已知序列的核酸杂交时,可以通过比对序列及鉴别本文所述的保守区域来确定杂合体长度。
在杂交和洗涤缓冲液中,可以用SSPE(1×SSPE是0.15M NaCl,10mM NaH2PO4和1.25mM EDTA,pH7.4)代替SSC(1×SSC是0.15M NaCl和15mM柠檬酸钠);杂交完成后洗涤15分钟。杂交和洗涤可以另外地包括5×Denhardt′s试剂、0.5-1.0%SDS、100μg/ml变性片段化的鲑精DNA、0.5%焦磷酸钠和高达50%的甲酰胺。
*Tb-Tr:对于预期长度小于50个碱基对的杂合体,杂交温度应该比杂合体的解链温度Tm低5-10℃;根据上述方程式确定Tm
±本发明还包括以PNA或修饰的核酸代替任一或多个DNA或RNA杂交配偶体。
为了定义严格性水平,可以参考Sambrook等(2001)的《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约,或者CurrentProtocols in Molecular Biology,John Wiley & Sons,N.Y.(1989)。
两WRKY结构域核酸或其变体可以来自任何天然或人工的来源。所述核酸/基因或其变体可分离自微生物来源,如酵母、真菌或粘霉菌(slimemold),或分离自植物、苔藓、藻类或动物(包括人类)来源。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸的天然形式。优选植物来源的核酸,无论来源于同一植物物种(例如对于其被引入的物种而言)还是来源于不同植物物种。可以从单子叶物种,优选从禾本科(Poaceae),更优选从稻或玉蜀黍中分离所述核酸。更优选地,从稻中分离的两WRKY结构域核酸表示为SEQ ID NO:1或SEQ ID NO:50,而具有两个WRKY结构域多肽序列表示为SEQ ID NO:2或SEQ ID NO:51。
可以通过在两WRKY结构域基因座内或在植物基因组的别处引入遗传修饰来调节具有两个WRKY结构域的多肽或其同源物编码核酸的表达。本文所定义的基因座意指基因组区,其包括目的基因和编码区上游或下游的10 kb。
例如,可以通过任一(或多个)如下方法引入遗传修饰:T-DNA激活、TILLING、同源重组、定点诱变和定向进化,或通过在植物中引入和表达编码具有两个WRKY结构域的多肽或此类多肽的同源物的核酸。引入遗传修饰之后的步骤是选择具有两个WRKY结构域的多肽或其同源物编码核酸经调节的表达,所述表达调节使植物相对于对照植物产率增加。
T-DNA激活标记(Hayashi等Science(1992)1350-1353)包括将通常含有启动子(也可以是翻译增强子或内含子)的T-DNA***在目的基因的基因组区(基因座)或基因编码区上游或下游10 kb,从而在构型上使启动子能够指导靶向基因的表达。通常天然启动子对靶向基因表达的调控被破坏,基因由新引入的启动子控制。启动子一般包含于T-DNA中。例如,通过农杆菌属感染将此T-DNA随机***植物基因组,并导致在***T-DNA附近的基因过表达。得到的转基因植物由于引入的启动子附近基因过表达而表现出显性表型。引入的启动子可以是任何能够在期望生物体内(在本案中是植物)指导基因表达的启动子。例如,组成型的、组织偏好的、细胞类型偏好的和诱导型的启动子都适用于T-DNA激活。
也可以通过TILLING(定向诱导的基因组局部突变)技术将遗传修饰引入两WRKY结构域基因座。这是一种诱变技术,其用于产生和/或鉴定并最终分离诱变的能够呈现出调节的WRKY活性的两WRKY结构域核酸变体。与该基因的天然形式相比,突变变体也可以在强度和表达谱(时间和位置)方面呈现出调节的WRKY表达。LING还允许选择携带此类突变变体的植物。TILLING结合了高密度诱变和高通量筛选方法。TILLING一般遵循的步骤有:(a)EMS诱变(Redei GP和Koncz C,(1992)In Methods inArabidopsis Research,Koncz C,Chua NH,Schell J编辑,新加坡,WorldScientific Publishing Co,第16-82页;Feldmann等,(1994)In MeyerowitzEM,Somerville CR编辑,Arabidopsis.冷泉港实验室出版社,冷泉港,纽约,第137-172页;Lightner J和Caspar T,(1998)In J Martinez-Zapater,JSalinas编辑,Methods on Molecular Biology,82卷Humana Press,Totowa,NJ,第91-104页);(b)DNA制备和个体合并;(c)目的区域的PCR扩增;(d)变性和退火以形成杂双链体;(e)DHPLC,其中库中杂双链体的存在会检测为色谱图上额外的峰;(f)突变个体的鉴定;和(g)突变PCR产物的测序。TILLING的方法是本领域众所周知的(McCallum等(2002)Nat Biotechnol18:455-457,由Stemple综述(2004)Nat Rev Genet 5(2):145-50)。
同源重组允许向基因组中的指定选择位置引入所选的核酸。同源重组是生物科学中常规使用的标准技术,其用于低等生物体如酵母或小立碗藓(physcomitrella)。在植物中执行同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMBO J.9(10):3077-84),而且也在作物植物,如稻中描述(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotechnol 15(2):132-8)。所靶向的核酸(其可以是上文中定义的两WRKY结构域核酸或其变体)无需靶向两WRKY结构域基因座,但是可以引入到例如高表达区域。所靶向的核酸可以是改良的等位基因,其用于替换内源基因或除内源基因之外再额外引入。
定点诱变可用于产生两WRKY结构域核酸的变体。可以通过几种方法来完成定点诱变,最常见的是基于PCR的方法(current protocols inmolecular biology.Wiley 编 辑http://www.4ulr.com/products/currentprotocols/index.html)。
定向进化也可以用于产生两WRKY结构域核酸的变体。这包括DNA改组的重复,继之以适当筛选和/或选择,以产生编码具有修饰生物活性的具有两个WRKY结构域的多肽或其同源物或部分的两WRKY结构域核酸的变体或其部分(Castle等(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
T-DNA激活、TILLING、同源重组、定点诱变和定向进化是能够产生新的两WRKY结构域核酸等位基因和变体的技术的实例。
引入遗传修饰(在本案中不需引入两WRKY结构域基因座中)的优选方法是在植物中引入和表达具有两个WRKY结构域的多肽或此类多肽的同源物的编码核酸。
具有两个WRKY结构域多肽的“同源物”也可用于本发明。同源物包括肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未修饰蛋白质具有氨基酸取代、缺失和/或***,并且与其衍生自的未修饰蛋白质具有相似的生物活性和功能活性。为了产生这样的同源物,蛋白质的氨基酸由具有相似性质(如相似的疏水性、亲水性、抗原性、形成或打破α螺旋结构或β片层结构的倾向)的其它氨基酸所替换。保守取代表是本领域众所周知的(例如见Creighton(1 984)Proteins.W.H.Freeman and Company和下表3)。
术语“同源物”也包括两种特定形式的同源物,包括直系同源(orthologous)序列和旁系同源(paralogous)序列,其涵盖用于描述基因祖先关系的进化概念。术语“旁系同源”涉及在物种基因组内部的基因复制产生的旁系基因。术语“直系同源”涉及由于物种形成产生的不同有机体中的同源基因。具有两个WRKY结构域多肽的同源物的实例在上文表1或序列表中给出。
例如,可以通过所谓的交互blast搜索容易地找到在单子叶植物种中的直系同源物。这可以通过一次BLAST而实现,包括使用查询序列(例如SEQID NO:1、SEQ ID NO:50、SEQ ID NO:2或SEQ ID NO:51)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,可使用BLASTN或TBLASTX(利用标准默认值),而当从多肽序列开始时,可使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列源自的相同生物体的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:1、SEQ ID NO:50、SEQ ID NO:2或SEQ ID NO:51的情况下,二次BLAST将会针对稻属或玉蜀黍属的序列)。然后比较一次BLAST和二次BLAST的结果。如果一次BLAST中得分靠前的命中事件来自查询序列源自的相同物种,则找到了旁系同源物,则反向BLAST理想地以查询序列作为得分靠前的命中事件(除旁系同源序列自身之外);如果一次BLAST中得分靠前的命中事件不是来自查询序列源自的相同物种,则找到了直系同源物,且优选经反向BLAST时查询序列在最高命中事件之列。得分靠前的命中事件E值低。E值越低,得分越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还通过同一性百分比来记分种种比较。同一性百分比是指在特定长度上两比较核酸(或多肽)序列之间相同的核苷酸(或氨基酸)数。在大家族的情况下可以使用CLUSTALW,继之以邻近连接树来辅助聚类可视化。
同源物可以是蛋白质“取代变体”的形式,即在氨基酸序列中至少有一个残基被除去,并在这一位置***不同的残基。氨基酸取代通常是单个残基的取代,但是视施加于多肽的功能性限制而定也可能是成簇取代;***通常在1到10个氨基酸残基的数量级。优选氨基酸取代包括保守的氨基酸取代。本领域可以容易地获得保守取代表。下表给出了保守氨基酸取代的实例。
表3:保守氨基酸取代的实例
残基 保守取代 残基 保守取代
Ala Ser Leu Ile;Val
Arg Lys Lys Arg;Gln
Asn Gln;His Met Leu;Ile
Asp Glu Phe Met;Leu;Tyr
Gln Asn Ser Thr;Gly
Cys Ser Thr Ser;Val
Glu Asp Trp Tyr
Gly Pro Tyr Trp;Phe
His Asn;Gln Val Ile;Leu
Ile Leu;Val
同源物也可以是蛋白质的“***变体”的形式,即在蛋白质的预定位置引入一个或多个氨基酸残基。***可以包括N-末端和/或C-末端的融合,以及单个或多个氨基酸的内部序列***。通常,氨基酸序列内部的***将小于N-或C-末端的融合,数量级为约1到10个残基。N-或C-末端融合蛋白质或肽的实例包括在酵母双杂交***中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳蛋白质、(组氨酸)6标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag.100表位、c-myc表位、FLAG表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白质C表位和VSV表位。
蛋白质“缺失变体”形式的同源物特征在于从蛋白质中除去一个或多个氨基酸。
可通过本领域众所周知的肽合成技术如固相肽合成法等,或通过重组DNA操作容易地得到蛋白质的氨基酸变体。用于操纵DNA序列以产生蛋白质的取代、***或缺失变体的方法是本领域众所周知的。例如,本领域技术人员熟知在DNA预定位置产生取代突变的技术,其包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、QuickChange定点诱变(Stratagene,San Diego,CA)、PCR介导的定点诱变或其它定点诱变方法。
具有两个WRKY结构域的多肽或其同源物可以是衍生物。“衍生物”包括肽、寡肽、多肽、蛋白质和酶,与天然产生形式多肽的氨基酸序列相比,其可以包括天然及非天然产生氨基酸残基的取代、缺失或添加。蛋白质的“衍生物”包括肽、寡肽、多肽、蛋白质和酶,与天然产生形式多肽的氨基酸序列相比,其可以包括天然产生的改变的、糖基化、酰基化、异戊烯化、sumoylated(泛素化)或非天然产生的氨基酸残基。衍生物还可以包括相对于其源自的氨基酸序列的一个或多个非氨基酸取代基,例如共价或非共价地结合于氨基酸序列的报告分子或其它配体,例如与之结合有利于衍生物检测的报告分子,以及相对于天然产生蛋白质的氨基酸序列而言非天然产生的氨基酸残基。
具有两个WRKY结构域的多肽或其同源物可以由两WRKY结构域核酸/基因的可选剪接变体编码。本文所用的术语“可选剪接变体”包括其中选择的内含子和/或外显子已被切除、替换或添加的核酸序列变体,或者其中内含子已被缩短或增长的核酸序列变体。这样的变体保持了蛋白质的生物活性,这可以通过选择性地保留蛋白质的功能性区段来实现。这样的剪接变体可以是天然的或人工的。产生这类剪接变体的方法是本领域众所周知的。优选的剪接变体可包括编码多肽的核苷酸,所述多肽从氨基末端到羧基末端包含:(i)Pro-Ser富含结构域,和(ii)两个WRKY结构域,包括锌指C2-H2基序。剪接变体可任选地包含如下一项或多项:(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和(iii)保守结构域,其与SEQ ID NO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性。剪接变体可以在Pro-Ser富含结构域中还包含LXSP基序(其中L为Leu,S为Ser,P为Pro,而X为任意氨基酸)。优选的剪接变体为如表1和/或序列表中所给出的任一核酸所示的、具有两个核酸WRKY结构域多肽编码核酸的剪接变体。最优选SEQ ID NO:1或SEQ ID NO:50所示核酸的剪接变体。
同源物还可以由具有两个WRKY结构域的多肽或其同源物的编码核酸的等位基因变体所编码。等位基因变体天然存在,并且这些天然等位基因的用途包含于本发明的方法中。等位基因变体包括单核苷酸多态性(SNP),以及小型***/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL在大多数生物体天然存在的多态性品系中形成最大的一组序列变体。等位基因变体可包括编码多肽的核苷酸,所述多肽从氨基末端到羧基末端包含:(i)Pro-Ser富含结构域,和(ii)两个WRKY结构域,包括锌指C2-H2基序。等位基因变体可任选地包含如下一项或多项:(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和(iii)保守结构域,其与SEQ IDNO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性。等位基因变体可以在Pro-Ser富含结构域中还包含LXSP基序(其中L为Leu,S为Ser,P为Pro,而X为任意氨基酸)。优选的等位基因变体为如表1和/或序列表中所给出的任一核酸所示的、具有两个核酸WRKY结构域多肽编码核酸的等位基因变体。最优选SEQ ID NO:1或SEQ ID NO:50所示核酸的等位基因变体。
具有两个WRKY结构域多肽编码核酸的剪接变体和等位基因变体为可用于实施本发明方法的核酸的实例。
根据本发明的优选方面,考虑两WRKY结构域核酸或其变体经调节的表达。增加基因或基因产物表达的方法在本领域内有充分的记录,并且包括,例如,由适当的启动子驱动的过表达、转录增强子或翻译增强子的使用。可以将用作启动子或增强子元件的分离的核酸引入非异源形式多核苷酸的适当位置(一般是上游),从而上调两WRKY结构域核酸或其变体的表达。例如,可以通过突变、缺失和/或取代,在体内改变内源启动子(见Kmiec,美国专利No.5,565,350;Zarling等,PCT/US93/03868),或者将分离的启动子在本发明基因的适当方向和距离引入植物细胞中,从而控制基因的表达降低基因或基因产物表达的方法在本领域内有充分的记录,并且包括,例如,通过反义技术、共抑制、RNAi技术(利用发夹RNA(hpRNA)、小干扰RNA(siRNA)、微RNA(miRNA))等下调表达。
如果期望多肽表达,通常期望在多核苷酸编码区的3’末端纳入多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、多种其它植物基因或T-DNA。例如,待加入的3’末端序列可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其他植物基因、或次优选地源自任何其它真核基因。
也可以在5’非翻译区或部分编码序列的编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的数量。已显示,在植物和动物表达构建体的转录单位中纳入的可剪接内含子均可以在mRNA和蛋白质水平使基因表达增加高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Genes Dev.1:1183-1200)。通常这类内含子被放置在转录单位5’末端附近时,其增强基因表达的作用达到最大。玉米内含子Adh1-S内含子1、2和6,Bronze-1内含子的使用是本领域公知的。通常见The MaizeHandbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
本发明还提供遗传构建体和载体,以促进可用于本发明方法的核苷酸序列的引入和/或表达。
因此,提供的基因构建体含有:
(i)如上文所定义的两WRKY结构域核酸或其变体;
(ii)一个或多个能够驱动(i)中核酸序列表达的控制序列;和任选的
(iii)转录终止序列。
可以使用本领域技术人员熟知的重组DNA技术构建用于本发明方法的构建体。可以将基因构建体***可商购的、适合于转化进入植物并适于在转化的细胞中表达目的基因的载体中。本发明因此提供了上文所定义的基因构建体在本发明方法中的用途。
用含有目的序列(即编码具有两个WRKY结构域的多肽或此类多肽的同源物的核酸)的载体转化植物。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。术语“调控元件”、“控制序列”和“启动子”在本文都可互换使用,从广义上是指能够影响与之相连的序列表达的调控核酸序列。上述术语包括源自典型真核生物基因组基因的转录调控序列(包括具有或没有CCAAT盒序列的TATA盒,其对于精确的转录起始是必需的),以及另外的调控元件(即上游激活序列、增强子和沉默子),其通过应答发育刺激和/或外部刺激或以组织特异的方式改变基因表达。该术语还包括了经典原核生物基因的转录调控序列,在此情况下可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也包含合成的融合分子或衍生物,其赋予、激活或增强细胞、组织或器官中核酸分子的表达。本文所用的术语“有效连接”指在启动子序列和目的基因之间的功能性连接,从而启动子序列能够起始目的基因的转录。
在植物中有功能的合适启动子通常是已知的。它们可以采取组成型或诱导型启动子的形式。合适的启动子能够在多细胞真核生物中进行发育和/或组织特异性表达;从而可以有利地在植物中使用叶、根、花、种子、气孔、块茎或果实特异性启动子。
例如,在植物中可用的不同植物启动子为诸如USP、LegB4-、DC3启动子或来自欧芹的泛素启动子等启动子。
“植物”启动子包含调控元件,其介导编码序列区段在植物细胞中的表达。从而,植物启动子无需为植物来源的,而是可以来源于病毒或微生物,例如,特别是来源于攻击植物细胞的病毒。
“植物”启动子也可以来源于植物细胞,例如,来源于经本文所述的欲在本发明方法中表达的核酸序列转化的植物。这对于其他“植物”调控信号同样适用,例如“植物”终止子的情况。
为在植物中表达,核酸分子必须如上文所述的那样,有效连接于或者包含合适的启动子,所述启动子在合适的地点适时地以细胞或组织特异性方式表达该基因。可用的启动子有组成型启动子(Benfey等,EMBO J.8(1989)2195-2202),如来源于植物病毒的那些启动子,如35S CAMV(Franck等,Cell 21(1980)285-294)、19S CaMV(还参见US 5352605和WO84/02913)、34S FMV(Sanger等,Plant.Mol.Biol.14,1990:433-443),或植物启动子如欧芹泛素启动子、如US 4,962,028中所述的核酮糖二磷酸缩化酶/加氧酶(Rubisco)小亚基启动子或植物启动子PRP1[Ward等,Plant.Mol.Biol.22(1993)]、SSU、PGEL1、OCS[Leisner(1988)Proc Natl Acad SciUSA 85(5):2553-2557]、lib4、usp、mas[Comai(1990)Plant Mol Biol 15(3):373-381]、STLS1、ScBV(Schenk(1999)Plant Mol Biol39(6):1221-1230)、B33、SAD1或SAD2(亚麻启动子,Jain等,Crop Science,39(6),1999:1696-1701)或nos[Shaw等(1984)Nucleic Acids Res.12(20):7831-7846]。其他组成型植物启动子的实例为甜菜V-ATPase启动子(WO 01/14572)。合成组成型启动子的实例有超级启动子(Super promoter)(WO 95/14098)和来源于G-box的启动子(WO 94/12015)。此外,适当的情况下还可以使用化学诱导型启动子,对照EP-A 388186、EP-A 335528、WO 97/06268。在植物中稳定组成型表达本发明蛋白质是有利的。然而,如果收获前的晚期表达有利的话,最好诱导型表达本发明的多肽,因为代谢操作很可能会导致植物生产延迟。
也能够通过化学诱导型启动子促进植物基因的表达(有关综述,参见Gatz 1997,Annu.Rev.Plant Physiol.Plant Mol.Biol.48:89-108)。当期望以时间特异性方式表达基因时,化学诱导型启动子尤其适用。此类启动子的实例有水杨酸诱导型启动子(WO 95/19443)、脱落酸诱导型启动子(EP 335 528)、四环素诱导型启动子(Gatz等(1992)Plant J.2,397-404)、环己醇或乙醇诱导型启动子(WO 93/21334),或者文中所述的其他启动子。
其他合适的启动子是那些针对生物或非生物胁迫起反应的启动子,例如病原诱导的PRP1基因启动子(Ward等,Plant.Mol.Biol.22(1993)361-366)、番茄热诱导型hsp80启动子(US 5,187,267)、马铃薯冷诱导型α-淀粉酶启动子(WO 96/12814)或创伤诱导型pinII启动子(EP-A-0 375 091),或者文中所述的其他启动子。
优选的启动子尤其是那些导致基因在组织和器官、在种子细胞如胚乳细胞以及发育中的胚细胞中表达的启动子。合适的启动子有油菜籽油菜napin基因启动子(US 5,608,152)、蚕豆(Vicia faba)USP启动子(Baeumlein等,Mol Gen Genet,1991,225(3):459-67)、拟南芥油质蛋白启动子(WO98/45461)、菜豆(Phaseolus vulgaris)菜豆蛋白启动子(US 5,504,200)、芸苔Bce4启动子(WO 91/13980)、豆arc5启动子、胡萝卜DcG3启动子或豆球蛋白B4启动子(LeB4;Baeumlein等,1992,Plant Journal,2(2):233-9),以及在单子叶植物中带来种子特异性表达的启动子,如玉米、大麦、小麦、黑麦、稻等。有利的种子特异性启动子有蔗糖结合蛋白启动子(WO 00/26388)、菜豆蛋白启动子和napin启动子。必须考虑的合适的启动子有大麦lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230),以及WO 99/16890中所述的启动子(来自大麦大麦醇溶蛋白基因、稻谷蛋白基因、稻oryzin基因、稻醇溶谷蛋白基因、小麦醇溶蛋白基因、小麦谷蛋白基因、玉米玉米醇溶蛋白基因、燕麦谷蛋白基因、高粱kasirin基因、黑麦黑麦碱基因的启动子)。其他合适的启动子为Amy32b、Amy 6-6和Aleurain[US 5,677,474]、Bce4(油菜籽油菜)[US 5,530,149]、大豆球蛋白(大豆)[EP 571 741]、磷酸烯醇式丙酮酸羧化酶(大豆)[JP 06/62870]、ADR12-2(大豆)[WO 98/08962],异柠檬酸裂合酶(油菜籽油菜)[US 5,689,040]或α-淀粉酶(大麦)[EP 781 849]。可用于在植物中表达基因的其他启动子有叶特异性启动子,如DE-A 19644478中所述的那些;或者光调控的启动子,如豌豆petE启动子。
其他合适的植物启动子有胞质FBPase启动子或马铃薯ST-LSI启动子(Stockhaus等,EMBO J.8,1989,2445)、大豆磷酸核糖焦磷酸氨基转移酶启动子(GenBank登录号U87999)或EP-A-0 249 676中描述的瘤特异性启动子(node-specific promoter)。
有利地,可以使用任何类型的启动子驱动核酸序列的表达。启动子可以是诱导型启动子,即应答发育、化学、环境或物理刺激,具有诱导的或增加的转录起始。诱导型启动子的实例是胁迫诱导型启动子,即当植物接触多种胁迫条件时激活的启动子。另外或可选地,所述启动子可以是组织特异性启动子,即能够在某些组织,如在叶、根、种子等组织中优先地起始转录的启动子。
在一个实施方案中,两WRKY结构域核酸或其变体有效连接于组成型启动子。组成型启动子在其生长和发育的大多数但不必然是所有阶段都转录激活,并且基本上是普遍表达。优选启动子为GOS2启动子(来自稻)(SEQID NO:42)。也可用来驱动两WRKY结构域核酸表达的其他组成型启动子的实例示于下表4。
表4:组成型启动子的实例
基因来源 表达模式 参考文献
肌动蛋白 组成型 McElroy等,Plant Cell,2:163-171,1990
CAMV 35S 组成型 OdeH等,Nature,313:810-812,1985
CaMV 19S 组成型 Nilsson等,Physiol.Plant.100:456-462,1997
GOS2 组成型 de Pater等,Plant J Nov;2(6):837-44,1992
泛素 组成型 Christensen等,Plant Mol.Biol.18:675-689,1992
稻亲环蛋白 组成型 Buchholz等,Plant Mol Biol.25(5):837-43,1994
玉米H3组蛋白 组成型 Lepetit等,Mol.Gen.Genet.231:276-285,1992
肌动蛋白2 组成型 An等,Plant J.10(1);107-121,1996
在另一实施方案中,两WRKY结构域核酸或其变体有效的连接于种子特异性启动子,优选胚和/或糊粉特异性启动子。优选胚和/或糊粉特异性启动子为油质蛋白启动子,更优选胚和/或糊粉特异性启动子为18 kDa油质蛋白启动子,还优选胚和/或糊粉特异性启动子为稻18 kDa油质蛋白启动子(Wu等(1998)J Biochem 123(3):386-91),最优选胚和/或糊粉特异性启动子与SEQ ID NO:43所示的序列基本上相似或如SEQ ID NO:43所示。也可用来驱动两WRKY结构域核酸表达的其他种子特异性启动子的实例示于下
表5。
表5:种子特异性启动子的实例
基因来源和名称 表达模式 参考文献
稻RP6 胚乳特异性 Wen等(1993)Plant Physiol101(3):1115-6
基因来源和名称 表达模式 参考文献
高梁高梁醇溶蛋白 胚乳特异性 DeRose等(1996)Plant Molec Biol32:1029-35
玉米醇溶蛋白 胚乳特异性 Matzke等(1990)Plant Mol Biol14(3):323-32
稻油质蛋白18 kDa 胚(和糊粉)特异性 Chuang等(1996)J Biochem120(1):74-81
稻油质蛋白16 kDa 胚(和糊粉)特异性 Chuang等(1 996)J Biochem120(1):74-81
大豆β-伴大豆球蛋白 Chiera等(2005)Plant Molec Biol56(6):895-904
稻Wsi18 整个种子 Joshee等(1998)Plant Cell Physiol39(1):64-72.
整个种子 Sasaki等(2002)NCBI登录号BAA85411
应当明白,本发明的实用性不局限于SEQ ID NO:1或SEQ ID NO:50所示的两WRKY结构域核酸,而且本发明的实用性也不局限于受GOS2启动子或油质蛋白启动子所驱动的两WRKY结构域核酸表达。
任选地,还可以在引入植物的构建体中使用一个或多个终止子序列。术语“终止子”包括控制序列,其为位于转录单位末端的DNA序列,传递信号引发初级转录物的3’加工和多聚腺苷酸化以及转录的终止。另外的调控元件可以包括转录和翻译的增强子。本领域技术人员将知道适合用于实施本发明的终止子和增强子的序列。这类序列为本领域技术人员所公知或者可以容易地获得。
本发明的遗传构建体还包括在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为附加型遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测和/或选择如序列表中所述以及本发明方法中所用核酸序列的成功转移,最好使用标记基因(=报告基因)。这些标记基因能够通过一系列不同的原理鉴定核酸分子的成功转移,例如通过视觉鉴定,借助于荧光、发光或者人眼不可见的光波波长范围,通过除草剂或抗生素抗性,通过称为营养标记(营养缺陷型标记)或抗营养标记(antinutritive marker),通过酶测定或通过植物激素。可提及的此类标记的实例有GFP(=绿色荧光蛋白);荧光素/荧光素酶***;β-半乳糖苷酶及其着色底物,例如X-Gal;针对例如咪唑啉酮、草甘磷、膦丝菌素或磺胺脲的除草剂抗性;针对例如博来霉素、潮霉素、链霉素、卡那霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟菌素等等的抗生素抗性;营养标记如甘露糖或木糖的利用;或抗营养标记如对2-脱氧葡萄糖的抗性。这仅仅是一小部分可能的标记的名单。技术人员对这类标记极为熟悉。优选根据不同生物体和选择方法来使用不同的标记。
因此遗传构建体可以任选地包括可选择的标记基因。如本文所用,术语“可选择的标记或可选择的标记基因”包括赋予细胞表型的任何基因,该基因在细胞中表达,有利于鉴定和/或选择经本发明的核酸构建体转染或转化的细胞。适当的标记可以选自赋予抗生素或除草剂抗性的标记,其引入新的代谢性状或允许可视选择。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的nptII,或磷酸化潮霉素的hpt)、赋予除草剂抗性的基因(例如提供Basta抗性的bar;提供草甘膦抗性的aroA或gox)、或者提供代谢性状的基因(例如允许植物使用甘露糖作为唯一碳源的manA)。可视标记基因导致形成颜色(例如β-葡糖醛酸糖苷酶GUS)、发光(例如荧光素酶)或荧光(绿色荧光蛋白GFP及其衍生物)。
已知核实稳定或瞬时整合进植物细胞,仅少数细胞摄入外来DNA,并整合进其基因组(如果期望的话),这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,通常将编码可选择标记(如上文所属,例如抗生素抗性)的基因与目的基因一起引入宿主细胞中。植物中优选的可选择标记包括那些赋予除草剂如草甘膦或草丁膦抗性的标记。其他合适的标记为例如编码参与例如糖或氨基酸生物合成通路基因的标记,如β-半乳糖苷酶、ura3或ilv2。编码基因如荧光素酶、gfp或其他荧光基因的标记同样适用。这些标记和前述标记可在突变体中使用,所述突变体中原有的这些基因没有功能,例如由于常规方法而缺失。此外,编码可选择标记的核酸分子与编码本发明多肽的核酸分子可以在同一个载体中引入宿主细胞或用于本发明的方法,或者在单独的载体中。由所引入的核酸稳定转染的细胞可以例如通过选择(例如,整合有可选择标记的细胞存活而其他细胞死去)予以鉴定。
一旦成功引入核酸,将不再需要或不期望转基因宿主细胞中存在标记基因,通常特别是抗生素和除草剂抗性基因,所以根据本发明引入核酸的方法有利地采用能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采用两个载体同时进行转化,一个载体携带根据本发明的核酸,而第二个携带标记基因。较大比例的转化体接收或者对于植物而言含有(高达40%或以上的转化体)两个载体。对于农杆菌转化,转化体通常只接收载体的一部分,即为T-DNA所侧接的序列,其通常指表达盒。随后可通过杂交从转化植物中除去标记基因。在另一种方法中,利用整合进转座子的标记基因与期望的核酸一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交,或者用赋予转座酶表达的核酸瞬时或稳定转化转化体。在有些情况下(约10%),一旦成功进行了转化,转座子跳出宿主细胞基因组并丢失。在其他一些情况下,转座子跳至不同的位置。在这些情况下,必须通过杂交消除标记基因。在微生物学领域,研发了有可能或便于检测此类事件的技术。另一有利的方法有赖于称为重组***的方法,其优势在于可以免除杂交消除步骤。最著名的这类***称为Cre/lox***。Cre1为重组酶,且切除位于loxP序列之间的序列。如果标记基因整合在loxP序列之间,一旦成功进行了转化,由于该重组酶的表达,其得以切除。其他重组***有HIN/HIX、FLP/FRT及REP/STB***(Tribble等,J.Biol.Chem.275,2000:22255-22267;Velmurugan等,J.Cell Biol.149,2000:553-566)。根据本发明的核酸有可能位点特异性地整合进植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
本发明还包括可由本发明方法获得的植物。本发明因此提供可由本发明方法获得的植物、植物部分(包括种子)和植物细胞,所述植物、植物部分和植物细胞中引入了两WRKY结构域核酸或其变体。
本发明还提供用于生产相对于对照植物产率增加的转基因植物的方法,包括在植物中引入和表达两WRKY结构域核酸或其变体。
更具体地,本发明提供用于生产相对于对照植物产率增加的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达如本文所述的两WRKY结构域核酸或其变体;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
可以将核酸直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明的优选方面,优选通过转化将核酸引入植物。
本文所指术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞,不考虑转移所用的方法。通过器官发生或者胚胎发生的能够随即克隆增殖的植物组织都可以使用本发明的遗传构建体转化,并从其再生整个植物。具体的组织选择将因可提供和最适于转化的具体物种的克隆增殖***而变。示例性的靶组织包括叶盘、花粉、胚、子叶、胚轴、雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如子叶分生组织和胚轴分生组织)。可以将多核苷酸瞬时地或稳定地引入宿主细胞,并且可以,例如作为质粒保持非整合的状态。可选地,其可以整合进入宿主基因组。得到的转化植物细胞可以接着以本领域技术人员熟知的方式再生为转化的植物。
外来基因转移进入植物基因组中称为转化。为实施转化,利用转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。有利的转化法是植物原位(in planta)转化。为此,有可能例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。根据本发明,证明使转化农杆菌悬液作用于完整植株或至少花原基尤为有利。随后培养植物,直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件中,从而可将转化植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长周期之后,通过喷雾对其进行选择。另一可能性包括使用合适的选择剂,将种子,适用的情况下是在授粉之后,种植在琼脂板上,从而仅转化的种子能够长成植物。其他有利的转化方法、特别是植物转化方法,为技术人员所公知,并在下文描述。
植物物种的转化目前是一种相当常规的技术。有利地,可以使用几种转化方法的任一向适当的祖先细胞引入目的基因。转化方法包括用脂质体、电穿孔、增强游离DNA摄取的化学品、直接向植物注射DNA、粒子枪轰击、用病毒或花粉转化以及显微注射(microprojection)。方法可以选自用于原生质体的钙/聚乙二醇方法(Krens,F.A.等,(1882)Nature 296,72-74;Negrutiu I.等,(1987)Plant Mol.Biol.8:363-373);原生质体的电穿孔法(Shillito R.D.等,1985 Bio/Technol 3,1099-1102);植物材料的显微注射(Crossway A.等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击(Klein T.M.等,(1987)Nature 327:70);(非整合的)病毒感染,等等。优选使用任何熟知的稻转化方法,通过农杆菌属介导的转化,产生表达两WRKY结构域核酸/基因的转基因稻植物,例如在以下任一文献中描述的方法:公开的欧洲专利申请EP 1198985 A1,Aldemita和Hodges (Planta,199:612-617,1996);Chan等(Plant Mol.Biol.22(3)491-506,1993),Hiei等(Plant J.6(2):271-282,1994)其公开的内容如同其陈述的全部内容那样并入本文作为参考。至于谷物转化,优选的方法如Ishida等(Nat.Biotechnol.14(6):745-50,1996)或Frame等(Plant Physiol.129(1):13-22,2002)中所述,其公开的内容如同其陈述的全部内容那样并入本文作为参考。作为举例,所述方法由B.Jenes等,Techniques for Gene Transfer,在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press(1993)128-143以及Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中进一步描述。优选将待表达的核酸或构建体克隆到载体中,所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens),例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。然后以已知的方式利用由这样的载体转化的农杆菌来转化植物,特别是作物植物,例如作为举例的烟草植物,例如通过在农杆菌溶液中水浴擦伤的叶子或剁碎的叶子,然后在合适的培养基中培养之。例如,通过根癌农杆菌的植物转化由Hfgen和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述,或者尤其是由于F.F.White,Vectors for Gene Transfer in Higher Plants在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press,1993,第15-38页而为人所知。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。
如所提到的那样,用本发明表达载体转化的农杆菌也可以以其自身已知的方法来转化植物,如实验植物,像拟南芥或作物植物,例如像谷类、玉米、燕麦、黑麦、大麦、小麦、大豆、稻、棉花、甜菜、芸苔、向日葵、亚麻、***、马铃薯、烟草、番茄、胡萝卜、甜椒、油菜籽油菜、木薯淀粉、木薯、竹芋、万寿菊、苜蓿、生菜和多种树木、坚果和葡萄藤物种,特别是含油作物植物,如大豆、花生、蓖麻油植物、向日葵、玉米、棉花、亚麻、油菜籽油菜、椰子、油椰、红花(Carthamus tinctorius)、可可豆,例如通过在农杆菌溶液中水浴划破的叶子或叶节,随后在合适的培养基中培养之。
除了转化体细胞、然后再生为完整植株以外,还有可能转化植物分生组织的细胞,特别是发育成配子的那些细胞。在这种情况下,转化的配子循着天然植物的发育而产生转基因植物。因此,例如,用农杆菌处理拟南芥的种子,并从发育中的植物获得种子,其中一定比例经转化因而是转基因的[Feldman,KA和Marks MD(1987).Mol Gen Genet 208:274-289;Feldmann K(1992).在C Koncz,N-H Chua和J Shell编辑Methods inArabidopsis Research.Word Scientific,Singapore,第274-289页]。可选方法基于荧光的反复去除以及莲座叶中心切除部位与转化农杆菌一起进行的孵育,由此在随后的时间点同样能够获得转化的种子(Chang(1994).PlantJ.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,特别有效的方法是真空渗透法,及其改良法如“浸花法”(floral dip)。对于拟南芥的真空渗透,用农杆菌悬液减压处理完整植株[Bechthold,N(1993).C RAcad Sci Paris Life Sci,316:1194-1199],而对于“浸花法”,将发育中的花组织与表面活性剂处理的农杆菌悬液一起短暂孵育[Clough,SJ und Bent,AF(1998).The Plant J.16,735-743]。在两种情况下均收获一定比例的转基因种子,且可通过在上述选择性条件下培养而将这些种子与非转基因种子区分开来。另外,质体的稳定转化是有利的,因为质体在多数作物中母系遗传,降低或消除了转基因通过花粉流失的风险。叶绿体基因组的转化通常通过Klaus等,2004[Nature Biotechnology 22(2),225-229]***展示的方法实现。简言之,将待转化的序列与可选择的标记基因一起克隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性整合到质体中。质体转化已在许多不同的植物物种中描述,且综述可摘自Bock(2001)Transgenic plastids in basic research and plant biotechnology.J Mol Biol.2001 Sep 21;312(3):425-38或Maliga,P(2003)Progresstowards co mmercialization of plastid transformation technology.TrendsBiotechnol.21,20-28。其他生物技术方法最近被报道为不含标记的质体转化体的形式,这可以通过瞬时共合体标记基因产生(Klaus等,2004,NatureBiotechnology 22(2),225-229)。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者Hfgen和Willmitzer的出版物。
DNA转移和再生之后,可评估推定转化的植物,例如用Southern分析评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析和/或定量PCR监测新引入DNA的表达水平,这类技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交得到纯合的第二代(或T2)转化体,而T2植物进一步通过经典育种技术繁殖。
产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如经过转化包含表达盒的所有细胞);转化和非转化组织的嫁接体(例如在植物中,转化的根茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述方法产生的任何植物细胞或植物,以及所有的植物部分和其繁殖体。本发明还涵盖由任意上述方法产生的初级转化或转染的细胞、组织、器官或整个植物的后代,所述后代的唯一要求是与本发明方法产生的亲本呈现同样的基因型和/或表型特性。本发明也包括含有分离的两WRKY结构域核酸或其变体的宿主细胞。本发明优选的宿主细胞是植物细胞。本发明也延及植物可收获的部分,例如,但不限于种子、叶、果实、花、茎培养物、根茎、块茎和球茎。本发明还涉及由这样的植物的可收获部分衍生的产品,优选由之直接衍生的产品,如干丸或干粉、油类、脂肪和脂肪酸、淀粉或蛋白质。
本发明还包括如本文所定义的两WRKY结构域核酸或其变体的用途以及具有两个WRKY结构域的多肽或其同源物的用途。
一类这样的用途涉及提高产率,特别是种子产率。产率如上文所定义,并且优选包括如下一项或多项:增加的TKW、增加的种子长度、增加的单个种子宽度、增加的单个种子面积、增加的种子数量以及增加的每个圆锥花序的花朵数量。
可以在育种程序中使用两WRKY结构域核酸或其变体或者具有两个WRKY结构域的多肽或其同源物,其中鉴定可以遗传地连接于两WRKY结构域基因或其变体的DNA标记。可以使用两WRKY结构域核酸/基因或其变体或者具有两个WRKY结构域的多肽或其同源物界定分子标记。然后可以在育种程序中使用此DNA或蛋白质标记,以选择产率增加的植物。例如,两WRKY结构域基因或其变体可以是表1和/或序列表中所给出的任一核酸所示的核酸。
两WRKY结构域核酸/基因的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变体;可选地,此程序可以以收集无意产生的所谓“天然”起源的等位基因变体开始。然后通过例如PCR鉴定等位基因变体。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,所述等位基因变体提供增加的产率。一般通过监测含有所研究序列不同等位基因变体的植物的生长行为来进行选择,所述研究序列的不同等位基因变体是例如表1中所给出的任一核酸的不同等位基因变体。
可以在温室或田地中监测生长行为。更多任选的步骤包括,将经鉴定含有较好等位基因变体的植物与其他植物杂交。例如,可使用这种方法产生目的表型特征的组合。
两WRKY结构域核酸或其变体还可以作为探针,用于对为那些基因连锁性状的一部分并作为其标志物的基因进行遗传和物理作图。这样的信息可以在植物育种中使用,以得到具有所期望表型的品系。两WRKY结构域核酸或其变体的这类应用仅需要长至少15、16、17、18、19或20个核苷酸的核酸序列。两WRKY结构域核酸或其变体可以用作限制性片段长度多态性(RFLP)标记。可用两WRKY结构域核酸或其变体探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。此外,可以使用核酸探测含有一组个体的限制性内切酶处理的基因组DNA的Southern印迹,所述一组个体为代表明确的遗传杂交的亲本和子代的一组个体。记录DNA多态性的分离,并用于计算在先前用此群体获得的遗传图谱中两WRKY结构域核酸或其变体的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在遗传作图中使用的植物基因衍生探针的产生和用途描述于Bematzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近亲同基因系和其它个体组作图。这类方法是本领域技术人员众所周知的。
核酸探针也可以用于物理作图(即在物理图谱上安置序列;见Hoheisel等,在Non-mammalian Genomic Analysis:A Practical Guide,Academicpress 1996,第319-346页,及其中引用的参考文献)。
在另一实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向用于大的克隆(几个kb到几百个kb;见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸进行。实例包括等位基因特异性扩增[Kazazian(1989)J.Lab.Clin.Med11:95-96]、PCR扩增片段的多态性[CAPS;Sheffield等(1993)Genomics16:325-332]、等位基国特异性连接[Landegren等(1988)Science 241:1077-1080]、核苷酸延伸反应[Sokolov(1990)Nucleic Acid Res.18:3671]、放射杂交作图[Walter等(1997)Nat.Genet.7:22-28]和Happy作图[Dear和Cook(1989)Nucleic Acid Res.17:6795-6807]。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间的DNA序列差异。然而,这对作图方法通常不是必要的。
根据本发明的方法得到如前所述产率提高的植物。这些有利的生长特征还可以组合其它经济上有利的性状,如其他提高产率的性状、对多种胁迫的耐受性、改良多种构造特征和/或生化和/或生理学特征的性状。
附图说明
现参考以下附图描述本发明,其中:
图1显示了具有两个WRKY结构域多肽的典型结构域结构。Pro-Ser富含结构域定位于蛋白质的氨基末端;LXSP基序(L代表Leu,S代表Ser,P代表Pro,而X代表任意氨基酸)包含在此区域中,且已标出。两个WRKY结构域以黑框圈出。在两个WRKY结构域之间为酸性(AC)链和推定的核定位信号(NLS)。代表羧基末端WRKY结构域的SEQ ID NO:39基序也以方框圈出。
图2显示了Arath_WRKY家族58个成员(来自Eulgem等(2000)TrendsPlant Sci 5(5):199-206)的***发生分析。黑色箭头指示具有两个WRKY结构域多肽的聚类以及位于其氨基末端的Pro-Ser富含结构。
图3显示了数个具有两个WRKY结构域多肽的多重比对,使用基于修饰的ClustalW算法(InforMax,Bethesda,MD,http://www.informaxinc.com)的VNTI AlignX多重比对程序建立,采用默认设置,空位开放罚分为10,空位延伸罚分为0.05。在必要的地方还进行了微小的人工编辑,以更好地定位一些保守区域。植物多肽上氨基末端至羧基末端的重要结构域以方框圈出:Pro-Ser富含结构域及其LXSP基序(L代表Leu,S代表Ser,P代表Pro,而X代表任意氨基酸),氨基末端WRKY结构域(及其七肽),包括其C2H2锌结合结构域,酸性链,NLS,SEQ ID NO:39的基序,以及羧基末端WRKY结构域(及其七肽),包括其C2H2锌结合结构域,这些结构域要么以方框圈出,要么以粗体书写。SEQ ID NO:2的LXSP基序从氨基酸至氨基酸,酸性链从第304位氨基酸至第309位氨基酸,NLS从第311位氨基酸至第314位氨基酸。
图4显示了双元载体p0700和p0709,用于在稻中表达分别处于GOS2启动子(内参PRO0129;如SEQ ID NO:42所示)和油质蛋白启动子(内参PRO0218;如SEQ ID NO:43所示)控制之下的具有两个WRKY结构域的稻多肽。
图5详述了用于实施本发明方法的序列实例,编码具有两WRKY结构域多肽的(全长)多核苷酸序列从起始密码子到终止密码子表示。
实施例
现参考以下实施例描述本发明,所述实施例仅意在举例说明。
DNA操作除非另外说明,重组DNA技术根据描述于(Sambrook(2001)《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约)或者Ausubel等(1994),Current Protocols in Molecular Biology,CurrentProtocols第一卷和第二卷的标准方法执行。植物分子工作的标准材料和方法由R.D.D.Croy描述于Plant Molecular Biology Labfase(1993),由BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
实施例1:稻两WRKY结构域基因的克隆
使用稻幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板,通过PCR扩增SEQ ID NO:1的稻两WRKY结构域基因。从幼苗提取的RNA经反转录后,将cDNA克隆进入pCMV Sport 6.0。该库平均***物大小为1.66 kb,并且原始克隆数的数量级在2.67×107cfu。原始滴度确定为3.34×106cfn/ml,第一次扩增之后为1010cfu/ml。提取质粒之后,将200 ng模板用于50μl PCR混合物中。PCR扩增所用的引物包括Gateway重组的AttB位点,为引物prm05769(SEQ ID NO:40;正义,起始密码子为粗体,AttB1位点为斜体:5’-GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGGCGTCCTCGACG 3’)和prm05770(SEQ ID NO:41;反义,互补,AttB2位点为斜体:5’GGGGACCACTTTGTACAAGAAAGCTGGGTGGCTCGACTAGCAGAGGA3’)。在标准条件下使用Hifi Taq DNA聚合酶进行PCR。同样用标准方法扩增和纯化1535 bp(包括attB位点)的PCR片段。接着进行Gateway操作的第一步,BP反应,在此期间将PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,p06983。质粒pDONR201作为Gateway技术的一部分购自Invitrogen。
实施例2:载体构建
随后利用进入克隆p06983与用于稻转化的指定载体p00640进行LR反应。此载体在T-DNA边界内包含功能性元件:植物可选择的标记;可筛选的标记表达盒;旨在与已克隆到进入克隆中的目的序列进行LR体内重组的Gateway表达盒。用于组成型表达(PRO0129)的稻GOS2启动子(SEQ IDNO:42)位于此Gateway盒的上游。
利用进入克隆p06983与用于稻转化的另一指定载体p00831进行第二LR反应。用于胚和/或糊粉特异性表达(PRO0218)的稻18 kDa油质蛋白启动子(SEQ ID NO:43)位于此Gateway盒的上游。
LR重组步骤之后,将所产生的表达载体p0700和p0709(图4),分别转化进入农杆菌菌株LBA4044,随后分别转化进入稻植物。使转化的稻植物生长,随后研究实施例3中描述的参数。
实施例3:稻两WRKY结构域转基因植物的评估及结果
大约产生了15到20个独立的T0稻转化体。初级转化体由组织培养室转移到温室生长并收获T1种子。4到5个事件得以保留,其中T1代发生转基因存在/缺乏的3∶1分离。通过监测可视标记的表达,在每一事件中选出大约10个含转基因(杂合子和纯合子)的T1幼苗,以及大约10个缺少转基因(无效合子)的T1幼苗。转基因植物和相应的无效合子在随机位置上并排生长。从播种期到成熟期,使植物几次通过数字成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数字图像(2048×1536像素,1600百万色)。
4个T1事件进一步在T2代中进行评价,遵循与T1代相同的评价方法,但每个事件使用更多的个体。
统计分析:F-检验
使用双因子ANOVA(变异分析)作为植物表型特性整体评估的统计模型。在由本发明基因转化的所有植物的所有事件中,对所有测量参数进行F检验。进行F检验来检查所有转化事件中基因的效应,并验证基因的整体效应,亦称为整体基因效应。真实的整体基因效应显著性的阈值设定为F检验的5%概率水平。显著性F检验值证明基因效应,其意味着不仅仅是基因的存在或位置引起表型的差异。
种子相关参数的测量
成熟的初级圆锥花序被收获、包装、标记条形码,然后在37℃烘箱中干燥三天。然后敲打圆锥花序并对所有种子进行收集和计数,得出种子总数。种子总数除以初级圆锥花序数可以估算每个圆锥花序的小穗数。用吹风装置将饱满的壳与空壳分离。丢弃空壳,并再次计数剩余的部分。饱满的壳在分析天平上称重。通过计数分离步骤之后剩余的饱满壳数来确定饱满种子数。通过称重从植物收获的全部饱满的壳来测量种子总产率。从已计数的饱满种子数及其总重外推得到千粒重(TKW)。根据种子总产率与地上面积(以mm2计)的比值乘以系数106来获得收获指数。本发明中每个圆锥花序的种子总数定义为种子总数与成熟初级圆锥花序数的比值。本发明中种子饱满率定义为饱满种子数占种子(或小穗)总数的比例(表达为%)。通过计数排除背景后地上植物部分的图片像素总数来测定植物地上部分。该值是在同一时间点从不同角度获得的图片的平均值,并通过校准将其转换为用平方毫米表示的物理表面值。实验显示这种方法测量的地上部分植物面积与植物的生物量有关。
3.1在两WRKY结构域多肽编码核酸上游具有组成型启动子的转基因稻植物的评价和结果
两WRKY结构域转基因稻植物的TKW测量结果示于表6。还显示了转基因和相应无效合子之间的百分比差异。标出了TKW显著增加的事件数,以及T1和T2代F检验的P值。
T1和T2代两WRKY结构域转基因稻植物的TKW与其无效对应物相比显著增加(表6)。
表6:T1和T2代两WRKY结构域转基因稻植物与其无效对应物相比的TKW测量结果
  显示增加的事件数   %差异     显示显著增加的事件数     F检验的P值
T1代   5个中的5个   3     5个中的2个     <0.001
T2代   4个中的4个   6     4个中的4个     <0.001
利用客户定制装置对T2代植物的种子测量单个种子参数(宽度、长度和面积),所述装置由两个主要组件即称重装置和成像装置构成,连接于用于图像分析的软件。
两WRKY结构域转基因稻植物T3种子(自T2代植物收获)的平均单个种子面积、长度和宽度测量结果示于表7。还显示了转基因和相应无效合子之间的百分比差异。标出了参数显著增加的事件数,以及F检验的P值。
T2代两WRKY结构域转基因稻植物T3种子的平均单个种子面积、长度和宽度与其无效对应物相比都显著增加(表7)。
表7:两WRKY结构域转基因稻植物T3种子(自T2代植物收获)与其无效对应物相比的平均单个种子面积、长度和宽度测量结果
  显示增加的事件数     %差异     显示显著增加的事件数     F检验的P值
  平均种子面积   4个中的4个     3     4个中的4个     <0.001
  平均种子长度   4个中的4个     2     4个中的4个     <0.001
  平均种子宽度   4个中的4个     1     4个中的2个     <0.001
3.1在两WRKY结构域多肽编码核酸上游具有胚和/或糊粉特异性启动子的转基因稻植物的评价和结果
两WRKY结构域转基因稻植物的种子总数测量结果示于表8。还显示了转基因和相应无效合子之间的百分比差异。标出了种子总数显著增加的事件数,以及T1和T2代F检验的P值。
T1和T2代两WRKY结构域转基因稻植物的种子总数与其无效对应物相比显著增加(表8)。
表8:T1和T2代两WRKY结构域转基因稻植物与其无效对应物相比的种子总数测量结果
  显示增加的事件数    %差异     显示显著增加的事件数     F检验的P值
T1代   4个中的3个   11     4个中的2个     0.0037
T2代   4个中的4个   12     4个中的2个     0.0029
两WRKY结构域转基因稻植物每个圆锥花序的花朵总数的测量结果示于表9。还显示了转基因和相应无效合子之间的百分比差异。标出了种子总数显著增加的事件数,以及T1和T2代F检验的P值。
T1和T2代两WRKY结构域转基因稻植物每个圆锥花序的花朵总数与其无效对应物相比显著增加(表9)。
表9:T1和T2代两WRKY结构域转基因稻植物与其无效对应物相比的每个圆锥花序的花朵总数的测量结果
  显示增加的事件数   %差异     显示显著增加的事件数     F检验的P值
T1代   4个中的2个   7     4个中的2个     0.0122
T2代   4个中的4个   7     4个中的1个     0.0091
实施例4:可用于实施本发明方法的具有两个WRKY结构域的多肽之间的全局相似性和同一性的确定
利用本领域可获得的方法即MatGAT(矩阵全局比对工具)软件(BMCBioinformatics.2003 4:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;由Ledion Bitincka主办的软件),来确定具有两个WRKY结构域的多肽之间的全局相似性和同一性百分比。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成举例矩阵。SEQ ID NO:2的序列在第17行。
具有两个WRKY结构域的多肽在SEQ ID NO:39(76个氨基酸的保守结构域)长度上的全局相似性和同一性软件分析结果示于表10。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。具有两个WRKY结构域的旁系同源物和直系同源物之间的同一性百分比范围为70%至100%,反映了它们之间在此保守结构域内的高度序列同一性保守。
表10:具有两个WRKY结构域的旁系同源和直系同源多肽之间保守结构域(如SEQ ID NO:39所示)的同一性和相似性百分比。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。
Figure S2006800248227D00591
Figure S2006800248227D00601

Claims (36)

1.增加相对于对照植物的植物产率的方法,包括调节植物中具有两个WRKY结构域的多肽或此类多肽的同源物编码核酸的表达,和任选地选择产率增加的植物,其中所述具有两个WRKY结构域的多肽或同源物从氨基末端到羧基末端包含:(i)Pro-Ser富含结构域,和(ii)两个WRKY结构域,包括锌指C2-H2基序。
2.根据权利要求1的方法,其中所述具有两个WRKY结构域的多肽或同源物还包含如下一项或多项:(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和(iii)保守结构域,其与SEQ ID NO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性。
3.根据权利要求1或2的方法,其中所述具有两个WRKY结构域的多肽或同源物在所述Pro-Ser富含结构域中还包含LXSP基序(其中L为Leu,S为Ser,P为Pro,而X为任意氨基酸)。
4.根据权利要求1至3中任一项的方法,其中与Swiss-Prot蛋白质序列数据库蛋白质的平均氨基酸组成(以%表示)相比,所述Pro-Ser富含结构域中所富含的Pro和Ser至少为其两倍。
5.根据权利要求1至4中任一项的方法,其中通过引入遗传修饰来实现所述表达的调节,优选在编码具有两个WRKY结构域的多肽或此类多肽的同源物的基因座引入遗传修饰。
6.根据权利要求5的方法,其中通过T-DNA激活、TILLING、同源重组、定点诱变或定向进化中任一实现所述遗传修饰。
7.增加相对于对照植物的产率的方法,包括在植物中引入和表达权利要求1中所定义的两WRKY结构域核酸或其变体。
8.根据权利要求7的方法,其中所述变体是两WRKY结构域核酸的部分或能够与两WRKY结构域核酸杂交的序列,所述部分或杂交序列编码多肽,所述多肽从氨基末端到羧基末端包含:(i)Pro-Ser富含结构域,和(ii)两个WRKY结构域,包括锌指C2-H2基序。
9.根据权利要求7或8的方法,其中所述两WRKY结构域核酸或其变体在植物中过表达。
10.根据权利要求7至9中任一项的方法,其中所述两WRKY结构域核酸或其变体是植物来源的,优选来自单子叶植物,还优选来自禾本科,更优选核酸来自稻或玉蜀黍。
11.根据权利要求7至10中任一项的方法,其中所述变体编码SE Q ID NO:2或SE Q ID NO:51所示多肽的直系同源物或旁系同源物。
12.根据权利要求7至11中任一项的方法,其中所述两WRKY结构域核酸或其变体有效连接于组成型启动子。
13.根据权利要求12的方法,其中所述组成型启动子是GOS2启动子。
14.根据权利要求7至11中任一项的方法,其中所述两WRKY结构域核酸或其变体有效连接于胚和/或糊粉特异性启动子。
15.根据权利要求14的方法,其中所述胚和/或糊粉特异性启动子是油质蛋白启动子。
16.根据权利要求1至15中任一项的方法,其中所述增加的产率是增加的种子产率。
17.根据权利要求1至16中任一项的方法,其中所述增加的产率选自如下一项或多项:增加的TKW、增加的单个种子面积、增加的单个种子长度、增加的单个种子宽度、增加的种子数量和增加的每个圆锥花序的花朵数量,各自相对于对照植物而言。
18.可通过权利要求1至17中任一项所述的方法获得的植物、植物部分或植物细胞。
19.分离的核酸分子,包含选自下组的核酸分子:
(a)分离的核酸分子,如SEQ ID NO:50所示;
(b)分离的核酸分子,编码如SEQ ID NO:51所示的氨基酸序列;
(c)分离的核酸分子,作为遗传密码简并性的结果,其序列能够根据如SEQ ID NO:51所示的多肽序列推断出来;
(d)分离的核酸分子,其编码的多肽与(a)至(c)中核酸分子所编码的多肽的氨基酸序列具有至少80%的同一性;
(e)分离的核酸分子,编码如SEQ ID NO:51所示的氨基酸分子的同源物、衍生物或活性片段,所述同源物、衍生物或活性片段为植物来源,且有利地包含:
(i)位于两个WRKY结构域之间的酸性链,其中6个氨基酸中至少3个为Asp(D)或Glu(E);
(ii)位于两个WRKY结构域之间的推定的NLS,其中4个氨基酸中至少3个为Lys(K)或Arg(R);和
(iii)保守结构域,其与SEQ ID NO:39具有至少50%、60%或70%、优选75%或80%、更优选90%、甚至更优选91%、92%、93%、94%或95%、最优选96%、97%、98%或99%的同一性;
(f)分离的核酸分子或其互补物,能够与上述(a)至(c)中核酸分子杂交,其中所述杂交序列或其互补物编码(a)至(e)中的植物蛋白质;
其中所述核酸分子在植物中具有增加产率和/或生长的活性。
20.构建体,含有:
(i)权利要求1中所定义的两WRKY结构域核酸或其变体;
(ii)能够驱动(i)中核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列;或
(iv)如权利要求19所述的核酸序列。
21.根据权利要求20的构建体,其中所述控制序列是组成型启动子。
22.根据权利要求21的构建体,其中所述组成型启动子是GOS2启动子。
23.根据权利要求22的构建体,其中所述GOS2启动子如SEQID NO:42所示。
24.根据权利要求20的构建体,其中所述控制序列是胚和/或糊粉特异性启动子。
25.根据权利要求24的构建体,其中所述胚和/或糊粉特异性启动子是油质蛋白启动子。
26.根据权利要求25的构建体,其中所述油质蛋白启动子如SEQ ID NO:43所示。
27.由权利要求19所述的核酸序列或者权利要求20到26中任一项所述的构建体转化的植物、植物部分或植物细胞。
28.生产相对于对照植物产率增加的转基因植物的方法,该方法包括:
(i)在植物或植物细胞中引入和表达权利要求1中所定义的两WRKY结构域核酸或其变体;
(ii)在促进植物生长和发育的条件下培养植物细胞。
29.产率增加的转基因植物,其通过将两WRKY结构域核酸或其变体引入所述植物而产生。
30.根据权利要求18、27或29的植物,其中所述植物是单子叶植物,如甘蔗,或者其中所述植物是谷类,如稻、玉米、小麦、大麦、粟、黑麦、燕麦或高粱。
31.权利要求18、27、29或30中任一项所述植物的可收获部分。
32.根据权利要求31的植物可收获部分,其中所述可收获部分是种子。
33.从根据权利要求30的植物,和/或从根据权利要求31或32的植物可收获部分直接衍生的产品。
34.权利要求1中所定义的两WRKY结构域核酸/基因或其变体、或者权利要求1中所定义的具有两个WRKY结构域的多肽或此类多肽的同源物在相对于对照植物提高产率、特别是种子产率中的用途。
35.根据权利要求34的用途,其中所述种子产率为如下一项或多项:增加的TKW、增加的单个种子面积、增加的单个种子长度、增加的单个种子宽度、增加的种子数量或增加的每个圆锥花序的花朵数量。
36.权利要求1中所定义的两WRKY结构域核酸/基因或其变体、或者权利要求1中所定义的具有两个WRKY结构域的多肽或此类多肽的同源物作为分子标记的用途。
CN2006800248227A 2005-07-05 2006-07-04 产率增加的植物及其制备方法 Expired - Fee Related CN101218347B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
EP05106076.2 2005-07-05
EP05106076 2005-07-05
US70441505P 2005-08-02 2005-08-02
US60/704,415 2005-08-02
EP05109907.5 2005-10-24
EP05109907 2005-10-24
US73035605P 2005-10-27 2005-10-27
US60/730,356 2005-10-27
PCT/EP2006/006495 WO2007003409A2 (en) 2005-07-05 2006-07-04 Plants having increased yield and a method for making the same

Publications (2)

Publication Number Publication Date
CN101218347A true CN101218347A (zh) 2008-07-09
CN101218347B CN101218347B (zh) 2013-01-16

Family

ID=46934292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800248227A Expired - Fee Related CN101218347B (zh) 2005-07-05 2006-07-04 产率增加的植物及其制备方法

Country Status (9)

Country Link
US (1) US20090106861A1 (zh)
EP (1) EP1902134A2 (zh)
CN (1) CN101218347B (zh)
AR (1) AR054158A1 (zh)
AU (1) AU2006265264B2 (zh)
BR (1) BRPI0612737B1 (zh)
CA (1) CA2611250A1 (zh)
MX (1) MX2007015822A (zh)
WO (1) WO2007003409A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108728455A (zh) * 2018-07-27 2018-11-02 云南农业大学 甘蔗细茎野生种受干旱胁迫表达的WRKY转录因子基因SsWRKY1

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080092629A (ko) * 2007-04-12 2008-10-16 이화여자대학교 산학협력단 식물체에서 AtSPF3의 수준을 조절하여 식물의 종자생산량을 변화시키는 방법
BR122017021070B1 (pt) 2007-12-28 2019-01-29 Swetree Technologies Ab método para produzir uma planta lenhosa perene transgênica apresentando um crescimento aumentado medido pela altura em comparação com seu tipo selvagem
CN101965405B (zh) * 2008-01-25 2014-03-05 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于制备该植物的方法
WO2012110855A1 (en) * 2011-02-16 2012-08-23 Zulfiqar Ali Gmwrky49 transcriptional gene and use thereof for enhancing plant tolerance to salt and/or drought
CN102295693B (zh) * 2011-09-14 2013-06-05 林忠平 一种水稻wrky类转录因子及其编码基因与应用
CA2962852A1 (en) 2017-03-31 2018-09-30 Chuanxin Sun Carbohydrate producing plant material
CN107056911B (zh) * 2017-06-30 2020-09-29 沈阳农业大学 一种促进植物提前开花的草莓转录因子及其应用
CN109136260B (zh) * 2018-10-11 2022-03-15 中国科学院微生物研究所 Wrky20蛋白质及其编码基因在调控植物抗逆性中的应用
CN112195189A (zh) * 2020-11-20 2021-01-08 河北农业大学 大麦转录因子HvWRKY6基因及其在小麦抗条锈病、叶锈病中的应用
CN112931860A (zh) * 2021-03-12 2021-06-11 盘冯春 一种减肥组合物及其制备方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7345217B2 (en) * 1998-09-22 2008-03-18 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
US20100293669A2 (en) * 1999-05-06 2010-11-18 Jingdong Liu Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
EP1226240A2 (en) * 2000-01-04 2002-07-31 E.I. Du Pont De Nemours And Company Spf1-related transcription factors
WO2002015675A1 (en) * 2000-08-22 2002-02-28 Mendel Biotechnology, Inc. Genes for modifying plant traits iv
AU2002323142A1 (en) * 2001-08-09 2003-02-24 Mendel Biotechnology, Inc. Yield-related polynucleotides and polypeptides in plants
EP1585820B1 (en) * 2003-01-21 2007-01-03 CropDesign N.V. Use of the regulatory sequence of the rice gos2 gene for the gene expression in dicotyledonous plants or plant cells
ATE502112T1 (de) * 2003-11-13 2011-04-15 Mendel Biotechnology Inc Pflanzliche transkriptionsregulatoren
ATE441719T1 (de) * 2004-03-22 2009-09-15 Cropdesign Nv Pflanzen mit erhíhtem saatertrag und verfahren zu deren herstellung

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108728455A (zh) * 2018-07-27 2018-11-02 云南农业大学 甘蔗细茎野生种受干旱胁迫表达的WRKY转录因子基因SsWRKY1

Also Published As

Publication number Publication date
WO2007003409A2 (en) 2007-01-11
EP1902134A2 (en) 2008-03-26
AR054158A1 (es) 2007-06-06
WO2007003409A3 (en) 2007-03-15
US20090106861A1 (en) 2009-04-23
BRPI0612737A8 (pt) 2016-12-27
AU2006265264B2 (en) 2011-11-03
AU2006265264A1 (en) 2007-01-11
CN101218347B (zh) 2013-01-16
BRPI0612737B1 (pt) 2020-09-15
MX2007015822A (es) 2008-02-22
CA2611250A1 (en) 2007-01-11
BRPI0612737A2 (pt) 2012-10-02

Similar Documents

Publication Publication Date Title
CN101218347B (zh) 产率增加的植物及其制备方法
US8853492B2 (en) Plants having improved growth characteristics and a method for making the same
RU2463351C2 (ru) Растения, характеризующиеся повышенной урожайностью, и способ их получения
EP1948807B1 (en) Plants having improved growth characteristics and a method for making the same
CN101473037B (zh) 具有增强的产量相关性状的nac转录因子受调节表达的植物和用于产生该植物的方法
CA2509100C (en) Plants having modified growth characteristics and a method for making the same
CN101107364A (zh) 产率增加的植物及其制备方法
CN101351556B (zh) 具有改良生长特性的植物及其制备方法
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
US20120137386A1 (en) Plants Having Modulated Carbon Partitioning and a Method for Making the Same
CN103045638A (zh) 具有改良生长特性的植物及其制备方法
CN101128590B (zh) 产量增加的植物及其制备方法
CN1950511B (zh) 产量增加的植物及制备其的方法
CN101128589A (zh) 产量增加的植物及其制备方法
CN1993039B (zh) 具有改良生长特性的植物的制备方法
AU2006226460B2 (en) Plants having increased yield and a method for making the same
CN1934259B (zh) 具有改良的生长特性的植物以及制备所述植物的方法
CN1678748B (zh) 发育被改变的植物以及制备这种植物的方法
MX2007000410A (es) Plantas que tienen caracteristicas de crecimiento mejoradas y metodo para hacer las mismas.
CN101014614A (zh) 具有改良生长特性的植物及其制备方法
MX2008005840A (en) Plants having improved growth characteristics and a method for making the same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130116

Termination date: 20140704

EXPY Termination of patent right or utility model