CN103732747A

CN103732747A - 鉴定和分离导致转录增强的终止子序列的方法

Info

Publication number: CN103732747A
Application number: CN201280038154.9A
Authority: CN
Inventors: J·V·哈廷格; A·N·伯格梅尔; J·M·库恩; L·P·洛亚尔; E·杜维尼哥
Original assignee: BASF Plant Science Co GmbH
Current assignee: BASF Plant Science Co GmbH
Priority date: 2011-08-01
Filing date: 2012-07-20
Publication date: 2014-04-16
Also published as: EP3112465A3; CA2842092A1; BR112014002342A2; IN2014CN00793A; EP2739737A1; WO2013017982A1; US20140250546A1; EP3112465A2; EP2739737A4; AU2012291737A1

Abstract

本发明提供了用于鉴定和分离导致转录增强的终止子序列的有效的高通量方法、***和DNA构建体。本发明还提供了用这些方法分离的终止子序列及其用于增强基因表达的用途。

Description

鉴定和分离导致转录增强的终止子序列的方法

发明领域

本发明涉及用于鉴定和分离导致转录增强的终止子序列的有效的高通量方法、***和DNA构建体。本发明还涉及用这些方法分离的终止子序列及其用于增强基因表达的用途。

发明背景

植物生物技术的目的是产生具有有利的新性能，例如害虫和疾病抗性、对环境胁迫(例如水浸、干旱、高温、寒冷、光强度、昼长、化学品等)的抗性、提高的质量(例如高果实产量、延长的储存期、一致的果实形状和颜色、较高的含糖量、较高的维生素C和A含量、较低的酸度等等)的植物，或产生某些化学品或药物(Dunwell，2000)。此外可提高针对非生物胁迫(干旱、盐)和／或生物胁迫(昆虫、真菌、线虫感染)的抗性。可通过开发具有期望表型的遗传改造的植物实现作物产量增加和产量稳定性。

对所有生物技术领域而言，除了启动子序列之外，位于基因3′UTR的终止子序列是用于特定基因的重组表达的基本先决条件。在动物***中，转录终止的机制已被研究得很清楚(Zhao等人，1999；Proudfoot，1986；Kim等人，2003；Yonaha和Proudfoot，2000；Cramer等人，2001；Kuerstem和Goodwin，2003)。

然而，终止子可能具有比简单的终止转录更多的作用。例如，Narsai等人报导，终止子覆盖mRNA稳定或去稳定元件(Narsai等人2007)。其中这些元件可为富含AU的元件或miRNA结合位点。此外，有效的终止可用于释放转录聚合酶从而反向循环制转录起始位点。这可导致较高水平的转录起始(Nagaya等人2010.；Mapendano等人2010)。mRNA的3′端加工也可涉及细胞核输出和随后的翻译。因此，终止子序列可正面或负面影响转基因的表达水平。

植物终止子的诱变实验已鉴定了3种主要元件：远端上游元件(FUE)、近端上游元件(NUE；AAUAAA样基序)和切割／多腺苷酸化位点(CS)。NUE区是位于poly(A)位点的30nt以内的富含A的元件(Hunt，1994)。FUE区是增强CS处的加工效率的富含U-或UG的序列(Mogen等人1990，Rothnie，1996)，其自身是YA(CA或UA)二核苷酸，在富含U的区域内，所述区域发生多腺苷酸化(Bassett，2007).

在植物生物技术中经常需要以高水平表达转基因以产生期望的效果。在大多数应用中，认为启动子的强度主要决定了转基因的表达水平。启动子的鉴定和表征是昂贵和费时的，因为每一种启动子具有其特定的表达模式和强度。此外，合适的强启动子组是有限的。鉴于现代植物生物技术倾向于在一个构建体中堆积多个表达盒，为了最优基因表达而加倍相同的强启动子元件具有同源重组或转录基因沉默的风险。然而，使用较弱的启动子作为避免此问题的替换方案可能限制在构建体中一种基因的表达。这进而不利于在转基因植物中产生期望的表型。

作为强启动子的替代，终止子序列可用于实现与其功能连接的基因的增强的表达水平。这允许在多基因构建体中使用可选的较弱的启动子而不损害整体表达水平。另一个可能的优势是，如果仅修饰终止子的话，不会改变启动子的特异性和表达模式。

因此本发明的一个目的是提供鉴定、分离和检测增强植物中基因表达的终止子序列的方法。本发明的另一个目的是提供这样的增强基因表达的终止子。本发明的另一个目的是提供有效终止转录的终止子。通过本发明实现了这些目的。

发明详述

本发明的第一个实施方案是终止子分子，其包含至少一种在表1中定义的增强终止子元件(ET)或如表2中定义的其组合，或任意这些ET或这些ET组合的互补或反向互补物，其中包含所述ET或其组合的终止子分子导致与终止子分子功能连接的待表达的异源核酸分子的增强的表达。

增强终止子元件是由在ET的正或负链内的共多达26个核苷酸的保守的矩阵序列包围的约4-6个核苷酸的高度保守核心序列定义的序列基序，所述元件能够与DNA结合蛋白或DNA结合核酸分子相互作用。保守的矩阵序列允许在序列中的一定可变性而不损失其被DNA结合蛋白或核酸结合的能力。

描述DNA结合蛋白或核酸结合位点的一种方式是通过核苷酸或位置权重矩阵(NWM或PWM)(有关综述见Stormo，2000)。权重矩阵模式定义比简单的IUPAC共有序列更好，因为其代表了每个单独位置上的完整的核苷酸分布。其也允许定量在权重矩阵与在序列中检测到的潜在DNA结合蛋白或核酸结合位点之间的相似性(Cartharius等人2005)。

矩阵的“核心序列”被定义为矩阵的4、5或6个连续的最高保守的位置。

如在本文和涉及MatInspector的论文中(Cartharius K，等人(2005)Bioinformatics21；Cartharius K(2005)，DNA Press；Quandt K，等人(1995)Nucleic Acids Res.23)描述的计算核心相似性。

仅当矩阵的最高保守的碱基在序列中完全匹配时达到1.0的最大核心相似性。比核心相似性更重要的是矩阵相似性，其考虑在整个矩阵长度上的所有碱基。如本文和在MatInspector论文(Quandt K，等人(1995)NucleicAcids Res.23)中描述的计算矩阵相似性。与矩阵的完全匹配得到1.00的分数(每个序列位置对应在矩阵中的该位置上的最高保守的核苷酸)，与矩阵的“好”匹配具有>0.80的相似性。

在矩阵的高保守位置中的错配比在低保守区中的错配更多地减少矩阵相似性。

在一个实施方案中，ET具有在表1中定义的序列。在另一个实施方案中，ET的序列如表10中描述的定义，其中如在Quandt等人(1995，NAR23(23)4878—4884)中的第4879页右栏的等式2和3中描述的计算匹配序列的核心和矩阵相似性，其中矩阵相似性为至少0.8，优选地矩阵相似性为至少0.85，更优选地矩阵相似性为至少0.9，甚至更优选地矩阵相似性为至少0.95。在最优选的实施方案中，矩阵相似性为至少1.0。在一个实施方案中核心相似性为至少0.75，优选地核心相似性为至少0.8，例如0.85，更优选地核心相似性为至少0.9，甚至更优选地核心相似性为至少0.95。在最优选的实施方案中核心相似性为至少1.0。提及任意本发明的ET的SEQ ID可理解为在表1中定义的或如表10中描述的序列。

优选地终止子分子包含至少一种由SEQ ID NO5或SEQ ID NO6，或SEQ ID NO5和SEQ ID NO6的组合定义的增强终止子元件(ET)。

优选地在被定义为表达增强的终止子中存在一组(即表2中的一行)中的所有ET元件。在基因表达增强终止子序列中存在一组(即表2中的一行)中的至少2个，优选至少3个，最优选所有ET元件的每种组合。

在优选的实施方案中，这些终止子分子与相对本发明的终止子分子为异源的另一种核酸分子功能连接。这些核酸分子可为例如任意调控核酸分子，例如启动子、NEENA或内含子。核酸分子也可为任意待表达的核酸，例如目的基因，编码区或非编码区，例如5′或3′UTR，微小RNA，RNAi，反义RNA等等。

本发明的另一个实施方案是终止子分子，其包含选自下述的序列

a)核酸分子，其具有如SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64中定义的序列，或

b)核酸分子，其具有与如SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64定义的任意序列具有至少60％或更高的同一性，优选与如SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64定义的任意序列具有至少70％或更高的同一性，例如与如SEQID NO：1、2、3、4、57、58、59、60、61、62、63和64定义的任意序列具有至少80％或更高的同一性的序列，更优选地所述同一性为85％或更高，更优选地所述同一性为90％或更高，甚至更优选地所述同一性为95％或更高，96％或更高，97％或更高，98％或更高，在最优选的实施方案中，与如SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64定义的任意序列的所述同一性为99％或更高，或

c)a)或b)的核酸分子的100或更多个连续的碱基，优选150或更多个连续的碱基，更优选200个连续的碱基或更多，甚至更优选250或更多个连续的碱基的片段，其具有表达增强活性，例如如同具有SEQID NO：1、2、3、4、57、58、59、60、61、62、63和64定义的任意序列的序列的对应核酸分子的65％或更高，优选70％或更高，更优选75％或更高，甚至更优选80％或更高，85％或更高或90％或更高的表达增强活性，在最优选的实施方案中其具有95％或更高的表达增强活性，或

d)核酸分子，其是任意之前在a)或b)中提及的核酸分子的互补或反向互补物，或

e)核酸分子，其可使用表5中显示的SEQ ID NO：67至96描述的寡核苷酸引物从基因组DNA，优选植物基因组DNA，更优选单子叶植物基因组DNA通过PCR得到，或

f)100个核苷酸或更多、150个核苷酸或更多、200个核苷酸或更多或250个核苷酸或更多的核酸分子，其与包含SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64描述的转录增强终止子的至少50，优选至少100，更优选至少150，甚至更优选至少200，最优选至少250个连续的核苷酸或其互补物的核酸分子在等价于下述的条件下杂交，即在7％的十二烷基硫酸钠(SDS)、0.5M NaPO4，1mMEDTA中在50℃下杂交，在2X SSC、0.1％SDS中在50℃或65℃，优选65℃下洗涤。优选地所述核酸分子与包含SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64描述的转录增强终止子的至少50，优选至少100，更优选至少150，甚至更优选至少200，最优选至少250个连续的核苷酸或其互补物的核酸分子在等价于下述的条件下杂交，即在7％的十二烷基硫酸钠(SDS)，0.5M NaPO₄，1mM EDTA中在50℃下杂交，在1X SSC、0.1％SDS中在50℃或65℃，优选65℃下洗涤，更优选地，所述核酸分子与包含SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64定义的任意序列所描述的转录增强终止子的至少50，优选至少100，更优选至少150，甚至更优选至少200，最优选至少250个连续的核苷酸的核酸分子在等价于下述的条件下杂交，即在7％的十二烷基硫酸钠(SDS)，0.5MNaPO₄，1mM EDTA中在50℃下杂交，在0.1X SSC，0.1％SDS中在50℃或65℃，优选65℃下洗涤，

其中在a)至f)中定义的终止子分子导致与其功能连接的异源核酸分子的增强的表达。

优选地在上文b)至f)中定义的核酸分子是功能增强终止子分子，因此终止转录并具有在上文a)中定义的各自分子的至少50％的表达增强作用。更优选地，在上文b)至f)中定义的核酸分子包含在上文a)中定义的和在表1中定义的或在表10中定义的核酸分子中包含的增强终止子元件(ET)或在表2中定义的其组合，且是功能增强终止子分子，因此终止转录并具有在上文a)中定义的分子的至少50％的表达增强作用。例如，在上文b)至f)中定义的核酸分子包含功能多腺苷酸化信号和与在上文a)中定义的分子的AT含量相差不超过50％，优选40％，更优选30％，甚至更优选20％，特别优选10％的AT含量。最优选地它们与在上文a)中定义的分子具有相同的AT含量。

本发明的另一个实施方案是鉴定和分离导致与终止子分子功能连接的异源核酸分子表达增强的终止子分子的方法，其包括以下步骤：鉴定包含下述序列的核酸分子，所述序列在不超过500bp，优选400bp，更优选300bp，最优选250bp中包含在表1中定义的或在表10中定义的至少1个，优选至少2个，更优选至少4个ET。最优选地其包含在表2的1行中列出的所有ET元件。在本发明的另一个步骤中，各个核酸分子通过本领域技术人员公知的方法从其天然背景例如基因组DNA中被分离，或被合成。

本发明的另一个实施方案是鉴定和分离导致与终止子分子功能连接的异源核酸分子表达增强的终止子分子的方法，其包括以下步骤：

A)鉴定3′UTR和／或转录区例如编码区，和

B)鉴定对应的基因组DNA

C)使用任意计算ET检测或IUPAC字符串匹配序列分析在B)中鉴定的组中鉴定包含在表1或表10和2中定义的任意ET或其组合的分子，和

D)分离至少250bp包含所述ET的基因组DNA。

可通过本领域技术人员公知的任意方法鉴定3′UTR和对应的基因组DNA，所述方法例如全长cDNA的序列测定，基于例如基因组DNA序列中的编码序列的预测的计算预测或使用例如cDNA或基因组DNA的带注释的数据库。

术语“对应的基因组DNA”应理解为包含在步骤A)中被鉴定为3′UTR或转录区的序列的基因组DNA，优选植物基因组DNA，更优选地单子叶植物基因组DNA。对应的基因组DNA可包含与在步骤A)中鉴定的3′UTR或转录区的任意序列相同的序列，或与其具有至少60％或优选70％或更高，例如80％或更高的同一性的序列，更优选地所述同一性为85％或更高，更优选地所述同一性为90％或更高，甚至更优选地所述同一性为95％或更高，96％或更高，97％或更高，98％或更高，在最优选的实施方案中，所述同一性为99％或更高。

可例如使用技术人员公知的工具进行在B)中鉴定的组中的包含任意ET或其组合的分子的鉴定，例如Genomatix Software GmbH的MatInspector，University of Queensland和Univeristy of Washington的MEME程序组，或相当的工具。可使用本领域公知的重组方法例如PCR、限制克隆或基因合成进行至少250bp，例如300bp，优选至少350bp，例如400bp，更优选至少450bp，例如500bp的分离。分离的表达增强终止子分子可在随后的步骤中与启动子和／或待表达的核酸分子功能连接。技术人员知道功能连接2个或多个核酸分子的多种方法。这样的方法可包括限制／连接、不依赖连接酶的克隆、重组工程化、重组或合成。可应用其他方法功能连接2个或多个核酸分子。

本发明的另一个实施方案是产生相比对应的对照植物或其部分具有一种或多种核酸分子的增强的表达的植物或其部分的方法，所述方法包括以下步骤：

a)将一种或多种如上定义的表达增强终止子分子引入植物或其部分，和

b)将所述一种或多种表达增强终止子分子整合进所述植物细胞、植物或其部分的基因组中，使得所述一种或多种表达增强终止子分子与内源核酸功能连接，所述内源核酸相对所述一种或多种表达增强终止子分子是异源的，和任选地

c)从所述转化的植物细胞、植物或其部分再生包含所述一种或多种表达增强终止子的植物或其部分。

可通过粒子轰击、原生质体电穿孔、病毒感染、农杆菌介导的转化或本领域公知的任意其他方法将一种或多种表达增强终止子分子引入植物或其部分。可将表达增强终止子分子整合引入例如质粒或病毒DNA或病毒RNA。在引入植物或植物部分以前，表达增强终止子分子也可包含在BAC，YAC或人工染色体上。其也可以作为包含表达增强终止子序列的线性核酸分子被引入，其中其他序列可存在于核酸分子上的表达增强终止子序列的附近。在表达增强终止子序列邻近的这些序列可为从约20bp，例如20bp至几百个碱基对，例如100bp或更多，并且其可促进至基因组的整合，例如通过同源重组。可应用基因组整合的任意其他方法，例如靶向整合方法，例如同源重组或随机整合方法，例如非常规重组。

可与表达增强终止子分子功能连接的内源核酸可为任意核酸分子。核酸分子可为蛋白质编码核酸分子或非编码分子，例如反义RNA，rRNA，tRNA，miRNA，ta-siRNA，siRNA，dsRNA，snRNA，snoRNA或本领域公知的任意其他非编码RNA。

1.将一种或多种表达增强终止子分子与启动子和／或与处于所述启动子控制下的核酸分子功能连接，和

2.将所述一种或多种包含在表1或10或2中定义的ET或其组合的表达增强终止子分子或在上文a)至f)中定义的终止子分子引入植物或其部分的基因组中，所述终止子分子与所述异源启动子和／或所述待表达的异源核酸功能连接，和

3.从所述转化的植物或其部分再生包含所述一种或多种表达增强终止子分子的植物或其部分。

表达增强终止子分子相对与所述表达增强终止子功能连接的所述启动子控制下的核酸分子可为异源的，或其相对所述启动子和所述启动子控制下的核酸分子可都是异源的。

在如上定义的本发明的方法的一个实施方案中，所述方法包括以下步骤：

i)提供表达构建体，其包含一种或多种包含在表1或10或2中定义的ET或其组合的表达增强终止子分子或在上文a)至f)中定义的终止子分子，所述终止子分子与启动子和一种或多种核酸分子功能连接，后者相对所述一种或多种表达增强终止子分子是异源的且处于所述启动子的控制下，和

ii)将包含所述一种或多种表达增强终止子分子的所述表达构建体整合进所述植物或其部分的基因组中，和任选地

iii)从所述转化的植物或其部分再生包含所述一种或多种表达构建体的植物或其部分。

本发明的方法可应用于任何植物，例如裸子植物或被子植物，优选被子植物，例如双子叶或单子叶植物。优选的单子叶植物是例如玉米、小麦、稻、大麦、高粱、芭蕉(musa)、甘蔗、芒草和短柄草，特别优选的单子叶植物是玉米、小麦和稻。优选的双子叶植物是例如大豆(soy)、油菜(rapeseed)、卡诺拉(canola)、亚麻(linseed)、棉花(cotton)、马铃薯(potato)、甜菜(sugar beet)、万寿菊(tagetes)和拟南芥(Arabidopsis)，特别优选的双子叶植物是大豆、油菜、卡诺拉和马铃薯。

展示核酸分子的增强的表达的植物在本文中指相比没有与相应核酸分子功能连接的相应表达增强终止子的在相同条件下生长的对照植物具有更高的，优选统计上显著更高的核酸分子表达的植物。这样的对照植物可为野生型植物或包含与本发明植物控制相同基因的相同启动子的转基因植物，其中所述启动子和／或待表达的核酸不与本发明的表达增强终止子连接。

包含一种或多种包含在表1或10或2中定义的ET或其组合的表达增强终止子分子或在上文a)至f)中定义的表达增强终止子分子的重组表达构建体是本发明的另一个实施方案。重组表达构建体可还包含一种或多种启动子和任选地一种或多种表达的核酸分子，所述启动子和核酸分子都与一种或多种表达增强终止子分子功能连接，至少后者(核酸分子)相对所述一种或多种表达增强终止子分子是异源的。

表达增强终止子分子相对与表达增强终止子分子功能连接的所述启动子控制下的核酸分子可为异源的，或其相对启动子和所述启动子控制下的核酸分子可都为异源的。

表达构建体可包含1或更多，例如2或更多，例如5或更多，例如10或更多种与表达增强终止子分子功能连接的启动子和待表达的核酸分子的组合，所述核酸分子相对相应的表达增强终止子分子是异源的。表达构建体也可还包含不包含表达增强终止子分子的表达构建体。

包含一个或多个如上定义的重组表达构建体的重组表达载体是本发明的另一个实施方案。可用于本发明的多种表达载体是技术人员公知的。将包含这样的表达构建体的载体引入植物基因组和从转化的细胞恢复转基因植物的方法也是本领域熟知的，所述表达构建体包含例如与表达增强终止子功能连接的启动子和任选地其他元件，例如启动子、UTR、NEENA等等。取决于用于转化植物或其部分的方法，可将整个载体整合进所述植物或其部分的基因组，或将载体的某些组件整合进基因组，例如T-DNA。

包含如上定义的重组表达载体或如上定义的重组表达构建体的转基因细胞或转基因植物或其部分是本发明的另一个实施方案。所述转基因细胞、转基因植物或其部分可选自细菌、真菌、酵母或植物、昆虫或哺乳动物细胞或植物。优选的转基因细胞是细菌、真菌、酵母和植物细胞。优选的细菌是肠杆菌例如大肠杆菌(E. coli)和农杆菌属细菌，例如根癌农杆菌(Agrobacterium tumefaciens)和发根农杆菌(Agrobacterium rhizogenes)。优选地植物是单子叶或双子叶植物，例如单子叶或双子叶作物，例如玉米、大豆、卡诺拉、棉花、马铃薯、甜菜、稻、小麦、高粱、大麦、芭蕉、甘蔗、芒草等等。优选的作物是玉米、稻、小麦、大豆、卡诺拉、棉花或马铃薯。特别优选的双子叶作物是大豆、卡诺拉、棉花或马铃薯。

特比优选的单子叶作物是玉米、小麦和稻。

来源于如上定义的转基因细胞或植物或其部分的转基因细胞培养物、转基因种子、部分或繁殖材料是本发明的其他实施方案，其包含所述异源的包含在表1或10或2中定义的ET或其组合的表达增强终止子分子或在上文a)至f)中定义的表达增强终止子分子或如上定义的所述重组表达构建体或所述重组载体。

本文中所指的转基因部分或繁殖材料包括包含相应的表达增强终止子分子、重组表达构建体或重组载体的所有组织和器官，例如叶、茎和果，以及用于植物的繁殖和/或再生的材料，例如插条、接穗、压条、分枝或芽(shoot)。

本发明的另一个实施方案是包含在表1或10或2中定义的ET或其组合的表达增强终止子分子或在上文a)至f)中定义的表达增强终止子分子或如上定义的重组构建体或重组载体用于增强植物或其部分中的表达的用途。

本发明的另一个实施方案是通过将包含在表1或10或2中定义的ET或其组合的表达增强终止子分子或在上文a)至f)中定义的表达增强终止子分子或如上定义的重组构建体或重组载体引入植物，培养植物，收获和加工植物或其部分生产农产品的方法。

本发明的另一个实施方案是产生重组终止子分子的方法，所述终止子增强与所述终止子分子功能连接的异源核酸分子的表达，所述方法包括以下步骤，即在缺乏表达增强性能的终止子分子中引入至少一种在表1或表10中定义的ET元件或在表2中定义的其组合，或其互补或反向互补物。

在一个实施方案中，ET具有在表1中定义的序列。在另一个实施方案中，ET的序列如表10中描述的定义，其中如在Quandt等人(1995，NAR23(23)4878—4884)中的第4879页右栏的方程2和3中描述的计算匹配序列的核心和矩阵相似性，其中矩阵相似性为至少0.8，优选地矩阵相似性为至少0.85，更优选地矩阵相似性为至少0.9，甚至更优选地矩阵相似性为至少0.95。在最优选的实施方案中，矩阵相似性为至少1.0。在一个实施方案中核心相似性为至少0.75，优选地核心相似性为至少0.8，例如0.85，更优选地核心相似性为至少0.9，甚至更优选地核心相似性为至少0.95。在最优选的实施方案中核心相似性为至少1.0。

在本发明的方法中，优选地将至少一个通过SEQ ID NO5或SEQ IDNO6，或SEQ ID NO5和SEQ ID NO6的组合定义的增强终止子元件(ET)引入本发明的重组终止子分子中。

在本发明的方法的优选实施方案中，将一组(即表2中的一行)中的所有ET元件引入本发明的重组终止子中。在根据本发明的方法产生的基因表达增强终止子序列中存在一组(即表2中的一行)中的至少2种，优选至少3种，最优选所有ET元件的每种组合。

技术人员知道产生这样的重组终止子分子的方法。可使用缺乏增强与终止子分子功能连接的核酸分子的表达的能力的终止子分子，且可通过克隆方法、重组或合成终止子分子引入本发明的ET元件。

定义

缩写：NEENA-增强核酸表达的核酸，GFP-绿色荧光蛋白，GUS—β-葡糖苷酸酶，BAP-6-苄氨基嘌呤，2,4-D-2，4-二氯苯氧乙酸，MS—Murashige-Skoog培养基，NAA-1-萘乙酸，MES，2-(N-吗啉代)-乙磺酸，IAA：吲哚乙酸，Kan：硫酸卡那霉素，GA3-赤霉酸，Timentin^TM：替卡西林二钠／克拉维酸钾，microl：微升。

应当理解，本发明不限于具体的方法或方案。还应当理解本文所用的术语目的仅在于描述具体实施方案，并且不意图限制本发明，本发明将仅受所附权利要求书限制。必须指出，如本文中和所附权利要求中所用，单数形式“一个”、“一种”和“该”包括复数指称，除非上下文另外明确地指明并非如此。因此，例如，对“一个载体”的提及是对一个或多个载体的提及并且包括本领域技术人员已知的其等同物等。术语“约”在本文中用来指大约、大致、左右和在……范围内。当术语“约”与一个数字范围联合使用时，它通过使界限值扩展高于和低于所述数值而修饰该范围。通常而言，术语“约”在本文中用来通过20％、优选10％之上或之下(更高或更低)变化而修饰高于和低于所述值的数值。如本文中所用，词汇“或”意指特定列出的任何一成员并且还包括该列出的成员的任意组合。在本说明书中及以下权利要求中使用时，词汇“包含”、“包含着”、“包括”、“包括着”和“包括了”意图指明一个或多个所述特征、整数、组分或步骤的存在，但是它们不排除一个或多个其他特征、整数、组分、步骤或其组的存在或添加。为清晰起见，将本说明书中使用的某些术语如下定义并使用：

农产品：本申请中使用的术语“农产品”是指来自植物的任何可收获的产品。植物产品可以是，但不限于，食品、饲料、食物补充物、饲料补充物、纤维、化妆品或药品。食品可以被视为用于营养或用于补充营养的组合物。特别地，动物饲料或动物饲料补充物，被认为是食品。农产品例如可以是植物提取物、蛋白质、氨基酸、糖类、脂肪、油、聚合物例如淀粉或纤维、微生物、二级植物产品等等。

反向平行：“反向平行”在本文中指经互补性碱基残基之间氢键配对的两个核苷酸序列，其中磷酸二酯键在一个核苷酸序列中以5'-3’方向分布并且在另一个核苷酸序列中以3’-5’方向分布。

反义：术语“反义”指相对于其转录或发挥作用的正常方向为反向并且从而表达下述RNA转录物的核苷酸序列，其中所述的RNA转录物与宿主细胞内部表达的靶基因mRNA分子互补(例如，它可以借助Watson-Crick碱基配对作用与靶基因mRNA分子或单链基因组DNA杂交)或与靶DNA分子(例如宿主细胞中存在的基因组DNA)互补。

编码区：如本文中所用，术语“编码区”在谈及结构基因使用时，指编码在作为mRNA分子翻译结果的新生多肽中存在的氨基酸的核苷酸序列。在真核生物中，编码区在5’侧以编码起始物甲硫氨酸的核苷酸三联体“ATG”为界并且在3’侧以特定终止密码子的3种三联体(即TAA、TAG、TGA)之一为界。除含有内含子之外，基因的基因组形式也可以包含位于RNA转录物中存在的序列的5’-及3’-端的序列。这些序列称作“侧翼”序列或区(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5’或3’)。5’-侧翼区可以含有控制或影响基因转录的调节序列如启动子和增强子。3’-侧翼区可以含有指导转录终止、转录后剪切和聚腺苷酸化的序列。

互补的：“互补的”或“互补性”指包含反向平行核苷酸序列的两个核苷酸序列，其中一旦在反向平行核苷酸序列中的互补性碱基残基之间形成氢键，则所述反向平行核苷酸序列能够相互配对(通过碱基配对原则)。例如，序列5'-AGT-3’与序列5'-ACT-3'互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核酸碱基根据碱基配对规则未匹配的情况。核酸分子之间的“全部”或“完全”互补性是其中每个核酸碱基按照碱基配对规则与另一个碱基匹配的情况。核酸分子链之间互补性的程度对核酸分子链之间杂交的效率和强度具有明显影响。如本文中所用的核酸序列“互补物”指这样的核苷酸序列，其核酸分子显示与该核酸序列的核酸分子的全部互补性。

双链RNA：“双链RNA”分子或“dsRNA”分子包含核苷酸序列的有义RNA片段和该核苷酸序列的反义RNA片段，二者均包含彼此互补的核苷酸序列，因而允许有义RNA片段和反义RNA片段配对并形成双链RNA分子。

内源的：“内源的”核苷酸序列指存在于未转化植物细胞的基因组中的核苷酸序列。

增强的表达：“增强”或“增加”核酸分子在植物细胞中的表达在本文中同等地使用，并且意指该核酸分子在应用本发明方法之后在植物、植物部分或植物细胞中的表达水平比其在应用该方法之前在植物、植物部分或植物细胞中的表达更高，或与缺少本发明重组核酸分子的参照植物相比更高。例如，参照植物包含仅缺少相应的本发明的增强终止子的相同构建体。如本文中所用的术语“增强”或“增加”是同义的，并且在本文中意指待表达的核酸分子的更高、优选显著更高的表达。如本文中所用的，“增强”或“增加”某物质(如蛋白质、mRNA或RNA)的水平意指相对于基本上相同条件下培育的、缺少本发明重组核酸分子(例如缺少本发明的增强终止子分子、本发明的重组构建体或重组载体)的基本上相同植物、植物部分或植物细胞，该水平增加。如本文中所用的，“增强”或“增加”某物质(例如由靶基因表达的前RNA、mRNA、rRNA、tRNA、snoRNA、snRNA和／或由其编码的蛋白质产物)的水平意指相对于缺少本发明重组核酸分子的细胞或生物，该水平增加20％或更多、例如50％或更多，优选100％或更多，更优选3倍或更多倍，甚至更优选15倍或更多倍，最优选10倍或更多倍，例如20倍。可以通过技术人员熟悉的方法测定所述增强或增加。因而，可以例如通过蛋白质的免疫学检测法确定核酸或蛋白质量的增强或增加。另外，可以使用技术如蛋白质测定法、荧光法、Northern杂交法、核酸酶保护测定法、逆转录法(定量RT-PCR)、ELISA(酶联免疫吸附测定法)、蛋白质印迹法、放射免疫测定法(RIA)或其他免疫测定法和荧光激活的细胞分析(FACS)来测量植物或植物细胞中的特定蛋白质或RNA。取决于所诱导蛋白质产物的类型，也可以确定其活性或对生物或细胞表型的影响。用于确定蛋白质数量的方法是技术人员已知的。可以提到的实例是：微量Biuret法(Goa J(1953)Scand J Clin Lab Invest5：218-222)、Folin-Ciocalteau法(Lowry OH等人(1951)J Biol Chem193：265-275)或测量CBB G-250的吸光度(Bradford MM(1976)Analyt Biochem72：248-254)。作为用于量化蛋白质的活性的一个实例，在下文实施例中描述萤光素酶活性检测法。

增强终止子元件(ET)：定义了赋予功能连接基因的增强的表达的基因表达增强终止子的长度为5至30个碱基的短核酸序列。它们可以被定义为核苷酸权重矩阵。增强终止子元件可以显示同源终止子序列之间的保守性。如表1和2中所定义的单个增强终止子元件或其组合的存在足以将终止子序列划分为表达增强。

表达：“表达”指基因产物的生物合成，优选地指细胞中核苷酸序列例如内源基因或异源基因的转录和／或翻译。例如，在结构基因的情况下，表达涉及结构基因转录成mRNA并且任选地随后mRNA翻译成一种或多种多肽。在其他情况下，表达可以仅指携带RNA分子的DNA的转录。

表达构建体：如本文中所用的“表达构建体”意指能够指导特定核苷酸序列在适宜植物部分或植物细胞中表达的DNA序列，该DNA序列包含在导入此DNA序列的所述植物部分或植物细胞中有功能的启动子，所述启动子与任选地有效连接至终止信号的目的核苷酸序列有效连接。如果需要翻译，该DNA序列一般还包含为正确翻译所述核苷酸序列所需的序列。编码区可以编码目的蛋白，但也可以以有义或反义方向编码功能性目的RNA，例如RNAa、siRNA、snoRNA、snRNA、microRNA、ta-siRNA或任何其他非编码的调节性RNA。包含目的核苷酸序列的表达构建体可以是嵌合的，这意指该表达构建体的组件中一者或多者相对于该表达构建体的其他组件中一者或多者是异源的。该表达构建体也可以是一种这样的表达构建体，它天然地存在，但已经以用于异源表达的重组形式获得。然而，一般而言，该表达构建体相对于宿主是异源，即，该表达构建体的特定DNA序列不天然存在于宿主细胞中并且必须已经通过转化事件导入宿主细胞或该宿主细胞的祖先中。该表达构建体中的核苷酸序列的表达可以处于种子特异性和／或种子偏好的启动子或处于仅在宿主细胞暴露于一些特定外部刺激时才启动转录的诱导型启动子的控制下。在植物的情况下，该启动子也可以是针对特定组织或器官或发育阶段特异的。

外来：术语“外来”指任何核酸分子(例如，基因序列)，所述核酸分子通过实验操作导入细胞的基因组中并且可以包括该细胞中存在的序列，只要导入的序列含有一些修饰(例如，点突变、存在可选择标记基因等)和因此相对于天然存在序列是不同的。

功能性连接：将术语“功能性连接”或“功能性连接的”理解为意指例如调节性元件(例如启动子)与待表达的核酸序列并且根据需要与其他调节性元件(例如，终止子或NEENA)以如此方式依次排列，从而每种调节性元件可以履行其目的功能以允许、修饰、促进或影响所述核酸序列的表达。作为同义词，可以使用“有效连接”或“有效连接的”。可以根据所述核酸序列相对于有义或反义RNA的排列，产生表达。为此目的，不是必需要求化学意义上的直接连接。遗传控制序列例如增强子序列也能够从远离的位置或甚至从其它DNA分子对靶序列产生其作用。优选的排列是这样的排列，其中待表达的核酸序列重组地位于充当启动子的序列之后，从而这两个序列相互共价地连接。该启动子序列与待重组表达的核酸序列之间的距离优选地小于200碱基对、特别优选地小于100碱基对、非常特别优选地小于50碱基对。在一个优选的实施方案中，待转录的核酸序列以如此方式位于启动子之后，其中转录起点与本发明嵌合RNA的合乎需要的开端相同。功能性连接和表达构建体可以借助如(例如，在Maniatis T，Fritsch EF和Sambrook J(1989)Molecular Cloning：A Laboratory Manual，第二版，Cold Spring Harbor Laboratory，Cold Spring Harbor(NY)；Silhavy等人(1984)Experiments with Gene Fusions，Cold Spring Harbor Laboratory，Cold Spring Harbor(NY)；Ausubel等人(1987)Current Protocols inMolecular Biology，Greene Publishing Assoc.and Wiley Interscience；Gelvin等人(编著)(1990)Plant Molecular Biology Manual；KluwerAcademic Publisher，Dordrecht，The Netherlands)所述的惯用重组和克隆技术产生。然而，其他序列，例如充当带限制性酶特定切割位点的接头或充当信号肽的序列，也可以位于这两个序列之间。序列的***也可以导致融合蛋白的表达。优选地，由调节性区域例如启动子和待表达核酸序列的连接组成的表达构建体可以以载体整合的形式存在并且被***植物基因组，例如通过转化法。

基因：术语“基因”指与能够以某种方式调节基因产物(例如，多肽或功能性RNA)表达的适宜调节序列有效连接的区域。基因包括DNA中位于编码区(可读框，ORF)之前(上游)和之后(下游)的不翻译的调节区(例如启动子、增强子、阻抑物等)，以及在可用的情况下，在各个编码区(例如外显子)之间的间插序列(例如内含子)。如本文中所用的术语“结构基因”意图指转录成mRNA的DNA序列，其中所述的mRNA随后翻译成作为具体多肽的特征的氨基酸序列。

基因组和基因组DNA：术语“基因组”或“基因组DNA”指宿主生物的可遗传信息。所述基因组DNA包括细胞核的DNA(也称作染色体DNA)，还包括质体(例如，叶绿体)和其他细胞器(例如，线粒体)的DNA。优选地，术语“基因组”或“基因组DNA”指细胞核的染色体DNA。

异源的：就核酸分子或DNA而言，术语“异源的”指这样的核酸分子，所述核酸分子有效连接于，或受到操作以变得有效连接于自然界中不与该核酸分子有效连接或自然界中与该核酸分子在不同位置有效连接的第二种核酸分子。包含核酸分子和与之连接的一个或多个调节性核酸分子(如启动子或转录终止信号)的异源表达构建体例如是源自实验操作的构建体，在所述构建体中，a)所述核酸分子或b)所述调节性核酸分子或c)二者(即(a)和(b))不位于其天然(原有)遗传环境中或已经因实验操作受到修饰，修饰的实例是一个或多个核苷酸残基的置换、添加、缺失、倒位或***。天然遗传环境指源生物中的天然染色体基因座或指存在于基因组文库中。在基因组文库的情况下，优选地保留，至少部分地保留该核酸分子的序列的天然遗传环境。该环境分布在所述核酸序列的至少一侧并且具有至少50bp，优选地至少500bp，特别优选地至少1,000bp，非常特别优选地至少5,000bp序列长度。天然存在的表达构建体例如启动子与相应基因的天然存在组合-在通过非天然的合成性“人工”方法例如诱变法修饰时变成转基因表达构建体。已经描述了此类方法(US5,565,350；WO00／15815)。例如，与启动子有效连接的编码蛋白质的核酸分子相对于该启动子视为异源，其中所述的启动子不是该核酸分子的天然启动子。优选地，异源DNA相对于导入该异源DNA的细胞不是内源的或不天然与该细胞相关，但是已经从另一种细胞获得或已经合成。异源DNA还包括含有一些修饰的内源DNA序列、不天然存在的多拷贝内源DNA序列或这样的DNA序列，该DNA序列不与物理连接于所述DNA序列的另一个DNA序列天然接合。通常地但不是必需地，异源DNA在表达其的细胞中编码RNA或蛋白质，而所述RNA或蛋白质正常情况下不被所述细胞产生。

杂交：如本文中所用，术语“杂交”包括“核酸分子的链通过碱基配对作用与互补链结合的任意过程”。(J.Coombs(1994)Dictionary ofBiotechnology，Stockton Press，New York)。杂交和杂交的强度(即，核酸分子之间结合的强度)受此类因素影响，如核酸分子之间的互补性程度、所涉及条件的严格性、所形成杂合体的Tm和核酸分子内部的G∶C比。如本文中所用，术语“Tm”用来指“解链温度”。解链温度是双链核酸分子群体一半解离成单链的温度。用于计算核酸分子的Tm的等式是本领域熟知的。如标准参考文献所示，当核酸分子处于1M NaCl的水溶液中时，可以通过等式：Tm=81.5+0.41(％G+C)计算来进行Tm值的简单估计[见例如，Anderson和Young，Quantitative Filter Hybridization，in Nucleic AcidHybridization(1985)]。其他参考文献包括更复杂计算法，这些算法考虑了结构特征及序列特征以计算Tm。严格条件是本领域技术人员已知的并且可以在Current Protocols in Molecular Biology，John Wiley&Sons，N.Y.(1989)，6.3.1-6.3.6中找到。

“同一性”：在比较两个或多个核酸或氨基酸分子使用时，“同一性”意指所述分子的序列共有某种程度的序列相似性，即所述序列是部分相同的。

为确定两个氨基酸序列或两个核酸分子的同一性(同源性在本文可互换地使用)百分数，将所述序列以一个序列在另一个序列下的方式书写以最佳比较(例如，可以将空位***蛋白质的序列或核酸的序列，旨在与另一种蛋白质或另一种核酸产生最佳比对)。

随后在对应氨基酸位置或核苷酸位置处比较氨基酸残基或核酸分子。当一个序列中的位置由另一个序列中对应位置处的相同氨基酸残基或相同核酸分子占据时，则所述分子在这个位置处是同源的(即，如本上下文中所用的氨基酸或核酸“同源性”对应于氨基酸或核酸“同一性”。这两个序列之间的同源性百分数是所述序列共有的相同位置的数值的函数(即同源性百分数＝相同位置的数值／位置总数×100)。术语“同源性”和“同一性”因而视为同义词。

为确定两个或多个氨基酸序列或两个或多个核苷酸序列的同一性百分数，已经开发了几个计算机软件程序。两个或更多序列的同一性可以用例如软件fasta计算，其中软件fasta已经以fasta3版本使用(W.R.Pearson和D.J.Lipman，PNAS85，2444(1988)；W.R.Pearson，Methods inEnzymology183，63(1990)；W.R.Pearson和D.J.Lipman，PNAS85，2444(1988)；W.R.Pearson，Enzymology183，63(1990))。用于计算不同序列的同一性的另一种有用程序是标准blast程序，其中该程序包含于Biomaxpedant软件(联邦德国慕尼黑Biomax)中。不幸地，该程序有时产生次优结果，因为BLAST不总是包含主题和查询对象的完整序列。然而，由于该程序非常高效，因而它可以用于庞大数目序列的比较。以下设置通常用于这样的序列比较：

-p程序名称[字符串]；-d数据库[字符串]；默认＝nr；-i查询文件[FileIn]；默认=stdin；-e期望值(E)[Real]；默认=10.0；-m比对浏览选项：0=配对；1=查询-比上区域(query-anchored)，显示同一性；2=查询-比上区域，不显示同一性；3=查询-比上区域的屏文形式，显示同一性；4=查询-比上区域的屏文形式，不显示同一性；5=查询-比上区域，不显示同一性和突然结束；6=查询-比上区域的屏文形式，不显示同一性和突然结束；7=XML Blast输出；8=TAB格式输出；9带注释行的TAB格式输出[整数]；默认＝0；-o BLAST报告输出文件[File Out]任选；默认=stdout；-F过滤软件查询序列(DUST用blastn，SEG用其他方法)[字符串]；默认=T；-G空位开口成本(零激发默认行为)[整数]；默认＝0；-E开口延伸成本(零激发默认行为)[整数]；默认=0；-X X空位比对的下降值(比特)(零激发默认行为)；blastn30，megablast20，tblastx0，全部其他方法15[整数]；默认＝0；-I在定义行中显示GI′[T／F]；默认＝F；-q核苷酸错配罚分(仅blastn)[整数]；默认=-3；-r核苷酸匹配回报(仅blastn)[整数]；默认=1；-v显示对(V)的单-线描述的数据库序列数[整数]；默认＝500；-b显示对(B)的比对结果的数据库序列数[整数]；默认＝250；-f延伸命中的阈值，若为零，则默认；blastp11，blastn0，blastx12，tblastn13；tblastx13，megablast0[整数]；默认=0；-g执行空位比对(对tblastx不可用)[T／F]；默认＝T；-Q查询使用的遗传密码[整数]；默认＝1；-D DB遗传密码子(仅用于tblast[nx])[整数]；默认=1；-a使用的处理器数目[整数]；默认＝1；-O SeqAlign文件[File Out]任选；-J相信查询定义行[T／F]；默认=F；-M矩阵[字符串]；默认=BLOSUM62；-W字大小，如果为零，则默认(blastn11，megablast28，全部其他方法3)[整数]；默认=0；-z数据库的有效长度(对于真实大小，使用零)[Real]；默认＝0；-K来自保持区域的最佳命中数(默认关闭；若使用，则推荐值为100)[整数]；默认＝0；-P0用于多重命中；1用于单一命中[整数]；默认=0；-Y搜索空间的有效长度(对真实大小，使用零)[Real]；默认＝0；-S针对数据库搜索的查询链(对于blast[nx]和tblastx)；3用于两者，1是顶端，2是底部[整数]；默认＝3；-T产生HTML输出结果[T／F]；默认=F；-l限制数据库搜索至GI′s列表[字符串]任选；-U使用FASTA序列的较低事件过滤作用[T／F]任选；默认＝F；-y无空位延伸的X下降值(比特)(0.0激发默认行为)；blastn20，megablast10，全部其他方法7[Real]；默认＝0.0；-Z最终空位比对的X下降值(比特)(0.0激发默认行为)；blastn／megablast50，tblastx0，全部其他方法25[整数]；默认=0；-R PSI-TBLASTN检查点文件[File In]任选；-n MegaBlast搜索[T／F]；默认＝F；-L查询序列上的位置[字符串]任选；-A多重命中窗口大小，如果为零，则默认(blastn／megablast0，全部其他方法40[整数]；默认=0；-w移码罚分(OOF算法用于blastx)[整数]；默认＝0；-t允许tblastn中用于联系HSP的最大内含子的长度(0取消连接联系)[整数]；默认＝0。

通过使用Needleman和Wunsch或者Smith和Waterman算法获得高质量的结果。因而，优选基于所述算法的程序。有利地，可以用程序PileUp(J.Mol.Evolution.，25，351(1987)，Higgins等人，CABIOS5，151(1989))或优选地用均基于Needleman和Wunsch算法(J.Mol.Biol.48；443(1970))的程序“Gap”与“Needle”和基于Smith和Waterman(Adv.Appl.Math.2；482(1981))算法的“BestFit”进行序列的比较。“Gap”和“BestFit”是GCG软件包[Genetics Computer Group,575Science Drive,Madison,Wisconsin，USA53711(1991)；Altschul等人(Nucleic Acids Res.25，3389(1997))的部分，“Needle”是欧洲分子生物学开放软件包(The European Molecular BiologyOpen Software Suite(EMBOSS))的部分(Trends in Genetics16(6)，276(2000))。因而，优选地，用程序“Gap”或“Needle”在所述序列的整个范围内进行确定序列同源性百分数的计算。用于比较核酸序列的以下标准调整用于“Needle”：矩阵：EDNAFULL，空位罚分：10.0，延伸罚分：0.5。用于比较核酸序列的以下标准调整用于“Gap”：空位权重：50，长度权重：3，平均匹配：10.000，平均错配：0.000。

例如，将声称在核酸水平与序列SEQ ID NO：1具有80％同一性的序列理解为意指，通过上述程序“Needle”以设置的上述参数与序列SEQ IDNO：1所代表的序列比较时具有80％同一性的序列。优选地，在查询序列例如SEQ ID NO：1的完整长度上计算同源性。

内含子：指基因内部的DNA区段(间插序列)，该DNA区段不编码该基因产生的蛋白质的部分，并且从该基因转录的mRNA中在该mRNA从细胞核输出之前剪切下来。内含子序列指内含子的核酸序列。因而，内含子是DNA序列的这些区域，它们随编码序列(外显子)一起转录但是在成熟mRNA形成期间被除去。内含子可以位于实际编码区内部或位于前mRNA(未剪接的mRNA)的5’或3’非翻译前导序列中。初级转录物中的内含子被切下并且编码序列同时且精确地连接以形成成熟的mRNA。内含子和外显子的交界形成剪接位点。内含子的序列始于GU并止于AG。另外，在植物中，已经描述AU-AC内含子的两个实例：来自拟南芥(Arabidopsisthaliana)的RecA样蛋白基因第14内含子和G5基因第7内含子是AT-AC含子。含有内含子的前mRNA具有3种短序列，连同其他序列，这些短序列对于精确剪接内含子是必需的。这些序列是5’剪接位点、3’剪接位点和分支点。mRNA剪接是除去初级mRNA转录物中存在的间插序列(内含子)并接合或连接外显子序列。这又称作顺式剪接作用，所述顺式剪接作用将相同RNA上的两个外显子接合，同时除去间插序列(内含子)。内含子的功能性元件包含由剪接体(例如其剪接内含子末端处的共有序列)的特定蛋白质组分识别并结合的序列。功能性元件与剪接体的相互作用导致从不成熟mRNA除去内含子序列和外显子序列的再接合。内含子具有3种短序列，这些短序列对于精确剪接内含子是必需的，但是并非足够的。这些序列是5’剪接位点、3’剪接位点和分支点。分支点序列是在植物中剪接过程和剪接位点选择方面重要的。分支点序列通常位于3’剪接位点上游10-60个核苷酸处。

同基因的：除可以因存在或不存在异源DNA序列而不同之外，在遗传上相同的生物(例如植物)。

分离的：如本文中所用的术语“分离的”或“分离”意指材料已经通过人工取出并且离开其原来的天然环境存在并且因此不是自然界的产物。分离的材料或分子(如DNA分子或酶)可以以纯化的形式存在或可以存在于非天然环境中如例如存在于转基因宿主细胞中。例如，活植物中存在的天然存在多核苷酸或多肽不是分离的，然而与该天然***中一些或全部共存物质分开的相同多核苷酸或多肽是分离的。此类多核苷酸可以是载体的一部分和／或此类多核苷酸或多肽可以是组合物的一部分，和是分离的，因为这种载体或组合物不是其最初环境的一部分。优选地，术语“分离的”相对于核酸分子使用时，如在“分离的核酸序列”中，指被鉴定并且与该核酸序列天然来源中通常与其接合的至少一种杂质性核酸分子分开的核酸序列。分离的核酸分子是这样的核酸分子，其在与自然界中找到该核酸分子的形式或环境不同的形式或环境下存在。相反，未分离的核酸分子是以其在自然界中存在的状态所找到的核酸分子如DNA和RNA。例如，在宿主细胞染色体上相邻基因附近找到给定的DNA序列(例如，基因)；作为与编码多种蛋白质的众多其他mRNA的混合物，在细胞中找到的RNA序列，如编码特定蛋白质的特定mRNA序列。然而，包含例如SEQ ID NO：1的分离的核酸序列包括例如在细胞中通常含有SEQ ID NO：1的此类核酸序列，其中所述核酸序列位于不同于天然细胞中其染色体或染色体外位置的染色体或染色体外位置中，或侧翼分布有不同于自然界中存在的核酸序列。分离的核酸序列可以以单链或双链形式存在。当分离的核酸序列用来表达蛋白质时，该核酸序列将最少含有有义链或编码链的至少一部分(即，该核酸序列可以是单链的)。备选地，它可以含有有义链和反义链(即，该核酸序列可以是双链的)。

最小启动子：在缺少上游激活情况下无活性或启动子活性大大降低的启动子元件，尤其是TATA元件。在合适的转录因子存在下，最小启动子发挥作用以引起转录。

NEENA：参见“增强核酸表达的核酸”。

非编码：术语“非编码”指核酸分子中不编码所表达蛋白质的部分或全部的序列。非编码序列包括但不限于内含子、增强子、启动子区、3’非翻译区和5’非翻译区。

增强核酸表达的核酸(NEENA)：术语“增强核酸表达的核酸”指这样的序列和／或核酸分子，其是具有增强与NEENA功能性连接的启动子的控制下之核酸表达的内在特性的特定序列。不同于启动子序列，NEENA本身不能驱动表达。为了履行增强与NEENA功能性连接的核酸分子表达的职能，NEENA本身应当与启动子功能性连接。与本领域已知的增强子序列的区别在于，NEENA以顺式方式而不以反式方式起作用，并且必需靠近待表达核酸的转录起始位点存在。

核酸和核苷酸：术语“核酸”和“核苷酸”指天然存在的或合成的或人工核酸或核苷酸。术语“核酸”和“核苷酸”包括处于单链或双链、有义或反义形式的脱氧核糖核苷酸或核糖核苷酸或其任何核苷酸类似物和聚合物或杂合体。除非另外说明，特定核酸序列也隐含地包括其保守方式修饰的变体(例如简并密码子置换)和互补序列，以及明确指出的序列。术语“核酸”在本文中与“基因”、“cDNA”、“mRNA”、“寡核苷酸”和“多核苷酸”互换地使用。核苷酸类似物包括在碱基、糖和／或磷酸酯的化学结构中具有修饰的核苷酸，所述修饰包括但不限于5-位置嘧啶修饰、8-位置嘌呤修饰、胞嘧啶环外胺处的修饰、5-溴-尿嘧啶置换等；和2′-位置糖修饰，包括但不限于糖修饰的核糖核苷酸，其中2′-OH由选自H、OR、R、卤素、SH、SR、NH₂、NHR、NR₂或CN的基团替换。短发夹RNA(shRNA)也可以包含非天然元件如非天然碱基，例如，肌苷和黄嘌呤，非天然糖，例如，2′-甲氧基核糖，或非天然磷酸二酯键，例如甲基磷酸酯、硫代磷酸酯和肽。

核酸序列：短语“核酸序列”指从5’-端至3’-端读取的脱氧核糖核苷酸或核糖核苷酸的单链或双链聚合物。它包括染色体DNA、自我复制型质粒、DNA或RNA的感染性聚合物、和主要发挥结构性作用的DNA或RNA。“核酸序列”也指代表核苷酸的缩写、字母、字符或字的连续串。在一个实施方案中，核酸可以是“探针”，所述探针是相对短的核酸，通常长度小于100个核苷酸。经常地，核酸探针具有约50个核苷酸长度至约10个核苷酸长度。核酸的“靶区域”是核酸中被鉴定为目标的部分。核酸的“编码区”是核酸的部分，其中置于适宜的调节性序列控制下时，所述部分以序列特异性方式转录和翻译以产生特定的多肽或蛋白质。称该编码区编码这种多肽或蛋白质。

寡核苷酸：术语“寡核苷酸”指核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物的低聚物或聚合物，以及具有类似发挥作用的非天然存在部分的寡核苷酸。此类修饰或取代的寡核苷酸因合乎需要的特性，例如增强的细胞摄取、增强的核酸靶亲和力和在核酸酶存在下增加的稳定性而经常优选地胜过其天然形式。寡核苷酸优选地包括通过键(例如，磷酸二酯键)或取代键(substitute linkage)相互共价偶联的两个或多个核苷酸单体(nucleomonomer)。

突出端：“突出端”是双链寡核苷酸分子的5’-或3’-羟基端上相对短的单链核苷酸序列(也称作“延伸”、“伸出端”或“粘末端”)。

植物：通常理解为意指能够光合作用的任何真核单细胞或多细胞生物或其细胞、组织、器官、部分或繁殖材料(如种子或果实)。为本发明的目的，包括植物界(Plant Kingdom)的全部属和物种的高等和低等植物。优选一年生、多年生、单子叶和双子叶植物。该术语包括成熟植物、种子、苗(shoots)和幼苗(seedling)及其衍生部分、繁殖材料(如种子或小孢子)、植物器官、组织、原生质体、愈伤组织和其他培养物(例如细胞培养物)，和归并成产生功能单元或结构单元的任何其他类型的植物细胞。成熟植物指在除幼苗之外的任何目的发育阶段的植物。幼苗指在早期发育阶段的年幼不成熟植物。一年生、二年生、单子叶和双子叶植物是用于产生转基因植物的优选宿主生物。基因的表达在全部观赏植物、用材树或观赏树、花、切花、灌木或草坪草中是更进一步有利的。可以用举例方式、但非限制方式提到的植物是被子植物、苔藓植物例如獐耳细辛属(Hepaticae)(地钱类(liverwort))和藓纲(Musci)(藓类植物)；蕨类植物如蕨类、木贼类和石松类；裸子植物如松柏类植物、苏铁植物、银杏(ginkgo)和买麻藤科(Gnetaeae)植物；藻类如绿藻纲(Chlorophyceae)、褐藻纲(Phaeophpyceae)、红藻纲(Rhodophyceae)、粘藻纲(Myxophyceae)、黄藻纲(Xanthophyceae)、硅藻纲(Bacillariophyceae)(硅藻类)和裸藻纲(Euglenophyceae)。优选地用于食物或饲料目的的植物，如豆科(Leguminosae)如豌豆、苜蓿和大豆；禾本科(Gramineae)如稻、玉米、小麦、大麦、高粱、粟(millet)、黑麦(rye)、黑小麦(triticale)或燕麦(oat)；伞形科(Umbelliferae)，具体地是胡萝卜属(Daucus)(非常特别地是物种胡萝卜(carota))和芹属(Apium)，非常特别地是物种旱芹(Graveolens dulce(celery))及众多其它植物；茄科(Solanaceae)，特别是番茄属(Lycopersicon)，非常特别地是物种番茄(tomato)，和茄属(Solanum)，非常特别地是物种马铃薯(tuberosum)(tomato)和茄子(eggplant)和众多其它植物(如烟草(tobacco))，和辣椒属(Capsicum)，非常特别地是物种辣椒(annum(pepper))及众多其它植物；豆科(Leguminosae)，特别地是大豆属(Glycine)，非常特别地是物种大豆(soybean)、苜蓿、豌豆、紫花苜蓿、菜豆或花生及众多其它植物；和十字花科(Brassicacae)，特别地是芸苔属(Brassica)，非常特别地是物种欧洲油菜(napus，(oilseed rape))、芸苔(campestris，(beet)、甘蓝(oleracea cvTastie(卷心菜))、花椰菜(oleracea cv Snowball Y(花椰菜))和花茎甘蓝(oleracea cv Emperor(broccoli))；和拟南芥属，非常特别地是物种拟南芥及众多其它植物；菊科(Compositae)，具体地是莴苣属(Lactuca)，非常特别地是物种莴苣(sativa，(lettuce)及众多其它植物；菊科(Asteraceae)如向日葵、万寿菊、莴苣或金盏花及众多其它植物；葫芦科(Cucurbitaceae)如甜瓜、西葫芦／南瓜或夏南瓜，和亚麻(linseed)。更优选地是棉属植物、甘蔗、***、亚麻、辣椒和多种树、坚果和藤本(wine)物种。

多肽：术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在文中互换地使用，用来指连续氨基酸残基的聚合物或低聚物。

前蛋白：正常情况下靶向细胞器如叶绿体并且仍包含其转运肽的蛋白质。

初级转录物：如本文中所用的术语“初级转录物”指基因的不成熟RNA转录物。“初级转录物”例如仍包含内含子和／或仍不包含聚腺苷酸尾或帽结构和／或是缺少对其作为转录物正常发挥作用必需的其他修饰，例如修剪或编辑。

启动子：术语“启动子”或“启动子序列”是等同物并且如本文中所用的，指与目的核苷酸序列连接时能够控制目的核苷酸序列转录成RNA的DNA序列。此类启动子可以例如在以下公共数据库中http：／／www.grassius.org／grasspromdb.html、http：／／mendel.cs.rhul.ac.uk／ mendel.php?topic=plantprom、http：//ppdb.gene.nagoya-u.ac.jp／cgi-bin／index.cgi找到。其中所列的启动子可以用于本发明的方法并且在此引用而包括。启动子位于由该启动子控制转录成mRNA的目的核苷酸序列的5’(即，上游)，靠近其转录起始位点，并且为RNA聚合酶和用于转录起始的其他转录因子的特异性结合提供位点。所述启动子包含靠近转录起始位点例如至少10kb，例如5kb或2kb。它也可以包含靠近转录起始位点至少1500bp，优选地至少1000bp，更优选地至少500bp，甚至更优选地至少400bp，至少300bp，至少200bp或至少100bp。在又一个优选的实施方案中，启动子包含靠近转录起始位点至少50bp，例如至少25bp。启动子不包含外显子和／或内含子区或5’非翻译区。启动子可以例如相对于相应植物为异源或同源。如果多核苷酸序列源自外来物种，或如果来自相同物种，但从其原有形式中被修饰，则它相对于某生物或第二多核苷酸序列为“异源”。例如，与异源编码序列有效连接的启动子指编码序列来自不同于衍生该启动子的物种中，或，如果来自相同物种，编码序列与该启动子不天然接合(例如基因修饰的编码序列或来自不同生态型或品种的等位基因)。合适的启动子可以源自其中应当发生表达的宿主细胞的基因或源自该宿主细胞的病原体(例如，植物或植物病原体如植物病毒)。植物特异性启动子是适于调节植物中表达的启动子。这种启动子可以源自植物，也可以源自植物病原体，或它可以是由人设计的合成性启动子。如果启动子是诱导型启动子，则转录的速率应答于诱导剂而增加。另外，启动子可以以组织特异性或组织优先的方式受到调节，从而它仅仅或优势地在特定组织类型如叶、根或分生组织中在转录所接合的编码区方面有活性。用于启动子时，术语“组织特异性”指这样的启动子，该启动子能够指导目的核苷酸序列在特定类型的组织(例如，花瓣)中选择性表达，同时相同目的核苷酸序列在不同类型组织(例如，根)中相对缺少的表达。可以例如通过这样的方式评价启动子的组织特异性：将报道基因与该启动子序列有效连接以产生报道构建体，将报道构建体导入植物的基因组，从而该报道构建体整合至所产生的转基因植物的每种组织中，并且检测报道基因在转基因植物的不同组织中的表达(例如，检测mRNA、蛋白质或由报道基因编码的蛋白质的活性)。相对于报道基因在其他组织中的表达水平，检测到该报道基因在一种或多种组织中的更大表达水平表明该启动子对其中检测到更大表达水平的组织是特异性的。用于启动子时，术语“细胞类型特异的”指这样的启动子，该启动子能够指导目的核苷酸序列在特定类型的细胞中选择性表达，同时相同目的核苷酸序列在相同组织内部的不同类型细胞中相对缺少的表达。用于启动子时，术语“细胞类型特异的”还意指能够促进目的核苷酸序列在单一组织内部的某区域中选择表达的启动子。使用本领域熟知的方法，例如GUS活性染色法、GFP蛋白法或免疫组织化学染色法，可以评估启动子的细胞类型特异性。谈及启动子或源自启动子的表达时，术语“组成型”意指能够指导有效连接的核酸分子在刺激物(例如，热休克、化学品、光等)不存在下在大部分植物组织和细胞中贯穿植物或植物部分的基本上整个生活期限转录的启动子。一般而言，组成型启动子能够指导转基因在基本上任何细胞和任何组织中的表达。

启动子特异性：谈及启动子时，术语“特异性”意指由相应启动子引起的表达的样式。特异性描述了植物或其部分的组织和／或发育状态，在其中该启动子引起处于相应启动子控制下的核酸分子表达。启动子的特异性也可以包含环境条件，在所述环境条件下可以激活或下调该启动子，如由生物胁迫或环境胁迫如寒冷、干旱、受伤或感染诱导或阻遏。

纯化：如本文中所用，术语“纯化的”指从其天然环境取出、分离或分开的分子，即核酸序列或氨基酸序列。“基本上纯化的”分子至少60％没有、优选地至少75％没有和更优选地至少90％没有与它们天然结合在一起的其他组分。纯化的核酸序列可以是分离的核酸序列。

重组：就核酸分子而言，术语“重组”指通过重组DNA技术产生的核酸分子。重组核酸分子也可以包括本身不存在于自然界中但是被人修饰、改变、突变或操纵的分子。优选地，“重组核酸分子”是在序列方面与天然存在的核酸分子有至少一个核酸不同的非天然存在的核酸分子。“重组核酸分子”也可以包括“重组构建体”，其包含不天然地以这种顺序存在的一系列核酸分子，所述核酸分子优选地有效地连接。用于产生所述重组核酸分子的优选方法可以包括克隆技术、定向或非定向诱变法、合成或重组技术。

“种子特异性启动子”在本发明的上下文中是指在种子中调节相应启动子控制下的核酸分子转录的启动子，其中在种子的任何组织或细胞中转录的转录赋予在植物任何发育阶段在整株植物中从所述核酸序列转录的RNA的全部量的90％以上，优选95％以上，更优选99％以上。术语“种子特异性表达”也具有相应地理解。

“种子偏好的启动子”在本发明的上下文中是指在种子中调节相应启动子控制下的核酸分子转录的启动子，其中在种子的任何组织或细胞中的转录赋予在植物任何发育阶段在整株植物中从所述核酸序列转录的RNA的全部量的50％以上，优选70％以上，更优选80％以上。术语“种子偏好地表达”也具有相应地理解。

有义：术语“有义”理解为意指核酸分子，其具有与靶序列互补或相同的序列，例如与蛋白质转录因子结合和参与给定基因表达的序列。根据一个优选的实施方案，该核酸分子包含目的基因和允许表达该目的基因的元件。

显著的增加或减少：大于测量技术中固有误差幅度的增加或减少，例如在酶活性或在基因表达方面，优选地是对照酶的活性或对照细胞中的表达增加或减少约2倍或更多，更优选地增加或减少约5倍或更多，并且最优选地增加或减少约10倍或更多。

小核酸分子：“小核酸分子”理解为由核酸或其衍生物如RNA或DNA组成的分子。它们可以是双链或单链的，并且其长度在约15和约30bp之间，例如在15和30bp之间，更优选地在约19和约26bp之间，例如在19和26bp之间，甚至更优选地在约20和约25bp之间，例如在20和25bp之间。在一个特别优选的实施方案中，寡核苷酸的长度在约21和约24bp之间，例如在21和24bp之间。在一个最优选的实施方案中，小核酸分子的长度是约21bp和约24bp，例如21bp和24bp。

基本上互补的：在最广意义上，本文中就核苷酸序列相对于参比或靶核苷酸序列而言使用时，术语“基本上互补的”意指这样的核苷酸序列，其具有在基本上互补的核苷酸序列和所述参比或靶核苷酸序列的完全互补序列之间至少60％，更希望地至少70％，更希望地至少80％或85％，优选地至少90％，更优选地至少93％，仍更优选地至少95％或96％，仍旧更优选地至少97％或98％，依旧更优选地至少99％或最优选地100％的同一性百分数(后者等同于本上下文中的术语“同一的”)。优选地，在至少19个核苷酸长度、优选地至少50个核苷酸长度、更优选地核酸序列的全部长度范围内针对所述参比核苷酸序列评估同一性(如果不是，则另外在下文说明)。使用威斯康辛大学GCG的默认GAP分析，GAP的SEQWEB应用，基于Needleman和Wunsch算法(Needleman和Wunsch(1970)J Mol.Biol.48：443-453；如上文定义)实施序列比较。与参比核苷酸序列“基本上互补的”核苷酸序列与该参比核苷酸序列在低严格性条件、优选地中等严格性条件、最优选地高严格性条件(如上文定义)下杂交。

终止子：术语“终止子”、“转录终止子”或“转录终止子序列”在本文中使用时意指位于基因的3'UTR的引起聚合酶终止形成磷酸二酯键并且释放新生转录物的序列。如本文所用的，终止子包含有效生产信使RNA所必需的完整的3’UTR结构。终止子序列导致或起始自启动子起始的核酸序列的转录终止。优选地，转录终止子序列还包含引起转录物聚腺苷酸化的序列。转录终止子可以例如，包含一个或多个聚腺苷酸化信号序列，一个或多个聚腺苷酸化结合序列和多个长度的引起转录终止的下游序列。已经认识到编码表达的RNA转录物的3’非翻译区的序列下游的序列也是转录终止子的一部分，尽管序列本身并不作为RNA转录物的部分被表达。此外，转录终止子可以包含可以影响其功能性的额外的序列，例如3’非翻译序列(即编码序列的终止密码子之后的基因的序列)。转录终止可以涉及多个机制，包括但不限于诱导的RNA聚合酶II从其DNA模板的解离。

转基因：如本文中所用的术语“转基因”指通过实验操作导入细胞的基因组中的任何核酸序列。转基因可以是“内源DNA序列”或“异源DNA序列”(即，“外来DNA”)。术语“内源DNA序列”指这样的核苷酸序列，其天然存在于导入核苷酸序列的细胞中，只要它相对于天然存在序列不含有一些修饰(例如，点突变、存在可选择标记基因等)。

转基因的：当提及生物时，术语“转基因的”意指用重组DNA分子转化生物，优选地稳定转化生物，其中所述重组DNA分子优选地包含与目的DNA序列有效连接的合适启动子。

载体：如本文中所用，术语“载体”指能够运输已经与之连接的另一个核酸分子的核酸分子。一种类型的载体是基因组整合的载体，或“整合的载体”，所述载体可以整合至宿主细胞的染色体DNA中。另一个类型的载体是游离型载体，即，能够进行染色体外复制的核酸分子。本文中将能够指导与它们有效连接的基因表达的载体称作“表达载体”。在本说明书中，“质粒”和“载体”互换地使用，除非从上下文显而易见并非如此。设计旨在体外或体内产生如本文所述RNA的表达载体可以含有被任何RNA聚合酶识别的序列，所述的RNA聚合酶包括线粒体RNA聚合酶、RNA pol I、RNA polII和RNA pol III。这些载体可以用来在根据本发明的细胞中转录想要的RNA分子。将植物转化载体理解为适用于植物转化过程中的载体。

野生型：就生物、多肽或核酸序列而言，术语“野生型”、“天然”或“天然来源”意指所述生物是天然存在的或是在至少一种天然存在生物中可获得的，其没有被改变、突变或由人类操作。

实施例

化学品和常用方法

除非另外说明，如(Sambrook等人，1989)所述为本发明的目的进行克隆过程，包括限制性消化、琼脂糖凝胶电泳、核酸的纯化、核酸的连接、细菌细胞的转化、选择和培养。使用Sanger技术(Sanger等人，1977)，用激光荧光DNA测序仪(Applied Biosystems，Foster City，CA，USA)进行重组DNA的序列分析。除非另外描述，从Sigma Aldrich(Sigma Aldrich，St.Louis，USA)、Promega(Madison，WI，USA)、Duchefa(Haarlem,TheNetherlands)或Invitrogen(Carlsbad，CA，USA)获得化学品和试剂。限制性核酸内切酶来自New England Biolabs(Ipswich，MA，USA)或RocheDiagnostics GmbH(Penzberg，Germany)。寡核苷酸由Eurofins MWGOperon(Ebersberg，Germany)合成。

实施例1：推定增强基因表达的稻(Oryza sativa)终止子的鉴定

鉴定了增强功能连接基因的基因表达的终止子的序列元件。表1提供了43种增强终止子(ET)元件的综述。

表1：表达增强终止子(ET)序列元件

行号	ET ID	SEQ ID NO	IUPAC序列
				1	ET1	SEQ ID NO5	NRYCTTCCCWTYWWNNTDNNNCN
2	ET2	SEQ ID NO6	NGTGATWTTNCWNSN
				3	ET3	SEQ ID NO7	BTMMTTTTCCSTTV
4	ET4	SEQ ID NO8	DAVAGCCATCAVT
				5	ET5	SEQ ID NO9	DCTTRNTATTTKAV
6	ET6	SEQ ID NO10	NADHATNTNNDKWTGGTTTGTHNNAN
				7	ET7	SEQ ID NO11	NWANAATGASANNNNAHNAN
8	ET8	SEQ ID NO12	NAAAAGTAN
				9	ET9	SEQ ID NO13	WKWNNTGGAAGCAT
10	ET10	SEQ ID NO14	NWNNNHNWNTGNTATTN
				11	ET11	SEQ ID NO15	WYNNNHNNMNSNAAACTCANVAN
12	ET12	SEQ ID NO16	NWWKWNTNNTHATTATGMTN
				13	ET13	SEQ ID NO17	YGATGGCNNTAN
14	ET14	SEQ ID NO18	YHNNTTGTKTCNKNNKNMNNNVM
				15	ET15	SEQ ID NO19	NHNTYNNKTGCTTTKTNDN
16	ET16	SEQ ID NO20	ATKTTTCCTGYDNMAY
				17	ET17	SEQ ID NO21	WMCTATTGTNMWWWNKTA
18	ET18	SEQ ID NO22	TTTTCTCYTWCYTCTSMY
				19	ET19	SEQ ID NO23	KTTGRTTCYN
20	ET20	SEQ ID NO24	TKATATTGYNDWAYWWR
				21	ET21	SEQ ID NO25	WSNWAACTWGAW
22	ET22	SEQ ID NO26	NWTNTTATGNTM
				23	ET23	SEQ ID NO27	WMWWVBTCAATAAB
24	ET24	SEQ ID NO28	NTYANKDTTCYTGTGAA

25	ET25	SEQ ID NO29	TNNRWKNNGTGTTCTN
				26	ET26	SEQ ID NO30	NTATTGTSRHD
27	ET27	SEQ ID NO31	NWTTGTTTCN
				28	ET28	SEQ ID NO32	NWNNMCCTKTCCNNNRN
29	ET29	SEQ ID NO33	NTTASYKNAWTDKCACCAAN
				30	ET30	SEQ ID NO34	NNTTACTGSNWNNNNRN
31	ET31	SEQ ID NO35	NRRWNTTAATAANKWT
				32	ET32	SEQ ID NO36	NTNTCTGNTAN
33	ET33	SEQ ID NO37	NNNHNNTTGTTTCNNHWKNMN
				34	ET34	SEQ ID NO38	NTYANKDTTCYTGTGAA
35	ET35	SEQ ID NO39	YKTNNTTGCTTTN
				36	ET36	SEQ ID NO40	NGTGATWTTNCWNSN
37	ET37	SEQ ID NO41	MWNSRNNNBTNBRHGGCTTGTWN
				38	ET38	SEQ ID NO42	NYCTTTTSCNNNANYWAAN
39	ET39	SEQ ID NO43	NWTGCTACCN
				40	ET40	SEQ ID NO44	NAWTYTGATGANNAWNAW
41	ET41	SEQ ID NO45	WGWNABNMKMNAGMTCCACN
				42	ET42	SEQ ID NO46	NTCATAAGNRBA
43	ET43	SEQ ID NO47	DTMATTTTSY

A=腺嘌呤；C=胞嘧啶；G=鸟嘌呤；T=胸腺嘧啶；U=尿嘧啶；R=G A(嘌呤)；Y=T C(嘧啶)；K=G T(酮)；M=A C(氨基)；S=G C；W=A T；B=G T C；D=G A T；H=A C T；V=G C A；N=A G C T(任意)

使用ET元件筛选具有基因表达增强性能的终止子序列。通过ET元件的组合定义增强表达的终止子。表2列出了足以鉴定基因表达增强终止子分子的组合组(一行代表一组)。每行定义了基因表达增强终止子分子的特征ET元件组。

表2：表达增强终止子(ET)序列元件的组合组

行号

ET元件1

ET元件2

ET元件3

ET元件4

ET元件5

ET元件6

1

SEQ ID NO5

SEQ ID NO6

2

SEQ ID NO5

3

SEQ ID NO6

4

SEQ ID NO43

SEQ ID NO47

5

SEQ ID NO44

SEQ ID NO32

6

SEQ ID NO44

SEQ ID NO36

7

SEQ ID NO33

SEQ ID NO44

8

SEQ ID NO45

SEQ ID NO26

9

SEQ ID NO46

SEQ ID NO31

10

SEQ ID NO34

SEQ ID NO11

11

SEQ ID NO18

SEQ ID NO46

12

SEQ ID NO41

SEQ ID NO44

13

SEQ ID NO30

SEQ ID NO8

14

SEQ ID NO16

SEQ ID NO36

SEQ ID NO31

15

SEQ ID NO16

SEQ ID NO10

SEQ ID NO31

16

SEQ ID NO16

SEQ ID NO18

SEQ ID NO36

17

SEQ ID NO16

SEQ ID NO18

SEQ ID NO10

18

SEQ ID NO16

SEQ ID NO15

SEQ ID NO37

19

SEQ ID NO20

SEQ ID NO25

SEQ ID NO32

20

SEQ ID NO20

SEQ ID NO25

SEQ ID NO36

21

SEQ ID NO8

SEQ ID NO32

SEQ ID NO11

22

SEQ ID NO8

SEQ ID NO22

SEQ ID NO32

23

SEQ ID NO8

SEQ ID NO22

SEQ ID NO36

24

SEQ ID NO8

SEQ ID NO36

SEQ ID NO11

25

SEQ ID NO8

SEQ ID NO13

SEQ ID NO32

26

SEQ ID NO43

SEQ ID NO11

SEQ ID NO31

27

SEQ ID NO43

SEQ ID NO13

SEQ ID NO31

28

SEQ ID NO43

SEQ ID NO13

SEQ ID NO18

29

SEQ ID NO43

SEQ ID NO18

SEQ ID NO11

30

SEQ ID NO23

SEQ ID NO14

SEQ ID NO25

31

SEQ ID NO23

SEQ ID NO15

SEQ ID NO25

32

SEQ ID NO33

SEQ ID NO8

SEQ ID NO22

33

SEQ ID NO33

SEQ ID NO8

SEQ ID NO11

34

SEQ ID NO33

SEQ ID NO27

SEQ ID NO17

35

SEQ ID NO33

SEQ ID NO27

SEQ ID NO42

36

SEQ ID NO33

SEQ ID NO19

SEQ ID NO25

37

SEQ ID NO45

SEQ ID NO43

SEQ ID NO23

38

SEQ ID NO45

SEQ ID NO46

SEQ ID NO37

39

SEQ ID NO35

SEQ ID NO36

SEQ ID NO37

40

SEQ ID NO27

SEQ ID NO36

SEQ ID NO37

41

SEQ ID NO27

SEQ ID NO17

SEQ ID NO32

42

SEQ ID NO27

SEQ ID NO17

SEQ ID NO36

43

SEQ ID NO27

SEQ ID NO17

SEQ ID NO41

44

SEQ ID NO27

SEQ ID NO41

SEQ ID NO42

45

SEQ ID NO27

SEQ ID NO42

SEQ ID NO32

46

SEQ ID NO27

SEQ ID NO42

SEQ ID NO36

47

SEQ ID NO17

SEQ ID NO9

SEQ ID NO36

48

SEQ ID NO17

SEQ ID NO35

SEQ ID NO32

49

SEQ ID NO17

SEQ ID NO35

SEQ ID NO36

50

SEQ ID NO17

SEQ ID NO10

SEQ ID NO9

51

SEQ ID NO17

SEQ ID NO10

SEQ ID NO39

52

SEQ ID NO17

SEQ ID NO39

SEQ ID NO36

53

SEQ ID NO17

SEQ ID NO12

SEQ ID NO9

54

SEQ ID NO17

SEQ ID NO12

SEQ ID NO39

55

SEQ ID NO12

SEQ ID NO16

SEQ ID NO31

56

SEQ ID NO12

SEQ ID NO16

SEQ ID NO18

57

SEQ ID NO12

SEQ ID NO35

SEQ ID NO37

58

SEQ ID NO12

SEQ ID NO47

SEQ ID NO25

59

SEQ ID NO29

SEQ ID NO33

SEQ ID NO27

60

SEQ ID NO29

SEQ ID NO9

SEQ ID NO36

61

SEQ ID NO29

SEQ ID NO35

SEQ ID NO32

62

SEQ ID NO29

SEQ ID NO35

SEQ ID NO36

63

SEQ ID NO29

SEQ ID NO27

SEQ ID NO32

64

SEQ ID NO29

SEQ ID NO27

SEQ ID NO36

65

SEQ ID NO29

SEQ ID NO39

SEQ ID NO36

66

SEQ ID NO29

SEQ ID NO12

SEQ ID NO9

67

SEQ ID NO29

SEQ ID NO12

SEQ ID NO39

68

SEQ ID NO40

SEQ ID NO17

SEQ ID NO36

69

SEQ ID NO40

SEQ ID NO42

SEQ ID NO36

70

SEQ ID NO41

SEQ ID NO8

SEQ ID NO11

71

SEQ ID NO41

SEQ ID NO19

SEQ ID NO25

72

SEQ ID NO42

SEQ ID NO9

SEQ ID NO36

73

SEQ ID NO42

SEQ ID NO35

SEQ ID NO32

74

SEQ ID NO42

SEQ ID NO35

SEQ ID NO36

75

SEQ ID NO42

SEQ ID NO10

SEQ ID NO9

76

SEQ ID NO42

SEQ ID NO10

SEQ ID NO39

77

SEQ ID NO42

SEQ ID NO39

SEQ ID NO36

78

SEQ ID NO42

SEQ ID NO12

SEQ ID NO9

79

SEQ ID NO42

SEQ ID NO12

SEQ ID NO39

80

SEQ ID NO47

SEQ ID NO10

SEQ ID NO25

81

SEQ ID NO22

SEQ ID NO25

SEQ ID NO36

SEQ ID NO31

82

SEQ ID NO33

SEQ ID NO43

SEQ ID NO42

SEQ ID NO7

83

SEQ ID NO33

SEQ ID NO45

SEQ ID NO17

SEQ ID NO46

84

SEQ ID NO33

SEQ ID NO45

SEQ ID NO42

SEQ ID NO46

85

SEQ ID NO33

SEQ ID NO28

SEQ ID NO15

SEQ ID NO25

86

SEQ ID NO33

SEQ ID NO17

SEQ ID NO16

SEQ ID NO14

87

SEQ ID NO33

SEQ ID NO17

SEQ ID NO16

SEQ ID NO15

88

SEQ ID NO33

SEQ ID NO17

SEQ ID NO43

SEQ ID NO7

89

SEQ ID NO33

SEQ ID NO17

SEQ ID NO35

SEQ ID NO10

90

SEQ ID NO33

SEQ ID NO17

SEQ ID NO12

SEQ ID NO35

91

SEQ ID NO33

SEQ ID NO38

SEQ ID NO15

SEQ ID NO25

92

SEQ ID NO33

SEQ ID NO12

SEQ ID NO20

SEQ ID NO25

93

SEQ ID NO33

SEQ ID NO42

SEQ ID NO16

SEQ ID NO14

94

SEQ ID NO33

SEQ ID NO42

SEQ ID NO16

SEQ ID NO15

95

SEQ ID NO33

SEQ ID NO42

SEQ ID NO35

SEQ ID NO10

96

SEQ ID NO33

SEQ ID NO42

SEQ ID NO12

SEQ ID NO35

97

SEQ ID NO45

SEQ ID NO16

SEQ ID NO36

SEQ ID NO37

98

SEQ ID NO45

SEQ ID NO43

SEQ ID NO13

SEQ ID NO42

99

SEQ ID NO45

SEQ ID NO23

SEQ ID NO10

SEQ ID NO25

100

SEQ ID NO45

SEQ ID NO28

SEQ ID NO25

SEQ ID NO32

101

SEQ ID NO45

SEQ ID NO28

SEQ ID NO25

SEQ ID NO36

102

SEQ ID NO45

SEQ ID NO17

SEQ ID NO16

SEQ ID NO32

103

SEQ ID NO45

SEQ ID NO17

SEQ ID NO16

SEQ ID NO36

104

SEQ ID NO45

SEQ ID NO17

SEQ ID NO43

SEQ ID NO13

105

SEQ ID NO45

SEQ ID NO17

SEQ ID NO21

SEQ ID NO25

106

SEQ ID NO45

SEQ ID NO17

SEQ ID NO41

SEQ ID NO46

107

SEQ ID NO45

SEQ ID NO38

SEQ ID NO25

SEQ ID NO32

108

SEQ ID NO45

SEQ ID NO38

SEQ ID NO25

SEQ ID NO36

109

SEQ ID NO45

SEQ ID NO12

SEQ ID NO16

SEQ ID NO37

110

SEQ ID NO45

SEQ ID NO12

SEQ ID NO23

SEQ ID NO25

111

SEQ ID NO45

SEQ ID NO41

SEQ ID NO42

SEQ ID NO46

112

SEQ ID NO45

SEQ ID NO42

SEQ ID NO16

SEQ ID NO32

113

SEQ ID NO45

SEQ ID NO42

SEQ ID NO16

SEQ ID NO36

114

SEQ ID NO45

SEQ ID NO42

SEQ ID NO21

SEQ ID NO25

115

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

SEQ ID NO31

116

SEQ ID NO10

SEQ ID NO25

SEQ ID NO11

SEQ ID NO31

117

SEQ ID NO17

SEQ ID NO16

SEQ ID NO14

SEQ ID NO32

118

SEQ ID NO17

SEQ IDNO16

SEQ ID NO14

SEQ ID NO36

119

SEQ ID NO17

SEQ ID NO7

SEQ ID NO25

SEQ ID NO32

120

SEQ ID NO17

SEQ ID NO7

SEQ ID NO25

SEQ ID NO36

121

SEQ ID NO17

SEQ ID NO13

SEQ ID NO24

SEQ ID NO25

122

SEQ ID NO17

SEQ ID NO13

SEQ ID NO15

SEQ ID NO25

123

SEQ ID NO17

SEQ ID NO41

SEQ ID NO16

SEQ ID NO15

124

SEQ ID NO17

SEQ ID NO41

SEQ ID NO12

SEQ ID NO35

125

SEQ ID NO7

SEQ ID NO25

SEQ ID NO36

SEQ ID NO37

126

SEQ ID NO12

SEQ ID NO22

SEQ ID NO25

SEQ ID NO31

127

SEQ ID NO12

SEQ ID NO25

SEQ ID NO11

SEQ ID NO31

128

SEQ ID NO12

SEQ ID NO7

SEQ ID NO25

SEQ ID NO37

129

SEQ ID NO12

SEQ ID NO18

SEQ ID NO22

SEQ ID NO25

130

SEQ ID NO12

SEQ ID NO18

SEQ ID NO25

SEQ ID NO11

131

SEQ ID NO29

SEQ ID NO33

SEQ ID NO16

SEQ ID NO15

132

SEQ ID NO29

SEQ ID NO33

SEQ ID NO45

SEQ ID NO46

133

SEQ ID NO29

SEQ ID NO33

SEQ ID NO12

SEQ ID NO35

134

SEQ ID NO29

SEQ ID NO45

SEQ ID NO16

SEQ ID NO32

135

SEQ ID NO29

SEQ ID NO45

SEQ ID NO16

SEQ ID NO36

136

SEQ ID NO29

SEQ ID NO7

SEQ ID NO25

SEQ ID NO32

137

SEQ ID NO29

SEQ ID NO7

SEQ ID NO25

SEQ ID NO36

138

SEQ ID NO29

SEQ ID NO13

SEQ ID NO15

SEQ ID NO25

139

SEQ ID NO13

SEQ ID NO10

SEQ ID NO25

SEQ ID NO31

140

SEQ ID NO13

SEQ ID NO12

SEQ ID NO25

SEQ ID NO31

141

SEQ ID NO13

SEQ ID NO12

SEQ ID NO18

SEQ ID NO25

142

SEQ ID NO13

SEQ ID NO18

SEQ ID NO10

SEQ ID NO25

143

SEQ ID NO13

SEQ ID NO15

SEQ ID NO25

SEQ ID NO37

144

SEQ ID NO13

SEQ ID NO42

SEQ ID NO24

SEQ ID NO25

145

SEQ ID NO13

SEQ ID NO42

SEQ ID NO15

SEQ ID NO25

146

SEQ ID NO18

SEQ ID NO22

SEQ ID NO25

SEQ ID NO36

147

SEQ ID NO18

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

148

SEQ ID NO18

SEQ ID NO10

SEQ ID NO25

SEQ ID NO11

149

SEQ ID NO41

SEQ ID NO42

SEQ ID NO16

SEQ ID NO15

150

SEQ ID NO41

SEQ ID NO42

SEQ ID NO12

SEQ ID NO35

151

SEQ ID NO30

SEQ ID NO45

SEQ ID NO17

SEQ ID NO25

152

SEQ ID NO30

SEQ ID NO45

SEQ ID NO42

SEQ ID NO25

153

SEQ ID NO15

SEQ ID NO25

SEQ ID NO37

SEQ ID NO11

154

SEQ ID NO42

SEQ ID NO16

SEQ ID NO14

SEQ ID NO32

155

SEQ ID NO42

SEQ ID NO16

SEQ ID NO14

SEQ ID NO36

156

SEQ ID NO42

SEQ ID NO7

SEQ ID NO25

SEQ ID NO32

157

SEQ ID NO42

SEQ ID NO7

SEQ ID NO25

SEQ ID NO36

158

SEQ ID NO33

SEQ ID NO45

SEQ ID NO43

SEQ ID NO42

SEQ ID NO11

159

SEQ ID NO33

SEQ ID NO45

SEQ ID NO17

SEQ ID NO16

SEQ ID NO10

160

SEQ ID NO33

SEQ ID NO45

SEQ ID NO17

SEQ ID NO43

SEQ ID NO11

161

SEQ ID NO33

SEQ ID NO45

SEQ ID NO17

SEQ ID NO12

SEQ ID NO16

162

SEQ ID NO33

SEQ ID NO45

SEQ ID NO38

SEQ ID NO12

SEQ ID NO25

163

SEQ ID NO33

SEQ ID NO45

SEQ ID NO12

SEQ ID NO28

SEQ ID NO25

164

SEQ ID NO33

SEQ ID NO45

SEQ ID NO42

SEQ ID NO16

SEQ ID NO10

165

SEQ ID NO33

SEQ ID NO45

SEQ ID NO42

SEQ ID NO12

SEQ ID NO16

166

SEQ ID NO33

SEQ ID NO17

SEQ ID NO22

SEQ ID NO15

SEQ ID NO25

167

SEQ ID NO33

SEQ ID NO17

SEQ ID NO10

SEQ ID NO7

SEQ ID NO25

168

SEQ ID NO33

SEQ ID NO17

SEQ ID NO12

SEQ ID NO7

SEQ ID NO25

169

SEQ ID NO33

SEQ ID NO17

SEQ ID NO14

SEQ ID NO25

SEQ ID NO11

170

SEQ ID NO33

SEQ ID NO17

SEQ ID NO15

SEQ ID NO25

SEQ ID NO11

171

SEQ ID NO33

SEQ ID NO42

SEQ ID NO22

SEQ ID NO15

SEQ ID NO25

172

SEQ ID NO33

SEQ ID NO42

SEQ ID NO10

SEQ ID NO7

SEQ ID NO25

173

SEQ ID NO33

SEQ ID NO42

SEQ ID NO12

SEQ ID NO7

SEQ ID NO25

174

SEQ ID NO33

SEQ ID NO42

SEQ ID NO14

SEQ ID NO25

SEQ ID NO11

175

SEQ ID NO33

SEQ ID NO42

SEQ ID NO15

SEQ ID NO25

SEQ ID NO11

176

SEQ ID NO45

SEQ ID NO25

SEQ ID NO36

SEQ ID NO37

SEQ ID NO11

177

SEQ ID NO45

SEQ ID NO17

SEQ ID NO22

SEQ ID NO25

SEQ ID NO32

178

SEQ ID NO45

SEQ ID NO17

SEQ ID NO22

SEQ ID NO25

SEQ ID NO36

179

SEQ ID NO45

SEQ ID NO17

SEQ ID NO25

SEQ ID NO32

SEQ ID NO11

180

SEQ ID NO45

SEQ ID NO17

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

181

SEQ ID NO45

SEQ ID NO17

SEQ ID NO13

SEQ ID NO25

SEQ ID NO32

182

SEQ ID NO45

SEQ ID NO17

SEQ ID NO13

SEQ ID NO10

SEQ ID NO25

183

SEQ ID NO45

SEQ ID NO17

SEQ ID NO13

SEQ ID NO12

SEQ ID NO25

184

SEQ ID NO45

SEQ ID NO17

SEQ ID NO41

SEQ ID NO12

SEQID NO16

185

SEQ ID NO45

SEQ ID NO12

SEQ ID NO25

SEQ ID NO37

SEQ ID NO11

186

SEQ ID NO45

SEQ ID NO13

SEQ ID NO12

SEQ ID NO25

SEQ ID NO37

187

SEQ ID NO45

SEQ ID NO13

SEQ ID NO42

SEQ ID NO25

SEQ ID NO32

188

SEQ ID NO45

SEQ ID NO13

SEQ ID NO42

SEQ ID NO10

SEQ ID NO25

189

SEQ ID NO45

SEQ ID NO13

SEQ ID NO42

SEQ ID NO12

SEQ ID NO25

190

SEQ ID NO45

SEQ ID NO41

SEQ ID NO42

SEQ ID NO12

SEQ ID NO16

191

SEQ ID NO45

SEQ ID NO42

SEQ ID NO22

SEQ ID NO25

SEQ ID NO32

192

SEQ ID NO45

SEQ ID NO42

SEQ ID NO22

SEQ ID NO25

SEQ ID NO36

193

SEQ ID NO45

SEQ ID NO42

SEQ ID NO25

SEQ ID NO32

SEQ ID NO11

194

SEQ ID NO45

SEQ ID NO42

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

195

SEQ ID NO17

SEQ ID NO24

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

196

SEQ ID NO17

SEQ ID NO13

SEQ ID NO14

SEQ ID NO25

SEQ ID NO32

197

SEQ ID NO17

SEQ ID NO41

SEQ ID NO12

SEQ ID NO7

SEQ ID NO25

198

SEQ ID NO17

SEQ ID NO41

SEQ ID NO15

SEQ ID NO25

SEQ ID NO11

199

SEQ ID NO17

SEQ ID NO14

SEQ ID NO25

SEQ ID NO32

SEQ ID NO11

200

SEQ ID NO17

SEQ ID NO14

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

201

SEQ ID NO29

SEQ ID NO33

SEQ ID NO45

SEQ ID NO12

SEQ ID NO16

202

SEQ ID NO29

SEQ ID NO33

SEQ ID NO12

SEQ ID NO7

SEQ ID NO25

203

SEQ ID NO29

SEQ ID NO33

SEQ ID NO15

SEQ ID NO25

SEQ ID NO11

204

SEQ ID NO29

SEQ ID NO45

SEQ ID NO25

SEQ ID NO32

SEQ ID NO11

205

SEQ ID NO29

SEQ ID NO45

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

206

SEQ ID NO29

SEQ ID NO45

SEQ ID NO13

SEQ ID NO25

SEQ ID NO32

207

SEQ ID NO29

SEQ ID NO45

SEQ ID NO13

SEQ ID NO12

SEQ ID NO25

208

SEQ ID NO13

SEQ ID NO42

SEQ ID NO14

SEQ ID NO25

SEQ ID NO32

209

SEQ ID NO41

SEQ ID NO42

SEQ ID NO12

SEQ ID NO7

SEQ ID NO25

210

SEQ ID NO41

SEQID NO42

SEQ ID NO15

SEQ ID NO25

SEQ ID NO11

211

SEQ ID NO42

SEQ ID NO24

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

212

SEQ ID NO42

SEQ ID NO14

SEQ ID NO25

SEQ ID NO32

SEQ ID NO11

213

SEQ ID NO42

SEQ ID NO14

SEQ ID NO25

SEQ ID NO36

SEQ ID NO11

214

SEQ ID NO33

SEQ ID NO45

SEQ ID NO17

SEQ ID NO10

SEQ ID NO25

SEQ ID NO11

215

SEQ ID NO33

SEQ ID NO45

SEQ ID NO17

SEQ ID NO12

SEQ ID NO22

SEQ ID NO25

216

SEQ ID NO33

SEQ ID NO45

SEQ ID NO17

SEQ ID NO12

SEQ ID NO25

SEQ ID NO11

217

SEQ ID NO33

SEQ ID NO45

SEQ ID NO42

SEQ ID NO10

SEQ ID NO25

SEQ ID NO11

218

SEQ ID NO33

SEQ ID NO45

SEQ ID NO42

SEQ ID NO12

SEQ ID NO22

SEQ ID NO25

219

SEQ ID NO33

SEQ ID NO45

SEQ ID NO42

SEQ ID NO12

SEQ ID NO25

SEQ ID NO11

220

SEQ ID NO45

SEQ ID NO17

SEQ ID NO41

SEQ ID NO12

SEQ ID NO25

SEQ ID NO11

221

SEQ ID NO45

SEQ ID NO41

SEQ ID NO42

SEQ ID NO12

SEQ ID NO25

SEQ ID NO11

222

SEQ ID NO29

SEQ ID NO33

SEQ ID NO45

SEQ ID NO12

SEQ ID NO25

SEQ ID NO11

使用表2的短核酸序列元件(ET元件)组合鉴定推定增强功能连接基因的基因表达的稻终止子。在稻的公共可获得的基因组信息上(www.phytozome.net)进行序列检索(Genomatix Genome Analyser；Genomatix software GmbH，Germany)得到4个具有推定增强表达的候选终止子。在表3中列出了候选终止子和没有短增强信号的对照终止子。在表3中列出了在植物生物技术中常用的根癌农杆菌终止子，t-OCS(章鱼碱合酶转录终止子)和t-nos(胭脂碱合酶转录终止子(Genbank V00087))作为参照终止子：

表3：稻终止子和标准终止子t-OCS和t-nos(SEQ ID NO见表5)的概述

基因座		基因座
			推定的表达增强终止子(稻)	标准终止子	对照终止子(稻)
t-Os05g41900.1	t-OCS 192bp	t-Os06g47230.1
			t-Os03g56790.1	t-nos 253bp	t-Os02g38920.1
t-Os02g33080.1		t-Os12943600.1
			t-OsOSg10480.1		t-Os02g52290.1
		t-Os05g33880.1
					t-Os01g02150.1
		t-Os10933660.1
					t-Os05g42424.1
		t-Os03g46770.1

实施例2：通过3′RACE PCR验证终止子序列的完整性

使用RNAeasy试剂盒(QIAGEN；Hilden，Germany)根据制造商的说明书从稻植物的绿色组织中提取RNA。使用Quantitect试剂盒(QIAGEN，Hilden，Germany)根据制造商的说明书进行cDNA合成。

使用BD Bioscience Clontech(Heidelberg，Germany)的SMARTerRACE cDNA扩增试剂盒进行3′RACE分析，使用提供的寡d(T)和锚定引物以及在表4中列出的各个基因特异性引物。使用Invitrogen(carlsbad，CA，USA)的TOPO TA克隆试剂盒克隆PCR扩增子并对其测序以测定多腺苷酸化信号的位置。在表4中列出确认的3′UTR长度：

表4：基因特异性3′RACE引物和确认的3′UTR长度

实施例3：通过聚合酶链式反应分离终止子序列

使用Qiagen DNeasy Plant Mini试剂盒(Qiagen，Hilden，Germany)从稻绿色组织中提取基因组DNA。通过常规聚合酶链式反应(PCR)分离包含推定的表达增强终止子序列的基因组DNA片段。此外选择了不含任何表达增强信号的对照终止子组(比较表1和表2)。

聚合酶链式反应包含15组引物(表5)。基于包含整个3′UTR至注释和确认的多腺苷酸化信号的加上～300nt下游序列的稻基因组序列(www.phytozome.net)设计了13组引物。分别设计了一引物对用于从根癌农杆菌扩增标准终止子t-OCS和t-nos。

聚合酶链式反应遵照Phusion高保真DNA聚合酶(货号F-540L，NewEngland Biolabs，Ipswich，MA，USA)概述的方案。使用分离的DNA作为PCR扩增中的模板DNA，使用以下引物：

使用以下组成进行PCR扩增(50μl)：

3.00μl稻基因组DNA(50ng／μl基因组DNA)

10.00μl5x Phusion HF缓冲液

4.00μl dNTP(2.5mM)

2.50μl正向引物(10μM)

2.50μl反向引物(10μM)

0.50μl Phusion HF DNA聚合酶(2U／μl)

对PCR应用touch-down法，使用以下参数：98.0℃30秒(1个循环)，98.0℃30秒，56.0℃30秒和72.0℃60秒(4个循环)；4个额外循环，退火温度分别为54.0℃，51.0℃和49.0℃，接着20个循环的98.0℃30秒，46.0℃30秒和72.0℃60秒(4个循环)和72.0℃5分钟。扩增产物上样至2％(w／v)琼脂糖凝胶并在80V分离。从凝胶上切除PCR产物并用Qiagen凝胶提取试剂盒(Qiagen，Hilden，Germany)纯化。在用XhoI(10U／μl)和HindIII(10U／μl)或EcoRI(10U／μl)或SmaI(10U／μl)限制性内切核酸酶进行DNA限制消化后，再次用Qiagen凝胶提取试剂盒(Qiagen，Hilden,Germany)纯化消化的产物。

表6：限制消化概述

实施例4：产生具有终止子序列的载体构建体

使用多位点Gateway***(Invitrogen，Carlsbad，CA，USA)将启动子：：报告基因：：终止子盒组装进用于植物转化的双元构建体。在报告基因构建体中使用稻p-OsGos2(前缀p-表示启动子)启动子，使用萤火虫荧光素酶(Promega，Madison，WI，USA)作为报告蛋白，用于定量测定待分析的终止子序列的表达增强作用。

产生了包含萤火虫荧光素酶编码序列(Promega，Madison，WI，USA)和在其后的各个终止子(见上)的ENTR／B载体。使用在表6中指示的限制酶在萤火虫荧光素酶编码序列下游单独克隆终止子PCR片段。得到的pENTR／B载体总结在表7中，编码序列具有前缀c-。

表7：所有pENTR／B载体

根据制造商(Invitrogen，Carlsbad，CA，USA)的Gateway手册进行位点特异性重组(单位点LR反应)，将包含部分表达盒(c-LUC：：SEQ IDNO1-NO4，c-LUC：：SEQ ID NO65-NO66和c-LUC：：SEQ ID NO48-NO56)的pENTR/B与含有重组位点上游的组成型p-OsGos2的目的载体(VC-CCP05050-1qcz)组合。反应得到双元载体具有p-OsGos2启动子、萤火虫荧光素酶编码序列c-LUC和在萤火虫荧光素酶编码序列下游的各个终止子序列SEQ ID NO1-NO4，SEQ ID NO65-NO66和SEQ IDNO48-NO56(表8)，对此给出SEQ ID NO1和对照构建体(SEQ ID NO65和NO66)的组合作为示例(分别为SEQ ID NO97，NO98和NO99)。除了SEQ ID NO2至NO4和NO48至NO56的变化以外，所有载体中的核苷酸序列是相同的。得到的植物转化载体总结在表8中：

表8：用于稻转化的植物表达载体

得到的载体LJK428、LJK434、LJK441、LJK433、LJK445、LJK444、LJK427、LJK429、LJK430、LJK431、LJK432、LJK435、LJK442、LJK443和LJK447随后用于产生稳定的转基因稻植物。

实施例5：转基因稻植物的产生

使用包含各个表达载体的农杆菌细胞转化稻植物。将稻栽培品种日本晴(japonica cultivar Nipponbare)的成熟干燥种子脱壳。通过如下方式实施消毒：在70％乙醇中孵育1分钟，随后在0.2％HgCl₂中孵育30分钟，随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗下孵育4周后，将生胚性盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后，将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。生胚性愈伤组织片在新鲜培养基上传代培养3日，随后共培育(以助长细胞***活性)。

将含有相应表达载体的农杆菌菌株LBA4404用于共培育。将农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并且在液体共培育培养基中悬浮至密度(OD₆₀₀)约1。随后将混悬液转移至培养皿内，并且将所述愈伤组织浸入该混悬液中15分钟。将所述愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基，并且在25℃于黑暗下孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗下在选择剂存在时培育4周。在此期间，迅速生长的抗性愈伤组织团发育。在转移这种材料至再生培养基并在光照下孵育后，生胚潜能释放并且苗在随后4至5周内发育。将苗从愈伤组织切下并且在含有植物生长素的培养基上孵育2至3周，其中从所述培养基转移幼苗至土壤。硬化的苗在温室中在高湿度和短日照下培育。

对于一个构建体，产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在验证T-DNA***物拷贝数的定量PCR分析后，仅保留显示所述选择剂抗性的单拷贝转基因植物用于收获T1种子。随后在移栽后3至5个月收获种子。该方法以超过50％的比例产生单基因座转化体(Aldemita和Hodges1996，Chan等1993，Hiei等1994)。

实施例6：植物分析

对成年转基因稻植物的叶材料取样，在液氮中冷冻并进行荧光素酶报告基因测定(根据Ow等人，1986的修改方案)。在研磨后，将冷冻组织样品重悬在800μl缓冲液I(0.1M磷酸缓冲液pH7.8，1mM DTT(SigmaAldrich，St.Louis，MO，USA)，0.05％Tween20(Sigma Aldrich，St.Louis，MO，USA))中，接着以10000g离心10分钟。将75μl含水上清液转移至96孔板。在加入25μl缓冲液II(80mM甘氨酸-甘氨酰(Carl Roth，Karlsruhe，Germany)，40mM MgSO₄(Duchefa，Haarlem，TheNetherlands)，60mM ATP(Sigma Aldrich，St.Louis，MO，USA)，pH7.8)和D-荧光素至终浓度0.5mM(货号：L-8220，BioSynth，Staad，Switzerland)后，在MicroLumat Plus LB96V(Berthold Technologies，Bad Wildbad，Germany)中记录发光，得到相对光单位RLU／分钟(RLU／min)的单位。

为了标准化样品间的荧光素酶活性，在测定荧光素酶活性时平行测定了含水上清液中的蛋白质浓度(修改自Bradford，1976，Anal.Biochem.72，248)。将5μl在缓冲液I中的含水细胞提取物与250μl Bradford试剂(SigmaAldrich，St.Louis，MO，USA)混合，在室温孵育10分钟。在平板阅读器(Thermo Electron Corporation，Multiskan Ascent354)中测定595nm处的吸光度。使用以前生成的标准浓度曲线计算样品中的总蛋白质量。对含有相同构建体的转基因植物平均化从RLU／min和mg蛋白质／ml样品的比例得到的值，计算倍数变化值以评估表达增强终止子序列的影响。

相对连接t-OCS终止子序列的报告基因构建体，LJK428、LJK434、LJK441和LJK433显示了2.7倍，2.0倍，1.7倍和1.6倍高的荧光素酶活性(直接指示了荧光素酶报告基因的表达水平)(图1)。在表达构建体的同基因背景下，只有包含表达增强元件(表1和2)的4个检测的终止子序列导致相比t-OCS终止子的显著更高的荧光素酶活性(p<0.0005)(图1)。

类似地，相对连接t-nos终止子序列的报告基因构建体，LJK428、LJK434、LJK441和LJK433显示了2.3倍，1.7倍，1.4倍和1.4倍高的荧光素酶活性(直接指示了荧光素酶报告基因的表达水平)(图1)。在表达构建体的同基因背景下，只有包含表达增强元件(表1和2)的4个检测的终止子序列导致相比t-nos终止子的显著更高的荧光素酶活性(p<0.005)(图1)。

在构建体LJK428、LJK434、LJK441和LJK433中的终止子序列可因此用于显著增强相比标准终止子t-OCS和t-nos的表达水平。没有任何短增强元件的稻的对照终止子序列显示了与t-OCS和t-nos相当的表达(图1)。

实施例7：在其天然背景下表达增强终止子序列的微阵列分析

为了检测SEQ ID NO1至NO4是否也正面影响在其稻转录物的天然序列背景下的表达，用转录抑制剂处理稻植物。通过微阵列分析(AffymetrixGeneChip Rice(48,564转录物)；由ATLAS-Biotech，Berlin，Germany提供)评估SEQ ID NO1-NO4在其天然背景下(LOC_Os05g41900.1，LOC_Os03g56790.1，LOC_Os02g33080.1和LOC_Os08g10480.1)的功能连接转录物的转录物稳定性，通过抑制剂处理后的转录物水平测定所述转录物稳定性。

7.1用转录抑制剂处理转基因稻植物

在每个时点在瓦林商业搅拌器(waring commercial belnder)中用40ml培养基(1mM PIPES，1mM柠檬酸钠，1mM KCl，15mM蔗糖；pH6.25)破碎2株10天大的稻植物7秒以增加用于处理的表面。将75μg／mL放线菌素D(Sigma Aldrich，St.Louis，USA)和200μg／mL蛹虫草菌素(Cordycepin)(Sigma Aldrich，St.Louis，USA)加入培养基并真空渗透样品(1x100mbar，没有孵育时间)。在恒定的搅拌下(80rpm)孵育液体组织悬浮物。在0h、6h、12h、24h和36h后取样。

7.2微阵列分析和数据解释

使用RNAeasy试剂盒(QIAGEN；Hilden，Germany)从样品中提取RNA并与Affymetrix Gene Chip Rice杂交。

共48,564个转录物的平均数据分析显示在抑制剂处理后36h的时间进程内转录水平降低(～3倍)(图2)。相反地，来自LOC_Os05g41900.1、LOC_Os03g56790.1、LOC_Os02g33080.1和LOC_Os08g10480.1的转录物的转录水平在抑制剂处理后0h和36h之间的改变低于20％(图3)。

因此在用转录抑制剂放线菌素D和蛹虫草菌素处理后，与SEQ IDNO1至NO4功能连接的天然转录物显示了比平均转录物更高的稳定性(图2和3)。

实施例8：鉴定在其他单子叶植物物种中的基因表达增强终止子

如在稻中描述的，筛选其他单子叶植物物种，即玉米(Zea mays)、两色蜀黍(Sorghum bicolour)和二穗短柄草(Brachypodium distachion)的具有在表1和2中列出的ET元件的表达增强终止子序列。鉴定了推定的表达增强终止子序列(SEQ ID NO57-64)(表9)。分析显示SEQ IDNO57-64与SEQ ID NO1-NO3是直向同源的。因此各个ET序列在单子叶植物物种间是功能保守的。

表9：来自玉米、二穗短柄草和两色蜀黍的表达增强终止子序列，在稻中的直向同源序列

类似地克隆了单子叶植物终止子序列(SEQ ID NO57-64)并在荧光素酶报告基因背景下检测，如在实施例2至6中针对稻终止子所描述的。所有检测的终止子相比标准终止子t-OCS和t-nos显示了提高的荧光素酶活性水平，即增强的表达。

图注：

图1：用于稻终止子序列的荧光素酶报告基因测定

计算了含有相同构建体的转基因植物(n>17)的平均荧光素酶活性值[RLU／min]和变化倍数值以评估表达增强终止子序列的影响。

使用灰色条表示标准终止子构建体t-OCS和t-nos。相对与t-OCS终止子序列连接的报告基因构建体，LJK428、LJK434、LJK441和LJK433显示了2.7倍、2.0倍、1.7倍和1.6倍高的荧光素酶活性(p<0.0005)。

类似地，相对与t-nos终止子序列连接的报告基因构建体，LJK428、LJK434、LJK441和LJK433显示了2.3倍、1.7倍、1.4倍和1.4倍高的荧光素酶活性(p<0.005)。

用星号标记与t-nos终止子表达构建体有显著(p<0.005)差异的表达。对照稻终止子构建体LJK427、LJK429、LJK430、LJK431、LJK432、LJK435、LJK443和LJK447显示了与t-nos标准终止子构建体相当的表达水平。LJK442在报告基因背景下具有显著更低的荧光素酶活性水平。

图2：在微阵列分析中稻转录物随时间的平均信号强度

在用转录抑制剂(放线菌素D和蛹虫草菌素)处理后测量了AffymetrixGene Chip Rice上的48,564个转录物的平均信号强度。在抑制剂处理后0h、6h、12h、24h和36h采样。36h后的平均信号强度降低至抑制剂处理前的起始强度的1／3。这反映了稻转录物的平均转录物稳定性。

图3：与稻中的SEQ ID NO1-NO4终止子序列连接的天然转录物的信号强度；在用转录抑制剂处理后36h时间进程内的微阵列分析

在用转录抑制剂处理后36h时间进程内测量了与转录增强终止子序列(SEQ ID NO1-NO4)连接的天然转录物的信号强度。4种分析的转录物的信号强度相比起始强度变化<20％。相比平均转录物稳定性(图2)，与SEQID NO1-NO4连接的转录物在抑制剂处理后36h时间进程内显示了高稳定性。

表10：

表10：定义了所定义基序中的每个位置处的各个A、T、G或C碱基的频率的矩阵(MATRIX)权重表。Pos.基序中的位置，频率以％给出。一个位置中的总数高于或低于100％是由于舍入误差(round-off error)。

参考文献：

下列列出的文献和所有本文引用的文献在本文中以下述程度引入作为参考，即它们补充了本文所使用的方法、技术和／或组合物，解释本文所使用的方法、技术和／或组合物，为本文所使用的方法、技术和／或组合物提供背景或教导了本文所使用的方法、技术和／或组合物。

Dunwell(2000)J Exp Bot51Spec No：487—96

Zhao等人(1999)Microbiol Mol Biol Rev63：405-445

Proudfoot(1986)Nature322：562-565

Kim等人(2003)Biotechnology Progress19：1620-1622

Yonaha&Proudfoot(2000)EMBO J.19：3770-3777

Cramer等人(2001)FEBS Letters498：179-182

Kuersten&Goodwin(2003)Nature Reviews Genetics4：626—637

R.R.Aldemita和T.K.Hodges.Agrobacterium tumefaciens-mediatedtransformation of j aponica and indica rice varieties.Planta199(4)：612—617，1996.

M.M.Bradford.Rapid和Sensitive Method for Quantitation of MicrogramQuantities of Protein Utilizing Principle of Protein-Dye Binding.Analytical Biochemistry72(1—2)：248—254，1976.

M.T.Chan，H.H.Chang，S.L.Ho，W.F.Tong，和S.M.Yu.Agrobacterium-Mediated Production of Transgenic Rice PlantsExpressing A Chimeric Alpha—Amylase Promoter Beta—GlucuronidaseGene.Plant Molecular Biology22(3)：491—506，1993.

Cartharius K，Frech K，Grote K.(2005)Matlnspector and beyond：promoter analysis based on transcription factor binding sites，Bioinformatics21(13)2933—2942

Cartharius K(2005)，DNA Press

Genbank V00087

Y.Hiei，S.Ohta，T.Komari，和T.Kumashiro.Efficient Transformation ofRice(Oryza—Sativa L)Mediated by Agrobacterium andSequence-Analysis of the Boundaries of the T—Dna.Plant Journal6(2)：271—282，1994.

D.W.Ow，K.V.Wood，M.Deluca,J.R.Dewet，D.R.Helinski，和S.H.Howell.Transient and Stable Expression of the Firefly Luciferase Genein Plant-Cells and Transgenic Plants.Science234(4778)：856-859，1986.

J.Sambrook，E.F.Fritsch，和T.Maniatis.Molecular CIoning ALaboratory Manual第二版，卷12和3.Sambrook，J.，E.F. Fritsch andT.Maniatis.Molecular Cloning：A Laboratory Manual，第二版，卷1，2和3.Xxxix+Pagination Varies(卷1)；Xxxiii+Pagination Varies(卷2)：Xxxii+Pagination Varies(卷3)Cold Spring Harbor Laboratoty Press：1989.

F.Sanger，S.Nicklen，和A.R.Coulson.Dna Sequencing withChain—Terminating Inhibitors.Proceedings of the National Academy ofScienees of the United States of America74(12)：5463-5467，1977.

www.phytozome.net

Mapendano，C.K.，等人″Crosstalk between mRNA3′End Processingand Transcription Initiation.″Molecular Cell40.3(2010)：410-22.

Nagaya，S.，等人"The HSP Terminator of Arabidopsis thaliana IncreasesGene Expression in Plant Cells."Plant and Cell Physiology51.2(2010)：328-32.

Narsai，R.，等人″Genome-wide analysis of mRNA decay rates and theirdeterminants thaliana.″Plant Cell19.11(2007)：3418—36.

K.Quandt，K.Frech，H Karas，E Wingender和T Werner(1995)，Matindand Matinspector：new fast and versatile tools for detection of consensusmatches in nucleotide sequence data Nucleic Acid Research23(23)4878—4884

Claims

1.终止子分子，其包含至少一种下述在表1中定义的增强终止子元件(ET)或如表2中定义的其组合，或任意这些ET或这些ET组合的互补物或反向互补物，其中包含所述ET或其组合的终止子分子导致与所述终止子分子功能连接的异源核酸分子的增强的表达。

2.终止子分子，其包含选自下述的序列

b)核酸分子，其具有与SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64具有至少60％同一性的序列，或

c)i)或ii)的核酸分子的100或更多个连续碱基的片段，其具有如同具有SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64的序列的对应核酸分子的表达增强活性，或

d)核酸分子，其是任意之前在i)或ii)中提及的核酸分子的互补物或反向互补物，或

e)核酸分子，其可使用表5中显示的SEQ ID NO：63至96描述的寡核苷酸引物通过PCR得到，或

f)100个核苷酸或更多的核酸分子，其与包含SEQ ID NO：1、2、3、4、57、58、59、60、61、62、63和64描述的转录增强终止子的至少50个连续的核苷酸或其互补物的核酸分子在相当于下述的条件下杂交，即在7％的十二烷基硫酸钠(SDS)，0.5M NaPO4，1mM EDTA中在50℃下杂交，在2X SSC，0.1％SDS中在50℃下洗涤。

其中所述终止子分子导致与其功能连接的异源核酸分子的增强的表达。

3.鉴定和分离导致与终止子分子功能连接的异源核酸分子表达增强的终止子分子的方法，其包括以下步骤：

A)鉴定3′UTR，和

B)鉴定对应的基因组DNA

C)使用任意计算ET检测或IUPAC字符串匹配序列分析工具在B)中鉴定的组中鉴定包含在表1或表2中定义的任意ET或其组合的分子，和

D)分离至少250bp包含所述ET的基因组DNA。

4.产生重组终止子分子的方法，所述终止子分子增强与所述终止子分子功能连接的异源核酸分子的表达，所述方法包括以下步骤，在缺乏表达增强性能的终止子分子中引入至少一种在表1或表10中定义的ET元件或在表2中定义的其组合，或其互补物或反向互补物。

5.产生相比对应的对照植物或其部分具有一种或多种核酸分子的增强的表达的植物或其部分的方法，所述方法包括以下步骤：

a)将一种或多种包含在表1或2中定义的ET或其组合的终止子分子或在权利要求2的a)至f)中定义的终止子分子引入植物或其部分，

和

b)将所述一种或多种终止子分子与启动子和所述启动子控制下的核酸分子功能连接，其中所述终止子分子相对所述核酸分子和／或启动子是异源的。

6.权力要求5的方法，其包括以下步骤

a)将一种或多种包含在表1或2中定义的ET或其组合的终止子分子或在权利要求2的a)至f)中定义的终止子分子引入植物或其部分，和

b)将所述一种或多种终止子整合进所述植物或其部分的基因组中，使得所述一种或多种终止子与内源表达的核酸功能连接，所述内源表达的核酸相对所述一种或多种终止子是异源的，和任选地

c)从所述转化细胞再生包含所述一种或多种终止子的植物或其部分。

7.权利要求5至6的方法，其包括以下步骤：

a)提供表达构建体，其包含一种或多种包含在表1或2中定义的ET或其组合的终止子分子或在权利要求2的a)至f)中定义的终止子分子，所述终止子分子与启动子和一种或多种核酸分子功能连接，后者相对所述一种或多种终止子分子是异源的且处于所述启动子的控制下，和

b)将包含所述一种或多种终止子分子的所述表达构建体整合进所述植物或其部分的基因组中，和任选地

c)从所述转化的植物或其部分再生包含所述一种或多种表达构建体的植物或其部分。

8.权利要求5至7的方法，其中所述植物是单子叶或双子叶植物。

9.重组表达构建体，其包含一种或多种包含在表1或2中定义的ET或其组合的终止子分子或在权利要求2的a)至f)中定义的终止子分子。

10.权利要求9的重组表达构建体，其中所述终止子分子与一种或多种启动子和一种或多种表达的核酸分子功能连接，至少后者相对所述一种或多种终止子是异源的。

11.重组表达载体，其包含一种或多种权利要求9或10的重组表达构建体。

12.转基因植物或其部分，其包含一种或多种包含在表1或2中定义的ET或其组合的异源终止子分子或在权利要求2的a)至f)中定义的异源终止子分子。

13.转基因细胞或转基因植物或其部分，其包含权利要求11的重组表达载体或权利要求9或10的重组表达构建体。

14.权利要求13的转基因细胞、转基因植物或其部分，其选自或来自细菌、真菌、酵母或植物。

15.来自权利要求12至15的转基因细胞或植物或其部分的转基因细胞培养物、转基因种子、部分或繁殖材料，其包含所述包含在表1或2中定义的ET或其组合的异源终止子或在权利要求2的a)至f)中定义的异源终止子分子，权利要求9或10的重组表达构建体或权利要求11的重组载体。

16.包含在表1或2中定义的ET或其组合的终止子分子或在权利要求2的a)至f)中定义的终止子分子或在权利要求9至11中任一项定义的重组构建体或重组载体用于增强植物或其部分中的表达的用途。

17.产生农产品的方法，其通过将在表1或2中定义的ET或其组合或在权利要求2的a)至f)中定义的终止子分子或在权利要求9至11中任一项定义的重组构建体或重组载体引入植物，培养植物，收获和加工植物或其部分。