CN1318593C

CN1318593C - 编码参与生育酚合成的蛋白质的核酸序列

Info

Publication number: CN1318593C
Application number: CNB008087849A
Authority: CN
Inventors: B·萨维季; M·W·拉斯纳; J·D·韦斯; D·波斯特－比特恩米勒
Original assignee: Calgene LLC
Current assignee: Monsanto Products Co ltd; Monsanto Co
Priority date: 1999-04-15
Filing date: 2000-04-14
Publication date: 2007-05-30
Anticipated expiration: 2020-04-14
Also published as: US6541259B1; US20030170833A1; CA2369844A1; AU2005200270B2; CN1408024A; CN100387721C; US7141718B2; US20020108148A1; EP1190068A2; JP2002541851A; DE60025713T2; US7335815B2; PT1190068E; BRPI0009763B1; AU2005200270A1; EP1190068B1; DE60034224D1; BRPI0009763B8; CA2370616A1; MXPA01010486A

Abstract

提供了生产改变了生育酚含量和组成的植物和种子的核酸序列和方法。这些方法对提高植物中生育酚水平及在宿主植物细胞中产生希望的生育酚成分具有特殊的用途。

Description

编码参与生育酚合成的蛋白质的核酸序列

引言

本申请要求美国在先申请60/129,899(1999年4月15日提交)和美国在先申请60/146,461(1999年7月30日提交)的优先权。

技术领域

本发明涉及核酸与氨基酸的序列和构建体，及其相关方法。

背景

类异戊二烯类化合物广泛地存在于所有生物体中。植物合成多种系列的类异戊二烯类化合物，超过22,000种之多(Connolly和Hill(1992)Dictionary of Terpenoids，champman and Hall，New York，NY)。在植物中，类异戊二烯类化合物在特定的细胞功能诸如固醇的生成中起重要作用，促成真核细胞膜的构造以及存在于泛醌和质体醌、生长调节剂(如脱落酸、赤霉素、油菜素类固醇)或光合色素叶绿素和类胡萝卜素的开链聚异戊二烯化合物的侧链。尽管其它的植物性类异戊二烯类化合物的生理作用(比如，多种系列的次级代谢产物的生理作用)并不明显，但是已知有些类异戊二烯类化合物在介导对不同的环境挑战的适应性反应中起关键作用。尽管类异戊二烯类化合物的结构和功能具有显著的多样性，但是它们都源自单一种代谢前体，即异戊烯二磷酸(IPP)(Wright，(1961)Annu.Rev.Biochem.20：525-548；以及Spurgeon和Porter，(1981)Biosynthesis ofIsoprenoid Compounds.，Porter和Spurgeon编辑(John Wiley，NewYork)第1卷，1-46页)。

在高等植物的叶绿体中，存在着源自类异戊二烯途径的若干独特和相互关联的生化途径，它们导致次级代谢产物(包括生育酚)的生成。生育酚不仅在植物中起着至关重要的作用，而且从哺乳动物的营养角度来看也是重要的。在质体中，生育酚占总醌库的量达到40％

生育酚和生育三烯酚(不饱和生育酚的衍生物)是众所周知的抗氧化剂，在保护细胞免受自由基损害以及预防多种疾病(包括心脏病、癌症、白内障、视网膜病、早老性痴呆和神经变性)中起重要的作用，而且已经表明它们对关节炎症状以及在抗衰老中具有有益的效应。维生素E被用于鸡饲料中，以提高鸡肉的货架寿命、外观、香味和氧化稳定性，以及将母育酚从饲料转移到鸡蛋中。已经表明，维生素E对家畜动物的正常生育是必需的，并改善家畜动物的总体表现和增强其免疫力。在动物饲料中补充维生素E还可赋予奶制品氧化稳定性。

天然生育酚作为补充物，在过去的三年里，对其需求一直在以10-20％的速度稳定地增长。目前，对天然生育酚的需求超过了供给，已知天然生育酚的生物活性，高于合成得到的生育酚的外消旋混合物。天然生育酚都是d-立体异构体，而合成α-生育酚是八种d，1-α-生育酚异构体的混合物，只有其中的一种(占12.5％)与天然d-α-生育酚完全相同。天然d-α-生育酚，与其它天然生育酚或生育三烯酚相比，具有最高的维生素E活性(1.49IU/mg)。合成α-生育酚的维生素E活性为1.1IU/mg。1995年，世界市场对生育酚精制原料的需求为10.2亿美元；其中合成物质占市场的85-88％，剩下的12-15％为天然物质。天然生育酚和生育三烯酚的最佳来源物为植物油和谷类产品。当前，大部分的天然维生素E是产自γ-生育酚，而γ-生育酚又出自豆油加工，随后通过化学修饰可将其转化为α-生育酚(α-生育酚表现出最高的生物活性)。

不通过化学修饰而提高植物中生育酚和生育三烯酚(特别是那些能够直接使用的更希望得到的化合物)水平的方法，将有助于本领域，这是由于这些分子表现出更好的功能性和生物可利用性。。

另外，希望得到这样的方法，其可增加宿主植物细胞中其它类异戊二烯衍生化合物的产量。而且，还需要在宿主植物细胞中产生特定的类异戊二烯化合物的方法。

发明概述

本发明涉及异戊烯转移酶(PT)，更具体地，涉及PT的多核苷酸和多肽。本发明的多核苷酸和多肽包括源自真核细胞来源物的那些多核苷酸和多肽。

因而，本发明的一个方面涉及编码异戊烯转移酶蛋白质的分离的多核苷酸序列。更具体地，本发明提供了编码来自细菌和植物源的PT蛋白质的分离的核酸序列。

本发明的另一方面涉及一些寡聚核苷酸，包括部分或全部PT编码序列。

本发明的又一个方面提供了可用于转录或者转录及翻译(表达)异戊烯转移酶的重组DNA构建体。更具体地，本发明提供了能够在宿主细胞中转录或者转录及翻译的构建体。

在本发明的另一个方面中，提供了在宿主细胞或其后代中产生异戊烯转移酶的方法。更具体地，用可以用于转录或者转录及翻译异戊烯转移酶的DNA构建体对宿主细胞进行了转化或转染。含有异戊烯转移酶的重组细胞也是本发明的一部分。

另一方面，本发明涉及使用多核苷酸和多肽序列改变宿主细胞(尤其是宿主植物细胞)中的生育酚含量的方法。在本文中还构思了含有如此改变的生育酚含量的植物细胞。

通过表达异戊烯转移酶而得到的被修饰的植物、种子和油也被认为是本发明的一部分。

附图的简要说明

图1.提供了排列于ATPT2、ATPT3、ATPT4、ATPT8和ATPT12之间的氨基酸序列，通过Clustal W分析得到。

图2提供了表达构建体pCGN10800的示意图。

图3提供了表达构建体pCGN10801的示意图。

图4提供了表达构建体pCGN10803的示意图。

图5提供了表达构建体pCGN10806的示意图。

图6提供了表达构建体pCGN10807的示意图。

图7提供了表达构建体pCGN10808的示意图。

图8提供了表达构建体pCGN10809的示意图。

图9提供了表达构建体pCGN108010的示意图。

图10提供了表达构建体pCGN10811的示意图。

图11提供了表达构建体pCGN10812的示意图。

图12提供了表达构建体pCGN10813的示意图。

图13提供了表达构建体pCGN10814的示意图。

图14提供了表达构建体pCGN10815的示意图。

图15提供了表达构建体pCGN10816的示意图。

图16提供了表达构建体pCGN10817的示意图。

图17提供了表达构建体pCGN10819的示意图。

图18提供了表达构建体pCGN10824的示意图。

图19提供了表达构建体pCGN10825的示意图。

图20提供了表达构建体pCGN10826的示意图。

图21给出了Clustal W分析得到的集胞蓝细菌属(Synchocystis)序列敲除间的氨基酸序列排列。

图22给出了拟南芥属中ATPT2、ATPT3、ATPT4、ATPT8和ATPT12蛋白序列的氨基酸序列，以及集胞蓝细菌属中slr1736、slr0926、sll1899、slr0056和slr1518氨基酸序列。

图23给出了野生型集胞蓝细菌属菌株6803和集胞蓝细菌属slr1736敲除的集胞蓝细菌属制备物的酶分析结果。

图24给出了包含pCGN10822的转基因拟南芥属种子提取物HPLC分析资料的条线图，pCGN10822提供了从napin启动子起始向有义方向的ATPT2序列的表达。给出了α-，γ-，及δ-生育酚的图谱，同时也给出了22种转化细胞、一种非转化(野生型)对照组的总生育酚图谱。

图25给出了用pCGN10803(35S-ATPT2，向反义方向)、pCGN10802(1625行，napin ATPT2向有义方向)、pCGN10809(1627行，35S-ATPT3向有义方向)转化的植物拟南芥属种子提取物的HPLC分析条线图，同时也给出了非转化(野生型)对照组及经空载体转化对照组的图谱。

发明的详细描述

本发明尤其提供了改变(如增加和减少)生育酚水平和/或调整其在宿主细胞内含量的组成和方法。本发明特别提供了多核苷酸、多肽和在宿主植物细胞中调整生育酚含量的方法。

本发明提供了参与直链和芳香基化合物异戊烯化的多聚核苷酸及多肽序列。本文所用的直链异戊烯基转移酶包括编码参与直链化合物异戊烯化的蛋白质序列，该直链化合物包括但不局限于牻牛儿牻牛儿焦磷酸和法尼基焦磷酸。本文所用的芳香基异戊烯基转移酶包括编码参与芳香基化合物异戊烯化的蛋白质序列，该芳香基化合物包括但不局限于甲基萘醌、泛醌、叶绿素及尿黑酸。本发明中的异戊烯基转移酶优选尿黑酸的异戊烯化的蛋白质序列。

高等植物中α-生育酚的生物合成涉及到尿黑酸和叶绿基焦磷酸缩合形成2-甲基-6叶绿基苯醌，其可以通过环化和随后的甲基化形成多种生育酚(Fiedler等，1982，Planta，155：511-515，Soll等，1980，Arch，Biochem.Biophys.204：544-550，Marshall等，1985，Phytochem.，24：1705-1711，这些文献的全部内容在此引入作为参考)。Norniset等鉴定和描述了，拟南芥属dps2突变在生育酚和质体醌-9的积聚物中是不存在的。进一步的遗传学和生物化学分析显示PDS2编码的蛋白质是造成尿黑酸异戊烯化的原因，这在生育酚合成中可能是限速步骤，该基因现在仍未被分离。因此，本发明的一个方面是提供参与尿黑酸异戊烯化的多聚核苷酸和多肽。

分离的多聚核苷酸和多肽

本发明的第一个方面涉及分离的异戊烯基转移酶多核苷酸，该多核苷酸包括编码本发明多肽的多核苷酸，这些多肽具有选自序列表列出的推定氨基酸序列。本发明还涉及其它与这些多核苷酸序列及其变异体紧密相关的多核苷酸序列。

本发明提供了一种多核苷酸序列，其整个序列与在序列表中列出的每个编码序列完全相同。本发明还提供了成熟多肽或其片段的编码序列，以及与其它编码序列诸如那些编码导肽或分泌序列、前-、原-或前原-蛋白质序列处于同一读框中的成熟多肽或其片段的编码序列。该多核苷酸还可包含非编码序列，例如包括但不限于非编码的5’和3’序列，诸如转录但不翻译的序列、终止信号、核糖体结合位点、稳定mRNA的序列、内含子、多腺苷酸化信号和编码所添加氨基酸的添加编码序列。例如，可以将一个标记序列包括在内，以促进融合多肽的纯化。本发明的多核苷酸还包括含有结构基因和控制基因表达的天然结合序列的多核苷酸。

本发明还包括下式的多核苷酸：

X-(R₁)_n-(R₂)-(R₃)_n-Y

其中，位于5’末端的X是氢，位于3’末端的Y是氢或金属，R₁和R₃为任何核酸残基，n是一个介于1-3000之间的整数(优选介于1-1000之间)，R₂是本发明的核酸序列，尤其是选自序列表列出的核酸序列并优选SEQ ID NOs：1、3、5、7、8、10、11、13-16、18、23、29、36和38中的那些核酸序列。在上式中，R₂是有方向性的，其5’末端残基位于左边，结合于R₁，而其3’末端残基位于右边，结合于R₃。通过每组R(R大于1)表示的任何核酸残基片段，可以是杂聚物，也可以是均聚物，优选为杂聚物。

本发明还涉及本文所述的多核苷酸的变异体，它们编码本发明的多肽的变异体。那些本发明的多核苷酸片段的变异体，可被用于合成本发明的全长多核苷酸。优选的实施方案为编码多肽变异体的多核苷酸，其中对本发明的多肽序列的5-10，1-5，1-3，2，1或无氨基酸残基被以任何组合替代、添加或缺失。特别优选沉默的替代、添加和缺失，因为它们不会改变该多核苷酸或多肽的性能或活性。

本发明的进一步优选的实施方案为：在多核苷酸全长内与编码本发明多肽的多核苷酸有至少50％、60％或70％相同性的多核苷酸，以及与这种多核苷酸互补的多核苷酸。更优选含有其全长与编码本发明多肽的多核苷酸及其互补多核苷酸有至少80％相同性的区域的多核苷酸。在这一点上，尤其优选其全长与编码本发明多肽的多核苷酸及其互补多核苷酸有至少90％相同性，特别优选那些有至少95％相同性的多核苷酸序列。进一步地，非常优选那些有至少97％相同性的多核苷酸序列，而且尤其非常优选那些有至少98％和99％相同性的多核苷酸序列，其中最优选那些有至少99％相同性的多核苷酸序列。

优选的实施方案为这样的多核苷酸，它们所编码的多肽基本上保留了与成熟多肽(由序列表中列出的多核苷酸编码)相同的生物学功能或活性。

本发明进一步涉及可与上述序列杂交的多核苷酸。更具体地，本发明涉及在严格条件下可与上述多核苷酸杂交的多核苷酸。本文所用的术语“严格条件”和“严格杂交条件”是指在序列间具有至少95％(优选至少97％)相同性的情况下，一般会发生杂交反应。严格杂交条件的一个例子是，在含有50％甲酰胺、5×SSC(150mM NaCl，15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardt’s溶液、10％硫酸葡聚糖和20毫克/毫升变性剪切鲑精DNA的溶液中，在42℃温育过夜，随后在0.1×SSC中于大约65℃冲洗杂交载体。其它的杂交和冲洗条件是公知的，并且在Sambrook等人的分子克隆：实验室手册(Molecular Cloning：A Laboratory Manual)，Cold SpringHarbor，NY(1989)第二版，尤其是第11章中有例子。

本发明还提供一种基本上由一种多核苷酸序列组成的多核苷酸，这样的多核苷酸可如此获得：在严格杂交条件下，用在多核苷酸序列表中列出的多核苷酸序列或其片段序列作为探针，筛选含有该种多核苷酸序列的完整基因的合适的文库；然后分离所述的核苷酸序列。用于获得这样一种多核苷酸的片段包括例如本文中所述的探针和引物。

正如本文所讨论的关于本发明的多核苷酸测定法，例如，本发明的多核苷酸可被用作RNA、cDNA或基因组DNA的杂交探针，以分离全长cDNA或编码多肽的基因组克隆，以及分离与序列表中列出的多核苷酸具有高度序列相似性的其它基因的cDNA或基因组克隆。这样的探针一般含有至少15个碱基。优选地，这样的探针具有至少30个碱基并可以具有至少50个碱基。尤其优选的探针将具有30-50个碱基，其中包括30和50个在内。

含有或含于序列表中列出的多核苷酸序列的每一种基因，其编码区可以利用序列表中提供的DNA序列筛选，以合成寡核苷酸探针。然后，使用与本发明的基因的序列具有序列互补性的标记寡核苷酸，对cDNA、基因组DNA或mRNA的文库进行筛选，以鉴定可与探针杂交的文库中的成员。例如，制备与异戊烯基转移酶EST序列相应的合成的寡核苷酸。以寡核苷酸为引物，以聚合酶链式反应(PCR)技术获得异戊烯基转移酶基因的5’端和3’端序列。或者，在可以根据特定的异戊烯基转移酶肽制备出低简并性寡核苷酸的情况下，也可以将这样的探针直接用于筛选基因文库，以获得异戊烯基转移酶基因序列。尤其是，筛选噬菌体载体中的cDNA文库有助于这种方法，因为杂交的背景较低。

一般地，使用核酸探针所获得的异戊烯基转移酶序列显示出，靶异戊烯基转移酶序列与用作探针的编码序列之间60-70％的序列相同。但是，也可以获得低至50-60％序列相同性的长序列。核酸探针可以是长的核酸序列片段，也可以是较短的寡核苷酸探针。当使用较长的核酸片段作为探针时(大于大约100bp)，为了从靶样品中获得与探针序列具有20-50％偏差(即，50-80％的序列相同性)的序列，在进行筛选时可以将杂交的严格性降低。寡核苷酸探针可以比编码异戊烯基转移酶的完整核酸序列短许多，但至少也应该为大约10个，优选至少为大约15个，更优选至少为大约20个核苷酸。当使用较短的区域作探针时，与较长的区域相比，希望能达到更高的序列相同性程度。因此，希望鉴定出高度保守的氨基酸序列区，以设计寡核苷酸探针，用于探测和回收其它相关的异戊烯基转移酶基因。较短的探针对于聚合酶链式反应(PCR)常常特别有用，并且在可以鉴定出高度保守序列的情况下尤其如此(参见Gould等。，PNAS USA(1989)86：1934-1938)。

本发明的另一方面涉及异戊烯基转移酶多肽。这种多肽包括：在序列表中列出的分离的多肽及其多肽和片段，尤其是那些显示异戊烯基转移酶活性并且与从序列表所列序列中选出的多肽序列具有至少50％、60％或70％，优选至少80％，更优选至少90％，最优选至少95％相同性的多肽，还包括这些多肽的组成部分，其中多肽的组成部分优选包含至少30个氨基酸，更优选包含至少50个氨基酸。

“相同性”，正如本领域所熟知的，是两种或更多种多肽序列间或者两种或更多种多核苷酸序列间的相互关系，其可通过比较这些序列而确定。在本领域中，“相同性”也指多肽或多核苷酸序列间的序列相关性程度，其可通过对这些序列一串串地进行比对而确定。“相同性”可以容易地通过已知的方法计算出，这些方法包括但不限于：在Computational Molecular Biology，Lesk，A.M.编辑，牛津大学出版社，纽约，1988；Biocomputing：Informatics and Genome Projects，Smith，D.W.编辑，Academic Press，纽约，1993；Computer Analysis ofSequence Data，Part I，Griffin，A.M.和Griffin，H.G.编辑，Humana Press，New Jersey，1994；Sequence Analysis in Molecular Biology，von Heinje，G.，Academic Press，1987；Sequence Analysis Primers，Gribscov，M.和Devereux，J.编辑，Stockton Press，纽约，(1991)；以及Carillo，H.和Lipman，D.，SIAM J Applied Math.，48：1073(1988)中描述的那些方法。在设计确定相同性的方法时，目的就是给出待测试序列间的最大匹配。而且，确定相同性的方法被编写在可公开获得的程序中。可用于确定两种序列间相同性的电脑程序包括但不限于：GCG(Devereux，J.等，Nucleic Acids Research，12(1)：387(1984))；一组五个BLAST的程序，其中的三个用于核酸序列查询(BLASTN、BLASTX和TBLASTX)，两个用于蛋白质序列查询(BLASTP和TBLASTN)(Coulson，Trends in Biotechnolgy，12：76-80(1994)；Birren等，Genome Analysis，1：543-559(1997))。BLAST X程序可以从NCBI和其它途径公开获得(BLAST Manual，Altschul，S.等，NCBI NLM NIH，Bethesda，MD 20894；Altschul，S.等，J.Mol.Biol，215：403-410(1990))。公知知的SmithWaterman算法也可用于确定相同性。

多肽序列比较参数一般包括：

算法：Needleman和Wunsch，J.Mol.Biol.48：443-453(1970)

比较矩阵：BLOSSUM62，来自Hentikoff和Hentikoff，Proc.Natl.Acad.Sci USA 89：10915-10919(1992)

空位处罚分：12

空位长度处罚分：4

能够采用这些参数的一个程序，可从Genetics Computer Group，Madison，Wisconsin公开获得，这个程序被称为“空位”程序。上述参数，连同对末端空位没有处罚分，就是进行肽比较的缺省设置参数。

多核苷酸序列比较的参数包括：

算法：Needleman和Wunsch，J.Mol.Biol.48：443-453(1970)

比较矩阵：匹配＝+10，错配＝0

空位处罚分：50

空位长度处罚分：3

能够采用这些参数的一个程序，可从Genetics Computer Group，Madison，Wisconsin公开获得，这个程序被称为“空位”程序。上述参数就是进行核酸比较的缺省设置参数。

本发明还包括下式的多肽：

X-(R₁)_n-(R₂)-(R₃)_n-Y

其中，位于氨基末端的X是氢，位于羧基末端的Y是氢或金属，R₁和R₃为任何氨基酸残基，n是一个介于1-1000之间的整数，R₂是本发明的氨基酸序列，尤其是选自序列表中列出的氨基酸序列，优选在SEQ ID NO：2、4、6、9、12、17、19-22、24-28、30、32-37和39中提供的序列编码的那些氨基酸序列。在上式中，R₂是有方向性的，其氨基末端残基位于左边，结合于R₁，而其羧基末端残基位于右边，结合于R₃。用一组R(R大于1)表示的任何氨基酸残基片段，可以是杂聚物，也可以是均聚物，优选为杂聚物。

本发明的多肽包括由多核苷酸编码的分离的多肽，其中的多核苷酸含有选自本文序列表中列出的序列。

本发明的多肽可以是成熟的蛋白质或者可以是融合蛋白质的一部分。

这些多肽的片段和变异体也被认为是本发明的一部分。一个片段就是一个变异体多肽，它所具有的氨基酸序列与前面描述的多肽的氨基酸序列的一部分而不是全部完全相同。这些片段可以独立存在，也可以含于一个更大的多肽中，其中该片段形成一部分或一个区域，最优选是形成单一连续区域。优选的片段为具有生物学活性的片段，它们可以介导本发明多肽的活性，其中包括那些具有相似活性或提高活性或降低活性的片段。本发明还包括那些在动物尤其是人中具有抗原性或免疫原性的片段。

这些多肽的变异体还包括与序列表中列出的序列不同的多肽，这些不同是由保守氨基酸的取代产生的，即一个氨基酸残基被另一个具有相似性质的氨基酸残基取代。一般地，这中取代发生在Ala、Val、Leu和Ile之间，Ser和Thr之间，Asp和Glu之间，Asn和Gln之间，Lys和Arg之间，或Phe和Tyr之间。尤其优选其中5-10、1-5、1-3个或者1个氨基酸被以任何组合取代、缺失或添加的变异体。

那些是本发明多肽片段的变异体，通过肽合成可用于产生相应的全长多肽。因而，可将这些变异体用作生成本发明的全长多肽的中间体。

本发明的多核苷酸和多肽可用于，例如，转化宿主细胞诸如植物宿主细胞，正如本文所进一步讨论的。

本发明还提供了编码多肽的多核苷酸，其中的多肽为成熟蛋白质再加上添加的氨基或羧基末端氨基酸，或者成熟的多肽中的氨基酸(例如，当蛋白质的成熟形式具有多于一个多肽链时)。这种序列可以，例如，在蛋白质从前体到成熟形式的转变加工中起作用，帮助蛋白质转运，缩短或延长蛋白质半寿期，或者在蛋白质的测定或生产中简化操作。预期可使用胞内酶从成熟的蛋白质中除去任何添加的氨基酸。

具有融合到一种或多种前序列(prosequence)的成熟形式的多肽的前体蛋白质，可能是该多肽的无活性形式。一般地，当前序列被除去时，无活性前体被激活。在激活之前可以将一部分或者全部前序列除去。这种前体蛋白质一般称为前蛋白质。

植物构建及应用方法

我们尤其感兴趣的是将核苷酸序列用于重组DNA构建体，以指导本发明的异戊烯基转移酶序列在宿主细胞中的转录或转录及翻译(表达)。表达构建体一般含有宿主细胞中的功能性启动子，该启动子有效地连接到本发明的编码异戊烯基转移酶的核酸序列，还含有宿主细胞中的功能性转录终止区。

当序列的排列方式使得第一种核酸序列影响到第二种核酸序列的功能时，这两种核酸序列就是“有效地连接”或“有效地结合”。优选地，这两种序列是单一连续核酸分子的一部分，更优选地，这两种序列相邻。例如，如果一个启动子调节或介导一个基因在细胞中的转录，那么，所述启动子就与所述基因进行了有效地连接。

本领域的技术人员会认识到，在植物细胞中有许多功能性启动子，并且已在文献中对它们进行了描述。还展望了叶绿体和质体特异性启动子、叶绿体或质体中功能性启动子，以及在叶绿体或质体中有效的启动子。

一组植物功能性启动子为组成型启动子如CaMV35S或FMV35S启动子，它们在大多数植物器官中产生高水平的表达。已将CaMV35S和FMV35S启动子的增强或复制版本用于本发明的实践中(Odell等人，1985，Nature，313：810-812；Rogers，美国专利第5,378,619号)。另外，可优选让异戊烯基转移酶基因在植物的特定组织(如叶、茎、根、块茎、种子、果实等)中表达，并且所选择的启动子应具有所需要的组织和发育特异性。

尤其感兴趣的是，使本发明的核酸序列从转录起始区开始表达，并优先在植物种子组织中表达。这种优先在种子中转录起始的序列例子包括那些源自编码植物储藏蛋白质基因序列或者油料种子中参与脂肪酸生物合成的基因的序列。这种启动子的例子包括来自诸如napin(Kirdl等，Seed Sci.Res.，1：209-219(1991))、菜豆蛋白、玉米醇溶蛋白、大豆胰蛋白酶抑制剂、ACP、硬脂酰-ACP去饱和酶、大豆β-conglycin的α’亚单位(大豆7s，(Chen等Proc.Natl.Acad.Sci.，83：8560-8564(1986)))和油质蛋白的基因的5’调节区。

指导具有异戊烯基转移酶的蛋白质定位于特定的亚细胞区室例如线粒体、内质网、液泡、叶绿体或其它质体区室中，也许是有益的。例如，当将本发明的目的基因靶向质体诸如叶绿体以表达时，构建体也要使用指导基因至质体的序列。这种序列在本文中称为叶绿体转运肽(CTP)或质体转运肽(PTP)。这样，在没有将目的基因直接***到质体中的情况下，表达构建体将另外含有编码转运肽的基因，从而指导目的基因至质体。叶绿体转运肽可以是源自目的基因，也可以是源自具有CTP的异种序列。这种转运肽在本领域中是公知的。参见例如，Von Heijne等(1991)Plant Mol.Boil.Rep.9：104-126；Clark等(1989)J.Biol.Chem.264：17544-17550；della-Cioppa等(1987)PlantPhysiol.84：965-968；Romer等(1993)Biochem.Biophys.Res Commun.196：1414-1421；和Shah等(1986)Science 233：478-481。

根据目的用途，构建体可以含有编码整个异戊烯基转移酶蛋白质或其一个组成部分的核酸序列。例如，当需要反义抑制给定的异戊烯基转移酶蛋白质时，就不需要完整的异戊烯基转移酶序列。而且，当用于构建体中的异戊烯基转移酶序列是旨在用作探针时，则制备只含有异戊烯基转移酶编码序列的特定组成部分(例如，被发现是编码高度保守的异戊烯基转移酶区的序列)的构建体可能是有益的。

技术人员会认识到，用于抑制内源序列在宿主细胞中表达的方法有许多。这些方法包括但不限于反义抑制(Smith等(1988)Nature，334：724-726)、共抑制(Napoli等(1989)Plant Cell，2：279-289)、核酶(PCT公开说明书，WO 97/10328)以及有义与反义的组合(Waterhouse等(1998)，Proc.Natl.Acad.Sci.USA 95：13959-13964)。在宿主细胞中抑制内源序列的方法一般使用了转录或转录及翻译至少一部分待抑制序列。这种序列可以与内源序列的编码区同源，也可以与内源序列的非编码区同源。

本发明的植物表达构建体也可以提供调节转录本的终止区。转录本的终止区可以由编码异戊烯基转移酶的DNA序列提供，或者由不同基因来源的方便的转录终止区提供，例如，与转录本起始区天然结合的转录本终止区。技术人员会认识到，任何能够在植物细胞中终止转录的方便的转录本终止区，都可以在本发明的构建体中予以采用。

或者，也可以将构建体制备为可以指导异戊烯基转移酶序列直接从宿主植物细胞的质体表达。这种构建体和方法为本领域所公知，并一般描述于，例如Svab等(1990)Proc.Natl.Acsd.Sci.USA 87：8526-8530和Svab和Maliga(1993)Proc.Natl.Acsd.Sci.USA 90：913-917以及美国专利第5,693,507号。

本发明中的异戊烯基转移酶构建体可以与另外的构建体一起在转化方法中使用，该另外的构建体提供编码参与生产生育酚或生育酚前体(如：同源酸和/或叶绿基焦磷酸)蛋白质的核苷酸序列的表达。参与生产尿黑酸的蛋白质的核苷酸序列在本领域中是公知的，它包括但不局限于4-羟苯基丙酮酸双加氧酶(HPPD，ECl.13.11.27，如在Garcia等(1984)J.Mol.Biol.180：1023-1051中所述)、单一或双官能tyrA(如Xia等(1992)J.Gen Microbiol.138：1309-1316，以及Hudson.等(1984)J.Mol.Biol.180：1023-1051中所述)加氧酶、4-羟苯基丙酮酸二(9Cl)，4-羟苯基丙酮酸双加氧酶、对-4-羟苯基丙酮酸双加氧酶、对-4-羟苯基丙酮酸羟化酶、对-4-羟苯基丙酮酸氧化酶、对-4-羟苯基丙酮酸羟化酶、对-4-羟苯基丙酮酸氧化酶、4-羟苯基乙酸，NAD(P)H：氧化还原酶(1-羟基化)、4-羟苯基乙酸1-一加氧酶等。另外，编码参与生产叶绿基焦磷酸蛋白质的核酸序列的表达构建体也可以与本发明中的异戊烯基转移酶构建体一起使用。编码参与生产叶绿基焦磷酸蛋白质的核酸序列在本领域中是公知的，它包括但不局限于牻牛儿牻牛儿焦磷酸合酶(GGPPS)，牻牛儿牻牛儿焦磷酸还原酶(GGH)，1-脱氧木酮糖5-磷酸合酶，1-脱氧-D-木糖-5-磷酸盐还原异构酶、4-二磷酸胞苷-2-C-甲基赤藓糖醇合酶、异戊基焦磷酸异构酶。

本发明中的异戊烯基转移酶序列可以用于制备转化构建体，该构建体含有一个二级表达盒来表达参与生育酚生物合成的其它序列。本发明中令人感兴趣的另外的参与生育酚生物合成的序列包括但不局限于γ生育酚甲基化转移酶(Shintani等(1998)Science 282(5396)：2098-2100)、生育酚环化酶和生育酚甲基化酶。

当将含有表达构建体的重组DNA构建体引入到植物的细胞、组织、器官中或植物中时，我们就认为植物的细胞、组织、器官或植物已被转化、转染或转基因。转基因或转化的细胞或植物也包括细胞或植物的子代，以及由育种项目而产生的子代，该育种项目在杂交试验中采用这样的转基因植物作为亲代，并且这些子代由于异戊烯基转移酶核酸序列的存在而表现出变化的表型。

具有异戊烯基转移酶并作为提高或减低其表达的目的DNA序列的植物表达或转录型构建体，可用于广泛多种植物生命体中，尤其是参与生成食用或工业用途的植物油的植物生命体。用于本发明方法的尤其优选的植物包括但不限于：金合欢、苜蓿、茴香树、苹果树、杏树、洋蓟、芝麻菜、石刁柏、鳄梨树、芭蕉属植物、大麦、豆科植物、甜菜、黑莓、乌饭树、嫩茎花椰菜、球芽甘蓝、卷心菜、canola、罗马甜瓜、胡萝卜、木薯、花椰菜、芹菜、樱桃树、菊苣属植物、芫荽叶、柑橘属植物、克莱门氏小柑橘、咖啡树、玉米、棉花、黄瓜、Douglas冷杉、茄子、苣荬菜、escarole、桉树属植物、茴香、无花果属植物、大蒜、葫芦属植物、葡萄、葡萄柚、加甜味烟草、凉薯、kiwifruit、莴苣、韭葱、柠檬树、酸橙、火炬松、芒果、甜瓜、菌类植物、油桃、坚果、燕麦属植物、油棕榈、菜籽油油菜、秋葵荚、洋葱、柑桔、一种装饰性植物、番木瓜树、欧芹、豌豆、桃树、花生、梨树、胡椒属植物、柿树、松树、菠萝、车前草、李属植物、石榴树、杨属植物、马铃薯、南瓜、温柏树、放射状松树、菊苣、小萝卜、木莓、水稻、黑麦、高粱、美国长叶松、大豆、菠菜、南瓜、草莓、糖甜菜、甘蔗、向日葵、白薯、枫香属植物、红橘树、茶树、烟草、西红柿、黑小麦、草皮、芜菁、一种葡萄树、西瓜、小麦、薯蓣属植物和.夏季产南瓜。

最优选的是温带油料作物。感兴趣的温带油料作物包括但不限于：油菜仔(Canula和高芥子酸变种)、向日葵、红花、棉花、大豆、花生、椰子和油棕以及玉米。依据引入重组构建体至宿主细胞内所使用的方法，也许需要其它DNA序列。重要的是，本发明适用于双子叶种类的植物和单子叶种类的植物，并可以容易地适用于新的和/或改进的转化和调节技术。

尤其感兴趣的是，在植物中使用了异戊烯基转移酶构建体，以产生这样的植物或植物体部分(其中包括但不限于叶、茎、根、生殖性部分和种子)，在具有转化植物细胞的植物体部分中，生育酚的含量被改变。

为了进行免疫学筛选，用纯化的蛋白质或其组成部分注射兔或小鼠就可以制备针对该蛋白质的抗体，这种制备抗体的方法为本领域人员所公知。可以制备产生单克隆抗体或多克隆抗体，尽管在一般情况下多克隆抗体对于基因分离更有用。可以进行Western分析，以确定在所希望的植物种类的粗提取物中有相关蛋白质的存在，例如采用针对被编码蛋白质的抗体通过交叉反应来确定。当观察到交叉反应时，通过筛选代表所希望植物种类的表达文库，将编码相关蛋白质的基因分离。表达文库可构建于多种可商购载体中，包括λgtll，正如在Sambrook等在Molecular Cloning：A Laboratory Manual第二版(1989)Cold Spring Harbor Laboratory，Cold Spring Harbor，New York中所描述的。

为了证实被鉴定为异戊烯基转移酶的核酸序列所编码的蛋白质的活性和特异性，采用杆状病毒表达***在昆虫细胞培养物中进行了体外测定。这种杆状病毒表达***为本领域所公知，并且在Lee等人的美国专利5,348,886中有描述，本文引用其全部作为参考。

另外，可以制备其它表达构建体，以使用不同的表达***测定蛋白质活性。将这种表达构建体转化到酵母或原核细胞宿主内并测定异戊烯基转移酶活性。这种表达***为本领域所公知，并可容易地通过商业途径获得。

除了在本发明中所描述的序列外，用于本发明的DNA编码序列也可源自藻、真菌、细菌、哺乳动物来源物、植物等。可以使用与异戊烯基转移酶的保守核苷酸或氨基酸序列相应的特征序列，在已有的数据库中进行同源性搜索，从而从其它来源物诸如植物和微生物中分离相当、相关基因。也可以在EST数据库中进行搜索。而且，本发明还包含在功能上、酶本身方面与本文所公开的相当的DNA序列编码酶的用途，其中该DNA序列是本文中所公开的与遗传密码的简并性相一致的核酸序列的简并性相当物。使用任何这些方法所鉴定的编码序列，对其功能的证实，可以通过缺乏特异性生化反应或者已经发生突变的合适生物体(例如，集胞蓝细菌属(Synechocystis)、Schewanella、酵母、假单胞菌属(Pseudomonas)、红细菌科(Rhodobacteria)等)的突变体的互补来实现。DNA编码区的序列可以依据密码子的使用选择性，通过基因合成予以最优化，从而在特定的宿主中实现表达的最大化。

为了改变宿主细胞中生育酚的生成，依据本发明可以使用第二种表达构建体。例如，异戊烯转移酶表达构建体可以与第二种具有编码参与生育酚生物合成的蛋白的核苷酸序列的表达构建体一起引入宿主细胞。

在获得这种转基因植物中，转化方法对于本发明并不是非常重要，并且当前有多种植物转化方法可供使用。另外，如果有更新可用于转化作物的方法，此后可以直接应用这些新方法。例如，天然对农杆菌属(Agrobacterium)感染敏感的许多植物种类，可以通过农杆菌属介导转化的三分或二分载体方法予以成功地转化。在许多情况下，希望使构建体的一侧或两侧都与T-DNA相连，优选使左侧和右侧与T-DNA相连，更优选使右侧相连。这在构建体使用根癌农杆菌(A.tumefaciens)或毛根农杆菌(A.rhizogenes)作为转化方式时显得尤其有用，尽管T-DNA边缘区在其它转化方式中也有用途。另外，已经开发了显微注射、DNA颗粒轰击和电穿孔技术，这些技术可以转化多种单子叶和双子叶植物种类。

在正常情况下，在DNA构建体中将包含这种结构基因，它具有在宿主中表达所必需的调节区并提供对转化细胞的选择。该基因可以提供对一种细胞毒试剂例如抗生素、重金属、毒素等的抗性，通过互补对营养缺陷型宿主提供原养，提供病毒免疫力等等。根据不同宿主种类的数目，引入表达构建体或其组分，可以使用一种或多种标记，从而对不同的宿主种类使用不同的选择条件。

在使用农杆菌属转化植物细胞时，可以使用这样一种载体，其被引入农杆菌属宿主后，可与存在于农杆菌属宿主中的T-DNA或Ti-或Ri-质粒进行同源重组。含有T-DNA(用于重组)的Ti-或Ri-质粒可以被接臂(能引起瘿的形成)的，也可以被断臂(不能引起瘿的形成)的，在后一种情况下，只要vir基因存在于转化的农杆菌属宿主中即可。接臂的质粒能够产生正常植物细胞与瘿的混合物。

在将农杆菌属用作转化宿主植物细胞的媒介物的情况下，将通过T-DNA边缘区相连的表达或转录构建体***到一种宽宿主范围的载体中，这种载体具有在大肠杆菌以及农杆菌属中复制的能力，在文献中有对多种宽宿主范围载体的描述。通常使用的是pRK2或其衍生物。参见例如，Ditta等(Proc.Nat.Acad.Sci.U.S.A.(1980)77：7347-7351)以及EPA 0120515，此处引入作为参考。或者，也可以将准备在植物细胞中表达的序列***到含有独立的复制序列的载体中，其中的一个复制序列在大肠杆菌中稳定载体，另一个在农杆菌属稳定载体。见例如，MacBride等Plant Mol.Bol.(1990)14：269-276，其中使用了pRiHRI复制起点(Jouanin等Mol.Gen.Genet.(1985)201：370-374)，并使植物表达载体在宿主农杆菌属细胞中的稳定性增加。

包括表达构建体和T-DNA的可以是一种或多种标记，它们允许对转化的农杆菌属以及转化的植物细胞进行选择。已经开发了若干种用于植物细胞的标记，诸如对氯霉素、卡那霉素、氨基糖苷G418、潮霉素等的抗性，本发明并不要求必须使用某种标记，而是根据特定的宿主以及构建的方式优选一种或另一种标记。

在使用农杆菌属转化植物细胞时，可以将外植体与转化的农杆菌属合并在一起并温育足够的时间以使转化发生，细菌被杀死，然后将植物细胞培养于合适的选择培性养基中。一旦愈伤组织形成，通过使用合适的植物激素(采用公知的方法)可以催促茎干形成，然后将茎干转移到生根培养基中以再生植物。接着可以让植物生长结种，然后将种子用于建立重复生产以及用于分离植物油。

有几个可能的方法，用来获得含有多个表达构建体的本发明的植物细胞。本发明包含了任何用于生成植物的方法，该植物具有一种构建体，其具有编码本发明的表达构建体的DNA序列，以及至少一种其它构建体，其具有另一种编码酶的DNA序列。例如，可以通过将两种表达构建体合在单一种转化载体中，或使用独立的载体将表达构建体与第二种构建体同时用于转化植物，其中的每一种载体均表达所希望的基因。还可以将第二种构建体引入到已经用异戊烯转移酶表达构建体转化的植物中，或者也可以将一个是表达异戊烯转移酶构建体、另一个是表达第二种构建体的被转化植物，互相进行杂交，从而使两种构建体合于同一植物中。

可以将本发明的核酸序列用于构建体中，以提供在多种宿主细胞(真核细胞和原核细胞)中该序列的表达。本发明的宿主细胞优选包括单子叶和双子叶植物细胞。

一般地，技术人员对那些描述大分子(例如，DNA分子、质粒等)的构建、操作和分离，产生重组生物体以及筛选和分离克隆(参见例如，Sambrook等Molecular Cloning：A Laboratory Manual，ColdSpring Harbor Press(1989)；Maliga等Methods in Plant MolecularBiology，Cold Spring Harbor Press(1985)，其全部内容在此处引入作为参考；Birren等Genome Analysis：Analysing DNA，1，ColdSpring Harbor，New York，其全部内容在此处引入作为参考)的特定条件及方法的标准资料都很熟悉。

在昆虫宿主细胞中表达序列的方法在本领域中是公知的。杆状病毒表达载体是重组的昆虫病毒，其中已将所选择的外源基因的编码序列***到杆状病毒启动子的后面，以取代病毒基因，例如，多角体蛋白基因(Smith和Summers，美国专利4,745,051，其全部内容在此处引入作为参考)。杆状病毒表达载体为本领域所公知，并在例如Doerfler的Curr.Top.Microbiol.Immunol.，131：51-68(1968)；Luckrow和Summers的Bio/Technology，6：47-55(1988a)；Miller的Annual Review of Microbiology，42：177-199(1988)；Summers的Curr.Comm.Molecular Biology，Cold Spring Harbor Press，ColdSpring Harbor，N.Y.(1988)；Summers和Smith的A Manual ofMethods for Baculovirus Vectors and Insect Cell Culture Procedures，Texas Ag.Exper.Station Bullentin No.1555(1988)中对其进行了描述，其全部内容在此处引入作为参考。

在真菌宿主细胞中表达目的核酸序列的方法为本领域所公知。真菌宿主细胞可以是例如，酵母细胞或丝状真菌细胞。在酵母细胞中表达目的DNA序列的方法一般描述于“Guide to Yeast Genetics andMolecular Biolgy”，Guthrie和Fink编辑，Methods in Enzymology，Academic Press，Inc.，第194卷(1991年)；以及“Gene ExpressionTechnology”，Goeddel编辑，Methods in Enzymology，AcademicPress，Inc.，第185卷(1991年)。

可用作表达宿主的哺乳动物细胞是本领域所公知的，其中包括许多无限增殖化细胞系，可从美国典型培养物保藏中心(ATCC，Manassas，VA)得到它们，诸如Hela细胞、中国仓鼠卵巢(CHO)细胞、幼小仓鼠肾(BHK)细胞和若干其它细胞系。用于哺乳动物细胞的合适的启动子也是本领域所公知的，其中包括但不限于病毒性启动子诸如来自猴病毒40(SV40)(Fiers等Nature，273：113(1978)，此处引入其全部内容作为参考)、劳斯肉瘤病毒(RSV)、腺病毒(ADV)和牛***瘤病毒(BPV)的启动子。哺乳动物细胞也需要终止子序列和poly-A添加序列。也可以将提高表达的增强子序列包括在内，并且也希望含有可促进基因扩增的序列(例如，甲氨蝶呤抗性基因)。

适于在哺乳动物细胞中复制的载体是本领域所公知的，其中可包括病毒性复制子，或者能够确保将编码表位的适当序列整合到宿主基因组中的序列。已经对那些极大地促进重组病毒构建的质粒载体进行了描述(参见例如，Mackett等J.Virol，49：857(1984)；Chakrabarti等Mol.Cell.Biol.5：3403(1985)；Moss，In：Gene Transfer VectorsFor Mammalian Cells，Miller和Calos编辑，Cold Spring HarborLaboratory，N.Y.第10页(1987)；此处引入上述全部文献的全部内容作为参考)

到目前为止，我们已对本发明进行了综述，通过参考下面的实施例，将更容易了解本发明，所给出的这些实施例，仅用于说明，而不是构成对本发明的限制。

实施例

实施例1：异戊二烯转移酶序列的鉴定

PSI-BLAST(Altschul，et al.(1997)Nuc Acid Res 25；3389-3402)的序列文件(profiles)是针对直链和芳香类的异戊烯转移酶产生的。为了得到直链的序列文件，作为对NCBI中非冗余的蛋白质数据库的查询，使用来源于Porphyra purpurea(基因库，收录号1709766)的异戊烯转移酶。大肠杆菌的参与泛醌形成的酶ubiA(genbank收录号1790473)作为启始序列来产生芳香类异戊烯转移酶的序列文件。这些序列文件用来检索公共和专利的DNA和蛋白质数据库。在拟南芥属中，鉴定了7种直链异戊烯转移酶：ATPT1(SEQ ID NO：9)、ATPT7(SEQ ID NO：10)、ATPT8(SEQ ID NO：11)、ATPT9(SEQ ID NO：13)、ATPT10(SEQ ID NO：14)、ATPT11(SEQ ID NO：15)和ATPT12(SEQ ID NO：16)；鉴定了5种芳香异戊烯转移酶：ATPT2(SEQ ID NO：1)、ATPT3(SEQ IDNO：3)、ATPT4(SEQ ID NO：5)、ATPT5(SEQ ID NO：7)、ATPT6(SEQ ID NO：8)。还鉴定了来源于其它植物与芳香类异戊烯转移酶相关的芳香类异戊烯转移酶序列，如大豆(SEQ IDNOs：19-23，在SEQ ID NO：24中给出了SEQ ID NO：23的推定氨基酸序列)和玉米(SEQ ID NOs：25-29和31)。由ZMPT的推定氨基酸序列(SEQ IQ NO：29)在SEQ ID NO：30中给出。

使用附加的Bioaccellerator硬件和由Compugen Ltd.提供的GenWeb软件在Silicon Graphics Unix计算机上进行检索。该软件和硬件在使用序列文件作为查询工具检索DNA和蛋白质数据库中需要使用Smith-Waterman算法。用来查询蛋白质数据库的程序是序列文件索引。在该检索中，不是查询单一序列，而是查询基于氨基酸或核苷酸序列的多种排列的序列文件。这个序列文件是用来查询序列数据组，即序列数据库。该序列文件含有序列上每一个位点打分的相关信息，它有效地替代了用于标准查询的“打分矩阵“。用于以蛋白质序列文件查询核酸数据库的程序是T序列文件索引。T序列文件索引使用氨基酸序列文件查询来检索核酸数据库。当检索进行时，数据库中的序列以6个读框为单位翻译成氨基酸序列。T序列文件索引的结果文件与序列文件索引的只在一个方面有区别，即T序列文件索引中有一附加行指出最佳排列的读框。

Smith-Waterman算法(Smith和Waterman(1981)supra)是用来查找一段序列与数据库中一组序列相似性的。E分值以及其它序列信息，如保守的多肽序列，用来鉴定相关序列。

为了得到对应拟南芥属的异戊烯转移酶的全部编码区，设计了合成寡核苷酸引物来扩增含有异戊烯转移酶序列的部分cDNA克隆的5’末端和3’末端。引物按照相关拟南芥属异戊烯转移酶序列设计并用于cDNA末端快速扩增反应(Rapid Amplification of cDNA Ends，RACE)(Frohman等(1988)Proc.Natl.Acad.Sci.USA 85：8998-9002)，该反应使用Marthaon cDNA扩增试剂盒(Clontech Laboratories Inc，Palo Alto，CA)。

使用ATPT2序列进行其它BLAST检索，该序列是一种芳香异戊烯转移酶。其它序列在与ATPT2序列相似的大豆文库中鉴定。另外的大豆序列证实在氨基酸顺序上有80％相同性和91％相似性。

ATPT2(SEQ ID NO：2)、ATPT3(SEQ ID NO：4)、ATPT4(SEQ IDNO：6)、ATPT8(SEQ ID NO：12)和ATPT12(SEQ ID NO：17)之间的氨基酸序列排列使用ClusfalW(图1)进行，其相同和相似百分率在表1中给出。

表1

	ATPT2	ATPT3	ATPT4	ATPT8	ATPT12
	ATPT2	ATPT3	ATPT4	ATPT8	ATPT12	ATPT2 ％相同性％相似性％空位		12	13	11	15
	25	25	22	32				12	13	11	15
	25	25	22	32			17	20	20	9
ATPT3 ％相同性％相似性％空位			12	6			17	20	20	9	22
			12	6			29	16	38		22
			20	24			29	16	38	14
			20	24	ATPT4 ％相同性％相似性％空位				9	14	14
			18	29					9		14
			18	29					26	19
ATPT8 ％相同性％相似性％空位									26	19	7
									19		7
									19	20
					ATPT12 ％相同性％相似性％空位					20

实施例2：表达构建体的制备

对一个由pCGN3223(描述于USPN 5,639,790，其全部内容引入本文作为参考)衍生而来的含napin盒的质粒进行修饰，使其更有助于克隆含有多限制性位点的大DNA片断，并且使多napin融合基因克隆至植物双表达载体。在使用限制性内切酶BssH II对构建载体pCGN77645消化以后，将序列为CGCGATTTAAATGGCGCGCCCTGCAGGCGGCCGCCTGCAGGGCGCGCCATTTAAAT(SEQ ID NO：40)的自身连接寡核苷酸组成的接头与克隆载体pBC Sk+(Stratagen)连接在一起。得到的载体pCGN7770含有pCGN3323的napin种子特异表达盒的pGCN7765主链。

克隆盒pCGN7787(除pCGN7770的napin调节区以外与pGGN7770基本相同的调节单元)被双链CAMV 35S启动子和tml聚腺苷酸和转录终止区所代替。

植物转染双载体pCGN5139由pCGN1558构建(McBride和Summerfelt(1990)Plant Molecular Biology，14：269-276)。pCGN1558的多连接子被一个非多连接子的Hind III/Asp718片段所代替，后者含有独特的限制性内切酶位点Asc I，Pac I，Xba I，Swa I，BamH I和NotI。Asp718和Hind III限制性内切酶位点存在于pCGN5139内。

构建一系列快速双载体以使得DNA序列快速克隆到含有转录启始位点(启始子)和转录终止区的双载体中。

通过连接寡核苷酸5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ ID NO：41)和5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ IDNO：42)到Sal I/Xho I消化的pCGN7770构建质粒pCGN8618。含有napin启动子、多连接子(polylinker)和napin 3’区的片段通过用Asp718I消化而从pCGN8618切下；该片段被Klenow片段将5’-突出端添入而变为平端，然后与pCGN5139连接，后者已被Asp718和Hind III消化，并由Klenow片段将5’-突出端添入而变为平端。将含有为了使napin启动子与pCGN5139的Asp718 I的平端接近并且使napin的3’-末端与Hind III位点平端接近而定向***物的质粒进行序列测定，来确定***的方向和克隆连接的完整性。得到的质粒称pCGN8622。

通过连接寡核苷酸寡聚核苷5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ ID NO：43)和5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ IDNO：44)到Sal I/Xho I消化的pCGN7770构建质粒pCGN8619。将含有napin启动子、多连接子(polylinker)和napin3’区的片段通过用Asp718 I消化而从pCGN8619切下；该片段被Klenow片段将5’-突出端添入而变为平端，然后与pCGN5139连接，后者已被Asp718和Hind III消化，并由Klenow片段将5’-突出端添入而变为平端。将含有为了使napin启动子与pCGN5139的Asp718 I的平端接近并且使napin的3’-末端与Hind III位点平端接近而定向***物的质粒进行序列测定，来确定***的方向和克隆连接的完整性。得到的质粒称pCGN8623。

通过连接寡核苷酸寡聚核苷5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGGAGCT-3’(SEQ IDNO：45)和5’-CCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ IDNO：46)到Sal I/Sac I消化的pCGN7787构建质粒pCGN8620。将含有d35S启动子、多连接子(polylinker)和trm 3’区的片段通过用Asp718I完全和Not I部分消化而从pCGN8620切下；该片段被Klenow片段将5’-突出端添入而变为平端，然后与pCGN5139连接，后者已被Asp718和Hind III消化，并由Klenow片段将5’-突出端添入而变为平端。将含有为了使d35S启动子与pCGN5139的Asp718 I的平端接近并且使tml的3’-末端与Hind III位点平端接近而定向***物的质粒进行序列测定，来确定***的方向和克隆连接的完整性。得到的质粒称pCGN8624。

通过连接寡核苷酸寡聚核苷5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCCAGCT-3’(SEQ IDNO：47)和5’-GGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ IDNO：48)到Sal I/Sac I消化的pCGN7787构建质粒pCGN8621。将含有d35S启动子、多连接子(Polylinker)和trm3’区的片段通过用Asp718I完全和Not I部分消化而从pCGN8621切下；该片段被Klenow片段将5’-突出端添入而变为平端，然后与pCGN5139连接，后者已被Asp718和Hind III消化，并由Klenow片段将5’-突出端添入而变为平端。将含有为了使d35S启动子与pCGN5139的Asp718 I的平端接近并且使tml的3’-末端与Hind III位点平端接近而定向***物的质粒进行序列测定，来确定***的方向和克隆连接的完整性。得到的质粒称pCGN8625。

质粒构建体pCGN8640是上述pCGN8624的修饰。从编码细菌奇霉素和链霉素抗性(Fling等(1985)，Nucleic Acids Research13(19)：7095-7100)的转位子分离的938bp Pst I的片段，是选择大肠杆菌和毛根农杆菌的决定因素，而且由Pfu聚合酶补为平端。该平端片段连接到被Spe I消化且被Pfu聚合酶补平的质粒pCGN8624。对含有Pst I片段的区域测序以确定***物的方向和克隆连接的完整性。

按如下的方法将奇霉素抗性标记引入pCGN8622和pCGN8623：将从pCGN8640得到的7.7kbp的Avr II-SnaB I片段连接到从pCGN8622或pCGN8623得到的10.9kbp的Avr II-SnaB I片段。分别得到质粒pCGN8641和pCGN8643。

通过连接寡核苷酸5’-GATCACCTGCAGGAAGCTTGCGGCCGCGGATCCAATGCA-3’(SEQ ID NO：49)和5’-TTGGATCCGCGGCCGCAAGCTTCCTGCAGGT-3’(SEQ ID NO：50)到Bam H I-Pst I消化的pCGN8641构建质粒pCGN8644。

设计将合成寡核苷酸用于聚合酶链反应(PCR)来扩增用于制备表达构建体的ATPT2、ATPT3、ATPT4、ATPT8和ATPT12的编码序列，见下面表2。

表2

名称	限制位点	序列	序列编号
名称	限制位点	序列	序列编号	ATPT2	5’Not I	GGATCCGCGGCCGCACAATGGAGTCTCTGCTCTCTAGTTCT	51
ATPT2	3’Sse I	GGATCCTGCAGGTCACTTCAAAAAAGGTAACAGCAAGT	52	ATPT2	5’Not I	GGATCCGCGGCCGCACAATGGAGTCTCTGCTCTCTAGTTCT	51
ATPT2	3’Sse I	GGATCCTGCAGGTCACTTCAAAAAAGGTAACAGCAAGT	52	ATPT3	5’Not I	GGATCCGCGGCCGCACAATGGCGTTTTTTGGGCTCTCCCGTGTTT	53
ATPT3	3’Sse I	GGATCCTGCAGGTTATTGAAAACTTCTTCCAAGTACAACT	54	ATPT3	5’Not I	GGATCCGCGGCCGCACAATGGCGTTTTTTGGGCTCTCCCGTGTTT	53
ATPT3	3’Sse I	GGATCCTGCAGGTTATTGAAAACTTCTTCCAAGTACAACT	54	ATPT4	5’Not I	GGATCCGCGGCCGCACAATGTGGCGAAGATCTGTTGTT	55
ATPT4	3’Sse I	GGATCCTGCAGGTCATGGAGAGTAGAAGGAAGGAGCT	56	ATPT4	5’Not I	GGATCCGCGGCCGCACAATGTGGCGAAGATCTGTTGTT	55
ATPT4	3’Sse I	GGATCCTGCAGGTCATGGAGAGTAGAAGGAAGGAGCT	56	ATPT8	5’Not I	GGATCCGCGGCCGCACAATGGTACTTGCCGAGGTTCCAAAGCTTGCCTCT	57
ATPT8	3’Sse I	GGATCCTGCAGGTCACTTGTTTCTGGTGATGACTCTAT	58	ATPT8	5’Not I	GGATCCGCGGCCGCACAATGGTACTTGCCGAGGTTCCAAAGCTTGCCTCT	57
ATPT8	3’Sse I	GGATCCTGCAGGTCACTTGTTTCTGGTGATGACTCTAT	58	ATPT12	5’Not I	GGATCCGCGGCCGCACAATGACTTCGATTCTCAACACT	59

ATPT12

3’Sse I

GGATCCTGCAGGTCAGTGTTGCGATGCTAATGCCGT

60

ATPT2、ATPT3、ATPT4、ATPT8和ATPT12的编码序列均分别由上述表2中的PCR引物来扩增，并克隆到载体TopoTA(Invitrogen)中。含有相应异戊烯转移酶的构建体用Not I和Sse8387 I消化，并克隆到上述快速双载体中。

编码异戊烯转移酶ATPT2的序列按照有义方向克隆到pCGN8640，以生成植物转化构建体pCGN10800(图2)。ATPT2序列处于35S启动子的控制之下。

ATPT2序列也按照反义方向克隆到构建体pCGN8641以生成pCGN10801(图3)。该构建体提供了ATPT2序列从napin启动子的的反义表达。

ATPT2编码序列也按照反义方向克隆到构建体pCGN8643以生成植物转化构建体pCGN10802。

ATPT2编码序列也按照反义方向克隆到载体pCGN8644以生成植物转化构建体pCGN10803(图4)。

ATPT4编码序列克隆到载体pCGN864，以生成植物转化构建体pCGN10806(图5)。ATPT2序列克隆到载体pCGN864以生成植物转化构建体pCGN10807(图6)。ATPT3编码序列克隆到载体pCGN864以生成植物转化构建体pCGN10808(图7)。ATPT3编码序列按照有义方向克隆到载体pCGN8640以生成植物转化构建体pCGN10809(图8)。ATPT3编码序列按照反义方向克隆到载体pCGN8641以生成植物转化构建体pCGN10810(图9)。ATPT3编码序列克隆到载体pCGN8643以生成植物转化构建体pCGN10811(图10)。ATPT3编码序列克隆到载体pCGN8640以生成植物转化构建体pCGN10812(图11)。ATPT4编码序列克隆到载体pCGN8640以生成植物转化构建体pCGN10813(图12)。ATPT4编码序列克隆到载体pCGN8643以生成植物转化构建体pCGN10814(图13)。ATPT4编码序列克隆到载体pCGN8641以生成植物转化构建体pCGN10815(图14)。ATPT4编码序列按照反义方向克隆到载体pCGN8644以生成植物转化构建体pCGN10816(图15)。ATPT2编码序列克隆到载体pCGN？？？以生成植物转化构建体pCGN10817(图16)。ATPT8编码序列按照有义方向克隆到载体pCGN8643以生成植物转化构建体pCGN10819(图17)。ATPT12编码序列克隆到载体pCGN8644以生成植物转化构建体pCGN10824(图18)。ATPT12编码序列克隆到载体pCGN8641以生成植物转化构建体pCGN10825(图19)。ATPT8编码序列克隆到载体pCGN8644以生成植物转化构建体pCGN10826(图20)。

实施例3植物转化

转基因芸苔属植物是按照Radke等(Theor.Appl.Genet.(1988)75：685-694；Plant Cell Reports(1992)11：499-505)所述的方法通过毛根农杆菌介导的转化获得。转基因拟南芥植株可以按照Valverbens等(Proc.Nat.Acad.Sci.(1988)85：5536-5540)、Bent等((1994)，Science 265：1856-1860)或Bechtold等((1993)，C.R.Acad.Sci，Life Science 316：1194-1199)所述的方法通过毛根农杆菌介导的转化获得。其它种属的植物也可以利用相关技术进行类似的转化。

另外，还可使用微粒轰击法(如Klein等(Bio/Technology 10：286-291)所述)获得细胞核转化的植株。

实施例4异戊烯转移酶的鉴定

利用大肠杆菌ubiA(Genebank accession 1790473)序列产生的PSI-Blast序列文件来分析集胞蓝细菌属基因组。该分析在集胞蓝细菌属基因组中分离了5个开放读框(ORFs)，它们都可能是异戊烯转移酶：slr0926(注释为ubiA(4-羟苯甲酸-八异戊烯转移酶)，SEQ ID NO：32)、sll1899(注释为ctaB(细胞色素c氧化酶折叠蛋白)，SEQ IDNO：33)、slr0056(注释为g4(叶绿素合酶33kd亚单位)，SEQ IDNO：34)、slr1518(注释为menA(甲基萘醌类生物合成蛋白)，SEQ IDNO：35)和SLR1736(注释为未知功能的推测蛋白，SEQ ID NO：36)。

为了确定这些开放读框在生育酚生物合成中可能具有或其参与的作用，制备敲除构建体以阻断集胞蓝细菌属中破裂的ORF。

设计寡核苷酸以扩增slr1736ORF的5’末端区域和3’末端区域，其中5’末端为5’-TAATGTGTACATTGTCGGCCTC(1736-5’)(SEQ IDNO：61)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCCACAATTCCCCGCACCGTC)(1736-kanpr1)(SEQ ID NO：62)，3’端为5’-AGGCTAATAAGCACAAATGGGA(1736-3’)(SEQ ID NO：63)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGAATTGGTTTAGGTTATCCC(1736-kanpr2)(SEQ ID NO：64)。1736-kanpr1和1736-kanpr2寡核苷酸含有20bp与slr1736 ORF相同，另有40bp序列与卡那霉素抗性盒序列相同。完成这些寡核苷酸各自的PCR步骤，产物经凝胶纯化并与卡那霉素抗性基因连接，卡那霉素基因来源于puc4K(Pharmacia)，其已被Hinc II消化，并从载体的主链中凝胶纯化出来。连接的片段在没有寡核苷酸时在下列条件下可以装配，该条件为在100μl反应体积中使用pfu聚合酶进行40个循环，每个循环为94℃1分钟、55℃1分钟、72℃1分钟零5秒(Zhao，H和Arnold(1997)Nucleic Acid Res.25(6)：1307-1308)。然后，在此装配反应体系中取1μl或者5μl进行扩增，扩增使用嵌套于ORF片段末端的5’和3’的寡核苷酸进行，这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中，生成构建体pMON21681，并用于集胞蓝细菌属的转化。

用下列引物，按照与上述同样的方法，还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGGTTGCCCAAACCCCATC(SEQ ID NO：65)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTGGGTAAGCAACAATGACCGGC(SEQ ID NO：66)扩增ubiA5’序列。使用合成寡核苷酸引物5’-GAATTCTCAAAGCCAGCCCAGTAAC(SEQID NO：67)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGGTGCGAAAAGGGTTTTCCC(SEQ ID NO：68)扩增3’端区域。扩增产物与卡那霉素抗性基因连接，卡那霉素基因来源于puc4K，其已被Hinc II消化，并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-CCAGTGGTTTAGGCTGTGTGGTC(SEQ ID NO：69)和5’-CTGAGTTGGATGTATTGGATC(SEQ ID NO：70))扩增自身连接的片段，这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中，生成构建体pMON21682，并用于集胞蓝细菌属的转化。

用下列引物，按照与上述同样的方法，还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGGTTACTTCGACAAAAATCC(SEQ ID NO：71)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTGCTAGGCAACCGCTTAGTAC(SEQ ID NO：72)扩增sll 18995’序列。使用合成寡核苷酸引物5’-GAATTCTTAACCCAACAGTAAAGTTCCC(SEQ ID NO：73)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGCCGGCATTGTCTTTTACATG(SEQ ID NO：74)扩增3’端区域。扩增产物与卡那霉素抗性基因连接，卡那霉素基因来源于puc4K，其已被Hinc II消化，并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-GGAACCCTTGCAGCCGCTTC(SEQ ID NO：75)和5’-GTATGCCCAACTGGTGCAGAGG(SEQ ID NO：76))扩增自身连接的片段，这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中，生成构建体pMON21679，并用于集胞蓝细菌属的转化。

用下列引物，按照与上述同样的方法，还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGTCTGACACACAAAATACCG(SEQ ID NO：77)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCGCCAATACCAGCCACCAACAG(SEQ ID NO：78)扩增slr00565’序列。使用合成寡核苷酸引物5’-GAATTCTCAAATCCCCGCATGGCCTAG(SEQ ID NO：79)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGCCTACGGCTTGGACGTGTGGG(SEQ ID NO：80)扩增3’端区域。扩增产物与卡那霉素抗性基因连接，卡那霉素基因来源于puc4K，其已被Hinc II消化，并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-CACTTGGATTCCCCTGATCTG(SEQ ID NO：81)和5’-GCAATACCCGCTTGGAAAACG(SEQ ID NO：82))扩增自身连接的片段，这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中，生成构建体pMON21677，并用于集胞蓝细菌属的转化。

用下列引物，按照与上述同样的方法，还可合成用于制备其它序列集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGACCGAATCTTCGCCCCTAGC(SEQ ID NO：83)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCAATCCTAGGTAGCCGAGGCG(SEQ ID NO：84)扩增slr15185’序列。使用合成寡核苷酸引物5’-GAATTCTTAGCCCAGGCCAGCCCAGCC(SEQ ID NO：85)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGGGAATTGATTTGTTTAATTACC(SEQ ID NO：86)扩增3’端区域。扩增产物与卡那霉素抗性基因连接，卡那霉素基因来源于puc4K，其已被Hinc II消化，并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-GCGATCGCCATTATCGCTTGG(SEQ ID NO：87)和5’-GCAGACTGGCAATTATCAGTAACG(SEQ ID NO：88))扩增自身连接的片段，这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中，生成构建体pMON21680，并用于集胞蓝细菌属的转化。

B.集胞蓝细菌属的转化

将集胞蓝细菌属6803细胞培育至密度约为2×10⁸细胞/ml时离心收集，将细胞微粒重悬浮在新鲜的BG-11培养基(ATCC培养基616)中，密度调整为1×10⁹细胞/ml，马上用于转化。将100μL细胞用5μL微量制备的DNA混合。在光照条件下30℃温育4小时。然后将混合物置于尼龙滤膜上，尼龙滤膜放置在BG-11琼脂上，琼脂中加有pH8的TES，使其培育12-18小时。随后将该滤膜转移至BG-11+TES+5μg/ml卡那霉素琼脂上培育直至7-10天内出现菌落(Packer和Glazer，1988)。随后将菌落挑入含有5μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有10μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有25μg/ml卡那霉素的BG-11液体培养基中培育5天。然后收集细胞，进行PCR分析以确定破裂的ORF的存在，同时进行HPLC分析以确定这种破裂的ORF对于生育酚水平是否有影响。

对为slr1736和sll1899分离的集胞蓝细菌属中的PCR分析表明突变基因组中发生完全分离，表明在这些菌株中无法检测到任何野生型基因组的复制，这也表明天然基因的功能对细胞的功能并不重要。对这些分离株的HPLC分析表明，sll1899菌株生育酚水平没有可见的减少。但是，在承载slr1736敲除的菌株中没有可检测水平的生育酚。

利用Clustal W对集胞蓝细菌属敲除株的氨基酸序列进行了比较，结果见表3，表中列出了相同性百分比，类似性百分比和差异性百分比。序列的排列在图21中给出。

表3：

	slr1736	slr0926	sll1899	slr0056	slr1518
	slr1736	slr0926	sll1899	slr0056	slr1518	slr1736 相同性％相似性％		1429	1230	1834	1126

差异性％	7	10	5
差异性％	7	10	5	slr0926 相同性％相似性％差异性％	20397	19329	14284
sll1899 相同性％相似性％差异性％		172912	13299	slr0926 相同性％相似性％差异性％	20397	19329	14284
sll1899 相同性％相似性％差异性％		172912	13299	slr0056 相同性％相似性％差异性％			15318
slr1518 相同性％相似性％差异性％				slr0056 相同性％相似性％差异性％			15318

氨基酸序列的比较是在不同拟南芥异戊烯转移酶序列和集胞蓝细菌属序列间进行。比较结果见表4。表中列出了相同性百分比，类似性百分比以及差异性百分比。序列对比结果见图22。

表4：

	ATPT2	slr1736	ATPT3	slr0926	ATPT4	sll1899	ATPT12	slr0056	ATPT8	slr1518
	ATPT2	slr1736	ATPT3	slr0926	ATPT4	sll1899	ATPT12	slr0056	ATPT8	slr1518	ATPT2slr1736ATPT3slr0926ATPT4sll1899		294627	9231391934	92128132812233629	8202381934112621122433	82029122815142631203712183328	122811132626132616172825112319132427	9232415331010213020331081832173013	72125821125143011241161632102310	920241026101122301429971933122611

ATPT12slr0056ATPT8slr1518

526618

8192592310

112623133287237

4B.slr1737敲除株的制备

集胞蓝细菌属种6803 slr1737敲除株按下列方法构建：利用GPS^TM-1 Genome Priming System(New England Biolabs)，通过Tn7Transposase***，将卡那霉素抗性盒***到slr1737中。集胞蓝细菌属基因组文库克隆的含标靶的orf的652碱基对的质粒被用作靶DNA(集胞蓝细菌属基因组碱基对1324051-1324703；推定orf碱基对为1323672-1324763，Cyanobase注)。按照制造商的草案进行反应。然后将反应混合物转化到大肠杆菌DH 10B electrocompetant细胞中并摊铺。然后筛选转化形成的菌落，以使转位子通过用M13正向和反向通用引物扩增***靶序列，结果产生了对于全长为约2300碱基对的片段652碱基对+约1700碱基对的产物，即转位子卡那霉素盒的大小。测定结束后需要确定标靶的orf内***物大约的位点，因为据估计在集胞蓝细菌属中有效的同源重组需要100个碱基对的orf序列。这可以通过扩增反应进行，利用转位子末端的引物Primer S(5’端)或Primer N(3’端)，与M13的正向或反向引物结合使用。也就是说，将四种不同的引物结合用于描述可能的基因敲除株的图谱：引物S-M13正向、引物S-M13反向、引物N-M13正向、引物N-M13反向。用于转化集胞蓝细菌属和敲除株slr1737的构建株被测定为由一个150个碱基对的slr1737序列(位于***转位子的5’端)和约500bp的序列(位于***转位子的3’端)组成，与orf和卡那霉素抗性盒的转录方向一致。slr1737的核酸序列在SEQ ID NO：38中给出，推定的氨基酸序列在SEQ ID NO：39中给出。

将集胞蓝细菌属6803细胞培育至密度约为2×10⁸细胞/ml时离心收集，将细胞微粒重悬浮在新鲜的BG-11培养基中，密度调整为1×10⁹细胞/ml并马上用于转化。将100μL细胞用5μL微量制备的DNA混合。在光照条件下30℃温育4小时。然后将混合物置于尼龙滤膜上，尼龙滤膜放置在BG-11琼脂上，琼脂中添加有pH8的TES，使其培育12-18小时。随后将该滤膜转移至BG-11+TES+5μg/ml卡那霉素琼脂上培育直至7-10天内出现菌落(Packer和Glazer，1988)。随后将菌落挑入含有5μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有10μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有25μg/ml卡那霉素的BG-11液体培养基中培育5天。然后收集细胞，进行PCR分析以确定破裂的ORF的存在，同时进行HPLC分析以确定这种破裂的ORF对于生育酚水平是否有影响。

利用slr1737 orf末端的引物对集胞蓝细菌属的分离株进行PCR分析，结果显示突变基因组发生彻底分离，表明在这些菌株中检测不到野生型基因组复制。这表明野生型基因对细胞的功能不重要。对基因敲除株slr1737的HPLC分析表明检测不到生育酚产生。

4C.植物异戊烯转移酶酶活性分析

[³H]尿黑酸的0.1％H₃PO₄溶液(放射活性40Ci/mmol)。按Joo等(1973)Can.J.Biochem.51：1527所述方法合成叶绿基焦磷酸。按Soll等(1980)Phytochemistry 19：215的方法合成2-甲基-6-叶绿基醌醇和2，3-二甲基-5-叶绿基醌醇。尿黑酸、α，β，δ和γ-生育酚以及母育酚均为商购。

使用起泡空气在30℃、50μE·m^-2·s^-1荧光和70％相对湿度下，在BG-11培养基上培育野生型集胞蓝细菌属种Pcc6803。在该生物体的slr1736敲除株(潜在的PPT)的生长培养基上补充25μg/ml卡那霉素。收集0.25升到1升培养液中的细胞，5000g离心10分钟，储存在-80℃下。

按照Zak’s的操作方法(Zak等(1999)Eur J.Biochem.261：311)，稍作改动，分离总膜。细胞在弗氏压碎器上破碎。在弗氏压碎处理前，细胞用溶菌酶在30℃下，在含7mM EDTA、5mM NaCl和10mM Hepes-NaOH的pH7.4的培养基中温育1小时。5000g离心10分钟，收集去壁细菌细胞，将其重悬浮在pH为7.8的0.1-0.5mg叶绿素·mL^-1的20mM磷酸钾缓冲液中，在溶液中加入适量的蛋白酶抑制剂混合物和DNA酶I，DNA酶I由Boehinger Mannheim获得。弗氏压碎处理在100MPa下进行2-3次。破碎后，细胞悬浮液在5000g离心10分钟以使未破碎细胞沉淀，随后100,000g离心1小时收集总膜。将最终所得的沉淀重悬浮在含50mM Tris-HCl和4mM MgCl₂的缓冲液中。

叶绿体微粒是从250g市售的菠菜叶中分离的。将指定的叶片部分剪下，放入研磨缓冲液中(2L/250g叶片)，缓冲液含2mM EDTA、1mM MgCl₂、1mM MnCl₂，0.33M山梨醇、0.1％抗坏血酸和50mMHepes，pH为7.5。叶片在1L混合器中匀浆三次，每次3秒，然后用四层微孔布过滤。然后上清液在5000g离心6分钟。将叶绿体微粒重悬浮在少量研磨缓冲液中(Douce等Methods in Chloroplast MolecularBiology，239(1982))。

微粒中的叶绿体可以用三种途径破碎。首先按每管1mg叶绿素将叶绿体分装于试管中，在微量离心机中以6000rpm的速度离心2分钟，去除研磨缓冲液。每管中加入200μl Triton X-100缓冲液(0.1％Triton X-100，50mM Tris-HCl，pH7.6和4mM MgCl₂)或者是溶胀缓冲液(10mM Tris pH7.6，4mM MgCl₂)，并在4℃下温育0.5小时，随后破碎的叶绿体微粒马上用于分析。另外，破碎的叶绿体微粒还可以通过在液N₂中冷冻或者贮存在-80℃下0.5小时而获得，随后进行分析。

在某些情形下，叶绿体微粒可以进一步用40％/80％percoll梯度进行纯化，以获得完整的叶绿体。完整的叶绿体用溶胀缓冲液破裂，然后或者用于活性分析，或者用于进一步用20.5％/31.8％蔗糖密度梯度纯化被膜(Sol等，1980，supra)。膜部分在100,000g离心40分钟，随后重悬浮在50mM Tris-HCl pH7.6和4mM MgCl₂中。

用适量的1Mtris-NaOH pH10混合不同数量的[³H]HGA和40-60μM未标记的HGA(放射活性在0.16-4Ci/mmol范围内)，以将pH调至7.6。用痕量的固态NaBH₄将HGA还原4分钟。除HGA外，标准的温育混合物(终体积1ml)含有50mM pH为7.6的Tris-HCl、3-5mM MgCl₂和100μM叶绿基焦磷酸。反应由加入集胞蓝细菌属总膜、菠菜叶绿体团微粒、菠菜破碎叶绿体或者菠菜被膜开始，酶反应在23℃或30℃、黑暗或光照下进行2小时。反应通过加入液N₂冷冻来终止，贮存在-80℃或者直接进行萃取。

向每一分析混合液中加入恒定数量的母育酚，用2ml氯仿/甲醇(1∶2，v/v)萃取反应产物，以得到单相的溶液。其中加入NaCl溶液(2ml；0.9％)，剧烈振荡。重复萃取步骤3次。用20μm过滤器过滤含有异戊二烯基醌的有机层，在N₂环境下蒸发，随后重悬浮在100μl乙醇中。

样本主要通过正常相HPLC方法(等度的90％己烷和10％甲基-叔丁基醚)，使用Zorbax硅胶柱(4.6×250mm)进行分析。样品也可以用反相HPLC方法(等度的0.1％H₃PO₄的甲醇溶液)，使用Vydac 201HS54 C18柱(4.6×250mm)并同时使用All-tech C18防护柱进行分析。产物的量基于底物的放射活性进行计算，基于内标的量，按照回收百分比进行调整。

叶绿素的量按照Amon(1949)Plant Physiol.24：1描述的方法进行测定。蛋白质的含量用Bradford法，用γ球蛋白作为标准物进行测定(Bradford，(1976)Anal.Biochem.72：248)。

分析结果证明，在制备集胞蓝细菌属slr1736敲除株中生成了2-甲基-6-叶绿基质体醌。slr1736敲除株的叶绿基异戊烯转移酶活性的分析结果在图23中给出。

4D.ATPT₂对slr1736基因敲除株的功能补偿

为检测ATPT₂能否补偿集胞蓝细菌属6803基因敲除株slr1736的功能，构建了表达ATPT₂序列的质粒，其启动子为TAC。载体质粒psl1211来自于Washington大学Dr.Himadri Pakrasi实验室，此质粒是在质粒RSF1010基础上改进的，RSF1010具有宽范围的宿主(NgW.O.，Zentella R.，Wang.Y.，Taylor J-S.A.，Pakrasi，H.B.2000。PhrA，集胞蓝细菌属种PCC 6803植株中主要的光反应因子编码环丁烷-嘧啶二聚体特异性DNA光裂解酶(待发表))。通过PCR技术，利用下述引物可以将ATPT₂基因从载体pCGN10817中分离出来：ATPT2 nco.pr.5’-CCATGGATTCGAGTAAAGTTGTCGC(SEQ IDNO：89)；ATPT2 ri.pr 5’-GAATTCACTTCAAAAAAGGTAACAG(SEQ ID NO：90)。这些引物除去了ATPT₂序列5’端大约112bp，这段DNA被认为是叶绿体的转运肽。这些引物还在5’末端引入了NcoI位点，3’末端引入了EcoR I位点，以便能使其亚克隆至后一载体。将使用这些引物所得的PCR产物和pCGN10817连接到pGEM T easy中，得到载体pMON21689，用M13正向和反向引物进行测序，验证序列正确与否。然后将pMON21689的NcoI/EcoRI片段与psl1211的EagI/EcoRI和EagI/NcoI片段连接。通过接合作用将质粒pMON21690引入slr1736集胞蓝细菌属6803 KO植株。s1906细胞(一种辅助菌株)和含pMON21690的DH 10B细胞培育至对数期(0.D.600＝0.4)，通过离心收集1ml细胞。用无菌BG-11溶液将细胞微粒冲洗2次，然后重悬浮在200μlBG-11中。在灭菌Eppendorf管中混合下列溶液：50μl SL906、50μl含pMON21690的DH10B和100μL新鲜的slr1736集胞蓝细菌属6803KO菌株(O.D.730＝0.2-0.4)培养物。马上将细胞混合物转移至置于BG-11上的硝酸纤维素膜，在30℃、2500 LUX(50μe)光照下温育24小时。然后将滤液转移至添加10μg/ml庆大霉素的BG-11上，如上述方法温育约5天。当菌落出现时，挑取菌落，培养在BG-11+10μg/ml庆大霉素液体培养基中(Elhai，J.和Wolk，P.1988.Conjugal tranfer ofDNA to Cyanobacteria.Methods in Enzymology 167：747-54)。然后离心收集1ml液体培养物，用乙醇/邻苯三酚萃取，HPLC分离，分析生育酚含量。Slr1736集胞蓝细菌属6803 KO菌株不含有可检测的生育酚，而用pMON 21690转化的Slr1736集胞蓝细菌属6803 KO菌株含有可检测的α-生育酚。用psl1211(载体对照)转化的集胞蓝细菌属6803株也同样产生α-生育酚。

实施例5：转基因植物分析

用高压液相色谱(HPLC)分析经ATPT蛋白有义或反义表达构建体转化的拟南芥属植物，以检测总生育酚及特定的生育酚(α-、β-、γ-及δ-生育酚)水平的改变。

按照下述方法制备用于HPLC的叶子与种子提取物：对于种子提取物，在一消毒微量离心管中加入10mg种子、1g微珠(Biospec)和500μl 1％邻苯三酚(Sigma Chem)的乙醇溶液。混合物于一小珠搅拌器(Bcadbeater，Biospec)内快速震荡3分钟。然后将提取物经0.2μm滤膜过滤至自动样品收集管中。过滤的提取物按下述方法用于HPLC分析。

叶子萃取物是这样制备的：用在萃取前将30-50mg叶子组织与1g微珠混合后在液氮中冷冻。萃取时将500μl 1％邻苯三酚的乙醇溶液加入叶子/微珠混合物中，并在珠搅拌器(Biospec)上快速摇动1分钟。最终形成的混合物于14000rpm离心4分钟，并在HPLC分析之前按上述方法过滤。

HPLC的操作中使用的是4.6mm×250mm的HPLC Zorbax硅胶柱，其具有荧光检测器、带通滤波器和狭缝光栅，激发波长为290nm，发射波长为336nm。溶剂A是己烷，溶剂B是甲基叔丁基醚。进样体积为20μl，流速为1.5ml/min，采用梯度洗脱(表5)，洗脱时间是12min(40℃)。

表5：

时间	溶剂A	溶剂B
时间	溶剂A	溶剂B	0分钟	90％	10％
10分钟	90％	10％	0分钟	90％	10％
10分钟	90％	10％	11分钟	25％	75％
12分钟	90％	10％	11分钟	25％	75％

溶于1％邻苯三酚/乙醇溶液的生育酚标准品也同时进样作为对照(包括α-、γ-、β-、δ-生育酚及生育酚(母育酚))(均来自于Matreya)。

α-、β-、δ-、γ-生育酚的标准曲线采用Chemstation软件计算。组分X的绝对含量如下计算：X的绝对量＝响应值x×RFx×稀释因子，响应值x是组分X峰下面积，RFx是组分X的响应因子(含量x/响应值x)，稀释因子是500μl。而ng/mg组织是指总ng组分/mg植物组织。

含有pMON10822质粒从napin启动子开始表达ATAT2序列的转基因拟南芥属种子提取物的HPLC分析结果见图24。

从napin启动子(pMON10822质粒)开始表达ATAT2序列的拟南芥属种子组织的HPLC分析结果说明种子中生育酚水平增加了。其总生育酚水平比未转化(野生型)拟南芥属植物的总生育酚水平增加了50-60％之多(图24)。

另外，特定生育酚的水平在从napin启动子开始表达ATAT2核酸序列的转基因拟南芥属植物中也是增高的。这些植株中的δ-生育酚水平比野生型拟南芥属植株种子中的δ-生育酚水平增加3倍还多。在表达ATAT2核酸序列的转基因拟南芥属植株中γ-生育酚水平比非转基因对照植株中的γ-生育酚水平增加了近60％之多。另外，α-生育酚水平比非转基因对照植株中的α-生育酚水平增加了3倍之多。

含有pMON10803质粒从增强的35S启动子开始表达ATAT2序列的转基因拟南芥属植株种子提取物的HPLC分析结果见图25。

本专利说明书中提到的所有出版物和专利申请都代表了与本发明有关的领域的技术人员的技术水平。所有出版物及专利申请在此以相同的程度被引用作为参考，每个出版物或专利申请都被具体地且独立地引用作为参考。

尽管为了能够更清晰地理解，已经通过图示说明和例证的方法对上述发明的细节加以描述，但显然在所附的权利要求范围内还可以做某些改变和修改。

序列表

<110>M·拉斯纳

M·波斯特-比特恩米勒

B·萨维季

J·韦斯

<120>编码参与生育酚合成的蛋白质的核酸序列

<130>17133/00/WO

<150>60/129,899

<151>1999-04-15

<150>60/146,461

<151>1999-07-30

<150>PCT/US00/10368

<151>2000-04-14

<160>94

<170>FastSEQ for Windows Version 4.0

<210>1

<211>1182

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>1

atggagtctc tgctctctag ttcttctctt gtttccgctg ctggtgggtt ttgttggaag 60

aagcagaatc taaagctcca ctctttatca gaaatccgag ttctgcgttg tgattcgagt 120

aaagttgtcg caaaaccgaa gtttaggaac aatcttgtta ggcctgatgg tcaaggatct 180

tcattgttgt tgtatccaaa acataagtcg agatttcggg ttaatgccac tgcgggtcag 240

cctgaggctt tcgactcgaa tagcaaacag aagtctttta gagactcgtt agatgcgttt 300

tacaggtttt ctaggcctca tacagttatt ggcacagtgc ttagcatttt atctgtatct 360

ttcttagcag tagagaaggt ttctgatata tctcctttac ttttcactgg catcttggag 420

gctgttgttg cagctctcat gatgaacatt tacatagttg ggctaaatca gttgtctgat 480

gttgaaatag ataaggttaa caagccctat cttccattgg catcaggaga atattctgtt 540

aacaccggca ttgcaatagt agcttccttc tccatcatga gtttctggct tgggtggatt 600

gttggttcat ggccattgtt ctgggctctt tttgtgagtt tcatgctcgg tactgcatac 660

tctatcaatt tgccactttt acggtggaaa agatttgcat tggttgcagc aatgtgtatc 720

ctcgctgtcc gagctattat tgttcaaatc gccttttatc tacatattca gacacatgtg 780

tttggaagac caatcttgtt cactaggcct cttattttcg ccactgcgtt tatgagcttt 840

ttctctgtcg ttattgcatt gtttaaggat atacctgata tcgaagggga taagatattc 900

ggaatccgat cattctctgt aactctgggt cagaaacggg tgttttggac atgtgttaca 960

ctacttcaaa tggcttacgc tgttgcaatt ctagttggag ccacatctcc attcatatgg 1020

agcaaagtca tctcggttgt gggtcatgtt atactcgcaa caactttgtg ggctcgagct 1080

aagtccgttg atctgagtag caaaaccgaa ataacttcat gttatatgtt catatggaag 1140

ctcttttatg cagagtactt gctgttacct tttttgaagt ga 1182

<210>2

<211>393

<212>PRT

<213>拟南芥属种(Arabidopsis sp)

<400>2

Met Glu Ser Leu Leu Ser Ser Ser Ser Leu Val Ser Ala Ala Gly Gly

1 5 10 15

Phe Cys Trp Lys Lys Gln Asn Leu Lys Leu His Ser Leu Ser Glu Ile

20 25 30

Arg Val Leu Arg Cys Asp Ser Ser Lys Val Val Ala Lys Pro Lys Phe

35 40 45

Arg Asn Asn Leu Val Arg Pro Asp Gly Gln Gly Ser Ser Leu Leu Leu

50 55 60

Tyr Pro Lys His Lys Ser Arg Phe Arg Val Asn Ala Thr Ala Gly Gln

65 70 75 80

Pro Glu Ala Phe Asp Ser Asn Ser Lys Gln Lys Ser Phe Arg Asp Ser

85 90 95

Leu Asp Ala Phe Tyr Arg Phe Ser Arg Pro His Thr Val Ile Gly Thr

100 105 110

Val Leu Ser Ile Leu Ser Val Ser Phe Leu Ala Val Glu Lys Val Ser

115 120 125

Asp Ile Ser Pro Leu Leu Phe Thr Gly Ile Leu Glu Ala Val Val Ala

130 135 140

Ala Leu Met Met Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu Ser Asp

145 150 155 160

Val Glu Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro Leu Ala Ser Gly

165 170 175

Glu Tyr Ser Val Asn Thr Gly Ile Ala Ile Val Ala Ser Phe Ser Ile

180 185 190

Met Ser Phe Trp Leu Gly Trp Ile Val Gly Ser Trp Pro Leu Phe Trp

195 200 205

Ala Leu Phe Val Ser Phe Met Leu Gly Thr Ala Tyr Ser Ile Asn Leu

210 215 220

Pro Leu Leu Arg Trp Lys Arg Phe Ala Leu Val Ala Ala Met Cys Ile

225 230 235 240

Leu Ala Val Arg Ala Ile Ile Val Gln Ile Ala Phe Tyr Leu His Ile

245 250 255

Gln Thr His Val Phe Gly Arg Pro Ile Leu Phe Thr Arg Pro Leu Ile

260 265 270

Phe Ala Thr Ala Phe Met Ser Phe Phe Ser Val Val Ile Ala Leu Phe

275 280 285

Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys Ile Phe Gly Ile Arg Ser

290 295 300

Phe Ser Val Thr Leu Gly Gln Lys Arg Val Phe Trp Thr Cys Val Thr

305 310 315 320

Leu Leu Gln Met Ala Tyr Ala Val Ala Ile Leu Val Gly Ala Thr Ser

325 330 335

Pro Phe Ile Trp Ser Lys Val Ile Ser Val Val Gly His Val Ile Leu

340 345 350

Ala Thr Thr Leu Trp Ala Arg Ala Lys Ser Val Asp Leu Ser Ser Lys

355 360 365

Thr Glu Ile Thr Ser Cys Tyr Met Phe Ile Trp Lys Leu Phe Tyr Ala

370 375 380

Glu Tyr Leu Leu Leu Pro Phe Leu Lys

385 390

<210>3

<211>1224

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>3

atggcgtttt ttgggctctc ccgtgtttca agacggttgt tgaaatcttc cgtctccgta 60

actccatctt cttcctctgc tcttttgcaa tcacaacata aatccttgtc caatcctgtg 120

actacccatt acacaaatcc tttcactaag tgttatcctt catggaatga taattaccaa 180

gtatggagta aaggaagaga attgcatcag gagaagtttt ttggtgttgg ttggaattac 240

agattaattt gtggaatgtc gtcgtcttct tcggttttgg agggaaagcc gaagaaagat 300

gataaggaga agagtgatgg tgttgttgtt aagaaagctt cttggataga tttgtattta 360

ccagaagaag ttagaggtta tgctaagctt gctcgattgg ataaacccat tggaacttgg 420

ttgcttgcgt ggccttgtat gtggtcgatt gcgttggctg ctgatcctgg aagccttcca 480

agttttaaat atatggcttt atttggttgc ggagcattac ttcttagagg tgctggttgt 540

actataaatg atctgcttga tcaggacata gatacaaagg ttgatcgtac aaaactaaga 600

cctatcgcca gtggtctttt gacaccattt caagggattg gatttctcgg gctgcagttg 660

cttttaggct tagggattct tctccaactt aacaattaca gccgtgtttt aggggcttca 720

tctttgttac ttgtcttttc ctacccactt atgaagaggt ttacattttg gcctcaagcc 780

tttttaggtt tgaccataaa ctggggagca ttgttaggat ggactgcagt taaaggaagc 840

atagcaccat ctattgtact ccctctctat ctctccggag tctgctggac ccttgtttat 900

gatactattt atgcacatca ggacaaagaa gatgatgtaa aagttggtgt taagtcaaca 960

gcccttagat tcggtgataa tacaaagctt tggttaactg gatttggcac agcatccata 1020

ggttttcttg cactttctgg attcagtgca gatctcgggt ggcaatatta cgcatcactg 1080

gccgctgcat caggacagtt aggatggcaa atagggacag ctgacttatc atctggtgct 1140

gactgcagta gaaaatttgt gtcgaacaag tggtttggtg ctattatatt tagtggagtt 1200

gtacttggaa gaagttttca ataa 1224

<210>4

<211>407

<212>PRT

<213>拟南芥属种(Arabidopsis sp)

<400>4

Met Ala Phe Phe Gly Leu Ser Arg Val Ser Arg Arg Leu Leu Lys Ser

1 5 10 15

Ser Val Ser Val Thr Pro Ser Ser Ser Ser Ala Leu Leu Gln Ser Gln

20 25 30

His Lys Ser Leu Ser Asn Pro Val Thr Thr His Tyr Thr Asn Pro Phe

35 40 45

Thr Lys Cys Tyr Pro Ser Trp Asn Asp Asn Tyr Gln Val Trp Ser Lys

50 55 60

Gly Arg Glu Leu His Gln Glu Lys Phe Phe Gly Val Gly Trp Asn Tyr

65 70 75 80

Arg Leu Ile Cys Gly Met Ser Ser Ser Ser Ser Val Leu Glu Gly Lys

85 90 95

Pro Lys Lys Asp Asp Lys Glu Lys Ser Asp Gly Val Val Val Lys Lys

100 105 110

Ala Ser Trp Ile Asp Leu Tyr Leu Pro Glu Glu Val Arg Gly Tyr Ala

115 120 125

Lys Leu Ala Arg Leu Asp Lys Pro Ile Gly Thr Trp Leu Leu Ala Trp

130 135 140

Pro Cys Met Trp Ser Ile Ala Leu Ala Ala Asp Pro Gly Ser Leu Pro

145 150 155 160

Ser Phe Lys Tyr Met Ala Leu Phe Gly Cys Gly Ala Leu Leu Leu Arg

165 170 175

Gly Ala Gly Cys Thr Ile Asn Asp Leu Leu Asp Gln Asp Ile Asp Thr

180 185 190

Lys Val Asp Arg Thr Lys Leu Arg Pro Ile Ala Ser Gly Leu Leu Thr

195 200 205

Pro Phe Gln Gly Ile Gly Phe Leu Gly Leu Gln Leu Leu Leu Gly Leu

210 215 220

Gly Ile Leu Leu Gln Leu Asn Asn Tyr Ser Arg Val Leu Gly Ala Ser

225 230 235 240

Ser Leu Leu Leu Val Phe Ser Tyr Pro Leu Met Lys Arg Phe Thr Phe

245 250 255

Trp Pro Gln Ala Phe Leu Gly Leu Thr Ile Asn Trp Gly Ala Leu Leu

260 265 270

Gly Trp Thr Ala Val Lys Gly Ser Ile Ala Pro Ser Ile Val Leu Pro

275 280 285

Leu Tyr Leu Ser Gly Val Cys Trp Thr Leu Val Tyr Asp Thr Ile Tyr

290 295 300

Ala His Gln Asp Lys Glu Asp Asp Val Lys Val Gly Val Lys Ser Thr

305 310 315 320

Ala Leu Arg Phe Gly Asp Asn Thr Lys Leu Trp Leu Thr Gly Phe Gly

325 330 335

Thr Ala Ser Ile Gly Phe Leu Ala Leu Ser Gly Phe Ser Ala Asp Leu

340 345 350

Gly Trp Gln Tyr Tyr Ala Ser Leu Ala Ala Ala Ser Gly Gln Leu Gly

355 360 365

Trp Gln Ile Gly Thr Ala Asp Leu Ser Ser Gly Ala Asp Cys Ser Arg

370 375 380

Lys Phe Val Ser Asn Lys Trp Phe Gly Ala Ile Ile Phe Ser Gly Val

385 390 395 400

Val Leu Gly Arg Ser Phe Gln

405

<210>5

<211>1296

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>5

atgtggcgaa gatctgttgt ttctcgttta tcttcaagaa tctctgtttc ttcttcgtta 60

ccaaacccta gactgattcc ttggtcccgc gaattatgtg ccgttaatag cttctcccag 120

cctccggtct cgacggaatc aactgctaag ttagggatca ctggtgttag atctgatgcc 180

aatcgagttt ttgccactgc tactgccgcc gctacagcta cagctaccac cggtgagatt 240

tcgtctagag ttgcggcttt ggctggatta gggcatcact acgctcgttg ttattgggag 300

ctttctaaag ctaaacttag tatgcttgtg gttgcaactt ctggaactgg gtatattctg 360

ggtacgggaa atgctgcaat tagcttcccg gggctttgtt acacatgtgc aggaaccatg 420

atgattgctg catctgctaa ttccttgaat cagatttttg agataagcaa tgattctaag 480

atgaaaagaa cgatgctaag gccattgcct tcaggacgta ttagtgttcc acacgctgtt 540

gcatgggcta ctattgctgg tgcttctggt gcttgtttgt tggccagcaa gactaatatg 600

ttggctgctg gacttgcatc tgccaatctt gtactttatg cgtttgttta tactccgttg 660

aagcaacttc accctatcaa tacatgggtt ggcgctgttg ttggtgctat cccacccttg 720

cttgggtggg cggcagcgtc tggtcagatt tcatacaatt cgatgattct tccagctgct 780

ctttactttt ggcagatacc tcattttatg gcccttgcac atctctgccg caatgattat 840

gcagctggag gttacaagat gttgtcactc tttgatccgt cagggaagag aatagcagca 900

gtggctctaa ggaactgctt ttacatgatc cctctcggtt tcatcgccta tgactggggg 960

ttaacctcaa gttggttttg cctcgaatca acacttctca cactagcaat cgctgcaaca 1020

gcattttcat tctaccgaga ccggaccatg cataaagcaa ggaaaatgtt ccatgccagt 1080

cttctcttcc ttcctgtttt catgtctggt cttcttctac accgtgtctc taatgataat 1140

cagcaacaac tcgtagaaga agccggatta acaaattctg tatctggtga agtcaaaact 1200

cagaggcgaa agaaacgtgt ggctcaacct ccggtggctt atgcctctgc tgcaccgttt 1260

cctttcctcc cagctccttc cttctactct ccatga 1296

<210>6

<211>431

<212>PRT

<213>拟南芥属种(Arabidopsis sp)

<400>6

Met Trp Arg Arg Ser Val Val Tyr Arg Phe Ser Ser Arg Ile Ser Val

1 5 10 15

Ser Ser Ser Leu Pro Asn Pro Arg Leu Ile Pro Trp Ser Arg Glu Leu

20 25 30

Cys Ala Val Asn Ser Phe Ser Gln Pro Pro Val Ser Thr Glu Ser Thr

35 40 45

Ala Lys Leu Gly Ile Thr Gly Val Arg Ser Asp Ala Asn Arg Val Phe

50 55 60

Ala Thr Ala Thr Ala Ala Ala Thr Ala Thr Ala Thr Thr Gly Glu Ile

65 70 75 80

Ser Ser Arg Val Ala Ala Leu Ala Gly Leu Gly His His Tyr Ala Arg

85 90 95

Cys Tyr Trp Glu Leu Ser Lys Ala Lys Leu Ser Met Leu Val Val Ala

100 105 110

Thr Ser Gly Thr Gly Tyr Ile Leu Gly Thr Gly Asn Ala Ala Ile Ser

115 120 125

Phe Pro Gly Leu Cys Tyr Thr Cys Ala Gly Thr Met Met Ile Ala Ala

130 135 140

Ser Ala Asn Ser Leu Asn Gln Ile Phe Glu Ile Ser Asn Asp Ser Lys

145 150 155 160

Met Lys Arg Thr Met Leu Arg Pro Leu Pro Ser Gly Arg Ile Ser Val

165 170 175

Pro His Ala Val Ala Trp Ala Thr Ile Ala Gly Ala Ser Gly Ala Cys

180 185 190

Leu Leu Ala Ser Lys Thr Asn Met Leu Ala Ala Gly Leu Ala Ser Ala

195 200 205

Asn Leu Val Leu Tyr Ala Phe Val Tyr Thr Pro Leu Lys Gln Leu His

210 215 220

Pro Ile Asn Thr Trp Val Gly Ala Val Val Gly Ala Ile Pro Pro Leu

225 230 235 240

Leu Gly Trp Ala Ala Ala Ser Gly Gln IIe Ser Tyr Asn Ser Met Ile

245 250 255

Leu Pro Ala Ala Leu Tyr Phe Trp Gln Ile Pro His Phe Met Ala Leu

260 265 270

Ala His Leu Cys Arg Asn Asp Tyr Ala Ala Gly Gly Tyr Lys Met Leu

275 280 285

Ser Leu Phe Asp Pro Ser Gly Lys Arg Ile Ala Ala Val Ala Leu Arg

290 295 300

Asn Cys Phe Tyr Met Ile Pro Leu Gly Phe Ile Ala Tyr Asp Trp Gly

305 310 315 320

Leu Thr Ser Ser Trp Phe Cys Leu Glu Ser Thr Leu Leu Thr Leu Ala

325 330 335

Ile Ala Ala Thr Ala Phe Ser Phe Tyr Arg Asp Arg Thr Met His Lys

240 345 350

Ala Arg Lys Met Phe His Ala Ser Leu Leu Phe Leu Pro Val Phe Met

355 360 365

Ser Gly Leu Leu Leu His Arg Val Ser Asn Asp Asn Gln Gln Gln Leu

370 375 380

Val Glu Glu Ala Gly Leu Thr Asn Ser Val Ser Gly Glu Val Lys Thr

385 390 395 400

Gln Arg Arg Lys Lys Arg Val Ala Gln Pro Pro Val Ala Tyr Ala Ser

405 410 415

Ala Ala Pro Phe Pro Phe Leu Pro Ala Pro Ser Phe Tyr Ser Pro

420 425 430

<210>7

<211>479

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>7

ggaaactccc ggagcacctg tttgcaggta ccgctaacct taatcgataa tttatttctc 60

ttgtcaggaa ttatgtaagt ctggtggaag gctcgcatac catttttgca ttgcctttcg 120

ctatgatcgg gtttactttg ggtgtgatga gaccaggcgt ggctttatgg tatggcgaaa 180

acccattttt atccaatgct gcattccctc ccgatgattc gttctttcat tcctatacag 240

gtatcatgct gataaaactg ttactggtac tggtttgtat ggtatcagca agaagcgcgg 300

cgatggcgtt taaccggtat ctcgacaggc attttgacgc gaagaacccg cgtactgcca 360

tccgtgaaat acctgcgggc gtcatatctg ccaacagtgc gctggtgttt acgataggct 420

gctgcgtggt attctgggtg gcctgttatt tcattaacac gatctgtttt tacctggcg 479

<210>8

<211>551

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<220>

<221>misc_feature

<222>(1)...(551)

<223>n＝A，T，C or G

<400>8

ttgtggctta caccttaatg agcatacgcc agnccattac ggctcgttaa tcggcgccat 60

ngccggngct gntgcaccgg tagtgggcta ctgcgccgtg accaatcagc ttgatctagc 120

ggctcttatt ctgtttttaa ttttactgtt ctggcaaatg ccgcattttt acgcgatttc 180

cattttcagg ctaaaagact tttcagcggc ctgtattccg gtgctgccca tcattaaaga 240

cctgcgctat accaaaatca gcatgctggt ttacgtgggc ttatttacac tggctgctat 300

catgccggcc ctcttagggt atgccggttg gatttatggg atagcggcct taattttagg 360

cttgtattgg ctttatattg ccatacaagg attcaagacc gccgatgatc aaaaatggtc 420

tcgtaagatg tttggatctt cgattttaat cattaccctc ttgtcggtaa tgatgcttgt 480

ttaaacttac tgcctcctga agtttatata tcgataattt cagcttaagg aggcttagtg 540

gttaattcaa t 551

<210>9

<211>297

<212>PRT

<213>拟南芥属种(Arabidopsis sp)

<400>9

Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe

1 5 10 15

Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg Ser Thr Ile Leu Leu

20 25 30

Leu Met Ala Thr Ala Leu Asn Val Arg Val Pro Glu Ala Leu Ile Gly

35 40 45

Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg Val Arg Gln Arg Gly

50 55 60

Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp

65 70 75 80

Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly Ser Leu Asn

85 90 95

Val Val Met Gly Asn Lys Val Val Ala Leu Leu Ala Thr Ala Val Glu

100 105 110

His Leu Val Thr Gly Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln

115 120 125

Arg Tyr Ser Met Asp Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala

130 135 140

Ser Leu Ile Ser Asn Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln

145 150 155 160

Thr Ala Glu Val Ala Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly

165 170 175

Leu Ala Phe Gln Leu Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Set

180 185 190

Ala Ser Leu Gly Lys Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile

195 200 205

Thr Ala Pro Ile Leu Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu

210 215 220

Val Val Asp Gln Val Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu

225 230 235 240

Glu Tyr Leu Gly Lys Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala

245 250 255

Met Glu His Ala Asn Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu

260 265 270

Thr Asp Asn Glu Asp Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu

275 280 285

Thr His Arg Val Ile Thr Arg Asn Lys

290 295

<210>10

<211>561

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>10

aagcgcatcc gtcctcttct acgattgccg ccagccgcat gtatggctgc ataaccgacc 60

gcccctatcc gctcgcggcc gcggtcgaat tcattcacac cgcgacgctg ctgcatgacg 120

acgtcgtcga tgaaagcgat ttgcgccgcg gccgcgaaag cgcgcataag gttttcggca 180

atcaggcgag cgtgctcgtc ggcgatttcc ttttctcccg cgccttccag ctgatggtgg 240

aagacggctc gctcgacgcg ctgcgcattc tctcggatgc ctccgccgtg atcgcgcagg 300

gcgaagtgat gcagctcggc accgcgcgca atcttgaaac caatatgagc cagtatctcg 360

atgtgatcag cgcgaagacc gccgcgctct ttgccgccgc ctgcgaaatc ggcccggtga 420

tggcgaacgc gaaggcggaa gatgctgccg cgatgtgcga atacggcatg aatctcggta 480

tcgccttcca gatcatcgac gaccttctcg attacggcac cggcggccac gccgagcttg 540

gcaagaacac gggcgacgat t 561

<210>11

<211>966

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>11

atggtacttg ccgaggttcc aaagcttgcc tctgctgctg agtacttctt caaaaggggt 60

gtgcaaggaa aacagtttcg ttcaactatt ttgctgctga tggcgacagc tctgaatgta 120

cgcgttccag aagcattgat tggggaatca acagatatag tcacatcaga attacgcgta 180

aggcaacggg gtattgctga aatcactgaa atgatacacg tcgcaagtct actgcacgat 240

gatgtcttgg atgatgccga tacaaggcgt ggtgttggtt ccttaaatgt tgtaatgggt 300

aacaagatgt cggtattagc aggagacttc ttgctctccc gggcttgtgg ggctctcgct 360

gctttaaaga acacagaggt tgtagcatta cttgcaactg ctgtagaaca tcttgttacc 420

ggtgaaacca tggaaataac tagttcaacc gagcagcgtt atagtatgga ctactacatg 480

cagaagacat attataagac agcatcgcta atctctaaca gctgcaaagc tgttgccgtt 540

ctcactggac aaacagcaga agttgccgtg ttagcttttg agtatgggag gaatctgggt 600

ttagcattcc aattaataga cgacattctt gatttcacgg gcacatctgc ctctctcgga 660

aagggatcgt tgtcagatat tcgccatgga gtcataacag ccccaatcct ctttgccatg 720

gaagagtttc ctcaactacg cgaagttgtt gatcaagttg aaaaagatcc taggaatgtt 780

gacattgctt tagagtatct tgggaagagc aagggaatac agagggcaag agaattagcc 840

atggaacatg cgaatctagc agcagctgca atcgggtctc tacctgaaac agacaatgaa 900

gatgtcaaaa gatcgaggcg ggcacttatt gacttgaccc atagagtcat caccagaaac 960

aagtga 966

<210>12

<211>321

<212>PRT

<213>拟南芥属种(Arabidopsis sp)

<400>12

Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe

1 5 10 15

Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg Ser Thr Ile Leu Leu

20 25 30

Leu Met Ala Thr Ala Leu Asn Val Arg Val Pro Glu Ala Leu Ile Gly

35 40 45

Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg Val Arg Gln Arg Gly

50 55 60

Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp

65 70 75 80

Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly Ser Leu Asn

85 90 95

Val Val Met Gly Asn Lys Met Ser Val Leu Ala Gly Asp Phe Leu Leu

100 105 110

Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys Asn Thr Glu Val Val

115 120 125

Ala Leu Leu Ala Thr Ala Val Glu His Leu Val Thr Gly Glu Thr Met

130 135 140

Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser Met Asp Tyr Tyr Met

145 150 155 160

Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn Ser Cys Lys

165 170 175

Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu Val Ala Val Leu Ala

180 185 190

Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe Gln Leu Ile Asp Asp

195 200 205

Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys Gly Ser Leu

210 215 220

Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro Ile Leu Phe Ala Met

225 230 235 240

Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp Gln Val Glu Lys Asp

245 250 255

Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu Gly Lys Ser Lys Gly

260 265 270

Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His Ala Asn Leu Ala Ala

275 280 285

Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn Glu Asp Val Lys Arg

290 295 300

Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg Val Ile Thr Arg Asn

305 310 315 320

Lys

<210>13

<211>621

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>13

gctttctcct ttgctaattc ttgagctttc ttgatcccac cgcgatttct aactatttca 60

atcgcttctt caagcgatcc aggctcacaa aactcagact caatgatctc tcttagcctt 120

ggctcattct ctagcgcgaa gatcactggc gccgttatgt tacctttggc taagtcatta 180

gctgcaggct tacctaactg ctctgtggac tgagtgaagt ccagaatgtc atcaactact 240

tgaaaagata aaccgagatt cttcccgaac tgatacattt gctctgcgac cttgctttcg 300

actttactga aaattgctgc tcctttggtg cttgcagcta ctaatgaagc tgtcttgtag 360

taactcttta gcatgtagtc atcaagcttg acatcacaat cgaataaact cgatgcttgc 420

tttatctcac cgcttgcaaa atctttgatc acctgcaaaa agataaatca agattcagac 480

caaatgttct ttgtattgag tagcttcatc taatctcaga aaggaatatt acctgactta 540

tgagcttaat gacttcaagg ttttcgagat ttgtaagtac catgatgctt gagcaacatg 600

aaatccccag ctaatacagc t 621

<210>14

<211>741

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>14

ggtgagtttt gttaatagtt atgagattca tctatttttg tcataaaatt gtttggtttg 60

gtttaaactc tgtgtataat tgcaggaaag gaaacagttc atgagctttt cggcacaaga 120

gtagcggtgc tagctggaga tttcatgttt gctcaagcgt catggtactt agcaaatctc 180

gagaatcttg aagttattaa gctcatcagt caggtactta gttactctta cattgttttt 240

ctatgaggtt gagctatgaa tctcatttcg ttgaataatg ctgtgcctca aacttttttt 300

catgttttca ggtgatcaaa gactttgcaa gcggagagat aaagcaggcg tccagcttat 360

ttgactgcga caccaagctc gacgagtact tactcaaaag tttctacaag acagcctctt 420

tagtggctgc gagcaccaaa ggagctgcca ttttcagcag agttgagcct gatgtgacag 480

aacaaatgta cgagtttggg aagaatctcg gtctctcttt ccagatagtt gatgatattt 540

tggatttcac tcagtcgaca gagcagctcg ggaagccagc agggagtgat ttggctaaag 600

gtaacttaac agcacctgtg attttcgctc tggagaggga gccaaggcta agagagatca 660

ttgagtcaaa gttctgtgag gcgggttctc tggaagaagc gattgaagcg gtgacaaaag 720

gtggggggat taagagagca c 741

<210>15

<211>1087

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>15

cctcttcagc caatccagag gaagaagaga caacttttta tctttcgtca agagtctccg 60

aaaacgcacg gttttatgct ctctcttctg ccctcacctc acaagacgca gggcacatga 120

ttcaaccaga gggaaaaagc aacgataaca actctgcttt tgatttcaag ctgtatatga 180

tccgcaaagc cgagtctgta aatgcggctc tcgacgtttc cgtaccgctt ctgaaacccc 240

ttacgatcca agaagcggtc aggtactctt tgctagccgg cggaaaacgt gtgaggcctc 300

tgctctgcat tgccgcttgt gagcttgtgg ggggcgacga ggctactgcc atgtcagccg 360

cttgcgcggt cgagatgatc cacacaagct ctctcattca tgacgatctt ccgtgcatgg 420

acaatgccga cctccgtaga ggcaagccca ccaatcacaa ggtatgttgt ttaattatat 480

gaaggctcag agataatgct gaactagtgt tgaaccaatt tttgctcaaa caaggtatat 540

ggagaagaca tggcggtttt ggcaggtgat gcactccttg cattggcgtt tgagcacatg 600

acggttgtgt cgagtgggtt ggtcgctccc gagaagatga ttcgcgccgt ggttgagctg 660

gccagggcca tagggactac agggctagtt gctggacaaa tgatagacct agccagcgaa 720

agactgaatc cagacaaggt tggattggag catctagagt tcatccatct ccacaaaacg 780

gcggcattgt tggaggcagc ggcagtttta ggggttataa tgggaggtgg aacagaggaa 840

gaaatcgaaa agcttagaaa gtatgctagg tgtattggac tactgtttca ggttgttgat 900

gacattctcg acgtaacaaa atctactgag gaattgggta agacagccgg aaaagacgta 960

atggccggaa agctgacgta tccaaggctg ataggtttgg agggatccag ggaagttgca 1020

gagcacctga ggagagaagc agaggaaaag cttaaagggt ttgatccaag tcaggcggcg 1080

cctctgg 1087

<210>16

<211>1164

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>16

atgacttcga ttctcaacac tgtctccacc atccactctt ccagagttac ctccgtcgat 60

cgagtcggag tcctctctct tcggaattcg gattccgttg agttcactcg ccggcgttct 120

ggtttctcga cgttgatcta cgaatcaccc gggcggagat ttgttgtgcg tgcggcggag 180

actgatactg ataaagttaa atctcagaca cctgacaagg caccagccgg tggttcaagc 240

attaaccagc ttctcggtat caaaggagca tctcaagaaa ctaataaatg gaagattcgt 300

cttcagctta caaaaccagt cacttggcct ccactggttt ggggagtcgt ctgtggtgct 360

gctgcttcag ggaactttca ttggacccca gaggatgttg ctaagtcgat tctttgcatg 420

atgatgtctg gtccttgtct tactggctat acacagacaa tcaacgactg gtatgataga 480

gatatcgacg caattaatga gccatatcgt ccaattccat ctggagcaat atcagagcca 540

gaggttatta cacaagtctg ggtgctatta ttgggaggtc ttggtattgc tggaatatta 600

gatgtgtggg cagggcatac cactcccact gtcttctatc ttgctttggg aggatcattg 660

ctatcttata tatactctgc tccacctctt aagctaaaac aaaatggatg ggttggaaat 720

tttgcacttg gagcaagcta tattagtttg ccatggtggg ctggccaagc attgtttggc 780

actcttacgc cagatgttgt tgttctaaca ctcttgtaca gcatagctgg gttaggaata 840

gccattgtta acgacttcaa aagtgttgaa ggagatagag cattaggact tcagtctctc 900

ccagtagctt ttggcaccga aactgcaaaa tggatatgcg ttggtgctat agacattact 960

cagctttctg ttgccggata tctattagca tctgggaaac cttattatgc gttggcgttg 1020

gttgctttga tcattcctca gattgtgttc cagtttaaat actttctcaa ggaccctgtc 1080

aaatacgacg tcaagtacca ggcaagcgcg cagccattct tggtgctcgg aatatttgta 1140

acggcattag catcgcaaca ctga 1164

<210>17

<211>387

<212>PRT

<213>拟南芥属种(Arabidopsis sp)

<400>17

Met Thr Ser Ile Leu Asn Thr Val Ser Thr Ile His Ser Ser Arg Val

1 5 10 15

Thr Ser Val Asp Arg Val Gly Val Leu Set Leu Arg Asn Ser Asp Ser

20 25 30

Val Glu Phe Thr Arg Arg Arg Ser Gly Phe Ser Thr Leu Ile Tyr Glu

35 40 45

Ser Pro Gly Arg Arg Phe Val Val Arg Ala Ala Glu Thr Asp Thr Asp

50 55 60

Lys Val Lys Ser Gln Thr Pro Asp Lys Ala Pro Ala Gly Gly Set Ser

65 70 75 80

Ile Asn Gln Leu Leu Gly Ile Lys Gly Ala Ser Gln Glu Thr Asn Lys

85 90 95

Trp Lys Ile Arg Leu Gln Leu Thr Lys Pro Val Thr Trp Pro Pro Leu

100 105 110

Val Trp Gly Val Val Cys Gly Ala Ala Ala Ser Gly Asn Phe His Trp

115 120 125

Thr Pro Glu Asp Val Ala Lys Ser Ile Leu Cys Met Met Met Ser Gly

130 135 140

Pro Cys Leu Thr Gly Tyr Thr Gln Thr Ile Asn Asp Trp Tyr Asp Arg

145 150 155 160

Asp Ile Asp Ala Ile Asn Glu Pro Tyr Arg Pro Ile Pro Ser Gly Ala

165 170 175

Ile Ser Glu Pro Glu Val Ile Thr Gln Val Trp Val Leu Leu Leu Gly

180 185 190

Gly Leu Gly Ile Ala Gly Ile Leu Asp Val Trp Ala Gly His Thr Thr

195 200 205

Pro Thr Val Phe Tyr Leu Ala Leu Gly Gly Ser Leu Leu Ser Tyr Ile

210 215 220

Tyr Ser Ala Pro Pro Leu Lys Leu Lys Gln Asn Gly Trp Val Gly Asn

225 230 235 240

Phe Ala Leu Gly Ala Ser Tyr Ile Ser Leu Pro Trp Trp Ala Gly Gln

245 250 255

Ala Leu Phe Gly Thr Leu Thr Pro Asp Val Val Val Leu Thr Leu Leu

260 265 270

Tyr Ser Ile Ala Gly Leu Gly Ile Ala Ile Val Asn Asp Phe Lys Ser

275 280 285

Val Glu Gly Asp Arg Ala Leu Gly Leu Gln Ser Leu Pro Val Ala Phe

290 295 300

Gly Thr Glu Thr Ala Lys Trp Ile Cys Val Gly Ala Ile Asp Ile Thr

305 310 315 320

Gln Leu Ser Val Ala Gly Tyr Leu Leu Ala Ser Gly Lys Pro Tyr Tyr

325 330 335

Ala Leu Ala Leu Val Ala Leu Ile Ile Pro Gln Ile Val Phe Gln Phe

340 345 350

Lys Tyr Phe Leu Lys Asp Pro Val Lys Tyr Asp Val Lys Tyr Gln Ala

355 360 365

Ser Ala Gln Pro Phe Leu Val Leu Gly Ile Phe Val Thr Ala Leu Ala

370 375 380

Ser Gln His

385

<210>18

<21l>981

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>18

atgttgttta gtggttcagc gatcccatta agcagcttct gctctcttcc ggagaaaccc 60

cacactcttc ctatgaaact ctctcccgct gcaatccgat cttcatcctc atctgccccg 120

gggtcgttga acttcgatct gaggacgtat tggacgactc tgatcaccga gatcaaccag 180

aagctggatg aggccatacc ggtcaagcac cctgcgggga tctacgaggc tatgagatac 240

tctgtactcg cacaaggcgc caagcgtgcc cctcctgtga tgtgtgtggc ggcctgcgag 300

ctcttcggtg gcgatcgcct cgccgctttc cccaccgcct gtgccctaga aatggtgcac 360

gcggcttcgt tgatacacga cgacctcccc tgtatggacg acgatcctgt gcgcagagga 420

aagccatcta accacactgt ctacggctct ggcatggcca ttctcgccgg tgacgccctc 480

ttcccactcg ccttccagca cattgtctcc cacacgcctc ctgaccttgt tccccgagcc 540

accatcctca gactcatcac tgagattgcc cgcactgtcg gctccactgg tatggctgca 600

ggccagtacg tcgaccttga aggaggtccc tttcctcttt cctttgttca ggagaagaaa 660

ttcggagcca tgggtgaatg ctctgccgtg tgcggtggcc tattgggcgg tgccactgag 720

gatgagctcc agagtctccg aaggtacggg agagccgtcg ggatgctgta tcaggtggtc 780

gatgacatca ccgaggacaa gaagaagagc tatgatggtg gagcagagaa gggaatgatg 840

gaaatggcgg aagagctcaa ggagaaggcg aagaaggagc ttcaagtgtt tgacaacaag 900

tatggaggag gagacacact tgttcctctc tacaccttcg ttgactacgc tgctcatcga 960

cattttcttc ttcccctctg a 981

<210>19

<211>245

<212>DNA

<213>甘氨酸种(Glycine sp)

<400>19

gcaacatctg ggactgggtt tgtcttgggg agtggtagtg ctgttgatct ttcggcactt 60

tcttgcactt gcttgggtac catgatggtt gctgcatctg ctaactcttt gaatcaggtg 120

tttgagatca ataatgatgc taaaatgaag agaacaagtc gcaggccact accctcagga 180

cgcatcacaa tacctcatgc agttggctgg gcatcctctg ttggattagc tggtacggct 240

ctact 245

<210>20

<211>253

<212>DNA

<213>甘氨酸种(Glycine sp)

<400>20

attggctttc caagatcatt gggttttctt gttgcattca tgaccttcta ctccttgggt 60

ttggcattgt ccaaggatat acctgacgtt gaaggagata aagagcacgg cattgattct 120

tttgcagtac gtctaggtca gaaacgggca ttttggattt gcgtttcctt ttttgaaatg 180

gctttcggag ttggtatcct ggccggagca tcatgctcac acttttggac taaaattttc 240

acgggtatgg gaa 253

<210>21

<211>275

<212>DNA

<213>甘氨酸种(Glycine sp)

<400>21

tgatcttcta ctctctgggt atggcattgt ccaaggatat atctgacgtt aaaggagata 60

aagcatacgg catcgatact ttagcgatac gtttgggtca aaaatgggta ttttggattt 120

gcattatcct ttttgaaatg gcttttggag ttgccctctt ggcaggagca acatcttctt 180

acctttggat taaaattgtc acgggtctgg gacatgctat tcttgcttca attctcttgt 240

accaagccaa atctatatac ttgagcaaca aagtt 275

<210>22

<211>299

<212>DNA

<213>甘氨酸种(Glycine sp)

<220>

<221>misc_feature

<222>(1)...(299)

<223>n＝A，T，C or G

<400>22

ccanaatang tncatcttng aaagacaatt ggcctcttca acacacaagt ctgcatgtga 60

agaagaggcc aattgtcttt ccaagatcac ttatngtggc tattgtaatc atgaacttct 120

tctttgtggg tatggcattg gcaaaggata tacctanctg ttgaaggaga taaaatatat 180

ggcattgata cttttgcaat acgtataggt caaaaacaag tattttggat ttgtattttc 240

ctttttgaaa ggctttcgga gtttccctag tggcaggagc aacatcttct agccttggt 299

<210>23

<211>767

<212>DNA

<213>甘氨酸种(Glycine sp)

<400>23

gtggaggctg tggttgctgc cctgtttatg aatatttata ttgttggttt gaatcaattg 60

tctgatgttg aaatagacaa gataaacaag ccgtatcttc cattagcatc tggggaatat 120

tcctttgaaa ctggtgtcac tattgttgca tctttttcaa ttctgagttt ttggcttggc 180

tgggttgtag gttcatggcc attattttgg gccctttttg taagctttgt gctaggaact 240

gcttattcaa tcaatgtgcc tctgttgaga tggaagaggt ttgcagtgct tgcagcgatg 300

tgcattctag ctgttcgggc agtaatagtt caacttgcat ttttccttca catgcagact 360

catgtgtaca agaggccacc tgtcttttca agaccattga tttttgctac tgcattcatg 420

agcttcttct ctgtagttat agcactgttt aaggatatac ctgacattga aggagataaa 480

gtatttggca tccaatcttt ttcagtgtgt ttaggtcaga agccggtgtt ctggacttgt 540

gttacccttc ttgaaatagc ttatggagtc gccctcctgg tgggagctgc atctccttgt 600

ctttggagca aaattttcac gggtctggga cacgctgtgc tggcttcaat tctctggttt 660

catgccaaat ctgtagattt gaaaagcaaa gcttcgataa catccttcta tatgtttatt 720

tggaagctat tttatgcaga atacttactc attccttttg ttagatg 767

<210>24

<211>255

<212>PRT

<213>甘氨酸种(Glycine sp)

<400>24

Val Glu Ala Val Val Ala Ala Leu Phe Met Asn Ile Tyr Ile Val Gly

1 5 10 15

Leu Asn Gln Leu Ser Asp Val Glu Ile Asp Lys Ile Asn Lys Pro Tyr

20 25 30

Leu Pro Leu Ala Ser Gly Glu Tyr Ser Phe Glu Thr Gly Val Thr Ile

35 40 45

Val Ala Ser Phe Ser Ile Leu Ser Phe Trp Leu Gly Trp Val Val Gly

50 55 60

Ser Trp Pro Leu Phe Trp Ala Leu Phe Val Ser Phe Val Leu Gly Thr

65 70 75 80

Ala Tyr Ser Ile Asn Val Pro Leu Leu Arg Trp Lys Arg Phe Ala Val

85 90 95

Leu Ala Ala Met Cys Ile Leu Ala Val Arg Ala Val Ile Val Gln Leu

100 105 110

Ala Phe Phe Leu His Met Gln Thr His Val Tyr Lys Arg Pro Pro Val

115 120 125

Phe Ser Arg Pro Leu Ile Phe Ala Thr Ala Phe Met Ser Phe Phe Ser

130 135 140

Val Val Ile Ala Leu Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys

145 150 155 160

Val Phe Gly Ile Gln Set Phe Ser Val Cys Leu Gly Gln Lys Pro Val

165 170 175

Phe Trp Thr Cys Val Thr Leu Leu Glu Ile Ala Tyr Gly Val Ala Leu

180 185 190

Leu Val Gly Ala Ala Ser Pro Cys Leu Trp Ser Lys Ile Phe Thr Gly

195 200 205

Leu Gly His Ala Val Leu Ala Ser Ile Leu Trp Phe His Ala Lys Ser

210 215 220

Val Asp Leu Lys Ser Lys Ala Ser Ile Thr Ser Phe Tyr Met Phe Ile

225 230 235 240

Trp Lys Leu Phe Tyr Ala Glu Tyr Leu Leu Ile Pro Phe Val Arg

245 250 255

<210>25

<211>360

<212>DNA

<213>玉蜀黍属种(Zea sp)

<220>

<221>misc_feature

<222>(1)...(360)

<223>n＝A，T，C or G

<400>25

ggcgtcttca cttgttctgg tcttctcgta tcccctgatg aagaggttca cattttggcc 60

tcaggcttat cttggcctga cattcaactg gggagcttta ctagggtggg ctgctattaa 120

ggaaagcata gaccctgcaa atcatccttc cattgtatac agctggtatt tgttggacgc 180

tggtgtatga tactatatat gcgcatcagg tgtttcgcta tccctacttt catattaatc 240

cttgatgaag tggccatttc atgttgtcgc ggtggtctta tacttgcata tctccatgca 300

tctcaggaca aagangatga cctgaaagta ggagtccaag tccacagctt aagatttggg 360

<210>26

<211>299

<212>DNA

<213>玉蜀黍属种(Zea sp)

<220>

<221>misc_feature

<222>(1)...(299)

<223>n＝A，T，C or G

<400>26

gatggttgca gcatctgcaa ataccctcaa ccaggtgttt gngataaaaa atgatgctaa 60

aatgaaaagg acaatgcgtg ccccctgcca tctggtcgca ttagtcctgc acatgctgcg 120

atgtgggcta caagtgttgg agttgcagga acagctttgt tggcctggaa ggctaatggc 180

ttggcagctg ggcttgcagc ttctaatctt gttctgtatg catttgtgta tacgccgttg 240

aagcaaatac accctgttaa tacatgggtt ggggcagtcg ttggtgccat cccaccact 299

<210>27

<211>255

<212>DNA

<213>玉蜀黍属种(Zea sp)

<220>

<221>misc_feature

<222>(1)...(255)

<223>n＝A，T，C or G

<400>27

anacttgcat atctccatgc ntctcaggac aaagangatg acctgaaagt aggtgtcaag 60

tccacagcat taagatttgg agatttgacc nnatactgna tcagtggctt tggcgcggca 120

tgcttcggca gcttagcact cagtggttac aatgctgacc ttggttggtg tttagtgtga 180

tgcttgagcg aagaatggta tngtttttac ttgatattga ctccagacct gaaatcatgt 240

tggacagggt ggccc 255

<210>28

<211>257

<212>DNA

<213>玉蜀黍属种(Zea sp)

<400>28

attgaagggg ataggactct ggggcttcag tcacttcctg ttgcttttgg gatggaaact 60

gcaaaatgga tttgtgttgg agcaattgat atcactcaat tatctgttgc aggttaccta 120

ttgagcaccg gtaagctgta ttatgccctg gtgttgcttg ggctaacaat tcctcaggtg 180

ttctttcagt tccagtactt cctgaaggac cctgtgaagt atgatgtcaa atatcaggca 240

agcgcacaac cattctt 257

<210>29

<211>368

<212>DNA

<213>玉蜀黍属种(Zea sp)

<400>29

atccagttgc aaataataat ggcgttcttc tctgttgtaa tagcactatt caaggatata 60

cctgacatcg aaggggaccg catattcggg atccgatcct tcagcgtccg gttagggcaa 120

aagaaggtct tttggatctg cgttggcttg cttgagatgg cctacagcgt tgcgatactg 180

atgggagcta cctcttcctg tttgtggagc aaaacagcaa ccatcgctgg ccattccata 240

cttgccgcga tcctatggag ctgcgcgcga tcggtggact tgacgagcaa agccgcaata 300

acgtccttct acatgttcat ctggaagctg ttctacgcgg agtacctgct catccctctg 360

gtgcggtg 368

<210>30

<211>122

<212>PRT

<213>玉蜀黍属种(Zea sp)

<400>30

Ile Gln Leu Gln Ile Ile Met Ala Phe Phe Ser Val Val Ile Ala Leu

1 5 10 15

Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Arg Ile Phe Gly Ile Arg

20 25 30

Ser Phe Ser Val Arg Leu Gly Gln Lys Lys Val Phe Trp Ile Cys Val

35 40 45

Gly Leu Leu Glu Met Ala Tyr Ser Val Ala Ile Leu Met Gly Ala Thr

50 55 60

Ser Ser Cys Leu Trp Ser Lys Thr Ala Thr Ile Ala Gly His Ser Ile

65 70 75 80

Leu Ala Ala Ile Leu Trp Ser Cys Ala Arg Ser Val Asp Leu Thr Ser

85 90 95

Lys Ala Ala Ile Thr Ser Phe Tyr Met Phe Ile Trp Lys Leu Phe Tyr

100 105 110

Ala Glu Tyr Leu Leu Ile Pro Leu Val Arg

115 120

<210>31

<211>278

<212>DNA

<213>玉蜀黍属种(Zea sp)

<400>31

tattcagcac cacctctcaa gctcaagcag aatggatgga ttgggaactt cgctctgggt 60

gcgagttaca tcagcttgcc ctggtgggct ggccaggcgt tatttggaac tcttacacca 120

gatatcattg tcttgactac tttgtacagc atagctgggc tagggattgc tattgtaaat 180

gatttcaaga gtattgaagg ggataggact ctggggcttc agtcacttcc tgttgctttt 240

gggatggaaa ctgcaaaatg gatttgtgtt ggagcaat 278

<210>32

<211>292

<212>PRT

<213>集胞蓝细菌属种(Synechocystis sp)

<400>32

Met Val Ala Gln Thr Pro Ser Ser Pro Pro Leu Trp Leu Thr Ile Ile

1 5 10 15

Tyr Leu Leu Arg Trp His Lys Pro Ala Gly Arg Leu Ile Leu Met Ile

20 25 30

Pro Ala Leu Trp Ala Val Cys Leu Ala Ala Gln Gly Leu Pro Pro Leu

35 40 45

Pro Leu Leu Gly Thr Ile Ala Leu Gly Thr Leu Ala Thr Ser Gly Leu

50 55 60

Gly Cys Val Val Asn Asp Leu Trp Asp Arg Asp Ile Asp Pro Gln Val

65 70 75 80

Glu Arg Thr Lys Gln Arg Pro Leu Ala Ala Arg Ala Leu Ser Val Gln

85 90 95

Val Gly Ile Gly Val Ala Leu Val Ala Leu Leu Cys Ala Ala Gly Leu

100 105 110

Ala Phe Tyr Leu Thr Pro Leu Ser Phe Trp Leu Cys Val Ala Ala Val

115 120 125

Pro Val Ile Val Ala Tyr Pro Gly Ala Lys Arg Val Phe Pro Val Pro

130 135 140

Gln Leu Val Leu Ser Ile Ala Trp Gly Phe Ala Val Leu Ile Ser Trp

145 150 155 160

Ser Ala Val Thr Gly Asp Leu Thr Asp Ala Thr Trp Val Leu Trp Gly

165 170 175

Ala Thr Val Phe Trp Thr Leu Gly Phe Asp Thr Val Tyr Ala Met Ala

180 185 190

Asp Arg Glu Asp Asp Arg Arg Ile Gly Val Asn Ser Ser Ala Leu Phe

195 200 205

Phe Gly Gln Tyr Val Gly Glu Ala Val Gly Ile Phe Phe Ala Leu Thr

210 215 220

Ile Gly Cys Leu Phe Tyr Leu Gly Met Ile Leu Met Leu Asn Pro Leu

225 230 235 240

Tyr Trp Leu Ser Leu Ala Ile Ala Ile Val Gly Trp Val Ile Gln Tyr

245 250 255

Ile Gln Leu Ser Ala Pro Thr Pro Glu Pro Lys Leu Tyr Gly Gln Ile

260 265 270

Phe Gly Gln Asn Val Ile Ile Gly Phe Val Leu Leu Ala Gly Met Leu

275 280 285

Leu Gly Trp Leu

290

<210>33

<211>316

<212>PRT

<213>集胞蓝细菌属种(Synechocystis sp)

<400>33

Met Val Thr Ser Thr Lys Ile His Arg Gln His Asp Ser Met Gly Ala

1 5 10 15

Val Cys Lys Ser Tyr Tyr Gln Leu Thr Lys Pro Arg Ile Ile Pro Leu

20 25 30

Leu Leu Ile Thr Thr Ala Ala Ser Met Trp Ile Ala Ser Glu Gly Arg

35 40 45

Val Asp Leu Pro Lys Leu Leu Ile Thr Leu Leu Gly Gly Thr Leu Ala

50 55 60

Ala Ala Ser Ala Gln Thr Leu Asn Cys Ile Tyr Asp Gln Asp Ile Asp

65 70 75 80

Tyr Glu Met Leu Arg Thr Arg Ala Arg Pro Ile Pro Ala Gly Lys Val

85 90 95

Gln Pro Arg His Ala Leu Ile Phe Ala Leu Ala Leu Gly Val Leu Ser

100 105 110

Phe Ala Leu Leu Ala Thr Phe Val Asn Val Leu Ser Gly Cys Leu Ala

115 120 125

Leu Ser Gly Ile Val Phe Tyr Met Leu Val Tyr Thr His Trp Leu Lys

130 135 140

Arg His Thr Ala Gln Asn Ile Val Ile Gly Gly Ala Ala Gly Ser Ile

145 150 155 160

Pro Pro Leu Val Gly Trp Ala Ala Val Thr Gly Asp Leu Ser Trp Thr

165 170 175

Pro Trp Val Leu Phe Ala Leu Ile Phe Leu Trp Thr Pro Pro His Phe

180 185 190

Trp Ala Leu Ala Leu Met Ile Lys Asp Asp Tyr Ala Gln Val Asn Val

195 200 205

Pro Met Leu Pro Val Ile Ala Gly Glu Glu Lys Thr Val Ser Gln Ile

210 215 220

Trp Tyr Tyr Ser Leu Leu Val Val Pro Phe Ser Leu Leu Leu Val Tyr

225 230 235 240

Pro Leu His Gln Leu Gly Ile Leu Tyr Leu Ala Ile Ala Ile Ile Leu

245 250 255

Gly Gly Gln Phe Leu Val Lys Ala Trp Gln Leu Lys Gln Ala Pro Gly

260 265 270

Asp Arg Asp Leu Ala Arg Gly Leu Phe Lys Phe Ser Ile Phe Tyr Leu

275 280 285

Met Leu Leu Cys Leu Ala Met Val Ile Asp Ser Leu Pro Val Thr His

290 295 300

Gln Leu Val Ala Gln Met Gly Thr Leu Leu Leu Gly

305 310 315

<210>34

<211>324

<212>PRT

<213>集胞蓝细菌属种(Synechocystis sp)

<400>34

Met Ser Asp Thr Gln Asn Thr Gly Gln Asn Gln Ala Lys Ala Arg Gln

1 5 10 15

Leu Leu Gly Met Lys Gly Ala Ala Pro Gly Glu Ser Ser Ile Trp Lys

20 25 30

Ile Arg Leu Gln Leu Met Lys Pro Ile Thr Trp Ile Pro Leu Ile Trp

35 40 45

Gly Val Val Cys Gly Ala Ala Ser Ser Gly Gly Tyr Ile Trp Ser Val

50 55 60

Glu Asp Phe Leu Lys Ala Leu Thr Cys Met Leu Leu Ser Gly Pro Leu

65 70 75 80

Met Thr Gly Tyr Thr Gln Thr Leu Asn Asp Phe Tyr Asp Arg Asp Ile

85 90 95

Asp Ala Ile Asn Glu Pro Tyr Arg Pro Ile Pro Ser Gly Ala Ile Ser

100 105 110

Val Pro Gln Val Val Thr Gln Ile Leu Ile Leu Leu Val Ala Gly Ile

115 120 125

Gly Val Ala Tyr Gly Leu Asp Val Trp Ala Gln His Asp Phe Pro Ile

130 135 140

Met Met Val Leu Thr Leu Gly Gly Ala Phe Val Ala Tyr Ile Tyr Ser

145 150 155 160

Ala Pro Pro Leu Lys Leu Lys Gln Asn Gly Trp Leu Gly Asn Tyr Ala

165 170 175

Leu Gly Ala Ser Tyr Ile Ala Leu Pro Trp Trp Ala Gly His Ala Leu

180 185 190

Phe Gly Thr Leu Asn Pro Thr Ile Met Val Leu Thr Leu Ile Tyr Ser

195 200 205

Leu Ala Gly Leu Gly Ile Ala Val Val Asn Asp Phe Lys Ser Val Glu

210 215 220

Gly Asp Arg Gln Leu Gly Leu Lys Ser Leu Pro Val Met Phe Gly Ile

225 230 235 240

Gly Thr Ala Ala Trp Ile Cys Val Ile Met Ile Asp Val Phe Gln Ala

245 250 255

Gly Ile Ala Gly Tyr Leu Ile Tyr Val His Gln Gln Leu Tyr Ala Thr

260 265 270

Ile Val Leu Leu Leu Leu Ile Pro Gln Ile Thr Phe Gln Asp Met Tyr

275 280 285

Phe Leu Arg Asn Pro Leu Glu Asn Asp Val Lys Tyr Gln Ala Ser Ala

290 295 300

Gln Pro Phe Leu Val Phe Gly Met Leu Ala Thr Gly Leu Ala Leu Gly

305 310 315 320

His Ala Gly Ile

<210>35

<211>307

<212>PRT

<213>集胞蓝细菌属种(Synechocystis sp)

<400>35

Met Thr Glu Ser Ser Pro Leu Ala Pro Ser Thr Ala Pro Ala Thr Arg

1 5 10 15

Lys Leu Trp Leu Ala Ala Ile Lys Pro Pro Met Tyr Thr Val Ala Val

20 25 30

Val Pro Ile Thr Val Gly Ser Ala Val Ala Tyr Gly Leu Thr Gly Gln

35 40 45

Trp His Gly Asp Val Phe Thr Ile Phe Leu Leu Ser Ala Ile Ala Ile

50 55 60

Ile Ala Trp Ile Asn Leu Ser Asn Asp Val Phe Asp Ser Asp Thr Gly

65 70 75 80

Ile Asp Val Arg Lys Ala His Ser Val Val Asn Leu Thr Gly Asn Arg

85 90 95

Asn Leu Val Phe Leu Ile Ser Asn Phe Phe Leu Leu Ala Gly Val Leu

100 105 110

Gly Leu Met Ser Met Ser Trp Arg Ala Gln Asp Trp Thr Val Leu Glu

115 120 125

Leu Ile Gly Val Ala Ile Phe Leu Gly Tyr Thr Tyr Gln Gly Pro Pro

130 135 140

Phe Arg Leu Gly Tyr Leu Gly Leu Gly Glu Leu Ile Cys Leu Ile Thr

145 150 155 160

Phe Gly Pro Leu Ala Ile Ala Ala Ala Tyr Tyr Ser Gln Ser Gln Ser

165 170 175

Phe Ser Trp Asn Leu Leu Thr Pro Ser Val Phe Val Gly Ile Ser Thr

180 185 190

Ala Ile Ile Leu Phe Cys Ser His Phe His Gln Val Glu Asp Asp Leu

195 200 205

Ala Ala Gly Lys Lys Ser Pro Ile Val Arg Leu Gly Thr Lys Leu Gly

210 215 220

Ser Gln Val Leu Thr Leu Ser Val Val Ser Leu Tyr Leu Ile Thr Ala

225 230 235 240

Ile Gly Val Leu Cys His Gln Ala Pro Trp Gln Thr Leu Leu Ile Ile

245 250 255

Ala Ser Leu Pro Trp Ala Val Gln Leu Ile Arg His Val Gly Gln Tyr

260 265 270

His Asp Gln Pro Glu Gln Val Ser Asn Cys Lys Phe Ile Ala Val Asn

275 280 285

Leu His Phe Phe Ser Gly Met Leu Met Ala Ala Gly Tyr Gly Trp Ala

290 295 300

Gly Leu Gly

305

<210>36

<211>927

<212>DNA

<213>集胞蓝细菌属种(Synechocystis sp)

<400>36

atggcaacta tccaagcttt ttggcgcttc tcccgccccc ataccatcat tggtacaact 60

ctgagcgtct gggctgtgta tctgttaact attctcgggg atggaaactc agttaactcc 120

cctgcttccc tggatttagt gttcggcgct tggctggcct gcctgttggg taatgtgtac 180

attgtcggcc tcaaccaatt gtgggatgtg gacattgacc gcatcaataa gccgaatttg 240

cccctagcta acggagattt ttctatcgcc cagggccgtt ggattgtggg actttgtggc 300

gttgcttcct tggcgatcgc ctggggatta gggctatggc tggggctaac ggtgggcatt 360

agtttgatta ttggcacggc ctattcggtg ccgccagtga ggttaaagcg cttttccctg 420

ctggcggccc tgtgtattct gacggtgcgg ggaattgtgg ttaacttggg cttattttta 480

ttttttagaa ttggtttagg ttatcccccc actttaataa cccccatctg ggttttgact 540

ttatttatct tagttttcac cgtggcgatc gccattttta aagatgtgcc agatatggaa 600

ggcgatcggc aatttaagat tcaaacttta actttgcaaa tcggcaaaca aaacgttttt 660

cggggaacct taattttact cactggttgt tatttagcca tggcaatctg gggcttatgg 720

gcggctatgc ctttaaatac tgctttcttg attgtttccc atttgtgctt attagcctta 780

ctctggtggc ggagtcgaga tgtacactta gaaagcaaaa ccgaaattgc tagtttttat 840

cagtttattt ggaagctatt tttcttagag tacttgctgt atcccttggc tctgtggtta 900

cctaattttt ctaatactat tttttag 927

<210>37

<211>308

<212>PRT

<213>集胞蓝细菌属种(Synechocystis sp)

<400>37

Met Ala Thr Ile Gln Ala Phe Trp Arg Phe Ser Arg Pro His Thr Ile

1 5 10 15

Ile Gly Thr Thr Leu Ser Val Trp Ala Val Tyr Leu Leu Thr Ile Leu

20 25 30

Gly Asp Gly Asn Ser Val Asn Ser Pro Ala Ser Leu Asp Leu Val Phe

35 40 45

Gly Ala Trp Leu Ala Cys Leu Leu Gly Asn Val Tyr Ile Val Gly Leu

50 55 60

Asn Gln Leu Trp Asp Val Asp Ile Asp Arg Ile Asn Lys Pro Asn Leu

65 70 75 80

Pro Leu Ala Asn Gly Asp Phe Ser Ile Ala Gln Gly Arg Trp Ile Val

85 90 95

Gly Leu Cys Gly Val Ala Ser Leu Ala Ile Ala Trp Gly Leu Gly Leu

100 105 110

Trp Leu Gly Leu Thr Val Gly Ile Ser Leu Ile Ile Gly Thr Ala Tyr

115 120 125

Ser Val Pro Pro Val Arg Leu Lys Arg Phe Ser Leu Leu Ala Ala Leu

130 135 140

Cys Ile Leu Thr Val Arg Gly Ile Val Val Asn Leu Gly Leu Phe Leu

145 150 155 160

Phe Phe Arg Ile Gly Leu Gly Tyr Pro Pro Thr Leu Ile Thr Pro Ile

165 170 175

Trp Val Leu Thr Leu Phe Ile Leu Val Phe Thr Val Ala Ile Ala Ile

180 185 190

Phe Lys Asp Val Pro Asp Met Glu Gly Asp Arg Gln Phe Lys Ile Gln

195 200 205

Thr Leu Thr Leu Gln Ile Gly Lys Gln Asn Val Phe Arg Gly Thr Leu

210 215 220

Ile Leu Leu Thr Gly Cys Tyr Leu Ala Met Ala Ile Trp Gly Leu Trp

225 230 235 240

Ala Ala Met Pro Leu Ash Thr Ala Phe Leu Ile Val Ser His Leu Cys

245 250 255

Leu Leu Ala Leu Leu Trp Trp Arg Ser Arg Asp Val His Leu Glu Ser

260 265 270

Lys Thr Glu Ile Ala Ser Phe Tyr Gln Phe Ile Trp Lys Leu Phe Phe

275 280 285

Leu Glu Tyr Leu Leu Tyr Pro Leu Ala Leu Trp Leu Pro Asn Phe Ser

290 295 300

Asn Thr Ile Phe

305

<210>38

<211>1092

<212>DNA

<213>集胞蓝细菌属种(Synechocystis sp)

<400>38

atgaaatttc cgccccacag tggttaccat tggcaaggtc aatcaccttt ctttgaaggt 60

tggtacgtgc gcctgctttt gccccaatcc ggggaaagtt ttgcttttat gtactccatc 120

gaaaatcctg ctagcgatca tcattacggc ggcggtgctg tgcaaatttt agggccggct 180

acgaaaaaac aagaaaatca ggaagaccaa cttgtttggc ggacatttcc ctcggtaaaa 240

aaattttggg ccagtcctcg ccagtttgcc ctagggcatt ggggaaaatg tagggataac 300

aggcaggcga aacccctact ctccgaagaa ttttttgcca cggtcaagga aggttatcaa 360

atccatcaaa atcagcacca aggacaaatc attcatggcg atcgccattg tcgttggcag 420

ttcaccgtag aaccggaagt aacttggggg agtcctaacc gatttcctcg ggctacagcg 480

ggttggcttt cctttttacc cttgtttgat cccggttggc aaattctttt agcccaaggt 540

agagcgcacg gctggctgaa atggcagagg gaacagtatg aatttgacca cgccctagtt 600

tatgccgaaa aaaattgggg tcactccttt ccctcccgct ggttttggct ccaagcaaat 660

tattttcctg accatccagg actgagcgtc actgccgctg gcggggaacg gattgttctt 720

ggtcgccccg aagaggtagc tttaattggc ttacatcacc aaggtaattt ttacgaattt 780

ggcccgggcc atggcacagt cacttggcaa gtagctccct ggggccgttg gcaattaaaa 840

gccagcaatg ataggtattg ggtcaagttg tccggaaaaa cagataaaaa aggcagttta 900

gtccacactc ccaccgccca gggcttacaa ctcaactgcc gagataccac taggggctat 960

ttgtatttgc aattgggatc tgtgggtcac ggcctgatag tgcaagggga aacggacacc 1020

gcggggctag aagttggagg tgattggggt ttaacagagg aaaatttgag caaaaaaaca 1080

gtgccattct ga 1092

<210>39

<211>363

<212>PRT

<213>集胞蓝细菌属种(Synechocystis sp)

<400>39

Met Lys Phe Pro Pro His Ser Gly Tyr His Trp Gln Gly Gln Ser Pro

1 5 10 15

Phe Phe Glu Gly Trp Tyr ValArg Leu Leu Leu Pro Gln Ser Gly Glu

20 25 30

Ser Phe Ala Phe Met Tyr Ser Ile Glu Asn Pro Ala Ser Asp His His

35 40 45

Tyr Gly Gly Gly Ala Val Gln Ile Leu Gly Pro Ala Thr Lys Lys Gln

50 55 60

Glu Asn Gln Glu Asp Gln Leu Val Trp Arg Thr Phe Pro Ser Val Lys

65 70 75 80

Lys Phe Trp Ala Ser Pro Arg Gln Phe Ala Leu Gly His Trp Gly Lys

85 90 95

Cys Arg Asp Asn Arg Gln Ala Lys Pro Leu Leu Ser Glu Glu Phe Phe

100 105 110

Ala Thr Val Lys Glu Gly Tyr Gln Ile His Gln Asn Gln His Gln Gly

115 120 125

Gln Ile Ile His Gly Asp Arg His Cys Arg Trp Gln Phe Thr Val Glu

130 135 140

Pro Glu Val Thr Trp Gly Ser Pro Asn Arg Phe Pro Arg Ala Thr Ala

145 150 155 160

Gly Trp Leu Ser Phe Leu Pro Leu Phe Asp Pro Gly Trp Gln Ile Leu

165 170 175

Leu Ala Gln Gly Arg Ala His Gly Trp Leu Lys Trp Gln Arg Glu Gln

180 185 190

Tyr Glu Phe Asp His Ala Leu Val Tyr Ala Glu Lys Ash Trp Gly His

195 200 205

Ser Phe Pro Ser Arg Trp Phe Trp Leu Gln Ala Asn Tyr Phe Pro Asp

210 215 220

His Pro Gly Leu Ser Val Thr Ala Ala Gly Gly Glu Arg Ile Val Leu

225 230 235 240

Gly Arg Pro Glu Glu Val Ala Leu Ile Gly Leu His His Gln Gly Asn

245 250 255

Phe Tyr Glu Phe Gly Pro Gly His Gly Thr Val Thr Trp Gln Val Ala

260 265 270

Pro Trp Gly Arg Trp Gln Leu Lys Ala Ser Asn Asp Arg Tyr Trp Val

275 280 285

Lys Leu Ser Gly Lys Thr Asp Lys Lys Gly Ser Leu Val His Thr Pro

290 295 300

Thr Ala Gln Gly Leu Gln Leu Asn Cys Arg Asp Thr Thr Arg Gly Tyr

305 310 315 320

Leu Tyr Leu Gln Leu Gly Ser Val Gly His Gly Leu Ile Val Gln Gly

325 330 335

Glu Thr Asp Thr Ala Gly Leu Glu Val Gly Gly Asp Trp Gly Leu Thr

340 345 350

Glu Glu Asn Leu Ser Lys Lys Thr Val Pro Phe

355 360

<210>40

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>40

cgcgatttaa atggcgcgcc ctgcaggcgg ccgcctgcag ggcgcgccat ttaaat 56

<210>41

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>41

tcgaggatcc gcggccgcaa gcttcctgca gg 32

<210>42

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>42

tcgacctgca ggaagcttgc ggccgcggat cc 32

<210>43

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>43

tcgacctgca ggaagcttgc ggccgcggat cc 32

<210>44

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>44

tcgaggatcc gcggccgcaa gcttcctgca gg 32

<210>45

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>45

tcgaggatcc gcggccgcaa gcttcctgca ggagct 36

<210>46

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>46

cctgcaggaa gcttgcggcc gcggatcc 28

<210>47

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>47

tcgacctgca ggaagcttgc ggccgcggat ccagct 36

<210>48

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>48

ggatccgcgg ccgcaagctt cctgcagg 28

<210>49

<211>39

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>49

gatcacctgc aggaagcttg cggccgcgga tccaatgca 39

<210>50

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>50

ttggatccgc ggccgcaagc ttcctgcagg t 31

<210>51

<211>41

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>51

ggatccgcgg ccgcacaatg gagtctctgc tctctagttc t 41

<210>52

<211>38

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>52

ggatcctgca ggtcacttca aaaaaggtaa cagcaagt 38

<210>53

<211>45

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>53

ggatccgcgg ccgcacaatg gcgttttttg ggctctcccg tgttt 45

<210>54

<211>40

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>54

ggatcctgca ggttattgaa aacttcttcc aagtacaact 40

<210>55

<211>38

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>55

ggatccgcgg ccgcacaatg tggcgaagat ctgttgtt 38

<210>56

<211>37

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>56

ggatcctgca ggtcatggag agtagaagga aggagct 37

<210>57

<211>50

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>57

ggatccgcgg ccgcacaatg gtacttgccg aggttccaaa gcttgcctct 50

<210>58

<211>38

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>58

ggatcctgca ggtcacttgt ttctggtgat gactctat 38

<210>59

<211>38

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>59

ggatccgcgg ccgcacaatg acttcgattc tcaacact 38

<210>60

<211>36

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>60

ggatcctgca ggtcagtgtt gcgatgctaa tgccgt 36

<210>61

<211>22

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>61

taatgtgtac attgtcggcc tc 22

<210>62

<211>60

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>62

gcaatgtaac atcagagatt ttgagacaca acgtggcttt ccacaattcc ccgcaccgtc 60

<210>63

<211>22

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>63

aggctaataa gcacaaatgg ga 22

<210>64

<211>63

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>64

ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggaattgg tttaggttat 60

ccc 63

<210>65

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>65

ggatccatgg ttgcccaaac cccatc 26

<210>66

<211>61

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>66

gcaatgtaac atcagagatt ttgagacaca acgtggcttt gggtaagcaa caatgaccgg 60

c 61

<210>67

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>67

gaattctcaa agccagccca gtaac 25

<210>68

<211>63

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>68

ggtatgagtc agcaacacct tcttcacgag gcagacctca gcgggtgcga aaagggtttt 60

ccc 63

<210>69

<211>23

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>69

ccagtggttt aggctgtgtg gtc 23

<210>70

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>70

ctgagttgga tgtattggat c 21

<210>71

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>71

ggatccatgg ttacttcgac aaaaatcc 28

<210>72

<211>60

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>72

gcaatgtaac atcagagatt ttgagacaca acgtggcttt gctaggcaac cgcttagtac 60

<210>73

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>73

gaattcttaa cccaacagta aagttccc 28

<210>74

<211>63

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>74

ggtatgagtc agcaacacct tcttcacgag gcagacctca gcgccggcat tgtcttttac 60

atg 63

<210>75

<211>20

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>75

ggaacccttg cagccgcttc 20

<210>76

<211>22

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>76

gtatgcccaa ctggtgcaga gg 22

<210>77

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>77

ggatccatgt ctgacacaca aaataccg 28

<210>78

<211>62

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>78

gcaatgtaac atcagagatt ttgagacaca acgtggcttt cgccaatacc agccaccaac 60

ag 62

<210>79

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>79

gaattctcaa atccccgcat ggcctag 27

<210>80

<211>65

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>80

ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggcctacg gcttggacgt 60

gtggg 65

<210>81

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>81

cacttggatt cccctgatct g 21

<210>82

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>82

gcaatacccg cttggaaaac g 21

<210>83

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>83

ggatccatga ccgaatcttc gcccctagc 29

<210>84

<211>61

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>84

gcaatgtaac atcagagatt ttgagacaca acgtggcttt caatcctagg tagccgaggc 60

g 61

<210>85

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>85

gaattcttag cccaggccag cccagcc 27

<210>86

<211>66

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>86

ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggggaatt gatttgttta 60

attacc 66

<210>87

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>87

gcgatcgcca ttatcgcttg g 21

<210>88

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>88

gcagactggc aattatcagt aacg 24

<210>89

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>89

ccatggattc gagtaaagtt gtcgc 25

<210>90

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的说明：寡核苷酸

<400>90

gaattcactt caaaaaaggt aacag 25

<210>91

<211>4550

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>91

attttacacc aatttgatca cttaactaaa ttaattaaat tagatgatta tcccaccata 60

tttttgagca ttaaaccata aaaccatagt tataagtaac tgttttaatc gaatatgact 120

cgattaagat taggaaaaat ttataaccgg taattaagaa aacattaacc gtagtaaccg 180

taaatgccga ttcctccctt gtctaaaaga cagaaaacat atattttatt ttgccccata 240

tgtttcactc tatttaattt caggcacaat acttttggtt ggtaacaaaa ctaaaaagga 300

caacacgtga tacttttcct cgtccgtcag tcagattttt tttaaactag aaacaagtgg 360

caaatctaca ccacattttt tgcttaatct attaacttgt aagttttaaa ttcctaaaaa 420

agtctaacta attcttctaa tataagtaca ttccctaaat ttcccaaaaa gtcaaattaa 480

taattttcaa aatctaatct aaatatctaa taattcaaaa tcattaaaaa gacacgcaac 540

aatgacacca attaatcatc ctcgacccac acaattctac agttctcatg ctaaaccata 600

ttttttgctc tctgttcctt caaaatcatt tctttctctt ctttgattcc caaagatcac 660

ttctttgtct ttgatttttg attttttttc tctctggcgt gaaggaagaa gctttatttc 720

atggagtctc tgctctctag ttcttctctt gtttccgctg gtaaatctcg tccttttctg 780

gtttcaggtt ttatttgttg tttaggtttc gtttttgtga ttcagaacca tacaaaaagt 840

ttgaactttt ctgaatataa aataaggaaa aagtttcgat ttttataatg aattgtttac 900

tagatcgaag taggtgacaa aggttattgt gtggagaagc ataatttctg ggcttgactt 960

tgaattttgt ttctcatgca tgcaacttat caatcagctg gtgggttttg ttggaagaag 1020

cagaatctaa agctccactc tttatcaggt tcgttagggt tttatgggtt tttgaaatta 1080

aatactcaat catcttagtc tcattattct attggttgaa tcacattttc taatttggaa 1140

tttatgagac aatgtatgtt ggacttagtt gaagttcttc tctttggtta tagttgaagt 1200

gttactgatg ttgtttagct ctttacacca atatatacac ccaattttgc agaaatccga 1260

gttctgcgtt gtgattcgag taaagttgtc gcaaaaccga agtttaggaa caatcttgtt 1320

aggcctgatg gtcaaggatc ttcattgttg ttgtatccaa aacataagtc gagatttcgg 1380

gttaatgcca ctgcgggtca gcctgaggct ttcgactcga atagcaaaca gaagtctttt 1440

agagactcgt tagatgcgtt ttacaggttt tctaggcctc atacagttat tggcacagtt 1500

aagtttctct ttaaaaatgt aactctttta aaacgcaatc tttcagggtt ttcaaggaga 1560

taacattagc tctgtgattg gatttgcagg tgcttagcat tttatctgta tctttcttag 1620

cagtagagaa ggtttctgat atatctcctt tacttttcac tggcatcttg gaggtaatga 1680

atatataaca cataatgacc gatgaagaag atacattttt ttcgtctctc tgtttaaaca 1740

attgggtttt gttttcaggc tgttgttgca gctctcatga tgaacattta catagttggg 1800

ctaaatcagt tgtctgatgt tgaaatagat aaggtaacat gcaaattttc ttcatatgag 1860

ttcgagagac tgatgagatt aatagcagct agtgcctaga tcatctctat gtgggttttt 1920

gcaggttaac aagccctatc ttccattggc atcaggagaa tattctgtta acaccggcat 1980

tgcaatagta gcttccttct ccatcatggt atggtgccat tttcacaaaa tttcaacttt 2040

tagaattcta taagttactg aaatagtttg ttataaatcg ttatagagtt tctggcttgg 2100

gtggattgtt ggttcatggc cattgttctg ggctcttttt gtgagtttca tgctcggtac 2160

tgcatactct atcaatgtaa gtaagtttct caatactaga atttggctca aatcaaaatc 2220

tgcagtttct agttttaggt taatgaggtt ttaataactt acttctacta caaacagttg 2280

ccacttttac ggtggaaaag atttgcattg gttgcagcaa tgtgtatcct cgctgtccga 2340

gctattattg ttcaaatcgc cttttatcta catattcagg tactaaacca ttttccttat 2400

gttttgtagt tgttttcatc aaaatcactt ttatattact aaagctgtga aactttgttg 2460

cagacacatg tgtttggaag accaatcttg ttcactaggc ctcttatttt cgccactgcg 2520

tttatgagct ttttctctgt cgttattgca ttgtttaagg taaacaaaga tggaaaaaga 2580

ttaaatctat gtatacttaa agtaaagcat tctactgtta ttgatgagaa gttttctttt 2640

ttggttggat gcaggatata cctgatatcg aaggggataa gatattcgga atccgatcat 2700

tctctgtaac tctgggtcag aaacgggtac gatatctaaa ctaaagaaat tgttttgact 2760

caagtgttgg attaagatta cagaagaaag aaaactgttt ttgtttcttg caaaattcag 2820

gtgttttgga catgtgttac actacttcaa atggcttacg ctgttgcaat tctagttgga 2880

gccacatctc cattcatatg gagcaaagtc atctcggtaa caatctttct ttacccatcg 2940

aaaactcgct aattcatcgt ttgagtggta ctggtttcat tttgttccgt tctgttgatt 3000

ttttttcagg ttgtgggtca tgttatactc gcaacaactt tgtgggctcg agctaagtcc 3060

gttgatctga gtagcaaaac cgaaataact tcatgttata tgttcatatg gaaggttaga 3120

ttcgtttata aatagagtct ttactgcctt tttatgcgct ccaatttgga attaaaatag 3180

cctttcagtt tcatcgaatc accattatac tgataaattc tcatttctgc atcagctctt 3240

ttatgcagag tacttgctgt tacctttttt gaagtgactg acattagaag agaagaagat 3300

ggagataaaa gaataagtca tcactatgct tctgttttta ttacaagttc atgaaattag 3360

gtagtgaact agtgaattag agttttattc tgaaacatgg cagactgcaa aaatatgtca 3420

aagatatgaa tttctgttgg gtaaagaagt ctctgcttgg gcaaaatctt aaggttcggt 3480

gtgttgatat aatgctaagc gaagaaatcg attctatgta gaaatttccg aaactatgtg 3540

taaacatgtc agaacatctc cattctatat cttcttctgc aagaaagctc tgtttttatc 3600

acctaaactc tttatctctg tgtagttaag atatgtatat gtacgtgact acattttttt 3660

gttgatgtaa tttgcagaac gtatggattt ttgttagaaa gcatgagttc gaaagtatat 3720

gtttatatat atggataatt cagacctaac gtcgaagctc acaagcataa attcactact 3780

atagtttgct ctgtaataga tagttccatt gatgtcttga aactgtacgt aactgcctgg 3840

gcgttttgtg gttgatactg actactgagt gttctttgtg agtgttgtaa gtatacaaga 3900

agaagaatat aggctcacgg gaacgactgt ggtggaagat gaaatggaga tcatcacgta 3960

gcggctttgc caaagaccga gtcacgatcg agtctatgaa gtctttacag ctgctgatta 4020

tgattgacca ttgcttagag acgcattgga atcttactag ggacttgcct gggagtttct 4080

tcaagtacgt gtcagatcat acgatgtagg agatttcacg gctttgatgt gtttgtttgg 4140

agtcacaatg cttaatgggc ttattggccc aataatagct agctcttttg ctttagccgt 4200

ttcgtttgtc ccctggtggt gagtattatt agggtatggt gtgaccaaag tcaccagacc 4260

tagagtgaat ctagtagagt cctagaccat ggtccatggc ttttatttgt aatttgaaaa 4320

atgaacaatt ctttttgtaa ggaaaacttt tatatagtag acgtttacta tatagaaact 4380

agttgaacta acttcgtgca attgcataat aatggtgtga aatagagggt gcaaaactca 4440

ataaacattt cgacgtacca agagttcgaa acaataagca aaatagattt ttttgcttca 4500

gactaatttg tacaatgaat ggttaataaa ccattgaagc ttttattaat 4550

<210>92

<211>4450

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>92

tttaggttac aaaatcaatg atattgcgta tgtcaactat aaaagccaaa agtaaagcct 60

cttgtttgac cagaaggtca tgatcattgt atacatacag ccaaactacc tcctggaaga 120

aaagacatgg atcccaaaca acaacaatag cttcttttac aagaaccagt agtaactagt 180

cactaatcta aaagagttaa gtttcagctt ttctggcaat ggctccttga tcatttcaat 240

cctgaaggag acccactttg tagcaagacc atgtcctctg tttcacttac agtgtgtctc 300

aaaagtctac ttcaattctt catatatagg ttcctcacac tacagcttca tcctcattcg 360

ttgacagaga gagagtcttt attgaaaact tcttccaagt acaactccac taaatataat 420

agcaccaaac cacttgttcg acacaaatct gtacagatat aaaaacacta ttaggttttc 480

caaggcaaat cacataattg gattgtgaaa gagtacaaaa gataaaccca aattttcata 540

ctttctactg cagtcagcac cagatgataa gtcagctgtc cctatttgcc atcctaactg 600

tcctgatgca gcggccagtg atgcgtaata ttgccaccct taatcattag agcgagaaac 660

aaaaagaatc aaaagacagt aaatggaatt aggaatcaca aatgagtcct tgtaaagttt 720

attgagtacc gagatctgca ctgaatccag aaagtgcaag aaaacctatg gatgctgtgc 780

caaatccagt taaccaaagc tttgtattat caccgaatct aagggctgtt gacttaacac 840

caacttttac atcatcttct ttgtcctgga gacacaatat attagacatt agtccatgga 900

aaaaaaatga tttaacctag aatatctcaa aattacttgc ataaaaactg aacttgagct 960

gaaattttgg gttcgtagct tgtggcatat actatttcat tttcaatggg ccacaaaggt 1020

aactttcttt tctcacttct gttgcaaacg ggaagacttt tatggggcta actcttcact 1080

taaagtatag aaatcagatg gaaaaggtgg gagatcaggg taattttctt ctttatgatt 1140

gacaaaagtc gaacatcgaa atggatgcat ttgcatgaga catgaaacaa aagctgaaaa 1200

agaaatctgt ggtggtgaag ctagaaaaag aaaacaaagc aagcaatatg cacacattga 1260

gattaactac tttgctactg gtcataatca aatagatttt gaagctaaaa aataaaaagt 1320

gaatatacct gatgtgcata aatagtatca taaacaaggg tccagcagac tccggagaga 1380

tagagaggga gtacaataga tggtgctatg cttcctttaa ctgcagtcca tcctaacaat 1440

gctccccagt ttatggtcaa acctaaaaag gcttgaggct gcaattataa aaacgaatca 1500

atcataagaa aatcagaaaa tatataatgt ctaactttga gaagccagaa tagatttaaa 1560

ttacccaaaa tgtaaacctc ttcataagtg ggtaggaaaa gacaagtaac aaagatgaag 1620

cccctaaaac acggctgcag aatatacata ctgaaatgag ctcaagtaga aaagaatttg 1680

atcacaaaac taaagacaag acctgagaac atatcttcag aatttgggcc aactacataa 1740

gggtgaacca tatgtgtatg tgaattttta aacaaacact tgcaaatacg cgactttagg 1800

gcaagtaaaa aatccaaaca aacctgtaat tgttaagttg gagaagaatc cctaagccta 1860

aaagcaactg cagcccgaga aatccaatcc cttgaaatgg tgtcaaaaga ccactggcga 1920

taggtcttag ttttgtacga tcaacctgga tataaaagaa atttgtaaga caacataatc 1980

taaaacaaaa caaccataca aaatcttgag ctttacatac aagcaaccca tctttgttta 2040

tggaagaatg aatccagtta catgaatgct gtgtatctac cctaactact aaacacatat 2100

ttcaatcgaa aaacatattc caccttcacc atatctaaca cctgaagtct ttcacttttt 2160

gaacgaagtc atcagaacat gcagataagc tattacccaa aacagagata tgactggaaa 2220

tgttgtcgta aattgatcca acatagaaaa atcaagacca gttccagatg tcaaagcaat 2280

aacactttcc caccatggtt acagaaacca tagttacaca aaacatgttt cctaaaccaa 2340

catactaaag ggatatataa atttgacatc actttatcac cataccataa gatagcttaa 2400

aaacaaactg acctttgtat ctatgtcctg atcaagcaga tcatttatag tacaaccagc 2460

acctctaaga agtaatgctc cgcaaccaaa taaagccata tatttaaaac ttggaaggct 2520

tccaggatca gcagccaacg caatcgacct atacaacaat gatggagatt cagagtatcg 2580

atctatttac atagctctgg aactagatcc atgacgaaac atggaacatc gttataatat 2640

ctaaagactt ccaaacagat tcctgagtaa gaaacccagt ggaactatag tactgtaaca 2700

tatataaaat caaagaaaac tcaggtttat agcattatcc aatcctgatt tctgccaatc 2760

cttaaccact ctcccatgct atcaaaaacc tcagctcaag atcatactac ctaattgcct 2820

atgagctctt gggaagatca ttatggattt gataactgaa aaaagtaaca gagaaatagc 2880

agactgcaag aactactcca aacttctcca ctgatatgta tgtagtctaa caataataaa 2940

cagacataaa ttcttttatc aagcttcaag agcaagttag tcagaaaaca tcacagccaa 3000

accaaccagg aaaacacata actttatcac ataaaactaa atttaatgta atctgactta 3060

acataaacca tcctttggga cgaaaggaaa ctatataaac atgcagtctt tctttccctc 3120

agctattctt tcggatggat tataatgaat ctcaaaagtg aaatgtcttg attctcagct 3180

acattactca aaggcgaaga taaacttacc acatacaagg ccacgcaagc aaccaagttc 3240

caatgggttt atccaatcga gcaagcttag cataacctct aacttcttct ggtaaataca 3300

aatctatcca agaagcttcc ttaacaacaa caccatcact cttctcctta tcatctttct 3360

tcggctttcc ctccaaaacc gaagaagacg acgacattcc acaaattaat ctgtaattcc 3420

aaccaacacc aaaaaacttc tcctgatgca attctcttcc tttactccat acttggtaat 3480

tatcattcca tgaaggataa cacttagtga aaggatttgt gtaatgggta gtcacaggat 3540

tggacaagga tttatgttgt gattgcaaaa gagcagagga agaagatgga gttacggaga 3600

cggaagattt caacaaccgt cttgaaacac gggagagccc aaaaaacgcc atctttgaga 3660

gaaattgttg cctggaagaa acaaagactt gagatttcaa acgtaagtga attcttacga 3720

acgaaagcta acttctcaag agaatcagat tagtgattcc tcaaaaacaa acaaaactat 3780

ctaatttcag tttcgagtga tgaagcctta agaatctaga acctccatgg cgtttctaat 3840

ctctcagaga taatcgaatt ccttaaacaa tcaaagctta gaaagagaag aacaacaaca 3900

acaacaaaaa aaatcagatt aacaaccgac cagagagcaa cgacgacgcc ggcgagaaag 3960

agcacgtcgt ctcggagcaa gacttcttct ccagtaaccc ggatggatcg ttaatgggcc 4020

tgtagattat tatatttggg ccgaaacaat tgggtcagca aaaacttggg ggataatgaa 4080

gaaacacgta cagtatgcat ttaggctcca aattaattgg ccatataatt cgaatcagat 4140

aaactaatca acccctacct tacttatttc tcactgtttt tatttctacc ttagtagttg 4200

aagaaacact tttatttatc ttttcgggac ccaaatttga taggatcggg ccattactca 4260

tgagcgtcag acacatatta gccttatcag attagtgggg taaggttttt ttaattcggt 4320

aagaagcaac aatcaatgtc ggagaaatta aagaatctgc atgggcgtgg cgtgatgata 4380

tgtgcatatg gagtcagttg ccgatcatat ataactattt ataaactaca tataaagact 4440

actaatagat 4450

<210>93

<211>2850

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>93

aattaaaatt tgagcggtct aaaccattag accgtttaga gatccctcca acccaaaata 60

gtcgattttc acgtcttgaa catatattgg gccttaatct gtgtggttag taaagacttt 120

tattggtcaa agaaaaacaa ccatggccca acatgttgat acttttattt aattatacaa 180

gtacccctga attctctgaa atatatttga ttgacccaga tattaatttt aattatcatt 240

tcctgtaaaa gtgaaggagt caccgtgact cgtcgtaatc tgaaaccaat ctgttcatat 300

gatgaagaag tttctctcgt tctcctccaa cgcgtagaaa attctgacgg cttaacgatg 360

tggcgaagat ctgttgttta tcgtttctct tcaagaatct ctgtttcttc ttcgttacca 420

aaccctagac tgattccttg gtcccgcgaa ttatgtgccg ttaatagctt ctcccagcct 480

ccggtctcga cggaatcaac tgctaagtta gggatcactg gtgttagatc tgatgccaat 540

cgagtttttg ccactgctac tgccgccgct acagctacag ctaccaccgg tgagatttcg 600

tctagagttg cggctttggc tggattaggg catcactacg ctcgttgtta ttgggagctt 660

tctaaagcta aacttaggta tgtgtttact tttcttttct catgaaaaat ctgaaaattt 720

ccaattgttg gattcttaaa ttctcatttg ttttatggtt gtagtatgct tgtggttgca 780

acttctggaa ctgggtatat tctgggtacg ggaaatgctg caattagctt cccggggctt 840

tgttacacat gtgcaggaac catgatgatt gctgcatctg ctaattcctt gaatcaggtc 900

attgaaatgt tgagaagttc ataaatttcg aatccttgtt gtgtttatgt agttgatctt 960

gcttgcttat gtttatgtag ttgaaaagtt taaaaatttc taatccttgg tagttgatct 1020

cgcttgtttg ttttttcatt ttctagattt ttgagataag caatgattct aagatgaaaa 1080

gaacgatgct aaggccattg ccttcaggac gtattagtgt tccacacgct gttgcatggg 1140

ctactattgc tggtgcttct ggtgcttgtt tgttggccag caaggtgaat gtttgttttt 1200

ttatatgtga tttctttgtt ttatgaatgg gtgattgaga gattatggat ctaaactttt 1260

gcttccacga caaggttatt gcagactaat atgttggctg ctggacttgc atctgccaat 1320

cttgtacttt atgcgtttgt ttatactccg ttgaagcaac ttcaccctat caatacatgg 1380

gttggcgctg ttgttggtgc tatcccaccc ttgcttgggt aaatttttgt tccttttctt 1440

ctttatttta gcagattctg ttttgttgga tactgctttt aattcaaaat gtagtcatgg 1500

ttcaccaatt ctatgcttat ctattttgtg tgttgtcagg tgggcggcag cgtctggtca 1560

gatttcatac aattcgatga ttcttccagc tgctctttac ttttggcaga tacctcattt 1620

tatggccctt gcacatctct gccgcaatga ttatgcagct ggagggtaag accatatggt 1680

gtcatatgag attagaatgt ctccttccat gtagtgttga tcttgaacta gttcaatttc 1740

gtggaatgat cagagtgtcc tagatagtgt cacagcagtc gacattttag tggctagata 1800

atgagttctt tccgttagag ataaacattc gcgaacattg tttccagctt ccgcgaccca 1860

acttctgatt ttgtttcttg gtaccttgtt ttcagttaca agatgttgtc actctttgat 1920

ccgtcaggga agagaatagc agcagtggct ctaaggaact gcttttacat gatccctctc 1980

ggtttcatcg cctatgactg tgagtcttgt agattcatct tttttttgta gtttattgac 2040

tgcattgctg tatctgattt ttgctgttcc ttccaatttt tgtgacaggg gggttaacct 2100

caagttggtt ttgcctcgaa tcaacacttc tcacactagc aatcgctgca acagcatttt 2160

cattctaccg agaccggacc atgcataaag caaggaaaat gttccatgcc agtcttctct 2220

tccttcctgt tttcatgtct ggtcttcttc tacaccgtgt ctctaatgat aatcagcaac 2280

aactcgtaga agaagccgga ttaacaaatt ctgtatctgg tgaagtcaaa actcagaggc 2340

gaaagaaacg tgtggctcaa cctccggtgg cttatgcctc tgctgcaccg tttcctttcc 2400

tcccagctcc ttccttctac tctccatgat aacctttaag caagctattg aatttttgga 2460

aacagaaatt aaaaaaaaaa tctgaaaagt tcttaagttt aatctttggt taataatgaa 2520

gtggagaacg catacaagtt tatgtatttt ttctcatctc cacataattg tattttttct 2580

ctaagtatgt ttcaaatgat acaaaataca tactttatca attatctgat caaattgatg 2640

aatttttgag ctttgacgtg ttaggtctat ctaataaacg tagtaacgaa tttggttttg 2700

gaaatgaaat ccgataaccg atgatggtgt agagttaaac gattaaaccg ggttggttaa 2760

aggtctcgag tctcgacggc tgcggaaatc ggaaaatcac gattgaggac tttgagctgc 2820

cacgaagatg gcgatgaggt tgaaatcaat 2850

<210>94

<211>3660

<212>DNA

<213>拟南芥属种(Arabidopsis sp)

<400>94

tatttgtatt tttattgtta aattttatga tttcacccgg tatatatcat cccatattaa 60

tattagattt attttttggg ctttatttgg gttttcgatt taaactgggc ccattctgct 120

tcaatgaaac cctaatgggt tttgtttggg ctttggattt aaaccgggcc cattctgctt 180

caatgaaggt cctttgtcca acaaaactaa catccgacac aactagtatt gccaagagga 240

tcgtgccaca tggcagttat tgaatcaaag gccgccaaaa ctgtaacgta gacattactt 300

atctccggta acggacaacc actcgtttcc cgaaacagca actcacagac tcacaccact 360

ccagtctccg gcttaactac caccagagac gattctctct tccgtcggtt ctatgacttc 420

gattctcaac actgtctcca ccatccactc ttccagagtt acctccgtcg atcgagtcgg 480

agtcctctct cttcggaatt cggattccgt tgagttcact cgccggcgtt ctggtttctc 540

gacgttgatc tacgaatcac ccggtagtta gcattctgtt ggatagattg atgaatgttt 600

tcttcgattt tttttttact gatcttgttg tggatctctc gtagggcgga gatttgttgt 660

gcgtgcggcg gagactgata ctgataaagg tatgattttt tagttgtttt tattttctct 720

ctcttcaaaa ttctcttttc aaacactgtg gcgtttgaat ttccgacggc agttaaatct 780

cagacacctg acaaggcacc agccggtggt tcaagcatta accagcttct cggtatcaaa 840

ggagcatctc aagaaactgt aattttgttc atctcctcag aatcttttaa attatcatat 900

ttgtggataa tgatgtgtta gtttaggaat tttcctacta aaggtaatct cttttgagga 960

caagtcttgt ttttagctta gaaatgatgt gaaaatgttg tttgttagct aaaaagagtt 1020

tgttgttata ttctgtattc agaataaatg gaagattcgt cttcagctta caaaaccagt 1080

cacttggcct ccactggttt ggggagtcgt ctgtggtgct gctgcttcag gtaatcatac 1140

gaacctcttt tggatcatgc aatactgtac agaaagtttt ttcattttcc ttccaattgt 1200

ttcttctggc agggaacttt cattggaccc cagaggatgt tgctaagtcg attctttgca 1260

tgatgatgtc tggtccttgt cttactggct atacacaggt ctggttttac acaacaaaaa 1320

gctgacttgt tcttattcta gtgcatttgc ttggtgctac aataacctag acttgtcgat 1380

ttccagacaa tcaacgactg gtatgataga gatatcgacg caattaatga gccatatcgt 1440

ccaattccat ctggagcaat atcagagcca gaggtaactg agacagaaca ttgtgagctt 1500

ttatctcttt tgtgattctg atttctcctt actccttaaa atgcaggtta ttacacaagt 1560

ctgggtgcta ttattgggag gtcttggtat tgctggaata ttagatgtgt gggtaagttg 1620

gcccttctga cattaactag tacagttaaa gggcacatca gatttgctaa aatcttccct 1680

tatcaggcag ggcataccac tcccactgtc ttctatcttg ctttgggagg atcattgcta 1740

tcttatatat actctgctcc acctcttaag gtaagtttta ttcctaactt ccactctcta 1800

gtgataagac actccatcca agttttggag ttttgaatat cgatatctga actgatctca 1860

ttgcagctaa aacaaaatgg atgggttgga aattttgcac ttggagcaag ctatattagt 1920

ttgccatggt aagatatctc gtgtatcaat aatatatggc gttgttctca tctcattgat 1980

ttgtttcttg ctcacttgac tgataggtgg gctggccaag cattgtttgg cactcttacg 2040

ccagatgttg ttgttctaac actcttgtac agcatagctg gggtactctt ttggcaaacc 2100

ttttatgttg cttttttcgt tatctgttgt aatatgctct tgcttcatgt tgtacctttg 2160

tgataatgca gttaggaata gccattgtta acgacttcaa aagtgttgaa ggagatagag 2220

cattaggact tcagtctctc ccagtagctt ttggcaccga aactgcaaaa tggatatgcg 2280

ttggtgctat agacattact cagctttctg ttgccggtat gtactatcca ctgtttttgt 2340

gcagctgtgg cttctatttc ttttccttga tcttatcaac tggatattca ccaatggtaa 2400

agcacaaatt aatgaagctg aatcaacaaa ggcaaaacat aaaagtacat tctaatgaaa 2460

tgagctaatg aagaggaggc atctactttt atgtttcatt agtgtgattg atggattttc 2520

atttcatgct tctaaaacaa gtattttcaa cagtgtcatg aaataacaga acttatatct 2580

tcatttgtac ttttactagt ggatgagtta cacaatcatt gttatagaac caaatcaaag 2640

gtagagatca tcattagtat atgtctattt tggttgcagg atatctatta gcatctggga 2700

aaccttatta tgcgttggcg ttggttgctt tgatcattcc tcagattgtg ttccaggtaa 2760

agacgttaac agtctcacat tataattaat caaattcttg tcactcgtct gattgctaca 2820

ctcgcttcta taaactgcag tttaaatact ttctcaagga ccctgtcaaa tacgacgtca 2880

agtaccaggt aagtcaactt agtacacatg tttgtgttct tttgaaatat ctttgagagg 2940

tctcttaatc agaagttgct tgaaacactc atcttgatta caggcaagcg cgcagccatt 3000

cttggtgctc ggaatatttg taacggcatt agcatcgcaa cactgaaaaa ggcgtatttt 3060

gatggggttt tgtcgaaagc agaggtgttg acacatcaaa tgtgggcaag tgatggcatc 3120

aactagttta aaagattttg taaaatgtat gtaccgttat tactagaaac aactcctgtt 3180

gtatcaattt agcaaaacgg ctgagaaatt gtaattgatg ttaccgtatt tgcgctccat 3240

ttttgcattt cctgctcata tcgaggattg gggtttatgt tagttctgtc acttctctgc 3300

tttcagaatg tttttgtttt ctgtagtgga ttttaactat tttcatcact ttttgtattg 3360

attctaaaca tgtatccaca taaaaacagt aatatacaaa aatgatactt cctcaaactt 3420

tttataatct aaatctaaca actagctagt aacccaacta acttcataca attaatttga 3480

gaaactacaa agactagact atacatatgt tatttaacaa cttgaaactg tgttattact 3540

acctgatttt tttctattct acagccattt gatatgctgc aatcttaaca tatcaagtct 3600

cacgttgttg gacacaacat actatcacaa gtaagacacg aagtaaaacc aaccggcaac 3660

Claims

1.一种编码异戊烯转移酶的分离的核酸序列，其中所述异戊烯转移酶异戊烯化尿黑酸，且其中所述核酸序列编码具有如SEQ ID NO：2所示序列的多肽。

2.如权利要求1中所述的分离的核酸序列，其中所述异戊烯转移酶被SEQ ID NO：1所表示的序列编码。

3.一种编码异戊烯转移酶的分离的核酸序列，其中所述异戊烯转移酶异戊烯转移酶异戊烯化尿黑酸，并来自于拟南芥属，且其中所述的核酸序列编码具有如SEQ ID NO：2所示序列的多肽。

4.一种核酸构建体，包含作为有效结合组分的宿主细胞中的功能性转录起始区、编码异戊烯转移酶的核酸序列，其中所述异戊烯转移酶异戊烯化尿黑酸，且其中所述核酸序列编码具有如SEQ ID NO：2所示序列的多肽。

5.一种包括权利要求4所述的构建体的宿主细胞。

6.如权利要求4中所述的宿主细胞，其中所述宿主细胞是植物细胞。