编码参与生育酚合成的蛋白质的核酸序列
引言
本申请要求美国在先申请60/129,899(1999年4月15日提交)和美国在先申请60/146,461(1999年7月30日提交)的优先权。
技术领域
本发明涉及核酸与氨基酸的序列和构建体,及其相关方法。
背景
类异戊二烯类化合物广泛地存在于所有生物体中。植物合成多种系列的类异戊二烯类化合物,超过22,000种之多(Connolly和Hill(1992)Dictionary of Terpenoids,champman and Hall,New York,NY)。在植物中,类异戊二烯类化合物在特定的细胞功能诸如固醇的生成中起重要作用,促成真核细胞膜的构造以及存在于泛醌和质体醌、生长调节剂(如脱落酸、赤霉素、油菜素类固醇)或光合色素叶绿素和类胡萝卜素的开链聚异戊二烯化合物的侧链。尽管其它的植物性类异戊二烯类化合物的生理作用(比如,多种系列的次级代谢产物的生理作用)并不明显,但是已知有些类异戊二烯类化合物在介导对不同的环境挑战的适应性反应中起关键作用。尽管类异戊二烯类化合物的结构和功能具有显著的多样性,但是它们都源自单一种代谢前体,即异戊烯二磷酸(IPP)(Wright,(1961)Annu.Rev.Biochem.20:525-548;以及Spurgeon和Porter,(1981)Biosynthesis ofIsoprenoid Compounds.,Porter和Spurgeon编辑(John Wiley,NewYork)第1卷,1-46页)。
在高等植物的叶绿体中,存在着源自类异戊二烯途径的若干独特和相互关联的生化途径,它们导致次级代谢产物(包括生育酚)的生成。生育酚不仅在植物中起着至关重要的作用,而且从哺乳动物的营养角度来看也是重要的。在质体中,生育酚占总醌库的量达到40%
生育酚和生育三烯酚(不饱和生育酚的衍生物)是众所周知的抗氧化剂,在保护细胞免受自由基损害以及预防多种疾病(包括心脏病、癌症、白内障、视网膜病、早老性痴呆和神经变性)中起重要的作用,而且已经表明它们对关节炎症状以及在抗衰老中具有有益的效应。维生素E被用于鸡饲料中,以提高鸡肉的货架寿命、外观、香味和氧化稳定性,以及将母育酚从饲料转移到鸡蛋中。已经表明,维生素E对家畜动物的正常生育是必需的,并改善家畜动物的总体表现和增强其免疫力。在动物饲料中补充维生素E还可赋予奶制品氧化稳定性。
天然生育酚作为补充物,在过去的三年里,对其需求一直在以10-20%的速度稳定地增长。目前,对天然生育酚的需求超过了供给,已知天然生育酚的生物活性,高于合成得到的生育酚的外消旋混合物。天然生育酚都是d-立体异构体,而合成α-生育酚是八种d,1-α-生育酚异构体的混合物,只有其中的一种(占12.5%)与天然d-α-生育酚完全相同。天然d-α-生育酚,与其它天然生育酚或生育三烯酚相比,具有最高的维生素E活性(1.49IU/mg)。合成α-生育酚的维生素E活性为1.1IU/mg。1995年,世界市场对生育酚精制原料的需求为10.2亿美元;其中合成物质占市场的85-88%,剩下的12-15%为天然物质。天然生育酚和生育三烯酚的最佳来源物为植物油和谷类产品。当前,大部分的天然维生素E是产自γ-生育酚,而γ-生育酚又出自豆油加工,随后通过化学修饰可将其转化为α-生育酚(α-生育酚表现出最高的生物活性)。
不通过化学修饰而提高植物中生育酚和生育三烯酚(特别是那些能够直接使用的更希望得到的化合物)水平的方法,将有助于本领域,这是由于这些分子表现出更好的功能性和生物可利用性。。
另外,希望得到这样的方法,其可增加宿主植物细胞中其它类异戊二烯衍生化合物的产量。而且,还需要在宿主植物细胞中产生特定的类异戊二烯化合物的方法。
发明概述
本发明涉及异戊烯转移酶(PT),更具体地,涉及PT的多核苷酸和多肽。本发明的多核苷酸和多肽包括源自真核细胞来源物的那些多核苷酸和多肽。
因而,本发明的一个方面涉及编码异戊烯转移酶蛋白质的分离的多核苷酸序列。更具体地,本发明提供了编码来自细菌和植物源的PT蛋白质的分离的核酸序列。
本发明的另一方面涉及一些寡聚核苷酸,包括部分或全部PT编码序列。
本发明的又一个方面提供了可用于转录或者转录及翻译(表达)异戊烯转移酶的重组DNA构建体。更具体地,本发明提供了能够在宿主细胞中转录或者转录及翻译的构建体。
在本发明的另一个方面中,提供了在宿主细胞或其后代中产生异戊烯转移酶的方法。更具体地,用可以用于转录或者转录及翻译异戊烯转移酶的DNA构建体对宿主细胞进行了转化或转染。含有异戊烯转移酶的重组细胞也是本发明的一部分。
另一方面,本发明涉及使用多核苷酸和多肽序列改变宿主细胞(尤其是宿主植物细胞)中的生育酚含量的方法。在本文中还构思了含有如此改变的生育酚含量的植物细胞。
通过表达异戊烯转移酶而得到的被修饰的植物、种子和油也被认为是本发明的一部分。
附图的简要说明
图1.提供了排列于ATPT2、ATPT3、ATPT4、ATPT8和ATPT12之间的氨基酸序列,通过Clustal W分析得到。
图2提供了表达构建体pCGN10800的示意图。
图3提供了表达构建体pCGN10801的示意图。
图4提供了表达构建体pCGN10803的示意图。
图5提供了表达构建体pCGN10806的示意图。
图6提供了表达构建体pCGN10807的示意图。
图7提供了表达构建体pCGN10808的示意图。
图8提供了表达构建体pCGN10809的示意图。
图9提供了表达构建体pCGN108010的示意图。
图10提供了表达构建体pCGN10811的示意图。
图11提供了表达构建体pCGN10812的示意图。
图12提供了表达构建体pCGN10813的示意图。
图13提供了表达构建体pCGN10814的示意图。
图14提供了表达构建体pCGN10815的示意图。
图15提供了表达构建体pCGN10816的示意图。
图16提供了表达构建体pCGN10817的示意图。
图17提供了表达构建体pCGN10819的示意图。
图18提供了表达构建体pCGN10824的示意图。
图19提供了表达构建体pCGN10825的示意图。
图20提供了表达构建体pCGN10826的示意图。
图21给出了Clustal W分析得到的集胞蓝细菌属(Synchocystis)序列敲除间的氨基酸序列排列。
图22给出了拟南芥属中ATPT2、ATPT3、ATPT4、ATPT8和ATPT12蛋白序列的氨基酸序列,以及集胞蓝细菌属中slr1736、slr0926、sll1899、slr0056和slr1518氨基酸序列。
图23给出了野生型集胞蓝细菌属菌株6803和集胞蓝细菌属slr1736敲除的集胞蓝细菌属制备物的酶分析结果。
图24给出了包含pCGN10822的转基因拟南芥属种子提取物HPLC分析资料的条线图,pCGN10822提供了从napin启动子起始向有义方向的ATPT2序列的表达。给出了α-,γ-,及δ-生育酚的图谱,同时也给出了22种转化细胞、一种非转化(野生型)对照组的总生育酚图谱。
图25给出了用pCGN10803(35S-ATPT2,向反义方向)、pCGN10802(1625行,napin ATPT2向有义方向)、pCGN10809(1627行,35S-ATPT3向有义方向)转化的植物拟南芥属种子提取物的HPLC分析条线图,同时也给出了非转化(野生型)对照组及经空载体转化对照组的图谱。
发明的详细描述
本发明尤其提供了改变(如增加和减少)生育酚水平和/或调整其在宿主细胞内含量的组成和方法。本发明特别提供了多核苷酸、多肽和在宿主植物细胞中调整生育酚含量的方法。
本发明提供了参与直链和芳香基化合物异戊烯化的多聚核苷酸及多肽序列。本文所用的直链异戊烯基转移酶包括编码参与直链化合物异戊烯化的蛋白质序列,该直链化合物包括但不局限于牻牛儿牻牛儿焦磷酸和法尼基焦磷酸。本文所用的芳香基异戊烯基转移酶包括编码参与芳香基化合物异戊烯化的蛋白质序列,该芳香基化合物包括但不局限于甲基萘醌、泛醌、叶绿素及尿黑酸。本发明中的异戊烯基转移酶优选尿黑酸的异戊烯化的蛋白质序列。
高等植物中α-生育酚的生物合成涉及到尿黑酸和叶绿基焦磷酸缩合形成2-甲基-6叶绿基苯醌,其可以通过环化和随后的甲基化形成多种生育酚(Fiedler等,1982,Planta,155:511-515,Soll等,1980,Arch,Biochem.Biophys.204:544-550,Marshall等,1985,Phytochem.,24:1705-1711,这些文献的全部内容在此引入作为参考)。Norniset等鉴定和描述了,拟南芥属dps2突变在生育酚和质体醌-9的积聚物中是不存在的。进一步的遗传学和生物化学分析显示PDS2编码的蛋白质是造成尿黑酸异戊烯化的原因,这在生育酚合成中可能是限速步骤,该基因现在仍未被分离。因此,本发明的一个方面是提供参与尿黑酸异戊烯化的多聚核苷酸和多肽。
分离的多聚核苷酸和多肽
本发明的第一个方面涉及分离的异戊烯基转移酶多核苷酸,该多核苷酸包括编码本发明多肽的多核苷酸,这些多肽具有选自序列表列出的推定氨基酸序列。本发明还涉及其它与这些多核苷酸序列及其变异体紧密相关的多核苷酸序列。
本发明提供了一种多核苷酸序列,其整个序列与在序列表中列出的每个编码序列完全相同。本发明还提供了成熟多肽或其片段的编码序列,以及与其它编码序列诸如那些编码导肽或分泌序列、前-、原-或前原-蛋白质序列处于同一读框中的成熟多肽或其片段的编码序列。该多核苷酸还可包含非编码序列,例如包括但不限于非编码的5’和3’序列,诸如转录但不翻译的序列、终止信号、核糖体结合位点、稳定mRNA的序列、内含子、多腺苷酸化信号和编码所添加氨基酸的添加编码序列。例如,可以将一个标记序列包括在内,以促进融合多肽的纯化。本发明的多核苷酸还包括含有结构基因和控制基因表达的天然结合序列的多核苷酸。
本发明还包括下式的多核苷酸:
X-(R1)n-(R2)-(R3)n-Y
其中,位于5’末端的X是氢,位于3’末端的Y是氢或金属,R1和R3为任何核酸残基,n是一个介于1-3000之间的整数(优选介于1-1000之间),R2是本发明的核酸序列,尤其是选自序列表列出的核酸序列并优选SEQ ID NOs:1、3、5、7、8、10、11、13-16、18、23、29、36和38中的那些核酸序列。在上式中,R2是有方向性的,其5’末端残基位于左边,结合于R1,而其3’末端残基位于右边,结合于R3。通过每组R(R大于1)表示的任何核酸残基片段,可以是杂聚物,也可以是均聚物,优选为杂聚物。
本发明还涉及本文所述的多核苷酸的变异体,它们编码本发明的多肽的变异体。那些本发明的多核苷酸片段的变异体,可被用于合成本发明的全长多核苷酸。优选的实施方案为编码多肽变异体的多核苷酸,其中对本发明的多肽序列的5-10,1-5,1-3,2,1或无氨基酸残基被以任何组合替代、添加或缺失。特别优选沉默的替代、添加和缺失,因为它们不会改变该多核苷酸或多肽的性能或活性。
本发明的进一步优选的实施方案为:在多核苷酸全长内与编码本发明多肽的多核苷酸有至少50%、60%或70%相同性的多核苷酸,以及与这种多核苷酸互补的多核苷酸。更优选含有其全长与编码本发明多肽的多核苷酸及其互补多核苷酸有至少80%相同性的区域的多核苷酸。在这一点上,尤其优选其全长与编码本发明多肽的多核苷酸及其互补多核苷酸有至少90%相同性,特别优选那些有至少95%相同性的多核苷酸序列。进一步地,非常优选那些有至少97%相同性的多核苷酸序列,而且尤其非常优选那些有至少98%和99%相同性的多核苷酸序列,其中最优选那些有至少99%相同性的多核苷酸序列。
优选的实施方案为这样的多核苷酸,它们所编码的多肽基本上保留了与成熟多肽(由序列表中列出的多核苷酸编码)相同的生物学功能或活性。
本发明进一步涉及可与上述序列杂交的多核苷酸。更具体地,本发明涉及在严格条件下可与上述多核苷酸杂交的多核苷酸。本文所用的术语“严格条件”和“严格杂交条件”是指在序列间具有至少95%(优选至少97%)相同性的情况下,一般会发生杂交反应。严格杂交条件的一个例子是,在含有50%甲酰胺、5×SSC(150mM NaCl,15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardt’s溶液、10%硫酸葡聚糖和20毫克/毫升变性剪切鲑精DNA的溶液中,在42℃温育过夜,随后在0.1×SSC中于大约65℃冲洗杂交载体。其它的杂交和冲洗条件是公知的,并且在Sambrook等人的分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual),Cold SpringHarbor,NY(1989)第二版,尤其是第11章中有例子。
本发明还提供一种基本上由一种多核苷酸序列组成的多核苷酸,这样的多核苷酸可如此获得:在严格杂交条件下,用在多核苷酸序列表中列出的多核苷酸序列或其片段序列作为探针,筛选含有该种多核苷酸序列的完整基因的合适的文库;然后分离所述的核苷酸序列。用于获得这样一种多核苷酸的片段包括例如本文中所述的探针和引物。
正如本文所讨论的关于本发明的多核苷酸测定法,例如,本发明的多核苷酸可被用作RNA、cDNA或基因组DNA的杂交探针,以分离全长cDNA或编码多肽的基因组克隆,以及分离与序列表中列出的多核苷酸具有高度序列相似性的其它基因的cDNA或基因组克隆。这样的探针一般含有至少15个碱基。优选地,这样的探针具有至少30个碱基并可以具有至少50个碱基。尤其优选的探针将具有30-50个碱基,其中包括30和50个在内。
含有或含于序列表中列出的多核苷酸序列的每一种基因,其编码区可以利用序列表中提供的DNA序列筛选,以合成寡核苷酸探针。然后,使用与本发明的基因的序列具有序列互补性的标记寡核苷酸,对cDNA、基因组DNA或mRNA的文库进行筛选,以鉴定可与探针杂交的文库中的成员。例如,制备与异戊烯基转移酶EST序列相应的合成的寡核苷酸。以寡核苷酸为引物,以聚合酶链式反应(PCR)技术获得异戊烯基转移酶基因的5’端和3’端序列。或者,在可以根据特定的异戊烯基转移酶肽制备出低简并性寡核苷酸的情况下,也可以将这样的探针直接用于筛选基因文库,以获得异戊烯基转移酶基因序列。尤其是,筛选噬菌体载体中的cDNA文库有助于这种方法,因为杂交的背景较低。
一般地,使用核酸探针所获得的异戊烯基转移酶序列显示出,靶异戊烯基转移酶序列与用作探针的编码序列之间60-70%的序列相同。但是,也可以获得低至50-60%序列相同性的长序列。核酸探针可以是长的核酸序列片段,也可以是较短的寡核苷酸探针。当使用较长的核酸片段作为探针时(大于大约100bp),为了从靶样品中获得与探针序列具有20-50%偏差(即,50-80%的序列相同性)的序列,在进行筛选时可以将杂交的严格性降低。寡核苷酸探针可以比编码异戊烯基转移酶的完整核酸序列短许多,但至少也应该为大约10个,优选至少为大约15个,更优选至少为大约20个核苷酸。当使用较短的区域作探针时,与较长的区域相比,希望能达到更高的序列相同性程度。因此,希望鉴定出高度保守的氨基酸序列区,以设计寡核苷酸探针,用于探测和回收其它相关的异戊烯基转移酶基因。较短的探针对于聚合酶链式反应(PCR)常常特别有用,并且在可以鉴定出高度保守序列的情况下尤其如此(参见Gould等。,PNAS USA(1989)86:1934-1938)。
本发明的另一方面涉及异戊烯基转移酶多肽。这种多肽包括:在序列表中列出的分离的多肽及其多肽和片段,尤其是那些显示异戊烯基转移酶活性并且与从序列表所列序列中选出的多肽序列具有至少50%、60%或70%,优选至少80%,更优选至少90%,最优选至少95%相同性的多肽,还包括这些多肽的组成部分,其中多肽的组成部分优选包含至少30个氨基酸,更优选包含至少50个氨基酸。
“相同性”,正如本领域所熟知的,是两种或更多种多肽序列间或者两种或更多种多核苷酸序列间的相互关系,其可通过比较这些序列而确定。在本领域中,“相同性”也指多肽或多核苷酸序列间的序列相关性程度,其可通过对这些序列一串串地进行比对而确定。“相同性”可以容易地通过已知的方法计算出,这些方法包括但不限于:在Computational Molecular Biology,Lesk,A.M.编辑,牛津大学出版社,纽约,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.编辑,Academic Press,纽约,1993;Computer Analysis ofSequence Data,Part I,Griffin,A.M.和Griffin,H.G.编辑,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;Sequence Analysis Primers,Gribscov,M.和Devereux,J.编辑,Stockton Press,纽约,(1991);以及Carillo,H.和Lipman,D.,SIAM J Applied Math.,48:1073(1988)中描述的那些方法。在设计确定相同性的方法时,目的就是给出待测试序列间的最大匹配。而且,确定相同性的方法被编写在可公开获得的程序中。可用于确定两种序列间相同性的电脑程序包括但不限于:GCG(Devereux,J.等,Nucleic Acids Research,12(1):387(1984));一组五个BLAST的程序,其中的三个用于核酸序列查询(BLASTN、BLASTX和TBLASTX),两个用于蛋白质序列查询(BLASTP和TBLASTN)(Coulson,Trends in Biotechnolgy,12:76-80(1994);Birren等,Genome Analysis,1:543-559(1997))。BLAST X程序可以从NCBI和其它途径公开获得(BLAST Manual,Altschul,S.等,NCBI NLM NIH,Bethesda,MD 20894;Altschul,S.等,J.Mol.Biol,215:403-410(1990))。公知知的SmithWaterman算法也可用于确定相同性。
多肽序列比较参数一般包括:
算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970)
比较矩阵:BLOSSUM62,来自Hentikoff和Hentikoff,Proc.Natl.Acad.Sci USA 89:10915-10919(1992)
空位处罚分:12
空位长度处罚分:4
能够采用这些参数的一个程序,可从Genetics Computer Group,Madison,Wisconsin公开获得,这个程序被称为“空位”程序。上述参数,连同对末端空位没有处罚分,就是进行肽比较的缺省设置参数。
多核苷酸序列比较的参数包括:
算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970)
比较矩阵:匹配=+10,错配=0
空位处罚分:50
空位长度处罚分:3
能够采用这些参数的一个程序,可从Genetics Computer Group,Madison,Wisconsin公开获得,这个程序被称为“空位”程序。上述参数就是进行核酸比较的缺省设置参数。
本发明还包括下式的多肽:
X-(R1)n-(R2)-(R3)n-Y
其中,位于氨基末端的X是氢,位于羧基末端的Y是氢或金属,R1和R3为任何氨基酸残基,n是一个介于1-1000之间的整数,R2是本发明的氨基酸序列,尤其是选自序列表中列出的氨基酸序列,优选在SEQ ID NO:2、4、6、9、12、17、19-22、24-28、30、32-37和39中提供的序列编码的那些氨基酸序列。在上式中,R2是有方向性的,其氨基末端残基位于左边,结合于R1,而其羧基末端残基位于右边,结合于R3。用一组R(R大于1)表示的任何氨基酸残基片段,可以是杂聚物,也可以是均聚物,优选为杂聚物。
本发明的多肽包括由多核苷酸编码的分离的多肽,其中的多核苷酸含有选自本文序列表中列出的序列。
本发明的多肽可以是成熟的蛋白质或者可以是融合蛋白质的一部分。
这些多肽的片段和变异体也被认为是本发明的一部分。一个片段就是一个变异体多肽,它所具有的氨基酸序列与前面描述的多肽的氨基酸序列的一部分而不是全部完全相同。这些片段可以独立存在,也可以含于一个更大的多肽中,其中该片段形成一部分或一个区域,最优选是形成单一连续区域。优选的片段为具有生物学活性的片段,它们可以介导本发明多肽的活性,其中包括那些具有相似活性或提高活性或降低活性的片段。本发明还包括那些在动物尤其是人中具有抗原性或免疫原性的片段。
这些多肽的变异体还包括与序列表中列出的序列不同的多肽,这些不同是由保守氨基酸的取代产生的,即一个氨基酸残基被另一个具有相似性质的氨基酸残基取代。一般地,这中取代发生在Ala、Val、Leu和Ile之间,Ser和Thr之间,Asp和Glu之间,Asn和Gln之间,Lys和Arg之间,或Phe和Tyr之间。尤其优选其中5-10、1-5、1-3个或者1个氨基酸被以任何组合取代、缺失或添加的变异体。
那些是本发明多肽片段的变异体,通过肽合成可用于产生相应的全长多肽。因而,可将这些变异体用作生成本发明的全长多肽的中间体。
本发明的多核苷酸和多肽可用于,例如,转化宿主细胞诸如植物宿主细胞,正如本文所进一步讨论的。
本发明还提供了编码多肽的多核苷酸,其中的多肽为成熟蛋白质再加上添加的氨基或羧基末端氨基酸,或者成熟的多肽中的氨基酸(例如,当蛋白质的成熟形式具有多于一个多肽链时)。这种序列可以,例如,在蛋白质从前体到成熟形式的转变加工中起作用,帮助蛋白质转运,缩短或延长蛋白质半寿期,或者在蛋白质的测定或生产中简化操作。预期可使用胞内酶从成熟的蛋白质中除去任何添加的氨基酸。
具有融合到一种或多种前序列(prosequence)的成熟形式的多肽的前体蛋白质,可能是该多肽的无活性形式。一般地,当前序列被除去时,无活性前体被激活。在激活之前可以将一部分或者全部前序列除去。这种前体蛋白质一般称为前蛋白质。
植物构建及应用方法
我们尤其感兴趣的是将核苷酸序列用于重组DNA构建体,以指导本发明的异戊烯基转移酶序列在宿主细胞中的转录或转录及翻译(表达)。表达构建体一般含有宿主细胞中的功能性启动子,该启动子有效地连接到本发明的编码异戊烯基转移酶的核酸序列,还含有宿主细胞中的功能性转录终止区。
当序列的排列方式使得第一种核酸序列影响到第二种核酸序列的功能时,这两种核酸序列就是“有效地连接”或“有效地结合”。优选地,这两种序列是单一连续核酸分子的一部分,更优选地,这两种序列相邻。例如,如果一个启动子调节或介导一个基因在细胞中的转录,那么,所述启动子就与所述基因进行了有效地连接。
本领域的技术人员会认识到,在植物细胞中有许多功能性启动子,并且已在文献中对它们进行了描述。还展望了叶绿体和质体特异性启动子、叶绿体或质体中功能性启动子,以及在叶绿体或质体中有效的启动子。
一组植物功能性启动子为组成型启动子如CaMV35S或FMV35S启动子,它们在大多数植物器官中产生高水平的表达。已将CaMV35S和FMV35S启动子的增强或复制版本用于本发明的实践中(Odell等人,1985,Nature,313:810-812;Rogers,美国专利第5,378,619号)。另外,可优选让异戊烯基转移酶基因在植物的特定组织(如叶、茎、根、块茎、种子、果实等)中表达,并且所选择的启动子应具有所需要的组织和发育特异性。
尤其感兴趣的是,使本发明的核酸序列从转录起始区开始表达,并优先在植物种子组织中表达。这种优先在种子中转录起始的序列例子包括那些源自编码植物储藏蛋白质基因序列或者油料种子中参与脂肪酸生物合成的基因的序列。这种启动子的例子包括来自诸如napin(Kirdl等,Seed Sci.Res.,1:209-219(1991))、菜豆蛋白、玉米醇溶蛋白、大豆胰蛋白酶抑制剂、ACP、硬脂酰-ACP去饱和酶、大豆β-conglycin的α’亚单位(大豆7s,(Chen等Proc.Natl.Acad.Sci.,83:8560-8564(1986)))和油质蛋白的基因的5’调节区。
指导具有异戊烯基转移酶的蛋白质定位于特定的亚细胞区室例如线粒体、内质网、液泡、叶绿体或其它质体区室中,也许是有益的。例如,当将本发明的目的基因靶向质体诸如叶绿体以表达时,构建体也要使用指导基因至质体的序列。这种序列在本文中称为叶绿体转运肽(CTP)或质体转运肽(PTP)。这样,在没有将目的基因直接***到质体中的情况下,表达构建体将另外含有编码转运肽的基因,从而指导目的基因至质体。叶绿体转运肽可以是源自目的基因,也可以是源自具有CTP的异种序列。这种转运肽在本领域中是公知的。参见例如,Von Heijne等(1991)Plant Mol.Boil.Rep.9:104-126;Clark等(1989)J.Biol.Chem.264:17544-17550;della-Cioppa等(1987)PlantPhysiol.84:965-968;Romer等(1993)Biochem.Biophys.Res Commun.196:1414-1421;和Shah等(1986)Science 233:478-481。
根据目的用途,构建体可以含有编码整个异戊烯基转移酶蛋白质或其一个组成部分的核酸序列。例如,当需要反义抑制给定的异戊烯基转移酶蛋白质时,就不需要完整的异戊烯基转移酶序列。而且,当用于构建体中的异戊烯基转移酶序列是旨在用作探针时,则制备只含有异戊烯基转移酶编码序列的特定组成部分(例如,被发现是编码高度保守的异戊烯基转移酶区的序列)的构建体可能是有益的。
技术人员会认识到,用于抑制内源序列在宿主细胞中表达的方法有许多。这些方法包括但不限于反义抑制(Smith等(1988)Nature,334:724-726)、共抑制(Napoli等(1989)Plant Cell,2:279-289)、核酶(PCT公开说明书,WO 97/10328)以及有义与反义的组合(Waterhouse等(1998),Proc.Natl.Acad.Sci.USA 95:13959-13964)。在宿主细胞中抑制内源序列的方法一般使用了转录或转录及翻译至少一部分待抑制序列。这种序列可以与内源序列的编码区同源,也可以与内源序列的非编码区同源。
本发明的植物表达构建体也可以提供调节转录本的终止区。转录本的终止区可以由编码异戊烯基转移酶的DNA序列提供,或者由不同基因来源的方便的转录终止区提供,例如,与转录本起始区天然结合的转录本终止区。技术人员会认识到,任何能够在植物细胞中终止转录的方便的转录本终止区,都可以在本发明的构建体中予以采用。
或者,也可以将构建体制备为可以指导异戊烯基转移酶序列直接从宿主植物细胞的质体表达。这种构建体和方法为本领域所公知,并一般描述于,例如Svab等(1990)Proc.Natl.Acsd.Sci.USA 87:8526-8530和Svab和Maliga(1993)Proc.Natl.Acsd.Sci.USA 90:913-917以及美国专利第5,693,507号。
本发明中的异戊烯基转移酶构建体可以与另外的构建体一起在转化方法中使用,该另外的构建体提供编码参与生产生育酚或生育酚前体(如:同源酸和/或叶绿基焦磷酸)蛋白质的核苷酸序列的表达。参与生产尿黑酸的蛋白质的核苷酸序列在本领域中是公知的,它包括但不局限于4-羟苯基丙酮酸双加氧酶(HPPD,ECl.13.11.27,如在Garcia等(1984)J.Mol.Biol.180:1023-1051中所述)、单一或双官能tyrA(如Xia等(1992)J.Gen Microbiol.138:1309-1316,以及Hudson.等(1984)J.Mol.Biol.180:1023-1051中所述)加氧酶、4-羟苯基丙酮酸二(9Cl),4-羟苯基丙酮酸双加氧酶、对-4-羟苯基丙酮酸双加氧酶、对-4-羟苯基丙酮酸羟化酶、对-4-羟苯基丙酮酸氧化酶、对-4-羟苯基丙酮酸羟化酶、对-4-羟苯基丙酮酸氧化酶、4-羟苯基乙酸,NAD(P)H:氧化还原酶(1-羟基化)、4-羟苯基乙酸1-一加氧酶等。另外,编码参与生产叶绿基焦磷酸蛋白质的核酸序列的表达构建体也可以与本发明中的异戊烯基转移酶构建体一起使用。编码参与生产叶绿基焦磷酸蛋白质的核酸序列在本领域中是公知的,它包括但不局限于牻牛儿牻牛儿焦磷酸合酶(GGPPS),牻牛儿牻牛儿焦磷酸还原酶(GGH),1-脱氧木酮糖5-磷酸合酶,1-脱氧-D-木糖-5-磷酸盐还原异构酶、4-二磷酸胞苷-2-C-甲基赤藓糖醇合酶、异戊基焦磷酸异构酶。
本发明中的异戊烯基转移酶序列可以用于制备转化构建体,该构建体含有一个二级表达盒来表达参与生育酚生物合成的其它序列。本发明中令人感兴趣的另外的参与生育酚生物合成的序列包括但不局限于γ生育酚甲基化转移酶(Shintani等(1998)Science 282(5396):2098-2100)、生育酚环化酶和生育酚甲基化酶。
当将含有表达构建体的重组DNA构建体引入到植物的细胞、组织、器官中或植物中时,我们就认为植物的细胞、组织、器官或植物已被转化、转染或转基因。转基因或转化的细胞或植物也包括细胞或植物的子代,以及由育种项目而产生的子代,该育种项目在杂交试验中采用这样的转基因植物作为亲代,并且这些子代由于异戊烯基转移酶核酸序列的存在而表现出变化的表型。
具有异戊烯基转移酶并作为提高或减低其表达的目的DNA序列的植物表达或转录型构建体,可用于广泛多种植物生命体中,尤其是参与生成食用或工业用途的植物油的植物生命体。用于本发明方法的尤其优选的植物包括但不限于:金合欢、苜蓿、茴香树、苹果树、杏树、洋蓟、芝麻菜、石刁柏、鳄梨树、芭蕉属植物、大麦、豆科植物、甜菜、黑莓、乌饭树、嫩茎花椰菜、球芽甘蓝、卷心菜、canola、罗马甜瓜、胡萝卜、木薯、花椰菜、芹菜、樱桃树、菊苣属植物、芫荽叶、柑橘属植物、克莱门氏小柑橘、咖啡树、玉米、棉花、黄瓜、Douglas冷杉、茄子、苣荬菜、escarole、桉树属植物、茴香、无花果属植物、大蒜、葫芦属植物、葡萄、葡萄柚、加甜味烟草、凉薯、kiwifruit、莴苣、韭葱、柠檬树、酸橙、火炬松、芒果、甜瓜、菌类植物、油桃、坚果、燕麦属植物、油棕榈、菜籽油油菜、秋葵荚、洋葱、柑桔、一种装饰性植物、番木瓜树、欧芹、豌豆、桃树、花生、梨树、胡椒属植物、柿树、松树、菠萝、车前草、李属植物、石榴树、杨属植物、马铃薯、南瓜、温柏树、放射状松树、菊苣、小萝卜、木莓、水稻、黑麦、高粱、美国长叶松、大豆、菠菜、南瓜、草莓、糖甜菜、甘蔗、向日葵、白薯、枫香属植物、红橘树、茶树、烟草、西红柿、黑小麦、草皮、芜菁、一种葡萄树、西瓜、小麦、薯蓣属植物和.夏季产南瓜。
最优选的是温带油料作物。感兴趣的温带油料作物包括但不限于:油菜仔(Canula和高芥子酸变种)、向日葵、红花、棉花、大豆、花生、椰子和油棕以及玉米。依据引入重组构建体至宿主细胞内所使用的方法,也许需要其它DNA序列。重要的是,本发明适用于双子叶种类的植物和单子叶种类的植物,并可以容易地适用于新的和/或改进的转化和调节技术。
尤其感兴趣的是,在植物中使用了异戊烯基转移酶构建体,以产生这样的植物或植物体部分(其中包括但不限于叶、茎、根、生殖性部分和种子),在具有转化植物细胞的植物体部分中,生育酚的含量被改变。
为了进行免疫学筛选,用纯化的蛋白质或其组成部分注射兔或小鼠就可以制备针对该蛋白质的抗体,这种制备抗体的方法为本领域人员所公知。可以制备产生单克隆抗体或多克隆抗体,尽管在一般情况下多克隆抗体对于基因分离更有用。可以进行Western分析,以确定在所希望的植物种类的粗提取物中有相关蛋白质的存在,例如采用针对被编码蛋白质的抗体通过交叉反应来确定。当观察到交叉反应时,通过筛选代表所希望植物种类的表达文库,将编码相关蛋白质的基因分离。表达文库可构建于多种可商购载体中,包括λgtll,正如在Sambrook等在Molecular Cloning:A Laboratory Manual第二版(1989)Cold Spring Harbor Laboratory,Cold Spring Harbor,New York中所描述的。
为了证实被鉴定为异戊烯基转移酶的核酸序列所编码的蛋白质的活性和特异性,采用杆状病毒表达***在昆虫细胞培养物中进行了体外测定。这种杆状病毒表达***为本领域所公知,并且在Lee等人的美国专利5,348,886中有描述,本文引用其全部作为参考。
另外,可以制备其它表达构建体,以使用不同的表达***测定蛋白质活性。将这种表达构建体转化到酵母或原核细胞宿主内并测定异戊烯基转移酶活性。这种表达***为本领域所公知,并可容易地通过商业途径获得。
除了在本发明中所描述的序列外,用于本发明的DNA编码序列也可源自藻、真菌、细菌、哺乳动物来源物、植物等。可以使用与异戊烯基转移酶的保守核苷酸或氨基酸序列相应的特征序列,在已有的数据库中进行同源性搜索,从而从其它来源物诸如植物和微生物中分离相当、相关基因。也可以在EST数据库中进行搜索。而且,本发明还包含在功能上、酶本身方面与本文所公开的相当的DNA序列编码酶的用途,其中该DNA序列是本文中所公开的与遗传密码的简并性相一致的核酸序列的简并性相当物。使用任何这些方法所鉴定的编码序列,对其功能的证实,可以通过缺乏特异性生化反应或者已经发生突变的合适生物体(例如,集胞蓝细菌属(Synechocystis)、Schewanella、酵母、假单胞菌属(Pseudomonas)、红细菌科(Rhodobacteria)等)的突变体的互补来实现。DNA编码区的序列可以依据密码子的使用选择性,通过基因合成予以最优化,从而在特定的宿主中实现表达的最大化。
为了改变宿主细胞中生育酚的生成,依据本发明可以使用第二种表达构建体。例如,异戊烯转移酶表达构建体可以与第二种具有编码参与生育酚生物合成的蛋白的核苷酸序列的表达构建体一起引入宿主细胞。
在获得这种转基因植物中,转化方法对于本发明并不是非常重要,并且当前有多种植物转化方法可供使用。另外,如果有更新可用于转化作物的方法,此后可以直接应用这些新方法。例如,天然对农杆菌属(Agrobacterium)感染敏感的许多植物种类,可以通过农杆菌属介导转化的三分或二分载体方法予以成功地转化。在许多情况下,希望使构建体的一侧或两侧都与T-DNA相连,优选使左侧和右侧与T-DNA相连,更优选使右侧相连。这在构建体使用根癌农杆菌(A.tumefaciens)或毛根农杆菌(A.rhizogenes)作为转化方式时显得尤其有用,尽管T-DNA边缘区在其它转化方式中也有用途。另外,已经开发了显微注射、DNA颗粒轰击和电穿孔技术,这些技术可以转化多种单子叶和双子叶植物种类。
在正常情况下,在DNA构建体中将包含这种结构基因,它具有在宿主中表达所必需的调节区并提供对转化细胞的选择。该基因可以提供对一种细胞毒试剂例如抗生素、重金属、毒素等的抗性,通过互补对营养缺陷型宿主提供原养,提供病毒免疫力等等。根据不同宿主种类的数目,引入表达构建体或其组分,可以使用一种或多种标记,从而对不同的宿主种类使用不同的选择条件。
在使用农杆菌属转化植物细胞时,可以使用这样一种载体,其被引入农杆菌属宿主后,可与存在于农杆菌属宿主中的T-DNA或Ti-或Ri-质粒进行同源重组。含有T-DNA(用于重组)的Ti-或Ri-质粒可以被接臂(能引起瘿的形成)的,也可以被断臂(不能引起瘿的形成)的,在后一种情况下,只要vir基因存在于转化的农杆菌属宿主中即可。接臂的质粒能够产生正常植物细胞与瘿的混合物。
在将农杆菌属用作转化宿主植物细胞的媒介物的情况下,将通过T-DNA边缘区相连的表达或转录构建体***到一种宽宿主范围的载体中,这种载体具有在大肠杆菌以及农杆菌属中复制的能力,在文献中有对多种宽宿主范围载体的描述。通常使用的是pRK2或其衍生物。参见例如,Ditta等(Proc.Nat.Acad.Sci.U.S.A.(1980)77:7347-7351)以及EPA 0120515,此处引入作为参考。或者,也可以将准备在植物细胞中表达的序列***到含有独立的复制序列的载体中,其中的一个复制序列在大肠杆菌中稳定载体,另一个在农杆菌属稳定载体。见例如,MacBride等Plant Mol.Bol.(1990)14:269-276,其中使用了pRiHRI复制起点(Jouanin等Mol.Gen.Genet.(1985)201:370-374),并使植物表达载体在宿主农杆菌属细胞中的稳定性增加。
包括表达构建体和T-DNA的可以是一种或多种标记,它们允许对转化的农杆菌属以及转化的植物细胞进行选择。已经开发了若干种用于植物细胞的标记,诸如对氯霉素、卡那霉素、氨基糖苷G418、潮霉素等的抗性,本发明并不要求必须使用某种标记,而是根据特定的宿主以及构建的方式优选一种或另一种标记。
在使用农杆菌属转化植物细胞时,可以将外植体与转化的农杆菌属合并在一起并温育足够的时间以使转化发生,细菌被杀死,然后将植物细胞培养于合适的选择培性养基中。一旦愈伤组织形成,通过使用合适的植物激素(采用公知的方法)可以催促茎干形成,然后将茎干转移到生根培养基中以再生植物。接着可以让植物生长结种,然后将种子用于建立重复生产以及用于分离植物油。
有几个可能的方法,用来获得含有多个表达构建体的本发明的植物细胞。本发明包含了任何用于生成植物的方法,该植物具有一种构建体,其具有编码本发明的表达构建体的DNA序列,以及至少一种其它构建体,其具有另一种编码酶的DNA序列。例如,可以通过将两种表达构建体合在单一种转化载体中,或使用独立的载体将表达构建体与第二种构建体同时用于转化植物,其中的每一种载体均表达所希望的基因。还可以将第二种构建体引入到已经用异戊烯转移酶表达构建体转化的植物中,或者也可以将一个是表达异戊烯转移酶构建体、另一个是表达第二种构建体的被转化植物,互相进行杂交,从而使两种构建体合于同一植物中。
可以将本发明的核酸序列用于构建体中,以提供在多种宿主细胞(真核细胞和原核细胞)中该序列的表达。本发明的宿主细胞优选包括单子叶和双子叶植物细胞。
一般地,技术人员对那些描述大分子(例如,DNA分子、质粒等)的构建、操作和分离,产生重组生物体以及筛选和分离克隆(参见例如,Sambrook等Molecular Cloning:A Laboratory Manual,ColdSpring Harbor Press(1989);Maliga等Methods in Plant MolecularBiology,Cold Spring Harbor Press(1985),其全部内容在此处引入作为参考;Birren等Genome Analysis:Analysing DNA,1,ColdSpring Harbor,New York,其全部内容在此处引入作为参考)的特定条件及方法的标准资料都很熟悉。
在昆虫宿主细胞中表达序列的方法在本领域中是公知的。杆状病毒表达载体是重组的昆虫病毒,其中已将所选择的外源基因的编码序列***到杆状病毒启动子的后面,以取代病毒基因,例如,多角体蛋白基因(Smith和Summers,美国专利4,745,051,其全部内容在此处引入作为参考)。杆状病毒表达载体为本领域所公知,并在例如Doerfler的Curr.Top.Microbiol.Immunol.,131:51-68(1968);Luckrow和Summers的Bio/Technology,6:47-55(1988a);Miller的Annual Review of Microbiology,42:177-199(1988);Summers的Curr.Comm.Molecular Biology,Cold Spring Harbor Press,ColdSpring Harbor,N.Y.(1988);Summers和Smith的A Manual ofMethods for Baculovirus Vectors and Insect Cell Culture Procedures,Texas Ag.Exper.Station Bullentin No.1555(1988)中对其进行了描述,其全部内容在此处引入作为参考。
在真菌宿主细胞中表达目的核酸序列的方法为本领域所公知。真菌宿主细胞可以是例如,酵母细胞或丝状真菌细胞。在酵母细胞中表达目的DNA序列的方法一般描述于“Guide to Yeast Genetics andMolecular Biolgy”,Guthrie和Fink编辑,Methods in Enzymology,Academic Press,Inc.,第194卷(1991年);以及“Gene ExpressionTechnology”,Goeddel编辑,Methods in Enzymology,AcademicPress,Inc.,第185卷(1991年)。
可用作表达宿主的哺乳动物细胞是本领域所公知的,其中包括许多无限增殖化细胞系,可从美国典型培养物保藏中心(ATCC,Manassas,VA)得到它们,诸如Hela细胞、中国仓鼠卵巢(CHO)细胞、幼小仓鼠肾(BHK)细胞和若干其它细胞系。用于哺乳动物细胞的合适的启动子也是本领域所公知的,其中包括但不限于病毒性启动子诸如来自猴病毒40(SV40)(Fiers等Nature,273:113(1978),此处引入其全部内容作为参考)、劳斯肉瘤病毒(RSV)、腺病毒(ADV)和牛***瘤病毒(BPV)的启动子。哺乳动物细胞也需要终止子序列和poly-A添加序列。也可以将提高表达的增强子序列包括在内,并且也希望含有可促进基因扩增的序列(例如,甲氨蝶呤抗性基因)。
适于在哺乳动物细胞中复制的载体是本领域所公知的,其中可包括病毒性复制子,或者能够确保将编码表位的适当序列整合到宿主基因组中的序列。已经对那些极大地促进重组病毒构建的质粒载体进行了描述(参见例如,Mackett等J.Virol,49:857(1984);Chakrabarti等Mol.Cell.Biol.5:3403(1985);Moss,In:Gene Transfer VectorsFor Mammalian Cells,Miller和Calos编辑,Cold Spring HarborLaboratory,N.Y.第10页(1987);此处引入上述全部文献的全部内容作为参考)
到目前为止,我们已对本发明进行了综述,通过参考下面的实施例,将更容易了解本发明,所给出的这些实施例,仅用于说明,而不是构成对本发明的限制。
实施例
实施例1:异戊二烯转移酶序列的鉴定
PSI-BLAST(Altschul,et al.(1997)Nuc Acid Res 25;3389-3402)的序列文件(profiles)是针对直链和芳香类的异戊烯转移酶产生的。为了得到直链的序列文件,作为对NCBI中非冗余的蛋白质数据库的查询,使用来源于Porphyra purpurea(基因库,收录号1709766)的异戊烯转移酶。大肠杆菌的参与泛醌形成的酶ubiA(genbank收录号1790473)作为启始序列来产生芳香类异戊烯转移酶的序列文件。这些序列文件用来检索公共和专利的DNA和蛋白质数据库。在拟南芥属中,鉴定了7种直链异戊烯转移酶:ATPT1(SEQ ID NO:9)、ATPT7(SEQ ID NO:10)、ATPT8(SEQ ID NO:11)、ATPT9(SEQ ID NO:13)、ATPT10(SEQ ID NO:14)、ATPT11(SEQ ID NO:15)和ATPT12(SEQ ID NO:16);鉴定了5种芳香异戊烯转移酶:ATPT2(SEQ ID NO:1)、ATPT3(SEQ IDNO:3)、ATPT4(SEQ ID NO:5)、ATPT5(SEQ ID NO:7)、ATPT6(SEQ ID NO:8)。还鉴定了来源于其它植物与芳香类异戊烯转移酶相关的芳香类异戊烯转移酶序列,如大豆(SEQ IDNOs:19-23,在SEQ ID NO:24中给出了SEQ ID NO:23的推定氨基酸序列)和玉米(SEQ ID NOs:25-29和31)。由ZMPT的推定氨基酸序列(SEQ IQ NO:29)在SEQ ID NO:30中给出。
使用附加的Bioaccellerator硬件和由Compugen Ltd.提供的GenWeb软件在Silicon Graphics Unix计算机上进行检索。该软件和硬件在使用序列文件作为查询工具检索DNA和蛋白质数据库中需要使用Smith-Waterman算法。用来查询蛋白质数据库的程序是序列文件索引。在该检索中,不是查询单一序列,而是查询基于氨基酸或核苷酸序列的多种排列的序列文件。这个序列文件是用来查询序列数据组,即序列数据库。该序列文件含有序列上每一个位点打分的相关信息,它有效地替代了用于标准查询的“打分矩阵“。用于以蛋白质序列文件查询核酸数据库的程序是T序列文件索引。T序列文件索引使用氨基酸序列文件查询来检索核酸数据库。当检索进行时,数据库中的序列以6个读框为单位翻译成氨基酸序列。T序列文件索引的结果文件与序列文件索引的只在一个方面有区别,即T序列文件索引中有一附加行指出最佳排列的读框。
Smith-Waterman算法(Smith和Waterman(1981)supra)是用来查找一段序列与数据库中一组序列相似性的。E分值以及其它序列信息,如保守的多肽序列,用来鉴定相关序列。
为了得到对应拟南芥属的异戊烯转移酶的全部编码区,设计了合成寡核苷酸引物来扩增含有异戊烯转移酶序列的部分cDNA克隆的5’末端和3’末端。引物按照相关拟南芥属异戊烯转移酶序列设计并用于cDNA末端快速扩增反应(Rapid Amplification of cDNA Ends,RACE)(Frohman等(1988)Proc.Natl.Acad.Sci.USA 85:8998-9002),该反应使用Marthaon cDNA扩增试剂盒(Clontech Laboratories Inc,Palo Alto,CA)。
使用ATPT2序列进行其它BLAST检索,该序列是一种芳香异戊烯转移酶。其它序列在与ATPT2序列相似的大豆文库中鉴定。另外的大豆序列证实在氨基酸顺序上有80%相同性和91%相似性。
ATPT2(SEQ ID NO:2)、ATPT3(SEQ ID NO:4)、ATPT4(SEQ IDNO:6)、ATPT8(SEQ ID NO:12)和ATPT12(SEQ ID NO:17)之间的氨基酸序列排列使用ClusfalW(图1)进行,其相同和相似百分率在表1中给出。
表1
|
ATPT2 |
ATPT3 |
ATPT4 |
ATPT8 |
ATPT12 |
ATPT2 %相同性%相似性%空位 |
|
12 |
13 |
11 |
15 |
|
25 |
25 |
22 |
32 |
|
17 |
20 |
20 |
9 |
ATPT3 %相同性%相似性%空位 |
|
|
12 |
6 |
22 |
|
|
29 |
16 |
38 |
|
|
20 |
24 |
14 |
ATPT4 %相同性%相似性%空位 |
|
|
|
9 |
14 |
|
|
|
18 |
29 |
|
|
|
26 |
19 |
ATPT8 %相同性%相似性%空位 |
|
|
|
|
7 |
|
|
|
|
19 |
|
|
|
|
20 |
ATPT12 %相同性%相似性%空位 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
实施例2:表达构建体的制备
对一个由pCGN3223(描述于USPN 5,639,790,其全部内容引入本文作为参考)衍生而来的含napin盒的质粒进行修饰,使其更有助于克隆含有多限制性位点的大DNA片断,并且使多napin融合基因克隆至植物双表达载体。在使用限制性内切酶BssH II对构建载体pCGN77645消化以后,将序列为CGCGATTTAAATGGCGCGCCCTGCAGGCGGCCGCCTGCAGGGCGCGCCATTTAAAT(SEQ ID NO:40)的自身连接寡核苷酸组成的接头与克隆载体pBC Sk+(Stratagen)连接在一起。得到的载体pCGN7770含有pCGN3323的napin种子特异表达盒的pGCN7765主链。
克隆盒pCGN7787(除pCGN7770的napin调节区以外与pGGN7770基本相同的调节单元)被双链CAMV 35S启动子和tml聚腺苷酸和转录终止区所代替。
植物转染双载体pCGN5139由pCGN1558构建(McBride和Summerfelt(1990)Plant Molecular Biology,14:269-276)。pCGN1558的多连接子被一个非多连接子的Hind III/Asp718片段所代替,后者含有独特的限制性内切酶位点Asc I,Pac I,Xba I,Swa I,BamH I和NotI。Asp718和Hind III限制性内切酶位点存在于pCGN5139内。
构建一系列快速双载体以使得DNA序列快速克隆到含有转录启始位点(启始子)和转录终止区的双载体中。
通过连接寡核苷酸5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ ID NO:41)和5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ IDNO:42)到Sal I/Xho I消化的pCGN7770构建质粒pCGN8618。含有napin启动子、多连接子(polylinker)和napin 3’区的片段通过用Asp718I消化而从pCGN8618切下;该片段被Klenow片段将5’-突出端添入而变为平端,然后与pCGN5139连接,后者已被Asp718和Hind III消化,并由Klenow片段将5’-突出端添入而变为平端。将含有为了使napin启动子与pCGN5139的Asp718 I的平端接近并且使napin的3’-末端与Hind III位点平端接近而定向***物的质粒进行序列测定,来确定***的方向和克隆连接的完整性。得到的质粒称pCGN8622。
通过连接寡核苷酸寡聚核苷5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ ID NO:43)和5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ IDNO:44)到Sal I/Xho I消化的pCGN7770构建质粒pCGN8619。将含有napin启动子、多连接子(polylinker)和napin3’区的片段通过用Asp718 I消化而从pCGN8619切下;该片段被Klenow片段将5’-突出端添入而变为平端,然后与pCGN5139连接,后者已被Asp718和Hind III消化,并由Klenow片段将5’-突出端添入而变为平端。将含有为了使napin启动子与pCGN5139的Asp718 I的平端接近并且使napin的3’-末端与Hind III位点平端接近而定向***物的质粒进行序列测定,来确定***的方向和克隆连接的完整性。得到的质粒称pCGN8623。
通过连接寡核苷酸寡聚核苷5’-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGGAGCT-3’(SEQ IDNO:45)和5’-CCTGCAGGAAGCTTGCGGCCGCGGATCC-3’(SEQ IDNO:46)到Sal I/Sac I消化的pCGN7787构建质粒pCGN8620。将含有d35S启动子、多连接子(polylinker)和trm 3’区的片段通过用Asp718I完全和Not I部分消化而从pCGN8620切下;该片段被Klenow片段将5’-突出端添入而变为平端,然后与pCGN5139连接,后者已被Asp718和Hind III消化,并由Klenow片段将5’-突出端添入而变为平端。将含有为了使d35S启动子与pCGN5139的Asp718 I的平端接近并且使tml的3’-末端与Hind III位点平端接近而定向***物的质粒进行序列测定,来确定***的方向和克隆连接的完整性。得到的质粒称pCGN8624。
通过连接寡核苷酸寡聚核苷5’-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCCAGCT-3’(SEQ IDNO:47)和5’-GGATCCGCGGCCGCAAGCTTCCTGCAGG-3’(SEQ IDNO:48)到Sal I/Sac I消化的pCGN7787构建质粒pCGN8621。将含有d35S启动子、多连接子(Polylinker)和trm3’区的片段通过用Asp718I完全和Not I部分消化而从pCGN8621切下;该片段被Klenow片段将5’-突出端添入而变为平端,然后与pCGN5139连接,后者已被Asp718和Hind III消化,并由Klenow片段将5’-突出端添入而变为平端。将含有为了使d35S启动子与pCGN5139的Asp718 I的平端接近并且使tml的3’-末端与Hind III位点平端接近而定向***物的质粒进行序列测定,来确定***的方向和克隆连接的完整性。得到的质粒称pCGN8625。
质粒构建体pCGN8640是上述pCGN8624的修饰。从编码细菌奇霉素和链霉素抗性(Fling等(1985),Nucleic Acids Research13(19):7095-7100)的转位子分离的938bp Pst I的片段,是选择大肠杆菌和毛根农杆菌的决定因素,而且由Pfu聚合酶补为平端。该平端片段连接到被Spe I消化且被Pfu聚合酶补平的质粒pCGN8624。对含有Pst I片段的区域测序以确定***物的方向和克隆连接的完整性。
按如下的方法将奇霉素抗性标记引入pCGN8622和pCGN8623:将从pCGN8640得到的7.7kbp的Avr II-SnaB I片段连接到从pCGN8622或pCGN8623得到的10.9kbp的Avr II-SnaB I片段。分别得到质粒pCGN8641和pCGN8643。
通过连接寡核苷酸5’-GATCACCTGCAGGAAGCTTGCGGCCGCGGATCCAATGCA-3’(SEQ ID NO:49)和5’-TTGGATCCGCGGCCGCAAGCTTCCTGCAGGT-3’(SEQ ID NO:50)到Bam H I-Pst I消化的pCGN8641构建质粒pCGN8644。
设计将合成寡核苷酸用于聚合酶链反应(PCR)来扩增用于制备表达构建体的ATPT2、ATPT3、ATPT4、ATPT8和ATPT12的编码序列,见下面表2。
表2
名称 |
限制位点 |
序列 |
序列编号 |
ATPT2 |
5’Not I |
GGATCCGCGGCCGCACAATGGAGTCTCTGCTCTCTAGTTCT |
51 |
ATPT2 |
3’Sse I |
GGATCCTGCAGGTCACTTCAAAAAAGGTAACAGCAAGT |
52 |
ATPT3 |
5’Not I |
GGATCCGCGGCCGCACAATGGCGTTTTTTGGGCTCTCCCGTGTTT |
53 |
ATPT3 |
3’Sse I |
GGATCCTGCAGGTTATTGAAAACTTCTTCCAAGTACAACT |
54 |
ATPT4 |
5’Not I |
GGATCCGCGGCCGCACAATGTGGCGAAGATCTGTTGTT |
55 |
ATPT4 |
3’Sse I |
GGATCCTGCAGGTCATGGAGAGTAGAAGGAAGGAGCT |
56 |
ATPT8 |
5’Not I |
GGATCCGCGGCCGCACAATGGTACTTGCCGAGGTTCCAAAGCTTGCCTCT |
57 |
ATPT8 |
3’Sse I |
GGATCCTGCAGGTCACTTGTTTCTGGTGATGACTCTAT |
58 |
ATPT12 |
5’Not I |
GGATCCGCGGCCGCACAATGACTTCGATTCTCAACACT |
59 |
ATPT12 |
3’Sse I |
GGATCCTGCAGGTCAGTGTTGCGATGCTAATGCCGT |
60 |
ATPT2、ATPT3、ATPT4、ATPT8和ATPT12的编码序列均分别由上述表2中的PCR引物来扩增,并克隆到载体TopoTA(Invitrogen)中。含有相应异戊烯转移酶的构建体用Not I和Sse8387 I消化,并克隆到上述快速双载体中。
编码异戊烯转移酶ATPT2的序列按照有义方向克隆到pCGN8640,以生成植物转化构建体pCGN10800(图2)。ATPT2序列处于35S启动子的控制之下。
ATPT2序列也按照反义方向克隆到构建体pCGN8641以生成pCGN10801(图3)。该构建体提供了ATPT2序列从napin启动子的的反义表达。
ATPT2编码序列也按照反义方向克隆到构建体pCGN8643以生成植物转化构建体pCGN10802。
ATPT2编码序列也按照反义方向克隆到载体pCGN8644以生成植物转化构建体pCGN10803(图4)。
ATPT4编码序列克隆到载体pCGN864,以生成植物转化构建体pCGN10806(图5)。ATPT2序列克隆到载体pCGN864以生成植物转化构建体pCGN10807(图6)。ATPT3编码序列克隆到载体pCGN864以生成植物转化构建体pCGN10808(图7)。ATPT3编码序列按照有义方向克隆到载体pCGN8640以生成植物转化构建体pCGN10809(图8)。ATPT3编码序列按照反义方向克隆到载体pCGN8641以生成植物转化构建体pCGN10810(图9)。ATPT3编码序列克隆到载体pCGN8643以生成植物转化构建体pCGN10811(图10)。ATPT3编码序列克隆到载体pCGN8640以生成植物转化构建体pCGN10812(图11)。ATPT4编码序列克隆到载体pCGN8640以生成植物转化构建体pCGN10813(图12)。ATPT4编码序列克隆到载体pCGN8643以生成植物转化构建体pCGN10814(图13)。ATPT4编码序列克隆到载体pCGN8641以生成植物转化构建体pCGN10815(图14)。ATPT4编码序列按照反义方向克隆到载体pCGN8644以生成植物转化构建体pCGN10816(图15)。ATPT2编码序列克隆到载体pCGN???以生成植物转化构建体pCGN10817(图16)。ATPT8编码序列按照有义方向克隆到载体pCGN8643以生成植物转化构建体pCGN10819(图17)。ATPT12编码序列克隆到载体pCGN8644以生成植物转化构建体pCGN10824(图18)。ATPT12编码序列克隆到载体pCGN8641以生成植物转化构建体pCGN10825(图19)。ATPT8编码序列克隆到载体pCGN8644以生成植物转化构建体pCGN10826(图20)。
实施例3植物转化
转基因芸苔属植物是按照Radke等(Theor.Appl.Genet.(1988)75:685-694;Plant Cell Reports(1992)11:499-505)所述的方法通过毛根农杆菌介导的转化获得。转基因拟南芥植株可以按照Valverbens等(Proc.Nat.Acad.Sci.(1988)85:5536-5540)、Bent等((1994),Science 265:1856-1860)或Bechtold等((1993),C.R.Acad.Sci,Life Science 316:1194-1199)所述的方法通过毛根农杆菌介导的转化获得。其它种属的植物也可以利用相关技术进行类似的转化。
另外,还可使用微粒轰击法(如Klein等(Bio/Technology 10:286-291)所述)获得细胞核转化的植株。
实施例4异戊烯转移酶的鉴定
利用大肠杆菌ubiA(Genebank accession 1790473)序列产生的PSI-Blast序列文件来分析集胞蓝细菌属基因组。该分析在集胞蓝细菌属基因组中分离了5个开放读框(ORFs),它们都可能是异戊烯转移酶:slr0926(注释为ubiA(4-羟苯甲酸-八异戊烯转移酶),SEQ ID NO:32)、sll1899(注释为ctaB(细胞色素c氧化酶折叠蛋白),SEQ IDNO:33)、slr0056(注释为g4(叶绿素合酶33kd亚单位),SEQ IDNO:34)、slr1518(注释为menA(甲基萘醌类生物合成蛋白),SEQ IDNO:35)和SLR1736(注释为未知功能的推测蛋白,SEQ ID NO:36)。
为了确定这些开放读框在生育酚生物合成中可能具有或其参与的作用,制备敲除构建体以阻断集胞蓝细菌属中破裂的ORF。
设计寡核苷酸以扩增slr1736ORF的5’末端区域和3’末端区域,其中5’末端为5’-TAATGTGTACATTGTCGGCCTC(1736-5’)(SEQ IDNO:61)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCCACAATTCCCCGCACCGTC)(1736-kanpr1)(SEQ ID NO:62),3’端为5’-AGGCTAATAAGCACAAATGGGA(1736-3’)(SEQ ID NO:63)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGAATTGGTTTAGGTTATCCC(1736-kanpr2)(SEQ ID NO:64)。1736-kanpr1和1736-kanpr2寡核苷酸含有20bp与slr1736 ORF相同,另有40bp序列与卡那霉素抗性盒序列相同。完成这些寡核苷酸各自的PCR步骤,产物经凝胶纯化并与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K(Pharmacia),其已被Hinc II消化,并从载体的主链中凝胶纯化出来。连接的片段在没有寡核苷酸时在下列条件下可以装配,该条件为在100μl反应体积中使用pfu聚合酶进行40个循环,每个循环为94℃1分钟、55℃1分钟、72℃1分钟零5秒(Zhao,H和Arnold(1997)Nucleic Acid Res.25(6):1307-1308)。然后,在此装配反应体系中取1μl或者5μl进行扩增,扩增使用嵌套于ORF片段末端的5’和3’的寡核苷酸进行,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21681,并用于集胞蓝细菌属的转化。
用下列引物,按照与上述同样的方法,还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGGTTGCCCAAACCCCATC(SEQ ID NO:65)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTGGGTAAGCAACAATGACCGGC(SEQ ID NO:66)扩增ubiA5’序列。使用合成寡核苷酸引物5’-GAATTCTCAAAGCCAGCCCAGTAAC(SEQID NO:67)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGGTGCGAAAAGGGTTTTCCC(SEQ ID NO:68)扩增3’端区域。扩增产物与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K,其已被Hinc II消化,并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-CCAGTGGTTTAGGCTGTGTGGTC(SEQ ID NO:69)和5’-CTGAGTTGGATGTATTGGATC(SEQ ID NO:70))扩增自身连接的片段,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21682,并用于集胞蓝细菌属的转化。
用下列引物,按照与上述同样的方法,还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGGTTACTTCGACAAAAATCC(SEQ ID NO:71)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTGCTAGGCAACCGCTTAGTAC(SEQ ID NO:72)扩增sll 18995’序列。使用合成寡核苷酸引物5’-GAATTCTTAACCCAACAGTAAAGTTCCC(SEQ ID NO:73)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGCCGGCATTGTCTTTTACATG(SEQ ID NO:74)扩增3’端区域。扩增产物与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K,其已被Hinc II消化,并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-GGAACCCTTGCAGCCGCTTC(SEQ ID NO:75)和5’-GTATGCCCAACTGGTGCAGAGG(SEQ ID NO:76))扩增自身连接的片段,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21679,并用于集胞蓝细菌属的转化。
用下列引物,按照与上述同样的方法,还可合成其它序列用于制备集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGTCTGACACACAAAATACCG(SEQ ID NO:77)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCGCCAATACCAGCCACCAACAG(SEQ ID NO:78)扩增slr00565’序列。使用合成寡核苷酸引物5’-GAATTCTCAAATCCCCGCATGGCCTAG(SEQ ID NO:79)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGCCTACGGCTTGGACGTGTGGG(SEQ ID NO:80)扩增3’端区域。扩增产物与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K,其已被Hinc II消化,并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-CACTTGGATTCCCCTGATCTG(SEQ ID NO:81)和5’-GCAATACCCGCTTGGAAAACG(SEQ ID NO:82))扩增自身连接的片段,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21677,并用于集胞蓝细菌属的转化。
用下列引物,按照与上述同样的方法,还可合成用于制备其它序列集胞蓝细菌属敲除构建体的引物。使用引物5’-GGATCCATGACCGAATCTTCGCCCCTAGC(SEQ ID NO:83)和5’-GCAATGTAACATCAGAGATTTTGAGACACAACGTGGCTTTCAATCCTAGGTAGCCGAGGCG(SEQ ID NO:84)扩增slr15185’序列。使用合成寡核苷酸引物5’-GAATTCTTAGCCCAGGCCAGCCCAGCC(SEQ ID NO:85)和5’-GGTATGAGTCAGCAACACCTTCTTCACGAGGCAGACCTCAGCGGGGAATTGATTTGTTTAATTACC(SEQ ID NO:86)扩增3’端区域。扩增产物与卡那霉素抗性基因连接,卡那霉素基因来源于puc4K,其已被Hinc II消化,并从载体的主链中凝胶提纯出来。使用嵌套于ORF片段末端的5’和3’寡核苷酸(5’-GCGATCGCCATTATCGCTTGG(SEQ ID NO:87)和5’-GCAGACTGGCAATTATCAGTAACG(SEQ ID NO:88))扩增自身连接的片段,这样得到的产物中含有5’末端100-200bp碱基将被敲除的集胞蓝细菌属基因、卡那霉素抗性盒以及3’末端100-200bp碱基将被敲除的基因。该PCR产物随后被克隆到载体pGem T easy(Promega)中,生成构建体pMON21680,并用于集胞蓝细菌属的转化。
B.集胞蓝细菌属的转化
将集胞蓝细菌属6803细胞培育至密度约为2×108细胞/ml时离心收集,将细胞微粒重悬浮在新鲜的BG-11培养基(ATCC培养基616)中,密度调整为1×109细胞/ml,马上用于转化。将100μL细胞用5μL微量制备的DNA混合。在光照条件下30℃温育4小时。然后将混合物置于尼龙滤膜上,尼龙滤膜放置在BG-11琼脂上,琼脂中加有pH8的TES,使其培育12-18小时。随后将该滤膜转移至BG-11+TES+5μg/ml卡那霉素琼脂上培育直至7-10天内出现菌落(Packer和Glazer,1988)。随后将菌落挑入含有5μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有10μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有25μg/ml卡那霉素的BG-11液体培养基中培育5天。然后收集细胞,进行PCR分析以确定破裂的ORF的存在,同时进行HPLC分析以确定这种破裂的ORF对于生育酚水平是否有影响。
对为slr1736和sll1899分离的集胞蓝细菌属中的PCR分析表明突变基因组中发生完全分离,表明在这些菌株中无法检测到任何野生型基因组的复制,这也表明天然基因的功能对细胞的功能并不重要。对这些分离株的HPLC分析表明,sll1899菌株生育酚水平没有可见的减少。但是,在承载slr1736敲除的菌株中没有可检测水平的生育酚。
利用Clustal W对集胞蓝细菌属敲除株的氨基酸序列进行了比较,结果见表3,表中列出了相同性百分比,类似性百分比和差异性百分比。序列的排列在图21中给出。
表3:
|
slr1736 |
slr0926 |
sll1899 |
slr0056 |
slr1518 |
slr1736 相同性%相似性% |
|
1429 |
1230 |
1834 |
1126 |
差异性% |
|
|
7 |
10 |
5 |
slr0926 相同性%相似性%差异性% |
|
|
20397 |
19329 |
14284 |
sll1899 相同性%相似性%差异性% |
|
|
|
172912 |
13299 |
slr0056 相同性%相似性%差异性% |
|
|
|
|
15318 |
slr1518 相同性%相似性%差异性% |
|
|
|
|
|
氨基酸序列的比较是在不同拟南芥异戊烯转移酶序列和集胞蓝细菌属序列间进行。比较结果见表4。表中列出了相同性百分比,类似性百分比以及差异性百分比。序列对比结果见图22。
表4:
|
ATPT2 |
slr1736 |
ATPT3 |
slr0926 |
ATPT4 |
sll1899 |
ATPT12 |
slr0056 |
ATPT8 |
slr1518 |
ATPT2slr1736ATPT3slr0926ATPT4sll1899 |
|
294627 |
9231391934 |
92128132812233629 |
8202381934112621122433 |
82029122815142631203712183328 |
122811132626132616172825112319132427 |
9232415331010213020331081832173013 |
72125821125143011241161632102310 |
920241026101122301429971933122611 |
ATPT12slr0056ATPT8slr1518 |
|
|
|
|
|
|
|
526618 |
8192592310 |
112623133287237 |
4B.slr1737敲除株的制备
集胞蓝细菌属种6803 slr1737敲除株按下列方法构建:利用GPSTM-1 Genome Priming System(New England Biolabs),通过Tn7Transposase***,将卡那霉素抗性盒***到slr1737中。集胞蓝细菌属基因组文库克隆的含标靶的orf的652碱基对的质粒被用作靶DNA(集胞蓝细菌属基因组碱基对1324051-1324703;推定orf碱基对为1323672-1324763,Cyanobase注)。按照制造商的草案进行反应。然后将反应混合物转化到大肠杆菌DH 10B electrocompetant细胞中并摊铺。然后筛选转化形成的菌落,以使转位子通过用M13正向和反向通用引物扩增***靶序列,结果产生了对于全长为约2300碱基对的片段652碱基对+约1700碱基对的产物,即转位子卡那霉素盒的大小。测定结束后需要确定标靶的orf内***物大约的位点,因为据估计在集胞蓝细菌属中有效的同源重组需要100个碱基对的orf序列。这可以通过扩增反应进行,利用转位子末端的引物Primer S(5’端)或Primer N(3’端),与M13的正向或反向引物结合使用。也就是说,将四种不同的引物结合用于描述可能的基因敲除株的图谱:引物S-M13正向、引物S-M13反向、引物N-M13正向、引物N-M13反向。用于转化集胞蓝细菌属和敲除株slr1737的构建株被测定为由一个150个碱基对的slr1737序列(位于***转位子的5’端)和约500bp的序列(位于***转位子的3’端)组成,与orf和卡那霉素抗性盒的转录方向一致。slr1737的核酸序列在SEQ ID NO:38中给出,推定的氨基酸序列在SEQ ID NO:39中给出。
将集胞蓝细菌属6803细胞培育至密度约为2×108细胞/ml时离心收集,将细胞微粒重悬浮在新鲜的BG-11培养基中,密度调整为1×109细胞/ml并马上用于转化。将100μL细胞用5μL微量制备的DNA混合。在光照条件下30℃温育4小时。然后将混合物置于尼龙滤膜上,尼龙滤膜放置在BG-11琼脂上,琼脂中添加有pH8的TES,使其培育12-18小时。随后将该滤膜转移至BG-11+TES+5μg/ml卡那霉素琼脂上培育直至7-10天内出现菌落(Packer和Glazer,1988)。随后将菌落挑入含有5μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有10μg/ml卡那霉素的BG-11液体培养基中培育5天。然后将这些细胞转移至含有25μg/ml卡那霉素的BG-11液体培养基中培育5天。然后收集细胞,进行PCR分析以确定破裂的ORF的存在,同时进行HPLC分析以确定这种破裂的ORF对于生育酚水平是否有影响。
利用slr1737 orf末端的引物对集胞蓝细菌属的分离株进行PCR分析,结果显示突变基因组发生彻底分离,表明在这些菌株中检测不到野生型基因组复制。这表明野生型基因对细胞的功能不重要。对基因敲除株slr1737的HPLC分析表明检测不到生育酚产生。
4C.植物异戊烯转移酶酶活性分析
[3H]尿黑酸的0.1%H3PO4溶液(放射活性40Ci/mmol)。按Joo等(1973)Can.J.Biochem.51:1527所述方法合成叶绿基焦磷酸。按Soll等(1980)Phytochemistry 19:215的方法合成2-甲基-6-叶绿基醌醇和2,3-二甲基-5-叶绿基醌醇。尿黑酸、α,β,δ和γ-生育酚以及母育酚均为商购。
使用起泡空气在30℃、50μE·m-2·s-1荧光和70%相对湿度下,在BG-11培养基上培育野生型集胞蓝细菌属种Pcc6803。在该生物体的slr1736敲除株(潜在的PPT)的生长培养基上补充25μg/ml卡那霉素。收集0.25升到1升培养液中的细胞,5000g离心10分钟,储存在-80℃下。
按照Zak’s的操作方法(Zak等(1999)Eur J.Biochem.261:311),稍作改动,分离总膜。细胞在弗氏压碎器上破碎。在弗氏压碎处理前,细胞用溶菌酶在30℃下,在含7mM EDTA、5mM NaCl和10mM Hepes-NaOH的pH7.4的培养基中温育1小时。5000g离心10分钟,收集去壁细菌细胞,将其重悬浮在pH为7.8的0.1-0.5mg叶绿素·mL-1的20mM磷酸钾缓冲液中,在溶液中加入适量的蛋白酶抑制剂混合物和DNA酶I,DNA酶I由Boehinger Mannheim获得。弗氏压碎处理在100MPa下进行2-3次。破碎后,细胞悬浮液在5000g离心10分钟以使未破碎细胞沉淀,随后100,000g离心1小时收集总膜。将最终所得的沉淀重悬浮在含50mM Tris-HCl和4mM MgCl2的缓冲液中。
叶绿体微粒是从250g市售的菠菜叶中分离的。将指定的叶片部分剪下,放入研磨缓冲液中(2L/250g叶片),缓冲液含2mM EDTA、1mM MgCl2、1mM MnCl2,0.33M山梨醇、0.1%抗坏血酸和50mMHepes,pH为7.5。叶片在1L混合器中匀浆三次,每次3秒,然后用四层微孔布过滤。然后上清液在5000g离心6分钟。将叶绿体微粒重悬浮在少量研磨缓冲液中(Douce等Methods in Chloroplast MolecularBiology,239(1982))。
微粒中的叶绿体可以用三种途径破碎。首先按每管1mg叶绿素将叶绿体分装于试管中,在微量离心机中以6000rpm的速度离心2分钟,去除研磨缓冲液。每管中加入200μl Triton X-100缓冲液(0.1%Triton X-100,50mM Tris-HCl,pH7.6和4mM MgCl2)或者是溶胀缓冲液(10mM Tris pH7.6,4mM MgCl2),并在4℃下温育0.5小时,随后破碎的叶绿体微粒马上用于分析。另外,破碎的叶绿体微粒还可以通过在液N2中冷冻或者贮存在-80℃下0.5小时而获得,随后进行分析。
在某些情形下,叶绿体微粒可以进一步用40%/80%percoll梯度进行纯化,以获得完整的叶绿体。完整的叶绿体用溶胀缓冲液破裂,然后或者用于活性分析,或者用于进一步用20.5%/31.8%蔗糖密度梯度纯化被膜(Sol等,1980,supra)。膜部分在100,000g离心40分钟,随后重悬浮在50mM Tris-HCl pH7.6和4mM MgCl2中。
用适量的1Mtris-NaOH pH10混合不同数量的[3H]HGA和40-60μM未标记的HGA(放射活性在0.16-4Ci/mmol范围内),以将pH调至7.6。用痕量的固态NaBH4将HGA还原4分钟。除HGA外,标准的温育混合物(终体积1ml)含有50mM pH为7.6的Tris-HCl、3-5mM MgCl2和100μM叶绿基焦磷酸。反应由加入集胞蓝细菌属总膜、菠菜叶绿体团微粒、菠菜破碎叶绿体或者菠菜被膜开始,酶反应在23℃或30℃、黑暗或光照下进行2小时。反应通过加入液N2冷冻来终止,贮存在-80℃或者直接进行萃取。
向每一分析混合液中加入恒定数量的母育酚,用2ml氯仿/甲醇(1∶2,v/v)萃取反应产物,以得到单相的溶液。其中加入NaCl溶液(2ml;0.9%),剧烈振荡。重复萃取步骤3次。用20μm过滤器过滤含有异戊二烯基醌的有机层,在N2环境下蒸发,随后重悬浮在100μl乙醇中。
样本主要通过正常相HPLC方法(等度的90%己烷和10%甲基-叔丁基醚),使用Zorbax硅胶柱(4.6×250mm)进行分析。样品也可以用反相HPLC方法(等度的0.1%H3PO4的甲醇溶液),使用Vydac 201HS54 C18柱(4.6×250mm)并同时使用All-tech C18防护柱进行分析。产物的量基于底物的放射活性进行计算,基于内标的量,按照回收百分比进行调整。
叶绿素的量按照Amon(1949)Plant Physiol.24:1描述的方法进行测定。蛋白质的含量用Bradford法,用γ球蛋白作为标准物进行测定(Bradford,(1976)Anal.Biochem.72:248)。
分析结果证明,在制备集胞蓝细菌属slr1736敲除株中生成了2-甲基-6-叶绿基质体醌。slr1736敲除株的叶绿基异戊烯转移酶活性的分析结果在图23中给出。
4D.ATPT2对slr1736基因敲除株的功能补偿
为检测ATPT2能否补偿集胞蓝细菌属6803基因敲除株slr1736的功能,构建了表达ATPT2序列的质粒,其启动子为TAC。载体质粒psl1211来自于Washington大学Dr.Himadri Pakrasi实验室,此质粒是在质粒RSF1010基础上改进的,RSF1010具有宽范围的宿主(NgW.O.,Zentella R.,Wang.Y.,Taylor J-S.A.,Pakrasi,H.B.2000。PhrA,集胞蓝细菌属种PCC 6803植株中主要的光反应因子编码环丁烷-嘧啶二聚体特异性DNA光裂解酶(待发表))。通过PCR技术,利用下述引物可以将ATPT2基因从载体pCGN10817中分离出来:ATPT2 nco.pr.5’-CCATGGATTCGAGTAAAGTTGTCGC(SEQ IDNO:89);ATPT2 ri.pr 5’-GAATTCACTTCAAAAAAGGTAACAG(SEQ ID NO:90)。这些引物除去了ATPT2序列5’端大约112bp,这段DNA被认为是叶绿体的转运肽。这些引物还在5’末端引入了NcoI位点,3’末端引入了EcoR I位点,以便能使其亚克隆至后一载体。将使用这些引物所得的PCR产物和pCGN10817连接到pGEM T easy中,得到载体pMON21689,用M13正向和反向引物进行测序,验证序列正确与否。然后将pMON21689的NcoI/EcoRI片段与psl1211的EagI/EcoRI和EagI/NcoI片段连接。通过接合作用将质粒pMON21690引入slr1736集胞蓝细菌属6803 KO植株。s1906细胞(一种辅助菌株)和含pMON21690的DH 10B细胞培育至对数期(0.D.600=0.4),通过离心收集1ml细胞。用无菌BG-11溶液将细胞微粒冲洗2次,然后重悬浮在200μlBG-11中。在灭菌Eppendorf管中混合下列溶液:50μl SL906、50μl含pMON21690的DH10B和100μL新鲜的slr1736集胞蓝细菌属6803KO菌株(O.D.730=0.2-0.4)培养物。马上将细胞混合物转移至置于BG-11上的硝酸纤维素膜,在30℃、2500 LUX(50μe)光照下温育24小时。然后将滤液转移至添加10μg/ml庆大霉素的BG-11上,如上述方法温育约5天。当菌落出现时,挑取菌落,培养在BG-11+10μg/ml庆大霉素液体培养基中(Elhai,J.和Wolk,P.1988.Conjugal tranfer ofDNA to Cyanobacteria.Methods in Enzymology 167:747-54)。然后离心收集1ml液体培养物,用乙醇/邻苯三酚萃取,HPLC分离,分析生育酚含量。Slr1736集胞蓝细菌属6803 KO菌株不含有可检测的生育酚,而用pMON 21690转化的Slr1736集胞蓝细菌属6803 KO菌株含有可检测的α-生育酚。用psl1211(载体对照)转化的集胞蓝细菌属6803株也同样产生α-生育酚。
实施例5:转基因植物分析
用高压液相色谱(HPLC)分析经ATPT蛋白有义或反义表达构建体转化的拟南芥属植物,以检测总生育酚及特定的生育酚(α-、β-、γ-及δ-生育酚)水平的改变。
按照下述方法制备用于HPLC的叶子与种子提取物:对于种子提取物,在一消毒微量离心管中加入10mg种子、1g微珠(Biospec)和500μl 1%邻苯三酚(Sigma Chem)的乙醇溶液。混合物于一小珠搅拌器(Bcadbeater,Biospec)内快速震荡3分钟。然后将提取物经0.2μm滤膜过滤至自动样品收集管中。过滤的提取物按下述方法用于HPLC分析。
叶子萃取物是这样制备的:用在萃取前将30-50mg叶子组织与1g微珠混合后在液氮中冷冻。萃取时将500μl 1%邻苯三酚的乙醇溶液加入叶子/微珠混合物中,并在珠搅拌器(Biospec)上快速摇动1分钟。最终形成的混合物于14000rpm离心4分钟,并在HPLC分析之前按上述方法过滤。
HPLC的操作中使用的是4.6mm×250mm的HPLC Zorbax硅胶柱,其具有荧光检测器、带通滤波器和狭缝光栅,激发波长为290nm,发射波长为336nm。溶剂A是己烷,溶剂B是甲基叔丁基醚。进样体积为20μl,流速为1.5ml/min,采用梯度洗脱(表5),洗脱时间是12min(40℃)。
表5:
时间 |
溶剂A |
溶剂B |
0分钟 |
90% |
10% |
10分钟 |
90% |
10% |
11分钟 |
25% |
75% |
12分钟 |
90% |
10% |
溶于1%邻苯三酚/乙醇溶液的生育酚标准品也同时进样作为对照(包括α-、γ-、β-、δ-生育酚及生育酚(母育酚))(均来自于Matreya)。
α-、β-、δ-、γ-生育酚的标准曲线采用Chemstation软件计算。组分X的绝对含量如下计算:X的绝对量=响应值x×RFx×稀释因子,响应值x是组分X峰下面积,RFx是组分X的响应因子(含量x/响应值x),稀释因子是500μl。而ng/mg组织是指总ng组分/mg植物组织。
含有pMON10822质粒从napin启动子开始表达ATAT2序列的转基因拟南芥属种子提取物的HPLC分析结果见图24。
从napin启动子(pMON10822质粒)开始表达ATAT2序列的拟南芥属种子组织的HPLC分析结果说明种子中生育酚水平增加了。其总生育酚水平比未转化(野生型)拟南芥属植物的总生育酚水平增加了50-60%之多(图24)。
另外,特定生育酚的水平在从napin启动子开始表达ATAT2核酸序列的转基因拟南芥属植物中也是增高的。这些植株中的δ-生育酚水平比野生型拟南芥属植株种子中的δ-生育酚水平增加3倍还多。在表达ATAT2核酸序列的转基因拟南芥属植株中γ-生育酚水平比非转基因对照植株中的γ-生育酚水平增加了近60%之多。另外,α-生育酚水平比非转基因对照植株中的α-生育酚水平增加了3倍之多。
含有pMON10803质粒从增强的35S启动子开始表达ATAT2序列的转基因拟南芥属植株种子提取物的HPLC分析结果见图25。
本专利说明书中提到的所有出版物和专利申请都代表了与本发明有关的领域的技术人员的技术水平。所有出版物及专利申请在此以相同的程度被引用作为参考,每个出版物或专利申请都被具体地且独立地引用作为参考。
尽管为了能够更清晰地理解,已经通过图示说明和例证的方法对上述发明的细节加以描述,但显然在所附的权利要求范围内还可以做某些改变和修改。
序列表
<110>M·拉斯纳
M·波斯特-比特恩米勒
B·萨维季
J·韦斯
<120>编码参与生育酚合成的蛋白质的核酸序列
<130>17133/00/WO
<150>60/129,899
<151>1999-04-15
<150>60/146,461
<151>1999-07-30
<150>PCT/US00/10368
<151>2000-04-14
<160>94
<170>FastSEQ for Windows Version 4.0
<210>1
<211>1182
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>1
atggagtctc tgctctctag ttcttctctt gtttccgctg ctggtgggtt ttgttggaag 60
aagcagaatc taaagctcca ctctttatca gaaatccgag ttctgcgttg tgattcgagt 120
aaagttgtcg caaaaccgaa gtttaggaac aatcttgtta ggcctgatgg tcaaggatct 180
tcattgttgt tgtatccaaa acataagtcg agatttcggg ttaatgccac tgcgggtcag 240
cctgaggctt tcgactcgaa tagcaaacag aagtctttta gagactcgtt agatgcgttt 300
tacaggtttt ctaggcctca tacagttatt ggcacagtgc ttagcatttt atctgtatct 360
ttcttagcag tagagaaggt ttctgatata tctcctttac ttttcactgg catcttggag 420
gctgttgttg cagctctcat gatgaacatt tacatagttg ggctaaatca gttgtctgat 480
gttgaaatag ataaggttaa caagccctat cttccattgg catcaggaga atattctgtt 540
aacaccggca ttgcaatagt agcttccttc tccatcatga gtttctggct tgggtggatt 600
gttggttcat ggccattgtt ctgggctctt tttgtgagtt tcatgctcgg tactgcatac 660
tctatcaatt tgccactttt acggtggaaa agatttgcat tggttgcagc aatgtgtatc 720
ctcgctgtcc gagctattat tgttcaaatc gccttttatc tacatattca gacacatgtg 780
tttggaagac caatcttgtt cactaggcct cttattttcg ccactgcgtt tatgagcttt 840
ttctctgtcg ttattgcatt gtttaaggat atacctgata tcgaagggga taagatattc 900
ggaatccgat cattctctgt aactctgggt cagaaacggg tgttttggac atgtgttaca 960
ctacttcaaa tggcttacgc tgttgcaatt ctagttggag ccacatctcc attcatatgg 1020
agcaaagtca tctcggttgt gggtcatgtt atactcgcaa caactttgtg ggctcgagct 1080
aagtccgttg atctgagtag caaaaccgaa ataacttcat gttatatgtt catatggaag 1140
ctcttttatg cagagtactt gctgttacct tttttgaagt ga 1182
<210>2
<211>393
<212>PRT
<213>拟南芥属种(Arabidopsis sp)
<400>2
Met Glu Ser Leu Leu Ser Ser Ser Ser Leu Val Ser Ala Ala Gly Gly
1 5 10 15
Phe Cys Trp Lys Lys Gln Asn Leu Lys Leu His Ser Leu Ser Glu Ile
20 25 30
Arg Val Leu Arg Cys Asp Ser Ser Lys Val Val Ala Lys Pro Lys Phe
35 40 45
Arg Asn Asn Leu Val Arg Pro Asp Gly Gln Gly Ser Ser Leu Leu Leu
50 55 60
Tyr Pro Lys His Lys Ser Arg Phe Arg Val Asn Ala Thr Ala Gly Gln
65 70 75 80
Pro Glu Ala Phe Asp Ser Asn Ser Lys Gln Lys Ser Phe Arg Asp Ser
85 90 95
Leu Asp Ala Phe Tyr Arg Phe Ser Arg Pro His Thr Val Ile Gly Thr
100 105 110
Val Leu Ser Ile Leu Ser Val Ser Phe Leu Ala Val Glu Lys Val Ser
115 120 125
Asp Ile Ser Pro Leu Leu Phe Thr Gly Ile Leu Glu Ala Val Val Ala
130 135 140
Ala Leu Met Met Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu Ser Asp
145 150 155 160
Val Glu Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro Leu Ala Ser Gly
165 170 175
Glu Tyr Ser Val Asn Thr Gly Ile Ala Ile Val Ala Ser Phe Ser Ile
180 185 190
Met Ser Phe Trp Leu Gly Trp Ile Val Gly Ser Trp Pro Leu Phe Trp
195 200 205
Ala Leu Phe Val Ser Phe Met Leu Gly Thr Ala Tyr Ser Ile Asn Leu
210 215 220
Pro Leu Leu Arg Trp Lys Arg Phe Ala Leu Val Ala Ala Met Cys Ile
225 230 235 240
Leu Ala Val Arg Ala Ile Ile Val Gln Ile Ala Phe Tyr Leu His Ile
245 250 255
Gln Thr His Val Phe Gly Arg Pro Ile Leu Phe Thr Arg Pro Leu Ile
260 265 270
Phe Ala Thr Ala Phe Met Ser Phe Phe Ser Val Val Ile Ala Leu Phe
275 280 285
Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys Ile Phe Gly Ile Arg Ser
290 295 300
Phe Ser Val Thr Leu Gly Gln Lys Arg Val Phe Trp Thr Cys Val Thr
305 310 315 320
Leu Leu Gln Met Ala Tyr Ala Val Ala Ile Leu Val Gly Ala Thr Ser
325 330 335
Pro Phe Ile Trp Ser Lys Val Ile Ser Val Val Gly His Val Ile Leu
340 345 350
Ala Thr Thr Leu Trp Ala Arg Ala Lys Ser Val Asp Leu Ser Ser Lys
355 360 365
Thr Glu Ile Thr Ser Cys Tyr Met Phe Ile Trp Lys Leu Phe Tyr Ala
370 375 380
Glu Tyr Leu Leu Leu Pro Phe Leu Lys
385 390
<210>3
<211>1224
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>3
atggcgtttt ttgggctctc ccgtgtttca agacggttgt tgaaatcttc cgtctccgta 60
actccatctt cttcctctgc tcttttgcaa tcacaacata aatccttgtc caatcctgtg 120
actacccatt acacaaatcc tttcactaag tgttatcctt catggaatga taattaccaa 180
gtatggagta aaggaagaga attgcatcag gagaagtttt ttggtgttgg ttggaattac 240
agattaattt gtggaatgtc gtcgtcttct tcggttttgg agggaaagcc gaagaaagat 300
gataaggaga agagtgatgg tgttgttgtt aagaaagctt cttggataga tttgtattta 360
ccagaagaag ttagaggtta tgctaagctt gctcgattgg ataaacccat tggaacttgg 420
ttgcttgcgt ggccttgtat gtggtcgatt gcgttggctg ctgatcctgg aagccttcca 480
agttttaaat atatggcttt atttggttgc ggagcattac ttcttagagg tgctggttgt 540
actataaatg atctgcttga tcaggacata gatacaaagg ttgatcgtac aaaactaaga 600
cctatcgcca gtggtctttt gacaccattt caagggattg gatttctcgg gctgcagttg 660
cttttaggct tagggattct tctccaactt aacaattaca gccgtgtttt aggggcttca 720
tctttgttac ttgtcttttc ctacccactt atgaagaggt ttacattttg gcctcaagcc 780
tttttaggtt tgaccataaa ctggggagca ttgttaggat ggactgcagt taaaggaagc 840
atagcaccat ctattgtact ccctctctat ctctccggag tctgctggac ccttgtttat 900
gatactattt atgcacatca ggacaaagaa gatgatgtaa aagttggtgt taagtcaaca 960
gcccttagat tcggtgataa tacaaagctt tggttaactg gatttggcac agcatccata 1020
ggttttcttg cactttctgg attcagtgca gatctcgggt ggcaatatta cgcatcactg 1080
gccgctgcat caggacagtt aggatggcaa atagggacag ctgacttatc atctggtgct 1140
gactgcagta gaaaatttgt gtcgaacaag tggtttggtg ctattatatt tagtggagtt 1200
gtacttggaa gaagttttca ataa 1224
<210>4
<211>407
<212>PRT
<213>拟南芥属种(Arabidopsis sp)
<400>4
Met Ala Phe Phe Gly Leu Ser Arg Val Ser Arg Arg Leu Leu Lys Ser
1 5 10 15
Ser Val Ser Val Thr Pro Ser Ser Ser Ser Ala Leu Leu Gln Ser Gln
20 25 30
His Lys Ser Leu Ser Asn Pro Val Thr Thr His Tyr Thr Asn Pro Phe
35 40 45
Thr Lys Cys Tyr Pro Ser Trp Asn Asp Asn Tyr Gln Val Trp Ser Lys
50 55 60
Gly Arg Glu Leu His Gln Glu Lys Phe Phe Gly Val Gly Trp Asn Tyr
65 70 75 80
Arg Leu Ile Cys Gly Met Ser Ser Ser Ser Ser Val Leu Glu Gly Lys
85 90 95
Pro Lys Lys Asp Asp Lys Glu Lys Ser Asp Gly Val Val Val Lys Lys
100 105 110
Ala Ser Trp Ile Asp Leu Tyr Leu Pro Glu Glu Val Arg Gly Tyr Ala
115 120 125
Lys Leu Ala Arg Leu Asp Lys Pro Ile Gly Thr Trp Leu Leu Ala Trp
130 135 140
Pro Cys Met Trp Ser Ile Ala Leu Ala Ala Asp Pro Gly Ser Leu Pro
145 150 155 160
Ser Phe Lys Tyr Met Ala Leu Phe Gly Cys Gly Ala Leu Leu Leu Arg
165 170 175
Gly Ala Gly Cys Thr Ile Asn Asp Leu Leu Asp Gln Asp Ile Asp Thr
180 185 190
Lys Val Asp Arg Thr Lys Leu Arg Pro Ile Ala Ser Gly Leu Leu Thr
195 200 205
Pro Phe Gln Gly Ile Gly Phe Leu Gly Leu Gln Leu Leu Leu Gly Leu
210 215 220
Gly Ile Leu Leu Gln Leu Asn Asn Tyr Ser Arg Val Leu Gly Ala Ser
225 230 235 240
Ser Leu Leu Leu Val Phe Ser Tyr Pro Leu Met Lys Arg Phe Thr Phe
245 250 255
Trp Pro Gln Ala Phe Leu Gly Leu Thr Ile Asn Trp Gly Ala Leu Leu
260 265 270
Gly Trp Thr Ala Val Lys Gly Ser Ile Ala Pro Ser Ile Val Leu Pro
275 280 285
Leu Tyr Leu Ser Gly Val Cys Trp Thr Leu Val Tyr Asp Thr Ile Tyr
290 295 300
Ala His Gln Asp Lys Glu Asp Asp Val Lys Val Gly Val Lys Ser Thr
305 310 315 320
Ala Leu Arg Phe Gly Asp Asn Thr Lys Leu Trp Leu Thr Gly Phe Gly
325 330 335
Thr Ala Ser Ile Gly Phe Leu Ala Leu Ser Gly Phe Ser Ala Asp Leu
340 345 350
Gly Trp Gln Tyr Tyr Ala Ser Leu Ala Ala Ala Ser Gly Gln Leu Gly
355 360 365
Trp Gln Ile Gly Thr Ala Asp Leu Ser Ser Gly Ala Asp Cys Ser Arg
370 375 380
Lys Phe Val Ser Asn Lys Trp Phe Gly Ala Ile Ile Phe Ser Gly Val
385 390 395 400
Val Leu Gly Arg Ser Phe Gln
405
<210>5
<211>1296
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>5
atgtggcgaa gatctgttgt ttctcgttta tcttcaagaa tctctgtttc ttcttcgtta 60
ccaaacccta gactgattcc ttggtcccgc gaattatgtg ccgttaatag cttctcccag 120
cctccggtct cgacggaatc aactgctaag ttagggatca ctggtgttag atctgatgcc 180
aatcgagttt ttgccactgc tactgccgcc gctacagcta cagctaccac cggtgagatt 240
tcgtctagag ttgcggcttt ggctggatta gggcatcact acgctcgttg ttattgggag 300
ctttctaaag ctaaacttag tatgcttgtg gttgcaactt ctggaactgg gtatattctg 360
ggtacgggaa atgctgcaat tagcttcccg gggctttgtt acacatgtgc aggaaccatg 420
atgattgctg catctgctaa ttccttgaat cagatttttg agataagcaa tgattctaag 480
atgaaaagaa cgatgctaag gccattgcct tcaggacgta ttagtgttcc acacgctgtt 540
gcatgggcta ctattgctgg tgcttctggt gcttgtttgt tggccagcaa gactaatatg 600
ttggctgctg gacttgcatc tgccaatctt gtactttatg cgtttgttta tactccgttg 660
aagcaacttc accctatcaa tacatgggtt ggcgctgttg ttggtgctat cccacccttg 720
cttgggtggg cggcagcgtc tggtcagatt tcatacaatt cgatgattct tccagctgct 780
ctttactttt ggcagatacc tcattttatg gcccttgcac atctctgccg caatgattat 840
gcagctggag gttacaagat gttgtcactc tttgatccgt cagggaagag aatagcagca 900
gtggctctaa ggaactgctt ttacatgatc cctctcggtt tcatcgccta tgactggggg 960
ttaacctcaa gttggttttg cctcgaatca acacttctca cactagcaat cgctgcaaca 1020
gcattttcat tctaccgaga ccggaccatg cataaagcaa ggaaaatgtt ccatgccagt 1080
cttctcttcc ttcctgtttt catgtctggt cttcttctac accgtgtctc taatgataat 1140
cagcaacaac tcgtagaaga agccggatta acaaattctg tatctggtga agtcaaaact 1200
cagaggcgaa agaaacgtgt ggctcaacct ccggtggctt atgcctctgc tgcaccgttt 1260
cctttcctcc cagctccttc cttctactct ccatga 1296
<210>6
<211>431
<212>PRT
<213>拟南芥属种(Arabidopsis sp)
<400>6
Met Trp Arg Arg Ser Val Val Tyr Arg Phe Ser Ser Arg Ile Ser Val
1 5 10 15
Ser Ser Ser Leu Pro Asn Pro Arg Leu Ile Pro Trp Ser Arg Glu Leu
20 25 30
Cys Ala Val Asn Ser Phe Ser Gln Pro Pro Val Ser Thr Glu Ser Thr
35 40 45
Ala Lys Leu Gly Ile Thr Gly Val Arg Ser Asp Ala Asn Arg Val Phe
50 55 60
Ala Thr Ala Thr Ala Ala Ala Thr Ala Thr Ala Thr Thr Gly Glu Ile
65 70 75 80
Ser Ser Arg Val Ala Ala Leu Ala Gly Leu Gly His His Tyr Ala Arg
85 90 95
Cys Tyr Trp Glu Leu Ser Lys Ala Lys Leu Ser Met Leu Val Val Ala
100 105 110
Thr Ser Gly Thr Gly Tyr Ile Leu Gly Thr Gly Asn Ala Ala Ile Ser
115 120 125
Phe Pro Gly Leu Cys Tyr Thr Cys Ala Gly Thr Met Met Ile Ala Ala
130 135 140
Ser Ala Asn Ser Leu Asn Gln Ile Phe Glu Ile Ser Asn Asp Ser Lys
145 150 155 160
Met Lys Arg Thr Met Leu Arg Pro Leu Pro Ser Gly Arg Ile Ser Val
165 170 175
Pro His Ala Val Ala Trp Ala Thr Ile Ala Gly Ala Ser Gly Ala Cys
180 185 190
Leu Leu Ala Ser Lys Thr Asn Met Leu Ala Ala Gly Leu Ala Ser Ala
195 200 205
Asn Leu Val Leu Tyr Ala Phe Val Tyr Thr Pro Leu Lys Gln Leu His
210 215 220
Pro Ile Asn Thr Trp Val Gly Ala Val Val Gly Ala Ile Pro Pro Leu
225 230 235 240
Leu Gly Trp Ala Ala Ala Ser Gly Gln IIe Ser Tyr Asn Ser Met Ile
245 250 255
Leu Pro Ala Ala Leu Tyr Phe Trp Gln Ile Pro His Phe Met Ala Leu
260 265 270
Ala His Leu Cys Arg Asn Asp Tyr Ala Ala Gly Gly Tyr Lys Met Leu
275 280 285
Ser Leu Phe Asp Pro Ser Gly Lys Arg Ile Ala Ala Val Ala Leu Arg
290 295 300
Asn Cys Phe Tyr Met Ile Pro Leu Gly Phe Ile Ala Tyr Asp Trp Gly
305 310 315 320
Leu Thr Ser Ser Trp Phe Cys Leu Glu Ser Thr Leu Leu Thr Leu Ala
325 330 335
Ile Ala Ala Thr Ala Phe Ser Phe Tyr Arg Asp Arg Thr Met His Lys
240 345 350
Ala Arg Lys Met Phe His Ala Ser Leu Leu Phe Leu Pro Val Phe Met
355 360 365
Ser Gly Leu Leu Leu His Arg Val Ser Asn Asp Asn Gln Gln Gln Leu
370 375 380
Val Glu Glu Ala Gly Leu Thr Asn Ser Val Ser Gly Glu Val Lys Thr
385 390 395 400
Gln Arg Arg Lys Lys Arg Val Ala Gln Pro Pro Val Ala Tyr Ala Ser
405 410 415
Ala Ala Pro Phe Pro Phe Leu Pro Ala Pro Ser Phe Tyr Ser Pro
420 425 430
<210>7
<211>479
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>7
ggaaactccc ggagcacctg tttgcaggta ccgctaacct taatcgataa tttatttctc 60
ttgtcaggaa ttatgtaagt ctggtggaag gctcgcatac catttttgca ttgcctttcg 120
ctatgatcgg gtttactttg ggtgtgatga gaccaggcgt ggctttatgg tatggcgaaa 180
acccattttt atccaatgct gcattccctc ccgatgattc gttctttcat tcctatacag 240
gtatcatgct gataaaactg ttactggtac tggtttgtat ggtatcagca agaagcgcgg 300
cgatggcgtt taaccggtat ctcgacaggc attttgacgc gaagaacccg cgtactgcca 360
tccgtgaaat acctgcgggc gtcatatctg ccaacagtgc gctggtgttt acgataggct 420
gctgcgtggt attctgggtg gcctgttatt tcattaacac gatctgtttt tacctggcg 479
<210>8
<211>551
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<220>
<221>misc_feature
<222>(1)...(551)
<223>n=A,T,C or G
<400>8
ttgtggctta caccttaatg agcatacgcc agnccattac ggctcgttaa tcggcgccat 60
ngccggngct gntgcaccgg tagtgggcta ctgcgccgtg accaatcagc ttgatctagc 120
ggctcttatt ctgtttttaa ttttactgtt ctggcaaatg ccgcattttt acgcgatttc 180
cattttcagg ctaaaagact tttcagcggc ctgtattccg gtgctgccca tcattaaaga 240
cctgcgctat accaaaatca gcatgctggt ttacgtgggc ttatttacac tggctgctat 300
catgccggcc ctcttagggt atgccggttg gatttatggg atagcggcct taattttagg 360
cttgtattgg ctttatattg ccatacaagg attcaagacc gccgatgatc aaaaatggtc 420
tcgtaagatg tttggatctt cgattttaat cattaccctc ttgtcggtaa tgatgcttgt 480
ttaaacttac tgcctcctga agtttatata tcgataattt cagcttaagg aggcttagtg 540
gttaattcaa t 551
<210>9
<211>297
<212>PRT
<213>拟南芥属种(Arabidopsis sp)
<400>9
Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe
1 5 10 15
Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg Ser Thr Ile Leu Leu
20 25 30
Leu Met Ala Thr Ala Leu Asn Val Arg Val Pro Glu Ala Leu Ile Gly
35 40 45
Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg Val Arg Gln Arg Gly
50 55 60
Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp
65 70 75 80
Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly Ser Leu Asn
85 90 95
Val Val Met Gly Asn Lys Val Val Ala Leu Leu Ala Thr Ala Val Glu
100 105 110
His Leu Val Thr Gly Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln
115 120 125
Arg Tyr Ser Met Asp Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala
130 135 140
Ser Leu Ile Ser Asn Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln
145 150 155 160
Thr Ala Glu Val Ala Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly
165 170 175
Leu Ala Phe Gln Leu Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Set
180 185 190
Ala Ser Leu Gly Lys Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile
195 200 205
Thr Ala Pro Ile Leu Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu
210 215 220
Val Val Asp Gln Val Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu
225 230 235 240
Glu Tyr Leu Gly Lys Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala
245 250 255
Met Glu His Ala Asn Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu
260 265 270
Thr Asp Asn Glu Asp Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu
275 280 285
Thr His Arg Val Ile Thr Arg Asn Lys
290 295
<210>10
<211>561
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>10
aagcgcatcc gtcctcttct acgattgccg ccagccgcat gtatggctgc ataaccgacc 60
gcccctatcc gctcgcggcc gcggtcgaat tcattcacac cgcgacgctg ctgcatgacg 120
acgtcgtcga tgaaagcgat ttgcgccgcg gccgcgaaag cgcgcataag gttttcggca 180
atcaggcgag cgtgctcgtc ggcgatttcc ttttctcccg cgccttccag ctgatggtgg 240
aagacggctc gctcgacgcg ctgcgcattc tctcggatgc ctccgccgtg atcgcgcagg 300
gcgaagtgat gcagctcggc accgcgcgca atcttgaaac caatatgagc cagtatctcg 360
atgtgatcag cgcgaagacc gccgcgctct ttgccgccgc ctgcgaaatc ggcccggtga 420
tggcgaacgc gaaggcggaa gatgctgccg cgatgtgcga atacggcatg aatctcggta 480
tcgccttcca gatcatcgac gaccttctcg attacggcac cggcggccac gccgagcttg 540
gcaagaacac gggcgacgat t 561
<210>11
<211>966
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>11
atggtacttg ccgaggttcc aaagcttgcc tctgctgctg agtacttctt caaaaggggt 60
gtgcaaggaa aacagtttcg ttcaactatt ttgctgctga tggcgacagc tctgaatgta 120
cgcgttccag aagcattgat tggggaatca acagatatag tcacatcaga attacgcgta 180
aggcaacggg gtattgctga aatcactgaa atgatacacg tcgcaagtct actgcacgat 240
gatgtcttgg atgatgccga tacaaggcgt ggtgttggtt ccttaaatgt tgtaatgggt 300
aacaagatgt cggtattagc aggagacttc ttgctctccc gggcttgtgg ggctctcgct 360
gctttaaaga acacagaggt tgtagcatta cttgcaactg ctgtagaaca tcttgttacc 420
ggtgaaacca tggaaataac tagttcaacc gagcagcgtt atagtatgga ctactacatg 480
cagaagacat attataagac agcatcgcta atctctaaca gctgcaaagc tgttgccgtt 540
ctcactggac aaacagcaga agttgccgtg ttagcttttg agtatgggag gaatctgggt 600
ttagcattcc aattaataga cgacattctt gatttcacgg gcacatctgc ctctctcgga 660
aagggatcgt tgtcagatat tcgccatgga gtcataacag ccccaatcct ctttgccatg 720
gaagagtttc ctcaactacg cgaagttgtt gatcaagttg aaaaagatcc taggaatgtt 780
gacattgctt tagagtatct tgggaagagc aagggaatac agagggcaag agaattagcc 840
atggaacatg cgaatctagc agcagctgca atcgggtctc tacctgaaac agacaatgaa 900
gatgtcaaaa gatcgaggcg ggcacttatt gacttgaccc atagagtcat caccagaaac 960
aagtga 966
<210>12
<211>321
<212>PRT
<213>拟南芥属种(Arabidopsis sp)
<400>12
Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe
1 5 10 15
Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg Ser Thr Ile Leu Leu
20 25 30
Leu Met Ala Thr Ala Leu Asn Val Arg Val Pro Glu Ala Leu Ile Gly
35 40 45
Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg Val Arg Gln Arg Gly
50 55 60
Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp
65 70 75 80
Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly Ser Leu Asn
85 90 95
Val Val Met Gly Asn Lys Met Ser Val Leu Ala Gly Asp Phe Leu Leu
100 105 110
Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys Asn Thr Glu Val Val
115 120 125
Ala Leu Leu Ala Thr Ala Val Glu His Leu Val Thr Gly Glu Thr Met
130 135 140
Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser Met Asp Tyr Tyr Met
145 150 155 160
Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn Ser Cys Lys
165 170 175
Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu Val Ala Val Leu Ala
180 185 190
Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe Gln Leu Ile Asp Asp
195 200 205
Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys Gly Ser Leu
210 215 220
Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro Ile Leu Phe Ala Met
225 230 235 240
Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp Gln Val Glu Lys Asp
245 250 255
Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu Gly Lys Ser Lys Gly
260 265 270
Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His Ala Asn Leu Ala Ala
275 280 285
Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn Glu Asp Val Lys Arg
290 295 300
Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg Val Ile Thr Arg Asn
305 310 315 320
Lys
<210>13
<211>621
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>13
gctttctcct ttgctaattc ttgagctttc ttgatcccac cgcgatttct aactatttca 60
atcgcttctt caagcgatcc aggctcacaa aactcagact caatgatctc tcttagcctt 120
ggctcattct ctagcgcgaa gatcactggc gccgttatgt tacctttggc taagtcatta 180
gctgcaggct tacctaactg ctctgtggac tgagtgaagt ccagaatgtc atcaactact 240
tgaaaagata aaccgagatt cttcccgaac tgatacattt gctctgcgac cttgctttcg 300
actttactga aaattgctgc tcctttggtg cttgcagcta ctaatgaagc tgtcttgtag 360
taactcttta gcatgtagtc atcaagcttg acatcacaat cgaataaact cgatgcttgc 420
tttatctcac cgcttgcaaa atctttgatc acctgcaaaa agataaatca agattcagac 480
caaatgttct ttgtattgag tagcttcatc taatctcaga aaggaatatt acctgactta 540
tgagcttaat gacttcaagg ttttcgagat ttgtaagtac catgatgctt gagcaacatg 600
aaatccccag ctaatacagc t 621
<210>14
<211>741
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>14
ggtgagtttt gttaatagtt atgagattca tctatttttg tcataaaatt gtttggtttg 60
gtttaaactc tgtgtataat tgcaggaaag gaaacagttc atgagctttt cggcacaaga 120
gtagcggtgc tagctggaga tttcatgttt gctcaagcgt catggtactt agcaaatctc 180
gagaatcttg aagttattaa gctcatcagt caggtactta gttactctta cattgttttt 240
ctatgaggtt gagctatgaa tctcatttcg ttgaataatg ctgtgcctca aacttttttt 300
catgttttca ggtgatcaaa gactttgcaa gcggagagat aaagcaggcg tccagcttat 360
ttgactgcga caccaagctc gacgagtact tactcaaaag tttctacaag acagcctctt 420
tagtggctgc gagcaccaaa ggagctgcca ttttcagcag agttgagcct gatgtgacag 480
aacaaatgta cgagtttggg aagaatctcg gtctctcttt ccagatagtt gatgatattt 540
tggatttcac tcagtcgaca gagcagctcg ggaagccagc agggagtgat ttggctaaag 600
gtaacttaac agcacctgtg attttcgctc tggagaggga gccaaggcta agagagatca 660
ttgagtcaaa gttctgtgag gcgggttctc tggaagaagc gattgaagcg gtgacaaaag 720
gtggggggat taagagagca c 741
<210>15
<211>1087
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>15
cctcttcagc caatccagag gaagaagaga caacttttta tctttcgtca agagtctccg 60
aaaacgcacg gttttatgct ctctcttctg ccctcacctc acaagacgca gggcacatga 120
ttcaaccaga gggaaaaagc aacgataaca actctgcttt tgatttcaag ctgtatatga 180
tccgcaaagc cgagtctgta aatgcggctc tcgacgtttc cgtaccgctt ctgaaacccc 240
ttacgatcca agaagcggtc aggtactctt tgctagccgg cggaaaacgt gtgaggcctc 300
tgctctgcat tgccgcttgt gagcttgtgg ggggcgacga ggctactgcc atgtcagccg 360
cttgcgcggt cgagatgatc cacacaagct ctctcattca tgacgatctt ccgtgcatgg 420
acaatgccga cctccgtaga ggcaagccca ccaatcacaa ggtatgttgt ttaattatat 480
gaaggctcag agataatgct gaactagtgt tgaaccaatt tttgctcaaa caaggtatat 540
ggagaagaca tggcggtttt ggcaggtgat gcactccttg cattggcgtt tgagcacatg 600
acggttgtgt cgagtgggtt ggtcgctccc gagaagatga ttcgcgccgt ggttgagctg 660
gccagggcca tagggactac agggctagtt gctggacaaa tgatagacct agccagcgaa 720
agactgaatc cagacaaggt tggattggag catctagagt tcatccatct ccacaaaacg 780
gcggcattgt tggaggcagc ggcagtttta ggggttataa tgggaggtgg aacagaggaa 840
gaaatcgaaa agcttagaaa gtatgctagg tgtattggac tactgtttca ggttgttgat 900
gacattctcg acgtaacaaa atctactgag gaattgggta agacagccgg aaaagacgta 960
atggccggaa agctgacgta tccaaggctg ataggtttgg agggatccag ggaagttgca 1020
gagcacctga ggagagaagc agaggaaaag cttaaagggt ttgatccaag tcaggcggcg 1080
cctctgg 1087
<210>16
<211>1164
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>16
atgacttcga ttctcaacac tgtctccacc atccactctt ccagagttac ctccgtcgat 60
cgagtcggag tcctctctct tcggaattcg gattccgttg agttcactcg ccggcgttct 120
ggtttctcga cgttgatcta cgaatcaccc gggcggagat ttgttgtgcg tgcggcggag 180
actgatactg ataaagttaa atctcagaca cctgacaagg caccagccgg tggttcaagc 240
attaaccagc ttctcggtat caaaggagca tctcaagaaa ctaataaatg gaagattcgt 300
cttcagctta caaaaccagt cacttggcct ccactggttt ggggagtcgt ctgtggtgct 360
gctgcttcag ggaactttca ttggacccca gaggatgttg ctaagtcgat tctttgcatg 420
atgatgtctg gtccttgtct tactggctat acacagacaa tcaacgactg gtatgataga 480
gatatcgacg caattaatga gccatatcgt ccaattccat ctggagcaat atcagagcca 540
gaggttatta cacaagtctg ggtgctatta ttgggaggtc ttggtattgc tggaatatta 600
gatgtgtggg cagggcatac cactcccact gtcttctatc ttgctttggg aggatcattg 660
ctatcttata tatactctgc tccacctctt aagctaaaac aaaatggatg ggttggaaat 720
tttgcacttg gagcaagcta tattagtttg ccatggtggg ctggccaagc attgtttggc 780
actcttacgc cagatgttgt tgttctaaca ctcttgtaca gcatagctgg gttaggaata 840
gccattgtta acgacttcaa aagtgttgaa ggagatagag cattaggact tcagtctctc 900
ccagtagctt ttggcaccga aactgcaaaa tggatatgcg ttggtgctat agacattact 960
cagctttctg ttgccggata tctattagca tctgggaaac cttattatgc gttggcgttg 1020
gttgctttga tcattcctca gattgtgttc cagtttaaat actttctcaa ggaccctgtc 1080
aaatacgacg tcaagtacca ggcaagcgcg cagccattct tggtgctcgg aatatttgta 1140
acggcattag catcgcaaca ctga 1164
<210>17
<211>387
<212>PRT
<213>拟南芥属种(Arabidopsis sp)
<400>17
Met Thr Ser Ile Leu Asn Thr Val Ser Thr Ile His Ser Ser Arg Val
1 5 10 15
Thr Ser Val Asp Arg Val Gly Val Leu Set Leu Arg Asn Ser Asp Ser
20 25 30
Val Glu Phe Thr Arg Arg Arg Ser Gly Phe Ser Thr Leu Ile Tyr Glu
35 40 45
Ser Pro Gly Arg Arg Phe Val Val Arg Ala Ala Glu Thr Asp Thr Asp
50 55 60
Lys Val Lys Ser Gln Thr Pro Asp Lys Ala Pro Ala Gly Gly Set Ser
65 70 75 80
Ile Asn Gln Leu Leu Gly Ile Lys Gly Ala Ser Gln Glu Thr Asn Lys
85 90 95
Trp Lys Ile Arg Leu Gln Leu Thr Lys Pro Val Thr Trp Pro Pro Leu
100 105 110
Val Trp Gly Val Val Cys Gly Ala Ala Ala Ser Gly Asn Phe His Trp
115 120 125
Thr Pro Glu Asp Val Ala Lys Ser Ile Leu Cys Met Met Met Ser Gly
130 135 140
Pro Cys Leu Thr Gly Tyr Thr Gln Thr Ile Asn Asp Trp Tyr Asp Arg
145 150 155 160
Asp Ile Asp Ala Ile Asn Glu Pro Tyr Arg Pro Ile Pro Ser Gly Ala
165 170 175
Ile Ser Glu Pro Glu Val Ile Thr Gln Val Trp Val Leu Leu Leu Gly
180 185 190
Gly Leu Gly Ile Ala Gly Ile Leu Asp Val Trp Ala Gly His Thr Thr
195 200 205
Pro Thr Val Phe Tyr Leu Ala Leu Gly Gly Ser Leu Leu Ser Tyr Ile
210 215 220
Tyr Ser Ala Pro Pro Leu Lys Leu Lys Gln Asn Gly Trp Val Gly Asn
225 230 235 240
Phe Ala Leu Gly Ala Ser Tyr Ile Ser Leu Pro Trp Trp Ala Gly Gln
245 250 255
Ala Leu Phe Gly Thr Leu Thr Pro Asp Val Val Val Leu Thr Leu Leu
260 265 270
Tyr Ser Ile Ala Gly Leu Gly Ile Ala Ile Val Asn Asp Phe Lys Ser
275 280 285
Val Glu Gly Asp Arg Ala Leu Gly Leu Gln Ser Leu Pro Val Ala Phe
290 295 300
Gly Thr Glu Thr Ala Lys Trp Ile Cys Val Gly Ala Ile Asp Ile Thr
305 310 315 320
Gln Leu Ser Val Ala Gly Tyr Leu Leu Ala Ser Gly Lys Pro Tyr Tyr
325 330 335
Ala Leu Ala Leu Val Ala Leu Ile Ile Pro Gln Ile Val Phe Gln Phe
340 345 350
Lys Tyr Phe Leu Lys Asp Pro Val Lys Tyr Asp Val Lys Tyr Gln Ala
355 360 365
Ser Ala Gln Pro Phe Leu Val Leu Gly Ile Phe Val Thr Ala Leu Ala
370 375 380
Ser Gln His
385
<210>18
<21l>981
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>18
atgttgttta gtggttcagc gatcccatta agcagcttct gctctcttcc ggagaaaccc 60
cacactcttc ctatgaaact ctctcccgct gcaatccgat cttcatcctc atctgccccg 120
gggtcgttga acttcgatct gaggacgtat tggacgactc tgatcaccga gatcaaccag 180
aagctggatg aggccatacc ggtcaagcac cctgcgggga tctacgaggc tatgagatac 240
tctgtactcg cacaaggcgc caagcgtgcc cctcctgtga tgtgtgtggc ggcctgcgag 300
ctcttcggtg gcgatcgcct cgccgctttc cccaccgcct gtgccctaga aatggtgcac 360
gcggcttcgt tgatacacga cgacctcccc tgtatggacg acgatcctgt gcgcagagga 420
aagccatcta accacactgt ctacggctct ggcatggcca ttctcgccgg tgacgccctc 480
ttcccactcg ccttccagca cattgtctcc cacacgcctc ctgaccttgt tccccgagcc 540
accatcctca gactcatcac tgagattgcc cgcactgtcg gctccactgg tatggctgca 600
ggccagtacg tcgaccttga aggaggtccc tttcctcttt cctttgttca ggagaagaaa 660
ttcggagcca tgggtgaatg ctctgccgtg tgcggtggcc tattgggcgg tgccactgag 720
gatgagctcc agagtctccg aaggtacggg agagccgtcg ggatgctgta tcaggtggtc 780
gatgacatca ccgaggacaa gaagaagagc tatgatggtg gagcagagaa gggaatgatg 840
gaaatggcgg aagagctcaa ggagaaggcg aagaaggagc ttcaagtgtt tgacaacaag 900
tatggaggag gagacacact tgttcctctc tacaccttcg ttgactacgc tgctcatcga 960
cattttcttc ttcccctctg a 981
<210>19
<211>245
<212>DNA
<213>甘氨酸种(Glycine sp)
<400>19
gcaacatctg ggactgggtt tgtcttgggg agtggtagtg ctgttgatct ttcggcactt 60
tcttgcactt gcttgggtac catgatggtt gctgcatctg ctaactcttt gaatcaggtg 120
tttgagatca ataatgatgc taaaatgaag agaacaagtc gcaggccact accctcagga 180
cgcatcacaa tacctcatgc agttggctgg gcatcctctg ttggattagc tggtacggct 240
ctact 245
<210>20
<211>253
<212>DNA
<213>甘氨酸种(Glycine sp)
<400>20
attggctttc caagatcatt gggttttctt gttgcattca tgaccttcta ctccttgggt 60
ttggcattgt ccaaggatat acctgacgtt gaaggagata aagagcacgg cattgattct 120
tttgcagtac gtctaggtca gaaacgggca ttttggattt gcgtttcctt ttttgaaatg 180
gctttcggag ttggtatcct ggccggagca tcatgctcac acttttggac taaaattttc 240
acgggtatgg gaa 253
<210>21
<211>275
<212>DNA
<213>甘氨酸种(Glycine sp)
<400>21
tgatcttcta ctctctgggt atggcattgt ccaaggatat atctgacgtt aaaggagata 60
aagcatacgg catcgatact ttagcgatac gtttgggtca aaaatgggta ttttggattt 120
gcattatcct ttttgaaatg gcttttggag ttgccctctt ggcaggagca acatcttctt 180
acctttggat taaaattgtc acgggtctgg gacatgctat tcttgcttca attctcttgt 240
accaagccaa atctatatac ttgagcaaca aagtt 275
<210>22
<211>299
<212>DNA
<213>甘氨酸种(Glycine sp)
<220>
<221>misc_feature
<222>(1)...(299)
<223>n=A,T,C or G
<400>22
ccanaatang tncatcttng aaagacaatt ggcctcttca acacacaagt ctgcatgtga 60
agaagaggcc aattgtcttt ccaagatcac ttatngtggc tattgtaatc atgaacttct 120
tctttgtggg tatggcattg gcaaaggata tacctanctg ttgaaggaga taaaatatat 180
ggcattgata cttttgcaat acgtataggt caaaaacaag tattttggat ttgtattttc 240
ctttttgaaa ggctttcgga gtttccctag tggcaggagc aacatcttct agccttggt 299
<210>23
<211>767
<212>DNA
<213>甘氨酸种(Glycine sp)
<400>23
gtggaggctg tggttgctgc cctgtttatg aatatttata ttgttggttt gaatcaattg 60
tctgatgttg aaatagacaa gataaacaag ccgtatcttc cattagcatc tggggaatat 120
tcctttgaaa ctggtgtcac tattgttgca tctttttcaa ttctgagttt ttggcttggc 180
tgggttgtag gttcatggcc attattttgg gccctttttg taagctttgt gctaggaact 240
gcttattcaa tcaatgtgcc tctgttgaga tggaagaggt ttgcagtgct tgcagcgatg 300
tgcattctag ctgttcgggc agtaatagtt caacttgcat ttttccttca catgcagact 360
catgtgtaca agaggccacc tgtcttttca agaccattga tttttgctac tgcattcatg 420
agcttcttct ctgtagttat agcactgttt aaggatatac ctgacattga aggagataaa 480
gtatttggca tccaatcttt ttcagtgtgt ttaggtcaga agccggtgtt ctggacttgt 540
gttacccttc ttgaaatagc ttatggagtc gccctcctgg tgggagctgc atctccttgt 600
ctttggagca aaattttcac gggtctggga cacgctgtgc tggcttcaat tctctggttt 660
catgccaaat ctgtagattt gaaaagcaaa gcttcgataa catccttcta tatgtttatt 720
tggaagctat tttatgcaga atacttactc attccttttg ttagatg 767
<210>24
<211>255
<212>PRT
<213>甘氨酸种(Glycine sp)
<400>24
Val Glu Ala Val Val Ala Ala Leu Phe Met Asn Ile Tyr Ile Val Gly
1 5 10 15
Leu Asn Gln Leu Ser Asp Val Glu Ile Asp Lys Ile Asn Lys Pro Tyr
20 25 30
Leu Pro Leu Ala Ser Gly Glu Tyr Ser Phe Glu Thr Gly Val Thr Ile
35 40 45
Val Ala Ser Phe Ser Ile Leu Ser Phe Trp Leu Gly Trp Val Val Gly
50 55 60
Ser Trp Pro Leu Phe Trp Ala Leu Phe Val Ser Phe Val Leu Gly Thr
65 70 75 80
Ala Tyr Ser Ile Asn Val Pro Leu Leu Arg Trp Lys Arg Phe Ala Val
85 90 95
Leu Ala Ala Met Cys Ile Leu Ala Val Arg Ala Val Ile Val Gln Leu
100 105 110
Ala Phe Phe Leu His Met Gln Thr His Val Tyr Lys Arg Pro Pro Val
115 120 125
Phe Ser Arg Pro Leu Ile Phe Ala Thr Ala Phe Met Ser Phe Phe Ser
130 135 140
Val Val Ile Ala Leu Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys
145 150 155 160
Val Phe Gly Ile Gln Set Phe Ser Val Cys Leu Gly Gln Lys Pro Val
165 170 175
Phe Trp Thr Cys Val Thr Leu Leu Glu Ile Ala Tyr Gly Val Ala Leu
180 185 190
Leu Val Gly Ala Ala Ser Pro Cys Leu Trp Ser Lys Ile Phe Thr Gly
195 200 205
Leu Gly His Ala Val Leu Ala Ser Ile Leu Trp Phe His Ala Lys Ser
210 215 220
Val Asp Leu Lys Ser Lys Ala Ser Ile Thr Ser Phe Tyr Met Phe Ile
225 230 235 240
Trp Lys Leu Phe Tyr Ala Glu Tyr Leu Leu Ile Pro Phe Val Arg
245 250 255
<210>25
<211>360
<212>DNA
<213>玉蜀黍属种(Zea sp)
<220>
<221>misc_feature
<222>(1)...(360)
<223>n=A,T,C or G
<400>25
ggcgtcttca cttgttctgg tcttctcgta tcccctgatg aagaggttca cattttggcc 60
tcaggcttat cttggcctga cattcaactg gggagcttta ctagggtggg ctgctattaa 120
ggaaagcata gaccctgcaa atcatccttc cattgtatac agctggtatt tgttggacgc 180
tggtgtatga tactatatat gcgcatcagg tgtttcgcta tccctacttt catattaatc 240
cttgatgaag tggccatttc atgttgtcgc ggtggtctta tacttgcata tctccatgca 300
tctcaggaca aagangatga cctgaaagta ggagtccaag tccacagctt aagatttggg 360
<210>26
<211>299
<212>DNA
<213>玉蜀黍属种(Zea sp)
<220>
<221>misc_feature
<222>(1)...(299)
<223>n=A,T,C or G
<400>26
gatggttgca gcatctgcaa ataccctcaa ccaggtgttt gngataaaaa atgatgctaa 60
aatgaaaagg acaatgcgtg ccccctgcca tctggtcgca ttagtcctgc acatgctgcg 120
atgtgggcta caagtgttgg agttgcagga acagctttgt tggcctggaa ggctaatggc 180
ttggcagctg ggcttgcagc ttctaatctt gttctgtatg catttgtgta tacgccgttg 240
aagcaaatac accctgttaa tacatgggtt ggggcagtcg ttggtgccat cccaccact 299
<210>27
<211>255
<212>DNA
<213>玉蜀黍属种(Zea sp)
<220>
<221>misc_feature
<222>(1)...(255)
<223>n=A,T,C or G
<400>27
anacttgcat atctccatgc ntctcaggac aaagangatg acctgaaagt aggtgtcaag 60
tccacagcat taagatttgg agatttgacc nnatactgna tcagtggctt tggcgcggca 120
tgcttcggca gcttagcact cagtggttac aatgctgacc ttggttggtg tttagtgtga 180
tgcttgagcg aagaatggta tngtttttac ttgatattga ctccagacct gaaatcatgt 240
tggacagggt ggccc 255
<210>28
<211>257
<212>DNA
<213>玉蜀黍属种(Zea sp)
<400>28
attgaagggg ataggactct ggggcttcag tcacttcctg ttgcttttgg gatggaaact 60
gcaaaatgga tttgtgttgg agcaattgat atcactcaat tatctgttgc aggttaccta 120
ttgagcaccg gtaagctgta ttatgccctg gtgttgcttg ggctaacaat tcctcaggtg 180
ttctttcagt tccagtactt cctgaaggac cctgtgaagt atgatgtcaa atatcaggca 240
agcgcacaac cattctt 257
<210>29
<211>368
<212>DNA
<213>玉蜀黍属种(Zea sp)
<400>29
atccagttgc aaataataat ggcgttcttc tctgttgtaa tagcactatt caaggatata 60
cctgacatcg aaggggaccg catattcggg atccgatcct tcagcgtccg gttagggcaa 120
aagaaggtct tttggatctg cgttggcttg cttgagatgg cctacagcgt tgcgatactg 180
atgggagcta cctcttcctg tttgtggagc aaaacagcaa ccatcgctgg ccattccata 240
cttgccgcga tcctatggag ctgcgcgcga tcggtggact tgacgagcaa agccgcaata 300
acgtccttct acatgttcat ctggaagctg ttctacgcgg agtacctgct catccctctg 360
gtgcggtg 368
<210>30
<211>122
<212>PRT
<213>玉蜀黍属种(Zea sp)
<400>30
Ile Gln Leu Gln Ile Ile Met Ala Phe Phe Ser Val Val Ile Ala Leu
1 5 10 15
Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Arg Ile Phe Gly Ile Arg
20 25 30
Ser Phe Ser Val Arg Leu Gly Gln Lys Lys Val Phe Trp Ile Cys Val
35 40 45
Gly Leu Leu Glu Met Ala Tyr Ser Val Ala Ile Leu Met Gly Ala Thr
50 55 60
Ser Ser Cys Leu Trp Ser Lys Thr Ala Thr Ile Ala Gly His Ser Ile
65 70 75 80
Leu Ala Ala Ile Leu Trp Ser Cys Ala Arg Ser Val Asp Leu Thr Ser
85 90 95
Lys Ala Ala Ile Thr Ser Phe Tyr Met Phe Ile Trp Lys Leu Phe Tyr
100 105 110
Ala Glu Tyr Leu Leu Ile Pro Leu Val Arg
115 120
<210>31
<211>278
<212>DNA
<213>玉蜀黍属种(Zea sp)
<400>31
tattcagcac cacctctcaa gctcaagcag aatggatgga ttgggaactt cgctctgggt 60
gcgagttaca tcagcttgcc ctggtgggct ggccaggcgt tatttggaac tcttacacca 120
gatatcattg tcttgactac tttgtacagc atagctgggc tagggattgc tattgtaaat 180
gatttcaaga gtattgaagg ggataggact ctggggcttc agtcacttcc tgttgctttt 240
gggatggaaa ctgcaaaatg gatttgtgtt ggagcaat 278
<210>32
<211>292
<212>PRT
<213>集胞蓝细菌属种(Synechocystis sp)
<400>32
Met Val Ala Gln Thr Pro Ser Ser Pro Pro Leu Trp Leu Thr Ile Ile
1 5 10 15
Tyr Leu Leu Arg Trp His Lys Pro Ala Gly Arg Leu Ile Leu Met Ile
20 25 30
Pro Ala Leu Trp Ala Val Cys Leu Ala Ala Gln Gly Leu Pro Pro Leu
35 40 45
Pro Leu Leu Gly Thr Ile Ala Leu Gly Thr Leu Ala Thr Ser Gly Leu
50 55 60
Gly Cys Val Val Asn Asp Leu Trp Asp Arg Asp Ile Asp Pro Gln Val
65 70 75 80
Glu Arg Thr Lys Gln Arg Pro Leu Ala Ala Arg Ala Leu Ser Val Gln
85 90 95
Val Gly Ile Gly Val Ala Leu Val Ala Leu Leu Cys Ala Ala Gly Leu
100 105 110
Ala Phe Tyr Leu Thr Pro Leu Ser Phe Trp Leu Cys Val Ala Ala Val
115 120 125
Pro Val Ile Val Ala Tyr Pro Gly Ala Lys Arg Val Phe Pro Val Pro
130 135 140
Gln Leu Val Leu Ser Ile Ala Trp Gly Phe Ala Val Leu Ile Ser Trp
145 150 155 160
Ser Ala Val Thr Gly Asp Leu Thr Asp Ala Thr Trp Val Leu Trp Gly
165 170 175
Ala Thr Val Phe Trp Thr Leu Gly Phe Asp Thr Val Tyr Ala Met Ala
180 185 190
Asp Arg Glu Asp Asp Arg Arg Ile Gly Val Asn Ser Ser Ala Leu Phe
195 200 205
Phe Gly Gln Tyr Val Gly Glu Ala Val Gly Ile Phe Phe Ala Leu Thr
210 215 220
Ile Gly Cys Leu Phe Tyr Leu Gly Met Ile Leu Met Leu Asn Pro Leu
225 230 235 240
Tyr Trp Leu Ser Leu Ala Ile Ala Ile Val Gly Trp Val Ile Gln Tyr
245 250 255
Ile Gln Leu Ser Ala Pro Thr Pro Glu Pro Lys Leu Tyr Gly Gln Ile
260 265 270
Phe Gly Gln Asn Val Ile Ile Gly Phe Val Leu Leu Ala Gly Met Leu
275 280 285
Leu Gly Trp Leu
290
<210>33
<211>316
<212>PRT
<213>集胞蓝细菌属种(Synechocystis sp)
<400>33
Met Val Thr Ser Thr Lys Ile His Arg Gln His Asp Ser Met Gly Ala
1 5 10 15
Val Cys Lys Ser Tyr Tyr Gln Leu Thr Lys Pro Arg Ile Ile Pro Leu
20 25 30
Leu Leu Ile Thr Thr Ala Ala Ser Met Trp Ile Ala Ser Glu Gly Arg
35 40 45
Val Asp Leu Pro Lys Leu Leu Ile Thr Leu Leu Gly Gly Thr Leu Ala
50 55 60
Ala Ala Ser Ala Gln Thr Leu Asn Cys Ile Tyr Asp Gln Asp Ile Asp
65 70 75 80
Tyr Glu Met Leu Arg Thr Arg Ala Arg Pro Ile Pro Ala Gly Lys Val
85 90 95
Gln Pro Arg His Ala Leu Ile Phe Ala Leu Ala Leu Gly Val Leu Ser
100 105 110
Phe Ala Leu Leu Ala Thr Phe Val Asn Val Leu Ser Gly Cys Leu Ala
115 120 125
Leu Ser Gly Ile Val Phe Tyr Met Leu Val Tyr Thr His Trp Leu Lys
130 135 140
Arg His Thr Ala Gln Asn Ile Val Ile Gly Gly Ala Ala Gly Ser Ile
145 150 155 160
Pro Pro Leu Val Gly Trp Ala Ala Val Thr Gly Asp Leu Ser Trp Thr
165 170 175
Pro Trp Val Leu Phe Ala Leu Ile Phe Leu Trp Thr Pro Pro His Phe
180 185 190
Trp Ala Leu Ala Leu Met Ile Lys Asp Asp Tyr Ala Gln Val Asn Val
195 200 205
Pro Met Leu Pro Val Ile Ala Gly Glu Glu Lys Thr Val Ser Gln Ile
210 215 220
Trp Tyr Tyr Ser Leu Leu Val Val Pro Phe Ser Leu Leu Leu Val Tyr
225 230 235 240
Pro Leu His Gln Leu Gly Ile Leu Tyr Leu Ala Ile Ala Ile Ile Leu
245 250 255
Gly Gly Gln Phe Leu Val Lys Ala Trp Gln Leu Lys Gln Ala Pro Gly
260 265 270
Asp Arg Asp Leu Ala Arg Gly Leu Phe Lys Phe Ser Ile Phe Tyr Leu
275 280 285
Met Leu Leu Cys Leu Ala Met Val Ile Asp Ser Leu Pro Val Thr His
290 295 300
Gln Leu Val Ala Gln Met Gly Thr Leu Leu Leu Gly
305 310 315
<210>34
<211>324
<212>PRT
<213>集胞蓝细菌属种(Synechocystis sp)
<400>34
Met Ser Asp Thr Gln Asn Thr Gly Gln Asn Gln Ala Lys Ala Arg Gln
1 5 10 15
Leu Leu Gly Met Lys Gly Ala Ala Pro Gly Glu Ser Ser Ile Trp Lys
20 25 30
Ile Arg Leu Gln Leu Met Lys Pro Ile Thr Trp Ile Pro Leu Ile Trp
35 40 45
Gly Val Val Cys Gly Ala Ala Ser Ser Gly Gly Tyr Ile Trp Ser Val
50 55 60
Glu Asp Phe Leu Lys Ala Leu Thr Cys Met Leu Leu Ser Gly Pro Leu
65 70 75 80
Met Thr Gly Tyr Thr Gln Thr Leu Asn Asp Phe Tyr Asp Arg Asp Ile
85 90 95
Asp Ala Ile Asn Glu Pro Tyr Arg Pro Ile Pro Ser Gly Ala Ile Ser
100 105 110
Val Pro Gln Val Val Thr Gln Ile Leu Ile Leu Leu Val Ala Gly Ile
115 120 125
Gly Val Ala Tyr Gly Leu Asp Val Trp Ala Gln His Asp Phe Pro Ile
130 135 140
Met Met Val Leu Thr Leu Gly Gly Ala Phe Val Ala Tyr Ile Tyr Ser
145 150 155 160
Ala Pro Pro Leu Lys Leu Lys Gln Asn Gly Trp Leu Gly Asn Tyr Ala
165 170 175
Leu Gly Ala Ser Tyr Ile Ala Leu Pro Trp Trp Ala Gly His Ala Leu
180 185 190
Phe Gly Thr Leu Asn Pro Thr Ile Met Val Leu Thr Leu Ile Tyr Ser
195 200 205
Leu Ala Gly Leu Gly Ile Ala Val Val Asn Asp Phe Lys Ser Val Glu
210 215 220
Gly Asp Arg Gln Leu Gly Leu Lys Ser Leu Pro Val Met Phe Gly Ile
225 230 235 240
Gly Thr Ala Ala Trp Ile Cys Val Ile Met Ile Asp Val Phe Gln Ala
245 250 255
Gly Ile Ala Gly Tyr Leu Ile Tyr Val His Gln Gln Leu Tyr Ala Thr
260 265 270
Ile Val Leu Leu Leu Leu Ile Pro Gln Ile Thr Phe Gln Asp Met Tyr
275 280 285
Phe Leu Arg Asn Pro Leu Glu Asn Asp Val Lys Tyr Gln Ala Ser Ala
290 295 300
Gln Pro Phe Leu Val Phe Gly Met Leu Ala Thr Gly Leu Ala Leu Gly
305 310 315 320
His Ala Gly Ile
<210>35
<211>307
<212>PRT
<213>集胞蓝细菌属种(Synechocystis sp)
<400>35
Met Thr Glu Ser Ser Pro Leu Ala Pro Ser Thr Ala Pro Ala Thr Arg
1 5 10 15
Lys Leu Trp Leu Ala Ala Ile Lys Pro Pro Met Tyr Thr Val Ala Val
20 25 30
Val Pro Ile Thr Val Gly Ser Ala Val Ala Tyr Gly Leu Thr Gly Gln
35 40 45
Trp His Gly Asp Val Phe Thr Ile Phe Leu Leu Ser Ala Ile Ala Ile
50 55 60
Ile Ala Trp Ile Asn Leu Ser Asn Asp Val Phe Asp Ser Asp Thr Gly
65 70 75 80
Ile Asp Val Arg Lys Ala His Ser Val Val Asn Leu Thr Gly Asn Arg
85 90 95
Asn Leu Val Phe Leu Ile Ser Asn Phe Phe Leu Leu Ala Gly Val Leu
100 105 110
Gly Leu Met Ser Met Ser Trp Arg Ala Gln Asp Trp Thr Val Leu Glu
115 120 125
Leu Ile Gly Val Ala Ile Phe Leu Gly Tyr Thr Tyr Gln Gly Pro Pro
130 135 140
Phe Arg Leu Gly Tyr Leu Gly Leu Gly Glu Leu Ile Cys Leu Ile Thr
145 150 155 160
Phe Gly Pro Leu Ala Ile Ala Ala Ala Tyr Tyr Ser Gln Ser Gln Ser
165 170 175
Phe Ser Trp Asn Leu Leu Thr Pro Ser Val Phe Val Gly Ile Ser Thr
180 185 190
Ala Ile Ile Leu Phe Cys Ser His Phe His Gln Val Glu Asp Asp Leu
195 200 205
Ala Ala Gly Lys Lys Ser Pro Ile Val Arg Leu Gly Thr Lys Leu Gly
210 215 220
Ser Gln Val Leu Thr Leu Ser Val Val Ser Leu Tyr Leu Ile Thr Ala
225 230 235 240
Ile Gly Val Leu Cys His Gln Ala Pro Trp Gln Thr Leu Leu Ile Ile
245 250 255
Ala Ser Leu Pro Trp Ala Val Gln Leu Ile Arg His Val Gly Gln Tyr
260 265 270
His Asp Gln Pro Glu Gln Val Ser Asn Cys Lys Phe Ile Ala Val Asn
275 280 285
Leu His Phe Phe Ser Gly Met Leu Met Ala Ala Gly Tyr Gly Trp Ala
290 295 300
Gly Leu Gly
305
<210>36
<211>927
<212>DNA
<213>集胞蓝细菌属种(Synechocystis sp)
<400>36
atggcaacta tccaagcttt ttggcgcttc tcccgccccc ataccatcat tggtacaact 60
ctgagcgtct gggctgtgta tctgttaact attctcgggg atggaaactc agttaactcc 120
cctgcttccc tggatttagt gttcggcgct tggctggcct gcctgttggg taatgtgtac 180
attgtcggcc tcaaccaatt gtgggatgtg gacattgacc gcatcaataa gccgaatttg 240
cccctagcta acggagattt ttctatcgcc cagggccgtt ggattgtggg actttgtggc 300
gttgcttcct tggcgatcgc ctggggatta gggctatggc tggggctaac ggtgggcatt 360
agtttgatta ttggcacggc ctattcggtg ccgccagtga ggttaaagcg cttttccctg 420
ctggcggccc tgtgtattct gacggtgcgg ggaattgtgg ttaacttggg cttattttta 480
ttttttagaa ttggtttagg ttatcccccc actttaataa cccccatctg ggttttgact 540
ttatttatct tagttttcac cgtggcgatc gccattttta aagatgtgcc agatatggaa 600
ggcgatcggc aatttaagat tcaaacttta actttgcaaa tcggcaaaca aaacgttttt 660
cggggaacct taattttact cactggttgt tatttagcca tggcaatctg gggcttatgg 720
gcggctatgc ctttaaatac tgctttcttg attgtttccc atttgtgctt attagcctta 780
ctctggtggc ggagtcgaga tgtacactta gaaagcaaaa ccgaaattgc tagtttttat 840
cagtttattt ggaagctatt tttcttagag tacttgctgt atcccttggc tctgtggtta 900
cctaattttt ctaatactat tttttag 927
<210>37
<211>308
<212>PRT
<213>集胞蓝细菌属种(Synechocystis sp)
<400>37
Met Ala Thr Ile Gln Ala Phe Trp Arg Phe Ser Arg Pro His Thr Ile
1 5 10 15
Ile Gly Thr Thr Leu Ser Val Trp Ala Val Tyr Leu Leu Thr Ile Leu
20 25 30
Gly Asp Gly Asn Ser Val Asn Ser Pro Ala Ser Leu Asp Leu Val Phe
35 40 45
Gly Ala Trp Leu Ala Cys Leu Leu Gly Asn Val Tyr Ile Val Gly Leu
50 55 60
Asn Gln Leu Trp Asp Val Asp Ile Asp Arg Ile Asn Lys Pro Asn Leu
65 70 75 80
Pro Leu Ala Asn Gly Asp Phe Ser Ile Ala Gln Gly Arg Trp Ile Val
85 90 95
Gly Leu Cys Gly Val Ala Ser Leu Ala Ile Ala Trp Gly Leu Gly Leu
100 105 110
Trp Leu Gly Leu Thr Val Gly Ile Ser Leu Ile Ile Gly Thr Ala Tyr
115 120 125
Ser Val Pro Pro Val Arg Leu Lys Arg Phe Ser Leu Leu Ala Ala Leu
130 135 140
Cys Ile Leu Thr Val Arg Gly Ile Val Val Asn Leu Gly Leu Phe Leu
145 150 155 160
Phe Phe Arg Ile Gly Leu Gly Tyr Pro Pro Thr Leu Ile Thr Pro Ile
165 170 175
Trp Val Leu Thr Leu Phe Ile Leu Val Phe Thr Val Ala Ile Ala Ile
180 185 190
Phe Lys Asp Val Pro Asp Met Glu Gly Asp Arg Gln Phe Lys Ile Gln
195 200 205
Thr Leu Thr Leu Gln Ile Gly Lys Gln Asn Val Phe Arg Gly Thr Leu
210 215 220
Ile Leu Leu Thr Gly Cys Tyr Leu Ala Met Ala Ile Trp Gly Leu Trp
225 230 235 240
Ala Ala Met Pro Leu Ash Thr Ala Phe Leu Ile Val Ser His Leu Cys
245 250 255
Leu Leu Ala Leu Leu Trp Trp Arg Ser Arg Asp Val His Leu Glu Ser
260 265 270
Lys Thr Glu Ile Ala Ser Phe Tyr Gln Phe Ile Trp Lys Leu Phe Phe
275 280 285
Leu Glu Tyr Leu Leu Tyr Pro Leu Ala Leu Trp Leu Pro Asn Phe Ser
290 295 300
Asn Thr Ile Phe
305
<210>38
<211>1092
<212>DNA
<213>集胞蓝细菌属种(Synechocystis sp)
<400>38
atgaaatttc cgccccacag tggttaccat tggcaaggtc aatcaccttt ctttgaaggt 60
tggtacgtgc gcctgctttt gccccaatcc ggggaaagtt ttgcttttat gtactccatc 120
gaaaatcctg ctagcgatca tcattacggc ggcggtgctg tgcaaatttt agggccggct 180
acgaaaaaac aagaaaatca ggaagaccaa cttgtttggc ggacatttcc ctcggtaaaa 240
aaattttggg ccagtcctcg ccagtttgcc ctagggcatt ggggaaaatg tagggataac 300
aggcaggcga aacccctact ctccgaagaa ttttttgcca cggtcaagga aggttatcaa 360
atccatcaaa atcagcacca aggacaaatc attcatggcg atcgccattg tcgttggcag 420
ttcaccgtag aaccggaagt aacttggggg agtcctaacc gatttcctcg ggctacagcg 480
ggttggcttt cctttttacc cttgtttgat cccggttggc aaattctttt agcccaaggt 540
agagcgcacg gctggctgaa atggcagagg gaacagtatg aatttgacca cgccctagtt 600
tatgccgaaa aaaattgggg tcactccttt ccctcccgct ggttttggct ccaagcaaat 660
tattttcctg accatccagg actgagcgtc actgccgctg gcggggaacg gattgttctt 720
ggtcgccccg aagaggtagc tttaattggc ttacatcacc aaggtaattt ttacgaattt 780
ggcccgggcc atggcacagt cacttggcaa gtagctccct ggggccgttg gcaattaaaa 840
gccagcaatg ataggtattg ggtcaagttg tccggaaaaa cagataaaaa aggcagttta 900
gtccacactc ccaccgccca gggcttacaa ctcaactgcc gagataccac taggggctat 960
ttgtatttgc aattgggatc tgtgggtcac ggcctgatag tgcaagggga aacggacacc 1020
gcggggctag aagttggagg tgattggggt ttaacagagg aaaatttgag caaaaaaaca 1080
gtgccattct ga 1092
<210>39
<211>363
<212>PRT
<213>集胞蓝细菌属种(Synechocystis sp)
<400>39
Met Lys Phe Pro Pro His Ser Gly Tyr His Trp Gln Gly Gln Ser Pro
1 5 10 15
Phe Phe Glu Gly Trp Tyr ValArg Leu Leu Leu Pro Gln Ser Gly Glu
20 25 30
Ser Phe Ala Phe Met Tyr Ser Ile Glu Asn Pro Ala Ser Asp His His
35 40 45
Tyr Gly Gly Gly Ala Val Gln Ile Leu Gly Pro Ala Thr Lys Lys Gln
50 55 60
Glu Asn Gln Glu Asp Gln Leu Val Trp Arg Thr Phe Pro Ser Val Lys
65 70 75 80
Lys Phe Trp Ala Ser Pro Arg Gln Phe Ala Leu Gly His Trp Gly Lys
85 90 95
Cys Arg Asp Asn Arg Gln Ala Lys Pro Leu Leu Ser Glu Glu Phe Phe
100 105 110
Ala Thr Val Lys Glu Gly Tyr Gln Ile His Gln Asn Gln His Gln Gly
115 120 125
Gln Ile Ile His Gly Asp Arg His Cys Arg Trp Gln Phe Thr Val Glu
130 135 140
Pro Glu Val Thr Trp Gly Ser Pro Asn Arg Phe Pro Arg Ala Thr Ala
145 150 155 160
Gly Trp Leu Ser Phe Leu Pro Leu Phe Asp Pro Gly Trp Gln Ile Leu
165 170 175
Leu Ala Gln Gly Arg Ala His Gly Trp Leu Lys Trp Gln Arg Glu Gln
180 185 190
Tyr Glu Phe Asp His Ala Leu Val Tyr Ala Glu Lys Ash Trp Gly His
195 200 205
Ser Phe Pro Ser Arg Trp Phe Trp Leu Gln Ala Asn Tyr Phe Pro Asp
210 215 220
His Pro Gly Leu Ser Val Thr Ala Ala Gly Gly Glu Arg Ile Val Leu
225 230 235 240
Gly Arg Pro Glu Glu Val Ala Leu Ile Gly Leu His His Gln Gly Asn
245 250 255
Phe Tyr Glu Phe Gly Pro Gly His Gly Thr Val Thr Trp Gln Val Ala
260 265 270
Pro Trp Gly Arg Trp Gln Leu Lys Ala Ser Asn Asp Arg Tyr Trp Val
275 280 285
Lys Leu Ser Gly Lys Thr Asp Lys Lys Gly Ser Leu Val His Thr Pro
290 295 300
Thr Ala Gln Gly Leu Gln Leu Asn Cys Arg Asp Thr Thr Arg Gly Tyr
305 310 315 320
Leu Tyr Leu Gln Leu Gly Ser Val Gly His Gly Leu Ile Val Gln Gly
325 330 335
Glu Thr Asp Thr Ala Gly Leu Glu Val Gly Gly Asp Trp Gly Leu Thr
340 345 350
Glu Glu Asn Leu Ser Lys Lys Thr Val Pro Phe
355 360
<210>40
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>40
cgcgatttaa atggcgcgcc ctgcaggcgg ccgcctgcag ggcgcgccat ttaaat 56
<210>41
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>41
tcgaggatcc gcggccgcaa gcttcctgca gg 32
<210>42
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>42
tcgacctgca ggaagcttgc ggccgcggat cc 32
<210>43
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>43
tcgacctgca ggaagcttgc ggccgcggat cc 32
<210>44
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>44
tcgaggatcc gcggccgcaa gcttcctgca gg 32
<210>45
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>45
tcgaggatcc gcggccgcaa gcttcctgca ggagct 36
<210>46
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>46
cctgcaggaa gcttgcggcc gcggatcc 28
<210>47
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>47
tcgacctgca ggaagcttgc ggccgcggat ccagct 36
<210>48
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>48
ggatccgcgg ccgcaagctt cctgcagg 28
<210>49
<211>39
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>49
gatcacctgc aggaagcttg cggccgcgga tccaatgca 39
<210>50
<211>31
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>50
ttggatccgc ggccgcaagc ttcctgcagg t 31
<210>51
<211>41
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>51
ggatccgcgg ccgcacaatg gagtctctgc tctctagttc t 41
<210>52
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>52
ggatcctgca ggtcacttca aaaaaggtaa cagcaagt 38
<210>53
<211>45
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>53
ggatccgcgg ccgcacaatg gcgttttttg ggctctcccg tgttt 45
<210>54
<211>40
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>54
ggatcctgca ggttattgaa aacttcttcc aagtacaact 40
<210>55
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>55
ggatccgcgg ccgcacaatg tggcgaagat ctgttgtt 38
<210>56
<211>37
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>56
ggatcctgca ggtcatggag agtagaagga aggagct 37
<210>57
<211>50
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>57
ggatccgcgg ccgcacaatg gtacttgccg aggttccaaa gcttgcctct 50
<210>58
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>58
ggatcctgca ggtcacttgt ttctggtgat gactctat 38
<210>59
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>59
ggatccgcgg ccgcacaatg acttcgattc tcaacact 38
<210>60
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>60
ggatcctgca ggtcagtgtt gcgatgctaa tgccgt 36
<210>61
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>61
taatgtgtac attgtcggcc tc 22
<210>62
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>62
gcaatgtaac atcagagatt ttgagacaca acgtggcttt ccacaattcc ccgcaccgtc 60
<210>63
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>63
aggctaataa gcacaaatgg ga 22
<210>64
<211>63
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>64
ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggaattgg tttaggttat 60
ccc 63
<210>65
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>65
ggatccatgg ttgcccaaac cccatc 26
<210>66
<211>61
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>66
gcaatgtaac atcagagatt ttgagacaca acgtggcttt gggtaagcaa caatgaccgg 60
c 61
<210>67
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>67
gaattctcaa agccagccca gtaac 25
<210>68
<211>63
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>68
ggtatgagtc agcaacacct tcttcacgag gcagacctca gcgggtgcga aaagggtttt 60
ccc 63
<210>69
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>69
ccagtggttt aggctgtgtg gtc 23
<210>70
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>70
ctgagttgga tgtattggat c 21
<210>71
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>71
ggatccatgg ttacttcgac aaaaatcc 28
<210>72
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>72
gcaatgtaac atcagagatt ttgagacaca acgtggcttt gctaggcaac cgcttagtac 60
<210>73
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>73
gaattcttaa cccaacagta aagttccc 28
<210>74
<211>63
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>74
ggtatgagtc agcaacacct tcttcacgag gcagacctca gcgccggcat tgtcttttac 60
atg 63
<210>75
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>75
ggaacccttg cagccgcttc 20
<210>76
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>76
gtatgcccaa ctggtgcaga gg 22
<210>77
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>77
ggatccatgt ctgacacaca aaataccg 28
<210>78
<211>62
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>78
gcaatgtaac atcagagatt ttgagacaca acgtggcttt cgccaatacc agccaccaac 60
ag 62
<210>79
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>79
gaattctcaa atccccgcat ggcctag 27
<210>80
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>80
ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggcctacg gcttggacgt 60
gtggg 65
<210>81
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>81
cacttggatt cccctgatct g 21
<210>82
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>82
gcaatacccg cttggaaaac g 21
<210>83
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>83
ggatccatga ccgaatcttc gcccctagc 29
<210>84
<211>61
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>84
gcaatgtaac atcagagatt ttgagacaca acgtggcttt caatcctagg tagccgaggc 60
g 61
<210>85
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>85
gaattcttag cccaggccag cccagcc 27
<210>86
<211>66
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>86
ggtatgagtc agcaacacct tcttcacgag gcagacctca gcggggaatt gatttgttta 60
attacc 66
<210>87
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>87
gcgatcgcca ttatcgcttg g 21
<210>88
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>88
gcagactggc aattatcagt aacg 24
<210>89
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>89
ccatggattc gagtaaagtt gtcgc 25
<210>90
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的说明:寡核苷酸
<400>90
gaattcactt caaaaaaggt aacag 25
<210>91
<211>4550
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>91
attttacacc aatttgatca cttaactaaa ttaattaaat tagatgatta tcccaccata 60
tttttgagca ttaaaccata aaaccatagt tataagtaac tgttttaatc gaatatgact 120
cgattaagat taggaaaaat ttataaccgg taattaagaa aacattaacc gtagtaaccg 180
taaatgccga ttcctccctt gtctaaaaga cagaaaacat atattttatt ttgccccata 240
tgtttcactc tatttaattt caggcacaat acttttggtt ggtaacaaaa ctaaaaagga 300
caacacgtga tacttttcct cgtccgtcag tcagattttt tttaaactag aaacaagtgg 360
caaatctaca ccacattttt tgcttaatct attaacttgt aagttttaaa ttcctaaaaa 420
agtctaacta attcttctaa tataagtaca ttccctaaat ttcccaaaaa gtcaaattaa 480
taattttcaa aatctaatct aaatatctaa taattcaaaa tcattaaaaa gacacgcaac 540
aatgacacca attaatcatc ctcgacccac acaattctac agttctcatg ctaaaccata 600
ttttttgctc tctgttcctt caaaatcatt tctttctctt ctttgattcc caaagatcac 660
ttctttgtct ttgatttttg attttttttc tctctggcgt gaaggaagaa gctttatttc 720
atggagtctc tgctctctag ttcttctctt gtttccgctg gtaaatctcg tccttttctg 780
gtttcaggtt ttatttgttg tttaggtttc gtttttgtga ttcagaacca tacaaaaagt 840
ttgaactttt ctgaatataa aataaggaaa aagtttcgat ttttataatg aattgtttac 900
tagatcgaag taggtgacaa aggttattgt gtggagaagc ataatttctg ggcttgactt 960
tgaattttgt ttctcatgca tgcaacttat caatcagctg gtgggttttg ttggaagaag 1020
cagaatctaa agctccactc tttatcaggt tcgttagggt tttatgggtt tttgaaatta 1080
aatactcaat catcttagtc tcattattct attggttgaa tcacattttc taatttggaa 1140
tttatgagac aatgtatgtt ggacttagtt gaagttcttc tctttggtta tagttgaagt 1200
gttactgatg ttgtttagct ctttacacca atatatacac ccaattttgc agaaatccga 1260
gttctgcgtt gtgattcgag taaagttgtc gcaaaaccga agtttaggaa caatcttgtt 1320
aggcctgatg gtcaaggatc ttcattgttg ttgtatccaa aacataagtc gagatttcgg 1380
gttaatgcca ctgcgggtca gcctgaggct ttcgactcga atagcaaaca gaagtctttt 1440
agagactcgt tagatgcgtt ttacaggttt tctaggcctc atacagttat tggcacagtt 1500
aagtttctct ttaaaaatgt aactctttta aaacgcaatc tttcagggtt ttcaaggaga 1560
taacattagc tctgtgattg gatttgcagg tgcttagcat tttatctgta tctttcttag 1620
cagtagagaa ggtttctgat atatctcctt tacttttcac tggcatcttg gaggtaatga 1680
atatataaca cataatgacc gatgaagaag atacattttt ttcgtctctc tgtttaaaca 1740
attgggtttt gttttcaggc tgttgttgca gctctcatga tgaacattta catagttggg 1800
ctaaatcagt tgtctgatgt tgaaatagat aaggtaacat gcaaattttc ttcatatgag 1860
ttcgagagac tgatgagatt aatagcagct agtgcctaga tcatctctat gtgggttttt 1920
gcaggttaac aagccctatc ttccattggc atcaggagaa tattctgtta acaccggcat 1980
tgcaatagta gcttccttct ccatcatggt atggtgccat tttcacaaaa tttcaacttt 2040
tagaattcta taagttactg aaatagtttg ttataaatcg ttatagagtt tctggcttgg 2100
gtggattgtt ggttcatggc cattgttctg ggctcttttt gtgagtttca tgctcggtac 2160
tgcatactct atcaatgtaa gtaagtttct caatactaga atttggctca aatcaaaatc 2220
tgcagtttct agttttaggt taatgaggtt ttaataactt acttctacta caaacagttg 2280
ccacttttac ggtggaaaag atttgcattg gttgcagcaa tgtgtatcct cgctgtccga 2340
gctattattg ttcaaatcgc cttttatcta catattcagg tactaaacca ttttccttat 2400
gttttgtagt tgttttcatc aaaatcactt ttatattact aaagctgtga aactttgttg 2460
cagacacatg tgtttggaag accaatcttg ttcactaggc ctcttatttt cgccactgcg 2520
tttatgagct ttttctctgt cgttattgca ttgtttaagg taaacaaaga tggaaaaaga 2580
ttaaatctat gtatacttaa agtaaagcat tctactgtta ttgatgagaa gttttctttt 2640
ttggttggat gcaggatata cctgatatcg aaggggataa gatattcgga atccgatcat 2700
tctctgtaac tctgggtcag aaacgggtac gatatctaaa ctaaagaaat tgttttgact 2760
caagtgttgg attaagatta cagaagaaag aaaactgttt ttgtttcttg caaaattcag 2820
gtgttttgga catgtgttac actacttcaa atggcttacg ctgttgcaat tctagttgga 2880
gccacatctc cattcatatg gagcaaagtc atctcggtaa caatctttct ttacccatcg 2940
aaaactcgct aattcatcgt ttgagtggta ctggtttcat tttgttccgt tctgttgatt 3000
ttttttcagg ttgtgggtca tgttatactc gcaacaactt tgtgggctcg agctaagtcc 3060
gttgatctga gtagcaaaac cgaaataact tcatgttata tgttcatatg gaaggttaga 3120
ttcgtttata aatagagtct ttactgcctt tttatgcgct ccaatttgga attaaaatag 3180
cctttcagtt tcatcgaatc accattatac tgataaattc tcatttctgc atcagctctt 3240
ttatgcagag tacttgctgt tacctttttt gaagtgactg acattagaag agaagaagat 3300
ggagataaaa gaataagtca tcactatgct tctgttttta ttacaagttc atgaaattag 3360
gtagtgaact agtgaattag agttttattc tgaaacatgg cagactgcaa aaatatgtca 3420
aagatatgaa tttctgttgg gtaaagaagt ctctgcttgg gcaaaatctt aaggttcggt 3480
gtgttgatat aatgctaagc gaagaaatcg attctatgta gaaatttccg aaactatgtg 3540
taaacatgtc agaacatctc cattctatat cttcttctgc aagaaagctc tgtttttatc 3600
acctaaactc tttatctctg tgtagttaag atatgtatat gtacgtgact acattttttt 3660
gttgatgtaa tttgcagaac gtatggattt ttgttagaaa gcatgagttc gaaagtatat 3720
gtttatatat atggataatt cagacctaac gtcgaagctc acaagcataa attcactact 3780
atagtttgct ctgtaataga tagttccatt gatgtcttga aactgtacgt aactgcctgg 3840
gcgttttgtg gttgatactg actactgagt gttctttgtg agtgttgtaa gtatacaaga 3900
agaagaatat aggctcacgg gaacgactgt ggtggaagat gaaatggaga tcatcacgta 3960
gcggctttgc caaagaccga gtcacgatcg agtctatgaa gtctttacag ctgctgatta 4020
tgattgacca ttgcttagag acgcattgga atcttactag ggacttgcct gggagtttct 4080
tcaagtacgt gtcagatcat acgatgtagg agatttcacg gctttgatgt gtttgtttgg 4140
agtcacaatg cttaatgggc ttattggccc aataatagct agctcttttg ctttagccgt 4200
ttcgtttgtc ccctggtggt gagtattatt agggtatggt gtgaccaaag tcaccagacc 4260
tagagtgaat ctagtagagt cctagaccat ggtccatggc ttttatttgt aatttgaaaa 4320
atgaacaatt ctttttgtaa ggaaaacttt tatatagtag acgtttacta tatagaaact 4380
agttgaacta acttcgtgca attgcataat aatggtgtga aatagagggt gcaaaactca 4440
ataaacattt cgacgtacca agagttcgaa acaataagca aaatagattt ttttgcttca 4500
gactaatttg tacaatgaat ggttaataaa ccattgaagc ttttattaat 4550
<210>92
<211>4450
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>92
tttaggttac aaaatcaatg atattgcgta tgtcaactat aaaagccaaa agtaaagcct 60
cttgtttgac cagaaggtca tgatcattgt atacatacag ccaaactacc tcctggaaga 120
aaagacatgg atcccaaaca acaacaatag cttcttttac aagaaccagt agtaactagt 180
cactaatcta aaagagttaa gtttcagctt ttctggcaat ggctccttga tcatttcaat 240
cctgaaggag acccactttg tagcaagacc atgtcctctg tttcacttac agtgtgtctc 300
aaaagtctac ttcaattctt catatatagg ttcctcacac tacagcttca tcctcattcg 360
ttgacagaga gagagtcttt attgaaaact tcttccaagt acaactccac taaatataat 420
agcaccaaac cacttgttcg acacaaatct gtacagatat aaaaacacta ttaggttttc 480
caaggcaaat cacataattg gattgtgaaa gagtacaaaa gataaaccca aattttcata 540
ctttctactg cagtcagcac cagatgataa gtcagctgtc cctatttgcc atcctaactg 600
tcctgatgca gcggccagtg atgcgtaata ttgccaccct taatcattag agcgagaaac 660
aaaaagaatc aaaagacagt aaatggaatt aggaatcaca aatgagtcct tgtaaagttt 720
attgagtacc gagatctgca ctgaatccag aaagtgcaag aaaacctatg gatgctgtgc 780
caaatccagt taaccaaagc tttgtattat caccgaatct aagggctgtt gacttaacac 840
caacttttac atcatcttct ttgtcctgga gacacaatat attagacatt agtccatgga 900
aaaaaaatga tttaacctag aatatctcaa aattacttgc ataaaaactg aacttgagct 960
gaaattttgg gttcgtagct tgtggcatat actatttcat tttcaatggg ccacaaaggt 1020
aactttcttt tctcacttct gttgcaaacg ggaagacttt tatggggcta actcttcact 1080
taaagtatag aaatcagatg gaaaaggtgg gagatcaggg taattttctt ctttatgatt 1140
gacaaaagtc gaacatcgaa atggatgcat ttgcatgaga catgaaacaa aagctgaaaa 1200
agaaatctgt ggtggtgaag ctagaaaaag aaaacaaagc aagcaatatg cacacattga 1260
gattaactac tttgctactg gtcataatca aatagatttt gaagctaaaa aataaaaagt 1320
gaatatacct gatgtgcata aatagtatca taaacaaggg tccagcagac tccggagaga 1380
tagagaggga gtacaataga tggtgctatg cttcctttaa ctgcagtcca tcctaacaat 1440
gctccccagt ttatggtcaa acctaaaaag gcttgaggct gcaattataa aaacgaatca 1500
atcataagaa aatcagaaaa tatataatgt ctaactttga gaagccagaa tagatttaaa 1560
ttacccaaaa tgtaaacctc ttcataagtg ggtaggaaaa gacaagtaac aaagatgaag 1620
cccctaaaac acggctgcag aatatacata ctgaaatgag ctcaagtaga aaagaatttg 1680
atcacaaaac taaagacaag acctgagaac atatcttcag aatttgggcc aactacataa 1740
gggtgaacca tatgtgtatg tgaattttta aacaaacact tgcaaatacg cgactttagg 1800
gcaagtaaaa aatccaaaca aacctgtaat tgttaagttg gagaagaatc cctaagccta 1860
aaagcaactg cagcccgaga aatccaatcc cttgaaatgg tgtcaaaaga ccactggcga 1920
taggtcttag ttttgtacga tcaacctgga tataaaagaa atttgtaaga caacataatc 1980
taaaacaaaa caaccataca aaatcttgag ctttacatac aagcaaccca tctttgttta 2040
tggaagaatg aatccagtta catgaatgct gtgtatctac cctaactact aaacacatat 2100
ttcaatcgaa aaacatattc caccttcacc atatctaaca cctgaagtct ttcacttttt 2160
gaacgaagtc atcagaacat gcagataagc tattacccaa aacagagata tgactggaaa 2220
tgttgtcgta aattgatcca acatagaaaa atcaagacca gttccagatg tcaaagcaat 2280
aacactttcc caccatggtt acagaaacca tagttacaca aaacatgttt cctaaaccaa 2340
catactaaag ggatatataa atttgacatc actttatcac cataccataa gatagcttaa 2400
aaacaaactg acctttgtat ctatgtcctg atcaagcaga tcatttatag tacaaccagc 2460
acctctaaga agtaatgctc cgcaaccaaa taaagccata tatttaaaac ttggaaggct 2520
tccaggatca gcagccaacg caatcgacct atacaacaat gatggagatt cagagtatcg 2580
atctatttac atagctctgg aactagatcc atgacgaaac atggaacatc gttataatat 2640
ctaaagactt ccaaacagat tcctgagtaa gaaacccagt ggaactatag tactgtaaca 2700
tatataaaat caaagaaaac tcaggtttat agcattatcc aatcctgatt tctgccaatc 2760
cttaaccact ctcccatgct atcaaaaacc tcagctcaag atcatactac ctaattgcct 2820
atgagctctt gggaagatca ttatggattt gataactgaa aaaagtaaca gagaaatagc 2880
agactgcaag aactactcca aacttctcca ctgatatgta tgtagtctaa caataataaa 2940
cagacataaa ttcttttatc aagcttcaag agcaagttag tcagaaaaca tcacagccaa 3000
accaaccagg aaaacacata actttatcac ataaaactaa atttaatgta atctgactta 3060
acataaacca tcctttggga cgaaaggaaa ctatataaac atgcagtctt tctttccctc 3120
agctattctt tcggatggat tataatgaat ctcaaaagtg aaatgtcttg attctcagct 3180
acattactca aaggcgaaga taaacttacc acatacaagg ccacgcaagc aaccaagttc 3240
caatgggttt atccaatcga gcaagcttag cataacctct aacttcttct ggtaaataca 3300
aatctatcca agaagcttcc ttaacaacaa caccatcact cttctcctta tcatctttct 3360
tcggctttcc ctccaaaacc gaagaagacg acgacattcc acaaattaat ctgtaattcc 3420
aaccaacacc aaaaaacttc tcctgatgca attctcttcc tttactccat acttggtaat 3480
tatcattcca tgaaggataa cacttagtga aaggatttgt gtaatgggta gtcacaggat 3540
tggacaagga tttatgttgt gattgcaaaa gagcagagga agaagatgga gttacggaga 3600
cggaagattt caacaaccgt cttgaaacac gggagagccc aaaaaacgcc atctttgaga 3660
gaaattgttg cctggaagaa acaaagactt gagatttcaa acgtaagtga attcttacga 3720
acgaaagcta acttctcaag agaatcagat tagtgattcc tcaaaaacaa acaaaactat 3780
ctaatttcag tttcgagtga tgaagcctta agaatctaga acctccatgg cgtttctaat 3840
ctctcagaga taatcgaatt ccttaaacaa tcaaagctta gaaagagaag aacaacaaca 3900
acaacaaaaa aaatcagatt aacaaccgac cagagagcaa cgacgacgcc ggcgagaaag 3960
agcacgtcgt ctcggagcaa gacttcttct ccagtaaccc ggatggatcg ttaatgggcc 4020
tgtagattat tatatttggg ccgaaacaat tgggtcagca aaaacttggg ggataatgaa 4080
gaaacacgta cagtatgcat ttaggctcca aattaattgg ccatataatt cgaatcagat 4140
aaactaatca acccctacct tacttatttc tcactgtttt tatttctacc ttagtagttg 4200
aagaaacact tttatttatc ttttcgggac ccaaatttga taggatcggg ccattactca 4260
tgagcgtcag acacatatta gccttatcag attagtgggg taaggttttt ttaattcggt 4320
aagaagcaac aatcaatgtc ggagaaatta aagaatctgc atgggcgtgg cgtgatgata 4380
tgtgcatatg gagtcagttg ccgatcatat ataactattt ataaactaca tataaagact 4440
actaatagat 4450
<210>93
<211>2850
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>93
aattaaaatt tgagcggtct aaaccattag accgtttaga gatccctcca acccaaaata 60
gtcgattttc acgtcttgaa catatattgg gccttaatct gtgtggttag taaagacttt 120
tattggtcaa agaaaaacaa ccatggccca acatgttgat acttttattt aattatacaa 180
gtacccctga attctctgaa atatatttga ttgacccaga tattaatttt aattatcatt 240
tcctgtaaaa gtgaaggagt caccgtgact cgtcgtaatc tgaaaccaat ctgttcatat 300
gatgaagaag tttctctcgt tctcctccaa cgcgtagaaa attctgacgg cttaacgatg 360
tggcgaagat ctgttgttta tcgtttctct tcaagaatct ctgtttcttc ttcgttacca 420
aaccctagac tgattccttg gtcccgcgaa ttatgtgccg ttaatagctt ctcccagcct 480
ccggtctcga cggaatcaac tgctaagtta gggatcactg gtgttagatc tgatgccaat 540
cgagtttttg ccactgctac tgccgccgct acagctacag ctaccaccgg tgagatttcg 600
tctagagttg cggctttggc tggattaggg catcactacg ctcgttgtta ttgggagctt 660
tctaaagcta aacttaggta tgtgtttact tttcttttct catgaaaaat ctgaaaattt 720
ccaattgttg gattcttaaa ttctcatttg ttttatggtt gtagtatgct tgtggttgca 780
acttctggaa ctgggtatat tctgggtacg ggaaatgctg caattagctt cccggggctt 840
tgttacacat gtgcaggaac catgatgatt gctgcatctg ctaattcctt gaatcaggtc 900
attgaaatgt tgagaagttc ataaatttcg aatccttgtt gtgtttatgt agttgatctt 960
gcttgcttat gtttatgtag ttgaaaagtt taaaaatttc taatccttgg tagttgatct 1020
cgcttgtttg ttttttcatt ttctagattt ttgagataag caatgattct aagatgaaaa 1080
gaacgatgct aaggccattg ccttcaggac gtattagtgt tccacacgct gttgcatggg 1140
ctactattgc tggtgcttct ggtgcttgtt tgttggccag caaggtgaat gtttgttttt 1200
ttatatgtga tttctttgtt ttatgaatgg gtgattgaga gattatggat ctaaactttt 1260
gcttccacga caaggttatt gcagactaat atgttggctg ctggacttgc atctgccaat 1320
cttgtacttt atgcgtttgt ttatactccg ttgaagcaac ttcaccctat caatacatgg 1380
gttggcgctg ttgttggtgc tatcccaccc ttgcttgggt aaatttttgt tccttttctt 1440
ctttatttta gcagattctg ttttgttgga tactgctttt aattcaaaat gtagtcatgg 1500
ttcaccaatt ctatgcttat ctattttgtg tgttgtcagg tgggcggcag cgtctggtca 1560
gatttcatac aattcgatga ttcttccagc tgctctttac ttttggcaga tacctcattt 1620
tatggccctt gcacatctct gccgcaatga ttatgcagct ggagggtaag accatatggt 1680
gtcatatgag attagaatgt ctccttccat gtagtgttga tcttgaacta gttcaatttc 1740
gtggaatgat cagagtgtcc tagatagtgt cacagcagtc gacattttag tggctagata 1800
atgagttctt tccgttagag ataaacattc gcgaacattg tttccagctt ccgcgaccca 1860
acttctgatt ttgtttcttg gtaccttgtt ttcagttaca agatgttgtc actctttgat 1920
ccgtcaggga agagaatagc agcagtggct ctaaggaact gcttttacat gatccctctc 1980
ggtttcatcg cctatgactg tgagtcttgt agattcatct tttttttgta gtttattgac 2040
tgcattgctg tatctgattt ttgctgttcc ttccaatttt tgtgacaggg gggttaacct 2100
caagttggtt ttgcctcgaa tcaacacttc tcacactagc aatcgctgca acagcatttt 2160
cattctaccg agaccggacc atgcataaag caaggaaaat gttccatgcc agtcttctct 2220
tccttcctgt tttcatgtct ggtcttcttc tacaccgtgt ctctaatgat aatcagcaac 2280
aactcgtaga agaagccgga ttaacaaatt ctgtatctgg tgaagtcaaa actcagaggc 2340
gaaagaaacg tgtggctcaa cctccggtgg cttatgcctc tgctgcaccg tttcctttcc 2400
tcccagctcc ttccttctac tctccatgat aacctttaag caagctattg aatttttgga 2460
aacagaaatt aaaaaaaaaa tctgaaaagt tcttaagttt aatctttggt taataatgaa 2520
gtggagaacg catacaagtt tatgtatttt ttctcatctc cacataattg tattttttct 2580
ctaagtatgt ttcaaatgat acaaaataca tactttatca attatctgat caaattgatg 2640
aatttttgag ctttgacgtg ttaggtctat ctaataaacg tagtaacgaa tttggttttg 2700
gaaatgaaat ccgataaccg atgatggtgt agagttaaac gattaaaccg ggttggttaa 2760
aggtctcgag tctcgacggc tgcggaaatc ggaaaatcac gattgaggac tttgagctgc 2820
cacgaagatg gcgatgaggt tgaaatcaat 2850
<210>94
<211>3660
<212>DNA
<213>拟南芥属种(Arabidopsis sp)
<400>94
tatttgtatt tttattgtta aattttatga tttcacccgg tatatatcat cccatattaa 60
tattagattt attttttggg ctttatttgg gttttcgatt taaactgggc ccattctgct 120
tcaatgaaac cctaatgggt tttgtttggg ctttggattt aaaccgggcc cattctgctt 180
caatgaaggt cctttgtcca acaaaactaa catccgacac aactagtatt gccaagagga 240
tcgtgccaca tggcagttat tgaatcaaag gccgccaaaa ctgtaacgta gacattactt 300
atctccggta acggacaacc actcgtttcc cgaaacagca actcacagac tcacaccact 360
ccagtctccg gcttaactac caccagagac gattctctct tccgtcggtt ctatgacttc 420
gattctcaac actgtctcca ccatccactc ttccagagtt acctccgtcg atcgagtcgg 480
agtcctctct cttcggaatt cggattccgt tgagttcact cgccggcgtt ctggtttctc 540
gacgttgatc tacgaatcac ccggtagtta gcattctgtt ggatagattg atgaatgttt 600
tcttcgattt tttttttact gatcttgttg tggatctctc gtagggcgga gatttgttgt 660
gcgtgcggcg gagactgata ctgataaagg tatgattttt tagttgtttt tattttctct 720
ctcttcaaaa ttctcttttc aaacactgtg gcgtttgaat ttccgacggc agttaaatct 780
cagacacctg acaaggcacc agccggtggt tcaagcatta accagcttct cggtatcaaa 840
ggagcatctc aagaaactgt aattttgttc atctcctcag aatcttttaa attatcatat 900
ttgtggataa tgatgtgtta gtttaggaat tttcctacta aaggtaatct cttttgagga 960
caagtcttgt ttttagctta gaaatgatgt gaaaatgttg tttgttagct aaaaagagtt 1020
tgttgttata ttctgtattc agaataaatg gaagattcgt cttcagctta caaaaccagt 1080
cacttggcct ccactggttt ggggagtcgt ctgtggtgct gctgcttcag gtaatcatac 1140
gaacctcttt tggatcatgc aatactgtac agaaagtttt ttcattttcc ttccaattgt 1200
ttcttctggc agggaacttt cattggaccc cagaggatgt tgctaagtcg attctttgca 1260
tgatgatgtc tggtccttgt cttactggct atacacaggt ctggttttac acaacaaaaa 1320
gctgacttgt tcttattcta gtgcatttgc ttggtgctac aataacctag acttgtcgat 1380
ttccagacaa tcaacgactg gtatgataga gatatcgacg caattaatga gccatatcgt 1440
ccaattccat ctggagcaat atcagagcca gaggtaactg agacagaaca ttgtgagctt 1500
ttatctcttt tgtgattctg atttctcctt actccttaaa atgcaggtta ttacacaagt 1560
ctgggtgcta ttattgggag gtcttggtat tgctggaata ttagatgtgt gggtaagttg 1620
gcccttctga cattaactag tacagttaaa gggcacatca gatttgctaa aatcttccct 1680
tatcaggcag ggcataccac tcccactgtc ttctatcttg ctttgggagg atcattgcta 1740
tcttatatat actctgctcc acctcttaag gtaagtttta ttcctaactt ccactctcta 1800
gtgataagac actccatcca agttttggag ttttgaatat cgatatctga actgatctca 1860
ttgcagctaa aacaaaatgg atgggttgga aattttgcac ttggagcaag ctatattagt 1920
ttgccatggt aagatatctc gtgtatcaat aatatatggc gttgttctca tctcattgat 1980
ttgtttcttg ctcacttgac tgataggtgg gctggccaag cattgtttgg cactcttacg 2040
ccagatgttg ttgttctaac actcttgtac agcatagctg gggtactctt ttggcaaacc 2100
ttttatgttg cttttttcgt tatctgttgt aatatgctct tgcttcatgt tgtacctttg 2160
tgataatgca gttaggaata gccattgtta acgacttcaa aagtgttgaa ggagatagag 2220
cattaggact tcagtctctc ccagtagctt ttggcaccga aactgcaaaa tggatatgcg 2280
ttggtgctat agacattact cagctttctg ttgccggtat gtactatcca ctgtttttgt 2340
gcagctgtgg cttctatttc ttttccttga tcttatcaac tggatattca ccaatggtaa 2400
agcacaaatt aatgaagctg aatcaacaaa ggcaaaacat aaaagtacat tctaatgaaa 2460
tgagctaatg aagaggaggc atctactttt atgtttcatt agtgtgattg atggattttc 2520
atttcatgct tctaaaacaa gtattttcaa cagtgtcatg aaataacaga acttatatct 2580
tcatttgtac ttttactagt ggatgagtta cacaatcatt gttatagaac caaatcaaag 2640
gtagagatca tcattagtat atgtctattt tggttgcagg atatctatta gcatctggga 2700
aaccttatta tgcgttggcg ttggttgctt tgatcattcc tcagattgtg ttccaggtaa 2760
agacgttaac agtctcacat tataattaat caaattcttg tcactcgtct gattgctaca 2820
ctcgcttcta taaactgcag tttaaatact ttctcaagga ccctgtcaaa tacgacgtca 2880
agtaccaggt aagtcaactt agtacacatg tttgtgttct tttgaaatat ctttgagagg 2940
tctcttaatc agaagttgct tgaaacactc atcttgatta caggcaagcg cgcagccatt 3000
cttggtgctc ggaatatttg taacggcatt agcatcgcaa cactgaaaaa ggcgtatttt 3060
gatggggttt tgtcgaaagc agaggtgttg acacatcaaa tgtgggcaag tgatggcatc 3120
aactagttta aaagattttg taaaatgtat gtaccgttat tactagaaac aactcctgtt 3180
gtatcaattt agcaaaacgg ctgagaaatt gtaattgatg ttaccgtatt tgcgctccat 3240
ttttgcattt cctgctcata tcgaggattg gggtttatgt tagttctgtc acttctctgc 3300
tttcagaatg tttttgtttt ctgtagtgga ttttaactat tttcatcact ttttgtattg 3360
attctaaaca tgtatccaca taaaaacagt aatatacaaa aatgatactt cctcaaactt 3420
tttataatct aaatctaaca actagctagt aacccaacta acttcataca attaatttga 3480
gaaactacaa agactagact atacatatgt tatttaacaa cttgaaactg tgttattact 3540
acctgatttt tttctattct acagccattt gatatgctgc aatcttaaca tatcaagtct 3600
cacgttgttg gacacaacat actatcacaa gtaagacacg aagtaaaacc aaccggcaac 3660