CN1852975A

CN1852975A - 转基因的高色氨酸植物

Info

Publication number: CN1852975A
Application number: CNA038156148A
Authority: CN
Inventors: 莉萨·M·韦弗; 蒂姆·N·奥尔马索夫; 加布里拉·瓦杜瓦; 梁继红; 玛格丽特·J·瓦拉戈纳; 蒂亚马冈德鲁·V·文卡蒂什; 西瓦林加纳·曼朱纳思
Original assignee: Monsanto Co
Current assignee: Monsanto Co
Priority date: 2002-05-03
Filing date: 2003-05-05
Publication date: 2006-10-25
Anticipated expiration: 2023-05-05
Also published as: US20110195175A1; US8158851B2; WO2003092363A2; AU2003253601A1; EP1571896A4; BR0309860A; EP1571896A2; CA2482879A1; WO2003092363A3; CA2482879C; CN1852975B; AU2003253601A8; US20030213010A1

Abstract

本发明提供通过在植物细胞中导入和表达编码邻氨基苯甲酸合酶的分离DNA片段来改变植物的色氨酸含量的方法。也提供用编码邻氨基苯甲酸合酶的分离DNA片段转化的转基因植物，以及来源于这些植物的人或动物的食物、种子和后代。

Description

转基因的高色氨酸植物

本申请要求于2002年5月3日提交的，美国临时申请系列号为60/377,727的权利。

许多重要的农作物，包括大豆和玉米的种子不包含营养完全的充足数量的几种氨基酸。这些氨基酸包括但不限于：色氨酸、异亮氨酸、缬氨酸、精氨酸、赖氨酸、甲硫氨酸和苏氨酸。因此，这些氨基酸的生物合成途径，和/或进入那些途径的代谢产物的生物合成途径，是用于增加这些植物的氨基酸含量的潜在的操作目标。

邻氨基苯甲酸合酶(AS，EC4.1.3.27)催化植物、真菌和细菌中从芳香氨基酸途径到生物合成色氨酸分出支路的第一反应。

邻氨基苯甲酸合酶(例如玉米邻氨基苯甲酸合酶)的最普遍形式是由2个亚基，α或TrpE亚基和β或TrpG亚基组成的异四聚体酶。2个α-亚基和2个β-亚基装配形成异四聚体的邻氨基苯甲酸合酶。也已经发现″单体″形式的AS包括具有TrpE和TrpG亚基活性的单个多肽链(例如苜蓿中华根瘤菌(Rhizobium meliloti))。当单体的邻氨基苯甲酸合酶只包括一类多肽时，单体邻氨基苯甲酸合酶的酶促活性形式一般是由2个这种单体多肽的同型二聚体组成的。异四聚体和单体的邻氨基苯甲酸合酶都在利用谷氨酰胺和分支酸的反应中催化形成邻氨基苯甲酸。在α-亚基(在此指″α-结构域″)上发现的结构域结合分支酸并除去烯醇丙酮酸侧链，而在β-亚基(在此指″β-结构域″)上发现的结构域将氨基从谷氨酰胺传递到羧酸和烯醇丙酮酸部分间的分支酸苯基环上的位置。

合成色氨酸的下一个反应是将磷酸核糖焦磷酸的磷酸核糖基部分传递到邻氨基苯甲酸上。吲哚环在2个步骤形成，包括将核糖基团异构转化为核酮糖，然后是环化反应以产生吲哚磷酸甘油。该途径中的最后反应由可能包含1个或2个亚基的单个酶催化。该反应实现吲哚甘油醛-3-磷酸的切割和吲哚基团与丝氨酸的缩合(Umbarger，Ann.Rev.Biochem.，47：555(1978))。

在较高等的植物和微生物中流入色氨酸途径的代谢产物显然受到色氨酸的邻氨基苯甲酸合酶反馈抑制的调节。色氨酸可阻断需要活化β-结构域和产生相对于α-结构域活性部位的氨通道途径的构像重排。这种色氨酸的反馈抑制被认为降低了经邻氨基苯甲酸合酶的色氨酸的生产。参见Li J.和Last，R.L.，拟南芥(Arabidopsis thaliana)trp5突变株具有抗反馈的邻氨基苯甲酸合酶和升高的可溶解色氨酸The Arabidopsis thaliana trp5 mutant has afeedback-resistant anthranilate synthase and elevated soluble tryptophan(植物生理学Plant Physiol.，110：51-59(1996))。

已经鉴定几个氨基酸残基涉及来自鼠伤寒沙门氏菌(Salmonellatyphimurium)的邻氨基苯甲酸合酶复合物的反馈调节。这种信息提供了氨基末端调节位点的证据(生物化学杂志J.Biol.Chem.，266：8328-8335(1991))。Niyogi等人已经使用分子的方法进一步表征来自某些植物的邻氨基苯甲酸合酶。参见，Niyogi和Fink，植物细胞Plant Cell，4：721(1992)和Niyogi等人，植物细胞Plant Cell，5：1011(1993)。他们发现拟南芥邻氨基苯甲酸合酶的α-亚基是由2个紧密相关的、分别调节的非等位基因编码的。这些α-亚基基因中的一个，ASA1，是由创伤和细菌性病原体浸润诱导的，暗示其涉及防御反应，而另一个α-亚基基因，ASA2是以组成性的基础水平表达的。两种预测的蛋白质共用与细菌和真菌的邻氨基苯甲酸合酶蛋白质同源的区域，并且在已经被证明描述涉及细菌中色氨酸反馈抑制的位置包含保守的氨基酸残基(Caligiuri等人，生物化学杂志J.Biol.Chem.，266：8328(1991))。

色氨酸的氨基酸类似物和色氨酸生物合成途径中的中间体的类似物(例如5-甲基色氨酸、4-甲基色氨酸、5-氟基色氨酸、5-羟色氨酸、7-氮杂色氨酸、3β-吲哚基乙酸、3-甲基邻氨基苯甲酸)已经显示抑制原核和真核生物的生长。可对植物细胞培养物进行抗这些氨基酸类似物的筛选。例如，已经选择抗5-甲基色氨酸(5-MT)、色氨酸的氨基酸类似物的生长抑制所培养的烟草、胡萝卜、马铃薯、谷物和毛曼陀罗(Datura innoxia)细胞系，其生长抑制是由于表达改变的邻氨基苯甲酸合酶。

Ranch等人，植物生理学Plant Physiol.71：136(1983)在双子叶植物杂草，毛曼陀罗的细胞培养物中选择5-MT抗性，并且报道抗性的细胞培养物包含增加的色氨酸水平(比野生型水平高出8-30倍)并具有对色氨酸反馈抑制灵敏度较小的邻氨基苯甲酸合酶。再生的植物也是对5-MT有抗性的，包含改变的邻氨基苯甲酸合酶，并且在叶片中具有比对照植物的叶片更大的游离色氨酸浓度(4-44倍)。与在烟草(N.tabacum)中的研究相比，改变的酶不在从抗性细胞系再生的植物中表达，这些结果表明氨基酸过量产生的表型可在细胞水平选择并且在从毛曼陀罗中所选择的细胞再生的完整植株中表达。

Hibberd等人(美国专利号4,581,847)描述了5-MT抗性的玉米细胞系包含比野生型的邻氨基苯甲酸合酶对反馈抑制较少敏感的邻氨基苯甲酸合酶。一种5-MT抗性细胞系比非转化的细胞系积聚大于几乎二十倍水平的游离色氨酸。

P.C.Anderson等人(美国专利号6,118,047)公开了利用来自C28玉米的邻氨基苯甲酸合酶的色氨酸不敏感的α-结构域在转基因中制备显示种子中游离色氨酸水平升高的转基因玉米植株(玉米(Zea mays))。

虽然有可能在某些细胞培养物和植物中选择5-MT抗性，这些特性不一定与完整植株中过量生产的游离色氨酸相关。另外，再生自5-MT抗性系的植物经常不表达酶的改变形式。也不能预测该特性将在一段时间内稳定并且将会作为可遗传的性状延续下去。还已经从高等植物的细胞培养物的粗提物中部分地纯化邻氨基苯甲酸合酶(Hankins等人，植物生理学Plant Physiol.，57：101(1976)；Widholm，Biochim.Biophys.Acta，320：217(1973))。然而，发现它是很不稳定的。因此，必须提供具有可增加植物色氨酸含量的邻氨基苯甲酸合酶源的植物。

发明概述

本发明提供编码可用于产生转基因植物的邻氨基苯甲酸合酶(AS)的核酸。当这种邻氨基苯甲酸合酶在转基因植物中表达时，可在植物细胞内获得升高水平的色氨酸。在一个实施方案中，本发明涉及编码单体邻氨基苯甲酸合酶的DNA分子，其中这种单体的邻氨基苯甲酸合酶是天然的或是邻氨基苯甲酸合酶的α-和β-结构域的遗传工程嵌合融合体。来自几个种属(例如，一些细菌及其他微生物)的邻氨基苯甲酸合酶基因，天然地产生组成单个多肽链的单体邻氨基苯甲酸合酶。然而，大多种属具有由在分开亚基上发现的2个α和2个β结构域组成的异四聚体邻氨基苯甲酸合酶。本发明也预期形成包括连接任何β-结构域的任何邻氨基苯甲酸合酶α-结构域的嵌合邻氨基苯甲酸合酶的融合蛋白质。

通常，天然存在的单体邻氨基苯甲酸合酶与多数植物的邻氨基苯甲酸合酶序列的同一性是相当低的。然而，根据本发明，尽管与植物内源的邻氨基苯甲酸合酶的序列同一性很低，当在植物中表达时，这种单体邻氨基苯甲酸合酶可提供高水平的色氨酸。因此，本发明提供可具有差异(divergent)的序列而且能够在植物宿主中有效提供高水平的色氨酸的单体邻氨基苯甲酸合酶。例如，包含单体根瘤农杆菌(Agrobacterium tumefaciens)邻氨基苯甲酸合酶的转基因的大豆植株可在种子中产生达到大约10,000-大约12,000ppm的色氨酸，而平均的trp水平范围达到大约7,000-大约8,000ppm。相反，非转基因的大豆植株通常在种子中只具有达到大约100-大约200ppm的色氨酸。

因此，本发明提供编码单体邻氨基苯甲酸合酶的分离的DNA序列，其中单体的邻氨基苯甲酸合酶具有邻氨基苯甲酸α-结构域和邻氨基苯甲酸β-结构域，并且其中单体的邻氨基苯甲酸合酶是在植物中表达的。这种表达可提高植物中L-色氨酸的水平。

单体的邻氨基苯甲酸合酶可以是天然单体的。可从中分离天然单体邻氨基苯甲酸合酶核酸的生物体的实例，包括但不限于例如根瘤农杆菌、苜蓿中华根瘤菌(例如，Genbank登记号GI 95177)、Mesorhizobium loti(例如，Genbank登记号GI 13472468)、马尔他布鲁氏菌(Brucella melitensis)(例如，Genbank登记号GI 17982357)、念珠藻属(Nostoc sp.)PCC7120(例如，Genbank登记号GI 17227910或GI 17230725)、巴西固氮螺菌(Azospirillum brasilense)(例如，Genbank登记号GI1174156)和鱼腥藻属(Anabaena)M22983(例如，Genbank登记号GI152445)的生物体。在一些实施方案中，分离的DNA编码具有例如，SEQ ID NO：4的氨基酸序列或SEQ ID NOs：1或75中任何一个核苷酸序列的根瘤农杆菌邻氨基苯甲酸合酶。

可选地，单体的邻氨基苯甲酸合酶可以是任何适用的邻氨基苯甲酸合酶的α和β结构域的融合体。这种α和β结构域可来源于玉米、芸香(Rutagraveolens)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、鼠伤寒沙门氏菌、粘质沙雷氏杆菌(Serratia marcescens)、大肠杆菌(Escherichia coli)、根瘤农杆菌、拟南芥、苜蓿中华根瘤菌(例如，Genbank登记号GI 95177)、百脉根根瘤菌(Mesorhizobiun loti)(例如，Genbank登记号GI 13472468)、马尔他布鲁氏菌(例如，Genbank登记号GI 17982357)、念珠藻属PCC7120(例如，Genbank登记号GI17227910或GI 17230725)、巴西固氮螺菌(例如，Genbank登记号GI 1174156)和鱼腥藻属(Anabaena)M22983(例如，Genbank登记号GI 152445)、大豆、稻、棉花、小麦、烟草或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因。例如，编码α或β结构域的核酸可利用任何SEQ ID NOs：1-70，75-113和116-137中的序列信息获得。

在另一个实施方案中，本发明提供编码来自玉米(Zea mays)的邻氨基苯甲酸合酶的α结构域，包括SEQ ID NOs：5或66的分离DNA。这种分离的DNA可具有核苷酸序列SEQ ID NOs：2，67或68。可将分离的DNA可操作地连接启动子，并且当在植物中表达时可在植物中提供升高水平的L-色氨酸。

在另一实施方案中，本发明提供编码邻氨基苯甲酸合酶的分离的DNA分子，其中DNA分子编码基本上与由SEQ ID NOs：66，108-111，133和137所例证说明的邻氨基苯甲酸合酶蛋白质同源的蛋白质。编码邻氨基苯甲酸合酶的分离DNA包括基本上与由SEQ ID NOs：67，68，104-107和134-136所例证说明的DNA分子同源的DNA分子。

在另一个实施方案中，本发明提供包括表达盒的DNA构建体，其中该可操作连接的表达盒包括(i)异源启动子；(ii)编码单体邻氨基苯甲酸合酶蛋白质的DNA分子，其中单体的邻氨基苯甲酸合酶包括包含邻氨基苯甲酸合酶α-结构域和邻氨基苯甲酸合酶β-结构域的单个多肽，以及(iii)转录终止子。单体的邻氨基苯甲酸合酶蛋白质可包括与由SEQ ID NOs：4，7，43，57，77-82和130-132所例证说明的蛋白质基本上同源的蛋白质。DNA分子可包括与由SEQ ID NOs：1，75，76，83和121-129所例证说明的DNA分子基本上同源的DNA分子。

在进一步的实施方案中，本发明提供包括第一表达盒的DNA构建体，其中第一表达盒可操作的连接，包括(i)异源启动子；(ii)编码邻氨基苯甲酸合酶α-结构域蛋白质的DNA分子和(iii)转录终止子。

上述的DNA构建体可进一步包括第二表达盒，包括可操作的连接(i)异源启动子；(ii)编码邻氨基苯甲酸合酶β-结构域蛋白质的DNA分子和(iii)转录终止子。DNA构建体可包括与由SEQ ID NOs：5，6，8，44，45，66，99，100，101，102，103，108，109，110，111，117，118，133或137所例证说明的蛋白质基本上同源的α-结构域或β-结构域蛋白质。编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子可包括与由SEQ ID NOs：2，3，67，94，95，96，97，98，104，105，106，112，116，119，120，134，135或136所例证说明的DNA分子基本上同源的DNA分子。具体的实例包括其中α-结构域邻氨基苯甲酸合酶蛋白质是SEQ ID NO：66和β-结构域蛋白质是SEQ ID NO：118的DNA构建体。

分离的DNA也可编码突变的邻氨基苯甲酸合酶或突变的邻氨基苯甲酸合酶结构域。这种突变的邻氨基苯甲酸合酶或其结构域可具有一种或多种突变。本领域的技术人员已知，突变可以是沉默的，可产生具有与野生型类似的酶活性的变异基因产物，或可产生具有改变的酶活性的衍生基因产物。本发明包括所有这类的突变。

可在体外或体内从野生型邻氨基苯甲酸合酶核酸产生突变的分离DNA，并且可编码例如，一种或多种氨基酸的取代、缺失或***。产生具有增加活性的、更大稳定性的或对色氨酸或色氨酸类似物的反馈抑制较少灵敏性的突变邻氨基苯甲酸合酶的突变的分离DNAs是合乎需要的。在一个实施方案中，邻氨基苯甲酸合酶或其结构域抗内源L-色氨酸或色氨酸类似物的抑制。例如，邻氨基苯甲酸合酶可在色氨酸-结合袋或减少邻氨基苯甲酸合酶灵敏性的其它地方，或其对于色氨酸抑制的结构域具有一种或多种突变。预期用于突变的氨基酸残基是例如在大约48，51，52，293，和298位置的残基。例如，突变可以是：

a)在大约48位用Phe替换Val；

b)在大约48位用Tyr替换Val；

c)在大约51位用Phe替换Ser；

d)在大约51位用Cys替换Ser；

e)在大约52位用Phe替换Asn；

f)在大约293位用Ala替换Pro；

g)在大约293位用Gly替换Pro；或

h)在大约298位用Trp替换Phe；

其中突变的位置由所选择的邻氨基苯甲酸合酶的氨基酸序列与根瘤农杆菌邻氨基苯甲酸合酶氨基酸序列的序列对比决定。具有这种突变的邻氨基苯甲酸合酶的实例包括具有SEQ ID NOs：58-65，69，70和84-94的邻氨基苯甲酸合酶。

分离的DNA可编码其他元件和功能。本领域的技术人员所预期的任何元件或功能都可包括在内。例如，分离的DNA也可包括在植物细胞中有功能的启动子，其可操作地连接到编码邻氨基苯甲酸合酶的DNA上。分离的DNA可进一步编码质体运输肽。分离的DNA也可编码选择性的标记或报道基因。这种选择性的标记可赋予所述植物细胞除草剂抗性、高蛋白含量、高含油量、高赖氨酸含量、高异亮氨酸含量、高生育酚含量等。DNA序列也可包括编码一种或多种来源于苏云金杆菌(Bacillus thuringiensis)的杀虫剂蛋白质的序列。

本发明进一步提供包括本发明的分离DNA的载体。这种载体可用于在原核和真核细胞中表达邻氨基苯甲酸合酶多肽，用于转化植物细胞并产生转基因植物。

本发明也提供包括本发明的分离DNA的转基因植物。这些分离DNAs在转基因植物中的表达可导致转基因植物，例如植物的种子或其他部分中的L-色氨酸，优选游离的L-色氨酸水平的升高。该水平增至高于不同于转基因大豆植物的，缺乏该DNA的，例如相应的未转化细胞或具有相同遗传背景的未转化植株的植物细胞中L-色氨酸的水平。DNA优选是可遗传的，其优选通过可繁殖植物的完全正常的生殖周期传递给其后代以及进一步传给下一代。

可具有这种分离的DNA的转基因植物包括双子叶植物(双子叶)，例如大豆或Canola。可选地，转基因植物可以是单子叶植物(单子叶)，例如玉米、稻、小麦、大麦或高粱。

本发明也提供包含任何本发明的分离DNAs、邻氨基苯甲酸合酶多肽、转基因或载体的任何转基因植物的种子。

本发明进一步提供包含具有本发明的分离DNA或DNA构建体的植物的至少一部分的动物饲料或人的食品。可被归入动物饲料或人食品的植物的部分包括例如，种子、叶片、茎、根、块茎或果实。所需要的植物部分具有由本发明的分离DNA编码的邻氨基苯甲酸合酶表达所提供的增加的色氨酸水平。

本发明进一步提供通过将本发明的分离DNA导入植物的可再生细胞用于改变、优选增加植物(双子叶植物或单子叶植物)中色氨酸含量的方法。优选地，DNA序列可操作地连接至少一种在植物细胞中可操作的启动子。鉴定或选择转化的细胞，然后再生以产生包括可表达功能性的邻氨基苯甲酸合酶多肽的植物。在一些实施方案中，编码邻氨基苯甲酸合酶或其结构域的DNA是突变的DNA。导入的DNA优选是可遗传的并且该植物优选是可繁殖的植物。例如，导入的DNA优选可通过完全的性周期传递给子代植株，并且可赋予子代的后代高色氨酸的表型。

编码邻氨基苯甲酸合酶的DNAs，优选整合到也可包括编码运输肽、例如质体运输肽的DNA序列和选择性标记或报道基因的，可操作地连接一种或多种在靶植物细胞中有功能的启动子的载体或″转化基因″中。启动子可以是例如，可诱导的启动子、组织特异的启动子、强启动子或弱启动子。其他的转录本或翻译调控元件，例如增强子或终止子，也可功能性地连接编码邻氨基苯甲酸合酶的DNA片段。

悬浮培养物中的细胞或胚胎、完整的组织或器官可通过多种转化技术转化，例如通过微粒子轰击、电穿孔和根瘤农杆菌介导的转化，及其他本领域适用的方法。

因此，转化植物的细胞，包括天然的邻氨基苯甲酸合酶基因和转化基因或其他编码外源邻氨基苯甲酸合酶的DNA片段。植物细胞中外源邻氨基苯甲酸合酶的表达可导致色氨酸及其次级代谢产物的水平增加。在一些实施方案中，这种表达赋予对一定数量的内源L-色氨酸类似物的耐受性，例如比具有野生型或色氨酸敏感的邻氨基苯甲酸合酶的植物细胞存在至少大约10％多的邻氨基苯甲酸合酶活性。

本发明也提供用于改变植物中色氨酸含量的方法，包括：(a)将包括可操作地连接到在植物细胞中有功能的启动子上、编码邻氨基苯甲酸合酶结构域和质体运输肽的分离DNA的转化基因导入植物的可再生细胞；以及(b)从所述的转化植物细胞再生转化植株，其中植物的细胞表达由分离的DNA编码的邻氨基苯甲酸合酶，相对于同样遗传背景的未转化植物中的色氨酸含量，该合酶表达的数量有效增加了所述植物中的色氨酸含量。结构域可以是邻氨基苯甲酸合酶α-结构域。邻氨基苯甲酸合酶结构域可具有一种或多种突变，例如，减少结构域对色氨酸抑制的灵敏性的突变。这种突变可以是例如在色氨酸结合袋(pocket)中。这种结构域可以是，例如，来自根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻(Euglena gracilis)、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、硫磺矿硫化叶菌、大豆、稻、棉花或玉米的邻氨基苯甲酸合酶结构域。芸香具有它自己的叶绿体转运序列，其可与邻氨基苯甲酸合酶转基因一起使用。因此，当利用芸香DNA时，本领域的技术人员不必增加质体转运序列。

本发明也提供包括编码单体邻氨基苯甲酸合酶或其结构域的DNA的，新的分离和纯化的DNA分子。当在植物内表达时，这种邻氨基苯甲酸合酶DNA可提供高水平的色氨酸。在一些实施方案中，邻氨基苯甲酸合酶基本上抗游离的L-色氨酸或其类似物的抑制。本发明包括的新的DNA序列的实例包括但不限于，从根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌；大豆慢生根瘤菌(Bradyrhizobium japonicum)、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞(Rhodopseudomonas palustris)、深红红螺菌(Rhodospirillum rubrum)、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、高粱(Sorghum bicolor)、硫磺矿硫化叶菌、Thermobifida fusca或玉米(Zea mays王蜀黍)或其他邻氨基苯甲酸合酶分离的DNA分子。

这些DNA序列包括具有在单个多肽链上连接至少另一个邻氨基苯甲酸合酶结构域的邻氨基苯甲酸合酶α-结构域的，合成的或天然存在的单体形式的邻氨基苯甲酸合酶。单体的邻氨基苯甲酸合酶可以例如，是邻氨基苯甲酸合酶α或β结构域的融合体。这种邻氨基苯甲酸合酶α或β结构域可来源于根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌、深红红螺菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、高粱(sorghum bicolor)、硫磺矿硫化叶菌、Thermobifidafusca、高粱属(sorghum)、大豆、稻、棉花、小麦、烟草或玉米(王蜀黍)，或编码邻氨基苯甲酸合酶的亚基或结构域的任何基因。这种邻氨基苯甲酸合酶及其结构域在此也由分离自根瘤农杆菌，(SEQ ID NOs：175或84-94)、玉米，(SEQ ID NOs：2，67，68，96，116或136)、芸香(SEQ ID NO：3)、鱼腥藻M22983、拟南芥(SEQ ID NO：45)、巴西固氮螺菌(SEQ ID NO：122)、马尔他布鲁氏菌(SEQ ID NO：123)、百脉根根瘤菌(SEQ ID NO：121)、念珠藻属PCC7120(SEQ ID NOs：124或125)、苜蓿中华根瘤菌、血色红假单胞菌(SEQID NO：126)、硫磺矿硫化叶菌、稻(SEQ ID NOs：94，95，119或120)、小麦(SEQID NO：97)、烟草(SEQ ID NO：98)、陆地棉(Gossypium hirsutum)(SEQ ID NOs：104或105)、大豆(Glycine max)(SEQ ID NOs：106，107，112或113)、大豆慢生根瘤菌(SEQ ID NO：127)、深红红螺菌(SEQ ID NO：128)、Thermobifidafusca(SEQ ID NO：129)或高粱(SEQ ID NOs：134或135)的邻氨基苯甲酸合酶的核酸例证说明。这些核苷酸序列从根瘤农杆菌(SEQ ID NOs：4，58-65，69或70)；玉米(SEQ ID NOs：5，66，101，118或137)和芸香(SEQ ID NO：6)，鱼腥藻M22983、巴西固氮螺菌(SEQ ID NO：78)、马尔他布鲁氏菌(SEQ ID NO：79)、百脉根根瘤菌(SEQ ID NO：77)、念珠藻属PCC7120(SEQ ID NOs：80或81)、苜蓿中华根瘤菌(SEQ ID NOs：7或43)、血色红假单胞菌(SEQ ID NOs：57或82)、硫磺矿硫化叶菌(SEQ ID NOs：8或44)、稻(SEQ ID NOs：99，100或117)、小麦(SEQ ID NO：102)、烟草(SEQ ID NO：103)、陆地棉(SEQ ID NOs：108或109)、大豆(SEQ ID NOs：110或111)、大豆慢生根瘤菌(SEQ ID NO：130)、深红红螺菌(SEQ ID NO：131)、Thermobifida fusca(SEQ ID NO：132)或高粱(SEQ IDNO：133)编码邻氨基苯甲酸合酶或其α-结构域或β结构域。

本发明也提供包括编码具有酶活性的根瘤农杆菌邻氨基苯甲酸合酶或其结构域的DNA序列的分离DNA分子。这种DNA分子可编码具有SEQ IDNOs：4，58-65，69或70的邻氨基苯甲酸合酶，具有邻氨基苯甲酸合酶活性的结构域或其变体。DNA分子也可具有包括SEQ ID NOs：1，75或84-93，或其结构域或变体的序列。在此所提供的任何DNA的编码区也可被优化，用于在所选择的生物体，例如所选择的植物或微生物中表达。具有用于所选择植物的优化密码子的DNA分子的实例是具有SEQ ID NO：75的根瘤农杆菌邻氨基苯甲酸合酶的DNA分子。

本发明也提供包括编码玉米邻氨基苯甲酸合酶结构域的DNA序列的分离和纯化的DNA分子。这种DNA分子可编码具有SEQ ID NOs：5或66的邻氨基苯甲酸合酶结构域，或具有邻氨基苯甲酸合酶活性的其变体或衍生物。DNA分子也可具有包括SEQ ID NOs：2，67，或68的序列，或其结构域或变体。

本发明进一步提供与包括SEQ ID NOs：1，75或84-94中的任何一个的互补DNA分子在严谨条件下杂交的，至少8个核苷酸的分离的DNA分子。这种DNA分子可以是探针或引物、例如具有SEQ ID NOs：9-42，47-56或138-143中任何一个的核酸。可选地，DNA可包括所选择的邻氨基苯甲酸合酶或其结构域的全部编码区。这种DNA也可包括编码在植物细胞中可操作的启动子的DNA序列和/或编码质体运输肽的DNA序列。本发明进一步涉及用于在植物和/或微生物中转化和表达这类DNA分子的载体。

与在此所明确描述的DNA序列和氨基酸序列显示50％、优选60％、更优选70％、更优选80％、最优选90％，例如95％-99％的序列同一性的，功能性的邻氨基苯甲酸合酶DNA序列和功能性的邻氨基苯甲酸合酶多肽也在本发明的范畴内。例如85％同一性，指当2个序列对比进行最大匹配时，85％的氨基酸是相同的。在最大化匹配中容许缺口(gap)(在任何一个待匹配的2个序列中)；5个或较少的间隙(gap)长度是优选的，而2个或更少是更优选的。

可选地和优选地，如在此所使用的术语，如果当利用具有突变数据矩阵以及6分或更大的缺口罚分的ALIGN程序时，它们具有大于5的序列对比积分(alignmentscore)(在标准偏差单位中)，则这2种多肽序列是同源的。参见Dayhoff，M.O.，″蛋白质序列和结构的图谱Atlas of Protein Sequence andStructure″，1972，第5卷，国家生物医学研究基金会，pp.101-110，以及该卷的增刊2，pp.1-10。更优选地当利用ALIGN程序进行优化序列对比时，如果它们的氨基酸大于或等于50％相同，则2个序列或其部分是同源的。本发明进一步提供用于产生具有高种子水平的色氨酸的转基因植物的载体，包括编码单体邻氨基苯甲酸合酶的分离DNA序列，其中包含连接有邻氨基苯甲酸合酶β-结构域和质体运输肽，并可操作地连接在植物细胞中有功能的启动子的邻氨基苯甲酸合酶α-结构域。这种单体的邻氨基苯甲酸合酶可例如是，根瘤农杆菌，苜蓿中华根瘤菌、百脉根根瘤菌，马尔他布鲁氏菌，念珠藻属PCC7120，巴西固氮螺菌，鱼腥藻M22983，大豆慢生根瘤菌，深红红螺菌或Thermobifida fusca的邻氨基苯甲酸合酶。单体的邻氨基苯甲酸合酶也可来源于根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌、百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆慢生根瘤菌，深红红螺菌，Thermobifida fusca，高粱，大豆，稻，棉花，小麦，烟草，玉米或编码邻氨基苯甲酸合酶的亚基或结构域的任何基因的邻氨基苯甲酸合酶α-和β-结构域的融合体。

提供增加水平的色氨酸的，分离和纯化的邻氨基苯甲酸合酶DNA的转化可在分子水平评估，例如，Southern或Northern印迹分析，基于PCR的方法学，邻氨基苯甲酸合酶的生物化学或免疫学检测，或通过表型分析，即，转化后代的细胞是否可在存在抑制未转化植物细胞生长的大量色氨酸的氨基酸类似物时生长。

本发明也提供在原核或真核宿主细胞，例如酵母、昆虫细胞或细菌中生产邻氨基苯甲酸合酶的方法，其可以是培养物，优选是商业规模的。该方法包括将包含编码邻氨基苯甲酸合酶或其结构域，例如单体邻氨基苯甲酸合酶，至少包括α和β邻氨基苯甲酸合酶的结构域，或其功能性变体的DNA片段的转化基因导入宿主细胞，并在宿主细胞中表达邻氨基苯甲酸合酶，以产生功能性的邻氨基苯甲酸合酶或其结构域的步骤。转化基因通常包括转录本和翻译调控元件，例如在真核或原核起源的宿主细胞中有功能的启动子。优选地，转基因被导入已知可用于生产重组蛋白质的，例如大肠杆菌的原核细胞，或例如酵母或昆虫细胞的真核细胞。培养转化细胞可导致增加色氨酸及其衍生物的生产，可从细胞或培养基中回收该产物。色氨酸的累积也可导致在微生物和植物中增加次级代谢产物的生产，例如包含吲哚的代谢产物，例如植物中的单个的吲哚，吲哚共轭物，吲哚生物碱，吲哚植物抗毒素和吲哚芥子油苷(glucosinalates)。

对色氨酸不敏感的邻氨基苯甲酸合酶具有增加多种分支酸衍生代谢产物的潜能，包括来自由于色氨酸通过分支酸变位酶刺激苯基丙氨酸所合成的苯基丙氨酸。参见Siehl，D.来自植物氨基酸的分支酸的色氨酸、酪氨酸和苯丙氨酸的生物合成：生物化学和生物工艺学，(The biosynthesis of tryptophan，tyrosine and phenylalanine from chorismate in Plant Amino Acids：Biochemistryand Biotechnology)，ed.BK Singh，第171-204页。当反馈不敏感的邻氨基苯甲酸合酶存在时，可能增加的其他分支酸衍生的代谢产物包括，苯丙酮(phenylpropanoid)、类黄酮和异类黄酮，以及来源于邻氨基苯甲酸的代谢产物，例如吲哚、吲哚生物碱和吲哚异硫氰酸盐。许多化合物是重要的植物激素、植物防御化合物、各种健康状况的化学保护剂(chemopreventive agents)、和/或药物学活性的化合物。这些化合物的合成可能由于邻氨基苯甲酸合酶的表达而增加，其范围取决于表达邻氨基苯甲酸合酶的生物体。本发明涉及在多种原核和真核细胞或生物体，包括植物细胞、微生物、真菌、酵母、细菌、昆虫细胞和哺乳动物细胞中的色氨酸及其他有用化合物的合成。

因此，本发明提供用于生产色氨酸的方法，包括：在足够表达由该分离DNA编码的单体邻氨基苯甲酸合酶的条件下，培养包括分离的DNA的原核或真核的宿主细胞，其中单体的邻氨基苯甲酸合酶包括邻氨基苯甲酸合酶α结构域和邻氨基苯甲酸合酶β结构域，并且其中足够表达单体的邻氨基苯甲酸合酶的条件包括，宿主细胞足以利用单体的邻氨基苯甲酸合酶合成色氨酸的养分和前体。

可在多种宿主细胞和/或生物体中表达产生的有用化合物的实例包括，吲哚乙酸及其他生长素；对心血管健康重要的、存在于大豆中的异类黄酮化合物；在玉米中对食草昆虫的天敌起信号作用的挥发性的吲哚化合物；抗癌剂，例如在十字花科植物家族中发现的吲哚芥子油苷(吲哚-3-甲醇)；以及吲哚生物碱，例如由某些种属的真菌生产的麦角化合物。(Barnes等人，Adv Exp MedBiol.，401：87(1996)；Frey等人，Proc Natl Acad.Sci.，97：14801(2000)；Muller等人，生物化学Biol.Chem.，381：679(2000)；Mantegani等人，Farmaco，54：288(1999)；Zeligs，医药食品杂志J Med Food，1：67(1998)；Mash等人，AnnNY Acad Sci.，844：274(1998)；Melanson等人，Proc Natl Acad.Sci.，94：13345(1997)；Broadbent等人，Curr Med Chem.，5：469(1998))。

本发明也提供在中度以及优选高严谨条件下，与编码邻氨基苯甲酸合酶的DNA分子的互补序列杂交的、至少7个核苷酸碱基的分离和纯化的DNA分子。这种分离和纯化的DNA分子包括编码邻氨基苯甲酸合酶或其结构域或突变体的新的DNA片段。突变的DNA可编码基本上抗游离L-色氨酸或色氨酸的氨基酸类似物抑制的邻氨基苯甲酸合酶。这种邻氨基苯甲酸合酶DNA分子可与例如，根瘤农杆菌、血色红假单胞菌或芸香的邻氨基苯甲酸合酶，或其α-结构域，包括其功能性的突变体杂交。当这些DNA分子编码功能性的邻氨基苯甲酸合酶或邻氨基苯甲酸合酶结构域时，它们定义为编码邻氨基苯甲酸合酶、邻氨基苯甲酸合酶结构域或其突变体的主要DNA分子的″变体″。较短的DNA分子或寡聚核苷酸可用作PCR扩增靶DNA序列的引物，或作为合成全长基因的中间产物。

也提供杂交探针，包括至少7个核苷酸碱基的新的分离和纯化的DNA片段，其被可检测地标记或结合可检测的标记物，该DNA片段在中度或优选高严谨条件下，与包括编码邻氨基苯甲酸合酶，例如编码单体的邻氨基苯甲酸合酶或其结构域，例如α-结构域，包括基本上抗色氨酸的氨基酸类似物抑制的、其功能性突变体的DNA片段的DNA分子的非编码链杂交。中度和严谨杂交条件是本领域已知的，参见，例如Sambrook等人，分子克隆：实验指南Molecular Cloning：A Laboratory Manual，第2版(1989)；也参见，Sambrook和Russell，分子克隆：实验室指南，第3版(2001年1月15日)的第0.47-9.51节。例如，严谨条件是(1)使用低离子强度和高温进行洗涤，例如，50℃，0.015MNaCl/0.0015M柠檬酸钠(SSC)；0.1％十二烷基硫酸钠(SDS)，或(2)在杂交期间使用例如甲酰胺的变性剂，例如，在42℃，50％甲酰胺和0.1％牛血清白蛋白/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/含750mM NaCl，75mM柠檬酸钠的50mM pH6.5的磷酸钠缓冲液。另一个使用的实例是，在42℃，50％甲酰胺，5×SSC(0.75M NaCl，0.075M柠檬酸钠)，50mM磷酸钠(pH6.8)，0.1％焦磷酸钠，5×Denhardt′s溶液，超声处理的鲑鱼精DNA(50μg/ml)，0.1％十二烷基磺酸钠SDS)，和10％葡聚糖硫酸酯，并在42℃，0.2×SSC和0.1％SDS中洗涤。

附图简述

图1是质粒pMON61600的限制性图谱。

图2表明根瘤农杆菌邻氨基苯甲酸合酶DNA序列(上面的序列)(SEQ IDNO：4)的翻译序列和苜蓿中华根瘤菌的邻氨基苯甲酸合酶DNA序列(下面的序列)(SEQ ID NO：7)的翻译序列。

图3是质粒pMON34692的限制性图谱。

图4是质粒pMON34697的限制性图谱。

图5是质粒pMON34705的限制性图谱。

图6A-B表明比较根瘤农杆菌α-结构域序列(SEQ ID NO：4)和硫磺矿硫化叶菌α-结构域序列(SEQ ID NO：8)的邻氨基苯甲酸合酶氨基酸序列的序列对比。

图7A-B表明用于突变SEQ ID NO：1的34个引物的序列(SEQ ID NOs：9-42)。突变密码子是加下划线的，而变化的碱基是小写字体的。

图8表明质粒pMON13773的限制性图谱。

图9表明质粒pMON58044的限制性图谱。

图10表明质粒pMON53084的限制性图谱。

图11表明质粒pMON58045的限制性图谱。

图12表明质粒pMON58046的限制性图谱。

图13表明质粒pMON38207的限制性图谱。

图14表明质粒pMON58030的限制性图谱。

图15表明质粒pMON58006的限制性图谱。

图16表明质粒pMON58041的限制性图谱。

图17表明质粒pMON58028的限制性图谱。

图18表明质粒pMON58042的限制性图谱。

图19表明质粒pMON58029的限制性图谱。

图20表明质粒pMON58043的限制性图谱。

图21A-D表明具有SEQ ID NOs：4和43(分别来源于根瘤农杆菌和苜蓿中华根瘤菌)的单体″TrpEG″邻氨基苯甲酸合酶，与来自硫磺矿硫化叶菌(SEQID NO：44)和拟南芥(SEQ ID NO：45)的异四聚体邻氨基苯甲酸合酶的TrpE(α)和TrpG(β)结构域的多重序列对比。接头区域是加下划线的。

图22是质粒pMON52214的限制性图谱。

图23是质粒pMON53901的限制性图谱。

图24是质粒pMON39324的限制性图谱。

图25是质粒pMON39322的限制性图谱。

图26是质粒pMON39325的限制性图谱。

图27是表明用pMON39325转化的大豆种子中游离的色氨酸水平的图表。存在5个来自各事件的观察结果。NT表示非转基因的大豆种子。

图28是质粒pMON25997的限制性图谱。

图29是质粒pMON62000的限制性图谱。

图30表明大肠杆菌EMG2(K-12 wt F+)的截短的trpE基因序列(SEQ IDNO：46)。该trpE核酸的最初30bp和最后的150bp通过EcoRI限制酶切位点连接。该trpG基因的开始部分紧随trpE的终止密码子。

图31图解表明大肠杆菌trpE基因中框内缺失的构建体。

图32A-C表明分离自根瘤农杆菌的邻氨基苯甲酸合酶基因的α-结构域的DNA(SEQ ID NO：1)和氨基酸(SEQ ID NO：4)序列。

图33A-C表明分离自玉米的邻氨基苯甲酸合酶基因的α-结构域的DNA(SEQ ID NO：2)序列。图33D表明分离自玉米的邻氨基苯甲酸合酶基因的α-结构域的氨基酸(SEQ ID NO：5)序列。

图34是质粒pMON58120的限制性图谱。

图35A-E提供来自根瘤农杆菌(AgrTu_15889565)(SEQ ID NO：4)、苜蓿中华根瘤菌(RhiMe_136328)(SEQ ID NO：7)、百脉根根瘤菌(MesLo_13472468)(SEQ ID NO：77)、巴西固氮螺菌(AzoBr-1717765)(SEQ IDNO：78)、马尔他布鲁氏菌(BruMe_17986732)(SEQ ID NO：79)、念珠藻属(Nostoc_17227910)(SEQ ID NO：80)、念珠藻属(Nostoc_17230725)(SEQ IDNO：81)和血色红假单胞菌(RhoPa_TrpEG)(SEQ ID NO：82)的邻氨基苯甲酸合酶氨基酸序列的序列比较。

图36A-B提供用于根瘤农杆菌邻氨基苯甲酸合酶的优化核苷酸序列(SEQ ID NO：75)。

图37A-C提供野生型(上面的链)和优化的(下面的链)根瘤农杆菌邻氨基苯甲酸合酶核苷酸序列(SEQ ID NOs：1和75)的序列对比。这2个序列由中间的链证明是94％相同的。

图38是质粒pMON66877的限制性图谱。

图39是质粒pMON66878的限制性图谱。

图40是质粒pMON66879的限制性图谱。

图41是质粒pMON66595的限制性图谱。

图42是质粒pMON66599的限制性图谱。

图43是质粒pMON66598的限制性图谱。

图44是质粒pMON66596的限制性图谱。

图45是质粒pMON79951的限制性图谱。

图46是质粒pMON79955的限制性图谱。

图47是质粒pMON79956的限制性图谱。

图48是质粒pMON36524的限制性图谱。

图49是质粒pMON30167的限制性图谱。

发明详述

本发明提供分离的DNAs，载体，宿主细胞和含有编码能够在植物中表达高水平的色氨酸的邻氨基苯甲酸合酶的分离核酸的转基因植物。在一个实施方案中，分离的核酸编码单体邻氨基苯甲酸合酶(AS)。在另一个实施方案中，分离的核酸编码邻氨基苯甲酸合酶，或其结构域，其基本上抗游离的L-色氨酸或色氨酸的氨基酸类似物的抑制。邻氨基苯甲酸合酶或其结构域的表达，可以提高色氨酸例如种子中游离色氨酸的水平，而超过在缺乏这种表达的植物中的水平。

提供生产含有增强的邻氨基苯甲酸合酶活性的相关核酸的转基因植物的方法，和生产培养细胞，植物组织，植物，植物部分和产生高水平色氨酸的种子。这种转基因植物将产生高水平色氨酸的能力优先地性传递给其后代。也描述了产生编码突变邻氨基苯甲酸合酶的分离DNAs，和细胞培养物的筛选技术以挑选出过量表达色氨酸和/或对色氨酸类似物有抗性作用的新表型。例如，产生能够生产高水平色氨酸的大豆品系，制备和表征含有至少一种本发明的分离核酸的转基因大豆细胞，然后在植物中再生。其中一些分离的DNAs对色氨酸类似物的生长抑制有抗性作用。本发明也提供用于在双子叶植物，例如其他的豆类，以及例如谷粒的单子叶植物中产生升高的游离色氨酸水平的方法。

定义

如在此所用的，转化植物、植物组织、植物部分或植物细胞中的色氨酸的“改变”水平是相应于未转化的植物、植物组织、植物部分或植物细胞增强或减少的水平。

正如在此所用的“α-结构域”是结合分支酸和消除烯醇丙酮酸侧链的酶或酶复合物的一部分。TrpE基因编码这种α-结构域。在一些情况中，α-结构域是只具有结合分支酸和消除分支酸的烯醇丙酮酸侧链功能的单个多肽。在其他情况中，α-结构域是除了结合分支酸和消除分支酸的烯醇丙酮酸侧链外，还可执行其他酶功能的较大多肽的一部分。

术语“β-结构域”是指将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支酸环的位置的酶或酶复合物的一部分。TrpG基因编码这种β-结构域。在一些情况中，β-结构域是只具有将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支环位置的功能的单个多肽。在其他情况中，β-结构域是除了将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支酸环位置外，还可执行其他酶功能的较大多肽的一部分。

正如在此所用的，“色氨酸的氨基酸类似物”是指结构上与色氨酸相关的氨基酸，并且可以与野生型邻氨基苯甲酸合酶的色氨酸结合位点结合。这些类似物包括但不限于，6-甲基苯甲酸甲酯、5-甲基色氨酸、4-甲基色氨酸、5-氟色氨酸、5-羟色氨酸、7-氮杂色氨酸、3β-吲哚丙烯酸、3-甲基邻氨基苯甲酸等。

术语“基本上由...组成”与涉及出现的DNA分子、序列或片段一起使用，是指编码邻氨基苯甲酸合酶的DNA分子、序列或片段的主要部分。除非另有注明，DNA分子、序列或片段只编码邻氨基苯甲酸合酶。

在此使用的术语“互补”指能与参照的核苷酸序列的全部、或部分杂交的核酸链的序列。例如，核苷酸序列“TATAC”具有与参照序列5′-TATAC-3′100％的相同性，但也与参照序列5′-GTATA-3′100％互补。

正如在此所用的，“外源的”邻氨基苯甲酸合酶是由导入到宿主细胞中的分离DNA编码的邻氨基苯甲酸合酶，优选地与天然的未转化状态的细胞中的任何DNA序列都不相同。“内源的”或“天然的”邻氨基苯甲酸合酶是天然存在于宿主细胞或生物体内的邻氨基苯甲酸合酶。

正如在此所用的，植物细胞、植物组织、植物一部分或植物中游离L-色氨酸“增强的”或“升高的”水平与未转化的植物细胞、植物组织、植物部分或植物，即未由存在外源的邻氨基苯甲酸合酶核酸或其结构域而改变基因组的植物中的水平相比大约是2-200倍，优选为5-150倍，更优选为10-100倍。例如，在转化的植物种子中游离色氨酸的水平与未转化的植物种子(“起始材料”)相比较。

编码邻氨基苯甲酸合酶的DNA分子和编码运输肽的DNA分子或标记/报道基因是从天然来源中“分离的”，不再存在于其通常存在的细胞中。这样分离的DNA分子至少是部分制备或在体外操作的，例如，从其通常发现的细胞中分离，纯化和扩增。这样分离的DNA分子也可以是“重组的”，将其与外源DNA分子或片段结合。例如，重组的DNA可以是将分离的DNA可操作地连接外源启动子，或连接对宿主细胞来说是内源的启动子。

在此与邻氨基苯甲酸合酶相关使用的术语“单体”指两个或更多个邻氨基苯甲酸合酶结构域结合形成单个多肽链的功能形式。单体邻氨基苯甲酸合酶可在体内组装成二聚体形式。单体邻氨基苯甲酸合酶核酸和多肽可分离自各种生物体，例如根瘤农杆菌，鱼腥藻M22983，巴西固氮螺菌，马尔他布鲁氏菌，薄肌眼虫藻，百脉根根瘤菌，念珠藻属PCC7120或苜蓿中华根瘤菌。可选地，可将选自任何方便的单体或多聚体邻氨基苯甲酸合酶基因的结构域结合，构建单体邻氨基苯甲酸合酶的核酸和多肽。这种生物体包括，例如，根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌，百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆，稻，棉花，玉米或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因。编码所选择区域的核酸可以重组连接。例如，编码α-结构域的C端的核酸可通过形成磷酸二酯键与编码β-结构域的N端的核酸连接。或者，这种多肽的单个结构域可化学连接。例如α-结构域C端通过形成肽键与β-结构域的N端相连，或者相反。

正如在此所用的，“天然的”基因指在体外没有改变，也就是说在体外没有突变的“野生型”基因。

术语“质体”值得是植物细胞器类型，包括造粉体，叶绿体，色质体，油质体，eoplast，黄化质体，白色体和前质体。这些细胞器可自我复制，含有通常称为“叶绿体基因组”的，根据植物的种类大小为大约120-大约217kb的环状DNA分子，其通常含有反向的重复区域。

正如在此所用的，“多肽”指除了分别具有氨基和羧基，而不用肽键连接的N端和C端外，通过肽键连接的所有氨基酸的连续链。多肽可以是任何长度的，并且可进行例如糖基化或磷酸化的翻译后修饰，。

正如在此所用的，“对色氨酸的氨基酸类似物的抑制有抗性或耐受的”植物细胞，植物组织或植物，是在L-色氨酸类似物存在时与相应的野生型的邻氨基苯甲酸合酶相比，至少含有约10％多的邻氨基苯甲酸合酶活性的植物细胞，植物组织或植物。通常，“对色氨酸的氨基酸类似物的抑制有抗性或耐受的”植物细胞，植物组织或植物可在一定数量的色氨酸的氨基酸类似物下生长，而该数量通常可抑制未转化的植物细胞，植物组织或植物的生长，这可通过本领域已知的方法确定。例如，用编码基本上抗或耐受色氨酸的氨基酸类似物的抑制的邻氨基苯甲酸合酶的DNA分子转化的，同型纯合回交转变的近交植物生长在一定数量的色氨酸的氨基酸类似物下，而该数量的类似物抑制相应的，即基本上等基因的轮回的近交植物的生长。

正如在此所用的，当耐受/抗性的和野生型的邻氨基苯甲酸合酶处于等量的色氨酸或色氨酸的氨基酸类似物时，“对色氨酸或色氨酸的氨基酸类似物的抑制有抗性或耐受的”邻氨基苯甲酸合酶保持比相应的野生型或天然易感的邻氨基苯甲酸合酶的活性高出大约10％多。优选地，抗性或耐受性的邻氨基苯甲酸合酶比相应于野生型的或天然易感型的邻氨基苯甲酸合酶，保持大于20％多的活性。

在此使用的涉及邻氨基苯甲酸合酶的术语“其结构域”包括全长邻氨基苯甲酸合酶的结构或功能性片段。结构区域包括邻氨基苯甲酸合酶内已鉴定的结构。结构区域的一个实例包括α螺旋，β折叠，活性位点，底物或抑制剂结合位点等。功能区域包括具有确定功能的邻氨基苯甲酸合酶的片段，例如色氨酸结合袋，活性位点或底物或抑制剂结合位点。邻氨基苯甲酸合酶的功能性结构域包括可催化色氨酸生物合成途径中的一个步骤的邻氨基苯甲酸合酶部分。例如，α-结构域是由TrpE编码的区域，可将NH₃传递到分支酸上而形成氨基苯甲酸。β-结构域是由TrpG编码的区域，可除去谷氨酸的氨基而形成氨。因此，功能结构域包括邻氨基苯甲酸合酶的酶活性片段和结构域。也包括邻氨基苯甲酸合酶的突变结构域。用于制备突变结构域的野生型邻氨基苯甲酸合酶的核酸包括，例如，编码根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌，百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆，稻，棉花，玉米的结构域的任何核酸，或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因，其可在编码区包含至少一个氨基酸的取代。突变或相连的、以形成具有增强的色氨酸生物合成活性，更好的稳定性，降低对色氨酸或其类似物的敏感性等的单体邻氨基苯甲酸合酶的结构域，是特别感兴趣的。

术语“5′UTR”指DNA上游未翻译的区域，或基因编码区的5′未翻译的区域。

术语“3′UTR”指DNA下游未翻译的区域，或基因编码区的3′未翻译的区域。

术语“基本上同源”指两个序列在序列上至少90％相同，其通过(Version10；Genetics Computer Group，Inc.，University of Wiconsin BiotechnologyCenter，Madison，WI)中所描述的BestFit程序，使用默认的参数进行测定。

序列相同性的百分数优选使用″Best Fit″或″Gap″序列分析软件包的程序(Version 10；Genetics Computer Group，Inc.，University of WisconsinBiotechnology Center，Madison，WI)测定。″Gap″使用Needleman和Wunsch(1970)算法，以发现两个序列的序列对比中最大的匹配数和最小的缺口(gap)。

″Best Fit″在两个序列间对相似性最好的片段进行优化的序列对比，并且利用Smith和Waterman(Smith and Waterman，1981；Smith等人，1983)的同源性算法***缺口(gap)以最大化匹配的数目。优选使用默认参数的″Best Fit″程序测定同一性的百分数。在此使用的术语“可操作地连接”指启动子与编码区是以通过启动子来控制和调节编码区翻译的方式连接。可操作地连接启动子和编码区的方法是本领域已知的。

通用概念

本发明涉及用于获得产生升高水平的游离L-色氨酸的植物的新的核酸和方法。过量生产是由于导入和表达编码邻氨基苯甲酸合酶或其结构域的核酸。这种邻氨基苯甲酸合酶核酸包括邻氨基苯甲酸合酶的野生型或突变的α-结构域，或单体形式。邻氨基苯甲酸合酶的单体形式在单个多肽链上含有至少两个邻氨基苯甲酸合酶区域，例如，α-结构域连接β-结构域。

天然植物的邻氨基苯甲酸合酶通常对L-色氨酸和其类似物的抑制反馈敏感。这种抑制构成调控色氨酸合成途径的关键机制。因此，邻氨基苯甲酸合酶或其结构域是高度活性的、更加有效的或较少程度地受到色氨酸或其类似物的抑制，从而可能产生升高水平的色氨酸。根据本发明，根瘤农杆菌邻氨基苯甲酸合酶对于产生高水平的色氨酸特别有用。

为了在植物或所选择的宿主细胞中产生高水平色氨酸，分离所选择的邻氨基苯甲酸合酶核酸，并可在体外操作，以包括在植物细胞或其他细胞类型中基因表达所需的调控信号。因为报道植物中的色氨酸合成途径在质体中进行，可将外源邻氨基苯甲酸合酶的核酸导入质体中或通过加上编码质体运输肽的氨基末端的核酸片段进行修饰。这种质体运输肽可直接引导邻氨基苯甲酸合酶基因产物进入质体。在一些情况中邻氨基苯甲酸合酶已经含有质体运输序列，这样就没有必要增加片段了。

为了改变色氨酸的生物合成，编码邻氨基苯甲酸合酶活性的核酸必须导入植物细胞或其他宿主细胞，然后直接或间接地验证这些转化细胞。可使用完整的邻氨基苯甲酸合酶或其有用的部分或结构域。邻氨基苯甲酸合酶稳定地整合在植物细胞基因组上。控制邻氨基苯甲酸合酶表达的转录信号必须在植物细胞或其他宿主细胞内被识别并发挥作用。也就是说邻氨基苯甲酸合酶必须转录成信使RNA(mRNA)，而mRNA必须在植物细胞核中稳定、完整地运输到细胞质中翻译。邻氨基苯甲酸合酶mRNA必须含有可被植物细胞核糖体识别和合适翻译的合适的翻译信号。多肽基因产物必须基本上逃脱细胞质内蛋白水解的攻击，而被转运到正确的细胞内部分(例如，质体)，并且能够呈现赋予酶活性的三维构像。邻氨基苯甲酸合酶必须进一步能够在色氨酸和其衍生物的生物合成中发挥作用；也就是说，必须定位在催化生物合成中旁侧步骤的天然植物酶的附近(大概在质体中)，以获得所需要的底物并传递合适的产物。

即使满足所有的条件，色氨酸的成功过量产生也不是一个可以预料的事情。一些转基因的表达可能受到附近染色体元件的负影响，如果通过突变减少反馈抑制而获得高水平的色氨酸，存在其他的控制机制来补偿邻氨基苯甲酸合酶步骤减少的调控。可能有提高所蓄积氨基酸降解率的机制。色氨酸和相关氨基酸的过量表达的水平也不能对植物有毒性。最后，导入性状必须是稳定的和可以遗传的，以提供商业上的发展和使用。

编码邻氨基苯甲酸合酶的DNA的分离和鉴定

可通过标准的方法鉴定和分离编码邻氨基苯甲酸合酶的核酸，例如，如Sambrook等在“分子克隆：实验指南”，第二版(1989)；Sambrook和Russell，在“分子克隆：实验指南”，第三版(2001.1.15)中所描述的。例如，编码邻氨基苯甲酸合酶或其结构域的DNA序列可以通过筛选来源于特定细胞种类、细胞系、初级细胞或组织的核酸所产生的DNA或cDNA文库而鉴定。用于鉴定和分离邻氨基苯甲酸合酶的文库的实例包括，但不限于，来源于根瘤农杆菌菌株A348，玉米自交系B73(Stratagene，La Jolla，加利福尼亚，Cat.#937005，Clontech，Palo Alto，加利福尼亚，Cat.#FL1032a，#FL1032b，和FL1032n)的cDNA文库，来源于玉米自交系Mo17(Stratagene，Cat.#946102)的基因组文库，来源于玉米自交系B73(Clontech，Cat.#FL1032d)的基因组文库，来源于鱼腥藻M22983(例如，Genbank登录号GI 152445)，拟南芥，巴西固氮螺菌(例如，Genbank登录号GI 1174156)，马尔他布鲁氏菌(GI17982357)，大肠杆菌，薄肌眼虫藻(Euglena gracilis)，百脉根根瘤菌(例如，Genbank登录号GI 13472468)，念珠藻属PCC7120(例如，Genbank登录号GI 17227910或GI 17230725)，苜蓿中华根瘤菌(例如，Genbank登录号GI95177)，芸香，血色红假单胞菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，硫磺矿硫化叶菌，大豆，稻，棉花，小麦，烟草，玉米(玉蜀黍)，或其他种类的基因组DNA。而且，可采用分离自任何这些种类的基因组DNA，mRNA或cDNA，通过核酸扩增方法分离邻氨基苯甲酸合酶核酸。

筛选编码邻氨基苯甲酸合酶的全长或其部分序列的DNA片段可通过筛选与来源于从其他生物体的邻氨基苯甲酸合酶基因探针杂交的基因组或cDNA文库的噬菌斑，或筛选与特异性识别邻氨基苯甲酸合酶的抗体结合的cDNA表达文库的噬菌斑而实现。将与来自其他生物体的邻氨基苯甲酸合酶探针杂交的DNA片段和/或携带邻氨基苯甲酸合酶抗体免疫活性的DNA片段的噬菌斑亚克隆到载体中，并进行测序和/或作为探针用于鉴定编码所需要的邻氨基苯甲酸合酶基因的全长或部分的其他cDNA或基因组序列。用于筛选玉米或植物文库的优选cDNA探针可从质粒克隆pDPG600或pDPG602获得。

cDNA文库可例如，通过随机寡引物或寡dT引物引发制备。含有DNA片段的噬菌斑可以用特异于邻氨基苯甲酸合酶的探针或抗体筛选。将编码邻氨基苯甲酸合酶基因部分的DNA片段亚克隆，并测序，以及用作鉴定基因组邻氨基苯甲酸合酶基因的探针。编码细菌或植物邻氨基苯甲酸合酶的DNA片段可通过确定与其他已知的邻氨基苯甲酸合酶基因的同源性而验证，或通过与邻氨基苯甲酸合酶特异的信使RNA杂交而验证。一旦获得编码邻氨基苯甲酸合酶的5′，中间和3′端部分的cDNA片段，则可将其作为探针，从基因组文库中鉴定和克隆完整的邻氨基苯甲酸合酶基因的基因组拷贝。

对部分基因组拷贝或邻氨基苯甲酸合酶基因的拷贝测序，并通过标准方法鉴定基因的5′端，包括通过与其他邻氨基苯甲酸合酶基因的DNA序列同源或RNA酶保护分析，例如，Sambrook等在“分子克隆：实验指南”，第二版(1989)；Sambrook和Russell，在“分子克隆：实验指南”，第三版(2001.1.15)中所描述的。靶基因的3′和5′端可通过利用已知的AS编码区计算机搜索基因组序列数据库来定位。一旦鉴定基因的5′端，邻氨基苯甲酸合酶基因的完整拷贝可通过标准方法获得，包括克隆或利用与基因DNA序列的5′末端互补的寡核苷引物的聚合酶链式反应(PCR)。分离的邻氨基苯甲酸合酶基因的全长拷贝的存在可通过杂交，部分序列分析或通过表达玉米邻氨基苯甲酸合酶来验证。

本发明例证性分离的DNAs包括具有下面核苷酸SEQ ID NO的DNAs：

SEQ ID NO：1根瘤农杆菌(野生型)

SEQ ID NO：2玉米(野生型，α2)

SEQ ID NO：3芸香

SEQ ID NO：46大肠杆菌EMG2(K-12 wt F+)的截短的TrpE基因

SEQ ID NO：67玉米(C28突变)

SEQ ID NO：68玉米(C28+终止子)

SEQ ID NO：71叶绿体靶肽(g)

SEQ ID NO：73叶绿体靶肽(a)

SEQ ID NO：75根瘤农杆菌(优化的)

SEQ ID NO：76血色红假单胞菌

SEQ ID NO：83血色红假单胞菌(RhoPa_TrpEG)

SEQ ID NO：84根瘤农杆菌V48F突变体

SEQ ID NO：85根瘤农杆菌V48Y突变体

SEQ ID NO：86根瘤农杆菌S51F突变体

SEQ ID NO：87根瘤农杆菌S51C突变体

SEQ ID NO：88根瘤农杆菌N52F突变体

SEQ ID NO：89根瘤农杆菌P293A突变体

SEQ ID NO：90根瘤农杆菌P293G突变体

SEQ ID NO：91根瘤农杆菌F298W突变体

SEQ ID NO：92根瘤农杆菌S50K突变体

SEQ ID NO：93根瘤农杆菌F298A突变体

SEQ ID NO：94稻

SEQ ID NO：95稻的同功酶

SEQ ID NO：96玉米(Anderson的美国专利No.6,118,047)

SEQ ID NO：97小麦

SEQ ID NO：98烟草

SEQ ID NO：104陆地棉(Gossypium hirsutum)(α)

SEQ ID NO：105陆地棉(β)

SEQ ID NO：106大豆(Glycine max)(α)

SEQ ID NO：107大豆(β)

SEQ ID NO：112具有5′和3′UTRs的大豆(α)

SEQ ID NO：113具有5′和3′UTRs的大豆(β)

SEQ ID NO：116玉米(β)

SEQ ID NO：119稻(Oryza sativa)(β1)

SEQ ID NO：120稻(β2)

SEQ ID NO：121百脉根根瘤菌

SEQ ID NO：122巴西固氮螺菌

SEQ ID NO：123马尔他布鲁氏菌

SEQ ID NO：124念珠藻属

SEQ ID NO：125念珠藻属

SEQ ID NO：126血色红假单胞菌

SEQ ID NO：127大豆慢生根瘤菌

SEQ ID NO：128深红红螺菌

SEQ ID NO：129 Thermobifida fusca

SEQ ID NO：134高粱(Sorghum bicolor)(β1)

SEQ ID NO：135高粱(β2)

SEQ ID NO：136玉米(α1)

某些引物也可以用于实现本发明，例如具有SEQ ID NOs：9-42，47-56，或138-143的引物。

本发明也包括编码具有例如下述任何氨基酸序列的邻氨基苯甲酸合酶的任何分离核酸。

SEQ ID NO：4根瘤农杆菌(野生型)

SEQ ID NO：5玉米(野生型)

SEQ ID NO：6芸香

SEQ ID NO：7苜蓿中华根瘤菌

SEQ ID NO：8硫磺矿硫化叶菌

SEQ ID NO：43苜蓿中华根瘤菌

SEQ ID NO：44硫磺矿硫化叶菌

SEQ ID NO：45拟南芥

SEQ ID NO：57血色红假单胞菌

SEQ ID NO：58根瘤农杆菌V48F突变体

SEQ ID NO：59根瘤农杆菌V48Y突变体

SEQ ID NO：60根瘤农杆菌S51F突变体

SEQ ID NO：61根瘤农杆菌S51C突变体

SEQ ID NO：62根瘤农杆菌N52F突变体

SEQ ID NO：63根瘤农杆菌P293A突变体

SEQ ID NO：64根瘤农杆菌P293G突变体

SEQ ID NO：65根瘤农杆菌F298W突变体

SEQ ID NO：66玉米C28突变体

SEQ ID NO：69根瘤农杆菌S50K突变体

SEQ ID NO：70根瘤农杆菌F298A突变体

SEQ ID NO：74叶绿体靶肽(a)

SEQ ID NO：72叶绿体靶肽(g)

SEQ ID NO：77百脉根根瘤菌(MesLo_13472468)

SEQ ID NO：78巴西固氮螺菌(AzoBr_1717765)

SEQ ID NO：79马尔他布鲁氏菌(BruMe_17986732)

SEQ ID NO：80念珠藻属(Nostoc_17227910)

SEQ ID NO：81念珠藻属(Nostoc_17230725)

SEQ ID NO：82血色红假单胞菌RhoPa_TrpEG

SEQ ID NO：99稻

SEQ ID NO：100稻的同功酶

SEQ ID NO：101玉米(Anderson的美国专利No.6,118,047)

SEQ ID NO：102小麦

SEQ ID NO：103烟草

SEQ ID NO：108陆地棉(α)

SEQ ID NO：109陆地棉(β)

SEQ ID NO：110大豆(α)

SEQ ID NO：111大豆(β)

SEQ ID NO：114玉米(ASα2)叶绿体靶肽

SEQ ID NO：115玉米(ASα1)叶绿体靶肽

SEQ ID NO：117稻(β)

SEQ ID NO：118玉米(β)

SEQ ID NO：130大豆慢生根瘤菌

SEQ ID NO：131深红红螺菌

SEQ ID NO：132 Thermobifida fusca

SEQ ID NO：133高粱(β)

SEQ ID NO：137玉米(ASα1)

任何这些核酸和多肽以及其任何突变体，变异体或衍生物都可用于实现本发明。

单体的邻氨基苯甲酸合酶

根据本发明，来源于植物和非植物类的单体邻氨基苯甲酸合酶在植物中都有可以提供高水平色氨酸的功能。出乎意料的是非植物类来源的单体邻氨基苯甲酸合酶在植物中有很好的作用效果，尽管这些单体邻氨基苯甲酸合酶序列与大多数植物邻氨基苯甲酸合酶的同源性很低。例如，成功使用来源于如细菌，原生生物和微生物一样多样的物种的单体邻氨基苯甲酸合酶。特别是来源于下述细菌类的单体邻氨基苯甲酸合酶：根瘤农杆菌，苜蓿中华根瘤菌，百脉根根瘤菌，马尔他布鲁氏菌，念珠藻属PCC7120，巴西固氮螺菌，鱼腥藻M22983，大豆慢生根瘤菌(Bradyrhizobium janonicum)，深红红螺菌，和Thermobidfida fusca，在植物中都有提供高水平色氨酸的功能，尽管这些单体邻氨基苯甲酸合酶序列与大多数植物邻氨基苯甲酸合酶的同源性很低。

包含例如野生型单体根瘤农杆菌邻氨基苯甲酸合酶的转基因植物可以在种子中产生高达约10,000-约12,000ppm的色氨酸，平均的trp水平为约7,000-约8,000ppm。非转基因大豆植物的种子中通常只能达到约100-约200ppm的色氨酸。比较含有添加突变的玉米α-结构域的转基因植物产生较低水平的色氨酸(例如，平均达到约3000-约4000ppm)。

单体酶相对于多聚酶具有一些优点。例如，虽然本发明并不仅限于特定的机制，单体酶可以提供更好的稳定性，协同表达等。当在体内合成异源的四聚体邻氨基苯甲酸合酶的结构域或亚基时，这些结构域/亚基必须在酶具有活性之前就适当地组装成异源四聚体形式。通过转基因方法在植物中增加单个的邻氨基苯甲酸合酶结构域不能提供过量产生的异源四聚体酶，因为没有足够的内源非转基因结构域来从实质上增强功能四聚体的水平。因此，编码单体邻氨基苯甲酸合酶的核酸、载体和酶可有利地用于过量产生邻氨基苯甲酸合酶的所有酶功能。

根据本发明，当在植物细胞、植物组织或种子中表达时，可融合或连接来源于天然产生异源四聚体邻氨基苯甲酸合酶的种属的邻氨基苯甲酸合酶结构域，以提供能产生高水平色氨酸的单体邻氨基苯甲酸合酶。例如，单体邻氨基苯甲酸合酶可通过融合或连接邻氨基苯甲酸合酶的α和β-结构域，以使得α-β融合体与天然单体的邻氨基苯甲酸合酶的序列排列比对而制备。单体和四聚体邻氨基苯甲酸合酶的序列排列的实例如图21和35所示。采用这种序列排列，可以调整邻氨基苯甲酸合酶结构域的间隔和定位或修饰，以从异源四聚体区域产生任选地与天然邻氨基苯甲酸合酶的排列比对的单体邻氨基苯甲酸合酶结构。这种融合蛋白可用于升高植物组织中的色氨酸水平。

异源四聚体邻氨基苯甲酸合酶，例如硫磺矿硫化叶菌邻氨基苯甲酸合酶(例如，Genbank登录号GI 1004323)，与其他植物或微生物的异源四聚体邻氨基苯甲酸合酶的同源性大约为30％-87％。单体邻氨基苯甲酸合酶，例如根瘤农杆菌邻氨基苯甲酸合酶与其他单体酶，例如苜蓿中华根瘤菌(Genbank登录号GI 15966140)和巴西固氮螺菌(Genbank登录号1717765)的同源性分别为大约83％和约52％。Bae等人，苜蓿中华根瘤菌邻氨基苯甲酸合酶基因：克隆，测序和在大肠杆菌中表达，细菌学杂志J.Bacteriol.，171：3471-3478(1989)；De Troch等人，分离和纯化巴西固氮螺菌trpE(G)基因，编码邻氨基苯甲酸合酶.Curr.Microbiol.，34：27-32(1997)。

然而，全序列与天然单体和天然四聚体邻氨基苯甲酸合酶的同源性可以小于30％。因此，不是计算机产生的排列而是视觉排列，以优化排列单体和四聚体的邻氨基苯甲酸合酶。邻氨基苯甲酸合酶内的界标(landmark)结构和序列有助于序列排列。例如，基序″LLES″是形成邻氨基苯甲酸合酶的色氨酸结合袋的β-夹层的β-折叠的一部分。这种界标序列可用于更加确信地排列差异的邻氨基苯甲酸合酶序列，特别是用于确定涉及色氨酸结合的关键残基。

为了实现邻氨基苯甲酸合酶结构域的融合或连接，所选择的TrpE或α-结构域的C末端与TrpG结构域或β-结构域的N末端连接。在一些方案中，可在结构域间使用接头肽，以提供合适的间隔和/或灵活性。通过单体和四聚体邻氨基苯甲酸合酶的序列对比来鉴定合适的接头序列。

例如通过杂交，PCR扩增或如Anderson等人在美国专利No.6,118,047中所描述的，克隆所选择的β-结构域。质体传递肽序列可通过标准方法与邻氨基苯甲酸合酶编码区连接。例如可以使用拟南芥小亚基(SSU)的叶绿体靶肽(CTP，SEQ ID NOs：71-74)。也参见Stark等人，科学Science，258：287(1992)。然后可将融合的基因***在此所描述的用于转化植物的合适载体中。

邻氨基苯甲酸合酶的突变体

本发明所包括的突变的邻氨基苯甲酸合酶，可具有任何类型的突变，包括例如，氨基酸取代、缺失、和/或重排。这种突变体可以是邻氨基苯甲酸合酶核酸和在此所特异性鉴定的多肽的衍生物或变异体。突变的邻氨基苯甲酸合酶也可从任何可得到的种类中获得，包括没有在此明确鉴定的种类。突变体、衍生物和变异体可具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137序列中任何一个的氨基酸位点至少约30％的同一性，并且具有邻氨基苯甲酸合酶活性。在优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约50％的同一性，并且具有邻氨基苯甲酸合酶活性。在更优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约60％的同一性，并且具有邻氨基苯甲酸合酶活性。在更优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约70％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约80％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约90％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs：4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约95％的同一性，并且具有邻氨基苯甲酸合酶活性。

在一个实施方案中，邻氨基苯甲酸合酶突变体、变异体和衍生物可通过将SEQ ID NOs：1-3，9-42，46，47-56，67-68，75-76，83-98，104-107，112，113，116，119-129，134-136，和138-143，或其片段或引物中任何一个，在中等的或优选高严谨条件下与所选择的核酸源杂交来鉴定。杂交的中等或严谨条件在本领域是已知的，参见，例如Sambrook等人，分子克隆：实验指南，第二版(1989)的第0.47-9.51节；也参见Sambrook和Russell，“分子克隆：实验指南，第三版(2001.1.15)。例如，严谨条件是：(1)采用低离子强度和高温洗涤，例如0.015M NaCl/0.0015M柠檬酸钠(SSC)；0.1％十二烷基硫酸钠(SDS)，于50℃，或(2)杂交过程中使用例如甲酰胺的变性试剂，例如，50％甲酰胺，0.1％小牛血清/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/50mM磷酸钠缓冲液pH6.5和750mM NaCl，75mM柠檬酸钠，于42℃。另外一个实例是采用50％甲酰胺，5×SSC(0.75M NaCl，0.075M柠檬酸钠)，50mM磷酸钠(pH6.8)，0.1％焦磷酸钠，5×Denhardt′s溶液，超声的鲑精DNA(50μg/ml)，0.1％十二烷基硫酸钠(SDS)，和10％葡聚糖硫酸酯于42℃，和在42℃下用0.2×SSC和0.1％SDS洗涤。

本发明进一步提供杂交探针和包含至少7个核苷酸碱基的新分离和纯化的DNA片段的引物，其可被可检测地标记或结合可检测的标记。这种杂交探针或引物可在中等或高严谨条件下与编码邻氨基苯甲酸合酶的DNA分子的任何一条链杂交。这种杂交探针和引物的实例包括SEQ ID NOs：9-42，47-56，和138-143中的任何一个。

邻氨基苯甲酸合酶可以是任何邻氨基苯甲酸合酶，或其突变体或结构域，例如α-结构域。邻氨基苯甲酸合酶可以是单体邻氨基苯甲酸合酶。功能性的突变体是优先的，特别是那些能够在植物中产生高水平色氨酸的突变体，例如，对色氨酸的氨基酸类似物的抑制有基本抗性的突变体。

产生编码突变的邻氨基苯甲酸合酶的核酸可产生自任何方便的种类，例如，编码根瘤农杆菌，鱼腥藻M22983(例如Genbank登录号GI 152445)，拟南芥，巴西固氮螺菌(例如，Genbank登录号GI 1174156)，马尔他布鲁氏菌(例如，Genbank登录号GI 17982357)，大肠杆菌，薄肌眼虫藻，百脉根根瘤菌(例如，Genbank登录号GI 13472468)，念珠藻属PCC7120(例如，Genbank登录号GI 17227910或GI 17230725)，苜蓿中华根瘤菌(例如，Genbank登录号GI 95177)，芸香，血色红假单胞菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，硫磺矿硫化叶菌，大豆慢生根瘤菌，深红红螺菌，Thermobifidafusca，Sorghum bicolor，大豆，稻，棉花，小麦，烟草，玉米(玉蜀黍)的任何结构域，或编码邻氨基苯甲酸合酶亚基或区域的任何基因的核酸。

所需要的突变包括升高邻氨基苯甲酸合酶的活性，减少对色氨酸或其类似物的反馈抑制的敏感性，和/或在植物中产生升高量的色氨酸。这种突变在其显示的活性的水平或类型上具有功能性改变，并且有时被称为在此所提供的邻氨基苯甲酸合酶核酸和多肽的“衍生物”。

然而，本发明也包括邻氨基苯甲酸合酶变异体和带“沉默”突变的邻氨基苯甲酸合酶。正如在此所用的，沉默突变是一种改变邻氨基苯甲酸合酶核苷酸序列但并不改变邻氨基苯甲酸合酶编码的氨基酸序列的突变。突变核酸编码变异体邻氨基苯甲酸合酶，与相应的野生型邻氨基苯甲酸合酶相比，变异体具有一个或更多个氨基酸的改变但并没有从基本上改变它的活性。本发明指所有这种衍生物、变异体和带有沉默突变的邻氨基苯甲酸合酶核酸。

可通过几种方法获得编码对L-色氨酸或色氨酸的氨基酸类似物有抗性和/或耐受性的突变的邻氨基苯甲酸合酶的DNA。该方法包括但不限于：

1.培养物中的自发变异和直接的突变筛选；

2.任何细胞种类或组织，种子或植物的组织培养物中的直接或间接的突变方法；

3.通过下述方法突变所克隆的邻氨基苯甲酸合酶基因，例如通过化学突变；特异性点或定点诱变(Sambrook等人，在前引用的)，转位子介导的突变(Berg等人，生物技术Biotechnology，1：417(1983))，和缺失突变(Mitra等人，Molec.Gen.Genetic.，215：294(1989))；

4.在关键残基中设计合理的突变；以及

5.DNA移码以将感兴趣的突变整合到多种邻氨基苯甲酸合酶核酸中。

例如，可使用能够得到的邻氨基苯甲酸合酶蛋白的蛋白结构信息合理地设计可能具有增强的活性，或减少对色氨酸或色氨酸类似物敏感性的邻氨基苯甲酸合酶突变。这种蛋白结构信息是可以得到的，例如，从硫磺矿硫化叶菌(solfulobus solfataricus)邻氨基苯甲酸合酶(Knochel等人，Proc.Natl.Acad.Sci.(U.S.A.)，96：9479-9484(1999))。合理设计的突变可以通过对所选择的邻氨基苯甲酸合酶氨基酸与已知结构的，如硫磺矿硫化叶菌的邻氨基苯甲酸合酶氨基酸序列进行序列对比而实现。参见附图6、21和35。通过结合结构信息和序列同源性的知识来预测邻氨基苯甲酸合酶蛋白的色氨酸结合和催化区域。例如，确定色氨酸结合袋的残基可作为突变的候选物来改变酶对色氨酸反馈抑制的抗性。使用这种结构信息，在涉及色氨酸结合的位点或区域，合理设计几种根瘤农杆菌邻氨基苯甲酸合酶的突变体。

使用这种序列和结构分析，与单体根瘤农杆菌邻氨基苯甲酸合酶在大约25-60或200-225或290-300或370-375位类似的区域，可在单体根瘤农杆菌邻氨基苯甲酸合酶中，作为产生具有对色氨酸反馈抑制敏感性降低的活性的邻氨基苯甲酸合酶的潜在的有用突变而鉴定出来。更具体地，与单体根瘤农杆菌邻氨基苯甲酸合酶中的P29，E30，S31，I32，S42，V43，V48，S50，S51，N52，N204，P205，M209，F210，G221，N292，P293，F298，和A373类似的氨基酸是产生具有对色氨酸反馈抑制敏感性降低的活性的邻氨基苯甲酸合酶的潜在的有用突变残基。本发明包括在这些位点的任何氨基酸的取代或***。可选地，任何这些位点的氨基酸也可被缺失。

定点诱变可用于在各种位点产生氨基酸取代、缺失和***。在根瘤农杆菌邻氨基苯甲酸合酶编码区内的具体突变实例包括下列：

在大约48位用Phe替换Val(见例如，SEQ ID NO：58)；

在大约48位用Tyr替换Val(见例如，SEQ ID NO：59)；

在大约51位用Phe替换Ser(见例如，SEQ ID NO：60)；

在大约51位用Cys替换Ser(见例如，SEQ ID NO：61)；

在大约52位用Phe替换Asn(见例如，SEQ ID NO：62)；

在大约293位用Ala替换Pro(见例如，SEQ ID NO：63)；

在大约293位用Gly替换Pro(见例如，SEQ ID NO：64)；或

在大约298位用Trp替换Phe(见例如，SEQ ID NO：65)。

通过对比待突变的邻氨基苯甲酸合酶的氨基酸序列和根瘤农杆菌邻氨基苯甲酸合酶的氨基酸序列，可在任何邻氨基苯甲酸合酶的类似位置产生相似的突变。可用于序列对比的根瘤农杆菌邻氨基苯甲酸合酶的一个实例是SEQ ID NO：4。

可通过经典的突变和遗传筛选鉴定有用的突变体。通过将酶暴露在游离的L-色氨酸或色氨酸的氨基酸类似物下，测定基因编码的酶的活性来检测功能性变化，或通过限制性酶切图谱或DNA序列分析检测DNA分子中的变化。

例如，编码基本上耐受5-甲基色氨酸(5-MT)的邻氨基苯甲酸合酶的基因可以从5-甲基色氨酸耐受细胞系中分离。见美国专利No.4,581,847，其所公开的内容在此引入作为参考。简而言之，使部分分化的植物细胞培养物生长，并暴露于连续低水平的5-甲基色氨酸进行继代培养。然后在几次继代培养的期间逐步增加5-甲基色氨酸的浓度。在通常有毒性的5-甲基色氨酸水平存在下生长的细胞或组织，在5-甲基色氨酸存在下重复地传代培养和表征。所培养细胞的耐受5-甲基色氨酸性特性的稳定性可通过使所选择的细胞系在不含5-甲基色氨酸时生长不同的时间段，然后将组织暴露于5-甲基色氨酸后分析其生长来评估。由于邻氨基苯甲酸合酶改变而具有耐受性优点的细胞系可通过在通常有毒性的，即生长抑制剂水平的5-甲基色氨酸下鉴定具有酶活性的细胞系而选择出来。

从5-MT-或6-甲基邻氨基苯甲酸(6-MA)-抗性的细胞系中克隆的邻氨基苯甲酸合酶基因可以用标准方法评估对5-MY，6-MA，或色氨酸的其他氨基酸类似物的耐受性，如美国专利No.4,581,847所描述的，其所公开的内容在此引入作为参考。

对5-甲基色氨酸抑制的敏感性降低的邻氨基苯甲酸合酶的细胞系可以用于分离5-甲基色氨酸-抗性的邻氨基苯甲酸合酶。可从耐受5-甲基色氨酸的细胞系产生DNA文库，并且编码邻氨基苯甲酸合酶基因的全长或部分DNA片段可通过与编码邻氨基苯甲酸合酶基因的cDNA探针杂交而鉴定。改变基因的完整拷贝可通过克隆和连接或利用合适引物的PCT获得。编码邻氨基苯甲酸合酶的改变基因的分离可在转化的植物细胞中通过测定表达的邻氨基苯甲酸合酶在通常有毒性的5-甲基色氨酸水平下是否保留酶活性而验证。见Anderson等人，美国专利号6,118,047。

可优化在此提供的任何DNA分子的编码区，用于在所选择的生物体中例如，所选择的植物或其他宿主细胞类型中表达。对于所选择的植物具有优化的密码子使用的DNA分子的实例是具有SEQ ID NO：75的根瘤农杆菌邻氨基苯甲酸合酶的DNA分子。该优化的根瘤农杆菌邻氨基苯甲酸合酶DNA(SEQ ID NO：75)与SEQ ID NO：1有94％的同一性。

转基因和载体

一旦获得和扩增编码邻氨基苯甲酸合酶或其结构域的核酸，就可以可操作地与启动子，任选地与其他元件结合形成转基因。

大多数基因具有已知作为启动子并调控基因表达的DNA序列的区域。在真核和原核细胞中，通常在编码序列上游的DNA序列侧翼找到启动子区域。启动子序列提供对下游基因序列转录的调控，一般包括约50-约2,000个核苷酸碱基对。启动子序列也包含调控序列，例如可影响基因表达水平的增强子序列。一些分离的启动子序列可提供外源基因的基因表达，即不同于天然或同源基因的基因表达。已知启动子序列可以是强的或弱的或可诱导的。强启动子可以提供高水平的基因表达，而弱启动子提供低水平的基因表达。可诱导的启动子是对于外源所加的试剂或对于环境或发育的刺激可打开或关闭基因表达的启动子。启动子可以提供组织特异性或发育的调控。对于异源基因是强启动子的分离启动子是有利的，因为它提供足够水平的基因表达以便容易检测和筛选出转化细胞，在需要时提供高水平的基因表达。

可提供本发明的转基因中的启动子用于从编码邻氨基苯甲酸合酶的DNA序列表达邻氨基苯甲酸合酶。优选地，编码序列的表达导致植物组织，例如植物种子中色氨酸水平的增强。在另一个实施方案中，编码序列的表达导致对色氨酸的氨基酸类似物的反馈抑制或生长抑制的耐受性增强或导致细胞中色氨酸总量的增加。也可诱导启动子以使得基因表达可以在加入外源试剂时开放或关闭。例如，如P_tac启动子的细菌启动子可根据加入到转化的细菌细胞中的异硫丙基半乳糖苷的水平被诱导而改变基因表达的水平。也可优选结合具有提供在植物中组织特异性表达或发育地调控基因表达的启动子的基因。用于实现本发明的许多启动子对本领域技术人员来说是可获得的。

优选的启动子一般包括但不限于，在细菌、细菌噬菌体、质体或植物细胞中起作用的启动子。有用的启动子包括CaMV 35S启动子(Odell等人，自然Nature，313：810(1985))，CaMV 19S(Lawton等人，Plant Mol.Biol.，9：31F(1987))，nos(Ebert等人，Proc.Nat.Acad.Sci.(U.S.A.)，84：5745(1987))，Adh(Walker等人，Proc.Nat.Acad.Sci.(U.S.A.)，84：6624(1987))，蔗糖合酶(Yang等人，Proc.Nat.Acad Sci.(U.S.A.)，87：4144(1990))，α-微管蛋白，napin，肌动蛋白(Wang等人，Mol.Cell.Biol.，12：3399(1992))，cab(Sullivan等人，Mol.Gen.Genet.，215：431(1989))，PEPCase启动子(Hudspeth等人，Plant Mol.Biol.，12：579(1989))，7S-α′-大豆伴球蛋白启动子(Beachy等人，EMBO J，4：3047(1985))或与R基因复合物相关的启动子(Chandler等人，The Plant Cell，1：1175(1989))。其他有用的启动子包括噬菌体SP6，T3，和T7启动子。

也可使用质体启动子。大多数的质体基因含有可用于多亚基质体编码的RNA聚合酶(PEP)以及单亚基核编码的RNA聚合酶的启动子。核编码的聚合酶(NEP)启动子的共有序列和几种天然质体基因的特异性启动子序列的列表可在Hajdukiewicz等人，EMBO J.，16：4041-4048，(1997)中找到，在此将其全部引入作为参考。

可使用的质体启动子的实例包括玉米质体RRN(ZMRRN)启动子。ZMRRN启动子在拟南芥质体RNA聚合酶存在时可驱使基因表达。可用于本发明的相似启动子有甘氨酸最大质体RRN(SOYRRN)和烟草(Nicotianatabacum)质体RRN(NTRRN)启动子。所有这三种启动子都可被拟南芥(Arabidopsis)质体RNA聚合酶识别。RRN启动子的普遍特征在Hajdukiewicz等人和美国专利6,218,145中有描述。

而且，来源于特定启动子的转录增强子或复制增强子也可用于增强表达。这种增强子的实例包括但不限于，来源于CaMV 35S启动子和章鱼氨酸(octopine)合酶基因(Last等人，美国专利5,290,924)的元件。例如，根据本发明可构建包括ocs增强子元件的载体。这个元件首次是从农杆菌属(Ellis等人，EMBO J.，6：3203(1987))的章鱼氨酸合酶(ocs)基因中确定的16bp回文(palindromic)增强子，并且存在至少10个其他的启动子(Bouchez等人，EMBOJ.，8：4197(1989))。当在单子叶植物转化中使用时，建议使用增强子元件，例如ocs元件和特别是多拷贝的元件，将有助于增强邻近启动子的转录水平。组织特异性启动子，包括但不限于，根细胞启动子(Conkling等人，PlantPhysiol.，93：1203(1990))，并且也包括特别有用的组织特异性增强子(Fromm等人，The Plant Cell，1：977(1989))，以及例如ABA-和膨压诱导的启动子等的可诱导的启动子。

转录起始位点和编码序列起始之间的DNA序列，即未翻译的前导序列可影响基因表达，也希望采用特定的前导序列。可采用本领域技术人员可获得的任何前导序列。优选的前导序列直接优化所连接基因的表达水平，例如，通过增强或维持mRNA的稳定性和/或防止不合适的翻译起始(Joshi，Nucl.Acid Res.，15：6643(1987))。本领域技术人员谨慎考虑选择这种序列。也可以考虑使用来源于在双子叶植物，特别是大豆中高表达基因的序列。

在一些情况下，不必要极端高表达邻氨基苯甲酸合酶或其结构域。例如，使用本发明的方法可产生这种高水平的邻氨基苯甲酸合酶，可产生的底物而不是酶可能限制色氨酸产生的水平。在这种时候，本领域的技术人员可采用更加适度或调控水平的表达。这样技术人员可容易地调节和调控表达的水平，例如，通过使用弱启动子或发育调控或组织特异性的启动子。

编码感兴趣的邻氨基苯甲酸合酶的核酸也包括质体运输肽(例如SEQ IDNOs：72，74，114，或115)，有助于运输邻氨基苯甲酸合酶多肽进入质体，例如，进入叶绿体。通常编码所选择的质体运输肽(例如，SEQ ID NOs：71或73)的核酸在框内与编码邻氨基苯甲酸合酶的序列连接。然而，质体运输肽也可位于邻氨基苯甲酸合酶的N末端或C末端。

构建体也包括感兴趣的核酸(例如编码邻氨基苯甲酸合酶的DNA)和作为转录终止信号和允许所得mRNA的多聚腺苷酸化的核酸序列。这种转录终止信号位于感兴趣的编码区的3′或下游。优选的转录终止信号包括来源于根瘤农杆菌胭脂氨酸合酶基因的转录终止信号(Bevan等人，Nucl.AcidRes.，11：369(1983))，来源于根瘤农杆菌章鱼氨酸(octopine)合酶的终止子，和马铃薯和番茄中编码蛋白酶抑制剂I和II的3′末端基因，尽管也可以使用其他本领域技术人员已知的转录终止信号。根据需要进一步包括调控元件，例如Adh内含子1(Callis等人，Genes Develop.，1：1183(1987))，蔗糖合酶内含子(Vasil等人，Plant Physiol.，91：5175(1989))或TMVω元件(Gallie等人，ThePlant Cell，1：301(1989))。可以根据An，Methods in Enzymology，153：292(1987)描述的方法获得这些3′非翻译的调控序列，或已经存在可从商业上，例如Clontech，(Palo Alto，加利福尼亚)获得的质体上。3′非翻译的调控序列可按标准方法可操作地与邻氨基苯甲酸合酶基因的3末端相连。本发明也可以使用其他本领域技术人员已知的调控元件。

DNA构建体可包含第一表达盒，包括，可操作地连接，异源启动子，编码邻氨基苯甲酸合酶α-结构域蛋白的DNA分子和转录终止子。这种DNA构建体可进一步包含可操作连接的第二表达盒，其包括异源启动子，编码邻氨基苯甲酸合酶β-结构域蛋白的DNA分子和转录终止子。

在本发明中也使用可选择的标记基因或报道基因。这种基因可赋予表达标记基因的细胞明显的表型，这样可以在没有标记的细胞中区分出转化细胞。可选择的标记基因赋予一个可通过化学方法，即通过使用选择性试剂(例如，杀虫剂，抗生素等)进行“选择”的性状。报道基因或可筛选的基因赋予可通过观察或检测确定的性状，即通过“筛选”(例如，R-基因座性状)。当然，本领域已知许多合适标记基因的实例，都可用于实现本发明。

本发明中涉及使用的可选择标记包括但不限于，编码新霉素抗性的neo基因(Potrykus等人，Mol Gen.Genet.，199：183(1985))，可用卡那霉素，G418等选择；编码bialaphos抗性的bar基因；编码改变的DPSP合酶蛋白的基因(Hinchee等人，Biotech.，6：915(1988))可赋予草甘膦抗性；腈水解酶基因，例如来源于臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn，可赋予bromoxynil抗性(Stalker等人，Science，242：419(1988))；突变的乙酰乳酸合酶基因(ALS)可赋予咪唑啉酮、磺酰尿或其他ALS-抑制化学试剂(EP 154 204(1985))的抗性；氨甲喋呤抗性DHFR基因(Thillet等人，J.Biol.Chem.，263：12500(1988))；茅草枯(dalapon)脱卤素酶基因可赋予对杀虫剂茅草枯的抗性；或突变的邻氨基苯甲酸合酶基因可赋予对5-甲基色氨酸的抗性。使用突变的EPSP合酶基因时，通过整合合适的质体运输肽(CTP)可实现额外的益处。

能够在选择转化体的***中使用的可选择标记基因的说明性的实施方案是编码phosphinothricin乙酰基转移酶的基因，例如来源于吸水链霉菌(Streptomyces hygroscopicus)的bar基因或来源于绿色产色链霉菌(Streptomyces viridochromogenes)的pat基因(美国专利5,550,318，其在此引入作为参考)。Phosphinothricin乙酰基转移酶(PAT)使杀虫剂bialaphos，phosphinothricin(PPT)中的活性成分失活。PPT抑制谷氨酰胺合酶，(Murakami等人，Mol.Gen.Genet.，205：42(1986)；Twell等人，Plant Physiol.，91：1270(1989))导致氨的迅速积累和细胞死亡。

可使用的选择性标记包括但不限于，β-葡醛糖酸糖苷酶或uidA基因(GUS)，已知其编码各种发色底物的酶；R-基因座基因，其编码的产物调控植物组织中花色素苷色素(红色)的产量(Dellaporta等人，染色体结构和功能，第263-282页(1988))；β-内酰胺酶基因(Sutcliffe，Proc.Nat.Acad.Sci.(U.S.A.)，75：3737(1978))，已知其编码各种发色底物的酶(例如，PADAC，生色的头孢菌素)；xylE基因(Zukowsky等人，Proc.Nat.Acad.Sci.(U.S.A.)，80：1101(1983))编码儿茶酚双加氧酶可转换生色的儿茶酚；α-淀粉酶基因(Ikuta等人，Biotech.，8：241(1990))；酪氨酸酶基因(Katz等人，J.Gen.Microbiol.，129：2703(1983))，其编码的酶可以氧化酪氨酸为DOPA和多巴醌，其依次可浓缩形成易检测的化合物黑色素；β-半乳糖苷酶基因，已知其编码各种发色底物的酶；萤光素酶(lux)基因(Ow等人，Science，234：856(1986))，其可用生物发光检测；或甚至是水母发光蛋白质基因(Prasher等人，Biochem.Biophys.Res.Comm.，126：1259(1985))，它可用于钙敏感的生物发光检测，或绿色荧光蛋白基因(Niedz等人，Plant Cell Reports，14：403(1995))。转化细胞中lux基因的存在可使用例如X射线胶片，闪烁计数，荧光分光光度测定法，低光视频照相机，光子计数照相机，或多维发光仪(multiwell luminometry)检测。预想也可发展这个***以用于生物发光的群体筛选，例如在组织培养平板上，或甚至在整个植株中筛选。

另外，也可构建转基因，用于提供将基因产物导向植物细胞内的胞内部分或指导蛋白进入胞外环境。这通常通过连接编码运输或信号肽的DNA序列和编码特定基因的序列而实现。所得的运输或信号肽将分别把蛋白运输到特定的细胞内或细胞外的目的地，并且可在翻译后除去。运输或信号肽有助于运输蛋白通过细胞内的膜，例如，液泡、小泡、质体和线粒体膜，而信号肽指导蛋白通过胞外膜。通过协助蛋白进入细胞内或细胞外的区室，这些序列增强了基因产物的积累。

这种用法的特定实例是关于指导邻氨基苯甲酸合酶进入，例如质体而非细胞质的特定的细胞器。使用拟南芥SSU 1A运输肽赋予蛋白特异性导向质体作为例证性说明。可选地，转基因也可包括编码质体运输肽的DNA序列或编码rbcS(RuBISCO)运输肽的DNA序列，其可操作地连接启动子和编码邻氨基苯甲酸合酶的DNA序列。(关于质体导向肽的综述，见Heijne等人，Eur.J.Biochem.，180：535(1989)；Keegstra等人，Ann.Rev.Plant Physiol.PlantMol.Biol.，40：471(1989))。如果转基因被导入植物细胞，转基因也可包含植物转录终止和多聚腺苷酸化信号和翻译信号，以及连接植物邻氨基苯甲酸合酶基因的3′末端的翻译信号。

可以使用外源质体运输肽，其不在天然的植物邻氨基苯甲酸合酶基因内被编码。质体运输肽一般长度为40-70个氨基酸，功能是翻译后指导蛋白进入质体。运输肽在进入质体产生成熟蛋白的过程中或之后切除。编码植物邻氨基苯甲酸合酶的基因的完整拷贝含有质体运输肽。那种情况下，就没必要将外源获得的质体运输肽序列结合到转基因中。

可以从各种植物核基因中获得外源运输肽编码序列，只要基因的产物表达为含有氨基端运输肽的前蛋白并运输到质体中。已知的植物基因产物的实例包括这种运输肽序列，包括但不限于，核酮糖二磷酸羧化酶的小亚基，叶绿素a/b结合蛋白，由核基因编码的质体核糖体蛋白，某些热休克蛋白，氨基酸生物合酶，例如乙酰乳酸合酶，3-烯醇丙酮磷酸莽草盐(3-enolpyruvylphosphos hikimate)合酶，二氢吡啶二羧酸合酶，邻氨基苯甲酸合酶等的氨基酸。在一些情况中，质体运输肽蛋白可能在感兴趣的邻氨基苯甲酸合酶基因中编码，其中就不必要添加这种质体运输序列。可选地，编码运输肽的DNA片段可从例如上面所列出的运输肽的已知序列整个地或部分地化学合成，。

不管编码运输肽的DNA片段的来源，它必须包括例如ATG密码子的翻译起始密码子，和表达在宿主植物的质体中可识别的和发挥合适作用的氨基酸序列。也必须关注运输肽和邻氨基苯甲酸合酶之间连接的氨基酸序列，其可切除产生成熟的酶。已经鉴别了一些保守的氨基酸序列，并可作为指导路线。运输肽编码序列和邻氨基苯甲酸合酶编码序列的精确融合可能需要处理一个或两个DNA序列以引入，例如方便的限制性酶切位点。这可通过定点突变，化学合成的寡核苷接头的***等方法实现。

编码质体运输肽的核酸的精确融合是不必要的，只要编码质体运输肽的序列在编码邻氨基苯甲酸合酶的序列框内。例如，经常可以包括附加的肽或氨基酸而对感兴趣的蛋白的表达或定位无反作用。

一旦获得质体运输肽序列，可适宜地与启动子和邻氨基苯甲酸合酶编码区根据标准方法在转基因中连接。可构建在植物细胞中起作用和在下游具有多克隆位点的质粒或从商业来源获得。采用限制性酶将质体运输肽序列***启动子的下游。邻氨基苯甲酸合酶的编码区可在翻译后融合或立即***质体运输肽序列的3′末端的下游和框架内。因此，质体运输肽优先与邻氨基苯甲酸合酶的氨基端连接。一旦形成，将转基因亚克隆到其他的质粒或载体中。

除了核植物转化以外，本发明也提供植物质体基因组的转化。因此，将基因产物导向植物细胞内的胞内区室，可通过指导基因进入胞内部分获得。质体基因组的直接转化比核转化更好。例如，直接的质体转化邻氨基苯甲酸合酶相对于核转化消除了对质体靶肽和翻译后的运输以及前体蛋白的处理过程的需要。在P.Maliga，Current Opinion in Plant Biology，5：164-172(2002)，P.B.Heifetz，Biochimie，82：655-666(2000)，R.Bock.，J.Mol.Biol.，312：425-438(2001)，和H.Daniell等人，Trends in Plant Science，7：84-91(2002)中描述了植物的质体转化，在此作为参考。

构建了含有邻氨基苯甲酸合酶基因的转基因后，将盒导入植物细胞中。根据植物细胞的类型，基因表达的水平和基因编码酶的活性，将编码邻氨基苯甲酸合酶的DNA导入植物细胞可导致色氨酸的过量产生，赋予对色氨酸的氨基酸类似物，例如5-甲基色氨酸或6-甲基邻氨基苯甲酸的耐受性，和/或另外改变植物细胞中的色氨酸含量。

宿主细胞的转化

将包含邻氨基苯甲酸合酶基因的转基因亚克隆到已知的表达载体中，检测和/或定量AS的表达。这种筛选方法对于鉴定提供邻氨基苯甲酸合酶基因的表达的转基因，和邻氨基苯甲酸合酶在转化植物细胞的质体中的表达是有用的。

质粒载体包括附加的DNA序列，其提供简便的筛选，扩增和在原核和真核细胞中转化转基因，例如，pUC-衍生载体，pSK-衍生载体，pGEM-衍生载体，pSP-衍生载体，或pBS-衍生载体。附加的DNA序列包括提供载体自我复制的复制原点，可选择的标记基因，优选编码抗生素或杀虫剂抗性，提供多位点以便在转基因中***DNA序列或编码的基因的独特的多克隆位点，以及增强原核和真核细胞转化的序列。

可用于植物和原核细胞中表达的另外的载体是二元的Ti质粒(如在Schilperoort等人，美国专利4,940,838中所公开的)，以载体pGA582例证说明。二元的Ti质粒已经被在前引用的An鉴定。二元的Ti质粒可在原核细菌，例如大肠杆菌和农杆菌中复制。衣杆菌质粒载体可用于传递转基因进入植物细胞中。二元的Ti载体优选包括提供有效的植物细胞转化的胭脂氨酸TDNA的左右边界，可选择标记基因，T边界区独特的多克隆位点，colE1复制原点和野生型宿主区域的复制子。携带本发明的转基因的二元Ti载体可用于原核和真核细胞的转化，但优选用于转化植物细胞。参见例如，Glassman等人，美国专利5,258,300。

通过适用的方法将表达载体导入原核或真核细胞。对于单子叶和双子叶植物特别有效的转化方法，包括但不限于，微粒轰击未成熟胚胎(美国专利5,990,390)或II型胚胎发生的愈伤组织细胞，如W.J.Gordon-Kamm等人(Plant Cell，2：603(1990))，M.E.Fromm等人Bio/Technology，8：833(1990))和D.A.Walters等人(Plant Molecular Biology，18：189(1992))所描述的，或电穿孔I型胚胎发生的愈伤组织，如D′Halluin等人(The Plant Cell，4：1495(1992))，或Krzyzek(美国专利5,384,253)所描述的。通过与DNA包被的钨须漩涡转化植物细胞(Coffee等人，美国专利5,302,523)和使用含有DNA的脂质体转化细胞。

所选择的邻氨基苯甲酸合酶构建体转化细胞后，宿主细胞可用于由转基因的邻氨基苯甲酸合酶结合宿主酶促机制产生有用产物的生产。培养转化细胞导致升高的色氨酸产量和其他有用的化合物，其可以从细胞或培养基中获得。在各种宿主细胞和/或生物体中表达产生的有用化合物的实例，包括色氨酸，吲哚乙酸和其他植物激素，在大豆中发现的对心血管健康很重要的异类黄酮化合物，玉米中作为食草昆虫天敌的信号的挥发性吲哚，抗癌剂，例如十字花科(cruciferae)植物家族中的吲哚芥子油苷(glucosinolate)(吲哚-3-甲醇)，和吲哚生物碱，例如某些真菌产生的麦角化合物。(Barnes等人，Adv ExpMed Biol，401：87(1996)；Frey等人，Proc Natl Acad. Sci.，97：14801(2000)；Muller等人，Biol.Chem.，381：679(2000)；Mantegani等人，Farmaco，54：288(1999)；Zeligs，J Med Food，1：67(1998)；Mash等人，Ann NY Acad Sci.，844：274(1998)；Melanson等人，Proc Natl Acad.Sci.，94：13345(1997)；Broadbent等人，Curr Med Chem.，5：469(1998))。

色氨酸的积累导致微生物和植物中次级代谢产物增加，例如，含有例如植物中简单的吲哚，吲哚共轭物，吲哚生物碱，吲哚植物抗毒素和吲哚芥子油苷的代谢产物的吲哚。

对色氨酸不敏感的邻氨基苯甲酸合酶有可能由于色氨酸经分支酸变位酶刺激合成苯基丙氨酸，而增加各种分支酸衍生的代谢物，包括那些衍生自苯基丙氨酸的代谢物。参见Siehl，D.来自分支酸的色氨酸、酪氨酸和苯基丙氨酸的生物合成，″植物氨基酸：生物化学和生物技术″，BK Singh编辑，第171-204页。当存在反馈不敏感的邻氨基苯甲酸合酶时，其他分支酸衍生的代谢物可能增加，包括苯丙醇，类黄酮和异类黄酮，以及衍生自邻氨基苯甲酸的代谢物，例如吲哚，吲哚生物碱和吲哚芥子油苷。这些化合物中的许多种是重要的植物激素，植物防御化合物，各种健康状态的化学防护试剂，和/或药物活性的化合物。

由于邻氨基苯甲酸合酶的表达而增强合成的这些化合物的范围依赖于表达邻氨基苯甲酸合酶的生物体。本领域的技术人员可轻易地评估哪种和/或测定生物体和宿主细胞可用于产生所需要的化合物。本发明也包括在各种生物体，包括植物，微生物，真菌，酵母，细菌，昆虫细胞和哺乳动物细胞中合成色氨酸和其他有用的化合物。

筛选色氨酸过量产生的细胞系的策略

利用组织培养技术对所需要的色氨酸类似物抗性，色氨酸过量产生的变异体的有效筛选，需要仔细的确定筛选的条件。优化这些条件以容许在培养物中生长和积累色氨酸类似物抗性的、色氨酸过量产生的细胞，同时抑制大量细胞群的生长。由于个体细胞在种群中的存活力高度依赖于邻近细胞的存活力，这使得情况变得复杂。

通过化合物与组织相互作用的特征确定细胞培养物暴露于色氨酸类似物下的状况。要考虑例如毒性的程度和抑制的速率这类因素。培养物中细胞化合物的积累，培养基和细胞中化合物的持续和稳定，都需要同吸收和传递给所需要的细胞部分的程度一起考虑。可选地，测定加入色氨酸是否逆转化合物的作用也很重要。

要仔细评价类似物对于培养物的存活力和形态学的影响。特别重要的是选择对培养的植物再生能力没有影响的暴露于类似物的条件。对类似物暴露条件的选择也受到类似物是否杀死细胞或只是抑制细胞分化的影响。

筛选方案的选择依赖于上面提到的考虑因素。下面简要描述的方案可用于筛选过程。例如，为了选择对色氨酸类似物的生长抑制有抗性的细胞，将在培养物的悬浮液中很好分化的细胞在短时间内暴露在高水平的色氨酸类似物下。回收和蓄积存活的细胞，并随后再暴露更长时间。可选地，有组织的部分分化的细胞培养物伴随连续的暴露在最初低水平的色氨酸类似物下生长和传代培养。经过几次传代培养间隔后浓度逐渐增加。在筛选过程中使用这些方案时，本发明并不仅限于这些过程。

植物修饰的基因

如上所描述的，在本发明的转基因，载体和植物中，作为可选择的标记基因和报道基因的基因可操作地与编码邻氨基苯甲酸合酶或其结构域的DNA序列连接。另外，可以将其他农艺学的性状加到本发明的转基因，载体和植物中。这些性状包括但不限于，昆虫抗性或耐受性；疾病抗性或耐受性(病毒，细菌，真菌，线虫类)；胁迫抗性或耐受性，例证说明的有抗或耐受干旱，热，冷，冰冻，过量潮湿，盐胁迫，氧化胁迫，增加的产量，食物含量和组成，物理表现，雄性不育，干燥，群从能力(standability)，繁殖力，淀粉特性，油的数量和质量等。可整合一个或多个赋予本发明的植物这些性状的基因。

昆虫抗性或耐受性

苏云金芽孢杆菌(Bacillus thuringiensis或″Bt″)包括近20种已知亚类的细菌，其产生的内毒素多肽被多种昆虫摄入时是有毒的。内毒素蛋白(Bt蛋白)和相应的基因(Bt基因)的生物学和分子生物学在H.R.Whitely等人，Ann.Rev.Microbiol.，40：549(1986)和H.Hofte等人，Microbiol.Rev.，53：242(1989)中有评述。已经克隆和测序了各种Bt蛋白的编码基因。Bt多肽的片段对于各种鳞翅目(Lepidoptera)害虫的毒性是本质上的，并占大约Bt多肽分子首要(first)的50％。因此，截短的Bt基因编码的截短的Bt多肽在多数时候保留了对多种鳞翅目昆虫的毒性。例如HD73和HD1 Bt多肽显示对美国植物中的重要鳞翅类害虫幼虫的毒性，例如欧洲玉米螟(borer)，切根虫(cut worms)和螟蛉(earworms)。M.Geiser等人，Gene，48：109(1986)和M.J.Adang等人，Gene，36：289(1985)各自克隆和测序了编码HD73和HD1 Bt多肽的编码基因，其可从采用标准方法收集的培养物(例如，Bacillus Genetic Stock Center，Columbus，OH or USDA Bt stock collection Peoria，IL)中获得的HD73和HD1菌株中克隆。例如在美国专利6,329,574；6,303,364；6,320,100和6,331,655中描述了Bt基因和多肽。

编码新的、以前未表征的Bt毒素的DNA可从宿主芽孢杆菌(Bacillus)生物体中采用以前克隆Bt基因的步骤克隆得到，也可以产生Bt毒素的新的合成形式。

用于本发明的Bt基因包括5′DNA序列，其含有在植物中允许下游的Bt序列转录和翻译起始的DNA序列。Bt基因也包含3′DNA序列，它包括来源于可在感兴趣植物中表达的基因的3′非编码区的序列。Bt基因也包括编码苏云金芽孢杆菌产生的毒性Bt多肽或其毒性部分或具有的基本氨基序列的同源物的DNA序列。Bt编码序列可包括：(i)编码与Bt内毒素基本上同源的杀虫剂蛋白的DNA序列，它对感兴趣植物的有害昆虫有活性，例如HD73或HD1 Bt序列；(ii)编码Bt内毒素多肽的杀虫剂活性的片段的序列，例如杀虫剂活性的HD73或HD1多肽的从羧基和/或氨基端截短的形式；和/或(iii)在框内与编码提供附加优点的多肽融合的截短的Bt序列，所附加的优点例如：(a)可选择的基因，例如，赋予抗生素或杀虫剂抗性的基因，(b)其产物易检测和分析的报道基因，例如，荧光蛋白或β-葡萄糖苷酶；(c)编码具有一些附加用途的多肽序列的DNA序列，该附加用途是稳定Bt蛋白不被降解或增强Bt蛋白对昆虫的有效性，例如蛋白酶抑制剂；和(d)协助指导Bt蛋白进入植物细胞特定的部分内或外的序列，例如信号序列。

为了在植物中获得Bt蛋白的优化合成，也可以适当调节Bt基因的DNA序列，使基因在感兴趣的植物中更加有效的表达。由于Bt基因的密码子使用与感兴趣植物中表达的基因所使用的不同，可以通过使用在植物中，例如经常在感兴趣的植物中使用的(见E.Murray等人，Nucl Acids Res.，l7：477(1989))更加有效表达的密码子来取代这些密码子而增加Bt基因在植物细胞中的表达。这种密码子取代需要取代碱基但不改变最终Bt多肽的序列。Bt多肽序列可与细菌基因或其片段相同。含有比原始细菌的基因更加优选的密码子的完整的Bt编码序列或其部分，可通过采用标准的化学合成方法合成，并且采用标准方法导入或组装Bt基因，例如定点突变或DNA聚合和连接等。

蛋白酶抑制剂可提供昆虫抗性。例如，使用来源于马铃薯或番茄的蛋白酶抑制剂II基因，pinII是非常有用的。组合使用pinII基因和Bt毒素基因也是有好处的。编码昆虫消化***抑制剂的其他基因，或编码酶或有助于抑制剂产生的辅助因子的基因也很有用。这包括例如来源于小麦和大麦的水稻半胱氨酸蛋白酶(oryzacystatin)抑制剂和淀粉酶抑制剂。

编码凝集素的基因可赋予附加的或备选的杀虫剂特性。(Murdock等，Phytochemistry，29 85(1990)；Czapla和Lang，J.Econ.Entomol.，83：2480(1990)。也包括有用的外源凝集素基因，例如，大麦和小麦的胚凝集素(WGA)以及稻的外源凝集素(Gatehouse等人，J Sci Food Agric.，35：373(1984))。

当被导入有害昆虫时，控制针对昆虫的大的或小的活性多肽，例如溶解酶的肽，肽激素和毒素和毒液的产量的基因都是很有用的。例如，保幼激素酯酶的表达直接导向特异性的有害昆虫，也可导致杀虫剂活性，或可导致***的停止(Hammock等人，Nature，344：458(1990))。

表达编码影响昆虫外皮(cutide)完整性的基因的转基因植物也是有用的。这些基因包括编码几丁质酶，蛋白酶，脂肪酶和产生三国霉素的基因。编码影响昆虫蜕皮活性的基因，如影响蜕皮素UDP-葡萄糖基转移酶产量的基因也是有用的。

编码促进减少植物对有害昆虫的营养品质的化合物的生产的酶的基因也是有用的。通过改变固醇成分可例如赋予植物杀虫剂活性。本发明进一步的实施方案涉及具有增强的脂肪氧化酶活性的转基因植物。

本发明也提供用于改变次级代谢物的方法和化合物。一个实例涉及改变植物产生DIMBOA，预期其可赋予对欧洲玉米螟，根虫和几种其他有害昆虫的抗性。参见例如，美国专利6,331,880。DIMBOA来源于吲哚相关的化合物。本发明提供的方法用于增强植物细胞和组织内类似色氨酸的吲哚相关地化合物含量。因此，根据本发明在此提供的方法也可增加DIMBOA的水平，因而增强对昆虫的抗性。

导入调控玉米可凝性球蛋白(maysin)产生的基因和涉及高粱中蜀黍苷产生的基因，都可分别用于促进对有害幼虫(earworm)和根虫的抗性。

也可使用编码具有潜在的杀虫剂活性的蛋白的更多基因。这种基因包括，例如，可用作根虫抑制剂的豇豆胰蛋白酶抑制剂(CpTI；Hilder等人，Nature，330：160(1987))；证实可用于玉米根虫抑制剂(deterrent)的编码除虫菌素的基因(除虫菌素和阿巴美丁(Abamectin)，Campbell，W.C.，编辑.，1989；Ikeda等人，J Bacteriol，169：5615 1987)；核糖体灭活蛋白基因；和调控植物结构的基因。转基因植物包括抗昆虫抗体基因和编码可将植物外用为非毒性杀虫剂(前杀虫剂)转化为植物内杀虫剂的酶的基因。

环境或胁迫抗性或耐受性

可通过基因的表达影响植物对各种环境胁迫的耐受能力的提高。例如，对霜冻温度的增强抗性可通过导入“抗冻”蛋白，例如美洲拟鲽(WinterFlounder)(Cutler等人，J Plant Physiol.，135：351(1989))或合成其基因衍生物而赋予。改善质体中甘油-3-磷酸乙酰基转移酶的表达可赋予增强的耐寒性(Wolter等人，The EMBO J.，11：4685(1992))。超氧化物歧化酶的表达可赋予对氧化胁迫的抗性(Gupta等人，Proc.Natl.Acad.Sci(U.S.A.)，90：1629(1993))，谷胱甘肽还原酶可改善对氧化胁迫的抗性(Bowler等人，Ann Rev.Plant Physiol.，43：83(1992))。

预期影响植物的含水量，总的水压，渗透压和膨压的基因的表达增强植物对干旱的耐受性，并因此将是有用的。建议使用例如，编码用于渗透压活性溶质的生物合成的基因的表达可赋予抗干旱的保护。这类基因中有编码甘露醇脱氢酶(Lee和Saier，J.Bacteriol.，258，10761(1982))和海藻糖-6-磷酸合酶(Kaasen等人，J.Bacteriology，174：889(1992))的基因。

类似地，其他代谢产物也可保护酶的功能或膜的完整性(Loomis等人，J.Expt.Zoology，252：9(1989))，因此编码用于这些化合物的生物合成的基因可赋予以类似或补充甘露醇的方式的干旱抗性。天然产生的其他代谢物的实例是渗透压活性的，和/或在干旱和/或脱水过程中提供一些直接保护作用的，包括果糖，赤藓糖醇，山梨醇，卫矛醇，葡糖基甘油，蔗糖，水苏糖，棉子糖，脯氨酸，甘氨酸，甜菜碱，ononitol和松醇。参见例如，美国专利6,281,411。

根据结构的相似性可分为三种后期胚胎发生蛋白(见Dure等人，PlantMolecular Biology，12：475(1989))。所有三种LEA组的结构基因的表达可赋予干旱耐受性。水胁迫过程中诱导的其他类型的蛋白可能是有用的，包括硫醇蛋白酶，醛缩酶和跨膜运输蛋白，在干旱胁迫中其可赋予各种保护性和/或修复功能。参见例如，PCT/CA99/00219(Na+/H+交换多肽基因)。影响脂质生物合成的基因也可用于赋予干旱抗性。

涉及特异的形态学性状，容许从干燥的土壤中增强水的提取的基因表达也是有用的。在胁迫过程中增强复制适应性的基因表达也是有用的。建议在胁迫过程中最小化核发育不全的基因表达将提高所收获的谷物的数量，因此是有价值的。

即使当土壤中的水不受限制时，通过导入和表达基因可使植物更有效地利用水从而增加总的产量。通过导入基因提高植物最大化利用水的能力，可克服涉及水的可获得性的所有胁迫范围，也可实现产量性能的稳定性或产量的连续性。

疾病抗性或耐受性

可通过表达基因产生对病毒的抗性。例如，表达针对基本的病毒功能的反义基因或表达编码病毒外壳蛋白的基因可赋予对病毒的抗性。

通过导入基因赋予对细菌和真菌导致的疾病的抗性。例如，编码称作“肽抗生素”的基因，编码病原相关(PR)蛋白，毒素抗性和影响宿主病原体相互作用，例如形态学特征的蛋白的基因都是有用的。

真菌毒素的减少/消除

由植物相关的真菌产生的真菌毒素，包括黄曲霉毒素和烟曲霉毒素(fumonisin)，是使得谷粒无用的一个重要因素。抑制这些真菌的生长可减少毒素物质的合成，从而减少由于真菌毒素污染造成的谷粒损失。可在植物中导入基因抑制真菌毒素的合成而不妨碍真菌的生长。此外，为了获得减少真菌毒素污染的谷粒，表达编码使得真菌毒素无毒性的酶的新基因也是有用的。

植物组合物或品质

可以改变植物组合物，例如，通过各种方式改善氨基酸的平衡，包括增加天然蛋白的表达，降低不良组合物的表达，改变天然蛋白的组成，或导入编码完整的具有优越组成的新蛋白的基因。参见例如，美国专利6,160,208(种子储存蛋白表达的改变)。导入基因改变植物中油的含量是有价值的。参见例如，美国专利6,069,289和6,268,550(ACCase基因)。导入的基因可例如通过增加分枝的程度，通过延迟代谢导致母牛中增加对淀粉的利用，从而增强植物中淀粉含量的营养价值，。

植物农艺学的性状

决定植物在何处生长的两个因素是生长季节过程中的平均日温度和霜冻间的时间长短。表达涉及调控植物发育的基因也许是有用的，例如，已经在谷物(corn)中鉴定的非舌叶(liguleless)和粗糙鞘基因。

导入玉米的基因将增强站立性和其他植物的生长特性。赋予更强壮的茎，改善的根系或防止或减少抽穗的额外损耗的基因表达对于农民来说都是有价值的。

营养利用

利用可获得营养的能力是植物生长的一个限制因素。通过导入基因可改变营养的吸收，耐受pH的极限，植物中的流动，储存库，和代谢活动的有效性。这些修饰使得植物更加有效利用可获得的营养。例如，通常存在于植物中并涉及营养利用的酶的活性的增强可增强营养的有用性。这种酶的一个实例是植酸酶。

雄性不育

雄性不育在生产杂交中有用，雄性不育可通过表达基因产生。可通过转化导入TURF-13而从疾病敏感性中分离出雄性不育。参见Levings，Science，250：942-947，(1990)。对于育种的目的，有必要恢复雄性不育，可导入编码恢复雄性不育的基因。

抗性细胞系的筛选和表征

当细胞或组织恢复到在通常的色氨酸类似物水平抑制存在下观察到生长良好就可以进行筛选。这些细胞“系”在色氨酸类似物存在下传代培养几次以去除非抗性细胞，然后进行表征。通过比较在各种浓度的色氨酸类似物存在下这些细胞系和未筛选细胞或组织的生长可确定所获得的抗性量。将所筛选的细胞系在没有色氨酸类似物存在下，简单培养不同的时间阶段，然后分析将组织再暴露在色氨酸类似物下的生长就可以评估培养细胞抗性的稳定性。也可以使用体外化学研究评估抗性细胞系来证实改变类似物的作用位点可形成对色氨酸类似物抑制的较少的敏感性。

在转化细胞中可测定和定量邻氨基苯甲酸合酶的瞬时表达。基因表达可通过RT-PCR分析，使用克隆的邻氨基苯甲酸合酶特异性抗体的Western印迹或通过检测在色氨酸或色氨酸的氨基酸类似物存在下酶的活性而定量。测定克隆的邻氨基苯甲酸合酶的组织和亚细胞定位可通过使用克隆的邻氨基苯甲酸合酶特异性抗体的免疫化学染色法或亚细胞的分级以及随后的生物化学和/或免疫学分析。也可以评估克隆的邻氨基苯甲酸合酶对试剂的敏感性。提供邻氨基苯甲酸合酶的表达或邻氨基苯甲酸合酶对色氨酸的氨基酸类似物或游离的L-色氨酸的抑制的耐受性的转基因可用于转化单子叶和/或双子叶植物组织细胞并产生转化的植物和种子。转化细胞可通过检测选择性标记基因或报道基因的存在，例如，通过检测选择性的除草剂抗性标记而筛选。邻氨基苯甲酸合酶基因在转基因的胚胎发生愈伤组织中的瞬时表达可使用对邻氨基苯甲酸合酶特异性的抗体或通过RT-PCR分析来检测。

植物再生和种子的生产

转化的胚胎发生愈伤组织，分生组织，胚，叶盘等都可用于产生显示转化的邻氨基苯甲酸合酶基因稳定遗传的转基因植物。显示对色氨酸的氨基酸类似物的令人满意水平耐受性的植物细胞系可通过本领域已知的方法实行植物再生方案以获得成熟植物和表达耐受性性状的种子(例如，参见美国专利5,990,390和5,489,520；和Laursen等人，Plant Mol.Biol.，24：51(1994))。植物再生方案可使体细胞胚发育并随后生长成根和苗。为了确定耐受性性状在植物分化器官中，而不仅只是在未分化的细胞培养物中表达，可分析再生植物相对于再生的非转化植物的植物各个部分的色氨酸存在水平。转基因植物和种子可从采用标准的方法显示出色氨酸含量或对色氨酸类似物的抗性变化的细胞和组织中产生。尤其优选色氨酸含量增强的叶片和种子。在抑制量的色氨酸或其类似物的存在下，酶特定活性的变化可通过检测转化细胞中的酶活性来测定，如Widholm，Biochimica et Biophysica Acta，279：48(1972)中所描述的。通过如Jones等人，Analyst，106：968(1981)所描述的标准方法检查总色氨酸含量的变化。

从已知表达性状的细胞系获得成熟的植物。如果可能的话，使再生植物自花授粉。另外，将来源于再生植物的花粉与具有农艺学上重要的自交系的种子所生长的植物进行杂交。在一些情况中，使用来源于自交系的花粉给再生植物授粉。通过评价第一代和后代的性状分离来遗传表征该性状。如果该性状是商业上有用的，组织培养物中所选择的植物性状的遗传可能性和表达是特别重要的。

如果各种不同杂交组合都可以得到的话，色氨酸过量产生的大豆，谷类和其他植物的商业价值是巨大的。农民一般根据成熟度，站立性或其他农艺学性状的差异种植多种杂交品种。另外，由于成熟度，疾病，和昆虫抗性的性状的差异，适应一部分地区的杂种并不适于其他部分。因此，有必要培育色氨酸过量产生的大量的亲本自交系以产生许多杂交组合。

通过杂交原始过量产生的品系与正常的原种品系以及将杂交后代与正常的亲本回交来进行转换过程(回交)。这种杂交的后代将进行分离以至于携带基因的植物负责过量生产，而另外一些则没有。携带这种基因的植物再次与正常的亲本杂交，导致在后代中再次分离出过量产生和正常产量的性状。不停重复直到原始正常的亲本转变成过量产生的品系，也具有在正常亲本中原始就有的其他重要的特性。对于每种原种品系都实现分离的回交方案，则可将其转换成色氨酸过量生产的品系。

回交后，新的过量产生的品系和合适品系的组合是具有很好的商业价值的杂种，评价其过量生产和其他一系列重要的农艺学性状。生产过量产生的品系和杂种，其是原始正常品系和杂种的纯种类型。这需要在一系列环境条件中评估哪些品系或杂种通常将用于大规模地生长。对于高水平色氨酸大豆的产生，需要杂种种子的两个亲本是纯合的高色氨酸的特征。增加表现令人满意的杂种的亲本品系并采用标准的杂种种子生产试验用于杂种的制备。

预计在此产生的转基因植物有益于各种商业和研究目的。可产生转基因植物用于传统的农艺学以具有对从植物中收获的谷粒的消费者有利的性状(例如，在人食物或动物饲料中增加营养含量)。在这种用途中，植物通常是为了人或动物食物中的谷物的用途而生长。然而，植物的其他部分，例如茎，外壳，营养性部分等都是有用的，包括用作动物饲料，发酵饲料，生物催化的一部分或观赏性的用途。

转基因植物也可用于商业上的蛋白或其他分子的生产，其中从植物部分，种子等中提取或纯化感兴趣的分子。也可体外培养、生长植物的细胞或组织，或发酵制备这种分子。

转基因植物也可用于商业上的育种项目，或杂交或培育相关农作物种类的植株。可以传递重组DNA编码的改进，例如，通过原生质体融合从大豆细胞传递到其他种类的细胞。

在一个实施方案中，含有玉米邻氨基苯甲酸α-结构域的转基因分离自对5-MT耐受的玉米品系，与35S CaMV启动子连接并且采用微粒轰击的方法导入5-MT敏感的单子叶或双子叶组织中。筛选出转化的胚胎或分生组织用于产生转基因植物。评估转化的愈伤组织和转基因的植物对5-MT或6-MA的耐受性和耐受性状的稳定遗传性。

下面的实施例进一步阐述了本发明，但并不是为了限制本发明。

实施例1：来自根瘤农杆菌的邻氨基苯甲酸合酶的分离和大肠杆菌表达

该实施例描述了来自根瘤农杆菌的邻氨基苯甲酸合酶的分离及其在大肠杆菌中的表达。

根瘤农杆菌AS的克隆

使用来自苜蓿中华根瘤菌(Rhizobium meliloti)的邻氨基苯甲酸合酶编码区的核苷酸和氨基酸序列(GenBank登录号：P15395)检索根瘤农杆菌C58基因组序列数据库(Goodner等人，科学Science，294：2323-2328(2001))。该检索由利用blosum62矩阵的tblastn组成(Altschul等人，核酸研究Nucleic Acid Res.，25：3389-3402(1997))。

在根瘤农杆菌C58基因组序列数据库中鉴定的AS同系物，通过利用来自根瘤农杆菌菌株C58(ATCCNo.33970)的基因组DNA作为模板的PCR克隆。初级的PCR反应利用下列引物进行：

5′-TTATGCCGCCTGTCATCG-3′(SEQ ID NO：47)；和

5′-ATAGGCTTAATGGTAACCG-3′(SEQ ID NO：48)。

基因扩增参数如下：(a)95℃变性30秒，(b)50℃退火30秒，以及(c)根据制造商的指导，利用扩展高保真PCR(Roche Biochemicals)在72℃延伸2分钟。

附加一轮的PCR扩增产生大约2.3Kb长度的产物，该反应利用上述的扩增模板和下列成套引物：

5′-CTGAACAACAGAAGTACG-3′(SEQ ID NO：49)；和

5′-TAACCGTGTCATCGAGCG-3′(SEQ ID NO：50)。

将纯化的PCR产物连接到pGEM-Teasy(Promega Biotech)中从而得到质粒pMON61600(图1)。pMON61600利用标准的测序方法测序。正确序列的确认是通过与苜蓿中华根瘤菌邻氨基苯甲酸合酶的序列(图2)比较而获得的。来自分离克隆的翻译的氨基酸序列(SEQ ID NO：4)与苜蓿中华根瘤菌酶(SEQID NO：7)(图2)享有88％的同一性。缩写″AgroAS″或根瘤农杆菌AS有时在此用于指根瘤农杆菌的邻氨基苯甲酸合酶。

根瘤农杆菌AS的大肠杆菌表达

构建下列载体以便于将根瘤农杆菌AS基因亚克隆到合适的表达载体中。

利用pMON61600作为模板和下列引物产生2215碱基对的PCR片段：

5′-AAAAAGATCTCCATGGTAACGATCATTCAGG-3′

(SEQ ID NO：51)；和

5′-AAAAGAATTCTTATCACGCGGCCTTGGTCTTCGCC-3′

(SEQ ID NO：52)。

质粒pMON61600用限制性内切酶NcoI和RsrII消化。另外，将409bp的片段(通过用NcoI和RsrII消化2215碱基对的PCR产物产生)随后连接到消化的pMON61600质粒中，从而替换NcoI/RsrII片段，并在具有根瘤农杆菌AS翻译起始密码子(ATG)的框内得到NcoI位点，以产生质粒pMON34692(图3)。

碱基T7大肠杆菌表达质粒，pMON34697(图4)，是通过用SphI和BamHI限制性消化pET30a(NoVogen公司)而产生的。纯化所得到的4,969bp片段并用来自pET11d(NoVogen公司)的338bp的SphI和BamHI片段亚克隆。

质粒pMON34705(图5)通过用NcoI和SacI限制性消化pMON34697而产生。然后纯化所得到的5,263bp片段并连接来自包含根瘤农杆菌AS的pMON34692的2,256bp的NcoI和SacI片段。

根据制造商的指导说明(Novogen公司)，将质粒pMON34705转化入大肠杆菌BL21(DE3)(F-ompTHsdS_b(r_B ^-m_B ^-)gal dcm(DE3))。DE3是包含受控制于异丙基-1-硫代-D-半乳糖苷(IPTG)诱导的lacUV5的T7 RNA聚合酶的染色体拷贝的λDE3的宿主溶菌原。

在已经于37℃培养过夜(10小时)的卡那霉素平板上筛选转化细胞。将单克隆转入2ml的LB(Luria液体培养基；每升10g胰蛋白胨，5g酵母提取物，10gNaCl，和1g葡萄糖(任选的))或2×-YT液体培养基(每升16g胰蛋白胨，10g酵母提取物，5gNaCl)，然后放入37℃的培养箱中在225rpm摇动3小时。移出细胞并在培养物中加入4μL的100mM IPTG，再放回37℃培养箱补充培养2-3小时。移出1mL等分的细胞，并在超声缓冲液(50mM磷酸钾(pH7.3)，10％甘油，10mM 2-巯基乙醇和10mM MgCl₂)中超声处理。所得到的裂解细胞提取物是用于如下所述的标准AS分析的原材料。结果证实以质粒pMON34705为基础的表达体系能够生产可溶解的和酶促活性的根瘤农杆菌AS蛋白质，其数量是总的可溶解的提取蛋白质的大约50％。

实施例2：通过用野生型的农杆菌邻氨基苯甲酸合酶转化植物获得高Trp种子水平。

表达载体pMON58120

载体pMON58120(图34)编码264碱基对的拟南芥小亚基(SSU)叶绿体靶肽(CTP，SEQ ID NO：71)和2187碱基对的野生型农杆菌(Agrobacterium)邻氨基苯甲酸合酶(AgroAS)开放阅读框(SEQ ID NO：1)间的融合体。参见，Stark等人，(1992)科学Science，258：287。开放阅读框的表达是由大豆7Sα初级(7Sα′)启动子驱动的。

当在细胞质核糖体上翻译时，融合体(不成熟的蛋白质)进入到叶绿体中，其中除去了叶绿体靶序列。在CTP1中存在2个切割位点。第一个位点是CDS起始(C/M)上游的30个碱基对，而另一个是起始的甲硫氨酸(C/M)。第二切割位点看来不进行有效地加工。预测该切割产生通过酶活性数据和trp效能数据所显示的具有AS活性的大约70Kd的成熟蛋白质。

AS基因用赋予草甘膦抗性的合成CP4基因转化，然而CP4基因是从AS基因单独加工出来的。CP4基因的表达由FMV启动子驱动，该启动子是来自玄参(Figwort)花叶病毒的35S启动子。草甘膦抗性提供了转化植物的筛选。

AS蛋白质的Western分析

分析pMON58120的35个转化事件中AgroAS蛋白质的存在。AgroAS蛋白质用兔抗纯化的His标记的AgroAS激发的多克隆抗体检测。使用His-标记的全长Agro-AS多肽作为抗原，由CoCalico Biological公司在兔中产生多克隆抗体群。将重组His标记的Agro-AS DNA置入pMON34701(pet-30a-agroAS)表达载体。His-AgroAS融合蛋白质在大肠杆菌BL21(DE3)中表达，并通过Ni-NTA树脂***(Qiagen方法)纯化。对于western分析，使用1∶5,000稀释的兔抗-AgroAS初级抗体。其次使用1∶5,000稀释的山羊抗-兔碱性磷酸酶-共轭的抗体。在携带7Sα′-Agro AS基因的转基因品系中，western印迹分析一致显示存在特异地与抗-AgroAS抗体交叉反应的单个条带。没有在非转基因的对照品系中检测到该条带。

大豆和拟南芥种子的游离氨基酸分析

氨基酸提取：将大约50mg碾碎的大豆种子(5mg拟南芥)材料置于各自的离心管中。将1毫升的5％三氯乙酸加入各个样品(对于拟南芥为100μl)。涡旋样品，并在室温下搁置搅动15分钟。然后在14000rpm微离心15分钟。除去一些上清液，放入HPLC管并密封。样品在4℃保存有待排列分析。

氨基酸分析：用于氨基酸分析的试剂包括硼酸盐缓冲液(水中0.4N，pH10.2)中的OPA试剂(含邻苯二醛和3-巯基丙酸的硼酸盐缓冲液Hewlett-Packard，PN 5061-3335))。利用如2000年3月17日的Agilent技术出版物，″利用Zorbax Eclipse-AAA柱和Agilent 1100系列HPLC的氨基酸分析″所描述的Agilent 1100系列HPLC***进行分析。最初，用10μl硼酸盐缓冲液中的2.5μl OPA试剂诱导(derivatized)0.5μl的样品。其次，将该诱导衍生物用1.2ml/min的流速注射到Eclipse XDB-C18 5μm，4.6×150mm柱上。利用在340nm激发，在450nm发射的荧光测量氨基酸浓度。用HPLC缓冲液A和B的梯度根据表A进行洗提，其中HPLC缓冲液A是40mM Na₂HPO₄，pH＝7.8，而HPLC缓冲液B是9∶9∶2∷甲醇∶乙腈∶水。

表A：氨基酸洗提

时间

0

20

21

26

27

％缓冲液B

5

65

100

从干的化学药品，利用感兴趣的所有氨基酸制备氨基酸标准。脯氨酸分析需要使用9-芴甲基-氯甲酸酯(FMOC)的附加衍生步骤。氨基酸标准有时也以0-100μg/ml的浓度范围购买。样品以μg/g的种子粉末报告。

野生型农杆菌邻氨基苯甲酸合酶在拟南芥中的表达

将载体pMON58120通过次级荧光的真空渗入转化拟南芥植株，并且容许植株产生转基因的种子。收集种子并以存在可选择的标记物(草甘膦抗性)进行筛选。草甘膦抗性植物生长成熟并且从各个植物收集种子，其中该植株指明为转化事件，并且分析色氨酸含量(表B)。如表B所示，也在成熟种子中通过Western印迹分析，分析所选择转化事件中表达农杆菌邻氨基苯甲酸合酶蛋白质的存在。

表B：转化体的分析

转化事件	Trp(ppm)	蛋白质的存在
转化事件	Trp(ppm)	蛋白质的存在	7317	2547	+
7315	2960	+	7317	2547	+
7315	2960	+	7319	3628	+
7313	3979	+	7319	3628	+

野生型农杆菌邻氨基苯甲酸合酶在大豆(Glycine Max)中的表达

分析35个大豆转化事件中，33个具有增加的种子trp水平，例如，从上述的500ppm达到12,000ppm。在非转基因的大豆种子中，trp水平小于200ppm。包含高数量trp的所有种子通过western印迹证明邻氨基苯甲酸合酶蛋白质的表达。表C显示包含高trp水平以及通过western印迹分析邻氨基苯甲酸合酶蛋白质，同时也为邻氨基苯甲酸合酶阳性的19个大豆事件的数据。

表C：具有pMON58120的19个大豆转基因事件中

AgroAS蛋白质的存在和色氨酸水平之间的相关性

谱系	最大Trp(ppm)	平均Trp(ppm)	蛋白质存在？
谱系	最大Trp(ppm)	平均Trp(ppm)	蛋白质存在？	A3244(ctr)	306	96	否
GM_A20380：@.	6444	2246.4	是	A3244(ctr)	306	96	否
GM_A20380：@.	6444	2246.4	是	GM_A20532：@.	6055	2556.6	是
GM_A22043：@.	10422	2557.2	是	GM_A20532：@.	6055	2556.6	是
GM_A22043：@.	10422	2557.2	是	GM_A20598：@.	8861	2859.9	是
GM_A20744：@.	7121	3373.3	是	GM_A20598：@.	8861	2859.9	是
GM_A20744：@.	7121	3373.3	是	GM_A20381：@.	6392	3572.9	是
GM_A20536：@.	9951	3581.5	是	GM_A20381：@.	6392	3572.9	是
GM_A20536：@.	9951	3581.5	是	GM_A20510：@.	8916	3592.7	是
GM_A20459：@.	8043	3900.4	是	GM_A20510：@.	8916	3592.7	是
GM_A20459：@.	8043	3900.4	是	GM_A20337：@.	7674	4088.6	是
GM_A20533：@.	9666	4183.2	是	GM_A20337：@.	7674	4088.6	是
GM_A20533：@.	9666	4183.2	是	GM_A20577：@.	6276	4434.1	是
GM_A20339：@.	9028	4687.8	是	GM_A20577：@.	6276	4434.1	是
GM_A20339：@.	9028	4687.8	是	GM_A20386：@.	8487	5285.3	是
GM_A20457：@.	11007	5888.9	是	GM_A20386：@.	8487	5285.3	是
GM_A20457：@.	11007	5888.9	是	GM_A20379：@.	7672	6416.1	是
GM_A20537：@.	9163	6695.8	是	GM_A20379：@.	7672	6416.1	是
GM_A20537：@.	9163	6695.8	是	GM_A20534：@.	12676	7618.2	是
GM_A20576：@.	10814	7870.1	是	GM_A20534：@.	12676	7618.2	是

Agro AS的酶测定

在携带pMON58120构建体的11个转化事件中测量邻氨基苯甲酸合酶的特异活性。利用基于HPLC的终点分析根据C.Paulsen(J.Chromatogr.，547：155-160(1991))所描述的方法分析个别的大豆未成熟种子。简要地，从碾磨缓冲液(100mM Tris pH7.5，10％甘油，1mM EDTA，1mM DTT)中的单个种子产生脱盐提取物并用反应缓冲液(100mM tris pH7.5，1mM分支酸，20mM谷氨酰胺和10mM MgCl₂)培育30分钟。在存在或缺少25mM trp时测量AgroAS活性。反应用磷酸终止并且通过HPLC利用设置在340nm/激发和410nm/发射的荧光检测器定量所形成的邻氨基苯甲酸的数值。

不成熟的分离的转基因种子中AS的特异活性与非转基因对照相比，增加1.5倍到70倍，达到高达6,000pmoles/mg/min。如表D的最后一列所示，转基因植物中的邻氨基苯甲酸合酶活性是抗色氨酸抑制的(参见表D)。

表D：转基因事件20576中的Agro AS酶活性

事件	种子号	特异活性(pmoles/mg/min)	特异活性(pmoles/mg/min)(+25微摩尔Trp)
事件	种子号	特异活性(pmoles/mg/min)	特异活性(pmoles/mg/min)(+25微摩尔Trp)	对照	3244-1	95.4	42.4
对照	3244-2	85.5	40.6	对照	3244-1	95.4	42.4
对照	3244-2	85.5	40.6	20576	20576-1	6060.2	4407.1
20576	20576-2	3783.8	1709.4	20576	20576-1	6060.2	4407.1
20576	20576-2	3783.8	1709.4	20576	20576-3	2768.3	2431.7
20576	20576-4	4244.08	2125.2	20576	20576-3	2768.3	2431.7

实施例3：用包含玉米邻氨基苯甲酸合酶α-亚基基因的载体转化大豆

玉米邻氨基苯甲酸合酶α-亚基的编码序列通过用XbaI组合部分的NcoI消化而从pMON52214(图22)分离(参见Anderson等人，美国专利号6,118,047)。所得到的表示邻氨基苯甲酸合酶α编码区的1952bp的DNA片段用凝胶纯化，并制备成平末端。质粒pMON53901(图23)用BglII和EcoRI消化，以产生6.8Kb的片段。分离后，使6.8Kb片段的末端钝化并脱磷酸化。然后将包含ASα基因的1952Kb的片段连接平末端的6.8Kbp的MON53901片段以产生pMON39324，玉米7S启动子-玉米ASα-NOS3′UTR表达载体(图24)。

该pMON39324，玉米7S启动子-玉米ASα-NOS3′UTR盒，随后用BamHI消化获得包含7S启动子和玉米ASα编码序列的2.84Kb的DNA片段。质粒pMON39322(图25)用BamHI消化获得5.88kb的DNA片段。然后将这2个片段连接在一起以产生pMON39325(图26)，亚克隆成为pMON39322的包含7S启动子-玉米ASα-NOS3′UTR盒的转化载体。

利用类似的方法，从USP启动子的下游克隆玉米邻氨基苯甲酸合酶α-亚基的编码序列，以产生pMON58130表达载体，从Arc5启动子的下游克隆产生pMON69662表达载体，从Lea9启动子下游克隆产生pMON69650表达载体，以及从Per1启动子的下游克隆产生pMON69651表达载体。这些表达载体的列表如表E所示。

表E：C28-玉米邻氨基苯甲酸合酶的构建体

种子世代	表达盒	载体名称
种子世代	表达盒	载体名称	R4	7Sa′-玉米ASα	PMON39325
R2	Napin-玉米ASα	PMON58023	R4	7Sa′-玉米ASα	PMON39325
R2	Napin-玉米ASα	PMON58023	R1	USP-玉米ASα	PMON58130
R1	Arc5-玉米ASα	PMON69662	R1	USP-玉米ASα	PMON58130
R1	Arc5-玉米ASα	PMON69662	R1	Lea9-玉米ASα	PMON69650
R1	Per1-玉米ASα	PMON69651	R1	Lea9-玉米ASα	PMON69650

这些载体用于植物转化和繁殖实验。如在此所描述的，大豆植株用包含玉米AS的载体利用微粒子轰击技术转化。对于每种类型的载体分别建立几个转基因的大豆品系，并且通过表E中所标明的世代数目来繁殖。

例如，建立3个携带pMON39325的7Sα′-玉米AS转化基因的纯合系。这3个系在2个不同的场所随机分组设计生长。产生成熟的种子并且分析游离氨基酸的含量。包括对照以建立基线的trp水平，即3个相应阴性的等值线和非转基因的对照。

表F提供pMON39325转化体和对照系的R4种子中ppm的色氨酸，显示非转基因大豆平均包含大约100-200μg色氨酸种子粉末，而pMON39325转化体基本上包含更多的Trp。也参见，图27。

表F：用C28玉米突变体(pMON39325)转化

的大豆植株种子中的色氨酸水平

阳性等值线号	阳性等值线的平均trp(ppm)	标准偏差	相应的阴性等值线的平均trp(ppm)	标准偏差
阳性等值线号	阳性等值线的平均trp(ppm)	标准偏差	相应的阴性等值线的平均trp(ppm)	标准偏差	39325-1	3467	377	226	55
39325-2	2623	307	164	20	39325-1	3467	377	226	55
39325-2	2623	307	164	20	39325-3	3715	152	184	64
39325-4	2833	165	202	146	39325-3	3715	152	184	64
39325-4	2833	165	202	146	39325-5	3315	161	173	34
39325-6	2394	318	144	22	39325-5	3315	161	173	34
39325-6	2394	318	144	22	非转基因的对照-7			191	24
非转基因的对照-8			118	23	非转基因的对照-7			191	24

用在5个不同启动子的控制下表达C28玉米邻氨基苯甲酸合酶的5个其他构建体转化大豆(表E)，并获得转基因植株。各个构建体都产生高trp的结果。由Per1-C28玉米邻氨基苯甲酸合酶产生的实施例说明的结果显示在表G和H中。

表G：3个具有Per1-C28玉米AS(pMON69651)的转基因

事件中C28玉米AS蛋白质表达与增加的Trp水平相关

谱系	平均Trp(ppm)	蛋白质存在？
谱系	平均Trp(ppm)	蛋白质存在？	对照	96	否
22689	2375	是	对照	96	否
22689	2375	是	22787	1707	是
22631	1116	是	22787	1707	是

表H说明用pMON69651表达载体转化大豆植株，R1种子中C28玉米AS的酶活性。

表H：pMON69651转化体的R1种子中C28玉米AS的特异活性

事件	种子号	特异活性(pmoles/mg/min)	种子特异活性(pmoles/mg/min)(+25微摩尔色氨酸)
事件	种子号	特异活性(pmoles/mg/min)	种子特异活性(pmoles/mg/min)(+25微摩尔色氨酸)	对照		51.6	2.6
22689	22689-1	130.9	64.7	对照		51.6	2.6
22689	22689-1	130.9	64.7		22689-2	115.3
	22689-3	148.5	61.1		22689-2	115.3
	22689-3	148.5	61.1		22689-4	149.5
	22689-5	133.8	60.3		22689-4	149.5

这些结果表明当大豆植物组织用C28玉米AS基因转化时，色氨酸有显著的增加。

表G中显示的高色氨酸水平与AS蛋白质的存在和转基因酶的增加的特异活性(比非转基因对照中高2.5倍)有关(表H)。如表H所示-以及根据C28玉米AS酶的生物化学特性所预测的-转基因事件的特异活性是色氨酸-抗性的。

实施例4：根瘤农杆菌邻氨基苯甲酸合酶色氨酸反馈不敏感的突变体的合理设计

该实施例描述包含对色氨酸或色氨酸类似物的反馈抑制具有各种灵敏度或不敏感的突变的根瘤农杆菌邻氨基苯甲酸合酶的载体。

根瘤农杆菌突变的邻氨基苯甲酸合酶基因的产生

利用硫磺矿硫化叶菌(Solfulobus solfataricus)的邻氨基苯甲酸合酶蛋白质结构信息作为指导(Knochel等人，Proc.Natl.Acad.Sci.(美国)，96：9479-9484(1999))，利用蛋白质信息学确信指定几个涉及色氨酸结合的残基，合理设计几个根瘤农杆菌邻氨基苯甲酸合酶突变体。这通过将根瘤农杆菌邻氨基苯甲酸合酶基因与硫磺矿硫化叶菌的邻氨基苯甲酸合酶氨基酸序列进行序列对比而实现(图6)。根瘤农杆菌假定的色氨酸结合和催化域是通过结合对序列同源性的结构信息的认识而指定的。确定结合袋中的残基是可用于改变以提供对色氨酸反馈抑制的抗性的潜在候选物。

根据硫磺矿硫化叶菌邻氨基苯甲酸合酶的结构分析，表明氨基酸E30，S31，I32，S42，V43，N204，P205，M209，F210，G221和A373涉及色氨酸结合。根据成对地序列对比，硫磺矿硫化叶菌的N204，P205和F210在单体的根瘤农杆菌邻氨基苯甲酸合酶中分别为残基N292，P293和F298，也是保守的。

然而，由于多重***和缺失，硫磺矿硫化叶菌和根瘤农杆菌酶的N-末端区是高度离散的。因此，必须在根瘤农杆菌邻氨基苯甲酸合酶涉及色氨酸调控的N-末端区域人工指定残基(图6)。结构分析表明基序″LLES″在色氨酸结合袋中形成β折叠(β-sheet)。该结构在异四聚体酶中看来似乎是高度保守的。然后将已知的单体酶利用″LLES″基序作为界标人工序列对比于硫磺矿硫化叶菌序列(图21)。根据蛋白质信息学分析，根瘤农杆菌AS中的氨基酸残基V48，S50，S51和N52也可能涉及色氨酸结合。

随着在根瘤农杆菌单体的酶中指定假定的色氨酸结合残基，合理化几个独特策略以用于减少该酶对色氨酸抑制的敏感性。这些置换包括例如，扩大色氨酸-结合袋(F298A)，窄化结合袋(V48F，V48Y，S51F，S51C，N52F，F298W)，增加结合袋的极性(S50K)，或通过改变蛋白质主链的构象扭曲结合袋的形状(P293A，P29G)。

根瘤农杆菌AS的定点诱变

使用定点诱变产生10个单一氨基酸置换的6个位点。利用QuikChange^TM定点诱变试剂盒(Stratagene)将突变导入pMON34705中的根瘤农杆菌AS。用于定点诱变的引物是SEQ ID NOs：9-42(图7；F＝正向，R＝反向)。每个引物序列特异地用于在序列中的特异位点改变核酸，并因此改变编码的密码子，用于编码新的氨基酸。例如，S51C指明在根瘤农杆菌AS肽序列51位的氨基酸，从丝氨酸变化为半胱氨酸。

诱变后再确认全部基因的序列并且表达变体以及如下列用于野生型酶所描述的，从大肠杆菌纯化。将所得到的包括突变的根瘤农杆菌AS的质粒利用如实施例1所描述的T7表达***，合适地克隆到用于过量生产蛋白质的质粒中。

根瘤农杆菌AS蛋白质的表达和纯化

如实施例中所描述的，在大肠杆菌中表达根瘤农杆菌AS野生型和突变的酶。所有的根瘤农杆菌AS酶，包括野生型和其突变体的纯化，在4℃进行。将细胞(大约1g湿重)悬浮在20ml的纯化缓冲液(50mM磷酸钾，pH7.3，10mMMgCl₂，10mM2-巯基乙醇，10％甘油)中，并且通过超声处理(Branson SonifierCell Disruptor，W185)裂解。匀浆物在20,000×g离心15分钟后收集上清液。上清液进行硫酸铵分级分离(30-65％饱和)。在20,000×g离心15分钟后收集沉淀物，并溶于3ml的纯化缓冲液，然后整个地加载到用相同的缓冲液预平衡的Econo-Pac 10DG脱盐柱上。通过进一步分析检测包含酶的级分并加以收集。将收集的酶(4.3mls)加载到用相同的缓冲液平衡的10ml DEAESephacel(Pharmacia Biotech)柱(1.5×7.5cm)上。该柱用30ml的纯化缓冲液洗涤并且用相同缓冲液中的30ml的50mM NaCl洗提酶。收集包含高AS活性的级分并且通过65％的硫酸铵饱和液沉淀，以及如上所述分离和脱盐。收集包含酶的级分并贮藏在-80℃。

邻氨基苯甲酸合酶的酶测定和动力学分析

根瘤农杆菌AS的标准分析于25℃，在包含100mM磷酸钾，pH7.0，10mMMgCl₂，1mM二硫苏糖醇，200μM分支酸和10mM L-谷氨酰胺的分析缓冲液中进行。通过将30μl的酶加入反应混合物并混合而开始反应。邻氨基苯甲酸的形成直接通过320m处3分钟的吸光率增加而监测。根据吸光率对反应时间变化的斜率，以每秒增加的单位吸光率计算反应的初速度。在总体积为1ml的包含100mM磷酸钾，pH7.0，10mM MgCl₂，1mM二硫苏糖醇和10mM L-谷氨酰胺，并且分支酸浓度在2.5-100μM分支酸之间变化的分析缓冲液中确定分支酸的Km(Km^Cho)。在总体积为1ml的包含100mM磷酸钾，pH7.0，10mM MgCl₂，1mM二硫苏糖醇和200μM分支酸，并且L-谷氨酰胺浓度在0.1-2mM L-谷氨酰胺之间变化的分析缓冲液中确定谷氨酰胺的Km(Km^Gln)。在总体积为1ml，包含100mM磷酸钾，pH7.0，10mM MgCl₂，1mM二硫苏糖醇，10mM L-谷氨酰胺，200μM分支酸，并且L-色氨酸的浓度在0.1-10mM色氨酸之间变化的分析缓冲液中确定色氨酸的IC₅₀(IC₅₀ ^Trp)。在使数据适合非线性回归程序(GraFit)后计算AS的动力学参数和IC₅₀。

几个突变体证明对色氨酸抑制的敏感性降低，同时与野生型酶相比仍然保持酶活性(表I)。这些结果表明可例如通过在邻氨基苯甲酸合酶的色氨酸结合袋中突变氨基酸和通过优化证明为反馈不敏感的突变来减少对色氨酸抑制的灵敏性的程度。

表I：邻氨基苯甲酸合酶活性以及色氨酸

对根瘤农杆菌AS突变体的作用

突变	密码子	K_m ^Cho(μM)	K_m ^Gln(mM)	k_cat(s^-1)	k_cat/K_m ^Cho(μM^-1s^-1)	IC₅₀ ^Trp(μM)
突变	密码子	K_m ^Cho(μM)	K_m ^Gln(mM)	k_cat(s^-1)	k_cat/K_m ^Cho(μM^-1s^-1)	IC₅₀ ^Trp(μM)	WT		8.0	0.11	0.43	5.37×10^-2	5
V48F	TTT	4.5	0.08	0.24	5.33×10^-2	150	WT		8.0	0.11	0.43	5.37×10^-2	5
V48F	TTT	4.5	0.08	0.24	5.33×10^-2	150	V48Y	TAT	4.2	0.10	0.18	4.28×10^-2	650
S50K	AAG	13	0.01	0.13	1.00×10^-2	0.1	V48Y	TAT	4.2	0.10	0.18	4.28×10^-2	650
S50K	AAG	13	0.01	0.13	1.00×10^-2	0.1	S51F	TTC	10	0.06	0.08	0.80×10^-2	＞32,000
S51C	TGC	2.8	0.08	0.15	5.36×10^-2	1,500	S51F	TTC	10	0.06	0.08	0.80×10^-2	＞32,000
S51C	TGC	2.8	0.08	0.15	5.36×10^-2	1,500	N52F	TTC	5.5	0.04	0.21	3.82×10^-2	41
P293A	GCG	24	0.16	0.35	1.46×10^-2	14	N52F	TTC	5.5	0.04	0.21	3.82×10^-2	41
P293A	GCG	24	0.16	0.35	1.46×10^-2	14	P293G	GGG	33	0.07	0.48	1.45×10^-2	17
F298A	GCC	9.2	0.10	0.46	5.00×10^-2	5.5	P293G	GGG	33	0.07	0.48	1.45×10^-2	17
F298A	GCC	9.2	0.10	0.46	5.00×10^-2	5.5	F298W	TGG	18	0.14	0.44	2.44×10^-2	450

实施例5：随机诱变根瘤农杆菌AS以产生色氨酸反馈不敏感的突变体

除在实施例4中所描述的合理设计方法外，其他产生邻氨基苯甲酸合酶的反馈不敏感突变体的策略包括但不限于随机诱变。根瘤农杆菌AS的随机诱变，可例如通过化学诱变(分离的DNA或完整的生物体)、易错PCR和DNA移码实现。该实施例描述化学诱变及其后的遗传选择的使用。遗传选择方法也对选择来源于其他诱变方法的所需要的突变体有用。

包含根瘤农杆菌AS的大肠杆菌表达质粒的产生

通过利用包含正向引物5′末端上的Ncol位点和反向引物3′末端上的XbaI位点的引物，PCR扩增来自根瘤农杆菌AS克隆pMON61600(在实施例1中所描述的(SEQ ID NO：1)的开放阅读框：

5′-CATCCCATGGATGGTAACGATCATTCAGGAT-3′

(SEQ ID NO：55)；和

5′-GATGTCTAGAGACACTATAGAATACTCAAGC-3′

(SEQ ID NO：56)。

将所得到的PCR产物连接到pMON25997(图28)中，pMON25997用BspH1和Xba1消化除去bktB开放阅读框(Slater等人，细菌学杂志J.Bact.，180：1979-1987(1998))而得到质粒pMON62000(图29)。pMON62000是用于诱变和互补色氨酸营养缺陷型(EMG2ΔtrpE)的基础质粒。

大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE的产生

大肠杆菌菌株Ec-8(EMG2ΔtrpE)利用***载体pKO3构建，以从大肠杆菌菌株EMG2(K-12 wt F+)(大肠杆菌遗传原种中心)的染色体的trpE基因缺失1,383个碱基对。PCR扩增大肠杆菌基因组DNA的2个扩增子。第一个扩增子大约1.5kb，并在3′末端包含trpE ORF的前30bp。该扩增子在5′末端包含BamHI位点，并且在3’末端包含EcoR1位点。第二个扩增子大约1kb，并且在5’末端包含trpE ORF的最后150bp。该扩增子在5’末端包含EcoR1位点，并且在3’末端包含Sal1位点。2个扩增子用适当的酶消化，并且在EcoR1位点连接在一起以产生trpE的框内缺失。图30显示所得到的截短基因的序列(SEQ IDNO：46)。将trpE缺失扩增子在BamH1和Sal1位点连接到pKO3中。如A.J.Link等人，J.Bacteriol.，179：6228(1997)所描述的进行基因断裂。

大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE与pMON62000的互补

用pMON62000转化大肠杆菌菌株Ec-8(EMG2ΔtrpE)并且接种在M9基本培养基上以确定缺失是否通过加入pMON62000而互补。对照质粒(减去根瘤农杆菌AS***)和对照菌株Ec-8也接种在M9基本培养基和具有40μg/ml色氨酸的M9基本培养基上。观察到在没有色氨酸的M9上生长用pMON62000转化的菌株Ec-8，而对照都没有观察到有生长，表明菌株Ec-8中trpE缺失通过pMON62000互补。

pMON62000的羟胺诱变和突变体的遗传选择

为了产生邻氨基苯甲酸合酶的突变体，pMON62000用化学诱变剂羟胺突变。将下列成分在eppendorf管中化合：20μg pMON62000质粒DNA和40μl2.5M羟胺，pH6.0。用0.1M NaH₂PO₄，pH6.0+5mM EDTA，pH6.0使体积变为200μl。该试管在70℃孵育。1.5小时后，将100μl的反应混合物在浮于大约500ml H₂O上的硝酸纤维素滤膜上透析。15分钟后，利用Qiagen PCR纯化试剂盒浓缩DNA。3小时后，将剩余的100μl反应混合物移出并以同样的方式纯化。

然后大肠杆菌菌株Ec-8用已经用羟胺诱变处理1.5或3小时的100ngpMON62000通过电穿孔转化。对于各个时间点进行2种转化方法。容许转化细胞在SOC介质(20g/L细菌用胰化胨(Bacto-Tryptone)，5g/L细菌用酵母提取物，10ml/L 1M NaCl，2.5ml/L 1M KCl，18g葡萄糖)中恢复4或6小时。

制备2个245mm正方形的生物检测平板，包含M9基本培养基，加2％琼脂和50μg/ml 5-甲基-DL-色氨酸(5-MT)。将一等分的900μl 1.5小时诱变处理的转化混合物接种到1个50μg/ml 5-MT的平板上。将剩余的100μl接种到M9对照平板上。对于包含3.0小时诱变处理的质粒的转化混合物进行相同的步骤。

然后平板在37℃孵育大约2.5天。从5-MT平板分离抗性克隆并接种到LB-卡那霉素(50μg/ml)平板上以验证质粒的存在。所有选择的集落都在这些平板上生长。将来自每一抗性克隆的个别克隆分成两份以分离质粒。进行限制性消化和PCR并且证实所有的克隆都包含所需的根瘤农杆菌AS***。

然后将挽救质粒转化回菌株Ec-8。通过划线接种到新的LB-卡那霉素平板上纯化来自每个转化子的一个克隆。为了证实对5-MT的抗性，将个别纯化的克隆接种到包含M9加50μg/ml 5-MT和2％琼脂的平板上，然后在37℃生长3天。大部分克隆证实有抗性。为了确定抗性突变体是否在5-MT的更高浓度保持抗性，将它们接种到M9加300μg/ml 5-MT和2％琼脂上。大多数克隆证明在此高浓度也有抗性。

分离来自所有抗性克隆的质粒并对两条链都测序。这个实验的一些突变体在表J中进行图解。

表J：5-MT抗性克隆中根瘤农杆菌trpEG序列的变化。

数据库克隆#	原始克隆#	确定的序列变异体	K_m ^cho(μM)	IC₅₀ ^trp(μM)
数据库克隆#	原始克隆#	确定的序列变异体	K_m ^cho(μM)	IC₅₀ ^trp(μM)	Wt			8.0	5.0
Ec-12	1	G4A Val2Ile			Wt			8.0	5.0
Ec-12	1	G4A Val2Ile			Ec-18	8	C35T Thr12Ile	15	2.5
Ec-19	9	C2068T Pro690Ser	5.0	3.4	Ec-18	8	C35T Thr12Ile	15	2.5
Ec-19	9	C2068T Pro690Ser	5.0	3.4	Ec-20	11	G1066A Glu356Lys和C1779T Ile593Ile

如表J中的数据所表明的，几个突变体对突变酶的Km^cho和IC₅₀ ^trp的作用很小，表明这些突变可能不是抗色氨酸反馈抑制的来源。例如，在核苷酸35位的C到T的突变，它将氨基酸12位的苏氨酸残基变化为异亮氨酸(Thr12Ile)，而在Km^cho和IC₅₀ ^trp值中产生微小的变化。类似地，核苷酸2068位的C到T的变化，将脯氨酸变化为丝氨酸，也在Km^cho和IC₅₀ ^trp值中产生微小的变化。这些突变可能因此，也许是产生具有如同野生型酶特性的变体基因产物的″沉默的″突变。

实施例6：高色氨酸转基因的大豆植物。

该实施例说明由用来自根瘤农杆菌的邻氨基苯甲酸合酶的色氨酸反馈不敏感突变体转化产生的，具有升高的色氨酸水平的转基因大豆植物的制备。

载体构建

质粒pMON34711，具有来自根瘤农杆菌的，包含在实施例4中所描述的F298W突变的邻氨基苯甲酸合酶克隆，将其用限制性内切酶NotI消化。使所得到片段的末端钝化，然后用NcoI消化。然后质粒pMON13773(图8)用限制性内切酶EcoRI消化，使末端钝化，然后用NcoI消化。将所得到片段连接质粒pMON58044，该质粒包含在7S启动子和NOS3′UTR控制下的AS基因(图9)。

然后用限制性内切酶BglII和NcoI切割质粒pMON58044，并连接通过用BglII和NcoI消化pMON53084(图10)所产生的片段。所得到的片段命名为pMON58045(图11)并且包含用于拟南芥SSU1A运输肽的序列。

最后，通过连接由用限制性内切酶NotI消化pMON58045(图11)和pMON38207(图13)所产生的片段构建质粒pMON58046(图12)。这产生了用于大豆转化的pMON58046载体(图12)。

经微粒子轰击的大豆转化

对于粒子轰击转化法，将市场上可买到的大豆种子(即，Asgrow A3244，A4922)发芽大约18-24小时过夜，并切下分生组织外植体。移去初生叶暴露分生组织并将外植体置于目标培养基中，同时分生组织垂直于粒子递送的方向。

将如上所述的pMON58046转化载体用CaCl₂和亚精胺沉淀到显微的金粒子上，并且随后再悬浮在乙醇中。将悬浮液包涂到Mylar片层上，然后放置到放电装置上。将颗粒以大约60％的电容经放电加速进入植物组织。

轰击后，将外植体置于选择性培养基(WPM+0.075mM草甘膦)(WPM＝木本植物(woody plant)培养基(McCown和Lloyd，Proc.International PlantPropagation Soc.，30：421，(1981)minus BAP))中5-7周，以供选择和生长转基因苗用。轰击大约5-7周后收获表型阳性的苗，并且放入选择性的根培养基中(BPM+0.025mM草甘膦)(参见，下列用于BRM的配方)2-3周。将产根苗转入温室并盆栽到土壤中。将在选择中保持健康，但不生根的苗转入非选择性的根培养基中(无草甘膦的BRM)附加培养2周。在转入温室并盆栽到土壤中之前，检测来自任何不在选定区域生根的苗的根中，植物选择性标记物的表达。在标准温室条件下保持植株直到收获R1种子。

用于豆生根培养基的配方(BRM)提供如下。

化合物	4L的数量
化合物	4L的数量	MS盐^***	8.6g
肌醇(细胞培养级)	0.40g	MS盐^***	8.6g
肌醇(细胞培养级)	0.40g	SBRM维生素原液^**	8.0ml
L-半胱氨酸(10mg/ml)	40.0ml	SBRM维生素原液^**	8.0ml
L-半胱氨酸(10mg/ml)	40.0ml	蔗糖(超纯的)	120g
调节pH到5.8		蔗糖(超纯的)	120g
调节pH到5.8		Washed琼脂	32g
高压灭菌后加入：		Washed琼脂	32g
高压灭菌后加入：		SBRM/TSG激素原液^*	20.0毫升

^*SBRM/TSG激素原液(每1L的BRM)：3.0ml IAA(0.033mg/ml)，2.0ml无菌蒸馏水。原液在4℃避光储存。

^**SBRM维生素原液(每1L的原液)：甘氨酸(1.0g)，烟酸(0.25g)，吡哆醇HCl(0.25g)，硫胺HCl(0.25g)。

^***3×MInorMS盐(每1L原液)：H₂BO₃(1.86g)，MnSO₄(5.07g)，ZnSO₄-H₂O(2.58g)，KI(0.249g)，7.5ul NaMoO-2H₂O(1.0mg/ml)，7.5ulCoSO₄-5H₂O(1.0mg/ml)，7.5ulCoCl₂-6H₂O(1.0mg/ml)。

每次加入并溶解1个成分，用无菌蒸馏水使体积达到1升，并且该溶液保存在箔覆盖的瓶子中，在冰箱中保存不超过1个月。

利用根瘤农杆菌转化大豆

对于农杆菌转化法，将市场上可买到的大豆种子(Asgrow A3244，A4922)发芽过夜(大约10-12小时)，并且切下分生组织外植体。可移去或不移去初生叶暴露分生组织并且将外植体置于创伤导管中。

使包含感兴趣质粒的农杆菌菌株ABI生长到对数期。通过离心收获细胞并且再悬浮在含有诱导物的接种培养基中。从种子开始萌芽和利用超声处理创伤以来不迟于14小时，混合大豆外植体和诱导的农杆菌培养物。

创伤后，在农杆菌中培养外植体大约1个小时。该接种步骤后，通过移液管移出农杆菌并且将外植体置于共培养2-4天。此时，将它们转入选择性培养基(WPM+0.075mM草甘膦+抗生素以控制农杆菌过度生长)5-7周以容许选择并生长转基因的苗。

轰击后大约5-7周后，收获表型阳性的苗并置于选择性的根培养基中(BRM+0.025mM草甘膦)2-3周。将产生根的苗转入温室并盆栽到土壤中。将在选择中保持健康，但不生根的苗转入非选择性的根培养基中(无草甘膦的BRM)附加培养2星期。在转入温室并盆栽到土壤中之前，检测来自任何不在选定区域生根的苗的根中，植物选择性标记草甘膦抗性的表达。在标准温室条件下保持植株直到收获R1种子。

R1种子的氨基酸含量的分析

生产成熟的R1种子并且利用如Agilent Technologies Technical BulletinREV14所描述的荧光检测分析游离氨基酸的含量。从每个事件选择5个种子用于单个种子分析。表达AgroAS F298W，AgroAS S51F，AgroAS V48F，AgroAS V48Y或AgroAS S51C的突变体蛋白质的大豆种子产生高数量的色氨酸。最高水平的色氨酸对萌芽具有负影响。结果显示在表K，L和M中。

表K：用pMON58046转化的种子中蛋白质的表达

谱系	平均Trp(ppm)	蛋白质存在？
谱系	平均Trp(ppm)	蛋白质存在？	对照	96	否
22817	9922	是	对照	96	否
22817	9922	是	22891	12955	是
23026	7968	是	22891	12955	是

表L：AS蛋白质表达与pMON58123转化相关

谱系	平均Trp(ppm)	蛋白质存在？
谱系	平均Trp(ppm)	蛋白质存在？	对照	96	否
23562	88	否	对照	96	否
23562	88	否	23590	8795	是
23911	388	否	23590	8795	是

表M：携带下列AgroAS等位基因中的一个的大豆中，

平均和最大的色氨酸水平：V48F(pMON66877)、

V48Y(pMON66878)和S51C(pMON66879)。

PMON号	说明	事件号	平均trp(ppm)	最大trp(ppm)
PMON号	说明	事件号	平均trp(ppm)	最大trp(ppm)	66877	7Sα-V48F AgroAS	26640	12,283	28,342
66877	7Sα-V48F AgroAS	26641	5,588	14,579	66877	7Sα-V48F AgroAS	26640	12,283	28,342
66877	7Sα-V48F AgroAS	26641	5,588	14,579	66877	7Sα-V48F AgroAS	26642	11,833	18,712
66878	7Sα-V48Y AgroAS	26872	6,015	11,902	66877	7Sα-V48F AgroAS	26642	11,833	18,712
66878	7Sα-V48Y AgroAS	26872	6,015	11,902	66878	7Sα-V48Y AgroAS	26875	12,361	17,181
66878	7Sα-V48Y AgroAS	27010	13,962	19,323	66878	7Sα-V48Y AgroAS	26875	12,361	17,181
66878	7Sα-V48Y AgroAS	27010	13,962	19,323	66879	7Sα-S48C AgroAS	27105	12,614	31,827
66879	7Sα-S48C AgroAS	27300	16,711	34,263	66879	7Sα-S48C AgroAS	27105	12,614	31,827
66879	7Sα-S48C AgroAS	27300	16,711	34,263	66879	7Sα-S48C AgroAS	27568	10,135	20,237

用AgroAS转化的R1种子中的AS酶活性

生产成熟的R1种子并且分析邻氨基苯甲酸合酶活性。在携带AgroASF298W(SEQ ID NOs：65或91)或AgroAS S51F(SEQ ID NOs：60或86)突变体等位基因的R1大豆种子中确定邻氨基苯甲酸合酶的酶活性。观察到非常高水平的色氨酸-抗性邻氨基苯甲酸合酶活性，与由这些种子所产生的高数量的色氨酸一致。结果显示在表N和O中。

表N：用pMON58046转化的R1种子中AS的特异活性

事件	种子号	特异活性(pmoles/mg/min)	种子特异活性(pmoles/mg/min)(+25微摩尔Trp)
事件	种子号	特异活性(pmoles/mg/min)	种子特异活性(pmoles/mg/min)(+25微摩尔Trp)	对照		77.6
23076	23076-1	100.5	1.04	对照		77.6
23076	23076-1	100.5	1.04		23076-2	4512.8
	23076-3	9737.4	9290.4		23076-2	4512.8
	23076-3	9737.4	9290.4		23076-4	136.12
	23076-5	8992.5	9749.9		23076-4	136.12

表O：用pMON58123转化的R1种子中AS的特异活性

事件	种子号	特异活性(pmoles/mg/min)	种子特异活性(pmoles/mg/min)(+25微摩尔Trp)
事件	种子号	特异活性(pmoles/mg/min)	种子特异活性(pmoles/mg/min)(+25微摩尔Trp)	对照		83.7	32.7
23590	23590-1	891	692.3	对照		83.7	32.7
23590	23590-1	891	692.3		23590-2	466.2	186.5
	23590-3	71.7	38.3		23590-2	466.2	186.5
	23590-3	71.7	38.3		23590-4	320.5	316.2

实施例7：包括芸香邻氨基苯甲酸合酶α-亚基的转化载体的制备

来自芸香(Ruta graveolens)的邻氨基苯甲酸合酶α基因(Genbank登记号GI960291)提供另一个对本发明有用的邻氨基苯甲酸合酶结构域(Bohlmann，J等人，Plant Phys.，111：507-514(1996))。存在于芸香基因组中的邻氨基苯甲酸合酶的一个同工酶显示对L-色氨酸的反馈抑制的敏感度较低。该等位基因也可用于本发明以提高转基因植物中游离的L-色氨酸的水平。载体pMON58030(图14)包含对色氨酸抑制较少敏感的芸香邻氨基苯甲酸合酶α-亚基。从pMON58030 PCR扩增芸香的邻氨基苯甲酸合酶α基因，以提供在芸香邻氨基苯甲酸合酶α基因片段的5′末端的BamHI位点和在3末端的BglII位点，其中利用包含这2个限制性内切酶位点的引物：

5′-CAAAAGCTGGATCCCCACC-3′(SEQ ID NO：53)；和

5′-CCTATCCGAGATCTCTCAACTCC-3′(SEQ ID NO：54)。

纯化PCR片段，用分别的限制性内切酶消化以形成pMON58041，其中包含芸香ASα至napin启动子的转录融合体。产生农杆菌介导的植物转化质粒，pMON58043，包括napin启动子，芸香AS，NOS终止子，草甘膦抗性(CP4)可选择的标记和适合于所述盒的固有染色体整合的边界。使用所得到的植物转化载体利用如实施例2，3和6中所描述的标准的植物转化技术转化植物。

实施例8：转化多个多肽邻氨基苯甲酸合酶成为单体的单个多肽邻氨基苯甲酸合酶

需要通过融合所选择的多亚基酶产生单体的邻氨基苯甲酸合酶，例如为了优化催化的效率，为了稳定酶，为了获得例如包括TrpE和TrpG活性的亚基，以及2个亚基间有效传递的协同表达。在有些情况下，可能对使用植物或微生物来源的TrpE或α-亚基有用，其中该植物或微生物通过标准诱变方法或通过如前文的实施例，例如实施例4中所描述的合理设计而不受有关反馈抑制的调控。在其他情况下，使用植物或微生物来源的野生型TrpE或α-亚基。

所选择的TrpE或α-亚基的C-末端连接TrpG亚基或β-亚基的N-末端，优选使用肽接头连接。可合理设计接头以提供合适的间隔和使两个亚基适当定位排列的灵活性。可选地接头可通过单体的和异四聚体的邻氨基苯甲酸合酶的序列对比确定。单体的和异四聚体的邻氨基苯甲酸合酶所形成的序列对比的实例显示在图21和35中。也可设想可能必须产生包括异源亚基的单体邻氨基苯甲酸合酶以便优化效益。例如，α-亚基可从例如大肠杆菌的细菌来源获得，并与例如拟南芥的植物来源的β-亚基融合。

可将产生的新蛋白质导入植物，例如如实施例2，3或6中所描述的。本发明不限于所显示和描述的精确细节，因为应该理解可在保持在权利要求所定义的本发明的精神和范围内的同时，产生许多变化和改进。

实施例9：来自基因组序列数据库的邻氨基苯甲酸合酶的鉴定。

对本发明有用的单体邻氨基苯甲酸合酶以及α和β结构域可经生物信息分析，通过利用BLAST( www.ncbi.nlm.nih.gov/blast/)搜索例如genbank和/或swisprot数据库鉴定。鉴定单体邻氨基苯甲酸合酶的有用的查询序列包括，例如邻氨基苯甲酸合酶的结构域，例如硫磺矿硫化叶菌的α-结构域(GI1004323)或β-结构域(GI 1004324)，或单体的邻氨基苯甲酸合酶，例如根瘤农杆菌AS(GI 15889565)。推定的单体邻氨基苯甲酸合酶将具有与询问序列50％和100％之间的同源性，并且应最低限度地包含700个氨基酸。如果使用AS-α-结构域查询基因组数据库，除鉴定推定的邻氨基苯甲酸合酶基因外，它也可能鉴定涉及PABA合成，例如4-氨基-4-脱氧分支酸(ADC)合酶的基因。单体的ADC合酶基因可根据观察ADC合酶的酰胺转移酶结构域(β-结构域)存在于蛋白质的N-末端，而AS的酰胺转移酶结构域(β-结构域)存在于C-末端，从而将推定的单体AS基因轻易地鉴定出来。对本发明有用的单体邻氨基苯甲酸合酶通过生物信息分析鉴定，包括但不限于，例如苜蓿中华根瘤菌(Rhizobiummeliloti)(GI 95177)，百脉根根瘤菌(Mesorhizo biumloti)(GI 13472468)，马尔他布鲁氏菌(Brwella melitensis)(GI 17982357)，念珠藻属(NostoaSP.)PCC7120(GI 17227910，GI 17230725)，巴西固氮螺菌(Azospirillumbrasilense)(GI 1174156)，血色红假单胞菌(Rhodopseudomonas palustris)，鱼腥藻(Anabaena)M22983(GI 152445)。图21是本发明中所使用的2个单体邻氨基苯甲酸合酶(根瘤农杆菌和苜蓿中华根瘤菌)与2个异四聚体邻氨基苯甲酸合酶(硫磺矿硫化叶菌和拟南芥)的序列对比的实例。图35是几个单体的邻氨基苯甲酸合酶与血色红假单胞菌异四聚体邻氨基苯甲酸合酶的序列对比的实例。

实施例10：优化密码子的使用

该实施例说明通过优化密码子的使用改进植物种子中邻氨基苯甲酸合酶基因表达的方法。

检验野生型根瘤农杆菌的邻氨基苯甲酸合酶(AS)基因的核苷酸序列(SEQ ID NO：1)中存在的不表达密码子。为了鉴定低表达的密码子，从谷物和大豆中寻找高度表达的种子蛋白质的序列以获得相对的密码子频率。相对的密码子使用频率显示在表P中，表示为预期值的形式。预期值形式可例证说明如下：假定存在4个编码给定氨基酸的密码子，并且假定它们同样使用，然后预期每个密码子占氨基酸25％(0.25)的频率。然而，由于冗余，将0.25规范化到1.0，以对每个密码子相比较于编码该氨基酸的密码子产生相对的积分。对于这个分析，如果该密码子比另一个对于给定的氨基酸选择更占优势，则它受到大于1.0的计数。相应地，如果密码子是较少占优势的，它受到小于1.0的计数。对于这个研究，如果其相对的密码子使用频率低于0.5，则认为该特定的密码子未被充分表示。

利用表P所产生的结果，在谷物和大豆中，野生型农杆菌AS序列的紧密检查显示认为125个密码子未被充分表示(低于0.5的阈值)(表Q)。这些未被充分表示的密码子被如上所定义的更占优势的密码子替代。改变的核苷酸序列显示在图36中。利用生物信息工具，装配所得到的序列并且通过翻译以及与相应的野生型AS序列的核苷酸和蛋白质的序列对比分析完整性。虽然未改变蛋白质序列，但优化序列的核苷酸序列与野生型的农杆菌AS序列(图37)具有94％的同一性。分别利用Lasergene EditSeq(DNASTAR公司，Madison，WI)和Grail2(国立橡树岭实验室，OakRidge，TN)分析优化的核苷酸序列中隐藏的多聚腺苷酸化信号(AATAAA，AATAAT)和隐藏的内含子的缺乏。没有发现隐藏的信号。

改变的核苷酸序列利用本领域中公知的技术或由例如EgeaBiosciencesces公司(SanDiego，加利福尼亚)的商业供应者合成。将所得到的核苷酸克隆到适当的表达载体中，并且利用本说明书的上述实施例中所详细记载的方法，测试在谷物，大豆和拟南芥中的效能。

表P：玉米和大豆种子-表达基因¹中相对的密码子使用频率。

密码子	氨基酸	玉米种子	大豆种子	密码子	氨基酸	玉米种子	大豆种子
密码子	氨基酸	玉米种子	大豆种子	密码子	氨基酸	玉米种子	大豆种子	TTT	F	0.4211	0.7348	ATC	I	1.7143	1.0563
TTC	F	1.5789	1.2652	ATA	I	0.3673	0.6654	TTT	F	0.4211	0.7348	ATC	I	1.7143	1.0563
TTC	F	1.5789	1.2652	ATA	I	0.3673	0.6654	TTA	L	0.4557	0.3875	ATG	M	1.0000	1.0000
TTG	L	0.9494	1.2060	ACT	T	0.6153	1.0008	TTA	L	0.4557	0.3875	ATG	M	1.0000	1.0000
TTG	L	0.9494	1.2060	ACT	T	0.6153	1.0008	TCT	S	0.9624	1.4851	ACC	T	1.2213	2.1020
TCC	S	1.3707	1.1249	ACA	T	0.8372	0.7146	TCT	S	0.9624	1.4851	ACC	T	1.2213	2.1020
TCC	S	1.3707	1.1249	ACA	T	0.8372	0.7146	TCA	S	0.9107	1.0044	ACG	T	1.3262	0.1826
TCG	S	0.7851	0.3266	AAT	N	0.2885	0.5409	TCA	S	0.9107	1.0044	ACG	T	1.3262	0.1826
TCG	S	0.7851	0.3266	AAT	N	0.2885	0.5409	TAT	Y	0.2455	0.6861	AAC	N	1.7115	1.4591
TAC	Y	1.7545	1.3139	AAA	K	0.5333	0.9030	TAT	Y	0.2455	0.6861	AAC	N	1.7115	1.4591
TAC	Y	1.7545	1.3139	AAA	K	0.5333	0.9030	TGT	C	0.2788	0.7572	AAG	K	1.4667	1.0970
TGC	C	1.7222	1.2428	AGT	S	0.2679	0.9714	TGT	C	0.2788	0.7572	AAG	K	1.4667	1.0970
TGC	C	1.7222	1.2428	AGT	S	0.2679	0.9714	TGG	W	1.0000	1.0000	AGC	S	1.7032	1.0876
CTT	L	0.7975	1.6298	AGA	R	0.3913	1.9459	TGG	W	1.0000	1.0000	AGC	S	1.7032	1.0876
CTT	L	0.7975	1.6298	AGA	R	0.3913	1.9459	CTC	L	1.0610	1.6301	AGG	R	2.9185	1.3087

CTA	L	0.8544	0.5905	GTT	V	0.5714	1.2381
CTA	L	0.8544	0.5905	GTT	V	0.5714	1.2381	CTG	L	1.8820	0.5562	GTC	V	1.0119	0.6864
CCT	P	0.6500	1.5822	GTA	V	0.3810	0.3472	CTG	L	1.8820	0.5562	GTC	V	1.0119	0.6864
CCT	P	0.6500	1.5822	GTA	V	0.3810	0.3472	CCC	P	0.8520	0.7694	GTG	V	2.0357	1.7284
CCA	P	1.2240	1.5838	GCT	A	0.9876	1.3583	CCC	P	0.8520	0.7694	GTG	V	2.0357	1.7284
CCA	P	1.2240	1.5838	GCT	A	0.9876	1.3583	CCG	P	1.2740	0.0645	GCC	A	1.1618	1.1283
CAT	H	0.8438	0.6066	GCA	A	0.8011	1.2898	CCG	P	1.2740	0.0645	GCC	A	1.1618	1.1283
CAT	H	0.8438	0.6066	GCA	A	0.8011	1.2898	CAC	H	1.1563	1.3934	GCG	A	1.0495	0.2235
CAA	Q	0.8639	1.2162	GAT	D	0.8500	0.9523	CAC	H	1.1563	1.3934	GCG	A	1.0495	0.2235
CAA	Q	0.8639	1.2162	GAT	D	0.8500	0.9523	CAG	Q	1.1361	0.7838	GAC	D	1.1500	1.0477
CGT	R	0.2582	0.5903	GAA	E	0.6818	1.0463	CAG	Q	1.1361	0.7838	GAC	D	1.1500	1.0477
CGT	R	0.2582	0.5903	GAA	E	0.6818	1.0463	CGC	R	1.0082	1.1159	GAG	E	1.3182	0.9537
CGA	R	0.1957	0.6700	GGT	G	1.1268	1.1431	CGC	R	1.0082	1.1159	GAG	E	1.3182	0.9537
CGA	R	0.1957	0.6700	GGT	G	1.1268	1.1431	CGG	R	1.2283	0.3692	GGC	G	1.8758	0.6577
ATT	I	0.9184	1.2783	GGA	G	0.3085	1.2759	CGG	R	1.2283	0.3692	GGC	G	1.8758	0.6577
ATT	I	0.9184	1.2783	GGA	G	0.3085	1.2759	ATC	I	1.7143	1.0563	GGG	G	0.6889	0.9233

¹相对的密码子频率以预期值的形式表示。这指如果存在4个编码给定氨基酸的密码子，并且它们是同样使用的，预期每个密码子占25％(0.25)。由于冗余，将0.25规格化为1，以对于每个密码子相比较于所有编码该氨基酸的密码子产生相对的积分。如果密码子比另一个对于给定的氨基酸选择更占优势，则它将得到＞1的计数。而如果它比另一个对于该氨基酸较少优选，它将得到＜1的计数。

表Q：未被充分表示的AgroAS密码子和用于改善种子表达²的改进

密码子	密码子(wt)	氨基酸	修饰的密码子	作物中未充分表示²	密码子	密码子(wt)	氨基酸	修饰的密码子	作物中未充分表示	密码子	密码子(wt)	氨基酸	修饰的密码子	作物中未充分表示
密码子	密码子(wt)	氨基酸	修饰的密码子	作物中未充分表示²	密码子	密码子(wt)	氨基酸	修饰的密码子	作物中未充分表示	密码子	密码子(wt)	氨基酸	修饰的密码子	作物中未充分表示	2	GTA	V	GTG	谷物，大豆	177	TCG	S	TCC	大豆	481	GCG	A	GCC	大豆
3	ACG	T	ACC	大豆	179	GCG	A	GCC	大豆	485	AAT	N	AAC	谷物，大豆	2	GTA	V	GTG	谷物，大豆	177	TCG	S	TCC	大豆	481	GCG	A	GCC	大豆

9	GGA	G	GGT	谷物	180	CGT	R	CGC	谷物	489	CCG	P	CCA	大豆
9	GGA	G	GGT	谷物	180	CGT	R	CGC	谷物	489	CCG	P	CCA	大豆	10	GCG	A	GCC	大豆	181	CCG	P	CCA	大豆	504	ATA	I	ATC	谷物
15	ACG	T	ACC	大豆	185	CGT	R	CGC	谷物	508	CGT	R	CGC	谷物	10	GCG	A	GCC	大豆	181	CCG	P	CCA	大豆	504	ATA	I	ATC	谷物
15	ACG	T	ACC	大豆	185	CGT	R	CGC	谷物	508	CGT	R	CGC	谷物	16	AAA	K	AAG	谷物	190	TTT	F	TTC	谷物	520	CGT	R	CGC	谷物
21	GTC	V	GTG	大豆	201	TAT	Y	TAC	谷物	543	ACG	T	ACC	大豆	16	AAA	K	AAG	谷物	190	TTT	F	TTC	谷物	520	CGT	R	CGC	谷物
21	GTC	V	GTG	大豆	201	TAT	Y	TAC	谷物	543	ACG	T	ACC	大豆	23	CGA	R	CGC	谷物	209	CGT	R	CGC	谷物	545	GCG	A	GCC	大豆
26	CGG	R	CGC	大豆	218	ACG	T	ACC	大豆	546	AAT	N	AAC	谷物，大豆	23	CGA	R	CGC	谷物	209	CGT	R	CGC	谷物	545	GCG	A	GCC	大豆
26	CGG	R	CGC	大豆	218	ACG	T	ACC	大豆	546	AAT	N	AAC	谷物，大豆	30	TAT	Y	TAC	谷物	219	ACG	T	ACC	大豆	547	TAT	Y	TAC	谷物
36	AAT	N	AAC	谷物，大豆	238	CCG	P	CCA	大豆	551	ACG	T	ACC	大豆	30	TAT	Y	TAC	谷物	219	ACG	T	ACC	大豆	547	TAT	Y	TAC	谷物
36	AAT	N	AAC	谷物，大豆	238	CCG	P	CCA	大豆	551	ACG	T	ACC	大豆	46	GGC	G	GGT	大豆	244	CGT	R	CGC	谷物	553	GCG	A	GCC	大豆
47	GCG	A	GCC	大豆	248	TAT	Y	TAC	谷物	554	ACG	T	ACC	大豆	46	GGC	G	GGT	大豆	244	CGT	R	CGC	谷物	553	GCG	A	GCC	大豆
47	GCG	A	GCC	大豆	248	TAT	Y	TAC	谷物	554	ACG	T	ACC	大豆	48	GTT	V	GTG	谷物	276	CGT	R	CGC	谷物	556	TCG	S	TCC	大豆
49	TTT	F	TTC	谷物	280	AAT	N	AAC	谷物，大豆	559	AGA	R	AGG	谷物	48	GTT	V	GTG	谷物	276	CGT	R	CGC	谷物	556	TCG	S	TCC	大豆
49	TTT	F	TTC	谷物	280	AAT	N	AAC	谷物，大豆	559	AGA	R	AGG	谷物	50	TCG	S	TCC	大豆	281	CCG	P	CCA	大豆	561	CCG	P	CCA	大豆
53	TAT	Y	TAC	谷物	282	TCG	S	TCC	大豆	572	CCG	P	CCA	大豆	50	TCG	S	TCC	大豆	281	CCG	P	CCA	大豆	561	CCG	P	CCA	大豆
53	TAT	Y	TAC	谷物	282	TCG	S	TCC	大豆	572	CCG	P	CCA	大豆	55	TAT	Y	TAC	谷物	283	GCG	A	GCC	大豆	578	TCG	S	TCC	大豆
56	CCG	P	CCA	大豆	290	GCG	A	GCC	大豆	580	GGA	G	GGT	谷物	55	TAT	Y	TAC	谷物	283	GCG	A	GCC	大豆	578	TCG	S	TCC	大豆
56	CCG	P	CCA	大豆	290	GCG	A	GCC	大豆	580	GGA	G	GGT	谷物	58	CGT	R	CGC	谷物	293	CCG	P	CCA	大豆	584	CCG	P	CCA	大豆
64	ACG	T	ACC	大豆	294	TCG	S	TCC	大豆	585	ACG	T	ACC	大豆	58	CGT	R	CGC	谷物	293	CCG	P	CCA	大豆	584	CCG	P	CCA	大豆
64	ACG	T	ACC	大豆	294	TCG	S	TCC	大豆	585	ACG	T	ACC	大豆	69	CCG	P	CCA	大豆	296	TAT	Y	TAC	谷物	592	ACG	T	ACC	大豆
70	CCG	P	CCA	大豆	301	AAT	N	AAC	谷物，大豆	602	CCG	P	CCA	大豆	69	CCG	P	CCA	大豆	296	TAT	Y	TAC	谷物	592	ACG	T	ACC	大豆
70	CCG	P	CCA	大豆	301	AAT	N	AAC	谷物，大豆	602	CCG	P	CCA	大豆	75	TGT	C	TGC	谷物	307	TAT	Y	TAC	谷物	617	TAT	Y	TAC	谷物
76	TTT	F	TTC	谷物	312	TCG	S	TCC	大豆	633	TCG	S	TCC	大豆	75	TGT	C	TGC	谷物	307	TAT	Y	TAC	谷物	617	TAT	Y	TAC	谷物
76	TTT	F	TTC	谷物	312	TCG	S	TCC	大豆	633	TCG	S	TCC	大豆	85	TAT	Y	TAC	谷物	313	CCG	P	CCA	大豆	652	ACG	T	ACC	大豆
86	AAT	N	AAC	谷物，大豆	322	CGT	R	CGC	谷物	655	CGT	R	CGC	谷物	85	TAT	Y	TAC	谷物	313	CCG	P	CCA	大豆	652	ACG	T	ACC	大豆
86	AAT	N	AAC	谷物，大豆	322	CGT	R	CGC	谷物	655	CGT	R	CGC	谷物	97	ACG	T	ACC	大豆	328	CCG	P	CCA	大豆	658	TCG	S	TCC	大豆

102	GCG	A	GCC	大豆	329	ATA	I	ATC	谷物	667	CCG	P	CCA	大豆
102	GCG	A	GCC	大豆	329	ATA	I	ATC	谷物	667	CCG	P	CCA	大豆	112	TCG	S	TCC	大豆	339	CCG	P	CCA	大豆	668	CGT	R	CGC	谷物
115	CGG	R	CGC	大豆	352	TCG	S	TCC	大豆	680	ACG	T	ACC	大豆	112	TCG	S	TCC	大豆	339	CCG	P	CCA	大豆	668	CGT	R	CGC	谷物
115	CGG	R	CGC	大豆	352	TCG	S	TCC	大豆	680	ACG	T	ACC	大豆	123	CCG	P	CCA	大豆	363	TCG	S	TCC	大豆	690	CCG	P	CCA	大豆
125	CGT	R	CGC	谷物	376	CCG	P	CCA	大豆	698	CCG	P	CCA	大豆	123	CCG	P	CCA	大豆	363	TCG	S	TCC	大豆	690	CCG	P	CCA	大豆
125	CGT	R	CGC	谷物	376	CCG	P	CCA	大豆	698	CCG	P	CCA	大豆	133	TCG	S	TCC	大豆	378	TCG	S	TCC	大豆	700	TCG	S	TCC	大豆
136	CCG	P	CCA	大豆	390	TAT	Y	TAC	谷物	703	ACG	T	ACC	大豆	133	TCG	S	TCC	大豆	378	TCG	S	TCC	大豆	700	TCG	S	TCC	大豆
136	CCG	P	CCA	大豆	390	TAT	Y	TAC	谷物	703	ACG	T	ACC	大豆	137	ACG	T	ACC	大豆	411	TTT	F	TTC	谷物	705	GGA	G	GGT	谷物
143	AGA	R	AGG	谷物	442	CCG	P	CCA	大豆	708	GCG	A	GCC	大豆	137	ACG	T	ACC	大豆	411	TTT	F	TTC	谷物	705	GGA	G	GGT	谷物
143	AGA	R	AGG	谷物	442	CCG	P	CCA	大豆	708	GCG	A	GCC	大豆	150	TAT	Y	TAC	谷物	446	TAT	Y	TAC	谷物	711	CGG	R	CGC	大豆
151	TCG	S	TCC	大豆	449	GCG	A	GCC	大豆	715	AAT	N	AAC	谷物，大豆	150	TAT	Y	TAC	谷物	446	TAT	Y	TAC	谷物	711	CGG	R	CGC	大豆
151	TCG	S	TCC	大豆	449	GCG	A	GCC	大豆	715	AAT	N	AAC	谷物，大豆	153	GCG	A	GCC	大豆	460	AAT	N	AAC	谷物，大豆	724	GCG	A	GCC	大豆
155	TCG	S	TCC	大豆	464	ACG	T	ACC	大豆	729	GCG	A	GCC	大豆	153	GCG	A	GCC	大豆	460	AAT	N	AAC	谷物，大豆	724	GCG	A	GCC	大豆
155	TCG	S	TCC	大豆	464	ACG	T	ACC	大豆	729	GCG	A	GCC	大豆	172	GCG	A	GCC	大豆	469	CGG	R	CGC	大豆

²标题为″作物中未充分表示″栏表明作物(玉米或大豆)中特定的密码子是未被充分表示的。

实施例11：包括单体的苜蓿中华根瘤菌邻氨基苯甲酸合酶的转化载体的制备。

苜蓿中华根瘤菌的基因克隆

使用获得自ATCC的苜蓿中华根瘤菌1021的穿刺培养物，接种到YM培养基(每1L含10g甘露醇，0.5g K₂HPO₄，0.2g MgSO₄-7H₂O，1.0g酵母提取物，0.2g NaCl，88mg FeCl₃-6H₂O，15g琼脂)平板上。该平板在30℃生长2天。使用单个克隆接种到1升的YM培养基中。该培养物在30℃生长过夜。在5,000×g旋转10分钟沉下细胞颗粒并且在-20℃冷冻。使用Qiagen Genomic-tip DNA试剂盒(Qiagen公司，Valencia，加利福尼亚)根据1999年8月的Qiagen基因组DNA手册(第42页)提取基因组DNA。

使用PCR反应扩增基因。所使用的引物是Rhizo F2：

ATGGCAGCGGTAATTCTGGAAG(SEQ ID NO：138)和Rhizo R8：

TCAGGCTGCCTTGGTCTTC(SEQ ID NO：139)。

将所得到的PCR片段克隆到pGEM(Promega公司，Madison，WI.)载体中。

最后，利用PCR扩增pGEM中的PCR产物，使用下列引物：

Rhizo NcoI ACTGACTCCATGGCAGCGGTAATTCTGGAA

(SEQ ID NO：140)和Rhizo SpeI：

CTGACTAGTTCAGGCTGCTT(SEQ ID NO：141)，

并且将产物克隆到TOPO 2.1 PCR载体中(Invitrogen公司，Grand Island，N.Y.)。

载体构建

用SpeI消化在TOPO 2.1载体中包含根瘤菌基因的载体，并且进行klenow反应以使该位点钝化。PCR纯化DNA(Qiagen PCR纯化试剂盒和MinElute手册，2001)，然后用NcoI消化。将该片段克隆到pET30a的EcoRV和NcoI位点，从而产生pMON66595(图41)。

通过几个步骤产生拟南芥转化载体，最初用NcoI/EcoRI消化pMON13773(图8)以产生骨架片段。用NcoI和EcoRI消化pMON66595并除去根瘤菌AS基因的较大的部分(大约2000碱基对)。然后将两段连接在一起。用EcoRI消化阳性克隆并用小牛肠磷酸酶(CIP)处理。通过用EcoRI消化pMON66595除去根瘤菌基因的第二个片段，并且保持大约200碱基对的片段。将2个片段连接在一起，并且对所合成的克隆测序以检查根瘤菌小片段的正确方向。

用BglII和NcoI消化具有正确的序列和方向的上述一个克隆。然后用BglII和NcoI消化pMON58046(图12)，并且除去CTP2运输肽片段。将这些片段连接在一起以完成该盒。

连接片段用NotI消化以移出该盒。然后在CIP处理的NotI位点将它们连接成为pMON36524(图48)。消化这些克隆以发现以与NPTII基因产生pMON66599(图42)相同的方向***的盒。

然后将载体pMON66599转化农杆菌并用于转化拟南芥。该实验中的对照构建体是pMON66598(图43)，其与pMON66599所描述的盒***方式相同，只是包含农杆菌AS野生型基因。

互补分析

用BamHI和NcoI切下来自pMON66595的根瘤菌AS基因，并克隆到pSE280载体(Invitrogen)的相应位点，产生pMON66596(图44)。然后将pMON66596转化突变的大肠杆菌菌株，EMG2ΔtrpE(产生自EMG菌株WTK12，F+，获得自ATCC)显示同数的基因互补于trp-菌株的基因组。

活性分析

将pMON66596转化BL-21细胞并用IPTG诱导表达蛋白质。通过HPLC分析粗细胞提取物，并发现具有活性和大约10μM trp的IC₅₀(Poulson，色谱法杂志Journal of Chromatography，547：155-160(1991))。

蛋白质表达和纯化

通过用IPTG诱导His-标记的蛋白质表达。利用QIAexpressionist 2002手册和镍树脂(Ni-NTA Spin手册，2000)中所列出的天然条件完成蛋白质纯化。兔血清显示识别纯化的蛋白质。

如在实施例2，3和6中，用包含根瘤菌邻氨基苯甲酸合酶基因的载体转化植物，并且在种子中显示升高的色氨酸水平。

实施例12：用包含玉米邻氨基苯甲酸合酶α-亚基基因和玉米邻氨基苯甲酸合酶β-亚基基因的载体转化谷物。

为了产生包含玉米邻氨基苯甲酸合酶α-亚基的编码序列的穿梭载体，用EcoRI和SacII消化pMON65150。凝胶纯化所得到的6195碱基对的片段，然后脱磷酸化。质粒pMON66604用EcoRI和SacII消化，以产生凝胶纯化的1077碱基对的片段。然后将1077碱基对的片段连接包含玉米ASα编码序列的粘末端的6195碱基对片段，以产生pMON67149，玉米L3(油质蛋白)启动子-玉米hsp70内含子-玉米ASα-Tr7 3′UTR表达载体。随后用XhoI消化这个载体，产生包含玉米油质蛋白启动子、玉米热休克蛋白70内含子、玉米邻氨基苯甲酸α-亚基编码序列和Tr7 3’UTR的4364碱基对的DNA片段。

用XhoI消化质粒pMON30167，产生8.89Kb的DNA片段。然后将这个片段连接4964碱基对的片段以产生pMON79951(图45)，转化载体包含L3启动子-zmhsp70内含子-玉米ASα-Tr7 3′UTR。

通过PCR从Monsanto所有的cDNA文库分离玉米邻氨基苯甲酸合酶β-亚基的编码序列，其中利用下列引物：

5′引物5″TGCTGACCATGGCCTGCTCCCACATCGTCG3′

(SEQ ID NO：142)，其包含NcoI限制酶切位点(以粗体显示)，和

3′引物5′CAGTGAATTCCTACGAACGCTGCTTCTCCAGTTC3′

(SEQ ID NO：143)，其包含EcoRI限制酶切位点(以粗体显示)。

所使用的PCR参数是，2°/秒到95°；95°5分钟；2°/秒到95；95°30秒；2°/秒到55°；55°45秒；2°/秒到72°；72°55秒；循环25次，在第三步开始；2°/秒到72°；72°10分钟；2°/秒到4°保持。(所有的温度显示为℃，除非另作说明)。PCR混合物包含：1μl从pMON79952小量制备(Qiagen方法)的DNA，1.5μl的各种引物(10μM原液)5μl含氯化镁的Roche 10×PCR缓冲液，2μl 10mM dNTP混合物，1μL高保真(Hi-Fi)Taq混合物(Roche扩展高保真PCR***#1732650)和水，总体积为50μl。所得到的PCR产物连接到pGEM-T载体(Promega pGEM-T载体***I#A3600)中。对上述片段测序显示其丢失限制性酶切位点。利用pGEM克隆作为模板再进行PCR，并且将产物克隆到TOPO 2.1 PCR载体中(Invitrogen TOPO TA克隆试剂盒pCR2.1-TOPO载体#45-0641)。该克隆通过测序证实。所得到的包含玉米ASβ的载体称为pMON66592。然后用NcoI和EcoRI消化该载体，以产生850碱基对(bp)的片段。分离后，钝化850bp片段的末端并脱去磷酸。用BamHI和SmaI消化质粒pMON79953，以产生5353bp的片段。分离后，钝化5353bp片段的末端。然后将包含ASβ基因的850bp片段连接到平末端的5353bppMON79953片段中以产生pMON79954，玉米L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR载体。

随后用XhoI消化载体pMON79954以产生包含玉米油质蛋白启动子，玉米hsp70内含子，玉米ASβ编码序列和Tr7 3′UTR的2907碱基对的DNA片段。质粒pMON30167(图49)用XhoI消化以产生8.89Kb的片段。将2个片段连接在一起以产生pMON79955(图46)，转化载体包含L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR。

为了产生玉米ASα和ASβ叠加(stacking)载体，用HindIII消化pMON79955以产生16.57Kb的片段。产生钝化的片段并且脱去磷酸。质粒pMON67149用XhoI消化，以产生4364碱基对的DNA片段，随后变为平末端。将2个片段连接在一起以产生pMON79956(图47)，最后的转化载体包含玉米L3启动子-zmhsp70内含子-玉米ASα-Tr73′UTR，与玉米L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR叠加。

利用根瘤农杆菌转化玉米

玉米植株(自交系LH198/Hi11)在标准实验下生长在温室中。当胚为1.5-2.0mm长度，通常在授粉后10-15天收获植物的穗。通过喷雾或渗入80％的乙醇对穗进行表面杀菌。

利用本领域技术人员公知的方法从个体的种仁分离不成熟的胚胎。转化前，将不成熟的胚胎在包含16.9mg/L AgNO₃(指定为培养基2112V)的培养基211(N6盐，2％蔗糖，1mg/l 2，4-二氯苯氧乙酸(2，4-D)，0.5mg/L烟酸，1.0mg/L硫胺HCl，0.91g/L L-天冬酰胺，100mg/L：肌醇，0.5g/L MES，100mg/L酪蛋白水解物，1.6g/L MgCl₂，0.69g/L L-脯氨酸，2g/L GELGRO tm，pH5.8)上培养3-6天。

农杆菌介导的转化玉米细胞及其他单子叶植物的方法是已知的(美国专利号5,591,616和5,981,840；以及EP0 672 752)。使用农杆菌菌株ABI和根瘤农杆菌二元载体***进行转化。

在与玉米胚胎细胞共培养前，农杆菌细胞生长在28℃，包含大约50μg/ml卡那霉素和100μg/ml壮观霉素的LB(DIFCO)液体培养基中，以选择保持改变的Ti质粒和二元载体。在接种玉米细胞前，农杆菌细胞在室温下，在包括用于保持质粒的适当抗生素和200μM乙酰丁香酮的AB培养基(Chilton等人，Proc.Nat.Acad.Sci.(美国)，71：3672-3676(1974))中生长过夜。在马上接种前，农杆菌细胞通过离心沉淀，在包含200μM乙酰丁香酮的1/2 MSVI培养基(2.2g/L GIBCO MS(Murashige和Skoog，Physiol.Plant 15：473-497(1962)基本(basal)盐，2mg/L甘氨酸，0.5g/L烟酸，0.5g/LL-吡哆醇-HCl，0.1mg/L硫胺，115g/L L-脯氨酸，10g/L D-葡萄糖和10g/L蔗糖，pH5.4)中洗涤。

切下不成熟的玉米胚，浸于1/2MSPL培养基的农杆菌悬浮液中并且在室温下与农杆菌培养大约5分钟。

农杆菌感染和共培养后，将胚转入类型II的延迟培养基中5-7天并且在27℃黑暗培养。延迟培养基由包含2.0mg/L 2，4-D(GIBCO)，100mg/L-酪蛋白氨基酸，12mM脯氨酸，500mg/L羧苄青霉素和20μM硫代硫酸银的MS基础盐组成。所有的培养基化学试剂是组织培养级的。一旦从不成熟的胚胎观察到类型II的愈伤组织开始的标志，正如Selman等人，在玉米手册The MaizeHandbook，Freeling和Walbot编辑，Springer Verlag，第672页(1994)中所定义的，从胚胎除去胚芽鞘。然后将胚胎转入包含2.0mg/L 2，4-D，12mM脯氨酸，20μM硫代硫酸银，500mg/L羧苄青霉素和0.5mM草甘膦(Monsanto公司，St.Louis，Mo.)的MS培养基并且在27℃黑暗培养2周。

如上所述将胚形成的愈伤组织转入MS培养基，但是培养基另外包含1.0mM草甘膦。然后培养物在黑暗中于27℃培养2周。然后将仍然具有愈伤组织的胚转入包含3.0mM草甘膦的MS培养基另外培养2周。

通过将愈伤组织转入包含0.1mg/L 2，4-D和0.1μM脱落酸(ABA)的MS培养基2周，然后转入包含6％蔗糖而无2，4-D的MS培养基再培养2周实现植物再生。培育在黑暗中于27℃进行以容许体细胞胚成熟并在再生过程中转化。

将准备发芽的体细胞胚转入无激素的MS培养基，并且在光照下培养直到产生附着根的苗。大约2-3周后，产生小植株。

然后将小植株转入温室并且在标准温室条件下生长。

R1种子氨基酸含量的分析

对于各个载体建立几个转基因谷物的品系并通过世代的数目繁殖。这些品系是生长的，并且自花受粉以产生纯合系。在各个世代，利用在未成熟种子上进行western印迹分析确定转化基因的表达，产生成熟的R1种子并利用如Agilent Technologies Technical Bulletin REV14所描述的荧光检测分析游离氨基酸的含量。表达ASα蛋白质的玉米种子相对于基线水平(相当于阴性等值线和非转基因对照)产生升高数量的色氨酸。谷物的基线游离色氨酸水平的范围是从大约5-大约25ppm。

所有的出版物和专利在此引入作为参考，并且逐一地引入作为参考。本发明不限于所显示和描述的精确细节，因为应该理解在保持在由权利要求所定义的本发明的精神和范围之内的同时可产生许多变化和改进。

序列表

<110>孟山都技术公司(Monsanto Technology，LLC)

Weaver，Lisa

Oulmassov，Tim

Vaduva，Gabriela

Liang，Jihong

Varagona，Rita

Venkatesh，Tyamagondlu

<120>转基因的高色氨酸植物

<130>51857R

<160>143

<170>PatentIn version 3.1

<210>1

<211>2190

<212>DNA

<213>根瘤农杆菌(Agrobacterium tumefaciens)

<400>1

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>2

<211>1815

<212>DNA

<213>玉米(Zea mays)

<400>2

atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg 60

cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga 120

accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180

agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240

cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300

acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360

ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420

gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480

cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540

atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600

tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660

tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720

gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780

cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840

tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900

cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960

gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020

aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080

aatcctagcc catacatggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140

cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200

gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260

gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320

gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380

gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440

gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500

gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga 1560

atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620

gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680

gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740

gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800

gtagacaaag aatag 1815

<210>3

<211>1993

<212>DNA

<213>芸香(Ruta graveolens)

<400>3

aaaaaatctg tctgtttttc gtgtttggac atttcagcgg cactgggtgc catcagttga 60

ttcgactcat ttgatttatt ttgtttgttg gccatgagtg cagcggcaac gtcgatgcaa 120

tcccttaaat tctccaaccg tctggtccca cccagtcgcc gtctgtctcc ggttccgaac 180

aatgtcacct gcaataacct ccccaagtct gcagctcccg tccggacagt caaatgctgc 240

gcttcttcct ggaacagtac catcaacggc gcggccgcca cgaccaacgg tgcgtccgcc 300

gccagtaacg gcgcatccac gaccaccact acatatgtta gtgatgcaac cagatttatc 360

gactcttcta aaagggcaaa tctagtgcca ttataccgtt gcatattcgc ggatcatctc 420

acgccggtgc ttgcctatag atgtttggtt caagaagacg ataaagagac tccaagtttt 480

ttattcgaat cagtagagcc gggtcggatt tctactgttg ggaggtatag tgtggttgga 540

gctcatcccg tgatggaagt tatagctaaa gataatatgg ttacggtgat ggatcatgag 600

aaagggagct tagttgagga ggtggtcgat gatcccatgg agattcctag aagaatttcc 660

gaggattgga agcctcaaat aatcgatgat cttcctgaag ctttttgcgg tggttgggtt 720

ggtttcttct catacgatac agttcgatat gtggagaaga aaaagttacc attctcaaag 780

gcacctcagg atgataggaa tcttgcagat atgcatctag gtctctataa cgatgttatt 840

gtgtttgatc atgtggaaaa gaaagtatat gttattcatt gggtgaggct aaatcaacag 900

tcttctgaag aaaaagcata tgccgagggt ctggaacact tggagagact agtatccaga 960

gtacaggatg agaacacgcc aaggctcgcc ccaggttcca tagacttaca cactggtcat 1020

tttggacctc cattaaaaaa gtcaaacatg acatgtgaag aatacaaaat ggctgtacta 1080

gcggcaaaag aacatattca ggctggggat atttttcaaa tcgtactaag ccaacgtttt 1140

gaacgtcgaa catttgctga tccatttgaa gtttataggg cactgagagt tgttaatccg 1200

agtccctata tgacgtatat gcaggcaaga gggtgtgttc tggtagcttc aagtccagaa 1260

attcttactc gagtaaagaa gaataagatt gtgaatcgac ctttggctgg aacagcccga 1320

agagggagga ctactgaaga agatgagatg ttggaaacac agttgctaaa agacgcaaag 1380

caatgtgctg agcatgttat gctggtcgat ttgggacgga atgatgttgg caaggtttca 1440

aaatctggtt ctgtgaaagt ggaaaagctg atgaatgttg aacgatattc acatgttatg 1500

cacataagct ctacggtcac aggtgagttg caagataatc tcagttgctg ggatgccctg 1560

cgtgctgcac tgcctgtcgg gactgttagt ggagcaccaa aggtgaaggc aatggagtta 1620

atcgatgaat tggaggtaaa tagacgtggc ccctacagtg gtgggtttgg cggtatctcc 1680

ttcaccggag atatggacat tgccctggct ctaaggacca ttgttttcca aaccggtaca 1740

cgctatgaca caatgtactc gtacaagaat gctaccaaac gccggcagtg ggtggcatac 1800

cttcaagccg gggctggcat tgttgctgat agtgatccag acgacgagca tcgtgagtgc 1860

cagaacaaag ccgccggact ggcccgtgcc atcgacctag ctgagtctgc ttttgtgaac 1920

aaatcaagta gctaaagttt tggatttgga agtggagttg agtctcggat aggatttaga 1980

gtaaaaaaag agg 1993

<210>4

<211>729

<212>PRT

<213>根瘤农杆菌(Agrobacterium tumefaciens)

<400>4

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>5

<211>604

<212>PRT

<213>玉米(Zea mays)

<400>5

Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala

1 5 10 15

Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr

20 25 30

Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala

35 40 45

Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala

50 55 60

Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala

65 70 75 80

Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val

85 90 95

Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu

100 105 110

Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly

115 120 125

Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His

130 135 140

Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp

145 150 155 160

His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln

165 170 175

Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu

180 185 190

Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp

195 200 205

Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro

210 215 220

Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp

225 230 235 240

Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp

245 250 255

Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly

260 265 270

Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val

275 280 285

Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly

290 295 300

Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala

305 310 315 320

Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile

325 330 335

Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu

340 345 350

Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala Tyr

355 360 365

Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu

370 375 380

Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr

385 390 395 400

Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln

405 410 415

Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp

420 425 430

Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys

435 440 445

Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile

450 455 460

Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp

465 470 475 480

Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys

485 490 495

Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly

500 505 510

Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln

515 520 525

Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His

530 535 540

Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val

545 550 555 560

Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp

565 570 575

Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala

580 585 590

Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu

595 600

<210>6

<211>613

<212>PRT

<213>芸香(Ruta graveolens)

<400>6

Met Ser Ala Ala Ala Thr Ser Met Gln Ser Leu Lys Phe Ser Asn Arg

1 5 10 15

Leu Val Pro Pro Ser Arg Arg Leu Ser Pro Val Pro Asn Asn Val Thr

20 25 30

Cys Asn Asn Leu Pro Lys Ser Ala Ala Pro Val Arg Thr Val Lys Cys

35 40 45

Cys Ala Ser Ser Trp Asn Ser Thr Ile Asn Gly Ala Ala Ala Thr Thr

50 55 60

Asn Gly Ala Ser Ala Ala Ser Asn Gly Ala Ser Thr Thr Thr Thr Thr

65 70 75 80

Tyr Val Ser Asp Ala Thr Arg Phe Ile Asp Ser Ser Lys Arg Ala Asn

85 90 95

Leu Val Pro Leu Tyr Arg Cys Ile Phe Ala Asp His Leu Thr Pro Val

100 105 110

Leu Ala Tyr Arg Cys Leu Val Gln Glu Asp Asp Lys Glu Thr Pro Ser

115 120 125

Phe Leu Phe Glu Ser Val Glu Pro Gly Arg Ile Ser Thr Val Gly Arg

130 135 140

Tyr Ser Val Val Gly Ala His Pro Val Met Glu Val Ile Ala Lys Asp

145 150 155 160

Asn Met Val Thr Val Met Asp His Glu Lys Gly Ser Leu Val Glu Glu

165 170 175

Val Val Asp Asp Pro Met Glu Ile Pro Arg Arg Ile Ser Glu Asp Trp

180 185 190

Lys Pro Gln Ile Ile Asp Asp Leu Pro Glu Ala Phe Cys Gly Gly Trp

195 200 205

Val Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys

210 215 220

Leu Pro Phe Ser Lys Ala Pro Gln Asp Asp Arg Asn Leu Ala Asp Met

225 230 235 240

His Leu Gly Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys

245 250 255

Lys Val Tyr Val Ile His Trp Val Arg Leu Asn Gln Gln Ser Ser Glu

260 265 270

Glu Lys Ala Tyr Ala Glu Gly Leu Glu His Leu Glu Arg Leu Val Ser

275 280 285

Arg Val Gln Asp Glu Asn Thr Pro Arg Leu Ala Pro Gly Ser Ile Asp

290 295 300

Leu His Thr Gly His Phe Gly Pro Pro Leu Lys Lys Ser Asn Met Thr

305 310 315 320

Cys Glu Glu Tyr Lys Met Ala Val Leu Ala Ala Lys Glu His Ile Gln

325 330 335

Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg

340 345 350

Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Val Val Asn

335 360 365

Pro Ser Pro Tyr Met Thr Tyr Met Gln Ala Arg Gly Cys Val Leu Val

370 375 380

Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val

385 390 395 400

Asn Arg Pro Leu Ala Gly Thr Ala Arg Arg Gly Arg Thr Thr Glu Glu

405 410 415

Asp Glu Met Leu Glu Thr Gln Leu Leu Lys Asp Ala Lys Gln Cys Ala

420 425 430

Glu His Val Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val

435 440 445

Ser Lys Ser Gly Ser Val Lys Val Glu Lys Leu Met Asn Val Glu Arg

450 455 460

Tyr Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln

465 470 475 480

Asp Asn Leu Ser Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly

485 490 495

Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu

500 505 510

Leu Glu Val Asn Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile

515 520 525

Ser Phe Thr Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val

530 535 540

Phe Gln Thr Gly Thr Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Asn Ala

545 550 555 560

Thr Lys Arg Arg Gln Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Ile

565 570 575

Val Ala Asp Ser Asp Pro Asp Asp Glu His Arg Glu Cys Gln Asn Lys

580 585 590

Ala Ala Gly Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val

595 600 605

Asn Lys Ser Ser Ser

610

<210>7

<211>729

<212>PRT

<213>苜蓿中华根瘤菌(Rhizobium meliloti)

<400>7

Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys

1 5 10 15

Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp

20 25 30

Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu

65 70 75 80

Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile

85 90 95

Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala

100 105 110

Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala

130 135 140

Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu

165 170 175

Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala

210 215 220

Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser

500 505 510

Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly

515 520 525

Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr

545 550 555 560

Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu

610 615 620

Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu

705 710 715 720

Ala Lys Arg Ala Lys Thr Lys Ala Ala

725

<210>8

<211>421

<212>PRT

<213>硫磺矿硫化叶菌(Sulfolobus solfataricus)

<400>8

Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe

1 5 10 15

Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile

20 25 30

Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr

35 40 45

Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly

50 55 60

Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly

65 70 75 80

Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys

85 90 95

Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe

100 105 110

Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val

115 120 125

Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly

130 135 140

Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr

145 150 155 160

Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile

165 170 175

Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp

180 185 190

Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr

195 200 205

Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro

210 215 220

Glu Leu Leu Phe Arg Val Gln Asp Asn Ile Val Glu Thr Tyr Pro Ile

225 230 235 240

Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu

245 250 255

Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met

260 265 270

Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly

275 280 285

Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val

290 295 300

Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn

305 310 315 320

Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly

325 330 335

Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr

340 345 350

Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly

355 360 365

Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu

370 375 380

Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro

385 390 395 400

Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr

405 410 415

Ala Ile Gly Val Arg

420

<210>9

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>9

ccatcgcggc gcgttttttt cgtccaacta tg 32

<210>10

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>10

catagttgga cgaaaaaaac gcgccgcgat gg 32

<210>11

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>11

ccatcgcggc gcgtattttt cgtccaacta tgaatatcc 39

<210>12

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>12

ggatattcat agttggacga aaaatacgcg ccgcgatgg 39

<210>13

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>13

ccatcgcggc gcgtggtttt cgtccaacta tgaatatcc 39

<210>14

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>14

ggatattcat agttggacga aaaccacgcg ccgcgatgg 39

<210>15

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>15

ccatcgcggc gcggttttta agtccaacta tgaatatcc 39

<210>16

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>16

ggatattcat agttggactt aaaaaccgcg ccgcgatgg 39

<210>17

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>17

gcgcggtttt ttcgtgcaac tatgaatatc cggg 34

<210>18

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>18

cccggatatt catagttgca cgaaaaaacc gcgc 34

<210>19

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>19

cgcggttttt tcgttcaact atgaatatcc gggc 34

<210>20

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>20

gcccggatat tcatagttga acgaaaaaac cgcg 34

<210>21

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>21

cggcgcggtt ttttcgatca actatgaata tccgggc 37

<210>22

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>22

gcccggatat tcatagttga tcgaaaaaac cgcgccg 37

<210>23

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>23

ggcgcggttt tttcgctcaa ctatgaatat ccgggc 36

<210>24

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>24

gcccggatat tcatagttga gcgaaaaaac cgcgcc 36

<210>25

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>25

cggcgcggtt ttttcgatga actatgaata tccgggccg 39

<210>26

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>26

cggcccggat attcatagtt catcgaaaaa accgcgccg 39

<210>27

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>27

cgcggttttt tcgaccaact atgaatatcc gggc 34

<210>28

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>28

gcccggatat tcatagttgg tcgaaaaaac cgcg 34

<210>29

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>29

ggcgcggttt tttcggtcaa ctatgaatat ccgggc 36

<210>30

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>30

gcccggatat tcatagttga ccgaaaaaac cgcgcc 36

<210>31

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>31

gcgcggtttt ttcgtacaac tatgaatatc cgggc 35

<210>32

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>32

gcccggatat tcatagttgt acgaaaaaac cgcgc 35

<210>33

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>33

cggcgcggtt ttttcgtcct tctatgaata tccggg 36

<210>34

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>34

cccggatatt catagaagga cgaaaaaacc gcgccg 36

<210>35

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>35

ctgaaggcga tcaacgcgtc gccctattc 29

<210>36

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>36

gaatagggcg acgcgttgat cgccttcag 29

<210>37

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>37

cctgaaggcg atcaacgggt cgccctattc c 31

<210>38

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>38

ggaatagggc gacccgttga tcgccttcag g 31

<210>39

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>39

cgtcgcccta ttccgccttc atcaatctcg gcg 33

<210>40

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>40

cgccgagatt gatgaaggcg gaatagggcg acg 33

<210>41

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>41

cgtcgcccta ttcctggttc atcaatctcg gcg 33

<210>42

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>42

cgccgagatt gatgaaccag gaatagggcg acg 33

<210>43

<211>729

<212>PRT

<213>苜蓿中华根瘤菌(Rhizobium meliloti)

<400>43

Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys

1 5 10 15

Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp

20 25 30

Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu

65 70 75 80

Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile

85 90 95

Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala

100 105 110

Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala

130 135 140

Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu

165 170 175

Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala

210 215 220

Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser

500 505 510

Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly

515 520 525

Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr

545 550 555 560

Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu

610 615 620

Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu

705 710 715 720

Ala Lys Arg Ala Lys Thr Lys Ala Ala

725

<210>44

<211>616

<212>PRT

<213>硫磺矿硫化叶菌(Sulfolobus solfataricus)

<400> 44

Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe

1 5 10 15

Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile

20 25 30

Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr

35 40 45

Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly

50 55 60

Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly

65 70 75 80

Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys

85 90 95

Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe

100 105 110

Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val

115 120 125

Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly

130 135 140

Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr

145 150 155 160

Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile

165 170 175

Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp

180 185 190

Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr

195 200 205

Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro

210 215 220

Glu Leu Leu Phe Arg Val Gin Asp Asn Ile Val Glu Thr Tyr Pro Ile

225 230 235 240

Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu

245 250 255

Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met

260 265 270

Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly

275 280 285

Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val

290 295 300

Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn

305 310 315 320

Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly

325 330 335

Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr

340 345 350

Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly

355 360 365

Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu

370 375 380

Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro

385 390 395 400

Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr

405 410 415

Ala Ile Gly Val Arg Met Asp Leu Thr Leu Ile Ile Asp Asn Tyr Asp

420 425 430

Ser Phe Val Tyr Asn Ile Ala Gln Ile Val Gly Glu Leu Gly Ser Tyr

435 440 445

Pro Ile Val Ile Arg Asn Asp Glu Ile Ser Ile Lys Gly Ile Glu Arg

450 455 460

Ile Asp Pro Asp Arg Leu Ile Ile Ser Pro Gly Pro Gly Thr Pro Glu

465 470 475 480

Lys Arg Glu Asp Ile Gly Val Ser Leu Asp Val Ile Lys Tyr Leu Gly

485 490 495

Lys Arg Thr Pro Ile Leu Gly Val Cys Leu Gly His Gln Ala Ile Gly

500 505 510

Tyr Ala Phe Gly Ala Lys Ile Arg Arg Ala Arg Lys Val Phe His Gly

515 520 525

Lys Ile Ser Asn Ile Ile Leu Val Asn Asn Ser Pro Leu Ser Leu Tyr

530 535 540

Tyr Gly Ile Ala Lys Glu Phe Lys Ala Thr Arg Tyr His Ser Leu Val

545 550 555 560

Val Asp Glu Val His Arg Pro Leu Ile Val Asp Ala Ile Ser Ala Glu

565 570 575

Asp Asn Glu Ile Met Ala Ile His His Glu Glu Tyr Pro Ile Tyr Gly

580 585 590

Val Gln Phe His Pro Glu Ser Val Gly Thr Ser Leu Gly Tyr Lys Ile

595 600 605

Leu Tyr Asn Phe Leu Asn Arg Val

610 615

<210>45

<211>897

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400> 45

Met Ser Ala Val Ser Ile Ser Ala Val Lys Ser Asp Phe Phe Thr Val

1 5 10 15

Glu Ala Ile Ala Val Thr His His Arg Thr Pro His Pro Pro His Phe

20 25 30

Pro Ser Leu Arg Phe Pro Leu Ser Leu Lys Ser Pro Pro Ala Thr Ser

35 40 45

Leu Asn Leu Val Ala Gly Ser Lys Leu Leu His Phe Ser Arg Arg Leu

50 55 60

Pro Ser Ile Lys Cys Ser Tyr Thr Pro Ser Leu Asp Leu Ser Glu Glu

65 70 75 80

Gln Phe Thr Lys Phe Lys Lys Ala Ser Glu Lys Gly Asn Leu Val Pro

85 90 95

Leu Phe Arg Cys Val Phe Ser Asp His Leu Thr Pro Ile Leu Ala Tyr

100 105 110

Arg Cys Leu Val Lys Glu Asp Asp Arg Asp Ala Pro Ser Phe Leu Phe

115 120 125

Glu Ser Val Glu Pro Gly Ser Gln Ser Ser Asn Ile Gly Arg Tyr Ser

130 135 140

Val Val Gly Ala Gln Pro Thr Ile Glu Ile Val Ala Lys Gly Asn Val

145 150 155 160

Val Thr Val Met Asp His Gly Ala Ser Leu Arg Thr Glu Glu Glu Val

165 170 175

Asp Asp Pro Met Met Val Pro Gln Lys Ile Met Glu Glu Trp Asn Pro

180 185 190

Gln Gly Ile Asp Glu Leu Pro Glu Ala Phe Cys Gly Gly Trp Val Gly

195 200 205

Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro

210 215 220

Phe Ser Asn Ala Pro Glu Asp Asp Arg Ser Leu Pro Asp Val Asn Leu

225 230 235 240

Gly Leu Tyr Asp Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala

245 250 255

Tyr Val Ile His Trp Val Arg Ile Asp Lys Asp Arg Ser Val Glu Glu

260 265 270

Asn Phe Arg Glu Gly Met Asn Arg Leu Glu Ser Leu Thr Ser Arg Ile

275 280 285

Gln Asp Gln Lys Pro Pro Lys Met Pro Thr Gly Phe Ile Lys Leu Arg

290 295 300

Thr Gln Leu Phe Gly Pro Lys Leu Glu Lys Ser Thr Met Thr Ser Glu

305 310 315 320

Ala Tyr Lys Glu Ala Val Val Glu Ala Lys Glu His Ile Leu Ala Gly

325 330 335

Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe

340 345 350

Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser

355 360 365

Pro Tyr Met Ala Tyr Leu Gln Val Arg Gly Cys Ile Leu Val Ala Ser

370 375 380

Ser Pro Glu Ile Leu Leu Arg Ser Lys Asn Arg Lys Ile Thr Asn Arg

385 390 395 400

Pro Leu Ala Gly Thr Val Arg Arg Gly Lys Thr Pro Lys Glu Asp Leu

405 410 415

Met Leu Glu Lys Glu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His

420 425 430

Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys

435 440 445

Pro Gly Ser Val Glu Val Lys Lys Leu Lys Asp Ile Glu Trp Phe Ser

450 455 460

His Val Met His Ile Ser Ser Thr Val Val Gly Glu Leu Leu Asp His

465 470 475 480

Leu Thr Ser Trp Asp Ala Leu Arg Ala Val Leu Pro Val Gly Thr Val

485 490 495

Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu

500 505 510

Val Thr Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe

515 520 525

Asn Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro

530 535 540

Thr Asn Thr Arg Tyr Asp Thr Leu Tyr Ser Tyr Lys His Pro Gln Arg

545 550 555 560

Arg Arg Glu Trp Ile Ala His Ile Gln Ala Gly Ala Gly Ile Val Ala

565 570 575

Asp Ser Asn Pro Asp Asp Glu His Arg Glu Cys Glu Asn Lys Ala Ala

580 585 590

Ala Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ser Phe Leu Glu Ala

595 600 605

Pro Glu Phe Thr Thr Ile Thr Pro His Ile Asn Asn Ile Met Ala Ala

610 615 620

Ser Thr Leu Tyr Lys Ser Cys Leu Leu Gln Pro Lys Ser Gly Ser Thr

625 630 635 640

Thr Arg Arg Leu Asn Pro Ser Leu Val Asn Pro Leu Thr Asn Pro Thr

645 650 655

Arg Val Ser Val Leu Gly Lys Ser Arg Arg Asp Val Phe Ala Lys Ala

660 665 670

Ser Ile Glu Met Ala Glu Ser Asn Ser Ile Pro Ser Val Val Val Asn

675 680 685

Ser Ser Lys Gln His Gly Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser

690 695 700

Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Leu Gly Cys His Phe

705 710 715 720

Glu Val Tyr Arg Asn Asp Glu Leu Thr Val Glu Glu Leu Lys Lys Lys

725 730 735

Asn Pro Arg Gly Val Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp

740 745 750

Ser Gly Ile Ser Leu Gln Thr Val Leu Glu Leu Gly Pro Leu Val Pro

755 760 765

Leu Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly

770 775 780

Gly Lys Ile Val Arg Ser Pro Phe Gly Val Met His Gly Lys Ser Ser

785 790 795 800

Met Val His Tyr Asp Glu Lys Gly Glu Glu Gly Leu Phe Ser Gly Leu

805 810 815

Ser Asn Pro Phe Ile Val Gly Arg Tyr His Ser Leu Val Ile Glu Lys

820 825 830

Asp Thr Phe Pro Ser Asp Glu Leu Glu Val Thr Ala Trp Thr Glu Asp

835 840 845

Gly Leu Val Met Ala Ala Arg His Arg Lys Tyr Lys His Ile Gln Gly

850 855 860

Val Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Lys Thr Ile

865 870 875 880

Val Arg Asn Phe Ile Lys Ile Val Glu Lys Lys Glu Ser Glu Lys Leu

885 890 895

Thr

<210>46

<211>252

<212>DNA

<213>人工序列

<220>

<223>截短的基因

<400>46

atgcaaacac aaaaaccgac tctcgaactg gaattcctgg tggaaaacgg tatcgccacc 60

gtgcaagcgg gtgctggtgt agtccttgat tctgttccgc agtcggaagc cgacgaaacc 120

cgtaacaaag cccgcgctgt actgcgcgct attgccaccg cgcatcatgc acaggagact 180

ttctgatggc tgacattctg ctgctcgata atatcgactc ttttacgtac aacctggcag 240

atcagttgcg ca 252

<210>47

<211>18

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>47

ttatgccgcc tgtcatcg 18

<210>48

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>48

ataggcttaa tggtaaccg 19

<210>49

<211>18

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>49

ctgaacaaca gaagtacg 18

<210>50

<211>18

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>50

taaccgtgtc atcgagcg 18

<210>51

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>51

aaaaagatct ccatggtaac gatcattcag g 31

<210>52

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>52

aaaagaattc ttatcacgcg gccttggtct tcgcc 35

<210>53

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>53

caaaagctgg atccccacc 19

<210>54

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>54

cctatccgag atctctcaac tcc 23

<210>55

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>55

catcccatgg atggtaacga tcattcagga t 31

<210>56

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物.

<400>56

gatgtcraga gacactatag aatactcaag c 31

<210>57

<211>719

<212>PRT

<213>血色红假单胞菌(Rhodopseudomonas palustris)

<400>57

Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr

1 5 10 15

Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly

20 25 30

Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val

35 40 45

Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp

50 55 60

Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys

65 70 75 80

Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe

85 90 95

Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys

100 105 110

Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp

115 120 125

Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala

130 135 140

Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr

145 150 155 160

Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln

165 170 175

Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro

180 185 190

Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile

195 200 205

Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn

210 215 220

Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala

225 230 235 240

Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala

245 250 255

Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe

260 265 270

Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys

275 280 285

Arg Ile Asn Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly

290 295 300

Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly

305 310 315 320

Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val

325 330 335

Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu

340 345 350

Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp

355 360 365

Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg

370 375 380

Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu

385 390 395 400

Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His

405 410 415

Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln

420 425 430

Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala

435 440 445

Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile

450 455 460

Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala

465 470 475 480

Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln

485 490 495

Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys

500 505 510

Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val

515 520 525

Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr

530 535 540

Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly

545 550 555 560

Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro

565 570 575

Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala

580 585 590

Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln

595 600 605

Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro

610 615 620

Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met

625 630 635 640

Arg Gly Leu Pro Asn Glu Val Thr Ile Gly Arg Tyr Hi s Ser Leu Tyr

645 650 655

Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr

660 665 670

Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly

675 680 685

Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val

690 695 700

Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala

705 710 715

<210>58

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>58

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Phe

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 15 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>59

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>59

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Tyr

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>60

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>60

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Ser Phe Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

ThrArg Lys Ala Lys Thr Lys Ala Ala

725

<210>61

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>61

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Ser Cys Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser ILe Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>62

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>62

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Ser Ser Phe Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>63

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>63

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Ala Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Aa Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>64

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>64

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Gly Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>65

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>65

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Trp Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu Hi s Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val Hi s Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>66

<211>604

<212>PRT

<213>人工序列

<220>

<223>玉米突变体.

<400>66

Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala

1 5 10 l5

Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr

20 25 30

Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala

35 40 45

Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala

50 55 60

Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala

65 70 75 80

Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val

85 90 95

Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu

100 105 110

Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly

115 120 125

Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His

130 135 140

Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp

145 150 155 160

His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln

165 170 175

Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu

180 185 190

Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp

195 200 205

Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro

210 215 220

Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp

225 230 235 240

Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp

245 250 255

Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly

260 265 270

Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val

275 280 285

Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly

290 295 300

Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala

305 310 315 320

Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile

325 330 335

Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu

340 345 350

Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Lys Ala Tyr

355 360 365

Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu

370 375 380

Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr

385 390 395 400

Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln

405 410 415

Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp

420 425 430

Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys

435 440 445

Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile

450 455 460

Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp

465 470 475 480

Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys

485 490 495

Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly

500 505 510

Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln

515 520 525

Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His

530 535 540

Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val

545 550 555 560

Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp

565 570 575

Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala

580 585 590

Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu

595 600

<210>67

<211>1815

<212>DNA

<213>人工序列

<220>

<223>玉米突变体.

<400>67

atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg 60

cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga l20

accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180

agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240

cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300

acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360

ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420

gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480

cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540

atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600

tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660

tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720

gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780

cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840

tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900

cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960

gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020

aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080

aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140

cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200

gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260

gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320

gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380

gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440

gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500

gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga 1560

atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620

gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680

gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740

gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800

gtagacaaag aatag 1815

<210>68

<211>2204

<212>DNA

<213>人工序列

<220>

<223>玉米突变体.

<400>68

atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg 60

cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga 120

accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180

agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240

cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300

acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360

ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420

gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480

cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540

atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600

tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660

tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720

gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780

cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840

tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900

cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960

gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020

aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080

aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140

cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200

gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260

gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320

gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380

gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440

gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500

gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga l560

atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620

gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680

gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740

gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800

gtagacaaag aatagtgtgc tatggttatc gtttagttct tgttcatgtt tcttttaccc 1860

actttccgtt aaaaaaagat gtcattagtg ggtggagaaa agcaataaga ctgttctcta 1920

gaattcgagc tcggtaccgg atccaattcc cgatcgttca aacatttggc aataaagttt 1980

cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta 2040

cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat 2100

gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa 2160

ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatc 2204

<210>69

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400> 69

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Lys Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>70

<211>729

<212>PRT

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>70

Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys

1 5 10 15

Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn

20 25 30

Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met

65 70 75 80

Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile

85 90 95

Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser

100 105 110

Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr

115 120 125

Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala

130 135 140

Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu

165 170 175

Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro

180 185 190

Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp

195 200 205

Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser

210 215 220

Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys

225 230 235 240

Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys

245 250 255

Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys

260 265 270

Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu

275 280 285

Lys Ala Ile Asn Pro Ser Pro Tyr Ser Ala Phe Ile Asn Leu Gly Asp

290 295 300

Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly

500 505 510

Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly

515 520 525

Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu

610 615 620

Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro

625 630 635 640

Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile

660 665 670

Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu

705 710 715 720

Thr Arg Lys Ala Lys Thr Lys Ala Ala

725

<210>71

<211>264

<212>DNA

<213>人工序列

<220>

<223>CTP的序列.

<400>71

atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg 60

gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac 120

aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct 180

ccgattggaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt 240

ggtcgcgtca actgcatgca ggcc 264

<210>72

<211>88

<212>PRT

<213>人工序列

<220>

<223>CTP的序列.

<400>72

Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala

1 5 10 15

Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala

20 25 30

Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser

35 40 45

Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys

50 55 60

Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly

65 70 75 80

Gly Arg Val Asn Cys Met Gln Ala

85

<210>73

<211>264

<212>DNA

<213>人工序列

<220>

<223>CTP的序列.

<400>73

atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg 60

gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac 120

aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct 180

ccgattgaaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt 240

ggtcgcgtca actgcatgca ggcc 264

<210>74

<211>88

<212>PRT

<213>人工序列

<220>

<223>CTP的序列.

<400>74

Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala

1 5 10 15

Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala

20 25 30

Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser

35 40 45

Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Glu Lys

50 55 60

Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly

65 70 75 80

Gly Arg Val Asn Cys Met Gln Ala

85

<210>75

<211>2190

<212>DNA

<213>人工序列

<220>

<223>优化的根瘤农杆菌(An optimized A.tumefaciens.)

<400>75

atggtgacca tcattcagga tgacggtgcc gagacctacg agaccaaggg cggcatccag 60

gtgagccgca agcgccgccc caccgattac gccaacgcca tcgataacta catcgaaaag 120

cttgattccc atcgcggtgc cgtgttctcc tccaactacg aatacccagg ccgctacacc 180

cgctgggata ccgccatcgt cgatccacca ctcggcattt cctgcttcgg ccgcaagatg 240

tggatcgaag cctacaacgg ccgcggcgaa gtgctgctcg atttcattac cgaaaagctg 300

aaggccacac ccgatctcac cctcggcgct tcctccaccc gccgcctcga tcttaccgtc 360

aacgaaccag accgcgtctt caccgaagaa gaacgctcca aaatcccaac cgtcttcacc 420

gctctcaggg ccatcgtcga cctcttctac tccagcgccg attccgccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcca tcaagctttc cctggcccgc 540

ccagaagacc agcgcgacat ggtgctgttc ctgcccgatg aaatcctcgt cgttgatcac 600

tactccgcca aggcctggat cgaccgctac gatttcgaga aggacggcat gaccaccgac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccacccaag 720

ggcgatcacc gccccggcga atactccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgctg cgaaagcaac 840

ccatccgcca tttcccgccg cctgaaggcc atcaacccat ccccctactc cttcttcatc 900

aacctcggcg atcaggaata cctggtcggc gcctccccag aaatgttcgt gcgcgtctcc 960

ggccgccgca tcgagacctg cccaatctca ggcaccatca agcgcggcga cgatccaatt 1020

gccgacagcg agcagatttt gaaactgctc aactccaaaa aggacgaatc cgaactgacc 1080

atgtgctccg acgtggaccg caacgacaag agccgcgtct gcgagccagg ttccgtgaag 1140

gtcattggcc gccgccagat cgagatgtac tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc ttcgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccacgcg cctggtacgg cggtgccatc ggcatggtcg gcttcaacgg cgacatgaac 1380

accggcctga ccctgcgcac catccgcatc aaggacggta ttgccgaagt gcgcgccggc 1440

gccaccctgc tcaacgattc caacccacag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tctcagccat tcgcgacgca aaaggcacca actctgccgc caccaagcgc 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacaccc tggccaacta cttccgccag accggcgcca ccgtctccac cgtcaggtca 1680

ccagtcgcag ccgacgtgtt cgatcgcttc cagccagacc tcgttgtcct gtcccccggt 1740

cccggcagcc caaccgattt cgactgcaag gcaaccatca aggccgcccg cgcccgcgat 1800

ctgccaatct tcggcgtttg cctcggtctg caggcattgg cagaagccta cggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttccc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcaccgtcg gtcgctacca ttccatcttc 1980

gccgatcccg ccaccctgcc acgcgatttc atcatcaccg cagaaagcga ggacggcacc 2040

atcatgggca tcgaacacgc caaggaacca gtggccgccg ttcagttcca cccagaatcc 2100

atcatgaccc tcggtcagga cgccggcatg cgcatgatcg agaacgtcgt ggtgcatctg 2160

acccgcaagg ccaagaccaa ggccgcctga 2190

<210>76

<211>2160

<212>DNA

<213>血色红假单胞菌(Rhodopseudomonas palustris)

<400>76

atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc 60

gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat 120

ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac 180

gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa 240

ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag 300

cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc 360

gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc 420

ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac 480

ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc 540

gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc 600

gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc 660

ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc 720

gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc 780

ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg 840

gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat 900

ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc 960

cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020

gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080

tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140

ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200

ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260

accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320

ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380

ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440

acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500

gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560

gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620

ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680

ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740

ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800

ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860

ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920

cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980

gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040

gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100

ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160

<210>77

<211>733

<212>PRT

<213>百脉根根瘤菌(Mesorhizobium loti)

<400>77

Met Glu Thr Ala Met Thr Met Lys Val Leu Glu Asn Gly Ala Glu Ser

1 5 10 15

Phe Val Thr Ala Gly Gly Ile Thr Ile Thr Arg Glu Arg His Asp Arg

20 25 30

Pro Tyr Ala Gly Ala Ile Asp Ala Tyr Val Asp Gly Leu Asn Ser Arg

35 40 45

Arg Gly Ala Val Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr

50 55 60

Arg Trp Asp Thr Ala Ile Ile Asp Pro Pro Leu Val Ile Ser Ala Arg

65 70 75 80

Gly Arg Ala Met Arg Ile Glu Ala Leu Asn Arg Arg Gly Glu Ala Leu

85 90 95

Leu Pro Val Ile Gly Lys Thr Leu Gly Gly Leu Ala Asp Ile Thr Ile

100 105 110

Ala Glu Thr Thr Lys Thr Leu Ile Arg Leu Asp Val Ala Lys Pro Gly

115 120 125

Arg Val Phe Thr Glu Glu Glu Arg Ser Arg Val Pro Ser Val Phe Thr

130 135 140

Val Leu Arg Ala Ile Thr Ala Leu Phe Lys Thr Asp Glu Asp Ala Asn

145 150 155 160

Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ser Phe Gln Phe Asp

165 170 175

Pro Val Asp Tyr Lys Leu Glu Arg Lys Pro Ser Gln Arg Asp Leu Val

180 185 190

Leu Phe Leu Pro Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys

195 200 205

Ala Trp Thr Asp Arg Tyr Asp Tyr Ser Gly Glu Gly Phe Ser Thr Glu

210 215 220

Gly Leu Pro Arg Asp Ala Ile Ala Glu Pro Phe Lys Thr Ala Asp Arg

225 230 235 240

Ile Pro Pro Arg Gly Asp His Glu Pro Gly Glu Tyr Ala Asn Leu Val

245 250 255

Arg Arg Ala Met Asp Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val

260 265 270

Pro Gly Gln Met Phe Tyr Glu Arg Cys Glu Thr Gln Pro Ser Asp Ile

275 280 285

Ser Arg Lys Leu Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile

290 295 300

Asn Leu Gly Glu Asn Glu Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe

305 310 315 320

Val Arg Val Asn Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr

325 330 335

Ile Lys Arg Gly Asp Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys

340 345 350

Leu Leu Asn Ser Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp

355 360 365

Val Asp Arg Asn Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg

370 375 380

Val Ile Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr

385 390 395 400

Val Asp His Ile Glu Gly Arg Leu Arg Glu Gly Met Asp Ala Phe Asp

405 410 415

Ala Phe Leu Ser His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys

420 425 430

Leu Trp Ala Met Arg Phe Ile Glu Gln Asn Glu Lys Ser Pro Arg Ala

435 440 445

Trp Tyr Gly Gly Ala Ile Gly Met Val Asn Phe Asn Gly Asp Met Asn

450 455 460

Thr Gly Leu Thr Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu

465 470 475 480

Val Arg Ala Gly Ala Thr Leu Leu Phe Asp Ser Ile Pro Glu Glu Glu

485 490 495

Glu Ala Glu Thr Glu Leu Lys Ala Ser Ala Met Leu Ser Ala Ile Arg

500 505 510

Asp Ala Lys Thr Gly Asn Ser Ala Ser Thr Glu Arg Thr Thr Ala Arg

515 520 525

Val Gly Asp Gly Val Asn Ile Leu Leu Val Asp His Glu Asp Ser Phe

530 535 540

Val His Thr Leu Ala Asn Tyr Phe Arg Gln Thr Gly Ala Asn Val Ser

545 550 555 560

Thr Val Arg Thr Pro Val Pro Asp Glu Val Phe Glu Arg Leu Lys Pro

565 570 575

Asp Leu Val Val Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp

580 585 590

Cys Ala Ala Thr Ile Arg Arg Ala Arg Ala Arg Asp Leu Pro Ile Phe

595 600 605

Gly Val Cys Leu Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu

610 615 620

Leu Arg Gln Leu His Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg

625 630 635 640

Val Ser Lys Pro Gly Ile Ile Phe Ser Gly Leu Pro Lys Glu Val Thr

645 650 655

Val Gly Arg Tyr His Ser Ile Phe Ala Asp Pro Val Arg Leu Pro Asp

660 665 670

Asp Phe Ile Val Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe

675 680 685

Glu His Arg Lys Glu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser

690 695 700

Ile Met Thr Leu Gly His Asn Ala Gly Met Arg Ile Ile Glu Asn Ile

705 710 715 720

Val Ala His Leu Pro Arg Lys Ala Lys Glu Lys Ala Ala

725 730

<210>78

<211>732

<212>PRT

<213>巴西固氮螺菌(Azospirillum brasilense)

<400>78

Met Tyr Pro Ala Asp Leu Leu Ala Ser Pro Asp Leu Leu Glu Pro Leu

1 5 10 15

Arg Phe Gln Thr Arg Gly Gly Val Thr Val Thr Arg Arg Ala Thr Ala

20 25 30

Leu Asp Pro Arg Thr Ala Leu Asp Pro Val Ile Asp Ala Leu Asp Arg

35 40 45

Arg Arg Gly Leu Leu Leu Ser Ser Gly Val Glu Ala Pro Gly Arg Tyr

50 55 60

Arg Arg His Ala Leu Gly Phe Thr Asp Pro Ala Val Ala Leu Thr Ala

65 70 75 80

Arg Gly Arg Thr Leu Arg Ile Asp Ala Leu Asn Gly Arg Gly Gln Val

85 90 95

Leu Leu Pro Ala Val Ala Glu Ala Leu Arg Gly Leu Glu Ala Leu Ala

100 105 110

Gly Leu Glu Glu Ala Pro Ser Arg Val Thr Ala Ser Ser Ala Ser Pro

115 120 125

Ala Pro Leu Pro Gly Glu Glu Arg Ser Arg Gln Pro Ser Val Phe Ser

130 135 140

Val Leu Arg Ala Val Leu Asp Leu Phe Ala Ala Pro Asp Asp Pro Leu

145 150 155 160

Leu Gly Leu Tyr Gly Ala Phe Ala Tyr Asp Leu Ala Phe Gln Phe Glu

165 170 175

Pro Ile Arg Gln Arg Leu Glu Arg Pro Asp Asp Gln Arg Asp Leu Leu

180 185 190

Leu Tyr Leu Pro Asp Arg Leu Val Ala Leu Asp Pro Ile Ala Gly Leu

195 200 205

Ala Arg Leu Val Ala Tyr Glu Phe Ile Thr Ala Ala Gly Ser Thr Glu

210 215 220

Gly Leu Glu Cys Gly Gly Arg Asp His Pro Tyr Arg Pro Asp Thr Asn

225 230 235 240

Ala Glu Ala Gly Cys Asp His Ala Pro Gly Asp Tyr Gln Arg Val Val

245 250 255

Glu Ser Ala Lys Ala Ala Phe Arg Arg Gly Asp Leu Phe Glu Val Val

260 265 270

Pro Gly Gln Thr Phe Ala Glu Pro Cys Ala Asp Ala Pro Ser Ser Val

275 280 285

Phe Arg Arg Leu Arg Ala Ala Asn Pro Ala Pro Tyr Glu Ala Phe Val

290 295 300

Asn Leu Gly Arg Gly Glu Phe Leu Val Ala Ala Ser Pro Glu Met Tyr

305 310 315 320

Val Arg Val Ala Gly Gly Arg Val Glu Thr Cys Pro Ile Ser Gly Thr

325 330 335

Val Ala Arg Gly Ala Asp Ala Leu Gly Asp Ala Ala Gln Val Leu Arg

340 345 350

Leu Leu Thr Ser Ala Lys Asp Ala Ala Glu Leu Thr Met Cys Thr Asp

355 360 365

Val Asp Arg Asn Asp Lys Ala Arg Val Cys Glu Pro Gly Ser Val Arg

370 375 380

Val Ile Gly Arg Arg Met Ile Glu Leu Tyr Ser Arg Leu Ile His Thr

385 390 395 400

Val Asp His Val Glu Gly Arg Leu Arg Ser Gly Met Asp Ala Leu Asp

405 410 415

Ala Phe Leu Thr His Ser Trp Ala Val Thr Val Thr Gly Ala Pro Lys

420 425 430

Arg Trp Ala Met Gln Phe Leu Glu Asp Thr Glu Gln Ser Pro Arg Arg

435 440 445

Trp Tyr Gly Gly Ala Phe Gly Arg Leu Gly Phe Asp Gly Gly Met Asp

450 455 460

Thr Gly Leu Thr Leu Arg Thr Ile Arg Met Ala Glu Gly Val Ala Tyr

465 470 475 480

Val Arg Ala Gly Ala Thr Leu Leu Ser Asp Ser Asp Pro Asp Ala Glu

485 490 495

Asp Ala Glu Cys Arg Leu Lys Ala Ala Ala Phe Arg Asp Ala Ile Arg

500 505 510

Gly Thr Ala Ala Gly Ala Ala Pro Thr Leu Pro Ala Ala Pro Arg Gly

515 520 525

Gly Glu Gly Arg Arg Val Leu Leu Val Asp His Asp Asp Ser Phe Val

530 535 540

His Thr Leu Ala Asp Tyr Leu Arg Gln Thr Gly Ala Ser Val Thr Thr

545 550 555 560

Leu Arg His Ser His Ala Arg Ala Ala Leu Ala Glu Arg Arg Pro Asp

565 570 575

Leu Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ala Asp Phe Asp Val

580 585 590

Ala Gly Thr Ile Asp Ala Ala Leu Ala Leu Gly Leu Pro Val Phe Gly

595 600 605

Val Cys Leu Gly Leu Gln Gly Met Val Glu Arg Phe Gly Gly Ala Leu

610 615 620

Asp Val Leu Pro Glu Pro Val His Gly Lys Ala Thr Glu Val Arg Val

625 630 635 640

Leu Gly Gly Ala Leu Phe Ala Gly Leu Pro Glu Arg Leu Thr Val Gly

645 650 655

Arg Tyr His Ser Leu Val Ala Arg Arg Asp Arg Leu Pro Ala Asp Leu

660 665 670

Thr Val Thr Ala Glu Thr Ala Asp Gly Leu Val Met Ala Val Glu His

675 680 685

Arg Arg Leu Pro Leu Ala Ala Val Gln Phe His Pro Glu Ser Ile Leu

690 695 700

Ser Leu Asp Gly Gly Ala Gly Leu Ala Leu Leu Gly Asn Val Met Asp

705 710 715 720

Arg Leu Ala Ala Gly Ala Leu Thr Asp Ala Ala Ala

725 730

<210>79

<211>731

<212>PRT

<213>马尔他布鲁氏菌(Brucella melitensis)

<400>79

Met Asn Ala Lys Thr Ala Asp Ser Glu Ile Phe Gln His Glu Thr Ala

1 5 10 15

Gly Gly Ile Ile Val Glu Arg Val Arg His Leu Thr Ala Tyr Lys Gly

20 25 30

Ala Ile Glu Ser Tyr Ile Asp Val Leu Asn Glu Trp Arg Gly Ala Val

35 40 45

Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr

50 55 60

Ala Ile Val Asp Pro Pro Val Val Ile Thr Ser Arg Ala Arg Thr Met

65 70 75 80

Arg Ile Glu Ala Leu Asn Ala Arg Gly Val Ile Leu Leu Arg Pro Ile

85 90 95

Leu Asp Thr Val Lys Ala Leu Ser Glu Val Lys Ile Asp Gln Ser Gly

100 105 110

Glu Asn Arg Ile Asp Leu Thr Ile Val Glu Pro Val Gly Thr Phe Thr

115 120 125

Glu Glu Glu Arg Ser Arg Met Pro Ser Val Phe Thr Val Leu Arg Ala

130 135 140

Ile Val Gly Leu Phe Phe Ser Glu Glu Asp Ala Asn Leu Gly Leu Tyr

145 150 155 160

Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Pro Ile Gln Tyr

165 170 175

Lys Leu Lys Arg Pro Asp Asp Gln Arg Asp Leu Val Leu Phe Ile Pro

180 185 190

Asp Glu Ile Phe Val Ala Asp His Tyr Ala Ala Arg Ala Trp Val Asp

195 200 205

Arg Tyr Glu Phe Arg Cys Gly Gly Ser Ser Thr His Gly Leu Asp Arg

210 215 220

Ala Thr Pro Val Val Pro Phe Lys Pro Ser Glu Arg Lys Leu Ala Arg

225 230 235 240

Gly Asp His Asn Pro Gly Glu Tyr Ala Arg Leu Val Glu Arg Ala Lys

245 250 255

Glu Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Thr

260 265 270

Phe Tyr Glu Arg Cys His Thr Ala Pro Ser Glu Ile Phe Arg Arg Leu

275 280 285

Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Glu

290 295 300

Ser Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Asn

305 310 315 320

Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly

325 330 335

Glu Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser

340 345 350

Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn

355 360 365

Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile

385 390 395 400

Glu Gly Arg Leu Arg Asp Gly Met Asp Ala Phe Asp Gly Phe Leu Ser

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Arg Phe Leu Glu Glu Asn Glu Arg Ser Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Met Met His Phe Asn Gly Asp Met Asn Thr Gly Leu Thr

450 455 460

Leu Arg Thr Ile Arg Ile Lys Asp Gly Val Ala Glu Ile Arg Ala Gly

465 470 475 480

Ala Thr Leu Leu Phe Asp Ser Asn Pro Asp Glu Glu Glu Ala Glu Thr

485 490 495

Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Val Arg Asp Ala Gln Lys

500 505 510

Ser Asn Gln Ile Ala Glu Glu Ser Val Ala Ala Lys Val Gly Glu Gly

515 520 525

Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu

530 535 540

Ala Asn Tyr Phe Arg Gln Thr Gly Ala Lys Val Ser Thr Val Arg Ser

545 550 555 560

Pro Val Ala Glu Glu Ile Phe Asp Arg Val Asn Pro Asp Leu Val Val

565 570 575

Leu Ser Pro Gly Pro Gly Ser Pro Gln Asp Phe Asp Cys Lys Ala Thr

580 585 590

Ile Asp Lys Ala Arg Lys Arg Gln Leu Pro Ile Phe Gly Val Cys Leu

595 600 605

Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Ala Leu Arg Gln Leu

610 615 620

Arg Val Pro Val His Gly Lys Pro Ser Arg Ile Arg Val Ser Lys Pro

625 630 635 640

Glu Arg Ile Phe Ser Gly Leu Pro Glu Glu Val Thr Val Gly Arg Tyr

645 650 655

His Ser Ile Phe Ala Asp Pro Glu Arg Leu Pro Asp Asp Phe Leu Val

660 665 670

Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe Glu His Lys His

675 680 685

Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu

690 695 700

Gly His Asn Ala Gly Met Arg Met Ile Glu Asn Ile Val Thr His Leu

705 710 715 720

Ala Gly Lys His Lys Ala Arg Arg Thr Asn Tyr

725 730

<210>80

<211>735

<212>PRT

<213>念珠藻属(Nostoc sp.)

<400>80

Met Ile Ala Asp Ser His Ser Tyr Arg Thr Asn Gly Asn Val Arg Val

1 5 10 15

Ser Arg Ser Ile Thr Gln Val Lys Met Glu Thr Ala Leu Glu Glu Ile

20 25 30

Leu Phe Tyr Leu Asn Ser Gln Arg Gly Gly Leu Leu Thr Ser Ser Tyr

35 40 45

Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe Val Asn Pro

50 55 60

Pro Val Glu Leu Ser Thr Ser Gly Asn Thr Phe Thr Leu Thr Ala Leu

65 70 75 80

Asn Glu Arg Gly Tyr Val Leu Leu Pro Val Ile Phe Glu Cys Leu Ser

85 90 95

Lys Ser Glu Gln Leu Gln Lys Leu Thr Glu His His His Lys Ile Thr

100 105 110

Gly Leu Val Lys Ser Thr Pro Glu Phe Phe Ala Glu Glu Glu Arg Ser

115 120 125

Lys Gln Pro Ser Thr Phe Thr Val Ile Arg Glu Ile Leu His Ile Phe

130 135 140

Ser Ser Gln Glu Asp Glu His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr

145 150 155 160

Asp Leu Val Phe Gln Phe Glu Gln Ile Thr Gln Cys Leu Glu Arg Pro

165 170 175

Gln Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu Leu Ile Val

180 185 190

Val Asp Tyr Tyr Gln Gln Gln Ala Phe Arg Leu Glu Tyr Asp Phe Ile

195 200 205

Thr Ala His Gly Ser Thr Tyr Asp Leu Pro Arg Thr Gly Glu Ser Val

210 215 220

Asp Tyr Arg Gly Gln Cys Leu Thr Pro Pro Gln Asn Ala Asp His Lys

225 230 235 240

Ile Gly Glu Tyr Ala Lys Leu Val Glu Phe Ala Leu Asp Tyr Phe Arg

245 250 255

Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe Phe Thr Ala

260 265 270

Cys Glu Ala Pro Pro Ser G1n Leu Phe Glu Thr Leu Lys Gln Ile Asn

275 280 285

Pro Ser Pro Tyr Gly Phe Ile Phe Asn Leu Gly Gly Glu Tyr Ile Ile

290 295 300

Gly Ala Ser Pro Glu Met Phe Val Arg Val Glu Gly Arg Arg Val Glu

305 310 315 320

Thr Cys Pro Ile Ser Gly Thr Ile Thr Arg Gly His Asp Ala Ile Asp

325 330 335

Asp Ala Val Gln Ile Arg Gln Leu Leu Asn Ser His Lys Asp Glu Ala

340 345 350

Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys Ser Arg Ile

355 360 365

Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg Arg Gln Ile Glu Leu

370 375 380

Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly Ile Leu Arg

385 390 395 400

Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr Trp Ala Val

405 410 415

Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Ile Gln Phe Ile Glu Lys

420 425 430

Asn Glu Arg Ser Val Arg Arg Trp Tyr Gly Gly Ala Val Gly Tyr Leu

435 440 445

Asn Phe Asn Gly Asn Leu Asn Thr Gly Leu Ile Leu Arg Thr Ile Arg

450 455 460

Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr Leu Leu Tyr

465 470 475 480

Asp Ser Ile Pro Gln Ala Glu Glu Gln Glu Thr Ile Thr Lys Ala Ala

485 490 495

Ala Ala Phe Glu Thr Ile Arg Arg Ala Lys Gln Ile Asp Pro Gln Ile

500 505 510

Glu Glu Ser Ser Thr Arg Lys Leu Ser Lys Tyr Leu Pro Asp Gly Gln

515 520 525

Ser Gly Lys His Ile Leu Leu Ile Asp His Glu Asp Ser Phe Val His

530 535 540

Thr Leu Ala Asn Tyr Ile Arg Ser Thr Gly Ala Thr Val Thr Thr Leu

545 550 555 560

Arg His Gly Phe Ser Glu Ser Leu Phe Asp Thr Glu Arg Pro Asp Leu

565 570 575

Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ser Glu Phe Lys Val Gln

580 585 590

Glu Thr Val Ala Ala Cys Val Arg Arg Gln Ile Pro Leu Phe Gly Val

595 600 605

Cys Leu Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly

610 615 620

Val Leu Asn Tyr Pro Gln His Gly Lys Ser Ser Arg Ile Phe Val Thr

625 630 635 640

Ala Pro Asp Ser Val Met Phe Gln Asp Leu Pro Glu Ser Phe Thr Val

645 650 655

Gly Arg Tyr His Ser Leu Phe Ala Leu Ser Gln Arg Leu Pro Lys Glu

660 665 670

Leu Lys Val Thr Ala Ile Ser Asp Asp Glu Val Ile Met Ala Ile Glu

675 680 685

His Gln Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile

690 695 700

Met Thr Leu Ala Gly Glu Val Gly Leu Met Met Ile Lys Asn Val Val

705 710 715 720

Gln Lys Tyr Thr Gln Ser Gln Gln Ser Thr Val Pro Ile Tyr Asp

725 730 735

<210>81

<211>715

<212>PRT

<213>念珠藻属(Nostoc sp.)

<400>81

Met Arg Val Ser Arg Ser Thr Thr Glu Val Lys Met Asp Thr Ala Leu

1 5 10 15

Asp Glu Ile Leu Phe His Leu Asn Gln Val Arg Gly Gly Leu Leu Thr

20 25 30

Ser Ser Tyr Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe

35 40 45

Ile Asn Pro Pro Leu Gln Leu Thr Thr Arg Glu Asn Ala Phe Thr Ile

50 55 60

Ser Ser Leu Asn Pro Arg Gly Gln Val Leu Leu Pro Thr Leu Phe Gln

65 70 75 80

His Leu Ser Ala Gln Ser Gln Leu Gln Gln Ile Ser Leu Asn His Asp

85 90 95

Tyr Ile Thr Gly Glu Ile Arg Pro Thr Lys Gln Leu Phe Thr Glu Glu

100 105 110

Gln Arg Ser Lys Gln Pro Ser Ala Phe Thr Val Ile Arg Glu Ile Leu

115 120 125

Gln Ile Phe Ala Ser Asp Glu Asp Glu His Leu Gly Leu Tyr Gly Ala

130 135 140

Phe Gly Tyr Asp Leu Val Phe Gln Phe Glu Pro Ile Pro Gln Lys Ile

145 150 155 160

Ala Arg Pro Ala Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu

165 170 175

Leu Ile Val Val Asp Tyr Tyr Leu Gln Lys Ala Tyr Arg His Gln Tyr

180 185 190

Glu Phe Ala Thr Glu His Gly Asn Thr Glu His Leu Pro Arg Thr Gly

195 200 205

Gln Ser Ile Asp Tyr Gln Gly Lys His Leu Leu Pro Asn Gln Thr Ala

210 215 220

Asp His Gln Pro Gly Glu Tyr Ala Asn Leu Val Glu Gln Ala Leu Asp

225 230 235 240

Tyr Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe

245 250 255

Phe Thr Ala Cys Glu Gln Ser Pro Ser Gln Leu Phe Gln Thr Leu Arg

260 265 270

Gln Ile Asn Pro Ser Pro Tyr Gly Phe Leu Leu Asn Leu Gly Gly Glu

275 280 285

Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Asp Gly Arg

290 295 300

Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Arg Arg Gly Glu Asp

305 310 315 320

Ala Leu Gly Asp Ala Val Gln Ile Arg Gln Leu Leu Ash Ser His Lys

325 330 335

Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys

340 345 350

Ser Arg Ile Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg Arg Gln

355 360 365

Ile Glu Leu Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly

370 375 380

Ile Leu Arg Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr

385 390 395 400

Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met Gln Phe

405 410 415

Ile Glu Gln His Glu Arg Ser Ala Arg Arg Trp Tyr Gly Gly Ala Val

420 425 430

Gly Tyr Leu Gly Phe Asn Gly Asn Leu Asn Thr Gly Leu Thr Leu Arg

435 440 445

Thr Ile Arg Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr

450 455 460

Val Leu Tyr Asp Ser Ile Pro Ser Ala Glu Glu Glu Glu Thr Ile Thr

465 470 475 480

Lys Ala Thr Ala Leu Phe Glu Thr Ile Arg Arg His Thr Thr Ala Asn

485 490 495

Lys Thr Gln Gly Asn Asp Ser His Arg Pro Gly Asp Ile Ala His Asn

500 505 510

Lys Arg Ile Leu Leu Ile Asp Tyr Glu Asp Ser Phe Val His Thr Leu

515 520 525

Ala Asn Tyr Ile Arg Thr Thr Gly Ala Thr Val Thr Thr Leu Arg His

530 535 540

Gly Phe Ala Glu Ser Tyr Phe Asp Ala Glu Arg Pro Asp Leu Val Val

545 550 555 560

Leu Ser Pro Gly Pro Gly Arg Pro Ser Asp Phe Arg Val Pro Gln Thr

565 570 575

Val Ala Ala Leu Val Gly Arg Glu Ile Pro Ile Phe Gly Val Cys Leu

580 585 590

Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly Val Leu

595 600 605

Asp Tyr Pro Gln His Gly Lys Pro Ala Arg Ile Ser Val Thr Ala Pro

610 615 620

Asp Ser Val Leu Phe Gln Asn Leu Pro Ala Ser Phe Ile Val Gly Arg

625 630 635 640

Tyr His Ser Leu Phe Ala Gln Pro Gln Thr Ile Pro Gly Glu Leu Lys

645 650 655

Val Thr Ala Ile Ser Glu Asp Asn Val Ile Met Ala Ile Glu His Gln

660 665 670

Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr

675 680 685

Leu Ala Gly Glu Val Gly Gln Thr Ile Ile Lys Asn Val Val Gln Thr

690 695 700

Tyr Thr Gln Thr Leu Glu Thr Ser Ile Tyr Ser

705 710 715

<210>82

<211>719

<212>PRT

<213>血色红假单胞菌(Rhodopseudomonas palustris)

<400>82

Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr

1 5 10 15

Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly

20 25 30

Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val

35 40 45

Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp

50 55 60

Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys

65 70 75 80

Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe

85 90 95

Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys

100 105 110

Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp

115 120 125

Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala

130 135 140

Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr

145 150 155 160

Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln

165 170 175

Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro

180 185 190

Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile

195 200 205

Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn

210 215 220

Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala

225 230 235 240

Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala

245 250 255

Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe

260 265 270

Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys

275 280 285

Arg Ile Ash Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly

290 295 300

Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly

305 310 315 320

Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val

325 330 335

Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu

340 345 350

Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp

355 360 365

Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg

370 375 380

Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu

385 390 395 400

Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His

405 410 415

Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln

420 425 430

Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala

435 440 445

Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile

450 455 460

Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala

465 470 475 480

Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln

485 490 495

Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys

500 505 510

Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val

515 520 525

Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr

530 535 540

Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly

545 550 555 560

Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro

565 570 575

Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala

580 585 590

Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln

595 600 605

Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro

610 615 620

Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met

625 630 635 640

Arg Gly Leu Pro Ash Glu Val Thr Ile Gly Arg Tyr His Ser Leu Tyr

645 650 655

Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr

660 665 670

Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly

675 680 685

Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val

690 695 700

Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala

705 710 715

<210>83

<211>2160

<212>DNA

<213>血色红假单胞菌(Rhodopseudomonas palustris)

<400>83

atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc 60

gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat 120

ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac 180

gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa 240

ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag 300

cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc 360

gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc 420

ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac 480

ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc 540

gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc 600

gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc 660

ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc 720

gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc 780

ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg 840

gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat 900

ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc 960

cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020

gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080

tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140

ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200

ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260

accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320

ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380

ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440

acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500

gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560

gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620

ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680

ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740

ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800

ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860

ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920

cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980

gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040

gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100

ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160

<210>84

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>84

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc gtttttttcg tccaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>85

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>85

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc gtatttttcg tccaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>86

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>86

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggttttttcg ttcaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>87

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>87

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggttttttcg tgcaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>88

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>88

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggttttttcg tccttctatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>89

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>89

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacgcgt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>90

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>90

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacgggt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>91

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>91

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc ctggttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>92

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>92

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggtttttaag tccaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>93

<211>2190

<212>DNA

<213>人工序列

<220>

<223>根瘤农杆菌突变体.

<400>93

atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60

gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag 120

cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc 180

cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg 240

tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg 300

aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc 360

aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc 420

gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc 480

ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt 540

ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac 600

tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac 660

ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag 720

ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc 780

cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat 840

ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cgccttcatc 900

aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc 960

ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020

gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080

atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140

gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200

gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260

gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320

agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380

accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440

gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500

tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560

gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620

gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680

ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740

cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800

ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860

ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920

ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980

gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040

atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100

atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160

acccgcaagg cgaagaccaa ggccgcgtga 2190

<210>94

<211>1821

<212>DNA

<213>稻(0ryza sativa)

<400>94

atggagtcca tcgccgccgc cacgttcacg ccctcgcgcc tcgccgcccg ccccgccact 60

ccggcggcgg cggcggcccc ggttagagcg agggcggcgg tagcggcagg agggaggagg 120

aggacgagta ggcgcggcgg cgtgaggtgc tccgcgggga agccagaggc aagcgcggtg 180

atcaacggga gcgcggcggc gcgggcggcg gaggaggaca ggaggcgctt cttcgaggcg 240

gcggagcgtg ggagcgggaa gggcaacctg gtgcccatgt gggagtgcat cgtctccgac 300

cacctcaccc ccgtgctcgc ctaccgctgc ctcgtccccg aggacaacat ggagacgccc 360

agcttcctct tcgagtccgt cgagcagggg cccgagggca ccaccaacgt cggtcgctat 420

agcatggtgg gagcccaccc agtgatggag gtcgtggcaa aggagcacaa ggtcacaatc 480

atggaccacg agaagggcaa ggtgacggag caggtcgtgg atgatcctat gcagatcccc 540

aggagcatga tggaaggatg gcacccgcag cagatcgatc agctccccga ttccttcacc 600

ggtggatggg tcgggttctt ttcctatgat acagtccgtt atgttgaaaa gaagaagctg 660

cccttctccg gtgctcccca ggacgatagg aaccttcctg atgttcacct tgggctttat 720

gatgatgttc tcgtcttcga caatgtcgag aagaaagtat atgtcatcca ttgggtaaat 780

cttgatcggc atgcaaccac cgaggatgca ttccaagatg gcaagtcccg gctgaacctg 840

ttgctatcta aagtgcacaa ttcaaatgta cccaagcttt ctccaggatt tgtaaagtta 900

cacactcggc agtttggtac acctttgaac aaatcaacca tgacaagtga tgagtacaag 960

aatgctgtta tgcaggctaa ggagcatatt atggctggtg atattttcca gattgtttta 1020

agccagaggt ttgagaggca gacatacgcc aatccatttg aagtctatcg agctttacga 1080

attgtgaacc caagtccata catggcatat gtacaggcaa gaggctgtgt cctggtagca 1140

tctagtccag aaattcttac tcgtgtgagg aagggtaaaa ttattaaccg tccacttgct 1200

gggactgttc gaaggggcaa gacagagaag gaagatgaaa tgcaagagca acaactacta 1260

agtgatgaaa aacagtgtgc tgaacatatt atgcttgtag atttgggaag gaatgatgtt 1320

ggaaaggtct ccaaacctgg atctgtgaag gtggagaaat taatgaacat tgaacgctac 1380

tcccatgtca tgcacatcag ttccacggtg agtggagagt tggatgatca tctccaaagt 1440

tgggatgccc tgcgagccgc gttgcctgtt ggaacagtta gtggagcacc aaaggtgaaa 1500

gccatggagc tgatagacga gctagaggtc acaagacgag gaccatacag tggcggcctt 1560

ggagggatat catttgacgg ggacatgctt atcgctcttg cactccgcac cattgtgttc 1620

tcaacagcgc caagccacaa cacgatgtac tcatacaaag acaccgagag gcgccgggag 1680

tgggtcgctc accttcaggc tggtgctggc attgtcgctg atagcagccc agacgacgag 1740

caacgtgaat gcgagaacaa ggcagccgct ctggctcgag ccatcgatct tgctgaatca 1800

gctttcgtag acaaggaata g 1821

<210>95

<211>1498

<212>DNA

<213>稻(Oryza sativa)

<400>95

gaattcaaat tttttatata gagtatttct atacatgaat ttttctaact ttttgttttt 60

taaaaaaaat ttgtgtggtg tactgtaata ggaagagaag aaggggagga ggaaggaggg 120

agaagaggga ggagtatatg gggagggggg gatgaactga tcgcccagcg tgatagctgg 180

cgatcgagca cccattagaa gggcccaata aaccctggat aattgtcatt gagtggcacc 240

tttcattgag aagacgttat taggaattgt agaagtggat aattatgcta tctgttgtat 300

tgagtgtcac tgtcaccgat aaagctttgc tggttaatgc attgtatttc tccatcaacg 360

cttcatgata caatggtatt tggacgtgtt tataaaataa tatacgtata atgtgggtgg 420

cctagcggcg gccggttaca catagcagcg atcggtccga tgctagtctt cattcattca 480

ggtatgtatt caggtatcag tgtgtgggtg atagtttttt tttttcgttt ttctagttac 540

gatatctcat atctcatagt tgtgatctta taaacttttt catgtttatc aatataaatt 600

tcgtgttatc tagtcgttaa aagaaccgta taatgtggca aaaaaaatgt ataatgtgtc 660

agagtttgca cgtgtttatc ttgctgcccc gaaacgatta attcagtgat ttggcaacaa 720

caaaatgtcg tggcggataa gcatatccgt cccaaaagga aaaaaagaaa aggaaaaata 780

atctttagaa ataaagccct tactttttcc aagaagcaga ggtaaccgta gctggtattc 840

cgcggctaac tcaatccctt tctctggagt cttggagcgg cacggcggct gcgcacccga 900

cctcgcccac cacctgctcg gcgaaacgcc cggctcggcc gcgacgtgtc ccaccgcacc 960

gcgcgcgcac ccgcgcgccc cgagcccctc gccgcctccg cgcgggcgcc gcacctattt 1020

aaatgcggcc ccgatcccgc attctctcaa ctgcactagt ccccaccaac ggctcggtcc 1080

agtagagttt atcccccacc tatggccagc ctcgtgctct ccctgcgcat cgcccgttcc 1140

acgccgccgc tggggctggg cggggggcga ttccgcggcc gacgaggggc cgtcgcctgc 1200

cgcgccgcca cgttccagca gctcgacgcc gtcggtgagt ctccgtatca aatgtggggg 1260

ggcatgtctt ggtttgcgga ttggtgggtt gatttgaatg tgtgttctcg tggccgcagc 1320

ggtgagggag gaggagtcca agttcaaggc gggggcggcg gagggttgca acatcctgcc 1380

gctcaagcga tgcatcttct ccgaccacct cacgccggtg ctcgcgtacc gctgcctcgt 1440

cagggaggac gaccgcgagg cgcccagctt cctgtttgag tccgtcgagc agggatcc 1498

<210>96

<211>2073

<212>DNA

<213>玉米(Zea mays)

<400>96

gaattccgcc aaatcgggct atagatcaaa cgctgcactg tagggagcgt gaagccagcg 60

gcgaatggaa tccctagccg ccacctccgt gttcgcgccc tcccgcgtcg ccgtcccggc 120

ggcgcgggcc ctggttaggg cggggacggt ggtaccaacc aggcggacga gcagccggag 180

cggaaccagc ggggtgaaat gctctgctgc cgtgacgccg caggcgagcc cagtgattag 240

caggagcgct gcggcggcga aggcggcgga ggaggacaag aggcggttct tcgaggcggc 300

ggcgcggggg agcgggaagg ggaacctggt gcccatgtgg gagtgcatca aggggaacct 360

ggtgcccatg tgggagtgca tcgtgtcgga ccatctcacc cccgtgctcg cctaccgctg 420

cctcgtcccc gaggacaacg tcgacgcccc cagcttcctc ttcgagtccg tcgagcaggg 480

gccccagggc accaccaacg tcggccgcta tagcatggtg ggagcccacc cagtgatgga 540

gattgtggcc aaagaccaca aggttacgat catggaccac gagaagagcc aagtgacaga 600

gcaggtagtg gacgacccga tgcagatccc gaggaccatg atggagggat ggcacccaca 660

gcagatcgac gagctccctg aatccttctc cggtggatgg gttgggttct tttcctatga 720

tacggttagg tatgttgaga agaagaagct accgttctcc agtgctcctc aggacgatag 780

gaaccttcct gatgtgcact tgggactcta tgatgatgtt ctagtcttcg ataatgttga 840

gaagaaagta tatgttatcc attgggtcaa tgtggaccgg catgcatctg ttgaggaagc 900

ataccaagat ggcaggtccc gactaaacat gttgctatct aaagtgcaca attccaatgt 960

ccccacactc tctcctggat ttgtgaagct gcacacacgc aagtttggta cacctttgaa 1020

caagtcgacc atgacaagtg atgagtataa gaatgctgtt ctgcaggcta aggaacatat 1080

tatggctggg gatatcttcc agattgtttt aagccagagg ttcgagagac gaacatatgc 1140

caacccattt gaggtttatc gagcattacg gattgtgaat cctagcccat acatggcgta 1200

tgtacaggca agaggctgtg tattggttgc gtctagtcct gaaattctta cacgagtcag 1260

taaggggaag attattaatc gaccacttgc tggaactgtt cgaaggggca agacagagaa 1320

ggaagatcaa atgcaagagc agcaactgtt aagtgatgaa aaacagtgtg ccgagcacat 1380

aatgcttgtg gacttgggaa ggaatgatgt tggcaaggta tccaaaccag gaggatcagt 1440

gaaggtggag aagttgatta ttgagagata ctcccatgtt atgcacataa gctcaacggt 1500

tagtggacag ttggatgatc atctccagag ttgggatgcc ttgagagctg ccttgcccgt 1560

tggaacagtc agtggtgcac caaaggtgaa ggccatggag ttgattgata agttggaagt 1620

tacgaggcga ggaccatata gtggtggtct aggaggaata tcgtttgatg gtgacatgca 1680

aattgcactt tctctccgca ccatcgtatt ctcaacagcg ccgagccaca acacgatgta 1740

ctcatacaaa gacgcagata ggcgtcggga gtgggtcgct catcttcagg ctggtgcagg 1800

cattgttgcc gacagtagcc cagatgacga acaacgtgaa tgcgagaata aggctgctgc 1860

actagctcgg gccatcgatc ttgcagagtc agcttttgtg aacaaagaat agtgtgctat 1920

ggttatcgtt tagttcttgt tcatgtttct tttacccact ttccgttaaa aaaagatgtc 1980

attagtgggt ggagaaaagc aataagactg ttctctagag aaccgaagaa atatggaaat 2040

tgaggttatg gccggaattc ctgcagcccg ggg 2073

<210>97

<211>504

<212>DNA

<213>小麦(Triticum aestivum)

<400>97

cccaaacagt ggtggcttag gagggatatc atttgatggt gacatgctta tcgctcttgc 60

tctccgcacc attgtgtttt caacagctcc aagccccaat aggatgtact catacaaaag 120

ctcagatagg ccccgagagt gggttgctca tcttcaggct ggtgcgggca ttgttgctga 180

tagtatccca gacgatgagc aaaaagaatt tgagaataag gcggctgccc tagctcgggc 240

aattgatctt gcagagtcgg cttttttaga caaagaatag agtgtctatt aaattatttt 300

ttttagttgt tcatcatttt tcacccagtt cattttggaa agttgttcat cgttttttca 360

ccgagttcat attggggaaa aaaagcaata ccgttttgtt gtcctttgaa atgaataaat 420

ttgagctata ataagatgta ttttgctcat cgggcaaaaa aaaaaaaaaa aatataaaaa 480

aaaaaaaaaa aaaaaaaaaa aata 504

<210>98

<211>2161

<212>DNA

<213>烟草(Nicotiana tabacum)

<400>98

gtcaaaaatc cccatttcac cgtttcctcg tttctcctcc tcactaattt tgtctctttc 60

tcttggtttg ctattgtgct cttgtaggaa tgcagtcgtt acctatctca taccggttgt 120

ttccggccac ccaccggaaa gttctgccat tcgccgtcat ttctagccgg agctcaactt 180

ctgcacttgc gcttcgtgtc cgtacactac aatgccgctg ccttcactct tcatctctag 240

ttatggatga ggacaggttc attgaagctt ctaaaagcgg gaacttgatt ccgctgcaca 300

aaaccatttt ttctgatcat ctgactccgg tgctggctta ccggtgtttg gtgaaagaag 360

acgaccgtga agctccaagc tttctctttg aatccgttga acctggtttt cgaggttcta 420

gtgttggtcg ctacagcgtg gtgggggctc aaccatctat ggaaattgtg gctaaggaac 480

acaatgtgac tatattggac caccacactg gaaaattgac ccagaagact gtccaagatc 540

ccatgacgat tccgaggagt atttctgagg gatggaagcc cagactcatt gatgaacttc 600

ctgatacctt ttgtggtgga tgggttggtt atttctcata tgacacagtt cggtatgtag 660

agaacaggaa gttgccattc ctaagggctc cagaggatga ccggaacctt gcagatattc 720

aattaggact atacgaagat gtcattgtgt ttgatcatgt tgagaagaaa gcacatgtga 780

ttcactgggt gcagttggat cagtattcat ctcttcctga ggcatatctt gatgggaaga 840

aacgcttgga aatattagtg tctagagtac aaggaattga gtctccaagg ttatctcccg 900

gttctgtgga tttctgtact catgcttttg gaccttcatt aaccaaggga aacatgacaa 960

gtgaggagta caagaatgct gtcttacaag caaaggagca cattgctgca ggagacatat 1020

ttcaaatcgt tttaagtcaa cgctttgaga gaagaacatt tgctgaccca tttgaagtgt 1080

acagagcatt aagaattgtg aatccaagcc catatatgac ttacatacaa gccagaggct 1140

gtattttagt tgcatcgagc ccagaaattt tgacacgtgt gaagaagaga agaattgtta 1200

atcgaccact ggctgggaca agcagaagag ggaagacacc tgatgaggat gtgatgttgg 1260

aaatgcagat gttaaaagat gagaaacaac gcgcagagca catcatgctg gttgatttag 1320

gacgaaatga tgtaggaaag gtgtcaaaac ctggttctgt gaatgtcgaa aagctcatga 1380

gcgttgagcg gtattcccat gtgatgcaca taagctccac ggtctctgga gagttgcttg 1440

atcatttaac ctgttgggat gcactacgtg ctgcattgcc tgttgggacc gtcagtggag 1500

caccaaaggt aaaggccatg gagttgattg atcagctaga agtagctcgg agagggcctt 1560

acagtggtgg gtttggaggc atttcctttt caggtgacat ggacatcgca ctagctctaa 1620

ggacgatggt attcctcaat ggagctcgtt atgacacaat gtattcatat acagatgcca 1680

gcaagcgtca ggaatgggtt gctcatctcc aatccggggc tggaattgtg gctgatagta 1740

atcctgatga ggaacagata gaatgcgaga ataaagtagc cggtctgtgc cgagccattg 1800

acttggccga gtcagctttt gtaaagggaa gacacaaacc gtcagtcaag ataaatggtt 1860

ctgtgccaaa tctattttca agggtacaac gtcaaacatc tgttatgtcg aaggacagag 1920

tacatgagaa aagaaactag cgaatatgaa gatgtacata aattctaaag tggttttctt 1980

gttcagttta atcttttact ggattgagac tgtagttgct gaagatagtt gtttagaatg 2040

accttcattt tggtgttcct gaaaggacag tgcacatata tagcaaattg atcaaatgtt 2100

taatccttgt atgcgggtga gaatcaatgc catcagcaat ttggaaaaaa aaaaaaaaaa 2160

a 2161

<210>99

<211>606

<212>PRT

<213>稻(Oryza sativa)

<400>99

Met Glu Ser Ile Ala Ala Ala Thr Phe Thr Pro Ser Arg Leu Ala Ala

1 5 10 15

Arg Pro Ala Thr Pro Ala Ala Ala Ala Ala Pro Val Arg Ala Arg Ala

20 25 30

Ala Val Ala Ala Gly Gly Arg Arg Arg Thr Ser Arg Arg Gly Gly Val

35 40 45

Arg Cys Ser Ala Gly Lys Pro Glu Ala Ser Ala Val Ile Asn Gly Ser

50 55 60

Ala Ala Ala Arg Ala Ala Glu Glu Asp Arg Arg Arg Phe Phe Glu Ala

65 70 75 80

Ala Glu Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys

85 90 95

Ile Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val

100 105 110

Pro Glu Asp Asn Met Glu Thr Pro Ser Phe Leu Phe Glu Ser Val Glu

115 120 125

Gln Gly Pro Glu Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly

130 135 140

Ala His Pro Val Met Glu Val Val Ala Lys Glu His Lys Val Thr Ile

145 150 155 160

Met Asp His Glu Lys Gly Lys Val Thr Glu Gln Val Val Asp Asp Pro

165 170 175

Met Gln Ile Pro Arg Ser Met Met Glu Gly Trp His Pro Gln Gln Ile

180 185 190

Asp Gln Leu Pro Asp Ser Phe Thr Gly Gly Trp Val Gly Phe Phe Ser

195 200 205

Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Gly

210 215 220

Ala Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr

225 230 235 240

Asp Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile

245 250 255

His Trp Val Asn Leu Asp Arg His Ala Thr Thr Glu Asp Ala Phe Gln

260 265 270

Asp Gly Lys Ser Arg Leu Ash Leu Leu Leu Ser Lys Val His Asn Ser

275 280 285

Asn Val Pro Lys Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Gln

290 295 300

Phe Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys

305 310 315 320

Asn Ala Val Met Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe

325 330 335

Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Gln Thr Tyr Ala Asn Pro

340 345 350

Phe Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met

355 360 365

Ala Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu

370 375 380

Ile Leu Thr Arg Val Arg Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala

385 390 395 400

Gly Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Glu Met Gln Glu

405 410 415

Gln Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu

420 425 430

Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser

435 440 445

Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met

450 455 460

His Ile Ser Ser Thr Val Ser Gly Glu Leu Asp Asp His Leu Gln Ser

465 470 475 480

Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala

485 490 495

Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val Thr Arg

500 505 510

Arg Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp

515 520 525

Met Leu Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro

530 535 540

Ser His Asn Thr Met Tyr Ser Tyr Lys Asp Thr Glu Arg Arg Arg Glu

545 550 555 560

Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser

565 570 575

Pro Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala

580 585 590

Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu

595 600 605

<210>100

<211>67

<212>PRT

<213>稻(Oryza sativa)

<400>100

Met Cys Val Leu Val Ala Ala Ala Val Arg Glu Glu Glu Ser Lys Phe

1 5 10 15

Lys Ala Gly Ala Ala Glu Gly Cys Asn Ile Leu Pro Leu Lys Arg Cys

20 25 30

Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val

35 40 45

Arg Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu Ser Val Glu

50 55 60

Gln Gly Ser

65

<210>101

<211>525

<212>PRT

<213>玉米(Zea mays)

<400>101

Met Trp Glu Cys Ile Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile

1 5 10 15

Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro

20 25 30

Glu Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln

35 40 45

Gly Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala

50 55 60

His Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met

65 70 75 80

Asp His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met

85 90 95

Gln Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp

100 105 110

Glu Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr

115 120 125

Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala

130 135 140

Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp

145 150 155 160

Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His

165 170 175

Trp Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp

180 185 190

Gly Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn

195 200 205

Val Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe

210 215 220

Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn

225 230 235 240

Ala Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln

245 250 255

Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe

260 265 270

Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala

275 280 285

Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile

290 295 300

Leu Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly

305 310 315 320

Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln

325 330 335

Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val

340 345 350

Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Gly Ser

355 360 365

Val Lys Val Glu Lys Leu Ile Ile Glu Arg Tyr Ser His Val Met His

370 375 380

Ile Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp

385 390 395 400

Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro

405 410 415

Lys Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg

420 425 430

Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met

435 440 445

Gln Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser

450 455 460

His Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp

465 470 475 480

Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro

485 490 495

Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg

500 505 510

Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asn Lys Glu

515 520 525

<210>102

<211>92

<212>PRT

<213>小麦(Triticum aestivum)

<400>102

Pro Asn Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Leu

1 5 10 15

Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser Pro

20 25 30

Asn Arg Met Tyr Ser Tyr Lys Ser Ser Asp Arg Pro Arg Glu Trp Val

35 40 45

Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ile Pro Asp

50 55 60

Asp Glu Gln Lys Glu Phe Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala

65 70 75 80

Ile Asp Leu Ala Glu Ser Ala Phe Leu Asp Lys Glu

85 90

<210>103

<211>616

<212>PRT

<213>烟草(Nicotiana tabacum)

<400>103

Met Gln Ser Leu Pro Ile Ser Tyr Arg Leu Phe Pro Ala Thr His Arg

1 5 10 15

Lys Val Leu Pro Phe Ala Val Ile Ser Ser Arg Ser Ser Thr Ser Ala

20 25 30

Leu Ala Leu Arg Val Arg Thr Leu Gln Cys Arg Cys Leu His Ser Ser

35 40 45

Ser Leu Val Met Asp Glu Asp Arg Phe Ile Glu Ala Ser Lys Ser Gly

50 55 60

Asn Leu Ile Pro Leu His Lys Thr Ile Phe Ser Asp His Leu Thr Pro

65 70 75 80

Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro

85 90 95

Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Phe Arg Gly Ser Ser Val

100 105 110

Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Ser Met Glu Ile Val Ala

115 120 125

Lys Glu His Asn Val Thr Ile Leu Asp His His Thr Gly Lys Leu Thr

130 135 140

Gln Lys Thr Val Gln Asp Pro Met Thr Ile Pro Arg Ser Ile Ser Glu

145 150 155 160

Gly Trp Lys Pro Arg Leu Ile Asp Glu Leu Pro Asp Thr Phe Cys Gly

165 170 175

Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Asn

180 185 190

Arg Lys Leu Pro Phe Leu Arg Ala Pro Glu Asp Asp Arg Asn Leu Ala

195 200 205

Asp Ile Gln Leu Gly Leu Tyr Glu Asp Val Ile Val Phe Asp His Val

210 215 220

Glu Lys Lys Ala His Val Ile His Trp Val Gln Leu Asp Gln Tyr Ser

225 230 235 240

Ser Leu Pro Glu Ala Tyr Leu Asp Gly Lys Lys Arg Leu Glu Ile Leu

245 250 255

Val Ser Arg Val Gln Gly Ile Glu Ser Pro Arg Leu Ser Pro Gly Ser

260 265 270

Val Asp Phe Cys Thr His Ala Phe Gly Pro Ser Leu Thr Lys Gly Asn

275 280 285

Met Thr Ser Glu Glu Tyr Lys Asn Ala Val Leu Gln Ala Lys Glu His

290 295 300

Ile Ala Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu

305 310 315 320

Arg Arg Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Ile

325 330 335

Val Asn Pro Ser Pro Tyr Met Thr Tyr Ile Gln Ala Arg Gly Cys Ile

340 345 350

Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Arg Arg

355 360 365

Ile Val Asn Arg Pro Leu Ala Gly Thr Ser Arg Arg Gly Lys Thr Pro

370 375 380

Asp Glu Asp Val Met Leu Glu Met Gln Met Leu Lys Asp Glu Lys Gln

385 390 395 400

Arg Ala Glu His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly

405 410 415

Lys Val Ser Lys Pro Gly Ser Val Asn Val Glu Lys Leu Met Ser Val

420 425 430

Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val Ser Gly Glu

435 440 445

Leu Leu Asp His Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro

450 455 460

Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile

465 470 475 480

Asp Gln Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly

485 490 495

Gly Ile Ser Phe Ser Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr

500 505 510

Met Val Phe Leu Asn Gly Ala Arg Tyr Asp Thr Met Tyr Ser Tyr Thr

515 520 525

Asp Ala Ser Lys Arg Gln Glu Trp Val Ala His Leu Gln Ser Gly Ala

530 535 540

Gly Ile Val Ala Asp Ser Asn Pro Asp Glu Glu Gln Ile Glu Cys Glu

545 550 555 560

Asn Lys Val Ala Gly Leu Cys Arg Ala Ile Asp Leu Ala Glu Ser Ala

565 570 575

Phe Val Lys Gly Arg His Lys Pro Ser Val Lys Ile Asn Gly Ser Val

580 585 590

Pro Asn Leu Phe Ser Arg Val Gln Arg Gln Thr Ser Val Met Ser Lys

595 600 605

Asp Arg Val His Glu Lys Arg Asn

610 615

<210>104

<211>1776

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<220>

<221>misc_feature

<223>α亚基.

<400>104

atgcaggcat ccatgtcggt tacctcgacg aactccacat taccaatgcc agtgcaaagc 60

agccttggat tctctcaccg cttccttcct tcatctcatc ggttttctca acttccgatc 120

acccgctttt ctcccgctcc tacttcactc aaatgcaggg gctctctttc aagctttcca 180

cttgttaatg atgaaaagaa gtttgtggag gcggccaaaa aagcaaattt agtccccctt 240

tatcgttgca ttttctctga tcaactgact ccagtgcttg cataccggtg tttggttaaa 300

gaagatgata gagaggctcc aagttttctc tttgagtcag tggagcctgg ttctcgggtt 360

tctagtgttg gtcgatatag cgtggttgga gctcaaccga caatggaaat tgtggcaaaa 420

gaaaacaaag ttatgattat ggatcatgag gcagggaatt tgactgagga ggtcgttgag 480

gatccgatgt gtattcccaa gagaatctca gagacttgga aaccccgact tgttgaagat 540

cttcctgatg cgttttgtgg tggatgggtt ggttatttct cctatgatac agttcgttat 600

gtggagaaga aaaagcttcc gttcactaag gcaccacgtg atgacagaaa cctgccagat 660

atacatctag gactctacaa cgacgtgatt gtatttgatc atgtggaaaa gaaagcatat 720

ataattcact gggtgaggct agataaacac tcgtctgttg agaaagctta taatgaagga 780

gttgaacacc tagagaaatt ggtagctaga gtacaagatg ttgagctacc aaagctatct 840

ccaggctctg tagcattaca aacccatcac tttggccctt ctttaaagaa ctcaaatatg 900

gaaaaggaag agttcaagaa agctgtactg aaagcgaaag agcatattct ggcaggggat 960

attttccaga ttgtattaag ccaacgtttt gaacggagaa catttgctga cccctttgaa 1020

atatatagag ctttgcgagt tgtgaatcca agtccatata tggcctactt gcaagctaga 1080

ggaagtattc tagttgcttc aagtcccgaa attcttacca gggtaaagaa gaataagatt 1140

gtgaataggc cattggctgg aacaacaagg agaggaaaga ctcaggctga agatgagctg 1200

gcagaaaagc tattgctaag taatgaaaag gaatgtgcag aacacatcat gcttgttgat 1260

ttgggtcgca atgatgttgg aaaggtctcc aaatatggtt ctgtaaaggt ggagaagctg 1320

atgaatattg aacgatattc ccatgtgatg cacataagct ccacggttac tggtgagttg 1380

caggatcatc tcactagttg ggatgtcctc cgtgctgcac ttcccgttgg aactgttagt 1440

ggagcaccaa aggtgaaggc gatggagcta atcgatgagt tagaggtgtc aagacgaggt 1500

ccttatagcg gaggatttgg gggcatttcc ttcactgggg atatggatat tgcgttggct 1560

ctcaggacca tggtattccc tacaggtagc cgctatgaca caatgtactc atacaaaggt 1620

tccagcagac gccaagaatg ggtagcttat cttcaagccg gcgctggtgt agttgcagac 1680

agtgatcctg atgccgagca cctcgaatgt caaaacaaag ctgctggcct tgctcgttcc 1740

attgacctag cggaggctgc attcgttcat aaatga 1776

<210>105

<211>843

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<220>

<221>misc_feature

<223>β亚基.

<400>105

atggcagcta atattataac ccaatcatct ctgcttcagc caaaacctgc actttctgct 60

aaaacccttc aaatcccatc tctgcatcgc ttatccggcc tccctcctcc atcaagggtt 120

ggcttttttc tggaaaagaa aacggggatt gttggaaaag ctccattaaa atcggctgta 180

tcggactcaa cctcgtcagt tttggagaac aagaaaaaca gcaagaatcc cattgtcgtc 240

attgacaatt acgacagttt cacttacaat ctttgccagt atattggaga gcttggatgt 300

tacttcgagg tttttcgaaa tgacgaatta actgtagaag acttaaaaat gaaaaaccct 360

aggggagtgc ttatctctcc tggtccagga acaccccaag attccggaat atcactgcag 420

actgttttgg aacttggacc tactgtacct ttgtttggtg tttgtatggg tttgcagtgc 480

attggtgagg cttttggagg aaagatagtg cgttctccct atggtgttat gcatggcaaa 540

agttcccctg tatattatga cgaaaagggg gaagacggtt tgttatctgg attgtcaaac 600

cctttcaatg ctggcagata tcatagcctc gtgattgaaa aggacagttt ccctgaggaa 660

gcacttgagg ttactgcttg gacagaagat ggactgataa tggctgctag gcacaaagtt 720

tataagcatc tgcagggtgt tcaattccat ccagagagca tcataacctc tgaaggaaaa 780

acaattgttc ggaatttcat caaactaatc gagagaaagg aggtggcagg atccaagaat 840

tag 843

<210>106

<211>1704

<212>DNA

<213>大豆(Glycine max)

<220>

<221>misc_feature

<223>α亚基.

<400>106

atggcgactg ttccgcaccc attatccctc gcaagtgtag gttttgctaa ccgaacctcc 60

tccatctcca gatccactct caaatgctgc gctcaatctc cttctccttc actagttgac 120

aacgcccaga agtttctcga agcttccaag aaggggaacg tcattcctct cttccgctgc 180

atattttccg atcacctcac tccggtgctt gcgtaccggt gcctggttaa ggaggacgag 240

agagatgctc cgagttttct ctttgaatcg gtcgagccag gccaaatttc tagcatcgga 300

cggtacagtg tggttggagc acagccgtgt atggaaattg tggcgaaaga gaacgtggtt 360

actattatgg accacgtgga agggcgcagg agtgaggaaa ttgtagagga tcctctggtg 420

attcctcgta ggatcatgga gaagtggacg cctcaactct tagatgaact tcctgaagcg 480

ttttgtggtg gttgggtagg gtatttctct tatgatacaa tgcgctatgt agaaaagaag 540

aaacttccat tttctaatgc cccagtagat gacagaaacc ttcctgatgt tcatctgggc 600

ctttatgaca gtgtgattgt gtttgatcat gttgaaaaga aagcatatgt gattcattgg 660

gttcgggtgg atcgatattc ttcagctgag gaggccttcg aagatggaag gaaccggctg 720

gaaactctag tatctcgggt gcatgatata attaccccaa ggctgcctac aggttcgata 780

aagttataca ctcgtctctt tggtcctaaa ctggagatgt caaacatgac aaatgaggag 840

tataagaggg cagtattgaa ggctaaagag cacatacggg ctggtgatat ttttcaaatt 900

gtactaagtc aacgttttga acagagaact tttgcagacc catttgaaat ctacagagca 960

ttgaggattg ttaatcctag tccatatatg acttatttac aggccagagg aagtattttg 1020

gttgcttcaa gtccagaaat tcttacacgg gtgaagaaga gaaagatcac caatcggccc 1080

cttgctggta ctgttagaag aggaaaaaca ccaaaagaag atatcatgtt ggagaaacaa 1140

cttttgaatg atgaaaagca atgtgcagag cacgtaatgc tagttgattt ggggagaaat 1200

gatgttggaa aggtctccaa accgggttct gttcaagttg aaaagcttat gaatattgag 1260

cgctattccc atgttatgca catcagctca acagtcacag gggagttatt agatcactta 1320

acaagctggg atgcattgcg tgctgcttta cctgttggta cagttagcgg agcaccgaag 1380

gtcaaagcca tgcagttgat tgatgagttg gaagtcgcaa gaagggggcc ctatagtggg 1440

ggatttggag gtatatcatt caatggcgat atggacatag cccttgctct gaggaccata 1500

gttttcccta caaatgctcg ttatgacaca atgtactcct acaaggataa gaacaaacgc 1560

agagaatggg ttgcccatct ccaggctgga gcgggaattg tggctgacag tgatcctgct 1620

gatgaacaaa gagagtgcga gaacaaagct gcagctcttg ctcgtgccat tgatcttgca 1680

gaatcttcat ttgttgataa ataa 1704

<210>107

<21l>837

<212>DNA

<213>大豆(Glycine max)

<220>

<221>misc_feature

<223>β亚基.

<400>107

atggctgcca cattcttctc tcacttgtcg cttcttcaat ccaacaacaa cccttctctc 60

tctcacacac cctctcgctt ccctcattct ctcaccaacc gtgtcaaacc ctccctcggt 120

gtggtatctg tggccaaaag ggtaagtgga gtggtgccaa aggccaattt gaatgccttg 180

gaggccaatt cgggtttccc catttcggct aagaagtcca acaacaaccc cattgttgtt 240

attgacaact atgacagttt cacctataat ctttgccagt atatggggga gttagggttt 300

cactttgagg tctaccgcaa tgatgagttg acagtggagg agttaagaag gaaaaatccc 360

agaggagtgc tgatatcacc tgggccagga gaacctcaag attcaggcat atctttgcaa 420

acggttttgg aacttggacc aactgtgcca ttgtttggtg tgtgcatggg tttgcaatgc 480

attggagagg cttttggagg gaagattgtt cgttctcctc atggtgttat gcatggaaaa 540

agctctatgg tttactatga tgagaaagga gaagatggat tacttgctgg actatcaaat 600

cctttcttgg ctggtagata tcacagcctt gtaattgaaa aagagagctt tcctcatgat 660

gaacttgagg caacagcatg gacagaagat ggtcttataa tggctgctcg tcataagaaa 720

tataagcatc tacagggtgt tcagtttcat ccagagagca tcataacccc agaaggcaag 780

acaattgtcc gtaattttgt caagcttatc gagaaaaggg aggctggtgg ctcttga 837

<210>108

<211>591

<212>PRT

<213>陆地棉(Gossypium hirsutum)

<220>

<221>MISC_FEATURE

<223>α亚基.

<400>108

Met Gln Ala Ser Met Ser Val Thr Ser Thr Asn Ser Thr Leu Pro Met

1 5 10 15

Pro Val Gln Ser Ser Leu Gly Phe Ser His Arg Phe Leu Pro Ser Ser

20 25 30

His Arg Phe Ser Gln Leu Pro Ile Thr Arg Phe Ser Pro Ala Pro Thr

35 40 45

Ser Leu Lys Cys Arg Gly Ser Leu Ser Ser Phe Pro Leu Val Asn Asp

50 55 60

Glu Lys Lys Phe Val Glu Ala Ala Lys Lys Ala Asn Leu Val Pro Leu

65 70 75 80

Tyr Arg Cys Ile Phe Ser Asp Gln Leu Thr Pro Val Leu Ala Tyr Arg

85 90 95

Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu

100 105 110

Ser Val Glu Pro Gly Ser Arg Val Ser Ser Val Gly Arg Tyr Ser Val

115 120 125

Val Gly Ala Gln Pro Thr Met Glu Ile Val Ala Lys Glu Asn Lys Val

130 135 140

Met Ile Met Asp His Glu Ala Gly Asn Leu Thr Glu Glu Val Val Glu

145 150 155 160

Asp Pro Met Cys Ile Pro Lys Arg Ile Ser Glu Thr Trp Lys Pro Arg

165 170 175

Leu Val Glu Asp Leu Pro Asp Ala Phe Cys Gly Gly Trp Val Gly Tyr

180 185 190

Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe

195 200 205

Thr Lys Ala Pro Arg Asp Asp Arg Asn Leu Pro Asp Ile His Leu Gly

210 215 220

Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala Tyr

225 230 235 240

Ile Ile His Trp Val Arg Leu Asp Lys His Ser Ser Val Glu Lys Ala

245 250 255

Tyr Asn Glu Gly Val Glu His Leu Glu Lys Leu Val Ala Arg Val Gln

260 265 270

Asp Val Glu Leu Pro Lys Leu Ser Pro Gly Ser Val Ala Leu Gln Thr

275 280 285

His His Phe Gly Pro Ser Leu Lys Asn Ser Asn Met Glu Lys Glu Glu

290 295 300

Phe Lys Lys Ala Val Leu Lys Ala Lys Glu His Ile Leu Ala Gly Asp

305 310 315 320

Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe Ala

325 330 335

Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Val Val Asn Pro Ser Pro

340 345 350

Tyr Met Ala Tyr Leu Gln Ala Arg Gly Ser Ile Leu Val Ala Ser Ser

355 360 365

Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val Asn Arg Pro

370 375 380

Leu Ala Gly Thr Thr Arg Arg Gly Lys Thr Gln Ala Glu Asp Glu Leu

385 390 395 400

Ala Glu Lys Leu Leu Leu Ser Asn Glu Lys Glu Cys Ala Glu His Ile

405 410 415

Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Tyr

420 425 430

Gly Ser Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His

435 440 445

Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln Asp His Leu

450 455 460

Thr Ser Trp Asp Val Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser

465 470 475 480

Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val

485 490 495

Ser Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe Thr

500 505 510

Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro Thr

515 520 525

Gly Ser Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Gly Ser Ser Arg Arg

530 535 540

Gln Glu Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Val Val Ala Asp

545 550 555 560

Ser Asp Pro Asp Ala Glu His Leu Glu Cys Gln Asn Lys Ala Ala Gly

565 570 575

Leu Ala Arg Ser Ile Asp Leu Ala Glu Ala Ala Phe Val His Lys

580 585 590

<210>109

<211>280

<212>PRT

<213>陆地棉(Gossypium hirsutum)

<220>

<221>MISC_FEATURE

<223>β亚基.

<400>109

Met Ala Ala Asn Ile Ile Thr Gln Ser Ser Leu Leu Gln Pro Lys Pro

1 5 10 15

Ala Leu Ser Ala Lys Thr Leu Gln Ile Pro Ser Leu His Arg Leu Ser

20 25 30

Gly Leu Pro Pro Pro Ser Arg Val Gly Phe Phe Leu Glu Lys Lys Thr

35 40 45

Gly Ile Val Gly Lys Ala Pro Leu Lys Ser Ala Val Ser Asp Ser Thr

50 55 60

Ser Ser Val Leu Glu Asn Lys Lys Asn Ser Lys Asn Pro Ile Val Val

65 70 75 80

Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys Gln Tyr Ile Gly

85 90 95

Glu Leu Gly Cys Tyr Phe Glu Val Phe Arg Asn Asp Glu Leu Thr Val

100 105 110

Glu Asp Leu Lys Met Lys Asn Pro Arg Gly Val Leu Ile Ser Pro Gly

115 120 125

Pro Gly Thr Pro Gln Asp Ser Gly Ile Ser Leu Gln Thr Val Leu Glu

130 135 140

Leu Gly Pro Thr Val Pro Leu Phe Gly Val Cys Met Gly Leu Gln Cys

145 150 155 160

Ile Gly Glu Ala Phe Gly Gly Lys Ile Val Arg Ser Pro Tyr Gly Val

165 170 175

Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu Lys Gly Glu Asp

180 185 190

Gly Leu Leu Ser Gly Leu Ser Asn Pro Phe Asn Ala Gly Arg Tyr His

195 200 205

Ser Leu Val Ile Glu Lys Asp Ser Phe Pro Glu Glu Ala Leu Glu Val

210 215 220

Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg His Lys Val

225 230 235 240

Tyr Lys His Leu Gln Gly Val Gln Phe His Pro Glu Ser Ile Ile Thr

245 250 255

Ser Glu Gly Lys Thr Ile Val Arg Asn Phe Ile Lys Leu Ile Glu Arg

260 265 270

Lys Glu Val Ala Gly Ser Lys Asn

275 280

<210>110

<211>567

<212>PRT

<213>大豆(Glycine max)

<220>

<221>MISC_FEATURE

<223>α亚基.

<400>110

Met Ala Thr Val Pro His Pro Leu Ser Leu Ala Ser Val Gly Phe Ala

1 5 10 15

Asn Arg Thr Ser Ser Ile Ser Arg Ser Thr Leu Lys Cys Cys Ala Gln

20 25 30

Ser Pro Ser Pro Ser Leu Val Asp Asn Ala Gln Lys Phe Leu Glu Ala

35 40 45

Ser Lys Lys Gly Asn Val Ile Pro Leu Phe Arg Cys Ile Phe Ser Asp

50 55 60

His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Glu

65 70 75 80

Arg Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Gln Ile

85 90 95

Ser Ser Ile Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Cys Met Glu

100 105 110

Ile Val Ala Lys Glu Asn Val Val Thr Ile Met Asp His Val Glu Gly

115 120 125

Arg Arg Ser Glu Glu Ile Val Glu Asp Pro Leu Val Ile Pro Arg Arg

130 135 140

Ile Met Glu Lys Trp Thr Pro Gln Leu Leu Asp Glu Leu Pro Glu Ala

145 150 155 160

Phe Cys Gly Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Met Arg Tyr

165 170 175

Val Glu Lys Lys Lys Leu Pro Phe Ser Asn Ala Pro Val Asp Asp Arg

180 185 190

Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Ser Val Ile Val Phe

195 200 205

Asp His Val Glu Lys Lys Ala Tyr Val Ile His Trp Val Arg Val Asp

210 215 220

Arg Tyr Ser Ser Ala Glu Glu Ala Phe Glu Asp Gly Arg Asn Arg Leu

225 230 235 240

Glu Thr Leu Val Ser Arg Val His Asp Ile Ile Thr Pro Arg Leu Pro

245 250 255

Thr Gly Ser Ile Lys Leu Tyr Thr Arg Leu Phe Gly Pro Lys Leu Glu

260 265 270

Met Ser Asn Met Thr Asn Glu Glu Tyr Lys Arg Ala Val Leu Lys Ala

275 280 285

Lys Glu His Ile Arg Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln

290 295 300

Arg Phe Glu Gln Arg Thr Phe Ala Asp Pro Phe Glu Ile Tyr Arg Ala

305 310 315 320

Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Thr Tyr Leu Gln Ala Arg

325 330 335

Gly Ser Ile Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys

340 345 350

Lys Arg Lys Ile Thr Asn Arg Pro Leu Ala Gly Thr Val Arg Arg Gly

355 360 365

Lys Thr Pro Lys Glu Asp Ile Met Leu Glu Lys Gln Leu Leu Asn Asp

370 375 380

Glu Lys Gln Cys Ala Glu His Val Met Leu Val Asp Leu Gly Arg Asn

385 390 395 400

Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Gln Val Glu Lys Leu

405 410 415

Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val

420 425 430

Thr Gly Glu Leu Leu Asp His Leu Thr Ser Trp Asp Ala Leu Arg Ala

435 440 445

Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met

450 455 460

Gln Leu Ile Asp Glu Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly

465 470 475 480

Gly Phe Gly Gly Ile Ser Phe Asn Gly Asp Met Asp Ile Ala Leu Ala

485 490 495

Leu Arg Thr Ile Val Phe Pro Thr Asn Ala Arg Tyr Asp Thr Met Tyr

500 505 510

Ser Tyr Lys Asp Lys Asn Lys Arg Arg Glu Trp Val Ala His Leu Gln

515 520 525

Ala Gly Ala Gly Ile Val Ala Asp Ser Asp Pro Ala Asp Glu Gln Arg

530 535 540

Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala Ile Asp Leu Ala

545 550 555 560

Glu Ser Ser Phe Val Asp Lys

565

<210>111

<211>278

<212>PRT

<213>大豆(Glycine max)

<220>

<221>MISC_FEATURE

<223>β亚基.

<400>111

Met Ala Ala Thr Phe Phe Ser His Leu Ser Leu Leu Gln Ser Asn Asn

1 5 10 15

Asn Pro Ser Leu Ser His Thr Pro Ser Arg Phe Pro His Ser Leu Thr

20 25 30

Asn Arg Val Lys Pro Ser Leu Gly Val Val Ser Val Ala Lys Arg Val

35 40 45

Ser Gly Val Val Pro Lys Ala Asn Leu Asn Ala Leu Glu Ala Asn Ser

50 55 60

Gly Phe Pro Ile Ser Ala Lys Lys Ser Asn Asn Asn Pro Ile Val Val

65 70 75 80

Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly

85 90 95

Glu Leu Gly Phe His Phe Glu Val Tyr Arg Asn Asp Glu Leu Thr Val

100 105 110

Glu Glu Leu Arg Arg Lys Asn Pro Arg Gly Val Leu Ile Ser Pro Gly

115 120 125

Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln Thr Val Leu Glu

130 135 140

Leu Gly Pro Thr Val Pro Leu Phe Gly Val Cys Met Gly Leu Gln Cys

145 150 155 160

Ile Gly Glu Ala Phe Gly Gly Lys Ile Val Arg Ser Pro His Gly Val

165 170 175

Met His Gly Lys Ser Ser Met Val Tyr Tyr Asp Glu Lys Gly Glu Asp

180 185 190

Gly Leu Leu Ala Gly Leu Ser Asn Pro Phe Leu Ala Gly Arg Tyr His

195 200 205

Ser Leu Val Ile Glu Lys Glu Ser Phe Pro His Asp Glu Leu Glu Ala

210 215 220

Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg His Lys Lys

225 230 235 240

Tyr Lys His Leu Gln Gly Val Gln Phe His Pro Glu Ser Ile Ile Thr

245 250 255

Pro Glu Gly Lys Thr Ile Val Arg Asn Phe Val Lys Leu Ile Glu Lys

260 265 270

Arg Glu Ala Gly Gly Ser

275

<210>112

<211>2210

<212>DNA

<213>大豆(Glycine max)

<220>

<221>3′UTR

<222>(1919)..(2210)

<223>

<220>

<221>misc_feature

<223>α亚基.

<220>

<221>5′UTR

<222>(1)..(214)

<223>

<400>112

aaagaaatga cctgaagtct ctatatattc caggtaacga agaccttagc aacccaatga 60

acgcgtcccc atgaacggca cgtgtagcgg agtactaggc cgccgttaca cgctactgct 120

gtccgtcgtc accgtttgaa ttacccaccg ctactttgtc gtcattcttc ttcttcttcc 180

cttttcattg accttttcct tccttcgtcc tccaatggcg actgttccgc acccattatc 240

cctcgcaagt gtaggttttg ctaaccgaac ctcctccatc tccagatcca ctctcaaatg 300

ctgcgctcaa tctccttctc cttcactagt tgacaacgcc cagaagtttc tcgaagcttc 360

caagaagggg aacgtcattc ctctcttccg ctgcatattt tccgatcacc tcactccggt 420

gcttgcgtac cggtgcctgg ttaaggagga cgagagagat gctccgagtt ttctctttga 480

atcggtcgag ccaggccaaa tttctagcat cggacggtac agtgtggttg gagcacagcc 540

gtgtatggaa attgtggcga aagagaacgt ggttactatt atggaccacg tggaagggcg 600

caggagtgag gaaattgtag aggatcctct ggtgattcct cgtaggatca tggagaagtg 660

gacgcctcaa ctcttagatg aacttcctga agcgttttgt ggtggttggg tagggtattt 720

ctcttatgat acaatgcgct atgtagaaaa gaagaaactt ccattttcta atgccccagt 780

agatgacaga aaccttcctg atgttcatct gggcctttat gacagtgtga ttgtgtttga 840

tcatgttgaa aagaaagcat atgtgattca ttgggttcgg gtggatcgat attcttcagc 900

tgaggaggcc ttcgaagatg gaaggaaccg gctggaaact ctagtatctc gggtgcatga 960

tataattacc ccaaggctgc ctacaggttc gataaagtta tacactcgtc tctttggtcc 1020

taaactggag atgtcaaaca tgacaaatga ggagtataag agggcagtat tgaaggctaa 1080

agagcacata cgggctggtg atatttttca aattgtacta agtcaacgtt ttgaacagag 1140

aacttttgca gacccatttg aaatctacag agcattgagg attgttaatc ctagtccata 1200

tatgacttat ttacaggcca gaggaagtat tttggttgct tcaagtccag aaattcttac 1260

acgggtgaag aagagaaaga tcaccaatcg gccccttgct ggtactgtta gaagaggaaa 1320

aacaccaaaa gaagatatca tgttggagaa acaacttttg aatgatgaaa agcaatgtgc 1380

agagcacgta atgctagttg atttggggag aaatgatgtt ggaaaggtct ccaaaccggg 1440

ttctgttcaa gttgaaaagc ttatgaatat tgagcgctat tcccatgtta tgcacatcag 1500

ctcaacagtc acaggggagt tattagatca cttaacaagc tgggatgcat tgcgtgctgc 1560

tttacctgtt ggtacagtta gcggagcacc gaaggtcaaa gccatgcagt tgattgatga 1620

gttggaagtc gcaagaaggg ggccctatag tgggggattt ggaggtatat cattcaatgg 1680

cgatatggac atagcccttg ctctgaggac catagttttc cctacaaatg ctcgttatga 1740

cacaatgtac tcctacaagg ataagaacaa acgcagagaa tgggttgccc atctccaggc 1800

tggagcggga attgtggctg acagtgatcc tgctgatgaa caaagagagt gcgagaacaa 1860

agctgcagct cttgctcgtg ccattgatct tgcagaatct tcatttgttg ataaataatt 1920

tggattgatc catcatcagt gatgctcctt gataactgag gggcatcctt tttaaatggt 1980

agagaggaag tttgtggtgt gggcagatga taggggatat gaattacgga gaatctgaaa 2040

ctttgataat gttatgacag aagtgatgaa cataataagg tatttaatga taatgacagc 2100

tttgtgactt tagttaagtc gtcgtttaag agacttcaat agccatttcc gtcggtccat 2160

cttaaaccaa agaaaggtgc ctttgacgga gtttcttttg ctatcataaa 2210

<210>113

<211>988

<212>DNA

<213>大豆(Glycine max)

<220>

<221>3′UTR

<222>(926)..(988)

<223>

<220>

<221>misc_feature

<223>β亚基.

<220>

<221>5′UTR

<222>(1)..(88)

<223>

<400>113

actcggctat gcatccaacg cgttgggagc tctcccatat ggtcgacctg caggcggccg 60

cgaattcact agtgattaac atttgaacat ggctgccaca ttcttctctc acttgtcgct 120

tcttcaatcc aacaacaacc cttctctctc tcacacaccc tctcgcttcc ctcattctct 180

caccaaccgt gtcaaaccct ccctcggtgt ggtatctgtg gccaaaaggg taagtggagt 240

ggtgccaaag gccaatttga atgccttgga ggccaattcg ggtttcccca tttcggctaa 300

gaagtccaac aacaacccca ttgttgttat tgacaactat gacagtttca cctataatct 360

ttgccagtat atgggggagt tagggtttca ctttgaggtc taccgcaatg atgagttgac 420

agtggaggag ttaagaagga aaaatcccag aggagtgctg atatcacctg ggccaggaga 480

acctcaagat tcaggcatat ctttgcaaac ggttttggaa cttggaccaa ctgtgccatt 540

gtttggtgtg tgcatgggtt tgcaatgcat tggagaggct tttggaggga agattgttcg 600

ttctcctcat ggtgttatgc atggaaaaag ctctatggtt tactatgatg agaaaggaga 660

agatggatta cttgctggac tatcaaatcc tttcttggct ggtagatatc acagccttgt 720

aattgaaaaa gagagctttc ctcatgatga acttgaggca acagcatgga cagaagatgg 780

tcttataatg gctgctcgtc ataagaaata taagcatcta cagggtgttc agtttcatcc 840

agagagcatc ataaccccag aaggcaagac aattgtccgt aattttgtca agcttatcga 900

gaaaagggag gctggtggct cttgaaaatc gaattcccgc ggccgccatg gcggccggga 960

gcatgcgacg tcgggccbaw kcggmgtt 988

<210>114

<211>47

<212>PRT

<213>玉米(Zea mays)

<220>

<221>misc_feature

<223>CTP的序列.

<400>114

Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala

1 5 10 15

Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr

20 25 30

Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser

35 40 45

<210>115

<211>32

<212>PRT

<213>玉米(Zea mays)

<220>

<221>misc_feature

<223>CTP的序列.

<400>115

Met Ala Thr Ala Ser Leu Ala Leu Ser Leu Arg Leu Ala Pro Ser Ser

1 5 10 15

Arg Pro Leu Ser Leu Arg Arg Arg Gly Ala Ala Gly Val Thr Cys Arg

20 25 30

<210>116

<211>849

<212>DNA

<213>玉米(Zea mays)

<400>116

atggcctgct cccacatcgt cgccgccgcg ggggtctcct cccccgccgc agcggcggct 60

cgttccccgg cgcattctcc cgctgccgcc ttcgcgcgcc tccggtcgac gcctcgtttc 120

gcgagcgctg gcttgtcggt taagggaaac ggagcggcgt tcccgttggt cgccgccgcg 180

gggccggccg cggcggcacc ggtggccgac ctggacggcc gcccggccac ggagaagcag 240

cccatcatcg tcatcgacaa ctacgacagc ttcacataca acctctgcca gtatatgggg 300

gagcttggat tgaacttcga agtataccgc aatgatgaac tgaccataga agatgtgaga 360

aggaagaacc caaggggaat acttatttct ccaggacctg gtgaaccaca agattcggga 420

atatcattgc agactgttct tgaattaggc ccaaccatcc caatttttgg agtttgcatg 480

ggtctgcaat gcattggaga ggcatttgga ggaaagatta tccgtgctcc ttctggagtg 540

atgcatggga aaagctctcc agtttattac gatgaggaat taggaaaggc attgttcaat 600

ggcttgccaa acccttttac tgccgcgagg taccacagct tggtcattga gcaagaaacc 660

ttcccacatg atgctttgga ggctactgca tggactgaag atggacttat catggctgct 720

cgccacaaga agtacaaaca catccagggt gtccaattcc acccggagag catcatcacc 780

cctgaaggca agaaaatcat cctcaacttt gtcagattca ttgaggaact ggagaagcag 840

cgttcgtag 849

<210>117

<211>273

<212>PRT

<213>稻(0ryza sativa)

<400>117

Met Ala Thr Ala Ala Arg Leu Leu Pro Lys Ile Gln Ser Pro Ala Ser

1 5 10 15

Pro Ala Val Ala Glu Ala Arg Arg Arg Arg Pro Ser Ser Leu Arg Leu

20 25 30

Gly Val Thr Ser Gly Pro Ala Arg Thr Leu Lys Gln Lys Leu Val Ala

35 40 45

Lys Ser Ala Val Ser Val Val Glu Gly Glu Asn Ala Phe Asp Gly Val

50 55 60

Lys Gln Asp Thr Arg Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser Phe

65 70 75 80

Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Val Gly Ala Asn Phe Glu

85 90 95

Val Tyr Arg Asn Asp Asp Ile Thr Val Glu Glu Ile Lys Lys Ile Ser

100 105 110

Pro Arg Gly Ile Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp Ser

115 120 125

Gly Ile Ser Leu Gln Thr Val Gln Asp Leu Gly Pro Ser Thr Pro Leu

130 135 140

Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly

145 150 155 160

Lys Val Val Arg Ser Pro Tyr Gly Val Val His Gly Lys Gly Ser Leu

165 170 175

Val His Tyr Glu Glu Lys Leu Asp Gly Thr Leu Phe Ser Gly Leu Pro

180 185 190

Asn Pro Phe Gln Ala Gly Arg Tyr His Ser Leu Val Ile Glu Lys Asp

195 200 205

Ser Phe Pro His Asp Ala Leu Glu Ile Thr Ala Trp Thr Asp Asp Gly

210 215 220

Leu Ile Met Ala Ala Arg His Arg Lys Tyr Lys His Ile Gln Gly Val

225 230 235 240

Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Arg Leu Met Val

245 250 255

Lys Asn Phe Ile Lys Ile Ile Glu Gly Tyr Glu Ala Leu Asn Cys Leu

260 265 270

Pro

<210>118

<211>282

<212>PRT

<213>玉米(Zea mays)

<400>118

Met Ala Cys Ser His Ile Val Ala Ala Ala Gly Val Ser Ser Pro Ala

1 5 10 15

Ala Ala Ala Ala Arg Ser Pro Ala His Ser Pro Ala Ala Ala Phe Ala

20 25 30

Arg Leu Arg Ser Thr Pro Arg Phe Ala Ser Ala Gly Leu Ser Val Lys

35 40 45

Gly Asn Gly Ala Ala Phe Pro Leu Val Ala Ala Ala Gly Pro Ala Ala

50 55 60

Ala Ala Pro Val Ala Asp Leu Asp Gly Arg Pro Ala Thr Glu Lys Gln

65 70 75 80

Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys

85 90 95

Gln Tyr Met Gly Glu Leu Gly Leu Asn Phe Glu Val Tyr Arg Asn Asp

100 105 110

Glu Leu Thr Ile Glu Asp Val Arg Arg Lys Asn Pro Arg Gly Ile Leu

115 120 125

Ile Ser Pro Gly Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln

130 135 140

Thr Val Leu Glu Leu Gly Pro Thr Ile Pro Ile Phe Gly Val Cys Met

145 150 155 160

Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly Lys Ile Ile Arg Ala

165 170 175

Pro Ser Gly Val Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu

180 185 190

Glu Leu Gly Lys Ala Leu Phe Asn Gly Leu Pro Asn Pro Phe Thr Ala

195 200 205

Ala Arg Tyr His Ser Leu Val Ile Glu Gln Glu Thr Phe Pro His Asp

210 215 220

Ala Leu Glu Ala Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala

225 230 235 240

Arg His Lys Lys Tyr Lys His Ile Gln Gly Val Gln Phe His Pro Glu

245 250 255

Ser Ile Ile Thr Pro Glu Gly Lys Lys Ile Ile Leu Asn Phe Val Arg

260 265 270

Phe Ile Glu Glu Leu Glu Lys Gln Arg Ser

275 280

<210>119

<211>822

<212>DNA

<213>稻(Oryza sativa)

<400>119

atggccaccg ccgcgcggct cctccccaag atccagtccc ccgcctcccc ggccgtcgcg 60

gaggcgcgga ggcgccgccc ctccagtctc cgattaggag ttactagtgg acccgcaaga 120

actctgaagc aaaagcttgt tgctaagagt gctgtttctg tggtggaagg tgaaaacgca 180

tttgatggag taaagcaaga tactagacca atcatagtta tagataacta cgatagcttc 240

acgtataatt tatgccagta catgggtgag gtgggagcta actttgaggt gtaccgcaat 300

gatgatatca ccgtggaaga aattaagaag atttctccta gaggaatact catctcccct 360

ggccctggca cacctcaaga ttcaggaata tcattgcaaa cagttcaaga tcttggacct 420

tctacacctt tgtttggggt ttgcatgggt ttgcagtgta ttggggaggc atttggaggg 480

aaggttgttc gttctcctta tggagttgtg catgggaaag gatcccttgt tcactatgag 540

gagaaacttg atggaacact gttttctggt ctcccaaacc cattccaagc gggaagatac 600

cacagccttg taattgagaa ggatagcttc ccacatgatg ccctggaaat tactgcttgg 660

acagacgatg ggctgatcat ggctgctcgc cacaggaagt acaaacatat acagggtgtg 720

cagttccatc cagagagcat cataacaaca gaagggaggc tcatggtcaa gaatttcatc 780

aagattattg aaggctacga ggccttgaat tgcttaccgt ga 822

<210>120

<211>867

<212>DNA

<213>稻(Oryza sativa)

<400>120

atggcgtgct cccacctggc cgccgccgcc gccgcggcct ccccggcggc cgcgcgttca 60

ccggcggcct ccagcgccgc aaccgcgagc gccttcgcgc gcctctcggc gacgccccgg 120

gtcgcgagcg gcgggttggc cgttaggggc cagaggggtg tagccgctgt tgtcgccgcc 180

gccgccgggg ccgccgcggc gacgcccgtg gccgacatcg aggaacgccg ggccaccgag 240

aagcagccca tcattgtcat cgataactac gacagcttta cctacaacct ctgccagtat 300

atgggggagc ttggattgaa ctttgaggta tatcgcaatg atgaacttac catagaggat 360

gtaaagagga agaacccaag aggaatactt atttctccag ggcctggtga gccacaagat 420

tcaggtatat cattgcagac tgttctggaa cttggaccta ccatcccaat ttttggtgtc 480

tgcatgggtc tgcagtgtat cggggaagct tttggaggaa agattatccg tgctccttct 540

ggtgtcatgc atggaaaaag ctctccagtt cgctacgatg aggagctagg gaaggccttg 600

ttcaatggct tgccaaaccc atttaccgct gcaagatacc atagcttggt gatcgagcag 660

gagaccttcc cccatgacgc tctggaagcc accgcgtgga ctgaagatgg ccttatcatg 720

gctgctcgcc acaagaagta caggcacatc cagggagtcc aattccaccc agagagcatc 780

atcaccccag aaggcaagag gatcattctc aacttcgtga ggttcatcga ggagctggag 840

aagcagcgtg ccggagagaa gaactag 867

<210>121

<211>2202

<212>DNA

<213>百脉根根瘤菌(Mesorhizobium loti)

<400>121

atggagacgg caatgacgat gaaggttctg gaaaacggcg ctgaaagctt cgtgaccgcg 60

ggtggcatca ccattacgcg tgagcgccac gaccggccct atgcgggtgc gatcgacgct 120

tatgtcgatg gcttgaactc gcgccgcggc gcggtgtttt cctccaacta cgaatatccc 180

ggccgctata cgcgctggga caccgccatc atcgatccgc cgctggtcat ttccgcgcgg 240

ggccgcgcca tgcgcatcga agcgctgaac cgccgcggcg aggcgctgtt gccggtgatc 300

ggcaaaacgc tgggcggcct tgccgacatc accatcgccg agacgacgaa gacgctcatc 360

cgcctcgacg tcgccaagcc cggccgcgtc ttcacggagg aagagcgcag ccgcgtgccc 420

tcggtcttca ccgtgctgcg cgccatcacc gctttgttca aaaccgacga ggacgccaat 480

ctcggcctct atggcgcctt cggctacgac ctctccttcc agttcgaccc ggtcgactac 540

aagctcgagc gcaagcccag ccagcgcgac ctcgtgctgt tcctgcccga cgagatcctg 600

gtcgtcgacc actattccgc caaagcctgg accgaccgct acgactattc gggcgaagga 660

ttttcgaccg aaggtctgcc gcgcgacgca atcgccgagc cgttcaagac cgccgaccgc 720

atcccgccgc gcggtgacca tgagccgggc gaatacgcta atctggtgcg gcgtgccatg 780

gactcgttca agcgcggcga cctgttcgag gtcgtgcccg gccagatgtt ctacgagcgc 840

tgcgagacgc agccctccga catttcgcgc aagctgaaat cgatcaaccc ctcgccttat 900

tcgttcttca tcaacctcgg cgaaaacgaa tatctgatcg gcgcctcgcc cgaaatgttc 960

gtgcgcgtca atggccgccg cgtcgaaacc tgcccgattt cgggcaccat caaacgcggc 1020

gacgacgcca tttccgatag cgagcagatc ctgaagctgc tcaattcgaa gaaggacgaa 1080

tccgagctca caatgtgctc ggacgtcgac cgcaacgaca agtcgcgggt ctgcgagccc 1140

ggctcggtgc gcgtcatcgg ccgccgccag atcgagatgt attcgcgcct catccacacc 1200

gtcgatcaca tcgaaggccg gctgcgcgaa ggcatggacg ctttcgacgc cttcctgtcg 1260

catgcctggg cggtcactgt caccggcgcg ccgaaactgt gggccatgcg cttcatcgag 1320

cagaacgaga agagcccgcg cgcctggtat ggcggcgcaa tcggcatggt caacttcaac 1380

ggcgacatga acaccggcct gacgctgcgc accatccgca tcaaggacgg cattgccgaa 1440

gtgcgggccg gcgcgacatt gctgttcgac agcattcccg aggaagaaga agccgaaacc 1500

gaactgaagg catccgccat gctctccgcc atccgcgacg ccaagacggg caactccgcc 1560

agcaccgagc gcaccaccgc gcgggtcggc gacggcgtca acatcctgct cgtcgaccac 1620

gaggactctt tcgtccacac gctggccaac tacttccgcc agaccggcgc caatgtctcg 1680

accgtgcgca cgccggtgcc ggacgaagtg ttcgagcggc tgaagccgga ccttgtcgtg 1740

ctctcacccg gaccgggtac gccgaaggat ttcgattgcg ccgcgaccat cagacgagcg 1800

cgcgcccgcg acctgccgat cttcggcgtc tgcctaggcc tgcaggcgct ggccgaggcc 1860

tatggcgggg aactgcgcca gctgcatatt cccatgcacg gcaagccctc gcgcatccgc 1920

gtctccaagc ccggcatcat cttctccggc ctgcccaagg aagtcactgt cggccgttac 1980

cactcgatct tcgccgatcc ggtgcgcttg cccgatgatt tcattgtcac ggcagagact 2040

gaggacggca tcatcatggc tttcgagcac cgcaaggagc cgatcgcggc ggtgcagttc 2100

cacccggaat cgatcatgac gctcggccac aatgccggca tgcgcatcat cgagaacatc 2160

gtcgcccatt tgccgcgcaa ggccaaggaa aaggcagcct ga 2202

<210>122

<211>2199

<212>DNA

<213>巴西固氮螺菌(Azospirillum brasilense)

<400>122

atgtaccccg ccgaccttct tgcctcgccc gacctcctcg aaccgctgcg tttccagacg 60

cgcggcggcg tcaccgtcac gcggcgggcg acggcgctcg acccgcggac cgccctcgac 120

ccggtgatcg acgcgctgga ccgccgccgc ggcctgctgc tgtccagcgg ggtggaggcg 180

ccgggccgct accgccgtca cgcgctgggc ttcaccgacc ccgcggtggc gctcacggcg 240

cgtgggcgga cgctgcgcat cgacgcgctg aacgggcggg ggcaagtgct gctgcccgcc 300

gtcgccgagg ccctgcgtgg cctggaggcc ctggccggtc tagaggaggc gccgtcgcgg 360

gtcactgcct cgtccgcaag cccagcaccc cttcccggag aggagcggag ccgccagccc 420

tccgttttct cggtcctgcg ggcggtgctg gatctgtttg ccgcccccga cgacccgttg 480

ctcgggctct acggggcctt cgcctacgac ctcgccttcc agttcgagcc gatccgccag 540

cggttggagc ggcccgacga ccagcgcgat ctgctgctct acctgccgga ccggctcgtc 600

gcgctggacc ccatcgcagg actcgcccgg ctcgtcgcgt atgagttcat cacggcggcg 660

ggcagcaccg aggggctgga gtgcggcggg cgcgaccacc cctaccgtcc cgacaccaac 720

gccgaggccg gctgcgacca cgcgcccggt gactatcagc gcgtcgtcga gagcgccaag 780

gccgccttcc gccgcggcga cctgttcgag gtggtgcccg gccagacctt cgccgagccc 840

tgcgccgacg cgccttcgtc ggtgttccgg cggctgcgcg ccgccaaccc ggcgccttac 900

gaggccttcg tcaacctcgg gcggggcgag ttcctcgtcg ccgccagccc ggagatgtat 960

gtgcgggtgg cgggcgggcg ggtggaaacc tgcccgatct ccggcaccgt ggcgcgcggg 1020

gccgacgcgc tgggcgacgc cgcgcaggtc ctgcgcctgc tgacctcggc caaggacgcg 1080

gcggagctga ccatgtgcac cgacgtggac cgcaacgaca aggcgcgggt gtgcgagccg 1140

ggatccgtcc gggtgatcgg gcggcggatg atcgagctgt actcccgtct gatccacacg 1200

gtggaccatg tggagggacg gctgcggtcc ggaatggacg cgctggacgc cttcctcacc 1260

cacagctggg cggtgacggt gaccggcgcg cccaagcgct gggccatgca gttcctggag 1320

gatacggagc aatcgccgcg ccgctggtac ggcggggcct tcggccggct gggcttcgac 1380

ggcgggatgg acaccggcct gaccctgcgc accatccgca tggccgaggg cgttgcctac 1440

gtgcgggcgg gggcgacgct gctgtccgac agcgatccgg acgcggagga cgcggagtgc 1500

cgcctgaagg ccgccgcctt ccgcgacgcc atccgcggga cggcggcggg tgcggcgccc 1560

acgctgccgg cggctccccg tggcggggag ggcaggcggg tgctgctggt ggatcacgac 1620

gacagcttcg tccacacgct ggccgactat ctgcgccaga cgggcgcttc ggtgacgacg 1680

ctgcgtcaca gtcacgcacg ggcggcgctg gcggagcgga ggccggatct ggtcgtgctg 1740

tcccccggtc cggggcgccc ggcggatttc gacgtggcgg gcaccatcga cgcggcgctg 1800

gcgctcggcc tgccggtgtt cggcgtctgc ctgggcctgc aagggatggt ggagcgcttc 1860

ggcggcgcgc tggacgtgct gccggagccc gtccacggca aggcgacgga ggtccgggtg 1920

ctgggcggcg cgctgttcgc cggcctgccg gagcggctga cggtcgggcg ctaccactct 1980

ctggtggccc ggcgcgaccg gctgccggcg gacctcacgg tgaccgcgga gaccgccgac 2040

ggtctggtga tggcggtcga gcaccggcgg cttccgctcg ccgccgtgca gttccacccc 2100

gagtcgatcc tgtcgctcga cggtggggcc ggtcttgccc tgctgggcaa cgtgatggac 2160

cggctggccg ccggcgccct gacggacgct gcggcttga 2199

<210>123

<211>2196

<212>DNA

<213>马尔他布鲁氏菌(Brucella melitensis)

<400>123

atgaatgcga agactgcgga tagcgagata ttccagcacg aaacggcagg cggtatcatc 60

gtcgagcggg tgcgccacct cacggcctat aagggcgcca ttgaaagcta tatcgatgtg 120

ctgaacgaat ggcgcggtgc ggtgttctcg tccaattacg aatatccggg ccgctatacg 180

cgatgggata ccgcaattgt cgatccgccg gtcgtcatca cgtcgcgtgc ccgcacgatg 240

cgcatcgagg cgctgaacgc gcgcggcgtc atcctgcttc ggcccattct ggataccgtc 300

aaggcgcttt cggaagtaaa gatcgaccag tccggcgaaa accgtatcga tctgacgatt 360

gtggaaccgg tcggcacctt cacggaagaa gaacgctcgc gcatgccctc ggtctttacg 420

gtgctgcgcg ccatagtcgg gcttttcttc tcggaggagg atgccaatct cggcctttat 480

ggcgcctttg gctatgatct ggcgttccag ttcgatccca tccagtacaa gctgaagcgc 540

ccggacgacc agcgtgacct cgtgctgttc attcccgacg aaatcttcgt cgccgaccat 600

tatgcggcgc gcgcctgggt ggaccgttat gaatttcgct gcggcggttc gtccacgcac 660

ggtcttgatc gcgcgacgcc ggtggtgcct ttcaagccat cggagcgcaa gcttgcgcgc 720

ggcgatcata atccgggtga atatgccagg cttgtcgagc gcgccaagga aagcttcaag 780

cgcggcgacc tgttcgaggt tgtgccgggc cagaccttct atgagcgctg ccacacggcg 840

ccgtcggaga ttttccgccg gctgaagtcg atcaatcctt cgccctattc ctttttcatc 900

aatctgggcg agagcgaata tctggtcggc gcatcgccgg aaatgtttgt gcgcgtcaat 960

gggcggcgca tcgagacctg cccgatttcc ggcaccatca agcgcggtga agatgcaatt 1020

tcggattctg agcagatatt gaaactgctt aattccaaga aggacgaatc cgagctgacc 1080

atgtgttcgg atgtggaccg caacgacaag agccgcgttt gcgagccggg ttcggtgcgt 1140

gttatcggtc gccgccagat cgagatgtat tcccgcctga tccatacggt cgatcatatc 1200

gaaggccgcc tgcgtgacgg catggatgcg tttgacggct tcctcagcca tgcatgggct 1260

gtgacggtga caggcgcgcc gaagctgtgg gcaatgcgct ttcttgagga aaacgaacgc 1320

agcccgcgcg catggtatgg cggcgcgatc ggcatgatgc atttcaatgg cgatatgaat 1380

acagggctga cgctgcgcac catccgcatc aaggatggtg tggcggaaat ccgtgcaggg 1440

gcgacgcttc tgttcgattc caaccctgac gaggaagaag ccgagaccga attgaaggca 1500

tcggccatga ttgcggctgt gcgggacgca cagaagagca atcagatcgc ggaagaaagt 1560

gtggcggcaa aggtgggtga gggggtttcg atcctgctgg tcgatcacga ggattccttc 1620

gtccatacgc ttgccaatta tttccgccag acgggcgcca aggtttccac cgtgcgttca 1680

ccggtggcag aggagatatt cgaccgcgtc aatcccgatc tggtggtgtt atcgccggga 1740

ccgggctcgc cgcaggattt cgattgcaag gcgaccatcg ataaggcgcg caagcgccag 1800

cttccgattt ttggcgtctg cctcggcctt caggccctgg cggaagccta tggcggggcg 1860

ttgcgccagc ttcgcgttcc ggtgcatggc aagccttcac gcatccgcgt atcaaagccg 1920

gagcgcattt tctccggctt gccggaggaa gtgacggtgg ggcgttatca ttcgatcttc 1980

gccgatcctg aacgcctgcc ggatgatttt ctcgtcacag ccgaaacgga agacgggatc 2040

atcatggctt ttgaacataa acatgaaccg gtggcagccg ttcaattcca tcccgaatcc 2100

atcatgacgc ttggccataa tgccggtatg cgcatgatcg agaatatcgt gacgcatctt 2160

gcaggcaagc acaaggcgcg ccgcaccaac tattga 2196

<210>124

<211>2148

<212>DNA

<213>念珠藻属(Nostoc sp.)

<400>124

gtgcgcgtat ctcgtagcac aaccgaggtg aagatggaca ctgcactaga tgaaattctc 60

tttcacctaa atcaagtacg tggaggtttg ttaaccagta gttacgaata tccagggcga 120

tacaaaagat gggcgattgg attcattaat cccccattac aactgacaac aagagagaac 180

gcatttacca tctcttcact caatcctcgc ggacaggtgc tactaccaac cttgttccag 240

catctatcag cccagtcgca actacaacaa atcagcctca atcatgacta catcacaggt 300

gaaattcgac ccacaaaaca gttattcaca gaagaacaac ggagtaaaca accgtcagcc 360

tttacagtca tccgcgaaat tctccagatt tttgcgagtg atgaagacga gcatttaggg 420

ttatatggtg catttggtta cgacttagta tttcaatttg aaccaattcc ccaaaaaatt 480

gctcgtcccg cagaccaacg ggatttagtc ctgtatctac ccgatgaact catagttgta 540

gattactatc tacaaaaagc atatcgtcac cagtatgaat ttgccacaga acatggcaac 600

accgagcatc ttccacggac aggccagtcc atcgactacc agggtaaaca tcttctacca 660

aaccaaactg ctgaccatca accaggagaa tatgccaacc tagttgagca agcactcgac 720

tacttccgcc ggggtgactt atttgaagta gttcctagtc aaaacttttt tacagcctgt 780

gaacaatcac ccagtcaact attccagacc ttaaggcaaa ttaatcctag tccttatgga 840

tttctgttga atttgggtgg tgaatatctc ataggtgcat caccagaaat gtttgtgcga 900

gttgatggta ggcgagtgga aacctgtccc attagtggca ctattagacg gggagaagat 960

gctttaggcg acgctgtaca aattcgtcag ttgcttaact cccataaaga tgaagccgag 1020

ttaacaatgt gtactgacgt agaccgcaac gataaatcgc ggatttgtga acccggttca 1080

gtcagggtga ttggtcgtcg ccagattgaa ctgtacagcc acctcattca tacagtagac 1140

catgtagaag ggatactgag gccggaattt gacgctttag atgccttctt gagtcatact 1200

tgggcagtta cagtcacagg cgcacccaaa cgagccgcca tgcagttcat cgaacagcat 1260

gaacgcagcg cccgtcgttg gtatggggga gcagttggtt atttaggctt taatggtaac 1320

ttgaataccg gattaacctt gcggacaatt cgtttacaag actccatcgc cgaagtgcga 1380

gttggtgcaa cagtccttta cgactccatt ccgtcagccg aagaagagga aacaattact 1440

aaagcgactg cattatttga gaccattcgc cgtcatacca ctgccaataa aactcaagga 1500

aacgatagtc atcgccctgg ggatatcgcc cacaataagc gtatcctcct catcgactac 1560

gaagattcat ttgttcacac attagccaat tacatccgca ccaccggcgc aaccgtcacc 1620

accctacgtc atggttttgc tgaatcatat tttgatgcag aacgcccaga cttagtggta 1680

ttgtctcccg gccctggtag acccagtgac ttccgagttc cccaaacggt tgcagccttg 1740

gtaggtcgag aaatccccat ttttggcgtt tgtctgggat tacaaggcat agtggaagct 1800

tttggcggag aattaggcgt gcttgattat ccccaacacg gtaaacccgc acggatttca 1860

gtgactgcac ctgattctgt gctgtttcaa aatttaccag catccttcat cgtgggtaga 1920

taccattcct tatttgccca accccaaact atacccggtg aactcaaagt cacagcgatt 1980

tctgaggaca atgtaattat ggcaattgaa caccaaacac tacctatagc cgccgtccaa 2040

tttcatccag agtcaatcat gaccctagca ggagaagttg gtcagacaat cattaaaaat 2100

gtggtgcaga catataccca aactttagaa acatcaattt actcttag 2148

<210>125

<211>2208

<212>DNA

<213>念珠藻属(Nostoc sp.)

<400>125

atgattgccg attcccacag ctacagaact aatggtaacg tgcgtgtctc tcgctccatc 60

acacaagtta aaatggagac agctttagaa gagattcttt tctacttaaa ctctcagcgt 120

ggtggattgc tgactagtag ctatgaatat ccaggaagat ataaaagatg ggcaattggt 180

tttgttaatc cacctgtaga attatccaca agcggaaata cttttactct cacagcatta 240

aatgagcgtg gctatgtact tttaccagtg atctttgagt gtttatcaaa atcagaacaa 300

ctccagaaac tcactgaaca tcatcataaa attactggat tagttaaatc tacaccagaa 360

ttttttgccg aagaagaacg tagtaaacaa ccttctacat ttacggttat tcgggaaata 420

ctacatatct tctctagtca agaagacgaa catttaggat tatatggtgc gtttggttat 480

gacttagttt tccaatttga gcaaataacc caatgcttag aacgtccaca agaccaacga 540

gatttagttc tatatttacc cgacgaattg atagttgtag actactatca acaacaagca 600

tttcggctag agtatgactt catcacagcg catggtagta cttatgattt gccccgcacg 660

ggagaatctg ttgattatcg aggtcaatgt ttaacacctc ctcaaaatgc tgaccataaa 720

ataggtgagt atgccaaact agtagaattt gcccttgatt atttccgtcg gggtgactta 780

tttgaagtgg ttcccagtca gaattttttc acagcttgcg aagcaccacc aagccaacta 840

tttgaaactt taaaacaaat aaatcctagt ccctatggat ttatttttaa tcttggtgga 900

gaatacatca ttggcgcttc accagaaatg tttgtacggg tggaaggtag gcgtgtagaa 960

acttgtccta ttagtggcac tattactaga gggcatgatg ctatagatga tgctgtgcag 1020

attcgtcagt tactcaactc ccacaaagac gaagcagagt tgactatgtg tactgacgta 1080

gaccgtaacg ataagtctcg catctgtgaa cccggttcag tcaaggtgat tggtcgccgg 1140

caaattgaat tatatagcca cttaattcat acggtagacc atgtagaagg cattctccga 1200

ccagagtttg atgctttaga tgctttcctc agtcacactt gggctgttac agtcacaggc 1260

gcaccgaaaa gggctgctat tcaattcatc gaaaagaacg aacgcagcgt cagacgttgg 1320

tatggtggcg cggttgggta tttgaatttt aacgggaatt taaatactgg gttaatttta 1380

aggacaatca gattgcaaga ctcaattgct gaagtgcgag ttggtgctac tctactgtat 1440

gactccatac cccaagcaga agaacaagaa accatcacta aagctgcggc tgcttttgaa 1500

acgattcggc gtgctaaaca aatagaccca cagattgaag aatctagtac tagaaagtta 1560

agcaaatatc ttcccgatgg acaatcaggt aaacacatct tactaattga ccatgaagac 1620

tcatttgttc ataccctagc taactacatc cgttccactg gtgcaactgt caccacactg 1680

cgtcacggct tctcagaatc cctatttgat acagaacgcc cagacttagt agtattatct 1740

cctggccccg gtagaccgag tgaatttaaa gtacaggaaa ccgtcgccgc ctgcgtccgt 1800

cgccaaatac ctctgtttgg tgtctgttta ggactgcaag gtattgtgga agctttcggt 1860

ggagaattgg gagtattgaa ttatccccaa catggtaaat cttcgcggat ttttgttaca 1920

gcacccgatt ctgtgatgtt tcaagatttg cccgaatctt ttacagtcgg gagatatcat 1980

tcattatttg cactatcaca acgcttacca aaagaactga aggtgacagc gatttctgat 2040

gatgaggtga ttatggcgat tgaacatcag acactaccta tcgccgccgt ccagtttcat 2100

ccagaatcaa tcatgactct agctggagaa gttggtttaa tgatgatcaa aaatgtggtg 2160

caaaaatata cacaaagtca acagtcaaca gttcccatct atgactaa 2208

<210>126

<211>2160

<212>DNA

<213>血色红假单胞菌(Rhodopseudomonas palustris)

<400>126

atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc 60

gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat 120

ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac 180

gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa 240

ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag 300

cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc 360

gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc 420

ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac 480

ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc 540

gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc 600

gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc 660

ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc 720

gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc 780

ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg 840

gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat 900

ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc 960

cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020

gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080

tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140

ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200

ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260

accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320

ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380

ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440

acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500

gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560

gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620

ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680

ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740

ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800

ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860

ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920

cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980

gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040

gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100

ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160

<210>127

<211>2166

<212>DNA

<213>大豆慢生根瘤菌(Bradyrhizobium japonicum)

<400>127

atgaacagga cagtctttgc cctcccggcc agaagcgatt acgtgacccg cggcggtctc 60

gcgatcacgc gcgtggcgga gcagtttacc ggcggcgcga gccggctcga cgatctcgtc 120

aacctgctcg accgccgccg cggcgtggtg ctgtcctcgg gcacgaccgt gccgggccgc 180

tacgagagct tcgacctcgg cttctccgat ccgccgctca agctcgagac cacaggcgtc 240

aatttcaagc tggaagccct gaacgagcgc ggccaggtgc tgatcgcctt ccttgccgat 300

gtcctgcgcg agccctgcgt ggtgatatcc gaaaagaccg cttcgcgcct cgccggccac 360

atcatccgcg gcgatgcccc ggtcgaggaa gaccagcgca cccggcgcgc cagcgtggtg 420

tcgctggtgc gcgacctcgt cgccgccttc tccgccaatg acgacgggct gctcggcctg 480

ttcggcgcct tcgcctacga tctcgtgttc cagatcgagg atctcgtgca gaagcgcgcg 540

cgcgagagcg accagcgcga catcgtgctc tacgttcccg atcgcctgct ggcctatgac 600

cgcgccaccg gccgcggcgt cgtgctcagc tacgacttca cgtggaaggg cagatccacc 660

gagggcctgc cgcgcgagac cgccgacagc ccgtacatga agacaccgcg ccagggcttt 720

gccgatcatg cgcccggcga ataccaggcc accgtcgaga ccgcgcgcgc ggcctttgcc 780

cgcggcgatc tgttcgaggc cgtgccgggc cagctgttcg ccgagccctg cgatcgttct 840

ccggcggaag tgttccagcg cctctgtgtc atcaacccgt cgccctacgg cgcgctgatg 900

aatctcggcg acggcgagtt tctcgtctcc gcctcgcccg agatgttcgt gcgttcggac 960

ggccgccgcg tcgagacctg cccgatctcg ggcaccatcg cgcgcggcac cgatgcgatc 1020

ggcgatgccg agcagatccg ccagctcctg aattcggaga aggacgagtt cgagctcaac 1080

atgtgcaccg acgttgatcg caacgacaag gcgcgcgtct gcgtccccgg caccatcaag 1140

gtgctggcgc gccggcagat cgagacctac tcaaaactgt tccacaccgt cgaccacgtc 1200

gagggcatgc tgcgtcccgg cttcgacgcg ctcgatgcct tcctcaccca tgcctgggcc 1260

gtcaccgtga caggtgcgcc gaagctctgg gcgatgcagt tcgtcgagga tcacgagcgg 1320

tcgccgcggc gctggtatgc gggtgcgatc ggcgcggtga atttcgacgg cagcatcaat 1380

accggcctca ccatccgcac catccgcatg aaggatggtc tcgccgaggt gcgcgtcggc 1440

gccacctgcc tgttcgattc cgatcccgct gccgaggacc gcgaatgcca ggtcaaggcg 1500

gcggcgctgt tccaggcgct gcgcggcgat ccgccaaaac cgctctcgac ctttgcgccc 1560

gatgcgaccg gaagcggcaa gcgggtgctg ctgatcgacc acgacgacag cttcgtgcac 1620

atgctcgccg actatttccg ccaggtcggc gccagcgtca ccgtggtccg ctatgtgcat 1680

gcgctcgaca tgctcaagca gaagaggtgg gatttgctgg tgctgtcgcc cggcccgggc 1740

aggcccgaag atttcgggat caggaagacg atcgatgcgg cgctggagaa caagctgccg 1800

gtgttcggcg tctgcctcgg cgtgcaggcg atcggcgaat attttggcgg cgagctcggc 1860

cagctcacgc atcccgccca cggccggccc tcgcgggtgc aggtgcgcgg cggccgcctg 1920

atgcgcaatt tgccgagcga gatcgtgatc ggccgctatc actcgctcta tgtcgagcgc 1980

gacagcatgc cggaggtttt gtccgtcacc gccagcaccg aggacggcgt cgctatggcg 2040

ctggagcaca agaccctgcc ggtcgcgggc gtgcaattcc acccggagtc gctgatgtcg 2100

ctcggcggcg aggtgggctt gaggattgtc gagaacgcgt tccggctgga tgcgcgtgtt 2160

gattga 2166

<210>128

<211>2187

<212>DNA

<213>深红红螺菌(Rhodospirillum rubrum)

<400>128

atgcaaacat cgaccttcac caccgccggc ggttttacca tcagcagttg cctacgcccg 60

cttgccgggg cggatggcgc cttcgaggcg ctgatcgacc gactcgatcg ccatcgcggc 120

atggtgatcg cctcgaccta tgagtatccc ggccgctatc gccgccacgc cctggggttt 180

tgcgatccgc cgctggtgct ggagggcaag gggcgcgagg cccatctgct ggcgctcaat 240

cgccgggggc gggccctgct gccggccctg gccgttggct tggagggggc ggccgggctg 300

gagggcctgc gccgcgaggc cgaccggctg gtcttgcgtg tcaaggccat ggcgccctgg 360

ttccccgagg aggagcgctc gcgccaaccc tcgctgatgt cggtggtgcg cgccctcgcc 420

gggctgttcg ccgccgaaaa cgacccgttt ttcgggcttg tcggcgcctt tggctatgac 480

ctgggcttgg ctttcgagcg cctgccccat gcccggccgc gatcggccga tcaccgcgat 540

ctggtgcttt acctgcccga ccgtctgctg atcgacgatc ccgaagccgg cggccttgcc 600

gaacgccttt acgacatcac cgcggccgat ggggcaagca ccgccggctt ggcgcgggaa 660

accgccgctt acaccgccga ccaccccgcc ggcggcgtgc cgatcgagga tgatatgccc 720

ccgggcgctt acggggcgat cgtccgtggg ctgaaggagg ccttcgccgc cggggatctg 780

ttcgaggcgg tgccctcgcg cgccctgcgc cggccttgcg ccgaggcgcc gagccgtttg 840

taccggcggc tgcgcgcggc caatccggcg ccctatctgt tcctggccaa tctgggggcg 900

ggcgaacatc tgatcggcgc ctcgcccgaa atgttcgtgc gcgtcggtgg agcgccgggg 960

gcgcggcggg tggaaacctg cccgatctcg ggcaccatcg cccgggggcc cgacgccctg 1020

ggcgatgccg aggccatccg caccctgctc aattcgacca aggacgaggc cgaattgacc 1080

atgtgcaccg atgtcgaccg caacgacaag gcgcgggtct gcgtggccgg cagcgttacc 1140

gtcatcggtc gccgccagat cgagctatat tcccggctga tccacacggt cgaccatgtg 1200

gagggccggc tgcgccccga gcttgacgcc cttgacgcct ttctcagcca ctgctgggcg 1260

gtgacggtga ccggagcgcc caagcgcgcc gccatggccg ccgtcgaagc cgtggagcgg 1320

gcgccgcgcg cctggtatgg cggcgccatc ggccgcctgg gcttcgacgg taccctcgac 1380

accggactgg tgctgcgcac catccgcctg cgtcacggcg tcgccgaggt gcgggtgggg 1440

gcgacgctgc tccaccgttc cgatcccgag gaggaggagg ccgaaaccct gctcaaggcc 1500

tcggccctgc tcgccctgct cgatgccacc accccggcca agccgaatgc cccgcatctt 1560

ccgttgcgcg gccgggcgcc gcgcgtgctg gtcatcgacc acgaggacag cttcgtccat 1620

accctggcgt cttatctgcg caatgccggg gccgagacca ccgtgctgcg ctgggacgtg 1680

ccggcggcgg tgcgcgccgg cgtcgaggcc gatctgctgg tgctgtcgcc gggaccgggc 1740

acgccgtcgc gcttcgccct gggggccagc ctggactggg cggtggcgcg cggcttgccg 1800

gtcttcggcg tctgcctggg gctgcagggc atcgtcgaac aggccggggg ccgccttgcc 1860

cggctggcgg ttcccgccca tggcatggcc tcgacgctgc ggctggtcgc ccccggggac 1920

ccgctgttcg ccggcctgcc cacgaccatg agagtgggcc gctaccacag cctgcacgcc 1980

gagcgcgcca gcctgcccga cagcctggag atcctggccg aaagcgacga cggggtgatc 2040

atggcgctgc gccaccgcct gctgcccttc agcgccgtgc aattccaccc cgaaagcctg 2100

atgaccctgg acggcggcgc cggaccccga ttgatcgcca atcttctgga aaccctaagc 2160

gtcccgcgaa cgcgccacgc cgcctaa 2187

<210>129

<211>2181

<212>DNA

<213>Thermobifida fusca

<400>129

gtggacgaca actcctacac caccagtggt ggtatcaccg tgcaccgcac ggcagtgccg 60

tgcgatcccc gtgcgctcgc cgatctgacg gtcaacgtgg aacagcgccg aggcggcgtg 120

ctctcctccg ggatggagta tcccggccgc tacagccgtt ggcatttggg atacgtggac 180

ccgtgcctgg aagttgtcgc gcgcggccgc acgatcgggg cgacggccct caacgaccgc 240

ggccgtgtcc tgctgcccgc ggtagcccgg gcgctcaccg cgcacggcgc ggtggtggag 300

cacaccgacg acacggtcgc tgtcacggtc cctgaaccgg atcccaccga gttcttcact 360

gaggaagagc gcagccgccg gctcagtgtt ttttctgcgc tccgcgccct cgtgggcgtg 420

ttcttccacg cggaagaacc ccacctgggg ttgtacgggg cgttcggcta cgatctggcg 480

ttccagttcg aaccgatcga gcaggtgctg ccgcgcgacc cggaggaccg ggacctggtg 540

ttgcacctgc ccgacgagat catcgtccac gaccggaaac gggagatctg ccagcgctac 600

tcctacgact tcacgctgcc ggaggagttg cgcggcccgg caggggcgac cacgcggggc 660

ctgccacgcc acaccgagcc cacacccccg gtgaccccgg ctgccgaggt gccgccgcag 720

ccggaacccg ggtcgtatgc gcggatcgtg gctgaggcca aggagcggtt ccgccgcggc 780

gacttgttcg aagtggtgcc cagccaccgc ttgtacgcgc cgtgtgcgtc gcctgcgcgg 840

ttctacgagc ggctgcggga acgcaaccct gccccgtacg agttcttcct caacctgggg 900

gagggcgagt acctggtcgg cgcgtccccg gaaatgtttg tgcgggtcac gggccgtccc 960

ggagaggggc agcgggtgga gacctgcccg atctccggca cgatcaagcg tggcgcggac 1020

gcggtcggcg acgcggagaa catcaaggag ctgctgtcgt ccgcgaagga agagtcggag 1080

ctgaccatgt gcaccgacgt ggaccgcaac gacaagtccc gggtgtgcgt gccaggcagt 1140

gtgcgggtga tcggccgccg gcagatcgaa atgtacagtc ggctcatcca cacggtcgac 1200

cacattgagg ggattctgcg ccccgagttg gacgctattg acgcgttcct cacccacatg 1260

tgggcggtga ccgtgacggg ggcgccgaag acgtgggcga tgcggttcat cgaacagcat 1320

gagagttcgc cgcgccgctg gtatgggggc gcggtcggtg tcatcaattt tgatggttcg 1380

atgaacaccg ggttgacgtt gcggaccgcg cacatccggg acggggtggc gacggtgcgg 1440

gcgggcgcca cactgctgta cgactctgat ccggaagctg aagagcggga gactttcctc 1500

aaagcccgtg ccctgttgga gaccctcacc gacgagggtg aggaaacctc caaggctgcg 1560

cctgcggtgg agcaggtggg ggcggggatg cgggtgctgc tcgtcgacca cgaagactcg 1620

ttcgtcaaca cgctcgcgga ctacgtccgg cggcacggcg ccgaggtcac cacggtgcgc 1680

tacgggttcg acccggccct gctcgaccag atgcgtcccg acctggtggt gctctccccg 1740

gggccggggc tgcccgccga tttcgcgatg agcgcgctgt tgaaggagtt ggacgcgcgc 1800

ggcctgcctg tgttcggggt gtgcctgggg ctgcaggcga tggtggagta cgcgggcggg 1860

gagctgctca ctttggacac gccggtgcac ggtaaacccg gccgggttcg ggtcaccggg 1920

ggcgcgctgc tggctgggct gggagaggac ggggagttca ccgcggcccg ctaccactcc 1980

gtgtacgcga ccccggaccg ggtgaaaggg ttcgaggtga cggcggtgac ggaggacgac 2040

ggtttccccg tggtcatggc gatcgagaat gctgaggcgc ggcggtgggc ggtccagttc 2100

caccccgagt cgatcctcac cggccgggtg ggggagcaga tcgtggcgaa cgtgctgcgc 2160

ttggccaggg agagcagctg a 2181

<210>130

<211>721

<212>PRT

<213>大豆慢生根瘤菌(Bradyrhizobium japonicum)

<400>130

Met Asn Arg Thr Val Phe Ala Leu Pro Ala Arg Ser Asp Tyr Val Thr

1 5 10 15

Arg Gly Gly Leu Ala Ile Thr Arg Val Ala Glu Gln Phe Thr Gly Gly

20 25 30

Ala Ser Arg Leu Asp Asp Leu Val Asn Leu Leu Asp Arg Arg Arg Gly

35 40 45

Val Val Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe

50 55 60

Asp Leu Gly Phe Ser Asp Pro Pro Leu Lys Leu Glu Thr Thr Gly Val

65 70 75 80

Asn Phe Lys Leu Glu Ala Leu Asn Glu Arg Gly Gln Val Leu Ile Ala

85 90 95

Phe Leu Ala Asp Val Leu Arg Glu Pro Cys Val Val Ile Ser Glu Lys

100 105 110

Thr Ala Ser Arg Leu Ala Gly His Ile Ile Arg Gly Asp Ala Pro Val

115 120 125

Glu Glu Asp Gln Arg Thr Arg Arg Ala Ser Val Val Ser Leu Val Arg

130 135 140

Asp Leu Val Ala Ala Phe Ser Ala Asn Asp Asp Gly Leu Leu Gly Leu

145 150 155 160

Phe Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Ile Glu Asp Leu Val

165 170 175

Gln Lys Arg Ala Arg Glu Ser Asp Gln Arg Asp Ile Val Leu Tyr Val

180 185 190

Pro Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Val

195 200 205

Leu Ser Tyr Asp Phe Thr Trp Lys Gly Arg Ser Thr Glu Gly Leu Pro

210 215 220

Arg Glu Thr Ala Asp Ser Pro Tyr Met Lys Thr Pro Arg Gln Gly Phe

225 230 235 240

Ala Asp His Ala Pro Gly Glu Tyr Gln Ala Thr Val Glu Thr Ala Arg

245 250 255

Ala Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu

260 265 270

Phe Ala Glu Pro Cys Asp Arg Ser Pro Ala Glu Val Phe Gln Arg Leu

275 280 285

Cys Val Ile Asn Pro Ser Pro Tyr Gly Ala Leu Met Asn Leu Gly Asp

290 295 300

Gly Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp

305 310 315 320

Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly

325 330 335

Thr Asp Ala Ile Gly Asp Ala Glu Gln Ile Arg Gln Leu Leu Asn Ser

340 345 350

Glu Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn

355 360 365

Asp Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg

370 375 380

Arg Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val

385 390 395 400

Glu Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr

405 410 415

His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met

420 425 430

Gln Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly

435 440 445

Ala Ile Gly Ala Val Asn Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr

450 455 460

Ile Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly

465 470 475 480

Ala Thr Cys Leu Phe Asp Ser Asp Pro Ala Ala Glu Asp Arg Glu Cys

485 490 495

Gln Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Pro

500 505 510

Lys Pro Leu Ser Thr Phe Ala Pro Asp Ala Thr Gly Ser Gly Lys Arg

515 520 525

Val Leu Leu Ile Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp

530 535 540

Tyr Phe Arg Gln Val Gly Ala Ser Val Thr Val Val Arg Tyr Val His

545 550 555 560

Ala Leu Asp Met Leu Lys Gln Lys Arg Trp Asp Leu Leu Val Leu Ser

565 570 575

Pro Gly Pro Gly Arg Pro Glu Asp Phe Gly Ile Arg Lys Thr Ile Asp

580 585 590

Ala Ala Leu Glu Asn Lys Leu Pro Val Phe Gly Val Cys Leu Gly Val

595 600 605

Gln Ala Ile Gly Glu Tyr Phe Gly Gly Glu Leu Gly Gln Leu Thr His

610 615 620

Pro Ala His Gly Arg Pro Ser Arg Val Gln Val Arg Gly Gly Arg Leu

625 630 635 640

Met Arg Asn Leu Pro Ser Glu Ile Val Ile Gly Arg Tyr His Ser Leu

645 650 655

Tyr Val Glu Arg Asp Ser Met Pro Glu Val Leu Ser Val Thr Ala Ser

660 665 670

Thr Glu Asp Gly Val Ala Met Ala Leu Glu His Lys Thr Leu Pro Val

675 680 685

Ala Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu

690 695 700

Val Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Asp Ala Arg Val

705 710 715 720

Asp

<210>131

<211>728

<212>PRT

<213>深红红螺菌(Rhodospirillum rubrum)

<400>131

Met Gln Thr Ser Thr Phe Thr Thr Ala Gly Gly Phe Thr Ile Ser Ser

1 5 10 15

Cys Leu Arg Pro Leu Ala Gly Ala Asp Gly Ala Phe Glu Ala Leu Ile

20 25 30

Asp Arg Leu Asp Arg His Arg Gly Met Val Ile Ala Ser Thr Tyr Glu

35 40 45

Tyr Pro Gly Arg Tyr Arg Arg His Ala Leu Gly Phe Cys Asp Pro Pro

50 55 60

Leu Val Leu Glu Gly Lys Gly Arg Glu Ala His Leu Leu Ala Leu Asn

65 70 75 80

Arg Arg Gly Arg Ala Leu Leu Pro Ala Leu Ala Val Gly Leu Glu Gly

85 90 95

Ala Ala Gly Leu Glu Gly Leu Arg Arg Glu Ala Asp Arg Leu Val Leu

100 105 110

Arg Val Lys Ala Met Ala Pro Trp Phe Pro Glu Glu Glu Arg Ser Arg

115 120 125

Gln Pro Ser Leu Met Ser Val Val Arg Ala Leu Ala Gly Leu Phe Ala

130 135 140

Ala Glu Asn Asp Pro Phe Phe Gly Leu Val Gly Ala Phe Gly Tyr Asp

145 150 155 160

Leu Gly Leu Ala Phe Glu Arg Leu Pro His Ala Arg Pro Arg Ser Ala

165 170 175

Asp His Arg Asp Leu Val Leu Tyr Leu Pro Asp Arg Leu Leu Ile Asp

180 185 190

Asp Pro Glu Ala Gly Gly Leu Ala Glu Arg Leu Tyr Asp Ile Thr Ala

195 200 205

Ala Asp Gly Ala Ser Thr Ala Gly Leu Ala Arg Glu Thr Ala Ala Tyr

210 215 220

Thr Ala Asp His Pro Ala Gly Gly Val Pro Ile Glu Asp Asp Met Pro

225 230 235 240

Pro Gly Ala Tyr Gly Ala Ile Val Arg Gly Leu Lys Glu Ala Phe Ala

245 250 255

Ala Gly Asp Leu Phe Glu Ala Val Pro Ser Arg Ala Leu Arg Arg Pro

260 265 270

Cys Ala Glu Ala Pro Ser Arg Leu Tyr Arg Arg Leu Arg Ala Ala Asn

275 280 285

Pro Ala Pro Tyr Leu Phe Leu Ala Asn Leu Gly Ala Gly Glu His Leu

290 295 300

Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Gly Gly Ala Pro Gly

305 310 315 320

Ala Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly

325 330 335

Pro Asp Ala Leu Gly Asp Ala Glu Ala Ile Arg Thr Leu Leu Asn Ser

340 345 350

Thr Lys Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn

355 360 365

Asp Lys Ala Arg Val Cys Val Ala Gly Ser Val Thr Val Ile Gly Arg

370 375 380

Arg Gln Ile Glu Leu Tyr Ser Arg Leu Ile His Thr Val Asp His Val

385 390 395 400

Glu Gly Arg Leu Arg Pro Glu Leu Asp Ala Leu Asp Ala Phe Leu Ser

405 410 415

His Cys Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met

420 425 430

Ala Ala Val Glu Ala Val Glu Arg Ala Pro Arg Ala Trp Tyr Gly Gly

435 440 445

Ala Ile Gly Arg Leu Gly Phe Asp Gly Thr Leu Asp Thr Gly Leu Val

450 455 460

Leu Arg Thr Ile Arg Leu Arg His Gly Val Ala Glu Val Arg Val Gly

465 470 475 480

Ala Thr Leu Leu His Arg Ser Asp Pro Glu Glu Glu Glu Ala Glu Thr

485 490 495

Leu Leu Lys Ala Ser Ala Leu Leu Ala Leu Leu Asp Ala Thr Thr Pro

500 505 510

Ala Lys Pro Asn Ala Pro His Leu Pro Leu Arg Gly Arg Ala Pro Arg

515 520 525

Val Leu Val Ile Asp His Glu Asp Ser Phe Val His Thr Leu Ala Ser

530 535 540

Tyr Leu Arg Asn Ala Gly Ala Glu Thr Thr Val Leu Arg Trp Asp Val

545 550 555 560

Pro Ala Ala Val Arg Ala Gly Val Glu Ala Asp Leu Leu Val Leu Ser

565 570 575

Pro Gly Pro Gly Thr Pro Ser Arg Phe Ala Leu Gly Ala Ser Leu Asp

580 585 590

Trp Ala Val Ala Arg Gly Leu Pro Val Phe Gly Val Cys Leu Gly Leu

595 600 605

Gln Gly Ile Val Glu Gln Ala Gly Gly Arg Leu Ala Arg Leu Ala Val

610 615 620

Pro Ala His Gly Met Ala Ser Thr Leu Arg Leu Val Ala Pro Gly Asp

625 630 635 640

Pro Leu Phe Ala Gly Leu Pro Thr Thr Met Arg Val Gly Arg Tyr His

645 650 655

Ser Leu His Ala Glu Arg Ala Ser Leu Pro Asp Ser Leu Glu Ile Leu

660 665 670

Ala Glu Ser Asp Asp Gly Val Ile Met Ala Leu Arg His Arg Leu Leu

675 680 685

Pro Phe Ser Ala Val Gln Phe His Pro Glu Ser Leu Met Thr Leu Asp

690 695 700

Gly Gly Ala Gly Pro Arg Leu Ile Ala Asn Leu Leu Glu Thr Leu Ser

705 710 715 720

Val Pro Arg Thr Arg His Ala Ala

725

<210>132

<211>726

<212>PRT

<213>Thermobifida fusca

<400>132

Val Asp Asp Asn Ser Tyr Thr Thr Ser Gly Gly Ile Thr Val His Arg

1 5 10 15

Thr Ala Val Pro Cys Asp Pro Arg Ala Leu Ala Asp Leu Thr Val Asn

20 25 30

Val Glu Gln Arg Arg Gly Gly Val Leu Ser Ser Gly Met Glu Tyr Pro

35 40 45

Gly Arg Tyr Ser Arg Trp His Leu Gly Tyr Val Asp Pro Cys Leu Glu

50 55 60

Val Val Ala Arg Gly Arg Thr Ile Gly Ala Thr Ala Leu Asn Asp Arg

65 70 75 80

Gly Arg Val Leu Leu Pro Ala Val Ala Arg Ala Leu Thr Ala His Gly

85 90 95

Ala Val Val Glu His Thr Asp Asp Thr Val Ala Val Thr Val Pro Glu

100 105 110

Pro Asp Pro Thr Glu Phe Phe Thr Glu Glu Glu Arg Ser Arg Arg Leu

115 120 125

Ser Val Phe Ser Ala Leu Arg Ala Leu Val Gly Val Phe Phe His Ala

130 135 140

Glu Glu Pro His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ala

145 150 155 160

Phe Gln Phe Glu Pro Ile Glu Gln Val Leu Pro Arg Asp Pro Glu Asp

165 170 175

Arg Asp Leu Val Leu His Leu Pro Asp Glu Ile Ile Val His Asp Arg

180 185 190

Lys Arg Glu Ile Cys Gln Arg Tyr Ser Tyr Asp Phe Thr Leu Pro Glu

195 200 205

Glu Leu Arg Gly Pro Ala Gly Ala Thr Thr Arg Gly Leu Pro Arg His

210 215 220

Thr Glu Pro Thr Pro Pro Val Thr Pro Ala Ala Glu Val Pro Pro Gln

225 230 235 240

Pro Glu Pro Gly Ser Tyr Ala Arg Ile Val Ala Glu Ala Lys Glu Arg

245 250 255

Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser His Arg Leu Tyr

260 265 270

Ala Pro Cys Ala Ser Pro Ala Arg Phe Tyr Glu Arg Leu Arg Glu Arg

275 280 285

Asn Pro Ala Pro Tyr Glu Phe Phe Leu Asn Leu Gly Glu Gly Glu Tyr

290 295 300

Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Thr Gly Arg Pro

305 310 315 320

Gly Glu Gly Gln Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys

325 330 335

Arg Gly Ala Asp Ala Val Gly Asp Ala Glu Asn Ile Lys Glu Leu Leu

340 345 350

Ser Ser Ala Lys Glu Glu Ser Glu Leu Thr Met Cys Thr Asp Val Asp

355 360 365

Arg Asn Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Arg Val Ile

370 375 380

Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp

385 390 395 400

His Ile Glu Gly Ile Leu Arg Pro Glu Leu Asp Ala Ile Asp Ala Phe

405 410 415

Leu Thr His Met Trp Ala Val Thr Val Thr Gly Ala Pro Lys Thr Trp

420 425 430

Ala Met Arg Phe Ile Glu Gln His Glu Ser Ser Pro Arg Arg Trp Tyr

435 440 445

Gly Gly Ala Val Gly Val Ile Asn Phe Asp Gly Ser Met Asn Thr Gly

450 455 460

Leu Thr Leu Arg Thr Ala His Ile Arg Asp Gly Val Ala Thr Val Arg

465 470 475 480

Ala Gly Ala Thr Leu Leu Tyr Asp Ser Asp Pro Glu Ala Glu Glu Arg

485 490 495

Glu Thr Phe Leu Lys Ala Arg Ala Leu Leu Glu Thr Leu Thr Asp Glu

500 505 510

Gly Glu Glu Thr Ser Lys Ala Ala Pro Ala Val Glu Gln Val Gly Ala

515 520 525

Gly Met Arg Val Leu Leu Val Asp His Glu Asp Ser Phe Val Asn Thr

530 535 540

Leu Ala Asp Tyr Val Arg Arg His Gly Ala Glu Val Thr Thr Val Arg

545 550 555 560

Tyr Gly Phe Asp Pro Ala Leu Leu Asp Gln Met Arg Pro Asp Leu Val

565 570 575

Val Leu Ser Pro Gly Pro Gly Leu Pro Ala Asp Phe Ala Met Ser Ala

580 585 590

Leu Leu Lys Glu Leu Asp Ala Arg Gly Leu Pro Val Phe Gly Val Cys

595 600 605

Leu Gly Leu Gln Ala Met Val Glu Tyr Ala Gly Gly Glu Leu Leu Thr

610 615 620

Leu Asp Thr Pro Val His Gly Lys Pro Gly Arg Val Arg Val Thr Gly

625 630 635 640

Gly Ala Leu Leu Ala Gly Leu Gly Glu Asp Gly Glu Phe Thr Ala Ala

645 650 655

Arg Tyr His Ser Val Tyr Ala Thr Pro Asp Arg Val Lys Gly Phe Glu

660 665 670

Val Thr Ala Val Thr Glu Asp Asp Gly Phe Pro Val Val Met Ala Ile

675 680 685

Glu Asn Ala Glu Ala Arg Arg Trp Ala Val Gln Phe His Pro Glu Ser

690 695 700

Ile Leu Thr Gly Arg Val Gly Glu Gln Ile Val Ala Asn Val Leu Arg

705 710 715 720

Leu Ala Arg Glu Ser Ser

725

<210>133

<211>281

<212>PRT

<213>高粱(Sorghum bicolor)

<400>133

Met Val Cys Ser Gln Leu Thr Ala Ala Gly Ala Ser Ser Leu Ala Ala

1 5 10 15

Ala Ala Val Arg Ser Arg Ala His Ser Pro Ala Ala Ala Phe Ala Gln

20 25 30

Leu Arg Ser Thr Pro Arg Ile Ala Ser Ala Gly Leu Ser Val Lys Gly

35 40 45

Asn Arg Ala Ala Leu Pro Leu Val Ala Ala Ala Gly Pro Ala Ala Ala

50 55 60

Ala Pro Val Ala Asp Leu Asp Gly Pro Pro Ala Thr Glu Lys Gln Pro

65 70 75 80

Ile lle Val Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Ash Leu Cys Gln

85 90 95

Tyr Met Gly Glu Leu Gly Leu Asn Phe Glu Val Tyr Arg Asn Asp Glu

100 105 110

Leu Thr Ile Glu Asp Val Lys Arg Lys Asn Pro Arg Gly Ile Leu Ile

115 120 125

Ser Pro Gly Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln Ala

130 135 140

Val Leu Glu Leu Gly Pro Thr Ile Pro Ile Phe Gly Val Cys Met Gly

145 150 155 160

Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly Lys Ile Ile Arg Ala Pro

165 170 175

Ser Gly Val Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu Glu

180 185 190

Leu Gly Lys Ala Leu Phe Asn Gly Leu Pro Asn Pro Phe Thr Ala Ala

195 200 205

Arg Tyr His Ser Leu Val Ile Glu Glu Glu Thr Phe Pro His Asp Ala

210 215 220

Leu Glu Ala Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg

225 230 235 240

His Lys Lys Tyr Lys His Ile Gln Gly Val Gln Phe His Pro Glu Ser

245 250 255

Ile Ile Thr Pro Asp Gly Lys Lys Ile Ile Leu Asn Phe Val Arg Phe

260 265 270

Ile Glu Glu Leu Glu Lys Gln Arg Ser

275 280

<210>134

<211>1122

<212>DNA

<213>高粱(Sorghum bicolor)

<400>134

gtcgacccac gcgtccgccg cctccccacc ctcgctccct ctcaccgccc gccaccgccg 60

agatggtctg ctcccagctc accgccgcgg gggcctcctc cctcgccgcc gcagcggttc 120

gttcccgggc gcattcccca gccgccgcct tcgcgcaact acggtcgacg cctcgcattg 180

cgagcgctgg cttgtcggtt aagggaaaca gggcggctct tccgttggtc gccgccgcgg 240

ggccggccgc ggcggcgccg gtggccgacc tggacggccc cccggccacg gagaagcagc 300

ccatcattgt catcgataac tacgacagct tcacctacaa cctctgccag tatatggggg 360

agcttggatt gaactttgaa gtataccgca atgatgaact gaccatagaa gatgtaaaga 420

ggaagaaccc aagaggaata cttatttctc cagggcctgg tgaaccacaa gattcaggaa 480

tatcattgca ggctgttctt gaattaggcc caaccatccc aatttttgga gtttgcatgg 540

gcctgcagtg cattggggag gcatttgggg gaaagattat ccgtgctcct tctggagtga 600

tgcatgggaa aagctctcca gtttattacg acgaggaatt aggaaaggcc ttattcaatg 660

gcttgccaaa cccttttacc gctgcgaggt accacagctt ggtcattgag gaagaaacct 720

tcccgcatga tgctttagag gccactgcat ggactgaaga tggacttatc atggctgctc 780

gccacaagaa gtacaaacac atccagggtg tccaattcca cccggagagc atcatcaccc 840

ctgacggcaa gaaaatcatc ctcaatttcg tcagattcat tgaggaactg gagaagcagc 900

gttcctaggg aggtagatgc caccggtggc ttcatagatc agtcagaagc agagacaaag 960

gcgcttgaag ctgcgtagta ccgggtctgg cagtggaagt tagctaggaa acagcctttt 1020

tcctccctta attcgttgtg ctcgtggtaa tataatctgt gtggactgaa tttcgaataa 1080

agtccagctg ttcaaataaa aaaaaaaaaa aagggcggcc gc 1122

<210>135

<211>1934

<212>DNA

<213>高粱(Sorghum bicolor)

<400>135

gtcgacccac gcgtccgcgt gacaccccgc gcggcacctc cgcctcccca ccctcgctcc 60

ctctcaccgc ccgccaccgc cgagatggtc tgctcccagc tcaccgccgc gggggcctcc 120

tccctcgccg ccgcagcggt tcgttcccgg gcgcattccc cagccgccgc cttcgcgcaa 180

ctacggtcga cgcctcgcat tgcgagcgct ggcttgtcgg ttaagggaaa cagggcggct 240

cttccgttgg tcgccgccgc ggggccggcc gcggcggcgc cggtggccga cctggacggc 300

cccccggcca cggagaagca gcccatcatt gtcatcgata actacgacag cttcacctac 360

aacctctgcc agtatatggg ggagcttgga ttgaactttg aagtataccg caatgatgaa 420

ctgaccatag aagatgtaaa gaggaagaac ccaagaggaa tacttatttc tccagggcct 480

ggtgaaccac aagattcagg aatatcattg caggctgttc ttgaattagg cccaaccatc 540

ccaatttttg gagtttgcat gggcctgcag tgcattgggg aggcatttgg gggaaagatt 600

atccgtgctc cttctggagt gatgcatggg aaaagctctc cagtttatta cgacgaggaa 660

ttaggaaagg ccttattcaa tggcttgcca aaccctttta ccgctgcgag gtaccacagc 720

ttggtcattg aggaagaaac cttcccgcat gatgctttag aggccactgc atggactgaa 780

gatggactta tcatggctgc tcgccacaag aagtacaaac acatccaggg tgtccaattc 840

cacccggaga gcatcatcac ccctgacggc aagaaaatca tcctcaattt cgtcagattc 900

attgaggaac tggagaagca gcgttcctag ggaggtagat gccaccggtg gcttcataga 960

tcagtcagaa gcagagacaa aggcgcttga agctgcgtag taccgggtct ggcagtggaa 1020

gttagctagg aaacagcctt tttcctccct taattcgttg tgctcgtggt aatataatct 1080

gtgtggactg aatttcgaat aaagtccagc tgttcaaata aaaaaaaaaa aaaagggcgg 1140

ccgctaccct cgaggccggc cgggccggga agccgcgatg ttaaatgtgt ggtccttagc 1200

aatcaaatct gcgtacaaga tggaatctct attattttca gcgaaaccaa gggattccgt 1260

gagcgcatcc gagggaggaa ggtgggcgta cctttaggct tctttccgac ctccgggaag 1320

tgcggcgagg gtttcatggc gatgttggcg gctgcaaggc cggcgcgccg gatagaggcg 1380

ggggcagggg aactgacaag ggtttaacta cgcgaacgcg cactgcagga atggacgagc 1440

tcgctctctc aaatcggccg aatgcgctcg tcccaccgag acgccgtctt gctccgtctc 1500

cctgtctcgc tcacgcggac gctccacgcg agcagggcag gccgaggagg gcgacggcgc 1560

agccgggcga cggcgcgagg agagcgatgg cgcgaagagt gcagaacgcg cggctcggcg 1620

gcggcgcagc tgtgcggcgg cgcggttggg ccgcggtggc ggagaacggt gaacggaaga 1680

acgaagaaga aagggaaaga agcctttgta tgacacgtgg gtcccgcagt tagaagggtt 1740

aaatctgttg tctcatccat cacgtagtct taattttttt ttcactagtc tgtgttaatg 1800

ctacgatctt aagaagccag cgacaataag agtagctcta ataaaaaaaa aaaaaaaaag 1860

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaacaaaaa aaaaaaaaaa aaaggcccct 1920

agggccctcg agct 1934

<210>136

<211>2055

<212>DNA

<213>玉米(Zea mays)

<400>136

ggccggccgg gactccactc cactccactc gcccgcgccc gccgcccgcg tgctcctccc 60

tcgcgcccgc cccgccccgc tccgccccta tctatatcca ttcccgctcg tccccctcaa 120

caaccctcct cacggcgcac tcgtgttcgt gtcatcccgc ccgcaggccg cagtccatgg 180

ccaccgccag cctcgcgctc tcgctgcgcc tcgcgccgta ctcgcacccg ctgagcctcc 240

gccgccgggg ggccgccggc gtcacctgcc gcgccaccac cgccacgttc caccagcttg 300

acgccgtcgc ggtgagggag gaggagtcca ggttccggac ggcggcggcg gagggccgca 360

acctgctgcc gctcacgagg tgcatcttct ccgatcacct cacgcccgtg ctcgcctacc 420

gctgcctcgt caaggaggac gaacgcgagg cgcccagctt tctattcgag tctgtcgagc 480

aggggtccga gggcaccaat gtggggaggt acagcgtggt cggggcgcag ccttctatgg 540

aggtcgtggc caaggctaac catgtgacgg tcatggacca tgagatgaag tcgaggaggg 600

agcacttcgt gcctgatccc atgaggatcc ccaggacaat catggagcag tggaacccgc 660

agattgctga cagcctccct gatgcatttt gtggaggatg ggttggattc ttctcatatg 720

atacagtgcg ttatgttgaa acaaagaagc ttcctttcag taaggcacca catgatgata 780

ggaaccttcc tgatattcat ttaggcctct atagtgacgt cattgtgttt gatcatgttg 840

aaaagaaaac acatgttatt cattgggtga ggacagactg ctatcgttct gttgatgaag 900

catatgaaga tggaagaaat cggcttgaag ctttgttatc aagattacat tgcctcaatg 960

tcccaacact ttcttctggt tctataaaac tcaatgttga aaactttggc ccagtaatgc 1020

aaaaatcaac gatgtcaagc gaagaatata aaaatatcgt tgtccaagct aaagaacaca 1080

tcttggccgg tgacattttc caagttgttt taagccagcg ttttgagaga cggacattcg 1140

ccgacccctt tgaaatctat cgtgcattgc gcatcgtaaa tcctagtcca tatatggcct 1200

atctacaggc acgaggttgt attctcgtgg catcgagtcc tgaaattctt acccgggtac 1260

aaaagaggac aataatcaat cgtccgcttg ctggaaccat aagaagaggc aaaacaaaag 1320

cagaagacaa aactttagaa caattgcttt tgagtgacga aaagcagtgt gctgaacata 1380

ttatgctagt agatcttggc cgaaatgatg ttgggaaggt gtccaaacca ggttcagtaa 1440

aggtagagaa attgatgaat atcgaacgat attctcatgt catgcacatc agctcaacag 1500

taactggaga gctacgcgat gatcttacgt gttgggatgc gctacgagcc gcattgccag 1560

ttggaaccgt tagtggcgct ccaaaggtga gagcaatgga gttgattgat cagctagaag 1620

tgagtatgcg tgggccgtat agtggtggct ttggagggat ttcctttcgc ggcgacatgg 1680

acattgcact ggctcttcgc actatcgtct tccccaccgc atctcggttt gataccatgt 1740

actcgtacac agacagtaag tcccgacagg agtgggtggc tcacctccag gccggagctg 1800

gcatagttgc tgatagcaaa ccggatgacg agcaccaaga gtgtataaac aaggctgcag 1860

gtgttgctcg tgccattgac cttgctgaat ctacatttct tgaagactag tctagtctaa 1920

tgaaggaaat gtatgtttaa gttctctgta caattatgga ttgtcctaga aaacaggctt 1980

tcttaggccg aataaaaact caattgtaat aaagttaata aatggacaac tttagctaaa 2040

aaaaaaaaaa aaaaa 2055

<210>137

<211>577

<212>PRT

<213>玉米(Zea mays)

<400>137

Met Ala Thr Ala Ser Leu Ala Leu Ser Leu Arg Leu Ala Pro Tyr Ser

1 5 10 15

His Pro Leu Ser Leu Arg Arg Arg Gly Ala Ala Gly Val Thr Cys Arg

20 25 30

Ala Thr Thr Ala Thr Phe His Gln Leu Asp Ala Val Ala Val Arg Glu

35 40 45

Glu Glu Ser Arg Phe Arg Thr Ala Ala Ala Glu Gly Arg Asn Leu Leu

50 55 60

Pro Leu Thr Arg Cys Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala

65 70 75 80

Tyr Arg Cys Leu Val Lys Glu Asp Glu Arg Glu Ala Pro Ser Phe Leu

85 90 95

Phe Glu Ser Val Glu Gln Gly Ser Glu Gly Thr Asn Val Gly Arg Tyr

100 105 110

Ser Val Val Gly Ala Gln Pro Ser Met Glu Val Val Ala Lys Ala Asn

115 120 125

His Val Thr Val Met Asp His Glu Met Lys Ser Arg Arg Glu His Phe

130 135 140

Val Pro Asp Pro Met Arg Ile Pro Arg Thr Ile Met Glu Gln Trp Asn

145 150 155 160

Pro Gln Ile Ala Asp Ser Leu Pro Asp Ala Phe Cys Gly Gly Trp Val

165 170 175

Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Thr Lys Lys Leu

180 185 190

Pro Phe Ser Lys Ala Pro His Asp Asp Arg Asn Leu Pro Asp Ile His

195 200 205

Leu Gly Leu Tyr Ser Asp Val Ile Val Phe Asp His Val Glu Lys Lys

210 215 220

Thr His Val Ile His Trp Val Arg Thr Asp Cys Tyr Arg Ser Val Asp

225 230 235 240

Glu Ala Tyr Glu Asp Gly Arg Asn Arg Leu Glu Ala Leu Leu Ser Arg

245 250 255

Leu His Cys Leu Ash Val Pro Thr Leu Ser Ser Gly Ser Ile Lys Leu

260 265 270

Asn Val Glu Asn Phe Gly Pro Val Met Gln Lys Ser Thr Met Ser Ser

275 280 285

Glu Glu Tyr Lys Asn Ile Val Val Gln Ala Lys Glu His Ile Leu Ala

290 295 300

Gly Asp Ile Phe Gln Val Val Leu Ser Gln Arg Phe Glu Arg Arg Thr

305 310 315 320

Phe Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro

325 330 335

Ser Pro Tyr Met Ala Tyr Leu Gln Ala Arg Gly Cys Ile Leu Val Ala

340 345 350

Ser Ser Pro Glu Ile Leu Thr Arg Val Gln Lys Arg Thr Ile Ile Asn

355 360 365

Arg Pro Leu Ala Gly Thr Ile Arg Arg Gly Lys Thr Lys Ala Glu Asp

370 375 380

Lys Thr Leu Glu Gln Leu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu

385 390 395 400

His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser

405 410 415

Lys Pro Gly Ser Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr

420 425 430

Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Arg Asp

435 440 445

Asp Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr

450 455 460

Val Ser Gly Ala Pro Lys Val Arg Ala Met Glu Leu Ile Asp Gln Leu

465 470 475 480

Glu Val Ser Met Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser

485 490 495

Phe Arg Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val Phe

500 505 510

Pro Thr Ala Ser Arg Phe Asp Thr Met Tyr Ser Tyr Thr Asp Ser Lys

515 520 525

Ser Arg Gln Glu Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val

530 535 540

Ala Asp Ser Lys Pro Asp Asp Glu His Gln Glu Cys Ile Asn Lys Ala

545 550 555 560

Ala Gly Val Ala Arg Ala Ile Asp Leu Ala Glu Ser Thr Phe Leu Glu

565 570 575

Asp

<210>138

<211>22

<212>DNA

<213>人工的

<220>

<223>引物.

<400>138

atggcagcgg taattctgga ag 22

<210>139

<211>19

<212>DNA

<213>人工的

<220>

<223>引物.

<400>139

tcaggctgcc ttggtcttc 19

<210>140

<211>30

<212>DNA

<213>人工的

<220>

<223>引物.

<400>140

actgactcca tggcagcggt aattctggaa 30

<210>141

<211>20

<212>DNA

<213>人工的

<220>

<223>引物.

<400>141

ctgactagtt caggctgctt 20

<210>142

<211>30

<212>DNA

<213>人工的

<220>

<223>引物.

<400>142

tgctgaccat ggcctgctcc cacatcgtcg 30

<210>143

<211>34

<212>DNA

<213>人工的

<220>

<223>引物.

<400>143

cagtgaattc ctacgaacgc tgcttctcca gttc 34

Claims

1.编码邻氨基苯甲酸合酶的分离的DNA分子，其中该DNA分子编码与选自SEQ ID NOs：66、108、109、110、111、133或137的蛋白质基本上同源的蛋白质。

2.权利要求1的分离的DNA分子，其中该DNA分子与选自SEQ ID NOs：67、68、104、105、106、107、134、135或136的DNA分子基本上同源。

3.包括表达盒的DNA构建体，其中该可操作连接的表达盒包括(i)异源启动子；(ii)编码单体邻氨基苯甲酸合酶蛋白质的DNA分子，其中该单体的邻氨基苯甲酸合酶包括包含邻氨基苯甲酸合酶α-结构域和邻氨基苯甲酸合酶β-结构域的单个多肽；和(iii)转录终止子。

4.权利要求3的DNA构建体，其中单体的邻氨基苯甲酸合酶蛋白质是与选自SEQ ID NOs：4、7、43、57、77、78、79、80、81、82、130、131或132的蛋白质基本上同源的。

5.权利要求3的DNA构建体，其中该蛋白质是SEQ ID NO：4。

6.权利要求3的DNA构建体，其中该DNA分子是与选自SEQ ID NOs：1、75、76、83、121、122、123、124、125、126、127、128或129的DNA分子基本上同源的。

7.权利要求3的DNA构建体，其中该表达盒进一步编码质体运输肽。

8.权利要求7的DNA构建体，其中该质体运输肽选自SEQ ID NOs：72、74、114或115。

9.包括第一表达盒的DNA构建体，其中可操作连接的第一表达盒，包括(i)异源启动子；(ii)编码邻氨基苯甲酸合酶α-结构域蛋白质的DNA分子；和(iii)转录终止子。

10.权利要求9的DNA构建体，进一步包括可操作连接的第二表达盒，包括(i)异源启动子；(ii)编码邻氨基苯甲酸合酶β-结构域蛋白质的DNA分子；和iii)转录终止子。

11.权利要求10的DNA构建体，其中该α-结构域或β-结构域蛋白质是与选自SEQ ID NOs：5、6、8、44、45、66、99、100、101、102、103、108、109、110、111、117、118、133或137的蛋白质基本上同源的。

12.权利要求10的DNA构建体，其中编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子是与选自SEQ ID NOs：2、3、67、94、95、96、97、98、104、105、106、112、116、119、120、134、135或136的DNA分子基本上同源的。

13.权利要求10的DNA构建体，其中编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子选自SEQ ID NOs：2、3、67、94、95、96、97、98、104、105、106、112、116、119、120、134、135或136。

14.权利要求10的DNA构建体，其中α-结构域蛋白质是SEQ ID NO：66，而β-结构域蛋白质是SEQ ID NO：118。

15.用于改变植物中色氨酸含量的方法，包括：

a.将包括编码邻氨基苯甲酸合酶的分离DNA分子的转基因导入可再生的植物细胞，其中该分离的DNA被可操作地连接到在植物细胞中有功能的启动子上，以产生转化的植物细胞；以及

b.从转化的植物细胞再生植物，其中该植物细胞表达由分离的DNA编码的邻氨基苯甲酸合酶，相对于不包括转化基因的具有相同或相似遗传背景的第二植物中的色氨酸含量，该合酶的数量有效增加了该植物中的色氨酸含量。

16.权利要求15的方法，其中邻氨基苯甲酸合酶是与选自根瘤农杆菌(Agrobacterium tumefaciens)、鱼腥藻属(Anabaena)M22983、巴西固氮螺菌(Azospirillum brasilense)、大豆慢生根瘤菌(Bradyrhizobium japonicum)、马尔他布鲁氏菌(Brucella melitensis)、Mesorhizobium loti、念珠藻属的种(Nostocsp.)PCC7120、苜蓿中华根瘤菌(Rhizobium meliloti)、深红红螺菌(Rhodospirillum rubrum)、血色红假单胞菌(Rhodopseudomonas palustris)或Thermobifida fusca的单体邻氨基苯甲酸合酶基本上同源的。

17.权利要求15的方法，其中邻氨基苯甲酸合酶选自SEQ ID NOs：4、7、43、57、77、78、79、80、81、82、130、131或132。

18.权利要求15的方法，其中邻氨基苯甲酸合酶是由与选自SEQ ID NOs：1、75、76、83、121、122、123、124、125、126、127、128或129的DNA分子基本上同源的DNA分子编码的。

19.权利要求15的方法，其中邻氨基苯甲酸合酶包括嵌合的单体邻氨基苯甲酸合酶，其包括第一种属的邻氨基苯甲酸合酶α-结构域和来自第二种属的邻氨基苯甲酸合酶β-结构域的融合体，其中第一种属和第二种属选自根瘤农杆菌、鱼腥藻属M22983、拟南芥(Arabidopsis thaliana)、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌(Escherichia coli)、薄肌眼虫藻(Euglena gracilis)、Mesorhizobium loti、念珠藻属的种PCC7120、苜蓿中华根瘤菌、深红红螺菌、芸香(Ruta graveolens)、血色红假单胞菌、鼠伤寒沙门氏菌(Salmonella typhimurium)、粘质沙雷氏杆菌(Serratia marcescens)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、Thermobifida fusca、高粱、大豆、稻、棉花、小麦、烟草或玉米。

20.权利要求19的方法，其中α-结构域或β-结构域至少是部分的SEQ IDNOs：4、5、6、7、8、43、44、45、57、66、77、78、79、80、81、82、99、100、101、102、103、108、109、110、111、117、118、130、131、132、133或137。

21.权利要求15的方法，其中DNA分子进一步编码质体运输肽。

22.权利要求21的方法，其中该质体运输肽选自SEQ ID NOs：72、74、114或115。

23.权利要求15的方法，其中植物是双子叶植物。

24.权利要求33的方法，其中双子叶植物选自大豆、棉花或canola。

25.权利要求20的方法，其中植物是单子叶植物。

26.权利要求25的方法，其中单子叶植物选自玉米、稻、小麦、大麦或高粱。

27.用于制备动物饲料或人食品的方法，包括：

a.将包括编码邻氨基苯甲酸合酶的分离DNA分子的转基因导入可再生的植物细胞，其中该分离的DNA分子被可操作地连接到在植物细胞中有功能的启动子上，以产生转化的植物细胞；以及

b.从转化的植物细胞再生植物，其中该植物细胞表达由分离的DNA分子编码的邻氨基苯甲酸合酶，相对于不包括转化基因的具有相同或相似遗传背景的第二植物中的色氨酸含量，该合酶的数量有效增加了该植物中的色氨酸含量。

28.权利要求27的方法，其中邻氨基苯甲酸合酶选自SEQ ID NOs：4、7、43、57、77、78、79、80、81、82、130、131或132。

29.权利要求27的方法，其中邻氨基苯甲酸合酶包括嵌合的单体邻氨基苯甲酸合酶，其包括第一种属的邻氨基苯甲酸合酶α-结构域和第二种属的邻氨基苯甲酸合酶β-结构域的融合体，其中第一种属和第二种属选自根瘤农杆菌、鱼腥藻属M22983、拟南芥、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、Mesorhizobium loti、念珠藻属的种PCC7120、苜蓿中华根瘤菌、深红红螺菌、芸香、血色红假单胞菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、硫磺矿硫化叶菌、Thermobifida fusca、高粱、大豆、稻、棉花、小麦、烟草或玉米。

30.通过权利要求27的方法所制备的动物饲料或人食品。

31.包括权利要求10的DNA构建体的动物饲料或人食品。

32.通过权利要求27的方法所制备的转基因植物。

33.包括权利要求10的DNA构建体的转基因植物。