CN1852975A - 转基因的高色氨酸植物 - Google Patents

转基因的高色氨酸植物 Download PDF

Info

Publication number
CN1852975A
CN1852975A CNA038156148A CN03815614A CN1852975A CN 1852975 A CN1852975 A CN 1852975A CN A038156148 A CNA038156148 A CN A038156148A CN 03815614 A CN03815614 A CN 03815614A CN 1852975 A CN1852975 A CN 1852975A
Authority
CN
China
Prior art keywords
acid synthase
amino benzoyl
plant
seq
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038156148A
Other languages
English (en)
Other versions
CN1852975B (zh
Inventor
莉萨·M·韦弗
蒂姆·N·奥尔马索夫
加布里拉·瓦杜瓦
梁继红
玛格丽特·J·瓦拉戈纳
蒂亚马冈德鲁·V·文卡蒂什
西瓦林加纳·曼朱纳思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Monsanto Co
Original Assignee
Monsanto Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Monsanto Co filed Critical Monsanto Co
Publication of CN1852975A publication Critical patent/CN1852975A/zh
Application granted granted Critical
Publication of CN1852975B publication Critical patent/CN1852975B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • C12N15/8254Tryptophan or lysine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Nutrition Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供通过在植物细胞中导入和表达编码邻氨基苯甲酸合酶的分离DNA片段来改变植物的色氨酸含量的方法。也提供用编码邻氨基苯甲酸合酶的分离DNA片段转化的转基因植物,以及来源于这些植物的人或动物的食物、种子和后代。

Description

转基因的高色氨酸植物
本申请要求于2002年5月3日提交的,美国临时申请系列号为60/377,727的权利。
许多重要的农作物,包括大豆和玉米的种子不包含营养完全的充足数量的几种氨基酸。这些氨基酸包括但不限于:色氨酸、异亮氨酸、缬氨酸、精氨酸、赖氨酸、甲硫氨酸和苏氨酸。因此,这些氨基酸的生物合成途径,和/或进入那些途径的代谢产物的生物合成途径,是用于增加这些植物的氨基酸含量的潜在的操作目标。
邻氨基苯甲酸合酶(AS,EC4.1.3.27)催化植物、真菌和细菌中从芳香氨基酸途径到生物合成色氨酸分出支路的第一反应。
Figure A0381561400061
邻氨基苯甲酸合酶(例如玉米邻氨基苯甲酸合酶)的最普遍形式是由2个亚基,α或TrpE亚基和β或TrpG亚基组成的异四聚体酶。2个α-亚基和2个β-亚基装配形成异四聚体的邻氨基苯甲酸合酶。也已经发现″单体″形式的AS包括具有TrpE和TrpG亚基活性的单个多肽链(例如苜蓿中华根瘤菌(Rhizobium meliloti))。当单体的邻氨基苯甲酸合酶只包括一类多肽时,单体邻氨基苯甲酸合酶的酶促活性形式一般是由2个这种单体多肽的同型二聚体组成的。异四聚体和单体的邻氨基苯甲酸合酶都在利用谷氨酰胺和分支酸的反应中催化形成邻氨基苯甲酸。在α-亚基(在此指″α-结构域″)上发现的结构域结合分支酸并除去烯醇丙酮酸侧链,而在β-亚基(在此指″β-结构域″)上发现的结构域将氨基从谷氨酰胺传递到羧酸和烯醇丙酮酸部分间的分支酸苯基环上的位置。
合成色氨酸的下一个反应是将磷酸核糖焦磷酸的磷酸核糖基部分传递到邻氨基苯甲酸上。吲哚环在2个步骤形成,包括将核糖基团异构转化为核酮糖,然后是环化反应以产生吲哚磷酸甘油。该途径中的最后反应由可能包含1个或2个亚基的单个酶催化。该反应实现吲哚甘油醛-3-磷酸的切割和吲哚基团与丝氨酸的缩合(Umbarger,Ann.Rev.Biochem.,47:555(1978))。
在较高等的植物和微生物中流入色氨酸途径的代谢产物显然受到色氨酸的邻氨基苯甲酸合酶反馈抑制的调节。色氨酸可阻断需要活化β-结构域和产生相对于α-结构域活性部位的氨通道途径的构像重排。这种色氨酸的反馈抑制被认为降低了经邻氨基苯甲酸合酶的色氨酸的生产。参见Li J.和Last,R.L.,拟南芥(Arabidopsis thaliana)trp5突变株具有抗反馈的邻氨基苯甲酸合酶和升高的可溶解色氨酸The Arabidopsis thaliana trp5 mutant has afeedback-resistant anthranilate synthase and elevated soluble tryptophan(植物生理学Plant Physiol.,110:51-59(1996))。
已经鉴定几个氨基酸残基涉及来自鼠伤寒沙门氏菌(Salmonellatyphimurium)的邻氨基苯甲酸合酶复合物的反馈调节。这种信息提供了氨基末端调节位点的证据(生物化学杂志J.Biol.Chem.,266:8328-8335(1991))。Niyogi等人已经使用分子的方法进一步表征来自某些植物的邻氨基苯甲酸合酶。参见,Niyogi和Fink,植物细胞Plant Cell,4:721(1992)和Niyogi等人,植物细胞Plant Cell,5:1011(1993)。他们发现拟南芥邻氨基苯甲酸合酶的α-亚基是由2个紧密相关的、分别调节的非等位基因编码的。这些α-亚基基因中的一个,ASA1,是由创伤和细菌性病原体浸润诱导的,暗示其涉及防御反应,而另一个α-亚基基因,ASA2是以组成性的基础水平表达的。两种预测的蛋白质共用与细菌和真菌的邻氨基苯甲酸合酶蛋白质同源的区域,并且在已经被证明描述涉及细菌中色氨酸反馈抑制的位置包含保守的氨基酸残基(Caligiuri等人,生物化学杂志J.Biol.Chem.,266:8328(1991))。
色氨酸的氨基酸类似物和色氨酸生物合成途径中的中间体的类似物(例如5-甲基色氨酸、4-甲基色氨酸、5-氟基色氨酸、5-羟色氨酸、7-氮杂色氨酸、3β-吲哚基乙酸、3-甲基邻氨基苯甲酸)已经显示抑制原核和真核生物的生长。可对植物细胞培养物进行抗这些氨基酸类似物的筛选。例如,已经选择抗5-甲基色氨酸(5-MT)、色氨酸的氨基酸类似物的生长抑制所培养的烟草、胡萝卜、马铃薯、谷物和毛曼陀罗(Datura innoxia)细胞系,其生长抑制是由于表达改变的邻氨基苯甲酸合酶。
Ranch等人,植物生理学Plant Physiol.71:136(1983)在双子叶植物杂草,毛曼陀罗的细胞培养物中选择5-MT抗性,并且报道抗性的细胞培养物包含增加的色氨酸水平(比野生型水平高出8-30倍)并具有对色氨酸反馈抑制灵敏度较小的邻氨基苯甲酸合酶。再生的植物也是对5-MT有抗性的,包含改变的邻氨基苯甲酸合酶,并且在叶片中具有比对照植物的叶片更大的游离色氨酸浓度(4-44倍)。与在烟草(N.tabacum)中的研究相比,改变的酶不在从抗性细胞系再生的植物中表达,这些结果表明氨基酸过量产生的表型可在细胞水平选择并且在从毛曼陀罗中所选择的细胞再生的完整植株中表达。
Hibberd等人(美国专利号4,581,847)描述了5-MT抗性的玉米细胞系包含比野生型的邻氨基苯甲酸合酶对反馈抑制较少敏感的邻氨基苯甲酸合酶。一种5-MT抗性细胞系比非转化的细胞系积聚大于几乎二十倍水平的游离色氨酸。
P.C.Anderson等人(美国专利号6,118,047)公开了利用来自C28玉米的邻氨基苯甲酸合酶的色氨酸不敏感的α-结构域在转基因中制备显示种子中游离色氨酸水平升高的转基因玉米植株(玉米(Zea mays))。
虽然有可能在某些细胞培养物和植物中选择5-MT抗性,这些特性不一定与完整植株中过量生产的游离色氨酸相关。另外,再生自5-MT抗性系的植物经常不表达酶的改变形式。也不能预测该特性将在一段时间内稳定并且将会作为可遗传的性状延续下去。还已经从高等植物的细胞培养物的粗提物中部分地纯化邻氨基苯甲酸合酶(Hankins等人,植物生理学Plant Physiol.,57:101(1976);Widholm,Biochim.Biophys.Acta,320:217(1973))。然而,发现它是很不稳定的。因此,必须提供具有可增加植物色氨酸含量的邻氨基苯甲酸合酶源的植物。
发明概述
本发明提供编码可用于产生转基因植物的邻氨基苯甲酸合酶(AS)的核酸。当这种邻氨基苯甲酸合酶在转基因植物中表达时,可在植物细胞内获得升高水平的色氨酸。在一个实施方案中,本发明涉及编码单体邻氨基苯甲酸合酶的DNA分子,其中这种单体的邻氨基苯甲酸合酶是天然的或是邻氨基苯甲酸合酶的α-和β-结构域的遗传工程嵌合融合体。来自几个种属(例如,一些细菌及其他微生物)的邻氨基苯甲酸合酶基因,天然地产生组成单个多肽链的单体邻氨基苯甲酸合酶。然而,大多种属具有由在分开亚基上发现的2个α和2个β结构域组成的异四聚体邻氨基苯甲酸合酶。本发明也预期形成包括连接任何β-结构域的任何邻氨基苯甲酸合酶α-结构域的嵌合邻氨基苯甲酸合酶的融合蛋白质。
通常,天然存在的单体邻氨基苯甲酸合酶与多数植物的邻氨基苯甲酸合酶序列的同一性是相当低的。然而,根据本发明,尽管与植物内源的邻氨基苯甲酸合酶的序列同一性很低,当在植物中表达时,这种单体邻氨基苯甲酸合酶可提供高水平的色氨酸。因此,本发明提供可具有差异(divergent)的序列而且能够在植物宿主中有效提供高水平的色氨酸的单体邻氨基苯甲酸合酶。例如,包含单体根瘤农杆菌(Agrobacterium tumefaciens)邻氨基苯甲酸合酶的转基因的大豆植株可在种子中产生达到大约10,000-大约12,000ppm的色氨酸,而平均的trp水平范围达到大约7,000-大约8,000ppm。相反,非转基因的大豆植株通常在种子中只具有达到大约100-大约200ppm的色氨酸。
因此,本发明提供编码单体邻氨基苯甲酸合酶的分离的DNA序列,其中单体的邻氨基苯甲酸合酶具有邻氨基苯甲酸α-结构域和邻氨基苯甲酸β-结构域,并且其中单体的邻氨基苯甲酸合酶是在植物中表达的。这种表达可提高植物中L-色氨酸的水平。
单体的邻氨基苯甲酸合酶可以是天然单体的。可从中分离天然单体邻氨基苯甲酸合酶核酸的生物体的实例,包括但不限于例如根瘤农杆菌、苜蓿中华根瘤菌(例如,Genbank登记号GI 95177)、Mesorhizobium loti(例如,Genbank登记号GI 13472468)、马尔他布鲁氏菌(Brucella melitensis)(例如,Genbank登记号GI 17982357)、念珠藻属(Nostoc sp.)PCC7120(例如,Genbank登记号GI 17227910或GI 17230725)、巴西固氮螺菌(Azospirillum brasilense)(例如,Genbank登记号GI1174156)和鱼腥藻属(Anabaena)M22983(例如,Genbank登记号GI152445)的生物体。在一些实施方案中,分离的DNA编码具有例如,SEQ ID NO:4的氨基酸序列或SEQ ID NOs:1或75中任何一个核苷酸序列的根瘤农杆菌邻氨基苯甲酸合酶。
可选地,单体的邻氨基苯甲酸合酶可以是任何适用的邻氨基苯甲酸合酶的α和β结构域的融合体。这种α和β结构域可来源于玉米、芸香(Rutagraveolens)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、鼠伤寒沙门氏菌、粘质沙雷氏杆菌(Serratia marcescens)、大肠杆菌(Escherichia coli)、根瘤农杆菌、拟南芥、苜蓿中华根瘤菌(例如,Genbank登记号GI 95177)、百脉根根瘤菌(Mesorhizobiun loti)(例如,Genbank登记号GI 13472468)、马尔他布鲁氏菌(例如,Genbank登记号GI 17982357)、念珠藻属PCC7120(例如,Genbank登记号GI17227910或GI 17230725)、巴西固氮螺菌(例如,Genbank登记号GI 1174156)和鱼腥藻属(Anabaena)M22983(例如,Genbank登记号GI 152445)、大豆、稻、棉花、小麦、烟草或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因。例如,编码α或β结构域的核酸可利用任何SEQ ID NOs:1-70,75-113和116-137中的序列信息获得。
在另一个实施方案中,本发明提供编码来自玉米(Zea mays)的邻氨基苯甲酸合酶的α结构域,包括SEQ ID NOs:5或66的分离DNA。这种分离的DNA可具有核苷酸序列SEQ ID NOs:2,67或68。可将分离的DNA可操作地连接启动子,并且当在植物中表达时可在植物中提供升高水平的L-色氨酸。
在另一实施方案中,本发明提供编码邻氨基苯甲酸合酶的分离的DNA分子,其中DNA分子编码基本上与由SEQ ID NOs:66,108-111,133和137所例证说明的邻氨基苯甲酸合酶蛋白质同源的蛋白质。编码邻氨基苯甲酸合酶的分离DNA包括基本上与由SEQ ID NOs:67,68,104-107和134-136所例证说明的DNA分子同源的DNA分子。
在另一个实施方案中,本发明提供包括表达盒的DNA构建体,其中该可操作连接的表达盒包括(i)异源启动子;(ii)编码单体邻氨基苯甲酸合酶蛋白质的DNA分子,其中单体的邻氨基苯甲酸合酶包括包含邻氨基苯甲酸合酶α-结构域和邻氨基苯甲酸合酶β-结构域的单个多肽,以及(iii)转录终止子。单体的邻氨基苯甲酸合酶蛋白质可包括与由SEQ ID NOs:4,7,43,57,77-82和130-132所例证说明的蛋白质基本上同源的蛋白质。DNA分子可包括与由SEQ ID NOs:1,75,76,83和121-129所例证说明的DNA分子基本上同源的DNA分子。
在进一步的实施方案中,本发明提供包括第一表达盒的DNA构建体,其中第一表达盒可操作的连接,包括(i)异源启动子;(ii)编码邻氨基苯甲酸合酶α-结构域蛋白质的DNA分子和(iii)转录终止子。
上述的DNA构建体可进一步包括第二表达盒,包括可操作的连接(i)异源启动子;(ii)编码邻氨基苯甲酸合酶β-结构域蛋白质的DNA分子和(iii)转录终止子。DNA构建体可包括与由SEQ ID NOs:5,6,8,44,45,66,99,100,101,102,103,108,109,110,111,117,118,133或137所例证说明的蛋白质基本上同源的α-结构域或β-结构域蛋白质。编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子可包括与由SEQ ID NOs:2,3,67,94,95,96,97,98,104,105,106,112,116,119,120,134,135或136所例证说明的DNA分子基本上同源的DNA分子。具体的实例包括其中α-结构域邻氨基苯甲酸合酶蛋白质是SEQ ID NO:66和β-结构域蛋白质是SEQ ID NO:118的DNA构建体。
分离的DNA也可编码突变的邻氨基苯甲酸合酶或突变的邻氨基苯甲酸合酶结构域。这种突变的邻氨基苯甲酸合酶或其结构域可具有一种或多种突变。本领域的技术人员已知,突变可以是沉默的,可产生具有与野生型类似的酶活性的变异基因产物,或可产生具有改变的酶活性的衍生基因产物。本发明包括所有这类的突变。
可在体外或体内从野生型邻氨基苯甲酸合酶核酸产生突变的分离DNA,并且可编码例如,一种或多种氨基酸的取代、缺失或***。产生具有增加活性的、更大稳定性的或对色氨酸或色氨酸类似物的反馈抑制较少灵敏性的突变邻氨基苯甲酸合酶的突变的分离DNAs是合乎需要的。在一个实施方案中,邻氨基苯甲酸合酶或其结构域抗内源L-色氨酸或色氨酸类似物的抑制。例如,邻氨基苯甲酸合酶可在色氨酸-结合袋或减少邻氨基苯甲酸合酶灵敏性的其它地方,或其对于色氨酸抑制的结构域具有一种或多种突变。预期用于突变的氨基酸残基是例如在大约48,51,52,293,和298位置的残基。例如,突变可以是:
a)在大约48位用Phe替换Val;
b)在大约48位用Tyr替换Val;
c)在大约51位用Phe替换Ser;
d)在大约51位用Cys替换Ser;
e)在大约52位用Phe替换Asn;
f)在大约293位用Ala替换Pro;
g)在大约293位用Gly替换Pro;或
h)在大约298位用Trp替换Phe;
其中突变的位置由所选择的邻氨基苯甲酸合酶的氨基酸序列与根瘤农杆菌邻氨基苯甲酸合酶氨基酸序列的序列对比决定。具有这种突变的邻氨基苯甲酸合酶的实例包括具有SEQ ID NOs:58-65,69,70和84-94的邻氨基苯甲酸合酶。
分离的DNA可编码其他元件和功能。本领域的技术人员所预期的任何元件或功能都可包括在内。例如,分离的DNA也可包括在植物细胞中有功能的启动子,其可操作地连接到编码邻氨基苯甲酸合酶的DNA上。分离的DNA可进一步编码质体运输肽。分离的DNA也可编码选择性的标记或报道基因。这种选择性的标记可赋予所述植物细胞除草剂抗性、高蛋白含量、高含油量、高赖氨酸含量、高异亮氨酸含量、高生育酚含量等。DNA序列也可包括编码一种或多种来源于苏云金杆菌(Bacillus thuringiensis)的杀虫剂蛋白质的序列。
本发明进一步提供包括本发明的分离DNA的载体。这种载体可用于在原核和真核细胞中表达邻氨基苯甲酸合酶多肽,用于转化植物细胞并产生转基因植物。
本发明也提供包括本发明的分离DNA的转基因植物。这些分离DNAs在转基因植物中的表达可导致转基因植物,例如植物的种子或其他部分中的L-色氨酸,优选游离的L-色氨酸水平的升高。该水平增至高于不同于转基因大豆植物的,缺乏该DNA的,例如相应的未转化细胞或具有相同遗传背景的未转化植株的植物细胞中L-色氨酸的水平。DNA优选是可遗传的,其优选通过可繁殖植物的完全正常的生殖周期传递给其后代以及进一步传给下一代。
可具有这种分离的DNA的转基因植物包括双子叶植物(双子叶),例如大豆或Canola。可选地,转基因植物可以是单子叶植物(单子叶),例如玉米、稻、小麦、大麦或高粱。
本发明也提供包含任何本发明的分离DNAs、邻氨基苯甲酸合酶多肽、转基因或载体的任何转基因植物的种子。
本发明进一步提供包含具有本发明的分离DNA或DNA构建体的植物的至少一部分的动物饲料或人的食品。可被归入动物饲料或人食品的植物的部分包括例如,种子、叶片、茎、根、块茎或果实。所需要的植物部分具有由本发明的分离DNA编码的邻氨基苯甲酸合酶表达所提供的增加的色氨酸水平。
本发明进一步提供通过将本发明的分离DNA导入植物的可再生细胞用于改变、优选增加植物(双子叶植物或单子叶植物)中色氨酸含量的方法。优选地,DNA序列可操作地连接至少一种在植物细胞中可操作的启动子。鉴定或选择转化的细胞,然后再生以产生包括可表达功能性的邻氨基苯甲酸合酶多肽的植物。在一些实施方案中,编码邻氨基苯甲酸合酶或其结构域的DNA是突变的DNA。导入的DNA优选是可遗传的并且该植物优选是可繁殖的植物。例如,导入的DNA优选可通过完全的性周期传递给子代植株,并且可赋予子代的后代高色氨酸的表型。
编码邻氨基苯甲酸合酶的DNAs,优选整合到也可包括编码运输肽、例如质体运输肽的DNA序列和选择性标记或报道基因的,可操作地连接一种或多种在靶植物细胞中有功能的启动子的载体或″转化基因″中。启动子可以是例如,可诱导的启动子、组织特异的启动子、强启动子或弱启动子。其他的转录本或翻译调控元件,例如增强子或终止子,也可功能性地连接编码邻氨基苯甲酸合酶的DNA片段。
悬浮培养物中的细胞或胚胎、完整的组织或器官可通过多种转化技术转化,例如通过微粒子轰击、电穿孔和根瘤农杆菌介导的转化,及其他本领域适用的方法。
因此,转化植物的细胞,包括天然的邻氨基苯甲酸合酶基因和转化基因或其他编码外源邻氨基苯甲酸合酶的DNA片段。植物细胞中外源邻氨基苯甲酸合酶的表达可导致色氨酸及其次级代谢产物的水平增加。在一些实施方案中,这种表达赋予对一定数量的内源L-色氨酸类似物的耐受性,例如比具有野生型或色氨酸敏感的邻氨基苯甲酸合酶的植物细胞存在至少大约10%多的邻氨基苯甲酸合酶活性。
本发明也提供用于改变植物中色氨酸含量的方法,包括:(a)将包括可操作地连接到在植物细胞中有功能的启动子上、编码邻氨基苯甲酸合酶结构域和质体运输肽的分离DNA的转化基因导入植物的可再生细胞;以及(b)从所述的转化植物细胞再生转化植株,其中植物的细胞表达由分离的DNA编码的邻氨基苯甲酸合酶,相对于同样遗传背景的未转化植物中的色氨酸含量,该合酶表达的数量有效增加了所述植物中的色氨酸含量。结构域可以是邻氨基苯甲酸合酶α-结构域。邻氨基苯甲酸合酶结构域可具有一种或多种突变,例如,减少结构域对色氨酸抑制的灵敏性的突变。这种突变可以是例如在色氨酸结合袋(pocket)中。这种结构域可以是,例如,来自根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻(Euglena gracilis)、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、硫磺矿硫化叶菌、大豆、稻、棉花或玉米的邻氨基苯甲酸合酶结构域。芸香具有它自己的叶绿体转运序列,其可与邻氨基苯甲酸合酶转基因一起使用。因此,当利用芸香DNA时,本领域的技术人员不必增加质体转运序列。
本发明也提供包括编码单体邻氨基苯甲酸合酶或其结构域的DNA的,新的分离和纯化的DNA分子。当在植物内表达时,这种邻氨基苯甲酸合酶DNA可提供高水平的色氨酸。在一些实施方案中,邻氨基苯甲酸合酶基本上抗游离的L-色氨酸或其类似物的抑制。本发明包括的新的DNA序列的实例包括但不限于,从根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌;大豆慢生根瘤菌(Bradyrhizobium japonicum)、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞(Rhodopseudomonas palustris)、深红红螺菌(Rhodospirillum rubrum)、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、高粱(Sorghum bicolor)、硫磺矿硫化叶菌、Thermobifida fusca或玉米(Zea mays王蜀黍)或其他邻氨基苯甲酸合酶分离的DNA分子。
这些DNA序列包括具有在单个多肽链上连接至少另一个邻氨基苯甲酸合酶结构域的邻氨基苯甲酸合酶α-结构域的,合成的或天然存在的单体形式的邻氨基苯甲酸合酶。单体的邻氨基苯甲酸合酶可以例如,是邻氨基苯甲酸合酶α或β结构域的融合体。这种邻氨基苯甲酸合酶α或β结构域可来源于根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌、深红红螺菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、高粱(sorghum bicolor)、硫磺矿硫化叶菌、Thermobifidafusca、高粱属(sorghum)、大豆、稻、棉花、小麦、烟草或玉米(王蜀黍),或编码邻氨基苯甲酸合酶的亚基或结构域的任何基因。这种邻氨基苯甲酸合酶及其结构域在此也由分离自根瘤农杆菌,(SEQ ID NOs:175或84-94)、玉米,(SEQ ID NOs:2,67,68,96,116或136)、芸香(SEQ ID NO:3)、鱼腥藻M22983、拟南芥(SEQ ID NO:45)、巴西固氮螺菌(SEQ ID NO:122)、马尔他布鲁氏菌(SEQ ID NO:123)、百脉根根瘤菌(SEQ ID NO:121)、念珠藻属PCC7120(SEQ ID NOs:124或125)、苜蓿中华根瘤菌、血色红假单胞菌(SEQID NO:126)、硫磺矿硫化叶菌、稻(SEQ ID NOs:94,95,119或120)、小麦(SEQID NO:97)、烟草(SEQ ID NO:98)、陆地棉(Gossypium hirsutum)(SEQ ID NOs:104或105)、大豆(Glycine max)(SEQ ID NOs:106,107,112或113)、大豆慢生根瘤菌(SEQ ID NO:127)、深红红螺菌(SEQ ID NO:128)、Thermobifidafusca(SEQ ID NO:129)或高粱(SEQ ID NOs:134或135)的邻氨基苯甲酸合酶的核酸例证说明。这些核苷酸序列从根瘤农杆菌(SEQ ID NOs:4,58-65,69或70);玉米(SEQ ID NOs:5,66,101,118或137)和芸香(SEQ ID NO:6),鱼腥藻M22983、巴西固氮螺菌(SEQ ID NO:78)、马尔他布鲁氏菌(SEQ ID NO:79)、百脉根根瘤菌(SEQ ID NO:77)、念珠藻属PCC7120(SEQ ID NOs:80或81)、苜蓿中华根瘤菌(SEQ ID NOs:7或43)、血色红假单胞菌(SEQ ID NOs:57或82)、硫磺矿硫化叶菌(SEQ ID NOs:8或44)、稻(SEQ ID NOs:99,100或117)、小麦(SEQ ID NO:102)、烟草(SEQ ID NO:103)、陆地棉(SEQ ID NOs:108或109)、大豆(SEQ ID NOs:110或111)、大豆慢生根瘤菌(SEQ ID NO:130)、深红红螺菌(SEQ ID NO:131)、Thermobifida fusca(SEQ ID NO:132)或高粱(SEQ IDNO:133)编码邻氨基苯甲酸合酶或其α-结构域或β结构域。
本发明也提供包括编码具有酶活性的根瘤农杆菌邻氨基苯甲酸合酶或其结构域的DNA序列的分离DNA分子。这种DNA分子可编码具有SEQ IDNOs:4,58-65,69或70的邻氨基苯甲酸合酶,具有邻氨基苯甲酸合酶活性的结构域或其变体。DNA分子也可具有包括SEQ ID NOs:1,75或84-93,或其结构域或变体的序列。在此所提供的任何DNA的编码区也可被优化,用于在所选择的生物体,例如所选择的植物或微生物中表达。具有用于所选择植物的优化密码子的DNA分子的实例是具有SEQ ID NO:75的根瘤农杆菌邻氨基苯甲酸合酶的DNA分子。
本发明也提供包括编码玉米邻氨基苯甲酸合酶结构域的DNA序列的分离和纯化的DNA分子。这种DNA分子可编码具有SEQ ID NOs:5或66的邻氨基苯甲酸合酶结构域,或具有邻氨基苯甲酸合酶活性的其变体或衍生物。DNA分子也可具有包括SEQ ID NOs:2,67,或68的序列,或其结构域或变体。
本发明进一步提供与包括SEQ ID NOs:1,75或84-94中的任何一个的互补DNA分子在严谨条件下杂交的,至少8个核苷酸的分离的DNA分子。这种DNA分子可以是探针或引物、例如具有SEQ ID NOs:9-42,47-56或138-143中任何一个的核酸。可选地,DNA可包括所选择的邻氨基苯甲酸合酶或其结构域的全部编码区。这种DNA也可包括编码在植物细胞中可操作的启动子的DNA序列和/或编码质体运输肽的DNA序列。本发明进一步涉及用于在植物和/或微生物中转化和表达这类DNA分子的载体。
与在此所明确描述的DNA序列和氨基酸序列显示50%、优选60%、更优选70%、更优选80%、最优选90%,例如95%-99%的序列同一性的,功能性的邻氨基苯甲酸合酶DNA序列和功能性的邻氨基苯甲酸合酶多肽也在本发明的范畴内。例如85%同一性,指当2个序列对比进行最大匹配时,85%的氨基酸是相同的。在最大化匹配中容许缺口(gap)(在任何一个待匹配的2个序列中);5个或较少的间隙(gap)长度是优选的,而2个或更少是更优选的。
可选地和优选地,如在此所使用的术语,如果当利用具有突变数据矩阵以及6分或更大的缺口罚分的ALIGN程序时,它们具有大于5的序列对比积分(alignmentscore)(在标准偏差单位中),则这2种多肽序列是同源的。参见Dayhoff,M.O.,″蛋白质序列和结构的图谱Atlas of Protein Sequence andStructure″,1972,第5卷,国家生物医学研究基金会,pp.101-110,以及该卷的增刊2,pp.1-10。更优选地当利用ALIGN程序进行优化序列对比时,如果它们的氨基酸大于或等于50%相同,则2个序列或其部分是同源的。本发明进一步提供用于产生具有高种子水平的色氨酸的转基因植物的载体,包括编码单体邻氨基苯甲酸合酶的分离DNA序列,其中包含连接有邻氨基苯甲酸合酶β-结构域和质体运输肽,并可操作地连接在植物细胞中有功能的启动子的邻氨基苯甲酸合酶α-结构域。这种单体的邻氨基苯甲酸合酶可例如是,根瘤农杆菌,苜蓿中华根瘤菌、百脉根根瘤菌,马尔他布鲁氏菌,念珠藻属PCC7120,巴西固氮螺菌,鱼腥藻M22983,大豆慢生根瘤菌,深红红螺菌或Thermobifida fusca的邻氨基苯甲酸合酶。单体的邻氨基苯甲酸合酶也可来源于根瘤农杆菌,鱼腥藻M22983,拟南芥,巴西固氮螺菌,马尔他布鲁氏菌、百脉根根瘤菌,念珠藻属PCC7120,苜蓿中华根瘤菌,血色红假单胞菌,芸香,硫磺矿硫化叶菌,鼠伤寒沙门氏菌,粘质沙雷氏杆菌,大豆慢生根瘤菌,深红红螺菌,Thermobifida fusca,高粱,大豆,稻,棉花,小麦,烟草,玉米或编码邻氨基苯甲酸合酶的亚基或结构域的任何基因的邻氨基苯甲酸合酶α-和β-结构域的融合体。
提供增加水平的色氨酸的,分离和纯化的邻氨基苯甲酸合酶DNA的转化可在分子水平评估,例如,Southern或Northern印迹分析,基于PCR的方法学,邻氨基苯甲酸合酶的生物化学或免疫学检测,或通过表型分析,即,转化后代的细胞是否可在存在抑制未转化植物细胞生长的大量色氨酸的氨基酸类似物时生长。
本发明也提供在原核或真核宿主细胞,例如酵母、昆虫细胞或细菌中生产邻氨基苯甲酸合酶的方法,其可以是培养物,优选是商业规模的。该方法包括将包含编码邻氨基苯甲酸合酶或其结构域,例如单体邻氨基苯甲酸合酶,至少包括α和β邻氨基苯甲酸合酶的结构域,或其功能性变体的DNA片段的转化基因导入宿主细胞,并在宿主细胞中表达邻氨基苯甲酸合酶,以产生功能性的邻氨基苯甲酸合酶或其结构域的步骤。转化基因通常包括转录本和翻译调控元件,例如在真核或原核起源的宿主细胞中有功能的启动子。优选地,转基因被导入已知可用于生产重组蛋白质的,例如大肠杆菌的原核细胞,或例如酵母或昆虫细胞的真核细胞。培养转化细胞可导致增加色氨酸及其衍生物的生产,可从细胞或培养基中回收该产物。色氨酸的累积也可导致在微生物和植物中增加次级代谢产物的生产,例如包含吲哚的代谢产物,例如植物中的单个的吲哚,吲哚共轭物,吲哚生物碱,吲哚植物抗毒素和吲哚芥子油苷(glucosinalates)。
对色氨酸不敏感的邻氨基苯甲酸合酶具有增加多种分支酸衍生代谢产物的潜能,包括来自由于色氨酸通过分支酸变位酶刺激苯基丙氨酸所合成的苯基丙氨酸。参见Siehl,D.来自植物氨基酸的分支酸的色氨酸、酪氨酸和苯丙氨酸的生物合成:生物化学和生物工艺学,(The biosynthesis of tryptophan,tyrosine and phenylalanine from chorismate in Plant Amino Acids:Biochemistryand Biotechnology),ed.BK Singh,第171-204页。当反馈不敏感的邻氨基苯甲酸合酶存在时,可能增加的其他分支酸衍生的代谢产物包括,苯丙酮(phenylpropanoid)、类黄酮和异类黄酮,以及来源于邻氨基苯甲酸的代谢产物,例如吲哚、吲哚生物碱和吲哚异硫氰酸盐。许多化合物是重要的植物激素、植物防御化合物、各种健康状况的化学保护剂(chemopreventive agents)、和/或药物学活性的化合物。这些化合物的合成可能由于邻氨基苯甲酸合酶的表达而增加,其范围取决于表达邻氨基苯甲酸合酶的生物体。本发明涉及在多种原核和真核细胞或生物体,包括植物细胞、微生物、真菌、酵母、细菌、昆虫细胞和哺乳动物细胞中的色氨酸及其他有用化合物的合成。
因此,本发明提供用于生产色氨酸的方法,包括:在足够表达由该分离DNA编码的单体邻氨基苯甲酸合酶的条件下,培养包括分离的DNA的原核或真核的宿主细胞,其中单体的邻氨基苯甲酸合酶包括邻氨基苯甲酸合酶α结构域和邻氨基苯甲酸合酶β结构域,并且其中足够表达单体的邻氨基苯甲酸合酶的条件包括,宿主细胞足以利用单体的邻氨基苯甲酸合酶合成色氨酸的养分和前体。
可在多种宿主细胞和/或生物体中表达产生的有用化合物的实例包括,吲哚乙酸及其他生长素;对心血管健康重要的、存在于大豆中的异类黄酮化合物;在玉米中对食草昆虫的天敌起信号作用的挥发性的吲哚化合物;抗癌剂,例如在十字花科植物家族中发现的吲哚芥子油苷(吲哚-3-甲醇);以及吲哚生物碱,例如由某些种属的真菌生产的麦角化合物。(Barnes等人,Adv Exp MedBiol.,401:87(1996);Frey等人,Proc Natl Acad.Sci.,97:14801(2000);Muller等人,生物化学Biol.Chem.,381:679(2000);Mantegani等人,Farmaco,54:288(1999);Zeligs,医药食品杂志J Med Food,1:67(1998);Mash等人,AnnNY Acad Sci.,844:274(1998);Melanson等人,Proc Natl Acad.Sci.,94:13345(1997);Broadbent等人,Curr Med Chem.,5:469(1998))。
本发明也提供在中度以及优选高严谨条件下,与编码邻氨基苯甲酸合酶的DNA分子的互补序列杂交的、至少7个核苷酸碱基的分离和纯化的DNA分子。这种分离和纯化的DNA分子包括编码邻氨基苯甲酸合酶或其结构域或突变体的新的DNA片段。突变的DNA可编码基本上抗游离L-色氨酸或色氨酸的氨基酸类似物抑制的邻氨基苯甲酸合酶。这种邻氨基苯甲酸合酶DNA分子可与例如,根瘤农杆菌、血色红假单胞菌或芸香的邻氨基苯甲酸合酶,或其α-结构域,包括其功能性的突变体杂交。当这些DNA分子编码功能性的邻氨基苯甲酸合酶或邻氨基苯甲酸合酶结构域时,它们定义为编码邻氨基苯甲酸合酶、邻氨基苯甲酸合酶结构域或其突变体的主要DNA分子的″变体″。较短的DNA分子或寡聚核苷酸可用作PCR扩增靶DNA序列的引物,或作为合成全长基因的中间产物。
也提供杂交探针,包括至少7个核苷酸碱基的新的分离和纯化的DNA片段,其被可检测地标记或结合可检测的标记物,该DNA片段在中度或优选高严谨条件下,与包括编码邻氨基苯甲酸合酶,例如编码单体的邻氨基苯甲酸合酶或其结构域,例如α-结构域,包括基本上抗色氨酸的氨基酸类似物抑制的、其功能性突变体的DNA片段的DNA分子的非编码链杂交。中度和严谨杂交条件是本领域已知的,参见,例如Sambrook等人,分子克隆:实验指南Molecular Cloning:A Laboratory Manual,第2版(1989);也参见,Sambrook和Russell,分子克隆:实验室指南,第3版(2001年1月15日)的第0.47-9.51节。例如,严谨条件是(1)使用低离子强度和高温进行洗涤,例如,50℃,0.015MNaCl/0.0015M柠檬酸钠(SSC);0.1%十二烷基硫酸钠(SDS),或(2)在杂交期间使用例如甲酰胺的变性剂,例如,在42℃,50%甲酰胺和0.1%牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/含750mM NaCl,75mM柠檬酸钠的50mM pH6.5的磷酸钠缓冲液。另一个使用的实例是,在42℃,50%甲酰胺,5×SSC(0.75M NaCl,0.075M柠檬酸钠),50mM磷酸钠(pH6.8),0.1%焦磷酸钠,5×Denhardt′s溶液,超声处理的鲑鱼精DNA(50μg/ml),0.1%十二烷基磺酸钠SDS),和10%葡聚糖硫酸酯,并在42℃,0.2×SSC和0.1%SDS中洗涤。
附图简述
图1是质粒pMON61600的限制性图谱。
图2表明根瘤农杆菌邻氨基苯甲酸合酶DNA序列(上面的序列)(SEQ IDNO:4)的翻译序列和苜蓿中华根瘤菌的邻氨基苯甲酸合酶DNA序列(下面的序列)(SEQ ID NO:7)的翻译序列。
图3是质粒pMON34692的限制性图谱。
图4是质粒pMON34697的限制性图谱。
图5是质粒pMON34705的限制性图谱。
图6A-B表明比较根瘤农杆菌α-结构域序列(SEQ ID NO:4)和硫磺矿硫化叶菌α-结构域序列(SEQ ID NO:8)的邻氨基苯甲酸合酶氨基酸序列的序列对比。
图7A-B表明用于突变SEQ ID NO:1的34个引物的序列(SEQ ID NOs:9-42)。突变密码子是加下划线的,而变化的碱基是小写字体的。
图8表明质粒pMON13773的限制性图谱。
图9表明质粒pMON58044的限制性图谱。
图10表明质粒pMON53084的限制性图谱。
图11表明质粒pMON58045的限制性图谱。
图12表明质粒pMON58046的限制性图谱。
图13表明质粒pMON38207的限制性图谱。
图14表明质粒pMON58030的限制性图谱。
图15表明质粒pMON58006的限制性图谱。
图16表明质粒pMON58041的限制性图谱。
图17表明质粒pMON58028的限制性图谱。
图18表明质粒pMON58042的限制性图谱。
图19表明质粒pMON58029的限制性图谱。
图20表明质粒pMON58043的限制性图谱。
图21A-D表明具有SEQ ID NOs:4和43(分别来源于根瘤农杆菌和苜蓿中华根瘤菌)的单体″TrpEG″邻氨基苯甲酸合酶,与来自硫磺矿硫化叶菌(SEQID NO:44)和拟南芥(SEQ ID NO:45)的异四聚体邻氨基苯甲酸合酶的TrpE(α)和TrpG(β)结构域的多重序列对比。接头区域是加下划线的。
图22是质粒pMON52214的限制性图谱。
图23是质粒pMON53901的限制性图谱。
图24是质粒pMON39324的限制性图谱。
图25是质粒pMON39322的限制性图谱。
图26是质粒pMON39325的限制性图谱。
图27是表明用pMON39325转化的大豆种子中游离的色氨酸水平的图表。存在5个来自各事件的观察结果。NT表示非转基因的大豆种子。
图28是质粒pMON25997的限制性图谱。
图29是质粒pMON62000的限制性图谱。
图30表明大肠杆菌EMG2(K-12 wt F+)的截短的trpE基因序列(SEQ IDNO:46)。该trpE核酸的最初30bp和最后的150bp通过EcoRI限制酶切位点连接。该trpG基因的开始部分紧随trpE的终止密码子。
图31图解表明大肠杆菌trpE基因中框内缺失的构建体。
图32A-C表明分离自根瘤农杆菌的邻氨基苯甲酸合酶基因的α-结构域的DNA(SEQ ID NO:1)和氨基酸(SEQ ID NO:4)序列。
图33A-C表明分离自玉米的邻氨基苯甲酸合酶基因的α-结构域的DNA(SEQ ID NO:2)序列。图33D表明分离自玉米的邻氨基苯甲酸合酶基因的α-结构域的氨基酸(SEQ ID NO:5)序列。
图34是质粒pMON58120的限制性图谱。
图35A-E提供来自根瘤农杆菌(AgrTu_15889565)(SEQ ID NO:4)、苜蓿中华根瘤菌(RhiMe_136328)(SEQ ID NO:7)、百脉根根瘤菌(MesLo_13472468)(SEQ ID NO:77)、巴西固氮螺菌(AzoBr-1717765)(SEQ IDNO:78)、马尔他布鲁氏菌(BruMe_17986732)(SEQ ID NO:79)、念珠藻属(Nostoc_17227910)(SEQ ID NO:80)、念珠藻属(Nostoc_17230725)(SEQ IDNO:81)和血色红假单胞菌(RhoPa_TrpEG)(SEQ ID NO:82)的邻氨基苯甲酸合酶氨基酸序列的序列比较。
图36A-B提供用于根瘤农杆菌邻氨基苯甲酸合酶的优化核苷酸序列(SEQ ID NO:75)。
图37A-C提供野生型(上面的链)和优化的(下面的链)根瘤农杆菌邻氨基苯甲酸合酶核苷酸序列(SEQ ID NOs:1和75)的序列对比。这2个序列由中间的链证明是94%相同的。
图38是质粒pMON66877的限制性图谱。
图39是质粒pMON66878的限制性图谱。
图40是质粒pMON66879的限制性图谱。
图41是质粒pMON66595的限制性图谱。
图42是质粒pMON66599的限制性图谱。
图43是质粒pMON66598的限制性图谱。
图44是质粒pMON66596的限制性图谱。
图45是质粒pMON79951的限制性图谱。
图46是质粒pMON79955的限制性图谱。
图47是质粒pMON79956的限制性图谱。
图48是质粒pMON36524的限制性图谱。
图49是质粒pMON30167的限制性图谱。
发明详述
本发明提供分离的DNAs,载体,宿主细胞和含有编码能够在植物中表达高水平的色氨酸的邻氨基苯甲酸合酶的分离核酸的转基因植物。在一个实施方案中,分离的核酸编码单体邻氨基苯甲酸合酶(AS)。在另一个实施方案中,分离的核酸编码邻氨基苯甲酸合酶,或其结构域,其基本上抗游离的L-色氨酸或色氨酸的氨基酸类似物的抑制。邻氨基苯甲酸合酶或其结构域的表达,可以提高色氨酸例如种子中游离色氨酸的水平,而超过在缺乏这种表达的植物中的水平。
提供生产含有增强的邻氨基苯甲酸合酶活性的相关核酸的转基因植物的方法,和生产培养细胞,植物组织,植物,植物部分和产生高水平色氨酸的种子。这种转基因植物将产生高水平色氨酸的能力优先地性传递给其后代。也描述了产生编码突变邻氨基苯甲酸合酶的分离DNAs,和细胞培养物的筛选技术以挑选出过量表达色氨酸和/或对色氨酸类似物有抗性作用的新表型。例如,产生能够生产高水平色氨酸的大豆品系,制备和表征含有至少一种本发明的分离核酸的转基因大豆细胞,然后在植物中再生。其中一些分离的DNAs对色氨酸类似物的生长抑制有抗性作用。本发明也提供用于在双子叶植物,例如其他的豆类,以及例如谷粒的单子叶植物中产生升高的游离色氨酸水平的方法。
定义
如在此所用的,转化植物、植物组织、植物部分或植物细胞中的色氨酸的“改变”水平是相应于未转化的植物、植物组织、植物部分或植物细胞增强或减少的水平。
正如在此所用的“α-结构域”是结合分支酸和消除烯醇丙酮酸侧链的酶或酶复合物的一部分。TrpE基因编码这种α-结构域。在一些情况中,α-结构域是只具有结合分支酸和消除分支酸的烯醇丙酮酸侧链功能的单个多肽。在其他情况中,α-结构域是除了结合分支酸和消除分支酸的烯醇丙酮酸侧链外,还可执行其他酶功能的较大多肽的一部分。
术语“β-结构域”是指将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支酸环的位置的酶或酶复合物的一部分。TrpG基因编码这种β-结构域。在一些情况中,β-结构域是只具有将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支环位置的功能的单个多肽。在其他情况中,β-结构域是除了将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支酸环位置外,还可执行其他酶功能的较大多肽的一部分。
正如在此所用的,“色氨酸的氨基酸类似物”是指结构上与色氨酸相关的氨基酸,并且可以与野生型邻氨基苯甲酸合酶的色氨酸结合位点结合。这些类似物包括但不限于,6-甲基苯甲酸甲酯、5-甲基色氨酸、4-甲基色氨酸、5-氟色氨酸、5-羟色氨酸、7-氮杂色氨酸、3β-吲哚丙烯酸、3-甲基邻氨基苯甲酸等。
术语“基本上由...组成”与涉及出现的DNA分子、序列或片段一起使用,是指编码邻氨基苯甲酸合酶的DNA分子、序列或片段的主要部分。除非另有注明,DNA分子、序列或片段只编码邻氨基苯甲酸合酶。
在此使用的术语“互补”指能与参照的核苷酸序列的全部、或部分杂交的核酸链的序列。例如,核苷酸序列“TATAC”具有与参照序列5′-TATAC-3′100%的相同性,但也与参照序列5′-GTATA-3′100%互补。
正如在此所用的,“外源的”邻氨基苯甲酸合酶是由导入到宿主细胞中的分离DNA编码的邻氨基苯甲酸合酶,优选地与天然的未转化状态的细胞中的任何DNA序列都不相同。“内源的”或“天然的”邻氨基苯甲酸合酶是天然存在于宿主细胞或生物体内的邻氨基苯甲酸合酶。
正如在此所用的,植物细胞、植物组织、植物一部分或植物中游离L-色氨酸“增强的”或“升高的”水平与未转化的植物细胞、植物组织、植物部分或植物,即未由存在外源的邻氨基苯甲酸合酶核酸或其结构域而改变基因组的植物中的水平相比大约是2-200倍,优选为5-150倍,更优选为10-100倍。例如,在转化的植物种子中游离色氨酸的水平与未转化的植物种子(“起始材料”)相比较。
编码邻氨基苯甲酸合酶的DNA分子和编码运输肽的DNA分子或标记/报道基因是从天然来源中“分离的”,不再存在于其通常存在的细胞中。这样分离的DNA分子至少是部分制备或在体外操作的,例如,从其通常发现的细胞中分离,纯化和扩增。这样分离的DNA分子也可以是“重组的”,将其与外源DNA分子或片段结合。例如,重组的DNA可以是将分离的DNA可操作地连接外源启动子,或连接对宿主细胞来说是内源的启动子。
在此与邻氨基苯甲酸合酶相关使用的术语“单体”指两个或更多个邻氨基苯甲酸合酶结构域结合形成单个多肽链的功能形式。单体邻氨基苯甲酸合酶可在体内组装成二聚体形式。单体邻氨基苯甲酸合酶核酸和多肽可分离自各种生物体,例如根瘤农杆菌,鱼腥藻M22983,巴西固氮螺菌,马尔他布鲁氏菌,薄肌眼虫藻,百脉根根瘤菌,念珠藻属PCC7120或苜蓿中华根瘤菌。可选地,可将选自任何方便的单体或多聚体邻氨基苯甲酸合酶基因的结构域结合,构建单体邻氨基苯甲酸合酶的核酸和多肽。这种生物体包括,例如,根瘤农杆菌,鱼腥藻M22983,拟南芥,巴西固氮螺菌,马尔他布鲁氏菌,百脉根根瘤菌,念珠藻属PCC7120,苜蓿中华根瘤菌,血色红假单胞菌,芸香,硫磺矿硫化叶菌,鼠伤寒沙门氏菌,粘质沙雷氏杆菌,大豆,稻,棉花,玉米或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因。编码所选择区域的核酸可以重组连接。例如,编码α-结构域的C端的核酸可通过形成磷酸二酯键与编码β-结构域的N端的核酸连接。或者,这种多肽的单个结构域可化学连接。例如α-结构域C端通过形成肽键与β-结构域的N端相连,或者相反。
正如在此所用的,“天然的”基因指在体外没有改变,也就是说在体外没有突变的“野生型”基因。
术语“质体”值得是植物细胞器类型,包括造粉体,叶绿体,色质体,油质体,eoplast,黄化质体,白色体和前质体。这些细胞器可自我复制,含有通常称为“叶绿体基因组”的,根据植物的种类大小为大约120-大约217kb的环状DNA分子,其通常含有反向的重复区域。
正如在此所用的,“多肽”指除了分别具有氨基和羧基,而不用肽键连接的N端和C端外,通过肽键连接的所有氨基酸的连续链。多肽可以是任何长度的,并且可进行例如糖基化或磷酸化的翻译后修饰,。
正如在此所用的,“对色氨酸的氨基酸类似物的抑制有抗性或耐受的”植物细胞,植物组织或植物,是在L-色氨酸类似物存在时与相应的野生型的邻氨基苯甲酸合酶相比,至少含有约10%多的邻氨基苯甲酸合酶活性的植物细胞,植物组织或植物。通常,“对色氨酸的氨基酸类似物的抑制有抗性或耐受的”植物细胞,植物组织或植物可在一定数量的色氨酸的氨基酸类似物下生长,而该数量通常可抑制未转化的植物细胞,植物组织或植物的生长,这可通过本领域已知的方法确定。例如,用编码基本上抗或耐受色氨酸的氨基酸类似物的抑制的邻氨基苯甲酸合酶的DNA分子转化的,同型纯合回交转变的近交植物生长在一定数量的色氨酸的氨基酸类似物下,而该数量的类似物抑制相应的,即基本上等基因的轮回的近交植物的生长。
正如在此所用的,当耐受/抗性的和野生型的邻氨基苯甲酸合酶处于等量的色氨酸或色氨酸的氨基酸类似物时,“对色氨酸或色氨酸的氨基酸类似物的抑制有抗性或耐受的”邻氨基苯甲酸合酶保持比相应的野生型或天然易感的邻氨基苯甲酸合酶的活性高出大约10%多。优选地,抗性或耐受性的邻氨基苯甲酸合酶比相应于野生型的或天然易感型的邻氨基苯甲酸合酶,保持大于20%多的活性。
在此使用的涉及邻氨基苯甲酸合酶的术语“其结构域”包括全长邻氨基苯甲酸合酶的结构或功能性片段。结构区域包括邻氨基苯甲酸合酶内已鉴定的结构。结构区域的一个实例包括α螺旋,β折叠,活性位点,底物或抑制剂结合位点等。功能区域包括具有确定功能的邻氨基苯甲酸合酶的片段,例如色氨酸结合袋,活性位点或底物或抑制剂结合位点。邻氨基苯甲酸合酶的功能性结构域包括可催化色氨酸生物合成途径中的一个步骤的邻氨基苯甲酸合酶部分。例如,α-结构域是由TrpE编码的区域,可将NH3传递到分支酸上而形成氨基苯甲酸。β-结构域是由TrpG编码的区域,可除去谷氨酸的氨基而形成氨。因此,功能结构域包括邻氨基苯甲酸合酶的酶活性片段和结构域。也包括邻氨基苯甲酸合酶的突变结构域。用于制备突变结构域的野生型邻氨基苯甲酸合酶的核酸包括,例如,编码根瘤农杆菌,鱼腥藻M22983,拟南芥,巴西固氮螺菌,马尔他布鲁氏菌,百脉根根瘤菌,念珠藻属PCC7120,苜蓿中华根瘤菌,血色红假单胞菌,芸香,硫磺矿硫化叶菌,鼠伤寒沙门氏菌,粘质沙雷氏杆菌,大豆,稻,棉花,玉米的结构域的任何核酸,或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因,其可在编码区包含至少一个氨基酸的取代。突变或相连的、以形成具有增强的色氨酸生物合成活性,更好的稳定性,降低对色氨酸或其类似物的敏感性等的单体邻氨基苯甲酸合酶的结构域,是特别感兴趣的。
术语“5′UTR”指DNA上游未翻译的区域,或基因编码区的5′未翻译的区域。
术语“3′UTR”指DNA下游未翻译的区域,或基因编码区的3′未翻译的区域。
术语“基本上同源”指两个序列在序列上至少90%相同,其通过(Version10;Genetics Computer Group,Inc.,University of Wiconsin BiotechnologyCenter,Madison,WI)中所描述的BestFit程序,使用默认的参数进行测定。
序列相同性的百分数优选使用″Best Fit″或″Gap″序列分析软件包的程序(Version 10;Genetics Computer Group,Inc.,University of WisconsinBiotechnology Center,Madison,WI)测定。″Gap″使用Needleman和Wunsch(1970)算法,以发现两个序列的序列对比中最大的匹配数和最小的缺口(gap)。
″Best Fit″在两个序列间对相似性最好的片段进行优化的序列对比,并且利用Smith和Waterman(Smith and Waterman,1981;Smith等人,1983)的同源性算法***缺口(gap)以最大化匹配的数目。优选使用默认参数的″Best Fit″程序测定同一性的百分数。在此使用的术语“可操作地连接”指启动子与编码区是以通过启动子来控制和调节编码区翻译的方式连接。可操作地连接启动子和编码区的方法是本领域已知的。
通用概念
本发明涉及用于获得产生升高水平的游离L-色氨酸的植物的新的核酸和方法。过量生产是由于导入和表达编码邻氨基苯甲酸合酶或其结构域的核酸。这种邻氨基苯甲酸合酶核酸包括邻氨基苯甲酸合酶的野生型或突变的α-结构域,或单体形式。邻氨基苯甲酸合酶的单体形式在单个多肽链上含有至少两个邻氨基苯甲酸合酶区域,例如,α-结构域连接β-结构域。
天然植物的邻氨基苯甲酸合酶通常对L-色氨酸和其类似物的抑制反馈敏感。这种抑制构成调控色氨酸合成途径的关键机制。因此,邻氨基苯甲酸合酶或其结构域是高度活性的、更加有效的或较少程度地受到色氨酸或其类似物的抑制,从而可能产生升高水平的色氨酸。根据本发明,根瘤农杆菌邻氨基苯甲酸合酶对于产生高水平的色氨酸特别有用。
为了在植物或所选择的宿主细胞中产生高水平色氨酸,分离所选择的邻氨基苯甲酸合酶核酸,并可在体外操作,以包括在植物细胞或其他细胞类型中基因表达所需的调控信号。因为报道植物中的色氨酸合成途径在质体中进行,可将外源邻氨基苯甲酸合酶的核酸导入质体中或通过加上编码质体运输肽的氨基末端的核酸片段进行修饰。这种质体运输肽可直接引导邻氨基苯甲酸合酶基因产物进入质体。在一些情况中邻氨基苯甲酸合酶已经含有质体运输序列,这样就没有必要增加片段了。
为了改变色氨酸的生物合成,编码邻氨基苯甲酸合酶活性的核酸必须导入植物细胞或其他宿主细胞,然后直接或间接地验证这些转化细胞。可使用完整的邻氨基苯甲酸合酶或其有用的部分或结构域。邻氨基苯甲酸合酶稳定地整合在植物细胞基因组上。控制邻氨基苯甲酸合酶表达的转录信号必须在植物细胞或其他宿主细胞内被识别并发挥作用。也就是说邻氨基苯甲酸合酶必须转录成信使RNA(mRNA),而mRNA必须在植物细胞核中稳定、完整地运输到细胞质中翻译。邻氨基苯甲酸合酶mRNA必须含有可被植物细胞核糖体识别和合适翻译的合适的翻译信号。多肽基因产物必须基本上逃脱细胞质内蛋白水解的攻击,而被转运到正确的细胞内部分(例如,质体),并且能够呈现赋予酶活性的三维构像。邻氨基苯甲酸合酶必须进一步能够在色氨酸和其衍生物的生物合成中发挥作用;也就是说,必须定位在催化生物合成中旁侧步骤的天然植物酶的附近(大概在质体中),以获得所需要的底物并传递合适的产物。
即使满足所有的条件,色氨酸的成功过量产生也不是一个可以预料的事情。一些转基因的表达可能受到附近染色体元件的负影响,如果通过突变减少反馈抑制而获得高水平的色氨酸,存在其他的控制机制来补偿邻氨基苯甲酸合酶步骤减少的调控。可能有提高所蓄积氨基酸降解率的机制。色氨酸和相关氨基酸的过量表达的水平也不能对植物有毒性。最后,导入性状必须是稳定的和可以遗传的,以提供商业上的发展和使用。
编码邻氨基苯甲酸合酶的DNA的分离和鉴定
可通过标准的方法鉴定和分离编码邻氨基苯甲酸合酶的核酸,例如,如Sambrook等在“分子克隆:实验指南”,第二版(1989);Sambrook和Russell,在“分子克隆:实验指南”,第三版(2001.1.15)中所描述的。例如,编码邻氨基苯甲酸合酶或其结构域的DNA序列可以通过筛选来源于特定细胞种类、细胞系、初级细胞或组织的核酸所产生的DNA或cDNA文库而鉴定。用于鉴定和分离邻氨基苯甲酸合酶的文库的实例包括,但不限于,来源于根瘤农杆菌菌株A348,玉米自交系B73(Stratagene,La Jolla,加利福尼亚,Cat.#937005,Clontech,Palo Alto,加利福尼亚,Cat.#FL1032a,#FL1032b,和FL1032n)的cDNA文库,来源于玉米自交系Mo17(Stratagene,Cat.#946102)的基因组文库,来源于玉米自交系B73(Clontech,Cat.#FL1032d)的基因组文库,来源于鱼腥藻M22983(例如,Genbank登录号GI 152445),拟南芥,巴西固氮螺菌(例如,Genbank登录号GI 1174156),马尔他布鲁氏菌(GI17982357),大肠杆菌,薄肌眼虫藻(Euglena gracilis),百脉根根瘤菌(例如,Genbank登录号GI 13472468),念珠藻属PCC7120(例如,Genbank登录号GI 17227910或GI 17230725),苜蓿中华根瘤菌(例如,Genbank登录号GI95177),芸香,血色红假单胞菌,鼠伤寒沙门氏菌,粘质沙雷氏杆菌,硫磺矿硫化叶菌,大豆,稻,棉花,小麦,烟草,玉米(玉蜀黍),或其他种类的基因组DNA。而且,可采用分离自任何这些种类的基因组DNA,mRNA或cDNA,通过核酸扩增方法分离邻氨基苯甲酸合酶核酸。
筛选编码邻氨基苯甲酸合酶的全长或其部分序列的DNA片段可通过筛选与来源于从其他生物体的邻氨基苯甲酸合酶基因探针杂交的基因组或cDNA文库的噬菌斑,或筛选与特异性识别邻氨基苯甲酸合酶的抗体结合的cDNA表达文库的噬菌斑而实现。将与来自其他生物体的邻氨基苯甲酸合酶探针杂交的DNA片段和/或携带邻氨基苯甲酸合酶抗体免疫活性的DNA片段的噬菌斑亚克隆到载体中,并进行测序和/或作为探针用于鉴定编码所需要的邻氨基苯甲酸合酶基因的全长或部分的其他cDNA或基因组序列。用于筛选玉米或植物文库的优选cDNA探针可从质粒克隆pDPG600或pDPG602获得。
cDNA文库可例如,通过随机寡引物或寡dT引物引发制备。含有DNA片段的噬菌斑可以用特异于邻氨基苯甲酸合酶的探针或抗体筛选。将编码邻氨基苯甲酸合酶基因部分的DNA片段亚克隆,并测序,以及用作鉴定基因组邻氨基苯甲酸合酶基因的探针。编码细菌或植物邻氨基苯甲酸合酶的DNA片段可通过确定与其他已知的邻氨基苯甲酸合酶基因的同源性而验证,或通过与邻氨基苯甲酸合酶特异的信使RNA杂交而验证。一旦获得编码邻氨基苯甲酸合酶的5′,中间和3′端部分的cDNA片段,则可将其作为探针,从基因组文库中鉴定和克隆完整的邻氨基苯甲酸合酶基因的基因组拷贝。
对部分基因组拷贝或邻氨基苯甲酸合酶基因的拷贝测序,并通过标准方法鉴定基因的5′端,包括通过与其他邻氨基苯甲酸合酶基因的DNA序列同源或RNA酶保护分析,例如,Sambrook等在“分子克隆:实验指南”,第二版(1989);Sambrook和Russell,在“分子克隆:实验指南”,第三版(2001.1.15)中所描述的。靶基因的3′和5′端可通过利用已知的AS编码区计算机搜索基因组序列数据库来定位。一旦鉴定基因的5′端,邻氨基苯甲酸合酶基因的完整拷贝可通过标准方法获得,包括克隆或利用与基因DNA序列的5′末端互补的寡核苷引物的聚合酶链式反应(PCR)。分离的邻氨基苯甲酸合酶基因的全长拷贝的存在可通过杂交,部分序列分析或通过表达玉米邻氨基苯甲酸合酶来验证。
本发明例证性分离的DNAs包括具有下面核苷酸SEQ ID NO的DNAs:
SEQ ID NO:1根瘤农杆菌(野生型)
SEQ ID NO:2玉米(野生型,α2)
SEQ ID NO:3芸香
SEQ ID NO:46大肠杆菌EMG2(K-12 wt F+)的截短的TrpE基因
SEQ ID NO:67玉米(C28突变)
SEQ ID NO:68玉米(C28+终止子)
SEQ ID NO:71叶绿体靶肽(g)
SEQ ID NO:73叶绿体靶肽(a)
SEQ ID NO:75根瘤农杆菌(优化的)
SEQ ID NO:76血色红假单胞菌
SEQ ID NO:83血色红假单胞菌(RhoPa_TrpEG)
SEQ ID NO:84根瘤农杆菌V48F突变体
SEQ ID NO:85根瘤农杆菌V48Y突变体
SEQ ID NO:86根瘤农杆菌S51F突变体
SEQ ID NO:87根瘤农杆菌S51C突变体
SEQ ID NO:88根瘤农杆菌N52F突变体
SEQ ID NO:89根瘤农杆菌P293A突变体
SEQ ID NO:90根瘤农杆菌P293G突变体
SEQ ID NO:91根瘤农杆菌F298W突变体
SEQ ID NO:92根瘤农杆菌S50K突变体
SEQ ID NO:93根瘤农杆菌F298A突变体
SEQ ID NO:94稻
SEQ ID NO:95稻的同功酶
SEQ ID NO:96玉米(Anderson的美国专利No.6,118,047)
SEQ ID NO:97小麦
SEQ ID NO:98烟草
SEQ ID NO:104陆地棉(Gossypium hirsutum)(α)
SEQ ID NO:105陆地棉(β)
SEQ ID NO:106大豆(Glycine max)(α)
SEQ ID NO:107大豆(β)
SEQ ID NO:112具有5′和3′UTRs的大豆(α)
SEQ ID NO:113具有5′和3′UTRs的大豆(β)
SEQ ID NO:116玉米(β)
SEQ ID NO:119稻(Oryza sativa)(β1)
SEQ ID NO:120稻(β2)
SEQ ID NO:121百脉根根瘤菌
SEQ ID NO:122巴西固氮螺菌
SEQ ID NO:123马尔他布鲁氏菌
SEQ ID NO:124念珠藻属
SEQ ID NO:125念珠藻属
SEQ ID NO:126血色红假单胞菌
SEQ ID NO:127大豆慢生根瘤菌
SEQ ID NO:128深红红螺菌
SEQ ID NO:129 Thermobifida fusca
SEQ ID NO:134高粱(Sorghum bicolor)(β1)
SEQ ID NO:135高粱(β2)
SEQ ID NO:136玉米(α1)
某些引物也可以用于实现本发明,例如具有SEQ ID NOs:9-42,47-56,或138-143的引物。
本发明也包括编码具有例如下述任何氨基酸序列的邻氨基苯甲酸合酶的任何分离核酸。
SEQ ID NO:4根瘤农杆菌(野生型)
SEQ ID NO:5玉米(野生型)
SEQ ID NO:6芸香
SEQ ID NO:7苜蓿中华根瘤菌
SEQ ID NO:8硫磺矿硫化叶菌
SEQ ID NO:43苜蓿中华根瘤菌
SEQ ID NO:44硫磺矿硫化叶菌
SEQ ID NO:45拟南芥
SEQ ID NO:57血色红假单胞菌
SEQ ID NO:58根瘤农杆菌V48F突变体
SEQ ID NO:59根瘤农杆菌V48Y突变体
SEQ ID NO:60根瘤农杆菌S51F突变体
SEQ ID NO:61根瘤农杆菌S51C突变体
SEQ ID NO:62根瘤农杆菌N52F突变体
SEQ ID NO:63根瘤农杆菌P293A突变体
SEQ ID NO:64根瘤农杆菌P293G突变体
SEQ ID NO:65根瘤农杆菌F298W突变体
SEQ ID NO:66玉米C28突变体
SEQ ID NO:69根瘤农杆菌S50K突变体
SEQ ID NO:70根瘤农杆菌F298A突变体
SEQ ID NO:74叶绿体靶肽(a)
SEQ ID NO:72叶绿体靶肽(g)
SEQ ID NO:77百脉根根瘤菌(MesLo_13472468)
SEQ ID NO:78巴西固氮螺菌(AzoBr_1717765)
SEQ ID NO:79马尔他布鲁氏菌(BruMe_17986732)
SEQ ID NO:80念珠藻属(Nostoc_17227910)
SEQ ID NO:81念珠藻属(Nostoc_17230725)
SEQ ID NO:82血色红假单胞菌RhoPa_TrpEG
SEQ ID NO:99稻
SEQ ID NO:100稻的同功酶
SEQ ID NO:101玉米(Anderson的美国专利No.6,118,047)
SEQ ID NO:102小麦
SEQ ID NO:103烟草
SEQ ID NO:108陆地棉(α)
SEQ ID NO:109陆地棉(β)
SEQ ID NO:110大豆(α)
SEQ ID NO:111大豆(β)
SEQ ID NO:114玉米(ASα2)叶绿体靶肽
SEQ ID NO:115玉米(ASα1)叶绿体靶肽
SEQ ID NO:117稻(β)
SEQ ID NO:118玉米(β)
SEQ ID NO:130大豆慢生根瘤菌
SEQ ID NO:131深红红螺菌
SEQ ID NO:132 Thermobifida fusca
SEQ ID NO:133高粱(β)
SEQ ID NO:137玉米(ASα1)
任何这些核酸和多肽以及其任何突变体,变异体或衍生物都可用于实现本发明。
单体的邻氨基苯甲酸合酶
根据本发明,来源于植物和非植物类的单体邻氨基苯甲酸合酶在植物中都有可以提供高水平色氨酸的功能。出乎意料的是非植物类来源的单体邻氨基苯甲酸合酶在植物中有很好的作用效果,尽管这些单体邻氨基苯甲酸合酶序列与大多数植物邻氨基苯甲酸合酶的同源性很低。例如,成功使用来源于如细菌,原生生物和微生物一样多样的物种的单体邻氨基苯甲酸合酶。特别是来源于下述细菌类的单体邻氨基苯甲酸合酶:根瘤农杆菌,苜蓿中华根瘤菌,百脉根根瘤菌,马尔他布鲁氏菌,念珠藻属PCC7120,巴西固氮螺菌,鱼腥藻M22983,大豆慢生根瘤菌(Bradyrhizobium janonicum),深红红螺菌,和Thermobidfida fusca,在植物中都有提供高水平色氨酸的功能,尽管这些单体邻氨基苯甲酸合酶序列与大多数植物邻氨基苯甲酸合酶的同源性很低。
包含例如野生型单体根瘤农杆菌邻氨基苯甲酸合酶的转基因植物可以在种子中产生高达约10,000-约12,000ppm的色氨酸,平均的trp水平为约7,000-约8,000ppm。非转基因大豆植物的种子中通常只能达到约100-约200ppm的色氨酸。比较含有添加突变的玉米α-结构域的转基因植物产生较低水平的色氨酸(例如,平均达到约3000-约4000ppm)。
单体酶相对于多聚酶具有一些优点。例如,虽然本发明并不仅限于特定的机制,单体酶可以提供更好的稳定性,协同表达等。当在体内合成异源的四聚体邻氨基苯甲酸合酶的结构域或亚基时,这些结构域/亚基必须在酶具有活性之前就适当地组装成异源四聚体形式。通过转基因方法在植物中增加单个的邻氨基苯甲酸合酶结构域不能提供过量产生的异源四聚体酶,因为没有足够的内源非转基因结构域来从实质上增强功能四聚体的水平。因此,编码单体邻氨基苯甲酸合酶的核酸、载体和酶可有利地用于过量产生邻氨基苯甲酸合酶的所有酶功能。
根据本发明,当在植物细胞、植物组织或种子中表达时,可融合或连接来源于天然产生异源四聚体邻氨基苯甲酸合酶的种属的邻氨基苯甲酸合酶结构域,以提供能产生高水平色氨酸的单体邻氨基苯甲酸合酶。例如,单体邻氨基苯甲酸合酶可通过融合或连接邻氨基苯甲酸合酶的α和β-结构域,以使得α-β融合体与天然单体的邻氨基苯甲酸合酶的序列排列比对而制备。单体和四聚体邻氨基苯甲酸合酶的序列排列的实例如图21和35所示。采用这种序列排列,可以调整邻氨基苯甲酸合酶结构域的间隔和定位或修饰,以从异源四聚体区域产生任选地与天然邻氨基苯甲酸合酶的排列比对的单体邻氨基苯甲酸合酶结构。这种融合蛋白可用于升高植物组织中的色氨酸水平。
异源四聚体邻氨基苯甲酸合酶,例如硫磺矿硫化叶菌邻氨基苯甲酸合酶(例如,Genbank登录号GI 1004323),与其他植物或微生物的异源四聚体邻氨基苯甲酸合酶的同源性大约为30%-87%。单体邻氨基苯甲酸合酶,例如根瘤农杆菌邻氨基苯甲酸合酶与其他单体酶,例如苜蓿中华根瘤菌(Genbank登录号GI 15966140)和巴西固氮螺菌(Genbank登录号1717765)的同源性分别为大约83%和约52%。Bae等人,苜蓿中华根瘤菌邻氨基苯甲酸合酶基因:克隆,测序和在大肠杆菌中表达,细菌学杂志J.Bacteriol.,171:3471-3478(1989);De Troch等人,分离和纯化巴西固氮螺菌trpE(G)基因,编码邻氨基苯甲酸合酶.Curr.Microbiol.,34:27-32(1997)。
然而,全序列与天然单体和天然四聚体邻氨基苯甲酸合酶的同源性可以小于30%。因此,不是计算机产生的排列而是视觉排列,以优化排列单体和四聚体的邻氨基苯甲酸合酶。邻氨基苯甲酸合酶内的界标(landmark)结构和序列有助于序列排列。例如,基序″LLES″是形成邻氨基苯甲酸合酶的色氨酸结合袋的β-夹层的β-折叠的一部分。这种界标序列可用于更加确信地排列差异的邻氨基苯甲酸合酶序列,特别是用于确定涉及色氨酸结合的关键残基。
为了实现邻氨基苯甲酸合酶结构域的融合或连接,所选择的TrpE或α-结构域的C末端与TrpG结构域或β-结构域的N末端连接。在一些方案中,可在结构域间使用接头肽,以提供合适的间隔和/或灵活性。通过单体和四聚体邻氨基苯甲酸合酶的序列对比来鉴定合适的接头序列。
例如通过杂交,PCR扩增或如Anderson等人在美国专利No.6,118,047中所描述的,克隆所选择的β-结构域。质体传递肽序列可通过标准方法与邻氨基苯甲酸合酶编码区连接。例如可以使用拟南芥小亚基(SSU)的叶绿体靶肽(CTP,SEQ ID NOs:71-74)。也参见Stark等人,科学Science,258:287(1992)。然后可将融合的基因***在此所描述的用于转化植物的合适载体中。
邻氨基苯甲酸合酶的突变体
本发明所包括的突变的邻氨基苯甲酸合酶,可具有任何类型的突变,包括例如,氨基酸取代、缺失、和/或重排。这种突变体可以是邻氨基苯甲酸合酶核酸和在此所特异性鉴定的多肽的衍生物或变异体。突变的邻氨基苯甲酸合酶也可从任何可得到的种类中获得,包括没有在此明确鉴定的种类。突变体、衍生物和变异体可具有与SEQ ID NOs:4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137序列中任何一个的氨基酸位点至少约30%的同一性,并且具有邻氨基苯甲酸合酶活性。在优选的实施方案中,多肽衍生物和变异体的氨基酸具有与SEQ ID NOs:4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一个的氨基酸位点至少约50%的同一性,并且具有邻氨基苯甲酸合酶活性。在更优选的实施方案中,多肽衍生物和变异体的氨基酸具有与SEQ ID NOs:4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一个的氨基酸位点至少约60%的同一性,并且具有邻氨基苯甲酸合酶活性。在更优选的实施方案中,多肽衍生物和变异体的氨基酸具有与SEQ ID NOs:4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一个的氨基酸位点至少约70%的同一性,并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中,多肽衍生物和变异体的氨基酸具有与SEQ ID NOs:4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一个的氨基酸位点至少约80%的同一性,并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中,多肽衍生物和变异体的氨基酸具有与SEQ ID NOs:4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一个的氨基酸位点至少约90%的同一性,并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中,多肽衍生物和变异体的氨基酸具有与SEQ ID NOs:4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一个的氨基酸位点至少约95%的同一性,并且具有邻氨基苯甲酸合酶活性。
在一个实施方案中,邻氨基苯甲酸合酶突变体、变异体和衍生物可通过将SEQ ID NOs:1-3,9-42,46,47-56,67-68,75-76,83-98,104-107,112,113,116,119-129,134-136,和138-143,或其片段或引物中任何一个,在中等的或优选高严谨条件下与所选择的核酸源杂交来鉴定。杂交的中等或严谨条件在本领域是已知的,参见,例如Sambrook等人,分子克隆:实验指南,第二版(1989)的第0.47-9.51节;也参见Sambrook和Russell,“分子克隆:实验指南,第三版(2001.1.15)。例如,严谨条件是:(1)采用低离子强度和高温洗涤,例如0.015M NaCl/0.0015M柠檬酸钠(SSC);0.1%十二烷基硫酸钠(SDS),于50℃,或(2)杂交过程中使用例如甲酰胺的变性试剂,例如,50%甲酰胺,0.1%小牛血清/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/50mM磷酸钠缓冲液pH6.5和750mM NaCl,75mM柠檬酸钠,于42℃。另外一个实例是采用50%甲酰胺,5×SSC(0.75M NaCl,0.075M柠檬酸钠),50mM磷酸钠(pH6.8),0.1%焦磷酸钠,5×Denhardt′s溶液,超声的鲑精DNA(50μg/ml),0.1%十二烷基硫酸钠(SDS),和10%葡聚糖硫酸酯于42℃,和在42℃下用0.2×SSC和0.1%SDS洗涤。
本发明进一步提供杂交探针和包含至少7个核苷酸碱基的新分离和纯化的DNA片段的引物,其可被可检测地标记或结合可检测的标记。这种杂交探针或引物可在中等或高严谨条件下与编码邻氨基苯甲酸合酶的DNA分子的任何一条链杂交。这种杂交探针和引物的实例包括SEQ ID NOs:9-42,47-56,和138-143中的任何一个。
邻氨基苯甲酸合酶可以是任何邻氨基苯甲酸合酶,或其突变体或结构域,例如α-结构域。邻氨基苯甲酸合酶可以是单体邻氨基苯甲酸合酶。功能性的突变体是优先的,特别是那些能够在植物中产生高水平色氨酸的突变体,例如,对色氨酸的氨基酸类似物的抑制有基本抗性的突变体。
产生编码突变的邻氨基苯甲酸合酶的核酸可产生自任何方便的种类,例如,编码根瘤农杆菌,鱼腥藻M22983(例如Genbank登录号GI 152445),拟南芥,巴西固氮螺菌(例如,Genbank登录号GI 1174156),马尔他布鲁氏菌(例如,Genbank登录号GI 17982357),大肠杆菌,薄肌眼虫藻,百脉根根瘤菌(例如,Genbank登录号GI 13472468),念珠藻属PCC7120(例如,Genbank登录号GI 17227910或GI 17230725),苜蓿中华根瘤菌(例如,Genbank登录号GI 95177),芸香,血色红假单胞菌,鼠伤寒沙门氏菌,粘质沙雷氏杆菌,硫磺矿硫化叶菌,大豆慢生根瘤菌,深红红螺菌,Thermobifidafusca,Sorghum bicolor,大豆,稻,棉花,小麦,烟草,玉米(玉蜀黍)的任何结构域,或编码邻氨基苯甲酸合酶亚基或区域的任何基因的核酸。
所需要的突变包括升高邻氨基苯甲酸合酶的活性,减少对色氨酸或其类似物的反馈抑制的敏感性,和/或在植物中产生升高量的色氨酸。这种突变在其显示的活性的水平或类型上具有功能性改变,并且有时被称为在此所提供的邻氨基苯甲酸合酶核酸和多肽的“衍生物”。
然而,本发明也包括邻氨基苯甲酸合酶变异体和带“沉默”突变的邻氨基苯甲酸合酶。正如在此所用的,沉默突变是一种改变邻氨基苯甲酸合酶核苷酸序列但并不改变邻氨基苯甲酸合酶编码的氨基酸序列的突变。突变核酸编码变异体邻氨基苯甲酸合酶,与相应的野生型邻氨基苯甲酸合酶相比,变异体具有一个或更多个氨基酸的改变但并没有从基本上改变它的活性。本发明指所有这种衍生物、变异体和带有沉默突变的邻氨基苯甲酸合酶核酸。
可通过几种方法获得编码对L-色氨酸或色氨酸的氨基酸类似物有抗性和/或耐受性的突变的邻氨基苯甲酸合酶的DNA。该方法包括但不限于:
1.培养物中的自发变异和直接的突变筛选;
2.任何细胞种类或组织,种子或植物的组织培养物中的直接或间接的突变方法;
3.通过下述方法突变所克隆的邻氨基苯甲酸合酶基因,例如通过化学突变;特异性点或定点诱变(Sambrook等人,在前引用的),转位子介导的突变(Berg等人,生物技术Biotechnology,1:417(1983)),和缺失突变(Mitra等人,Molec.Gen.Genetic.,215:294(1989));
4.在关键残基中设计合理的突变;以及
5.DNA移码以将感兴趣的突变整合到多种邻氨基苯甲酸合酶核酸中。
例如,可使用能够得到的邻氨基苯甲酸合酶蛋白的蛋白结构信息合理地设计可能具有增强的活性,或减少对色氨酸或色氨酸类似物敏感性的邻氨基苯甲酸合酶突变。这种蛋白结构信息是可以得到的,例如,从硫磺矿硫化叶菌(solfulobus solfataricus)邻氨基苯甲酸合酶(Knochel等人,Proc.Natl.Acad.Sci.(U.S.A.),96:9479-9484(1999))。合理设计的突变可以通过对所选择的邻氨基苯甲酸合酶氨基酸与已知结构的,如硫磺矿硫化叶菌的邻氨基苯甲酸合酶氨基酸序列进行序列对比而实现。参见附图6、21和35。通过结合结构信息和序列同源性的知识来预测邻氨基苯甲酸合酶蛋白的色氨酸结合和催化区域。例如,确定色氨酸结合袋的残基可作为突变的候选物来改变酶对色氨酸反馈抑制的抗性。使用这种结构信息,在涉及色氨酸结合的位点或区域,合理设计几种根瘤农杆菌邻氨基苯甲酸合酶的突变体。
使用这种序列和结构分析,与单体根瘤农杆菌邻氨基苯甲酸合酶在大约25-60或200-225或290-300或370-375位类似的区域,可在单体根瘤农杆菌邻氨基苯甲酸合酶中,作为产生具有对色氨酸反馈抑制敏感性降低的活性的邻氨基苯甲酸合酶的潜在的有用突变而鉴定出来。更具体地,与单体根瘤农杆菌邻氨基苯甲酸合酶中的P29,E30,S31,I32,S42,V43,V48,S50,S51,N52,N204,P205,M209,F210,G221,N292,P293,F298,和A373类似的氨基酸是产生具有对色氨酸反馈抑制敏感性降低的活性的邻氨基苯甲酸合酶的潜在的有用突变残基。本发明包括在这些位点的任何氨基酸的取代或***。可选地,任何这些位点的氨基酸也可被缺失。
定点诱变可用于在各种位点产生氨基酸取代、缺失和***。在根瘤农杆菌邻氨基苯甲酸合酶编码区内的具体突变实例包括下列:
在大约48位用Phe替换Val(见例如,SEQ ID NO:58);
在大约48位用Tyr替换Val(见例如,SEQ ID NO:59);
在大约51位用Phe替换Ser(见例如,SEQ ID NO:60);
在大约51位用Cys替换Ser(见例如,SEQ ID NO:61);
在大约52位用Phe替换Asn(见例如,SEQ ID NO:62);
在大约293位用Ala替换Pro(见例如,SEQ ID NO:63);
在大约293位用Gly替换Pro(见例如,SEQ ID NO:64);或
在大约298位用Trp替换Phe(见例如,SEQ ID NO:65)。
通过对比待突变的邻氨基苯甲酸合酶的氨基酸序列和根瘤农杆菌邻氨基苯甲酸合酶的氨基酸序列,可在任何邻氨基苯甲酸合酶的类似位置产生相似的突变。可用于序列对比的根瘤农杆菌邻氨基苯甲酸合酶的一个实例是SEQ ID NO:4。
可通过经典的突变和遗传筛选鉴定有用的突变体。通过将酶暴露在游离的L-色氨酸或色氨酸的氨基酸类似物下,测定基因编码的酶的活性来检测功能性变化,或通过限制性酶切图谱或DNA序列分析检测DNA分子中的变化。
例如,编码基本上耐受5-甲基色氨酸(5-MT)的邻氨基苯甲酸合酶的基因可以从5-甲基色氨酸耐受细胞系中分离。见美国专利No.4,581,847,其所公开的内容在此引入作为参考。简而言之,使部分分化的植物细胞培养物生长,并暴露于连续低水平的5-甲基色氨酸进行继代培养。然后在几次继代培养的期间逐步增加5-甲基色氨酸的浓度。在通常有毒性的5-甲基色氨酸水平存在下生长的细胞或组织,在5-甲基色氨酸存在下重复地传代培养和表征。所培养细胞的耐受5-甲基色氨酸性特性的稳定性可通过使所选择的细胞系在不含5-甲基色氨酸时生长不同的时间段,然后将组织暴露于5-甲基色氨酸后分析其生长来评估。由于邻氨基苯甲酸合酶改变而具有耐受性优点的细胞系可通过在通常有毒性的,即生长抑制剂水平的5-甲基色氨酸下鉴定具有酶活性的细胞系而选择出来。
从5-MT-或6-甲基邻氨基苯甲酸(6-MA)-抗性的细胞系中克隆的邻氨基苯甲酸合酶基因可以用标准方法评估对5-MY,6-MA,或色氨酸的其他氨基酸类似物的耐受性,如美国专利No.4,581,847所描述的,其所公开的内容在此引入作为参考。
对5-甲基色氨酸抑制的敏感性降低的邻氨基苯甲酸合酶的细胞系可以用于分离5-甲基色氨酸-抗性的邻氨基苯甲酸合酶。可从耐受5-甲基色氨酸的细胞系产生DNA文库,并且编码邻氨基苯甲酸合酶基因的全长或部分DNA片段可通过与编码邻氨基苯甲酸合酶基因的cDNA探针杂交而鉴定。改变基因的完整拷贝可通过克隆和连接或利用合适引物的PCT获得。编码邻氨基苯甲酸合酶的改变基因的分离可在转化的植物细胞中通过测定表达的邻氨基苯甲酸合酶在通常有毒性的5-甲基色氨酸水平下是否保留酶活性而验证。见Anderson等人,美国专利号6,118,047。
可优化在此提供的任何DNA分子的编码区,用于在所选择的生物体中例如,所选择的植物或其他宿主细胞类型中表达。对于所选择的植物具有优化的密码子使用的DNA分子的实例是具有SEQ ID NO:75的根瘤农杆菌邻氨基苯甲酸合酶的DNA分子。该优化的根瘤农杆菌邻氨基苯甲酸合酶DNA(SEQ ID NO:75)与SEQ ID NO:1有94%的同一性。
转基因和载体
一旦获得和扩增编码邻氨基苯甲酸合酶或其结构域的核酸,就可以可操作地与启动子,任选地与其他元件结合形成转基因。
大多数基因具有已知作为启动子并调控基因表达的DNA序列的区域。在真核和原核细胞中,通常在编码序列上游的DNA序列侧翼找到启动子区域。启动子序列提供对下游基因序列转录的调控,一般包括约50-约2,000个核苷酸碱基对。启动子序列也包含调控序列,例如可影响基因表达水平的增强子序列。一些分离的启动子序列可提供外源基因的基因表达,即不同于天然或同源基因的基因表达。已知启动子序列可以是强的或弱的或可诱导的。强启动子可以提供高水平的基因表达,而弱启动子提供低水平的基因表达。可诱导的启动子是对于外源所加的试剂或对于环境或发育的刺激可打开或关闭基因表达的启动子。启动子可以提供组织特异性或发育的调控。对于异源基因是强启动子的分离启动子是有利的,因为它提供足够水平的基因表达以便容易检测和筛选出转化细胞,在需要时提供高水平的基因表达。
可提供本发明的转基因中的启动子用于从编码邻氨基苯甲酸合酶的DNA序列表达邻氨基苯甲酸合酶。优选地,编码序列的表达导致植物组织,例如植物种子中色氨酸水平的增强。在另一个实施方案中,编码序列的表达导致对色氨酸的氨基酸类似物的反馈抑制或生长抑制的耐受性增强或导致细胞中色氨酸总量的增加。也可诱导启动子以使得基因表达可以在加入外源试剂时开放或关闭。例如,如Ptac启动子的细菌启动子可根据加入到转化的细菌细胞中的异硫丙基半乳糖苷的水平被诱导而改变基因表达的水平。也可优选结合具有提供在植物中组织特异性表达或发育地调控基因表达的启动子的基因。用于实现本发明的许多启动子对本领域技术人员来说是可获得的。
优选的启动子一般包括但不限于,在细菌、细菌噬菌体、质体或植物细胞中起作用的启动子。有用的启动子包括CaMV 35S启动子(Odell等人,自然Nature,313:810(1985)),CaMV 19S(Lawton等人,Plant Mol.Biol.,9:31F(1987)),nos(Ebert等人,Proc.Nat.Acad.Sci.(U.S.A.),84:5745(1987)),Adh(Walker等人,Proc.Nat.Acad.Sci.(U.S.A.),84:6624(1987)),蔗糖合酶(Yang等人,Proc.Nat.Acad Sci.(U.S.A.),87:4144(1990)),α-微管蛋白,napin,肌动蛋白(Wang等人,Mol.Cell.Biol.,12:3399(1992)),cab(Sullivan等人,Mol.Gen.Genet.,215:431(1989)),PEPCase启动子(Hudspeth等人,Plant Mol.Biol.,12:579(1989)),7S-α′-大豆伴球蛋白启动子(Beachy等人,EMBO J,4:3047(1985))或与R基因复合物相关的启动子(Chandler等人,The Plant Cell,1:1175(1989))。其他有用的启动子包括噬菌体SP6,T3,和T7启动子。
也可使用质体启动子。大多数的质体基因含有可用于多亚基质体编码的RNA聚合酶(PEP)以及单亚基核编码的RNA聚合酶的启动子。核编码的聚合酶(NEP)启动子的共有序列和几种天然质体基因的特异性启动子序列的列表可在Hajdukiewicz等人,EMBO J.,16:4041-4048,(1997)中找到,在此将其全部引入作为参考。
可使用的质体启动子的实例包括玉米质体RRN(ZMRRN)启动子。ZMRRN启动子在拟南芥质体RNA聚合酶存在时可驱使基因表达。可用于本发明的相似启动子有甘氨酸最大质体RRN(SOYRRN)和烟草(Nicotianatabacum)质体RRN(NTRRN)启动子。所有这三种启动子都可被拟南芥(Arabidopsis)质体RNA聚合酶识别。RRN启动子的普遍特征在Hajdukiewicz等人和美国专利6,218,145中有描述。
而且,来源于特定启动子的转录增强子或复制增强子也可用于增强表达。这种增强子的实例包括但不限于,来源于CaMV 35S启动子和章鱼氨酸(octopine)合酶基因(Last等人,美国专利5,290,924)的元件。例如,根据本发明可构建包括ocs增强子元件的载体。这个元件首次是从农杆菌属(Ellis等人,EMBO J.,6:3203(1987))的章鱼氨酸合酶(ocs)基因中确定的16bp回文(palindromic)增强子,并且存在至少10个其他的启动子(Bouchez等人,EMBOJ.,8:4197(1989))。当在单子叶植物转化中使用时,建议使用增强子元件,例如ocs元件和特别是多拷贝的元件,将有助于增强邻近启动子的转录水平。组织特异性启动子,包括但不限于,根细胞启动子(Conkling等人,PlantPhysiol.,93:1203(1990)),并且也包括特别有用的组织特异性增强子(Fromm等人,The Plant Cell,1:977(1989)),以及例如ABA-和膨压诱导的启动子等的可诱导的启动子。
转录起始位点和编码序列起始之间的DNA序列,即未翻译的前导序列可影响基因表达,也希望采用特定的前导序列。可采用本领域技术人员可获得的任何前导序列。优选的前导序列直接优化所连接基因的表达水平,例如,通过增强或维持mRNA的稳定性和/或防止不合适的翻译起始(Joshi,Nucl.Acid Res.,15:6643(1987))。本领域技术人员谨慎考虑选择这种序列。也可以考虑使用来源于在双子叶植物,特别是大豆中高表达基因的序列。
在一些情况下,不必要极端高表达邻氨基苯甲酸合酶或其结构域。例如,使用本发明的方法可产生这种高水平的邻氨基苯甲酸合酶,可产生的底物而不是酶可能限制色氨酸产生的水平。在这种时候,本领域的技术人员可采用更加适度或调控水平的表达。这样技术人员可容易地调节和调控表达的水平,例如,通过使用弱启动子或发育调控或组织特异性的启动子。
编码感兴趣的邻氨基苯甲酸合酶的核酸也包括质体运输肽(例如SEQ IDNOs:72,74,114,或115),有助于运输邻氨基苯甲酸合酶多肽进入质体,例如,进入叶绿体。通常编码所选择的质体运输肽(例如,SEQ ID NOs:71或73)的核酸在框内与编码邻氨基苯甲酸合酶的序列连接。然而,质体运输肽也可位于邻氨基苯甲酸合酶的N末端或C末端。
构建体也包括感兴趣的核酸(例如编码邻氨基苯甲酸合酶的DNA)和作为转录终止信号和允许所得mRNA的多聚腺苷酸化的核酸序列。这种转录终止信号位于感兴趣的编码区的3′或下游。优选的转录终止信号包括来源于根瘤农杆菌胭脂氨酸合酶基因的转录终止信号(Bevan等人,Nucl.AcidRes.,11:369(1983)),来源于根瘤农杆菌章鱼氨酸(octopine)合酶的终止子,和马铃薯和番茄中编码蛋白酶抑制剂I和II的3′末端基因,尽管也可以使用其他本领域技术人员已知的转录终止信号。根据需要进一步包括调控元件,例如Adh内含子1(Callis等人,Genes Develop.,1:1183(1987)),蔗糖合酶内含子(Vasil等人,Plant Physiol.,91:5175(1989))或TMVω元件(Gallie等人,ThePlant Cell,1:301(1989))。可以根据An,Methods in Enzymology,153:292(1987)描述的方法获得这些3′非翻译的调控序列,或已经存在可从商业上,例如Clontech,(Palo Alto,加利福尼亚)获得的质体上。3′非翻译的调控序列可按标准方法可操作地与邻氨基苯甲酸合酶基因的3末端相连。本发明也可以使用其他本领域技术人员已知的调控元件。
DNA构建体可包含第一表达盒,包括,可操作地连接,异源启动子,编码邻氨基苯甲酸合酶α-结构域蛋白的DNA分子和转录终止子。这种DNA构建体可进一步包含可操作连接的第二表达盒,其包括异源启动子,编码邻氨基苯甲酸合酶β-结构域蛋白的DNA分子和转录终止子。
在本发明中也使用可选择的标记基因或报道基因。这种基因可赋予表达标记基因的细胞明显的表型,这样可以在没有标记的细胞中区分出转化细胞。可选择的标记基因赋予一个可通过化学方法,即通过使用选择性试剂(例如,杀虫剂,抗生素等)进行“选择”的性状。报道基因或可筛选的基因赋予可通过观察或检测确定的性状,即通过“筛选”(例如,R-基因座性状)。当然,本领域已知许多合适标记基因的实例,都可用于实现本发明。
本发明中涉及使用的可选择标记包括但不限于,编码新霉素抗性的neo基因(Potrykus等人,Mol Gen.Genet.,199:183(1985)),可用卡那霉素,G418等选择;编码bialaphos抗性的bar基因;编码改变的DPSP合酶蛋白的基因(Hinchee等人,Biotech.,6:915(1988))可赋予草甘膦抗性;腈水解酶基因,例如来源于臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn,可赋予bromoxynil抗性(Stalker等人,Science,242:419(1988));突变的乙酰乳酸合酶基因(ALS)可赋予咪唑啉酮、磺酰尿或其他ALS-抑制化学试剂(EP 154 204(1985))的抗性;氨甲喋呤抗性DHFR基因(Thillet等人,J.Biol.Chem.,263:12500(1988));茅草枯(dalapon)脱卤素酶基因可赋予对杀虫剂茅草枯的抗性;或突变的邻氨基苯甲酸合酶基因可赋予对5-甲基色氨酸的抗性。使用突变的EPSP合酶基因时,通过整合合适的质体运输肽(CTP)可实现额外的益处。
能够在选择转化体的***中使用的可选择标记基因的说明性的实施方案是编码phosphinothricin乙酰基转移酶的基因,例如来源于吸水链霉菌(Streptomyces hygroscopicus)的bar基因或来源于绿色产色链霉菌(Streptomyces viridochromogenes)的pat基因(美国专利5,550,318,其在此引入作为参考)。Phosphinothricin乙酰基转移酶(PAT)使杀虫剂bialaphos,phosphinothricin(PPT)中的活性成分失活。PPT抑制谷氨酰胺合酶,(Murakami等人,Mol.Gen.Genet.,205:42(1986);Twell等人,Plant Physiol.,91:1270(1989))导致氨的迅速积累和细胞死亡。
可使用的选择性标记包括但不限于,β-葡醛糖酸糖苷酶或uidA基因(GUS),已知其编码各种发色底物的酶;R-基因座基因,其编码的产物调控植物组织中花色素苷色素(红色)的产量(Dellaporta等人,染色体结构和功能,第263-282页(1988));β-内酰胺酶基因(Sutcliffe,Proc.Nat.Acad.Sci.(U.S.A.),75:3737(1978)),已知其编码各种发色底物的酶(例如,PADAC,生色的头孢菌素);xylE基因(Zukowsky等人,Proc.Nat.Acad.Sci.(U.S.A.),80:1101(1983))编码儿茶酚双加氧酶可转换生色的儿茶酚;α-淀粉酶基因(Ikuta等人,Biotech.,8:241(1990));酪氨酸酶基因(Katz等人,J.Gen.Microbiol.,129:2703(1983)),其编码的酶可以氧化酪氨酸为DOPA和多巴醌,其依次可浓缩形成易检测的化合物黑色素;β-半乳糖苷酶基因,已知其编码各种发色底物的酶;萤光素酶(lux)基因(Ow等人,Science,234:856(1986)),其可用生物发光检测;或甚至是水母发光蛋白质基因(Prasher等人,Biochem.Biophys.Res.Comm.,126:1259(1985)),它可用于钙敏感的生物发光检测,或绿色荧光蛋白基因(Niedz等人,Plant Cell Reports,14:403(1995))。转化细胞中lux基因的存在可使用例如X射线胶片,闪烁计数,荧光分光光度测定法,低光视频照相机,光子计数照相机,或多维发光仪(multiwell luminometry)检测。预想也可发展这个***以用于生物发光的群体筛选,例如在组织培养平板上,或甚至在整个植株中筛选。
另外,也可构建转基因,用于提供将基因产物导向植物细胞内的胞内部分或指导蛋白进入胞外环境。这通常通过连接编码运输或信号肽的DNA序列和编码特定基因的序列而实现。所得的运输或信号肽将分别把蛋白运输到特定的细胞内或细胞外的目的地,并且可在翻译后除去。运输或信号肽有助于运输蛋白通过细胞内的膜,例如,液泡、小泡、质体和线粒体膜,而信号肽指导蛋白通过胞外膜。通过协助蛋白进入细胞内或细胞外的区室,这些序列增强了基因产物的积累。
这种用法的特定实例是关于指导邻氨基苯甲酸合酶进入,例如质体而非细胞质的特定的细胞器。使用拟南芥SSU 1A运输肽赋予蛋白特异性导向质体作为例证性说明。可选地,转基因也可包括编码质体运输肽的DNA序列或编码rbcS(RuBISCO)运输肽的DNA序列,其可操作地连接启动子和编码邻氨基苯甲酸合酶的DNA序列。(关于质体导向肽的综述,见Heijne等人,Eur.J.Biochem.,180:535(1989);Keegstra等人,Ann.Rev.Plant Physiol.PlantMol.Biol.,40:471(1989))。如果转基因被导入植物细胞,转基因也可包含植物转录终止和多聚腺苷酸化信号和翻译信号,以及连接植物邻氨基苯甲酸合酶基因的3′末端的翻译信号。
可以使用外源质体运输肽,其不在天然的植物邻氨基苯甲酸合酶基因内被编码。质体运输肽一般长度为40-70个氨基酸,功能是翻译后指导蛋白进入质体。运输肽在进入质体产生成熟蛋白的过程中或之后切除。编码植物邻氨基苯甲酸合酶的基因的完整拷贝含有质体运输肽。那种情况下,就没必要将外源获得的质体运输肽序列结合到转基因中。
可以从各种植物核基因中获得外源运输肽编码序列,只要基因的产物表达为含有氨基端运输肽的前蛋白并运输到质体中。已知的植物基因产物的实例包括这种运输肽序列,包括但不限于,核酮糖二磷酸羧化酶的小亚基,叶绿素a/b结合蛋白,由核基因编码的质体核糖体蛋白,某些热休克蛋白,氨基酸生物合酶,例如乙酰乳酸合酶,3-烯醇丙酮磷酸莽草盐(3-enolpyruvylphosphos hikimate)合酶,二氢吡啶二羧酸合酶,邻氨基苯甲酸合酶等的氨基酸。在一些情况中,质体运输肽蛋白可能在感兴趣的邻氨基苯甲酸合酶基因中编码,其中就不必要添加这种质体运输序列。可选地,编码运输肽的DNA片段可从例如上面所列出的运输肽的已知序列整个地或部分地化学合成,。
不管编码运输肽的DNA片段的来源,它必须包括例如ATG密码子的翻译起始密码子,和表达在宿主植物的质体中可识别的和发挥合适作用的氨基酸序列。也必须关注运输肽和邻氨基苯甲酸合酶之间连接的氨基酸序列,其可切除产生成熟的酶。已经鉴别了一些保守的氨基酸序列,并可作为指导路线。运输肽编码序列和邻氨基苯甲酸合酶编码序列的精确融合可能需要处理一个或两个DNA序列以引入,例如方便的限制性酶切位点。这可通过定点突变,化学合成的寡核苷接头的***等方法实现。
编码质体运输肽的核酸的精确融合是不必要的,只要编码质体运输肽的序列在编码邻氨基苯甲酸合酶的序列框内。例如,经常可以包括附加的肽或氨基酸而对感兴趣的蛋白的表达或定位无反作用。
一旦获得质体运输肽序列,可适宜地与启动子和邻氨基苯甲酸合酶编码区根据标准方法在转基因中连接。可构建在植物细胞中起作用和在下游具有多克隆位点的质粒或从商业来源获得。采用限制性酶将质体运输肽序列***启动子的下游。邻氨基苯甲酸合酶的编码区可在翻译后融合或立即***质体运输肽序列的3′末端的下游和框架内。因此,质体运输肽优先与邻氨基苯甲酸合酶的氨基端连接。一旦形成,将转基因亚克隆到其他的质粒或载体中。
除了核植物转化以外,本发明也提供植物质体基因组的转化。因此,将基因产物导向植物细胞内的胞内区室,可通过指导基因进入胞内部分获得。质体基因组的直接转化比核转化更好。例如,直接的质体转化邻氨基苯甲酸合酶相对于核转化消除了对质体靶肽和翻译后的运输以及前体蛋白的处理过程的需要。在P.Maliga,Current Opinion in Plant Biology,5:164-172(2002),P.B.Heifetz,Biochimie,82:655-666(2000),R.Bock.,J.Mol.Biol.,312:425-438(2001),和H.Daniell等人,Trends in Plant Science,7:84-91(2002)中描述了植物的质体转化,在此作为参考。
构建了含有邻氨基苯甲酸合酶基因的转基因后,将盒导入植物细胞中。根据植物细胞的类型,基因表达的水平和基因编码酶的活性,将编码邻氨基苯甲酸合酶的DNA导入植物细胞可导致色氨酸的过量产生,赋予对色氨酸的氨基酸类似物,例如5-甲基色氨酸或6-甲基邻氨基苯甲酸的耐受性,和/或另外改变植物细胞中的色氨酸含量。
宿主细胞的转化
将包含邻氨基苯甲酸合酶基因的转基因亚克隆到已知的表达载体中,检测和/或定量AS的表达。这种筛选方法对于鉴定提供邻氨基苯甲酸合酶基因的表达的转基因,和邻氨基苯甲酸合酶在转化植物细胞的质体中的表达是有用的。
质粒载体包括附加的DNA序列,其提供简便的筛选,扩增和在原核和真核细胞中转化转基因,例如,pUC-衍生载体,pSK-衍生载体,pGEM-衍生载体,pSP-衍生载体,或pBS-衍生载体。附加的DNA序列包括提供载体自我复制的复制原点,可选择的标记基因,优选编码抗生素或杀虫剂抗性,提供多位点以便在转基因中***DNA序列或编码的基因的独特的多克隆位点,以及增强原核和真核细胞转化的序列。
可用于植物和原核细胞中表达的另外的载体是二元的Ti质粒(如在Schilperoort等人,美国专利4,940,838中所公开的),以载体pGA582例证说明。二元的Ti质粒已经被在前引用的An鉴定。二元的Ti质粒可在原核细菌,例如大肠杆菌和农杆菌中复制。衣杆菌质粒载体可用于传递转基因进入植物细胞中。二元的Ti载体优选包括提供有效的植物细胞转化的胭脂氨酸TDNA的左右边界,可选择标记基因,T边界区独特的多克隆位点,colE1复制原点和野生型宿主区域的复制子。携带本发明的转基因的二元Ti载体可用于原核和真核细胞的转化,但优选用于转化植物细胞。参见例如,Glassman等人,美国专利5,258,300。
通过适用的方法将表达载体导入原核或真核细胞。对于单子叶和双子叶植物特别有效的转化方法,包括但不限于,微粒轰击未成熟胚胎(美国专利5,990,390)或II型胚胎发生的愈伤组织细胞,如W.J.Gordon-Kamm等人(Plant Cell,2:603(1990)),M.E.Fromm等人Bio/Technology,8:833(1990))和D.A.Walters等人(Plant Molecular Biology,18:189(1992))所描述的,或电穿孔I型胚胎发生的愈伤组织,如D′Halluin等人(The Plant Cell,4:1495(1992)),或Krzyzek(美国专利5,384,253)所描述的。通过与DNA包被的钨须漩涡转化植物细胞(Coffee等人,美国专利5,302,523)和使用含有DNA的脂质体转化细胞。
所选择的邻氨基苯甲酸合酶构建体转化细胞后,宿主细胞可用于由转基因的邻氨基苯甲酸合酶结合宿主酶促机制产生有用产物的生产。培养转化细胞导致升高的色氨酸产量和其他有用的化合物,其可以从细胞或培养基中获得。在各种宿主细胞和/或生物体中表达产生的有用化合物的实例,包括色氨酸,吲哚乙酸和其他植物激素,在大豆中发现的对心血管健康很重要的异类黄酮化合物,玉米中作为食草昆虫天敌的信号的挥发性吲哚,抗癌剂,例如十字花科(cruciferae)植物家族中的吲哚芥子油苷(glucosinolate)(吲哚-3-甲醇),和吲哚生物碱,例如某些真菌产生的麦角化合物。(Barnes等人,Adv ExpMed Biol,401:87(1996);Frey等人,Proc Natl Acad. Sci.,97:14801(2000);Muller等人,Biol.Chem.,381:679(2000);Mantegani等人,Farmaco,54:288(1999);Zeligs,J Med Food,1:67(1998);Mash等人,Ann NY Acad Sci.,844:274(1998);Melanson等人,Proc Natl Acad.Sci.,94:13345(1997);Broadbent等人,Curr Med Chem.,5:469(1998))。
色氨酸的积累导致微生物和植物中次级代谢产物增加,例如,含有例如植物中简单的吲哚,吲哚共轭物,吲哚生物碱,吲哚植物抗毒素和吲哚芥子油苷的代谢产物的吲哚。
对色氨酸不敏感的邻氨基苯甲酸合酶有可能由于色氨酸经分支酸变位酶刺激合成苯基丙氨酸,而增加各种分支酸衍生的代谢物,包括那些衍生自苯基丙氨酸的代谢物。参见Siehl,D.来自分支酸的色氨酸、酪氨酸和苯基丙氨酸的生物合成,″植物氨基酸:生物化学和生物技术″,BK Singh编辑,第171-204页。当存在反馈不敏感的邻氨基苯甲酸合酶时,其他分支酸衍生的代谢物可能增加,包括苯丙醇,类黄酮和异类黄酮,以及衍生自邻氨基苯甲酸的代谢物,例如吲哚,吲哚生物碱和吲哚芥子油苷。这些化合物中的许多种是重要的植物激素,植物防御化合物,各种健康状态的化学防护试剂,和/或药物活性的化合物。
由于邻氨基苯甲酸合酶的表达而增强合成的这些化合物的范围依赖于表达邻氨基苯甲酸合酶的生物体。本领域的技术人员可轻易地评估哪种和/或测定生物体和宿主细胞可用于产生所需要的化合物。本发明也包括在各种生物体,包括植物,微生物,真菌,酵母,细菌,昆虫细胞和哺乳动物细胞中合成色氨酸和其他有用的化合物。
筛选色氨酸过量产生的细胞系的策略
利用组织培养技术对所需要的色氨酸类似物抗性,色氨酸过量产生的变异体的有效筛选,需要仔细的确定筛选的条件。优化这些条件以容许在培养物中生长和积累色氨酸类似物抗性的、色氨酸过量产生的细胞,同时抑制大量细胞群的生长。由于个体细胞在种群中的存活力高度依赖于邻近细胞的存活力,这使得情况变得复杂。
通过化合物与组织相互作用的特征确定细胞培养物暴露于色氨酸类似物下的状况。要考虑例如毒性的程度和抑制的速率这类因素。培养物中细胞化合物的积累,培养基和细胞中化合物的持续和稳定,都需要同吸收和传递给所需要的细胞部分的程度一起考虑。可选地,测定加入色氨酸是否逆转化合物的作用也很重要。
要仔细评价类似物对于培养物的存活力和形态学的影响。特别重要的是选择对培养的植物再生能力没有影响的暴露于类似物的条件。对类似物暴露条件的选择也受到类似物是否杀死细胞或只是抑制细胞分化的影响。
筛选方案的选择依赖于上面提到的考虑因素。下面简要描述的方案可用于筛选过程。例如,为了选择对色氨酸类似物的生长抑制有抗性的细胞,将在培养物的悬浮液中很好分化的细胞在短时间内暴露在高水平的色氨酸类似物下。回收和蓄积存活的细胞,并随后再暴露更长时间。可选地,有组织的部分分化的细胞培养物伴随连续的暴露在最初低水平的色氨酸类似物下生长和传代培养。经过几次传代培养间隔后浓度逐渐增加。在筛选过程中使用这些方案时,本发明并不仅限于这些过程。
植物修饰的基因
如上所描述的,在本发明的转基因,载体和植物中,作为可选择的标记基因和报道基因的基因可操作地与编码邻氨基苯甲酸合酶或其结构域的DNA序列连接。另外,可以将其他农艺学的性状加到本发明的转基因,载体和植物中。这些性状包括但不限于,昆虫抗性或耐受性;疾病抗性或耐受性(病毒,细菌,真菌,线虫类);胁迫抗性或耐受性,例证说明的有抗或耐受干旱,热,冷,冰冻,过量潮湿,盐胁迫,氧化胁迫,增加的产量,食物含量和组成,物理表现,雄性不育,干燥,群从能力(standability),繁殖力,淀粉特性,油的数量和质量等。可整合一个或多个赋予本发明的植物这些性状的基因。
昆虫抗性或耐受性
苏云金芽孢杆菌(Bacillus thuringiensis或″Bt″)包括近20种已知亚类的细菌,其产生的内毒素多肽被多种昆虫摄入时是有毒的。内毒素蛋白(Bt蛋白)和相应的基因(Bt基因)的生物学和分子生物学在H.R.Whitely等人,Ann.Rev.Microbiol.,40:549(1986)和H.Hofte等人,Microbiol.Rev.,53:242(1989)中有评述。已经克隆和测序了各种Bt蛋白的编码基因。Bt多肽的片段对于各种鳞翅目(Lepidoptera)害虫的毒性是本质上的,并占大约Bt多肽分子首要(first)的50%。因此,截短的Bt基因编码的截短的Bt多肽在多数时候保留了对多种鳞翅目昆虫的毒性。例如HD73和HD1 Bt多肽显示对美国植物中的重要鳞翅类害虫幼虫的毒性,例如欧洲玉米螟(borer),切根虫(cut worms)和螟蛉(earworms)。M.Geiser等人,Gene,48:109(1986)和M.J.Adang等人,Gene,36:289(1985)各自克隆和测序了编码HD73和HD1 Bt多肽的编码基因,其可从采用标准方法收集的培养物(例如,Bacillus Genetic Stock Center,Columbus,OH or USDA Bt stock collection Peoria,IL)中获得的HD73和HD1菌株中克隆。例如在美国专利6,329,574;6,303,364;6,320,100和6,331,655中描述了Bt基因和多肽。
编码新的、以前未表征的Bt毒素的DNA可从宿主芽孢杆菌(Bacillus)生物体中采用以前克隆Bt基因的步骤克隆得到,也可以产生Bt毒素的新的合成形式。
用于本发明的Bt基因包括5′DNA序列,其含有在植物中允许下游的Bt序列转录和翻译起始的DNA序列。Bt基因也包含3′DNA序列,它包括来源于可在感兴趣植物中表达的基因的3′非编码区的序列。Bt基因也包括编码苏云金芽孢杆菌产生的毒性Bt多肽或其毒性部分或具有的基本氨基序列的同源物的DNA序列。Bt编码序列可包括:(i)编码与Bt内毒素基本上同源的杀虫剂蛋白的DNA序列,它对感兴趣植物的有害昆虫有活性,例如HD73或HD1 Bt序列;(ii)编码Bt内毒素多肽的杀虫剂活性的片段的序列,例如杀虫剂活性的HD73或HD1多肽的从羧基和/或氨基端截短的形式;和/或(iii)在框内与编码提供附加优点的多肽融合的截短的Bt序列,所附加的优点例如:(a)可选择的基因,例如,赋予抗生素或杀虫剂抗性的基因,(b)其产物易检测和分析的报道基因,例如,荧光蛋白或β-葡萄糖苷酶;(c)编码具有一些附加用途的多肽序列的DNA序列,该附加用途是稳定Bt蛋白不被降解或增强Bt蛋白对昆虫的有效性,例如蛋白酶抑制剂;和(d)协助指导Bt蛋白进入植物细胞特定的部分内或外的序列,例如信号序列。
为了在植物中获得Bt蛋白的优化合成,也可以适当调节Bt基因的DNA序列,使基因在感兴趣的植物中更加有效的表达。由于Bt基因的密码子使用与感兴趣植物中表达的基因所使用的不同,可以通过使用在植物中,例如经常在感兴趣的植物中使用的(见E.Murray等人,Nucl Acids Res.,l7:477(1989))更加有效表达的密码子来取代这些密码子而增加Bt基因在植物细胞中的表达。这种密码子取代需要取代碱基但不改变最终Bt多肽的序列。Bt多肽序列可与细菌基因或其片段相同。含有比原始细菌的基因更加优选的密码子的完整的Bt编码序列或其部分,可通过采用标准的化学合成方法合成,并且采用标准方法导入或组装Bt基因,例如定点突变或DNA聚合和连接等。
蛋白酶抑制剂可提供昆虫抗性。例如,使用来源于马铃薯或番茄的蛋白酶抑制剂II基因,pinII是非常有用的。组合使用pinII基因和Bt毒素基因也是有好处的。编码昆虫消化***抑制剂的其他基因,或编码酶或有助于抑制剂产生的辅助因子的基因也很有用。这包括例如来源于小麦和大麦的水稻半胱氨酸蛋白酶(oryzacystatin)抑制剂和淀粉酶抑制剂。
编码凝集素的基因可赋予附加的或备选的杀虫剂特性。(Murdock等,Phytochemistry,29 85(1990);Czapla和Lang,J.Econ.Entomol.,83:2480(1990)。也包括有用的外源凝集素基因,例如,大麦和小麦的胚凝集素(WGA)以及稻的外源凝集素(Gatehouse等人,J Sci Food Agric.,35:373(1984))。
当被导入有害昆虫时,控制针对昆虫的大的或小的活性多肽,例如溶解酶的肽,肽激素和毒素和毒液的产量的基因都是很有用的。例如,保幼激素酯酶的表达直接导向特异性的有害昆虫,也可导致杀虫剂活性,或可导致***的停止(Hammock等人,Nature,344:458(1990))。
表达编码影响昆虫外皮(cutide)完整性的基因的转基因植物也是有用的。这些基因包括编码几丁质酶,蛋白酶,脂肪酶和产生三国霉素的基因。编码影响昆虫蜕皮活性的基因,如影响蜕皮素UDP-葡萄糖基转移酶产量的基因也是有用的。
编码促进减少植物对有害昆虫的营养品质的化合物的生产的酶的基因也是有用的。通过改变固醇成分可例如赋予植物杀虫剂活性。本发明进一步的实施方案涉及具有增强的脂肪氧化酶活性的转基因植物。
本发明也提供用于改变次级代谢物的方法和化合物。一个实例涉及改变植物产生DIMBOA,预期其可赋予对欧洲玉米螟,根虫和几种其他有害昆虫的抗性。参见例如,美国专利6,331,880。DIMBOA来源于吲哚相关的化合物。本发明提供的方法用于增强植物细胞和组织内类似色氨酸的吲哚相关地化合物含量。因此,根据本发明在此提供的方法也可增加DIMBOA的水平,因而增强对昆虫的抗性。
导入调控玉米可凝性球蛋白(maysin)产生的基因和涉及高粱中蜀黍苷产生的基因,都可分别用于促进对有害幼虫(earworm)和根虫的抗性。
也可使用编码具有潜在的杀虫剂活性的蛋白的更多基因。这种基因包括,例如,可用作根虫抑制剂的豇豆胰蛋白酶抑制剂(CpTI;Hilder等人,Nature,330:160(1987));证实可用于玉米根虫抑制剂(deterrent)的编码除虫菌素的基因(除虫菌素和阿巴美丁(Abamectin),Campbell,W.C.,编辑.,1989;Ikeda等人,J Bacteriol,169:5615 1987);核糖体灭活蛋白基因;和调控植物结构的基因。转基因植物包括抗昆虫抗体基因和编码可将植物外用为非毒性杀虫剂(前杀虫剂)转化为植物内杀虫剂的酶的基因。
环境或胁迫抗性或耐受性
可通过基因的表达影响植物对各种环境胁迫的耐受能力的提高。例如,对霜冻温度的增强抗性可通过导入“抗冻”蛋白,例如美洲拟鲽(WinterFlounder)(Cutler等人,J Plant Physiol.,135:351(1989))或合成其基因衍生物而赋予。改善质体中甘油-3-磷酸乙酰基转移酶的表达可赋予增强的耐寒性(Wolter等人,The EMBO J.,11:4685(1992))。超氧化物歧化酶的表达可赋予对氧化胁迫的抗性(Gupta等人,Proc.Natl.Acad.Sci(U.S.A.),90:1629(1993)),谷胱甘肽还原酶可改善对氧化胁迫的抗性(Bowler等人,Ann Rev.Plant Physiol.,43:83(1992))。
预期影响植物的含水量,总的水压,渗透压和膨压的基因的表达增强植物对干旱的耐受性,并因此将是有用的。建议使用例如,编码用于渗透压活性溶质的生物合成的基因的表达可赋予抗干旱的保护。这类基因中有编码甘露醇脱氢酶(Lee和Saier,J.Bacteriol.,258,10761(1982))和海藻糖-6-磷酸合酶(Kaasen等人,J.Bacteriology,174:889(1992))的基因。
类似地,其他代谢产物也可保护酶的功能或膜的完整性(Loomis等人,J.Expt.Zoology,252:9(1989)),因此编码用于这些化合物的生物合成的基因可赋予以类似或补充甘露醇的方式的干旱抗性。天然产生的其他代谢物的实例是渗透压活性的,和/或在干旱和/或脱水过程中提供一些直接保护作用的,包括果糖,赤藓糖醇,山梨醇,卫矛醇,葡糖基甘油,蔗糖,水苏糖,棉子糖,脯氨酸,甘氨酸,甜菜碱,ononitol和松醇。参见例如,美国专利6,281,411。
根据结构的相似性可分为三种后期胚胎发生蛋白(见Dure等人,PlantMolecular Biology,12:475(1989))。所有三种LEA组的结构基因的表达可赋予干旱耐受性。水胁迫过程中诱导的其他类型的蛋白可能是有用的,包括硫醇蛋白酶,醛缩酶和跨膜运输蛋白,在干旱胁迫中其可赋予各种保护性和/或修复功能。参见例如,PCT/CA99/00219(Na+/H+交换多肽基因)。影响脂质生物合成的基因也可用于赋予干旱抗性。
涉及特异的形态学性状,容许从干燥的土壤中增强水的提取的基因表达也是有用的。在胁迫过程中增强复制适应性的基因表达也是有用的。建议在胁迫过程中最小化核发育不全的基因表达将提高所收获的谷物的数量,因此是有价值的。
即使当土壤中的水不受限制时,通过导入和表达基因可使植物更有效地利用水从而增加总的产量。通过导入基因提高植物最大化利用水的能力,可克服涉及水的可获得性的所有胁迫范围,也可实现产量性能的稳定性或产量的连续性。
疾病抗性或耐受性
可通过表达基因产生对病毒的抗性。例如,表达针对基本的病毒功能的反义基因或表达编码病毒外壳蛋白的基因可赋予对病毒的抗性。
通过导入基因赋予对细菌和真菌导致的疾病的抗性。例如,编码称作“肽抗生素”的基因,编码病原相关(PR)蛋白,毒素抗性和影响宿主病原体相互作用,例如形态学特征的蛋白的基因都是有用的。
真菌毒素的减少/消除
由植物相关的真菌产生的真菌毒素,包括黄曲霉毒素和烟曲霉毒素(fumonisin),是使得谷粒无用的一个重要因素。抑制这些真菌的生长可减少毒素物质的合成,从而减少由于真菌毒素污染造成的谷粒损失。可在植物中导入基因抑制真菌毒素的合成而不妨碍真菌的生长。此外,为了获得减少真菌毒素污染的谷粒,表达编码使得真菌毒素无毒性的酶的新基因也是有用的。
植物组合物或品质
可以改变植物组合物,例如,通过各种方式改善氨基酸的平衡,包括增加天然蛋白的表达,降低不良组合物的表达,改变天然蛋白的组成,或导入编码完整的具有优越组成的新蛋白的基因。参见例如,美国专利6,160,208(种子储存蛋白表达的改变)。导入基因改变植物中油的含量是有价值的。参见例如,美国专利6,069,289和6,268,550(ACCase基因)。导入的基因可例如通过增加分枝的程度,通过延迟代谢导致母牛中增加对淀粉的利用,从而增强植物中淀粉含量的营养价值,。
植物农艺学的性状
决定植物在何处生长的两个因素是生长季节过程中的平均日温度和霜冻间的时间长短。表达涉及调控植物发育的基因也许是有用的,例如,已经在谷物(corn)中鉴定的非舌叶(liguleless)和粗糙鞘基因。
导入玉米的基因将增强站立性和其他植物的生长特性。赋予更强壮的茎,改善的根系或防止或减少抽穗的额外损耗的基因表达对于农民来说都是有价值的。
营养利用
利用可获得营养的能力是植物生长的一个限制因素。通过导入基因可改变营养的吸收,耐受pH的极限,植物中的流动,储存库,和代谢活动的有效性。这些修饰使得植物更加有效利用可获得的营养。例如,通常存在于植物中并涉及营养利用的酶的活性的增强可增强营养的有用性。这种酶的一个实例是植酸酶。
雄性不育
雄性不育在生产杂交中有用,雄性不育可通过表达基因产生。可通过转化导入TURF-13而从疾病敏感性中分离出雄性不育。参见Levings,Science,250:942-947,(1990)。对于育种的目的,有必要恢复雄性不育,可导入编码恢复雄性不育的基因。
抗性细胞系的筛选和表征
当细胞或组织恢复到在通常的色氨酸类似物水平抑制存在下观察到生长良好就可以进行筛选。这些细胞“系”在色氨酸类似物存在下传代培养几次以去除非抗性细胞,然后进行表征。通过比较在各种浓度的色氨酸类似物存在下这些细胞系和未筛选细胞或组织的生长可确定所获得的抗性量。将所筛选的细胞系在没有色氨酸类似物存在下,简单培养不同的时间阶段,然后分析将组织再暴露在色氨酸类似物下的生长就可以评估培养细胞抗性的稳定性。也可以使用体外化学研究评估抗性细胞系来证实改变类似物的作用位点可形成对色氨酸类似物抑制的较少的敏感性。
在转化细胞中可测定和定量邻氨基苯甲酸合酶的瞬时表达。基因表达可通过RT-PCR分析,使用克隆的邻氨基苯甲酸合酶特异性抗体的Western印迹或通过检测在色氨酸或色氨酸的氨基酸类似物存在下酶的活性而定量。测定克隆的邻氨基苯甲酸合酶的组织和亚细胞定位可通过使用克隆的邻氨基苯甲酸合酶特异性抗体的免疫化学染色法或亚细胞的分级以及随后的生物化学和/或免疫学分析。也可以评估克隆的邻氨基苯甲酸合酶对试剂的敏感性。提供邻氨基苯甲酸合酶的表达或邻氨基苯甲酸合酶对色氨酸的氨基酸类似物或游离的L-色氨酸的抑制的耐受性的转基因可用于转化单子叶和/或双子叶植物组织细胞并产生转化的植物和种子。转化细胞可通过检测选择性标记基因或报道基因的存在,例如,通过检测选择性的除草剂抗性标记而筛选。邻氨基苯甲酸合酶基因在转基因的胚胎发生愈伤组织中的瞬时表达可使用对邻氨基苯甲酸合酶特异性的抗体或通过RT-PCR分析来检测。
植物再生和种子的生产
转化的胚胎发生愈伤组织,分生组织,胚,叶盘等都可用于产生显示转化的邻氨基苯甲酸合酶基因稳定遗传的转基因植物。显示对色氨酸的氨基酸类似物的令人满意水平耐受性的植物细胞系可通过本领域已知的方法实行植物再生方案以获得成熟植物和表达耐受性性状的种子(例如,参见美国专利5,990,390和5,489,520;和Laursen等人,Plant Mol.Biol.,24:51(1994))。植物再生方案可使体细胞胚发育并随后生长成根和苗。为了确定耐受性性状在植物分化器官中,而不仅只是在未分化的细胞培养物中表达,可分析再生植物相对于再生的非转化植物的植物各个部分的色氨酸存在水平。转基因植物和种子可从采用标准的方法显示出色氨酸含量或对色氨酸类似物的抗性变化的细胞和组织中产生。尤其优选色氨酸含量增强的叶片和种子。在抑制量的色氨酸或其类似物的存在下,酶特定活性的变化可通过检测转化细胞中的酶活性来测定,如Widholm,Biochimica et Biophysica Acta,279:48(1972)中所描述的。通过如Jones等人,Analyst,106:968(1981)所描述的标准方法检查总色氨酸含量的变化。
从已知表达性状的细胞系获得成熟的植物。如果可能的话,使再生植物自花授粉。另外,将来源于再生植物的花粉与具有农艺学上重要的自交系的种子所生长的植物进行杂交。在一些情况中,使用来源于自交系的花粉给再生植物授粉。通过评价第一代和后代的性状分离来遗传表征该性状。如果该性状是商业上有用的,组织培养物中所选择的植物性状的遗传可能性和表达是特别重要的。
如果各种不同杂交组合都可以得到的话,色氨酸过量产生的大豆,谷类和其他植物的商业价值是巨大的。农民一般根据成熟度,站立性或其他农艺学性状的差异种植多种杂交品种。另外,由于成熟度,疾病,和昆虫抗性的性状的差异,适应一部分地区的杂种并不适于其他部分。因此,有必要培育色氨酸过量产生的大量的亲本自交系以产生许多杂交组合。
通过杂交原始过量产生的品系与正常的原种品系以及将杂交后代与正常的亲本回交来进行转换过程(回交)。这种杂交的后代将进行分离以至于携带基因的植物负责过量生产,而另外一些则没有。携带这种基因的植物再次与正常的亲本杂交,导致在后代中再次分离出过量产生和正常产量的性状。不停重复直到原始正常的亲本转变成过量产生的品系,也具有在正常亲本中原始就有的其他重要的特性。对于每种原种品系都实现分离的回交方案,则可将其转换成色氨酸过量生产的品系。
回交后,新的过量产生的品系和合适品系的组合是具有很好的商业价值的杂种,评价其过量生产和其他一系列重要的农艺学性状。生产过量产生的品系和杂种,其是原始正常品系和杂种的纯种类型。这需要在一系列环境条件中评估哪些品系或杂种通常将用于大规模地生长。对于高水平色氨酸大豆的产生,需要杂种种子的两个亲本是纯合的高色氨酸的特征。增加表现令人满意的杂种的亲本品系并采用标准的杂种种子生产试验用于杂种的制备。
预计在此产生的转基因植物有益于各种商业和研究目的。可产生转基因植物用于传统的农艺学以具有对从植物中收获的谷粒的消费者有利的性状(例如,在人食物或动物饲料中增加营养含量)。在这种用途中,植物通常是为了人或动物食物中的谷物的用途而生长。然而,植物的其他部分,例如茎,外壳,营养性部分等都是有用的,包括用作动物饲料,发酵饲料,生物催化的一部分或观赏性的用途。
转基因植物也可用于商业上的蛋白或其他分子的生产,其中从植物部分,种子等中提取或纯化感兴趣的分子。也可体外培养、生长植物的细胞或组织,或发酵制备这种分子。
转基因植物也可用于商业上的育种项目,或杂交或培育相关农作物种类的植株。可以传递重组DNA编码的改进,例如,通过原生质体融合从大豆细胞传递到其他种类的细胞。
在一个实施方案中,含有玉米邻氨基苯甲酸α-结构域的转基因分离自对5-MT耐受的玉米品系,与35S CaMV启动子连接并且采用微粒轰击的方法导入5-MT敏感的单子叶或双子叶组织中。筛选出转化的胚胎或分生组织用于产生转基因植物。评估转化的愈伤组织和转基因的植物对5-MT或6-MA的耐受性和耐受性状的稳定遗传性。
下面的实施例进一步阐述了本发明,但并不是为了限制本发明。
实施例1:来自根瘤农杆菌的邻氨基苯甲酸合酶的分离和大肠杆菌表达
该实施例描述了来自根瘤农杆菌的邻氨基苯甲酸合酶的分离及其在大肠杆菌中的表达。
根瘤农杆菌AS的克隆
使用来自苜蓿中华根瘤菌(Rhizobium meliloti)的邻氨基苯甲酸合酶编码区的核苷酸和氨基酸序列(GenBank登录号:P15395)检索根瘤农杆菌C58基因组序列数据库(Goodner等人,科学Science,294:2323-2328(2001))。该检索由利用blosum62矩阵的tblastn组成(Altschul等人,核酸研究Nucleic Acid Res.,25:3389-3402(1997))。
在根瘤农杆菌C58基因组序列数据库中鉴定的AS同系物,通过利用来自根瘤农杆菌菌株C58(ATCCNo.33970)的基因组DNA作为模板的PCR克隆。初级的PCR反应利用下列引物进行:
5′-TTATGCCGCCTGTCATCG-3′(SEQ ID NO:47);和
5′-ATAGGCTTAATGGTAACCG-3′(SEQ ID NO:48)。
基因扩增参数如下:(a)95℃变性30秒,(b)50℃退火30秒,以及(c)根据制造商的指导,利用扩展高保真PCR(Roche Biochemicals)在72℃延伸2分钟。
附加一轮的PCR扩增产生大约2.3Kb长度的产物,该反应利用上述的扩增模板和下列成套引物:
5′-CTGAACAACAGAAGTACG-3′(SEQ ID NO:49);和
5′-TAACCGTGTCATCGAGCG-3′(SEQ ID NO:50)。
将纯化的PCR产物连接到pGEM-Teasy(Promega Biotech)中从而得到质粒pMON61600(图1)。pMON61600利用标准的测序方法测序。正确序列的确认是通过与苜蓿中华根瘤菌邻氨基苯甲酸合酶的序列(图2)比较而获得的。来自分离克隆的翻译的氨基酸序列(SEQ ID NO:4)与苜蓿中华根瘤菌酶(SEQID NO:7)(图2)享有88%的同一性。缩写″AgroAS″或根瘤农杆菌AS有时在此用于指根瘤农杆菌的邻氨基苯甲酸合酶。
根瘤农杆菌AS的大肠杆菌表达
构建下列载体以便于将根瘤农杆菌AS基因亚克隆到合适的表达载体中。
利用pMON61600作为模板和下列引物产生2215碱基对的PCR片段:
5′-AAAAAGATCTCCATGGTAACGATCATTCAGG-3′
(SEQ ID NO:51);和
5′-AAAAGAATTCTTATCACGCGGCCTTGGTCTTCGCC-3′
(SEQ ID NO:52)。
质粒pMON61600用限制性内切酶NcoI和RsrII消化。另外,将409bp的片段(通过用NcoI和RsrII消化2215碱基对的PCR产物产生)随后连接到消化的pMON61600质粒中,从而替换NcoI/RsrII片段,并在具有根瘤农杆菌AS翻译起始密码子(ATG)的框内得到NcoI位点,以产生质粒pMON34692(图3)。
碱基T7大肠杆菌表达质粒,pMON34697(图4),是通过用SphI和BamHI限制性消化pET30a(NoVogen公司)而产生的。纯化所得到的4,969bp片段并用来自pET11d(NoVogen公司)的338bp的SphI和BamHI片段亚克隆。
质粒pMON34705(图5)通过用NcoI和SacI限制性消化pMON34697而产生。然后纯化所得到的5,263bp片段并连接来自包含根瘤农杆菌AS的pMON34692的2,256bp的NcoI和SacI片段。
根据制造商的指导说明(Novogen公司),将质粒pMON34705转化入大肠杆菌BL21(DE3)(F-ompTHsdSb(rB -mB -)gal dcm(DE3))。DE3是包含受控制于异丙基-1-硫代-D-半乳糖苷(IPTG)诱导的lacUV5的T7 RNA聚合酶的染色体拷贝的λDE3的宿主溶菌原。
在已经于37℃培养过夜(10小时)的卡那霉素平板上筛选转化细胞。将单克隆转入2ml的LB(Luria液体培养基;每升10g胰蛋白胨,5g酵母提取物,10gNaCl,和1g葡萄糖(任选的))或2×-YT液体培养基(每升16g胰蛋白胨,10g酵母提取物,5gNaCl),然后放入37℃的培养箱中在225rpm摇动3小时。移出细胞并在培养物中加入4μL的100mM IPTG,再放回37℃培养箱补充培养2-3小时。移出1mL等分的细胞,并在超声缓冲液(50mM磷酸钾(pH7.3),10%甘油,10mM 2-巯基乙醇和10mM MgCl2)中超声处理。所得到的裂解细胞提取物是用于如下所述的标准AS分析的原材料。结果证实以质粒pMON34705为基础的表达体系能够生产可溶解的和酶促活性的根瘤农杆菌AS蛋白质,其数量是总的可溶解的提取蛋白质的大约50%。
实施例2:通过用野生型的农杆菌邻氨基苯甲酸合酶转化植物获得高Trp种子水平。
表达载体pMON58120
载体pMON58120(图34)编码264碱基对的拟南芥小亚基(SSU)叶绿体靶肽(CTP,SEQ ID NO:71)和2187碱基对的野生型农杆菌(Agrobacterium)邻氨基苯甲酸合酶(AgroAS)开放阅读框(SEQ ID NO:1)间的融合体。参见,Stark等人,(1992)科学Science,258:287。开放阅读框的表达是由大豆7Sα初级(7Sα′)启动子驱动的。
当在细胞质核糖体上翻译时,融合体(不成熟的蛋白质)进入到叶绿体中,其中除去了叶绿体靶序列。在CTP1中存在2个切割位点。第一个位点是CDS起始(C/M)上游的30个碱基对,而另一个是起始的甲硫氨酸(C/M)。第二切割位点看来不进行有效地加工。预测该切割产生通过酶活性数据和trp效能数据所显示的具有AS活性的大约70Kd的成熟蛋白质。
AS基因用赋予草甘膦抗性的合成CP4基因转化,然而CP4基因是从AS基因单独加工出来的。CP4基因的表达由FMV启动子驱动,该启动子是来自玄参(Figwort)花叶病毒的35S启动子。草甘膦抗性提供了转化植物的筛选。
AS蛋白质的Western分析
分析pMON58120的35个转化事件中AgroAS蛋白质的存在。AgroAS蛋白质用兔抗纯化的His标记的AgroAS激发的多克隆抗体检测。使用His-标记的全长Agro-AS多肽作为抗原,由CoCalico Biological公司在兔中产生多克隆抗体群。将重组His标记的Agro-AS DNA置入pMON34701(pet-30a-agroAS)表达载体。His-AgroAS融合蛋白质在大肠杆菌BL21(DE3)中表达,并通过Ni-NTA树脂***(Qiagen方法)纯化。对于western分析,使用1∶5,000稀释的兔抗-AgroAS初级抗体。其次使用1∶5,000稀释的山羊抗-兔碱性磷酸酶-共轭的抗体。在携带7Sα′-Agro AS基因的转基因品系中,western印迹分析一致显示存在特异地与抗-AgroAS抗体交叉反应的单个条带。没有在非转基因的对照品系中检测到该条带。
大豆和拟南芥种子的游离氨基酸分析
氨基酸提取:将大约50mg碾碎的大豆种子(5mg拟南芥)材料置于各自的离心管中。将1毫升的5%三氯乙酸加入各个样品(对于拟南芥为100μl)。涡旋样品,并在室温下搁置搅动15分钟。然后在14000rpm微离心15分钟。除去一些上清液,放入HPLC管并密封。样品在4℃保存有待排列分析。
氨基酸分析:用于氨基酸分析的试剂包括硼酸盐缓冲液(水中0.4N,pH10.2)中的OPA试剂(含邻苯二醛和3-巯基丙酸的硼酸盐缓冲液Hewlett-Packard,PN 5061-3335))。利用如2000年3月17日的Agilent技术出版物,″利用Zorbax Eclipse-AAA柱和Agilent 1100系列HPLC的氨基酸分析″所描述的Agilent 1100系列HPLC***进行分析。最初,用10μl硼酸盐缓冲液中的2.5μl OPA试剂诱导(derivatized)0.5μl的样品。其次,将该诱导衍生物用1.2ml/min的流速注射到Eclipse XDB-C18 5μm,4.6×150mm柱上。利用在340nm激发,在450nm发射的荧光测量氨基酸浓度。用HPLC缓冲液A和B的梯度根据表A进行洗提,其中HPLC缓冲液A是40mM Na2HPO4,pH=7.8,而HPLC缓冲液B是9∶9∶2∷甲醇∶乙腈∶水。
                    表A:氨基酸洗提
    时间     0     20     21     26     27
%缓冲液B     5     65     100     100     100
从干的化学药品,利用感兴趣的所有氨基酸制备氨基酸标准。脯氨酸分析需要使用9-芴甲基-氯甲酸酯(FMOC)的附加衍生步骤。氨基酸标准有时也以0-100μg/ml的浓度范围购买。样品以μg/g的种子粉末报告。
野生型农杆菌邻氨基苯甲酸合酶在拟南芥中的表达
将载体pMON58120通过次级荧光的真空渗入转化拟南芥植株,并且容许植株产生转基因的种子。收集种子并以存在可选择的标记物(草甘膦抗性)进行筛选。草甘膦抗性植物生长成熟并且从各个植物收集种子,其中该植株指明为转化事件,并且分析色氨酸含量(表B)。如表B所示,也在成熟种子中通过Western印迹分析,分析所选择转化事件中表达农杆菌邻氨基苯甲酸合酶蛋白质的存在。
               表B:转化体的分析
    转化事件     Trp(ppm)     蛋白质的存在
    7317     2547     +
    7315     2960     +
    7319     3628     +
    7313     3979     +
野生型农杆菌邻氨基苯甲酸合酶在大豆(Glycine Max)中的表达
分析35个大豆转化事件中,33个具有增加的种子trp水平,例如,从上述的500ppm达到12,000ppm。在非转基因的大豆种子中,trp水平小于200ppm。包含高数量trp的所有种子通过western印迹证明邻氨基苯甲酸合酶蛋白质的表达。表C显示包含高trp水平以及通过western印迹分析邻氨基苯甲酸合酶蛋白质,同时也为邻氨基苯甲酸合酶阳性的19个大豆事件的数据。
      表C:具有pMON58120的19个大豆转基因事件中
      AgroAS蛋白质的存在和色氨酸水平之间的相关性
    谱系 最大Trp(ppm) 平均Trp(ppm) 蛋白质存在?
  A3244(ctr)     306     96     否
GM_A20380:@. 6444 2246.4
  GM_A20532:@.     6055     2556.6     是
  GM_A22043:@.     10422     2557.2     是
  GM_A20598:@.     8861     2859.9     是
GM_A20744:@. 7121 3373.3
GM_A20381:@. 6392 3572.9
GM_A20536:@. 9951 3581.5
  GM_A20510:@.     8916     3592.7     是
GM_A20459:@. 8043 3900.4
GM_A20337:@. 7674 4088.6
  GM_A20533:@.     9666     4183.2     是
GM_A20577:@. 6276 4434.1
  GM_A20339:@.     9028     4687.8     是
GM_A20386:@. 8487 5285.3
  GM_A20457:@.     11007     5888.9     是
GM_A20379:@. 7672 6416.1
GM_A20537:@. 9163 6695.8
  GM_A20534:@.     12676     7618.2     是
  GM_A20576:@.     10814     7870.1     是
Agro AS的酶测定
在携带pMON58120构建体的11个转化事件中测量邻氨基苯甲酸合酶的特异活性。利用基于HPLC的终点分析根据C.Paulsen(J.Chromatogr.,547:155-160(1991))所描述的方法分析个别的大豆未成熟种子。简要地,从碾磨缓冲液(100mM Tris pH7.5,10%甘油,1mM EDTA,1mM DTT)中的单个种子产生脱盐提取物并用反应缓冲液(100mM tris pH7.5,1mM分支酸,20mM谷氨酰胺和10mM MgCl2)培育30分钟。在存在或缺少25mM trp时测量AgroAS活性。反应用磷酸终止并且通过HPLC利用设置在340nm/激发和410nm/发射的荧光检测器定量所形成的邻氨基苯甲酸的数值。
不成熟的分离的转基因种子中AS的特异活性与非转基因对照相比,增加1.5倍到70倍,达到高达6,000pmoles/mg/min。如表D的最后一列所示,转基因植物中的邻氨基苯甲酸合酶活性是抗色氨酸抑制的(参见表D)。
              表D:转基因事件20576中的Agro AS酶活性
 事件 种子号     特异活性(pmoles/mg/min)              特异活性(pmoles/mg/min)(+25微摩尔Trp)
 对照 3244-1     95.4     42.4
 对照 3244-2     85.5     40.6
 20576 20576-1     6060.2     4407.1
 20576 20576-2     3783.8     1709.4
 20576 20576-3     2768.3     2431.7
 20576 20576-4     4244.08     2125.2
实施例3:用包含玉米邻氨基苯甲酸合酶α-亚基基因的载体转化大豆
玉米邻氨基苯甲酸合酶α-亚基的编码序列通过用XbaI组合部分的NcoI消化而从pMON52214(图22)分离(参见Anderson等人,美国专利号6,118,047)。所得到的表示邻氨基苯甲酸合酶α编码区的1952bp的DNA片段用凝胶纯化,并制备成平末端。质粒pMON53901(图23)用BglII和EcoRI消化,以产生6.8Kb的片段。分离后,使6.8Kb片段的末端钝化并脱磷酸化。然后将包含ASα基因的1952Kb的片段连接平末端的6.8Kbp的MON53901片段以产生pMON39324,玉米7S启动子-玉米ASα-NOS3′UTR表达载体(图24)。
该pMON39324,玉米7S启动子-玉米ASα-NOS3′UTR盒,随后用BamHI消化获得包含7S启动子和玉米ASα编码序列的2.84Kb的DNA片段。质粒pMON39322(图25)用BamHI消化获得5.88kb的DNA片段。然后将这2个片段连接在一起以产生pMON39325(图26),亚克隆成为pMON39322的包含7S启动子-玉米ASα-NOS3′UTR盒的转化载体。
利用类似的方法,从USP启动子的下游克隆玉米邻氨基苯甲酸合酶α-亚基的编码序列,以产生pMON58130表达载体,从Arc5启动子的下游克隆产生pMON69662表达载体,从Lea9启动子下游克隆产生pMON69650表达载体,以及从Per1启动子的下游克隆产生pMON69651表达载体。这些表达载体的列表如表E所示。
     表E:C28-玉米邻氨基苯甲酸合酶的构建体
    种子世代     表达盒     载体名称
    R4     7Sa′-玉米ASα     PMON39325
    R2     Napin-玉米ASα     PMON58023
    R1     USP-玉米ASα     PMON58130
    R1     Arc5-玉米ASα     PMON69662
    R1     Lea9-玉米ASα     PMON69650
    R1     Per1-玉米ASα     PMON69651
这些载体用于植物转化和繁殖实验。如在此所描述的,大豆植株用包含玉米AS的载体利用微粒子轰击技术转化。对于每种类型的载体分别建立几个转基因的大豆品系,并且通过表E中所标明的世代数目来繁殖。
例如,建立3个携带pMON39325的7Sα′-玉米AS转化基因的纯合系。这3个系在2个不同的场所随机分组设计生长。产生成熟的种子并且分析游离氨基酸的含量。包括对照以建立基线的trp水平,即3个相应阴性的等值线和非转基因的对照。
表F提供pMON39325转化体和对照系的R4种子中ppm的色氨酸,显示非转基因大豆平均包含大约100-200μg色氨酸种子粉末,而pMON39325转化体基本上包含更多的Trp。也参见,图27。
                 表F:用C28玉米突变体(pMON39325)转化
                      的大豆植株种子中的色氨酸水平
阳性等值线号 阳性等值线的平均trp(ppm) 标准偏差 相应的阴性等值线的平均trp(ppm)   标准偏差
39325-1     3467     377     226     55
39325-2     2623     307     164     20
39325-3     3715     152     184     64
39325-4     2833     165     202     146
39325-5     3315     161     173     34
39325-6     2394     318     144     22
非转基因的对照-7     191     24
非转基因的对照-8     118     23
用在5个不同启动子的控制下表达C28玉米邻氨基苯甲酸合酶的5个其他构建体转化大豆(表E),并获得转基因植株。各个构建体都产生高trp的结果。由Per1-C28玉米邻氨基苯甲酸合酶产生的实施例说明的结果显示在表G和H中。
   表G:3个具有Per1-C28玉米AS(pMON69651)的转基因
    事件中C28玉米AS蛋白质表达与增加的Trp水平相关
    谱系     平均Trp(ppm)   蛋白质存在?
    对照     96     否
    22689     2375     是
22787 1707
22631 1116
表H说明用pMON69651表达载体转化大豆植株,R1种子中C28玉米AS的酶活性。
      表H:pMON69651转化体的R1种子中C28玉米AS的特异活性
 事件  种子号     特异活性(pmoles/mg/min)     种子特异活性(pmoles/mg/min)(+25微摩尔色氨酸)
 对照     51.6     2.6
 22689  22689-1     130.9     64.7
 22689-2     115.3
 22689-3     148.5     61.1
 22689-4     149.5
 22689-5     133.8     60.3
这些结果表明当大豆植物组织用C28玉米AS基因转化时,色氨酸有显著的增加。
表G中显示的高色氨酸水平与AS蛋白质的存在和转基因酶的增加的特异活性(比非转基因对照中高2.5倍)有关(表H)。如表H所示-以及根据C28玉米AS酶的生物化学特性所预测的-转基因事件的特异活性是色氨酸-抗性的。
实施例4:根瘤农杆菌邻氨基苯甲酸合酶色氨酸反馈不敏感的突变体的合理设计
该实施例描述包含对色氨酸或色氨酸类似物的反馈抑制具有各种灵敏度或不敏感的突变的根瘤农杆菌邻氨基苯甲酸合酶的载体。
根瘤农杆菌突变的邻氨基苯甲酸合酶基因的产生
利用硫磺矿硫化叶菌(Solfulobus solfataricus)的邻氨基苯甲酸合酶蛋白质结构信息作为指导(Knochel等人,Proc.Natl.Acad.Sci.(美国),96:9479-9484(1999)),利用蛋白质信息学确信指定几个涉及色氨酸结合的残基,合理设计几个根瘤农杆菌邻氨基苯甲酸合酶突变体。这通过将根瘤农杆菌邻氨基苯甲酸合酶基因与硫磺矿硫化叶菌的邻氨基苯甲酸合酶氨基酸序列进行序列对比而实现(图6)。根瘤农杆菌假定的色氨酸结合和催化域是通过结合对序列同源性的结构信息的认识而指定的。确定结合袋中的残基是可用于改变以提供对色氨酸反馈抑制的抗性的潜在候选物。
根据硫磺矿硫化叶菌邻氨基苯甲酸合酶的结构分析,表明氨基酸E30,S31,I32,S42,V43,N204,P205,M209,F210,G221和A373涉及色氨酸结合。根据成对地序列对比,硫磺矿硫化叶菌的N204,P205和F210在单体的根瘤农杆菌邻氨基苯甲酸合酶中分别为残基N292,P293和F298,也是保守的。
然而,由于多重***和缺失,硫磺矿硫化叶菌和根瘤农杆菌酶的N-末端区是高度离散的。因此,必须在根瘤农杆菌邻氨基苯甲酸合酶涉及色氨酸调控的N-末端区域人工指定残基(图6)。结构分析表明基序″LLES″在色氨酸结合袋中形成β折叠(β-sheet)。该结构在异四聚体酶中看来似乎是高度保守的。然后将已知的单体酶利用″LLES″基序作为界标人工序列对比于硫磺矿硫化叶菌序列(图21)。根据蛋白质信息学分析,根瘤农杆菌AS中的氨基酸残基V48,S50,S51和N52也可能涉及色氨酸结合。
随着在根瘤农杆菌单体的酶中指定假定的色氨酸结合残基,合理化几个独特策略以用于减少该酶对色氨酸抑制的敏感性。这些置换包括例如,扩大色氨酸-结合袋(F298A),窄化结合袋(V48F,V48Y,S51F,S51C,N52F,F298W),增加结合袋的极性(S50K),或通过改变蛋白质主链的构象扭曲结合袋的形状(P293A,P29G)。
根瘤农杆菌AS的定点诱变
使用定点诱变产生10个单一氨基酸置换的6个位点。利用QuikChangeTM定点诱变试剂盒(Stratagene)将突变导入pMON34705中的根瘤农杆菌AS。用于定点诱变的引物是SEQ ID NOs:9-42(图7;F=正向,R=反向)。每个引物序列特异地用于在序列中的特异位点改变核酸,并因此改变编码的密码子,用于编码新的氨基酸。例如,S51C指明在根瘤农杆菌AS肽序列51位的氨基酸,从丝氨酸变化为半胱氨酸。
诱变后再确认全部基因的序列并且表达变体以及如下列用于野生型酶所描述的,从大肠杆菌纯化。将所得到的包括突变的根瘤农杆菌AS的质粒利用如实施例1所描述的T7表达***,合适地克隆到用于过量生产蛋白质的质粒中。
根瘤农杆菌AS蛋白质的表达和纯化
如实施例中所描述的,在大肠杆菌中表达根瘤农杆菌AS野生型和突变的酶。所有的根瘤农杆菌AS酶,包括野生型和其突变体的纯化,在4℃进行。将细胞(大约1g湿重)悬浮在20ml的纯化缓冲液(50mM磷酸钾,pH7.3,10mMMgCl2,10mM2-巯基乙醇,10%甘油)中,并且通过超声处理(Branson SonifierCell Disruptor,W185)裂解。匀浆物在20,000×g离心15分钟后收集上清液。上清液进行硫酸铵分级分离(30-65%饱和)。在20,000×g离心15分钟后收集沉淀物,并溶于3ml的纯化缓冲液,然后整个地加载到用相同的缓冲液预平衡的Econo-Pac 10DG脱盐柱上。通过进一步分析检测包含酶的级分并加以收集。将收集的酶(4.3mls)加载到用相同的缓冲液平衡的10ml DEAESephacel(Pharmacia Biotech)柱(1.5×7.5cm)上。该柱用30ml的纯化缓冲液洗涤并且用相同缓冲液中的30ml的50mM NaCl洗提酶。收集包含高AS活性的级分并且通过65%的硫酸铵饱和液沉淀,以及如上所述分离和脱盐。收集包含酶的级分并贮藏在-80℃。
邻氨基苯甲酸合酶的酶测定和动力学分析
根瘤农杆菌AS的标准分析于25℃,在包含100mM磷酸钾,pH7.0,10mMMgCl2,1mM二硫苏糖醇,200μM分支酸和10mM L-谷氨酰胺的分析缓冲液中进行。通过将30μl的酶加入反应混合物并混合而开始反应。邻氨基苯甲酸的形成直接通过320m处3分钟的吸光率增加而监测。根据吸光率对反应时间变化的斜率,以每秒增加的单位吸光率计算反应的初速度。在总体积为1ml的包含100mM磷酸钾,pH7.0,10mM MgCl2,1mM二硫苏糖醇和10mM L-谷氨酰胺,并且分支酸浓度在2.5-100μM分支酸之间变化的分析缓冲液中确定分支酸的Km(KmCho)。在总体积为1ml的包含100mM磷酸钾,pH7.0,10mM MgCl2,1mM二硫苏糖醇和200μM分支酸,并且L-谷氨酰胺浓度在0.1-2mM L-谷氨酰胺之间变化的分析缓冲液中确定谷氨酰胺的Km(KmGln)。在总体积为1ml,包含100mM磷酸钾,pH7.0,10mM MgCl2,1mM二硫苏糖醇,10mM L-谷氨酰胺,200μM分支酸,并且L-色氨酸的浓度在0.1-10mM色氨酸之间变化的分析缓冲液中确定色氨酸的IC50(IC50 Trp)。在使数据适合非线性回归程序(GraFit)后计算AS的动力学参数和IC50
几个突变体证明对色氨酸抑制的敏感性降低,同时与野生型酶相比仍然保持酶活性(表I)。这些结果表明可例如通过在邻氨基苯甲酸合酶的色氨酸结合袋中突变氨基酸和通过优化证明为反馈不敏感的突变来减少对色氨酸抑制的灵敏性的程度。
           表I:邻氨基苯甲酸合酶活性以及色氨酸
                对根瘤农杆菌AS突变体的作用
  突变   密码子     Km Cho(μM)     Km Gln(mM)     kcat(s-1)     kcat/Km Cho(μM-1s-1)   IC50 Trp(μM)
  WT     8.0     0.11     0.43     5.37×10-2     5
  V48F   TTT     4.5     0.08     0.24     5.33×10-2     150
  V48Y   TAT     4.2     0.10     0.18     4.28×10-2     650
  S50K   AAG     13     0.01     0.13     1.00×10-2     0.1
  S51F   TTC     10     0.06     0.08     0.80×10-2     >32,000
  S51C   TGC     2.8     0.08     0.15     5.36×10-2     1,500
  N52F   TTC     5.5     0.04     0.21     3.82×10-2     41
  P293A   GCG     24     0.16     0.35     1.46×10-2     14
  P293G   GGG     33     0.07     0.48     1.45×10-2     17
  F298A   GCC     9.2     0.10     0.46     5.00×10-2     5.5
  F298W   TGG     18     0.14     0.44     2.44×10-2     450
实施例5:随机诱变根瘤农杆菌AS以产生色氨酸反馈不敏感的突变体
除在实施例4中所描述的合理设计方法外,其他产生邻氨基苯甲酸合酶的反馈不敏感突变体的策略包括但不限于随机诱变。根瘤农杆菌AS的随机诱变,可例如通过化学诱变(分离的DNA或完整的生物体)、易错PCR和DNA移码实现。该实施例描述化学诱变及其后的遗传选择的使用。遗传选择方法也对选择来源于其他诱变方法的所需要的突变体有用。
包含根瘤农杆菌AS的大肠杆菌表达质粒的产生
通过利用包含正向引物5′末端上的Ncol位点和反向引物3′末端上的XbaI位点的引物,PCR扩增来自根瘤农杆菌AS克隆pMON61600(在实施例1中所描述的(SEQ ID NO:1)的开放阅读框:
5′-CATCCCATGGATGGTAACGATCATTCAGGAT-3′
(SEQ ID NO:55);和
5′-GATGTCTAGAGACACTATAGAATACTCAAGC-3′
(SEQ ID NO:56)。
将所得到的PCR产物连接到pMON25997(图28)中,pMON25997用BspH1和Xba1消化除去bktB开放阅读框(Slater等人,细菌学杂志J.Bact.,180:1979-1987(1998))而得到质粒pMON62000(图29)。pMON62000是用于诱变和互补色氨酸营养缺陷型(EMG2ΔtrpE)的基础质粒。
大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE的产生
大肠杆菌菌株Ec-8(EMG2ΔtrpE)利用***载体pKO3构建,以从大肠杆菌菌株EMG2(K-12 wt F+)(大肠杆菌遗传原种中心)的染色体的trpE基因缺失1,383个碱基对。PCR扩增大肠杆菌基因组DNA的2个扩增子。第一个扩增子大约1.5kb,并在3′末端包含trpE ORF的前30bp。该扩增子在5′末端包含BamHI位点,并且在3’末端包含EcoR1位点。第二个扩增子大约1kb,并且在5’末端包含trpE ORF的最后150bp。该扩增子在5’末端包含EcoR1位点,并且在3’末端包含Sal1位点。2个扩增子用适当的酶消化,并且在EcoR1位点连接在一起以产生trpE的框内缺失。图30显示所得到的截短基因的序列(SEQ IDNO:46)。将trpE缺失扩增子在BamH1和Sal1位点连接到pKO3中。如A.J.Link等人,J.Bacteriol.,179:6228(1997)所描述的进行基因断裂。
大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE与pMON62000的互补
用pMON62000转化大肠杆菌菌株Ec-8(EMG2ΔtrpE)并且接种在M9基本培养基上以确定缺失是否通过加入pMON62000而互补。对照质粒(减去根瘤农杆菌AS***)和对照菌株Ec-8也接种在M9基本培养基和具有40μg/ml色氨酸的M9基本培养基上。观察到在没有色氨酸的M9上生长用pMON62000转化的菌株Ec-8,而对照都没有观察到有生长,表明菌株Ec-8中trpE缺失通过pMON62000互补。
pMON62000的羟胺诱变和突变体的遗传选择
为了产生邻氨基苯甲酸合酶的突变体,pMON62000用化学诱变剂羟胺突变。将下列成分在eppendorf管中化合:20μg pMON62000质粒DNA和40μl2.5M羟胺,pH6.0。用0.1M NaH2PO4,pH6.0+5mM EDTA,pH6.0使体积变为200μl。该试管在70℃孵育。1.5小时后,将100μl的反应混合物在浮于大约500ml H2O上的硝酸纤维素滤膜上透析。15分钟后,利用Qiagen PCR纯化试剂盒浓缩DNA。3小时后,将剩余的100μl反应混合物移出并以同样的方式纯化。
然后大肠杆菌菌株Ec-8用已经用羟胺诱变处理1.5或3小时的100ngpMON62000通过电穿孔转化。对于各个时间点进行2种转化方法。容许转化细胞在SOC介质(20g/L细菌用胰化胨(Bacto-Tryptone),5g/L细菌用酵母提取物,10ml/L 1M NaCl,2.5ml/L 1M KCl,18g葡萄糖)中恢复4或6小时。
制备2个245mm正方形的生物检测平板,包含M9基本培养基,加2%琼脂和50μg/ml 5-甲基-DL-色氨酸(5-MT)。将一等分的900μl 1.5小时诱变处理的转化混合物接种到1个50μg/ml 5-MT的平板上。将剩余的100μl接种到M9对照平板上。对于包含3.0小时诱变处理的质粒的转化混合物进行相同的步骤。
然后平板在37℃孵育大约2.5天。从5-MT平板分离抗性克隆并接种到LB-卡那霉素(50μg/ml)平板上以验证质粒的存在。所有选择的集落都在这些平板上生长。将来自每一抗性克隆的个别克隆分成两份以分离质粒。进行限制性消化和PCR并且证实所有的克隆都包含所需的根瘤农杆菌AS***。
然后将挽救质粒转化回菌株Ec-8。通过划线接种到新的LB-卡那霉素平板上纯化来自每个转化子的一个克隆。为了证实对5-MT的抗性,将个别纯化的克隆接种到包含M9加50μg/ml 5-MT和2%琼脂的平板上,然后在37℃生长3天。大部分克隆证实有抗性。为了确定抗性突变体是否在5-MT的更高浓度保持抗性,将它们接种到M9加300μg/ml 5-MT和2%琼脂上。大多数克隆证明在此高浓度也有抗性。
分离来自所有抗性克隆的质粒并对两条链都测序。这个实验的一些突变体在表J中进行图解。
           表J:5-MT抗性克隆中根瘤农杆菌trpEG序列的变化。
  数据库克隆#   原始克隆#  确定的序列变异体   Km cho(μM)   IC50 trp(μM)
  Wt     8.0     5.0
  Ec-12     1  G4A Val2Ile
  Ec-18     8  C35T Thr12Ile     15     2.5
  Ec-19     9  C2068T Pro690Ser     5.0     3.4
  Ec-20     11  G1066A Glu356Lys和C1779T Ile593Ile
如表J中的数据所表明的,几个突变体对突变酶的Kmcho和IC50 trp的作用很小,表明这些突变可能不是抗色氨酸反馈抑制的来源。例如,在核苷酸35位的C到T的突变,它将氨基酸12位的苏氨酸残基变化为异亮氨酸(Thr12Ile),而在Kmcho和IC50 trp值中产生微小的变化。类似地,核苷酸2068位的C到T的变化,将脯氨酸变化为丝氨酸,也在Kmcho和IC50 trp值中产生微小的变化。这些突变可能因此,也许是产生具有如同野生型酶特性的变体基因产物的″沉默的″突变。
实施例6:高色氨酸转基因的大豆植物。
该实施例说明由用来自根瘤农杆菌的邻氨基苯甲酸合酶的色氨酸反馈不敏感突变体转化产生的,具有升高的色氨酸水平的转基因大豆植物的制备。
载体构建
质粒pMON34711,具有来自根瘤农杆菌的,包含在实施例4中所描述的F298W突变的邻氨基苯甲酸合酶克隆,将其用限制性内切酶NotI消化。使所得到片段的末端钝化,然后用NcoI消化。然后质粒pMON13773(图8)用限制性内切酶EcoRI消化,使末端钝化,然后用NcoI消化。将所得到片段连接质粒pMON58044,该质粒包含在7S启动子和NOS3′UTR控制下的AS基因(图9)。
然后用限制性内切酶BglII和NcoI切割质粒pMON58044,并连接通过用BglII和NcoI消化pMON53084(图10)所产生的片段。所得到的片段命名为pMON58045(图11)并且包含用于拟南芥SSU1A运输肽的序列。
最后,通过连接由用限制性内切酶NotI消化pMON58045(图11)和pMON38207(图13)所产生的片段构建质粒pMON58046(图12)。这产生了用于大豆转化的pMON58046载体(图12)。
经微粒子轰击的大豆转化
对于粒子轰击转化法,将市场上可买到的大豆种子(即,Asgrow A3244,A4922)发芽大约18-24小时过夜,并切下分生组织外植体。移去初生叶暴露分生组织并将外植体置于目标培养基中,同时分生组织垂直于粒子递送的方向。
将如上所述的pMON58046转化载体用CaCl2和亚精胺沉淀到显微的金粒子上,并且随后再悬浮在乙醇中。将悬浮液包涂到Mylar片层上,然后放置到放电装置上。将颗粒以大约60%的电容经放电加速进入植物组织。
轰击后,将外植体置于选择性培养基(WPM+0.075mM草甘膦)(WPM=木本植物(woody plant)培养基(McCown和Lloyd,Proc.International PlantPropagation Soc.,30:421,(1981)minus BAP))中5-7周,以供选择和生长转基因苗用。轰击大约5-7周后收获表型阳性的苗,并且放入选择性的根培养基中(BPM+0.025mM草甘膦)(参见,下列用于BRM的配方)2-3周。将产根苗转入温室并盆栽到土壤中。将在选择中保持健康,但不生根的苗转入非选择性的根培养基中(无草甘膦的BRM)附加培养2周。在转入温室并盆栽到土壤中之前,检测来自任何不在选定区域生根的苗的根中,植物选择性标记物的表达。在标准温室条件下保持植株直到收获R1种子。
用于豆生根培养基的配方(BRM)提供如下。
化合物 4L的数量
MS盐*** 8.6g
肌醇(细胞培养级) 0.40g
SBRM维生素原液** 8.0ml
L-半胱氨酸(10mg/ml) 40.0ml
蔗糖(超纯的) 120g
调节pH到5.8
Washed琼脂 32g
高压灭菌后加入:
SBRM/TSG激素原液* 20.0毫升
*SBRM/TSG激素原液(每1L的BRM):3.0ml IAA(0.033mg/ml),2.0ml无菌蒸馏水。原液在4℃避光储存。
**SBRM维生素原液(每1L的原液):甘氨酸(1.0g),烟酸(0.25g),吡哆醇HCl(0.25g),硫胺HCl(0.25g)。
***3×MInorMS盐(每1L原液):H2BO3(1.86g),MnSO4(5.07g),ZnSO4-H2O(2.58g),KI(0.249g),7.5ul NaMoO-2H2O(1.0mg/ml),7.5ulCoSO4-5H2O(1.0mg/ml),7.5ulCoCl2-6H2O(1.0mg/ml)。
每次加入并溶解1个成分,用无菌蒸馏水使体积达到1升,并且该溶液保存在箔覆盖的瓶子中,在冰箱中保存不超过1个月。
利用根瘤农杆菌转化大豆
对于农杆菌转化法,将市场上可买到的大豆种子(Asgrow A3244,A4922)发芽过夜(大约10-12小时),并且切下分生组织外植体。可移去或不移去初生叶暴露分生组织并且将外植体置于创伤导管中。
使包含感兴趣质粒的农杆菌菌株ABI生长到对数期。通过离心收获细胞并且再悬浮在含有诱导物的接种培养基中。从种子开始萌芽和利用超声处理创伤以来不迟于14小时,混合大豆外植体和诱导的农杆菌培养物。
创伤后,在农杆菌中培养外植体大约1个小时。该接种步骤后,通过移液管移出农杆菌并且将外植体置于共培养2-4天。此时,将它们转入选择性培养基(WPM+0.075mM草甘膦+抗生素以控制农杆菌过度生长)5-7周以容许选择并生长转基因的苗。
轰击后大约5-7周后,收获表型阳性的苗并置于选择性的根培养基中(BRM+0.025mM草甘膦)2-3周。将产生根的苗转入温室并盆栽到土壤中。将在选择中保持健康,但不生根的苗转入非选择性的根培养基中(无草甘膦的BRM)附加培养2星期。在转入温室并盆栽到土壤中之前,检测来自任何不在选定区域生根的苗的根中,植物选择性标记草甘膦抗性的表达。在标准温室条件下保持植株直到收获R1种子。
R1种子的氨基酸含量的分析
生产成熟的R1种子并且利用如Agilent Technologies Technical BulletinREV14所描述的荧光检测分析游离氨基酸的含量。从每个事件选择5个种子用于单个种子分析。表达AgroAS F298W,AgroAS S51F,AgroAS V48F,AgroAS V48Y或AgroAS S51C的突变体蛋白质的大豆种子产生高数量的色氨酸。最高水平的色氨酸对萌芽具有负影响。结果显示在表K,L和M中。
表K:用pMON58046转化的种子中蛋白质的表达
    谱系     平均Trp(ppm)   蛋白质存在?
    对照     96     否
22817 9922
    22891     12955     是
    23026     7968     是
      表L:AS蛋白质表达与pMON58123转化相关
    谱系     平均Trp(ppm)   蛋白质存在?
    对照     96     否
    23562     88     否
    23590     8795     是
    23911     388     否
        表M:携带下列AgroAS等位基因中的一个的大豆中,
             平均和最大的色氨酸水平:V48F(pMON66877)、
              V48Y(pMON66878)和S51C(pMON66879)。
 PMON号     说明    事件号   平均trp(ppm)   最大trp(ppm)
 66877  7Sα-V48F AgroAS     26640     12,283     28,342
 66877  7Sα-V48F AgroAS     26641     5,588     14,579
 66877  7Sα-V48F AgroAS     26642     11,833     18,712
 66878  7Sα-V48Y AgroAS     26872     6,015     11,902
 66878  7Sα-V48Y AgroAS     26875     12,361     17,181
 66878  7Sα-V48Y AgroAS     27010     13,962     19,323
 66879  7Sα-S48C AgroAS     27105     12,614     31,827
 66879  7Sα-S48C AgroAS     27300     16,711     34,263
 66879  7Sα-S48C AgroAS     27568     10,135     20,237
用AgroAS转化的R1种子中的AS酶活性
生产成熟的R1种子并且分析邻氨基苯甲酸合酶活性。在携带AgroASF298W(SEQ ID NOs:65或91)或AgroAS S51F(SEQ ID NOs:60或86)突变体等位基因的R1大豆种子中确定邻氨基苯甲酸合酶的酶活性。观察到非常高水平的色氨酸-抗性邻氨基苯甲酸合酶活性,与由这些种子所产生的高数量的色氨酸一致。结果显示在表N和O中。
           表N:用pMON58046转化的R1种子中AS的特异活性
  事件   种子号     特异活性(pmoles/mg/min)     种子特异活性(pmoles/mg/min)(+25微摩尔Trp)
  对照     77.6
 23076   23076-1     100.5     1.04
  23076-2     4512.8
  23076-3     9737.4     9290.4
  23076-4     136.12
  23076-5     8992.5     9749.9
           表O:用pMON58123转化的R1种子中AS的特异活性
  事件   种子号     特异活性(pmoles/mg/min)     种子特异活性(pmoles/mg/min)(+25微摩尔Trp)
 对照     83.7     32.7
 23590   23590-1     891     692.3
  23590-2     466.2     186.5
  23590-3     71.7     38.3
  23590-4     320.5     316.2
实施例7:包括芸香邻氨基苯甲酸合酶α-亚基的转化载体的制备
来自芸香(Ruta graveolens)的邻氨基苯甲酸合酶α基因(Genbank登记号GI960291)提供另一个对本发明有用的邻氨基苯甲酸合酶结构域(Bohlmann,J等人,Plant Phys.,111:507-514(1996))。存在于芸香基因组中的邻氨基苯甲酸合酶的一个同工酶显示对L-色氨酸的反馈抑制的敏感度较低。该等位基因也可用于本发明以提高转基因植物中游离的L-色氨酸的水平。载体pMON58030(图14)包含对色氨酸抑制较少敏感的芸香邻氨基苯甲酸合酶α-亚基。从pMON58030 PCR扩增芸香的邻氨基苯甲酸合酶α基因,以提供在芸香邻氨基苯甲酸合酶α基因片段的5′末端的BamHI位点和在3末端的BglII位点,其中利用包含这2个限制性内切酶位点的引物:
5′-CAAAAGCTGGATCCCCACC-3′(SEQ ID NO:53);和
5′-CCTATCCGAGATCTCTCAACTCC-3′(SEQ ID NO:54)。
纯化PCR片段,用分别的限制性内切酶消化以形成pMON58041,其中包含芸香ASα至napin启动子的转录融合体。产生农杆菌介导的植物转化质粒,pMON58043,包括napin启动子,芸香AS,NOS终止子,草甘膦抗性(CP4)可选择的标记和适合于所述盒的固有染色体整合的边界。使用所得到的植物转化载体利用如实施例2,3和6中所描述的标准的植物转化技术转化植物。
实施例8:转化多个多肽邻氨基苯甲酸合酶成为单体的单个多肽邻氨基苯甲酸合酶
需要通过融合所选择的多亚基酶产生单体的邻氨基苯甲酸合酶,例如为了优化催化的效率,为了稳定酶,为了获得例如包括TrpE和TrpG活性的亚基,以及2个亚基间有效传递的协同表达。在有些情况下,可能对使用植物或微生物来源的TrpE或α-亚基有用,其中该植物或微生物通过标准诱变方法或通过如前文的实施例,例如实施例4中所描述的合理设计而不受有关反馈抑制的调控。在其他情况下,使用植物或微生物来源的野生型TrpE或α-亚基。
所选择的TrpE或α-亚基的C-末端连接TrpG亚基或β-亚基的N-末端,优选使用肽接头连接。可合理设计接头以提供合适的间隔和使两个亚基适当定位排列的灵活性。可选地接头可通过单体的和异四聚体的邻氨基苯甲酸合酶的序列对比确定。单体的和异四聚体的邻氨基苯甲酸合酶所形成的序列对比的实例显示在图21和35中。也可设想可能必须产生包括异源亚基的单体邻氨基苯甲酸合酶以便优化效益。例如,α-亚基可从例如大肠杆菌的细菌来源获得,并与例如拟南芥的植物来源的β-亚基融合。
可将产生的新蛋白质导入植物,例如如实施例2,3或6中所描述的。本发明不限于所显示和描述的精确细节,因为应该理解可在保持在权利要求所定义的本发明的精神和范围内的同时,产生许多变化和改进。
实施例9:来自基因组序列数据库的邻氨基苯甲酸合酶的鉴定。
对本发明有用的单体邻氨基苯甲酸合酶以及α和β结构域可经生物信息分析,通过利用BLAST( www.ncbi.nlm.nih.gov/blast/)搜索例如genbank和/或swisprot数据库鉴定。鉴定单体邻氨基苯甲酸合酶的有用的查询序列包括,例如邻氨基苯甲酸合酶的结构域,例如硫磺矿硫化叶菌的α-结构域(GI1004323)或β-结构域(GI 1004324),或单体的邻氨基苯甲酸合酶,例如根瘤农杆菌AS(GI 15889565)。推定的单体邻氨基苯甲酸合酶将具有与询问序列50%和100%之间的同源性,并且应最低限度地包含700个氨基酸。如果使用AS-α-结构域查询基因组数据库,除鉴定推定的邻氨基苯甲酸合酶基因外,它也可能鉴定涉及PABA合成,例如4-氨基-4-脱氧分支酸(ADC)合酶的基因。单体的ADC合酶基因可根据观察ADC合酶的酰胺转移酶结构域(β-结构域)存在于蛋白质的N-末端,而AS的酰胺转移酶结构域(β-结构域)存在于C-末端,从而将推定的单体AS基因轻易地鉴定出来。对本发明有用的单体邻氨基苯甲酸合酶通过生物信息分析鉴定,包括但不限于,例如苜蓿中华根瘤菌(Rhizobiummeliloti)(GI 95177),百脉根根瘤菌(Mesorhizo biumloti)(GI 13472468),马尔他布鲁氏菌(Brwella melitensis)(GI 17982357),念珠藻属(NostoaSP.)PCC7120(GI 17227910,GI 17230725),巴西固氮螺菌(Azospirillumbrasilense)(GI 1174156),血色红假单胞菌(Rhodopseudomonas palustris),鱼腥藻(Anabaena)M22983(GI 152445)。图21是本发明中所使用的2个单体邻氨基苯甲酸合酶(根瘤农杆菌和苜蓿中华根瘤菌)与2个异四聚体邻氨基苯甲酸合酶(硫磺矿硫化叶菌和拟南芥)的序列对比的实例。图35是几个单体的邻氨基苯甲酸合酶与血色红假单胞菌异四聚体邻氨基苯甲酸合酶的序列对比的实例。
实施例10:优化密码子的使用
该实施例说明通过优化密码子的使用改进植物种子中邻氨基苯甲酸合酶基因表达的方法。
检验野生型根瘤农杆菌的邻氨基苯甲酸合酶(AS)基因的核苷酸序列(SEQ ID NO:1)中存在的不表达密码子。为了鉴定低表达的密码子,从谷物和大豆中寻找高度表达的种子蛋白质的序列以获得相对的密码子频率。相对的密码子使用频率显示在表P中,表示为预期值的形式。预期值形式可例证说明如下:假定存在4个编码给定氨基酸的密码子,并且假定它们同样使用,然后预期每个密码子占氨基酸25%(0.25)的频率。然而,由于冗余,将0.25规范化到1.0,以对每个密码子相比较于编码该氨基酸的密码子产生相对的积分。对于这个分析,如果该密码子比另一个对于给定的氨基酸选择更占优势,则它受到大于1.0的计数。相应地,如果密码子是较少占优势的,它受到小于1.0的计数。对于这个研究,如果其相对的密码子使用频率低于0.5,则认为该特定的密码子未被充分表示。
利用表P所产生的结果,在谷物和大豆中,野生型农杆菌AS序列的紧密检查显示认为125个密码子未被充分表示(低于0.5的阈值)(表Q)。这些未被充分表示的密码子被如上所定义的更占优势的密码子替代。改变的核苷酸序列显示在图36中。利用生物信息工具,装配所得到的序列并且通过翻译以及与相应的野生型AS序列的核苷酸和蛋白质的序列对比分析完整性。虽然未改变蛋白质序列,但优化序列的核苷酸序列与野生型的农杆菌AS序列(图37)具有94%的同一性。分别利用Lasergene EditSeq(DNASTAR公司,Madison,WI)和Grail2(国立橡树岭实验室,OakRidge,TN)分析优化的核苷酸序列中隐藏的多聚腺苷酸化信号(AATAAA,AATAAT)和隐藏的内含子的缺乏。没有发现隐藏的信号。
改变的核苷酸序列利用本领域中公知的技术或由例如EgeaBiosciencesces公司(SanDiego,加利福尼亚)的商业供应者合成。将所得到的核苷酸克隆到适当的表达载体中,并且利用本说明书的上述实施例中所详细记载的方法,测试在谷物,大豆和拟南芥中的效能。
       表P:玉米和大豆种子-表达基因1中相对的密码子使用频率。
密码子  氨基酸   玉米种子  大豆种子 密码子 氨基酸   玉米种子   大豆种子
  TTT     F     0.4211     0.7348     ATC     I     1.7143     1.0563
  TTC     F     1.5789     1.2652     ATA     I     0.3673     0.6654
  TTA     L     0.4557     0.3875     ATG     M     1.0000     1.0000
  TTG     L     0.9494     1.2060     ACT     T     0.6153     1.0008
  TCT     S     0.9624     1.4851     ACC     T     1.2213     2.1020
  TCC     S     1.3707     1.1249     ACA     T     0.8372     0.7146
  TCA     S     0.9107     1.0044     ACG     T     1.3262     0.1826
  TCG     S     0.7851     0.3266     AAT     N     0.2885     0.5409
  TAT     Y     0.2455     0.6861     AAC     N     1.7115     1.4591
  TAC     Y     1.7545     1.3139     AAA     K     0.5333     0.9030
  TGT     C     0.2788     0.7572     AAG     K     1.4667     1.0970
  TGC     C     1.7222     1.2428     AGT     S     0.2679     0.9714
  TGG     W     1.0000     1.0000     AGC     S     1.7032     1.0876
  CTT     L     0.7975     1.6298     AGA     R     0.3913     1.9459
  CTC     L     1.0610     1.6301     AGG     R     2.9185     1.3087
  CTA   L     0.8544     0.5905     GTT     V   0.5714     1.2381
  CTG   L     1.8820     0.5562     GTC     V   1.0119     0.6864
  CCT   P     0.6500     1.5822     GTA     V   0.3810     0.3472
  CCC   P     0.8520     0.7694     GTG     V   2.0357     1.7284
  CCA   P     1.2240     1.5838     GCT     A   0.9876     1.3583
  CCG   P     1.2740     0.0645     GCC     A   1.1618     1.1283
  CAT   H     0.8438     0.6066     GCA     A   0.8011     1.2898
  CAC   H     1.1563     1.3934     GCG     A   1.0495     0.2235
  CAA   Q     0.8639     1.2162     GAT     D   0.8500     0.9523
  CAG   Q     1.1361     0.7838     GAC     D   1.1500     1.0477
  CGT   R     0.2582     0.5903     GAA     E   0.6818     1.0463
  CGC   R     1.0082     1.1159     GAG     E   1.3182     0.9537
  CGA   R     0.1957     0.6700     GGT     G   1.1268     1.1431
  CGG   R     1.2283     0.3692     GGC     G   1.8758     0.6577
  ATT   I     0.9184     1.2783     GGA     G   0.3085     1.2759
  ATC   I     1.7143     1.0563     GGG     G   0.6889     0.9233
1相对的密码子频率以预期值的形式表示。这指如果存在4个编码给定氨基酸的密码子,并且它们是同样使用的,预期每个密码子占25%(0.25)。由于冗余,将0.25规格化为1,以对于每个密码子相比较于所有编码该氨基酸的密码子产生相对的积分。如果密码子比另一个对于给定的氨基酸选择更占优势,则它将得到>1的计数。而如果它比另一个对于该氨基酸较少优选,它将得到<1的计数。
        表Q:未被充分表示的AgroAS密码子和用于改善种子表达2的改进
  密码子   密码子(wt)   氨基酸   修饰的密码子   作物中未充分表示2   密码子   密码子(wt)   氨基酸 修饰的密码子 作物中未充分表示   密码子   密码子(wt)   氨基酸   修饰的密码子   作物中未充分表示
  2  GTA   V   GTG   谷物,大豆   177   TCG   S TCC 大豆   481   GCG   A   GCC   大豆
  3  ACG   T   ACC   大豆   179   GCG   A GCC 大豆   485   AAT   N   AAC   谷物,大豆
  9   GGA  G  GGT   谷物     180  CGT  R  CGC 谷物 489   CCG   P  CCA   大豆
  10   GCG  A  GCC   大豆     181  CCG  P  CCA 大豆 504   ATA   I  ATC   谷物
  15   ACG  T  ACC   大豆     185  CGT  R  CGC 谷物 508   CGT   R  CGC   谷物
  16   AAA  K  AAG   谷物     190  TTT  F  TTC 谷物 520   CGT   R  CGC   谷物
  21   GTC  V  GTG   大豆     201  TAT  Y  TAC 谷物 543   ACG   T  ACC   大豆
  23   CGA  R  CGC   谷物     209  CGT  R  CGC 谷物 545   GCG   A  GCC   大豆
  26   CGG  R  CGC   大豆     218  ACG  T  ACC 大豆 546   AAT   N  AAC   谷物,大豆
  30   TAT  Y  TAC   谷物     219  ACG  T  ACC 大豆 547   TAT   Y  TAC   谷物
  36   AAT  N  AAC   谷物,大豆     238  CCG  P  CCA 大豆 551   ACG   T  ACC   大豆
  46   GGC  G  GGT   大豆     244  CGT  R  CGC 谷物 553   GCG   A  GCC   大豆
  47   GCG  A  GCC   大豆     248  TAT  Y  TAC 谷物 554   ACG   T  ACC   大豆
  48   GTT  V  GTG   谷物     276  CGT  R  CGC 谷物 556   TCG   S  TCC   大豆
  49   TTT  F  TTC   谷物     280  AAT  N  AAC 谷物,大豆 559   AGA   R  AGG   谷物
  50   TCG  S  TCC   大豆     281  CCG  P  CCA 大豆 561   CCG   P  CCA   大豆
  53   TAT  Y  TAC   谷物     282  TCG  S  TCC 大豆 572   CCG   P  CCA   大豆
  55   TAT  Y  TAC   谷物     283  GCG  A  GCC 大豆 578   TCG   S  TCC   大豆
  56   CCG  P  CCA   大豆     290  GCG  A  GCC 大豆 580   GGA   G  GGT   谷物
  58   CGT  R  CGC   谷物     293   CCG  P  CCA 大豆 584   CCG   P  CCA   大豆
  64   ACG  T  ACC   大豆     294   TCG  S  TCC 大豆 585   ACG   T  ACC   大豆
  69   CCG  P  CCA   大豆     296   TAT  Y  TAC 谷物 592   ACG   T  ACC   大豆
  70   CCG  P  CCA   大豆     301   AAT  N  AAC 谷物,大豆 602   CCG   P  CCA   大豆
  75   TGT  C  TGC   谷物     307   TAT  Y  TAC 谷物 617   TAT   Y  TAC   谷物
  76   TTT  F  TTC   谷物     312   TCG  S  TCC 大豆 633   TCG   S  TCC   大豆
  85   TAT  Y  TAC   谷物     313   CCG  P  CCA 大豆 652   ACG   T  ACC   大豆
  86   AAT  N  AAC   谷物,大豆     322   CGT  R  CGC 谷物 655   CGT   R  CGC   谷物
  97   ACG  T  ACC   大豆     328   CCG  P  CCA 大豆 658   TCG   S  TCC   大豆
  102   GCG  A  GCC   大豆   329   ATA  I  ATC   谷物   667  CCG  P   CCA   大豆
  112   TCG  S  TCC   大豆   339   CCG  P  CCA   大豆   668  CGT  R   CGC   谷物
  115   CGG  R  CGC   大豆   352   TCG  S  TCC   大豆   680  ACG  T   ACC   大豆
  123   CCG  P  CCA   大豆   363   TCG  S  TCC   大豆   690  CCG  P   CCA   大豆
  125   CGT  R  CGC   谷物   376   CCG  P  CCA   大豆   698  CCG  P   CCA   大豆
  133   TCG  S  TCC   大豆   378   TCG  S  TCC   大豆   700  TCG  S   TCC   大豆
  136   CCG  P  CCA   大豆   390   TAT  Y  TAC   谷物   703  ACG  T   ACC   大豆
  137   ACG  T  ACC   大豆   411   TTT  F  TTC   谷物   705  GGA  G   GGT   谷物
  143   AGA  R  AGG   谷物   442   CCG  P  CCA   大豆   708  GCG  A   GCC   大豆
  150   TAT  Y  TAC   谷物   446   TAT  Y  TAC   谷物   711  CGG  R   CGC   大豆
  151   TCG  S  TCC   大豆   449   GCG  A  GCC   大豆   715  AAT  N   AAC   谷物,大豆
  153   GCG  A  GCC   大豆   460   AAT  N  AAC   谷物,大豆   724  GCG  A   GCC   大豆
  155   TCG  S  TCC   大豆   464   ACG  T  ACC   大豆   729  GCG  A   GCC   大豆
  172  GCG  A  GCC   大豆   469   CGG  R  CGC   大豆
2标题为″作物中未充分表示″栏表明作物(玉米或大豆)中特定的密码子是未被充分表示的。
实施例11:包括单体的苜蓿中华根瘤菌邻氨基苯甲酸合酶的转化载体的制备。
苜蓿中华根瘤菌的基因克隆
使用获得自ATCC的苜蓿中华根瘤菌1021的穿刺培养物,接种到YM培养基(每1L含10g甘露醇,0.5g K2HPO4,0.2g MgSO4-7H2O,1.0g酵母提取物,0.2g NaCl,88mg FeCl3-6H2O,15g琼脂)平板上。该平板在30℃生长2天。使用单个克隆接种到1升的YM培养基中。该培养物在30℃生长过夜。在5,000×g旋转10分钟沉下细胞颗粒并且在-20℃冷冻。使用Qiagen Genomic-tip DNA试剂盒(Qiagen公司,Valencia,加利福尼亚)根据1999年8月的Qiagen基因组DNA手册(第42页)提取基因组DNA。
使用PCR反应扩增基因。所使用的引物是Rhizo F2:
ATGGCAGCGGTAATTCTGGAAG(SEQ ID NO:138)和Rhizo R8:
TCAGGCTGCCTTGGTCTTC(SEQ ID NO:139)。
将所得到的PCR片段克隆到pGEM(Promega公司,Madison,WI.)载体中。
最后,利用PCR扩增pGEM中的PCR产物,使用下列引物:
Rhizo NcoI ACTGACTCCATGGCAGCGGTAATTCTGGAA
(SEQ ID NO:140)和Rhizo SpeI:
CTGACTAGTTCAGGCTGCTT(SEQ ID NO:141),
并且将产物克隆到TOPO 2.1 PCR载体中(Invitrogen公司,Grand Island,N.Y.)。
载体构建
用SpeI消化在TOPO 2.1载体中包含根瘤菌基因的载体,并且进行klenow反应以使该位点钝化。PCR纯化DNA(Qiagen PCR纯化试剂盒和MinElute手册,2001),然后用NcoI消化。将该片段克隆到pET30a的EcoRV和NcoI位点,从而产生pMON66595(图41)。
通过几个步骤产生拟南芥转化载体,最初用NcoI/EcoRI消化pMON13773(图8)以产生骨架片段。用NcoI和EcoRI消化pMON66595并除去根瘤菌AS基因的较大的部分(大约2000碱基对)。然后将两段连接在一起。用EcoRI消化阳性克隆并用小牛肠磷酸酶(CIP)处理。通过用EcoRI消化pMON66595除去根瘤菌基因的第二个片段,并且保持大约200碱基对的片段。将2个片段连接在一起,并且对所合成的克隆测序以检查根瘤菌小片段的正确方向。
用BglII和NcoI消化具有正确的序列和方向的上述一个克隆。然后用BglII和NcoI消化pMON58046(图12),并且除去CTP2运输肽片段。将这些片段连接在一起以完成该盒。
连接片段用NotI消化以移出该盒。然后在CIP处理的NotI位点将它们连接成为pMON36524(图48)。消化这些克隆以发现以与NPTII基因产生pMON66599(图42)相同的方向***的盒。
然后将载体pMON66599转化农杆菌并用于转化拟南芥。该实验中的对照构建体是pMON66598(图43),其与pMON66599所描述的盒***方式相同,只是包含农杆菌AS野生型基因。
互补分析
用BamHI和NcoI切下来自pMON66595的根瘤菌AS基因,并克隆到pSE280载体(Invitrogen)的相应位点,产生pMON66596(图44)。然后将pMON66596转化突变的大肠杆菌菌株,EMG2ΔtrpE(产生自EMG菌株WTK12,F+,获得自ATCC)显示同数的基因互补于trp-菌株的基因组。
活性分析
将pMON66596转化BL-21细胞并用IPTG诱导表达蛋白质。通过HPLC分析粗细胞提取物,并发现具有活性和大约10μM trp的IC50(Poulson,色谱法杂志Journal of Chromatography,547:155-160(1991))。
蛋白质表达和纯化
通过用IPTG诱导His-标记的蛋白质表达。利用QIAexpressionist 2002手册和镍树脂(Ni-NTA Spin手册,2000)中所列出的天然条件完成蛋白质纯化。兔血清显示识别纯化的蛋白质。
如在实施例2,3和6中,用包含根瘤菌邻氨基苯甲酸合酶基因的载体转化植物,并且在种子中显示升高的色氨酸水平。
实施例12:用包含玉米邻氨基苯甲酸合酶α-亚基基因和玉米邻氨基苯甲酸合酶β-亚基基因的载体转化谷物。
为了产生包含玉米邻氨基苯甲酸合酶α-亚基的编码序列的穿梭载体,用EcoRI和SacII消化pMON65150。凝胶纯化所得到的6195碱基对的片段,然后脱磷酸化。质粒pMON66604用EcoRI和SacII消化,以产生凝胶纯化的1077碱基对的片段。然后将1077碱基对的片段连接包含玉米ASα编码序列的粘末端的6195碱基对片段,以产生pMON67149,玉米L3(油质蛋白)启动子-玉米hsp70内含子-玉米ASα-Tr7 3′UTR表达载体。随后用XhoI消化这个载体,产生包含玉米油质蛋白启动子、玉米热休克蛋白70内含子、玉米邻氨基苯甲酸α-亚基编码序列和Tr7 3’UTR的4364碱基对的DNA片段。
用XhoI消化质粒pMON30167,产生8.89Kb的DNA片段。然后将这个片段连接4964碱基对的片段以产生pMON79951(图45),转化载体包含L3启动子-zmhsp70内含子-玉米ASα-Tr7 3′UTR。
通过PCR从Monsanto所有的cDNA文库分离玉米邻氨基苯甲酸合酶β-亚基的编码序列,其中利用下列引物:
5′引物5″TGCTGACCATGGCCTGCTCCCACATCGTCG3′
(SEQ ID NO:142),其包含NcoI限制酶切位点(以粗体显示),和
3′引物5′CAGTGAATTCCTACGAACGCTGCTTCTCCAGTTC3′
(SEQ ID NO:143),其包含EcoRI限制酶切位点(以粗体显示)。
所使用的PCR参数是,2°/秒到95°;95°5分钟;2°/秒到95;95°30秒;2°/秒到55°;55°45秒;2°/秒到72°;72°55秒;循环25次,在第三步开始;2°/秒到72°;72°10分钟;2°/秒到4°保持。(所有的温度显示为℃,除非另作说明)。PCR混合物包含:1μl从pMON79952小量制备(Qiagen方法)的DNA,1.5μl的各种引物(10μM原液)5μl含氯化镁的Roche 10×PCR缓冲液,2μl 10mM dNTP混合物,1μL高保真(Hi-Fi)Taq混合物(Roche扩展高保真PCR***#1732650)和水,总体积为50μl。所得到的PCR产物连接到pGEM-T载体(Promega pGEM-T载体***I#A3600)中。对上述片段测序显示其丢失限制性酶切位点。利用pGEM克隆作为模板再进行PCR,并且将产物克隆到TOPO 2.1 PCR载体中(Invitrogen TOPO TA克隆试剂盒pCR2.1-TOPO载体#45-0641)。该克隆通过测序证实。所得到的包含玉米ASβ的载体称为pMON66592。然后用NcoI和EcoRI消化该载体,以产生850碱基对(bp)的片段。分离后,钝化850bp片段的末端并脱去磷酸。用BamHI和SmaI消化质粒pMON79953,以产生5353bp的片段。分离后,钝化5353bp片段的末端。然后将包含ASβ基因的850bp片段连接到平末端的5353bppMON79953片段中以产生pMON79954,玉米L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR载体。
随后用XhoI消化载体pMON79954以产生包含玉米油质蛋白启动子,玉米hsp70内含子,玉米ASβ编码序列和Tr7 3′UTR的2907碱基对的DNA片段。质粒pMON30167(图49)用XhoI消化以产生8.89Kb的片段。将2个片段连接在一起以产生pMON79955(图46),转化载体包含L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR。
为了产生玉米ASα和ASβ叠加(stacking)载体,用HindIII消化pMON79955以产生16.57Kb的片段。产生钝化的片段并且脱去磷酸。质粒pMON67149用XhoI消化,以产生4364碱基对的DNA片段,随后变为平末端。将2个片段连接在一起以产生pMON79956(图47),最后的转化载体包含玉米L3启动子-zmhsp70内含子-玉米ASα-Tr73′UTR,与玉米L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR叠加。
利用根瘤农杆菌转化玉米
玉米植株(自交系LH198/Hi11)在标准实验下生长在温室中。当胚为1.5-2.0mm长度,通常在授粉后10-15天收获植物的穗。通过喷雾或渗入80%的乙醇对穗进行表面杀菌。
利用本领域技术人员公知的方法从个体的种仁分离不成熟的胚胎。转化前,将不成熟的胚胎在包含16.9mg/L AgNO3(指定为培养基2112V)的培养基211(N6盐,2%蔗糖,1mg/l 2,4-二氯苯氧乙酸(2,4-D),0.5mg/L烟酸,1.0mg/L硫胺HCl,0.91g/L L-天冬酰胺,100mg/L:肌醇,0.5g/L MES,100mg/L酪蛋白水解物,1.6g/L MgCl2,0.69g/L L-脯氨酸,2g/L GELGRO tm,pH5.8)上培养3-6天。
农杆菌介导的转化玉米细胞及其他单子叶植物的方法是已知的(美国专利号5,591,616和5,981,840;以及EP0 672 752)。使用农杆菌菌株ABI和根瘤农杆菌二元载体***进行转化。
在与玉米胚胎细胞共培养前,农杆菌细胞生长在28℃,包含大约50μg/ml卡那霉素和100μg/ml壮观霉素的LB(DIFCO)液体培养基中,以选择保持改变的Ti质粒和二元载体。在接种玉米细胞前,农杆菌细胞在室温下,在包括用于保持质粒的适当抗生素和200μM乙酰丁香酮的AB培养基(Chilton等人,Proc.Nat.Acad.Sci.(美国),71:3672-3676(1974))中生长过夜。在马上接种前,农杆菌细胞通过离心沉淀,在包含200μM乙酰丁香酮的1/2 MSVI培养基(2.2g/L GIBCO MS(Murashige和Skoog,Physiol.Plant 15:473-497(1962)基本(basal)盐,2mg/L甘氨酸,0.5g/L烟酸,0.5g/LL-吡哆醇-HCl,0.1mg/L硫胺,115g/L L-脯氨酸,10g/L D-葡萄糖和10g/L蔗糖,pH5.4)中洗涤。
切下不成熟的玉米胚,浸于1/2MSPL培养基的农杆菌悬浮液中并且在室温下与农杆菌培养大约5分钟。
农杆菌感染和共培养后,将胚转入类型II的延迟培养基中5-7天并且在27℃黑暗培养。延迟培养基由包含2.0mg/L 2,4-D(GIBCO),100mg/L-酪蛋白氨基酸,12mM脯氨酸,500mg/L羧苄青霉素和20μM硫代硫酸银的MS基础盐组成。所有的培养基化学试剂是组织培养级的。一旦从不成熟的胚胎观察到类型II的愈伤组织开始的标志,正如Selman等人,在玉米手册The MaizeHandbook,Freeling和Walbot编辑,Springer Verlag,第672页(1994)中所定义的,从胚胎除去胚芽鞘。然后将胚胎转入包含2.0mg/L 2,4-D,12mM脯氨酸,20μM硫代硫酸银,500mg/L羧苄青霉素和0.5mM草甘膦(Monsanto公司,St.Louis,Mo.)的MS培养基并且在27℃黑暗培养2周。
如上所述将胚形成的愈伤组织转入MS培养基,但是培养基另外包含1.0mM草甘膦。然后培养物在黑暗中于27℃培养2周。然后将仍然具有愈伤组织的胚转入包含3.0mM草甘膦的MS培养基另外培养2周。
通过将愈伤组织转入包含0.1mg/L 2,4-D和0.1μM脱落酸(ABA)的MS培养基2周,然后转入包含6%蔗糖而无2,4-D的MS培养基再培养2周实现植物再生。培育在黑暗中于27℃进行以容许体细胞胚成熟并在再生过程中转化。
将准备发芽的体细胞胚转入无激素的MS培养基,并且在光照下培养直到产生附着根的苗。大约2-3周后,产生小植株。
然后将小植株转入温室并且在标准温室条件下生长。
R1种子氨基酸含量的分析
对于各个载体建立几个转基因谷物的品系并通过世代的数目繁殖。这些品系是生长的,并且自花受粉以产生纯合系。在各个世代,利用在未成熟种子上进行western印迹分析确定转化基因的表达,产生成熟的R1种子并利用如Agilent Technologies Technical Bulletin REV14所描述的荧光检测分析游离氨基酸的含量。表达ASα蛋白质的玉米种子相对于基线水平(相当于阴性等值线和非转基因对照)产生升高数量的色氨酸。谷物的基线游离色氨酸水平的范围是从大约5-大约25ppm。
所有的出版物和专利在此引入作为参考,并且逐一地引入作为参考。本发明不限于所显示和描述的精确细节,因为应该理解在保持在由权利要求所定义的本发明的精神和范围之内的同时可产生许多变化和改进。
                          序列表
<110>孟山都技术公司(Monsanto Technology,LLC)
     Weaver,Lisa
     Oulmassov,Tim
     Vaduva,Gabriela
     Liang,Jihong
     Varagona,Rita
     Venkatesh,Tyamagondlu
<120>转基因的高色氨酸植物
<130>51857R
<160>143
<170>PatentIn version 3.1
<210>1
<211>2190
<212>DNA
<213>根瘤农杆菌(Agrobacterium tumefaciens)
<400>1
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc  1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag  1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat  1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc  1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc  1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt  1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc  1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca  1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga  1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat  1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag  1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc  1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc  1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg  2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg  2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg  2160
acccgcaagg cgaagaccaa ggccgcgtga                                   2190
<210>2
<211>1815
<212>DNA
<213>玉米(Zea mays)
<400>2
atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg   60
cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga  120
accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg  180
agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg  240
cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc  300
acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc  360
ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg  420
gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac  480
cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc  540
atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga  600
tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc  660
tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat   720
gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac   780
cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta   840
tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca   900
cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct   960
gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag  1020
aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg  1080
aatcctagcc catacatggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt  1140
cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact  1200
gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat  1260
gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag  1320
gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat  1380
gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat  1440
gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg  1500
gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga  1560
atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca  1620
gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc  1680
gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt  1740
gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt  1800
gtagacaaag aatag                                                   1815
<210>3
<211>1993
<212>DNA
<213>芸香(Ruta graveolens)
<400>3
aaaaaatctg tctgtttttc gtgtttggac atttcagcgg cactgggtgc catcagttga   60
ttcgactcat ttgatttatt ttgtttgttg gccatgagtg cagcggcaac gtcgatgcaa  120
tcccttaaat tctccaaccg tctggtccca cccagtcgcc gtctgtctcc ggttccgaac  180
aatgtcacct gcaataacct ccccaagtct gcagctcccg tccggacagt caaatgctgc  240
gcttcttcct ggaacagtac catcaacggc gcggccgcca cgaccaacgg tgcgtccgcc  300
gccagtaacg gcgcatccac gaccaccact acatatgtta gtgatgcaac cagatttatc  360
gactcttcta aaagggcaaa tctagtgcca ttataccgtt gcatattcgc ggatcatctc  420
acgccggtgc ttgcctatag atgtttggtt caagaagacg ataaagagac tccaagtttt  480
ttattcgaat cagtagagcc gggtcggatt tctactgttg ggaggtatag tgtggttgga   540
gctcatcccg tgatggaagt tatagctaaa gataatatgg ttacggtgat ggatcatgag   600
aaagggagct tagttgagga ggtggtcgat gatcccatgg agattcctag aagaatttcc   660
gaggattgga agcctcaaat aatcgatgat cttcctgaag ctttttgcgg tggttgggtt   720
ggtttcttct catacgatac agttcgatat gtggagaaga aaaagttacc attctcaaag   780
gcacctcagg atgataggaa tcttgcagat atgcatctag gtctctataa cgatgttatt   840
gtgtttgatc atgtggaaaa gaaagtatat gttattcatt gggtgaggct aaatcaacag   900
tcttctgaag aaaaagcata tgccgagggt ctggaacact tggagagact agtatccaga   960
gtacaggatg agaacacgcc aaggctcgcc ccaggttcca tagacttaca cactggtcat  1020
tttggacctc cattaaaaaa gtcaaacatg acatgtgaag aatacaaaat ggctgtacta  1080
gcggcaaaag aacatattca ggctggggat atttttcaaa tcgtactaag ccaacgtttt  1140
gaacgtcgaa catttgctga tccatttgaa gtttataggg cactgagagt tgttaatccg  1200
agtccctata tgacgtatat gcaggcaaga gggtgtgttc tggtagcttc aagtccagaa  1260
attcttactc gagtaaagaa gaataagatt gtgaatcgac ctttggctgg aacagcccga  1320
agagggagga ctactgaaga agatgagatg ttggaaacac agttgctaaa agacgcaaag  1380
caatgtgctg agcatgttat gctggtcgat ttgggacgga atgatgttgg caaggtttca  1440
aaatctggtt ctgtgaaagt ggaaaagctg atgaatgttg aacgatattc acatgttatg  1500
cacataagct ctacggtcac aggtgagttg caagataatc tcagttgctg ggatgccctg  1560
cgtgctgcac tgcctgtcgg gactgttagt ggagcaccaa aggtgaaggc aatggagtta  1620
atcgatgaat tggaggtaaa tagacgtggc ccctacagtg gtgggtttgg cggtatctcc  1680
ttcaccggag atatggacat tgccctggct ctaaggacca ttgttttcca aaccggtaca  1740
cgctatgaca caatgtactc gtacaagaat gctaccaaac gccggcagtg ggtggcatac  1800
cttcaagccg gggctggcat tgttgctgat agtgatccag acgacgagca tcgtgagtgc  1860
cagaacaaag ccgccggact ggcccgtgcc atcgacctag ctgagtctgc ttttgtgaac  1920
aaatcaagta gctaaagttt tggatttgga agtggagttg agtctcggat aggatttaga  1980
gtaaaaaaag agg                                                     1993
<210>4
<211>729
<212>PRT
<213>根瘤农杆菌(Agrobacterium tumefaciens)
<400>4
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                295                  300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                  525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>5
<211>604
<212>PRT
<213>玉米(Zea mays)
<400>5
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala
1               5                   10                  15
Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr
            20                  25                  30
Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala
        35                  40                  45
Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala
    50                  55                  60
Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala
65                  70                  75                  80
Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val
                85                  90                  95
Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu
            100                 105                 110
Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly
        115                 120                 125
Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His
    130                 135                 140
Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp
145                 150                 155                 160
His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln
                165                 170                 175
Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu
            180                 185                 190
Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp
        195                 200                 205
Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro
    210                 215                 220
Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp
225                 230                 235                 240
Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp
                245                 250                 255
Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly
            260                 265                 270
Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val
        275                 280                 285
Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly
    290                 295                 300
Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala
305                 310                 315                 320
Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile
                325                 330                 335
Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu
            340                 345                 350
Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala Tyr
        355                 360                 365
Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu
    370                 375                 380
Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr
385                 390                 395                 400
Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln
                405                 410                 415
Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp
            420                 425                 430
Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys
        435                 440                 445
Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile
    450                 455                 460
Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp
465                 470                 475                 480
Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys
            485                     490                 495
Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly
            500                 505                 510
Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln
        515                 520                 525
Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His
    530                 535                 540
Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val
545                 550                 555                 560
Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp
                565                 570                 575
Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala
            580                 585                 590
Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu
        595                 600
<210>6
<211>613
<212>PRT
<213>芸香(Ruta graveolens)
<400>6
Met Ser Ala Ala Ala Thr Ser Met Gln Ser Leu Lys Phe Ser Asn Arg
1               5                   10                  15
Leu Val Pro Pro Ser Arg Arg Leu Ser Pro Val Pro Asn Asn Val Thr
            20                  25                  30
Cys Asn Asn Leu Pro Lys Ser Ala Ala Pro Val Arg Thr Val Lys Cys
        35                  40                  45
Cys Ala Ser Ser Trp Asn Ser Thr Ile Asn Gly Ala Ala Ala Thr Thr
    50                  55                  60
Asn Gly Ala Ser Ala Ala Ser Asn Gly Ala Ser Thr Thr Thr Thr Thr
65                  70                  75                  80
Tyr Val Ser Asp Ala Thr Arg Phe Ile Asp Ser Ser Lys Arg Ala Asn
                85                  90                  95
Leu Val Pro Leu Tyr Arg Cys Ile Phe Ala Asp His Leu Thr Pro Val
            100                 105                 110
Leu Ala Tyr Arg Cys Leu Val Gln Glu Asp Asp Lys Glu Thr Pro Ser
        115                 120                 125
Phe Leu Phe Glu Ser Val Glu Pro Gly Arg Ile Ser Thr Val Gly Arg
    130                 135                 140
Tyr Ser Val Val Gly Ala His Pro Val Met Glu Val Ile Ala Lys Asp
145                 150                 155                 160
Asn Met Val Thr Val Met Asp His Glu Lys Gly Ser Leu Val Glu Glu
                165                 170                 175
Val Val Asp Asp Pro Met Glu Ile Pro Arg Arg Ile Ser Glu Asp Trp
            180                 185                 190
Lys Pro Gln Ile Ile Asp Asp Leu Pro Glu Ala Phe Cys Gly Gly Trp
        195                 200                 205
Val Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys
    210                 215                 220
Leu Pro Phe Ser Lys Ala Pro Gln Asp Asp Arg Asn Leu Ala Asp Met
225                 230                 235                 240
His Leu Gly Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys
                245                 250                 255
Lys Val Tyr Val Ile His Trp Val Arg Leu Asn Gln Gln Ser Ser Glu
            260                 265                 270
Glu Lys Ala Tyr Ala Glu Gly Leu Glu His Leu Glu Arg Leu Val Ser
        275                 280                 285
Arg Val Gln Asp Glu Asn Thr Pro Arg Leu Ala Pro Gly Ser Ile Asp
    290                 295                 300
Leu His Thr Gly His Phe Gly Pro Pro Leu Lys Lys Ser Asn Met Thr
305                 310                 315                 320
Cys Glu Glu Tyr Lys Met Ala Val Leu Ala Ala Lys Glu His Ile Gln
                325                 330                 335
Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg
            340                 345                 350
Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Val Val Asn
        335                  360                365
Pro Ser Pro Tyr Met Thr Tyr Met Gln Ala Arg Gly Cys Val Leu Val
    370                 375                 380
Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val
385                 390                 395                 400
Asn Arg Pro Leu Ala Gly Thr Ala Arg Arg Gly Arg Thr Thr Glu Glu
                405                 410                 415
Asp Glu Met Leu Glu Thr Gln Leu Leu Lys Asp Ala Lys Gln Cys Ala
            420                 425                 430
Glu His Val Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val
        435                 440                 445
Ser Lys Ser Gly Ser Val Lys Val Glu Lys Leu Met Asn Val Glu Arg
    450                 455                 460
Tyr Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln
465                 470                 475                 480
Asp Asn Leu Ser Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly
                485                 490                 495
Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu
            500                 505                 510
Leu Glu Val Asn Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile
        515                 520                 525
Ser Phe Thr Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val
    530                 535                 540
Phe Gln Thr Gly Thr Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Asn Ala
545                 550                 555                 560
Thr Lys Arg Arg Gln Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Ile
                565                 570                 575
Val Ala Asp Ser Asp Pro Asp Asp Glu His Arg Glu Cys Gln Asn Lys
            580                 585                 590
Ala Ala Gly Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val
        595                 600                 605
Asn Lys Ser Ser Ser
    610
<210>7
<211>729
<212>PRT
<213>苜蓿中华根瘤菌(Rhizobium meliloti)
<400>7
Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys
1               5                   10                  15
Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp
            20                  25                   30
Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile
                85                  90                  95
Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala
            100                 105                 110
Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala
    130                 135                 140
Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu
                165                 170                 175
Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala
    210                 215                 220
Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg
   370                   375                380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr
                485                 490                495
Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser
            500                 505                 510
Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly
        515                 520                 525
Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr
545                 550                 555                 560
Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu
    610                 615                 620
Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu
705                 710                 715                 720
Ala Lys Arg Ala Lys Thr Lys Ala Ala
                725
<210>8
<211>421
<212>PRT
<213>硫磺矿硫化叶菌(Sulfolobus solfataricus)
<400>8
Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe
1               5                   10                  15
Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile
            20                  25                  30
Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr
        35                  40                  45
Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly
    50                  55                  60
Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly
65                  70                  75                  80
Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys
                85                  90                  95
Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe
            100                 105                 110
Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val
        115                 120                 125
Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly
    130                 135                 140
Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr
145                 150                 155                 160
Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile
                165                 170                 175
Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp
            180                 185                 190
Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr
        195                 200                 205
Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro
    210                 215                 220
Glu Leu Leu Phe Arg Val Gln Asp Asn Ile Val Glu Thr Tyr Pro Ile
225                 230                 235                 240
Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu
                245                 250                 255
Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met
            260                 265                 270
Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly
        275                 280                 285
Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val
    290                 295                 300
Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn
305                 310                 315                 320
Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly
                325                 330                 335
Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr
            340                 345                 350
Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly
        355                 360                 365
Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu
    370                 375                 380
Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro
385                 390                 395                 400
Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr
                405                 410                 415
Ala Ile Gly Val Arg
            420
<210>9
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>9
ccatcgcggc gcgttttttt cgtccaacta tg                              32
<210>10
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>10
catagttgga cgaaaaaaac gcgccgcgat gg                              32
<210>11
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>11
ccatcgcggc gcgtattttt cgtccaacta tgaatatcc                       39
<210>12
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>12
ggatattcat agttggacga aaaatacgcg ccgcgatgg                       39
<210>13
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>13
ccatcgcggc gcgtggtttt cgtccaacta tgaatatcc                       39
<210>14
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>14
ggatattcat agttggacga aaaccacgcg ccgcgatgg                       39
<210>15
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>15
ccatcgcggc gcggttttta agtccaacta tgaatatcc                       39
<210>16
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>16
ggatattcat agttggactt aaaaaccgcg ccgcgatgg                       39
<210>17
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>17
gcgcggtttt ttcgtgcaac tatgaatatc cggg                            34
<210>18
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>18
cccggatatt catagttgca cgaaaaaacc gcgc                            34
<210>19
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>19
cgcggttttt tcgttcaact atgaatatcc gggc                            34
<210>20
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>20
gcccggatat tcatagttga acgaaaaaac cgcg                            34
<210>21
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>21
cggcgcggtt ttttcgatca actatgaata tccgggc                         37
<210>22
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>22
gcccggatat tcatagttga tcgaaaaaac cgcgccg                         37
<210>23
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>23
ggcgcggttt tttcgctcaa ctatgaatat ccgggc                          36
<210>24
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>24
gcccggatat tcatagttga gcgaaaaaac cgcgcc                          36
<210>25
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>25
cggcgcggtt ttttcgatga actatgaata tccgggccg                       39
<210>26
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>26
cggcccggat attcatagtt catcgaaaaa accgcgccg                       39
<210>27
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>27
cgcggttttt tcgaccaact atgaatatcc gggc                            34
<210>28
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>28
gcccggatat tcatagttgg tcgaaaaaac cgcg                            34
<210>29
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>29
ggcgcggttt tttcggtcaa ctatgaatat ccgggc                          36
<210>30
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>30
gcccggatat tcatagttga ccgaaaaaac cgcgcc                          36
<210>31
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>31
gcgcggtttt ttcgtacaac tatgaatatc cgggc                           35
<210>32
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>32
gcccggatat tcatagttgt acgaaaaaac cgcgc                           35
<210>33
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>33
cggcgcggtt ttttcgtcct tctatgaata tccggg                          36
<210>34
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>34
cccggatatt catagaagga cgaaaaaacc gcgccg                          36
<210>35
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>35
ctgaaggcga tcaacgcgtc gccctattc                                  29
<210>36
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>36
gaatagggcg acgcgttgat cgccttcag                                  29
<210>37
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>37
cctgaaggcg atcaacgggt cgccctattc c                               31
<210>38
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>38
ggaatagggc gacccgttga tcgccttcag g                               31
<210>39
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>39
cgtcgcccta  ttccgccttc atcaatctcg gcg                            33
<210>40
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>40
cgccgagatt gatgaaggcg gaatagggcg acg                             33
<210>41
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>41
cgtcgcccta ttcctggttc atcaatctcg gcg                             33
<210>42
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>42
cgccgagatt gatgaaccag gaatagggcg acg                             33
<210>43
<211>729
<212>PRT
<213>苜蓿中华根瘤菌(Rhizobium meliloti)
<400>43
Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys
1               5                   10                  15
Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp
            20                  25                  30
Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile
                85                  90                  95
Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala
            100                 105                 110
Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala
    130                 135                 140
Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu
                165                 170                 175
Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala
    210                 215                 220
Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
            355             360                 365
Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg
        370             375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                  425                430
Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser
            500                 505                 510
Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly
        515                 520                  525
Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr
545                 550                 555                 560
Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu
    610                 615                 620
Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys
        675                  680                685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu
705                 710                 715                 720
Ala Lys Arg Ala Lys Thr Lys Ala Ala
                725
<210>44
<211>616
<212>PRT
<213>硫磺矿硫化叶菌(Sulfolobus solfataricus)
<400> 44
Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe
1               5                   10                  15
Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile
            20                  25                  30
Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr
        35                  40                  45
Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly
    50                  55                  60
Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly
65                  70                  75                  80
Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys
                85                  90                  95
Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe
            100                 105                 110
Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val
        115                 120                 125
Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly
    130                 135                 140
Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr
145                 150                 155                 160
Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile
                165                 170                  175
Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp
            180                 185                 190
Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr
        195                 200                 205
Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro
    210                 215                 220
Glu Leu Leu Phe Arg Val Gin Asp Asn Ile Val Glu Thr Tyr Pro Ile
225                 230                 235                 240
Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu
                245                 250                 255
Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met
            260                 265                 270
Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly
        275                 280                 285
Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val
    290                 295                 300
Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn
305                 310                 315                 320
Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly
                325                 330                 335
Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr
            340                 345                 350
Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly
        355                 360                 365
Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu
    370                 375                 380
Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro
385                 390                 395                 400
Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr
                405                 410                 415
Ala Ile Gly Val Arg Met Asp Leu Thr Leu Ile Ile Asp Asn Tyr Asp
            420                 425                 430
Ser Phe Val Tyr Asn Ile Ala Gln Ile Val Gly Glu Leu Gly Ser Tyr
        435                 440                 445
Pro Ile Val Ile Arg Asn Asp Glu Ile Ser Ile Lys Gly Ile Glu Arg
    450                 455                 460
Ile Asp Pro Asp Arg Leu Ile Ile Ser Pro Gly Pro Gly Thr Pro Glu
465                 470                 475                 480
Lys Arg Glu Asp Ile Gly Val Ser Leu Asp Val Ile Lys Tyr Leu Gly
                485                 490                 495
Lys Arg Thr Pro Ile Leu Gly Val Cys Leu Gly His Gln Ala Ile Gly
            500                 505                 510
Tyr Ala Phe Gly Ala Lys Ile Arg Arg Ala Arg Lys Val Phe His Gly
        515                 520                 525
Lys Ile Ser Asn Ile Ile Leu Val Asn Asn Ser Pro Leu Ser Leu Tyr
    530                 535                 540
Tyr Gly Ile Ala Lys Glu Phe Lys Ala Thr Arg Tyr His Ser Leu Val
545                 550                 555                 560
Val Asp Glu Val His Arg Pro Leu Ile Val Asp Ala Ile Ser Ala Glu
                565                 570                 575
Asp Asn Glu Ile Met Ala Ile His His Glu Glu Tyr Pro Ile Tyr Gly
            580                 585                 590
Val Gln Phe His Pro Glu Ser Val Gly Thr Ser Leu Gly Tyr Lys Ile
        595                 600                 605
Leu Tyr Asn Phe Leu Asn Arg Val
    610             615
<210>45
<211>897
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400> 45
Met Ser Ala Val Ser Ile Ser Ala Val Lys Ser Asp Phe Phe Thr Val
1               5                   10                  15
Glu Ala Ile Ala Val Thr His His Arg Thr Pro His Pro Pro His Phe
            20                  25                  30
Pro Ser Leu Arg Phe Pro Leu Ser Leu Lys Ser Pro Pro Ala Thr Ser
        35                  40                  45
Leu Asn Leu Val Ala Gly Ser Lys Leu Leu His Phe Ser Arg Arg Leu
    50                  55                  60
Pro Ser Ile Lys Cys Ser Tyr Thr Pro Ser Leu Asp Leu Ser Glu Glu
65                  70                  75                  80
Gln Phe Thr Lys Phe Lys Lys Ala Ser Glu Lys Gly Asn Leu Val Pro
                85                  90                  95
Leu Phe Arg Cys Val Phe Ser Asp His Leu Thr Pro Ile Leu Ala Tyr
           100                  105                 110
Arg Cys Leu Val Lys Glu Asp Asp Arg Asp Ala Pro Ser Phe Leu Phe
        115                 120                 125
Glu Ser Val Glu Pro Gly Ser Gln Ser Ser Asn Ile Gly Arg Tyr Ser
    130                135                  140
Val Val Gly Ala Gln Pro Thr Ile Glu Ile Val Ala Lys Gly Asn Val
145                 150                 155                 160
Val Thr Val Met Asp His Gly Ala Ser Leu Arg Thr Glu Glu Glu Val
                165                 170                 175
Asp Asp Pro Met Met Val Pro Gln Lys Ile Met Glu Glu Trp Asn Pro
            180                 185                 190
Gln Gly Ile Asp Glu Leu Pro Glu Ala Phe Cys Gly Gly Trp Val Gly
        195                 200                  205
Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro
    210                 215                 220
Phe Ser Asn Ala Pro Glu Asp Asp Arg Ser Leu Pro Asp Val Asn Leu
225                 230                  235                240
Gly Leu Tyr Asp Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala
                245                 250                 255
Tyr Val Ile His Trp Val Arg Ile Asp Lys Asp Arg Ser Val Glu Glu
            260                 265                 270
Asn Phe Arg Glu Gly Met Asn Arg Leu Glu Ser Leu Thr Ser Arg Ile
        275                 280                 285
Gln Asp Gln Lys Pro Pro Lys Met Pro Thr Gly Phe Ile Lys Leu Arg
    290                 295                 300
Thr Gln Leu Phe Gly Pro Lys Leu Glu Lys Ser Thr Met Thr Ser Glu
305                 310                 315                 320
Ala Tyr Lys Glu Ala Val Val Glu Ala Lys Glu His Ile Leu Ala Gly
                325                 330                 335
Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe
            340                  345                350
Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser
        355                 360                 365
Pro Tyr Met Ala Tyr Leu Gln Val Arg Gly Cys Ile Leu Val Ala Ser
    370                 375                 380
Ser Pro Glu Ile Leu Leu Arg Ser Lys Asn Arg Lys Ile Thr Asn Arg
385                 390                 395                 400
Pro Leu Ala Gly Thr Val Arg Arg Gly Lys Thr Pro Lys Glu Asp Leu
                405                  410                415
Met Leu Glu Lys Glu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His
            420                 425                 430
Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys
        435                 440                 445
Pro Gly Ser Val Glu Val Lys Lys Leu Lys Asp Ile Glu Trp Phe Ser
    450                 455                 460
His Val Met His Ile Ser Ser Thr Val Val Gly Glu Leu Leu Asp His
465                 470                 475                 480
Leu Thr Ser Trp Asp Ala Leu Arg Ala Val Leu Pro Val Gly Thr Val
                485                 490                 495
Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu
            500                 505                 510
Val Thr Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe
        515                 520                 525
Asn Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro
    530                 535                 540
Thr Asn Thr Arg Tyr Asp Thr Leu Tyr Ser Tyr Lys His Pro Gln Arg
545                 550                 555                 560
Arg Arg Glu Trp Ile Ala His Ile Gln Ala Gly Ala Gly Ile Val Ala
                565                 570                 575
Asp Ser Asn Pro Asp Asp Glu His Arg Glu Cys Glu Asn Lys Ala Ala
            580                 585                 590
Ala Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ser Phe Leu Glu Ala
        595                 600                 605
Pro Glu Phe Thr Thr Ile Thr Pro His Ile Asn Asn Ile Met Ala Ala
    610                 615                 620
Ser Thr Leu Tyr Lys Ser Cys Leu Leu Gln Pro Lys Ser Gly Ser Thr
625                 630                 635                 640
Thr Arg Arg Leu Asn Pro Ser Leu Val Asn Pro Leu Thr Asn Pro Thr
                645                 650                  655
Arg Val Ser Val Leu Gly Lys Ser Arg Arg Asp Val Phe Ala Lys Ala
            660                 665                 670
Ser Ile Glu Met Ala Glu Ser Asn Ser Ile Pro Ser Val Val Val Asn
        675                 680                 685
Ser Ser Lys Gln His Gly Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser
    690                 695                 700
Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Leu Gly Cys His Phe
705                 710                 715                 720
Glu Val Tyr Arg Asn Asp Glu Leu Thr Val Glu Glu Leu Lys Lys Lys
                725                 730                 735
Asn Pro Arg Gly Val Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp
            740                 745                 750
Ser Gly Ile Ser Leu Gln Thr Val Leu Glu Leu Gly Pro Leu Val Pro
        755                 760                 765
Leu Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly
    770                 775                 780
Gly Lys Ile Val Arg Ser Pro Phe Gly Val Met His Gly Lys Ser Ser
785                 790                 795                 800
Met Val His Tyr Asp Glu Lys Gly Glu Glu Gly Leu Phe Ser Gly Leu
                805                 810                 815
Ser Asn Pro Phe Ile Val Gly Arg Tyr His Ser Leu Val Ile Glu Lys
            820                 825                 830
Asp Thr Phe Pro Ser Asp Glu Leu Glu Val Thr Ala Trp Thr Glu Asp
        835                 840                 845
Gly Leu Val Met Ala Ala Arg His Arg Lys Tyr Lys His Ile Gln Gly
    850                 855                 860
Val Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Lys Thr Ile
865                 870                 875                 880
Val Arg Asn Phe Ile Lys Ile Val Glu Lys Lys Glu Ser Glu Lys Leu
                885                 890                 895
Thr
<210>46
<211>252
<212>DNA
<213>人工序列
<220>
<223>截短的基因
<400>46
atgcaaacac aaaaaccgac tctcgaactg gaattcctgg tggaaaacgg tatcgccacc   60
gtgcaagcgg gtgctggtgt agtccttgat tctgttccgc agtcggaagc cgacgaaacc  120
cgtaacaaag cccgcgctgt actgcgcgct attgccaccg cgcatcatgc acaggagact  180
ttctgatggc tgacattctg ctgctcgata atatcgactc ttttacgtac aacctggcag  240
atcagttgcg ca                                                      252
<210>47
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>47
ttatgccgcc tgtcatcg                                              18
<210>48
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>48
ataggcttaa tggtaaccg                                             19
<210>49
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>49
ctgaacaaca gaagtacg                                              18
<210>50
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>50
taaccgtgtc atcgagcg                                              18
<210>51
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>51
aaaaagatct ccatggtaac gatcattcag g                               31
<210>52
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>52
aaaagaattc ttatcacgcg gccttggtct tcgcc                           35
<210>53
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>53
caaaagctgg atccccacc                                             19
<210>54
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>54
cctatccgag atctctcaac tcc                                        23
<210>55
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>55
catcccatgg atggtaacga tcattcagga t                               31
<210>56
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物.
<400>56
gatgtcraga gacactatag aatactcaag c                               31
<210>57
<211>719
<212>PRT
<213>血色红假单胞菌(Rhodopseudomonas palustris)
<400>57
Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr
1               5                   10                  15
Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly
            20                  25                  30
Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val
        35                  40                  45
Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp
    50                  55                   60
Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys
65                  70                  75                  80
Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe
                85                  90                  95
Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys
            100                 105                 110
Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp
        115                 120                 125
Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala
    130                 135                 140
Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln
                165                 170                 175
Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro
            180                 185                 190
Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile
        195                 200                  205
Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn
    210                 215                 220
Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala
225                 230                 235                 240
Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala
                245                 250                 255
Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe
            260                 265                 270
Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys
        275                 280                 285
Arg Ile Asn Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly
    290                 295                 300
Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly
305                 310                 315                 320
Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val
                325                  330                335
Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu
                340             345                 350
Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp
            355             360                 365
Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg
        370             375                 380
Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu
385                 390                 395                 400
Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His
                405                 410                 415
Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln
            420                 425                 430
Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala
        435                 440                 445
Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile
    450                 455                 460
Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala
465                 470                 475                 480
Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln
                485                 490                 495
Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys
            500                 505                 510
Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val
        515                 520                 525
Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr
    530                 535                 540
Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His  Gly
545                 550                 555                  560
Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro
                565                 570                 575
Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala
            580                 585                 590
Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln
        595                 600                 605
Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro
    610                 615                 620
Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met
625                 630                 635                 640
Arg Gly Leu Pro Asn Glu Val Thr Ile Gly Arg Tyr Hi s Ser Leu Tyr
                645                 650                  655
Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr
            660                 665                 670
Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly
        675                 680                 685
Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val
    690                 695                 700
Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala
705                 710                  715
<210>58
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>58
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Phe
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 15                  160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                  270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                  575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                  620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                  635                640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>59
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>59
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                      15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Tyr
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                  175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370             375                     380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385             390                     395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
            405                     410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
        420                     425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
    435                     440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>60
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>60
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Phe Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115             120                     125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130             135                     140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145             150                     155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
            165                     170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
           180                  185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                  415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645             650                     655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660             665                     670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
ThrArg Lys Ala Lys Thr Lys Ala Ala
               725
<210>61
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>61
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Cys Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                  620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser ILe Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>62
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>62
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Phe Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                  605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>63
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>63
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Ala Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Aa Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
   450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>64
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>64
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Gly Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405             410                     415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420             425                     430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435             440                     445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450             455                     460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465             470                     475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
            485                     490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
        500                     505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
    515                     520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
530                     535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>65
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>65
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Trp Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu Hi s Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val Hi s Leu
705                 710                 715                  720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>66
<211>604
<212>PRT
<213>人工序列
<220>
<223>玉米突变体.
<400>66
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala
1               5                   10                  l5
Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr
            20                  25                  30
Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala
        35                  40                  45
Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala
    50                  55                  60
Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala
65                  70                  75                  80
Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val
                85                  90                  95
Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu
            100                 105                 110
Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly
        115                 120                 125
Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His
    130                 135                 140
Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp
145                 150                 155                 160
His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln
                165                 170                 175
Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu
            180                 185                 190
Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp
        195                 200                 205
Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro
    210                 215                 220
Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp
225                 230                 235                 240
Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp
                245                 250                 255
Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly
            260                 265                 270
Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val
        275                 280                 285
Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly
    290                 295                 300
Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala
305                 310                 315                 320
Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile
                325                 330                 335
Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu
            340                 345                 350
Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Lys Ala Tyr
        355                 360                 365
Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu
    370                 375                 380
Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr
385                 390                 395                 400
Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln
                405                 410                 415
Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp
            420                 425                 430
Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys
        435                 440                 445
Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile
    450                 455                 460
Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp
465                 470                 475                 480
Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys
                485                 490                 495
Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly
            500                 505                 510
Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln
        515                 520                 525
Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His
    530                 535                 540
Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val
545                 550                 555                 560
Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp
                565                 570                 575
Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala
            580                 585                 590
Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu
        595                 600
<210>67
<211>1815
<212>DNA
<213>人工序列
<220>
<223>玉米突变体.
<400>67
atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg    60
cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga   l20
accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg   180
agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg   240
cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc   300
acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc   360
ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg   420
gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac   480
cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc   540
atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga   600
tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc   660
tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat   720
gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac   780
cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta   840
tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca   900
cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct   960
gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag  1020
aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg  1080
aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt  1140
cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact  1200
gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat  1260
gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag  1320
gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat  1380
gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat  1440
gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg  1500
gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga  1560
atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca  1620
gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc  1680
gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt  1740
gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt  1800
gtagacaaag aatag                                                   1815
<210>68
<211>2204
<212>DNA
<213>人工序列
<220>
<223>玉米突变体.
<400>68
atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg   60
cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga  120
accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg  180
agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg  240
cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc  300
acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc  360
ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg  420
gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac  480
cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc  540
atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga  600
tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc  660
tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat  720
gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac  780
cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta   840
tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca   900
cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct   960
gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag  1020
aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg  1080
aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt  1140
cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact  1200
gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat  1260
gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag  1320
gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat  1380
gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat  1440
gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg  1500
gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga  l560
atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca  1620
gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc  1680
gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt  1740
gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt  1800
gtagacaaag aatagtgtgc tatggttatc gtttagttct tgttcatgtt tcttttaccc  1860
actttccgtt aaaaaaagat gtcattagtg ggtggagaaa agcaataaga ctgttctcta  1920
gaattcgagc tcggtaccgg atccaattcc cgatcgttca aacatttggc aataaagttt  1980
cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta  2040
cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat  2100
gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa  2160
ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatc                   2204
<210>69
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400> 69
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Lys Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>70
<211>729
<212>PRT
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>70
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
1               5                   10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Ala Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435             440                     445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450             455                     460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                  480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
                500             505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
            515             520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>71
<211>264
<212>DNA
<213>人工序列
<220>
<223>CTP的序列.
<400>71
atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg    60
gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac   120
aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct   180
ccgattggaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt   240
ggtcgcgtca actgcatgca ggcc                                          264
<210>72
<211>88
<212>PRT
<213>人工序列
<220>
<223>CTP的序列.
<400>72
Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala
1               5                   10                  15
Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala
            20                  25                  30
Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser
        35                  40                  45
Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly
65                  70                  75                  80
Gly Arg Val Asn Cys Met Gln Ala
                85
<210>73
<211>264
<212>DNA
<213>人工序列
<220>
<223>CTP的序列.
<400>73
atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg   60
gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac  120
aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct  180
ccgattgaaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt  240
ggtcgcgtca actgcatgca ggcc                                         264
<210>74
<211>88
<212>PRT
<213>人工序列
<220>
<223>CTP的序列.
<400>74
Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala
1               5                   10                  15
Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala
            20                  25                  30
Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser
        35                  40                  45
Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Glu Lys
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly
65                  70                  75                  80
Gly Arg Val Asn Cys Met Gln Ala
                85
<210>75
<211>2190
<212>DNA
<213>人工序列
<220>
<223>优化的根瘤农杆菌(An optimized A.tumefaciens.)
<400>75
atggtgacca tcattcagga tgacggtgcc gagacctacg agaccaaggg cggcatccag   60
gtgagccgca agcgccgccc caccgattac gccaacgcca tcgataacta catcgaaaag  120
cttgattccc atcgcggtgc cgtgttctcc tccaactacg aatacccagg ccgctacacc  180
cgctgggata ccgccatcgt cgatccacca ctcggcattt cctgcttcgg ccgcaagatg  240
tggatcgaag cctacaacgg ccgcggcgaa gtgctgctcg atttcattac cgaaaagctg  300
aaggccacac ccgatctcac cctcggcgct tcctccaccc gccgcctcga tcttaccgtc  360
aacgaaccag accgcgtctt caccgaagaa gaacgctcca aaatcccaac cgtcttcacc    420
gctctcaggg ccatcgtcga cctcttctac tccagcgccg attccgccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcca tcaagctttc cctggcccgc    540
ccagaagacc agcgcgacat ggtgctgttc ctgcccgatg aaatcctcgt cgttgatcac    600
tactccgcca aggcctggat cgaccgctac gatttcgaga aggacggcat gaccaccgac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccacccaag    720
ggcgatcacc gccccggcga atactccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgctg cgaaagcaac    840
ccatccgcca tttcccgccg cctgaaggcc atcaacccat ccccctactc cttcttcatc    900
aacctcggcg atcaggaata cctggtcggc gcctccccag aaatgttcgt gcgcgtctcc    960
ggccgccgca tcgagacctg cccaatctca ggcaccatca agcgcggcga cgatccaatt   1020
gccgacagcg agcagatttt gaaactgctc aactccaaaa aggacgaatc cgaactgacc   1080
atgtgctccg acgtggaccg caacgacaag agccgcgtct gcgagccagg ttccgtgaag   1140
gtcattggcc gccgccagat cgagatgtac tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc ttcgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccacgcg cctggtacgg cggtgccatc ggcatggtcg gcttcaacgg cgacatgaac   1380
accggcctga ccctgcgcac catccgcatc aaggacggta ttgccgaagt gcgcgccggc   1440
gccaccctgc tcaacgattc caacccacag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tctcagccat tcgcgacgca aaaggcacca actctgccgc caccaagcgc   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacaccc tggccaacta cttccgccag accggcgcca ccgtctccac cgtcaggtca   1680
ccagtcgcag ccgacgtgtt cgatcgcttc cagccagacc tcgttgtcct gtcccccggt   1740
cccggcagcc caaccgattt cgactgcaag gcaaccatca aggccgcccg cgcccgcgat   1800
ctgccaatct tcggcgtttg cctcggtctg caggcattgg cagaagccta cggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttccc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcaccgtcg gtcgctacca ttccatcttc   1980
gccgatcccg ccaccctgcc acgcgatttc atcatcaccg cagaaagcga ggacggcacc   2040
atcatgggca tcgaacacgc caaggaacca gtggccgccg ttcagttcca cccagaatcc   2100
atcatgaccc tcggtcagga cgccggcatg cgcatgatcg agaacgtcgt ggtgcatctg   2160
acccgcaagg ccaagaccaa ggccgcctga                                    2190
<210>76
<211>2160
<212>DNA
<213>血色红假单胞菌(Rhodopseudomonas palustris)
<400>76
atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc    60
gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat   120
ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac   180
gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa   240
ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag   300
cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc   360
gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc   420
ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac   480
ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc   540
gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc   600
gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc   660
ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc   720
gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc   780
ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg   840
gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat   900
ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc   960
cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc  1020
gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg  1080
tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt  1140
ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag  1200
ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc  1260
accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc  1320
ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc  1380
ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc  1440
acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg  1500
gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac  1560
gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg  1620
ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc  1680
ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg  1740
ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc   1800
ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag   1860
ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg   1920
cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc   1980
gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc   2040
gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc   2100
ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa   2160
<210>77
<211>733
<212>PRT
<213>百脉根根瘤菌(Mesorhizobium loti)
<400>77
Met Glu Thr Ala Met Thr Met Lys Val Leu Glu Asn Gly Ala Glu Ser
1               5                   10                  15
Phe Val Thr Ala Gly Gly Ile Thr Ile Thr Arg Glu Arg His Asp Arg
            20                  25                  30
Pro Tyr Ala Gly Ala Ile Asp Ala Tyr Val Asp Gly Leu Asn Ser Arg
        35              40                      45
Arg Gly Ala Val Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr
    50              55                      60
Arg Trp Asp Thr Ala Ile Ile Asp Pro Pro Leu Val Ile Ser Ala Arg
65              70                      75                  80
Gly Arg Ala Met Arg Ile Glu Ala Leu Asn Arg Arg Gly Glu Ala Leu
            85                      90                  95
Leu Pro Val Ile Gly Lys Thr Leu Gly Gly Leu Ala Asp Ile Thr Ile
        100                     105                 110
Ala Glu Thr Thr Lys Thr Leu Ile Arg Leu Asp Val Ala Lys Pro Gly
    115                     120                 125
Arg Val Phe Thr Glu Glu Glu Arg Ser Arg Val Pro Ser Val Phe Thr
130                     135                 140
Val Leu Arg Ala Ile Thr Ala Leu Phe Lys Thr Asp Glu Asp Ala Asn
145                 150                 155                 160
Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ser Phe Gln Phe Asp
                165                170                  175
Pro Val Asp Tyr Lys Leu Glu Arg Lys Pro Ser Gln Arg Asp Leu Val
            180                 185                 190
Leu Phe Leu Pro Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys
        195                 200                 205
Ala Trp Thr Asp Arg Tyr Asp Tyr Ser Gly Glu Gly Phe Ser Thr Glu
    210                 215                 220
Gly Leu Pro Arg Asp Ala Ile Ala Glu Pro Phe Lys Thr Ala Asp Arg
225                 230                 235                 240
Ile Pro Pro Arg Gly Asp His Glu Pro Gly Glu Tyr Ala Asn Leu Val
                245                 250                 255
Arg Arg Ala Met Asp Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val
            260                 265                 270
Pro Gly Gln Met Phe Tyr Glu Arg Cys Glu Thr Gln Pro Ser Asp Ile
        275                 280                 285
Ser Arg Lys Leu Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile
    290                 295                 300
Asn Leu Gly Glu Asn Glu Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe
305                 310                 315                 320
Val Arg Val Asn Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr
                325                 330                 335
Ile Lys Arg Gly Asp Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys
            340                 345                 350
Leu Leu Asn Ser Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp
        355                 360                 365
Val Asp Arg Asn Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg
    370                 375                 380
Val Ile Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr
385                 390                 395                 400
Val Asp His Ile Glu Gly Arg Leu Arg Glu Gly Met Asp Ala Phe Asp
                405                 410                 415
Ala Phe Leu Ser His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys
            420                 425                 430
Leu Trp Ala Met Arg Phe Ile Glu Gln Asn Glu Lys Ser Pro Arg Ala
        435                 440                 445
Trp Tyr Gly Gly Ala Ile Gly Met Val Asn Phe Asn Gly Asp Met Asn
    450                 455                 460
Thr Gly Leu Thr Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu
465                 470                 475                 480
Val Arg Ala Gly Ala Thr Leu Leu Phe Asp Ser Ile Pro Glu Glu Glu
                485                 490                 495
Glu Ala Glu Thr Glu Leu Lys Ala Ser Ala Met Leu Ser Ala Ile Arg
            500                 505                 510
Asp Ala Lys Thr Gly Asn Ser Ala Ser Thr Glu Arg Thr Thr Ala Arg
        515                 520                  525
Val Gly Asp Gly Val Asn Ile Leu Leu Val Asp His Glu Asp Ser Phe
    530                 535                 540
Val His Thr Leu Ala Asn Tyr Phe Arg Gln Thr Gly Ala Asn Val Ser
545                 550                 555                 560
Thr Val Arg Thr Pro Val Pro Asp Glu Val Phe Glu Arg Leu Lys Pro
                565                 570                 575
Asp Leu Val Val Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp
            580                 585                 590
Cys Ala Ala Thr Ile Arg Arg Ala Arg Ala Arg Asp Leu Pro Ile Phe
        595                 600                  605
Gly Val Cys Leu Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu
    610                 615                 620
Leu Arg Gln Leu His Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg
625                 630                 635                 640
Val Ser Lys Pro Gly Ile Ile Phe Ser Gly Leu Pro Lys Glu Val Thr
                645                 650                 655
Val Gly Arg Tyr His Ser Ile Phe Ala Asp Pro Val Arg Leu Pro Asp
            660                 665                 670
Asp Phe Ile Val Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe
        675                 680                 685
Glu His Arg Lys Glu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser
    690                 695                 700
Ile Met Thr Leu Gly His Asn Ala Gly Met Arg Ile Ile Glu Asn Ile
705                 710                 715                 720
Val Ala His Leu Pro Arg Lys Ala Lys Glu Lys Ala Ala
                725                 730
<210>78
<211>732
<212>PRT
<213>巴西固氮螺菌(Azospirillum brasilense)
<400>78
Met Tyr Pro Ala Asp Leu Leu Ala Ser Pro Asp Leu Leu Glu Pro Leu
1               5                   10                  15
Arg Phe Gln Thr Arg Gly Gly Val Thr Val Thr Arg Arg Ala Thr Ala
            20                  25                  30
Leu Asp Pro Arg Thr Ala Leu Asp Pro Val Ile Asp Ala Leu Asp Arg
        35                  40                  45
Arg Arg Gly Leu Leu Leu Ser Ser Gly Val Glu Ala Pro Gly Arg Tyr
    50                  55                  60
Arg Arg His Ala Leu Gly Phe Thr Asp Pro Ala Val Ala Leu Thr Ala
65                  70                  75                  80
Arg Gly Arg Thr Leu Arg Ile Asp Ala Leu Asn Gly Arg Gly Gln Val
                85                  90                  95
Leu Leu Pro Ala Val Ala Glu Ala Leu Arg Gly Leu Glu Ala Leu Ala
            100                 105                 110
Gly Leu Glu Glu Ala Pro Ser Arg Val Thr Ala Ser Ser Ala Ser Pro
        115                 120                 125
Ala Pro Leu Pro Gly Glu Glu Arg Ser Arg Gln Pro Ser Val Phe Ser
    130                 135                 140
Val Leu Arg Ala Val Leu Asp Leu Phe Ala Ala Pro Asp Asp Pro Leu
145                 150                 155                 160
Leu Gly Leu Tyr Gly Ala Phe Ala Tyr Asp Leu Ala Phe Gln Phe Glu
                165                 170                 175
Pro Ile Arg Gln Arg Leu Glu Arg Pro Asp Asp Gln Arg Asp Leu Leu
            180                 185                 190
Leu Tyr Leu Pro Asp Arg Leu Val Ala Leu Asp Pro Ile Ala Gly Leu
        195                 200                 205
Ala Arg Leu Val Ala Tyr Glu Phe Ile Thr Ala Ala Gly Ser Thr Glu
    210                 215                 220
Gly Leu Glu Cys Gly Gly Arg Asp His Pro Tyr Arg Pro Asp Thr Asn
225                 230                 235                 240
Ala Glu Ala Gly Cys Asp His Ala Pro Gly Asp Tyr Gln Arg Val Val
                245                 250                 255
Glu Ser Ala Lys Ala Ala Phe Arg Arg Gly Asp Leu Phe Glu Val Val
            260                 265                 270
Pro Gly Gln Thr Phe Ala Glu Pro Cys Ala Asp Ala Pro Ser Ser Val
        275                 280                 285
Phe Arg Arg Leu Arg Ala Ala Asn Pro Ala Pro Tyr Glu Ala Phe Val
    290                 295                 300
Asn Leu Gly Arg Gly Glu Phe Leu Val Ala Ala Ser Pro Glu Met Tyr
305                 310                 315                 320
Val Arg Val Ala Gly Gly Arg Val Glu Thr Cys Pro Ile Ser Gly Thr
                325                 330                 335
Val Ala Arg Gly Ala Asp Ala Leu Gly Asp Ala Ala Gln Val Leu Arg
            340                 345                 350
Leu Leu Thr Ser Ala Lys Asp Ala Ala Glu Leu Thr Met Cys Thr Asp
        355                 360                 365
Val Asp Arg Asn Asp Lys Ala Arg Val Cys Glu Pro Gly Ser Val Arg
    370                 375                 380
Val Ile Gly Arg Arg Met Ile Glu Leu Tyr Ser Arg Leu Ile His Thr
385                 390                 395                 400
Val Asp His Val Glu Gly Arg Leu Arg Ser Gly Met Asp Ala Leu Asp
                405                 410                 415
Ala Phe Leu Thr His Ser Trp Ala Val Thr Val Thr Gly Ala Pro Lys
            420                 425                 430
Arg Trp Ala Met Gln Phe Leu Glu Asp Thr Glu Gln Ser Pro Arg Arg
        435                 440                 445
Trp Tyr Gly Gly Ala Phe Gly Arg Leu Gly Phe Asp Gly Gly Met Asp
    450                 455                 460
Thr Gly Leu Thr Leu Arg Thr Ile Arg Met Ala Glu Gly Val Ala Tyr
465                 470                 475                 480
Val Arg Ala Gly Ala Thr Leu Leu Ser Asp Ser Asp Pro Asp Ala Glu
                485                 490                 495
Asp Ala Glu Cys Arg Leu Lys Ala Ala Ala Phe Arg Asp Ala Ile Arg
            500                 505                 510
Gly Thr Ala Ala Gly Ala Ala Pro Thr Leu Pro Ala Ala Pro Arg Gly
        515                 520                 525
Gly Glu Gly Arg Arg Val Leu Leu Val Asp His Asp Asp Ser Phe Val
    530                 535                 540
His Thr Leu Ala Asp Tyr Leu Arg Gln Thr Gly Ala Ser Val Thr Thr
545                 550                 555                 560
Leu Arg His Ser His Ala Arg Ala Ala Leu Ala Glu Arg Arg Pro Asp
                565                 570                 575
Leu Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ala Asp Phe Asp Val
            580                 585                     590
Ala Gly Thr Ile Asp Ala Ala Leu Ala Leu Gly Leu Pro Val Phe Gly
        595                 600                      605
Val Cys Leu Gly Leu Gln Gly Met Val Glu Arg Phe Gly Gly Ala Leu
    610                 615                 620
Asp Val Leu Pro Glu Pro Val His Gly Lys Ala Thr Glu Val Arg Val
625                 630                 635                 640
Leu Gly Gly Ala Leu Phe Ala Gly Leu Pro Glu Arg Leu Thr Val Gly
                645             650                     655
Arg Tyr His Ser Leu Val Ala Arg Arg Asp Arg Leu Pro Ala Asp Leu
            660             665                     670
Thr Val Thr Ala Glu Thr Ala Asp Gly Leu Val Met Ala Val Glu His
        675             680                     685
Arg Arg Leu Pro Leu Ala Ala Val Gln Phe His Pro Glu Ser Ile Leu
    690             695                     700
Ser Leu Asp Gly Gly Ala Gly Leu Ala Leu Leu Gly Asn Val Met Asp
705             710                     715                 720
Arg Leu Ala Ala Gly Ala Leu Thr Asp Ala Ala Ala
            725                     730
<210>79
<211>731
<212>PRT
<213>马尔他布鲁氏菌(Brucella melitensis)
<400>79
Met Asn Ala Lys Thr Ala Asp Ser Glu Ile Phe Gln His Glu Thr Ala
1               5                   10                  15
Gly Gly Ile Ile Val Glu Arg Val Arg His Leu Thr Ala Tyr Lys Gly
            20                  25                  30
Ala Ile Glu Ser Tyr Ile Asp Val Leu Asn Glu Trp Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Val Val Ile Thr Ser Arg Ala Arg Thr Met
65                  70                  75                  80
Arg Ile Glu Ala Leu Asn Ala Arg Gly Val Ile Leu Leu Arg Pro Ile
                85                  90                  95
Leu Asp Thr Val Lys Ala Leu Ser Glu Val Lys Ile Asp Gln Ser Gly
            100             105                     110
Glu Asn Arg Ile Asp Leu Thr Ile Val Glu Pro Val Gly Thr Phe Thr
        115             120                     125
Glu Glu Glu Arg Ser Arg Met Pro Ser Val Phe Thr Val Leu Arg Ala
    130                 135                 140
Ile Val Gly Leu Phe Phe Ser Glu Glu Asp Ala Asn Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Pro Ile Gln Tyr
                165                 170                 175
Lys Leu Lys Arg Pro Asp Asp Gln Arg Asp Leu Val Leu Phe Ile Pro
            180                 185                 190
Asp Glu Ile Phe Val Ala Asp His Tyr Ala Ala Arg Ala Trp Val Asp
        195                 200                 205
Arg Tyr Glu Phe Arg Cys Gly Gly Ser Ser Thr His Gly Leu Asp Arg
    210                 215                 220
Ala Thr Pro Val Val Pro Phe Lys Pro Ser Glu Arg Lys Leu Ala Arg
225                 230                 235                 240
Gly Asp His Asn Pro Gly Glu Tyr Ala Arg Leu Val Glu Arg Ala Lys
                245                 250                 255
Glu Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Thr
            260                 265                 270
Phe Tyr Glu Arg Cys His Thr Ala Pro Ser Glu Ile Phe Arg Arg Leu
        275                 280                 285
Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Glu
    290                 295                 300
Ser Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Asn
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Glu Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Gly Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Leu Glu Glu Asn Glu Arg Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Met His Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Val Ala Glu Ile Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Phe Asp Ser Asn Pro Asp Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Val Arg Asp Ala Gln Lys
            500                 505                 510
Ser Asn Gln Ile Ala Glu Glu Ser Val Ala Ala Lys Val Gly Glu Gly
        515                 520                 525
Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Lys Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Glu Glu Ile Phe Asp Arg Val Asn Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Gln Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Asp Lys Ala Arg Lys Arg Gln Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Ala Leu Arg Gln Leu
    610                 615                 620
Arg Val Pro Val His Gly Lys Pro Ser Arg Ile Arg Val Ser Lys Pro
625                 630             635                     640
Glu Arg Ile Phe Ser Gly Leu Pro Glu Glu Val Thr Val Gly Arg Tyr
                645             650                     655
His Ser Ile Phe Ala Asp Pro Glu Arg Leu Pro Asp Asp Phe Leu Val
            660             665                     670
Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe Glu His Lys His
        675             680                     685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690             695                     700
Gly His Asn Ala Gly Met Arg Met Ile Glu Asn Ile Val Thr His Leu
705             710                     715                 720
Ala Gly Lys His Lys Ala Arg Arg Thr Asn Tyr
            725                     730
<210>80
<211>735
<212>PRT
<213>念珠藻属(Nostoc sp.)
<400>80
Met Ile Ala Asp Ser His Ser Tyr Arg Thr Asn Gly Asn Val Arg Val
1               5                   10                  15
Ser Arg Ser Ile Thr Gln Val Lys Met Glu Thr Ala Leu Glu Glu Ile
            20                  25                  30
Leu Phe Tyr Leu Asn Ser Gln Arg Gly Gly Leu Leu Thr Ser Ser Tyr
        35                  40                  45
Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe Val Asn Pro
    50                  55                  60
Pro Val Glu Leu Ser Thr Ser Gly Asn Thr Phe Thr Leu Thr Ala Leu
65                  70                  75                  80
Asn Glu Arg Gly Tyr Val Leu Leu Pro Val Ile Phe Glu Cys Leu Ser
                85                  90                  95
Lys Ser Glu Gln Leu Gln Lys Leu Thr Glu His His His Lys Ile Thr
            100                 105                 110
Gly Leu Val Lys Ser Thr Pro Glu Phe Phe Ala Glu Glu Glu Arg Ser
        115                 120                 125
Lys Gln Pro Ser Thr Phe Thr Val Ile Arg Glu Ile Leu His Ile Phe
    130                 135                 140
Ser Ser Gln Glu Asp Glu His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr
145                 150                 155                 160
Asp Leu Val Phe Gln Phe Glu Gln Ile Thr Gln Cys Leu Glu Arg Pro
                165                 170                 175
Gln Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu Leu Ile Val
            180                 185                 190
Val Asp Tyr Tyr Gln Gln Gln Ala Phe Arg Leu Glu Tyr Asp Phe Ile
        195                 200                 205
Thr Ala His Gly Ser Thr Tyr Asp Leu Pro Arg Thr Gly Glu Ser Val
    210                 215                 220
Asp Tyr Arg Gly Gln Cys Leu Thr Pro Pro Gln Asn Ala Asp His Lys
225                 230                 235                 240
Ile Gly Glu Tyr Ala Lys Leu Val Glu Phe Ala Leu Asp Tyr Phe Arg
                245                 250                 255
Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe Phe Thr Ala
            260                 265                 270
Cys Glu Ala Pro Pro Ser G1n Leu Phe Glu Thr Leu Lys Gln Ile Asn
        275                 280                 285
Pro Ser Pro Tyr Gly Phe Ile Phe Asn Leu Gly Gly Glu Tyr Ile Ile
    290                 295                 300
Gly Ala Ser Pro Glu Met Phe Val Arg Val Glu Gly Arg Arg Val Glu
305                 310                 315                 320
Thr Cys Pro Ile Ser Gly Thr Ile Thr Arg Gly His Asp Ala Ile Asp
                325                 330                 335
Asp Ala Val Gln Ile Arg Gln Leu Leu Asn Ser His Lys Asp Glu Ala
            340                 345                 350
Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys Ser Arg Ile
        355                 360                 365
Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg Arg Gln Ile Glu Leu
    370                 375                 380
Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly Ile Leu Arg
385                 390                 395                 400
Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr Trp Ala Val
                405                 410                 415
Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Ile Gln Phe Ile Glu Lys
            420                 425                 430
Asn Glu Arg Ser Val Arg Arg Trp Tyr Gly Gly Ala Val Gly Tyr Leu
        435                 440                 445
Asn Phe Asn Gly Asn Leu Asn Thr Gly Leu Ile Leu Arg Thr Ile Arg
    450                 455                 460
Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr Leu Leu Tyr
465                 470                 475                 480
Asp Ser Ile Pro Gln Ala Glu Glu Gln Glu Thr Ile Thr Lys Ala Ala
                485                 490                 495
Ala Ala Phe Glu Thr Ile Arg Arg Ala Lys Gln Ile Asp Pro Gln Ile
            500                 505                 510
Glu Glu Ser Ser Thr Arg Lys Leu Ser Lys Tyr Leu Pro Asp Gly Gln
        515                 520                 525
Ser Gly Lys His Ile Leu Leu Ile Asp His Glu Asp Ser Phe Val His
    530                 535                 540
Thr Leu Ala Asn Tyr Ile Arg Ser Thr Gly Ala Thr Val Thr Thr Leu
545                 550                 555                 560
Arg His Gly Phe Ser Glu Ser Leu Phe Asp Thr Glu Arg Pro Asp Leu
                565                 570                 575
Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ser Glu Phe Lys Val Gln
            580                 585                 590
Glu Thr Val Ala Ala Cys Val Arg Arg Gln Ile Pro Leu Phe Gly Val
        595                 600                 605
Cys Leu Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly
    610                 615                 620
Val Leu Asn Tyr Pro Gln His Gly Lys Ser Ser Arg Ile Phe Val Thr
625                 630                 635                 640
Ala Pro Asp Ser Val Met Phe Gln Asp Leu Pro Glu Ser Phe Thr Val
                645                 650                655
Gly Arg Tyr His Ser Leu Phe Ala Leu Ser Gln Arg Leu Pro Lys Glu
            660                 665                 670
Leu Lys Val Thr Ala Ile Ser Asp Asp Glu Val Ile Met Ala Ile Glu
        675                 680                 685
His Gln Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile
    690                 695                 700
Met Thr Leu Ala Gly Glu Val Gly Leu Met Met Ile Lys Asn Val Val
705                 710                 715                 720
Gln Lys Tyr Thr Gln Ser Gln Gln Ser Thr Val Pro Ile Tyr Asp
                725                 730                 735
<210>81
<211>715
<212>PRT
<213>念珠藻属(Nostoc sp.)
<400>81
Met Arg Val Ser Arg Ser Thr Thr Glu Val Lys Met Asp Thr Ala Leu
1               5                   10                  15
Asp Glu Ile Leu Phe His Leu Asn Gln Val Arg Gly Gly Leu Leu Thr
            20                  25                  30
Ser Ser Tyr Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe
        35                  40                  45
Ile Asn Pro Pro Leu Gln Leu Thr Thr Arg Glu Asn Ala Phe Thr Ile
    50                  55                  60
Ser Ser Leu Asn Pro Arg Gly Gln Val Leu Leu Pro Thr Leu Phe Gln
65                  70                  75                  80
His Leu Ser Ala Gln Ser Gln Leu Gln Gln Ile Ser Leu Asn His Asp
                85                  90                  95
Tyr Ile Thr Gly Glu Ile Arg Pro Thr Lys Gln Leu Phe Thr Glu Glu
            100                 105                 110
Gln Arg Ser Lys Gln Pro Ser Ala Phe Thr Val Ile Arg Glu Ile Leu
        115                 120                 125
Gln Ile Phe Ala Ser Asp Glu Asp Glu His Leu Gly Leu Tyr Gly Ala
    130                 135                 140
Phe Gly Tyr Asp Leu Val Phe Gln Phe Glu Pro Ile Pro Gln Lys Ile
145                 150                 155                 160
Ala Arg Pro Ala Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu
                165                 170                 175
Leu Ile Val Val Asp Tyr Tyr Leu Gln Lys Ala Tyr Arg His Gln Tyr
            180                 185                 190
Glu Phe Ala Thr Glu His Gly Asn Thr Glu His Leu Pro Arg Thr Gly
        195                 200                 205
Gln Ser Ile Asp Tyr Gln Gly Lys His Leu Leu Pro Asn Gln Thr Ala
    210                 215                 220
Asp His Gln Pro Gly Glu Tyr Ala Asn Leu Val Glu Gln Ala Leu Asp
225                 230                 235                 240
Tyr Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe
                245                 250                 255
Phe Thr Ala Cys Glu Gln Ser Pro Ser Gln Leu Phe Gln Thr Leu Arg
            260                 265                 270
Gln Ile Asn Pro Ser Pro Tyr Gly Phe Leu Leu Asn Leu Gly Gly Glu
        275                 280                 285
Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Asp Gly Arg
    290                 295                 300
Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Arg Arg Gly Glu Asp
305                 310                 315                 320
Ala Leu Gly Asp Ala Val Gln Ile Arg Gln Leu Leu Ash Ser His Lys
                325                 330                 335
Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys
            340                 345                 350
Ser Arg Ile Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg Arg Gln
        355                 360                 365
Ile Glu Leu Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly
    370                 375                 380
Ile Leu Arg Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr
385                 390                 395                 400
Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met Gln Phe
                405                 410                 415
Ile Glu Gln His Glu Arg Ser Ala Arg Arg Trp Tyr Gly Gly Ala Val
            420                 425                 430
Gly Tyr Leu Gly Phe Asn Gly Asn Leu Asn Thr Gly Leu Thr Leu Arg
        435                 440                 445
Thr Ile Arg Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr
    450                 455                 460
Val Leu Tyr Asp Ser Ile Pro Ser Ala Glu Glu Glu Glu Thr Ile Thr
465                 470                 475                 480
Lys Ala Thr Ala Leu Phe Glu Thr Ile Arg Arg His Thr Thr Ala Asn
                485                 490                 495
Lys Thr Gln Gly Asn Asp Ser His Arg Pro Gly Asp Ile Ala His Asn
            500                 505                 510
Lys Arg Ile Leu Leu Ile Asp Tyr Glu Asp Ser Phe Val His Thr Leu
        515                 520                 525
Ala Asn Tyr Ile Arg Thr Thr Gly Ala Thr Val Thr Thr Leu Arg His
    530                 535                 540
Gly Phe Ala Glu Ser Tyr Phe Asp Ala Glu Arg Pro Asp Leu Val Val
545                 550                 555                 560
Leu Ser Pro Gly Pro Gly Arg Pro Ser Asp Phe Arg Val Pro Gln Thr
                565                 570                 575
Val Ala Ala Leu Val Gly Arg Glu Ile Pro Ile Phe Gly Val Cys Leu
            580                 585                 590
Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly Val Leu
        595                 600                 605
Asp Tyr Pro Gln His Gly Lys Pro Ala Arg Ile Ser Val Thr Ala Pro
    610                 615                 620
Asp Ser Val Leu Phe Gln Asn Leu Pro Ala Ser Phe Ile Val Gly Arg
625                 630                 635                 640
Tyr His Ser Leu Phe Ala Gln Pro Gln Thr Ile Pro Gly Glu Leu Lys
                645                 650                 655
Val Thr Ala Ile Ser Glu Asp Asn Val Ile Met Ala Ile Glu His Gln
            660                 665                 670
Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr
        675                 680                 685
Leu Ala Gly Glu Val Gly Gln Thr Ile Ile Lys Asn Val Val Gln Thr
    690                 695                 700
Tyr Thr Gln Thr Leu Glu Thr Ser Ile Tyr Ser
705                 710                 715
<210>82
<211>719
<212>PRT
<213>血色红假单胞菌(Rhodopseudomonas palustris)
<400>82
Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr
1               5                   10                  15
Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly
            20                  25                  30
Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val
        35                  40                  45
Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp
    50                  55                  60
Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys
65                  70                  75                  80
Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe
                85                  90                  95
Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys
            100                 105                 110
Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp
        115                 120                 125
Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala
    130                 135                 140
Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln
                165                 170                 175
Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro
            180                 185                 190
Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile
        195                 200                 205
Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn
    210                 215                 220
Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala
225                 230                 235                 240
Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala
                245                 250                 255
Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe
            260                 265                 270
Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys
        275                 280                 285
Arg Ile Ash Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly
    290                 295                 300
Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly
305                 310                 315                 320
Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val
                325                 330                 335
Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu
            340                 345                 350
Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp
        355                 360                 365
Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg
    370                 375                 380
Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu
385                 390                 395                 400
Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His
                405                 410                 415
Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln
            420                 425                 430
Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala
        435                 440                 445
Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile
    450                 455                 460
Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala
465                 470                 475                 480
Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln
                485                 490                 495
Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys
            500                 505                 510
Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val
        515                 520                 525
Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr
    530                 535                 540
Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly
545                 550                 555                 560
Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro
                565                 570                 575
Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala
            580                 585                 590
Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln
        595                 600                 605
Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro
    610                 615                 620
Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met
625                 630                 635                 640
Arg Gly Leu Pro Ash Glu Val Thr Ile Gly Arg Tyr His Ser Leu Tyr
                645                 650                 655
Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr
            660                 665                 670
Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly
        675                 680                 685
Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val
    690                 695                 700
Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala
705                 710                 715
<210>83
<211>2160
<212>DNA
<213>血色红假单胞菌(Rhodopseudomonas palustris)
<400>83
atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc     60
gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat    120
ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac    180
gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa    240
ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag    300
cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc    360
gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc    420
ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac    480
ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc    540
gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc    600
gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc    660
ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc    720
gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc    780
ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg    840
gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat    900
ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc    960
cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc   1020
gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg   1080
tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt   1140
ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag   1200
ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc   1260
accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc   1320
ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc   1380
ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc   1440
acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg   1500
gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac   1560
gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg   1620
ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc   1680
ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg   1740
ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc   1800
ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag   1860
ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg   1920
cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc   1980
gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc   2040
gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc   2100
ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa   2160
<210>84
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>84
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc gtttttttcg tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>85
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>85
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc gtatttttcg tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>86
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>86
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg ttcaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>87
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>87
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg tgcaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>88
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>88
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg tccttctatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>89
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>89
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacgcgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>90
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>90
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacgggt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>91
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>91
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc ctggttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>92
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>92
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggtttttaag tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>93
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根瘤农杆菌突变体.
<400>93
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cgccttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat   1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc   1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt   1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca   1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga   1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat   1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc   1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg   2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg   2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg   2160
acccgcaagg cgaagaccaa ggccgcgtga                                    2190
<210>94
<211>1821
<212>DNA
<213>稻(0ryza sativa)
<400>94
atggagtcca tcgccgccgc cacgttcacg ccctcgcgcc tcgccgcccg ccccgccact     60
ccggcggcgg cggcggcccc ggttagagcg agggcggcgg tagcggcagg agggaggagg    120
aggacgagta ggcgcggcgg cgtgaggtgc tccgcgggga agccagaggc aagcgcggtg    180
atcaacggga gcgcggcggc gcgggcggcg gaggaggaca ggaggcgctt cttcgaggcg    240
gcggagcgtg ggagcgggaa gggcaacctg gtgcccatgt gggagtgcat cgtctccgac    300
cacctcaccc ccgtgctcgc ctaccgctgc ctcgtccccg aggacaacat ggagacgccc    360
agcttcctct tcgagtccgt cgagcagggg cccgagggca ccaccaacgt cggtcgctat    420
agcatggtgg gagcccaccc agtgatggag gtcgtggcaa aggagcacaa ggtcacaatc    480
atggaccacg agaagggcaa ggtgacggag caggtcgtgg atgatcctat gcagatcccc    540
aggagcatga tggaaggatg gcacccgcag cagatcgatc agctccccga ttccttcacc    600
ggtggatggg tcgggttctt ttcctatgat acagtccgtt atgttgaaaa gaagaagctg    660
cccttctccg gtgctcccca ggacgatagg aaccttcctg atgttcacct tgggctttat    720
gatgatgttc tcgtcttcga caatgtcgag aagaaagtat atgtcatcca ttgggtaaat    780
cttgatcggc atgcaaccac cgaggatgca ttccaagatg gcaagtcccg gctgaacctg    840
ttgctatcta aagtgcacaa ttcaaatgta cccaagcttt ctccaggatt tgtaaagtta    900
cacactcggc agtttggtac acctttgaac aaatcaacca tgacaagtga tgagtacaag    960
aatgctgtta tgcaggctaa ggagcatatt atggctggtg atattttcca gattgtttta   1020
agccagaggt ttgagaggca gacatacgcc aatccatttg aagtctatcg agctttacga   1080
attgtgaacc caagtccata catggcatat gtacaggcaa gaggctgtgt cctggtagca   1140
tctagtccag aaattcttac tcgtgtgagg aagggtaaaa ttattaaccg tccacttgct   1200
gggactgttc gaaggggcaa gacagagaag gaagatgaaa tgcaagagca acaactacta   1260
agtgatgaaa aacagtgtgc tgaacatatt atgcttgtag atttgggaag gaatgatgtt   1320
ggaaaggtct ccaaacctgg atctgtgaag gtggagaaat taatgaacat tgaacgctac   1380
tcccatgtca tgcacatcag ttccacggtg agtggagagt tggatgatca tctccaaagt   1440
tgggatgccc tgcgagccgc gttgcctgtt ggaacagtta gtggagcacc aaaggtgaaa   1500
gccatggagc tgatagacga gctagaggtc acaagacgag gaccatacag tggcggcctt   1560
ggagggatat catttgacgg ggacatgctt atcgctcttg cactccgcac cattgtgttc   1620
tcaacagcgc caagccacaa cacgatgtac tcatacaaag acaccgagag gcgccgggag   1680
tgggtcgctc accttcaggc tggtgctggc attgtcgctg atagcagccc agacgacgag   1740
caacgtgaat gcgagaacaa ggcagccgct ctggctcgag ccatcgatct tgctgaatca   1800
gctttcgtag acaaggaata g                                             1821
<210>95
<211>1498
<212>DNA
<213>稻(Oryza sativa)
<400>95
gaattcaaat tttttatata gagtatttct atacatgaat ttttctaact ttttgttttt     60
taaaaaaaat ttgtgtggtg tactgtaata ggaagagaag aaggggagga ggaaggaggg    120
agaagaggga ggagtatatg gggagggggg gatgaactga tcgcccagcg tgatagctgg    180
cgatcgagca cccattagaa gggcccaata aaccctggat aattgtcatt gagtggcacc    240
tttcattgag aagacgttat taggaattgt agaagtggat aattatgcta tctgttgtat    300
tgagtgtcac tgtcaccgat aaagctttgc tggttaatgc attgtatttc tccatcaacg    360
cttcatgata caatggtatt tggacgtgtt tataaaataa tatacgtata atgtgggtgg    420
cctagcggcg gccggttaca catagcagcg atcggtccga tgctagtctt cattcattca    480
ggtatgtatt caggtatcag tgtgtgggtg atagtttttt tttttcgttt ttctagttac    540
gatatctcat atctcatagt tgtgatctta taaacttttt catgtttatc aatataaatt    600
tcgtgttatc tagtcgttaa aagaaccgta taatgtggca aaaaaaatgt ataatgtgtc    660
agagtttgca cgtgtttatc ttgctgcccc gaaacgatta attcagtgat ttggcaacaa    720
caaaatgtcg tggcggataa gcatatccgt cccaaaagga aaaaaagaaa aggaaaaata    780
atctttagaa ataaagccct tactttttcc aagaagcaga ggtaaccgta gctggtattc    840
cgcggctaac tcaatccctt tctctggagt cttggagcgg cacggcggct gcgcacccga    900
cctcgcccac cacctgctcg gcgaaacgcc cggctcggcc gcgacgtgtc ccaccgcacc    960
gcgcgcgcac ccgcgcgccc cgagcccctc gccgcctccg cgcgggcgcc gcacctattt   1020
aaatgcggcc ccgatcccgc attctctcaa ctgcactagt ccccaccaac ggctcggtcc   1080
agtagagttt atcccccacc tatggccagc ctcgtgctct ccctgcgcat cgcccgttcc   1140
acgccgccgc tggggctggg cggggggcga ttccgcggcc gacgaggggc cgtcgcctgc   1200
cgcgccgcca cgttccagca gctcgacgcc gtcggtgagt ctccgtatca aatgtggggg   1260
ggcatgtctt ggtttgcgga ttggtgggtt gatttgaatg tgtgttctcg tggccgcagc   1320
ggtgagggag gaggagtcca agttcaaggc gggggcggcg gagggttgca acatcctgcc   1380
gctcaagcga tgcatcttct ccgaccacct cacgccggtg ctcgcgtacc gctgcctcgt   1440
cagggaggac gaccgcgagg cgcccagctt cctgtttgag tccgtcgagc agggatcc     1498
<210>96
<211>2073
<212>DNA
<213>玉米(Zea mays)
<400>96
gaattccgcc aaatcgggct atagatcaaa cgctgcactg tagggagcgt gaagccagcg     60
gcgaatggaa tccctagccg ccacctccgt gttcgcgccc tcccgcgtcg ccgtcccggc    120
ggcgcgggcc ctggttaggg cggggacggt ggtaccaacc aggcggacga gcagccggag    180
cggaaccagc ggggtgaaat gctctgctgc cgtgacgccg caggcgagcc cagtgattag    240
caggagcgct gcggcggcga aggcggcgga ggaggacaag aggcggttct tcgaggcggc    300
ggcgcggggg agcgggaagg ggaacctggt gcccatgtgg gagtgcatca aggggaacct    360
ggtgcccatg tgggagtgca tcgtgtcgga ccatctcacc cccgtgctcg cctaccgctg    420
cctcgtcccc gaggacaacg tcgacgcccc cagcttcctc ttcgagtccg tcgagcaggg    480
gccccagggc accaccaacg tcggccgcta tagcatggtg ggagcccacc cagtgatgga    540
gattgtggcc aaagaccaca aggttacgat catggaccac gagaagagcc aagtgacaga    600
gcaggtagtg gacgacccga tgcagatccc gaggaccatg atggagggat ggcacccaca    660
gcagatcgac gagctccctg aatccttctc cggtggatgg gttgggttct tttcctatga    720
tacggttagg tatgttgaga agaagaagct accgttctcc agtgctcctc aggacgatag    780
gaaccttcct gatgtgcact tgggactcta tgatgatgtt ctagtcttcg ataatgttga    840
gaagaaagta tatgttatcc attgggtcaa tgtggaccgg catgcatctg ttgaggaagc    900
ataccaagat ggcaggtccc gactaaacat gttgctatct aaagtgcaca attccaatgt    960
ccccacactc tctcctggat ttgtgaagct gcacacacgc aagtttggta cacctttgaa   1020
caagtcgacc atgacaagtg atgagtataa gaatgctgtt ctgcaggcta aggaacatat   1080
tatggctggg gatatcttcc agattgtttt aagccagagg ttcgagagac gaacatatgc   1140
caacccattt gaggtttatc gagcattacg gattgtgaat cctagcccat acatggcgta   1200
tgtacaggca agaggctgtg tattggttgc gtctagtcct gaaattctta cacgagtcag   1260
taaggggaag attattaatc gaccacttgc tggaactgtt cgaaggggca agacagagaa   1320
ggaagatcaa atgcaagagc agcaactgtt aagtgatgaa aaacagtgtg ccgagcacat   1380
aatgcttgtg gacttgggaa ggaatgatgt tggcaaggta tccaaaccag gaggatcagt   1440
gaaggtggag aagttgatta ttgagagata ctcccatgtt atgcacataa gctcaacggt   1500
tagtggacag ttggatgatc atctccagag ttgggatgcc ttgagagctg ccttgcccgt   1560
tggaacagtc agtggtgcac caaaggtgaa ggccatggag ttgattgata agttggaagt   1620
tacgaggcga ggaccatata gtggtggtct aggaggaata tcgtttgatg gtgacatgca   1680
aattgcactt tctctccgca ccatcgtatt ctcaacagcg ccgagccaca acacgatgta   1740
ctcatacaaa gacgcagata ggcgtcggga gtgggtcgct catcttcagg ctggtgcagg   1800
cattgttgcc gacagtagcc cagatgacga acaacgtgaa tgcgagaata aggctgctgc   1860
actagctcgg gccatcgatc ttgcagagtc agcttttgtg aacaaagaat agtgtgctat   1920
ggttatcgtt tagttcttgt tcatgtttct tttacccact ttccgttaaa aaaagatgtc   1980
attagtgggt ggagaaaagc aataagactg ttctctagag aaccgaagaa atatggaaat   2040
tgaggttatg gccggaattc ctgcagcccg ggg                                2073
<210>97
<211>504
<212>DNA
<213>小麦(Triticum aestivum)
<400>97
cccaaacagt ggtggcttag gagggatatc atttgatggt gacatgctta tcgctcttgc     60
tctccgcacc attgtgtttt caacagctcc aagccccaat aggatgtact catacaaaag    120
ctcagatagg ccccgagagt gggttgctca tcttcaggct ggtgcgggca ttgttgctga    180
tagtatccca gacgatgagc aaaaagaatt tgagaataag gcggctgccc tagctcgggc    240
aattgatctt gcagagtcgg cttttttaga caaagaatag agtgtctatt aaattatttt    300
ttttagttgt tcatcatttt tcacccagtt cattttggaa agttgttcat cgttttttca    360
ccgagttcat attggggaaa aaaagcaata ccgttttgtt gtcctttgaa atgaataaat    420
ttgagctata ataagatgta ttttgctcat cgggcaaaaa aaaaaaaaaa aatataaaaa    480
aaaaaaaaaa aaaaaaaaaa aata                                           504
<210>98
<211>2161
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>98
gtcaaaaatc cccatttcac cgtttcctcg tttctcctcc tcactaattt tgtctctttc     60
tcttggtttg ctattgtgct cttgtaggaa tgcagtcgtt acctatctca taccggttgt    120
ttccggccac ccaccggaaa gttctgccat tcgccgtcat ttctagccgg agctcaactt    180
ctgcacttgc gcttcgtgtc cgtacactac aatgccgctg ccttcactct tcatctctag    240
ttatggatga ggacaggttc attgaagctt ctaaaagcgg gaacttgatt ccgctgcaca    300
aaaccatttt ttctgatcat ctgactccgg tgctggctta ccggtgtttg gtgaaagaag    360
acgaccgtga agctccaagc tttctctttg aatccgttga acctggtttt cgaggttcta    420
gtgttggtcg ctacagcgtg gtgggggctc aaccatctat ggaaattgtg gctaaggaac    480
acaatgtgac tatattggac caccacactg gaaaattgac ccagaagact gtccaagatc    540
ccatgacgat tccgaggagt atttctgagg gatggaagcc cagactcatt gatgaacttc    600
ctgatacctt ttgtggtgga tgggttggtt atttctcata tgacacagtt cggtatgtag    660
agaacaggaa gttgccattc ctaagggctc cagaggatga ccggaacctt gcagatattc    720
aattaggact atacgaagat gtcattgtgt ttgatcatgt tgagaagaaa gcacatgtga    780
ttcactgggt gcagttggat cagtattcat ctcttcctga ggcatatctt gatgggaaga    840
aacgcttgga aatattagtg tctagagtac aaggaattga gtctccaagg ttatctcccg    900
gttctgtgga tttctgtact catgcttttg gaccttcatt aaccaaggga aacatgacaa    960
gtgaggagta caagaatgct gtcttacaag caaaggagca cattgctgca ggagacatat   1020
ttcaaatcgt tttaagtcaa cgctttgaga gaagaacatt tgctgaccca tttgaagtgt   1080
acagagcatt aagaattgtg aatccaagcc catatatgac ttacatacaa gccagaggct   1140
gtattttagt tgcatcgagc ccagaaattt tgacacgtgt gaagaagaga agaattgtta   1200
atcgaccact ggctgggaca agcagaagag ggaagacacc tgatgaggat gtgatgttgg   1260
aaatgcagat gttaaaagat gagaaacaac gcgcagagca catcatgctg gttgatttag   1320
gacgaaatga tgtaggaaag gtgtcaaaac ctggttctgt gaatgtcgaa aagctcatga   1380
gcgttgagcg gtattcccat gtgatgcaca taagctccac ggtctctgga gagttgcttg   1440
atcatttaac ctgttgggat gcactacgtg ctgcattgcc tgttgggacc gtcagtggag   1500
caccaaaggt aaaggccatg gagttgattg atcagctaga agtagctcgg agagggcctt   1560
acagtggtgg gtttggaggc atttcctttt caggtgacat ggacatcgca ctagctctaa   1620
ggacgatggt attcctcaat ggagctcgtt atgacacaat gtattcatat acagatgcca   1680
gcaagcgtca ggaatgggtt gctcatctcc aatccggggc tggaattgtg gctgatagta   1740
atcctgatga ggaacagata gaatgcgaga ataaagtagc cggtctgtgc cgagccattg   1800
acttggccga gtcagctttt gtaaagggaa gacacaaacc gtcagtcaag ataaatggtt   1860
ctgtgccaaa tctattttca agggtacaac gtcaaacatc tgttatgtcg aaggacagag   1920
tacatgagaa aagaaactag cgaatatgaa gatgtacata aattctaaag tggttttctt   1980
gttcagttta atcttttact ggattgagac tgtagttgct gaagatagtt gtttagaatg   2040
accttcattt tggtgttcct gaaaggacag tgcacatata tagcaaattg atcaaatgtt   2100
taatccttgt atgcgggtga gaatcaatgc catcagcaat ttggaaaaaa aaaaaaaaaa   2160
a                                                                   2161
<210>99
<211>606
<212>PRT
<213>稻(Oryza sativa)
<400>99
Met Glu Ser Ile Ala Ala Ala Thr Phe Thr Pro Ser Arg Leu Ala Ala
1               5                   10                  15
Arg Pro Ala Thr Pro Ala Ala Ala Ala Ala Pro Val Arg Ala Arg Ala
            20                  25                  30
Ala Val Ala Ala Gly Gly Arg Arg Arg Thr Ser Arg Arg Gly Gly Val
        35                  40                  45
Arg Cys Ser Ala Gly Lys Pro Glu Ala Ser Ala Val Ile Asn Gly Ser
    50                  55                  60
Ala Ala Ala Arg Ala Ala Glu Glu Asp Arg Arg Arg Phe Phe Glu Ala
65                  70                  75                  80
Ala Glu Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys
                85                  90                  95
Ile Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val
            100                 105                 110
Pro Glu Asp Asn Met Glu Thr Pro Ser Phe Leu Phe Glu Ser Val Glu
        115                 120                 125
Gln Gly Pro Glu Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly
    130                 135                 140
Ala His Pro Val Met Glu Val Val Ala Lys Glu His Lys Val Thr Ile
145                 150                 155                 160
Met Asp His Glu Lys Gly Lys Val Thr Glu Gln Val Val Asp Asp Pro
                165                 170                 175
Met Gln Ile Pro Arg Ser Met Met Glu Gly Trp His Pro Gln Gln Ile
            180                 185                 190
Asp Gln Leu Pro Asp Ser Phe Thr Gly Gly Trp Val Gly Phe Phe Ser
        195                 200                 205
Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Gly
    210                 215                 220
Ala Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr
225                 230                 235                 240
Asp Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile
                245                 250                 255
His Trp Val Asn Leu Asp Arg His Ala Thr Thr Glu Asp Ala Phe Gln
            260                 265                 270
Asp Gly Lys Ser Arg Leu Ash Leu Leu Leu Ser Lys Val His Asn Ser
        275                 280                 285
Asn Val Pro Lys Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Gln
    290                 295                 300
Phe Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys
305                 310                 315                 320
Asn Ala Val Met Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe
                325                 330                 335
Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Gln Thr Tyr Ala Asn Pro
            340                 345                 350
Phe Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met
        355                 360                 365
Ala Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu
    370                 375                 380
Ile Leu Thr Arg Val Arg Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala
385                 390                 395                 400
Gly Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Glu Met Gln Glu
                405                 410                 415
Gln Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu
            420                 425                 430
Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser
        435                 440                 445
Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met
    450                 455                 460
His Ile Ser Ser Thr Val Ser Gly Glu Leu Asp Asp His Leu Gln Ser
465                 470                 475                 480
Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala
                485                 490                 495
Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val Thr Arg
            500                 505                 510
Arg Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp
        515                 520                 525
Met Leu Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro
    530                 535                 540
Ser His Asn Thr Met Tyr Ser Tyr Lys Asp Thr Glu Arg Arg Arg Glu
545                 550                 555                 560
Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser
                565                 570                 575
Pro Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala
            580                 585                 590
Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu
        595                 600                 605
<210>100
<211>67
<212>PRT
<213>稻(Oryza sativa)
<400>100
Met Cys Val Leu Val Ala Ala Ala Val Arg Glu Glu Glu Ser Lys Phe
1               5                   10                  15
Lys Ala Gly Ala Ala Glu Gly Cys Asn Ile Leu Pro Leu Lys Arg Cys
            20                  25                  30
Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val
        35                  40                  45
Arg Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu Ser Val Glu
    50                  55                  60
Gln Gly Ser
65
<210>101
<211>525
<212>PRT
<213>玉米(Zea mays)
<400>101
Met Trp Glu Cys Ile Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile
1               5                   10                  15
Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro
            20                  25                  30
Glu Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln
        35                  40                  45
Gly Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala
    50                  55                  60
His Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met
65                  70                  75                  80
Asp His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met
                85                  90                  95
Gln Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp
            100                 105                 110
Glu Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr
        115                 120                 125
Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala
    130                 135                 140
Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp
145                 150                 155                 160
Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His
                165                 170                 175
Trp Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp
            180                 185                 190
Gly Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn
        195                 200                 205
Val Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe
    210                 215                 220
Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn
225                 230                 235                 240
Ala Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln
                245                 250                 255
Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe
            260                 265                 270
Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala
        275                 280                 285
Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile
    290                 295                 300
Leu Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly
305                 310                 315                 320
Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln
                325                 330                 335
Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val
            340                 345                 350
Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Gly Ser
        355                 360                 365
Val Lys Val Glu Lys Leu Ile Ile Glu Arg Tyr Ser His Val Met His
    370                 375                 380
Ile Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp
385                 390                 395                 400
Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro
                405                 410                 415
Lys Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg
            420                 425                 430
Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met
        435                 440                 445
Gln Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser
    450                 455                 460
His Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp
465                 470                 475                 480
Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro
                485                 490                 495
Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg
            500                 505                 510
Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asn Lys Glu
        515                 520                 525
<210>102
<211>92
<212>PRT
<213>小麦(Triticum aestivum)
<400>102
Pro Asn Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Leu
1               5                   10                  15
Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser Pro
            20                  25                  30
Asn Arg Met Tyr Ser Tyr Lys Ser Ser Asp Arg Pro Arg Glu Trp Val
        35                  40                  45
Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ile Pro Asp
    50                  55                  60
Asp Glu Gln Lys Glu Phe Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala
65                  70                  75                  80
Ile Asp Leu Ala Glu Ser Ala Phe Leu Asp Lys Glu
                85                  90
<210>103
<211>616
<212>PRT
<213>烟草(Nicotiana tabacum)
<400>103
Met Gln Ser Leu Pro Ile Ser Tyr Arg Leu Phe Pro Ala Thr His Arg
1               5                   10                  15
Lys Val Leu Pro Phe Ala Val Ile Ser Ser Arg Ser Ser Thr Ser Ala
            20                  25                  30
Leu Ala Leu Arg Val Arg Thr Leu Gln Cys Arg Cys Leu His Ser Ser
        35                  40                  45
Ser Leu Val Met Asp Glu Asp Arg Phe Ile Glu Ala Ser Lys Ser Gly
    50                  55                  60
Asn Leu Ile Pro Leu His Lys Thr Ile Phe Ser Asp His Leu Thr Pro
65                  70                  75                  80
Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro
                85                  90                  95
Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Phe Arg Gly Ser Ser Val
            100                 105                 110
Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Ser Met Glu Ile Val Ala
        115                 120                 125
Lys Glu His Asn Val Thr Ile Leu Asp His His Thr Gly Lys Leu Thr
    130                 135                 140
Gln Lys Thr Val Gln Asp Pro Met Thr Ile Pro Arg Ser Ile Ser Glu
145                 150                 155                 160
Gly Trp Lys Pro Arg Leu Ile Asp Glu Leu Pro Asp Thr Phe Cys Gly
                165                 170                 175
Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Asn
            180                 185                 190
Arg Lys Leu Pro Phe Leu Arg Ala Pro Glu Asp Asp Arg Asn Leu Ala
        195                 200                 205
Asp Ile Gln Leu Gly Leu Tyr Glu Asp Val Ile Val Phe Asp His Val
    210                 215                 220
Glu Lys Lys Ala His Val Ile His Trp Val Gln Leu Asp Gln Tyr Ser
225                 230                 235                 240
Ser Leu Pro Glu Ala Tyr Leu Asp Gly Lys Lys Arg Leu Glu Ile Leu
                245                 250                 255
Val Ser Arg Val Gln Gly Ile Glu Ser Pro Arg Leu Ser Pro Gly Ser
            260                 265                 270
Val Asp Phe Cys Thr His Ala Phe Gly Pro Ser Leu Thr Lys Gly Asn
        275                 280                 285
Met Thr Ser Glu Glu Tyr Lys Asn Ala Val Leu Gln Ala Lys Glu His
    290                 295                 300
Ile Ala Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu
305                 310                 315                 320
Arg Arg Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Ile
                325                 330                 335
Val Asn Pro Ser Pro Tyr Met Thr Tyr Ile Gln Ala Arg Gly Cys Ile
            340                 345                 350
Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Arg Arg
        355                 360                 365
Ile Val Asn Arg Pro Leu Ala Gly Thr Ser Arg Arg Gly Lys Thr Pro
    370                 375                 380
Asp Glu Asp Val Met Leu Glu Met Gln Met Leu Lys Asp Glu Lys Gln
385                 390                 395                 400
Arg Ala Glu His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly
                405                 410                 415
Lys Val Ser Lys Pro Gly Ser Val Asn Val Glu Lys Leu Met Ser Val
            420                 425                 430
Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val Ser Gly Glu
        435                 440                 445
Leu Leu Asp His Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro
    450                 455                 460
Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile
465                 470                 475                 480
Asp Gln Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly
                485                 490                 495
Gly Ile Ser Phe Ser Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr
            500                 505                 510
Met Val Phe Leu Asn Gly Ala Arg Tyr Asp Thr Met Tyr Ser Tyr Thr
        515                 520                 525
Asp Ala Ser Lys Arg Gln Glu Trp Val Ala His Leu Gln Ser Gly Ala
    530                 535                 540
Gly Ile Val Ala Asp Ser Asn Pro Asp Glu Glu Gln Ile Glu Cys Glu
545                 550                 555                 560
Asn Lys Val Ala Gly Leu Cys Arg Ala Ile Asp Leu Ala Glu Ser Ala
                565                 570                 575
Phe Val Lys Gly Arg His Lys Pro Ser Val Lys Ile Asn Gly Ser Val
            580                 585                 590
Pro Asn Leu Phe Ser Arg Val Gln Arg Gln Thr Ser Val Met Ser Lys
        595                 600                 605
Asp Arg Val His Glu Lys Arg Asn
    610                 615
<210>104
<211>1776
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<220>
<221>misc_feature
<223>α亚基.
<400>104
atgcaggcat ccatgtcggt tacctcgacg aactccacat taccaatgcc agtgcaaagc     60
agccttggat tctctcaccg cttccttcct tcatctcatc ggttttctca acttccgatc    120
acccgctttt ctcccgctcc tacttcactc aaatgcaggg gctctctttc aagctttcca    180
cttgttaatg atgaaaagaa gtttgtggag gcggccaaaa aagcaaattt agtccccctt    240
tatcgttgca ttttctctga tcaactgact ccagtgcttg cataccggtg tttggttaaa    300
gaagatgata gagaggctcc aagttttctc tttgagtcag tggagcctgg ttctcgggtt    360
tctagtgttg gtcgatatag cgtggttgga gctcaaccga caatggaaat tgtggcaaaa    420
gaaaacaaag ttatgattat ggatcatgag gcagggaatt tgactgagga ggtcgttgag    480
gatccgatgt gtattcccaa gagaatctca gagacttgga aaccccgact tgttgaagat    540
cttcctgatg cgttttgtgg tggatgggtt ggttatttct cctatgatac agttcgttat    600
gtggagaaga aaaagcttcc gttcactaag gcaccacgtg atgacagaaa cctgccagat    660
atacatctag gactctacaa cgacgtgatt gtatttgatc atgtggaaaa gaaagcatat    720
ataattcact gggtgaggct agataaacac tcgtctgttg agaaagctta taatgaagga    780
gttgaacacc tagagaaatt ggtagctaga gtacaagatg ttgagctacc aaagctatct    840
ccaggctctg tagcattaca aacccatcac tttggccctt ctttaaagaa ctcaaatatg    900
gaaaaggaag agttcaagaa agctgtactg aaagcgaaag agcatattct ggcaggggat    960
attttccaga ttgtattaag ccaacgtttt gaacggagaa catttgctga cccctttgaa   1020
atatatagag ctttgcgagt tgtgaatcca agtccatata tggcctactt gcaagctaga   1080
ggaagtattc tagttgcttc aagtcccgaa attcttacca gggtaaagaa gaataagatt   1140
gtgaataggc cattggctgg aacaacaagg agaggaaaga ctcaggctga agatgagctg   1200
gcagaaaagc tattgctaag taatgaaaag gaatgtgcag aacacatcat gcttgttgat   1260
ttgggtcgca atgatgttgg aaaggtctcc aaatatggtt ctgtaaaggt ggagaagctg   1320
atgaatattg aacgatattc ccatgtgatg cacataagct ccacggttac tggtgagttg   1380
caggatcatc tcactagttg ggatgtcctc cgtgctgcac ttcccgttgg aactgttagt   1440
ggagcaccaa aggtgaaggc gatggagcta atcgatgagt tagaggtgtc aagacgaggt   1500
ccttatagcg gaggatttgg gggcatttcc ttcactgggg atatggatat tgcgttggct   1560
ctcaggacca tggtattccc tacaggtagc cgctatgaca caatgtactc atacaaaggt   1620
tccagcagac gccaagaatg ggtagcttat cttcaagccg gcgctggtgt agttgcagac   1680
agtgatcctg atgccgagca cctcgaatgt caaaacaaag ctgctggcct tgctcgttcc   1740
attgacctag cggaggctgc attcgttcat aaatga                             1776
<210>105
<211>843
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<220>
<221>misc_feature
<223>β亚基.
<400>105
atggcagcta atattataac ccaatcatct ctgcttcagc caaaacctgc actttctgct     60
aaaacccttc aaatcccatc tctgcatcgc ttatccggcc tccctcctcc atcaagggtt    120
ggcttttttc tggaaaagaa aacggggatt gttggaaaag ctccattaaa atcggctgta    180
tcggactcaa cctcgtcagt tttggagaac aagaaaaaca gcaagaatcc cattgtcgtc    240
attgacaatt acgacagttt cacttacaat ctttgccagt atattggaga gcttggatgt    300
tacttcgagg tttttcgaaa tgacgaatta actgtagaag acttaaaaat gaaaaaccct    360
aggggagtgc ttatctctcc tggtccagga acaccccaag attccggaat atcactgcag    420
actgttttgg aacttggacc tactgtacct ttgtttggtg tttgtatggg tttgcagtgc    480
attggtgagg cttttggagg aaagatagtg cgttctccct atggtgttat gcatggcaaa    540
agttcccctg tatattatga cgaaaagggg gaagacggtt tgttatctgg attgtcaaac    600
cctttcaatg ctggcagata tcatagcctc gtgattgaaa aggacagttt ccctgaggaa    660
gcacttgagg ttactgcttg gacagaagat ggactgataa tggctgctag gcacaaagtt    720
tataagcatc tgcagggtgt tcaattccat ccagagagca tcataacctc tgaaggaaaa    780
acaattgttc ggaatttcat caaactaatc gagagaaagg aggtggcagg atccaagaat    840
tag                                                                  843
<210>106
<211>1704
<212>DNA
<213>大豆(Glycine max)
<220>
<221>misc_feature
<223>α亚基.
<400>106
atggcgactg ttccgcaccc attatccctc gcaagtgtag gttttgctaa ccgaacctcc     60
tccatctcca gatccactct caaatgctgc gctcaatctc cttctccttc actagttgac    120
aacgcccaga agtttctcga agcttccaag aaggggaacg tcattcctct cttccgctgc    180
atattttccg atcacctcac tccggtgctt gcgtaccggt gcctggttaa ggaggacgag    240
agagatgctc cgagttttct ctttgaatcg gtcgagccag gccaaatttc tagcatcgga    300
cggtacagtg tggttggagc acagccgtgt atggaaattg tggcgaaaga gaacgtggtt    360
actattatgg accacgtgga agggcgcagg agtgaggaaa ttgtagagga tcctctggtg    420
attcctcgta ggatcatgga gaagtggacg cctcaactct tagatgaact tcctgaagcg    480
ttttgtggtg gttgggtagg gtatttctct tatgatacaa tgcgctatgt agaaaagaag    540
aaacttccat tttctaatgc cccagtagat gacagaaacc ttcctgatgt tcatctgggc    600
ctttatgaca gtgtgattgt gtttgatcat gttgaaaaga aagcatatgt gattcattgg    660
gttcgggtgg atcgatattc ttcagctgag gaggccttcg aagatggaag gaaccggctg    720
gaaactctag tatctcgggt gcatgatata attaccccaa ggctgcctac aggttcgata    780
aagttataca ctcgtctctt tggtcctaaa ctggagatgt caaacatgac aaatgaggag    840
tataagaggg cagtattgaa ggctaaagag cacatacggg ctggtgatat ttttcaaatt    900
gtactaagtc aacgttttga acagagaact tttgcagacc catttgaaat ctacagagca    960
ttgaggattg ttaatcctag tccatatatg acttatttac aggccagagg aagtattttg   1020
gttgcttcaa gtccagaaat tcttacacgg gtgaagaaga gaaagatcac caatcggccc   1080
cttgctggta ctgttagaag aggaaaaaca ccaaaagaag atatcatgtt ggagaaacaa   1140
cttttgaatg atgaaaagca atgtgcagag cacgtaatgc tagttgattt ggggagaaat   1200
gatgttggaa aggtctccaa accgggttct gttcaagttg aaaagcttat gaatattgag   1260
cgctattccc atgttatgca catcagctca acagtcacag gggagttatt agatcactta   1320
acaagctggg atgcattgcg tgctgcttta cctgttggta cagttagcgg agcaccgaag   1380
gtcaaagcca tgcagttgat tgatgagttg gaagtcgcaa gaagggggcc ctatagtggg   1440
ggatttggag gtatatcatt caatggcgat atggacatag cccttgctct gaggaccata   1500
gttttcccta caaatgctcg ttatgacaca atgtactcct acaaggataa gaacaaacgc   1560
agagaatggg ttgcccatct ccaggctgga gcgggaattg tggctgacag tgatcctgct   1620
gatgaacaaa gagagtgcga gaacaaagct gcagctcttg ctcgtgccat tgatcttgca   1680
gaatcttcat ttgttgataa ataa                                          1704
<210>107
<21l>837
<212>DNA
<213>大豆(Glycine max)
<220>
<221>misc_feature
<223>β亚基.
<400>107
atggctgcca cattcttctc tcacttgtcg cttcttcaat ccaacaacaa cccttctctc     60
tctcacacac cctctcgctt ccctcattct ctcaccaacc gtgtcaaacc ctccctcggt    120
gtggtatctg tggccaaaag ggtaagtgga gtggtgccaa aggccaattt gaatgccttg    180
gaggccaatt cgggtttccc catttcggct aagaagtcca acaacaaccc cattgttgtt    240
attgacaact atgacagttt cacctataat ctttgccagt atatggggga gttagggttt    300
cactttgagg tctaccgcaa tgatgagttg acagtggagg agttaagaag gaaaaatccc    360
agaggagtgc tgatatcacc tgggccagga gaacctcaag attcaggcat atctttgcaa    420
acggttttgg aacttggacc aactgtgcca ttgtttggtg tgtgcatggg tttgcaatgc    480
attggagagg cttttggagg gaagattgtt cgttctcctc atggtgttat gcatggaaaa    540
agctctatgg tttactatga tgagaaagga gaagatggat tacttgctgg actatcaaat    600
cctttcttgg ctggtagata tcacagcctt gtaattgaaa aagagagctt tcctcatgat    660
gaacttgagg caacagcatg gacagaagat ggtcttataa tggctgctcg tcataagaaa    720
tataagcatc tacagggtgt tcagtttcat ccagagagca tcataacccc agaaggcaag    780
acaattgtcc gtaattttgt caagcttatc gagaaaaggg aggctggtgg ctcttga       837
<210>108
<211>591
<212>PRT
<213>陆地棉(Gossypium hirsutum)
<220>
<221>MISC_FEATURE
<223>α亚基.
<400>108
Met Gln Ala Ser Met Ser Val Thr Ser Thr Asn Ser Thr Leu Pro Met
1               5                   10                  15
Pro Val Gln Ser Ser Leu Gly Phe Ser His Arg Phe Leu Pro Ser Ser
            20                  25                  30
His Arg Phe Ser Gln Leu Pro Ile Thr Arg Phe Ser Pro Ala Pro Thr
        35                  40                  45
Ser Leu Lys Cys Arg Gly Ser Leu Ser Ser Phe Pro Leu Val Asn Asp
    50                  55                  60
Glu Lys Lys Phe Val Glu Ala Ala Lys Lys Ala Asn Leu Val Pro Leu
65                  70                  75                  80
Tyr Arg Cys Ile Phe Ser Asp Gln Leu Thr Pro Val Leu Ala Tyr Arg
                85                  90                  95
Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu
            100                 105                 110
Ser Val Glu Pro Gly Ser Arg Val Ser Ser Val Gly Arg Tyr Ser Val
        115                 120                 125
Val Gly Ala Gln Pro Thr Met Glu Ile Val Ala Lys Glu Asn Lys Val
    130                 135                 140
Met Ile Met Asp His Glu Ala Gly Asn Leu Thr Glu Glu Val Val Glu
145                 150                 155                 160
Asp Pro Met Cys Ile Pro Lys Arg Ile Ser Glu Thr Trp Lys Pro Arg
                165                 170                 175
Leu Val Glu Asp Leu Pro Asp Ala Phe Cys Gly Gly Trp Val Gly Tyr
            180                 185                 190
Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe
        195                 200                 205
Thr Lys Ala Pro Arg Asp Asp Arg Asn Leu Pro Asp Ile His Leu Gly
    210                 215                 220
Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala Tyr
225                 230                 235                 240
Ile Ile His Trp Val Arg Leu Asp Lys His Ser Ser Val Glu Lys Ala
                245                 250                 255
Tyr Asn Glu Gly Val Glu His Leu Glu Lys Leu Val Ala Arg Val Gln
            260                 265                 270
Asp Val Glu Leu Pro Lys Leu Ser Pro Gly Ser Val Ala Leu Gln Thr
        275                 280                 285
His His Phe Gly Pro Ser Leu Lys Asn Ser Asn Met Glu Lys Glu Glu
    290                 295                 300
Phe Lys Lys Ala Val Leu Lys Ala Lys Glu His Ile Leu Ala Gly Asp
305                 310                 315                 320
Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe Ala
                325                 330                 335
Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Val Val Asn Pro Ser Pro
            340                 345                 350
Tyr Met Ala Tyr Leu Gln Ala Arg Gly Ser Ile Leu Val Ala Ser Ser
        355                 360                 365
Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val Asn Arg Pro
    370                 375                 380
Leu Ala Gly Thr Thr Arg Arg Gly Lys Thr Gln Ala Glu Asp Glu Leu
385                 390                 395                 400
Ala Glu Lys Leu Leu Leu Ser Asn Glu Lys Glu Cys Ala Glu His Ile
                405                 410                 415
Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Tyr
            420                 425                 430
Gly Ser Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His
        435                 440                 445
Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln Asp His Leu
    450                 455                 460
Thr Ser Trp Asp Val Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser
465                 470                 475                 480
Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val
                485                 490                 495
Ser Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe Thr
            500                 505                 510
Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro Thr
        515                 520                 525
Gly Ser Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Gly Ser Ser Arg Arg
    530                 535                 540
Gln Glu Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Val Val Ala Asp
545                 550                 555                 560
Ser Asp Pro Asp Ala Glu His Leu Glu Cys Gln Asn Lys Ala Ala Gly
                565                 570                 575
Leu Ala Arg Ser Ile Asp Leu Ala Glu Ala Ala Phe Val His Lys
            580                 585                 590
<210>109
<211>280
<212>PRT
<213>陆地棉(Gossypium hirsutum)
<220>
<221>MISC_FEATURE
<223>β亚基.
<400>109
Met Ala Ala Asn Ile Ile Thr Gln Ser Ser Leu Leu Gln Pro Lys Pro
1               5                   10                  15
Ala Leu Ser Ala Lys Thr Leu Gln Ile Pro Ser Leu His Arg Leu Ser
            20                  25                  30
Gly Leu Pro Pro Pro Ser Arg Val Gly Phe Phe Leu Glu Lys Lys Thr
        35                  40                  45
Gly Ile Val Gly Lys Ala Pro Leu Lys Ser Ala Val Ser Asp Ser Thr
    50                  55                  60
Ser Ser Val Leu Glu Asn Lys Lys Asn Ser Lys Asn Pro Ile Val Val
65                  70                  75                  80
Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys Gln Tyr Ile Gly
                85                  90                  95
Glu Leu Gly Cys Tyr Phe Glu Val Phe Arg Asn Asp Glu Leu Thr Val
            100                 105                 110
Glu Asp Leu Lys Met Lys Asn Pro Arg Gly Val Leu Ile Ser Pro Gly
        115                 120                 125
Pro Gly Thr Pro Gln Asp Ser Gly Ile Ser Leu Gln Thr Val Leu Glu
    130                 135                 140
Leu Gly Pro Thr Val Pro Leu Phe Gly Val Cys Met Gly Leu Gln Cys
145                 150                 155                 160
Ile Gly Glu Ala Phe Gly Gly Lys Ile Val Arg Ser Pro Tyr Gly Val
                165                 170                 175
Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu Lys Gly Glu Asp
            180                 185                 190
Gly Leu Leu Ser Gly Leu Ser Asn Pro Phe Asn Ala Gly Arg Tyr His
        195                 200                 205
Ser Leu Val Ile Glu Lys Asp Ser Phe Pro Glu Glu Ala Leu Glu Val
    210                 215                 220
Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg His Lys Val
225                 230                 235                 240
Tyr Lys His Leu Gln Gly Val Gln Phe His Pro Glu Ser Ile Ile Thr
                245                 250                 255
Ser Glu Gly Lys Thr Ile Val Arg Asn Phe Ile Lys Leu Ile Glu Arg
            260                 265                 270
Lys Glu Val Ala Gly Ser Lys Asn
        275                 280
<210>110
<211>567
<212>PRT
<213>大豆(Glycine max)
<220>
<221>MISC_FEATURE
<223>α亚基.
<400>110
Met Ala Thr Val Pro His Pro Leu Ser Leu Ala Ser Val Gly Phe Ala
1               5                   10                  15
Asn Arg Thr Ser Ser Ile Ser Arg Ser Thr Leu Lys Cys Cys Ala Gln
            20                  25                  30
Ser Pro Ser Pro Ser Leu Val Asp Asn Ala Gln Lys Phe Leu Glu Ala
        35                  40                  45
Ser Lys Lys Gly Asn Val Ile Pro Leu Phe Arg Cys Ile Phe Ser Asp
    50                  55                  60
His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Glu
65                  70                  75                  80
Arg Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Gln Ile
                85                  90                  95
Ser Ser Ile Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Cys Met Glu
            100                 105                 110
Ile Val Ala Lys Glu Asn Val Val Thr Ile Met Asp His Val Glu Gly
        115                 120                 125
Arg Arg Ser Glu Glu Ile Val Glu Asp Pro Leu Val Ile Pro Arg Arg
    130                 135                 140
Ile Met Glu Lys Trp Thr Pro Gln Leu Leu Asp Glu Leu Pro Glu Ala
145                 150                 155                 160
Phe Cys Gly Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Met Arg Tyr
                165                 170                 175
Val Glu Lys Lys Lys Leu Pro Phe Ser Asn Ala Pro Val Asp Asp Arg
            180                 185                 190
Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Ser Val Ile Val Phe
        195                 200                 205
Asp His Val Glu Lys Lys Ala Tyr Val Ile His Trp Val Arg Val Asp
    210                 215                 220
Arg Tyr Ser Ser Ala Glu Glu Ala Phe Glu Asp Gly Arg Asn Arg Leu
225                 230                 235                 240
Glu Thr Leu Val Ser Arg Val His Asp Ile Ile Thr Pro Arg Leu Pro
                245                 250                 255
Thr Gly Ser Ile Lys Leu Tyr Thr Arg Leu Phe Gly Pro Lys Leu Glu
            260                 265                 270
Met Ser Asn Met Thr Asn Glu Glu Tyr Lys Arg Ala Val Leu Lys Ala
        275                 280                 285
Lys Glu His Ile Arg Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln
    290                 295                 300
Arg Phe Glu Gln Arg Thr Phe Ala Asp Pro Phe Glu Ile Tyr Arg Ala
305                 310                 315                 320
Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Thr Tyr Leu Gln Ala Arg
                325                 330                 335
Gly Ser Ile Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys
            340                 345                 350
Lys Arg Lys Ile Thr Asn Arg Pro Leu Ala Gly Thr Val Arg Arg Gly
        355                 360                 365
Lys Thr Pro Lys Glu Asp Ile Met Leu Glu Lys Gln Leu Leu Asn Asp
    370                 375                 380
Glu Lys Gln Cys Ala Glu His Val Met Leu Val Asp Leu Gly Arg Asn
385                 390                 395                 400
Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Gln Val Glu Lys Leu
                405                 410                 415
Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val
            420                 425                 430
Thr Gly Glu Leu Leu Asp His Leu Thr Ser Trp Asp Ala Leu Arg Ala
        435                 440                 445
Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met
    450                 455                 460
Gln Leu Ile Asp Glu Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly
465                 470                 475                 480
Gly Phe Gly Gly Ile Ser Phe Asn Gly Asp Met Asp Ile Ala Leu Ala
                485                 490                 495
Leu Arg Thr Ile Val Phe Pro Thr Asn Ala Arg Tyr Asp Thr Met Tyr
            500                 505                 510
Ser Tyr Lys Asp Lys Asn Lys Arg Arg Glu Trp Val Ala His Leu Gln
        515                 520                 525
Ala Gly Ala Gly Ile Val Ala Asp Ser Asp Pro Ala Asp Glu Gln Arg
    530                 535                 540
Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala Ile Asp Leu Ala
545                 550                 555                 560
Glu Ser Ser Phe Val Asp Lys
                565
<210>111
<211>278
<212>PRT
<213>大豆(Glycine max)
<220>
<221>MISC_FEATURE
<223>β亚基.
<400>111
Met Ala Ala Thr Phe Phe Ser His Leu Ser Leu Leu Gln Ser Asn Asn
1               5                   10                  15
Asn Pro Ser Leu Ser His Thr Pro Ser Arg Phe Pro His Ser Leu Thr
            20                  25                  30
Asn Arg Val Lys Pro Ser Leu Gly Val Val Ser Val Ala Lys Arg Val
        35                  40                  45
Ser Gly Val Val Pro Lys Ala Asn Leu Asn Ala Leu Glu Ala Asn Ser
    50                  55                  60
Gly Phe Pro Ile Ser Ala Lys Lys Ser Asn Asn Asn Pro Ile Val Val
65                  70                  75                  80
Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly
                85                  90                  95
Glu Leu Gly Phe His Phe Glu Val Tyr Arg Asn Asp Glu Leu Thr Val
            100                 105                 110
Glu Glu Leu Arg Arg Lys Asn Pro Arg Gly Val Leu Ile Ser Pro Gly
        115                 120                 125
Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln Thr Val Leu Glu
    130                 135                 140
Leu Gly Pro Thr Val Pro Leu Phe Gly Val Cys Met Gly Leu Gln Cys
145                 150                 155                 160
Ile Gly Glu Ala Phe Gly Gly Lys Ile Val Arg Ser Pro His Gly Val
                165                 170                 175
Met His Gly Lys Ser Ser Met Val Tyr Tyr Asp Glu Lys Gly Glu Asp
            180                 185                 190
Gly Leu Leu Ala Gly Leu Ser Asn Pro Phe Leu Ala Gly Arg Tyr His
        195                 200                 205
Ser Leu Val Ile Glu Lys Glu Ser Phe Pro His Asp Glu Leu Glu Ala
    210                 215                 220
Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg His Lys Lys
225                 230                 235                 240
Tyr Lys His Leu Gln Gly Val Gln Phe His Pro Glu Ser Ile Ile Thr
                245                 250                 255
Pro Glu Gly Lys Thr Ile Val Arg Asn Phe Val Lys Leu Ile Glu Lys
            260                 265                 270
Arg Glu Ala Gly Gly Ser
        275
<210>112
<211>2210
<212>DNA
<213>大豆(Glycine max)
<220>
<221>3′UTR
<222>(1919)..(2210)
<223>
<220>
<221>misc_feature
<223>α亚基.
<220>
<221>5′UTR
<222>(1)..(214)
<223>
<400>112
aaagaaatga cctgaagtct ctatatattc caggtaacga agaccttagc aacccaatga     60
acgcgtcccc atgaacggca cgtgtagcgg agtactaggc cgccgttaca cgctactgct    120
gtccgtcgtc accgtttgaa ttacccaccg ctactttgtc gtcattcttc ttcttcttcc    180
cttttcattg accttttcct tccttcgtcc tccaatggcg actgttccgc acccattatc    240
cctcgcaagt gtaggttttg ctaaccgaac ctcctccatc tccagatcca ctctcaaatg    300
ctgcgctcaa tctccttctc cttcactagt tgacaacgcc cagaagtttc tcgaagcttc    360
caagaagggg aacgtcattc ctctcttccg ctgcatattt tccgatcacc tcactccggt    420
gcttgcgtac cggtgcctgg ttaaggagga cgagagagat gctccgagtt ttctctttga    480
atcggtcgag ccaggccaaa tttctagcat cggacggtac agtgtggttg gagcacagcc    540
gtgtatggaa attgtggcga aagagaacgt ggttactatt atggaccacg tggaagggcg    600
caggagtgag gaaattgtag aggatcctct ggtgattcct cgtaggatca tggagaagtg    660
gacgcctcaa ctcttagatg aacttcctga agcgttttgt ggtggttggg tagggtattt    720
ctcttatgat acaatgcgct atgtagaaaa gaagaaactt ccattttcta atgccccagt    780
agatgacaga aaccttcctg atgttcatct gggcctttat gacagtgtga ttgtgtttga    840
tcatgttgaa aagaaagcat atgtgattca ttgggttcgg gtggatcgat attcttcagc    900
tgaggaggcc ttcgaagatg gaaggaaccg gctggaaact ctagtatctc gggtgcatga    960
tataattacc ccaaggctgc ctacaggttc gataaagtta tacactcgtc tctttggtcc   1020
taaactggag atgtcaaaca tgacaaatga ggagtataag agggcagtat tgaaggctaa   1080
agagcacata cgggctggtg atatttttca aattgtacta agtcaacgtt ttgaacagag   1140
aacttttgca gacccatttg aaatctacag agcattgagg attgttaatc ctagtccata   1200
tatgacttat ttacaggcca gaggaagtat tttggttgct tcaagtccag aaattcttac   1260
acgggtgaag aagagaaaga tcaccaatcg gccccttgct ggtactgtta gaagaggaaa   1320
aacaccaaaa gaagatatca tgttggagaa acaacttttg aatgatgaaa agcaatgtgc   1380
agagcacgta atgctagttg atttggggag aaatgatgtt ggaaaggtct ccaaaccggg   1440
ttctgttcaa gttgaaaagc ttatgaatat tgagcgctat tcccatgtta tgcacatcag   1500
ctcaacagtc acaggggagt tattagatca cttaacaagc tgggatgcat tgcgtgctgc   1560
tttacctgtt ggtacagtta gcggagcacc gaaggtcaaa gccatgcagt tgattgatga   1620
gttggaagtc gcaagaaggg ggccctatag tgggggattt ggaggtatat cattcaatgg   1680
cgatatggac atagcccttg ctctgaggac catagttttc cctacaaatg ctcgttatga   1740
cacaatgtac tcctacaagg ataagaacaa acgcagagaa tgggttgccc atctccaggc   1800
tggagcggga attgtggctg acagtgatcc tgctgatgaa caaagagagt gcgagaacaa   1860
agctgcagct cttgctcgtg ccattgatct tgcagaatct tcatttgttg ataaataatt   1920
tggattgatc catcatcagt gatgctcctt gataactgag gggcatcctt tttaaatggt   1980
agagaggaag tttgtggtgt gggcagatga taggggatat gaattacgga gaatctgaaa   2040
ctttgataat gttatgacag aagtgatgaa cataataagg tatttaatga taatgacagc   2100
tttgtgactt tagttaagtc gtcgtttaag agacttcaat agccatttcc gtcggtccat   2160
cttaaaccaa agaaaggtgc ctttgacgga gtttcttttg ctatcataaa              2210
<210>113
<211>988
<212>DNA
<213>大豆(Glycine max)
<220>
<221>3′UTR
<222>(926)..(988)
<223>
<220>
<221>misc_feature
<223>β亚基.
<220>
<221>5′UTR
<222>(1)..(88)
<223>
<400>113
actcggctat gcatccaacg cgttgggagc tctcccatat ggtcgacctg caggcggccg     60
cgaattcact agtgattaac atttgaacat ggctgccaca ttcttctctc acttgtcgct    120
tcttcaatcc aacaacaacc cttctctctc tcacacaccc tctcgcttcc ctcattctct    180
caccaaccgt gtcaaaccct ccctcggtgt ggtatctgtg gccaaaaggg taagtggagt    240
ggtgccaaag gccaatttga atgccttgga ggccaattcg ggtttcccca tttcggctaa    300
gaagtccaac aacaacccca ttgttgttat tgacaactat gacagtttca cctataatct    360
ttgccagtat atgggggagt tagggtttca ctttgaggtc taccgcaatg atgagttgac    420
agtggaggag ttaagaagga aaaatcccag aggagtgctg atatcacctg ggccaggaga    480
acctcaagat tcaggcatat ctttgcaaac ggttttggaa cttggaccaa ctgtgccatt    540
gtttggtgtg tgcatgggtt tgcaatgcat tggagaggct tttggaggga agattgttcg    600
ttctcctcat ggtgttatgc atggaaaaag ctctatggtt tactatgatg agaaaggaga    660
agatggatta cttgctggac tatcaaatcc tttcttggct ggtagatatc acagccttgt    720
aattgaaaaa gagagctttc ctcatgatga acttgaggca acagcatgga cagaagatgg    780
tcttataatg gctgctcgtc ataagaaata taagcatcta cagggtgttc agtttcatcc    840
agagagcatc ataaccccag aaggcaagac aattgtccgt aattttgtca agcttatcga    900
gaaaagggag gctggtggct cttgaaaatc gaattcccgc ggccgccatg gcggccggga    960
gcatgcgacg tcgggccbaw kcggmgtt                                       988
<210>114
<211>47
<212>PRT
<213>玉米(Zea mays)
<220>
<221>misc_feature
<223>CTP的序列.
<400>114
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala
1               5                   10                  15
Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr
            20                  25                  30
Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser
        35                  40                  45
<210>115
<211>32
<212>PRT
<213>玉米(Zea mays)
<220>
<221>misc_feature
<223>CTP的序列.
<400>115
Met Ala Thr Ala Ser Leu Ala Leu Ser Leu Arg Leu Ala Pro Ser Ser
1               5                   10                  15
Arg Pro Leu Ser Leu Arg Arg Arg Gly Ala Ala Gly Val Thr Cys Arg
            20                  25                  30
<210>116
<211>849
<212>DNA
<213>玉米(Zea mays)
<400>116
atggcctgct cccacatcgt cgccgccgcg ggggtctcct cccccgccgc agcggcggct     60
cgttccccgg cgcattctcc cgctgccgcc ttcgcgcgcc tccggtcgac gcctcgtttc    120
gcgagcgctg gcttgtcggt taagggaaac ggagcggcgt tcccgttggt cgccgccgcg    180
gggccggccg cggcggcacc ggtggccgac ctggacggcc gcccggccac ggagaagcag    240
cccatcatcg tcatcgacaa ctacgacagc ttcacataca acctctgcca gtatatgggg    300
gagcttggat tgaacttcga agtataccgc aatgatgaac tgaccataga agatgtgaga    360
aggaagaacc caaggggaat acttatttct ccaggacctg gtgaaccaca agattcggga    420
atatcattgc agactgttct tgaattaggc ccaaccatcc caatttttgg agtttgcatg    480
ggtctgcaat gcattggaga ggcatttgga ggaaagatta tccgtgctcc ttctggagtg    540
atgcatggga aaagctctcc agtttattac gatgaggaat taggaaaggc attgttcaat    600
ggcttgccaa acccttttac tgccgcgagg taccacagct tggtcattga gcaagaaacc    660
ttcccacatg atgctttgga ggctactgca tggactgaag atggacttat catggctgct    720
cgccacaaga agtacaaaca catccagggt gtccaattcc acccggagag catcatcacc    780
cctgaaggca agaaaatcat cctcaacttt gtcagattca ttgaggaact ggagaagcag    840
cgttcgtag                                                            849
<210>117
<211>273
<212>PRT
<213>稻(0ryza sativa)
<400>117
Met Ala Thr Ala Ala Arg Leu Leu Pro Lys Ile Gln Ser Pro Ala Ser
1               5                   10                  15
Pro Ala Val Ala Glu Ala Arg Arg Arg Arg Pro Ser Ser Leu Arg Leu
            20                  25                  30
Gly Val Thr Ser Gly Pro Ala Arg Thr Leu Lys Gln Lys Leu Val Ala
        35                  40                  45
Lys Ser Ala Val Ser Val Val Glu Gly Glu Asn Ala Phe Asp Gly Val
    50                  55                  60
Lys Gln Asp Thr Arg Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser Phe
65                  70                  75                  80
Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Val Gly Ala Asn Phe Glu
                85                  90                  95
Val Tyr Arg Asn Asp Asp Ile Thr Val Glu Glu Ile Lys Lys Ile Ser
            100                 105                 110
Pro Arg Gly Ile Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp Ser
        115                 120                 125
Gly Ile Ser Leu Gln Thr Val Gln Asp Leu Gly Pro Ser Thr Pro Leu
    130                 135                 140
Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly
145                 150                 155                 160
Lys Val Val Arg Ser Pro Tyr Gly Val Val His Gly Lys Gly Ser Leu
                165                 170                 175
Val His Tyr Glu Glu Lys Leu Asp Gly Thr Leu Phe Ser Gly Leu Pro
            180                 185                 190
Asn Pro Phe Gln Ala Gly Arg Tyr His Ser Leu Val Ile Glu Lys Asp
        195                 200                 205
Ser Phe Pro His Asp Ala Leu Glu Ile Thr Ala Trp Thr Asp Asp Gly
    210                 215                 220
Leu Ile Met Ala Ala Arg His Arg Lys Tyr Lys His Ile Gln Gly Val
225                 230                 235                 240
Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Arg Leu Met Val
                245                 250                 255
Lys Asn Phe Ile Lys Ile Ile Glu Gly Tyr Glu Ala Leu Asn Cys Leu
            260                 265                 270
Pro
<210>118
<211>282
<212>PRT
<213>玉米(Zea mays)
<400>118
Met Ala Cys Ser His Ile Val Ala Ala Ala Gly Val Ser Ser Pro Ala
1               5                   10                  15
Ala Ala Ala Ala Arg Ser Pro Ala His Ser Pro Ala Ala Ala Phe Ala
            20                  25                  30
Arg Leu Arg Ser Thr Pro Arg Phe Ala Ser Ala Gly Leu Ser Val Lys
        35                  40                  45
Gly Asn Gly Ala Ala Phe Pro Leu Val Ala Ala Ala Gly Pro Ala Ala
    50                  55                  60
Ala Ala Pro Val Ala Asp Leu Asp Gly Arg Pro Ala Thr Glu Lys Gln
65                  70                  75                  80
Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys
                85                  90                  95
Gln Tyr Met Gly Glu Leu Gly Leu Asn Phe Glu Val Tyr Arg Asn Asp
            100                 105                 110
Glu Leu Thr Ile Glu Asp Val Arg Arg Lys Asn Pro Arg Gly Ile Leu
        115                 120                 125
Ile Ser Pro Gly Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln
    130                 135                 140
Thr Val Leu Glu Leu Gly Pro Thr Ile Pro Ile Phe Gly Val Cys Met
145                 150                 155                 160
Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly Lys Ile Ile Arg Ala
                165                 170                 175
Pro Ser Gly Val Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu
            180                 185                 190
Glu Leu Gly Lys Ala Leu Phe Asn Gly Leu Pro Asn Pro Phe Thr Ala
        195                 200                 205
Ala Arg Tyr His Ser Leu Val Ile Glu Gln Glu Thr Phe Pro His Asp
    210                 215                 220
Ala Leu Glu Ala Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala
225                 230                 235                 240
Arg His Lys Lys Tyr Lys His Ile Gln Gly Val Gln Phe His Pro Glu
                245                 250                 255
Ser Ile Ile Thr Pro Glu Gly Lys Lys Ile Ile Leu Asn Phe Val Arg
            260                 265                 270
Phe Ile Glu Glu Leu Glu Lys Gln Arg Ser
        275                 280
<210>119
<211>822
<212>DNA
<213>稻(Oryza sativa)
<400>119
atggccaccg ccgcgcggct cctccccaag atccagtccc ccgcctcccc ggccgtcgcg     60
gaggcgcgga ggcgccgccc ctccagtctc cgattaggag ttactagtgg acccgcaaga    120
actctgaagc aaaagcttgt tgctaagagt gctgtttctg tggtggaagg tgaaaacgca    180
tttgatggag taaagcaaga tactagacca atcatagtta tagataacta cgatagcttc    240
acgtataatt tatgccagta catgggtgag gtgggagcta actttgaggt gtaccgcaat    300
gatgatatca ccgtggaaga aattaagaag atttctccta gaggaatact catctcccct    360
ggccctggca cacctcaaga ttcaggaata tcattgcaaa cagttcaaga tcttggacct    420
tctacacctt tgtttggggt ttgcatgggt ttgcagtgta ttggggaggc atttggaggg    480
aaggttgttc gttctcctta tggagttgtg catgggaaag gatcccttgt tcactatgag    540
gagaaacttg atggaacact gttttctggt ctcccaaacc cattccaagc gggaagatac    600
cacagccttg taattgagaa ggatagcttc ccacatgatg ccctggaaat tactgcttgg    660
acagacgatg ggctgatcat ggctgctcgc cacaggaagt acaaacatat acagggtgtg    720
cagttccatc cagagagcat cataacaaca gaagggaggc tcatggtcaa gaatttcatc    780
aagattattg aaggctacga ggccttgaat tgcttaccgt ga                       822
<210>120
<211>867
<212>DNA
<213>稻(Oryza sativa)
<400>120
atggcgtgct cccacctggc cgccgccgcc gccgcggcct ccccggcggc cgcgcgttca     60
ccggcggcct ccagcgccgc aaccgcgagc gccttcgcgc gcctctcggc gacgccccgg    120
gtcgcgagcg gcgggttggc cgttaggggc cagaggggtg tagccgctgt tgtcgccgcc    180
gccgccgggg ccgccgcggc gacgcccgtg gccgacatcg aggaacgccg ggccaccgag    240
aagcagccca tcattgtcat cgataactac gacagcttta cctacaacct ctgccagtat    300
atgggggagc ttggattgaa ctttgaggta tatcgcaatg atgaacttac catagaggat    360
gtaaagagga agaacccaag aggaatactt atttctccag ggcctggtga gccacaagat    420
tcaggtatat cattgcagac tgttctggaa cttggaccta ccatcccaat ttttggtgtc    480
tgcatgggtc tgcagtgtat cggggaagct tttggaggaa agattatccg tgctccttct    540
ggtgtcatgc atggaaaaag ctctccagtt cgctacgatg aggagctagg gaaggccttg    600
ttcaatggct tgccaaaccc atttaccgct gcaagatacc atagcttggt gatcgagcag    660
gagaccttcc cccatgacgc tctggaagcc accgcgtgga ctgaagatgg ccttatcatg    720
gctgctcgcc acaagaagta caggcacatc cagggagtcc aattccaccc agagagcatc    780
atcaccccag aaggcaagag gatcattctc aacttcgtga ggttcatcga ggagctggag    840
aagcagcgtg ccggagagaa gaactag                                        867
<210>121
<211>2202
<212>DNA
<213>百脉根根瘤菌(Mesorhizobium loti)
<400>121
atggagacgg caatgacgat gaaggttctg gaaaacggcg ctgaaagctt cgtgaccgcg     60
ggtggcatca ccattacgcg tgagcgccac gaccggccct atgcgggtgc gatcgacgct    120
tatgtcgatg gcttgaactc gcgccgcggc gcggtgtttt cctccaacta cgaatatccc    180
ggccgctata cgcgctggga caccgccatc atcgatccgc cgctggtcat ttccgcgcgg    240
ggccgcgcca tgcgcatcga agcgctgaac cgccgcggcg aggcgctgtt gccggtgatc    300
ggcaaaacgc tgggcggcct tgccgacatc accatcgccg agacgacgaa gacgctcatc    360
cgcctcgacg tcgccaagcc cggccgcgtc ttcacggagg aagagcgcag ccgcgtgccc    420
tcggtcttca ccgtgctgcg cgccatcacc gctttgttca aaaccgacga ggacgccaat    480
ctcggcctct atggcgcctt cggctacgac ctctccttcc agttcgaccc ggtcgactac    540
aagctcgagc gcaagcccag ccagcgcgac ctcgtgctgt tcctgcccga cgagatcctg    600
gtcgtcgacc actattccgc caaagcctgg accgaccgct acgactattc gggcgaagga    660
ttttcgaccg aaggtctgcc gcgcgacgca atcgccgagc cgttcaagac cgccgaccgc    720
atcccgccgc gcggtgacca tgagccgggc gaatacgcta atctggtgcg gcgtgccatg    780
gactcgttca agcgcggcga cctgttcgag gtcgtgcccg gccagatgtt ctacgagcgc    840
tgcgagacgc agccctccga catttcgcgc aagctgaaat cgatcaaccc ctcgccttat    900
tcgttcttca tcaacctcgg cgaaaacgaa tatctgatcg gcgcctcgcc cgaaatgttc    960
gtgcgcgtca atggccgccg cgtcgaaacc tgcccgattt cgggcaccat caaacgcggc   1020
gacgacgcca tttccgatag cgagcagatc ctgaagctgc tcaattcgaa gaaggacgaa   1080
tccgagctca caatgtgctc ggacgtcgac cgcaacgaca agtcgcgggt ctgcgagccc   1140
ggctcggtgc gcgtcatcgg ccgccgccag atcgagatgt attcgcgcct catccacacc   1200
gtcgatcaca tcgaaggccg gctgcgcgaa ggcatggacg ctttcgacgc cttcctgtcg   1260
catgcctggg cggtcactgt caccggcgcg ccgaaactgt gggccatgcg cttcatcgag   1320
cagaacgaga agagcccgcg cgcctggtat ggcggcgcaa tcggcatggt caacttcaac   1380
ggcgacatga acaccggcct gacgctgcgc accatccgca tcaaggacgg cattgccgaa   1440
gtgcgggccg gcgcgacatt gctgttcgac agcattcccg aggaagaaga agccgaaacc   1500
gaactgaagg catccgccat gctctccgcc atccgcgacg ccaagacggg caactccgcc   1560
agcaccgagc gcaccaccgc gcgggtcggc gacggcgtca acatcctgct cgtcgaccac   1620
gaggactctt tcgtccacac gctggccaac tacttccgcc agaccggcgc caatgtctcg   1680
accgtgcgca cgccggtgcc ggacgaagtg ttcgagcggc tgaagccgga ccttgtcgtg   1740
ctctcacccg gaccgggtac gccgaaggat ttcgattgcg ccgcgaccat cagacgagcg   1800
cgcgcccgcg acctgccgat cttcggcgtc tgcctaggcc tgcaggcgct ggccgaggcc   1860
tatggcgggg aactgcgcca gctgcatatt cccatgcacg gcaagccctc gcgcatccgc   1920
gtctccaagc ccggcatcat cttctccggc ctgcccaagg aagtcactgt cggccgttac   1980
cactcgatct tcgccgatcc ggtgcgcttg cccgatgatt tcattgtcac ggcagagact   2040
gaggacggca tcatcatggc tttcgagcac cgcaaggagc cgatcgcggc ggtgcagttc   2100
cacccggaat cgatcatgac gctcggccac aatgccggca tgcgcatcat cgagaacatc   2160
gtcgcccatt tgccgcgcaa ggccaaggaa aaggcagcct ga                      2202
<210>122
<211>2199
<212>DNA
<213>巴西固氮螺菌(Azospirillum brasilense)
<400>122
atgtaccccg ccgaccttct tgcctcgccc gacctcctcg aaccgctgcg tttccagacg     60
cgcggcggcg tcaccgtcac gcggcgggcg acggcgctcg acccgcggac cgccctcgac    120
ccggtgatcg acgcgctgga ccgccgccgc ggcctgctgc tgtccagcgg ggtggaggcg    180
ccgggccgct accgccgtca cgcgctgggc ttcaccgacc ccgcggtggc gctcacggcg    240
cgtgggcgga cgctgcgcat cgacgcgctg aacgggcggg ggcaagtgct gctgcccgcc    300
gtcgccgagg ccctgcgtgg cctggaggcc ctggccggtc tagaggaggc gccgtcgcgg    360
gtcactgcct cgtccgcaag cccagcaccc cttcccggag aggagcggag ccgccagccc    420
tccgttttct cggtcctgcg ggcggtgctg gatctgtttg ccgcccccga cgacccgttg    480
ctcgggctct acggggcctt cgcctacgac ctcgccttcc agttcgagcc gatccgccag    540
cggttggagc ggcccgacga ccagcgcgat ctgctgctct acctgccgga ccggctcgtc    600
gcgctggacc ccatcgcagg actcgcccgg ctcgtcgcgt atgagttcat cacggcggcg    660
ggcagcaccg aggggctgga gtgcggcggg cgcgaccacc cctaccgtcc cgacaccaac    720
gccgaggccg gctgcgacca cgcgcccggt gactatcagc gcgtcgtcga gagcgccaag    780
gccgccttcc gccgcggcga cctgttcgag gtggtgcccg gccagacctt cgccgagccc    840
tgcgccgacg cgccttcgtc ggtgttccgg cggctgcgcg ccgccaaccc ggcgccttac    900
gaggccttcg tcaacctcgg gcggggcgag ttcctcgtcg ccgccagccc ggagatgtat    960
gtgcgggtgg cgggcgggcg ggtggaaacc tgcccgatct ccggcaccgt ggcgcgcggg   1020
gccgacgcgc tgggcgacgc cgcgcaggtc ctgcgcctgc tgacctcggc caaggacgcg   1080
gcggagctga ccatgtgcac cgacgtggac cgcaacgaca aggcgcgggt gtgcgagccg   1140
ggatccgtcc gggtgatcgg gcggcggatg atcgagctgt actcccgtct gatccacacg   1200
gtggaccatg tggagggacg gctgcggtcc ggaatggacg cgctggacgc cttcctcacc   1260
cacagctggg cggtgacggt gaccggcgcg cccaagcgct gggccatgca gttcctggag   1320
gatacggagc aatcgccgcg ccgctggtac ggcggggcct tcggccggct gggcttcgac   1380
ggcgggatgg acaccggcct gaccctgcgc accatccgca tggccgaggg cgttgcctac   1440
gtgcgggcgg gggcgacgct gctgtccgac agcgatccgg acgcggagga cgcggagtgc   1500
cgcctgaagg ccgccgcctt ccgcgacgcc atccgcggga cggcggcggg tgcggcgccc   1560
acgctgccgg cggctccccg tggcggggag ggcaggcggg tgctgctggt ggatcacgac   1620
gacagcttcg tccacacgct ggccgactat ctgcgccaga cgggcgcttc ggtgacgacg   1680
ctgcgtcaca gtcacgcacg ggcggcgctg gcggagcgga ggccggatct ggtcgtgctg   1740
tcccccggtc cggggcgccc ggcggatttc gacgtggcgg gcaccatcga cgcggcgctg   1800
gcgctcggcc tgccggtgtt cggcgtctgc ctgggcctgc aagggatggt ggagcgcttc   1860
ggcggcgcgc tggacgtgct gccggagccc gtccacggca aggcgacgga ggtccgggtg   1920
ctgggcggcg cgctgttcgc cggcctgccg gagcggctga cggtcgggcg ctaccactct   1980
ctggtggccc ggcgcgaccg gctgccggcg gacctcacgg tgaccgcgga gaccgccgac   2040
ggtctggtga tggcggtcga gcaccggcgg cttccgctcg ccgccgtgca gttccacccc   2100
gagtcgatcc tgtcgctcga cggtggggcc ggtcttgccc tgctgggcaa cgtgatggac   2160
cggctggccg ccggcgccct gacggacgct gcggcttga                          2199
<210>123
<211>2196
<212>DNA
<213>马尔他布鲁氏菌(Brucella melitensis)
<400>123
atgaatgcga agactgcgga tagcgagata ttccagcacg aaacggcagg cggtatcatc     60
gtcgagcggg tgcgccacct cacggcctat aagggcgcca ttgaaagcta tatcgatgtg    120
ctgaacgaat ggcgcggtgc ggtgttctcg tccaattacg aatatccggg ccgctatacg    180
cgatgggata ccgcaattgt cgatccgccg gtcgtcatca cgtcgcgtgc ccgcacgatg    240
cgcatcgagg cgctgaacgc gcgcggcgtc atcctgcttc ggcccattct ggataccgtc    300
aaggcgcttt cggaagtaaa gatcgaccag tccggcgaaa accgtatcga tctgacgatt    360
gtggaaccgg tcggcacctt cacggaagaa gaacgctcgc gcatgccctc ggtctttacg    420
gtgctgcgcg ccatagtcgg gcttttcttc tcggaggagg atgccaatct cggcctttat    480
ggcgcctttg gctatgatct ggcgttccag ttcgatccca tccagtacaa gctgaagcgc    540
ccggacgacc agcgtgacct cgtgctgttc attcccgacg aaatcttcgt cgccgaccat    600
tatgcggcgc gcgcctgggt ggaccgttat gaatttcgct gcggcggttc gtccacgcac    660
ggtcttgatc gcgcgacgcc ggtggtgcct ttcaagccat cggagcgcaa gcttgcgcgc    720
ggcgatcata atccgggtga atatgccagg cttgtcgagc gcgccaagga aagcttcaag    780
cgcggcgacc tgttcgaggt tgtgccgggc cagaccttct atgagcgctg ccacacggcg    840
ccgtcggaga ttttccgccg gctgaagtcg atcaatcctt cgccctattc ctttttcatc    900
aatctgggcg agagcgaata tctggtcggc gcatcgccgg aaatgtttgt gcgcgtcaat    960
gggcggcgca tcgagacctg cccgatttcc ggcaccatca agcgcggtga agatgcaatt   1020
tcggattctg agcagatatt gaaactgctt aattccaaga aggacgaatc cgagctgacc   1080
atgtgttcgg atgtggaccg caacgacaag agccgcgttt gcgagccggg ttcggtgcgt   1140
gttatcggtc gccgccagat cgagatgtat tcccgcctga tccatacggt cgatcatatc   1200
gaaggccgcc tgcgtgacgg catggatgcg tttgacggct tcctcagcca tgcatgggct   1260
gtgacggtga caggcgcgcc gaagctgtgg gcaatgcgct ttcttgagga aaacgaacgc   1320
agcccgcgcg catggtatgg cggcgcgatc ggcatgatgc atttcaatgg cgatatgaat   1380
acagggctga cgctgcgcac catccgcatc aaggatggtg tggcggaaat ccgtgcaggg   1440
gcgacgcttc tgttcgattc caaccctgac gaggaagaag ccgagaccga attgaaggca   1500
tcggccatga ttgcggctgt gcgggacgca cagaagagca atcagatcgc ggaagaaagt   1560
gtggcggcaa aggtgggtga gggggtttcg atcctgctgg tcgatcacga ggattccttc   1620
gtccatacgc ttgccaatta tttccgccag acgggcgcca aggtttccac cgtgcgttca   1680
ccggtggcag aggagatatt cgaccgcgtc aatcccgatc tggtggtgtt atcgccggga   1740
ccgggctcgc cgcaggattt cgattgcaag gcgaccatcg ataaggcgcg caagcgccag   1800
cttccgattt ttggcgtctg cctcggcctt caggccctgg cggaagccta tggcggggcg   1860
ttgcgccagc ttcgcgttcc ggtgcatggc aagccttcac gcatccgcgt atcaaagccg   1920
gagcgcattt tctccggctt gccggaggaa gtgacggtgg ggcgttatca ttcgatcttc   1980
gccgatcctg aacgcctgcc ggatgatttt ctcgtcacag ccgaaacgga agacgggatc   2040
atcatggctt ttgaacataa acatgaaccg gtggcagccg ttcaattcca tcccgaatcc   2100
atcatgacgc ttggccataa tgccggtatg cgcatgatcg agaatatcgt gacgcatctt   2160
gcaggcaagc acaaggcgcg ccgcaccaac tattga                             2196
<210>124
<211>2148
<212>DNA
<213>念珠藻属(Nostoc sp.)
<400>124
gtgcgcgtat ctcgtagcac aaccgaggtg aagatggaca ctgcactaga tgaaattctc     60
tttcacctaa atcaagtacg tggaggtttg ttaaccagta gttacgaata tccagggcga    120
tacaaaagat gggcgattgg attcattaat cccccattac aactgacaac aagagagaac    180
gcatttacca tctcttcact caatcctcgc ggacaggtgc tactaccaac cttgttccag    240
catctatcag cccagtcgca actacaacaa atcagcctca atcatgacta catcacaggt    300
gaaattcgac ccacaaaaca gttattcaca gaagaacaac ggagtaaaca accgtcagcc    360
tttacagtca tccgcgaaat tctccagatt tttgcgagtg atgaagacga gcatttaggg    420
ttatatggtg catttggtta cgacttagta tttcaatttg aaccaattcc ccaaaaaatt    480
gctcgtcccg cagaccaacg ggatttagtc ctgtatctac ccgatgaact catagttgta    540
gattactatc tacaaaaagc atatcgtcac cagtatgaat ttgccacaga acatggcaac    600
accgagcatc ttccacggac aggccagtcc atcgactacc agggtaaaca tcttctacca    660
aaccaaactg ctgaccatca accaggagaa tatgccaacc tagttgagca agcactcgac    720
tacttccgcc ggggtgactt atttgaagta gttcctagtc aaaacttttt tacagcctgt    780
gaacaatcac ccagtcaact attccagacc ttaaggcaaa ttaatcctag tccttatgga    840
tttctgttga atttgggtgg tgaatatctc ataggtgcat caccagaaat gtttgtgcga    900
gttgatggta ggcgagtgga aacctgtccc attagtggca ctattagacg gggagaagat    960
gctttaggcg acgctgtaca aattcgtcag ttgcttaact cccataaaga tgaagccgag   1020
ttaacaatgt gtactgacgt agaccgcaac gataaatcgc ggatttgtga acccggttca   1080
gtcagggtga ttggtcgtcg ccagattgaa ctgtacagcc acctcattca tacagtagac   1140
catgtagaag ggatactgag gccggaattt gacgctttag atgccttctt gagtcatact   1200
tgggcagtta cagtcacagg cgcacccaaa cgagccgcca tgcagttcat cgaacagcat   1260
gaacgcagcg cccgtcgttg gtatggggga gcagttggtt atttaggctt taatggtaac   1320
ttgaataccg gattaacctt gcggacaatt cgtttacaag actccatcgc cgaagtgcga   1380
gttggtgcaa cagtccttta cgactccatt ccgtcagccg aagaagagga aacaattact   1440
aaagcgactg cattatttga gaccattcgc cgtcatacca ctgccaataa aactcaagga   1500
aacgatagtc atcgccctgg ggatatcgcc cacaataagc gtatcctcct catcgactac   1560
gaagattcat ttgttcacac attagccaat tacatccgca ccaccggcgc aaccgtcacc   1620
accctacgtc atggttttgc tgaatcatat tttgatgcag aacgcccaga cttagtggta   1680
ttgtctcccg gccctggtag acccagtgac ttccgagttc cccaaacggt tgcagccttg   1740
gtaggtcgag aaatccccat ttttggcgtt tgtctgggat tacaaggcat agtggaagct   1800
tttggcggag aattaggcgt gcttgattat ccccaacacg gtaaacccgc acggatttca   1860
gtgactgcac ctgattctgt gctgtttcaa aatttaccag catccttcat cgtgggtaga   1920
taccattcct tatttgccca accccaaact atacccggtg aactcaaagt cacagcgatt   1980
tctgaggaca atgtaattat ggcaattgaa caccaaacac tacctatagc cgccgtccaa   2040
tttcatccag agtcaatcat gaccctagca ggagaagttg gtcagacaat cattaaaaat   2100
gtggtgcaga catataccca aactttagaa acatcaattt actcttag                2148
<210>125
<211>2208
<212>DNA
<213>念珠藻属(Nostoc sp.)
<400>125
atgattgccg attcccacag ctacagaact aatggtaacg tgcgtgtctc tcgctccatc     60
acacaagtta aaatggagac agctttagaa gagattcttt tctacttaaa ctctcagcgt    120
ggtggattgc tgactagtag ctatgaatat ccaggaagat ataaaagatg ggcaattggt    180
tttgttaatc cacctgtaga attatccaca agcggaaata cttttactct cacagcatta    240
aatgagcgtg gctatgtact tttaccagtg atctttgagt gtttatcaaa atcagaacaa    300
ctccagaaac tcactgaaca tcatcataaa attactggat tagttaaatc tacaccagaa    360
ttttttgccg aagaagaacg tagtaaacaa ccttctacat ttacggttat tcgggaaata    420
ctacatatct tctctagtca agaagacgaa catttaggat tatatggtgc gtttggttat    480
gacttagttt tccaatttga gcaaataacc caatgcttag aacgtccaca agaccaacga    540
gatttagttc tatatttacc cgacgaattg atagttgtag actactatca acaacaagca    600
tttcggctag agtatgactt catcacagcg catggtagta cttatgattt gccccgcacg    660
ggagaatctg ttgattatcg aggtcaatgt ttaacacctc ctcaaaatgc tgaccataaa    720
ataggtgagt atgccaaact agtagaattt gcccttgatt atttccgtcg gggtgactta    780
tttgaagtgg ttcccagtca gaattttttc acagcttgcg aagcaccacc aagccaacta    840
tttgaaactt taaaacaaat aaatcctagt ccctatggat ttatttttaa tcttggtgga    900
gaatacatca ttggcgcttc accagaaatg tttgtacggg tggaaggtag gcgtgtagaa    960
acttgtccta ttagtggcac tattactaga gggcatgatg ctatagatga tgctgtgcag   1020
attcgtcagt tactcaactc ccacaaagac gaagcagagt tgactatgtg tactgacgta   1080
gaccgtaacg ataagtctcg catctgtgaa cccggttcag tcaaggtgat tggtcgccgg   1140
caaattgaat tatatagcca cttaattcat acggtagacc atgtagaagg cattctccga   1200
ccagagtttg atgctttaga tgctttcctc agtcacactt gggctgttac agtcacaggc   1260
gcaccgaaaa gggctgctat tcaattcatc gaaaagaacg aacgcagcgt cagacgttgg   1320
tatggtggcg cggttgggta tttgaatttt aacgggaatt taaatactgg gttaatttta   1380
aggacaatca gattgcaaga ctcaattgct gaagtgcgag ttggtgctac tctactgtat   1440
gactccatac cccaagcaga agaacaagaa accatcacta aagctgcggc tgcttttgaa   1500
acgattcggc gtgctaaaca aatagaccca cagattgaag aatctagtac tagaaagtta   1560
agcaaatatc ttcccgatgg acaatcaggt aaacacatct tactaattga ccatgaagac   1620
tcatttgttc ataccctagc taactacatc cgttccactg gtgcaactgt caccacactg   1680
cgtcacggct tctcagaatc cctatttgat acagaacgcc cagacttagt agtattatct   1740
cctggccccg gtagaccgag tgaatttaaa gtacaggaaa ccgtcgccgc ctgcgtccgt   1800
cgccaaatac ctctgtttgg tgtctgttta ggactgcaag gtattgtgga agctttcggt   1860
ggagaattgg gagtattgaa ttatccccaa catggtaaat cttcgcggat ttttgttaca   1920
gcacccgatt ctgtgatgtt tcaagatttg cccgaatctt ttacagtcgg gagatatcat   1980
tcattatttg cactatcaca acgcttacca aaagaactga aggtgacagc gatttctgat   2040
gatgaggtga ttatggcgat tgaacatcag acactaccta tcgccgccgt ccagtttcat   2100
ccagaatcaa tcatgactct agctggagaa gttggtttaa tgatgatcaa aaatgtggtg   2160
caaaaatata cacaaagtca acagtcaaca gttcccatct atgactaa                2208
<210>126
<211>2160
<212>DNA
<213>血色红假单胞菌(Rhodopseudomonas palustris)
<400>126
atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc     60
gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat    120
ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac    180
gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa    240
ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag    300
cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc    360
gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc    420
ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac    480
ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc    540
gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc    600
gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc    660
ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc    720
gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc    780
ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg    840
gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat    900
ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc    960
cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc   1020
gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg   1080
tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt   1140
ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag   1200
ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc   1260
accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc   1320
ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc   1380
ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc   1440
acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg   1500
gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac   1560
gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg   1620
ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc   1680
ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg   1740
ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc   1800
ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag   1860
ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg   1920
cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc   1980
gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc   2040
gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc   2100
ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa   2160
<210>127
<211>2166
<212>DNA
<213>大豆慢生根瘤菌(Bradyrhizobium japonicum)
<400>127
atgaacagga cagtctttgc cctcccggcc agaagcgatt acgtgacccg cggcggtctc     60
gcgatcacgc gcgtggcgga gcagtttacc ggcggcgcga gccggctcga cgatctcgtc    120
aacctgctcg accgccgccg cggcgtggtg ctgtcctcgg gcacgaccgt gccgggccgc    180
tacgagagct tcgacctcgg cttctccgat ccgccgctca agctcgagac cacaggcgtc    240
aatttcaagc tggaagccct gaacgagcgc ggccaggtgc tgatcgcctt ccttgccgat    300
gtcctgcgcg agccctgcgt ggtgatatcc gaaaagaccg cttcgcgcct cgccggccac    360
atcatccgcg gcgatgcccc ggtcgaggaa gaccagcgca cccggcgcgc cagcgtggtg    420
tcgctggtgc gcgacctcgt cgccgccttc tccgccaatg acgacgggct gctcggcctg    480
ttcggcgcct tcgcctacga tctcgtgttc cagatcgagg atctcgtgca gaagcgcgcg    540
cgcgagagcg accagcgcga catcgtgctc tacgttcccg atcgcctgct ggcctatgac    600
cgcgccaccg gccgcggcgt cgtgctcagc tacgacttca cgtggaaggg cagatccacc    660
gagggcctgc cgcgcgagac cgccgacagc ccgtacatga agacaccgcg ccagggcttt    720
gccgatcatg cgcccggcga ataccaggcc accgtcgaga ccgcgcgcgc ggcctttgcc    780
cgcggcgatc tgttcgaggc cgtgccgggc cagctgttcg ccgagccctg cgatcgttct    840
ccggcggaag tgttccagcg cctctgtgtc atcaacccgt cgccctacgg cgcgctgatg    900
aatctcggcg acggcgagtt tctcgtctcc gcctcgcccg agatgttcgt gcgttcggac    960
ggccgccgcg tcgagacctg cccgatctcg ggcaccatcg cgcgcggcac cgatgcgatc   1020
ggcgatgccg agcagatccg ccagctcctg aattcggaga aggacgagtt cgagctcaac   1080
atgtgcaccg acgttgatcg caacgacaag gcgcgcgtct gcgtccccgg caccatcaag   1140
gtgctggcgc gccggcagat cgagacctac tcaaaactgt tccacaccgt cgaccacgtc   1200
gagggcatgc tgcgtcccgg cttcgacgcg ctcgatgcct tcctcaccca tgcctgggcc   1260
gtcaccgtga caggtgcgcc gaagctctgg gcgatgcagt tcgtcgagga tcacgagcgg   1320
tcgccgcggc gctggtatgc gggtgcgatc ggcgcggtga atttcgacgg cagcatcaat   1380
accggcctca ccatccgcac catccgcatg aaggatggtc tcgccgaggt gcgcgtcggc   1440
gccacctgcc tgttcgattc cgatcccgct gccgaggacc gcgaatgcca ggtcaaggcg   1500
gcggcgctgt tccaggcgct gcgcggcgat ccgccaaaac cgctctcgac ctttgcgccc   1560
gatgcgaccg gaagcggcaa gcgggtgctg ctgatcgacc acgacgacag cttcgtgcac   1620
atgctcgccg actatttccg ccaggtcggc gccagcgtca ccgtggtccg ctatgtgcat   1680
gcgctcgaca tgctcaagca gaagaggtgg gatttgctgg tgctgtcgcc cggcccgggc   1740
aggcccgaag atttcgggat caggaagacg atcgatgcgg cgctggagaa caagctgccg   1800
gtgttcggcg tctgcctcgg cgtgcaggcg atcggcgaat attttggcgg cgagctcggc   1860
cagctcacgc atcccgccca cggccggccc tcgcgggtgc aggtgcgcgg cggccgcctg   1920
atgcgcaatt tgccgagcga gatcgtgatc ggccgctatc actcgctcta tgtcgagcgc   1980
gacagcatgc cggaggtttt gtccgtcacc gccagcaccg aggacggcgt cgctatggcg   2040
ctggagcaca agaccctgcc ggtcgcgggc gtgcaattcc acccggagtc gctgatgtcg   2100
ctcggcggcg aggtgggctt gaggattgtc gagaacgcgt tccggctgga tgcgcgtgtt   2160
gattga                                                              2166
<210>128
<211>2187
<212>DNA
<213>深红红螺菌(Rhodospirillum rubrum)
<400>128
atgcaaacat cgaccttcac caccgccggc ggttttacca tcagcagttg cctacgcccg     60
cttgccgggg cggatggcgc cttcgaggcg ctgatcgacc gactcgatcg ccatcgcggc    120
atggtgatcg cctcgaccta tgagtatccc ggccgctatc gccgccacgc cctggggttt    180
tgcgatccgc cgctggtgct ggagggcaag gggcgcgagg cccatctgct ggcgctcaat    240
cgccgggggc gggccctgct gccggccctg gccgttggct tggagggggc ggccgggctg    300
gagggcctgc gccgcgaggc cgaccggctg gtcttgcgtg tcaaggccat ggcgccctgg    360
ttccccgagg aggagcgctc gcgccaaccc tcgctgatgt cggtggtgcg cgccctcgcc    420
gggctgttcg ccgccgaaaa cgacccgttt ttcgggcttg tcggcgcctt tggctatgac    480
ctgggcttgg ctttcgagcg cctgccccat gcccggccgc gatcggccga tcaccgcgat    540
ctggtgcttt acctgcccga ccgtctgctg atcgacgatc ccgaagccgg cggccttgcc    600
gaacgccttt acgacatcac cgcggccgat ggggcaagca ccgccggctt ggcgcgggaa    660
accgccgctt acaccgccga ccaccccgcc ggcggcgtgc cgatcgagga tgatatgccc    720
ccgggcgctt acggggcgat cgtccgtggg ctgaaggagg ccttcgccgc cggggatctg    780
ttcgaggcgg tgccctcgcg cgccctgcgc cggccttgcg ccgaggcgcc gagccgtttg    840
taccggcggc tgcgcgcggc caatccggcg ccctatctgt tcctggccaa tctgggggcg    900
ggcgaacatc tgatcggcgc ctcgcccgaa atgttcgtgc gcgtcggtgg agcgccgggg    960
gcgcggcggg tggaaacctg cccgatctcg ggcaccatcg cccgggggcc cgacgccctg   1020
ggcgatgccg aggccatccg caccctgctc aattcgacca aggacgaggc cgaattgacc   1080
atgtgcaccg atgtcgaccg caacgacaag gcgcgggtct gcgtggccgg cagcgttacc   1140
gtcatcggtc gccgccagat cgagctatat tcccggctga tccacacggt cgaccatgtg   1200
gagggccggc tgcgccccga gcttgacgcc cttgacgcct ttctcagcca ctgctgggcg   1260
gtgacggtga ccggagcgcc caagcgcgcc gccatggccg ccgtcgaagc cgtggagcgg   1320
gcgccgcgcg cctggtatgg cggcgccatc ggccgcctgg gcttcgacgg taccctcgac   1380
accggactgg tgctgcgcac catccgcctg cgtcacggcg tcgccgaggt gcgggtgggg   1440
gcgacgctgc tccaccgttc cgatcccgag gaggaggagg ccgaaaccct gctcaaggcc   1500
tcggccctgc tcgccctgct cgatgccacc accccggcca agccgaatgc cccgcatctt   1560
ccgttgcgcg gccgggcgcc gcgcgtgctg gtcatcgacc acgaggacag cttcgtccat   1620
accctggcgt cttatctgcg caatgccggg gccgagacca ccgtgctgcg ctgggacgtg   1680
ccggcggcgg tgcgcgccgg cgtcgaggcc gatctgctgg tgctgtcgcc gggaccgggc   1740
acgccgtcgc gcttcgccct gggggccagc ctggactggg cggtggcgcg cggcttgccg   1800
gtcttcggcg tctgcctggg gctgcagggc atcgtcgaac aggccggggg ccgccttgcc   1860
cggctggcgg ttcccgccca tggcatggcc tcgacgctgc ggctggtcgc ccccggggac   1920
ccgctgttcg ccggcctgcc cacgaccatg agagtgggcc gctaccacag cctgcacgcc   1980
gagcgcgcca gcctgcccga cagcctggag atcctggccg aaagcgacga cggggtgatc   2040
atggcgctgc gccaccgcct gctgcccttc agcgccgtgc aattccaccc cgaaagcctg   2100
atgaccctgg acggcggcgc cggaccccga ttgatcgcca atcttctgga aaccctaagc   2160
gtcccgcgaa cgcgccacgc cgcctaa                                       2187
<210>129
<211>2181
<212>DNA
<213>Thermobifida fusca
<400>129
gtggacgaca actcctacac caccagtggt ggtatcaccg tgcaccgcac ggcagtgccg     60
tgcgatcccc gtgcgctcgc cgatctgacg gtcaacgtgg aacagcgccg aggcggcgtg    120
ctctcctccg ggatggagta tcccggccgc tacagccgtt ggcatttggg atacgtggac    180
ccgtgcctgg aagttgtcgc gcgcggccgc acgatcgggg cgacggccct caacgaccgc    240
ggccgtgtcc tgctgcccgc ggtagcccgg gcgctcaccg cgcacggcgc ggtggtggag    300
cacaccgacg acacggtcgc tgtcacggtc cctgaaccgg atcccaccga gttcttcact    360
gaggaagagc gcagccgccg gctcagtgtt ttttctgcgc tccgcgccct cgtgggcgtg    420
ttcttccacg cggaagaacc ccacctgggg ttgtacgggg cgttcggcta cgatctggcg    480
ttccagttcg aaccgatcga gcaggtgctg ccgcgcgacc cggaggaccg ggacctggtg    540
ttgcacctgc ccgacgagat catcgtccac gaccggaaac gggagatctg ccagcgctac    600
tcctacgact tcacgctgcc ggaggagttg cgcggcccgg caggggcgac cacgcggggc    660
ctgccacgcc acaccgagcc cacacccccg gtgaccccgg ctgccgaggt gccgccgcag    720
ccggaacccg ggtcgtatgc gcggatcgtg gctgaggcca aggagcggtt ccgccgcggc    780
gacttgttcg aagtggtgcc cagccaccgc ttgtacgcgc cgtgtgcgtc gcctgcgcgg    840
ttctacgagc ggctgcggga acgcaaccct gccccgtacg agttcttcct caacctgggg    900
gagggcgagt acctggtcgg cgcgtccccg gaaatgtttg tgcgggtcac gggccgtccc    960
ggagaggggc agcgggtgga gacctgcccg atctccggca cgatcaagcg tggcgcggac   1020
gcggtcggcg acgcggagaa catcaaggag ctgctgtcgt ccgcgaagga agagtcggag   1080
ctgaccatgt gcaccgacgt ggaccgcaac gacaagtccc gggtgtgcgt gccaggcagt   1140
gtgcgggtga tcggccgccg gcagatcgaa atgtacagtc ggctcatcca cacggtcgac   1200
cacattgagg ggattctgcg ccccgagttg gacgctattg acgcgttcct cacccacatg   1260
tgggcggtga ccgtgacggg ggcgccgaag acgtgggcga tgcggttcat cgaacagcat   1320
gagagttcgc cgcgccgctg gtatgggggc gcggtcggtg tcatcaattt tgatggttcg   1380
atgaacaccg ggttgacgtt gcggaccgcg cacatccggg acggggtggc gacggtgcgg   1440
gcgggcgcca cactgctgta cgactctgat ccggaagctg aagagcggga gactttcctc   1500
aaagcccgtg ccctgttgga gaccctcacc gacgagggtg aggaaacctc caaggctgcg   1560
cctgcggtgg agcaggtggg ggcggggatg cgggtgctgc tcgtcgacca cgaagactcg   1620
ttcgtcaaca cgctcgcgga ctacgtccgg cggcacggcg ccgaggtcac cacggtgcgc   1680
tacgggttcg acccggccct gctcgaccag atgcgtcccg acctggtggt gctctccccg   1740
gggccggggc tgcccgccga tttcgcgatg agcgcgctgt tgaaggagtt ggacgcgcgc   1800
ggcctgcctg tgttcggggt gtgcctgggg ctgcaggcga tggtggagta cgcgggcggg   1860
gagctgctca ctttggacac gccggtgcac ggtaaacccg gccgggttcg ggtcaccggg   1920
ggcgcgctgc tggctgggct gggagaggac ggggagttca ccgcggcccg ctaccactcc   1980
gtgtacgcga ccccggaccg ggtgaaaggg ttcgaggtga cggcggtgac ggaggacgac   2040
ggtttccccg tggtcatggc gatcgagaat gctgaggcgc ggcggtgggc ggtccagttc   2100
caccccgagt cgatcctcac cggccgggtg ggggagcaga tcgtggcgaa cgtgctgcgc   2160
ttggccaggg agagcagctg a                                             2181
<210>130
<211>721
<212>PRT
<213>大豆慢生根瘤菌(Bradyrhizobium japonicum)
<400>130
Met Asn Arg Thr Val Phe Ala Leu Pro Ala Arg Ser Asp Tyr Val Thr
1               5                   10                  15
Arg Gly Gly Leu Ala Ile Thr Arg Val Ala Glu Gln Phe Thr Gly Gly
            20                  25                  30
Ala Ser Arg Leu Asp Asp Leu Val Asn Leu Leu Asp Arg Arg Arg Gly
        35                  40                  45
Val Val Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe
    50                  55                  60
Asp Leu Gly Phe Ser Asp Pro Pro Leu Lys Leu Glu Thr Thr Gly Val
65                  70                  75                  80
Asn Phe Lys Leu Glu Ala Leu Asn Glu Arg Gly Gln Val Leu Ile Ala
                85                  90                  95
Phe Leu Ala Asp Val Leu Arg Glu Pro Cys Val Val Ile Ser Glu Lys
            100                 105                 110
Thr Ala Ser Arg Leu Ala Gly His Ile Ile Arg Gly Asp Ala Pro Val
        115                 120                 125
Glu Glu Asp Gln Arg Thr Arg Arg Ala Ser Val Val Ser Leu Val Arg
    130                 135                 140
Asp Leu Val Ala Ala Phe Ser Ala Asn Asp Asp Gly Leu Leu Gly Leu
145                 150                 155                 160
Phe Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Ile Glu Asp Leu Val
                165                 170                 175
Gln Lys Arg Ala Arg Glu Ser Asp Gln Arg Asp Ile Val Leu Tyr Val
            180                 185                 190
Pro Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Val
        195                 200                 205
Leu Ser Tyr Asp Phe Thr Trp Lys Gly Arg Ser Thr Glu Gly Leu Pro
    210                 215                 220
Arg Glu Thr Ala Asp Ser Pro Tyr Met Lys Thr Pro Arg Gln Gly Phe
225                 230                 235                 240
Ala Asp His Ala Pro Gly Glu Tyr Gln Ala Thr Val Glu Thr Ala Arg
                245                 250                 255
Ala Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu
            260                 265                 270
Phe Ala Glu Pro Cys Asp Arg Ser Pro Ala Glu Val Phe Gln Arg Leu
        275                 280                 285
Cys Val Ile Asn Pro Ser Pro Tyr Gly Ala Leu Met Asn Leu Gly Asp
    290                 295                 300
Gly Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp
305                 310                 315                 320
Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly
                325                 330                 335
Thr Asp Ala Ile Gly Asp Ala Glu Gln Ile Arg Gln Leu Leu Asn Ser
            340                 345                 350
Glu Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg
    370                 375                 380
Arg Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val
385                 390                 395                 400
Glu Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Gln Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly
        435                 440                 445
Ala Ile Gly Ala Val Asn Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr
    450                 455                 460
Ile Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly
465                 470                 475                 480
Ala Thr Cys Leu Phe Asp Ser Asp Pro Ala Ala Glu Asp Arg Glu Cys
                485                 490                 495
Gln Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Pro
            500                 505                 510
Lys Pro Leu Ser Thr Phe Ala Pro Asp Ala Thr Gly Ser Gly Lys Arg
        515                 520                 525
Val Leu Leu Ile Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp
    530                 535                 540
Tyr Phe Arg Gln Val Gly Ala Ser Val Thr Val Val Arg Tyr Val His
545                 550                 555                 560
Ala Leu Asp Met Leu Lys Gln Lys Arg Trp Asp Leu Leu Val Leu Ser
                565                 570                 575
Pro Gly Pro Gly Arg Pro Glu Asp Phe Gly Ile Arg Lys Thr Ile Asp
            580                 585                 590
Ala Ala Leu Glu Asn Lys Leu Pro Val Phe Gly Val Cys Leu Gly Val
        595                 600                 605
Gln Ala Ile Gly Glu Tyr Phe Gly Gly Glu Leu Gly Gln Leu Thr His
    610                 615                 620
Pro Ala His Gly Arg Pro Ser Arg Val Gln Val Arg Gly Gly Arg Leu
625                 630                 635                 640
Met Arg Asn Leu Pro Ser Glu Ile Val Ile Gly Arg Tyr His Ser Leu
                645                 650                 655
Tyr Val Glu Arg Asp Ser Met Pro Glu Val Leu Ser Val Thr Ala Ser
            660                 665                 670
Thr Glu Asp Gly Val Ala Met Ala Leu Glu His Lys Thr Leu Pro Val
        675                 680                 685
Ala Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu
    690                 695                 700
Val Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Asp Ala Arg Val
705                 710                 715                 720
Asp
<210>131
<211>728
<212>PRT
<213>深红红螺菌(Rhodospirillum rubrum)
<400>131
Met Gln Thr Ser Thr Phe Thr Thr Ala Gly Gly Phe Thr Ile Ser Ser
1               5                   10                  15
Cys Leu Arg Pro Leu Ala Gly Ala Asp Gly Ala Phe Glu Ala Leu Ile
            20                  25                  30
Asp Arg Leu Asp Arg His Arg Gly Met Val Ile Ala Ser Thr Tyr Glu
        35                  40                  45
Tyr Pro Gly Arg Tyr Arg Arg His Ala Leu Gly Phe Cys Asp Pro Pro
    50                  55                  60
Leu Val Leu Glu Gly Lys Gly Arg Glu Ala His Leu Leu Ala Leu Asn
65                  70                  75                  80
Arg Arg Gly Arg Ala Leu Leu Pro Ala Leu Ala Val Gly Leu Glu Gly
                85                  90                  95
Ala Ala Gly Leu Glu Gly Leu Arg Arg Glu Ala Asp Arg Leu Val Leu
            100                 105                 110
Arg Val Lys Ala Met Ala Pro Trp Phe Pro Glu Glu Glu Arg Ser Arg
        115                 120                 125
Gln Pro Ser Leu Met Ser Val Val Arg Ala Leu Ala Gly Leu Phe Ala
    130                 135                 140
Ala Glu Asn Asp Pro Phe Phe Gly Leu Val Gly Ala Phe Gly Tyr Asp
145                 150                 155                 160
Leu Gly Leu Ala Phe Glu Arg Leu Pro His Ala Arg Pro Arg Ser Ala
                165                 170                 175
Asp His Arg Asp Leu Val Leu Tyr Leu Pro Asp Arg Leu Leu Ile Asp
            180                 185                 190
Asp Pro Glu Ala Gly Gly Leu Ala Glu Arg Leu Tyr Asp Ile Thr Ala
        195                 200                 205
Ala Asp Gly Ala Ser Thr Ala Gly Leu Ala Arg Glu Thr Ala Ala Tyr
    210                 215                 220
Thr Ala Asp His Pro Ala Gly Gly Val Pro Ile Glu Asp Asp Met Pro
225                 230                 235                 240
Pro Gly Ala Tyr Gly Ala Ile Val Arg Gly Leu Lys Glu Ala Phe Ala
                245                 250                 255
Ala Gly Asp Leu Phe Glu Ala Val Pro Ser Arg Ala Leu Arg Arg Pro
            260                 265                 270
Cys Ala Glu Ala Pro Ser Arg Leu Tyr Arg Arg Leu Arg Ala Ala Asn
        275                 280                 285
Pro Ala Pro Tyr Leu Phe Leu Ala Asn Leu Gly Ala Gly Glu His Leu
    290                 295                 300
Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Gly Gly Ala Pro Gly
305                 310                 315                 320
Ala Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly
                325                 330                 335
Pro Asp Ala Leu Gly Asp Ala Glu Ala Ile Arg Thr Leu Leu Asn Ser
            340                 345                 350
Thr Lys Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ala Arg Val Cys Val Ala Gly Ser Val Thr Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Leu Tyr Ser Arg Leu Ile His Thr Val Asp His Val
385                 390                 395                 400
Glu Gly Arg Leu Arg Pro Glu Leu Asp Ala Leu Asp Ala Phe Leu Ser
                405                 410                 415
His Cys Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met
            420                 425                 430
Ala Ala Val Glu Ala Val Glu Arg Ala Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Arg Leu Gly Phe Asp Gly Thr Leu Asp Thr Gly Leu Val
    450                 455                 460
Leu Arg Thr Ile Arg Leu Arg His Gly Val Ala Glu Val Arg Val Gly
465                 470                 475                 480
Ala Thr Leu Leu His Arg Ser Asp Pro Glu Glu Glu Glu Ala Glu Thr
                485                 490                 495
Leu Leu Lys Ala Ser Ala Leu Leu Ala Leu Leu Asp Ala Thr Thr Pro
            500                 505                 510
Ala Lys Pro Asn Ala Pro His Leu Pro Leu Arg Gly Arg Ala Pro Arg
        515                 520                 525
Val Leu Val Ile Asp His Glu Asp Ser Phe Val His Thr Leu Ala Ser
    530                 535                 540
Tyr Leu Arg Asn Ala Gly Ala Glu Thr Thr Val Leu Arg Trp Asp Val
545                 550                 555                 560
Pro Ala Ala Val Arg Ala Gly Val Glu Ala Asp Leu Leu Val Leu Ser
                565                 570                 575
Pro Gly Pro Gly Thr Pro Ser Arg Phe Ala Leu Gly Ala Ser Leu Asp
            580                 585                 590
Trp Ala Val Ala Arg Gly Leu Pro Val Phe Gly Val Cys Leu Gly Leu
        595                 600                 605
Gln Gly Ile Val Glu Gln Ala Gly Gly Arg Leu Ala Arg Leu Ala Val
    610                 615                 620
Pro Ala His Gly Met Ala Ser Thr Leu Arg Leu Val Ala Pro Gly Asp
625                 630                 635                 640
Pro Leu Phe Ala Gly Leu Pro Thr Thr Met Arg Val Gly Arg Tyr His
                645                 650                 655
Ser Leu His Ala Glu Arg Ala Ser Leu Pro Asp Ser Leu Glu Ile Leu
            660                 665                 670
Ala Glu Ser Asp Asp Gly Val Ile Met Ala Leu Arg His Arg Leu Leu
        675                 680                 685
Pro Phe Ser Ala Val Gln Phe His Pro Glu Ser Leu Met Thr Leu Asp
    690                 695                 700
Gly Gly Ala Gly Pro Arg Leu Ile Ala Asn Leu Leu Glu Thr Leu Ser
705                 710                 715                 720
Val Pro Arg Thr Arg His Ala Ala
                725
<210>132
<211>726
<212>PRT
<213>Thermobifida fusca
<400>132
Val Asp Asp Asn Ser Tyr Thr Thr Ser Gly Gly Ile Thr Val His Arg
1               5                   10                  15
Thr Ala Val Pro Cys Asp Pro Arg Ala Leu Ala Asp Leu Thr Val Asn
            20                  25                  30
Val Glu Gln Arg Arg Gly Gly Val Leu Ser Ser Gly Met Glu Tyr Pro
        35                  40                  45
Gly Arg Tyr Ser Arg Trp His Leu Gly Tyr Val Asp Pro Cys Leu Glu
    50                  55                  60
Val Val Ala Arg Gly Arg Thr Ile Gly Ala Thr Ala Leu Asn Asp Arg
65                  70                  75                  80
Gly Arg Val Leu Leu Pro Ala Val Ala Arg Ala Leu Thr Ala His Gly
                85                  90                  95
Ala Val Val Glu His Thr Asp Asp Thr Val Ala Val Thr Val Pro Glu
            100                 105                 110
Pro Asp Pro Thr Glu Phe Phe Thr Glu Glu Glu Arg Ser Arg Arg Leu
        115                 120                 125
Ser Val Phe Ser Ala Leu Arg Ala Leu Val Gly Val Phe Phe His Ala
    130                 135                 140
Glu Glu Pro His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ala
145                 150                 155                 160
Phe Gln Phe Glu Pro Ile Glu Gln Val Leu Pro Arg Asp Pro Glu Asp
                165                 170                 175
Arg Asp Leu Val Leu His Leu Pro Asp Glu Ile Ile Val His Asp Arg
            180                 185                 190
Lys Arg Glu Ile Cys Gln Arg Tyr Ser Tyr Asp Phe Thr Leu Pro Glu
        195                 200                 205
Glu Leu Arg Gly Pro Ala Gly Ala Thr Thr Arg Gly Leu Pro Arg His
    210                 215                 220
Thr Glu Pro Thr Pro Pro Val Thr Pro Ala Ala Glu Val Pro Pro Gln
225                 230                 235                 240
Pro Glu Pro Gly Ser Tyr Ala Arg Ile Val Ala Glu Ala Lys Glu Arg
                245                 250                 255
Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser His Arg Leu Tyr
            260                 265                 270
Ala Pro Cys Ala Ser Pro Ala Arg Phe Tyr Glu Arg Leu Arg Glu Arg
        275                 280                 285
Asn Pro Ala Pro Tyr Glu Phe Phe Leu Asn Leu Gly Glu Gly Glu Tyr
    290                 295                 300
Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Thr Gly Arg Pro
305                 310                 315                 320
Gly Glu Gly Gln Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys
                325                 330                 335
Arg Gly Ala Asp Ala Val Gly Asp Ala Glu Asn Ile Lys Glu Leu Leu
            340                 345                 350
Ser Ser Ala Lys Glu Glu Ser Glu Leu Thr Met Cys Thr Asp Val Asp
        355                 360                 365
Arg Asn Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Arg Val Ile
    370                 375                 380
Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp
385                 390                 395                 400
His Ile Glu Gly Ile Leu Arg Pro Glu Leu Asp Ala Ile Asp Ala Phe
                405                 410                 415
Leu Thr His Met Trp Ala Val Thr Val Thr Gly Ala Pro Lys Thr Trp
            420                 425                 430
Ala Met Arg Phe Ile Glu Gln His Glu Ser Ser Pro Arg Arg Trp Tyr
        435                 440                 445
Gly Gly Ala Val Gly Val Ile Asn Phe Asp Gly Ser Met Asn Thr Gly
    450                 455                 460
Leu Thr Leu Arg Thr Ala His Ile Arg Asp Gly Val Ala Thr Val Arg
465                 470                 475                 480
Ala Gly Ala Thr Leu Leu Tyr Asp Ser Asp Pro Glu Ala Glu Glu Arg
                485                 490                 495
Glu Thr Phe Leu Lys Ala Arg Ala Leu Leu Glu Thr Leu Thr Asp Glu
            500                 505                 510
Gly Glu Glu Thr Ser Lys Ala Ala Pro Ala Val Glu Gln Val Gly Ala
        515                 520                 525
Gly Met Arg Val Leu Leu Val Asp His Glu Asp Ser Phe Val Asn Thr
    530                 535                 540
Leu Ala Asp Tyr Val Arg Arg His Gly Ala Glu Val Thr Thr Val Arg
545                 550                 555                 560
Tyr Gly Phe Asp Pro Ala Leu Leu Asp Gln Met Arg Pro Asp Leu Val
                565                 570                 575
Val Leu Ser Pro Gly Pro Gly Leu Pro Ala Asp Phe Ala Met Ser Ala
            580                 585                 590
Leu Leu Lys Glu Leu Asp Ala Arg Gly Leu Pro Val Phe Gly Val Cys
        595                 600                 605
Leu Gly Leu Gln Ala Met Val Glu Tyr Ala Gly Gly Glu Leu Leu Thr
    610                 615                 620
Leu Asp Thr Pro Val His Gly Lys Pro Gly Arg Val Arg Val Thr Gly
625                 630                 635                 640
Gly Ala Leu Leu Ala Gly Leu Gly Glu Asp Gly Glu Phe Thr Ala Ala
                645                 650                 655
Arg Tyr His Ser Val Tyr Ala Thr Pro Asp Arg Val Lys Gly Phe Glu
            660                 665                 670
Val Thr Ala Val Thr Glu Asp Asp Gly Phe Pro Val Val Met Ala Ile
        675                 680                 685
Glu Asn Ala Glu Ala Arg Arg Trp Ala Val Gln Phe His Pro Glu Ser
    690                 695                 700
Ile Leu Thr Gly Arg Val Gly Glu Gln Ile Val Ala Asn Val Leu Arg
705                 710                 715                 720
Leu Ala Arg Glu Ser Ser
                725
<210>133
<211>281
<212>PRT
<213>高粱(Sorghum bicolor)
<400>133
Met Val Cys Ser Gln Leu Thr Ala Ala Gly Ala Ser Ser Leu Ala Ala
1               5                   10                  15
Ala Ala Val Arg Ser Arg Ala His Ser Pro Ala Ala Ala Phe Ala Gln
            20                  25                  30
Leu Arg Ser Thr Pro Arg Ile Ala Ser Ala Gly Leu Ser Val Lys Gly
        35                  40                  45
Asn Arg Ala Ala Leu Pro Leu Val Ala Ala Ala Gly Pro Ala Ala Ala
    50                  55                  60
Ala Pro Val Ala Asp Leu Asp Gly Pro Pro Ala Thr Glu Lys Gln Pro
65                  70                  75                  80
Ile lle Val Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Ash Leu Cys Gln
                85                  90                  95
Tyr Met Gly Glu Leu Gly Leu Asn Phe Glu Val Tyr Arg Asn Asp Glu
            100                 105                 110
Leu Thr Ile Glu Asp Val Lys Arg Lys Asn Pro Arg Gly Ile Leu Ile
        115                 120                 125
Ser Pro Gly Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln Ala
    130                 135                 140
Val Leu Glu Leu Gly Pro Thr Ile Pro Ile Phe Gly Val Cys Met Gly
145                 150                 155                 160
Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly Lys Ile Ile Arg Ala Pro
                165                 170                 175
Ser Gly Val Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu Glu
            180                 185                 190
Leu Gly Lys Ala Leu Phe Asn Gly Leu Pro Asn Pro Phe Thr Ala Ala
        195                 200                 205
Arg Tyr His Ser Leu Val Ile Glu Glu Glu Thr Phe Pro His Asp Ala
    210                 215                 220
Leu Glu Ala Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg
225                 230                 235                 240
His Lys Lys Tyr Lys His Ile Gln Gly Val Gln Phe His Pro Glu Ser
                245                 250                 255
Ile Ile Thr Pro Asp Gly Lys Lys Ile Ile Leu Asn Phe Val Arg Phe
            260                 265                 270
Ile Glu Glu Leu Glu Lys Gln Arg Ser
        275                 280
<210>134
<211>1122
<212>DNA
<213>高粱(Sorghum bicolor)
<400>134
gtcgacccac gcgtccgccg cctccccacc ctcgctccct ctcaccgccc gccaccgccg     60
agatggtctg ctcccagctc accgccgcgg gggcctcctc cctcgccgcc gcagcggttc    120
gttcccgggc gcattcccca gccgccgcct tcgcgcaact acggtcgacg cctcgcattg    180
cgagcgctgg cttgtcggtt aagggaaaca gggcggctct tccgttggtc gccgccgcgg    240
ggccggccgc ggcggcgccg gtggccgacc tggacggccc cccggccacg gagaagcagc    300
ccatcattgt catcgataac tacgacagct tcacctacaa cctctgccag tatatggggg    360
agcttggatt gaactttgaa gtataccgca atgatgaact gaccatagaa gatgtaaaga    420
ggaagaaccc aagaggaata cttatttctc cagggcctgg tgaaccacaa gattcaggaa    480
tatcattgca ggctgttctt gaattaggcc caaccatccc aatttttgga gtttgcatgg    540
gcctgcagtg cattggggag gcatttgggg gaaagattat ccgtgctcct tctggagtga    600
tgcatgggaa aagctctcca gtttattacg acgaggaatt aggaaaggcc ttattcaatg    660
gcttgccaaa cccttttacc gctgcgaggt accacagctt ggtcattgag gaagaaacct    720
tcccgcatga tgctttagag gccactgcat ggactgaaga tggacttatc atggctgctc    780
gccacaagaa gtacaaacac atccagggtg tccaattcca cccggagagc atcatcaccc    840
ctgacggcaa gaaaatcatc ctcaatttcg tcagattcat tgaggaactg gagaagcagc    900
gttcctaggg aggtagatgc caccggtggc ttcatagatc agtcagaagc agagacaaag    960
gcgcttgaag ctgcgtagta ccgggtctgg cagtggaagt tagctaggaa acagcctttt   1020
tcctccctta attcgttgtg ctcgtggtaa tataatctgt gtggactgaa tttcgaataa   1080
agtccagctg ttcaaataaa aaaaaaaaaa aagggcggcc gc                      1122
<210>135
<211>1934
<212>DNA
<213>高粱(Sorghum bicolor)
<400>135
gtcgacccac gcgtccgcgt gacaccccgc gcggcacctc cgcctcccca ccctcgctcc     60
ctctcaccgc ccgccaccgc cgagatggtc tgctcccagc tcaccgccgc gggggcctcc    120
tccctcgccg ccgcagcggt tcgttcccgg gcgcattccc cagccgccgc cttcgcgcaa    180
ctacggtcga cgcctcgcat tgcgagcgct ggcttgtcgg ttaagggaaa cagggcggct    240
cttccgttgg tcgccgccgc ggggccggcc gcggcggcgc cggtggccga cctggacggc    300
cccccggcca cggagaagca gcccatcatt gtcatcgata actacgacag cttcacctac    360
aacctctgcc agtatatggg ggagcttgga ttgaactttg aagtataccg caatgatgaa    420
ctgaccatag aagatgtaaa gaggaagaac ccaagaggaa tacttatttc tccagggcct    480
ggtgaaccac aagattcagg aatatcattg caggctgttc ttgaattagg cccaaccatc    540
ccaatttttg gagtttgcat gggcctgcag tgcattgggg aggcatttgg gggaaagatt    600
atccgtgctc cttctggagt gatgcatggg aaaagctctc cagtttatta cgacgaggaa    660
ttaggaaagg ccttattcaa tggcttgcca aaccctttta ccgctgcgag gtaccacagc    720
ttggtcattg aggaagaaac cttcccgcat gatgctttag aggccactgc atggactgaa    780
gatggactta tcatggctgc tcgccacaag aagtacaaac acatccaggg tgtccaattc    840
cacccggaga gcatcatcac ccctgacggc aagaaaatca tcctcaattt cgtcagattc    900
attgaggaac tggagaagca gcgttcctag ggaggtagat gccaccggtg gcttcataga    960
tcagtcagaa gcagagacaa aggcgcttga agctgcgtag taccgggtct ggcagtggaa   1020
gttagctagg aaacagcctt tttcctccct taattcgttg tgctcgtggt aatataatct   1080
gtgtggactg aatttcgaat aaagtccagc tgttcaaata aaaaaaaaaa aaaagggcgg   1140
ccgctaccct cgaggccggc cgggccggga agccgcgatg ttaaatgtgt ggtccttagc   1200
aatcaaatct gcgtacaaga tggaatctct attattttca gcgaaaccaa gggattccgt   1260
gagcgcatcc gagggaggaa ggtgggcgta cctttaggct tctttccgac ctccgggaag   1320
tgcggcgagg gtttcatggc gatgttggcg gctgcaaggc cggcgcgccg gatagaggcg   1380
ggggcagggg aactgacaag ggtttaacta cgcgaacgcg cactgcagga atggacgagc   1440
tcgctctctc aaatcggccg aatgcgctcg tcccaccgag acgccgtctt gctccgtctc   1500
cctgtctcgc tcacgcggac gctccacgcg agcagggcag gccgaggagg gcgacggcgc   1560
agccgggcga cggcgcgagg agagcgatgg cgcgaagagt gcagaacgcg cggctcggcg   1620
gcggcgcagc tgtgcggcgg cgcggttggg ccgcggtggc ggagaacggt gaacggaaga   1680
acgaagaaga aagggaaaga agcctttgta tgacacgtgg gtcccgcagt tagaagggtt   1740
aaatctgttg tctcatccat cacgtagtct taattttttt ttcactagtc tgtgttaatg   1800
ctacgatctt aagaagccag cgacaataag agtagctcta ataaaaaaaa aaaaaaaaag   1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaacaaaaa aaaaaaaaaa aaaggcccct   1920
agggccctcg agct                                                     1934
<210>136
<211>2055
<212>DNA
<213>玉米(Zea mays)
<400>136
ggccggccgg gactccactc cactccactc gcccgcgccc gccgcccgcg tgctcctccc     60
tcgcgcccgc cccgccccgc tccgccccta tctatatcca ttcccgctcg tccccctcaa    120
caaccctcct cacggcgcac tcgtgttcgt gtcatcccgc ccgcaggccg cagtccatgg    180
ccaccgccag cctcgcgctc tcgctgcgcc tcgcgccgta ctcgcacccg ctgagcctcc    240
gccgccgggg ggccgccggc gtcacctgcc gcgccaccac cgccacgttc caccagcttg    300
acgccgtcgc ggtgagggag gaggagtcca ggttccggac ggcggcggcg gagggccgca    360
acctgctgcc gctcacgagg tgcatcttct ccgatcacct cacgcccgtg ctcgcctacc    420
gctgcctcgt caaggaggac gaacgcgagg cgcccagctt tctattcgag tctgtcgagc    480
aggggtccga gggcaccaat gtggggaggt acagcgtggt cggggcgcag ccttctatgg    540
aggtcgtggc caaggctaac catgtgacgg tcatggacca tgagatgaag tcgaggaggg    600
agcacttcgt gcctgatccc atgaggatcc ccaggacaat catggagcag tggaacccgc    660
agattgctga cagcctccct gatgcatttt gtggaggatg ggttggattc ttctcatatg    720
atacagtgcg ttatgttgaa acaaagaagc ttcctttcag taaggcacca catgatgata    780
ggaaccttcc tgatattcat ttaggcctct atagtgacgt cattgtgttt gatcatgttg    840
aaaagaaaac acatgttatt cattgggtga ggacagactg ctatcgttct gttgatgaag    900
catatgaaga tggaagaaat cggcttgaag ctttgttatc aagattacat tgcctcaatg    960
tcccaacact ttcttctggt tctataaaac tcaatgttga aaactttggc ccagtaatgc   1020
aaaaatcaac gatgtcaagc gaagaatata aaaatatcgt tgtccaagct aaagaacaca   1080
tcttggccgg tgacattttc caagttgttt taagccagcg ttttgagaga cggacattcg   1140
ccgacccctt tgaaatctat cgtgcattgc gcatcgtaaa tcctagtcca tatatggcct   1200
atctacaggc acgaggttgt attctcgtgg catcgagtcc tgaaattctt acccgggtac   1260
aaaagaggac aataatcaat cgtccgcttg ctggaaccat aagaagaggc aaaacaaaag   1320
cagaagacaa aactttagaa caattgcttt tgagtgacga aaagcagtgt gctgaacata   1380
ttatgctagt agatcttggc cgaaatgatg ttgggaaggt gtccaaacca ggttcagtaa   1440
aggtagagaa attgatgaat atcgaacgat attctcatgt catgcacatc agctcaacag   1500
taactggaga gctacgcgat gatcttacgt gttgggatgc gctacgagcc gcattgccag   1560
ttggaaccgt tagtggcgct ccaaaggtga gagcaatgga gttgattgat cagctagaag   1620
tgagtatgcg tgggccgtat agtggtggct ttggagggat ttcctttcgc ggcgacatgg   1680
acattgcact ggctcttcgc actatcgtct tccccaccgc atctcggttt gataccatgt   1740
actcgtacac agacagtaag tcccgacagg agtgggtggc tcacctccag gccggagctg   1800
gcatagttgc tgatagcaaa ccggatgacg agcaccaaga gtgtataaac aaggctgcag   1860
gtgttgctcg tgccattgac cttgctgaat ctacatttct tgaagactag tctagtctaa   1920
tgaaggaaat gtatgtttaa gttctctgta caattatgga ttgtcctaga aaacaggctt   1980
tcttaggccg aataaaaact caattgtaat aaagttaata aatggacaac tttagctaaa   2040
aaaaaaaaaa aaaaa                                                    2055
<210>137
<211>577
<212>PRT
<213>玉米(Zea mays)
<400>137
Met Ala Thr Ala Ser Leu Ala Leu Ser Leu Arg Leu Ala Pro Tyr Ser
1               5                   10                  15
His Pro Leu Ser Leu Arg Arg Arg Gly Ala Ala Gly Val Thr Cys Arg
            20                  25                  30
Ala Thr Thr Ala Thr Phe His Gln Leu Asp Ala Val Ala Val Arg Glu
        35                  40                  45
Glu Glu Ser Arg Phe Arg Thr Ala Ala Ala Glu Gly Arg Asn Leu Leu
    50                  55                  60
Pro Leu Thr Arg Cys Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala
65                  70                  75                  80
Tyr Arg Cys Leu Val Lys Glu Asp Glu Arg Glu Ala Pro Ser Phe Leu
                85                  90                  95
Phe Glu Ser Val Glu Gln Gly Ser Glu Gly Thr Asn Val Gly Arg Tyr
            100                 105                 110
Ser Val Val Gly Ala Gln Pro Ser Met Glu Val Val Ala Lys Ala Asn
        115                 120                 125
His Val Thr Val Met Asp His Glu Met Lys Ser Arg Arg Glu His Phe
    130                 135                 140
Val Pro Asp Pro Met Arg Ile Pro Arg Thr Ile Met Glu Gln Trp Asn
145                 150                 155                 160
Pro Gln Ile Ala Asp Ser Leu Pro Asp Ala Phe Cys Gly Gly Trp Val
                165                 170                 175
Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Thr Lys Lys Leu
            180                 185                 190
Pro Phe Ser Lys Ala Pro His Asp Asp Arg Asn Leu Pro Asp Ile His
        195                 200                 205
Leu Gly Leu Tyr Ser Asp Val Ile Val Phe Asp His Val Glu Lys Lys
    210                 215                 220
Thr His Val Ile His Trp Val Arg Thr Asp Cys Tyr Arg Ser Val Asp
225                 230                 235                 240
Glu Ala Tyr Glu Asp Gly Arg Asn Arg Leu Glu Ala Leu Leu Ser Arg
                245                 250                 255
Leu His Cys Leu Ash Val Pro Thr Leu Ser Ser Gly Ser Ile Lys Leu
            260                 265                 270
Asn Val Glu Asn Phe Gly Pro Val Met Gln Lys Ser Thr Met Ser Ser
        275                 280                 285
Glu Glu Tyr Lys Asn Ile Val Val Gln Ala Lys Glu His Ile Leu Ala
    290                 295                 300
Gly Asp Ile Phe Gln Val Val Leu Ser Gln Arg Phe Glu Arg Arg Thr
305                 310                 315                 320
Phe Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro
                325                 330                 335
Ser Pro Tyr Met Ala Tyr Leu Gln Ala Arg Gly Cys Ile Leu Val Ala
            340                 345                 350
Ser Ser Pro Glu Ile Leu Thr Arg Val Gln Lys Arg Thr Ile Ile Asn
        355                 360                 365
Arg Pro Leu Ala Gly Thr Ile Arg Arg Gly Lys Thr Lys Ala Glu Asp
    370                 375                 380
Lys Thr Leu Glu Gln Leu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu
385                 390                 395                 400
His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser
                405                 410                 415
Lys Pro Gly Ser Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr
            420                 425                 430
Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Arg Asp
        435                 440                 445
Asp Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr
    450                 455                 460
Val Ser Gly Ala Pro Lys Val Arg Ala Met Glu Leu Ile Asp Gln Leu
465                 470                 475                 480
Glu Val Ser Met Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser
                485                 490                 495
Phe Arg Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val Phe
            500                 505                 510
Pro Thr Ala Ser Arg Phe Asp Thr Met Tyr Ser Tyr Thr Asp Ser Lys
        515                 520                 525
Ser Arg Gln Glu Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val
    530                 535                 540
Ala Asp Ser Lys Pro Asp Asp Glu His Gln Glu Cys Ile Asn Lys Ala
545                 550                 555                 560
Ala Gly Val Ala Arg Ala Ile Asp Leu Ala Glu Ser Thr Phe Leu Glu
                565                 570                 575
Asp
<210>138
<211>22
<212>DNA
<213>人工的
<220>
<223>引物.
<400>138
atggcagcgg taattctgga ag                                             22
<210>139
<211>19
<212>DNA
<213>人工的
<220>
<223>引物.
<400>139
tcaggctgcc ttggtcttc                                                 19
<210>140
<211>30
<212>DNA
<213>人工的
<220>
<223>引物.
<400>140
actgactcca tggcagcggt aattctggaa                                     30
<210>141
<211>20
<212>DNA
<213>人工的
<220>
<223>引物.
<400>141
ctgactagtt caggctgctt                                                20
<210>142
<211>30
<212>DNA
<213>人工的
<220>
<223>引物.
<400>142
tgctgaccat ggcctgctcc cacatcgtcg                                     30
<210>143
<211>34
<212>DNA
<213>人工的
<220>
<223>引物.
<400>143
cagtgaattc ctacgaacgc tgcttctcca gttc                                34

Claims (33)

1.编码邻氨基苯甲酸合酶的分离的DNA分子,其中该DNA分子编码与选自SEQ ID NOs:66、108、109、110、111、133或137的蛋白质基本上同源的蛋白质。
2.权利要求1的分离的DNA分子,其中该DNA分子与选自SEQ ID NOs:67、68、104、105、106、107、134、135或136的DNA分子基本上同源。
3.包括表达盒的DNA构建体,其中该可操作连接的表达盒包括(i)异源启动子;(ii)编码单体邻氨基苯甲酸合酶蛋白质的DNA分子,其中该单体的邻氨基苯甲酸合酶包括包含邻氨基苯甲酸合酶α-结构域和邻氨基苯甲酸合酶β-结构域的单个多肽;和(iii)转录终止子。
4.权利要求3的DNA构建体,其中单体的邻氨基苯甲酸合酶蛋白质是与选自SEQ ID NOs:4、7、43、57、77、78、79、80、81、82、130、131或132的蛋白质基本上同源的。
5.权利要求3的DNA构建体,其中该蛋白质是SEQ ID NO:4。
6.权利要求3的DNA构建体,其中该DNA分子是与选自SEQ ID NOs:1、75、76、83、121、122、123、124、125、126、127、128或129的DNA分子基本上同源的。
7.权利要求3的DNA构建体,其中该表达盒进一步编码质体运输肽。
8.权利要求7的DNA构建体,其中该质体运输肽选自SEQ ID NOs:72、74、114或115。
9.包括第一表达盒的DNA构建体,其中可操作连接的第一表达盒,包括(i)异源启动子;(ii)编码邻氨基苯甲酸合酶α-结构域蛋白质的DNA分子;和(iii)转录终止子。
10.权利要求9的DNA构建体,进一步包括可操作连接的第二表达盒,包括(i)异源启动子;(ii)编码邻氨基苯甲酸合酶β-结构域蛋白质的DNA分子;和iii)转录终止子。
11.权利要求10的DNA构建体,其中该α-结构域或β-结构域蛋白质是与选自SEQ ID NOs:5、6、8、44、45、66、99、100、101、102、103、108、109、110、111、117、118、133或137的蛋白质基本上同源的。
12.权利要求10的DNA构建体,其中编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子是与选自SEQ ID NOs:2、3、67、94、95、96、97、98、104、105、106、112、116、119、120、134、135或136的DNA分子基本上同源的。
13.权利要求10的DNA构建体,其中编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子选自SEQ ID NOs:2、3、67、94、95、96、97、98、104、105、106、112、116、119、120、134、135或136。
14.权利要求10的DNA构建体,其中α-结构域蛋白质是SEQ ID NO:66,而β-结构域蛋白质是SEQ ID NO:118。
15.用于改变植物中色氨酸含量的方法,包括:
a.将包括编码邻氨基苯甲酸合酶的分离DNA分子的转基因导入可再生的植物细胞,其中该分离的DNA被可操作地连接到在植物细胞中有功能的启动子上,以产生转化的植物细胞;以及
b.从转化的植物细胞再生植物,其中该植物细胞表达由分离的DNA编码的邻氨基苯甲酸合酶,相对于不包括转化基因的具有相同或相似遗传背景的第二植物中的色氨酸含量,该合酶的数量有效增加了该植物中的色氨酸含量。
16.权利要求15的方法,其中邻氨基苯甲酸合酶是与选自根瘤农杆菌(Agrobacterium tumefaciens)、鱼腥藻属(Anabaena)M22983、巴西固氮螺菌(Azospirillum brasilense)、大豆慢生根瘤菌(Bradyrhizobium japonicum)、马尔他布鲁氏菌(Brucella melitensis)、Mesorhizobium loti、念珠藻属的种(Nostocsp.)PCC7120、苜蓿中华根瘤菌(Rhizobium meliloti)、深红红螺菌(Rhodospirillum rubrum)、血色红假单胞菌(Rhodopseudomonas palustris)或Thermobifida fusca的单体邻氨基苯甲酸合酶基本上同源的。
17.权利要求15的方法,其中邻氨基苯甲酸合酶选自SEQ ID NOs:4、7、43、57、77、78、79、80、81、82、130、131或132。
18.权利要求15的方法,其中邻氨基苯甲酸合酶是由与选自SEQ ID NOs:1、75、76、83、121、122、123、124、125、126、127、128或129的DNA分子基本上同源的DNA分子编码的。
19.权利要求15的方法,其中邻氨基苯甲酸合酶包括嵌合的单体邻氨基苯甲酸合酶,其包括第一种属的邻氨基苯甲酸合酶α-结构域和来自第二种属的邻氨基苯甲酸合酶β-结构域的融合体,其中第一种属和第二种属选自根瘤农杆菌、鱼腥藻属M22983、拟南芥(Arabidopsis thaliana)、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌(Escherichia coli)、薄肌眼虫藻(Euglena gracilis)、Mesorhizobium loti、念珠藻属的种PCC7120、苜蓿中华根瘤菌、深红红螺菌、芸香(Ruta graveolens)、血色红假单胞菌、鼠伤寒沙门氏菌(Salmonella typhimurium)、粘质沙雷氏杆菌(Serratia marcescens)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、Thermobifida fusca、高粱、大豆、稻、棉花、小麦、烟草或玉米。
20.权利要求19的方法,其中α-结构域或β-结构域至少是部分的SEQ IDNOs:4、5、6、7、8、43、44、45、57、66、77、78、79、80、81、82、99、100、101、102、103、108、109、110、111、117、118、130、131、132、133或137。
21.权利要求15的方法,其中DNA分子进一步编码质体运输肽。
22.权利要求21的方法,其中该质体运输肽选自SEQ ID NOs:72、74、114或115。
23.权利要求15的方法,其中植物是双子叶植物。
24.权利要求33的方法,其中双子叶植物选自大豆、棉花或canola。
25.权利要求20的方法,其中植物是单子叶植物。
26.权利要求25的方法,其中单子叶植物选自玉米、稻、小麦、大麦或高粱。
27.用于制备动物饲料或人食品的方法,包括:
a.将包括编码邻氨基苯甲酸合酶的分离DNA分子的转基因导入可再生的植物细胞,其中该分离的DNA分子被可操作地连接到在植物细胞中有功能的启动子上,以产生转化的植物细胞;以及
b.从转化的植物细胞再生植物,其中该植物细胞表达由分离的DNA分子编码的邻氨基苯甲酸合酶,相对于不包括转化基因的具有相同或相似遗传背景的第二植物中的色氨酸含量,该合酶的数量有效增加了该植物中的色氨酸含量。
28.权利要求27的方法,其中邻氨基苯甲酸合酶选自SEQ ID NOs:4、7、43、57、77、78、79、80、81、82、130、131或132。
29.权利要求27的方法,其中邻氨基苯甲酸合酶包括嵌合的单体邻氨基苯甲酸合酶,其包括第一种属的邻氨基苯甲酸合酶α-结构域和第二种属的邻氨基苯甲酸合酶β-结构域的融合体,其中第一种属和第二种属选自根瘤农杆菌、鱼腥藻属M22983、拟南芥、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、Mesorhizobium loti、念珠藻属的种PCC7120、苜蓿中华根瘤菌、深红红螺菌、芸香、血色红假单胞菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、硫磺矿硫化叶菌、Thermobifida fusca、高粱、大豆、稻、棉花、小麦、烟草或玉米。
30.通过权利要求27的方法所制备的动物饲料或人食品。
31.包括权利要求10的DNA构建体的动物饲料或人食品。
32.通过权利要求27的方法所制备的转基因植物。
33.包括权利要求10的DNA构建体的转基因植物。
CN038156148A 2002-05-03 2003-05-05 转基因的高色氨酸植物 Expired - Lifetime CN1852975B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US37772702P 2002-05-03 2002-05-03
US60/377,727 2002-05-03
US10/430,011 US20030213010A1 (en) 2002-05-03 2003-05-05 Transgenic high tryptophan plants
PCT/US2003/013944 WO2003092363A2 (en) 2002-05-03 2003-05-05 Transgenic high tryptophan plants
US10/430,011 2003-05-05

Publications (2)

Publication Number Publication Date
CN1852975A true CN1852975A (zh) 2006-10-25
CN1852975B CN1852975B (zh) 2012-09-05

Family

ID=29406807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN038156148A Expired - Lifetime CN1852975B (zh) 2002-05-03 2003-05-05 转基因的高色氨酸植物

Country Status (7)

Country Link
US (2) US20030213010A1 (zh)
EP (1) EP1571896A4 (zh)
CN (1) CN1852975B (zh)
AU (1) AU2003253601A1 (zh)
BR (1) BR0309860A (zh)
CA (1) CA2482879C (zh)
WO (1) WO2003092363A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011114279A1 (en) * 2010-03-18 2011-09-22 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and method for making the same
CN110484545A (zh) * 2019-09-17 2019-11-22 东北师范大学 一种从野生大豆中分离出来的抗花叶病毒GsCAD1基因、编码蛋白及其应用
CN114836427A (zh) * 2022-05-13 2022-08-02 杭州师范大学 一种培育apoaequorin转基因番茄的方法及其应用

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7604976B2 (en) 2001-04-02 2009-10-20 Ceres, Inc. Sequence-determined DNA fragments encoding glutamine amidotransferase proteins
AU2002257246A1 (en) * 2001-05-04 2002-11-18 Ridong Chen Transgenic high tryptophan plants
WO2003092363A2 (en) * 2002-05-03 2003-11-13 Monsanto Technology, Llc Transgenic high tryptophan plants
US7714189B2 (en) * 2002-05-03 2010-05-11 Monsanto Technology Llc High tryptophan maize
BRPI0507088A (pt) * 2004-01-26 2007-06-19 Renessen Llc alimento de soja com alto teor de proteìna
JP4651410B2 (ja) * 2004-04-13 2011-03-16 国立大学法人愛媛大学 イネのアントラニル酸合成酵素遺伝子oasa2の新規改変遺伝子およびその利用
JP4538645B2 (ja) * 2004-09-17 2010-09-08 独立行政法人科学技術振興機構 トリプトファン含有ダイズ、およびその利用
EP1870469A4 (en) * 2005-02-28 2009-03-25 Nat University Corp Ehime Univ NOVEL MODIFIED GENE OF OASA2 GENE OF ANTHRANILIC ACID SYNTHASE OF RICE AND USE THEREOF
AR054540A1 (es) * 2005-07-08 2007-06-27 Renessen Llc Harina de soja alta en triptofano
EP2049670A1 (en) * 2006-08-11 2009-04-22 Monsanto Technology, LLC Production of high tryptophan maize by chloroplast targeted expression of anthranilate synthase
AR063127A1 (es) * 2006-10-03 2008-12-30 Monsanto Technology Llc Metodo para la produccion de semilla de maiz hibrido y composiciones producidas a partir del mismo
US7561972B1 (en) 2008-06-06 2009-07-14 Dna Twopointo, Inc. Synthetic nucleic acids for expression of encoded proteins
US8401798B2 (en) * 2008-06-06 2013-03-19 Dna Twopointo, Inc. Systems and methods for constructing frequency lookup tables for expression systems
US8126653B2 (en) * 2008-07-31 2012-02-28 Dna Twopointo, Inc. Synthetic nucleic acids for expression of encoded proteins
US7561973B1 (en) 2008-07-31 2009-07-14 Dna Twopointo, Inc. Methods for determining properties that affect an expression property value of polynucleotides in an expression system
JP2021118678A (ja) * 2018-04-06 2021-08-12 味の素株式会社 アルカロイドの製造方法
JP7094494B2 (ja) * 2018-09-07 2022-07-04 味の素株式会社 キョウチクトウ科ニチニチソウ属の形質転換植物体
CN112080501B (zh) * 2020-09-10 2021-11-23 隆平生物技术(海南)有限公司 重组启动子、基因表达盒及其在植物育种中的应用

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4642411A (en) 1984-09-04 1987-02-10 Molecular Genetics Research And Development Limited Partnership Tryptophan overproducer mutants of cereal crops
US4581847A (en) 1984-09-04 1986-04-15 Molecular Genetics Research And Development Tryptophan overproducer mutants of cereal crops
US6118047A (en) * 1993-08-25 2000-09-12 Dekalb Genetic Corporation Anthranilate synthase gene and method of use thereof for conferring tryptophan overproduction
JP2001512028A (ja) 1997-07-31 2001-08-21 サンフォード サイエンティフィック インコーポレイテッド 穀物改良のためのtdc遺伝子を用いたトランスジェニック植物
US6232526B1 (en) * 1999-05-14 2001-05-15 Dekalb Genetics Corp. Maize A3 promoter and methods for use thereof
AU2002257246A1 (en) * 2001-05-04 2002-11-18 Ridong Chen Transgenic high tryptophan plants
EP1504096B1 (en) 2002-05-03 2010-04-14 Monsanto Technology LLC Seed specific usp promoters for expressing genes in plants
WO2003092363A2 (en) 2002-05-03 2003-11-13 Monsanto Technology, Llc Transgenic high tryptophan plants

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011114279A1 (en) * 2010-03-18 2011-09-22 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and method for making the same
CN103037682A (zh) * 2010-03-18 2013-04-10 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物及其制备方法
CN110484545A (zh) * 2019-09-17 2019-11-22 东北师范大学 一种从野生大豆中分离出来的抗花叶病毒GsCAD1基因、编码蛋白及其应用
CN110484545B (zh) * 2019-09-17 2023-03-28 东北师范大学 一种从野生大豆中分离出来的抗花叶病毒GsCAD1基因、编码蛋白及其应用
CN114836427A (zh) * 2022-05-13 2022-08-02 杭州师范大学 一种培育apoaequorin转基因番茄的方法及其应用

Also Published As

Publication number Publication date
US20110195175A1 (en) 2011-08-11
US8158851B2 (en) 2012-04-17
WO2003092363A2 (en) 2003-11-13
AU2003253601A1 (en) 2003-11-17
EP1571896A4 (en) 2007-06-06
BR0309860A (pt) 2007-11-06
EP1571896A2 (en) 2005-09-14
CA2482879A1 (en) 2003-11-13
WO2003092363A3 (en) 2006-06-15
CA2482879C (en) 2013-02-12
CN1852975B (zh) 2012-09-05
AU2003253601A8 (en) 2003-11-17
US20030213010A1 (en) 2003-11-13

Similar Documents

Publication Publication Date Title
CN1852975A (zh) 转基因的高色氨酸植物
CN1263856C (zh) 真核生物中原卟啉原氧化酶酶活力的操作
CN1049454C (zh) 生产转基因玉米的方法
CN1245516C (zh) 编码乙酰乳酸合酶基因的基因
CN1155713C (zh) 选择转基因植物细胞的方法
CN1705748A (zh) 用于增加植物中总的油类水平的方法
CN1933723A (zh) 玉米植株mon88017和组合物以及检测它们的方法
CN1950509A (zh) 高赖氨酸玉米组合物及其检测方法
CN1246461C (zh) 修饰植物中次级代谢化合物水平的方法和组合物
CN1252098A (zh) 产生具有降低的棉子糖类和植酸水平之种子的大豆植物
CN1201012C (zh) 改变植物开花时间的方法
CN101031646A (zh) 抗除草剂的向日葵植物、编码抗除草剂的乙酰羟酸合酶大亚基蛋白的多核苷酸和使用方法
CN1719971A (zh) 转基因高色氨酸植物
CN1742085A (zh) 用于增加谷物产量的基因及其用途
CN1406282A (zh) 种子产量、生物量、和收获指数增加的转基因植物
CN1193097C (zh) 向真核细胞运送的外源dna的改良整合方法
US9090882B2 (en) Compositions and methods for enhanced amino acid levels in plants conferred by lysine and/or threonine feedback insensitive aspartate kinase proteins
CN1810977A (zh) 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸
CN1822763A (zh) 氮限制条件下生长得以改善的植物的制备方法
CN1206347C (zh) Cyp79家族的p450单加氧酶
CN1219966A (zh) 植物糖传感蛋白及其用途
CN1289369A (zh) 植物核黄素生物合成基因及其用途
CN1262654C (zh) 与玉米株高相关基因及其编码蛋白与应用
CN1898382A (zh) 基因组dna片段的筛选方法
CN1894408A (zh) 除草剂代谢蛋白质,其基因及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20120905