CN1719971A - 转基因高色氨酸植物 - Google Patents

转基因高色氨酸植物 Download PDF

Info

Publication number
CN1719971A
CN1719971A CNA028135067A CN02813506A CN1719971A CN 1719971 A CN1719971 A CN 1719971A CN A028135067 A CNA028135067 A CN A028135067A CN 02813506 A CN02813506 A CN 02813506A CN 1719971 A CN1719971 A CN 1719971A
Authority
CN
China
Prior art keywords
anthranilate
synzyme
plant
separated dna
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028135067A
Other languages
English (en)
Other versions
CN1719971B (zh
Inventor
L·M·韦弗
J·梁
R·陈
S·S·郑
T·米特斯基
S·斯拉特尔
W·拉普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renessen LLC
Monsanto Co
Original Assignee
Renessen LLC
Monsanto Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renessen LLC, Monsanto Co filed Critical Renessen LLC
Publication of CN1719971A publication Critical patent/CN1719971A/zh
Application granted granted Critical
Publication of CN1719971B publication Critical patent/CN1719971B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • C12N15/8254Tryptophan or lysine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nutrition Science (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供通过在植物细胞中导入并表达编码邻氨基苯甲酸酯合成酶的分离的DNA片段而带给植物对色氨酸的氨基酸类似物的抗性和/或改变植物的色氨酸含量的方法。还提供了编码邻氨基苯甲酸酯合成酶的分离的DNA片段转化的转基因植物,以及来自这些植物的人类或动物食物,种子和后代。

Description

转基因高色氨酸植物
发明背景
很多重要作物包括大豆和玉米的种子不含有足量的使营养完全的几种氨基酸。这些氨基酸包括但不限于:色氨酸,异亮氨酸,缬氨酸,精氨酸,赖氨酸,蛋氨酸和苏氨酸。因此,这些氨基酸的生物合成途径,和/或进入那些途径的代谢产物的生物合成途径,是为了提高这些植物的氨基酸含量而操作的有潜力的目标。
邻氨基苯甲酸酯合成酶(AS,EC 4.1.3.27)催化从芳香氨基酸途径分支到植物,真菌和细菌中色氨酸的生物合成的第一反应。
            分支酸酯
              ↓邻氨基苯甲酸酯合成酶
           邻氨基苯甲酸酯
              ↓
          磷酸核糖基邻氨基苯甲酸酯
              ↓
          1-(0-羧基苯基氨基)-1-
          脱氧核糖-5-磷酸酯
              ↓
          吲哚-3-甘油磷酸酯
              ↓
             吲哚
              ↓
            色氨酸
邻氨基苯甲酸酯合成酶(例如,玉米邻氨基苯甲酸酯合成酶)的最常见的形式是由两个亚基,α或TrpE亚基和β或TrpG亚基,构成的异四聚体酶。两个α亚基和两个β亚基装配形成异四聚体邻氨基苯甲酸酯合成酶。还发现过″单体″形式的AS,它包括具有TrpE和TrpG两种亚基活性的单多肽链(例如苜蓿根瘤菌(Rhizobium meliloti))。邻氨基苯甲酸酯合成酶单体只包括一种类型的多肽,而邻氨基苯甲酸酯合成酶单体的酶活性形式一般是由这样两个多肽单体组成的同型二聚体。异型四聚体和单体邻氨基苯甲酸酯合成酶催化使用谷酰胺和分支酸酯的反应中邻氨基苯甲酸酯的合成。α亚基上发现的结构域(这里称作″α结构域″)结合分支酸酯并且消除烯醇丙酮酸侧链,β亚基上发现的结构域(这里称作″β结构域″)将谷酰胺上的氨基转移到位于羧酸酯和烯醇丙酮酸酯部分之间的分支酸酯苯基环上。
色氨酸合成中的下一个反应是将磷酸核糖焦磷酸酯的磷酸核糖部分转移给邻氨基苯甲酸酯。经两个步骤形成吲哚环,包括将核糖基团转移给核酮糖的异构化作用,接着进行环化反应得到吲哚甘油磷酸。该途径中最后的反应是包含一个或两个亚基的单一的酶催化的。反应实现吲哚甘油醛-3-磷酸的裂解和吲哚基团与丝氨酸的缩合(Umbarger,Ann.Rev.Biochem,47,555(1978))。
高级植物和微生物色氨酸途径中的代谢物流显然受通过色氨酸对邻氨基苯甲酸酯合成酶反馈抑制的调节。色氨酸可以阻断构象重排,而激活β-结构域并且产生氨向α-结构域的活性位点通过的通道需要构象重排。相信色氨酸的这样的反馈抑制作用压制通过邻氨基苯甲酸酯合成酶的色氨酸制备。参见Li J. & Last,R.L.鼠耳芥trp5突变体有反馈抗性邻氨基苯甲酸酯合成酶和提高的可溶性色氨酸.PlantPhysiol.110,51-59(1996)。
已经鉴定出来自鼠伤寒沙门氏菌(Salmonella typhimurium)的邻氨基苯甲酸酯合成酶的反馈调节中涉及几个氨基酸残基。该信息提供了氨基末端调节位点的证据。J.Biol.Chem.266,8328-8335(1991)。Niyogi等应用分子途径进一步表征了来自某些植物的邻氨基苯甲酸酯合成酶。参见Niyogi和Fink(Plant Cell,4,721(1992))和Niyogi等(Plant Cell,5,1011(1993))。他们发现差异调节的两个紧密相关的非等位基因编码鼠耳芥属邻氨基苯甲酸酯合成酶的α-亚基。这些α-亚基基因中的一个,ASA1,由伤害和细菌病原体渗透诱导,推断其在防御响应中涉及,而另一个α-亚基,ASA2,以组成型基础水平被表达。两者都预示蛋白质都有与细菌和真菌邻氨基苯甲酸酯合成酶蛋白质同源的区,并且在证明在细菌的色氨酸反馈抑制作用涉及的位点包含保守的氨基酸残基(Caligiuri等,J.Biol.Chem.,266,8328(1991))。
色氨酸生物合成途径中色氨酸的氨基酸类似物和中间体的类似物(例如,5-甲基色氨酸,4-甲基色氨酸,5-氟代色氨酸,5-羟基色氨酸,7-氮杂色氨酸,3β-吲哚丙烯酸,3-甲基邻氨基苯甲酸),已经被证明抑制原核生物和真核生物的生长。能选择对这些氨基酸类似物抗性的植物细胞培养物。例如,因为改变的邻氨基苯甲酸酯合成酶,已经通过5-甲基色氨酸(5-MT),一种色氨酸的氨基酸类似物,选择了培养的烟草,胡萝卜,马铃薯,玉米和毛曼陀螺细胞系。
Ranch等(Plant Physio.,71,136(1983))对毛曼陀螺,一种双子叶杂草的细胞培养物筛选5-MT抗性,并且报道该抗性细胞培养物含有提高的色氨酸水平(比野生型水平高8至30倍)并且邻氨基苯甲酸酯合成酶对色氨酸反馈抑制作用具有较小敏感性。再生植物也对5-MT有抗性,含有改变的邻氨基苯甲酸酯合成酶,并且比对照植物的叶子具有更高的游离色氨酸浓度(4-44倍)。与使用烟草的研究相反,其中从抗性细胞系再生的植物不表达改变的酶,这些结果表明氨基酸超量生产表型应该在细胞水平上选择,并且在毛曼陀螺中选择的细胞再生的整个植株中表达。
Hibberd等(美国专利No.4,581,847,1986年4月15日公开)描述了5-MT抗性玉米细胞系,它含有比野生型邻氨基苯甲酸酯合成酶对反馈抑制敏感性更小的邻氨基苯甲酸酯合成酶。一种5-MT抗性细胞系积累的游离色氨酸水平几乎比没有转化的细胞系大20倍。
P.C.Anderson等(美国专利No.6,118,047)公开了来自C28玉米的邻氨基苯甲酸酯合成酶的色氨酸不敏感α-结构域在转基因制备种子中具有高水平游离色氨酸的转基因玉米植物(玉米)的用途。
尽管有可能在某些细胞培养物和植物中筛选5-MT抗性,这种特征不必然地与整个植株中游离色氨酸的超量生产相关联。另外,从5-MT抗性系再生的植株常常不表达改变形式的酶。不可预言这种特征在一段时期内稳定并且作为可遗传性状传代。
从高级植物细胞培养物的粗提取物中也已经部分纯化出邻氨基苯甲酸酯合成酶(Hankins等,PlantPhysiol.,57,101(1976);Widholm,Biochim.Biophys.Acta,320,217(1973))。但是,发现它是非常不稳定的。因此,需要提供具有能提高植物色氨酸含量的邻氨基苯甲酸酯合成酶来源的植物。
发明概述
本发明提供用来产生转基因植物的编码邻氨基苯甲酸酯合成酶(AS)的核酸。当在转基因植物中表达这样的邻氨基苯甲酸酯合成酶核酸时,植物细胞中能达到提高水平的色氨酸。在一个实施方案中,本发明涉及编码单体邻氨基苯甲酸酯合成酶的DNA分子,其中这样的单体邻氨基苯甲酸酯合成酶是天然的或基因工程的邻氨基苯甲酸酯合成酶的α-和β-结构域的嵌合融合体。来自几种物种(例如,一些细菌和其它微生物)的邻氨基苯甲酸酯合成酶基因天然给出构成单多肽链的单体邻氨基苯甲酸酯合成酶。但是,大多数物种具有由分开亚基上发现的两个α-和两个β-结构域组成的杂四聚体邻氨基苯甲酸酯合成酶。本发明还涉及包括与任何β-结构域连接的任何邻氨基苯甲酸酯合成酶α-结构域的嵌合邻氨基苯甲酸酯合成酶融合蛋白的形成。
一般情况下,天然存在的单体邻氨基苯甲酸酯合成酶与大多数植物邻氨基苯甲酸酯合成酶的序列同一性十分低。但是,根据本发明,这样的单体邻氨基苯甲酸酯合成酶当在植物中表达时能提供高水平色氨酸,尽管与植物的内源邻氨基苯甲酸酯合成酶的序列同一性低。因此,本发明提供具有趋异序列并且在植株宿主中能有效提供高水平色氨酸的单体邻氨基苯甲酸酯合成酶。例如,含有单体根癌土壤杆菌(Agrobacterium tumefaciens)邻氨基苯甲酸酯合成酶的转基因大豆植物在种子中能产生最多大约10,000至大约12,000ppm色氨酸,平均trp水平范围大约7,000至大约8,000ppm。相反,非转基因大豆植物种子中一般只有至多大约100至大约200ppm色氨酸。
因此,本发明提供编码单体邻氨基苯甲酸酯合成酶的分离的DNA序列,其中单体邻氨基苯甲酸酯合成酶具有邻氨基苯甲酸酯α-结构域和邻氨基苯甲酸酯β-结构域,并且其中在植株中表达单体邻氨基苯甲酸酯合成酶。这样的表达能提高植物中L-色氨酸的水平。
单体邻氨基苯甲酸酯合成酶可以是天然单体。可以从中分离天然单体邻氨基苯甲酸酯合成酶核酸的生物体的例子包括但不限于下面的生物体,例如根癌土壤杆菌,苜蓿根瘤菌(Rhizobium meliloti)(例如,Genbank登记号No.GI 95177),Mesorhizobium loti(例如,Genbank登记号No.GI 13472468),马尔他布鲁氏菌(Brucellamelitensis)(例如,Genbank登记号No.GI 17982357),念珠蓝细菌(Nostoc sp.)PCC7120(例如,Genbank登记号Nos.GI 17227910或者GI 17230725),巴西固氮螺菌(Azospirillum brasilense)(例如,Genbank登记号No.GI 1174156)和鱼腥蓝细菌(AnabaenaM22983)(例如,Genbank登记号No.GI 152445)。在一些实施方案中,分离的DNA编码具有例如具有SEQ ID NO:4氨基酸序列的或者具有SEQ ID NO:1或75任一个核苷酸序列的根癌土壤杆菌邻氨基苯甲酸酯合成酶。
或者,单体邻氨基苯甲酸酯合成酶可以是任何可获得的邻氨基苯甲酸酯合成酶α-和β-结构域的融合体。这样的α-和β-结构域可以从下面的生物得到:玉米,芸香,硫磺矿硫化叶菌(Sulfolobussolfataricus),鼠伤寒沙门氏菌(Salmonella typhimurium),粘质沙雷氏菌(Serratia marcescens),大肠杆菌(Escherichia coli),根癌土壤杆菌(Agrobacterium tumefaciens),鼠耳芥,苜蓿根瘤菌(Rhizobium meliloti)(例如,Genbank登记号No.GI95177),Mesorhizobium loti(例如,Genbank登记号No.GI 13472468),马尔他布鲁氏菌(Brucella melitensis)(例如,Genbank登记号No.GI 17982357),念珠蓝细菌(Nostoc sp.)PCC7120(例如,Genbank登记号Nos.GI 17227910或者GI 17230725),巴西固氮螺菌(Azospirillum brasilense)(例如,Genbank登记号No.GI 1174156)和鱼腥蓝细菌(Anabaena)M22983(例如,Genbank登记号No.GI152445),大豆,稻,棉花,小麦,烟草或编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。例如,编码这样的α-或β-结构域的核酸能通过使用SEQ ID NO:1-70,75-103中任一个的序列信息来获得。
在另一个实施方案中,本发明提供编码来自玉米的包括SEQ ID NO:5,或SEQ ID NO:66的邻氨基苯甲酸酯合成酶的α-结构域的分离的DNA。这样的分离的DNA可以具有SEQ ID NO:2,67或68的核苷酸序列。分离的DNA能与启动子可操作性连接,并且当在植株中表达时能在植株中提供高水平L-色氨酸。
分离的DNA也能编码突变体邻氨基苯甲酸酯合成酶,或者突变体邻氨基苯甲酸酯合成酶结构域。这样的突变体邻氨基苯甲酸酯合成酶,或者其结构域,能有一处或多处突变。正如本领域技术人员公知的,突变可以是沉默的,能给出具有类似于野生型酶活性的基因产物变体,或者能给出具有改变的酶活性的基因产物衍生物。本发明包括所有的这样的突变体。
突变的分离的DNA能体外或体内从野生型邻氨基苯甲酸酯合成酶核酸产生,并且能编码,例如,一个或多个氨基酸取代,缺失或***。产生具有提高的活性,更高的稳定性,或者对色氨酸或色氨酸类似物反馈抑制敏感较小的邻氨基苯甲酸酯合成酶突变体的突变的分离的DNAs是人们期望的。在一个实施方案中,邻氨基苯甲酸酯合成酶,或者其结构域,对内源L-色氨酸或色氨酸类似物赋予的抑制作用有抗性。例如,邻氨基苯甲酸酯合成酶在色氨酸结合袋处或者降低邻氨基苯甲酸酯合成酶或者其结构域对色氨酸抑制作用的敏感性的别处有一个或多个突变。氨基酸残基中涉及突变的是例如大约48,51,52,293和298位置处的残基。例如,突变可以是:
a)在大约48位,Phe置换Val;
b)在大约48位,Tyr置换Val;
c)在大约51位,Phe置换Ser;
d)在大约51位,Cys置换Ser;
e)在大约52位,Phe置换Asn;
f)在大约293位,Ala置换Pro;
g)在大约293位,Gly置换Pro;或
h)在大约298位,Trp置换Phe;
其中通过将选择的邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列比对确定突变位置。具有这样的突变的邻氨基苯甲酸酯合成酶的例子包括具有SEQ ID NO:58-65,69,70,84-94的那些。
分离的DNA能编码其它元件和功能。包括本领域技术人员想到的任何元件或功能。例如,分离的DNA还可以包括在植物细胞中有功能的启动子,它与编码邻氨基苯甲酸酯合成酶的DNA可操作性连接。分离的DNA还能编码质体转运肽。分离的DNA还能编码选择标记或报道基因。这样的选择标记基因能给所述植物的细胞赋予除草剂抗性,高蛋白质含量,高油含量,高赖氨酸含量,高异亮氨酸含量,高生育酚含量等。所述DNA序列还可以包括编码来自苏云金芽孢杆菌(Bacillusthuringiensis)的杀虫蛋白的一种或几种的序列。
本发明进一步提供包括本发明的分离的DNA的载体。这样的载体可以被用来在原核细胞和真核细胞中表达邻氨基苯甲酸酯合成酶多肽,来转化植物细胞和来产生转基因植物。
本发明还提供包括本发明的分离的DNA的转基因植物。这些分离的DNA在转基因植物中表达能导致转基因植物中,例如植物的种子或者其它部分,L-色氨酸优选游离的L-色氨酸含量提高。该含量高于因不存在此DNA而与转基因大豆植物细胞例如相应的没有转化的细胞或带有相同的遗传背景的没有转化的植物不同的植物的细胞中L-色氨酸的含量。所述DNA优选是可遗传的,其优选通过可繁殖植物到其后代和再到进一步传代完整正常有性周期而传递。
能具有这样的分离的DNA的转基因植物包括双子叶植物,例如,大豆或canola。或者,转基因植物可以是单子叶植物,例如,玉米,稻,小麦,大麦或高梁。
本发明还提供包含本发明的分离的DNA,邻氨基苯甲酸酯合成酶多肽,转基因或载体的转基因植物的种子。
本发明进一步提供含有具有本发明的分离的DNA的植物的至少一部分的动物饲料或人食物。动物饲料或人食物中可以包括的植物的部分包括,例如,种子,叶,茎干,根,块茎,或果实。期望的植物的部分具有本发明的分离的DNA编码的邻氨基苯甲酸酯合成酶的表达提供的提高水平的色氨酸。
本发明进一步提供通过将本发明的分离的DNA导入植物的可再生细胞中而改变优选提高植物(双子叶或单子叶)的色氨酸含量的方法。所述DNA序列优选与植物细胞中可操作的一个启动子可操作性连接。鉴定或筛选转化的细胞,然后再生,得到包括表达功能邻氨基苯甲酸酯合成酶多肽的细胞的植株。在一些实施方案中,编码邻氨基苯甲酸酯合成酶或者其结构域的DNA,是突变体DNA。导入的DNA优选是可遗传的,并且植物优选是可繁殖植物。例如,导入的DNA优选能通过产生后代植株的完全有性循环而传代,并且能给后代的下一代赋予高色氨酸表型。
邻氨基苯甲酸酯合成酶-编码DNAs,优选被***载体中或转基因中,其中还可以包括编码转运肽的DNA序列,例如质体转运肽,和选择标记或报道基因,它们与在靶植物细胞中有功能的一个或多个启动子可操作性连接。启动子可以是,例如,诱导型启动子,组织特异性启动子,强启动子或弱启动子。其它转录或翻译调节元件,例如,增强子或中止子,也可以被功能连接于邻氨基苯甲酸酯合成酶-编码DNA片段。
通过各种各样的转化技术,例如,通过微粒轰击,电穿孔和根癌土壤杆菌介导的转化,和其它本领域能获得的方法,能转化悬浮培养物中的或者作为胚胎,完整组织或器官的细胞。
因此,转化植物的细胞包括天然邻氨基苯甲酸酯合成酶基因和编码外源邻氨基苯甲酸酯合成酶的转基因或其它DNA片段。外源邻氨基苯甲酸酯合成酶在植物细胞中的表达能导致色氨酸及其次级代谢物水平的提高。在一些实施方案中,这样的表达赋予对一定量内源L-色氨酸类似物的耐受性,例如,这样与具有野生型或色氨酸敏感型邻氨基苯甲酸酯合成酶的植物细胞相比,存在至少大约10%以上邻氨基苯甲酸酯合成酶活性。
本发明还提供改变植物中色氨酸含量的方法,包括:(a)向植物可再生细胞中导入包括编码邻氨基苯甲酸酯合成酶结构域和质体转运肽的分离的DNA的转基因,其可操作性连接于在植物细胞中有功能的启动子,得到转化细胞;和(b)从所述转化植物细胞再生转化植株,其中所述植物细胞以相对于相同遗传背景的没有转化的植物中色氨酸含量来说在所述植物中有效提高色氨酸含量的量表达分离的DNA编码的邻氨基苯甲酸酯合成酶结构域。所述结构域可以是邻氨基苯甲酸酯合成酶α-结构域。邻氨基苯甲酸酯合成酶结构域可以有一个或多个突变,例如,降低结构域对色氨酸抑制作用的敏感性的突变。这样的突变可以在例如色氨酸结合袋中。这样的结构域可以是例如来自下面的微生物的邻氨基苯甲酸酯合成酶结构域:根癌土壤杆菌(Agrobacterium tumefaciens),鱼腥蓝细菌(Anabaena)M22983,鼠耳芥,巴西固氮螺菌(Azospirillum brasilense),马尔他布鲁氏菌(Brucella melitensis),大肠杆菌(Escherichia coli),Euglenagracilis,Mesorhizobium loti,念珠蓝细菌(Nostoc sp.)PCC7120,苜蓿根瘤菌(Rhizobium meliloti),芸香,血色红假单孢菌(Rhodopseudomonas palustris),鼠伤寒沙门氏菌(Salmonellatyphimurium),粘质沙雷氏菌(Serratia marcescens),硫磺矿硫化叶菌(Sulfolobus solfataricus),大豆,稻,棉花或玉米。芸香具有其本身的叶绿体转运序列,它可以与邻氨基苯甲酸酯合成酶转基因使用。因此,本领域技术人员当使用芸香DNA时不需要加质体转运序列。
本发明还提供包括编码单体邻氨基苯甲酸酯合成酶或者其结构域的DNA的新的分离的和纯化的DNA分子。这样的邻氨基苯甲酸酯合成酶DNA当在植株中表达时能提供高水平色氨酸。在一些实施方案中,邻氨基苯甲酸酯合成酶基本上对游离L-色氨酸或者其类似物的抑制作用有抗性。本发明涉及的新的DNA序列的例子包括但不限于从下面微生物分离的DNA分子:根癌土壤杆菌(Agrobacterium tumefaciens),鱼腥蓝细菌(Anabaena)M22983,鼠耳芥,巴西固氮螺菌(Azospirillumbrasilense),马尔他布鲁氏菌(Brucella melitensis),大肠杆菌(Escherichia coli),Euglena gracilis,Mesorhizobium loti,念珠蓝细菌(Nostoc sp.)PCC7120,苜蓿根瘤菌(Rhizobiummeliloti),芸香,血色红假单孢菌(Rhodopseudomonas palustris),鼠伤寒沙门氏菌(Salmonella typhimurium),粘质沙雷氏菌(Serratiamarcescens),硫磺矿硫化叶菌(Sulfolobus solfataricus),或玉米。
这些DNA序列包括具有与多肽单链上至少一种其它邻氨基苯甲酸酯合成酶结构域连接的邻氨基苯甲酸酯合成酶的α-结构域的合成的或天然存在的单体形式的邻氨基苯甲酸酯合成酶。单体邻氨基苯甲酸酯合成酶可以是例如邻氨基苯甲酸酯合成酶α-或β-结构域的融合体。这样的邻氨基苯甲酸酯合成酶α-或β-结构域可以来自根癌土壤杆菌(Agrobacterium tumefaciens),鱼腥蓝细菌(Anabaena)M22983,鼠耳芥,巴西固氮螺菌(Azospirillum brasilense),马尔他布鲁氏菌(Brucella melitensis),大肠杆菌(Escherichia coli),Euglena gracilis,Mesorhizobium loti,念珠蓝细菌(Nostocsp.)PCC7120,苜蓿根瘤菌(Rhizobium meliloti),芸香,血色红假单孢菌(Rhodopseudomonas palustris),鼠伤寒沙门氏菌(Salmonella typhimurium),粘质沙雷氏菌(Serratia marcescens),硫磺矿硫化叶菌(Sulfolobus solfataricus),大豆,稻,棉花,小麦,烟草或玉米(zea mays),或者编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。从下面来源分离的邻氨基苯甲酸酯合成酶核酸也在这里举例说明了这样的邻氨基苯甲酸酯合成酶及其结构域:根癌土壤杆菌,(SEQ ID NO:1,75,84-94),玉米,(SEQ ID NO:2,67,68,96),芸香(SEQ ID NO:3),鱼腥蓝细菌M22983,鼠耳芥(SEQID NO:45),巴西固氮螺菌(SEQ ID NO:78),马尔他布鲁氏菌(SEQID NO:79),Mesorhizobium loti(SEQ ID NO:77),念珠蓝细菌PCC7120(SEQ ID NO:80或81),苜蓿根瘤菌(SEQ ID NO:7),血色红假单孢菌(SEQ ID NO:57),硫磺矿硫化叶菌(SEQ ID NO:8),稻(SEQ ID NO:94或95),小麦(SEQ ID NO:97),或烟草(SEQ ID NO:98)。这些核苷酸序列编码来自下面来源的邻氨基苯甲酸酯合成酶或者其α-结构域:根癌土壤杆菌(SEQ ID NO:4,58-65,69,70,);玉米(SEQ ID NO:5,66或101)和芸香(SEQ ID NO:6),鱼腥蓝细菌M22983,巴西固氮螺菌(SEQ ID NO:78),马尔他布鲁氏菌(SEQ IDNO:79),Mesorhizobium loti(SEQ ID NO:77),念珠蓝细菌PCC7120(SEQ ID NO:80或81),苜蓿根瘤菌(SEQ ID NO:7或43),血色红假单孢菌(SEQ ID NO:57或82),硫磺矿硫化叶菌(SEQ ID NO:8或44),稻(SEQ ID NO:99或100),小麦(SEQ ID NO:102),或烟草(SEQ ID NO:103)。
本发明还提供包括编码根癌土壤杆菌邻氨基苯甲酸酯合成酶或者其具有酶促活性的结构域的DNA序列的分离的DNA分子。这样的DNA分子能编码具有SEQ ID NO:4,58-65,69或70的邻氨基苯甲酸酯合成酶,具有邻氨基苯甲酸酯合成酶活性的其结构域或变体。所述DNA分子还可以具有包括SEQ ID NO:1,75,84-94的序列,或者其结构域或变体。也能针对在选择的生物体例如选择的植物或微生物中的表达优化这里提供的任何DNA分子的编码区。对于选择的植物具有优化密码子使用的DNA分子的例子是具有SEQ ID NO:75的根癌土壤杆菌邻氨基苯甲酸酯合成酶DNA分子。
本发明还提供了包括编码玉米邻氨基苯甲酸酯合成酶结构域的DNA序列的分离的和纯化的DNA分子。这样的DNA分子能编码具有SEQID NO:5,66的邻氨基苯甲酸酯合成酶结构域或者具有邻氨基苯甲酸酯合成酶活性的其变体或衍生物。所述DNA分子也可以具有包括SEQID NO:2,67或68的序列,或者其结构域或变体。
本发明进一步提供在严谨条件下与包括SEQ ID NO:1,75或84-94任一个的DNA分子的互补序列杂交的至少8个核苷酸的分离的DNA分子。这样的DNA分子可以是探针或引物,例如,具有SEQ ID NO:9-42或47-56任一个的核酸。或者,所述DNA能包括至多针对选择的邻氨基苯甲酸酯合成酶或者其结构域的整个编码区。这样的DNA还可以包括编码在植物细胞中可操作的启动子的DNA序列和/或编码质体传递肽的DNA序列。本发明进一步涉及用于这些类型的DNA分子在植物和/或微生物中转化和表达的载体。
本发明范围内也包括表现出与这里清楚描述的DNA序列和氨基酸序列序列同一性50%,优选60%,更优选70%,更优选80%,最优选90%,例如,95%至99%的功能邻氨基苯甲酸酯合成酶DNA序列和功能邻氨基苯甲酸酯合成酶多肽。例如,85%同一性意思是当两个序列最大匹配比对时85%的氨基酸是相同的。最大匹配中有空位(两个序列中的一个是匹配的);空位长度是5或更小是优选的,2或更小是更优选的。
或者并且优选地,根据这里使用的该术语,如果应用带有突变数据矩阵并且空位默认值是6或更大的ALIGN程序,它们具有大于5的比对分值,则这两个多肽序列是同源的。参见Dayhoff,M.O.,Atlas ofProtein Sequence and Structure,1972,第5卷,NationalBiomedical Research Foundation,pp.101-110,和该卷的增刊2,pp.1-10。当利用ALIGN程序最优比对时,如果它们的氨基酸同一性大于或等于50%,则这两个序列或者其部分更优选是同源的。
本发明进一步提供产生具有高种子水平色氨酸的转基因植物的表达载体,包含与在植物细胞中有功能的启动子可操作性连接的编码包括与邻氨基苯甲酸酯合成酶β-结构域和质体转运肽连接的邻氨基苯甲酸酯合成酶α-结构域的单体邻氨基苯甲酸酯合成酶的分离的DNA序列。这样的单体邻氨基苯甲酸酯合成酶可以是,例如,根癌土壤杆菌,苜蓿根瘤菌,Mesorhizobium loti,马尔他布鲁氏菌,
念珠蓝细菌PCC7120,巴西固氮螺菌或鱼腥蓝细菌M22983邻氨基苯甲酸酯合成酶。单体邻氨基苯甲酸酯合成酶还可以是邻氨基苯甲酸酯合成酶α-或β-结构域的融合体,这样的邻氨基苯甲酸酯合成酶α-或β-结构域来自根癌土壤杆菌(Agrobacterium tumefaciens),鱼腥蓝细菌(Anabaena)M22983,鼠耳芥,巴西固氮螺菌(Azospirillumbrasilense),马尔他布鲁氏菌(Brucella melitensis),Mesorhizobiumloti,念珠蓝细菌(Nostoc sp.)PCC7120,苜蓿根瘤菌(Rhizobiummeliloti),芸香,血色红假单孢菌(Rhodopseudomonas palustris),硫磺矿硫化叶菌(Sulfolobus solfataricus),鼠伤寒沙门氏菌(Salmonella typhimurium),粘质沙雷氏菌(Serratia marcescens),大豆,稻,棉花,小麦,烟草或玉米,或者编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。
可以以分子水平评价提供提高的色氨酸水平的分离的和纯化的邻氨基苯甲酸酯合成酶DNA的传递,例如,Southern或Northern印迹分析,PCR-为基础的方法,邻氨基苯甲酸酯合成酶的生物化学或免疫检测,或者通过表型分析,即,转化的后代的细胞是否能够在一定量的抑制没有转化的植物细胞生长的色氨酸的氨基酸类似物的存在下生长。
本发明还提供在优选能以商业规模培养的原核或真核宿主细胞例如酵母,昆虫细胞,或细菌中产生邻氨基苯甲酸酯合成酶的方法。该方法包括将包括编码邻氨基苯甲酸酯合成酶或者其结构域,例如单体邻氨基苯甲酸酯合成酶,至少包括α和β邻氨基苯甲酸酯合成酶结构域或者其功能变体,的DNA片段的转基因导入宿主细胞,并且在宿主细胞中表达邻氨基苯甲酸酯合成酶以得到功能邻氨基苯甲酸酯合成酶或者其结构域的步骤。转基因一般包括转录和翻译调节元件,例如,在真核或原核源的宿主细胞中有功能的启动子。优选地,转基因被导入原核细胞,例如大肠杆菌,或者真核细胞,例如酵母或昆虫细胞,已知它们用于产生重组蛋白质。培养转化细胞能导致色氨酸及其衍生物生产的增强,色氨酸及其衍生物能从细胞或者培养基中回收。色氨酸的积累还可以导致微生物和植物中次级代谢物产生的增加,例如植物中含有吲哚的代谢物,例如简单的吲哚,吲哚偶联物,吲哚生物碱,吲哚植物抗毒素和吲哚glucosinalates。
对色氨酸不敏感的邻氨基苯甲酸酯合成酶具有增加分支酸变位酶衍生的代谢物的种类的可能性,包括由于通过分支酸变位酶的色氨酸对苯丙氨酸合成的刺激而从苯丙氨酸衍生的那些。参见Siehl,D.,从分支酸生物合成色氨酸,酪氨酸和苯丙氨酸(The biosynthesis oftryptophan,tyrosine,and phenylalanine from chorismate),PlantAmino Acids:Biochemistry and Biotechnology,BK Singh编著,pp171-204。当存在反馈不敏感邻氨基苯甲酸酯合成酶是可以增加的其它分支酸代谢物包括苯基propanoids,类黄酮,和类异黄酮,以及从邻氨基苯甲酸酯衍生的那些,例如吲哚,吲哚生物碱,和吲哚glucosinolates。这些化合物中很多是重要的植物激素,植物防御化合物,各种健康状态的化学预防药物,和/或药物活性化合物。其合成可能因邻氨基苯甲酸酯合成酶的表达而增加的这些化合物的范围取决于其中表达邻氨基苯甲酸酯合成酶的生物体。本发明涉及在各种原核和真核细胞和生物体中合成色氨酸和其它有用的化合物,包括植物细胞,微生物,真菌,酵母,细菌,昆虫细胞和哺乳动物细胞。
因此,本发明提供制备色氨酸的方法:在足以表达分离的DNA编码的单体邻氨基苯甲酸酯合成酶的条件下培养包括分离的DNA的原核或真核宿主细胞,其中单体邻氨基苯甲酸酯合成酶包括邻氨基苯甲酸酯合成酶α结构域和邻氨基苯甲酸酯合成酶β结构域,并且其中足以表达单体邻氨基苯甲酸酯合成酶的条件包括对于宿主细胞利用单体邻氨基苯甲酸酯合成酶合成色氨酸来说足够的营养和前体。
在各种宿主细胞和/或生物体中表达时可以产生的有用的化合物的例子包括吲哚乙酸和其它植物激素,大豆中发现的对心血管健康重要的异类黄酮化合物,作为对玉米草食性昆虫天敌的信号起作用的挥发性吲哚化合物,十字花科植物家族中发现的抗癌药物,例如吲哚glucosinolates(吲哚-3-甲醇),以及一些真菌物种产生的吲哚生物碱,例如麦角化合物(Barnes等,Adv Exp Med Biol,401,87(1996);Frey等,Proc Natl Acad Sci,97,14801(2000);Muller等,BiolChem,381,679(2000);Mantegani等,Farmaco,54,288(1999);Zeligs,J Med Food,1,67(1998);Mash等,Ann NY Acad Sci,844,274(1998);Melanson等,Proc Natl Acad Sci,94,13345(1997);Broadbent等,Curr Med Chem,5,469(1998))。
本发明还提供在中等,优选高严谨条件下,与邻氨基苯甲酸酯合成酶编码DNA分子的互补序列杂交的至少7个核苷酸碱基的分离的和纯化的DNA分子。这样的分离的和纯化的DNA分子包括编码邻氨基苯甲酸酯合成酶或者其结构域或突变体的新的DNA片段。突变体DNA能编码基本上对游离L-色氨酸或者色氨酸的氨基酸类似物赋予的抑制作用有抗性的邻氨基苯甲酸酯合成酶。这样的邻氨基苯甲酸酯合成酶DNA分子能例如与根癌土壤杆菌,血色红假单孢菌或芸香邻氨基苯甲酸酯合成酶或者其α-结构域,包括其功能突变体杂交。当这些DNA分子编码功能邻氨基苯甲酸酯合成酶或邻氨基苯甲酸酯合成酶结构域时,它们被称作编码邻氨基苯甲酸酯合成酶,邻氨基苯甲酸酯合成酶结构域或者其突变体的一级DNA分子的″变体″。较短DNA分子或寡核苷酸可以被用作用于通过PCR扩增靶DNA序列的引物,或者用作全长基因合成的中间体。
还提供了包括可检测标记的或者能与可检测标记物结合的至少7个核苷酸碱基的新的分离的和纯化的DNA片段的杂交探针,其中所述DNA片段在中等或者优选高严谨条件下与包括编码邻氨基苯甲酸酯合成酶,例如单体邻氨基苯甲酸酯合成酶,或者其结构域,例如α-结构域,包括其基本上对色氨酸的氨基酸类似物赋予的抑制作用有抗性的功能突变体的DNA片段的DNA分子的非编码链杂交。中等和严谨杂交条件对于本领域是公知的,参见,例如Sambrook等,分子克隆:实验手册(Molecular Cloning:A Laboratory Manual)0.47-9.51章节,第二版(1989);也可参见,Sambrook和Russell,分子克隆:实验手册(Molecular Cloning:A Laboratory Manual),第三版(2001年1月15日)。例如,严谨条件是那些:(1)使用低离子强度和高温的条件洗涤,例如,0.015M NaCl/0.0015M柠檬酸钠(SSC);50℃下0.1%十二烷基硫酸钠(SDS),或者(2)在杂交过程中使用变性剂,例如甲酰胺,例如,42℃下,有750mM NaCl,75mM柠檬酸钠的50%甲酰胺和0.1%牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/50mM磷酸钠缓冲液,pH 6.5。另一个例子是42℃下,使用50%甲酰胺,5x SSC(0.75M NaCl,0.075M柠檬酸钠),50mM磷酸钠(pH 6.8),0.1%焦磷酸钠,5x Denhardt′s溶液,超声处理过的鲑精DNA(50微克/毫升),0.1%十二烷酰基硫酸钠(SDS),和10%硫酸葡聚糖,42℃下,用0.2x SSC和0.1%SDS洗涤。
附图简述
图1是pMON61600限制性酶切图。
图2描述根癌土壤杆菌(Agrobacterium tumefaciens)邻氨基苯甲酸酯合成酶DNA序列的翻译序列(上面的序列)(SEQ ID NO:4)和来自苜蓿根瘤菌(Rhizobium meliloti)的邻氨基苯甲酸酯合成酶DNA序列的翻译序列(下面的序列)(SEQ ID NO:7)。
图3是pMON34692限制性酶切图。
图4是pMON34697限制性酶切图。
图5是pMON34705限制性酶切图。
图6(A-B)描述比较根癌土壤杆菌α-结构域序列(SEQ ID NO:4)和硫磺矿硫化叶菌α-结构域序列(SEQ ID NO:8)的邻氨基苯甲酸酯合成酶氨基酸序列比对。
图7(A-B)描述用于诱变SEQ ID NO:1的34个引物的序列(SEQ IDNOs 9-42)。下划线是突变的密码子,下面这种情况是变化的碱基。
图8描述质粒pMON13773的限制性酶切图。
图9描述质粒pMON58044的限制性酶切图。
图10描述质粒pMON53084的限制性酶切图。
图11描述质粒pMON58045的限制性酶切图。
图12描述质粒pMON58046的限制性酶切图。
图13描述质粒pMON38207的限制性酶切图。
图14描述质粒pMON58030的限制性酶切图。
图15描述质粒pMON58006的限制性酶切图。
图16描述质粒pMON58041的限制性酶切图。
图17描述质粒pMON58028的限制性酶切图。
图18描述质粒pMON58042的限制性酶切图。
图19描述质粒pMON58029的限制性酶切图。
图20描述质粒pMON58043的限制性酶切图。
图21(A-D)描述具有SEQ ID NO:4和43(分别来自根癌土壤杆菌和苜蓿根瘤菌)的单体″TrpEG″邻氨基苯甲酸酯合成酶与来自硫磺矿硫化叶菌(SEQ ID NO:44)和鼠耳芥(SEQ ID NO:45)的异四聚体邻氨基苯甲酸酯合成酶的TrpE(α)和TrpG(β)结构域的多序列比对。下划线是接头区。
图22是质粒pMON52214的限制性酶切图。
图23是质粒pMON53901的限制性酶切图。
图24是质粒pMON39324的限制性酶切图。
图25是质粒pMON39322的限制性酶切图。
图26是质粒pMON39325的限制性酶切图。
图27是描述pMON39325转化的大豆种子中游离色氨酸水平的图。每个事件观察5次。
NT代表未转基因的大豆种子。
图28是质粒pMON25997的限制性酶切图。
图29是质粒pMON62000的限制性酶切图。
图30描述截短的大肠杆菌EMG2(K-12wt F+)的trpE基因的序列(K-12wt F+)(SEQ ID NO:46)。该trpE核酸的前30bp和后150bp通过EcoR1限制性酶切位点连接。trpG基因开头接着trpE终止密码子。
图31图示说明大肠杆菌trpE基因框内缺失的构建。
图32(A-C)描述从根癌土壤杆菌分离的邻氨基苯甲酸酯合成酶基因的α-结构域的DNA序列(SEQ ID NO:1)和氨基酸序列(SEQ ID NO:4)。
图33(A-C)描述从玉米分离的邻氨基苯甲酸酯合成酶基因的α-结构域的DNA序列(SEQ ID NO:2)。图33(D)描述从玉米分离的邻氨基苯甲酸酯合成酶基因的α-结构域的氨基酸序列(SEQ ID NO:5)。
图34是质粒pMON58120的限制性酶切图。
图35(A-E)提供了来自根癌土壤杆菌(AgrTu_15889565)(SEQ IDNO:4),苜蓿根瘤菌(RhiMe_136328)(SEQ ID NO:7),Mesorhizobiumloti(MesLo_13472468)(SEQ ID NO:77),巴西固氮螺菌(AzoBr_1717765)(SEQ ID NO:78),马尔他布鲁氏菌BruMe_17986732)(SEQ ID NO:79),念珠蓝细菌(Nostoc_17227910)(SEQ ID NO:80),念珠蓝细菌(Nostoc_17230725)(SEQ ID NO:81),和血色红假单孢菌(RhoPa_TrpEG)(SEQ ID NO:82)的邻氨基苯甲酸酯合成酶氨基酸序列的序列比较。
图36(A-B)提供对于根癌土壤杆菌邻氨基苯甲酸酯合成酶优化的核苷酸序列(SEQ ID NO:75)。
图37(A-C)提供野生型(上链)和优化的(下链)根癌土壤杆菌邻氨基苯甲酸酯合成酶核苷酸序列(SEQ ID NO:1和75)的比对。这两个序列94%相同。
发明详述
本发明提供分离的DNAs,载体,宿主细胞和转基因植物,其中包括当在植物中表达时能提供高水平色氨酸的邻氨基苯甲酸酯合成酶的分离的编码核酸。在一个实施方案中,分离的核酸编码单体邻氨基苯甲酸酯合成酶(AS)。在另一个实施方案中,分离的核酸编码邻氨基苯甲酸酯合成酶,或者其基本上对游离L-色氨酸或色氨酸的氨基酸类似物赋予的抑制作用有抗性的结构域。邻氨基苯甲酸酯合成酶或者其结构域的表达提高种子中色氨酸例如游离色氨酸的水平,使其水平高于没有这种表达的植物中存在的水平。
还提供了制备具有与提高的邻氨基苯甲酸酯合成酶活性相关的核酸的产生高水平色氨酸的转基因植物,制备培养的细胞,植物组织,植物,植物部分和种子的方法。这样的转基因植物优选能将产生高水平色氨酸的能力有性传递给它们的后代。还描述了产生分离的编码突变体邻氨基苯甲酸酯合成酶的DNAs的方法,以及选择超量生产色氨酸和/或对色氨酸类似物有抗性的新的表型的细胞培养筛选技术。例如,为了产生能产生高水平色氨酸的大豆品系,制备并表征包含至少一种本发明的分离的DNAs的转基因大豆细胞,然后再生成植物。一些分离的DNAs对色氨酸类似物赋予的生长抑制作用有抗性。本发明中提供的方法还可以被用来在双子叶植物中,例如其它豆类,以及单子叶植物,例如谷物,产生高水平的色氨酸。
定义
如这里定义的,被转化植物,植物组织,植物部分或植物细胞中色氨酸的″改变的″水平是比相应的没有转化的植物,植物组织,植物部分或植物细胞中发现的水平更高或更低。
如这里使用的,″α-结构域″是结合分支酸并且去除烯醇丙酮酸侧链的酶或酶复合体的一部分。这样的α-结构域可以由TrpE基因编码。在一些情况下,α-结构域是单链多肽,其功能只是结合分支酸并且从分支酸去除烯醇丙酮酸侧链。在另一些情况下,α-结构域是除了结合分支酸并且从分支酸去除烯醇丙酮酸侧链之外还有其它酶功能的较大多肽的一部分。
术语″β-结构域″指将谷酰胺的氨基转移到位于羧酸酯和烯醇丙酮酸酯部分之间的分支酸酯环上的位置的酶或酶复合体的一部分。这样的β-结构域由TrpG基因编码。在一些情况下,β-结构域是单链多肽,其功能只是将谷酰胺的氨基转移到位于羧酸酯和烯醇丙酮酸酯部分之间的分支酸酯环上的位置。在另一些情况下,β-结构域是除了将谷酰胺的氨基转移到位于羧酸酯和烯醇丙酮酸酯部分之间的分支酸酯环上之外还有其它酶功能的较大多肽的一部分。
如这里使用的,″色氨酸的氨基酸类似物″是结构与色氨酸相关并且能结合野生型邻氨基苯甲酸酯合成酶中色氨酸结合位点的氨基酸。这些类似物包括但不限于,6-甲基邻氨基苯甲酸酯,5-甲基色氨酸,4-甲基色氨酸,5-氟色氨酸,5-羟基色氨酸,7-氮杂色氨酸,3β-吲哚丙烯酸,3-甲基邻氨基苯甲酸,等等。
这里关于本发明的DNA分子,序列或片段而使用的术语″基本上由...构成″定义为指DNA分子的主要部分,序列或片段编码邻氨基苯甲酸酯合成酶。除非另有说明,DNA分子,序列或片段一般不编码除邻氨基苯甲酸酯合成酶之外的额蛋白质。
术语″与...互补″在这里用来指能与参照多核苷酸序列的全部或部分杂交的核酸链序列。为了详细说明,核苷酸序列″TATAC″对参照序列5′-TATAC-3′来说同一性100%,但是与参照序列5′-GTATA-3′100%互补。
如这里使用的,″外源″邻氨基苯甲酸酯合成酶是被导入宿主细胞的,优选与其天然的没有转化的细胞中存在的任何DNA序列不相同的,分离的DNA编码的邻氨基苯甲酸酯合成酶。″内源″或″天然″邻氨基苯甲酸酯合成酶是在宿主细胞或生物体中天然存在的邻氨基苯甲酸酯合成酶。
如这里使用的,植物细胞,植物组织,植物部分或植物中游离L-色氨酸的″提高的″或″增加的″水平为是没有转化的植物细胞,植物组织,植物部分或植物中发现的水平的大约2至200倍,优选大约5至150倍,更优选大约10至100倍的水平,即,外源邻氨基苯甲酸酯合成酶核酸或者其结构域的存在没有改变基因组的水平。例如,转化的植物种子中游离L-色氨酸的水平可与没有转化的植物种子(起始材料)中的水平相比较。
编码邻氨基苯甲酸酯合成酶的DNA分子,和编码传递肽的DNA分子或标记物/报道基因是″分离的″,因为它们被从它们的天然来源分离出来并且不再在它们天然存在的细胞中。这样的分离的DNA分子在体外已经至少部分制备出来或者利用,例如,从它们天然被发现的细胞中分离,纯化,并扩增。这样的分离的DNA分子也可以是″重组的″,在于它们已经与外源DNA分子结合。例如,重组DNA可以是与外源启动子或者与宿主细胞内源的启动子可操作性连接的分离的DNA。
如这里使用的,关于邻氨基苯甲酸酯合成酶,术语″单体″意思是两个或多个邻氨基苯甲酸酯合成酶结构域以功能方式***到单一多肽链中。单体邻氨基苯甲酸酯合成酶可以体内组装成二聚体形式。
能从各种各样的生物体分离单体邻氨基苯甲酸酯合成酶核酸和多肽,例如根癌土壤杆菌,鱼腥蓝细菌M22983,巴西固氮螺菌,马尔他布鲁氏菌,Euglena gracilis,Mesorhizobium loti,念珠蓝细菌PCC7120,苜蓿根瘤菌。或者,从选自任何常规单体或多聚体邻氨基苯甲酸酯合成酶基因的结构域的组合能构建单体邻氨基苯甲酸酯合成酶核酸和多肽。这样的微生物包括,例如,根癌土壤杆菌(Agrobacterium tumefaciens),鱼腥蓝细菌(Anabaena)M22983,鼠耳芥,巴西固氮螺菌(Azospirillum brasilense),马尔他布鲁氏菌(Brucella melitensis),Mesorhizobium loti,念珠蓝细菌(Nostocsp.)PCC7120,苜蓿根瘤菌(Rhizobium meliloti),血色红假单孢菌(Rhodopseudomonas palustris),芸香,鼠伤寒沙门氏菌(Salmonella typhimurium),粘质沙雷氏菌(Serratia marcescens),硫磺矿硫化叶菌(Sulfolobus solfataricus),大豆,稻,棉花或玉米,或者编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。编码选择的结构域的核酸可以重组连接。例如,编码α-结构域的C-末端的核酸通过形成磷酸二酯键而与编码β-结构域的N-末端的核酸连接,反之亦然。或者,这样的单链结构域多肽能被化学连接。例如,α-结构域通过其C-末端通过肽键与β-结构域的N-末端连接,反之亦然。
如这里使用的,″天然″基因意指体外没有改变的基因,即,体外没有突变的″野生型″基因。
术语″质体″指植物细胞细胞器种类,包括淀粉形成体,叶绿体,有色体,成油体,eoplasts,白色体,白色粒,和前质体。这些细胞器是自身复制的,并且包含通常称作″叶绿体基因组″的,一种大小大约120至大约217kb的环状DNA分子,取决于植物物种,并且其通常包含倒置的复制区。
如这里使用的,″多肽″指通过肽键全部连接在一起的氨基酸连续链,除了分别具有氨基和羧基并且不以肽键连接的N-末端和C-末端氨基酸。多肽可以是任何长度,并且可以是翻译后修饰,例如,通过糖基化或磷酸化。
如这里使用的,“对色氨酸的氨基酸类似物引起的抑制作用有抗性或耐受的”植物细胞,植物组织或植物是与相应的野生型邻氨基苯甲酸酯合成酶相比L-色氨酸类似物的存在下保留至少大约10%以上的邻氨基苯甲酸酯合成酶活性的植物细胞,植物组织,或植物。一般情况下,“对色氨酸的氨基酸类似物引起的抑制作用有抗性或耐受的”植物细胞,植物组织或植物根据本领域公知的方法测定在一定量的一般抑制没有转化的植物细胞,植物组织,或者植物的色氨酸的氨基酸类似物中能生长。例如,纯合回交转化的编码邻氨基苯甲酸酯合成酶的DNA分子转化的近交植物,所述植物基本上对色氨酸的氨基酸类似物引起的抑制作用有抗性或耐受,该植物在一定量的抑制相应的,即基本上等基因的再生近交植物生长的色氨酸的氨基酸类似物中能生长。
如这里使用的,“对色氨酸或色氨酸的氨基酸类似物引起的抑制作用有抗性或耐受的”邻氨基苯甲酸酯合成酶是当耐受/抗性和野生型邻氨基苯甲酸酯合成酶暴露于等量色氨酸或色氨酸的氨基酸类似物时保留比相应的“野生型”或天然易感邻氨基苯甲酸酯合成酶高大约10%以上活性的邻氨基苯甲酸酯合成酶。优选地,抗性或耐受邻氨基苯甲酸酯合成酶保留比相应的“野生型”或天然易感邻氨基苯甲酸酯合成酶高大约20%以上活性。
关于邻氨基苯甲酸酯合成酶,这里使用的术语″其结构域″包括全长邻氨基苯甲酸酯合成酶的结构或功能片段。结构域包括邻氨基苯甲酸酯合成酶中可鉴定的结构。结构域的例子包括α螺旋,β折叠,活性位点,底物或抑制剂结合位点等。功能域包括实现可鉴定功能,例如色氨酸结合袋,活性位点或底物或抑制剂结合位点的邻氨基苯甲酸酯合成酶的片段。邻氨基苯甲酸酯合成酶的功能域包括能催化色氨酸生物合成途径中的一个步骤的邻氨基苯甲酸酯合成酶的那些部分。例如,α-结构域是trpE编码的并且能将NH3转移给分支酸酯并且形成邻氨基苯甲酸酯的结构域。TrpG能编码β-结构域并且能从谷酰胺去除氨基形成氨。因此,功能域包括酶活性片段和邻氨基苯甲酸酯合成酶的结构域。
还涉及邻氨基苯甲酸酯合成酶的突变体结构域。用来制备突变体结构域的野生型邻氨基苯甲酸酯合成酶核酸包括,例如,编码根癌土壤杆菌(Agrobacterium tumefaciens),鱼腥蓝细菌(Anabaena)M22983,鼠耳芥,巴西固氮螺菌(Azospirillum brasilense),马尔他布鲁氏菌(Brucella melitensis),Mesorhizobium loti,念珠蓝细菌(Nostoc sp.)PCC7120,苜蓿根瘤菌(Rhizobiummeliloti),血色红假单孢菌(Rhodopseudomonas palustris),芸香,硫磺矿硫化叶菌(Sulfolobus solfataricus),鼠伤寒沙门氏菌(Salmonella typhimurium),粘质沙雷氏菌(Serratia marcescens),大豆,稻,棉花,小麦,烟草或玉米(Zea mays)的结构域的任何基因,或者编码在其编码区包括至少一个氨基酸取代的邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。被诱变或连接形成具有提高的色氨酸生物合成活性,更大的稳定性,减小的对色氨酸或者其类似物的敏感性等的单体邻氨基苯甲酸酯合成酶的结构域是特别令人感兴趣的。
一般概念
本发明涉及获得产生提高水平的游离L-色氨酸的植物的新的核酸和方法。编码邻氨基苯甲酸酯合成酶或者其结构域的核酸的导入和表达导致超量生产。这样的邻氨基苯甲酸酯合成酶核酸包括野生型或突变体α-结构域,或者单体形式的邻氨基苯甲酸酯合成酶。单体形式的邻氨基苯甲酸酯合成酶在单多肽链例如与β-结构域连接的α-结构域中包括至少两个邻氨基苯甲酸酯合成酶结构域。
天然植物邻氨基苯甲酸酯合成酶一般对L-色氨酸和它的类似物赋予的反馈抑制作用十分敏感。这样的抑制作用构成调节色氨酸合成途径的关键机理。因此,高度活性,更有效或者通过色氨酸或者其类似物抑制至较小程度的邻氨基苯甲酸酯合成酶或者其结构域可能产生提高水平的色氨酸。根据本发明,根癌土壤杆菌邻氨基苯甲酸酯合成酶特别用于产生高水平色氨酸。
为了在植物或者在选择的宿主细胞中产生高水平色氨酸,分离选择的邻氨基苯甲酸酯合成酶核酸,并且可以体外操作使包括在植物细胞或者其他细胞类型中基因表达所需要的调节信号。因为据报道质体中存在在植物中的色氨酸生物合成途径,外源邻氨基苯甲酸酯合成酶核酸或者被导入质体中或者通过加上编码氨基末端质体传递肽的核酸片段而修饰。这样的质体传递肽能将邻氨基苯甲酸酯合成酶基因产物导入质体。在一些情况下,邻氨基苯甲酸酯合成酶可能已经含有了质体转运序列,在这种情况下没有必要加上一个。
为了改变色氨酸的生物合成,必须将编码邻氨基苯甲酸酯合成酶活性的核酸导入植物细胞或者其他宿主细胞中,并且直接或间接地鉴定这些转化细胞。可以使用整个邻氨基苯甲酸酯合成酶或者其有用部分或结构域。
邻氨基苯甲酸酯合成酶被稳定地***到植物细胞基因组中。控制邻氨基苯甲酸酯合成酶表达的转录信号必须被植物细胞或者其他宿主细胞识别并且在植物细胞或者其他宿主细胞中有功能。也就是,邻氨基苯甲酸酯合成酶必须转录成信使RNA,该在植物细胞核中必须是稳定的并且被完整转运到细胞质中翻译。邻氨基苯甲酸酯合成酶必须具有被植物细胞核糖体识别并合适地翻译的适当的翻译信号。多肽基因产物必须本质上避免在细胞质中受到蛋白水解作用,并且被转运到正确的细区室(例如质体)并且能呈现赋予酶活性的三维构象。邻氨基苯甲酸酯合成酶必须能进一步在色氨酸及其衍生物的生物合成中发挥功能;也就是,为了获得要求的底物并且传递合适的产物,它必须位于催化生物合成中的侧翼步骤的天然植物酶附近(可能在质体中)。
即使符合所有的这些条件,成功超量生产色氨酸也不是可预期的事件。一些转基因的表达可能受到附近染色体元件的负面影响。如果通过诱变减小反馈抑制作用实现高水平色氨酸,可能有另外的控制机理补偿邻氨基苯甲酸酯合成酶步骤降低的调节作用。可能有提高积累的氨基酸的分解速率的机理。色氨酸和相关的氨基酸也必须以对植物没有毒性的水平超量生产。最后,为了允许商业化生产和使用,导入特性必须是稳定的和可遗传的。
编码邻氨基苯甲酸酯合成酶的DNA的分离和鉴定
能通过标准方法鉴定和分离编码邻氨基苯甲酸酯合成酶的核酸,例如,根据Sambrook等,Molecular Cloning:A Laboratory Manual,第二版(1989);Sambrook and Russell,Molecular Cloning:ALaboratory Manual,第三版(2001年1月15日)。例如,通过从来自特殊细胞类型,细胞系,原代细胞,或组织的核酸产生的DNA或cDNA文库进行筛选,能鉴定编码邻氨基苯甲酸酯合成酶或其结构域的DNA序列。用于鉴定和分离邻氨基苯甲酸酯合成酶的文库的例子包括但不限于来自下面生物的cDNA文库:根癌土壤杆菌(Agrobacteriumtumefaciens)菌株A348,玉米近交系B73(Stratagene,La Jolla,加利福尼亚,Cat.#937005,Clontech,Palo Alto,加利福尼亚,Cat.#FL1032a,#FL1032b,和FL1032n),来自玉米近交系Mo17的基因组文库(Stratagene,Cat.#946102),来自玉米近交系B73的基因组文库(Clontech,Cat.#FL1032d),来自鱼腥蓝细菌(Anabaena)M22983(例如,Genbank登记号No.GI 152445)的,来自鼠耳芥,巴西固氮螺菌(Azospirillum brasilense)(例如,Genbank登记号No.GI1174156),马尔他布鲁氏菌(Brucella melitensis)(GI 17982357),大肠杆菌(Escherichia coli),Euglena gracilis,Mesorhizobiumloti(例如,Genbank登记号No.GI 13472468),念珠蓝细菌(Nostocsp.)PCC7120(例如,Genbank登记号Nos.GI 17227910或者GI17230725),苜蓿根瘤菌(Rhizobium meliloti)(例如,Genbank登记号No.GI 95177),芸香,沼泽红假单胞菌(Rhodopseudomonaspalustris),鼠伤寒沙门氏菌(Salmonella typhimurium),粘质沙雷氏菌(Serratia marcescens),硫磺矿硫化叶菌(Sulfolobussolfataricus),大豆,稻,棉花,小麦,烟草,玉米或者其它物种的基因组DNA。此外,通过使用从任何这些物种分离的基因组DNA,mRNA或cDNA的核酸扩增方法能分离邻氨基苯甲酸酯合成酶核酸。
通过从用于杂交于来自其他生物体的邻氨基苯甲酸酯合成酶基因探针的基因组或cDNA筛选噬斑或者通过从用于与特异性识别邻氨基苯甲酸酯合成酶的抗体结合的cDNA表达文库筛选噬斑能实现对编码邻氨基苯甲酸酯合成酶的序列的全部或部分的DNA片段的筛选。与来自携带与抗邻氨基苯甲酸酯合成酶抗体免疫反应的DNA片段的其他生物体和/或噬斑的邻氨基苯甲酸酯合成酶杂交的DNA片段能被亚克隆到载体中,测序和/或被用作鉴定编码期望的邻氨基苯甲酸酯合成酶基因的全部或部分的其他cDNA或基因组序列的探针。能从质粒克隆pDPG600或pDPG602获得用于筛选玉米或植物文库的cDNA探针。
例如通过随即寡聚物引导或者寡聚物dT引导,能制备cDNA文库。使用对邻氨基苯甲酸酯合成酶特异性的探针或抗体能筛选包含DNA片段的噬斑。编码邻氨基苯甲酸酯合成酶基因一部分的DNA片段能被亚克隆,测序和用作鉴定基因组邻氨基苯甲酸酯合成酶基因的探针。通过测定与其他已知的邻氨基苯甲酸酯合成酶的序列同源性或者通过与邻氨基苯甲酸酯合成酶特异性信使RNA的杂交,能证实编码细菌或植物邻氨基苯甲酸酯合成酶的一部分的DNA片段。一旦获得编码邻氨基苯甲酸酯合成酶的5′端,中间和3′端部分的cDNA片段,它们能被用作鉴定和克隆来自基因组文库的邻氨基苯甲酸酯合成酶基因的完全基因组拷贝的探针。
通过标准方法能对邻氨基苯甲酸酯合成酶基因的基因组拷贝部分测序并鉴定基因的5′端,包括通过与其他邻氨基苯甲酸酯合成酶基因同源的DNA序列或者通过RNA酶保护分析,例如,如Sambrook等,Molecular Cloning:A Laboratory Manual,第二版(1989);Sambrook和Russell,Molecular Cloning:A Laboratory Manual,第三版(2001年1月15日)所描述的。利用已知的AS编码区通过序列数据库的计算机检索也能确定靶基因的3′端和5′端。一旦鉴定基因的5′端部分,通过标准方法能获得邻氨基苯甲酸酯合成酶基因的完全拷贝,包括克隆或者使用与基因的5′端的DNA序列互补的寡核苷酸引物的聚合酶链式反应(PCR)。通过杂交,部分序列分析,或者通过玉米邻氨基苯甲酸酯合成酶的表达,能证实邻氨基苯甲酸酯合成酶基因的分离的全长拷贝的存在。
例举的本发明的分离的DNAs包括具有下面核苷酸序列鉴定号的DNAs:
SEQ ID NO:1--根癌土壤杆菌(Agrobacterium tumefaciens)(野生型)
SEQ ID NO:2--玉米(野生型)
SEQ ID NO:3--芸香
SEQ ID NO:46--大肠杆菌EMG2的截短的TrpE基因(K-12wt F+)
SEQ ID NO:67--玉米(C28突变体)
SEQ ID NO:68--玉米(C28+终止子)
SEQ ID NO:71-叶绿体导向肽(g)
SEQ ID NO:73--叶绿体导向肽(a)
SEQ ID NO:75--根癌土壤杆菌(Agrobacterium tumefaciens)(优化的)
SEQ ID NO:76--血色红假单孢菌(Rhodopseudomonas palustris)
SEQ ID NO:83--血色红假单孢菌(Rhodopseudomonas palustris)(RhoPa_TrpEG)
SEQ ID NO:84--根癌土壤杆菌V48F突变体
SEQ ID NO:85--根癌土壤杆菌V48Y突变体
SEQ ID NO:86--根癌土壤杆菌S51F突变体
SEQ ID NO:87--根癌土壤杆菌S51C突变体
SEQ ID NO:88--根癌土壤杆菌N52F突变体
SEQ ID NO:89--根癌土壤杆菌P293A突变体
SEQ ID NO:90--根癌土壤杆菌P293G突变体
SEQ ID NO:91--根癌土壤杆菌F298W突变体
SEQ ID NO:92--根癌土壤杆菌S50K突变体
SEQ ID NO:93--根癌土壤杆菌F298A突变体
SEQ ID NO:94--稻
SEQ ID NO:95-稻同工酶
SEQ ID NO:96-玉米(Anderson的美国专利6,118,047)
SEQ ID NO:97-小麦
SEQ ID NO:98-烟草
一些引物对于实施本发明是有用的,例如具有SEQ ID NO:9-42,47-56的引物。
本发明还涉及编码具有下面氨基酸序列的任何一个的邻氨基苯甲酸酯合成酶的所有的分离的核酸。
SEQ ID NO:4--根癌土壤杆菌(Agrobacterium tumefaciens)(野生型)
SEQ ID NO:5--玉米(野生型)
SEQ ID NO:6--芸香
SEQ ID NO:7—苜蓿根瘤菌(Rhizobium meliloti)
SEQ ID NO:8--硫磺矿硫化叶菌(Sulfolobus solfataricus)
SEQ ID NO:43--苜蓿根瘤菌(Rhizobium meliloti)
SEQ ID NO:44-硫磺矿硫化叶菌(Sulfolobus solfataricus)
SEQ ID NO:45-鼠耳芥
SEQ ID NO:57-血色红假单孢菌(Rhodopseudomonas palustris)
SEQ ID NO:58--根癌土壤杆菌V48F突变体
SEQ ID NO:59--根癌土壤杆菌V48Y突变体
SEQ ID NO:60--根癌土壤杆菌S51F突变体
SEQ ID NO:61--根癌土壤杆菌S51C突变体
SEQ ID NO:62--根癌土壤杆菌N52F突变体
SEQ ID NO:63--根癌土壤杆菌P293A突变体
SEQ ID NO:64--根癌土壤杆菌P293G突变体
SEQ ID NO:65--根癌土壤杆菌F298W突变体
SEQ ID NO:66-玉米C28突变体
SEQ ID NO:69--根癌土壤杆菌S50K突变体
SEQ ID NO:70--根癌土壤杆菌F298A突变体
SEQ ID NO:74-叶绿体导向肽(a)
SEQ ID NO:72--叶绿体导向肽(g)
SEQ ID NO:77--Mesorhizobium loti(MesLo_13472468)
SEQ ID NO:78--巴西固氮螺菌(AzoBr_1717765)
SEQ ID NO:79--马尔他布鲁氏菌(BruMe_17986732)
SEQ ID NO:80-念珠蓝细菌(Nostoc_17227910)
SEQ ID NO:81-念珠蓝细菌(Nostoc_17230725)
SEQ ID NO:82-血色红假单孢菌RhoPa_TrpEG
SEQ ID NO:99-稻
SEQ ID NO:100-稻同工酶
SEQ ID NO:101-玉米(Anderson的美国专利6,118,047)
SEQ ID NO:102-小麦
SEQ ID NO:103—烟草
在实施本发明中可以使用这些核酸和多肽的任何一种,以及其任何突变体,变异体或衍生物。
单体邻氨基苯甲酸酯合成酶
根据本发明,来自植物和非植物物种的单体邻氨基苯甲酸酯合成酶在植物中有功能并且能提供高水平色氨酸。令人惊奇地,来自非植物物种的单体邻氨基苯甲酸酯合成酶在植物中功能非常好,虽然这些单体邻氨基苯甲酸酯合成酶的序列与大多数植物邻氨基苯甲酸酯合成酶具有低同源性。例如,能成功地使用来自不同的象细菌,原生生物和微生物的物种的单体邻氨基苯甲酸酯合成酶。特别地,来自细菌物种例如根癌土壤杆菌,苜蓿根瘤菌,Mesorhizobium loti,马尔他布鲁氏菌,念珠蓝细菌PCC7120,巴西固氮螺菌和鱼腥蓝细菌M2298的单体邻氨基苯甲酸酯合成酶在植物中有功能并且能提供高水平色氨酸,尽管这些单体邻氨基苯甲酸酯合成酶的序列与大多数植物邻氨基苯甲酸酯合成酶具有十分低的序列同一性。
含有例如野生型单体根癌土壤杆菌邻氨基苯甲酸酯合成酶的转基因植物在种子中能产生最多大约10,000至大约12,000ppm色氨酸,平均trp水平范围最多大约7,000至大约8,000ppm。非转基因大豆植物种子中一般最多只有大约100至大约200ppm色氨酸。通过比较,含有加入的突变体玉米α结构域的转基因植物产生多少低一些水平的色氨酸(例如,平均最多大约3000至大约4000ppm)。
单体酶与多聚体酶相比有一些优势。例如,虽然本发明不局限于特定机理,但是单体酶可以提供更大稳定性,协调表达等等。当体内合成异四聚体邻氨基苯甲酸酯合成酶的结构域或亚基时,那些结构域/亚基一定在酶变活性之前合适地组装成异四聚体形式。通过转基因方法对植物加一个邻氨基苯甲酸酯合成酶的结构域可能不提供整个异四聚体酶的超量生产,因为可能没有足够内源量的非转基因结构域来基本上提高功能四聚体的水平。因此,能有利地使用编码单体邻氨基苯甲酸酯合成酶的核酸,载体和酶来超量产生所有的邻氨基苯甲酸酯合成酶的酶学功能。
根据本发明,来自天然生产异四聚体邻氨基苯甲酸酯合成酶的物种的邻氨基苯甲酸酯合成酶结构域可以是融合的或者连接以使当在植物细胞,植物组织或种子中表达时提供能产生高色氨酸水平的单体邻氨基苯甲酸酯合成酶。例如,通过融合或连接邻氨基苯甲酸酯合成酶的α和β结构域使得α-β融合体的序列一般与天然单体邻氨基苯甲酸酯合成酶比对,能制备单体邻氨基苯甲酸酯合成酶。单体和异四聚体邻氨基苯甲酸酯合成酶序列比对的例子如图21和35所示。应用这样的序列比对,可以调节或修饰邻氨基苯甲酸酯合成酶结构域的空间和取向来产生从最适当与天然单体邻氨基苯甲酸酯合成酶最优比对的异四聚体结构域构建的单体邻氨基苯甲酸酯合成酶。这样的融合蛋白能被用来提高植物组织中的色氨酸水平。
异四聚体邻氨基苯甲酸酯合成酶,例如硫磺矿硫化叶菌(Sulfolobus solfataricus)邻氨基苯甲酸酯合成酶(例如,Genbank登记号No.GI1004323),与来自其他植物和微生物物种的异四聚体邻氨基苯甲酸酯合成酶有大约30%至大约87%的序列同源性。单体邻氨基苯甲酸酯合成酶,例如根癌土壤杆菌邻氨基苯甲酸酯合成酶与其他单体酶例如苜蓿根瘤菌(Genbank登记号No.GI 15966140)和巴西固氮螺菌(Genbank登记号No.1717765)邻氨基苯甲酸酯合成酶分别有大约83%和大约52%同一性。Bae等,苜蓿根瘤菌邻氨基苯甲酸酯合成酶基因:克隆,测序,和在大肠杆菌中表达,J.Bacteriol.171,3471-3478(1989);De Troch等,编码邻氨基苯甲酸酯合成酶的巴西固氮螺菌trpE(G)基因的分离和表征,Curr.Microbiol.34,27-32(1997)。
然而,天然单体和天然四聚体邻氨基苯甲酸酯合成酶之间总的序列同一性小于30%。因此,目测比对而不是计算机产生的比对,需要优化比对单体和四聚体邻氨基苯甲酸酯合成酶。邻氨基苯甲酸酯合成酶内划界结构和序列能有利于序列比对。例如,基序″LLES″是形成邻氨基苯甲酸酯合成酶的色氨酸结合袋的β-夹层的β-折叠的部分。这样的划界序列能被用来更可靠地比对散开的邻氨基苯甲酸酯合成酶序列,特别用于确定色氨酸结合中涉及的关键残基。
为了实现邻氨基苯甲酸酯合成酶结构域的融合或连接,选择的TrpE或α-结构域的C-末端与TrpG结构域或β-结构域的N-末端连接。在某些情况下,在结构域之间可以使用接头肽来提供合适的空间和/或柔性。通过单体和异四聚体邻氨基苯甲酸酯合成酶的序列比对能鉴定合适的接头序列。
例如通过杂交,PCR扩增或者如Anderson等,美国专利No.6,118,047所述,能克隆选择的β-结构域。利用标准方法也可以使质体转运肽连接邻氨基苯甲酸酯合成酶编码区。例如,鼠耳芥属小亚基(SSU)叶绿体导向肽(CTP,SEQ ID NO:71-74)可以用于该目的。也参见,Stark等(1992)Science 258:287。融合基因然后如这里所述被***合适的载体中用于植物转化。
邻氨基苯甲酸酯合成酶突变体
本发明涉及的邻氨基苯甲酸酯合成酶突变体可以具有任何类型的突变,包括,例如,氨基酸取代,缺失,***和/或重排。这样的突变体可以是这里具体鉴定的邻氨基苯甲酸酯合成酶核酸和多肽的衍生物或变体。或者,可以从任何可获得的物种,包括这里没有详述鉴定的那些,获得邻氨基苯甲酸酯合成酶突变体。所述突变体,衍生物和变体可以与SEQ ID NO:4-8,43-45,57-66,69-70,77-82,99-103中任一个的氨基酸位置至少有大约30%的同一性,并且具有邻氨基苯甲酸酯合成酶活性。在优选的实施方案中,多肽衍生物和变体与SEQ IDNO:4-8,43-45,57-66,69-70,77-82,99-103中任一个的氨基酸位置至少有大约50%的同一性,并且具有邻氨基苯甲酸酯合成酶活性。在更优选的实施方案中,多肽衍生物和变体与SEQ ID NO:4-8,43-45,57-66,69-70,77-82,99-103中任一个的氨基酸位置至少有大约60%的同一性,并且具有邻氨基苯甲酸酯合成酶活性。在更优选的实施方案中,多肽衍生物和变体与SEQ ID NO:4-8,43-45,57-66,69-70,77-82,99-103中任一个的氨基酸位置至少有大约70%的同一性,并且具有邻氨基苯甲酸酯合成酶活性。在甚至更加优选的实施方案中,多肽衍生物和变体与SEQ ID NO:4-8,43-45,57-66,69-70,77-82,99-103中任一个的氨基酸位置至少有大约80%的同一性,并且具有邻氨基苯甲酸酯合成酶活性。在甚至更加优选的实施方案中,多肽衍生物和变体与SEQ ID NO:4-8,43-45,57-66,69-70,77-82,99-103中任一个的氨基酸位置至少有大约90%的同一性,并且具有邻氨基苯甲酸酯合成酶活性。在甚至更加优选的实施方案中,多肽衍生物和变体与SEQ IDNO:4-8,43-45,57-66,69-70,77-82,99-103中任一个的氨基酸位置至少有大约95%的同一性,并且具有邻氨基苯甲酸酯合成酶活性。
在一个实施方案中,通过在中等,或者,优选地,在高度严谨条件下,SEQ ID NO:1-3,942,46,47-56,67-68,75-76,83-98中任一个,或者其片段或引物,与选择的核酸源杂交,能鉴定邻氨基苯甲酸酯合成酶突变体,变体和衍生物。中等和严谨杂交条件是本领域公知的,参见,例如Sambrook等,分子克隆:实验手册(Molecular Cloning:A Laboratory Manual)0.47-9.51章节,第二版(1989);也可参见,Sambrook和Russell,分子克隆:实验手册(Molecular Cloning:ALaboratory Manual),第三版(2001年1月15日)。例如,严谨条件是那些:(1)洗涤使用低离子强度和高温的条件,例如,0.015MNaCl/0.0015M柠檬酸钠(SSC);50℃下0.1%十二烷基硫酸钠(SDS),或者(2)在杂交过程中使用变性剂,例如甲酰胺,例如,42℃下,有750mM NaCl,75mM柠檬酸钠的50%甲酰胺和0.1%牛血清白蛋白/0.1%Fico11/0.1%聚乙烯吡咯烷酮/50mM磷酸钠缓冲液,pH 6.5。另一个例子是42℃下,使用50%甲酰胺,5x SSC(0.75M NaCl,0.075M柠檬酸钠),50mM磷酸钠(pH 6.8),0.1%焦磷酸钠,5x Denhardt′s溶液,超声处理过的鲑精DNA(50微克/毫升),0.1%十二烷酰基硫酸钠(SDS),和10%硫酸葡聚糖,42℃下,用0.2x SSC和0.1%SDS洗涤。
本发明进一步提供包括能可检测标记或者与可检测标记结合的至少7个核苷酸碱基的新的分离的和纯化的DNA片段的杂交探针和引物。这样的杂交探针或引物能在中等或高度严谨条件下与编码邻氨基苯甲酸酯合成酶的DNA分子的任意一条链杂交。这样的杂交探针和引物的例子包括SEQ ID NO:9-42,47-56中的任一个。
所述邻氨基苯甲酸酯合成酶可以是任何邻氨基苯甲酸酯合成酶,或者其突变体或结构域,例如α-结构域。邻氨基苯甲酸酯合成酶可以是单体邻氨基苯甲酸酯合成酶。功能突变体是优选的,特别是在植物中产生高水平色氨酸的那些,例如,对色氨酸的氨基酸类似物赋予的抑制作用基本上有抗性的那些突变体。
编码邻氨基苯甲酸酯合成酶突变体的核酸也可以自任何适当物种产生,例如,来自编码下面的任何结构域的核酸:根癌土壤杆菌(Agrobacterium tumefaciens),鱼腥蓝细菌(Anabaena)M22983(例如Genbank登记号No.GI 152445),鼠耳芥,巴西固氮螺菌(Azospirillum brasilense)(例如,Genbank登记号No.GI1174156),马尔他布鲁氏菌(Brucella melitensis)(例如,Genbank登记号No.GI 17982357),大肠杆菌(Escherichia coli),Euglenagracilis,Mesorhizobium loti(例如,Genbank登记号No.GI13472468),念珠蓝细菌(Nostoc sp.)PCC7120(例如,Genbank登记号No.GI 17227910或GI 17230725),苜蓿根瘤菌(Rhizobiummeliloti)(例如,Genbank登记号No.GI 95177),芸香,血色红假单孢菌(Rhodopseudomonas palustris),鼠伤寒沙门氏菌(Salmonellatyphimurium),粘质沙雷氏菌(Serratia marcescens),硫磺矿硫化叶菌(Sulfolobus solfataricus),大豆,稻,棉花小麦,烟草,玉米(Zea mays)或者编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。
期望具有提高的邻氨基苯甲酸酯合成酶活性,对色氨酸或色氨酸类似物反馈抑制敏感较小,和/或能在植物中产生增加量色氨酸的能力的邻氨基苯甲酸酯合成酶突变体。这样的突变体在他们表现出的活性水平或类型上确实有功能改变,有时称作这里提供的邻氨基苯甲酸酯合成酶核酸和多肽的″衍生物″。
然而,本发明还涉及带有″沉默″突变的邻氨基苯甲酸酯合成酶变体以及邻氨基苯甲酸酯合成酶核酸。如这里使用的,沉默突变是改变邻氨基苯甲酸酯合成酶的核苷酸序列但是不改变编码的邻氨基苯甲酸酯合成酶的氨基酸序列的突变。核酸突变体编码邻氨基苯甲酸酯合成酶突变体,变体具有当与相应的野生型邻氨基苯甲酸酯合成酶相比较时基本上不改变它的活性的一个或几个氨基酸改变。本发明涉及带有沉默突变的所有的这样的衍生物,变体和邻氨基苯甲酸酯合成酶核酸。
通过几种方法能获得对L-色氨酸或色氨酸的氨基酸类似物有抗性和/或耐受性的突变邻氨基苯甲酸酯合成酶的编码DNA。所述方法包括但不限于:
1.自发变异和在培养物中直接突变体筛选;
2.对任何细胞类型或组织,种子或植物的组织培养物的直接或间接诱变方法;
3.通过例如化学诱变;点特异性或定点诱变(Sambrook等,上文引述),转座子介导诱变(Berg等,Biotechnology,1,417(1983)),和缺失诱变(Mitra等,Molec.Gen.Genetic.,215,294(1989))的克隆的邻氨基苯甲酸酯合成酶基因的诱变;
4.关键残基突变的合理设计;和
5.DNA混排以便将感兴趣的突变***到各种邻氨基苯甲酸酯合成酶核酸中。
例如,可以使用来自可获得的邻氨基苯甲酸酯合成酶蛋白质的蛋白质结构信息来合理设计具有提高的活性或者降低的对色氨酸或色氨酸类似物的敏感性的高度可能性的邻氨基苯甲酸酯合成酶突变体。例如,对于硫磺矿硫化叶菌(Sulfolobus solfataricus)邻氨基苯甲酸酯合成酶,这样的蛋白质结构信息是可得的(Knochel等,Proc.Natl.Acad.Sci.USA,96,9479-9484(1999))。通过将选择的邻氨基苯甲酸酯合成酶氨基酸序列与来自已知结构的邻氨基苯甲酸酯合成酶例如硫磺矿硫化叶菌(Sulfolobus solfataricus)邻氨基苯甲酸酯合成酶的邻氨基苯甲酸酯合成酶氨基酸序列比对能完成突变的合理设计。参见图6,21和35。通过结合结构信息知识和序列同源性能设计邻氨基苯甲酸酯合成酶的预测的色氨酸结合和催化区。例如,色氨酸结合袋中的残基可以被鉴定为改变酶对色氨酸的反馈抑制作用的抗性的突变的潜在的候选。利用这样的结构信息,几种根癌土壤杆菌邻氨基苯甲酸酯合成酶突变体在色氨酸结合中涉及的位点或结构域中合理设计。
利用这样的序列和结构分析,在单体根癌土壤杆菌邻氨基苯甲酸酯合成酶中鉴定了与单体根癌土壤杆菌邻氨基苯甲酸酯合成酶大约位置25-60或200-225或290-300或370-375类似的区,这些对于产生对色氨酸反馈抑制作用较小敏感的活性邻氨基苯甲酸酯合成酶的突变是潜在的有用的残基。更具体地说,与单体根癌土壤杆菌邻氨基苯甲酸酯合成酶中P29,E30,S31,I32,S42,V43,V48,S50,S51,N52,N204,P205,M209,F210,G221,N292,P293,F298和A373类似的氨基酸残基是对于产生对色氨酸反馈抑制作用较小敏感的活性邻氨基苯甲酸酯合成酶的突变潜在的有用的残基。本发明涉及这些位点的任何位点的任何氨基酸取代或***。或者,可以缺失这些位点的任何位点的氨基酸。
可以利用定点诱变在各位点产生氨基酸取代,缺失和***。根癌土壤杆菌邻氨基苯甲酸酯合成酶编码区中进行的特异突变的例子包括下面的:
在大约48位,Phe置换Val(参见例如,SEQ ID NO:58);
在大约48位,Tyr置换Val(参见例如,SEQ ID NO:59);
在大约51位,Phe置换Ser(参见例如,SEQ ID NO:60);
在大约51位,Cys置换Ser(参见例如,SEQ ID NO:61);
在大约52位,Phe置换Asn(参见例如,SEQ ID NO:62);
在大约293位,Ala置换Pro(参见例如,SEQ ID NO:63);
在大约293位,Gly置换Pro(参见例如,SEQ ID NO:64);
在大约298位,Trp置换Phe(参见例如,SEQ ID NO:65);
通过将要诱变的邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列比对,在任何邻氨基苯甲酸酯合成酶的类似位点能进行类似突变。可以用于比对的根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的一个例子是SEQ ID NO:4。
通过传统诱变和基因筛选也能鉴定有用的突变体。通过将酶暴露给游离L-色氨酸或色氨酸的类似物,或者通过利用限制性酶切图谱或者DNA序列分析测定DNA分子中的改变,能检测基因编码的酶的活性的功能变化。
例如,从5-甲基色氨酸耐受细胞系能分离基本上对5-甲基色氨酸耐受的邻氨基苯甲酸酯合成酶编码基因。参见美国专利No.4,581,847,1986年4月15日公开,该专利文献公开内容在此引作参考。简要地说,连续暴露与低水平5-甲基色氨酸,培养部分分化的植物细胞并传代。在正常毒素5-甲基色氨酸水平存在下,细胞或组织生长在5-甲基色氨酸存在下重复传代培养并且表征。培养的细胞的5-甲基色氨酸耐受特性的稳定性可以通过不存在5-甲基色氨酸下将选择的细胞系培养不同时间后分析组织接触5-甲基色氨酸之后的生长来评价。由于具有改变的邻氨基苯甲酸酯合成酶而耐受的细胞系可以通过鉴定正常毒性,即,生长抑制剂水平的5-甲基色氨酸存在下具有酶活性的细胞系来筛选。
根据1986年4月15日公开的美国专利No.4,581,847描述的,通过标准方法能对5-MT-或6-MA-抗性细胞系克隆的邻氨基苯甲酸酯合成酶基因对5-MT,6-MA,或者色氨酸的其他氨基酸类似物的耐受性,该专利文献在此引作参考。
对5-甲基色氨酸抑制作用有降低的敏感性的具有邻氨基苯甲酸酯合成酶的细胞系可以被用来分离5-甲基色氨酸-抗性邻氨基苯甲酸酯合成酶。能产生对5-甲基色氨酸有抗性的细胞系的DNA文库,并且通过与编码邻氨基苯甲酸酯合成酶基因的一部分的cDNA探针杂交,能鉴定编码邻氨基苯甲酸酯合成酶基因的全部或部分的DNA片段。通过克隆和连接或者通过使用合适的引物的PCR合成,能获得改变的基因的完全拷贝。通过测定当暴露给正常毒性水平的5-甲基色氨酸时表达的邻氨基苯甲酸酯合成酶是否保留酶活性,能证实转化的植物细胞中编码邻氨基苯甲酸酯合成酶的改变的基因的分离。参见,Anderson等美国专利No.6,118,047。
对于在选择的生物体,例如,选择的植物或者其他宿主细胞类型中表达,还可以优化这里提供的任何DNA分子的编码区。对于选择的植物有优化的密码子使用的DNA分子的例子是具有SEQ ID NO:75的根癌土壤杆菌邻氨基苯甲酸酯合成酶DNA分子。这种优化的根癌土壤杆菌邻氨基苯甲酸酯合成酶DNA(SEQ ID NO:75)与SEQ ID NO:1具有94%同一性。
转基因和载体
一旦获得和扩增编码邻氨基苯甲酸酯合成酶或者其结构域的核酸,它与启动子可操作性连接,和,任选地,与其他元件可操作性连接,形成转基因。
已知是启动子并且调节基表达的大多数基因具有DNA序列区。一般在原核和真核细胞中编码序列的侧翼DNA序列上游中发现启动子区。启动子序列提供下游基因序列的转录的调节并且一般包括大约50至大约2,000核苷酸碱基对。启动于序列还含有能影响基因表达水平的调控序列,例如增强子序列。一些分离的启动子序列能提供异源基因的基因表达,即,与天然或同源基因不同的基因。还知道启动子序列是强的或弱的或可诱导的。强启动子提供高水平基因表达,而弱启动子提供非常低水平的基因表达。诱导型启动子是响应外部加的物质或者环境或者启发性刺激提供基因表达的开和关的启动子。启动子还能提供组织特异性或发育性调节。对于异源基因是强启动子的分离的启动子序列是有利的,因为它提供足够水平的基因表达,使得容易检测和筛选转化细胞并且在期望时提供高水平基因表达。
本发明转基因中的启动子能提供编码邻氨基苯甲酸酯合成酶的DNA序列表达邻氨基苯甲酸酯合成酶。优选地,表达编码序列,使得在植物组织中,例如在植物的种子中,得到色氨酸水平的提高。在另一个实施方案中,表达编码序列,使得导致提高的植物细胞对反馈抑制作用的耐受性或者对色氨酸的氨基酸类似物的生长抑制作用的耐受性,或者使得导致细胞总的色氨酸含量的增加。启动子还可以是诱导型的,使得外部加的物质引起的基因表达开或关。例如,细菌启动子,例如Piac启动子,可以被诱导至基因表达的不同水平,取决于对转化的细菌细胞所加的异硫丙基半乳糖苷的水平。优选的是使基因结合能在植物中提供组织特异性表达或启动性调节基因表达的启动子。实施本发明中有用的很多启动子对于本领域技术人员是可获得的。
优选的启动子一般包括但不限于在细菌,噬菌体,质体或植物细胞中有功能的启动子。有用的启动子包括CaMV 35S启动子(Odell等,Nature,313,810(1985)),the CaMV 19S(Lawton等,Plant Mol.Biol.,9,31F(1987)),nos(Ebert等,PNAS USA,84,5745(1987)),Adh(Walker等,PNAS USA,84,6624(1987)),蔗糖合酶(Yang等,PNASUSA,87,4144(1990)),α-微管蛋白,napin,肌动蛋白(Wang等,Mol.Cell.Biol.,12,3399(1992)),cab(Sullivan等,Mol.Gen.Genet.,215,431(1989)),PEPCase启动子(Hudspeth等,Plant Mol.Biol.,12,579(1989)),7S-α′-conglycinin启动子(Beachy等,EMBO J,4,3047(1985))或者与R基因复合体相关的那些启动子(Chandler等,The Plant Cell,1,1175(1989))。其他有用的启动子包括噬菌体SP6,T3,和T7启动子。
也能使用质体启动子。大多数质体基因含有用于多亚基质体-编码RNA聚合酶(PEP)和单亚基核-编码RNA聚合酶。Hajdukiewicz等,1997,EMBO J.Vol.16 pp.4041-4048中能找到核-编码聚合酶(NEP)启动子的共有序列和用于几种天然质体基因的特异启动子序列表,该文献在此引作参考。
能使用的质体启动子的例子包括玉米质体RRN(ZMRRN)启动子。当存在鼠耳芥质体RNA聚合酶时,ZMRRN启动子能启动基因表达。能在本发明中使用的类似的启动子是甘氨酸最大质体RRN(SOYRRN)和烟草质体RRN(NTRRN)启动子。鼠耳芥质体RNA聚合酶能识别所有的三种启动子。Hajdukiewicz等和美国专利6,218,145描述了RRN启动子的共性。
此外,能使用转录增强子或增强子副本来提高使用特定启动子的表达。这样的启动子的例子包括但不限于,来自CaMV 35S启动子和章鱼氨酸合酶基因的元件(Last等,美国专利No.5,290,924,1994年3月1日)。例如,涉及构建根据本发明使用的载体,使包括ocs增强子元件。该元件第一次被鉴定是来自土壤杆菌章鱼氨酸合酶(ocs)基因的16bp回文增强子(Ellis等,EMBO J.,6,3203(1987)),并且在至少10个其他启动子中存在(Bouchez等,EMBO J.,8,4197(1989)。提出使用增强子元件,例如ocs元件和特别地该元件的多个拷贝,当在单子叶植物转化背景中使用时,能起作用提高从相邻启动子转录的水平。还包括组织特异性启动子,包括但不限于,根-细胞启动子(Conkling等,Plant Physio.,93,1203(1990)),和组织特异性启动子(Fromm等,The Plant Cell,1,977(1989)),是特别有用的,它们是诱导型启动子,例如ABA-和充盈-诱导型启动子等等。
因为转录起始位点和编码序列起始位点之间的DNA序列,即,没有翻译的前导序列,能影响基因表达,人们还希望使用特定的前导序列。可以使用本领域技术人员可获得的任何前导序列。优选的前导序列指导相关的基因表达的最优化水平,例如,通过提高或保持mRNA稳定性和/或通过防止翻译的不适当的起始(Joshi,Nucl.Acid Res.,15,6643(1987))。这样的序列的选择是本领域技术人员考虑的。涉及来自在双子叶植物中,特别是在大豆中高度表达的基因的序列。
在某些情况下,不需要邻氨基苯甲酸酯合成酶或者其结构域的极端高表达。例如,应用本发明的方法,能产生这样高水平的邻氨基苯甲酸酯合成酶,即底物而不是酶的可获得性,可以限制产生的色氨酸的水平。在这样的情况下,本领域技术人员能选择更高调制或调节水平的表达。这样的本领域技术人员容易调制或调节表达水平,例如,通过使用较弱的启动子或者通过使用发育调节或组织特异性启动子。
感兴趣的编码邻氨基苯甲酸酯合成酶的核酸还包括有利于邻氨基苯甲酸酯合成酶多肽转运到质体中例如叶绿体中的质体转运肽(例如SEQ ID NO:72或74)。编码选择的质体转运肽的核酸(例如SEQ ID NO:71或73)一般框内与邻氨基苯甲酸酯合成酶的编码序列连接。然而,质体转运肽可以置于邻氨基苯甲酸酯合成酶的N-末端或C-末端。
构建体还包括感兴趣的核酸(例如编码邻氨基苯甲酸酯合成酶的DNA)以及作为转录终止信号起作用并且允许得到的mRNA聚腺苷酸化的核酸序列。这样的转录终止信号置于感兴趣的编码区的3′端或下游。涉及的优选的转录终止信号包括来自根癌土壤杆菌的胭脂碱合酶基因的转录终止信号(Bevan等,Nucl.Acid Res.,11,369(1983)),来自根癌土壤杆菌的章鱼合酶基因的终止子,和编码来自马铃薯或番茄的蛋白酶抑制剂I或II的基因的3′端,但是也包括本领域技术人员公知的其他转录终止信号。期望的情况下,还可以进一步包括调节元件,例如Adh内含子1(Callis等,Genes Develop.,1,1183(1987)),蔗糖合酶内含子(Vasil等,Plant Physio.,91,5175(1989))或者TMVω元件(Gallie等,The Plant Cell,1,301(1989))。根据An,Methods in Enzymology,153,292(1987)所述能获得这些3′非翻译调节序列或者在从商业来源例如Clontech,Palo Alto,加利福尼亚获得的质粒中已经存在。3′非翻译调节序列通过标准方法能与邻氨基苯甲酸酯合成酶基因的3′端可操作性连接。用于实施本发明的其他这样的调节元件对于本领域技术人员是公知的。
可选择标记基因或者报道基因在本发明中也是有用的。这样的基因能给表达标记基因的细胞赋予不同的表型,这样使得这样的转化的细胞区别于没有标记的细胞。可选择标记基因赋予一个特性,人们可以通过化学方法,即通过使用选择试剂(例如除草剂,抗生素,或者类似的)来选择。报道基因或者可筛选基因赋予一个特性,通过观察或试验,即,通过′筛选′能加以鉴定(例如,R-位点特性)。当然,合适的标记基因的很多例子是本领域公知的并且可以在实施本发明中使用。
与本发明相关使用的可能的可选择标记物包括但不限于neo基因(Potrykus等,Mol.Gen.Genet.,199,183(1985)),它编码新霉素抗性并且对于使用卡那霉素,G418,等,能被选择;编码bialaphos抗性的bar基因;编码改变的EPSP合酶蛋白(Hinchee等,Biotech.,6,915(1988))从而赋予草甘膦抗性的基因;腈水解酶基因,例如来自臭鼻粘液杆菌(Klebsiella ozaenae)的赋予对溴草腈抗性的bxn(Stalker等,Science,242,419(1988));赋予对咪唑啉酮,磺酰基脲或者其他ALS-抑制化学品的抗性的突变体乙酰乳酸合酶基因(ALS)(欧洲专利申请154,204,1985);甲氨喋呤-抗性DHFR基因(Thillet等,J.Biol.Chem.,263,12500(1988));赋予对除草剂茅草枯抗性的茅草枯脱卤作用酶基因;或者赋予对5-甲基色氨酸的抗性的突变的邻氨基苯甲酸酯合成酶基因。使用突变体EPSP合酶基因时,通过掺入合适的质体转运肽(CTP)可以实现另外的利益。
能在***中使用选择转化体的可选择标记基因的详细描述的实施方案是编码膦丝菌素乙酰基转移酶的基因,例如来自吸水链霉菌(Streptomyces hygroscopicus)的bar基因或者来自产绿色链霉菌(Streptomyces viridochromogenes)的pat基因(美国专利No.5,550,318,在此引作参考)。膦丝菌素乙酰基转移酶(PAT)将除草剂bialaphos,膦丝菌素(PPT)中的活性成分灭活。PPT抑制谷酰胺合酶(Murakami等,Mol.Gen.Genet.,205,42(1986);Twell等,PlantPhysio.,91,1270(1989)),引起氨的快速积累和细胞凋亡。
可以使用的可筛选标记物包括但不限于β-葡糖醛酸糖苷酶或uidA基因(GUS),其编码一种酶,这种酶的各种产色底物是已知的;R-位基因,它编码调节植物组织中花色素苷色素(红色)的生产的产物(Dellaporta等,Chromosome Structure and Function,pp.263282(1988));β-内酰胺酶基因(Sutcliffe,PNAS USA,75,3737(1978)),它编码一种酶,这种酶的各种产色底物是已知的(例如,PADAC,产色头孢菌素);xylE基因(Zukowsky等,PNASUSA,80,1101(1983)),它编码能转换产色儿茶酚的儿茶酚双加氧酶;α-淀粉酶基因(Ikuta等,Biotech.,8,241(1990));酪氨酸酶基因(Katz等,J.Gen.Microbiol.,129,2703(1983)),它编码一种酶,这种酶能将酪氨酸氧化为DOPA和dopaquinone,它们接着缩合形成容易检测的化合物黑色素;β-半乳糖苷酶基因,它编码一种酶,这种酶有很多产色底物;荧光素酶(lux)基因(Ow等,Science,234,856(1986)),可用于生物发光检测;抑或是水母发光蛋白基因(Prasher等,Biochem.Biophys.Res.Comm.,126,1259(1985)),它可以在钙-敏感生物发光检测中使用,或者绿色荧光蛋白质基因(Niedz等,Plant CellReports,14,403(1995))。应用,例如X-射线照相,闪烁计数,荧光分光光度法,暗光影视照相法,光学计数照相法,或多孔发光计,可以检测转化细胞中lux基因的存在。也想到可以开发该***用于生物荧光种群筛选,例如对组织培养板,甚至对整个植株筛选。
另外,可以构建转基因并且用来提供使基因产物导向植物细胞中的胞内隔室或者将蛋白质定向于胞外环境。这一般通过将编码传递或信号肽序列的DNA序列与特定基因编码序列连接能实现。得到的传递,或信号肽将蛋白质分别转运到特定胞内,或胞外目的地,然后可以翻译后去除。转运或信号肽作用有利于蛋白质通过胞内膜转运,例如,液泡,囊,质体和线粒体膜,而信号肽指示蛋白质通过胞外膜。通过帮助蛋白质转运到隔室内或细胞外,这些序列可以增加基因产物的积累。
这样一种用途的特定例子涉及指示邻氨基苯甲酸酯合成酶到特定细胞器,例如质体,而不是胞质。这通过使用使蛋白质质体特异性定向的鼠耳芥属SSU1A转运肽来解释。或者,转基因能包括质体转运肽-编码DNA序列或者编码rbcS(RuBISCO)转运肽的DNA序列,该序列在启动子和编码邻氨基苯甲酸酯合成酶的DNA序列之间可操作性连接(有关质体定向肽的综述,参见Heijne等,Eur.J.Biochem.,180,535(1989);Keegstra等,Ann.Rev.Plant Physio.Plant Mol.Biol.,40,471(1989))。如果转基因被导入植物细胞,转基因还可以包含植物转录终止和聚腺苷酸化信号和与植物邻氨基苯甲酸酯合成酶基因的3′端连接的翻译信号。
可以使用在天然植物邻氨基苯甲酸酯合成酶基因中不编码的外源质体转运肽。质体转运肽一般长度40-70个氨基酸并且翻译后发挥功能指示蛋白质到质体。转运到质体期间或者之后,转运肽裂解,产生成熟蛋白质。编码植物邻氨基苯甲酸酯合成酶的基因的完全拷贝可以包含质体转运肽序列。在那种情况下,不需要将外源获得的质体转运肽序列结合到转基因中。
外源质体转运肽编码序列能从各种各样的植物核基因获得,只要基因产物表达为包括氨基末端转运肽的前蛋白质并且被转运到质体中。已知包括这样的转运肽序列的植物基因产物的例子包括但不限于,核酮糖二磷酸羧化酶的小亚基,叶绿素a/b结合蛋白,核基因编码的质体核糖体蛋白质,一些热激蛋白,氨基酸生物合成酶,例如乙酰乳酸合酶,3-烯醇丙酮酸磷酸莽草酸合酶,二氢吡啶二羧酸合酶,邻氨基苯甲酸酯合成酶等等。在一些情况下,质体转运蛋白质已经在感兴趣的邻氨基苯甲酸酯合成酶基因中编码,在这种情况下不需要加这样的质体转运序列。或者,编码转运肽的DNA片段可以从已知的转运肽的序列例如上面列出的那些的全部或部分化学合成。
不管编码传递肽的DNA片段的来源,它应该包括翻译起始密码子,例如,ATG密码子,并且表达成宿主植物质体中被识别并且适当发挥功能的氨基酸序列。还应该注意传递肽和邻氨基苯甲酸酯合成酶之间连接处的氨基酸序列,在此它被裂解得到成熟酶。一些保守氨基酸序列已经被鉴定并且可以作为指导。传递肽编码序列与邻氨基苯甲酸酯合成酶编码序列的正确融合可能要求导入例如一个适当的限制性酶切位点的一个或两个DNA序列的操作。通过包括定点诱变,化学合成的寡核苷酸接头的***等方法可以实现这个操作。
编码质体转运蛋白质的核酸的正确融合不一定是必需的,只要质体转运蛋白质的编码序列是邻氨基苯甲酸酯合成酶框内的。例如,经常可以包括另外的肽基或氨基酸而不会不利地影响感兴趣的蛋白质的表达或定位。
一旦获得,应用标准方法,质体转运肽序列能适当地连接启动子和转基因中的邻氨基苯甲酸酯合成酶编码区。包含在植物细胞中有功能的启动子并且具有多个克隆位点下游的质粒可以被构建或者从商业来源获得。利用限制性酶可以从启动子下游***质体转运肽序列。然后,邻氨基苯甲酸酯合成酶编码区从质体转运肽序列的3′末端下游和框内立即翻译融合或***。因此,质体转运肽优选与邻氨基苯甲酸酯合成酶的氨基末端连接。一旦形成,转基因可以被亚克隆到其它质粒或载体中。
除了核植物转化之外,本发明还涉及植物质体基因组的定向转化。因此,通过基因向胞内隔室的定向运送也可以实现基因产物导向于植物细胞中胞内隔室。质体基因组的定向转化可以对核转化提供另外的好处。例如,邻氨基苯甲酸酯合成酶的定向质体转化排除了质体定向肽和翻译后转运和处理从相应的核转化体得到的前蛋白质的要求。P.Maliga.Current Opinion in Plant Biology 5,164-172(2002),P.B.Heifetz.Biochimie vol.82,655-666(2000),R.Bock.J.Mol.Biol.312,425438(2001),和H.Daniell等,Trends in Plant Science7,84-91(2002)描述了植物的质体转化,这里引作参考。
构建了包含邻氨基苯甲酸酯合成酶基因的转基因之后,可以将这个盒导入植物细胞中。根据植物细胞的类型,基因表达水平,和该基因编码的酶的活性,编码邻氨基苯甲酸酯合成酶的DNA导入植物细胞中能导致色氨酸的超量生产,赋予对色氨酸的氨基酸类似物,例如5-甲基色氨酸或6-甲基邻氨基苯甲酸酯,的耐受性,和/或另外改变植物细胞的色氨酸含量。
宿主细胞的转化
包括邻氨基苯甲酸酯合成酶基因的转基因可以被亚克隆到已知的表达载体中,AS表达能被检测和/或定量测定。该筛选方法用于鉴定提供邻氨基苯甲酸酯合成酶基因表达的转基因,和转化的植物细胞中质体中邻氨基苯甲酸酯合成酶的表达。
质粒载体包括为容易选择,扩增和转基因在原核和真核细胞中转化而提供的另外的DNA序列,例如,pUC-来源载体,pSK-来源载体,pGEM-来源载体,pSP-来源载体,或pBS-来源载体。附加的DNA序列包括为载体自主复制提供的复制起点,可选择标记基因,优选编码抗生素或除草剂抗性,为将多个位点***DNA序列提供的独特多克隆位点或者转基因中编码的基因,和增强原核和真核细胞转化的序列。
用于在植物和原核细胞中表达的另一种载体是二元Ti质粒(如1990年7月10日公开的Schilperoort等,美国专利No.4,940,838所述),举例描述的是载体pGA582。这种二元Ti质粒载体先前由An在上文引述的文献中表征过。这种二元Ti载体在原核细菌例如大肠杆菌和土壤杆菌中能被复制。土壤杆菌质粒载体也可以被用来将转基因转移给植物细胞。这种二元Ti载体优选包括胭脂碱T DNA右和左缘,以提供有效植物细胞转化,可选择标记基因,T边缘区中独特的多个克隆位点,colE1复制起点和宽的宿主范围复制子。携带本发明的转基因的二元Ti载体能被用来转化原核和真核细胞,但是优选用来转化植物细胞。参见,例如,Glassman等,美国专利No.5,258,300。
然后通过现有方法将表达载体导入原核或真核细胞中。对于单子叶植物和双子叶植物特别有效的转化方法包括但不限于,根据W.J.Gordon-Kamm等(Plant Cell,2,603(1990)),M.E.Fromm等(Bio/Technology,8,833(1990))和D.A.Walters等(PlantMolecular Biology,18,189(1992))所述的对未成熟胚胎或者II型胚胎发生胼胝体细胞的微注射轰击(美国专利No.5,990,390),或者通过D′Halluin等(The Plant Cell,4,1495(1992)),或者Krzyzek(美国专利No.5,384,253,1995年1月24日公开的)描述的对I型胚胎发生胼胝体细胞的电穿孔。也可以通过应用DNA-包被的钨须转化植物细胞(Coffee等,美国专利No.5,302,523,1994年4月12日公开)和通过细胞暴露于包含DNA的脂质体而转化。
选择的邻氨基苯甲酸酯合成酶构建体转化到宿主细胞中之后,宿主细胞可以用于转基因邻氨基苯甲酸酯合成酶与宿主细胞酶促机构结合产生有用的产物。培养转化细胞能导致色氨酸和其它有用化合物的增强的生产,能从细胞或培养基回收这些产物。在各种宿主细胞和/或生物体中表达时可以产生的有用化合物的例子包括色氨酸,吲哚乙酸和其它植物激素,在大豆中发现的对心血管健康重要的类异黄酮化合物,作为对玉米中食草昆虫天敌的信号的挥发性吲哚化合物,抗癌药物例如十字花科植物科中发现的吲哚芥子油苷(吲哚-3-甲醇),以及某吲哚生物碱例如些种的真菌产生的麦角化合物(Barnes等,Adv ExpMed Biol,401,87(1996);Frey等,Proc Natl Acad Sci,97,14801(2000);Muller等,Biol Chem,381,679(2000);Mantegani等,Farmaco,54,288(1999);Zeligs,J Med Food,1,67(1998);Mash等,Ann NY Acad Sci,844,274(1998);Melanson等,Proc Natl AcadSci,94,13345(1997);Broadbent等,Curr Med Chem,5,469(1998))。
色氨酸的积累还可以导致微生物和植物中次级代谢产物的增加的产生,例如,含有吲哚的代谢产物,例如简单的吲哚,吲哚偶联物,吲哚生物碱,吲哚植物抗毒素和植物中的吲哚芥子油苷。
对色氨酸不灵敏的邻氨基苯甲酸酯合成酶具有增加各种分支酸衍生的代谢产物的潜力,包括由于通过分支酸变位酶由于苯丙氨酸合成刺激而从苯丙氨酸衍生的那些。参见Siehl,D.,The biosynthesis oftryptophan,tyrosine,and phenylalanine from chorismate in PlantAmino Acids:Biochemistry and Biotechnology,BK Singh编著,pp171-204。当存在反馈不灵敏邻氨基苯甲酸酯合成酶时,其它可能增加的分支酸衍生的代谢产物包括苯基propanoids,类黄酮,和异类黄酮,以及从邻氨基苯甲酸酯衍生的那些,例如吲哚,吲哚生物碱和吲哚芥子油苷。这些化合物中很多是重要的植物激素,植物防御化合物,各种健康状况的化学预防剂,和/或药学活性化合物。
其合成可能由于邻氨基苯甲酸酯合成酶的表达而增加的这些化合物的范围取决于表达邻氨基苯甲酸酯合成酶的生物体。本领域技术人员容易确定为了产生期望的化合物使用和/或试验哪种生物体和宿主细胞。本发明涉及在各种生物体中合成色氨酸和其它有用化合物,包括植物,微生物,真菌,酵母,细菌,昆虫细胞,和哺乳动物细胞。
选择色氨酸超量生产细胞系的策略
应用组织培养技术有效选择期望的色氨酸类似物抗性,色氨酸超量生产变异体要求仔细确定选择条件。优化这些条件使色氨酸类似物抗性,色氨酸超量生产细胞在培养物中生长和积累,同时抑制大量细胞种群的生长。种群中个体细胞的活力高度取决于相邻细胞的活力这一事实使得情况复杂化。
通过表征化合物与组织的相互作用确定细胞培养物暴露给色氨酸类似物的条件。应该考虑象毒性程度和抑制率这样的因素。需要考虑培养物中细胞中化合物的积累,培养基和细胞中化合物的持久性和稳定性,还有期望的细胞隔室的吸收和传输。另外,确定加入色氨酸是否容易逆反化合物的作用这一点是重要的。
谨慎评价类似物对培养物活性和形态学的影响。尤其重要的是选择对培养物的植物再生能力没有影响的类似物暴露条件。类似物是否杀死细胞或者只是抑制细胞***也影响类似物暴露条件的选择。
选择方案的选择取决于上述考虑。在选择程序中能使用下面简要描述的方案。例如,为了选择对色氨酸类似物引起的生长抑制的抗性的细胞,可以使液体悬浮培养物中最后***的细胞接触高色氨酸类似物水平短暂时间。然后回收并积累存活细胞,之后再接触更长时间。或者,培养组织部分分化的细胞培养物,并且继续暴露于低水平的色氨酸类似物再培养。几次次代培养间隔中逐渐提高浓度。虽然在选择步骤中能使用这些方案,但是本发明不局限于这些操作。
用于植物修饰的基因
如上所述,作为可选择标记基因和报道基因发挥功能的基因在本发明的转基因,载体和植物中能操作结合编码邻氨基苯甲酸酯合成酶或其结构域的DNA序列。另外,对本发明的转基因,载体和植物可以加其它农学性状。这样的性状包括但不限于,昆虫抗性或耐受性;疾病抗性或耐受性(病毒,细菌,真菌,线虫);应激抗性或耐受性,举例来说对干旱,热,寒冷,冰冻,过分潮湿,盐胁迫,氧化胁迫的抗性或耐受性;提高的产率;食物含量和组成;物质外观;雄性不育;干燥;忍受能力;生产力;淀粉性能;油量和油质;等等。人们可以将赋予这样的性状的一个或几个基因***本发明的植物。
昆虫抗性或耐受性
苏云金芽孢杆菌(Bacillus thuringiensis)(或″Bt″)细菌几乎包括20种细菌亚种,各种各样的昆虫物种消化时,它们产生毒性内毒素多肽。内毒素蛋白质(Bt蛋白质)和相应的基因(Bt基因)的生物学和分子生物学的有关综述参见H.R.Whitely等,Ann.Rev.Microbiol.,40,549(1986)和H.Hofte等,Microbiol.Rev.,53,242(1989)。编码各种Bt蛋白质的基因已经被克隆和测序。Bt多肽的一个片段对于对各种鳞翅目害虫的毒性是必要的,并且包含在Bt多肽分子的大约头50%中。结果,截短的Bt基因编码的截短的Bt多肽在很多情况下保留它对很多鳞翅目昆虫害虫的毒性。例如,已经证明HD73和HD1 Bt多肽对美国植物重要的鳞翅目昆虫害虫例如欧洲玉米钻孔虫,切根虫和螟蛉的幼虫有毒性。M.Geiser等,Gene,48,109(1986)和M.J.Adang等,Gene,36,289(1985)分别克隆和测序了编码HD1和HD73Bt多肽的基因,并且利用标准方法,能从得自培养物收集中心(例如Bacillus Genetic Stock Center,Columbus,Ohioor USDA Bt stock collection Peoria,111.)的HD1和HD73株克隆。例如美国专利号6,329,574,6,303,364,6,320,100和6,331,655中描述了Bt基因和多肽的例子。
利用先前用来克隆Bt基因的方法从宿主芽孢杆菌微生物可以克隆编码新的先前没有表征的Bt毒素的DNA,还可以产生Bt毒素新的合成形式。
本发明中有用的Bt基因可以包含包括使得植物中下游定位的Bt序列的转录和翻译起始的DNA序列的5′DNA序列。Bt基因还可以包含包括从能在感兴趣的植物中表达的基因的3′非编码区衍生的序列的3′DNA序列。Bt基因还包括编码苏云金芽胞杆菌产生的毒性Bt多肽或者其毒性部分或者与其具有相当的氨基酸序列同源性的DNA序列。Bt编码序列可以包括:(i)对抗感兴趣的植物的昆虫害虫有活性的与Bt内毒素基本上同源的杀虫蛋白质,例如,HD73或HD1 Bt序列,的编码DNA序列;(ii)Bt内毒素多肽的杀虫活性片段,例如从羧基和/或氨基末端截短的杀虫活性HD73或HD1多肽,的编码序列;和/或(iii)与编码提供例如下面的一些附加好处的多肽的序列框内融合的截短的Bt序列:(a)可选择的基因,例如,赋予对抗生素或除草剂抗性的基因,(b)其产物容易检测或分析的报道基因,例如,荧光素酶或β-葡糖醛酸糖苷酶;(c)编码在稳定Bt蛋白质抗分解或者增强Bt蛋白质抗昆虫效力中有一些附加用途的多肽序列的DNA序列,例如,蛋白酶抑制剂和(d)帮助Bt蛋白质定向于植物细胞内或外的特定隔室的序列,例如,信号序列。
为了获得Bt蛋白质在植物中的最佳合成,将Bt基因的DNA序列调节至更相似的在感兴趣的植物中有效表达的基因也是适当的。因为Bt基因的密码子利用可以与在感兴趣的植物中表达的基因所利用的不相似,可以通过用在植物中更有效表达的那些,例如在感兴趣的植物中经常使用的那些密码子(参见E.Murray等,Nucl.Acids Res.,17,477(1989))来置换这些密码子可以提高Bt基因在植物细胞中的表达。这样的密码子置换要求取代碱基而不改变得到的Bt多肽的氨基酸序列。Bt多肽序列可以与细菌基因或者其片段相同。含有比原细菌基因更高比例优选密码子的完全Bt编码序列,或者其片段,可以利用标准化学合成方法来合成,或者利用标准方法导入或组装成Bt基因,例如定点诱变或DNA聚合和连接等等。
蛋白酶抑制剂还可以提供昆虫抗性。例如,使用来自番茄或马铃薯的蛋白酶抑制剂II基因,pinII,可能是有用的。利用pinII基因和Bt毒素基因的结合也是有利的。编码昆虫消化***抑制剂的其它基因,或者编码有利于产生抑制剂的酶或辅助因子的那些,也是有用的。该组包括oryzacystatin和淀粉酶抑制剂例如来自小麦和大麦的那些。
编码凝集素的基因可以赋予另外的或其它的杀虫性能(Murdock等,Phytochemistry,29 85(1990);Czapla & Lang,J.Econ.Entomol.,83,2480(1990))。有用的凝集素基因包括,例如,大麦和小麦胚芽凝集素(WGA)和稻凝集素。(Gatehouse等,J Sci Food Agric,35,373(1984))。
当导入昆虫害虫中时控制有抗昆虫活性的大的或小的多肽的产生的基因,所述多肽例如溶菌肽,肽激素和毒素和毒物,也可能是有用的。例如,幼年激素酯酶的表达,定向特异昆虫害虫,也可以产生杀虫活性,或者可能引起蜕变停止(Hammock等,Nature,344,458(1990))。
表达编码影响昆虫角质层的完整性的酶的基因的转基因植物也是有用的。这样的基因包括编码例如壳多糖酶,蛋白酶,脂酶的那些基因和产生nikkomycin的基因。影响昆虫蜕皮活性编码基因,例如影响蜕皮激素UDP-葡糖基转移酶的产生的那些,也是有用的。
有利于降低植物对昆虫害虫的营养品质的化合物的产生的酶的编码基因也是有用的。例如,通过改变它的甾醇组成有可能赋予植物杀虫活性。本发明的其它实施方案涉及具有提高的脂肪氧合酶活性的转基因植物。
本发明还提供用于改变植物次级代谢物的方法和组合物。一个实施例涉及改变植物产生DIMBOA,想到,会赋予对欧洲玉米钻孔虫,切根虫和几种其它昆虫害虫的抗性。参见,例如,美国专利6,331,880。DIMBOA从吲哚相关的化合物衍生。本发明提供提高植物细胞和组织中吲哚相关化合物象色氨酸含量的方法。因此,根据本发明,这里提供的方法还可以提高DIMBOA水平,从而提高植物对昆虫的抗性。
在有利于对螟蛉和切根虫的抗性中分别涉及使用能调节玉米面球蛋白的基因和高梁中蜀黍苷产生中涉及的基因的导入。
也可以使用表征具有潜在杀虫活性的蛋白质的其他编码基因。这样的基因包括,例如,可以用作切根虫制止物的豇豆胰蛋白酶抑制剂(CpTI;Hilder等,Nature,330,160(1987));证明用作玉米切根虫制止剂的除虫菌素编码基因(除虫菌素和阿巴美丁,Campbell,W.C.,编著,1989;Ikeda等,J Bacteriol,169,5615 1987);核糖体灭活蛋白质基因;和调节植物结构的基因。还涉及包括抗昆虫抗体基因和编码酶的基因的转基因植物,所述酶能将植物外施用的没有毒性的杀虫剂(杀虫剂原)转化为植物内杀虫剂。
环境或胁迫抗性或耐受性
基因表达能影响植物耐受各种环境胁迫的能力的改进。例如,通过导入“防冻”蛋白质,例如Winter Flounder(Cutler等,J PlantPhysio,135,351 1989)蛋白质或其合成基因衍生物,可以赋予对冷冻温度提高的抗性。通过增强质体中甘油-3-磷酸乙酰基转移酶的表达也可以赋予改进的寒冷耐受性(Wolter等,The EMBO J.,11,4685(1992))。通过过氧化物歧化酶的表达能赋予对氧化胁迫的抗性(Gupta等,Proc.Natl.Acad.Sci USA,90,1629(1993)),并且能通过谷胱甘肽还原酶能加以改进(Bowler等,Ann Rev.Plant Physio,43,83(1992))。
考虑有利地影响植物水含量,总的水势,渗透势和充盈的基因的表达能增强植物耐受干旱的能力,因此是有用的。提出,例如,渗透活性溶质的生物合成的编码基因的表达可以赋予抗干旱的保护作用。这一类是编码甘露糖醇脱氢酶(Lee和Saier,J.Bacteriol.,258,10761(1982))和海藻糖-6-磷酸合酶(Kaasen等,J.Bacteriology,174,889(1992))的基因。
类似地,其他代谢物可以保护酶功能或膜完整性(Loomis等,J.Expt.Zoology,252,9(1989)),因此这些化合物生物合成的编码基因的表达以类似于甘露糖醇的方式可以赋予干旱抗性。在干旱和/或干燥期间有渗透活性和/或提供一些直接的保护作用的天然存在的代谢产物的其他例子包括果糖,赤癣醇,山梨糖醇,半乳糖醇,葡萄糖基甘油,蔗糖,水苏糖,面子糖,脯氨酸,甘氨酸,甜菜碱,ononitol和蒎里醇。参见,例如,美国专利6,281,411。
以结构相似性为基础已经分出三类晚胚胎发生蛋白质(参见Dure等,Plant Molecular Biology,12,475(1989))。所有三组LEA结构基因的表达可以赋予干旱耐受性。水胁迫中诱导的其他类型的可以是有用的蛋白质包括硫醇蛋白酶,醛缩酶和跨膜转运蛋白,它可以在干燥胁迫中赋予各种保护和/或修复型功能。参见,例如,PCT/CA99/00219(Na+/H+交换剂多肽基因)。影响脂质生物合成的基因在赋予干旱抗性中也可能是有用的。
与使从干燥土壤提取增加量的水的特定形态性状相关的基因表达也可能是有用的。胁迫期间提高复制适应性的基因表达也可以是有用的。还提出胁迫期间将内核中止最小化的基因表达会增加要收获的谷粒的量,因此是有价值的。
使植物更有效地使用水,通过基因的导入和表达,可以改善总的性能,甚至当土壤水可利用性是有限的时候。通过导入提高植物将克服与水可利用性相关的全范围胁迫的水利用最大化的能力的基因,可以实现产率性能的稳定和持久。
病害抗性和耐受性
通过基因的表达可以产生对病毒的抗性。例如,定向重要病毒功能的反义基因的表达或编码病毒外被蛋白基因的表达可以赋予对病毒的抗性。
通过导入基因可以赋予对细菌和真菌引起的病害的抗性。例如,所谓″肽抗生素″,发病机理相关(PR)蛋白质,毒素抗性,和影响宿主病原体相互作用例如形态特征的蛋白质的编码基因可能是有用的。
霉菌毒素减少/排除
与植物相关的真菌产生霉菌毒素,包括黄曲霉毒素和fumonisin是使谷粒无用的一个重要的因素。这些真菌生长抑制作用可以减少这些毒性物质的合成,因此减少由于霉菌毒素污染的谷粒损失。可以将基因导入植物,这样抑制霉菌毒素的合成而不干扰真菌生长。此外,为了实现谷粒的减少的霉菌毒素污染,编码能使得霉菌毒素无毒的酶的新基因的表达是有用的。
植物组成或品质
通过各种途径,包括提高天然蛋白质的表达,降低有不好的组成的那些蛋白质的表达,改变天然蛋白质的组成,或者导入编码具有优势组成的整个新的蛋白质的基因,可以改变植物组成,例如,以改善氨基酸平衡。参见,例如,美国专利No.6,160,208(种子储存蛋白质表达的改变)。改变植物油含量的基因导入是有价值的。参见,例如美国专利Nos.6,069,289和6,268,550(ACC酶基因)。例如通过提高分支程度可以导入提高植物的淀粉成分的营养价值的基因,通过延迟其新陈代谢而提高母牛中淀粉利用。
植物农学特征
决定植物在哪里能生长的因素中的两个是生长季节平均日温和霜冻之间的时间长短。植物发育调节中涉及的基因的表达是有用的,例如,玉米中已经鉴定的无叶片和粗造叶鞘基因。
可以向玉米导入改善植物群丛能力和其他植物生长特征的基因。可以赋予更强的茎,改善的根系,或者防止或减少穗掉落的基因的表达对于农民是有价值的。
营养物利用
利用有效营养物的能力可能是植物生长中的限制因素。通过导入基因,可以改变营养物摄入,耐受pH极限,在植物中的调动,贮存积累,和对代谢活性的有效性。这些修饰使得植物更有效利用可利用的营养物。例如,植物中一般存在的和在营养物利用中涉及的酶的活性的提高可以提高营养物的有效性。这样的酶的例子是肌醇六磷酸酶。
雄性不育
雄性不育在杂交种子的生产中是有用的,雄性不育可以通过基因表达产生。通过转化通过导入TURF-13,可以使雄性不育与病害敏感性分开。参见Levings,Science,250:942-947,1990。因为为了饲料目的和为了谷粒生产需要恢复雄性不育,也可以导入编码雄性不育恢复的基因。
抗性细胞系的选择和表征
进行选择,直到回收细胞或组织,发现这些细胞或组织在正常抑制水平色氨酸类似物的存在下生长良好。这些细胞″系″在色氨酸类似物的存在下传代几代,去除没有抗性的细胞后表征。通过将这些细胞系的生长与在各种浓度的各种色氨酸类似物存在下没有选择的细胞或组织的生长相比较,确定获得的抗性的量。通过简单地使选择的细胞系在没有色氨酸的存在下生长不同时间之后分析再次使组织暴露给类似物的生长,可以评价培养的细胞的抗性性状稳定性。利用体外化学研究证实将类似物作用位点改变成对色氨酸类似物的抑制作用敏感性较小的形式,也可以评价抗性细胞系。
可以检测和定量分析转化的细胞中邻氨基苯甲酸酯合成酶基因的瞬时表达。通过RT PCR分析,使用对克隆的邻氨基苯甲酸酯合成酶特异性的抗体的定量蛋白质印迹,或者通过检测色氨酸或色氨酸的氨基酸类似物存在下酶活性,能定量分析基因表达。通过使用对克隆的邻氨基苯甲酸酯合成酶或亚细胞级分特异性的抗体的免疫化学染色方法,接着进行生物化学和/或免疫化学分析,能测定克隆的邻氨基苯甲酸酯合成酶的组织和亚细胞定位。也能评价克隆的邻氨基苯甲酸酯合成酶对试剂的敏感性。然后可以使用提供邻氨基苯甲酸酯合成酶或者对色氨酸的氨基酸类似物或游离L-色氨酸的抑制作用有耐受性的邻氨基苯甲酸酯合成酶表达的基因来转化单子叶植物和/或双子叶植物组织细胞并且再生转化植株和种子。通过检测可选择标记基因或报道基因的存在,例如通过检测可选择除草剂抗性基因,能选择转化细胞。利用对克隆的邻氨基苯甲酸酯合成酶特异性的抗体或者通过RT-PCR分析能检测转基因胚胎发生胼胝体中邻氨基苯甲酸酯合成酶的瞬时表达。
植物再生和种子产生
然后可以使用转化的胚胎发生胼胝体,分生组织,胚芽,叶片等来产生表现出邻氨基苯甲酸酯合成酶基因稳定遗传的转基因植物。通过本领域公知的方法(例如,参见美国专利Nos.5,990,390,5,489,520;和Laursen等,Plant Mol.Biol.,24,51(1994)),使表现出令人满意水平的对色氨酸的氨基酸类似物的耐受性的植物细胞系进行植物再生程序,获得表达耐受性性状的成熟植株和种子。植物再生程序使得躯干胚芽发育并且接着长出根和芽。为了确定耐受性性状在植物分化器官中表达,而不是只在未分化细胞培养物中表达,对再生植物评测植物各部分中相对于再生的没有转化的植株存在的色氨酸水平。应用标准方法,从色氨酸含量和对色氨酸类似物的抗性有变化的转化细胞和组织能产生转基因植物和种子。尤其优选的是叶子或种子的色氨酸含量增加。通过根据Widholm,Biochimica et Biophysica Acta,279,48(1972)所述,通过测定转化细胞中的酶活性,能检测抑制量的色氨酸或者其类似物存在下酶的比活性变化。通过如Jones等,Analyst,106,968(1981)所述标准方法也能测定总的色氨酸含量的变化。
然后从已知表达该性状的细胞系获得成熟植株。如果可能,再生的植株能自花授粉。另外,从再生植株获得的花粉与农业重要的近交系种子长成的植株杂交。在某些情况下,这些近交系植株的花粉被用来对再生植株授粉。通过评价第一代和后代中该性状的独立性来遗传学表征该性状。如果这些性状在商业上特别有用,则在组织培养物中选择的性状在植物中的遗传学和表达是特别重要的。
如果很多不同的杂交组合可以商售的话,则色氨酸超量生产大豆,谷类和其它植物的商业甲酯是最大的。根据例如成熟期,忍受能力或者其它农业性状这样的差异为基础,农民一般播种一种以上的杂种。另外,因为象成熟期,病害和昆虫抗性这样的性状的差异,适合那个地区的杂种并不适合其它地区。因为这样,需要对大量亲本近交系导入色氨酸超量生产作用,使得能产生很多杂交组合。
通过使原始超量生产品系与正常精华品系杂交并且使后代与正常亲本回交,进行逆反过程(回交)。这种杂交产生的后代被隔离,使得一些植株带有负责超量生产的基因,而另一些则不带有这样的基因。带有这样的基因的植株再次与正常亲本杂交,产生超量生产和正常生产再一次隔离的后代。反复如此,直到原始正常亲本转化成超量生产品系,还具有和在正常亲本中最初发现的所有的其它重要属性。对于要转化成色氨酸超量生产品系的每一个精华品系实施分开的额回交程序。
回交之后,对产生好的商业杂种的新的超量生产品系和品系的适当组合评价超量生产以及重要的农学性状组合。产生超量生产品系和杂种,它们确实代表原始正常品系和杂种。这要求评价在各种环境下这些品系或杂种一般是否商业化生长。对于高色氨酸大豆生产,需要杂种的两个亲本对于高色氨酸特征是纯合的。性状令人满意的杂种的亲本系增加并且用于应用标准杂种生产实施的杂种生产。
预期这里产生的转基因植物对于各种商业和研究目的是有用的。能创建转基因植物用于传统农业,是具有有利于从植株收获的谷粒的消费者的性状(例如,人类食物或动物饲料中提高的营养含量)。在这样的应用中,一般为了人类或动物食物中的谷物应用而种植植物。但是,植物的其他部分,包括茎,皮,营养部分等等,也具有用途,包括用作动物青贮饲料,发酵饲料,生物催化,或者用于观赏目的的部分。
在蛋白质或其他分子的商业制备中也发现转基因植物的用途,在这种情况下,从植物部分,种子等提取或纯化感兴趣的分子。植物细胞或组织也可以被培养,体外生长,或者发酵,制备这样的分子。
也可以在商业饲养项目中使用转基因植物,或者可以与相关农作物植株杂交或育种。例如通过原生质体融合,重组DNA编码的改善可以例如从大豆细胞转移给其他物种细胞。
在一个实施方案中,利用微粒轰击,从对5-MT耐受的玉米细胞系分离的并且与35S CaMV启动子连接的玉米邻氨基苯甲酸酯合成酶α-结构域组成的转基因被导入5-MT敏感单子叶或双子叶组织。选择转化的胚芽或分生组织,并且用于产生转基因植株。对转化的胼祗体和转基因植株评价对5-MT或6-MA的耐受性和耐受性状的稳定遗传性。
下面的实施例进一步详细描述本发明并且本发明不受它的限制。
实施例1:从根癌土壤杆菌分离邻氨基苯甲酸酯合成酶和在大肠杆菌中表达。
该实施例描述了从根癌土壤杆菌分离邻氨基苯甲酸酯合成酶和它在大肠杆菌中的表达。
根癌土壤杆菌As的克隆
利用来自苜蓿根瘤菌(Rhizobium meliloti)(GenBank登记号:P15395)的邻氨基苯甲酸酯合成酶编码区的核苷酸和氨基酸序列来检索根癌土壤杆菌C58基因组序列数据库(Goodner等,Science294,2323-2328(2001))。检索由使用blosum62矩阵的tblastn构成(Altschul等,Nucleic Acid Res.,25,33893402(1997))。
使用来自根癌土壤杆菌C58(ATCC No.33970)的基因组DNA作为模板通过PCR克隆在根癌土壤杆菌C58基因组序列数据库中鉴定的AS同源物克隆。使用下面的引物进行第一轮PCR反应:
5′-TTATGCCGCCTGTCATCG-3′(SEQ ID NO:47)和
5′-ATAGGCTTAATGGTAACCG-3′(SEQ ID NO:48)。
基因扩增参数如下:(a)95℃变性30秒,(b)50℃退火30秒和(c)72℃延伸2分钟,利用Expand高保真PCR(Roche Biochemicals),根据生产商指导。
使用上一步得到的扩增模板和下面嵌套引物进行另一轮PCR扩增,得到长度大约2.3Kb的产物:
5′-CTGAACAACAGAAGTACG-3′(SEQ ID NO:49)
5′-TAACCGTGTCATCGAGCG-3′(SEQ ID NO:50)。
纯化的PCR产物连接至pGEM-T easy(Promega Biotech),得到质粒pMON61600(图1)。利用标准测序方法对pMON61600测序。通过与苜蓿根瘤菌邻氨基苯甲酸酯合成酶序列比较证实得到正确序列(图2)。从分离的克隆翻译的氨基酸序列(SEQ ID NO:4)与苜蓿根瘤菌酶有88%同一性(SEQ ID NO:7)(图2)。
缩写″AgroAS″或A.tumefaciens AS在这里同时用来指根癌土壤杆菌邻氨基苯甲酸酯合成酶。
根癌土壤杆菌AS的大肠杆菌表达
构建有利于将癌土壤杆菌AS基因亚克隆到合适的表达载体中的下面的载体。
使用作为模板的pMON61600和下面的引物制备2215碱基对PCR片段:
  5′-AAAAAGATCTCCATGGTAACGATCATTCAGG-3′(SEQ ID NO:51)
5′-AAAAGAA  TTCTTATCACGCGGCCTTGGTCTTCGCC-3′(SEQ ID NO:52)。
用限制酶NcoI和RsrII消化质粒pMON61600。另外,一个409bp片段(通过用NcoI和RsrII消化2215碱基对PCR产物而衍生)之后被连接到消化的pMON61600质粒中,从而置换NcoI/RsrII片段,产生框内NcoI位点和根癌土壤杆菌AS翻译起始密码子(ATG),得到质粒pMON34692(图3)。
通过使用SphI和BamHI限制消化pET30a(Novogen,Inc)产生碱基T7大肠杆菌表达质粒,pMON34697(图4)。纯化得到的4,969bp片段并且与来自pET11d(Novogen,Inc)的338bp SphI和BamHI片段亚克隆。
通过用NcoI和SacI限制消化pMON34697制备质粒pMON34705(图5)。然后纯化得到的5,263bp片段并且用来自包含根癌土壤杆菌AS的pMON 34692的2,256bp NcoI和Sad片段消化。
根据生产商说明(Novogen,Inc),质粒pMON34705转化到大肠杆菌BL21(DE3)(F-ompTHsdSb(rB -mB -)gal dcm(DE3))中。DE3是包含异丙基-1-硫-D-吡喃半乳糖苷(IPTG)可诱导lacUV5控制下的T7RNA聚合酶的染色体拷贝的λDE3的宿主溶素原。
对在37℃下温育过夜(10小时)的卡那霉素板选择转化的细胞。将单一菌落转移给2毫升LB(Luria培养液;每升,10克胰蛋白胨,5克酵母提取物,10克NaCl,和1克葡萄糖(任选的))或2X-YT肉汤(每升,16克胰蛋白胨,10克酵母提取物,5克NaCl),然后放在37℃保温箱中225rpm摇动3小时。取出细胞并且向培养物加入4微升100mM IPTG,再回到37℃保温箱中另外培养2-3小时。取出1mL等份细胞并且在超声处理缓冲液(50mM磷酸钾(pH 7.3),10%甘油,10mM 2-巯基乙醇和10mM MgCl2)中超声处理。得到的溶解的细胞提取物是下面描述的标准AS测试的原材料。结果证明以质粒pMON34705为基础的表达***能产生可溶的酶活性根癌土壤杆菌AS蛋白质,其占总的可溶提取蛋白质的大约50%。
实施例2:通过用野生型根癌土壤杆菌邻氨基苯甲酸酯合成酶转化
         植物来实现高Trp种子水平
表达载体 pMON58120
载体pMON58120(图34)编码264碱基对鼠耳芥属小亚基(SSU)叶绿体定向肽(CTP,SEQ ID NO:71)和2187碱基对野生型根癌土壤杆菌邻氨基苯甲酸酯合成酶(AgroAS)开放读框之间的融合体(SEQ ID NO:1)。参见,Stark等,(1992)Science 258:287。该开放读框的表达由大豆7Sα引物(7Sα′)启动子启动。
在胞质核糖体上翻译之后,融合体(未成熟蛋白质)被导入其中去除了叶绿体定向序列的叶绿体中。CTP1中有两个切割位点。第一个位点是CDS起点(C/M)30碱基对下游,另一个是在初始的甲硫氨酸(C/M)。第二个切割位点看起来没有被有效处理。预计切割得到酶活性数据和trp有效数据证明的具有AS活性的大约70Kd的成熟蛋白质。
用赋予草甘膦抗性的合成CP4基因转化的AS基因,但是和AS基因分开处理CP4基因。FMV启动子启动CP4基因的表达,FMV启动子是来自Figwort Mosaic病毒的35S启动子。草甘膦使选择转化植物。
AS蛋白质的Western分析
对35个pMON58120转化事件分析AgroAS蛋白质序列。用兔产生的抗纯His-标记AgroAS的多克隆抗体检测AgroAS蛋白质。His-标记的全长Agro-AS多肽被CoCalico Biological,INC.用作兔产生多克隆抗体种群的抗原。重组His-标记Agro-AS DNA被***pMON 34701(pet30a-agroAS)表达载体中。在大肠杆菌BL21(DE3)中表达His-AgroAS融合蛋白,并且通过Ni-NTA树脂***(Qiagen protocol)纯化。对于蛋白质分析,以1∶5,000稀释度使用兔抗-AgroAS一抗。以1∶5,000稀释度使用山羊抗-兔碱磷酸酶-偶联二抗。在携带7Sα′Agro AS基因的转基因系中,蛋白质分析始终如一揭示与抗-AgroAS抗体特异***叉反应的单一泳带的存在。在非转基因对照系中没有检测到该泳带。
大豆和鼠耳芥属种子的游离氨基酸分析
氨基酸提取:大约50mg粉碎的大豆种子(5mg的鼠耳芥属)材料放在各离心管中。向各样品(对于鼠耳芥属是100微升)中加入1毫升5%三氯乙酸。让样品涡旋,静置,在室温下搅拌15分钟。然后它们14000rpm位离心15分钟。然后取出一些上清液,放置在HPLC小瓶中并密封。样品在分析对列中保持在4℃。
氨基酸分析:用于氨基酸分析的试剂包括硼酸缓冲液中的OPA试剂(邻-苯二醛和3-巯基丙酸(Hewlett-Packard,PN 5061-3335)),其中硼酸缓冲液是0.4N水溶液,pH 10.2)。根据Agilent TechnicalPublication,″使用Zorbax Eclipse-AAA柱和Agilent 1100HPLC的氨基酸分析″,2000年3月17日描述的,使用Agilent 1100系列HPLC***进行分析。首先,0.5微升的样品与2.5微升的OPA试剂在10微升硼酸缓冲液中反应。其次,将衍生物注Eclipse XDB-C18 5微米,4.6×150mm柱,使用1.2毫升/分钟的流速。利用荧光测定氨基酸浓度:340nm激发,450nm发射。根据表A使用梯度HPLC缓冲液A和B洗脱,其中HPLC缓冲液A是40mM Na2HPO4,pH=7.8,HPLC缓冲液B是9∶9∶2::甲醇∶乙腈∶水。
                     表A:氨基酸洗脱
 时间   0   20   21   26   27
 %缓冲液B   5   65   100   100   100
使用感兴趣的所有的氨基酸从干燥化学品制备氨基酸标准物。脯氨酸分析要求使用9-芴基甲基-氯甲酸酯(FMOC)的另外的衍生化步骤。有时也购买0-100微克/毫升浓度范围的氨基酸标准物。以微克/克种子粉报道样品。使用MS Excel电子表格进行计算,MynabirdTMBROW>Public>Calculators>External Standard.Xls。
野生型土壤杆菌邻氨基苯甲酸酯合成酶在鼠耳芥属中的表达
通过激发性荧光的真空渗透将载体pMON 58120转化到鼠耳芥属植物中,使植物生成转基因种子。收集种子并且筛选可选择标记物(草甘膦抗性)的存在。草甘膦抗性植物生长至成熟并且各植株生成种子,这指定一个转化事件,分析色氨酸含量(表B)。也对选择的转化事件通过如表B所示蛋白质印迹分析来分析成熟种子中表达的土壤杆菌邻氨基苯甲酸酯合成酶蛋白质的存在。
               表B:转化体分析
  转化事件   Trp(ppm)   存在的蛋白质
  7317   2547   +
  7315   2960   +
  7319   3628   +
  7313   3979   +
野生型土壤杆菌邻氨基苯甲酸酯合成酶在大豆中的表达(甘氨酸最大值)
分析的35个大豆转化事件中有33个其种子中trp水平提高,例如,从高于500ppm至最多12,000ppm。在非转基因大豆种子中,trp水平低于200ppm。蛋白质印迹证明含有高含量trp的所有的种子表达邻氨基苯甲酸酯合成酶。表C给出具有高trp水平并且蛋白质印迹分析还对邻氨基苯甲酸酯合成酶邻氨基苯甲酸酯合成酶蛋白质呈阳性的19个大豆结果的数据。
表C:19个携带pMON58120的大豆转基因事件中Agro AS蛋白质
            的存在与色氨酸水平之间的关系
  谱系   Trp最大值(ppm)   Trp平均值(ppm) 存在蛋白质?
  A3244(ctr)   306   96
  GM_A20380:@.   6444   2246.4
  GM_A20532:@.   6055   2556.6
  GM_A22043:@.   10422   2557.2
  GM_A20598:@.   8861   2859.9
  GM_A20744:@.   7121   3373.3
  GM_A20381:@.   6392   3572.9
  GM_A20536:@.   9951   3581.5
  GM_A20510:@.   8916   3592.7
  GM_A20459:@.   8043   3900.4
  GM_A20337:@.   7674   4088.6
  GM_A20533:@.   9666   4183.2
  GM_A20577:@.   6276   4434.1
  GM_A20339:@.   9028   4687.8
  GM_A20386:@.   8487   5285.3
  GM_A20457:@.   11007   5888.9
  GM_A20379:@.   7672   6416.1
  GM_A20537:@.   9163   6695.8
  GM_A20534:@.   12676   7618.2
  GM_A20576:@.   10814   7870.1
Agro AS酶测试
对携带pMON58120构建体的11个转化事件测定邻氨基苯甲酸酯合成酶的比活性。以C.Paulsen(J.Chromatogr.547,1991,155-160)所述方法为基础使用HPLC为基础的终点测试来分析各未成熟大豆种子。简要地说,在研磨缓冲液(100mM Tris pH7.5,10%甘油,1mM EDTA,1mM DTT)中从各种种子获得脱盐提取液,并且用反应缓冲液(100mMtris pH 7.5,1mM分支酸酯,20mM谷酰胺,和10mM MgCl2)温育30分钟。存在或不存在25mM trp下测定Agro AS活性。用磷酸终止反应,并且使用340nm/激发和410nm/发射设置的荧光检测器通过HPLC定量测定形成的邻氨基苯甲酸酯的量。
与非转基因种子相比,未成熟分离转基因种子中AS的比活性范围提高1.5-倍至70-倍,达到6,000pmoles/mg/min这样高。如表D的最后一栏所示,转基因植物中邻氨基苯甲酸酯合成酶活性对色氨酸抑制作用有抗性(参见表D)。
               表D:转基因事件20576中的Agro AS酶活性
  事件   种子编号   比活性(pmoles/mg/min)   比活性(pmoles/mg/min)(+25micromolar Trp)
  对照   3244-1   95.4   42.4
  对照   3244-2   85.5   40.6
  20576   20576-1   6060.2   4407.1
  20576   20576-2   3783.8   1709.4
  20576   20576-3   2768.3   2431.7
  20576   20576-4   4244.08   2125.2
实施例3:包含玉米邻氨基苯甲酸酯合成酶α-亚基基因的载体对大
                      豆的转化
通过用XbaI消化结合部分NcoI消化(参见Anderson等,美国专利6,118,047),从pMON52214(图22)分离玉米邻氨基苯甲酸酯合成酶α-亚基的编码序列。得到的代表邻氨基苯甲酸酯合成酶编码区的1952bp DNA片段进行凝胶纯化,并且把末端变成平端。用BglII和EcoRI消化质粒pMON53901(图23),得到6.8Kb片段。分离之后,将6.8Kb片段的末端变成平端并且去磷酸化。然后使包含ASα基因的1952Kb片段连接平端6.8kb pMON53901片段,产生pMON 39324,一种玉米7SP-ASα-NOS表达载体(图24)。
接着用BamHI消化这种pMON39324,玉米7SP-ASα-NOS盒,得到包含7S启动子和玉米ASα编码序列的2.84Kb DNA片段。用BamHI消化质粒pMON39322(图25),得到5.88kb DNA片段。然后将这两个片段连接在一起得到pMON39325(图26),一种亚克隆到pMON39322中的包含7S启动子-玉米ASα-NOS终止子盒的转化载体。
使用类似方法,从USP启动子下游克隆编码玉米邻氨基苯甲酸酯合成酶α-亚基的序列,产生pMON58130表达载体,从Arc5启动子下游克隆,得到pMON69662表达载体,从Lea9启动子下游克隆,得到pMON69650表达载体,从Per1启动子下游克隆,得到pMON69651表达载体。表E给出这些表达载体列表。
  表E:C28-玉米邻氨基苯甲酸酯合成酶构建体
  种子世代   表达盒   载体名称
  R4   7Sa’-玉米-ASα   PMON39325
  R2   Napin-玉米-ASα   PMON58023
  R1   USP-玉米-ASα   PMON58130
  R1   Arc5-玉米-ASα   PMON69662
  R1   Lea9-玉米-ASα   PMON69650
  R1   Per1-玉米-ASα   PMON69651
这些载体用于植物转化和繁殖实验。使用这里描述的微粒轰击技术,用包含AS的玉米载体转化大豆植物。对于每种类型载体建立几种转基因大豆品系,并且几次传代繁殖,如表E所示。
例如,建立三个携带来自pMON39325的7Sα′-玉米-AS转基因的纯合品系。在两个不同的地点随机化区段设计种植这三个系。得到成熟种子并且分析游离氨基酸含量。对照确定基准trp水平,即三个相应的负等值线和非转基因对照。
表F提供对于pMON39325转化体和对照系R4种子色氨酸,以ppm表示,证明平均非转基因大豆含有大约100-200微克色氨酸/克种子粉,而pMON39325转化体基本上含有更多Trp。也参见图27。
表F:用C28玉米突变体(pMON39325)转化的大豆植物种子中的Trp水平
正等值线数   正等值线平均trp(ppm) 标准差   相应负等值线的平均trp(ppm) 标准差
  39325-1   3467   377   226   55
  35325-2   2623   307   164   20
  35325-3   3715   152   184   64
  35325-4   2833   165   202   146
  35325-5   3315   161   173   34
  35325-6   2394   318   144   22
非转基因对照-7   191   24
非转基因对照-8   118   23
在五种不同的启动子(表E)的控制下表达C28玉米邻氨基苯甲酸酯合成酶的五种其他构建体转化到大豆中,得到转基因植物。每一种构建体产生高trp的结果。表G和H给出详细说明的Per1-C28玉米邻氨基苯甲酸酯合成酶产生的结果的实施例。
表G:C28玉米AS蛋白质表达与携带Per1-C28玉米AS(pMON69651)
       的三个转基因事件中提高的Trp水平的关系
  系谱   Trp平均值(ppm)   是否存在蛋白质
  对照   96   否
  22689   2375   是
  22787   1707   是
  22631   1116   是
表H详细描述用pMON69651表达载体转化的大豆植株的R1种子中C28玉米AS的酶活性。
表H:pMON69651转化体的R1种子中C28玉米AS的比活性。
  事件   种子编号   比活性(pmoles/mg/min)   比活性(pmoles/mg/min)(+25micromolar Trp)
  对照   51.6   2.6
  22689   22689-1   130.9   64.7
  22689-2   115.3
  22689-3   148.5   61.1
  22689-4   149.5
  22698-5   133.8   60.3
这些结果表明当用C28玉米AS基因转化大豆植物组织时色氨酸大大增加。表G所示高trp水平与AS蛋白质的存在以及与对于转基因酶的提高的比活性(比非转基因对照高2.5倍)有关(表H)。如表H所示-以及如C28玉米AS酶的生化性质预计的-转基因事件的比活性是色氨酸抗性的。
实施例4:根癌土壤杆菌邻氨基苯甲酸酯合成酶色氨酸反馈不敏感
                    突变体的合理设计。
该实施例描述包含具有不同程度的对色氨酸或色氨酸类似物反馈抑制作用敏感或不敏感的突变体根癌土壤杆菌邻氨基苯甲酸酯合成酶的载体。
根癌土壤杆菌突变体邻氨基苯甲酸酯合成酶基因的产生。
利用来自硫磺矿硫化叶菌(Sulfolobus solfataricus)邻氨基苯甲酸酯合成酶的蛋白质结构信息作为指导(Knochel等,Proc.Natl.Acad.Sci.USA,96,9479-9484(1999)),利用有把握设计色氨酸结合中涉及的几种残基的蛋白质信息,合理设计几种根癌土壤杆菌邻氨基苯甲酸酯合成酶突变体。通过使根癌土壤杆菌邻氨基苯甲酸酯合成酶基因与来自硫磺矿硫化叶菌的邻氨基苯甲酸酯合成酶氨基酸序列比对(图6)来实现。通过结合结构信息和序列同源性知识推导根癌土壤杆菌的色氨酸结合和催化区。结合袋中的残基被鉴定为改变以提供对色氨酸的反馈抑制作用的抗性的可能的候选者。
以硫磺矿硫化叶菌邻氨基苯甲酸酯合成酶的结构分析为基础,提出色氨酸结合中涉及氨基酸E30,S31,I32,S42,V43,N204,P205,M209,F210,G221,和A373。以对对比对为基础,硫磺矿硫化叶菌的N204,P205,和F210在单体邻氨基苯甲酸酯合成酶中分别作为残基N292,P293,和F298也是保守的。
但是,由于多处***和缺失,硫磺矿硫化叶菌和根癌土壤杆菌酶的N-末端区高度趋异。因为这个原因,需要人工设计色氨酸调节中涉及的根癌土壤杆菌邻氨基苯甲酸酯合成酶的N-末端区的残基(图6)。结构分析表明色氨酸结合袋中基序″LLES″形成β-折叠。表明该结构在异四聚体酶中高度保守。然后使用″LLES″基序作为界标,将已知的单体酶与硫磺矿硫化叶菌序列手工比对(图21)。以这种蛋白质信息分析为基础,色氨酸结合中也同样涉及根癌土壤杆菌AS中的氨基酸残基V48,S50,S51,和N52。
使用根癌土壤杆菌单体酶中比对的推导的色氨酸结合残基,对于减小酶对色氨酸抑制作用的敏感性,几种不同的策略是合理的。这些取代包括,例如,扩大色氨酸-结合袋(F298A),缩窄结合袋(V48F,V48Y,S51F,S51C,N52F,F298W),提高结合袋极性(S50K),或通过改变蛋白质主链构象而改变结合袋性状(P293A,P29G)。
根癌土壤杆菌AS定点诱变
利用定点诱变产生10个单氨基酸取代6个位点。利用Quik ChangeTM定点诱变试剂盒(Stratagene),将突变导入根癌土壤杆菌ASpMON34705中。用于定点诱变的引物是SEQ ID NO:9-42(图7;F=正向,R=反向)。各个引物序列对于序列中特定位置处核酸的改变是特异性的,因此改变编码新的氨基酸的编码密码子。例如,S51 C指根癌土壤杆菌AS肽序列中氨基酸位置51处丝氨酸变为半胱氨酸。
诱变之后,再次确认整个基因的序列,并且如下文对于野生型酶所述从大肠杆菌表达变体并纯化。使用实施例1所述的T7表达***,将包含突变体根癌土壤杆菌AS的得到的质粒适当克隆到超量生产蛋白质的质粒中。
根癌土壤杆菌AS蛋白质表达和纯化
根据实施例1所述在大肠杆菌中表达根癌土壤杆菌AS野生型和突变体酶。所有的根癌土壤杆菌AS酶,包括野生型及其突变体的纯化在4℃下进行。细胞(湿重大约1克)悬浮于20ml纯化缓冲液(50mM磷酸钾,pH 7.3,10mM MgCl2,10mM 2-巯基乙醇,10%甘油)中,并且超声处理溶解(Branson sonifier Cell Disruptor,W185)。匀浆以20,000xg离心15分钟之后收集上清液。对上清液进行硫酸铵分级分离法(30至65%饱和)。以20,000xg离心15分钟之后收集沉淀并且溶解于3ml纯化缓冲液中,之后,全部加载到Econo-Pac 1 ODE脱盐柱子上,柱子用相同的缓冲液预先平衡过。通过显影分析检测含有酶的级分并且合并。合并的酶(4.3毫升)加载给用相同的缓冲液平衡过的10ml DEAE Sephacel(Pharmacia Biotech)柱子(1.5×7.5cm)。用30ml纯化缓冲液冲洗柱子,并且用相同缓冲液中30ml的50mM NaCl洗脱酶。合并含有高AS活性的级分并且用65%饱和的硫酸铵沉淀并且分离,并且如上所述脱盐。合并含有酶的级分并且在-80℃下保存。
邻氨基苯甲酸酯合成酶测定和动力学分析
在25℃下,在含有100mM磷酸钾,pH 7.0,10mM MgCl2,1mM二硫苏糖醇,200μM分支酸酯和10mM L-谷酰胺的测试缓冲液中对根癌土壤杆菌AS进行标准分析。通过向反应混合物中加30微升的酶并且混合开始反应。通过320nm吸收度增加直接监测邻氨基苯甲酸酯的形成3分钟。以吸收度变化对反应时间的斜率为基础计算反应初始速度,以每秒吸收度提高为单位。在总容积是1ml的含有100mM磷酸钾,pH7.0,10mM MgCl2,1mM二硫苏糖醇,和10mM L-谷酰胺和2.5-100pM分支酸酯之间不同浓度的分支酸酯的测试缓冲液中测定分支酸酯的Km(Km Cho)。在总容积是1ml的含有100mM磷酸钾,pH 7.0,10mM MgCl2,1mM二硫苏糖醇,200μM分支酸酯和0.1-2mM L-谷酰胺之间的不同浓度的L-谷酰胺的测试缓冲液中测定谷酰胺的Km(Km Gln)。在总容积是1ml的含有100mM磷酸钾,pH 7.0,10mM MgCl2,1mM二硫苏糖醇,10mM L-谷酰胺,200μM分支酸酯和0.1-10mM L-色氨酸之间的不同浓度的L-色氨酸的测试缓冲液中测定色氨酸的IC50(IC50 Trp)。数据与非线性回归程序拟合之后计算AS的动力学参数和IC50(GraFit)。
几种突变体证明对色氨酸抑制作用的减小的敏感性,同时仍然保留比得上野生型酶的酶活性(表I)。这些结果证明对色氨酸抑制作用敏感性程度能被降低,例如,通过诱变邻氨基苯甲酸酯合成酶的色氨酸结合袋中的氨基酸和通过优化证明反馈不敏感性的突变。
表I:邻氨基苯甲酸酯合成酶活性和色氨酸对根癌土壤杆菌AS突变体的作用
突变 密码子   Km Cho(μM)   Km Gln(mM)   kcat(s-1)   .kcat/Km Cho(μM-1s-1)   IC50 Trp(μM)
  WTV48FV48YS50KS51FS51CN52FP293AP293GF298AF298W TTTTATAAGTTCTGCTTCGCGGGGGCCTGG   8.04.54.213102.85.524339.218   0.110.080.100.010.060.080.040.160.070.100.14   0.430.240.180.130.080.150.210.350.480.460.44   5.37×10-25.33×10-24.28×10-21.00×10-20.80×10-25.36×10-23.82×10-21.46×10-21.45×10-25.00×10-22.44×10-2   51506500.1>32,0001,5004114175.5450
实施例5:产生色氨酸反馈不敏感突变体的根癌土壤杆菌AS的随机诱变
除了实施例4描述的合理设计方案,产生邻氨基苯甲酸酯合成酶的反馈不敏感性突变体的其他策略包括但不限于随即诱变。例如,通过化学诱变(分离的DNA或者整个生物体),易错PCR,和DNA改组,能实现根癌土壤杆菌AS的随机诱变。该实施例描述了化学诱变的利用,接着基因筛选。基因筛选方法对于从其他诱变技术得到的期望的突变体的选择也是有用的。
含有根癌土壤杆菌AS的大肠杆菌表达质粒的制备
使用正向引物5′端上包含Nco1位点和反向引物3′端上的Xba1位点的引物通过PCR扩增来自根癌土壤杆菌AS克隆pMON61600的可读框(实施例1描述的SEQ ID NO:1):
5′-CATCCCATGGATGGTAACGATCATT CAGGAT-3′(SEQ ID NO:55);和5′-GATGTCTAGAGACAC TATAGAATACTCAAGC-3′(SEQ ID NO:56).
得到的PCR产物连接到pMON25997中(图28),其有通过用BspH1和Xba1消化去除的bktB可读框(Slater等,J.Bact.180,p1979-1987(1998)),产生质粒pMON62000(图29)。pMON62000是基础质粒,用于色氨酸营养缺陷型诱变和补充(EMG2ΔtrpE)。
大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE的制备
使用***载体pKO3从大肠杆菌菌株EMG2(K-12wt F+)(E.coliGenetic Stock Center)的染色体trpE基因缺失1,383碱基对来构建大肠杆菌菌株(EMG2ΔtrpE)。PCR扩增大肠杆菌基因组DNA的两个扩增子。第一个扩增子大约是1.5kb并且3′端包含trpE ORF的前30bp。在扩增子在5′端包含一个BamH1 s位点,在3′端包含一个EcoR1位点。第二扩增子大约是1kb并且在5′端包含trpE ORF的后150bp。该扩增子在5′端包含一个EcoR1位点,在3′端包含一个Sa11位点。用合适的酶消化两个扩增子并且在EcoR1位点连接在一起,产生trpE的框内缺失。图30给出得到的截短基因的序列(SEQ ID NO:46)。TrpE缺失扩增子在BamH1和Sa11位点连接到pKO3中。根据A.J.Link等,J.Bacteriol,179,6228(1997)所述进行基因切割。
pMON62000对大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE的补充
用pMON62000转化大肠杆菌菌株Ec-8(EMG2ΔtrpE)并且在M9基本培养基上平板培养,确定加pMON62000是否补充缺失。质粒对照(缺根癌土壤杆菌AS***物)和对照株Ec-8也在M9基本培养基上平板培养和在有40微克/毫升色氨酸的M9基本培养基上平板培养。
在没有色氨酸的M9上发现pMON62000转化的菌株Ec-8生长,对对照没有发现生长,表明pMON62000补偿了Ec-8菌株的trpE缺失。
pMON62000的羟胺诱变和突变体的遗传筛选
为了制备邻氨基苯甲酸酯合成酶的突变体,用化学诱变剂羟胺诱变pMON62000。在微量离心管中混合下面的成分:20微克pMON62000质粒DNA和4O微升2.5M羟胺,pH 6.0。用0.1M NaH2PO4,pH6.0+5mM EDTA,pH 6.0使容积达到200微升。试管在70℃下温育。1.5小时之后,在大约500ml H2O上漂浮的硝基纤维素过滤器上透析100微升反应混合物。15分钟之后,使用Qiagen PCR纯化试剂盒浓缩DNA。3小时之后,用相同的方法取出并纯化剩余的100微升反应混合物。
然后通过电穿孔用使用羟胺已经诱变1.5或3小时的100ng的pMON62000转化大肠杆菌株Ec-8。每一个时间点进行这两个转化程序。在SOC培养基(20g/L Bacto-胰蛋白胨,5g/L Bacto酵母提取物,10ml/L 1M NaCl,2.5ml/L 1M KCl,18g葡萄糖)中回收转化细胞4或6小时。
制备含有M9基本培养基,加2%琼脂,和50微克/毫升5-甲基-DL-色氨酸(5-MT)的两个245mm正方形生物测试板。其余100微升加到M9对照板上。对含有3.0小时诱变质粒的转化混合物实施相同的程序。
然后将板在37℃下温育大约2.5天。从5-MT板分离抗性菌落并且划线接种到LB-卡那霉素(50微克/毫升)板,证基本粒的存在。所有的选择的菌落在这些板上生长。准备双份各抗性克隆的各菌落,分离质粒。进行限制性消化和PCR并且证明所有的克隆含有期望的根癌土壤杆菌AS***物。
获救质粒然后转化回菌株Ec-8中。通过划线到新的LB-卡那霉素板上纯化每次转化的一个菌落。为了证明对5-MT的抗性,各纯化的菌落划线到含有M9加50微克/毫升5-MT和2%琼脂的板上,然后在37℃下培养3天。大多数克隆有抗性。为了确定在甚至更高的5-MT浓度下抗性突变体是否保持抗性,它们在M9加300微克/毫升5-MT和2%琼脂的板上平板培养。在该高浓度下大多数克隆也证实有抗性。
从所有的抗性克隆分离质粒并且对两个链测序。表J中图表表示了这项实验的一些突变。
            表J:5-MT抗性克隆中根癌土壤杆菌trpEG序列变化
  数据库克隆#   原始克隆# 测得的序列变化   Km cho(μM)   IC50 trp(μM)
  Wt   8.0   5.0
  Ec-12   1 G4A Val2He
  Ec-18   8 C35T Thr12Ile   15   2.5
  Ec-19   9 C2068T Pro690Ser   5.0   3.4
  Ec-20   11 G1066A Glu356Lys & C1779T Ile593Ile
如表J中的数据所示,几种突变体对突变体酶的Km和IC50几乎没有影响,表明这些突变可能不是对色氨酸反馈抑制作用的抗性的来源。例如,35位核苷酸从C突变为T,它将12位氨基酸从苏氨酸变为异亮氨酸(Thr12Ile),Km Cho和IC50 trp值变化很小。类似地,2068位核苷酸从C突变为T,它将脯氨酸变为丝氨酸,Km Cho和IC50 trp值变化很小。因此这些突变可能是″沉默″突变,得到具有和野生型那些一样的酶学性质的变体基因产物。
实施例6:高色氨酸转基因大豆植物
该实施例描述由于用来自根癌土壤杆菌的邻氨基苯甲酸酯合成酶的色氨酸反馈不灵敏突变体转化而具有提高的色氨酸水平的转基因大豆植物的制备。
载体构建
用限制酶NotI消化质粒pMON34711,该质粒携带实施例4描述的含有F298W突变的根癌土壤杆菌的邻氨基苯甲酸酯合成酶克隆。将得到的片段的末端变成平端后用NcoI消化。然后用限制酶EcoRI消化质粒pMON13773(图8),末端平端后用NcoI消化。连接得到的片段,得到质粒pMON58044,它包含7S启动子和NOS3′终止子控制下的AS基因(图9)。
然后用限制酶BglII和NcoI酶切质粒pMON58044,并且与用BglII和NcoI消化pMON53084(图10)产生的片段连接。得到的片段命名为pMON58045(图11),并且包含鼠耳芥属SSU1A转运肽的序列。
最后,通过将用限制酶NotI消化pMON58045(图11)和pMON38207(图13)产生的片段连接来构建质粒pMON58046(图12)。得到pMON58046载体(图12),其用于大豆转化。
通过微粒轰击转化大豆
关于微粒轰击转化方法,商购大豆种子(即,Asgrow A3244,A4922)发芽过夜大约18-24小时,切除分生组织分离块。去除初生叶暴露分生组织并且将分离块置于目标培养基中,分生组织位于微粒送递方向的垂直方向。
用CaCl2和精脒将上述pMON58046转化载体沉淀极微小的金粒上,接着重新悬浮于乙醇。将悬浮液包被到Mylar薄片上,该薄片然后被放到放电装置上。通过以大约60%电容放电使微粒加速进入植物组织。
轰击之后,组织培养分离块放在选择培养基(WPM+0.075mM草甘膦)(WPM=木质植物培养基(McCown & Lloyd,Proc.InternationalPlant Propagation Soc.,30:421,1981)减去BAP))中培养5-7周,选择并且使转基因芽生长。轰击之后大约5-7周收获表型呈阳性的芽,并且放在选择性生根培养基(BRM+0.025mM草甘膦)(参见下文对于BRM的配方)中2-3周。将生根的芽转移到温室中种在土壤中。选择时保持健康的但是没有生根的芽被转移给非选择性生根培养基(没有草甘膦的BRM)中另外生长两周。在转移到温室中种在土壤中之前,对脱离选择生根的从任何芽生的根分析植物可选择标记物的表达。植株保留在标准温室条件下直到收获R1种子。
下面给出用于豆子生根培养基(BRM)的配方。
化合物                           对于4L的量
MS盐***                           8.6g
Myo-肌醇(细胞培养级)              0.40g
SBRM维生素原液**                  8.0ml
L-半胱氨酸(10mg/ml)               40.0ml
蔗糖(超级醇)                      120g
调节pH至                          5.8
洗涤过的琼脂                      32g
高压灭菌之后加入:
SBRM/TSG激素原液*                 20.0ml
*SBRM/TSG激素原液(每1L BRM):3.0ml IAA(0.033mg/ml),2.0ml灭菌蒸馏水。4℃下避光贮存原液。
**SBRM维生素原液(每1L原液):甘氨酸(1.0g),烟酸(0.25g),盐酸维生素B-6(0.25g),盐酸维生素B1(0.25g)。
***3X MInor MS盐(每1L原液):H2BO3(1.86g),MnSO4(5.07g),ZnSO4-H2O(2.58g),KI(0.249g),7.5微升NaMoO-2H2O(1.0mg/ml),7.5微升CoSO4-5H2O(1.0mg/ml),7.5微升CoCl2-6H2O(1.0mg/ml)。
一次加入一种成分并且溶解,加灭菌蒸馏水使容积达到一升,溶液贮存于冷藏箱中箔片覆盖的瓶子中不超过一个月。
使用根癌土壤杆菌转化大豆
对于土壤杆菌转化方法,商购大豆种子(Asgrow A3244,A4922)发芽过夜(大约10-12小时)并且切除分生组织分离块。初生叶可以被去除也可以不被去除,使分生组织和分离块放在创伤容器中。
含有感兴趣的质粒的土壤杆菌株ABI生长至对数期。离心收获细胞并且重新悬浮于含有诱导剂的接种培养基中。大豆组织培养分离块和诱导的土壤杆菌培养物混合,不超过自种子发芽起14个小时,并且利用超声创伤。
创伤之后,组织培养分离块在土壤杆菌中生长大约1小时。接种步骤之后,吸移土壤杆菌,并且将组织培养分离块放在共培养物中2-4天。此时,将它们转移给选择培养基(WPM+0.075mM草甘膦+控制土壤杆菌过量生长的抗生素)5-7周,选择并且使转基因芽生长。
轰击之后大约5-7周收获表型呈阳性的芽,并且放在选择性生根培养基(BRM+0.025mM草甘膦)中2-3周。将生根的芽转移到温室中种在土壤中。选择时保持健康的但是没有生根的芽被转移给非选择性生根培养基(没有草甘膦的BRM)中另外生长两周。在转移到温室中种在土壤中之前,对脱离选择生根的从任何芽生的根分析植物可选择标记物的表达。植株保留在标准温室条件下直到收获R1种子。
R1种子的氨基酸含量分析
制备成熟R1种子并且应用Agilent Technologies TechnicalBulletin REV14中描述的荧光检测分析游离氨基酸含量。每一个结果的每一个种子分析选择5粒种子。表达AgroAS F298W或AgroAS S51F突变体蛋白质的大豆种子产生非常高含量的色氨酸。表K和L给出结果。
表K:用pMON58046转化的种子中的蛋白质表达
  谱系  Trp平均值   是否存在蛋白质
  对照  96   否
  22817  9922   是
  22891  12955   是
  23026  7968   是
表L:AS蛋白质表达与pMON58123转化体的关系
  谱系   Trp平均值   是否存在蛋白质
  对照   96   否
  23562   88   否
  23590   8795   是
  23911   388   是
Agro AS转化的R1种子中AS酶活性
制备成熟R1种子并且分析邻氨基苯甲酸酯合成酶活性。测定携带Agro AS F298W(SEQ ID NO:65或91)或Agro AS S51F(SEQ ID NO:60或86)突变体等位基因的R1大豆种子中邻氨基苯甲酸酯合成酶酶活性。发现非常高水平的色氨酸抗性邻氨基苯甲酸酯合成酶活性,与这些种子产生的高含量色氨酸一致。表M和N给出结果。
表M:用pMON58046转化的R1种子中AS的比活性
  事件   种子编号   比活性(pmoles/mg/min)   比活性(pmoles/mg/min)(+25mcromolar Trp)
  对照   77.6
  23076   23076-1   100.5   1.04
  23076-2   4512.8
  23076-3   9737.4   9290.4
  23076-4   136.12
  23076-5   8992.5   9749.9
表N:用pMON58123转化的R1种子中AS的比活性
  事件   种子编号   比活性(pmoles/mg/min)   比活性(pmoles/mg/min)(+25mcromolar Trp)
  对照   83.7   32.7
  23590   23590-1   891   692.3
  23590-2   466.2   186.5
  23590-3   71.7   38.3
  23590-4   320.5   316.2
实施例7:包含芸香邻氨基苯甲酸酯合成酶α-亚基的转化载体的制备
来自芸香邻氨基苯甲酸酯合成酶的α基因(Genbank登记号No.GI960291)提供本发明中有用的另一个邻氨基苯甲酸酯合成酶结构域(Bohlmann,J等,Plant Phys111507-514(1996))。芸香基因组中存在的邻氨基苯甲酸酯合成酶的一种同功酶证明对L-色氨酸反馈抑制作用的较小易感性。这个等位基因可以在本发明中用来提高转基因植物中游离L-色氨酸水平。载体pMON58030(图14)包含芸香邻氨基苯甲酸酯合成酶的α-亚基,其对色氨酸抑制作用敏感性较小。从pMON58030PCR扩增芸香邻氨基苯甲酸酯合成酶的α基因,通过使用包含这两个限制酶位点的PCR引物在芸香邻氨基苯甲酸酯合成酶的α基因片段的5’端引入BamHI位点和在3’端引入BglII位点:
5’-CAAAAGCTGGATCCCCACC-3’(SEQ ID NO:53)和
5’-CCTATCCGAGATCTCTCAACTCC-3’(SEQ ID NO:54)。
纯化该PCR片段,并且用相应限制酶消化,得到pMON58041,其包含芸香ASα与napin启动子的转录融合体。制备包含napin启动子,芸香AS,NOS终止子,草甘膦抗性(CP4),可选择标记物和适合所述盒适当染色体整合的缘的土壤杆菌介导的植物转化质粒,pMON58043。利用实施例2,3和6中所述标准植物转化技术,用得到的植物转化载体转化植物。
实施例8:将多个多肽邻氨基苯甲酸酯合成酶转化到单体单一多肽邻氨基苯甲酸酯合成酶中
期望通过选择的多亚基酶的融合产生的单体邻氨基苯甲酸酯合成酶,例如达到催化效率最大化,稳定该酶,实现例如具有TrpE和TrpG活性的亚基的同步表达,和两个亚基之间的有效转染。在某些情况下,通过标准诱变技术或者通过前面实施例例如实施例4所述的合理设计,有用地使用来自植物或微生物来源的TrpE或α亚基,所述来源反馈抑制方面不受调节。在其他情况下,使用来自植物或微生物来源的野生型TrpE或α亚基。
选择的TrpE或α亚基的C-末端与TrpG或β亚基的N-末端连接,优选使用肽接头。能合理设计接头,为两个亚基适当比对提供合适的空间将柔顺性。或者,通过单体和异四聚体邻氨基苯甲酸酯合成酶的序列比对能鉴定接头。图21和35给出形成的单体和异四聚体邻氨基苯甲酸酯合成酶的序列比对的例子。还发现为了将利益最大化,需要产生包括异源亚基的单体邻氨基苯甲酸酯合成酶。例如,从细菌源,例如大肠杆菌,可以获得α亚基,并且与来自植物例如鼠耳芥属来源的β亚基融合。
例如,根据实施例2,3或6所述,能将产生的新的蛋白质导入植物。本发明不局限于所给出的和所描述的具体细节。要明白在权利要求书定义的精神和范围内可以进行很多改变和修饰。
实施例9:来自基因组序列数据库的邻氨基苯甲酸酯合成酶的鉴定
通过例如使用BLAST(www.ncbi.nlm.nih.gov/blast/)检索GenBank和/或swissprot数据库,通过生物信息学分析,能鉴定本发明中有用的单体邻氨基苯甲酸酯合成酶以及α和β结构域。用于鉴定单体邻氨基苯甲酸酯合成酶的查询序列包括,例如,来自硫磺矿硫化叶菌(Sulfolobus solfataricus)的邻氨基苯甲酸酯合成酶结构域,例如α结构域(GI1004323)或β结构域(GI1004324),或者单体邻氨基苯甲酸酯合成酶,例如根癌土壤杆菌AS(GI15889565)。推导的单体邻氨基苯甲酸酯合成酶与查询序列的同源性在50%和100%之间,并且应该最少含有700个氨基酸。如果使用AS-α结构域查询基因组数据库,除了鉴定推导的邻氨基苯甲酸酯合成酶基因外,还可能鉴定PABA合成例如4-氨基-4-去氧分支酸酯(ADC)合成酶合成中涉及的基因。以ADC合成酶的酰胺转移酶结构域(β结构域)在蛋白质的N-末端而AS的酰胺转移酶结构域(β结构域)在C-末端这样的观察为基础,能容易地将单体ADC合成酶基因与推导的单体AS基因区别开来。通过生物信息学分析鉴定的本发明中使用的单体邻氨基苯甲酸酯合成酶包括但不限于,例如苜蓿根瘤菌(Rhizobium meliloti)(GI95177),Mesorhizobium loti(GI 13472468),马尔他布鲁氏菌(Brucella melitensis)(GI 17982357),念珠蓝细菌(Nostoc sp.)PCC7120(GI 17227910,GI 17230725),巴西固氮螺菌(Azospirillumbrasilense)(GI 1174156),血色红假单孢菌(Rhodopseudomonaspalustris),鱼腥蓝细菌(Anabaena)M22983(GI 152445)。图21是本发明中有用的两个单体邻氨基苯甲酸酯合成酶(根癌土壤杆菌和苜蓿根瘤菌)与两个异四聚体邻氨基苯甲酸酯合成酶(硫磺矿硫化叶菌和鼠耳芥)的序列比对的例子。图35是几种单体邻氨基苯甲酸酯合成酶与血色红假单孢菌异四聚体邻氨基苯甲酸酯合成酶的序列比对的例子。
实施例10:优化的密码子使用
该实施例描述通过密码子使用的优化使邻氨基苯甲酸酯合成酶基因在种子中改善的表达。
对来野生型根癌土壤杆菌的邻氨基苯甲酸酯合成酶(AS)基因的核苷酸序列(SEQ ID NO:1)检查没有充分表达的密码子的存在。为了鉴定没有充分表达的密码子,对来自玉米和大豆的高表达种子蛋白质的序列检查相对密码子频率。表O给出相对密码子使用频率,以预期值形式代表。预期值形式可以举例如下:假设编码一个给定氨基酸有四个密码子,并且假设它们同样好地被使用,则预期各密码子对那个氨基酸的频率占25%(0.25)。但是,由于冗余性,将0.25标准化为1.0,与编码那个氨基酸的其他密码子相比给出每一个密码子的相对评分。对于该项分析,如果一个密码子比对于给定氨基酸的其他选择更普遍,则接受大于1.0的数。相应地,如果一个密码子不普遍,它接受小于1.0的数。对于该项研究,如果相对密码子使用频率低于0.5,则认为特定密码子未被充分表达。
应用表O的结果,对野生型土壤杆菌AS序列的严谨检查表明,认为玉米和大豆中密码子125未被充分表达(低于0.5阈值)(表P)。用上面定义的更普遍密码子置换这些未被充分表达的密码子。修饰的核苷酸序列如图36所示。利用生物信息学工具,组装得到序列,并且分析翻译的整合性,并且将核苷酸和蛋白质序列与相应的野生型AS序列比对。同时,蛋白质序列没有变化,优化的序列的核苷酸序列与野生型土壤杆菌AS序列有94%同一性(图37)。分别利用LasergeneEditSeq(DNASTAR,Inc.,Madison,WI)和Grail2(Oak Ridge NationalLaboratory,Oak Ridge,TN)对优化核苷酸序列分析不存在隐藏聚腺苷酸化信号(AATAAA,AATAAT)和隐藏内含子。没有发现隐藏信号。
应用本领域公知的技术合成修饰的核苷酸序列或者由供应商提供,例如Egea Biosciencesces,Inc.(San Diego,CA)。将得到的核苷酸克隆到合适的表达载体中,并且利用本说明书前面实施例中描述的方法测定在玉米,大豆和鼠耳芥属中的效率。
表O:玉米和大豆种子表达基因中相对密码子使用频率1
  密码子   AA   玉米种子   大豆种子   密码子   AA   玉米种子   大豆种子
  TTTTTCTTATTGTCTTCCTCATCGTATTACTGTTGCTGGCTTCTCCTACTGCCTCCCCCACCGCATCACCAACAGCGTCGCCGACGGATTATC   FFLLSSSSYYCCWLLLLPPPPHHQQRRRRII   0.42111.57890.45570.94940.96241.37070.91070.78510.24551.75450.27781.72221.00000.79751.06100.85441.88200.65000.85201.22401.27400.84381.15630.86391.13610.25821.00820.19571.22830.91841.7143   0.73481.26520.38751.20601.48511.12491.00440.32660.68611.31390.75721.24281.00001.62981.63010.59050.55621.58220.76941.58380.06450.60661.39341.21620.78380.59031.11590.67000.36921.27831.0563   ATCATAATGACTACCACAACGAATAACAAAAAGAGTAGCAGAAGGGTTGTCGTAGTGGCTGCCGCAGCGGATGACGAAGAGGGTGGCGGAGGG   IIMTTTTNNKKSSRRVVVVAAAADDEEGGGG   1.71430.36731.00000.61531.22130.83721.32620.28851.71150.53331.46670.26791.70320.39132.91850.57141.01190.38102.03570.98761.16180.80111.04950.85001.15000.68181.31821.12681.87580.30850.6889   1.05630.66541.00001.00082.10200.71460.18260.54091.45910.90301.09700.97141.08761.94591.30871.23810.68640.34721.72841.35831.12831.28980.22350.95231.04771.04630.95371.14310.65771.27590.9233
1以预期值形式表示相对密码子频率。这意味着,如果编码一个给定氨基酸有四个密码子,如果它们同样好地被使用,则预期各密码子占25%(0.25)。由于冗余性,0.25被标准化成1,与编码该氨基酸的所有密码子相比,给出每一个密码子的相对评分。在现实生活中,如果一个密码子比对于给定氨基酸的其他选择更普遍,则它是大于1的数。如果一个密码子与这个氨基酸的其他密码子相比不优选,则它是小于1的数。
表P。没有充分表达的Agro AS密码子和为改进种子表达而进行的修饰
  密码子   密码子(wt)   氨基酸   修饰的密码子   在作物中未充分表达2   密码子   密码子(wt)   氨基酸   修饰的密码子   在作物中未充分表达2   密码子   密码子(wt)   氨基酸   修饰的密码子   在作物中未充分表达2
  2391015162123263036464748495053555658   GTAACGGGAGCGACGAAAGTCCGACGGTATAATGGCGCGGTTTTTTCGTATTATCCGCGT   VTGATKVRRYNGAVFSYYPR   GTGACCGGTGCCACCAAGGTGCGCCGCTACAACGGTGCCGTGTTCTCCTACTACCCACGC   corn,soysoycornsoysoycornsoycornsoycorncorn,soysoysoycorncornsoycorncornsoycorn   177179180181185190201209218219238244248276280281282283290293   TCGGCGCGTCCGCGTTTTTATCGTACGACGCCGCGTTATCGTAATCCGTCGGCGGCGCCG   SARPRFYRTTPRYRNPSAAP   TCCGCCCGCCCACGCTTCTACCGCACCACCCCACGCTACCGCAACCCATCCGCCGCCCCA   soysoycornsoycorncorncorncornsoysoysoycorncorncorncorn,soysoysoysoysoysoy   481485489504508520543545546547551553554556559561572578580584   GCGAATCCGATACGTCGTACGGCGAATTATACGGCGACGTCGAGACCGCCGTCGGGACCG   ANPIRRTANYTATSRPPSGP   GCCAACCCAATCCGCCGCACCGCCAACTACACCGCCACCTCCAGGCCACCATCCGGTCCA   soycorn,soysoycorncorncornsoysoycorn,soycornsoysoysoysoycornsoysoysoycornSoy
  密码子   密码子(wt)   氨基酸   修饰的密码子   在作物中未充分表达2   密码子   密码子(wt)   氨基酸   修饰的密码子   在作物中未充分表达2   密码子   密码子(wt)   氨基酸   修饰的密码子   在作物中未充分表达2
  6469707576858697102112115123125133136137143150151153155173   ACGCCGCCGTGTTTTTATAATACGGCGTCGCGGCCGCGTTCGCCGACGAGATATTCGGCGTCGGCG   TPPCFYNTASRPRSPTRYSASA   ACCCCACCATGCTTCTACAACACCGCCTCCCGCCCACGCTCCCCAACCAGGTACTCCGCCTCCGCC   soysoysoycorncorncorncorn,soysoysoysoysoysoycornsoysoysoycorncornsoysoysoysoy   294296301307312313322328329339352363376378390411442446449460464469   TCGTATAATTATTCGCCGCGTCCGATACCGTCGTCGCCGTCGTATTTTCCGTATGCGAATACGCGG   SYNYSPRPIPSSPSYFPYANTR   TCCTACAACTACTCCCCACGCCCAATCCCATCCTCCCCATCCTACTTCCCATACGCCAACACCCGC   soycorncorn,soycornsoysoycornsoycornsoysoysoysoysoycorncornsoycornsoycorn,soysoysoy   585592602617633652655658667668680690698700703705708711715724729   ACGACGCCGTATTCGACGCGTTCGCCGCGTACGCCGCCGTCGACGGGAGCGCGGAATGCGGCG   TTPYSTRSPRTPPSTGARNAA   ACCACCCCATACTCCACCCGCTCCCCACGCACCCCACCATCCACCGGTGCCCGCAACGCCGCC   SoySoySoyCornSoySoyCornSoySoyCornSoySoySoySoySoyCornSoySoycorn,soySoySoy
标题是“在作物中未充分表达”的列表示在哪一种作物(玉米或大豆)中特定密码子未充分表达
所有的出版物和专利文献在此引作参考,分别引入作为参考。本发明不局限于所给出的和所描述的具体细节。应该理解,在权利要求书定义的精神和范围内可以进行很多改变和修饰。
                      序列表
<110>孟山都公司
     L.M.韦弗
     J.梁
     R.陈
     S.S.郑
     T.米特斯基
     S.斯拉特尔
     W.拉普
<120>转基因高色氨酸植物
<130>1463.002WO1
<150>US 60/288,904
<151>2001-05-04
<160>103
<170>FastSEQ for Windows Version 4.0
<210>1
<211>2190
<212>DNA
<213>根癌土壤杆菌(Agrobacterium tumefaciens)
<400>1
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag     60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag    120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc    180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg    240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg    300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc    360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc    420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt    540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac    600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag    720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat    840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc    900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc    960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt   1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc   1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag   1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>2
<211>1815
<212>DNA
<213>玉米(Zea mays)
<400>2
atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg      60
cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga     120
accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg     180
agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg     240
cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc     300
acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc     360
ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg     420
gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac     480
cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc     540
atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga     600
tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc     660
tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat     720
gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac     780
cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta     840
tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca     900
cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct     960
gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag    1020
aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg    1080
aatcctagcc catacatggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt    1140
cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact    1200
gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat    1260
gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag    1320
gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat    1380
gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat    1440
gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg    1500
gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga    1560
atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca    1620
gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc    1680
gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt    1740
gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt    1800
gtagacaaag aatag                                                     1815
<210>3
<211>1993
<212>DNA
<213>芸香(Ruta graveolens)
<400>3
aaaaaatctg tctgtttttc gtgtttggac atttcagcgg cactgggtgc catcagttga      60
ttcgactcat ttgatttatt ttgtttgttg gccatgagtg cagcggcaac gtcgatgcaa     120
tcccttaaat tctccaaccg tctggtccca cccagtcgcc gtctgtctcc ggttccgaac     180
aatgtcacct gcaataacct ccccaagtct gcagctcccg tccggacagt caaatgctgc     240
gcttcttcct ggaacagtac catcaacggc gcggccgcca cgaccaacgg tgcgtccgcc     300
gccagtaacg gcgcatccac gaccaccact acatatgtta gtgatgcaac cagatttatc     360
gactcttcta aaagggcaaa tctagtgcca ttataccgtt gcatattcgc ggatcatctc     420
acgccggtgc ttgcctatag atgtttggtt caagaagacg ataaagagac tccaagtttt     480
ttattcgaat cagtagagcc gggtcggatt tctactgttg ggaggtatag tgtggttgga     540
gctcatcccg tgatggaagt tatagctaaa gataatatgg ttacggtgat ggatcatgag     600
aaagggagct tagttgagga ggtggtcgat gatcccatgg agattcctag aagaatttcc     660
gaggattgga agcctcaaat aatcgatgat cttcctgaag ctttttgcgg tggttgggtt     720
ggtttcttct catacgatac agttcgatat gtggagaaga aaaagttacc attctcaaag     780
gcacctcagg atgataggaa tcttgcagat atgcatctag gtctctataa cgatgttatt     840
gtgtttgatc atgtggaaaa gaaagtatat gttattcatt gggtgaggct aaatcaacag     900
tcttctgaag aaaaagcata tgccgagggt ctggaacact tggagagact agtatccaga     960
gtacaggatg agaacacgcc aaggctcgcc ccaggttcca tagacttaca cactggtcat    1020
tttggacctc cattaaaaaa gtcaaacatg acatgtgaag aatacaaaat ggctgtacta    1080
gcggcaaaag aacatattca ggctggggat atttttcaaa tcgtactaag ccaacgtttt    1140
gaacgtcgaa catttgctga tccatttgaa gtttataggg cactgagagt tgttaatccg    1200
agtccctata tgacgtatat gcaggcaaga gggtgtgttc tggtagcttc aagtccagaa    1260
attcttactc gagtaaagaa gaataagatt gtgaatcgac ctttggctgg aacagcccga    1320
agagggagga ctactgaaga agatgagatg ttggaaacac agttgctaaa agacgcaaag    1380
caatgtgctg agcatgttat gctggtcgat ttgggacgga atgatgttgg caaggtttca    1440
aaatctggtt ctgtgaaagt ggaaaagctg atgaatgttg aacgatattc acatgttatg    1500
cacataagct ctacggtcac aggtgagttg caagataatc tcagttgctg ggatgccctg    1560
cgtgctgcac tgcctgtcgg gactgttagt ggagcaccaa aggtgaaggc aatggagtta    1620
atcgatgaat tggaggtaaa tagacgtggc ccctacagtg gtgggtttgg cggtatctcc    1680
ttcaccggag atatggacat tgccctggct ctaaggacca ttgttttcca aaccggtaca    1740
cgctatgaca caatgtactc gtacaagaat gctaccaaac gccggcagtg ggtggcatac    1800
cttcaagccg gggctggcat tgttgctgat agtgatccag acgacgagca tcgtgagtgc    1860
cagaacaaag ccgccggact ggcccgtgcc atcgacctag ctgagtctgc ttttgtgaac    1920
aaatcaagta gctaaagttt tggatttgga agtggagttg agtctcggat aggatttaga    1980
gtaaaaaaag agg                                            1993
<210>4
<211>729
<212>PRT
<213>根癌土壤杆菌
<400>4
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>5
<211>604
<212>PRT
<213>玉米
<400>5
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala
 1               5                  10                  15
Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr
            20                  25                  30
Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala
        35                  40                  45
Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala
    50                  55                  60
Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala
65                  70                  75                  80
Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val
               85                   90                  95
Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu
            100                 105                 110
Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly
        115                 120                 125
Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His
    130                 135                 140
Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp
145                 150                 155                 160
His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln
                165                 170                 175
Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu
            180                 185                 190
Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp
        195                 200                 205
Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro
    210                 215                 220
Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp
225                 230                 235                 240
Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp
                245                 250                 255
Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly
            260                 265                 270
Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val
        275                 280                 285
Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly
    290                 295                 300
Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala
305                 310                 315                 320
Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile
                325                 330                 335
Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu
            340                 345                 350
Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala Tyr
        355                 360                 365
Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu
    370                 375                 380
Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr
385                 390                 395                 400
Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln
                405                 410                 415
Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp
            420                 425                 430
Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys
        435                 440                 445
Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile
    450                 455                 460
Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp
465                 470                 475                 480
Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys
                485                 490                 495
Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly
            500                 505                 510
Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln
        515                 520                 525
Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His
    530                 535                 540
Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val
545                 550                 555                 560
Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp
                565                 570                 575
Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala
            580                 585                 590
Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu
        595                 600
<210>6
<211>613
<212>PRT
<213>芸香
<400>6
Met Ser Ala Ala Ala Thr Ser Met Gln Ser Leu Lys Phe Ser Asn Arg
 1               5                  10                  15
Leu Val Pro Pro Ser Arg Arg Leu Ser Pro Val Pro Asn Asn Val Thr
            20                  25                  30
Cys Asn Asn Leu Pro Lys Ser Ala Ala Pro Val Arg Thr Val Lys Cys
        35                  40                  45
Cys Ala Ser Ser Trp Asn Ser Thr Ile Asn Gly Ala Ala Ala Thr Thr
    50                  55                  60
Asn Gly Ala Ser Ala Ala Ser Asn Gly Ala Ser Thr Thr Thr Thr Thr
65                  70                  75                  80
Tyr Val Ser Asp Ala Thr Arg Phe Ile Asp Ser Ser Lys Arg Ala Asn
                85                  90                  95
Leu Val Pro Leu Tyr Arg Cys Ile Phe Ala Asp His Leu Thr Pro Val
            100                 105                 110
Leu Ala Tyr Arg Cys Leu Val Gln Glu Asp Asp Lys Glu Thr Pro Ser
        115                 120                 125
Phe Leu Phe Glu Ser Val Glu Pro Gly Arg Ile Ser Thr Val Gly Arg
    130                 135                 140
Tyr Ser Val Val Gly Ala His Pro Val Met Glu Val Ile Ala Lys Asp
145                 150                 155                 160
Asn Met Val Thr Val Met Asp His Glu Lys Gly Ser Leu Val Glu Glu
                165                 170                 175
Val Val Asp Asp Pro Met Glu Ile Pro Arg Arg Ile Ser Glu Asp Trp
            180                 185                 190
Lys Pro Gln Ile Ile Asp Asp Leu Pro Glu Ala Phe Cys Gly Gly Trp
        195                 200                 205
Val Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys
    210                 215                 220
Leu Pro Phe Ser Lys Ala Pro Gln Asp Asp Arg Asn Leu Ala Asp Met
225                 230                 235                 240
His Leu Gly Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys
                245                 250                 255
Lys Val Tyr Val Ile His Trp Val Arg Leu Asn Gln Gln Ser Ser Glu
            260                 265                 270
Glu Lys Ala Tyr Ala Glu Gly Leu Glu His Leu Glu Arg Leu Val Ser
        275                 280                 285
Arg Val Gln Asp Glu Asn Thr Pro Arg Leu Ala Pro Gly Ser Ile Asp
    290                 295                 300
Leu His Thr Gly His Phe Gly Pro Pro Leu Lys Lys Ser Asn Met Thr
305                 310                 315                 320
Cys Glu Glu Tyr Lys Met Ala Val Leu Ala Ala Lys Glu His Ile Gln
                325                 330                 335
Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg
            340                 345                 350
Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Val Val Asn
        355                 360                 365
Pro Ser Pro Tyr Met Thr Tyr Met Gln Ala Arg Gly Cys Val Leu Val
    370                 375                 380
Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val
385                 390                 395                 400
Asn Arg Pro Leu Ala Gly Thr Ala Arg Arg Gly Arg Thr Thr Glu Glu
              405                 410                 415
Asp Glu Met Leu Glu Thr Gln Leu Leu Lys Asp Ala Lys Gln Cys Ala
            420                 425                 430
Glu His Val Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val
        435                 440                 445
Ser Lys Ser Gly Ser Val Lys Val Glu Lys Leu Met Asn Val Glu Arg
    450                 455                 460
Tyr Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln
465                 470                 475                 480
Asp Asn Leu Ser Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly
                485                 490                 495
Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu
            500                 505                 510
Leu Glu Val Asn Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile
        515                 520                 525
Ser Phe Thr Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val
    530                 535                 540
Phe Gln Thr Gly Thr Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Asn Ala
545                 550                 555                 560
Thr Lys Arg Arg Gln Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Ile
                565                 570                 575
Val Ala Asp Ser Asp Pro Asp Asp Glu His Arg Glu Cys Gln Asn Lys
            580                 585                 590
Ala Ala Gly Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val
        595                 600                 605
Asn Lys Ser Ser Ser
    610
<210>7
<211>729
<212>PRT
<213>苜蓿根瘤菌(Rhizobium meliloti)
<400>7
Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys
 1               5                  10                  15
Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp
            20                  25                  30
Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile
                85                  90                  95
Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala
            100                 105                 110
Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala
    130                 135                 140
Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu
                165                 170                 175
Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala
    210                 215                 220
Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser
            500                 505                 510
Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly
        515                 520                 525
Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr
545                 550                 555                 560
Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu
    610                 615                 620
Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu
705                 710                 715                 720
Ala Lys Arg Ala Lys Thr Lys Ala Ala
                725
<210>8
<211>421
<212>PRT
<213>硫磺矿硫化叶菌(sulfolobus solfataricus)
<400>8
Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe
 1               5                  10                  15
Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile
            20                  25                  30
Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr
        35                  40                  45
Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly
    50                  55                  60
Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly
65                  70                  75                  80
Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys
                85                  90                  95
Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe
            100                 105                 110
Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val
        115                 120                 125
Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly
    130                 135                 140
Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr
145                 150                 155                 160
Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile
                165                 170                 175
Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp
            180                 185                 190
Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr
        195                 200                 205
Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro
    210                 215                 220
Glu Leu Leu Phe Arg Val Gln Asp Asn Ile Val Glu Thr Tyr Pro Ile
225                 230                 235                 240
Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu
                245                 250                 255
Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met
            260                 265                 270
 Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly
         275                 280                 285
Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val
    290                 295                 300
Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn
305                 310                 315                 320
Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly
                325                 330                 335
Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr
            340                 345                 350
Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly
        355                 360                 365
Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu
    370                 375                 380
Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro
385                 390                 395                 400
Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr
                405                 410                 415
Ala Ile Gly Val Arg
            420
<210>9
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>9
ccatcgcggc gcgttttttt cgtccaacta tg                                32
<210>10
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>10
catagttgga cgaaaaaaac gcgccgcgat gg                                32
<210>11
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>11
ccatcgcggc gcgtattttt cgtccaacta tgaatatcc                         39
<210>12
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>12
ggatattcat agttggacga aaaatacgcg ccgcgatgg                         39
<210>13
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>13
ccatcgcggc gcgtggtttt cgtccaacta tgaatatcc                           39
<210>14
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>14
ggatattcat agttggacga aaaccacgcg ccgcgatgg                           39
<210>15
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>15
ccatcgcggc gcggttttta agtccaacta tgaatatcc                           39
<210>16
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>16
ggatattcat agttggactt aaaaaccgcg ccgcgatgg                           39
<210>17
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>17
gcgcggtttt ttcgtgcaac tatgaatatc cggg                                34
<210>18
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>18
cccggatatt catagttgca cgaaaaaacc gcgc                              34
<210>19
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>19
cgcggttttt tcgttcaact atgaatatcc gggc                              34
<210>20
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>20
gcccggatat tcatagttga acgaaaaaac cgcg                              34
<210>21
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>21
cggcgcggtt ttttcgatca actatgaata tccgggc                           37
<210>22
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>22
gcccggatat tcatagttga tcgaaaaaac cgcgccg                              37
<210>23
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>23
ggcgcggttt tttcgctcaa ctatgaatat ccgggc                               36
<210>24
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>24
gcccggatat tcatagttga gcgaaaaaac cgcgcc                               36
<210>25
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>25
cggcgcggtt ttttcgatga actatgaata tccgggccg                            39
<210>26
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
  <400>26
  cggcccggat attcatagtt catcgaaaaa accgcgccg                        39
  <210>27
  <211>34
  <212>DNA
  <213>人工序列
  <220>
  <223>引物
  <400>27
  cgcggttttt tcgaccaact atgaatatcc gggc                            34
  <210>28
  <211>34
  <212>DNA
  <213>人工序列
  <220>
  <223>引物
  <400>28
  gcccggatat tcatagttgg tcgaaaaaac cgcg                            34
  <210>29
  <211>36
  <212>DNA
  <213>人工序列
  <220>
  <223>引物
  <400>29
  ggcgcggttt tttcggtcaa ctatgaatat ccgggc                          36
  <210>30
  <211>36
  <212>DNA
  <213>人工序列
  <220>
  <223>引物
  <400>30
  gcccggatat tcatagttga ccgaaaaaac cgcgcc                          36
  <210>31
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>31
gcgcggtttt ttcgtacaac tatgaatatc cgggc                              35
<210>32
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>32
gcccggatat tcatagttgt acgaaaaaac cgcgc                              35
<210>33
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>33
cggcgcggtt ttttcgtcct tctatgaata tccggg                             36
<210>34
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>34
cccggatatt catagaagga cgaaaaaacc gcgccg                            36
<210>35
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>35
ctgaaggcgatcaacgcgtc gccctattc                                     29
<210>36
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>36
gaatagggcg acgcgttgat cgccttcag                                    29
<210>37
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>37
cctgaaggcg atcaacgggt cgccctattc c                                 31
<210>38
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>38
ggaatagggc gacccgttga tcgccttcag g                                 31
<210>39
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>39
cgtcgcccta ttccgccttc atcaatctcg gcg                              33
<210>40
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>40
cgccgagatt gatgaaggcg gaatagggcg acg                              33
<210>41
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>41
cgtcgcccta ttcctggttc atcaatctcg gcg                              33
<210>42
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>42
cgccgagatt gatgaaccag gaatagggcg acg                              33
<210>43
<211>729
<212>PRT
<213>苜蓿根瘤菌
<400>43
Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys
 1               5                  10                  15
Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp
            20                  25                  30
Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile
                85                  90                  95
Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala
            100                 105                 110
Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala
    130                 135                 140
Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu
                165                 170                 175
Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala
    210                 215                 220
Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
 Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu
         275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser
            500                 505                 510
Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly
        515                 520                 525
Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr
545                 550                 555                 560
Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu
    610                 615                 620
Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu
705                 710                 715                 720
Ala Lys Arg Ala Lys Thr Lys Ala Ala
                725
<210>44
<211>616
<212>PRT
<213>硫磺矿硫化叶菌
<400>44
Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe
 1               5                  10                  15
Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile
            20                  25                  30
Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr
        35                  40                  45
Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly
    50                  55                  60
Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly
65                  70                  75                  80
Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys
                85                  90                  95
Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe
            100                 105                 110
Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val
        115                 120                 125
Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly
    130                 135                 140
Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr
145                 150                 155                 160
Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile
               165                  170                 175
Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp
            180                 185                 190
Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr
        195                 200                 205
Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro
    210                 215                 220
Glu Leu Leu Phe Arg Val Gln Asp Asn Ile Val Glu Thr Tyr Pro Ile
225                 230                 235                 240
Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu
                245                 250                 255
Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met
            260                 265                 270
Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly
        275                 280                 285
Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val
    290                 295                 300
Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn
305                 310                 315                 320
Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly
                325                 330                 335
Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr
            340                 345                 350
Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly
        355                 360                 365
Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu
    370                 375                 380
Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro
385                 390                 395                 400
Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr
                405                 410                 415
Ala Ile Gly Val Arg Met Asp Leu Thr Leu Ile Ile Asp Asn Tyr Asp
            420                 425                 430
Ser Phe Val Tyr Asn Ile Ala Gln Ile Val Gly Glu Leu Gly Ser Tyr
        435                 440                 445
Pro Ile Val Ile Arg Asn Asp Glu Ile Ser Ile Lys Gly Ile Glu Arg
    450                 455                 460
Ile Asp Pro Asp Arg Leu Ile Ile Ser Pro Gly Pro Gly Thr Pro Glu
465                 470                 475                 480
Lys Arg Glu Asp Ile Gly Val Ser Leu Asp Val Ile Lys Tyr Leu Gly
                485                 490                 495
Lys Arg Thr Pro Ile Leu Gly Val Cys Leu Gly His Gln Ala Ile Gly
            500                 505                 510
Tyr Ala Phe Gly Ala Lys Ile Arg Arg Ala Arg Lys Val Phe His Gly
        515                 520                 525
Lys Ile Ser Asn Ile Ile Leu Val Asn Asn Ser Pro Leu Ser Leu Tyr
    530                 535                 540
Tyr Gly Ile Ala Lys Glu Phe Lys Ala Thr Arg Tyr His Ser Leu Val
545                 550                 555                 560
Val Asp Glu Val His Arg Pro Leu Ile Val Asp Ala Ile Ser Ala Glu
                565                 570                 575
Asp Asn Glu Ile Met Ala Ile His His Glu Glu Tyr Pro Ile Tyr Gly
            580                 585                 590
Val Gln Phe His Pro Glu Ser Val Gly Thr Ser Leu Gly Tyr Lys Ile
        595                 600                 605
Leu Tyr Asn Phe Leu Asn Arg Val
    610                 615
<210>45
<211>897
<212>PRT
<213>鼠耳芥(Arabidopsis thaliana)
<400>45
Met Ser Ala Val Ser Ile Ser Ala Val Lys Ser Asp Phe Phe Thr Val
 1               5                  10                  15
Glu Ala Ile Ala Val Thr His His Arg Thr Pro His Pro Pro His Phe
            20                  25                  30
Pro Ser Leu Arg Phe Pro Leu Ser Leu Lys Ser Pro Pro Ala Thr Ser
        35                  40                  45
Leu Asn Leu Val Ala Gly Ser Lys Leu Leu His Phe Ser Arg Arg Leu
    50                  55                  60
Pro Ser Ile Lys Cys Ser Tyr Thr Pro Ser Leu Asp Leu Ser Glu Glu
65                  70                  75                  80
Gln Phe Thr Lys Phe Lys Lys Ala Ser Glu Lys Gly Asn Leu Val Pro
                85                  90                  95
Leu Phe Arg Cys Val Phe Ser Asp His Leu Thr Pro Ile Leu Ala Tyr
            100                 105                 110
Arg Cys Leu Val Lys Glu Asp Asp Arg Asp Ala Pro Ser Phe Leu Phe
        115                 120                 125
Glu Ser Val Glu Pro Gly Ser Gln Ser Ser Asn Ile Gly Arg Tyr Ser
    130                 135                 140
Val Val Gly Ala Gln Pro Thr Ile Glu Ile Val Ala Lys Gly Asn Val
145                 150                 155                 160
Val Thr Val Met Asp His Gly Ala Ser Leu Arg Thr Glu Glu Glu Val
                165                 170                 175
Asp Asp Pro Met Met Val Pro Gln Lys Ile Met Glu Glu Trp Asn Pro
            180                 185                 190
Gln Gly Ile Asp Glu Leu Pro Glu Ala Phe Cys Gly Gly Trp Val Gly
        195                 200                 205
Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro
    210                 215                 220
Phe Ser Asn Ala Pro Glu Asp Asp Arg Ser Leu Pro Asp Val Asn Leu
225                 230                 235                 240
Gly Leu Tyr Asp Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala
                245                 250                 255
Tyr Val Ile His Trp Val Arg Ile Asp Lys Asp Arg Ser Val Glu Glu
            260                 265                 270
Asn Phe Arg Glu Gly Met Asn Arg Leu Glu Ser Leu Thr Ser Arg Ile
        275                 280                 285
Gln Asp Gln Lys Pro Pro Lys Met Pro Thr Gly Phe Ile Lys Leu Arg
    290                 295                 300
Thr Gln Leu Phe Gly Pro Lys Leu Glu Lys Ser Thr Met Thr Ser Glu
305                 310                 315                 320
Ala Tyr Lys Glu Ala Val Val Glu Ala Lys Glu His Ile Leu Ala Gly
                325                 330                 335
Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe
            340                 345                 350
Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser
        355                 360                 365
Pro Tyr Met Ala Tyr Leu Gln Val Arg Gly Cys Ile Leu Val Ala Ser
    370                 375                 380
Ser Pro Glu Ile Leu Leu Arg Ser Lys Asn Arg Lys Ile Thr Asn Arg
385                 390                 395                 400
Pro Leu Ala Gly Thr Val Arg Arg Gly Lys Thr Pro Lys Glu Asp Leu
                405                 410                 415
Met Leu Glu Lys Glu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His
            420                 425                 430
Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys
        435                 440                 445
Pro Gly Ser Val Glu Val Lys Lys Leu Lys Asp Ile Glu Trp Phe Ser
    450                 455                 460
His Val Met His Ile Ser Ser Thr Val Val Gly Glu Leu Leu Asp His
465                 470                 475                 480
Leu Thr Ser Trp Asp Ala Leu Arg Ala Val Leu Pro Val Gly Thr Val
                485                 490                 495
Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu
            500                 505                 510
Val Thr Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe
        515                 520                 525
Asn Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro
    530                 535                 540
Thr Asn Thr Arg Tyr Asp Thr Leu Tyr Ser Tyr Lys His Pro Gln Arg
545                 550                 555                 560
Arg Arg Glu Trp Ile Ala His Ile Gln Ala Gly Ala Gly Ile Val Ala
                565                 570                 575
Asp Ser Asn Pro Asp Asp Glu His Arg Glu Cys Glu Asn Lys Ala Ala
            580                 585                 590
Ala Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ser Phe Leu Glu Ala
        595                 600                 605
Pro Glu Phe Thr Thr Ile Thr Pro His Ile Asn Asn Ile Met Ala Ala
    610                 615                 620
Ser Thr Leu Tyr Lys Ser Cys Leu Leu Gln Pro Lys Ser Gly Ser Thr
625                 630                 635                 640
Thr Arg Arg Leu Asn Pro Ser Leu Val Asn Pro Leu Thr Asn Pro Thr
                645                 650                 655
Arg Val Ser Val Leu Gly Lys Ser Arg Arg Asp Val Phe Ala Lys Ala
            660                 665                 670
Ser Ile Glu Met Ala Glu Ser Asn Ser Ile Pro Ser Val Val Val Asn
        675                 680                 685
Ser Ser Lys Gln His Gly Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser
    690                 695                 700
Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Leu Gly Cys His Phe
705                 710                 715                 720
Glu Val Tyr Arg Asn Asp Glu Leu Thr Val Glu Glu Leu Lys Lys Lys
                725                 730                 735
Asn Pro Arg Gly Val Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp
            740                 745                 750
Ser Gly Ile Ser Leu Gln Thr Val Leu Glu Leu Gly Pro Leu Val Pro
        755                 760                 765
Leu Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly
    770                 775                 780
Gly Lys Ile Val Arg Ser Pro Phe Gly Val Met His Gly Lys Ser Ser
785                 790                 795                 800
Met Val His Tyr Asp Glu Lys Gly Glu Glu Gly Leu Phe Ser Gly Leu
                805                 810                 815
Ser Asn Pro Phe Ile Val Gly Arg Tyr His Ser Leu Val Ile Glu Lys
            820                 825                 830
Asp Thr Phe Pro Ser Asp Glu Leu Glu Val Thr Ala Trp Thr Glu Asp
        835                 840                 845
Gly Leu Val Met Ala AlaArg His Arg Lys Tyr Lys His Ile Gln Gly
    850                 855                 860
Val Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Lys Thr Ile
865                 870                 875                 880
Val Arg Asn Phe Ile Lys Ile Val Glu Lys Lys Glu Ser Glu Lys Leu
     885               890              895
Thr
<210>46
<211>252
<212>DNA
<213>人工序列
<220>
<223>截短的基因
<400>46
atgcaaacac aaaaaccgac tctcgaactg gaattcctgg tggaaaacgg tatcgccacc     60
gtgcaagcgg gtgctggtgt agtccttgat tctgttccgc agtcggaagc cgacgaaacc    120
cgtaacaaag cccgcgctgt actgcgcgct attgccaccg cgcatcatgc acaggagact    180
ttctgatggc tgacattctg ctgctcgata atatcgactc ttttacgtac aacctggcag    240
atcagttgcg ca                                                        252
<210>47
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>47
ttatgccgcc tgtcatcg                                                  18
<210>48
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>48
ataggcttaa tggtaaccg                                                19
<210>49
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
ctgaacaaca gaagtacg                                                 18
<210>50
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
taaccgtgtc atcgagcg                                                 18
<210>51
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>51
aaaaagatct ccatggtaac gatcattcag g                                  31
<210>52
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>52
aaaagaattc ttatcacgcg gccttggtct tcgcc                              35
<210>53
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>53
caaaagctgg atccccacc                                               19
<210>54
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>54
cctatccgag atctctcaac tcc                                           23
<210>55
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>55
catcccatgg atggtaacga tcattcagga t                                  31
<210>56
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>56
gatgtctaga gacactatag aatactcaag c                                  31
<210>57
<211>719
<212>PRT
<213>血色红假单孢菌(Rhodopseudomonas palustris)
<400>57
Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr
 1               5                  10                  15
Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly
            20                  25                  30
Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val
        35                  40                  45
Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp
    50                  55                  60
Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys
65                  70                  75                  80
Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe
                85                  90                  95
Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys
            100                 105                 110
Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp
        115                 120                 125
Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala
    130                 135                 140
Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln
                165                 170                 175
Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro
            180                 185                 190
Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile
        195                 200                 205
Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn
    210                 215                 220
Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala
225                 230                 235                 240
Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala
                245                 250                 255
Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe
            260                 265                 270
Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys
        275                 280                 285
Arg Ile Asn Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly
    290                 295                 300
Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly
305                 310                 315                 320
Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val
                325                 330                 335
Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu
            340                 345                 350
Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp
        355                 360                 365
Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg
    370                 375                 380
Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu
385                 390                 395                 400
Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His
                405                 410                 415
Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln
            420                 425                 430
Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala
        435                 440                 445
Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile
    450                 455                 460
Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala
465                 470                 475                 480
Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln
                485                 490                 495
Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys
            500                 505                 5l0
Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val
        515                 520                 525
Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr
    530                 535                 540
Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly
545                 550                 555                 560
Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro
                565                 570                 575
Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala
            580                 585                 590
Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln
        595                 600                 605
Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro
    610                 615                 620
Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met
625                 630                 635                 640
Arg Gly Leu Pro Asn Glu Val Thr Ile Gly Arg Tyr His Ser Leu Tyr
                645                 650                 655
Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr
            660                 665                 670
Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly
        675                 680                 685
Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val
    690                 695                 700
Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala
705                 710                     715
<210>58
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>58
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Phe
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>59
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>59
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Tyr
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>60
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>60
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Phe Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>61
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>61
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Cys Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
610                     615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>62
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>62
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile 6lu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Phe Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
           500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>63
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>63
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Ala Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>64
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>64
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Ash Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Gly Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>65
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>65
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Trp Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>66
<211>604
<212>PRT
<213>人工序列
<220>
<223>玉米突变体
<400>66
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala
 1               5                  10                  15
Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr
            20                  25                  30
Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala
        35                  40                  45
Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala
    50                  55                  60
Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala
65                  70                  75                  80
Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val
                85                  90                  95
Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu
            100                 105                 110
Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly
        115                 120                 125
Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His
    130                 135                 140
Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp
145                 150                 155                 160
His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln
                165                 170                 175
Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu
            180                 185                 190
Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp
        195                 200                 205
Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro
    210                 215                 220
Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp
225                 230                 235                 240
Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp
                245                 250                 255
Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly
            260                 265                 270
Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val
        275                 280                 285
Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly
    290                 295                 300
Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala
305                 310                 315                 320
Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile
                325                 330                 335
Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu
            340                 345                 350
Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Lys Ala Tyr
        355                 360                 365
Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu
    370                 375                 380
Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr
385                 390                 395                 400
Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln
                405                 410                 415
Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp
            420                 425                 430
Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys
        435                 440                 445
Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile
    450                 455                 460
Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp
465                 470                 475                 480
Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys
                485                 490                 495
Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly
            500                 505                 510
Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln
        515                 520                 525
Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His
    530                 535                 540
Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val
545                 550                 555                 560
Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp
                565                 570                 575
Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala
            580                 585                 590
Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu
        595                 600
<210>67
<211>1815
<212>DNA
<213>人工序列
<220>
<223>玉米突变体
<400>67
atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg     60
cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga    120
accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg    180
agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg    240
cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc    300
acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc    360
ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg    420
gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac    480
cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc    540
atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga    600
tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc    660
tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat    720
gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac    780
cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta    840
tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca    900
cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct     960
gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag    1020
aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg    1080
aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt    1140
cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact    1200
gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat    1260
gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag    1320
gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat    1380
gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat    1440
gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg    1500
gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga    1560
atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca    1620
gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc    1680
gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt    1740
gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt    1800
gtagacaaag aatag                                                     1815
<210>68
<211>2204
<212>DNA
<213>人工序列
<220>
<223>玉米突变体
<400>68
atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg     60
cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga    120
accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg    180
agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg    240
cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc    300
acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc    360
ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg    420
gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac    480
cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc    540
atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga    600
tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc    660
tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat    720
gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac    780
cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta    840
tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca    900
cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct    960
gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag   1020
aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg   1080
aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt   1140
cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact   1200
gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat   1260
gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag   1320
gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat    1380
gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat    1440
gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg    1500
gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga    1560
atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca    1620
gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc    1680
gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt    1740
gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt    1800
gtagacaaag aatagtgtgc tatggttatc gtttagttct tgttcatgtt tcttttaccc    1860
actttccgtt aaaaaaagat gtcattagtg ggtggagaaa agcaataaga ctgttctcta    1920
gaattcgagc tcggtaccgg atccaattcc cgatcgttca aacatttggc aataaagttt    1980
cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta    2040
cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat    2100
gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa    2160
ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatc                     2204
<210>69
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>69
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Lys Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cy8 Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>70
<211>729
<212>PRT
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>70
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys
 1               5                  10                  15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn
            20                  25                  30
Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met
65                  70                  75                  80
Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
                85                  90                  95
Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser
            100                 105                 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala
    130                 135                 140
Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu
                165                 170                 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro
            180                 185                 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp
        195                 200                 205
Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser
    210                 215                 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys
225                 230                 235                 240
Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
                245                 250                 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys
            260                 265                 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu
        275                 280                 285
Lys Ala Ile Asn Pro Ser Pro Tyr Ser Ala Phe Ile Asn Leu Gly Asp
    290                 295                 300
Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 410                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly
            500                 505                 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly
        515                 520                 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu
    610                 615                 620
Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625                 630                 635                 640
Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile
            660                 665                 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu
705                 710                 715                 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala
                725
<210>71
<211>264
<212>DNA
<213>人工序列
<220>
<223>CTP的序列
<400>71
atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg     60
gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac    120
aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct    180
ccgattggaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt    240
ggtcgcgtca actgcatgca ggcc                                           264
<210>72
<211>88
<212>PRT
<213>人工序列
<220>
<223>CTP的序列
<400>72
Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala
 1               5                  10                  15
Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala
            20                  25                  30
Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser
        35                  40                  45
Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly
65                  70                  75                  80
Gly Arg Val Asn Cys Met Gln Ala
                85
<210>73
<211>264
<212>DNA
<213>人工序列
<220>
<223>CTP的序列
<400>73
atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg     60
gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac    120
aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct    180
ccgattgaaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt    240
ggtcgcgtca actgcatgca ggcc                                           264
<210>74
<211>88
<212>PRT
<213>人工序列
<220>
<223>CTP的序列
<400>74
Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala
 1               5                  10                  15
Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala
            20                  25                  30
Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser
        35                  40                  45
Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Glu Lys
    50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly
65                  70                  75                  80
Gly Arg Val Asn Cys Met Gln Ala
                85
<210>75
<211>2190
<212>DNA
<213>人工序列
<220>
<223>优化的根癌土壤杆菌
<400>75
atggtgacca tcattcagga tgacggtgcc gagacctacg agaccaaggg cggcatccag     60
gtgagccgca agcgccgccc caccgattac gccaacgcca tcgataacta catcgaaaag    120
cttgattccc atcgcggtgc cgtgttctcc tccaactacg aatacccagg ccgctacacc    180
cgctgggata ccgccatcgt cgatccacca ctcggcattt cctgcttcgg ccgcaagatg    240
tggatcgaag cctacaacgg ccgcggcgaa gtgctgctcg atttcattac cgaaaagctg    300
aaggccacac ccgatctcac cctcggcgct tcctccaccc gccgcctcga tcttaccgtc    360
aacgaaccag accgcgtctt caccgaagaa gaacgctcca aaatcccaac cgtcttcacc    420
gctctcaggg ccatcgtcga cctcttctac tccagcgccg attccgccat cggcctgttc    480
ggtgccttcg gttacgatct cgccttccag ttcgacgcca tcaagctttc cctggcccgc    540
ccagaagacc agcgcgacat ggtgctgttc ctgcccgatg aaatcctcgt cgttgatcac    600
tactccgcca aggcetggat cgaccgctac gatttcgaga aggacggcat gaccaccgac    660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccacccaag    720
ggcgatcacc gccccggcga atactccgag cttgtggtga aggccaagga aagcttccgc    780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgctg cgaaagcaac    840
ccatccgcca tttcccgccg cctgaaggcc atcaacccat ccccctactc cttcttcatc    900
aacctcggcg atcaggaata cctggtcggc gcctccccag aaatgttcgt gcgcgtctcc    960
ggccgccgca tcgagacctg cccaatctca ggcaccatca agcgcggcga cgatccaatt   1020
gccgacagcg agcagatttt gaaactgctc aactccaaaa aggacgaatc cgaactgacc   1080
atgtgctccg acgtggaccg caacgacaag agccgcgtct gcgagccagg ttccgtgaag   1140
gtcattggcc gccgccagat cgagatgtac tcacgcctca tccacaccgt cgatcacatc   1200
gaaggccgcc tgcgcgacga tatggacgcc ttcgacggtt tcctcagcca cgcctgggcc   1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag   1320
agcccacgcg cctggtacgg cggtgccatc ggcatggtcg gcttcaacgg cgacatgaac   1380
accggcctga ccctgcgcac catccgcatc aaggacggta ttgccgaagt gcgcgccggc   1440
gccaccctgc tcaacgattc caacccacag gaagaagaag ccgaaaccga actgaaggcc   1500
tccgccatga tctcagccat tcgcgacgca aaaggcacca actctgccgc caccaagcgc   1560
ga tgccgccaaagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc   1620
gtgcacaccc tggccaacta cttccgccag accggcgcca ccgtctccac cgtcaggtca   1680
ccagtcgcag ccgacgtgtt cgatcgcttc cagccagacc tcgttgtcct gtcccccggt   1740
cccggcagcc caaccgattt cgactgcaag gcaaccatca aggccgcccg cgcccgcgat   1800
ctgccaatct tcggcgtttg cctcggtctg caggcattgg cagaagccta cggcggcgag   1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttccc gcatccgcgt gctggaaccc   1920
ggcctcgtct tctccggtct cggcaaggaa gtcaccgtcg gtcgctacca ttccatcttc   1980
gccgatcccg ccaccctgcc acgcgatttc atcatcaccg cagaaagcga ggacggcacc   2040
atcatgggca tcgaacacgc caaggaacca gtggccgccg ttcagttcca cccagaatcc   2100
atcatgaccc tcggtcagga cgccggcatg cgcatgatcg agaacgtcgt ggtgcatctg   2160
acccgcaagg ccaagaccaa ggccgcctga                                    2190
<210>76
<211>2160
<212>DNA
<213>血色红假单孢菌
(400>76
atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc     60
gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat    120
ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac    180
gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa    240
ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag    300
cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc    360
gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc    420
ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac    480
ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc    540
gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc    600
gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc    660
ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc    720
gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc    780
ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg    840
gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat    900
ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc    960
cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc   1020
gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg   1080
tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt   1140
ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag   1200
ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc   1260
accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc   1320
ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc   1380
ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc   1440
acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg   1500
gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac   1560
gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg   1620
ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc   1680
ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg   1740
ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc   1800
ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag   1860
ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg   1920
cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc   1980
gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc   2040
gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc   2100
ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa   2160
<210>77
<211>733
<212>PRT
<213>Mesorhizobium loti
<400>77
Met Glu Thr Ala Met Thr Met Lys Val Leu Glu Asn Gly Ala Glu Ser
 1               5                  10                  15
Phe Val Thr Ala Gly Gly Ile Thr Ile Thr Arg Glu Arg His Asp Arg
            20                  25                  30
Pro Tyr Ala Gly Ala Ile Asp Ala Tyr Val Asp Gly Leu Asn Ser Arg
        35                  40                  45
Arg Gly Ala Val Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr
    50                  55                  60
Arg Trp Asp Thr Ala Ile Ile Asp Pro Pro Leu Val Ile Ser Ala Arg
65                  70                  75                  80
Gly Arg Ala Met Arg Ile Glu Ala Leu Asn Arg Arg Gly Glu Ala Leu
                85                  90                  95
Leu Pro Val Ile Gly Lys Thr Leu Gly Gly Leu Ala Asp Ile Thr Ile
            100                 105                 110
Ala Glu Thr Thr Lys Thr Leu Ile Arg Leu Asp Val Ala Lys Pro Gly
        115                 120                 125
Arg Val Phe Thr Glu Glu Glu Arg Ser Arg Val Pro Ser Val Phe Thr
    130                 135                 140
Val Leu Arg Ala Ile Thr Ala Leu Phe Lys Thr Asp Glu Asp Ala Asn
145                 150                 155                 160
Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ser Phe Gln Phe Asp
                165                 170                 175
Pro Val Asp Tyr Lys Leu Glu Arg Lys Pro Ser Gln Arg Asp Leu Val
            180                 185                 190
Leu Phe Leu Pro Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys
        195                 200                 205
Ala Trp Thr Asp Arg Tyr Asp Tyr Ser Gly Glu Gly Phe Ser Thr Glu
    210                 215                 220
Gly Leu Pro Arg Asp Ala Ile Ala Glu Pro Phe Lys Thr Ala Asp Arg
225                 230                 235                 240
Ile Pro Pro Arg Gly Asp His Glu Pro Gly Glu Tyr Ala Asn Leu Val
                245                 250                 255
Arg Arg Ala Met Asp Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val
            260                 265                 270
Pro Gly Gln Met Phe Tyr Glu Arg Cys Glu Thr Gln Pro Ser Asp Ile
        275                 280                 285
Ser Arg Lys Leu Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile
    290                 295                 300
Asn Leu Gly Glu Asn Glu Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe
305                 310                 315                 320
Val Arg Val Asn Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr
                325                 330                 335
Ile Lys Arg Gly Asp Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys
            340                 345                 350
Leu Leu Asn Ser Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp
        355                 360                 365
Val Asp Arg Asn Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg
    370                 375                 380
Val Ile Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr
385                 390                 395                 400
Val Asp His Ile Glu Gly Arg Leu Arg Glu Gly Met Asp Ala Phe Asp
                405                 410                 415
Ala Phe Leu Ser His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys
            420                 425                 430
Leu Trp Ala Met Arg Phe Ile Glu Gln Asn Glu Lys Ser Pro Arg Ala
        435                 440                 445
Trp Tyr Gly Gly Ala Ile Gly Met Val Asn Phe Asn Gly Asp Met Asn
    450                 455                 460
Thr Gly Leu Thr Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu
465                 470                 475                 480
Val Arg Ala Gly Ala Thr Leu Leu Phe Asp Ser Ile Pro Glu Glu Glu
                485                 490                 495
Glu Ala Glu Thr Glu Leu Lys Ala Ser Ala Met Leu Ser Ala Ile Arg
            500                 505                 510
Asp Ala Lys Thr Gly Asn Ser Ala Ser Thr Glu Arg Thr Thr Ala Arg
        515                 520                 525
Val Gly Asp Gly Val Asn Ile Leu Leu Val Asp His Glu Asp Ser Phe
    530                 535                 540
Val His Thr Leu Ala Asn Tyr Phe Arg Gln Thr Gly Ala Asn Val Ser
545                 550                 555                 560
Thr Val Arg Thr Pro Val Pro Asp Glu Val Phe Glu Arg Leu Lys Pro
                565                 570                 575
Asp Leu Val Val Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp
            580                 585                 590
Cys Ala Ala Thr Ile Arg Arg Ala Arg Ala Arg Asp Leu Pro Ile Phe
        595                 600                 605
Gly Val Cys Leu Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu
    610                 615                 620
Leu Arg Gln Leu His Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg
625                 630                 635                 640
Val Ser Lys Pro Gly Ile Ile Phe Ser Gly Leu Pro Lys Glu Val Thr
                645                 650                 655
Val Gly Arg Tyr His Ser Ile Phe Ala Asp Pro Val Arg Leu Pro Asp
            660                 665                 670
Asp Phe Ile Val Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe
        675                 680                 685
Glu His Arg Lys Glu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser
    690                 695                 700
Ile Met Thr Leu Gly His Asn Ala Gly Met Arg Ile Ile Glu Asn Ile
705                 710                 715                 720
Val Ala His Leu Pro Arg Lys Ala Lys Glu Lys Ala Ala
                725                 730
<210>78
<211>732
<212>PRT
<213>巴西固氮螺菌(Azospirillum brasilense)
<400>78
Met Tyr Pro Ala Asp Leu Leu Ala Ser Pro Asp Leu Leu Glu Pro Leu
 1               5                  10                  15
Arg Phe Gln Thr Arg Gly Gly Val Thr Val Thr Arg Arg Ala Thr Ala
            20                  25                  30
Leu Asp Pro Arg Thr Ala Leu Asp Pro Val Ile Asp Ala Leu Asp Arg
        35                  40                  45
Arg Arg Gly Leu Leu Leu Ser Ser Gly Val Glu Ala Pro Gly Arg Tyr
    50                  55                  60
Arg Arg His Ala Leu Gly Phe Thr Asp Pro Ala Val Ala Leu Thr Ala
65                  70                  75                  80
Arg Gly Arg Thr Leu Arg Ile Asp Ala Leu Asn Gly Arg Gly Gln Val
                85                  90                  95
Leu Leu Pro Ala Val Ala Glu Ala Leu Arg Gly Leu Glu Ala Leu Ala
            100                 105                 110
Gly Leu Glu Glu Ala Pro Ser Arg Val Thr Ala Ser Ser Ala Ser Pro
        115                 120                 125
Ala Pro Leu Pro Gly Glu Glu Arg Ser Arg Gln Pro Ser Val Phe Ser
    130                 135                 140
Val Leu Arg Ala Val Leu Asp Leu Phe Ala Ala Pro Asp Asp Pro Leu
145                 150                 155                 160
Leu Gly Leu Tyr Gly Ala Phe Ala Tyr Asp Leu Ala Phe Gln Phe Glu
               165                 170                 175
Pro Ile Arg Gln Arg Leu Glu Arg Pro Asp Asp Gln Arg Asp Leu Leu
            180                 185                 190
Leu Tyr Leu Pro Asp Arg Leu Val Ala Leu Asp Pro Ile Ala Gly Leu
        195                 200                 205
Ala Arg Leu Val Ala Tyr Glu Phe Ile Thr Ala Ala Gly Ser Thr Glu
    210                 215                 220
Gly Leu Glu Cys Gly Gly Arg Asp His Pro Tyr Arg Pro Asp Thr Asn
225                 230                 235                 240
Ala Glu Ala Gly Cys Asp His Ala Pro Gly Asp Tyr Gln Arg Val Val
                245                 250                 255
Glu Ser Ala Lys Ala Ala Phe Arg Arg Gly Asp Leu Phe Glu Val Val
            260                 265                 270
Pro Gly Gln Thr Phe Ala Glu Pro Cys Ala Asp Ala Pro Ser Ser Val
        275                 280                 285
Phe Arg Arg Leu Arg Ala Ala Asn Pro Ala Pro Tyr Glu Ala Phe Val
    290                 295                 300
Asn Leu Gly Arg Gly Glu Phe Leu Val Ala Ala Ser Pro Glu Met Tyr
305                 310                 315                 320
Val Arg Val Ala Gly Gly Arg Val Glu Thr Cys Pro Ile Ser Gly Thr
                325                 330                 335
Val Ala Arg Gly Ala Asp Ala Leu Gly Asp Ala Ala Gln Val Leu Arg
            340                 345                 350
Leu Leu Thr Ser Ala Lys Asp Ala Ala Glu Leu Thr Met Cys Thr Asp
        355                 360                 365
Val Asp Arg Asn Asp Lys Ala Arg Val Cys Glu Pro Gly Ser Val Arg
    370                 375                 380
Val Ile Gly Arg Arg Met Ile Glu Leu Tyr Ser Arg Leu Ile His Thr
385                 390                 395                 400
Val Asp His Val Glu Gly Arg Leu Arg Ser Gly Met Asp Ala Leu Asp
                405                 410                 415
Ala Phe Leu Thr His Ser Trp Ala Val Thr Val Thr Gly Ala Pro Lys
            420                 425                 430
Arg Trp Ala Met Gln Phe Leu Glu Asp Thr Glu Gln Ser Pro Arg Arg
        435                 440                 445
Trp Tyr Gly Gly Ala Phe Gly Arg Leu Gly Phe Asp Gly Gly Met Asp
    450                 455                 460
Thr Gly Leu Thr Leu Arg Thr Ile Arg Met Ala Glu Gly Val Ala Tyr
465                 470                 475                 480
Val Arg Ala Gly Ala Thr Leu Leu Ser Asp Ser Asp Pro Asp Ala Glu
                485                 490                 495
Asp Ala Glu Cys Arg Leu Lys Ala Ala Ala Phe Arg Asp Ala Ile Arg
            500                 505                 510
Gly Thr Ala Ala Gly Ala Ala Pro Thr Leu Pro Ala Ala Pro Arg Gly
        515                 520                 525
Gly Glu Gly Arg Arg Val Leu Leu Val Asp His Asp Asp Ser Phe Val
    530                 535                 540
His Thr Leu Ala Asp Tyr Leu Arg Gln Thr Gly Ala Ser Val Thr Thr
545                 550                 555                 560
Leu Arg His Ser His Ala Arg Ala Ala Leu Ala Glu Arg Arg Pro Asp
                565                 570                 575
Leu Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ala Asp Phe Asp Val
            580                 585                 590
Ala Gly Thr Ile Asp Ala Ala Leu Ala Leu Gly Leu Pro Val Phe Gly
        595                 600                 605
Val Cys Leu Gly Leu Gln Gly Met Val Glu Arg Phe Gly Gly Ala Leu
    610                 615                 620
Asp Val Leu Pro Glu Pro Val His Gly Lys Ala Thr Glu Val Arg Val
625                 630                 635                 640
Leu Gly Gly Ala Leu Phe Ala Gly Leu Pro Glu Arg Leu Thr Val Gly
                645                 650                 655
Arg Tyr His Ser Leu Val Ala Arg Arg Asp Arg Leu Pro Ala Asp Leu
            660                 665                 670
Thr Val Thr Ala Glu Thr Ala Asp Gly Leu Val Met Ala Val Glu His
        675                 680                 685
Arg Arg Leu Pro Leu Ala Ala Val Gln Phe His Pro Glu Ser Ile Leu
    690                 695                 700
Ser Leu Asp Gly Gly Ala Gly Leu Ala Leu Leu Gly Asn Val Met Asp
705                 710                 715                 720
Arg Leu Ala Ala Gly Ala Leu Thr Asp Ala Ala Ala
                725                 730
<210>79
<211>731
<212>PRT
<213>马耳他布鲁氏菌(Brucella melitensis)
<400>79
Met Asn Ala Lys Thr Ala Asp Ser Glu Ile Phe Gln His Glu Thr Ala
 1               5                  10                  15
Gly Gly Ile Ile Val Glu Arg Val Arg His Leu Thr Ala Tyr Lys Gly
            20                  25                  30
Ala Ile Glu Ser Tyr Ile Asp Val Leu Asn Glu Trp Arg Gly Ala Val
        35                  40                  45
Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr
    50                  55                  60
Ala Ile Val Asp Pro Pro Val Val Ile Thr Ser Arg Ala Arg Thr Met
65                  70                  75                  80
Arg Ile Glu Ala Leu Asn Ala Arg Gly Val Ile Leu Leu Arg Pro Ile
                85                  90                  95
Leu Asp Thr Val Lys Ala Leu Ser Glu Val Lys Ile Asp Gln Ser Gly
            100                 105                 110
Glu Asn Arg Ile Asp Leu Thr Ile Val Glu Pro Val Gly Thr Phe Thr
        115                 120                 125
Glu Glu Glu Arg Ser Arg Met Pro Ser Val Phe Thr Val Leu Arg Ala
    130                 135                 140
Ile Val Gly Leu Phe Phe Ser Glu Glu Asp Ala Asn Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Pro Ile Gln Tyr
                165                 170                 175
Lys Leu Lys Arg Pro Asp Asp Gln Arg Asp Leu Val Leu Phe Ile Pro
            180                 185                 190
Asp Glu Ile Phe Val Ala Asp His Tyr Ala Ala Arg Ala Trp Val Asp
        195                 200                 205
Arg Tyr Glu Phe Arg Cys Gly Gly Ser Ser Thr His Gly Leu Asp Arg
    210                 215                 220
Ala Thr Pro Val Val Pro Phe Lys Pro Ser Glu Arg Lys Leu Ala Arg
225                 230                 235                 240
Gly Asp His Asn Pro Gly Glu Tyr Ala Arg Leu Val Glu Arg Ala Lys
                245                 250                 255
Glu Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Thr
            260                 265                 270
Phe Tyr Glu Arg Cys His Thr Ala Pro Ser Glu Ile Phe Arg Arg Leu
        275                 280                 285
Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Glu
    290                 295                 300
Ser Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Asn
305                 310                 315                 320
Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly
                325                 330                 335
Glu Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser
            340                 345                 350
Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
        355                 360                 365
Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg
    370                 375                 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile
385                 390                 395                 400
Glu Gly Arg Leu Arg Asp Gly Met Asp Ala Phe Asp Gly Phe Leu Ser
                405                 4l0                 415
His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met
            420                 425                 430
Arg Phe Leu Glu Glu Asn Glu Arg Ser Pro Arg Ala Trp Tyr Gly Gly
        435                 440                 445
Ala Ile Gly Met Met His Phe Asn Gly Asp Met Asn Thr Gly Leu Thr
    450                 455                 460
Leu Arg Thr Ile Arg Ile Lys Asp Gly Val Ala Glu Ile Arg Ala Gly
465                 470                 475                 480
Ala Thr Leu Leu Phe Asp Ser Asn Pro Asp Glu Glu Glu Ala Glu Thr
                485                 490                 495
Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Val Arg Asp Ala Gln Lys
            500                 505                 510
Ser Asn Gln Ile Ala Glu Glu Ser Val Ala Ala Lys Val Gly Glu Gly
        515                 520                 525
Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu
    530                 535                 540
Ala Asn Tyr Phe Arg Gln Thr Gly Ala Lys Val Ser Thr Val Arg Ser
545                 550                 555                 560
Pro Val Ala Glu Glu Ile Phe Asp Arg Val Asn Pro Asp Leu Val Val
                565                 570                 575
Leu Ser Pro Gly Pro Gly Ser Pro Gln Asp Phe Asp Cys Lys Ala Thr
            580                 585                 590
Ile Asp Lys Ala Arg Lys Arg Gln Leu Pro Ile Phe Gly Val Cys Leu
        595                 600                 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Ala Leu Arg Gln Leu
    610                 615                 620
Arg Val Pro Val His Gly Lys Pro Ser Arg Ile Arg Val Ser Lys Pro
625                 630                 635                 640
Glu Arg Ile Phe Ser Gly Leu Pro Glu Glu Val Thr Val Gly Arg Tyr
                645                 650                 655
His Ser Ile Phe Ala Asp Pro Glu Arg Leu Pro Asp Asp Phe Leu Val
            660                 665                 670
Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe Glu His Lys His
        675                 680                 685
Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu
    690                 695                 700
Gly His Asn Ala Gly Met Arg Met Ile Glu Asn Ile Val Thr His Leu
705                 710                 715                 720
Ala Gly Lys His Lys Ala Arg Arg Thr Asn Tyr
                725                 730
<210>80
<211>735
<212>PRT
<213>念珠蓝细菌(Nostoc sp.)
<400>80
Met Ile Ala Asp Ser His Ser Tyr Arg Thr Asn Gly Asn Val Arg Val
 1               5                  10                  15
Ser Arg Ser Ile Thr Gln Val Lys Met Glu Thr Ala Leu Glu Glu Ile
            20                  25                  30
Leu Phe Tyr Leu Asn Ser Gln Arg Gly Gly Leu Leu Thr Ser Ser Tyr
        35                  40                  45
Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe Val Asn Pro
    50                  55                  60
Pro Val Glu Leu Ser Thr Ser Gly Asn Thr Phe Thr Leu Thr Ala Leu
65                  70                  75                  80
Asn Glu Arg Gly Tyr Val Leu Leu Pro Val Ile Phe Glu Cys Leu Ser
                85                  90                  95
Lys Ser Glu Gln Leu Gln Lys Leu Thr Glu His His His Lys Ile Thr
            100                 105                 110
Gly Leu Val Lys Ser Thr Pro Glu Phe Phe Ala Glu Glu Glu Arg Ser
        115                 120                 125
Lys Gln Pro Ser Thr Phe Thr Val Ile Arg Glu Ile Leu His Ile Phe
    130                 135                 140
Ser Ser Gln Glu Asp Glu His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr
145                 150                 155                 160
Asp Leu Val Phe Gln Phe Glu Gln Ile Thr Gln Cys Leu Glu Arg Pro
                165                 170                 175
Gln Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu Leu Ile Val
            180                 185                 190
Val Asp Tyr Tyr Gln Gln Gln Ala Phe Arg Leu Glu Tyr Asp Phe Ile
        195                 200                 205
Thr Ala His Gly Ser Thr Tyr Asp Leu Pro Arg Thr Gly Glu Ser Val
    210                 215                 220
Asp Tyr Arg Gly Gln Cys Leu Thr Pro Pro Gln Asn Ala Asp His Lys
225                 230                 235                 240
Ile Gly Glu Tyr Ala Lys Leu Val Glu Phe Ala Leu Asp Tyr Phe Arg
                245                 250                 255
Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe Phe Thr Ala
            260                 265                 270
Cys Glu Ala Pro Pro Ser Gln Leu Phe Glu Thr Leu Lys Gln Ile Asn
        275                 280                 285
Pro Ser Pro Tyr Gly Phe Ile Phe Asn Leu Gly Gly Glu Tyr Ile Ile
    290                 295                 300
Gly Ala Ser Pro Glu Met Phe Val Arg Val Glu Gly Arg Arg Val Glu
305                 310                 315                 320
Thr Cys Pro Ile Ser Gly Thr Ile Thr Arg Gly His Asp Ala Ile Asp
                325                 330                 335
Asp Ala Val Gln Ile Arg Gln Leu Leu Asn Ser His Lys Asp Glu Ala
            340                 345                 350
Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys Ser Arg Ile
        355                 360                 365
Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg Arg Gln Ile Glu Leu
    370                 375                 380
Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly Ile Leu Arg
385                 390                 395                 400
Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr Trp Ala Val
                405                 410                 415
Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Ile Gln Phe Ile Glu Lys
            420                 425                 430
Asn Glu Arg Ser Val Arg Arg Trp Tyr Gly Gly Ala Val Gly Tyr Leu
        435                 440                 445
Asn Phe Asn Gly Asn Leu Asn Thr Gly Leu Ile Leu Arg Thr Ile Arg
    450                 455                 460
Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr Leu Leu Tyr
465                 470                 475                 480
Asp Ser Ile Pro Gln Ala Glu Glu Gln Glu Thr Ile Thr Lys Ala Ala
                485                 490                 495
Ala Ala Phe Glu Thr Ile Arg Arg Ala Lys Gln Ile Asp Pro Gln Ile
            500                 505                 510
Glu Glu Ser Ser Thr Arg Lys Leu Ser Lys Tyr Leu Pro Asp Gly Gln
        515                 520                 525
Ser Gly Lys His Ile Leu Leu Ile Asp His Glu Asp Ser Phe Val His
    530                 535                 540
Thr Leu Ala Asn Tyr Ile Arg Ser Thr Gly Ala Thr Val Thr Thr Leu
545                 550                 555                 560
Arg His Gly Phe Ser Glu Ser Leu Phe Asp Thr Glu Arg Pro Asp Leu
                565                 570                 575
Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ser Glu Phe Lys Val Gln
            580                 585                 590
Glu Thr Val Ala Ala Cys Val Arg Arg Gln Ile Pro Leu Phe Gly Val
        595                 600                 605
Cys Leu Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly
    610                 615                 620
Val Leu Asn Tyr Pro Gln His Gly Lys Ser Ser Arg Ile Phe Val Thr
625                 630                 635                 640
Ala Pro Asp Ser Val Met Phe Gln Asp Leu Pro Glu Ser Phe Thr Val
                645                 650                 655
Gly Arg Tyr His Ser Leu Phe Ala Leu Ser Gln Arg Leu Pro Lys Glu
            660                 665                 670
Leu Lys Val Thr Ala Ile Ser Asp Asp Glu Val Ile Met Ala Ile Glu
        675                 680                 685
His Gln Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile
    690                 695                 700
Met Thr Leu Ala Gly Glu Val Gly Leu Met Met Ile Lys Asn Val Val
705                 710                 715                 720
Gln Lys Tyr Thr Gln Ser Gln Gln Ser Thr Val Pro Ile Tyr Asp
                725                 730                 735
<210>81
<211>715
<212>PRT
<213>念珠蓝细菌
<400>81
Met Arg Val Ser Arg Ser Thr Thr Glu Val Lys Met Asp Thr Ala Leu
 1               5                  10                  15
Asp Glu Ile Leu Phe His Leu Asn Gln Val Arg Gly Gly Leu Leu Thr
            20                  25                  30
Ser Ser Tyr Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe
        35                  40                  45
Ile Asn Pro Pro Leu Gln Leu Thr Thr Arg Glu Asn Ala Phe Thr Ile
    50                  55                  60
Ser Ser Leu Asn Pro Arg Gly Gln Val Leu Leu Pro Thr Leu Phe Gln
65                  70                  75                  80
His Leu Ser Ala Gln Ser Gln Leu Gln Gln Ile Ser Leu Asn His Asp
                85                  90                  95
Tyr Ile Thr Gly Glu Ile Arg Pro Thr Lys Gln Leu Phe Thr Glu Glu
            100                 105                 110
Gln Arg Ser Lys Gln Pro Ser Ala Phe Thr Val Ile Arg Glu Ile Leu
        115                 120                 125
Gln Ile Phe Ala Ser Asp Glu Asp Glu His Leu Gly Leu Tyr Gly Ala
    130                 135                 140
Phe Gly Tyr Asp Leu Val Phe Gln Phe Glu Pro Ile Pro Gln Lys Ile
145                 150                 155                 160
Ala Arg Pro Ala Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu
                165                 170                 175
Leu Ile Val Val Asp Tyr Tyr Leu Gln Lys Ala Tyr Arg His Gln Tyr
            180                 185                 190
Glu Phe Ala Thr Glu His Gly Asn Thr Glu His Leu Pro Arg Thr Gly
        195                 200                 205
Gln Ser Ile Asp Tyr Gln Gly Lys His Leu Leu Pro Asn Gln Thr Ala
    210                 215                 220
Asp His Gln Pro Gly Glu Tyr Ala Asn Leu Val Glu Gln Ala Leu Asp
225                 230                 235                 240
Tyr Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe
                245                 250                 255
Phe Thr Ala Cys Glu Gln Ser Pro Ser Gln Leu Phe Gln Thr Leu Arg
            260                 265                 270
Gln Ile Asn Pro Ser Pro Tyr Gly Phe Leu Leu Asn Leu Gly Gly Glu
        275                 280                 285
Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Asp Gly Arg
    290                 295                 300
Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Arg Arg Gly Glu Asp
305                 310                 315                 320
Ala Leu Gly Asp Ala Val Gln Ile Arg Gln Leu Leu Asn Ser His Lys
                325                 330                 335
Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys
            340                 345                 350
Ser Arg Ile Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg Arg Gln
        355                 360                 365
Ile Glu Leu Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly
    370                 375                 380
Ile Leu Arg Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr
385                 390                 395                 400
Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met Gln Phe
                405                 410                 415
Ile Glu Gln His Glu Arg Ser Ala Arg Arg Trp Tyr Gly Gly Ala Val
            420                 425                 430
Gly Tyr Leu Gly Phe Asn Gly Asn Leu Asn Thr Gly Leu Thr Leu Arg
        435                 440                 445
Thr Ile Arg Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr
    450                 455                 460
Val Leu Tyr Asp Ser Ile Pro Ser Ala Glu Glu Glu Glu Thr Ile Thr
465                 470                 475                 480
Lys Ala Thr Ala Leu Phe Glu Thr Ile Arg Arg His Thr Thr Ala Asn
                485                 490                 495
Lys Thr Gln Gly Asn Asp Ser His Arg Pro Gly Asp Ile Ala His Asn
            500                 505                 510
Lys Arg Ile Leu Leu Ile Asp Tyr Glu Asp Ser Phe Val His Thr Leu
        515                 520                 525
Ala Asn Tyr Ile Arg Thr Thr Gly Ala Thr Val Thr Thr Leu Arg His
    530                 535                 540
Gly Phe Ala Glu Ser Tyr Phe Asp Ala Glu Arg Pro Asp Leu Val Val
545                 550                 555                 560
Leu Ser Pro Gly Pro Gly Arg Pro Ser Asp Phe Arg Val Pro Gln Thr
                565                 570                 575
Val Ala Ala Leu Val Gly Arg Glu Ile Pro Ile Phe Gly Val Cys Leu
            580                 585                 590
Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly Val Leu
        595                 600                 605
Asp Tyr Pro Gln His Gly Lys Pro Ala Arg Ile Ser Val Thr Ala Pro
    610                 615                 620
Asp Ser Val Leu Phe Gln Asn Leu Pro Ala Ser Phe Ile Val Gly Arg
625                 630                 635                 640
Tyr His Ser Leu Phe Ala Gln Pro Gln Thr Ile Pro Gly Glu Leu Lys
                645                 650                 655
ValThr Ala Ile Ser Glu Asp Asn Val Ile Met Ala Ile Glu His Gln
           660                 665                 670
Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr
        675                 680                 685
Leu Ala Gly Glu Val Gly Gln Thr Ile Ile Lys Asn Val Val Gln Thr
    690                 695                 700
Tyr Thr Gln Thr Leu Glu Thr Ser Ile Tyr Ser
705                 710                 715
<210>82
<211>719
<212>PRT
<213>血色红假单孢菌
<400>82
Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr
 1               5                  10                  15
Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly
            20                  25                  30
Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val
        35                  40                  45
Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp
    50                  55                  60
Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys
65                  70                  75                  80
Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe
                85                  90                  95
Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys
                100                 105                 110
Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp
            115                 120                 125
Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala
        130                 135                 140
Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr
145                 150                 155                 160
Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln
                165                 170                 175
Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro
            180                 185                 190
Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile
        195                 200                 205
Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn
    210                 215                 220
Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala
225                 230                 235                 240
Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala
                245                 250                 255
Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe
            260                 265                 270
Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys
        275                 280                 285
Arg Ile Asn Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly
    290                 295                 300
Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly
305                 310                 315                 320
Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val
                325                 330                 335
Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu
            340                 345                 350
Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp
        355                 360                 365
Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg
    370                 375                 380
Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu
385                 390                 395                 400
Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His
                405                 410                 415
Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln
            420                 425                 430
Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala
        435                 440                 445
Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile
    450                 455                 460
Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala
465                 470                 475                 480
Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln
                485                 490                 495
Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys
            500                 505                 510
Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val
        515                 520                 525
Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr
    530                 535                 540
Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly
545                 550                 555                 560
Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro
                565                 570                 575
Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala
            580                 585                 590
Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln
        595                 600                 605
Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro
    610                 615                 620
Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met
625                 630                 635                 640
Arg Gly Leu Pro Asn Glu Val Thr Ile Gly Arg Tyr His Ser Leu Tyr
                645                 650                 655
Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr
            660                 665                 670
Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly
        675                 680                 685
Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val
    690                 695                 700
Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala
705                 710                 715
<210>83
<211>2160
<212>DNA
<213>血色红假单孢菌
<400>83
atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc      60
gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat     120
ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac     180
gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa     240
ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag     300
cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc     360
gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc     420
ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac     480
ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc     540
gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc     600
gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc     660
ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc     720
gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc     780
ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg     840
gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat     900
ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc     960
cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc    1020
gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg    1080
tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt    1140
ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag    1200
ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc    1260
accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc    1320
ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc    1380
ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc    1440
acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg    1500
gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac    1560
gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg    1620
ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc    1680
ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg    1740
ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc    1800
ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag    1860
ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg    1920
cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc    1980
gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc    2040
gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc    2100
ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa    2160
<210>84
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>84
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc gtttttttcg tccaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcgat ttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1 140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>85
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>85
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc gtatttttcg tccaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>86
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>86
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc ggttttttcg ttcaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>87
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>87
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc ggttttttcg tgcaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg     2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>88
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>88
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc ggttttttcg tccttctatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>89
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>89
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacgcgt cgccctattc cttcttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>90
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>90
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacgggt cgccctattc cttcttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>91
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>91
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc ctggttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>92
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>92
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc ggtttttaag tccaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>93
<211>2190
<212>DNA
<213>人工序列
<220>
<223>根癌土壤杆菌突变体
<400>93
atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag      60
gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag     120
cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc     180
cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg     240
tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg     300
aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc     360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc     420
gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc     480
ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt     540
ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac     600
tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac     660
ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag     720
ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc     780
cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat     840
ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cgccttcatc     900
aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc     960
ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt    1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc    1080
atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag    1140
gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc    1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc    1260
gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag    1320
agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat    1380
accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc    1440
gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc    1500
tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt    1560
gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc    1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca    1680
ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga    1740
cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat    1800
ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag    1860
ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc    1920
ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc    1980
gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg    2040
atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg    2100
atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg    2160
acccgcaagg cgaagaccaa ggccgcgtga                                     2190
<210>94
<211>1821
<212>DNA
<213>稻(Oryza sativa)
<400>94
atggagtcca tcgccgccgc cacgttcacg ccctcgcgcc tcgccgcccg ccccgccact      60
ccggcggcgg cggcggcccc ggttagagcg agggcggcgg tagcggcagg agggaggagg     120
aggacgagta ggcgcggcgg cgtgaggtgc tccgcgggga agccagaggc aagcgcggtg     180
atcaacggga gcgcggcggc gcgggcggcg gaggaggaca ggaggcgctt cttcgaggcg     240
gcggagcgtg ggagcgggaa gggcaacctg gtgcccatgt gggagtgcat cgtctccgac     300
cacctcaccc ccgtgctcgc ctaccgctgc ctcgtccccg aggacaacat ggagacgccc     360
agcttcctct tcgagtccgt cgagcagggg cccgagggca ccaccaacgt cggtcgctat     420
agcatggtgg gagcccaccc agtgatggag gtcgtggcaa aggagcacaa ggtcacaatc     480
atggaccacg agaagggcaa ggtgacggag caggtcgtgg atgatcctat gcagatcccc     540
aggagcatga tggaaggatg gcacccgcag cagatcgatc agctccccga ttccttcacc     600
ggtggatggg tcgggttctt ttcctatgat acagtccgtt atgttgaaaa gaagaagctg     660
cccttctccg gtgctcccca ggacgatagg aaccttcctg atgttcacct tgggctttat     720
gatgatgttc tcgtcttcga caatgtcgag aagaaagtat atgtcatcca ttgggtaaat     780
cttgatcggc atgcaaccac cgaggatgca ttccaagatg gcaagtcccg gctgaacctg     840
ttgctatcta aagtgcacaa ttcaaatgta cccaagcttt ctccaggatt tgtaaagtta     900
cacactcggc agtttggtac acctttgaac aaatcaacca tgacaagtga tgagtacaag     960
aatgctgtta tgcaggctaa ggagcatatt atggctggtg atattttcca gattgtttta    1020
agccagaggt ttgagaggca gacatacgcc aatccatttg aagtctatcg agctttacga    1080
attgtgaacc caagtccata catggcatat gtacaggcaa gaggctgtgt cctggtagca    1140
tctagtccag aaattcttac tcgtgtgagg aagggtaaaa ttattaaccg tccacttgct    1200
gggactgttc gaaggggcaa gacagagaag gaagatgaaa tgcaagagca acaactacta    1260
agtgatgaaa aacagtgtgc tgaacatatt atgcttgtag atttgggaag gaatgatgtt    1320
ggaaaggtct ccaaacctgg atctgtgaag gtggagaaat taatgaacat tgaacgctac    1380
tcccatgtca tgcacatcag ttccacggtg agtggagagt tggatgatca tctccaaagt    1440
tgggatgccc tgcgagccgc gttgcctgtt ggaacagtta gtggagcacc aaaggtgaaa    1500
gccatggagc tgatagacga gctagaggtc acaagacgag gaccatacag tggcggcctt    1560
ggagggatat catttgacgg ggacatgctt atcgctcttg cactccgcac cattgtgttc    1620
tcaacagcgc caagccacaa cacgatgtac tcatacaaag acaccgagag gcgccgggag    1680
tgggtcgctc accttcaggc tggtgctggc attgtcgctg atagcagccc agacgacgag    1740
caacgtgaat gcgagaacaa ggcagccgct ctggctcgag ccatcgatct tgctgaatca    1800
gctttcgtag acaaggaata g                                              1821
<210>95
<211>1498
<212>DNA
<213>稻
<400>95
gaattcaaat tttttatata gagtatttct atacatgaat ttttctaact ttttgttttt      60
taaaaaaaat ttgtgtggtg tactgtaata ggaagagaag aaggggagga ggaaggaggg     120
agaagaggga ggagtatatg gggagggggg gatgaactga tcgcccagcg tgatagctgg     180
cgatcgagca cccattagaa gggcccaata aaccctggat aattgtcatt gagtggcacc     240
tttcattgag aagacgttat taggaattgt agaagtggat aattatgcta tctgttgtat     300
tgagtgtcac tgtcaccgat aaagctttgc tggttaatgc attgtatttc tccatcaacg     360
cttcatgata caatggtatt tggacgtgtt tataaaataa tatacgtata atgtgggtgg     420
cctagcggcg gccggttaca catagcagcg atcggtccga tgctagtctt cattcattca     480
ggtatgtatt caggtatcag tgtgtgggtg atagtttttt tttttcgttt ttctagttac     540
gatatctcat atctcatagt tgtgatctta taaacttttt catgtttatc aatataaatt     600
tcgtgttatc tagtcgttaa aagaaccgta taatgtggca aaaaaaatgt ataatgtgtc     660
agagtttgca cgtgtttatc ttgctgcccc gaaacgatta attcagtgat ttggcaacaa     720
caaaatgtcg tggcggataa gcatatccgt cccaaaagga aaaaaagaaa aggaaaaata     780
atctttagaa ataaagccct tactttttcc aagaagcaga ggtaaccgta gctggtattc     840
cgcggctaac tcaatccctt tctctggagt cttggagcgg cacggcggct gcgcacccga     900
cctcgcccac cacctgctcg gcgaaacgcc cggctcggcc gcgacgtgtc ccaccgcacc     960
gcgcgcgcac ccgcgcgccc cgagcccctc gccgcctccg cgcgggcgcc gcacctattt    1020
aaatgcggcc ccgatcccgc attctctcaa ctgcactagt ccccaccaac ggctcggtcc    1080
agtagagttt atcccccacc tatggccagc ctcgtgctct ccctgcgcat cgcccgttcc    1140
acgccgccgc tggggctggg cggggggcga ttccgcggcc gacgaggggc cgtcgcctgc    1200
cgcgccgcca cgttccagca gctcgacgcc gtcggtgagt ctccgtatca aatgtggggg    1260
ggcatgtctt ggtttgcgga ttggtgggtt gatttgaatg tgtgttctcg tggccgcagc    1320
ggtgagggag gaggagtcca agttcaaggc gggggcggcg gagggttgca acatcctgcc    1380
gctcaagcga tgcatcttct ccgaccacct cacgccggtg ctcgcgtacc gctgcctcgt    1440
cagggaggac gaccgcgagg cgcccagctt cctgtttgag tccgtcgagc agggatcc      1498
<210>96
<211>2073
<212>DNA
<213>玉米
<400>96
gaattccgcc aaatcgggct atagatcaaa cgctgcactg tagggagcgt gaagccagcg      60
gcgaatggaa tccctagccg ccacctccgt gttcgcgccc tcccgcgtcg ccgtcccggc     120
ggcgcgggcc ctggttaggg cggggacggt ggtaccaacc aggcggacga gcagccggag     180
cggaaccagc ggggtgaaat gctctgctgc cgtgacgccg caggcgagcc cagtgattag     240
caggagcgct gcggcggcga aggcggcgga ggaggacaag aggcggttct tcgaggcggc     300
ggcgcggggg agcgggaagg ggaacctggt gcccatgtgg gagtgcatca aggggaacct     360
ggtgcccatg tgggagtgca tcgtgtcgga ccatctcacc cccgtgctcg cctaccgctg     420
cctcgtcccc gaggacaacg tcgacgcccc cagcttcctc ttcgagtccg tcgagcaggg     480
gccccagggc accaccaacg tcggccgcta tagcatggtg ggagcccacc cagtgatgga     540
gattgtggcc aaagaccaca aggttacgat catggaccac gagaagagcc aagtgacaga     600
gcaggtagtg gacgacccga tgcagatccc gaggaccatg atggagggat ggcacccaca     660
gcagatcgac gagctccctg aatccttctc cggtggatgg gttgggttct tttcctatga     720
tacggttagg tatgttgaga agaagaagct accgttctcc agtgctcctc aggacgatag     780
gaaccttcct gatgtgcact tgggactcta tgatgatgtt ctagtcttcg ataatgttga     840
gaagaaagta tatgttatcc attgggtcaa tgtggaccgg catgcatctg ttgaggaagc     900
ataccaagat ggcaggtccc gactaaacat gttgctatct aaagtgcaca attccaatgt     960
ccccacactc tctcctggat ttgtgaagct gcacacacgc aagtttggta cacctttgaa    1020
caagtcgacc atgacaagtg atgagtataa gaatgctgtt ctgcaggcta aggaacatat    1080
tatggctggg gatatcttcc agattgtttt aagccagagg ttcgagagac gaacatatgc    1140
caacccattt gaggtttatc gagcattacg gattgtgaat cctagcccat acatggcgta    1200
tgtacaggca agaggctgtg tattggttgc gtctagtcct gaaattctta cacgagtcag    1260
taaggggaag attattaatc gaccacttgc tggaactgtt cgaaggggca agacagagaa    1320
ggaagatcaa atgcaagagc agcaactgtt aagtgatgaa aaacagtgtg ccgagcacat    1380
aatgcttgtg gacttgggaa ggaatgatgt tggcaaggta tccaaaccag gaggatcagt    1440
gaaggtggag aagttgatta ttgagagata ctcccatgtt atgcacataa gctcaacggt    1500
tagtggacag ttggatgatc atctccagag ttgggatgcc ttgagagctg ccttgcccgt    1560
tggaacagtc agtggtgcac caaaggtgaa ggccatggag ttgattgata agttggaagt    1620
tacgaggcga ggaccatata gtggtggtct aggaggaata tcgtttgatg gtgacatgca    1680
aattgcactt tctctccgca ccatcgtatt ctcaacagcg ccgagccaca acacgatgta    1740
ctcatacaaa gacgcagata ggcgtcggga gtgggtcgct catcttcagg ctggtgcagg    1800
cattgttgcc gacagtagcc cagatgacga acaacgtgaa tgcgagaata aggctgctgc    1860
actagctcgg gccatcgatc ttgcagagtc agcttttgtg aacaaagaat agtgtgctat    1920
ggttatcgtt tagttcttgt tcatgtttct tttacccact ttccgttaaa aaaagatgtc    1980
attagtgggt ggagaaaagc aataagactg ttctctagag aaccgaagaa atatggaaat    2040
tgaggttatg gccggaattc ctgcagcccg ggg                                 2073
<210>97
<211>504
<212>DNA
<213>小麦(Triticum aestivum)
<400>97
cccaaacagt ggtggcttag gagggatatc atttgatggt gacatgctta tcgctcttgc      60
tctccgcacc attgtgtttt caacagctcc aagccccaat aggatgtact catacaaaag     120
ctcagatagg ccccgagagt gggttgctca tcttcaggct ggtgcgggca ttgttgctga     180
tagtatccca gacgatgagc aaaaagaatt tgagaataag gcggctgccc tagctcgggc     240
aattgatctt gcagagtcgg cttttttaga caaagaatag agtgtctatt aaattatttt     300
ttttagttgt tcatcatttt tcacccagtt cattttggaa agttgttcat cgttttttca     360
ccgagttcat attggggaaa aaaagcaata ccgttttgtt gtcctttgaa atgaataaat     420
ttgagctata ataagatgta ttttgctcat cgggcaaaaa aaaaaaaaaa aatataaaaa     480
aaaaaaaaaa aaaaaaaaaa aata                                            504
<210>98
<211>2161
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>98
gtcaaaaatc cccatttcac cgtttcctcg tttctcctcc tcactaattt tgtctctttc      60
tcttggtttg ctattgtgct cttgtaggaa tgcagtcgtt acctatctca taccggttgt     120
ttccggccac ccaccggaaa gttctgccat tcgccgtcat ttctagccgg agctcaactt     180
ctgcacttgc gcttcgtgtc cgtacactac aatgccgctg ccttcactct tcatctctag     240
ttatggatga ggacaggttc attgaagctt ctaaaagcgg gaacttgatt ccgctgcaca     300
aaaccatttt ttctgatcat ctgactccgg tgctggctta ccggtgtttg gtgaaagaag     360
acgaccgtga agctccaagc tttctctttg aatccgttga acctggtttt cgaggttcta     420
gtgttggtcg ctacagcgtg gtgggggctc aaccatctat ggaaattgtg gctaaggaac     480
acaatgtgac tatattggac caccacactg gaaaattgac ccagaagact gtccaagatc     540
ccatgacgat tccgaggagt atttctgagg gatggaagcc cagactcatt gatgaacttc     600
ctgatacctt ttgtggtgga tgggttggtt atttctcata tgacacagtt cggtatgtag     660
agaacaggaa gttgccattc ctaagggctc cagaggatga ccggaacctt gcagatattc     720
aattaggact atacgaagat gtcattgtgt ttgatcatgt tgagaagaaa gcacatgtga     780
ttcactgggt gcagttggat cagtattcat ctcttcctga ggcatatctt gatgggaaga     840
aacgcttgga aatattagtg tctagagtac aaggaattga gtctccaagg ttatctcccg     900
gttctgtgga tttctgtact catgcttttg gaccttcatt aaccaaggga aacatgacaa     960
gtgaggagta caagaatgct gtcttacaag caaaggagca cattgctgca ggagacatat    1020
ttcaaatcgt tttaagtcaa cgctttgaga gaagaacatt tgctgaccca tttgaagtgt    1080
acagagcatt aagaattgtg aatccaagcc catatatgac ttacatacaa gccagaggct    1140
gtattttagt tgcatcgagc ccagaaattt tgacacgtgt gaagaagaga agaattgtta    1200
atcgaccact ggctgggaca agcagaagag ggaagacacc tgatgaggat gtgatgttgg    1260
aaatgcagat gttaaaagat gagaaacaac gcgcagagca catcatgctg gttgatttag    1320
gacgaaatga tgtaggaaag gtgtcaaaac ctggttctgt gaatgtcgaa aagctcatga    1380
gcgttgagcg gtattcccat gtgatgcaca taagctccac ggtctctgga gagttgcttg    1440
atcatttaac ctgttgggat gcactacgtg ctgcattgcc tgttgggacc gtcagtggag    1500
caccaaaggt aaaggccatg gagttgattg atcagctaga agtagctcgg agagggcctt    1560
acagtggtgg gtttggaggc atttcctttt caggtgacat ggacatcgca ctagctctaa    1620
ggacgatggt attcctcaat ggagctcgtt atgacacaat gtattcatat acagatgcca    1680
gcaagcgtca ggaatgggtt gctcatctcc aatccggggc tggaattgtg gctgatagta    1740
atcctgatga ggaacagata gaatgcgaga ataaagtagc cggtctgtgc cgagccattg    1800
acttggccga gtcagctttt gtaaagggaa gacacaaacc gtcagtcaag ataaatggtt    1860
ctgtgccaaa tctattttca agggtacaac gtcaaacatc tgttatgtcg aaggacagag    1920
tacatgagaa aagaaactag cgaatatgaa gatgtacata aattctaaag tggttttctt    1980
gttcagttta atcttttact ggattgagac tgtagttgct gaagatagtt gtttagaatg    2040
accttcattt tggtgttcct gaaaggacag tgcacatata tagcaaattg atcaaatgtt    2100
taatccttgt atgcgggtga gaatcaatgc catcagcaat ttggaaaaaa aaaaaaaaaa    2160
a                                                                    2161
<210>99
<211>606
<212>PRT
<213>稻
<400>99
Met Glu Ser Ile Ala Ala Ala Thr Phe Thr Pro Ser Arg Leu Ala Ala
 1              5                   10                  15
Arg Pro Ala Thr Pro Ala Ala Ala Ala Ala Pro Val Arg Ala Arg Ala
            20                  25                  30
Ala Val Ala Ala Gly Gly Arg Arg Arg Thr Ser Arg Arg Gly Gly Val
        35                  40                  45
Arg Cys Ser Ala Gly Lys Pro Glu Ala Ser Ala Val Ile Asn Gly Ser
    50                  55                  60
Ala Ala Ala Arg Ala Ala Glu Glu Asp Arg Arg Arg Phe Phe Glu Ala
65                  70                  75                  80
Ala Glu Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys
                85                  90                  95
Ile Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val
            100                 105                 110
Pro Glu Asp Asn Met Glu Thr Pro Ser Phe Leu Phe Glu Ser Val Glu
        115                 120                 125
Gln Gly Pro Glu Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly
    130                 135                 140
Ala His Pro Val Met Glu Val Val Ala Lys Glu His Lys Val Thr Ile
145                 150                 155                 160
Met Asp His Glu Lys Gly Lys Val Thr Glu Gln Val Val Asp Asp Pro
                165                 170                 175
Met Gln Ile Pro Arg Ser Met Met Glu Gly Trp His Pro Gln Gln Ile
            180                 185                 190
Asp Gln Leu Pro Asp Ser Phe Thr Gly Gly Trp Val Gly Phe Phe Ser
        195                 200                 205
Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Gly
    210                 215                 220
Ala Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr
225                 230                 235                 240
Asp Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile
                245                 250                 255
His Trp Val Asn Leu Asp Arg His Ala Thr Thr Glu Asp Ala Phe Gln
            260                 265                 270
Asp Gly Lys Ser Arg Leu Asn Leu Leu Leu Ser Lys Val His Asn Ser
        275                 280                 285
Asn Val Pro Lys Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Gln
    290                 295                 300
Phe Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys
305                 310                 315                 320
Asn Ala Val Met Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe
                 325                 330                 335
Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Gln Thr Tyr Ala Asn Pro
            340                 345                 350
Phe Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met
         355                 360                 365
Ala Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu
     370                 375                 380
Ile Leu Thr Arg Val Arg Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala
385                 390                 395                 400
Gly Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Glu Met Gln Glu
                405                 410                 415
Gln Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu
            420                 425                 430
Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser
        435                 440                 445
Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met
    450                 455                 460
His Ile Ser Ser Thr Val Ser Gly Glu Leu Asp Asp His Leu Gln Ser
465                 470                 475                 480
Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala
                485                 490                 495
Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val Thr Arg
            500                 505                 510
Arg Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp
        515                 520                 525
Met Leu Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro
    530                 535                 540
Ser His Asn Thr Met Tyr Ser Tyr Lys Asp Thr Glu Arg Arg Arg Glu
545                 550                 555                 560
Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser
                565                 570                 575
Pro Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala
            580                 585                 590
Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu
        595                 600                 605
<210>100
<211>67
<212>PRT
<213>稻
<400>100
Met Cys Val Leu Val Ala Ala Ala Val Arg Glu Glu Glu Ser Lys Phe
 1               5              10                  15
Lys Ala Gly Ala Ala Glu Gly Cys Asn Ile Leu Pro Leu Lys Arg Cys
            20                  25                  30
Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val
        35                  40                  45
Arg Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu Ser Val Glu
    50                  55                  60
Gln Gly Ser
65
<210>101
<211>525
<212>PRT
<213>玉米
<400>101
Met Trp Glu Cys Ile Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile
 1               5                  10                  15
Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro
            20                  25                  30
Glu Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln
        35                  40                  45
Gly Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala
    50                  55                  60
His Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met
65                  70                  75                  80
Asp His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met
                85                  90                  95
Gln Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp
            100                 105                 110
Glu Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr
        115                 120                 125
Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala
    130                 135                 140
Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp
145                 150                 155                 160
Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His
                165                 170                 175
Trp Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp
            180                 185                 190
Gly Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn
        195                 200                 205
Val Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe
    210                 215                 220
Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn
225                 230                 235                 240
Ala Va1 Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln
                245                 250                 255
Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe
            260                 265                 270
Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala
        275                 280                 285
Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile
    290                 295                 300
Leu Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly
305                 310                 315                 320
Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln
                325                 330                 335
Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val
            340                 345                 350
Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Gly Ser
        355                 360                 365
Val Lys Val Glu Lys Leu Ile Ile Glu Arg Tyr Ser His Val Met His
    370                 375                 380
Ile Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp
385                 390                 395                 400
Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro
                405                 410                 415
Lys Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg
            420                 425                 430
Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met
        435                 440                 445
Gln Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser
    450                 455                 460
His Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp
465                 470                 475                 480
Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro
                485                 490                 495
Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg
            500                 505                 510
Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asn Lys Glu
        515                 520                 525
<210>102
<211>92
<212>PRT
<213>小麦
<400>102
Pro Asn Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Leu
 1               5                  10                  15
Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser Pro
            20                  25                  30
Asn Arg Met Tyr Ser Tyr Lys Ser Ser Asp Arg Pro Arg Glu Trp Val
        35                  40                  45
Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ile Pro Asp
    50                  55                  60
Asp Glu Gln Lys Glu Phe Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala
65                  70                  75                  80
Ile Asp Leu Ala Glu Ser Ala Phe Leu Asp Lys Glu
                85                  90
<210>103
<211>616
<212>PRT
<213>烟草
<400>103
Met Gln Ser Leu Pro Ile Ser Tyr Arg Leu Phe Pro Ala Thr His Arg
 1               5                  10                  15
Lys Val Leu Pro Phe Ala Val Ile Ser Ser Arg Ser Ser Thr Ser Ala
            20                  25                  30
Leu Ala Leu Arg Val Arg Thr Leu Gln Cys Arg Cys Leu His Ser Ser
        35                  40                  45
Ser Leu Val Met Asp Glu Asp Arg Phe Ile Glu Ala Ser Lys Ser Gly
    50                  55                  60
Asn Leu Ile Pro Leu His Lys Thr Ile Phe Ser Asp His Leu Thr Pro
65                  70                  75                  80
Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro
            85                  90                  95
Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Phe Arg Gly Ser Ser Val
        100                 105                 110
Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Ser Met Glu Ile Val Ala
        115                 120                 125
Lys Glu His Asn Val Thr Ile Leu Asp His His Thr Gly Lys Leu Thr
    130                 135                 140
Gln Lys Thr Val Gln Asp Pro Met Thr Ile Pro Arg Ser Ile Ser Glu
145                 150                 155                 160
Gly Trp Lys Pro Arg Leu Ile Asp Glu Leu Pro Asp Thr Phe Cys Gly
                165                 170                 175
Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Asn
            180                 185                 190
Arg Lys Leu Pro Phe Leu Arg Ala Pro Glu Asp Asp Arg Asn Leu Ala
        195                 200                 205
Asp Ile Gln Leu Gly Leu Tyr Glu Asp Val Ile Val Phe Asp His Val
    210                 215                 220
Glu Lys Lys Ala His Val Ile His Trp Val Gln Leu Asp Gln Tyr Ser
225                 230                 235                 240
Ser Leu Pro Glu Ala Tyr Leu Asp Gly Lys Lys Arg Leu Glu Ile Leu
                245                 250                 255
Val Ser Arg Val Gln Gly Ile Glu Ser Pro Arg Leu Ser Pro Gly Ser
            260                 265                 270
Val Asp Phe Cys Thr His Ala Phe Gly Pro Ser Leu Thr Lys Gly Asn
        275                 280                 285
Met Thr Ser Glu Glu Tyr Lys Asn Ala Val Leu Gln Ala Lys Glu His
    290                 295                 300
Ile Ala Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu
305                 310                 315                 320
Arg Arg Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Ile
                325                 330                 335
Val Asn Pro Ser Pro Tyr Met Thr Tyr Ile Gln Ala Arg Gly Cys Ile
            340                 345                 350
Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Arg Arg
        355                 360                 365
Ile Val Asn Arg Pro Leu Ala Gly Thr Ser Arg Arg Gly Lys Thr Pro
    370                 375                 380
Asp Glu Asp Val Met Leu Glu Met Gln Met Leu Lys Asp Glu Lys Gln
385                 390                 395                 400
Arg Ala Glu His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly
                405                 410                 415
Lys Val Ser Lys Pro Gly Ser Val Asn Val Glu Lys Leu Met Ser Val
            420                 425                 430
Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val Ser Gly Glu
        435                 440                 445
Leu Leu Asp His Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro
    450                 455                 460
Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile
465                 470                 475                 480
Asp Gln Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly
                485                 490                 495
Gly Ile Ser Phe Ser Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr
            500                 505                 510
Met Val Phe Leu Asn Gly Ala Arg Tyr Asp Thr Met Tyr Ser Tyr Thr
        515                 520                 525
Asp Ala Ser Lys Arg Gln Glu Trp Val Ala His Leu Gln Ser Gly Ala
    530                 535                 540
Gly Ile Val Ala Asp Ser Asn Pro Asp Glu Glu Gln Ile Glu Cys Glu
545                 550                 555                 560
Asn Lys Val Ala Gly Leu Cys Arg Ala Ile Asp Leu Ala Glu Ser Ala
                565                 570                 575
Phe Val Lys Gly Arg His Lys Pro Ser Val Lys Ile Asn Gly Ser Val
            580                 585                 590
Pro Asn Leu Phe Ser Arg Val Gln Arg Gln Thr Ser Val Met Ser Lys
        595                 600                 605
Asp Arg Val His Glu Lys Arg Asn
    610                 615
12

Claims (210)

1.一种编码单体邻氨基苯甲酸酯合成酶的分离的DNA,其中所述单体邻氨基苯甲酸酯合成酶包含包括邻氨基苯甲酸酯合成酶α-结构域和邻氨基苯甲酸酯合成酶β-结构域的单一多肽,并且其中单体邻氨基苯甲酸酯合成酶在植物中表达。
2.权利要求1的分离的DNA,其中所述单体邻氨基苯甲酸酯合成酶的表达相对具有相同遗传背景的未转化植物来说提高植物中L-色氨酸的水平。
3.权利要求1的分离的DNA,其中所述单体邻氨基苯甲酸酯合成酶是根癌土壤杆菌,苜蓿根瘤菌,Mesorhizobium loti,马尔他布鲁氏菌,念珠蓝细菌PCC7120,巴西固氮螺菌或鱼腥蓝细菌M22983邻氨基苯甲酸酯合成酶。
4.权利要求1的分离的DNA,其中所述单体邻氨基苯甲酸酯合成酶包括SEQ ID NO:4,7,43,58,59,60,61,62,63,64,65,69,70,77,78,79,80,81或82的任一个。
5.权利要求1的分离的DNA,其中所述分离的DNA包括SEQ ID NO:1,75,83,84,85,86,87,88,89,90,91,92或93的任一个。
6.权利要求1的分离的DNA,其中所述分离的DNA编码包括来自第一物种的邻氨基苯甲酸酯合成酶α结构域和来自第二物种的邻氨基苯甲酸酯合成酶β结构域的融合体的嵌合单体邻氨基苯甲酸酯合成酶。
7.权利要求1的分离的DNA,其中从根癌土壤杆菌,鱼腥蓝细菌M22983,鼠耳芥,巴西固氮螺菌,马尔他布鲁氏菌,大肠杆菌,Euglenagracilis,Mesorhizobium loti,念珠蓝细菌PCC7120,苜蓿根瘤菌,芸香,血色红假单孢菌,鼠伤寒沙门氏菌,粘质沙雷氏菌,硫磺矿硫化叶菌,棉花,稻,小麦,烟草或玉米获得编码α结构域或β结构域的DNA。
8.权利要求1的分离的DNA,其中所述α结构域或β结构域是氨基酸序列SEQ ID NO:4,5,6,7,8,43,44,45,58,59,60,61,62,63,64,65,66,69,70,77,78,7980,81,82,99,100,101,102或103任何一个的至少一部分。
9.权利要求1的分离的DNA,其中所述邻氨基苯甲酸酯合成酶包括提高邻氨基苯甲酸酯合成酶活性或者降低邻氨基苯甲酸酯合成酶对色氨酸或其类似物的抑制作用的敏感性的突变。
10.权利要求9的分离的DNA,其中所述突变是在色氨酸结合袋中。
11.权利要求9的分离的DNA,其中当邻氨基苯甲酸酯合成酶氨基酸序列与具有SEQ ID NO:4的单体根癌土壤杆菌邻氨基苯甲酸酯合成酶比对时,所述突变在氨基酸位置25-60或200-225或290-300或370-375中。
12.权利要求9的分离的DNA,其中所述突变是:
a)在大约48位,Phe置换Val;
b)在大约48位,Tyr置换Val;
c)在大约51位,Phe置换Ser;
d)在大约51位,Cys置换Ser;
e)在大约52位,Phe置换Asn;
f)在大约293位,Ala置换Pro;
g)在大约293位,Gly置换Pro;或者
h)在大约298位,Trp置换Phe;并且
其中通过邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的比对确定突变位置。
13.权利要求9的分离的DNA,其中所述邻氨基苯甲酸酯合成酶包括SEQ ID NO:58-65,69或70中的任一个。
14.权利要求12的分离的DNA,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列是SEQ ID NO:4。
15.权利要求1的分离的DNA,其中所述分离的DNA进一步编码质体转运肽。
16.权利要求15的分离的DNA,其中所述质体转运肽包括SEQ ID NO:72或74。
17.权利要求1的分离的DNA,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
18.权利要求17的分离的DNA,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
19.权利要求17的分离的DNA,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
20.权利要求1的分离的DNA,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
21.权利要求1的分离的DNA,其中所述植物是双子叶植物。
22.权利要求21的分离的DNA,其中所述植物是大豆或canola。
23.权利要求1的分离的DNA,其中所述植物是单子叶植物。
24.权利要求23的分离的DNA,其中所述植物是玉米,稻,小麦,大麦或高梁。
25.权利要求1的分离的DNA,其中所述分离的编码邻氨基苯甲酸酯合成酶的DNA包括与其可操作性连接的启动子。
26.包含权利要求1-25任一项的分离的DNA的载体。
27.包含权利要求1-25任一项的分离的DNA的种子。
28.包含与启动子可操作性连接的编码单体邻氨基苯甲酸酯合成酶的分离的DNA转基因植物,其中所述单体邻氨基苯甲酸酯合成酶包括邻氨基苯甲酸酯合成酶α结构域和邻氨基苯甲酸酯合成酶β结构域,并且其中单体邻氨基苯甲酸酯合成酶在植物中表达。
29.权利要求28的转基因植物,其中所述单体邻氨基苯甲酸酯合成酶的表达相对具有相同遗传背景的未转化植物来说提高植物中L-色氨酸的水平。
30.权利要求28的转基因植物,其中所述单体邻氨基苯甲酸酯合成酶是根癌土壤杆菌,苜蓿根瘤菌,Mesorhizobium loti,马尔他布鲁氏菌,念珠蓝细菌PCC7120,巴西固氮螺菌或鱼腥蓝细菌M22983邻氨基苯甲酸酯合成酶。
31.权利要求28的转基因植物,其中所述单体邻氨基苯甲酸酯合成酶是苜蓿根瘤菌(Rhizobium meliloti)(Genbank登记号No.GI95177),Mesorhizobium loti(Genbank登记号No.GI 13472468),马尔他布鲁氏菌(Brucella melitensis)(Genbank登记号No.GI17982357),念珠蓝细菌(Nostoc sp.)PCC7120(Genbank登记号No.GI17227910,GI17230725),巴西固氮螺菌(Azospirillum brasilense)(Genbank登记号No.GI1174156),或鱼腥蓝细菌(Anabaena)M22983(Genbank登记号No.GI 152445)邻氨基苯甲酸酯合成酶。
32.权利要求28的转基因植物,其中所述单体邻氨基苯甲酸酯合成酶是包括来自第一物种的邻氨基苯甲酸酯合成酶α结构域和来自第二物种的邻氨基苯甲酸酯合成酶β结构域连接的融合体的嵌合单体邻氨基苯甲酸酯合成酶。
33.权利要求28的转基因植物,其中从根癌土壤杆菌,鱼腥蓝细菌M22983,鼠耳芥,巴西固氮螺菌,马尔他布鲁氏菌,大肠杆菌,Euglena gracilis,Mesorhizobium loti,念珠蓝细菌PCC7120,苜蓿根瘤菌,芸香,血色红假单孢菌,鼠伤寒沙门氏菌,粘质沙雷氏菌,硫磺矿硫化叶菌,大豆,棉花,稻,小麦,烟草或玉米获得编码α结构域或β结构域的DNA。
34.权利要求28的转基因植物,其中所述α结构域或β结构域是氨基酸序列SEQ ID NO:4,5,6,7,8,43,44,45,58,59,60,61,62,63,64,65,66,69,70,77,78,7980,81,82,99,100,101,102或103任何一个的至少一部分。
35.权利要求28的转基因植物,其中所述邻氨基苯甲酸酯合成酶包括提高邻氨基苯甲酸酯合成酶活性或者降低邻氨基苯甲酸酯合成酶对色氨酸或其类似物的抑制作用的敏感性的突变。
36.权利要求35的转基因植物,其中所述突变是在色氨酸结合袋中。
37.权利要求35的转基因植物,当邻氨基苯甲酸酯合成酶氨基酸序列与具有SEQ ID NO:4的单体根癌土壤杆菌邻氨基苯甲酸酯合成酶比对时,其中所述突变在氨基酸位置25-60或200-225或290-300或370-375中。
38.权利要求35的转基因植物,其中所述突变是:
a)在大约48位,Phe置换Val;
b)在大约48位,Tyr置换Val;
c)在大约51位,Phe置换Ser;
d)在大约51位,Cys置换Ser;
e)在大约52位,Phe置换Asn;
f)在大约293位,Ala置换Pro;
g)在大约293位,Gly置换Pro;或者
h)在大约298位,Trp置换Phe;并且
其中通过邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的比对确定突变位置。
39.权利要求35的转基因植物,其中所述邻氨基苯甲酸酯合成酶包括SEQ ID NO:58-65,69或70中的任一个。
40.权利要求38的转基因植物,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列是SEQ ID NO:4。
41.权利要求28的转基因植物,其中所述分离的DNA进一步编码质体转运肽。
42.权利要求41的转基因植物,其中所述质体转运肽包括SEQ ID NO:72或74。
43.权利要求28的转基因植物,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
44.权利要求43的转基因植物,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
45.权利要求44的转基因植物,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
46.权利要求28的转基因植物,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
47.权利要求28的转基因植物,其中所述植物是双子叶植物。
48.权利要求47的转基因植物,其中所述植物是大豆或canola。
49.权利要求28的转基因植物,其中所述植物是单子叶植物。
50.权利要求49的转基因植物,其中所述植物是玉米,稻,小麦,大麦或高梁。
51.权利要求28的转基因植物的种子。
52.包括与启动子可操作性连接的编码根癌土壤杆菌邻氨基苯甲酸酯合成酶或者其结构域的分离的DNA的转基因植物。
53.权利要求52的转基因植物,其中表达根癌土壤杆菌邻氨基苯甲酸酯合成酶或者其结构域,使得提高所述植物中L-色氨酸的水平。
54.权利要求52的转基因植物,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶包括SEQ ID NO:4,58,59,60,61,62,63,64,65,69或70。
55.权利要求52的转基因植物,其中所述分离的DNA包括SEQ ID NO:1,75,84,85,86,87,88,89,90,91,92或93。
56.包括与启动子可操作性连接的编码嵌合单体邻氨基苯甲酸酯合成酶的分离的DNA的转基因植物,其中所述单体邻氨基苯甲酸酯合成酶是来自第一物种的邻氨基苯甲酸酯合成酶α结构域和来自第二物种的邻氨基苯甲酸酯合成酶β结构域的融合体。
57.权利要求56的转基因植物,其中表达嵌合单体根癌土壤杆菌邻氨基苯甲酸酯合成酶,使得提高所述植物中L-色氨酸的水平。
58.权利要求56的转基因植物,其中从根癌土壤杆菌,鱼腥蓝细菌M22983,鼠耳芥,巴西固氮螺菌,马尔他布鲁氏菌,大肠杆菌,Euglena gracilis,Mesorhizobium loti,念珠蓝细菌PCC7120,苜蓿根瘤菌,芸香,血色红假单孢菌,鼠伤寒沙门氏菌,粘质沙雷氏菌,硫磺矿硫化叶菌,大豆,稻,棉花,小麦,烟草或玉米获得编码α结构域或β结构域的DNA。
59.权利要求56的转基因植物,其中所述α结构域或β结构域是氨基酸序列SEQ ID NO:4,5,6,7,8,43,44,45,58,59,60,61,62,63,64,65,66,69,70,77,78,7980,81,82,99,100,101,102或103任何一个的至少一部分。
60.权利要求52或56的转基因植物,其中所述邻氨基苯甲酸酯合成酶包括提高邻氨基苯甲酸酯合成酶活性或者降低邻氨基苯甲酸酯合成酶对色氨酸或其类似物的抑制作用的敏感性的突变。
61.权利要求60的转基因植物,当邻氨基苯甲酸酯合成酶氨基酸序列与具有SEQ ID NO:4的单体根癌土壤杆菌邻氨基苯甲酸酯合成酶比对时,其中所述突变在氨基酸位置25-60或200-225或290-300或370-375中。
62.权利要求60的转基因植物,其中所述突变在色氨酸结合袋中。
63.权利要求60的转基因植物,其中所述突变是:
(a)在大约48位,Phe置换Val;
(b)在大约48位,Tyr置换Val;
(c)在大约51位,Phe置换Ser;
(d)在大约51位,Cys置换Ser;
(e)在大约52位,Phe置换Asn;
(f)在大约293位,Ala置换Pro;
(g)在大约293位,Gly置换Pro;或者
(h)在大约298位,Trp置换Phe;并且
其中通过邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的比对确定突变位置。
64.权利要求60的转基因植物,其中所述邻氨基苯甲酸酯合成酶包括SEQ ID NO:58-65,69或70中的任一个。
65.权利要求63的转基因植物,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列是SEQ ID NO:4。
66.权利要求52或56的转基因植物,其中所述分离的DNA进一步编码质体转运肽。
67.权利要求66的转基因植物,其中所述质体转运肽包括SEQ ID NO:72或74。
68.权利要求52或56的转基因植物,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
69.权利要求68的转基因植物,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
70.权利要求69的转基因植物,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
71.权利要求52或56的转基因植物,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
72.权利要求52或56的转基因植物,其中所述植物是双子叶植物。
73.权利要求72的转基因植物,其中所述植物是大豆或canola。
74.权利要求52或56的转基因植物,其中所述植物是单子叶植物。
75.权利要求72的转基因植物,其中所述植物是玉米,稻,小麦,大麦或高梁。
76.权利要求52或56的转基因植物的种子。
77.包含与启动子可操作性连接的包括SEQ ID NO:5或SEQ ID NO:66的来自玉米的编码邻氨基苯甲酸酯合成酶的α结构域的分离的DNA的转基因植物。
78.权利要求77的转基因植物,其中所述分离的DNA包括与启动子可操作性连接的SEQ ID NO:2,SEQ ID NO:67或SEQ ID NO:68。
79.权利要求77的转基因植物,其中表达单体邻氨基苯甲酸酯合成酶的α结构域,使得提高所述植物中L-色氨酸的水平。
80.权利要求77的转基因植物,其中所述结构域包括提高邻氨基苯甲酸酯合成酶活性或者降低邻氨基苯甲酸酯合成酶对色氨酸或其类似物的抑制作用的敏感性的至少一个突变。
81.权利要求77的转基因植物,其中所述突变在色氨酸结合袋中。
82.权利要求77的转基因植物,其中所述分离的DNA进一步编码质体转运肽。
83.权利要求82的转基因植物,其中所述质体转运肽包括SEQ ID NO:72或74。
84.权利要求77的转基因植物,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
85.权利要求84的转基因植物,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
86.权利要求85的转基因植物,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
87.权利要求77的转基因植物,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
88.权利要求77的转基因植物,其中所述植物是双子叶植物。
89.权利要求88的转基因植物,其中所述植物是大豆或canola。
90.权利要求77的转基因植物,其中所述植物是单子叶植物。
91.权利要求90的转基因植物,其中所述植物是玉米,稻,小麦,大麦或高梁。
92.权利要求77的转基因植物的种子。
93.一种改变植物中色氨酸含量的方法,包括:
(a)向植物可再生细胞中导入包括编码包括邻氨基苯甲酸酯合成酶α结构域和邻氨基苯甲酸酯合成酶β结构域的单体邻氨基苯甲酸酯合成酶的分离的DNA的转基因,其中所述分离的DNA可操作性连接于在植物细胞中有功能的启动子,得到转化的植物细胞;和
(b)从所述转化植物细胞再生植株,其中所述植物细胞以相对于相同遗传背景的没有转化的植物中色氨酸含量来说在所述植物中有效提高色氨酸含量的量表达分离的DNA编码的单体邻氨基苯甲酸酯合成酶。
94.权利要求93的方法,其中所述单体邻氨基苯甲酸酯合成酶是根癌土壤杆菌,苜蓿根瘤菌,Mesorhizobium loti,马尔他布鲁氏菌,念珠蓝细菌PCC7120,巴西固氮螺菌或鱼腥蓝细菌M22983邻氨基苯甲酸酯合成酶。
95.权利要求93的方法,其中所述单体邻氨基苯甲酸酯合成酶包括SEQ ID NO:4,7,43,58,59,60,61,62,63,64,65,69,70,77,78,79,80,81或82的任一个。
96.权利要求93的方法,其中所述分离的DNA包括SEQ ID NO:1,75,83,84,85,86,87,88,89,90,91,92或93的任一个。
97.权利要求93的方法,其中所述分离的DNA编码包括来自第一物种的邻氨基苯甲酸酯合成酶α结构域和来自第二物种的邻氨基苯甲酸酯合成酶β结构域的融合体的嵌合单体邻氨基苯甲酸酯合成酶。
98.权利要求93的方法,其中从根癌土壤杆菌,鱼腥蓝细菌M22983,鼠耳芥,巴西固氮螺菌,马尔他布鲁氏菌,大肠杆菌,Euglenagracilis,Mesorhizobium loti,念珠蓝细菌PCC7120,苜蓿根瘤菌,芸香,血色红假单孢菌,鼠伤寒沙门氏菌,粘质沙雷氏菌,硫磺矿硫化叶菌,大豆,棉花,稻,小麦,烟草或玉米获得编码α结构域或β结构域的DNA。
99.权利要求97的方法,其中所述α结构域或β结构域是氨基酸序列SEQ ID NO:4,5,6,7,8,43,44,45,58,59,60,61,62,63,64,65,66,69,70,77,78,7980,81,82,99,100,101,102或103任何一个的至少一部分。
100.权利要求93的方法,其中所述分离的DNA进一步编码质体转运肽。
101.权利要求100的方法,其中所述质体转运肽包括SEQ ID NO:72或74。
102.权利要求93的方法,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
103.权利要求102的方法,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
104.权利要求103的方法,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
105.权利要求93的方法,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
106.权利要求93的方法,其中所述邻氨基苯甲酸酯合成酶包括提高邻氨基苯甲酸酯合成酶活性或者降低邻氨基苯甲酸酯合成酶对色氨酸或其类似物的抑制作用的敏感性的一个突变。
107.权利要求106的方法,当邻氨基苯甲酸酯合成酶氨基酸序列与具有SEQ ID NO:4的单体根癌土壤杆菌邻氨基苯甲酸酯合成酶比对时,其中所述突变在氨基酸位置25-60或200-225或290-300或370-375中。
108.权利要求106的方法,其中所述突变是在色氨酸结合袋中。
109.权利要求106的方法,其中所述突变是:
a)在大约48位,Phe置换Val;
b)在大约48位,Tyr置换Val;
c)在大约51位,Phe置换Ser;
d)在大约51位,Cys置换Ser;
e)在大约52位,Phe置换Asn;
f)在大约293位,Ala置换Pro;
g)在大约293位,Gly置换Pro;或者
h)在大约298位,Trp置换Phe;并且
其中通过邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的比对确定突变位置。
110.权利要求109的方法,其中所述邻氨基苯甲酸酯合成酶包括SEQ ID NO:58-65,69或70中的任一个。
111.权利要求109的方法,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列是SEQ ID NO:4。
112.权利要求93的方法,其中所述植物是双子叶植物。
113.权利要求112的方法,其中所述植物是大豆或canola。
114.权利要求93的方法,其中所述植物是单子叶植物。
115.权利要求114的方法,其中所述植物是玉米,稻,小麦,大麦或高梁。
116.一种改变植物中色氨酸含量的方法,包括:
(a)向植物可再生细胞中导入包括与在植物细胞中有功能的启动子可操作性连接的编码来自玉米的具有SEQ ID NO:5或SEQ ID NO:66的邻氨基苯甲酸酯合成酶α结构域的分离的DNA的转基因,得到转化的植物细胞;和
(b)从所述转化植物细胞再生植株,其中所述植物细胞以相对于相同遗传背景的没有转化的植物中色氨酸含量来说在所述植物中有效提高色氨酸含量的量表达分离的DNA编码的邻氨基苯甲酸酯合成酶。
117.权利要求116的方法,其中所述邻氨基苯甲酸酯合成酶的α结构域包括提高邻氨基苯甲酸酯合成酶活性或者降低该结构域对色氨酸或其类似物的抑制作用的敏感性的一个突变。
118.权利要求116的方法,其中所述突变是在色氨酸结合袋中。
119.权利要求116的方法,其中所述植物是双子叶植物。
120.权利要求119的方法,其中所述植物是大豆或canola。
121.权利要求116的方法,其中所述植物是单子叶植物。
122.权利要求121的方法,其中所述植物是玉米,稻,小麦,大麦或高梁。
123.权利要求116的方法,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
124.权利要求123的方法,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
125.权利要求124的方法,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
126.权利要求116的方法,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
127.一种制备动物饲料或人类食品的方法,包括:
(a)向植物可再生细胞中导入包括编码包括邻氨基苯甲酸酯合成酶α结构域和邻氨基苯甲酸酯合成酶β结构域的单体邻氨基苯甲酸酯合成酶的分离的DNA的转基因,其中所述分离的DNA可操作性连接于在植物细胞中有功能的启动子,得到转化的植物细胞;和
(b)从所述转化植物细胞再生植株,其中所述植物细胞以相对于相同遗传背景的没有转化的植物中色氨酸含量来说在所述植物中有效提高色氨酸含量的量表达分离的DNA编码的单体邻氨基苯甲酸酯合成酶。
128.权利要求127的方法,其中所述单体邻氨基苯甲酸酯合成酶是根癌土壤杆菌,苜蓿根瘤菌,Mesorhizobium loti,马尔他布鲁氏菌,念珠蓝细菌PCC7120,巴西固氮螺菌或鱼腥蓝细菌M22983邻氨基苯甲酸酯合成酶。
129.权利要求127的方法,其中所述单体邻氨基苯甲酸酯合成酶包括SEQ ID NO:4,7,43,58,59,60,61,62,63,64,65,69,70,77,78,79,80,81或82的任一个。
130.权利要求127的方法,其中所述分离的DNA包括SEQ ID NO:1,75,83,84,85,86,87,88,89,90,91,92或93的任一个。
131.权利要求127的方法,其中所述分离的DNA编码包括来自第一物种的邻氨基苯甲酸酯合成酶α结构域和来自第二物种的邻氨基苯甲酸酯合成酶β结构域的融合体的嵌合单体邻氨基苯甲酸酯合成酶。
132.权利要求127的方法,其中从根癌土壤杆菌,鱼腥蓝细菌M22983,鼠耳芥,巴西固氮螺菌,马尔他布鲁氏菌,大肠杆菌,Euglenagracilis,Mesorhizobium loti,念珠蓝细菌PCC7120,苜蓿根瘤菌,芸香,血色红假单孢菌,鼠伤寒沙门氏菌,粘质沙雷氏菌,硫磺矿硫化叶菌,大豆,棉花,稻,小麦,烟草或玉米获得编码α结构域或β结构域的DNA。
133.权利要求127的方法,其中所述α结构域或β结构域是氨基酸序列SEQ ID NO:4,5,6,7,8,43,44,45,58,59,60,61,62,63,64,65,66,69,70,77,78,79 80,81,82,99,100,101,102或103任何一个的至少一部分。
134.权利要求127的方法,其中所述邻氨基苯甲酸酯合成酶包括提高邻氨基苯甲酸酯合成酶活性或者降低邻氨基苯甲酸酯合成酶对色氨酸或其类似物的抑制作用的敏感性的一个突变。
135.权利要求134的方法,其中所述突变是在色氨酸结合袋中。
136.权利要求134的方法,其中所述突变是:
a)在大约48位,Phe置换Val;
b)在大约48位,Tyr置换Val;
c)在大约51位,Phe置换Ser;
d)在大约51位,Cys置换Ser;
e)在大约52位,Phe置换Asn;
f)在大约293位,Ala置换Pro;
g)在大约293位,Gly置换Pro;或者
h)在大约298位,Trp置换Phe;并且
其中通过邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的比对确定突变位置。
137.权利要求136的方法,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列是SEQ ID NO:4。
138.权利要求134的方法,其中所述邻氨基苯甲酸酯合成酶包括SEQ ID NO:58-65,69或70中的任一个。
139.权利要求127的方法,其中所述分离的DNA进一步编码质体转运肽。
140.权利要求139的方法,其中所述质体转运肽包括SEQ ID NO:72或74。
141.权利要求127的方法,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
142.权利要求141的方法,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
143.权利要求142的方法,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
144.权利要求127的方法,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
145.权利要求127的方法,其中所述植物是双子叶植物。
146.权利要求145的方法,其中所述植物是大豆或canola。
147.权利要求127的方法,其中所述植物是单子叶植物。
148.权利要求147的方法,其中所述植物是玉米,稻,小麦,大麦或高梁。
149.一种动物饲料或人类食品,包括编码包括邻氨基苯甲酸酯合成酶α结构域和邻氨基苯甲酸酯合成酶β结构域的单体邻氨基苯甲酸酯合成酶的分离的DNA的植物的至少一部分,其中所述植物细胞能表达分离的DNA编码的单体邻氨基苯甲酸酯合成酶。
150.权利要求149的动物饲料或人类食品,其中所述植物细胞能以相对于相同遗传背景的没有转化的植物中色氨酸含量来说在所述植物中有效提高色氨酸含量的量表达分离的DNA编码的单体邻氨基苯甲酸酯合成酶。
151.权利要求149的动物饲料或人类食品,其中所述植物部分包括种子,叶,茎,根,块茎,或果实。
152.权利要求149的动物饲料或人类食品,其中所述单体邻氨基苯甲酸酯合成酶是根癌土壤杆菌,苜蓿根瘤菌,Mesorhizobium loti,马尔他布鲁氏菌,念珠蓝细菌PCC7120,巴西固氮螺菌或鱼腥蓝细菌M22983邻氨基苯甲酸酯合成酶。
153.权利要求149的动物饲料或人类食品,其中所述单体邻氨基苯甲酸酯合成酶包括SEQ ID NO:4,7,43,58,59,60,61,62,63,64,65,69,70,77,78,79,80,81或82的任一个。
154.权利要求149的动物饲料或人类食品,其中所述分离的DNA包括SEQ ID NO:1,75,83,84,85,86,87,88,89,90,91,92或93的任一个。
155.权利要求149的动物饲料或人类食品,其中所述分离的DNA编码包括来自第一物种的邻氨基苯甲酸酯合成酶α结构域和来自第二物种的邻氨基苯甲酸酯合成酶β结构域的融合体的嵌合单体邻氨基苯甲酸酯合成酶。
156.权利要求155的动物饲料或人类食品,其中从根癌土壤杆菌,鱼腥蓝细菌M22983,鼠耳芥,巴西固氮螺菌,马尔他布鲁氏菌,大肠杆菌,Euglena gracilis,Mesorhizobium loti,念珠蓝细菌PCC7120,苜蓿根瘤菌,芸香,血色红假单孢菌,鼠伤寒沙门氏菌,粘质沙雷氏菌,硫磺矿硫化叶菌,大豆,稻,棉花,小麦,烟草或玉米获得编码α结构域或β结构域的DNA。
157.权利要求149的动物饲料或人类食品,其中所述α结构域或β结构域是氨基酸序列SEQ ID NO:4,5,6,7,8,43,44,45,58,59,60,61,62,63,64,65,66,69,70,77,78,79 80,81,82,99,100,101,102或103任何一个的至少一部分。
158.权利要求149的动物饲料或人类食品,其中所述邻氨基苯甲酸酯合成酶包括提高邻氨基苯甲酸酯合成酶活性或者降低邻氨基苯甲酸酯合成酶对色氨酸或其类似物的抑制作用的敏感性的突变。
159.权利要求158的动物饲料或人类食品,当邻氨基苯甲酸酯合成酶氨基酸序列与具有SEQ ID NO:4的单体根癌土壤杆菌邻氨基苯甲酸酯合成酶比对时,其中所述突变在氨基酸位置25-60或200-225或290-300或370-375中。
160.权利要求158的动物饲料或人类食品,其中所述突变是在色氨酸结合袋中。
161.权利要求158的动物饲料或人类食品,其中所述突变是:
(a)在大约48位,Phe置换Val;
(b)在大约48位,Tyr置换Val;
(c)在大约51位,Phe置换Ser;
(d)在大约51位,Cys置换Ser;
(e)在大约52位,Phe置换Asn;
(f)在大约293位,Ala置换Pro;
(g)在大约293位,Gly置换Pro;或者
(h)在大约298位,Trp置换Phe;并且
其中通过邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的比对确定突变位置。
162.权利要求149的动物饲料或人类食品,其中所述邻氨基苯甲酸酯合成酶包括SEQ ID NO:58-65,69或70中的任一个。
163.权利要求161的动物饲料或人类食品,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列是SEQ ID NO:4。
164.权利要求149的动物饲料或人类食品,其中所述分离的DNA进一步编码质体转运肽。
165.权利要求164的动物饲料或人类食品,其中所述质体转运肽包括SEQ ID NO:72或74。
166.权利要求149的动物饲料或人类食品,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
167.权利要求166的动物饲料或人类食品,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
168.权利要求167的动物饲料或人类食品,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
169.权利要求149的动物饲料或人类食品,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
170.权利要求149的动物饲料或人类食品,其中所述植物是双子叶植物。
171.权利要求170的动物饲料或人类食品,其中所述植物是大豆或canola。
172.权利要求149的动物饲料或人类食品,其中所述植物是单子叶植物。
173.权利要求172的动物饲料或人类食品,其中所述植物是玉米,稻,小麦,大麦或高梁。
174.编码包括与SEQ ID NO:4至少具有90%序列同一性的多肽的邻氨基苯甲酸酯合成酶的分离的DNA。
175.编码邻氨基苯甲酸酯合成酶的分离的DNA,包括与SEQ ID NO:1至少具有60%序列同一性的DNA。
176.权利要求174或175的分离的DNA,其中所述分离的DNA包括至少20个核苷酸并且在严谨杂交条件下与具有SEQ ID NO:1的DNA的互补序列杂交。
177.权利要求176的分离的DNA,其中所述严谨杂交条件包括42℃下用0.2x SSC洗涤。
178.权利要求176的分离的DNA,其中所述分离的DNA包括SEQ IDNO:9-42或46-56的任一个。
179.编码来自玉米的邻氨基苯甲酸酯合成酶的具有SEQ ID NO:5或SEQ ID NO:66氨基酸序列的α结构域的分离的DNA。
180.编码来自玉米的邻氨基苯甲酸酯合成酶的α结构域具有SEQID NO:2,SEQ ID NO:67或SEQ ID NO:68的核苷酸序列的分离的DNA。
181.权利要求179或180的分离的DNA,其中所述邻氨基苯甲酸酯合成酶的α结构域在植物中表达,使得提高植物中L-色氨酸的水平。
182.权利要求179或180的分离的DNA,其中所述结构域具有降低该结构域对色氨酸或其类似物的抑制作用的敏感性的至少一个突变。
183.权利要求179或180的分离的DNA,其中所述突变是在色氨酸结合袋中。
184.权利要求179或180的分离的DNA,其中所述分离的DNA进一步编码可选择标记基因或报道基因。
185.权利要求184的分离的DNA,其中当所述可选择标记基因在植物中表达时,赋予所述植物细胞除草剂抗性。
186.权利要求185的分离的DNA,其中所述除草剂抗性包括对草甘膦,glufosinate或茅草枯的抗性。
187.权利要求179或180的分离的DNA,其中所述分离的DNA进一步编码当在植物中表达时赋予植物昆虫抗性的苏云金芽胞杆菌蛋白质。
188.权利要求179或180的分离的DNA,其中所述植物是双子叶植物。
189.权利要求188的分离的DNA,其中所述植物是大豆或canola。
190.权利要求179或180的分离的DNA,其中所述植物是单子叶植物。
191.权利要求190的分离的DNA,其中所述植物是玉米,稻,小麦,大麦或高梁。
192.权利要求179或180的分离的DNA,其中编码邻氨基苯甲酸酯合成酶的分离的DNA包括与其可操作性连接的启动子。
193.包含权利要求179或180的分离的DNA的启动子。
194.编码邻氨基苯甲酸酯合成酶突变体的分离的DNA,其中所述突变包括:
(a)在大约48位,Phe置换Val;
(b)在大约48位,Tyr置换Val;
(c)在大约51位,Phe置换Ser;
(d)在大约51位,Cys置换Ser;
(e)在大约52位,Phe置换Asn;
(f)在大约293位,Ala置换Pro;
(g)在大约293位,Gly置换Pro;或者
(h)在大约298位,Trp置换Phe;并且
其中通过邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的比对确定突变位置。
195.权利要求194的分离的DNA,其中所述邻氨基苯甲酸酯合成酶包括SEQ ID NO:58-65中的任一个。
196.权利要求194的分离的DNA,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列是SEQ ID NO:4。
197.一种制备色氨酸的方法,包括:在足以表达分离的DNA编码的单体邻氨基苯甲酸酯合成酶的条件下培养包含分离的DNA的原核或真核宿主细胞,其中单体邻氨基苯甲酸酯合成酶包括邻氨基苯甲酸酯合成酶α结构域和邻氨基苯甲酸酯合成酶β结构域,并且其中足以表达单体邻氨基苯甲酸酯合成酶的条件包括对于宿主细胞利用单体邻氨基苯甲酸酯合成酶合成色氨酸来说足够的营养和前体。
198.权利要求197的方法,其中所述方法进一步包括产生苯基propanoids,类黄酮,类异黄酮,吲哚,吲哚生物碱,或吲哚glucosinolates。
199.权利要求197的方法,其中所述单体邻氨基苯甲酸酯合成酶是根癌土壤杆菌,苜蓿根瘤菌,Mesorhizobium loti,马尔他布鲁氏菌,念珠蓝细菌PCC7120,巴西固氮螺菌或鱼腥蓝细菌M22983邻氨基苯甲酸酯合成酶。
200.权利要求197的方法,其中所述单体邻氨基苯甲酸酯合成酶包括SEQ ID NO:4,7,43,58,59,60,61,62,63,64,65,69,70,77,78,79,80,81或82的任一个。
201.权利要求197的方法,其中所述分离的DNA包括SEQ ID NO:1,75,83,84,85,86,87,88,89,90,91,92或93的任一个。
202.权利要求197的方法,其中所述分离的DNA编码包括来自第一物种的邻氨基苯甲酸酯合成酶α结构域和来自第二物种的邻氨基苯甲酸酯合成酶β结构域的融合体的嵌合单体邻氨基苯甲酸酯合成酶。
203.权利要求197的方法,其中从根癌土壤杆菌,鱼腥蓝细菌M22983,鼠耳芥,巴西固氮螺菌,马尔他布鲁氏菌,大肠杆菌,Euglenagracilis,Mesorhizobium loti,念珠蓝细菌PCC7120,苜蓿根瘤菌,芸香,血色红假单孢菌,鼠伤寒沙门氏菌,粘质沙雷氏菌,硫磺矿硫化叶菌,大豆,棉花,稻,小麦,烟草或玉米获得编码α结构域或β结构域的DNA。
204.权利要求197的方法,其中所述α结构域或β结构域是氨基酸序列SEQ ID NO:4,5,6,7,8,43,44,45,58,59,60,61,62,63,64,65,66,69,70,77,78,7980,81,82,99,100,101,102或103任何一个的至少一部分。
205.权利要求197的方法,其中所述邻氨基苯甲酸酯合成酶包括提高邻氨基苯甲酸酯合成酶活性或者降低邻氨基苯甲酸酯合成酶对色氨酸或其类似物的抑制作用的敏感性的突变。
206.权利要求205的方法,当邻氨基苯甲酸酯合成酶氨基酸序列与具有SEQ ID NO:4的单体根癌土壤杆菌邻氨基苯甲酸酯合成酶比对时,其中所述突变在氨基酸位置25-60或200-225或290-300或370-375中。
207.权利要求205的方法,其中所述突变是在色氨酸结合袋中。
208.权利要求205的方法,其中所述突变是:
(a)在大约48位Phe置换Val;
(b)在大约48位Tyr置换Val;
(c)在大约51位Phe置换Ser;
(d)在大约51位Cys置换Ser;
(e)在大约52位Phe置换Asn;
(f)在大约293位Ala置换Pro;
(g)在大约293位Gly置换Pro;或者
(h)在大约298位Trp置换Phe;并且
其中通过邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的比对确定突变位置。
209.权利要求197的方法,其中所述邻氨基苯甲酸酯合成酶包括SEQ ID NO:58-65,69或70中的任一个。
210.权利要求197的方法,其中所述根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列是SEQ ID NO:4。
CN028135067A 2001-05-04 2002-05-03 转基因高色氨酸植物细胞 Expired - Lifetime CN1719971B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US28890401P 2001-05-04 2001-05-04
US60/288,904 2001-05-04
PCT/US2002/014207 WO2002090497A2 (en) 2001-05-04 2002-05-03 Transgenic high tryptophan plants

Publications (2)

Publication Number Publication Date
CN1719971A true CN1719971A (zh) 2006-01-11
CN1719971B CN1719971B (zh) 2011-04-13

Family

ID=23109154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN028135067A Expired - Lifetime CN1719971B (zh) 2001-05-04 2002-05-03 转基因高色氨酸植物细胞

Country Status (9)

Country Link
US (1) US7217865B2 (zh)
EP (1) EP1542527B1 (zh)
CN (1) CN1719971B (zh)
AR (1) AR035965A1 (zh)
AT (1) ATE544859T1 (zh)
AU (1) AU2002257246A1 (zh)
BR (1) BRPI0209437B1 (zh)
CA (2) CA2709843C (zh)
WO (1) WO2002090497A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101967461A (zh) * 2010-10-22 2011-02-09 秦皇岛领先科技发展有限公司 一种固氮螺菌的发酵方法与由该方法得到的发酵液及其用途
CN102171344A (zh) * 2007-05-25 2011-08-31 加拿大国家研究委员会 编码调节生物碱合成之转录因子的核酸序列及其在改良植物代谢中的应用

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7604976B2 (en) 2001-04-02 2009-10-20 Ceres, Inc. Sequence-determined DNA fragments encoding glutamine amidotransferase proteins
US7714189B2 (en) * 2002-05-03 2010-05-11 Monsanto Technology Llc High tryptophan maize
EP1970442B1 (en) * 2002-05-03 2017-01-18 Monsanto Technology LLC Transgenic high tryptophan plants
US7179959B2 (en) 2002-05-03 2007-02-20 Renessen Llc Temporal seed promoters for expressing genes in plants
BR0309860A (pt) 2002-05-03 2007-11-06 Monsanto Technology Llc plantas transgênicas com elevado teor de triptofano
EP1750983A4 (en) * 2004-01-26 2008-10-29 Renessen Llc SOYBEAN FLOUR WITH HIGH PROTEIN CONTENT
JP4651410B2 (ja) * 2004-04-13 2011-03-16 国立大学法人愛媛大学 イネのアントラニル酸合成酵素遺伝子oasa2の新規改変遺伝子およびその利用
JP4538645B2 (ja) * 2004-09-17 2010-09-08 独立行政法人科学技術振興機構 トリプトファン含有ダイズ、およびその利用
CN101128584A (zh) * 2005-02-28 2008-02-20 国立大学法人爱媛大学 稻的邻氨基苯甲酸合成酶基因oasa2的新改良基因及其用途
AU2006269457B2 (en) * 2005-07-08 2011-10-27 Renessen Llc High tryptophan soybean meal
JP5296684B2 (ja) * 2006-08-11 2013-09-25 モンサント テクノロジー エルエルシー アントラニル酸合成酵素の葉緑体標的発現による高トリプトファントウモロコシの生産
CN108179129A (zh) * 2018-03-13 2018-06-19 长沙艾格里生物肥料技术开发有限公司 一种沼泽红假单胞菌菌剂在防控稻曲病中的应用
CN113046260B (zh) * 2021-02-04 2023-04-25 兴安盟莱绅生物农业有限公司 一种促进大豆生长的微生物混合菌剂及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4581847A (en) * 1984-09-04 1986-04-15 Molecular Genetics Research And Development Tryptophan overproducer mutants of cereal crops
US4642411A (en) * 1984-09-04 1987-02-10 Molecular Genetics Research And Development Limited Partnership Tryptophan overproducer mutants of cereal crops
US6118047A (en) * 1993-08-25 2000-09-12 Dekalb Genetic Corporation Anthranilate synthase gene and method of use thereof for conferring tryptophan overproduction
WO1999006581A1 (en) * 1997-07-31 1999-02-11 Sanford Scientific, Inc. Transgenic plants using the tdc gene for crop improvement
BR0309860A (pt) * 2002-05-03 2007-11-06 Monsanto Technology Llc plantas transgênicas com elevado teor de triptofano

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105925601A (zh) * 2007-05-25 2016-09-07 22世纪有限责任公司 编码调节生物碱合成之转录因子的核酸序列及其在改良植物代谢中的应用
US10941410B2 (en) 2007-05-25 2021-03-09 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US9175302B2 (en) 2007-05-25 2015-11-03 22Nd Century Limited, Llc Method for increasing a nicotinic alkaloid in a Nicotiana plant by introducing a mutation into the gene encoding the NbTF7 transcription factor and plants and products made by said method
US8624083B2 (en) 2007-05-25 2014-01-07 National Research Council Of Canada Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US8822757B2 (en) 2007-05-25 2014-09-02 National Research Council Of Canada Nucleic acid sequences encoding transcription factors regulating nicotine alkaloid biosynthesis and their use in modifying plant metabolism
US9121030B2 (en) 2007-05-25 2015-09-01 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US9133468B2 (en) 2007-05-25 2015-09-15 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US9150872B2 (en) 2007-05-25 2015-10-06 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US9157090B2 (en) 2007-05-25 2015-10-13 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US9157089B2 (en) 2007-05-25 2015-10-13 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US11597941B2 (en) 2007-05-25 2023-03-07 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
CN102171344A (zh) * 2007-05-25 2011-08-31 加拿大国家研究委员会 编码调节生物碱合成之转录因子的核酸序列及其在改良植物代谢中的应用
US9752156B2 (en) 2007-05-25 2017-09-05 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US9732350B2 (en) 2007-05-25 2017-08-15 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US10968459B2 (en) 2007-05-25 2021-04-06 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US9976153B2 (en) 2007-05-25 2018-05-22 22Nd Century Limited, Llc Down regulation of auxin response factor NbTF7 to increase nicotine in a plant
US9988640B2 (en) 2007-05-25 2018-06-05 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US10030249B2 (en) 2007-05-25 2018-07-24 22Nd Century Limited, Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US10337020B2 (en) 2007-05-25 2019-07-02 22Nd Century Limited Llc Nucleic acid sequences encoding transcription factors regulating alkaloid biosynthesis and their use in modifying plant metabolism
US10669552B2 (en) 2007-05-25 2020-06-02 22Nd Century Limited, Llc Up-regulation of auxin response factor NbTF7 to decrease nicotine in a plant
CN105925601B (zh) * 2007-05-25 2021-01-01 22世纪有限责任公司 编码调节生物碱合成之转录因子的核酸序列及其在改良植物代谢中的应用
CN102171344B (zh) * 2007-05-25 2016-03-16 22世纪有限责任公司 编码调节生物碱合成之转录因子的核酸序列及其在改良植物代谢中的应用
CN101967461A (zh) * 2010-10-22 2011-02-09 秦皇岛领先科技发展有限公司 一种固氮螺菌的发酵方法与由该方法得到的发酵液及其用途
CN101967461B (zh) * 2010-10-22 2012-06-27 领先生物农业股份有限公司 一种固氮螺菌的发酵方法与由该方法得到的发酵液及其用途

Also Published As

Publication number Publication date
BR0209437A (pt) 2011-07-05
US7217865B2 (en) 2007-05-15
CA2709843A1 (en) 2002-11-14
EP1542527A4 (en) 2006-03-08
BRPI0209437B1 (pt) 2019-02-26
EP1542527B1 (en) 2012-02-08
EP1542527A2 (en) 2005-06-22
AR035965A1 (es) 2004-07-28
AU2002257246A1 (en) 2002-11-18
WO2002090497A2 (en) 2002-11-14
WO2002090497A3 (en) 2005-04-28
CA2446258A1 (en) 2002-11-14
ATE544859T1 (de) 2012-02-15
US20030097677A1 (en) 2003-05-22
CN1719971B (zh) 2011-04-13
CA2709843C (en) 2014-02-18
CA2446258C (en) 2013-02-12

Similar Documents

Publication Publication Date Title
CN1263856C (zh) 真核生物中原卟啉原氧化酶酶活力的操作
CN1049454C (zh) 生产转基因玉米的方法
CN1852975A (zh) 转基因的高色氨酸植物
CN1024021C (zh) 含谷胱甘肽s-转移酶基因的除莠剂耐性植物
CN1245516C (zh) 编码乙酰乳酸合酶基因的基因
CN1285875A (zh) 突变的羟基苯丙酮酸双氧化酶、基dna序列和含该基因且耐除草剂的植物的分离
CN1246461C (zh) 修饰植物中次级代谢化合物水平的方法和组合物
CN1195861C (zh) 将多肽被囊化于淀粉基质中
CN1236394A (zh) 除草剂抗性植物
CN1201012C (zh) 改变植物开花时间的方法
CN1950509A (zh) 高赖氨酸玉米组合物及其检测方法
CN1933723A (zh) 玉米植株mon88017和组合物以及检测它们的方法
CN1705748A (zh) 用于增加植物中总的油类水平的方法
CN1719971A (zh) 转基因高色氨酸植物
CN1252098A (zh) 产生具有降低的棉子糖类和植酸水平之种子的大豆植物
CN1191357C (zh) 口服的免疫原性细菌肠毒素在转基因植物中的表达
CN1193097C (zh) 向真核细胞运送的外源dna的改良整合方法
US9090882B2 (en) Compositions and methods for enhanced amino acid levels in plants conferred by lysine and/or threonine feedback insensitive aspartate kinase proteins
CN1406282A (zh) 种子产量、生物量、和收获指数增加的转基因植物
CN1822763A (zh) 氮限制条件下生长得以改善的植物的制备方法
CN1685040A (zh) 用于在植物中表达基因的种子特异性usp启动子
CN1810977A (zh) 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸
CN1252097A (zh) 转基因植物选择方法
CN101044153A (zh) 用于植物中的真核翻译起始因子基因调节元件
CN1842592A (zh) 赋予植物再分化能力的基因及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20110413

CX01 Expiry of patent term