CN101175850B - 一类新型epsp合酶的鉴定 - Google Patents

一类新型epsp合酶的鉴定 Download PDF

Info

Publication number
CN101175850B
CN101175850B CN200680016320.XA CN200680016320A CN101175850B CN 101175850 B CN101175850 B CN 101175850B CN 200680016320 A CN200680016320 A CN 200680016320A CN 101175850 B CN101175850 B CN 101175850B
Authority
CN
China
Prior art keywords
ala
leu
gly
val
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200680016320.XA
Other languages
English (en)
Other versions
CN101175850A (zh
Inventor
N·卡洛兹
B·卡尔
P·E·哈默
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
BASF Agricultural Solutions Seed US LLC
Original Assignee
Athenix Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Athenix Corp filed Critical Athenix Corp
Publication of CN101175850A publication Critical patent/CN101175850A/zh
Application granted granted Critical
Publication of CN101175850B publication Critical patent/CN101175850B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8275Glyphosate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • C12N9/10923-Phosphoshikimate 1-carboxyvinyltransferase (2.5.1.19), i.e. 5-enolpyruvylshikimate-3-phosphate synthase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

提供了用于赋予细菌、植物、植物细胞、组织和种子草甘膦耐受性的组合物和方法。所述组合物包含一类称为III型的新型EPSPS酶,和编码该酶的多核苷酸、含有那些多核苷酸的载体,以及含有该载体的宿主细胞。这种新的蛋白质含有至少一个选自在此提供的III型结构域的序列结构域。这些序列结构域可用来鉴定具有抗草甘膦活性的EPSP合酶。

Description

一类新型EPSP合酶的鉴定
与相关申请案的交叉参考 
本申请要求于2005年4月8日申请的美国临时申请案No.60/669,686、于2005年5月6日申请的No.60/678,348、于2005年6月29申请的No.60/695,193,以及于2005年10月11日申请的No.60/725,182的优先权,在此将它们的内容通过全文引用作为参考。 
发明领域
本发明涉及植物分子生物学,特别是涉及一类赋予除草剂草甘膦抗性的新型EPSP合酶。 
发明背景 
N-膦酰甲基甘氨酸通常称作草甘膦,是一种重要的农艺学化学试剂。草甘膦抑制将磷酸烯醇丙酮酸(PEP)和3-磷酸莽草酸(S3P)转化成5-烯醇丙酮基-3-磷酸莽草酸的酶。该酶(5-烯醇丙酮基莽草酸-3-磷酸合酶,在这里称为“EPSP合酶”或“EPSPS”)的抑制通过阻断莽草酸途径来杀死植物细胞,从而抑制了芳族氨基酸的生物合成。 
由于草甘膦-类型的除草剂抑制了芳族氨基酸的生物合成,它们不仅杀死植物细胞,而且还对细菌细胞有毒性。草甘膦抑制许多细菌的EPSP合酶,并因此对这些细菌有毒性。然而,一些细菌的EPSP合酶具有高的草甘膦耐受性。 
抗草甘膦毒性的植物细胞可通过转化植物细胞来表达抗草甘膦的细菌EPSP合酶来产生。值得注意的是,来自根瘤农杆菌(Agrobacterium tumefaciens)菌株CP4的细菌基因已用于在植物中表达之后赋予植物细胞除草剂抗性。一种来自鼠伤寒沙门菌(Salmonella typhimurium)菌株CT7的突变型EPSP合酶赋予了细 菌细胞草甘膦抗性,并赋予了植物细胞草甘膦抗性(美国专利Nos.4,535,060、4,769,061和5,094,945)。 
EPSP合酶(Mr 46,000)折叠成两个相似的结构域,每个结构域包含3个拷贝的βαβαββ-折叠单位(Stallings等,(1991)Proc.Natl.Acad.Sci.U.S.A.885046-5050)。Lys-22、Arg-124、Asp-313、Arg-344、Arg-386和Lys-411是来自大肠杆菌(E.coli)的EPSP合酶的保守残基(Sch
Figure 200680016320X_0
nbrunn等,(2001)Proc.Natl.Acad.Sci.U.S.A.98:1376-1380)。对EPSPS活性重要的保守残基还包括Arg-100、Asp-242和Asp-384(Selvapandiyan等,(1995)FEBSLetters 374:253-256)。Arg-27与S3P结合(Shuttleworth等,(1999)Biochemistry 38:296-302)。已经分离了野生型EPSPS酶的变体,这些变体由于EPSPS氨基酸编码序列的改变而是草甘膦-耐受性的(Kishore和Shah(1988)Annu.Rev.Biochem.57:627-63;Wang等,(2003)Plant Res.116:455-60;Eschenburg等,(2002)Planta 216:129-35)。He等(2001,Biochim et BiophysicaActa 1568:1-6)已经通过大肠杆菌和鼠伤寒沙门菌EPSPS基因之间的突变发生和重组,研发出了具有增强的草甘膦耐受性的EPSP合酶,并提出在位置42(T42M)和位置230(Q230K)处的突变很可能是造成观察到的抗性的原因。随后的研究(He等(2003)Biosci.Biotech.Biochem.67:1405-1409)显示,T42M突变(苏氨酸突变为甲硫氨酸)足以提高大肠杆菌和鼠伤寒沙门菌酶两者的耐受性。 
由于除草剂耐受性植物提供了许多有利方面,用于鉴定具有抗草甘膦活性的抗除草剂基因的方法是期望的。 
发明概述 
提供了用于赋予细菌、植物、植物细胞、组织和种子草甘膦耐受性的组合物和方法。所述组合物包含一类称为III型的新型EPSPS酶,和编码该酶的多核苷酸、含有那些多核苷酸的载体,以及含有该载体的宿主细胞。这种新的蛋白质含有至少一个选自下列结构域(III型 结构域)的序列结构域: 
结构域I: 
L-A-K-G-X1-S-X2-L-X3-G-A-L-K-S-D-D-T(SEO ID NO:13),其中X1表示赖氨酸或苏氨酸,其中X2表示精氨酸或组氨酸,其中X3表示丝氨酸或苏氨酸; 
结构域Ia: 
L-A-K-G-X1,(SEQ ID No:14),其中X1表示赖氨酸或苏氨酸; 
结构域Ib: 
S-X1-L-X2(SEQ ID NO:15),其中X1表示精氨酸或组氨酸,其中X2表示丝氨酸或苏氨酸; 
结构域Ic: 
G-A-L-K-S-D-D-T(SEQ ID NO:16); 
结构域II: 
E-P-D-X1-X2-T-F-X3-V-X4-X5-X6-G(SEQ ID NO:17),其中X1表示天冬氨酸或丙氨酸,其中X2表示丝氨酸或苏氨酸,其中X3表示缬氨酸或异亮氨酸,其中X4表示苏氨酸或谷氨酸或赖氨酸,其中X5表示丝氨酸或甘氨酸,其中X6表示谷氨酰胺或丝氨酸或谷氨酸或苏氨酸; 
结构域IIa: 
E-P-D-X1-X2-T-F-X3-V(SEQ ID NO:18),其中X1表示天冬氨酸或丙氨酸,其中X2表示丝氨酸或苏氨酸,其中X3表示缬氨酸或异亮氨酸; 
结构域IIb: 
X1-X2-X3-G(SEQ ID NO:19),其中X1表示苏氨酸或谷氨酸或赖氨酸,其中X2表示丝氨酸或甘氨酸,其中X3表示谷氨酰胺或丝氨酸或谷氨酸或苏氨酸; 
结构域III: 
RFLTAA(SEQ ID NO:20); 
结构域IV: 
KRPI(G/M)P(SEQ ID NO:21) 
K-R-P-I-X1-P,其中X1表示甘氨酸或甲硫氨酸或亮氨酸; 
结构域V: 
X1-G-C-P-P-V(SEQ ID NO:22),其中X1表示苏氨酸或丝氨酸; 
结构域VI: 
I-G-A-X1-G-Y-X2-D-L-T(SEQ ID NO:23),其中X1表示精氨酸或赖氨酸或亮氨酸,并且其中X2表示异亮氨酸或缬氨酸; 
结构域VII: 
W-X1-V-X2-X3-T-G(SEQ ID NO:24),其中X1表示精氨酸或赖氨酸,其中X2表示丙氨酸或组氨酸或谷氨酸或丝氨酸,其中X3表示脯氨酸或丙氨酸; 
结构域VIII: 
E-P-D-A-S-A-A-T-Y-L-W-X1-A-X2-X3-L(SEQ ID NO:25),其中X1表示丙氨酸或甘氨酸,其中X2表示谷氨酸或谷氨酰胺,其中X3表示缬氨酸或亮氨酸或丙氨酸; 
结构域VIIIa: 
E-P-D-A-S-A-A-T-Y-L-W(SEQ ID NO:26); 
结构域IX: 
I-D-X1-G(SEQ ID NO:27),其中X1表示异亮氨酸或亮氨酸; 
结构域X: 
F-X1-Q-P-D-A-K-A(SEQ ID NO:28),其中X1表示苏氨酸或丝氨酸; 
结构域XI: 
X1-F-P-X2-X3-X4-A-X5-X6-X7-G-S-Q-M-Q-D-A-I-P-T-X8-A-V-X9A-A-F-N(SEQ ID NO:29),其中X1表示谷氨酰胺或赖氨酸或丝氨酸,其中X2表示天冬酰胺或组氨酸,其中X3表示甲硫氨酸或亮氨酸,其中X4表示脯氨酸或谷氨酰胺,其中X5表示苏氨酸或谷氨酸或缬氨酸,其中X6 表示缬氨酸或异亮氨酸,其中X7表示天冬氨酸或缬氨酸,其中X8表示亮氨酸或异亮氨酸,其中X9表示亮氨酸或异亮氨酸; 
结构域XIa: 
X1-F-P-X2-X3-X4-A(SEQ ID NO:30),其中X1表示谷氨酰胺或赖氨 酸或丝氨酸,其中X2表示天冬酰胺或组氨酸,其中X3表示甲硫氨酸或亮氨酸,其中X4表示脯氨酸或谷氨酰胺; 
结构域XIb: 
X1-X2-X3-G-S-Q-M-Q-D-A-I-P-T-X4-A-V-X5A-A-F-N(SEQ IDNO:31),其中X1表示苏氨酸或谷氨酸或缬氨酸,其中X2指缬氨酸或异亮氨酸,其中X3指天冬氨酸或缬氨酸,其中X4指亮氨酸或异亮氨酸,其中X5指亮氨酸或异亮氨酸; 
结构域XIc: 
G-S-Q-M-Q-D-A-I-P-T(SEQ ID NO:32); 
结构域XII: 
P-V-R-F-X1-X2-X3-X4-N-L-R-V-K-E-C-D-R-X5(SEQ ID NO:33),其中X1表示缬氨酸或苏氨酸,其中X2表示谷氨酸或甘氨酸,其中X3表示亮氨酸或异亮氨酸,其中X4表示丙氨酸或谷氨酸,其中X5表示异亮氨酸或缬氨酸; 
结构域XIIa: 
P-V-R-F(SEQ ID NO:34); 
结构域XIIb: 
X1-X2-X3-X4-N-L-R-V-K-E-C-D-R-X5(SEQ ID NO:35),其中X1表示缬氨酸或苏氨酸,其中X2表示谷氨酸或甘氨酸,其中X3表示亮氨酸或异亮氨酸,其中X4表示丙氨酸或谷氨酸,其中X5表示异亮氨酸或缬氨酸; 
结构域XIIc: 
N-L-R-V-K-E-C-D-R(SEQ ID NO:36); 
结构域XIII: 
E-G-D-D-L-X1-X2(SEQ ID NO:37),其中X1表示亮氨酸或异亮氨酸,其中X2表示缬氨酸或异亮氨酸; 
结构域XIV: 
X1-P-X2-L-A-G(SEQ ID NO:38),其中X1表示天冬氨酸或天冬酰胺,其中X2表示丙氨酸或丝氨酸或苏氨酸; 
结构域XV: 
A-X1-I-D-X2-X3-X4-D-H-R(SEQ ID NO:39),其中X1表示亮氨酸或丝氨酸或谷氨酸,其中X2表示苏氨酸或丝氨酸,其中X3表示组氨酸或苯基丙氨酸,其中X4表示丙氨酸或丝氨酸; 
结构域XVI: 
F-A-L-A-X1-L-K-X2-X3-G-I(SEQ ID NO:40),其中X1表示甘氨酸或丙氨酸,其中X2表示异亮氨酸或缬氨酸,其中X3表示丝氨酸或甘氨酸或丙氨酸或赖氨酸; 
结构域XVIa: 
F-A-L-A-X1-L-K(SEQ ID NO:41)其中X1表示甘氨酸或丙氨酸; 
结构域XVIb: 
L-K-X1-X2-G-I(SEQ ID NO:42),其中X1表示异亮氨酸或缬氨酸, 其中X2表示丝氨酸或甘氨酸或丙氨酸或赖氨酸;以及 
结构域XVII: 
-X1-P-X2-C-V-X3-K(SEQ ID NO:43),其中X1表示天冬酰胺或天冬氨酸,其中X2表示丙氨酸或天冬氨酸,其中X3表示丙氨酸或甘氨酸。 
结构域XVIII: 
X1-S-L-G-V(SEQ ID NO:44),其中X1表示丙氨酸或丝氨酸或脯氨酸。 
SEQ ID NOS:13-44中列出的上述结构域通过比对具有至少50%的序列同一性的III型序列而确定。至少一种这些序列结构域的存在预示着抗草甘膦活性。 
提供了对应赋予除草剂抗性的核酸序列的分离的核酸分子。另外,也包含了对应所述多核苷酸的氨基酸序列。特别地,本发明提供了含有III型结构域的分离的核酸分子,包括在SEQ ID NO:9、11、55、57和58中列出的核苷酸序列、编码在SEQ ID NO:10、12、56和59中显示的氨基酸序列的核苷酸序列、保藏于登记号为B-30833和B-30838的细菌宿主中的抗除草剂的核苷酸序列,以及它们的变体和片段。与本发明的核苷酸序列互补的核苷酸序列,或者与本发明的序 列杂交的核苷酸序列也包括在内。这些序列可用于构建用于随后转化进目标植物的表达载体,用作用于分离其它草甘膦抗性基因的探针,用作选择标记等。 
组合物还包含所述多肽的抗体以及编码抗除草剂多肽的合成多核苷酸。所述编码序列可用于在生物体,包括微生物和植物中转化并表达的DNA构建体或表达盒。组合物也包含转化的细菌、植物、植物细胞、组织和种子,它们通过将本发明的组合物引入生物体的基因组中而是草甘膦耐受性的。如果生物体是一种植物,则该序列的引入使得能将含有草甘膦的除草剂施用至作物来选择性杀死草甘膦敏感的杂草,而不会杀死转化的生物体。 
另外提供了用于鉴定具有抗草甘膦活性的EPSP合酶的方法。该方法包括,获得EPSP合酶的氨基酸序列,以及确定所述氨基酸序列是否含有至少一种本发明的序列结构域。 
在此描述的EPSP合酶代表一类新型EPSPS酶,在下文中称为III型EPSPS酶。 
附图描述 
图1显示了EPSP合酶氨基酸序列的比对。已确定为对底物结合和EPSPS活性重要的保守残基用方框标出。方框描绘了III型结构域的氨基酸位置。方框上方的罗马数字与III型结构域对应。 
发明详述 
本发明涉及用于赋予生物体除草剂耐受性,特别是草甘膦耐受性的组合物和方法。该方法涉及用编码本发明的III型草甘膦耐性基因的核苷酸序列来转化生物体。特别的,本发明识别一种类型的赋予草甘膦耐受性的酶,以及编码这种酶的核苷酸序列。该序列可用于制备显示增加的除草剂草甘膦耐受性的植物。因此,提供了转化的细菌、植物、植物细胞、植物组织和种子。 
III型酶特征为具有至少一种选自下面列出的结构域的结构域, 在这里称之为III型结构域: 
结构域I: 
L-A-K-G-X1-S-X2-L-X3-G-A-L-K-S-D-D-T(SEQ ID NO:13),其中X1表示赖氨酸或苏氨酸,其中X2表示精氨酸或组氨酸,其中X3表示丝氨酸或苏氨酸; 
结构域Ia: 
L-A-K-G-X1,(SEQ ID No:14),其中X1表示赖氨酸或苏氨酸; 
结构域Ib: 
S-X1-L-X2(SEQ ID NO:15),其中X1表示精氨酸或组氨酸,其中X2表示丝氨酸或苏氨酸; 
结构域Ic: 
G-A-L-K-S-D-D-T(SEQ ID NO:16); 
结构域II: 
E-P-D-X1-X2-T-F-X3-V-X4-X5-X6-G(SEQ ID NO:17),其中X1表示天冬氨酸或丙氨酸,其中X2表示丝氨酸或苏氨酸,其中X3表示缬氨酸或异亮氨酸,其中X4表示苏氨酸或谷氨酸或赖氨酸,其中X5表示丝氨酸或甘氨酸,其中X6表示谷氨酰胺或丝氨酸或谷氨酸或苏氨酸; 
结构域IIa: 
E-P-D-X1-X2-T-F-X3-V(SEQ ID NO:18),其中X1表示天冬氨酸或丙氨酸,其中X2表示丝氨酸或苏氨酸,其中X3表示缬氨酸或异亮氨酸; 
结构域IIb: 
X1-X2-X3-G(SEQ ID NO:19),其中X1表示苏氨酸或谷氨酸或赖氨酸,其中X2表示丝氨酸或甘氨酸,其中X3表示谷氨酰胺或丝氨酸或谷氨酸或苏氨酸; 
结构域III: 
RFLTAA(SEQ ID NO:20); 
结构域IV: 
KRPI(G/M)P(SEQ ID NO:21) 
K-R-P-I-X1-P,其中X1表示甘氨酸或甲硫氨酸或亮氨酸; 
结构域V: 
X1-G-C-P-P-V(SEQ ID NO:22),其中X1表示苏氨酸或丝氨酸; 
结构域VI: 
I-G-A-X1-G-Y-X2-D-L-T(SEQ ID NO:23),其中X1表示精氨酸或赖氨酸或亮氨酸,并且其中X2表示异亮氨酸或缬氨酸; 
结构域VII: 
W-X1-V-X2-X3-T-G(SEQ ID NO:24),其中X1表示精氨酸或赖氨酸,其中X2表示丙氨酸或组氨酸或谷氨酸或丝氨酸,其中X3表示脯氨酸或丙氨酸; 
结构域VIII: 
E-P-D-A-S-A-A-T-Y-L-W-X1-A-X2-X3-L(SEQ ID NO:25),其中X1表示丙氨酸或甘氨酸,其中X2表示谷氨酸或谷氨酰胺,其中X3表示缬氨酸或亮氨酸或丙氨酸; 
结构域VIIIa: 
E-P-D-A-S-A-A-T-Y-L-W(SEQ ID NO:26); 
结构域IX: 
I-D-X1-G(SEQ ID NO:27),其中X1表示异亮氨酸或亮氨酸; 
结构域X: 
F-X1-Q-P-D-A-K-A(SEQ ID NO:28),其中X1表示苏氨酸或丝氨酸; 
结构域XI: 
X1-F-P-X2-X3-X4-A-X5-X6-X7-G-S-Q-M-Q-D-A-I-P-T-X8-A-V-X9A-A-F-N(SEQ ID NO:29),其中X1表示谷氨酰胺或赖氨酸或丝氨酸,其中X2表示天冬酰胺或组氨酸,其中X3表示甲硫氨酸或亮氨酸,其中X4表示脯氨酸或谷氨酰胺,其中X5表示苏氨酸或谷氨酸或缬氨酸,其中X6 表示缬氨酸或异亮氨酸,其中X7表示天冬氨酸或缬氨酸,其中X8表示亮氨酸或异亮氨酸,其中X9表示亮氨酸或异亮氨酸; 
结构域XIa: 
X1-F-P-X2-X3-X4-A(SEQ ID NO:30),其中X1表示谷氨酰胺或赖氨酸或丝氨酸,其中X2表示天冬酰胺或组氨酸,其中X3表示甲硫氨酸或亮氨酸,其中X4表示脯氨酸或谷氨酰胺; 
结构域XIb: 
X1-X2-X3-G-S-Q-M-Q-D-A-I-P-T-X4-A-V-X5A-A-F-N(SEQ ID NO:31),其中X1表示苏氨酸或谷氨酸或缬氨酸,其中X2指缬氨酸或异亮氨酸,其中X3指天冬氨酸或缬氨酸,其中X4指亮氨酸或异亮氨酸,其中X5指亮氨酸或异亮氨酸; 
结构域XIc: 
G-S-Q-M-Q-D-A-I-P-T(SEQ ID NO:32); 
结构域XII: 
P-V-R-F-X1-X2-X3-X4-N-L-R-V-K-E-C-D-R-X5(SEQ ID NO:33),其中X1表示缬氨酸或苏氨酸,其中X2表示谷氨酸或甘氨酸,其中X3表示亮氨酸或异亮氨酸,其中X4表示丙氨酸或谷氨酸,其中X5表示异亮氨酸或缬氨酸; 
结构域XIIa: 
P-V-R-F(SEQ ID NO:34); 
结构域XIIb: 
X1-X2-X3-X4-N-L-R-V-K-E-C-D-R-X5(SEQ ID NO:35),其中X1表示缬氨酸或苏氨酸,其中X2表示谷氨酸或甘氨酸,其中X3表示亮氨酸或异亮氨酸,其中X4表示丙氨酸或谷氨酸,其中X5表示异亮氨酸或缬氨酸; 
结构域XIIc: 
N-L-R-V-K-E-C-D-R(SEQ ID NO:36); 
结构域XIII: 
E-G-D-D-L-X1-X2(SEQ ID NO:37),其中X1表示亮氨酸或异亮氨酸,其中X2表示缬氨酸或异亮氨酸; 
结构域XIV: 
X1-P-X2-L-A-G(SEQ ID NO:38),其中X1表示天冬氨酸或天冬酰 胺,其中X2表示丙氨酸或丝氨酸或苏氨酸; 
结构域XV: 
A-X1-I-D-X2-X3-X4-D-H-R(SEQ ID NO:39),其中X1表示亮氨酸或丝氨酸或谷氨酸,其中X2表示苏氨酸或丝氨酸,其中X3表示组氨酸或苯基丙氨酸,其中X4表示丙氨酸或丝氨酸; 
结构域XVI: 
F-A-L-A-X1-L-K-X2-X3-G-I(SEQ ID NO:40),其中X1表示甘氨酸或丙氨酸,其中X2表示异亮氨酸或缬氨酸,其中X3表示丝氨酸或甘氨酸或丙氨酸或赖氨酸; 
结构域XVIa: 
F-A-L-A-X1-L-K(SEQ ID NO:41),其中X1表示甘氨酸或丙氨酸;结构域XVIb: 
L-K-X1-X2-G-I(SEQ ID NO:42),其中X1表示异亮氨酸或缬氨酸,其中X2表示丝氨酸或甘氨酸或丙氨酸或赖氨酸;以及 
结构域XVII: 
-X1-P-X2-C-V-X3-K(SEQ ID NO:43),其中X1表示天冬酰胺或天冬氨酸,其中X2表示丙氨酸或天冬氨酸,其中X3表示丙氨酸或甘氨酸。 
结构域XVIII: 
X1-S-L-G-V(SEQ ID NO:44),其中X1表示丙氨酸或丝氨酸或脯氨酸。 
SEQ ID NOS:13-44中列出的上述结构域通过比对具有至少50%序列同一性的III型序列得以鉴定。在一些实施方案中,存在至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31或32个这样的序列结构域。 
采用本发明的方法以及鉴定的结构域,可以鉴定可赋予草甘膦耐受性的其它蛋白质(例如,SEQ ID NO:2、4、46和48)。这些蛋白质包括已知的蛋白质以及新鉴定的蛋白质(例如,SEQ ID NOS:10、12、56和59)。 
“草甘膦”意指N-膦酰甲基甘氨酸(包括它的任何盐)的任何除草剂形式,以及导致植物(planta)中产生草甘膦阴离子的其它形式。“抗除草剂蛋白质”、“除草剂耐受性蛋白质”或由“除草剂抗性-”或“除草剂耐受性-”编码多核苷酸的表达产生的蛋白质包括,赋予细胞比未表达该蛋白质的细胞耐受更高浓度的除草剂的能力的蛋白质,或者赋予细胞比未表达该蛋白质的细胞更长时间耐受某种浓度的除草剂的能力的蛋白质。“抗草甘膦蛋白质”或“草甘膦耐受性蛋白质”包括,赋予细胞比未表达该蛋白质的细胞耐受更高浓度的草甘膦的能力的蛋白质,或者赋予细胞比未表达该蛋白质的细胞更长时间地耐受一定浓度的草甘膦的能力的蛋白质。“耐受”或“耐受性”意指以不容易与未经处理的细胞区分的方式存活,或行使基本的细胞功能例如蛋白质合成和呼吸。 
分离的多核苷酸,以及它们的变体和片段
本发明的一个方面涉及不同于SEQ ID NOS:1、3、7、45、47和53中列出的多核苷酸序列的分离的多核苷酸,其编码具有至少一种本发明的III型序列结构域的EPSP合酶。“不同于”意指本发明不包括在列举的SEQ ID NOS中列出的多核苷酸序列。 
本发明的分离的多核苷酸包括,编码抗除草剂蛋白质和多肽或其生物活性部分的核苷酸序列,以及足以用作杂交探针来鉴定除草剂抗性-编码多核苷酸的多核苷酸。如在此使用的,“多核苷酸”旨在包括DNA分子(例如cDNA或基因组DNA)和RNA分子(例如mRNA)以及使用核苷酸类似物产生的DNA或RNA的类似物。多核苷酸可以是单链或双链DNA。 
本发明的核苷酸序列包括特征为上面包括的结构域的那些。用于鉴定这些结构域的信息包括草甘膦-敏感性EPSPS分子的序列比对。序列比对用来确定序列间的同源区域,并用来确定是III型EPSPS酶的特征的III型结构域。 
所述结构域的变体也包含于本发明范围内(例如SEQ ID NO:55)。 这种变体包含具有至少90%、至少95%、96%、97%、98%或99%序列同一性的序列,并包含于赋予草甘膦耐受性的DNA分子中。 
“分离的”或“纯化的”多核苷酸或蛋白质,或其生物活性部分基本上无其它细胞物质,或在通过重组技术生产时基本上无培养基,或者在化学合成时基本上无化学前体或其它的化学试剂。优选地,“分离的”多核苷酸不含有在该多核苷酸所源自的生物体的基因组DNA中,天然位于该多核苷酸侧翼(即,位于该多核苷酸5′和3′末端的序列)的序列(例如,蛋白质编码序列)。为了本发明的目的,“分离的”在用来指多核苷酸时不包括分离的染色体。例如,在多个实施方案中,分离的草甘膦抗性-编码多核苷酸可包含少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列,所述的这些核苷酸序列天然位于该多核苷酸所源自的细胞的基因组DNA中的多核苷酸的侧翼。基本上无细胞物质的抗除草剂蛋白质包括具有低于约30%、20%、10%或5%(按干重计算)的非-抗除草剂蛋白质(在这里也称作“污染蛋白质”)的蛋白质制剂。 
作为这些除草剂抗性-编码核苷酸序列的片段的多核苷酸也包含于本发明中(例如,SEQ ID NOS:57、58和60)。“片段”意指编码抗除草剂蛋白质的核苷酸序列的一部分(例如SEQ ID NO:59)。该核苷酸序列片段可编码抗除草剂蛋白质的生物活性部分,或者它可以是采用下面公开的方法,能够用作杂交探针或PCR引物的片段。作为抗除草剂核苷酸序列的片段的多核苷酸包含至少约15、20、50、75、100、200、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950个连续核苷酸,或者达到存在于在此公开的全长除草剂抗性-编码核苷酸序列中的核苷酸数。“连续”核苷酸意指彼此直接邻接的核苷酸残基。 
本发明核苷酸序列的片段通常会含有至少一种在此描述的III型结构域,并且会编码保留全长抗草甘膦蛋白质的生物活性,即抗除草 剂活性的蛋白质片段。“保留抗除草剂活性”意指该片段将会具有至少约30%、至少约50%、至少约70%或至少约80%的作为SEQ ID NO:6在此公开的全长抗草甘膦蛋白质的抗除草剂活性。 
用于测量抗除草剂活性的方法是本领域熟知的。参见,例如,美国专利No.4,535,060和5,188,642,它们的每一个在这里通过全文引用作为参考。编码本发明蛋白质的生物活性部分的除草剂抗性-编码核苷酸序列的片段将会编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400个连续氨基酸,或达到存在于本发明的全长抗除草剂蛋白质中的氨基酸总数。重要的是,该片段将会含有至少一种在这里描述的III型结构域。 
本发明的抗除草剂蛋白质是特征为III型的那些,或它们的保留活性的片段或变体。术语“充分一致”意指采用标准参数,用在这里描述的比对程序之一测量出的,与参考序列比较具有至少约60%或65%序列同一性、至少约70%或75%序列同一性、至少约80%或85%序列同一性或至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸或核苷酸序列。本领域的技术人员将会理解,这些值可通过考虑密码子简并、氨基酸相似性、阅读框定位等来适当调节,以确定通过两种核苷酸序列编码的蛋白质的相应同一性。 
为了测定两个氨基酸序列或两个多核苷酸的百分比同一性,为了最佳比较而进行序列比对。这两个序列之间的百分比同一性是序列共有的相同位置数的函数(即,百分比同一性=相同位置数/位置总数(例如,重叠位置)×100)。在一个实施方案中,这两个序列是一样长的。这两个序列之间的百分比同一性可采用类似于下面描述的那些技术(允许或不允许缺口)测定。在百分比同一性计算中,通常计算精确的匹配。 
两个序列之间的百分比同一性的测定可采用数学算法完成。用于比较两个序列的数学算法的非限制性实例是Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264-2268的算法,其在 Karlin和Altschul(1993)Proc.Natl.Acad.Sd.USA 90:5873-5877中进行了修改。这种算法整合进了Altschul等,(1990)J.Mol.Biol.215:403-410的BLASTN和BLASTX程序中。BLAST核苷酸搜索可用BLASTN程序进行(分值=100,字长=12),以获得与本发明的GDC-类多核苷酸同源的核苷酸序列。BLAST蛋白质搜索可用BLASTX程序进行(分值=50,字长=3),以获得与本发明的抗除草剂蛋白质分子同源的氨基酸序列。为了获得有缺口的比对用于比较目的,可以如Altschul等(1997)Nucleic Acids Res.25:3389-2402中描述的使用GappedBLAST。备选地,可以采用PSI-Blast进行迭代搜索,测定分子间远缘关系。参见Altschul等(1997),同上。当采用BLAST、Gapped BLAST和PSI-Blast程序时,可以使用各个程序的默认参数(例如BLASTX和BLASTN)。参见www.ncbi.nlm.nih.gov。用于序列比较的数学算法的另一非限制性实例是ClustalW算法(Higgins等,(1994)NucleicAcids Res.22:4673-4680)。ClustalW可比较序列并对齐整个氨基酸或DNA序列,并因而可提供有关整个氨基酸序列的序列保守性的数据。ClustalW算法在多个可商业获得的DNA/氨基酸分析软件包中使用,例如Vector NTI Program Suite(Invitrogen Corporation,Carlsbad,CA)的ALIGNX程序模块。在用ClustalW比对氨基酸序列后,可以评估氨基酸的百分比同一性。可用于分析ClustalW比对的软件程序的非限制性实例是GENEDOCTM。GENEDOCTM(Karl Nicholas)使得能评估多个蛋白质之间的氨基酸(或DNA)相似性和同一性。用于序列比较的数学算法的另一非限制性实例是Myers和Miller(1988)CABIOS 4:11-17的算法。该算法整合进了ALIGN程序(version 2.0)中,ALIGN程序是GCG序列比对软件包(可从Accelrys公司,San Diego,CA获得)的一部分。当采用ALIGN程序来比较氨基酸序列时,可采用PAM120权重残基表、12的缺口长度罚分和4的缺口罚分。 
除非另外说明,将使用Needleman和Wunsch(1970)J.Mol.Biol.48(3):443-453算法的GAP Version 10,使用下列参数,用于测定序列同一性或相似性:核苷酸序列的百分比同一性和百分比相似性使用 50的GAP权重和3的长度权重,以及nwsgapdna.cmp打分矩阵;氨基酸序列的百分比同一性和百分比相似性使用8的GAP权重和2的长度权重,以及BLOSUM62打分程序。也可以使用等价程序。“等价程序”意指用于任何两种所讨论序列的任何序列比较程序,当与由GAP 10版产生的对应的比对相比较时,所述的序列比较程序产生了具有相同核苷酸残基匹配和相同百分比序列同一性的比对。本发明还包含多核苷酸变体。除草剂抗性-编码核苷酸序列的“变体”包括编码在这里公开的抗除草剂蛋白质,但由于遗传密码的简并而保守不同的那些序列,以及如上讨论的充分一致的那些序列。天然存在的等位基因变体可采用熟知的分子生物学技术,例如如在下文中概述的聚合酶链式反应(PCR)和杂交技术鉴定。核苷酸序列变体还包括合成产生的核苷酸序列,所述的核苷酸序列例如通过采用定点诱变产生,但它仍然编码如下文中讨论的在本发明中公开的抗除草剂蛋白质。包含于本发明的蛋白质变体是有生物活性的,即它们保留了天然蛋白的目标生物活性,即抗除草剂活性。“保留抗除草剂活性”意指该变体将会具有至少约30%、至少约50%、至少约70%或至少约80%的天然蛋白质的抗除草剂活性。用于测量抗除草剂活性的方法是本领域熟知的。参见,例如,美国专利No.4,535,060和5,188,642,它们的每一个在这里通过全文引用作为参考。 
熟练技术人员将会进一步了解到,变化可通过突变来引入进本发明的核苷酸序列中,从而导致编码的抗除草剂蛋白质的氨基酸序列发生变化,而不会改变该蛋白质的生物活性。因此,多种分离的多核苷酸可通过引入一个或多个核苷酸的取代、添加或缺失进在这里公开的相应核苷酸序列中而产生,这样一个或多个氨基酸的取代、添加或缺失引入进了编码的蛋白质中。可通过标准技术,例如定点诱变和PCR-介导的诱变来引入突变。这些核苷酸序列变体也包含于本发明中。 
例如,保守氨基酸取代可以在一个或多个预定的,非必需的氨基酸残基处发生。“非必需的”氨基酸残基是可以从抗除草剂蛋白质的野生型序列改变而不会改变生物活性的残基,而“必需的”氨基酸残 基是生物活性所必需的。“保守氨基酸取代”是其中氨基酸残基用具有类似侧链的氨基酸残基代替的取代。具有类似侧链的氨基酸残基家族已经在本领域定义。这些家族包括具有碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、无电荷极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸)、β分支的侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳族侧链的(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。氨基酸取代可以在保持功能的非保守区发生。一般而言,这种取代不能对保守氨基酸残基,或者不能对位于保守基序内的氨基酸残基进行,所述的保守基序内的这些残基是蛋白质活性所必需的。然而,本领域的技术人员将会了解,功能性变体可以在保守残基中具有较小的保守或非保守改变。 
备选地,变体核苷酸序列可通过沿全部或部分的编码序列随机引入突变,例如通过饱和诱变来产生,并且可以筛选产生的突变体的赋予抗除草剂活性的能力以鉴定保持该活性的突变体。诱变发生后,可重组表达编码的蛋白质,并采用标准检测技术测定该蛋白质的活性。 
采用方法例如PCR、杂交等,对应的抗除草剂序列可通过寻找本发明的保守结构域来鉴定。参见,例如Sambrook和Russell(2001)Molecular Cloning:A Laboratory Manual(Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY)以及Innis等,(1990)PCR Protocols:A Guide to Methods and Applications(AcademicPress,St Louis,MO)。 
在杂交方法中,全部或部分的抗除草剂核苷酸序列或结构域可用于筛选cDNA或基因组文库。用于构建这种cDNA和基因组文库的方法通常为本领域所知,并且公开于Sambrook和Russell,2001(同上)中。所谓的杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸,并且可用可检测基团例如32P,或任何其它可检测标记,例如放射性同位素、荧光化合物、酶或酶辅因子标记。用于杂交的探 针可以基于在此公开的已知的除草剂抗性-编码核苷酸序列,通过标记合成的寡核苷酸产生。另外可以使用基于核苷酸序列或编码的氨基酸序列中的保守核苷酸或氨基酸残基而设计的简并引物。探针通常包含核苷酸序列的一个区域,在严格条件下,该区域与本发明除草剂抗性-编码核苷酸序列或其片段或变体的至少约12、至少约25或至少约50、75、100、125、150、175、200、250、300、350、400、500、600、700、800、900、1000、1200、1400、1600、1800个连续核苷酸杂交。用于制备杂交探针的方法通常是本领域所知的,并公开于Sambrook和Russell,2001,同上以及Sambrook等(1989)Molecular Cloning:ALaboratory Manual(2d ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York)中,将两者在此通过引用作为参考。 
这种序列的杂交可在严格条件下进行。“严格条件”或“严格杂交条件”是指,在其下探针将会与其靶序列比与其它序列杂交达到更高的可检测水平(例如,至少两倍于背景)的条件。严格条件是序列-依赖性的,并且在不同的环境下将会不同。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。备选地,可调节严格条件以允许序列中的一些错配,以便检测到较低水平的相似性(异源探测)。通常,探针长度少于约1000个核苷酸,或少于500个核苷酸。 
典型地,严格条件会是其中在pH 7.0-8.3下盐浓度低于约1.5MNa离子,通常约0.01-1.0M Na离子浓度(或其它盐),并且对于短探针(例如10-50个核苷酸)温度至少约30℃而对于长的探针(例如大于50个核苷酸)至少60℃的那些条件。严格条件也可以通过加入去稳定剂例如甲酰胺实现。示例性的低严格条件包括,在37℃下用30-35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲液杂交,并在50-55℃下于1×至2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸钠)中洗涤。示例性的中等严格条件包括,在37℃下于40-45%甲酰胺、1.0M NaCl、1%SDS中杂交,并在55-60℃下于0.5×至1×SSC中洗涤。示例性的高严格条件包括,在37℃下于50%甲酰胺、 1M NaCl、1%SDS中杂交,并在60-65℃的0.1×SSC中洗涤。任选地,洗涤缓冲液可包含约0.1%至约1%的SDS。杂交的持续时间一般少于约24小时,通常约4至12小时。 
特异性通常是杂交后洗涤的函数,最终的洗涤溶液的离子强度和温度是关键因素。对于DNA-DNA杂交链,Tm可从Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的等式:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L估算;其中M是一价阳离子的摩尔浓度,%GC是DNA中鸟苷和胞嘧啶核苷酸的百分比,%form是杂交溶液中甲酰胺的百分比,而L是碱基对表示的杂交链的长度。Tm是50%的互补靶序列杂交至完全匹配的探针时的温度(在确定的离子强度和pH下)。对于每1%的错配,Tm降低约1℃;从而,可调节Tm、杂交和/或洗涤条件来与期望同一性的序列杂交。例如,如果要寻找≥90%同一性的序列,可将Tm降低10℃。通常,在确定的离子强度和pH下,严格条件选择为比特定序列和它的互补序列的热解链温度(Tm)约低5℃。然而,极严格条件可采用在比热解链温度(Tm)低1、2、3或4℃下的杂交和/或洗涤;中等严格条件可采用在比热解链温度(Tm)低6、7、8、9或10℃下的杂交和/或洗涤;低严格条件可采用在比热解链温度(Tm)低11、12、13、14、15或20℃下的杂交和/或洗涤。采用所述的等式、杂交和洗涤组合物,以及期望的Tm,一般技术人员将会理解,杂交和/或洗涤溶液的严格性的变化已隐含描述。如果期望的错配水平导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则优选增加SSC的浓度,以便可使用更高的温度。多核苷酸杂交的广泛指导在Tijssen(1993)Laboratory Techniques inBiochemistry and Molecular Biology-Hybridization with NucleicAcid Probes,PartI,Chapter2(Elsevier,New York);和Ausube l等编辑的(1995)Current Protocols in Molecular Biology,Chapter2(Greene Publishing and Wiley-Interscience,New York)中找到。参见Sambrook等(1989)Molecular Cloning:A Laboratory Manual(2d ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor, NY)。 
分离的蛋白质以及其变体和片段
抗除草剂蛋白质也包含于本发明内。“抗除草剂蛋白质”意指具有至少一种上面列出的结构域的III型蛋白质,包括,例如SEQ ID NO:10、12、56和59。也提供其片段、生物活性部分和变体,并且可用于实践本发明的方法。 
“片段”或“生物活性部分”包括含有编码抗除草剂蛋白质的一部分氨基酸序列,并保留了抗除草剂活性的多肽片段。抗除草剂蛋白质的生物活性部分可以是例如10、25、50、100或更多个氨基酸长的多肽。这种生物活性部分可通过重组技术制备并评估其抗除草剂活性。用于测量抗除草剂活性的方法是本领域熟知的。参见,例如,美国专利No.4,535,060和5,188,642,将它们每一个在此通过全文引用作为参考。 
“变体”意指具有与III型酶有至少约60%、65%、约70%、75%、约80%、85%,或约至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列的蛋白质或多肽。变体还包括由在严格条件下与编码III型酶的多核苷酸,或其互补多核苷酸杂交的多核苷酸编码的多肽。变体包括由于诱变而氨基酸序列不同的多肽。本发明包含的变体蛋白质是有生物活性的,即它们继续拥有天然蛋白质的期望的生物活性,即保留了抗除草剂活性。用于测量抗除草剂活性的方法是本领域熟知的。参见,例如美国专利No.4,535,060和5,188,642,将它们每一个在此通过全文引用作为参考。 
细菌基因通常在邻近开放阅读框的起始处具有多个甲硫氨酸起始密码子。通常,在一个或多个这些起始密码子处的翻译起始将会导致功能性蛋白质的产生。这些起始密码子可包括ATG密码子。然而,细菌例如芽孢杆菌(Bacillus sp.)也识别密码子GTG为起始密码子,并且在GTG密码子处起始翻译的蛋白质在第一个氨基酸处含有甲硫氨 酸。此外,通常不会根据先前经验而确定这些密码子中哪些在细菌中天然使用。因此,应理解,一个备选甲硫氨酸密码子的使用可能导致赋予除草剂抗性的变体的产生(例如,由SEQ ID NO:58编码的SEQ IDNO:59)。这些抗除草剂蛋白质包含于本发明内,并且可用于本发明的方法。 
也包括本发明多肽的抗体,或其变体或片段的抗体。用于产生抗体的方法是本领域熟知的(参见,例如Harlow and Lane(1988)Antibodies:ALabora tory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.;美国专利No.4,196,265)。 
细菌或植物细胞的转化
细菌细胞的转化通过本领域已知的多种技术中的一种完成,该技术不限于电穿孔或化学转化(参见,例如Ausubel(ed.)(1994)Current Protocols in Molecular Biology,John Wiley and Sons,Inc.,Indianopolis,IN)。赋予对毒性物质抗性的标记可用于将转化的细胞(已经吸收并表达试验DNA的那些细胞)与未-转化的细胞(不含有或不表达试验DNA的那些细胞)鉴别开来。在本发明的一方面,基因可用作用以评估细菌或植物细胞转化的标记。 
植物细胞的转化可以以类似的方式完成。“植物”意指整株植物、植物器官(例如叶、茎、根等)、种子、植物细胞、繁殖体、胚和它们的子代。植物细胞可以是分化的或未分化的(例如,愈伤组织、悬浮培养细胞、原生质体、叶细胞、根细胞、韧皮部细胞、花粉)。“转基因植物”或“转化的植物”或“稳定转化的”植物或细胞或组织指,已将外源的多核苷酸序列或DNA片段***或整合进植物细胞中的植物。“稳定转化”意指引入植物中的核苷酸构建体整合进植物的基因组中,并能够遗传给它的子代。 
可修饰本发明的基因以获得或增强在植物细胞中的表达。本发明的抗除草剂序列可提供于表达盒中用于在目标植物中表达。“植物表达盒”包括能够导致在植物细胞中从开放阅读框表达蛋白质的DNA构 建体。在转录的5′-3′方向,该表达盒将会包含在植物中发挥功能的有效连接至本发明的DNA序列的转录起始区域(即启动子),以及转录和翻译的终止区域(即终止区域)。在一些实施方案中,转录起始区域将会导致RNA序列的产生,所述的RNA序列允许编码的EPSPS酶充分表达而增强用该多核苷酸转化的植物细胞的草甘膦耐受性。“充分表达”意指转录起始区域将会提供一定数量的本发明抗草甘膦多肽(例如,含有III型结构域的那些)的表达,所述的一定量的抗草甘膦多肽将会赋予植物或细胞比不含有或不表达该蛋白质的植物或细胞耐受更高浓度的草甘膦的能力,或比不含有或不表达该蛋白质的植物或细胞更长时间地耐受一定浓度的草甘膦的能力。 
表达盒可另外包含至少一种将被共转化进生物体中的额外的基因,例如选择标记基因。备选地,另外的基因可在多个表达盒上提供。这种表达盒中提供多个限制性位点用于***抗除草剂序列而使其处于调控区的转录调节下。 
对于本发明的植物宿主和/或DNA序列,启动子可以是天然的或类似的,或者外来的或异源的。另外,启动子可以是天然的序列或为合成的序列。如果启动子是“天然的”或与植物宿主“同源的”,则旨在表示该启动子发现于所述启动子引入其中的天然植物中。如果启动子对本发明的DNA序列来说是“外来的”或“异源的”,则旨在表示对于有效连接的本发明的DNA序列,该启动子不是天然的或天然存在的启动子。“异源的”一般指对于它们存在于其中的细胞或部分天然基因组来说不是内源性的,且已通过感染、转染、显微注射、电穿孔、微喷射等加至细胞的多核苷酸序列。“有效连接”意指启动子和另一个序列之间的功能性连接,其中启动子序列起始和调节对应所述另一个序列的DNA序列的转录。通常,有效连接表示连接的多核苷酸序列是连续的并且,如果需要连接两个蛋白质编码区,则其是连续的并且位于相同的阅读框内。 
通常,这种构建体也会含有5′和3′非翻译区。这种构建体可以含有“信号序列”或“前导序列”来帮助目标肽同步翻译运输或翻译 后运输至某些细胞内结构,例如叶绿体(或其它质体)、内质网或高尔基体,或者被分泌。例如,基因可设计成含有信号肽,以便帮助该肽转移到内质网。“信号序列”意指已知或猜测可导致肽同步翻译运输或翻译后运输穿过细胞膜的序列。在真核生物中,这通常涉及分泌进入高尔基体中,伴随有一些糖基化产生。“前导序列”意指当翻译时,导致足以引发肽链同步翻译运输到亚细胞器的任何氨基酸序列。因此,这包括前导序列,目标是通过运输到内质网,运输到液泡、质体包括叶绿体、线粒体等来运输和/或糖基化。植物表达盒还可以设计成含有内含子,这样,表达需要进行内含子的mRNA加工。 
“3′非翻译区”意指位于编码序列下游的核苷酸序列。多腺苷酸化信号序列(例如,多腺苷酸化的核苷酸)和编码调节信号的其它序列是3′非翻译区,所述的调节信号能够影响多聚腺苷酸片段添加到mRNA前体的3′末端。“5′非翻译区”意指位于编码序列上游的核苷酸序列。 
其它上游或下游的非翻译元件包括增强子。增强子是用于增强启动子区表达的核苷酸序列。增强子是本领域熟知的并且包括,但不限于SV40增强子区和35S增强子元件。 
终止区可以是天然与转录起始区一起的,可以是天然与本发明的抗除草剂序列一起的,或者可以源自另外的来源。适宜的终止区可从根瘤农杆菌的Ti-质粒获得,例如章鱼碱合酶和胭脂碱合酶终止区。还可以参见Guerineau等,(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等,(1991)Genes Dev.5:141-149;Mogen等,(1990)Plant Cell 2:1261-1272;Munroe等,(1990)Gene 91:151-158;Ballas等,(1989)Nucleic Acids Res.17:7891-7903;以及Joshi等,(1987)Nucleic Acid Res.15:9627-9639。 
如有必要,可以优化基因来增强在转化的宿主细胞中的表达。即,基因可以用宿主细胞偏爱的密码子合成用于提高表达,或者可以用密码子以宿主偏爱的密码子使用频率合成。通常,基因的GC含量将会增 加。对于宿主偏爱的密码子使用的讨论,参见,例如Campbell和Gowri(1990)Plant Physiol.92:1-11。用于合成宿主偏爱的基因的方法是本领域已知的。参见,例如,美国专利No.6,320,100、6,075,185、5,380,831和5,436,391,美国公开的申请案No.20040005600和20010003849,以及Murray等,(1989)Nucleic Acids Res.17:477-498,在此将其通过引用作为参考。 
在一个实施方案中,将目标多核苷酸靶向叶绿体来表达。以这种方式,如果目标多核苷酸不直接***进叶绿体中,则表达盒将另外含有编码转运肽(transit peptide)的多核苷酸来引导目标基因产物至叶绿体。这种转运肽是本领域已知的。参见,例如Von Heijne等,(1991)Plant Mol.Biol.Rep.9:104-126;Clark等,(1989)J.Biol.Chem.264:17544-17550;Della-Cioppa等,(1987)Plant Physiol.84:965-968;Romer等,(1993)Biochem.Biophys.Res.Commun.196:1414-1421;以及Shah等,(1986)Science 233:478-481。在一些实施方案中,本发明的多核苷酸编码一种含有氨基-末端叶绿体转运肽和EPSPS酶的融合多肽。“融合多肽”可例如通过这样产生:除去编码第一种多肽的多核苷酸序列的终止密码子,然后按读码框融合编码第二种多肽的多核苷酸序列,这样得到的多核苷酸序列将随后由细胞表达为单个多肽。 
可以优化要靶向至叶绿体的目标多核苷酸在叶绿体中的表达,考虑植物细胞核和该细胞器之间密码子利用的不同。以这种方式,目标多核苷酸可采用叶绿体-偏爱的密码子合成。参见,例如,美国专利No.5,380,831,在此将其通过引用作为参考。 
通常将这种“植物表达盒”***“植物转化载体”中。“转化载体”意指有效转化细胞所需的DNA分子。这种分子可以由一个或多个表达盒组成,并且可以组织成多于一个的“载体”DNA分子。例如,二元载体是利用两个非-连续DNA载体,来编码植物细胞转化所需的所有顺式-和反式功能的植物转化载体(Hellens和Mullineaux(2000)Trends in Plant Science 5:446-451)。“载体”指设计用 来在不同宿主细胞之间转移的多核苷酸构建体。“表达载体”指具有在外源细胞中***、整合并表达异源DNA序列能力的载体。 
该植物转化载体可由实现植物转化所需的一个或多个DNA载体组成。例如,利用由多于一个的连续DNA片段组成的植物转化载体是本领域中的一般惯例。在本领域中,这些载体通常称为“二元载体”。二元载体以及具有辅助质粒的载体最常用于农杆菌(Agrobacterium)-介导的转化,其中实现有效转化所需的DNA片段的大小和复杂性非常大,并且将功能元件分散到单独的DNA分子上是有利的。二元载体通常含有质粒载体,所述的质粒载体含有T-DNA转移所需的顺式作用序列(例如左边界和右边界)、设计成能够在植物细胞中表达的选择标记,以及“目标基因”(设计成能够在期望产生转基因植物的植物细胞中表达的基因)。也存在于该质粒载体上的是细菌复制所需的序列。将顺式-作用序列以允许有效转移进入植物细胞中并在那里表达的方式排列。例如,选择标记基因和目标基因位于左边界和右边界之间。通常,第二个质粒载体含有介导T-DNA从农杆菌转移到植物细胞中的反式-作用因子。该质粒常常包含毒性功能元件(Vir基因),其允许通过农杆菌感染植物细胞,并通过边界序列处的切割转移DNA以及vir-介导的DNA转移,这是本领域所了解的(Hellens和Mullineaux(2000)Trends in Plant Science,5:446-451)。几种类型的农杆菌属菌株(例如LBA4404、GV3101、EHA101、EHA105等)可用于植物转化。通过其它方法例如微喷射、显微注射、电穿孔、聚乙二醇等来转化植物不需要第二种质粒载体。 
植物转化
本发明的方法涉及将核苷酸构建体引入植物中。“引入”意指以使构建体获得进入植物细胞内的方式给予植物核苷酸构建体。本发明的方法不需要采用用于将核苷酸构建体引入进植物中的特殊方法,仅需要核苷酸构建体获得进入至少一个植物细胞的内部。用于将核苷酸构建体引入植物中的方法是本领域已知的,包括但不限于稳定转化方 法、瞬时转化方法,以及病毒-介导的方法。 
通常,植物转化方法包括:将异源DNA转移进靶植物细胞(例如未成熟或成熟的胚、悬浮培养物、未分化的愈伤组织、原生质体等)中,之后应用最大阈水平的适当选择(取决于选择标记基因,并且在该情况下是“草甘膦”)来从一组未转化的细胞群中回收转化了的植物细胞。 
在这种方法中,含有一个或多个本发明的III型结构域的抗草甘膦多肽可用作选择标记。通常将外植体转移至新鲜提供的相同的培养基中并按常规培养。随后,在置于补充有最大阈水平的选择剂(例如“草甘膦”)的再生培养基中后,转化的细胞分化成了小苗。然后将小苗转移至选择性生根培养基(rooting medium)中,用以回收生根的小苗或小植株。随后,转基因小植株成长为成熟植物并产生能育种子(例如,Hiei等,(1994)The Plant Journal 6:271-282;Ishida等,(1996)Na ture Bio technology 14:745-750)。通常将外植体转移至新鲜提供的相同的培养基中并按常规培养。用于产生转基因植物的技术和方法的一般性描述可在Ayres和Park(1994)CriticalReviews in Plant Science 13:219-239以及Bommineni和Jauhar(1997)Maydica 42:107-120中找到。由于转化的材料含有许多细胞,转化和未转化的细胞都存在于接受处理的任何一片靶标愈伤组织或组织或细胞群中。杀死未转化的细胞并使转化的细胞增殖的能力产生了转化的植物培养物。通常,除去未转化的细胞的能力是对迅速回收转化的植物细胞并成功生产转基因植物的限制。然后,将用分子和生物化学方法来确认转基因植物基因组中整合的异源基因的存在。 
转基因植物的产生可通过多种方法之一完成,包括但不限于通过农杆菌将异源DNA引入植物细胞中(农杆菌-介导的转化)、用附着于粒子的异源的外来DNA轰击植物细胞,以及多种其它的非-粒子引导-介导方法(例如,Hiei等(1994)The Plant Journal 6:271-282;Ishida等,(1996)Na ture Bio technology 14:745-750;Ayres和Park(1994)Critical Reviews in Plant Science 13:219-239;Bommineni和 Jauhar(1997)Maydica 42:107-120)来转移DNA。 
用于叶绿体转化的方法是本领域已知的。见,例如,Svab等,(1990)Proc.Natl.Acad.Sci.USA 87:8526-8530;Svab和Maliga(1993)Proc.Natl.Acad.Sci.USA 90:913-917;Svab和Maliga(1993)EMBOJ.12:601-606。该方法依靠粒子枪递送含有选择标记的DNA,并通过同源重组靶向该DNA至质体基因组。另外,质体转化可通过核-编码的和质体-引导的RNA聚合酶的组织偏爱型表达,使沉默的质体运载的转基因反式激活来完成。这样的一种体系已经在McBride等,(1994)Proc.Natl.Acad.Sci.USA 91:7301-7305中报道。 
根据常规的方法,可使已转化的细胞成长为植株。见,例如McCormick等,(1986)Plant Cell Reports 5:81-84。随后可以栽培这些植物,并用相同转化株或不同转化株授粉,并且鉴定得到的具有组成型表达期望表型特征的杂种。可以栽培两个或多个世代,以确保期望的表型特征的表达得以稳定保持和遗传,然后收获种子以确保期望表型特征的表达已经实现。以这样的方式,本发明提供了转化的种子(也称为“转基因种子”),所述的种子具有已稳定整合进它们基因组中的本发明核苷酸构建体,例如本发明表达盒。 
植物
本发明可用于任何植物种类的转化,包括但不限于单子叶植物和双子叶植物。目标植物的实例包括,但不限于玉米(maize)、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、 甘蔗、烟草、大麦和油菜、芸苔属物种、苜蓿、黑麦、黍、红花、花生、甘薯、木薯、咖啡树、椰子、菠萝、柑橘、可可、茶、香蕉、鳄梨、无花果、番石榴、芒果、橄榄、木瓜、腰果、澳大利亚坚果、杏、燕麦、蔬菜、观赏性植物和针叶植物。 
蔬菜包括,但不限于番茄、莴苣、四季豆、利马豆、豌豆,以及黄瓜(Curcumis)属的成员例如黄瓜、罗马甜瓜和甜瓜。观赏性植物包括,但不限于杜鹃花、八仙花(hydrangea)、木槿(hibiscus)、 蔷薇、郁金香、水仙花、矮牵牛花(petunias)、康乃馨、猩猩木和菊花。优选地,本发明的植物是作物(例如,玉米、高梁、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等)。 
本发明尤其适合于单子叶植物科的任何成员,包括但不限于玉米、水稻、大麦、燕麦、小麦、高粱、黑麦、甘蔗、菠萝、山药、洋葱、香蕉、椰子和枣椰子。 
植物转化的评估
在将异源的外来DNA引入植物细胞中后,通过多种方法,例如分析与整合进的基因相关的多核苷酸、蛋白质和代谢物,来证实植物基因组中异源基因的转化或整合。 
PCR分析是一种在移栽进土壤之前的早期阶段,筛选转化的细胞、组织或小苗的整合的基因的存在的快速方法(Sambrook和Russell(2001)Molecular Cloning:ALaboratory Manual,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY)。PCR用对目标基因或农杆菌载体背景等特异性的寡核苷酸引物完成。 
植物转化可通过基因组DNA的DNA印迹分析(Sambrook和Russell,2001,同上)确认。一般而言,从转化体中提取出总DNA,将其用合适的限制性内切酶消化,在琼脂糖凝胶中分级分离并转移至硝酸纤维素膜或尼龙膜上。然后,根据标准技术(Sambrook和Russell,2001,同上),用例如放射标记的32P靶DNA片段探测该膜或“印迹”来确认植物基因组中所引入的基因的整合。 
在RNA印迹分析中,根据本领域中常规使用的标准方法(Sambrook和Russell,2001,同上),从转化体的特定组织中分离出RNA,将其在甲醛琼脂糖凝胶中分级分离,并印记到尼龙滤膜上。然后,通过本领域已知的方法(Sambrook和Russell,2001,同上),将所述滤膜与源自GDC的放射性探针杂交来检测由本发明序列编码的RNA的表达。 
可采用结合抗除草剂蛋白质上存在的一个或多个表位的抗体,通 过标准方法(Sambrook和Russell,2001,同上)对转基因植物进行蛋白质印迹和生物化学测定法等,以测定由除草剂抗性基因编码的蛋白质的存在。 
本发明也涉及用于鉴定具有抗草甘膦活性的EPSP合酶的方法。该方法包括,确定某些保守序列结构域是否存在于EPSP合酶的氨基酸序列中。一个或多个结构域的存在在上面列出。 
从序列预测蛋白质功能
采用本发明的方法以及鉴定的结构域,可以鉴定赋予草甘膦耐受性的其它多肽(例如,SEQ ID NO:2、4、46和48)。可通过搜寻含有EPSP合酶序列的序列数据库,和/或通过比对EPSP合酶的多肽序列来搜索III型结构域的存在而鉴定这些另外的多肽。这些多肽包括已知的多肽以及新鉴定出的多肽。应该了解,这些结构域的一些修饰本质上是容许的而不破坏这些结构域的赋予草甘膦抗性的特性,并因此与在这里列出的结构域是等效的。 
一般而言,存在四个等级的蛋白质结构:一级结构,其由直链氨基酸或多肽序列组成;二级结构,其由蛋白质折叠成的α-螺旋、β-片层(β-strand)以及转角(turn)产生;三级结构,其由已组合形成紧密的球状结构域的简单基序构成;以及四级结构,其可包含多条氨基酸链或亚基。当从序列预测功能时,鉴定功能上重要的基序或模式是重要的。具有相似折叠的蛋白质结构域通常具有相同的分子功能(Hegyi和Gerstein(1999)J.Mol.Biol.288:147-164;Moult和Melamud(2000)Curr.Opin. Struct. Biol.10:384-389;Shakhnovich等,(2003)J.Mol.Biol.326:1-9)。对蛋白质功能重要的结构域的确定可通过多序列比对完成。 
三维结构可通过同源建模,即通过利用具有经实验方法测定的3D结构的序列同系物(>25%的序列同一性)预测。例如大肠杆菌EPSP合酶(AroA)的三维结构是所熟知的(Shnbrunn等,(2001)Proc.Natl.Acad.Sci.USA 98:1375-1380)。该结构是基于AroA与草甘膦和莽 草酸3-磷酸的结晶。 
下面的实施例是以举例说明的方式而不是以限定的方式提供。 
试验 
实施例1.EPSPS基因的分离
已从7种不同细菌(肺炎克雷伯氏菌(Klebsiella pneumoniae)、放射形土壤杆菌(Agrobacterium radiobacter)、根瘤菌属物种(Rhizobium sp.)、泡囊短波单胞菌(Brevundomonas vesicularis)、根瘤农杆菌(Agrobacterium tumefaciens)、丁香假单胞菌(Pseudomonas syringae),以及布鲁氏菌属/苍白杆菌属(Brucella/Ochrobactrum)分离了编码III型EPSPS酶的基因。 
grg8开放阅读框的DNA编码序列和氨基酸序列在于2004年12月29日申请的美国专利申请No.60/640,195中提供,并分别在本申请的SEQ ID NO:7和SEQ ID NO:8中提供。 
grg12开放阅读框的DNA编码序列和氨基酸序列分别在本申请的SEQ ID NO:57和10以及SEQ ID NO:58和59中提供。 
grg15开放阅读框的DNA编码序列和氨基酸序列分别在本申请的SEQ ID NO:11和SEQ ID NO:12中提供。 
grg6开放阅读框的DNA编码序列和氨基酸序列在GenBank登记号AE016853的碱基1,140,091到1,141,347中提供,并且分别在本申请的SEQ ID NO:1和SEQ ID NO:2中提供。 
grg9开放阅读框的DNA编码序列和氨基酸序列在GenBank登记号NC_003304的碱基628,398到629,675中提供,并且分别在本申请的SEQ ID NO:3和SEQ ID NO:4中提供。 
grg7开放阅读框的DNA编码序列和氨基酸序列分别在本申请的SEQ ID NO:45和SEQ ID NO:46中提供。 
grg5开放阅读框的DNA编码序列和氨基酸序列在GenBank登记号NC_005773的碱基1到1257中提供,并且分别在本申请的SEQ ID NO:47 和SEQ ID NO:48中提供。 
玉米EPSPS开放阅读框的DNA编码序列和氨基酸序列在GenBank登记号X63374(gi:1524383)的碱基1到1335中提供,并且蛋白质序列在本申请的SEQ ID NO:50中提供。 
公开于国际专利申请案WO2005014820中的细菌EPSPS的DNA编码序列和氨基酸序列分别在本申请的SEQ ID NO:53和SEQ ID NO:54中提供。 
grg7ml开放阅读框的DNA编码序列和氨基酸序列分别在本申请的SEQ ID NO:55和SEQ ID NO:56中提供。 
实施例2.从丁香假单胞菌番茄致病变种(Pseudomonas syringaepv tomato )菌株DC3000克隆EPSP合酶基因。
用下列引物:CAGAGATCTGGCATGCGACCTCAAGCCACTCTC(上游,SEQID NO:61)和CAGGGCGCGCCTCAGCGCTGAACACTCACCC(下游,SEQ IDNO:62),从丁香假单胞菌番茄致病变种菌株DC3000(ATCC BAA-871)的基因组DNA PCR-扩增EPSP合酶编码序列。将得到的1.3kb PCR产物用Bgl II和Asc I消化,连接进已用BamH I和Asc I消化的改良的pUC18中,随后经电穿孔进入DH5α细胞中。从抗氨苄青霉素的菌落制备质粒DNA并通过限制酶切消化分析。选择一个克隆用于进一步的分析。用本领域熟知的技术测定了***片段的DNA序列,并发现与公开的菌株DC3000的序列(Genbank登记号AE016853,碱基1,140,091到1,141,347)100%一致。该质粒称为pAX703,并且EPSPS ORF称为grg6。 
将质粒pAX703转化进ΔaroA大肠杆菌细胞并发现弥补了缺失。这说明grg6编码了功能性EPSP合酶。 
实施例3.从放射形土壤杆菌菌株C58克隆EPSP合酶基因。
用下列引物:CAGGGATCCGGCATGATCGAACTGACCATCACCC(上游,SEQID NO:63)和CAGGGCGCGCCTCAGTGCTGCGGCTCGGCAGCG(下游,SEQ ID NO:64),从根瘤农杆菌菌株C58(ATCC 33970)的基因组DNA PCR-扩增EPSP合酶编码序列。将得到的1.3kb PCR产物用BamH I和Asc I消化,连接进已用BamH I和Asc I消化的改良的pUC18中,随后经电穿孔进入DH5α细胞中。从抗氨苄青霉素的菌落制备质粒DNA并通过限制酶切消化分析。选择一个克隆用于进一步的分析。用本领域熟知的技术测定了***片段的DNA序列,并发现与公开的菌株C58的序列(Genbank登记号NC_003304,碱基628398到629675)100%一致。该质粒称为pAX702,并且C58 EPSPS ORF称为grg9。 
将质粒pAX702转化进ΔaroA大肠杆菌细胞中并发现弥补了缺失。这说明grg9编码了功能性EPSP合酶。 
实施例4.检测grg6和grg9的草甘膦抗性。
将分别含有grg6和grg9的质粒pAX703和pAX702转化进大肠杆菌细胞中,并在含有不同浓度草甘膦的M63琼脂培养基上划线接种。将载体质粒pUC18用作草甘膦-敏感对照。结果在下面的表1中给出,并证实了grg6或grg9的表达赋予了高水平的草甘膦抗性。 
表1 
Figure 200680016320XA00800011
实施例5.从丁香假单胞菌丁香致病变种菌株B728a克隆EPSP合酶基因。
用下列引物:CAGGGATCCGGCATGCGACCTCAAGCCACCCTC(上游,SEQID NO:65)和CAGGGCGCGCCTCAGCGCTGAACACTCACAC(下游,SEQ ID NO:66),从一个充分分离的丁香假单胞菌丁香致病变种菌株B728a的菌落PCR-扩增EPSP合酶编码序列。将得到的1.26kb PCR产物用合适的限制性内切酶消化并连接进载体pRSF1b中,然后经电穿孔进入大肠杆菌细胞中。从抗氨苄青霉素的菌落制备质粒DNA并通过限制酶切消化分析。选出一个克隆用于进一步的分析并命名为pAX1923。测定pAX1923中的开放阅读框的DNA序列,发现其与公开的丁香假单胞菌丁香致病变种菌株B728a的EPSPS的序列一致。因此,我们将该开放阅读框命名为grg7。 
类似地,将另一1.26kb PCR产物用BamH I和Asc I消化,连接至已用BamH I和Asc I消化的改良的pUC18中,随后经电穿孔进入DH5α细胞中。从抗氨苄青霉素的菌落制备质粒DNA并通过限制酶切消化分析。选择一个克隆用于进一步的分析。用本领域熟知的技术测定pAX712***物的DNA序列,当与公开的丁香假单胞菌丁香致病变种菌株B728a的DNA序列(Genbank登记号NZ_AABP02000003,碱基39,901到41,400)比较时,发现其包含3个核苷酸变化。这3个DNA核苷酸变化导致:蛋白质相对于由所述公开序列编码的假定蛋白质具有一个氨基酸变化。将编码EPSPS的菌株B728a的开放阅读框,如在质粒pAX712中鉴定的,称为grg7ml(SEQ ID NO:55;grg7ml蛋白质序列在SEQ ID NO:56中列出)。 
实施例6.从丁香假单胞菌菜豆致病变种菌株1448a克隆EPSP合酶基因。
丁香假单胞菌菜豆致病变种菌株1448a的EPSPS的序列数据从The Institute for Genomic Research的网址www.tigr.org获得。用基于可从The Institute for Genomic Research(“TIGR”,个人通信)获得的DNA序列设计的下列引物:CAGGGATCCGGCATGCGACCTCAAGCCACCCTC(上游,SEQ ID NO:67)和AGAGGCGCGCCTCAGCGCTGAACACGCACC(下游,SEQ ID NO:68),从丁香假单胞菌菜豆致病变种菌株1448a(ATCC BAA-978)的基因组DNA PCR- 扩增丁香假单胞菌菜豆致病变种菌株1448a的EPSP合酶编码序列。将得到的1.26kb PCR产物用BamH I和Asc I消化,连接进已用BamH I和Asc I消化的改良的pUC18中,随后经电穿孔进入DH5α细胞中。从抗氨苄青霉素的菌落制备质粒DNA并通过限制酶切消化分析。选出一个克隆用于进一步的分析,并命名为pAX713。用本领域熟知的技术测定pAX713***物的DNA序列,发现其与公开的丁香假单胞菌菜豆致病变种(Pseudomonas syringae pv.phaseolicola)菌株1448a的DNA序列(通过The Institute for Genomic Research(TIGR)进行,并可在www.tigr.org上以电子版形式在线获得)100%一致。该质粒称为pAX713,并且编码EPSPS的菌株1448a的开放阅读框,如在质粒pAX713中鉴定的,称为grg5。 
实施例7.检测grg5和grg7的草甘膦抗性。
将分别含有grg5、grg7和grg7ml的质粒pAX713、pAX1923和pAX712转化进大肠杆菌细胞中,并在含有不同浓度草甘膦的M6 3琼脂培养基上划线接种。将载体质粒pUC18用作草甘膦-敏感对照。结果在下面的表2中显示,并证实grg5、grg7或grg7ml的表达赋予了高水平的草甘膦抗性。 
表2 
Figure 200680016320XA00800021
实施例8:ATX20019的分离
通过将土壤样品涂布于含有草甘膦作为唯一磷来源的HEPES矿物盐培养基(HMSM)上来分离ATX20019。由于HMSM不含芳族氨基酸,菌株必须是抗草甘膦的以便在该培养基中生长。 
将2克土壤悬浮于约10ml的水中,涡旋15秒并让其沉淀15分 钟。将10μl菌环量的该混悬液加入至3ml补充有10mM草甘膦的HMSM(pH 7.0)中。HMSM含有(每升):10g葡萄糖、2g NH4SO4、9.53g HEPES、1.0ml 0.8M MgSO4、1.0ml 0.1M CaCl2、1.0ml痕量元素溶液(在100ml的1000x溶液中:0.1g FeSO4·7H2O、0.5mgCuSO4·5H2O、1.0mg H3BO3、1.0mg MnSO4·5H2O、7.0mg ZnSO4·7H2O、1.0mg MoO3、4.0g KCl)。让培养物在28℃下于振荡培养箱中培育4天,随后将20μl用于接种2.5ml含有10mM草甘膦作为唯一磷来源的新鲜HMSM。2天后,将20μl用于接种另一个新鲜的2.5ml培养基。5天后,将20μl用于接种一个新鲜的2.5ml培养基。在充分培养后,通过将1μl菌环在琼脂平板表面划线接种将培养物涂布于固体培养基上,并在28℃下储存,所述的琼脂平板含有具有10mM草甘膦作为唯一磷来源的HMSM琼脂。然后将培养物再次涂布用于分离。由于其在有高浓度草甘膦的情况下生长的能力而选择了一种特殊的菌株,称为ATX20019。通过对16S rDNA进行序列测定并与数据库比较,确定了ATX20019是苍白杆菌属(Ochrobactrum sp.)/布鲁氏菌属(Brucella sp.)的一员。 
实施例9.粘粒文库的制备和筛选
采用本领域一般已知的方法从ATX20019培养物中提取出总DNA。将该DNA用限制性内切酶Sau3A1部分消化并根据生产商的说明书,与SuperCos(Stratagene)载体片段连接。用GigaPackIII XL packagingextract(Stratagene),将连接产物包装进噬菌体颗粒中,转染进大肠杆菌aroA-细胞中。大肠杆菌aroA-是一种其中天然的编码EPSP合酶的aroA基因已删除的菌株。该菌株不能在M63培养基中生长,因为它需要外来提供的芳族氨基酸。含有EPSP合酶基因的粘粒的存在可遗传性地补充aroA-表型,即,使得该菌株能够在没有外来提供的芳族氨基酸的M63培养基上生长。 
将转染的细胞涂布于含有50μg/ml卡那霉素的M63琼脂培养基上,M63琼脂培养基含有100mM KH2PO4、15mM(NH4)2SO4、50μM CaCl2、 1μM FeSO4、50μM MgCl2、55mM葡萄糖、25mg/升L-脯氨酸、10mg/升盐酸硫胺素、用于调节pH至7.0的足够的NaOH,以及15g/升琼脂。鉴别了生长在该培养基上的两个菌落。从这两个菌落的每个制备粘粒DNA并将其再转化进大肠杆菌aroA-细胞中。在每种情况中,用粘粒DNA再转化的细胞可在有0或10mM草甘膦存在的M6 3培养基上生长,而含有空的SuperCos载体的细胞不能在M63培养基上生长。这证实了,所述的粘粒能够补充aroA-表型并且能够赋予草甘膦抗性。这些粘粒称为pAX1100和pAX1101。通过使用两种不同的酶的限制酶切消化分析,所述的粘粒似乎是一致的。选择一种粘粒即pAX1101用于进一步鉴定。 
实施例10.粘粒pAX1101中的grg12的鉴定
为了鉴定负责粘粒pAX1101显示的草甘膦-抗性的基因,将该克隆的DNA用转座因子进行诱变处理。在该方法中,鉴定了已受到转座子***,并且已丧失赋予草甘膦抗性的能力的克隆。转座子***的位置确定了负责草甘膦抗性表型的开放阅读框。 
用EZ::TN Insertion Kit(Epicentre,Madison,WI)和生产商提供的方法,让粘粒pAX1101接受体外转座子诱变。该方法随机地***转座子片段进粘粒DNA中,并因此随机地破坏了粘粒中的基因的功能。所述的转座子含有编码抗生素抗性的基因,因此可通过在存在那种抗生素时生长的能力来选择转座子***克隆。转座子***的位置可通过限制性片段作图或通过用在转座子中退火的引物测序而确定。 
将转座子***的pAX1101克隆转化进大肠杆菌菌株DH5α中,并将其涂布于含有草甘膦的M63培养基上。发现多个克隆已丧失了在存在草甘膦时生长的能力,这说明转座子已破坏了负责抗性的基因。 
使用本领域熟知的测序方法,测定含有转座子***物的pAX1101区域的DNA序列,并表示为SEQ ID NO:9。确定了在SEQ ID NO:9的碱基46到1380处的开放阅读框(ORF)。该核苷酸序列表示为SEQ IDNO:57,并且对应的氨基酸序列表示为SEQ ID NO:58。来自已丧失草甘膦抗性的8个转座子***克隆的序列数据分析显示,它们都存在于该ORF内。这说明该ORF编码了粘粒赋予的草甘膦抗性。将该基因命名为grg12。含有grg12ORF的粘粒pAX1101于2004年4月4日保藏于农业研究机构保藏中心(Agricultural Research Service CultureCollection(NRRL)),分配的保藏号为B-30833。
实施例11.GRG12与其它蛋白质的同源性
GRG12与EPSP合酶具有同源性。GRG12氨基酸序列(SEQ ID NO:10)与其它EPSP合酶的氨基酸序列的比对在图1中显示。表3列出了GRG12与多种EPSP合酶的百分比同一性。对氨基酸序列(SEQ ID NO:10)的分析表明,其不含代表II型EPSP合酶的4个结构域。因此,它是一种新的、非-II型的抗草甘膦EPSP合酶。 
GRG12与在WO2005014820中描述的EPSPS(SEQ ID NO:54)具有最高的氨基酸同源性。GRG12(SEQ ID NO:10)与WO2005014820中描述的EPSPS具有92%的氨基酸同一性。 
表3.GRG12与其它EPSP合酶的氨基酸同一性 
Figure 200680016320XA00800031
grg12DNA序列(SEQ ID NO:9)的进一步分析显示,存在另一个更短的开放阅读框(SHQ ID NO:58),其从SEQ ID NO:9的核苷酸142处的GTG起始密码子开始。该开放阅读框的翻译产生了与SEQ ID NO:10的残基33-444相同的蛋白质(SEQ ID NO:59),除了SEQ ID NO:59的起始密码子是甲硫氨酸而不是SEQ ID NO:10中存在的缬氨酸。SEQ IDNO:59与已知的EPSPS蛋白质的比对表明,该蛋白质含有已知对发挥EPSPS功能关键的所有残基。因此,该蛋白质可能含有功能性的、抗草甘膦EPSPS酶,而由高度保守的结构域内部的起始密码子起始翻译产生的蛋白质将不可能有功能。SEQ ID NO:59与WO2005014820中描述的EPSPS(SEQ ID NO:54)有97%的同一性。 
这两种开放阅读框(SEQ ID NO:57和58)编码功能性EPSPS活性的能力都可通过如下检测:如本领域已知,通过PCR来扩增每个开放阅读框,将得到的PCR片段克隆进在合适的启动子控制下的质粒载体中,诱导蛋白质从所述开放阅读框表达,并比较表达的蛋白质补充大肠杆菌中的aroA-表型的能力和赋予草甘膦抗性的能力。 
实施例12.对grg12进行基因工程改造用于在大肠杆菌中表达GRG12蛋白质
通过PCR扩增grg12开放阅读框(ORF),克隆进稍微修饰形式的质粒载体pUC18中并转化进大肠杆菌菌株DH5α中。对pUC18的改变如下:将终止密码子***进1acZ开放阅读框中,并且将核糖体结合位点(用于优化***的grg12 ORF的翻译起始)***BamHI限制性位点的上游。制备质粒DNA,并通过限制酶切消化来确定grg12***物的存在和方向。将含有相对于载体中的1ac启动子以正向取向的ORF的一个克隆命名为pAX1106,并检测其赋予草甘膦抗性的能力。将含有pAX1106或空载体质粒的大肠杆菌细胞在含有0-200mM草甘膦的M63琼脂平板划线接种。结果在下面的表4中显示。这些结果证明,grg12赋予了高水平的草甘膦抗性。 
表4.pAX1106在M63草甘膦琼脂上的生长 
实施例13.在大肠杆菌中作为6×His-标记的蛋白质表达的GRG12的纯化
采用PFUULTRATM DNA聚合酶(Stratagene),通过PCR扩增grg12编码区。设计用于引导PCR的寡核苷酸,来引入限制性内切酶识别位点至得到的PCR产物的5′和3′末端附近。将得到的PCR产物用合适的限制性内切酶消化,并将消化产物克隆进6xHis-标签表达载体pRSF1b(Nova gen)中。得到的克隆在与6xHis标签相同的翻译阅读框中含有grg12,并且其C-端直接与6xHis标签连接。用于产生这种克隆,以及用于表达含有6xHis-标签的蛋白质的一般策略是本领域熟知的。 
GRG12蛋白质的表达水平可在SDS-PAGE蛋白质凝胶上测定。GRG12蛋白质可通过在例如Ni-NTA Superflow Resin(Qiagen)上,按照生产商的说明书,进行层析来纯化诱导的GRG12蛋白质而得以分离。 
实施例14:ATX4150的分离
ATX4150通过将土壤样品涂布于含有草甘膦作为唯一磷来源的加富基础培养基(Enriched Minimal Media)(EMM)上来分离。由于EMM不含芳族氨基酸,菌株必须是抗草甘膦的以便在该培养基中生长。 
将2克土壤悬浮于约30ml的水中,并在Aquasonic超声波仪水浴中超声处理30秒钟。将该样品涡旋5秒钟并让其沉淀60秒钟。将该步骤重复3次。将100μl该混悬液加入至3ml补充有4mM草甘膦的EMM(pH 6.0)中。EMM含有(每900ml):10g葡萄糖、2gNaNO3、1.0ml 0.8M MgSO4、1.0ml 0.1M CaCl2、1.0ml痕量元素 溶液(在100ml的1000x溶液:0.1g FeSO4·7H2O、0.5mg CuSO4·5H2O、1.0mg H3BO3、1.0mg MnSO4·5H2O、7.0mg ZnSO4·7H2O、1.0mg MoO3、4.0g KCl中)。让培养物在21℃下于组织培养旋转滚筒中振荡16天,并随后将100μl用于接种3ml含有4mM草甘膦作为唯一磷来源的新鲜EMM。5天后,将100μl用于接种另一个新鲜的3 ml培养物。在数天后,通过将1μl菌环划线接种于琼脂平板表面上,将培养物涂布于固体培养基上,所述的琼脂平板含有具有5mM草甘膦作为唯一磷来源的EMM琼脂。在数天后,将菌落再涂布于含有5mM草甘膦作为唯一磷来源的EMM上用于分离。由于其在有高浓度草甘膦的情况下生长的能力而选择了一种特殊的菌株,称为ATX4150。 
实施例15.粘粒文库的制备和筛选
用本领域普遍知道的方法从ATX4150培养物中提取出总DNA。将该DNA用限制性内切酶Sau3A1部分消化并根据生产商的说明书,与SuperCos(Stratagene)载体片段连接。用GigaPack III XL packagingextract(Stratagene),将连接产物包装进噬菌体颗粒中,转染进大肠杆菌aroA-细胞中。大肠杆菌aroA-是一种其中天然的编码EPSP合酶的aroA基因已删除的菌株。该菌株不能在M63培养基中生长,因为它需要外来提供的芳族氨基酸。含有EPSP合酶基因的粘粒的存在可遗传性地补充aroA-表型,即,其使得该菌株能够在没有外来提供的芳族氨基酸的M63培养基上生长。 
将转染的细胞涂布于含有50μg/ml卡那霉素的M63琼脂培养基上。M63琼脂培养基含有100mM KH2PO4、15mM(NH4)2SO4、50μM CaCl2、1μM FeSO4、50μM MgCl2、55mM葡萄糖、25mg/升L-脯氨酸、10mg/升硫胺素HCl、用于调节pH至7.0的足够的NaOH,以及15g/升琼脂。鉴定了生长在该培养基上的5种菌落。从这些菌落的每个制备粘粒DNA并将其再转化进大肠杆菌aroA-细胞。在每种情况中,用粘粒DNA再转化的细胞可在有0或10mM草甘膦存在的M6 3培养基上生长,而含有空的SuperCos载体的细胞不能在M63培养基上生长。这证实了,所述的粘粒能够补充aroA-表型并且能够赋予草甘膦抗性。选择一种粘粒用于进一步鉴定,并且命名为pAX305。
实施例16.粘粒pAX305中的grg15的鉴定
为了鉴定负责粘粒pAX305显示的草甘膦-抗性的基因,将该克隆的DNA用转座因子进行诱变处理。用EZ::TN Insertion Kit(Epicentre,Madison,WI)和生产商提供的方法,让粘粒pAX305接受体外转座子诱变。将pAX305的转座子***克隆转化进大肠杆菌中,并将其涂布于含有草甘膦的M63培养基上。发现多个克隆已丧失了在存在草甘膦时生长的能力,这说明转座子已破坏了负责抗性的基因。 
使用本领域熟知的测序方法,测定含有转座子***物的pAX305区域的DNA序列,并表示为SEQ ID NO:61。确定了一个开放阅读框(ORF,SEQ ID NO:61的核苷酸碱基77到1354)。来自已丧失草甘膦抗性的8个转座子***克隆的序列数据分析显示,它们都存在于该ORF内。这说明该ORF编码了粘粒赋予的草甘膦抗性。将该基因命名为grg15。含有grg15ORF(SEQ ID NO:11)的粘粒pAX305于2004年4月20日保藏于农业研究机构保藏中心(Agricultural Research ServiceCulture Collection(NRRL))中,并分配保藏号为NRRL B-30838。 
实施例17.GRG15与其它蛋白质的同源性
GRG15与EPSP合酶具有同源性。GRG15氨基酸序列(SEQ ID NO:12)与其它EPSP合酶的氨基酸序列的比对在图1中显示。表5列出了GRG15与多种EPSP合酶的百分比同一性。对氨基酸序列(SEQ ID NO:12)的分析表明,其不含有代表II型EPSP合酶的4个结构域。因此,它是一种新的、非-II型抗草甘膦EPSP合酶。 
表5.GRG15与其它EPSP合酶的氨基酸同一性 
Figure 200680016320XA00800051
实施例18.抗草甘膦的非-II型酶(III型)之间的同源区段(Homology Block)
GRG蛋白质(非-II型抗草甘膦蛋白质)的氨基酸序列的比较显示,GRG蛋白质相互具有显著的同源性,并且不同于先前确定的抗草甘膦EPSP合酶(参见图1)。 
实施例19:保守结构域的鉴定
分析了7种已知的EPSP合酶的氨基酸序列的中不存在于I型或II型EPSP合酶中的保守结构域。在这些EPSP合酶中发现了下列结构域:下划线表示仅在该类型中存在的保守残基,而斜体字表示所有EPSPS酶中保守的残基。 
结构域I: 
L-A-K-G-X1-S-X2-L-X3-G-A-L-K-S-D-D-T(SEQ ID NO:13),其中X1表示赖氨酸或苏氨酸,其中X2表示精氨酸或组氨酸,其中X3表示丝氨酸或苏氨酸。 
结构域Ia: 
L-A-K-G-X1(SEQ ID No:14),其中X1表示赖氨酸或苏氨酸。 
结构域Ib: 
S-X1-L-X2(SEQ ID NO:15),其中X1表示精氨酸或组氨酸,其中X2表示丝氨酸或苏氨酸。 
结构域Ic: 
G-A-L-K-S-D-D-T(SEQ ID NO:16) 
结构域II: 
E-P-D-X1-X2-T-F-X3-V-X4-X5-X6-G(SEQ ID NO:17),其中X1表示天冬氨酸或丙氨酸,其中X2表示丝氨酸或苏氨酸,其中X3表示缬氨酸或异亮氨酸,其中X4表示苏氨酸或谷氨酸或赖氨酸,其中X5表示丝氨酸或甘氨酸,其中X6表示谷氨酰胺或丝氨酸或谷氨酸或苏氨酸。 
结构域IIa: 
E-P-D-X1-X2-T-F-X3-V(SEQ ID NO:18),其中X1表示天冬氨酸或丙氨酸,其中X2表示丝氨酸或苏氨酸,其中X3表示缬氨酸或异亮氨酸。 
结构域IIb: 
X1-X2-X3-G(SEQ ID NO:19),其中X1表示苏氨酸或谷氨酸或赖氨酸,其中X2表示丝氨酸或甘氨酸,其中X3表示谷氨酰胺或丝氨酸或谷 氨酸或苏氨酸。 
结构域III: 
RFLTAA(SEQ ID NO:20) 
结构域IV: 
KRPI(G/M)P(SEQ ID NO:21) 
K-R-P-I-X1-P,其中X1表示甘氨酸或甲硫氨酸或亮氨酸。 
结构域V: 
X1-G-C-P-P-V(SEQ ID NO:22),其中X1表示苏氨酸或丝氨酸。 
结构域VI: 
I-G-A-X1-G-Y-X2-D-L-T(SEQ ID NO:23),其中X1表示精氨酸或赖氨酸或亮氨酸,并且其中X2表示异亮氨酸或缬氨酸。 
结构域VII: 
W-X1-V-X2-X3-T-G(SEQ ID NO:24),其中X1表示精氨酸或赖氨酸,其中X2表示丙氨酸或组氨酸或谷氨酸或丝氨酸,其中X3表示脯氨酸或丙氨酸。 
结构域VIII: 
E-P-D-A-S-A-A-T-Y-L-W-X1-A-X2-X3-L(SEQ ID NO:25),其中X1表示丙氨酸或甘氨酸,其中X2表示谷氨酸或谷氨酰胺,其中X3表示缬氨酸或亮氨酸或丙氨酸。 
结构域VIIIa: 
E-P-D-A-S-A-A-T-Y-L-W(SEQ ID NO:26) 
结构域IX: 
I-D-X1-G(SEQ ID NO:27),其中X1表示异亮氨酸或亮氨酸。 
结构域X: 
F-X1-Q-P-D-A-K-A(SEQ ID NO:28),其中X1表示苏氨酸或丝氨酸, 
结构域XI: 
X1-F-P-X2-X3-X4-A-X5-X6-X7-G-S-Q-M-Q-D-A-I-P-T-X8-A-V-X9 A-A-F-N(SEQ ID NO:29),其中X1表示谷氨酰胺或赖氨酸或丝氨酸,其中X2表示天冬酰胺或组氨酸,其中X3表示甲硫氨酸或亮氨酸,其中X4表示脯氨酸或谷氨酰胺,其中X5表示苏氨酸或谷氨酸或缬氨酸,其中X6表示缬氨酸或异亮氨酸,其中X7表示天冬氨酸或缬氨酸,其中X8 表示亮氨酸或异亮氨酸,其中X9表示亮氨酸或异亮氨酸。 
结构域XIa: 
X1-F-P-X2-X3-X4-A(SEQ ID NO:30),其中X1表示谷氨酰胺或赖氨酸或丝氨酸,其中X2表示天冬酰胺或组氨酸,其中X3表示甲硫氨酸或亮氨酸,其中X4表示脯氨酸或谷氨酰胺。 
结构域XIb: 
X1-X2-X3-G-S-Q-M-Q-D-A-I-P-T-X4-A-V-X5A-A-F-N(SEQ IDNO:31),其中X1表示苏氨酸或谷氨酸或缬氨酸,其中X2指缬氨酸或异亮氨酸,其中X3指天冬氨酸或缬氨酸,其中X4指亮氨酸或异亮氨酸,其中X5指亮氨酸或异亮氨酸。 
结构域XIc: 
G-S-Q-M-Q-D-A-I-P-T(SEQ ID NO:32) 
结构域XII: 
P-V-R-F-X1-X2-X3-X4-N-L-R-V-K-E-C-D-R-X5(SEQ ID NO:33),其中X1表示缬氨酸或苏氨酸,其中X2表示谷氨酸或甘氨酸,其中X3表示亮氨酸或异亮氨酸,其中X4表示丙氨酸或谷氨酸,其中X5表示异亮氨酸或缬氨酸。 
结构域XIIa: 
P-V-R-F(SEQ ID NO:34) 
结构域XIIb: 
X1-X2-X3-X4-N-L-R-V-K-E-C-D-R-X5(SEQ ID NO:35),其中X1表示缬氨酸或苏氨酸,其中X2表示谷氨酸或甘氨酸,其中X3表示亮氨酸或异亮氨酸,其中X4表示丙氨酸或谷氨酸,其中X5表示异亮氨酸或缬氨酸。 
结构域XIIc: 
N-L-R-V-K-E-C-D-R(SEQ ID NO:36) 
结构域XIII: 
E-G-D-D-L-X1-X2(SEQ ID NO:37),其中X1表示亮氨酸或异亮氨酸,其中X2表示缬氨酸或异亮氨酸。 
结构域XIV: 
X1-P-X2-L-A-G(SEQ ID NO:38),其中X1表示天冬氨酸或天冬酰胺,其中X2表示丙氨酸或丝氨酸或苏氨酸。 
结构域XV: 
A-X1-I-D-X2-X3-X4-D-H-R(SEQ ID NO:39),其中X1表示亮氨酸或丝氨酸或谷氨酸,其中X2表示苏氨酸或丝氨酸,其中X3表示组氨酸 或苯丙氨酸,其中X4表示丙氨酸或丝氨酸。 
结构域XVI: 
F-A-L-A-X1-L-K-X2-X3-G-I(SEQ ID NO:40),其中X1表示甘氨酸或丙氨酸,其中X2表示异亮氨酸或缬氨酸,其中X3表示丝氨酸或甘氨酸或丙氨酸或赖氨酸。 
结构域XVIa: 
F-A-L-A-X1-L-K(SEQ ID NO:41),其中X1表示甘氨酸或丙氨酸。 
结构域XVIb: 
L-K-X1-X2-G-I(SEQ ID NO:42),其中X1表示异亮氨酸或缬氨酸,其中X2表示丝氨酸或甘氨酸或丙氨酸或赖氨酸。 
结构域XVII: 
-X1-P-X2-C-V-X3-K(SEQ ID NO:43),其中X1表示天冬酰胺或天冬氨酸,其中X2表示丙氨酸或天冬氨酸,其中X3表示丙氨酸或甘氨酸。 
结构域XVIII: 
X1-S-L-G-V(SEQ ID NO:44),其中X1表示丙氨酸或丝氨酸或脯氨酸。 
实施例20.对grg12进行基因工程改造用于植物转化
通过PCR从全长的cDNA模板扩增grg12开放阅读框(ORF)。在PCR过程中,将Hind III限制性位点加入至ORF的每个末端。另外,将核苷酸序列ACC加至紧挨基因的起始密码子的5′,以增强翻译效率(Kozak(1987)Nucleic Acids Research 15:8125-8148;Joshi(1987)Nucleic Acids Research 15:6643-6653)。采用本领域熟知的技术将PCR产物克隆并测序,以确保在PCR过程中未引入突变。 
将含有grg12 PCR产物的质粒用例如HindIII消化,并分离出含有完整的ORF的片段。在该实施例中,将所述片段克隆进质粒,例如pAX200的Hind III位点,所述pAX200质粒是含有水稻肌动蛋白启动子(McElroy等,(1991)Molec.Gen.Genet.231:150-160),以及Pin II终止子(An等,(1989)The Plant Cell 1:115-122)的植物表达载体。然后,将来自该中间质粒的启动子-基因-终止子片段亚克隆进质粒例如pSB11(Japan Tobacco公司)中,形成最终的质粒,在此称为pSB11GRG12。pSB11GRG12经组织而使得含有所述的启动子-grg12-终止子构建体的DNA片段可通过合适的限制性内切酶切离,并也可用于例如通过空气束注射(aerosol beam injection)转化进植物中。pSB11GRG12的结构通过限制酶切消化和凝胶电泳,以及通过跨越多个克隆连接部位的测序来核实。 
采用本领域熟知的三亲杂交方法(triparental matingprocedure),将该质粒导入还含有质粒pSB1(Japan Tobacco公司)的根瘤农杆菌菌株LBA4404中,并涂布于含有抗生素的培养基上。质粒pSB11GRG12携带有奇霉素抗性,但却是一种窄宿主范围的质粒并且不能够在农杆菌中复制。当pSB11GRG12通过同源重组整合进宽宿主范围的质粒pSB1中时,产生了抗生素抗性菌落。得到的共整合体(cointegrate)产物通过DNA杂交校验。含有该共整合体的农杆菌菌株可用于例如通过PureIntro方法(Japan Tobacco)转化玉米。 
实施例21.grg12转化进植物细胞中
玉米穗最好在授粉8-12天后收集。从玉米穗中分离出胚,并且将那些0.8-1.5mm大小的胚优选用于转化。将胚盾片侧朝上涂布于合适的孵育培养基,例如DN62A5S培养基(3.98g/LN6盐、1mL/L(1000×储液)N6维生素、800mg/L L-天冬酰胺、100mg/L Myo-肌醇、1.4g/L L-脯氨酸、100mg/L酪蛋白氨基酸、50g/L蔗糖、1mL/L(1mg/mL储液)2,4-D)上。然而,除了DN62A5S的培养基和盐也是合适的,并且是本领域所知的。将胚在25℃下于黑暗中孵育过夜。然而,在本 质上是不必将胚孵育过夜的。 
将得到的外植体转移至网状方格(每平板30-40个)中,转移至渗透培养基(osmotic media)上约30-45分钟,然后转移至束流平板(beaming plate)上(参见,例如PCT出版物No.WO/0138514和美国专利No.5,240,842)。 
使用基本上如PCT出版物No.WO/0138514中描述的条件,用空气束加速器将设计用于在植物细胞中表达GRG12的DNA构建体加速进入植物组织中。之后,将胚在渗透培养基中孵育约30分钟,并在25℃下于黑暗中置于孵育培养基中过夜。为了避免不当破坏被加速器处理过的外植体,将它们在转移至恢复培养基之前孵育至少24小时。然后,将胚分散到恢复阶段培养基中,约5天,25℃于黑暗中,随后转移至选择培养基。将外植体在选择培养基中孵育达到8周,这取决于所采用的特定选择的性质和特征。在选择阶段后,将得到的愈伤组织转移至胚成熟培养基中,直到观察到成熟的体细胞胚形成。随后,将得到的成熟的体细胞胚置于低光照下,并且通过本领域熟知的方法起始再生过程。让得到的小苗在生根培养基中生根,并且将得到的植物转移至苗圃罐中并繁殖为转基因植物。 
材料 
表6.DN6 2A5S培养基 
Figure 200680016320XA00800061
用1N KOH/1N KCl将溶液的pH调节至pH 5.8,加入浓度达到3g/L 的Gelrite(Sigma),并将培养基进行高压灭菌处理。在冷却至50℃后,加入2ml/L的5mg/ml硝酸银储液(Phytotechnology Labs)。 
实施例22.通过农杆菌-介导的转化将grg12转化进玉米植物细胞中
穗最好在授粉8-12天后收集。从玉米穗中分离出胚,并且将那些0.8-1.5mm大小的胚优选用于转化。将胚盾片侧朝上涂布于合适的孵育培养基上,并在25℃下于黑暗中孵育过夜。然而,在本质上是不必将胚孵育过夜的。将胚与农杆菌菌株接触约5-10分钟,所述农杆菌菌株含有用于Ti质粒介导的转移的合适载体,并随后涂布于共培养培养基上约3天(在25℃下于黑暗中)。在共同培养后,将外植体转移至恢复阶段培养基中约5天(在25℃下于黑暗中)。将外植体在选择培养基中孵育达到8周,这取决于所采用的特定选择的性质和特征。在选择阶段后,将得到的愈伤组织转移至胚成熟培养基中,直到观察到成熟的体细胞胚形成。随后,将得到的成熟的体细胞胚置于低光照下,并且通过本领域熟知的方法起始再生过程。 
让得到的小苗在生根培养基中生根,并且将得到的植物转移至苗圃罐中并繁殖为转基因植物。 
在本说明书中提及的所有出版物和专利申请案表现了本发明所属领域的那些技术人员的技术水平。所有出版物和专利申请在此以相同的程度引入作为参考,就如同每一出版物或专利申请被明确和单独地引入作为参考一样。 
尽管为了理解的清楚已经通过说明和实施例的方式相当详细地描述了前述的发明,但是显然可以做出某些改变和修饰而不脱离所附的权利要求的范围。 
序列表
<110>Carozzi,Nadine
Carr,Brian
Hammer,Philip E.
<120>一类新型EPSP合酶的鉴定
<130>045600/310289
<150>60/669,686
<151>2005-04-08
<150>60/678,348
<151>2005-05-06
<150>60/695,193
<151>2005-06-29
<150>60/725,182
<151>2005-10-11
<160>68
<170>FastSEQ for Windows Version 4.0
<210>1
<211>1257
<212>DNA
<213>丁香假单胞菌
<220>
<221>CDS
<222>(1)...(1257)
<221>misc feature
<222>(0)...(0)
<223>菌株DC3000EPSPS基因
<400>1
atg cga cct caa gcc act ctc act gtt atg cct gtc gag cgc ccg ctg  48
Met Arg Pro Gln Ala Thr Leu Thr Val Met Pro Val Glu Arg Pro Leu
 1               5                   10                  15
gtc ggg cgc gtc agc ccg ccg ggc tcc aag tcg atc acc aac cgc gca     96
Val Gly Arg Val Ser Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala
             20                  25                  30
ctg ctg ctg gcg ggg ctt gcc aaa ggc acc agc cgc ctg acc ggc gcg    144
Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala
         35                  40                  45
ctg aag agt gac gat acc cgt gtg atg tcc gaa gca ctg cga ctg atg    192
Leu Lys Ser Asp Asp Thr Arg Val Met Ser Glu Ala Leu Arg Leu Met
     50                  55                  60
ggc gtg cag gtc gac gag ccg gat gac agc acc ttt gtg gtc acc agc    240
Gly Val Gln Val Asp Glu Pro Asp Asp Ser Thr Phe Val Val Thr Ser
 65                  70                  75                  80
agc ggc cac tgg caa gcg ccg cag caa gcg ctg ttt ctc ggc aac gcc    288
Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala
                 85                  90                  95
ggg acc gcg acg cgc ttt ctg acc gct gcg ctg gcc aac ttt gaa ggc    336
Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly
            100                 105                 110
gac ttc gtg gtg gat ggc gac gag tac atg cgt aaa cgc ccg atc ggc    384
Asp Phe Val Val Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro Ile Gly
        115                 120                 125
ccg ctg gtc gat gcc ttg cag cgc atg ggc gtg gaa atc agc gcg ccc    432
Pro Leu Val Asp Ala Leu Gln Arg Met Gly Val Glu Ile Ser Ala Pro
    130                 135                 140
agc ggt tgc ccg ccc gtg gcg atc aag ggc aag ggc ggt ctg caa gcc    480
Ser Gly Cys Pro Pro Val Ala Ile Lys Gly Lys Gly Gly Leu Gln Ala
145                 150                 155                 160
ggg cgt att gaa atc gac ggc aac ctg tcc agc cag tac gta tcg gcg    528
Gly Arg Ile Glu Ile Asp Gly Asn Leu Ser Ser Gln Tyr Val Ser Ala
                165                 170                 175
ctg ctg atg gcc gga gcg tgt ggc aaa ggc tcg ctt gaa gtt gct ctg    576
Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Ser Leu Glu Val Ala Leu
            l80                 185                 190
acc ggt agc gag atc ggc gca cgc ggc tat gtc gac ctg acc ctg gcg     624
Thr Gly Ser Glu Ile Gly Ala Arg Gly Tyr Val Asp Leu Thr Leu Ala
        195                 200                 205
gcg atg cag gcc ttc ggc gct gaa gtt cag gcc atc ggc gac gct gcc     672
Ala Met Gln Ala Phe Gly Ala Glu Val Gln Ala Ile Gly Asp Ala Ala
    210                 215                 220
tgg aaa gtc tcg gcc acc ggc tac cac gct acg gat ttc cac atc gag     720
Trp Lys Val Ser Ala Thr Gly Tyr His Ala Thr Asp Phe His Ile Glu
225                 230                 235                 240
ccg gat gca tcg gca gcc acc tac ctc tgg gcc gca caa gcc ctg acc     768
Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr
                245                 250                 255
gaa ggc aac atc gac ctg ggc gtg gcc agt gat gca ttc act cag cct     816
Glu Gly Asn Ile Asp Leu Gly Val Ala Ser Asp Ala Phe Thr Gln Pro
            260                 265                 270
gac gcg ctg gcc agc cag atc atc gac agc ttc ccg aac atg ccg gcg     864
Asp Ala Leu Ala Ser Gln Ile Ile Asp Ser Phe Pro Asn Met Pro Ala
        275                 280                 285
gtg atc gac ggt tcg caa atg cag gac gcc att ccg acc ctc gca gtg     912
Val Ile Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val
    290                 295                 300
ctc gcg gcc ttc aat cgt cag ccg gta cgc ttc gtc ggc atc gcc aac     960
Leu Ala Ala Phe Asn Arg Gln Pro Val Arg Phe Val Gly Ile Ala Asn
305                 310                 315                 320
ctg cgg gtc aag gaa tgt gat cgt att tca gcg ctg tgt gac ggc ctg    1008
Leu Arg Val Lys Glu Cys Asp Arg Ile Ser Ala Leu Cys Asp Gly Leu
                325                 330                 335
tgc gcc atc gca ccg ggc ctt gcg gtt gaa gag ggc gac gac ctg atc    1056
Cys Ala Ile Ala Pro Gly Leu Ala Val Glu Glu Gly Asp Asp Leu Ile
            340                 345                 350
gtg cac gcc aac ccg gcg ctg gca ggg acc aca gtc aac gca ctg atc    1104
Val His Ala Asn Pro Ala Leu Ala Gly Thr Thr Val Asn Ala Leu Ile
        355                 360                 365
gac acc cat tcc gac cat cgc atc gcc atg tgc ttt gcc ctg gct ggt  1152
Asp Thr His Ser Asp His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly
    370                 375                 380
ttg aag atc aaa ggc atc cat att cag gat ccc gat tgc gtc gcc aag  1200
Leu Lys Ile Lys Gly Ile His Ile Gln Asp Pro Asp Cys Val Ala Lys
385                 390                 395                 400
acc tat ccg ggt tac tgg gat gcg ctg gct tcg ctg ggg gtg agt gtt  1248
Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Ala Ser Leu Gly Val Ser Val
                405                 410                 415
cag cgc tga                                                      1257
Gln Arg *
<210>2
<211>418
<212>PRT
<213>丁香假单胞菌
<400>2
Met Arg Pro Gln Ala Thr Leu Thr Val Met Pro Val Glu Arg Pro Leu
 1               5                  10                  15
Val Gly Arg Val Ser Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala
            20                  25                  30
Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala
        35                  40                  45
Leu Lys Ser Asp Asp Thr Arg Val Met Ser Glu Ala Leu Arg Leu Met
    50                  55                  60
Gly Val Gln Val Asp Glu Pro Asp Asp Ser Thr Phe Val Val Thr Ser
65                  70                  75                  80
Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala
                85                  90                  95
Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly
            100                 105                 110
Asp Phe Val Val Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro Ile Gly
        115                 120                 125
Pro Leu Val Asp Ala Leu Gln Arg Met Gly Val Glu Ile Ser Ala Pro
    130                 135                 140
Ser Gly Cys Pro Pro Val Ala Ile Lys Gly Lys Gly Gly Leu Gln Ala
145                 150                 155                 160
Gly Arg Ile Glu Ile Asp Gly Asn Leu Ser Ser Gln Tyr Val Ser Ala
                165                 170                 175
Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Ser Leu Glu Val Ala Leu
            180                 185                 190
Thr Gly Ser Glu Ile Gly Ala Arg Gly Tyr Val Asp Leu Thr Leu Ala
        195                 200                 205
Ala Met Gln Ala Phe Gly Ala Glu Val Gln Ala Ile Gly Asp Ala Ala
    210                 215                 220
Trp Lys Val Ser Ala Thr Gly Tyr His Ala Thr Asp Phe His Ile Glu
225                 230                 235                 240
Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr
                245                 250                 255
Glu Gly Asn Ile Asp Leu Gly Val Ala Ser Asp Ala Phe Thr Gln Pro
            260                 265                 270
Asp Ala Leu Ala Ser Gln Ile Ile Asp Ser Phe Pro Asn Met Pro Ala
        275                 280                 285
Val Ile Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val
    290                 295                 300
Leu Ala Ala Phe Asn Arg Gln Pro Val Arg Phe Val Gly Ile Ala Asn
305                 310                 315                 320
Leu Arg Val Lys Glu Cys Asp Arg Ile Ser Ala Leu Cys Asp Gly Leu
                325                 330                 335
Cys Ala Ile Ala Pro Gly Leu Ala Val Glu Glu Gly Asp Asp Leu Ile
            340                 345                 350
Val His Ala Asn Pro Ala Leu Ala Gly Thr Thr Val Asn Ala Leu Ile
        355                 360                 365
Asp Thr His Ser Asp His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly
    370                 375                 380
Leu Lys Ile Lys Gly Ile His Ile Gln Asp Pro Asp Cys Val Ala Lys
385                 390                 395                 400
Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Ala Ser Leu Gly Val Ser Val
                405                 410                 415
Gln Arg
<210>3
<211>1278
<212>DNA
<213>根瘤农杆菌
<220>
<221>CDS
<222>(1)...(1278)
<22l>misc feature
<222>(0)...(0)
<223>菌株C58EPSPS
<400>3
atg atc gaa ctg acc atc acc ccg ccc ggc cac ccg ctt tcc ggc aag   48
Met Ile Glu Leu Thr Ile Thr Pro Pro Gly His Pro Leu Ser Gly Lys
 1               5                   10                  15
gtg gag ccg ccc ggc tcc aaa tcc atc acc aac cgc gcg ctt ctc ttg   96
Val Glu Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu
             20                  25                  30
gcc ggc ctc gcc aag ggc aaa agc cac ttg tca ggc gcc ctg aaa agc  144
Ala Gly Leu Ala Lys Gly Lys Ser His Leu Ser Gly Ala Leu Lys Ser
         35                  40                  45
gac gat acg ctt tat atg gcc gaa gct ctg cgg gag atg ggc gtg aag  192
Asp Asp Thr Leu Tyr Met Ala Glu Ala Leu Arg Glu Met Gly Val Lys
     50                  55                  60
gtc acc gag cct gac gcc acc acc ttc gtg gtg gag gga acg ggc gtg  240
Val Thr Glu Pro Asp Ala Thr Thr Phe Val Val Glu Gly Thr Gly Val
65                  70                  75                  80
ctg cag cag ccg gaa aag ccg ctg ttc ctc ggc aat gcc ggc acc gcc  288
Leu Gln Gln Pro Glu Lys Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala
                 85                  90                  95
acg cgg ttc ctg act gcc gcc ggg gca ctt gtc gat ggc gcc gtc atc  336
Thr Arg Phe Leu Thr Ala Ala Gly Ala Leu Val Asp Gly Ala Val Ile
            100                 105                 110
atc gat ggg gac gaa cat atg cgc aaa cgc ccg ata ctg ccg ctg gtg  384
Ile Asp Gly Asp Glu His Met Arg Lys Arg Pro Ile Leu Pro Leu Val
        115                 120                 125
cag gcg ctg cgg gct ctc ggc gtg gaa gcg gat gcg cca acc ggc tgc  432
Gln Ala Leu Arg Ala Leu Gly Val Glu Ala Asp Ala Pro Thr Gly Cys
    130                 135                 140
ccg cct gtc acc gtc cgt ggc aag ggt atg ggt ttt cca aag ggc agc  480
Pro Pro Val Thr Val Arg Gly Lys Gly Met Gly Phe Pro Lys Gly Ser
145                 150                 155                 160
gtc acc atc gac gcc aat ctc tcc agc cag tat gtg tcg gca ctg ttg    528
Val Thr Ile Asp Ala Asn Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu
                165                 170                 175
atg gcc gcc gcc tgc ggt gac aag ccc gtg gat atc atc ctg aag ggt    576
Met Ala Ala Ala Cys Gly Asp Lys Pro Val Asp Ile Ile Leu Lys Gly
            180                 185                 190
gag gaa atc ggc gcg aag ggc tat atc gac ctc acc aca tcc gcc atg    624
Glu Glu Ile Gly Ala Lys Gly Tyr Ile Asp Leu Thr Thr Ser Ala Met
        195                 200                 205
gaa gcc ttc gga gcg aag gtg gag cgg gtc agc aac gcc atc tgg cgc    672
Glu Ala Phe Gly Ala Lys Val Glu Arg Val Ser Asn Ala Ile Trp Arg
    210                 215                 220
gtg cat ccg acc ggt tac acg gca acc gat ttc cac atc gag ccg gat    720
Val His Pro Thr Gly Tyr Thr Ala Thr Asp Phe His Ile Glu Pro Asp
225                 230                 235                 240
gcc tcc gcc gcc acc tat ctc tgg ggc gcg gag ctt ctg acc ggc ggt    768
Ala Ser Ala Ala Thr Tyr Leu Trp Gly Ala Glu Leu Leu Thr Gly Gly
                245                 250                 255
gct atc gat atc ggc acg ccc gct gac aaa ttc act cag ccg gat gcc    816
Ala Ile Asp Ile Gly Thr Pro Ala Asp Lys Phe Thr Gln Pro Asp Ala
            260                 265                 270
aag gct tat gag gtc atg gcg cag ttt ccg cat ctg ccc gcc gaa atc    864
Lys Ala Tyr Glu Val Met Ala Gln Phe Pro His Leu Pro Ala Glu Ile
        275                 280                 285
gac ggt tcg cag atg cag gac gcc att cca acc atc gcg gtt atc gcc    912
Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Ile Ala Val Ile Ala
    290                 295                 300
gcc ttc aac gag acg ccg gtg cgt ttc gtc ggc atc gcc aat ctg cgc    960
Ala Phe Asn Glu Thr Pro Val Arg Phe Val Gly Ile Ala Asn Leu Arg
305                 310                 315                 320
gtc aag gaa tgc gac cgc atc cgc gcc gtc tcg ctc ggc ctc aac gaa   1008
Val Lys Glu Cys Asp Arg Ile Arg Ala Val Ser Leu Gly Leu Asn Glu
                325                 330                 335
atc cgc gag ggt ctg gcg cat gaa gag ggt gac gac ctg atc gta cat  1056
Ile Arg Glu Gly Leu Ala His Glu Glu Gly Asp Asp Leu Ile Val His
            340                 345                 350
gcc gat ccg tcg ctc gcc ggg cag acg gtc gat gcc tcc atc gat acc  1104
Ala Asp Pro Ser Leu Ala Gly Gln Thr Val Asp Ala Ser Ile Asp Thr
        355                 360                 365
ttt gcc gat cac cgc atc gcc atg agt ttt gca ctg gcg gcg ctc aag  1152
Phe Ala Asp His Arg Ile Ala Met Ser Phe Ala Leu Ala Ala Leu Lys
    370                 375                 380
atc gga ggc atc gcc atc cag aat ccc gcc tgc gtg gcc aag acc tat  1200
Ile Gly Gly IIe Ala Ile Gln Asn Pro Ala Cys Val Ala Lys Thr Tyr
385                 390                 395                 400
ccg ggc tac tgg aaa gcg ctt gcc tcg ctc ggc gtc gac tat acc gaa  1248
Pro Gly Tyr Trp Lys Ala Leu Ala Ser Leu Gly Val Asp Tyr Thr Glu
                405                 410                 415
aag gaa agc gct gcc gag ccg cag cac tga                          1278
Lys Glu Ser Ala Ala Glu Pro Gln His *
            420                 425
<210>4
<211>425
<212>PRT
<213>根瘤农杆菌
<400>4
Met Ile Glu Leu Thr Ile Thr Pro Pro Gly His Pro Leu Ser Gly Lys
 1               5                  10                  15
Val Glu Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu
            20                  25                  30
Ala Gly Leu Ala Lys Gly Lys Ser His Leu Ser Gly Ala Leu Lys Ser
        35                  40                  45
Asp Asp Thr Leu Tyr Met Ala Glu Ala Leu Arg Glu Met Gly Val Lys
    50                  55                  60
Val Thr Glu Pro Asp Ala Thr Thr Phe Val Val Glu Gly Thr Gly Val
65                  70                  75                  80
Leu Gln Gln Pro Glu Lys Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala
                85                  90                  95
Thr Arg Phe Leu Thr Ala Ala Gly Ala Leu Val Asp Gly Ala Val Ile
            100                 105                 110
Ile Asp Gly Asp Glu His Met Arg Lys Arg Pro Ile Leu Pro Leu Val
        115                 120                 125
Gln Ala Leu Arg Ala Leu Gly Val Glu Ala Asp Ala Pro Thr Gly Cys
    130                 135                 140
Pro Pro Val Thr Val Arg Gly Lys Gly Met Gly Phe Pro Lys Gly Ser
145                 150                 155                 160
Val Thr Ile Asp Ala Asn Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu
                165                 170                 175
Met Ala Ala Ala Cys Gly Asp Lys Pro Val Asp Ile Ile Leu Lys Gly
            180                 185                 190
Glu Glu Ile Gly Ala Lys Gly Tyr Ile Asp Leu Thr Thr Ser Ala Met
        195                 200                 205
Glu Ala Phe Gly Ala Lys Val Glu Arg Val Ser Asn Ala Ile Trp Arg
    210                 215                 220
Val His Pro Thr Gly Tyr Thr Ala Thr Asp Phe His Ile Glu Pro Asp
225                 230                 235                 240
Ala Ser Ala Ala Thr Tyr Leu Trp Gly Ala Glu Leu Leu Thr Gly Gly
                245                 250                 255
Ala Ile Asp Ile Gly Thr Pro Ala Asp Lys Phe Thr Gln Pro Asp Ala
            260                 265                 270
Lys Ala Tyr Glu Val Met Ala Gln Phe Pro His Leu Pro Ala Glu Ile
        275                 280                 285
Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Ile Ala Val Ile Ala
    290                 295                 300
Ala Phe Asn Glu Thr Pro Val Arg Phe Val Gly Ile Ala Asn Leu Arg
305                 310                 315                 320
Val Lys Glu Cys Asp Arg Ile Arg Ala Val Ser Leu Gly Leu Asn Glu
                325                 330                 335
Ile Arg Glu Gly Leu Ala His Glu Glu Gly Asp Asp Leu Ile Val His
            340                 345                 350
Ala Asp Pro Ser Leu Ala Gly Gln Thr Val Asp Ala Ser Ile Asp Thr
        355                 360                 365
Phe Ala Asp His Arg Ile Ala Met Ser Phe Ala Leu Ala Ala Leu Lys
    370                 375                 380
Ile Gly Gly Ile Ala Ile Gln Asn Pro Ala Cys Val Ala Lys Thr Tyr
385                 390                 395                 400
Pro Gly Tyr Trp Lys Ala Leu Ala Ser Leu Gly Val Asp Tyr Thr Glu
                405                 410                 415
Lys Glu Ser Ala Ala Glu Pro Gln His
            420                 425
<210>5
<211>1398
<212>DNA
<213>Enterobacteriaceae
<220>
<221>CDS
<222>(103)...(1398)
<400>5
aaaaaaggaa atgaactatg tgttgctgga aaaagtaggg aagggagtgg tgaagagtat     60
tccactggtt caattagaaa aaatcattca aggattacca aa gtg aaa gta aca       114
                                               Val Lys Val Thr
                                                1
ata cag ccc gga gat ctg act gga att atc cag tca ccc gct tca aaa      162
Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser Pro Ala Ser Lys
5                    10                  15                  20
agt tcg atg cag cga gct tgt gct gct gca ctg gtt gca aaa gga ata      210
Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile
                 25                  30                  35
agt gag atc att aat ccc ggt cat agc aat gat gat aaa gct gcc agg      258
Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg
             40                  45                  50
gat att gta agc cgg ctt ggt gcc agg ctt gaa gat cag cct gat ggt      306
Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly
         55                  60                  65
tct ttg cag ata aca agt gaa ggc gta aaa cct gtc gct cct ttt att      354
Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile
     70                  75                  80
gac tgc ggt gaa tct ggt tta agt atc cgg atg ttt act ccg att gtt      402
Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val
 85                  90                  95                 100
gcg ttg agt aaa gaa gag gtg acg atc aaa gga tct gga agc ctt gtt      450
Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val
                105                 110                 115
aca aga cca atg gat ttc ttt gat gaa att ctt ccg cat ctc ggt gta    498
Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val
            120                 125                 130
aaa gtt aaa tct aac cag ggt aaa ttg cct ctc gtt ata cag ggg cca    546
Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro
        135                 140                 145
ttg aaa cca gca gac gtt acg gtt gat ggg tcc tta agc tct cag ttc    594
Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe
    150                 155                 160
ctt aca ggt ttg ttg ctt gca tat gcg gcc gca gat gca agc gat gtt    642
Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val
165                 170                 175                 180
gcg ata aaa gta acg aat ctc aaa agc cgt ccg tat atc gat ctt aca    690
Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr
                185                 190                 195
ctg gat gtg atg aag cgg ttt ggt ttg aag act ccc gag aat cga aac    738
Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn
            200                 205                 210
tat gaa gag ttt tat ttc aaa gcc ggg aat gta tat gat gaa acg aaa    786
Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys
        215                 220                 225
atg caa cga tac acc gta gaa ggc gac tgg agc ggt ggt gct ttt tta    834
Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu
    230                 235                 240
ctg gta gcg ggg gct att gcc ggg ccg atc acg gta aga ggt ttg gat    882
Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp
245                 250                 255                 260
ata gct tcg acg cag gct gat aaa gcg atc gtt cag gct ttg atg agt    930
Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser
                265                 270                 275
gcg aac gca ggt att gcg att gat gca aaa gag atc aaa ctt cat cct    978
Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro
            280                 285                 290
gct gat ctc aat gca ttt gaa ttt gat gct act gat tgc ccg gat ctt    1026
Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu
        295                 300                 305
ttt ccg cca ttg gtt gct ttg gcg tct tat tgc aaa gga gaa aca aag    1074
Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys
    310                 315                 320
atc aaa ggc gta agc agg ctg gcg cat aaa gaa agt gac aga gga ttg    1122
Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu
325                 330                 335                 340
acg ctg cag gac gag ttc ggg aaa atg ggt gtt gaa atc cac ctt gag    1170
Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu Ile His Leu Glu
                345                 350                 355
gga gat ctg atg cgc gtg atc gga ggg aaa ggc gta aaa gga gct gaa    1218
Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu
            360                 365                 370
gtt agt tca agg cac gat cat cgc att gcg atg gct tgc gcg gtg gct    1266
Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala Cys Ala Val Ala
        375                 380                 385
gct tta aaa gct gtg ggt gaa aca acc atc gaa cat gca gaa gcg gtg    1314
Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val
    390                 395                 400
aat aaa tcc tac ccg gat ttt tac agc gat ctt aaa caa ctt ggc ggt    1362
Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly
405                 410                 415                 420
gtt gta tct tta aac cat caa ttt aat ttc tca tga                    1398
Val Val Ser Leu Asn His Gln Phe Asn Phe Ser  *
                425                 430
<210>6
<211>431
<212>PRT
<213>Enterobacteriaceae
<400>6
Val Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser
1               5                   10                  15
Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val
            20                  25                  30
Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp
        35                  40                  45
Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp
    50                  55                  60
Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val
65                  70                  75                  80
Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe
                85                  90                  95
Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser
            100                 105                 110
Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro
        115                 120                 125
His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val
    130                 135                 140
Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu
145                 150                 155                 160
Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp
                165                 170                 175
Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr
            180                 185                 190
Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro
        195                 200                 205
Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr
    210                 215                 220
Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly
225                 230                 235                 240
Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val
                245                 250                 255
Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln
            260                 265                 270
Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile
        275                 280                 285
Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp
    290                 295                 300
Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys
305                 310                 315                 320
Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser
                325                 330                 335
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu
            340                 345                 350
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val
        355                 360                 365
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala
    370                 375                 380
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His
385                 390                 395                 400
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys
                405                 410                 415
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser
            420                 425                 430
<210>7
<211>1257
<212>DNA
<213>泡囊短波单胞菌
<220>
<221>CDS
<222>(1)...(1257)
<400>7
atg atg atg ggt aga gcc aaa ctc acg att atc ccg ccg ggc aag cct   48
Met Met Met Gly Arg Ala Lys Leu Thr Ile Ile Pro Pro Gly Lys Pro
 1               5                   10                  15
ttg acc gga cgc gcc atg ccg ccg gga tcg aag tcg atc acc aac cgc   96
Leu Thr Gly Arg Ala Met Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg
             20                  25                  30
gca ttg ctg ctc gcc ggc ctc gcc aag ggc acg agc cgg cta acc ggt  144
Ala Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly
         35                  40                  45
gcg ctg aag agc gac gat acc cgc tat atg gcc gaa gcg ctg cgt gcg  192
Ala Leu Lys Ser Asp Asp Thr Arg Tyr Met Ala Glu Ala Leu Arg Ala
     50                  55                  60
atg ggt gta acg atc gac gag ccc gac gac acc acg ttc atc gtc aaa  240
Met Gly Val Thr Ile Asp Glu Pro Asp Asp Thr Thr Phe Ile Val Lys
 65                  70                  75                  80
ggc agc ggc aag ctg cag ccg ccg gca gcc ccg ctt ttc ctc ggc aat  288
Gly Ser Gly Lys Leu Gln Pro Pro Ala Ala Pro Leu Phe Leu Gly Asn
                 85                  90                  95
gcc ggc acg gca acg cgc ttc ctg acg gcg gcc gcg gca ctg gtg gac    336
Ala Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Ala Ala Leu Val Asp
            100                 105                 110
ggc aag gtc atc gtc gac ggc gat gcc cat atg cgc aag cgg ccg atc    384
Gly Lys Val Ile Val Asp Gly Asp Ala His Met Arg Lys Arg Pro Ile
        115                 120                 125
gga ccg cta gtc gac gcg ttg cgc tcg ctc ggc atc gat gcc tcg gct    432
Gly Pro Leu Val Asp Ala Leu Arg Ser Leu Gly Ile Asp Ala Ser Ala
    130                 135                 140
gaa acc ggc tgc ccg cca gtc acg atc aac ggc acc ggc cgc ttc gag    480
Glu Thr Gly Cys Pro Pro Val Thr Ile Asn Gly Thr Gly Arg Phe Glu
145                 150                 155                 160
gca agc cgc gtg cag atc gat ggc ggc ctg tcc agc cag tat gtc tcg    528
Ala Ser Arg Val Gln Ile Asp Gly Gly Leu Ser Ser Gln Tyr Val Ser
                165                 170                 175
gcg ctc ctg atg atg gcc gcc ggc ggc gat cgc gct gtc gat gtc gag    576
Ala Leu Leu Met Met Ala Ala Gly Gly Asp Arg Ala Val Asp Val Glu
            180                 185                 190
ctt ctc ggc gaa cat atc ggc gct ctc ggc tat atc gac ctg acc gtt    624
Leu Leu Gly Glu His Ile Gly Ala Leu Gly Tyr Ile Asp Leu Thr Val
        195                 200                 205
gcc gcc atg cgc gct ttc ggc gcg aag gtt gag cgt gtg agc ccg gtc    672
Ala Ala Met Arg Ala Phe Gly Ala Lys Val Glu Arg Val Ser Pro Val
    210                 215                 220
gcc tgg cgc gtc gag ccc acc ggc tat cat gcg gcc gac ttc gtg atc    720
Ala Trp Arg Val Glu Pro Thr Gly Tyr His Ala Ala Asp Phe Val Ile
225                 230                 235                 240
gag ccg gat gcc tct gct gcg acc tat ctc tgg gcc gcc gaa gtt ctg    768
Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Glu Val Leu
                245                 250                 255
agc ggc ggc aag atc gat ctc ggc acg ccg gcg gaa cag ttc tcg caa    816
Ser Gly Gly Lys Ile Asp Leu Gly Thr Pro Ala Glu Gln Phe Ser Gln
            260                 265                 270
ccg gat gcg aaa gcc tat gat ctg att tcg aaa ttc ccg cat ctg cct     864
Pro Asp Ala Lys Ala Tyr Asp Leu Ile Ser Lys Phe Pro His Leu Pro
        275                 280                 285
gct gtc atc gac ggc tcg cag atg cag gac gcc atc ccg acg ctc gcc     912
Ala Val Ile Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala
    290                 295                 300
gtt ctc gcc gct ttc aac gaa atg cct gtg cgc ttc gtc ggt atc gaa     960
Val Leu Ala Ala Phe Asn Glu Met Pro Val Arg Phe Val Gly Ile Glu
305                 310                 315                 320
aac ctg cgc gtc aag gaa tgc gat cgt atc cgc gcg ctc tcg agc ggc    1008
Asn Leu Arg Val Lys Glu Cys Asp Arg Ile Arg Ala Leu Ser Ser Gly
                325                 330                 335
cta tcc cgc atc gtt ccg aac ctc ggc acg gaa gag ggc gac gat ctc    1056
Leu Ser Arg Ile Val Pro Asn Leu Gly Thr Glu Glu Gly Asp Asp Leu
            340                 345                 350
atc atc gcc tcc gat ccg agc ctt gcc ggc aaa atc ctg acc gca gag    1104
Ile Ile Ala Ser Asp Pro Ser Leu Ala Gly Lys Ile Leu Thr Ala Glu
        355                 360                 365
atc gat agc ttt gcc gat cac cgc atc gcc atg agc ttt gcg ctg gcc    1152
Ile Asp Ser Phe Ala Asp His Arg Ile Ala Met Ser Phe Ala Leu Ala
    370                 375                 380
ggc ctg aag atc ggc ggc att acc att ctc gac ccc gac tgc gtc gcc    1200
Gly Leu Lys Ile Gly Gly Ile Thr Ile Leu Asp Pro Asp Cys Val Ala
385                 390                 395                 400
aag aca ttc ccg tcc tac tgg aat gtg ctg tct tcg ctg ggg gtc gcc    1248
Lys Thr Phe Pro Ser Tyr Trp Asn Val Leu Ser Ser Leu Gly Val Ala
                405                 410                 415
tac gaa gac                                                        1257
Tyr Glu Asp
<210>8
<211>419
<212>PRT
<213>泡囊短波单胞菌
<400>8
Met Met Met Gly Arg Ala Lys Leu Thr Ile Ile Pro Pro GIy Lys Pro
 1               5                  10                  15
Leu Thr Gly Arg Ala Met Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg
            20                  25                  30
Ala Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly
        35                  40                  45
Ala Leu Lys Ser Asp Asp Thr Arg Tyr Met Ala Glu Ala Leu Arg Ala
    50                  55                  60
Met Gly Val Thr lle Asp Glu Pro Asp Asp Thr Thr Phe Ile Val Lys
65                  70                  75                  80
Gly Ser Gly Lys Leu Gln Pro Pro Ala Ala Pro Leu Phe Leu Gly Asn
                85                  90                  95
Ala Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Ala Ala Leu Val Asp
            100                 105                 110
Gly Lys Val Ile Val Asp Gly Asp Ala His Met Arg Lys Arg Pro Ile
        115                 120                 125
Gly Pro Leu Val Asp Ala Leu Arg Ser Leu Gly Ile Asp Ala Ser Ala
    130                 135                 140
Glu Thr Gly Cys Pro Pro Val Thr Ile Asn Gly Thr Gly Arg Phe Glu
145                 150                 155                 160
Ala Ser Arg Val Gln Ile Asp Gly Gly Leu Ser Ser Gln Tyr Val Ser
                165                 170                 175
Ala Leu Leu Met Met Ala Ala Gly Gly Asp Arg Ala Val Asp Val Glu
            180                 185                 190
Leu Leu Gly Glu His Ile Gly Ala Leu Gly Tyr Ile Asp Leu Thr Val
        195                 200                 205
Ala Ala Met Arg Ala Phe Gly Ala Lys Val Glu Arg Val Ser Pro Val
    210                 215                 220
Ala Trp Arg Val Glu Pro Thr Gly Tyr His Ala Ala Asp Phe Val Ile
225                 230                 235                 240
Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Glu Val Leu
                245                 250                 255
Ser Gly Gly Lys Ile Asp Leu Gly Thr Pro Ala Glu Gln Phe Ser Gln
            260                 265                 270
Pro Asp Ala Lys Ala Tyr Asp Leu Ile Ser Lys Phe Pro His Leu Pro
        275                 280                 285
Ala Val Ile Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala
    290                 295                 300
Val Leu Ala Ala Phe Asn Glu Met Pro Val Arg Phe Val Gly Ile Glu
305                 310                 315                 320
Asn Leu Arg Val Lys Glu Cys Asp Arg Ile Arg Ala Leu Ser Ser Gly
                325                 330                 335
Leu Ser Arg Ile Val Pro Asn Leu Gly Thr Glu Glu Gly Asp Asp Leu
            340                 345                 350
Ile Ile Ala Ser Asp Pro Ser Leu Ala Gly Lys Ile Leu Thr Ala Glu
        355                 360                 365
Ile Asp Ser Phe Ala Asp His Arg Ile Ala Met Ser Phe Ala Leu Ala
    370                 375                 380
Gly Leu Lys Ile Gly Gly Ile Thr Ile Leu Asp Pro Asp Cys Val Ala
385                 390                 395                 400
Lys Thr Phe Pro Ser Tyr Trp Asn Val Leu Ser Ser Leu Gly Val Ala
                405                 410                 415
Tyr Glu Asp
<210>9
<211>1385
<212>DNA
<213>苍白杆菌属/布鲁氏菌属
<221>CDS
<222>(142)...(1380)
<400>9
gcgcatgcca ataaataacg cagatcaccc actcactcga caagcatggc gtgtttgcct   60
gatgattcgg gtccgcacgt cggccactcc acgccacctt gccttgacca ggagccttgt  120
accttgagtt cgcagaaaac c gtg acc gtt aca ccg ccc aac ttc ccc ctc    171
                        Val Thr Val Thr Pro Pro Asn Phe Pro Leu
                         1               5                   10
act ggc aag gtc gcg ccc ccc ggc tcc aaa tcc att acc aac cgt gcg    219
Thr Gly Lys Val Ala Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala
                 15                  20                  25
ctg ttg ctc gcg gca ctg gcc aag ggc acc age cgt ttg agc ggt gcg    267
Leu Leu Leu Ala Ala Leu Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala
             30                  35                  40
ctc aaa agc gat gac acg cgc cac atg tcg gtc gcc ctg cgg cag atg    315
Leu Lys Ser Asp Asp Thr Arg His Met Ser Val Ala Leu Arg Gln Met
         45                  50                  55
ggc gtc acc atc gac gag ccg gac gac acc acc ttt gtc gtc acc agc    363
Gly Val Thr Ile Asp Glu Pro Asp Asp Thr Thr Phe Val Val Thr Ser
     60                  65                  70
caa ggc tcg ctg caa ttg ccg gcc cag ccg ttg ttc ctc ggc aac gcc    411
Gln Gly Ser Leu Gln Leu Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala
 75                  80                  85                  90
ggc acc gcc atg cgc ttt ctc acg gct gcc gtc gcc acc gtg caa ggc    459
Gly Thr Ala Met Arg Phe Leu Thr Ala Ala Val Ala Thr Val Gln Gly
                 95                 100                 105
acc gtg gta ctg gac ggt gac gag tac atg caa aaa cgc ccg atc ggc    507
Thr Val Val Leu Asp Gly Asp Glu Tyr Met Gln Lys Arg Pro Ile Gly
            110                 115                 120
ccg ctg ctg gcc acc ctg ggc cag aac ggc atc cag gtc gac agc ccc    555
Pro Leu Leu Ala Thr Leu Gly Gln Asn Gly Ile Gln Val Asp Ser Pro
        125                 130                 135
acc ggt tgc cca ccg gta acg gtg cat ggc gcg ggc aag gtc cag gcc    603
Thr Gly Cys Pro Pro Val Thr Val His Gly Ala Gly Lys Val Gln Ala
    140                 145                 150
agg cgt ttt gag att gac gga ggc ttg tcc agc cag tac gta tcg gcc    651
Arg Arg Phe Glu Ile Asp Gly Gly Leu Ser Ser Gln Tyr Val Ser Ala
155                 160                 165                 170
ctg ctg atg ctg gcg gcg tgc ggc gaa gca ccg att gaa gtg gcg ctg    699
Leu Leu Met Leu Ala Ala Cys Gly Glu Ala Pro Ile Glu Val Ala Leu
                175                 180                 185
acc ggc aag gac atc ggc gcc cgt ggc tat gtg gac ctg acc ctc gat    747
Thr Gly Lys Asp Ile Gly Ala Arg Gly Tyr Val Asp Leu Thr Leu Asp
            190                 195                 200
tgc atg cgt gcg ttc ggg gcc cag gta gac atc gtg gac gac acc acc    795
Cys Met Arg Ala Phe Gly Ala Gln Val Asp Ile Val Asp Asp Thr Thr
        205                 210                 215
tgg cgc gtg gcc ccc acg ggc tat acc gcc cat gat tac ctg atc gaa    843
Trp Arg Val Ala Pro Thr Gly Tyr Thr Ala His Asp Tyr Leu Ile Glu
    220                 225                 230
ccc gac gct tcc gcc gcc act tac ctg tgg gcc gca gaa gta ctg acc     891
Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Glu Val Leu Thr
235                 240                 245                 250
ggt ggc cgt atc gat att ggt gta gcc gcg cag gac ttc acc cag ccc     939
Gly Gly Arg Ile Asp Ile Gly Val Ala Ala Gln Asp Phe Thr Gln Pro
                255                 260                 265
gac gcc aag gca cag gcc gtg atc gcg caa ttc ccg aac atg cag gcc     987
Asp Ala Lys Ala Gln Ala Val Ile Ala Gln Phe Pro Asn Met Gln Ala
            270                 275                 280
acg gtg gtg ggt tca caa atg cag gat gcg atc ccg acc ctg gcg gtg    1035
Thr Val Val Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val
        285                 290                 295
ctc gcc gca ttc aac aat acc ccg gtg cgc ttc act gaa ctg gcg aac    1083
Leu Ala Ala Phe Asn Asn Thr Pro Val Arg Phe Thr Glu Leu Ala Asn
    300                 305                 310
ctg cgc gtc aag gaa tgt gac cgc gtg cag gcg ctg cac gat ggc ctc    1131
Leu Arg Val Lys Glu Cys Asp Arg Val Gln Ala Leu His Asp Gly Leu
315                 320                 325                 330
aac gaa att cgc ccg ggc ctg gcg acc atc gaa ggt gat gac ctg ctg    1179
Asn Glu Ile Arg Pro Gly Leu Ala Thr Ile Glu Gly Asp Asp Leu Leu
                335                 340                 345
gtt gcc agc gac ccc gct ttg gct ggc acc gcc tgc acc gca ctg atc    1227
Val Ala Ser Asp Pro Ala Leu Ala Gly Thr Ala Cys Thr Ala Leu Ile
            350                 355                 360
gat acc cac gcc gac cat cgc atc gcc atg tgc ttt gcc ctg gcc ggg    1275
Asp Thr His Ala Asp His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly
        365                 370                 375
ctg aaa gtc tcg ggc att cgc atc caa gac cct gat tgc gta gcc aag    1323
Leu Lys Val Ser Gly Ile Arg Ile Gln Asp Pro Asp Cys Val Ala Lys
    380                 385                 390
acc tac cct gac tac tgg aaa gcg ctg gcc agc ctg ggc gtt cac tta    1371
Thr Tyr Pro Asp Tyr Trp Lys Ala Leu Ala Ser Leu Gly Val His Leu
395                 400                 405                 410
agc tac tga cacac                                          1385
Ser Tyr  *
<210>10
<211>444
<212>PRT
<213>苍白杆菌属/布鲁氏菌属
<400>10
Met Ala Cys Leu Pro Asp Asp Ser Gly Pro His Val Gly His Ser Thr
 1               5                  10                  15
Pro Pro Cys Leu Asp Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr
            20                  25                  30
Val Thr Val Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Val Ala Pro
        35                  40                  45
Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu
    50                  55                  60
Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr
65                  70                  75                  80
Arg His Met Ser Val Ala Leu Arg Gln Met Gly Val Thr Ile Asp Glu
                85                  90                  95
Pro Asp Asp Thr Thr Phe Val Val Thr Ser Gln Gly Ser Leu Gln Leu
            100                 105                 110
Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe
        115                 120                 125
Leu Thr Ala Ala Val Ala Thr Val Gln Gly Thr Val Val Leu Asp Gly
    130                 135                 140
Asp Glu Tyr Met Gln Lys Arg Pro Ile Gly Pro Leu Leu Ala Thr Leu
145                 150                 155                 160
Gly Gln Asn Gly Ile Gln Val Asp Ser Pro Thr Gly Cys Pro Pro Val
                165                 170                 175
Thr Val His Gly Ala Gly Lys Val Gln Ala Arg Arg Phe Glu Ile Asp
            180                 185                 190
Gly Gly Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu Met Leu Ala Ala
        195                 200                 205
Cys Gly Glu Ala Pro Ile Glu Val Ala Leu Thr Gly Lys Asp Ile Gly
    210                 215                 220
Ala Arg Gly Tyr Val Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly
225                 230                 235                 240
Ala Gln Val Asp Ile Val Asp Asp Thr Thr Trp Arg Val Ala Pro Thr
                245                 250                 255
Gly Tyr Thr Ala His Asp Tyr Leu Ile Glu Pro Asp Ala Ser Ala Ala
            260                 265                 270
Thr Tyr Leu Trp Ala Ala Glu Val Leu Thr Gly Gly Arg Ile Asp Ile
        275                 280                 285
Gly Val Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala
    290                 295                 300
Val Ile Ala Gln Phe Pro Asn Met Gln Ala Thr Val Val Gly Ser Gln
305                 310                 315                 320
Met Gln Asp Ala Ile Pro Thr Leu Ala Val Leu Ala Ala Phe Asn Asn
                325                 330                 335
Thr Pro Val Arg Phe Thr Glu Leu Ala Asn Leu Arg Val Lys Glu Cys
            340                 345                 350
Asp Arg Val Gln Ala Leu His Asp Gly Leu Asn Glu Ile Arg Pro Gly
        355                 360                 365
Leu Ala Thr Ile Glu Gly Asp Asp Leu Leu Val Ala Ser Asp Pro Ala
    370                 375                 380
Leu Ala Gly Thr Ala Cys Thr Ala Leu Ile Asp Thr His Ala Asp His
385                 390                 395                 400
Arg Ile Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Val Ser Gly Ile
                405                 410                 415
Arg Ile Gln Asp Pro Asp Cys Val Ala Lys Thr Tyr Pro Asp Tyr Trp
            420                 425                 430
Lys Ala Leu Ala Ser Leu Gly Val His Leu Ser Tyr
        435                 440
<210>11
<211>1278
<212>DNA
<213>未知
<220>
<223>分离自土壤样品
<221>CDS
<222>(1)...(1278)
<400>11
atg atc gaa ctg acc atc acc ccg ccc ggc cac ccg ctt tcc ggc aag  48
Met Ile Glu Leu Thr Ile Thr Pro Pro Gly His Pro Leu Ser Gly Lys
 1               5                   10                  15
gtg gag ccg ccc ggt tcc aaa tcc att acc aac cgt gca ctt ctg ctg  96
Val Glu Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu
             20                  25                  30
gcc ggg ctc gcc aag ggc aaa agc cgt ctc acg ggc gcg ctg aaa agc    144
Ala Gly Leu Ala Lys Gly Lys Ser Arg Leu Thr Gly Ala Leu Lys Ser
         35                  40                  45
gac gat acg ctt tac atg gca gaa gcg ctg cgt gag atg ggt gtc aag    192
Asp Asp Thr Leu Tyr Met Ala Glu Ala Leu Arg Glu Met Gly Val Lys
     50                  55                  60
gta acc gag cct gac gcg acc acc ttc gtg gtg gag agt tca ggt ggg    240
Val Thr Glu Pro Asp Ala Thr Thr Phe Val Val Glu Ser Ser Gly Gly
 65                  70                  75                  80
ttg cat cag ccg gaa aag ccg ctt ttc ctc ggc aat gcc ggc aca gct    288
Leu His Gln Pro Glu Lys Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala
                 85                  90                  95
acc cgc ttt ctc acc gcc gct gcc gcc ctt gtg gat ggc gcc gtc atc    336
Thr Arg Phe Leu Thr Ala Ala Ala Ala Leu Val Asp Gly Ala Val Ile
            100                 105                 110
atc gat ggc gac gag cat atg cgc aaa cgc ccg atc atg ccg ctg gtg    384
Ile Asp Gly Asp Glu His Met Arg Lys Arg Pro Ile Met Pro Leu Val
        115                 120                 125
gaa gcc ctg cgc tcc ctc ggc gtt gag gcg gag gcg ccg acc ggc tgc    432
Glu Ala Leu Arg Ser Leu Gly Val Glu Ala Glu Ala Pro Thr Gly Cys
    130                 135                 140
ccg ccc gtc acc gtc tgc ggt aag ggt act ggc ttc ccg aag ggc agc    480
Pro Pro Val Thr Val Cys Gly Lys Gly Thr Gly Phe Pro Lys Gly Ser
145                 150                 155                 160
gtc acg atc gac gcc aac ctt tcc agc cag tat gtg tcc gca ctt ctg    528
Val Thr Ile Asp Ala Asn Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu
                165                 170                 175
atg gcc gcc gcc tgc ggc gac aag cct gtc gat atc atc ctc aaa ggt    576
Met Ala Ala Ala Cys Gly Asp Lys Pro Val Asp Ile Ile Leu Lys Gly
            180                 185                 190
gag gaa atc ggc gcg aag ggc tat atc gat ctc acc aca tcg gcc atg    624
Glu Glu Ile Gly Ala Lys Gly Tyr Ile Asp Leu Thr Thr Ser Ala Met
        195                 200                 205
gaa gcc ttc ggc gca aag gtg gag cgg gtc agc aac gcc atc tgg cgc     672
Glu Ala Phe Gly Ala Lys Val Glu Arg Val Ser Asn Ala Ile Trp Arg
    210                 215                 220
gtg cat ccg acc ggc tac acg gcg acc gat ttc cat atc gag ccg gat     720
Val His Pro Thr Gly Tyr Thr Ala Thr Asp Phe His Ile Glu Pro Asp
225                 230                 235                 240
gcc tcg gcc gcc acc tat ctc tgg ggc gct gag ctt ttg acc ggc ggc     768
Ala Ser Ala Ala Thr Tyr Leu Trp Gly Ala Glu Leu Leu Thr Gly Gly
                245                 250                 255
gcc atc gat atc ggt acg ccg gcc gac aag ttc acc cag ccg gat gcc     816
Ala Ile Asp Ile Gly Thr Pro Ala Asp Lys Phe Thr Gln Pro Asp Ala
            260                 265                 270
aag gcc cat gag gtc atg gcg caa ttt ccg cat ctg ccc gcc gaa atc     864
Lys Ala His Glu Val Met Ala Gln Phe Pro His Leu Pro Ala Glu Ile
        275                 280                 285
gac ggt tcg cag atg cag gat gcc att ccc acc att gcc gtt ctc gcc     912
Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Ile Ala Val Leu Ala
    290                 295                 300
gcc ttt aac gaa acg ccg gtg cgt ttc gtc ggc atc gcc aat ctg cgc     960
Ala Phe Asn Glu Thr Pro Val Arg Phe Val Gly Ile Ala Asn Leu Arg
305                 310                 315                 320
gtc aag gag tgc gac cga atc cgc gcc gtc tca ctc ggc ctc aac gaa    1008
Val Lys Glu Cys Asp Arg Ile Arg Ala Val Ser Leu Gly Leu Asn Glu
                325                 330                 335
atc cgc gat ggt ctg gcg cat gag gaa ggc gac gac ttg atc gtg cat    1056
Ile Arg Asp Gly Leu Ala His Glu Glu Gly Asp Asp Leu Ile Val His
            340                 345                 350
tcc gat cct tcg ctt gcg ggc cag acg gtg aat gcc tcc atc gac act    1104
Ser Asp Pro Ser Leu Ala Gly Gln Thr Val Asn Ala Ser Ile Asp Thr
        355                 360                 365
ttc gcc gac cac cgt atc gcc atg agc ttt gcg ctg gcg gcg ctg aag    1152
Phe Ala Asp His Arg Ile Ala Met Ser Phe Ala Leu Ala Ala Leu Lys
    370                 375                 380
atc ggc ggc att gcc atc cag aat ccg gcc tgc gtg ggc aag acc tat  1200
Ile Gly Gly Ile Ala Ile Gln Asn Pro Ala Cys Val Gly Lys Thr Tyr
385                 390                 395                 400
ccc ggt tac tgg aag gcg ctc gcc tcg ctg gga gtc gaa tac tcg gaa  1248
Pro Gly Tyr Trp Lys Ala Leu Ala Ser Leu Gly Val Glu Tyr Ser Glu
                405                 410                 415
aag gaa acc gct gcc gag ccg cag cat tag                          1278
Lys Glu Thr Ala Ala Glu Pro Gln His *
            420                 425
<210>12
<211>425
<212>PRT
<213>未知
<220>
<223>分离自土壤样品
<400>12
Met Ile Glu Leu Thr Ile Thr Pro Pro Gly His Pro Leu Ser Gly Lys
 1               5                  10                  15
Val Glu Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu
            20                  25                  30
Ala Gly Leu Ala Lys Gly Lys Ser Arg Leu Thr Gly Ala Leu Lys Ser
        35                  40                  45
Asp Asp Thr Leu Tyr Met Ala Glu Ala Leu Arg Glu Met Gly Val Lys
    50                  55                  60
Val Thr Glu Pro Asp Ala Thr Thr Phe Val Val Glu Ser Ser Gly Gly
65                  70                  75                  80
Leu His Gln Pro Glu Lys Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala
                85                  90                  95
Thr Arg Phe Leu Thr Ala Ala Ala Ala Leu Val Asp Gly Ala Val Ile
            100                 105                 110
Ile Asp Gly Asp Glu His Met Arg Lys Arg Pro Ile Met Pro Leu Val
        115                 120                 125
Glu Ala Leu Arg Ser Leu Gly Val Glu Ala Glu Ala Pro Thr Gly Cys
    130                 135                 140
Pro Pro Val Thr Val Cys Gly Lys Gly Thr Gly Phe Pro Lys Gly Ser
145                 150                 155                 160
Val Thr Ile Asp Ala Asn Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu
                165                 170                 175
Met Ala Ala Ala Cys Gly Asp Lys Pro Val Asp Ile Ile Leu Lys Gly
            180                 185                 190
Glu Glu Ile Gly Ala Lys Gly Tyr Ile Asp Leu Thr Thr Ser Ala Met
        195                 200                 205
Glu Ala Phe Gly Ala Lys Val Glu Arg Val Ser Asn Ala Ile Trp Arg
    210                 215                 220
Val His Pro Thr Gly Tyr Thr Ala Thr Asp Phe His Ile Glu Pro Asp
225                 230                 235                 240
Ala Ser Ala Ala Thr Tyr Leu Trp Gly Ala Glu Leu Leu Thr Gly Gly
                245                 250                 255
Ala Ile Asp Ile Gly Thr Pro Ala Asp Lys Phe Thr Gln Pro Asp Ala
            260                 265                 270
Lys Ala His Glu Val Met Ala Gln Phe Pro His Leu Pro Ala Glu Ile
        275                 280                 285
Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Ile Ala Val Leu Ala
    290                 295                 300
Ala Phe Asn Glu Thr Pro Val Arg Phe Val Gly Ile Ala Asn Leu Arg
305                 310                 315                 320
Val Lys Glu Cys Asp Arg Ile Arg Ala Val Ser Leu Gly Leu Asn Glu
                325                 330                 335
Ile Arg Asp Gly Leu Ala His Glu Glu Gly Asp Asp Leu Ile Val His
            340                 345                 350
Ser Asp Pro Ser Leu Ala Gly Gln Thr Val Asn Ala Ser Ile Asp Thr
        355                 360                 365
Phe Ala Asp His Arg Ile Ala Met Ser Phe Ala Leu Ala Ala Leu Lys
    370                 375                 380
Ile Gly Gly Ile Ala Ile Gln Asn Pro Ala Cys Val Gly Lys Thr Tyr
385                 390                 395                 400
Pro Gly Tyr Trp Lys Ala Leu Ala Ser Leu Gly Val Glu Tyr Ser Glu
                405                 410                 415
Lys Glu Thr Ala Ala Glu Pro Gln His
            420                 425
<210>13
<211>17
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>5
<223>Xaa=Lys或Thr
<221>变体
<222>7
<223>Xaa=Arg或His
<221>变体
<222>9
<223>Xaa=Ser或Thr
<400>13
Leu Ala Lys Gly Xaa Ser Xaa Leu Xaa Gly Ala Leu Lys Ser Asp Asp
 1               5                  10                  15
Thr
<210>14
<211>5
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>5
<223>Xaa=Lys或Thr
<400>14
Leu Ala Lys Gly Xaa
 1               5
<210>15
<211>4
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>2
<223>Xaa=Arg或His
<221>变体
<222>4
<223>Xaa=Ser或Thr
<400>15
Ser Xaa Leu Xaa
 1
<210>16
<211>8
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<400>16
Gly Ala Leu Lys Ser Asp Asp Thr
 1               5
<210>17
<211>13
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>4
<223>Xaa=Asp或Ala
<221>变体
<222>5
<223>Xaa=Ser或Thr
<221>变体
<222>8
<223>Xaa=Val或Ile
<221>变体
<222>10
<223>Xaa=Thr,Glu或Lys
<221>变体
<222>11
<223>Xaa=Ser或Gly
<221>变体
<222>(12)...(0)
<223>Xaa=Gln,Ser,Glu或Thr
<400>17
Glu Pro Asp Xaa Xaa Thr Phe Xaa Val Xaa Xaa Xaa Gly
 1               5                  10
<210>18
<211>9
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>4
<223>Xaa=Asp或Ala
<221>变体
<222>5
<223>Xaa=Ser或Thr
<221>变体
<222>8
<223>Xaa=Val或Ile
<400>18
Glu Pro Asp Xaa Xaa Thr Phe Xaa Val
 1               5
<210>19
<211>4
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Thr,Glu或Lys
<221>变体
<222>2
<223>Xaa=Ser或Gly
<221>变体
<222>3
<223>Xaa=Gln,Ser,Glu或Thr
<400>19
Xaa Xaa Xaa Gly
 1
<210>20
<211>6
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<400>20
Arg Phe Leu Thr Ala Ala
 1               5
<210>21
<211>6
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>5
<223>Xaa=Gly,Met或Leu
<400>21
Lys Arg Pro Ile Xaa Pro
 1               5
<210>22
<211>6
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Thr或Ser
<400>22
Xaa Gly Cys Pro Pro Val
 1               5
<210>23
<211>10
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>4
<223>Xaa=Arg,Lys或Leu
<221>变体
<222>7
<223>Xaa=Ile或Val
<400>23
Ile Gly Ala Xaa Gly Tyr Xaa Asp Leu Thr
 1               5                  10
<210>24
<211>7
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>2
<223>Xaa=Arg或Lys
<221>变体
<222>4
<223>Xaa=Ala,HIs,Glu或Ser
<221>变体
<222>5
<223>Xaa=Pro或Ala
<400>24
Trp Xaa Val Xaa Xaa Thr Gly
 1               5
<210>25
<211>16
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>12
<223>Xaa=Ala或Gly
<221>变体
<222>14
<223>Xaa=Glu或Gln
<221>变体
<222>15
<223>Xaa=Val,Leu或Ala
<400>25
Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Xaa Ala Xaa Xaa Leu
 1               5                  10                  15
<210>26
<211>11
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<400>26
Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp
 1               5                  10
<210>27
<211>4
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>3
<223>Xaa=Ile或Leu
<400>27
Ile Asp Xaa Gly
 1
<210>28
<211>8
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>2
<223>Xaa=Thr或Ser
<400>28
Phe Xaa Gln Pro Asp Ala Lys Ala
 1               5
<210>29
<211>28
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Glu,Lys或Ser
<221>变体
<222>4
<223>Xaa=Asp或His
<221>变体
<222>5
<223>Xaa=Met或Leu
<221>变体
<222>6
<223>Xaa=Pro或Gln
<221>变体
<222>8
<223>Xaa=Thr,Glu或Val
<221>变体
<222>(9)...(0)
<223>Xaa=Val或Ile
<221>变体
<222>(10)...(0)
<223>Xaa=Asp或Val
<221>变体
<222>(21)...(0)
<223>Xaa=Leu或Ile
<221>变体
<222>(24)...(0)
<223>Xaa=Leu或Ile
<400>29
Xaa Phe Pro Xaa Xaa Xaa Ala Xaa Xaa Xaa Gly Ser Gln Met Gln Asp
 1               5                  10                  15
Ala Ile Pro Thr Xaa Ala Val Xaa Ala Ala Phe Asn
            20                  25
<210>30
<211>7
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Gln,Lys或Ser
<221>变体
<222>4
<223>Xaa=Asp或His
<221>变体
<222>5
<223>Xaa=Met或Leu
<221>变体
<222>6
<223>Xaa=Pro或Gln
<400>30
Xaa Phe Pro Xaa Xaa Xaa Ala
 1               5
<210>31
<211>21
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Thr,Glu,或Val
<221>变体
<222>2
<223>Xaa=Val或Ile
<221>变体
<222>3
<223>Xaa=Asp或Val
<221>变体
<222>14
<223>Xaa=Leu或Ile
<221>变体
<222>17
<223>Xaa=Leu或Ile
<400>31
Xaa Xaa Xaa Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Xaa Ala Val
 1               5                  10                  15
Xaa Ala Ala Phe Asn
            20
<210>32
<211>10
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<400>32
Gly Ser Gln Met Gln Asp Ala Ile Pro Thr
 1               5                  10
<210>33
<211>18
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>5
<223>Xaa=Val或Thr
<221>变体
<222>6
<223>Xaa=Glu或Gly
<221>变体
<222>7
<223>Xaa=Leu或Ile
<221>变体
<222>8
<223>Xaa=Ala或Glu
<221>变体
<222>17
<223>Xaa=Ile或Val
<400>33
Pro Val Arg Phe Xaa Xaa Xaa Xaa Asn Leu Arg Val Lys Glu Cys Asp
 1               5                  10                  15
Arg Xaa
<210>34
<211>4
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<400>34
Pro Val Arg Phe
 1
<210>35
<211>14
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Val或Thr
<221>变体
<222>2
<223>Xaa=Glu或Gly
<221>变体
<222>3
<223>Xaa=Leu或Ile
<221>变体
<222>4
<223>Xaa=ala或Glu
<221>变体
<222>14
<223>Xaa=Ile或Val
<400>35
Xaa Xaa Xaa Xaa Asn Leu Arg Val Lys Glu Cys Asp Arg Xaa
 1               5                  10
<210>36
<211>9
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<400>36
Asn Leu Arg Val Lys Glu Cys Asp Arg
 1               5
<210>37
<211>7
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>6
<223>Xaa=Leu或Ile
<221>变体
<222>7
<223>Xaa=Val或Ile
<400>37
Glu Gly Asp Asp Leu Xaa Xaa
 1               5
<210>38
<211>6
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Asp或Asn
<221>变体
<222>3
<223>Xaa=Ala,Ser或Thr
<400>38
Xaa Pro Xaa Leu Ala Gly
 1               5
<210>39
<211>10
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>2
<223>Xaa=Leu,Ser或Glu
<221>变体
<222>5
<223>Xaa=Thr或Ser
<221>变体
<222>6
<223>Xaa=His或Phe
<221>变体
<222>7
<223>Xaa=ala或Ser
<400>39
Ala Xaa Ile Asp Xaa Xaa Xaa Asp His Arg
 1               5                  10
<210>40
<211>11
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>5
<223>Xaa=Gly或Ala
<221>变体
<222>8
<223>Xaa=Ile或Val
<221>变体
<222>9
<223>Xaa=Ser,Gly,Ala或Lys
<400>40
Phe Ala Leu Ala Xaa Leu Lys Xaa Xaa Gly Ile
 1               5                  10
<210>41
<211>7
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>5
<223>Xaa=Gly或Ala
<400>41
Phe Ala Leu Ala Xaa Leu Lys
 1               5
<210>42
<211>6
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>3
<223>Xaa=Ile或Val
<221>变体
<222>4
<223>Xaa=Ser,Gly,Ala或Lys
<400>42
Leu Lys Xaa Xaa Gly Ile
 1               5
<210>43
<211>7
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Asn或Asp
<221>变体
<222>3
<223>Xaa=Ala或Asp
<221>变体
<222>6
<223>Xaa=Ala或Gly
<400>43
Xaa Pro Xaa Cys Val Xaa Lys
 1               5
<210>44
<211>5
<212>PRT
<213>人工序列
<220>
<223>保守结构域
<221>变体
<222>1
<223>Xaa=Ala,Ser或Pro
<400>44
Xaa Ser Leu Gly Val
 1               5
<210>45
<211>1500
<212>DNA
<213>丁香假单胞菌
<220>
<221>CDS
<222>(102)...(1358)
<221>misc_feature
<222>(0)...(0)
<223>pv syringae菌株B728a
<400>45
gctgacccgc gcccgggctt ggcgatgaat gaaaccggca ctgcgggctt gatcccgctc  60
gtgctaggat cgcgattttt ccgctgacgc tcagggacat c atg cga cct caa gcc  116
                                              Met Arg Pro Gln Ala
                                               1               5
acc ctc act gtt ttg cct gtc gag cgc ccg ttg gtc ggg cgt gtc agc    164
Thr Leu Thr Val Leu Pro Val Glu Arg Pro Leu Val Gly Arg Val Ser
                 10                  15                  20
ccg ccg ggc tcc aag tcg atc acc aac cgt gca ttg ttg ctg gcc ggg    212
Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Gly
             25                  30                  35
ctg gcc aaa ggc acc agc cgc ctg acc ggc gcg ctg aag agt gat gac    260
Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala Leu Lys Ser Asp Asp
         40                  45                  50
acg cgc gtg atg tcc gaa gcc ttg cgt ctg atg ggc gtg cag gtc gac    308
Thr Arg Val Met Ser Glu Ala Leu Arg Leu Met Gly Val Gln Val Asp
     55                  60                  65
gag ccg gat gac agc acc ttc gtg gtc acc agc agc ggg cac tgg cag    356
Glu Pro Asp Asp Ser Thr Phe Val Val Thr Ser Ser Gly His Trp Gln
 70                  75                  80                  85
gcg ccg caa cag gcg ctg ttc ctc ggc aat gcc ggg act gcg aca cgc    404
Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala Gly Thr Ala Thr Arg
                 90                  95                 100
ttt ctg acc gcg gca ctg gcc aac ttc gaa ggc gac ttc gtg gtg gat    452
Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly Asp Phe Val Val Asp
            105                 110                 115
ggc gac gaa tac atg cgc aag cgc ccg atc ggc ccg ttg gtc gat gcc    500
Gly Asp Glu Tyr Met Arg Lys Arg Pro Ile Gly Pro Leu Val Asp Ala
        120                 125                 130
ttg cag cgc atg ggc gtg gag gtc agc gca ccc agt ggt tgc ccg ccg    548
Leu Gln Arg Met Gly Val Glu Val Ser Ala Pro Ser Gly Cys Pro Pro
    135                 140                 145
gtg gcc atc aag ggc aag ggc ggt ctt gag gcc ggt cgt atc gaa atc    596
Val Ala Ile Lys Gly Lys Gly Gly Leu Glu Ala Gly Arg Ile Glu Ile
150                 155                 160                 165
gac ggc aat ctg tcc agc cag tat gtg tcg gca ctg ctg atg gcc ggt    644
Asp Gly Asn Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu Met Ala Gly
                170                 175                 180
gcc tgt ggc aag ggg cct gtg gaa gtt gcc ctg aca ggc agc gag atc    692
Ala Cys Gly Lys Gly Pro Val Glu Val Ala Leu Thr Gly Ser Glu Ile
            185                 190                 195
ggc gcg cgt ggt tac ctc gac ctc acg ctg gcg gcc atg cgg gcg ttc    740
Gly Ala Arg Gly Tyr Leu Asp Leu Thr Leu Ala Ala Met Arg Ala Phe
        200                 205                 210
ggt gcc gag gtt cag gcc atc ggc gac gcc gcc tgg aaa gtc tcg gct    788
Gly Ala Glu Val Gln Ala Ile Gly Asp Ala Ala Trp Lys Val Ser Ala
    215                 220                 225
acc ggt tat cgc gct acg gat ttc cac atc gaa ccg gat gcc tcg gcg     836
Thr Gly Tyr Arg Ala Thr Asp Phe His Ile Glu Pro Asp Ala Ser Ala
230                 235                 240                 245
gcc acc tac ctt tgg gct gcg cag gcc ctg acc gag ggc gct atc gac     884
Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr Glu Gly Ala Ile Asp
                250                 255                 260
ctg ggc gtg gcc agc aac gcg ttc act cag cct gat gca ctg gcc agt     932
Leu Gly Val Ala Ser Asn Ala Phe Thr Gln Pro Asp Ala Leu Ala Ser
            265                 270                 275
cag atc atc gcc agc ttc ccg aac atg ccg gcc gtg atc gac ggc tcg     980
Gln Ile Ile Ala Ser Phe Pro Asn Met Pro Ala Val Ile Asp Gly Ser
        280                 285                 290
cag atg cag gac gcg att ccc acg ctg gcc gta ctg gcc gcg ttc aat    1028
Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val Leu Ala Ala Phe Asn
    295                 300                 305
cgt caa ccg gtg cgc ttt gtc ggc atc gcc aac ctg cgg gtc aag gag    1076
Arg Gln Pro Val Arg Phe Val Gly Ile Ala Asn Leu Arg Val Lys Glu
310                 315                 320                 325
tgc gac cgc atc tcg gca ctg tcc aac ggc ctg tgc gcc atc gca ccc    1124
Cys Asp Arg Ile Ser Ala Leu Ser Asn Gly Leu Cys Ala Ile Ala Pro
                330                 335                 340
ggc ctg gcg gtc gaa gag ggt gac gat ctg atc gtt acc gcc aac ccg    1172
Gly Leu Ala Val Glu Glu Gly Asp Asp Leu Ile Val Thr Ala Asn Pro
            345                 350                 355
acg ctg gca ggc act acg gtc gat gcc ttg atc gat acc cac tcc gac    1220
Thr Leu Ala Gly Thr Thr Val Asp Ala Leu Ile Asp Thr His Ser Asp
        360                 365                 370
cat cgg atc gcc atg tgc ttt gca ctg gcg ggc ctg aag att gcc ggc    1268
His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Ile Ala Gly
    375                 380                 385
atc cgc att ctc gac cct gat tgc gtc gcc aag acc tac ccg ggg tac    1316
Ile Arg Ile Leu Asp Pro Asp Cys Val Ala Lys Thr Tyr Pro Gly Tyr
390                 395                 400                 405
tgg gat gcg ctg gct tct ctg ggt gtg agt gtt cag cgc tga              1358
Trp Asp Ala Leu Ala Ser Leu Gly Val Ser Val Gln Arg *
                410                 415
tagatcaggt ttatcggctc gggaagcctg taggatttcg agacatcttt agctggcagt    1418
ctacggttgt agatactatg tttatacgtt ggggttgcat gcctcgtgtg aggtatctac    1478
agtattgcta cgttatgagg tg                                             1500
<210>46
<211>418
<212>PRT
<213>丁香假单胞菌
<220>
<221>变体
<222>(0)...(0)
<223>pv syringae菌株B728a
<400>46
Met Arg Pro Gln Ala Thr Leu Thr Val Leu Pro Val Glu Arg Pro Leu
 1               5                  10                  15
Val Gly Arg Val Ser Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala
            20                  25                  30
Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala
        35                  40                  45
Leu Lys Ser Asp Asp Thr Arg Val Met Ser Glu Ala Leu Arg Leu Met
    50                  55                  60
Gly Val Gln Val Asp Glu Pro Asp Asp Ser Thr Phe Val Val Thr Ser
65                  70                  75                  80
Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala
                85                  90                  95
Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly
            100                 105                 110
Asp Phe Val Val Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro Ile Gly
        115                 120                 125
Pro Leu Val Asp Ala Leu Gln Arg Met Gly Val Glu Val Ser Ala Pro
    130                 135                 140
Ser Gly Cys Pro Pro Val Ala Ile Lys Gly Lys Gly Gly Leu Glu Ala
145                 150                 155                 160
Gly Arg Ile Glu Ile Asp Gly Asn Leu Ser Ser Gln Tyr Val Ser Ala
                165                 170                 175
Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Pro Val Glu Val Ala Leu
            180                 185                 190
Thr Gly Ser Glu Ile Gly Ala Arg Gly Tyr Leu Asp Leu Thr Leu Ala
        195                 200                 205
Ala Met Arg Ala Phe Gly Ala Glu Val Gln Ala Ile Gly Asp Ala Ala
    210                 215                 220
Trp Lys Val Ser Ala Thr Gly Tyr Arg Ala Thr Asp Phe His Ile Glu
225                 230                 235                 240
Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr
                245                 250                 255
Glu Gly Ala Ile Asp Leu Gly Val Ala Ser Asn Ala Phe Thr Gln Pro
            260                 265                 270
Asp Ala Leu Ala Ser Gln Ile Ile Ala Ser Phe Pro Asn Met Pro Ala
        275                 280                 285
Val Ile Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val
    290                 295                 300
Leu Ala Ala Phe Asn Arg Gln Pro Val Arg Phe Val Gly Ile Ala Asn
305                 310                 315                 320
Leu Arg Val Lys Glu Cys Asp Arg Ile Ser Ala Leu Ser Asn Gly Leu
                325                 330                 335
Cys Ala Ile Ala Pro Gly Leu Ala Val Glu Glu Gly Asp Asp Leu Ile
            340                 345                 350
Val Thr Ala Asn Pro Thr Leu Ala Gly Thr Thr Val Asp Ala Leu Ile
        355                 360                 365
Asp Thr His Ser Asp His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly
    370                 375                 380
Leu Lys Ile Ala Gly Ile Arg Ile Leu Asp Pro Asp Cys Val Ala Lys
385                 390                 395                 400
Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Ala Ser Leu Gly Val Ser Val
                405                 410                 415
Gln Arg
<210>47
<211>1466
<212>DNA
<213>丁香假单胞菌
<220>
<221>CDS
<222>(101)...(1357)
<221>misc_feature
<222>(0)...(0)
<223>pv phaseolicola 菌株 1448a
<400>47
gtaaacggct gtctggcccg ttggggcagc aaaaccgcac tgcgggcttg atcccgctcg  60
tgctaggatc gcgatttttc cgctgacgct cagggacatc atg cga cct caa gcc    115
                                            Met Arg Pro Gln Ala
                                             1               5
acc ctc act gtt ttg cct gtc gag cgc ccg ctg gtc ggg cgc gtc agc    163
Thr Leu Thr Val Leu Pro Val Glu Arg Pro Leu Val Gly Arg Val Ser
                 10                  15                  20
ccg ccg ggc tcc aag tcg atc acc aac cgc gca ttg ttg ctg gcc ggg    211
Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Gly
             25                  30                  35
ctg gcc aaa ggc acc agc cgc ctg acc ggc gcg ctg aag agt gac gac    259
Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala Leu Lys Ser Asp Asp
         40                  45                  50
acc cgc gtg atg tcc gaa gca ctg cgt ctg atg ggc gtg cag gtc gac    307
Thr Arg Val Met Ser Glu Ala Leu Arg Leu Met Gly Val Gln Val Asp
     55                  60                  65
gag ccg gat gac agc acc ttc gtg gtc acc agc agc ggc cac tgg cag    355
Glu Pro Asp Asp Ser Thr Phe Val Val Thr Ser Ser Gly His Trp Gln
 70                  75                  80                  85
gca ccg cag cag gca ctg ttt ctc ggt aac gcc gga acc gca acg cgc    403
Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala Gly Thr Ala Thr Arg
                 90                  95                 100
ttt ctg acc gct gca ctg gcc aac ttc gaa ggc gac ttt gtg gtc gac    451
Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly Asp Phe Val Val Asp
            105                 110                 115
ggc gac gag tac atg cgc aag cgc ccg atc ggc ccg ctg gtc gat gcc    499
Gly Asp Glu Tyr Met Arg Lys Arg Pro Ile Gly Pro Leu Val Asp Ala
        120                 125                 130
ttg cag cgc atg ggt gtg gag gtc agt gcg ccc agt ggc tgc ccg ccg    547
Leu Gln Arg Met Gly Val Glu Val Ser Ala Pro Ser Gly Cys Pro Pro
    135                 140                 145
gtg gcg atc aag ggc aaa ggc ggt ctg gaa gcc gga cgt att gaa atc     595
Val Ala Ile Lys Gly Lys Gly Gly Leu Glu Ala Gly Arg Ile Glu Ile
150                 155                 160                 165
gat ggc aac ctg tcc agc cag tac gtg tca gcg ttg ctg atg gcc gga     643
Asp Gly Asn Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu Met Ala Gly
                170                 175                 180
gcc tgc ggc aag ggc ccg gtc gaa gtc gcc ttg acc ggc agc gag att     691
Ala Cys Gly Lys Gly Pro Val Glu Val Ala Leu Thr Gly Ser Glu Ile
            185                 190                 195
ggc gca cgt ggt tac gtc gac ctt acc ctg gcg gcc atg cag gcc ttc     739
Gly Ala Arg Gly Tyr Val Asp Leu Thr Leu Ala Ala Met Gln Ala Phe
        200                 205                 210
ggc gcc gag gtt cag gcc atc ggc gaa acc gcc tgg aaa gtc tcg gcc     787
Gly Ala Glu Val Gln Ala Ile Gly Glu Thr Ala Trp Lys Val Ser Ala
    215                 220                 225
act ggt tat cgc gct acg gac ttc cat atc gaa ccg gat gca tcg gcg     835
Thr Gly Tyr Arg Ala Thr Asp Phe His Ile Glu Pro Asp Ala Ser Ala
230                 235                 240                 245
gcc acc tac ctg tgg gcc gcc caa gca ctg acc gag ggc gat atc gac     883
Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr Glu Gly Asp Ile Asp
                250                 255                 260
ctc ggc gtg gcc agc gac gca ttc act cag cct gat gcc ctg gcc agt     931
Leu Gly Val Ala Ser Asp Ala Phe Thr Gln Pro Asp Ala Leu Ala Ser
            265                 270                 275
cag atc atc gca agc ttc ccg aac atg cct gcc gtg atc gac ggt tcg     979
Gln Ile Ile Ala Ser Phe Pro Asn Met Pro Ala Val Ile Asp Gly Ser
        280                 285                 290
caa atg cag gac gcg att ccg acg ctg gcg gta ctc gcc gcc ttc aac    1027
Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val Leu Ala Ala Phe Asn
    295                 300                 305
cgt cag cca gtg cgc ttt gtc ggc atc gcc aac ctg cgg gtc aag gaa    1075
Arg Gln Pro Val Arg Phe Val Gly Ile Ala Asn Leu Arg Val Lys Glu
310                 315                 320                 325
tgt gac cgt att tca gca ctg tcc cac ggc ctg tgt gcc atc gcg ccg    1123
Cys Asp Arg Ile Ser Ala Leu Ser His Gly Leu Cys Ala Ile Ala Pro
                330                 335                 340
ggc ctt gct gta gag gag ggc gac gac ctg ctg gtg cac gcc aac ccg    1171
Gly Leu Ala Val Glu Glu Gly Asp Asp Leu Leu Val His Ala Asn Pro
            345                 350                 355
gcg ctg gca ggc acc acg gta gac gca ttg att gac acc cac tcc gac    1219
Ala Leu Ala Gly Thr Thr Val Asp Ala Leu Ile Asp Thr His Ser Asp
        360                 365                 370
cat cgc atc gcc atg tgt ttt gcg ctg gca ggc ttg aag att gcc ggt    1267
His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Ile Ala Gly
    375                 380                 385
att cgc att ctc gac cea gat tgc gtc ggc aag acc tac ccg ggt tac    1315
Ile Arg Ile Leu Asp Pro Asp Cys Val Gly Lys Thr Tyr Pro Gly Tyr
390                 395                 400                 405
tgg gat gca ctg gct tcg ctg ggg gtg cgt gtt cag cgc tga            1357
Trp Asp Ala Leu Ala Ser Leu Gly Val Arg Val Gln Arg *
                410                 415
gagcagctat ggagccgttt ttcagatccc gaagaacggc tgcatcatcc gcgccagcag  1417
cccgtgaaag cgcagccttg attctgtcgc cagtacgcag atgcattcc              1466
<210>48
<211>418
<212>PRT
<213>丁香假单胞菌
<220>
<221>变体
<222>(0)...(0)
<223>pv phaseolicola菌株1448a
<400>48
Met Arg Pro Gln Ala Thr Leu Thr Val Leu Pro Val Glu Arg Pro Leu
 1               5                  10                  15
Val Gly Arg Val Ser Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala
            20                  25                  30
Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala
        35                  40                  45
Leu Lys Ser Asp Asp Thr Arg Val Met Ser Glu Ala Leu Arg Leu Met
    50                  55                  60
Gly Val Gln Val Asp Glu Pro Asp Asp Ser Thr Phe Val Val Thr Ser
65                  70                  75                  80
Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala
                85                  90                  95
Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly
            100                 105                 110
Asp Phe Val Val Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro Ile Gly
        115                 120                 125
Pro Leu Val Asp Ala Leu Gln Arg Met Gly Val Glu Val Ser Ala Pro
    130                 135                 140
Ser Gly Cys Pro Pro Val Ala Ile Lys Gly Lys Gly Gly Leu Glu Ala
145                 150                 155                 160
Gly Arg Ile Glu Ile Asp Gly Asn Leu Ser Ser Gln Tyr Val Ser Ala
                165                 170                 175
Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Pro Val Glu Val Ala Leu
            180                 185                 190
Thr Gly Ser Glu Ile Gly Ala Arg Gly Tyr Val Asp Leu Thr Leu Ala
        195                 200                 205
Ala Met Gln Ala Phe Gly Ala Glu Val Gln Ala Ile Gly Glu Thr Ala
    210                 215                 220
Trp Lys Val Ser Ala Thr Gly Tyr Arg Ala Thr Asp Phe His Ile Glu
225                 230                 235                 240
Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr
                245                 250                 255
Glu Gly Asp Ile Asp Leu Gly Val Ala Ser Asp Ala Phe Thr Gln Pro
            260                 265                 270
Asp Ala Leu Ala Ser Gln Ile Ile Ala Ser Phe Pro Asn Met Pro Ala
        275                 280                 285
Val Ile Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val
    290                 295                 300
Leu Ala Ala Phe Asn Arg Gln Pro Val Arg Phe Val Gly Ile Ala Asn
305                 310                 315                 320
Leu Arg Val Lys Glu Cys Asp Arg Ile Ser Ala Leu Ser His Gly Leu
                325                 330                 335
Cys Ala Ile Ala Pro Gly Leu Ala Val Glu Glu Gly Asp Asp Leu Leu
            340                 345                 350
Val His Ala Asn Pro Ala Leu Ala Gly Thr Thr Val Asp Ala Leu Ile
        355                 360                 365
Asp Thr His Ser Asp His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly
    370                 375                 380
Leu Lys Ile Ala Gly Ile Arg Ile Leu Asp Pro Asp Cys Val Gly Lys
385                 390                 395                 400
Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Ala Ser Leu Gly Val Arg Val
                405                 410                 415
Gln Arg
<210>49
<211>427
<212>PRT
<213>大肠杆菌
<400>49
Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile
 1               5                  10                  15
Asn Leu Pro Gly Ser Lys Thr Val Ser Asn Arg Ala Leu Leu Leu Ala
            20                  25                  30
Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp
        35                  40                  45
Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr
    50                  55                  60
Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile lle Gly Asn Gly Gly
65                  70                  75                  80
Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
                85                  90                  95
Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp
            100                 105                 110
Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His
        115                 120                 125
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu
    130                 135                 140
Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly
145v                150                 155                 160
Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu
                165                 170                 175
Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys
            180                 185                 190
Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met
        195                 200                 205
Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val
    210                 215                 220
Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu
225                 230                 235                 240
Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys
                245                 250                 255
Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly
            260                 265                 270
Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys
        275                 280                 285
Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile
    290                 295                 300
Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr
305                 310                 315                 320
Ala Ala Leu Phe Ala Lys Gly Thr Thr Arg Leu Arg Asn Ile Tyr Asn
                325                 330                 335
Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu
            340                 345                 350
Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile
        355                 360                 365
Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp
    370                 375                 380
His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro
385                 390                 395                 400
Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr
                405                 410                 415
Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala
            420                 425
<210>50
<211>444
<212>PRT
<213>玉蜀黍
<400>50
Ala Gly Ala Glu Glu Ile Val Leu Gln Pro Ile Lys Glu Ile Ser Gly
 1               5                  10                  15
Thr Val Lys Leu Pro Gly Ser Lys Ser Leu Ser Asn Arg Ile Leu Leu
            20                  25                  30
Leu Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn Leu Leu Asn
        35                  40                  45
Ser Glu Asp Val His Tyr Met Leu Gly Ala Leu Arg Thr Leu Gly Leu
    50                  55                  60
Ser Val Glu Ala Asp Lys Ala Ala Lys Arg Ala Val Val Val Gly Cys
65                  70                  75                  80
Gly Gly Lys Phe Pro Val Glu Asp Ala Lys Glu Glu Val Gln Leu Phe
                85                  90                  95
Leu Gly Asn Ala Gly Thr Ala Met Arg Pro Leu Thr Ala Ala Val Thr
            100                 105                 110
Ala Ala Gly Gly Asn Ala Thr Tyr Val Leu Asp Gly Val Pro Arg Met
        115                 120                 125
Arg Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys Gln Leu Gly
    130                 135                 140
Ala Asp Val Asp Cys Phe Leu Gly Thr Asp Cys Pro Pro Val Arg Val
145                 150                 155                 160
Asn Gly Ile Gly Gly Leu Pro Gly Gly Lys Val Lys Leu Ser Gly Ser
                165                 170                 175
Ile Ser Ser Gln Tyr Leu Ser Ala Leu Leu Met Ala Ala Pro Leu Ala
            180                 185                 190
Leu Gly Asp Val Glu Ile Glu Ile Ile Asp Lys Leu Ile Ser Ile Pro
        195                 200                 205
Tyr Val Glu Met Thr Leu Arg Leu Met Glu Arg Phe Gly Val Lys Ala
    210                 215                 220
Glu His Ser Asp Ser Trp Asp Arg Phe Tyr Ile Lys Gly Gly Gln Lys
225                 230                 235                 240
Tyr Lys Ser Pro Lys Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala
                245                 250                 255
Ser Tyr Phe Leu Ala Gly Ala Ala Ile Thr Gly Gly Thr Val Thr Val
            260                 265                 270
Glu Gly Cys Gly Thr Thr Ser Leu Gln Gly Asp Val Lys Phe Ala Glu
        275                 280                 285
Val Leu Glu Met Met Gly Ala Lys Val Thr Trp Thr Glu Thr Ser Val
    290                 295                 300
Thr Val Thr Gly Pro Pro Arg Glu Pro Phe Gly Arg Lys His Leu Lys
305                 310                 315                 320
Ala Ile Asp Val Asn Met Asn Lys Met Pro Asp Val Ala Met Thr Leu
                325                 330                 335
Ala Val Val Ala Leu Phe Ala Asp Gly Pro Thr Ala Ile Arg Asp Val
            340                 345                 350
Ala Ser Trp Arg Val Lys Glu Thr Glu Arg Met Val Ala Ile Arg Thr
        355                 360                 365
Glu Leu Thr Lys Leu Gly Ala Ser Val Glu Glu Gly Pro Asp Tyr Cys
    370                 375                 380
Ile Ile Thr Pro Pro Glu Lys Leu Asn Val Thr Ala Ile Asp Thr Tyr
385                 390                 395                 400
Asp Asp His Arg Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Glu
                405                 410                 415
Val Pro Val Thr Ile Arg Asp Pro Gly Cys Thr Arg Lys Thr Phe Pro
            420                 425                 430
Asp Tyr Phe Asp Val Leu Ser Thr Phe Val Lys Asn
        435                 440
<210>51
<211>455
<212>PRT
<213>农杆菌属物种
<220>
<221>变体
<222>(0)...(0)
<223>菌株CP4
<400>51
Met Ser His Gly Ala Ser Ser Arg Pro Ala Thr Ala Arg Lys Ser Ser
 1               5                  10                  15
Gly Leu Ser Gly Thr Val Arg Ile Pro Gly Asp Lys Ser Ile Ser His
            20                  25                  30
Arg Ser Phe Met Phe Gly Gly Leu Ala Ser Gly Glu Thr Arg Ile Thr
        35                  40                  45
Gly Leu Leu Glu Gly Glu Asp Val Ile Asn Thr Gly Lys Ala Met Gln
    50                  55                  60
Ala Met Gly Ala Arg Ile Arg Lys Glu Gly Asp Thr Trp Ile Ile Asp
65                  70                  75                  80
Gly Val Gly Asn Gly Gly Leu Leu Ala Pro Glu Ala Pro Leu Asp Phe
                85                  90                  95
Gly Asn Ala Ala Thr Gly Cys Arg Leu Thr Met Gly Leu Val Gly Val
            100                 105                 110
Tyr Asp Phe Asp Ser Thr Phe Ile Gly Asp Ala Ser Leu Thr Lys Arg
        115                 120                 125
Pro Met Gly Arg Val Leu Asn Pro Leu Arg Glu Met Gly Val Gln Val
    130                 135                 140
Lys Ser Glu Asp Gly Asp Arg Leu Pro Val Thr Leu Arg Gly Pro Lys
145                 150                 155                 160
Thr Pro Thr Pro Ile Thr Tyr Arg Val Pro Met Ala Ser Ala Gln Val
                165                 170                 175
Lys Ser Ala Val Leu Leu Ala Gly Leu Asn Thr Pro Gly Ile Thr Thr
            180                 185                 190
Val Ile Glu Pro Ile Met Thr Arg Asp His Thr Glu Lys Met Leu Gln
        195                 200                 205
Gly Phe Gly Ala Asn Leu Thr Val Glu Thr Asp Ala Asp Gly Val Arg
    210                 215                 220
Thr Ile Arg Leu Glu Gly Arg Gly Lys Leu Thr Gly Gln Val Ile Asp
225                 230                 235                 240
Val Pro Gly Asp Pro Ser Ser Thr Ala Phe Pro Leu Val Ala Ala Leu
                245                 250                 255
Leu Val Pro Gly Ser Asp Val Thr Ile Leu Asn Val Leu Met Asn Pro
            260                 265                 270
Thr Arg Thr Gly Leu Ile Leu Thr Leu Gln Glu Met Gly Ala Asp Ile
        275                 280                 285
Glu Val Ile Asn Pro Arg Leu Ala Gly Gly Glu Asp Val Ala Asp Leu
    290                 295                 300
Arg Val Arg Ser Ser Thr Leu Lys Gly Val Thr Val Pro Glu Asp Arg
305                 310                 315                 320
Ala Pro Ser Met Ile Asp Glu Tyr Pro Ile Leu Ala Val Ala Ala Ala
                325                 330                 335
Phe Ala Glu Gly Ala Thr Val Met Asn Gly Leu Glu Glu Leu Arg Val
            340                 345                 350
Lys Glu Ser Asp Arg Leu Ser Ala Val Ala Asn Gly Leu Lys Leu Asn
        355                 360                 365
Gly Val Asp Cys Asp Glu Gly Glu Thr Ser Leu Val Val Arg Gly Arg
    370                 375                 380
Pro Asp Gly Lys Gly Leu Gly Asn Ala Ser Gly Ala Ala Val Ala Thr
385                 390                 395                 400
His Leu Asp His Arg Ile Ala Met Ser Phe Leu Val Met Gly Leu Val
                405                 410                 415
Ser Glu Asn Pro Val Thr Val Asp Asp Ala Thr Met Ile Ala Thr Ser
            420                 425                 430
Phe Pro Glu Phe Met Asp Leu Met Ala Gly Leu Gly Ala Lys Ile Glu
        435                 440                 445
Leu Ser Asp Thr Lys Ala Ala
    450                 455
<210>52
<211>428
<212>PRT
<213>枯草芽孢杆菌
<220>
<221>变体
<222>(0)...(0)
<223>EPSPS-蛋白
<400>52
Met Lys Arg Asp Lys Val Gln Thr Leu His Gly Glu Ile His Ile Pro
 1               5                  10                  15
Gly Asp Lys Ser Ile Ser His Arg Ser Val Met Phe Gly Ala Leu Ala
            20                  25                  30
Ala Gly Thr Thr Thr Val Lys Asn Phe Leu Pro Gly Ala Asp Cys Leu
        35                  40                  45
Ser Thr Ile Asp Cys Phe Arg Lys Met Gly Val His Ile Glu Gln Ser
    50                  55                  60
Ser Ser Asp Val Val Ile His Gly Lys Gly Ile Asp Ala Leu Lys Glu
65                  70                  75                  80
Pro Glu Ser Leu Leu Asp Val Gly Asn Ser Gly Thr Thr Ile Arg Leu
                85                  90                  95
Met Leu Gly Ile Leu Ala Gly Arg Pro Phe Tyr Ser Ala Val Ala Gly
            100                 105                 110
Asp Glu Ser Ile Ala Lys Arg Pro Met Lys Arg Val Thr Glu Pro Leu
        115                 120                 125
Lys Lys Met Gly Ala Lys Ile Asp Gly Arg Ala Gly Gly Glu Phe Thr
    130                 135                 140
Pro Leu Ser Val Ser Gly Ala Ser Leu Lys Gly Ile Asp Tyr Val Ser
145                 150                 155                 160
Pro Val Ala Ser Ala Gln Ile Lys Ser Ala Val Leu Leu Ala Gly Leu
                165                 170                 175
Gln Ala Glu Gly Thr Thr Thr Val Thr Glu Pro His Lys Ser Arg Asp
            180                 185                 190
His Thr Glu Arg Met Leu Ser Ala Phe Gly Val Lys Leu Ser Glu Asp
        195                 200                 205
Gln Thr Ser Val Ser Ile Ala Gly Gly Gln Lys Leu Thr Ala Ala Asp
    210                 215                 220
Ile Phe Val Pro Gly Asp Ile Ser Ser Ala Ala Phe Phe Leu Ala Ala
225                 230                 235                 240
Gly Ala Met Val Pro Asn Ser Arg Ile Val Leu Lys Asn Val Gly Leu
                245                 250                 255
Asn Pro Thr Arg Thr Gly Ile Ile Asp Val Leu Gln Asn Met Gly Ala
            260                 265                 270
Lys Leu Glu Ile Lys Pro Ser Ala Asp Ser Gly Ala Glu Pro Tyr Gly
        275                 280                 285
Asp Leu Ile Ile Glu Thr Ser Ser Leu Lys Ala Val Glu Ile Gly Gly
    290                 295                 300
Asp Ile Ile Pro Arg Leu Ile Asp Glu Ile Pro Ile Ile Ala Leu Leu
305                 310                 315                 320
Ala Thr Gln Ala Glu Gly Thr Thr Val Ile Lys Asp Ala Ala Glu Leu
                325                 330                 335
Lys Val Lys Glu Thr Asn Arg Ile Asp Thr Val Val Ser Glu Leu Arg
            340                 345                 350
Lys Leu Gly Ala Glu Ile Glu Pro Thr Ala Asp Gly Met Lys Val Tyr
        355                 360                 365
Gly Lys Gln Thr Leu Lys Gly Gly Ala Ala Val Ser Ser His Gly Asp
    370                 375                 380
His Arg Ile Gly Met Met Leu Gly Ile Ala Ser Cys Ile Thr Glu Glu
385                 390                 395                 400
Pro Ile Glu Ile Glu His Thr Asp Ala Ile His Val Ser Tyr Pro Thr
                405                 410                 415
Phe Phe Glu His Leu Asn Lys Leu Ser Lys Lys Ser
            420                 425
<210>53
<211>1500
<212>DNA
<213>未知
<220>
<223>未知细菌
<221>CDS
<222>(40)...(1371)
<400>53
ctcctacagt tagggcaagt cccccaccac tcgacaagc atg gcg tgt ttg cct     54
                                           Met Ala Cys Leu Pro
                                            1               5
gat gat tcg ggt ccg cat gtc ggc cac tcc acg cca cct cgc ctt gac   102
Asp Asp Ser Gly Pro His Val Gly His Ser Thr Pro Pro Arg Leu Asp
                 10                  15                  20
cag gag cct tgt acc ttg agt tcg cag aaa acc gtg acc gtt aca ccg   150
Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr Val Thr Val Thr Pro
             25                  30                  35
ccc aac ttc ccc ctc act ggc aag gtc gcg ccc ccc ggc tcc aaa tcc   198
Pro Asn Phe Pro Leu Thr GIy Lys Val Ala Pro Pro Gly Ser Lys Ser
         40                  45                  50
att acc aac cgt gcg ctg ttg ctg gcg gca ttg gcc aag ggc acc agc   246
Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu Ala Lys Gly Thr Ser
     55                  60                  65
cgt ttg agc ggt gcg ctc aaa agc gat gac acg cgc cac atg tcg gtc   294
Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr Arg His Met Ser Val
 70                  75                  80                  85
gcc ctg cgg cag atg ggc gtc acc atc gac gag ccg gac gac acc acc   342
Ala Leu Arg Gln Met Gly Val Thr Ile Asp Glu Pro Asp Asp Thr Thr
                 90                  95                 100
ttt gtg gtc acc agc caa ggc tcg ctg caa ttg ccg gcc cag ccg ttg    390
Phe Val Val Thr Ser Gln Gly Ser Leu Gln Leu Pro Ala Gln Pro Leu
            105                 110                 115
ttc ctc ggc aac gct ggc acc gcc atg cgc ttt ctc acg gct gcc gtg    438
Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe Leu Thr Ala Ala Val
        120                 125                 130
gcc acc gtg caa ggc acc gtg gta ctg gac ggc gac gag tac atg caa    486
Ala Thr Val Gln Gly Thr Val Val Leu Asp Gly Asp Glu Tyr Met Gln
    135                 140                 145
aaa cgc ccg att ggc ccg ctg ctg gct acc ctg ggc cag aac ggc atc    534
Lys Arg Pro Ile Gly Pro Leu Leu Ala Thr Leu Gly Gln Asn Gly Ile
150                 155                 160                 165
cag gtc gac agc ccc acc ggt tgc cca ccg gtc acc gtg cac ggc atg    582
Gln Val Asp Ser Pro Thr Gly Cys Pro Pro Val Thr Val His Gly Met
                170                 175                 180
ggc aag gtc cag gcc aag cgt ttc gag att gat ggt ggt ttg tcc agc    630
Gly Lys Val Gln Ala Lys Arg Phe Glu Ile Asp Gly Gly Leu Ser Ser
            185                 190                 195
cag tac gta tcg gcc ctg ctg atg ctc gcg gcg tgc ggc gaa gcg ccg    678
Gln Tyr Val Ser Ala Leu Leu Met Leu Ala Ala Cys Gly Glu Ala Pro
        200                 205                 2l0
att gaa gtg gcg ctg acc ggc aag gat atc ggt gcc cgt ggc tac gtg    726
Ile Glu Val Ala Leu Thr Gly Lys Asp Ile Gly Ala Arg Gly Tyr Val
    215                 220                 225
gac ctg acc ctc gac tgc atg cgt gcc ttc ggg gcc cag gtg gac gcc    774
Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly Ala Gln Val Asp Ala
230                 235                 240                 245
gtg gac gac acc acc tgg cgc gtc gcc ccc acc ggc tat acc gcc cat    822
Val Asp Asp Thr Thr Trp Arg Val Ala Pro Thr Gly Tyr Thr Ala His
                250                 255                 260
gat tac ctg atc gaa ccc gat gcg tcc gcc gcc acg tat ttg tgg gcc    870
Asp Tyr Leu Ile Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala
            265                 270                 275
gca gaa gtg ctg acc ggt ggg cgt atc gac atc ggc gta gcc gcg cag     918
Ala Glu Val Leu Thr Gly Gly Arg Ile Asp Ile Gly Val Ala Ala Gln
        280                 285                 290
gac ttc acc cag ccc gac gcc aag gcc cag gcc gtg att gcg cag ttc     966
Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala Val Ile Ala Gln Phe
    295                 300                 305
ccg aac atg caa gcc acg gtg gta ggc tcg caa atg cag gat gcg atc    1014
Pro Asn Met Gln Ala Thr Val Val Gly Ser Gln Met Gln Asp Ala Ile
310                 315                 320                 325
ccg acc ctg gcg gtg ctc gcc gcg ttc aac aac acc ccg gtg cgt ttc    1062
Pro Thr Leu Ala Val Leu Ala Ala Phe Asn Asn Thr Pro Val Arg Phe
                330                 335                 340
act gaa ctg gcg aac ctg cgc gtc aag gaa tgt gac cgc gtg cag gcg    1110
Thr Glu Leu Ala Asn Leu Arg Val Lys Glu Cys Asp Arg Val Gln Ala
            345                 350                 355
ctg cac gat ggc ctc aac gaa att cgc ccg ggc ctg gcg acc atc gag    1158
Leu His Asp Gly Leu Asn Glu Ile Arg Pro Gly Leu Ala Thr Ile Glu
        360                 365                 370
ggc gat gac ctg ctg gtc gcc agc gac ccg gcc ctg gca ggc acc gcc    1206
Gly Asp Asp Leu Leu Val Ala Ser Asp Pro Ala Leu Ala Gly Thr Ala
    375                 380                 385
tgc acc gca ctg atc gac acc cac gcc gac cat cgc atc gcc atg tgc    1254
Cys Thr Ala Leu Ile Asp Thr His Ala Asp His Arg Ile Ala Met Cys
390                 395                 400                 405
ttt gcc ctg gcc ggg ctt aaa gtc tcg ggc att cgc att caa gac ccg    1302
Phe Ala Leu Ala Gly Leu Lys Val Ser Gly Ile Arg Ile Gln Asp Pro
                410                 415                 420
gac tgc gtg gcc aag acc tac cct gac tac tgg aaa gcc tgg ccc agc    1350
Asp Cys Val Ala Lys Thr Tyr Pro Asp Tyr Trp Lys Ala Trp Pro Ser
            425                 430                 435
ctg ggc gtt cac cta aac gac tgacacacaa aacctgtagc agagcttgct       1401
Leu Gly Val His Leu Asn Asp
        440
cgcgaaaaac gcacacgtgc cgcgtttgtt caggaaacac gcgttatcgt tgacgtttat    1461
cgagctaagc tcgctcctac attttgcagc gagatcttg                           1500
<210>54
<211>444
<212>PRT
<213>未知
<220>
<223>未知细菌
<400>54
Met Ala Cys Leu Pro Asp Asp Ser Gly Pro His Val Gly His Ser Thr
 1               5                  10                  15
Pro Pro Arg Leu Asp Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr
            20                  25                  30
Val Thr Val Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Val Ala Pro
        35                  40                  45
Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu
    50                  55                  60
Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr
65                  70                  75                  80
Arg His Met Ser Val Ala Leu Arg Gln Met Gly Val Thr Ile Asp Glu
                85                  90                  95
Pro Asp Asp Thr Thr Phe Val Val Thr Ser Gln Gly Ser Leu Gln Leu
            100                 105                 110
Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe
        115                 120                 125
Leu Thr Ala Ala Val Ala Thr Val Gln Gly Thr Val Val Leu Asp Gly
    130                 135                 140
Asp Glu Tyr Met Gln Lys Arg Pro Ile Gly Pro Leu Leu Ala Thr Leu
145                 150                 155                 160
Gly Gln Asn Gly Ile Gln Val Asp Ser Pro Thr Gly Cys Pro Pro Val
                165                 170                 175
Thr Val His Gly Met Gly Lys Val Gln Ala Lys Arg Phe Glu Ile Asp
            180                 185                 190
Gly Gly Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu Met Leu Ala Ala
        195                 200                 205
Cys Gly Glu Ala Pro Ile Glu Val Ala Leu Thr Gly Lys Asp Ile Gly
    210                 215                 220
Ala Arg Gly Tyr Val Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly
225                 230                 235                 240
Ala Gln Val Asp Ala Val Asp Asp Thr Thr Trp Arg Val Ala Pro Thr
                245                 250                 255
Gly Tyr Thr Ala His Asp Tyr Leu Ile Glu Pro Asp Ala Ser Ala Ala
            260                 265                 270
Thr Tyr Leu Trp Ala Ala Glu Val Leu Thr Gly Gly Arg Ile Asp Ile
        275                 280                 285
Gly Val Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala
    290                 295                 300
Val Ile Ala Gln Phe Gln Asn Met Gln Ala Thr Val Val Gly Ser Gln
305                 310                 315                 320
Met Gln Asp Ala Ile Pro Thr Leu Ala Val Leu Ala Ala Phe Asn Asn
                325                 330                 335
Thr Pro Val Arg Phe Thr Glu Leu Ala Asn Leu Arg Val Lys Glu Cys
            340                 345                 350
Asp Arg Val Gln Ala Leu His Asp Gly Leu Asn Glu Ile Arg Pro Gly
        355                 360                 365
Leu Ala Thr Ile Glu Gly Asp Asp Leu Leu Val Ala Ser Asp Pro Ala
    370                 375                 380
Leu Ala Gly Thr Ala Cys Thr Ala Leu Ile Asp Thr His Ala Asp His
385                 390                 395                 400
Arg Ile Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Val Ser Gly Ile
                405                 410                 415
Arg Ile Gln Asp Pro Asp Cys Val Ala Lys Thr Tyr Pro Asp Tyr Trp
            420                 425                 430
Lys Ala Trp Pro Ser Leu Gly Val His Leu Asn Asp
        435                 440
<210>55
<211>1257
<212>DNA
<213>丁香假单胞菌
<220>
<221>misc_feature
<222>(0)...(0)
<223>pv syringae菌株B728a
<221>CDS
<222>(1)...(1257)
<400>55
atg cga cct caa gcc acc ctc act gtt ttg cct gtc gag cgc ccg ttg    48
Met Arg Pro Gln Ala Thr Leu Thr Val Leu Pro Val Glu Arg Pro Leu
 1               5                   10                  15
gtc ggg cgt gtc agc ccg ccg ggc tcc aag tcg atc acc aac cgt gca     96
Val Gly Arg Val Ser Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala
             20                  25                  30
ttg ttg ctg gcc ggg ctg gcc aaa ggc acc agc cgc ctg acc ggc gcg    144
Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala
         35                  40                  45
ctg aag agt gat gac acg cgc gtg atg tcc gaa gcc ttg cgt ctg atg    192
Leu Lys Ser Asp Asp Thr Arg Val Met Ser Glu Ala Leu Arg Leu Met
     50                  55                  60
ggc gtg cag gtc gac gag ccg gat gac agc acc ttc gtg gtc acc agc    240
Gly Val Gln Val Asp Glu Pro Asp Asp Ser Thr Phe Val Val Thr Ser
 65                  70                  75                  80
agc ggg cac tgg cag gcg ccg caa cag gcg ctg ttc ctc ggc aat gcc    288
Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala
                 85                  90                  95
ggg act gcg aca cgc ttt ctg acc gcg gca ctg gcc aac ttc gaa ggc    336
Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly
            100                 105                 110
gac ttc gtg gtg gat ggc gac gaa tac atg cgc aag cgc ccg atc ggc    384
Asp Phe Val Val Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro Ile Gly
        115                 120                 125
ccg ttg gtc gat gcc ttg cag cgc atg ggc gtg gag gtc agc gca ccc    432
Pro Leu Val Asp Ala Leu Gln Arg Met Gly Val Glu Val Ser Ala Pro
    130                 135                 140
agt ggt tgc ccg ccg gtg gcc atc aag ggc aag ggc ggt ctt gag gcc    480
Ser Gly Cys Pro Pro Val Ala Ile Lys Gly Lys Gly Gly Leu Glu Ala
145                 150                 155                 160
ggt cgt atc gaa atc gat ggc aat ctg tcc agc cag tat gtg tcg gca    528
Gly Arg Ile Glu Ile Asp Gly Asn Leu Ser Ser Gln Tyr Val Ser Ala
                165                 170                 175
ctg ctg atg gcc ggt gcc tgt ggc aag ggg cct gtg gaa gtt gcc ctg    576
Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Pro Val Glu Val Ala Leu
            180                 185                 190
aca ggc agc gag atc ggc gcg cgt ggt tac ctc gac ctc acg ctg gcg     624
Thr Gly Ser Glu Ile Gly Ala Arg Gly Tyr Leu Asp Leu Thr Leu Ala
        195                 200                 205
gcc atg cgg gcg ttc ggt gcc gag gtt cag gcc atc ggc gac gcc gcc     672
Ala Met Arg Ala Phe Gly Ala Glu Val Gln Ala Ile Gly Asp Ala Ala
    210                 215                 220
tgg aaa gtc tcg gct acc ggt tat cgc gct acg gat ttc cac atc gaa     720
Trp Lys Val Ser Ala Thr Gly Tyr Arg Ala Thr Asp Phe His Ile Glu
225                 230                 235                 240
ccg gat gcc tcg gcg gcc acc tac ctt tgg gct gcg cag gcc ctg acc     768
Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr
                245                 250                 255
gag ggc gct atc gac ctg ggc gtg gcc agc aac gcg ttc act cag cct     816
Glu Gly Ala Ile Asp Leu Gly Val Ala Ser Asn Ala Phe Thr Gln Pro
            260                 265                 270
gat gca ctg gcc agt cag atc atc gcc agc ttc ccg aac atg ccg gcc     864
Asp Ala Leu Ala Ser Gln Ile Ile Ala Ser Phe Pro Asn Met Pro Ala
        275                 280                 285
gtg atc gac ggc tcg cag atg cag gac gcg att ccc acg ctg gcc gta     912
Val Ile Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val
    290                 295                 300
ctg gcc gcg ttc aat cgt caa ccg gtg cgc ttt gtc ggc atc gcc aac     960
Leu Ala Ala Phe Asn Arg Gln Pro Val Arg Phe Val Gly Ile Ala Asn
305                 310                 315                 320
ctg cgg gtc aag gag tgc gac cgc atc tcg gca ctg tcc aac ggc ctg    1008
Leu Arg Val Lys Glu Cys Asp Arg Ile Ser Ala Leu Ser Asn Gly Leu
                325                 330                 335
tgc gcc atc gca ccc ggc ctg gcg gtc gaa gag ggt gac gat ctg atc    1056
Cys Ala Ile Ala Pro Gly Leu Ala Val Glu Glu Gly Asp Asp Leu Ile
            340                 345                 350
gtt acc gcc aac ccg acg ctg gca ggc act acg gtc gat gcc ttg atc    1104
Val Thr Ala Asn Pro Thr Leu Ala Gly Thr Thr Val Asp Ala Leu Ile
        355                 360                 365
gat acc cac tcc gac cat cgg atc gcc atg tgc ttt gca ctg gcg ggc    1152
Asp Thr His Ser Asp His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly
    370                 375                 380
ctg aag att gcc ggc atc cgc att ctc gac cct gac tgc gtc gcc aag    1200
Leu Lys Ile Ala Gly Ile Arg Ile Leu Asp Pro Asp Cys Val Ala Lys
385                 390                 395                 400
acc tac ccg ggg tac tgg gat gcg ctg gtt tct ctg ggt gtg agt gtt    1248
Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Val Ser Leu Gly Val Ser Val
                405                 410                 415
cag cgc tga                                                        1257
Gln Arg *
<210>56
<211>418
<212>PRT
<213>丁香假单胞菌
<220>
<221>变体
<222>(0)...(0)
<223>pv syringae菌株B728a
<400>56
Met Arg Pro Gln Ala Thr Leu Thr Val Leu Pro Val Glu Arg Pro Leu
 1               5                  10                  15
Val Gly Arg Val Ser Pro Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala
            20                  25                  30
Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala
        35                  40                  45
Leu Lys Ser Asp Asp Thr Arg Val Met Ser Glu Ala Leu Arg Leu Met
    50                  55                  60
Gly Val Gln Val Asp Glu Pro Asp Asp Ser Thr Phe Val Val Thr Ser
65                  70                  75                  80
Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala
                85                  90                  95
Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly
            100                 105                 110
Asp Phe Val Val Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro Ile Gly
        115                 120                 125
Pro Leu Val Asp Ala Leu Gln Arg Met Gly Val Glu Val Ser Ala Pro
    130                 135                 140
Ser Gly Cys Pro Pro Val Ala Ile Lys Gly Lys Gly Gly Leu Glu Ala
145                 150                 155                 160
Gly Arg Ile Glu Ile Asp Gly Asn Leu Ser Ser Gln Tyr Val Ser Ala
                165                 170                 175
Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Pro Val Glu Val Ala Leu
            180                 185                 190
Thr Gly Ser Glu Ile Gly Ala Arg Gly Tyr Leu Asp Leu Thr Leu Ala
        195                 200                 205
Ala Met Arg Ala Phe Gly Ala Glu Val Gln Ala Ile Gly Asp Ala Ala
    210                 215                 220
Trp Lys Val Ser Ala Thr Gly Tyr Arg Ala Thr Asp Phe His Ile Glu
225                 230                 235                 240
Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr
                245                 250                 255
Glu Gly Ala Ile Asp Leu Gly Val Ala Ser Asn Ala Phe Thr Gln Pro
            260                 265                 270
Asp Ala Leu Ala Ser Gln Ile Ile Ala Ser Phe Pro Asn Met Pro Ala
        275                 280                 285
Val Ile Asp Gly Ser Gln Met Gln Asp Ala Ile Pro Thr Leu Ala Val
    290                 295                 300
Leu Ala Ala Phe Asn Arg Gln Pro Val Arg Phe Val Gly Ile Ala Asn
305                 310                 315                 320
Leu Arg Val Lys Glu Cys Asp Arg Ile Ser Ala Leu Ser Asn Gly Leu
                325                 330                 335
Cys Ala Ile Ala Pro Gly Leu Ala Val Glu Glu Gly Asp Asp Leu Ile
            340                 345                 350
Val Thr Ala Asn Pro Thr Leu Ala Gly Thr Thr Val Asp Ala Leu Ile
        355                 360                 365
Asp Thr His Ser Asp His Arg Ile Ala Met Cys Phe Ala Leu Ala Gly
    370                 375                 380
Leu Lys Ile Ala Gly Ile Arg Ile Leu Asp Pro Asp Cys Val Ala Lys
385                 390                 395                 400
Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Val Ser Leu Gly Val Ser Val
                405                 410                 415
Gln Arg
<210>57
<211>1332
<212>DNA
<213>苍白杆菌属/布鲁氏菌属
<221>CDS
<222>(1)...(1332)
<400>57
atg gcg tgt ttg cct gat gat tcg ggt ccg cac gtc ggc cac tcc acg     48
Met Ala Cys Leu Pro Asp Asp Ser Gly Pro His Val Gly His Ser Thr
 1               5                   10                  15
cca cct tgc ctt gac cag gag cct tgt acc ttg agt tcg cag aaa acc     96
Pro Pro Cys Leu Asp Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr
             20                  25                  30
gtg acc gtt aca ccg ccc aac ttc ccc ctc act ggc aag gtc gcg ccc    144
Val Thr Val Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Val Ala Pro
         35                  40                  45
ccc ggc tcc aaa tcc att acc aac cgt gcg ctg ttg ctc gcg gca ctg    192
Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu
     50                  55                  60
gcc aag ggc acc agc cgt ttg agc ggt gcg ctc aaa agc gat gac acg    240
Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr
 65                  70                  75                  80
cgc cac atg tcg gtc gcc ctg cgg cag atg ggc gtc acc atc gac gag    288
Arg His Met Ser Val Ala Leu Arg Gln Met Gly Val Thr Ile Asp Glu
                 85                  90                  95
ccg gac gac acc acc ttt gtc gtc acc agc caa ggc tcg ctg caa ttg    336
Pro Asp Asp Thr Thr Phe Val Val Thr Ser Gln Gly Ser Leu Gln Leu
            100                 105                 110
ccg gcc cag ccg ttg ttc ctc ggc aac gcc ggc acc gcc atg cgc ttt    384
Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe
        115                 120                 125
ctc acg gct gcc gtc gcc acc gtg caa ggc acc gtg gta ctg gac ggt    432
Leu Thr Ala Ala Val Ala Thr Val Gln Gly Thr Val Val Leu Asp Gly
    130                 135                 140
gac gag tac atg caa aaa cgc ccg atc ggc ccg ctg ctg gcc acc ctg    480
Asp Glu Tyr Met Gln Lys Arg Pro Ile Gly Pro Leu Leu Ala Thr Leu
145                 150                 155                 160
ggc cag aac ggc atc cag gtc gac agc ccc acc ggt tgc cca ccg gta    528
Gly Gln Asn Gly Ile Gln Val Asp Ser Pro Thr Gly Cys Pro Pro Val
                165                 170                 175
acg gtg cat ggc gcg ggc aag gtc cag gcc agg cgt ttt gag att gac    576
Thr Val His Gly Ala Gly Lys Val Gln Ala Arg Arg Phe Glu Ile Asp
            180                 185                 190
gga ggc ttg tcc agc cag tac gta tcg gcc ctg ctg atg ctg gcg gcg    624
Gly Gly Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu Met Leu Ala Ala
        195                 200                 205
tgc ggc gaa gca ccg att gaa gtg gcg ctg acc ggc aag gac atc ggc    672
Cys Gly Glu Ala Pro Ile Glu Val Ala Leu Thr Gly Lys Asp Ile Gly
    210                 215                 220
gcc cgt ggc tat gtg gac ctg acc ctc gat tgc atg cgt gcg ttc ggg    720
Ala Arg Gly Tyr Val Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly
225                 230                 235                 240
gcc cag gta gac atc gtg gac gac acc acc tgg cgc gtg gcc ccc acg    768
Ala Gln Val Asp Ile Val Asp Asp Thr Thr Trp Arg Val Ala Pro Thr
                245                 250                 255
ggc tat acc gcc cat gat tac ctg atc gaa ccc gac gct tcc gcc gcc    816
Gly Tyr Thr Ala His Asp Tyr Leu Ile Glu Pro Asp Ala Ser Ala Ala
            260                 265                 270
act tac ctg tgg gcc gca gaa gta ctg acc ggt ggc cgt atc gat att    864
Thr Tyr Leu Trp Ala Ala Glu Val Leu Thr Gly Gly Arg Ile Asp Ile
        275                 280                 285
ggt gta gcc gcg cag gac ttc acc cag ccc gac gcc aag gca cag gcc    912
Gly Val Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala
    290                 295                 300
gtg atc gcg caa ttc ccg aac atg cag gcc acg gtg gtg ggt tca caa    960
Val Ile Ala Gln Phe Pro Asn Met Gln Ala Thr Val Val Gly Ser Gln
305                 310                 315                 320
atg cag gat gcg atc ccg acc ctg gcg gtg ctc gcc gca ttc aac aat   1008
Met Gln Asp Ala Ile Pro Thr Leu Ala Val Leu Ala Ala Phe Asn Ash
                325                 330                 335
acc ccg gtg cgc ttc act gaa ctg gcg aac ctg cgc gtc aag gaa tgt    1056
Thr Pro Val Arg Phe Thr Glu Leu Ala Asn Leu Arg Val Lys Glu Cys
            340                 345                 350
gac cgc gtg cag gcg ctg cac gat ggc ctc aac gaa att cgc ccg ggc    1104
Asp Arg Val Gln Ala Leu His Asp Gly Leu Asn Glu Ile Arg Pro Gly
        355                 360                 365
ctg gcg acc atc gaa ggt gat gac ctg ctg gtt gcc agc gac ccc gct    1152
Leu Ala Thr Ile Glu Gly Asp Asp Leu Leu Val Ala Ser Asp Pro Ala
    370                 375                 380
ttg gct ggc acc gcc tgc acc gca ctg atc gat acc cac gcc gac cat    1200
Leu Ala Gly Thr Ala Cys Thr Ala Leu Ile Asp Thr His Ala Asp His
385                 390                 395                 400
cgc atc gcc atg tgc ttt gcc ctg gcc ggg ctg aaa gtc tcg ggc att    1248
Arg Ile Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Val Ser Gly Ile
                405                 410                 415
cgc atc caa gac cct gat tgc gta gcc aag acc tac cct gac tac tgg    1296
Arg Ile Gln Asp Pro Asp Cys Val Ala Lys Thr Tyr Pro Asp Tyr Trp
            420                 425                 430
aaa gcg ctg gcc agc ctg ggc gtt cac tta agc tac                    1332
Lys Ala Leu Ala Ser Leu Gly Val His Leu Ser Tyr
        435                 440
<210>58
<211>1236
<212>DNA
<213>苍白杆菌属/布鲁氏菌属
<221>CDS
<222>(1)...(1236)
<400>58
gtg acc gtt aca ccg ccc aac ttc ccc ctc act ggc aag gtc gcg ccc    48
Met Thr Val Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Val Ala Pro
 1               5                   10                  15
ccc ggc tcc aaa tcc att acc aac cgt gcg ctg ttg ctc gcg gca ctg     96
Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu
             20                  25                  30
gcc aag ggc acc agc cgt ttg agc ggt gcg ctc aaa agc gat gac acg    144
Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr
         35                  40                  45
cgc cac atg tcg gtc gcc ctg cgg cag atg ggc gtc acc atc gac gag    192
Arg His Met Ser Val Ala Leu Arg Gln Met Gly Val Thr Ile Asp Glu
     50                  55                  60
ccg gac gac acc acc ttt gtc gtc acc agc caa ggc tcg ctg caa ttg    240
Pro Asp Asp Thr Thr Phe Val Val Thr Ser Gln Gly Ser Leu Gln Leu
 65                  70                  75                  80
ccg gcc cag ccg ttg ttc ctc ggc aac gcc ggc acc gcc atg cgc ttt    288
Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe
                 85                  90                  95
ctc acg gct gcc gtc gcc acc gtg caa ggc acc gtg gta ctg gac ggt    336
Leu Thr Ala Ala Val Ala Thr Val Gln Gly Thr Val Val Leu Asp Gly
            100                 105                 110
gac gag tac atg caa aaa cgc ccg atc ggc ccg ctg ctg gcc acc ctg    384
Asp Glu Tyr Met Gln Lys Arg Pro Ile Gly Pro Leu Leu Ala Thr Leu
        115                 120                 125
ggc cag aac ggc atc cag gtc gac agc ccc acc ggt tgc cca ccg gta    432
Gly Gln Asn Gly Ile Gln Val Asp Ser Pro Thr Gly Cys Pro Pro Val
    130                 135                 140
acg gtg cat ggc gcg ggc aag gtc cag gcc agg cgt ttt gag att gac    480
Thr Val His Gly Ala Gly Lys Val Gln Ala Arg Arg Phe Glu Ile Asp
145                 150                 155                 160
gga ggc ttg tcc agc cag tac gta tcg gcc ctg ctg atg ctg gcg gcg    528
Gly Gly Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu Met Leu Ala Ala
                165                 170                 175
tgc ggc gaa gca ccg att gaa gtg gcg ctg acc ggc aag gac atc ggc    576
Cys Gly Glu Ala Pro Ile Glu Val Ala Leu Thr Gly Lys Asp Ile Gly
            180                 185                 190
gcc cgt ggc tat gtg gac ctg acc ctc gat tgc atg cgt gcg ttc ggg     624
Ala Arg Gly Tyr Val Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly
        195                 200                 205
gcc cag gta gac atc gtg gac gac acc acc tgg cgc gtg gcc ccc acg     672
Ala Gln Val Asp Ile Val Asp Asp Thr Thr Trp Arg Val Ala Pro Thr
    210                 215                 220
ggc tat acc gcc cat gat tac ctg atc gaa ccc gac gct tcc gcc gcc     720
Gly Tyr Thr Ala His Asp Tyr Leu Ile Glu Pro Asp Ala Ser Ala Ala
225                 230                 235                 240
act tac ctg tgg gcc gca gaa gta ctg acc ggt ggc cgt atc gat att     768
Thr Tyr Leu Trp Ala Ala Glu Val Leu Thr Gly Gly Arg Ile Asp Ile
                245                 250                 255
ggt gta gcc gcg cag gac ttc acc cag ccc gac gcc aag gca cag gcc     816
Gly Val Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala
            260                 265                 270
gtg atc gcg caa ttc ccg aac atg cag gcc acg gtg gtg ggt tca caa     864
Val Ile Ala Gln Phe Pro Asn Met Gln Ala Thr Val Val Gly Ser Gln
        275                 280                 285
atg cag gat gcg atc ccg acc ctg gcg gtg ctc gcc gca ttc aac aat     912
Met Gln Asp Ala Ile Pro Thr Leu Ala Val Leu Ala Ala Phe Asn Asn
    290                 295                 300
acc ccg gtg cgc ttc act gaa ctg gcg aac ctg cgc gtc aag gaa tgt     960
Thr Pro Val Arg Phe Thr Glu Leu Ala Asn Leu Arg Val Lys Glu Cys
305                 310                 315                 320
gac cgc gtg cag gcg ctg cac gat ggc ctc aac gaa att cgc ccg ggc    1008
Asp Arg Val Gln Ala Leu His Asp Gly Leu Asn Glu Ile Arg Pro Gly
                325                 330                 335
ctg gcg acc atc gaa ggt gat gac ctg ctg gtt gcc agc gac ccc gct    1056
Leu Ala Thr Ile Glu Gly Asp Asp Leu Leu Val Ala Ser Asp Pro Ala
            340                 345                 350
ttg gct ggc acc gcc tgc acc gca ctg atc gat acc cac gcc gac cat    1104
Leu Ala Gly Thr Ala Cys Thr Ala Leu Ile Asp Thr His Ala Asp His
        355                 360                 365
cgc atc gcc atg tgc ttt gcc ctg gcc ggg ctg aaa gtc tcg ggc att    1152
Arg Ile Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Val Ser Gly Ile
    370                 375                 380
cgc atc caa gac cct gat tgc gta gcc aag acc tac cct gac tac tgg    1200
Arg Ile Gln Asp Pro Asp Cys Val Ala Lys Thr Tyr Pro Asp Tyr Trp
385                 390                 395                 400
aaa gcg ctg gcc agc ctg ggc gtt cac tta agc tac                    1236
Lys Ala Leu Ala Ser Leu Gly Val His Leu Ser Tyr
                405                 410
<210>59
<211>412
<212>PRT
<213>苍白杆菌属/布鲁氏菌属
<400>59
Met Thr Val Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Val Ala Pro
 1               5                  10                  15
Pro Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu
            20                  25                  30
Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr
        35                  40                  45
Arg His Met Ser Val Ala Leu Arg Gln Met Gly Val Thr Ile Asp Glu
    50                  55                  60
Pro Asp Asp Thr Thr Phe Val Val Thr Ser Gln Gly Ser Leu Gln Leu
65                  70                  75                  80
Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe
                85                  90                  95
Leu Thr Ala Ala Val Ala Thr Val Gln Gly Thr Val Val Leu Asp Gly
            100                 105                 110
Asp Glu Tyr Met Gln Lys Arg Pro Ile Gly Pro Leu Leu Ala Thr Leu
        115                 120                 125
Gly Gln Asn Gly Ile Gln Val Asp Ser Pro Thr Gly Cys Pro Pro Val
    130                 135                 140
Thr Val His Gly Ala Gly Lys Val Gln Ala Arg Arg Phe Glu Ile Asp
145                 150                 155                 160
Gly Gly Leu Ser Ser Gln Tyr Val Ser Ala Leu Leu Met Leu Ala Ala
                165                 170                 175
Cys Gly Glu Ala Pro Ile Glu Val Ala Leu Thr Gly Lys Asp Ile Gly
            180                 185                 190
Ala Arg Gly Tyr Val Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly
        195                 200                 205
Ala Gln Val Asp Ile Val Asp Asp Thr Thr Trp Arg Val Ala Pro Thr
    210                 215                 220
Gly Tyr Thr Ala His Asp Tyr Leu Ile Glu Pro Asp Ala Ser Ala Ala
225                 230                 235                 240
Thr Tyr Leu Trp Ala Ala Glu Val Leu Thr Gly Gly Arg Ile Asp Ile
                245                 250                 255
Gly Val Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala
            260                 265                 270
Val Ile Ala Gln Phe Pro Asn Met Gln Ala Thr Val Val Gly Ser Gln
        275                 280                 285
Met Gln Asp Ala Ile Pro Thr Leu Ala Val Leu Ala Ala Phe Asn Asn
    290                 295                 300
Thr Pro Val Arg Phe Thr Glu Leu Ala Asn Leu Arg Val Lys Glu Cys
305                 310                 315                 320
Asp Arg Val Gln Ala Leu His Asp Gly Leu Asn Glu Ile Arg Pro Gly
                325                 330                 335
Leu Ala Thr Ile Glu Gly Asp Asp Leu Leu Val Ala Ser Asp Pro Ala
            340                 345                 350
Leu Ala Gly Thr Ala Cys Thr Ala Leu Ile Asp Thr His Ala Asp His
        355                 360                 365
Arg Ile Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Val Ser Gly Ile
    370                 375                 380
Arg Ile Gln Asp Pro Asp Cys Val Ala Lys Thr Tyr Pro Asp Tyr Trp
385                 390                 395                 400
Lys Ala Leu Ala Ser Leu Gly Val His Leu Ser Tyr
                405                 410
<210>60
<211>1496
<212>DNA
<213>未知
<220>
<223>分离自土壤样品
<400>60
aagcaccggc tcacaaattc ccgccgatat tccgatagcc cggctttgcg ccgcattctt     60
tgacaagacg acgatcatga tcgaactgac catcaccccg cccggccacc cgctttccgg    120
caaggtggag ccgcccggtt ccaaatccat taccaaccgt gcacttctgc tggccgggct    180
cgccaagggc aaaagccgtc tcacgggcgc gctgaaaagc gacgatacgc tttacatggc    240
agaagcgctg cgtgagatgg gtgtcaaggt aaccgagcct gacgcgacca ccttcgtggt    300
ggagagttca ggtgggttgc atcagccgga aaagccgctt ttcctcggca atgccggcac    360
agctacccgc tttctcaccg ccgctgccgc ccttgtggat ggcgccgtca tcatcgatgg   420
cgacgagcat atgcgcaaac gcccgatcat gccgctggtg gaagccctgc gctccctcgg   480
cgttgaggcg gaggcgccga ccggctgccc gcccgtcacc gtctgcggta agggtactgg   540
cttcccgaag ggcagcgtca cgatcgacgc caacctttcc agccagtatg tgtccgcact   600
tctgatggcc gccgcctgcg gcgacaagcc tgtcgatatc atcctcaaag gtgaggaaat   660
cggcgcgaag ggctatatcg atctcaccac atcggccatg gaagccttcg gcgcaaaggt   720
ggagcgggtc agcaacgcca tctggcgcgt gcatccgacc ggctacacgg cgaccgattt   780
ccatatcgag ccggatgcct cggccgccac ctatctctgg ggcgctgagc ttttgaccgg   840
cggcgccatc gatatcggta cgccggccga caagttcacc cagccggatg ccaaggccca   900
tgaggtcatg gcgcaatttc cgcatctgcc cgccgaaatc gacggttcgc agatgcagga   960
tgccattccc accattgccg ttctcgccgc ctttaacgaa acgccggtgc gtttcgtcgg  1020
catcgccaat ctgcgcgtca aggagtgcga ccgaatccgc gccgtctcac tcggcctcaa  1080
cgaaatccgc gatggtctgg cgcatgagga aggcgacgac ttgatcgtgc attccgatcc  1140
ttcgcttgcg ggccagacgg tgaatgcctc catcgacact ttcgccgacc accgtatcgc  1200
catgagcttt gcgctggcgg cgctgaagat cggcggcatt gccatccaga atccggcctg  1260
cgtgggcaag acctatcccg gttactggaa ggcgctcgcc tcgctgggag tcgaatactc  1320
ggaaaaggaa accgctgccg agccgcagca ttagaagaac ggtattggtt ttccgtcatt  1380
ccggccctga gccggaatcc agtgcgatca agtccttgat cgcgaaagac tcttcaagcc  1440
gcgcagacgc gcggctgctg gataccgggt ctagcccggt atgacggcaa tgactg      1496
<210>61
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>61
cagagatctg gcatgcgacc tcaagccact ctc                                33
<210>62
<211>31
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>62
cagggcgcgc ctcagcgctg aacactcacc c                                  31
<210>63
<211>34
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>63
cagggatccg gcatgatcga actgaccatc accc                   34
<210>64
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>64
cagggcgcgc ctcagtgctg cggctcggca gcg                    33
<210>65
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>65
cagggatccg gcatgcgacc tcaagccacc ctc                    33
<210>66
<211>31
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>66
cagggcgcgc ctcagcgctg aacactcaca c                      31
<210>67
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>67
cagggatccg gcatgcgacc tcaagccacc ctc                      33
<210>68
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>68
agaggcgcgc ctcagcgctg aacacgcacc                          30

Claims (20)

1.分离的编码草甘膦耐受性5-烯醇丙酮基莽草酸-3-磷酸合酶(EPSPS)酶的多核苷酸,其中所述的多核苷酸选自:
a)SEQ ID NO:9、57或58的核苷酸序列;
b)以保藏号B-30833或B-30838保藏的质粒的DNA***物的除草剂抗性核苷酸序列;以及
c)编码SEQ ID NO:10的氨基酸序列或SEQ ID NO:59的氨基酸序列的多肽的核苷酸序列。
2.权利要求1的多核苷酸,其中所述的多核苷酸连接至启动子,该启动子在植物细胞中起作用导致RNA序列的产生。
3.权利要求1的多核苷酸,其中所述的多核苷酸连接至启动子,该启动子在植物细胞中起作用导致RNA序列的产生,该RNA序列使得能充分表达编码的EPSPS酶,来增强用该多核苷酸转化的植物细胞的草甘膦耐受性。
4.权利要求3的多核苷酸,所述的多核苷酸另外包含3’非翻译区,该3’非翻译区在植物细胞中起作用而导致将一段多腺苷酸化核苷酸添加在RNA序列的3’末端。
5.权利要求3的多核苷酸,其中所述的启动子相对于该多核苷酸是异源的。
6.权利要求1的多核苷酸,其中所述的多核苷酸编码含有氨基-末端叶绿体转运肽和EPSPS酶的融合多肽。
7.一种生产对草甘膦除草剂耐受的遗传转化植物的方法,所述的方法包括步骤:
a)将多核苷酸***至植物细胞的基因组中,所述的多核苷酸由如下组成:
i)启动子,其在植物细胞中起作用而导致RNA序列的产生,
ii)编码草甘膦耐受性5-烯醇丙酮基莽草酸-3-磷酸合酶酶的多核苷酸,其中所述的多核苷酸选自:
1)SEQ ID NO:9、57或58的核苷酸序列;
2)以保藏号B-30833或B-30838保藏的质粒的DNA***物的除草剂抗性核苷酸序列;以及
3)编码SEQ ID NO:10或59的氨基酸序列的多肽的核苷酸序列;
iii)3’非翻译多核苷酸,其在植物细胞中起作用而导致一段多腺苷酸化核苷酸添加在RNA序列的3’末端;
b)获得转化的植物细胞;以及
c)从转化的植物细胞再生具有增强的草甘膦除草剂耐受性的遗传转化植物。
8.权利要求7的方法,其中获得转化的植物包括筛选增强的草甘膦除草剂耐受性。
9.权利要求7的方法,其中所述的多核苷酸编码含有氨基-末端叶绿体转运肽和EPSPS酶的融合多肽。
10.一种分离的多肽,所述的多肽选自:
a)SEQ ID NO:10或59的氨基酸序列的多肽;
b)由SEQ ID NO:57或58的核苷酸序列编码的多肽;
c)SEQ ID NO:10的氨基酸序列或SEQ ID NO:59的氨基酸序列的多肽,其中所述的多肽具有抗除草剂活性;
d)通过SEQ ID NO:9、57或58的核苷酸序列编码的多肽,其中所述的多肽具有抗除草剂活性;以及,
e)由质粒的DNA***物的抗除草剂核苷酸序列编码的多肽,所述的质粒以保藏号B-30833或B-30838保藏。
11.一种用于选择性控制有植物种子或植物的田地中的杂草的方法,所述的方法包括:
a)栽培草甘膦耐受的种子或植物,所述的植物或种子已将含有异源多核苷酸的多核苷酸整合进它们的基因组中,所述的异源多核苷酸由如下组成:
i)启动子,其在植物细胞中起作用而导致RNA序列的产生;
ii)编码草甘膦耐受性5-烯醇丙酮基莽草酸-3-磷酸合酶(EPSPS)酶的多核苷酸,其中所述的多核苷酸选自:
1)SEQ ID NO:9、57或58的核苷酸序列;
2)以保藏号B-30833或B-30838保藏的质粒的DNA***物的除草剂抗性核苷酸序列;以及
3)编码SEQ ID NO:10的氨基酸序列或SEQ ID NO:59的氨基酸序列的多肽的核苷酸序列;
iii)3’非翻译多核苷酸,其在植物细胞中起作用而导致一段多腺苷酸化核苷酸添加在RNA序列的3’末端;以及
b)施用给田间的植物和杂草足够量的草甘膦除草剂,来控制杂草而不会显著地影响植物。
12.权利要求11的方法,其中所述的植物或植物种子包括农作物。
13.权利要求11的方法,其中所述的启动子相对于所述多核苷酸是异源的,并且适用于导致EPSPS酶的充分表达来增强用该多核苷酸转化的植物的草甘膦耐受性。
14.一种生产对草甘膦除草剂耐受的遗传转化植物的方法,所述的方法包括步骤:
a)将权利要求1的多核苷酸***至植物细胞的基因组中;
b)获得转化的植物细胞;以及
c)从转化的植物细胞再生出具有增强的草甘膦除草剂耐受性的遗传转化植物。
15.一种产生对草甘膦耐受的遗传转化植物的方法,所述的方法包括:用含有多核苷酸的DNA构建体转化植物细胞,以及再生转化的植物,所述多核苷酸的序列选自SEQ ID NO:9、57或58。
16.权利要求15的方法,其中所述的DNA构建体还含有启动子,该启动子在植物细胞中起作用而导致RNA序列的产生,所述RNA序列使得能充分表达编码的EPSPS酶,来增强用该多核苷酸转化的植物细胞的草甘膦耐受性。
17.权利要求15的方法,其中所述的多核苷酸编码含有氨基-末端叶绿体转运肽和EPSPS酶的融合多肽。
18.一种用于选择性控制具有种植的种子或植物的田地中的杂草的方法,所述的方法包括:
a)栽培含有权利要求1的多核苷酸的植物或源自其的转化种子,以及
b)施用给田间的植物和杂草足够量的草甘膦除草剂,来控制杂草而不会显著地影响植物。
19.权利要求18的方法,其中所述的植物或植物种子包括农作物。
20.权利要求18的方法,其中所述的多核苷酸编码含有氨基-末端叶绿体转运肽和EPSPS酶的融合多肽。
CN200680016320.XA 2005-04-08 2006-04-07 一类新型epsp合酶的鉴定 Expired - Fee Related CN101175850B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US66968605P 2005-04-08 2005-04-08
US60/669,686 2005-04-08
US67834805P 2005-05-06 2005-05-06
US60/678,348 2005-05-06
US69519305P 2005-06-29 2005-06-29
US60/695,193 2005-06-29
US72518205P 2005-10-11 2005-10-11
US60/725,182 2005-10-11
PCT/US2006/013161 WO2006110586A2 (en) 2005-04-08 2006-04-07 Identification of a new class of epsp synthases

Publications (2)

Publication Number Publication Date
CN101175850A CN101175850A (zh) 2008-05-07
CN101175850B true CN101175850B (zh) 2013-09-04

Family

ID=37087567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680016320.XA Expired - Fee Related CN101175850B (zh) 2005-04-08 2006-04-07 一类新型epsp合酶的鉴定

Country Status (11)

Country Link
US (3) US7700842B2 (zh)
EP (2) EP1871875A2 (zh)
JP (1) JP4879969B2 (zh)
CN (1) CN101175850B (zh)
AR (1) AR053049A1 (zh)
AU (1) AU2006235263B2 (zh)
BR (1) BRPI0608940A2 (zh)
CA (1) CA2603465C (zh)
MX (1) MX2007012462A (zh)
NZ (1) NZ563000A (zh)
WO (1) WO2006110586A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104745610A (zh) * 2013-12-27 2015-07-01 上海市农业科学院 一种源于豌豆根瘤菌的EPSP合酶基因AroA-Rl及其制备方法和应用
CN106520721A (zh) * 2017-01-06 2017-03-22 天津农学院 一种高抗草甘膦epsp合酶及其编码基因的应用

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7700842B2 (en) * 2005-04-08 2010-04-20 Athenix Corporation Identification of a new class of EPSP synthases
CN101484463A (zh) * 2006-05-12 2009-07-15 联邦科学技术研究组织 降解除草剂的酶
NZ573150A (en) * 2006-06-27 2011-09-30 Athenix Corp Grg33, grg35, grg36, grg37, grg38, grg39, and grg50: novel epsp synthase genes conferring herbicide resistance
BRPI0719672A2 (pt) 2006-11-29 2013-12-24 Athenix Corp Molécula isolada de ácido nucleico, vetor, célula hospedeira, planta transgênica, semente transgênica, polipeptídeo isolado, método para produzir um polipeptídeo com atividade de resistência a herbicidas, método para conferir resistência a um herbicida em uma planta, planta, método para aumentar o vigor ou rendimento de uma planta, método para conferir resistência ao glifosato a uma planta
WO2009085982A1 (en) * 2007-12-19 2009-07-09 Monsanto Technology Llc Method to enhance yield and purity of hybrid crops
CN101932701A (zh) 2008-02-01 2010-12-29 阿森尼克斯公司 Grg31和grg36 epsp合酶的定向进化
EP2449108A1 (en) * 2009-07-01 2012-05-09 Bayer BioScience N.V. Methods and means for obtaining plants with enhanced glyphosate tolerance
BR112012018108A2 (pt) 2010-01-22 2015-10-20 Bayer Ip Gmbh combinações acaricidas e/ou inseticidas de ingredientes ativos
JP6092100B2 (ja) 2010-06-09 2017-03-08 バイエル・クロップサイエンス・エヌ・ヴェーBayer Cropscience N.V. 植物ゲノム工学に一般的に使用されるヌクレオチド配列において植物ゲノムを改変するための方法および手段
AU2011264074B2 (en) 2010-06-09 2015-01-22 Bayer Cropscience Nv Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering
JP5860471B2 (ja) 2010-11-15 2016-02-16 バイエル・インテレクチュアル・プロパティ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングBayer Intellectual Property GmbH N−アリールピラゾール(チオ)カルボキサミド類
US9265252B2 (en) 2011-08-10 2016-02-23 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
EP2748323B1 (en) 2011-08-22 2019-05-01 BASF Agricultural Solutions Seed US LLC Methods and means to modify a plant genome
RU2626535C2 (ru) 2012-02-01 2017-07-28 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Синтетические происходящие из brassica транзитные пептиды хлоропластов
AU2013205557B2 (en) 2012-04-17 2016-04-21 Corteva Agriscience Llc Synthetic brassica-derived chloroplast transit peptides
WO2013160230A1 (en) 2012-04-23 2013-10-31 Bayer Cropscience Nv Targeted genome engineering in plants
CN104995174A (zh) 2012-12-19 2015-10-21 拜耳作物科学股份公司 二氟甲基-烟酰-四氢萘基胺
AU2013361220A1 (en) 2012-12-21 2015-04-02 Pioneer Hi-Bred International, Inc. Compositions and methods for auxin-analog conjugation
US20140289906A1 (en) 2013-03-14 2014-09-25 Pioneer Hi-Bred International, Inc. Compositions Having Dicamba Decarboxylase Activity and Methods of Use
US20160040149A1 (en) 2013-03-14 2016-02-11 Pioneer Hi-Bred International Inc. Compositions Having Dicamba Decarboxylase Activity and Methods of Use
CN103205404B (zh) * 2013-03-26 2014-08-27 上海市农业科学院 来源于苹果的epsp合酶多位点突变体及其编码基因与应用
BR112016008489A2 (pt) 2013-10-18 2017-10-03 Pioneer Hi Bred Int Sequências de glifosato-n-acetiltransferase (glyat) e métodos de uso
BR112016013349B8 (pt) 2013-12-20 2022-08-23 Dow Agrosciences Llc Controle de erva daninha herbicida sinergístico e aperfeiçoada tolerância de colheita a partir de combinações de 2,4-d-colina, glifosato, e glufosinato em áreas de colheita de soja, milho, algodão e outras tolerantes a 2,4-d-, glifosato e glufosinato
US10053702B2 (en) 2014-04-22 2018-08-21 E I Du Pont De Nemours And Company Plastidic carbonic anhydrase genes for oil augmentation in seeds with increased DGAT expression
AR100785A1 (es) 2014-06-09 2016-11-02 Dow Agrosciences Llc Control herbicida de maleza a partir de combinaciones de fluroxipir e inhibidores de als
CN107531676A (zh) 2015-04-13 2018-01-02 拜耳作物科学股份公司 N‑环烷基‑n‑(双杂环基亚乙基)‑(硫代)羧酰胺衍生物

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4196265A (en) 1977-06-15 1980-04-01 The Wistar Institute Method of producing antibodies
US5094945A (en) 1983-01-05 1992-03-10 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthase, production and use
US4535060A (en) * 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
DE3687682T2 (de) 1985-08-07 1993-08-19 Monsanto Co Glyphosat resistente pflanzen.
US5240842A (en) 1989-07-11 1993-08-31 Biotechnology Research And Development Corporation Aerosol beam microinjector
US20010003849A1 (en) 1989-08-07 2001-06-14 Kenneth A. Barton Expression of genes in plants
US5633435A (en) * 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
CA2396392C (en) 1999-11-29 2015-04-21 Midwest Oilseeds, Inc. Methods and compositions for the introduction of molecules into cells
US7314974B2 (en) * 2002-02-21 2008-01-01 Monsanto Technology, Llc Expression of microbial proteins in plants for production of plants with improved properties
AU2003228440B2 (en) 2002-04-01 2008-10-02 Walter Reed Army Institute Of Research Method of designing synthetic nucleic acid sequences for optimal protein expression in a host cell
AU2003255106A1 (en) * 2003-08-08 2005-02-25 Biotechnology Research Institute, Chinese Academy of Agricultural Science 5-enolpyruvyl-3-phosphoshikimate synthase of high glyphosate-bioresistance and coding sequence
US7700842B2 (en) * 2005-04-08 2010-04-20 Athenix Corporation Identification of a new class of EPSP synthases

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104745610A (zh) * 2013-12-27 2015-07-01 上海市农业科学院 一种源于豌豆根瘤菌的EPSP合酶基因AroA-Rl及其制备方法和应用
CN106520721A (zh) * 2017-01-06 2017-03-22 天津农学院 一种高抗草甘膦epsp合酶及其编码基因的应用

Also Published As

Publication number Publication date
MX2007012462A (es) 2007-11-07
US7700842B2 (en) 2010-04-20
NZ563000A (en) 2009-10-30
US20060253921A1 (en) 2006-11-09
WO2006110586A2 (en) 2006-10-19
CA2603465A1 (en) 2006-10-19
AU2006235263B2 (en) 2012-05-24
JP2008535495A (ja) 2008-09-04
BRPI0608940A2 (pt) 2010-02-17
US20100144530A1 (en) 2010-06-10
AR053049A1 (es) 2007-04-18
AU2006235263A1 (en) 2006-10-19
CA2603465C (en) 2015-06-30
US20100144529A1 (en) 2010-06-10
EP1871875A2 (en) 2008-01-02
CN101175850A (zh) 2008-05-07
WO2006110586A3 (en) 2007-01-25
JP4879969B2 (ja) 2012-02-22
EP2295548A1 (en) 2011-03-16

Similar Documents

Publication Publication Date Title
CN101175850B (zh) 一类新型epsp合酶的鉴定
US7960615B2 (en) GRG36: novel EPSP synthase gene conferring herbicide resistance
US7534937B2 (en) Genes conferring herbicide resistance
US8003854B2 (en) GRG32: a novel EPSP synthase gene conferring herbicide resistance
US9045765B2 (en) EPSP synthase genes conferring herbicide resistance
US8097775B2 (en) GRO-1 herbicide resistance gene and methods for its use
MX2008015557A (es) Epsp sintasas mejoradas: composiciones y metodos de uso.
AU2007257851A1 (en) Novel EPSP synthase genes conferring herbicide resistance

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200324

Address after: New jersey, USA

Patentee after: BASF Agricultural Solutions Seeds US LLC

Address before: Ludwigshafen, Germany

Patentee before: BASF SE

Effective date of registration: 20200324

Address after: Ludwigshafen, Germany

Patentee after: BASF SE

Address before: North Carolina, USA

Patentee before: ATHENIX Corp.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130904

Termination date: 20210407

CF01 Termination of patent right due to non-payment of annual fee