CN109890970B - 生产目标物质的方法 - Google Patents

生产目标物质的方法 Download PDF

Info

Publication number
CN109890970B
CN109890970B CN201780066709.3A CN201780066709A CN109890970B CN 109890970 B CN109890970 B CN 109890970B CN 201780066709 A CN201780066709 A CN 201780066709A CN 109890970 B CN109890970 B CN 109890970B
Authority
CN
China
Prior art keywords
gene
microorganism
target substance
protein
strain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780066709.3A
Other languages
English (en)
Other versions
CN109890970A (zh
Inventor
B.米吉茨
S.莫迪
M.西迪奎
C.罗切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Publication of CN109890970A publication Critical patent/CN109890970A/zh
Application granted granted Critical
Publication of CN109890970B publication Critical patent/CN109890970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/22Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • C12N9/1011Catechol O-methyltransferase (2.1.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

提供了用于生产目标物质诸如香草醛和香草酸的方法。通过使用具有目标物质生产能力的微生物从碳源或目标物质的前体生产目标物质,所述微生物已经经修饰而具有拟杆菌门O‑甲基转移酶(OMT),尤其是编码具有特定突变的OMT的OMT基因。

Description

生产目标物质的方法
发明领域
本发明涉及通过使用微生物生产目标物质,诸如香草醛和香草酸的方法。
发明背景
香草醛是提供香草气味的主要成分,并且用作食品、饮料、香水等中的芳香物。香草醛通常通过从天然产物中提取或通过化学合成来生产。
已经尝试在生产香草醛的方法中尝试生物工程技术,例如通过使用各种微生物与丁香油酚、异丁香油酚、阿魏酸、葡萄糖、香草酸、椰子壳等(Kaur B.and Chakraborty D.,Biotechnological and molecular approaches for vanillin production:areview.Appl Biochem Biotechnol.2013Feb;169(4):1353-72)。另外,使用生物工程技术生产香草醛的其他方法包括以糖苷生产(WO2013/022881和WO2004/111254),使用香草醛合酶从阿魏酸生产香草醛(JP2015-535181),通过大肠杆菌发酵来生产香草酸,然后将香草酸酶促转化为香草醛(美国专利No.6,372,461)。
香草醛可以经由中间体原儿茶酸产生。具体地,原儿茶酸可以转化成香草酸或原儿茶醛,并且香草酸或原儿茶醛然后可以转化成香草醛。O-甲基转移酶(OMT)催化使原儿茶酸和/或原儿茶醛甲基化以产生香草酸和/或香草醛的反应,即间位的羟基基团的甲基化。OMT也可以催化使原儿茶酸和/或原儿茶醛甲基化以产生异香草酸和/或异香草醛的反应,即对位的羟基基团的甲基化,作为副反应。选择性催化间位的羟基基团的甲基化的突变体OMT可以用于产生目标物质,诸如香草醛(参见WO2013/022881)。
发明概述
本发明描述了用于改善目标物质诸如香草醛和香草酸的生产的新技术,因此提供了用于有效生产目标物质的方法。
本发明的一方面是通过突变O-甲基转移酶(OMT)以使它在选择的微生物中具有特定突变,微生物可以以显著改善的方式生产目标物质诸如香草酸。
本发明的一方面提供了生产目标物质的方法,所述方法包括以下步骤:通过使用具有生产所述目标物质的能力的微生物来生产所述目标物质,其中所述微生物已经以使该微生物具有属于拟杆菌门(Bacteroidetes)的细菌天然的O-甲基转移酶基因的方式进行了修饰,且其中所述目标物质选自由以下组成的组:香草醛、香草酸、阿魏酸、愈创木酚、4-乙烯基愈创木酚、4-乙基愈创木酚和它们的组合。
本发明的另一方面提供了如上文描述的方法,其中所述生产包括在含有碳源的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
本发明的另一方面提供了如上文描述的方法,其中所述生产包括通过使用所述微生物以将所述目标物质的前体转化成所述目标物质。
本发明的另一方面提供了如上文描述的方法,其中所述转化包括在含有所述前体的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
本发明的另一方面提供了如上文描述的方法,其中所述转化包括在反应混合物中允许所述微生物的细胞作用于所述前体以在所述反应混合物中生产和积累所述目标物质。
本发明的另一方面提供了如上文描述的方法,其中所述细胞是存在于所述微生物的培养液中的细胞、从所述培养液中收集的细胞、存在于所述培养液的加工产物中的细胞、存在于收集的细胞的加工产物中的细胞,或这些的组合。
本发明的另一方面提供了如上文描述的方法,其中所述前体选自由以下组成的组:原儿茶酸、原儿茶醛、L-苯丙氨酸、L-酪氨酸和它们的组合。
本发明的另一方面提供了如上文描述的方法,所述方法还包括收集所述目标物质。
本发明的另一方面提供了如上文描述的方法,其中所述属于拟杆菌门的细菌是属于Niastella、Terrimonas或Chitinophaga属的细菌。
本发明的另一方面提供了如上文描述的方法,其中所述O-甲基转移酶基因是编码选自由以下组成的组的蛋白质的基因:
(a)包含SEQ ID NO:141的氨基酸序列的蛋白质,
(b)包含SEQ ID NO:141的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、***和/或添加的蛋白质,且其中所述蛋白质具有O-甲基转移酶活性,
(c)包含与SEQ ID NO:141的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有O-甲基转移酶活性,和
(d)包含(a)、(b)或(c)中定义的蛋白质但具有特定突变的氨基酸序列的蛋白质,其中所述特定突变是选自由以下组成的组的氨基酸残基处的突变:D21、L31、M36、S42、L67、Y90、P144和它们的组合。
本发明的另一方面提供了如上文描述的方法,其中所述特定突变选自由以下组成的组:D21Y、L31H、M36(K、V)、S42C、L67F、Y90(A、C、G、S)、P144(E、G、S、V、Y)和它们的组合。
本发明的另一方面提供了如上文描述的方法,其中所述特定突变选自由以下组成的组:D21Y/M36K/L67F,D21Y/M36K/L67F/Y90A,L31H/M36K/L67F/P144V,L31H/L67F/Y90A,M36K/S42C/L67F,M36K/L67F,M36K/L67F/Y90A,M36K/L67F/Y90A/P144E,M36K/L67F/Y90C,M36K/L67F/Y90C/P144V,M36K/L67F/Y90G,M36K/L67F/Y90S/P144G,M36K/L67F/P144S,M36K/L67F/P144Y,M36K/Y90A/P144V,M36K/P144E和M36V/L67F/P144S。
本发明的另一方面提供了如上文描述的方法,其中所述微生物是属于肠杆菌科的细菌、棒状杆菌细菌或酵母。
本发明的另一方面提供了如上文描述的方法,其中所述微生物是属于棒状杆菌属的细菌。
本发明的另一方面提供了如上文描述的方法,其中所述微生物是谷氨酸棒杆菌。
本发明的另一方面提供了如上文描述的方法,其中所述微生物是属于埃希氏菌属的细菌。
本发明的另一方面提供了如上文描述的方法,其中所述微生物是大肠杆菌。
本发明的另一方面提供了如上文描述的方法,其中所述微生物已经以与未修饰的菌株相比参与所述目标物质的生物合成的酶的活性得以增加的方式进行了进一步的修饰。
本发明的另一方面提供了如上文描述的方法,其中所述参与目标物质的生物合成的酶选自由以下组成的组:3-脱氧-D-***糖-庚酮糖酸7-磷酸合酶、3-脱氢奎尼酸合酶、3-脱氢奎尼酸脱水酶、3-脱氢莽草酸脱水酶、芳族醛氧化还原酶和它们的组合。
本发明的另一方面提供了如上文描述的方法,其中所述微生物已经以与未修饰的菌株相比磷酸泛酰巯基乙胺基转移酶的活性得以增加的方式进行了进一步的修饰。
本发明的另一方面提供了如上文描述的方法,其中所述微生物已经以与未修饰的菌株相比参与除所述目标物质以外的物质的副生产的酶的活性得以降低的方式进行了进一步的修饰。
本发明的另一方面提供了如上文描述的方法,其中所述参与除目标物质以外的物质的副生产的酶选自由以下组成的组:香草酸脱甲基酶、原儿茶酸3,4-双加氧酶、醇脱氢酶、莽草酸脱氢酶和它们的组合。
本发明的另一方面提供了如上文描述的方法,其中所述微生物已经以与未修饰的菌株相比L-半胱氨酸生物合成酶的活性得以增加的方式进行了进一步的修饰。
本发明的另一方面提供了如上文描述的方法,其中所述L-半胱氨酸生物合成酶是由选自由以下组成的组的基因编码的蛋白质:cysI基因、cysX基因、cysH基因、cysD基因、cysN基因、cysY基因、cysZ基因、fpr2基因和它们的组合。
本发明的另一方面提供了如上文描述的方法,其中通过增加由cysR基因编码的蛋白质的活性来增加L-半胱氨酸生物合成酶的活性。
本发明的另一方面提供了如上文描述的方法,其中所述微生物已经以与未修饰的菌株相比由NCgl2048基因编码的蛋白质的活性得以降低的方式进行了进一步的修饰。
本发明的另一方面提供了如上文描述的方法,其中所述微生物已经以与未修饰的菌株相比烯醇化酶的活性得以降低的方式进行了进一步修饰。
本发明的另一方面提供了如上文描述的方法,其中所述微生物已经以与未修饰的菌株相比S-腺苷-L-高半胱氨酸水解酶的活性得以增加的方式进行了进一步修饰。
本发明的另一方面提供了如上文描述的方法,其中所述微生物已经以使该微生物具有选自由以下组成的组的结果的方式进行了修饰:(i)与未修饰的菌株相比,AICAR甲酰转移酶/IMP环化水解酶的活性得以降低,(ii)编码AICAR甲酰转移酶/IMP环化水解酶的基因具有改善所述微生物生产所述目标物质的能力的突变,和(iii)它们的组合。
本发明的另一方面提供了如上文描述的方法,其中所述目标物质选自由以下组成的组:香草醛、香草酸和它们的组合。
本发明的另一方面提供了生产香草醛的方法,所述方法包括通过如上文描述的方法生产香草酸;并且将所述香草酸转化成香草醛。
发明详述
<1>微生物
如本文所述的微生物是具有生产目标物质的能力的微生物,所述微生物已经以具有,即含有来源于属于拟杆菌门(Bacteroidetes)的细菌的O-甲基转移酶(OMT)基因,或对于属于拟杆菌门(Bacteroidetes)的细菌天然的O-甲基转移酶(OMT)基因的方式进行了修饰。此类OMT基因也可以称为“拟杆菌门OMT基因”。生产目标物质的能力也可以称为“目标物质生产能力”。
<1-1>具有目标物质生产能力的微生物
短语“具有目标物质生产能力的微生物”可以指能够生产目标物质的微生物。
短语“具有目标物质生产能力的微生物”可以指在微生物用于发酵方法的情况下能够通过发酵生产目标物质的微生物。也就是说,短语“具有目标物质生产能力的微生物”可以指能够从碳源生产目标物质的微生物。具体而言,短语“具有目标物质生产能力的微生物”可以指当在含有碳源的培养基等培养基中培养时能够在培养基中以一定程度生产并积累目标物质,从而可以从培养基中收集目标物质的微生物。
短语“具有目标物质生产能力的微生物”还可以指在将微生物用于生物转化方法的情况下能够通过生物转化生产目标物质的微生物。也就是说,短语“具有目标物质生产能力的微生物”可以指能够从目标物质的前体生产目标物质的微生物。具体而言,短语“具有目标物质生产能力的微生物”可以指当在含有目标物质的前体的培养基中培养时,能够在培养基中以一定程度生产并积累目标物质,从而可以从培养基中收集目标物质的微生物。具体而言,短语“具有目标物质生产能力的微生物”还可以指能够在被允许作用于反应混合物中的目标物质的前体时在反应混合物中以一定程度生产和积累目标物质,从而可以从反应混合物中收集目标物质的微生物。
具有目标物质生产能力的微生物可以是能够在培养基或反应混合物中以比用非修饰菌株可以获得的量更大的量生产和积累目标物质的微生物。非修饰的菌株也可以称为“非修饰的微生物的菌株”。短语“非修饰微生物的菌株”或“非修饰的菌株”可以指尚未以它具有拟杆菌门OMT基因的方式进行修饰的对照菌株。此类对照菌株的实例可以包括具有拟杆菌门OMT基因外的OMT基因,诸如智人天然的OMT基因,而不是拟杆菌门OMT基因的菌株。具有目标物质生产能力的微生物可以能够在培养基或反应混合物中以例如0.01g/L以上、0.05g/L以上或0.09g/L以上的量积累目标物质。
目标物质可以是代谢物,所述代谢物的生物合成可以包括由拟杆菌门OMT催化的步骤。此类代谢物的实例可以包括例如香草醛、香草酸、阿魏酸、愈创木酚、4-乙烯基愈创木酚和4-乙基愈创木酚。此类代谢物的具体实例可以包括香草醛和香草酸。微生物可以能够仅产生一种目标物质的能力,或者可以能够产生两种或更多种目标物质的能力。此外,微生物可以能够从目标物质的一种前体或目标物质的两种或更多种前体产生目标物质的能力。
当目标物质是能够形成盐的化合物时,目标物质可以作为游离化合物,其盐或它们的混合物获得。也就是说,除非另有说明,术语“目标物质”可以指游离形式的目标物质、其盐或其混合物。盐的实例可以包括例如硫酸盐,盐酸盐,碳酸盐,铵盐,钠盐和钾盐。作为目标物质的盐,可以使用一种盐,或者可以组合使用两种或更多种盐。
可以用作亲本菌株以构建如本文中描述的微生物的微生物没有特别限制。微生物的实例可以包括细菌和酵母。
细菌的实例可以包括属于肠杆菌科的细菌和棒状杆菌细菌。
属于肠杆菌科的细菌的实例可以包括属于埃希氏菌属、肠杆菌属(Enterobacter)、泛菌属(Pantoea)、克雷伯氏菌属(Klebsiella)、沙雷菌属(Serratia)、欧文氏菌属(Erwinia)、发光杆菌属(Photorhabdus)、普罗威登斯菌属(Providencia)、沙门氏菌属(Salmonella)、摩根菌属(Morganella)的细菌。具体地,可以使用根据用于NCBI(National Center for Biotechnology Information)数据库的分类学(ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=91347)分类为肠杆菌科的细菌。
埃希氏菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为埃希氏菌属的细菌。埃希氏菌属细菌的实例可以包括例如记载于Neidhardt et al.(Backmann B.J.,1996,Derivations and Genotypes of some mutantderivatives of Escherichia coli K-12,pp.2460-2488,表1,于F.D.Neidhardt(编),Escherichia coli and Salmonella Cellular and Molecular Biology/第二版,American Society for Microbiology Press,Washington,D.C.)工作中的那些细菌。埃希氏菌属细菌的实例可以包括例如大肠杆菌。大肠杆菌的具体实例可以包括大肠杆菌K-12菌株,诸如W3110菌株(ATCC 27325)和MG1655菌株(ATCC 47076);大肠杆菌K5菌株(ATCC23506);大肠杆菌B菌株,诸如BL21(DE3)菌株;以及其衍生菌株。
肠杆菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为肠杆菌属的细菌。肠杆菌属细菌的实例可以包括例如聚团肠杆菌(Enterobacter agglomerans)和产气肠杆菌(Enterobacter aerogenes)。聚团肠杆菌的具体实例可以包括例如聚团肠杆菌ATCC 12287菌株。产气肠杆菌的具体实例可以包括例如产气肠杆菌ATCC 13048菌株、NBRC 12010菌株(Biotechnol.Bioeng.,2007,Mar.27;98(2):340-348)和AJ110637菌株(FERM BP-10955)。肠杆菌属细菌的实例还可以包括例如记载于欧洲专利申请公开(EP-A)No.0952221中的菌株。另外,聚团肠杆菌还可以包括分类为成团泛菌(Pantoea agglomerans)的一些菌株。
泛菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为泛菌属的细菌。泛菌属细菌的实例可以包括例如菠萝泛菌(Pantoeaananatis)、斯氏泛菌(Pantoea stewartii)、成团泛菌和柠檬泛菌(Pantoea citrea)。菠萝泛菌的具体实例可以包括例如菠萝泛菌LMG20103菌株、AJ13355菌株(FERM BP-6614)、AJ13356菌株(FERM BP-6615)、AJ13601菌株(FERM BP-7207)、SC17菌株(FERM BP-11091)、SC17(0)菌株(VKPM B-9246)和SC17sucA菌株(FERM BP-8646)。一些肠杆菌属细菌和欧文氏菌属细菌重新分类为泛菌属(Int.J.Syst.Bacteriol.,39,337-345(1989);Int.J.Syst.Bacteriol.,43,162-173(1993))。例如,基于16S rRNA等的核苷酸序列分析,一些聚团肠杆菌菌株最近重新分类为成团泛菌、菠萝泛菌、斯氏泛菌等(Int.J.Syst.Bacteriol.,39,337-345(1989))。泛菌属细菌可以包括如上文描述的重新分类为泛菌属的那些细菌。
欧文氏菌属细菌的实例可以包括解淀粉欧文氏菌(Erwinia amylovora)和胡萝卜软腐欧文氏菌(Erwinia carotovora)。克雷伯氏菌属细菌的实例可以包括植物克雷伯氏菌(Klebsiella planticola)。
棒状杆菌细菌的实例可以包括属于棒杆菌属、短杆菌属(Brevibacterium)、细杆菌属(Microbacterium)等的细菌。
此类棒状杆菌细菌的具体实例可以包括以下物种。
嗜乙酰乙酸棒状杆菌(Corynebacterium acetoacidophilum)
醋谷氨酸棒杆菌(Corynebacterium acetoglutamicum)
解烷棒状杆菌(Corynebacterium alkanolyticum)
帚石南棒状杆菌(Corynebacterium callunae)
钝齿棒状杆菌(Corynebacterium crenatum)
谷氨酸棒杆菌(Corynebacterium glutamicum)
百合棒杆菌(Corynebacterium lilium)
栖糖蜜棒杆菌(Corynebacterium melassecola)
热产氨棒状杆菌(Corynebacterium thermoaminogenes)(有效棒杆菌(Corynebacterium efficiens))
力士棒杆菌(Corynebacterium herculis)
二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒杆菌)
黄色短杆菌(Brevibacterium flavum)(谷氨酸棒杆菌)
未成熟短杆菌(Brevibacterium immariophilum)
乳糖发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒杆菌)
玫瑰色短杆菌(Brevibacterium roseum)
解糖短杆菌(Brevibacterium saccharolyticum)
硫殖短杆菌(Brevibacterium thiogenitalis)
产氨短杆菌(Corynebacterium ammoniagenes)(Corynebacterium stationis)
白色短杆菌(Brevibacterium album)
蜡状短杆菌(Brevibacterium cerinum)
嗜氨细杆菌(Microbacterium ammoniaphilum)
棒状杆菌细菌的具体实例可以包括以下菌株。
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC 13870
醋谷氨酸棒杆菌(Corynebacterium acetoglutamicum)ATCC 15806
解烷棒杆菌(Corynebacterium alkanolyticum)ATCC 21511
帚石南棒杆菌(Corynebacterium callunae)ATCC 15991
钝齿棒杆菌(Corynebacterium crenatum)AS1.542
谷氨酸棒杆菌ATCC 13020,ATCC 13032,ATCC 13060,ATCC 13869,FERM BP-734
百合棒杆菌(Corynebacterium lilium)ATCC 15990
栖糖蜜棒杆菌(Corynebacterium melassecola)ATCC 17965
有效棒杆菌(Corynebacterium efficiens)(热产氨棒状杆菌(Corynebacteriumthermoaminogenes))AJ12340(FERM BP-1539)
力士棒杆菌(Corynebacterium herculis)ATCC 13868
二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒杆菌)ATCC 14020
黄色短杆菌(Brevibacterium flavum)(谷氨酸棒杆菌)ATCC 13826,ATCC14067,AJ12418(FERM BP-2205)
未成熟短杆菌(Brevibacterium immariophilum)ATCC 14068
乳糖发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒杆菌)ATCC13869
玫瑰色短杆菌(Brevibacterium roseum)ATCC 13825
解糖短杆菌(Brevibacterium saccharolyticum)ATCC 14066
硫殖短杆菌(Brevibacterium thiogenitalis)ATCC 19240
产氨短杆菌(Corynebacterium ammoniagenes)(停滞棒杆菌(Corynebacteriumstationis))ATCC 6871,ATCC 6872
白色短杆菌(Brevibacterium album)ATCC 15111
蜡状短杆菌(Brevibacterium cerinum)ATCC 15112
嗜氨细杆菌(Microbacterium ammoniaphilum)ATCC 15354
棒状杆菌细菌可以包括先前被分类为短杆菌属但目前并入棒状杆菌属中的细菌(Int.J.Syst.Bacteriol.,41,255(1991))。此外,停滞棒杆菌可以包括先前已被分类为产氨棒状杆菌,但目前基于16S rRNA的核苷酸序列分析等重新分类为停滞棒杆菌的细菌(Int.J.Syst.Evol.Microbiol.,60,874-879(2010))。
酵母可以是芽殖酵母或裂殖酵母。酵母可以是单倍体或二倍体以上的多倍体酵母。酵母的实例可包括属于酵母属(Saccharomyces)的酵母,例如酿酒酵母(Saccharomycescerevisiae),属于毕赤酵母属(Pichia)(其也可以称为Wickerhamomyces属)的酵母,如西弗毕赤酵母(Pichia ciferrii),赛道威毕赤酵母(Pichia sydowiorum)和巴斯德毕赤酵母(Pichia pastoris),属于假丝酵母属(Candida)的酵母,诸如实用假性酵母(Candidautilis),属于汉逊酵母属(Hansenula)的酵母,如多形汉逊酵母(Hansenula polymorpha)和属于裂殖酵母(Schizosaccharomyces)的酵母,如粟酒裂殖酵母(Schizosaccharomycespombe)。
这些菌株可以从例如美国典型培养物保藏中心(地址:P.O.Box 1549,Manassas,VA 20108,United States of America;或atcc.org)获得。也就是说,注册号被赋予各自的菌株,并且菌株可以通过使用这些注册号订购(参见atcc.org)。美国典型培养物保藏中心的目录中列出了菌株的注册号。这些菌株也可以从例如菌株保藏的保藏所获得。
微生物可以固有具有目标物质生产能力,或者可以已经以使它具有目标物质生产能力的方式进行了修饰。具有目标物质生产能力的微生物可以通过赋予如上所述的此类微生物以目标物质生产能力或增强如上提及的此类微生物的目标物质生产能力来获得。
以下,说明赋予或提高目标物质生成能力的方法的具体实例。为了赋予或提高目标物质生产能力,下面举例说明的此类修饰可以独立使用,或者以适当组合使用。
目标物质可以通过参与目标物质生物合成的酶的作用产生。此类酶也可以称为“目标物质生物合成酶”。因此,微生物可以具有目标物质生物合成酶。换言之,微生物可以具有编码目标物质生物合成酶的基因。此类基因也可以称为“目标物质生物合成基因”。微生物可以固有具有目标物质生物合成基因,或者可以已经引入了目标物质生物合成基因。本文解释了用于引入基因的方法。
另外,通过提高目标物质生物合成酶的活性,可以改善微生物的目标物质生产能力。也就是说,赋予或提高目标物质生成能力的方法的实例可以包括提高目标物质生物合成酶的活性的方法。也就是说,微生物可以经修饰而使得增加了目标物质生物合成酶的活性。一种目标物质生物合成酶的活性可以得以增加,或者两种或更多种目标物质生物合成酶的活性可以得以增加。本文描述了用于增加蛋白质(诸如酶等)的活性的方法。通过例如增加编码蛋白质的基因的表达,可以提高蛋白质(诸如酶等)的活性。
目标物质可以从例如碳源和/或目标物质的前体产生。因此,目标物质生物合成酶的实例可以包括例如催化从碳源和/或前体向目标物质转化的酶。例如,3-脱氢莽草酸可以通过部分莽草酸途径产生,其可以包括由3-脱氧-D-***糖-庚酮糖酸7-磷酸合酶(DAHP合酶),3-脱氢奎尼酸合酶和3-脱氢奎尼酸脱水酶催化的步骤;可以通过3-脱氢莽草酸脱水酶(DHSD)的作用将3-脱氢莽草酸转化为原儿茶酸;可以通过O-甲基转移酶(OMT)或芳香醛氧化还原酶,诸如芳香羧酸还原酶,ACAR的作用将原儿茶酸分别转化为香草酸或原儿茶醛;以及可以通过ACAR或OMT的作用将香草酸或原儿茶醛转化为香草醛。也就是说,目标物质生物合成酶的具体实例可以包括例如DAHP合酶,3-脱氢奎尼酸合酶,3-脱氢奎尼酸脱水酶,DHSD,OMT和ACAR。
术语“3-脱氧-D-***糖-庚酮糖酸7-磷酸合酶(DAHP合酶)”可以指具有催化将D-赤藓糖-4-磷酸和磷酸烯醇丙酮酸转化成3-脱氧-D-***糖-庚糖酮酸7-磷酸(DAHP)和磷酸的反应的活性的蛋白质(EC 2.5.1.54)。编码DAHP合酶的基因也可以称为“DAHP合酶基因”。DAHP合酶的实例可以包括分别由aroF、aroG和aroH基因编码的AroF、AroG和AroH蛋白。在这些中,AroG可以作为主要的DAHP合酶发挥功能。DAHP合酶诸如AroF、AroG和AroH蛋白的实例包括各种生物体如肠杆菌科(Enterobacteriaceae)细菌和棒状杆菌细菌的那些。DAHP合酶的具体实例可以包括大肠杆菌天然的AroF、AroG和AroH蛋白。大肠杆菌K-12MG1655菌株天然的aroG基因的核苷酸序列如SEQ ID NO:1所示,并且由该基因编码的AroG蛋白的氨基酸序列如SEQ ID NO:2所示。
DAHP合酶活性可以通过例如将酶与底物,诸如D-赤藓糖-4-磷酸和磷酸烯醇丙酮酸温育并测量DAHP的酶和底物依赖性生成来测量。
术语“3-脱氢奎尼酸合酶”可以指具有催化使DAHP脱磷酸化以产生3-脱氢奎宁酸的反应的活性的蛋白质(EC 4.2.3.4)。编码3-脱氢奎尼酸合酶的基因也可以称为“3-脱氢奎尼酸合酶基因”。3-脱氢奎尼酸合酶的实例可以包括由aroB基因编码的AroB蛋白。3-脱氢奎尼酸合酶如AroB蛋白的实例可以包括各种生物体如肠杆菌科细菌和棒状杆菌细菌天然的那些。3-脱氢奎尼酸合酶的具体实例可以包括大肠杆菌天然的AroB。大肠杆菌K-12MG1655菌株天然的aroB基因的核苷酸序列如SEQ ID NO:3所示,并且由该基因编码的AroB蛋白的氨基酸序列如SEQ ID NO:4所示。
3-脱氢奎尼酸合酶活性可以通过例如将酶与底物,诸如DAHP温育并测量3-脱氢奎宁酸的酶和底物依赖性产生来测量。
术语“3-脱氢奎尼酸脱水酶”可以指具有催化使3-脱氢奎宁酸脱水以生成3-脱氢莽草酸的反应的活性的蛋白质(EC 4.2.1.10)。编码3-脱氢奎尼酸脱水酶的基因也可以称为“3-脱氢奎尼酸脱水酶基因”。3-脱氢奎尼酸脱水酶的实例可以包括由aroD基因编码的AroD蛋白。3-脱氢奎尼酸脱水酶诸如AroD蛋白的实例可以包括各种生物体如肠杆菌科细菌和棒杆菌的那些。3-脱氢奎尼酸脱水酶的具体实例可以包括大肠杆菌天然的AroD蛋白。大肠杆菌K-12MG1655菌株天然的aroD基因的核苷酸序列如SEQ ID NO:5所示,并且由该基因编码的AroD蛋白的氨基酸序列如SEQ ID NO:6所示。
3-脱氢奎尼酸脱水酶活性可以通过例如将酶与底物,诸如3-脱氢奎宁酸温育并测量3-脱氢莽草酸的酶和底物依赖性产生来测量。
术语“3-脱氢草酸脱水酶(DHSD)”可以指具有催化使3-脱氢莽草酸脱水以生成原儿茶酸的反应的活性的蛋白质(EC 4.2.1.118)。编码DHSD的基因也可以称为“DHSD基因”。DHSD的实例可以包括由asbF基因编码的AsbF蛋白。DHSD例如AsbF蛋白的实例包括各种生物体如苏云金芽孢杆菌(Bacillus thuringiensis),粗糙脉孢菌(Neurospora crassa)和Podospora pauciseta天然的那些。苏云金芽孢杆菌BMB171菌株天然的asbF基因的核苷酸序列如SEQ ID NO:7所示,并且由该基因编码的AsbF蛋白的氨基酸序列如SEQ ID NO:8所示。
DHSD活性可以通过例如将酶与底物,诸如3-脱氢莽草酸温育并测量原儿茶酸的酶和底物依赖性产生来测量。
编码莽草酸途径的酶如DAHP合酶,3-脱氢奎尼酸合酶和3-脱氢奎尼酸脱水酶的基因的表达受到酪氨酸阻遏物TyrR阻遏,所述TyrR其由tyrR基因编码。因此,莽草酸途径酶的活性也可以通过降低酪氨酸阻遏物TyrR的活性而增加。大肠杆菌K-12MG1655菌株天然的tyrR基因的核苷酸序列如SEQ ID NO:9所示,并且由该基因编码的TyrR蛋白的氨基酸序列如SEQ ID NO:10所示。
O-甲基转移酶(OMT)在以下“属于拟杆菌门的细菌的天然O-甲基转移酶基因的导入”中描述。
术语“芳族醛氧化还原酶(芳族羧酸还原酶;ACAR)”可以指具有催化在电子供体和ATP存在下还原香草酸和/或原儿茶酸的反应以产生香草醛和/或原儿茶醛的活性的蛋白质(EC 1.2.99.6等)。此活性也可以称为“ACAR活性”。编码ACAR的基因也可称为“ACAR基因”。ACAR通常可以使用香草酸和原儿茶酸两者作为底物,但不必限于此。也就是说,ACAR可以具有需要的底物特异性,这取决于在如本文所述的方法中生产目标物质的特定生物合成途径。例如,当通过香草酸向香草醛的转化来生产目标物质时,可以使用至少对香草酸特异性的ACAR。另外,例如,当通过原儿茶酸向原儿茶醛的转化来生产目标物质时,可以使用至少对原儿茶酸特异性的ACAR。电子供体的实例可以包括NADH和NADPH。ACAR的实例可以包括各种生物体如诺卡尔菌属种(Nocardia sp.)菌株NRRL 5646、放线菌属种(Actinomycessp.)、热乙酸梭菌(Clostridium thermoaceticum)、黑曲霉(Aspergillus niger)、甜瓜棒孢(Corynespora melonis)、云芝属种(Coriolus sp.)和链孢霉属种(Neurospora sp.)天然的ACAR(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。诺卡尔菌属种菌株NRRL 5646已被分类为艾阿华诺卡氏菌(Nocardia iowensis)。ACAR的实例还可包括其他诺卡氏菌细菌,例如巴西诺卡氏菌(Nocardia brasiliensis)和伤口诺卡氏菌(Nocardia vulneris)的ACAR。巴西诺卡氏菌ATCC 700358天然的ACAR基因的核苷酸序列以SEQ ID NO:17显示,并且由此基因编码的ACAR的氨基酸序列以SEQ ID NO:18显示。巴西诺卡氏菌ATCC 700358天然的变体ACAR基因的实例的核苷酸序列以SEQ ID NO:19显示,并且由此基因编码的ACAR的氨基酸序列以SEQ ID NO:20显示。
ACAR活性可以通过例如在ATP和NADPH存在下将酶与底物,诸如香草酸或原儿茶酸一起温育,并且测量NADPH的酶和底物依赖性氧化来测量(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485中描述的方法的修改)。
可以通过磷酸泛酰巯基乙胺化(phosphopantetheinylation)将ACAR变为活性酶(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。因此,ACAR活性也可以通过增加催化蛋白质的磷酸泛酰巯基乙胺化的酶(其也可以称为“磷酸泛酰巯基乙胺基化酶”)的活性来增加。也就是说,赋予或提高目标物质生产能力的方法的实例可以包括增加磷酸泛酰巯基乙胺基化酶的活性的方法。也就是说,微生物可以以使磷酸泛酰巯基乙胺基化酶的活性得以增加的方式进行了修饰。磷酸泛酰巯基乙胺基化酶的实例可以包括磷酸泛酰巯基乙胺基转移酶(PPT)。
术语“磷酸泛酰巯基乙胺基转移酶(PPT)”可以指具有在磷酸泛酰巯基乙胺基供体存在下催化使ACAR磷酸泛酰巯基乙胺化的反应的活性的蛋白质。此活性也可以称为“PPT活性”。编码PPT的基因也可以称为“PPT基因”。磷酸泛酰巯基乙胺基供体的实例可以包括辅酶A(CoA)。PPT的实例可以包括EntD蛋白,其由entD基因编码。PPT例如EntD蛋白质的实例可以包括各种生物体天然的那些。PPT的具体实例可以包括大肠杆菌天然的EntD蛋白。大肠杆菌K-12MG1655菌株的entD基因的核苷酸序列如SEQ ID NO:21所示,并且由该基因编码的EntD蛋白的氨基酸序列如SEQ ID NO:22所示。PPT的具体实例还可以包括巴西诺卡菌天然的PPT,皮疽诺卡菌(Nocardia farcinica)IFM10152天然的PPT(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)和谷氨酸棒杆菌天然的PPT(App.Env.Microbiol.2009,Vol.75,No.9,pp.2765-2774)。谷氨酸棒杆菌ATCC 13032菌株天然的PPT基因的核苷酸序列如SEQ ID NO:23所示,并且由该基因编码的PPT的氨基酸序列如SEQ ID NO:24所示。
PPT活性可以基于例如在CoA存在下与ACAR温育时观察到的ACAR活性的增强来测量(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。
愈创木酚可以从香草酸生产。因此,上述关于香草酸的目标物质生物合成酶的描述可以在必要修饰后适用于愈创木酚的目标物质生物合成酶。香草酸可以通过香草酸脱羧酶(VDC)的作用转化为愈创木酚。也就是说,目标物质生物合成酶的实例还可以包括VDC。
阿魏酸、4-乙烯基愈创木酚和4-乙基愈创木酚可以从L-苯丙氨酸或L-酪氨酸生产。也就是说,目标物质生物合成酶的实例还可以包括例如L-苯丙氨酸生物合成酶,L-酪氨酸生物合成酶,以及催化L-苯丙氨酸或L-酪氨酸转化为阿魏酸,4-乙烯基愈创木酚或4-乙基愈创木酚的酶。L-苯丙氨酸生物合成酶的实例可包括上文例示的芳香族氨基酸的常见生物合成酶,以及分支酸变位酶(pheA),预苯酸脱水酶(pheA)和酪氨酸氨基转移酶(tyrB)。分支酸变位酶和预苯酸脱水酶可以由pheA基因编码为双功能酶。L-酪氨酸生物合成酶的实例可以包括上文例示的芳香族氨基酸的常见生物合成酶,以及分支酸变位酶(tyrA),预苯酸脱氢酶(tyrA)和酪氨酸氨基转移酶(tyrB)。分支酸变位酶和预苯酸脱氢酶可以由tyrA基因编码为双功能酶。L-苯丙氨酸可以通过苯丙氨酸脱氨酶(PAL;EC 4.3.1.24)的作用转化为肉桂酸,然后通过肉桂酸4-羟化酶(C4H;EC 1.14.13.11)的作用转化为对香豆酸。此外,L-酪氨酸可通过酪氨酸脱氨酶(TAL;EC 4.3.1.23)的作用转化为对香豆酸。对香豆酸可以分别通过羟基肉桂酸3-羟化酶(C3H),O-甲基转移酶(OMT),阿魏酸脱羧酶(FDC)和乙烯基苯酚还原酶(VPR)的作用连续转化为咖啡酸,阿魏酸,4-乙烯基愈创木酚和4-乙基愈创木酚。也就是说,催化L-苯丙氨酸或L-酪氨酸转化为阿魏酸,4-乙烯基愈创木酚或4-乙基愈创木酚的酶的实例可以包括这些酶。
用于赋予或提高目标物质生产能力的方法的实例还可以包括提高目标物质以外物质,例如在生产目标物质期间作为中间产物生成的物质和用作目标物质前体的物质的摄取***的活性的方法。也就是说,本发明的细菌可以以使此类摄取***的活性得以增加的方式进行了修饰。术语“物质的摄取***”可以指具有将来自细胞外部的物质掺入细胞的功能的蛋白质。此活性也可以称为“物质的摄取活性”。编码此类摄取***的基因也可以称为“摄取***基因”。此类摄取***的实例可以包括香草酸摄取***和原儿茶酸摄取***。香草酸摄取***的实例可以包括由vanK基因编码的VanK蛋白(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。谷氨酸棒杆菌ATCC13869菌株天然的vanK基因(NCgl2302)的核苷酸序列如SEQ ID NO:25所示,并且由该基因编码的VanK蛋白的氨基酸序列如SEQ ID NO:26所示。原儿茶酸摄取***基因可以包括由pcaK基因编码的PcaK蛋白(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。谷氨酸棒杆菌ATCC13869菌株天然的pcaK基因(NCgl1031)的核苷酸序列如SEQ ID NO:27所示,并且由该基因编码的PcaK蛋白的氨基酸序列如SEQ ID NO:28所示。
可以根据例如已知方法(M.T.Chaudhry,et al.,Microbiology,2007.153:857-865)测量物质的摄取活性。
用于赋予或提高目标物质生产能力的方法的实例还可以包括降低参与目标物质以外的物质的副生成的酶的活性的方法。除了目标物质以外的此类物质也可以称为“副产物”。此类酶也可以称为“副产物生成酶”。副产物生成酶的实例可以包括例如参与目标物质利用的酶和催化远离目标物质的生物合成途径分支的反应以产生除目标物质之外的物质的酶。本文描述了降低蛋白质诸如酶等的活性的方法。通过例如破坏编码蛋白质的基因可以降低蛋白质诸如酶等的活性。例如,据报道,在棒状杆菌细菌中,香草醛按香草醛->香草酸->原儿茶酸的顺序代谢并利用(Current Microbiology,2005,Vol.51,pp.59-65)。也就是说,副产物生成酶的具体实例可以包括催化香草醛转化为原儿茶酸的酶和催化原儿茶酸进一步代谢的酶。此类酶的实例可以包括香草酸脱甲基酶,原儿茶酸3,4-双加氧酶,以及将原儿茶酸3,4-双加氧酶的反应产物进一步分解为琥珀酰-CoA和乙酰-CoA的各种酶(Appl.Microbiol.Biotechnol.,2012,Vol.95,p77-89)。此外,可以通过醇脱氢酶的作用将香草醛转化成香草醇(Kunjapur AM.et al.,J.Am.Chem.Soc.,2014,Vol.136,p11644-11654.;Hansen EH.et al.,App.Env.Microbiol.,2009,Vol.75,p2765-2774.)。也就是说,副产物生成酶的具体实例也可以包括醇脱氢酶(ADH)。此外,作为香草酸和香草醛生物合成途径中间体的3-脱氢莽草酸也可以通过莽草酸脱氢酶的作用转化为莽草酸。也就是说,副产物生成酶的具体实例还可以包括莽草酸脱氢酶。
术语“香草酸脱甲基酶”可以指具有催化香草酸脱甲基化生成原儿茶酸的反应的活性的蛋白质。此活性也可以称为“香草酸脱甲基酶活性”。编码香草酸脱甲基酶的基因也可以称为“香草酸脱甲基酶基因”。香草酸脱甲基酶的实例可以包括由vanAB基因编码的VanAB蛋白(Current Microbiology,2005,Vol.51,pp.59-65)。vanA基因和vanB基因分别编码香草酸脱甲基酶的亚基A和亚基B。为了降低香草酸脱甲基酶活性,这两种vanAB基因可以被破坏等,或者两者中仅一种可以被破坏等。谷氨酸棒杆菌ATCC13869天然菌株的vanAB基因的核苷酸序列分别如SEQ ID NO:29和31所示,并且由这些基因编码的VanAB蛋白的氨基酸序列分别如SEQ ID NO:30和32所示。vanAB基因通常与vanK基因一起构成vanABK操纵子。因此,为了降低香草酸脱甲基酶活性,vanABK操纵子可以被完全破坏等(例如缺失)。在此类情况下,可以将vanK基因再引入宿主。例如,当使用存在于细胞外的香草酸,并且vanABK操纵子完全被破坏等(例如缺失)时,优选再引入vanK基因。
香草酸脱甲基酶活性可以通过例如将酶与底物诸如香草酸温育并测量原儿茶酸的酶和底物依赖性产生来测量(J Bacteriol,2001,Vol.183,p3276-3281)。
术语“原儿茶酸3,4-双加氧酶”可以指具有催化氧化原儿茶酸反应生成β-羧基-顺,顺-粘康酸的反应活性的蛋白质。此活性也可以称为“原儿茶酸3,4-双加氧酶活性”。编码原儿茶酸3,4-双加氧酶的基因也可以称为“原儿茶酸3,4-双加氧酶基因”。原儿茶酸3,4-双加氧酶的实例可以包括由pcaGH基因编码的PcaGH蛋白(Appl.Microbiol.Biotechnol.,2012,Vol.95,p77-89)。pcaG基因和pcaH基因分别编码原儿茶酸3,4-双加氧酶的α亚基和β亚基。为了降低原儿茶酸3,4-双加氧酶活性,这两种pcaGH基因可以被破坏等,或者两者中仅一种可以被破坏等。谷氨酸棒杆菌ATCC 13032菌株天然的pcaGH基因的核苷酸序列分别如SEQ ID NO:33和35所示,并且由这些基因编码的PcaGH蛋白的氨基酸序列分别如SEQ IDNO:34和36所示。
原儿茶酸3,4-双加氧酶活性可以通过例如将酶与底物诸如原儿茶酸温育并测量酶和底物依赖性氧消耗量来测量(Meth.Enz.,1970,Vol.17A,p526-529)。
术语“醇脱氢酶(ADH)”可以指具有在电子供体存在下催化醛还原以产生醇的反应的活性的蛋白质(EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.71等)。此活性也可以称为“ADH活性”。编码ADH的基因也可以称为“ADH基因”。电子供体的实例可以包括NADH和NADPH。
作为ADH,具有在电子供体存在下催化还原香草醛的反应以产生香草醇的活性的ADH是一个特别的例子。该活性也可以特别称为“香草醇脱氢酶活性”。此外,具有香草醇脱氢酶活性的ADH也可以特别称为“香草醇脱氢酶”。作为ADH,具有催化在电子供体存在下还原香草醛以产生香草醇的反应的活性的ADH是具体的实例。此活性也可以特别称为“香草醇脱氢酶活性”。此外,具有香草醇脱氢酶活性的ADH也可以特别称为“香草醇脱氢酶”。
ADH的实例可以包括分别由yqhD基因,NCgl0324基因,NCgl0313基因,NCgl2709基因,NCgl0219基因和NCgl2382基因编码的YqhD蛋白,NCgl0324蛋白质,NCgl0313蛋白质,NCgl2709蛋白质,NCgl0219蛋白质和NCgl2382蛋白质。yqhD基因和NCgl0324基因编码香草醇脱氢酶。yqhD基因可以在例如属于肠杆菌科的细菌,诸如大肠杆菌中找到。NCgl0324基因,NCgl0313基因,NCgl2709基因,NCgl0219基因和NCgl2382基因可以例如在棒状杆菌细菌例如谷氨酸棒杆菌中找到。大肠杆菌K-12MG1655菌株天然的yqhD基因的核苷酸序列如SEQID NO:37所示,并且由此基因编码的YqhD蛋白的氨基酸序列以SEQ ID NO:38所示。谷氨酸棒杆菌ATCC13869菌株天然的NCgl0324基因,NCgl0313基因和NCgl2709基因的核苷酸序列分别如SEQ ID NO:39,41和43所示,并且由这些基因编码的蛋白质的氨基酸序列分别如SEQID NO:40,42和44所示。谷氨酸棒杆菌ATCC 13032菌株天然的NCgl0219基因和NCgl2382基因的核苷酸序列分别如SEQ ID NO:45和47所示,并且由这些基因编码的蛋白质的氨基酸序列如SEQ ID NO:46和48所示。可以降低一种ADH的活性,或者可以降低两种或更多种ADH的活性。例如,可以降低诸如NCgl0324蛋白质,NCgl2709蛋白质和NCgl0313蛋白质中的一种或多种的活性。特别地,可以至少降低NCgl0324蛋白质的活性。
ADH活性可以通过例如在NADPH或NADH存在下将酶与底物(诸如醛,如香草醛)一起温育,并测量NADPH或NADH的酶和底物依赖性氧化来测量。
术语“莽草酸脱氢酶”可以指具有催化在电子供体存在下还原3-脱氢莽草酸以产生莽草酸的反应的活性的蛋白质(EC 1.1.1.25)。该活性也可称为“莽草酸脱氢酶活性”。编码莽草酸脱氢酶的基因也可称为“莽草酸脱氢酶基因”。电子供体的实例可包括NADH和NADPH。莽草酸脱氢酶的实例可包括AroE蛋白,其由aroE基因编码。大肠杆菌K-12MG1655菌株天然的aroE基因的核苷酸序列如SEQ ID NO:49所示,并且由该基因编码的AroE蛋白的氨基酸序列如SEQ ID NO:50所示。
莽草酸脱氢酶活性可以通过例如在NADPH或NADH存在下将酶与底物诸如3-脱氢莽草酸一起温育,并测量NADPH或NADH的酶和底物依赖性氧化来测量。
用于赋予或增强目标物质生产能力的方法的实例还可以包括增加L-半胱氨酸生物合成酶的活性的方法。
术语“L-半胱氨酸生物合成酶”可以指参与L-半胱氨酸生物合成的蛋白质。编码L-半胱氨酸生物合成酶的基因也可称为“L-半胱氨酸生物合成基因”。L-半胱氨酸生物合成酶的实例可包括参与硫利用的蛋白质。参与硫利用的蛋白质的实例可包括CysIXHDNYZ蛋白质和Fpr2蛋白质,它们分别由cysIXHDNYZ基因和fpr2基因编码。CysIXHDNYZ蛋白特别涉及无机硫化合物如硫酸盐和亚硫酸盐的还原。特别地,Fpr2蛋白可以参与电子转运以还原亚硫酸盐。L-半胱氨酸生物合成酶的实例还可包括O-乙酰丝氨酸(硫醇)-裂合酶。O-乙酰丝氨酸(硫醇)-裂合酶的实例可包括CysK蛋白,其由cysK基因编码。L-半胱氨酸生物合成酶的实例可包括各种生物体,例如肠杆菌科细菌和棒状杆菌细菌天然的那些。L-半胱氨酸生物合成酶的具体实例可包括谷氨酸棒杆菌天然的CysIXHDNYZ蛋白,Fpr2蛋白和CysK蛋白。谷氨酸棒杆菌ATCC13869天然的cysIXHDNYZ基因和fpr2基因的核苷酸序列分别以SEQ ID NOS:88,90,92,94,96,98,100,和102显示,并且这些基因编码的蛋白质的氨基酸序列分别以SEQ IDNOS:89,91,93,95,97,99,101和103显示。可以增加一种L-半胱氨酸生物合成酶的活性,或者可以增加两种或更多种L-半胱氨酸生物合成酶的活性。例如,可以增加CysIXHDNYZ蛋白、Fpr2蛋白和CysK蛋白中一种或多种的活性,或者可以增加CysIXHDNYZ蛋白和Fpr2蛋白中一种或多种的活性。
L-半胱氨酸生物合成酶的活性可以通过例如增加编码L-半胱氨酸生物合成酶的基因(例如cysIXHDNYZ基因、fpr2基因和cysK基因)的表达来增加。
L-半胱氨酸生物合成基因的表达可以通过例如修饰(例如增加或减少)基因表达调节物的活性来增加。也就是说,L-半胱氨酸生物合成基因的表达可以通过例如增加基因的正表达调节物(例如活化剂)的活性来增加。此外,L-半胱氨酸生物合成基因的表达可以通过例如降低基因的负表达调节物(例如阻遏物)的活性来增加。此类调节物也可称为“调节蛋白”。编码此类调节因子的基因也可称为“调节基因”。
此类活化剂的实例可包括CysR和SsuR蛋白,它们分别由cysR和ssuR基因编码。CysR蛋白活性的增加可导致cysIXHDNYZ基因,fpr2基因和ssuR基因中一种或多种的表达增加。此外,SsuR蛋白活性的增加可以导致参与有机硫化合物利用的基因表达增加。此类活化剂的实例可包括各种生物体,例如肠杆菌科细菌和棒状杆菌的那些活化剂。此类活化剂的具体实例可包括谷氨酸棒杆菌天然的CysR和SsuR蛋白。谷氨酸棒杆菌ATCC 13869菌株天然的cysR基因(NCgl0120)和ssuR基因的核苷酸序列分别以SEQ ID NO:104和106显示,并且由这些基因编码的蛋白质的氨基酸序列分别以SEQ ID NO:105和107显示。可以增加CysR蛋白和SsuR蛋白中的一种或两种的活性。例如,可以至少增加CysR蛋白的活性。可以通过例如增加编码活化剂的基因的表达来增加此类活化剂的活性。
此类阻遏物的实例是McbR蛋白,其由mcbR基因编码。McbR蛋白活性降低可以导致cysR和ssuR基因中一种或多种的表达增加,从而可进一步导致cysIXHDNYZ基因和fpr2基因中一种或多种的表达增加。此类阻遏物的活性可以通过例如降低编码阻遏物的基因的表达或通过破坏编码阻遏物的基因来降低。
也就是说,具体地,可以通过例如增加cysIXHDNYZ基因,fpr2基因,cysR基因和ssuR基因中的一种或多种的表达来增加L-半胱氨酸生物合成酶的活性。因此,短语“L-半胱氨酸生物合成酶的活性得以增加”可以表示例如cysIXHDNYZ基因,fpr2基因,cysR基因和ssuR基因中的一种或多种的表达得以增加。例如,可以至少增加cysR基因的表达。此外,例如,可以增加所有这些基因的表达。可以通过增加cysR基因的表达来增加cysIXHDNYZ基因,fpr2基因和ssuR基因中一种或多种的表达。
用于赋予或增强目标物质生产能力的方法的实例可以进一步包括降低NCgl2048蛋白活性的方法。
术语“NCgl2048蛋白”可以指由NCgl2048基因编码的蛋白质。NCgl2048蛋白的实例可以包括各种生物体,诸如肠杆菌科细菌和棒状杆菌细菌天然的蛋白。NCgl2048蛋白的具体实例可以包括谷氨酸棒杆菌天然的NCgl2048蛋白。谷氨酸棒杆菌ATCC 13869菌株天然的NCgl2048基因的核苷酸序列以SEQ ID NO:119显示,并且由此基因编码的蛋白质的氨基酸序列以SEQ ID NO:120显示。顺便提及,关于本文中描述的保守变体,NCgl2048蛋白的原始功能可以指具有以SEQ ID NO:120所示的氨基酸序列的蛋白质的功能,或者也可以指微生物中的蛋白质活性降低提供目标物质的生产增加的特性。
用于赋予或增强目标物质生产能力的方法的实例还可以包括降低烯醇化酶活性的方法。
术语“烯醇化酶”可以指具有催化将2-磷酸-D-甘油酸脱水以生成磷酸烯醇丙酮酸的反应的活性的蛋白质(EC 4.2.1.11)。此活性也可以称为“烯醇化酶活性”。烯醇化酶也可以称为“磷酸丙酮酸水合酶”。编码烯醇化酶的基因也可以称为“烯醇化酶基因”。烯醇化酶的实例可以包括Eno蛋白,其由eno基因编码。烯醇化酶诸如Eno蛋白的实例可以包括各种生物体,诸如肠杆菌科细菌和棒状杆菌细菌天然的蛋白。烯醇化酶的具体实例可以包括谷氨酸棒杆菌天然的Eno蛋白。谷氨酸棒杆菌ATCC 13869菌株天然的eno基因(NCgl0935)的核苷酸序列以SEQ ID NO:128显示,并且由此蛋白质编码的Eno蛋白的氨基酸序列以SEQ ID NO:129显示。
烯醇化酶活性可以通过将酶与底物诸如2-磷酸-D-甘油酸一起温育,并且测量磷酸烯醇丙酮酸的酶和底物依赖性生成来测量。
用于赋予或增强目标物质生产能力的方法的实例进一步可以包括增加S-腺苷-L-高半胱氨酸水解酶活性的方法。
术语“S-腺苷-L-高半胱氨酸水解酶”可以指具有催化水解S-腺苷-L-高半胱氨酸(SAH)以生成L-高半胱氨酸和腺苷的反应的活性的蛋白质(EC3.3.1.1)。此活性也可以称为“S-腺苷-L-高半胱氨酸水解酶活性”。S-腺苷-L-高半胱氨酸水解酶也可以称为“腺苷高半胱氨酸酶”。编码S-腺苷-L-高半胱氨酸水解酶的基因也可以称为“S-腺苷-L-高半胱氨酸水解酶基因”。S-腺苷-L-高半胱氨酸水解酶的实例可以包括SahH蛋白,其由sahH基因编码。S-腺苷-L-高半胱氨酸水解酶诸如SahH蛋白的实例可以包括各种生物体诸如酵母、链霉菌细菌和棒状杆菌细菌天然的那些。S-腺苷-L-高半胱氨酸水解酶的具体实例可以包括谷氨酸棒杆菌天然的SahH蛋白。谷氨酸棒杆菌ATCC13869菌株天然的sahH基因(NCgl0719)的核苷酸序列以SEQ ID NO:175显示,并且由此基因编码的SahH蛋白的氨基酸序列以SEQ ID NO:176显示。
S-腺苷-L-高半胱氨酸水解酶活性可以例如通过将酶与底物,诸如S-腺苷-L-高半胱氨酸和DTNB(5,5'-二硫代二(2-硝基苯甲酸)一起温育,并且于412nm测量产物(诸如高半胱氨酸)依赖性TNB(5-巯基-2-硝基苯甲酸)生成(J Mol Microbiol Biotechnol 2008,15:277-286)来测量活性。
用于赋予或增强目标物质生产能力的方法的实例还可以包括降低AICAR甲酰转移酶/IMP环化水解酶活性或修饰编码AICAR甲酰转移酶/IMP环化水解酶的基因以便具有后面描述的“特定突变”的方法。
术语“AICAR甲酰转移酶/IMP环化水解酶”可以指AICAR甲酰转移酶和/或IMP环化水解酶,即AICAR甲酰转移酶和IMP环化水解酶中的任一种或两种。术语“AICAR甲酰转移酶”可以指具有催化将5-氨基-1-(5-磷酸-D-核糖基)咪唑-4-甲酰胺(AICAR)和10-甲酰基四氢叶酸转化为5-甲酰胺基-1-(5-磷酸-D-核糖基)咪唑-4-甲酰胺(FAICAR)和四氢叶酸的反应的活性的蛋白质(EC2.1.2.3)。该活性也可称为“AICAR甲酰转移酶活性”。术语“IMP环化水解酶”可以指具有催化脱水FAICAR以产生IMP的反应的活性的蛋白质(EC3.5.4.10)。该活性也可称为“IMP环化水解酶活性”。编码AICAR甲酰转移酶/IMP环化水解酶的基因也可称为“AICAR甲酰转移酶/IMP环化水解酶基因”。AICAR甲酰转移酶和IMP环化水解酶可以编码为双功能酶。因此,术语“AICAR甲酰转移酶/IMP环化水解酶”可以具体指双功能AICAR甲酰转移酶/IMP环化水解酶,即具有AICAR甲酰转移酶活性和IMP环化水解酶活性的蛋白质。AICAR甲酰转移酶/IMP环化水解酶的实例可包括PurH蛋白,其是由purH基因编码的双功能AICAR甲酰转移酶/IMP环化水解酶。AICAR甲酰转移酶/IMP环化水解酶例如PurH蛋白的实例可包括各种生物体天然的那些,例如肠杆菌科细菌和棒状杆菌细菌。AICAR甲酰转移酶/IMP环化水解酶的具体实例可包括谷氨酸棒杆菌天然的PurH蛋白。谷氨酸棒杆菌ATCC 13869菌株天然的purH基因(NCg10827)的核苷酸序列显示为SEQ ID NO:177,并且由该基因编码的PurH蛋白的氨基酸序列显示为SEQ ID NO:178。
AICAR甲酰转移酶/IMP环化水解酶活性可以通过例如将酶与底物,如AICAR和10-甲酰基四氢叶酸(对于AICAR甲酰转移酶)和FAICAR(对于IMP环化水解酶)一起温育;并测量相应产物的酶和底物依赖性生成,例如FAICAR或四氢叶酸(对于AICAR甲酰转移酶);IMP(对于IMP环化水解酶)来测量。可以基于298nm处的吸光度测量四氢叶酸的生成(Rayl EA,etal(1996)JBC 271:2225-33)。此外,AICAR甲酰转移酶活性和IMP环化水解酶活性可以通过例如将酶与AICAR甲酰转移酶的底物,如AICAR和10-甲酰基四氢叶酸一起温育,并测量酶和底物依赖性的IMP环化水解酶的产物,例如IMP生成来共同测量。AICAR甲酰转移酶/IMP环化水解酶具有在至少一种适当条件下测量的AICAR甲酰转移酶/IMP环化水解酶活性是足够的。换言之,足够的是,微生物以在至少一种适当条件下测量活性时AICAR甲酰转移酶/IMP环化水解酶的活性得以降低的方式进行修饰。顺便提及,本文提及的所有其他蛋白质具有各自在至少一种适当条件下测量的相应活性也是足够的。
本文将解释降低蛋白质如AICAR甲酰转移酶/IMP环化水解酶活性的方法。AICAR甲酰转移酶/IMP环化水解酶的活性可以通过例如减弱编码AICAR甲酰转移酶/IMP环化水解酶的基因的表达,或破坏编码AICAR甲酰转移酶/IMP环化水解酶的基因来降低。此外,在一个实施方案中,还可以通过例如以具有“特定突变”的方式修饰编码AICAR甲酰转移酶/IMP环化水解酶的基因来降低AICAR甲酰转移酶/IMP环化水解酶的活性。此类降低AICAR甲酰转移酶/IMP环化水解酶活性的方法可以单独使用或以任意组合使用。
可以以使编码AICAR甲酰转移酶/IMP环化水解酶的基因具有“特定突变”的方式修饰微生物。
“特定突变”是导致改善微生物的目标物质生产能力的突变。就AICAR甲酰转移酶/IMP环化水解酶基因而言,术语“特定突变”可以指AICAR甲酰转移酶/IMP环化水解酶基因的核苷酸序列的变化。“特定突变”可以提供编码的AICAR甲酰转移酶/IMP环化水解酶的氨基酸序列的变化。因此,术语“特定突变”也可用于AICAR甲酰转移酶/IMP环化水解酶,该术语是指AICAR甲酰转移酶/IMP环化水解酶基因中“特定突变”提供的AICAR甲酰转移酶/IMP环化水解酶的氨基酸序列的变化。也就是说,表述“AICAR甲酰转移酶/IMP环化水解酶基因具有“特定突变””可以解读为由该基因编码的AICAR甲酰转移酶/IMP环化水解酶具有“特定突变”。
具有“特定突变”的AICAR甲酰转移酶/IMP环化水解酶也可称为“突变体AICAR甲酰转移酶/IMP环化水解酶”。编码突变体AICAR甲酰转移酶/IMP环化水解酶的基因,即具有“特定突变”的AICAR甲酰转移酶/IMP环化水解酶基因,也可称为“突变体AICAR甲酰转移酶/IMP环化水解酶基因”。
不具有“特定突变”的AICAR甲酰转移酶/IMP环化水解酶也可称为“野生型AICAR甲酰转移酶/IMP环化水解酶”。编码野生型AICAR甲酰转移酶/IMP环化水解酶的基因,即不具有“特定突变”的AICAR甲酰转移酶/IMP环化水解酶基因,也可称为“野生型AICAR甲酰转移酶/IMP环化水解酶基因”。野生型AICAR甲酰转移酶/IMP环化水解酶基因或野生型AICAR甲酰转移酶/IMP环化水解酶的实例可包括例如上文示例的AICAR甲酰转移酶/IMP环化水解酶基因或AICAR甲酰转移酶/IMP环化水解酶及其保守变体。
“特定突变”没有特别限制,只要突变改善微生物的目标物质生产能力即可。“特定突变”可以是例如用于降低AICAR甲酰转移酶/IMP环化水解酶活性的突变。“特定突变”也可以是例如用于增加AICAR的细胞内浓度的突变。
“特定突变”的具体实例可包括导致编码的AICAR甲酰转移酶/IMP环化水解酶的37位的丝氨酸残基(S37)被另一个氨基酸残基取代的突变。
在“S37”处的突变中,修饰后的氨基酸残基可以是除修饰前的氨基酸残基以外的任何氨基酸残基,其至少是丝氨酸残基以外的残基,只要该突变改善微生物的目标物质生产能力。修饰后的氨基酸残基的实例可包括K(Lys),R(Arg),H(His),A(Ala),V(Val),L(Leu),I(Ile),G(Gly),T(Thr),P(Pro),F(Phe),W(Trp),Y(Tyr),C(Cys),M(Met),D(Asp),E(Glu),N(Asn)和Q(Gln)。修饰后的氨基酸残基的具体实例可包括F(Phe)。也就是说,“特定突变”的具体实例可包括导致用F替换S37的突变(S37F突变)。
任意野生型AICAR甲酰转移酶/IMP环化水解酶中的“S37”可以指对应于SEQ IDNO:178所示氨基酸序列37位的谷氨酸残基的氨基酸残基。关于OMT的“L198”或“E199”处的突变的描述,如限定其绝对位置的那些,可以在必要修改后适用于AICAR甲酰转移酶/IMP环化水解酶的“S37”处的突变,条件是SEQ ID NO:178所示的氨基酸序列用作野生型蛋白质的参考序列。
以使AICAR甲酰转移酶/IMP环化水解酶基因具有“特定突变”的方式修饰微生物的方法没有特别限制。表述“微生物以使编码AICAR甲酰转移酶/IMP环化水解酶的基因具有“特定突变”的方式进行修饰”可以具体地意指微生物以具有突变体AICAR甲酰转移酶/IMP环化水解酶基因替换天然野生型AICAR甲酰转移酶/IMP环化水解酶基因的方式进行修饰。表述“微生物具有突变体AICAR转甲酰/IMP环基因替换天然野生型AICAR甲酰转移酶/IMP环化水解酶”可以意味着微生物具有突变体AICAR甲酰转移酶/IMP环化水解酶基因而它不再具有正常功能性天然野生型AICAR甲酰转移酶/IMP环化水解酶基因,即天然野生型AICAR甲酰转移酶/IMP环化水解酶基因已经以不能正常发挥功能的方式进行了修饰。已经以使微生物的目标物质生产能力得到改善的方式对天然野生型AICAR甲酰转移酶/IMP环化水解酶基因进行了修饰是足够的。短语“天然野生型AICAR甲酰转移酶/IMP环化水解酶基因”可以指固有存在于微生物中的野生型AICAR甲酰转移酶/IMP环化水解酶基因。也就是说,可以以通过例如将突变体AICAR甲酰转移酶/IMP环化水解酶基因导入微生物中使AICAR甲酰转移酶/IMP环化水解酶基因具有“特定突变”的方式对微生物进行了修饰。在此类情况下,应当以微生物的目标物质生产能力与突变体AICAR甲酰转移酶/IMP环化水解酶基因的引入相结合得到改善的方式对微生物染色体等上的天然野生型AICAR甲酰转移酶/IMP环化水解酶基因进行修饰,例如破坏或缺失。例如,天然野生型AICAR甲酰转移酶/IMP环化水解酶基因可以用突变体AICAR甲酰转移酶/IMP环化水解酶基因替换,或者可以不依赖于突变体AICAR甲酰转移酶/IMP环化水解酶基因的引入而破坏或缺失。或者,微生物也可以以通过例如在微生物的染色体等上将“特定突变”引入野生型AICAR甲酰转移酶/IMP环化水解酶基因,例如天然的野生型AICAR甲酰转移酶/IMP环化水解酶基因,使AICAR甲酰转移酶/IMP环化水解酶基因具有“特定突变”进行修饰。可以通过例如天然突变,诱变处理或遗传工程将突变引入染色体等上的基因中。
突变体AICAR甲酰转移酶/IMP环化水解酶基因可以通过例如修饰野生型AICAR甲酰转移酶/IMP环化水解酶基因,使得由此编码的AICAR甲酰转移酶/IMP环化水解酶具有“特定突变”来获得。待修饰的野生型AICAR甲酰转移酶/IMP环化水解酶基因可以通过例如从具有野生型AICAR甲酰转移酶/IMP环化水解酶基因的生物体中克隆或化学合成获得。待修饰的野生型AICAR甲酰转移酶/IMP环化水解酶基因可以源自或可以不源自微生物来源的微生物。或者,也可以在不使用野生型AICAR甲酰转移酶/IMP环化水解酶基因的情况下获得突变体AICAR甲酰转移酶/IMP环化水解酶基因。例如,突变体AICAR甲酰转移酶/IMP环化水解酶基因可以通过例如从具有突变体AICAR甲酰转移酶/IMP环化水解酶基因的生物体中克隆或化学合成而直接获得。获得的突变体AICAR甲酰转移酶/IMP环化水解酶基因可在使用前进一步修饰。可以使用已知方法修饰基因。例如,可以通过位点特异性诱变方法将目标突变引入DNA的靶位点。
待修饰活性的蛋白质可以根据产生目标物质的生物合成途径的类型以及选定的微生物中固有存在的蛋白质的类型和活性来适当选择。例如,当通过原儿茶酸的生物转化生产香草醛时,可优选增强OMT,ACAR,PPT和原儿茶酸摄取***中一种或多种的活性。此外,当通过原儿茶醛生物转化生产香草醛时,可以优选增强OMT的活性。已经将微生物修饰为具有拟杆菌门OMT基因,因此可以至少增强OMT活性。
用于育种出具有目标物质生产能力的微生物的基因和蛋白质可以分别具有例如上面列举的或其他已知的核苷酸序列和氨基酸序列。此外,用于育种出具有目标物质生产能力的微生物的基因和蛋白质可以是上面例示的基因和蛋白质的保守变体,例如分别具有上述例示或其他已知核苷酸序列和氨基酸序列的基因和蛋白质。具体地,例如,用于育种出具有目标物质生产能力的微生物的基因可以各自是编码蛋白质的基因,所述蛋白质具有上述例示的氨基酸序列或已知蛋白质的氨基酸序列但可以包含一个或几个位置处一个或几个氨基酸残基的取代、缺失、***和/或添加,只要保持蛋白质的原始功能,即其酶活性,转运蛋白活性等即可。对于基因和蛋白质的保守变体,可以在必要修改后适用关于本文描述的OMT基因和OMT的保守变体的描述。
<1-2>源自属于拟杆菌门的细菌的O-甲基转移酶基因的导入
可以以具有源自属于拟杆菌门的细菌的O-甲基转移酶(OMT)基因(拟杆菌门OMT基因),例如本文所述的野生型OMT基因和突变体OMT基因的方式修饰微生物。具有OMT基因的微生物也可称为“具有OMT的微生物”。此外,具有突变体OMT基因或突变体OMT的微生物也可称为“具有OMT基因或OMT中的突变的微生物”。通过将微生物修饰为具有拟杆菌门OMT基因,可以改善微生物的目标物质生产能力,即,可以增加通过使用微生物的目标物质生产。也就是说,与未修饰的菌株,例如,与具有除拟杆菌门OMT基因以外的OMT基因替换拟杆菌门OMT基因的菌株相比,可以获得改善的目标物质生产能力和增加的目标物质的产量。目标物质产量的增加可以是目标物质的绝对生产程度,如绝对量和绝对产率的增加,或者可以是目标物质相对于副产物的相对生产程度,诸如相对量和相对产率。对于香草酸或香草醛生产,副产物的实例可包括例如异香草酸和异香草醛。
可以通过修饰具有目标物质生产能力的微生物以具有拟杆菌门OMT基因来获得微生物。微生物也可以通过将微生物修饰为具有拟杆菌门OMT基因,然后赋予微生物以目标物质生产能力或增强微生物的目标物质生产能力来获得。此外,微生物可以具有目标物质生产能力,这是由于以使它具有拟杆菌门OMT基因的对微生物的修饰,或者由于以使它具有拟杆菌门OMT基因的对微生物的修饰和其他用于赋予或增强目标物质生产能力的修饰的组合。构建微生物的修饰可以以任意顺序进行。
术语“O-甲基转移酶(OMT)”可以指具有在甲基供体存在下催化物质的羟基的甲基化反应的活性的蛋白质(EC 2.1.1.68等)。此活性也可以称为“OMT活性”。编码OMT的基因也可以称为“OMT基因”。根据在如本文中所述的方法中生产目标物质的特定生物合成途径,OMT可以具有需要的底物特异性。例如,当经由原儿茶酸向香草酸的转化生产目标物质时,可以使用至少对原儿茶酸特异性的OMT。此外,例如,当经由原儿茶醛向香草醛的转化生产目标物质时,可以使用至少对原儿茶醛特异性的OMT。也就是说,具体地,术语“O-甲基转移酶(OMT)”可以指具有催化在存在甲基基团供体的情况下使原儿茶酸和/或原儿茶醛甲基化(即间位上的羟基基团的甲基化)以产生香草酸和/或香草醛的反应的活性的蛋白质。OMT可以使用原儿茶酸和原儿茶酸两者作为底物,但是不一定限于此。此外,当产生阿魏酸、4-乙烯基愈创木酚或4-乙基愈创木酚时,可以使用至少对咖啡酸特异性的OMT。也就是说,具体地,术语“O-甲基转移酶(OMT)”也可以指具有在存在甲基供体的情况下催化使咖啡酸甲基化以产生阿魏酸的反应的活性的蛋白质。甲基供体的实例可以包括S-腺苷甲硫氨酸(SAM)。
OMT也可以催化使原儿茶酸和/或原儿茶醛甲基化以产生异香草酸和/或异香草醛,即对位羟基的甲基化的反应,作为副反应。OMT可以选择性催化间位羟基的甲基化。表述“选择性催化间位羟基的甲基化”可以表示OMT从原儿茶酸选择性产生香草酸和/或OMT从原儿茶醛选择性产生香草醛。表述“从原儿茶酸选择性产生香草酸”可以表示当允许OMT作用于原儿茶酸时,以摩尔比计,相对于香草酸和异香草酸的总量,OMT产生的香草酸的量例如为60%以上,65%以上,70%以上,75%以上,80%以上,85%以上,90%以上,或95%以上。此比率(即香草酸的量相对于香草酸和异香草酸的总量的比率)也可以称为“VA/(VA+iVA)比率”。此外,表述“从原儿茶醛选择性产生香草酸”可以表示当允许OMT作用于原儿茶醛时,以摩尔比计,相对于香草醛和异香草醛的总量,OMT产生的香草醛的量例如为60%以上,65%以上,70%以上,75%以上,80%以上,85%以上,90%以上,或95%以上。该比率(即香草醛的量相对于香草醛和异香草醛的总量的比率)也可以称为“Vn/(Vn+iVn)比率”。
OMT活性可以通过例如在存在SAM的情况下将酶与底物,如原儿茶酸或原儿茶醛一起温育,并测量相应产物,例如香草酸或香草醛的酶和底物依赖性产生来测量(WO2013/022881A1)。此外,通过在相同条件下测量相应副产物,如异香草酸或异香草醛的产生,并将副产物的产生与产物的产生进行比较,可以确定OMT是否选择性产生产物。
短语“源自属于拟杆菌门的细菌的OMT基因(拟杆菌门OMT基因)”可以指编码源自属于拟杆菌门的细菌的或属于拟杆菌门的细菌天然的OMT的基因。此类OMT也可称为“拟杆菌门OMT”。术语“源自拟杆菌门的细菌的或属于拟杆菌门的细菌天然的OMT(拟杆菌门OMT)”可以共同指在拟杆菌门细菌,即属于拟杆菌门的细菌中发现的OMT,及其在特定范围内的变异,例如下文描述的保守变体和特定突变体。
拟杆菌门细菌的实例可包括属于Niastella、Terrimonas、Chitinophaga等属的细菌(International Journal of Systematic and Evolutionary Microbiology(2007),57,1828-1833)。Niastella细菌的实例可包括Niastella koreensis。也就是说,拟杆菌门OMT基因和拟杆菌门OMT的实例可以分别包括Niastella koreensis天然的OMT基因和OMT。Niastella koreensis天然的OMT基因的核苷酸序列以SEQ ID NO:140所示,并且由该基因编码的OMT的氨基酸序列以SEQ ID NO:141所示。也就是说,拟杆菌门OMT基因可以是例如具有SEQ ID NO:140所示核苷酸序列的基因。此外,拟杆菌门OMT可以是例如具有SEQ ID NO:141所示的氨基酸序列的蛋白质。表述“基因或蛋白质具有核苷酸或氨基酸序列”包括当基因或蛋白质包括核苷酸或氨基酸序列时,以及当基因或蛋白质仅包括核苷酸或氨基酸序列时。
拟杆菌门OMT基因可以是上面示例的任何OMT基因的变体,即具有SEQ ID NO:140所示的核苷酸序列的基因,只要其原始功能得以保持即可。类似地,拟杆菌门OMT可以是上面示例的任何OMT的变体,即具有SEQ ID NO:141所示的氨基酸序列的蛋白质,只要其原始功能得以保持即可。保持其原始功能的变体也可以称为“保守变体”。也就是说,拟杆菌门OMT基因和拟杆菌门OMT的实例还可包括此类保守变体。此类保守变体可以存在于拟杆菌门细菌中或者可以不存在于拟杆菌门细菌中。保守变体的实例可以包括例如上文示例的基因和蛋白质的同源物和人工修饰形式。
表述“保持原始功能”是指基因或蛋白质的变体具有对应于原始基因或蛋白质的功能(例如活性或性质)的功能(例如活性或性质)。当提及基因时,表述“保持原始功能”可以意指基因的变体编码保持原始功能的蛋白质。也就是说,当提及OMT基因时,表述“保持原始功能”可以意味着该基因的变体编码OMT。当提及OMT时,表述“保持原始功能”可意味着蛋白质的变体具有OMT活性。
以下将解释保守变体的实例。
拟杆菌门OMT基因同源物或拟杆菌门OMT同源物可以使用上述例示的拟杆菌门OMT基因的任何核苷酸序列或上文例示的拟杆菌门OMT的任何氨基酸序列作为查询序列通过例如BLAST搜索或FASTA搜索从公共数据库容易地获得。此外,拟杆菌门OMT基因的同源物可以通过例如使用拟杆菌门细菌等生物体的染色体作为模板和基于上述例示的拟杆菌门OMT基因的任何核苷酸序列制备的寡核苷酸作为引物的PCR获得。
拟杆菌门OMT基因可以编码蛋白质,所述蛋白质具有任何上述氨基酸序列如以SEQID NO:141所示的氨基酸序列,且包括在一个或几个位置处一个或几个氨基酸残基的取代,缺失,***和/或添加,只要保持原始功能即可。例如,编码的蛋白质可以具有延伸的或缺失的N端和/或C端。尽管以上使用的术语“一个或几个”所表示的数目可以随蛋白质的三维结构中的氨基酸残基的位置或氨基酸残基的类型而不同,具体而言,它例如为1至50,1至40,1至30,1至20,1至10,1至5,或1至3。
一个或几个氨基酸残基的上述取代,缺失,***和/或添加可以各自是保持蛋白质原始功能的保守突变。保守突变的典型实例是保守取代。若取代位点是芳香氨基酸,则保守取代是其中取代在Phe,Trp和Tyr之间相互发生的突变;若它是疏水性氨基酸,则保守取代是取代在Leu,Ile和Val之间相互发生的突变;若它是极性氨基酸;则保守取代是取代在Gln和Asn之间相互发生的突变;若它是碱性氨基酸,则保守取代是取代在Lys,Arg和His之间相互发生的突变;若它是酸性氨基酸,则保守取代是取代在Asp和Glu之间相互发生的突变;以及若它是具有羟基的氨基酸,则保守取代是取代在Ser和Thr之间相互发生的突变。认为是保守取代的取代的实例可以具体包括用Ser或Thr取代Ala,用Gln,His,或Lys取代Arg,用Glu,Gln,Lys,His,或Asp取代Asn,用Asn,Glu,或Gln取代Asp,用Ser或Ala取代Cys,用Asn,Glu,Lys,His,Asp,或Arg取代Gln,用Gly,Asn,Gln,Lys,或Asp取代Glu,用Pro取代Gly,用Asn,Lys,Gln,Arg,或Tyr取代His,用Leu,Met,Val,或Phe取代Ile,用Ile,Met,Val,或用Phe取代Leu,用Asn,Glu,Gln,His,或Arg取代Lys,用Ile,Leu,Val,或Phe取代Met,用Trp,Tyr,Met,Ile,或Leu取代Phe,用Thr或Ala取代Ser,用Ser或Ala取代Thr,用Phe或Tyr取代Trp,用His,Phe,或Trp取代Tyr,以及用Met,Ile,或Leu取代Val。此外,如上所述的氨基酸残基的此类取代,缺失,***,添加等可以包括由于个体差异引起的天然存在的突变或者该基因来源的生物体的物种的差异(突变体或变体)。
此外,拟杆菌门OMT基因可以是编码与上述任何氨基酸序列的总氨基酸序列具有例如50%或更多,65%或更多,80%或更多,90%或更多,95%或更多,97%或更多,或99%或更多的同源性的氨基酸序列的蛋白质的基因,只要保持原始功能。另外,在本说明书中,“同源性”等同于“同一性”。
此外,拟杆菌门OMT基因可以是能够在严格条件下与可以从任何前述核苷酸序列,如以SEQ ID NOS:140所示的核苷酸序列制备的探针,例如与任何上述核苷酸序列的全部序列或部分序列互补的序列杂交的基因(例如DNA),只要保持原始功能。“严格条件”可以指形成所谓特异性杂合物,并且不形成非特异性杂合物的条件。严格条件的实例可以包括高度同源的DNA彼此杂交(例如,不小于50%,65%,或80%同源,不小于90%同源,不小于95%同源,不小于97%同源,或不小于99%同源的DNA彼此杂交,并且同源性小于上述项的DNA不彼此杂交)的那些条件,或典型的Southern杂交的清洗条件,即在与1x SSC,0.1%SDS于60℃;0.1x SSC,0.1%SDS于60℃;或者0.1x SSC,0.1%SDS于68℃对应的盐浓度和温度清洗1次,或2或3次的条件。
用于上述杂交的探针可以是与如上述的基因互补的序列的一部分。此类探针可以使用基于已知基因序列制备的寡核苷酸作为引物和含有任何上述基因的DNA片段作为模板通过PCR制备。作为探针,例如可以使用长度约300bp的DNA片段。当使用长度为约300bp的DNA片段作为探针时,具体地,杂交的清洗条件可以是例如50℃,2xSSC和0.1%SDS。
此外,由于关于密码子简并性的性质随宿主而变化,拟杆菌门OMT基因可以包括相应等同密码子对任意密码子的替换。也就是说,由于遗传密码的简并性,拟杆菌门OMT基因可以是以上例示的任何拟杆菌门OMT基因的变体。例如,拟杆菌门OMT基因可以以使其根据选择的宿主中的密码子频率而具有最佳密码子的方式进行了修饰的基因。经密码子优化的拟杆菌门OMT基因的实例可以包括例如具有以SEQ ID NO:145所示的核苷酸序列的OMT基因,其已经针对谷氨酸棒杆菌的密码子选择进行了密码子优化。
例如,可以通过数学算法来确定两个序列之间的序列同一性的百分比。此类数学算法的非限制性实例可以包括Myers and Miller(1988)CABIOS4:11-17的算法、Smith etal(1981)Adv.Appl.Math.2:482的局部同源性算法、Needleman and Wunsch(1970)J.Mol.Biol.48:443-453的同源性比对算法、Pearson and Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的同源性筛选方法和Karlin and Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264的算法的修改形式,诸如记载于Karlin and Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873-5877的。
通过使用基于此类数学算法的程序,可以进行用于确定序列同一性的序列比较和比对。该程序可以由计算机适当地执行。此类程序的实例可以包括但不限于PC/Gene程序的CLUSTAL(可从Intelligenetics,Mountain View,Calif.获得),ALIGN程序(版本2.0)以及Wisconsin Genetics Software Package,版本8(可从Genetics Computer Group(GCG),575Science Drive,Madison,Wis.,USA获得)的GAP,BESTFIT,BLAST,FASTA和TFASTA。使用这些程序的比对可以通过使用例如初始参数来进行。CLUSTAL程序充分记载于Higgins etal.(1988)Gene 73:237-244(1988),Higgins et al.(1989)CABIOS 5:151-153,Corpet etal.(1988)Nucleic Acids Res.16:10881-90,Huang et al.(1992)CABIOS 8:155-65,以及Pearson et al.(1994)Meth.Mol.Biol.24:307-331。
为了获得与靶核苷酸序列同源的核苷酸序列,具体而言,例如,可以通过使用BLASTN程序以100的得分和12的字长来进行BLAST核苷酸搜索。为了获得与靶蛋白质同源的氨基酸序列,特别地,例如可以通过以50的得分和3的字长使用BLASTX程序进行BLAST蛋白质搜索。关于BLAST核苷酸搜索和BLAST蛋白质搜索,参见ncbi.nlm.nih.gov。另外,为了比较目的,可以使用Gapped BLAST(BLAST 2.0)以获得包含缺口的比对。另外,可以使用PSI-BLAST来进行重复搜索以检测序列之间的远距离关系。关于Gapped BLAST和PSI-BLAST,参见Altschul et al.(1997)Nucleic Acids Res.25:3389。当使用BLAST、Gapped BLAST或PSI-BLAST时,可以使用每个程序的初始参数(例如核苷酸序列的BLASTN和氨基酸序列的BLASTX)。比对也可以手动进行。
两个序列之间的序列同一性计算为在比对两个序列以便彼此最大限度配合时两个序列中匹配的残基的比率。
前述关于基因和蛋白质的保守变体的描述可以在必要修改后应用于任意蛋白质的变体,例如目标物质生物合成酶和编码它们的基因。
拟杆菌门OMT的实例可以进一步包含具有“特定突变”的OMT。此外,拟杆菌门OMT基因的实例还可以包含编码具有“特定突变”的OMT的OMT基因。具有“特定突变”的OMT也可以称为“突变体OMT”。编码突变体OMT的基因也可以称为“突变体OMT基因”。
不具有“特定突变”的OMT也可称为“野生型OMT”。编码野生型OMT的基因也可称为“野生型OMT基因”。本文提及的术语“野生型”用于方便区分“野生型”OMT和“突变体”OMT,并且“野生型”OMT不限于作为天然物质获得的那些,并且可以包括任何不具有“特定突变”的OMT。野生型OMT的实例可包括例如上面示例的OMT。此外,上述示例的OMT的所有保守变体应包括在野生型OMT中,条件是此类保守变体不具有“特定突变”。
突变体OMT可以与野生型OMT,例如上面示例的OMT及其保守变体相同,条件是突变体OMT具有“特定突变”。也就是说,突变体OMT可以是具有野生型OMT的任何氨基酸序列但具有“特定突变”的蛋白质。具体地,突变体OMT可以是例如具有SEQ ID NO:141所示的氨基酸序列的蛋白质,条件是突变体OMT具有“特定突变”。另外,具体地,突变体OMT可以是例如具有SEQ ID NO:141所示的氨基酸序列,但包括一个或几个氨基酸残基的取代,缺失,***和/或添加的蛋白质,条件是突变体OMT具有“特定突变”。此外,具体地,突变体OMT可以是例如与SEQ ID NO:141的氨基酸序列显示50%或更多,65%或更多,或80%或更多,90%或更多,95%或更多,97%或更多,或99%或更多的同一性的氨基酸序列的蛋白质,条件是突变体OMT具有“特定突变”。
在用作野生型OMT的保守变体中,保守突变可以发生在除“特定突变”的位置之外的位置。也就是说,换句话说,突变体OMT可以是具有上述示例的OMT的任何氨基酸序列,但具有“特定突变”并且还包括保守突变,例如在“特定突变”的位置以外的位置的一个或几个氨基酸残基的取代,缺失,***,和/或添加的蛋白质。
“特定突变”可以是对生产目标物质有效的突变,例如导致OMT的VA/(VA+iVA)比率和/或Vn/(Vn+iVn)比率增加的突变。
“特定突变”的实例可包括在以下氨基酸残基处的突变:D21,L31,M36,S42,L67,Y90和P144。“特定突变”可以是一个氨基酸残基的突变,或者可以是两个或多个氨基酸残基的突变组合。也就是说,“特定突变”可以包括例如以下氨基酸残基中的一个或多个的突变:D21,L31,M36,S42,L67,Y90和P144。
在上述用于定义氨基酸残基的表示法中,数字代表SEQ ID NO:141所示氨基酸序列中的位置,数字左侧的字母代表SEQ ID NO:141所示氨基酸序列中相应位置处的氨基酸残基,即在相应位置处修饰前的氨基酸残基。即,例如,“D21”表示SEQ ID NO:141所示的氨基酸序列中第21位的D(Asp)残基。任意野生型OMT中的这些氨基酸残基各自可以指“对应于SEQ ID NO:141所示氨基酸序列中所示氨基酸残基的氨基酸残基”。即,例如,任意野生型OMT中的“D21”表示对应于SEQ ID NO:141所示氨基酸序列中第21位的D(Asp)残基的氨基酸残基。
在上述每个突变中,修饰后的氨基酸残基可以是修饰前氨基酸残基以外的任何氨基酸残基。修饰后的氨基酸残基的实例可包括K(Lys),R(Arg),H(His),A(Ala),V(Val),L(Leu),I(Ile),G(Gly),S(Ser),T(Thr),P(Pro),F(Phe),W(Trp),Y(Tyr),C(Cys),M(Met),D(Asp),E(Glu),N(Asn)和Q(Gln),条件是修饰后的氨基酸残基不是修饰前的氨基酸残基。作为修饰后的氨基酸残基,可以选择对于目标物质的生产有效的那些,例如导致OMT的VA/(VA+iVA)比率和/或Vn/(Vn+iVn)比率增加的那些。
“特定突变”的具体实例可包括以下突变D21Y,L31H,M36(K,V),S42C,L67F,Y90(A,C,G,S)和P144(E,G,S,V,Y)。即,氨基酸残基D21,L31,M36,S42,L67,Y90和P144处的突变可以分别是例如突变D21Y,L31H,M36(K,V),S42C,L67F,Y90(A,C,G,S)和P144(E,G,S,V,Y)。“特定突变”可包括例如以下突变中的一种或多种:D21Y,L31H,M36(K,V),S42C,L67F,Y90(A,C,G,S)和P144(E,G,S,V,Y)。
在上述用于定义突变的符号中,数字左侧的数字和字母表示与上述相同的数字和字母。在上述用于定义突变的表示法中,数字右侧的字母表示在相应位置修饰后的氨基酸残基。即,例如,“D21Y”表示用Y(Tyr)残基取代SEQ ID NO:141所示氨基酸序列中第21位的D(Asp)残基的突变。另外,例如,M36(K,V)代表用K(Lys)或V(Val)残基取代SEQ ID NO:141所示氨基酸序列中第36位的M(Met)残基的突变。任意野生型OMT中的这些突变各自可以指“对应于SEQ ID NO:141所示的氨基酸序列中的指定突变的突变”。“对应于SEQ ID NO:141所示的氨基酸序列中X位氨基酸残基处突变的突变”应当读作对应于SEQ ID NO:141所示的氨基酸序列中X位处氨基酸残基的氨基酸残基的突变。也就是说,例如,任意野生型OMT中的“D21Y”表示用Y(Tyr)残基替换与SEQ ID NO:141所示的氨基酸序列中第21位的D(Asp)残基对应的氨基酸残基的突变。
突变组合的数量没有特别限制。突变组合的具体实例可包括D21Y/M36K/L67F,D21Y/M36K/L67F/Y90A,L31H/M36K/L67F/P144V,L31H/L67F/Y90A,M36K/S42C/L67F,M36K/L67F,M36K/L67F/Y90A,M36K/L67F/Y90A/P144E,M36K/L67F/Y90C,M36K/L67F/Y90C/P144V,M36K/L67F/Y90G,M36K/L67F/Y90S/P144G,M36K/L67F/P144S,M36K/L67F/P144Y,M36K/Y90A/P144V,M36K/P144E和M36V/L67F/P144S。也就是说,“特定突变”可以包括例如这些组合中的任一种。
在上述用于定义组合的符号中,数字和数字左侧和右侧的字母表示与上述相同的符号。在上述用于定义组合的表示法中,一起记录并用“/”***的两个或多个突变表示双重或更多重突变。即,例如,“M36K/P144E”代表M36K和P144E的双重突变。
氨基酸序列中的“X位”可以指从氨基酸序列的N-末端开始计数的第X位,并且N-末端的氨基酸残基是1位的氨基酸残基。在上述突变中定义的位置代表相对位置,并且它们的绝对位置可以由于氨基酸残基的缺失,***,添加等而发生变化。例如,若在SEQ ID NO:141所示的氨基酸序列中X位的N-末端侧的位置处缺失或***一个氨基酸残基,则原始在X位的氨基酸残基在X-1或X+1位处重新定位,然而,它仍被认为是“对应于SEQ ID NO:141所示氨基酸序列的X位处氨基酸残基的氨基酸残基”。
在上述示例突变中定义的修饰之前的氨基酸残基是典型的,但不一定限于此。例如,“对应于D21的氨基酸残基”通常可以是D(Asp)残基,但是,它可以不一定是D(Asp)残基。即,当野生型OMT具有SEQ ID NO:141所示的氨基酸序列以外的氨基酸序列时,“对应于D21的氨基酸残基”可以是除D(Asp)残基之外的氨基酸残基。因此,“对应于D21Y的突变”不仅可以包括当“对应于D21的氨基酸残基”是D(Asp)残基时,用Y(Tyr)残基取代该D(Asp)残基的突变,而且还包括当“对应于D21的氨基酸残基”是K(Lys),R(Arg),H(His),A(Ala),V(Val),L(Leu),I(Ile),G(Gly),S(Ser),T(Thr),P(Pro),F(Phe),W(Trp),C(Cys),M(Met),E(Glu),N(Asn)或Q(Gln)残基时,用Y(Tyr)残基取代该残基的突变。同样可以在适当修改后适用于其他突变。
在任意OMT的氨基酸序列中,哪个氨基酸残基是“对应于SEQ ID NO:141所示氨基酸序列中X位氨基酸残基的氨基酸残基”可以通过比对任意OMT的氨基酸序列和SEQ ID NO:141的氨基酸序列来确定。比对可以通过例如使用已知的基因分析软件进行。此类软件的具体实例可包括Hitachi Solutions生产的DNASIS,Genetyx生产的GENETYX等(ElizabethC.Tyler et al.,Computers and Biomedical Research,24(1)72-96,1991;Barton GJ etal.,Journal of Molecular Biology,198(2),327-37,1987)。
突变体OMT基因可以通过例如修饰野生型OMT基因以使由其编码的OMT具有“特定突变”而获得。待修饰的野生型OMT基因可以通过例如从具有野生型OMT基因的生物体中克隆或化学合成获得。此外,还可以在不使用野生型OMT基因的情况下获得突变体OMT基因。例如,突变体OMT基因可以通过化学合成直接获得。获得的突变体OMT基因可以原样使用,或者可以在使用前进一步修饰。
可以使用已知方法修饰基因。例如,可以通过位点特异性诱变方法将目标突变引入DNA的靶位点。位点特异性诱变方法的实例可包括使用PCR的方法(Higuchi,R.,61,于PCRTechnology,Erlich,H.A.编,Stockton Press(1989);Carter P.,Meth.In Enzymol.,154,382(1987)),和使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.in Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。
通过将基因导入微生物,可以将微生物修饰为具有拟杆菌门OMT基因,例如上述野生型OMT基因和突变体OMT基因。或者,当微生物已经在其染色体上具有OMT基因等时,通过将“特定突变”引入染色体等上的OMT基因,也可以将微生物修饰为具有突变体OMT基因。可以通过例如天然突变,诱变处理或遗传工程将突变引入染色体等上的基因中。
将拟杆菌门OMT基因导入微生物的方法没有特别限制。足够的是拟杆菌门OMT基因能够由微生物表达。微生物可具有一个拟杆菌门OMT基因拷贝,或可具有两个或多个的拟杆菌门OMT基因拷贝。微生物可以具有一种拟杆菌门OMT基因,或者可以具有两种或更多种拟杆菌门OMT基因。可以通过与下文“增加蛋白质活性的方法”中描述的基因引入相同的方式将拟杆菌门OMT基因引入微生物中。
微生物可以具有或不具有除拟杆菌门OMT基因之外的OMT基因。
<1-3>增加蛋白质活性的方法
以下,将解释用于增加蛋白质活性的方法,包括用于导入基因的方法。
表述“蛋白质的活性得以增加”指与非修饰菌株相比,蛋白质的活性增加。具体而言,表述“蛋白质的活性得以增加”可以意味着与非修饰菌株相比,每细胞的蛋白质的活性增加。术语“非修饰菌株”或“非修饰的微生物的菌株”可以指尚未以增加目标蛋白质活性的方式进行修饰的对照菌株。非修饰菌株的实例可以包括野生型菌株和亲本菌株。非修饰菌株的具体实例可以包括微生物物种的相应类型菌株。非修饰菌株的具体实例还可以包括以上关于微生物描述所例示的菌株。也就是说,在一个实施方案中,与类型菌株,即微生物所属的物种的类型菌株相比,蛋白质的活性可以得以增加。在另一个实施方案中,与谷氨酸棒杆菌ATCC13869菌株相比,蛋白质的活性也可以得以增加。在另一个实施方案中,与谷氨酸棒杆菌ATCC13032菌株相比,蛋白质的活性也可以得以增加。在另一个实施方案中,与大肠杆菌K-12MG1655菌株相比,蛋白质的活性也可以得以增加。“蛋白质活性得以增加”的短语也可以表达为“蛋白质的活性得以增强”。更具体地说,表述“蛋白质的活性得以增加”可以意味着与非修饰菌株相比每细胞的蛋白质的分子数目增加,和/或蛋白质的每个分子的功能增加。也就是说,表述“蛋白质活性得以增加”中的术语“活性”不限于蛋白质的催化活性,而且还可以指编码蛋白质的基因的转录量(即mRNA的量),或蛋白质的翻译量(即蛋白质的量)。此外,“蛋白质的活性得以增加”的短语不仅包括当目标蛋白质的活性在固有具有目标蛋白质活性的菌株中增加时,而且还包括当将目标蛋白质的活性赋予不固有地具有目标蛋白质活性的菌株时。此外,只要蛋白质的活性最终得以增加,宿主中固有存在的目标蛋白质的活性可以弱化和/或消除,然后可以将适当类型的目标蛋白质赋予宿主。
蛋白质活性增加的程度不受特别限制,只要蛋白质的活性与非修饰菌株相比增加即可。蛋白质的活性可以增加至例如非修饰菌株的蛋白质活性的1.2倍以上,1.5倍以上,2倍以上,或3倍以上。此外,当非修饰菌株不具有目标蛋白质的活性时,足够的是由于引入编码蛋白质的基因而产生蛋白质,并且例如,蛋白质可以以使其活性可以得到测量的程度生产。
提高蛋白质活性的修饰可以通过例如增加编码该蛋白质的基因的表达来实现。短语“基因的表达得以增加”意指与非修饰菌株如野生型菌株和亲本菌株相比,基因的表达得以增加。具体而言,短语“基因表达得以增加”可以意味着每个细胞的基因表达量与非修饰菌株相比得以增加。更具体地,短语“基因表达得以增加”可以意味着基因的转录量(即mRNA的量)得以增加,和/或基因的翻译量(即从基因表达的蛋白质量)得以增加。“基因表达得以增加”的短语也称为“基因表达得以增强”。基因的表达可以增加至例如非修饰菌株的表达的1.2倍以上,1.5倍以上,2倍以上,或3倍以上。此外,“基因表达得以增加”的短语不仅可以包括当目标基因的表达量在固有表达目标基因的菌株中得以增加时,而且还包括当将基因引入到不固有地表达目标基因并在其中表达的菌株中时。也就是说,短语“基因表达得以增加”也可以意指例如,将目标基因引入不拥有该基因的菌株中并在其中表达。
例如,可以通过增加基因的拷贝数来增加基因的表达。
可以通过将基因引入宿主的染色体来增加基因的拷贝数。例如可以通过使用同源重组(Miller,J.H.,Experiments in Molecular Genetics,1972,Cold Spring HarborLaboratory)将基因引入染色体。使用同源重组的基因转移方法的实例可以包括使用线性DNA的方法,诸如Red驱动的整合(Datsenko,K.A.,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000)),使用含有温度敏感性复制起点的质粒的方法,使用能够接合转移的质粒的方法,使用不具有在宿主中起作用的复制起点的***载体的方法,使用噬菌体的转导方法。可以引入基因的仅一个拷贝,或可以引入基因的两个或更多个拷贝。例如,通过使用以染色体上的多个拷贝存在的序列作为靶标进行同源重组,可以将多个拷贝的基因引入染色体。以多个拷贝存在于染色体上的此类序列的实例可以包括重复DNA和位于转座子两端的反向重复序列。或者,可以通过使用染色体上的适当序列,如对于产生目标物质不必要的基因作为靶标进行同源重组。另外,也可以用转座子或Mini-Mu(日本专利公开(Kokai)No.2-109985,美国专利No.5,882,888,EP 805867B1)将基因随机引入染色体。
可以通过使用具有与全部基因或其一部分互补的序列的探针进行Southern杂交、使用基于该基因序列制备的引物的PCR等确认靶基因对染色体的引入。
此外,通过将含有该基因的载体引入宿主中,也可以增加基因的拷贝数。例如,通过将含有靶基因的DNA片段与在宿主中起作用的载体连接以构建该基因的表达载体,并用该表达载体转化宿主,可以增加靶基因的拷贝数。可以通过例如使用具有靶基因的微生物的基因组DNA作为模板的PCR获得含有靶基因的DNA片段。作为载体,可以使用宿主细胞中可自主复制的载体。该载体可以是多拷贝载体。此外,载体可以具有用于选择转化体的标志物如抗生素抗性基因。此外,载体可以具有用于表达引入的基因的启动子和/或终止子。载体可以是例如源自细菌质粒的载体,源自酵母质粒的载体,源自噬菌体的载体,粘粒,噬菌粒等。可在肠杆菌科细菌诸如大肠杆菌中自主复制的载体的具体实例可以包括例如pUC19,pUC18,pHSG299,pHSG399,pHSG398,pBR322,pSTV29(所有这些可购自Takara Bio),pACYC184,pMW219(NIPPON GENE),pTrc99A(Pharmacia),pPROK系列载体(Clontech),pKK233-2(Clontech),pET系列载体(Novagen),pQE系列载体(QIAGEN),pCold TF DNA(TaKaRa),pACYC系列载体,和宽宿主范围的载体RSF1010。可在棒状杆菌细菌中自主复制的载体的具体实例可以包括例如pHM1519(Agric.Biol.Chem.,48,2901-2903(1984));pAM330(Agric.Biol.Chem.,48,2901-2903(1984));通过改善这些质粒获得并具有药物抗性基因的质粒;日本专利公开(Kokai)No.3-210184中描述的质粒pCRY30;日本专利公开(Kokai)No.2-72876和美国专利No.5,185,262中描述的质粒pCRY21,pCRY2KE,pCRY2KX,pCRY31,pCRY3KE和pCRY3KX;日本专利公开(Kokai)No.1-191686中描述的质粒pCRY2和pCRY3;日本专利公开(Kokai)No.58-192900中描述的pAJ655,pAJ611和pAJ1844;日本专利公开(Kokai)No.57-134500中描述的pCG1;日本专利公开(Kokai)No.58-35197中描述的pCG2;日本专利公开(Kokai)No.57-183799中描述的pCG4和pCG11;日本专利公开(Kokai)No.10-215883中描述的pVK7;WO2007/046389中描述的pVK9;WO2013/069634中描述的pVS7;和日本专利公开(Kokai)No.9-070291中描述的pVC7。
当引入基因时,宿主可以表达基因是足够的。具体而言,宿主中存在基因以便其在宿主中起作用的启动子的控制下表达是足够的。术语“在宿主中起作用的启动子”可以指在宿主中显示启动子活性的启动子。启动子可以是源自宿主的启动子或异源启动子。启动子可以是待引入基因的天然启动子或另一基因的启动子。作为启动子,例如也可以使用如本文描述的更强的启动子。
终止基因转录的终止子可以位于基因的下游。终止子没有特别限制,只要其在选择的宿主中起作用。终止子可以是源自宿主的终止子或异源终止子。终止子可以是待引入基因的天然终止子或另一基因的终止子。终止子的具体实例可以包括例如T7终止子、T4终止子、fd噬菌体终止子、tet终止子和trpA终止子。
在“Fundamental Microbiology Vol.8,Genetic Engineering,KYORITSUSHUPPAN CO.,LTD,1987”中详细公开了可用于各种微生物中的载体,启动子和终止子,并且可以使用那些。
此外,当引入两个或更多个基因时,基因各自可以由宿主表达是足够的。例如,所有基因可以由单个表达载体或染色体携带。此外,基因可以分别由两个或更多个表达载体携带,或者分开由单一或两个或更多个表达载体和染色体携带。也可以引入由两个或更多个基因构成的操纵子。“引入2个或更多个基因”的短语可以指例如引入编码2种或更多种蛋白质(酶等)的相应基因,引入编码构成单一蛋白质复合物(例如酶复合物)的2种或更多种亚基的相应基因以及它们的组合。
待引入的基因没有特别限制,只要它编码在宿主中起作用的蛋白即可。待引入的基因可以是源自宿主的基因,或者可以是异源基因。可以例如使用基于该基因的核苷酸序列设计的引物,并使用具有该基因的生物体的基因组DNA,携带该基因的质粒等作为模板通过PCR获得待引入的基因。待引入的基因也可以完全合成,例如基于该基因的核苷酸序列(Gene,60(1),115-127(1987))。获得的基因可以原样使用,或者根据需要在修饰后使用。也就是说,可以通过修饰基因来获得基因的变体。基因可以通过已知技术进行修饰。例如,可以通过位点特定突变方法将目标突变引入DNA的目标位点。也就是说,可以通过位点特定突变方法修饰基因的编码区,使得编码蛋白的特定位点包括氨基酸残基的取代,缺失,***和/或添加。位点特定突变方法的实例可以包括利用PCR的方法(Higuchi,R.,61,于PCRTechnology,Erlich,H.A.Eds.,Stockton Press(1989);Carter,P.,Meth.in Enzymol.,154,382(1987))和利用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.于Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。或者,可以完全合成基因的变体。
另外,当蛋白质作为由多个亚基构成的复合物起作用时,可以修饰多个亚基的部分或全部,只要蛋白质的活性最终得以增加。也就是说,例如,当通过增加基因的表达来增加蛋白质的活性时,可以增强编码亚基的多个基因的部分或全部的表达。通常优选增强编码亚基的多个基因全部的表达。此外,构成该复合物的亚基可以源自单一种类的生物体或两种或更多种生物体,只要该复合物具有目标蛋白质的功能即可。也就是说,例如,可以将编码多个亚基的相同生物体的基因引入宿主,或者可以将编码多个亚基的不同生物体的基因引入宿主中。
此外,可以通过改善基因的转录效率增加基因的表达。另外,通过提高基因的翻译效率也可以增加基因的表达。基因的转录效率和基因的翻译效率可以通过例如修饰基因的表达控制序列来改善。术语“表达控制序列”可以共同指影响基因表达的位点。表达控制序列的实例可以包括例如启动子,Shine-Dalgarno(SD)序列(其也可以称为核糖体结合位点(RBS))和RBS与起始密码子之间的间隔物区。可以通过使用启动子搜索载体或基因分析软件如GENETYX来鉴定表达控制序列。这些表达调控序列可以通过例如使用温度敏感性载体的方法或Red驱动整合方法(WO2005/010175)进行修饰。
通过例如用更强的启动子替换染色体上的基因的启动子可以提高基因的转录效率。术语“更强的启动子”可以指与基因的固有的野生型启动子相比提供改善的基因转录的启动子。更强的启动子的实例可以包括例如已知的高表达启动子,诸如T7启动子、trp启动子、lac启动子、thr启动子、tac启动子、trc启动子、tet启动子、araBAD启动子、rpoH启动子、msrA启动子、Pm1启动子(源自双歧杆菌属(Bifidobacterium))、PR启动子和PL启动子。在棒状杆菌细菌中可用的更强启动子的实例可以包括例如在棒状杆菌细菌中用乙酸、乙醇、丙酮酸等可诱导的人工修饰的P54-6启动子(Appl.Microbiol.Biotechnol.,53,674-679(2000)),pta,aceA,aceB,adh,和amyE启动子,cspB,SOD和tuf(EF-Tu)启动子,它们是能够在棒状杆菌细菌中提供大表达量的有力启动子(Journal of Biotechnology,104(2003)311-323;Appl.Environ.Microbiol.,2005Dec;71(12):8587-96),P2启动子(SEQ ID NO:108的位置942-1034)和P3启动子(SEQ ID NO:111)以及lac启动子,tac启动子和trc启动子。此外,作为更强的启动子,通过使用各种报道基因也可以获得高活性类型的现有启动子。例如,通过使启动子区中的-35和-10区更接近共有序列,可以增强启动子的活性(WO00/18935)。高活性型启动子的实例可以包括各种tac样启动子(Katashkina JI et al.,Russian Federation Patent Application No.2006134574)。在Goldstein et al.(Prokaryotic Promoters in Biotechnology,Biotechnol.Annu.Rev.,1,105-128(1995))的论文等中描述了评估启动子强度的方法和强启动子的实例。
例如,通过用更强的SD序列替换染色体上的基因的Shine-Dalgarno(SD)序列(其也可以称为核糖体结合位点(RBS)),可以改善基因的翻译效率。术语“更强的SD序列”可以指与基因固有的野生型SD序列相比提供改善的mRNA翻译的SD序列。更强的SD序列的实例可以包括例如源自噬菌体T7的基因10的RBS(Olins P.O.et al,Gene,1988,73,227-235)。此外,已知在RBS和起始密码子之间的间隔物区中,特别是在紧邻起始密码子上游的序列(5'-UTR)中,几个核苷酸的取代,***或缺失显著影响mRNA的稳定性和翻译效率,因此,也可以通过修饰来改善基因的翻译效率。
基因的翻译效率也可以通过例如修饰密码子来改善。例如,通过用更频繁使用的同义密码子取代基因中存在的稀有密码子,可以提高基因的翻译效率。也就是说,例如,基因可以以使该基因含有根据在选择的宿主中观察到的密码子频率的最佳密码子的方式进行了修饰。例如,可以通过用于将目标突变引入DNA的目标位点中的位点特定突变方法替换密码子。或者,可以完全合成替换目标密码子的基因片段。“密码子选择数据库”(kazusa.or.jp/codon;Nakamura,Y.et al,Nucl.Acids Res.,28,292(2000))中公开了各种生物体中的密码子的频率。
此外,基因的表达还可以通过扩增增加基因表达的调节子或缺失或弱化减少基因表达的调节子来增加。
可以独立使用或以任意组合使用如上所述用于增加基因表达的此类方法。
此外,也可以通过例如增强酶的比活性来获得增加蛋白质活性的修饰。比活性的增强也可以包括对反馈抑制的脱敏。也就是说,当蛋白质被代谢物反馈抑制时,可以通过使选择的宿主中的基因或蛋白质突变以对反馈抑制脱敏来增加蛋白质的活性。短语“对反馈抑制脱敏”可以包括消除反馈抑制,和弱化反馈抑制,除非另有叙述。此外,“对反馈抑制脱敏”的短语,即当反馈抑制得到消除或弱化时,也可以称为“对反馈抑制耐受”。通过例如搜索各种生物体可以获得显示增强的比活性的蛋白质。此外,通过向现有蛋白质中引入突变也可以获得高活性类型的固有蛋白质。待引入的突变可以是例如在蛋白质的一个或几个位置上一个或几个氨基酸残基的取代,缺失,***和/或添加。可以通过例如如上所述的此类位点特定突变方法来引入突变。突变也可以通过例如诱变处理来引入。诱变处理的实例可以包括X射线照射,紫外线照射和用突变剂如N-甲基-N'-硝基-N-亚硝基胍(MNNG),甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)处理。此外,可以通过用羟胺在体外直接处理DNA来诱导随机突变。比活性的增强可以独立使用,或者可以与如上述用于增强基因表达的此类方法任意组合使用。
用于转化的方法不受特别限制,并且可以使用常规已知的方法。可以使用例如用氯化钙处理接受细胞以增加其对DNA的通透性的方法,其已经对大肠杆菌K-12菌株报道(Mandel,M.and Higa,A.,J.Mol.Biol.,1970,53,159-162),以及从生长阶段中的细胞制备感受态细胞,接着用DNA转化的方法,其已经对枯草芽孢杆菌(Bacillus subtilis)报告(Duncan,C.H.,Wilson,G.A.and Young,F.E.,Gene,1977,1:153-167)。或者,可以使用使DNA-接受细胞变为原生质体或原生质球(其可以容易摄取重组DNA),接着将重组DNA引入DNA-接受细胞中的方法,已知该方法适用于枯草芽孢杆菌、放线菌和酵母(Chang,S.andChoen,S.N.,1979,Mol.Gen.Genet.,168:111-115;Bibb,M.J.,Ward,J.M.and Hopwood,O.A.,1978,Nature,274:398-400;Hinnen,A.,Hicks,J.B.and Fink,G.R.,1978,Proc.Natl.Acad.Sci.USA,75:1929-1933)。此外,也可以使用对棒状杆菌细菌报告的电脉冲方法(日本专利公开(Kokai)No.2-207791)。
可以通过测量蛋白质的活性来确认蛋白质活性的增加。
通过确认编码蛋白质的基因的表达增加,也可以确认蛋白质活性的增加。可以通过确认基因转录量的增加或通过确认从该基因表达的蛋白质量的增加来确认基因表达的增加。
可以通过比较从基因转录的mRNA的量与非修饰菌株如野生型菌株或亲本菌株的mRNA量来确认基因转录量的增加。用于评估mRNA量的方法的实例可以包括Northern杂交,RT-PCR等(Sambrook,J.,et al.,Molecular Cloning A Laboratory Manual/第三版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以增加到例如非修饰菌株的mRNA量的1.2倍以上,1.5倍以上,2倍以上或3倍以上。
可以通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA),2001)来确认蛋白质量的增加。蛋白质的量(诸如每细胞的蛋白质分子的数目)可以增加到例如非修饰菌株的蛋白质量的1.2倍以上,1.5倍以上,2倍以上或3倍以上。
除引入拟杆菌门OMT基因以外,上述提高蛋白质活性的方法可用于提高任意蛋白质如目标物质生物合成酶,磷酸泛酰巯基乙胺基化酶和物质摄取***的活性,和增强任意基因如编码那些任意蛋白质的基因的表达。
<1-4>降低蛋白质活性的方法
以下,将解释用于降低蛋白质的活性的方法。
表述“蛋白质的活性得以降低”指与非修饰菌株相比蛋白质的活性得以降低。具体而言,表述“蛋白质的活性得以降低”可以意味着与非修饰菌株相比,每个细胞的蛋白质的活性得以降低。术语“非修饰菌株”可以指尚未以使目的蛋白质的活性得以降低的方式进行修饰的对照菌株。非修饰菌株的实例可以包括野生型菌株和亲本菌株。非修饰菌株的具体实例可以包括微生物物种的相应类型菌株。非修饰菌株的具体实例还可以包括以上关于微生物描述所例示的菌株。也就是说,在一个实施方案中,与类型菌株,即微生物所属的物种的类型菌株相比,可以降低蛋白质的活性。在另一个实施方案中,与谷氨酸棒杆菌ATCC13869菌株相比,蛋白质的活性也可以得以降低。在另一个实施方案中,与谷氨酸棒杆菌ATCC 13032相比,蛋白质的活性也可以得以降低。另一个实施方案中,与大肠杆菌K-12MG1655菌株相比,蛋白质的活性也可以得以降低。“蛋白质活性得以降低”的短语还可以包括当蛋白质的活性已经完全消失时。更具体地说,表述“蛋白质的活性得以降低”可以意味着与非修饰的菌株相比每个细胞的蛋白质的分子数目得以减少,和/或蛋白质的每个分子的功能得以降低。也就是说,表述“蛋白质的活性得以降低”中的术语“活性”不限于蛋白质的催化活性,而且还可以指编码蛋白质的基因的转录量(即mRNA的量)或蛋白质的翻译量(即蛋白质的量)。“每个细胞的蛋白质的分子数目得以减少”的短语还可以包括当完全不存在蛋白质时。“蛋白质的每个分子的功能得以降低”的短语也可以包括当每个蛋白质分子的功能完全消失时。蛋白质活性降低的程度没有特别限制,只要活性与非修饰菌株的活性相比降低即可。蛋白质的活性可以降低到例如非修饰菌株的蛋白质活性的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
可以通过例如减少编码蛋白质的基因的表达来实现用于降低蛋白质活性的修饰。短语“基因的表达得以降低”指与非修饰菌株如野生型菌株和亲本菌株相比,该基因的表达得以降低。具体而言,短语“基因表达得以降低”可以意味着与非修饰菌株相比,每个细胞的基因表达得以降低。更具体地说,短语“基因表达得以降低”可以意味着基因的转录量(即mRNA的量)得以减少,和/或基因的翻译量(即从基因表达的蛋白质量)得以减少。“基因表达得以降低”的短语也可以包括当基因完全不表达时。“基因表达得以降低”的短语也可以称为“基因表达得以弱化”。基因的表达可以降低到例如非修饰菌株的表达的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
基因表达的降低可以是由于例如转录效率降低,翻译效率降低或组合所致。可以通过修饰基因的表达控制序列诸如启动子,Shine-Dalgarno(SD)序列(其也可以称为核糖体结合位点(RBS)),和基因的RBS和起始密码子之间的间隔物区来降低基因的表达。当修饰表达控制序列时,修饰表达控制序列的一个或多个核苷酸,两个或更多个核苷酸,或三个或更多个核苷酸。例如,通过用更弱的启动子替换染色体上基因的启动子,可以降低基因的转录效率。术语“更弱的启动子”可以指与基因固有的野生型启动子相比,提供基因的弱化转录的启动子。更弱启动子的实例可以包括例如诱导型启动子。也就是说,诱导型启动子可以在非诱导条件下,例如在不存在相应诱导物的情况下,起到更弱启动子的作用。更弱启动子的实例还可以包括例如P4和P8启动子(分别为SEQ ID NO:109的位置872-969和SEQ ID NO:110的位置901-1046)。此外,可以缺失表达控制序列的一部分或全部。基因的表达还可以通过例如操纵负责表达控制的因子来降低。负责表达控制的因子的实例可以包括负责转录或翻译控制的低分子(诸如诱导剂,抑制剂等),负责转录或翻译控制的蛋白质(转录因子等),负责转录或翻译控制的核酸(诸如siRNA等),等等。此外,通过例如对基因的编码区引入降低基因表达的突变,也可以降低基因的表达。例如,通过用在宿主中不太频繁使用的同义密码子替换基因编码区中的密码子,可以降低基因的表达。此外,例如,如本文所述,基因表达可以由于基因的破坏而降低。
用于降低蛋白质活性的修饰也可以通过例如破坏编码该蛋白质的基因来获得。短语“基因受到破坏”可以指基因以使得不产生通常可以起作用的蛋白质的方式进行了修饰。“不产生通常可以起作用的蛋白质”的短语可以包括当完全不从基因产生蛋白质时和当从基因产生每个分子的功能(例如活性或性质)得以降低或消除的蛋白质时。
可以通过例如缺失染色体上的基因来获得基因的破坏。术语“基因的缺失”可以指基因编码区的部分或整个区域的缺失。此外,可以缺失包括染色体上基因的编码区上游和下游序列的整个基因。只要可以降低蛋白质的活性,待缺失的区域可以是任何区域,例如N端区域(即编码蛋白质的N端区域的区域),内部区域或C端区域(即编码蛋白质的C端区域的区域)。缺失更长的区域通常可以更确定地使基因失活。待缺失的区域可以是具有例如基因的编码区的总长度的10%以上、20%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上、或95%以上的长度的区域。此外,优选的是,待缺失的区域的上游和下游序列的阅读框不相同。读码框的不一致性可以引起待缺失的区域下游的移码。
例如,也可以通过对染色体上基因的编码区引入用于氨基酸取代的突变(错义突变),终止密码子的突变(无义突变),添加或缺失一个或两个核苷酸残基的突变(移码突变)等获得基因的破坏(Journal of Biological Chemistry,272:8611-8617(1997);Proceedings of the National Academy of Sciences,USA,95 5511-5515(1998);Journal of Biological Chemistry,26 116,20833-20839(1991))。
也可以通过例如将另一个核苷酸序列***到染色体上的基因的编码区中获得基因的破坏。***的位点可以位于基因的任何区域中,并且***更长的核苷酸序列通常可以更确定地使基因失活。优选的是***位点上游和下游序列的阅读框不相同。读码框的不一致性可以引起待缺失的区域下游的移码。其他核苷酸序列没有特别限制,只要选择降低或消除所编码蛋白质活性的序列即可,并且其实例可以包括例如标志物基因如抗生素抗性基因,以及可用于产生目标物质的基因。
特别地,可以以编码蛋白质的氨基酸序列得以缺失的方式进行基因的破坏。换言之,可以通过例如缺失蛋白质的氨基酸序列,特别地修饰基因以使该基因编码氨基酸序列得以的蛋白质来实现降低蛋白质活性的修饰。短语“蛋白质的氨基酸序列的缺失”可以指蛋白质的氨基酸序列的部分或整个区域的缺失。另外,短语“蛋白质的氨基酸序列的缺失”可以指原始氨基酸序列在蛋白质中消失,并且还可以包括当原始氨基酸序列变为另一个氨基酸序列时。也就是说,例如,通过移码改变为另一氨基酸序列的区域可以视为缺失区域。当蛋白质的氨基酸序列得以缺失时,通常缩短蛋白质的总长度,但也可以存在蛋白质的总长度没有改变或延长的情况。例如,通过缺失基因编码区的部分或整个区域,可以在编码的蛋白质中缺失由缺失区域编码的区域。另外,例如,通过将终止密码子引入基因的编码区中,可以在编码的蛋白质中缺失由引入位点的下游区域编码的区域。另外,例如,通过在基因的编码区中移码,可以在编码的蛋白质中缺失由移码区编码的区域。关于基因缺失中待缺失区域的位置和长度的上述描述可以在必要修改后应用于缺失蛋白质氨基酸序列中待缺失区域的位置和长度。
如上所述的染色体上基因的此类修饰可以如下获得:通过例如制备以使基因不能产生通常起作用的蛋白质的方式进行了修饰的破坏类型基因,并用含有破坏类型基因的重组DNA转化宿主以引起破坏类型基因和染色体上的野生型基因之间的同源重组,从而用该破坏类型基因取代染色体上的野生型基因。在该程序中,若重组DNA中包括根据宿主特征如营养缺陷选择的标志物基因,则操作变得更容易。破坏类型基因的实例可以包括编码区的部分或整个区域得以缺失的基因,包含错义突变的基因,包括无义突变的基因,包含移码突变的基因,以及包含转座子或标志物基因***的基因。由破坏类型基因编码的蛋白质即使产生也具有与野生型蛋白质不同的构象,因此其功能得以降低或消除。已经建立了基于使用同源重组的基因取代的此类基因破坏,并且存在使用线性DNA的方法,诸如称为“Red驱动整合”的方法(Datsenko,K.A,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000)),以及利用Red驱动的整合与源自λ噬菌体的切除***的组合的方法(Cho,E.H.,Gumport,R.I.,Gardner,J.F.,J.Bacteriol.,184:5200-5203(2002))(参考WO2005/010175),使用具有温度敏感性复制起点的质粒的方法,使用能够接合转移的质粒的方法,利用没有在宿主中起作用的复制起点的***载体的方法(美国专利号6,303,383,日本专利公开(Kokai)No.05-007491),等等。
用于降低蛋白质活性的修饰也可以通过例如诱变处理来获得。诱变处理的实例包括X射线或紫外线的照射和用突变剂如N-甲基-N'-硝基-N-亚硝基胍(MNNG),甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)处理。
如上文提及的用于降低蛋白质活性的此类方法可以独立使用或者以任意组合使用。
当蛋白质作为由多个亚基构成的复合物起作用时,可以修饰多个亚基的部分或全部,只要蛋白质的活性最终得以降低。也就是说,例如,编码相应亚基的多个基因的部分或全部可以得以破坏等。此外,当蛋白质存在多种同工酶时,多种同工酶的部分或全部活性可以得以降低,只要蛋白质的活性最终得以降低。也就是说,例如,编码相应同功酶的多个基因的部分或全部可以得以破坏等。
可以通过测量蛋白质的活性确认蛋白质活性的降低。
蛋白质活性的降低也可以通过确认编码该蛋白质的基因的表达的降低来确认。基因表达的降低可以通过确认基因转录量的减少或从基因表达的蛋白质量的降低来确认。
通过比较从基因转录的mRNA的量与非修饰菌株中观察到的量,可以确认基因转录量的降低。用于评估mRNA量的方法的实例可以包括Northern杂交,RT-PCR等(MolecularCloning,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以降低到例如在非修饰菌株中观察到的量的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA)2001)可以确认蛋白质量的减少。蛋白质的量(诸如每个细胞的蛋白质的分子数目)可以降低到例如在非修饰菌株中观察到的蛋白质量的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
可以根据用于破坏的手段通过确定基因的部分或全部的核苷酸序列,基因的限制酶图谱,全长等来确认基因的破坏。
上述的降低蛋白质活性的方法还可以适用于任意蛋白质诸如副产物生成酶的活性降低,以及任意基因诸如编码那些任意蛋白的基因的表达降低。
<2>用于生产目标物质的方法
如本文中描述的方法是通过使用如本文中描述的微生物生产目标物质的方法。
<2-1>发酵方法
可以通过例如如本文中描述的微生物的发酵来生产目标物质。也就是说,如本文中描述的方法的实施方案可以是通过发酵微生物来生产目标物质的方法。此实施方案也可以称为“发酵方法”。此外,通过发酵如本文中所述的微生物生产目标物质的步骤也可以称为“发酵步骤”。
可以通过培养如本文中描述的微生物来进行发酵步骤。具体而言,在发酵方法中,可以从碳源生产目标物质。也就是说,发酵步骤可以是例如在培养基,诸如含有碳源的培养基中培养微生物以在培养基中生产和积累目标物质的步骤。也就是说,发酵方法可以是用于生产目标物质的方法,其包括以下步骤:例如在培养基,诸如含有碳源的培养基中培养微生物以在培养基中生产和积累目标物质的方法。此外,换言之,发酵步骤可以是例如通过使用微生物从碳源生产目标物质的步骤。
待使用的培养基没有特别限制,只要微生物可以在其中增殖并产生目标物质即可。作为培养基,例如可以使用用于培养微生物诸如细菌和酵母的典型培养基。培养基可以根据需要含有碳源,氮源,磷酸盐源,硫源,以及其他培养基组分,如各种有机组分和无机组分。培养基成分的类型和浓度可以根据诸如选择的微生物的类型等各种条件适当确定。
碳源没有特别限制,只要微生物可以利用它并产生目标物质即可。碳源的具体实例可以包括例如糖类,诸如葡萄糖,果糖,蔗糖,乳糖,半乳糖,木糖,***糖,赤糖糊(blackstrap molasses),淀粉的水解物和生物质的水解物;有机酸如乙酸,柠檬酸,琥珀酸和葡糖酸;醇如乙醇,甘油和粗甘油;和脂肪酸。作为碳源,特别地,可以使用植物来源的材料。植物的实例可以包括例如玉米,稻,小麦,大豆,甘蔗,甜菜和棉。植物来源材料的实例可以包括例如器官,诸如根,茎,干,枝,叶,花和种子,包括它们的植物体和这些植物器官的分解产物。植物来源材料的在其使用时的形式没有特别限定,并且它们可以以诸如未加工产物,汁,研磨产物,纯化产物等任何形式使用。戊糖如木糖,己糖如葡萄糖或它们的混合物可从例如植物生物质获得并且得到使用。具体而言,可以通过将植物生物质进行处理,诸如蒸汽处理,浓酸水解,稀酸水解,纤维素酶等酶水解,碱处理而得到这些糖类。由于半纤维素与纤维素相比通常更容易水解,因此可预先水解植物生物质中的半纤维素以释放戊糖,然后可以水解纤维素以产生己糖。此外,木糖可以通过例如通过对微生物赋予用于将己糖如葡萄糖转化为木糖的途径从己糖转化供应。作为碳源,可以使用一种碳源,或者可以组合使用两种或更多种碳源。
培养基中碳源的浓度没有特别限制,只要微生物可以增殖并产生目标物质即可。培养基中碳源的浓度可以在使得目标物质的生产不受抑制的范围内尽可能高。碳源在培养基中的初始浓度通常可以是例如通常5至30%(w/v),或10至20%(w/v)。此外,可以根据需要对培养基添加碳源。例如,可以与伴随发酵进展的碳源的减少或消减成比例地对培养基添加碳源。虽然可以暂时消减碳源,但是只要最终可以生产目标物质,可以优选以不消减碳源或不继续消减碳源的方式进行培养。
氮源的具体实例可以包括例如铵盐如硫酸铵,氯化铵和磷酸铵,有机氮源如蛋白胨,酵母提取物,肉膏和大豆蛋白分解产物,氨和尿素。用于pH调节的氨气和氨水也可用作氮源。作为氮源,可以使用一种氮源,也可以组合使用两种或更多种的氮源。
磷酸盐源的具体实例可以包括例如磷酸盐如磷酸二氢钾和磷酸氢二钾,以及磷酸聚合物如焦磷酸。作为磷酸盐源,可以使用一种磷酸盐源,或者可以组合使用两种或更多种磷酸盐源。
硫源的具体实例可以包括例如无机硫化合物如硫酸盐,硫代硫酸盐和亚硫酸盐,以及含硫氨基酸如半胱氨酸,胱氨酸和谷胱甘肽。作为硫源,可以使用一种硫源,或者可以组合使用两种或更多种硫源。
其他各种有机和无机组分的具体实例可以包括例如无机盐如氯化钠和氯化钾;微量金属如铁,锰,镁和钙;维生素如维生素B1,维生素B2,维生素B6,烟酸,烟酰胺和维生素B12;氨基酸;核酸;和含有这些的有机成分如蛋白胨,酪蛋白氨基酸,酵母提取物和大豆蛋白分解产物。作为其他各种有机和无机组分,可以使用一种组分,或者可以组合使用两种或更多种组分。
此外,当使用需要营养物如氨基酸进行生长的营养缺陷型突变株时,优选培养基含有此类需要的营养物。此外,培养基可以含有用于生产目标物质的组分。此类组分的具体实例可以包括例如甲基供体例如SAM及其前体例如甲硫氨酸。
培养条件没有特别限制,只要微生物可以增殖并且产生目标物质即可。培养可以用例如用于培养微生物诸如细菌和酵母的典型条件进行。培养条件可以根据诸如选择的微生物的种类等各种条件适当确定。
培养可以通过使用液体培养基来进行。在培养时,例如,可以将在诸如琼脂培养基等固体培养基上培养的微生物直接接种到液体培养基中,或者将在液体培养基中作为种子培养物培养的微生物接种到液体培养基中进行主要培养。也就是说,培养可以作为种子培养和主要培养分开进行。在此类情况下,种子培养和主要培养的培养条件可以是相同的或者可以是不相同。至少在主要培养过程中产生目标物质是足够的。培养开始时培养基中存在的微生物的量没有特别限制。例如,显示OD660为4-100的种子培养液可以在开始培养时以0.1-100质量%,或1-50质量%的量接种到用于主要培养的培养基中。
培养可以以分批培养,补料分批培养,连续培养或这些的组合进行。在培养开始时使用的培养基也可以称为“起始培养基”。在补料分批培养或连续培养中添加到培养***(例如发酵罐)的培养基也可以称为“补料培养基”。为了在补料分批培养或者连续培养中向培养***添加补料培养基也可以称为“补料”。此外,当作为种子培养和主要培养分开进行培养时,种子培养和主要培养的培养方案可以相同或可以不同。例如,种子培养和主要培养两者都可以作为分批培养进行。或者,例如,种子培养可以作为分批培养进行,并且主要培养可以以补料分批培养或连续培养进行。
各种组分诸如碳源可以存在于起始培养基,补料培养基或两者中。也就是说,各种组分诸如碳源可以在培养期间独立地或以任意组合的方式添加到培养基。这些组分可以添加一次或多次,或者可以连续添加。起始培养基中存在的组分的类型可以与补料培养基中存在的组分的类型相同或不同。此外,起始培养基中存在的组分的浓度可以与补料培养基中存在的组分的浓度相同或不同。此外,可以使用两种或更多种含有不同类型和/或不同浓度组分的补料培养基。例如,当间歇进行两次或更多次补料时,补料培养基中存在的组分的类型和/或浓度对于每次补料可以是相同的或者可以是不同的。
培养可以例如在需氧条件下进行。术语“需氧条件”可以指其中培养基中的溶解氧浓度为0.33ppm或更高,或1.5ppm或更高的条件。可以将氧浓度控制为例如饱和氧浓度的1-50%,或约5%。培养可以例如在通气或摇动下进行。培养基的pH值可以是例如3至10,或4.0至9.5。培养基的pH可以根据需要在培养过程中进行调整。培养基的pH可以通过使用各种碱性和酸性物质如氨气,氨水,碳酸钠,碳酸氢钠,碳酸钾,碳酸氢钾,碳酸镁,氢氧化钠,氢氧化钙和氢氧化镁来调节。培养温度可以是例如20至45℃,或25至37℃。培养时间可以是例如10至120小时。例如,可以继续培养直到培养基中存在的碳源被消耗,或者直到微生物的活性丧失。
通过在诸如上文所述的条件下培养微生物,在培养基中积累目标物质。
可以通过用于检测或鉴定化合物的已知方法来确认目标物质的产生。此类方法的实例可以包括例如HPLC,UPLC,LC/MS,GC/MS和NMR。这些方法可以独立使用,或者可以以适当的组合使用。这些方法也可以用于确定培养基中存在的各种组分的浓度。
生产的目标物质可以适当收集。也就是说,发酵方法可以进一步包括收集目标物质的步骤。此步骤也可以称为“收集步骤”。收集步骤可以是从培养肉汤,特别是从培养基中收集目标物质的步骤。目标物质可以通过用于分离和纯化化合物的已知方法收集。此类方法的实例可以包括例如离子交换树脂法,膜处理,沉淀,提取,蒸馏和结晶。具体地,目标物质也可以通过用有机溶剂如乙酸乙酯萃取或通过蒸汽蒸馏来收集。这些方法可以独立使用,或者可以以适当的组合使用。
此外,当目标物质沉淀在培养基中时,它可以通过例如离心或过滤收集。在培养基中溶解的目标物质结晶后,可以将沉淀在培养基中的目标物质和溶解在培养基中的目标物质一起分离。
除了目标物质之外,收集的目标物质可以包含例如微生物细胞,培养基组分,水分和微生物的副产物代谢物。收集的目标物质的纯度可以是例如30%(w/w)或更高,50%(w/w)或更高,70%(w/w)或更高,80%(w/w)或更高,90%(w/w)或更高,或95%(w/w)或更高。
<2-2>生物转化方法
目标物质也可以通过例如使用如本文中所述的微生物的生物转化来产生。也就是说,如本文中所述的方法的另一个实施方案可以是使用微生物通过生物转化来生产目标物质的方法。该实施方案也可以称为“生物转化方法”。此外,使用微生物通过生物转化来生产目标物质的步骤也可以称为“生物转化步骤”。
具体而言,在生物转化方法中,目标物质可以从目标物质的前体产生。更具体而言,在生物转化方法中,通过使用微生物,可以通过将目标物质的前体转化为目标物质来生产目标物质。也就是说,生物转化步骤可以是通过使用微生物将目标物质的前体转化为目标物质的步骤。
目标物质的前体也可以简称为“前体”。前体的实例可以包括下述物质,该物质向目标物质的转化包括由拟杆菌门OMT催化的步骤。前体的具体实例可以包括目标物质的生物合成途径的中间体,如就目标物质生物合成酶的描述而言所述的那些,条件是中间体向目标物质的转化包括由拟杆菌门OMT催化的步骤。前体的更具体实例可以包括例如原儿茶酸,原儿茶醛,L-苯丙氨酸,和L-酪氨酸。原儿茶酸可以用作生产例如香草醛,香草酸或愈创木酚的前体。原儿茶醛可以用作生产例如香草醛的前体。L-苯丙氨酸和L-酪氨酸各自可以用作生产例如阿魏酸,4-乙烯基愈创木酚或4-乙基愈创木酚的前体。作为前体,可以使用一种前体,或者可以组合使用两种或更多种前体。在前体是可以形成盐的化合物的情况下,前体可以作为游离化合物,其盐或其混合物使用。也就是说,术语“前体”可以指游离形式的前体,其盐或其混合物,除非另有说明。盐的实例可以包括例如硫酸盐,盐酸盐,碳酸盐,铵盐,钠盐和钾盐。作为前体的盐,可以使用一种盐,或者可以组合使用两种或更多种盐。
作为前体,可以使用商业产品,或者可以使用适当制备和获得的产品。也就是说,生物转化方法可以进一步包括生产前体的步骤。生产前体的方法没有特别限定,例如可以使用已知的方法。前体可以通过例如化学合成法,酶法,生物转化法,发酵法,提取方法或它们的组合来生产。也就是说,例如,目标物质的前体可以使用酶(该酶也可以称为“前体生物合成酶”)从其另外的前体产生,所述酶催化此类另外的前体转化成目标物质的前体。此外,例如,通过使用具有前体生产能力的微生物,可以从碳源或此类另外的前体生产目标物质的前体。短语“具有前体生产能力的微生物”可以指能够从碳源或其另外的前体生产目标物质的前体的微生物。例如,根据酶法或生物转化法生产原儿茶酸的方法的实例可以包括使用恶臭假单胞菌(Pseudomonas putida)KS-0180(日本专利公开(Kokai)No.7-75589)将对甲酚转化为原儿茶酸的方法,使用NADH依赖性对羟基苯甲酸羟化酶将对羟基苯甲酸转化为原儿茶酸的方法(日本专利公开(Kokai)No.5-244941),通过在含有对苯二甲酸的培养基中培养含有参与从对苯二甲酸生成原儿茶酸的反应的基因的转化体来生产原儿茶酸的方法(日本专利公开(Kokai)No.2007-104942),以及通过使用具有原儿茶酸生产能力并且具有原儿茶酸5-氧化酶活性降低或该活性缺乏的微生物从其前体生产原儿茶酸的方法(日本专利公开(Kokai)No.2010-207094)。此外,通过发酵生产原儿茶酸的方法的实例可以包括通过使用短杆菌属细菌和乙酸作为碳源生产原儿茶酸的方法(日本专利公开(Kokai)No.50-89592),通过使用引入有编码3-二氢莽草酸脱氢酶的基因的埃希氏菌属或克雷伯氏菌属细菌和葡萄糖作为碳源生产原儿茶酸的方法(美国专利号5,272,073)。此外,原儿茶醛可以通过根据使用ACAR的酶法或使用具有ACAR的微生物的生物转化法使用原儿茶酸作为前体生产。生产的前体可以原样或者根据需要进行适当的处理如浓缩,稀释,干燥,溶解,分馏,提取和纯化后用于生物转化方法。也就是说,作为前体,例如可以使用纯化至所需程度的纯化产物,或者可以使用含有前体的材料。含有前体的材料没有特别限制,只要微生物可以使用前体即可。含有前体的材料的具体实例可以包括通过培养具有前体生产能力的微生物获得的培养肉汤,与培养肉汤分离的培养上清液及其加工产物如其浓缩产物(如浓缩液体)和其干燥产物。
在一个实施方案中,生物转化步骤可以通过例如培养如本文中所述的微生物来进行。该实施方案也可以称为“生物转化方法的第一实施方案”。也就是说,生物转化步骤可以是例如在含有目标物质的前体的培养基中培养微生物以将该前体转化为目标物质的步骤。生物转化步骤具体可以是在含有目标物质的前体的培养基中培养微生物以在培养基中产生并积累目标物质的步骤。
要使用的培养基没有特别限制,只要培养基含有目标物质的前体,并且微生物可以在其中增殖并产生目标物质。培养条件没有特别限制,只要微生物可以增殖并且产生目标物质即可。关于发酵方法所提及的培养的描述,诸如关于培养基和培养条件的描述可以在必要修改后适用于生物转化方法的第一实施方案中的培养,只是培养基在第一实施方案中含有前体。
前体可以在整个培养期内存在在培养基中,或者可以在培养的部分时期期间存在在培养基中。也就是说,短语“在含有前体的培养基中培养微生物”并不一定意味着培养基中在整个培养期内都存在前体。例如,从培养开始起培养基中可以存在或可以不存在前体。当在培养开始时培养基中不存在前体时,在培养开始后将前体添加到培养基。添加的时机可以根据诸如培养期的长度等各种条件适当确定。例如,在微生物充分生长后,可以将前体添加到培养基中。此外,在任何情况下,可以根据需要将前体添加到培养基。例如,可以与伴随目标物质生成的前体的减少或消减成比例地对培养基添加前体。用于将前体添加到培养基的方法没有特别限制。例如,可以通过将含有前体的补料培养基补料到培养基来将前体供应给培养基。此外,例如,如本文中所述的微生物和具有前体生产能力的微生物可以共培养以允许具有前体生产能力的微生物在培养基中产生前体,从而将前体添加到培养基。这些添加方法可以独立使用,或者可以以适当的组合使用。前体在培养基中的浓度没有特别限制,只要微生物可以使用该前体作为目标物质的原料即可。前体在培养基中的浓度例如可以为0.1g/L或更高,1g/L或更高,2g/L或更高,5g/L或更高,10g/L或更高,或者15g/L或更高,或者可以是200g/L或更低,100g/L或更低,50g/L或更低,或者20g/L或更低,或者可以在由其组合限定的范围内(按游离化合物的重量计)。在整个培养期内,前体可以以或不以上文例示的范围内的浓度存在于培养基中。例如,在培养开始时前体可以以上文例示的范围内的浓度存在于培养基中,或者可以将其添加到培养基,从而在培养开始后获得上文例示的范围。在培养分别作为种子培养和主要培养进行的情况下,至少在主要培养期间产生目标物质是足够的。因此,足够的是至少在主要培养期间,即在主要培养的整个时期内或在主要培养的部分时期期间,培养基中存在前体,并且也就是说,在种子培养期间培养基中可以存在或可以不存在前体。在此类情况下,关于培养的术语,如“培养期(培养时期)”和“培养开始”可以理解为与主要培养有关的术语。
在另一个实施方案中,生物转化步骤也可以通过例如使用如本文中所述的微生物的细胞来进行。该实施方案也可以称为“生物转化方法的第二实施方案”。也就是说,生物转化步骤可以是例如通过使用微生物的细胞将反应混合物中的目标物质的前体转化成目标物质的步骤。生物转化步骤具体可以是使微生物的细胞作用于反应混合物中的目标物质的前体以在反应混合物中生成并积累目标物质的步骤。通过使用此类细胞进行的生物转化步骤也可以称为“转化反应”。
微生物的细胞可以通过培养微生物来获得。用于获得细胞的培养方法没有特别限制,只要微生物可以增殖即可。在用于获得细胞的培养时,前体可以存在或可以不存在于培养基中。此外,在用于获得细胞的培养时,培养基中可以产生或可以不产生目标物质。关于发酵方法中所述的培养的描述,例如关于培养基和培养条件的描述可以在必要修改后应用于获得用于生物转化方法的第二实施方案的细胞的培养。
细胞可以在存在于培养肉汤(具体是培养基)中时,或者在从培养肉汤(具体是培养基)中收集后用于转化反应。也可以根据需要在进行处理后将细胞用于转化反应。也就是说,细胞的实例可以包括含有细胞的培养肉汤,从培养肉汤中收集的细胞和其加工产物。换言之,细胞的实例可以包括存在于微生物的培养肉汤中的细胞,从培养肉汤中收集的细胞或存在于其加工产物中的细胞。加工产物的实例可以包括通过对细胞进行处理,特别地通过对含有细胞的培养肉汤或从培养肉汤中收集的细胞进行处理而获得的产物。这些形式的细胞可以独立使用,或者可以以适当的组合使用。
从培养基中收集细胞的方法没有特别限制,例如可以使用已知的方法。此类方法的实例可以包括例如自发沉淀,离心和过滤。也可以使用絮凝剂。这些方法可以独立使用,或者可以以适当的组合使用。收集的细胞可以根据需要通过使用合适的培养基进行清洗。收集的细胞可以根据需要通过使用适当的培养基重悬浮。可用于清洗或悬浮细胞的培养基的实例可以包括例如水性介质(水性溶剂),如水和缓冲水溶液。
细胞处理的实例可以包括例如稀释,冷凝,在载体如丙烯酰胺和角叉菜胶上固定化,冷冻和融化处理,以及增加细胞膜通透性的处理。例如,可以通过使用表面活性剂或有机溶剂来增加细胞膜的通透性。这些处理可以独立使用,或者可以以适当的组合使用。
用于转化反应的细胞没有特别限制,只要细胞具有目标物质生产能力。优选细胞保持其代谢活性。短语“细胞保持其代谢活性”可以表示细胞具有利用碳源产生或再生产生目标物质所需物质的能力。此类物质的实例可以包括例如ATP,电子供体如NADH和NADPH,以及甲基供体如SAM。细胞可以具有或可以不具有增殖能力。
转化反应可以在适当的反应混合物中进行。具体而言,转化反应可以通过使细胞和前体共存于适当的反应混合物中来进行。转化反应可以通过分批方法进行或可以通过柱方法进行。在分批法的情况下,转化反应可以通过例如将微生物的细胞和前体混合在反应容器中所含的反应混合物中来进行。转化反应可以静态进行,或者可以在搅拌或摇动反应混合物的情况下进行。在柱方法的情况下,转化反应可以通过例如使含有前体的反应混合物通过填充有固定化细胞的柱来进行。反应混合物的实例可以包括基于水性介质(水性溶剂)如水和水性缓冲液的那些。
除了前体之外,反应混合物可以根据需要含有除前体之外的组分。除前体以外的成分的实例可以包括ATP,电子供体诸如NADH,NADPH,甲基供体诸如SAM,金属离子,缓冲剂,表面活性剂,有机溶剂,碳源,磷酸盐源,和其它各种培养基成分。也就是说,例如,含有前体的培养基也可以用作反应混合物。也就是说,关于生物转化方法的第一实施方案中提及的培养基的描述也可以在必要修改后适用于生物转化方法的第二实施方案中的反应混合物。存在于反应混合物中的组分的类型和浓度可以根据各种条件来确定,例如待使用的前体的类型和待使用的细胞的形式。
转化反应的条件,诸如溶解氧浓度,反应混合物的pH,反应温度,反应时间,各种成分的浓度等没有特别限制,只要产生目标物质。转化反应可以用例如用于利用微生物细胞诸如静止细胞进行物质转化的典型条件来进行。转化反应的条件可以根据各种条件来确定,例如选择的微生物的类型。转化反应可以例如在需氧条件下进行。术语“需氧条件”可以指其中反应混合物中的溶解氧浓度为0.33ppm或更高,或1.5ppm或更高的条件。氧浓度可以控制为例如饱和氧浓度的1-50%,或约5%。反应混合物的pH值通常可以是例如6.0至10.0,或6.5至9.0。反应温度可以是例如15至50℃,或15至45℃,或20至40℃。反应时间可以是例如5分钟至200小时。在柱方法的情况下,反应混合物的加载速率可以是例如使得反应时间落入上述例示的反应时间范围内的速率。此外,转化反应也可以在例如培养条件下进行,例如用于培养微生物诸如细菌和真菌的典型条件。在转化反应期间,细胞可以增殖或可以不增殖。也就是说,关于生物转化方法的第一实施方案的培养条件的描述也可以在必要修改后适用于生物转化方法的第二实施方案中转化反应的条件,只是细胞可以或不可以在第二实施方案中增殖。在此类情况下,用于获得细胞的培养条件和转化反应的条件可以相同或不同。前体在反应混合物中的浓度例如可以为0.1g/L或更高,1g/L或更高,2g/L或更高,5g/L或更高,10g/L或更高,或者15g/L或更高,或者可以是200g/L或更低,100g/L或更低,50g/L或更低,或者20g/L或更低,或者可以在由其组合限定的范围内(按游离化合物的重量计)。例如,反应混合物中细胞的密度可以是1或更高,或者可以是300或更低,或者可以在其组合限定的范围内(按600nm的光密度(OD)计)。
在转化反应期间,可以将细胞,前体和其他组分独立地或以其任何任意组合添加到反应混合物。例如,可以与伴随目标物质产生的前体的减少或消耗成比例将前体添加到反应混合物。这些组分可以添加一次或多次,或者可以连续添加。
用于向反应混合物添加诸如前体的各种组分的方法没有特别限制。这些组分各自可以通过例如直接将它们加入到反应混合物中而添加到反应混合物中。此外,例如,可以将如本文中所述的微生物和具有前体生产能力的微生物共培养,以使具有前体生产能力的微生物在反应混合物中产生前体,从而将前体提供给反应混合物。此外,例如,组分如ATP,电子给体和甲基供体可以各自在反应混合物中产生或再生,可以在微生物的细胞中产生或再生,或者可以通过不同细胞之间的偶联反应产生或再生。例如,当微生物的细胞保持其代谢活性时,它们可以通过使用碳源在它们内部产生或再生诸如ATP,电子供体和甲基供体等组分。例如,具体地,微生物可以具有增强的SAM生成或再生能力,并且其生成或再生的SAM可以用于转化反应。SAM的生成或再生可以与用于生成或再生SAM的任何其他方法组合而得到进一步增强。另外,ATP生成或再生方法的实例可以包括例如通过使用棒状杆菌属细菌从碳源提供ATP的方法(Hori,H.et al.,Appl.Microbiol.Biotechnol.,48(6):693-698(1997)),通过使用酵母细胞和葡萄糖再生ATP的方法(Yamamoto,S et al.,Biosci.Biotechnol.Biochem.,69(4):784-789(2005)),使用磷酸烯醇丙酮酸和丙酮酸激酶再生ATP的方法(C.Aug'e and Ch.Gautheron,Tetrahedron Lett.,29:789-790(1988)),以及通过使用多磷酸和多磷酸激酶再生ATP的方法(Murata,K.et al.,Agric.Biol.Chem.,52(6):1471-1477(1988))。
此外,反应条件可以从转化反应的开始至结束是恒定的,或者它们可以在转化反应期间改变。表述“反应条件在转化反应期间改变”不仅可以包括当反应条件在时间上改变时,而且还包括当反应条件在空间上改变时。表述“反应条件在空间上改变”表示例如当通过柱法进行转化反应时,反应温度和孔密度等反应条件随流动中的位置而不同。
通过进行如上所述的生物转化步骤,获得培养肉汤(具体地培养基)或含有目标物质的反应混合物。目标物质的产生和目标物质的收集的确认可以以与上述发酵方法相同的方式进行。也就是说,生物转化方法可以进一步包括收集步骤,例如从培养肉汤(具体地培养基)或反应混合物中收集目标物质的步骤。除了目标物质之外,收集的目标物质可以包含例如微生物细胞,培养基组分,反应混合物组分,水分和微生物的副产物代谢物。收集的目标物质的纯度可以是,例如,30%(w/w)或更高,50%(w/w)或更高,70%(w/w)或更高,80%(w/w)或更高,90%(w/w)或更高,或95%(w/w)或更高。
<2-3>生产香草醛和其他目标物质的方法
当通过使用如本文所述的微生物,即通过发酵方法或生物转化方法生产目标物质时,由此产生的目标物质可以进一步转化为另一种目标物质。因此,本发明提供了制备第二目标物质,即目标物质B的方法,所述方法包括以下步骤:通过使用微生物,即通过发酵方法或生物转化方法产生第一目标物质,即目标物质A,并且将由此产生的第一目标物质A转化为第二目标物质B。
例如,当通过使用如本文所述的微生物,即通过发酵方法或生物转化方法生产香草酸时,由此产生的香草酸可以进一步转化为香草醛。因此,本发明提供了生产香草醛的方法,其包括通过使用微生物,即通过发酵方法或生物转化方法生产香草酸,并将由此产生的香草酸转化为香草醛的步骤。该方法也可以称为“香草醛生产方法”。
通过使用微生物产生的香草酸可以原样用于转化成香草醛,或者在根据需要进行适当的处理如浓缩,稀释,干燥,溶解,分馏,提取和纯化之后用于转化成香草醛。也就是说,作为香草酸,例如,可以使用纯化至期望程度的纯化产物,或者可以使用含有香草酸的物质。含有香草酸的物质没有特别限制,只要催化转化的组分(例如微生物和酶)可以使用香草酸。含有香草酸的材料的具体实例可以包括含有香草酸的培养肉汤或反应混合物,从培养肉汤或反应混合物中分离的上清液,及其加工产物,如浓缩产物,如其浓缩液及其干燥产物。
将香草酸转化为香草醛的方法没有特别限制。
可以通过例如使用具有ACAR的微生物的生物转化方法将香草酸转化为香草醛。具有ACAR的微生物可以以具有拟杆菌门OMT基因的方式或者可以不以具有拟杆菌门OMT基因的方式进行修饰。关于如本文所述的微生物的描述可以在必要的修改后适用于具有ACAR的微生物,只是具有ACAR的微生物具有ACAR,并且可以以具有拟杆菌门OMT基因的方式进行修饰或可以不以具有拟杆菌门OMT基因的方式进行修饰。具有ACAR的微生物可以以ACAR、PPT和香草酸摄取***中的一种或多种的活性得以增强的方式进行修饰。另外,关于使用微生物生产目标物质的生物转化方法的描述可以在必要的修改后适用于使用具有ACAR的微生物将香草酸转化为香草醛的生物转化方法。
也可以例如通过使用ACAR的酶方法将香草酸转化成香草醛。
ACAR可以通过允许具有ACAR基因的宿主表达ACAR基因来生成。ACAR也可以用无细胞蛋白质表达***来生成。
具有ACAR基因的宿主也可以称为“具有ACAR的宿主”。具有ACAR基因的宿主可以是固有地具有ACAR基因的宿主,或者可以是经修饰而具有ACAR基因的宿主。固有地具有ACAR基因的宿主的实例可以包括衍生出上述示例的ACAR的生物体。经修饰而具有ACAR基因的宿主的实例可以包括已经引入有ACAR基因的宿主。此外,固有地具有ACAR基因的宿主可以以ACAR得以增加的方式进行修饰。用于表达ACAR的宿主不受特别限制,只要宿主可以表达可以起作用的ACAR即可。宿主的实例可以包括例如,微生物,如细菌和酵母(真菌),植物细胞,昆虫细胞和动物细胞。
可以通过培养具有ACAR基因的宿主来表达ACAR基因。培养方法没有特别限制,只要具有ACAR基因的宿主可以增殖并表达ACAR即可。关于发酵方法培养的描述可以在必要的修改后适用于具有ACAR基因的宿主的培养。必要时,可以诱导ACAR基因的表达。作为培养的结果,可以获得含有ACAR的培养肉汤。ACAR可以在宿主细胞和/或培养基中积累。
在宿主细胞,培养基等中包含的ACAR可以原样用于酶促反应,或者自其纯化的ACAR可以用于酶促反应。可以进行纯化到期望的程度。也就是说,作为ACAR,可以使用纯化的ACAR,或者可以使用含有ACAR的级分。此类级分没有特别限制,只要其中含有的ACAR可以作用于香草酸即可。此类级分的实例可以包括具有ACAR基因的宿主的培养肉汤,即具有ACAR的宿主;从培养肉汤中收集细胞;细胞的加工产物,如细胞破碎物,细胞裂解物,细胞提取物和固定化细胞,如用丙烯酰胺,角叉菜胶等固定化的细胞;从培养肉汤中收集的培养物上清液;其部分纯化产物,例如粗产物;及其组合。这些级分可以独立使用或与纯化的ACAR组合使用。
酶促反应可以通过允许ACAR作用于香草酸来进行。酶促反应的条件没有特别限制,只要产生香草醛即可。酶促反应可以用例如用于使用酶或微生物细胞如静息细胞进行物质转化的典型条件进行。例如,关于生物转化方法的第二实施方案中的转化反应的描述也可以在必要的修改后适用于香草醛生产方法中的酶促反应。
通过进行如上所述的转化获得含有香草醛的反应混合物。香草醛的产生和香草醛的收集的确认可以以与上述发酵方法相同的方式进行。也就是说,香草醛生产方法可以进一步包括从反应混合物中收集香草醛的步骤。除香草醛外,收集的香草醛可以含有例如微生物细胞,培养基组分,反应混合物组分,ACAR,水分和微生物的副产物代谢物。收集的香草醛的纯度可以是例如30%(w/w)或更高,50%(w/w)或更高,70%(w/w)或更高,80%(w/w)或更高,90%(w/w)或更高,或95%(w/w)更高。
香草酸也可以通过例如使用具有VDC的微生物的生物转化方法或使用VDC的酶促方法转化为愈创木酚。阿魏酸可以通过例如使用具有FDC的微生物的生物转化方法或使用FDC的酶促方法转化为4-乙烯基愈创木酚。4-乙烯基愈创木酚可以通过例如使用具有VPR的微生物的生物转化方法或使用VPR的酶促方法转化为4-乙基愈创木酚。通过这些方法的组合,阿魏酸也可以转化为4-乙基愈创木酚。具体地,阿魏酸可以通过例如与VPR或具有VPR的微生物组合同时或依次使用FDC或具有FDC的微生物,或使用具有FDC和VPR两者的微生物转化为4-乙基愈创木酚。关于香草醛生产方法的上述描述可以在必要的修改后适用于生产其他目标物质的方法。
实施例
下文,将参考以下非限制性实施例更具体地解释本发明。
在本实施例中,从作为亲本菌株的谷氨酸棒杆菌2256菌株(ATCC 13869)构建含有各种OMT基因的菌株,并且用构建的菌株进行香草酸生产。
<1>香草酸脱甲基酶基因缺陷的菌株(FKS0165菌株)的构建
已经报道了在棒状杆菌细菌中,香草醛按香草醛->香草酸->原儿茶酸的顺序代谢,并利用(Current Microbiology,2005,Vol.51,pp.59-65)。从香草酸到原儿茶酸的转化反应由香草酸脱甲基酶催化。vanA基因和vanB基因分别编码香草酸脱甲基酶的亚基A和亚基B。vanK基因编码香草酸摄取***,并与vanAB基因一起构成vanABK操纵子(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。因此,首先通过缺失vanABK操纵子从谷氨酸棒杆菌2256菌株构建目标物质诸如香草醛和香草醛利用能力缺陷的菌株(FKS0165菌株)。程序如下所示。
<1-1>用于缺失vanABK基因的质粒pBS4SΔvanABK56的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:51和52的合成DNA作为引物进行PCR,以获得含有vanA基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:53和54的合成DNA作为引物进行PCR,以获得含有vanK基因的C端侧编码区的PCR产物。SEQ ID NO:52和53的序列彼此部分互补。然后,以近似等摩尔量混合含有vanA基因的N端侧编码区的PCR产物和含有vanK基因的C端侧编码区的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其***用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pBS4SΔvanABK56。
<1-2>FKS0165菌株的构建
上面获得的pBS4SΔvanABK56不含能使质粒在棒状杆菌细菌细胞中自主复制的区域。因此,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔvanABK56导入谷氨酸棒杆菌2256菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基(5g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素、15g/L琼脂,用NaOH调节到pH 7.5),并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔvanABK56掺入基因组中。此一次重组的菌株具有野生型vanABK基因和缺陷型vanABK基因两者。
将一次重组菌株在CM-Dex液体培养基(与CM-Dex琼脂培养基具有相同的组成,只是它不含琼脂)中培养过夜,并将该培养肉汤应用于S10琼脂培养基(100g/L蔗糖,10g/L聚胨,10g/L酵母提取物,1g/L KH2PO4,0.4g/L MgSO4-7H2O,0.01g/L FeSO4-7H2O,0.01g/LMnSO4-4-5H2O,3g/L尿素,1.2g/L大豆蛋白水解物溶液,10μg/L生物素,20μg/L琼脂,用NaOH调节至pH7.5,并在120℃高压灭菌20分钟),并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并使用它用SEQ ID NO:55和56的合成DNA作为引物进行PCR,确认了vanABK基因的缺失,并将该菌株命名为FKS0165菌株。
<2>醇脱氢酶同源基因缺陷菌株(FKFC14菌株)的构建
随后,通过使用谷氨酸棒杆菌菌株FKS0165作为亲本株,通过以下程序构建菌株FKFC14,其是醇脱氢酶同源基因(即NCgl0324基因(adhC)、NCgl0313基因(adhE)、和NCgl2709gene(adhA))缺陷的。
<2-1>FKFC5菌株(FKS0165ΔNCgl0324菌株)的构建
<2-1-1>用于缺失NCgl0324基因的质粒pBS4SΔ2256adhC的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:57和58的合成DNA作为引物进行PCR,以获得含有NCgl0324基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:59和60的合成DNA作为引物进行PCR,以获得含有NCgl0324基因的C端侧编码区的PCR产物。SEQ ID NO:58和59的序列彼此部分互补。然后,将约等摩尔量的含有NCgl0324基因的N端侧编码区的PCR产物和含有NCgl0324基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)***已经用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将其中***了靶PCR产物的质粒命名为pBS4SΔ2256adhC。
<2-1-2>FKFC5菌株(FKS0165ΔNCgl0324菌株)的构建
由于上述获得的pBS4SΔ2256adhC不含使质粒能够在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256adhC导入谷氨酸棒杆菌FKS0165菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认,生长的菌株是通过同源重组将pBS4SΔ2256adhC掺入基因组中的一次重组菌株。此一次重组菌株具有野生型NCgl0324基因和缺陷型NCgl0324基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养肉汤应用到S10琼脂培养基,并在31.5℃进行培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。从纯化的菌株制备基因组DNA,并用SEQ ID NO:61和62的合成DNA作为引物进行PCR以确认NCgl0324基因的缺失,并将该菌株命名为FKFC5菌株。
<2-2>FKFC11菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313菌株)的构建
<2-2-1>用于缺失NCgl0313基因的质粒pBS4SΔ2256adhE的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:63和64的合成DNA作为引物进行PCR,以获得含有NCgl0313基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA为模板和SEQ ID NO:65和66的合成DNA为引物进行PCR,以获得含有NCgl0313基因的C端侧编码区的PCR产物。SEQ ID NO:64和65的序列彼此部分互补。然后,将约等摩尔量的含有NCgl0313基因的N端侧编码区的PCR产物和含有NCgl0313基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)将其***用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从获得的转化体中提取质粒,并将其中***了靶PCR产物的质粒命名为pBS4SΔ2256adhE。
<2-2-2>FKFC11菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313株)的构建
由于上述获得的pBS4SΔ2256adhE不含有使质粒能够在棒状杆菌细菌细胞中的自主复制的区域,若用该质粒转化棒状杆菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,但它在非常低的频率发生。因此,通过电脉冲方法将pBS4SΔ2256adhE导入谷氨酸棒杆菌FKFC5菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃下培养。通过PCR证实,生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔ2256adhE掺入基因组中。此一次重组菌株具有野生型NCgl0313基因和缺陷型NCgl0313基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养肉汤应用到S10琼脂培养基上,并在31.5℃进行培养。在出现的菌落中,显示卡那霉素易感性的菌株在CM-Dex琼脂培养基上纯化。从纯化的菌株制备基因组DNA,并使用SEQ ID NO:67和68的合成DNA作为引物进行PCR以确认NCgl0313基因的缺失,并将该菌株命名为FKFC11菌株。
<2-3>FKFC14菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313ΔNCgl2709株)的构建
<2-3-1>用于缺失NCgl2709基因的质粒pBS4SΔ2256adhA的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:69和70的合成DNA作为引物进行PCR以获得含有NCgl2709基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA为模板和SEQ ID NO:71和72的合成DNA作为引物进行PCR,以得到含有NCgl2709基因的C端侧编码区的PCR产物。SEQ ID NO:70和71的序列彼此部分互补。然后,将约等摩尔量的含有NCgl2709基因的N端侧编码区的PCR产物和含有NCgl2709基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)***到用BamHI和PstI处理的pBS4S载体中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从获得的转化体中提取质粒,并将其中***了靶PCR产物的质粒命名为pBS4SΔ2256adhA。
<2-3-2>FKFC14菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313ΔNCgl2709菌株)的构建
由于上文获得的pBS4SΔ2256adhA不含能够使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌,则通过同源重组将该质粒掺入基因组的菌株作为转化体出现,但它在非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256adhA导入谷氨酸棒杆菌FKFC11菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认,生长的菌株是通过同源重组将pBS4SΔ2256adhA掺入基因组中的一次重组菌株。该一次重组菌株具有野生型NCgl2709基因和缺陷型NCgl2709基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养肉汤应用到S10琼脂培养基上,并在31.5℃进行培养。在出现的菌落中,显示卡那霉素易感性的菌株在CM-Dex琼脂培养基上纯化。从纯化的菌株制备基因组DNA,并用SEQ ID NO:73和74的合成DNA作为引物进行PCR以确认NCgl2709基因的缺失,并将该菌株命名为FKFC14菌株。
<3>原儿茶酸双加氧酶基因缺陷菌株(FKFC14ΔpcaGH菌株)的构建
随后,通过使用谷氨酸棒杆菌FKFC14菌株作为亲本菌株,通过外包构建菌株FKFC14ΔpcaGH,其是编码原儿茶酸3,4-双加氧酶的α亚基和β亚基的NCgl2314基因(pcaG)和NCgl2315基因(pcaH)缺陷的。也可以经由以下程序构建FKFC14ΔpcaGH菌株。
<3-1>用于缺失NCgl2314和NCgl2315基因的质粒pBS4SΔ2256pcaGH的构建
NCgl2314和NCgl2315基因彼此相邻,因此可以一起缺失这些基因。通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:75和76的合成DNA作为引物进行PCR以获得含有NCgl2315基因的上游区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:77和78的合成DNA作为引物进行PCR,以获得含有NCgl2314基因的下游区的PCR产物。SEQ ID NO:76和77的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl2315基因的上游区的PCR产物和含有NCgl2314基因的下游区的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其***用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(TakaraBio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pBS4SΔ2256pcaGH。
<3-2>FKFC14ΔpcaGH菌株的构建
由于上面获得的pBS4SΔ2256pcaGH不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256pcaGH导入谷氨酸棒杆菌FKFC14菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔ2256pcaGH掺入基因组中。此一次重组的菌株具有野生型NCgl2314和NCgl2315基因,和缺陷型NCgl2314和NCgl2315基因两者。
将一次重组菌株在CM-Dex液体培养基中培养过夜,并将该培养肉汤应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并使用它用SEQ ID NO:79和80的合成DNA作为引物进行PCR,确认了NCgl2314和NCgl2315基因的缺失,并将该菌株命名为FKFC14ΔpcaGH菌株。
<4>Dp2_0340菌株(FKFC14ΔpcaGH P2::NCgl0120P8::NCgl2048P4::NCgl0935菌株)的构建
<4-1>Ap1_0007菌株(FKFC14ΔpcaGH P2::NCgl0120菌株)的构建
随后,通过使用谷氨酸棒杆菌FKFC14ΔpcaGH菌株作为亲本菌株,通过外包构建菌株Ap1_0007,其中编码Crp家族表达调节蛋白的NCgl0120基因(cysR)的启动子区已经用P2启动子替换以增强此基因的表达。此菌株中含有P2启动子的基因组区域的核苷酸序列以SEQ ID NO:108显示,其中位置942-1034对应于P2启动子。也可以经由以下程序构建Ap1_0007菌株。
<4-1-1>用于替换NCgl0120基因启动子的质粒pBS4SP2::NCgl0120的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:81和82的合成DNA作为引物进行PCR以获得含有NCgl0120基因的上游区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:83和84的合成DNA作为引物进行PCR,以获得含有NCgl0120基因的下游区的PCR产物。另外,通过人工基因合成获得含有P2启动子区的SEQ ID NO:85的DNA片段。然后,通过使用SEQ ID NO:85的DNA片段作为模板,和SEQ ID NO:86和87的合成DNA作为引物进行PCR,以获得含有P2启动子的PCR产物。SEQ IDNO:82和86的序列彼此部分互补,并且SEQ ID NO:83和87的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl0120基因的上游区的PCR产物、含有NCgl0120基因的N端侧编码区的PCR产物和含有P2启动子的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其***用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pBS4SP2::NCgl0120。
<4-1-2>Ap1_0007菌株的构建
由于上面获得的pBS4SP2::NCgl0120不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SP2::NCgl0120导入谷氨酸棒杆菌FKFC14ΔpcaGH菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SP2::NCgl0120掺入基因组中。
将一次重组菌株在CM-Dex液体培养基中培养过夜,并将该培养肉汤应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并用于进行核苷酸序列分析以确认P2启动子位于NCgl0120基因上游,并且该菌株命名为Ap1_0007菌株。
<4-2>Bp1_0112菌株(FKFC14ΔpcaGH P2::NCgl0120P8::NCgl2048菌株)的构建
随后,通过使用谷氨酸棒杆菌Ap1_0007菌株作为亲本菌株,通过外包构建菌株Bp1_0112,其中NCgl2048基因的启动子区已经用P8启动子替换以弱化此基因的表达。此菌株中含有P8启动子的基因组区的核苷酸序列以SEQ ID NO:110显示,其中位置901-1046对应于P8启动子。Bp1_0112菌株也可以经由以下程序构建。
<4-2-1>用于替换NCgl2048基因启动子的质粒pBS4SP8::NCgl2048的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:112和113的合成DNA作为引物进行PCR,以获得含有NCgl2048基因的上游区的PCR产物。分开通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:114和115的合成DNA作为引物进行PCR,以获得含有NCgl2048基因的N端侧编码区的PCR产物。另外,通过人工基因合成获得含有P8启动子区的SEQ ID NO:116的DNA片段。然后,通过使用SEQ ID NO:116的DNA片段作为模板,和SEQ ID NO:117和118的合成DNA作为引物进行PCR,以获得含有P8启动子的PCR产物。SEQ ID NO:113和117的序列彼此部分互补,并且SEQ ID NO:114和118的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl2048基因的上游区的PCR产物、含有NCgl2048基因的N端侧编码区的PCR产物和含有P8启动子的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其***用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pBS4SP8::NCgl2048。
<4-2-2>Bp1_0112菌株的构建
由于上面获得的pBS4SP8::NCgl2048不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SP8::NCgl2048导入谷氨酸棒杆菌Ap1_0007菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SP8::NCgl2048掺入基因组中。
将一次重组菌株在CM-Dex液体培养基中培养过夜,将该培养肉汤应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并用于进行核苷酸序列分析以确认P8启动子位于NCgl2048基因上游,并且该菌株命名为Bp1_0112菌株。
<4-3>Dp2_0340菌株(FKFC14ΔpcaGH P2::NCgl0120P8::NCgl2048P4::NCgl0935菌株)的构建
随后,通过使用谷氨酸棒杆菌Bp1_0112菌株作为亲本菌株,通过外包构建菌株Dp2_0340,其中编码烯醇化酶的NCgl0935基因(eno)的启动子区已经用P4启动子替换以弱化此基因的表达。此菌株中含有P4启动子的基因组区域的核苷酸序列以SEQ ID NO:109显示,其中位置872-969对应于P4启动子。Dp2_0340菌株也可以经由以下程序构建。
<4-3-1>用于替换NCgl0935基因启动子的质粒pBS4SP4::NCgl0935的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:121和122的合成DNA作为引物进行PCR以获得含有NCgl0935基因的上游区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:123和124的合成DNA作为引物进行PCR,以获得含有NCgl0935基因的N端侧编码区的PCR产物。另外,通过人工基因合成获得含有P4启动子区的SEQ ID NO:125的DNA片段。然后,通过使用SEQ ID NO:125的DNA片段作为模板和SEQ ID NO:126和127的合成DNA作为引物进行PCR,以获得含有P4启动子的PCR产物。SEQ ID NO:122和126的序列彼此部分互补,并且SEQ ID NO:123和127的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl0935基因的上游区的PCR产物、含有NCgl0935基因的N端侧编码区的PCR产物和含有P4启动子的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其***用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pBS4SP4::NCgl0935。
<4-3-2>Dp2_0340菌株的构建
由于上面获得的pBS4SP4::NCgl0935不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SP4::NCgl0935导入谷氨酸棒杆菌Bp1_0112菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SP4::NCgl0935掺入基因组中。
将一次重组菌株在CM-Dex液体培养基中培养过夜,将该培养肉汤应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并用于进行核苷酸序列分析以确认P4启动子位于NCgl0935基因上游,并且该菌株命名为Dp2_0340菌株。
<5>Ep2_0055菌株(FKFC14ΔpcaGH P2::NCgl0120P8::NCgl2048P4::NCgl0935P3::NCgl0719菌株)的构建
随后,通过使用谷氨酸棒杆菌Dp2_0340菌株作为亲本菌株,通过外包构建菌株Ep2_0055,其中编码S-腺苷-L-高半胱氨酸水解酶的NCgl0719基因(sahH)的启动子区已经用P3启动子替换。P3启动子的核苷酸序列以SEQ ID NO:111显示。也可以经由以下程序构建Ep2_0055菌株。
<5-1>用于替换NCgl0719基因启动子的质粒pBS4SP3::NCgl0719的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:169和170的合成DNA作为引物进行PCR以获得含有NCgl0719基因的上游区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:171和172的合成DNA作为引物进行PCR,以获得含有NCgl0719基因的N端侧编码区的PCR产物。另外,通过人工基因合成获得含有P3启动子区的SEQ ID NO:111的DNA片段。然后,通过使用SEQ ID NO:111的DNA片段作为模板,和SEQ ID NO:173和174的合成DNA作为引物进行PCR,以获得含有P3启动子的PCR产物。SEQ ID NO:170和173的序列彼此部分互补,并且SEQ ID NO:171和174的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl0719基因的上游区的PCR产物、含有NCgl0719基因的N端侧编码区的PCR产物和含有P3启动子的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其***用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pBS4SP3::NCgl0719。
<5-2>Ep2_0055菌株的构建
由于上面获得的pBS4SP3::NCgl0719不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SP3::NCgl0719导入谷氨酸棒杆菌Dp2_0340菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SP3::NCgl0719掺入基因组中。
将一次重组菌株在CM-Dex液体培养基中培养过夜,并将该培养肉汤应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并使用它进行核苷酸序列分析以确认P3启动子位于NCgl0719基因上游,并将该菌株命名为Ep2_0055菌株。
<6>谷氨酸棒杆菌Ns1_0003菌株(FKFC14ΔpcaGH P2::NCgl0120P8::NCgl2048P4::NCgl0935P3::NCgl0719purH(S37F)菌株)的构建
通过外包获得谷氨酸棒杆菌Ns1_0003菌株,其对应于谷氨酸棒杆菌Ep2_0055菌株,条件是Ns1_0003菌株含有purH(S37F)基因,其是突变体purH基因,替换野生型purH基因。purH(S37F)基因编码PurH(S37F)蛋白,其具有用苯丙氨酸残基替换37位的丝氨酸残基的突变。相应的野生型purH基因的核苷酸序列以SEQ ID NO:177显示,并且相应的野生型purH蛋白的氨基酸序列以SEQ ID NO:178显示。purH(S37F)基因的核苷酸序列以SEQ IDNO:179显示,并且purH(S37F)蛋白的氨基酸序列以SEQ ID NO:180显示。Ns1_0003菌株也可以经由以下程序构建。
<6-1>用于引入purH(S37F)突变的质粒pBS4SΔ2256purH(S37F)的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:181和182的合成DNA作为引物进行PCR,以获得含有purH基因的N端侧编码区的PCR产物。分开通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:183和184的合成DNA作为引物进行PCR,以获得含有purH基因的C端侧编码区的PCR产物。另外,通过人工基因合成获得SEQ ID NO:185的DNA片段。SEQ ID NO:182和185的序列彼此部分互补,并且SEQ ID NO:183和185的序列彼此部分互补。然后,混合近似等摩尔量的含有purH基因的N端侧编码区的PCR产物、SEQ ID NO:185的DNA片段和含有purH基因的C端侧编码区的PCR产物,并通过使用InFusion HD克隆试剂盒(Clontech)将其***用BamHI和PstI处理的pBS4S载体中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pBS4SΔ2256purH(S37F)。
<6-2>Ns1_0003菌株的构建
由于上面获得的pBS4SΔ2256purH(S37F)不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256purH(S37F)导入谷氨酸棒杆菌Ep2_0055菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔ2256purH(S37F)掺入基因组中。一次重组的菌株具有野生型purH基因和S37F型purH基因两者
将一次重组菌株在CM-Dex液体培养基中培养过夜,将该培养培养基应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并用于用SEQ ID NO:186和187的合成DNA作为引物进行PCR以确认purH(S37F)基因的引入,并且该菌株命名为Ns1_0003菌株。
<7><5>用于表达OMT基因的质粒的构建
<7-1>用于表达智人OMT基因的质粒pVK9::PcspB-hsomt的构建
<7-1-1>质粒pEPlac-COMT2的构建
对于智人OMT基因,已知四种转录物变体和两种OMT同种型。这四种转录物变体(转录物变体1-4,GenBank登录号NM_000754.3,NM_001135161.1,NM_001135162.1和NM_007310.2)的核苷酸序列以SEQ ID NOS:11-14显示,并且较长的OMT同种型的氨基酸序列(MB-COMT,GenBank登录号NP_000745.1)以SEQ ID NO:15显示,并且较短的OMT同种型的氨基酸序列(S-COMT,GenBank登录号NP_009294.1)以SEQ ID NO:16显示。编码S-COMT的野生型cDNA的核苷酸序列以SEQ ID NO:130显示。S-COMT的野生型cDNA进行密码子优化以在大肠杆菌中表达,并且使用由ATG Service Gen(Russian Federation,Saint-Petersburg)提供的服务进行化学合成。为了便于进一步克隆,合成在3’和5’端分别具有用于限制性酶NdeI和SacI的位点的基因的DNA片段。经密码子优化的S-COMT cDNA也可以称为COMT2基因。含有COMT2基因的合成的DNA片段的核苷酸序列以SEQ ID NO:131显示。含有COMT2基因的合成DNA片段在pUC57载体(GenScript)中获得。
在T7***中确认COMT2基因的表达。将pUC57载体中***的COMT2基因再克隆到pET22(+)载体(Novagen)的NdeI和SacI限制性位点中。将获得的质粒导入大肠杆菌BL21(DE3)细胞(Novagen)中。将含有质粒的细胞在含有氨苄青霉素,200mg/l的LB培养基(胰蛋白胨,10g/l;酵母提取物,5g/l;NaCl,10g/l)中培养,并且在指数生长阶段中的2小时内由IPTG,1mM诱导。通过超声处理破坏细胞。使用12%SDS-PAGE中的电泳分析粗制蛋白质提取物。鉴定与S-OMT对应的条带(约24kDa),并且从凝胶中切出。从凝胶中分离目标蛋白质,并且用胰蛋白酶处理。使用质谱法分析获得的胰蛋白酶水解物,以确认COMT2基因的表达。
将pUC57载体中***的COMT2基因再克隆到pELAC载体的NdeI和SacI限制性位点中(SEQ ID NO:132,Smirnov S.V.et al.,Appl.Microbiol.Biotechnol,.2010,88(3):719-726)。通过将pET22b(+)(Novagen)的BglII-XbaI片段替换为含有PlacUV5启动子的合成BglII-XbaI片段构建pELAC载体。为了将COMT2基因***pELAC载体中,如由供应商推荐进行使用T4DNA连接酶(Fermentas,Lithuania)的连接反应。用遗传处理连接混合物,并且将获得的沉淀物溶解于水中,并且使用电穿孔(Micro Pulser,BioRad)在由供应商推荐的条件下导入大肠杆菌TG1细胞中。将细胞应用到补充有氨苄青霉素(200mg/L)的LA板(SambrookJ.and Russell D.W.,Molecular Cloning:A Laboratory Manual(第3版),Cold SpringHarbor Laboratory Press,2001)上,并且于37℃培养过夜。使用PCR分析测试获得的克隆以选择需要的克隆。使用引物P1和P2(SEQ ID NOS:133和134)来选择含有COMT2基因的菌落。在使用载体特异性引物P1和用于结束COMT2基因的反向引物P2时获得DNA片段(713bp)。如此,构建载体pEPlac-COMT2。使用引物P1和P3(SEQ ID NO:133和135)测定克隆的COMT2基因的序列。
<7-1-2>质粒pVK9::PcspB-hsomt的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:136和137的合成DNA作为引物进行PCR,以获得含有cspB基因的启动子区和SD序列的PCR产物。分开通过使用质粒pEPlac-COMT2作为模板,和SEQ ID NO:138和139的合成DNA作为引物进行PCR,以获得含有COMT2基因的PCR产物。然后,通过使用In Fusion HD克隆试剂盒(Clontech)将这些PCR产物***用BamHI和PstI处理的pVK9载体(WO2007/046389)中。pVK9载体是用于棒状杆菌细菌和大肠杆菌的穿梭载体。利用该DNA,转化大肠杆菌JM109的感受态细胞(TakaraBio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和25μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pVK9::PcspB-hsomt。
<7-2>用于表达Niastella koreensis的OMT基因的质粒pVK9::PcspB-omt35的构建
通过外包获得质粒pVK9::PcspB-omt35。质粒pVK9::PcspB-omt35含有针对谷氨酸棒杆菌的密码子选择进行密码子优化的Niastella koreensis的OMT基因。此基因也可以称为“omt35基因”,并且由此基因编码的OMT也可以称为“OMT35”。omt35基因的核苷酸序列以SEQ ID NO:145显示,并且OMT35的氨基酸序列以SEQ ID NO:141显示。质粒pVK9::PcspB-omt35也可以经由以下程序构建。
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:142和143的合成DNA作为引物进行PCR以获得含有cspB基因的启动子区和SD序列的PCR产物。分开地通过人工基因合成获得含有omt35基因的ORF的SEQ ID NO:144的DNA片段。然后,通过使用In Fusion HD克隆试剂盒(Clontech)将PCR产物和DNA片段***用BamHI和PstI处理的pVK9载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和25μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将***了靶PCR产物的质粒命名为pVK9::PcspB-omt35。
<7-3>用于表达Niastella koreensis的突变体OMT基因的质粒的构建
通过外包获得质粒pVK9::PcspB-omt202,pVK9::PcspB-omt301,pVK9::PcspB-omt302,pVK9::PcspB-omt304,pVK9::PcspB-omt305,pVK9::PcspB-omt306,pVK9::PcspB-omt307,pVK9::PcspB-omt308,pVK9::PcspB-omt309,pVK9::PcspB-omt311,pVK9::PcspB-omt312,pZK1::PcspB-omt312,pZK1::PcspB-omt401,pZK1::PcspB-omt402,pZK1::PcspB-omt403,pZK1::PcspB-omt404,pZK1::PcspB-omt406,pZK1::PcspB-omt407和pZK1::PcspB-omt408。这些质粒各自含有编码突变体OMT的突变体OMT基因,其对应于已经由于表2中所示的密码子变化引入表1中所示的突变的OMT35。由这些质粒包含的突变体OMT基因也分别称为"omt202基因","omt301基因","omt302基因","omt304基因","omt305基因","omt306基因","omt307基因","omt308基因","omt309基因","omt311基因","omt312基因"(对于pVK9::PcspB-omt312和pZK1::PcspB-omt312两者),"omt401基因","omt402基因","omt403基因","omt404基因","omt406基因","omt407基因"和"omt408基因",由这些突变体OMT基因编码的突变体OMT也分别称为"OMT202","OMT301","OMT302","OMT304","OMT305","OMT306","OMT307","OMT308","OMT309","OMT311","OMT312","OMT401","OMT402","OMT403","OMT404","OMT406","OMT407"和"OMT408"。这些质粒也可以经由以下程序构建。
[表1]
表1
Figure BDA0002041569020000741
Figure BDA0002041569020000751
[表2]
表2
Figure BDA0002041569020000752
Figure BDA0002041569020000761
通过使用QuikChange定点诱变试剂盒(Agilent Technologies)进行用于构建pVK9::PcspB-omt202的突变的引入。也就是说,通过使用质粒pVK9::PcspB-omt35作为模板和SEQ ID NO:146和147的合成DNA作为引物用Pfu Ultra DNA聚合酶进行PCR。然后,用DpnI处理PCR产物以消化模板。利用此DNA,转化XL1-Blue超感受态细胞,并且将细胞应用于含有25μg/mL卡那霉素的LB培养基,并且培养过夜。然后,挑出出现的菌落,并且分成单菌落以获得转化体。从获得的转化体提取质粒,确认其核苷酸序列,并且***有目标突变的质粒称为pVK9::PcspB-omt202。
通过人工基因合成构建用于表达突变体OMT基因的所有其它基于pVK9的质粒。这些基于pVK9的质粒各自由以SEQ ID NO:166所示的核苷酸序列和相应的突变体OMT基因组成,其中突变体OMT基因***SEQ ID NO:166的位置4879和位置4880之间。除了相应突变的密码子变化外,每个突变体OMT基因的核苷酸序列与omt35基因的核苷酸序列(SEQ ID NO:145)相同。
从pVK9::PcspB-omt312构建pZK1::PcspB-OMT312以引入来自谷氨酸棒杆菌ATCC13032的tcg0610终止子序列,并且除去已知的tn10转座子靶向位点。使用SEQ ID NO:167和168的合成DNA作为引物和pVK9::PcspB-omt312作为模板进行PCR。然后,使用T4多核苷酸激酶(New England Biolabs)将此PCR产物磷酸化,并且使用Quick连接试剂盒(New EnglandBiolabs)将所得的磷酸化的平端自身连接。将所得的连接混合物转化到大肠杆菌10-beta感受态细胞(New England Biolabs)中,并且将经转化的细胞混合物应用到含有25μg/mL卡那霉素的LB培养,并且培养过夜。将单菌落挑到含有卡那霉素的液体LB培养基中,并且提取质粒。进行Sanger测序以确认所得的质粒的序列如预期,并且具有正确序列的质粒命名为pZK1::PcspB-OMT312。
用与用于构建pVK9::PcspB-omt202的程序相同的程序构建用于表达突变体OMT基因的所有其它基于pZK1的质粒,只是使用表1中指定的编码相应的亲本OMT的基于pZK1的质粒作为模板并且使用表2中指定的引物组进行PCR。对于构建pZK1::PcspB-omt404和pZK1::PcspB-omt406,以表1中指定的次序将两个突变次序引入相应的亲本OMT。也就是说,例如,如下构建pZK1::PcspB-omt404:使用pZK1::PcspB-omt312作为模板引入M36V突变以构建中间质粒;然后,使用中间质粒作为模板引入P144S(1)突变以构建pZK1::PcspB-omt404。
<8>香草酸生产菌株的构建
通过外包构建谷氨酸棒杆菌FKFC14ΔpcaGH/pVK9::PcspB-hsomt,Dp2_0340/pVK9::PcspB-omt35,Dp2_0340/pVK9::PcspB-omt202,Dp2_0340/pVK9::PcspB-omt301,Dp2_0340/pVK9::PcspB-omt302,Dp2_0340/pVK9::PcspB-omt304,Dp2_0340/pVK9::PcspB-omt305,Dp2_0340/pVK9::PcspB-omt306,Dp2_0340/pVK9::PcspB-omt307,Dp2_0340/pVK9::PcspB-omt308,Dp2_0340/pVK9::PcspB-omt309,Dp2_0340/pVK9::PcspB-omt311,Dp2_0340/pVK9::PcspB-omt312,Ep2_0055/pZK1::PcspB-omt312,Ns1_0003/pZK1::PcspB-omt401,Ns1_0003/pZK1::PcspB-omt402,Ns1_0003/pZK1::PcspB-omt403,Ns1_0003/pZK1::PcspB-omt404,Ns1_0003/pZK1::PcspB-omt406,Ns1_0003/pZK1::PcspB-omt407和Ns1_0003/pZK1::PcspB-omt408菌株(其含有相应的质粒以表达OMT基因)。这些菌株也可以经由以下程序构建。
通过电穿孔将质粒pVK9::PcspB-hsomt,pVK9::PcspB-omt35,pVK9::PcspB-omt202,pVK9::PcspB-omt301,pVK9::PcspB-omt302,pVK9::PcspB-omt304,pVK9::PcspB-omt305,pVK9::PcspB-omt306,pVK9::PcspB-omt307,pVK9::PcspB-omt308,pVK9::PcspB-omt309,pVK9::PcspB-omt311,pVK9::PcspB-omt312,pZK1::PcspB-omt312,pZK1::PcspB-omt401,pZK1::PcspB-omt402,pZK1::PcspB-omt403,pZK1::PcspB-omt404,pZK1::PcspB-omt406,pZK1::PcspB-omt407和pZK1::PcspB-omt408各自导入谷氨酸棒杆菌FKFC14ΔpcaGH菌株(对于pVK9::PcspB-hsomt),谷氨酸棒杆菌Dp2_0340菌株(对于其他基于pVK9的质粒),谷氨酸棒杆菌Ep2_0055菌株(对于pZK1::PcspB-omt312),或谷氨酸棒杆菌Ns1_0003菌株(对于其他基于pZK1的质粒)。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并且于31.5℃培养。在相同的琼脂培养基上纯化生长的菌株,并且分别命名为FKFC14ΔpcaGH/pVK9::PcspB-hsomt,Dp2_0340/pVK9::PcspB-omt35,Dp2_0340/pVK9::PcspB-omt202,Dp2_0340/pVK9::PcspB-omt301,Dp2_0340/pVK9::PcspB-omt302,Dp2_0340/pVK9::PcspB-omt304,Dp2_0340/pVK9::PcspB-omt305,Dp2_0340/pVK9::PcspB-omt306,Dp2_0340/pVK9::PcspB-omt307,Dp2_0340/pVK9::PcspB-omt308,Dp2_0340/pVK9::PcspB-omt309,Dp2_0340/pVK9::PcspB-omt311,Dp2_0340/pVK9::PcspB-omt312,Ep2_0055/pZK1::PcspB-omt312,Ns1_0003/pZK1::PcspB-omt401,Ns1_0003/pZK1::PcspB-omt402,Ns1_0003/pZK1::PcspB-omt403,Ns1_0003/pZK1::PcspB-omt404,Ns1_0003/pZK1::PcspB-omt406,Ns1_0003/pZK1::PcspB-omt407和Ns1_0003/pZK1::PcspB-omt408。
将这些菌株各自接种到试管中存在的4mL含有25μg/mL卡那霉素的CM-Dex w/omameno培养基(5g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、10μg/L生物素,用KOH调节到pH7.5)中,并且于31.5℃在摇动的情况下培养约16小时。将获得的培养肉汤的0.9mL等分试样与0.6mL 50%甘油水溶液混合以获得甘油储液,并且于-80℃贮存。
<9>谷氨酸棒杆菌香草酸生产菌株的香草酸生产
将构建的香草酸生产菌株的甘油储液的各5μL等分试样接种到试管中存在的4mL不含mameno,且含有25μg/mL卡那霉素的CM-Dex培养基,并且于31.5℃在摇动的情况下培养20小时作为预培养物。将获得的预培养物肉汤的0.5mL等分试样接种到具有挡板的锥形瓶中存在的50mL含有25μg/mL卡那霉素的CM-Dex w/o mameno培养基,并且于31.5℃在摇动的情况下培养20小时。以8000rpm将获得的培养物肉汤离心5分钟,除去上清液,并且在经灭菌的生理盐水中悬浮细胞。测量细胞悬浮液的光密度(OD),并且用生理盐水稀释细胞悬浮液以获得600nm处的OD为50。将稀释的细胞悬浮液的5mL等分试样接种到具有挡板的锥形瓶中存在的20mL含有25μg/mL卡那霉素的香草酸生产培养基(75g/L葡萄糖、0.6g/L MgSO4-7H2O、6.3g/L(NH4)2SO4、2.5g/L KH2PO4、12.5mg/L FeSO4-7H2O、12.5mg/L MnSO4-4-5H2O、2.5g/L酵母提取物、150μg/L维生素B1、150μg/L生物素、6.9g/L原儿茶酸,用KOH调节到pH 7,然后与37.5g/L CaCO3(用180℃的热空气灭菌3小时)混合)中,并且于31.5℃在摇动的情况下培养24小时。
在培养开始和完成时,通过外包分析培养基中底物的浓度。也可以经由以下程序分析底物的浓度。
用Biotech分析仪AS-310(Sakura SI)分析培养基中的葡萄糖浓度。通过使用超高效液相层析NEXERA X2***(SHIMADZU)用以下条件分析培养基中的原儿茶酸、香草酸和异香草酸浓度。
UPLC分析条件:
柱:KINETEX 2.6μm XB-C18,150x 30mm(Phenomenex)
炉温度:40℃
流动相(A):0.1%三氟乙酸
流动相(B):0.1%三氟乙酸/80%乙腈
梯度程度(时间,A(%),B(%)):(0,90,10)->(3,80,20)
流速:1.5ml/min
表3和4中显示了结果。在表中,“VA/(VA+iVA)”可以指香草酸的生产量相对于香草酸和异香草酸的总生产量的比率。对引入有omt35基因的菌株观察到的VA/(VA+iVA)比率高于对引入有COMT2(hsomt)基因的菌株观察到的VA/(VA+iVA)比率。因此,揭示了OMT35对于降低异香草酸的副生产是有效的。另外,对引入有突变体OMT基因的菌株观察到的VA/(VA+iVA)比率高于对引入有COMT2(hsomt)基因或omt35基因的菌株观察到的VA/(VA+iVA)比率。因此,也揭示了这些突变对于降低异香草酸的副生产是有效的。
[表3]
表3:谷氨酸棒杆菌香草酸生产菌株的香草酸生产
Figure BDA0002041569020000791
Figure BDA0002041569020000801
缩写:
VA,香草酸;
iVA,异香草酸。
[表4]
表4:谷氨酸棒杆菌香草酸生产菌株的香草酸生产
质粒 VA/(VA+iVA)
pVK9::PcspB-hsomt 0.59
pZK1::PcspB-omt312 0.89
pZK1::PcspB-omt401 0.88
pZK1::PcspB-omt402 0.89
pZK1::PcspB-omt403 0.89
pZK1::PcspB-omt404 0.90
pZK1::PcspB-omt406 0.91
pZK1::PcspB-omt407 0.91
pZK1::PcspB-omt408 0.91
缩写:
VA,香草酸;
iVA,异香草酸。
[工业适用性]
根据本发明,微生物用于生产目标物质,诸如香草醛和香草酸的能力可以得到改善,并且可以有效生产目标物质。
<序列表的解释>
SEQ ID NO:
1:大肠杆菌MG1655的aroG基因的核苷酸序列
2:大肠杆菌MG1655的AroG蛋白的氨基酸序列
3:大肠杆菌MG1655的aroB基因的核苷酸序列
4:大肠杆菌MG1655的AroB蛋白的氨基酸序列
5:大肠杆菌MG1655的aroD基因的核苷酸序列
6:大肠杆菌MG1655的AroD蛋白的氨基酸序列
7:苏云金芽孢杆菌BMB171的asbF基因的核苷酸序列
8:苏云金芽孢杆菌BMB171的AsbF蛋白的氨基酸序列
9:大肠杆菌MG1655的tyrR基因的核苷酸序列
10:大肠杆菌MG1655的TyrR蛋白的氨基酸序列
11-14:智人OMT基因的转录物变体1至4的核苷酸序列
15:智人OMT同种型(MB-COMT)的氨基酸序列
16:智人OMT同种型(S-COMT)的氨基酸序列
17:巴西诺卡菌的ACAR基因的核苷酸序列
18:巴西诺卡菌的ACAR蛋白的氨基酸序列
19:巴西诺卡菌的ACAR基因的核苷酸序列
20:巴西诺卡菌的ACAR蛋白的氨基酸序列
21:大肠杆菌MG1655的entD基因的核苷酸序列
22:大肠杆菌MG1655的EntD蛋白的氨基酸序列
23:谷氨酸棒杆菌ATCC 13032的PPT基因的核苷酸序列
24:谷氨酸棒杆菌ATCC 13032的PPT蛋白的氨基酸序列
25:谷氨酸棒杆菌2256(ATCC 13869)的vanK基因的核苷酸序列
26:谷氨酸棒杆菌2256(ATCC 13869)的VanK蛋白的氨基酸序列
27:谷氨酸棒杆菌2256(ATCC 13869)的pcaK基因的核苷酸序列
28:谷氨酸棒杆菌2256(ATCC 13869)的PcaK蛋白的氨基酸序列
29:谷氨酸棒杆菌2256(ATCC 13869)的vanA基因的核苷酸序列
30:谷氨酸棒杆菌2256(ATCC 13869)的VanA蛋白的氨基酸序列
31:谷氨酸棒杆菌2256(ATCC 13869)的vanB基因的核苷酸序列
32:谷氨酸棒杆菌2256(ATCC 13869)的VanB蛋白的氨基酸序列
33:谷氨酸棒杆菌ATCC 13032的pcaG基因的核苷酸序列
34:谷氨酸棒杆菌ATCC 13032的PcaG蛋白的氨基酸序列
35:谷氨酸棒杆菌ATCC 13032的pcaH基因的核苷酸序列
36:谷氨酸棒杆菌ATCC 13032的PcaH蛋白的氨基酸序列
37:大肠杆菌MG1655的yqhD基因的核苷酸序列
38:大肠杆菌MG1655的YqhD蛋白的氨基酸序列
39:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0324基因的核苷酸序列
40:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0324蛋白的氨基酸序列
41:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0313基因的核苷酸序列
42:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0313蛋白的氨基酸序列
43:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2709基因的核苷酸序列
44:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2709蛋白的氨基酸序列
45:谷氨酸棒杆菌ATCC 13032的NCgl0219基因的核苷酸序列
46:谷氨酸棒杆菌ATCC 13032的NCgl0219蛋白的氨基酸序列
47:谷氨酸棒杆菌ATCC 13032的NCgl2382基因的核苷酸序列
48:谷氨酸棒杆菌ATCC 13032的NCgl2382蛋白的氨基酸序列
49:大肠杆菌MG1655的aroE基因的核苷酸序列
50:大肠杆菌MG1655的AroE蛋白的氨基酸序列
51-84:引物
85:含有P2启动子区的DNA片段的核苷酸序列
86和87:引物
88:谷氨酸棒杆菌2256(ATCC 13869)的cysI基因的核苷酸序列
89:谷氨酸棒杆菌2256(ATCC 13869)的CysI蛋白的氨基酸序列
90:谷氨酸棒杆菌2256(ATCC 13869)的cysX基因的核苷酸序列
91:谷氨酸棒杆菌2256(ATCC 13869)的CysX蛋白的氨基酸序列
92:谷氨酸棒杆菌2256(ATCC 13869)的cysH基因的核苷酸序列
93:谷氨酸棒杆菌2256(ATCC 13869)的CysH蛋白的氨基酸序列
94:谷氨酸棒杆菌2256(ATCC 13869)的cysD基因的核苷酸序列
95:谷氨酸棒杆菌2256(ATCC 13869)的CysD蛋白的氨基酸序列
96:谷氨酸棒杆菌2256(ATCC 13869)的cysN基因的核苷酸序列
97:谷氨酸棒杆菌2256(ATCC 13869)的CysN蛋白的氨基酸序列
98:谷氨酸棒杆菌2256(ATCC 13869)的cysY基因的核苷酸序列
99:谷氨酸棒杆菌2256(ATCC 13869)的CysY蛋白的氨基酸序列
100:谷氨酸棒杆菌2256(ATCC 13869)的cysZ基因的核苷酸序列
101:谷氨酸棒杆菌2256(ATCC 13869)的CysZ蛋白的氨基酸序列
102:谷氨酸棒杆菌2256(ATCC 13869)的fpr2基因的核苷酸序列
103:谷氨酸棒杆菌2256(ATCC 13869)的Fpr2蛋白的氨基酸序列
104:谷氨酸棒杆菌2256(ATCC 13869)的cysR基因的核苷酸序列
105:谷氨酸棒杆菌2256(ATCC 13869)的CysR蛋白的氨基酸序列
106:谷氨酸棒杆菌2256(ATCC 13869)的ssuR基因的核苷酸序列
107:谷氨酸棒杆菌2256(ATCC 13869)的SsuR蛋白的氨基酸序列
108:含有P2启动子的核苷酸序列
109:含有P4启动子的核苷酸序列
110:含有P6启动子的核苷酸序列
111:含有P8启动子的核苷酸序列
112-115:引物
116:含有P8启动子区的DNA片段的核苷酸序列
117和118:引物
119:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2048基因的核苷酸序列
120:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2048蛋白的氨基酸序列
121-124:引物
125:含有P4启动子区的DNA片段的核苷酸序列
126和127:引物
128:谷氨酸棒杆菌2256(ATCC 13869)的eno基因的核苷酸序列
129:谷氨酸棒杆菌2256(ATCC 13869)的Eno蛋白的氨基酸序列
130:编码智人S-COMT的cDNA的核苷酸序列
131:含有COMT2基因的合成DNA片段的核苷酸序列
132:pELAC载体
133-139:引物
140:Niastella koreensis的OMT基因的核苷酸序列
141:Niastella koreensis的OMT的氨基酸序列
142和143:引物
144:含有omt35基因的DNA片段的核苷酸序列
145:omt35基因的核苷酸序列(Niastella koreensis的经密码子优化的OMT基因)
146-165:引物
166:用于表达突变体OMT基因的一些基于pVK9的质粒的共同部分的核苷酸序列
167-174:引物
175:谷氨酸棒杆菌2256(ATCC 13869)的sahH基因的核苷酸序列
176:谷氨酸棒杆菌2256(ATCC 13869)的SahH蛋白的氨基酸序列
177:谷氨酸棒杆菌2256(ATCC 13869)的purH基因的核苷酸序列
178:谷氨酸棒杆菌2256(ATCC 13869)的PurH蛋白的氨基酸序列
179:purH(S37F)基因(突变体purH基因)的核苷酸序列
180:purH(S37F)蛋白(突变体purH蛋白)的氨基酸序列
181-184:引物
185:DNA片段的核苷酸序列
186和187:引物
序列表
<110> 味之素株式会社
<120> 生产目标物质的方法
<130> D889-16118
<150> US62/413061
<151> 2016-10-26
<150> US62/417617
<151> 2016-11-04
<160> 187
<170> PatentIn version 3.5
<210> 1
<211> 1053
<212> DNA
<213> 大肠杆菌
<400> 1
atgaattatc agaacgacga tttacgcatc aaagaaatca aagagttact tcctcctgtc 60
gcattgctgg aaaaattccc cgctactgaa aatgccgcga atacggttgc ccatgcccga 120
aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc tgttggttgt gattggccca 180
tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca ctcgcttgct ggcgctgcgt 240
gaagagctga aagatgagct ggaaatcgta atgcgcgtct attttgaaaa gccgcgtacc 300
acggtgggct ggaaagggct gattaacgat ccgcatatgg ataatagctt ccagatcaac 360
gacggtctgc gtatagcccg taaattgctg cttgatatta acgacagcgg tctgccagcg 420
gcaggtgagt ttctcgatat gatcacccca caatatctcg ctgacctgat gagctggggc 480
gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg aactggcatc agggctttct 540
tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta aagtggctat cgatgccatt 600
aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga aatgggggca ttcggcgatt 660
gtgaatacca gcggtaacgg cgattgccat atcattctgc gcggcggtaa agagcctaac 720
tacagcgcga agcacgttgc tgaagtgaaa gaagggctga acaaagcagg cctgccagca 780
caggtgatga tcgatttcag ccatgctaac tcgtccaaac aattcaaaaa gcagatggat 840
gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa aggccattat tggcgtgatg 900
gtggaaagcc atctggtgga aggcaatcag agcctcgaga gcggggagcc gctggcctac 960
ggtaagagca tcaccgatgc ctgcatcggc tgggaagata ccgatgctct gttacgtcaa 1020
ctggcgaatg cagtaaaagc gcgtcgcggg taa 1053
<210> 2
<211> 350
<212> PRT
<213> 大肠杆菌
<400> 2
Met Asn Tyr Gln Asn Asp Asp Leu Arg Ile Lys Glu Ile Lys Glu Leu
1               5                   10                  15
Leu Pro Pro Val Ala Leu Leu Glu Lys Phe Pro Ala Thr Glu Asn Ala
            20                  25                  30
Ala Asn Thr Val Ala His Ala Arg Lys Ala Ile His Lys Ile Leu Lys
        35                  40                  45
Gly Asn Asp Asp Arg Leu Leu Val Val Ile Gly Pro Cys Ser Ile His
    50                  55                  60
Asp Pro Val Ala Ala Lys Glu Tyr Ala Thr Arg Leu Leu Ala Leu Arg
65                  70                  75                  80
Glu Glu Leu Lys Asp Glu Leu Glu Ile Val Met Arg Val Tyr Phe Glu
                85                  90                  95
Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro His
            100                 105                 110
Met Asp Asn Ser Phe Gln Ile Asn Asp Gly Leu Arg Ile Ala Arg Lys
        115                 120                 125
Leu Leu Leu Asp Ile Asn Asp Ser Gly Leu Pro Ala Ala Gly Glu Phe
    130                 135                 140
Leu Asp Met Ile Thr Pro Gln Tyr Leu Ala Asp Leu Met Ser Trp Gly
145                 150                 155                 160
Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Val His Arg Glu Leu Ala
                165                 170                 175
Ser Gly Leu Ser Cys Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr
            180                 185                 190
Ile Lys Val Ala Ile Asp Ala Ile Asn Ala Ala Gly Ala Pro His Cys
        195                 200                 205
Phe Leu Ser Val Thr Lys Trp Gly His Ser Ala Ile Val Asn Thr Ser
    210                 215                 220
Gly Asn Gly Asp Cys His Ile Ile Leu Arg Gly Gly Lys Glu Pro Asn
225                 230                 235                 240
Tyr Ser Ala Lys His Val Ala Glu Val Lys Glu Gly Leu Asn Lys Ala
                245                 250                 255
Gly Leu Pro Ala Gln Val Met Ile Asp Phe Ser His Ala Asn Ser Ser
            260                 265                 270
Lys Gln Phe Lys Lys Gln Met Asp Val Cys Ala Asp Val Cys Gln Gln
        275                 280                 285
Ile Ala Gly Gly Glu Lys Ala Ile Ile Gly Val Met Val Glu Ser His
    290                 295                 300
Leu Val Glu Gly Asn Gln Ser Leu Glu Ser Gly Glu Pro Leu Ala Tyr
305                 310                 315                 320
Gly Lys Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Asp Thr Asp Ala
                325                 330                 335
Leu Leu Arg Gln Leu Ala Asn Ala Val Lys Ala Arg Arg Gly
            340                 345                 350
<210> 3
<211> 1089
<212> DNA
<213> 大肠杆菌
<400> 3
atggagagga ttgtcgttac tctcggggaa cgtagttacc caattaccat cgcatctggt 60
ttgtttaatg aaccagcttc attcttaccg ctgaaatcgg gcgagcaggt catgttggtc 120
accaacgaaa ccctggctcc tctgtatctc gataaggtcc gcggcgtact tgaacaggcg 180
ggtgttaacg tcgatagcgt tatcctccct gacggcgagc agtataaaag cctggctgta 240
ctcgataccg tctttacggc gttgttacaa aaaccgcatg gtcgcgatac tacgctggtg 300
gcgcttggcg gcggcgtagt gggcgatctg accggcttcg cggcggcgag ttatcagcgc 360
ggtgtccgtt tcattcaagt cccgacgacg ttactgtcgc aggtcgattc ctccgttggc 420
ggcaaaactg cggtcaacca tcccctcggt aaaaacatga ttggcgcgtt ctaccaacct 480
gcttcagtgg tggtggatct cgactgtctg aaaacgcttc ccccgcgtga gttagcgtcg 540
gggctggcag aagtcatcaa atacggcatt attcttgacg gtgcgttttt taactggctg 600
gaagagaatc tggatgcgtt gttgcgtctg gacggtccgg caatggcgta ctgtattcgc 660
cgttgttgtg aactgaaggc agaagttgtc gccgccgacg agcgcgaaac cgggttacgt 720
gctttactga atctgggaca cacctttggt catgccattg aagctgaaat ggggtatggc 780
aattggttac atggtgaagc ggtcgctgcg ggtatggtga tggcggcgcg gacgtcggaa 840
cgtctcgggc agtttagttc tgccgaaacg cagcgtatta taaccctgct caagcgggct 900
gggttaccgg tcaatgggcc gcgcgaaatg tccgcgcagg cgtatttacc gcatatgctg 960
cgtgacaaga aagtccttgc gggagagatg cgcttaattc ttccgttggc aattggtaag 1020
agtgaagttc gcagcggcgt ttcgcacgag cttgttctta acgccattgc cgattgtcaa 1080
tcagcgtaa 1089
<210> 4
<211> 362
<212> PRT
<213> 大肠杆菌
<400> 4
Met Glu Arg Ile Val Val Thr Leu Gly Glu Arg Ser Tyr Pro Ile Thr
1               5                   10                  15
Ile Ala Ser Gly Leu Phe Asn Glu Pro Ala Ser Phe Leu Pro Leu Lys
            20                  25                  30
Ser Gly Glu Gln Val Met Leu Val Thr Asn Glu Thr Leu Ala Pro Leu
        35                  40                  45
Tyr Leu Asp Lys Val Arg Gly Val Leu Glu Gln Ala Gly Val Asn Val
    50                  55                  60
Asp Ser Val Ile Leu Pro Asp Gly Glu Gln Tyr Lys Ser Leu Ala Val
65                  70                  75                  80
Leu Asp Thr Val Phe Thr Ala Leu Leu Gln Lys Pro His Gly Arg Asp
                85                  90                  95
Thr Thr Leu Val Ala Leu Gly Gly Gly Val Val Gly Asp Leu Thr Gly
            100                 105                 110
Phe Ala Ala Ala Ser Tyr Gln Arg Gly Val Arg Phe Ile Gln Val Pro
        115                 120                 125
Thr Thr Leu Leu Ser Gln Val Asp Ser Ser Val Gly Gly Lys Thr Ala
    130                 135                 140
Val Asn His Pro Leu Gly Lys Asn Met Ile Gly Ala Phe Tyr Gln Pro
145                 150                 155                 160
Ala Ser Val Val Val Asp Leu Asp Cys Leu Lys Thr Leu Pro Pro Arg
                165                 170                 175
Glu Leu Ala Ser Gly Leu Ala Glu Val Ile Lys Tyr Gly Ile Ile Leu
            180                 185                 190
Asp Gly Ala Phe Phe Asn Trp Leu Glu Glu Asn Leu Asp Ala Leu Leu
        195                 200                 205
Arg Leu Asp Gly Pro Ala Met Ala Tyr Cys Ile Arg Arg Cys Cys Glu
    210                 215                 220
Leu Lys Ala Glu Val Val Ala Ala Asp Glu Arg Glu Thr Gly Leu Arg
225                 230                 235                 240
Ala Leu Leu Asn Leu Gly His Thr Phe Gly His Ala Ile Glu Ala Glu
                245                 250                 255
Met Gly Tyr Gly Asn Trp Leu His Gly Glu Ala Val Ala Ala Gly Met
            260                 265                 270
Val Met Ala Ala Arg Thr Ser Glu Arg Leu Gly Gln Phe Ser Ser Ala
        275                 280                 285
Glu Thr Gln Arg Ile Ile Thr Leu Leu Lys Arg Ala Gly Leu Pro Val
    290                 295                 300
Asn Gly Pro Arg Glu Met Ser Ala Gln Ala Tyr Leu Pro His Met Leu
305                 310                 315                 320
Arg Asp Lys Lys Val Leu Ala Gly Glu Met Arg Leu Ile Leu Pro Leu
                325                 330                 335
Ala Ile Gly Lys Ser Glu Val Arg Ser Gly Val Ser His Glu Leu Val
            340                 345                 350
Leu Asn Ala Ile Ala Asp Cys Gln Ser Ala
        355                 360
<210> 5
<211> 759
<212> DNA
<213> 大肠杆菌
<400> 5
atgaaaaccg taactgtaaa agatctcgtc attggtacgg gcgcacctaa aatcatcgtc 60
tcgctgatgg cgaaagatat cgccagcgtg aaatccgaag ctctcgccta tcgtgaagcg 120
gactttgata ttctggaatg gcgtgtggac cactatgccg acctctccaa tgtggagtct 180
gtcatggcgg cagcaaaaat tctccgtgag accatgccag aaaaaccgct gctgtttacc 240
ttccgcagtg ccaaagaagg cggcgagcag gcgatttcca ccgaggctta tattgcactc 300
aatcgtgcag ccatcgacag cggcctggtt gatatgatcg atctggagtt atttaccggt 360
gatgatcagg ttaaagaaac cgtcgcctac gcccacgcgc atgatgtgaa agtagtcatg 420
tccaaccatg acttccataa aacgccggaa gccgaagaaa tcattgcccg tctgcgcaaa 480
atgcaatcct tcgacgccga tattcctaag attgcgctga tgccgcaaag taccagcgat 540
gtgctgacgt tgcttgccgc gaccctggag atgcaggagc agtatgccga tcgtccaatt 600
atcacgatgt cgatggcaaa aactggcgta atttctcgtc tggctggtga agtatttggc 660
tcggcggcaa cttttggtgc ggtaaaaaaa gcgtctgcgc cagggcaaat ctcggtaaat 720
gatttgcgca cggtattaac tattttacac caggcataa 759
<210> 6
<211> 252
<212> PRT
<213> 大肠杆菌
<400> 6
Met Lys Thr Val Thr Val Lys Asp Leu Val Ile Gly Thr Gly Ala Pro
1               5                   10                  15
Lys Ile Ile Val Ser Leu Met Ala Lys Asp Ile Ala Ser Val Lys Ser
            20                  25                  30
Glu Ala Leu Ala Tyr Arg Glu Ala Asp Phe Asp Ile Leu Glu Trp Arg
        35                  40                  45
Val Asp His Tyr Ala Asp Leu Ser Asn Val Glu Ser Val Met Ala Ala
    50                  55                  60
Ala Lys Ile Leu Arg Glu Thr Met Pro Glu Lys Pro Leu Leu Phe Thr
65                  70                  75                  80
Phe Arg Ser Ala Lys Glu Gly Gly Glu Gln Ala Ile Ser Thr Glu Ala
                85                  90                  95
Tyr Ile Ala Leu Asn Arg Ala Ala Ile Asp Ser Gly Leu Val Asp Met
            100                 105                 110
Ile Asp Leu Glu Leu Phe Thr Gly Asp Asp Gln Val Lys Glu Thr Val
        115                 120                 125
Ala Tyr Ala His Ala His Asp Val Lys Val Val Met Ser Asn His Asp
    130                 135                 140
Phe His Lys Thr Pro Glu Ala Glu Glu Ile Ile Ala Arg Leu Arg Lys
145                 150                 155                 160
Met Gln Ser Phe Asp Ala Asp Ile Pro Lys Ile Ala Leu Met Pro Gln
                165                 170                 175
Ser Thr Ser Asp Val Leu Thr Leu Leu Ala Ala Thr Leu Glu Met Gln
            180                 185                 190
Glu Gln Tyr Ala Asp Arg Pro Ile Ile Thr Met Ser Met Ala Lys Thr
        195                 200                 205
Gly Val Ile Ser Arg Leu Ala Gly Glu Val Phe Gly Ser Ala Ala Thr
    210                 215                 220
Phe Gly Ala Val Lys Lys Ala Ser Ala Pro Gly Gln Ile Ser Val Asn
225                 230                 235                 240
Asp Leu Arg Thr Val Leu Thr Ile Leu His Gln Ala
                245                 250
<210> 7
<211> 843
<212> DNA
<213> 苏云金芽孢杆菌
<400> 7
atgaaatatt cgctatgtac catttcattt cgtcatcaat taatttcatt tactgatatt 60
gttcaatttg catatgaaaa cggttttgaa ggaattgaat tatgggggac gcatgcacaa 120
aatttgtaca tgcaagaacg tgaaacgaca gaacgagaat tgaattttct aaaggataaa 180
aacttagaaa ttacgatgat aagtgattac ttagatatat cattatcagc agattttgaa 240
aaaacgatag agaaaagtga acaacttgta gtactagcta attggtttaa tacgaataaa 300
attcgcacgt ttgctgggca aaaagggagc aaggacttct cggaacaaga gagaaaagag 360
tatgtgaagc gaatacgtaa gatttgtgat gtgtttgctc agaacaatat gtatgtgctg 420
ttagaaacac atcccaatac actaacggac acattgcctt ctactataga gttattagaa 480
gaagtaaacc atccgaattt aaaaataaat cttgattttc ttcatatatg ggagtctggc 540
gcagatccaa tagacagttt ccatcgatta aagccgtgga cactacatta ccattttaag 600
aatatatctt cagcggatta tttgcatgtg tttgaaccta ataatgtata tgctgcagca 660
ggaagtcgta taggtatggt tccgttattt gaaggtattg taaattatga tgagattatt 720
caggaagtga gaaatacgga tctttttgct tccttagaat ggtttggaca taattcaaaa 780
gagatattaa aagaagaaat gaaagtatta ataaatagaa aattagaagt agtaacttcg 840
taa 843
<210> 8
<211> 280
<212> PRT
<213> 苏云金芽孢杆菌
<400> 8
Met Lys Tyr Ser Leu Cys Thr Ile Ser Phe Arg His Gln Leu Ile Ser
1               5                   10                  15
Phe Thr Asp Ile Val Gln Phe Ala Tyr Glu Asn Gly Phe Glu Gly Ile
            20                  25                  30
Glu Leu Trp Gly Thr His Ala Gln Asn Leu Tyr Met Gln Glu Arg Glu
        35                  40                  45
Thr Thr Glu Arg Glu Leu Asn Phe Leu Lys Asp Lys Asn Leu Glu Ile
    50                  55                  60
Thr Met Ile Ser Asp Tyr Leu Asp Ile Ser Leu Ser Ala Asp Phe Glu
65                  70                  75                  80
Lys Thr Ile Glu Lys Ser Glu Gln Leu Val Val Leu Ala Asn Trp Phe
                85                  90                  95
Asn Thr Asn Lys Ile Arg Thr Phe Ala Gly Gln Lys Gly Ser Lys Asp
            100                 105                 110
Phe Ser Glu Gln Glu Arg Lys Glu Tyr Val Lys Arg Ile Arg Lys Ile
        115                 120                 125
Cys Asp Val Phe Ala Gln Asn Asn Met Tyr Val Leu Leu Glu Thr His
    130                 135                 140
Pro Asn Thr Leu Thr Asp Thr Leu Pro Ser Thr Ile Glu Leu Leu Glu
145                 150                 155                 160
Glu Val Asn His Pro Asn Leu Lys Ile Asn Leu Asp Phe Leu His Ile
                165                 170                 175
Trp Glu Ser Gly Ala Asp Pro Ile Asp Ser Phe His Arg Leu Lys Pro
            180                 185                 190
Trp Thr Leu His Tyr His Phe Lys Asn Ile Ser Ser Ala Asp Tyr Leu
        195                 200                 205
His Val Phe Glu Pro Asn Asn Val Tyr Ala Ala Ala Gly Ser Arg Ile
    210                 215                 220
Gly Met Val Pro Leu Phe Glu Gly Ile Val Asn Tyr Asp Glu Ile Ile
225                 230                 235                 240
Gln Glu Val Arg Asn Thr Asp Leu Phe Ala Ser Leu Glu Trp Phe Gly
                245                 250                 255
His Asn Ser Lys Glu Ile Leu Lys Glu Glu Met Lys Val Leu Ile Asn
            260                 265                 270
Arg Lys Leu Glu Val Val Thr Ser
        275                 280
<210> 9
<211> 1542
<212> DNA
<213> 大肠杆菌
<400> 9
atgcgtctgg aagtcttttg tgaagaccga ctcggtctga cccgcgaatt actcgatcta 60
ctcgtgctaa gaggcattga tttacgcggt attgagattg atcccattgg gcgaatctac 120
ctcaattttg ctgaactgga gtttgagagt ttcagcagtc tgatggccga aatacgccgt 180
attgcgggtg ttaccgatgt gcgtactgtc ccgtggatgc cttccgaacg tgagcatctg 240
gcgttgagcg cgttactgga ggcgttgcct gaacctgtgc tctctgtcga tatgaaaagc 300
aaagtggata tggcgaaccc ggcgagctgt cagctttttg ggcaaaaatt ggatcgcctg 360
cgcaaccata ccgccgcaca attgattaac ggctttaatt ttttacgttg gctggaaagc 420
gaaccgcaag attcgcataa cgagcatgtc gttattaatg ggcagaattt cctgatggag 480
attacgcctg tttatcttca ggatgaaaat gatcaacacg tcctgaccgg tgcggtggtg 540
atgttgcgat caacgattcg tatgggccgc cagttgcaaa atgtcgccgc ccaggacgtc 600
agcgccttca gtcaaattgt cgccgtcagc ccgaaaatga agcatgttgt cgaacaggcg 660
cagaaactgg cgatgctaag cgcgccgctg ctgattacgg gtgacacagg tacaggtaaa 720
gatctctttg cctacgcctg ccatcaggca agccccagag cgggcaaacc ttacctggcg 780
ctgaactgtg cgtctatacc ggaagatgcg gtcgagagtg aactgtttgg tcatgctccg 840
gaagggaaga aaggattctt tgagcaggcg aacggtggtt cggtgctgtt ggatgaaata 900
ggggaaatgt caccacggat gcaggcgaaa ttactgcgtt tccttaatga tggcactttc 960
cgtcgggttg gcgaagacca tgaggtgcat gtcgatgtgc gggtgatttg cgctacgcag 1020
aagaatctgg tcgaactggt gcaaaaaggc atgttccgtg aagatctcta ttatcgtctg 1080
aacgtgttga cgctcaatct gccgccgcta cgtgactgtc cgcaggacat catgccgtta 1140
actgagctgt tcgtcgcccg ctttgccgac gagcagggcg tgccgcgtcc gaaactggcc 1200
gctgacctga atactgtact tacgcgttat gcgtggccgg gaaatgtgcg gcagttaaag 1260
aacgctatct atcgcgcact gacacaactg gacggttatg agctgcgtcc acaggatatt 1320
ttgttgccgg attatgacgc cgcaacggta gccgtgggcg aagatgcgat ggaaggttcg 1380
ctggacgaaa tcaccagccg ttttgaacgc tcggtattaa cccagcttta tcgcaattat 1440
cccagcacgc gcaaactggc aaaacgtctc ggcgtttcac ataccgcgat tgccaataag 1500
ttgcgggaat atggtctgag tcagaagaag aacgaagagt aa 1542
<210> 10
<211> 513
<212> PRT
<213> 大肠杆菌
<400> 10
Met Arg Leu Glu Val Phe Cys Glu Asp Arg Leu Gly Leu Thr Arg Glu
1               5                   10                  15
Leu Leu Asp Leu Leu Val Leu Arg Gly Ile Asp Leu Arg Gly Ile Glu
            20                  25                  30
Ile Asp Pro Ile Gly Arg Ile Tyr Leu Asn Phe Ala Glu Leu Glu Phe
        35                  40                  45
Glu Ser Phe Ser Ser Leu Met Ala Glu Ile Arg Arg Ile Ala Gly Val
    50                  55                  60
Thr Asp Val Arg Thr Val Pro Trp Met Pro Ser Glu Arg Glu His Leu
65                  70                  75                  80
Ala Leu Ser Ala Leu Leu Glu Ala Leu Pro Glu Pro Val Leu Ser Val
                85                  90                  95
Asp Met Lys Ser Lys Val Asp Met Ala Asn Pro Ala Ser Cys Gln Leu
            100                 105                 110
Phe Gly Gln Lys Leu Asp Arg Leu Arg Asn His Thr Ala Ala Gln Leu
        115                 120                 125
Ile Asn Gly Phe Asn Phe Leu Arg Trp Leu Glu Ser Glu Pro Gln Asp
    130                 135                 140
Ser His Asn Glu His Val Val Ile Asn Gly Gln Asn Phe Leu Met Glu
145                 150                 155                 160
Ile Thr Pro Val Tyr Leu Gln Asp Glu Asn Asp Gln His Val Leu Thr
                165                 170                 175
Gly Ala Val Val Met Leu Arg Ser Thr Ile Arg Met Gly Arg Gln Leu
            180                 185                 190
Gln Asn Val Ala Ala Gln Asp Val Ser Ala Phe Ser Gln Ile Val Ala
        195                 200                 205
Val Ser Pro Lys Met Lys His Val Val Glu Gln Ala Gln Lys Leu Ala
    210                 215                 220
Met Leu Ser Ala Pro Leu Leu Ile Thr Gly Asp Thr Gly Thr Gly Lys
225                 230                 235                 240
Asp Leu Phe Ala Tyr Ala Cys His Gln Ala Ser Pro Arg Ala Gly Lys
                245                 250                 255
Pro Tyr Leu Ala Leu Asn Cys Ala Ser Ile Pro Glu Asp Ala Val Glu
            260                 265                 270
Ser Glu Leu Phe Gly His Ala Pro Glu Gly Lys Lys Gly Phe Phe Glu
        275                 280                 285
Gln Ala Asn Gly Gly Ser Val Leu Leu Asp Glu Ile Gly Glu Met Ser
    290                 295                 300
Pro Arg Met Gln Ala Lys Leu Leu Arg Phe Leu Asn Asp Gly Thr Phe
305                 310                 315                 320
Arg Arg Val Gly Glu Asp His Glu Val His Val Asp Val Arg Val Ile
                325                 330                 335
Cys Ala Thr Gln Lys Asn Leu Val Glu Leu Val Gln Lys Gly Met Phe
            340                 345                 350
Arg Glu Asp Leu Tyr Tyr Arg Leu Asn Val Leu Thr Leu Asn Leu Pro
        355                 360                 365
Pro Leu Arg Asp Cys Pro Gln Asp Ile Met Pro Leu Thr Glu Leu Phe
    370                 375                 380
Val Ala Arg Phe Ala Asp Glu Gln Gly Val Pro Arg Pro Lys Leu Ala
385                 390                 395                 400
Ala Asp Leu Asn Thr Val Leu Thr Arg Tyr Ala Trp Pro Gly Asn Val
                405                 410                 415
Arg Gln Leu Lys Asn Ala Ile Tyr Arg Ala Leu Thr Gln Leu Asp Gly
            420                 425                 430
Tyr Glu Leu Arg Pro Gln Asp Ile Leu Leu Pro Asp Tyr Asp Ala Ala
        435                 440                 445
Thr Val Ala Val Gly Glu Asp Ala Met Glu Gly Ser Leu Asp Glu Ile
    450                 455                 460
Thr Ser Arg Phe Glu Arg Ser Val Leu Thr Gln Leu Tyr Arg Asn Tyr
465                 470                 475                 480
Pro Ser Thr Arg Lys Leu Ala Lys Arg Leu Gly Val Ser His Thr Ala
                485                 490                 495
Ile Ala Asn Lys Leu Arg Glu Tyr Gly Leu Ser Gln Lys Lys Asn Glu
            500                 505                 510
Glu
<210> 11
<211> 2304
<212> DNA
<213> 智人
<400> 11
cggcctgcgt ccgccaccgg aagcgccctc ctaatccccg cagcgccacc gccattgccg 60
ccatcgtcgt ggggcttctg gggcagctag ggctgcccgc cgcgctgcct gcgccggacc 120
ggggcgggtc cagtcccggg cgggccgtcg cgggagagaa ataacatctg ctttgctgcc 180
gagctcagag gagaccccag acccctcccg cagccagagg gctggagcct gctcagaggt 240
gctttgaaga tgccggaggc cccgcctctg ctgttggcag ctgtgttgct gggcctggtg 300
ctgctggtgg tgctgctgct gcttctgagg cactggggct ggggcctgtg ccttatcggc 360
tggaacgagt tcatcctgca gcccatccac aacctgctca tgggtgacac caaggagcag 420
cgcatcctga accacgtgct gcagcatgcg gagcccggga acgcacagag cgtgctggag 480
gccattgaca cctactgcga gcagaaggag tgggccatga acgtgggcga caagaaaggc 540
aagatcgtgg acgccgtgat tcaggagcac cagccctccg tgctgctgga gctgggggcc 600
tactgtggct actcagctgt gcgcatggcc cgcctgctgt caccaggggc gaggctcatc 660
accatcgaga tcaaccccga ctgtgccgcc atcacccagc ggatggtgga tttcgctggc 720
gtgaaggaca aggtcaccct tgtggttgga gcgtcccagg acatcatccc ccagctgaag 780
aagaagtatg atgtggacac actggacatg gtcttcctcg accactggaa ggaccggtac 840
ctgccggaca cgcttctctt ggaggaatgt ggcctgctgc ggaaggggac agtgctactg 900
gctgacaacg tgatctgccc aggtgcgcca gacttcctag cacacgtgcg cgggagcagc 960
tgctttgagt gcacacacta ccaatcgttc ctggaataca gggaggtggt ggacggcctg 1020
gagaaggcca tctacaaggg cccaggcagc gaagcagggc cctgactgcc cccccggccc 1080
ccctctcggg ctctctcacc cagcctggta ctgaaggtgc cagacgtgct cctgctgacc 1140
ttctgcggct ccgggctgtg tcctaaatgc aaagcacacc tcggccgagg cctgcgccct 1200
gacatgctaa cctctctgaa ctgcaacact ggattgttct tttttaagac tcaatcatga 1260
cttctttact aacactggct agctatatta tcttatatac taatatcatg ttttaaaaat 1320
ataaaataga aattaagaat ctaaatattt agatataact cgacttagta catccttctc 1380
aactgccatt cccctgctgc ccttgacttg ggcaccaaac attcaaagct ccccttgacg 1440
gacgctaacg ctaagggcgg ggcccctagc tggctgggtt ctgggtggca cgcctggccc 1500
actggcctcc cagccacagt ggtgcagagg tcagccctcc tgcagctagg ccaggggcac 1560
ctgttagccc catggggacg actgccggcc tgggaaacga agaggagtca gccagcattc 1620
acacctttct gaccaagcag gcgctgggga caggtggacc ccgcagcagc accagcccct 1680
ctgggcccca tgtggcacag agtggaagca tctccttccc tactccccac tgggccttgc 1740
ttacagaaga ggcaatggct cagaccagct cccgcatccc tgtagttgcc tccctggccc 1800
atgagtgagg atgcagtgct ggtttctgcc cacctacacc tagagctgtc cccatctcct 1860
ccaaggggtc agactgctag ccacctcaga ggctccaagg gcccagttcc caggcccagg 1920
acaggaatca accctgtgct agctgagttc acctgcaccg agaccagccc ctagccaaga 1980
ttctactcct gggctcaagg cctggctagc ccccagccag cccactccta tggatagaca 2040
gaccagtgag cccaagtgga caagtttggg gccacccagg gaccagaaac agagcctctg 2100
caggacacag cagatgggca cctgggacca cctccaccca gggccctgcc ccagacgcgc 2160
agaggcccga cacaagggag aagccagcca cttgtgccag acctgagtgg cagaaagcaa 2220
aaagttcctt tgctgcttta atttttaaat tttcttacaa aaatttaggt gtttaccaat 2280
agtcttattt tggcttattt ttaa 2304
<210> 12
<211> 2262
<212> DNA
<213> 智人
<400> 12
ctcccacggg aggagcaaga acacagaaca gagggggcaa gacagctcca ccaggagtca 60
ggagtgaatc ccctctggga acgaggcact aggaagaaga acttccagcc caggagaaat 120
aacatctgct ttgctgccga gctcagagga gaccccagac ccctcccgca gccagagggc 180
tggagcctgc tcagaggtgc tttgaagatg ccggaggccc cgcctctgct gttggcagct 240
gtgttgctgg gcctggtgct gctggtggtg ctgctgctgc ttctgaggca ctggggctgg 300
ggcctgtgcc ttatcggctg gaacgagttc atcctgcagc ccatccacaa cctgctcatg 360
ggtgacacca aggagcagcg catcctgaac cacgtgctgc agcatgcgga gcccgggaac 420
gcacagagcg tgctggaggc cattgacacc tactgcgagc agaaggagtg ggccatgaac 480
gtgggcgaca agaaaggcaa gatcgtggac gccgtgattc aggagcacca gccctccgtg 540
ctgctggagc tgggggccta ctgtggctac tcagctgtgc gcatggcccg cctgctgtca 600
ccaggggcga ggctcatcac catcgagatc aaccccgact gtgccgccat cacccagcgg 660
atggtggatt tcgctggcgt gaaggacaag gtcacccttg tggttggagc gtcccaggac 720
atcatccccc agctgaagaa gaagtatgat gtggacacac tggacatggt cttcctcgac 780
cactggaagg accggtacct gccggacacg cttctcttgg aggaatgtgg cctgctgcgg 840
aaggggacag tgctactggc tgacaacgtg atctgcccag gtgcgccaga cttcctagca 900
cacgtgcgcg ggagcagctg ctttgagtgc acacactacc aatcgttcct ggaatacagg 960
gaggtggtgg acggcctgga gaaggccatc tacaagggcc caggcagcga agcagggccc 1020
tgactgcccc cccggccccc ctctcgggct ctctcaccca gcctggtact gaaggtgcca 1080
gacgtgctcc tgctgacctt ctgcggctcc gggctgtgtc ctaaatgcaa agcacacctc 1140
ggccgaggcc tgcgccctga catgctaacc tctctgaact gcaacactgg attgttcttt 1200
tttaagactc aatcatgact tctttactaa cactggctag ctatattatc ttatatacta 1260
atatcatgtt ttaaaaatat aaaatagaaa ttaagaatct aaatatttag atataactcg 1320
acttagtaca tccttctcaa ctgccattcc cctgctgccc ttgacttggg caccaaacat 1380
tcaaagctcc ccttgacgga cgctaacgct aagggcgggg cccctagctg gctgggttct 1440
gggtggcacg cctggcccac tggcctccca gccacagtgg tgcagaggtc agccctcctg 1500
cagctaggcc aggggcacct gttagcccca tggggacgac tgccggcctg ggaaacgaag 1560
aggagtcagc cagcattcac acctttctga ccaagcaggc gctggggaca ggtggacccc 1620
gcagcagcac cagcccctct gggccccatg tggcacagag tggaagcatc tccttcccta 1680
ctccccactg ggccttgctt acagaagagg caatggctca gaccagctcc cgcatccctg 1740
tagttgcctc cctggcccat gagtgaggat gcagtgctgg tttctgccca cctacaccta 1800
gagctgtccc catctcctcc aaggggtcag actgctagcc acctcagagg ctccaagggc 1860
ccagttccca ggcccaggac aggaatcaac cctgtgctag ctgagttcac ctgcaccgag 1920
accagcccct agccaagatt ctactcctgg gctcaaggcc tggctagccc ccagccagcc 1980
cactcctatg gatagacaga ccagtgagcc caagtggaca agtttggggc cacccaggga 2040
ccagaaacag agcctctgca ggacacagca gatgggcacc tgggaccacc tccacccagg 2100
gccctgcccc agacgcgcag aggcccgaca caagggagaa gccagccact tgtgccagac 2160
ctgagtggca gaaagcaaaa agttcctttg ctgctttaat ttttaaattt tcttacaaaa 2220
atttaggtgt ttaccaatag tcttattttg gcttattttt aa 2262
<210> 13
<211> 2279
<212> DNA
<213> 智人
<400> 13
tggagataac acggatcgct gtgtacactg tgtgctccgg ttgttgcatc cgagggttga 60
tcggatggtg gttcccatcc agatccaagt cctggcccct gatcacagag aaacacagct 120
ggacattaaa gtgaaataac atctgctttg ctgccgagct cagaggagac cccagacccc 180
tcccgcagcc agagggctgg agcctgctca gaggtgcttt gaagatgccg gaggccccgc 240
ctctgctgtt ggcagctgtg ttgctgggcc tggtgctgct ggtggtgctg ctgctgcttc 300
tgaggcactg gggctggggc ctgtgcctta tcggctggaa cgagttcatc ctgcagccca 360
tccacaacct gctcatgggt gacaccaagg agcagcgcat cctgaaccac gtgctgcagc 420
atgcggagcc cgggaacgca cagagcgtgc tggaggccat tgacacctac tgcgagcaga 480
aggagtgggc catgaacgtg ggcgacaaga aaggcaagat cgtggacgcc gtgattcagg 540
agcaccagcc ctccgtgctg ctggagctgg gggcctactg tggctactca gctgtgcgca 600
tggcccgcct gctgtcacca ggggcgaggc tcatcaccat cgagatcaac cccgactgtg 660
ccgccatcac ccagcggatg gtggatttcg ctggcgtgaa ggacaaggtc acccttgtgg 720
ttggagcgtc ccaggacatc atcccccagc tgaagaagaa gtatgatgtg gacacactgg 780
acatggtctt cctcgaccac tggaaggacc ggtacctgcc ggacacgctt ctcttggagg 840
aatgtggcct gctgcggaag gggacagtgc tactggctga caacgtgatc tgcccaggtg 900
cgccagactt cctagcacac gtgcgcggga gcagctgctt tgagtgcaca cactaccaat 960
cgttcctgga atacagggag gtggtggacg gcctggagaa ggccatctac aagggcccag 1020
gcagcgaagc agggccctga ctgccccccc ggcccccctc tcgggctctc tcacccagcc 1080
tggtactgaa ggtgccagac gtgctcctgc tgaccttctg cggctccggg ctgtgtccta 1140
aatgcaaagc acacctcggc cgaggcctgc gccctgacat gctaacctct ctgaactgca 1200
acactggatt gttctttttt aagactcaat catgacttct ttactaacac tggctagcta 1260
tattatctta tatactaata tcatgtttta aaaatataaa atagaaatta agaatctaaa 1320
tatttagata taactcgact tagtacatcc ttctcaactg ccattcccct gctgcccttg 1380
acttgggcac caaacattca aagctcccct tgacggacgc taacgctaag ggcggggccc 1440
ctagctggct gggttctggg tggcacgcct ggcccactgg cctcccagcc acagtggtgc 1500
agaggtcagc cctcctgcag ctaggccagg ggcacctgtt agccccatgg ggacgactgc 1560
cggcctggga aacgaagagg agtcagccag cattcacacc tttctgacca agcaggcgct 1620
ggggacaggt ggaccccgca gcagcaccag cccctctggg ccccatgtgg cacagagtgg 1680
aagcatctcc ttccctactc cccactgggc cttgcttaca gaagaggcaa tggctcagac 1740
cagctcccgc atccctgtag ttgcctccct ggcccatgag tgaggatgca gtgctggttt 1800
ctgcccacct acacctagag ctgtccccat ctcctccaag gggtcagact gctagccacc 1860
tcagaggctc caagggccca gttcccaggc ccaggacagg aatcaaccct gtgctagctg 1920
agttcacctg caccgagacc agcccctagc caagattcta ctcctgggct caaggcctgg 1980
ctagccccca gccagcccac tcctatggat agacagacca gtgagcccaa gtggacaagt 2040
ttggggccac ccagggacca gaaacagagc ctctgcagga cacagcagat gggcacctgg 2100
gaccacctcc acccagggcc ctgccccaga cgcgcagagg cccgacacaa gggagaagcc 2160
agccacttgt gccagacctg agtggcagaa agcaaaaagt tcctttgctg ctttaatttt 2220
taaattttct tacaaaaatt taggtgttta ccaatagtct tattttggct tatttttaa 2279
<210> 14
<211> 2035
<212> DNA
<213> 智人
<400> 14
gctgttggca gctgtgttgc tgggcctggt gctgctggtg gtgctgctgc tgcttctgag 60
gcactggggc tggggcctgt gccttatcgg ctggaacgag ttcatcctgc agcccatcca 120
caacctgctc atgggtgaca ccaaggagca gcgcatcctg aaccacgtgc tgcagcatgc 180
ggagcccggg aacgcacaga gcgtgctgga ggccattgac acctactgcg agcagaagga 240
gtgggccatg aacgtgggcg acaagaaagg caagatcgtg gacgccgtga ttcaggagca 300
ccagccctcc gtgctgctgg agctgggggc ctactgtggc tactcagctg tgcgcatggc 360
ccgcctgctg tcaccagggg cgaggctcat caccatcgag atcaaccccg actgtgccgc 420
catcacccag cggatggtgg atttcgctgg cgtgaaggac aaggtcaccc ttgtggttgg 480
agcgtcccag gacatcatcc cccagctgaa gaagaagtat gatgtggaca cactggacat 540
ggtcttcctc gaccactgga aggaccggta cctgccggac acgcttctct tggaggaatg 600
tggcctgctg cggaagggga cagtgctact ggctgacaac gtgatctgcc caggtgcgcc 660
agacttccta gcacacgtgc gcgggagcag ctgctttgag tgcacacact accaatcgtt 720
cctggaatac agggaggtgg tggacggcct ggagaaggcc atctacaagg gcccaggcag 780
cgaagcaggg ccctgactgc ccccccggcc cccctctcgg gctctctcac ccagcctggt 840
actgaaggtg ccagacgtgc tcctgctgac cttctgcggc tccgggctgt gtcctaaatg 900
caaagcacac ctcggccgag gcctgcgccc tgacatgcta acctctctga actgcaacac 960
tggattgttc ttttttaaga ctcaatcatg acttctttac taacactggc tagctatatt 1020
atcttatata ctaatatcat gttttaaaaa tataaaatag aaattaagaa tctaaatatt 1080
tagatataac tcgacttagt acatccttct caactgccat tcccctgctg cccttgactt 1140
gggcaccaaa cattcaaagc tccccttgac ggacgctaac gctaagggcg gggcccctag 1200
ctggctgggt tctgggtggc acgcctggcc cactggcctc ccagccacag tggtgcagag 1260
gtcagccctc ctgcagctag gccaggggca cctgttagcc ccatggggac gactgccggc 1320
ctgggaaacg aagaggagtc agccagcatt cacacctttc tgaccaagca ggcgctgggg 1380
acaggtggac cccgcagcag caccagcccc tctgggcccc atgtggcaca gagtggaagc 1440
atctccttcc ctactcccca ctgggccttg cttacagaag aggcaatggc tcagaccagc 1500
tcccgcatcc ctgtagttgc ctccctggcc catgagtgag gatgcagtgc tggtttctgc 1560
ccacctacac ctagagctgt ccccatctcc tccaaggggt cagactgcta gccacctcag 1620
aggctccaag ggcccagttc ccaggcccag gacaggaatc aaccctgtgc tagctgagtt 1680
cacctgcacc gagaccagcc cctagccaag attctactcc tgggctcaag gcctggctag 1740
cccccagcca gcccactcct atggatagac agaccagtga gcccaagtgg acaagtttgg 1800
ggccacccag ggaccagaaa cagagcctct gcaggacaca gcagatgggc acctgggacc 1860
acctccaccc agggccctgc cccagacgcg cagaggcccg acacaaggga gaagccagcc 1920
acttgtgcca gacctgagtg gcagaaagca aaaagttcct ttgctgcttt aatttttaaa 1980
ttttcttaca aaaatttagg tgtttaccaa tagtcttatt ttggcttatt tttaa 2035
<210> 15
<211> 271
<212> PRT
<213> 智人
<400> 15
Met Pro Glu Ala Pro Pro Leu Leu Leu Ala Ala Val Leu Leu Gly Leu
1               5                   10                  15
Val Leu Leu Val Val Leu Leu Leu Leu Leu Arg His Trp Gly Trp Gly
            20                  25                  30
Leu Cys Leu Ile Gly Trp Asn Glu Phe Ile Leu Gln Pro Ile His Asn
        35                  40                  45
Leu Leu Met Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu
    50                  55                  60
Gln His Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp
65                  70                  75                  80
Thr Tyr Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys
                85                  90                  95
Gly Lys Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu
            100                 105                 110
Leu Glu Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg
        115                 120                 125
Leu Leu Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp
    130                 135                 140
Cys Ala Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp
145                 150                 155                 160
Lys Val Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu
                165                 170                 175
Lys Lys Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His
            180                 185                 190
Trp Lys Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly
        195                 200                 205
Leu Leu Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro
    210                 215                 220
Gly Ala Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu
225                 230                 235                 240
Cys Thr His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly
                245                 250                 255
Leu Glu Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro
            260                 265                 270
<210> 16
<211> 221
<212> PRT
<213> 智人
<400> 16
Met Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu Gln His
1               5                   10                  15
Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp Thr Tyr
            20                  25                  30
Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys Gly Lys
        35                  40                  45
Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu Leu Glu
    50                  55                  60
Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg Leu Leu
65                  70                  75                  80
Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp Cys Ala
                85                  90                  95
Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp Lys Val
            100                 105                 110
Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu Lys Lys
        115                 120                 125
Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His Trp Lys
    130                 135                 140
Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly Leu Leu
145                 150                 155                 160
Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro Gly Ala
                165                 170                 175
Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu Cys Thr
            180                 185                 190
His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly Leu Glu
        195                 200                 205
Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro
    210                 215                 220
<210> 17
<211> 3453
<212> DNA
<213> 巴西诺卡菌
<400> 17
ttgttcgccg aggacgagca ggtgaaagcc gcggtgccgg accaggaggt ggtcgaggcg 60
atccgggcgc ccggcctgcg cctggcacag atcatggcca ccgtgatgga gcgctatgcg 120
gaccgccccg cggtgggaca gcgggcgagc gagccggtca ccgagagcgg tcgcaccacc 180
ttccggctgc tcccggaatt cgagaccctg acctaccgcg agctgtgggc gcgcgtccgc 240
gcggtggccg ccgcgtggca cggagatgcc gaaaggcctt tgcgggccgg ggatttcgtt 300
gctctgctgg gtttcgccgg catcgattac ggcaccctcg atctcgcgaa catccatctc 360
ggcctcgtca cggtgccgct gcaatccggc gccacggccc cgcaactcgc cgcgatcctg 420
gccgagacca cgccccgggt gctggccgcg acacccgacc atctcgatat cgccgtcgaa 480
ttgctgaccg ggggagcctc gccggaacgg ctggtggtat tcgactaccg ccccgcggac 540
gacgatcacc gggcggcgct cgagtccgcg cgcagacggt tgagcgacgc gggcagtgcg 600
gtggtggtcg agacgctcga cgcggtccgc gcccgcggca gcgaattgcc ggccgcgccg 660
ctgttcgttc ccgccgcgga cgaggacccg ctggctctgc tcatctacac ctccggcagc 720
accggcacgc ctaagggcgc catgtacacc gaaagactga accgcacgac gtggctgagc 780
ggggcgaaag gcgtcggcct cacgctcggc tacatgccga tgagtcatat tgccgggcgg 840
gcctcgttcg ccggtgtgct ggcccgcggc ggcacggtct acttcaccgc ccgcagcgat 900
atgtcgacgc tgttcgaaga tctggccctg gtgcggccga ccgagatgtt cttcgtcccg 960
cgcgtgtgcg acatgatctt ccagcgctat caggccgaac tgtcgcggcg cgcgcccgcc 1020
gcggccgcga gcccggaact cgagcaggaa ctgaagaccg aactgcgctt gtccgcggtc 1080
ggggaccgct tactcggggc gatcgcgggc agcgcgccgc tgtcggccga gatgcgggag 1140
ttcatggagt cgctgctgga tctggaactg cacgacggct acggctcgac cgaggcgggt 1200
atcggcgtac tgcaagacaa tatcgtccag cgtccgccgg tcatcgatta caagctcgtc 1260
gacgtgccgg aattgggcta cttccggacg gaccagccgc atccccgcgg tgagttgctg 1320
ttgaaaaccg aagggatgat tccgggctac ttccggcggc ccgaggtgac cgcggagatc 1380
ttcgacgagg acggtttcta caggaccggt gacatcgtcg ccgaactcga accggatcgg 1440
ctgatctacc tggaccgccg caacaatgtg ctgaaactgg cccagggcga gttcgtcacg 1500
gtcgcccatc tggaagcggt gttcgcgacc agtccgctga tccggcagat ctacatctac 1560
ggcaacagcg agcgctcgtt cctgctggcg gtgatcgtgc ccaccgcgga cgcgctggcc 1620
gacggtgtca ccgacgcgct gaacacggcg ctgaccgaat ccttgcgaca gctcgcgaaa 1680
gaagccgggc tgcaatccta tgagctgccg cgcgagttcc tggtcgaaac cgaaccgttc 1740
accgtcgaga acggtctgct ctccggtatc gcgaaactgt tgcggcccaa gctcaaggag 1800
cactacggcg agcgactcga gcagctgtac cgcgatatcg aggcgaaccg caacgacgag 1860
ctgatcgagc tgcggcgcac cgcggccgag ctgccggtgc tcgaaaccgt cacgcgggct 1920
gcacgttcga tgctcggact ggccgcgtcg gagttgcggc cggacgcgca tttcaccgat 1980
ctcggcggtg attcactgtc cgcgctgtcg ttttcgaccc tgctgcagga catgctcgag 2040
gtcgaggtcc cggtcggtgt catcgtgagc cccgccaact cgctcgccga tctggcgaaa 2100
tacatcgagg ccgaacggca ttcgggggtg cggcggccga gcctgatctc ggtgcacggt 2160
cccggcaccg agatccgtgc cgccgatctc accctggaca agttcatcga cgagcgcacc 2220
ctcgctgccg cgaaagcggt tccggccgcg ccggcccagg cgcagaccgt cctgctcacc 2280
ggggcgaacg gctatctcgg ccgcttcctg tgcctggaat ggctgcagcg actggaccag 2340
accggcggca cgctggtctg catcgtgcgc ggtaccgacg cggccgccgc gcggaagcgc 2400
ctggatgcgg tgttcgacag cggtgatccg gagctgctcg accactaccg gaagctggcc 2460
gccgagcacc tcgaggtgct cgcgggcgat atcggcgacc cgaatctcgg cctggacgaa 2520
gcgacttggc agcggctcgc cgcgaccgtc gacctgatcg tgcaccccgc cgccctcgtc 2580
aaccatgtgc tgccgtacag ccagctgttc gggccgaatg tggtcggcac cgccgagatc 2640
atccggctgg ccatcaccga gcgccgtaag cccgtgacgt acctgtcgac ggtcgcggtg 2700
gccgcacagg tcgatcccgc cggcttcgac gaggagcgcg atatccggga gatgagcgcg 2760
gtgcgctcca tcgacgccgg gtacgcgaac ggttacggca acagcaagtg ggccggcgag 2820
gtgctgctgc gcgaggccca tgatctgtgc gggctgccgg tcgccgtgtt ccgctcggac 2880
atgatcctgg cgcacagcaa atacgtcggt cagctcaacg tccccgatgt gttcacccgg 2940
ctcatcctga gcctggcgct caccggcatc gcaccgtatt cgttctacgg gacggacagc 3000
gccgggcagc gcaggcgggc ccactacgac ggtctgcccg ccgatttcgt cgccgaggcg 3060
atcaccaccc tcggcgcgcg agccgagtcg gggttccata cctacgacgt gtggaacccg 3120
tacgacgacg gcatctcgct ggacgaattc gtcgactggc tcggcgattt cggcgtgccg 3180
atccagcgga tcgacgacta cgacgaatgg ttccggcgtt tcgagaccgc gatccgcgcg 3240
ctgcccgaaa agcagcgcga tgcttcgctg ctaccgctgc tggacgcaca ccggcggcca 3300
ctgcgcgcgg tgcgcggttc gctgttgccc gccaagaact tccaggcggc ggtgcagtcc 3360
gcgcggatcg gccccgatca ggacatcccg catctttccc cgcagttgat cgacaagtac 3420
gtcaccgacc tgcgccacct cggcctgctc tga 3453
<210> 18
<211> 1150
<212> PRT
<213> 巴西诺卡菌
<400> 18
Met Phe Ala Glu Asp Glu Gln Val Lys Ala Ala Val Pro Asp Gln Glu
1               5                   10                  15
Val Val Glu Ala Ile Arg Ala Pro Gly Leu Arg Leu Ala Gln Ile Met
            20                  25                  30
Ala Thr Val Met Glu Arg Tyr Ala Asp Arg Pro Ala Val Gly Gln Arg
        35                  40                  45
Ala Ser Glu Pro Val Thr Glu Ser Gly Arg Thr Thr Phe Arg Leu Leu
    50                  55                  60
Pro Glu Phe Glu Thr Leu Thr Tyr Arg Glu Leu Trp Ala Arg Val Arg
65                  70                  75                  80
Ala Val Ala Ala Ala Trp His Gly Asp Ala Glu Arg Pro Leu Arg Ala
                85                  90                  95
Gly Asp Phe Val Ala Leu Leu Gly Phe Ala Gly Ile Asp Tyr Gly Thr
            100                 105                 110
Leu Asp Leu Ala Asn Ile His Leu Gly Leu Val Thr Val Pro Leu Gln
        115                 120                 125
Ser Gly Ala Thr Ala Pro Gln Leu Ala Ala Ile Leu Ala Glu Thr Thr
    130                 135                 140
Pro Arg Val Leu Ala Ala Thr Pro Asp His Leu Asp Ile Ala Val Glu
145                 150                 155                 160
Leu Leu Thr Gly Gly Ala Ser Pro Glu Arg Leu Val Val Phe Asp Tyr
                165                 170                 175
Arg Pro Ala Asp Asp Asp His Arg Ala Ala Leu Glu Ser Ala Arg Arg
            180                 185                 190
Arg Leu Ser Asp Ala Gly Ser Ala Val Val Val Glu Thr Leu Asp Ala
        195                 200                 205
Val Arg Ala Arg Gly Ser Glu Leu Pro Ala Ala Pro Leu Phe Val Pro
    210                 215                 220
Ala Ala Asp Glu Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser
225                 230                 235                 240
Thr Gly Thr Pro Lys Gly Ala Met Tyr Thr Glu Arg Leu Asn Arg Thr
                245                 250                 255
Thr Trp Leu Ser Gly Ala Lys Gly Val Gly Leu Thr Leu Gly Tyr Met
            260                 265                 270
Pro Met Ser His Ile Ala Gly Arg Ala Ser Phe Ala Gly Val Leu Ala
        275                 280                 285
Arg Gly Gly Thr Val Tyr Phe Thr Ala Arg Ser Asp Met Ser Thr Leu
    290                 295                 300
Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu Met Phe Phe Val Pro
305                 310                 315                 320
Arg Val Cys Asp Met Ile Phe Gln Arg Tyr Gln Ala Glu Leu Ser Arg
                325                 330                 335
Arg Ala Pro Ala Ala Ala Ala Ser Pro Glu Leu Glu Gln Glu Leu Lys
            340                 345                 350
Thr Glu Leu Arg Leu Ser Ala Val Gly Asp Arg Leu Leu Gly Ala Ile
        355                 360                 365
Ala Gly Ser Ala Pro Leu Ser Ala Glu Met Arg Glu Phe Met Glu Ser
    370                 375                 380
Leu Leu Asp Leu Glu Leu His Asp Gly Tyr Gly Ser Thr Glu Ala Gly
385                 390                 395                 400
Ile Gly Val Leu Gln Asp Asn Ile Val Gln Arg Pro Pro Val Ile Asp
                405                 410                 415
Tyr Lys Leu Val Asp Val Pro Glu Leu Gly Tyr Phe Arg Thr Asp Gln
            420                 425                 430
Pro His Pro Arg Gly Glu Leu Leu Leu Lys Thr Glu Gly Met Ile Pro
        435                 440                 445
Gly Tyr Phe Arg Arg Pro Glu Val Thr Ala Glu Ile Phe Asp Glu Asp
    450                 455                 460
Gly Phe Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Glu Pro Asp Arg
465                 470                 475                 480
Leu Ile Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly
                485                 490                 495
Glu Phe Val Thr Val Ala His Leu Glu Ala Val Phe Ala Thr Ser Pro
            500                 505                 510
Leu Ile Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Glu Arg Ser Phe Leu
        515                 520                 525
Leu Ala Val Ile Val Pro Thr Ala Asp Ala Leu Ala Asp Gly Val Thr
    530                 535                 540
Asp Ala Leu Asn Thr Ala Leu Thr Glu Ser Leu Arg Gln Leu Ala Lys
545                 550                 555                 560
Glu Ala Gly Leu Gln Ser Tyr Glu Leu Pro Arg Glu Phe Leu Val Glu
                565                 570                 575
Thr Glu Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Gly Ile Ala Lys
            580                 585                 590
Leu Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg Leu Glu Gln
        595                 600                 605
Leu Tyr Arg Asp Ile Glu Ala Asn Arg Asn Asp Glu Leu Ile Glu Leu
    610                 615                 620
Arg Arg Thr Ala Ala Glu Leu Pro Val Leu Glu Thr Val Thr Arg Ala
625                 630                 635                 640
Ala Arg Ser Met Leu Gly Leu Ala Ala Ser Glu Leu Arg Pro Asp Ala
                645                 650                 655
His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser Phe Ser
            660                 665                 670
Thr Leu Leu Gln Asp Met Leu Glu Val Glu Val Pro Val Gly Val Ile
        675                 680                 685
Val Ser Pro Ala Asn Ser Leu Ala Asp Leu Ala Lys Tyr Ile Glu Ala
    690                 695                 700
Glu Arg His Ser Gly Val Arg Arg Pro Ser Leu Ile Ser Val His Gly
705                 710                 715                 720
Pro Gly Thr Glu Ile Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Ile
                725                 730                 735
Asp Glu Arg Thr Leu Ala Ala Ala Lys Ala Val Pro Ala Ala Pro Ala
            740                 745                 750
Gln Ala Gln Thr Val Leu Leu Thr Gly Ala Asn Gly Tyr Leu Gly Arg
        755                 760                 765
Phe Leu Cys Leu Glu Trp Leu Gln Arg Leu Asp Gln Thr Gly Gly Thr
    770                 775                 780
Leu Val Cys Ile Val Arg Gly Thr Asp Ala Ala Ala Ala Arg Lys Arg
785                 790                 795                 800
Leu Asp Ala Val Phe Asp Ser Gly Asp Pro Glu Leu Leu Asp His Tyr
                805                 810                 815
Arg Lys Leu Ala Ala Glu His Leu Glu Val Leu Ala Gly Asp Ile Gly
            820                 825                 830
Asp Pro Asn Leu Gly Leu Asp Glu Ala Thr Trp Gln Arg Leu Ala Ala
        835                 840                 845
Thr Val Asp Leu Ile Val His Pro Ala Ala Leu Val Asn His Val Leu
    850                 855                 860
Pro Tyr Ser Gln Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Ile
865                 870                 875                 880
Ile Arg Leu Ala Ile Thr Glu Arg Arg Lys Pro Val Thr Tyr Leu Ser
                885                 890                 895
Thr Val Ala Val Ala Ala Gln Val Asp Pro Ala Gly Phe Asp Glu Glu
            900                 905                 910
Arg Asp Ile Arg Glu Met Ser Ala Val Arg Ser Ile Asp Ala Gly Tyr
        915                 920                 925
Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg
    930                 935                 940
Glu Ala His Asp Leu Cys Gly Leu Pro Val Ala Val Phe Arg Ser Asp
945                 950                 955                 960
Met Ile Leu Ala His Ser Lys Tyr Val Gly Gln Leu Asn Val Pro Asp
                965                 970                 975
Val Phe Thr Arg Leu Ile Leu Ser Leu Ala Leu Thr Gly Ile Ala Pro
            980                 985                 990
Tyr Ser Phe Tyr Gly Thr Asp Ser Ala Gly Gln Arg Arg Arg Ala His
        995                 1000                1005
Tyr Asp Gly Leu Pro Ala Asp Phe Val Ala Glu Ala Ile Thr Thr
    1010                1015                1020
Leu Gly Ala Arg Ala Glu Ser Gly Phe His Thr Tyr Asp Val Trp
    1025                1030                1035
Asn Pro Tyr Asp Asp Gly Ile Ser Leu Asp Glu Phe Val Asp Trp
    1040                1045                1050
Leu Gly Asp Phe Gly Val Pro Ile Gln Arg Ile Asp Asp Tyr Asp
    1055                1060                1065
Glu Trp Phe Arg Arg Phe Glu Thr Ala Ile Arg Ala Leu Pro Glu
    1070                1075                1080
Lys Gln Arg Asp Ala Ser Leu Leu Pro Leu Leu Asp Ala His Arg
    1085                1090                1095
Arg Pro Leu Arg Ala Val Arg Gly Ser Leu Leu Pro Ala Lys Asn
    1100                1105                1110
Phe Gln Ala Ala Val Gln Ser Ala Arg Ile Gly Pro Asp Gln Asp
    1115                1120                1125
Ile Pro His Leu Ser Pro Gln Leu Ile Asp Lys Tyr Val Thr Asp
    1130                1135                1140
Leu Arg His Leu Gly Leu Leu
    1145                1150
<210> 19
<211> 3501
<212> DNA
<213> 巴西诺卡菌
<400> 19
atggcgactg attcgcgaag cgatcggcta cggcgtcgaa ttgcacagtt gttcgccgag 60
gacgagcagg tgaaagccgc ggtgccggac caggaggtgg tcgaggcgat ccgggcgccc 120
ggcctgcgcc tggcacagat catggccacc gtgatggagc gctatgcgga ccgccccgcg 180
gtgggacagc gggcgagcga gccggtcacc gagagcggtc gcaccacctt ccggctgctc 240
ccggaattcg agaccctgac ctaccgcgag ctgtgggcgc gcgtccgcgc ggtggccgcc 300
gcgtggcacg gagatgccga aaggcctttg cgggccgggg atttcgttgc tctgctgggt 360
ttcgccggca tcgattacgg caccctcgat ctcgcgaaca tccatctcgg cctcgtcacg 420
gtgccgctgc aatccggcgc cacggccccg caactcgccg cgatcctggc cgagaccacg 480
ccccgggtgc tggccgcgac acccgaccat ctcgatatcg ccgtcgaatt gctgaccggg 540
ggagcctcgc cggaacggct ggtggtattc gactaccgcc ccgcggacga cgatcaccgg 600
gcggcgctcg agtccgcgcg cagacggttg agcgacgcgg gcagtgcggt ggtggtcgag 660
acgctcgacg cggtccgcgc ccgcggcagc gaattgccgg ccgcgccgct gttcgttccc 720
gccgcggacg aggacccgct ggctctgctc atctacacct ccggcagcac cggcacgcct 780
aagggcgcca tgtacaccga aagactgaac cgcacgacgt ggctgagcgg ggcgaaaggc 840
gtcggcctca cgctcggcta catgccgatg agtcatattg ccgggcgggc ctcgttcgcc 900
ggtgtgctgg cccgcggcgg cacggtctac ttcaccgccc gcagcgatat gtcgacgctg 960
ttcgaagatc tggccctggt gcggccgacc gagatgttct tcgtcccgcg cgtgtgcgac 1020
atgatcttcc agcgctatca ggccgaactg tcgcggcgcg cgcccgccgc ggccgcgagc 1080
ccggaactcg agcaggaact gaagaccgaa ctgcgcttgt ccgcggtcgg ggaccgctta 1140
ctcggggcga tcgcgggcag cgcgccgctg tcggccgaga tgcgggagtt catggagtcg 1200
ctgctggatc tggaactgca cgacggctac ggctcgaccg aggcgggtat cggcgtactg 1260
caagacaata tcgtccagcg tccgccggtc atcgattaca agctcgtcga cgtgccggaa 1320
ttgggctact tccggacgga ccagccgcat ccccgcggtg agttgctgtt gaaaaccgaa 1380
gggatgattc cgggctactt ccggcggccc gaggtgaccg cggagatctt cgacgaggac 1440
ggtttctaca ggaccggtga catcgtcgcc gaactcgaac cggatcggct gatctacctg 1500
gaccgccgca acaatgtgct gaaactggcc cagggcgagt tcgtcacggt cgcccatctg 1560
gaagcggtgt tcgcgaccag tccgctgatc cggcagatct acatctacgg caacagcgag 1620
cgctcgttcc tgctggcggt gatcgtgccc accgcggacg cgctggccga cggtgtcacc 1680
gacgcgctga acacggcgct gaccgaatcc ttgcgacagc tcgcgaaaga agccgggctg 1740
caatcctatg agctgccgcg cgagttcctg gtcgaaaccg aaccgttcac cgtcgagaac 1800
ggtctgctct ccggtatcgc gaaactgttg cggcccaagc tcaaggagca ctacggcgag 1860
cgactcgagc agctgtaccg cgatatcgag gcgaaccgca acgacgagct gatcgagctg 1920
cggcgcaccg cggccgagct gccggtgctc gaaaccgtca cgcgggctgc acgttcgatg 1980
ctcggactgg ccgcgtcgga gttgcggccg gacgcgcatt tcaccgatct cggcggtgat 2040
tcactgtccg cgctgtcgtt ttcgaccctg ctgcaggaca tgctcgaggt cgaggtcccg 2100
gtcggtgtca tcgtgagccc cgccaactcg ctcgccgatc tggcgaaata catcgaggcc 2160
gaacggcatt cgggggtgcg gcggccgagc ctgatctcgg tgcacggtcc cggcaccgag 2220
atccgtgccg ccgatctcac cctggacaag ttcatcgacg agcgcaccct cgctgccgcg 2280
aaagcggttc cggccgcgcc ggcccaggcg cagaccgtcc tgctcaccgg ggcgaacggc 2340
tatctcggcc gcttcctgtg cctggaatgg ctgcagcgac tggaccagac cggcggcacg 2400
ctggtctgca tcgtgcgcgg taccgacgcg gccgccgcgc ggaagcgcct ggatgcggtg 2460
ttcgacagcg gtgatccgga gctgctcgac cactaccgga agctggccgc cgagcacctc 2520
gaggtgctcg cgggcgatat cggcgacccg aatctcggcc tggacgaagc gacttggcag 2580
cggctcgccg cgaccgtcga cctgatcgtg caccccgccg ccctcgtcaa ccatgtgctg 2640
ccgtacagcc agctgttcgg gccgaatgtg gtcggcaccg ccgagatcat ccggctggcc 2700
atcaccgagc gccgtaagcc cgtgacgtac ctgtcgacgg tcgcggtggc cgcacaggtc 2760
gatcccgccg gcttcgacga ggagcgcgat atccgggaga tgagcgcggt gcgctccatc 2820
gacgccgggt acgcgaacgg ttacggcaac agcaagtggg ccggcgaggt gctgctgcgc 2880
gaggcccatg atctgtgcgg gctgccggtc gccgtgttcc gctcggacat gatcctggcg 2940
cacagcaaat acgtcggtca gctcaacgtc cccgatgtgt tcacccggct catcctgagc 3000
ctggcgctca ccggcatcgc accgtattcg ttctacggga cggacagcgc cgggcagcgc 3060
aggcgggccc actacgacgg tctgcccgcc gatttcgtcg ccgaggcgat caccaccctc 3120
ggcgcgcgag ccgagtcggg gttccatacc tacgacgtgt ggaacccgta cgacgacggc 3180
atctcgctgg acgaattcgt cgactggctc ggcgatttcg gcgtgccgat ccagcggatc 3240
gacgactacg acgaatggtt ccggcgtttc gagaccgcga tccgcgcgct gcccgaaaag 3300
cagcgcgatg cttcgctgct accgctgctg gacgcacacc ggcggccact gcgcgcggtg 3360
cgcggttcgc tgttgcccgc caagaacttc caggcggcgg tgcagtccgc gcggatcggc 3420
cccgatcagg acatcccgca tctttccccg cagttgatcg acaagtacgt caccgacctg 3480
cgccacctcg gcctgctctg a 3501
<210> 20
<211> 1166
<212> PRT
<213> 巴西诺卡菌
<400> 20
Met Ala Thr Asp Ser Arg Ser Asp Arg Leu Arg Arg Arg Ile Ala Gln
1               5                   10                  15
Leu Phe Ala Glu Asp Glu Gln Val Lys Ala Ala Val Pro Asp Gln Glu
            20                  25                  30
Val Val Glu Ala Ile Arg Ala Pro Gly Leu Arg Leu Ala Gln Ile Met
        35                  40                  45
Ala Thr Val Met Glu Arg Tyr Ala Asp Arg Pro Ala Val Gly Gln Arg
    50                  55                  60
Ala Ser Glu Pro Val Thr Glu Ser Gly Arg Thr Thr Phe Arg Leu Leu
65                  70                  75                  80
Pro Glu Phe Glu Thr Leu Thr Tyr Arg Glu Leu Trp Ala Arg Val Arg
                85                  90                  95
Ala Val Ala Ala Ala Trp His Gly Asp Ala Glu Arg Pro Leu Arg Ala
            100                 105                 110
Gly Asp Phe Val Ala Leu Leu Gly Phe Ala Gly Ile Asp Tyr Gly Thr
        115                 120                 125
Leu Asp Leu Ala Asn Ile His Leu Gly Leu Val Thr Val Pro Leu Gln
    130                 135                 140
Ser Gly Ala Thr Ala Pro Gln Leu Ala Ala Ile Leu Ala Glu Thr Thr
145                 150                 155                 160
Pro Arg Val Leu Ala Ala Thr Pro Asp His Leu Asp Ile Ala Val Glu
                165                 170                 175
Leu Leu Thr Gly Gly Ala Ser Pro Glu Arg Leu Val Val Phe Asp Tyr
            180                 185                 190
Arg Pro Ala Asp Asp Asp His Arg Ala Ala Leu Glu Ser Ala Arg Arg
        195                 200                 205
Arg Leu Ser Asp Ala Gly Ser Ala Val Val Val Glu Thr Leu Asp Ala
    210                 215                 220
Val Arg Ala Arg Gly Ser Glu Leu Pro Ala Ala Pro Leu Phe Val Pro
225                 230                 235                 240
Ala Ala Asp Glu Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser
                245                 250                 255
Thr Gly Thr Pro Lys Gly Ala Met Tyr Thr Glu Arg Leu Asn Arg Thr
            260                 265                 270
Thr Trp Leu Ser Gly Ala Lys Gly Val Gly Leu Thr Leu Gly Tyr Met
        275                 280                 285
Pro Met Ser His Ile Ala Gly Arg Ala Ser Phe Ala Gly Val Leu Ala
    290                 295                 300
Arg Gly Gly Thr Val Tyr Phe Thr Ala Arg Ser Asp Met Ser Thr Leu
305                 310                 315                 320
Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu Met Phe Phe Val Pro
                325                 330                 335
Arg Val Cys Asp Met Ile Phe Gln Arg Tyr Gln Ala Glu Leu Ser Arg
            340                 345                 350
Arg Ala Pro Ala Ala Ala Ala Ser Pro Glu Leu Glu Gln Glu Leu Lys
        355                 360                 365
Thr Glu Leu Arg Leu Ser Ala Val Gly Asp Arg Leu Leu Gly Ala Ile
    370                 375                 380
Ala Gly Ser Ala Pro Leu Ser Ala Glu Met Arg Glu Phe Met Glu Ser
385                 390                 395                 400
Leu Leu Asp Leu Glu Leu His Asp Gly Tyr Gly Ser Thr Glu Ala Gly
                405                 410                 415
Ile Gly Val Leu Gln Asp Asn Ile Val Gln Arg Pro Pro Val Ile Asp
            420                 425                 430
Tyr Lys Leu Val Asp Val Pro Glu Leu Gly Tyr Phe Arg Thr Asp Gln
        435                 440                 445
Pro His Pro Arg Gly Glu Leu Leu Leu Lys Thr Glu Gly Met Ile Pro
    450                 455                 460
Gly Tyr Phe Arg Arg Pro Glu Val Thr Ala Glu Ile Phe Asp Glu Asp
465                 470                 475                 480
Gly Phe Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Glu Pro Asp Arg
                485                 490                 495
Leu Ile Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly
            500                 505                 510
Glu Phe Val Thr Val Ala His Leu Glu Ala Val Phe Ala Thr Ser Pro
        515                 520                 525
Leu Ile Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Glu Arg Ser Phe Leu
    530                 535                 540
Leu Ala Val Ile Val Pro Thr Ala Asp Ala Leu Ala Asp Gly Val Thr
545                 550                 555                 560
Asp Ala Leu Asn Thr Ala Leu Thr Glu Ser Leu Arg Gln Leu Ala Lys
                565                 570                 575
Glu Ala Gly Leu Gln Ser Tyr Glu Leu Pro Arg Glu Phe Leu Val Glu
            580                 585                 590
Thr Glu Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Gly Ile Ala Lys
        595                 600                 605
Leu Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg Leu Glu Gln
    610                 615                 620
Leu Tyr Arg Asp Ile Glu Ala Asn Arg Asn Asp Glu Leu Ile Glu Leu
625                 630                 635                 640
Arg Arg Thr Ala Ala Glu Leu Pro Val Leu Glu Thr Val Thr Arg Ala
                645                 650                 655
Ala Arg Ser Met Leu Gly Leu Ala Ala Ser Glu Leu Arg Pro Asp Ala
            660                 665                 670
His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser Phe Ser
        675                 680                 685
Thr Leu Leu Gln Asp Met Leu Glu Val Glu Val Pro Val Gly Val Ile
    690                 695                 700
Val Ser Pro Ala Asn Ser Leu Ala Asp Leu Ala Lys Tyr Ile Glu Ala
705                 710                 715                 720
Glu Arg His Ser Gly Val Arg Arg Pro Ser Leu Ile Ser Val His Gly
                725                 730                 735
Pro Gly Thr Glu Ile Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Ile
            740                 745                 750
Asp Glu Arg Thr Leu Ala Ala Ala Lys Ala Val Pro Ala Ala Pro Ala
        755                 760                 765
Gln Ala Gln Thr Val Leu Leu Thr Gly Ala Asn Gly Tyr Leu Gly Arg
    770                 775                 780
Phe Leu Cys Leu Glu Trp Leu Gln Arg Leu Asp Gln Thr Gly Gly Thr
785                 790                 795                 800
Leu Val Cys Ile Val Arg Gly Thr Asp Ala Ala Ala Ala Arg Lys Arg
                805                 810                 815
Leu Asp Ala Val Phe Asp Ser Gly Asp Pro Glu Leu Leu Asp His Tyr
            820                 825                 830
Arg Lys Leu Ala Ala Glu His Leu Glu Val Leu Ala Gly Asp Ile Gly
        835                 840                 845
Asp Pro Asn Leu Gly Leu Asp Glu Ala Thr Trp Gln Arg Leu Ala Ala
    850                 855                 860
Thr Val Asp Leu Ile Val His Pro Ala Ala Leu Val Asn His Val Leu
865                 870                 875                 880
Pro Tyr Ser Gln Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Ile
                885                 890                 895
Ile Arg Leu Ala Ile Thr Glu Arg Arg Lys Pro Val Thr Tyr Leu Ser
            900                 905                 910
Thr Val Ala Val Ala Ala Gln Val Asp Pro Ala Gly Phe Asp Glu Glu
        915                 920                 925
Arg Asp Ile Arg Glu Met Ser Ala Val Arg Ser Ile Asp Ala Gly Tyr
    930                 935                 940
Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg
945                 950                 955                 960
Glu Ala His Asp Leu Cys Gly Leu Pro Val Ala Val Phe Arg Ser Asp
                965                 970                 975
Met Ile Leu Ala His Ser Lys Tyr Val Gly Gln Leu Asn Val Pro Asp
            980                 985                 990
Val Phe Thr Arg Leu Ile Leu Ser Leu Ala Leu Thr Gly Ile Ala Pro
        995                 1000                1005
Tyr Ser Phe Tyr Gly Thr Asp Ser Ala Gly Gln Arg Arg Arg Ala
    1010                1015                1020
His Tyr Asp Gly Leu Pro Ala Asp Phe Val Ala Glu Ala Ile Thr
    1025                1030                1035
Thr Leu Gly Ala Arg Ala Glu Ser Gly Phe His Thr Tyr Asp Val
    1040                1045                1050
Trp Asn Pro Tyr Asp Asp Gly Ile Ser Leu Asp Glu Phe Val Asp
    1055                1060                1065
Trp Leu Gly Asp Phe Gly Val Pro Ile Gln Arg Ile Asp Asp Tyr
    1070                1075                1080
Asp Glu Trp Phe Arg Arg Phe Glu Thr Ala Ile Arg Ala Leu Pro
    1085                1090                1095
Glu Lys Gln Arg Asp Ala Ser Leu Leu Pro Leu Leu Asp Ala His
    1100                1105                1110
Arg Arg Pro Leu Arg Ala Val Arg Gly Ser Leu Leu Pro Ala Lys
    1115                1120                1125
Asn Phe Gln Ala Ala Val Gln Ser Ala Arg Ile Gly Pro Asp Gln
    1130                1135                1140
Asp Ile Pro His Leu Ser Pro Gln Leu Ile Asp Lys Tyr Val Thr
    1145                1150                1155
Asp Leu Arg His Leu Gly Leu Leu
    1160                1165
<210> 21
<211> 621
<212> DNA
<213> 大肠杆菌
<400> 21
atgaaaacta cgcatacctc cctccccttt gccggacata cgctgcattt tgttgagttc 60
gatccggcga atttttgtga gcaggattta ctctggctgc cgcactacgc acaactgcaa 120
cacgctggac gtaaacgtaa aacagagcat ttagccggac ggatcgctgc tgtttatgct 180
ttgcgggaat atggctataa atgtgtgccc gcaatcggcg agctacgcca acctgtctgg 240
cctgcggagg tatacggcag tattagccac tgtgggacta cggcattagc cgtggtatct 300
cgtcaaccga ttggcattga tatagaagaa attttttctg tacaaaccgc aagagaattg 360
acagacaaca ttattacacc agcggaacac gagcgactcg cagactgcgg tttagccttt 420
tctctggcgc tgacactggc attttccgcc aaagagagcg catttaaggc aagtgagatc 480
caaactgatg caggttttct ggactatcag ataattagct ggaataaaca gcaggtcatc 540
attcatcgtg agaatgagat gtttgctgtg cactggcaga taaaagaaaa gatagtcata 600
acgctgtgcc aacacgatta a 621
<210> 22
<211> 206
<212> PRT
<213> 大肠杆菌
<400> 22
Met Lys Thr Thr His Thr Ser Leu Pro Phe Ala Gly His Thr Leu His
1               5                   10                  15
Phe Val Glu Phe Asp Pro Ala Asn Phe Cys Glu Gln Asp Leu Leu Trp
            20                  25                  30
Leu Pro His Tyr Ala Gln Leu Gln His Ala Gly Arg Lys Arg Lys Thr
        35                  40                  45
Glu His Leu Ala Gly Arg Ile Ala Ala Val Tyr Ala Leu Arg Glu Tyr
    50                  55                  60
Gly Tyr Lys Cys Val Pro Ala Ile Gly Glu Leu Arg Gln Pro Val Trp
65                  70                  75                  80
Pro Ala Glu Val Tyr Gly Ser Ile Ser His Cys Gly Thr Thr Ala Leu
                85                  90                  95
Ala Val Val Ser Arg Gln Pro Ile Gly Ile Asp Ile Glu Glu Ile Phe
            100                 105                 110
Ser Val Gln Thr Ala Arg Glu Leu Thr Asp Asn Ile Ile Thr Pro Ala
        115                 120                 125
Glu His Glu Arg Leu Ala Asp Cys Gly Leu Ala Phe Ser Leu Ala Leu
    130                 135                 140
Thr Leu Ala Phe Ser Ala Lys Glu Ser Ala Phe Lys Ala Ser Glu Ile
145                 150                 155                 160
Gln Thr Asp Ala Gly Phe Leu Asp Tyr Gln Ile Ile Ser Trp Asn Lys
                165                 170                 175
Gln Gln Val Ile Ile His Arg Glu Asn Glu Met Phe Ala Val His Trp
            180                 185                 190
Gln Ile Lys Glu Lys Ile Val Ile Thr Leu Cys Gln His Asp
        195                 200                 205
<210> 23
<211> 654
<212> DNA
<213> 谷氨酸棒杆菌
<400> 23
atgctggatg agtctttgtt tccaaattcg gcaaagtttt ctttcattaa aactggcgat 60
gctgttaatt tagaccattt ccatcagttg catccgttgg aaaaggcact ggtagcgcac 120
tcggttgata ttagaaaagc agagtttgga gatgccaggt ggtgtgcaca tcaggcactc 180
caagctttgg gacgagatag cggtgatccc attttgcgtg gggaacgagg aatgccattg 240
tggccttctt cggtgtctgg ttcattgacc cacactgacg gattccgagc tgctgttgtg 300
gcgccacgat tgttggtgcg ttctatggga ttggatgccg aacctgcgga gccgttgccc 360
aaggatgttt tgggttcaat cgctcgggtg ggggagattc ctcaacttaa gcgcttggag 420
gaacaaggtg tgcactgcgc ggatcgcctg ctgttttgtg ccaaggaagc aacatacaaa 480
gcgtggttcc cgctgacgca taggtggctt ggttttgaac aagctgagat cgacttgcgt 540
gatgatggca cttttgtgtc ctatttgctg gttcgaccaa ctccagtgcc gtttatttca 600
ggtaaatggg tactgcgtga tggttatgtc atagctgcga ctgcagtgac ttga 654
<210> 24
<211> 217
<212> PRT
<213> 谷氨酸棒杆菌
<400> 24
Met Leu Asp Glu Ser Leu Phe Pro Asn Ser Ala Lys Phe Ser Phe Ile
1               5                   10                  15
Lys Thr Gly Asp Ala Val Asn Leu Asp His Phe His Gln Leu His Pro
            20                  25                  30
Leu Glu Lys Ala Leu Val Ala His Ser Val Asp Ile Arg Lys Ala Glu
        35                  40                  45
Phe Gly Asp Ala Arg Trp Cys Ala His Gln Ala Leu Gln Ala Leu Gly
    50                  55                  60
Arg Asp Ser Gly Asp Pro Ile Leu Arg Gly Glu Arg Gly Met Pro Leu
65                  70                  75                  80
Trp Pro Ser Ser Val Ser Gly Ser Leu Thr His Thr Asp Gly Phe Arg
                85                  90                  95
Ala Ala Val Val Ala Pro Arg Leu Leu Val Arg Ser Met Gly Leu Asp
            100                 105                 110
Ala Glu Pro Ala Glu Pro Leu Pro Lys Asp Val Leu Gly Ser Ile Ala
        115                 120                 125
Arg Val Gly Glu Ile Pro Gln Leu Lys Arg Leu Glu Glu Gln Gly Val
    130                 135                 140
His Cys Ala Asp Arg Leu Leu Phe Cys Ala Lys Glu Ala Thr Tyr Lys
145                 150                 155                 160
Ala Trp Phe Pro Leu Thr His Arg Trp Leu Gly Phe Glu Gln Ala Glu
                165                 170                 175
Ile Asp Leu Arg Asp Asp Gly Thr Phe Val Ser Tyr Leu Leu Val Arg
            180                 185                 190
Pro Thr Pro Val Pro Phe Ile Ser Gly Lys Trp Val Leu Arg Asp Gly
        195                 200                 205
Tyr Val Ile Ala Ala Thr Ala Val Thr
    210                 215
<210> 25
<211> 1428
<212> DNA
<213> 谷氨酸棒杆菌
<400> 25
atgcgcctgc gtgtctcgag tagtctcctc cccttcctcg tccccaacct cgaccattac 60
ggtcgccctc tcctaaagga gcctggcatg gatatccgcc aaacaattaa cgacacagca 120
atgtcgagat atcagtggtt cattgtattt atcgcagtgc tgctcaacgc actggacggc 180
tttgatgtcc tcgccatgtc ttttactgcg aatgcagtga ccgaagaatt tggactgagt 240
ggcagccagc ttggtgtgct gctgagttcc gcgctgttcg gcatgaccgc tggatctttg 300
ctgttcggtc cgatcggtga ccgtttcggc cgtaagaatg ccctgatgat cgcgctgctg 360
ttcaacgtgg tgggattggt attgtccgcc accgcgcagt ccgcaggcca gttgggcgtg 420
tggcgtttga tcactggtat cggcatcggc ggaatcctcg cctgcatcac agtggtgatc 480
agtgagttct ccaacaacaa aaaccgcggc atggccatgt ccatctacgc tgctggttac 540
ggcatcggcg cgtccttggg cggattcggc gcagcgcagc tcatcccaac atttggatgg 600
cgctccgtgt tcgcagccgg tgcgatcgca actggtatcg ccaccatcgc tactttcttc 660
ttcctgccag aatccgttga ttggctgagc actcgccgcc ctgcgggcgc tcgcgacaag 720
atcaattaca ttgcgcgccg cctgggcaaa gtcggtacct ttgagcttcc aggcgaacaa 780
agcttgtcga cgaaaaaagc cggtctccaa tcgtatgcag tgctcgttaa caaagagaac 840
cgtggaacca gcatcaagct gtgggttgcg ttcggcatcg tgatgttcgg cttctacttc 900
gccaacactt ggaccccgaa gctgctcgtg gaaaccggaa tgtcagaaca gcagggcatc 960
atcggtggtt tgatgttgtc catgggtgga gcattcggtt ccctgctcta cggtttcctc 1020
accaccaagt tcagctcccg aaacacactg atgaccttca tggtgctgtc cggcctgacg 1080
ctgatcctgt tcatttcctc cacctctgtt ccatccatcg cgtttgccag cggcgttgtc 1140
gtgggcatgc tgatcaatgg ttgtgtggct ggtctgtaca ccctgtcccc acagctgtac 1200
tccgctgaag tacgcaccac tggtgtgggc gctgcgattg gtatgggtcg tgtcggtgcg 1260
atttccgcgc cactgctggt gggtagcctg ctggattctg gctggtcccc aacgcagctg 1320
tatgttggtg tggcagtgat tgttattgcc ggtgcaaccg cattgattgg gatgcgcact 1380
caggcagtag ccgtcgaaaa gcagcctgaa gccctagcga ccaaatag 1428
<210> 26
<211> 475
<212> PRT
<213> 谷氨酸棒杆菌
<400> 26
Met Arg Leu Arg Val Ser Ser Ser Leu Leu Pro Phe Leu Val Pro Asn
1               5                   10                  15
Leu Asp His Tyr Gly Arg Pro Leu Leu Lys Glu Pro Gly Met Asp Ile
            20                  25                  30
Arg Gln Thr Ile Asn Asp Thr Ala Met Ser Arg Tyr Gln Trp Phe Ile
        35                  40                  45
Val Phe Ile Ala Val Leu Leu Asn Ala Leu Asp Gly Phe Asp Val Leu
    50                  55                  60
Ala Met Ser Phe Thr Ala Asn Ala Val Thr Glu Glu Phe Gly Leu Ser
65                  70                  75                  80
Gly Ser Gln Leu Gly Val Leu Leu Ser Ser Ala Leu Phe Gly Met Thr
                85                  90                  95
Ala Gly Ser Leu Leu Phe Gly Pro Ile Gly Asp Arg Phe Gly Arg Lys
            100                 105                 110
Asn Ala Leu Met Ile Ala Leu Leu Phe Asn Val Val Gly Leu Val Leu
        115                 120                 125
Ser Ala Thr Ala Gln Ser Ala Gly Gln Leu Gly Val Trp Arg Leu Ile
    130                 135                 140
Thr Gly Ile Gly Ile Gly Gly Ile Leu Ala Cys Ile Thr Val Val Ile
145                 150                 155                 160
Ser Glu Phe Ser Asn Asn Lys Asn Arg Gly Met Ala Met Ser Ile Tyr
                165                 170                 175
Ala Ala Gly Tyr Gly Ile Gly Ala Ser Leu Gly Gly Phe Gly Ala Ala
            180                 185                 190
Gln Leu Ile Pro Thr Phe Gly Trp Arg Ser Val Phe Ala Ala Gly Ala
        195                 200                 205
Ile Ala Thr Gly Ile Ala Thr Ile Ala Thr Phe Phe Phe Leu Pro Glu
    210                 215                 220
Ser Val Asp Trp Leu Ser Thr Arg Arg Pro Ala Gly Ala Arg Asp Lys
225                 230                 235                 240
Ile Asn Tyr Ile Ala Arg Arg Leu Gly Lys Val Gly Thr Phe Glu Leu
                245                 250                 255
Pro Gly Glu Gln Ser Leu Ser Thr Lys Lys Ala Gly Leu Gln Ser Tyr
            260                 265                 270
Ala Val Leu Val Asn Lys Glu Asn Arg Gly Thr Ser Ile Lys Leu Trp
        275                 280                 285
Val Ala Phe Gly Ile Val Met Phe Gly Phe Tyr Phe Ala Asn Thr Trp
    290                 295                 300
Thr Pro Lys Leu Leu Val Glu Thr Gly Met Ser Glu Gln Gln Gly Ile
305                 310                 315                 320
Ile Gly Gly Leu Met Leu Ser Met Gly Gly Ala Phe Gly Ser Leu Leu
                325                 330                 335
Tyr Gly Phe Leu Thr Thr Lys Phe Ser Ser Arg Asn Thr Leu Met Thr
            340                 345                 350
Phe Met Val Leu Ser Gly Leu Thr Leu Ile Leu Phe Ile Ser Ser Thr
        355                 360                 365
Ser Val Pro Ser Ile Ala Phe Ala Ser Gly Val Val Val Gly Met Leu
    370                 375                 380
Ile Asn Gly Cys Val Ala Gly Leu Tyr Thr Leu Ser Pro Gln Leu Tyr
385                 390                 395                 400
Ser Ala Glu Val Arg Thr Thr Gly Val Gly Ala Ala Ile Gly Met Gly
                405                 410                 415
Arg Val Gly Ala Ile Ser Ala Pro Leu Leu Val Gly Ser Leu Leu Asp
            420                 425                 430
Ser Gly Trp Ser Pro Thr Gln Leu Tyr Val Gly Val Ala Val Ile Val
        435                 440                 445
Ile Ala Gly Ala Thr Ala Leu Ile Gly Met Arg Thr Gln Ala Val Ala
    450                 455                 460
Val Glu Lys Gln Pro Glu Ala Leu Ala Thr Lys
465                 470                 475
<210> 27
<211> 1296
<212> DNA
<213> 谷氨酸棒杆菌
<400> 27
gtgtcaacga ccaccccaac ccgcgcaacc aaaagtgtcg gaacagttct cgcactcctg 60
tggttcgcaa ttgtcctcga cggctttgac ctagtcgtcc tgggcgcaac aatcccgtcc 120
atgctggagg atcccgcgtg ggatctcact gctggacagg ccacacagat ttccaccatc 180
ggcctcgtcg gcatgaccat cggcgcactg accattggtt tcttaactga ccgtctgggt 240
cgacgccgcg tcatgctgtt ctctgtggca gtgttttctg tattcaccct cctgctggca 300
ttcaccacca acgtccagct cttcagcctg tggcgtttcc tcgcaggtgt tggccttggt 360
ggagcactcc ccaccgcaat tgccatggtg accgagtttc gccccggcac caaagcgggc 420
tctgcatcaa ctaccttgat gaccggatac cacgtcgggg cagtagcaac cgctttcctt 480
ggtctcttcc ttatcgacgg ctttggttgg cactccatgt tcatcgcagg cgctgtgcca 540
ggactactcc tgctgccact gctgtatttc ttccttccag aatccccgca gtacctcaaa 600
atctccggca agttggatga ggcgcaggca gttgcagcat cttatggact ttccctggat 660
gatgatcttg atcgcgaaca cgaagaagaa cttggcgagt cctcctcact ttcctccctg 720
ttcaagccct cgttccgccg caacaccctg gcgatttggg gcacctcatt catgggactc 780
ctcctggtct acggcctgaa cacatggctg ccacaaatca tgcgccaagc agactacgac 840
atgggtaact ccctgggctt cctcatggtt cttaacatcg gcgcagtgat cggcctttat 900
attgcagggc gaattgccga taagaactcc cctcgcaaaa cagcactcgt atggttcgtg 960
ttctctgcat ttttcctcgc actacttgct gtccggatgc cactgatcgg tctgtatggc 1020
atcgtgctgc tcaccggcat ctttgtgttc agctcccagg tactcatcta cgccttcgtt 1080
ggtgagaatc accctgccaa gatgcgtgca actgccatgg gattctccgc aggaattggt 1140
cgcctcggcg cgatctcggg tccgttgctg ggcggcctgc ttgtcagtgc caaccttgct 1200
tacccatggg gcttcttcgc cttcgctggc gttggactgc tgggcgcgct gattttctcc 1260
gcatcgaaga ctctgaggca tcgcgagaac gcttag 1296
<210> 28
<211> 431
<212> PRT
<213> 谷氨酸棒杆菌
<400> 28
Met Ser Thr Thr Thr Pro Thr Arg Ala Thr Lys Ser Val Gly Thr Val
1               5                   10                  15
Leu Ala Leu Leu Trp Phe Ala Ile Val Leu Asp Gly Phe Asp Leu Val
            20                  25                  30
Val Leu Gly Ala Thr Ile Pro Ser Met Leu Glu Asp Pro Ala Trp Asp
        35                  40                  45
Leu Thr Ala Gly Gln Ala Thr Gln Ile Ser Thr Ile Gly Leu Val Gly
    50                  55                  60
Met Thr Ile Gly Ala Leu Thr Ile Gly Phe Leu Thr Asp Arg Leu Gly
65                  70                  75                  80
Arg Arg Arg Val Met Leu Phe Ser Val Ala Val Phe Ser Val Phe Thr
                85                  90                  95
Leu Leu Leu Ala Phe Thr Thr Asn Val Gln Leu Phe Ser Leu Trp Arg
            100                 105                 110
Phe Leu Ala Gly Val Gly Leu Gly Gly Ala Leu Pro Thr Ala Ile Ala
        115                 120                 125
Met Val Thr Glu Phe Arg Pro Gly Thr Lys Ala Gly Ser Ala Ser Thr
    130                 135                 140
Thr Leu Met Thr Gly Tyr His Val Gly Ala Val Ala Thr Ala Phe Leu
145                 150                 155                 160
Gly Leu Phe Leu Ile Asp Gly Phe Gly Trp His Ser Met Phe Ile Ala
                165                 170                 175
Gly Ala Val Pro Gly Leu Leu Leu Leu Pro Leu Leu Tyr Phe Phe Leu
            180                 185                 190
Pro Glu Ser Pro Gln Tyr Leu Lys Ile Ser Gly Lys Leu Asp Glu Ala
        195                 200                 205
Gln Ala Val Ala Ala Ser Tyr Gly Leu Ser Leu Asp Asp Asp Leu Asp
    210                 215                 220
Arg Glu His Glu Glu Glu Leu Gly Glu Ser Ser Ser Leu Ser Ser Leu
225                 230                 235                 240
Phe Lys Pro Ser Phe Arg Arg Asn Thr Leu Ala Ile Trp Gly Thr Ser
                245                 250                 255
Phe Met Gly Leu Leu Leu Val Tyr Gly Leu Asn Thr Trp Leu Pro Gln
            260                 265                 270
Ile Met Arg Gln Ala Asp Tyr Asp Met Gly Asn Ser Leu Gly Phe Leu
        275                 280                 285
Met Val Leu Asn Ile Gly Ala Val Ile Gly Leu Tyr Ile Ala Gly Arg
    290                 295                 300
Ile Ala Asp Lys Asn Ser Pro Arg Lys Thr Ala Leu Val Trp Phe Val
305                 310                 315                 320
Phe Ser Ala Phe Phe Leu Ala Leu Leu Ala Val Arg Met Pro Leu Ile
                325                 330                 335
Gly Leu Tyr Gly Ile Val Leu Leu Thr Gly Ile Phe Val Phe Ser Ser
            340                 345                 350
Gln Val Leu Ile Tyr Ala Phe Val Gly Glu Asn His Pro Ala Lys Met
        355                 360                 365
Arg Ala Thr Ala Met Gly Phe Ser Ala Gly Ile Gly Arg Leu Gly Ala
    370                 375                 380
Ile Ser Gly Pro Leu Leu Gly Gly Leu Leu Val Ser Ala Asn Leu Ala
385                 390                 395                 400
Tyr Pro Trp Gly Phe Phe Ala Phe Ala Gly Val Gly Leu Leu Gly Ala
                405                 410                 415
Leu Ile Phe Ser Ala Ser Lys Thr Leu Arg His Arg Glu Asn Ala
            420                 425                 430
<210> 29
<211> 1131
<212> DNA
<213> 谷氨酸棒杆菌
<400> 29
atgacactgt ccgaacgcaa gctcaccacc accgccaaga ttcttcccca cccactcaac 60
gcctggtacg tcgccgcttg ggattatgaa gtcacatcta aaaagcccat ggccaggaca 120
atcgccaaca aaccactcgc tttgtaccgc accaaagatg gccgagccgt tgcccttgca 180
gacgcctgct ggcaccgcct cgcaccgcta tccaagggaa aactcgtggg cacagacgga 240
atccaatgcc cttatcacgg cttggagtac aactccgcgg gccgctgcat gaaaatgccc 300
gcgcaggaaa ccctcaaccc gtcagcagcc gtcaactcct accccgtggt ggaagcccac 360
cgctttgtgt gggtgtggct gggcgatccc acattggcag atcccaccca agtacccgat 420
atgcaccaga tgagccaccc cgaatgggca ggcgatggac gcaccatctc cgctgactgc 480
aactaccaat tagtgctgga caacttgatg gacctcaccc acgaagaatt cgtgcactcc 540
tccagcatcg gccaagacga acttagtgaa tcagagttcg tggtcaccca cactgaagat 600
tccgtgacgg tcacccgctg gatgcatgac atagatgcac caccgttttg gcaaaagaac 660
atgaatgata agttcccagg atttgaaggc aaggtggatc gttggcagat catccactac 720
tactaccctt ccaccatctg cattgatgtt ggtgtagcaa aggctggaac cggcgcgcag 780
gaaggcgacc gcagccaggg cgttaatggg tatgtaatga acaccattac cccagattca 840
gatcgttcct ctcattactt ctgggcattc atgcgcaact accgcctgga aagccaaacc 900
atcaccaccc agctgcgcga cggtgtatcc ggtgtattca aagaagacga agacatgctg 960
accgctcagc aagatgccat cgacgccaac accgactatg agttttacag cctcaacatt 1020
gatgccggtg gcatgtgggt gcgccgaatc ctcgaggaag cactctccaa ggaaggccga 1080
ctggatatcc ccaccacatt cccccgcgca acaccgaagc cggaggcata a 1131
<210> 30
<211> 376
<212> PRT
<213> 谷氨酸棒杆菌
<400> 30
Met Thr Leu Ser Glu Arg Lys Leu Thr Thr Thr Ala Lys Ile Leu Pro
1               5                   10                  15
His Pro Leu Asn Ala Trp Tyr Val Ala Ala Trp Asp Tyr Glu Val Thr
            20                  25                  30
Ser Lys Lys Pro Met Ala Arg Thr Ile Ala Asn Lys Pro Leu Ala Leu
        35                  40                  45
Tyr Arg Thr Lys Asp Gly Arg Ala Val Ala Leu Ala Asp Ala Cys Trp
    50                  55                  60
His Arg Leu Ala Pro Leu Ser Lys Gly Lys Leu Val Gly Thr Asp Gly
65                  70                  75                  80
Ile Gln Cys Pro Tyr His Gly Leu Glu Tyr Asn Ser Ala Gly Arg Cys
                85                  90                  95
Met Lys Met Pro Ala Gln Glu Thr Leu Asn Pro Ser Ala Ala Val Asn
            100                 105                 110
Ser Tyr Pro Val Val Glu Ala His Arg Phe Val Trp Val Trp Leu Gly
        115                 120                 125
Asp Pro Thr Leu Ala Asp Pro Thr Gln Val Pro Asp Met His Gln Met
    130                 135                 140
Ser His Pro Glu Trp Ala Gly Asp Gly Arg Thr Ile Ser Ala Asp Cys
145                 150                 155                 160
Asn Tyr Gln Leu Val Leu Asp Asn Leu Met Asp Leu Thr His Glu Glu
                165                 170                 175
Phe Val His Ser Ser Ser Ile Gly Gln Asp Glu Leu Ser Glu Ser Glu
            180                 185                 190
Phe Val Val Thr His Thr Glu Asp Ser Val Thr Val Thr Arg Trp Met
        195                 200                 205
His Asp Ile Asp Ala Pro Pro Phe Trp Gln Lys Asn Met Asn Asp Lys
    210                 215                 220
Phe Pro Gly Phe Glu Gly Lys Val Asp Arg Trp Gln Ile Ile His Tyr
225                 230                 235                 240
Tyr Tyr Pro Ser Thr Ile Cys Ile Asp Val Gly Val Ala Lys Ala Gly
                245                 250                 255
Thr Gly Ala Gln Glu Gly Asp Arg Ser Gln Gly Val Asn Gly Tyr Val
            260                 265                 270
Met Asn Thr Ile Thr Pro Asp Ser Asp Arg Ser Ser His Tyr Phe Trp
        275                 280                 285
Ala Phe Met Arg Asn Tyr Arg Leu Glu Ser Gln Thr Ile Thr Thr Gln
    290                 295                 300
Leu Arg Asp Gly Val Ser Gly Val Phe Lys Glu Asp Glu Asp Met Leu
305                 310                 315                 320
Thr Ala Gln Gln Asp Ala Ile Asp Ala Asn Thr Asp Tyr Glu Phe Tyr
                325                 330                 335
Ser Leu Asn Ile Asp Ala Gly Gly Met Trp Val Arg Arg Ile Leu Glu
            340                 345                 350
Glu Ala Leu Ser Lys Glu Gly Arg Leu Asp Ile Pro Thr Thr Phe Pro
        355                 360                 365
Arg Ala Thr Pro Lys Pro Glu Ala
    370                 375
<210> 31
<211> 978
<212> DNA
<213> 谷氨酸棒杆菌
<400> 31
atgaactcgc aatggcaaga tgcacatgtt gtttccagcg aaatcatcgc tgcagacatt 60
cgacgaatag aactatcccc gaaatttgcg attccagtaa aacccggcga acatctcaag 120
atcatggtgc ccctaaaaac tggacaggaa aagagatcgt actccatcgt tgacgctcgt 180
cacgacggtt cgactctcgc cctgagcgta ctcaaaacca gaaactcccg tggaggatct 240
gagttcatgc atacgcttcg agctggagac acagttactg tctccaggcc gtctcaggat 300
tttcctctcc gcgtgggtgc gcctgagtat gtacttgttg ccggcggaat tggaatcaca 360
gcgatccgtt caatggcatc tttattaaag aaattgggag caaactaccg cattcatttc 420
gcagcacgca gccttgatgc catggcttac aaagatgagc tcgtggcaga acacggcgac 480
aagctgcacc tgcatctaga ttctgaaggc accaccatcg atgtcccagc attgatcgaa 540
accttaaacc cccacactga gctttatatg tgcggcccca tccgcttgat ggatgccatc 600
cggcgcgcat ggaacacccg cggacttgac cccaccaatc tgcgtttcga aacgtttgga 660
aacagtggat ggttctcccc agaggttttc cacatccaag taccagagct ggggcttcac 720
gccacagtca acaaggatga aagcatgctg gaggctttgc aaaaggctgg ggcgaatatg 780
atgtttgatt gtcgaaaagg cgaatgtggt ttgtgccagg ttcgcgttct agaagtcgat 840
ggccaggttg atcaccgcga tgtgttcttc tctgatcgtc aaaaagaatc cgacgcaaag 900
gcatgcgcct gcgtgtctcg agtagtctcc tccccttcct cgtccccaac ctcgaccatt 960
acggtcgccc tctcctaa 978
<210> 32
<211> 325
<212> PRT
<213> 谷氨酸棒杆菌
<400> 32
Met Asn Ser Gln Trp Gln Asp Ala His Val Val Ser Ser Glu Ile Ile
1               5                   10                  15
Ala Ala Asp Ile Arg Arg Ile Glu Leu Ser Pro Lys Phe Ala Ile Pro
            20                  25                  30
Val Lys Pro Gly Glu His Leu Lys Ile Met Val Pro Leu Lys Thr Gly
        35                  40                  45
Gln Glu Lys Arg Ser Tyr Ser Ile Val Asp Ala Arg His Asp Gly Ser
    50                  55                  60
Thr Leu Ala Leu Ser Val Leu Lys Thr Arg Asn Ser Arg Gly Gly Ser
65                  70                  75                  80
Glu Phe Met His Thr Leu Arg Ala Gly Asp Thr Val Thr Val Ser Arg
                85                  90                  95
Pro Ser Gln Asp Phe Pro Leu Arg Val Gly Ala Pro Glu Tyr Val Leu
            100                 105                 110
Val Ala Gly Gly Ile Gly Ile Thr Ala Ile Arg Ser Met Ala Ser Leu
        115                 120                 125
Leu Lys Lys Leu Gly Ala Asn Tyr Arg Ile His Phe Ala Ala Arg Ser
    130                 135                 140
Leu Asp Ala Met Ala Tyr Lys Asp Glu Leu Val Ala Glu His Gly Asp
145                 150                 155                 160
Lys Leu His Leu His Leu Asp Ser Glu Gly Thr Thr Ile Asp Val Pro
                165                 170                 175
Ala Leu Ile Glu Thr Leu Asn Pro His Thr Glu Leu Tyr Met Cys Gly
            180                 185                 190
Pro Ile Arg Leu Met Asp Ala Ile Arg Arg Ala Trp Asn Thr Arg Gly
        195                 200                 205
Leu Asp Pro Thr Asn Leu Arg Phe Glu Thr Phe Gly Asn Ser Gly Trp
    210                 215                 220
Phe Ser Pro Glu Val Phe His Ile Gln Val Pro Glu Leu Gly Leu His
225                 230                 235                 240
Ala Thr Val Asn Lys Asp Glu Ser Met Leu Glu Ala Leu Gln Lys Ala
                245                 250                 255
Gly Ala Asn Met Met Phe Asp Cys Arg Lys Gly Glu Cys Gly Leu Cys
            260                 265                 270
Gln Val Arg Val Leu Glu Val Asp Gly Gln Val Asp His Arg Asp Val
        275                 280                 285
Phe Phe Ser Asp Arg Gln Lys Glu Ser Asp Ala Lys Ala Cys Ala Cys
    290                 295                 300
Val Ser Arg Val Val Ser Ser Pro Ser Ser Ser Pro Thr Ser Thr Ile
305                 310                 315                 320
Thr Val Ala Leu Ser
                325
<210> 33
<211> 615
<212> DNA
<213> 谷氨酸棒杆菌
<400> 33
atgattgata cagggaagaa cggcgagttc cgctacgagc agtcgaatat catcgatcag 60
aacgaagccg agttcggcat cactccttca cagaccgtgg gcccttacgt ccacatcggt 120
ttgacccttg aaggtgcgga gcatctcgtg gagccaggtt cggaaggcgc ggtgtccttt 180
actgtttccg caactgatgg caacggcgac cccatcgcgg atgccatgtt tgaactgtgg 240
caggccgatc cagagggcat ccacaactct gatttggatc caaaccgcac agcaccagca 300
accgcagatg gcttccgcgg gcttggtcgc gcgatggcaa acgcgcaggg tgaggcaacg 360
ttcaccactt tggttccggg agcattcgca gatgaggcac cacacttcaa ggttggtgtg 420
ttcgcccgtg gcatgctgga gcgtctgtac actcgcgcat acctgccaga cgccgatttg 480
agcaccgacc cagttttggc tgtggtccca gctgatcgac gtgacctcct ggtggctcaa 540
aagaccgatg atggattccg cttcgacatc actgtccagg ctgaagacaa tgaaacccca 600
ttttttggac tctaa 615
<210> 34
<211> 204
<212> PRT
<213> 谷氨酸棒杆菌
<400> 34
Met Ile Asp Thr Gly Lys Asn Gly Glu Phe Arg Tyr Glu Gln Ser Asn
1               5                   10                  15
Ile Ile Asp Gln Asn Glu Ala Glu Phe Gly Ile Thr Pro Ser Gln Thr
            20                  25                  30
Val Gly Pro Tyr Val His Ile Gly Leu Thr Leu Glu Gly Ala Glu His
        35                  40                  45
Leu Val Glu Pro Gly Ser Glu Gly Ala Val Ser Phe Thr Val Ser Ala
    50                  55                  60
Thr Asp Gly Asn Gly Asp Pro Ile Ala Asp Ala Met Phe Glu Leu Trp
65                  70                  75                  80
Gln Ala Asp Pro Glu Gly Ile His Asn Ser Asp Leu Asp Pro Asn Arg
                85                  90                  95
Thr Ala Pro Ala Thr Ala Asp Gly Phe Arg Gly Leu Gly Arg Ala Met
            100                 105                 110
Ala Asn Ala Gln Gly Glu Ala Thr Phe Thr Thr Leu Val Pro Gly Ala
        115                 120                 125
Phe Ala Asp Glu Ala Pro His Phe Lys Val Gly Val Phe Ala Arg Gly
    130                 135                 140
Met Leu Glu Arg Leu Tyr Thr Arg Ala Tyr Leu Pro Asp Ala Asp Leu
145                 150                 155                 160
Ser Thr Asp Pro Val Leu Ala Val Val Pro Ala Asp Arg Arg Asp Leu
                165                 170                 175
Leu Val Ala Gln Lys Thr Asp Asp Gly Phe Arg Phe Asp Ile Thr Val
            180                 185                 190
Gln Ala Glu Asp Asn Glu Thr Pro Phe Phe Gly Leu
        195                 200
<210> 35
<211> 693
<212> DNA
<213> 谷氨酸棒杆菌
<400> 35
atggacatcc cacacttcgc cccgacggga ggcgaatact ccccactgca cttcccggag 60
taccggacca ccatcaagcg caacccaagc aacgatctca tcatggttcc tagtcgcctc 120
ggcgagtcca cgggacctgt cttcggcgac cgcgacttgg gagacatcga caacgacatg 180
accaaggtga acggtggcga ggctatcggc cagcgcatct tcgttcacgg ccgtgtcctc 240
ggtttcgatg gcaagccagt tccgcacacc ttggtcgagg cgtggcaggc aaacgccgca 300
ggccgttacc gccacaagaa tgactcctgg ccagcgccac tggatccaca cttcaacggt 360
gttgcacgta ctctcaccga caaggacggc cagtaccact tctggaccgt tatgccaggt 420
aattaccctt ggggtaacca ccacaacgca tggcgcccgg cgcacattca cttctcgctc 480
tatggtcgtc agtttacgga gcgtctggtc acccagatgt acttcccgaa cgatccattg 540
ttcttccagg atccgatcta caacgcggtg ccaaagggtg cacgtgagcg catgatcgca 600
acgttcgact atgacgagac ccgtgaaaac ttcgcgcttg gttacaagtt cgacatcgtc 660
cttcgtggcc gcaacgccac cccatttgag taa 693
<210> 36
<211> 230
<212> PRT
<213> 谷氨酸棒杆菌
<400> 36
Met Asp Ile Pro His Phe Ala Pro Thr Gly Gly Glu Tyr Ser Pro Leu
1               5                   10                  15
His Phe Pro Glu Tyr Arg Thr Thr Ile Lys Arg Asn Pro Ser Asn Asp
            20                  25                  30
Leu Ile Met Val Pro Ser Arg Leu Gly Glu Ser Thr Gly Pro Val Phe
        35                  40                  45
Gly Asp Arg Asp Leu Gly Asp Ile Asp Asn Asp Met Thr Lys Val Asn
    50                  55                  60
Gly Gly Glu Ala Ile Gly Gln Arg Ile Phe Val His Gly Arg Val Leu
65                  70                  75                  80
Gly Phe Asp Gly Lys Pro Val Pro His Thr Leu Val Glu Ala Trp Gln
                85                  90                  95
Ala Asn Ala Ala Gly Arg Tyr Arg His Lys Asn Asp Ser Trp Pro Ala
            100                 105                 110
Pro Leu Asp Pro His Phe Asn Gly Val Ala Arg Thr Leu Thr Asp Lys
        115                 120                 125
Asp Gly Gln Tyr His Phe Trp Thr Val Met Pro Gly Asn Tyr Pro Trp
    130                 135                 140
Gly Asn His His Asn Ala Trp Arg Pro Ala His Ile His Phe Ser Leu
145                 150                 155                 160
Tyr Gly Arg Gln Phe Thr Glu Arg Leu Val Thr Gln Met Tyr Phe Pro
                165                 170                 175
Asn Asp Pro Leu Phe Phe Gln Asp Pro Ile Tyr Asn Ala Val Pro Lys
            180                 185                 190
Gly Ala Arg Glu Arg Met Ile Ala Thr Phe Asp Tyr Asp Glu Thr Arg
        195                 200                 205
Glu Asn Phe Ala Leu Gly Tyr Lys Phe Asp Ile Val Leu Arg Gly Arg
    210                 215                 220
Asn Ala Thr Pro Phe Glu
225                 230
<210> 37
<211> 1164
<212> DNA
<213> 大肠杆菌
<400> 37
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 38
<211> 387
<212> PRT
<213> 大肠杆菌
<400> 38
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1               5                   10                  15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
            20                  25                  30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
        35                  40                  45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
    50                  55                  60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65                  70                  75                  80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
                85                  90                  95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
            100                 105                 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
        115                 120                 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
    130                 135                 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145                 150                 155                 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
                165                 170                 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
            180                 185                 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
        195                 200                 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
    210                 215                 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225                 230                 235                 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
                245                 250                 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
            260                 265                 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
        275                 280                 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
    290                 295                 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305                 310                 315                 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
                325                 330                 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
            340                 345                 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
        355                 360                 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
    370                 375                 380
Ala Ala Arg
385
<210> 39
<211> 1062
<212> DNA
<213> 谷氨酸棒杆菌
<400> 39
atgagcatcc aagtaaaagc actccagaaa accggccccg aagcaccttt cgaggtcaaa 60
atcattgagc gtcgtgagcc tcgcgctgac gacgtagtta tcgacatcaa agctgccggc 120
atctgccaca gcgatatcca caccatccgc aacgaatggg gcgaggcaca cttcccgctc 180
accgtcggcc acgaaatcgc aggcgttgtc tctgcggttg gctccgatgt aaccaagtgg 240
aaagtcggcg accgcgttgg cgtcggctgc ctagttaact cctgcggcga atgtgaacag 300
tgtgtcgcgg gatttgaaaa caactgcctt cgcggaaacg tcggaaccta caactccgac 360
gacgtcgacg gcaccatcac gcaaggtggc tacgccgaaa aggtagtggt caacgaacgt 420
ttcctctgca gcatcccaga ggaactcgac ttcgatgtcg cagcaccact gctgtgcgca 480
ggcatcacca cctactcccc gatcgctcgc tggaacgtta aagaaggcga caaagtagca 540
gtcatgggcc tcggcgggct cggccacatg ggtgtccaaa tcgccgcagc caagggcgct 600
gacgttaccg ttctgtcccg ttccctgcgc aaggctgaac ttgccaagga actcggcgca 660
gctcgcacgc ttgcgacttc tgatgaggat ttcttcaccg aacacgccgg tgaattcgac 720
ttcatcctca acaccattag cgcatccatc ccagtcgaca agtacctgag ccttctcaag 780
ccacacggtg tcatggctgt tgtcggtctg ccaccagaga agcagccact gagcttcggt 840
gcgctcatcg gcggcggaaa agtcctcacc ggatccaaca ttggcggcat ccctgaaacc 900
caggaaatgc tcgacttctg tgcaaaacac ggcctcggcg cgatgatcga aactgtcggc 960
gtcaacgatg ttgatgcagc ctacgaccgc gttgttgccg gcgacgttca gttccgcgtt 1020
gtcattgata ctgcttcgtt tgcagaggta gaggcggttt ag 1062
<210> 40
<211> 353
<212> PRT
<213> 谷氨酸棒杆菌
<400> 40
Met Ser Ile Gln Val Lys Ala Leu Gln Lys Thr Gly Pro Glu Ala Pro
1               5                   10                  15
Phe Glu Val Lys Ile Ile Glu Arg Arg Glu Pro Arg Ala Asp Asp Val
            20                  25                  30
Val Ile Asp Ile Lys Ala Ala Gly Ile Cys His Ser Asp Ile His Thr
        35                  40                  45
Ile Arg Asn Glu Trp Gly Glu Ala His Phe Pro Leu Thr Val Gly His
    50                  55                  60
Glu Ile Ala Gly Val Val Ser Ala Val Gly Ser Asp Val Thr Lys Trp
65                  70                  75                  80
Lys Val Gly Asp Arg Val Gly Val Gly Cys Leu Val Asn Ser Cys Gly
                85                  90                  95
Glu Cys Glu Gln Cys Val Ala Gly Phe Glu Asn Asn Cys Leu Arg Gly
            100                 105                 110
Asn Val Gly Thr Tyr Asn Ser Asp Asp Val Asp Gly Thr Ile Thr Gln
        115                 120                 125
Gly Gly Tyr Ala Glu Lys Val Val Val Asn Glu Arg Phe Leu Cys Ser
    130                 135                 140
Ile Pro Glu Glu Leu Asp Phe Asp Val Ala Ala Pro Leu Leu Cys Ala
145                 150                 155                 160
Gly Ile Thr Thr Tyr Ser Pro Ile Ala Arg Trp Asn Val Lys Glu Gly
                165                 170                 175
Asp Lys Val Ala Val Met Gly Leu Gly Gly Leu Gly His Met Gly Val
            180                 185                 190
Gln Ile Ala Ala Ala Lys Gly Ala Asp Val Thr Val Leu Ser Arg Ser
        195                 200                 205
Leu Arg Lys Ala Glu Leu Ala Lys Glu Leu Gly Ala Ala Arg Thr Leu
    210                 215                 220
Ala Thr Ser Asp Glu Asp Phe Phe Thr Glu His Ala Gly Glu Phe Asp
225                 230                 235                 240
Phe Ile Leu Asn Thr Ile Ser Ala Ser Ile Pro Val Asp Lys Tyr Leu
                245                 250                 255
Ser Leu Leu Lys Pro His Gly Val Met Ala Val Val Gly Leu Pro Pro
            260                 265                 270
Glu Lys Gln Pro Leu Ser Phe Gly Ala Leu Ile Gly Gly Gly Lys Val
        275                 280                 285
Leu Thr Gly Ser Asn Ile Gly Gly Ile Pro Glu Thr Gln Glu Met Leu
    290                 295                 300
Asp Phe Cys Ala Lys His Gly Leu Gly Ala Met Ile Glu Thr Val Gly
305                 310                 315                 320
Val Asn Asp Val Asp Ala Ala Tyr Asp Arg Val Val Ala Gly Asp Val
                325                 330                 335
Gln Phe Arg Val Val Ile Asp Thr Ala Ser Phe Ala Glu Val Glu Ala
            340                 345                 350
Val
<210> 41
<211> 1113
<212> DNA
<213> 谷氨酸棒杆菌
<400> 41
gtgtccatga gcactgtcgt gcctggaatt gtcgccctgt ccaagggggc accggtagaa 60
aaagtaaacg ttgttgtccc tgatccaggt gctaacgatg tcatcgtcaa gattcaggcc 120
tgcggtgtgt gccacaccga cttggcctac cgcgatggcg atatttcaga tgagttccct 180
tacctcctcg gccacgaggc agcaggtatt gttgaggagg taggcgagtc cgtcacccac 240
gttgaggtcg gcgatttcgt catcttgaac tggcgtgcag tgtgcggcga gtgccgtgca 300
tgtaagaagg gcgagccaaa gtactgcttt aacacccaca acgcatctaa gaagatgacc 360
ctggaagacg gcaccgagct gtccccagca ctgggtattg gcgcgttctt ggaaaagacc 420
ctggtccacg aaggccagtg caccaaggtt aaccctgagg aagatccagc agcagctggc 480
cttctgggtt gcggcatcat ggcaggtctt ggtgctgcgg taaacaccgg tgatattaag 540
cgcggcgagt ccgtggcagt cttcggcctt ggtggcgtgg gcatggcagc tattgctggc 600
gccaagattg ctggtgcatc gaagattatt gctgttgata tcgatgagaa gaagttggag 660
tgggcgaagg aattcggcgc aacccacacc attaattcct ctggtcttgg tggcgagggt 720
gatgcctctg aggtcgtggc aaaggttcgt gagctcactg atggtttcgg tactgacgtc 780
tccatcgatg cggtaggcat catgccgacc tggcagcagg cgttttactc ccgtgatcat 840
gcaggccgca tggtgatggt gggcgttcca aacctgacgt ctcgcgtaga tgttcctgcg 900
attgattttt acggtcgcgg tggctctgtg cgccctgcat ggtacggcga ctgcctgcct 960
gagcgtgatt tcccaactta tgtggatctg cacctgcagg gtcgtttccc gctggataag 1020
tttgtttctg agcgtattgg tcttgatgat gttgaagagg ctttcaacac catgaaggct 1080
ggcgacgtgc tgcgttctgt ggtggagatc taa 1113
<210> 42
<211> 370
<212> PRT
<213> 谷氨酸棒杆菌
<400> 42
Met Ser Met Ser Thr Val Val Pro Gly Ile Val Ala Leu Ser Lys Gly
1               5                   10                  15
Ala Pro Val Glu Lys Val Asn Val Val Val Pro Asp Pro Gly Ala Asn
            20                  25                  30
Asp Val Ile Val Lys Ile Gln Ala Cys Gly Val Cys His Thr Asp Leu
        35                  40                  45
Ala Tyr Arg Asp Gly Asp Ile Ser Asp Glu Phe Pro Tyr Leu Leu Gly
    50                  55                  60
His Glu Ala Ala Gly Ile Val Glu Glu Val Gly Glu Ser Val Thr His
65                  70                  75                  80
Val Glu Val Gly Asp Phe Val Ile Leu Asn Trp Arg Ala Val Cys Gly
                85                  90                  95
Glu Cys Arg Ala Cys Lys Lys Gly Glu Pro Lys Tyr Cys Phe Asn Thr
            100                 105                 110
His Asn Ala Ser Lys Lys Met Thr Leu Glu Asp Gly Thr Glu Leu Ser
        115                 120                 125
Pro Ala Leu Gly Ile Gly Ala Phe Leu Glu Lys Thr Leu Val His Glu
    130                 135                 140
Gly Gln Cys Thr Lys Val Asn Pro Glu Glu Asp Pro Ala Ala Ala Gly
145                 150                 155                 160
Leu Leu Gly Cys Gly Ile Met Ala Gly Leu Gly Ala Ala Val Asn Thr
                165                 170                 175
Gly Asp Ile Lys Arg Gly Glu Ser Val Ala Val Phe Gly Leu Gly Gly
            180                 185                 190
Val Gly Met Ala Ala Ile Ala Gly Ala Lys Ile Ala Gly Ala Ser Lys
        195                 200                 205
Ile Ile Ala Val Asp Ile Asp Glu Lys Lys Leu Glu Trp Ala Lys Glu
    210                 215                 220
Phe Gly Ala Thr His Thr Ile Asn Ser Ser Gly Leu Gly Gly Glu Gly
225                 230                 235                 240
Asp Ala Ser Glu Val Val Ala Lys Val Arg Glu Leu Thr Asp Gly Phe
                245                 250                 255
Gly Thr Asp Val Ser Ile Asp Ala Val Gly Ile Met Pro Thr Trp Gln
            260                 265                 270
Gln Ala Phe Tyr Ser Arg Asp His Ala Gly Arg Met Val Met Val Gly
        275                 280                 285
Val Pro Asn Leu Thr Ser Arg Val Asp Val Pro Ala Ile Asp Phe Tyr
    290                 295                 300
Gly Arg Gly Gly Ser Val Arg Pro Ala Trp Tyr Gly Asp Cys Leu Pro
305                 310                 315                 320
Glu Arg Asp Phe Pro Thr Tyr Val Asp Leu His Leu Gln Gly Arg Phe
                325                 330                 335
Pro Leu Asp Lys Phe Val Ser Glu Arg Ile Gly Leu Asp Asp Val Glu
            340                 345                 350
Glu Ala Phe Asn Thr Met Lys Ala Gly Asp Val Leu Arg Ser Val Val
        355                 360                 365
Glu Ile
    370
<210> 43
<211> 1047
<212> DNA
<213> 谷氨酸棒杆菌
<400> 43
gtgagtttta tgaccactgc tgcaccccaa gaatttaccg ctgctgttgt tgaaaaattc 60
ggtcatgacg tgaccgtgaa ggatattgac cttccaaagc cagggccaca ccaggcattg 120
gtgaaggtac tcacctccgg catctgccac accgacctcc acgccttgga gggcgattgg 180
ccagtaaagc cggaaccacc attcgtacca ggacacgaag gtgtaggtga agttgttgag 240
ctcggaccag gtgaacacga tgtgaaggtc ggcgatattg tcggcaatgc gtggctctgg 300
tcagcgtgcg gcacctgcga atactgcatc acaggcaggg aaactcagtg taacgaagct 360
gagtacggtg gctacaccca aaatggatcc ttcggccagt acatgctggt ggatacccga 420
tacgccgctc gcatcccaga cggcgtggac tacctcgaag cagcgccaat tctgtgtgca 480
ggcgtgactg tctacaaggc actcaaagtc tctgaaaccc gcccgggcca attcatggtg 540
atctccggtg tcggcggact tggccacatc gcagtccaat acgcagcggc gatgggcatg 600
cgtgtcattg cggtagatat tgccgaggac aagctggaac ttgcccgtaa gcacggtgcg 660
gaatttaccg tgaatgcgcg taatgaagat ccaggcgaag ctgtacagaa gtacaccaac 720
ggtggcgcac acggcgtgct tgtgactgca gttcacgagg cagcattcgg ccaggcactg 780
gatatggctc gacgtgcagg aacaattgtg ttcaacggtc tgccaccggg agagttccca 840
gcatccgtgt tcaacatcgt attcaagggc ctgaccatcc gtggatccct cgtgggaacc 900
cgccaagact tggccgaagc gctcgatttc tttgcacgcg gactaatcaa gccaaccgtg 960
agtgagtgct ccctcgatga ggtcaatgga gttcttgacc gcatgcgaaa cggcaagatc 1020
gatggtcgtg tggcgattcg tttctaa 1047
<210> 44
<211> 348
<212> PRT
<213> 谷氨酸棒杆菌
<400> 44
Met Ser Phe Met Thr Thr Ala Ala Pro Gln Glu Phe Thr Ala Ala Val
1               5                   10                  15
Val Glu Lys Phe Gly His Asp Val Thr Val Lys Asp Ile Asp Leu Pro
            20                  25                  30
Lys Pro Gly Pro His Gln Ala Leu Val Lys Val Leu Thr Ser Gly Ile
        35                  40                  45
Cys His Thr Asp Leu His Ala Leu Glu Gly Asp Trp Pro Val Lys Pro
    50                  55                  60
Glu Pro Pro Phe Val Pro Gly His Glu Gly Val Gly Glu Val Val Glu
65                  70                  75                  80
Leu Gly Pro Gly Glu His Asp Val Lys Val Gly Asp Ile Val Gly Asn
                85                  90                  95
Ala Trp Leu Trp Ser Ala Cys Gly Thr Cys Glu Tyr Cys Ile Thr Gly
            100                 105                 110
Arg Glu Thr Gln Cys Asn Glu Ala Glu Tyr Gly Gly Tyr Thr Gln Asn
        115                 120                 125
Gly Ser Phe Gly Gln Tyr Met Leu Val Asp Thr Arg Tyr Ala Ala Arg
    130                 135                 140
Ile Pro Asp Gly Val Asp Tyr Leu Glu Ala Ala Pro Ile Leu Cys Ala
145                 150                 155                 160
Gly Val Thr Val Tyr Lys Ala Leu Lys Val Ser Glu Thr Arg Pro Gly
                165                 170                 175
Gln Phe Met Val Ile Ser Gly Val Gly Gly Leu Gly His Ile Ala Val
            180                 185                 190
Gln Tyr Ala Ala Ala Met Gly Met Arg Val Ile Ala Val Asp Ile Ala
        195                 200                 205
Glu Asp Lys Leu Glu Leu Ala Arg Lys His Gly Ala Glu Phe Thr Val
    210                 215                 220
Asn Ala Arg Asn Glu Asp Pro Gly Glu Ala Val Gln Lys Tyr Thr Asn
225                 230                 235                 240
Gly Gly Ala His Gly Val Leu Val Thr Ala Val His Glu Ala Ala Phe
                245                 250                 255
Gly Gln Ala Leu Asp Met Ala Arg Arg Ala Gly Thr Ile Val Phe Asn
            260                 265                 270
Gly Leu Pro Pro Gly Glu Phe Pro Ala Ser Val Phe Asn Ile Val Phe
        275                 280                 285
Lys Gly Leu Thr Ile Arg Gly Ser Leu Val Gly Thr Arg Gln Asp Leu
    290                 295                 300
Ala Glu Ala Leu Asp Phe Phe Ala Arg Gly Leu Ile Lys Pro Thr Val
305                 310                 315                 320
Ser Glu Cys Ser Leu Asp Glu Val Asn Gly Val Leu Asp Arg Met Arg
                325                 330                 335
Asn Gly Lys Ile Asp Gly Arg Val Ala Ile Arg Phe
            340                 345
<210> 45
<211> 1020
<212> DNA
<213> 谷氨酸棒杆菌
<400> 45
atgcccaaat acattgccat gcaggtatcc gaatccggtg caccgttagc cgcgaatctc 60
gtgcaacctg ctccgttgaa atcgagggaa gtccgcgtgg aaatcgctgc tagtggtgtg 120
tgccatgcag atattggcac ggcagcagca tcggggaagc acactgtttt tcctgttacc 180
cctggtcatg agattgcagg aaccatcgcg gaaattggtg aaaacgtatc tcggtggacg 240
gttggtgatc gcgttgcaat cggttggttt ggtggcaatt gcggtgactg cgctttttgt 300
cgtgcaggtg atcctgtgca ttgcagagag cggaagattc ctggcgtttc ttatgcgggt 360
ggttgggcac agaatattgt tgttccagcg gaggctcttg ctgcgattcc agatggcatg 420
gacttttacg aggccgcccc gatgggctgc gcaggtgtga caacattcaa tgcgttgcga 480
aacctgaagc tggatcccgg tgcggctgtc gcggtctttg gaatcggcgg tttagtgcgc 540
ctagctattc agtttgctgc gaaaatgggt tatcgaacca tcaccatcgc ccgcggttta 600
gagcgtgagg agctagctag gcaacttggc gccaaccact acatcgatag caatgatctg 660
caccctggcc aggcgttatt tgaacttggc ggggctgact tgatcttgtc tactgcgtcc 720
accacggagc ctctttcgga gttgtctacc ggtctttcta ttggcgggca gctaaccatt 780
atcggagttg atgggggaga tatcaccgtt tcggcagccc aattgatgat gaaccgtcag 840
atcatcacag gtcacctcac tggaagtgcg aatgacacgg aacagactat gaaatttgct 900
catctccatg gcgtgaaacc gcttattgaa cggatgcctc tcgatcaagc caacgaggct 960
attgcacgta tttcagctgg taaaccacgt ttccgtattg tcttggagcc gaattcataa 1020
<210> 46
<211> 339
<212> PRT
<213> 谷氨酸棒杆菌
<400> 46
Met Pro Lys Tyr Ile Ala Met Gln Val Ser Glu Ser Gly Ala Pro Leu
1               5                   10                  15
Ala Ala Asn Leu Val Gln Pro Ala Pro Leu Lys Ser Arg Glu Val Arg
            20                  25                  30
Val Glu Ile Ala Ala Ser Gly Val Cys His Ala Asp Ile Gly Thr Ala
        35                  40                  45
Ala Ala Ser Gly Lys His Thr Val Phe Pro Val Thr Pro Gly His Glu
    50                  55                  60
Ile Ala Gly Thr Ile Ala Glu Ile Gly Glu Asn Val Ser Arg Trp Thr
65                  70                  75                  80
Val Gly Asp Arg Val Ala Ile Gly Trp Phe Gly Gly Asn Cys Gly Asp
                85                  90                  95
Cys Ala Phe Cys Arg Ala Gly Asp Pro Val His Cys Arg Glu Arg Lys
            100                 105                 110
Ile Pro Gly Val Ser Tyr Ala Gly Gly Trp Ala Gln Asn Ile Val Val
        115                 120                 125
Pro Ala Glu Ala Leu Ala Ala Ile Pro Asp Gly Met Asp Phe Tyr Glu
    130                 135                 140
Ala Ala Pro Met Gly Cys Ala Gly Val Thr Thr Phe Asn Ala Leu Arg
145                 150                 155                 160
Asn Leu Lys Leu Asp Pro Gly Ala Ala Val Ala Val Phe Gly Ile Gly
                165                 170                 175
Gly Leu Val Arg Leu Ala Ile Gln Phe Ala Ala Lys Met Gly Tyr Arg
            180                 185                 190
Thr Ile Thr Ile Ala Arg Gly Leu Glu Arg Glu Glu Leu Ala Arg Gln
        195                 200                 205
Leu Gly Ala Asn His Tyr Ile Asp Ser Asn Asp Leu His Pro Gly Gln
    210                 215                 220
Ala Leu Phe Glu Leu Gly Gly Ala Asp Leu Ile Leu Ser Thr Ala Ser
225                 230                 235                 240
Thr Thr Glu Pro Leu Ser Glu Leu Ser Thr Gly Leu Ser Ile Gly Gly
                245                 250                 255
Gln Leu Thr Ile Ile Gly Val Asp Gly Gly Asp Ile Thr Val Ser Ala
            260                 265                 270
Ala Gln Leu Met Met Asn Arg Gln Ile Ile Thr Gly His Leu Thr Gly
        275                 280                 285
Ser Ala Asn Asp Thr Glu Gln Thr Met Lys Phe Ala His Leu His Gly
    290                 295                 300
Val Lys Pro Leu Ile Glu Arg Met Pro Leu Asp Gln Ala Asn Glu Ala
305                 310                 315                 320
Ile Ala Arg Ile Ser Ala Gly Lys Pro Arg Phe Arg Ile Val Leu Glu
                325                 330                 335
Pro Asn Ser
<210> 47
<211> 879
<212> DNA
<213> 谷氨酸棒杆菌
<400> 47
atgcaaaccc ttgctgctat tgttcgtgcc acgaagcaac cttttgagat caccaccatt 60
gatctggatg caccacgacc agatgaagtt caaatccgtg ttattgctgc cggagtgcgc 120
cacactgacg caattgttcg tgatcagatt tacccaactt ttcttcccgc agttttcggc 180
cacgaaggcg ccggagtagt tgtcgccgtg ggttctgcag tcacctcggt gaaaccagat 240
gacaaggtag tgctgggatt caactcttgt ggccagtgct tgaagtgttt gggcggtaag 300
cctgcgtact gtgagaaatt ctatgaccgc aacttcgcat gcacccgcga tgccgggcac 360
actactttgt ttacccgtgc aacaaaagag caggcagagg ccatcatcga cacccttgat 420
gatgttttct acgatgcgga tgcgggtttc ctggcatacc cagcaactcc cccagaggct 480
tcgggagtaa gcgtgttggt tgtcgcggct ggtacctctg atctccccca agcaaaggaa 540
gcactacaca ctgcctccta cttggggcgc tccacctcac tgattgttga ttttggagtg 600
gctggcatcc accgcctgct ttcatacgaa gaagaactcc gcgctgcggg cgtgctcatc 660
gttgccgctg gaatggatgg tgcgctaccc ggagttgtcg caggcttagt gtccgcacct 720
gtcgtcgcac tgccaacctc cgtgggatac ggcgcaggtg ctggaggaat cgcaccactt 780
ctgaccatgc ttaacgcctg cgcgccggga gttggagtgg tcaacattga taacggctat 840
ggagcaggac acctggctgc gcagattgcg gcgaggtaa 879
<210> 48
<211> 292
<212> PRT
<213> 谷氨酸棒杆菌
<400> 48
Met Gln Thr Leu Ala Ala Ile Val Arg Ala Thr Lys Gln Pro Phe Glu
1               5                   10                  15
Ile Thr Thr Ile Asp Leu Asp Ala Pro Arg Pro Asp Glu Val Gln Ile
            20                  25                  30
Arg Val Ile Ala Ala Gly Val Arg His Thr Asp Ala Ile Val Arg Asp
        35                  40                  45
Gln Ile Tyr Pro Thr Phe Leu Pro Ala Val Phe Gly His Glu Gly Ala
    50                  55                  60
Gly Val Val Val Ala Val Gly Ser Ala Val Thr Ser Val Lys Pro Asp
65                  70                  75                  80
Asp Lys Val Val Leu Gly Phe Asn Ser Cys Gly Gln Cys Leu Lys Cys
                85                  90                  95
Leu Gly Gly Lys Pro Ala Tyr Cys Glu Lys Phe Tyr Asp Arg Asn Phe
            100                 105                 110
Ala Cys Thr Arg Asp Ala Gly His Thr Thr Leu Phe Thr Arg Ala Thr
        115                 120                 125
Lys Glu Gln Ala Glu Ala Ile Ile Asp Thr Leu Asp Asp Val Phe Tyr
    130                 135                 140
Asp Ala Asp Ala Gly Phe Leu Ala Tyr Pro Ala Thr Pro Pro Glu Ala
145                 150                 155                 160
Ser Gly Val Ser Val Leu Val Val Ala Ala Gly Thr Ser Asp Leu Pro
                165                 170                 175
Gln Ala Lys Glu Ala Leu His Thr Ala Ser Tyr Leu Gly Arg Ser Thr
            180                 185                 190
Ser Leu Ile Val Asp Phe Gly Val Ala Gly Ile His Arg Leu Leu Ser
        195                 200                 205
Tyr Glu Glu Glu Leu Arg Ala Ala Gly Val Leu Ile Val Ala Ala Gly
    210                 215                 220
Met Asp Gly Ala Leu Pro Gly Val Val Ala Gly Leu Val Ser Ala Pro
225                 230                 235                 240
Val Val Ala Leu Pro Thr Ser Val Gly Tyr Gly Ala Gly Ala Gly Gly
                245                 250                 255
Ile Ala Pro Leu Leu Thr Met Leu Asn Ala Cys Ala Pro Gly Val Gly
            260                 265                 270
Val Val Asn Ile Asp Asn Gly Tyr Gly Ala Gly His Leu Ala Ala Gln
        275                 280                 285
Ile Ala Ala Arg
    290
<210> 49
<211> 819
<212> DNA
<213> 大肠杆菌
<400> 49
atggaaacct atgctgtttt tggtaatccg atagcccaca gcaaatcgcc attcattcat 60
cagcaatttg ctcagcaact gaatattgaa catccctatg ggcgcgtgtt ggcacccatc 120
aatgatttca tcaacacact gaacgctttc tttagtgctg gtggtaaagg tgcgaatgtg 180
acggtgcctt ttaaagaaga ggcttttgcc agagcggatg agcttactga acgggcagcg 240
ttggctggtg ctgttaatac cctcatgcgg ttagaagatg gacgcctgct gggtgacaat 300
accgatggtg taggcttgtt aagcgatctg gaacgtctgt cttttatccg ccctggttta 360
cgtattctgc ttatcggcgc tggtggagca tctcgcggcg tactactgcc actcctttcc 420
ctggactgtg cggtgacaat aactaatcgg acggtatccc gcgcggaaga gttggctaaa 480
ttgtttgcgc acactggcag tattcaggcg ttgagtatgg acgaactgga aggtcatgag 540
tttgatctca ttattaatgc aacatccagt ggcatcagtg gtgatattcc ggcgatcccg 600
tcatcgctca ttcatccagg catttattgc tatgacatgt tctatcagaa aggaaaaact 660
ccttttctgg catggtgtga gcagcgaggc tcaaagcgta atgctgatgg tttaggaatg 720
ctggtggcac aggcggctca tgcctttctt ctctggcacg gtgttctgcc tgacgtagaa 780
ccagttataa agcaattgca ggaggaattg tccgcgtga 819
<210> 50
<211> 272
<212> PRT
<213> 大肠杆菌
<400> 50
Met Glu Thr Tyr Ala Val Phe Gly Asn Pro Ile Ala His Ser Lys Ser
1               5                   10                  15
Pro Phe Ile His Gln Gln Phe Ala Gln Gln Leu Asn Ile Glu His Pro
            20                  25                  30
Tyr Gly Arg Val Leu Ala Pro Ile Asn Asp Phe Ile Asn Thr Leu Asn
        35                  40                  45
Ala Phe Phe Ser Ala Gly Gly Lys Gly Ala Asn Val Thr Val Pro Phe
    50                  55                  60
Lys Glu Glu Ala Phe Ala Arg Ala Asp Glu Leu Thr Glu Arg Ala Ala
65                  70                  75                  80
Leu Ala Gly Ala Val Asn Thr Leu Met Arg Leu Glu Asp Gly Arg Leu
                85                  90                  95
Leu Gly Asp Asn Thr Asp Gly Val Gly Leu Leu Ser Asp Leu Glu Arg
            100                 105                 110
Leu Ser Phe Ile Arg Pro Gly Leu Arg Ile Leu Leu Ile Gly Ala Gly
        115                 120                 125
Gly Ala Ser Arg Gly Val Leu Leu Pro Leu Leu Ser Leu Asp Cys Ala
    130                 135                 140
Val Thr Ile Thr Asn Arg Thr Val Ser Arg Ala Glu Glu Leu Ala Lys
145                 150                 155                 160
Leu Phe Ala His Thr Gly Ser Ile Gln Ala Leu Ser Met Asp Glu Leu
                165                 170                 175
Glu Gly His Glu Phe Asp Leu Ile Ile Asn Ala Thr Ser Ser Gly Ile
            180                 185                 190
Ser Gly Asp Ile Pro Ala Ile Pro Ser Ser Leu Ile His Pro Gly Ile
        195                 200                 205
Tyr Cys Tyr Asp Met Phe Tyr Gln Lys Gly Lys Thr Pro Phe Leu Ala
    210                 215                 220
Trp Cys Glu Gln Arg Gly Ser Lys Arg Asn Ala Asp Gly Leu Gly Met
225                 230                 235                 240
Leu Val Ala Gln Ala Ala His Ala Phe Leu Leu Trp His Gly Val Leu
                245                 250                 255
Pro Asp Val Glu Pro Val Ile Lys Gln Leu Gln Glu Glu Leu Ser Ala
            260                 265                 270
<210> 51
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 51
cggtacccgg ggatccttac ttccgcgtat ccaac 35
<210> 52
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 52
ctaggaatcg cggccggtga actcctaaag aactatataa c 41
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 53
ggccgcgatt cctagcatgc 20
<210> 54
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 54
ccaagcttgc atgccagtca tcatcaacgg tgccg 35
<210> 55
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 55
atctccgcag aagacgtact g 21
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 56
tccgatcatg tatgacctcc 20
<210> 57
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 57
cggtacccgg ggatcggcat agtgcttcca acgctc 36
<210> 58
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 58
tagctccact caagattcct cgatattacc tacagg 36
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 59
tcttgagtgg agctagggcc 20
<210> 60
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 60
ccaagcttgc atgcccatat agagcccagg agctctc 37
<210> 61
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 61
cgccgcaaag tccaaataga aag 23
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 62
ggattcttcc tgaactcagc 20
<210> 63
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 63
cggtacccgg ggatcgggct cgtcctgaaa ttgcac 36
<210> 64
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 64
tccgtcgtga gccatgttgt gcccacgaga ctacc 35
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 65
atggctcacg acggattgcg 20
<210> 66
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 66
ccaagcttgc atgcccggtt gcagccttca taaacg 36
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 67
agaccaatga gtacccaacc g 21
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 68
tcagcgtctg gctcagctac 20
<210> 69
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 69
cggtacccgg ggatcaaccc cagctcaaat aacacc 36
<210> 70
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 70
tttcaacaca atccgtcctt ctcgcttgga ttacttg 37
<210> 71
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 71
cggattgtgt tgaaattgct ctg 23
<210> 72
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 72
ccaagcttgc atgcctcacc acgggaatct tcagg 35
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 73
ccggactggg gtgtgttttg 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 74
cccggaaaat acggtatagc 20
<210> 75
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 75
ccaagcttgc atgccccatc gcattgccga aaagc 35
<210> 76
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 76
aaagatcggg tcaatgcagt tcgcggggcg aacat 35
<210> 77
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 77
cgccccgcga actgcattga cccgatcttt atacc 35
<210> 78
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 78
cggtacccgg ggatcaacgt tgacggtgat gccat 35
<210> 79
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 79
gaaatgtcat acttcagcca tcagg 25
<210> 80
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 80
tgcgagtgat gaaatcctga aactt 25
<210> 81
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 81
ccaagcttgc atgcctttcg cggtgaatca accca 35
<210> 82
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 82
caggtcaaag ctaaggcatt gtctgtaaat gggca 35
<210> 83
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 83
ctaaggggtt tagcaatgcc caatcaggcc cactt 35
<210> 84
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 84
cggtacccgg ggatcttagg gtacgagggt aagtg 35
<210> 85
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> P2 启动子的DNA片段
<400> 85
cttagctttg acctgcacaa atagttgcaa attgtcccac atacacataa agtagcttgc 60
gtatttaaaa ttatgaacct aaggggttta gca 93
<210> 86
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 86
atttacagac aatgccttag ctttgacctg cacaa 35
<210> 87
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 87
ggcctgattg ggcattgcta aaccccttag g 31
<210> 88
<211> 1686
<212> DNA
<213> 谷氨酸棒杆菌
<400> 88
atgacaacaa ccaccggaag tgcccggcca gcacgtgccg ccaggaagcc taagcccgaa 60
ggccaatgga aaatcgacgg caccgagccg cttaaccatg ccgaggaaat taagcaagaa 120
gaacccgctt ttgctgtcaa gcagcgggtc attgatattt actccaagca gggtttttct 180
tccattgcac cggatgacat tgccccacgc tttaagtggt tgggcattta cacccagcgt 240
aagcaggatc tgggcggtga actgaccggt cagcttcctg atgatgagct gcaggatgag 300
tacttcatga tgcgtgtgcg ttttgatggc ggactggctt cccctgagcg cctgcgtgcc 360
gtgggtgaaa tttctaggga ttatgctcgt tccaccgcgg acttcaccga ccgccagaac 420
attcagctgc actggattcg tattgaagat gtgcctgcga tctgggagaa gctagaaacc 480
gtcggactgt ccaccatgct tggttgcggt gacgttccac gtgttatctt gggctcccca 540
gtttctggcg tagctgctga agagctgatc gatgccaccc cggctatcga tgcgattcgt 600
gagcgctacc tagacaagga agagttccac aaccttcctc gtaagtttaa gactgctatc 660
actggcaacc agcgccagga tgttacccac gaaatccagg acgtttcctt cgttccttcg 720
attcacccag aattcggccc aggatttgag tgctttgtgg gcggcggcct gtccaccaac 780
ccaatgcttg ctcagccact tggttcttgg attccacttg atgaggttcc agaagtgtgg 840
gctggcgtcg ccggaatttt ccgcgactac ggcttccgac gcctgcgtaa ccgtgctcgc 900
ctcaagttct tggtggcaca gtggggtatt gagaagttcc gtgaagttct tgagaccgaa 960
tacctcgagc gcaagctgat tgatggccca gttgttacca ccaaccctgg ctaccgtgac 1020
cacattggca ttcacccaca aaaggacggc aagttctacc tcggtgtgaa gccaaccgtt 1080
ggacacacca ccggtgagca gctcattgcc attgctgatg ttgcagaaaa gcacggcatc 1140
accaggattc gtaccacggc ggaaaaggaa ctgctcttcc tcgatattga gcgagagaac 1200
cttactaccg ttgcacgtga cctggatgaa atcggactgt actcttcacc ttccgagttc 1260
cgccgcggca tcatttcctg caccggcttg gagttctgca agcttgcgca cgcaaccacc 1320
aagtcacgag caattgagct tgtggacgaa ctggaagagc gactcggcga tttggatgtt 1380
cccatcaaga ttgccctgaa cggttgccct aactcttgtg cacgcaccca ggtttccgac 1440
atcggattca agggacagac cgtcactgat gctgacggca accgcgttga aggtttccag 1500
gttcacctgg gcggttccat gaacttggat ccaaacttcg gacgcaagct caagggccac 1560
aaggttattg ccgatgaagt gggagagtac gtcactcgcg ttgttaccca cttcaaggaa 1620
cagcgccacg aggacgagca cttccgcgat tgggtccagc gggccgctga ggaagatttg 1680
gtgtga 1686
<210> 89
<211> 561
<212> PRT
<213> 谷氨酸棒杆菌
<400> 89
Met Thr Thr Thr Thr Gly Ser Ala Arg Pro Ala Arg Ala Ala Arg Lys
1               5                   10                  15
Pro Lys Pro Glu Gly Gln Trp Lys Ile Asp Gly Thr Glu Pro Leu Asn
            20                  25                  30
His Ala Glu Glu Ile Lys Gln Glu Glu Pro Ala Phe Ala Val Lys Gln
        35                  40                  45
Arg Val Ile Asp Ile Tyr Ser Lys Gln Gly Phe Ser Ser Ile Ala Pro
    50                  55                  60
Asp Asp Ile Ala Pro Arg Phe Lys Trp Leu Gly Ile Tyr Thr Gln Arg
65                  70                  75                  80
Lys Gln Asp Leu Gly Gly Glu Leu Thr Gly Gln Leu Pro Asp Asp Glu
                85                  90                  95
Leu Gln Asp Glu Tyr Phe Met Met Arg Val Arg Phe Asp Gly Gly Leu
            100                 105                 110
Ala Ser Pro Glu Arg Leu Arg Ala Val Gly Glu Ile Ser Arg Asp Tyr
        115                 120                 125
Ala Arg Ser Thr Ala Asp Phe Thr Asp Arg Gln Asn Ile Gln Leu His
    130                 135                 140
Trp Ile Arg Ile Glu Asp Val Pro Ala Ile Trp Glu Lys Leu Glu Thr
145                 150                 155                 160
Val Gly Leu Ser Thr Met Leu Gly Cys Gly Asp Val Pro Arg Val Ile
                165                 170                 175
Leu Gly Ser Pro Val Ser Gly Val Ala Ala Glu Glu Leu Ile Asp Ala
            180                 185                 190
Thr Pro Ala Ile Asp Ala Ile Arg Glu Arg Tyr Leu Asp Lys Glu Glu
        195                 200                 205
Phe His Asn Leu Pro Arg Lys Phe Lys Thr Ala Ile Thr Gly Asn Gln
    210                 215                 220
Arg Gln Asp Val Thr His Glu Ile Gln Asp Val Ser Phe Val Pro Ser
225                 230                 235                 240
Ile His Pro Glu Phe Gly Pro Gly Phe Glu Cys Phe Val Gly Gly Gly
                245                 250                 255
Leu Ser Thr Asn Pro Met Leu Ala Gln Pro Leu Gly Ser Trp Ile Pro
            260                 265                 270
Leu Asp Glu Val Pro Glu Val Trp Ala Gly Val Ala Gly Ile Phe Arg
        275                 280                 285
Asp Tyr Gly Phe Arg Arg Leu Arg Asn Arg Ala Arg Leu Lys Phe Leu
    290                 295                 300
Val Ala Gln Trp Gly Ile Glu Lys Phe Arg Glu Val Leu Glu Thr Glu
305                 310                 315                 320
Tyr Leu Glu Arg Lys Leu Ile Asp Gly Pro Val Val Thr Thr Asn Pro
                325                 330                 335
Gly Tyr Arg Asp His Ile Gly Ile His Pro Gln Lys Asp Gly Lys Phe
            340                 345                 350
Tyr Leu Gly Val Lys Pro Thr Val Gly His Thr Thr Gly Glu Gln Leu
        355                 360                 365
Ile Ala Ile Ala Asp Val Ala Glu Lys His Gly Ile Thr Arg Ile Arg
    370                 375                 380
Thr Thr Ala Glu Lys Glu Leu Leu Phe Leu Asp Ile Glu Arg Glu Asn
385                 390                 395                 400
Leu Thr Thr Val Ala Arg Asp Leu Asp Glu Ile Gly Leu Tyr Ser Ser
                405                 410                 415
Pro Ser Glu Phe Arg Arg Gly Ile Ile Ser Cys Thr Gly Leu Glu Phe
            420                 425                 430
Cys Lys Leu Ala His Ala Thr Thr Lys Ser Arg Ala Ile Glu Leu Val
        435                 440                 445
Asp Glu Leu Glu Glu Arg Leu Gly Asp Leu Asp Val Pro Ile Lys Ile
    450                 455                 460
Ala Leu Asn Gly Cys Pro Asn Ser Cys Ala Arg Thr Gln Val Ser Asp
465                 470                 475                 480
Ile Gly Phe Lys Gly Gln Thr Val Thr Asp Ala Asp Gly Asn Arg Val
                485                 490                 495
Glu Gly Phe Gln Val His Leu Gly Gly Ser Met Asn Leu Asp Pro Asn
            500                 505                 510
Phe Gly Arg Lys Leu Lys Gly His Lys Val Ile Ala Asp Glu Val Gly
        515                 520                 525
Glu Tyr Val Thr Arg Val Val Thr His Phe Lys Glu Gln Arg His Glu
    530                 535                 540
Asp Glu His Phe Arg Asp Trp Val Gln Arg Ala Ala Glu Glu Asp Leu
545                 550                 555                 560
Val
<210> 90
<211> 249
<212> DNA
<213> 谷氨酸棒杆菌
<400> 90
gtgagtcttc ggaggaaacc caatcccaac cgcaaccacc ctctgtactg cccatactgc 60
gcgggagaag ttcttttccc cgatgagcaa acagaattcg cgtggttgtg tgcggattgc 120
accagagttt ttgaagtgaa atatcacggc caggacgatc cagtgcacag gccagcacca 180
gcaaagtcca catcgcaagc attaaaagaa tctctcgaaa gacacaaaag aggtgagtcg 240
caacaatga 249
<210> 91
<211> 82
<212> PRT
<213> 谷氨酸棒杆菌
<400> 91
Met Ser Leu Arg Arg Lys Pro Asn Pro Asn Arg Asn His Pro Leu Tyr
1               5                   10                  15
Cys Pro Tyr Cys Ala Gly Glu Val Leu Phe Pro Asp Glu Gln Thr Glu
            20                  25                  30
Phe Ala Trp Leu Cys Ala Asp Cys Thr Arg Val Phe Glu Val Lys Tyr
        35                  40                  45
His Gly Gln Asp Asp Pro Val His Arg Pro Ala Pro Ala Lys Ser Thr
    50                  55                  60
Ser Gln Ala Leu Lys Glu Ser Leu Glu Arg His Lys Arg Gly Glu Ser
65                  70                  75                  80
Gln Gln
<210> 92
<211> 786
<212> DNA
<213> 谷氨酸棒杆菌
<400> 92
atgagctttc aactagttaa cgccctgaaa aatactggtt cggtaaaaga tcccgagatc 60
tcacccgaag gacctcgcac gaccacaccg ttgtcaccag aggtagcaaa acacaacgag 120
gaactcgtcg aaaagcatgc tgctgcgttg tatgacgcca gcgcgcaaga gatcctggaa 180
tggacagccg agcacacgcc gggcgctatt gcagtgacct tgagcatgga aaacaccgtg 240
ctggcggagc tggctgcgcg gcacctgccg gaagctgatt tcctcttttt ggacaccggt 300
taccacttca aggaaactct tgaagttgcc cgccaggtag atgagcgtta ttcccagaag 360
cttgtcaccg cgctgccaat cctcaagcgc acggagcagg attccattta tggtctcaac 420
ctgtaccgca gcaacccagc ggcgtgctgc cgaatgcgca aagttgaacc gctggcggcg 480
tcgttaagcc catacgctgg ctggatcacc ggcctgcgcc gcgctgatgg cccaacccgt 540
gctcaagccc ctgcgctgag cttggatgcc accggcaggc tcaagatttc tccaattatc 600
acctggtcat tggaggaaac caacgagttc attgcggaca acaacctcat cgatcaccca 660
cttacccatc agggttatcc atcaattgga tgcgaaacct gcacccttcc tgttgctgaa 720
ggacaagacc ctagggccgg ccgttgggct ggaaacgcca agacagaatg cggacttcac 780
tcatga 786
<210> 93
<211> 261
<212> PRT
<213> 谷氨酸棒杆菌
<400> 93
Met Ser Phe Gln Leu Val Asn Ala Leu Lys Asn Thr Gly Ser Val Lys
1               5                   10                  15
Asp Pro Glu Ile Ser Pro Glu Gly Pro Arg Thr Thr Thr Pro Leu Ser
            20                  25                  30
Pro Glu Val Ala Lys His Asn Glu Glu Leu Val Glu Lys His Ala Ala
        35                  40                  45
Ala Leu Tyr Asp Ala Ser Ala Gln Glu Ile Leu Glu Trp Thr Ala Glu
    50                  55                  60
His Thr Pro Gly Ala Ile Ala Val Thr Leu Ser Met Glu Asn Thr Val
65                  70                  75                  80
Leu Ala Glu Leu Ala Ala Arg His Leu Pro Glu Ala Asp Phe Leu Phe
                85                  90                  95
Leu Asp Thr Gly Tyr His Phe Lys Glu Thr Leu Glu Val Ala Arg Gln
            100                 105                 110
Val Asp Glu Arg Tyr Ser Gln Lys Leu Val Thr Ala Leu Pro Ile Leu
        115                 120                 125
Lys Arg Thr Glu Gln Asp Ser Ile Tyr Gly Leu Asn Leu Tyr Arg Ser
    130                 135                 140
Asn Pro Ala Ala Cys Cys Arg Met Arg Lys Val Glu Pro Leu Ala Ala
145                 150                 155                 160
Ser Leu Ser Pro Tyr Ala Gly Trp Ile Thr Gly Leu Arg Arg Ala Asp
                165                 170                 175
Gly Pro Thr Arg Ala Gln Ala Pro Ala Leu Ser Leu Asp Ala Thr Gly
            180                 185                 190
Arg Leu Lys Ile Ser Pro Ile Ile Thr Trp Ser Leu Glu Glu Thr Asn
        195                 200                 205
Glu Phe Ile Ala Asp Asn Asn Leu Ile Asp His Pro Leu Thr His Gln
    210                 215                 220
Gly Tyr Pro Ser Ile Gly Cys Glu Thr Cys Thr Leu Pro Val Ala Glu
225                 230                 235                 240
Gly Gln Asp Pro Arg Ala Gly Arg Trp Ala Gly Asn Ala Lys Thr Glu
                245                 250                 255
Cys Gly Leu His Ser
            260
<210> 94
<211> 954
<212> DNA
<213> 谷氨酸棒杆菌
<400> 94
ttgggctgga aacgccaaga cagaatgcgg acttcactca tgaccacaac cgttgcatca 60
gaactttccc cacaccttaa agatcttgaa aatgaatcca tccacatcct ccgcgaggta 120
gctggccagt ttgataaggt cggcctgctg ttttccggcg gtaaggattc cgtcgtggtg 180
tacgagcttg cgcgccgcgc tttcgctcca gctaacgtgc cttttgaatt gctgcacgtg 240
gacaccggcc acaacttccc agaggttttg gaattccgcg acaacctggt ggagcgcacc 300
ggcgcccgcc tgcgcgtagc taaagtccag gactggatcg atcgcggtga cctgcaggaa 360
cgcccagacg gcacccgcaa cccactgcag actgtccctt tggtggagac catcgctgag 420
cagggctacg acgccgtgct tggtggcgct cgccgcgatg aggagcgtgc ccgcgccaag 480
gagcgtgtgt tctctgtgcg tgactccttc ggtggttggg atccacgccg tcagcgccca 540
gagctgtgga ccctctacaa cggtggccac ctgccaggcg aaaacatccg tgttttccca 600
atctccaact ggactgaagc tgacatctgg gagtacatcg gcgcccgtgg catcgaactt 660
ccaccgatct acttctccca cgaccgcgaa gttttcgagc gcgacggcat gtggctgacc 720
gcaggcgagt ggggtggacc aaagaagggc gaggagatcg tcaccaagac tgtccgctac 780
cgcaccgtcg gcgatatgtc ctgcaccggt gctgtgctct cagaagcccg caccattgac 840
gatgtgatcg aagagatcgc cacctccacc cttaccgaac gtggcgcaac ccgcgccgat 900
gaccgcctca gcgaatccgc aatggaagac cgcaagaagg aaggctactt ctga 954
<210> 95
<211> 317
<212> PRT
<213> 谷氨酸棒杆菌
<400> 95
Met Gly Trp Lys Arg Gln Asp Arg Met Arg Thr Ser Leu Met Thr Thr
1               5                   10                  15
Thr Val Ala Ser Glu Leu Ser Pro His Leu Lys Asp Leu Glu Asn Glu
            20                  25                  30
Ser Ile His Ile Leu Arg Glu Val Ala Gly Gln Phe Asp Lys Val Gly
        35                  40                  45
Leu Leu Phe Ser Gly Gly Lys Asp Ser Val Val Val Tyr Glu Leu Ala
    50                  55                  60
Arg Arg Ala Phe Ala Pro Ala Asn Val Pro Phe Glu Leu Leu His Val
65                  70                  75                  80
Asp Thr Gly His Asn Phe Pro Glu Val Leu Glu Phe Arg Asp Asn Leu
                85                  90                  95
Val Glu Arg Thr Gly Ala Arg Leu Arg Val Ala Lys Val Gln Asp Trp
            100                 105                 110
Ile Asp Arg Gly Asp Leu Gln Glu Arg Pro Asp Gly Thr Arg Asn Pro
        115                 120                 125
Leu Gln Thr Val Pro Leu Val Glu Thr Ile Ala Glu Gln Gly Tyr Asp
    130                 135                 140
Ala Val Leu Gly Gly Ala Arg Arg Asp Glu Glu Arg Ala Arg Ala Lys
145                 150                 155                 160
Glu Arg Val Phe Ser Val Arg Asp Ser Phe Gly Gly Trp Asp Pro Arg
                165                 170                 175
Arg Gln Arg Pro Glu Leu Trp Thr Leu Tyr Asn Gly Gly His Leu Pro
            180                 185                 190
Gly Glu Asn Ile Arg Val Phe Pro Ile Ser Asn Trp Thr Glu Ala Asp
        195                 200                 205
Ile Trp Glu Tyr Ile Gly Ala Arg Gly Ile Glu Leu Pro Pro Ile Tyr
    210                 215                 220
Phe Ser His Asp Arg Glu Val Phe Glu Arg Asp Gly Met Trp Leu Thr
225                 230                 235                 240
Ala Gly Glu Trp Gly Gly Pro Lys Lys Gly Glu Glu Ile Val Thr Lys
                245                 250                 255
Thr Val Arg Tyr Arg Thr Val Gly Asp Met Ser Cys Thr Gly Ala Val
            260                 265                 270
Leu Ser Glu Ala Arg Thr Ile Asp Asp Val Ile Glu Glu Ile Ala Thr
        275                 280                 285
Ser Thr Leu Thr Glu Arg Gly Ala Thr Arg Ala Asp Asp Arg Leu Ser
    290                 295                 300
Glu Ser Ala Met Glu Asp Arg Lys Lys Glu Gly Tyr Phe
305                 310                 315
<210> 96
<211> 1302
<212> DNA
<213> 谷氨酸棒杆菌
<400> 96
atgactgctc caaccttgaa taaagcatcc gaaaagattg catcacgcga gacccttcgt 60
ctgtgcaccg caggttccgt agatgatggc aagtccacct tcgtcggccg cctcctgcac 120
gacaccaagt ctgttcttgc tgatcagcta gcttccgtag agcgcacctc cgccgaccgc 180
ggcttcgaag gcctcgacct gtccctcctc gtcgacggcc tgcgcgccga gcgtgagcag 240
ggcatcacca tcgacgttgc ctaccgctac ttcgccactg acaagcgcac cttcatcctg 300
gctgacaccc caggccacgt gcagtacacc cgcaacaccg tcaccggcgt ctccacctcc 360
caggttgtag ttttgcttgt cgacgcccgc cacggcgtcg tcgagcagac ccgccgccac 420
ctgtccgtat cggccctgct gggcgtgcgc acggtgatcc tcgcagtcaa caaaattgac 480
cttgttgatt acagcgaaga agtcttccgc aacattgaaa aagaattcgt ttctttggct 540
tccgctttag atgtcaccga cacccacgtc gttccgatct ccgcactcaa gggcgacaac 600
gttgcagaac cttccaccca catggactgg tacgcgggac caaccgtgct ggaaatcctg 660
gaaaacgttg aagtttcccg cggccgtgca cacgacctgg gcttccgctt cccaatccag 720
tacgtcatcc gcgagcacgc aaccgattac cgcggctacg ccggcaccat caacgctggt 780
tccatctccg tgggcgatac cgtgcaccta cctgaaggcc gcaccaccca ggtcacccac 840
atcgattccg ctgacggatc cctccaaacc gcatcagttg gagaagccgt tgtcctgcgc 900
ctagcccagg aaatcgacct catccgcggc gaactcatcg caggctccga tcgcccagaa 960
tccgttcgtt ccttcaacgc cactgtcgtt ggtctagcag atcgcactat caaaccaggt 1020
gcagcagtca aggtccgcta cggcaccgag ctggtccgcg gacgcgtcgc agccatcgaa 1080
cgagtcctcg acatcgacgg cgtcaacgac aacgaagcac cagaaaccta cggcctcaac 1140
gacatcgcgc acgtgcgcat cgatgttgca ggtgaattgg aagttgaaga ttacgctgct 1200
cgtggcgcaa ttggctcctt ccttcttatc gatcaatcct ccggcgacac cctcgctgcc 1260
ggtttggttg gccaccgcct acgcaataac tggtcgatct ag 1302
<210> 97
<211> 433
<212> PRT
<213> 谷氨酸棒杆菌
<400> 97
Met Thr Ala Pro Thr Leu Asn Lys Ala Ser Glu Lys Ile Ala Ser Arg
1               5                   10                  15
Glu Thr Leu Arg Leu Cys Thr Ala Gly Ser Val Asp Asp Gly Lys Ser
            20                  25                  30
Thr Phe Val Gly Arg Leu Leu His Asp Thr Lys Ser Val Leu Ala Asp
        35                  40                  45
Gln Leu Ala Ser Val Glu Arg Thr Ser Ala Asp Arg Gly Phe Glu Gly
    50                  55                  60
Leu Asp Leu Ser Leu Leu Val Asp Gly Leu Arg Ala Glu Arg Glu Gln
65                  70                  75                  80
Gly Ile Thr Ile Asp Val Ala Tyr Arg Tyr Phe Ala Thr Asp Lys Arg
                85                  90                  95
Thr Phe Ile Leu Ala Asp Thr Pro Gly His Val Gln Tyr Thr Arg Asn
            100                 105                 110
Thr Val Thr Gly Val Ser Thr Ser Gln Val Val Val Leu Leu Val Asp
        115                 120                 125
Ala Arg His Gly Val Val Glu Gln Thr Arg Arg His Leu Ser Val Ser
    130                 135                 140
Ala Leu Leu Gly Val Arg Thr Val Ile Leu Ala Val Asn Lys Ile Asp
145                 150                 155                 160
Leu Val Asp Tyr Ser Glu Glu Val Phe Arg Asn Ile Glu Lys Glu Phe
                165                 170                 175
Val Ser Leu Ala Ser Ala Leu Asp Val Thr Asp Thr His Val Val Pro
            180                 185                 190
Ile Ser Ala Leu Lys Gly Asp Asn Val Ala Glu Pro Ser Thr His Met
        195                 200                 205
Asp Trp Tyr Ala Gly Pro Thr Val Leu Glu Ile Leu Glu Asn Val Glu
    210                 215                 220
Val Ser Arg Gly Arg Ala His Asp Leu Gly Phe Arg Phe Pro Ile Gln
225                 230                 235                 240
Tyr Val Ile Arg Glu His Ala Thr Asp Tyr Arg Gly Tyr Ala Gly Thr
                245                 250                 255
Ile Asn Ala Gly Ser Ile Ser Val Gly Asp Thr Val His Leu Pro Glu
            260                 265                 270
Gly Arg Thr Thr Gln Val Thr His Ile Asp Ser Ala Asp Gly Ser Leu
        275                 280                 285
Gln Thr Ala Ser Val Gly Glu Ala Val Val Leu Arg Leu Ala Gln Glu
    290                 295                 300
Ile Asp Leu Ile Arg Gly Glu Leu Ile Ala Gly Ser Asp Arg Pro Glu
305                 310                 315                 320
Ser Val Arg Ser Phe Asn Ala Thr Val Val Gly Leu Ala Asp Arg Thr
                325                 330                 335
Ile Lys Pro Gly Ala Ala Val Lys Val Arg Tyr Gly Thr Glu Leu Val
            340                 345                 350
Arg Gly Arg Val Ala Ala Ile Glu Arg Val Leu Asp Ile Asp Gly Val
        355                 360                 365
Asn Asp Asn Glu Ala Pro Glu Thr Tyr Gly Leu Asn Asp Ile Ala His
    370                 375                 380
Val Arg Ile Asp Val Ala Gly Glu Leu Glu Val Glu Asp Tyr Ala Ala
385                 390                 395                 400
Arg Gly Ala Ile Gly Ser Phe Leu Leu Ile Asp Gln Ser Ser Gly Asp
                405                 410                 415
Thr Leu Ala Ala Gly Leu Val Gly His Arg Leu Arg Asn Asn Trp Ser
            420                 425                 430
Ile
<210> 98
<211> 900
<212> DNA
<213> 谷氨酸棒杆菌
<400> 98
ttggctcctt ccttcttatc gatcaatcct ccggcgacac cctcgctgcc ggtttggttg 60
gccaccgcct acgcaataac tggtcgatct agaccagttg ctgtgaaggc aaggtgccgg 120
cttagatgcc ggcgcctagc ctacatccag ctaagacccc ctttaggaca cctcatgatt 180
cccctgatta cgctttccca cggttcccgc aaaaagtccg cagctgcagg tattactgcg 240
ctgactcatg aggccggacg aatgctggaa acaccagccg tggaagcgca tttagagctt 300
gctgaacctt cccttgatca ggttgtggca acgctcagtg cggaaggcgt aaccagggca 360
gcgttggttc ctttgctgtt tagcaatgcg tatcacgcaa agattgacgt tcctgaggca 420
gtaaaagatg cttcagaaaa gtatggtgtg gaacttctcg tgggtccgca tttgggcact 480
ggctccgatg tagccagcgt gcttgcgcag cggttgcgtg cggacgcccc cacagatgcc 540
catgtgattt tgtattccgt tggcagctca cacgtgtccg ccaatgaatc agtcatcgat 600
cttgcccaca ccattgctct cctcactggc ttttcggttg aggtggtgcc cgctaccggt 660
gggccaggtg ccggcggcgc cggagtaata gaggtggcct cgaaacacaa ggccgtccac 720
atcctgccgc tgtttgttac ggaaggtttg ctgctggatc gggttattga tcaatccgcc 780
aacatcgcag ctgccaccgg cacgaacttt acctattccg aacccctaac tactgacctc 840
gcaccacttg ttgcagcccg ttaccacgct gcattgagcg cactgctggc acatatctaa 900
<210> 99
<211> 299
<212> PRT
<213> 谷氨酸棒杆菌
<400> 99
Met Ala Pro Ser Phe Leu Ser Ile Asn Pro Pro Ala Thr Pro Ser Leu
1               5                   10                  15
Pro Val Trp Leu Ala Thr Ala Tyr Ala Ile Thr Gly Arg Ser Arg Pro
            20                  25                  30
Val Ala Val Lys Ala Arg Cys Arg Leu Arg Cys Arg Arg Leu Ala Tyr
        35                  40                  45
Ile Gln Leu Arg Pro Pro Leu Gly His Leu Met Ile Pro Leu Ile Thr
    50                  55                  60
Leu Ser His Gly Ser Arg Lys Lys Ser Ala Ala Ala Gly Ile Thr Ala
65                  70                  75                  80
Leu Thr His Glu Ala Gly Arg Met Leu Glu Thr Pro Ala Val Glu Ala
                85                  90                  95
His Leu Glu Leu Ala Glu Pro Ser Leu Asp Gln Val Val Ala Thr Leu
            100                 105                 110
Ser Ala Glu Gly Val Thr Arg Ala Ala Leu Val Pro Leu Leu Phe Ser
        115                 120                 125
Asn Ala Tyr His Ala Lys Ile Asp Val Pro Glu Ala Val Lys Asp Ala
    130                 135                 140
Ser Glu Lys Tyr Gly Val Glu Leu Leu Val Gly Pro His Leu Gly Thr
145                 150                 155                 160
Gly Ser Asp Val Ala Ser Val Leu Ala Gln Arg Leu Arg Ala Asp Ala
                165                 170                 175
Pro Thr Asp Ala His Val Ile Leu Tyr Ser Val Gly Ser Ser His Val
            180                 185                 190
Ser Ala Asn Glu Ser Val Ile Asp Leu Ala His Thr Ile Ala Leu Leu
        195                 200                 205
Thr Gly Phe Ser Val Glu Val Val Pro Ala Thr Gly Gly Pro Gly Ala
    210                 215                 220
Gly Gly Ala Gly Val Ile Glu Val Ala Ser Lys His Lys Ala Val His
225                 230                 235                 240
Ile Leu Pro Leu Phe Val Thr Glu Gly Leu Leu Leu Asp Arg Val Ile
                245                 250                 255
Asp Gln Ser Ala Asn Ile Ala Ala Ala Thr Gly Thr Asn Phe Thr Tyr
            260                 265                 270
Ser Glu Pro Leu Thr Thr Asp Leu Ala Pro Leu Val Ala Ala Arg Tyr
        275                 280                 285
His Ala Ala Leu Ser Ala Leu Leu Ala His Ile
    290                 295
<210> 100
<211> 930
<212> DNA
<213> 谷氨酸棒杆菌
<400> 100
atgcagacat taatctttat cgccattgca ggcgtcgcag cacagcttgt tgatggcggc 60
ctcggcatgg ggttcggcgt cacctcaacc accatcctca tcatgctcgc aggtttaggc 120
cctgcgcagg catccgccgt cgtgcacacc gcagaggttg gaaccacctt agtttctggt 180
ttaagccact ggaaatttgg caacgtggat tggaaagtag ttgtccggct cggtatcccc 240
ggcgctatcg gcgcatttgc tggcgctacc ttcttgtcca atatttccac cgaagcagca 300
gcaccgatca cctccctgat tcttgccctg atcggcatga acctagtctg gcgattcagc 360
aagggacgca tccgccgcga ctattccgat cgcccgcaca gcaagggatt cctcggcgga 420
ctcggtattg tcggtggctt cgttgacgcg tccggtggcg gcggatgggg tccagtgacc 480
acctctacgc tgctgtcttt gggacgcacc gaaccccgca aagtagtcgg caccgtcaac 540
accgcagaat tcttagtctc cctagccgca acattgggct tcgtcgtggg actgtgggat 600
gacctagtag ctaacctctc tgcagttctc gcgttgctca tcggcggcgc aatcgcagca 660
ccaatcggcg cctggatgat ctctcgcgtt aatgcaaccg tcctcggcgg cttcgtgggc 720
accctgattg tcacactgaa cctgccaaag gtgctcaatg tggttggcct tgatttcatc 780
cccaccggcc tcgtccaggt caccgtcctc ctcatcggcc tgccgctgac gtacctcggc 840
ttccgccgct accgcaaaaa cctcctcaac gaaaccatct ccagcgaggt tgtctccgaa 900
ccacagggac aaaagattaa aagctcttaa 930
<210> 101
<211> 309
<212> PRT
<213> 谷氨酸棒杆菌
<400> 101
Met Gln Thr Leu Ile Phe Ile Ala Ile Ala Gly Val Ala Ala Gln Leu
1               5                   10                  15
Val Asp Gly Gly Leu Gly Met Gly Phe Gly Val Thr Ser Thr Thr Ile
            20                  25                  30
Leu Ile Met Leu Ala Gly Leu Gly Pro Ala Gln Ala Ser Ala Val Val
        35                  40                  45
His Thr Ala Glu Val Gly Thr Thr Leu Val Ser Gly Leu Ser His Trp
    50                  55                  60
Lys Phe Gly Asn Val Asp Trp Lys Val Val Val Arg Leu Gly Ile Pro
65                  70                  75                  80
Gly Ala Ile Gly Ala Phe Ala Gly Ala Thr Phe Leu Ser Asn Ile Ser
                85                  90                  95
Thr Glu Ala Ala Ala Pro Ile Thr Ser Leu Ile Leu Ala Leu Ile Gly
            100                 105                 110
Met Asn Leu Val Trp Arg Phe Ser Lys Gly Arg Ile Arg Arg Asp Tyr
        115                 120                 125
Ser Asp Arg Pro His Ser Lys Gly Phe Leu Gly Gly Leu Gly Ile Val
    130                 135                 140
Gly Gly Phe Val Asp Ala Ser Gly Gly Gly Gly Trp Gly Pro Val Thr
145                 150                 155                 160
Thr Ser Thr Leu Leu Ser Leu Gly Arg Thr Glu Pro Arg Lys Val Val
                165                 170                 175
Gly Thr Val Asn Thr Ala Glu Phe Leu Val Ser Leu Ala Ala Thr Leu
            180                 185                 190
Gly Phe Val Val Gly Leu Trp Asp Asp Leu Val Ala Asn Leu Ser Ala
        195                 200                 205
Val Leu Ala Leu Leu Ile Gly Gly Ala Ile Ala Ala Pro Ile Gly Ala
    210                 215                 220
Trp Met Ile Ser Arg Val Asn Ala Thr Val Leu Gly Gly Phe Val Gly
225                 230                 235                 240
Thr Leu Ile Val Thr Leu Asn Leu Pro Lys Val Leu Asn Val Val Gly
                245                 250                 255
Leu Asp Phe Ile Pro Thr Gly Leu Val Gln Val Thr Val Leu Leu Ile
            260                 265                 270
Gly Leu Pro Leu Thr Tyr Leu Gly Phe Arg Arg Tyr Arg Lys Asn Leu
        275                 280                 285
Leu Asn Glu Thr Ile Ser Ser Glu Val Val Ser Glu Pro Gln Gly Gln
    290                 295                 300
Lys Ile Lys Ser Ser
305
<210> 102
<211> 1374
<212> DNA
<213> 谷氨酸棒杆菌
<400> 102
atgacaactc ccctgcgcgt agccatcatc ggagctggcc ctgctggcat ttacgcatcc 60
gacctcctca tccgcaatga agagcgcgaa gtgttcgttg accttttcga gcaaatgcct 120
gcaccgttcg gactcatccg ttacggcgtt gcaccagacc acccacgcat caagggcatc 180
gttaagtccc tgcacaacgt gttggacaag ccacgcctgc gcctgctcgg caacattgaa 240
atcggcaaag acatcaccgt cgaagaactc cgcgactact acgacgcagt tgtcttctcc 300
accggtgcag ttgcagaccg cgacctcaac atccccggaa ttgaagcaga aggttccttc 360
ggtgccggcg agttcgttgg cttctacgac ggcaacccac gcttcgagcg ctcctgggat 420
ctgtctgcac agtccgtcgc tgttatcggc gttggtaacg tcggcctcga tgtagcccgc 480
atcctggcta agacaggcga cgagctcaaa gtcaccgaaa tttccgacaa cgtctacgac 540
tccctcaaag aaaacaaggc cactgaagta cacgttttcg gacgtcgtgg cccagcacag 600
gtcaagttca ccccacagga actcaaagaa ctcgaccact cccccaccat caacgtggtt 660
gttgacccag aagacatcga ctacgacggc gcctccgaag aagcccgccg cgcatccaaa 720
tcccaggacc tggtctgcca gatcctggaa cagtacgcaa tccgcgagcc aaaggacgct 780
ccgcacaccc tgcagatcca cctctttgaa aacccagttg aggttcttca aaaggacggc 840
aaggttgttg gcctgcgcac cgaacgcacc gcgctcgacg gcaacggtgg cgtaaacggc 900
accggcgaat tcaaggactg gccagttcag gctgtctacc gcgcagtcgg ctacaagtcc 960
gaccccatcg acggcgtccc attcgatggg aacaagcacg tcatccctaa tgacggcgga 1020
catgtcctca ccgctccagg tgcagagcca gtaccaggcc tctacgccac cggctggatc 1080
aagcgtggac caatcggtct gatcggcaac accaagtctg atgccaagga aaccaccgac 1140
atcctcatca aggatgccgt caccggtgta cttgaagccc caaagcacca gggcgaagaa 1200
gccatcatcg agcttctcga ttcccgcaac atcccattca ccacctggga aggctggtac 1260
aaactcgacg cagcagagcg cgcactcggt gaagccgaag gccgcgagcg caagaagatt 1320
gttgattggg aagaaatggt ccgccaggcc cgcgaagctc cagcaattgt ctaa 1374
<210> 103
<211> 457
<212> PRT
<213> 谷氨酸棒杆菌
<400> 103
Met Thr Thr Pro Leu Arg Val Ala Ile Ile Gly Ala Gly Pro Ala Gly
1               5                   10                  15
Ile Tyr Ala Ser Asp Leu Leu Ile Arg Asn Glu Glu Arg Glu Val Phe
            20                  25                  30
Val Asp Leu Phe Glu Gln Met Pro Ala Pro Phe Gly Leu Ile Arg Tyr
        35                  40                  45
Gly Val Ala Pro Asp His Pro Arg Ile Lys Gly Ile Val Lys Ser Leu
    50                  55                  60
His Asn Val Leu Asp Lys Pro Arg Leu Arg Leu Leu Gly Asn Ile Glu
65                  70                  75                  80
Ile Gly Lys Asp Ile Thr Val Glu Glu Leu Arg Asp Tyr Tyr Asp Ala
                85                  90                  95
Val Val Phe Ser Thr Gly Ala Val Ala Asp Arg Asp Leu Asn Ile Pro
            100                 105                 110
Gly Ile Glu Ala Glu Gly Ser Phe Gly Ala Gly Glu Phe Val Gly Phe
        115                 120                 125
Tyr Asp Gly Asn Pro Arg Phe Glu Arg Ser Trp Asp Leu Ser Ala Gln
    130                 135                 140
Ser Val Ala Val Ile Gly Val Gly Asn Val Gly Leu Asp Val Ala Arg
145                 150                 155                 160
Ile Leu Ala Lys Thr Gly Asp Glu Leu Lys Val Thr Glu Ile Ser Asp
                165                 170                 175
Asn Val Tyr Asp Ser Leu Lys Glu Asn Lys Ala Thr Glu Val His Val
            180                 185                 190
Phe Gly Arg Arg Gly Pro Ala Gln Val Lys Phe Thr Pro Gln Glu Leu
        195                 200                 205
Lys Glu Leu Asp His Ser Pro Thr Ile Asn Val Val Val Asp Pro Glu
    210                 215                 220
Asp Ile Asp Tyr Asp Gly Ala Ser Glu Glu Ala Arg Arg Ala Ser Lys
225                 230                 235                 240
Ser Gln Asp Leu Val Cys Gln Ile Leu Glu Gln Tyr Ala Ile Arg Glu
                245                 250                 255
Pro Lys Asp Ala Pro His Thr Leu Gln Ile His Leu Phe Glu Asn Pro
            260                 265                 270
Val Glu Val Leu Gln Lys Asp Gly Lys Val Val Gly Leu Arg Thr Glu
        275                 280                 285
Arg Thr Ala Leu Asp Gly Asn Gly Gly Val Asn Gly Thr Gly Glu Phe
    290                 295                 300
Lys Asp Trp Pro Val Gln Ala Val Tyr Arg Ala Val Gly Tyr Lys Ser
305                 310                 315                 320
Asp Pro Ile Asp Gly Val Pro Phe Asp Gly Asn Lys His Val Ile Pro
                325                 330                 335
Asn Asp Gly Gly His Val Leu Thr Ala Pro Gly Ala Glu Pro Val Pro
            340                 345                 350
Gly Leu Tyr Ala Thr Gly Trp Ile Lys Arg Gly Pro Ile Gly Leu Ile
        355                 360                 365
Gly Asn Thr Lys Ser Asp Ala Lys Glu Thr Thr Asp Ile Leu Ile Lys
    370                 375                 380
Asp Ala Val Thr Gly Val Leu Glu Ala Pro Lys His Gln Gly Glu Glu
385                 390                 395                 400
Ala Ile Ile Glu Leu Leu Asp Ser Arg Asn Ile Pro Phe Thr Thr Trp
                405                 410                 415
Glu Gly Trp Tyr Lys Leu Asp Ala Ala Glu Arg Ala Leu Gly Glu Ala
            420                 425                 430
Glu Gly Arg Glu Arg Lys Lys Ile Val Asp Trp Glu Glu Met Val Arg
        435                 440                 445
Gln Ala Arg Glu Ala Pro Ala Ile Val
    450                 455
<210> 104
<211> 1173
<212> DNA
<213> 谷氨酸棒杆菌
<400> 104
ttgtctatga ttggctatgg tttacctatg cccaatcagg cccacttctc tgcgtccttt 60
gcccgcccct ctaccccggc tgcaaagtgc atgcaccata tccgcctcgg ccagcaactc 120
attagaaatg agctggtcga ggccacaggt ctgtcccaac cgactgtcac ccgcgcagtc 180
accgctttaa tgcaggcagg tttggttcgt gaacgccctg atctcacact ctcatcgggc 240
cctggtcgtc ccaatattcc tctagaactc gctccaagtc catggattca tgcaggcgtg 300
gcaatcggca ccaagtcttc ctacgtcgct ttgtttgata ccaagggtcg cacccttcgt 360
gatgccatac tggaaatctc agcagctgat ttagatccag acaccttcat cgaacacctc 420
atcgctggtg tcaaccgcct caccactggt cttgatctac cactggtagg tattggtgtg 480
gctacctcag gaaaagtcac caacgcgggc gttgtcaccg caagcaactt gggctgggat 540
ggcgttgata tcgccggccg tctgaactac caattcagcg ttccagcaac cgtggcatca 600
gcaattcctg ccatcgcagc ttctgaactg caggcttccc cacttcccca ccctgagcag 660
ccaactccca tcaccttgac cttctacgcc gatgactctg tgggcgcggc ctacagcaat 720
gatttgggag tacatgtcat tggaccactg gctacaactc gtggatcagg tttggatact 780
ttgggcatgg ctgctgaaga tgcgctgagc acccaaggtt tcttaagcag ggtttctgat 840
cagggtatct ttgccaacag ccttggtgag ctagtcacca ttgctaaaga caatgaaacc 900
gcacgggaat tcctcaacga tcgcgcgacc ctgctggctc acactgccgc agaagctgct 960
gaaacagtta agccatccac cctggttctc tcgggatcgg cgttttccga agatccacaa 1020
ggtcggttgg tgttcgcttc ccaattgaag aaggaatacg acgcagacat tgagctccgc 1080
ttgatcccca cccaccggga aaatgtccgc gcagcagctc gcgcagtcgc acttgatcga 1140
ctactcaacg agccacttac cctcgtaccc taa 1173
<210> 105
<211> 390
<212> PRT
<213> 谷氨酸棒杆菌
<400> 105
Leu Ser Met Ile Gly Tyr Gly Leu Pro Met Pro Asn Gln Ala His Phe
1               5                   10                  15
Ser Ala Ser Phe Ala Arg Pro Ser Thr Pro Ala Ala Lys Cys Met His
            20                  25                  30
His Ile Arg Leu Gly Gln Gln Leu Ile Arg Asn Glu Leu Val Glu Ala
        35                  40                  45
Thr Gly Leu Ser Gln Pro Thr Val Thr Arg Ala Val Thr Ala Leu Met
    50                  55                  60
Gln Ala Gly Leu Val Arg Glu Arg Pro Asp Leu Thr Leu Ser Ser Gly
65                  70                  75                  80
Pro Gly Arg Pro Asn Ile Pro Leu Glu Leu Ala Pro Ser Pro Trp Ile
                85                  90                  95
His Ala Gly Val Ala Ile Gly Thr Lys Ser Ser Tyr Val Ala Leu Phe
            100                 105                 110
Asp Thr Lys Gly Arg Thr Leu Arg Asp Ala Ile Leu Glu Ile Ser Ala
        115                 120                 125
Ala Asp Leu Asp Pro Asp Thr Phe Ile Glu His Leu Ile Ala Gly Val
    130                 135                 140
Asn Arg Leu Thr Thr Gly Leu Asp Leu Pro Leu Val Gly Ile Gly Val
145                 150                 155                 160
Ala Thr Ser Gly Lys Val Thr Asn Ala Gly Val Val Thr Ala Ser Asn
                165                 170                 175
Leu Gly Trp Asp Gly Val Asp Ile Ala Gly Arg Leu Asn Tyr Gln Phe
            180                 185                 190
Ser Val Pro Ala Thr Val Ala Ser Ala Ile Pro Ala Ile Ala Ala Ser
        195                 200                 205
Glu Leu Gln Ala Ser Pro Leu Pro His Pro Glu Gln Pro Thr Pro Ile
    210                 215                 220
Thr Leu Thr Phe Tyr Ala Asp Asp Ser Val Gly Ala Ala Tyr Ser Asn
225                 230                 235                 240
Asp Leu Gly Val His Val Ile Gly Pro Leu Ala Thr Thr Arg Gly Ser
                245                 250                 255
Gly Leu Asp Thr Leu Gly Met Ala Ala Glu Asp Ala Leu Ser Thr Gln
            260                 265                 270
Gly Phe Leu Ser Arg Val Ser Asp Gln Gly Ile Phe Ala Asn Ser Leu
        275                 280                 285
Gly Glu Leu Val Thr Ile Ala Lys Asp Asn Glu Thr Ala Arg Glu Phe
    290                 295                 300
Leu Asn Asp Arg Ala Thr Leu Leu Ala His Thr Ala Ala Glu Ala Ala
305                 310                 315                 320
Glu Thr Val Lys Pro Ser Thr Leu Val Leu Ser Gly Ser Ala Phe Ser
                325                 330                 335
Glu Asp Pro Gln Gly Arg Leu Val Phe Ala Ser Gln Leu Lys Lys Glu
            340                 345                 350
Tyr Asp Ala Asp Ile Glu Leu Arg Leu Ile Pro Thr His Arg Glu Asn
        355                 360                 365
Val Arg Ala Ala Ala Arg Ala Val Ala Leu Asp Arg Leu Leu Asn Glu
    370                 375                 380
Pro Leu Thr Leu Val Pro
385                 390
<210> 106
<211> 1074
<212> DNA
<213> 谷氨酸棒杆菌
<400> 106
gtgttcatgc ttgcacagcg aacactcccc attcacatca ccgcccccca cctgcccgtc 60
gcgcgcgtat ttcaccaaat tcgcgccaca gacgccgatc gcacctcgct gcaacgcgat 120
cttgaactct cccaagctgg catcactcgg catgtatcag cgcttattga tgcaggtctc 180
gtggaggaaa cccgagtgga ttccggggcg cgctcggggc gaccgcgcac aaaattaggc 240
atcgacggcc gccatctcac cgcctgggga gtgcacattg gcctgcgcag cacggatttt 300
gcggtgtgcg atttagccgg ccgagtgatt aggtatgagc gcgtggacca tgaagtttca 360
cactccacgc cgtcggaaac gctgaatttt gtcgcacata ggttacaaac attgagcgcc 420
ggcttgcccg agccccgcaa tgtgggcgtg gcattatctg cccacttaag cgccaacggc 480
accgtcactt ccgaagatta tggctggtca gaggtggaaa ttgggataca cctccccttc 540
cccgccacca tcggatcagg tgttgcggcg atggccggtt cggaaattat caacgcgcca 600
ctgacccaat ccacgcagtc cacgctgtat ttctacgccc gcgaaatggt ctcccacgcc 660
tggattttca acggcgctgt ccaccgcccc aacagcggcc gcacgccgac ggcgttcgga 720
aatacaaata ccttaaaaga tgcttttcga cgtggactca caccaacaac tttctccgat 780
ttagtccaac tctcccacac caacccgctt gcccgacaga tcctcaacga gcgcgcccac 840
aaacttgccg acgccgtaac caccgccgtt gatgttgtcg accccgaagc cgtcgtcttc 900
gccggcgaag ccttcaccct ggatccggaa actcttcgca ttgtggtgac ccagctccga 960
gcaaacaccg gcagccaact gagaatccaa cgcgcagacg cccacattct ccgcaccgcg 1020
gccatccagg tggcgctgca tccgatccgt caagatccgt tagcatttgt gtaa 1074
<210> 107
<211> 357
<212> PRT
<213> 谷氨酸棒杆菌
<400> 107
Met Phe Met Leu Ala Gln Arg Thr Leu Pro Ile His Ile Thr Ala Pro
1               5                   10                  15
His Leu Pro Val Ala Arg Val Phe His Gln Ile Arg Ala Thr Asp Ala
            20                  25                  30
Asp Arg Thr Ser Leu Gln Arg Asp Leu Glu Leu Ser Gln Ala Gly Ile
        35                  40                  45
Thr Arg His Val Ser Ala Leu Ile Asp Ala Gly Leu Val Glu Glu Thr
    50                  55                  60
Arg Val Asp Ser Gly Ala Arg Ser Gly Arg Pro Arg Thr Lys Leu Gly
65                  70                  75                  80
Ile Asp Gly Arg His Leu Thr Ala Trp Gly Val His Ile Gly Leu Arg
                85                  90                  95
Ser Thr Asp Phe Ala Val Cys Asp Leu Ala Gly Arg Val Ile Arg Tyr
            100                 105                 110
Glu Arg Val Asp His Glu Val Ser His Ser Thr Pro Ser Glu Thr Leu
        115                 120                 125
Asn Phe Val Ala His Arg Leu Gln Thr Leu Ser Ala Gly Leu Pro Glu
    130                 135                 140
Pro Arg Asn Val Gly Val Ala Leu Ser Ala His Leu Ser Ala Asn Gly
145                 150                 155                 160
Thr Val Thr Ser Glu Asp Tyr Gly Trp Ser Glu Val Glu Ile Gly Ile
                165                 170                 175
His Leu Pro Phe Pro Ala Thr Ile Gly Ser Gly Val Ala Ala Met Ala
            180                 185                 190
Gly Ser Glu Ile Ile Asn Ala Pro Leu Thr Gln Ser Thr Gln Ser Thr
        195                 200                 205
Leu Tyr Phe Tyr Ala Arg Glu Met Val Ser His Ala Trp Ile Phe Asn
    210                 215                 220
Gly Ala Val His Arg Pro Asn Ser Gly Arg Thr Pro Thr Ala Phe Gly
225                 230                 235                 240
Asn Thr Asn Thr Leu Lys Asp Ala Phe Arg Arg Gly Leu Thr Pro Thr
                245                 250                 255
Thr Phe Ser Asp Leu Val Gln Leu Ser His Thr Asn Pro Leu Ala Arg
            260                 265                 270
Gln Ile Leu Asn Glu Arg Ala His Lys Leu Ala Asp Ala Val Thr Thr
        275                 280                 285
Ala Val Asp Val Val Asp Pro Glu Ala Val Val Phe Ala Gly Glu Ala
    290                 295                 300
Phe Thr Leu Asp Pro Glu Thr Leu Arg Ile Val Val Thr Gln Leu Arg
305                 310                 315                 320
Ala Asn Thr Gly Ser Gln Leu Arg Ile Gln Arg Ala Asp Ala His Ile
                325                 330                 335
Leu Arg Thr Ala Ala Ile Gln Val Ala Leu His Pro Ile Arg Gln Asp
            340                 345                 350
Pro Leu Ala Phe Val
        355
<210> 108
<211> 2180
<212> DNA
<213> 人工序列
<220>
<223> 启动子 P2
<400> 108
tttcgcggtg aatcaaccca cccgaacggc gatccttcga agtattttgc cgattgatca 60
attagcgtcg gcaacatcac tgaatatgct gctcatgcag accggcgcaa tcgttggccc 120
gctgatcgca ggtgcgttga ttccgctgat cggtttcggg tggctgtatt tccttgatgt 180
tgtctccatc atccccacac tgtgggctgt atggtcactg ccttcaatca agccatccgg 240
caaggtcatg aaggccggtt tcgccagtgt ggtggatggc ctgaagtatt tggctggcca 300
acccgtgttg ttgatggtga tggtgctgga tcttatcgcc atgattttcg gcatgccacg 360
tgcgctttac cccgagatcg cggaagtgaa cttcggtggt ggtgacgccg gtgcaacgat 420
gctggcgttc atgtactcat ccatggctgt tggcgcagtt cttggcggcg tgctgtctgg 480
ttgggtttcc cggattagcc gccagggtgt tgcagtttat tggtgcatca tcgcctgggg 540
cgcagccgtt gctttgggtg gcgtagcaat tgttgtcagc cccggcgctg tgaccgcgtg 600
ggcgtggatg ttcatcatca tgatggtcat tggtggcatg gctgacatgt ttagctcggc 660
tgttcgaaat gctattttgc agcagtctgc agcggaacat gtgcagggcc gaatccaagg 720
tgtgtggatc atcgtcgtgg tgggtggacc tcgtttagct gacgtccttc acggttgggc 780
cgctgagccc ttgggtgcag gttggacggt attatggggc ggagtagcgg tggttgtact 840
cactgcaatt tgtatggtgg cggtgcctaa attctggaaa tacgagaaac caaaaattac 900
cggcatctaa atacttatcc atgcccattt acagacaatg ccttagcttt gacctgcaca 960
aatagttgca aattgtccca catacacata aagtagcttg cgtatttaaa attatgaacc 1020
taaggggttt agcaatgccc aatcaggccc acttctctgc gtcctttgcc cgcccctcta 1080
ccccggctgc aaagtgcatg caccatatcc gcctcggcca gcaactcatt agaaatgagc 1140
tggtcgaggc cacaggtctg tcccaaccga ctgtcacccg cgcagtcacc gctttaatgc 1200
aggcaggttt ggttcgtgaa cgccctgatc tcacactctc atcgggccct ggtcgtccca 1260
atattcctct agaactcgct ccaagtccat ggattcatgc aggcgtggca atcggcacca 1320
agtcttccta cgtcgctttg tttgatacca agggtcgcac ccttcgtgat gccatactgg 1380
aaatctcagc agctgattta gatccagaca ccttcatcga acacctcatc gctggtgtca 1440
accgcctcac cactggtctt gatctaccac tggtaggtat tggtgtggct acctcaggaa 1500
aagtcaccaa cgcgggcgtt gtcaccgcaa gcaacttggg ctgggatggc gttgatatcg 1560
ccggccgtct gaactaccaa ttcagcgttc cagcaaccgt ggcatcagca attcctgcca 1620
tcgcagcttc tgaactgcag gcttccccac ttccccaccc tgagcagcca actcccatca 1680
ccttgacctt ctacgccgat gactctgtgg gcgcggccta cagcaatgat ttgggagtac 1740
atgtcattgg accactggct acaactcgtg gatcaggttt ggatactttg ggcatggctg 1800
ctgaagatgc gctgagcacc caaggtttct taagcagggt ttctgatcag ggtatctttg 1860
ccaacagcct tggtgagcta gtcaccattg ctaaagacaa tgaaaccgca cgggaattcc 1920
tcaacgatcg cgcgaccctg ctggctcaca ctgccgcaga agctgctgaa acagttaagc 1980
catccaccct ggttctctcg ggatcggcgt tttccgaaga tccacaaggt cggttggtgt 2040
tcgcttccca attgaagaag gaatacgacg cagacattga gctccgcttg atccccaccc 2100
accgggaaaa tgtccgcgca gcagctcgcg cagtcgcact tgatcgacta ctcaacgagc 2160
cacttaccct cgtaccctaa 2180
<210> 109
<211> 2247
<212> DNA
<213> 人工序列
<220>
<223> 启动子 P4
<400> 109
ccctcatgag ttcaggggtt agaaaagcaa tgggatttgg atgcggttcg gttttggccg 60
tcatcatggt tatctcattt gttggatggg cgcttagctt catggatgga acggcaccta 120
ttcgccaact ccagcaaatc cctgaagatg ttccgccggc gcgtggtgta gaagttccgc 180
aaattgatac aggggcagat ggacgcacgt cagatcattt gcgtttttgg gcggaaccaa 240
ttgctcaaga tgctggtgtg tccgctcaag cgattgcggc ttatggaaac gcagagctca 300
ttgcgagtac tgcgtggcct ggctgcaatc tggggtggaa taccttggca ggtatcggcc 360
aggtggaaac ccgtcacggt acctacaacg gcaaaatgtt cgggggcagt tccctggatg 420
aaaatggagt tgcaacccct ccaatcatcg gcgttccact tgatggttca ccggggtttg 480
cggaaattcc cgacactgat ggtggggaat tagatggcga tactgaatat gatcgcgcgg 540
taggtcccat gcagttcatt ccggaaacgt ggcgacttat gggattggat gcaaacggtg 600
atggggtagc ggaccccaac caaattgatg acgcagcatt gagtgccgca aacctgttgt 660
gttccaacga tcgtgacttg tccactcctg aaggatggac cgcagctgtt cattcttaca 720
acatgtctaa tcagtatttg atggacgttc gagatgctgc cgcgtcctac gctttacgac 780
agccggcgat ctaaaactta acaagcgcaa cccccgaaaa tgtgagatta tgtccggtcg 840
gacacgtgcg ggctggggat atgggtagtt taataaattt ataccacaca gtctattgca 900
atagaccaag ctgttcagta gggtgcatgg gagaagaatt tcctaataaa aactcttaag 960
gacctccaag tggctgaaat catgcacgta ttcgctcgcg aaattctcga ctcccgcggt 1020
aacccaaccg tcgaggcaga ggttttcctt gatgacggtt cccacggtgt cgcaggtgtt 1080
ccatccggcg catccaccgg cgtccacgag gctcatgagc tgcgtgacgg tggcgatcgc 1140
tacctgggca agggcgtttt gaaggcagtt gaaaacgtca acgaagaaat cggcgacgag 1200
ctcgctggcc tagaggctga cgatcagcgc ctcatcgacg aagcaatgat caagcttgat 1260
ggcaccgcca acaagtcccg cctgggtgca aacgcaatcc ttggtgtttc catggctgtt 1320
gcaaaggctg ctgctgattc cgcaggcctc ccactgttcc gctacatcgg tggaccaaac 1380
gcacacgttc ttccagttcc aatgatgaac atcatcaacg gtggcgctca cgctgactcc 1440
ggtgttgacg ttcaggaatt catgatcgct ccaatcggtg cagagacctt ctctgaggct 1500
ctccgcaacg gcgcagaggt ctaccacgca ctgaagtccg tcatcaagga aaagggcctg 1560
tccaccggac ttggcgatga gggcggcttc gctccttccg tcggctccac ccgtgaggct 1620
cttgacctta tcgttgaggc aatcgagaag gctggcttca ccccaggcaa ggacatcgct 1680
cttgctctgg acgttgcttc ctctgagttc ttcaaggacg gcacctacca cttcgaaggt 1740
ggccagcact ccgcagctga gatggcaaac gtttacgctg agctcgttga cgcgtaccca 1800
atcgtctcca tcgaggaccc actgcaggaa gatgactggg agggttacac caacctcacc 1860
gcaaccatcg gcgacaaggt tcagatcgtt ggcgacgact tcttcgtcac caaccctgag 1920
cgcctgaagg agggcatcgc taagaaggct gccaactcca tcctggttaa ggtgaaccag 1980
atcggtaccc tcaccgagac cttcgacgct gtcgacatgg ctcaccgcgc aggctacacc 2040
tccatgatgt cccaccgttc cggtgagacc gaggacacca ccattgctga cctcgcagtt 2100
gcactcaact gtggccagat caagactggt gctccagcac gttccgaccg tgtcgcaaag 2160
tacaaccagc ttctccgcat cgagcagttg cttggcgacg ccggcgtcta cgcaggtcgc 2220
agcgcattcc cacgctttca gggctaa 2247
<210> 110
<211> 2192
<212> DNA
<213> 人工序列
<220>
<223> 启动子 P8
<400> 110
tcaccgagtc tttgatcaag ggtggcgctt ttgactccct tggacacgca cgaaaaggcc 60
tcatgctggt cttcgaagat gccgttgatt ccgtcatcgc taccaaaaaa gctgctgaca 120
agggacaatt tgatctcttt gcagctttcg actcggataa caacgacgat gtggcaagtt 180
tcttccagat caccgttcct gatgacgaat gggaccgtaa gcatgagctc gcactcgagc 240
gagaaatgct gggtctgtat gtttctggac acccactcga tggctatgaa gatgccattg 300
ctgcccaggt tgatacagca ctgaccacca ttgttgccgg tgaactcaag cacggcgcag 360
aagtgaccgt gggtggcatt atctctggtg tggatcgacg gttctccaag aaggacggtt 420
ccccttgggc gattgtcacc attgaagatc acaacggcgc gtccgttgaa ttgttggtct 480
tcaacaaggt gtattccatc gttggatcca tgattgtgga agacaacatc attttggcca 540
aggcacacat ctccattcga gatgatcgta tgagcctttt ctgtgatgat ctccgcgttc 600
cagagcttgg gccaggaaac gggcaaggac ttccgcttcg tttgtccatg cgtactgatc 660
agtgcaccat gtccaacatt gccaagctca agcaggtgct ggtggacaac aagggtgaat 720
ctgatgtgta cctcaatttg atcgatgggg ataactccac ggtcatgatt ttgggtgatc 780
acttaagagt caaccgatcc gcaagtttga tgggcgacct caaggcaacg atggggccag 840
gcatcctcgg ttaatcacat cacactggga ttaccccgtg taggggtgaa aacccgaatg 900
tggctaaaac ttttggaaac ttaagttacc tttaatcgga aacttattga attcgggtga 960
ggcaactgca actctggact taaagcatga gccagaaccg catcaggacc actcacgttg 1020
gttccttgcc ccgtacccca gagctacttg atgcaaacat caagcgctct aacggtgaga 1080
ttggggagga ggaattcttc cagatcctgc agtcttctgt agatgacgtg atcaagcgcc 1140
aggttgacct gggtatcgac atcctcaacg agggcgaata cggccacgtc acctccggtg 1200
cagttgactt cggtgcatgg tggaactact ccttcacccg cctgggcgga ctgaccatga 1260
ccgataccga ccgttgggca agccaggaag cagtgcgttc cacccctggc aacatcaagc 1320
tgaccagctt ctctgatcgt cgcgaccgcg cattgttcag cgaagcatac gaggatccag 1380
tatctggcat cttcaccggc cgcgcttctg tgggcaaccc agagttcacc ggacctatta 1440
cctacattgg ccaggaagaa actcagacgg atgttgatct gctgaagaag ggcatgaacg 1500
cagcgggagc taccgacggc ttcgttgcag cactatcccc aggatctgca gctcgattga 1560
ccaacaagtt ctacgacact gatgaagaag tcgtcgcagc atgtgccgat gcgctttccc 1620
aggaatacaa gatcatcacc gatgcaggtc tgaccgttca gctcgacgca ccggacttgg 1680
cagaagcatg ggatcagatc aacccagagc caagcgtgaa ggattactta gactggatcg 1740
gtacacgcat cgatgccatc aacagtgcag tgaagggcct tccaaaggaa cagacccgcc 1800
tgcacatctg ctggggctct tggcacggac cacacgtcac tgacatccca ttcggtgaca 1860
tcattggtga gatcctgcgc gcagaggtcg gtggcttctc cttcgaaggc gcatctcctc 1920
gtcacgcaca cgagtggcgt gtatgggaag aaaacaagct tcctgaaggc tctgttatct 1980
accctggtgt tgtgtctcac tccatcaacg ctgtggagca cccacgcctg gttgctgatc 2040
gtatcgttca gttcgccaag cttgttggcc ctgagaacgt cattgcgtcc actgactgtg 2100
gtctgggcgg acgtctgcat tcccagatcg catgggcaaa gctggagtcc ctagtagagg 2160
gcgctcgcat tgcatcaaag gaactgttct aa 2192
<210> 111
<211> 97
<212> DNA
<213> 人工序列
<220>
<223> 启动子 P3
<400> 111
tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtaa gatggaaacg 60
tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97
<210> 112
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 112
ccaagcttgc atgcctcacc gagtctttga tcaag 35
<210> 113
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 113
caaaagtttt agccacattc gggttttcac cccta 35
<210> 114
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 114
ctctggactt aaagcatgag ccagaaccgc atcag 35
<210> 115
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 115
cggtacccgg ggatcttaga acagttcctt tgatg 35
<210> 116
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> P8 启动子的DNA片段
<400> 116
gtggctaaaa cttttggaaa cttaagttac ctttaatcgg aaacttattg aattcgggtg 60
aggcaactgc aactctggac ttaaagc 87
<210> 117
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 117
gtgaaaaccc gaatgtggct aaaacttttg gaaac 35
<210> 118
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 118
gcggttctgg ctcatgcttt aagtccagag ttgca 35
<210> 119
<211> 1206
<212> DNA
<213> 谷氨酸棒杆菌
<400> 119
atgagccaga accgcatcag gaccactcac gttggttcct tgccccgtac cccagagcta 60
cttgatgcaa acatcaagcg ttctaacggt gagattgggg aggaggaatt cttccagatt 120
ctgcagtctt ctgtagatga cgtgatcaag cgccaggttg acctgggtat cgacatcctt 180
aacgagggcg aatacggcca cgtcacctcc ggtgcagttg acttcggtgc atggtggaac 240
tactccttca cccgcctggg cggactgacc atgaccgata ccgaccgttg ggcaagccag 300
gaagcagtgc gttccacccc tggcaacatc aagctgacca gcttctctga tcgtcgcgac 360
cgcgcattgt tcagcgaagc atacgaggat ccagtatctg gcatcttcac cggtcgcgct 420
tctgtgggca acccagagtt caccggacct attacctaca ttggccagga agaaactcag 480
acggatgttg atctgctgaa gaagggcatg aacgcagcgg gagctaccga cggcttcgtt 540
gcagcactat ccccaggatc tgcagctcga ttgaccaaca agttctacga cactgatgaa 600
gaagtcgtcg cagcatgtgc tgatgcgctt tcccaggaat acaagatcat caccgatgca 660
ggtctgaccg ttcagctcga cgcaccggac ttggcagaag catgggatca gatcaaccca 720
gagccaagcg tgaaggatta cttggactgg atcggtacac gcatcgatgc catcaacagt 780
gcagtgaagg gccttccaaa ggaacagacc cgcctgcaca tctgctgggg ctcttggcac 840
ggaccacacg tcactgacat cccattcggt gacatcattg gtgagatcct gcgcgcagag 900
gtcggtggct tctccttcga aggcgcatct cctcgtcacg cacacgagtg gcgtgtatgg 960
gaagaaaaca agcttcctga aggctctgtt atctaccctg gtgttgtgtc tcactccatc 1020
aacgctgtgg agcacccacg cctggttgct gatcgtatcg ttcagttcgc caagcttgtt 1080
ggccctgaga acgtcattgc gtccactgac tgtggtctgg gcggacgtct gcattcccag 1140
atcgcatggg caaagctgga gtccctagta gagggcgctc gcattgcatc aaaggaactg 1200
ttctaa 1206
<210> 120
<211> 401
<212> PRT
<213> 谷氨酸棒杆菌
<400> 120
Met Ser Gln Asn Arg Ile Arg Thr Thr His Val Gly Ser Leu Pro Arg
1               5                   10                  15
Thr Pro Glu Leu Leu Asp Ala Asn Ile Lys Arg Ser Asn Gly Glu Ile
            20                  25                  30
Gly Glu Glu Glu Phe Phe Gln Ile Leu Gln Ser Ser Val Asp Asp Val
        35                  40                  45
Ile Lys Arg Gln Val Asp Leu Gly Ile Asp Ile Leu Asn Glu Gly Glu
    50                  55                  60
Tyr Gly His Val Thr Ser Gly Ala Val Asp Phe Gly Ala Trp Trp Asn
65                  70                  75                  80
Tyr Ser Phe Thr Arg Leu Gly Gly Leu Thr Met Thr Asp Thr Asp Arg
                85                  90                  95
Trp Ala Ser Gln Glu Ala Val Arg Ser Thr Pro Gly Asn Ile Lys Leu
            100                 105                 110
Thr Ser Phe Ser Asp Arg Arg Asp Arg Ala Leu Phe Ser Glu Ala Tyr
        115                 120                 125
Glu Asp Pro Val Ser Gly Ile Phe Thr Gly Arg Ala Ser Val Gly Asn
    130                 135                 140
Pro Glu Phe Thr Gly Pro Ile Thr Tyr Ile Gly Gln Glu Glu Thr Gln
145                 150                 155                 160
Thr Asp Val Asp Leu Leu Lys Lys Gly Met Asn Ala Ala Gly Ala Thr
                165                 170                 175
Asp Gly Phe Val Ala Ala Leu Ser Pro Gly Ser Ala Ala Arg Leu Thr
            180                 185                 190
Asn Lys Phe Tyr Asp Thr Asp Glu Glu Val Val Ala Ala Cys Ala Asp
        195                 200                 205
Ala Leu Ser Gln Glu Tyr Lys Ile Ile Thr Asp Ala Gly Leu Thr Val
    210                 215                 220
Gln Leu Asp Ala Pro Asp Leu Ala Glu Ala Trp Asp Gln Ile Asn Pro
225                 230                 235                 240
Glu Pro Ser Val Lys Asp Tyr Leu Asp Trp Ile Gly Thr Arg Ile Asp
                245                 250                 255
Ala Ile Asn Ser Ala Val Lys Gly Leu Pro Lys Glu Gln Thr Arg Leu
            260                 265                 270
His Ile Cys Trp Gly Ser Trp His Gly Pro His Val Thr Asp Ile Pro
        275                 280                 285
Phe Gly Asp Ile Ile Gly Glu Ile Leu Arg Ala Glu Val Gly Gly Phe
    290                 295                 300
Ser Phe Glu Gly Ala Ser Pro Arg His Ala His Glu Trp Arg Val Trp
305                 310                 315                 320
Glu Glu Asn Lys Leu Pro Glu Gly Ser Val Ile Tyr Pro Gly Val Val
                325                 330                 335
Ser His Ser Ile Asn Ala Val Glu His Pro Arg Leu Val Ala Asp Arg
            340                 345                 350
Ile Val Gln Phe Ala Lys Leu Val Gly Pro Glu Asn Val Ile Ala Ser
        355                 360                 365
Thr Asp Cys Gly Leu Gly Gly Arg Leu His Ser Gln Ile Ala Trp Ala
    370                 375                 380
Lys Leu Glu Ser Leu Val Glu Gly Ala Arg Ile Ala Ser Lys Glu Leu
385                 390                 395                 400
Phe
<210> 121
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 121
ccaagcttgc atgccccctc atgagttcag gggtt 35
<210> 122
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 122
tggtataaat ttattaaact acccatatcc ccagc 35
<210> 123
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 123
cttaaggacc tccaagtggc tgaaatcatg cacgt 35
<210> 124
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 124
cggtacccgg ggatcttagc cctgaaagcg tggga 35
<210> 125
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> DNA fragment of P4 启动子
<400> 125
aataaattta taccacacag tctattgcaa tagaccaagc tgttcagtag ggtgcatggg 60
agaagaattt cctaataaaa actcttaagg acctccaa 98
<210> 126
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 126
ggatatgggt agtttaataa atttatacca cacag 35
<210> 127
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 127
catgatttca gccacttgga ggtccttaag agttt 35
<210> 128
<211> 1278
<212> DNA
<213> 谷氨酸棒杆菌
<400> 128
gtggctgaaa tcatgcacgt attcgctcgc gaaattctcg actcccgcgg taacccaacc 60
gtcgaggcag aggttttcct tgatgacggt tcccacggtg tcgcaggtgt tccatccggc 120
gcatccaccg gcgtccacga ggctcatgag ctgcgtgacg gtggcgatcg ctacctgggc 180
aagggcgttt tgaaggcagt tgaaaacgtc aacgaagaaa tcggcgacga gctcgctggc 240
ctagaggctg acgatcagcg cctcatcgac gaagcaatga tcaagcttga tggcaccgcc 300
aacaagtccc gcctgggtgc aaacgcaatc cttggtgttt ccatggctgt tgcaaaggct 360
gctgctgatt ccgcaggcct cccactgttc cgctacatcg gtggaccaaa cgcacacgtt 420
cttccagttc caatgatgaa catcatcaac ggtggcgctc acgctgactc cggtgttgac 480
gttcaggaat tcatgatcgc tccaatcggt gcagagacct tctctgaggc tctccgcaac 540
ggcgcagagg tctaccacgc actgaagtcc gtcatcaagg aaaagggcct gtccaccgga 600
cttggcgatg agggcggctt cgctccttcc gtcggctcca cccgtgaggc tcttgacctt 660
atcgttgagg caatcgagaa ggctggcttc accccaggca aggacatcgc tcttgctctg 720
gacgttgctt cctctgagtt cttcaaggac ggcacctacc acttcgaagg tggccagcac 780
tccgcagctg agatggcaaa cgtttacgct gagctcgttg acgcgtaccc aatcgtctcc 840
atcgaggacc cactgcagga agatgactgg gagggttaca ccaacctcac cgcaaccatc 900
ggcgacaagg ttcagatcgt tggcgacgac ttcttcgtca ccaaccctga gcgcctgaag 960
gagggcatcg ctaagaaggc tgccaactcc atcctggtta aggtgaacca gatcggtacc 1020
ctcaccgaga ccttcgacgc tgtcgacatg gctcaccgcg caggctacac ctccatgatg 1080
tcccaccgtt ccggtgagac cgaggacacc accattgctg acctcgcagt tgcactcaac 1140
tgtggccaga tcaagactgg tgctccagca cgttccgacc gtgtcgcaaa gtacaaccag 1200
cttctccgca tcgagcagtt gcttggcgac gccggcgtct acgcaggtcg cagcgcattc 1260
ccacgctttc agggctaa 1278
<210> 129
<211> 425
<212> PRT
<213> 谷氨酸棒杆菌
<400> 129
Met Ala Glu Ile Met His Val Phe Ala Arg Glu Ile Leu Asp Ser Arg
1               5                   10                  15
Gly Asn Pro Thr Val Glu Ala Glu Val Phe Leu Asp Asp Gly Ser His
            20                  25                  30
Gly Val Ala Gly Val Pro Ser Gly Ala Ser Thr Gly Val His Glu Ala
        35                  40                  45
His Glu Leu Arg Asp Gly Gly Asp Arg Tyr Leu Gly Lys Gly Val Leu
    50                  55                  60
Lys Ala Val Glu Asn Val Asn Glu Glu Ile Gly Asp Glu Leu Ala Gly
65                  70                  75                  80
Leu Glu Ala Asp Asp Gln Arg Leu Ile Asp Glu Ala Met Ile Lys Leu
                85                  90                  95
Asp Gly Thr Ala Asn Lys Ser Arg Leu Gly Ala Asn Ala Ile Leu Gly
            100                 105                 110
Val Ser Met Ala Val Ala Lys Ala Ala Ala Asp Ser Ala Gly Leu Pro
        115                 120                 125
Leu Phe Arg Tyr Ile Gly Gly Pro Asn Ala His Val Leu Pro Val Pro
    130                 135                 140
Met Met Asn Ile Ile Asn Gly Gly Ala His Ala Asp Ser Gly Val Asp
145                 150                 155                 160
Val Gln Glu Phe Met Ile Ala Pro Ile Gly Ala Glu Thr Phe Ser Glu
                165                 170                 175
Ala Leu Arg Asn Gly Ala Glu Val Tyr His Ala Leu Lys Ser Val Ile
            180                 185                 190
Lys Glu Lys Gly Leu Ser Thr Gly Leu Gly Asp Glu Gly Gly Phe Ala
        195                 200                 205
Pro Ser Val Gly Ser Thr Arg Glu Ala Leu Asp Leu Ile Val Glu Ala
    210                 215                 220
Ile Glu Lys Ala Gly Phe Thr Pro Gly Lys Asp Ile Ala Leu Ala Leu
225                 230                 235                 240
Asp Val Ala Ser Ser Glu Phe Phe Lys Asp Gly Thr Tyr His Phe Glu
                245                 250                 255
Gly Gly Gln His Ser Ala Ala Glu Met Ala Asn Val Tyr Ala Glu Leu
            260                 265                 270
Val Asp Ala Tyr Pro Ile Val Ser Ile Glu Asp Pro Leu Gln Glu Asp
        275                 280                 285
Asp Trp Glu Gly Tyr Thr Asn Leu Thr Ala Thr Ile Gly Asp Lys Val
    290                 295                 300
Gln Ile Val Gly Asp Asp Phe Phe Val Thr Asn Pro Glu Arg Leu Lys
305                 310                 315                 320
Glu Gly Ile Ala Lys Lys Ala Ala Asn Ser Ile Leu Val Lys Val Asn
                325                 330                 335
Gln Ile Gly Thr Leu Thr Glu Thr Phe Asp Ala Val Asp Met Ala His
            340                 345                 350
Arg Ala Gly Tyr Thr Ser Met Met Ser His Arg Ser Gly Glu Thr Glu
        355                 360                 365
Asp Thr Thr Ile Ala Asp Leu Ala Val Ala Leu Asn Cys Gly Gln Ile
    370                 375                 380
Lys Thr Gly Ala Pro Ala Arg Ser Asp Arg Val Ala Lys Tyr Asn Gln
385                 390                 395                 400
Leu Leu Arg Ile Glu Gln Leu Leu Gly Asp Ala Gly Val Tyr Ala Gly
                405                 410                 415
Arg Ser Ala Phe Pro Arg Phe Gln Gly
            420                 425
<210> 130
<211> 666
<212> DNA
<213> 智人
<400> 130
atgggtgaca ccaaggagca gcgcatcctg aaccacgtgc tgcagcatgc ggagcccggg 60
aacgcacaga gcgtgctgga ggccattgac acctactgcg agcagaagga gtgggccatg 120
aacgtgggcg acaagaaagg caagatcgtg gacgccgtga ttcaggagca ccagccctcc 180
gtgctgctgg agctgggggc ctactgtggc tactcagctg tgcgcatggc ccgcctgctg 240
tcaccagggg cgaggctcat caccatcgag atcaaccccg actgtgccgc catcacccag 300
cggatggtgg atttcgctgg cgtgaaggac aaggtcaccc ttgtggttgg agcgtcccag 360
gacatcatcc cccagctgaa gaagaagtat gatgtggaca cactggacat ggtcttcctc 420
gaccactgga aggaccggta cctgccggac acgcttctct tggaggaatg tggcctgctg 480
cggaagggga cagtgctact ggctgacaac gtgatctgcc caggtgcgcc agacttccta 540
gcacacgtgc gcgggagcag ctgctttgag tgcacacact accaatcgtt cctggaatac 600
agggaggtgg tggacggcct ggagaaggcc atctacaagg gcccaggcag cgaagcaggg 660
ccttaa 666
<210> 131
<211> 675
<212> DNA
<213> 智人
<400> 131
catatggggg ataccaaaga acagcggatt ctgaatcatg ttttacagca cgctgaaccg 60
ggcaatgctc agagcgtttt agaagcaata gatacctatt gtgaacagaa ggaatgggca 120
atgaatgttg gcgataaaaa gggcaaaatt gttgatgcag ttatccagga acatcagccg 180
agcgttttac ttgaactggg cgcatattgc ggttattccg cagttcggat ggcacggctg 240
ctgtcccctg gcgctcgctt aattaccatt gaaattaatc cggattgcgc agcaattacc 300
cagcggatgg ttgactttgc aggtgttaaa gataaagtca ccttggttgt cggcgctagc 360
caggatatta ttccgcagct gaaaaaaaaa tacgatgttg ataccctgga tatggtcttt 420
ttagatcatt ggaaagatcg gtatctgccc gatactctgt tattggaaga gtgcggtctg 480
ctgcggaaag gcaccgttct actggcagat aatgttattt gtcctggggc tcctgatttt 540
ctagctcatg ttcggggcag cagctgtttc gaatgtaccc attaccaatc gtttctggaa 600
tatcgcgaag ttgttgatgg tctggaaaag gcaatttata aaggtcctgg tagcgaggct 660
ggcccgtaag agctc 675
<210> 132
<211> 6557
<212> DNA
<213> 人工序列
<220>
<223> pELAC载体
<400> 132
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 600
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 660
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 720
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 780
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 840
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 900
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 960
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 1020
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 1080
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 1140
tgcagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 1200
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 1260
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 1320
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 1380
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 1440
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 1500
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 1560
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1620
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1680
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1740
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1800
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1860
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1920
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1980
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 2040
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 2100
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 2160
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 2220
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2280
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2340
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2400
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatatgg 2460
tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 2520
cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 2580
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 2640
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagctg cggtaaagct 2700
catcagcgtg gtcgtgaagc gattcacaga tgtctgcctg ttcatccgcg tccagctcgt 2760
tgagtttctc cagaagcgtt aatgtctggc ttctgataaa gcgggccatg ttaagggcgg 2820
ttttttcctg tttggtcact gatgcctccg tgtaaggggg atttctgttc atgggggtaa 2880
tgataccgat gaaacgagag aggatgctca cgatacgggt tactgatgat gaacatgccc 2940
ggttactgga acgttgtgag ggtaaacaac tggcggtatg gatgcggcgg gaccagagaa 3000
aaatcactca gggtcaatgc cagcgcttcg ttaatacaga tgtaggtgtt ccacagggta 3060
gccagcagca tcctgcgatg cagatccgga acataatggt gcagggcgct gacttccgcg 3120
tttccagact ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag 3180
acgttttgca gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac 3240
cagtaaggca accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca 3300
cccgtggggc cgccatgccg gcgataatgg cctgcttctc gccgaaacgt ttggtggcgg 3360
gaccagtgac gaaggcttga gcgagggcgt gcaagattcc gaataccgca agcgacaggc 3420
cgatcatcgt cgcgctccag cgaaagcggt cctcgccgaa aatgacccag agcgctgccg 3480
gcacctgtcc tacgagttgc atgataaaga agacagtcat aagtgcggcg acgatagtca 3540
tgccccgcgc ccaccggaag gagctgactg ggttgaaggc tctcaagggc atcggtcgag 3600
atcccggtgc ctaatgagtg agctaactta cattaattgc gttgcgctca ctgcccgctt 3660
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 3720
gcggtttgcg tattgggcgc cagggtggtt tttcttttca ccagtgagac gggcaacagc 3780
tgattgccct tcaccgcctg gccctgagag agttgcagca agcggtccac gctggtttgc 3840
cccagcaggc gaaaatcctg tttgatggtg gttaacggcg ggatataaca tgagctgtct 3900
tcggtatcgt cgtatcccac taccgagata tccgcaccaa cgcgcagccc ggactcggta 3960
atggcgcgca ttgcgcccag cgccatctga tcgttggcaa ccagcatcgc agtgggaacg 4020
atgccctcat tcagcatttg catggtttgt tgaaaaccgg acatggcact ccagtcgcct 4080
tcccgttccg ctatcggctg aatttgattg cgagtgagat atttatgcca gccagccaga 4140
cgcagacgcg ccgagacaga acttaatggg cccgctaaca gcgcgatttg ctggtgaccc 4200
aatgcgacca gatgctccac gcccagtcgc gtaccgtctt catgggagaa aataatactg 4260
ttgatgggtg tctggtcaga gacatcaaga aataacgccg gaacattagt gcaggcagct 4320
tccacagcaa tggcatcctg gtcatccagc ggatagttaa tgatcagccc actgacgcgt 4380
tgcgcgagaa gattgtgcac cgccgcttta caggcttcga cgccgcttcg ttctaccatc 4440
gacaccacca cgctggcacc cagttgatcg gcgcgagatt taatcgccgc gacaatttgc 4500
gacggcgcgt gcagggccag actggaggtg gcaacgccaa tcagcaacga ctgtttgccc 4560
gccagttgtt gtgccacgcg gttgggaatg taattcagct ccgccatcgc cgcttccact 4620
ttttcccgcg ttttcgcaga aacgtggctg gcctggttca ccacgcggga aacggtctga 4680
taagagacac cggcatactc tgcgacatcg tataacgtta ctggtttcac attcaccacc 4740
ctgaattgac tctcttccgg gcgctatcat gccataccgc gaaaggtttt gcgccattcg 4800
atggtgtccg ggatctcgac gctctccctt atgcgactcc tgcattagga agcagcccag 4860
tagtaggttg aggccgttga gcaccgccgc cgcaaggaat ggtgcatgca aggagatggc 4920
gcccaacagt cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat 4980
gagcccgaag tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc 5040
aaccgcacct gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat 5100
ctgcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 5160
ctttacactt tatgcttccg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc 5220
acacaggatc tagatttaag aaggagatat acatatggcc gaagaaggta aactggtaat 5280
ctggattaac ggcgataaag gctataacgg tctcgctgaa gtcggtaaga aattcgagaa 5340
agataccgga attaaagtca ccgttgagca tccggataaa ctggaagaga aattcccaca 5400
ggttgcggca acaggcgatg gccctgacat tatcttctgg gcacacgacc gctttggtgg 5460
ctacgctcaa tctggcctgt tggctgaaat caccccggac aaagcgttcc aggacaagct 5520
gtatccgttt acctgggatg ccgtacgtta caacggcaag ctgattgctt acccgatcgc 5580
tgttgaagcg ttatcgctga tttataacaa agatctgctg ccgaacccgc caaaaacctg 5640
ggaagagatc ccggcgctgg ataaagaact gaaagcgaaa ggtaagagcg cgctgatgtt 5700
caacctgcaa gaaccgtact tcacctggcc gctgattgct gctgacgggg gttatgcgtt 5760
caagtatgaa aacggcaagt acgacattaa agacgtgggc gtggataacg ctggcgcgaa 5820
agcgggtctg accttcctgg ttgacctgat taaaaacaaa cacatgaatg cagacaccga 5880
ttactccatc gcagaagctg cctttaataa aggcgaaaca gcgatgacca tcaacggccc 5940
gtgggcatgg tccaacatcg acaccagcaa agtgaattat ggtgtaacgg tactgccgac 6000
cttcaagggt caaccatcca aaccgttcgt tggcgtgctg agcgcaggta ttaacgccgc 6060
cagtccgaac aaagagctgg caaaagagtt cctcgaaaac tatctgctga ctgatgaagg 6120
tctggaagcg gttaataaag acaaaccgct gggtgccgta gcgctgaagt cttacgagga 6180
agagttggcg aaagatccac gtattgccgc cactatggaa aacgcccaga aaggtgaaat 6240
catgccgaac atcccgcaga tgtccgcttt ctggtatgcc gtgcgtactg cggtgatcaa 6300
cgccgccagc ggtcgtcaga ctgtcgatga agccctgaaa gacgcgcaga ctaaggatcc 6360
gaattcgagc tccgtcgaca agcttgcggc cgcactcgag caccaccacc accaccactg 6420
agatccggct gctaacaaag cccgaaagga agctgagttg gctgctgcca ccgctgagca 6480
ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt tgctgaaagg 6540
aggaactata tccggat 6557
<210> 133
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 133
gtgagttagc tcactcatta gg 22
<210> 134
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 134
cgattggtaa tgggtacatt cg 22
<210> 135
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 135
ggatctcagt ggtggtggtg 20
<210> 136
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 136
ccaagcttgc atgccaaatt cctgtgaatt agctgattta gtac 44
<210> 137
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 137
tttggtatcc cccatagagg cgaaggctcc ttgaatag 38
<210> 138
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 138
atgggggata ccaaagaaca gc 22
<210> 139
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 139
cggtacccgg ggatcatgct agttattgct cagcggtg 38
<210> 140
<211> 666
<212> DNA
<213> Niastella koreensis
<400> 140
atgaataatc aaatttttga atccgttgac cattatatca gcgatttact gggttacgaa 60
gacgatgcat tgcttgccgc caccaattca ttagccgaag caggcatgcc tgccatcagc 120
gtatcaccca accagggcaa gtttctgcaa ttactggccc aattgtgcca ggcaaaaaat 180
atcctggagc tgggcacact ggcaggctac agcaccattt ggatggcccg ggccttaccc 240
aaaaacggcc ggctcatcac ccttgaatat gaccccaaac atgcggccgt tgcacaaaaa 300
aatatcgacc gggccggcct tacttcacaa gtacagatca gaaccggtaa agcaattgac 360
atattaccgc aattagtgga agaaggcgcc ggaccttttg atatgatctt tatcgatgcc 420
gataaaccac cttacaccga atattttcaa tgggcgcttc ggttatcacg tcccggtaca 480
ctcatcgtgg ccgataatgt gatccgtgat ggcaaagtgc tggatgaaaa cagtacggag 540
cctgctgtac agggcgcaag acgtttcaat gccatgctgg gcgccaatac cgccgttgac 600
gccaccattc ttcaaatggt aggtgtaaaa gaatacgatg gaatggcttt ggccatagta 660
aaataa 666
<210> 141
<211> 221
<212> PRT
<213> Niastella koreensis
<400> 141
Met Asn Asn Gln Ile Phe Glu Ser Val Asp His Tyr Ile Ser Asp Leu
1               5                   10                  15
Leu Gly Tyr Glu Asp Asp Ala Leu Leu Ala Ala Thr Asn Ser Leu Ala
            20                  25                  30
Glu Ala Gly Met Pro Ala Ile Ser Val Ser Pro Asn Gln Gly Lys Phe
        35                  40                  45
Leu Gln Leu Leu Ala Gln Leu Cys Gln Ala Lys Asn Ile Leu Glu Leu
    50                  55                  60
Gly Thr Leu Ala Gly Tyr Ser Thr Ile Trp Met Ala Arg Ala Leu Pro
65                  70                  75                  80
Lys Asn Gly Arg Leu Ile Thr Leu Glu Tyr Asp Pro Lys His Ala Ala
                85                  90                  95
Val Ala Gln Lys Asn Ile Asp Arg Ala Gly Leu Thr Ser Gln Val Gln
            100                 105                 110
Ile Arg Thr Gly Lys Ala Ile Asp Ile Leu Pro Gln Leu Val Glu Glu
        115                 120                 125
Gly Ala Gly Pro Phe Asp Met Ile Phe Ile Asp Ala Asp Lys Pro Pro
    130                 135                 140
Tyr Thr Glu Tyr Phe Gln Trp Ala Leu Arg Leu Ser Arg Pro Gly Thr
145                 150                 155                 160
Leu Ile Val Ala Asp Asn Val Ile Arg Asp Gly Lys Val Leu Asp Glu
                165                 170                 175
Asn Ser Thr Glu Pro Ala Val Gln Gly Ala Arg Arg Phe Asn Ala Met
            180                 185                 190
Leu Gly Ala Asn Thr Ala Val Asp Ala Thr Ile Leu Gln Met Val Gly
        195                 200                 205
Val Lys Glu Tyr Asp Gly Met Ala Leu Ala Ile Val Lys
    210                 215                 220
<210> 142
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 142
catgattacg ccaagcttgc atgccaaatt cctgtgatta gctgatttag 50
<210> 143
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 143
cggattcgaa gatctggttg ttcatagagg cgaaggctcc ttgaataggt 50
<210> 144
<211> 778
<212> DNA
<213> Niastella koreensis
<400> 144
atgaacaacc agatcttcga atccgtcgat cactatattt ctgatcttct gggctacgag 60
gatgatgcgc ttttggccgc cactaattcc ctggccgagg caggtatgcc ggctattagc 120
gtttccccga accagggcaa atttttgcaa ctgctggccc aactttgcca agccaaaaac 180
attttggagc ttggtacgtt ggccggctat tcgaccatct ggatggctcg cgctctcccc 240
aagaacggcc gccttatcac cctggaatac gatccgaagc atgccgcggt agctcagaag 300
aacattgatc gcgctggctt gaccagccaa gtgcaaatcc gcacgggtaa agcaatcgac 360
atcctgccgc agctggtgga ggagggtgcc ggtccatttg atatgatctt cattgatgcc 420
gataagcccc catacaccga atactttcaa tgggctctgc gactgtcccg ccccggcact 480
ctcatcgtcg cggataatgt catccgcgat ggaaaggtgc tggacgaaaa ctccaccgag 540
cctgccgtcc aaggtgcccg ccgttttaat gccatgctcg gtgctaatac ggcagttgac 600
gcaaccatcc tccaaatggt gggcgtgaaa gagtacgacg gcatggcgct ggccatcgtt 660
aagtaaaagc ttgcggccgc actcgagcac caccaccacc accactgaga tccggctgct 720
aacaaagccc gaaaggaagc tgagttggct gctgccaccg ctgagcaata actagcat 778
<210> 145
<211> 666
<212> DNA
<213> Niastella koreensis
<400> 145
atgaacaacc agatcttcga atccgtcgat cactatattt ctgatcttct gggctacgag 60
gatgatgcgc ttttggccgc cactaattcc ctggccgagg caggtatgcc ggctattagc 120
gtttccccga accagggcaa atttttgcaa ctgctggccc aactttgcca agccaaaaac 180
attttggagc ttggtacgtt ggccggctat tcgaccatct ggatggctcg cgctctcccc 240
aagaacggcc gccttatcac cctggaatac gatccgaagc atgccgcggt agctcagaag 300
aacattgatc gcgctggctt gaccagccaa gtgcaaatcc gcacgggtaa agcaatcgac 360
atcctgccgc agctggtgga ggagggtgcc ggtccatttg atatgatctt cattgatgcc 420
gataagcccc catacaccga atactttcaa tgggctctgc gactgtcccg ccccggcact 480
ctcatcgtcg cggataatgt catccgcgat ggaaaggtgc tggacgaaaa ctccaccgag 540
cctgccgtcc aaggtgcccg ccgttttaat gccatgctcg gtgctaatac ggcagttgac 600
gcaaccatcc tccaaatggt gggcgtgaaa gagtacgacg gcatggcgct ggccatcgtt 660
aagtaa 666
<210> 146
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 146
ctggccgagg caggtaagcc ggctattagc gtt 33
<210> 147
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 147
aacgctaata gccggcttac ctgcctcggc cag 33
<210> 148
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 148
ctggccgagg caggtgttcc ggctattagc gtt 33
<210> 149
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 149
aacgctaata gccggaacac ctgcctcggc cag 33
<210> 150
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 150
cttatcaccc tggaatgtga tccgaagcat gcc 33
<210> 151
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 151
ggcatgcttc ggatcacatt ccagggtgat aag 33
<210> 152
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 152
cttatcaccc tggaagggga tccgaagcat gcc 33
<210> 153
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 153
ggcatgcttc ggatcccctt ccagggtgat aag 33
<210> 154
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 154
cttatcaccc tggaaagtga tccgaagcat gcc 33
<210> 155
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 155
ggcatgcttc ggatcacttt ccagggtgat aag 33
<210> 156
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 156
gatgccgata agcccggtta caccgaatac ttt 33
<210> 157
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 157
aaagtattcg gtgtaaccgg gcttatcggc atc 33
<210> 158
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 158
gatgccgata agccctctta caccgaatac ttt 33
<210> 159
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 159
aaagtattcg gtgtaagagg gcttatcggc atc 33
<210> 160
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 160
gatgccgata agcccagtta caccgaatac ttt 33
<210> 161
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 161
aaagtattcg gtgtaactgg gcttatcggc atc 33
<210> 162
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 162
gatgccgata agcccgtgta caccgaatac ttt 33
<210> 163
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 163
aaagtattcg gtgtacacgg gcttatcggc atc 33
<210> 164
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 164
gatgccgata agccctatta caccgaatac ttt 33
<210> 165
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 165
aaagtattcg gtgtaatagg gcttatcggc atc 33
<210> 166
<211> 7651
<212> DNA
<213> 人工序列
<220>
<223> 一些基于pVK9的表达质粒的共同部分
<400> 166
cgcagcaggc atgagcagcc cgaatatgcg cctgctggct gcaacgaccg aggaaatgac 60
ccgcgttttc ggcgctgacc aggctttttc acataggctg agccggtggc cactgcacgt 120
ctccgacgat cccaccgcgt accgctggca tgcccagcac aatcgcgtgg atcgcctagc 180
tgatcccgaa aaagtttttg ccttttgtaa aaaacttctc ggtcgccccg caaattttcg 240
attccagatt ttttaaaaac caagccagaa atacgacaca ccgtttgcag ataatctgtc 300
tttcggaaaa atcaagtgcg atacaaaatt tttagcaccc ctgagctgcg caaagtcccg 360
cttcgtgaaa attttcgtgc cgcgtgattt tccgccaaaa actttaacga acgttcgtta 420
taatggtgtc atgaccttca cgacgaagta ccaaaattgg cccgaatcat cagctatgga 480
tctctctgat gtcgcgctgg agtccgacgc gctcgatgct gccgtcgatt taaaaacggt 540
gatcggattt ttccgagctc tcgatacgac ggacgcgcca gcatcacgag actgggccag 600
tgccgcgagc gacctagaaa ctctcgtggc ggatcttgag gagctggctg acgagctgcg 660
tgctcggcag cgccaggagg acgcacagta gtggaggatc gaatcagttg cgcctactgc 720
ggtggcctga ttcctccccg gcctgacccg cgaggacggc gcgcaaaata ttgctcagat 780
gcgtgtcgtg ccgcagccag ccgcgagcgc gccaacaaac gccacgccga ggagctggag 840
gcggctaggt cgcaaatggc gctggaagtg cgtcccccga gcgaaatttt ggccatggtc 900
gtcacagagc tggaagcggc agcgagaatt atccgcgatc gtggcgcggt gcccgcaggc 960
atgacaaaca tcgtaaatgc cgcgtttcgt gtggccgtgg ccgcccagga cgtgtcagcg 1020
ccgccaccac ctgcaccgaa tcggcagcag cgtcgcgcgt cgaaaaagcg cacaggcggc 1080
aagaagcgat aagctgcacg aatacctgaa aaatgttgaa cgccccgtga gcggtaactc 1140
acagggcgtc ggctaacccc cagtccaaac ctgggagaaa gcgctcaaaa atgactctag 1200
cggattcacg agacattgac acaccggcct ggaaattttc cgctgatctg ttcgacaccc 1260
atcccgagct cgcgctgcga tcacgtggct ggacgagcga agaccgccgc gaattcctcg 1320
ctcacctggg cagagaaaat ttccagggca gcaagacccg cgacttcgcc agcgcttgga 1380
tcaaagaccc ggacacggga gaaacacagc cgaagttata ccgagttggt tcaaaatcgc 1440
ttgcccggtg ccagtatgtt gctctgacgc acgcgcagca cgcagccgtg cttgtcctgg 1500
acattgatgt gccgagccac caggccggcg ggaaaatcga gcacgtaaac cccgaggtct 1560
acgcgatttt ggagcgctgg gcacgcctgg aaaaagcgcc agcttggatc ggcgtgaatc 1620
cactgagcgg gaaatgccag ctcatctggc tcattgatcc ggtgtatgcc gcagcaggca 1680
tgagcagccc gaatatgcgc ctgctggctg caacgaccga ggaaatgacc cgcgttttcg 1740
gcgctgacca ggctttttca cataggctga gccggtggcc actgcacgtc tccgacgatc 1800
ccaccgcgta ccgctggcat gcccagcaca atcgcgtgga tcgcctagct gatcttatgg 1860
aggttgctcg catgatctca ggcacagaaa aacctaaaaa acgctatgag caggagtttt 1920
ctagcggacg ggcacgtatc gaagcggcaa gaaaagccac tgcggaagca aaagcacttg 1980
ccacgcttga agcaagcctg ccgagcgccg ctgaagcgtc tggagagctg atcgacggcg 2040
tccgtgtcct ctggactgct ccagggcgtg ccgcccgtga tgagacggct tttcgccacg 2100
ctttgactgt gggataccag ttaaaagcgg ctggtgagcg cctaaaagac accaagatca 2160
tcgacgccta cgagcgtgcc tacaccgtcg ctcaggcggt cggagcagac ggccgtgagc 2220
ctgatctgcc gccgatgcgt gaccgccaga cgatggcgcg acgtgtgcgc ggctacgtcg 2280
ctaaaggcca gccagtcgtc cctgctcgtc agacagagac gcagagcagc cgagggcgaa 2340
aagctctggc cactatggga agacgtggcg gtaaaaaggc cgcagaacgc tggaaagacc 2400
caaacagtga gtacgcccga gcacagcgag aaaaactagc taagtccagt caacgacaag 2460
ctaggaaagc taaaggaaat cgcttgacca ttgcaggttg gtttatgact gttgagggag 2520
agactggctc gtggccgaca atcaatgaag ctatgtctga atttagcgtg tcacgtcaga 2580
ccgtgaatag agcacttaag tctgcgggca ttgaacttcc acgaggacgc cgtaaagctt 2640
cccagtaaat gtgccatctc gtaggcagaa aacggttccc cccgtagggg tctctctctt 2700
ggcctccttt ctaggtcggg ctgattgctc ttgaagctct ctaggggggc tcacaccata 2760
ggcagataac ggttccccac cggctcacct cgtaagcgca caaggactgc tcccaaagat 2820
cgcctagctg atcttatgga ggttgctcgc atgatccttt ttgataatct catgaccaaa 2880
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatccccgtc 2940
cacctacaac aaagctctca tcaaccgtgg ctccctcact ttctggctgg atgatggggc 3000
gattcaggcc tggtatgagt cagcaacacc ttcttcacga ggcagacctc tcgacggagt 3060
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 3120
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 3180
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 3240
caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 3300
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 3360
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 3420
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 3480
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 3540
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 3600
cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 3660
gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt 3720
tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg 3780
tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg 3840
agcgcagcga gtcagtgagc gaggaagcgg aagaagctcg cacattcagc agcgtttttc 3900
agcgcgtttt cgatcaacgt ttcaatgttg gtatcaacac caggtttaac tttgaactta 3960
tcggcactga cggttactga ttttgaactt ttgctttgcc acggaacggt ctgcgttgtc 4020
gggaagatgc gtgatctgat ccttcaactc agcaaaagtt cccaatacgc aaaccgcctc 4080
tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 4140
cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 4200
tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 4260
caggaaacag ctatgaccat gattacgcca agcttgcatg ccaaattcct gtgattagct 4320
gatttagtac ttttcggagg tgtctattct taccaaatcg tcaagttgtg ggtagagtca 4380
cctgaatatt aattgcaccg cacgggtgat atatgcttat ttgctcaagt agttcgaggt 4440
taagtgtatt ttaggtgaac aaatttcagc ttcgggtaga agactttcga tgcgcttcag 4500
agcttctatt gggaaatctg acaccacttg attaaatagc ctacccccga attgggggat 4560
tggtcatttt ttgctgtgaa ggtagttttg atgcatatga cctgcgttta taaagaaatg 4620
taaacgtgat cagatcgata taaaagaaac agtttgtact caggtttgaa gcattttctc 4680
cgattcgcct ggcaaaaatc tcaattgtcg cttacagttt ttctcaacga caggctgcta 4740
agctgctagt tcggtggcct agtgagtggc gtttacttgg ataaaagtaa tcccatgtcg 4800
tgatcagcca ttttgggttg tttccatagc aatccaaagg tttcgtcttt cgatacctat 4860
tcaaggagcc ttcgcctctg agctccgtcg acaagcttgc ggccgcactc gagcaccacc 4920
accaccacca ctgagatccg gctgctaaca aagcccgaaa ggaagctgag ttggctgctg 4980
ccaccgctga gcaataacta gcatgatccc cgggtaccga gctcgaattc actggccgtc 5040
gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca 5100
catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 5160
cagttgcgca gcctgaatgg cgaatgcgat ttattcaaca aagccgccgt cccgtcaagt 5220
cagcgtaatg ctctgccctg atgaatcccc taatgatttt ggtaaaaatc attaagttaa 5280
ggtggataca catcttgtca tatgatcaaa tggtttcgcg aaaaatcaat aatcagacaa 5340
caagatgtgc gaactcgata ttttacacga ctctctttac caattctgcc ccgaattaca 5400
cttaaaacga ctcaacagct taacgttggc ttgccacgca ttacttgact gtaaaactct 5460
cactcttacc gaacttggcc gtaacctgcc aaccaaagcg agaacaaaac ataacatcaa 5520
acgaatcgac cgattgttag gtaatcgtca cctccacaaa gagcgactcg ctgtataccg 5580
ttggcatgct agctttatct gttcgggcaa tacgatgccc attgtacttg ttgactggtc 5640
tgatattcgt gagcaaaaac gacttatggt attgcgagct tcagtcgcac tacacggtcg 5700
ttctgttact ctttatgaga aagcgttccc gctttcagag caatgttcaa agaaagctca 5760
tgaccaattt ctagccgacc ttgcgagcat tctaccgagt aacaccacac cgctcattgt 5820
cagtgatgct ggctttaaag tgccatggta taaatccgtt gagaagctgg gttggtactg 5880
gttaagtcga gtaagaggaa aagtacaata tgcagaccta ggagcggaaa actggaaacc 5940
tatcagcaac ttacatgata tgtcatctag tcactcaaag actttaggct ataagaggct 6000
gactaaaagc aatccaatct catgccaaat tctattgtat aaatctcgct ctaaaggccg 6060
aaaaaatcag cgctcgacac ggactcattg tcaccacccg tcacctaaaa tctactcagc 6120
gtcggcaaag gagccatggg ttctagcaac taacttacct gttgaaattc gaacacccaa 6180
acaacttgtt aatatctatt cgaagcgaat gcagattgaa gaaaccttcc gagacttgaa 6240
aagtcctgcc tacggactag gcctacgcca tagccgaacg agcagctcag agcgttttga 6300
tatcatgctg ctaatcgccc tgatgcttca actaacatgt tggcttgcgg gcgttcatgc 6360
tcagaaacaa ggttgggaca agcacttcca ggctaacaca gtcagaaatc gaaacgtact 6420
ctcaacagtt cgcttaggca tggaagtttt gcggcattct ggctacacaa taacaaggga 6480
agacttactc gtggctgcaa ccctactagc tcaaaattta ttcacacatg gttacgcttt 6540
ggggaaatta tgaggggatc tctcagtgct ctgccagtgt tacaaccaat taaccaattc 6600
tgattagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 6660
aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 6720
ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 6780
acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 6840
gactgaatcc ggtgagaatg gcaaaagctt atgcatttct ttccagactt gttcaacagg 6900
ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 6960
ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 7020
cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 7080
atattcttct aatacctgga atgctgtttt cccggggatc gcagtggtga gtaaccatgc 7140
atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 7200
gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 7260
aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 7320
gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 7380
cggcttcgag caagacgttt cccgttgaat atggctcata acaccccttg tattactgtt 7440
tatgtaagca gacagtttta ttgttcatga tgatatattt ttatcttgtg caatgtaaca 7500
tcagagattt tgagacacaa cgtggctttg ttgaataaat cgaacttttg ctgagttgaa 7560
ggatcagatc acgcatcttc ccgacaacgc agaccgttcc gtggcaaagc aaaagttcaa 7620
aatcaccaac tggtcgcgat ccggtgtatg c 7651
<210> 167
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 167
gcacttacct taactggtag gtgctttttt caattctgat tagaaaaact catcgagc 58
<210> 168
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 168
ggtacccggg gatcatgc 18
<210> 169
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 169
ccaagcttgc atgccggtag gtggcgtatc agact 35
<210> 170
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 170
acgcgagaaa cggcactagt tgagggcctc taaat 35
<210> 171
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 171
gagtgttcgt taaaaatggc acaggttatg gactt 35
<210> 172
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 172
cggtacccgg ggatcttagt agcggtagtg ctccg 35
<210> 173
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 173
gaggccctca actagtgccg tttctcgcgt tgtgt 35
<210> 174
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 174
cataacctgt gccattttta acgaacactc ctcgc 35
<210> 175
<211> 1437
<212> DNA
<213> 谷氨酸棒杆菌
<400> 175
atggcacagg ttatggactt caaggttgcc gatctttcac tagcagaggc aggacgtcac 60
cagattcgtc ttgcagagta tgagatgcca ggtctcatgc agttgcgcaa ggaattcgca 120
gacgagcagc ctttgaaggg cgcccgaatt gctggttcca tccacatgac ggtccagacc 180
gccgtgctta ttgagaccct cactgctttg ggcgctgagg ttcgttgggc ttcctgcaac 240
attttctcca cccaggatga ggctgcagcg gctatcgttg tcggctccgg caccgtcgaa 300
gagccagctg gtgttccagt attcgcgtgg aagggtgagt cactggagga gtactggtgg 360
tgcatcaacc agatcttcag ctggggcgat gagctgccaa acatgatcct cgacgacggc 420
ggtgacgcca ccatggctgt tattcgcggt cgcgaatacg agcaggctgg tctggttcca 480
ccagcagagg ccaacgattc cgatgagtac atcgcattct tgggcatgct gcgtgaggtt 540
cttgctgcag agcctggcaa gtggggcaag atcgctgagg ccgttaaggg tgtcaccgag 600
gaaaccacca ccggtgtgca ccgcctgtac cacttcgctg aagaaggcgt actgcctttc 660
ccagcgatga acgtcaacga cgctgtcacc aagtccaagt ttgataacaa gtacggcacc 720
cgccactccc tgatcgacgg catcaaccgc gccaccgaca tgctcatggg cggcaagaac 780
gtgcttgtct gcggttacgg tgatgtcggc aagggctgcg ctgaggcttt cgacggccag 840
ggcgctcgcg tcaaggtcac cgaagctgac ccaatcaacg ctcttcaggc tctgatggat 900
ggctactctg tggtcaccgt tgatgaggcc atcgaggacg ccgacatcgt gatcaccgcg 960
accggtaaca aggacatcat ttccttcgag cagatgctca agatgaagga tcacgctctg 1020
ctgggcaaca tcggtcactt tgataatgag atcgatatgc attccctgtt gcaccgcgac 1080
gacgtcaccc gcaccacgat caagccacag gtcgacgagt tcaccttctc caccggtcgc 1140
tccatcatcg tgctgtctga aggccgtctg ctaaaccttg gcaacgccac cggacaccca 1200
tcatttgtca tgtccaactc tttcgccgat cagaccattg cgcagatcga actgttccaa 1260
aacgaaggac agtacgagaa cgaggtctac cgtctgccta aggttctcga cgaaaaggtg 1320
gcacgcatcc acgttgaggc tctcggcggt cagctcaccg aactgaccaa ggagcaggct 1380
gagtacatcg gcgttgacgt tgcaggtcca ttcaagccgg agcactaccg ctactaa 1437
<210> 176
<211> 478
<212> PRT
<213> 谷氨酸棒杆菌
<400> 176
Met Ala Gln Val Met Asp Phe Lys Val Ala Asp Leu Ser Leu Ala Glu
1               5                   10                  15
Ala Gly Arg His Gln Ile Arg Leu Ala Glu Tyr Glu Met Pro Gly Leu
            20                  25                  30
Met Gln Leu Arg Lys Glu Phe Ala Asp Glu Gln Pro Leu Lys Gly Ala
        35                  40                  45
Arg Ile Ala Gly Ser Ile His Met Thr Val Gln Thr Ala Val Leu Ile
    50                  55                  60
Glu Thr Leu Thr Ala Leu Gly Ala Glu Val Arg Trp Ala Ser Cys Asn
65                  70                  75                  80
Ile Phe Ser Thr Gln Asp Glu Ala Ala Ala Ala Ile Val Val Gly Ser
                85                  90                  95
Gly Thr Val Glu Glu Pro Ala Gly Val Pro Val Phe Ala Trp Lys Gly
            100                 105                 110
Glu Ser Leu Glu Glu Tyr Trp Trp Cys Ile Asn Gln Ile Phe Ser Trp
        115                 120                 125
Gly Asp Glu Leu Pro Asn Met Ile Leu Asp Asp Gly Gly Asp Ala Thr
    130                 135                 140
Met Ala Val Ile Arg Gly Arg Glu Tyr Glu Gln Ala Gly Leu Val Pro
145                 150                 155                 160
Pro Ala Glu Ala Asn Asp Ser Asp Glu Tyr Ile Ala Phe Leu Gly Met
                165                 170                 175
Leu Arg Glu Val Leu Ala Ala Glu Pro Gly Lys Trp Gly Lys Ile Ala
            180                 185                 190
Glu Ala Val Lys Gly Val Thr Glu Glu Thr Thr Thr Gly Val His Arg
        195                 200                 205
Leu Tyr His Phe Ala Glu Glu Gly Val Leu Pro Phe Pro Ala Met Asn
    210                 215                 220
Val Asn Asp Ala Val Thr Lys Ser Lys Phe Asp Asn Lys Tyr Gly Thr
225                 230                 235                 240
Arg His Ser Leu Ile Asp Gly Ile Asn Arg Ala Thr Asp Met Leu Met
                245                 250                 255
Gly Gly Lys Asn Val Leu Val Cys Gly Tyr Gly Asp Val Gly Lys Gly
            260                 265                 270
Cys Ala Glu Ala Phe Asp Gly Gln Gly Ala Arg Val Lys Val Thr Glu
        275                 280                 285
Ala Asp Pro Ile Asn Ala Leu Gln Ala Leu Met Asp Gly Tyr Ser Val
    290                 295                 300
Val Thr Val Asp Glu Ala Ile Glu Asp Ala Asp Ile Val Ile Thr Ala
305                 310                 315                 320
Thr Gly Asn Lys Asp Ile Ile Ser Phe Glu Gln Met Leu Lys Met Lys
                325                 330                 335
Asp His Ala Leu Leu Gly Asn Ile Gly His Phe Asp Asn Glu Ile Asp
            340                 345                 350
Met His Ser Leu Leu His Arg Asp Asp Val Thr Arg Thr Thr Ile Lys
        355                 360                 365
Pro Gln Val Asp Glu Phe Thr Phe Ser Thr Gly Arg Ser Ile Ile Val
    370                 375                 380
Leu Ser Glu Gly Arg Leu Leu Asn Leu Gly Asn Ala Thr Gly His Pro
385                 390                 395                 400
Ser Phe Val Met Ser Asn Ser Phe Ala Asp Gln Thr Ile Ala Gln Ile
                405                 410                 415
Glu Leu Phe Gln Asn Glu Gly Gln Tyr Glu Asn Glu Val Tyr Arg Leu
            420                 425                 430
Pro Lys Val Leu Asp Glu Lys Val Ala Arg Ile His Val Glu Ala Leu
        435                 440                 445
Gly Gly Gln Leu Thr Glu Leu Thr Lys Glu Gln Ala Glu Tyr Ile Gly
    450                 455                 460
Val Asp Val Ala Gly Pro Phe Lys Pro Glu His Tyr Arg Tyr
465                 470                 475
<210> 177
<211> 1563
<212> DNA
<213> 谷氨酸棒杆菌
<400> 177
atgagcgatg atcgtaaggc aattaaacgc gcactaatta gcgtgtatga caagactggc 60
ctggaggatc tagcccaggc acttcaccgc gcgaacgtgg aaattgtttc caccggatcc 120
actgcggcga agattgctga gcttggtatt cctgttaccc cggttgagga gctcaccggt 180
ttccctgagt gccttgaggg ccgtgtgaag acactgcatc ctaaggttca cgctggcatc 240
ttggcggaca cccgcaagga agaccacctg cgtcagctca aggaacttga ggtcgcccca 300
ttccagcttg tcgtggtgaa cctgtaccca tttgctgaga ccgttgcgtc cggcgccgat 360
ttcgatgctt gcgttgagca gatcgacatc ggaggcccat ccatggttcg tgctgcggca 420
aagaaccacc catctgtcgc tgtggttgtt tcaccaaacc gctacgagga tgtccaggaa 480
gctttgaaga ccggtggatt ctcccgcgcg gagcgcacca agttggctgc tgaggctttc 540
cgccacaccg caacctacga tgtcaccgtt gcaacctgga tgagcgagca gctggctgcc 600
gaagattctg agactgagtt cccaggttgg atcggcacca ccaacacctt gtcccgcagc 660
ttgcgttacg gtgagaaccc tcaccagtct gcagctttgt acgtgggcaa cacccgcgga 720
cttgcacagg ctaagcagtt ccacggcaag gaaatgagct acaacaacta caccgattct 780
gatgctgcat ggcgtgcagc gtgggatcac gagcgtcctt gtgtagctat catcaagcat 840
gcaaaccctt gtggcattgc tgtttctgat gagtccatcg cagcggcaca ccgcgaggca 900
cacgcatgtg actctgtgtc cgcattcggt ggcgtcatcg cgtccaaccg tgaagtcagc 960
gttgagatgg ctaaccaggt tgcagagatc ttcactgagg tcatcatcgc tccttcctac 1020
gaagagggcg ctgtggagat cctgagccag aagaagaaca tccgtattct tcaggctgaa 1080
gcacctgtgc gtaagggctt tgagtcccgt gagatctccg gcggtctgct tgttcaggaa 1140
cgcgacttga tccacgctga gggcgacaac tccgcaaact ggactcttgc tgccggctct 1200
gctgtttctc ctgaggttct gaaggacctg gagttcgcgt ggactgcagt tcgttccgtg 1260
aagtccaacg caattctgtt ggctaagaac ggcgctaccg ttggcgttgg catgggacag 1320
gtcaaccgcg ttgactctgc tcgcttggct gtcgaccgtg caggtgcaga gcgcgctacc 1380
ggttccgttg ctgcttccga tgcgttcttc ccattcgctg atggctttga ggttctcgct 1440
gaggctggca tcactgctgt tgtgcagcct ggtggatcca ttcgcgacaa cgaggtcatt 1500
gaggcagcca acaaggctgg cgtgaccatg tacctgactg gtgcgcgaca cttcgctcac 1560
taa 1563
<210> 178
<211> 520
<212> PRT
<213> 谷氨酸棒杆菌
<400> 178
Met Ser Asp Asp Arg Lys Ala Ile Lys Arg Ala Leu Ile Ser Val Tyr
1               5                   10                  15
Asp Lys Thr Gly Leu Glu Asp Leu Ala Gln Ala Leu His Arg Ala Asn
            20                  25                  30
Val Glu Ile Val Ser Thr Gly Ser Thr Ala Ala Lys Ile Ala Glu Leu
        35                  40                  45
Gly Ile Pro Val Thr Pro Val Glu Glu Leu Thr Gly Phe Pro Glu Cys
    50                  55                  60
Leu Glu Gly Arg Val Lys Thr Leu His Pro Lys Val His Ala Gly Ile
65                  70                  75                  80
Leu Ala Asp Thr Arg Lys Glu Asp His Leu Arg Gln Leu Lys Glu Leu
                85                  90                  95
Glu Val Ala Pro Phe Gln Leu Val Val Val Asn Leu Tyr Pro Phe Ala
            100                 105                 110
Glu Thr Val Ala Ser Gly Ala Asp Phe Asp Ala Cys Val Glu Gln Ile
        115                 120                 125
Asp Ile Gly Gly Pro Ser Met Val Arg Ala Ala Ala Lys Asn His Pro
    130                 135                 140
Ser Val Ala Val Val Val Ser Pro Asn Arg Tyr Glu Asp Val Gln Glu
145                 150                 155                 160
Ala Leu Lys Thr Gly Gly Phe Ser Arg Ala Glu Arg Thr Lys Leu Ala
                165                 170                 175
Ala Glu Ala Phe Arg His Thr Ala Thr Tyr Asp Val Thr Val Ala Thr
            180                 185                 190
Trp Met Ser Glu Gln Leu Ala Ala Glu Asp Ser Glu Thr Glu Phe Pro
        195                 200                 205
Gly Trp Ile Gly Thr Thr Asn Thr Leu Ser Arg Ser Leu Arg Tyr Gly
    210                 215                 220
Glu Asn Pro His Gln Ser Ala Ala Leu Tyr Val Gly Asn Thr Arg Gly
225                 230                 235                 240
Leu Ala Gln Ala Lys Gln Phe His Gly Lys Glu Met Ser Tyr Asn Asn
                245                 250                 255
Tyr Thr Asp Ser Asp Ala Ala Trp Arg Ala Ala Trp Asp His Glu Arg
            260                 265                 270
Pro Cys Val Ala Ile Ile Lys His Ala Asn Pro Cys Gly Ile Ala Val
        275                 280                 285
Ser Asp Glu Ser Ile Ala Ala Ala His Arg Glu Ala His Ala Cys Asp
    290                 295                 300
Ser Val Ser Ala Phe Gly Gly Val Ile Ala Ser Asn Arg Glu Val Ser
305                 310                 315                 320
Val Glu Met Ala Asn Gln Val Ala Glu Ile Phe Thr Glu Val Ile Ile
                325                 330                 335
Ala Pro Ser Tyr Glu Glu Gly Ala Val Glu Ile Leu Ser Gln Lys Lys
            340                 345                 350
Asn Ile Arg Ile Leu Gln Ala Glu Ala Pro Val Arg Lys Gly Phe Glu
        355                 360                 365
Ser Arg Glu Ile Ser Gly Gly Leu Leu Val Gln Glu Arg Asp Leu Ile
    370                 375                 380
His Ala Glu Gly Asp Asn Ser Ala Asn Trp Thr Leu Ala Ala Gly Ser
385                 390                 395                 400
Ala Val Ser Pro Glu Val Leu Lys Asp Leu Glu Phe Ala Trp Thr Ala
                405                 410                 415
Val Arg Ser Val Lys Ser Asn Ala Ile Leu Leu Ala Lys Asn Gly Ala
            420                 425                 430
Thr Val Gly Val Gly Met Gly Gln Val Asn Arg Val Asp Ser Ala Arg
        435                 440                 445
Leu Ala Val Asp Arg Ala Gly Ala Glu Arg Ala Thr Gly Ser Val Ala
    450                 455                 460
Ala Ser Asp Ala Phe Phe Pro Phe Ala Asp Gly Phe Glu Val Leu Ala
465                 470                 475                 480
Glu Ala Gly Ile Thr Ala Val Val Gln Pro Gly Gly Ser Ile Arg Asp
                485                 490                 495
Asn Glu Val Ile Glu Ala Ala Asn Lys Ala Gly Val Thr Met Tyr Leu
            500                 505                 510
Thr Gly Ala Arg His Phe Ala His
        515                 520
<210> 179
<211> 1563
<212> DNA
<213> 谷氨酸棒杆菌
<400> 179
atgagcgatg atcgtaaggc aattaaacgc gcactaatta gcgtgtatga caagactggc 60
ctggaggatc tagcccaggc acttcaccgc gcgaacgtgg aaattgtttt caccggatcc 120
actgcggcga agattgctga gcttggtatt cctgttaccc cggttgagga gctcaccggt 180
ttccctgagt gccttgaggg ccgtgtgaag acactgcatc ctaaggttca cgctggcatc 240
ttggcggaca cccgcaagga agaccacctg cgtcagctca aggaacttga ggtcgcccca 300
ttccagcttg tcgtggtgaa cctgtaccca tttgctgaga ccgttgcgtc cggcgccgat 360
ttcgatgctt gcgttgagca gatcgacatc ggaggcccat ccatggttcg tgctgcggca 420
aagaaccacc catctgtcgc tgtggttgtt tcaccaaacc gctacgagga tgtccaggaa 480
gctttgaaga ccggtggatt ctcccgcgcg gagcgcacca agttggctgc tgaggctttc 540
cgccacaccg caacctacga tgtcaccgtt gcaacctgga tgagcgagca gctggctgcc 600
gaagattctg agactgagtt cccaggttgg atcggcacca ccaacacctt gtcccgcagc 660
ttgcgttacg gtgagaaccc tcaccagtct gcagctttgt acgtgggcaa cacccgcgga 720
cttgcacagg ctaagcagtt ccacggcaag gaaatgagct acaacaacta caccgattct 780
gatgctgcat ggcgtgcagc gtgggatcac gagcgtcctt gtgtagctat catcaagcat 840
gcaaaccctt gtggcattgc tgtttctgat gagtccatcg cagcggcaca ccgcgaggca 900
cacgcatgtg actctgtgtc cgcattcggt ggcgtcatcg cgtccaaccg tgaagtcagc 960
gttgagatgg ctaaccaggt tgcagagatc ttcactgagg tcatcatcgc tccttcctac 1020
gaagagggcg ctgtggagat cctgagccag aagaagaaca tccgtattct tcaggctgaa 1080
gcacctgtgc gtaagggctt tgagtcccgt gagatctccg gcggtctgct tgttcaggaa 1140
cgcgacttga tccacgctga gggcgacaac tccgcaaact ggactcttgc tgccggctct 1200
gctgtttctc ctgaggttct gaaggacctg gagttcgcgt ggactgcagt tcgttccgtg 1260
aagtccaacg caattctgtt ggctaagaac ggcgctaccg ttggcgttgg catgggacag 1320
gtcaaccgcg ttgactctgc tcgcttggct gtcgaccgtg caggtgcaga gcgcgctacc 1380
ggttccgttg ctgcttccga tgcgttcttc ccattcgctg atggctttga ggttctcgct 1440
gaggctggca tcactgctgt tgtgcagcct ggtggatcca ttcgcgacaa cgaggtcatt 1500
gaggcagcca acaaggctgg cgtgaccatg tacctgactg gtgcgcgaca cttcgctcac 1560
taa 1563
<210> 180
<211> 520
<212> PRT
<213> 谷氨酸棒杆菌
<400> 180
Met Ser Asp Asp Arg Lys Ala Ile Lys Arg Ala Leu Ile Ser Val Tyr
1               5                   10                  15
Asp Lys Thr Gly Leu Glu Asp Leu Ala Gln Ala Leu His Arg Ala Asn
            20                  25                  30
Val Glu Ile Val Phe Thr Gly Ser Thr Ala Ala Lys Ile Ala Glu Leu
        35                  40                  45
Gly Ile Pro Val Thr Pro Val Glu Glu Leu Thr Gly Phe Pro Glu Cys
    50                  55                  60
Leu Glu Gly Arg Val Lys Thr Leu His Pro Lys Val His Ala Gly Ile
65                  70                  75                  80
Leu Ala Asp Thr Arg Lys Glu Asp His Leu Arg Gln Leu Lys Glu Leu
                85                  90                  95
Glu Val Ala Pro Phe Gln Leu Val Val Val Asn Leu Tyr Pro Phe Ala
            100                 105                 110
Glu Thr Val Ala Ser Gly Ala Asp Phe Asp Ala Cys Val Glu Gln Ile
        115                 120                 125
Asp Ile Gly Gly Pro Ser Met Val Arg Ala Ala Ala Lys Asn His Pro
    130                 135                 140
Ser Val Ala Val Val Val Ser Pro Asn Arg Tyr Glu Asp Val Gln Glu
145                 150                 155                 160
Ala Leu Lys Thr Gly Gly Phe Ser Arg Ala Glu Arg Thr Lys Leu Ala
                165                 170                 175
Ala Glu Ala Phe Arg His Thr Ala Thr Tyr Asp Val Thr Val Ala Thr
            180                 185                 190
Trp Met Ser Glu Gln Leu Ala Ala Glu Asp Ser Glu Thr Glu Phe Pro
        195                 200                 205
Gly Trp Ile Gly Thr Thr Asn Thr Leu Ser Arg Ser Leu Arg Tyr Gly
    210                 215                 220
Glu Asn Pro His Gln Ser Ala Ala Leu Tyr Val Gly Asn Thr Arg Gly
225                 230                 235                 240
Leu Ala Gln Ala Lys Gln Phe His Gly Lys Glu Met Ser Tyr Asn Asn
                245                 250                 255
Tyr Thr Asp Ser Asp Ala Ala Trp Arg Ala Ala Trp Asp His Glu Arg
            260                 265                 270
Pro Cys Val Ala Ile Ile Lys His Ala Asn Pro Cys Gly Ile Ala Val
        275                 280                 285
Ser Asp Glu Ser Ile Ala Ala Ala His Arg Glu Ala His Ala Cys Asp
    290                 295                 300
Ser Val Ser Ala Phe Gly Gly Val Ile Ala Ser Asn Arg Glu Val Ser
305                 310                 315                 320
Val Glu Met Ala Asn Gln Val Ala Glu Ile Phe Thr Glu Val Ile Ile
                325                 330                 335
Ala Pro Ser Tyr Glu Glu Gly Ala Val Glu Ile Leu Ser Gln Lys Lys
            340                 345                 350
Asn Ile Arg Ile Leu Gln Ala Glu Ala Pro Val Arg Lys Gly Phe Glu
        355                 360                 365
Ser Arg Glu Ile Ser Gly Gly Leu Leu Val Gln Glu Arg Asp Leu Ile
    370                 375                 380
His Ala Glu Gly Asp Asn Ser Ala Asn Trp Thr Leu Ala Ala Gly Ser
385                 390                 395                 400
Ala Val Ser Pro Glu Val Leu Lys Asp Leu Glu Phe Ala Trp Thr Ala
                405                 410                 415
Val Arg Ser Val Lys Ser Asn Ala Ile Leu Leu Ala Lys Asn Gly Ala
            420                 425                 430
Thr Val Gly Val Gly Met Gly Gln Val Asn Arg Val Asp Ser Ala Arg
        435                 440                 445
Leu Ala Val Asp Arg Ala Gly Ala Glu Arg Ala Thr Gly Ser Val Ala
    450                 455                 460
Ala Ser Asp Ala Phe Phe Pro Phe Ala Asp Gly Phe Glu Val Leu Ala
465                 470                 475                 480
Glu Ala Gly Ile Thr Ala Val Val Gln Pro Gly Gly Ser Ile Arg Asp
                485                 490                 495
Asn Glu Val Ile Glu Ala Ala Asn Lys Ala Gly Val Thr Met Tyr Leu
            500                 505                 510
Thr Gly Ala Arg His Phe Ala His
        515                 520
<210> 181
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 181
cggtacccgg ggatcctcaa cctcctggcg tcagtt 36
<210> 182
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 182
acaatgagtt tacgctcaac ctgcttgatt ctttc 35
<210> 183
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 183
attccagctt gtcgtggtga acctgtaccc atttg 35
<210> 184
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 184
ccaagcttgc atgccgatca agtcgcgttc ctgaac 36
<210> 185
<211> 400
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 185
gcgtaaactc attgtagaag tcctgaacag cgtggaattt tcgcgtcagg gtggcgtaca 60
actcaactgg agaggctaaa tccttcatga gcgatgatcg taaggcaatt aaacgcgcac 120
taattagcgt gtatgacaag actggcctgg aggatctagc ccaggcactt caccgcgcga 180
acgtggaaat tgttttcacc ggatccactg cggcgaagat tgctgagctt ggtattcctg 240
ttaccccggt tgaggagctc accggtttcc ctgagtgcct tgagggccgt gtgaagacac 300
tgcatcctaa ggttcacgct ggcatcttgg cggacacccg caaggaagac cacctgcgtc 360
agctcaagga acttgaggtc gccccattcc agcttgtcgt 400
<210> 186
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 186
cagcactgtg tttcctcgtc 20
<210> 187
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 187
caggtccttc agaacctcag 20

Claims (21)

1.一种生产目标物质的方法,所述方法包括以下步骤:
通过使用具有生产所述目标物质的能力的微生物来生产所述目标物质,
其中所述微生物已经以使该微生物具有源自属于拟杆菌门的细菌的O-甲基转移酶基因的方式进行了修饰,
其中所述微生物是谷氨酸棒杆菌,
其中所述目标物质是香草酸,
其中所述O-甲基转移酶基因是编码选自由以下组成的组的蛋白质的基因:
(a)由SEQ ID NO:141的氨基酸序列组成的蛋白质,和
(b)由具有特定突变的SEQ ID NO:141的氨基酸序列组成的蛋白质,其中所述特定突变是下述任一个:M36K,D21Y/M36K/L67F,D21Y/M36K/L67F/Y90A,L31H/M36K/L67F/P144V,L31H/L67F/Y90A,M36K/S42C/L67F,M36K/L67F,M36K/L67F/Y90A,M36K/L67F/Y90A/P144E,M36K/L67F/Y90C,M36K/L67F/Y90C/P144V,M36K/L67F/Y90G,M36K/L67F/Y90S/P144G,M36K/L67F/P144S,M36K/L67F/P144Y,M36K/Y90A/P144V,M36K/P144E,和M36V/L67F/P144S。
2.根据权利要求1所述的方法,其中所述生产包括:
在含有碳源的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
3.根据权利要求1所述的方法,其中所述生产包括:
通过使用所述微生物以将所述目标物质的前体转化成所述目标物质。
4.根据权利要求3所述的方法,其中所述转化包括:
在含有所述前体的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
5.根据权利要求3所述的方法,其中所述转化包括:
在反应混合物中允许所述微生物的细胞作用于所述前体以在所述反应混合物中生产和积累所述目标物质。
6.根据权利要求5所述的方法,其中所述细胞是存在于所述微生物的培养液中的细胞、从所述培养液中收集的细胞、存在于所述培养液的加工产物中的细胞、存在于收集的细胞的加工产物中的细胞,或这些的组合。
7.根据权利要求3至6中任一项所述的方法,其中所述前体是原儿茶酸。
8.根据权利要求1至6中任一项所述的方法,所述方法还包括收集所述目标物质。
9.根据权利要求1-6中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比参与所述目标物质的生物合成的酶的活性得以增加的方式进行了进一步的修饰。
10.根据权利要求9所述的方法,其中所述参与目标物质的生物合成的酶选自由以下组成的组:3-脱氧-D-***糖-庚酮糖酸7-磷酸合酶、3-脱氢奎尼酸合酶、3-脱氢奎尼酸脱水酶、3-脱氢莽草酸脱水酶、芳族醛氧化还原酶和它们的组合。
11.根据权利要求1-6中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比磷酸泛酰巯基乙胺基转移酶的活性得以增加的方式进行了进一步的修饰。
12.根据权利要求1至6中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比参与除所述目标物质以外的物质的副生产的酶的活性得以降低的方式进行了进一步的修饰。
13.根据权利要求12所述的方法,其中所述参与除目标物质以外的物质的副生产的酶选自由以下组成的组:香草酸脱甲基酶、原儿茶酸3,4-双加氧酶、醇脱氢酶、莽草酸脱氢酶和它们的组合。
14.根据权利要求1至6中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比L-半胱氨酸生物合成酶的活性得以增加的方式进行了进一步的修饰。
15.根据权利要求14所述的方法,其中所述L-半胱氨酸生物合成酶是由选自由以下组成的组的基因编码的蛋白质:cysI基因、cysX基因、cysH基因、cysD基因、cysN基因、cysY基因、cysZ基因、fpr2基因和它们的组合。
16.根据权利要求14所述的方法,其中通过增加由cysR基因编码的蛋白质的活性来增加L-半胱氨酸生物合成酶的活性。
17.根据权利要求1至6中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比由NCgl2048基因编码的蛋白质的活性得以降低的方式进行了进一步的修饰。
18.根据权利要求1至6中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比烯醇化酶的活性得以降低的方式进行了进一步修饰。
19.根据权利要求1至6中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比S-腺苷-L-高半胱氨酸水解酶的活性得以增加的方式进行了进一步修饰。
20.根据权利要求1至6中任一项所述的方法,其中所述微生物已经以使该微生物具有选自由以下组成的组的结果的方式进行了进一步修饰:
(i)与未修饰的菌株相比,AICAR甲酰转移酶和/或IMP环化水解酶的活性得以降低,
(ii)编码AICAR甲酰转移酶和/或IMP环化水解酶的基因具有改善所述微生物生产所述目标物质的能力的突变,和
(iii)它们的组合。
21.一种生产香草醛的方法,所述方法包括:
通过权利要求1至20中任一项的方法来生产香草酸;和
将所述香草酸转化成香草醛。
CN201780066709.3A 2016-10-26 2017-10-26 生产目标物质的方法 Active CN109890970B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662413061P 2016-10-26 2016-10-26
US62/413,061 2016-10-26
US201662417617P 2016-11-04 2016-11-04
US62/417,617 2016-11-04
PCT/JP2017/038795 WO2018079683A1 (en) 2016-10-26 2017-10-26 Method for producing objective substance

Publications (2)

Publication Number Publication Date
CN109890970A CN109890970A (zh) 2019-06-14
CN109890970B true CN109890970B (zh) 2023-04-04

Family

ID=60382531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780066709.3A Active CN109890970B (zh) 2016-10-26 2017-10-26 生产目标物质的方法

Country Status (5)

Country Link
US (1) US10883124B2 (zh)
EP (1) EP3532626B1 (zh)
JP (1) JP7063332B2 (zh)
CN (1) CN109890970B (zh)
WO (1) WO2018079683A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10858676B2 (en) 2017-05-22 2020-12-08 Ajinomoto Co., Inc. Method for producing objective substance
EP3960870A4 (en) 2019-03-29 2023-06-07 Ajinomoto Co., Inc. PROCESS FOR PRODUCTION OF ALLOLACTOSE
CN110042112A (zh) * 2019-04-23 2019-07-23 上海辰山植物园 黄芩黄酮苯丙素和类黄酮o-甲基转移酶基因及其载体构建和应用
WO2020226087A1 (ja) 2019-05-08 2020-11-12 味の素株式会社 バニリンの製造方法
BR112022017430A2 (pt) 2020-03-04 2022-10-18 Ajinomoto Kk Método e composição para produzir um alimento, transglutaminase mutante, gene, vetor, e, microrganismo
CN118064417B (zh) * 2024-04-24 2024-07-12 中国科学院天津工业生物技术研究所 一种3-脱氢莽草酸脱水酶突变体及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2344665A1 (en) * 1998-09-18 2000-03-30 Board Of Trustees Operating Michigan State University Synthesis of vanillin from a carbon source
CN1421523A (zh) * 2002-07-22 2003-06-04 江南大学 一种黑曲霉菌及用其生产香草酸和香草醛的微生物转化方法
WO2004036979A2 (en) * 2002-10-23 2004-05-06 Rutgers, The State University Of New Jersey Production of vanillin in microbial cells
CN105283547A (zh) * 2012-12-27 2016-01-27 罗地亚经营管理公司 用于生物合成生产的重组宿主细胞

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5089592A (zh) 1973-12-13 1975-07-18
JPS57134500A (en) 1981-02-12 1982-08-19 Kyowa Hakko Kogyo Co Ltd Plasmid pcg1
JPS57183799A (en) 1981-04-17 1982-11-12 Kyowa Hakko Kogyo Co Ltd Novel plasmid
JPS5835197A (ja) 1981-08-26 1983-03-01 Kyowa Hakko Kogyo Co Ltd プラスミドpcg2
JPS58192900A (ja) 1982-05-04 1983-11-10 Ajinomoto Co Inc 複合プラスミド
JPH01191686A (ja) 1988-01-26 1989-08-01 Mitsubishi Petrochem Co Ltd 複合プラスミド
FR2627508B1 (fr) 1988-02-22 1990-10-05 Eurolysine Procede pour l'integration d'un gene choisi sur le chromosome d'une bacterie et bacterie obtenue par ledit procede
JP2678995B2 (ja) 1988-09-08 1997-11-19 三菱化学株式会社 トリプトフアンシンターゼの製造法
US5185262A (en) 1988-07-27 1993-02-09 Mitsubishi Petrochemical Co., Ltd. DNA fragment containing gene which encodes the function of stabilizing plasmid in host microorganism
JPH02207791A (ja) 1989-02-07 1990-08-17 Ajinomoto Co Inc 微生物の形質転換法
JP2973446B2 (ja) 1990-01-11 1999-11-08 三菱化学株式会社 新規プラスミドベクター
JPH07108228B2 (ja) 1990-10-15 1995-11-22 味の素株式会社 温度感受性プラスミド
JPH05244941A (ja) 1992-03-03 1993-09-24 Toyo Ink Mfg Co Ltd Nadh依存性パラヒドロキシ安息香酸ヒドロキシラーゼ及びその製造方法
US5272073A (en) 1992-06-30 1993-12-21 Purdue Research Foundation Biocatalytic synthesis of catechol from glucose
JPH0775589A (ja) 1993-09-08 1995-03-20 Kawasaki Steel Corp プロトカテキュ酸の製造方法
DE69631118T2 (de) 1995-01-23 2004-07-01 Novozymes A/S Dna-integration durch transposition
JPH0970291A (ja) 1995-06-30 1997-03-18 Ajinomoto Co Inc 人工トランスポゾンを用いた遺伝子増幅方法
JP4168463B2 (ja) 1996-12-05 2008-10-22 味の素株式会社 L−リジンの製造法
AU756507B2 (en) 1998-03-18 2003-01-16 Ajinomoto Co., Inc. L-glutamic acid-producing bacterium and method for producing L-glutamic acid
HU225541B1 (en) 1998-09-25 2007-03-28 Ajinomoto Kk Process for producing l-amino acids by fermentation and amino acid-producing bacterium strains
JP2000262288A (ja) 1999-03-16 2000-09-26 Ajinomoto Co Inc コリネ型細菌の温度感受性プラスミド
EP2388333A3 (en) 2003-06-19 2012-04-04 Evolva SA A method of producing a low molecular weight organic compound in a cell
EP1649403A2 (en) 2003-07-29 2006-04-26 Ajinomoto Co., Inc. Method for determining metabolic flux affecting substance production
JP4882063B2 (ja) 2005-10-12 2012-02-22 国立大学法人東京農工大学 テレフタル酸の代謝に関与する新規遺伝子
EP1947190B1 (en) 2005-10-18 2017-11-29 Ajinomoto Co., Inc. Process for production of succinic acid
RU2418069C2 (ru) 2006-09-29 2011-05-10 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) Способ конструирования рекомбинантных бактерий, принадлежащих к роду pantoea, и способ продукции l-аминокислот с использованием бактерий, принадлежащих к роду pantoea
JP2010207094A (ja) 2009-03-06 2010-09-24 Genaris Inc プロトカテク酸の製造法
BR112014003041B1 (pt) * 2011-08-08 2021-10-13 International Flavors & Fragrances Inc. Método para produzir vanilina e/ou vanilina beta-d-glicosídeo, polipeptídeo de catecol-ometil transferase (comt) mutante, e, microorganismo hospedeiro recombinante
WO2013069634A1 (ja) 2011-11-11 2013-05-16 味の素株式会社 発酵法による目的物質の製造法
CA2888636C (en) 2012-11-05 2022-11-29 Evolva Sa Vanillin synthase
US10563181B2 (en) * 2015-06-16 2020-02-18 Council Of Scientific & Industrial Research Molecular cloning and expression of cDNA encoding O-methyltransferase isolated from Mangifera indica
WO2017073701A2 (en) * 2015-10-27 2017-05-04 Ajinomoto Co., Inc. Method for producing aldehyde
US10858676B2 (en) * 2017-05-22 2020-12-08 Ajinomoto Co., Inc. Method for producing objective substance

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2344665A1 (en) * 1998-09-18 2000-03-30 Board Of Trustees Operating Michigan State University Synthesis of vanillin from a carbon source
CN1421523A (zh) * 2002-07-22 2003-06-04 江南大学 一种黑曲霉菌及用其生产香草酸和香草醛的微生物转化方法
WO2004036979A2 (en) * 2002-10-23 2004-05-06 Rutgers, The State University Of New Jersey Production of vanillin in microbial cells
CN105283547A (zh) * 2012-12-27 2016-01-27 罗地亚经营管理公司 用于生物合成生产的重组宿主细胞

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
De Novo Biosynthesis of Vanillin in Fission Yeast (Schizosaccharomyces pombe) and Baker’s Yeast (Saccharomyces cerevisiae);Esben H. Hansen等;《APPLIED AND ENVIRONMENTAL MICROBIOLOGY 》;20090531;第75卷(第9期);第2766页图1、第2768页右栏第2段-第2770页右栏第1段 *
Esben H. Hansen等.De Novo Biosynthesis of Vanillin in Fission Yeast (Schizosaccharomyces pombe) and Baker’s Yeast (Saccharomyces cerevisiae).《APPLIED AND ENVIRONMENTAL MICROBIOLOGY 》.2009,第75卷(第9期), *
Metabolic engineering of Pseudomonas fluorescens for the production of vanillin from ferulic acid;Diana Di Gioia等;《Journal of biotechnology》;20110822;第156卷;第309-316页 *
NCBI Reference Sequence:WP_014216737.1.NCBI Reference Sequence:WP_014216737.1.《GENEBANK》.2013, *

Also Published As

Publication number Publication date
JP2019531756A (ja) 2019-11-07
CN109890970A (zh) 2019-06-14
EP3532626B1 (en) 2023-08-30
US20190249204A1 (en) 2019-08-15
EP3532626A1 (en) 2019-09-04
US10883124B2 (en) 2021-01-05
JP7063332B2 (ja) 2022-05-09
WO2018079683A1 (en) 2018-05-03

Similar Documents

Publication Publication Date Title
CN108350412B (zh) 用于生产醛的方法
CN108929886B (zh) 生产目标物质的方法
CN109890970B (zh) 生产目标物质的方法
CN109952380B (zh) 用于生产目标物质的方法
DK3087178T3 (en) PROCEDURE FOR PREPARING OXALATE OXIDASES WITH ACTIVITY OPTIMUM NEAR PHYSIOLOGICAL PH AND APPLICATION OF SUCH RECOMBINANT OXALATE OXIDASES IN THE TREATMENT OF OXALATE-RELATED DISEASES
CN109837315B (zh) 用于生产目标物质的方法
CN108026548A (zh) 生物制备甲基丙烯酸及其衍生物的方法
CN109937257B (zh) 生产目标物质的方法
CN109963947B (zh) 用于生产l-甲硫氨酸或需要s-腺苷甲硫氨酸进行合成的代谢物的方法
CN110923183A (zh) 产羊毛甾醇大肠杆菌菌株的构建方法
CN106591344A (zh) 一种融合分子伴侣标签的大肠杆菌热诱导可溶性蛋白表达载体及其应用
CN112553176B (zh) 一种热稳定性提高的谷氨酰胺转氨酶
CN101603023B (zh) 一株温控共表达外源基因的重组大肠杆菌及其应用
CN113755418A (zh) 表面展示碳酸酐酶的重组工程菌及其构建方法与应用
CN106011133B (zh) 一种小的dna分子量标准物、标准物质粒及其制备方法
CN106755031B (zh) 鼠李糖脂生产质粒及其构建方法与大肠杆菌工程菌和应用
CN114426957B (zh) 一种糖醛酸脱氢酶突变体及其在制备糖二酸中的应用
CN112553177B (zh) 一种热稳定性提高的谷氨酰胺转氨酶变体
KR101936825B1 (ko) 이소프렌의 생산 방법
CN114317473B (zh) 一种催化活性和热稳定性提高的谷氨酰胺转氨酶变体
CN110964702A (zh) 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用
KR101137021B1 (ko) 퓨조박테리움 뉴클레텀 유래의 신규 글리코실트랜스퍼라제및 이를 이용한 올리고당 제조방법
KR102527339B1 (ko) 일산화탄소 탈수소효소 및 포름산 탈수소효소를 이용한 개미산의 제조 방법
CN110964680B (zh) 利用纤维素制备金合欢烯的工程菌株及方法
CN110964681B (zh) 一种利用纤维素制备金合欢烯的工程菌株及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant