CN1336958A - 来自谷氨酸棒杆菌的丙酮酸羧化酶 - Google Patents

来自谷氨酸棒杆菌的丙酮酸羧化酶 Download PDF

Info

Publication number
CN1336958A
CN1336958A CN98814374A CN98814374A CN1336958A CN 1336958 A CN1336958 A CN 1336958A CN 98814374 A CN98814374 A CN 98814374A CN 98814374 A CN98814374 A CN 98814374A CN 1336958 A CN1336958 A CN 1336958A
Authority
CN
China
Prior art keywords
ala
leu
val
sequence
pyruvate carboxylase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN98814374A
Other languages
English (en)
Inventor
A·J·辛斯基
P·A·莱萨德
L·B·威利斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Original Assignee
Massachusetts Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology filed Critical Massachusetts Institute of Technology
Publication of CN1336958A publication Critical patent/CN1336958A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/08Lysine; Diaminopimelic acid; Threonine; Valine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y604/00Ligases forming carbon-carbon bonds (6.4)
    • C12Y604/01Ligases forming carbon-carbon bonds (6.4.1)
    • C12Y604/01001Pyruvate carboxylase (6.4.1.1)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及到一种来自谷氨酸棒状杆菌的添补酶,它可在赖氨酸和谷氨酸的工业发酵生产中补充消耗的草酰乙酸。特别地,本发明提供了编码丙酮酸羧化酶蛋白的分离的核酸。本发明还提供了丙酮酸羧化酶多肽。

Description

来自谷氨酸棒杆菌 的丙酮酸羧化酶
              本发明中的政府权利声明
本发明研发过程的部分工作使用了美国政府基金。美国政府对本发明具有部分权利。
                   发明背景
发明领域
本发明涉及到一种谷氨酸棒杆菌(Corynebacteriumglutamicum)丙酮酸羧化酶蛋白和编码这种蛋白质的多核苷酸。
背景技术
丙酮酸羧化酶是一种重要的添补酶,它在生长,或者工业发酵生产脯氨酸或者谷氨酸的过程中,补充因生物合成所消耗掉的草酰乙酸。
丙酮酸羧化酶所催化的两步反应的机制如下:
    (2)
在反应(1)中,依赖于ATP的生物素羧化酶结构域羧化生物素辅基,该生物素辅基连接在生物素-羧基-载体蛋白(BCCP)结构域的一个特定的赖氨酸残基上。乙酰基-辅酶A通过提高依赖于碳酸氢盐的ATP裂解的速率来激活反应(1)。在反应(2)中,BCCP结构域在被转羧基酶结构域催化的反应中,提供CO2给丙酮酸(Actwood,P.,V.,Int..J.Biochem.Cell.Biol.27:231-249(1995))。
丙酮羧化酶基因已经被从下列中克隆和测序:Rhizobium etli(Dunn,M..F.等,J.Bateriol,178:5960-5970(1996)),嗜热脂肪杆菌(Bacillus Stearothermophilus)(Kondo,H.,等,Gene191:47-50(1997),枯草杆菌(Genbank登记号Z97025),结核分枝杆菌(Mycobaterium tuberculosis)(Genbank登记号Z83018),和嗜热碱甲烷杆菌(Methanbacterium thermoautrophicum)(Mukhopadhyay,B,J.Biol.Chem.273:5155-5166(1998))。以前在乳发酵短杆菌(Brevibacterium lactofermentum)(Tasaka,0,等,Agric.Biol.Chem.43:1513-1519(1979))和谷氨酸棒杆菌(Corynebacterium glutamicum)中测定了丙酮酸羧化酶活性(Peters-Wendisch,P.G.,等,Microbiology143:1095-1103(1997))。
先前的研究显示,天冬氨酸家族氨基酸的生产力和产量决定性地依赖于通过添补途径的碳流(Vallino,J.J,和Stephanopoulos,G.Biotechnol.Bioeng.41:633-646(1993))。基于代谢平衡,可以显示出赖氨酸产生的速率,小于或者等于通过添补途径草酰乙酸合成的速率。
                   发明概述
本发明提供了一种分离的核酸分子,该核酸分子含有编码一种丙酮酸羧化酶多肽的多核苷酸,该多肽有如图1所示(SEQ ID NO:2)的氨基酸序列,或者ATCC保藏号_的细菌宿主保藏的粘粒所编码的氨基酸序列。通过测序保藏的丙酮酸羧化酶粘粒克隆确定的核苷酸序列,如图1(SEQ ID NO:1)所示,含有编码一个1140个氨基酸残基的多肽的可读框,该多肽的推定的分子量为大约1234kDa。预测的丙酮酸羧化酶蛋白质的1140个氨基酸的序列如图1和(SEQ ID NO:2)所示。
因此,本发明的一方面提供了分离的核酸分子,该核酸分子包括一种多核苷酸,具有选自如下的核苷酸序列:(a)一种编码丙酮酸羧化酶多肽的核苷酸序列,该丙酮酸羧化酶多肽具有SEQ ID NO:2中的完整的氨基酸序列;(b)一种编码丙酮酸羧化酶多肽的核苷酸序列,该丙酮酸羧化酶多肽具有ATCC保藏号_中的粘粒克隆所编码的完整的氨基酸序列;以及(c)与上述的(a)或者(b)中的核苷酸序列任何一种互补的核苷酸序列。
本发明更进一步的实施方案包括分离的核酸分子,这些分子包含的多核苷酸与上述(a)、(b)或者(c)中的任意多核苷酸序列具有至少90%,和更优选至少95%、97%、98%或者99%的同一性,或者这些分子包含一种多核苷酸,它们在严谨杂交条件下能够和具有的核苷酸序列与上述的(a)、(b)或者(c)中的核苷酸序列具有同一性的多核苷酸杂交。这些杂交的多核苷酸在严谨杂件交条件下不与具有仅由A残基或仅由T残基组成的核苷酸序列的多核苷酸杂交。
发明还涉及到含有本发明分离的核酸分子的重组载体,含有这些重组载体的宿主细胞,以及通过重组技术制备这些载体和宿主细胞的方法和使用它们生产丙酮酸羧化酶多肽或者肽的方法。
本发明还提供分离的丙酮酸羧化酶多肽,该丙酮酸羧化酶多肽具有的氨基酸序列选自:(a)具有图1所示(SEQ ID NO:2)氨基酸序列的丙酮酸羧化酶多肽的氨基酸序列;以及(b)具有完整的,由ATCC保藏号_中包含的粘粒克隆所编码的氨基酸序列的丙酮酸羧化酶多肽的氨基酸序列。本发明的多肽还包括所具有的氨基酸序列与上面所述(a)或者(b)中的氨基酸序列有至少90%相似性的,更优选95%相似性的多肽,以及所具有的氨基酸序列与上面所述的有至少70%同一性,更优选90%同一性,更优选95%,97%、98%和99%同一性的多肽。
                    附图的简要说明
图1显示了通过测序包含在ATCC保藏号_中的DNA克隆所确定的完整的丙酮酸羧化酶蛋白的核苷酸序列(SEQ ID NO:1)和推定的氨基酸序列(SEQ ID NO:2)。蛋白质序列具有大约1140个氨基酸残基,推定的分子量为大约123.6kDa。
                    发明的详述
本发明提供了分离的核酸分子,包括通过对克隆的粘粒进行测序得到的编码具有如图1(SEQ ID NO:2)所示的氨基酸序列的丙酮酸羧化酶蛋白的多核苷酸。本发明的丙酮酸羧化酶蛋白与结核分枝杆菌(Mycobaterium tuberculosis)的和人的丙酮酸羧化酶蛋白共享序列同源性。通过对编码一种丙酮酸羧化酶多肽的粘粒III F10进行测序所获得的核苷酸序列如图1(SEQ ID NO:1)所示,该粘粒保藏在美国典型培养物保藏中心(ATCC),10801University Blvd,Manassas,VA20110-2200,所给予的登记号为_。
                     核酸分子
除非另外说明,本文所有的核苷酸序列都是使用自动DNA测序仪(例如ABI Prism377)进行DNA分子测序而得到的,本文所有由测定的DNA分子所编码多肽的氨基酸序列都是由上面测定的DNA序列翻译预测而得的。因此,如本领域中所知的,通过这种自动设备测定的任何DNA序列,本文测定的任何核苷酸序列都可能含有一些错误。自动测序获得的核苷酸序列和要测序的DNA分子的真实序列典型地有至少大约90%,更典型地有至少大约95%至至少大约99.9%的同一性。真实的核苷酸序列可以通过其它方法,包括本领域中众所周知的人工DNA测序法更精确地测定。如本领域中所知的,较之于实际序列,在测定的核苷酸序列中单个的***或者缺失,会导致核苷酸序列翻译时移码,从而使预测的由测定的核苷酸序列编码的氨基酸序列,从这个***或者缺失位点开始会完全不同于测序的DNA分子真正编码的氨基酸序列。
除非另外说明,本文所提到的“核苷酸序列”代表一个脱氧核糖核苷酸(缩写为A、G、C、和T)的序列。然而,核酸分子或者多核苷酸的“核苷酸序列”指,DNA分子或多核苷酸,脱氧核糖核苷酸的序列,以及RNA分子,或者多核苷酸,其中特定的脱氧核苷酸序列中的每个胸腺嘧啶脱氧核苷酸(T)都被尿嘧啶核糖核苷酸(U)所替代的对应的核糖核苷酸(A、G、C和U)的序列。例如,参照具有使用脱氧核糖核苷酸缩写表示出的SEQ ID NO:1序列的RNA分子,指的是一种RNA分子,在它的序列中SEQ ID NO:1的每个脱氧核苷酸A、G或C被相应的核糖核苷酸A、G或C替代,而每个脱氧核苷酸T被核糖核苷酸U替代。
使用本文所提供的资料,例如图1中的核苷酸序列,通过应用常规的克隆和筛选方法,例如使用mRNA作为起始材料克隆DNA的方法,可以获得本发明的编码丙酮酸羧化酶多肽的核酸分子。图1所示的丙酮酸羧化酶蛋白(SEQ ID NO:2)和结核分枝杆菌(Mycobateriumtuberculosis)具有63%的同一性,和人具有44%的同一性。根据如上讨论的可能的测序错误,以及不同的已知蛋白中前导序列裂解位点的变化,普通技术人员会理解保藏的粘粒编码的真实的丙酮酸羧化酶多肽包含大约1140个氨基酸,但是可以是1133-1147个氨基酸的范围内的任意值。
如上所示的,本发明的核酸分子可以是以RNA的形式,例如mRNA,或者以DNA的形式,包括例如通过克隆或者合成得到的cDNA和基因组DNA。DNA可以是双链的或者单链的。单链DNA或者RNA可以是编码链,也被称为正义链,或者也可以是非编码链,也被称为反义链。
术语“分离”的核酸分子,指的是一种核酸分子,DNA或者RNA,被从它的天然环境中分离出来。例如,为本发明的目的分离的包含在载体中的重组DNA分子。分离的DNA分子的更多的例子包括维持在异源宿生组胞中的重组DNA分子,和在溶液中的部分或基本纯化的DNA分子。分离的RNA分子包括本发明的DNA分子在体内或者体外的RNA转录体。本发明的分离的核酸分子还包括通过合成产生的这些分子。
本发明中分离的核酸分子包括DNA分子,它们含有从图1所示核苷酸序列(SEQ ID:1)的199-201位作为起始密码的可读框;DNA分子,它们含有图1(SEQ ID NO:2)所示的丙酮酶酸羧化酶蛋白的编码序列;以及DNA分子,它们含有的序列基本上不同于上面所提到的那些,可是根据遗传密码的简并性,他们同样编码丙酮酸羧化酶蛋白。当然,遗传密码是为本领域众所周知的。因此,产生上述的简并变异体对本领域的技术人员来说是常规技术。
另一方面,本发明提供了分离的核酸分子,该核酸分子所编码的丙酮酸羧化酶多肽具有保藏在ATCC登记号_中的粘粒克隆所编码的氨基酸序列。优选地,该核酸分子编码上述保藏的克隆所编码的多肽。本发明还提供了分离的核酸分子,该核酸分子具有如1(SEQ ID NO:1)所示的核酸序列,或者具有上述保藏克隆含有的丙酮酸羧化酶DNA的核苷酸序列,或者该核酸分子具有的序列与上述序列的任何一种互补。
另一方面,本发明提供了一种分离的核酸分子,包括能够在严谨杂交条件下与上述本发明的核酸分子的一部分多核苷酸,例如保藏在ATCC登记号_中的粘粒克隆的一部分多核苷酸进行杂交的多核苷酸。“严谨杂交条件”指的是42℃,在溶液中温育过夜,溶液中含有:50%甲酰胺,5×SSC(150mM NaCl,15mM的柠檬酸三钠),50mM的磷酸钠(PH7.6),5×的Denhardt溶液,10%的硫酸葡聚糖,和20mg/ml的变性的,切碎的鲑鱼精DNA;然后用0.1×SSC在大约65℃清洗滤膜。可与一种多核苷酸的“一部分”杂交的多核苷酸,指的是一种多核苷酸(DNA或者RNA)能够和参照多核苷酸的至少大约15个核苷酸(nt)杂交,更优选至少大约20个nt,更优选至少大约30个nt,以及更优选至少大约30-70nt。这些可用作诊断探针和引物。
当然,依照本发明,可与参照多核苷酸(如保藏的粘粒克隆)的较大部分,例如长度为50-750nt的一段,甚至可与参照多核苷酸的全长杂交的多核苷酸,也可以用作探针,同样,对应于保藏的DNA或者图1所示的核苷酸序列(SEQ ID NO:1)的大部分,如果不是全部的话,的多核苷酸也可以。例如,“至少长度为20nt”的一部分多核苷酸,指的是一段来自参照多核苷酸核苷酸序列(例如保藏的DNA,或者如图1(SEQ ID NO:1)所示的核苷酸序列)的20个或者更多的邻接的核苷酸。如上所述,根据传统的DNA杂交技术,这些部分可在诊断上用作探针,或者作为引物用于通过聚合酶链式反应技术(PCR)扩增靶序列,参见如Sambrook,J.,Fricsch,E.F和Maniatis,T.,(1989)编:《分子克隆实验手册》第二版,冷泉港出版社,其完整的公开内容在本文引入作为参考。
既然已经保藏了丙酮酸羧化酶粘粒克隆,它的已经测定的核苷酸序列显示在图1(SEQ ID NO:1),那么产生与丙酮酸羧化酶DNA分子的一部分进行杂交的多核苷酸,对于本领域的技术人员来说就属于常规技术了。例如,通过限制内切酸裂解或者超声波切碎丙酮酸羧化酶粘粒克隆,就可以很容易得到不同大小的DNA部分,其是可以与丙酮酸羧化酶DNA分子的部分进行杂交的多核苷酸。可以供选择地,本发明的杂交的多核苷酸,可以根据已知技术通过合成的方法获得。
如上面所述的,编码丙酮酸羧化酶蛋白的多肽的本发明的核酸分子,可以包括,但是不限于编码该多肽氨基酸序列的那些自身;该多肽和附加序列的编码序列,例如,前-,原-或者前原-蛋白序列;带有或不带有上述附加编码序列的多肽的编码序列,其带有附加的非编码序列,包括例如,但不限于内含子和非编码5’和3’序列,例如在转录,mRNA加工中起重要作用的转录的,非翻译的序列,mRNA加工包括剪接和聚腺苷酸化信号,例如-核糖体接合和mRNA的稳定性;附加编码序列,其编码附加氨基酸,例如这些提供附加官能度的氨基酸。因此,编码多肽的序列可被融合于一个标记序列,例如编码便于纯化融合蛋白的多肽的序列。在本发明的一个特定的实施方案中,标记的氨基酸序列为六-组氨酸肽,例如pQE(Qiangen,Inc)载体中提供的标记物,其它的一些有很多是商业上可获得的。如Gentz等,Proc.Natl.Acad.Sci,USA86:821-824(1989)所叙述的,例如,六-组氨酸提供了这种融合蛋白方便的纯化方法。“HA”标记是另一种用于纯化的肽,它与来自流感病毒血凝素蛋白的一种抗原决定簇对应,已被Wilson等,CELL,37:767(1984)所述。
本发明还涉及到本发明的核酸分子的变异体,它们编码丙酮酸羧化酶蛋白的部分,类似物或者衍生物。变异体可以是天然存在的,例如天然的等位变异体。等位变异体指的是占据一种生物体中染色体给定位点的基因的几种替代形式中的一种。GenesII,Lewin,编。非天然存在的变异体可以通过方法上已知的诱变技术获得。
这些变异体包括由核苷酸替换,缺失或者添加所得到的那些。这些替换,缺失或者添加可以涉及一个或者更多个核苷酸。变异体可以是在编码区或者非编码区,或者二者同时改变。编码区的变化可以产生保守的或者非保守的氨基酸替换,缺失或者添加。其中特别优选的是沉默替换,缺乏或者添加,其不会改变丙酮酸羧化酶蛋白或者它的部分的特征和活性。这方面同样特别优选的是保守替换。最优选的是编码具有如图1所示的氨基酸序列(SEQ ID NO:2)的丙酮酸羧化酶蛋白的核酸分子。
此外,优选是丙酮酸羧化酶的优选表达比谷氨酸棒杆菌中高2到20倍的突变体或者变异体,以及反馈抑制突变体。
本发明更进一步的实施方案包括分离的核酸分子,包括一种多核苷酸,其具有与下面的序列有至少90%的同一性,更优选有至少95%,97%,98%或者99%的同一性的核苷酸序列:(a)一种核苷酸序列,它所编码的丙酮酸羧化酶多肽具有完整的SEQ ID NO:2的氨基酸序列;(b)一种核苷酸序列,它所编码的丙酮酸羧化酶多肽具有包含于ATCC保藏号_中的粘粒克隆编码的完整的氨基酸序列;或者(c)与上面的(a)或者(b)中的核苷酸任何一种互补的核苷酸序列。
一种具有与编码丙酮酸羧化酶多肽的参照核苷酸序列有至少例如95%的“同一性”的核苷酸序列的多核苷酸指的是,除了该多核苷酸序列每100个编码丙酮酸羧化酶多肽的参照核苷酸序列的核苷酸中有最多为5个的点突变外,该多核苷酸序列的核苷酸序列与参照序列是一致的。换句话说,为得到具有与参照核苷酸序列有至少95%核苷酸序列同一性的多核苷酸,参照序列中的高至5%的核苷酸可以删除或者用另外的核苷酸替换,或者至多占参照序列总核苷酸5%的数目的核酸可以***到参照序列中。这些参照序列的突变可以发生在参照核苷酸序列的5’或者3’端的位置,或者散布在这些末端位置之间的任意位置,或者单个地存在于参照序列的核苷酸间,或者以一个或更多个邻接的组群存在于参照序列中。
特别地,可以使用已知的计算机程序,例如Bestfit程序(Wisconsin序列分析软件包,UUNIX用8版,遗传学计算机小组,University Research Park,575Science Drive,Madison WI53711),方便地测定是否特定的核酸分子与图1所示的核苷酸序列或者保藏的粘粒克隆的核苷酸序列有例如至少90%,95%,97%,98%或者99%的同一性。Bestfit程序使用Smith和Waternan运算法(Advaces inApplied Mathematics2:482 489(1981))来寻找两个序列之间的最合适的同源性片段。根据本发明,当使用Bestfit或者任何其它的序列比较程序来确定是否特定的序列与本发明的参照序列有例如95%的同一性时,当然,参数的设置使得同一性的百分比是相对于全长参照序列来计算的且与参照序列核苷酸总数至多5%的同源性缺口是允许的。
本申请指定的核酸分子与图1所示的核酸序列(SEQ ID NO:1)或者保藏的DNA的核酸序列有至少90%,95%,97%、98%或者99%的同一性,而不论它们是否编码具有丙酮酸羧化酶活性的多肽。这是因为甚至当特定的核酸分子不编码具有丙酮酸羧化酶活性的多肽时,本领域中的技术人员仍然知道如何利用这些核酸分子,例如,用作杂交探针,或者聚合酶链式反应的引物。
然而,优选的是,核酸分子与图1所示的核酸序列(SEQ ID NO:1)或者保藏的DNA的核酸序列有至少90%、95%、97%、98%或者99%的同一性,它们实际上的确编码具有丙酮酸羧化酶蛋白活性的多肽。“具有丙酮酸羧化酶活性的多肽”指的是多肽具有的活性,通过特定的生物学方法测定,与本发明的丙酮酸羧化酶蛋白相似,但是不是必须一致的。
当然,根据遗传密码的简并性,本领域普通的技术人员可以立即识别与保藏的DNA的核酸序列或者图1所示的核酸序列(SEQ ID NO:1)具有至少90%、95%、97%、98%或者99%同一性的大量核酸分子会编码具有丙酮酸羧化酶蛋白活性多肽。实际上,既然这些核酸序列简并变异体都编码相同的多肽,甚至不用上述的比较方法,技术人员也可以明白这一点。本领域中还进一步认识到甚至于对那些不是简并变异体的核酸分子来说,合适量的这种分子也可以编码具有丙酮酸羧化酶蛋白活性的多肽。这是因为技术人员充分认识到很少会或者不会显著影响蛋白质的功能的氨基酸替代(例如,第二种脂族氨基酸替换一种脂族氨基酸)。
例如,Bowie.J.U,等“Deciphering the Message in ProteinSequences:Tolerance to Amino Acid Substtutions,”Science,247:1306-1310(1990),一文中给出了如何产生表型沉默氨基酸替换的指导,其中作者指出了两种主要的研究氨基酸序列改变的耐性的方法。第一种方法依赖于进化过程,其中的突变被自然选择所接受或者抛弃。第二种方法使用遗传工程将氨基酸变化导入克隆基因的特定位点上,并通过选择和筛选来鉴定保持功能的序列。如作者所述,这些研究显示出蛋白质对于氨基酸替换有惊人的忍耐性。作者还指出在一定位点的氨基酸变化是更有可能被接受的。例如,大多数埋入的氨基酸残基要求非极性侧链,而表面侧链通常只有很少特征是保守的。Bowie.J.U,等在上文中叙述了其它的这种表型沉默替换,上面列出了参考文献。
                   载体和宿主细胞
本发明还涉及到载体,其包括本发明的分离的DNA分子,用重组载体进行了遗传改造的宿主细胞,以及通过重组技术生产丙酮酸羧化酶多肽或其部分。
可以使用众所周知的技术,例如,感染,转导,转染,转位,结合,电穿孔和转化将重组结构导入宿主细胞。载体可以是,例如,噬菌体,质粒,病毒或者反转录病毒。
多核苷酸可以连接带有可筛选标记的载体,以在宿主细胞中增殖。通常地将质粒载体导入沉淀,例如磷酸钙沉淀,或者带电的脂质复合体。如果载体是病毒,可以使用合适的包装细胞系在体外进行包装,然后转导到宿主细胞中。
优选载体含有对目的多核苷酸的顺式作用调控区。合适的反式作用因子可以由宿主,载体或者基于导入宿主的载体自身提供。
在这部分特定的优选实施方案中,载体提供了专一性的表达,表达可以是受到诱异的,或细胞类型专一性的。在这些载体中特别优选的是易于操作的被环境因子诱导的那些载体,例如受温度和营养添加物诱导的载体。
本发明中使用的表达载体包括染色体-,游离型-和病毒-来源的载体,例如来自细菌质粒,噬菌体,酵母附加体,酵母染色体因子,病毒,例如杆状病毒,乳多空病毒,痘苗病毒,腺病毒,禽痘病毒,假狂犬病毒,和反转录病毒的载体,和由它们组合而衍生的载体,例如粘粒和噬菌粒。
DNA***片段应该有效地连在合适的启动子上,例如菌体λPL启动子,大肠杆菌Lac,trp和tae启动子,SV40早期和晚期启动了和反转录病毒LTPs启动子,此处列出了一些。其它的合适的启动子为本领域的技术人员所知。表达构建体还包括转录起始点,终止位点和在被转录区的翻译所需的核糖结合位点。由此构建体所表达的成熟转录体的编码部分包括在要翻译多肽开始部位的翻译起始密码子(AUG或者GUG)和适当地位于要翻译多肽末端合适部位的终止密码子。
如已说明的,表达载体优选包括至少一个选择性标记。这些标记包括真核细胞培养所需的二氢叶酸还原酸酶或者新霉素抗性,以及大肠杆菌和其它细菌培养所需的四环素,青霉素,氯霉素和卡那霉素抗性基因。合适的宿主细胞的代表性例子包括细菌细胞,例如大肠杆菌,谷氨酸棒状杆菌(C.glutamicum),链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)等的细胞;真菌细胞,例如酵母细胞。上述宿主细胞的合适的培养基和培养条件为本领域已知。
细菌中使用的优选的载体包括从Qiagen公司获得的pA2,pQE70和pQE60和pQE-9;从Stratagene公司获得的pBS载体,Phagescript载体,Bluescript载体,pNH8A,pNH16a,pNH18A,pNH46A,从Pharmacia公司获得的ptrc99a,pKK223-3,pKK233-3,pDR540,pRIT5。优选的真核载体包括从Stratagene公司获得的pWLNEO,pSV2CAT,pOG44,pXT1和pSG;可从Pharmalia公司获得的pSVK3,pBPV,pMSG和pSVL。其它合适的载体也为技术人员所知。
本发明使用的合适的细菌启动子包括大肠杆菌lacI和lacZ启动子,T3和T7启动子,gpt启动子和λPR和PL启动子和trp启动子。合适的真核启动了包括CMV立即早期启动子,HSV胸苷激酶启动子,早期和晚期SV40启动子,反转录病毒LTRs启动子,例如Rous肉瘤病毒(RSV)的那些,和金属硫蛋白启动子,比如鼠金属硫蛋白-I启动子。
使用磷酸钙转染法,DEAE-葡萄糖介导的转染法,阳离子脂质介导的转染法,电穿孔,转导,感染或者其它方法,可以有效地将重组结构转化到宿主细胞中。例如在许多标准实验手册中途述的方法,如Davis等,分子生物学基本方法”(1986)。
在高等真核生物中,通过向载体中***增强子序列可以提高编码本发明多肽的DNA的转录。增强子是DNA的顺式作用元件,通常大约10至300bp,它在一定的宿主细胞类型中提高启动子的转录活性。增强子的例子包括SV40增强子,它位于复制起始点晚侧100至270bp处,巨细胞病毒早期启动子增强子,在复制起始位点的晚期侧的多瘤病毒增强子,和腺病毒病毒增强子。
为了使转录的蛋白质分泌入内质网的腔中,周质空间或者细胞外环境中,可以将合适的分泌信号引入到表达的多肽上。这些信号对于多肽来说可以是内源的或者它们也可以是外源信号。
多肽可以以修饰的形式表达,例如融合蛋白,可以不但包括分泌信号,而且有附加的异源功能区。因此,例如,可以将附加的氨基酸区,特别是带电的氨基酸加到多肽的N-端,以提高在纯化过程中,或者在后面的操作和贮存过程中多肽的稳定性和持久性。而且,可以将肽部分加到多肽上以便于纯化。
丙酮酸羧化酶蛋白可以通过众所周知的方法从重组细胞培养物中回收和纯化,包括硫酸铵和乙醇沉淀,酸抽提,阴离子或者阳离子交换层析,磷酸纤维素层析,亲和层析,疏水相互作用层析,羟基磷灰石层析和凝集素层析。最优选地,使用高效液相层析(HPLC)进行纯化。
本发明的多肽包括天然纯化的产物,化学合成获得的产物,和利用重组技术在原核和真核宿主,包括例如细菌,酵母,高等植物,昆虫和哺乳动物细胞中产生的产物。依赖于重组生产过程中使用的宿主,本发明的多肽可以是糖基化的或者可以是非糖基化的,而且,在一些情况下作为宿主介导的过程的结果,本发明的多肽可以包括起始修饰的甲硫氨酸残基。
                 丙酮酸羧化酶多肽和肽
本发明还提供了一种分离的丙酮酸羧化酶多肽,其有保藏的DNA所编码的氨基酸序列,或者图1所示的氨基酸序列(SEQ ID NL:2),或者是含有上面多肽一部分的肽或多肽。名词“肽”和“寡肽”是同义的(如通称所认识的),两个名词可交换使用,作为一个概念,表示至少两个氨基酸由肽键连结而成的链。名词“多肽”此处用于表示由多于10个氨基酸残基构成的链。此处所有的寡肽和多肽的式和序列都是从左向右书写,在方向上是从氨基端到羧基端。
本领域可以认识到丙酮酸羧化酶多肽的一些氨基酸序列可以变化,而对于蛋白的结构和功能没有明显的影响。如果考虑这种序列的变化,应该记住蛋白质上存在决定活性的关键区域。通常,如果使用表现出相似的功能的酸残基,是可能替换形成三级结构的氨基酸残基的。在其它的例子中,如果变化处于蛋白质的非关键区域,则残基的类型可以是完全不重要的。
因此,本发明还提供了丙酮酸羧化酶多肽的变异体,它们显示出丙酮酸化酶的基本活性,或者它们包括丙酮酸化酶蛋白的一些区域,例如如下所讨论的区域。这些突变包括缺失,***,倒置,重复和类型替换(例如,用一个亲水残基替换另一个,但是作为一个规则,不用强亲水性的替换强疏水性的)。小的变化或者这些“中性”氨基酸的替换通常对活性只有很小的影响。
通常所见到的保守替换是,脂族氨基酸Ala,val,leu和Ile中的一个替换另一个;带羟基残基Ser和Thr的相互替换,酸性残基Asp和Glu的交换,酰胺残基Asn和Gln的取代,碱性残基Lys和Arg的交换和芳族氨基酸Phe和Tyr的替换。
如上面所详述的,更多的关于氨基酸改变可能是表型沉默(即对于功能不可能具有明显的有害效果)的指导可以在例如,Bowie.J.U,等“Deciphering the Message in Protein Sequences:Tolerance toAmino Acid Substtutions,”Science,247:1306--1310(1990),中找到。
本发明的多肽优选以分离的形式提供,且优选以基本纯化形式提供。如Smith和Johnson,Gene67:31-40(1998)所叙述的,一种重组产生的丙酮酸羧化酶多肽,可以通过一步法得到基本上的纯化。
本发明的多肽包括保藏的DNA编码的多肽,SEQ ID NO:2的多肽,以及与上述多肽有至少90%相似性,更优选有至少95%相似性,更优选有至少97%,98%或99%相似性的多肽。本发明更多的多肽包括与保藏DNA编码的多肽,SE ID NO:2多肽有70%同一性,更优选有至少90%或者95%同一性,更优选至少97%、98%、或99%同一性的多肽,也包括有至少30个氨基酸,更优选至少50个氨基酸的这些多肽的一部分。
两种多肽%相似性”指的是,通过使用Bestfit程序(Wisconsin序列分析软件包,UNIX用8版,遗传学计算机小组,UniversityResearch Park,575Science Drive,Madison WI53711)和确定相似性的缺席设置对两种多肽的氨基酸序列进行比较而得到的一种相似性分数。Bestfit使用Smith和Waternan局部同源性运算法(Advaces inApplied Mathematics 2:482-489(1981))来寻找两个序列之间的最好的相似性片段。
一种多肽具有的氨基酸序列与丙酮酸羧化酶多肽的氨基酸序列,有例如至少95%的“同一性”,指的是,除了每100个参照丙酮酸羧化酶多肽氨基酸序列的氨基酸中有最多为5个氨基酸的改变外,该多肽的氨基酸序列与参照序列是一致的。换句话说,为得到氨基酸序列与参照氨基酸序列有至少95%同一性的多肽,参照序列中的高至5%的氨基酸残基可以删除或者用其他的氨基酸替换,或者最多占参照序列总氨基酸残基数5%的氨基酸数可以***到参照序列中。这些参照序列的改变可以发生参照氨基酸序列的氨基端或者羧基端的位置,或者散布在这些末端位置之间的任意位置—或者单个地存在于参照序列的残基中,或者以一个或更多个相邻接的组群存在于参照序列中。
特别地,可以使用已知的计算机程序,例如Bestfit程序(Wisconsin序列分析软件包,UNIX用8版,遗传学计算机小组,University Research Park,575Science Drive,Madison WI 53711),可以方便地测定是否特定的多肽与图1所示的氨基酸序列(SEQ IDNO:2)或者保藏的粘粒克隆编码的氨基酸序列有至少90%,95%,97%,98%或者99%的同一性。根据本发明,当使用Bestfit或者任何其它的序列比较程序来确定是否特定的序列与本发明的参照序列有例如95%的同一性时,当然,参数的设置使得同一性的百分比是相对于全长参照氨基酸序列来计算的。与参照序列氨基酸残基总数高至5%的同源性空隙是允许的。
      用于棒状杆菌(Corynebaterium)操作的遗传工具
为制造出在棒状杆菌(Corynebaterium)中代谢工程所必需的遗传变化,研究者需要鉴定和克隆涉及到目的途径的基因。他们还需要一些方法来改变这些基因以影响他们编码的酶的调节或水平,然后将改变了的基因重新导入棒状杆菌(Corynebaterium)中,以检查它们对于氨基酸生物合成的效果。因此,代谢工程需要在其处理时能同时在棒状杆菌(Corynebaterium)和其它更易于操作的宿主中,比如大肠杆菌中进行复制的一批质粒。同时需要编码,例如,抗生素抗性的选择性标记,可以对变化的基因进行调节的良好表征的转录启动子,以及能将质粒***目的棒状杆菌(Corynebaterium)株中的有效的转化和接合***。
质粒已经分离和发展了几种不同的可以将基因导入并在棒状杆菌(Corynebaterium)中表达的质粒(Sonnen,H.等,Gene107:69-74(1991))。这些大部分原始被鉴定为小的(3-5Kb),隐蔽性的质粒,来自谷氨酸棒状杆菌(C.glutamicum),美棒状杆菌(C.callunae),和乳发酵棒状杆菌(C.lactofermentum)。它们分为四个相容组群,分别以质粒pCC1,PBL1,PHM1519和pGA1为例子。通过将已知大肠杆菌质粒的元件(特别是来自pBR322或者pUC18的ColE1复制起始位点),以及抗生素抗性标记引入,可以这些隐蔽性质粘开发出能同时在棒状杆菌(Corynebaterium)和大肠杆菌中复制的质粒  穿梭载体。第5个对于棒状杆菌(Corynebaterium)的操作非常有用的质粒是基于pNG2构建的,最初分离自白喉棒状杆菌(Corynebaterium diptheriae)(Serwold-Davis,T.M等,Proc,Natl,Acad,Sci,USA,84:4964-4968(1987))的质粒。这个质粒和它的衍生物能在许多种的棒状杆菌(Corynebaterium)和大肠杆菌中有效地复制。既然pNG2(一个仅1.8kbp的元件)的单独的复制起始点能够同时在革兰氏阳性和革兰氏阴性宿主中起作用,那么不需要给它另外添加ColE1型的元件。因此,pNG2衍生物(如pEP2)比其它的棒状杆菌(Corynebaterium)穿梭载体小得多,因此更容易操作。
选择性标记几种赋予抗生素抗性的基因已被证明可用于在棒状杆菌(Corynebaterium)中的质粒筛选和其他的重组DNA工作。这些基因包括来自Tn903的卡那霉素抗性决定子,分离自吸湿链霉菌(Streptomyces bygroscopicus)的潮霉素抗性标记,来自淀粉链球菌(Streptococcus faecalis)的四环素抗性基因,来自Tn5的博来霉素抗性标记,来自Streptomyces acrimycini的氯霉素抗性标记。在许多大肠杆菌质粒,如P3R322中使用的β-内酰胺酶基因在棒状杆菌(Corynebaterium)中不赋予氨苄青霉素抗性。
转化***  几种方法被设计用于将外源DNA导入棒状杆菌(Corynebaterium)中。最早的常规采用的方法是基于已在其它革兰氏阳性种中获得成功的方法,包括在DNA和聚乙二醇存在的情况下温育原生质球(Yoshihama,M等,J,Bacteriol,162:591-597(1985))。虽然这种方法可以使用,但是它的效率通常是比较低的,常常用每毫克DNA只能获得少于105个转化体。棒状杆菌(Corynebaterium)原生质球的电穿孔被证明为一种更有效和更可靠的转化方法。原生质球的制备产生通常是将细胞培养在丰富培养基上,培养基含有甘氨酸和或低浓度的其他的细胞壁生物合成抑制剂的,比如异烟肼,氨苄青霉素,青霉素G,或者吐温-80。然后用含有甘油的低盐缓冲液清洗原生质球,在电穿孔前将原生质球与DNA混合。据报道,使用这种方法的转化效率可以高达每微克质粒DNA107个转化体。
第三种将DNA转入棒状杆菌(Corynebaterium)的方法涉及到转接合。这种方法利用携带RP4质粒衍生物的各种大肠杆菌菌株的混杂。在大肠杆菌中,RP4编码许多功能,这些功能介导质粒从宿主菌株向大肠杆菌的其他受体菌株,甚至其它种中接合转移。这些“tra功能”介导菌毛形成和质粒转移。RP4还带有转移起始区,Ori T,一个被转移设置识别的顺式作用元件,它使得质粒通过菌毛传导并进入受体菌株。从这一***,Simon等(Bio/Technology 1:784-791(1985)开发出一种有用的用于将质粒从大肠杆菌转移到棒状杆菌(Corynebaterium)的转接合工具。他们将从RP4来的tra功能重新定位到一株被命名为S17-1的大肠杆菌菌株的染色体中。带有RP4oriT的质粒,能被从S17-1高效地转入其它的受体。尽管此方法已被证明对于导入复制质粒到棒状杆菌是有用的,其被证明对产生基因破坏更为有用。此可以通过导入一个可选择性的标记到棒状杆菌基因的克隆中来完成,其中的基因是破坏的目标。此构建物然后被连接于携带RP4oriT但缺少来支持在棒状杆菌复制的起点的大肠杆菌质粒。携带此质粒的S17-1然后被与受体菌株温育,且混合物然后转入到选择性培养基上。因为被导入的质粒不能在棒状杆菌(Corynebaterium)中复制,表达选择性标记的转接合体非常有可能在基因组DNA内发生了交换重组。
限制性缺陷株尽管使用了这种转化***,在文献中有很明显的先例就是棒状杆菌(Corynebaterium)能将大肠杆菌来源的DNA识别为外源DNA并通常降解它。这个功能是由棒状杆菌(Corynebaterium)的限制和修饰***造成的。为克服这一***的作用,一些转化和转接合方法要求在转化前对受体菌株进行简短地加热。热处理大概能失活负责限制性***的酶,使导入的DNA在酶被周转之前变成确定的。另一个用来提高DNA转移效率的策略是分离棒状杆菌(Corynebaterium)突变体,其中的限制性***是缺陷的。这些菌株以和已在棒状杆菌(Corynebaterium)中扩增的质粒几乎同样的效率引入在大肠杆菌扩增的质粒。在另一个用于克服棒状杆菌(Corynebaterium)中的限制性***的策略中,Leblon和其同事发展了一种基因破坏的“整合子”***(Reyes,O.等,GENE107:61-68(1991))。整合子是与目的宿主DNA有相同的限制/修饰特性的DNA分子,它所携带的DNA与宿主基因组的一部分(即基因组要被破坏的一个区域)同源,不能在宿主细胞中复制。一个从棒状杆菌(Corynebaterium)中克隆的基因,首先在一个可以在棒状杆菌(Corynebaterium)菌株中复制的质粒中用选择性标记间断。这个构建体然后被从棒状杆菌(Corynebaterium)质粒上切割下来,并自连接形成一个非复制的环状分子。这个整合子然后通过电穿孔被导入限制性宿主中。DNA的修饰使得整合子可以躲避宿主的限制性***,并且它进入宿主基因组中的重组,使选择性标记得到表达。
启动子  外源基因在棒状杆菌(Corynebaterium)中的表达需要可靠的转录启动子。对一些特定实验来说,也需要它的活性可以在特定的培养条件下被诱导的受调节的启动子。来自棒状杆菌(Corynebaterium)基因的启动子,例如fda,thrC和hom启动子被证明可用于外源基因表达。来自大肠杆菌的可诱导的启动子,例如,当lac抑制子(LacI)存在时受异丙基硫代半乳糖苷(IPTG)诱导的Plac和Ptrc启动子;当Trp抑制子(trpR)存在时对诱导物吲哚丙烯酸响应的Ptrp启动子;当温度敏感的λ抑制子(cI857)存在时受到抑制的λPL,都被用于在棒状杆菌(Corynebaterium)中调节基因表达。
基因鉴定  虽然存在所有其它的遗传工具,鉴定来自棒状杆菌(Corynebaterium)的相关基因仍然是一个挑战。在大肠杆菌中,一些已用于分离基因的来源是转导噬菌体,转座因子,从转导和转结合实验得到的大肠杆菌染色体的遗传图谱,以及最近,完整的染色体的物理和序列图。目前从棒状杆菌(Corynebaterium)中鉴定和回收基因的最成功的方法是使用棒状杆菌(Corynebaterium)基因组DNA补充(Complement)已知的大肠杆菌的营养缺陷型。在这个实践中,带有棒状杆菌(Corynebaterium)基因组片段的质粒文库,被导入特定的酶或者功能缺陷的大肠杆菌菌株中。不再显示出营养缺陷型(例如,高丝氨酸缺陷)的转化体,可能带有来自棒状杆菌(Corynebaterium)的互补基因。这种策略导致大量的棒状杆菌(Corynebaterium)基因被分离,包括几种来自负责天冬氨酸衍生的和芳香族氨基酸的合成途径,中间代谢和其它的细胞过程的基因。这一策略的一个限制是,不是所有的棒状杆菌(Corynebaterium)基因都可以在大肠杆菌宿主中表达的。因此,尽管一个基因可能显示于质粒文库中,它可能不能补充大肠杆菌的突变,因此不能过筛选来回收。为克服这个限制,一小部分基因是通过类似的策略鉴定的,这里将野生型棒状杆菌(Corynebaterium)的质粒文库,直接用于补充其它棒状杆菌(Corynebaterium)的突变。尽管这一策略避免了在营养缺陷型宿主中基因表达的量不够的问题,它的应用仍然被营养缺陷型中质粒转化效率低的问题所限制。还有其它的一些基因是通过与基于其它物种同源基因的核酸探针杂交,以及使用聚合链式反应和简并寡核苷酸引物进行直接扩增而鉴定的。
转座因子转座因子在基因鉴定中是非常有力的工具,因为它们偶联基因恢复和诱变。不象经典的诱变技术那样在基因中产生点突变或者小的缺失,当转座因子***基因中时,它们形成大的破坏,因此“标记”变化的基因以更易于被鉴定。已有一定数量的在棒状杆菌(Corynebaterium)中转位的转座因子被发现。在C.xerosi的pTP10质粒和白喉棒状杆菌(C.diphtherine)的PNG2质粒中发现的转位子,显示出可以在谷氨酸棒状杆菌(C.glutamicum)中转位并赋予红霉素抗性。日本Mitsubishi化学公司的一个小组从他们在谷氨酸棒状杆菌(C.glutamicum)中发现的一个***序列,IS31831,开发出一系列的人工转位子(Vertes,A.A等,Mol.Gen.Genet.245:397-405(1994)).在向IS31831的倒转重复间***一个选择性标记后,这些研究者将获得的在一个大肠杆菌质粒上(不能在棒状杆菌(Corynebaterium)中复制)的转位子,通过电穿孔的方法导入谷氨酸棒状杆菌(C.glutamicum)菌株中。他们发现选择性标记以大约4×104突变体/毫克DNA的频率***目的细胞的基因组中。使用这些转位子产生棒状杆菌(Corynebaterium)营养缺陷型,由此分离出几种负责氨基酸生物合成,和棒状杆菌(Corynebaterium)中其它功能的基因。
转导噬菌体转导噬菌体已用于其它***中对遗传基因座作图和分离基因。1976年,日本Ajinomoto公司的研究者们研究了150株经鉴定和未经鉴定的各种产谷氨酸的棒状杆菌菌株,鉴定可能用于转导的噬菌体(Mornose等,.J.Gen.Appl.microbiol.Rev,16:243-252(1995))。从这些筛选中回收的24个不同的噬菌体分离物中,只有3个可以以明显频率将trp标记从trp+供体转入trp-受体中,尽管甚至这个效率也只有10-7或者更少。这些研究者通过加入4mM环状腺苷酸(cAMP)和1.2mM氯化镁,稍微提高了转导的效率。一些不同的研究者试图从一些来源比如污染的工业发酵物,土壤和动物废物中分离corynephage开发可靠的转导方法。尽管分离和鉴定出了许多噬菌体,但是几乎没有与转导相关,开发出可普遍用于谷氨酸-产生细菌的可靠的高效的转导***的机会仍然是存在的。
                   实施例
下列实施例列出了以下的实验方案和实验细节。
细菌菌株和质粒
谷氨酸棒状杆菌(C.glutamicum)21253(hom,赖氨酸过量生产者)被用于制备染色体DNA。大肠杆菌DH5α(hsdR-,recA-)(Hanahan,D.,J.mol.Biol:166-577(1983))被用于转化。质粒pCR2.1TOPO(Invitrogen公司)被用于克隆聚合酶链式反应(PCR)产物。本研究构建了pRR850质粒,它含有一个克隆进pCR2.1TOPO质粒的850bp的片段。
培养基和培养条件
大肠杆菌菌株在37℃生长在Luria-Bertani(LB)培养基中(Sambrook,J,等,Molecular cloning:a laboratory manual,2ndedn,.Cold Spring Habour Laboratory,Cold Spring Habour,NY(1989))。谷氨酸棒状杆菌(C.glutamicum)在30℃生长在LB培养基中。当提到时,氨苄青霉素以下列浓度使用:平板上100μg/ml和液体培养基中50μg/ml。
DNA操作
如Tomioka,等所述从谷氨酸棒状杆菌(C.glutamicum)中分离了基因组DNA(Tomioka,N,等,Mol,gen.Genet.184:359-363(1980).根据供应商操作手册将PCR片段克隆入pCR2.1TOPO载体中。粘粒和质粒DNA使用Qiaprep spin柱制备,用Qiaex试剂盒(Qiagen公司)从琼脂糖凝胲中抽提DNA。测序所需的粘粒的大规模高纯度制备,使用Promega Wizard试剂盒(Promega公司)。使用标准技术进行大肠杆菌转化和琼脂糖凝胶电泳(Sambrook,J,等,Molecular cloning:alaboratory manual,2nd edn,.Cold Spring Habour Laboratory,ColdSpring Habour,NY(1989))。限制酶购自Boehringer Mannheim公司或者New England Bioabs公司。
粘粒文库
所用的粘粒文库是通过将谷氨酸棒状杆菌(C.glutamicum)染色体DNA,克隆入Supercos载体而构建的(Stratagene公司)。
聚合酶链式反应技术(PCR)
PCR是使用Boehringer Mannheim PCR core试剂盒依照制造商的说明进行的。当在谷氨酸棒状杆菌(C.glutamicum)染色体DNA上进行PCR反应时,每一反应中加入约1μg DNA。PCR反应所用的正向引物为
5’GTCTTCATCGAGATGAATCCGCG 3’
反向引物为:
5’CGCAGCGCCACATCGTAAGTCGC 3’
斑点印迹分析
含有本研究中鉴定的粘粒DNA的斑点印迹和作为正对照的探针用S&S小倍量仪(Schleicher & Schull公司)制备。编码谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶基因的一部分的一段850bp片段作为探针。如制造商所述,探针在一个随机引发的DNA标记反应用地高辛配基-11-duTP(Boehringer monabeim公司)进行标记。斑点印迹的杂交,清洗和比色检测使用Boehringer公司的Genius***,遵照他们的滤膜杂交用户指导的方法进行。291个粘粒起始杂交,在65℃进行过夜,在杂交温度清洗。用于第二轮筛选的17个粘粒的杂交,在65℃下进行杂交,但是只杂交8小时,胶片暴光的时间也减少。
用Western印迹检测含生物素的蛋白质
如Jetten和Sinskey所述制备谷氨酸棒状杆菌(C.gluamicum)细胞抽提物(Jetten,M.S.M,和Sinstrey,A.J.,FEMS,MicrobiolLett.111:183-188(1993))。细胞抽提物中的蛋白质,使用十二烷基硫酸纳(SDS)/7.5%聚丙烯胺凝胶,在BioRad微型凝胶装置上进行分离,然后使用BioRad微型转膜装置电转移到硝酸纤维膜上,如Towin等所述(Towbin,H.等,Proc,Natl,Acad,Sci,USA76:4350-4353(1979))。生物素化的蛋白使用Biorad公司抗生物素蛋白结合的碱性磷酸酶和Schleicher&Schull公司的5-溴-4-氯-3-吲哚磷酸-对-甲苯胺盐/氯化氮蓝四唑进行检测。
DNA测序
使用ABIPrism377DNA测序仪由MIT生物聚合物设备进行自动DNA测序。
序列分析
使用DNA  strider1.0版本程序(法国,Institut de RechercheFondamentale)进行DNA序列的倒转,互补,翻译和在序列中寻找可读框。使用国家生物技术信息中心(NCBI)的BLAST程序(Altsschul,S.F.等,J.Mol.Biol,215:403-410(1990))比较蛋白质和DNA序列。使用MACAW软件(NCBI)进行蛋白质的同源性搜索。使用Biosoft International的Primer Prenier软件设计PCR引物。使用Genevn大学的Expasy分子生物学服务器上的计算PI/MW工具来预测推定的氨基酸序列的分子量和pI。
实施例1:Western印迹检测生物素化的酶
既然已知丙酮酸羧化酶含有生物素,就可以用Western印迹来检测谷氨酸棒状杆菌(C.glutamicum)中生物素化的蛋白的产生。从LB培养基中培养的细胞中制备的抽提物中检测到了两种生物素化的蛋白质,(资料来显示)和以前的报告一致。大约位于80kDa的一条带鉴定为乙酰基辅酶A羧化酶的生物素羧基载体结构域(BCCP)(Jager,W.等,Arch.Microbiol 166:76-82(1996))。在120kDa的第二条带相信是丙酮酸羧化酶,因为这些蛋白在113-130kDa的范围内(Actwood,P.V.Int,J.Biochem.Cell.Biol.,27:231-249(1995))。
实施例2:PCR和克隆
基于以前已克隆出基因高度保守区的同源性克隆了谷氨酸棒状杆菌(C.glutamicum)的丙酮酸羧化酶基因。检测了13种生物体的丙酮酸羧化酶基因,设计了相应于丙酮酸羧化酶中保守的ATP结合亚基序,和紧靠丙酮酸结合基序(表1)的区域的引物。当氨基酸不同时,基于结核分枝杆菌(M.glutamicum)来设计引物,因为它和产谷氨酸棒状细菌(C.glutamicum)的近亲缘关系。从谷氨酸棒状杆菌(C.glutamicum)的基因组DNA中用PCR扩增了一个850bp的片段,并克隆到Invitrogen公司的pCR2.1TOPO载体上构建了pBR850质粒。引物还可以基于保守的生物素结合位点和丙酮酸结合位点(资料来显示)设计。
实施例3;分离含有谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶基因的粘粒。
含有谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶基因一部分的850碱基对的片段被用作探针检测谷氨酸棒状杆菌(C.glutamicum)基因组文库。在第一轮筛选中,斑点印迹中的291个粘粒中的17个表现为阳性。对这17个粘粒进行第二轮筛选,使用相同的探针,但是更严谨的杂交条件,获得4个有阳性信号的粘粒。为确证这些粘粒确实含有丙酮酸羧化酶基因,使用4个阳性粘粒作为模板,用于制备探针的相同引物进行PCR。从所有4个阳性相斯质粒中扩增出了850bp的片段,命名为IIIF10,IIE9,IIIG7和IIIB7。
生物体                   保守区A      保守区B
Caenorhabditis elegans   YFIEVNAR     ATFDVSMAedes aegypti            YFIEVNAR     ATFDVAL结核分枝杆菌             VFIEMNPR     ATYDVAL嗜热脂肪杆菌             YFIEVNPR     ATFDVAY巴斯徳毕赤酵母           YFIEINPR     ATFDVSMMus musculus             YFIEVNSR     ATFDVAMRattus norvegicus        YFIEVNSR     ATFDVAM酿洒酵母1                YFIEINPR     ATFDVAM酿洒酵母2                YFIEINPR     ATFDVAMRhizabium etli           YFIEVNPR     ATFDVSM人                       YFIEVNSR     ATFDVAM粟酒裂殖酵母             YFIEINPR     ATFDVSM
表1,使用NASAW软件对13种生物的丙酮酸羧化酶序列(来自Genbank)进行比较。选出两个高度保守的区,基于与这些区域相对应的结核分枝杆菌DNA序列设计了寡核苷酸生物。正向引物基于对应于保守区A的DNA序列。反向引物基于对应于保守区B的DNA序列。实施例4:测序策略
使用M13正向和M13反向引物对质粒pRR850中的850bp的***片段进行了测序。基于这个序列设计了Begrev1和Endfor1引物,用于对丙酮酸羧化酶基因的850bP部分的开始和终止位点之外的序列的测序。粘粒IIIF10被用作测序模板。通过设计新的引物(表2)并“步移”过整个基因而连续测序。
实施例5:序列分析
测序粘粒IIIF10的3637个bp的序列。鉴定出了一个3420bp的读码框,预测它编码一个1140个氨基酸的蛋白质。推断的蛋白质和结核分枝杆菌(M tuberculosis)的丙酮酸羧化酶有63%的同一性,和人的丙酮酸羧化酶有44%的同一性,基于此同源性命名为谷氨酸棒状杆菌(C.glutamicum)基因pc。预测推断的蛋白质的pI为5.4,分子量为123.6KDa,它与通过SDS/聚丙烯酰胺凝胶电泳得到的估计为120KDa的亚基的分子量是类似的。起始甲硫氨基酸的上游显示出具有共有核糖体结合位点AAGGAA。基于和结核分枝杆菌(M tuberculosis)序列的同源性,预测的翻译起始位点是GTG密码子,它也在其它的细菌序列中被观察到(Stryer,L.,Biocbemistry,3rd edn,Freeman,NY(1988);Keilhauer,C,等,J.Bacterio,175:5595-5603(1993))。该DNA序列被递交给GenBank并被给与的登记号为:AF038548。
谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶的氨基端节段含有六肽GGGGRG,它与发现在所有生物素给合蛋白中的GGGG(R/K)G序列相匹配,相信是一个ATP结合位点(Fry,D.C.,等Proc Nal AcadSci USA 83:907-911(1986);Post,L.E,等,J.Biol.Chem265:7742-7747(1990)。第二个被提出与ATP结合有关,且存在于生物素依赖性的羧化酶和氨甲酰基磷酸合成酶中的区域在谷氨酸棒状杆菌(C.glutamicum)序列中是保守的(Lim F,等,J.Biol.chem.263:11493-11497(1988))。预测的谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶蛋白也含有推定的丙酮酸结合基序,FLFEDPWDR,它在分枝杆菌,根瘤菌和人丙酮酸羧化酶的转羧基酶结构域是保守的(Dunn,N,F等,J.Bacteriol 178:5960-1970(1996).  用转羧基酶的色氨酸荧光的研究表明,在这个基序中的Trp残基与丙酮酸的结合有关(Kumer,G.K等,Biochemistry27:2978-5983(1988))。该酶的羧基端节段含有推定的生物素结合位点,AMKM,它与在其它丙酮酸羧化酶以及其它生物素赖性酶的生物素羧基载体蛋白(BCCP)结构域中发现的是一致的。
引物名称    引物序列(5′-3′)
Begrev1    TTCACCAGGTCCACCTCGEndfor1    CGTCGCAAAGCTGACTCCBegrev2    GATGCTTCTGTTGCTAATTTGCEndfor2    GGCCATTAAGGATATGGCTGBegrev3    GCGGTGGAATGATCCCCGAEndfor3    ACCGCACTGGGCCTTGCGEndfor4    TCGCCGCTTCGGCAACAC
表2,用于得到粘粒IIIF10中的丙酮酸羧酶基因的引物的DNA序列。
以前的研究表明磷酸烯醇丙酮酸羧化酶(ppc)不是谷氨酸棒状杆菌(C.glutamicum)中主要的添补酶,因为缺少它并不影响赖氨酸的生成(Gubler,M等,Appl,Microbiol,Biotechnol.40:857--863(1994);Peters-Wendisch,P.G.等,Microbiol,lett.11:269-274(1993)).而且,大量研究表明了存在丙酮酸羧化的酶,研究使用13C标记实验和NMR和GC-MS分析(Park,S.M.等,Apllied,Microbiol,Biotechnol,47:430-440(1997b);Peters-Wendisch,P.G.等,Arch,Microbiol,165:387-396(1996)),或者使用无细胞抽提物(Tosaka,O,Agri,Boil.Chem,43:1513-1519(1979))和可通透细胞(Peters-Wendisch,P.G等,Microbiol,143:1095-1103(1997)的酶学实验。在无细胞抽提物中只能检测到很低的丙酮酸羧化酸活性。而这与非常的ATP背景并不脱离。很可能测得的这种活性是由于可逆的葡糖异生酶,比如草酰乙酸脱羧化酶和苹果酸酶。谷氨酸棒杆菌中丙酮酸羧化酶的存在,使上述的葡萄糖异生酶满足这株细菌的添补的需要成为很不可能。
推断的谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶的基因的氨基酸序列和来自不同种群生物的丙酮酸羧化酶序列有显著的相似性。它含有在N一端区域的生物素羧化酶结构域,在C端区域的BCCP结构域,和在中间区域的具有丙酮酸特异结合位点的转羧基酶结构域。谷氨酸棒状杆菌(C.glutamicum)的丙酮酸羧化酶蛋白和结核分枝杆菌和人的丙酮酸羧化酶显示出强烈的同源性(Wexler,I,D等,Biochem.Biophys.Acta,1227:4652(1994))。
有先例发现谷氨酸棒状杆菌(C.glutamicum)含有不止一种行使再生草酰乙酸的添补功能的酶。产香茅醇假单胞菌(Pseudomonascitronellolis),荧光假单胞菌(Pseudomonas fuorscens),棕色固氮菌和新型硫杆菌(Thiobacillus novellus)含有ppc和丙酮酸羧化酶(O’Brien,R,W,等,J.Biol Chem 252:1257-1263(1977));Scrutton,M.C.和Taylor,B.L.Arch,Biochem.Biophys,164:641--654(1974),Milrad de Forcheet,SR,和Cazullo,J.J.J.Gen,Microbiol,93:75-81(1976);Charles,A.M,和Wiler,D.W,Can,J,Microbiol,30:532-539(1984)。玉米含有ppc的三种同功酶(Toh,H.等,Plant Cell Environ 17:31-43(1994).酿酒酵母(Saccharomyces Cerevisiae)中含有两种丙酮酸羧化酶的同功酶(Brewser,N,K等,Arch.Biochem.Biophys311:62-71(1994)),每种被示差调节。已发现丙酮酷羧化酶基因存在于谷氨酸棒状杆菌(C.glutamicum)中,可相互转化磷酸烯醇丙酮酸,草酰乙酸和丙酮酸的酶在此菌株中的数量达到6个。在一种生物体中存在全部6种酶的情况还没有被报道过。产香茅醇假单胞菌含有相互转化草酰乙酸,PEP和丙酮酸的5种酶,即丙酮酸激酶,PEP合成酶,PEP羧化酶,草酰乙酸脱羧酶和丙酮酸羧化酶(O’Brien,R,W,等,J.BiolChem252:1257-1263(1997).固氮菌含有上面除了PEP合成酶以外的所有酶(Scrutton,M.C.和Taylor,B.L.Arch,Biochem.Biophys,164:641-654(1974))。
谷氨酸棒状杆菌(C.glutamicum)中6种代谢相关的酶的存在,提示了通过效应子进行调节这些酶是重要的。所有6种相关的酶与其它下游活性协调的生化和遗传学研究可以导致对于最大化这种工业上重要的生物体的初级代谢物的产量必要的准确过程的阐明。
实施例6:丙酮酸羧化酶突变体的构建
应用PCR扩增了丙酮酸羧化酶从180到3630位核苷酸的完整的可读框。设计PCR使用的寡核甘酸引物,通过沉默诱变去除编码序列中的SalI位点,并在可续框的上游和下游分别导入EcoRV和SalI位点。用EcoRV和SalI消化PCR产物并克隆到pBluescript载体上。获得pPCBluescript质粒。为获得在质粒携带的pyc的破坏,构建了pPCBluescript的衍生物,其中的pyc基因的中间部分被删除并替换上了tsr基因,它编码对于抗生素硫链丝菌肽的抗性。然后将RP4mob元件***质粒中,得到pAL240。这个质粒能够经结合转移到棒状杆菌中,但是它转入后不能复制,因为它仅仅具有ColE1复制起始位点。经转接合将pAL240从大肠杆菌S17-1转入谷氨酸棒状杆菌中,然后在含有硫链丝菌肽和萘啶酮酸的培养基上筛选转结合体。
在确证每一个转接合体的药物抗性表型之后,检测它们在不同碳源上生长的能力。因为pAL240不能在棒状杆菌中复制,能够存活的那些细胞应是其基因组和质粒进行了重组的。鉴定出的几种侯选物具有合适的表型:它们具有对硫链丝菌肽和萘啶酮酸的抗性,在含有葡萄糖和醋酸作为单一碳源的极限平板上生长良好,在含有乳酸作为单一碳源的极限平板上生长较差或者根本不在生长。应用Southern杂交和基于PCR的实验来确证是否仅有一个拷贝的丙酮酸羧化酶基因存在于基因组中,以及是否它被硫链丝菌肽抗性标记破坏了。检测这一菌殊中的赖氨酸的合成和生物素化蛋白的产生,Δpyc菌株作为活性实验的负对照,和互补实验的宿主株。
实施例7:开发过量表达的菌株
为了检测丙酮酸羧化酶水平的增加会导致赖氨酸产量的增加这一假说,有必要构建菌株,其中的丙酮酸羧化酶基因的表达是处在诱导型启动子的控制下。
载体pAPE12,它具有NG2的复制起始位点和IPTG控制的Trp启动子的下游的多克隆位点,被用作谷氨酸棒状杆菌中的表达载体。构建了pAPE12的衍生物,其中含有的丙酮酸羧化酶位于Ptrc的下游。将pyc基因从pPCBluescript上,用SalI和XbaI切下,并连接到用同样酶切割的pAPE12上,形成pLW305。pPCBluescript上的丙酮酸羧化酶基因(因此,同样地pLW305上)具有野生型的GTG起始密码子,并且存在于靠近野生型基因的5’端的SalI限制性位点,被通过在丙酮酸羧化酶基因的扩增中引入一个碱基的沉默突变而消除掉了。
pLW305和pAPE12被通过电穿孔导入几种其它的棒状杆菌的遗传背景中。
因为pLW305中的丙酮酸羧化酶基因具有GTG起始密码子,并在trc启动子和起始密码间含有一些间插DNA,设计一种丙酮酸羧化酶过表达质粒,pXL1,其消除了这些缺点。使用寡核苷酸引物,从pLW305扩增该基因的5’端时,同时,将GTG启始密码子变成了ATG并引入了BspLU11-I限制性位点,其与NcoI相容。然后用BspLU11-I和AfeI切割PCR产物,并连入pLW305的用NcoI部分消化后用AfeI完全切割所得到的7.5Kb的骨架上。两个独立套的连接和转化得到了推定的pXL1克隆。
实施例8:发酵结果
已经显示出,当基因从其天然谷氨酸棒状杆菌C.glutamicum启动子表达时,丙酮酸羧化酶的活性水平随碳源的不同而有很大的变化。因此,检测了在这些碳源上生长的各个菌株的丙酮酸羧化酶的产量。
菌株NRRL B-11474,NRRLB-11474(pLW305),和NRRL B-11474Δpyc侯选物35在具两种不同碳源,葡萄糖和乳酸的烧瓶中于NRRLB-11474的极限培养基上生长。生长结果和氨基酸产生量列出如下。
                 葡萄糖                  乳酸
     生物量(克/升)   赖氨酸(克/升)   Ylys/glc(克/克)  生物量(克/升)  赖氨酸(克/升)  Ylys/lac(克/克)
NRRLB-11474     6.7±0.2   5.0±0.7     0.21   3   1.7   0.12
RRL-B11474(pLW305)     7.3±0.2   5.3±0.2     0.22   4   2.5   0.15
Δpyc#35     1.1   0     0   0   0   0
NRRL B-11474和pLW305在葡萄糖上表现出相同的行为。两株都产生相同的生物量和赖氨酸。在乳酸上也具有相似的赖氨酸产量。在相同的时期中,NRRL B-11474(pLW305)消耗了培养基中所有的乳酸,而野生型的NRRL-11474消耗少40%的乳酸。通过计算得到:NRRLB-11474以0.37克乳酸/小时的速率消耗乳酸,而NRRL B-11474(pLW305)菌株以0.65克乳酸/小时的速率消耗是这种基质。
NRRL B-11474Δpyc不在乳酸上生长,这与预期的表型是一致的。它的葡萄糖上的生长非常低,且该菌株不产生赖氨酸。进行动力学研究可以获知这些菌株行为的更多的特征。
实施例9:目测观察生物素化的蛋白
丙酮酸羧化酶含有生物素。因此通过监测细胞中特定的生物素化产物的出现,应该可以测定这种酶的积累。
实施例10:电泳凝胶
为在电泳凝胶中检测生物素化的蛋白质,使用了一种商业来源的连接着碱性磷酸酶的链霉抗生物素蛋白。经过诱导或者未诱导的大肠杆菌DH5α或者含有pAPE12或者pLW305的NRRL B-11474的培养物的粗蛋白裂解物在双份的7.5%聚丙烯胺变性电泳胶上分离蛋白质。每对之一的凝胶用考马斯亮兰染色以观察所有的蛋白质,并保证每一上样孔中所上样的蛋白质量是一样的。其它的凝胶用能够结合生物素化蛋白的链霉抗生物素蛋白质-碱性磷酸酶试剂处理。给碱性磷酸酶提供比色底物,5-溴-4-氯-3-引哚磷酸(BCIP)可以目测观察到这些蛋白质的位置。与其它人所报道的一样,检测到了两种主要的生物素化蛋白。高分子量的那种(大约120KDa)显示为丙酮酸羧化酶,低分子量的那种(大约60KDa)是生物素化的乙酰辅酶A羧化酶亚基。
此处提到的所有出版物作为参考引入本文。
尽管为了阐明和理解的目的已用一些细节描述了前述发明,但阅读本说明书的本领域的技术人员会充分理解各种形式和细节的变化并非脱离本发明和所附权利要求的范围。
序列表<110>Sinskey,Anthony J.
 Lessard,Philip A.
 Willis,Laura B.
 Stephanopoulos,Gregory<120>来自谷氨酸棒杆菌的丙酮酸羧化酶<130>1533.079CN00<140><141><160>36<170>PatentIn Ver.2.0<210>1<211>3621<212>DNA<213>谷氨酸棒杆菌<220><221>CDS<222>(199)..(3621)<400>1tggggcgggg ttagatcctg gggggtttat ttcattcact ttggcttgaa gtcgtgcagg 60tcaggggagt gttgcccgaa aacattgaga ggaaaacaaa aaccgatgtt tgattggggg 120aatcgggggt tacgatacta ggacgcagtg actgctatca cccttggcgg tctcttgttg 180aaaggaataa ttactcta gtg tcg act cac aca tct tca acg ctt cca gca   231
                Met Ser Thr His Thr Ser Ser Thr Leu Pro Ala
                  1               5                  10ttc aaa aag atc ttg gta gca aac cgc ggc gaa atc gcg gtc cgt gct   279Phe Lys Lys Ile Leu Val Ala Asn Arg Gly Glu Ile Ala Val Arg Ala
         15                  20                  25ttc cgt gca gca ctc gaa acc ggt gca gcc acg gta gct att tac ccc   327Phe Arg Ala Ala Leu Glu Thr Gly Ala Ala Thr Val Ala Ile Tyr Pro
     30                  35                  40cgt gaa gat cgg gga tca ttc cac cgc tct ttt gct tct gaa gct gtc   375Arg Glu Asp Arg Gly Ser Phe His Arg Ser Phe Ala Ser Glu Ala Val
 45                  50                  55cgc att ggt acc gaa ggc tca cca gtc aag gcg tac ctg gac atc gat   423Arg Ile Gly Thr Glu Gly Ser Pro Val Lys Ala Tyr Leu Asp Ile Asp 60                  65                  70                  75gaa att atc ggt gca gct aaa aaa gtt aaa gca gat gcc att tac ccg    471Glu Ile Ile Gly Ala Ala Lys Lys Val Lys Ala Asp Ala Ile Tyr Pro
             80                  85                  90gga tac ggc ttc ctg tct gaa aat gcc cag ctt gcc cgc gag tgt gcg    519Gly Tyr Gly Phe Leu Ser Glu Asn Ala Gln Leu Ala Arg Glu Cys Ala
        95                  100                 105gaa aac ggc att act ttt att ggc cca acc cca gag gtt ctt gat ctc    567Glu Asn Gly Ile Thr Phe Ile Gly Pro Thr Pro Glu Val Leu Asp Leu
    110                 115                 120acc ggt gat aag tct cgc gcg gta acc gcc gcg aag aag gct ggt ctg    615Thr Gly Asp Lys Ser Arg Ala Val Thr Ala Ala Lys Lys Ala Gly Leu
125                 130                 135cca gtt ttg gcg gaa tcc acc ccg agc aaa aac atc gat gag atc gtt    663Pro Val Leu Ala Glu Ser Thr Pro Ser Lys Asn Ile Asp Glu Ile Val140                 145                 150                 155aaa agc gct gaa ggc cag act tac ccc atc ttt gtg aag gca gtt gcc    711Lys Ser Ala Glu Gly Gln Thr Tyr Pro Ile Phe Val Lys Ala Val Ala
            160                 165                 170ggt ggt ggc gga cgc ggt atg cgt ttt gtt gct tca cct gat gag ctt    759Gly Gly Gly Gly Arg Gly Met Arg Phe Val Ala Ser Pro Asp Glu Leu
        175                 180                 185cgc aaa tta gca aca gaa gca tct cgt gaa gct gaa gcg gct ttc ggc    807Arg Lys Leu Ala Thr Glu Ala Ser Arg Glu Ala Glu Ala Ala Phe Gly
    190                 195                 200gat ggc gcg gta tat gtc gaa cgt gct gtg att aac cct cag cat att    855Asp Gly Ala Val Tyr Val Glu Arg Ala Val Ile Asn Pro Gln His Ile
205                 210                 215gaa gtg cag atc ctt ggc gat cac act gga gaa gtt gta cac ctt tat    903Glu Val Gln Ile Leu Gly Asp His Thr Gly Glu Val Val His Leu Tyr220                 225                 230                 235gaa cgt gac tgc tca ctg cag cgt cgt cac caa aaa gtt gtc gaa att    951Glu Arg Asp Cys Ser Leu Gln Arg Arg His Gln Lys Val Val Glu Ile
            240                 245                 250gcg cca gca cag cat ttg gat cca gaa ctg cgt gat cgc att tgt gcg    999Ala Pro Ala Gln His Leu Asp Pro Glu Leu Arg Asp Arg Ile Cys Ala
        255                 260                 265gat gca gta aag ttc tgc cgc tcc att ggt tac cag ggc gcg gga acc    1047Asp Ala Val Lys Phe Cys Arg Ser Ile Gly Tyr Gln Gly Ala Gly Thr
    270                 275                 280gtg gaa ttc ttg gtc gat gaa aag ggc aac cac gtc ttc atc gaa atg    1095Val Glu Phe Leu Val Asp Glu Lys Gly Ash His Val Phe Ile Glu Met
285                 290                 295aac cca cgt atc cag gtt gag cac acc gtg act gaa gaa gtc acc gag    1143Asn Pro Arg Ile Gln Val Glu His Thr Val Thr Glu Glu Val Thr Glu300                 305                 310                 315gtg gac ctg gtg aag gcg cag atg cgc ttg gct gct ggt gca acc ttg    1191Val Asp Leu Val Lys Ala Gln Met Arg Leu Ala Ala Gly Ala Thr Leu
            320                 325                 330aag gaa ttg ggt ctg acc caa gat aag atc aag acc cac ggt gca gca    1239Lys Glu Leu Gly Leu Thr Gln Asp Lys Ile Lys Thr His Gly Ala Ala
        335                 340                 345ctg cag tgc cgc atc acc acg gaa gat cca aac aac ggc ttc cgc cca    1287Leu Gln Cys Arg Ile Thr Thr Glu Asp Pro Asn Asn Gly Phe Arg Pro
    350                 355                 360gat acc gga act atc acc gcg tac cgc tca cca ggc gga gct ggc gtt    1335Asp Thr Gly Thr Ile Thr Ala Tyr Arg Ser Pro Gly Gly Ala Gly Val
365                 370                 375cgt ctt gac ggt gca gct cag ctc ggt ggc gaa atc acc gca cac ttt    1383Arg Leu Asp Gly Ala Ala Gln Leu Gly Gly Glu Ile Thr Ala His Phe380                 385                 390                 395gac tcc atg ctg gtg aaa atg acc tgc cgt ggt tcc gac ttt gaa act    1431Asp Ser Met Leu Val Lys Met Thr Cys Arg Gly Ser Asp Phe Glu Thr
            400                 405                 410gct gtt gct cgt gca cag cgc gcg ttg gct gag ttc acc gtg tct ggt    1479Ala Val Ala Arg Ala Gln Arg Ala Leu Ala Glu Phe Thr Val Ser Gly
        415                 420                 425gtt gca acc aac att ggt ttc ttg cgt gcg ttg ctg cgg gaa gag gac    1527Val Ala Thr Asn Ile Gly Phe Leu Arg Ala Leu Leu Arg Glu Glu Asp
    430                 435                 440ttc act tcc aag cgc atc gcc acc gga ttc att gcc gat cac ccg cac    1575Phe Thr Ser Lys Arg Ile Ala Thr Gly Phe Ile Ala Asp His Pro His
445                 450                 455ctc ctt cag gct cca cct gct gat gat gag cag gga cgc atc ctg gat    1623Leu Leu Gln Ala Pro Pro Ala Asp Asp Glu Gln Gly Arg Ile Leu Asp460                 465                 470                 475tac ttg gca gat gtc acc gtg aac aag cct cat ggt gtg cgt cca aag    1671Tyr Leu Ala Asp Val Thr Val Asn Lys Pro His Gly Val Arg Pro Lys
            480                 485                 490gat gtt gca gct cct atc gat aag ctg cct aac atc aag gat ctg cca    1719Asp Val Ala Ala Pro Ile Asp Lys Leu Pro Asn Ile Lys Asp Leu Pro
        495                 500                 505ctg cca cgc ggt tcc cgt gac cgc ctg aag cag ctt ggc cca gcc gcg    1767Leu Pro Arg Gly Ser Arg Asp Arg Leu Lys Gln Leu Gly Pro Ala Ala
    510                 515                 520ttt gct cgt gat ctc cgt gag cag gac gca ctg gca gtt act gat acc    1815Phe Ala Arg Asp Leu Arg Glu Gln Asp Ala Leu Ala Val Thr Asp Thr
525                 530                 535acc ttc cgc gat gca cac cag tct ttg ctt gcg acc cga gtc cgc tca    1863Thr Phe Arg Asp Ala His Gln Ser Leu Leu Ala Thr Arg Val Arg Ser540                 545                 550                 555ttc gca ctg aag cct gcg gca gag gcc gtc gca aag ctg act cct gag    1911Phe Ala Leu Lys Pro Ala Ala Glu Ala Val Ala Lys Leu Thr Pro Glu
            560                 565                 570ctt ttg tcc gtg gag gcc tgg ggc ggc gcg acc tac gat gtg gcg atg    1959Leu Leu Ser Val Glu Ala Trp Gly Gly Ala Thr Tyr Asp Val Ala Met
        575                 580                 585cgt ttc ctc ttt gag gat ccg tgg gac agg ctc gac gag ctg cgc gag    2007Arg Phe Leu Phe Glu Asp Pro Trp Asp Arg Leu Asp Glu Leu Arg Glu
    590                 595                 600gcg atg ccg aat gta aac att cag atg ctg ctt cgc ggc cgc aac acc    2055Ala Met Pro Asn Val Asn Ile Gln Met Leu Leu Arg Gly Arg Asn Thr
605                 610                 615gtg gga tac acc ccg tac cca gac tcc gtc tgc cgc gcg ttt gtt aag    2103Val Gly Tyr Thr Pro Tyr Pro Asp Ser Val Cys Arg Ala Phe Val Lys620                 625                 630                 635gaa gct gcc agc tcc ggc gtg gac atc ttc cgc atc ttc gac gcg ctt    2151Glu Ala Ala Ser Ser Gly Val Asp Ile Phe Arg Ile Phe Asp Ala Leu
            640                 645                 650aac gac gtc tcc cag atg cgt cca gca atc gac gca gtc ctg gag acc    2199Asn Asp Val Ser Gln Met Arg Pro Ala Ile Asp Ala Val Leu Glu Thr
        655                 660                 665aac acc gcg gta gcc gag gtg gct atg gct tat tct ggt gat ctc tct    2247Asn Thr Ala Val Ala Glu Val Ala Met Ala Tyr Ser Gly Asp Leu Ser
    670                 675                 680gat cca aat gaa aag ctc tac acc ctg gat tac tac cta aag atg gca    2295Asp Pro Asn Glu Lys Leu Tyr Thr Leu Asp Tyr Tyr Leu Lys Met Ala
685                 690                 695gag gag atc gtc aag tct ggc gct cac atc ttg gcc att aag gat atg    2343Glu Glu Ile Val Lys Ser Gly Ala His Ile Leu Ala Ile Lys Asp Met700                 705                 710                 715gct ggt ctg ctt cgc cca gct gcg gta acc aag ctg gtc acc gca ctg    2391Ala Gly Leu Leu Arg Pro Ala Ala Val Thr Lys Leu Val Thr Ala Leu
            720                 725                 730cgc cgt gaa ttc gat ctg cca gtg cac gtg cac acc cac gac act gcg    2439Arg Arg Glu Phe Asp Leu Pro Val His Val His Thr His Asp Thr Ala
        735                 740                 745ggt ggc cag ctg gca acc tac ttt gct gca gct caa gct ggt gca gat    2487Gly Gly Gln Leu Ala Thr Tyr Phe Ala Ala Ala Gln Ala Gly Ala Asp
    750                 755                 760gct gtt gac ggt gct tcc gca cca ctg tct ggc acc acc tcc cag cca    2535Ala Val Asp Gly Ala Ser Ala Pro Leu Ser Gly Thr Thr Ser Gln Pro
765                 770                 775tcc ctg tct gcc att gtt gct gca ttc gcg cac acc cgt cgc gat acc    2583Ser Leu Ser Ala Ile Val Ala Ala Phe Ala His Thr Arg Arg Asp Thr780                 785                 790                 795ggt ttg agc ctc gag gct gtt tct gac ctc gag ccg tac tgg gaa gca    2631Gly Leu Ser Leu Glu Ala Val Ser Asp Leu Glu Pro Tyr Trp Glu Ala
            800                 805                 810gtg cgc gga ctg tac ctg cca ttt gag tct gga acc cca ggc cca acc    2679Val Arg Gly Leu Tyr Leu Pro Phe Glu Ser Gly Thr Pro Gly Pro Thr
        815                 820                 825ggt cgc gtc tac cgc cac gaa atc cca ggc gga cag ttg tcc aac ctg    2727Gly Arg Val Tyr Arg His Glu Ile Pro Gly Gly Gln Leu Ser Asn Leu
    830                 835                 840cgt gca cag gcc acc gca ctg ggc ctt gcg gat cgt ttc gaa ctc atc    2775Arg Ala Gln Ala Thr Ala Leu Gly Leu Ala Asp Arg Phe Glu Leu Ile
845                 850                 855gaa gac aac tac gca gcc gtt aat gag atg ctg gga cgc cca acc aag    2823Glu Asp Asn Tyr Ala Ala Val Asn Glu Met Leu Gly Arg Pro Thr Lys860                 865                 870                 875gtc acc cca tcc tcc aag gtt gtt ggc gac ctc gca ctc cac ctc gtt    2871Val Thr Pro Ser Ser Lys Val Val Gly Asp Leu Ala Leu His Leu Val
            880                 885                 890ggt gcg ggt gtg gat cca gca gac ttt gct gcc gat cca caa aag tac    2919Gly Ala Gly Val Asp Pro Ala Asp Phe Ala Ala Asp Pro Gln Lys Tyr
        895                 900                 905gac atc cca gac tct gtc atc gcg ttc ctg cgc ggc gag ctt ggt aac    2967Asp Ile Pro Asp Ser Val Ile Ala Phe Leu Arg Gly Glu Leu Gly Asn
    910                 915                 920cct cca ggt ggc tgg cca gag cca ctg cgc acc cgc gca ctg gaa ggc    3015Pro Pro Gly Gly Trp Pro Glu Pro Leu Arg Thr Arg Ala Leu Glu Gly
925                 930                 935cgc tcc gaa ggc aag gca cct ctg acg gaa gtt cct gag gaa gag cag    3063Arg Ser Glu Gly Lys Ala Pro Leu Thr Glu Val Pro Glu Glu Glu Gln940                 945                 950                 955gcg cac ctc gac gct gat gat tcc aag gaa cgt cgc aat agc ctc aac    3111Ala His Leu Asp Ala Asp Asp Ser Lys Glu Arg Arg Asn Ser Leu Asn
            960                 965                 970cgc ctg ctg ttc ccg aag cca acc gaa gag ttc ctc gag cac cgt cgc    3159Arg Leu Leu Phe Pro Lys Pro Thr Glu Glu Phe Leu Glu His Arg Arg
        975                 980                 985cgc ttc ggc aac acc tct gcg ctg gat gat cgt gaa ttc ttc tac ggc    3207Arg Phe Gly Asn Thr Ser Ala Leu Asp Asp Arg Glu Phe Phe Tyr Gly
    990                 995                1000ctg gtc gaa ggc cgc gag act ttg atc cgc ctg cca gat gtg cgc acc    3255Leu Val Glu Gly Arg Glu Thr Leu Ile Arg Leu Pro Asp Val Arg Thr1005                1010                1015cca ctg ctt gtt cgc ctg gat gcg atc tct gag cca gac gat aag ggt    3303Pro Leu Leu Val Arg Leu Asp Ala Ile Ser Glu Pro Asp Asp Lys Gly1020               1025                1030                1035atg cgc aat gtt gtg gcc aac gtc aac ggc cag atc cgc cca atg cgt    3351Met Arg Asn Val Val Ala Asn Val Asn Gly Gln Ile Arg Pro Met Arg
           1040                1045                1050gtg cgt gac cgc tcc gtt gag tct gtc acc gca acc gca gaa aag gca    3399Val Arg Asp Arg Ser Val Glu Ser Val Thr Ala Thr Ala Glu Lys Ala
       1055                1060                1065gat tcc tcc aac aag ggc cat gtt gct gca cca ttc gct ggt gtt gtc    3447Asp Ser Ser Asn Lys Gly His Val Ala Ala Pro Phe Ala Gly Val Val
   1070                1075                1080acc gtg act gtt gct gaa ggt gat gag gtc aag gct gga gat gca gtc    3495Thr Val Thr Val Ala Glu Gly Asp Glu Val Lys Ala Gly Asp Ala Val1085                1090                1095gca atc atc gag gct atg aag atg gaa gca aca atc act gct tct gtt    3543Ala Ile Ile Glu Ala Met Lys Met Glu Ala Thr Ile Thr Ala Ser Val1100               1105                1110                1115gac ggc aaa atc gat cgc gtt gtg gtt cct gct gca acg aag gtg gaa    3591Asp Gly Lys Ile Asp Arg Val Val Val Pro Ala Ala Thr Lys Val Glu
           1120                1125                1130ggt ggc gac ttg atc gtc gtc gtt tcc taa                            3621Gly Gly Asp Leu Ile Val Val Val Ser
       1135                1140<210>2<211>1140<212>PRT<213>谷氨酸棒杆菌<400>2Met Ser Thr His Thr Ser Ser Thr Leu Pro Ala Phe Lys Lys Ile Leu1               5                  10                  15Val Ala Asn Arg Gly Glu Ile Ala Val Arg Ala Phe Arg Ala Ala Leu
         20                  25                  30Glu Thr Gly Ala Ala Thr Val Ala Ile Tyr Pro Arg Glu Asp Arg Gly
     35                  40                  45Ser Phe His Arg Ser Phe Ala Ser Glu Ala Val Arg Ile Gly Thr Glu
 50                  55                  60Gly Ser Pro Val Lys Ala Tyr Leu Asp Ile Asp Glu Ile Ile Gly Ala65                  70                  75                  80Ala Lys Lys Val Lys Ala Asp Ala Ile Tyr Pro Gly Tyr Gly Phe Leu
             85                  90                  95Ser Glu Asn Ala Gln Leu Ala Arg Glu Cys Ala Glu Asn Gly Ile Thr
        100                 105                  110Phe Ile Gly Pro Thr Pro Glu Val Leu Asp Leu Thr Gly Asp Lys Ser
    115                 120                 125Arg Ala Val Thr Ala Ala Lys Lys Ala Gly Leu Pro Val Leu Ala Glu
130                 135                 140Ser Thr Pro Ser Lys Asn Ile Asp Glu Ile Val Lys Ser Ala Glu Gly145                 150                 155                 160Gln Thr Tyr Pro Ile Phe Val Lys Ala Val Ala Gly Gly Gly Gly Arg
            165                 170                 175Gly Met Arg Phe Val Ala Ser Pro Asp Glu Leu Arg Lys Leu Ala Thr
        180                 185                 190Glu Ala Ser Arg Glu Ala Glu Ala Ala Phe Gly Asp Gly Ala Val Tyr
    195                 200                 205Val Glu Arg Ala Val Ile Asn Pro Gln His Ile Glu Val Gln Ile Leu
210                 215                 220Gly Asp His Thr Gly Glu Val Val His Leu Tyr Glu Arg Asp Cys Ser225                 230                 235                 240Leu Gln Arg Arg His Gln Lys Val Val Glu Ile Ala Pro Ala Gln His
            245                 250                 255Leu Asp Pro Glu Leu Arg Asp Arg Ile Cys Ala Asp Ala Val Lys Phe
        260                 265                 270Cys Arg Ser Ile Gly Tyr Gln Gly Ala Gly Thr Val Glu Phe Leu Val
    275                 280                 285Asp Glu Lys Gly Asn His Val Phe Ile Glu Met Asn Pro Arg Ile Gln
290                 295                 300Val Glu His Thr Val Thr Glu Glu Val Thr Glu Val Asp Leu Val Lys305                 310                 315                 320Ala Gln Met Arg Leu Ala Ala Gly Ala Thr Leu Lys Glu Leu Gly Leu
            325                 330                 335Thr Gln Asp Lys Ile Lys Thr His Gly Ala Ala Leu Gln Cys Arg Ile
        340                 345                 350Thr Thr Glu Asp Pro Asn Asn Gly Phe Arg Pro Asp Thr Gly Thr Ile
    355                 360                 365Thr Ala Tyr Arg Ser Pro Gly Gly Ala Gly Val Arg Leu Asp Gly Ala
370                 375                 380Ala Gln Leu Gly Gly Glu Ile Thr Ala His Phe Asp Ser Met Leu Val385                 390                 395                 400Lys Met Thr Cys Arg Gly Ser Asp Phe Glu Thr Ala Val Ala Arg Ala
            405                 410                 415Gln Arg Ala Leu Ala Glu Phe Thr Val Ser Gly Val Ala Thr Asn Ile
        420                 425                 430Gly Phe Leu Arg Ala Leu Leu Arg Glu Glu Asp Phe Thr Ser Lys Arg
    435                 440                 445Ile Ala Thr Gly Phe Ile Ala Asp His Pro His Leu Leu Gln Ala Pro
450                 455                 460Pro Ala Asp Asp Glu Gln Gly Arg Ile Leu Asp Tyr Leu Ala Asp Val465                 470                 475                 480Thr Val Asn Lys Pro His Gly Val Arg Pro Lys Asp Val Ala Ala Pro
            485                 490                 495Ile Asp Lys Leu Pro Asn Ile Lys Asp Leu Pro Leu Pro Arg Gly Ser
        500                 505                 510Arg Asp Arg Leu Lys Gln Leu Gly Pro Ala Ala Phe Ala Arg Asp Leu
    515                 520                 525Arg Glu Gln Asp Ala Leu Ala Val Thr Asp Thr Thr Phe Arg Asp Ala
530                 535                 540His Gln Ser Leu Leu Ala Thr Arg Val Arg Ser Phe Ala Leu Lys Pro545                 550                 555                 560Ala Ala Glu Ala Val Ala Lys Leu Thr Pro Glu Leu Leu Ser Val Glu
            565                 570                 575Ala Trp Gly Gly Ala Thr Tyr Asp Val Ala Met Arg Phe Leu Phe Glu
        580                 585                 590Asp Pro Trp Asp Arg Leu Asp Glu Leu Arg Glu Ala Met Pro Asn Val
    595                 600                 605Asn Ile Gln Met Leu Leu Arg Gly Arg Asn Thr Val Gly Tyr Thr Pro
610                 615                 620Tyr Pro Asp Ser Val Cys Arg Ala Phe Val Lys Glu Ala Ala Ser Ser625                 630                 635                 640Gly Val Asp Ile Phe Arg Ile Phe Asp Ala Leu Asn Asp Val Ser Gln
            645                 650                 655Met Arg Pro Ala Ile Asp Ala Val Leu Glu Thr Asn Thr Ala Val Ala
        660                 665                 670Glu Val Ala Met Ala Tyr Ser Gly Asp Leu Ser Asp Pro Asn Glu Lys
    675                 680                 685Leu Tyr Thr Leu Asp Tyr Tyr Leu Lys Met Ala Glu Glu Ile Val Lys
690                 695                 700Ser Gly Ala His Ile Leu Ala Ile Lys Asp Met Ala Gly Leu Leu Arg705                 710                 715                 720Pro Ala Ala Val Thr Lys Leu Val Thr Ala Leu Arg Arg Glu Phe Asp
            725                 730                 735Leu Pro Val His Val His Thr His Asp Thr Ala Gly Gly Gln Leu Ala
        740                 745                 750Thr Tyr Phe Ala Ala Ala Gln Ala Gly Ala Asp Ala Val Asp Gly Ala
    755                 760                 765Ser Ala Pro Leu Ser Gly Thr Thr Ser Gln Pro Ser Leu Ser Ala Ile
770                 775                 780Val Ala Ala Phe Ala His Thr Arg Arg Asp Thr Gly Leu Ser Leu Glu785                 790                 795                 800Ala Val Ser Asp Leu Glu Pro Tyr Trp Glu Ala Val Arg Gly Leu Tyr
            805                 810                 815Leu Pro Phe Glu Ser Gly Thr Pro Gly Pro Thr Gly Arg Val Tyr Arg
        820                 825                 830His Glu Ile Pro Gly Gly Gln Leu Ser Asn Leu Arg Ala Gln Ala Thr
    835                 840                 845Ala Leu Gly Leu Ala Asp Arg Phe Glu Leu Ile Glu Asp Asn Tyr Ala
850                 855                 860Ala Val Asn Glu Met Leu Gly Arg Pro Thr Lys Val Thr Pro Ser Ser865                 870                 875                 880Lys Val Val Gly Asp Leu Ala Leu His Leu Val Gly Ala Gly Val Asp
            885                 890                 895Pro Ala Asp Phe Ala Ala Asp Pro Gln Lys Tyr Asp Ile Pro Asp Ser
        900                 905                 910Val Ile Ala Phe Leu Arg Gly Glu Leu Gly Asn Pro Pro Gly Gly Trp
    915                 920                 925Pro Glu Pro Leu Arg Thr Arg Ala Leu Glu Gly Arg Ser Glu Gly Lys
930                 935                 940Ala Pro Leu Thr Glu Val Pro Glu Glu Glu Gln Ala His Leu Asp Ala945                 950                 955                 960Asp Asp Ser Lys Glu Arg Arg Asn Ser Leu Asn Arg Leu Leu Phe Pro
            965                 970                 975Lys Pro Thr Glu Glu Phe Leu Glu His Arg Arg Arg Phe Gly Asn Thr
        980                 985                 990Ser Ala Leu Asp Asp Arg Glu Phe Phe Tyr Gly Leu Val Glu Gly Arg
    995                1000                1005Glu Thr Leu Ile Arg Leu Pro Asp Val Arg Thr Pro Leu Leu Val Arg1010                1015                1020Leu Asp Ala Ile Ser Glu Pro Asp Asp Lys Gly Met Arg Asn Val Val025                1030                1035                1040Ala Asn Val Asn Gly Gln Ile Arg Pro Met Arg Val Arg Asp Arg Ser
           1045                1050                1055Val Glu Ser Val Thr Ala Thr Ala Glu Lys Ala Asp Ser Ser Asn Lys
       1060                1065                1070Gly His Val Ala Ala Pro Phe Ala Gly Val Val Thr Val Thr Val Ala
   1075                1080                1085Glu Gly Asp Glu Val Lys Ala Gly Asp Ala Val Ala Ile Ile Glu Ala1090                1095                1100Met Lys Met Glu Ala Thr Ile Thr Ala Ser Val Asp Gly Lys Ile Asp105                1110                1115                1120Arg Val Val Val Pro Ala Ala Thr Lys Val Glu Gly Gly Asp Leu Ile
           1125                1130                1135Val Val Val Ser
       1140<210>3<211>23<212>DNA<213>人工序列<220><223>人工序列的描述:正向DNA引物<400>3gtcttcatcg  agatgaatcc  gcg       23<210>4<211>23<212>DNA<213>人工序列<220><223>人工序列的描述:反向DNA引物<400>4cgcagcgcca  catcgtaagt  cgc       23<210>5<211>8<212>PRT<213>Caenorhabditis elegans<400>5Tyr Phe Ile Glu Val Asn Ala Arg1               5<210>6<211>7<212>PRT<213>Caenorhabditis elegans<400>6Ala Thr Phe Asp Val Ser Met1               5<210>7<211>8<212>PRT<213>Aedes aegypti<400>7Tyr Phe Ile Glu Val Asn Ala Arg1               5<210>8<211>7<212>PRT<213>Aedes aegypti<400>8Ala Thr Phe Asp Val Ala Leu1               5<210>9<211>8<212>PRT<213>结核分枝杆菌<400>9Val Phe Ile Glu Met Asn Pro Arg1               5<210>10<211>7<212>PRT<213>结核分枝杆菌<400>10Ala Thr Tyr Asp Val Ala Leu1               5<210>11<211>8<212>PRT<213>嗜热脂肪杆菌<400>11Tyr Phe Ile Glu Val Asn Pro Arg1               5<210>12<211>7<212>PRT<213>嗜热脂肪杆菌<400>12Ala Thr Phe Asp Val Ala Tyr1               5<210>13<211>8<212>PRT<213>巴斯德毕赤酵母<400>13Tyr Phe Ile Glu Ile Asn Pro Arg1               5<210>14<211>7<212>PRT<213>巴斯德毕赤酵母<400>14Ala Thr Phe Asp Val Ser Met1               5<210>15<211>8<212>PRT<213>Mus musculus<400>15Tyr Phe Ile Glu Val Asn Ser Arg1               5<210>16<211>7<212>PRT<213>Mus musculus<400>16Ala Thr Phe Asp Val Ala Met1               5<210>17<211>8<212>PRT<213>Rattus norvegicus<400>17Tyr Phe Ile Glu Val Asn Ser Arg1               5<210>18<211>7<212>PRT<213>Rattus norvegicus<400>18Ala Thr Phe Asp Val Ala Met1               5<210>19<211>8<212>PRT<213>酿酒酵母    1<400>19Tyr Phe Ile Glu Ile Asn Pro Arg1               5<210>20<211>7<212>PRT<213>酿酒酵母    1<400>20Ala Thr Phe Asp Val Ala Met1               5<210>21<211>8<212>PRT<213>酿酒酵母    2<400>21Tyr Phe Ile Glu Ile Asn Pro Arg1               5<210>22<211>7<212>PRT<213>酿酒酵母    2<400>22Ala Thr Phe Asp Val Ala Met1               5<210>23<211>8<212>PRT<213>Rhizobium etli<400>23Tyr Phe Ile Glu Val Asn Pro Arg1               5<210>24<211>7<212>PRT<213>Rhizobium etli<400>24Ala Thr Phe Asp Val Ser Met1               5<210>25<211>8<212>PRT<213>人<400>25Tyr Phe Ile Glu Val Asn ser Arg1               5<210>26<211>7<212>PRT<213>人<400>26Ala Thr Phe Asp Val Ala Met1               5<210>27<211>8<212>PRT<213>粟酒裂殖酵母<400>27Tyr Phe Ile Glu Ile Asn Pro Arg1               5<210>28<211>7<212>PRT<213>粟酒裂殖酵母<400>28Ala Thr Phe Asp Val Ser Met1               5<210>29<211>9<212>PRT<213>谷氨酸棒杆菌<400>29Phe Leu Phe Glu Asp Pro Trp Asp Arg1               5<210>30<211>18<212>DNA<213>人工序列<220><223>人工序列的描述:DNA引物<400>30ttcaccaggt ccacctcg    18<210>31<211>18<212>DNA<213>人工序列<220><223>人工序列的描述:DNA引物<400>31cgtcgcaaag ctgactcc         18<210>32<211>22<212>DNA<213>人工序列<220><223>人工序列的描述:DNA引物<400>32gatgcttctg ttgctaattt gc    22<210>33<211>20<212>DNA<213>人工序列<220><223>人工序列的描述:DNA引物<400>33ggccattaag gatatggctg       20<210>34<211>19<212>DNA<213>人工序列<220><223>人工序列的描述:DNA引物<400>34gcggtggaat gatccccga        19<210>35<211>18<213>人工序列<220><223>人工序列的描述:DNA引物<400>35accgcactgg  gccttgcg        18<210>36<211>18<212>DNA<213>人工序列<220><223>人工序列的描述:DNA引物<400>36tcgccgcttc  ggcaacac        18

Claims (17)

1.一种分离的核酸分子,包括与选自下列的序列具有至少95%的同一性的多核苷酸:
(a)一种编码具有SEQ ID NO:2中的氨基酸序列的丙酮酸羧化酶多肽的核苷酸序列;
(b)一种编码具有ATCC保藏号_中所含的粘粒克隆所编码的完整的氨基酸序列的丙酮酸羧化酶多肽的核苷酸序列;以及
(c)一种和(a)或者(b)中的任一种核苷酸序列互补核苷酸序列。
2.权利要求1的核酸分子,其中所说的多核苷酸具有SEQ ID NO:1中的完整的核苷酸序列。
3.权利要求1的核酸分子,其中所说的多核苷酸具有编码具有SEQ ID NO:2中的氨基酸序列的丙酮酸羧化酶多肽的SEQ ID NO:1中的核苷酸序列。
4.权利要求1的核酸分子,其中所说的多核苷酸具有编码具有包含在ATCC保藏号_中的粘粒克隆所编码的全部氨基酸序列的丙酮酸羧化酶多肽的核苷酸序列。
5.一种分离的核酸分子,包括在严谨杂交条件下与具有相同于权利要求1的(a),(b)或(c)中的核苷酸序列的核苷酸序列的杂交的多核苷酸,其中所说的杂交的多核苷酸在严谨杂交条件下不与具有仅由A残基或仅由T残基组成的核苷酸序列的多核苷酸杂交。
6.权利要求1的分离的核酸分子,其中所说的多核苷酸是DNA。
7.权利要求1的分离的核酸分子,其中所说的多核苷酸是RNA。
8.一种制备重组载体的方法,包括将权利要求1的一种分离的核酸分子***到载体中。
9.由权利要求8的方法所制备的重组载体。
10.一种制备重组宿主细胞的方法,包括将权利要求9的重组载体导入到宿主细胞中。
11.由权利要求10的方法所制备的重组宿主细胞。
12.一种制备丙酮酸羧化酶多肽的重组方法,包括将权利要求11的重组宿主细胞在一定条件下培养,从而使该多肽得到表达,并回收该多肽。
13.权利要求12的方法,其中所说的丙酮酸羧化酶的表达比它在谷氨酸棒杆菌中的表达高2-20倍。
14.一种分离的丙酮酸羧化酶多肽,它具有与选自下列的序列有至少95%的同一性的氨基酸序列:
(a)具有SEQ ID NO:2中的完整的氨基酸序列的丙酮酸羧化酶多肽的氨基酸序列;
(b)具有包含在ATCC保藏号_中的粘粒克隆所编码的完整的氨基酸序列的丙酮酸羧化酶多肽的氨基酸序列;以及
15.一种制备氨基酸的方法,包括表达权利要求1的核苷酸序列并回收所说的氨基酸。
16.权利要求15的方法,其中所说的氨基酸是赖氨酸。
17.权利要求15的方法,其中所说的丙酮酸羧化酶多肽的表达比它在谷氨酸棒杆菌中的表达高2-20倍。
CN98814374A 1998-12-23 1998-12-23 来自谷氨酸棒杆菌的丙酮酸羧化酶 Pending CN1336958A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1998/027301 WO2000039305A1 (en) 1998-12-23 1998-12-23 PYRUVATE CARBOXYLASE FROM $i(CORYNEBACTERIUM GLUTAMICUM)

Publications (1)

Publication Number Publication Date
CN1336958A true CN1336958A (zh) 2002-02-20

Family

ID=22268534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98814374A Pending CN1336958A (zh) 1998-12-23 1998-12-23 来自谷氨酸棒杆菌的丙酮酸羧化酶

Country Status (9)

Country Link
EP (1) EP1147198A1 (zh)
JP (1) JP2003503006A (zh)
KR (1) KR20010112232A (zh)
CN (1) CN1336958A (zh)
AU (1) AU2203399A (zh)
BR (1) BR9816106A (zh)
CA (1) CA2356446A1 (zh)
MX (1) MXPA01006290A (zh)
WO (1) WO2000039305A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103695454A (zh) * 2013-12-18 2014-04-02 山东寿光巨能金玉米开发有限公司 表达l-赖氨酸转运蛋白的重组质粒、工程菌及应用
CN105624175A (zh) * 2011-12-21 2016-06-01 Cj第一制糖株式会社 利用具有产生l-赖氨酸能力的微生物产生l-赖氨酸的方法
CN110997703A (zh) * 2017-04-25 2020-04-10 汉阳大学校产学协力团 新丙酮酸转移酶

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999053035A1 (en) 1998-04-13 1999-10-21 The University Of Georgia Research Foundation, Inc. Pyruvate carboxylase overexpression for enhanced production of oxaloacetate-derived biochemicals in microbial cells
US6965021B2 (en) * 2000-10-13 2005-11-15 Archer-Daniels-Midland Company Feedback-resistant pyruvate carboxylase gene from corynebacterium
DE102006032634A1 (de) 2006-07-13 2008-01-17 Evonik Degussa Gmbh Verfahren zur Herstellung von L-Aminosäuren
EP3170889A1 (en) * 2006-09-15 2017-05-24 CJ Cheiljedang Corporation A corynebacteria having enhanced l-lysine productivity and a method of producing l-lysine using the same
KR100830826B1 (ko) 2007-01-24 2008-05-19 씨제이제일제당 (주) 코리네박테리아를 이용하여 글리세롤을 포함한탄소원으로부터 발효산물을 생산하는 방법
KR101126041B1 (ko) 2008-04-10 2012-03-19 씨제이제일제당 (주) 트랜스포존을 이용한 형질전환용 벡터, 상기 벡터로형질전환된 미생물 및 이를 이용한 l-라이신 생산방법
US8932861B2 (en) 2008-04-10 2015-01-13 Cj Cheiljedang Corporation Transformation vector comprising transposon, microorganisms transformed with the vector, and method for producing L-lysine using the microorganism
DE102008001874A1 (de) 2008-05-20 2009-11-26 Evonik Degussa Gmbh Verfahren zur Herstellung von L-Aminosäuren
DE102008044768A1 (de) 2008-08-28 2010-03-04 Evonik Degussa Gmbh Verfahren zur Herstellung von organisch-chemischen Verbindungen unter Verwendung von verbesserten Stämmen der Familie Enterobacteriaceae
CN113755492B (zh) * 2020-07-20 2023-05-30 中国科学院天津工业生物技术研究所 丙酮酸羧化酶基因启动子的突变体及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2169170C (en) * 1993-08-24 2007-01-09 Masakazu Sugimoto Mutant phosphoenolpyruvate carboxylase, its gene, and production method of amino acid
ES2238773T3 (es) * 1997-10-04 2005-09-01 Degussa Ag Procedimiento para la produccion microbiana de aminoacidos de las familias del aspartato y/o glutamato, y agentes utilizables en el procedimiento.

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105624175A (zh) * 2011-12-21 2016-06-01 Cj第一制糖株式会社 利用具有产生l-赖氨酸能力的微生物产生l-赖氨酸的方法
CN103695454A (zh) * 2013-12-18 2014-04-02 山东寿光巨能金玉米开发有限公司 表达l-赖氨酸转运蛋白的重组质粒、工程菌及应用
CN110997703A (zh) * 2017-04-25 2020-04-10 汉阳大学校产学协力团 新丙酮酸转移酶
CN110997703B (zh) * 2017-04-25 2023-05-19 汉阳大学校产学协力团 新丙酮酸转移酶

Also Published As

Publication number Publication date
JP2003503006A (ja) 2003-01-28
KR20010112232A (ko) 2001-12-20
AU2203399A (en) 2000-07-31
WO2000039305A1 (en) 2000-07-06
EP1147198A1 (en) 2001-10-24
BR9816106A (pt) 2001-09-11
MXPA01006290A (es) 2002-04-17
CA2356446A1 (en) 2000-07-06

Similar Documents

Publication Publication Date Title
KR100760222B1 (ko) 유전자 증폭에 의해 증가된 리신 생산
KR101996769B1 (ko) 변이형 호모세린 디하이드로게나제 및 이를 이용한 호모세린 또는 호모세린 유래 l-아미노산의 생산 방법
CN112143719B (zh) 修饰的高丝氨酸脱氢酶及使用其产生高丝氨酸或衍生自高丝氨酸的l-氨基酸的方法
CN1347982A (zh) 棒状细菌的精氨酸阻遏物缺陷型菌株和制备l-精氨酸的方法
CN1288058A (zh) 编码pgi基因的新核苷酸序列
CN1275167A (zh) 天冬氨酸和/或谷氨酸系氨基酸的生物制备方法和该方法用的添加剂
US6403351B1 (en) Pyruvate carboxylase polypeptide from Corynebacterium glutamicum
CN1372597A (zh) 通过提高细胞nadph生产l-氨基酸的方法
CN1209170A (zh) 新型dna聚合酶
EP2210946B1 (en) Mutant of the proB gene from coryneform bacteria
CN1336958A (zh) 来自谷氨酸棒杆菌的丙酮酸羧化酶
CN1688689A (zh) 醛脱氢酶基因
CN1298019A (zh) 编码基因sucC和sucD的新核苷酸序列
KR102078732B1 (ko) 변형된 막 투과성
CN1898259A (zh) 用于编码精细化学品的代谢途径的蛋白质的基因变体
CN1656219A (zh) 新的多磷酸amp磷酸转移酶
CN1582300A (zh) 编码新蛋白的基因
KR20220136350A (ko) 변형된 daao 효소 및 이의 적용
US20230332116A1 (en) Polypeptide with aspartate kinase activity and use thereof in production of amino acid
KR102527895B1 (ko) GlxR 단백질 변이체 또는 이를 이용한 쓰레오닌 생산방법
CN114630903B (zh) 内消旋-二氨基庚二酸脱氢酶的修饰多肽及使用其生产l-苏氨酸的方法
CN1646690A (zh) 编码葡萄糖-6-磷酸脱氢酶蛋白的基因
KR20220152728A (ko) 3-메틸-2-옥소뷰타노에이트 하이드록시 메틸트랜스퍼라아제의 활성이 강화된 미생물, 및 이의 용도
CN1681840A (zh) 参与钴胺素生物合成的基因的转录活化基因
CN1354794A (zh) 弱氧化葡糖杆菌山梨糖醇脱氢酶、基因及其使用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication