CN102985540A - 在具有提高的核糖-5-磷酸活性的重组发酵单胞菌属中的改善的木糖利用 - Google Patents

在具有提高的核糖-5-磷酸活性的重组发酵单胞菌属中的改善的木糖利用 Download PDF

Info

Publication number
CN102985540A
CN102985540A CN2011800316776A CN201180031677A CN102985540A CN 102985540 A CN102985540 A CN 102985540A CN 2011800316776 A CN2011800316776 A CN 2011800316776A CN 201180031677 A CN201180031677 A CN 201180031677A CN 102985540 A CN102985540 A CN 102985540A
Authority
CN
China
Prior art keywords
rpi
ribose
host cell
seq
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800316776A
Other languages
English (en)
Other versions
CN102985540B (zh
Inventor
P.G.凯米
L.麦科尔
L.陶
J-F.汤布
P.V.维塔宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN102985540A publication Critical patent/CN102985540A/zh
Application granted granted Critical
Publication of CN102985540B publication Critical patent/CN102985540B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • C12N9/92Glucose isomerase (5.3.1.5; 5.3.1.9; 5.3.1.18)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/065Ethanol, i.e. non-beverage with microorganisms other than yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及所研究的木糖利用型发酵单胞菌属菌株,其被发现在生长于包含木糖的培养基中时积累木酮糖。为提高核糖-5-磷酸异构酶活性而对这些菌株进行的工程改造导致降低的核酮糖积累、改善的生长、改善的木糖利用以及提高的乙醇生产。

Description

在具有提高的核糖-5-磷酸活性的重组发酵单胞菌属中的改善的木糖利用
政府权利声明
本申请要求2010年6月29日提交的美国临时申请61/359445的权益。
本发明由美国政府支持通过能源部(Department of Energy)授予的合同DE-FC36-07GO17056而完成。美国政府拥有本发明的必然权利。
发明领域
本发明涉及微生物学和基因工程领域。更具体地,在利用木糖的运动发酵单胞菌(Z.mobilis)中提高核糖-5-磷酸异构酶活性改善了该微生物的木糖利用。
发明背景
通过微生物生产乙醇提供了一种替代化石燃料的可供选择的能源,因此成为当前研究的重要领域。理想的情况是,生产乙醇以及其它有用产物的微生物能够利用木糖作为碳源,这是因为木糖是水解的木质纤维素生物质中的主要戊糖。生物质可提供丰富可用的低成本碳底物。已经对在天然情况下不利用木糖的运动发酵单胞菌(Zymomonas mobilis)和其它细菌乙醇菌原通过引入编码如下酶的基因进行基因工程改造以用于木糖利用:1)木糖异构酶,其催化木糖向木酮糖的转化;2)木酮糖激酶,其将木酮糖磷酸化以形成5-磷酸木酮糖;3)转酮醇酶;和4)转醛醇酶。
对运动发酵单胞菌菌株进行木糖代谢的工程改造(US 5514583,US5712133,US 6566107,WO 95/28476,Feldmann等人(1992)Appl MicrobiolBiotechnol 38:354-361,Zhang等人(1995)Science 267:240-243),以及对棕榈发酵杆菌(Zymobacter palmae)菌株的工程改造(Yanase等人(2007)Appl.Environ.Mirobiol.73:2592-2599)已经获得成功。然而,工程化的菌株通常不像在葡萄糖上那样在木糖上生长并且生产乙醇。如美国专利7,223,575以及共同拥有并共同待决的美国专利7,741,119中所述,已经在木糖培养基上通过连续传代培养了经过木糖利用工程改造的菌株,其产生具有改善的木糖利用的菌种。在共同拥有并共同待决的美国专利申请US 2009-0246846A1中公开了具有较高木糖利用的培养菌株具有提高的木糖异构酶活性的发现,以及通过以来自突变的高活性运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子(Pgap)进行木糖异构酶表达而进行的用于改善木糖利用的工程改造。然而,木糖利用仍然无法与葡萄糖利用相比。
依然需要对于在木糖利用中具有进一步改善的发酵单胞菌属(Zymomonas)菌株和其它细菌乙醇菌原。
发明概述
本发明提供了生产乙醇的重组木糖利用型发酵单孢菌属或发酵杆菌属细胞,其经工程改造而具有提高的核糖-5-磷酸异构酶(RPI)活性。已经发现在较高木糖异构酶活性的菌株中形成RPI的碳流量也高,并且其导致不良副产物核酮糖-5-磷酸和/或核酮糖的生成(由细胞磷酸酶催化),所述不良副产物积累于培养基中。这些副产物的生成掠取了可用于乙醇生产的碳。申请人对于这一新发现的问题的解决方案是提高RPI的活性以引导更多的碳形成木糖代谢途径的所期望的产物(果糖-6-磷酸和甘油醛-6-磷酸),所述产物用于乙醇的生产。因此,在生长于包含木糖的培养基时积累核酮糖-5-磷酸和/或核酮糖的木糖利用型发酵单胞菌属或发酵杆菌属菌株中,RPI活性的提高改善了细胞生长、木糖利用和乙醇生产。
因此,本发明提供了重组细菌宿主细胞,其包含:
a)木糖代谢途径,所述木糖代谢途径包含编码具有木糖异构酶活性的多肽的至少一种基因;
b)编码具有核糖-5-磷酸异构酶活性的多肽的至少一种基因;以及
c)至少一种基因修饰,与在缺乏所述基因修饰的宿主细胞中的核糖-5-磷酸异构酶活性相比,所述基因修饰在所述宿主细胞中提高核糖-5-磷酸异构酶活性;
其中所述细菌宿主细胞利用木糖以生产乙醇;并且
其中所述细菌宿主细胞选自发酵单胞菌属和发酵杆菌属。
根据本文所述,本发明的核糖-5-磷酸异构酶可以是“A”型或“B”型。优选的“A”型核糖-5-磷酸异构酶是这样的酶:i)当使用以SEQ IDNO:83、84、85、86、87、88、89、90、91、92、93、94、95、96和97制备的剖面隐马尔可夫模型(Profile Hidden Markov Model)查询时得出0.1或更低的E值得分;所述查询使用hmmsearch算法进行,其中将Z参数设为10亿,并且
ii)在SEQ ID NO:97的酿酒酵母(Saccharomyces cerevisiae)RPI-A蛋白质中,在对应于107和129的位点处分别具有天冬氨酸和谷氨酸。
类似地,优选的“B”型核糖-5-磷酸异构酶是这样的酶:i)当使用以SEQ ID NO:1213、1214、1215、1216和1217制备的剖面隐马尔可夫模型查询时得出0.1或更低的E值得分;所述查询使用hmmsearch算法进行,其中将Z参数设为10亿;
ii)在SEQ ID NO:1216的大肠杆菌(E.coli)RPI-B蛋白质中,在对应于66和68的位点处分别具有半胱氨酸和苏氨酸,或在SEQ ID NO:1213的结核分枝杆菌(M.tuberculosis)RPI-B蛋白质中,在对应于68和72的位点处分别具有丝氨酸和谷氨酸,并且
iii)在SEQ ID NO:1216的大肠杆菌RPI-B蛋白质中,在对应于100的位点处具有天冬酰胺、甘氨酸、天冬氨酸、丝氨酸或谷氨酸但非亮氨酸。
当使用以SEQ ID NO:19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79和81制备的序型HMM查询时,本发明的优选木糖异构酶具有低于或等于3×10-10的E值得分并且具有四个催化位点残基:组氨酸54、天冬氨酸57、谷氨酸181和赖氨酸183,所述位点编号对应于白色链霉菌(Streptomyces albus)木糖异构酶序列SEQ ID NO:61。
此外,本发明提供了用于制备重组细菌宿主细胞以进行乙醇生产的方法,所述方法包括:
a)提供包含木糖代谢途径的发酵单胞菌或发酵杆菌细菌宿主细胞,其中当生长于包含木糖的培养基中时,所述细菌宿主细胞在木糖存在的情况下生产乙醇并且在培养基中积累核酮糖-5-磷酸、核酮糖或兼而积累核酮糖-5-磷酸和核酮糖;以及
b)对所述细菌宿主细胞(a)进行基因修饰,其中与在缺乏所述基因修饰的宿主细胞中的核糖-5-磷酸异构酶活性相比,所述基因修饰在所述宿主细胞中提高核糖-5-磷酸异构酶活性;
其中所述培养基中不再积累核酮糖-5-磷酸、核酮糖或核酮糖-5-磷酸和核酮糖均不积累。
在另一个实施方案中,本发明提供生产乙醇的方法,所述方法包括:
a)提供本发明的生产乙醇的重组细菌宿主细胞;以及
b)在包含木糖的培养基中培养所述宿主(a),从而将木糖转化成乙醇。
生物保藏物简述、附图和序列描述
申请人已经按照国际承认的用于专利程序目的的微生物保藏的布达佩斯条约的有关条款进行了以下生物保藏:
保藏菌株信息
保***命名参考 国际保藏命名 保藏日期
发酵单胞菌属(Zymomonas)ZW658 ATCC No PTA-7858 2006年9月12日
图1示出了进行木糖利用工程改造的发酵单胞菌属木糖代谢和乙醇发酵途径的示意图。
图2示出了菌种ZW801-4在包含葡萄糖(实线)或木糖(虚线)的培养基中生长后对培养物培养基的HPLC分析。
图3示出的图为ZW801-4对照菌株(ZW801-4#1和ZW801-4#2)与包含质粒的ZW801-4菌株的培养物的生长(A)、木糖利用(B)、乙醇生产(C)和培养基(D)中的核酮糖积累,所述质粒包含具有密苏里游动放线菌(A.missouriensis)GI启动子和运动发酵单胞菌RPI-A编码区(RPI-1和RPI-2)的嵌合基因。
图4示出了ZW801-4对照菌株(ZW801-1和ZW801-2)和包含质粒的ZW801-4菌株的生长图,所述质粒包含具有天然运动发酵单胞菌GAP启动子和大肠杆菌RPI-A编码区(ZW801-rpiEc-1和ZW801-rpiEc-2)的嵌合基因。
图5示出了ZW801-4对照菌株(801/pZB188-1和801/pZB188-3)和包含质粒的ZW801-4菌株的生长图,所述质粒包含具有运动发酵单胞菌GAP启动子和大肠杆菌xylA编码区(801/pXylA-2和801/pXylA-4)的嵌合基因。
图6示出的图为ZW801-4对照菌株(ZW801-1和ZW801-2)与包含质粒的ZW801-4菌株的培养物的生长(A)、木糖利用(B)、乙醇生产(C)和培养基(D)中的核酮糖积累,所述质粒为包含具有密苏里游动放线菌GI启动子和运动发酵单胞菌RPI-A编码区的嵌合基因的质粒以及具有运动发酵单胞菌GAP启动子和大肠杆菌xylA编码区(xylA/GI-rpiZ1.1和xylA/GI-rpiZ1.2)的嵌合基因的质粒。
图7示出了标志物(泳道1)和对ZW801 GAP-rpi-1、ZW801 GAP-rpi-3和ZW801 GAP-rpi-4中具有ATG起始密码子的RPI-A表达的细胞的总蛋白质提取物(分别为泳道2、3和4)以及表达具有天然GTG起始密码子的RPI-A的对照(泳道5和6)的染色凝胶,所述运动发酵单胞菌RPI-A蛋白质的位置以箭头标出。
表3是木糖异构酶的序型HMM表。表3是在此以电子版形式提交的,并且以引用方式并入本文。
表4是RPI-A蛋白的序型HMM表。表4是在此以电子版形式提交的,并且以引用方式并入本文。
表5是RPI-B蛋白的序型HMM表。表5是在此以电子版形式提交的,并且以引用方式并入本文。
下列序列符合37C.F.R.1.821-1.825(“对含有核酸序列和/或氨基酸序列公开的专利申请的要求-序列规则”),并且与世界知识产权组织(WIPO)标准ST.25(1998)和EPO和PCT的序列列表要求(规则5.2和49.5(a-bis),以及行政指导的208节和附录C)相一致。核苷酸的符号和格式以及氨基酸序列数据符合如37C.F.R.§1.822所示的规则。
SEQ ID NO:1-13是寡核苷酸引物。
SEQ ID NO:14是来自密苏里游动放线菌(Actinoplanes missouriensis)的葡糖异构酶基因的启动子的核苷酸序列。
SEQ ID NO:15是pZB188/aadA质粒的核苷酸序列。
SEQ ID NO:16是pZB-GI-RPI质粒的核苷酸序列。
SEQ ID NO:17是来自运动发酵单胞菌ZW1菌株(ZW4)的甘油醛-3-磷酸脱氢酶(GAP)的核苷酸序列。
SEQ ID NO:18是木糖异构酶表达盒PgapXylA的核苷酸序列。
表1:木糖异构酶蛋白及其编码区的SEQ ID编号
Figure BDA00002654356500061
Figure BDA00002654356500071
1这一编码序列根据锈棕色链霉菌编码序列进行设计用于编码白色链霉菌蛋白(其与锈棕色链霉菌蛋白具有三个氨基酸的差异)。
2这一编码序列根据极端嗜热菌编码序列进行设计用于编码Thermus Caldophilus蛋白(其与锈棕色链霉菌蛋白具有21个氨基酸的差异)。
3这一编码序列来自极端嗜热菌并且翻译成为水生栖热菌蛋白,尽管所述水生栖热菌编码序列可能由于密码子简并性而具有差异。
表2:作为种子序列用于RPI-A结构分析的核糖-5-磷酸异构酶蛋白及 其编码区的SEQ ID编号
Figure BDA00002654356500072
SEQ ID NO:98-1212是RPI-A核糖-5-磷酸异构酶蛋白。
SEQ ID NO:2123-3237是编码RPI-A核糖-5-磷酸异构酶蛋白的序列。
表3:作为种子序列用于RPI-B结构分析的核糖-5-磷酸异构酶蛋白及 其编码区的SEQ ID编号
Figure BDA00002654356500081
SEQ ID NO:1218-2107是RPI-B核糖-5-磷酸异构酶蛋白。
SEQ ID NO:3243-4132是编码RPI-B核糖-5-磷酸异构酶蛋白的序列。
发明详述
本文公开了木糖利用型发酵单胞菌或发酵杆菌菌株,其经基因修饰而与无所述基因修饰的菌株相比具有核糖-5-磷酸异构酶(RPI)活性表达的提高。当核酮糖在木糖利用中作为副产物产生时,所述提高的RPI活性提供改善的木糖利用,其对于在包含糖化生物质(其包括木糖)的培养基中的生长是需要的,这导致提高的乙醇生产。乙醇是用于替代化石燃料的重要化合物,并且糖化的生物质为通过发酵进行的乙醇生产提供可再生的碳源。
可使用下列定义阐释权利要求和说明书:
如本文所用,术语“包含”、“由...组成”、“包括”、“涵盖”、“具有”、“含有”、“包容”或“容纳”或其任何其它变型旨在包括非排它性的包括。例如,包含一系列元素的组合物、混合物、工艺、方法、制品或设备不必仅限于那些元素,而可以包括其它未明确列出的元素,或此类组合物、混合物、工艺、方法、制品或设备固有的元素。此外,除非有相反的明确说明,“或”是指包含性的“或”,而不是指排它性的“或”。例如,以下任何一个均表示满足条件A或B:A是真的(或存在的)且B是假的(或不存在的)、A是假的(或不存在的)且B是真的(或存在的)、以及A和B都是真的(或存在的)。
同样,涉及元素或组分例证(即出现)次数的位于本发明元素或组分前的不定冠词“一个”或“一种”旨在是非限制性的。因此,应将“一个”或“一种”理解为包括一个或至少一个,并且元素或组分的词语单数形式也包括复数形式,除非有数字明显表示单数。
如本文所用,术语“发明”或“本发明”是非限制性术语,并且不旨在意指本发明的任何单独实施方案,而是涵盖如本说明书和权利要求所述的所有可能的实施方案。
如本文所用,修饰本发明的成分或反应物的量使用的术语“约”是指可以通过例如以下方式而发生的用数字表示的量的变化:通过在实际中用于制备浓缩物或使用溶液的通常测量和液体处理操作;通过这些操作中非故意的误差;通过用于制备组合物或执行方法的成分的制造、来源或纯度中的差异;等。术语“约”还包括由于相对于由特定起始混合物所得组合物的不同平衡条件而不同的量。无论是否通过术语“约”来修饰,权利要求包括量的等同量。在一个实施方案中,术语“约”指在报告数值10%的范围内,优选地在报告数值5%的范围内。
术语“碳底物”或“可发酵碳底物”指能够被本发明的宿主生物体代谢的碳源,并且特别是选自以下的碳源:单糖、低聚糖和多糖。
“基因”指的是表达特定蛋白质的核酸片段或功能性RNA分子,其可任选地包括在编码序列之前的调控序列(5′非编码序列)或之后的调控序列(3′非编码序列)。“天然基因”或“野生型基因”指具有其自身调控序列的天然存在的基因。“嵌合基因”指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列。因此,嵌合基因可包含源自不同来源的调控序列和编码序列,或者源自相同来源、但排列方式与天然存在的排列方式不同的调控序列和编码序列。“内源性基因”指位于生物的基因组内它的天然位点的天然基因。“外来基因”指正常情况下不存在于宿主生物中的基因,它通过基因转移导入宿主生物。外来基因可以包含***到非天然生物体内的天然基因或嵌合基因。
术语“基因构建体”指的是编码一种或多种特定蛋白质表达的核酸片段或功能性RNA分子。在基因构建体中,所述基因在性质上可以是天然的、嵌合的或外来的。基因构建体通常应包含“编码序列”。“编码序列”指的是编码特定氨基酸序列的DNA序列。
“启动子”或“启动控制区”指能够控制编码序列或功能RNA的表达的DNA序列。通常来讲,编码序列位于启动子序列的3′端。启动子可整个源于天然基因,或者由源于天然存在的不同启动子的不同元件构成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。通常将在大多数细胞类型中、在大多数情况下引起基因表达的启动子称为“组成型启动子”。
术语“基因修饰”非包含性地指任意修饰、突变、碱基缺失、碱基添加、密码子修饰、基因过表达、基因遏制、启动子修饰或替换、基因添加(单一或多拷贝)、反义表达或遏制,或对宿主细胞或细菌菌株的基因元件的任何其它改动,无论其是否产生表现型的改变。
术语“重组细菌宿主细胞”指的是包含至少一种异源基因或基因构建体或核酸片段的细菌细胞。
如本文所用,术语“表达”指的是源自基因的编码(mRNA)或功能性RNA的转录和稳定积累。表达还可指mRNA翻译成为蛋白质。“反义抑制”指的是能够遏制靶蛋白的表达的反义RNA转录物的产生。“过表达”指的是基因产物在转基因生物中的产生,其超过了正常或非转化生物中的产生水平。“共遏制”指的是正义RNA转录物或片段的产生,其能够遏制相同或基本类似的外来或外源性基因的表达(U.S.5,231,020)。如本文所用,术语“转化”指的是将核酸片段转入宿主生物,其产生了遗传上稳定的特征。转入的核酸可以是宿主细胞中保留的质粒形式,或者一些转入的核酸可以被整合进宿主细胞基因组中。含有转化核酸片段的宿主生物称为“转基因”或“重组”或“转化”生物体。
如本文所用,术语“质粒”和“载体”是指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件,并且常常是环状双链DNA分子的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组进入一种独特构建体中,该独特构建体能够将所选基因产物的启动子片段和DNA序列与适当的3′末端非翻译序列一起引入细胞中。
术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列可操作地连接。编码序列可以按有义或反义的取向可操作地连接至调控序列。
术语“选择性标记”指一种鉴定因子,通常是抗生素或化学药品抗性基因,该因子能基于标记基因的效应,即,对抗生素的抗性进行选择,其中所述效应用于追踪遗传的受关注核酸和/或用于鉴定遗传了受关注核酸的细胞或生物。
如本文所用,术语“密码子简并性”指的是基因密码在不影响被编码蛋白的氨基酸序列的情况下允许核苷酸序列变异的特性。技术人员非常了解具体宿主细胞在使用核苷酸密码子来确定给定氨基酸时所表现出的“密码子偏倚性”。因此,当合成基因用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该宿主细胞优选的密码子使用频率。
当涉及用于转化多种宿主的基因或核酸分子的编码区时。术语“密码子优化”指的是在不改变所述DNA编码的蛋白质的情况下改变所述基因或所述核酸分子的编码区的密码子以反映该宿主生物的典型密码子使用。
术语“木质纤维质”指包含木质素和纤维素的组合物。木质纤维质材料也可包含半纤维素。
术语“纤维质”指包含纤维素和包括半纤维素在内的附加组分的组合物。
术语“糖化”指由多糖生产可发酵糖。
术语“预处理的生物质”指的是在糖化前对生物质进行物理、化学和/或热预处理以提高所述生物质中多糖的可利用性(accessibility)。
“生物质”指任何纤维质或木质纤维质材料,并包括包含纤维素的材料,以及任选地还包含半纤维素、木质素、淀粉、低聚糖和/或单糖的材料。生物质也可包括附加组分如蛋白质和/或脂质。生物质可来源于单一来源,或者生物质可包括来源于一种以上来源的混合物;例如,生物质可包括玉米棒和玉米秸秆的混合物,或草和叶的混合物。生物质包括但不限于生物能作物、农业残余物、市政固体垃圾、工业固体垃圾、来自造纸业的淤渣、庭院垃圾、木材和林业垃圾。生物质的实例包括但不限于,玉米棒、作物残余物(诸如玉米壳、玉米秸秆、草、小麦秸秆、大麦秸秆、干草、水稻秸秆、柳枝稷、废纸、蔗渣)、高粱、大豆、由谷物的研磨获得的组分、树、枝、根、叶、木屑、锯末、灌木丛、蔬菜、果实、花和动物肥料。
“生物质水解产物”指来源于生物质糖化的产物。生物质也可在糖化前进行预处理或预加工。
术语“木糖代谢途径”或“木糖利用途径”指的是一些列酶(由基因所编码),其将木糖代谢成为果糖-6-磷酸和/或甘油醛-6-磷酸,并且其包括1)木糖异构酶,其催化木糖向木酮糖的转化;2)木酮糖激酶,它将木酮糖磷酸化以形成5-磷酸木酮糖;3)转酮醇酶;以及4)转醛醇酶。
术语“木糖异构酶”指的是催化D-木糖和D木酮糖相互转换的酶。木糖异构酶(XI)属于归类为EC 5.3.1.5的酶类群体。
术语“核糖-5-磷酸异构酶”或“RPI”指的是催化核酮糖-5-磷酸和核糖-5-磷酸相互转换的酶。核糖-5-磷酸异构酶属于归类为EC 5.3.1.6的酶类群体。
如生物信息学领域所知,术语“E值”是“期望值”,其提供了匹配随机发生的概率。这提供了对序列匹配的统计显著性。所述E值越低,则该命中更有意义。
术语“运动发酵单胞菌RPI-A”指的是本领域中标记为RPI-A的运动发酵单胞菌RPI。但是,所述运动发酵单胞菌RPI蛋白与大肠杆菌RPI-B蛋白(36%)具有比与大肠杆菌RPI-A蛋白(20%)更接近的序列同一性,并且对本文所述的RPI的进一步分析将运动发酵单胞菌RPI归于RPI-B类型。但是,所述运动发酵单胞菌RPI在本文称为RPI-A以同其公开的已知名称相一致。
术语“异源”指非天然存在于受关注的位点。例如异源基因指宿主生物中非天然存在的但是通过转基因被导入到宿主生物中的基因。例如,存在于嵌合基因中的异源核酸分子是与其他嵌合基因片段相关的非天然存在核酸分子,例如具有彼此非天然相关的编码区和启动子片段的核酸分子。
如本文所用,“分离的核酸分子”是RNA或DNA的聚合物,它是单链或双链的,任选地包含合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的分离型核酸分子可由cDNA、基因组DNA或合成DNA的一个或多个片段构成。
当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核酸片段时,核酸片段“可杂交”至另一核酸片段,例如cDNA、基因组DNA或RNA分子。杂交和洗涤条件是为人熟知的,并且在Sambrook,J.,Fritsch,E.F.and Maniatis,T.Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989)中进行了例示,尤其是在该文献第11章和表11.1(全文以引用方式并入本文)中进行了例示。温度和离子强度条件决定了杂交的“严格度”。可以调节严格条件以筛选中度相似的片段(例如来自远缘生物的同源序列),到筛选高度相似的片段(例如从近缘生物复制功能性酶的基因)。杂交后的洗涤确定严格性条件。一组优选的条件使用一系列洗涤步骤,开始是6×SSC、0.5%SDS在室温下洗涤15分钟,然后用2×SSC、0.5%SDS在45℃下重复30分钟,再用0.2×SSC、0.5%SDS在50℃下重复洗涤两次,每次30分钟。更优选的一组严格性条件采用更高的温度,其中洗涤与上述洗涤相同,不同的是最后两次在0.2×SSC、0.5%SDS中洗涤30分钟时的温度被增加到60℃。另一组优选的高严格条件是最后两次洗涤是在65℃下用0.1XSSC,0.1%SDS进行。例如,另一组严格条件包括在0.1XSSC,0.1%SDS中于65℃下杂交并用2XSSC,0.1%SDS洗涤,随后用0.1XSSC,0.1%SDS洗涤。
杂交需要两种核酸含有互补序列,但是取决于杂交的严格度,碱基之间可能会发生错配。用于使核酸杂交的合适的严格度取决于核酸的长度和互补的程度,它们是本领域内熟知的变量。两条核苷酸序列之间的相似性或同源性程度越高,具有那些序列的核酸的杂交体的Tm值就越大。核酸杂交的相对稳定性(对应较高的Tm)按下列顺序依次降低:RNA:RNA、DNA:RNA、DNA:DNA。就长度大于100个核苷酸的杂交体而言,已经获得了计算Tm的方程式(参见Sambrook等人,同上,9.50-9.51)。对于较短核酸(即寡核苷酸)的杂交,错配的位点变得更重要,而且寡核苷酸的长度决定了其特异性(参见Sambrook等人,同上,11.7-11.8)。在一个实施方案中,可杂交核酸的长度为至少约10个核苷酸。优选地,可杂交核酸的最小长度为至少约15个核苷酸;更优选至少约20个核苷酸;最优选长度为至少约30个核苷酸。此外,技术人员应认识到,必要时可根据诸如探针长度之类的因素来调节温度和洗涤溶液的盐浓度。
术语“互补的”用于描述核苷酸碱基之间能够彼此杂交的关系。例如,对于DNA,腺嘌呤与胸腺嘧啶互补,而胞嘧啶与鸟嘌呤互补。
术语“同源”指的是核酸片段中一个或多个核苷酸碱基的变化并不影响所述核酸片段介导基因表达或产生特定表现型的能力。该术语还指对本发明的核酸片段的修饰(诸如一个或多个核苷酸的删除或***),其相对于原初的未修饰片段在实质上并不改变所产生的核酸片段的功能特征。因此,正如本领域的技术人员应当理解的,本发明涵盖的不仅仅是具体的示例性序列。
此外,技术人员认识到,本发明所涵盖的同源核苷酸序列也由它们在中等严格条件(如0.5×SSC,0.1%SDS,60℃)下,与本文所示例的序列杂交的能力,或杂交至本发明核苷酸序列的任何部分以及杂交至与本文所公开的任何核苷酸序列功能相当的序列的能力所限定。
如本领域已知的,术语“%同一性”是两条或更多条多肽序列之间或两条或更多条多核苷酸序列之间的关系,该关系通过对序列进行比较确定。在本领域中,“同一性”还表示多肽或多核苷酸序列之间序列关联的程度,根据具体情况,它由这些序列的序列串之间的匹配程度确定。“同一性”和“相似性”可容易地通过已知方法计算出来,所述的方法包括但不限于以下文献中所述:1.)Computational Molecular Biology(Lesk,A.M.编辑)OxfordUniversity:NY(1988);2.)Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic:NY(1993);3.)Computer Analysis of Sequence Data,第I部分(Griffin,A.M.和Griffin,H.G.编辑)Humania:NJ(1994);4.)Sequence Analysis in Molecular Biology(von Heinje,G.编辑),Academic(1987);以及5.)Sequence Analysis Primer(Gribskov,M.和Devereux,J.编辑)Stockton:NY(1991)。
设定确定同一性的优选方法来用于得出待测试序列之间的最佳匹配。确定同一性和相似性的方法在可公开获得的计算机程序中编成了代码。序列比对和%同一性计算可以用LASERGENE生物信息学计算软件包(LASERGENE bioinformatics computing suite(DNASTAR Inc.,Madison,WI))中的MegAlignTM程序进行。序列的多重比对使用“Clustal比对方法”进行,该方法涵盖若干个不同的算法,包括对应于称为Clustal V比对方法的“Clustal V比对方法”,该方法描述于Higgins和Sharp,(CABIOS.5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.,8:189-191(1992))中,并且可以在LASERGENE生物信息学计算软件包(DNASTAR Inc.)中的MegAlignTM程序中找到的比对方法。对于多重比对,默认值对应于空位罚分(GAP PENALTY)=10和空位长度罚分(GAP LENGTH PENALTY)=10。用Clustal方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、空位罚分=3、窗口(WINDOW)=5和DIAGONALS SAVED=5。对于核酸,这些参数为KTUPLE=2,GAP PENALTY=5,WINDOW=4以及DIAGONALS SAVED=4。在用Clustal V程序进行序列比对后,有可能通过观察相同程序中的“序列距离”表来获得“%同一性”。此外,也可以使用“Clustal W比对方法”,该方法相当于称为Clustal W(在Higgins和Sharp,CABIOS;5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.8:189-191(1992)中有所描述)和可以在LASERGENE生物信息学计算软件包(DNASTAR Inc.)中的MegAlignTMv6.1程序中找到的比对方法。用于多重比对的默认参数(缺口罚分=10、缺口长度罚分=0.2、延迟发散序列(DelayDivergen Seqs)(%)=30、DNA转换权重(DNA Transition Weight)=0.5、蛋白质权重矩阵(Protein Weight Matrix)=Gonnet系列和DNA权重矩阵(DNA WeightMatrix)=IUB)。在使用Clustal W程序对序列进行比对之后,可通过查看同一程序中的“序列距离”表以获得“%同一性”。
本领域的技术人员非常清楚,多种程度的序列同一性可用于从其它物种中鉴定多肽,其中这类多肽具有相同或相似的功能或活性。有用的同一性百分比实例包括但不限于:25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或可用于描述本发明的介于25%与100%之间的任何整数百分比,诸如25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。适当的核酸片段不仅具有上述同源性,并且通常编码具有至少50个氨基酸的多肽,优选地至少100个氨基酸,并且更优选地至少150个氨基酸。
术语“序列分析软件”指可用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可商购获得或独立开发。典型的序列分析软件包括但不限于:1.)GCG程序套件(Wisconsin Package Version 9.0,Genetics Computer Group(GCG),Madison,WI);2.)BLASTP,BLASTN,BLASTX(Altschul等人,J.Mol.Biol.,215:403-410(1990));3.)DNASTAR(DNASTAR,Inc.Madison,WI);4.)Sequencher(Gene CodesCorporation,Ann Arbor,MI);以及5.)the FASTA program incorporating theSmith-Waterman algorithm(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.编辑:Suhai,Sandor.Plenum:New York,NY)。在本专利申请的上下文中应当理解,使用序列分析软件进行分析时,分析结果将基于所参考程序的“默认值”,除非另外指明。在此所用的“默认值”将指在首次初始化软件时软件最初加载的任何值或参数集。
本文使用的标准重组DNA和分子克隆技术在本领域中是为人熟知的,并且描述于Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:ALaboratory Manual,第2版;Cold Spring Harbor Laboratory:Cold SpringHarbor,New York,1989(下文称为“Maniatis”);以及Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.Experiments with Gene Fusions;Cold Spring HarborLaboratory:Cold Spring Harbor,New York,1984;以及Ausubel,F.M.,InCurrent Protocols in Molecular Biology,Greene Publishing和Wiley-Interscience出版,1987。
本发明涉及木糖利用型发酵单胞菌或发酵杆菌的工程改造菌株,当在包含木糖的培养基中发酵时其具有改善的木糖利用。改善通过生物催化剂在包含生物质水解物的培养基中发酵而进行的乙醇生产进行的一个难题在于获得最佳的木糖利用,所述生物质水解物通常通过对生物质的预处理和糖化产生。木糖是水解的木质纤维素物质中的主要戊糖之一,另一种为***糖。本发明人已经发现,木糖利用型菌株中的核糖-5-磷酸运动发酵单胞菌的提高表达导致木糖利用中的提高效率,并且从而在包含买的培养基中发酵时导致了更高的乙醇产量。
木糖利用效率低下的发现
针对木糖利用而对乙醇菌原进行的工程改造通常包括表达4种蛋白质:木糖异构酶、木酮糖激酶、转酮醇酶和转醛醇酶。这些酶提供了木糖利用途径,其如图1所示补充入乙醇生产。然而,经工程改造以代谢木糖的运动发酵单胞菌进行的木糖利用通常并不高效。
申请人已经发现了木糖利用低效的潜在原因:可用于生产乙醇的木糖利用途径的代谢物转向成为副产物。具体地,申请人已经发现,对于能够以木糖作为唯一的碳源生长的木糖利用型运动发酵单胞菌,当其生长于仅包含木糖作为碳源的培养基上时,核酮糖(D-核酮糖)在该培养基中积累。积累于所述培养基中的核酮糖可导致约8%的总木糖消耗。在同样的木糖利用型发酵单胞菌生长于包含葡萄糖并且无木糖的培养基上时,这一核酮糖积累并不发生。
核酮糖可通过以磷酸酶将核酮糖-5-磷酸转化成核酮糖而产生。如果核酮糖-5-磷酸在细胞中积累,则其可为细胞磷酸酶提供底物。核酮糖-5-磷酸向核酮糖的转换以及核酮糖在培养基中的积累表明了负责将木糖代谢成为乙醇的途径中的酶缺陷。使木糖异构酶催化的木糖代谢初始步骤有所提高的条件可能加剧这一缺陷,导致甚至更高水平的核酮糖-5-磷酸和核酮糖积累。此外,核酮糖-5-磷酸积累可能高得使其成为细菌抑制性或甚至致死性的,这是因为已知细菌细胞中的糖磷酸积累对其代谢和存活是有害的。因此,通过对培养基中核酮糖的发现以及申请人对这一发现的潜在意义的认识,申请人已经鉴定出可能影响木糖利用的待解决问题。如图1所示,糖代谢和乙醇生产中核酮糖的降低生产和改进的核酮糖-5-磷酸利用可改善由木糖对乙醇的生产。
提高核糖-5-磷酸异构酶活性
申请人已经发现,核糖-5-磷酸异构酶(RPI)在木糖利用型运动发酵单胞菌中的提高表达导致了核酮糖的降低积累,当生长于包含木糖的培养基中时,所述木糖利用型运动发酵单胞菌积累核酮糖。核酮糖的降低积累可涉及本文所述的核酮糖-5-磷酸的降低积累。当在包含木糖的培养基中生长时,与缺乏提高的RPI表达的相同菌株相比,具有提高的RPI表达的菌株表现出改善的生长、提高的木糖利用和提高的乙醇生产。RPI催化核酮糖-5-磷酸和核糖-5-磷酸的相互转换(参见图1)。
与不含提高的RPI表达的相同菌株相比,在木糖利用型运动发酵单胞菌菌株(当生长于包含木糖的培养基中时,所述菌株产生核酮糖)中运动发酵单胞菌RPI-A酶(根据本文测定和下文描述其实际上是RPI-B)的提高表达导致了所述培养基中核酮糖积累的几乎50%的降低。此外具有提高的RPI表达的菌株表现出提高的细胞物产量、提高的木糖消耗以及提高的乙醇滴度,这显示了木糖向乙醇的提高转换。在相同的生产核酮糖的运动发酵单胞菌中,大肠杆菌RPI-A酶的提高表达也导致了提高的细胞物的生产。细胞物、木糖消耗和乙醇产量的提高应根据诸如初始木糖利用型菌株、培养基组成和RPI表达水平这样的因素而有所变化。通过在本文实施例的条件中使用本发明菌株,在包含100g/L木糖作为唯一的糖的培养基中生长60小时后,提高的细胞物可以为约15%或更高,并且乙醇生产的提高可以是至少约5%。
可以使用具有核糖-5-磷酸异构酶活性的任意蛋白质或多肽提高的RPI表达在发酵单胞菌中实现提高的RPI表达。存在两组核糖-5-磷酸异构酶,其称为RPI-A和RPI-B。所述RPI-B酶属于糖磷酸异构酶的RpiB/LacA/LacB家族。大肠杆菌具有两种RPI蛋白,一种为RPI-A并且另一种为RPI-B。运动发酵单胞菌具有单一的RPI蛋白,其命名为RPI-A。然而,所述运动发酵单胞菌RPI蛋白与大肠杆菌RPI-B蛋白(36%)具有比与大肠杆菌RPI-A蛋白(20%)更接近的序列同一性。下文所述对RPI的进一步分析将所述运动发酵单胞菌RPI归于RPI-B类型。但是,所述运动发酵单胞菌RPI在本文称为RPI-A以同其公开的已知名称相一致。
如所述运动发酵单胞菌和大肠杆菌RPI蛋白所例示,可用于本发明微生物的RPI蛋白序列非常多样。可使用生物信息学分析鉴定可用于本发明微生物的RPI蛋白。本文实施例8所使用的结构/功能生物信息学方法是基于剖面隐马尔可夫模型活性位点残基鉴定的分析以及另外对氨基酸筛选的鉴定。
剖面隐马尔可夫模型(HMM)使用HMMER软件包(Janelia Farm ResearchCampus,Ashburn,VA)的hmmsearch算法构建。支持序型HMM的理论描述于Durbin等人的((1998)Biological sequence analysis:probabilistic models of proteins and nucleic acids,Cambridge University Press)和Krogh等人的((1994)J.Mol.Biol.235:1501-1531)之中,其表征了一组蛋白质,所述表征基于该组蛋白质比对中各个位点处出现各种氨基酸的概率。
BRENDA(Cologne University BioInformatics Center)和PubMed(USNational Library of Medicine,National Institutes of Health)数据库中收录的功能性标识的蛋白质——RPI-A有15种(表2;SEQ ID NO:83、84、85、86、87、88、89、90、91、92、93、94、95、96和97)并且RPI-B有5种(表3;SEQ ID NO:1213、1214、1215、1216和1217)——其作为种子序列用于为RPI-A和RPI-B制备序型HMM。BRENDA是人力维护(human-curated)的数据库,其包含从实验性文献中提取的关于酶动力学、物理和生物化学特征的详细信息并且具有与相关数据库的链接。通过使用各组种子序列,以具有默认参数的ClustalW建立了多序列比对(MSA)。所述MSA结果作为输入数据用于制备所述序型HMM,其在表4和5中得出,分别用于核糖-5-磷酸异构酶A蛋白和核糖-5-磷酸异构酶B蛋白。在所述表中,氨基酸以单字母编码示出。各位点的第一行报告了匹配发射得分(match emission score):各种氨基酸处于该状态的概率(高亮显示最高得分)。第二行报告了***发射得分(insert emission score),并且第三行报告了在位转移得分(on state transitionscore):M→M,M→I,M→D;I→M,I→I;D→M,D→D;B→M;M→E。
除所述序型HMM之外,RPI-A和RPI-B酶的已知活性位点残基(Roos等人(2004)J.Mol.Biol.335:799-809;Graile等人(2005)Biochimie 87:763-769)以及与LacB相区分的氨基酸用于鉴定RPI-A和RPI-B蛋白,其可用于本发明微生物。可使用的RPI-A蛋白是这样的蛋白质:i)当使用以SEQ ID NO:83、84、85、86、87、88、89、90、91、92、93、94、95、96和97制备的剖面隐马尔可夫模型查询时得出0.1或更低的E值得分;所述查询使用hmmsearch算法进行,其中将Z参数设为10亿,并且ii)在SEQ ID NO:97的酿酒酵母RPI-A蛋白质中,在对应于107和129的位点处分别具有天冬氨酸和谷氨酸。可使用的RPI-B蛋白质是这样的蛋白质:i)当使用以SEQ IDNO:1213、1214、1215、1216和1217制备的剖面隐马尔可夫模型查询时得出0.1或更低的E值得分;所述查询使用hmmsearch算法进行,其中将Z参数设为10亿;ii)在(SEQ ID NO:1216)的大肠杆菌RPI-B蛋白质中,在对应于66和68的位点处分别具有半胱氨酸和苏氨酸,或在SEQ ID NO:1213的结核分枝杆菌RPI-B蛋白质中,在对应于68和72的位点处分别具有丝氨酸和谷氨酸,并且在SEQ ID NO:1216的大肠杆菌RPI-B蛋白质中,在对应于100的位点处具有天冬酰胺、甘氨酸、天冬氨酸、丝氨酸或谷氨酸但非亮氨酸。
符合上文标准并且可用于本发明微生物的RPI-A和RPI-B蛋白的实例是,RPI-A:SEQ ID NO:83至1212,并且RPI-B:SEQ ID NO:1213至2107。本发明细胞中可使用这些蛋白质,以及与这些序列中的任意序列具有至少约80-85%、85%-90%、90%-95%或至少约96%、97%、98%或99%的序列同一性并且具有核糖-5-磷酸异构酶活性的任意蛋白质。编码RPI-A蛋白的序列的实例包括SEQ ID NO:2108至3237。编码RPI-B蛋白的序列的实例包括SEQ ID NO:3238至4132。根据技术人员所熟知以及如上文描述,在文献和生物信息学数据库中可容易地鉴定另外的RPI。通常通过以RPI氨基酸序列或编码序列(诸如本文提供的序列)对公开可用的数据库的BLAST(上文所述)搜索而进行使用生物信息学对蛋白质和/或编码序列的鉴定。同一性基于Clustal W比对方法,所述方法采用空位罚分=10、空位长度罚分=0.1的默认参数和Gonnet 250系列的蛋白质权重矩阵。
此外,本文所述的序列或本领域所述的那些序列还可用于鉴定天然的其它同源物。例如,本文所述的各RPI编码核酸片段可用于分离编码同源蛋白质的DNA序列。使用序列依赖性规程进行同源序列的分离在本领域中是为人所熟知的。序列依赖性规程的实例包括但不限于:1)核酸杂交方法;2)DNA和RNA扩增方法,例如核酸扩增技术的各种用途[例如,聚合酶链反应(PCR),Mullis等人,U.S.Patent 4,683,202;连接酶链反应(LCR),Tabor,S.等人,Proc.Acad.Sci.USA 82:1074(1985);或链置换扩增(SDA),Walker等人,Proc.Natl.Acad.Sci.U.S.A.,89:392(1992)];以及3)文库构建和互补筛选方法。
木糖利用型宿主菌株
可在能够利用木糖作为碳源的发酵单胞菌属的任意菌株或其它细菌性乙醇菌原(诸如发酵杆菌)中提高RPI的表达。棕榈发酵杆菌是乙醇生产细菌,其已经通过使用运动发酵单胞菌甘油醛-3-磷酸脱氢酶和烯醇酶启动子表达下文针对发酵单胞菌描述的木糖利用基因而进行了木糖利用的工程改造(Yanase等人Applied and Environmental Microbiology(2007)73:2592-2599)。此外,当RPI表达未被提高时,所述乙醇菌原在生长与包含木糖的培养基时积累核酮糖-5-磷酸或核酮糖。
已经针对形成乙醇的木糖发酵发酵而对单胞菌属的菌株(诸如运动发酵单胞菌)进行了工程改造。通常将4种基因引入运动发酵单胞菌以用于表达4种参与木糖代谢的酶(图1),如美国专利No.5514583、美国专利5712133、美国专利6566107、WO 95/28476、Feldmann等人((1992)Appl MicrobiolBiotechnol 38:354-361)以及Zhang等人((1995)Science 267:240-243)中所描述。这些基因包括编码催化木糖向木酮糖转换的木糖异构酶的基因,以及磷酸化木酮糖以形成木酮糖-5-磷酸的木酮糖激酶的基因。还表达了转酮醇酶和转醛醇酶,所述酶为戊糖磷酸途径的两种酶,其将木酮糖-5-磷酸转化成连接戊糖代谢与糖酵解Entner-Douderoff途径的中间物,这样实现了木糖形成乙醇的代谢(参见图1)。编码这些酶的DNA序列可从能够代谢木糖的多种微生物中的任何一种获得,例如肠细菌和一些酵母以及真菌。所述编码区的来源可包括黄单胞菌属(Xanthomonas)、克雷伯氏菌属(Klebsiella)、大肠杆菌属(Escherichia)、红细菌属(Rhodobacter)、黄杆菌属(Flavobacterium)、醋杆菌属(Acetobacter)、葡糖杆菌属(Gluconobacter)、根瘤菌属(Rhizobium)、农杆菌属(Agrobacterium)、沙门氏菌属(Salmonella)、假单胞菌属(Pseudomonads)以及发酵单胞菌属(Zymomonas)。通常使用大肠杆菌的编码区。
内源性基因可提供部分木糖发酵途径,或者可通过任意已知基因操作技术加已改动以提供具有可用于木糖代谢的酶活性的蛋白质。例如,内源转酮醇酶可在建立木糖代谢途径时补充其它导入的酶活性。
另外经工程改造以利用并非天然底物的其它糖(如木糖)的发酵单胞菌属和发酵杆菌属的菌株也可用于本发明加工。一个实例是针对***糖利用进行工程改造的运动发酵单胞菌菌株,如US 5843760中所描述,其以引用的方式并入本文。可以通过其它另外的方式修饰菌株以改善木糖利用和乙醇生产。
RPI的提高表达
在本发明微生物中进行了基因修饰,与在缺乏所述基因修饰的微生物中的核糖-5-磷酸异构酶活性相比,其提高核糖-5-磷酸异构酶活性。可通过表达编码具有核糖-5-磷酸异构酶活性的蛋白质的DNA分子而获得RPI活性的提高表达,所述蛋白质在所述宿主微生物中具有活性。具有核糖-5-磷酸异构酶活性的可用蛋白质包括上文描述的核糖-5-磷酸异构酶A和核糖-5-磷酸异构酶B蛋白。
用于在微生物中提高酶活性的任何方法可用于提高RPI活性。这些方法对于本领域的技术人员是熟知的并且包括提高编码基因拷贝数量和/或通过包含搞表达启动子的基因表达。本发明菌株可进行工程改造以用于内源RPI编码区的提高表达和/或引入的异源RPI编码区的表达以提供提高的酶活性。此外,可通过突变并对所表达的突变基因进行筛选以鉴定具有提高活性的微生物,从而提高RPI活性。
RPI的提高表达通常通过以编码RPI的DNA分子进行转化而实现,所述DNA分子可操作地连接于嵌合基因或操作元中的启动子。可使用的RPI的编码序列包括编码上文所述的RPI-A和RPI-B蛋白的任意序列。这些编码序列的实例包括,对于RPI-A:SEQ ID NO:2108至3237,并且对于RPI-B:SEQ ID NO:3238至4132。
当使用异源编码区时,所述序列可以针对所述靶宿主细胞中的最高表达而进行密码子优化,如本领域的技术人员所熟知。如果天然起始密码子是GTG,其可改成ATG以进行提高的蛋白质表达。用于在细菌中进行基因表达的方法在该领域中是为人所熟知的。基因在细菌中的表达通常需要启动子(其可操作地连接于目标编码区)以及转录终止子。可使用的启动子是在发酵单胞菌或发酵杆菌中表达的启动子,诸如运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因的启动子(GAP启动子;Pgap)、运动发酵单胞菌烯醇酶基因的启动子(ENO启动子;Peno)以及密苏里游动放线菌木糖异构酶编码基因的启动子(GI promoter,Pgi)。可使用的特别高表达的启动子是具有导致高表达的突变的Pgap启动子,如美国专利公开号#2009-0246876A1中所公开。本文的Pgap启动子具有选自以下位点的碱基替换:位点-190、位点-89或位点-190与位点-89;其中所述位点编号是相对于运动发酵单胞菌的CP4和ZM4菌株中甘油醛-3-磷酸脱氢酶的天然ATG翻译起始密码子。具体地,所述碱基替换是位于位点-190的T对G的替换,位于位点-89的T对C的替换。这些位点在SEQ ID NO:17中分别为116和217。
RPI表达的嵌合基因或操作元通常构建于或转移入载体以用于进一步操作。载体是本领域熟知的。某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移/pRK404和三种相关载体:pRK437、pRK442和pRK442(H)的完整和加注的序列是可获得的。这些衍生物已被证明是在革兰氏阴性菌中进行遗传操纵的有用工具(Scott等人,Plasmid 50(1):74-79(2003))。
尤其可用于在发酵单胞菌属中表达的是能在大肠杆菌属和发酵单胞菌属中复制的载体,例如在美国专利5,514,583中描述的pZB188。载体可包括用于在细胞中自动复制的质粒,以及携带用于整合进入细菌基因组的构建体的质粒。用于DNA整合的质粒可包括转座子,其为与靶细菌基因组同源的核酸序列区域,或是其它支持整合的序列。另外类型的载体可以是转座组,其通过使用(例如)可商购自的***而产生。如何为所期望的的靶宿主和所期望的的功能选择适当的载体是为人熟知的。
细菌细胞可通过以众所周知的方法引入具有包含RPI编码区的嵌合基因的载体而进行工程改造,所述方法诸如冻融转化、钙介导的转化、电穿孔或结合法。用于针对改善的木糖利用而通过RPI酶的提高表达而进行工程改造的任意细菌细胞是转化的靶细胞,所述转化用于根据本文所述对菌株进行工程改造。尤其适合的宿主细胞是发酵单胞菌属和发酵杆菌属。所引入的嵌合基因可以在所述细胞中维持于稳定复制的质粒上,或在引入后整合进入所述基因组。
为使用整合于细菌细胞基因组的RPI嵌合基因或操作元对菌株进行工程改造,可使用本领域中为人熟知的方法,诸如同源重组、转座子***或转座组***。在同源重组中,将侧连于靶整合位点的DNA序列结合大观霉素抗性基因或其它选择标记以及Rpi嵌合基因,其引起所述选择标志和所述Rpi嵌合基因向所述靶基因组位点的***。此外,所述选择标记可结合位点特异性重组位点,从而在对应的位点特异性重组酶表达后从所述基因组中切除所述重组基因。
此外,可使用更为高表达的启动子替换所述内源RPI表达基因的启动子以提高所述细胞中的RPI活性。这可通过以上述载体和方法进行的同源重组而实现。
提高的木糖异构酶和RPI表达的组合
本发明微生物可经工程改造以具有木糖异构酶的提高表达。所述细胞中的提高RPI活性的存在与进一步提高的木糖异构酶表达共同导致了进一步提高的乙醇生产。例如,乙醇生产可提高至少约10%、15%、20%或25%,其取决于诸如具体菌株、培养基组成和生长条件这样的因素。
在本发明细胞中,可根据上文针对RPI表达的描述通过表达编码木糖异构酶的基因获得木糖异构酶活性的提高表达,所述木糖异构酶在宿主细胞中具有活性。具有木糖异构酶活性的可用酶类描述于共同拥有并共同待决的美国专利申请公开号US 2009-0246846A1中,其以引用的方式并入本文。根据本文公开,可使用HMM(如上文针对RPI的描述)鉴定木糖异构酶,所述HMM使用具有BRENDA数据库中引用的经实验确认的功能的32种木糖异构酶蛋白序列特征进行制备。这些蛋白质列于表1,并且具有SEQ IDNO:19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79和81。表3中得出了针对所述木糖利用蛋白家族的序型HMM。除所述序型HMM外,还发现4个催化位点氨基酸为木糖异构酶所特有:组氨酸54、天冬氨酸57、谷氨酸181和赖氨酸183,其位点编码对应于白色链霉菌木糖异构酶序列(SEQ ID NO:61)。除具有表1中所列的SEQ ID NO的蛋白质之外,具有<或=3×10-10的E值得分并且具有这4个催化位点残基的符合所述木糖异构酶序型HMM的任意蛋白质均为木糖异构酶,其编码区可用于在本发明细胞中提高木糖异构酶活性。如表1中所列,可用于表达木糖异构酶蛋白的编码区的实例是SEQ ID NO:20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80。
本领域已知由于遗传密码的简并性,在编码氨基酸序列的DNA序列中可存在变异。可对密码子进行优化以用于在靶宿主细胞中表达氨基酸序列,从而提供最佳的编码表达。
改善的木糖利用型菌株的发酵
具有提高RPI活性的本发明经工程改造的微生物可用于发酵以生产乙醇。例如,描述了由本发明的运动发酵单胞菌菌株进行的乙醇生产。
为进行乙醇生产,使具有提高的RPI活性的重组木糖利用型运动发酵单胞菌接触包含木糖的培养基。木糖可为唯一的糖,但是所述培养基通常包含包括木糖和葡萄糖在内的糖的混合物。所述培养基也包含包括这些糖的生物质水解产物,它们来源于经处理的纤维质或木质纤维质生物质。
当所述混合糖浓度高至抑制生长时,根据共同拥有的US 7629156B2中所公开,所述培养基包括山梨醇、甘露醇或它们的混合物。半乳糖醇或核糖醇可代替或与山梨醇或甘露糖醇组合。运动发酵单胞菌在其中进行发酵并且生产乙醇的培养基中生长。发酵在不补充空气、氧气、或其它气体(这可包括各种条件如厌氧、微氧、或微需氧发酵)的情况下运行至少约24小时,并且可运行30小时或更长时间。达到最大乙醇产量的时间是不确定的,取决于发酵条件。如果抑制剂存在于培养基中,通常需要更长的发酵时间。发酵可在介于约30℃和约37℃之间的温度、约4.5至约7.5的pH下进行。
可在实验室规模的发酵罐中,并且在生产商业用量的乙醇的情况下在扩规发酵中,将本发明运动发酵单胞菌生长于包含混合糖(包括木糖)的培养基中。当需要商业生产乙醇时,可使用多种培养方法。例如,从本发明的运动发酵单胞菌属菌株中的大规模生产可以通过分批培养方法和连续培养方法进行。经典的分批培养方法是封闭***,其中培养基的组成在培养开始时设定并且在培养过程期间不进行人工改变。因此,在培养过程开始时,用所期望的的生物接种培养基,并且不向***中添加任何物质可以发生生长或代谢活性。然而,通常来说,“分批”培养是指碳源的添加是成批的,但经常试图控制诸如pH和氧浓度之类的因素。在分批***中,代谢产物和生物质组成持续改变直至培养结束时。在分批培养物内,细胞缓慢通过静态延滞期到达高速生长对数期,并最后达到稳定期,此时生长速率减缓或终止。如果不加以处理,稳定期中的细胞将最终死亡。在某些***中对数期中的细胞通常负责最终产物或中间产物的批量生产。在其它***中可以获得稳定或指数后期生产。
标准分批式***的一种变型是补料分批***。分批补料培养方法也适用于本发明运动发酵单胞菌菌株的培养,并且包括典型的分批***,不同的是:底物随着培养进行以递增方式添加。在代谢产物往往抑制细胞的代谢作用以及其中期望培养基中具有有限量的底物时,补料分批式***是有用的。补料-分批***中实际底物浓度的测量是困难的,并因此根据可测量因素例如pH和废气如CO2的分压的改变来评估。分批和分批补料培养方法在本领域内是常用的且熟知的,并且实例可见于Biotechnology:A Textbook ofIndustrial Microbiology,Crueger,Crueger,和Brock,第二版(1989)SinauerAssociates,Inc.,Sunderland,MA,或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36,227,(1992),其以引用方式并入本文。
乙醇的商业生产也可通过连续培养进行。连续培养是一种开放式***,其中将设定好的培养基连续加入生物反应器里,并同时移出等量条件培养基用于加工。连续培养通常使细胞维持在其中细胞主要处于对数生长期的恒定高液相密度。或者,连续培养可以用固定化细胞来进行,其中连续添加碳和营养素,且连续从细胞团块中取出有价值的产物、副产物或废弃物。细胞固定可使用范围广泛的固体载体进行,所述固体载体由本领域技术人员已知的天然材料和/或合成材料组成。
连续或半连续培养允许调节影响细胞生长或最终产物浓度的一种因素或任何数目的因素。例如,一种方法将维持限制性营养物质例如碳源或氮水平处于固定速率并允许所有其它参数适度。在其它***中,影响生长的许多因素能够连续改变,而通过培养基浊度测量的细胞浓度保持不变。连续***努力维持稳态生长条件,且因此由于培养基取出的细胞丧失必须针对培养基中的细胞生长速度进行平衡。对于连续培养过程调节营养物质和生长因子的方法以及用于使产物形成速率达到最大的技术是工业微生物学领域熟知的,并且各种方法如上文Brock所述。
尤其适用于乙醇生产的发酵方法如下所述。期望的本发明运动发酵单胞菌属菌株在包含半复合培养基的摇瓶中生长,培养温度为30℃至约37℃,在回旋振荡器中以约150rpm的转速振荡培养,然后将其转移到包含相似培养基的10L种子发酵罐中。种子培养物在种子发酵罐中厌氧生长直至OD600介于3和6之间,然后将其转移到生产发酵罐中,其中的发酵参数经最优化用于乙醇生产。从种子罐转移到生产罐的典型种菌体积在约2%至约20%v/v的范围内。典型的发酵培养基包含基本培养基组分如磷酸钾(1.0-10.0g/l)、硫酸铵(0-2.0g/l)、硫酸镁(0-5.0g/l)、复合氮源如酵母提取物或大豆基产物(0-10g/l)。培养基中存在终浓度约5mM的山梨醇或甘露糖醇。包括木糖和至少一种附加糖如葡萄糖(或蔗糖)的混合糖提供碳源,当初始批次碳源(50-200g/l)耗尽时将混合糖持续加入发酵罐中以最大化乙醇比率和滴度。碳源进料速率进行动态调节以确保培养物不过度积累葡萄糖,过多的葡萄糖会导致积累毒性副产物如乙酸盐。为了最大化从利用的底物中生产的乙醇产量,通过磷酸盐的量来限制生物量增长,磷酸盐是初始时成批加入的或在发酵期间加入的。使用苛性碱溶液(如氢氧化铵、氢氧化钾、或氢氧化钠)和硫酸或磷酸将发酵控制在pH 5.0-6.0。将发酵罐的温度控制在30℃至约35℃。为了最小化泡沫,按需加入消泡剂(任何种类-硅氧烷基消泡剂、有机物基消泡剂等)到罐中。可任选地使用抗生素(菌株中有该抗生素的抗性标记)如卡那霉素以最小化污染。
上文描述的任意条件组以及本领域中所熟知的对这些条件另外改动均为通过木糖利用型重组运动发酵单胞菌进行乙醇生产的适当条件。
实施例
本发明将在下面的实施例中得到进一步阐述。应该理解,这些实施例尽管说明了本发明的优选实施方案,但仅是以例证的方式得出的。从上文的讨论和这些实施例中,本领域的技术人员能够确定本发明的实质特性,并且在不脱离其实质和范围的情况下,能对本发明进行各种变化和修改以适应不同的用途和条件。
通常方法
本文所使用的标准重组DNA和分子克隆技术在本领域中是为人所熟知的,并且由Sambrook,J.,Fritsch,E.F.and Maniatis,T.,Molecular Cloning:ALaboratory Manual,第2版,Cold Spring Harbor Laboratory:Cold SpringHarbor,NY(1989)(下文称为“Maniatis”);以及Silhavy,T.J.,Bennan,M.L.and Enquist,L.W.,Experiments with Gene Fusions,Cold Spring HarborLaboratory:Cold Spring Harbor,NY(1984);以及Ausubel,F.M.,CurrentProtocols in Molecular Biology,Greene Publishing Assoc.and Wiley-Interscience出版,Hoboken,NJ(1987)进行了描述。
缩写的含义如下:“kb”是指千碱基,“bp”是指碱基对,“nt”是指核苷酸,“hr”是指小时,“min”是指分钟,“sec”是指秒钟,“d”是指天数,“L”是指升,“ml”是指毫升,“μL”是指微升,“μg”是指微克,“ng”是指纳克,“mM”是指毫摩,“μM”是指微摩,“nm”是指纳摩,“μmol”是指微摩尔,“pmol”是指皮摩尔,“Cm”是指氯霉素,“Cmr”是指氯霉素抗性型,“Cms”是指氯霉素敏感型,“Spr”是指大观霉素抗性型,“Sps”是指大观霉素抗性敏感型,“XI”是木糖异构酶,“XK”是木酮糖激酶,“TAL”是转醛醇酶,“TKT”是转酮醇酶,“OD600”是指在600nm波长下测量的光密度,“PCR”是指聚合酶链反应,“kDa”是指千道尔顿,“g”是指重力常数,“bp”是指碱基对,“kbp”是指千碱基对,“HPLC”是指高效液相色谱并且“GC”是指气相色谱,“RM”是指包含10g/L酵母提取物加2g/L KH2PO4的丰富培养基,“MM”是指包含10g/L酵母提取物、5g/L胰蛋白胨、2.5g/L(NH4)2SO4和0.2g/L KH2PO4的接合培养基(mating medium)。
实施例1
核酮糖积累型运动发酵单胞菌ZW801-4菌株
所述重组运动发酵单胞菌ZW801-4菌株描述于美国专利7,741,119中,其以引用的方式并入本文。ZW801-4菌株衍生自ZW800菌株,ZW800菌株衍生自ZW658菌株,它们均描述于US 7,741,119中。通过连续转座事件向ZW1(ZM4菌株的重命名;ATCC#31821)基因组中整合入包含编码木糖异构酶(xylA)、木酮糖激酶(xylB)、转醛醇酶(tal)和转酮醇酶(tkt)的4个木糖利用基因的两个操作元(PgapxylAB和Pgaptaltkt)而构建ZW658,从而产生了X13L3菌株,其重命名为ZW641,并且随后在包含木糖的选择培养基上进行驯化。ZW658根据布达佩斯条约以ATCC#PTA-7858进行保藏。在ZW658中,使用宿主介导的双交换同源重组对编码葡萄糖-果糖氧化还原酶的基因进行***式灭活并以大观霉素抗性作为选择标记以产生ZW800菌株。通过使用Cre重组酶进行的位点特异性重组去除由loxP位点所结合的大观霉素抗性标记,从而产生了ZW801-4菌株。如共同拥有并共同待决的美国专利申请#US 2009-0246846A1中所公开,由于表达所述xylA编码区的启动子(Pgap)中的突变,ZW648具有比ZW641(以X13bC菌株显示)更高的木糖异构酶活性(约高出7倍)。
将ZW801-4生长于包含木糖作为唯一的碳源的培养基(MRM3X10培养基;1%酵母提取物、15mM KH2PO4、4mM MgSO4和100g/L木糖)中和以100g/L葡萄糖替代所述木糖的培养基中(MRM3G10)。在33℃下以最低搅拌(在LAB-Line旋转摇床中125RPM;Terra Universal,Inc.Fullerton,CA)生长细胞。通过高效色谱(HPLC)分析核酮糖和其它发酵产物。在Agilent 1200系列(Agilent Technologies,Santa Clara,CA)上使用折光率和二极管阵列检测器进行HPLC分析。流动相由0.5ml/min下的0.01N硫酸所组成。使用ShodexSH1011(Showa Denko,Tokyo,Japan)糖柱进行底物和发酵产物的分离。外部标准物包括不同浓度下的D-葡萄糖、D-木糖、甘油、乙酸盐、乙醇和D-核酮糖(Sigma-Aldrich,St.Louis,Missouri)以用于校准和与培养物培养基中积累的产物进行比较。所述D-核酮糖标准物的折光率信号为17.3分钟的持留时间,并且如同预期,使用二极管阵列检测器无信号。培养物培养基分析显示了核酮糖生产在所述包含木糖的培养的极早期开始,并且持续直至所述木糖源耗尽。此外,核酮糖仅在细胞生长于包含木糖的培养基中时积累(图2,虚线)。通过HPLC对在以葡萄糖作为碳源的培养物培养基中生长的ZW801-4菌株(图2,实线)进行的培养物培养基比较显示,即使这一底物被完全利用也不存在核酮糖的瞬时或累积生产(图2)。在包含木糖培养基的培养中,木糖并未完全使用。
实施例2
以嵌合性运动发酵单胞菌核酮糖-5-磷酸异构酶基因对运动发酵单胞菌 进行的工程改造
包含天然运动发酵单胞菌核酮糖-5-磷酸异构酶(RPI-A)编码区的嵌合基因的染色体外拷贝的表达通过将所述编码区克隆进入穿梭载体以邻接于源自密苏里游动放线菌的葡糖异构酶(GI)启动子而实现。
所述运动发酵单胞菌RPI-A编码区(SEQ ID NO:1870)使用PCR分离自ZW1菌株(ZM4菌株的重命名;ATCC#31821)基因组DNA。使用Puregene基因组DNA纯化试剂盒根据制造商的说明书(Gentra Systems,Minneapolis,Minnesota)从ZW1中制备基因组DNA。对PCR引物进行设计以扩增所述RPI-A编码区并且并入适当的限制性酶位点以用于克隆目的。还对PCR引物进行设计以保持所述启动子的Shine-Delgarno序列和所述编码区起始密码子之间的天然距离。
用于分离所述RPI-A编码区的PCR引物是引物1和引物2(SEQ IDNO:1和2)。引物1的序列对应于所述RPI-A编码区的5′末端,其包括天然的起始密码子和所述密苏里游动放线菌GI启动子的3′最末端的15bp序列。引物2包括所述RPI-A编码区的3′末端,其并入了天然终止密码子和XhoI限制性酶识别位点。使用来自运动发酵单胞菌ZW1基因组DNA以引物1和引物2进行的PCR产生了包含474bp RPI-A编码序列的DNA片段,其在5′末端具有15bp的GI启动子序列并且在3′末端具有XhoI限制性酶识别位点。
所述186bp的密苏里游动放线菌(ATCC 14538)GI启动子(SEQ ID NO:14)使用引物3和引物4(SEQ ID NO:3和4)通过PCR进行分离。所述PCR引物3包含位于所述GI启动子片段5′末端的NcoI和SacI限制性酶识别位点的序列。引物4的序列包含所述GI启动子的3′末端和所述RPI-A编码序列的最初15bp。
在第二次PCR中合并所述GI启动子和RPI-A编码序列PCR产物,所述第二次PCR仅使用引物2和引物3,其产生了包含连接于所述RPI-A编码序列的GI启动子的DNA片段,所述Shine-Delgarno序列和起始密码子之间的距离被保持。随后使用限制性酶NcoI和XhoI消化所述DNA片段并将其连接进入发酵单胞菌属/大肠杆菌穿梭载体pZB188/aadA,所述载体事先以同样两种酶进行处理。pZB188/aadA(SEQ ID NO:15)是通过pZB188构建的载体,其描述于US 5514583中,所述载体能够在大肠杆菌和运动发酵单胞菌中复制,并且具有四环素抗性标记。pZB188/aadA的构建描述于共同拥有并共同待决的美国专利申请公开号US 2009-0246876A1中(实施例5,其以引用的方式并入本文),并且具有对所述四环素抗性标记的删除并且以大观霉素抗性标记对其替代。在连接后,使用制造商的方案将所产生的命名为pZB-GI-RPI(SEQ ID NO:16)的质粒转化进入化学感受态大肠杆菌SCS110细胞中(Stratagene,San Diego,CA)。
将分离自SCS110细胞的质粒pZB-GI-RPI转化进入感受态运动发酵单胞菌ZW801-4菌株中。通过在30℃下将培养物过夜生长于MRM3G5(1%酵母提取物、15mM KH2PO4、4mM MgSO4和50g/L葡萄糖)中制备感受态ZW801-4细胞。于次日收集细胞并且转入新鲜培养基至初始OD600数值为0.025。将培养物生长至OD600为0.5,随后对其收集并且以4℃无菌过滤的水洗涤一次,并随后以4℃10%甘油洗涤两次。将浓缩200×倍的感受态细胞(OD600=100)储存于-80℃下直至使用。
使用AnaeroPacks(Mitsubishi Gas Chemical,New York,NY)在无氧罐内在30℃下孵育于MRM3G5-Spec250平板上(具有250mg/L大观霉素和15g/L琼脂的MRM3G5培养基)孵育2天之后,从单菌落中分离包含所述pZB-GI-RPI质粒的转化运动发酵单胞菌菌株。
实施例3
运动发酵单胞菌核酮糖-5-磷酸异构酶在重组运动发酵单胞菌菌株中的 提高表达的影响
为测定携带RPI-A基因的染色体外拷贝的重组运动发酵单胞菌菌株是否具有改变的核酮糖水平和改善的木糖发酵,从MRM3G5-Spec250平板上筛选了包含pZB-GI-RPI的单独转化菌株。将转化菌株(RPI-1和RPI-2)以0.1的初始OD600转移至MRM3G5-Spec250液体培养基中并且在30℃下孵育。在14-16小时孵育后,将菌株转移至MRM3X10培养基(1%酵母提取物、15mM KH2PO4、4mM MgSO4和100g/L木糖)并且孵育24小时。在将培养物第二次转移至新鲜MRM3X10培养基(其作为防止所述原始培养物中的葡萄糖残留的措施)后开始测试提高的RPI-A基因拷贝数量对于发酵性能的影响。以0.1的初始OD600接种携带pZB-GI-RPI的转化菌株和对照(重复ZW801-4:ZW801-1和ZW801-2)并且将其在30℃下进行孵育。根据光密度测量监测生长。根据实施例1中所述通过HPLC监测木糖消耗和产物积累(即,核酮糖和乙醇)。
图3(A-C)示出了在MRM3X10培养基中发酵的结果。图3A是两种转化菌株(RPI-1和RPI-2)与所述对照(ZW801-4#1和ZW801-4#2)相比较在光密度上的变化记录。根据该数据可见,所述转化和对照菌株的早期生长是类似的。然而,在48小时时间点所述对照菌株停止生长,而所述两个独立的转化菌株继续增加细胞物。由携带额外拷贝的运动发酵单胞菌RPI-A编码区的菌株所积累的细胞物的提高还反映于在本实验的晚期时间点中木糖的提高利用与乙醇生产的提高(图3B和3C)。图3D还示出了各菌株核酮糖积累的时间过程。根据该数据而明了,与对照相比,核酮糖的水平对于包含另外运动发酵单胞菌RPI-A编码区拷贝的重组菌株有所降低。
实施例4
大肠杆菌RPI-A基因在重组运动发酵单胞菌中的表达
所述RPI-A编码区克隆自大肠杆菌(编码区SEQ ID NO:2108,蛋白质SEQ ID NO:83)并且置入所述pZB188/aadA穿梭载体,所述编码区处于嵌合基因中,所述嵌合基因通过天然运动发酵单胞菌甘油醛-3-磷酸脱氢酶(GAP)启动子(来自ZW1,亦称为ZM4;SEQ ID NO:17)表达。
通过引物设计而保持了所述GAP启动子的Shine-Delgarno序列与大肠杆菌RPI-A编码区的起始密码子之间的天然距离。加入了适当的限制性酶识别位点以用于克隆目的。所述PCR引物5(SEQ ID NO:5)包括NcoI和SacI识别位点,其添加于所述GAP启动子序列的5′末端。通过在反应中使用引物6(SEQ ID NO:6)与引物5相配对,以及ZW1(ATCC#31821)基因组DNA作为模板,产生了304个碱基对的DNA片段,其包含整个天然运动发酵单胞菌GAP启动子。通过并入引物6序列,这一片段还包含所述大肠杆菌RPI-A编码区的5′末端编码序列的15个碱基对。通过使用引物7和引物8(SEQ ID NO:7和8)以及分离自大肠杆菌K12的基因组DNA,以PCR扩增了660个碱基对的片段。所述片段的5′末端包含对应于所述GAP启动子3′末端的15个碱基对序列。将用于限制性酶识别位点XhoI的序列添加至所述RPI-A编码区的3′末端。分离了所述GAP启动子和RPI-A编码区片段并且将其用于以引物5和引物8进行的第二次PCR。这一反应产生了单一DNA片段,其将所述GAP启动子连接于所述大肠杆菌RPI-A编码区,保持了Shine-Delgarno和初始密码子之间的天然距离,还并入了限制性酶位点以用于克隆进入pZB188/aadA穿梭载体(描述于实施例2中)。在以酶NcoI和XhoI消化之后进行了向所述穿梭载体的***。所述连接产物向感受态大肠杆菌SCS110细胞中的转化实现了对完整质粒的分离(命名为pZB-GI-RPI-ECA),其随后通过描述于实施例2中的方法转化进入感受态运动发酵单胞菌ZW801-4细胞。
将来自MRM3G5-Spec250平板的单克隆(命名为ZW801-rpiEc-1和ZW801-rpiEc-2菌株)生长于具有大观霉素(250μg/ml)的MRM3G10液体培养基中,并且随后与作为对照的亲本ZW801-4菌株(ZW801-1和ZW801-2)一起转移至新鲜的MRM3X10中。在30℃下孵育16小时后测定所述培养物的光密度。将细胞转移至新鲜的MRM3X10培养基,这最小化了葡萄糖向所述木糖培养基中的转移,并且将包含表达所述大肠杆菌RPI-A编码区的嵌合基因的菌株的生长与对照(重复进行)进行比对,从而测定通过这一异源基因的表达是否可能提高细胞物和降低核酮糖积累。图4中的结果显示了与对照相比较包含表达所述异源RPI-A编码区的嵌合基因的两种独立分离菌种的细胞物积累的提高。该结果类似于所述运动发酵单胞菌RPI-A编码区所显示的结果(图3A中示出),所述转化谱系积累了较高的细胞物。HPLC分析还显示了所述培养基中较低的核酮糖积累。在91小时的终点分析得出了对于所述两种对照菌株平均为3.03g/L的核酮糖积累,以及对于ZW801-rpiEc-1和ZW801-rpiEc-2菌株分别仅为2.12g/L和1.93g/L的核酮糖积累。来自这一比较的结果与实施例3所示的结果相一致,这显示了生长于包含木糖的培养基的菌株中RPI的提高表达导致细胞物积累的提高和降低的核酮糖积累。
实施例5
比较:具有进一步提高的木糖异构酶表达的重组运动发酵单胞菌 ZW801-4菌株的发酵性能
所述大肠杆菌xylA编码区通过GAP启动子在多拷贝穿梭载体上表达以提高这种酶的活性。表达在所述ZW801-4菌株中进行,如实施例1所述,其为木糖利用型菌株,由于表达所述xylA编码区的启动子(Pgap)中的突变而具有高木糖木糖异构酶活性。
此前在共同拥有并共同待决的美国专利申请公开号US 2009-0246876A1的实施例5中描述了包含由天然运动发酵单胞菌甘油醛-3-磷酸脱氢酶(GAP)启动子引导其转录的大肠杆菌木糖异构酶编码区(编码区SEQ IDNO:20;蛋白质SEQ ID NO:19)的pZB188/aadA(上文实施例2所述)载体(pZB188/aadA-GapXylA,亦称为pZB188/aadA-641GapXylA)的构建,其以引用的方式并入本文。所述PgapXylA表达盒(SEQ ID NO:18)具有来自所述ZW641菌株的GAP启动子(Pgap)。
如上文实施例1所述,将所述pZB188/aadA和pZB188/aadA-641GapXylA质粒转化进入ZW801-4菌株。从生长于MMG-KAN500平板(1%酵母提取物、15mM KH2PO4、4mM MgSO4、50g/L葡萄糖、500μg/ml卡那霉素)的单菌落中分离菌株并将其转移至MRM3X10培养基。将各菌株的初始细胞OD600调至0.08并且随后在30℃下以150RPM振荡孵育细胞。
图5示出了所述菌株在MRM3X10培养基中的生长速度。该结果显示,对照(801/pZB188-1和801/pZB188-3)的生长速度高于以pZB188/aadA-641GapXylA进行转化的菌株(801/pXylA-2和801/pXylA-4)。对于生长于包含木糖的培养基中的对照菌株,最终细胞物也有所提高。在表6中,HPLC分析也清楚地显示了包含pZB188/aadA-641GapXylA的菌株对木糖的降低利用以及较低的乙醇生产。据发现这些菌株中每克被利用木糖的核酮糖积累与所述对照谱系相比也有所提高。
因此,在如上所述已经具有木糖异构酶高表达的ZW801-4中,木糖异构酶的进一步提高表达对于发酵性能是有害的。
表6.在91小时孵育后对培养物培养基的HPLC分析。数据以g/L为单
菌株 木糖 核酮糖 乙醇
801/pXylA-2 34.72 4.27 32.26
801/pXylA-4 39.05 3.93 29.67
801/pZB188-1 8.20 8.20 43.67
801/pZB188-3 5.57 6.95 45.17
实施例6
具有木糖异构酶和核酮糖-5-磷酸异构酶的提高表达的ZW801-4菌株的 发酵性能
估测了在所述高木糖异构酶表达菌株ZW801-4中木糖异构酶(XI)和核酮糖-5-磷酸异构酶(RPI)提高表达的效果。
向上文所述的运动发酵单胞菌ZW801-4菌株中先后转化进入实施例1所述的穿梭载体pZB-GI-RPI和实施例5所述的pZB188/aadA-641GapXylA。首先通过转化并在MRM3G5-spec平板上进行筛选而分离了包含含有大观霉素标记的RPI-A载体的菌株。转化的细胞作为单菌落进行分离并且随后使用包含卡那霉素抗性标记的xylA载体进行再度转化。分离自MRM3G5-KAN平板的菌株据显示兼而具有大观霉素和卡那霉素耐受性,并且称为xylA/GI-rpiZ菌株。
将包含所述两种质粒(xylA/GI-rpiZ1.1和xylA/GI-rpiZ1.2)的单个菌落在具有大观霉素(250μg/ml)和卡纳霉素(400μg/ml)的MRM3G10培养基中过夜生长。在不具备抗生素选择的MRM3G10培养基中生长对照菌株(ZW801-1和ZW801-2)。随后将细胞转移入MRM3X10培养基并且在30℃下孵育另外20小时。在0.1的初始PD600下最终转移入新鲜的MRM3X10培养基,从而最小化葡萄糖从原始培养物向所述测试培养基的转移。所述ZW801对照菌株(重复进行)和xylA/GI-rpiZ菌株在30℃下孵育并且监测细胞生长以及通过HPLC分析监测糖消耗。
图6(A-D)示出了所述结果。图6A示出了贯穿所述实验的细胞生长。相对于对照,具有提高的xI和RPI表达的菌株以提高的速度生长并且形成更高的最终细胞物。所述结果与实施例4中的结果形成对比,所述实施例中仅具有提高的XI表达的菌株在包含木糖的培养基中以降低的速度生长。图6B和6C还示出了携带xylA和RPI-A的穿梭载体的菌株在木糖利用率和最终木糖消耗量上有所提高的改善的发酵性能,提高的木糖利用反映于最终乙醇滴度的提高上。图6D显示,核酮糖水平也被发现低于所述对照。
因此,提高的XI和RPI的组合改良了单独提高XI的不良效果(实施例5)并且进一步提高所述高XI ZW801-4菌株中的木糖利用和乙醇生产。
实施例7
重组运动发酵单胞菌菌株中提高的核酮糖-5-磷酸异构酶蛋白水平
上文实施例中的数据显示,RPI-A蛋白在重组运动发酵单胞菌中的提高表达导致了提高的发酵性能。这一实施例显示了用于在转化细胞中提高RPI的替代方法。
将所述运动发酵单胞菌RPI-A编码区(SEQ ID NO:3895)的翻译起始密码子由天然存在的GTG密码子变成更为常见的ATG密码子。此外,所述天然运动发酵单胞菌GAP启动子连接于RPI-A的编码序列,同时保持了所述Shine-Delgarno序列和对应这一启动子的起始密码子之间的距离。使用在3′末端并入NcoI和SacI限制性酶位点的引物5(SEQ ID NO:5)和包含与所述RPI-A编码区的开端重叠的15个碱基对的引物9(SEQ ID NO:9),通过PCR从运动发酵单胞菌ZW1基因组DNA中分离了所述GAP启动子(SEQID NO:17)。引物9中的15个碱基对重叠还将所述天然GTG起始密码子变成了ATG。
在使用运动发酵单胞菌ZW1基因组DNA作为模板以引物10(SEQ IDNO:10)进行的独立PCR中分离了所述RPI-A编码区,所述引物还具有所述ATG起始密码子变化以及与所述GAP启动子的15个碱基对的重叠。在反应中将引物11(SEQ ID NO:11)与引物10配对,从而引起对RPI-A的完整编码序列的分离。引物11还包含XhoI限制性酶识别位点以用于克隆进入所述pZB188穿梭载体。
在所述两次独立的反应之后,使用引物5和引物11以所述两种分离的DNA片段产物运行第三次PCR。通过这一反应,分离了包含GAP启动子(其与具有ATG起始密码子的RPI-A编码区相连接)的DNA片段并且随后使用酶NcoI和XhoI对其消化。将所述片段连接进入所述pZB188/aadA穿梭载体,其用于测定改变的起始密码子在转化细胞中对于稳态蛋白质水平的影响。
除以引物12(SEQ ID NO:12)和引物13(SEQ ID NO:13)替代引物9和引物10之外,使用了相同的方法分离出相同的RPI-A编码区(具有其天然GTG起始密码子)作为对照,。在第一轮PCR之后,分离了两个DNA片段并用于第三次PCR,所述两个DNA片段中的一个包含所述GAP启动子,具有与所述天然RPI-A编码区的15个碱基对的重叠,另一个包含具有所述天然起始密码子的RPI-A编码区。这一反应包括引物5和引物11,并且产生了包含与具有天然GTG起始密码子的RPI-A编码区相连接的GAP启动子的DNA片段。使用限制性酶NcoI和XhoI消化这一片段,并将其连接进入所述pZB188/aadA穿梭载体。所述GAP启动子天然RPI-A表达载体作为对照用于对比通过包含与ATG改造版本的RPI-A编码区相连接的相同GAP启动子的细胞所产生的蛋白水平。
将包含所述天然基因的穿梭载体和ATG改造基因的穿梭载体转化进入大肠杆菌SCS110感受态细胞。分离自大肠杆菌的质粒用于转化感受态ZW801-4细胞并且通过平铺于MRM3G5-spec平板筛选单菌落。将名为ZW801 GAP-rpi-1、ZW801 GAP-rpi-3和ZW801 GAP-rpi-4的分离单菌落过夜生长于具有大观霉素(250μg/ml)的MRM3G5培养基中,并且对其收集以用于制备蛋白质提取物。通过将细胞转移至新鲜的MRM3G10培养基中并且生长至OD600为0.6至0.8而制备提取物。通过以1OD600对44.38μl样品缓冲液的比例对细胞进行的稀释来控制所述提取物中的总蛋白浓度。样品缓冲液由650μl水、250μl Nupage 4×上样缓冲液和100μl 10×Nupage还原缓冲液组成。将悬浮于样品缓冲液中的细胞加热至80℃,进行10分钟。在以13000RPM进行10分钟的离心后收集上清液。将来自所述上清液的15微升蛋白提取物和Mark12未染色标准物(Invitrogen,Carlsbad,CA)上样至4-12%的Nupage Bis-Tris丙烯酰胺凝胶(Invitrogen,Carlsbad,CA),其使用Nupage1×MES SDS电泳缓冲液进行电泳。
图7示出了以Simply Blue Safe Stain(Invitrogen,Carlsbad,CA)染色的SDS凝胶。通过该图可见,在包含所述起始密码子改造的RPI-A编码区的菌株中来自总蛋白提取物的RPI-A蛋白水平(ZW801 GAP-rpi-1、ZW801GAP-rpi-3和ZW801 GAP-rpi-4,分别处于泳道2、3和4中)比包含天然RPI-A编码区的对照泳道(泳道5和6)更高。所述结果清楚地显示在转化谱系中通过将起始密码子从天然的GTG变成ATG提高运动发酵单胞菌RPI-A蛋白水平。
实施例8
核糖-5-磷酸异构酶的结构分析
为对RPI序列结构进行分析,通过Brenda(BRENDA,AMENDA andFRENDA the enzyme information system:new content and tools in 2009.ChangA.,Scheer M.,Grote A.,Schomburg I.,Schomburg D.Nucleic Acids Res.2009,第37卷,Database issue,D588-D592)和PubMed(US National Library ofMedicine,National Institutes of Health)数据库提取了在功能上表征为核糖-5-磷酸异构酶的RPI蛋白。这些种子序列包括RPI-A的15种序列以及RPI-B的5种序列。所述RPI-A种子序列是来自大肠杆菌(SEQ ID NO:83)、阴沟肠杆菌(SEQ ID NO:84)、创伤弧菌(SEQ ID NO:85)、极端嗜热菌(SEQ IDNO:86)、莱茵衣藻(SEQ ID NO:87)、菠菜根瘤菌(SEQ ID NO:88)、拟南芥(SEQ ID NO:89)、拟南芥(SEQ ID NO:90)、恶性疟原虫(SEQ ID NO:91)、超嗜热古菌(SEQ ID NO:92)、詹氏甲烷球菌(SEQ ID NO:93)、产琥珀酸拟杆菌(SEQ ID NO:94)、人类(SEQ ID NO:95)、秀丽隐杆线虫(SEQID NO:96)和酿酒酵母(SEQ ID NO:97)的序列。所述RPI-B种子序列是来自结核分枝杆菌(SEQ ID NO:1213)、海栖热袍菌(SEQ ID NO:1214)、热纤梭菌(SEQ ID NO:1215)、大肠杆菌(SEQ ID NO:1216)和克氏锥虫(SEQID NO:1217)的序列。附件“rpi_exp_evid.doc”中提供了具有提供用作种子序列的RPI的功能表征信息的摘要的参考文献。
使用BLAST以设定为0.001的E值将所述种子序列的各个序列(成员)用于搜索非冗余Genbank数据库(National Center for Biotechnology Information,Bethesda,MD)。分别对RPI-A和RPI-B合并Blast搜索结果,并且实施了100%ID和100%长度重叠的冗余度。这一分析产生了1232种RPI-A序列和1206种RPI-B序列。通过保留长度处于200-300氨基酸范围内(针对RPI-A)和125-185氨基酸范围内(针对RPI-B)的序列而将这些数值降至1155种RPI-A序列和1112种RPI-B序列。
对于各组RPI-A和RPI-B种子序列进行了多序列比对,其随后用于以HMMER软件包的hmmsearch算法遵循用户指南创建剖面隐马尔可夫模型(HMM),所述软件包可获自HMMER(Janelia Farm Research Campus,Ashburn,VA)。支持序型HMM的理论描述于R.Durbin,S.Eddy,A.Krogh,and G.Mitchison,Biological sequence analysis:probabilistic models of proteins and nucleic acids,Cambridge University Press,1998;Krogh等人,1994;J.Mol.Biol.235:1501-1531之中。如用户指南中所述,序型HMM是多重序列比对的统计模型。它们捕获关于比对中的每一列有多保守以及在每一位点哪种氨基酸残基最可能存在的位点特异性信息。因此,HMM具有正规的概率学基础。大量蛋白质家族的序型HMM可公开获自PFAM数据库(Janelia FarmResearch Campus,Ashburn,VA)并且所述软件可公开获得以用于创建序型HMM。
如下构建所述序型HMM
步骤1:构建序列比对
使用Clustal W以默认参数比对所述种子序列(在功能表征中具有高置信度的序列)。
步骤2:构建序型HMM
使用默认参数对各组比对序列运行所述hmmbuild程序。hmmbuild读取所述多序列比对文件,构建新的序型HMM并且将所述序型HMM存储于文件中。使用这一程序,从所述对比对中为上述各组种子序列产生了序型图。表4中得出了RPI-A的序型HMM,并且表5中得出了RPI-B的序型HMM。
以下基于HMMER软件用户指南的信息得出了关于hmmbuild程序制备序型HMM的方式的一些描述。序型HMM能够建模带缺口的比对,例如包括***和缺失,这使得软件能描述完整的保守域(而不是仅仅较小的不带缺口的基序)。采用***(I)状态和缺失(D)状态对***和缺失建模。包含多于特定部分x的空位字符的所有列将被指定为***列。在默认情况下x设为0.5。各匹配状态具有与之关联的I状态和D状态。HMMER将比对中相同的共有位点的一组三种状态(M/D/I)称作“节点”。这些状态与称作状态转换概率的箭头互相关联。M和I状态是发射者,而D状态是静默的。转换被安排为使得在每一节点,M状态被使用(并且一个残基被对齐并评分)或者D状态被使用(并且没有残基被对齐,从而产生一个缺失-空位符号’-’)。***发生在节点之间,并且I状态具有自我转换,允许在共有列之间出现一个或多个***的残基。
匹配状态的残基的评分(即匹配状态发射评分)或***状态的残基的评分(即***状态发射评分)与Log_2(p_x)/(null_x)成比例。其中p_x是根据序型HMM,某种氨基酸残基处于比对中的一个特定位点的概率,而null_x是根据空模型的概率。所述空模型为有预先算出的一组针对20种氨基酸中的每一种的发射概率的简单的单一状态概率模型,其中所述发射概率来源于氨基酸在SWISSPROT版本24中的分布。
状态转换得分还作为对数几率(log odd)参数进行计算,并且其与Log_2(t_x)成比例。其中t_x是转换为发射者或非发射者状态的概率。
步骤3:检验所述序型HMM
针对根据上文指出的BLAST搜索获得的RPI-A或RPI-B同类物的对应组搜索所述序型HMM。将0.1的E值用作截取值,将Z参数设为10亿。通过所述序型HMM搜索鉴定出了除一个之外的全部RPI-A和RPI-B序列类似物。将所述非匹配序列移除。表4中得出了所述RPI-A的序型HMM,表5中得出了所述RPI-B的序型HMM。
对RPI-A和RPI-B序列组的优化
对RPI-A和RPI-B序列组的进一步优化如下进行:进行多序列比对以去除具有内部、N末端或C末端切除的序列。这产生RPI-A的1145种序列,并且对于RPI-B无变化(1112种序列)。
针对经鉴定属于RPI-A和RPI-B的活性位点残基(Roos等人,(2004)J.Mol.Biol.335:799-809;Graile等人,(2005)Biochimie 87:763-769)评估序列。这些活性位点残基为:
对于RPI-A:分别位于酿酒酵母序列的107和128位点处的天冬氨酸和谷氨酸(D107和E128;SEQ ID NO:97)。所述酿酒酵母蛋白的位点107和128分别对应于所述HMM序型图上的位点91和114。
对于RPI-B:分别位于大肠杆菌序列的66和68位点处的半胱氨酸和苏氨酸(C66和T68;SEQ ID NO:1216)。所述大肠杆菌蛋白的位点66和68分别对应于所述HMM序型图上的位点69和71。
或者:分别位于结核分枝杆菌序列的68和72位点处的丝氨酸和谷氨酸(S68和E72;SEQ ID NO:1213)。所述结核分枝杆菌蛋白的位点68和72分别对应于所述HMM序型图上的位点71和75。
从RPI-A或RPI-B同类物组中去除缺少适当催化位点残基的蛋白质。最终RPI-A蛋白组为1130种蛋白质。
据发现,尽管RpiB序型HMM通过来自经实验证实的酶的RPI-B序列比对而产生,但是所述序型HMM鉴定出已知为RpiB/LacA/LacB家族的糖异构酶通类,其除核糖-6-磷酸异构酶之外还包含半乳糖-6-磷酸异构酶的两种亚基LacA和LacB。所述两种亚基可容易地鉴定:它们相连地位于基因组中,一种亚基缺乏所述两种催化残基,并且另一种携带了补充性的活性位点残基以及所述两种催化残基。
所述LacA亚基根据其对催化残基的缺乏而从所述RPI-B蛋白组去除。根据在大肠杆菌蛋白和结核分枝杆菌蛋白(SEQ ID NO:1216和1213)的位点100处具有亮氨酸而非天冬酰胺,将LacB蛋白与RPI-B蛋白加以区分。RPI-B蛋白在对应于位点100处还可具有甘氨酸、天冬氨酸、丝氨酸或谷氨酸,其对应于所述序型HMM的位点104。从所述RPI-B蛋白组中去除在该位点上具有亮氨酸的蛋白质,剩余895种序列。
通过这一结构分析,将符合RPI-A功能的蛋白质鉴定为SEQ ID NO:83至1212。RPI-A蛋白的编码序列为SEQ ID NO:2108至3237。
通过这一结构分析,将符合RPI-B功能的蛋白质鉴定为SEQ ID NO:1213至2107。RPI-B蛋白的编码序列为SEQ ID NO:3238至4132。
Figure BDA00002654356500421
Figure BDA00002654356500431
Figure BDA00002654356500441
Figure BDA00002654356500451
Figure BDA00002654356500461
Figure BDA00002654356500471
Figure BDA00002654356500481
Figure BDA00002654356500491
Figure BDA00002654356500501
Figure BDA00002654356500511
Figure BDA00002654356500521
Figure BDA00002654356500531
Figure BDA00002654356500551
Figure BDA00002654356500561
Figure BDA00002654356500571
Figure BDA00002654356500591
Figure BDA00002654356500601
Figure BDA00002654356500631
Figure BDA00002654356500641
Figure BDA00002654356500651
Figure BDA00002654356500661
Figure BDA00002654356500671
Figure BDA00002654356500681
Figure BDA00002654356500691
Figure BDA00002654356500701
Figure BDA00002654356500711
Figure BDA00002654356500721
Figure BDA00002654356500731
Figure BDA00002654356500741
Figure BDA00002654356500751
Figure BDA00002654356500761
Figure BDA00002654356500771
Figure BDA00002654356500781
Figure BDA00002654356500791
Figure BDA00002654356500801
Figure BDA00002654356500811
Figure BDA00002654356500821
Figure BDA00002654356500831
Figure BDA00002654356500841
Figure BDA00002654356500861
Figure BDA00002654356500871
Figure BDA00002654356500881
Figure BDA00002654356500891
Figure BDA00002654356500901
Figure BDA00002654356500911
Figure BDA00002654356500921
Figure BDA00002654356500931
Figure BDA00002654356500941
Figure BDA00002654356500951
Figure BDA00002654356500961
Figure BDA00002654356500971
Figure BDA00002654356500981
Figure BDA00002654356500991
Figure BDA00002654356501001
Figure BDA00002654356501011
Figure BDA00002654356501021
Figure BDA00002654356501031
Figure BDA00002654356501041
Figure BDA00002654356501051
Figure BDA00002654356501061
Figure BDA00002654356501071

Claims (19)

1.重组细菌宿主细胞,包含:
a)木糖代谢途径,所述木糖代谢途径包含编码具有木糖异构酶活性的多肽的至少一种基因;
b)编码具有核糖-5-磷酸异构酶活性的多肽的至少一种基因;以及
c)至少一种基因修饰,与在缺乏所述基因修饰的宿主细胞中的核糖-5-磷酸异构酶活性相比,所述基因修饰在所述宿主细胞中提高核糖-5-磷酸异构酶活性;
其中所述细菌宿主细胞利用木糖以生产乙醇;并且
其中所述细菌宿主细胞选自发酵单胞菌属和发酵杆菌属。
2.根据权利要求1所述的重组宿主细胞,其中步骤(c)的至少一种基因修饰是编码具有核糖-5-磷酸异构酶活性的多肽的内源性基因的过表达。
3.根据权利要求1所述的重组宿主细胞,其中步骤(c)的至少一种基因修饰是编码具有核糖-5-磷酸异构酶活性的多肽的至少一种非内源性基因的表达。
4.根据权利要求1所述的重组微生物,其中所述具有核糖-5-磷酸异构酶活性的多肽具有EC分类EC 5.3.1.6。
5.根据权利要求4所述的重组宿主细胞,其中所述具有核糖-5-磷酸异构酶活性的多肽选自核糖-5-磷酸异构酶A和核糖-5-磷酸异构酶B。
6.根据权利要求5所述的重组宿主细胞,其中所述核糖-5-磷酸异构酶A多肽:
i)当使用以SEQ ID NO:83、84、85、86、87、88、89、90、91、92、93、94、95、96和97制备的剖面隐马尔可夫模型查询时得出0.1或更低的E值得分;所述查询使用hmmsearch算法进行,其中将Z参数设为10亿,并且
ii)在SEQ ID NO:97的酿酒酵母RPI-A蛋白质中,在对应于107和129的位点处分别具有天冬氨酸和谷氨酸。
7.根据权利要求5所述的重组宿主细胞,其中基于使用空位罚分=10、空位长度罚分=0.1的默认参数和Gonnet 250系列的蛋白质权重矩阵的Clustal W比对方法,所述核糖-5-磷酸异构酶A具有与选自SEQID NO:83至1212的氨基酸序列具有至少90%同一性的氨基酸序列。
8.根据权利要求7所述的重组宿主细胞,其中基于使用空位罚分=10、空位长度罚分=0.1的默认参数和Gonnet 250系列的蛋白质权重矩阵的Clustal W比对方法,所述核糖-5-磷酸异构酶A具有与选自SEQID NO:83、84、85、86、87、88、89、90、91、92、93、94、95、96和97的氨基酸序列具有至少90%同一性的氨基酸序列。
9.根据权利要求5所述的重组宿主细胞,其中所述核糖-5-磷酸异构酶B多肽:
i)当使用以SEQ ID NO:1213、1214、1215、1216和1217制备的剖面隐马尔可夫模型查询时得出0.1或更低的E值得分;所述查询使用hmmsearch算法进行,其中将Z参数设为10亿;
ii)在SEQ ID NO:1216的大肠杆菌RPI-B蛋白质中,在对应于66和68的位点处分别具有半胱氨酸和苏氨酸,或在SEQ ID NO:1213的结核分枝杆菌RPI-B蛋白质中,在对应于68和72的位点处分别具有丝氨酸和谷氨酸,并且
iii)在SEQ ID NO:1216的大肠杆菌RPI-B蛋白质中,在对应于100的位点处具有天冬酰胺、甘氨酸、天冬氨酸、丝氨酸或谷氨酸但非亮氨酸。
10.根据权利要求5所述的重组宿主细胞,其中基于使用空位罚分=10、空位长度罚分=0.1的默认参数和Gonnet 250系列的蛋白质权重矩阵的Clustal W比对方法,所述核糖-5-磷酸异构酶B具有与选自SEQID NO:1213至2107的氨基酸序列具有至少90%同一性的氨基酸序列。
11.根据权利要求10所述的重组微生物,其中基于使用空位罚分=10、空位长度罚分=0.1的默认参数和Gonnet 250系列的蛋白质权重矩阵的Clustal W比对方法,所述核糖-5-磷酸异构酶B具有与选自SEQID NO:1213、1214、1215、1216和1217的氨基酸序列具有至少90%同一性的氨基酸序列。
12.根据权利要求1所述的重组宿主细胞,其中所述微生物还包含至少一种基因修饰,与在缺乏所述基因修饰的微生物中的木糖异构酶活性相比,所述基因修饰提高木糖异构酶活性。
13.根据权利要求1所述的重组宿主细胞,其中所述编码具有木糖异构酶活性的多肽的基因是过表达的。
14.根据权利要求1所述的重组微生物,其中所述编码具有木糖异构酶活性的多肽的基因以多拷贝表达。
15.根据权利要求1所述的重组宿主细胞,其中所述具有木糖异构酶活性的多肽是蛋白质,当使用以SEQ ID NO:19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79和81制备的序型HMM查询时,所述蛋白质具有低于或等于3×10-10的E值得分并且具有四个催化位点残基:组氨酸54、天冬氨酸57、谷氨酸181和赖氨酸183,所述位点编号参考SEQ ID NO:61的白色链霉菌木糖异构酶序列。
16.根据权利要求1所述的重组宿主细胞,其中基于使用空位罚分=10、空位长度罚分=0.1的默认参数和Gonnet 250系列的蛋白质权重矩阵的Clustal W比对方法,所述木糖异构酶多肽具有与选自SEQ IDNO:19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79和81的氨基酸序列具有至少90%同一性的氨基酸序列。
17.生产乙醇的方法,包括:
a)提供权利要求1的重组细菌宿主细胞;以及
b)在包含木糖的培养基中培养(a)的细菌宿主细胞,从而将木糖转化成乙醇。
18.根据权利要求17所述的方法,其中所述核糖-5-磷酸异构酶活性是选自核糖-5-磷酸异构酶A和核糖-5-磷酸异构酶B的多肽的活性。
19.根据权利要求18所述的方法,其中所述培养基包含包括木糖的糖的混合物或木糖作为唯一的糖。
CN201180031677.6A 2010-06-29 2011-06-28 在具有提高的核糖-5-磷酸活性的重组发酵单胞菌属中的改善的木糖利用 Expired - Fee Related CN102985540B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US35944510P 2010-06-29 2010-06-29
US61/359,445 2010-06-29
PCT/US2011/042122 WO2012006061A1 (en) 2010-06-29 2011-06-28 Improved xylose utilization in recombinant zymomonas having increased ribose- 5 - phosphate activity

Publications (2)

Publication Number Publication Date
CN102985540A true CN102985540A (zh) 2013-03-20
CN102985540B CN102985540B (zh) 2016-02-03

Family

ID=44629005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180031677.6A Expired - Fee Related CN102985540B (zh) 2010-06-29 2011-06-28 在具有提高的核糖-5-磷酸活性的重组发酵单胞菌属中的改善的木糖利用

Country Status (11)

Country Link
US (1) US8679822B2 (zh)
EP (1) EP2588606B1 (zh)
CN (1) CN102985540B (zh)
AU (1) AU2011276532B2 (zh)
CA (1) CA2810198A1 (zh)
DK (1) DK2588606T3 (zh)
ES (1) ES2546669T3 (zh)
HU (1) HUE025564T2 (zh)
MY (1) MY161335A (zh)
PL (1) PL2588606T3 (zh)
WO (1) WO2012006061A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104673731A (zh) * 2013-11-28 2015-06-03 中国科学院上海生命科学研究院 一种优化丙酮丁醇梭菌木糖利用率的方法
CN105555947A (zh) * 2013-09-26 2016-05-04 纳幕尔杜邦公司 高表达发酵单胞菌启动子
WO2018023207A1 (zh) * 2016-07-30 2018-02-08 邦泰生物工程(深圳)有限公司 一种制备烟酰胺单核苷酸的方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130157332A1 (en) 2011-12-20 2013-06-20 E I Du Pont De Nemours And Company Gene inactivation allowing immediate growth on xylose medium by engineered zymomonas
US8911983B2 (en) 2011-12-20 2014-12-16 E I Du Pont De Nemours And Company Pnp gene modification for improved xylose utilization in Zymomonas
US8697426B2 (en) 2012-06-15 2014-04-15 E I Du Pont De Nemours And Company Contaminant control in Zymomonas fermentation using virginiamycin
US8759069B2 (en) 2012-06-15 2014-06-24 E I Du Pont De Nemours And Company Contaminant control in Zymomonas fermentation using hop acids
US8846357B2 (en) 2012-12-20 2014-09-30 E I Du Pont De Nemours And Company Stabilized chlorine dioxide for contamination control in Zymomonas fermentation
US20140273105A1 (en) 2013-03-12 2014-09-18 E I Du Pont De Nemours And Company Gradient pretreatment of lignocellulosic biomass
US20150087040A1 (en) 2013-09-26 2015-03-26 E I Du Pont De Nemours And Company Production of ethanol and recycle water in a cellulosic fermentation process
US20150087041A1 (en) 2013-09-26 2015-03-26 E I Du Pont De Nemours And Company Production of ethanol with reduced contaminants in a cellulosic biomass based process
US20150147786A1 (en) 2013-11-24 2015-05-28 E I Du Pont De Nemours And Company High force and high stress destructuring for starch biomass processing
US9371546B2 (en) 2014-06-24 2016-06-21 E I Du Pont De Nemours And Company Enhancing D-xylose and L-arabinose utilization in Zymomonas cells
MX2018000502A (es) 2015-07-13 2018-09-07 Mara Renewables Corp Mejora del metabolismo de microalga de xilosa.
KR102069301B1 (ko) 2015-12-21 2020-01-22 주식회사 삼양사 과당으로부터 알로오스를 생산하는 균주 및 이를 이용한 알로오스 생산방법
WO2018106656A1 (en) 2016-12-06 2018-06-14 Danisco Us Inc Truncated lpmo enzymes and use thereof
RU2766710C2 (ru) 2017-03-13 2022-03-15 Бонамоуз, Инк. Ферментативное получение гексоз
WO2019074828A1 (en) 2017-10-09 2019-04-18 Danisco Us Inc CELLOBIOSE DEHYDROGENASE VARIANTS AND METHODS OF USE
US20220042120A1 (en) * 2018-12-12 2022-02-10 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Integrated proviral sequencing assay

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090246876A1 (en) * 2008-03-27 2009-10-01 E. I. Du Pont De Nemours And Company High expression zymomonas promoters
WO2009120731A2 (en) * 2008-03-27 2009-10-01 E. I. Du Pont De Nemours And Company Zymomonas with improved xylose utilization

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5843760A (en) 1994-04-15 1998-12-01 Midwest Research Institute Single zymomonas mobilis strain for xylose and arabinose fermentation
US5712133A (en) 1994-04-15 1998-01-27 Midwest Research Institute Pentose fermentation by recombinant zymomonas
WO1995028476A1 (en) 1994-04-15 1995-10-26 Midwest Research Institute Recombinant zymomonas for pentose fermentation
US5514583A (en) 1994-04-15 1996-05-07 Midwest Research Institute Recombinant zymomonas for pentose fermentation
US7223575B2 (en) 2000-05-01 2007-05-29 Midwest Research Institute Zymomonas pentose-sugar fermenting strains and uses thereof
US6566107B1 (en) 2000-11-01 2003-05-20 Midwest Research Institute Recombinant Zymomonas mobilis with improved xylose utilization
CA2573483C (en) * 2004-07-16 2014-10-28 Technische Universiteit Delft Metabolic engineering of xylose-fermenting eukaryotic cells
US7741084B2 (en) 2006-09-28 2010-06-22 E. I. Du Pont De Nemours And Company Ethanol production using xylitol synthesis mutant of xylose-utilizing zymomonas
US7629156B2 (en) 2006-09-28 2009-12-08 E.I. Du Pont De Nemours And Company Ethanol production in fermentation of mixed sugars containing xylose
US7741119B2 (en) 2006-09-28 2010-06-22 E. I. Du Pont De Nemours And Company Xylitol synthesis mutant of xylose-utilizing zymomonas for ethanol production
AU2008318720B2 (en) 2007-10-30 2013-09-26 Alliance For Sustainable Energy, Llc Process for the production of ethanol from a medium comprising xylose, employing a recombinant zymomonas strain having a reduced himA expression
EP2209899B1 (en) 2007-10-30 2012-04-18 E. I. du Pont de Nemours and Company Zymomonas with improved ethanol production in medium containing concentrated sugars and acetate
US8247208B2 (en) 2008-12-22 2012-08-21 Alliance For Sustainable Energy Llc Zymomonas with improved xylose utilization in stress conditions
US20110143408A1 (en) 2009-06-18 2011-06-16 E. I. Du Pont De Nemours And Company Zymomonas with improved arabinose utilization

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090246876A1 (en) * 2008-03-27 2009-10-01 E. I. Du Pont De Nemours And Company High expression zymomonas promoters
WO2009120731A2 (en) * 2008-03-27 2009-10-01 E. I. Du Pont De Nemours And Company Zymomonas with improved xylose utilization

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KAISA KARHUMAA等: "Investigation of limiting metabolic steps in the utilization of xylose by recombinant Saccharomycescerevisiae using metabolic engineering", 《YEAST》 *
SIGRUN D. FELDMANN等: "Pentose metabolism in Zymomonas mobilis wild-type and recombinant strains", 《APPLIED MICROBIOLOGY BIOTECHNOLOGY》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105555947A (zh) * 2013-09-26 2016-05-04 纳幕尔杜邦公司 高表达发酵单胞菌启动子
CN104673731A (zh) * 2013-11-28 2015-06-03 中国科学院上海生命科学研究院 一种优化丙酮丁醇梭菌木糖利用率的方法
WO2018023207A1 (zh) * 2016-07-30 2018-02-08 邦泰生物工程(深圳)有限公司 一种制备烟酰胺单核苷酸的方法
CN107889504A (zh) * 2016-07-30 2018-04-06 邦泰生物工程(深圳)有限公司 一种制备烟酰胺单核苷酸的方法
CN107889504B (zh) * 2016-07-30 2021-07-27 邦泰生物工程(深圳)有限公司 一种制备烟酰胺单核苷酸的方法

Also Published As

Publication number Publication date
AU2011276532A1 (en) 2013-02-21
CN102985540B (zh) 2016-02-03
MY161335A (en) 2017-04-14
ES2546669T3 (es) 2015-09-25
HUE025564T2 (en) 2016-03-29
EP2588606B1 (en) 2015-06-17
PL2588606T3 (pl) 2015-11-30
WO2012006061A1 (en) 2012-01-12
US20120156746A1 (en) 2012-06-21
CA2810198A1 (en) 2012-01-12
US8679822B2 (en) 2014-03-25
EP2588606A1 (en) 2013-05-08
AU2011276532B2 (en) 2013-10-10
DK2588606T3 (en) 2015-08-31

Similar Documents

Publication Publication Date Title
CN102985540B (zh) 在具有提高的核糖-5-磷酸活性的重组发酵单胞菌属中的改善的木糖利用
CN103003423B (zh) 在具有另外木糖异构酶活性的重组发酵单胞菌属中改善的木糖利用
CN101883861B (zh) 利用hima表达减少的重组发酵单胞菌属菌株从包含木糖的培养基生产乙醇的方法
CN101970671B (zh) 在包含浓缩糖和乙酸盐的培养基中具有改进的乙醇产量的发酵单胞菌属
CN103261400A (zh) 在生物质水解产物培养基中具有改善的乙醇生产的利用木糖的运动发酵单胞菌
CN102459570A (zh) 具有改善的***糖利用率的发酵单胞菌属细菌
JP2011529345A (ja) 微生物における産物の生産を向上させるための方法および組成物
CN102037120A (zh) 具有改善的木糖利用率的发酵单胞菌属
US20100105114A1 (en) Methods and Compositions for Regulating Sporulation
CN102186973A (zh) 细菌的[2Fe-2S]二羟酸脱水酶的鉴定和用途
WO2010014631A2 (en) Methods and compositions for improving the production of products in microorganisms
CN103476927A (zh) 发酵单胞菌中的泛酸生物合成
Sveinsdóttir et al. Ethanol production from monosugars and lignocellulosic biomass by thermophilic bacteria isolated from Icelandic hot springs
CN105026559A (zh) 酵母细胞中的牛瘤胃木糖异构酶活性
CN101889078A (zh) 能够同时发酵葡萄糖、甘露糖和木糖的细菌和使用该细菌生产生物乙醇的方法
CN103998607B (zh) 用于改善发酵单胞菌属(Zymomonas)中的木糖利用率的PNP基因修饰
CN104220590A (zh) 使得工程化的发酵单胞菌在木糖培养基上立即生长的基因失活
CN106459891A (zh) 增强发酵单胞菌细胞中d‑木糖和l‑***糖的利用
US20120045821A1 (en) Methods and compositions for genetic engineering of cyanobacteria to produce ethanol
Verbeke Diversity within the genus Thermoanaerobacter and its potential implications in lignocellulosic biofuel production through consolidated bioprocessing
Stoian et al. STUDIES CONCERNING ETHANOL PRODUCTION FROM SWEET SORGHUM EXTRACT USING A Z. MOBILIS HIGH PRODUCTIVE MUTANT STRAIN
Lal et al. Bioethanol: a status review on metabolic pathway modification of certain ethanologenic bacteria through genetic engineering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160203