CN103003423B - 在具有另外木糖异构酶活性的重组发酵单胞菌属中改善的木糖利用 - Google Patents

在具有另外木糖异构酶活性的重组发酵单胞菌属中改善的木糖利用 Download PDF

Info

Publication number
CN103003423B
CN103003423B CN201180032513.5A CN201180032513A CN103003423B CN 103003423 B CN103003423 B CN 103003423B CN 201180032513 A CN201180032513 A CN 201180032513A CN 103003423 B CN103003423 B CN 103003423B
Authority
CN
China
Prior art keywords
sequence
group
bacterial strain
xylose
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180032513.5A
Other languages
English (en)
Other versions
CN103003423A (zh
Inventor
R.Y.卡塞
M.齐
L.陶
P.V.维塔宁
J.杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN103003423A publication Critical patent/CN103003423A/zh
Application granted granted Critical
Publication of CN103003423B publication Critical patent/CN103003423B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • C12N9/92Glucose isomerase (5.3.1.5; 5.3.1.9; 5.3.1.18)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/065Ethanol, i.e. non-beverage with microorganisms other than yeasts
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

据发现,表达来自密苏里游动放线菌的木糖异构酶的发酵单孢菌属在生长于包含木糖的培养基时具有改善的木糖利用、生长和乙醇生产。通过分子***发生分析和序型隐蔽马尔科夫模型分析在结构上鉴定了与密苏里游动放线菌的木糖异构酶相关的木糖异构酶,从而提供了可用于改善木糖利用的木糖异构酶。

Description

在具有另外木糖异构酶活性的重组发酵单胞菌属中改善的木 糖利用
本申请要求2010年6月29日提交的美国临时申请61/359463的权益,并且其全文以引用的方式并入。
政府权利声明
本发明由美国政府支持通过能源部(the Department of Energy)授予的合同No.DE-FC36-07GO17056而完成。美国政府拥有本发明的必然权利。
发明领域
本发明涉及微生物学和基因工程领域。更具体地,鉴定了在发酵单胞菌属(Zymomonas)中具有高活性木糖异构酶,其提供了改善的木糖利用和乙醇生产。
发明背景
通过微生物生产乙醇提供了一种替代化石燃料的可供选择的能源,因此成为当前研究的重要领域。理想的情况是,产生乙醇以及其它有用产物的微生物能够利用木糖作为碳源,这是因为木糖是水解的木质纤维素生物质中的主要戊糖。生物质可提供丰富可用的低成本碳底物。已经对在天然情况下并不利用木糖的运动发酵单胞菌(Zymomonasmobilis)和其它细菌乙醇菌原进行基因工程改造以用于木糖利用,其通过导入编码如下的基因:1)木糖异构酶,其催化木糖向木酮糖的转化;2)木酮糖激酶,它将木酮糖磷酸化以形成5-磷酸木酮糖;3)转酮醇酶;以及4)转醛醇酶。所使用的编码区一般来自大肠杆菌(E.coli)基因。
对运动发酵单胞菌菌株进行木糖代谢的工程改造(US 5514583,US5712133,US6566107,WO 95/28476,Feldmann等人(1992)Appl.Microbiol.Biotechnol.,38:354-361,Zhang等人(1995)Science 267:240-243),以及对棕榈发酵杆菌(Zymobacter palmae)菌株的工程改造(Yanase等人(2007)Appl.Environ.Mirobiol.73:2592-2599)已经获得成功。然而,工程化的菌株通常不像在葡萄糖上那样在木糖上生长并且产生乙醇。已经通过在木糖培养基上进行的连续传代而驯化了针对木糖利用进行工程改造的菌株,其产生了具有改善的木糖利用的菌株,如美国专利7,223,575和美国专利7,741,119中所描述。在共同拥有并共同待决的美国专利申请公开US 20090246846A1中公开了通过以来自突变的高活性运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子(Pgap)进行的大肠杆菌木糖异构酶表达而改善木糖利用的工程改造。
依然需要对于在木糖利用中具有进一步改善的发酵单胞菌属菌株和其它细菌乙醇菌原。
发明概述
本发明提供了表达高活性木糖异构酶的重组木糖利用型发酵单胞菌属或发酵杆菌属(Zymobacter)细胞,其提供了改善的木糖利用和乙醇生产。
因此,本发明提供了选自发酵单胞菌属和发酵杆菌属的重组细菌菌株,其包含编码具有木糖异构酶活性的多肽的异源核酸分子,其中所述多肽是组I木糖异构酶且被包括在标识为EC 5.3.1.5的酶的分类中,并且所述菌株利用木糖作为碳源。
可用于本发明的木糖异构酶是当使用利用SEQ ID NO:2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137和142准备的序型隐蔽马尔科夫模型(Profile Hidden MarkovModel)查询时,给出1E-15或更低的E值得分的酶;所述查询使用hmmsearch算法进行,其中Z参数设定为10亿。或是基于使用GAPPENALTY=10、GAP LENGTHPENALTY=0.1、以及Gonnet 250系列的蛋白质权重矩阵的默认参数的Clustal W比对方法,与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146和147的氨基酸序列具有至少90%的同一性的酶。或当与SEQ ID NO:66的参照氨基酸序列比较时具有以下保守氨基酸或以下保守氨基酸的90%的酶:
a)在位置226处的亮氨酸,
b)在位置223处的甲硫氨酸,
c)在位置191处的异亮氨酸,
d)在位置195处的苏氨酸、丝氨酸或缬氨酸,
e)在位置88处的甲硫氨酸、苏氨酸或quanine
f)在位置290处的组氨酸,
g)在位置221处的谷氨酸或天冬氨酸,
h)在位置242处的苯丙氨酸、缬氨酸或亮氨酸,
i)在位置243处的组氨酸,
j)在位置193处的亮氨酸、苯丙氨酸或甲硫氨酸,
k)在位置256处的谷氨酰胺,
l)在位置213处的甘氨酸,
m)在位置288处的脯氨酸、酪氨酸、丙氨酸或丝氨酸,和
n)在位置249处的谷氨酰胺。
在另一个实施方案中,本发明提供了改善重组细菌细胞中木糖利用的方法,其包括:
a)提供选自发酵单胞菌属和发酵杆菌属的重组细菌菌株,所述重组细菌菌株包含木糖利用途径,包含不属于组I的木糖异构酶;以及
b)导入编码具有木糖异构酶活性的多肽的异源核酸分子,其中所述多肽是组I木糖异构酶。
或者,本发明提供了生产乙醇的方法,其包括:
a)提供本发明的重组细菌菌株;以及
b)在所述菌株生产乙醇的条件下,使(a)的菌株与木糖接触。
附图说明和序列描述
图1示出了进行木糖利用工程改造的发酵单胞菌属的乙醇发酵途径的示意图。
图2是木糖异构酶的***发育树的示意图,其显示了组I和组II分支。
图3是组I木糖异构酶的***发育树的示意图。
图4是ZW641对照菌株和使用具有表达来自密苏里游动放线菌(A.missourinesis)(355-1、355-2)、短乳杆菌(L.brevis)(356-1、356-2)或大肠杆菌(357-1、357-2)的木糖异构酶的密码子优化编码区的基因进行转化的ZW641菌株的生长曲线图。
图5是ZW641对照菌株和使用具有表达来自密苏里游动放线菌(355-1)、短乳杆菌(356-2)或大肠杆菌(357-2)的木糖异构酶的密码子优化编码区的基因进行转化的ZW641菌株的木糖异构酶活性图,其通过半胱氨酸-咔唑法进行测量。
图6是ZW641对照菌株和使用具有表达来自密苏里游动放线菌(AMxylA)、大肠杆菌(ECxylA)、昏暗地嗜皮菌(Geodermatophilusobscurus)(GOxylA)、耻垢分枝杆菌(Mycobacterium smegmatis)(MSxylA)、Salinispora arenicola(SAxylA)或Xylanimonascellulosilytica(XCxylA)的木糖异构酶的密码子优化编码区的基因进行转化的ZW641菌株的生长曲线图。
图7是ZW641对照菌株和使用具有表达来自密苏里游动放线菌(AMxylA)、大肠杆菌(ECxylA)、昏暗地嗜皮菌(GOxylA)、耻垢分枝杆菌(MSxylA)、Salinispora arenicola(SAxylA)或Xylanimonascellulosilytica(XCxylA)的木糖异构酶的密码子优化编码区的基因进行转化的ZW641菌株的木糖异构酶活性图,其通过半胱氨酸-咔唑法进行测量。
表1是木糖异构酶组I蛋白的序型HMM表。表1是在此以电子版形式提交的,并且以引用方式并入本文。
表2是XI蛋白的E值得分表,各蛋白由SEQ ID NO标明,所述E值得分使用所述组I序型HMM进行查询。表2是在此以电子版形式提交的,并且以引用方式并入本文。
根据下面的详细描述和附带的序列描述可以更充分地理解本发明,下面的详细描述和所附的序列描述形成了本申请的一部分。
下列序列符合37 C.F.R.1.821-1.825(“对含有核酸序列和/或氨基酸序列公开的专利申请的要求-序列规则”),并且与世界知识产权组织(WIPO)标准ST.25(1998)以及EPO和PCT的序列列表要求(规则5.2和49.5(a-bis规则),以及行政指导的208节和附录C)相一致。核苷酸的符号和格式以及氨基酸序列数据符合如37 C.F.R.§1.822所示的规则。
表3:组I木糖异构酶的编码区和蛋白质的SEQ ID NO。对种子蛋白质给出Uniprot 获取号(AC)并且对并非种子的蛋白质给出NCBI GI编号
*序列未获得
表4:组II种子木糖异构酶蛋白的SEQ ID NO。对种子蛋白质给出Uniprot获取号 (AC)
SEQ ID NO:307是LoxPw-aadA-LoxPw DNA片段PCR产物的核苷酸序列。
SEQ ID NO:308是密苏里游动放线菌木糖异构酶的编码区,其针对发酵单胞菌属进行了密码子优化。
SEQ ID NO:309是短乳杆菌木糖异构酶的编码区,其针对发酵单胞菌属进行了密码子优化。
SEQ ID NO:310是大肠杆菌木糖异构酶的编码区,其针对发酵单胞菌属进行了密码子优化。
SEQ ID NO:311是来自运动发酵单胞菌的甘油醛-3-磷酸脱氢酶基因启动子(ZmPgap)的核苷酸序列。
SEQ ID NO:312是运动发酵单胞菌L-核酮糖-5-磷酸4-差向异构酶基因的终止子的核苷酸序列。
SEQ ID NO:313是pARA354质粒的核苷酸序列。
SEQ ID NO:314-327、329、330和332-334是PCR和测序引物的核苷酸序列。
SEQ ID NO:328是LDH-L DNA片段PCR产物的核苷酸序列。
SEQ ID NO:331是LDH-R DNA片段PCR产物的核苷酸序列。
SEQ ID NO:335是昏暗地嗜皮菌木糖异构酶的密码子优化编码区的核苷酸序列。
SEQ ID NO:336是耻垢分枝杆菌木糖异构酶的密码子优化编码区的核苷酸序列。
SEQ ID NO:337是Salinispora arenicola木糖异构酶的密码子优化编码区的核苷酸序列。
SEQ ID NO:338是Xylanimonas cellulosilytica木糖异构酶的密码子优化编码区的核苷酸序列。
SEQ ID NO:339是嵌合基因构建中使用的启动子PgapS的核苷酸序列。
SEQ ID NO:340-345是PCR和测序引物的核苷酸序列。
发明详述
本文公开了木糖异构酶,其在发酵单胞菌属中具有高度活性并且可用于提高木糖利用和乙醇生产。乙醇是用于取代化石燃料的重要化合物。
可使用下列定义阐释权利要求和说明书:
如本文所用,术语“包含”、“由组成”、“包括”、“涵盖”、“具有”、“含有”、“包容”或“容纳”或其任何其它变型旨在包括非排它的包含物。例如,包含一系列元素的组合物、混合物、工艺、方法、制品或设备不必仅限于那些元素,而可以包括其他未明确列出的元素,或此类组合物、混合物、工艺、方法、制品或设备固有的元素。此外,除非有相反的明确说明,“或”是指包含性的“或”,而不是指排他性的“或”。例如,以下任何一个均表示满足条件A或B:A是真的(或存在的)且B是假的(或不存在的)、A是假的(或不存在的)且B是真的(或存在的)、以及A和B都是真的(或存在的)。
同样,涉及元素或组分例证(即出现)次数的位于本发明元素或组分前的不定冠词“一个”或“一种”旨在是非限制性的。因此,应将“一个”或“一种”理解为包括一个或至少一个,并且元素或组分的词语单数形式也包括复数形式,除非有数字明显表示单数。
如本文所用,术语“发明”或“本发明”是非限制性术语,并且不旨在意指本发明的任何单独实施方案,而是涵盖如本说明书和权利要求所述的所有可能的实施方案。
如本文所用,修饰本发明的成分或反应物的量使用的术语“约”是指可以通过例如以下方式而发生的用数字表示的量的变化:在真实世界中用于制备浓缩物或使用溶液的一般测量和液体处理操作;通过这些操作中非故意的误差;通过用于制备组合物或执行方法的成分的制造、来源或纯度中的差异;等。术语“约”还包括由于相对于由特定起始混合物所得组合物的不同平衡条件而不同的量。无论是否通过术语“约”来修饰,权利要求包括量的等同量。在一个实施方案中,术语“约”指在报告数值10%范围内,优选地在报告数值5%范围内。
术语“碳底物”或“可发酵碳底物”指能够被本发明的宿主生物体代谢的碳源,并且特别是选自以下的碳源:单糖、低聚糖和多糖。
“基因”指的是表达特定蛋白质的核酸片段或功能性RNA分子,其可任选地包括在编码序列之前的调控序列(5′非编码序列)或之后的调控序列(3′非编码序列)。“天然基因”或“野生型基因”指具有其自身调控序列的天然存在的基因。“嵌合基因”指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列。因此,嵌合基因可包含源自不同来源的调控序列和编码序列,或者源自相同来源、但排列方式与天然存在的排列方式不同的调控序列和编码序列。“内源性基因”指位于生物的基因组内它的天然位置的天然基因。“外来基因”指正常情况下不存在于宿主生物中的基因,它通过基因转移导入宿主生物。外来基因可以包含***到非天然生物体内的天然基因或嵌合基因。
术语“基因构建体”指的是编码一种或多种特定蛋白质或功能性RNA分子的核酸片段。在基因构建体中基因可以是天然的、嵌合的、或外来的。基因构建体一般应包含“编码序列”。“编码序列”指的是编码特定氨基酸序列的DNA序列。
“启动子”或“启动控制区”指能够控制编码序列或功能RNA的表达的DNA序列。一般来讲,编码序列位于启动子序列的3′端。启动子可整个源于天然基因,或者由源于天然存在的不同启动子的不同元件构成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。通常将在大多数细胞类型中、在大多数情况下引起基因表达的启动子称为“组成型启动子”。
如本文所用,术语“表达”指的是来自基因的编码RNA(mRNA)或功能性RNA的转录和稳定积累。表达还可指mRNA翻译成为多肽。“过表达”指的是基因产物在转基因生物中的产生,其超过了正常或非转化生物中的产生水平。
如本文所用,术语“转化”指将核酸片段转移至宿主生物体内,导致在基因上稳定遗传。转化的核酸可以是宿主细胞中保留的质粒形式,或者一些转化的核酸可以被整合进宿主细胞基因组中。含有转化核酸片段的宿主生物被称为“转基因”或“重组”或“转化”生物体。
如本文所用,术语“质粒”和“载体”是指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件,并且常常是环状双链DNA分子的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组进入一种独特构建体中,该独特构建体能够将所选基因产物的启动子片段和DNA序列与相应的3′末端非翻译序列一起导入细胞中。
术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列可操作地连接。编码序列可以按有义或反义的取向可操作地连接至调控序列。
术语“选择性标记”指一种鉴定因子,通常是抗生素或化学药品抗性基因,该因子能基于标记基因的效应,即,对抗生素的抗性进行选择,其中所述效应用于追踪遗传的受关注核酸和/或用于鉴定遗传了受关注核酸的细胞或生物。
如本文所用,术语“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的基因密码的性质。技术人员非常了解具体宿主细胞在使用核苷酸密码子来确定给定氨基酸时所表现出的“密码子偏倚性”。因此,当合成基因用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该宿主细胞优选的密码子使用频率。
术语“经密码子优化的”在其涉及用于转化不同宿主的核酸分子的基因或编码区时是指在不改变由DNA编码的多肽的情况下,改变核酸分子的基因或编码区中的密码子以反映宿主生物体通常的密码子使用。
术语“可发酵糖”指在发酵过程中能被微生物用作碳源的低聚糖和单糖。
术语“木质纤维质”指包含木质素和纤维素的组合物。木质纤维质材料也可包含半纤维素。
术语“纤维质”指包含纤维素和包括半纤维素在内的附加组分的组合物。
术语“糖化”指由多糖生产可发酵糖。
术语“预处理的生物质”指的是在糖化前经热、物理和/或化学预处理的生物质,所述预处理用以提高所述生物质中多糖的可利用性。
“生物质”指任何纤维质的或木质纤维质的材料并包括包含纤维素的,并且任选地还包含半纤维素、木质素、淀粉、低聚糖和/或单糖的材料。生物质也可包含附加组分如蛋白质和/或脂质。生物质可来源于单一来源,或者生物质可包括来源于一种以上来源的混合物;例如,生物质可包括玉米棒和玉米秸秆的混合物,或草和叶片的混合物。生物质包括但不限于生物能作物、农业残余物、市政固体垃圾、工业固体垃圾、来自造纸业的淤渣、庭院垃圾、木材和林业垃圾。生物质的实例包括但不限于玉米棒、作物残余物如玉米壳、玉米秸秆、草、小麦、小麦秸秆、大麦秸秆、干草、稻秆、柳枝稷、废纸、甘蔗渣、高粱,从谷物的研磨中获得的组分、树、枝、根、叶、木片、木屑、灌木和灌丛、蔬菜、水果、花和动物粪肥。
“生物质水解产物”指来源于生物质糖化的产物。生物质也可在糖化前进行预处理或预加工。
术语“木糖异构酶”指的是催化D-木糖和D-木酮糖相互转换的酶。木糖异构酶(XI)属于归类为EC 5.3.1.5的酶类群体。
如生物信息学领域所知,术语“E值”是“期望值(Expect-value)”,其提供了匹配随机发生的概率。这提供了对序列匹配的统计显著性。所述E值越低,则该命中更有意义。
属于“组I木糖异构酶”在本文是指属于组I的木糖木糖异构酶蛋白,其根据至少一种以下标准而定义:a)其属于包括所述密苏里游动放线菌XI在内的50%阈值序列同一性分组,其使用实施例4中的分子***发生生物信息学分析而准备;b)其基本上匹配特异性决定位置(SDP)中的组I的氨基酸,所述特异性决定位置使用对所述组I和组II的XI组的GroupSim分析而鉴定,所述XI组通过在实施例4中的表6给出的分子***发生分析而测定;和/或c)当使用以SEQ ID NO:2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137和142准备的序型隐蔽马尔科夫模型查询时,其给出1E-15或更低的E值得分;如实施例4,所述查询使用hmmsearch算法进行,其中Z参数设定为10亿。据了解尽管“1型”木糖利用是已知的并且在文献中进行了定义,本文提供的定义比所述文献定义更为准确并且其为指出了以下讨论的定语。因此,如本文所用,“组I”应指的是本申请者的定义,而“组II”应指的是本领域中所共识的定义。
术语“异源”指非天然存在于受关注的位置。例如,异源基因指的是在天然情况下未见于所述宿主生物中的基因,但其通过基因转移导入所述宿主生物。此外,存在于嵌合基因中的异源核酸分子是天然情况下未发现关联于所述嵌合基因中的其它片段的核酸分子,从而使所述核酸分子具有天然情况下互相并不关联的编码区和启动子片段。
如本文所用,“分离的核酸分子”是RNA或DNA的聚合物,它是单链或双链的,任选地包含合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的分离型核酸分子可由cDNA、基因组DNA或合成DNA的一个或多个片段构成。
当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核酸片段时,核酸片段“可杂交”至另一核酸片段,例如cDNA、基因组DNA或RNA分子。杂交和洗涤条件是为人熟知的,并且在Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory:Cold SpringHarbor,NY(1989)中进行了例示,尤其是在该文献第11章和表11.1(全文以引用方式并入本文)中进行了例示。温度和离子强度条件决定了杂交的“严格度”。可以调节严格条件以筛选中度相似的片段(例如来自远缘生物的同源序列),到筛选高度相似的片段(例如从近缘生物复制功能性酶的基因)。杂交后的洗涤确定严格性条件。一组优选的条件使用一系列洗涤步骤,开始是6×SSC、0.5%SDS在室温下洗涤15分钟,然后用2×SSC、0.5%SDS在45℃下重复30分钟,再用0.2×SSC、0.5%SDS在50℃下重复洗涤两次,每次30分钟。更优选的一组严格性条件采用更高的温度,其中洗涤与上述洗涤相同,不同的是最后两次在0.2×SSC、0.5%SDS中洗涤30分钟时的温度被增加到60℃。另一组优选的高严格条件是最后两次洗涤是在65℃下用0.1×SSC,0.1%SDS进行。例如,另一组严格条件包括在0.1×SSC,0.1%SDS中于65℃下杂交并用2×SSC,0.1%SDS洗涤,随后用0.1×SSC,0.1%SDS洗涤。
杂交需要两种核酸含有互补序列,但是取决于杂交的严格度,碱基之间可能会发生错配。用于使核酸杂交的合适的严格度取决于核酸的长度和互补的程度,它们是本领域内熟知的变量。两条核苷酸序列之间的相似性或同源性程度越高,具有那些序列的核酸的杂交体的Tm值就越大。核酸杂交的相对稳定性(对应较高的Tm)按下列顺序依次降低:RNA:RNA、DNA:RNA、DNA:DNA。就长度大于100个核苷酸的杂交体而言,已经获得了计算Tm的方程式(参见Sambrook等人,同上,9.50-9.51)。对于较短核酸(即寡核苷酸)的杂交,错配的位置变得更重要,而且寡核苷酸的长度决定了其特异性(参见Sambrook等人,同上,11.7-11.8)。在一个实施方案中,可杂交核酸的长度为至少约10个核苷酸。优选地,可杂交核酸的最小长度为至少约15个核苷酸;更优选至少约20个核苷酸;最优选长度为至少约30个核苷酸。此外,技术人员应认识到,必要时可根据诸如探针长度之类的因素来调节温度和洗涤溶液的盐浓度。
术语“互补的”用于描述核苷酸碱基之间能够彼此杂交的关系。例如,对于DNA,腺嘌呤与胸腺嘧啶互补,而胞嘧啶与鸟嘌呤互补。
术语“同源性”或“同源”本文互换使用。它们指这样的核酸片段,即其中一个或多个核苷酸碱基改变并不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰(例如缺失或***一个或多个核苷酸),相对于初始的未经修饰的核酸片段,该修饰基本上不会改变所得核酸片段的功能特性。因此,正如本领域的技术人员应当理解的,本发明涵盖的不仅仅是具体的示例性序列。
此外,技术人员认识到,本发明所涵盖的同源核苷酸序列也由它们在中等严格条件(如0.5×SSC,0.1%SDS,60℃)下,与本文所示例的序列杂交的能力,或杂交至本发明核苷酸序列的任何部分以及杂交至与本文所公开的任何核苷酸序列功能相当的序列的能力所限定。
如本领域已知的,术语“%同一性”是两条或更多条多肽序列之间或两条或更多条多核苷酸序列之间的关系,该关系通过对序列进行比较确定。在本领域中,“同一性”还表示多肽或多核苷酸序列之间序列关联的程度,根据具体情况,它由这些序列的序列串之间的匹配程度确定。“同一性”和“相似性”可容易地通过已知方法计算出来,所述的方法包括但不限于以下文献中所述:1.)Computational Molecular Biology(Lesk,A.M.编辑)OxfordUniversity:NY(1988);2.)Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic:NY(1993);3.)Computer Analysis of SequenceData,第I部 (Griffin,A.M.和Griffin,H.G.编辑)Humania:NJ(1994);4.)Sequence Analysis in Molecular Biology(von Heinje,G.编辑),Academic(1987);以及5.)Sequence Analysis Primer(Gribskov,M.和Devereux,J.编辑)Stockton:NY(1991)。
设定确定同一性的优选方法来用于给出待测试序列之间的最佳匹配。确定同一性和相似性的方法在可公开获得的计算机程序中编成了代码。序列比对和%同一性计算可以用LASERGENE生物信息学计算软件包(LASERGENE bioinformatics computing suite(DNASTAR Inc.,Madison,WI))中的MegAlignTM程序进行。
序列的多重比对使用“Clustal比对方法”进行,该方法涵盖若干个不同的算法,包括对应于称为Clustal V比对方法的“Clustal V比对方法”,该方法描述于Higgins和Sharp,(CABIOS.5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.,8:189-191(1992))中,并且可以在LASERGENE生物信息学计算软件包(DNASTAR Inc.)中的MegAlignTM程序中找到的比对方法。对于多重比对,默认值对应于GAP PENALTY=10和GAPLENGTHPENALTY=10。用Clustal方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、GAP PENALTY=3、WINDOW=5和DIAGONALS SAVED=5。对于核酸,这些参数为KTUPLE=2,GAPPENALTY=5,WINDOW=4和DIAGONALS SAVED=4。在用Clustal V程序进行序列比对后,有可能通过观察相同程序中的“序列距离”表来获得“%同一性”。
此外,也可以使用“Clustal W比对方法”,该方法相当于称为ClustalW(在Higgins和Sharp,CABIOS;5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.8:189-191(1992)中有所描述)和可以在LASERGENE生物信息学计算软件包(DNASTAR Inc.)中的MegAlignTM v6.1程序中找到的比对方法。用于多重比对的默认参数(GAP PENALTY=10、GAPLENGTHPENALTY=0.2、Delay Divergen Seqs(%)=30、DNA Transition Weight=0.5、Protein Weight Matrix=Gonnet系列和DNA Weight Matrix=IUB)。在使用Clustal W程序对序列进行比对之后,可通过查看同一程序中的“序列距离”表来获得“%同一性”。
本领域的技术人员非常清楚,多种程度的序列同一性可用于从其它物种中鉴定多肽,其中这类多肽具有相同或相似的功能或活性。有用的同一性百分比例子包括但不限于:50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或可用于描述本发明的介于50%与100%之间的任何整数百分值,诸如50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。合适的核酸片段不但具有上述同源性,而且通常编码具有至少50个氨基酸,优选至少100个氨基酸,更优选至少150个氨基酸,更优选至少200个氨基酸,最优选至少250个氨基酸的多肽。
术语“序列分析软件”指可用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可商购获得或独立开发。典型的序列分析软件包括但不限于:1.)GCG程序套件(Wisconsin Package Version 9.0,Genetics Computer Group(GCG),Madison,WI);2.)BLASTP,BLASTN,BLASTX(Altschul等人,J.Mol.Biol.,215:403-410(1990));3.)DNASTAR(DNASTAR,Inc.Madison,WI);4.)Sequencher(GeneCodesCorporation,Ann Arbor,MI);以及5.)并入了Smith-Waterman算法的FASTA程序(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date1992,111-20.编辑:Suhai,Sandor.Plenum:NewYork,NY)。在本专利申请的上下文中应当理解,使用序列分析软件进行分析时,分析结果将基于所参照程序的“默认值”,除非另外指明。在此所用的“默认值”将指在首次初始化软件时软件最初加载的任何值或参数集。
本文使用的标准重组DNA和分子克隆技术在本领域中是为人熟知的,并且描述于Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:ALaboratory Manual,第2版;Cold Spring Harbor Laboratory:Cold SpringHarbor,New York,1989(下文称为“Maniatis”);以及Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.Experiments with GeneFusions;Cold SpringHarbor Laboratory:Cold Spring Harbor,New York,1984;以及Ausubel,F.M.等人,In Current Protocols in Molecular Biology,Greene PublishingandWiley-Interscience出版,1987。
本发明涉及木糖利用型发酵单胞菌属或发酵杆菌属的工程改造菌株,所述菌株在包含木糖的培养基中发酵时具有改善的木糖利用。改善通过生物催化剂在包含生物质水解物的培养基中发酵而进行的乙醇生产进行的一个难题在于获得最佳的木糖利用,所述生物质水解物一般通过对生物质的预处理和糖化产生。木糖是水解的木质纤维素物质中的主要戊糖之一,另一种为***糖。申请人已经鉴定出了木糖异构酶类型,当发酵在包含木糖的培养基中进行时,所述木糖异构酶类型在表达于木糖利用型发酵单胞菌属菌株中时在木糖利用中提供了提高的效率和更高的乙醇产量。
高效木糖异构酶的发现
催化木糖向木酮糖转换的木糖异构酶(XI)是在表达于细菌细胞时提供利用木糖作为碳源的能力的四种酶之一。如图1所示,XI与木酮糖激酶、转酮醇酶和转醛醇酶在一起提供了始自木糖的途径,所述途径产生了果糖-6-P和甘油醛-3-P,其补充进入了乙醇的生物合成。作为所述木糖利用途径的第一个酶,木糖异构酶活性在提供将木糖最终转化成为乙醇的能力中尤为重要。申请人已经鉴定出了木糖异构酶,与一般使用的大肠杆菌XI相比所述木糖异构酶在表达于所述乙醇生产细菌发酵单胞菌属中表达时具有更高的活性并且支持了增强的木糖利用和乙醇生产。
来自大肠杆菌的木糖异构酶已经用于针对木糖利用而工程改造发酵单胞菌属。木糖异构酶根据其大小、氨基酸序列相似性和二价阳离子优选性(Park和Batt(2004)Appliedand Environmental Microbiology 70:4318-4325)而归类为两种类型。所述大肠杆菌XI属于组II。
申请人已经发现,属于组I的XI(如本文所定义)针对在木糖利用型发酵单胞菌属中的木糖利用和乙醇生产提供了增强的特性。根据下文所描述,本文发现所述密苏里游动放线菌XI属于组I的XI。当使用密码子优化的编码序列(SEQ ID NO:308)在发酵单胞菌属中表达时,来自密苏里游动放线菌的XI具有比类似表达的大肠杆菌XI(使用密码子优化的编码序列SEQ ID NO:310)或另一种短乳杆菌的组II的XI(密码子优化的编码序列SEQ ID NO:309)的特异活性更高的特异活性。密苏里游动放线菌、大肠杆菌和短乳杆菌XI的密码子优化的编码序列各自在发酵单胞菌属中表达,所述发酵单胞菌属进行了木糖利用的全部四种酶的工程改造,其包括通过非优化的编码序列表达的大肠杆菌木糖异构酶。与表达来自大肠杆菌或短乳杆菌的XI的菌株相比,表达所述密苏里游动放线菌XI的菌株在包含木糖的培养基中更好地生长、利用了更多的木糖并且产生了更多的乙醇。
与表达来自大肠杆菌或短乳杆菌的组II的XI的菌株相比,表达根据下文所述鉴定属于组I的额外XI的发酵单胞菌属菌株也被发现包含木糖的培养基中更好地生长、利用了更多的木糖并且产生了更多的乙醇。这些是为包含来自昏暗地嗜皮菌(SEQ ID NO:64)、耻垢分枝杆菌(SEQ ID NO:10)、Salinispora arenicola(SEQ ID NO:18)和Xylanimonascellulosilytica(SEQ IDNO:40)的XI的菌株。
与表达组II的XI的菌株相比,表达组I的XI的菌株中的生长增强、木糖利用改善和乙醇生产改善各自可在程度上有所变化。差异可能基于一些因素,诸如具体的XI编码基因表达特征、培养条件(诸如培养基中的碳源组成,包括木糖和其它碳源的量)以及菌株特点(诸如木糖利用和/或乙醇生产所涉及的其它基因修饰)。
组I木糖异构酶
属于组I的任意XI均可用于本发明菌株以改善木糖利用。所述组I的XI已经根据其长度而与组II的XI相区分。组I的XI据发现一般长约380个至390个氨基酸,而组II的XI一般长约440个至460个氨基酸。在组I的XI中存在至少约50%的氨基酸同一性,而组II的XI与组I的XI仅具有20-30%的氨基酸同一性。因此,使用这些结构标准可容易地将XI归类为属于组I或组II。
在Park与Batt的文献(上文)中鉴定为属于组I的XI是来自链霉菌属(Streptomyces)、游动放线菌属、栖热菌属(Thermus)和节杆菌属(Arthrobacter)的XI,而鉴定为属于组II的XI是来自克雷伯氏菌属(Klebsiella)、埃希氏菌属(Escherichia)、乳杆菌属(lactobacillus)、乳球菌属(Lactobacillus)、梭菌属(Clostridium)、芽孢杆菌属(Bacillus)、葡萄球菌属(Staphylococcus)和热厌氧杆菌属(Thermoanaerobacter)的XI。
生物信息学分析用于对组I比对组II进行更为完全地特征描述,用以鉴定可用于本发明菌株的XI。组I木糖异构酶的成员使用XI氨基酸序列的分子***发生分析进行鉴定。所述分子***发生分析在444种XI序列上进行,所述序列使用以180个具有功能性评注的XI种子序列进行的多查询序列BLAST分析(blastall)收集自公开数据库,所述种子序列来自SWISSPROT数据库:SEQ ID NO:2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、142和148-306。
在图2中示出的所产生的***发育树将所述密苏里游动放线菌XI置于称为组I的一个***发生分组,并且所述大肠杆菌XI置于称为组II的另一分组中。进行组I和组II的标记以与Park与Batt的文献(上文)分组相一致。短乳杆菌XI也处于组II中,其在本文实施例3中进行测试并且显示具有与来自大肠杆菌XI可比较的效果。所述种子序列中的21个序列(SEQ ID NO:2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137和142)据发现属于组I的XI。根据实施例4中所描述,所鉴定的属于组I的XI序列形成了50%阈值同一性簇。属于组II的XI序列形成了独立的50%阈值同一性簇。所鉴定的各个组I的XI由以下微生物中的一种微生物的基因组所编码并且因此而内源于该微生物:游动放线菌属(Actinoplanes)、节杆菌属(Arthrobacter)、链霉菌属(Streptomyces)、栖热菌属(Thermus)、嗜热棒菌属(Thermobaculum)、滑柱菌属(Herpetosiphon)、酸杆菌门(Acidobacteria)、玫瑰弯菌属(Roseiflexus)、亚栖热菌属(Meiothermus)、异常球菌属(Deinococcus)、亚栖热菌属(Meiothermus)、斯氏菌属(Stackebrandtia)、克里布所菌属(Kribbella)、木聚糖单胞菌属(Xylanimonas)、拟诺卡氏菌属(Nocardiopsis)、细小链孢菌属(Catenulispora)、链孢囊菌属(Streptosporangium)、地嗜皮菌属(Geodermatophilus)、放线束丝菌属(Actinosynnema)、糖单孢菌属(Saccharomonospora)、酸栖热菌属(Acidothermus)、嗜热裂孢菌属(Thermobifida)、类诺卡氏菌属(Nocardioides)、两面神菌属(Janibacter)、分枝杆菌属(Mycobacterium)、雷夫松氏菌属(Leifsonia)、棍状杆菌属(Clavibacter)、小单孢菌属(Micromonospora)、盐水孢菌属(Salinispora)、纤维单胞菌属(Cellulomonas)、琼斯氏菌属(Jonesia)、中村氏菌属(Nakamurella)、放线菌属(Actinomyces)、动弯杆菌属(Mobiluncus)、短状杆菌属(Brachybacterium)、布坦堡菌属(Beutengergai)、弗兰克氏菌属(Frankia)和放线细菌属(Actinobacterium)。
根据实施例4中所述通过分子***发生分析测定属于组I的XI的任意XI均可用于本发明菌株。图3中更为详尽地示出了所述组I的XI的分子***发生。图3中的组I的XI列于表3,其具有介于2与130之间和131-147之间的偶数号码的SEQ ID NO。这些蛋白质的编码区列于表3,其具有介于1与129之间的奇数号码的SEQ ID NO。根据实施例4中所述通过分子***发生分析鉴定属于组I的任何其它鉴定出的XI均可用于本发明菌株。或者,可用于本发明菌株的XI可被鉴定为具有与介于2与130之间和131-147之间的偶数号码的SEQ ID NO的XI氨基酸序列中的任意序列具有至少约70%-75%、75%-80%、80%-85%、85%-90%、90%-95%或至少约96%、97%、98%或99%的序列同一性的氨基酸序列的木糖异构酶蛋白。在一个实施方案中,可用于本发明菌株的XI可被鉴定为具有木糖异构酶活性并且具有与介于SEQ ID NO:24、66、134、140、143、145和147的XI氨基酸序列中的任意序列具有至少约70%-75%、75%-80%、80%-85%、85%-90%、90%-95%或至少约96%、97%、98%或99%的序列同一性的氨基酸序列的蛋白质。同一性基于Clustal W比对方法,所述方法使用GAPPENALTY=10、GAP LENGTH PENALTY=0.1、以及Gonnet 250系列的蛋白质权重矩阵的默认参数。
根据本文实施例4中所述使用GroupSim分析进一步特征描述了组I的XI和组II的XI。通过这一分析,将特定的氨基酸位置确定为特异性决定位置(SDP)以用于区分组I的XI和组II的XI蛋白质的结构。这些SDP氨基酸的位置在此以来自密苏里游动放线菌的代表性组I蛋白P12851(SEQ ID NO:66)和来自热产硫磺梭菌的代表性组II蛋白P19148(SEQ IDNO:267)中的对应位置给出。所述组II蛋白中的位置一般比所述组I的X蛋白中的位置超过约51。本领域的技术人员通过序列比对和所处序列环境可容易地鉴定在其它组I和组II蛋白中的对应位置。
以0.9或更高得分(其中1的满分应表示处于所述类型中全部蛋白在所指明的位置具有所列出的氨基酸并且所述氨基酸在类型间总是不同)区分组I的XI和组I的XI的SDP鉴别标识是以下P12851 vs P19148中的氨基酸(AA)位置:
1)AA226为亮氨酸;AA277为组氨酸
2)AA223为甲硫氨酸;AA274为亮氨酸
3)AA191为异亮氨酸;AA242为谷氨酰胺
4)AA195为苏氨酸、丝氨酸或缬氨酸;AA246为天冬氨酸
5)AA88为甲硫氨酸、苏氨酸或鸟嘌呤;AA139为精氨酸或色氨酸
6)AA290为组氨酸;AA337为天冬酰胺或甲硫氨酸
7)AA221为谷氨酸或天冬氨酸;AA272为丙氨酸、苏氨酸或甘氨酸
8)AA242为苯丙氨酸、缬氨酸或亮氨酸;A293为甘氨酸、半胱氨酸或色氨酸
9)AA243为组氨酸;AA294为丝氨酸、天冬酰胺、甘氨酸或亮氨酸
10)AA193为亮氨酸、苯丙氨酸或甲硫氨酸;AA244为天冬氨酸
11)AA256为谷氨酰胺;AA308为苏氨酸、异亮氨酸、缬氨酸、亮氨酸、甲硫氨酸、酪氨酸或组氨酸
12)AA213为甘氨酸;AA264为赖氨酸、天冬酰胺、丝氨酸、谷氨酸、丙氨酸、亮氨酸、精氨酸或谷氨酰胺
13)AA288为脯氨酸、酪氨酸、丙氨酸或丝氨酸;AA335为缬氨酸或甘氨酸
14)AA249为谷氨酰胺;AA301为天冬氨酸、组氨酸、天冬酰胺、精氨酸、丝氨酸或丙氨酸
本领域的技术人员使用这些氨基酸位置鉴别标识可容易地鉴定组I的XI。基本上如上文所列举,具有所述组I氨基酸位置鉴别标识的XI无论其长度在本文均应认为是组I的XI。因此,如果基本上显示为组II的XI的全部位置均为显示为组I的XI的氨基酸所占据,则所述蛋白质无论其长度均被认为是组I的XI。例如,在位置277处具有组I的AA226亮氨酸鉴别标识而非组氨酸的XI,在其它氨基酸鉴别标识保持了这一模式的情况下其为组I的XI。在本文基本上意指无需在全部位置上完全精确的符合,如0.9的得分所示,而非得分为1,组I的XI在SDP上具有至少90%氨基酸符合上文列单。
对组I的XI的另外生物信息学分析使用HMMER软件包(Janelia FarmResearchCampus,Ashburn,VA)的hmmsearch算法而进行。所述hmmsearch算法的Z参数设定为10亿。使用成组蛋白质序列进行的HMMER分析的发射为序型隐蔽马尔科夫模型(序型HMM)。支持序型HMM的理论描述于Durbin等人(Biological sequence analysis:probabilistic modelsof proteins andnucleic acids,Cambridge University出版,1998)和Krogh等人(1994J.Mol.Biol.235:1501-1531)之中(两者均以引用的方式并入本文),其表征了一组蛋白质,所述表征基于该组蛋白质比对中各个位置上出现各种氨基酸的概率。
具有已知木糖异构酶活性并且在上文所述的分子***发生分析中据发现属于组I的XI的21个种子序列被用作为蛋白质组以准备序型HMM。这些蛋白质具有SEQ ID NO:2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137和142。通过分子***发生分析鉴定为属于组I的全部XI(在表3中列出)均符合具有低于或等于2.2e-181的E值得分并设定Z参数为10亿的由组I种子序列所准备的序型HMM。通过分子***发生分析鉴定为属于组II的全部XI均符合具有高于或等于1.5e-07的E值得分的相同序型HMM。附录表2中列出了各XI SEQID NO的E值得分。因此,所准备的序型HMM提供了对功能性组I的XI的特征描述并且支持了所述分子***发生分析。因此,本发明菌株中可使用符合具有1E-15或更低的E值的序型HMM(以上述21个组I的XI种子序列而准备)的任意XI蛋白,其中1E-15介于组I的XI的最高得分和组II的XI的最低得分之间。更低的E值得分显示了更好的符合。
此外,本文所述或本领域中引述的组I的XI序列可用于鉴定自然中的其它同类物。例如,本文所述的各XI编码核酸片段可用于分离编码同源蛋白质的基因。使用序列依赖性规程分离同源基因是本领域熟知的。序列依赖性规程的实例包括但不限于:1)核酸杂交方法;2)DNA和RNA扩增方法,例如核酸扩增技术的各种用途[例如,聚合酶链反应(PCR),Mullis等人,美国专利4,683,202;连接酶链反应(LCR),Tabor,S.等人,Proc.Acad.Sci.USA82:1074(1985);或链置换扩增(SDA),Walker等人,Proc.Natl.Acad.Sci.U.S.A.,89:392(1992)];以及3)文库构建和互补筛选方法。
如本领域中所知,在编码氨基酸序列的DNA序列中由于基因密码的简并性而存在变异。可对密码子进行优化以用于在靶宿主细胞中表达氨基酸序列,从而提供最佳的编码蛋白质表达。
组I的XI的表达
在本发明菌株中,任意上述组I的XI均可与上文描述的编码木酮糖激酶、转酮醇酶和转醛醇酶一起表达于发酵单孢菌属的菌株或相关乙醇菌原中(诸如运动发酵单胞菌属或发酵杆菌属),其随后能够如下文所述利用木糖。棕榈发酵杆菌是乙醇生产细菌,其已经通过使用运动发酵单胞菌甘油醛-3-磷酸脱氢酶和烯醇酶启动子表达木糖利用基因(如下文对发酵单胞菌的描述)而进行了木糖利用的工程改造(Yanase等人,Applied andEnvironmentalMicrobiology(2007)73:2592-2599)。
可用于表达组I的XI的编码区包括表1中所列的SEQ ID为从1至129的奇数号码的编码区、表1中所列的SEQ ID为介于2与130之间和131-147之间的偶数号码的编码XI蛋白的其它序列,以及使用本文所述的生物信息学或实验方法在本领域中鉴定为编码组I的XI的序列以及本领域中为人所熟知的序列。
为进行表达,将组I的XI编码区构建于嵌合基因中,其具有可操作地连接的启动子并且一般具有终止序列。或者,将所述组I的XI编码区构建为操纵子的一部分,所述操纵子可操作地连接于启动子和终止序列,并且包括一种或多种另外的编码区。可使用的启动子是在发酵单孢菌属或发酵杆菌属细胞中表达的启动子,诸如运动发酵单胞菌甘油醛-3-磷酸脱氢酶(GAP启动子或Pgap),其包括US 20090246876中(其以引用的方式并入本文)公开的更具活性的突变GAP启动子(亦可称为superGAP启动子或Pgaps)以及运动发酵单胞菌烯醇酶(ENO启动子)基因。终止信号也是在所述靶细胞中表达的终止信号。
XI表达的嵌合基因或操纵子一般构建于或转移入载体以用于进一步操作。载体是本领域熟知的。某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移。pRK404和三种相关载体:pRK437、pRK442和pRK442(H)的完整和加注的序列是可获得的。这些衍生物已被证明是在革兰氏阴性菌中进行遗传操纵的有用工具(Scott等人,Plasmid 50(1):74-79(2003))。
尤其可用于在发酵单胞菌属中表达的是能在大肠杆菌属和发酵单胞菌属中复制的载体,例如在美国专利5,514,583中描述的pZB188。载体可包括用于在细胞中自动复制的质粒,以及携带用于整合进入细菌基因组的构建体的质粒。用于DNA整合的质粒可包括转座子,其为与靶细菌基因组同源的核酸序列区域,或是其它支持整合的序列。另外类型的载体可以是转座组,其通过使用(例如)可商购自的***而产生。如何为所需的靶宿主金额所需的功能选择适当的载体是为人熟知的。
细菌细胞可通过以著名的方法导入具有包含木糖异构酶编码区的嵌合基因的载体而进行工程改造,所述方法诸如冻融转化、钙介导的转化、电穿孔或结合法。用于通过表达木糖异构酶而针对木糖利用进行工程改造的任意细菌细胞是转化的靶细胞,所述转化用于根据本文所述对菌株进行工程改造。尤其适合的宿主细胞是发酵单胞菌属和发酵杆菌属细胞。所导入的嵌合基因可以在所述细胞中维持于稳定复制的质粒上,或在导入后整合进入所述基因组。
为使用整合于细菌细胞基因组的木糖异构酶嵌合基因或操纵子对菌株进行工程改造,可使用本领域中为人熟知的方法,诸如同源重组、转座子***或转座组***。在同源重组中,将侧连于靶整合位置的DNA序列结合大观霉素抗性基因或其它选择标记以及木糖异构酶嵌合基因,其引起所述选择标识和所述木糖异构酶嵌合基因向所述靶基因组位置的***。此外,所述选择标记可结合位置特异性重组位置,从而在对应的位置特异性重组酶表达后从所述基因组中切除所述重组基因。
对完整木糖利用途径的工程改造
除了使用嵌合基因或包含组I的XI编码区的编码区进行转化外,本发明菌株还受到针对木糖利用所需的三种其它酶类的表达而进行的工程改造:木酮糖激酶,其磷酸化木酮糖以形成木酮糖-5-磷酸,以及转醛醇酶和转酮醇酶,其为戊糖磷酸途径的两种酶,其将木酮糖-5-磷酸转换成为连接戊糖代谢与糖酵解Entner-Douderoff途径的中间物,这样实现了木糖形成乙醇的代谢(参见图1)。木糖利用型发酵单胞菌属菌株描述于美国专利5514583、美国专利5712133、美国专利6566107、WO 95/28476、Feldmann等人((1992)ApplMicrobiol Biotechnol 38:354-361),Zhang等人((1995)Science 267:240-243)中。使用编码来自大肠杆菌基因(包括组II的XI木糖异构酶)的序列转化了这些菌株。
所述组I的XI可以是表达用于木糖利用的唯一XI,或者除表达组II的XI(诸如来自大肠杆菌的组II的XI)之外还对其进行了表达。因此,可将组I的XI导入具有完整木糖利用途径并且能够利用木糖的发酵单孢菌属或发酵杆菌属菌株,所述木糖利用途径包括组II木糖异构酶编码基因。或者,可将组I的XI导入发酵单孢菌属或发酵杆菌属菌株,为进行木糖利用其表达木酮糖激酶、转醛醇酶和转酮醇酶,并且仅仅缺乏木糖异构酶活性。通过导入组I的XI,所述菌株能够利用木糖。
所述另三种酶可通过单独的嵌合基因或通过操纵子进行表达,如本领域的技术人员所熟知,所述操纵子包括超过一种编码区。编码这些酶的DNA序列可从能够代谢木糖的多种微生物中的任何一种获得,例如肠细菌和一些酵母以及真菌。编码区的来源包括黄单胞菌属、克雷伯氏菌属、埃希氏菌属、红细菌属、黄杆菌属、醋杆菌属、葡糖杆菌属、根瘤菌属、农杆菌属、沙门氏菌属、假单胞菌属、以及发酵单胞菌属。尤其有用的是大肠杆菌的编码区。
内源基因可提供部分木糖发酵途径,或者可通过任意已知基因操作技术加以改进以提供具有可用于木糖代谢的酶活性的蛋白质。例如,在建立木糖利用途径中,内源转酮醇酶可与其它导入的酶活性相补充。
已知的并且可用的木糖利用型菌株的实例包括CP4(pZB5)(US5,514,583)、ATCC31821/pZB5(US 6,566,107)、8b(US 20030162271;Mohagheghi等人,(2004)Biotechnol.25;321-325)以及ZW658(ATTCC PTA-7858;US 7,741,119)。
另外经工程改造以利用并非天然底物的其它糖类(如木糖)的发酵单胞菌属和发酵杆菌属的菌株也可用于本发明加工。一个实例是针对***糖利用进行工程改造的运动发酵单胞菌菌株,如US 5,843,760中所描述,其以引用的方式并入本文。可以通过其它另外的方式修饰菌株以改善木糖利用和乙醇生产。
改善的木糖利用型菌株的发酵
具有组I木糖异构酶嵌合基因或和用于表达木酮糖激酶、转醛醇酶和转酮醇酶的基因或操纵子的工程改造木糖利用型菌株可用于发酵以生产产物,所述产物是所述菌株的天然产物或所述菌株经工程改造以产生的产物。例如,运动发酵单胞菌和棕榈发酵细菌是天然的产乙醇细菌。例如,描述了由本发明的运动发酵单胞菌菌株进行的乙醇生产。
为进行乙醇生产,使具有组I木糖异构酶嵌合基因的重组木糖利用型运动发酵单胞菌接触包含混合糖类(包括木糖)的培养基。通常所述培养基包含包括***糖、木糖、和葡萄糖的混合糖类。所述培养基也包含包括这些糖的生物质水解产物,它们来源于经处理的纤维质或木质纤维质生物质。
当所述混合糖类浓度高至抑制生长时,如US 7,629,156中所公开,所述培养基包括山梨醇、甘露醇或它们的混合物。半乳糖醇或核糖醇可代替或与山梨醇或甘露糖醇组合。运动发酵单胞菌在其中进行发酵并且产生乙醇的培养基中生长。发酵在不补充空气、氧气、或其它气体(这可包括各种条件如厌氧、微氧、或微需氧发酵)的情况下运行至少约24小时,并且可运行30小时或更长时间。达到最大乙醇产量的时间是不确定的,取决于发酵条件。如果抑制剂存在于培养基中,通常需要更长的发酵时间。所述发酵可在约30℃至约37℃的温度下,在约4.5至约7.5的pH下运行。
可在实验室规模的发酵罐中,并且在生产商业用量的乙醇的情况下在扩规发酵中,将本发明运动发酵单胞菌生长于包含混合糖类(包括木糖)的培养基中。当需要商业生产乙醇时,可使用多种培养方法。例如,从本发明的运动发酵单胞菌属菌株中的大规模生产可以通过分批培养方法和连续培养方法进行。经典的分批培养方法是封闭***,其中培养基的组成在培养开始时设定并且在培养过程期间不进行人工改变。因此,在培养过程开始时,用所需的生物接种培养基,并且不向***中添加任何物质可以发生生长或代谢活性。然而,通常来说,“分批”培养是指碳源的添加是成批的,但经常试图控制诸如pH和氧浓度之类的因素。在分批***中,代谢产物和生物质组成持续改变直至培养结束时。在分批培养物内,细胞缓慢通过静态延滞期到达高速生长对数期,并最后达到稳定期,此时生长速率减缓或终止。如果不加以处理,稳定期中的细胞将最终死亡。在某些***中对数期中的细胞通常负责最终产物或中间产物的批量生产。在其它***中可以获得稳定或指数后期生产。
标准分批式***的一种变型是补料分批***。分批补料培养方法也适用于本发明运动发酵单胞菌菌株的培养,并且包括典型的分批***,不同的是:底物随着培养进行以递增方式添加。在代谢产物往往抑制细胞的代谢作用以及其中期望培养基中具有有限量的底物时,补料分批式***是有用的。补料-分批***中实际底物浓度的测量是困难的,并因此根据可测量因素例如pH和废气如CO2的分压的改变来评估。分批和分批补料培养方法在本领域内是常用的且熟知的,并且实例可见于Biotechnology:A Textbook ofIndustrialMicrobiology,Crueger,Crueger和Brock,第二版,(1989)SinauerAssociates,Inc.,Sunderland,MA,或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36,227,(1992),将其以引用方式并入本文。
乙醇的商业生产也可通过连续培养进行。连续培养是一种开放式***,其中将设定好的培养基连续加入生物反应器里,并同时移出等量条件培养基用于加工。连续培养一般使细胞维持在其中细胞主要处于对数生长期的恒定高液相密度。或者,连续培养可以用固定化细胞来进行,其中连续添加碳和营养素,且连续从细胞团块中取出有价值的产物、副产物或废弃物。细胞固定可使用范围广泛的固体载体进行,所述固体载体由本领域技术人员已知的天然材料和/或合成材料组成。
连续或半连续培养允许调节影响细胞生长或最终产物浓度的一种因素或任何数目的因素。例如,一种方法将维持限制性营养物质例如碳源或氮水平处于固定速率并允许所有其它参数适度。在其它***中,影响生长的许多因素能够连续改变,而通过培养基浊度测量的细胞浓度保持不变。连续***努力维持稳态生长条件,且因此由于培养基取出的细胞丧失必须针对培养基中的细胞生长速度进行平衡。对于连续培养过程调节营养物质和生长因子的方法以及用于使产物形成速率达到最大的技术是工业微生物学领域熟知的,并且各种方法如上文Brock所述。
尤其适用于乙醇生产的发酵方法如下所述。期望的本发明运动发酵单胞菌属菌株在包含半复合培养基的摇瓶中生长,培养温度为30℃至约37℃,在回旋振荡器中以约150rpm的转速振荡培养,然后将其转移到包含相似培养基的10L种子发酵罐中。种子培养物在种子发酵罐中厌氧生长直至OD600介于3和6之间,然后将其转移到生产发酵罐中,其中的发酵参数经最优化用于乙醇生产。从种子罐转移到生产罐的典型种菌体积在约2%至约20%v/v的范围内。典型的发酵培养基包含基本培养基组分如磷酸钾(1.0-10.0g/l)、硫酸铵(0-2.0g/l)、硫酸镁(0-5.0g/l)、复合氮源如酵母提取物或大豆基产物(0-10g/l)。培养基中存在终浓度约5mM的山梨醇或甘露糖醇。包括木糖和至少一种附加糖如葡萄糖(或蔗糖)的混合糖提供碳源,当初始批次碳源(50-200g/l)耗尽时将混合糖持续加入发酵罐中以最大化乙醇比率和滴度。碳源进料速率进行动态调节以确保培养物不过度积累葡萄糖,过多的葡萄糖会导致积累毒性副产物如乙酸盐。为了最大化从利用的底物中生产的乙醇产量,通过磷酸盐的量来限制生物量增长,磷酸盐是初始时成批加入的或在发酵期间加入的。使用苛性碱溶液(如氢氧化铵、氢氧化钾、或氢氧化钠)和硫酸或磷酸将发酵控制在pH 5.0-6.0。将所述发酵罐的温度控制于30℃-35℃。为了最小化泡沫,按需加入消泡剂(任何种类-硅氧烷基的、有机物基的等)到罐中。可任选地使用抗生素(菌株中有该抗生素的抗性标记)如卡那霉素以最小化污染。
上文描述的任意条件组以及本领域中所熟知的对这些条件另外改动均为通过木糖利用型重组运动发酵单胞菌菌株进行乙醇生产的适当条件。
实施例
本发明将在下面的实施例中得到进一步阐述。应该理解,这些实施例尽管说明了本发明的优选实施方案,但仅是以例证的方式给出的。从上文的讨论和这些实施例中,本领域的技术人员能够确定本发明的基本特性,并且在不脱离其实质和范围的情况下,能对本发明进行各种变化和修改以适应不同的用途和条件。
一般方法
缩写的含义如下:“kb”是指千碱基,“bp”是指碱基对,“nt”是指核苷酸,“hr”是指小时,“min”是指分钟,“sec”是指秒种,“d”是指天数,“L”是指升,“ml”或“mL”是指毫升,“μL”是指微升,“μg”是指微克,“ng”是指纳克,“mg”是指毫克,“mM”是指毫摩,“μM”是指微摩,“nm”是指纳米,“μmol”是指微摩尔,“pmol”是指皮摩尔,“Cm”是指氯霉素,“Cmr”是指氯霉素抗性型,“Cms”是指氯霉素敏感型,“Spr”是指大观霉素抗性型,“Sps”是指大观霉素敏感型,“XI”是木糖异构酶,“XK”是木酮糖激酶,“TAL”是转醛醇酶,“TKT”是转酮醇酶,“RM”是指包含10g/L酵母提取物加2g/L KH2PO4的丰富培养基,“MM”是指包含10g/L酵母提取物、5g/L胰蛋白胨、2.5g/L(NH4)2SO4和0.2g/L KH2PO4的接合培养基。
本文使用的标准重组DNA和分子克隆技术在本领域中是为人熟知的,并且由Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:ALaboratory Manual,第2版,Cold Spring Harbor Laboratory:Cold SpringHarbor,NY(1989)(下文称为“Maniatis”);以及由Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments withGene Fusions,Cold Spring HarborLaboratory:Cold Spring Harbor,NY(1984);以及Ausubel,F.M.等人,CurrentProtocols in Molecular Biology,Greene PublishingAssoc.and Wiley-Interscience,Hoboken,NJ(1987)所描述。
实施例1
嵌合木糖异构酶基因的构建和双交换子***载体的组装
制备了构建体以用于在运动发酵单胞菌中对来自密苏里游动放线菌(AMxylA)、短乳杆菌(LBxylA)和大肠杆菌(ECxylA)的木糖异构酶的编码区进行整合和表达。根据运动发酵单胞菌ZM4的密码子偏倚性对所述编码序列进行针对运动发酵单胞菌中表达的优化,并且由GenScript Corporation(Piscataway,NJ)合成所述编码序列。将各序列在EcoRV位置克隆进入pUC57并且以质粒pUC57-AMxylA(具有密码子优化的AMxylA编码区SEQID NO:308)、pUC57-LBxylA(具有密码子优化的LBxylA编码区SEQ ID NO:309)和pUC57-ECxylA(具有密码子优化的ECxylA编码区SEQ ID NO:310)提供。所述经优化的xylA编码序列编码天然木糖异构酶(XI)。
通过与来自运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因的305bp的启动子(Pgap;SEQ ID NO:311)和来自大肠杆菌L-核酮糖-5-磷酸4-差向异构酶基因的166bp的终止子(araD3’UTR;SEQ ID NO:312)进行连接,将所述xylA编码序列构建进入具有Pgap-xylA-araD3’UTR结构的嵌合基因。出于此目的,通过PCR合成了Pgap和araD3’UTR重叠片段。一次PCR反应由50μLAccuPrime Pfx SuperMix(Invitrogen,Carlsbad,CA)、作为模板的1μL40ng/μLpARA354(SEQ ID NO:313)和1μL的10μM正向和反向引物组成。质粒pARA354(SEQ IDNO:313)描述于共同拥有并共同待决的美国专利申请12/796025中(其以引用的方式并入本文),并且其为pBS SK(+)载体,所述载体包括Pgap-araBAD操纵子,其为邻接于来自大肠杆菌的araB、araA和araD(分别编码L-核酮糖激酶、L-***糖异构酶和L-核酮糖-5-磷酸-4-差向异构酶的蛋白质)编码区的Pgap启动子。所述操纵子包括3′非翻译区(UTR),其处于所述araD编码区的3′。下文进一步描述了pARA354。反应在Eppendorf Mastercycler(Hemburg,Germany)中进行以热起始PCR程序进行,其具有30个循环的95℃变性30秒/58℃退火(对于araD3’UTR为56℃)30秒/68℃延伸2分钟。
引物ara98和ara120(SEQ ID NO:314和315)产生了Pgap-AM重叠片段。引物ara98和ara121(SEQ ID NO:314和316)产生了Pgap-EC重叠片段。引物ara98和ara122(SEQ ID NO:314和317)产生了Pgap-LB重叠片段。除所述305bp的Pgap序列之外,全部3种Pgap重叠PCR片段还包括了在引物中提供的17bp的5′序列以添加StuI和SpeI位点,以及22bp的3′序列以匹配其对应xylA编码序列的最初22个核苷酸。
引物ara96和ara97(SEQ ID NO:318和319)产生了210bp的araD3’UTR重叠片段。除166bp的araD3’UTR之外,其还包括末端具有XbaI位点的24bp的5′序列,以及提供EcoRI、HindII和FseI位点的20bp的3′序列。还进行了类似的PCR以合成xylA重叠片段,但是将退火温度降至55℃。在这些反应中,使用引物ara114和ara115(SEQ ID NO:320和321)通过pUC57-AMxylA扩增了1,229bp的AMxylA重叠片段。使用引物ara116和ara117(SEQ ID NO:322和323)通过pUC57-ECxylA扩增了1,367bp的ECxylA重叠片段。使用引物ara118和ara119(SEQ ID NO:324和325)通过pUC57-LBxylA扩增了1,394bp的LBxylA重叠片段。所有的xylA重叠片段均具有匹配Pgap最后18个核苷酸的18bp的5′序列,提供XbaI位点并且匹配araD3’UTR最初18个核苷酸的24bp的3′序列,以及介于它们之间的xylA编码序列。通过在琼脂糖凝胶上将5μL各PCR样品跑样确认所述Pgap、araD3’UTR和xylA重叠片段,并且随后通过使用QIAquick PCRPurification Kit(Qiagen,Valencia,CA)对其纯化。
通过重叠PCR将重叠片段连接在一起。第一个重叠PCR进行如下组装以包括50μLAccuPrime Pfx SuperMix、1μL的20ng/μL Pgap重叠片段、2μL的10ng/μL对应xylA重叠片段以及1μL的10μM正向和反向引物。反应通过在热起始PCR程序进行,其具有30个循环的95℃变性30秒/55℃退火30秒/68℃延伸2分钟。结果为使用引物ara98和ara115(SEQ ID NO:314和321)通过Pgap-AM和AMxylA片段合成了Pgap-AMxylA片段;使用引物ara98和ara117(SEQ IDNO:314和323)通过Pgap-EC和ECxylA片段合成了Pgap-ECxylA片段;以及使用引物ara98和ara119(SEQ ID NO:314和325)通过Pgap-LB和LBxylA片段合成了Pgap-LBxylA片段。通过在琼脂糖凝胶上将5μL各PCR样品跑样确认这些Pgap-xylA片段,并且随后通过使用QIAquickPCRPurification Kit对其纯化。
类似于上文组装了第二个重叠PCR。其包括50μL AccuPrime PfxSuperMix、1μL的20ng/μL araD3’UTR重叠片段、2μL的10ng/μL Pgap-xylA片段、1μL的10μM引物ara97(SEQ IDNO:319)以及1μL的10μM引物ara98(SEQ ID NO:318)。通过30个循环的95℃变性30秒/56℃退火30秒/68℃延伸2.5分钟进行反应。将5μl所产生的PCR产物在琼脂糖凝胶上进行检查。包含Pgap-AMxylA和Pgap-LBxylA的反应分别产生了1,714bp的嵌合AMxylA操纵子片段(Pgap-AMxylA-araD3’UTR)和1,879bp的嵌合LBxylA操纵子片段(Pgap-LBxylA-araD3’UTR)。在两种嵌合基因片段中,最初17个核苷酸提供了StuI和SpeI位点,而最后35个核苷酸包含FesI、HindIII和EcoI位点。包含Pgap-ECxylA的PCR反应未能产生所述嵌合ECxylA片段(Pgap-ECxylA-araD3’UTR)。
将包含AMxylA和LBxylA的嵌合基因各自连接进入名为pARA354的双交换(DCO)载体(SEQ ID NO:313),其描述于共同拥有并共同待决的美国专利申请12/796025中。pARA354是pBS SK(+)衍生质粒(Bluescriptplasmid;Stratagene),其作为***载体使用,这是因为pBS载体不能在发酵单孢菌属中复制,其包含如上所述的Pgap-araBAD操纵子和DCO同源重组片段以引导所结合片段向所述发酵单孢菌属基因组的ldhA基因座的整合。使用运动发酵单胞菌DNA作为模板通过PCR合成了用于DCO的pARA354的两种ldhA DNA片段,LDH-L和LDH-R。所述反应使用AccuPrime Mix并遵循标准PCR程序。使用正向引物ara20(SEQ ID NO:326)和反向引物ara21(SEQ ID NO:327)合成LDH-L DNA片段。所得产物是895bp的DNA片段,它包括ldhA编码区的序列5’和ldhA编码区的核苷酸1-493,具有5’SacI位点和3’SpeI位点(SEQ IDNO:328)。使用正向引物ara22(SEQ ID NO:329)和反向引物ara23(SEQ ID NO:330)合成LDH-R DNA片段。所得产物是1169bp的片段,它包括ldhA编码区的核苷酸494-996和ldhA编码区的序列3’,具有5’EcoRI位点和3’NotI位点(SEQ ID NO:331)。由于LDH-L和LDH-R分别包含所述ldhA编码序列的最初493个碱基对和剩余的503个碱基对,pARA354经设计用于引导DNA片段通过交换重组向运动发酵单胞菌的ldhA编码序列中核苷酸493和494之间的***。
pARA354包含用于在大肠杆菌中进行质粒增殖的f1(+)起点和氨苄青霉素抗性基因。此外,在pARA354中的LDH-L和LDH-R同源重组片段之间为aadA标记(用于大观霉素抗性),其结合有野生型LoxP位点(LoxPw-aadA-LoxPw片段;SEQ ID NO:307)和Pgap-araBAD操纵子。
包含AMxylA和LBxylA嵌合基因的PCR片段各自以SpeI和EcoRI进行消化,进行琼脂糖凝胶电泳,并且通过使用QIAquick Gel PurificationKit(Qiagen)进行纯化。与此同时,还以SpeI和EcoRI消化pARA354以去除所述PgaparaBAD操纵子。通过琼脂糖凝胶电泳分离所述EcoRI-pARA354-SpeI质粒骨架(6,023bp)并且通过使用QIAquick Gel PurificationKit进行纯化。在15μL标准连接反应中将所述嵌合AMxylA和LBxylA基因各自构建进入所述pARA354骨架,所述连接反应包括5μL所述经消化的AMxylA或LBxylA嵌合基因片段、2μL经消化的pARA354骨架、3μL 5×连接酶缓冲液和1μL T4 DNA连接酶,其分别产生了7,714bp的DCO质粒pARA355和7,879bp的DCO质粒pARA356。两种质粒均在DH5α大肠杆菌细胞中增殖并且通过使用QIAprep Spin Miniprep Kit(Qiagen)进行制备。
为在所述DCO载体中构建嵌合ECxylA基因,使用SpeI和XbaI消化所述第一个重叠PCR所产生的Pgap-ECxylA重叠片段,对其进行琼脂糖凝胶电泳,并且使用QIAquick GelPurification Kit进行纯化。与此同时,使用SpeI和XbaI消化pARA355。通过琼脂糖凝胶电泳分离所述XbaI-pARA355-SpeI质粒骨架(6,220bp)并且通过使用QIAquick GelPurification Kit进行纯化。在如上所述的15μL标准连接反应中将所述Pgap-ECxylA片段组装进入所述pARA355骨架,所述连接反应包括5μL经消化的Pgap-ECxylA片段和2μL经消化的pARA355骨架片段。所产生的7,852bp DCO质粒pARA357在DH5α大肠杆菌细胞中增殖并且通过使用QIAprep Spin Miniprep Kit进行制备。
实施例2
嵌合AMxylA、LBxylA和ECxylA基因向运动发酵单胞菌菌株ZW641中的整合
使用菌株ZW641分析了在木糖利用型运动发酵单胞菌中表达密苏里游动放线菌、短乳杆菌或大肠杆菌XI的效果。ZW641菌株的制备描述于USUS7,741,119的实施例1中,其以引用的方式并入本文。其中所述的菌株X13L3随后重新命名为ZW641。通过先后将两种操纵子PgapxylAB和Pgaptaltkt与氯霉素抗性选择标记整合进入运动发酵单胞菌ZW1的基因组(ATCC 31821)而制备ZW641。通过生长于包含木糖的培养基中而对转化子进行针对木糖利用的进一步驯化。
在整合了PgapxylAB和Pgaptaltkt操纵子的ZW641中,所述xylA、xylB、tal和tkt编码区来自大肠杆菌基因。尽管ZW641具有木糖代谢所必需的全部四种基因,但是木糖利用并非最佳。因此,通过表达另外的XI基因可潜在地改善ZW641中背景水平的木糖利用。
通过在30℃下以150rpm振荡将种子细胞过夜生长于MRM3G5(1%酵母提取物、15mMKH2PO4、4mM MgSO4和50g/L葡萄糖)直至OD600值接近5而制备ZW641-1A菌株(ZW641的一种分离株)的感受态细胞。使用Shimadzu UV-1200分光光度计(Kyoto,Japan)测量所述OD600值。收获细胞并将其重悬在新鲜培养基中至OD600值为0.05。在相同条件下将所述细胞生长至早期至中期对数生长期(OD600接近0.5)。收获细胞并用冰水洗涤两次,然后用冰冷的10%甘油洗涤一次。收集所产生的感受态细胞并且将其重悬在冰冷的10%甘油中至OD600值接近100。由于运动发酵单胞菌的转化需要非甲基化的DNA,因此将DCO质粒pARA355、pARA356和pARA357各自转化进入大肠杆菌SCS110感受态细胞(Stratagene,La Jolla,CA)。对于各个转化,在37℃下将转化细胞的一个菌落过夜生长于10mL LB-Amp100中(包含100mg/L氨苄青霉素的LB液体)。使用QIAprep Spin DNA MiniprepKit(Qiagen)通过所述10mL培养物制备DNA。
在1MM电穿孔皿(VWR,West Chester,PA)中将约1μg非甲基化质粒DNA与50μLZW641-1A感受态细胞进行混合。在2.0KV下使用BT720Transporater Plus(BTX-Genetronics,San Diego,CA)将质粒DNA电穿孔到细胞中。在30℃下将转化细胞在1mL MMG5培养基(10g/L葡萄糖、10g/L酵母提取物、5g/L胰蛋白胨、2.5g/L(NH4)2SO4、2g/L K2HPO4和1mMMgSO4)中恢复4小时,并且在30℃下将其在MMG5-Spec250平板上(具有250mg/L大观霉素和15g/L琼脂的MMG5)在具有AnaeroPack的无氧罐(Mitsubishi Gas Chemical,New York,NY)内生长3天。对各个转化获得了约20个大观霉素抗性菌落。将这些菌落划线于新鲜的MMG5-Spec250平板上并且它们在上述相同条件下的生长显示所述嵌合xylA基因/Spec-R构建体已经整合进入了ZW641的基因组。通过PCR分析整合。一次反应包括25μLPCR SuperMix(Invitrogen)、0.5μL 10μM正向引物和反向引物(如下文所指定)以及来自所述菌落的少量运动发酵单胞菌细胞。反应在EppendorfMastercycler中以hardstart PCR程序进行,其进行35个循环的94℃变性45秒/55℃退火45秒/72℃延伸1.5分钟。通过在琼脂糖凝胶上对5μL进行跑样而检测反应。在所述第一个检验中当使用了ara46和ara43引物(SEQ ID NO:332和333)时,从大多数菌落中扩增出1,521bp PCR产物。这一产物覆盖了从所述质粒中的Spec-R标识的aadA编码区至所述LDH-R片段下游的运动发酵单胞菌基因组序列,这显示了由所述LDH-R片段介导的整合事件。在所述第二个检验中当正向-反向引物对为ara45-ara120(SEQID NO:334和315)、ara45-ara122(SEQ ID NO:334和317)以及ara45-ara121(SEQ ID NO:334和316)时,分别从ZW641-ara355、ZW641-ara356和ZW641-ara357的菌落中扩增出了1,289bp的PCR产物。这些产物覆盖从所述LDH-L片段上游的运动发酵单胞菌基因组序列至pARA355中的AMxylA、pARA356中的LBxylA或pARA357中的ECxylA。这些显示了由所述LDH-L片段介导的整合事件。因此,PCR证据证实了所述嵌合xylA操纵子/Spec-R构建体已经整合进入了ZW641-1A基因组。将使用pARA355、pARA356和pARA357转化的ZW641-1A细胞分别命名为ZW641-ara355、ZW641-ara356和ZW641-ara357。
实施例3
在运动发酵单胞菌菌株ZW641中AMxylA、LBxylA和ECxylA表达的特征
ZW641具有天然大肠杆菌xylA编码区的拷贝,其以低水平表达。菌株ZW641-ara355、ZW641-ara356和ZW641-ara357各自包含经密码子优化的xylA编码区的额外拷贝:分别为AMxylA、LBxylA和EcxylA。对这些菌株分析了增强的木糖利用、乙醇生产和木糖中的生长。
为检测这些新菌株在包含木糖的培养基中的生长并且将其与亲本菌株ZW641-1A进行比较,将来自前述实施例所述的MMG5-Spec250平板的ZW641-ara355、ZW641-ara356和ZW641-ara357各两个菌株(1和2)重新划线于MMX5平板(除以木糖替换葡萄糖外的相同培养基)。还将ZW641划线于所述平板以作为对照。在30℃下将所述平板上的细胞在具有AnaeroPack的无氧罐中生长6天。对于全部三组所述新菌株观察到了生长,但对于所述ZW641对照未观察到生长。包含额外拷贝AMxylA的ZW641-ara355的1和2菌株在所述木糖培养基上表现出比ZW641-ara356和ZW641-ara357菌株显著更多的生长。
为定量测量木糖中的生长,对这7种菌株进行96小时的生长分析。在本分析中,在30℃下150rpm的摇床中将来自各菌株的细胞在3mLMRM3G5中过夜生长。收获细胞,使用MRM3X10洗涤(与MRM3G5相同,但是以100g/L木糖取代50g/L葡萄糖)并且将其重悬浮于MRM3X10之中以具有接近0.1的起始OD600值。将25毫升的所述悬浮物置于50mL旋盖VWR离心管内并且在30℃下以150rpm振荡生长96小时的时程。在所述时程中,在0小时、4小时、24小时、48小时、72小时和96小时测量OD600值。在图4中以生长曲线进行作图的结果显示,第二个拷贝的xylA确实增强了所述工程改造菌株在包含木糖的培养基中的生长。当对包含第二个拷贝的xylA的菌株进行比较时,ZW641-ara355生长得显著快于ZW641-ara357。在96小时生长后其具有几乎2倍于ZW641-ara357的细胞密度。这一结果表明由AMxylA所编码的木糖异构酶可能功能比ECxylA所编码的木糖异构酶更好。ZW641-ara356生长与ZW641-ara357类似或比其稍慢,这表明由LBxylA所编码的木糖异构酶可能功能不比ECxylA所编码的木糖异构酶更好。
在所述时程中,在72小时点收集了ZW641、ZW641-ara355-1、ZW641-ara356-2和ZW641-ara357-2培养物的1mL样品。在10,000×g下对其离心以除去细胞。通过0.22μm的Costar Spin-X离心管式滤器过滤该上清液,并且在Agilent 1100HPLC***中通过BioRadAminex HPX-A7H离子排阻色谱柱使用0.01N H2SO4以0.6mL/min的速度在55℃下对其进行分析以测定乙醇和木糖浓度。表5中给出的结果显示,与ZW641中的基础水平木糖利用和乙醇生产相比,ZW641-ara355中的AMxylA显著地促进了木糖消耗并且将乙醇生产提高超过3.5倍。ZW641-ara357中的ECxylA对木糖代谢和乙醇生产略有提高,而ZW641-ara356中的LBxylA对于木糖利用给出了最小的提高并且在乙醇生产中并未引起可检测的变化。这些结果与此前对于生长的观测相一致,并且暗示了所述菌株之间生长的差异是由于木糖代谢的差异所引起,其可能由于木糖异构酶活性的差异而产生。
表5:在30℃下在MRM3X10中进行72小时培养后的细胞生长,木糖消耗和乙醇生产
*所述培养基中存留的木糖
+起始培养基
#na:不适用
为测定由AMxylA、LBxylA和ECxylA所编码的木糖异构酶是否具有不同的活性,在30℃下的150rpm摇床中将ZW641、ZW641-ara355-1、ZW641-ara356-2和ZW641-ara357-2在MRM3G5中生长过夜。通过10,000×g离心从2mL培养物中收集细胞,以冰冷的蛋白质提取缓冲液(10mM盐酸三乙醇胺,pH8.0,10mM MgSO4,1mM DTT和5%甘油)洗涤,将其重悬浮于500μL冰冷的蛋白质提取缓冲液中并且通过使用具有微平板超声头的Misonix Sonicator 4000(Qsonica,Newtown,CT)在7档设定下进行3次3分钟超声处理。通过10,000×g离心除去细胞碎片。保留上清液作为蛋白质提取物。通过使用Coomassie Plus Protein Assay Reagent(Pierce,Rockford,IL)测量其蛋白质浓度,并且通过改进的半胱氨酸-咔唑法测量木糖异构酶活性。100μL的半胱氨酸-咔唑分析反应包含10mM盐酸三乙醇胺缓冲液,pH7.0,10mMMgSO4,25mM D木糖和30μg的提取蛋白。在32℃下孵育15分钟后,通过加入25μl 50%三氯乙酸终止该反应。随后,向所述反应中按次序加入3ml冰冷的75%硫酸、100μl 2.4%盐酸半胱氨酸溶液和100μl0.12%咔唑乙醇溶液。将所述混合物在室温下保持10分钟。在ShimadzuUV-1200分光光度计上测量OD540值。根据D-木酮糖浓度OD540值的标准曲线测定所述对应的D-木酮糖浓度。通过进行包含不同量的D-木酮糖但无D-木糖和蛋白质的半胱氨酸-咔唑分析开发出所述标准曲线。最终,将一个单位的木糖异构酶定义为在所述反应中产生一微摩尔D-木酮糖所需的活性。以单位每毫克蛋白质计算特异活性。在所述分析中,在无蛋白质的空白反应中测量D-木糖的背景OD540。在对活性进行计算之前从原始OD540读值中减去这一背景。对各分析重复三次。图5中图示了所述半胱氨酸-咔唑分析的结果,其示出了ZW641、ZW641-ara355-1、ZW641-ara356-2和ZW641-ara357-2的蛋白质提取物中的木糖异构酶特异活性。各活性柱条为三次平行反应的平均,具有根据其计算出的标准差。这一结果显示了在向细胞中导入额外木糖异构酶活性的ZW641中的第二个拷贝xylA的表达。ZW641-ara355中的AMxylA、ZW641-ara356中的LBxylA以及ZW641-ara357中的ECxylA分别提高XI活性约20倍、3倍和4倍。由于这三种xylA基因通过相同的方法构建于ZW641中,因此在所述细胞提取物中的木糖异构酶特异活性的差异暗示了来自密苏里游动放线菌的木糖异构酶发挥了远比来自短乳杆菌和大肠杆菌的木糖异构酶更为优良的功能。实际上,所述密苏里游动放线菌XI给出了约2.3的特异活性,其比短乳杆菌XI高出6倍并且比大肠杆菌XI高出5倍。因此,通过检测细胞生长、木糖代谢和XI活性,本实施例已经将密苏里游动放线菌XI鉴定为在木糖利用型运动发酵单胞菌菌株中改善木糖利用的优秀木糖异构酶。
实施例4
木糖异构酶的结构分析
通过首先鉴定已知具有木糖异构酶(XI)活性的种子序列组而制备了可能为木糖异构酶的可用蛋白质序列的集合。所述种子序列作为木糖异构酶从SWISSPROT数据库中获取,所述数据库包含具有高可信度功能标注的蛋白质序列。从SWISSPROT(Swiss Instituteof Bioinformatics)中获取了180个XI种子序列:SEQ ID NO:2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137、142和148-306。随后将这些种子序列作为BLAST的blastall包中的一组多查询序列用于搜索NCBI(National Center forBiotechnology Information,Bethesda,MD)非冗余(nr)综合蛋白质数据库。鉴定出总计444个序列以形成可描述为XI活性蛋白的序列空间(sequence space)的组。
如图2所示,基于序列同一性的簇化和使用PHYLIP邻接算法(在PHYLIP(PhylogenyInference Package)版本3.5c中实施)(Felsenstein(1989)Cladistics 5:164-166)进行的分子***发生分析显示,上文产生的XI活性序列空间分成两组,称为组I(Group I)和组II(Group II)。所述组I组由82个序列(SEQ ID NO为介于2与130之间和131-147之间的偶数)组成,其中21个为种子(SEQ ID NO:2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137和142)。类似地,所述组II组由351个成员组成,其中159个为种子(SEQ ID NO:148-306)。如图2所示,所述短乳杆菌和大肠杆菌XI蛋白属于组II,而所述密苏里游动放线菌XI蛋白属于组I。
在形成所述***发生群体中遵循了以下方法:
由所述444个XI序列开始
步骤1:建立70%的同一性群体
将所述444个序列中的最长的序列命名为第一总序列。将所述444个序列中与第一总序列具有70%或更高的序列同一性的其它序列归组以形成第一ref70簇(A)。在其余的序列中,将最长的序列命名为第二总序列并用于类似地创建第二ref70簇(B)。连续进行所述归组方法直至各序列均处于簇中。某些簇为单例。
步骤2:以70%的阈值进行合并
对于各对簇A和B,如果A中三分之一的序列以70%或更高的序列同一性相关于B中的序列并且反之亦然,则将簇A和B合并。连续进行这一方法直至使用所述70%的同一性阈值无可以合并的对。
步骤3:以50%的阈值进行合并
遵循与步骤2相同的方法,但是使用了50%的序列同一性阈值。
步骤4:以30%的阈值进行合并
遵循与步骤2相同的方法,但是使用了30%的序列同一性阈值。
组I为50%阈值的同一性簇。组II为独立的50%阈值的同一性簇。
有11个序列并未明确地划分为组I或组II,因为它们在50%的同一性阈值上不与任何一个群体成簇。
图3示出了所述组I的XI的***发育树,其标出了具体的菌属。组I包括来自节杆菌属(Arthrobacter)、链霉菌属(Streptomyces)、栖热菌属(Thermus)、嗜热棒菌属(Thermobaculum)、滑柱菌属(Herpetosiphon)、酸杆菌门(Acidobacteria)、玫瑰弯菌属(Roseiflexus)、亚栖热菌属(Meiothermus)、异常球菌属(Deinococcus)、亚栖热菌属(Meiothermus)、斯氏菌属(Stackebrandtia)、克里布所菌属(Kribbella)、木聚糖单胞菌属(Xylanimonas)、拟诺卡氏菌属(Nocardiopsis)、细小链孢菌属(Catenulispora)、链孢囊菌属(Streptosporangium)、地嗜皮菌属(Geodermatophilus)、放线束丝菌属(Actinosynnema)、糖单孢菌属(Saccharomonospora)、酸栖热菌属(Acidothermus)、嗜热裂孢菌属(Thermobifida)、类诺卡氏菌属(Nocardioides)、两面神菌属(Janibacter)、分枝杆菌属(Mycobacterium)、雷夫松氏菌属(Leifsonia)、棍状杆菌属(Clavibacter)、小单孢菌属(Micromonospora)、盐水孢菌属(Salinispora)、纤维单胞菌属(Cellulomonas)、琼斯氏菌属(Jonesia)、中村氏菌属(Nakamurella)、放线菌属(Actinomyces)、动弯杆菌属(Mobiluncus)、短状杆菌属(Brachybacterium)、布坦堡菌属(Beutengergai)、弗兰克氏菌属(Frankia)和放线细菌属(Actinobacterium)的XI蛋白。
对组I和组II之间的区分:方法1
通过GroupSim分析(Capra和Singh(2008)Bioinformatics 24:1473-1480页)对组I成员和组II成员之间进行区分。所述GroupSim方法鉴定了决定蛋白质功能特异性的氨基酸残基。在蛋白质家族(其序列分成多个类型)的多序列比对(MSA)中可鉴定出区分序列功能类型的氨基酸残基。所述方法将多序列比对(MSA)和已知的特异性类型划分作为输入,并且对所述MSA中的各氨基酸位置配以得分值。高得分显示了氨基酸位置是特异性决定位置(SDP)的更高可能性。
对根据上述所述***发生分析而分为组I和组II的XI序列的MSA上进行的GroupSim分析鉴定了高区分性位置。表6中列出了具有高于或等于0.9的得分的位置,其中1.0的满分将表明所述类型中的全部蛋白在所指定的位置具有所列出的氨基酸并且所述氨基酸在类型间总是不同的,“残基”栏以单字母编码给出了在组I蛋白中对比在组II蛋白中(以竖条:|分开)的位置上的氨基酸。第2栏中的氨基酸位置编号属于代表性的组I蛋白P12581,其为来自密苏里游动放线菌的XI。第3栏中的氨基酸位置编号属于代表性的组II蛋白P19148,其为热产硫磺梭菌的XI(SEQ ID NO:267)。
表6:来自GroupSim分析的组I和组II的XI的高区分性氨基酸位置
对组I和组II之间的区分:方法2
使用HMMER软件包(支持序型HMM的理论描述于R.Durbin,S.Eddy,A.Krogh和G.Mitchison,Biological sequence analysis:probabilistic models ofproteins and nucleic acids,Cambridge University出版,1998;Krogh等人,1994;J.Mol.Biol.235:1501-1531中)进行对木糖异构酶家族酶类的类型的替代性结构/功能特征表述。
使用组I中的21个种子序列(SEQ ID NO:2、24、32、34、42、54、66、68、78、96、100、106、108、122、126、128、130、132、135、137和142)的多序列比对创建了序型隐蔽马尔科夫模型(HMM)用于代表组I成员。如用户指南中所述,序型HMM是多重序列比对的统计模型。它们捕获关于比对中的每一列有多保守以及在每一位置哪种氨基酸残基最可能存在的位置特异性信息。因此,HMM具有正规的概率学基础。就大量的蛋白质家族而言,序型HMM可从PFAM数据库(Janelia Farm Research Campus,Ashburn,VA)公开获得。
序型HMM的构建如下:
步骤1:构建序列比对
使用Clustal W以默认参数比对组I中的21个种子序列(具有高可信度标注的序列)。
步骤2:构建序型HMM
采用默认参数,对上述比对的序列的集合运行了hmmbuild程序。hmmbuild读取多重序列比对文件,构建新的序型HMM,并将所述序型HMM保存为文件。使用这一程序,从所述多比对中为上述种子序列组产生了未校正序型图。
以下基于HMMER软件用户指南的信息给出了关于hmmbuild程序制备序型HMM的方式的一些描述。序型HMM能够建模带缺口的比对,例如包括***和缺失,这使得软件能描述完整的保守域(而不是仅仅较小的不带缺口的基序)。采用***(I)状态和缺失(D)状态对***和缺失建模。包含多于特定部分x的空位字符的所有列将被指定为***列。在默认情况下将x设定为0.5。各匹配状态具有与之关联的I状态和D状态。HMMER将比对中相同的共有位置的一组三种状态(M/D/I)称作“节点”。这些状态与称作状态转换概率的箭头互相关联。M和I状态是发射者,而D状态是静默的。转换被安排为使得在每一节点,M状态被使用(并且一个残基被对齐并评分)或者D状态被使用(并且没有残基被对齐,从而产生一个缺失-空位符号‘-’)。***发生在节点之间,并且I状态具有自我转换,允许在共有列之间出现一个或多个***的残基。
匹配状态的残基的评分(即匹配状态发射评分)或***状态的残基的评分(即***状态发射评分)与Log_2(p_x)/(null_x)成比例。其中p_x是根据序型HMM,某种氨基酸残基处于比对中的一个特定位置的概率,而null_x是根据空模型的概率。所述空模型为有预先算出的一组针对20种氨基酸中的每一种的发射概率的简单的单一状态概率模型,其中所述发射概率来源于氨基酸在SWISSPROT版本24中的分布。
状态转换得分还作为对数几率(log odd)参数进行计算,并且其与Log_2(t_x)成比例。其中t_x是转换为发射者或非发射者状态的概率。
步骤3:校正所述序型HMM
用hmmcalibrate读取了序型HMM,hmmcalibrate以所述剖面对大量合成的随机序列进行评分(所使用的合成序列的默认数量为5,000),将极值分布(EVD)拟合至这些评分的直方图,并重新存储已包括了EVD参数的HMM文件。在根据蛋白质序列数据库搜索所述序型图时,这些EVD参数(μ和λ)用于计算二进制值的E值。hmmcalibrate在标为“EVD”的行中将两个参数写入所述HMM文件:这些参数为极值分布(EVD)的μ(位置)和λ(尺度)参数,所述极值分布与根据随机产生序列(具有大致与SWISS-PROT相同的长度和残基组成)而计算的得分直方图进行了最佳的拟合。对所述序型HMM进行了一次校正。
所述组I组的经校正序型HMM以附录中的表1提供,其为组I序型HMM Excel表。所述序型HMM在表中提供,该表给出了各氨基酸在所述氨基酸序列中的各位置出现的概率。对每一位置,突出显示了最高的可能性。表7示出了所述组I序型HMM的若干行。
表7:所述组I序型HMM的一部分
氨基酸以单字母编码示出。
各位置的第一行报告了匹配发射评分:各种氨基酸处于该状态的概率(突出显示最高得分)。第二行报告了***发射评分,并且第三行报告了在位状态转换评分:M→M,M→I,M→D;I→M,I→I;D→M,D→D;B→M;M→E。表7显示,在所述组I序型HMM中甲硫氨酸具有4620的概率出现在第一位,其为最高的概率。
步骤4:测试所建立的序型HMM的特异性和敏感性
针对区分组I成员与组II成员的能力,使用Z参数设定为10亿的hmmsearch评估所述组I序型HMM。所述hmmsearch程序使用组I序型HMM的hmm文件以及来自两个类型的全部序列,并且为各个序列分配E值得分。这一E值得分是对所述序型HMM的拟合的度量,较低的得分为较好的拟合。所产生的得分分配列表在附录中以表2提供。所述序型HMM清楚地将组I成员与组II成员加以区分,这是因为在最差得分的组I成员(2.2e-181)和最佳得分的组II成员(1.5e-07)之间具有E值差异的大幅空白。
这一分析显示,为组I的XI蛋白准备的序型HMM将组I与组II的XI蛋白加以区分。所述组I序型HMM提供了与在功能上类似于密苏里游动放线菌的XI的XI蛋白相联系的结构。
实施例5
组I的XI嵌合P gapS -xylA的构建和双交换***载体的组装
根据实施例4中描述的氨基酸序列分析,来自昏暗地嗜皮菌DSM43160(GOxylA;SEQID NO:64)、耻垢分枝杆菌菌株MC2 155(MSxylA;SEQ ID NO:10)、Salinispora arenicolaCNS-205(SAxylA;SEQ ID NO:18)和Xylanimonas cellulosilytica DSM 15894(XCxylA;SEQ ID NO:40)的木糖异构酶均属于组I木糖异构酶。根据运动发酵单胞菌ZM4的密码子偏倚性,对编码这些蛋白质的序列进行针对运动发酵单胞菌中的表达的优化(分别为SEQ IDNO:335、336、337和338),并且由GenScript Corporation(Piscataway,NJ)对其从头合成以成为结合SpeI和XhoI位点并且具有邻接于突变运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子(PgapS;SEQ ID NO:339)的编码区的DNA片段。如US 2009-0246876中所公开,所述PgapS为改进的Pgap,其在该天然启动子片段(Pgap)的位置116处具有“G”到“T”的突变,所述突变增强了由所述启动子进行的表达。由GenScript Corporation(Piscataway,NJ)将所述SpeI-PgapS-xylA-XhoI片段在EcoRV位点克隆进入pUC57。所产生的中间体质粒称为pUC57-PgapSGOxylA、pUC57-PgapSMSxylA、pUC57-PgapSSAxylA和pUC57-PgapSXCxylA。所述经优化的xylA编码序列为GOxylA(SEQ ID NO:35)、MSxylA(SEQ ID NO:336)、SAxylA(SEQ ID NO:337)和XCxylA(SEQ ID NO:338)。
使用常见的分子克隆方法构建DCO***载体。首先,对质粒pARA356(描述于实施例1中)进行如下修饰以在所述LBxylA和araD3’UTR序列之间添加XhoI位点。首先,使用正向引物ara368(SEQ ID NO:345)和反向引物ara97(SEQ ID NO:319)通过pARA356对araD3′UTR片段进行PCR扩增。所述ara368引物将SpeI和XhoI位点添加至araD3′UTR的5′末端,并且ara97引物将HindIII、FseI和EcoRI位点添加至araD3′UTR的3′末端。使用SpeI和EcoRI消化所述PCR产物。pARA356中的Pgap-LBxylA-araD3′UTR片段具有5′SpeI位点和3′EcoRI位点。通过以SpeI和EcoRI进行消化去除这一片段并将其替换以上文的SpeI-XhoI-araD3′UTR-HindIII-FseI-HindIII-EcoRI PCR产物。除以XhoI位点替换了Pgap-LBxylA之外,所产生的中间体质粒pARA356D具有与pARA356相同的序列。
在进行SpeI和XhoI消化后,从所述基于pUC57的质粒中分离上述的四种PgapS-xylA片段,并将其在所述SpeI和XhoI位点之间克隆进入经XhoI修饰的pARA356D以取代所述Pgap-LBxylA片段。所产生的四种DCO***载体为pARA356-GOxylA、pARA356-MSxylA、pARA356-SAxylA和pARA356-XCxylA。除以PgapS表达它们的嵌合xylA之外,这些载体等同于pARA356。
作为对照,分别将pARA355中的AMxylA和pARA357中的ECxylA用作为组I和组II的xylA的代表。但是,由于将PgapS用于表达所述四种新的组I的xylA基因,因此将控制pARA355中的AMxylA和pARA357中的ECxylA的Pgap启动子变成PgapS。出于此目的,使用正向引物ara10(SEQ IDNO:340)和反向引物ara401(SEQ ID NO:341)以PCR通过pARA356-XCxylA合成了319bp的PgapS OLE-PCR片段;使用正向引物ara402(SEQ ID NO:342)和反向引物ara403(SEQID NO:343)以PCR通过pARA355合成了1,229bp的PgapS-AMxylA OLE-PCR片段;并且使用正向引物ara402和反向引物ara404(SEQ ID NO:344)以PCR通过pARA357合成了1,367bp的PgapS-ECxylA OLE-PCR片段。PCR反应由50μL AccuPrime PfxSuperMix(Invitrogen,Carlsbad,CA)、1μL 40ng/μL的DNA模板和1μL 10μM正向和反向引物组成。反应在EppendorfMastercycler(Hemburg,Germany)中以热起始PCR程序进行,其具有35个循环的94℃变性1分钟/56℃退火1分钟/72℃延伸2分钟。所述PgapS OLE-PCR片段包括完整的PgapS OLE-PCR、5′SpeI位点和3′起始密码子。所述PgapS-AMxylA和PgapS-ECxylA OLE-PCR片段分别包含AMxylA和ECxylA编码序列。各片段具有匹配PgapS最后36nt的36-nt 5′序列和3′XhoI位点。此外,还通过重叠PCR(OLE-PCR)合成了SpeI-PgapS-AMxylA-XhoI和SpeI-PgapS-ECxylA-XhoI片段。PCR反应如上设定,但是包括入两种模板。SpeI-PgapS-AMxylA-XhoI通过使用正向引物ara10和反向引物ara403从PgapS和PgapS-AMxylA OLE-PCR片段中扩增;而SpeI-PgapS-ECxylA-XhoI通过使用正向引物ara10和反向引物ara404从PgapS和PgapS-ECxylA OLE-PCR片段中扩增。SpeI-PgapS-AMxylA-XhoI和SpeI-PgapS-ECxylA-XhoI均以SpeI和XhoI进行消化,进行琼脂糖凝胶电泳,并且通过使用QIAquick Gel Purification Kit(Qiagen)进行纯化。将所述DNA片段在SpeI和XhoI位点之间克隆进入经修饰的pARA356(上文所述)以取代所述Pgap-LBxylA片段。所产生的2种DCO***载体称为pARA356-AMxylA和pARA356-ECxylA。全部质粒均在DH5α大肠杆菌细胞中增殖并且通过使用QIAprep Spin Miniprep Kit进行制备。
实施例6
嵌合P gapS -xylA基因向ZW641中的整合和对它们表达的特征描述
本实施例描述了实施例2中所述的PgapS-xylA嵌合基因在克隆ZW641中的表达,并且显示所述四种受测组I的XI在运动发酵单胞菌中实际上功能优于组II的XI。
制备了感受态菌株ZW641-1A并且使用pARA356-AMxylApARA356-ECxylA、pARA356-GOxylA、pARA356-MSxylA、pARA356-SAxylA或pARA356-XCxylA分别进行转化。在MMG5-Spec250平板上筛选转化子并如上文描述通过PCR分析所导入的PgapS-xylA基因的整合(参见实施例2)。所产生的菌株名为ZW641-ara356-AMxylA、ZW641-ara356-ECxylA、ZW641-ara356-GOxylA、ZW641-ara356-MSxylA、ZW641-ara356-ASxylA和ZW641-ara356-XCxyl菌株。在这些菌株中,ZW641-ara356-AMxylA和ZW641-ara356-ECxylA作为对照而制备,这是因为实施例3显示所述AMxylA 1型木糖异构酶在运动发酵单胞菌中具有高度活性,而ECxylA是两种受测组II木糖异构酶中更好的酶。
为检验这六种新型菌株在木糖中的生长并且将它们与亲本菌株ZW641-1A进行比较,在木糖中对全部菌株进行96小时的摇瓶发酵。在本分析中,在30℃下以150rpm的振荡将来自各菌株在3mL MRM3G5中过夜生长。收集细胞,使用MRM3X10洗涤(与MRM3G5相同,但是以100g/L木糖取代50g/L葡萄糖)并且将其重悬浮于MRM3X10之中达到OD600约0.1。将25毫升的所述悬浮物置于50mL旋盖VWR离心管内并且在30℃下以150rpm振荡生长96小时的时程。在所述时程中,在0小时、24小时、48小时、72小时和96小时测量OD600值。图6中示出了所产生的生长曲线。其显示与实施例3中所分析的ZW1-ara355和ZW1-ara357相类似,在发酵结束时ZW641-ara356-AMxylA生长至超出ZW641-ara356-ECxylA约三倍的细胞密度。ZW641-ara356-AMxylA具有3.43的OD600,而ZW641-ara356-ECxylA达到1.18。两种菌株均生长得比ZW641更快。其它四种菌株均生长得比ZW641-ara356-ECxylA更快。它们的细胞密度在发酵结束时介于ZW641-ara356-AMxylA与ZW641-ara356-ECxylA的细胞密度之间。
为测量各菌种的代谢特征,在72小时点收集了1mL的各培养物样品。在10,000×g下对所述样品进行离心以除去细胞。通过0.22μm的Costar Spin-X离心管式滤器过滤所述上清液,并且在Agilent 1100HPLC***中通过BioRad Aminex HPX-A7H离子排阻色谱柱使用0.01N H2SO4以0.6mL/min的速度在55℃下对其进行分析以测定乙醇和木糖浓度。表8中示出的结果显示,更快的生长关联于更高的木糖利用和更多的乙醇生产。这些结果表明,生长中的差异是由于XI活性的差异所导致的。所有菌株均具有比所述Zw641对照更优良的生长、乙醇生产和木糖利用,并且具有组I的XI的所有菌株均表现优于具有组II大肠杆菌XI的菌株。
表8:在30℃下在MRM3X10中进行72小时培养后的细胞生长,木糖消耗和乙醇生产
菌株 生长(OD600) 乙醇(g/L) 木糖*(g/L)
ZW641 0.22 0.0 96.1
ZW641-ara356-AMxylA 3.21 26.3 41.5
ZW641-ara356-ECxylA 0.59 1.6 92.9
ZW641-ara356-GOxylA 1,14 3.0 90.0
ZW641-ara356-MSxylA 1.75 8.4 78.6
ZW641-ara356-SAxylA 1.51 5.0 86.3
ZW641-ara356-XCxylA 2.80 19.4 56.1
MRM3X10+ na# 0.0 96.1
*所述培养基中存留的木糖
+起始培养基
#na:不适用
为进一步证实这六种菌株各自具有对应于其生长和代谢特征的XI活性,如实施例3中对蛋白质浓度和木糖异构酶活性的分析一样制备了蛋白质提取物。特异活性以每毫克蛋白质单位计算,在活性计算之前从原始OD540读值中减去了D-木糖的背景OD540。对各分析重复三次。图7示出了各蛋白质提取物中所得的平均特异性XI活性。绝对特异活性低于实施例3中的活性,更可能是由于不同的反应条件导致。然而,对相对特异活性的比较清楚地表明所述XI活性对应于所述菌株的生长速度。更快的生长是由更高的XI活性所支持,所述AMxylA具有最高的活性并且ECxylA具有最低的活性。全部的所述组I的XI均具有比所述组II的ECxylA更高的平均活性。
表2:由SEQ ID NO标明的蛋白质的E值和XI组成员

Claims (3)

1.选自发酵单胞菌属(Zymomonas)和发酵杆菌属(Zymobacter)的重组细菌菌株,其中所述菌株包含木酮糖激酶、转酮醇酶和转醛醇酶,并且进一步包含SEQ ID NO:308所示的异源核酸分子,其中所述菌株利用木糖作为碳源,并且其中所述重组细菌菌株产生的乙醇量超过不包含所述异源核酸分子的对应的亲本菌株产生的乙醇量的3.5倍。
2.改善重组细菌细胞中木糖利用的方法,包括:
a)提供选自发酵单胞菌属和发酵杆菌属的重组细菌菌株,所述重组细菌菌株包含木酮糖激酶、转酮醇酶和转醛醇酶;以及
b)导入SEQ ID NO:308所示的异源核酸分子;
其中步骤(b)中获得的重组细菌菌株与步骤(a)的重组细菌菌株相比具有改善的木糖利用,并且产生的乙醇量超过步骤(a)的重组细菌菌株产生的乙醇量的3.5倍。
3.生产乙醇的方法,包括:
a)提供权利要求1的重组细菌菌株;以及
b)在所述菌株生产乙醇的条件下,使(a)的菌株与木糖接触。
CN201180032513.5A 2010-06-29 2011-06-28 在具有另外木糖异构酶活性的重组发酵单胞菌属中改善的木糖利用 Expired - Fee Related CN103003423B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US35946310P 2010-06-29 2010-06-29
US61/359463 2010-06-29
PCT/US2011/042132 WO2012003178A1 (en) 2010-06-29 2011-06-28 Improved xylose utilization in recombinant zymomonas having additional xylose isomerase activity

Publications (2)

Publication Number Publication Date
CN103003423A CN103003423A (zh) 2013-03-27
CN103003423B true CN103003423B (zh) 2017-04-19

Family

ID=44629003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180032513.5A Expired - Fee Related CN103003423B (zh) 2010-06-29 2011-06-28 在具有另外木糖异构酶活性的重组发酵单胞菌属中改善的木糖利用

Country Status (9)

Country Link
US (1) US8623623B2 (zh)
EP (1) EP2588607B1 (zh)
JP (1) JP6066904B2 (zh)
CN (1) CN103003423B (zh)
AU (1) AU2011271468B2 (zh)
BR (1) BR112012031844A2 (zh)
CA (1) CA2803878C (zh)
MY (1) MY164392A (zh)
WO (1) WO2012003178A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8476048B2 (en) 2010-12-17 2013-07-02 E I Du Pont De Nemours And Company Xylose utilizing zymomonas mobilis with improved ethanol production in biomass hydrolysate medium
JP2014522634A (ja) 2011-06-17 2014-09-08 ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー イソブタノール発酵の原料としてのリグノセルロース加水分解物
US8911983B2 (en) 2011-12-20 2014-12-16 E I Du Pont De Nemours And Company Pnp gene modification for improved xylose utilization in Zymomonas
US20130157332A1 (en) 2011-12-20 2013-06-20 E I Du Pont De Nemours And Company Gene inactivation allowing immediate growth on xylose medium by engineered zymomonas
US8759069B2 (en) 2012-06-15 2014-06-24 E I Du Pont De Nemours And Company Contaminant control in Zymomonas fermentation using hop acids
US20140178954A1 (en) 2012-12-20 2014-06-26 E I Du Pont De Nemours And Company Expression of xylose isomerase activity in yeast
US8846357B2 (en) 2012-12-20 2014-09-30 E I Du Pont De Nemours And Company Stabilized chlorine dioxide for contamination control in Zymomonas fermentation
US8669076B1 (en) 2013-03-11 2014-03-11 E I Du Pont De Nemours And Company Cow rumen xylose isomerases active in yeast cells
US9187743B2 (en) 2013-03-11 2015-11-17 E I Du Pont De Nemours And Company Bacterial xylose isomerases active in yeast cells
US20140273105A1 (en) 2013-03-12 2014-09-18 E I Du Pont De Nemours And Company Gradient pretreatment of lignocellulosic biomass
US20150087041A1 (en) 2013-09-26 2015-03-26 E I Du Pont De Nemours And Company Production of ethanol with reduced contaminants in a cellulosic biomass based process
US20150087040A1 (en) 2013-09-26 2015-03-26 E I Du Pont De Nemours And Company Production of ethanol and recycle water in a cellulosic fermentation process
US9139818B2 (en) 2013-09-26 2015-09-22 E I Du Pont De Nemours And Company High expression Zymomonas promoters
US10227623B2 (en) 2013-11-24 2019-03-12 E I Du Pont De Nemours And Company High force and high stress destructuring of cellulosic biomass
WO2015102999A1 (en) 2013-12-30 2015-07-09 E. I. Du Pont De Nemours And Company Drought tolerant plants and related constructs and methods involving genes encoding dtp4 polypeptides
US9371546B2 (en) 2014-06-24 2016-06-21 E I Du Pont De Nemours And Company Enhancing D-xylose and L-arabinose utilization in Zymomonas cells
EA035044B1 (ru) 2015-06-05 2020-04-21 Юнилевер Н.В. Устройство для доставки системы восстановления эмали на поверхность зубов
WO2016192924A1 (en) 2015-06-05 2016-12-08 Unilever Plc Oral care device
JP6977231B2 (ja) 2015-07-13 2021-12-08 マラ リニューアブルズ コーポレーション C5有機炭素の微生物による代謝の増強
JP7325335B2 (ja) 2017-05-05 2023-08-14 シーレクター ゲーエムベーハー グルコースイソメラーゼ
EP3765607A4 (en) * 2018-03-15 2022-04-27 Petiva Private Limited AN ISOMERASE ENCODING NUCLEIC ACID AND USES THEREOF
ES2960965T3 (es) 2019-04-22 2024-03-07 Ino Takayuki Economizador
WO2023110822A1 (en) 2021-12-14 2023-06-22 C-Lecta Gmbh Glucose isomerases

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1665959A (zh) * 2002-07-09 2005-09-07 西门子公司 高耐氧化部件
WO2009120731A2 (en) * 2008-03-27 2009-10-01 E. I. Du Pont De Nemours And Company Zymomonas with improved xylose utilization

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5712133A (en) 1994-04-15 1998-01-27 Midwest Research Institute Pentose fermentation by recombinant zymomonas
US5514583A (en) 1994-04-15 1996-05-07 Midwest Research Institute Recombinant zymomonas for pentose fermentation
US5843760A (en) 1994-04-15 1998-12-01 Midwest Research Institute Single zymomonas mobilis strain for xylose and arabinose fermentation
WO1995028476A1 (en) 1994-04-15 1995-10-26 Midwest Research Institute Recombinant zymomonas for pentose fermentation
SE9901298D0 (sv) 1999-04-09 1999-04-09 Forskarpatent I Syd Ab Xylose isomerase with improved kinetic properties
US7223575B2 (en) 2000-05-01 2007-05-29 Midwest Research Institute Zymomonas pentose-sugar fermenting strains and uses thereof
US6566107B1 (en) 2000-11-01 2003-05-20 Midwest Research Institute Recombinant Zymomonas mobilis with improved xylose utilization
US7741119B2 (en) * 2006-09-28 2010-06-22 E. I. Du Pont De Nemours And Company Xylitol synthesis mutant of xylose-utilizing zymomonas for ethanol production
US7741084B2 (en) 2006-09-28 2010-06-22 E. I. Du Pont De Nemours And Company Ethanol production using xylitol synthesis mutant of xylose-utilizing zymomonas
US7629156B2 (en) 2006-09-28 2009-12-08 E.I. Du Pont De Nemours And Company Ethanol production in fermentation of mixed sugars containing xylose
US7803623B2 (en) 2007-10-30 2010-09-28 E.I. Du Pont De Nemours And Company Zymomonas with improved ethanol production in medium containing concentrated sugars and acetate
JP5444323B2 (ja) 2008-03-27 2014-03-19 イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニー 高発現ザイモモナス(Zymomonas)プロモーター
US8247208B2 (en) 2008-12-22 2012-08-21 Alliance For Sustainable Energy Llc Zymomonas with improved xylose utilization in stress conditions
US20110143408A1 (en) 2009-06-18 2011-06-16 E. I. Du Pont De Nemours And Company Zymomonas with improved arabinose utilization

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1665959A (zh) * 2002-07-09 2005-09-07 西门子公司 高耐氧化部件
WO2009120731A2 (en) * 2008-03-27 2009-10-01 E. I. Du Pont De Nemours And Company Zymomonas with improved xylose utilization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Restoration of a Defective Lactococcus lactis Xylose Isomerase;Joo-Heon Park等;《APPLIED AND ENVIRONMENTAL MICROBIOLOGY》;20040731;第70卷(第7期);4318-4325页 *

Also Published As

Publication number Publication date
JP6066904B2 (ja) 2017-01-25
CA2803878C (en) 2014-09-09
WO2012003178A1 (en) 2012-01-05
EP2588607B1 (en) 2017-06-21
BR112012031844A2 (pt) 2016-02-16
JP2013532979A (ja) 2013-08-22
EP2588607A1 (en) 2013-05-08
AU2011271468A1 (en) 2012-12-06
CN103003423A (zh) 2013-03-27
US8623623B2 (en) 2014-01-07
CA2803878A1 (en) 2012-01-05
AU2011271468B2 (en) 2016-05-12
MY164392A (en) 2017-12-15
US20110318801A1 (en) 2011-12-29

Similar Documents

Publication Publication Date Title
CN103003423B (zh) 在具有另外木糖异构酶活性的重组发酵单胞菌属中改善的木糖利用
CN102985540B (zh) 在具有提高的核糖-5-磷酸活性的重组发酵单胞菌属中的改善的木糖利用
CN101883861B (zh) 利用hima表达减少的重组发酵单胞菌属菌株从包含木糖的培养基生产乙醇的方法
US20100105114A1 (en) Methods and Compositions for Regulating Sporulation
JP2013545491A (ja) バイオマス加水分解物培地中でのキシロース資化性ザイモモナス・モビリスによるエタノール産生の向上
CN102459570A (zh) 具有改善的***糖利用率的发酵单胞菌属细菌
CN101970671A (zh) 在包含浓缩糖和乙酸盐的培养基中具有改进的乙醇产量的发酵单胞菌属
Sveinsdóttir et al. Ethanol production from monosugars and lignocellulosic biomass by thermophilic bacteria isolated from Icelandic hot springs
CN103998607B (zh) 用于改善发酵单胞菌属(Zymomonas)中的木糖利用率的PNP基因修饰
CN104220590A (zh) 使得工程化的发酵单胞菌在木糖培养基上立即生长的基因失活
CN106554924A (zh) 生产乙醇的重组酿酒酵母菌株、其构建方法以及利用该菌株生产乙醇的方法
CN1935991B (zh) 产气荚膜梭菌甘油脱水酶基因及其1,3-丙二醇的生产方法
EP3160987B1 (en) Enhancing d-xylose and l-arabinose utilization in zymomonas cells
US20120045821A1 (en) Methods and compositions for genetic engineering of cyanobacteria to produce ethanol

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170419

Termination date: 20180628