CN101454457A

CN101454457A - 四碳醇的发酵生产

Info

Publication number: CN101454457A
Application number: CNA200780015929XA
Authority: CN
Inventors: G·K·多纳德森; A·C·伊里奥特; V·纳加拉詹; C·E·纳卡穆拉; J·-F·汤姆布
Original assignee: EI Du Pont de Nemours and Co
Current assignee: EIDP Inc
Priority date: 2006-05-02
Filing date: 2007-05-02
Publication date: 2009-06-10
Also published as: ZA200807719B; CN101437948A

Abstract

本发明提供了发酵生产四碳醇的方法。具体地讲，通过表达2－丁醇生物合成途径的重组细菌进行发酵生长而生产丁醇，优选2－丁醇。本发明的重组微生物和方法还可以适于生产2－丁酮，2－丁酮是本文所公开的2－丁醇生物合成途径中的中间产物。

Description

四碳醇的发酵生产

相关申请的交叉参考

根据美国法典第35条第119款，本专利申请要求提交于2006年5月2日的美国临时申请案No.60/796816和提交于2006年12月21日的美国临时申请案No.60/871156的优先权。

发明领域

本发明涉及工业微生物领域和醇的生产。更具体地讲，2-丁醇是通过重组微生物的工业发酵而产生。本发明的重组微生物和方法还可以适于生产2-丁酮，2-丁酮是本文所公开的2-丁醇生物合成途径中的中间产物。

发明背景

丁醇是一种重要的工业化学品，可用作燃料添加剂、塑料工业中的化学原料以及食品和香料工业中的食品级萃取剂。每年，通过石油化学手段生产100亿镑至120亿磅的丁醇，并且对该日用化学品的需求可能还会增加。2-丁酮(也称作甲基乙基酮(MEK))是一种应用广泛的溶剂，并且是仅次于丙酮的最重要的商业生产的酮。它被用作油漆、树脂和粘合剂的溶剂，以及用作选择性萃取剂和氧化反应的活化剂。

2-丁酮的化学合成方法是已知的，例如通过2-丁醇的脱氢作用合成，或在其中将液体丁烷催化氧化而生成2-丁酮和乙酸的工艺中合成(Ullmann’s Encyclopedia of Industrial Chemistry，第6版，2003，Wiley-VCHVerlag GmbH and Co.，Weinheim，Germany，第5卷，第727-732页)。2-丁酮还可通过氢化而化学转化为2-丁醇(Breen等人，J.or Catalysis 236：270-281(2005))。2-丁醇的化学合成方法是已知的，例如通过正丁烯的水合合成(Ullmann’s Encyclopedia of IndustrialChemistry，第6版，2003，Wiley-VCHVerlag GmbH and Co.，Weinheim，Germany，第5卷，第716-719页)。这些工艺利用衍生自石油化学品的起始材料并通常昂贵，并且对环境不友好。用衍生自植物的原材料生产2-丁酮和2-丁醇将会使温室气体排放达到最低程度并将代表本领域的进步。

通过生物转化其它有机化学品来生产2-丁醇的方法也是已知的。例如，Stampfer等人(WO 03/078615)描述了仲醇例如2-丁醇的生产方法，该方法是通过由得自赤红球菌(Rhodococcus ruber)的醇脱氢酶催化酮的还原而产生仲醇。同样，Kojima等人(EP0645453)描述了产生仲醇例如2-丁醇的方法，该方法是通过由得自***滑假丝酵母(Candida parapsilosis)的仲醇脱氢酶催化酮的还原而制备仲醇。另外，Kuehnle等人(EP1149918)描述了产生1-丁醇和2-丁醇两者的工艺，该工艺是通过赤红球菌的多种菌株氧化烃而产生。该工艺对1-丁醇产生具有93.8％的选择性。

通过乳酸杆菌(Lactobacilli)的某些菌株来生产2-丁醇的方法也是已知的(Speranza等人，J.Agric.Food Chem.(1997)45：3476-3480)。2-丁醇是通过转化内消旋-2，3-丁二醇而产生。还论述了通过这些乳酸杆菌菌株从乙酰乳酸和乙偶姻产生2-丁醇。然而，设计用于生产2-丁醇的重组微生物还未报道。

因此，需要环保型高性价比的生产2-丁醇和2-丁酮的工艺。本发明通过发现表达2-丁醇和2-丁酮生物合成途径的重组微生物生产宿主，从而满足了该需求。

发明概述

本发明提供了具有工程化2-丁醇生物合成途径的重组微生物。本发明还提供了具有工程化2-丁酮生物合成途径的重组微生物，该合成途径与省略最后一步的2-丁醇生物合成途径相同。工程化微生物可用于2-丁醇或2-丁酮的商业生产。因此，本发明提供了重组微生物宿主细胞，该宿主细胞包含至少一种编码多肽的DNA分子，该多肽催化底物至产物的转化，所述底物至产物的转化选自由以下转化组成的组：

i)丙酮酸转化为α-乙酰乳酸；

ii)α-乙酰乳酸转化为乙偶姻；

iii)乙偶姻转化为2，3-丁二醇；

iv)2，3-丁二醇转化为2-丁酮；和

v)2-丁酮转化为2-丁醇；

其中所述至少一种DNA分子与所述微生物宿主细胞是异源的，并且其中所述微生物宿主细胞产生2-丁醇。

在另一个实施方案中本发明提供了重组微生物宿主细胞，该宿主细胞包含至少一种编码多肽的DNA分子，该多肽催化底物至产物的转化，所述底物至产物的转化选自由以下转化组成的组：

i)丙酮酸转化为α-乙酰乳酸；

ii)α-乙酰乳酸转化为乙偶姻；

iii)乙偶姻转化为2，3-丁二醇；和

iv)2，3-丁二醇转化为2-丁酮；

其中所述至少一种DNA分子与所述微生物宿主细胞是异源的，并且其中所述微生物宿主细胞产生2-丁酮。

在另一个实施方案中，本发明提供了生产2-丁醇的方法，该方法包括：

1)提供重组微生物宿主细胞，其包含至少一种编码多肽的DNA分子，该多肽催化底物至产物的转化，所述底物至产物的转化选自由以下转化组成的组：

i)丙酮酸转化为α-乙酰乳酸；

ii)α-乙酰乳酸转化为乙偶姻；

iii)乙偶姻转化为2，3-丁二醇；

iv)2，3-丁二醇转化为2-丁酮；和

v)2-丁酮转化为2-丁醇；

其中所述至少一种DNA分子与所述微生物宿主细胞是异源的；和

2)使(1)中的宿主细胞在能产生2-丁醇的条件下与可发酵碳底物在发酵培养基中接触。

同样，本发明提供了生产2-丁酮的方法，该方法包括：

i)丙酮酸转化为α-乙酰乳酸；

ii)α-乙酰乳酸转化为乙偶姻；

iii)乙偶姻转化为2，3-丁二醇；和

iv)2，3-丁二醇转化为2-丁酮；

2)使(1)中的宿主细胞在能产生2-丁酮的条件下与可发酵碳底物在发酵培养基中接触。

在另一个实施方案中，本发明提供通过本发明的方法产生的含有2-丁醇或2-丁酮的发酵产物培养基。

附图、表和序列的说明

通过下面的详细说明、附图和随附的序列描述可以更全面地理解本发明，这些详细描述、附图和序列描述形成了本专利申请的一部分。

图1示出了生物合成2-丁酮和2-丁醇的四种不同途径。

图2示出了二醇/甘油脱水酶的全长大亚基的***树，其中移除了具有>95％同一性的序列(但保留了所有通过实验验证了的功能序列)，以及示出了列出该***树中每条序列的身份的索引表。经实验确定功能为二醇或甘油脱水酶的序列分别以黑色或浅灰色突出显示。

图3示出了二醇/甘油脱水酶的全长中等亚基的***树，其中移除了具有>95％同一性的序列，以及示出了列出该***树中每条序列的身份的索引表。经实验确定功能为二醇或甘油脱水酶的序列分别以黑色或浅灰色突出显示。

图4示出了二醇/甘油脱水酶的全长小亚基的***树，其中移除了具有>95％同一性的序列，以及示出了列出该***树中每条序列的身份的索引表。经实验确定功能为二醇或甘油脱水酶的序列分别以黑色或浅灰色突出显示。

表12是二醇/甘油脱水酶的α大亚基分布型HMM(Profile HMM)的表。表12是与电子表格形式一起提交并将其以引用的方式并入本文。

表13是二醇/甘油脱水酶的α中等亚基分布型HMM的表。表13是与电子表格形式一起提交并将其以引用的方式并入本文。

表14是二醇/甘油脱水酶的α小亚基分布型HMM的表。表14是与电子表格形式一起提交并将其以引用的方式并入本文。

下面的序列遵照37C.F.R.1.821-1.825(“Requirements for PatentApplications Containing Nucleotide Sequences and/or Amino AcidSequence Disclosures-the Sequence Rules”(对含有核酸序列和/或氨基酸序列公开的专利申请的要求-序列规则))，并且符合World IntellectualProperty Organization(世界知识产权组织，WIPO)ST.25标准(1998)以及EPO和PCT的序列清单要求(规则5.2和49.5(a-bis)以及Administrative Instructions(行政指令)的第208节和附录C)。用于核苷酸和氨基酸序列数据的符号和格式均遵照37C.F.R.§1.822中列出的规则。

表1

核酸和蛋白质SEQ ID号汇总表

说明	SEQ ID核酸	SEQ ID蛋白质
说明	SEQ ID核酸	SEQ ID蛋白质	budA，来自肺炎克雷伯菌(Klebsiella pneumoniae)ATCC 25955的乙酰乳酸脱羧酶	1	2
alsD，来自枯草芽孢杆菌(Bacillus subtilis)的乙酰乳酸脱羧酶	80	81	budA，来自肺炎克雷伯菌(Klebsiella pneumoniae)ATCC 25955的乙酰乳酸脱羧酶	1	2
alsD，来自枯草芽孢杆菌(Bacillus subtilis)的乙酰乳酸脱羧酶	80	81	budA，来自土生克雷伯菌(Klebsiella terrigena)的乙酰乳酸脱羧酶	82	83
budB，来自肺炎克雷伯菌ATCC 25955的乙酰乳酸合酶	3	4	budA，来自土生克雷伯菌(Klebsiella terrigena)的乙酰乳酸脱羧酶	82	83
budB，来自肺炎克雷伯菌ATCC 25955的乙酰乳酸合酶	3	4	alsS，来自枯草芽孢杆菌的乙酰乳酸合酶	76	77
budB，来自土生克雷伯菌的乙酰乳酸合酶	78	79	alsS，来自枯草芽孢杆菌的乙酰乳酸合酶	76	77
budB，来自土生克雷伯菌的乙酰乳酸合酶	78	79	budC，来自肺炎克雷伯菌IAM1063的丁二醇脱氢酶	5	6
来自蜡状芽孢杆菌(Bacillus cereus)的丁二醇脱氢酶	84	85	budC，来自肺炎克雷伯菌IAM1063的丁二醇脱氢酶	5	6
来自蜡状芽孢杆菌(Bacillus cereus)的丁二醇脱氢酶	84	85	来自蜡状芽孢杆菌的丁二醇脱氢酶	86	87
butB，来自乳酸乳球菌(Lactococcus lactis)的丁二醇脱氢酶	88	89	来自蜡状芽孢杆菌的丁二醇脱氢酶	86	87
butB，来自乳酸乳球菌(Lactococcus lactis)的丁二醇脱氢酶	88	89	pddA，来自产酸克雷伯菌(Klebsiella oxytoca)ATCC 8724的丁二醇脱水酶α亚基	7	8
pddB，来自产酸克雷伯菌ATCC 8724的丁二醇脱水酶β亚基	9	10	pddA，来自产酸克雷伯菌(Klebsiella oxytoca)ATCC 8724的丁二醇脱水酶α亚基	7	8
pddB，来自产酸克雷伯菌ATCC 8724的丁二醇脱水酶β亚基	9	10	pddC，来自产酸克雷伯菌ATCC 8724的丁二醇脱水酶γ亚基	11	12
pduC，来自鼠伤寒沙门氏菌(Salmonella typhimurium)的B12依赖型二醇脱水酶大亚基	92	93	pddC，来自产酸克雷伯菌ATCC 8724的丁二醇脱水酶γ亚基	11	12

pduD，来自鼠伤寒沙门氏菌的B12依赖型二醇脱水酶中等亚基	94	95
pduD，来自鼠伤寒沙门氏菌的B12依赖型二醇脱水酶中等亚基	94	95	pduE，来自鼠伤寒沙门氏菌的B12依赖型二醇脱水酶小亚基	96	97
pduC，来自丘状乳杆菌(Lactobacillus collinoides)的B12依赖型二醇脱水酶大亚基	98	99	pduE，来自鼠伤寒沙门氏菌的B12依赖型二醇脱水酶小亚基	96	97
pduC，来自丘状乳杆菌(Lactobacillus collinoides)的B12依赖型二醇脱水酶大亚基	98	99	pduD，来自丘状乳杆菌的B12依赖型二醇脱水酶中等亚基	100	101
pduE，来自丘状乳杆菌的B12依赖型二醇脱水酶小亚基	102	103	pduD，来自丘状乳杆菌的B12依赖型二醇脱水酶中等亚基	100	101
pduE，来自丘状乳杆菌的B12依赖型二醇脱水酶小亚基	102	103	pddC，来自肺炎克雷伯菌的腺苷钴胺素依赖型二醇脱水酶α亚基	104	105
pddD，来自肺炎克雷伯菌的腺苷钴胺素依赖型二醇脱水酶β亚基	106	107	pddC，来自肺炎克雷伯菌的腺苷钴胺素依赖型二醇脱水酶α亚基	104	105
pddD，来自肺炎克雷伯菌的腺苷钴胺素依赖型二醇脱水酶β亚基	106	107	pddD，来自肺炎克雷伯菌的腺苷钴胺素依赖型二醇脱水酶γ亚基	108	109
ddrA，来自产酸克雷伯菌的二醇脱水酶再活化因子大亚基	110	111	pddD，来自肺炎克雷伯菌的腺苷钴胺素依赖型二醇脱水酶γ亚基	108	109
ddrA，来自产酸克雷伯菌的二醇脱水酶再活化因子大亚基	110	111	ddrB，来自产酸克雷伯菌的二醇脱水酶再活化因子小亚基	112	113
pduG，来自鼠伤寒沙门氏菌的二醇脱水酶再活化因子大亚基	114	115	ddrB，来自产酸克雷伯菌的二醇脱水酶再活化因子小亚基	112	113
pduG，来自鼠伤寒沙门氏菌的二醇脱水酶再活化因子大亚基	114	115	pduH，来自鼠伤寒沙门氏菌的二醇脱水酶再活化因子小亚基	116	117
pduG，来自丘状乳杆菌的二醇脱水酶再活化因子大亚基	118	119	pduH，来自鼠伤寒沙门氏菌的二醇脱水酶再活化因子小亚基	116	117
pduG，来自丘状乳杆菌的二醇脱水酶再活化因子大亚基	118	119	pduH，来自丘状乳杆菌的二醇脱水酶再活化因子小亚基	120	121
sadH，来自赤红球菌(Rhodococcus ruber)219的丁醇脱氢酶	13	14	pduH，来自丘状乳杆菌的二醇脱水酶再活化因子小亚基	120	121
sadH，来自赤红球菌(Rhodococcus ruber)219的丁醇脱氢酶	13	14	adhA，来自强烈炽热球菌(Pyrococcus furiosus)的丁醇脱氢酶	90	91
chnA，来自不动杆菌属菌种(Acinteobacter sp.)的环己醇脱氢酶	71	72	adhA，来自强烈炽热球菌(Pyrococcus furiosus)的丁醇脱氢酶	90	91
chnA，来自不动杆菌属菌种(Acinteobacter sp.)的环己醇脱氢酶	71	72	yqhD，来自大肠杆菌的丁醇脱氢酶	74	75
来自河流弧菌(Vibrio fluvialis)的胺：丙酮酸转氨酶(乙偶姻胺化酶(aminase))	144经密码子优化的	122	yqhD，来自大肠杆菌的丁醇脱氢酶	74	75
来自河流弧菌(Vibrio fluvialis)的胺：丙酮酸转氨酶(乙偶姻胺化酶(aminase))	144经密码子优化的	122	来自胡萝卜软腐欧文氏菌黑胫亚种(Erwinia carotovora subsp atroseptica)的氨基醇激酶	123	124
来自胡萝卜软腐欧文氏菌黑胫亚种的氨基醇O-磷酸酯裂解酶	125	126	来自胡萝卜软腐欧文氏菌黑胫亚种(Erwinia carotovora subsp atroseptica)的氨基醇激酶	123	124
来自胡萝卜软腐欧文氏菌黑胫亚种的氨基醇O-磷酸酯裂解酶	125	126	budC，来自土生克雷伯菌(现在称为土生拉乌尔菌(Raoultellaterrigena))的乙偶姻还原酶(丁二醇脱氢酶)	133	134
来自肺炎克雷伯菌的甘油脱水酶α亚基	145	146		133	134

来自肺炎克雷伯菌的甘油脱水酶β亚基	147	148
来自肺炎克雷伯菌的甘油脱水酶β亚基	147	148	来自肺炎克雷伯菌的甘油脱水酶γ亚基	149	150
来自肺炎克雷伯菌的甘油脱水酶再激活酶大亚基	151	152	来自肺炎克雷伯菌的甘油脱水酶γ亚基	149	150
来自肺炎克雷伯菌的甘油脱水酶再激活酶大亚基	151	152	来自肺炎克雷伯菌的甘油脱水酶再激活酶小亚基	153	154

SEQ ID NO：15-65是实施例中所用的寡核苷酸PCR引物、克隆引物、筛选引物和测序引物的核苷酸序列。

SEQ ID NO：66是实施例11中所述的大肠杆菌菌株MG1655ΔyqhCD中yqhD基因的缺失区的核苷酸序列。

SEQ ID NO：67是葡萄糖异构酶启动子1.6GI的变体的核苷酸序列。

SEQ ID NO：68是1.5GI启动子的核苷酸序列。

SEQ ID NO：69是来自产酸克雷伯菌的二醇脱水酶操纵子的核苷酸序列。

SEQ ID NO：70是来自产酸克雷伯菌的二醇脱水酶再活化因子操纵子的核苷酸序列。

SEQ ID NO：73是实施例9中所述的pDCQ2的核苷酸序列。

SEQ ID NO：127-132是实施例中所用的其它寡核苷酸PCR引物和克隆引物的核苷酸序列。

SEQ ID NO：155是胡萝卜软腐欧文氏菌黑胫亚种的氨基醇激酶的密码子优化的编码区。

SEQ ID NO：156是胡萝卜软腐欧文氏菌黑胫亚种的氨基醇O-磷酸酯裂解酶的密码子优化的编码区。

SEQ ID NO：157-163是实施例中所用的其它寡核苷酸PCR引物和克隆引物的核苷酸序列。

SEQ ID NO：275是来自胡萝卜软腐欧文氏菌黑胫亚种的操作子的核苷酸序列。

表2：

其它甘油和二醇脱水酶的大亚基、中等亚基和小亚基

^a 说明	^b 亚基	蛋白质 SEQ ID
^a 说明	^b 亚基	蛋白质 SEQ ID	来自相同生物体的相应亚基^c
来自巴斯德梭菌(Clostridium pasteurianum)的甘油脱水酶α亚基	L	135	来自相同生物体的相应亚基^c
来自巴斯德梭菌(Clostridium pasteurianum)的甘油脱水酶α亚基	L	135	来自巴斯德梭菌的甘油脱水酶β亚基	M	136
来自巴斯德梭菌的甘油脱水酶γ亚基	S	137	来自巴斯德梭菌的甘油脱水酶β亚基	M	136
来自巴斯德梭菌的甘油脱水酶γ亚基	S	137	来自蟑螂埃希氏菌(Escherichia blattae)的甘油脱水酶α亚基	L	138
来自蟑螂埃希氏菌的甘油脱水酶β亚基	M	139	来自蟑螂埃希氏菌(Escherichia blattae)的甘油脱水酶α亚基	L	138
来自蟑螂埃希氏菌的甘油脱水酶β亚基	M	139	来自蟑螂埃希氏菌的甘油脱水酶γ亚基	S	140
来自弗氏柠檬酸杆菌(Citrobacter freundii)的甘油脱水酶α亚基	L	141	来自蟑螂埃希氏菌的甘油脱水酶γ亚基	S	140
来自弗氏柠檬酸杆菌(Citrobacter freundii)的甘油脱水酶α亚基	L	141	来自弗氏柠檬酸杆菌的甘油脱水酶β亚基	M	142
来自弗氏柠檬酸杆菌的甘油脱水酶γ亚基	S	143	来自弗氏柠檬酸杆菌的甘油脱水酶β亚基	M	142
来自弗氏柠檬酸杆菌的甘油脱水酶γ亚基	S	143	来自短乳杆菌(Lactobacillus brevis)的二醇脱水酶α亚基	L	164
来自短乳杆菌的二醇脱水酶β亚基	M	165	来自短乳杆菌(Lactobacillus brevis)的二醇脱水酶α亚基	L	164
来自短乳杆菌的二醇脱水酶β亚基	M	165	来自短乳杆菌的二醇脱水酶γ亚基	S	166
来自肠道沙门氏菌(Salmonella enterica)肠道亚种(enterica subsp.)猪霍乱血清型(serovar Choleraesuis)菌株SC-B67的二醇脱水酶α亚基	L	167	来自短乳杆菌的二醇脱水酶γ亚基	S	166
	L	167	来自肠道沙门氏菌肠道亚种猪霍乱血清型菌株SC-B67的二醇脱水酶β亚基	M	168
来自肠道沙门氏菌肠道亚种猪霍乱血清型菌株SC-B67的二醇脱水酶γ亚基	S	169	来自肠道沙门氏菌肠道亚种猪霍乱血清型菌株SC-B67的二醇脱水酶β亚基	M	168
来自肠道沙门氏菌肠道亚种猪霍乱血清型菌株SC-B67的二醇脱水酶γ亚基	S	169	来自大肠杆菌E24377A的丙二醇脱水酶大亚基	L	170
来自大肠杆菌E24377A的二醇/甘油脱水酶中等亚基	M	171	来自大肠杆菌E24377A的丙二醇脱水酶大亚基	L	170
来自大肠杆菌E24377A的二醇/甘油脱水酶中等亚基	M	171	来自大肠杆菌E24377A的丙二醇脱水酶小亚基	S	172

来自宋内志贺菌(Shigella sonnei)Ss046的二醇脱水酶大亚基	L	173
来自宋内志贺菌(Shigella sonnei)Ss046的二醇脱水酶大亚基	L	173	来自宋内志贺菌Ss046的二醇脱水酶中等亚基	M	174
来自宋内志贺菌Ss046的二醇脱水酶小亚基	S	175	来自宋内志贺菌Ss046的二醇脱水酶中等亚基	M	174
来自宋内志贺菌Ss046的二醇脱水酶小亚基	S	175	来自伯氏耶尔森菌(Yersinia bercovieri)ATCC 43970的丙二醇脱水酶大亚基	L	176
来自伯氏耶尔森菌ATCC 43970的假定蛋白YberA0_1000484	M	177	来自伯氏耶尔森菌(Yersinia bercovieri)ATCC 43970的丙二醇脱水酶大亚基	L	176
来自伯氏耶尔森菌ATCC 43970的假定蛋白YberA0_1000484	M	177	来自伯氏耶尔森菌ATCC 43970的丙二醇脱水酶小亚基	S	178
来自莫氏耶尔森菌ATCC 43969的丙二醇脱水酶大亚基	L	179	来自伯氏耶尔森菌ATCC 43970的丙二醇脱水酶小亚基	S	178
来自莫氏耶尔森菌ATCC 43969的丙二醇脱水酶大亚基	L	179	来自莫氏耶尔森菌ATCC 43969的假定蛋白YmolA_01001292	M	180
来自莫氏耶尔森菌ATCC 43969的丙二醇脱水酶小亚基	S	181	来自莫氏耶尔森菌ATCC 43969的假定蛋白YmolA_01001292	M	180
来自莫氏耶尔森菌ATCC 43969的丙二醇脱水酶小亚基	S	181	来自小肠结肠炎耶尔森菌(Yersinia enterocolitica)小肠结肠炎亚种(subsp.enterocolitica)8081的二醇脱水酶大亚基	L	182
来自小肠结肠炎耶尔森菌小肠结肠炎亚种8081的二醇脱水酶中等亚基	M	183		L	182
来自小肠结肠炎耶尔森菌小肠结肠炎亚种8081的二醇脱水酶中等亚基	M	183	来自小肠结肠炎耶尔森菌小肠结肠炎亚种8081的二醇脱水酶小亚基	S	184
来自中间耶尔森菌(Yersinia intermedia)ATCC 29909的丙二醇脱水酶大亚基	L	185	来自小肠结肠炎耶尔森菌小肠结肠炎亚种8081的二醇脱水酶小亚基	S	184
来自中间耶尔森菌(Yersinia intermedia)ATCC 29909的丙二醇脱水酶大亚基	L	185	来自中间耶尔森菌ATCC 29909的二醇/甘油脱水酶中等亚基	M	186
来自中间耶尔森菌ATCC 29909的丙二醇脱水酶小亚基	S	187	来自中间耶尔森菌ATCC 29909的二醇/甘油脱水酶中等亚基	M	186
来自中间耶尔森菌ATCC 29909的丙二醇脱水酶小亚基	S	187	来自威氏李斯特杆菌(Listeria welshimeri)血清型6b菌株SLCC5334的甘油脱水酶大亚基	L	188
来自威氏李斯特杆菌血清型6b菌株SLCC5334的利用丙二醇的脱水酶中等亚基	M	189	来自威氏李斯特杆菌(Listeria welshimeri)血清型6b菌株SLCC5334的甘油脱水酶大亚基	L	188
来自威氏李斯特杆菌血清型6b菌株SLCC5334的利用丙二醇的脱水酶中等亚基	M	189	来自威氏李斯特杆菌血清型6b菌株SLCC5334的利用丙二醇的脱水酶小亚基	S	190
来自无害李斯特菌(Listeria innocua)Clip11262的假定蛋白lin1117	L	191	来自威氏李斯特杆菌血清型6b菌株SLCC5334的利用丙二醇的脱水酶小亚基	S	190
来自无害李斯特菌(Listeria innocua)Clip11262的假定蛋白lin1117	L	191	来自无害李斯特菌Clip11262的假定蛋白lin1118	M	192
来自无害李斯特菌Clip11262的假定蛋白lin1119	S	193	来自无害李斯特菌Clip11262的假定蛋白lin1118	M	192
来自无害李斯特菌Clip11262的假定蛋白lin1119	S	193	来自单核细胞增多性李斯特菌(Listeria monocytogenes)EGD-e的假定蛋白1mol153	L	194

来自单核细胞增多性李斯特菌EGD-e的假定蛋白lmo1154	M	195
来自单核细胞增多性李斯特菌EGD-e的假定蛋白lmo1154	M	195	来自单核细胞增多性李斯特菌EGD-e的假定蛋白lmo1155	S	196
来自肠道沙门氏菌肠道亚种伤寒血清型(serovar Typhi)菌株CT18的甘油脱水酶大亚基	L	197	来自单核细胞增多性李斯特菌EGD-e的假定蛋白lmo1155	S	196
来自肠道沙门氏菌肠道亚种伤寒血清型(serovar Typhi)菌株CT18的甘油脱水酶大亚基	L	197	来自肠道沙门氏菌肠道亚种伤寒血清型菌株CT18的二醇脱水酶中等亚基	M	198
来自肠道沙门氏菌肠道亚种伤寒血清型菌株CT18的二醇脱水酶小亚基	S	199	来自肠道沙门氏菌肠道亚种伤寒血清型菌株CT18的二醇脱水酶中等亚基	M	198
来自肠道沙门氏菌肠道亚种伤寒血清型菌株CT18的二醇脱水酶小亚基	S	199	来自大肠杆菌的推定的甘油脱水酶大亚基	L	200
来自大肠杆菌的推定的二醇脱水酶中等亚基	M	201	来自大肠杆菌的推定的甘油脱水酶大亚基	L	200
来自大肠杆菌的推定的二醇脱水酶中等亚基	M	201	来自大肠杆菌的推定的二醇脱水酶小亚基	S	202
来自单核细胞增多性李斯特菌菌株4b F2365的甘油脱水酶大亚基	L	203	来自大肠杆菌的推定的二醇脱水酶小亚基	S	202
来自单核细胞增多性李斯特菌菌株4b F2365的甘油脱水酶大亚基	L	203	来自单核细胞增多性李斯特菌菌株4b F2365的利用丙二醇的脱水酶中等亚基	M	204
来自单核细胞增多性李斯特菌菌株4b F2365的利用丙二醇的脱水酶小亚基	S	205	来自单核细胞增多性李斯特菌菌株4b F2365的利用丙二醇的脱水酶中等亚基	M	204
来自单核细胞增多性李斯特菌菌株4b F2365的利用丙二醇的脱水酶小亚基	S	205	来自血链球菌(Streptococcus sanguis)SK36的推定的甘油脱水酶大亚基pduC	L	206
来自血链球菌SK36的推定的利用丙二醇的脱水酶中等亚基	M	207	来自血链球菌(Streptococcus sanguis)SK36的推定的甘油脱水酶大亚基pduC	L	206
来自血链球菌SK36的推定的利用丙二醇的脱水酶中等亚基	M	207	来自血链球菌SK36的推定的B12-依赖型二醇脱水酶小亚基	S	208
来自蟑螂埃希菌的DhaB	L	209	来自血链球菌SK36的推定的B12-依赖型二醇脱水酶小亚基	S	208
来自蟑螂埃希菌的DhaB	L	209	来自蟑螂埃希菌的DhaC	M	210
来自蟑螂埃希菌DhaE	S	211	来自蟑螂埃希菌的DhaC	M	210
来自蟑螂埃希菌DhaE	S	211	来自产气荚膜梭菌(Clostridium perfringens)菌株13的辅酶B12-依赖型甘油脱氢酶大亚基	L	212
来自产气荚膜梭菌菌株13的辅酶B12-依赖型甘油脱氢酶中等亚基	M	213	来自产气荚膜梭菌(Clostridium perfringens)菌株13的辅酶B12-依赖型甘油脱氢酶大亚基	L	212
来自产气荚膜梭菌菌株13的辅酶B12-依赖型甘油脱氢酶中等亚基	M	213	来自产气荚膜梭菌菌株13的辅酶B12-依赖型甘油脱氢酶小亚基	S	214
来自费氏耶尔森菌(Yersinia frederiksenii)ATCC 33641的丙二醇脱水酶大亚基	L	215	来自产气荚膜梭菌菌株13的辅酶B12-依赖型甘油脱氢酶小亚基	S	214
来自费氏耶尔森菌(Yersinia frederiksenii)ATCC 33641的丙二醇脱水酶大亚基	L	215	来自费氏耶尔森菌ATCC 33641的假定蛋白YfreA_01000478	M	216
来自费氏耶尔森菌ATCC 33641的丙二醇脱水酶小亚基	S	217	来自费氏耶尔森菌ATCC 33641的假定蛋白YfreA_01000478	M	216
来自费氏耶尔森菌ATCC 33641的丙二醇脱水酶小亚基	S	217	来自嗜热厌氧产乙醇杆菌(Thermoanaerobacter ethanolicus)	L	218

X514的甘油脱水酶
X514的甘油脱水酶			来自嗜热厌氧产乙醇杆菌X514的脱水酶中等亚基	M	219
来自嗜热厌氧产乙醇杆菌X514的脱水酶小亚基	S	220	来自嗜热厌氧产乙醇杆菌X514的脱水酶中等亚基	M	219
来自嗜热厌氧产乙醇杆菌X514的脱水酶小亚基	S	220	来自希氏乳杆菌(Lactobacillus hilgardii)的甘油脱水酶大亚基GldC	L	221
来自希氏乳杆菌的甘油脱水酶中等亚基GldD	M	222	来自希氏乳杆菌(Lactobacillus hilgardii)的甘油脱水酶大亚基GldC	L	221
来自希氏乳杆菌的甘油脱水酶中等亚基GldD	M	222	来自希氏乳杆菌的甘油脱水酶小亚基GldE	S	223
来自罗伊氏乳杆菌(Lactobacillusreuteri)JCM1112的甘油脱水酶	L	224	来自希氏乳杆菌的甘油脱水酶小亚基GldE	S	223
来自罗伊氏乳杆菌(Lactobacillusreuteri)JCM1112的甘油脱水酶	L	224	类似来自罗伊氏乳杆菌JCM 1112的二醇脱水酶γ亚基	M	225
来自罗伊氏乳杆菌JCM 1112的利用丙二醇的脱水酶小亚基	S	226	类似来自罗伊氏乳杆菌JCM 1112的二醇脱水酶γ亚基	M	225
来自罗伊氏乳杆菌JCM 1112的利用丙二醇的脱水酶小亚基	S	226	来自Lactobacillus diolivorans的甘油脱水酶大亚基GldC	L	227
来自Lactobacillus diolivorans的甘油脱水酶中等亚基GldD	M	228	来自Lactobacillus diolivorans的甘油脱水酶大亚基GldC	L	227
来自Lactobacillus diolivorans的甘油脱水酶中等亚基GldD	M	228	来自Lactobacillus diolivorans的甘油脱水酶小亚基GldE	S	229
来自罗伊氏乳杆菌的丙二醇脱水酶大亚基	L	230	来自Lactobacillus diolivorans的甘油脱水酶小亚基GldE	S	229
来自罗伊氏乳杆菌的丙二醇脱水酶大亚基	L	230	来自罗伊氏乳杆菌的丙二醇脱水酶中等亚基	M	231
来自罗伊氏乳杆菌的丙二醇脱水酶小亚基	S	232	来自罗伊氏乳杆菌的丙二醇脱水酶中等亚基	M	231
来自罗伊氏乳杆菌的丙二醇脱水酶小亚基	S	232	来自百脉根中慢生根瘤菌(Mesorhizobium loti)MAFF303099的甘油脱水酶大亚基	L+M	233
来自百脉根中慢生根瘤菌MAFF303099的甘油脱水酶小亚基	S	234	来自百脉根中慢生根瘤菌(Mesorhizobium loti)MAFF303099的甘油脱水酶大亚基	L+M	233
来自百脉根中慢生根瘤菌MAFF303099的甘油脱水酶小亚基	S	234	来自Mycobacterium vanbaaleniiPYR-1的甘油脱水酶	L+M	235
来自Mycobacterium vanbaaleniiPYR-1的利用丙二醇的脱水酶小亚基	S	236	来自Mycobacterium vanbaaleniiPYR-1的甘油脱水酶	L+M	235
来自Mycobacterium vanbaaleniiPYR-1的利用丙二醇的脱水酶小亚基	S	236	来自分支杆菌菌种MCS的甘油脱水酶	L+M	237
来自分支杆菌菌种MCS的脱水酶小亚基	S	238	来自分支杆菌菌种MCS的甘油脱水酶	L+M	237
来自分支杆菌菌种MCS的脱水酶小亚基	S	238	来自微黄分枝杆菌(Mycobacterium flavescens)PYR-GCK的脱水酶大亚基：脱水酶中等亚基	L+M	239
来自微黄分枝杆菌PYR-GCK的利用丙二醇的脱水酶小亚基	S	240	来自微黄分枝杆菌(Mycobacterium flavescens)PYR-GCK的脱水酶大亚基：脱水酶中等亚基	L+M	239
来自微黄分枝杆菌PYR-GCK的利用丙二醇的脱水酶小亚基	S	240	来自分枝杆菌菌种JLS的甘油脱水酶	L+M	241
来自分枝杆菌JLS的脱水酶小亚基	S	242	来自分枝杆菌菌种JLS的甘油脱水酶	L+M	241
来自分枝杆菌JLS的脱水酶小亚基	S	242	来自耻垢分枝杆菌(Mycobacterium smegmatis)	L	243

菌株MC2 155的甘油脱水酶大亚基
菌株MC2 155的甘油脱水酶大亚基			来自耻垢分枝杆菌菌株MC2 155的脱水酶中等亚基	M	244
来自耻垢分枝杆菌菌株MC2 155的二醇脱水酶γ亚基	S	245	来自耻垢分枝杆菌菌株MC2 155的脱水酶中等亚基	M	244
来自耻垢分枝杆菌菌株MC2 155的二醇脱水酶γ亚基	S	245
另外的亚基
另外的亚基			来自耻垢分枝杆菌菌株MC2 155的甘油脱水酶大亚基	L+M	246
来自耻垢分枝杆菌菌株MC2 155的甘油脱水酶大亚基	L+M	247	来自耻垢分枝杆菌菌株MC2 155的甘油脱水酶大亚基	L+M	246
来自耻垢分枝杆菌菌株MC2 155的甘油脱水酶大亚基	L+M	247	来自耻垢分枝杆菌菌株MC2 155的辅酶B12-依赖型甘油脱氢酶小亚基	S	248
来自耻垢分枝杆菌菌株MC2 155的辅酶B12-依赖型甘油脱氢酶小亚基	S	249	来自耻垢分枝杆菌菌株MC2 155的辅酶B12-依赖型甘油脱氢酶小亚基	S	248
来自耻垢分枝杆菌菌株MC2 155的辅酶B12-依赖型甘油脱氢酶小亚基	S	249	来自肠道沙门氏菌肠道亚种甲型副伤寒血清型(serovar Paratyphi A)菌株ATCC 9150的二醇脱水酶中等亚基	M	250
来自肠道沙门氏菌肠道亚种甲型副伤寒血清型菌株ATCC 9150的二醇脱水酶小亚基	S	251		M	250
来自肠道沙门氏菌肠道亚种甲型副伤寒血清型菌株ATCC 9150的二醇脱水酶小亚基	S	251	来自产气荚膜梭菌SM101的甘油脱水酶β亚基	M	252
来自产气荚膜梭菌SM101的甘油脱水酶γ亚基	S	253	来自产气荚膜梭菌SM101的甘油脱水酶β亚基	M	252
来自产气荚膜梭菌SM101的甘油脱水酶γ亚基	S	253	来自肠道沙门氏菌肠道亚种鼠伤寒血清型(serovar Typhimurium)的PduC	L	254
来自单核细胞增多性李斯特菌菌株4b H7858的甘油脱水酶大亚基	L	255	来自肠道沙门氏菌肠道亚种鼠伤寒血清型(serovar Typhimurium)的PduC	L	254
来自单核细胞增多性李斯特菌菌株4b H7858的甘油脱水酶大亚基	L	255	来自蟑螂埃希菌的DhaB	L	256
来自未培养细菌的DhaB	L	257	来自蟑螂埃希菌的DhaB	L	256
来自未培养细菌的DhaB	L	257	来自未培养细菌的DhaB	L	258
来自丘状乳杆菌的甘油脱水酶大亚基GldC	L	259	来自未培养细菌的DhaB	L	258
来自丘状乳杆菌的甘油脱水酶大亚基GldC	L	259	来自未培养细菌的PduD	M	260
来自未培养细菌的PduD	M	261	来自未培养细菌的PduD	M	260
来自未培养细菌的PduD	M	261	来自未培养细菌的DhaC	M	262
来自未培养细菌的DhaC	M	263	来自未培养细菌的DhaC	M	262
来自未培养细菌的DhaC	M	263	来自未培养细菌的DhaC	M	264
来自产气荚膜梭菌ATCC 13124的辅酶B12-依赖型甘油脱水酶中等亚基	M	265	来自未培养细菌的DhaC	M	264
来自产气荚膜梭菌ATCC 13124的辅酶B12-依赖型甘油脱水酶中等亚基	M	265	未知	M	266
来自蟑螂埃希菌的甘油脱水酶β-亚基	M	267	未知	M	266
来自蟑螂埃希菌的甘油脱水酶β-亚基	M	267	来自未培养细菌的PduE	S	268

来自未培养细菌的PduE	S	269
来自未培养细菌的PduE	S	269	来自单核细胞增多性李斯特菌菌株1/2a F6854的脱水酶小亚基	S	270
来自未培养细菌的DhaE	S	271	来自单核细胞增多性李斯特菌菌株1/2a F6854的脱水酶小亚基	S	270
来自未培养细菌的DhaE	S	271	来自未培养细菌的DhaE	S	272
来自未培养细菌的DhaE	S	273	来自未培养细菌的DhaE	S	272
来自未培养细菌的DhaE	S	273	来自单核细胞增多性李斯特菌FSLN1-017的脱水酶小亚基	S	274
			来自单核细胞增多性李斯特菌FSLN1-017的脱水酶小亚基	S	274

^a说明：来自序列的GenBank注释，可能没有正确包括甘油或二醇的命称，或者可能没有包括亚基信息。

^b亚基：通过与产酸克雷伯菌酶的大亚基、中等亚基或小亚基的序列同源性鉴定。

^c来源于同一生物体的亚基在一起列出并且注释为相同的酶，或者具有靠近的GenBank号以表明在基因组中的接近。

发明详述

本发明涉及采用重组微生物生产2-丁醇的方法。本发明符合多种商业需求和工业需求。丁醇是一种具有多种应用的重要工业日用化学品，其中其作为燃料或燃料添加剂的潜力尤为重要。尽管丁醇仅仅是一种四碳醇，但是其具有与汽油相似的能含量，并且可以与任何化石燃料混合。丁醇是优选的燃料或燃料添加剂，因为它在标准内燃机中燃烧时仅生成CO₂以及少量(或不生成)SO_X或NO_X。另外，丁醇的腐蚀性不及乙醇，是目前为止最优选的燃料添加剂。

丁醇除了可用作生物燃料或燃料添加剂之外，在新兴的燃料电池工业中其还具有影响氢分配问题的潜力。如今，由于氢的运输和分配存在安全隐患，燃料电池饱受困扰。可以容易地对丁醇重整其氢含量，并且可以通过现有的加油站以燃料电池或汽车内燃机所需的纯度进行分配。

最后，本发明从源自植物的碳源生产2-丁醇，避免了与丁醇生产的标准石油化学工艺相关的负面的环境影响。

本发明还提供了生产2-丁酮的重组微生物和方法，2-丁酮是本文所公开的2-丁醇生物合成途径中的中间产物。2-丁酮也称为甲基乙基酮(MEK)，可用作油漆或其它涂料的溶剂。其还可用于合成橡胶工业以及用于石蜡的生产。

以下定义和缩写是用于权利要求和说明书的判读。

如在此所用的，术语“发明”或“本发明”为非限制性术语并且无意于指具体发明的任何单个实施方案，而是涵盖如说明书和权利要求书中所述的所有可能的实施方案。

术语“2-丁醇生物合成途径”指从丙酮酸产生2-丁醇的酶途径。

术语“2-丁酮生物合成途径”指从丙酮酸产生2-丁酮的酶途径。

术语“乙酰乳酸合酶”，也称“乙酰羟酸合酶”，指具有催化两分子丙酮酸转化为一分子α-乙酰乳酸的酶活性的一种多肽(或多种多肽)。乙酰乳酸合酶，即EC 2.2.1.6[原为EC 4.1.3.18](Enzyme Nomenclature1992，Academic Press，San Diego)，其活性可能取决于辅因子焦磷酸硫胺素。适用的乙酰乳酸合酶可得自多种来源，例如，枯草芽孢杆菌[GenBank No：AAA22222 NCBI(美国国家生物技术信息中心)氨基酸序列(SEQ ID NO：77)，L04470 NCBI核苷酸序列(SEQ ID NO：76)]、土生克雷伯菌[GenBank No：AAA25055(SEQ ID NO：79)，L04507(SEQ ID NO：78)]和肺炎克雷伯菌[GenBank No：AAA25079(SEQ IDNO：4)，M73842(SEQ ID NO：3)]。

术语“乙酰乳酸脱羧酶”指具有催化α-乙酰乳酸转化为乙偶姻的酶活性的一种多肽(或多种多肽)。乙酰乳酸脱羧酶(即EC 4.1.1.5)可得自例如枯草芽孢杆菌[GenBank No：AAA22223(SEQ ID NO：81)，L04470(SEQ ID NO：80)]、土生克雷伯菌[GenBank No：AAA25054(SEQ ID NO：83)，L04507(SEQ ID NO：82)]和肺炎克雷伯菌[GenBankNo：AAU43774(SEQ ID NO：2)，AY722056(SEQ ID NO：1)]。

术语“乙偶姻胺化酶(aminase)”指具有催化乙偶姻转化为3-氨基-2-丁醇的酶活性的一种多肽(或多种多肽)。乙偶姻胺化酶可以利用辅因子5’-磷酸吡哆醛或NADH(还原型烟酰胺腺嘌呤二核苷酸)或NADPH(还原型烟酰胺腺嘌呤二核苷酸磷酸)。所得产物在3号位上具有(R)或(S)立体化学。磷酸吡哆醛依赖型酶可将氨基酸(例如丙氨酸或谷氨酸)用作氨基供体。NADH依赖型和NADPH依赖型酶可将氨用作第二底物。NADH依赖型乙偶姻胺化酶(也称作氨基醇脱氢酶)的一个合适实例由Ito等人(美国专利No.6,432,688)进行了描述。吡哆醛依赖型乙偶姻胺化酶的一个实例是由Shin和Kim(J.Org.Chem.67：2848-2853(2002))描述的胺：丙酮酸氨基转移酶(也称为胺：丙酮酸转氨酶)。

术语“丁醇脱氢酶”指具有催化2-丁酮和2-丁醇相互转换的酶活性的一种多肽(或多种多肽)。丁醇脱氢酶是庞大的醇脱氢酶家族中的亚群。丁醇脱氢酶可以是NAD依赖型或NADP依赖型。NAD依赖型酶称为EC 1.1.1.1，可得自例如赤红球菌[GenBank No：CAD36475(SEQID NO：14)，AJ491307(SEQ ID NO：13)]。NADP依赖型酶称为EC1.1.1.2，可得自例如强烈炽热球菌[GenBank No：AAC25556(SEQ IDNO：91)，AF013169(SEQ ID NO：90)]。另外，丁醇脱氢酶可得自大肠杆菌[GenBank No：NP_417484(SEQ ID NO：75)，NC_000913(SEQID NO：74)]，环己醇脱氢酶可得自不动杆菌[GenBank No：AAG10026(SEQ ID NO：72)，AF282240(SEQ ID NO：71)]。

术语“乙偶姻激酶”指具有催化乙偶姻转化为磷酸乙偶姻的酶活性的一种多肽(或多种多肽)。乙偶姻激酶可以利用ATP(三磷酸腺苷)或磷酸烯醇式丙酮酸作为该反应的磷酸供体。尽管催化乙偶姻进行该反应的酶未见报道，但存在催化相似底物二羟基丙酮进行类似反应的酶，例如称为EC 2.7.1.29的酶(Garcia-Alles等人，(2004)Biochemistry43：13037-13046)。

术语“乙偶姻磷酸酯胺化酶”指具有催化磷酸乙偶姻转化为3-氨基-2-丁醇O-磷酸酯的酶活性的一种多肽(或多种多肽)。乙偶姻磷酸酯胺化酶可以利用辅因子5’-磷酸吡哆醛、NADH或NADPH。所得产物在3号位上具有(R)或(S)立体化学。磷酸吡哆醛依赖型酶可利用氨基酸例如丙氨酸或谷氨酸。NADH依赖型和NADPH依赖型酶可将氨用作第二底物。尽管催化磷酸乙偶姻进行该反应的酶未见报道，但存在据悉催化相似底物磷酸丝氨醇的类似反应的磷酸吡哆醛依赖型酶(Yasuta等人，(2001)Appl.Environ.Microbiol.67：4999-5009)。

术语“氨基丁醇磷酸酯磷酸裂解酶”也称“氨基醇O-磷酸酯裂解酶”，是指具有催化3-氨基-2-丁醇O-磷酸酯转化为2-丁酮的酶活性的一种多肽(或多种多肽)。氨基丁醇磷酸酯磷酸裂解酶可以利用辅因子5’-磷酸吡哆醛。尽管能催化氨基丁醇磷酸酯，进行该反应的酶未见报道，但是报道了催化相似底物1-氨基-2-丙醇磷酸酯进行类似反应的酶(Jones等人，(1973)Biochem J.134：167-182)。本发明描述了一种新鉴定的氨基丁醇磷酸酯磷酸裂解酶(SEQ ID NO：126)，其来自物体胡萝卜软腐欧文氏菌，本文的实施例15中说明了其活性。

术语“氨基丁醇激酶”指具有催化3-氨基-2-丁醇转化为3-氨基-2-丁醇O-磷酸酯的酶活性的一种多肽(或多种多肽)。氨基丁醇激酶可以利用ATP作为磷酸供体。尽管能催化3-氨基-2-丁醇进行该反应的酶未有报道，但是报道了催化相似底物乙醇胺和1-氨基-2-丙醇进行类似反应的酶(Jones等人，同上)。本发明在实施例14中描述了胡萝卜软腐欧文氏菌黑胫亚种的氨基丁醇激酶(SEQ ID NO：124)。术语“丁二醇脱氢酶”(也称“乙偶姻还原酶”)指具有催化乙偶姻转化为2，3-丁二醇的酶活性的一种多肽(或多种多肽)。丁二醇脱氢酶是庞大的醇脱氢酶家族中的亚群。丁二醇脱氢酶可对醇产物中的(R)或(S)立体化学的产生具有特异性。(S)-特异性的丁二醇脱氢酶称为EC 1.1.1.76，可得自例如肺炎克雷伯菌(GenBank No：BBA13085(SEQ ID NO：6)，D86412(SEQ ID NO：5))。(R)-特异性丁二醇脱氢酶称为EC 1.1.1.4，可得自例如肺炎克雷伯菌[GenBank No.NP_830481(SEQ ID NO：85)，NC_004722(SEQ ID NO：84)；AAP07682(SEQ ID NO：87)，AE017000(SEQ ID NO：86)]和乳酸乳球菌[GenBank No.AAK04995(SEQ IDNO：89)，AE006323(SEQ ID NO：88)]。

术语“丁二醇脱水酶”(也称“二醇脱水酶”或“丙二醇脱水酶”)指具有催化2，3-丁二醇转化为2-丁酮的酶活性的一种多肽(或多种多肽)。丁二醇脱水酶可以利用辅因子腺苷钴胺素(维生素B12)。腺苷钴胺素依赖型酶称为EC 4.2.1.28，可得自例如产酸克雷伯菌[GenBank No：BAA08099(α亚基)(SEQ ID NO：8)，D45071(SEQ ID NO：7)；BAA08100(β亚基)(SEQ ID NO：10)，D45071(SEQ ID NO：9)；和BBA08101(γ亚基)(SEQ ID NO：12)，D45071(SEQ ID NO：11)(注意，所有三种亚基均是活性所必需的)]，以及肺炎克雷伯菌[GenBank No：AAC98384(α亚基)(SEQ ID NO：105)，AF102064(SEQID NO：104)；GenBank No：AAC98385(β亚基)(SEQ ID NO：107)，AF102064(SEQ ID NO：106)，GenBank No：AAC98386(γ亚基)(SEQID NO：109)，AF102064(SEQ ID NO：108)]。其它合适的二醇脱水酶包括但不限于B12依赖型二醇脱水酶，其可得自鼠伤寒沙门菌[GenBank No：AAB84102(大亚基)(SEQ ID NO：93)，AF026270(SEQID NO：92)；GenBank No：AAB84103(中等亚基)(SEQ ID NO：95)，AF026270(SEQ ID NO：94)；GenBank No：AAB84104(小亚基)(SEQID NO：97)，AF026270(SEQ ID NO：96)]；以及丘状乳杆菌[GenBankNo：CAC82541(大亚基)(SEQ ID NO：99)，AJ297723(SEQ ID NO：98)；GenBank No：CAC82542(中等亚基)(SEQ ID NO：101)；AJ297723(SEQ ID NO：100)；GenBank No：CAD01091(小亚基)(SEQ ID NO：103)，AJ297723(SEQ ID NO：102)]；和来自短乳杆菌的酶(尤其是菌株CNRZ 734和CNRZ 735，Speranza等人，同上)，以及编码相应酶的核苷酸序列。分离二醇脱水酶基因的方法是本领域所熟知的(如美国专利No.5,686,276)。另外的甘油脱水酶在表2中列出。

术语“甘油脱水酶”指具有催化甘油转化为3-羟基丙醛的酶活性的一种多肽(或多种多肽)。腺苷钴胺素-依赖型甘油脱水酶称为EC4.2.1.30。EC 4.2.1.30的甘油脱水酶在序列上类似于二醇脱水酶，并且也有三种亚基。甘油脱水酶还可用于将2，3-丁二醇转化为2-丁酮。EC4.2.1.30的甘油脱水酶的一些实例包括来自如下来源的那些：肺炎克雷伯菌(α亚基，编码区序列为SEQ ID NO：145，蛋白质序列为SEQ IDNO：146；β亚基，编码区序列为SEQ ID NO：147，蛋白质序列为SEQID NO：148；和γ亚基，编码区序列为SEQ ID NO：149，蛋白质序列为SEQ ID NO：150)；巴斯德梭菌[GenBank No：3360389(α亚基，SEQ ID NO：135)，3360390(β亚基，SEQ ID NO：136)，以及3360391(γ亚基，SEQ ID NO：137)]；蟑螂埃希氏菌[GenBank No：60099613(α亚基，SEQ ID NO：138)，57340191(β亚基，SEQ ID NO：139)和57340192(γ亚基，SEQ ID NO：140)]；以及弗氏柠檬酸杆菌[GenBankNo：1169287(α亚基，SEQ ID NO：141)，1229154(β亚基，SEQ IDNO：142)，以及1229155(γ亚基，SEQ ID NO：143)]。注意，所有这三种亚基均是活性所必需的。另外的甘油脱水酶列于表2中。

二醇脱水酶和甘油脱水酶在催化过程中可能会进行***式失活。再活化因子蛋白(在本文中也称作“再激活酶”)可用于再活化失活的酶(Mori等人，J.Biol.Chem.272：32034(1997))。优选地，再活化因子可得自与所用的二醇或甘油脱水酶相同的来源。例如，合适的二醇脱水酶再活化因子可得自产酸克雷伯菌[GenBank No：AAC15871(大亚基)(SEQ ID NO：111)，AF017781(SEQ ID NO：110)；GenBank No：AAC15872(小亚基)(SEQ ID NO：113)，AF017781(SEQ ID NO：112)]；鼠伤寒沙门氏菌[GenBank No：AAB84105(大亚基)(SEQ IDNO：115)，AF026270(SEQ ID NO：114)，GenBank No：AAD39008(小亚基)(SEQ ID NO：117)，AF026270(SEQ ID NO：116)]；以及丘状乳杆菌[GenBank No：CAD01092(大亚基)(SEQ ID NO：119)，AJ297723(SEQ ID NO：118)；GenBank No：CAD01093(小亚基)(SEQID NO：121)，AJ297723(SEQ ID NO：120)]。大亚基和小亚基两者均为活性所必需的。例如，合适的甘油脱水酶再活化因子可得自肺炎克雷伯菌(大亚基，编码区序列为SEQ ID NO：151，蛋白质序列为SEQ ID NO：152；以及小亚基，编码区序列为：SEQ ID NO：153，蛋白质序列为SEQ ID NO：154)。

术语“兼性厌氧微生物”指既可在有氧环境中生长又可在无氧环境中生长的微生物。

术语“碳底物”或“可发酵碳底物”指能够被本发明的宿主生物体代谢的碳源，并且特别是选自由下列物质组成的组的碳源：单糖、寡糖、多糖和一碳底物，或它们的混合物。

术语“基因”指能够被表达为特定蛋白质的核酸片段，其任选包括编码序列前的调控序列(5′非编码序列)和编码序列后的调控序列(3′非编码序列)。“天然基因”是指存在于自然界具有其自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因，包含在自然界中不是一起存在的调控序列和编码序列。因此，嵌合基因可包含源于不同来源的调控序列和编码序列，或者包含源于同一来源但以不同于在自然界中的方式排列的调控序列和编码序列。“内源性基因”指在生物体的基因组内位于其本来位置的天然基因。“外来”或“外源”基因指正常情况下不存在于宿主生物体中，而是通过基因转移导入宿主生物体内的基因。外来基因可以包含***到非天然生物体内的天然基因，或嵌合基因。“转基因”是通过转化方法导入基因组内的基因。

如本文所用，“分离的核酸片段”或“分离的核酸分子”或“基因构建体”可以互换使用，并将指单链-或双链-的RNA或DNA聚合体，任选含有合成的、非天然的或改变的核苷酸碱基。DNA聚合体形式的分离的核酸片段可由cDNA、基因组DNA或合成DNA的一个或多个片段构成。

当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核酸片段时，则核酸片段“可杂交”至另一核酸片段，例如cDNA、基因组DNA或RNA分子。杂交条件和洗涤条件是众所周知的，并在Sambrook，J.，Fritsch，E.F.和Maniatis，T.Molecular Cloning：A Laboratory Manual，第二版，Cold Spring Harbor Laboratory：ColdSpring Harbor，NY(1989)中举例说明，尤其是其中的第11章和表11.1(将其全部内容以引用的方式并入本文)。温度和离子强度条件确定了杂交的“严格性”。可以调节严格性条件以筛选中度相似的片段(例如来自远亲生物体的同源序列)，到筛选高度相似的片段(例如从近亲生物体复制功能性酶的基因)。杂交后的洗涤确定严格性条件。一组优选的条件采用一系列如下洗涤：开始采用6×SSC、0.5％ SDS在室温下持续洗涤15分钟，然后再使用2×SSC、0.5％ SDS在45℃下洗涤30分钟，最后使用0.2×SSC、0.5％ SDS在50℃下重复洗涤30分钟两次。更优选的一组严格性条件采用更高的温度，其中洗涤与上述洗涤相同，不同的是最后两次在0.2×SSC、0.5％ SDS中洗涤30分钟时的温度被增加到60℃。另一组优选的高严格性条件是最后两次洗涤是在65℃下用0.1×SSC、0.1％ SDS进行。例如，另一组严格性条件包括在0.1×SSC、0.1％ SDS中于65℃下杂交，并用2×SSC、0.1％ SDS洗涤，随后用0.1×SSC、0.1％ SDS洗涤。

杂交需要两种核酸含有互补序列，但是取决于杂交的严格性，碱基之间可能会发生错配。用于使核酸杂交的合适严格性取决于核酸的长度和互补的程度，所述长度和互补程度是本领域内所熟知的变量。两条核苷酸序列之间的相似性或同源性程度越高，具有那些序列的核酸的杂交体的Tm值越大。核酸杂交的相对稳定性(对应较高的Tm)按以下顺序依次降低：RNA：RNA、DNA：RNA、DNA：DNA。对于长度超过100个核苷酸的杂交体，已经推导出了用于计算Tm的公式(请参见Sambrook等人，同上，9.50-9.51)。对于较短核酸(寡核苷酸)的杂交，错配的位置变得更重要，而且寡核苷酸的长度决定了其特异性(请参见Sambrook等人，同上，11.7-11.8)。在一个实施方案中，可杂交核酸的长度为至少约10个核苷酸。优选地，可杂交核酸的最小长度为至少约15个核苷酸；更优选至少约20个核苷酸；并且最优选地，长度为至少约30个核苷酸。此外，技术人员将认识到，可根据需要根据诸如探针长度之类的因素来调节温度和洗涤溶液盐浓度。

氨基酸或核苷酸序列的“基本部分”是这样的部分，该部分包含的多肽的氨基酸序列或基因的核苷酸序列足以能通过推定来鉴定所述多肽或基因，所述的鉴别或者可以由本领域技术人员通过人工评价序列，或者利用比对算法(例如BLAST(Altschul，S.F.等人，J.Mol.Biol.，215：403-410(1993))通过计算机自动化序列比较和鉴别来完成。一般来讲，要推定鉴别多肽或核酸是否与已知蛋白质或基因同源，需要有10个或更多个连续氨基酸或30个或更多个核苷酸。此外，对于核苷酸序列，包含20-30个连续核苷酸的基因特异性寡核苷酸探针可用于序列依赖性的基因识别(如DNA杂交法)和基因分离(如细菌菌落或噬斑的原位杂交法)的方法中。此外，12至15个碱基的短寡核苷酸可在PCR中用作扩增引物，以便获得包含该引物的特定核酸片段。因此，核苷酸序列的“基本部分”包含的序列足以特异性地鉴别和/或分离包含该序列的核酸片段。本说明书提出了完整的氨基酸序列和编码特定真菌蛋白质的完整核苷酸序列。根据本文所公开的序列，技术人员现在可以利用本发明所公开序列的全部或基本部分，以用于本领域技术人员所熟知的目的。因此，本发明包括如随附的序列表中所示的完整序列，以及这些序列的如上文定义的基本部分。

术语“互补”用于描述核苷酸碱基之间能够彼此杂交的关系。例如，对于DNA，腺嘌呤与胸腺嘧啶互补，而胞嘧啶与鸟嘌呤互补。

术语“同源性”和“同源的”在本文中可互换使用。它们指这样的核苷酸片段，即其中一个或多个核苷酸碱基的变化不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰(例如缺失或***一个或多个核苷酸)，相对于初始的未经修饰的核酸片段，基本上不会改变所得核酸片段的功能特性。因此，正如本领域技术人员应该理解的，本发明不仅仅涵盖这些具体的示例性序列。

此外，技术人员认识到，本发明所涵盖的同源核苷酸序列也由它们在中等严格条件(如0.5×SSC，0.1％ SDS，60℃)下，与本文所示例的序列杂交的能力，或杂交至本文所公开的核苷酸序列的任何部分以及杂交至与本文所公开的任何核苷酸序列功能相当的序列的能力所限定。

“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。技术人员非常了解在使用核苷酸密码子确定给定氨基酸时特定宿主细胞显示出的“密码子偏好性”。因此，在合成基因以改善其在宿主细胞中的表达时，希望设计基因以使得其密码子使用频率接近宿主细胞中优选的密码子使用频率。

如本领域所熟知的，术语“百分比同一性”是两条或更多条多肽序列之间或两条或更多条多核苷酸序列之间的关系，该关系是通过对序列进行比较来确定。在本领域中，“同一性”还表示多肽或多核苷酸序列之间序列关联的程度，根据具体情况，它由这些序列的序列串之间的匹配程度确定。“同一性”和“相似性”可容易地通过已知方法计算出来，所述的方法包括但不限于以下文献中所描述的那些：1.)ComputationalMolecular Biology(Lesk，A.M.编辑)Oxford University：NY(1988)；2.)Biocomputing：Informatics and Genome Projects(Smith，D.W.编辑)Academic：NY(1993)；3.)Computer Analysis of Sequence Data，PartI(Griffin，A.M.和Griffin，H.G.编辑)Humania：NJ(1994)；4.)SequenceAnalysis in MolecularBiology(von Heinje，G.编辑)Academic(1987)；以及5.)Sequence Analysis Primer(Gribskov，M.和Devereux，J.编辑)Stockton：NY(1991)。

确定同一性的优选方法被用于给出待测试序列之间的最佳匹配。确定同一性和相似性的方法在可公开获得的计算机程序中编成了代码。可以使用LASERGENE生物信息学计算软件包(DNASTAR Inc.，Madison，Madison，WI)的MegAlign^TM程序来进行序列比对和百分比同一性的计算。使用“Clustal比对方法”执行序列多重比对，“Clustal比对方法_T涵盖了多种算法，包括“Clustal V比对方法”，其对应被称为Clustal V(在Higgins和Sharp，CABIOS.5：151-153(1989)；Higgins，D.G.等人，Comput.Appl.Biosci.，8：189-191(1992)中有所描述)，并且可见于LASERGENE生物信息学计算软件包(DNASTAR Inc.)MegAlign^TM程序中的比对方法。对于多重比对，默认值为空位罚分(GAP PENALTY)＝10和空位长度罚分(GAP LENGTH PENALTY)＝10。采用Clustal方法进行双序列比对和蛋白质序列百分比同一性计算的默认参数为KTUPLE＝1，空位罚分＝3，窗口大小(WINDOW)＝5和DIAGONALS SAVED＝5。而对于核酸，这些参数为KTUPLE＝2，空位罚分＝5，窗口大小＝4和DIAGONALS SAVED＝4。用Clustal V程序比对序列后，可通过查看同一程序中的“序列距离(sequence distances)”表来获得“百分比同一性”。另外，还可以利用“Clustal W比对方法”，其对应于标为Clustal W(在Higgins和Sharp，CABIOS.5：151-153(1989)；Higgins，D.G.等人，Comput.Appl.Biosci.8：189-191(1992)中有所描述)，并且可见于LASERGENE生物信息学计算软件包(DNASTAR Inc.)的MegAlign^TM v6.1程序中的比对方法。多重比对的默认参数(空位罚分＝10，空位长度罚分＝0.2，延迟发射序列(％)(DelayDivergen Seqs(％))＝30，DNA转换权重(DNA Transition Weight)＝0.5，蛋白质权重矩阵(Protein Weight Matrix)＝Gonnet系列，DNA权重矩阵(DNA Weight Matrix)＝IUB)。在使用Clustal W程序对序列进行比对之后，可通过查看同一程序中的“序列距离”表来获得“百分比同一性”。

本领域的技术人员非常清楚，多种程度的序列同一性可用于从其它物种中鉴别多肽，其中这类多肽具有相同或相似的功能或活性。百分比同一性的可用实例包括但不限于：24％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％或95％，或24％至100％之间的任何整数百分比都可用于描述本发明，例如25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。合适的核酸片段不仅具有上述同源性，而且通常还可编码具有至少50个氨基酸的多肽，优选具有至少100个氨基酸，更优选具有至少150个氨基酸，还更优选具有至少200个氨基酸，并且最优选具有至少250个氨基酸。

术语“序列分析软件”指可用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可商购获得或独立开发。典型的序列分析软件包括但不限于：1.)GCG程序程序包(Wisconsin PackageVersion 9.0，Genetics Computer Group(GCG)，Madison，WI)；2.)BLASTP、BLASTN、BLASTX(Altschul等人，J.Mol.Biol.，215：403-410(1990))；3.)DNASTAR(DNASTAR，Inc.，Madison，WI)；4.)Sequencher(Gene Codes Corporation，Ann Arbor，MI)；和5.)整合了Smith-Waterman算法的FASTA程序(W.R.Pearson，Comput.MethodsGenome Res.，[Proc.Int.Symp.](1994)，Meeting Date 1992，111-20，编辑：Suhai，Sandor.Plenum：New York，NY)。在本专利申请案的上下文中应当理解，使用序列分析软件进行分析时，除非另外指明，否则分析结果将基于所用程序的“默认值”。在此所用的“默认值”是指在首次初始化软件时软件最初加载的任何值或参数集。

如本文所用的，术语“编码序列”或“CDS”是指编码特定氨基酸序列的DNA序列。“合适的调控序列”指位于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列)的核苷酸序列，其可影响转录、RNA加工或稳定性，或者相关编码序列的翻译。调控序列可包括启动子、翻译前导序列、内含子、多聚腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。

术语“启动子”指能够控制编码序列或功能RNA的表达的DNA序列。一般来讲，编码序列位于启动子序列的3′端。启动子可以整个源于天然基因，或者由源于不同的天然存在的启动子的不同元件组成，或者甚至包含合成的DNA片段。本领域内的技术人员应当理解，不同的启动子可以在不同的组织或细胞类型中，或者在不同的发育阶段，或者响应不同的环境条件或生理条件而引导基因的表达。在大多数时候在大多数细胞类型中引起基因表达的启动子通常称为“组成型启动子”。还应进一步认识到，由于在大多数情况下调节序列的确切边界尚未完全界定，因此不同长度的DNA片段可以具有相同的启动子活性。

术语“可操纵地连接”指单个核酸片段上核酸序列的关联，以使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如，当启动子能够影响编码序列的表达(即，该编码序列受到该启动子的转录控制)时，则该启动子与该编码序列可操纵地连接。编码序列可以正义或反义的取向可操纵地连接至调控序列。

如本文所用的，术语“表达”指源于本发明核酸片段的正义(mRNA)或反义RNA的转录和稳定积聚。表达还可指将mRNA翻译为多肽。

在本文所用的，术语“转化”指将核酸片段转移至宿主生物体内，导致基因稳定遗传。含有转化核酸片段的宿主生物体被称为“转基因”或“重组”或“转化”生物体。

术语“质粒”和“载体”指常携带不是细胞中心代谢的部分的基因的染色体外遗传元件，并且通常是环状双链DNA片段的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状)，其中多个核苷酸序列已连接或重组进一种独特构建体中，该独特构建体能够将所选基因产物的启动子片段和DNA序列与相应的3′末端非翻译序列一起引入细胞中。“转化载体”指含有外来基因并且除了该外来基因外还含有有利于转化特定宿主细胞的元件的特定载体。

如在此所用的，术语“密码子简并性”指遗传密码允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下变化的性质。技术人员非常了解在使用核苷酸密码子确定给定氨基酸时具体宿主细胞显示出的“密码子偏好性”。因此，在合成基因以改善其在宿主细胞中的表达时，希望设计基因以使得其密码子使用频率接近于宿主细胞中优选的密码子使用频率。

术语“密码子优化的”在其涉及用于转化不同宿主的核酸分子的基因或编码区时，指在不改变由DNA编码的多肽的情况下，改变核酸分子的基因或编码区中的密码子以反映宿主生物体通常的密码子使用。

术语“发酵产物培养基”指在其中进行了发酵而使得产物存在于培养基中的培养基。

本文所用的标准重组DNA和分子克隆技术为本领域所熟知，并且在Sambrook，J.，Fritsch，E.F.和Maniatis，T.，Molecular Cloning：ALaboratory Manual，第二版，Cold Spring Harbor Laboratory Press，ColdSpring Harbor，NY(1989)(以下称为“Maniatis”)；以及Silhavy，T.J.，Bennan，M.L.和Enquist，L.W.，Experiments with Gene Fusions，ColdSpring Harbor Laboratory Press，Cold Spring Harbor，NY(1984)；以及Ausubel，F.M.等人，Current Protocols in Molecular Biology(GreenePublishing Assoc.and Wiley-Interscience出版，(1987))中有所描述。

2-丁醇和2-丁酮生物合成途径

利用碳水化合物的微生物将糖酵解(EMP)途径、恩-杜二氏(Entner-Doudoroff)途径和磷酸戊糖循环作用作中心代谢途径以给生长和维持提供能量和细胞前体。这些途径都有共同的中间产物3-磷酸甘油醛，而且最终，会直接成形丙酮酸或与EMP途径结合生成丙酮酸。糖转化为丙酮酸的组合反应产生能量(如5’-三磷酸腺苷，ATP)和还原型当量(如，还原型烟酰胺腺嘌呤二核苷酸NADH，以及还原型烟酰胺腺嘌呤二核苷酸磷酸盐NADPH)。NADH和NADPH必须被循环以形成其氧化形式(分别为NAD⁺和NADP⁺)。在存在无机电子受体(如O₂、NO₃ ^-和SO₄ ^2-)的情况下，还原型当量可以用于增加能量池；作为另外一种选择，可能形成还原型碳副产物。

本发明通过提供从丙酮酸至2-丁酮或2-丁醇的完整生物合成途径，使得能用重组微生物从碳水化合物源产生2-丁酮或2-丁醇。还描述了另外三种途径述。尽管已知2-丁醇不是任何细菌发酵的主要产物，但是存在多条可能的途径用来经由已知生化反应类型而生成2-丁醇。这些途径在图1中示出。下面所引用的字母和罗马数字与图1中的字母和罗马数字对应，它们分别用于描述转化步骤和产物。如下所述，2-丁酮是所有这些2-丁醇生物合成途径的中间产物。

所有途径均始于两个丙酮酸分子生成α-乙酰乳酸的初始反应(I)，在图1中作为底物至产物的转化(a)示出。从α-乙酰乳酸开始，存在4条途径生成2-丁酮(V)，在本文中称为2-丁酮生物合成途径：

途径1)I--->II--->III--->IV--->V(底物至产物的转化b、c、d、e)；

2)I--->II--->VII--->IV--->V(底物至产物的转化b、g、h、e)

3)I--->II--->VIII--->V(底物至产物的转化b、i、j)这是本发明的合成途径。

4)I--->IX--->X--->V(底物至产物的转化k、l、m)

2-丁醇生物合成途径以2-丁酮(V)转化为2-丁醇(VI)结束。下面是对每种途径中底物至产物的转化的详细论述。

途径1：

(a)丙酮酸转化为α-乙酰乳酸：

途径1中的初始步骤是由焦磷酸硫胺素依赖型酶催化，两分子丙酮酸转化为一分子α-乙酰乳酸(图1中的化合物I)和一分子二氧化碳。催化该底物至产物转化的酶(通常被称为乙酰乳酸合酶或称为乙酰羟酸合酶；EC 2.2.1.6[2002年以前为EC 4.1.3.18])是众所周知的，并且它们参与蛋白氨基酸亮氨酸和缬氨酸的生物合成途径，以及参与多种生物体中发酵产生2，3-丁二醇和乙偶姻的途径。

技术人员将理解，分离自多种来源的具有乙酰乳酸合酶活性的多肽将可用于本发明，而不依赖于序列同源性。合适的乙酰乳酸合酶的一些实例可得自多种来源例如枯草芽孢杆菌[GenBank No：AAA22222NCBI(美国国家生物技术信息中心)氨基酸序列(SEQ ID NO：77)，L04470 NCBI核苷酸序列(SEQ ID NO：76)]、土生克雷伯菌[GenBankNo：AAA25055(SEQ ID NO：79)，L04507(SEQ ID NO：78)]和肺炎克雷伯菌[GenBank No：AAA25079(SEQ ID NO：4)，M73842(SEQID NO：3)]。优选的乙酰乳酸合酶是与SEQ ID NO 4、77和79具有至少80％-85％的同一性的那些，其中具有至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet 250系列)具有至少95％的同一性是最优选的。

(b)α-乙酰乳酸转化为乙偶姻：

通过诸如乙酰乳酸脱羧酶(EC 4.1.1.5)之类的酶的作用，α-乙酰乳酸(I)转化为乙偶姻(II)。与乙酰乳酸合酶类似，该酶也是焦磷酸硫胺素依赖型酶，并且还涉及多种生物体产生2，3-丁二醇和乙偶姻。不同来源的酶在大小(4.2E-20g(25kDa)-8.3E-20g(50千道尔顿))、寡聚反应(二聚体至六聚物)、位置(细胞内或细胞外)和变构调节(例如，由支链氨基酸活化)方面十分多样化。就本发明的目的而言，位于细胞内优于位于细胞外，但是其它变型一般是可接受的。

技术人员将理解，分离自多种来源的具有乙酰乳酸脱羧酶活性的多肽将可用于本发明，而不依赖于序列同源性。合适的乙酰乳酸脱羧酶的一些实例可得自多种来源，例如，枯草芽孢杆菌[GenBank No：AAA22223(SEQ ID NO：81)，L04470(SEQ ID NO：80)]、土生克雷伯菌[GenBank No：AAA25054(SEQ ID NO：83)，L04507(SEQ IDNO：82)]和肺炎克雷伯菌[GenBank No：AAU43774(SEQ ID NO：2)，AY722056(SEQ ID NO：1)]。

优选的乙酰乳酸脱羧酶是与SEQ ID NO 2、81和83具有至少80％-85％的同一性，其中具有至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet 250系列)，具有至少95％的同一性是最优选的。

(c)乙偶姻转化为3-氨基-2-丁醇：

存在两种已知类型的生化反应可以实现底物乙偶姻(II)至产物3-氨基-2-丁醇(III)的转化，具体地讲，这两种反应是利用辅助氨基供体的磷酸吡哆醛依赖型转氨作用和直接与氨进行的还原氨化。在后一种情况下，还原当量是以还原型烟酰胺辅因子(NADH或NADPH)的形式提供。Ito等人(美国专利No.6,432,688)报道了以乙偶姻作为底物催化该反应的NADH依赖型酶的实例。尚未对该酶的任何立体特异性进行评价。Shin和Kim(同上)已报道了催化乙偶姻转化为3-氨基-2-丁醇的磷酸吡哆醛依赖型转氨酶的实例。本文实施例13中显示这种酶既能将乙偶姻的(R)异构体转化为3-氨基-2-丁醇的(2R，3S)异构体，又能将乙偶姻的(S)异构体转化为3-氨基-2-丁醇的(2S，3S)异构体。任一类型的酶(即转氨酶或还原胺化酶)被认为是乙偶姻胺化酶，并且可以用于产生2-丁醇。该组中其它酶可以具有不同的立体特异性。

技术人员将理解，从多种来源分离的具有乙偶姻胺化酶活性的多肽可用于本发明中，而与序列同源性无关。这种活性的一个实例已经在本文中有所描述，并且鉴定为SEQ ID NO：122。因此，优选的乙偶姻胺化酶是与SEQ ID NO：122具有至少80％-85％的同一性的那些酶，其中具有至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet250系列)，具有至少95％的同一性是最优选的。

(d)3-氨基-2-丁醇转化为3-氨基-2-丁醇O-磷酸酯：

本领域中尚无已知酶催化底物3-氨基-2-丁醇(III)至产物3-氨基-2-丁醇磷酸酯(IV)的转化。然而，一些假单胞菌属(Pseudomonas)和欧文氏菌属(Erwinia)的菌种已经显示可表达ATP依赖型乙醇胺激酶(EC 2.7.1.82)，该激酶允许它们利用乙醇胺或1-氨基-2-丙醇作为氮源(Jones等人，(1973)Biochem.J.134：167-182)。有可能该酶还具有对3-氨基-2-丁醇的活性或可以被工程化而实现该活性，由此提供氨基丁醇激酶。本发明在实施例14中描述了胡萝卜软腐欧文氏菌黑胫亚种的一种基因(SEQ ID NO：123)，该基因编码一种蛋白质(SEQ ID NO：24)，这种蛋白质已鉴定为氨基醇激酶。该酶可用于将3-氨基-2-丁醇转化为3-氨基-2-丁醇O-磷酸酯。

技术人员将理解，分离自多种来源的具有氨基丁醇激酶活性的多肽将可用于本发明，而不依赖于序列同源性。该活性的一个实例已经在本文中有所描述，并鉴定为SEQ ID NO：124。因此，优选的氨基丁醇激酶是与SEQ ID NO：124具有至少80％-85％的同一性的那些酶，其中至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet 250系列)，具有至少95％的同一性是最优选的。

(e)3-氨基-2-丁醇磷酸酯转化为2-丁酮：

虽然未报道有酶催化底物3-氨基-2-丁醇磷酸酯(IV)至产物2-丁酮(V)的转化，但是该底物非常类似于存在于少量假单胞菌属和欧文氏菌属菌种中由磷酸吡哆醛依赖型磷酸乙醇胺磷酸裂解酶所利用的那些底物。这些酶对磷酸乙醇胺和2-磷酸-1-氨基丙烷的两种对映体(Jones等人，(1973)Biochem.J.134：167-182)都具有活性，而且还对3-氨基-2-丁醇O-磷酸酯具有活性。本发明描述了一种胡萝卜软腐欧文氏菌黑胫亚种的基因(SEQ ID NO：125)，该基因编码与III类转氨酶具有同源性的蛋白质(SEQ ID NO：126)。实施例15证明这种酶对氨丙醇磷酸酯和氨基丁醇磷酸酯底物两者均具有活性。新鉴定和表征的酶能够催化(R)-3-氨基-(S)-2-丁醇O-磷酸酯和(S)-3-氨基-(R)-2-丁醇O-磷酸酯的混合物以及(R)-3-氨基-(R)-2-丁醇O-磷酸酯和(S)-3-氨基-^(S)-2-丁醇^O-磷酸酯的混合物向2-丁酮的转化。新鉴定和表征的酶也能够催化(R)和(S)-2-氨基-1-丙醇磷酸酯两者向丙酮的转化，优先催化(S)-2-氨基-1-丙醇磷酸酯的转化。利用建议的天然底物DL-1-氨基-2-丙醇磷酸酯时，可观察到最高的活性，该底物被转化为丙醛。

技术人员将理解，分离自多种来源的具有氨基丁醇磷酸酯磷酸裂解酶活性的多肽将可用于本发明，而不依赖于序列同源性。合适的氨基丁醇磷酸酯磷酸裂解酶的一个实例在本文中描述为SEQ ID NO：126。因此，优选的氨基丁醇磷酸酯磷酸裂解酶是与SEQ ID NO126具有至少80％-85％的同一性的那些酶，其中至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet 250系列)，具有至少95％的同一性是最优选的。

(f)2-丁酮转化为2-丁醇：

在所有途径中从丙酮酸产生2-丁醇的最后步骤是2-丁酮(V)还原为2-丁醇(VI)。该底物向产物的转化是由很广的一类醇脱氢酶(取决于酶，是利用NADH或利用NADPH作为氢化物源的类型)中的一些成员催化，这些成员可以被称为丁醇脱氢酶。催化2-丁酮还原的每种酶是众所周知的，如上文对丁醇脱氢酶的定义中所述。

技术人员将理解，分离自多种来源的具有丁醇脱氢酶活性的多肽将可用于本发明中，而不依赖于序列同源性。合适的丁醇脱氢酶的一些实例可得自多种来源，例如，赤红球菌[GenBank No：CAD36475(SEQID NO：14)，AJ491307(SEQ ID NO：13)]。NADP依赖型酶称为EC1.1.1.2，可得自例如强烈炽热球菌[GenBank No：AAC25556(SEQ IDNO：91)，AF013169(SEQ ID NO：90)]。另外，丁醇脱氢酶可得自大肠杆菌[GenBank No：NP_417484(SEQ ID NO：75)，NC_000913(SEQID NO：74)]，环己醇脱氢酶可得自不动杆菌[GenBank No：AAG10026(SEQ ID NO：72)，AF282240(SEQ ID NO：71)]。优选的丁醇脱氢酶是与SEQ ID NO14、91、75和72具有至少80％-85％的同一性的那些酶，其中具有至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet 250系列)，具有至少95％的同一性是最优选的。

途径2：

(a)丙酮酸转化为α-乙酰乳酸：

该底物向产物的转化与上文对途径1所述的一样。

(b)α-乙酰乳酸转化为乙偶姻：

该底物向产物的转化与上文对途径1所述的一样。

(g)乙偶姻转化为磷酸乙偶姻：

尽管尚未描述催化底物乙偶姻(II)至产物磷酸乙偶姻(VII)的转化的酶，但是底物乙偶姻的结构与二羟基丙酮的结构非常类似，因此乙偶姻对二羟基丙酮激酶(EC 2.7.1.29)(催化二羟基丙酮磷酸化的酶)来说是一种可接受的底物。用于改变酶的底物特异性的蛋白质工程技术是众所周知的(Antikainen和Martin(2005)Bioorg.Med.Chem.13：2701-2716)，并且可用于产生具有所需特异性的酶。在这种转化中，磷酸部分可由任何高能生物磷酸供体提供，而常见的底物是磷酸烯醇式丙酮酸(如在大肠杆菌二羟基丙酮激酶的情况下)和ATP(如在弗氏柠檬酸杆菌二羟基丙酮激酶的情况下)(Garcia-Alles等人，(2004)Biochemistry43：13037-13045)。

(h)磷酸乙偶姻转化为3-氨基-2-丁醇O-磷酸酯：

尽管尚未描述催化底物磷酸乙偶姻(VII)至产物3-氨基-2-丁醇O-磷酸酯(IV)的转化的酶，但是该底物的结构与磷酸二羟基丙酮的结构非常类似，磷酸二羟基丙酮是所提出的由短根瘤菌属(Bradyrhizobium)一些菌种的rtxA基因的5’部分所编码的磷酸丝氨醇转氨酶的底物(Yasuta等人，同上)。因此，磷酸丝氨醇转氨酶可在该步骤中起作用。

(e)3-氨基-2-丁醇O-磷酸酯转化为2-丁酮：

该底物向产物的转化与上文对途径1所述的一样。

(f)2-丁酮转化为2-丁醇：

该底物向产物的转化与上文对途径1所述的一样。

途径3：

(a)丙酮酸转化为α-乙酰乳酸：

该底物向产物的转化与上文对途径1所述的一样。

(b)α-乙酰乳酸转化为乙偶姻：

该底物向产物的转化与上文对途径1所述的一样。

(i)乙偶姻转化为2，3-丁二醇：

底物乙偶姻(II)至产物2，3-丁二醇(VIII)的转化可由丁二醇脱水氢酶催化，当进行还原时丁二醇脱氢酶可利用NADH或利用NADPH作为还原当量的来源。对乙偶姻具有活性的酶参与产生2，3-丁二醇的生物体中产生2，3-丁二醇的途径。所报道的酶(如来自肺炎克雷伯菌的BudC(Ui等人，(2004)Letters in Applied Microbiology39：533-537))通常利用NADH。可接受任一种辅因子用于通过该途径产生2-丁醇。

技术人员将理解，分离自多种来源的具有丁二醇脱氢酶活性的多肽将可用于本发明，而不依赖于序列同源性。合适的丁二醇脱氢酶的一些实例可得自多种来源，例如，肺炎克雷伯菌(GenBank No：BBA13085(SEQ ID NO：6)，D86412(SEQ ID NO：5))。(R)-特异性的丁二醇脱氢酶称为EC 1.1.1.4，可得自例如蜡状芽孢杆菌[GenBankNo.NP_830481(SEQ ID NO：85)，NC_004722(SEQ ID NO：84)；AAP07682(SEQ ID NO：87)，AE017000(SEQ ID NO：86)]和乳酸乳球菌[GenBank No.AAK04995(SEQ ID NO：89)，AE006323(SEQ IDNO：88)]。优选的丁二醇脱氢酶是与SEQ ID NO6、85、87和89具有至少80％-85％的同一性的那些酶，其中至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet 250系列)，具有至少95％的同一性是最优选的。

(j)2，3-丁二醇转化为2-丁酮：

底物2，3-丁二醇(VIII)至产物2-丁酮(V)的转化可由二醇脱水酶(EC 4.2.1.28)和甘油脱水酶(EC 4.2.1.30)催化。得到最好表征的二醇脱水酶是辅酶B12依赖型产酸克雷伯菌酶，但是类似的酶存在于多种肠道细菌中。该产酸克雷伯菌酶已显示出可接受内消旋-2，3-丁二醇作为底物(Bachovchin等人，(1977)Biochemistry16：1082-1092)，产生所需的产物2-丁酮。实施例17证明了肺炎克雷伯菌甘油脱水酶能够将内消旋-2，3-丁二醇转化为2-丁酮。肺炎克雷伯菌甘油脱水酶的三个亚基(α：SEQ ID NO：145(编码区)和146(蛋白质)；β：SEQ IDNO：147(编码区)和148(蛋白质)；和γ：SEQ ID NO：149(编码区)和SEQ ID NO：150(蛋白质))连同肺炎克雷伯菌甘油脱水酶再激活酶的两个亚基(大亚基，SEQ ID NO：151(编码区)和152(蛋白质)；和小亚基，SEQ ID NO：153(编码区)和SEQ ID NO：154(蛋白质))一起表达以提供活性。

文献中还报道了来自乙二醇梭菌(Clostridium glycolicum)的B12-依赖型二醇脱水酶(Hartmanis等人，(1986)Arch.Biochem.Biophys.245：144-152)。该酶对2，3-丁二醇具有活性，尽管这种活性不到对乙二醇的活性的1％，但是可以工程改造该酶以提高该活性。得以较好表征的B12-依赖型脱水酶是来自丁酸梭菌(Clostridium butyricum)的甘油脱水酶(O’Brien等人，(2004)Biochemistry43：4635-4645)，其对1，2-丙二醇以及甘油具有高活性。该酶利用S-腺苷甲硫氨酸作为腺苷基的来源。该酶对2，3-丁二醇的活性尚未有报道，但是这种活性(如果还未存在)，也可以进行工程改造。

技术人员将理解，分离自多种来源的具有丁二醇脱氢酶活性的多肽将可用于本发明，而不依赖于序列同源性。如上文指出的，多种二醇和甘油脱水酶已经在文献中描述并将适用于本发明。因此，根据本发明的一个方面，优选的二醇和甘油脱水酶是与其大亚基、中等亚基和小亚基分别具有如下序列的酶具有至少80％-85％同一性的那些：

a)SEQ ID NO：8、SEQ ID NO：10和SEQ ID NO：12；

b)SEQ ID NO：93、SEQ ID NO：95和SEQ ID NO：97；

c)SEQ ID NO：99、SEQ ID NO：101和SEQ ID NO：103；

d)SEQ ID NO：105、SEQ ID NO：107和SEQ ID NO：109；

e)SEQ ID NO：135、SEQ ID NO：136和SEQ ID NO：137；

f)SEQ ID NO：138、SEQ ID NO：139和SEQ ID NO：140；

g)SEQ ID NO：146、SEQ ID NO：148和SEQ ID NO：150；

h)SEQ ID NO：141、SEQ ID NO：142和SEQ ID NO：143；以及

i)SEQ ID NO：164、SEQ ID NO：165和SEQ ID NO：166。

其中具有至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet 250系列)，具有至少95％的同一性是最优选的。

类似地，优选的二醇和甘油脱水酶是与其大亚基、中等亚基和小亚基分别具有如下序列的酶具有至少80％-85％同一性的那些：

大亚基：SEQ ID NO：8、99、105、135、138、141、146和164；中等亚基：SEQ ID NO：10、101、107、136、139、142、148和165；小亚基：SEQ ID NO：12、103、109、137、140、143、150和166；其中具有至少85％-90％的同一性是更优选的，并且其中基于Clustal W比对方法(采用默认参数：空位罚分＝10，空位长度罚分＝0.1和蛋白质权重矩阵为Gonnet 250系列)，具有至少95％的同一性是最优选的。

可用于本发明的生物合成途径3的其它二醇和甘油脱水酶是通过在下面以及在实施例18中描述的生物信息学结构/功能分析来鉴定。

(f)2-丁酮转化为2-丁醇：

该底物向产物的转化与上文对途径1所述的一样。

用于生物合成途径3的二醇和甘油脱水酶

作为二醇和甘油脱水酶的任何酶可在本发明中用于将2，3-丁二醇转化为2-丁酮。酶类型EC 4.2.1.28和EC 4.2.1.30中的二醇和甘油脱水酶的结构/功能关系分别在本文实施例18中建立。功能由实验数据提供而结构通过生物信息学分析提供。分析了具有已经通过实验证明的活性的八种二醇和甘油脱水酶。在该组酶中(在表10中列出)，产酸克雷伯菌二醇脱水酶和肺炎克雷伯菌甘油脱水酶两者均显示将2，3-丁二醇转化为2-丁酮(分别在Bachovchin等人，(1977)Biochemistry16：1082-1092和本文17中显示)，而对另外六种酶的活性则利用它们的天然底物进行了证明(参考文献在表10中给出)。利用HMMER软件包的hmmsearch算法(Janelia Farm Research Campus，Ashburn，VA)分析了这组八种二醇和甘油脱水酶。将该hmmsearch算法的Z参数设定为10亿。利用一组蛋白质序列进行的HMMER分析的输出是分布型隐马尔可夫模型(Profile Hidden Markov Model)(分布型HMM(ProfileHMM))。分布型HMM依据的理论由Durbin等人，Biological sequenceanalysis：probabilistic models of proteins and nucleic acids，CambridgeUniversity Press，1998；Krogh等人，1994；J.Mol.Biol.235：1501-1531进行了描述(将其以引用的方式并入本文)，该方法基于每种氨基酸在蛋白质集的比对中每个位置上出现的概率来表征所述蛋白质集。

由于用来分析的具有实验验证的功能的八种二醇和甘油脱水酶(二醇/甘油脱水酶)的每种酶具有三个亚基(大亚基或α亚基、中等亚基或β亚基和小亚基或γ亚基)，故对每种亚基构建单独的分布型HMM。大亚基的分布型HMM(表12)用具有表1和表2中描述的SEQID NO：8、99、105、135、138、141、146和164的蛋白质构建。中等亚基分布型HMM(表13)用具有表1和表2中描述的SEQ ID NO：10、101、107、136、139、142、148和165的蛋白质构建。小亚基分布型HMM(表14)用具有表1和表2中描述的SEQ ID NO：12、103、109、137、140、143、150和166的蛋白质构建。提供功能测定法数据的参考文献在表10中给出。为大亚基构建的分布型HMM给出了对二醇/甘油脱水酶的功能性大亚基的结构表征。类似地，为中等亚基和小亚基构建的分布型HMM分别给出了对二醇/甘油脱水酶对功能性中等亚基和小亚基的结构表征。因此，将与大亚基、中等亚基或小亚基的分布型HMM具有显著匹配的任何蛋白质直接与所述分布型HMM对应的亚基的功能关联。要具有显著性，则所述的匹配具有的E-值为0.01或更小，其它“匹配”的用法应该理解为符合该E-值标准。因而，可用于本发明的二醇/甘油脱水酶亚基是匹配这样的分布型HMM的蛋白质，即该分布型HMM是用具有上文列出的SEQ ID NO的蛋白质构建，其中E-值为0.01或更小。

全长的并且通过匹配大亚基分布型HMM而与所述二醇/甘油脱水酶的大亚基具有功能关联的蛋白质，包括但不限于具有SEQ ID NO：93、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259的蛋白质。全长的并且通过匹配中等亚基分布型HMM而与所述二醇/甘油脱水酶的中等亚基具有功能关联的蛋白质，包括但不限于具有SEQ ID NO：95、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167的蛋白质。全长的并且通过匹配小亚基分布型HMM而与所述二醇/甘油脱水酶的小亚基具有功能关联的蛋白质，包括但不限于具有SEQ ID NO：97、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274的蛋白质。此外，全长的并且通过匹配大亚基和中等亚基分布型HMM而与所述二醇/甘油脱水酶的大亚基和中等亚基具有功能关联的蛋白质，包括但不限于具有SEQ ID NO：233、235、237、239、241、246和247的蛋白质。

由于上述分布型HMM提供了二醇/甘油脱水酶的结构/功能关系，匹配这些分布型HMM的新鉴定的蛋白质也可以用于本发明。此外，可用于本发明的二醇/甘油脱水酶亚基蛋白质序列包括具有的氨基酸变化对亚基功能具有最小影响的蛋白质，其基本上类似于上文列出的SEQ ID NO的序列。本领域技术人员将理解，对所编码的蛋白质的功能特性不产生影响的、化学等价的氨基酸在给定位点处的置换是常见的。为本发明的目的，将提供基本相似的蛋白质的置换定义为下列五组中的一组内的交换：

1.小的脂族非极性残基或微弱极性的残基：Ala、Ser、Thr(Pro、Gly)；

2.极性的、带负电荷的残基和它们的酰胺：Asp、Asn、Glu、Gln；

3.极性的、带正电荷的残基：His、Arg、Lys；

4.大的脂族非极性残基：Met、Leu、Ile、Val(Cys)；和

5.大的芳族残基：Phe、Tyr、Trp。

因而，可以预计这些组中一个氨基酸置换另一个氨基酸产生功能等价的蛋白质。在许多情况下，导致蛋白质的N-端和C-端部分改变的变化也将预计不会改变蛋白质的活性。

与匹配分布型HMM的那些SEQ ID基本类似的蛋白质可以在氨基酸序列上与其中一种匹配蛋白质具有90％或95％的同一性，并且这些蛋白质可以用于本发明。

本领域技术人员可以容易地鉴定一组可以一起用于提供功能性二醇/甘油脱水酶三种亚基。尤其合适的是来自相同生物体的大亚基、中等亚基和小亚基的组合，它们的编码区在基因组中的位置相互接近。这些亚基将最有可能形成天然的二醇或甘油脱水酶。许多大亚基、中等亚基和小亚基以表2中的这种方式分组。来自亲缘关系接近的菌株或物种的亚基的组合适于构成二醇脱水酶或甘油脱水酶。可以使用催化2，3-丁二醇转化为2-丁酮的任何亚基组合。通过氨基酸序列比较和/或功能测定法，本领域技术人员可以容易地确定有效的亚基组合。

因此，本发明提供了二醇和甘油脱水酶，其具有包含全长的大亚基、中等亚基和小亚基的氨基酸序列，当利用分布型隐马尔可夫模型进行查询时每个所述亚基得到的E值参数为0.01或更小，其中所述的分布型隐马尔可夫模型用如下亚基构建：SEQ ID NO：8、99、105、135、138、141、146和164的大亚基；SEQ ID NO：10、101、107、136、139、142、148和165的中等亚基；和SEQ ID NO：12、103、109、137、140、143、150和166的小亚基；每次查询采用其中Z参数设定为10亿的hmmsearch算法进行。

作为另一种选择，本发明提供了二醇和甘油脱水酶，其具有通过如下方法鉴定的氨基酸序列：

a)从对应二醇和甘油脱水酶的大亚基、中等亚基和小亚基的氨基酸序列的比对产生分布型隐马尔可夫模型，其中：

i)大亚基包含选自由如下序列组成的组的氨基酸序列：SEQ ID NO：8、99、105、135、138、141、146和164；

ii)中等亚基包含选自由如下序列组成的组的氨基酸序列：SEQ ID NO：10、101、107、136、139、142、148和165；以及

iii)小亚基包含选自由如下序列组成的组的氨基酸序列：SEQ ID NO：12、103、109、137、140、143、150和166；

b)利用其中Z参数设定为10亿以及E值参数设定为0.01的hmmsearch算法，用(a)的隐马尔可夫模型查询至少一个公开的含二醇和甘油脱水酶序列的蛋白质序列数据库，以鉴定二醇和甘油脱水酶氨基酸序列的第一数据集；以及

c)从(b)的第一数据集移除任何部分序列以产生二醇和甘油脱水酶氨基酸序列的第二数据集，其中二醇脱水酶和甘油脱水酶得以鉴定。

对于本发明的二醇和甘油脱水酶大亚基，该酶可以包含这样的大亚基，该大亚基包含与选自由以下序列组成的组的氨基酸序列具有至少95％的同一性的氨基酸序列：SEQ ID NO：8、93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259，所述的序列同一性是基于Clustal W比对方法计算，该比对方法使用如下默认参数：空位罚分＝10，空位长度罚分＝0.1，以及蛋白质权重矩阵为Gonnet 250系列。

对于本发明的二醇和甘油脱水酶中等亚基，该酶可以包含这样的中等亚基，该中等亚基包含与选自由以下序列组成的组的氨基酸序列具有至少95％的同一性的氨基酸序列：SEQ ID NO：10、95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167，所述的序列同一性是基于Clustal W比对方法计算，该比对方法使用如下默认参数：空位罚分＝10，空位长度罚分＝0.1，以及蛋白质权重矩阵为Gonnet 250系列。

对于本发明的二醇和甘油脱水酶小亚基，该酶可以包含这样的小亚基，该小亚基包含与选自由以下序列组成的组的氨基酸序列具有至少95％的同一性的氨基酸序列：SEQ ID NO：12、97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274、所述的序列同一性是基于Clustal W比对方法计算，该比对方法使用如下默认参数：空位罚分＝10，空位长度罚分＝0.1，以及蛋白质权重矩阵为Gonnet 250系列。

作为另外一种选择，二醇脱水酶或甘油脱水酶可以包含融合的大亚基、中等亚基和小亚基，该融合的大亚基、中等亚基和小亚基包含与选自由如下序列组成的组的氨基酸序列具有至少95％的同一性的氨基酸序列：SEQ ID NO：233、235、237、239、241、246和247，所述的序列同一性是基于Clustal W比对方法计算，该比对方法使用如下默认参数：空位罚分＝10，空位长度罚分＝0.1，以及蛋白质权重矩阵为Gonnet 250系列。

作为另一种选择，该二醇脱水酶或甘油脱水酶可以包含融合的大亚基、中等亚基和小亚基并且与包含编码大亚基、中等亚基和小亚基的全部三条氨基酸序列的氨基酸序列具有至少95％的同一性，其中所述三条氨基酸序列选自由如下序列组成的组：

a)SEQ ID NO：8，SEQ ID NO：10和SEQ ID NO：12；

b)SEQ ID NO：93，SEQ ID NO：95和SEQ ID NO：97；

c)SEQ ID NO：99，SEQ ID NO：101和SEQ ID NO：103；

d)SEQ ID NO：105，SEQ ID NO：107和SEQ ID NO：109；

e)SEQ ID NO：135，SEQ ID NO：136和SEQ ID NO：137；

f)SEQ ID NO：138，SEQ ID NO：139和SEQ ID NO：140；

g)SEQ ID NO：146，SEQ ID NO：148和SEQ ID NO：150；

h)SEQ ID NO：141，SEQ ID NO：142和SEQ ID NO：143；以及

i)SEQ ID NO：164，SEQ ID NO：165和SEQ ID NO：166；

所述的序列同一性是基于Clustal W比对方法计算，该比对方法使用如下默认参数：该比对方法使用如下默认参数：空位罚分＝10，空位长度罚分＝0.1，以及蛋白质权重矩阵为Gonnet 250系列。

途径4：

(a)丙酮酸转化为α-乙酰乳酸：

该底物向产物的转化与上文对途径1所述的一样。

(k)α-乙酰乳酸转化为2，3-二羟基-2-甲基丁酸：

底物乙酰乳酸(I)至产物2，3-二羟基-2-甲基丁酸(IX)的转化是本领域未知的。然而，该转化的产物作为发酵肉汤培养基的组分已经有报道(Ziadi等人，(1973)Comptes Rendus des Seances de l’Academiedes Sciences，Serie D：Sciences Naturelles276：965-8)，但是形成的机理未知。可能的形成机理是用NADH或NADPH作为电子供体还原乙酰乳酸。要利用该途径来产生2-丁醇，则需要鉴定或工程改造催化该反应的酶。然而，关于酮到醇的酶促还原反应的先例是得到确认的。

(l)2，3-二羟基-2-甲基丁酸转化为2-羟基-2-甲基-3-磷酸基丁酸：

尚不知道可催化底物2，3-二羟基-2-甲基丁酸(IX)至产物2-羟基-2-甲基-3-磷酸基丁酸(X)转化的酶。然而，自然界中存在大量的激酶，它们具有多样化的特异性。因此，有可能进行分离或工程改造而得到具有该活性的酶。

(m)2-羟基-2-甲基-3-磷酸基丁酸转化为2-丁酮：

尚不知道可催化底物2-羟基-2-甲基-3-磷酸丁酸(X)至产物2-丁酮(V)转化的酶。该反应与前一反应的组合非常类似于由甲羟戊酸-5-焦磷酸(M5PP)脱羧酶催化的多步反应，该多步反应包括最初将M5PP磷酸化而转化为3-磷酸基甲羟戊酸-5-PP以及随后依赖脱羧作用去除磷酸(Alvear等人，(1982)Biochemistry21：4646-4650)。

(f)2-丁酮转化为2-丁醇：

该底物至产物的转化与上文对途径1所述的一样。

因而，在提供从丙酮酸至2-丁醇的多条重组途径中，存在多种选择来实现各个转化步骤，并且本领域技术人员将能够利用可公开获得的序列以及本文所公开的序列来构建相关途径。上面表1和2中给出了本领域内已知的并且可用于构建2-丁醇生物合成途径的众多代表性基因的列表。

用于生产2-丁醇和2-丁酮的微生物宿主

用于生产2-丁醇或2-丁酮的微生物宿主可以选自细菌、蓝细菌、丝状真菌和酵母。用于生产2-丁醇或2-丁酮的微生物宿主应能耐受所产生的产物，从而产率不会受产物对宿主的毒性限制。用于生产2-丁醇的微生物宿主的选择将在下面进行详细描述。同样的标准也适用于对生产2-丁酮的宿主的选择。

在高滴度水平的2-丁醇下代谢活跃的微生物是不为本领域所熟知的。尽管已从产溶剂梭菌(solventogenic Clostridia)中分离了丁醇耐受性突变体，但有关其它潜在可用的细菌菌株的丁醇耐受性方面的信息几乎没有。关于细菌醇耐受性的比较的大部分研究表明，丁醇的毒性大于乙醇(de Cavalho等人，Microsc.Res.Tech.64：215-22(2004)和Kabelitz等人，FEMS Microbiol.Lett.220：223-227(2003))。Tomas等人(J.Bacteriol.186：2006-2018(2004))报道，1-丁醇的产率在丙酮丁醇梭菌(Clostridium acetobutylicum)发酵期间可能会受丁醇毒性的限制。1-丁醇对丙酮丁醇梭菌的主要影响是破坏膜功能(Hermann等人，Appl.Environ.Microbiol.50：1238-1243(1985))。

选择用于生产2-丁醇的微生物宿主应能耐受2-丁醇并且应该能利用引入的生物合成途径将碳水化合物转化成2-丁醇。选择合适微生物宿主的标准包括如下：对2-丁醇的固有耐受性、对碳水化合物的高利用率、用于基因操纵的遗传工具的可用性以及产生稳定的染色体变异的能力。

具有2-丁醇耐受性的合适宿主菌株可以通过基于菌株的固有耐受性进行筛选而鉴定。微生物对2-丁醇的固有耐受性可以通过测定在基本培养基中培养时，造成生长率50％抑制的2-丁醇浓度(IC50)来测量。IC50值可以利用本领域已知的方法来确定。例如，可让所关注的微生物在含有多种量的2-丁醇的情况下生长，通过测量600纳米下的光密度来监测生长率。倍增时间可以从生长曲线的对数部分计算并用作生长率的量度。产生50％生长抑制的2-丁醇的浓度可以从生长抑制百分比对2-丁醇浓度的曲线图测定。优选地，宿主菌株对2-丁醇的IC50应该大于约0.5％的IC50。更合适的是对2-丁醇的IC50大于约1.5％的宿主菌株。尤其合适的是对2-丁醇的IC50大于约2.5％的宿主菌株。

用于生产2-丁醇的微生物宿主也应对葡萄糖和/或其它碳水化合物具有高利用率。大多数微生物都能够利用碳水化合物。然而，某些环境微生物不能有效地利用碳水化合物，并因而将不会是合适的宿主。

遗传修饰宿主的能力对任何重组微生物的产生来说十分关键。可采用的基因转移技术模式包括电穿孔、接合、转导或自然转化。可利用多种宿主接合性质粒和药物抗性标记。基于可在宿主中产生作用的抗生素抗性标记的性质，针对该宿主生物体定制用于生物体的克隆载体。

也可以操纵微生物宿主以便通过使多种基因失活而使竞争碳流的途径失活。这就需要存在转座子或染色体整合载体用以引导失活。另外，通过化学诱变和突变株筛选，受化学诱变的生产宿主可能经历固有2-丁醇耐受性的提高。

基于上述标准，用于生产2-丁醇和2-丁酮的合适微生物宿主包括但不限于：梭菌属(Clostridium)、发酵单胞菌属(Zymomonas)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)、乳酸菌属(Lactobacillus)、肠球菌属(Enterococcus)、片球菌属(Pediococcus)、产碱杆菌属(Alcaligenes)、克雷伯菌属(Klebsiella)、类芽胞杆菌属(Paenibacillus)、节杆菌属(Arthrobacter)、棒状杆菌属(Corynebacterium)、短杆菌属(Brevibacterium)、毕赤酵母属(Pichia)、假丝酵母属(Candida)、汉逊酵母属(Hansenula)和酵母属(Saccharomyces)的成员。优选的宿主包括：大肠杆菌、真养产碱杆菌(Alcaligenes eutrophus)、地衣芽孢杆菌(Bacillus licheniformis)、浸麻类芽孢杆菌(Paenibacillus macerans)、红串红球菌(Rhodococcuserythropolis)、恶臭假单胞菌(Pseudomonas putida)、植物乳杆菌(Lactobacillus plantarum)、屎肠球菌(Enterococcus faecium)、鹑鸡肠球菌(Enterococcus gallinarium)、粪肠球菌(Enterococcus faecalis)、戊糖片球菌(Pediococcus pentosaceus)、乳酸片球菌(Pediococcusacidilactici)、枯草芽孢杆菌(Bacillus subtilis)和酿酒酵母(Saccharomyces cerevisiae)。

生产宿主的构建

可以采用本领域已知的技术构建含有编码将可发酵碳底物转化至2-丁醇或2-丁酮的酶途径的必需基因的重组生物体。在本发明中，编码2-丁醇生物合成途径3中的酶(乙酰乳酸合酶、乙酰乳酸脱羧酶、丁二醇脱氢酶、丁二醇脱水酶和丁醇脱氢酶)或编码省略了丁醇脱氢酶的2-丁酮生物合成途径3的酶的基因可以分离自如上所述的多种来源。

从细菌基因组中获得所需基因的方法是分子生物学领域中常用并且为人所熟知的。例如，如果基因序列已知，则可以设计引物并采用标准的引物引导的扩增方法(例如聚合酶链反应(美国专利No.4,683,202))扩增所需序列，以获得适于克隆进表达载体内的量的DNA。如果要分离与已知序列异源的基因，则可以通过限制性内切酶消化来产生合适的基因组文库并且可以用具有与所需基因序列互补的序列的探针来筛选。一旦分离了序列，即可以用标准的引物引导的扩增方法(例如聚合酶链反应(美国专利No.4,683,202))来扩增DNA，以获得适于克隆进表达载体中的量的DNA，然后将该表达载体转化至合适的宿主细胞内。

另外，给定具有所需酶活性的蛋白质的氨基酸序列时，则可通过逆翻译该蛋白质序列的来确定编码序列。含有该编码序列的DNA片段可以通过合成制备并将其克隆至表达载体内，然后将该表达载体转化到所需的宿主细胞内。

制备含有编码序列的合成DNA片段时，可以优化该序列用以在目标宿主细胞中表达。用于优化密码子以在异源宿主细胞内表达的工具很容易得到。一些密码子优化工具可基于宿主生物体的GC含量获得。表3中给出了一些示例性微生物宿主的GC含量。

表3

微生物宿主的GC含量

菌株	％GC
菌株	％GC	地衣芽胞杆菌	46
枯草芽胞杆菌	42	地衣芽胞杆菌	46
枯草芽胞杆菌	42	丙酮丁醇梭菌	37
大肠杆菌	50	丙酮丁醇梭菌	37
大肠杆菌	50	恶臭假单胞菌	61
真养产碱杆菌	61	恶臭假单胞菌	61
真养产碱杆菌	61	浸麻类芽孢杆菌	51
红串红球菌	62	浸麻类芽孢杆菌	51
红串红球菌	62	短芽孢杆菌属	50
多粘类芽胞杆菌(Paenibacillus polymyxa)	50	短芽孢杆菌属	50

一旦鉴定并分离了相关途径的基因，即可将它们通过本领域中已知的方法转化到合适的表达宿主内。可用于转化多种宿主细胞的载体是常见的并且可以从一些公司商购获得，例如

(Madison，WI)、Invitrogen Corp.(Carlsbad，CA)、Stratagene(LaJolla，CA)和New England Biolabs，Inc.(Beverly，MA)。通常，载体含有选择性标记和允许在所需宿主中自主复制或染色体整合的序列。另外，合适的载体包含具有转录起始控制功能的启动子区和转录终止控制区，在该启动子区和转录终止控制区之间可以***编码区DNA片段，以提供***该编码区的表达。这两种控制区均可来源于与转化的宿主细胞同源的基因，但是应当理解，这种控制区也可能来源于对被选择作生产宿主的特定物种来说是非天然的基因。

可用于驱动相关途径编码区在所需宿主细胞中表达的起始控制区或启动子有很多，并且为本领域技术人员所熟悉。事实上，驱动这些遗传元件的任何启动子都适用于本发明，所述的启动子包括但不限于源于以下基因的启动子：CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI、CUP1、FBA、GPD和GPM(可用于在酵母菌属中表达)；AOX1(可用于在毕赤酵母菌属中表达)；以及lac、ara、tet、trp、IP_L、IP_R、T7、tac和trc启动子(可用于在大肠杆菌、产碱杆菌属和假单胞菌属中表达)；amy、apr和npr启动子，以及多种噬菌体启动子(可用于在枯草芽胞杆菌、地衣芽孢杆菌和浸麻类芽孢杆菌中表达)；nisA(可用于在革兰氏阳性菌中表达，Eichenbaum等人，Appl.Environ.Microbiol.64(8)：2763-2769(1998))；以及合成的P11启动子(可用于在植物乳杆菌中表达，Rud等人，Microbiology152：1011-1019(2006))。

终止控制区也可以源于优选宿主天然的多种基因。任选地，终止位点可能是不必要的，然而，如果含有终止位点则是最优选的。

某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移。可利用pRK404和三种相关载体：pRK437、pRK442及pRK442(H)的完整且有注释的序列。这些衍生物已被证明是在革兰氏阴性菌中进行遗传操纵的有用工具(Scott等人，Plasmid50(1)：74-79(2003))。广宿主范围的IncP4质粒RSF1010的几种衍生质粒也可获得，其具有在一系列革兰氏阴性菌中发挥功能的启动子。质粒pAYC36和pAYC37具有活性启动子以及多克隆位点以允许异源基因在革兰氏阴性菌中表达。

染色体基因置换工具也可广泛获得。例如，将广宿主范围的复制子pWV101的热敏性变体进行改良以构建可用于在一系列革兰氏阳性菌内实现基因置换的质粒pVE6002(Maguin等人，J.Bacteriol.174(17)：5633-5638(1992))。另外，体外转座体可得自商业来源(例如

)，用以在各种基因组中产生随机突变。

2-丁醇生物合成途径在多种优选的微生物宿主中的表达在下面进行了更详细地描述。对于2-丁酮生物合成途径的表达，以下描述同样适用，但省略了最后的底物2-丁酮至产物2-丁醇的转化。

2-丁醇或2-丁酮生物合成途径在大肠杆菌中的表达

可用于转化大肠杆菌的载体是很普遍的并且可以从上述公司中商购获得。例如，可以将2-丁醇生物合成途径的基因从上述的多种来源分离，将其克隆至改良的pUC19载体上并转化进大肠杆菌NM522中，如实施例6和7所述。作为另外一种选择，可以将编码2-丁醇生物合成途径的基因分至多个操纵子中，克隆到表达载体上，并转化至多种大肠杆菌菌株内，如实施例9、10和11中所述。2-丁酮生物合成途径也可相似地表达，但省略丁醇脱氢酶。

2-丁醇或者2-丁酮生物合成途径在红串红球菌中的表达

一系列大肠杆菌-红球菌穿梭载体可用于在红串红球菌中表达，所述穿梭载体包括但不限于pRhBR17和pDA71(Kostichka等人，Appl.Microbiol.Biotechnol.62：61-68(2003))。另外，一系列启动子可用于异源基因在红串红球菌中表达(参见例如Nakashima等人，Appl.Environ.Microbiol.70：5557-5568(2004)，以及Tao等人，Appl.Microbiol.Biotechnol.2005，DOI10.1007/s00253-005-0064)。红串红球菌染色体基因中的靶向基因中断(Targeted gene disruption)可以利用Tao等人(同上)，和Brans等人(Appl.Envion.Microbiol.66：2029-2036(2000))所述的方法产生。

最初可以将如上所述的产生2-丁醇所需的异源基因克隆至pDA71或pRhBR71内，并转化进大肠杆菌中。然后，可以通过电穿孔将载体转化进红串红球菌中，如Kostichka等人(同上)所述。重组体可以在含有葡萄糖的合成培养基中生长，并随后可以利用本领域已知的发酵方法产生2-丁醇。2-丁酮生物合成途径也可相似地表达，但省略丁醇脱氢酶。

2-丁醇或者2-丁酮生物合成途径在枯草芽孢杆菌中的表达

枯草芽孢杆菌中基因表达及突变产生的方法也是本领域所熟知的。例如，2-丁醇生物合成途径的基因可以分离自多种来源，如上所述，将其克隆进改良的大肠杆菌-杆菌穿梭载体内，然后转化进枯草芽孢杆菌BE1010内，如实施例8所述。可以将所需基因克隆进杆菌属表达载体内并将其转化进菌株中以制备生产宿主。作为另外一种选择，可以利用本领域技术人员已知的条件复制子或者***载体将基因整合到杆菌染色体内。例如，Bacillus Genetic Stock Center(芽孢杆菌遗传保藏中心)拥有众多整合载体。2-丁酮生物合成途径也可相似地表达，但省略丁醇脱氢酶。

2-丁醇或2-丁酮生物合成途径在地衣芽孢杆菌中的表达

在枯草芽孢杆菌中复制的大多数质粒和穿梭载体可用于通过原生质体转化或电穿孔来转化地衣芽孢杆菌。产生2-丁醇所需的基因可以被克隆进质粒pBE20或pBE60衍生物(Nagarajan等人，Genel14：121-126(1992))内。转化地衣芽孢杆菌的方法是本领域已知(例如，参见Fleming等人，Appl.Environ.Microbiol.，61(11)：3775-3780(1995))。构建用于在枯草芽孢杆菌中表达的质粒可以被转化进地衣芽孢杆菌内以产生可生产2-丁醇的重组微生物宿主。2-丁酮生物合成途径可以类似地表达，但省略丁醇脱氢酶。

2-丁醇或2-丁酮生物合成途径在浸麻类芽孢杆菌中的表达

可按照上面关于在枯草芽孢杆菌中表达的描述构建质粒，并通过原生质体转化法将该质粒用于转化浸麻类芽孢杆菌，以产生可生产2-丁醇的重组微生物宿主。2-丁酮生物合成途径可以类似地表达，但省略丁醇脱氢酶。

2-丁醇或2-丁酮生物合成途径在真养产碱杆菌中的表达

用于在真养产碱杆菌中进行基因表达和产生突变的方法是本领域内已知的(参见例如Taghavi等人，Appl.Environ.Microbiol.，60(10)：3585-3591(1994))。可以将2-丁醇生物合成途径的基因克隆进上述任何广宿主范围的载体中，并通过电穿孔转化至真养产碱杆菌内以形成生产2-丁醇的重组体。产碱杆菌属中的聚羟基丁酸酯途径已经有详细描述，多种改良真养产碱杆菌基因组的遗传技术是已知的，并且这些工具可以应用于工程化2-丁醇生物合成途径。2-丁酮生物合成途径也可相似地表达，但省略丁醇脱氢酶。

2-丁醇或2-丁酮生物合成途径在恶臭假单胞菌中的表达

在恶臭假单胞菌中表达基因的方法是本领域内已知的(参见例如Ben-Bassat等人，美国专利No.6,586,229，将该文献以引用的方式并入本文)。可将2-丁醇生物合成途径的基因***pPCU18内，并可将该连接的DNA通过电穿孔转化至恶臭假单胞菌DOT-T1C5aAR1的电转化感受态细胞以生成可生产2-丁醇的重组体。2-丁酮生物合成途径也可相似地表达，但省略丁醇脱氢酶。

2-丁醇或2-丁酮生物合成途径在植物乳杆菌中的表达

乳杆菌属属于乳杆菌科(Lactobacillales)，并且用于转化枯草芽孢杆菌和链球菌的许多质粒及载体可用于转化乳杆菌属。合适载体的非限制性实例包括pAMβ1及其衍生载体(Renault等人，Gene183：175-182(1996)；以及O’Sullivan等人，Gene137：227-231(1993))；pMBB1和pMBB1的衍生载体pHW800(Wyckoff等人，Appl.Environ.Microbiol.62：1481-1486(1996))；接合质粒pMG1(Tanimoto等人，J.Bacteriol.184：5800-5804(2002))；pNZ9520(Kleerebezem等人，Appl.Environ.Microbiol.63：4581-4584(1997))；pAM401(Fujimoto等人，Appl.Environ.Microbiol.67：1262-1267(2001))；和pAT392(Arthur等人，Antimicrob.Agents Chemother.38：1899-1903(1994))。也已经报道了几种来源于植物乳杆菌的质粒(vanKranenburg等人，Appl.Environ.Microbiol.71(3)：1223-1230(2005))。

2-丁醇生物合成途径的多种基因可组装进任何合适的载体中，例如上述那些载体。可以基于从植物乳杆菌或Lactobacillus arizonensis的基因组序列推导出的密码子指数优化密码子以用于表达。可以利用本领域已知的方法将质粒引入宿主细胞中，例如电穿孔法(Cruz-Rodz等人，Molecular Genetics and Genomics 224：1252-154(1990)，Bringel等人，Appl.Microbiol.Biotechnol.33：664-670(1990)；Alegre等人，FEMSMicrobiology letters241：73-77(2004))和接合法(Shrago等人，Appl.Environ.Microbiol.52：574-576(1986))。还可以利用整合载体将2-丁醇生物合成途径基因整合至乳杆菌染色体内(Hols等人，Appl.Environ.Microbiol.60：1401-1403(1990)；Jang等人，Micro.Lett.24：191-195(2003))。2-丁酮生物合成途径也可相似地表达，但省略丁醇脱氢酶。

2-丁醇或2-丁酮生物合成途径在屎肠球菌、鹑鸡肠球菌和粪肠球菌中的表达

肠球菌属属于乳杆菌科，上述用于转化乳杆菌、枯草芽孢杆菌和链球菌的多种质粒和载体也可用于肠球菌。还可以使用采用来自乳球菌属(Lactococcus)的nisA基因的用于粪肠球菌的表达载体(Eichenbaum等人，Appl.Environ.Microbiol.64：2763-2769(1998)。另外，可以使用用于在屎肠球菌染色体中进行基因置换的载体(Nallaapareddy等人，Appl.Environ.Microbiol.72：334-345(2006))。

2-丁醇生物合成途径的多种基因可以组装进任何合适的载体中，例如上述那些载体。可以基于从粪肠球菌或屎肠球菌基因组序列推导出的密码子指数优化密码子以用于表达。质粒可以利用本领域已知的方法引入宿主细胞，例如电穿孔法，如Cruz-Rodz等人所述(MolecularGenetics and Genomics 224：1252-154(1990))或接合法，如Tanimoto等人(J.Bacteriol.184：5800-5804(2002))和Grohamann等人所述(Microbiol.Mol.Biol.Rev.67：277-301(2003))。2-丁酮生物合成途径也可相似地表达，但省略丁醇脱氢酶。

2-丁醇或2-丁酮生物合成途径在戊糖片球菌和乳酸片球菌中的表达

片球菌属属于乳杆菌科(Lactobacillales)，并且上述用于转化枯草芽孢杆菌和链球菌的多种质粒和载体也可用于转化片球菌属。合适载体的非限制性实施例是pHPS9(Bukhtiyarova等人，Appl.Environ.Microbiol.60：3405-3408(1994))。已经报道了几种来自片球菌的质粒(Alegre等人，FEMS Microbiol.Lett.250：151-156(2005)；Shareck等人，Crit.Rev Biotechno.24：155-208(2004))。

2-丁醇生物合成途径的基因可组装至任何合适的载体中，例如上述那些载体。可以基于从戊糖片球菌基因组序列推导出的密码子指数优化密码子以用于表达。质粒可以利用本领域已知的方法引入宿主细胞，例如电穿孔法(参见例如Osmanagaoglu等人，J.Basic Microbiol.40：233-241(2000)；Alegre等人，FEMS Microbiol.Lett.250：151-156(2005))及接合(Gonzalez和Kunka，Appl.Environ.Microbiol.46：81-89(1983))。还可以利用整合载体将2-丁醇生物合成途径基因整合至片球菌属的染色体内(Davidson等人，Antonie van Leeuwenhoek 70：161-183(1996))。2-丁酮生物合成途径也可相似地表达，但省略丁醇脱氢酶。

发酵培养基

本发明中的发酵培养基必须含有合适的碳底物。合适的底物可包括但不限于单糖，例如葡萄糖和果糖；寡糖，例如乳糖或蔗糖；多糖，例如淀粉、纤维素或它们的混合物；以及来自可再生原料的未纯化混合物，例如干酪乳清渗透物、玉米浆、甜菜糖蜜及大麦麦芽。另外，碳底物也可以为已证明可以被代谢转化为关键生化中间产物的诸如二氧化碳之类的一碳底物或甲醇。除了一碳和二碳底物外，甲基营养生物体也已知可以利用多种其它含碳化合物，例如甲胺、葡糖胺及用于代谢活动的多种氨基酸。例如，甲基营养酵母已知可利用来自甲胺的碳来形成海藻糖或甘油(Bellion等人，Microb.Growth C1 Compd.，[Int.Symp.]，第七届(1993)，415-32，编辑：Murrell，J.Collin；Kelly，Don P.Publisher：Intercept，Andover，UK)。类似地，假丝酵母属的多种物种将会代谢丙氨酸或油酸(Sulter等人，Arch.Microbiol.153：485-489(1990))。因此，设想本发明中所利用的碳源可涵盖各种含碳底物并且将仅受限于生物体的选择。

尽管预期所有上述碳底物及它们的混合物都适用于本发明，但优选的碳底物为葡萄糖、果糖和蔗糖，以及任意这些糖的混合物。蔗糖可以从诸如甘蔗、甜菜、木薯及甜高粱之类的原料获得。葡萄糖和右旋糖可以通过淀粉基原料(包括诸如玉米、小麦、裸麦、大麦和燕麦之类的谷物)的糖化作用获得。

另外，可发酵糖可以通过预处理及糖化工艺从纤维素类生物质和木质纤维类生物质获得，如例如在共同拥有及共同未决的美国专利申请US20070031918A1中所述，将该专利申请以引用的方式并入本文。生物质指任何纤维素类物质或木质纤维素类物质并包括包含纤维素，以及任选另外包含半纤维素、木质素、淀粉、寡糖和/或单糖的物质。生物质还可以包含附加成分，例如蛋白质和/或脂质。生物质可以源自单一来源，或生物质可以包含源于一种以上来源的混合物；例如，生物质可以包含玉米芯和玉米秸秆的混合物，或草和叶的混合物。生物质包括但不限于：生物能作物、农业残余物、城市固体废弃物、工业固体废弃物、造纸废渣、庭园废弃物、木材及林业废弃物。生物质的实例包括但不限于：玉米粒、玉米芯、作物残体(例如玉米壳、玉米秸秆)、禾草、小麦、麦秸、大麦、大麦秸秆、干草、稻草、柳枝稷、废纸、甘蔗渣、高梁、大豆、从碾磨谷物获得的成分、树木、树枝、树根、树叶、木片、锯末、灌木及丛枝灌木、蔬菜、果实、花及厩肥。

除了合适的碳源外，发酵培养基还必须含有本领域技术人员已知的适于培养物生长并促进生产2-丁醇或2-丁酮所必需的酶途径的矿物质、盐、辅因子、缓冲剂及其它组分。

培养条件

通常，细胞在约25℃至约40℃的温度范围下在合适的培养基中培养。本发明中合适的生长培养基是普通的商业制备的培养基，例如LuriaBertani(LB)肉汤、Sabouraud Dextrose(SD)肉汤或酵母膏培养基(YM)肉汤。也可以使用其它确定的或合成的生长培养基，微生物学或发酵科学领域的技术人员将知道用于具体微生物生长的合适培养基。已知可以直接或间接调节分解代谢物阻遏的试剂，如环腺苷酸2′:3′-单磷酸，也可以掺入发酵培养基中。

适于发酵的pH范围在pH5.0到pH9.0之间，其中pH6.0至pH8.0优选作为起始条件。

发酵可以在有氧或厌氧条件下进行，厌氧或微氧条件是优选的。

工业分批发酵和连续发酵

本发明的工艺采用分批发酵方法。经典的分批发酵是封闭***，其中培养基的组成在发酵开始时设定并且在发酵过程中不进行人工改变。因此在发酵开始时，用所需生物体对培养基进行接种，在不向***添加任何物质的情况下进行发酵。然而，通常来说，“分批”发酵是指碳源的添加是成批的，但经常试图控制诸如pH和氧浓度之类的因素。在分批发酵***中，代谢产物和生物质组成持续改变直至发酵结束时。在分批培养物内，细胞缓慢通过静态延缓期到达高速生长对数期，并最后达到稳定期，此时生长速率减缓或终止。如果不加以处理，稳定期的细胞将最终死亡。通常，指数生长期中的细胞负责产生大部分终产物或中间产物。

标准分批式***的一种变型是补料-分批***。补料-分批发酵工艺也适用于本发明，并且包括典型的分批式***，不同的是随着发酵进程递增地添加底物。在代谢产物往往抑制细胞的代谢作用，以及其中期望培养基中具有有限量的底物时，补料-分批式***是有用的。补料-分批式***中的实际底物浓度难于测量并因而可根据一些可测量因素(例如pH、溶解的氧以及废气例如CO₂的分压)进行评估。分批发酵和补料-分批发酵在本领域内是常用的且众所周知，并且实例可见于如下文献：Thomas D.Brock，Biotechnology：A Textbook of IndustrialMicrobiology，第二版，(1989)，Sinauer Associates，Inc.，Sunderland，MA.或Deshpande，Mukund V，Appl.Biochem.Biotechnol.，36：227，(1992)，将这两篇文献以引用的方式并入本文。

尽管本发明是以分批模式进行，但也设想该方法将可适用于连续发酵方法。连续发酵是一种开放式***，其中将设定好的发酵培养基连续加入生物反应器里，并同时移出等量适应了的培养基用于加工。连续发酵通常将培养物维持在恒定高的密度。

连续发酵允许调节一种因素或任意数目的因素，这些因素影响细胞生长或终产物浓度。例如，一种方法将以固定的速率维持限制性营养物质(例如碳源或氮水平)并且允许所有其它参数适度。在其它***中，可以连续改变影响生长的许多因素，同时保持恒定的细胞浓度(通过培养基的浊度测量)。连续***力求维持稳态的生长条件并因而，在发酵过程中由于培养基被取出而导致的细胞损失必须与细胞的生长率保持平衡。用于调节连续发酵工艺中的营养物质和生长因子的方法以及使产物形成速率保持最高水平的方法是工业微生物领域众所周知的，并且多种方法在已由Brock(同上)详细描述。

设想可以或者采用分批发酵、补料-分批发酵或者采用连续发酵工艺来实践施本发明，并且任何已知的发酵模式都将适用。另外，设想可以将细胞固定在底物上而作为完整的细胞催化剂并让其经受发酵条件用于生产2-丁醇或2-丁酮。

从发酵培养基中分离2-丁醇和2-丁酮的方法

采用本领域内已知的ABE发酵方法(参见例如Durre，Microbiol.Biotechnol.49：639-648(1998)，Groot等人，Process Biochem.27：61-75(1992)，以及其中的参考文献)，可从发酵培养基中分离生物产生的2-丁醇。例如，可以通过离心、过滤、滗析等方法从发酵培养基移出固形物。然后，使用诸如蒸馏、共沸蒸馏、液-液萃取、吸附、气提、薄膜蒸发或全蒸发等方法分离发酵培养基中的2-丁醇。这些方法同样适用于从发酵培养基中分离生物产生的2-丁酮。

实施例

本发明将在下面的实施例中进一步限定。应当理解，这些实施例在描述本发明的优选实施方案时，仅仅是以举例说明的方式给出。根据上面的论述和这些实施例，本领域技术人员可以确定本发明的基本特征，并且在不脱离本发明的精神和范围的前提下，可以对本发明作出多种变化和修改使其适用于多种用途和条件。

一般方法

实施例中所述的标准重组DNA技术和分子克隆技术在领域内是众所周知的，并且在下列文献中有所描述：Sambrook，J.，Fritsch，E.F.和Maniatis，T.Molecular Cloning：A Laboratory Manual；Cold SpringHarbor Laboratory Press：Cold Spring Harbor，NY，(1989)(Maniatis)和T.J.Silhavy，M.L.Bennan和L.W.Enquist，Experiments with GeneFusions，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，N.Y.(1984)以及Ausubel，F.M.等人，Current Protocols in Molecular Biology，Greene Publishing Assoc.和Wiley-Interscience出版(1987)。

适合细菌培养物维持及生长的材料和方法在领域内是众所周知的。适合用于下述实施例中的技术可见于如下文献：Manual of Methodsfor General Bacteriology(Phillipp Gerhardt，R.G.E.Murray，Ralph N.Costilow，Eugene W.Nester，Willis A.Wood，Noel R.Krieg和G.BriggsPhillips(编辑))，American Society for Microbiology，Washington，DC.(1994)或Thomas D.Brock，Biotechnology：A Textbook of IndustrialMicrobiology，第二版，Sinauer Associates，Inc.，Sunderland，MA(1989)。除非另外指明，否则所述用于细菌细胞生长和维持的所有试剂、限制性内切酶和材料均得自Aldrich Chemicals(Milwaukee，WI)、BDDiagnostic Systems(Sparks，MD)、LifeTechnolo gies(Rockville，MD)或Sigma Chemical Company(St.Louis，MO)。除非另外指明，否则细菌菌株均得自American Type Culture Collection(美国典型培养物保藏中心)(ATCC，Manassas，VA)。

下面的实施例中所述的寡核苷酸引物在表4中给出。所有寡核苷酸引物均由Sigma-Genosys(Woodlands，TX)合成。表4

克隆引物和筛选引物

基因	引物名称	序列	SEQ IDNO：	描述
基因	引物名称	序列	SEQ IDNO：	描述	budB	B1	CACCATGGACAAACAGTATCCGGTACGCC	15	budB正向引物

budB	B2	CGAAGGGCGATAGCTTTACCAATCC	16	budB反向引物
budB	B2	CGAAGGGCGATAGCTTTACCAATCC	16	budB反向引物	budA	B3	CACCATGAATCATTCTGCTGAATGCACCTGCG	17	budA正向引物
budA	B4	GATACTGTTTGTCCATGTGACC	18	budA反向引物	budA	B3	CACCATGAATCATTCTGCTGAATGCACCTGCG	17	budA正向引物
budA	B4	GATACTGTTTGTCCATGTGACC	18	budA反向引物	budC	B5	CACCATGAAAAAAGTCGCACTTGTTACC	19	budC正向引物
budC	B6	TTAGTTAAATACCAT	20	budC反向引物	budC	B5	CACCATGAAAAAAGTCGCACTTGTTACC	19	budC正向引物
budC	B6	TTAGTTAAATACCAT	20	budC反向引物	pddA	B7	CACCATGAGATCGAAAAGATTTG	21	pddABC正向引物
pddC	B8	CTTAGAGAAGTTAATCGTCGCC	22	pddABC反向引物	pddA	B7	CACCATGAGATCGAAAAGATTTG	21	pddABC正向引物
pddC	B8	CTTAGAGAAGTTAATCGTCGCC	22	pddABC反向引物	sadh	B9	CACCATGAAAGCCCTCCAGTACACC	23	sadh正向引物
sadh	B10	CGTCGTGTCATGCCCGGG	24	sadh反向引物	sadh	B9	CACCATGAAAGCCCTCCAGTACACC	23	sadh正向引物
sadh	B10	CGTCGTGTCATGCCCGGG	24	sadh反向引物	budA	B11	GATCGAATTCGTTTAAACTTAGTTTTCTACCGCACG	25	budABC正向引物
budC	B12	GATCGCATGCAAGCTTTCATATAGTCGGAATTCC	26	budABC反向引物	budA	B11	GATCGAATTCGTTTAAACTTAGTTTTCTACCGCACG	25	budABC正向引物
budC	B12	GATCGCATGCAAGCTTTCATATAGTCGGAATTCC	26	budABC反向引物	pddA	B13	GATCGAATTCGTTTAAACAAAGGAGGTCTGATTCATGAGATCG	27	pddABC正向引物
pddC	B14	GATCGGATTCTTAATCGTCGCC	28	pddABC反向引物	pddA	B13	GATCGAATTCGTTTAAACAAAGGAGGTCTGATTCATGAGATCG	27	pddABC正向引物
pddC	B14	GATCGGATTCTTAATCGTCGCC	28	pddABC反向引物	sadh	B15	GATCGGATCCAAAGGAGGTCGGGCGCATGAAAGCCC	29	sadh正向引物
sadh	B16	GATCTCTAGAAAGCTTTCAGCCCGGGACGACC	30	sadh反向引物	sadh	B15	GATCGGATCCAAAGGAGGTCGGGCGCATGAAAGCCC	29	sadh正向引物
sadh	B16	GATCTCTAGAAAGCTTTCAGCCCGGGACGACC	30	sadh反向引物	--	BenF	ACTTTCTTTCGCCTGTTTCAC	31	--
--	BenBPR	CATGAAGCTTGTTTAAACTCGGTGACCTTGAAAATAATGAAAACTTATATTGTTTTGAAAATAATGAAAACTTATATTG	32	--	--	BenF	ACTTTCTTTCGCCTGTTTCAC	31	--
--	BenBPR		32	--	budAB	BABC F	GAGCTCGAATTCAAAGGAGGAAGTGTATATGAATCATTC	33	budAB正向引物
budAB	BAB R	GGATCCTCTAGAATTAGTTAAATACCATCCCGCCG	34	budAB反向引物	budAB	BABC F	GAGCTCGAATTCAAAGGAGGAAGTGTATATGAATCATTC	33	budAB正向引物
budAB	BAB R	GGATCCTCTAGAATTAGTTAAATACCATCCCGCCG	34	budAB反向引物	budC	BC Spe F	ACTAGTAAAGGAGGAAAGAGTATGAAGAAGGTCGCACT	40	budC正向引物
budC	BC Xba R	TCTAGAAAGCAGGGGCAAGCCATGTC	41	budC反向引物	budC	BC Spe F	ACTAGTAAAGGAGGAAAGAGTATGAAGAAGGTCGCACT	40	budC正向引物
budC	BC Xba R	TCTAGAAAGCAGGGGCAAGCCATGTC	41	budC反向引物	pddABC-ddrAB	DDo For	AAGCTTAAAGGAGGCTGATTCATGAGATCGAAAAGATT	44	pddABC-ddrAB正向引物
pddABC-ddrAB	DDo Rev	TCTAGATTATTCATCCTGCTGTTCTCC	45	pddABC-ddrAB反向引物	pddABC-ddrAB	DDo For	AAGCTTAAAGGAGGCTGATTCATGAGATCGAAAAGATT	44	pddABC-ddrAB正向引物
pddABC-ddrAB	DDo Rev	TCTAGATTATTCATCCTGCTGTTCTCC	45	pddABC-ddrAB反向引物	chnA	ChnA F	CATCAATTGACTACGTAGTCGTACGTGTAAGGAGGTTTGAAATGGAAAAAATTAT	54	chnA正向引物

		G
		G			chnA	ChnA R	CATGCTAGCCCCGGGTATCTTCTACTCATTTTTTATTTCG	55	chnA反向引物
--	Top ter F1	CTAGAAGTCAAAAGCCTCCGACCGGAGGCTTTTGA	58	正向引物	chnA	ChnA R	CATGCTAGCCCCGGGTATCTTCTACTCATTTTTTATTTCG	55	chnA反向引物
--	Top ter F1	CTAGAAGTCAAAAGCCTCCGACCGGAGGCTTTTGA	58	正向引物	--	Top ter F2	CTGCTCGAGTTGCTAGCAAGTTTAAACAAAAAAAAGCCCGCTCATTAGGCGGGCTGAGCT	59	正向引物
--	Bot ter R1	CAGCCCGCCTAATGAGCGGGCTTTTTTTTGTTTAAAC	60	反向引物	--	Top ter F2		59	正向引物
--	Bot ter R1	CAGCCCGCCTAATGAGCGGGCTTTTTTTTGTTTAAAC	60	反向引物	--	Bot ter R2	TTGCTAGCAACTCGAGCAGTCAAAAGCCTCCGGTCGGAGGCTTTTGACTT	61	反向引物
KA-AT	OT872	CTCCGGAATTCATGTCTGACGGACGACTCACCGCA	127	氨基醇激酶/裂解酶操纵子正向引物	--	Bot ter R2	TTGCTAGCAACTCGAGCAGTCAAAAGCCTCCGGTCGGAGGCTTTTGACTT	61	反向引物
KA-AT	OT872	CTCCGGAATTCATGTCTGACGGACGACTCACCGCA	127	氨基醇激酶/裂解酶操纵子正向引物	KA-AT	OT873	TTCCAATGCATTGGCTGCAGTTATCTCTGTGCACGAGTGCCGATGA	128	氨基醇激酶/裂解酶操纵子反向引物
KA	OT879	AACAGCCAAGCTTGGCTGCAGTCATCGCGCATTCTCCGGG	129	氨基醇激酶反向引物	KA-AT	OT873	TTCCAATGCATTGGCTGCAGTTATCTCTGTGCACGAGTGCCGATGA	128	氨基醇激酶/裂解酶操纵子反向引物
KA	OT879	AACAGCCAAGCTTGGCTGCAGTCATCGCGCATTCTCCGGG	129	氨基醇激酶反向引物	AT	OT880	TCTCCGGAATTCATGACGTCTGAAATGACAGCGACAGAAG	130	氨基醇裂解酶正向引物
pBAD.HisB	OT909	GCTAACAGGAGGAAGAATTCATGGGGGGTTCTC	131	添加EcoRI位点以替换NcoI位点	AT	OT880	TCTCCGGAATTCATGACGTCTGAAATGACAGCGACAGAAG	130	氨基醇裂解酶正向引物
pBAD.HisB	OT909	GCTAACAGGAGGAAGAATTCATGGGGGGTTCTC	131	添加EcoRI位点以替换NcoI位点	pBAD.HisB	OT910	GAGAACCCCCCATGAATTCTTCCTCCTGTTAGC	132	添加EcoRI位点以替换NcoI位点
BudAB	N84seqR3	GGACCTGCTTCGCTTTATCG	15g	反向引物	pBAD.HisB	OT910	GAGAACCCCCCATGAATTCTTCCTCCTGTTAGC	132	添加EcoRI位点以替换NcoI位点
BudAB	N84seqR3	GGACCTGCTTCGCTTTATCG	15g	反向引物	APT	APTfor	GCGCGCCCGGGAAGAAGGAGCTCTTCACCATGAACAAACCACAGTCTTGG	162	APT正向引物
APT	APTrev	GCGCGCCCGGGTTCATGCCACCTCTGCG	163	APT反向引物	APT	APTfor	GCGCGCCCGGGAAGAAGGAGCTCTTCACCATGAACAAACCACAGTCTTGG	162	APT正向引物

表5

测序引物

名称	序列	基因特异性	SEQ IDNO：
名称	序列	基因特异性	SEQ IDNO：	M13正向引物	GTAAAACGACGGCCAGT	--	35
M13反向引物	AACAGCTATGACCATG	--	36	M13正向引物	GTAAAACGACGGCCAGT	--	35
M13反向引物	AACAGCTATGACCATG	--	36	N83 SeqF2	GCTGGATTACCAGCTCGACC	--	37
N83 SeqF3	CGGACGCATTACCGGCAAAG	--	38	N83 SeqF2	GCTGGATTACCAGCTCGACC	--	37
N83 SeqF3	CGGACGCATTACCGGCAAAG	--	38	N84 Seq R2	GCATCGAGATTATCGGGATG	--	65
N84 SeqR4	CGAAGCGAGAGAAGTTATCC	--	39	N84 Seq R2	GCATCGAGATTATCGGGATG	--	65

Trc F	TTGACAATTAATCATCCGGC	全部	42
Trc F	TTGACAATTAATCATCCGGC	全部	42	Trc R	CTTCTCTCATCCGCCAAAAC	全部	43
DDko seq F2	GCATGGCGCGGATTTGACGAAC	pddABC-ddrAB	46	Trc R	CTTCTCTCATCCGCCAAAAC	全部	43
DDko seq F2	GCATGGCGCGGATTTGACGAAC	pddABC-ddrAB	46	DDko seq F5	CATTAAAGAGACCAAGTACGTG	pddABC-ddrAB	47
DDko seq F7	ATATCCTGGTGGTGTCGTCGGCGT	pddABC-ddrAB	48	DDko seq F5	CATTAAAGAGACCAAGTACGTG	pddABC-ddrAB	47
DDko seq F7	ATATCCTGGTGGTGTCGTCGGCGT	pddABC-ddrAB	48	DDko seq F9	TCTTTGTCACCAACGCCCTGCG	pddABC-ddrAB	49
DDko seq R1	GCCCACCGCGCTCGCCGCCGCG	pddABC-ddrAB	50	DDko seq F9	TCTTTGTCACCAACGCCCTGCG	pddABC-ddrAB	49
DDko seq R1	GCCCACCGCGCTCGCCGCCGCG	pddABC-ddrAB	50	DDko seq R3	CCCCCAGGATGGCGGCTTCGGC	pddABC-ddrAB	51
DDko seq R7	GGGCCGACGGCGATAATCACTT	pddABC-ddrAB	52	DDko seq R3	CCCCCAGGATGGCGGCTTCGGC	pddABC-ddrAB	51
DDko seq R7	GGGCCGACGGCGATAATCACTT	pddABC-ddrAB	52	DDko seq R10	TTCTTCGATCCACTCCTTAACG	pddABC-ddrAB	53
chnSeq F1	CTCAACAGGGTGTAAGTGTAGT	chnA	56	DDko seq R10	TTCTTCGATCCACTCCTTAACG	pddABC-ddrAB	53
chnSeq F1	CTCAACAGGGTGTAAGTGTAGT	chnA	56	chnSeq R1	CGTTTTGATATAGCCAGGATGT	chnA	57
pCL1925 vec F	CGGTATCATCAACAGGCTTACC	全部	62	chnSeq R1	CGTTTTGATATAGCCAGGATGT	chnA	57
pCL1925 vec F	CGGTATCATCAACAGGCTTACC	全部	62	pCL1925 vec R1	AGGGTTTTCCCAGTCACGACGT	全部	63
pCL1925 vec R2	CGCAATAGTTGGCGAAGTAATC	全部	64	pCL1925 vec R1	AGGGTTTTCCCAGTCACGACGT	全部	63
pCL1925 vec R2	CGCAATAGTTGGCGAAGTAATC	全部	64	APTseqRev	GCTAGAGATGATAGC	APT	160
APTseqFor	GGAAGAGACTATCCAGCG	APT	161	APTseqRev	GCTAGAGATGATAGC	APT	160

测定培养基中2-丁醇和2-丁酮浓度的方法

可通过本领域已知的多种方法测定培养基中2-丁醇和2-丁酮的浓度。例如，利用带有Shodex SH-G保护柱的Shodex SH-1011色谱柱(均可从Waters Corporation(Milford，MA)购得)的特定高效液相色谱法(HPLC)，该色谱仪使用折射率(RI)检测器。用0.01M H₂SO₄作为流动相，流速为0.5mL/min，色谱柱温度为50℃来实现色谱分离。在所使用的条件下，2-丁酮和2-丁醇的保留时间分别为39.5和44.3分钟。作为另外一种选择，也可以利用气相色谱法(GC)。例如，利用HP-INNOWax色谱柱(30mx0.53mm内径，膜厚度为1μm，AgilentTechnologies，Wilmington，DE)的气相色谱法，该色谱仪使用火焰离子化检测器(FID)。载气为氦气，流速为4.5mL/min，在恒定排出压力下于150℃测量；200℃下进样分流比为1:25；将烘箱温度在45℃保持1分钟，以10℃/min升至45-220℃，然后在220℃保持5分钟；然后在240℃下用26mL/min的氦尾吹气进行FID检测。2-丁酮和2-丁醇的保留时间分别为3.61分钟和5.03分钟。

也可以通过用3-甲基-2-苯并噻唑酮腙(MBTH)衍生来检测2-丁酮。将含有2-丁酮的水溶液与等体积的6mg/mLMBTH水溶液在375mM甘氨酸-盐酸(pH2.7)中混合，并在100℃下孵育3分钟。在25cm×4.6mm(内径)Supelosil LC-18-D55μm色谱柱(Supelco)上用流动相(55％乙腈水溶液，流速为1mL/min)分析所得的MBTH衍生的样品。2-丁酮衍生物显示为两个峰(顺式和反式异构体)，保留时间分别为大约12.3和13.3分钟，吸光度最大值为230和307nm。

缩写的含意如下：“s”表示秒钟，“min”表示分钟，“h”表示小时，“psi”表示磅/平方英寸，“nm”表示纳米，“d”表示天，“μL”表示微升，“mL”表示毫升，“L”表示升，“mm”表示毫米，“nm”表示纳米，“mM”表示毫摩尔浓度，“M”表示摩尔浓度，“mmol”表示毫摩尔，“μmol”表示微摩尔，“g”表示克，“μg”表示微克，“ng”表示纳克，“PCR”表示聚合酶链反应，“OD”表示光密度，“OD₆₀₀”表示波长600nm时测得的光密度，“kDa”表示千道尔顿，“g”表示重力常数，“bp”表示碱基对，“kbp”表示千碱基对，“％w/v”表示重量/体积百分比，“％v/v”表示体积/体积百分比，“wt％”表示重量百分比，“HPLC”表示高效液相色谱法，“GC”表示气相色谱法。术语“摩尔选择性”是每摩尔糖底物所生成的产物的摩尔数，并以百分比计。

实施例1

乙酰乳酸合酶的克隆和表达

本实施例的目的是在大肠杆菌中克隆并表达编码乙酰乳酸合酶的budB基因。budB基因是利用PCR从肺炎克雷伯菌菌株ATCC 25955基因组DNA扩增得到。

编码乙酰乳酸合酶的budB序列是利用引物对B1(SEQ ID NO：15)和B2(SEQ ID NO：16)通过PCR从肺炎克雷伯菌(ATCC 25955)基因组DNA扩增而来的。其它PCR扩增试剂(如Kod HiFi DNA聚合酶(Novagen Inc.，Madison，WI；商品编号71805-3))可从制造商的试剂盒中获得，并根据制造商提供的方法使用。肺炎克雷伯菌基因组DNA是用Gentra Puregene Puregene试剂盒(Gentra Systems，Inc.，Minneapolis，MN；商品编号D-5000A)制备。扩增在DNA热循环仪GeneAmp 9700(PE Applied Biosystems，Foster city，CA)中进行。开放阅读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别为SEQ IDNO：3和SEQ ID NO：4。

对于表达研究，使用了Gateway克隆技术(Novagen Inc.，Carlsbad，CA)。进入载体(entry vector)pENTR/SD/D-TOPO允许进行定向克隆并为所关注的基因提供SD序列。目的载体pDEST14使用了T7启动子用于表达无标记基因。正向引物紧邻翻译起始密码子处整合了四个碱基(CACC)，以允许budB乙酰乳酸合酶编码区PCR产物定向克隆至pENTR/SD/D-TOPO(Invitrogen)内，产生了质粒pENTRSDD-TOPObudB。将pENTR构建体转化至大肠杆菌Top10(Invitrogen)细胞内，并根据制造商的推荐方法涂布平板。使转化株过夜生长并用QIAprep Spin Miniprep试剂盒(Qiagen，Valencia，CA；商品编号27106)按照制造商的推荐方法制备质粒DNA。为了产生表达克隆，利用LR Clonase酶混合物(LR Clonase mix)(Invitrogen，Carlsbad，CA)通过体外重组，将budB编码区从pENTRSDD-TOPObudB转移至pDEST14载体。将所得的载体pDEST14budB转化至BL-21-AI细胞(Novagen Inc.)内。在***糖诱导型araBAD启动子的控制下，BL-21-AI细胞携带T7 RNA聚合酶的染色体拷贝。

将转化株接种至添加了50μg/mL氨苄青霉素的LB培养基中并过夜培养。将过夜培养物的等分试样接种至50mL添加了50μg/mL氨苄青霉素的LB培养基中。在37℃下振荡培养该培养物，直到OD₆₀₀达到0.6-0.8。将培养物分为两个25mL部分，并将***糖加入其中一个烧瓶至终浓度为0.2％w/v。阴性对照烧瓶不用***糖诱导。将烧瓶在37℃下振荡孵育4小时。通过离心收获细胞并将细胞沉淀颗粒重悬浮于50mM MOPS、pH7.0缓冲液中。细胞可通过超声波处理或通过弗氏压碎器(French Pressure Cell)进行破裂。将各细胞裂解产物进行离心产生上清液和沉淀颗粒或不溶解部分。将各部分(来自诱导细胞和对照细胞的整个细胞裂解物)的等分试样重悬浮于SDS(MES)上样缓冲液(Invitrogen))中，加热至85℃保持10分钟，并接受SDS-PAGE分析(NuPAGE 4-12％ Bis-Tris凝胶，商品编号NP0322Box，Invitrogen)。诱导培养物中存在预期分子量的蛋白质(该分子量从核酸序列推导得到)，而未诱导的参照物中则没有。

用Bauerle等人所述的方法测量无细胞提取物中的乙酰乳酸合酶活性(Bauerle等人，(1964)Biochim.Biophys.Acta92：142-149)。用牛血清白蛋白(BSA)(Bio-Rad，Hercules，CA)作为标准，通过Bradford方法或Bicinchoninic试剂盒(Sigma，商品编号为BCA-1；St.Louis，MO)测定蛋白质浓度。

实施例2

乙酰乳酸脱羧酶的克隆和表达

本实施例的目的是在大肠杆菌中克隆并表达编码乙酰乳酸脱羧酶的budA基因。budA基因是利用PCR技术，从肺炎克雷伯菌菌株ATCC25955基因组DNA扩增得到。

以与实施例1中描述budB相同的方式克隆编码乙酰乳酸脱羧酶的budA序列，不同的是用于PCR扩增的引物为B3(SEQ ID NO：17)和B4(SEQ ID NO：18)。开放阅读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别为SEQ ID NO：1和SEQ ID NO：2。所得的质粒命名为pENTRSDD-TOPObudA。

用Bauerle等人(同上)描述的方法测量无细胞提取物中的乙酰乳酸脱羧酶活性。

实施例3(预言性的)

丁二醇脱氢酶的克隆和表达

本预言性实施例的目的是描述如何在大肠杆菌中克隆并表达编码丁二醇脱氢酶的budC基因。budC基因是利用PCR从肺炎克雷伯菌菌株IAM1063基因组DNA扩增得到。

编码丁二醇脱氢酶的budC序列是以与实施例1中描述budA相同的方式进行克隆和表达，不同的是用于PCR扩增的引物为B5(SEQ IDNO：19)和B6(SEQ ID NO：20)，基因组模板DNA来自肺炎克雷伯菌IAM1063(可得自Institute of Applied Microbiology CultureCollection，Tokyo，Japan)。肺炎克雷伯菌IAM1063基因组DNA是用Gentra Puregene Puregene试剂盒(Gentra Systems有限公司，Minneapolis，MN；商品编号D-5000A)制备。开放阅读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别为SEQ ID NO：5和SEQ IDNO：6。

根据NADH的消耗用分光光度法在340nm吸光度下测定无细胞提取物中丁二醇脱氢酶的活性。

实施例4(预言性的)

丁二醇脱水酶的克隆和表达

本预言性实施例的目的是描述如何在大肠杆菌中克隆并表达编码丁二醇脱水酶的pddA、pddB和pddC基因。pddA、pddB和pddC基因是利用PCR从产酸克雷伯菌ATCC 8724基因组DNA扩增得到。

编码丁二醇脱水酶的pddA、pddB和pddC序列是以与实施例1中描述budA相同的方式进行克隆和表达，不同的是基因组模板DNA来自产酸克雷伯菌ATCC 8724，而且引物为B7(SEQ ID NO：21)和B8(SEQ ID NO：22)。产酸克雷伯菌基因组DNA是用Gentra PuregenePuregene试剂盒(Gentra Systems，Inc.，Minneapolis，MN；商品编号D-5000A)制备。克隆包含所有三个开放阅读框(ORF)的单个PCR产物，以使得所有三个编码区作为一个操纵子从表达质粒上的单个启动子进行表达。三个亚基的开放阅读框的核苷酸序列分别为SEQ IDNO：7、9和11，三个酶亚基的预测氨基酸序列分别为SEQ ID NO：8、10和12。

通过用2，4-二硝基苯肼(DNPH)衍生酮产物来测定无细胞提取物中丁二醇脱水酶的活性。简而言之，通过加入等体积的1.0N HCl中的0.05重量％的DNPH淬灭100μL反应混合物，该反应混合物含有大约0.0005单位酶的细胞提取物、40mM磷酸钾缓冲液(pH 8.0)、2μg腺苷钴胺素、5μg 2，3-丁二醇和1μg牛血清白蛋白。在室温下15分钟后，通过加入100μL 4N NaOH进行显色。与用2-丁酮制备的标准曲线相比，根据波长为550nm时终溶液的吸光度确定产物的量。所有反应均于37℃在暗红光下进行。

实施例5(预言性的)

丁醇脱氢酶的克隆和表达

本预言性实施例的目的是描述如何在大肠杆菌中克隆并表达编码丁醇脱氢酶的sadh基因。sadh基因是利用PCR从赤红球菌菌株219基因组DNA扩增得到。

编码丁醇脱氢酶的sadh序列是以与实施例1中描述budA相同的方式进行克隆和表达，不同的是基因组模板DNA来自赤红球菌菌株219(Meens，Institut fuer Mikrobiologie，Universitaet Hannover，Hannover，Germany)，并且引物为B9(SEQ ID NO：23)和B10(SEQID NO：24)。赤红球菌基因组DNA是用Ultra Clean^TM微生物DNA分离试剂盒(Ultra Clean^TM Microbial DNA Isolation Kit)(MO BIOLaboratories Inc.，Carlsbad，CA)根据制造商提供的方法制备。开放阅读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别为SEQ IDNO：13和SEQ ID NO：14。

无细胞提取物中丁醇脱氢酶的活性是根据当将酶与NAD和2-丁醇进行孵育时，NAD转化为NADH引起的340nm波长处吸光度的增加来测量。

实施例6(预言性的)

用于2-丁醇生物合成途径中的基因的转化载体的构建

本预言性实施例的目的是描述用于2-丁醇生物合成途径(即上述途径3)中的基因的转化载体的制备。与大多数生物体类似，大肠杆菌最初将葡萄糖转化为丙酮酸。按途径3将丙酮酸转化为2-丁醇所需的酶(即乙酰乳酸合酶、乙酰乳酸脱羧酶、丁二醇脱氢酶、丁二醇脱水酶和丁醇脱氢酶)由budA、budB、budC、pddA、pddB、pddC和sadh基因编码。为了简化重组生物体中2-丁醇生物合成途径的构建，将编码该途径中的五个步骤的基因分至两个操纵子中。上游途径包括由乙酰乳酸合酶、乙酰乳酸脱羧酶以及丁二醇脱氢酶催化的前三个步骤。下游途径包括由丁二醇脱水酶和丁醇脱氢酶催化的后两个步骤。

通过PCR技术扩增编码序列，使用的引物整合了限制性酶切位点以用于后来的克隆，并且正向引物含有优化的大肠杆菌核糖体结合位点(AAAGGAGG)。将PCR产物TOPO克隆至pCR4 Blunt-TOPO载体中，并转化进Top10细胞(Invitrogen)内。质粒DNA从TOPO克隆制备，并检验克隆的PCR片段的序列。根据制造商的推荐方法使用限制性酶和T4 DNA连接酶(New England Biolabs，Beverly，MA)。对于克隆实验，用QIAquick凝胶提取试剂盒(QIAquick Gel Extraction kit)(Qiagen)将限制性酶切片段进行凝胶纯化。

确认序列后，将该编码区亚克隆至改良的pUC19载体中作为克隆平台。pUC19载体通过HindIII/SapI进行消化，然后通过用Klenow DNA聚合酶处理以补平末端而进行改良。对2.4kB载体片段进行凝胶纯化并重新连接以产生pUC 19dHS。作为另外一种选择，pUC19载体通过用SphI/SapI消化，然后用Klenow DNA聚合酶处理以形成平末端而进行改良。对2.4kB载体片段进行凝胶纯化并重新连接以产生pUC19dSS。所述的消化移除了邻近MCS(多克隆位点)的lac启动子，抑制载体上操纵子的转录。

上游途径：

budABC编码区通过PCR从肺炎克雷伯菌基因组DNA克隆，该PCR采用的引物对为B11和B12(表4)，分别为SEQ ID NO：25和SEQ ID NO：26。正向引物整合了EcoRI限制性酶切位点和核糖体结合位点(RBS)。反向引物整合了SphI限制性酶切位点。将PCR产物克隆至pCR4 Blunt-TOPO内产生pCR4 Blunt-TOPO-budABC。

为了构建上游途径操纵子，将pCR4 Blunt-TOPO-budABC用EcoRI和SphI进行消化，释放3.2kbpbudABC片段。pUC19dSS载体也用EcoRI和SphI消化，释放2.0kbp载体片段。利用T4DNA连接酶(New EnglandBiolabs)将budABC片段与载体片段连接在一起以形成pUC19dSS-budABC。

下游途径：

pddABC编码区通过PCR从产酸克雷伯菌ATCC 8724基因组DNA扩增，产生2.9kbp产物，该PCR使用引物B13和B14(表4)，分别为SEQ ID NO：27和SEQ ID NO：28。正向引物整合了EcoRI和PmeI限制性酶切位点和RBS。反向引物整合了BamHI限制性酶切位点。将PCR产物克隆至pCRBluntII-TOPO内，产生pCRBluntII-pdd。

sadh基因通过PCR从赤红球菌菌株219基因组DNA扩增，产生1.0kbp产物，该PCR使用引物B15和B16(表4)，分别为SEQ ID NO：29和SEQ ID NO：30。正向引物整合了BamHI限制性酶切位点和RBS。反向引物整合了XbaI限制性酶切位点。将PCR产物克隆至pCRBluntII-TOPO内形成pCRBluntII-sadh。

为了构建下游途径操纵子，将来自pCRBluntII-pdd的2.9kbp EcoRI和BamHI片段、来自pCRBluntII-sadh的1.0kbp BamHI和XbaI片段以及来自pUC19dHS的EcoRI和XbaI消化的大片段连接在一起。该三路连接产生了pUC19dHS-pdd-sadh。

将pUC19dSS-budABC载体用PmeI和HindIII消化，释放3.2kbp片段，将该片段克隆至pBenBP(大肠杆菌-枯草芽孢杆菌穿梭载体)内。质粒pBenBP通过改良pBE93载体产生，Nagarajan对此有所描述(WO93/2463，实施例4)。为了产生pBenBP，用NcoI/HindIII消化将解淀粉芽孢杆菌(Bacillus amyloliquefaciens)中性蛋白酶启动子(NPR)信号序列和phoA基因从pBE93上移除。用引物BenF和BenBPR(分别为SEQ ID NO：31和32)从pBE93 PCR扩增NPR启动子。引物BenBPR在启动子下游整合了BstEII、PmeI和HindIII位点。将PCR产物用NcoI和HindIII进行消化，并将片段克隆至载体pBE93中的相应位点以产生pBenBP。将上游操纵子片段亚克隆至pBenBP中的PmeI和HindIII位点，生成pBen-budABC。

将pUC19dHS-pdd-sadh载体用PmeI和HindIII消化，释放3.9kbp片段，将该片段克隆进pBenBP的PmeI与HindIII位点，生成pBen-pdd-sadh。

实施例7(预言性的)

2-丁醇生物合成途径在大肠杆菌中的表达

本预言性实施例的目的是描述如何在大肠杆菌中表达2-丁醇生物合成途径。

将按实施例6所述制备的质粒pBen-budABC和pBen-pdd-sadh分别转化进大肠杆菌NM522(ATCC No.47000)中，通过SDS-PAGE分析和酶测定法监测每个操纵子中基因的表达。确认所有基因的表达后，用EcoRI和HindIII消化pBen-budABC以释放NPR启动子-budABC片段。用DNA聚合酶的Klenow片段(New England Biolabs，商品编号为M0210S)将该片段进行平末端化。用EcoRI消化质粒pBen-pdd-sadh并同样补平其末端以生成线性化的平末端载体片段。连接载体和NPR-budABC片段，生成p2BOH。将该质粒转化至大肠杆菌NM522内产生大肠杆菌NM522/p2BOH，并如上文所述监测基因的表达。

将NM522/p2BOH接种至装有50mL培养基的250mL摇瓶中，并在35℃下以250rpm摇动。培养基由以下物质组成：右旋糖，5g/L；MOPS，0.05M；硫酸铵，0.01M；磷酸二氢钾，0.005M；S10金属混合物，1％(v/v)；酵母提取物，0.1％(w/v)；酪蛋白氨基酸，0.1％(w/v)；硫胺素，0.1mg/L；脯氨酸，0.05mg/L；以及生物素0.002mg/L，并用KOH滴定至pH 7.0。S10金属混合物含有：MgCl₂，200mM；CaCl₂，70mM；MnCl₂，5mM；FeCl₃，0.1mM；ZnCl₂，0.1mM；盐酸硫胺，0.2mM；CuSO₄，172μM；CoCl₂，253μM；和Na₂MoO₄，242μM。18小时后，用本领域所熟知的方法(如上文中“一般方法”部分所述)通过HPLC和GC分析检测2-丁醇。

实施例8(预言性的)

2-丁醇生物合成途径在枯草芽孢杆菌中的表达

本预言性实施例的目的是描述如何在枯草芽孢杆菌中表达2-丁醇生物合成途径。

将按实施例6所述制备的质粒pBen-budABC和pBen-pdd-sadh分别转化至枯草芽孢杆菌BE1010(J.Bacteriol.173：2278-2282(1991))并如实施例7所述监测每个操纵子中基因的表达。用EcoRI和HindIII消化质粒pBen-budABC以释放NPR启动子-budABC片段。用DNA聚合酶的Klenow片段(New England Biolabs，商品编号为M0210S)将该片段进行平末端化。用EcoRI消化质粒pBen-pdd-sadh并同样补平其末端以生成线性化的平末端载体片段。连接载体和NPR-budABC片段，生成p2BOH。将该质粒转化进枯草芽孢杆菌BE1010内以产生枯草芽孢杆菌BE1010/p2BOH，并如上文所述监测基因的表达。

将枯草芽孢杆菌BE1010/p2BOH接种进装有50mL培养基的250mL摇瓶中，并在35℃下以250rpm摇动18h。培养基由以下物质组成：右旋糖，5g/L；MOPS，0.05M；谷氨酸，0.02M；硫酸铵，0.01M；磷酸二氢钾缓冲液，0.005M；S10金属混合物(如实施例7所述)，1％(v/v)；酵母提取物，0.1％(w/v)；酪蛋白氨基酸，0.1％(w/v)；色氨酸，50mg/L；甲硫氨酸，50mg/L；以及赖氨酸，50mg/L，并用KOH滴定至pH7.0。18小时后，用本领域所熟知的方法(如上文中“一般方法”部分所述)通过HPLC和GC分析检测2-丁醇。

实施例9

用于2-丁醇生物合成途径中的基因的转化载体的构建

本实施例的目的是制备携带2-丁醇生物合成途径(即上述途径3)中的基因的重组大肠杆菌宿主。与大多数生物体类似，大肠杆菌最初将葡萄糖转化为丙酮酸。途径3中将丙酮酸转化为2-丁酮的酶(即乙酰乳酸合酶、乙酰乳酸脱羧酶、丁二醇脱氢酶以及丁二醇脱水酶)由budA、budB、budC、pddA、pddB和pddC基因编码。在该途径的最后步骤中，丁醇脱氢酶将2-丁酮转化为2-丁醇。执行该最后步骤的脱氢酶是广泛的，并且可以在许多生物体中找到。为了简化重组生物体中2-丁醇生物合成途径的构建，将编码该途径中的5个步骤的基因分至多个操纵子中。上游途径操纵子包括由乙酰乳酸合酶、乙酰乳酸脱羧酶以及丁二醇脱氢酶催化的前三个步骤，并将该操纵子克隆到表达载体上。下游途径操纵子包括由丁二醇脱水酶(包括再活化因子(Mori等人，J.Biol.Chem.272：32034(1997)))和丁醇脱氢酶催化的后两个步骤。催化过程中，二醇脱水酶可能进行***性失活。由ddrA和ddrB(GenBank AF017781，SEQ ID NO：70)编码的再活化因子蛋白会再活化失活的酶。ddrA和ddrB基因在二醇脱水酶操纵子的两侧。或者将脱水酶/再活化因子和丁醇脱氢酶的操纵子克隆到另一个表达载体上，或者将脱水酶/再活化因子操纵子单独克隆到另一个表达载体上并且最后的步骤由示范宿主中的内源活性提供。

载体pTrc99a-budABC的构建：

通过PCR技术从肺炎克雷伯菌ATCC 25955基因组DNA扩增budAB编码区，生成2.5kbp产物，该PCR使用引物对BABC F和BABR(分别为SEQ ID NO：33和34，见表4)。正向引物整合了SacI和EcoRI限制性酶切位点和核糖体结合位点(RBS)。反向引物整合了SpeI限制性酶切位点。将PCR产物克隆进pCR4 Blunt-TOPO中，产生pCR4Blunt-TOPO-budAB。从TOPO克隆制备质粒DNA，并用引物M13Forward(SEQ ID NO：35)、引物M13 Reverse(SEQ ID NO：36)、N83 SeqF2(SEQ ID NO：37)、N83 SeqF3(SEQ ID NO：38)和N84 SeqR4(SEQ ID NO：39)(参见表5)验证基因的序列。

通过PCR技术，以肺炎克雷伯菌ATCC 25955基因组DNA为模板，用引物对BC Spe F和BC Xba R扩增budC编码区，生成0.8kbp产物，其中BC Spe F和BC Xba R的SEQ ID NO分别为40和41。正向引物整合了SpeI限制性酶切位点、RBS，并通过将第二与第三密码子从AAA改变为AAG而修饰CDS。反向引物包括XbaI限制性酶切位点。将该PCR产物克隆进pCR4 Blunt-TOPO中，生成pCR4 Blunt-TOPO-budC。通过TOPO克隆制备质粒DNA，用引物M13 Forward(SEQ ID NO：35)和引物M13 Reverse(SEQ ID NO：36)验证基因的序列。

为了构建budABC操纵子，用SnaBI和XbaI消化pCR4Blunt-TOPO-budC，释放1.0kbpbudC片段。用SmaI和XbaI消化载体pTrc99a(Amann等人，Gene69(2)：301-315(1988))，生成4.2kbp线性化载体片段。将载体和budC片段连接以生成pTrc99a-budC，并将其转化至大肠杆菌Top10细胞(Invitrogen)中。通过用引物Trc F(SEQID NO：42)和Trc R(SEQ ID NO：43)对转化株进行PCR扩增分析1.2kbp产物，以确认budC嵌入序列的存在。从pCR4 Blunt-TOPO-budAB亚克隆得到budAB基因的2.5kbp EcoRI/SpeI片段。用EcoRI和SpeI消化载体pTrc99a-budC，并将所得的5.0kbp载体片段进行凝胶纯化。将纯化的载体与budAB***序列连接，并过转化至大肠杆菌Top10细胞中。利用引物Trc F(SEQ ID NO：42)和N84 Seq R2(SEQ ID NO：65)，通过PCR扩增筛选转化株，以确定是否产生pTrc99a-budABC。在该质粒中，bud A、B和C编码区在Trc启动子和rrnB终止序列之间按此顺序彼此相邻。

结果：

检查大肠杆菌Top10/pTrc99a-budABC的三个独立的分离株是否产生丁二醇，用大肠杆菌Top10/pCL1925-Kodd-ddr(下文所述)作为阴性对照。菌株在含有100μg/mL羧苄青霉素的LB培养基中生长。将所得的细胞用于在摇瓶(总体积大约175mL)中接种，该摇瓶装有125mL含100μg/mL羧苄青霉素的TM3a/葡萄糖培养基。此外，用携带pTrc99a-budABC的菌株接种的烧瓶还盛有0.4mM异丙基β-D-1-硫代半乳糖苷(IPTG)。TM3a/葡萄糖培养基(每升)含有：10g葡萄糖、13.6gKH₂PO₄、2.0g柠檬酸一水合物、3.0g(NH₄)₂SO₄、2.0g MgSO_4·7H₂O、0.2g CaCl_2·2H₂O、0.33g柠檬酸铁铵、1.0mg硫胺素.HCl、0.50g酵母提取物和10mL痕量元素溶液，用NH₄OH调节至pH6.8。痕量元素溶液含有：柠檬酸.H₂O(4.0g/L)、MnSO_4·H₂O(3.0g/L)、NaCl(1.0g/L)、FeSO_4·7H₂O(0.10g/L)、CoCl_2·6H₂O(0.10g/L)、ZnSO_4·7H₂O(0.10g/L)、CuSO_4·5H₂O(0.010g/L)、H₃BO₃(0.010g/L)和Na₂MoO_4·2H₂O(0.010g/L)。以大约0.03单位的起始OD₆₀₀对用透气盖封端的烧瓶进行接种，并在34℃下孵育，同时以300rpm摇动。

诱导后大约23小时，通过HPLC(Shodex Sugar SH1011柱)和GC(HP-INNOWax)，用与“一般方法”部分中描述的相同方法，分析肉汤等分试样中的2-丁醇和2-丁酮。分析结果在表6示出。三个大肠杆菌克隆将葡萄糖转化为乙偶姻和内消旋-2，3-丁二醇，这是该途径所期望的中间产物，摩尔选择性为14％。该选择性比缺乏budABC的大肠杆菌对照菌株中所观察到的选择性高大约35倍。

表6

大肠杆菌Top10/pTrc99a-budABC

产生的乙偶姻和内消旋-2，3-丁二醇

菌株	OD₆₀₀	乙偶姻，mM	内消旋-2，3-丁二醇，mM	摩尔选择性^a，％
菌株	OD₆₀₀	乙偶姻，mM	内消旋-2，3-丁二醇，mM	摩尔选择性^a，％
阴性对照	1.4	0.07	0.03	0.4
阴性对照	1.4	0.07	0.03	0.4
分离株#1	1.5	0.64	1.3	14
分离株#1	1.5	0.64	1.3	14	分离株#2	1.4	0.70	1.2	14
分离株#3	1.4	0.74	1.3	15	分离株#2	1.4	0.70	1.2	14
分离株#3	1.4	0.74	1.3	15

^a摩尔选择性＝(乙偶姻+内消旋-2，3-丁二醇)/(消耗的葡萄糖)。

载体pL1925-KoDD-ddr的构建：

利用引物DDo For(SEQ ID NO：44)和DDoRev(SEQ ID NO：45)，将二醇脱水酶(GenBank D45071，SEQ ID NO：69)和再活化因子(GenBank AF017781，SEQ ID NO：70)操纵子作为单一单位从产酸克雷伯菌ATCC 8724 PCR扩增。正向引物整合了优化的大肠杆菌RBS和HindIII限制性酶切位点。反向引物包含XbaI限制性酶切位点。将5318bp PCR产物克隆进pCR4Blunt-TOPO中，并将所得的pCR4Blunt-TOPO-Kodd-ddr克隆进行测序，所用引物为M13 Forward(SEQ ID NO：35)、M13 Reverse(SEQ ID NO：36)、DDko seq F2(SEQID NO：46)、DDko seq F5(SEQ ID NO：47)、DDko seq F7(SEQ IDNO：48)、DDko seq F9(SEQ ID NO：49)、DDko seq R1(SEQ ID NO：50)、DDko seq R3(SEQ ID NO：51)、DDko seq R7(SEQ ID NO：52)以及DDko seq R10(SEQ ID NO：53)。鉴定了具有含预期序列的***物的克隆。

为进行表达，将二醇脱水酶/再活化因子基因亚克隆进pCL1925(美国专利No.7,074,608)中，pCL1925是一种携带得自链霉菌属(Streptomcyes)的萄糖异构酶启动子的低拷贝质粒。用HindIII和XbaI消化pCR4Blunt-TOPO-Kodd-ddr，并将所得的5.3kbp Kodd-ddr片段进行凝胶纯化。用HindIII和XbaI消化载体pCL1925，并将所得的4539bp载体片段进行凝胶纯化。连接载体和Kodd-ddr片段，并将其转化进大肠杆菌Top10中。利用引物DDko Seq F7(SEQ ID NO：48)和DDko seqR7(SEQ ID NO：52)通过PCR技术筛选转化株。扩增携带该***物的质粒(pCL1925-Kodd-ddr)产生大约797bp的产物。

通过在室温下于80mM HEPES(pH8.2)中将细胞提取物(总蛋白质为～0.8mg/mL)与10mM丁二醇和12mM辅酶B₁₂孵育17h，测定二醇脱水酶对内消旋-2，3-丁二醇的活性。如“一般方法”中所述的通过HPLC确定预期产物2-丁酮的形成。

载体pCL1925-KoDD-ddr::T5 chnA ter的构建：

要提供异源乙醇脱氢酶的活性，将来自不动杆菌编码环己醇脱氢酶的chnA基因(Cheng等人，J.Bacteriol.182：4744-4751(2000))克隆到具有二醇脱水酶操纵子pCL1925-Kodd-ddr的pCL1925载体中。用引物ChnA F(SEQ ID NO：54)和ChnA R(SEQ ID NO：55)从pDCQ2(来自不动杆菌携带环己醇基因簇的粘粒)扩增chnA基因(SEQ IDNO：71(GenBank No：AF282240，SEQ ID NO：73))。将所得的828bpPCR产物克隆到pCR4Blunt-TOPO内而产生pCR4Blunt-TOPO-chnA，并利用引物M13 Forward(SEQ ID NO：35)和引物M13 Reverse(SEQID NO：36)通过菌落PCR筛选转化株。正确的克隆产生约1kbp的PCR产物，并用引物M13Forward(SEQ ID NO：35)和引物M13 Reverse(SEQ ID NO：36)进行测序。

对pCR4Blunt-TOPO-chnA进行测序以确认序列正确后，从质粒中亚克隆chnA基因的813bp的MfeI/SmaI片段。用MfeI和SmaI消化表达载体pQE30(Qiagen)，并且将所得的3350bp载体片段进行凝胶纯化。将chnA片段和纯化的载体连接，并转化到大肠杆菌Top10细胞内。针对494bp的PCR产物，用引物chnSeq F1(SEQ ID NO：56)和chnseqR1(SEQ ID NO：57)对转化株进行菌落PCR筛选。在该克隆将chnA基因置于质粒pQE30-chnA中的T5启动子控制下。

要制备携带两个操纵子的pCL1925载体，向该载体加入终止子。利用引物Top ter F1(SEQ ID NO：58)、Top ter F2(SEQ ID NO：59)、Bot ter R1(SEQ ID NO：60)和Bot ter R2(SEQ ID NO：61)通过寡核苷酸退火而制备tonB终止子-mcs-trpA终止子片段。将退火的DNA在6％PAGE凝胶(Embi-tec，San Diego，CA)上进行凝胶纯化。用SacI和XbaI消化载体pCL1925并进行凝胶纯化。连接退火的DNA和载体片段以生成pCL1925-ter。通过采用引物pCL1925 vec F(SEQ ID NO：62)和pCL1925 vec R1(SEQ ID NO：63)的菌落PCR扩增，针对大约400bp的PCR产物的存在筛选转化株。利用相同的引物对PCR筛选所得到的阳性克隆进行测序。

用XhoI和PmeI消化载体pCL1925-ter，对所得的4622bp片段进行凝胶纯化。用NcoI消化pQE30-chnA，并用Klenow DNA聚合酶处理该DNA以产生平末端。然后用XhoI消化pQE30-chnA，并将所得的1.2kbp的T5启动子-chnA片段进行凝胶纯化。将pCL1925-ter载体和chnA操纵子片段连接在一起以产生pCL1925-ter-T5chnA，并将其转化到大肠杆菌Top10中。通过采用引物pCL1925 vec F(SEQ ID NO：64)和chnseq R1(SEQ ID NO：59)的菌落PCR扩增，针对大约1kbp的产物筛选转化株。

要完成途径载体的构建，用XbaI和SacI消化pCL1925-KoDD-ddr质粒，并将所得的9504bp载体片段进行凝胶纯化。将来自pCL1925-ter-T5chnA、两侧带有终止子的chnA操纵子(Koichi等人，(1997)Volume 272，Number 51，pp.32034-32041)(trpA终止子位于chnA编码序列的3’端)被凝胶纯化为1271bp的XbaI/SacI片段。连接片段并转化到大肠杆菌Top10中后，通过菌落PCR对转化株进行筛选。用引物chnSeq F1(SEQ ID NO：58)和pCL1925 vec R2(SEQ ID NO：64)在所得的质粒pCL1925-KoDD-ddr::ter-T5chnA中扩增出预期的1107bp PCR产物。

实施例10

2-丁醇生物合成途径在过表达内源性醇脱氢酶的大肠杆菌中的表达

本实施例的目的是在几种大肠杆菌菌株中表达2-丁醇生物合成途径。

组成型表达yqhD的大肠杆菌菌株的构建：

大肠杆菌含有天然基因(yqhD)，该天然基因被鉴定为1，3-丙二醇脱氢酶(美国专利No.6,514,733)。yqhD基因(SEQ ID NO：74)与梭菌属中的基因adhB(可能是NADH依赖型丁醇脱氢酶)具有40％的同一性。采用λRed技术(Datsenko和Wanner，Proc.Natl.Acad.Sci.U.S.A.97：6640(2000))将yqhD基因置于大肠杆菌菌株MG1655 1.6yqhD::Cm(WO 2004/033646)中的葡萄糖异构酶启动子1.6GI(SEQ ID NO：67)变体的组成型表达下。类似地，用1.5GI启动子(WO 2003/089621)(SEQ ID NO：68)代替该天然启动子，产生菌株MG1655 1.5yqhD::Cm，因而，用1.5GI启动子代替了MG1655 1.6yqhD::Cm的1.6GI启动子。1.5GI和1.6GI启动子的不同之处在于-35区中的1bp，由此改变了启动子的强度(WO 2004/033646)。用1.5GI或用1.6GI启动子代替天然的yqhD启动子时，编码yqh操纵子的推定的转录调节因子的yqhC基因被删除。采用本领域内熟知的方法通过酶检测法确认丁醇脱氢酶的活性。

大肠杆菌菌株的转化：

将实施例9中描述的途径质粒pCL1925-Kodd-ddr和pTrc99a-budABC共转化到大肠杆菌菌株MG1655、MG1655 1.6yqhD和MG1655 1.5yqhD中。后两种菌株过表达1，3-丙二醇脱氢酶(YqhD)，该脱氢酶还具有丁醇脱氢酶活性。基本如上所述检查菌株是否产生2-丁酮和2-丁醇。将细胞接种到装有50或150mL TM3a/葡萄糖培养基(含0.1mg/L维生素B₁₂、合适的抗生素和IPTG)的摇瓶(总体积大约为175mL)以分别表现中等氧和低氧条件。大观霉素(50μg/mL)和羧苄青霉素(100μg/mL)分别用于质粒pCL1925-Kodd-ddr和pTrc99a-budABC。以起始OD₆₀₀≤0.04单位将菌落接种至摇瓶，在34℃下以300rpm振荡孵育。盛有50mL培养基的摇瓶盖有有通气盖；盛有150mL培养基的摇瓶带有不通气的盖以最大程度减少空气交换。在时间点零时加入浓度为0或0.04mM的IPTG。2-丁酮和2-丁醇产生的分析结果在表7中示出。所有包含2-丁醇生物合成途径的大肠杆菌菌株在低氧和中等氧条件下产生了2-丁酮，并且在低氧条件下产生了2-丁醇。

表7

用含有途径质粒DCL1925-Kodd-ddr和pTrc99a-budABC的大肠杆菌MG1655菌株产生2-丁酮和2-丁醇

菌株 ^a，b	IPTG.mM	培养基体积， mL	2-丁酮， mM	2-丁醇， mM
菌株 ^a，b	IPTG.mM	培养基体积， mL	2-丁酮， mM	2-丁醇， mM
MG1655 #1	0	50	0.08	未检出
MG1655 #1	0	50	0.08	未检出	MG1655 #2	0	50	0.11	未检出
MG1655 #1	0.04	50	0.12	未检出	MG1655 #2	0	50	0.11	未检出
MG1655 #1	0.04	50	0.12	未检出	MG1655 #2	0.04	50	0.11	未检出
MG1655 #1	0	150	0.15	0.047	MG1655 #2	0.04	50	0.11	未检出
MG1655 #1	0	150	0.15	0.047	MG1655 #2	0	150	0.19	0.041
MG1655 #1	0.04	150	0.10	0.015	MG1655 #2	0	150	0.19	0.041
MG1655 #1	0.04	150	0.10	0.015	MG1655 #2	0.04	150	0.11	0.015
					MG1655 #2	0.04	150	0.11	0.015
					MG16551.5yqhD #1	0	50	0.10	未检出

MG16551.5yqhD #2	0	50	0.07	未检出
MG16551.5yqhD #2	0	50	0.07	未检出	MG16551.5yqhD #1	0.04	50	0.12	未检出
MG16551.5yqhD #2	0.04	50	0.18	未检出	MG16551.5yqhD #1	0.04	50	0.12	未检出
MG16551.5yqhD #2	0.04	50	0.18	未检出	MG16551.5yqhD #1	0	150	0.16	0.030
MG16551.5yqhD #2	0	150	0.18	0.038	MG16551.5yqhD #1	0	150	0.16	0.030
MG16551.5yqhD #2	0	150	0.18	0.038	MG16551.5yqhD #1	0.04	150	0.10	0.021
MG16551.5yqhD #2	0.04	150	0.09	0.017	MG16551.5yqhD #1	0.04	150	0.10	0.021
MG16551.5yqhD #2	0.04	150	0.09	0.017
MG16551.6yqhD #1	0	50	0.08	未检出
MG16551.6yqhD #1	0	50	0.08	未检出	MG16551.6yqhD #2	0	50	0.07	未检出
MG16551.6yqhD #1	0.04	50	0.12	未检出	MG16551.6yqhD #2	0	50	0.07	未检出
MG16551.6yqhD #1	0.04	50	0.12	未检出	MG16551.6yqhD #2	0.04	50	0.15	未检出
MG16551.6yqhD #1	0	150	0.17	0.019	MG16551.6yqhD #2	0.04	50	0.15	未检出
MG16551.6yqhD #1	0	150	0.17	0.019	MG16551.6yqhD #2	0	150	0.18	0.041
MG16551.6yqhD #1	0.04	150	0.11	0.026	MG16551.6yqhD #2	0	150	0.18	0.041
MG16551.6yqhD #1	0.04	150	0.11	0.026	MG16551.6yqhD #2	0.04	150	0.11	0.038
					MG16551.6yqhD #2	0.04	150	0.11	0.038
					对照物(未接种的培养基)			未检出	未检出

^a #1和#2表示独立的分离株。

^b MG1655是MG1655/pCL1925-Kodd-ddr/pTrc99a-budABC

MG1655 1.6yqhD是MG1655 1.6yqhD/pCL1925-Kodd-ddr/pTrc99a-budABC

MG1655 1.6yqhD是MG1655 1.5yqhD/pCL1925-Kodd-ddr/pTrc99a-budABC。

实施例11

2-丁醇生物合成途径在具有异源乙醇脱氢酶的大肠杆菌中的表达

如实施例9中所述，将质粒pCL1925-KoDD-ddr::ter-T5chnA和pTrc99a-budABC转化到大肠杆菌菌株MG1655和MG1655ΔyqhCD内以用于验证2-丁醇的产生。

MG1655 ΔyqhCD携带失活的yqhCD，失活的yqhCD是利用Datsenko和Wanner的方法(Proc.Natl.Acad.Sci.U.S.A.97(12)：6640-6645(2000))制备。在将该区用pKD3的FRT-CmR-FRT盒置换后，用FLP重组酶移除氯霉素抗性标记。缺失区域的序列定为SEQ ID NO：66。

基本按上述方法，检查菌株MG1655/pTrc99a-budABC/pCL1925KoDD-ddr::ter-T5 chnA和MG1655ΔyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr::ter-T5 chnA的2-丁酮和2-丁醇产生。菌株MG1655ΔyqhCD/pCL1925作为阴性对照。将细胞接种在装有50或150mL TM3a/葡萄糖培养基(添加了0.1mg/L维生素B₁₂和合适的抗生素)的摇瓶(总体积大约为175mL)中以分别表现中等氧和低氧条件。大观霉素(50μg/mL)和氨苄青霉素(100μg/mL)分别用于筛选基于pCL1925的质粒和pTrc99a-budABC。源于pTrc99a-budABC的酶活性是在不存在PTG诱导物的情况下通过酶测定法检测，因而，培养基中不加入IPTG。以起始OD₆₀₀≤0.01单位将菌落接种至摇瓶中，在34℃下以300rpm振荡孵育24h。盛有50mL培养基的摇瓶盖有有通气盖；盛有150mL培养基的摇瓶盖有不通气的盖以最大程度减少空气交换。2-丁酮和2-丁醇产生的分析结果在表8中示出。两种包含2-丁醇生物合成途径的大肠杆菌菌株均在低氧和中度氧条件下产生2-丁酮，而在低氧条件下产生2-丁醇。

表8

由大肠杆菌菌株产生的2-丁酮和2-丁醇

菌株^a	体积，mL	2-丁酮，mM	2-丁醇，mM
菌株^a	体积，mL	2-丁酮，mM	2-丁醇，mM
阴性对照，MG1655ΔyqhCD/pCL1925	50	未检出	未检出
阴性对照，MG1655ΔyqhCD/pCL1925	50	未检出	未检出	MG1655/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA ter	50	0.33	未检出
MG1655Δyq hCD/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA ter #1	50	0.23	未检出	MG1655/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA ter	50	0.33	未检出
MG1655Δyq hCD/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA ter #1	50	0.23	未检出	MG1655 ΔyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA #2	50	0.19	未检出
				MG1655 ΔyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA #2	50	0.19	未检出
				阴性对照，MG1655ΔyqhCD/pCL1925	150	未检出	未检出
MG1655/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA ter	150	0.41	0.12	阴性对照，MG1655ΔyqhCD/pCL1925	150	未检出	未检出
MG1655/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA ter	150	0.41	0.12	MG1655 ΔyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA #1	150	0.15	0.46
MG1655 ΔyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA #2	150	0.44	0.14	MG1655 ΔyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA #1	150	0.15	0.46
MG1655 ΔyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr::T5chnA #2	150	0.44	0.14
培养基		未检出	未检出

^a #1和#2表示独立的分离株。

实施例12

氨基：丙酮酸转氨酶(APT)的克隆

来自河流弧菌JS17的氨基：丙酮酸转氨酶(APT)由Shin等人鉴定(Appl.Microbiol Biotechnol.(2003)61：463-471)。发现该酶的氨基酸序列(SEQ ID NO：122)与氨基酸：丙酮酸转氨酶具有显著的同源性(Shin和Kim(J.Org.Chem.67：2848-2853(2002))。这表明，河流弧菌APT对乙偶姻具有转氨酶活性。

为了使APT酶在大肠杆菌中表达，利用大肠杆菌优选的密码子以及其它的考虑(例如密码子平衡和mRNA的稳定性)，设计密码子优化的APT编码区(SEQ ID NO：144)，并合成(由DNA2.0合成；RedwoodCity，CA)。将编码区DNA片段亚克隆至pBAD.HisB载体(Invitrogen)的NcoI和HindIII位点之间，并将所得的质粒(下文称为pBAD.APT1)转化到TOP10细胞中。

实施例13

河流弧菌APT丙氨酸：乙偶姻转氨酶活性的表征

将TOP10/pBAD：APT1细胞的新鲜菌落接种到5mL含100μg/mL氨苄青霉素的LB肉汤中。将培养物在37℃下振荡(225rpm)孵育大约16h。将300μL该培养物的等分试样用于接种300mL相同的培养基，将培养基在37℃下振荡孵育(225rpm)。当培养物的OD₆₀₀达到0.8时，加入L-***糖至终浓度为0.2％(w/v)。将培养物另外孵育16h，然后收获。将细胞用100mM磷酸钾缓冲液(pH7.8)洗涤一次，然后冷冻并在-80℃下保存。

要分离酶，则将细胞颗粒解冻并重悬于8mL100mM磷酸钾缓冲液(pH7)中，缓冲液中含有0.2mM乙二胺四乙酸、1mM二硫苏糖醇和一片蛋白酶抑制剂混合物(Roche；Indianapolis，IN)。两次通过6.2MPa(900psi)下的弗氏压碎器使细胞裂解，并将所得的裂解产物通过在17000×g下离心30min进行澄清。加入硫酸铵至35％的饱和度，并在室温下搅拌溶液30min，此时通过离心(30min，17000×g)移出沉淀固形物。在上清液中加入额外的硫酸铵至55％饱和，在室温下再次搅拌溶液30min。通过离心(30min，17000×g)移出沉淀固形物，然后重悬于5mL含10μM 5’-磷酸吡哆醛和1mM二硫苏糖醇的100mM磷酸钾缓冲液(pH7)中。将该溶液通过用缓冲液A(50mM bis-tris丙烷缓冲液(pH6)，含有10μM 5’-磷酸吡哆醛和1mM二硫苏糖醇)平衡的PD10柱进行脱盐。然后将脱盐后的提取物上样至到用缓冲液A预平衡过的20mL Q-Fast Flow柱中。用缓冲液A中0-0.1MNaCl的线性梯度洗脱APT。通过在用聚丙烯酰胺凝胶电泳分析时存在的约8.3E-20g(50kD)的蛋白条带以及通过418nm下的特征性吸光度来检测洗脱级分中的酶。含有所述酶的级分在约0.3M NaCl时洗脱。合并这些级分得到总体积6mL的5.45mg/mL酶溶液，通过聚丙烯酰胺凝胶电泳判断该酶纯度>90％。

APT的丙氨酸：乙偶姻转氨酶活性采用乳酸脱氢酶偶联测定法来测定。反应混合物含100mM bis-tris丙烷(pH 9.0)、10μM 5’-磷酸吡哆醛、0-50mM乙偶姻、0-5mM_L-丙氨酸、0.14或0.28mg/mL纯化的酶、200μM NADH和20U/mL乳酸脱氢酶(Sigma；St.Louis，MO)。反应后，测量340nm处吸光度的变化，以此指示NADH的氧化。在上述条件下，乙偶姻的k_cat/K_m为10M^-1s^-1，L-丙氨酸的kcat/Km为400M^-1s^-1。

预期产物3-氨基-2-丁醇的身份是通过与合成的标准品比较来确定。用Dickey等人的方法合成(R，R)-和(S，S)-3-氨基-2-丁醇的混合物[Amer Chem Soc74：944(1952)]：将5g反式-2，3-环氧丁烷缓慢地搅动加至150mL冷的(4℃)NH₄OH中。将反应物慢慢升温至室温，密封并在室温下另外搅拌10天。此时，在40℃的真空条件下，通过旋转蒸发除去过量的氨和水以及残留的环氧丁烷。将所得的澄清油状物(2.9g)重悬于水中至浓度为10％(w/v)。通过NMR分析并与Levy等人报道的NMR谱[Org.Magnetic Resonance14：214(1980)]进行比较以确定产物的生成。用相同的方法合成相应的(2R，3S)-和(2S，3R)-异构体混合物，不同的是以2，3环氧丁烷的顺式异构体作为原料。

根据Roth报道的用于测定氨基酸的邻苯二甲醛衍生法[Anal.Chem.43：880(1971)]开发出了检测3-氨基-2-丁醇的分析方法。将200μL的1mM 3-氨基-2-丁醇(异构体混合物)等分试样与200μL 50mM硼酸盐溶液(pH9.5)混合，向其加入10μL乙醇中的5μL/mL 2-巯基乙醇和10μL乙醇中的10mg/mLo-邻苯二甲醛。溶液于室温下孵育10min，那时将衍生物萃取至200μL己烷中。通过滗析将己烷从水溶液分离，并将10μL注射至Chiracel OD HPLC柱(Daicel Chemical Industries；FortLee，NJ)。用90:10的己烷:异丙醇流动相以1mL/min的流速通过色谱注。通过在340nm处的吸光度检测到了3-氨基-2-丁醇的衍生化异构体，保留时间为大约15.7和16.8min[(2S，3S)和(2R，3R)]，以及18.4和21.9min[(2R，3S)和(2S，3R)]。为了区分第一混合物中的对映体，也在相同条件下对纯化的(2R，3R)异构体(Bridge Organics；Vicksburg，MI)进行色谱分析，并且发现是16.8min的峰。为了区分第二混合物中的异构体，首先利用丙氨酸:乙偶姻转氨酶对混合物进行动力学拆分：将0.28mg纯化的酶与1mL 100mM bis-tris丙烷(pH9.0)中的10mM丙酮酸和10mM3-氨基-2-丁醇[(2R，3S)和(2S，3R)异构体的1:1混合物]孵育。室温下24h后，移出等分试样如上所述进行分析。分析表明，18.4min的峰减少了95％，而21.9min的峰超过90％的保留下来。将100μL剩余反应混合物的等分试样与50μL 20mM NADH以及10μL来自实施例9中所述的TOP10/pTrc99a-BudC菌株的提取物进行混合。BudC酶已知可将(R)-乙偶姻还原为内消旋-2，3-丁二醇，并且可以使(S)-乙偶姻还原为(S，S)-2，3-丁二醇[Ui等人，(2004)Letters in AppliedMicrobiology39：533-537]。3h后，从反应物取出样品并如上所述分析乙偶姻和丁二醇。分析表明，主要的还原产物是内消旋-2，3-丁二醇，说明转氨酶反应的产物是(R)-乙偶姻，因此消耗的3-氨基-2-丁醇为(2R，3S)异构体。因而，保留时间18.4min可归为该异构体，21.9min可归为(2S，3R)异构体。

为了确认APT催化的丙氨酸:乙偶姻转氨酶反应的产物是3-氨基-2-丁醇，将0.28mg纯酶与1mL100mM bis-tris丙烷(pH9.0)中的10mM乙偶姻、10mM_L-丙氨酸、50U乳酸脱氢酶和200μM NADH进行孵育。将反应混合物在室温下孵育20h，然后移出200μL等分试样并如上所述衍生化。衍生产物的保留时间分别为15.8min(主要产物)和18.5min(次要产物)，与(2S，3S)-和(2R，3S)-3-氨基-2-丁醇标准样品的保留时间相符。

实施例14

胡萝卜软腐欧文氏菌黑胫亚种的氨基醇激酶和氨基醇O-磷酸酯裂解酶的鉴定与克隆

该实施例的目的是描述如何鉴定和克隆来自细菌胡萝卜软腐欧文氏菌的编码氨基醇激酶和氨基醇O-磷酸酯裂解酶的序列。这两种酶是途径1中将3-氨基-2-丁醇经中间产物3-氨基-2-丁醇磷酸酯转化为2-丁酮的部分，如图1所示。

欧文氏菌氨基醇激酶和氨基醇O-磷酸酯裂解酶的预测

ATP依赖型氨基醇激酶和氨基醇O-磷酸酯裂解酶活性已经在几种假单胞菌属和欧文氏菌属的菌种中得以检测，包括假单胞菌P6NCIB10431)、恶臭假单胞菌NCIB 10558(Jones等人，(1973)Biochem.J.134：167-182)、胡萝卜软腐欧文氏菌、菠萝欧文氏菌(Erwinia amanas)、鸡血藤欧文氏菌(Erwina milletiae)和马铃薯黑胫欧文氏菌(Erwiniaatroseptica)(Jones等人，(1973)Biochem.J.134：959-968)。在这些研究中，上述菌种的提取物显示具有将氨丙醇经由氨丙醇O-磷酸酯转化为丙醛以及将乙醇胺经由乙醇胺O-磷酸酯转化为乙醛的活性。

据报道存在上述活性的马铃薯黑胫欧文氏菌菌株(现命名为胡萝卜软腐欧文氏菌黑胫亚种菌株SCRI1043(ATCC BAA-672))的基因序列已在Sanger Institute进行了测定(Bell等人，Proc.Natl.Acad.Sci.USA101(30)：11105-11110)。分析胡萝卜软腐欧文氏菌黑胫亚种基因组中的推定激酶基因发现了一个操纵子序列(SEQ ID NO：275)，其编码的推定蛋白(ECA2059；SEQ ID NO：124)与百脉根根瘤菌(Rhizobiumloti)的高丝氨酸激酶具有39％的同源性，编码的第三类磷酸吡哆醛(PLP)依赖型转氨酶(ECA2060；SEQ ID NO：126)与来自苜蓿根瘤菌(Rhizobium meliloti)的推定转氨酶具有58％的同源性。预计ECA2059是一种氨基醇激酶，ECA2060是一种利用PLP作为辅因子的氨基醇O-磷酸酯裂解酶。

胡萝卜软腐欧文氏菌黑胫亚种的推定氨基醇激酶和推定氨基醇O- 磷酸酯裂解酶的克隆

胡萝卜软腐欧文氏菌黑胫亚种(ATCC #：BAA-672D)的基因组DNA可得自美国典型菌种保藏中心(ATCC)。编码推定的氨基醇激酶(KA)和氨基醇O-磷酸酯裂解酶(AT)的操纵子命名为KA-AT(SEQID NO：275。用Phusion DNA聚合酶(Finnzymes；New England Biolabs；Ipswich，MA)从欧文氏菌属基因组DNA扩增该操纵子序列，扩增引物为OT872(SEQ.ID：127)和OT873(SEQID：128)。通过PCR反应得到2.4kb的基因片段，其对应于KA-AT操纵子的大小。用EcoRI和PstI限制性内切酶消化PCR产物，并将其克隆至用相同限制性内切酶消化的pKK223-3载体(Amersham Biosciences；Piscataway，NJ)中。这产生了质粒pKK223.KA-AT，其含有处于tac启动子控制下的推定的欧文氏菌属氨基醇激酶-裂解酶操纵子序列。类似地，制备了质粒pKK223.KA和pKK223.AT，其中将推定的欧文氏菌属激酶及推定的欧文氏菌属裂解酶编码区置于独立的载体中，均处于tac启动子控制下。对于KA编码区(SEQ ID NO：123)的PCR克隆，使用了引物OT872(SEQID：127)和OT879(SEQIDNo.129)；而对于AT编码区(SEQID NO：125)的PCR克隆，在PCR扩增中使用了引物OT873(SEQ.ID：128)和OT880(SEQID：130)，生成的PCR产物分别为1.1kb和1.3kb。将每种PCR产物用EcoRI和PstI消化，并连接进载体pKK223-3中以产生pKK223.KA和pKK223.AT。

来源于胡萝卜软腐欧文氏菌黑胫亚种的推定氨基醇激酶和推定氨基醇O-磷酸酯裂解酶的体内活性

将质粒pKK223.KA-AT、pKK223.KA、pKK223.AT和pKK223-3转化至大肠杆菌MG1655菌株中。将转化体再次划线接种到MOPS基本培养基平板上，该基本培养基含有1％葡萄糖、0.5％氨丙醇(作为单一氮源)、1mM IPTG以及100μg/mL氨苄青霉素。用IPTG诱导KA-AT、KA和AT基因的表达。对照平板中不含IPTG。将平板于37℃下培养7天。在含有IPTG的平板上，仅MG1655/pKK223.KA-AT菌株生长，其它三种菌株未能生长。无IPTG的平板中长出了MG1655/pKK223.KA-AT菌株，不过菌落显著小于含IPTG的平板上的那些菌落，这对应于未诱导菌株细胞中KA和AT表达水平较低。其它三种菌株也未能在平板上生长。这表明推定的欧文氏菌属KA和AT基因的共表达提供了足够的酶活性，该活性使得大肠杆菌菌株MG1655/pKK223.KA-AT能利用氨丙醇作为唯一的氮源。每种单独的KA酶或AT酶的表达不足以在体内产生这样的酶活性。

实施例15

欧文氏菌属推定的氨基醇激酶和氨基醇O-磷酸酯裂解酶的体外活性

将欧文氏菌属KA-AT操纵子亚克隆到pBAD.HisB载体内并诱导蛋白质表达

采用SDS-PAGE分析法，分析了MG1655细胞中从pKK223.KA-AT载体表达的欧文氏菌属的推定的KA和AT酶的蛋白质表达水平。欧文氏菌AT酶的表达水平相对较低，并且在细胞提取物的可溶级分中检测到正确分子量为7.8E-20g(46kD)的新蛋白条带，而没有检测到与预期的KA酶相当大小的新蛋白条带。

为了提高欧文氏菌属推定的KA和AT基因的表达，将KA-AT操纵子亚克隆进载体pBAD.HisB-EcoRI的EcoRI和HindIII位点。通过使用引物OT909(SEQ ID #131)和OT910(SEQ ID #132)，经由QuickChange定点诱变(Stratagene，LaJolla，CA)用EcoRI位点置换pBAD.HisB中的NcoI位点，从pBAD.HisB载体(Invitrogen)衍生得到pBAD.HisB-EcoRI。在构建的质粒pBAD.KA-AT中，KA-AT操纵子被直接置于araB启动子(没有组氨酸标签)的控制下。

将pBAD.KA-AT质粒转化到大肠杆菌TOP10菌株中。将TOP10/pBAD.KA-AT株的50mL培养物在含有100μg/mL氨苄青霉素的LB培养基中于37℃下以250rpm振荡培养至对数中期(OD₆₀₀＝0.6)。通过加入L-***糖至终浓度0.1％(w/v)诱导培养物，并在37℃下进一步孵育5h，然后通过离心收获培养物。将细胞颗粒重悬于冰冷的50mM Tris-HCl(pH8.0中)，并用Fischer Sonic 300型Dismembrator(Fischer，Pittsburgh，PA)以50％的功率，在冰上超声破碎细胞，每个循环进行超声处理30秒，每次循环间停止60秒，重复四次循环。将每种经超声处理的样品离心(15,000×g，4分钟，4℃)。对澄清的无细胞提取物分析其蛋白质表达水平和氨基醇O-磷酸酯裂解酶活性。

氨基丁醇O-磷酸酯和氨丙醇O-磷酸酯的化学合成

通过基于Ferrari和Ferrari报道用于磷酸乙醇胺的方法(美国专利2730542[1956])的方法合成底物(R，R)-3-氨基-2-丁醇O-磷酸酯：将50％(w/v)水溶液中的10mmol H₃PO₄与(R，R)-3-氨基-2-丁醇(BridgeOrganics；Vicksburg，MI)的50％(w/v)水溶液混合，同时在冰上搅拌。混匀后，将溶液缓慢升温至室温，并然后在真空条件下搅拌并加热至70℃。在70℃下1h后，将温度缓慢地升高至185℃并维持另外2h。然后，将反应冷却至室温，并释放真空。将剩余物质溶于水中，并通过NMR分析表明，80％的原料转化成产物，有20％仍未反应。未观察到额外的产物。

通过同样的方法，用(2R，3S)-3-氨基-2-丁醇和(2S，3R)-3-氨基-2-丁醇的1:1混合物(如实施例13所述合成)作为原料，合成另外的底物(2R，3S)-3-氨基-2-丁醇O-磷酸酯以及(2S，3R)-3-氨基-2-丁醇O-磷酸酯。按照同样的方法，用DL-1-氨基-2-丙醇、(R)-2-氨基-1-丙醇或(S)-2-氨基-1-丙醇作为原料，合成DL-1-氨基-2-丙醇O-磷酸酯、(S)-2-氨基-1-丙醇O-磷酸酯以及(R)-2-氨基-1-丙醇O-磷酸酯。

由推定的欧文氏菌属KA-AT操纵子编码的氨丙醇O-磷酸酯裂解酶活性的分析

氨丙醇O-磷酸酯裂解酶测定法按照Jones等人(1973，Biochem.J.134：167-182)及G.Gori等人(1995，Chromatographia 40：336)所述的进行。对从氨丙醇O-磷酸酯形成丙醛用MBTH(其使得能检测醛形成)通过比色分析法测定。该反应如下进行。在1mL反应物中，将100μg大肠杆菌TOP10/pBAD.KA-AT的无细胞提取物加至100mMTris-HCl(pH7.8)中的10mM DL-1-氨基-2-丙醇O-磷酸酯中，该Tris-HCl中具有0.1mM PLP。将反应物在37℃下孵育10分钟和30分钟，在每个时间点移出100μL反应混合物等分试样，并将其与100μL 375mM甘氨酸-HCl(pH 2.7)中的6mg/mL MBTH混合。将该混合物在100℃孵育3分钟，在冰上冷却15-30s，并加入1mL的3.3mg/mL FeCl_3·6H₂O(在10mM HCl中)，然后在室温下孵育30分钟。在670nm处测定含有醛-MBTH加成物的反应混合物的吸光度。该测定的结果在表9中示出。在存在氨丙醇磷酸酯底物、PLP和无细胞提取物时，检测到醛的生成，醛生成用Abs₆₇₀指示，其比对照背景高多达0.3。当没有底物或无细胞提取物时，均未检出醛。不添加PLP时，检测到较少量的醛，推测是由于无细胞提取物中存在PLP的缘故。未经诱导的TOP10/pBAD.KA-AT-培养物的无细胞提取物在反应中未生成任何可检测到的醛。这些结果表明，推定的欧文氏菌属氨基醇O-磷酸酯裂解酶的确催化氨丙醇O-磷酸酯转化生成丙醛。

表9。

氨丙醇O-磷酸酯裂解酶测定。样品1是未经诱导的大肠杆菌 TOP10/pBAD.KA-AT的对照物的无细胞提取物。样品2-5含有经诱导的培养物大肠杆菌TOP10/pBAD.KA-AT的无细胞提取物。

样品号	由0.1％***糖诱导	氨丙醇O-磷酸酯	PLP	酶提取物(100μg/mL)	OD₆₇₀，10min	OD₆₇₀，30min
样品号	由0.1％***糖诱导	氨丙醇O-磷酸酯	PLP	酶提取物(100μg/mL)	OD₆₇₀，10min	OD₆₇₀，30min	1	未诱导	(+)	(+)	(+)	0.262	0.255
2	经诱导	(+)	(+)	(+)	1.229	2264	1	未诱导	(+)	(+)	(+)	0.262	0.255
2	经诱导	(+)	(+)	(+)	1.229	2264	3	经诱导	(-)	(+)	(+)	0.303	0.223
4	经诱导	(+)	(-)	(+)	0.855	1.454	3	经诱导	(-)	(+)	(+)	0.303	0.223
4	经诱导	(+)	(-)	(+)	0.855	1.454	5	经诱导	(+)	(+)	(-)	0.156	0.065

欧文氏菌属氨基醇O-磷酸酯裂解酶对氨基丁醇O-磷酸酯底物的活性分析

在与上述相同的条件下，研究氨基醇O-磷酸酯裂解酶对氨基丁醇O-磷酸酯底物的活性。该反应在1mL反应物中于37℃过夜进行，该反应物含有100mM Tris-HCl(pH7.8)中的100μg大肠杆菌TOP10/pBAD.KA-AT的无细胞提取物、10mM氨基丁醇O-磷酸酯((R，R)+(S，S)的混合物或(R，S)+(S，R)异构体的混合物，如实施例15中所述)，该Tris-HCl添加有0.1mM PLP。移出100μL反应混合物，并用“一般方法“中所述的MBTH衍生法检测2-丁酮产物。观察到代表衍生的2-丁酮异构体的两个峰。所以，欧文氏菌属氨基醇O-磷酸酯裂解酶除了是氨丙醇磷酸酯磷酸裂解酶外，还是氨基丁醇磷酸酯磷酸裂解酶。

欧文氏菌属氨基醇O-磷酸酯裂解酶对氨丙醇O-磷酸酯和氨丁醇 O-磷酸酯的立体异构体的活性分析

在与上述相同的条件下，研究欧文氏菌属氨基醇O-磷酸酯裂解酶对氨丙醇O-磷酸酯和氨丁醇O-磷酸酯的多种立体异构体的活性。在存在欧文氏菌属氨基醇O-磷酸酯裂解酶的情况下，(R)和(S)-2-氨基-1-丙醇O-磷酸酯均由该酶转化成丙酮，但是(S)异构体的产率要高得多。该酶还从3-氨基-2-丁醇O-磷酸酯异构体的两种混合物都生成丁酮，在含有(R，S)和(S，R)底物异构体的反应物中产率较高。丙酮和丁酮产物两者均通过MBTH进行衍生化，并通过如“一般方法“中所述的HPLC检测。

欧文氏菌属氨基醇激酶和氨基醇O-磷酸酯裂解酶的基因表达水平的优化

为了提高欧文氏菌属氨基醇激酶和氨基醇O-磷酸酯裂解酶基因在大肠杆菌中的表达水平，由DNA2.0(Redwood City，CA)合成两种酶的密码子优化的编码区(分别命名为EKA：SEQ ID NO：155，和EAT：SEQ ID NO：156)。合成在5’与3’末端包含限制性酶切位点以用于克隆的每个编码区：EKA具有5’BbsI和3’EcoRI、HindIII位点；EAT具有5’EcoRI和3’HindIII位点。DNA2.0以质粒pEKA和pEAT的形式提供EKA和EAT编码区，这两个质粒在DNA2.0的pJ51载体中。通过连接经BbsI和HindIII消化的pEKA片段，将EKA优化的编码区亚克隆到pBAD.HisB载体的NcoI和HindIII位点之间，以产生质粒pBAD.EKA。在所得的质粒中，编码区在组氨酸标记的5’端，所以使用引物SEQ ID NO：157和SEQ ID NO：158，通过进行QuickChange定点诱变反应，构建与欧文氏菌属的氨基醇激酶融合的N-末端His₆标记的编码区以产生载体pBAD.His-EKA。

将pBAD.His-EKA转化到大肠杆菌菌株BL21AI(F^-ompThsdSB(rB-mB-)gal dcm araB::T7RNAP-tetA；Invitrogen)中以产生菌株BL21AI/pBAD.HisA-EKA。将50mLBL21AI/pBAD.HisA-EKA培养物培养至对数中期(OD₆₀₀＝0.6)，用0.1％***糖诱导，并进一步在30℃下孵育过夜。通过超声处理制备无细胞提取物。在非变性纯化条件下，按照生产商的说明书，用ProBond^TM纯化***(Invitrogen)纯化His₆-标记的欧文氏菌属氨基醇激酶融合蛋白。

预言性结果

按照生产商的说明书，用ADP Quest Assay(DiscoveRx，Fremont，CA)分析His₆标记的欧文氏菌属氨基醇激酶的活性。这是一种测定ADP的积累的生化测定法，ADP是利用氨丙醇或氨基丁醇作为底物的氨基醇激酶反应的产物。在0.2mL的反应物中，将10mM的底物与His₆标记的欧文氏菌属氨基醇激酶在100mM Tris-HCl(pH7.8)、10mMMgCl₂、2mM KCl、0.1mM ATP中混合，并在37℃下反应1h。加入ADP试剂A(100μL)和ADP试剂B(200μL)，并将混合物在室温下孵育30min。以530nm的激发波长和590nm的发射波长测定荧光信号指示的活性。

实施例16

整个途径3的表达

载体pCLBudAB-ter-T5chnA的构建

用EcoRI消化载体pTrc99a::BudABC(如实施例9中所述)，并将该DNA用Klenow DNA聚合酶处理以产生平末端。随后，用SpeI消化该平末端化载体以产生含有budA和budB基因的2.5kb片段。用HindIII消化载体pCL1925-ter-T5chnA(如实施例9中所述)，并将该DNA用Klenow DNA聚合酶处理以产生平末端。随后用XbaI消化该平末端化载体以产生4.6kb的片段，然后将该片段连接至来自pTrc99a::BudABC的budAB片段。将所得的质粒(命名为pCLBudAB-ter-T5chnA)用于转化大肠杆菌Top10细胞，并利用引物pCL1925vecF(SEQ ID NO：62)和N84seqR3(SEQ ID NO：159)通过PCR筛选具有正确质粒结构的单克隆菌落。从产生预期大小为1.4kb的PCR产物的单克隆菌落中制备质粒。

载体pKK223.KA-AT-APT的构建

利用引物APTfor(SEQ ID NO：162；5′端含有RBS和SmaI位点)和APTrev(SEQ ID NO：163；3′端添加了SmaI位点)，通过PCR从载体pBAD.APT(如实施例12中所述)扩增APT基因。将具有1.7kb的预期大小的产物进行凝胶纯化并用SmaI消化以产生平末端。用PstI消化载体pKK223.KA-AT(如实施例14中所述)，并将DNA用KlenowDNA聚合酶处理以产生平末端。将所得的DNA片段与SmaI消化的PCR产物连接，并将连接产物用于转化大肠杆菌Top10细胞。利用引物OT872(SEQ ID NO：127)和APTrev(SEQ ID NO：163)，通过PCR筛选单个的氨苄青霉素抗性菌落。预计大小为4.1kbp的PCR产物的存在表明，编码APT的基因存在并且与编码KA和AT的基因相同的方向取向。使用引物APTseqRev(SEQ ID NO：160)和APTseqFor(SEQ ID NO：161)检验***物的序列。将该质粒命名为pKK223.KA-AT-APT。通过将5ml Top10/pKK223.KA-AT-APT的培养物在含有100μg/mL氨苄青霉素的LB培养基中于37℃振荡培养，从而检验全部三种基因是否正确表达。当OD₆₀₀达到约0.8时，通过加入IPTG至0.4mM来诱导质粒上的基因的表达。通过SDS PAGE和上述活性测定法来评估表达。

2-丁醇生产菌株的构建和2-丁醇和2-丁酮的产生

用pKK223.KA-AT-APT和pCLBudAB-ter-T5chnA两者转化大肠杆菌菌株MG1655，并筛选具有氨苄青霉素和大观霉素抗性的转化株，氨苄青霉素和大观霉素抗性指示质粒的存在。将细胞接种到盛有50或150ml TM3a/葡萄糖培养基(含有合适的抗生素)的摇瓶(总体积大约为175ml)中以分别表现中等氧和低氧条件。加入IPTG至0.4mM以诱导pKK223.KA-AT-APT的基因表达。作为阴性对照，将MG1655细胞在缺少抗生素的相同培养基中培养。以起始OD₆₀₀≤0.01接种摇瓶，在34℃下以300rpm振荡培养24h。盛有50mL培养基的摇瓶盖有通气盖；盛有150mL培养基的摇瓶带有不通气的盖以最大程度减少空气交换。包含2-丁醇合成途径的MG1655/pKK223.KA-AT-APT/pCLBudAB-ter-T5chnA菌株在低等和中等氧条件下产生了2-丁酮和2-丁醇两者，而阴性对照菌株未产生可检测水平的2-丁醇或2-丁酮。

实施例17

甘油脱水酶和丁二醇脱水酶活性的表征

甘油脱水酶(E.C.4.2.1.30)和二醇脱水酶(E.C.4.2.1.28)虽然在结构上相关，但本领域内通常基于多种差异(包括底物特异性)来区分。本实施例证明了甘油脱水酶将内消旋-2，3-丁二醇转化为2-丁酮。在US 6,514,733(Emptage等人)和WO 2003089621(将这两篇文献以引用的方式并入本文)中描述了重组大肠杆菌菌株KLP23/pSYCO12，其包含肺炎克雷伯菌基因，该基因编码甘油脱水酶的多个亚基(α：SEQID NO：145(编码区)和146(蛋白质)；β：SEQ ID NO：147(编码区)和148(蛋白质)；和γ：SEQ ID NO：149(编码区)和150(蛋白质))，并且其还包含肺炎克雷伯菌基因，该基因编码甘油脱水酶再激活酶的多个亚基(大亚基，SEQ ID NO：151(编码区)和152(蛋白质)；以及小亚基，SEQ ID NO：153(编码区)和154(蛋白质))。通过本领域技术人员已知的方法制备KLP23/pSYCO12无细胞粗提物。在37℃下80mM HEPES缓冲液(pH8.2)中于无光条件下进行酶测定法，该缓冲液具有12μM辅酶B₁₂和10mM内消旋-2，3-丁二醇。通过HPLC(使用Shodex SH-1011柱和具有折射率检测器的SH-G保护柱；0.01MH₂SO₄作为流动相，流速为0.5mL/min，柱温为50℃；2-丁酮保留时间＝40.2min)监测2-丁酮的生成。通过甘油脱水酶制备的2-丁酮的形成速率为0.4nmol/min/mg粗蛋白。

实施例18

通过产生并检验经实验证明的二醇/甘油脱水酶的分布型HMM对二醇/甘油脱水酶进行结构分析

二醇脱水酶和甘油脱水酶分布属于酶类型4.2.1.28和4.2.1.30。这两种类型的酶每种均为三个亚基的复合物：大亚基(也称为α亚基)、中等亚基(也称为β亚基)和小亚基(也称为γ亚基)。在一些甘油脱水酶中，发现大亚基和中等亚基是融合的。

通过序列鉴定家族成员

将产酸克雷伯菌丁二醇脱水酶用作原型酶以用于鉴定二醇和甘油脱水酶家族。将α亚基的氨基酸序列(GenBank No：BAA08099；SEQID NO：8)、β亚基的氨基酸序列(GenBank No：BAA08100；SEQ IDNO：10)和γ亚基的氨基酸序列(GenBank No：BAA08101；SEQ ID NO：12)每个均作为查询序列，对GenBank非冗余蛋白质数据库采用默认参数进行BLASTp搜索。提取具有相关匹配的序列相关性通过关于匹配蛋白质的E值分值、蛋白质定义、GenBank报告中包括的细节，以及关于主题的文献综述。对于大亚基，BLAST输出结果显示E值从e-20突然增加至E值为1.5。具有1.5或更大的E值的全部序列匹配均定义为不属于脱水酶。这些序列中的许多被标定为DNA引导的RNA聚合酶β亚基。有些匹配的E值约为e-20，其为部分序列。如果E值低于1.5，则将没有注释的序列包括在内。

利用产酸克雷伯菌丁二醇脱水酶α亚基作为查询序列，50种同系物被鉴定为该蛋白质家族的成员。该组包括不是全长蛋白质的一些序列。鉴定为二醇/甘油脱水酶α亚基家族的全长序列是原型SEQ ID NO：8和SEQ ID NO：93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259。SEQ ID NO：233、235、237、239、241、246、247包括α亚基和β亚基两者，这两个亚基在这些序列中融合在一起。

利用产酸克雷伯菌丁二醇脱水酶β-亚基作为查询序列，51种同系物被鉴定为该蛋白质家族的成员。该组成员包括不是全长蛋白质的一些序列。鉴定为二醇/甘油脱水酶β亚基家族的全长序列是原型SEQ IDNO：10和SEQ ID NO：95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167。

利用产酸克雷伯菌丁二醇脱水酶γ亚基作为查询序列，48种同系物被鉴定为该蛋白质家族的成员。该组成员包括不是全长蛋白质的一些序列。鉴定为二醇/甘油脱水酶γ亚基家族的全长序列是原型SEQ IDNO：12和SEQ ID NO：97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274。

鉴定具有经实验评估的功能的家族成员

对于通过上述分析鉴定的每条序列，在BRENDA、UniProt和NCBIEntrez数据库中搜索其生化功能的实验证据。BRENDA是一个人工维护的数据库，其含有从实验文献提取的关于酶动力学、物理和生化性质的详细信息，并且具有与相关数据库的链接(Cologne UniversityBioInformatics Center)。UniProt Knowledgebase由人工维护部分Swiss-Prot数据库和由机器注释补充TrEMBL数据库构成。人工维护的Swiss-Prot数据库(Swiss Institute of Bioinformatics)提供了高水平的蛋白质注释，包括结构域结构、翻译后修饰和序列变体。NCBI Entrez是位于NCBI(National Center for Biotechnology Information，Bethesda，MD)关于主要数据库(包括PubMed、Nucleotide和Protein Sequences、Protein Structures、Complete Genomes和Taxonomy)的集成的、基于文本的搜索和检索***。

通过对从这些数据库鉴定的信息和参考文献进行分析，鉴定了经实验验证具有二醇或甘油脱水酶功能的八种二醇/甘油脱水酶。这八种酶在表10中示出。

表10.

具有经实验验证的功能的二醇/甘油脱水酶

将来自具有实验确定的功能的二醇/甘油脱水酶的每种亚基的一组8条氨基酸序列(在表10中列出)，通过用采用默认参数的ClustalW进行多序列比对来比较。大亚基的同一性百分比范围为97.6％至58.4％。中等亚基的同一性百分比范围为89.5％至41.7％。小亚基的同一性百分比范围为83.3％至36.4％。因而，一些亚基序列之间的序列同一性程度比较低(例如36.4％、41.7％)，尽管已经知道这些亚基为通过实验数据已知能执行相同功能的酶的组分。低程度的序列同一性百分比使得利用这些用于结构/功能相关性的标准变得不切实际。

经实验验证的二醇/甘油脱水酶与其它二醇/甘油脱水酶的序列关系

为了进行这些分析，将大于>95％同一性的高度冗余的序列从大亚基、中等亚基或小亚基的序列集中移除，只保留所有经实验验证的功能序列。截短的或部分的蛋白质序列也被移除。利用采用默认参数的ClustalW对剩下的序列进行多序列比对。大亚基的同一性百分比的范围为97.6％(最高的百分比来自多条经实验验证的序列)至42.8％。中等亚基的同一性百分比的范围为91.9％至26.4％。小亚基的同一性百分比的范围为85.2％至20.5％。这些同一性百分比范围类似于经实验验证的序列的同一性百分比范围。

基于多序列比对，利用邻接算法(neighbor-joining algorithm)构建***树(如MEGA软件包3.1版中所实现的；Kumar等人，2004Briefings in Bioinformatics 5：150-163。)。***树在图2(大亚基)、图3(中等亚基)和图4(小亚基)中示出，其中对于每个图，映射的序列(mapped sequence)的身份在检索表中列出。从标记为经实验验证的功能序列的位置(二醇脱水酶和甘油脱水酶分别在黑色和浅灰色园圈中)可以看出，这些序列散步该***树的大部分。然而，每个***树确实包括具有没有经实验验证的成员的分支，但这些成员看起来属于二醇/甘油脱水酶家族。

基于八条亚基序列的序列集构建二醇/甘油-脱水酶家族的分布型隐马尔可夫模型(HMM)

一种替代的对酶的二醇/甘油脱水酶家族的亚基集的结构/功能表征是用HMMER软件包(分布型HMM所依据的理论在如下参考文献中描述：R.Durbin，S.Eddy，A.Krogh和G.Mitchison，Biological sequence analysis：probabilistic models of proteins and nucleic acids，Cambridge University Press，1998；Krogh等人，1994；J.Mol.Biol.235：1501-1531)，根据可得自HMMER(Janelia Farm Research Campus，Ashburn，VA)的用户指南进行。

将经功能鉴定的二醇/甘油脱水酶的大亚基、中等亚基和小亚基的每个8条序列(如表10中所示)的序列集用HMMER软件程序单独地分析。HMMER软件程序的输出为分布型隐马尔可夫模型(HMM)，其表征了输入序列。如用户指南中所述，分布型HMM是多序列比对的统计模型。这些分布型HMM捕集了关于每列比对的保守性程度，以及在各个位置上哪种氨基酸最可能出现的位置特异性信息。因而，HMM具有形式概率基础(formal probabilistic basis)。大量的蛋白质家族的分布型HMM可以在PFAM数据库中获得(Janelia Farm ResearchCampus，Ashburn，VA)。

每个分布型HMM如下构建：

步骤1.构建序列比对

用采用默认参数的Clustal W对经功能验证的二醇/甘油脱水酶的大亚基的八条序列(SEQ ID NO：8、99、105、135、138、141、146和164)进行比对。对中等亚基序列的序列集(SEQ ID Ns：10、101、107、136、139、142、148和165)和小亚基序列的序列集(SEQ ID NO：12、103、109、137、140、143、150和166)同样用采用默认参数的Clustal W进行比对。

步骤2.构建分布型HMM

采用默认参数，对每个比对序列集执行hmmbuild程序。hmmbuild读取多序列比对文件，构建新的分布型HMM，并将该分布型HMM保存至文件。利用该程序，从上述每个亚基序列集的多序列比对产生未校准的分布型HMM。

基于HMMER软件用户指南的如下信息给出了一些对hmmbuild程序构建分布型HMM的方式的描述。分布型HMM能模拟空位比对，如包括***和缺失，这使得该软件能描述完整的保守结构域(而不是仅描述没有空位的基序)。***和缺失用***(I)状态和缺失(D)状态来模拟。含有多于某一分数x的空位字符的所有列将被赋为***列。缺省时，x设定为0.5。每种匹配状态具有与之相关的I状态和D状态。HMMER将比对中相同的共有位置处的一组三种状态(M/D/I)称为“节点(node)”。这些状态与称为状态转移概率(state transition probability)的箭头互联。M和I状态是发射体(emitter)，而D状态是沉默的。对这些转移(transition)进行排列以使得在每个节点，或者使用了M状态(并对残基进行比对和打分)，或者使用了D状态(不进行残基比对，导致缺失-空位字符′-′)。***出现在节点之间，并且I状态具有自转移(self-transition)，允许一个或多个***残基出现在共有列之间。

匹配状态的残基的分值(即匹配状态发射分值)，或***状态的残基的分值(即***状态发射分值)与Log_2(p_x)/(null_x)成比例。其中，p_x是根据分布型HMM的、比对中特定位置处的氨基酸残基的概率，而null_x是根据Null模型的概率。Null模型是一种单一状态的概率模型，具有预先计算的20种氨基酸中每种的发射概率集，该概率源于氨基酸在SWISSPROT release 24中的分布。

状态转移分值也计算为胜算对数(log odds)参数并与Log_2(t_x)成比例。其中t_x是转移至发射状态或非发射状态的概率。

步骤3.校准分布型HMM

用hmmcalibrate读取每个分布型HMM，hmmcalibrate用该分布型HMM对大量合成的随机序列进行打分(所用的合成序列的默认数是5,000)，将极值分布(EVD)与这些分值的直方图拟合，并重新保存HMM文件，该文件现在包括了EVD参数。在用该分布型HMM搜索蛋白质序列数据库时，这些EVD参数(μ和λ)被用于计算二进制分值(bit score)的E值。hmmcalibrate将两个参数在标为“EVD”的行上写入HMM文件：这两个参数是极值分布(EVD)的μ(位置)和λ(尺度)参数，该极值分布最匹配对随机产生的序列进行计算得到的分值的直方图，其中该随机产生的序列具有大约与SWISS-PROT相同的长度和残基组成。对每个分布型HMM执行该校准。

大亚基、中等亚基和小亚基序列集的校准的分布型HMM在附录中给出，为α分布型HMM、β分布型HMM和γ分布型HMM Excel图表。每个分布型HMM在图表中给出，图表给出了每种氨基酸在氨基酸序列中各个位置出现的概率。对于每个位置，突出显示了最高的概率。表11显示了为具有经实验验证的功能的二醇/甘油脱水酶的大亚基而构建的分布型HMM的几行。

表11。

大亚基分布型HMM的一部分

氨基酸由单字母码表示。

每个位置的第一行报告了匹配发射分值：每个氨基酸处于该状态的概率(突出显示了最高的分值)。第二行报告了***发射分值，而第三行报告了状态转移分值：M→M、M→I、M→D；I→M、I→I；D→M、D→D；B→M；M→E。

表11显示，对于大亚基，甲硫氨酸具有4141的概率处于第一个位置，这是最高概率，并被突出显示。在第二个位置，赖氨酸具有最高的概率，概率为1954。在第三个位置，精氨酸具有最高概率，概率为3077。

步骤4.检验构建的分布型HMM的特异性和敏感性

利用hmmsearch来评价每个分布型HMM，hmmsearch从hmmfile读取分布型HMM并对序列文件搜索显著相似的序列匹配。搜索的序列文件是GenBank非冗余蛋白质数据库。数据库的大小(Z参数)设定为10亿。该大小设定值确保对当前数据库的显著E值将在可预见的未来保持显著性。E值截断值设定为10。

具有经实验验证的功能的二醇/甘油脱水酶的大亚基、中等亚基和小亚基的分布型HMM的专一性在于，仅二醇/甘油脱水酶亚基得以恢复，这通过匹配序列的注释表明，而敏感性在于即使二醇/甘油脱水酶亚基的部分序列也得以恢复。恢复序列的每条序列具有的E值为0.01或更小。

图2、图3和图4中的***树上的所有序列在分布型HMM匹配中均得以恢复。不含具有经实验验证的功能的序列的***树分支中所有序列都匹配。因而，通过与具有经实验验证的功能的8种二醇和甘油脱水酶的大亚基、中等亚基或小亚基的分布型HMM匹配，全部二醇和甘油脱水酶均与这8种酶关联。匹配所述分布型HMM的全长二醇和甘油脱水酶具有如下SEQ ID NO：

大(α)亚基：8、93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259。

融合的大亚基和中等亚基(大亚基和中等亚基部分分别匹配大亚基分布型HMM和中等亚基分布型HMM)：233、235、237、239、241、246和247。

中等(β)亚基：10、95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167。

小(γ)亚基：12、97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274。

这些分析显示，每种亚基的用具有经实验验证的功能的序列构建的分布型HMM，提供了与二醇/甘油脱水酶的功能关联的结构。所有上述序列与该分布型HMM的匹配继而又提供了这些序列的结构/功能关联。

Claims

1.一种重组微生物宿主细胞，包含至少一种编码催化底物至产物转化的多肽的DNA分子，所述底物至产物的转化选自由以下转化组成的组：

i)丙酮酸转化为α-乙酰乳酸；

ii)α-乙酰乳酸转化为乙偶姻；

iii)乙偶姻转化为2，3-丁二醇；

iv)2，3-丁二醇转化为2-丁酮；以及

v)2-丁酮转化为2-丁醇；

2.一种重组微生物宿主细胞，包含至少一种编码催化底物至产物转化的多肽的DNA分子，所述底物至产物的转化选自由以下转化组成的组：

i)丙酮酸转化为α-乙酰乳酸；

ii)α-乙酰乳酸转化为乙偶姻；

iii)乙偶姻转化为2，3-丁二醇；以及

iv)2，3-丁二醇转化为2-丁酮；

3.根据权利要求1或2所述的宿主细胞，其中催化底物丙酮酸至产物α-乙酰乳酸转化的多肽是乙酰乳酸合酶。

4.根据权利要求1或2所述的宿主细胞，其中所述催化底物α-乙酰乳酸至产物乙偶姻转化的多肽是乙酰乳酸脱羧酶。

5.根据权利要求1或2所述的宿主细胞，其中所述催化底物乙偶姻至产物2，3-丁二醇转化的多肽是丁二醇脱氢酶。

6.根据权利要求1或2所述的宿主细胞，其中所述催化底物2，3-丁二醇至产物2-丁酮转化的多肽是二醇脱水酶或甘油脱水酶。

7.根据权利要求1所述的宿主细胞，其中所述催化底物2-丁酮至产物2-丁醇转化的多肽是丁醇脱氢酶。

8.根据权利要求1或2所述的宿主细胞，其中所述细胞选自由以下细胞组成的组：细菌、蓝细菌、丝状真菌和酵母。

9.根据权利要求8所述的宿主细胞，其中所述细胞是选自由以下属组成的组的属的成员：梭菌属、发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌属、乳杆菌属、肠球菌属、片球菌属、产碱杆菌属、克雷伯菌属、类芽胞杆菌属、节杆菌属、棒状杆菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属和酵母属。

10.根据权利要求3所述的宿主细胞，其中基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述乙酰乳酸合酶具有与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：4，SEQ ID NO：77和SEQ ID NO：79。

11.根据权利要求4所述的宿主细胞，其中基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述乙酰乳酸脱羧酶具有与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ IDNO：2、SEQ ID NO：81和SEQ ID NO：83。

12.根据权利要求5所述的宿主细胞，其中基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述丁二醇脱氢酶具有与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：6、SEQ ID NO：85、SEQ ID NO：87和SEQ ID NO：89。

13.根据权利要求6所述的宿主细胞，其中所述二醇脱水酶或甘油脱水酶包含全长的大亚基、中等亚基和小亚基，当用分布型隐马尔可夫模型查询时，所述每种亚基给出的E-值参数是0.01或更小，其中所述分布型隐马尔可夫模型是用如下亚基产生：SEQ ID NO：8、99、105、135、138、141、146和164的大亚基；SEQ ID NO：10、101、107、136、139、142、148和165的中等亚基；和SEQ ID NO：12、103、109、137、140、143、150和166的小亚基；每次查询是用其中Z参数设定为10亿的hmmsearch算法进行。

14.根据权利要求6所述的宿主细胞，其中所述二醇脱水酶或所述甘油脱水酶由包括如下步骤的方法鉴定：

a)从对应所述二醇和甘油脱水酶的大亚基、中等亚基和小亚基的氨基酸序列的比对产生分布型隐马尔可夫模型；其中

i)所述大亚基包含选自由以下序列组成的组的氨基酸序列：SEQ ID NO：8、99、105、135、138、141、146和164；

ii)所述中等亚基包含选自由以下序列组成的组的氨基酸序列：SEQ ID NO：10、101、107、136、139、142、148和165；以及

iii)所述小亚基包含选自由以下序列组成的组的氨基酸序列：SEQ ID NO：12、103、109、137、140、143、150和166；

b)利用其中Z参数设定为10亿以及E值参数设定为0.01的hmmsearch算法，用(a)的分布型隐马尔可夫模型查询至少一个公开的含二醇和甘油脱水酶序列的蛋白质序列数据库，以鉴定二醇和甘油脱水酶氨基酸序列的第一数据集；以及

15.根据权利要求6所述的宿主细胞，其中所述二醇脱水酶或甘油脱水酶包含大亚基，基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述大亚基包含与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：8、93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259。

16.根据权利要求6所述的宿主细胞，其中所述二醇脱水酶或甘油脱水酶包含中等亚基，基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述中等亚基包含与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：10、95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167。

17.根据权利要求6所述的宿主细胞，其中所述二醇脱水酶或甘油脱水酶包含小亚基，基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述小亚基包含与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：12、97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274。

18.根据权利要求6所述的宿主细胞6，其中所述二醇脱水酶或甘油脱水酶包含融合的大亚基、中等亚基和小亚基，基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述融合的大亚基、中等亚基和小亚基包含与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：233、235、237、239、241、246和247。

19.根据权利要求6所述的宿主细胞，其中所述二醇脱水酶或甘油脱水酶包含融合的大亚基、中等亚基和小亚基，并且与包含编码大亚基、中等亚基和小亚基的全部三条氨基酸序列的氨基酸序列具有至少95％的同一性，其中所述三条氨基酸序列选自由如下序列组成的组：

a)SEQ ID NO：8，SEQ ID NO：10和SEQ ID NO：12；

b)SEQ ID NO：93，SEQ ID NO：95和SEQ ID NO：97；

c)SEQ ID NO：99，SEQ ID NO：101和SEQ ID NO：103；

d)SEQ ID NO：105，SEQ ID NO：107和SEQ ID NO：109；

e)SEQ ID NO：135，SEQ ID NO：136和SEQ ID NO：137；

f)SEQ ID NO：138，SEQ ID NO：139和SEQ ID NO：140；

g)SEQ ID NO：146，SEQ ID NO：148和SEQ ID NO：150；

h)SEQ ID NO：141，SEQ ID NO：142和SEQ ID NO：143；和

i)SEQ ID NO：164，SEQ ID NO：165和SEQ ID NO：166；

其中所述序列同一性是基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1，以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法。

20.根据权利要求8所述的宿主细胞，其中基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述丁醇脱氢酶具有与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：14、SEQ ID NO：72、SEQ ID NO：75和SEQ ID NO：91。

21.一种生产2-丁醇的方法，包括：

1)提供重组微生物宿主细胞，其包含至少一种编码催化底物至产物转化的多肽的DNA分子，所述底物至产物的转化选自由以下转化组成的组：

i)丙酮酸转化为α-乙酰乳酸；

ii)α-乙酰乳酸转化为乙偶姻；

iii)乙偶姻转化为2，3-丁二醇；

iv)2，3-丁二醇转化为2-丁酮；以及

v)2-丁酮转化为2-丁醇；

2)使(1)中的宿主细胞在能生产2-丁醇的条件下与可发酵碳底物在发酵培养基中接触。

22.一种生产2-丁酮的方法，包括：

i)丙酮酸转化为α-乙酰乳酸；

ii)α-乙酰乳酸转化为乙偶姻；

iii)乙偶姻转化为2，3-丁二醇；以及

iv)2，3-丁二醇转化为2-丁酮；

2)使(1)中的宿主细胞在能生产2-丁酮的条件下与可发酵碳底物在发酵培养基中接触。

23.根据权利要求21或22所述的方法，其中所述可发酵碳底物选自由单糖、寡糖和多糖组成的组。

24.根据权利要求21或22所述的方法，其中催化底物丙酮酸至产物α-乙酰乳酸转化的所述多肽是乙酰乳酸合酶。

25.根据权利要求21或22所述的方法，其中催化底物α-乙酰乳酸至产物乙偶姻转化的所述多肽是乙酰乳酸脱羧酶。

26.根据权利要求21或22所述的方法，其中催化底物乙偶姻至产物2，3-丁二醇转化的所述多肽是丁二醇脱氢酶。

27.根据权利要求21或22所述的方法，其中催化底物2，3-丁二醇至产物2-丁酮转化的所述多肽是二醇脱水酶或甘油脱水酶。

28.根据权利要求21所述的方法，其中催化底物2-丁酮至产物2-丁醇转化的所述多肽是丁醇脱氢酶。

29.根据权利要求21或22所述的方法，其中所述细胞选自以下细胞组成的组：细菌、蓝细菌、丝状真菌和酵母。

30.根据权利要求29所述的方法，其中所述细胞是选自由以下属组成的组的属的成员：梭菌属、发酵单胞菌属、埃希氏菌属、沙门氏菌、红球菌属、假单胞菌属、芽孢杆菌属、乳杆菌属、肠球菌属、片球菌属、产碱杆菌属、克雷伯菌属、类芽胞杆菌属、节杆菌属、棒状杆菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属和酵母属。

31.根据权利要求24所述的方法，其中基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1，以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述乙酰乳酸合酶具有与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：4、SEQ ID NO：77和SEQ ID NO：79。

32.根据权利要求25所述的方法，其中基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述乙酰乳酸脱羧酶具有与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：2、SEQ ID NO：81和SEQ ID NO：83。

33.根据权利要求26所述的方法，其中基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述丁二醇脱氢酶具有与选自由以下序列组成的组的序列具有至少95％的同一性的氨基酸序列：SEQ ID NO：6、SEQID NO：85、SEQ ID NO：87和SEQ ID NO：89。

34.根据权利要求27所述的方法，其中所述二醇脱水酶或甘油脱水酶包含全长的大亚基、中等亚基和小亚基，当用分布型隐马尔可夫模型查询时，所述每种亚基给出的E-值参数是0.01或更小，其中所述分布型隐马尔可夫模型是用如下亚基产生：SEQ ID NO：8、99、105、135、138、141、146和164的大亚基；SEQ ID NO：10、101、107、136、139、142、148和165的中等亚基；以及SEQ ID NO：12、103、109、137、140、143、150和166的小亚基；每次查询是用其中Z参数设定为10亿的hmmsearch算法进行。

35.根据权利要求27所述的方法，其中所述二醇脱水酶或所述甘油脱水酶通过包括以下步骤的方法鉴定：

a)从对应所述二醇和甘油脱水酶的大亚基、中等亚基和小亚基的氨基酸序列的比对产生分布型隐马尔可夫模型；

36.根据权利要求27所述的方法，其中所述二醇脱水酶或甘油脱水酶包含大亚基，基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述大亚基包含与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：8、93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259。

37.根据权利要求27所述的方法，其中所述二醇脱水酶或甘油脱水酶包含中等亚基，基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述中等亚基包含与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：10、95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167。

38.根据权利要求27所述的方法，其中所述二醇脱水酶或甘油脱水酶包含小亚基，基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述小亚基包含与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：12、97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274。

39.根据权利要求27所述的方法，其中所述二醇脱水酶或甘油脱水酶包含融合的大亚基、中等亚基和小亚基，基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述融合的大亚基、中等亚基和小亚基包含与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：233、235、237、239、241、246和247。

40.根据权利要求27所述的方法，其中所述二醇脱水酶或甘油脱水酶包含融合的大亚基、中等亚基和小亚基，并且与包含编码大亚基、中等亚基和小亚基的全部三条氨基酸序列的氨基酸序列具有至少95％的同一性，其中所述三条氨基酸序列选自由如下序列组成的组：

a)SEQ ID NO：8，SEQ ID NO：10和SEQ ID NO：12；

b)SEQ ID NO：93，SEQ ID NO：95和SEQ ID NO：97；

c)SEQ ID NO：99，SEQ ID NO：101和SEQ ID NO：103；

d)SEQ ID NO：105，SEQ ID NO：107和SEQ ID NO：109；

e)SEQ ID NO：135，SEQ ID NO：136和SEQ ID NO：137；

f)SEQ ID NO：138，SEQ ID NO：139和SEQ ID NO：140；

g)SEQ ID NO：146，SEQ ID NO：148和SEQ ID NO：150；

h)SEQ ID NO：141，SEQ ID NO：142和SEQ ID NO：143；和

i)SEQ ID NO：164，SEQ ID NO：165和SEQ ID NO：166；

41.根据权利要求28所述的方法，其中基于使用默认参数为空位罚分＝10、空位长度罚分＝0.1、以及蛋白质权重矩阵为Gonnet 250系列的Clustal W比对方法，所述丁醇脱氢酶具有与选自由以下序列组成的组的氨基酸序列有至少95％的同一性的氨基酸序列：SEQ ID NO：14、SEQ ID NO：72、SEQ ID NO：75和SEQ ID NO：91。

42.一种含2-丁醇的发酵产物培养基，所述发酵产物培养基是通过根据权利要求21所述的方法生产的。

43.一种含有2-丁酮的发酵产物培养基，所述发酵产物培养基是通过权利要求22所述的方法生产的。