CN102482648B - 酮还原酶介导的产生α氯代醇的立体选择性途径 - Google Patents

酮还原酶介导的产生α氯代醇的立体选择性途径 Download PDF

Info

Publication number
CN102482648B
CN102482648B CN201080027481.5A CN201080027481A CN102482648B CN 102482648 B CN102482648 B CN 102482648B CN 201080027481 A CN201080027481 A CN 201080027481A CN 102482648 B CN102482648 B CN 102482648B
Authority
CN
China
Prior art keywords
polypeptide
seq
residue
amino acid
compound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080027481.5A
Other languages
English (en)
Other versions
CN102482648A (zh
Inventor
荣贵·彭
迈克尔·沃格尔
史蒂文·詹姆斯·科利尔
韦丝娜·米切尔
亚加迪什·马维纳哈利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of CN102482648A publication Critical patent/CN102482648A/zh
Application granted granted Critical
Publication of CN102482648B publication Critical patent/CN102482648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/02Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • C12P7/28Acetone-containing products
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01184Carbonyl reductase (NADPH) (1.1.1.184)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开内容涉及工程化的酮还原酶多肽和其用于从α-氯代酮制备α-氯代醇的用途。还提供了编码工程化的酮还原酶多肽的多核苷酸和能够表达工程化的酮还原酶多肽的宿主细胞。

Description

酮还原酶介导的产生α氯代醇的立体选择性途径
1.技术领域
本公开内容涉及工程化的多肽和其用于从α-氯代酮制备α-氯代醇的用途。
2.对序列表、表格或计算机程序的引用
根据37C.F.R.1.821以计算机可读形式(CRF)通过EFS-Web使用文件名CX2-012WO1_ST25.txt同时电子提交的序列表通过引用被并入本文。电子版的序列表创建于2010年6月22日,其文件大小为143千字节。
3.背景
立体选择性还原α-卤代-酮为其相应的手性卤代-醇是见于许多有用的合成途径中的转化。例如,形成抗病毒化合物阿扎那韦(atazanavir)的合成途径包括还原来源自L-苯丙氨酸的Boc-氯-酮为相应的手性Boc-(S)-氯-醇。进行这一转化的标准化学技术产生需要进一步拆分的期望中间产物的非对映体混合物,增加了阿扎那韦生产的成本和降低效率。因此,能够更有效地立体选择性还原α-卤代-酮为手性卤代-醇的方法和组合物将是期望的。
已经发现属于酮还原酶(KRED)或羰基还原酶类(EC1.1.1.184)的某些酶可用于立体选择性转化前-立体异构的醛或酮底物为相应的手性醇产物。KRED通常将酮或醛底物转化为相应的醇产物,但是还可以催化逆反应,即醇底物被氧化为相应的酮/醛产物。酶例如KRED对酮和醛的还原以及醇的氧化需要辅因子,其中最常见的为还原型烟酰胺腺嘌呤二核苷酸(NADH)或还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH)以及用于氧化反应的烟酰胺腺嘌呤二核苷酸(NAD)或烟酰胺腺嘌呤二核苷酸磷酸(NADP)。NADH和NADPH充当电子供体,而NAD和NADP充当电子受体。
KRED正日益被用于立体选择性转化酮和醛为用于关键药物化合物生产的手性醇化合物。使用KRED来产生有用的化合物的实例包括4-氯乙酰基乙酸酯的不对称还原(Zhou,J.Am.Chem.Soc.1983105:5925-5926;Santaniello,J.Chem.Res.(S)1984:132-133;美国专利第5,559,030号;美国专利第5,700,670号和美国专利第5,891,685号)、二氧代羧酸的还原(例如美国专利第6,399,339号)、(S)氯-5-羟基-3-氧代已酸叔丁基酯的还原(例如美国专利第6,645,746号和WO01/40450)、基于吡咯并三嗪的化合物的还原(例如美国申请第2006/0286646号)、取代苯乙酮的还原(例如美国专利第6,800,477号)和酮噻吩烷(ketothiolanes)的还原(WO2005/054491)。在另一个方法中,如本文证明的,酮还原可在醇诸如异丙醇的存在下进行,以提供逆反应(醇脱氢)的底物。以这种方式,酮还原反应中消耗的NADH/NADPH通过逆向、氧化反应再生。
美国专利第7,083,973号公开了一种通过利用红球菌属(Rhodococcus)和短杆菌属(Brevibacterium)的某些物种还原含相应酮基团的化合物,制备(3S,2R)-1-卤代-2-羟基-3-(保护的)氨基-4-取代的丁烷的立体选择性方法。‘973专利公开,仅红球菌属和短杆菌属的选定物种催化该还原以形成高量和对映体产率的期望的(3S,2R)-1-卤代-2-羟基-3-(保护的)氨基-4-取代的丁烷。‘973专利公开,将来自150g红串红球菌(Rhodococcus erythropolis)ATCC4277细胞的10mL细胞提取物加载于10mg(1S)-[N-(1-苄基-2-氧-3-氯)丙基]氨基甲酸叔丁基酯底物、葡萄糖脱氢酶(35单位)、0.7mM NAD+和200mg葡萄糖(反应在pH6.0、150RPM搅动和30℃进行)以95%产率和>98%非对映体纯度产生(1S,2R)-[N-(1-苄基-2-羟基-3-氯)丙基]氨基甲酸叔丁基酯产物。
因此,能够以高产率和高的非对映体纯度立体选择性转化α-卤代-酮为卤代-醇的分离的KRED多肽将是期望的。同样,利用KRED多肽进行大规模手性卤代-醇的制备的改进方法将是期望的。
4.概述
本公开内容提供能够立体选择性地转化α-卤代-酮为手性卤代-醇的酮还原酶多肽,和在合成方法中利用这些多肽来制备化学化合物的方法,所述化学化合物诸如生产活性药物成分诸如抗逆转录病毒药物阿扎那韦中的中间产物。
在某些实施方案中,本公开内容提供能够转化式(I)化合物N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(其中R1是保护基)为相应的立体异构醇式(II)产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇的酮还原酶多肽,如以下方案1所示。
方案1
在具体实施方案中,本公开内容提供能够转化氯代酮化合物(1)((S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯)为相应的醇化合物(2)(叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯)的酮还原酶多肽,如以下方案2所示:
方案2
在某些实施方案中,本公开内容提供能够在24小时内以至少70%的转化率转化包含初始浓度为至少10g/L化合物(1)的反应混合物为化合物(2)的酮还原酶多肽。在某些实施方案中,能够进行这一转化的多肽的浓度是5g/L、2g/L、1g/L、或更少。在某些实施方案中,所述多肽能够在24小时或甚至更少时间内达到至少80%、85%、90%、95%、98%、99%、或更高的转化率。在某些实施方案中,所述多肽能够转化化合物(1)为大于约95%、大于约97%或大于约99%非对映体过量的化合物(2)。在某些实施方案中,所述多肽能够对包含初始浓度为至少20g/L、40g/L、60g/L、80g/L、100g/L、150g/L、200g/L或甚至更多的化合物(1)的反应混合物达到上述转化率。
在某些实施方案中,本公开内容提供转化式(I)化合物为式(III)化合物的方法(参见方案3),其中R1如上所述,所述方法包括利用本公开内容的酮还原酶转化式(I)化合物为式(II)化合物,然后将式(II)化合物与碱接触以提供式(III)化合物。
方案3
在某些实施方案中,该方法还包括将包含式(II)化合物的反应混合物萃取到有机溶剂萃取物中,将所述萃取物与碱接触。在某些实施方案中,该方法还包括用结晶溶剂交换所述有机溶剂萃取物,并结晶式(III)化合物。在某些实施方案中,进行将式(II)化合物与碱接触的所述步骤而不首先纯化和/或分离式(II)化合物。
因此,在具体实施方案中,本公开内容提供转化化合物(1)为化合物(3)(叔丁基(S)-1-((R)-环氧乙烷-2-基)-2-苯乙基氨基甲酸酯)的方法,包括利用本公开内容的酮还原酶转化化合物(1)为化合物(2),然后将化合物(2)与碱接触以提供化合物(3)(参见方案4)。
方案4
在某些实施方案中,该方法还包括将包含化合物(2)的反应混合物萃取到有机溶剂萃取物中,将所述萃取物与碱接触。在某些实施方案中,该方法还包括用结晶溶剂交换所述有机溶剂萃取物,并结晶化合物(3)。在某些实施方案中,进行将化合物(2)与碱接触的所述步骤而不首先纯化和/或分离化合物(2)。
在一些实施方案中,还原或转化底物N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(如化合物(1))为其相应的立体异构醇产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(如化合物(2))的方法,包括在适于还原或转化底物为产物的条件下将所述底物与至少一种本文公开的酮还原酶多肽接触或培养。
在上述方法的一些实施方案中,底物被还原为大于约95%、大于约97%或大于约99%非对映体过量的产物,其中酮还原酶多肽包括对应于SEQ IDNO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的序列。
在上述方法的某些实施方案中,当以大于约100g/L底物和少于约5g/L多肽进行时,至少约95%的底物在少于约24小时内被转化为产物。在某些实施方案中,能够进行该方法的多肽包括对应于SEQ ID NO:6、50、52和56的氨基酸序列。在上述方法的一些实施方案中,当以大于约150g/L底物和少于约1g/L多肽进行时,至少约95%的底物在少于约30小时内被转化为产物,其中多肽包括对应于SEQ ID NO:6、50、52和56的氨基酸序列。
一方面,本文所述的酮还原酶多肽具有与野生型酮还原酶相比或与工程化的酮还原酶相比具有一种或多种氨基酸差异的氨基酸序列。一种或多种氨基酸差异导致该酶对指定底物至少一种改进的特性。通常,本文所述的酮还原酶多肽是与从Novosphingobium aromaticivorans获得的天然存在的野生型酮还原酶(“N.aromaticivorans”;SEQ ID NO:2)相比具有一种或多种改进的特性的工程化的酮还原酶多肽。工程化的酮还原酶多肽的酶特性的改进包括以下的增加:酶活性、立体选择性、立体特异性、热稳定性、溶剂稳定性、对底物水平升高的耐受和对产物水平升高的耐受。
在一些实施方案中,本发明的酮还原酶多肽与SEQ ID NO:2相比在酶促活性的比率(rate)方面是改进的,即,还原N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)(如化合物(1),其中保护基是BOC部分)为N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(“产物”)(如,化合物(2))的转化率(conversion rate)。在一些实施方案中,在相当的检验条件下,工程化的酮还原酶多肽能够以SEQ ID NO:2的酶表现的速率的至少1.1倍、1.2倍、1.3倍、1.5倍、2倍、3倍或大于3倍的转化率转化底物为产物。
在一些实施方案中,这种酮还原酶多肽还能够转化N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)(如,化合物(1),其中保护基是BOC部分)为非对映体过量百分比至少约95%的N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(“产物”)(如化合物(2))。在一些实施方案中,这种酮还原酶多肽还能够转化底物为非对映体过量百分比至少约97%的产物。在一些实施方案中,这种酮还原酶多肽还能够转化底物为非对映体过量百分比至少约99%的产物。具有这种特性的示例性的多肽包括但不限于,包含对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽能够转化N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)(如化合物(1)),其中保护基是BOC部分)为非对映体过量百分比至少约99%的N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(“产物”)(如化合物(2)),转化率比SEQ ID NO:2多肽改进至少约1.2倍或更大。具有这种特性的示例性的多肽包括但不限于,包含对应于SEQID NO:4、6、14、16、18、22、24、26、28、30、32、34、36、38、40、50、52、54和56的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽能够转化N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)(如,化合物(1),其中保护基是BOC部分)为非对映体过量百分比至少约99%的N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(“产物”)(如化合物(2)),转化率比SEQ ID NO:2多肽改进至少约1.5倍或更大。具有这种特性的示例性的多肽包括但不限于,包含对应于SEQID NO:6、18、22、30、38、40、50、52、54和56的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽能够转化N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)(如化合物(1),其中保护基是BOC部分)为非对映体过量百分比至少约99%的N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(“产物”)(如化合物(2)),转化率比SEQ ID NO:2多肽改进大于3倍。具有这种特性的示例性的多肽包括但不限于,包含对应于SEQ ID NO:6、50、52和56的氨基酸序列的多肽。
在一些实施方案中,当以大于约100g/L底物和少于约5g/L多肽进行时,酮还原酶多肽能够在少于约24小时内转化至少约95%的底物为产物。具有这一能力的示例性的多肽包括但不限于,包含对应于SEQ ID NO:6、50、52和56的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽是高度立体选择性的,其中多肽可还原底物为大于约99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%非对映体过量的产物。具有高立体选择性的示例性的酮还原酶多肽包括但不限于,包含对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列的多肽。
在一些实施方案中,为了辅因子再生,酮还原酶多肽具有对仲醇的活性增加的改进特性。在一些实施方案中,相对于参考多肽SEQ ID NO:2,酮还原酶多肽以至少2倍、2.5倍、5倍、10倍、15倍或甚至更大的活性氧化异丙醇(IPA)为丙酮。表现对IPA的活性增加的改进特性的示例性的酮还原酶多肽包括但不限于,包括对应于SEQ ID NO:6、56、60、62、64、66、68、70、72、74、76、78和80的氨基酸序列的多肽。
在某些实施方案中,本公开内容的酮还原酶多肽与参考序列SEQ IDNO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同,并在对应于SEQ ID NO:2的所指位置的位置具有至少一种以下氨基酸差异:位置2的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸;位置28的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸;位置34的氨基酸是选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸;位置47的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸;位置50的氨基酸是选自赖氨酸和精氨酸的碱性氨基酸;位置81的氨基酸是选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸;位置90的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸;位置91的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸,或位置91的氨基酸是选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸,或位置91的氨基酸是选自赖氨酸和精氨酸的碱性氨基酸;位置94的氨基酸是碱性氨基酸精氨酸;位置112的氨基酸是选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸;位置117的氨基酸是选自天冬氨酸和谷氨酸的酸性氨基酸;位置143的氨基酸是选自赖氨酸和精氨酸的碱性氨基酸;位置144的氨基酸是半胱氨酸,或位置144的氨基酸是选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸;位置145的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸和甲硫氨酸的非极性氨基酸或选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸的脂肪族氨基酸;位置148的氨基酸是选自脯氨酸和组氨酸的受限制的氨基酸;位置150的氨基酸是选自亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸,或位置150的氨基酸是选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸,或位置150的氨基酸是选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸;位置152的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸;位置153的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸,或选自组氨酸和脯氨酸的受限制的氨基酸;位置158的氨基酸是选自天冬酰胺、谷氨酰胺和丝氨酸的极性氨基酸;位置190的氨基酸是选自丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸,或位置190的氨基酸是选自天冬酰胺、谷氨酰胺和丝氨酸的极性氨基酸,或位置190的氨基酸是脯氨酸;位置198的氨基酸是选自天冬酰胺、谷氨酰胺和苏氨酸的极性氨基酸;位置199的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸,或选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸;位置200的氨基酸是选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸和甘氨酸的非极性氨基酸;位置204的氨基酸是选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸;位置217的氨基酸是选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸;位置225的氨基酸是选自缬氨酸、亮氨酸、甘氨酸和甲硫氨酸的非极性氨基酸;位置231的氨基酸是选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸;位置232的氨基酸是选自亮氨酸、异亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的非极性氨基酸;位置233的氨基酸是选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸;位置244的氨基酸是选自丙氨酸、亮氨酸、异亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的非极性氨基酸;位置260的氨基酸是选自酪氨酸和色氨酸的芳香族氨基酸;和位置261的氨基酸是选自天冬酰胺、谷氨酰胺和苏氨酸的极性氨基酸。
在某些实施方案中,本公开内容的酮还原酶多肽与参考序列SEQ IDNO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同,与SEQ ID NO:2相比具有选自以下组成的组的至少一种氨基酸取代:P2L;V28A;A34S;A47V;E50K;D81N;S90V;I91L;I91W;I91R;I91K;K94R;D112Y;G117D;S143R;V144C;V144T;G145A;G145V;R148H;A150G;A150I;A150S;A150W;F152L;N153G;N153V;N153H;T158S;G190A;G190P;G190Q;G190V;S198N;I199G;I199L;I199M;I199N;M200I;V204F;A217T;I225V;P231F;A232V;E233Q;D244G;F260Y;S261N;和其混合物。
在一些实施方案中,本公开内容的改进的酮还原酶多肽是基于SEQ IDNO:2的序列,并包括与参考序列SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,还包括选自以下组成的组的至少一种氨基酸取代:位置2的脯氨酸残基被亮氨酸代替;位置28的缬氨酸残基被丙氨酸代替;位置34的丙氨酸残基被丝氨酸代替;位置47的丙氨酸残基被缬氨酸代替;位置50的谷氨酸残基被赖氨酸代替;位置81的天冬氨酸残基被天冬酰胺代替;位置90的丝氨酸残基被缬氨酸代替;位置91的异亮氨酸残基被选自亮氨酸、色氨酸、精氨酸和赖氨酸的氨基酸代替;位置94的赖氨酸残基被精氨酸代替;位置112的天冬氨酸残基被酪氨酸代替;位置117的甘氨酸残基被天冬氨酸代替;位置143的丝氨酸残基被精氨酸代替;位置144的缬氨酸残基被选自半胱氨酸和苏氨酸的氨基酸代替;位置145的甘氨酸残基被选自丙氨酸和缬氨酸的氨基酸代替;位置148的精氨酸残基被组氨酸代替;位置150的丙氨酸残基被选自甘氨酸、异亮氨酸、丝氨酸和色氨酸的氨基酸代替;位置152的苯丙氨酸残基被亮氨酸代替;位置153的天冬酰胺残基被选自甘氨酸、缬氨酸和组氨酸的氨基酸代替;位置158的苏氨酸残基被丝氨酸代替;位置190的甘氨酸残基被选自丙氨酸、脯氨酸、谷氨酰胺和缬氨酸的氨基酸代替;位置198的丝氨酸残基被天冬酰胺代替;位置199的异亮氨酸残基被选自甘氨酸、甲硫氨酸、亮氨酸和天冬酰胺的氨基酸代替;位置200的甲硫氨酸残基被异亮氨酸代替;位置204的缬氨酸残基被苯丙氨酸代替;位置217的丙氨酸残基被苏氨酸代替;位置225的异亮氨酸残基被缬氨酸代替;位置231的脯氨酸残基被苯丙氨酸代替;位置232的丙氨酸残基被缬氨酸代替;位置233的谷氨酸残基被谷氨酰胺代替;位置244的天冬氨酸残基被甘氨酸代替;位置260的苯丙氨酸残基被酪氨酸代替;和位置261的丝氨酸残基被天冬酰胺代替。
在一些实施方案中,除了以上以外,酮还原酶多肽可具有与参考氨基酸序列相比或与SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78或80的任何一种相比的一种或多种修饰(即,残基差异)。这些修饰可以是氨基酸***、缺失、取代、或这种改变的任何组合。在一些实施方案中,氨基酸序列差异可包括非保守、保守、以及非保守和保守氨基酸取代的组合。在一些实施方案中,这些酮还原酶多肽可任选地在其他氨基酸残基具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,改进的酮还原酶包括与对应于SEQ ID NO:2的氨基酸序列至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,其中改进的酮还原酶多肽氨基酸序列包括表2或3中展示的具体氨基酸取代组合的任何一组。在一些实施方案中,这些酮还原酶多肽可具有在其他氨基酸残基的突变。
另一方面,本公开内容提供编码本文所述的酮还原酶多肽的多核苷酸,和在高度严格杂交条件下与这种多核苷酸杂交的多核苷酸。多核苷酸可包括可用于表达所编码的工程化的酮还原酶的启动子和其他调节元件,并可采用对于具体的期望表达***优化的密码子。
在一些实施方案中,本公开内容提供编码与SEQ ID NO:2的氨基酸序列相比具有至少以下氨基酸序列,并且还包含选自以下组成的组的至少一种氨基酸取代的酮还原酶多肽的多核苷酸:位置2的脯氨酸残基被亮氨酸代替;位置28的缬氨酸残基被丙氨酸代替;位置34的丙氨酸残基被丝氨酸代替;位置47的丙氨酸残基被缬氨酸代替;位置50的谷氨酸残基被赖氨酸代替;位置81的天冬氨酸残基被天冬酰胺代替;位置90的丝氨酸残基被缬氨酸代替;位置91的异亮氨酸残基被选自亮氨酸、色氨酸、精氨酸和赖氨酸的氨基酸代替;位置94的赖氨酸残基被精氨酸代替;位置112的天冬氨酸残基被酪氨酸代替;位置117的甘氨酸残基被天冬氨酸代替;位置143的丝氨酸残基被精氨酸代替;位置144的缬氨酸残基被选自半胱氨酸和苏氨酸的氨基酸代替;位置145的甘氨酸残基被选自丙氨酸和缬氨酸的氨基酸代替;位置148的精氨酸残基被组氨酸代替;位置150的丙氨酸残基被选自甘氨酸、异亮氨酸、丝氨酸和色氨酸的氨基酸代替;位置152的苯丙氨酸残基被亮氨酸代替;位置153的天冬酰胺残基被选自甘氨酸、缬氨酸和组氨酸的氨基酸代替;位置158的苏氨酸残基被丝氨酸代替;位置190的甘氨酸残基被选自丙氨酸、脯氨酸、谷氨酰胺和缬氨酸的氨基酸代替;位置198的丝氨酸残基被天冬酰胺代替;位置199的异亮氨酸残基被选自甘氨酸、甲硫氨酸、亮氨酸和天冬酰胺的氨基酸代替;位置200的甲硫氨酸残基被异亮氨酸代替;位置204的缬氨酸残基被苯丙氨酸代替;位置217的丙氨酸残基被苏氨酸代替;位置225的异亮氨酸残基被缬氨酸代替;位置231的脯氨酸残基被苯丙氨酸代替;位置232的丙氨酸残基被缬氨酸代替;位置233的谷氨酸残基被谷氨酰胺代替;位置244的天冬氨酸残基被甘氨酸代替;位置260的苯丙氨酸残基被酪氨酸代替;和位置261的丝氨酸残基被天冬酰胺代替。示例性的多核苷酸包括但不限于SEQ IDNO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77和79的多核苷酸序列。
在一些实施方案中,本公开内容提供包括编码本文所述的酮还原酶多肽的多核苷酸和/或含这些多核苷酸的表达载体的宿主细胞。宿主细胞可以是N.aromaticivorans,或可以是不同生物,如大肠杆菌(E.coli)。宿主细胞可用于表达和分离本文所述的工程化的酮还原酶,或可选地,它们可直接用于转化底物为立体异构产物。因此,在一些实施方案中,本文公开的工程化的酮还原酶多肽可通过标准方法制备,包括培养包括含编码多肽的多核苷酸的表达载体的宿主细胞,从宿主细胞分离多肽。
无论以完整细胞、细胞提取物还是纯化的酮还原酶进行该方法,可使用单独的酮还原酶,或可选地,可使用两种或多种酮还原酶的混合物。
5.详述
除了在工作实施例中,或另外指明以外,说明书和权利要求书中使用的表示成分的量、反应条件等等的所有数字应理解为在所有情形中被术语“约”修饰。
在本公开内容中,除非另外具体指明,否则单数形式的使用包括多数形式(反之亦然)。而且,除非另外指明,否则“或”的使用表示“和/或”。类似地,“comprise(包括)”、“comprises(包括)”、“comprising(包括)”、“include(包括)”、“includes(包括)”和“including(包括)”是可互换的,不意为限制。
还应理解的是,当不同实施方案的描述使用术语“comprising(包括)”时,本领域技术人员将理解,在一些具体情形中,一种实施方案可替代地利用措辞“基本由…组成(consisting essentially of)”或“由…组成(consistingof)”描述。
应理解的是,以上一般性描述和以下的详述仅是示例性和说明性的,不限制本公开内容。
本文使用的标题仅是为了结构的目的,不解释为限制所描述的主题。
本公开内容涉及生物催化方法,其中α-氯代酮与酮还原酶接触,从而被转化为相应的α-氯代醇。因此,本公开内容提供能够转化N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)(如化合物(1),其中保护基是BOC部分)为相应的立体异构醇产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(“产物”)(如化合物(2))的酮还原酶。本公开内容还包括转化醇产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(如化合物(2))为相应的立体异构环氧化物N-保护的(S)-1-((R)-环氧乙烷-2-基)-2-苯基乙基氨基甲酸酯)如化合物(3)(叔丁基(S)-1-((R)-环氧乙烷-2-基)-2-苯基乙基氨基甲酸酯;其中保护基是BOC部分)的方法。
5.1.定义
如本文所用,下列术语旨在具有下列意义:
术语“保护基”是指当连接于分子中的反应性官能团时,掩蔽、减少或阻止该官能团的反应性的原子的基团。通常,保护基可在合成过程期间如期望地选择性去除。
“氮保护基”(或“N-保护基”)是指通常用于封闭或保护化合物上的氮官能性而使其他官能团能够反应的取代基。这种氮保护基的实例包括甲酰基、三苯甲基、甲氧基三苯甲基、甲苯磺酰基、邻苯二甲酰亚氨基、乙酰基、三氯乙酰基、氯乙酰基、溴乙酰基、碘乙酰基、苄氧羰基(Cbz)、9-芴基甲氧羰基(FMOC)、2-三甲硅烷基乙氧羰基(Teoc)、1-甲基-1-(4-联苯基)乙氧羰基(Bpoc)、叔丁氧羰基(BOC)、烯丙氧基羰基(Alloc)、三卤代乙酰基、苄基、苯甲酰基和硝基苯基乙酰基等等。可用于本公开内容的实施方案的保护基的进一步实例可见于P.G.M.Wuts和T.W.Greene,“Greene’s Protective Groups in Organic Synthesis–Fourth Edition(Greene有机合成中的保护基-第四版),”John Wiley and Sons,New York,N.Y.,2007,第7章(“Greene”)。
“立体异构体”、“立体异构形式”和类似表述在本文可互换使用,是指单独分子差异仅在于其原子在空间中的方位不同的所有异构体。其包括对映异构体和具有多于一个手性中心、不是彼此镜像的化合物的异构体(“非对映异构体”)。
“手性中心”是指四个不同基团与其连接的碳原子。
“对映异构体”或“对映异构形式”是指不可与其镜像叠加的分子,因此是光学活性的,其中对映异构体以一个方向旋转偏振光平面,其镜像以相反方向旋转偏振光平面。
“对映体过量”、“(ee)”、“非对映体过量”、“(de)”是指在化学物质中一种对映体或非对映体比另一种更多地存在。这一差异定义为每种对映体的摩尔分数之间的绝对差异:ee=|(F+)-(F-)|,其中(F+)+(F-)=1。因此,(ee)和(de)可表示为对映体过量或非对映体过量的百分比。
术语“外消旋”是指化合物等摩尔量的两种对映体的混合物,该混合物是光学上无活性的。
本文所用的“富集”特定手性化合物、对映异构体或非对映异构体的组合物通常包括至少约60%、70%、80%、90%或甚至更多的该特定手性化合物、对映异构体或非对映异构体。富集的量可利用本领域技术人员例行使用的常规分析方法确定,包括但不限于,在手性位移试剂存在下的NMR光谱、利用手性柱的气相色谱分析和利用手性柱的高压液相色谱分析。在一些实施方案中,单个手性化合物、对映异构体或非对映异构体将大致上不含其他相应的手性化合物、对映异构体或非对映异构体。“大致上不含”是指,利用本领域技术人员例行使用的常规分析方法,诸如以上提到的方法确定,组合物包括少于约10%的指定不希望的手性化合物、对映异构体或非对映异构体。在一些实施方案中,不希望的手性化合物、对映异构体或非对映异构体的量可少于约10%,例如,少于约9%、8%、7%、6%、5%、4%、3%、2%、1%或甚至更少。包含至少约95%的指定手性化合物、对映异构体或非对映异构体的手性富集、对映异构富集或非对映异构富集的组合物在本文分别称为“大致上手性地纯”、“大致上对映异构地纯”和“大致上非对映异构地纯”。包含至少约99%的指定手性化合物、对映异构体或非对映异构体的组合物在本文分别称为“手性地纯”、“对映异构地纯”和“非对映异构地纯”。
“酮还原酶”和“KRED”在本文中可互换地使用,以指具有将羰基还原为其相应的醇的酶促能力的多肽。在具体的实施方案中,本发明的酮还原酶多肽能够立体选择性地还原(1)((S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯)为相应的醇化合物(2)(叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯)。所述多肽通常利用辅因子即还原型烟酰胺腺嘌呤二核苷酸(NADH)或还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH)作为还原剂。本文所用的酮还原酶包括天然存在的(野生型)酮还原酶以及通过人类操作而产生的非天然存在的工程化的多肽。
本文使用的“工程化的酮还原酶多肽”是指具有通过人类操纵而产生的变异序列(如,通过天然存在的母体酶的定向进化或此前来源自天然存在的酶的变体的定向进化而产生的序列)的酮还原酶多肽。
“天然存在的”或“野生型”是指在自然中所发现的形式。例如,天然存在的或野生型的多肽或多核苷酸序列是存在于生物体中的、可从自然中的来源分离的并且未被人类操作有意识地修改的序列。
“蛋白”、“多肽”和“肽”在本文可互换使用,表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(如,糖基化、磷酸化、脂质化、豆蔻酰化(myristilation)、泛素化等等)。这一定义中包括D-氨基酸和L-氨基酸,以及D-氨基酸与L-氨基酸的混合物。
“多核苷酸”或“寡核苷酸”是指核碱基聚合物或寡聚物,其中核碱基被糖磷酸酯键(糖磷酸酯骨架)连接。核碱基或碱基包括对利用核酸或多核苷酸技术或利用聚酰胺或肽核酸技术从而产生可以序列特异性方式与多核苷酸杂交的聚合物的人们公知的天然存在的和合成的杂环部分。核碱基的非限制性实例包括:腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶、尿嘧啶、5-丙炔基-尿嘧啶、2-硫代-5-丙炔基-尿嘧啶、5-甲基胞嘧啶、假异胞嘧啶、2-硫尿嘧啶和2-硫代胸腺嘧啶、2-氨基嘌呤、N9-(2-氨基-6-氯嘌呤)、N9-(2,6-二氨基嘌呤)、次黄嘌呤、N9-(7-脱氮-鸟嘌呤)、N9-(7-脱氮-8-氮杂-鸟嘌呤)和N8-(7-脱氮-8-氮杂-腺嘌呤)。示例性的多核苷酸和寡核苷酸包括2’脱氧核糖核苷酸的聚合物(DNA)和核糖核苷酸的聚合物(RNA)。多核苷酸可完全由核糖核苷酸、完全由2’脱氧核糖核苷酸或其组合构成。
“编码序列”是指编码多肽(例如蛋白)的氨基酸序列的那部分多核苷酸(例如基因)。
“序列同一性百分比”、“同一性百分比”和“同一的百分比”在本文中可互换使用,以指多核苷酸序列或多肽序列之间的比较,并且是通过将两个最佳地比对的序列在一个比较窗口上进行比较而被确定的,其中比较窗口中的多核苷酸或多肽序列的部分与参考序列相比可包括添加或缺失(即,缺口)以将这两个序列最佳地比对。百分比如下计算:确定两个序列中存在相同核酸碱基或氨基酸残基或者核酸碱基和氨基酸残基与缺口对齐的位置的数量而产生匹配位置数目,将匹配位置数目除以比较窗口中位置的总数目并将该结果乘以100以得到序列同一性百分比。使用BLAST和BLAST2.0算法来进行最佳比对和序列同一性百分比的确定(参见例如,Altschul等,1990,J.Mol.Biol.215:403-410和Altschul等,1977,NucleicAcids Res.3389-3402)。用于进行BLAST分析的软件可通过美国国家生物技术信息中心网站公开获得。
简要地说,BLAST分析包括首先通过识别问询序列中具有长度W的短字来识别高得分序列对(HSP),所述短字当与数据库序列中的相同长度的字对齐时匹配或满足某个正值阈值得分T。T被称为相邻字得分阈值(neighborhood word score threshold)(Altschul等人,上述)。这些最初的相邻字匹配(word hit)充当用于启动搜索的种子以寻找包含它们的更长的HSP。然后字匹配沿每条序列在两个方向上延伸远至累计的比对得分可被增加。对于核苷酸序列,使用参数M(对一对匹配残基的奖励得分;总是>0)和N(对错配残基的处罚得分;总是<0)计算累计得分。对于氨基酸序列,使用得分矩阵来计算累计得分。当发生以下情况时字匹配在每个方向上的延伸停止:累计比对得分从其所达到的最大值下降了量X;由于一个或更多个负得分残基比对的累积,累计得分趋于零或零以下;或者到达每条序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列而言)使用字长(W)11、期望(E)10、M=5、N=-4以及两条链的比较作为缺省值。对于氨基酸序列,BLASTP程序使用字长(W)3、期望(E)10以及BLOSUM62得分矩阵作为缺省值(参见Henikoff和Henikoff,1989,Proc Natl Acad Sci USA89:10915)。
可获得与BLAST相似地作用的其他算法来提供两条序列的同一性百分比。用于比较的序列的最佳比对可如下进行:例如,通过Smith和Waterman,1981,Adv.Appl.Math.2:482的局部同源性算法,通过Needleman和Wunsch,1970,J.Mol.Biol.48:443的同源性比对算法,通过Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA85:2444的相似性搜索方法,通过这些算法的计算机实现(GCG Wisconsin软件包中的GAP、BESTFIT、FASTA或TFASTA)或通过直观检查(一般参见,Current Protocols inMolecular Biology(分子生物学最新实验方案),F.M.Ausubel等编著,Current Protocols,Greene Publishing Associates Inc.和John Wiley&Sons,Inc.之间的合资企业,(1995年增刊)(Ausubel))。另外,序列比对和序列同一性百分比的确定可以利用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用提供的缺省参数。
“参考序列”是指与改变的序列进行比较的确定序列。参考序列可以是较大序列的子部分(subset),例如,全长基因或多肽序列的区段。一般而言,参考序列长度为至少20个核苷酸或氨基酸残基,长度至少25个残基,长度至少50个残基,或者核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包含在这两条序列之间相似的序列(即完整序列的一部分),以及(2)还可以包含在这两条序列之间相异的序列,所以在两种(或更多种)多核苷酸或多肽之间的序列比较通常是通过跨比较窗口比较这两种多核苷酸的序列而进行的,以识别和比较局部区域的序列相似性。
术语“参考序列”不意为限于野生型序列,且可包括工程化或改变的序列。例如,在一些实施方案中,“参考序列”可以是之前工程化或改变的氨基酸序列。例如,“基于SEQ ID NO:2、在位置X315具有甘氨酸残基的参考序列”是指对应SEQ ID NO:2、在X315具有甘氨酸残基的参考序列(而SEQ ID NO:2的未改变形式在X315具有谷氨酸)。
“比较窗口”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中可以将序列与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中在比较窗口中的序列的部分可以包括与参考序列(它不包括添加或缺失)相比20%或更少的添加或缺失(即空位),以用于这两条序列的最优比对。比较窗口可以比20个连续残基长,并且任选地包括30、40、50、100或更长的窗口。
“基本同一性(substantial identity)”是指具有与参考序列跨至少20个残基位置的比较窗口、通常至少30-50个残基的窗口相比至少80%序列同一性、至少85%序列同一性、至少89%序列同一性、至少95%序列同一性、甚至至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性百分比是通过跨比较窗口比较参考序列与包括参考序列的总计20%或更少的缺失或添加的序列而计算的。在应用于多肽的特定实施方案中,术语“基本同一性”表示两条多肽序列当通过诸如程序GAP或BESTFIT使用缺省空位权重进行最优比对时共有至少80%的序列同一性,优选至少89%序列同一性,至少95%序列同一性或更大(例如,99%序列同一性)。优选地,不相同的残基位置差别在于保守的氨基酸取代。
“对应于”、“关于”或“相对于”当用在给定氨基酸或多核苷酸序列的编号上下文中时,是指在该给定氨基酸或多核苷酸序列与指定的参考序列进行比较时该参考序列的残基编号。换言之,给定聚合物的残基号码或残基位置是根据参考序列指定的,而不是给定氨基酸或多核苷酸序列内的残基的实际数字位置指定的。例如,可以将给定的氨基酸序列诸如工程化酮还原酶的氨基酸序列与参考序列进行比对,这是通过引入空位以优化这两条序列之间的残基匹配而实现的。在这些情况下,尽管存在空位,对给定氨基酸或多核苷酸序列中的残基进行编号是根据与其进行比对的参考序列做出的。
“来源自”如本文中在工程化的酶的上下文中所用,标明所述工程化所基于的起始酶和/或编码这种酶的基因。例如,通过人工地使编码SEQ IDNO:2的野生型酮还原酶的多核苷酸突变经过多代而获得具有变异多肽序列SEQ ID NO:6的工程化的酮还原酶。因此,该工程化的酮还原酶“来源自”SEQ ID NO:2的野生型酮还原酶。
“立体选择性”或“立体特异性”是指在化学反应或酶促反应中一种立体异构体比另一种立体异构体优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于另一种,或者立体选择性可以是完全的,其中只形成一种立体异构体。当立体异构体是对映体时,立体选择性被称为对映体选择性,即一种对映体在两种对映体之和中的分数(通常被报告为百分比)。它在本领域中通常可选地被报告为(通常为百分比)根据式[主要对映体-次要对映体]/[主要对映体+次要对映体]从其计算出的对映体过量(e.e.)。当立体异构体是非对映体时,有时立体选择性被称为非对映体选择性,即一种非对映体在两种非对映体的混合物之中的分数(通常被报告为百分比),通常被可选地报告为非对映体过量(d.e.)。对映体过量和非对映体过量是立体异构体过量的类型。
本文使用的“高立体选择性”是指能够将底物转化或还原为其对应的具有至少约99%立体异构体过量的产物(如化合物(1)为化合物(2))的酮还原酶多肽。
“改进的酶特性”是指与参考酶表现的特性相比,为了特定目的使得更好或更期望的任何酶特性。对于本文所述的工程化酮还原酶多肽而言,这种比较一般是对野生型酮还原酶作出的,但是在一些实施方案中,参考酮还原酶可以是另一种改进的工程化酮还原酶。期望改进的酶特性包括但不限于酶活性(它可以按照在一段时间内底物转化百分比来表示)、热稳定性、pH稳定性或活性概况、辅因子需求、对抑制剂(例如,产物抑制)的不应性、立体特异性和立体选择性(包括对映体选择性)。
“提高的酶活性”或“提高的活性”或“提高的转化率”是指与参考酶相比,可以由比活性(例如,产生的产物/时间/重量蛋白)的提高或者由底物转化为产物的转化率(例如,使用指定量的转胺酶在指定时间段内将起始量的底物转化为产物的百分比)的提高表示的工程化酶的改进特性。确定酶活性和转化率的示例性方法被提供在实施例中。可以影响与酶活性相关的任何特性,包括经典的酶特性Km、Vmax或kcat,它们的改变能够导致提高的酶活性。酶活性的改进可以是从比对应的野生型酮还原酶的酶活性改进约100%,到比天然存在的酮还原酶或从其获取酮还原酶多肽的另一种工程化酮还原酶的酶活性改进200%、500%、1000%或更大。在具体的实施方案中,工程化酮还原酶展现出在比母体野生型或其他参考酮还原酶的酶活性改进100%至200%、200%至1000%或大于1500%的范围内的改进的酶活性。本领域技术人员理解,任何酶的活性都受扩散限制以致催化转换速率不能超过包括任何所需的辅因子在内的底物的扩散速率。扩散限制或kcat/Km的理论最大值一般是约108到109(M-1s-1)。因此,酮还原酶的酶活性上的任何改进将具有与酮还原酶所作用的底物的扩散速率相关的上限。酮还原酶活性可以通过用于测量酮还原酶的标准测定中的任何一种来测量,例如实施例7描述的测定。使用本文进一步详述的限定的酶制品、在设置条件下的确定的测定以及一种或多种确定的底物,进行酶活性或转化率的比较。一般而言,在比较裂解物时,确定所测定的细胞数目和/或蛋白的量,并使用相同的表达***和相同的宿主细胞以使得由该宿主细胞所产生并存在于裂解物中的酶量的改变最小化。
“转化”是指底物被酶促转化为对应的产物。“转化百分比”是指在指定条件下在一段时间内被转化为产物的底物的百分比。因此,例如,酮还原酶多肽的“活性”或“转化率”可以表示为底物到产物的“转化百分比”。
“热稳定的”或“热稳定”可互换使用,是指与未处理的酶相比,在暴露于一组温度条件(例如40-80℃)一段时间(例如0.5-24小时)时耐受失活,从而在暴露于高温后保持某一水平残留活性(例如多于60%到80%)的多肽。
“溶剂稳定的”是指与未处理的酶相比,在暴露于不同浓度(例如,5-99%)的溶剂(如,异丙醇、二甲基亚砜、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚、乙腈等等)一段时间(例如0.5-24小时)后保持相似活性(多于例如60%到80%)的多肽。
“pH稳定的”是指与未处理的酶相比,在暴露于高pH或低pH(例如8至12或4.5-6)一段时间(例如0.5-24小时)后保持相似活性(例如多于60%到80%)的多肽。
“热稳定且溶剂稳定的”是指既热稳定又溶剂稳定的多肽。
在本文公开的多肽上下文中使用的“氨基酸”或“残基”是指在序列位置的具体单体(如,E315表示SEQ ID NO:2位置315的“氨基酸”或“残基”是谷氨酸)。
“亲水性氨基酸或残基”是指根据Eisenberg等人,1984,J.Mol.Biol.179:125-142的标准化统一疏水性量表具有展现出小于零的疏水性的侧链的氨基酸或残基。遗传编码的亲水性氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。
“酸性氨基酸或残基”是指当氨基酸被包括在肽或多肽中时具有展现出小于约6的pK值的侧链的亲水性氨基酸或残基。酸性氨基酸由于氢离子的缺失在生理pH下通常具有带负电的侧链。遗传编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。
“碱性氨基酸或残基”是指当氨基酸被包括在肽或多肽中时具有展现出大于约6的pKa值的侧链的亲水性氨基酸或残基。碱性氨基酸由于与水合氢离子缔合在生理pH下通常具有带正电的侧链。遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。
“极性氨基酸或残基”是指所具有的侧链在生理pH下不带电荷但具有如下至少一个键的亲水性氨基酸或残基:在所述至少一个键中由两个原子共有的电子对被这两个原子之一更紧密地持有。遗传编码的极性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。
“疏水性氨基酸或残基”是指根据Eisenberg等人,1984,J.Mol.Biol.179:125-142的标准化统一疏水性量表具有展现出大于零的疏水性的侧链的氨基酸或残基。遗传编码的疏水性氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。
“芳香族氨基酸或残基”是指具有包括至少一个芳环或杂芳环的侧链的亲水性或疏水性氨基酸或残基。遗传编码的芳香族氨基酸包括L-Phe(F)、L-Tyr(Y)和L-Trp(W)。尽管L-His(H)由于其杂芳香族氮原子的pKa有时被分类为碱性残基,或者因为其侧链包括杂芳环而被分类为芳香族残基,但本文的组氨酸被分类为亲水性残基或“受限制的残基(constrainedresidue)”(见下面)。
“受限制的氨基酸或残基”是指具有受限制的几何形状的氨基酸或残基。本文中,受限制的残基包括L-pro(P)和L-his(H)。组氨酸具有受限制的几何形状,因为它具有相对小的咪唑环。脯氨酸具有受限制的几何形状,因为它也具有五元环。
“非极性氨基酸或残基”是指所具有的侧链在生理pH下不带电荷并且具有如下键的疏水性氨基酸或残基:在所述键中由两个原子共有的电子对一般被这两个原子中每一个同等持有(即侧链是没有极性的)。遗传编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。
“脂肪族氨基酸或残基”是指具有脂肪烃侧链的疏水性氨基酸或残基。遗传编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。
“半胱氨酸”。氨基酸L-Cys(C)是独特的,因为它能够与其他L-Cys(C)氨基酸或其他包含硫烃基或硫氢基的氨基酸形成二硫键桥。“半胱氨酸样残基”包括半胱氨酸和其他包含可用于形成二硫键桥的硫氢基部分的氨基酸。L-Cys(C)(和其他具有包含-SH的侧链的氨基酸)以游离-SH还原形式或氧化的二硫键桥形式存在于肽中的能力影响L-Cys(C)赋予肽净疏水性还是净亲水性。尽管根据Eisenberg的标准化统一量表(Eisenberg等人,1984,上述)L-Cys(C)展现出0.29的疏水性,但应理解出于本公开内容的目的将L-Cys(C)归为它自己一组。
“小氨基酸或残基”是指具有由总计三个或更少的碳和/或杂原子(不包括α-碳和氢)组成的侧链的氨基酸或残基。根据以上定义可以将小氨基酸或残基进一步归类为脂肪族、非极性、极性或酸性的小氨基酸或残基。遗传编码的小氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。
“包含羟基的氨基酸或残基”是指包含羟基(-OH)部分的氨基酸。遗传编码的包含羟基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。
“氨基酸差异”或“残基差异”是指与参考序列相比,在多肽序列指定位置的残基改变。例如,参考序列在位置I199具有异亮氨酸时,位置I199的残基差异是指在位置199的残基改变为异亮氨酸以外的任何残基。如本文公开的,工程化的酮还原酶可包括相对参考序列的一种或多种残基差异,其中多个残基差异通常由相对参考序列进行改变的指定位置的列表表示(如,“与SEQ ID NO:2相比在以下残基位置的一种或多种残基差异:2、28、34、47、50、81、90、91、94、112、117、143、144、145、150、152、153、158、190、198、199、200、204、217、225、231、232、233、244、260和261”)。
“保守的”氨基酸取代(或突变)是指以具有相似侧链的残基取代残基,并因此通常包括用相同或相似定义的氨基酸类别中的氨基酸取代多肽中的氨基酸。然而,如本文所用,在一些实施方案中,如果保守的突变可以是从脂肪族残基到脂肪族残基、非极性残基到非极性残基、极性残基到极性残基、酸性残基到酸性残基、碱性残基到碱性残基、芳香族残基到芳香族残基、或受限制的残基到受限制的残基的取代,则保守的突变不包括从亲水性残基到亲水性残基、疏水性残基到疏水性残基、包含羟基的残基到包含羟基的残基、或小残基到小残基的取代。此外,如本文所用,A、V、L或I可以被保守突变为另一种脂肪族残基或另一种非极性残基。下表1显示了示例性保守取代。
表1:保守取代
“非保守取代”是指用具有显著差别的侧链特性的氨基酸取代或突变多肽中的氨基酸。非保守取代可以利用以上列出的限定组之间而不是它们之内的氨基酸。在一个实施方案中,非保守突变影响:(a)取代区域中的肽骨架的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链体积。
“缺失”是指通过从参考多肽去除一个或更多个氨基酸而对多肽进行的修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、7个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、12个或更多个氨基酸、15个或更多个氨基酸、或者20个或更多个氨基酸、高达构成参考酶的氨基酸总数的10%、或高达氨基酸总数的20%,同时保留酶活性和/或保留工程化酮还原酶的改进特性。缺失可以针对多肽的内部和/或端部。在多个实施方案中,缺失可以包括连续的区段或者可以是不连续的。
“***”是指通过从参考多肽添加一个或更多个氨基酸而对多肽进行的修饰。在一些实施方案中,改进的工程化酮还原酶包括一个或更多个氨基酸***天然存在的酮还原酶多肽,以及一个或更多个氨基酸***其他工程化的酮还原酶多肽。***可以在多肽的内部或者到羧基端或氨基端。如本文所用的***包括本领域已知的融合蛋白。***可以是氨基酸的连续区段,或者被天然存在的多肽中的一个或更多个氨基酸分隔。
如本文所用的“片段”是指如下多肽:所述多肽具有氨基端和/或羧基端缺失,但其中剩余的氨基酸序列与该序列中的对应位置相同。片段可以为至少14个氨基酸长、至少20个氨基酸长,至少50个氨基酸长或更长,以及高达全长酮还原酶多肽的70%、80%、90%、95%、98%和99%。
“分离的多肽”是指如下多肽:所述多肽基本上与其天然伴随的其他污染物例如蛋白、脂质和多核苷酸分离。该术语包括已自其天然存在环境或表达***(例如,宿主细胞或体外合成)中移出或纯化的多肽。改进的酮还原酶可以存在于细胞内、存在于细胞培养基中或者以各种形式制备,诸如裂解物或分离的制备物。像这样,在一些实施方案中,改进的酮还原酶可以是分离的多肽。
“基本上纯的多肽”是指如下组合物:在所述组合物中多肽物类是存在的优势物类(即,在摩尔基础或重量基础上它比该组合物中的任何其他个体大分子物类更丰富),并且当目标物类构成存在的大分子物类的按摩尔或重量%计至少约50%时一般是基本上纯化的组合物。一般而言,基本上纯的酮还原酶组合物将构成该组合物中存在的所有大分子物类的按摩尔或重量%计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物类纯化至基本的均一性(即,通过常规检测方法不能在组合物中检测出污染物类),其中组合物基本上由单一大分子物类组成。溶剂物类、小分子(<500道尔顿)、以及元素离子物类不被认为是大分子物类。在一些实施方案中,分离的改进酮还原酶多肽是基本上纯的多肽组合物。
如本文所用的“严格杂交”是指如下条件:在所述条件下核酸杂交体是稳定的。如本领域技术人员已知的,杂交体的稳定性反映在杂交体的解链温度(Tm)上。一般而言,杂交体的稳定性随离子强度、温度、G/C含量和离液剂的存在而变化。多核苷酸的Tm值可以使用预测解链温度的已知方法计算(参见例如,Baldino等人,Methods Enzymology168:761-777;Bolton等人,1962,Proc.Natl.Acad.Sci.USA48:1390;Bresslauer等人,1986,Proc.Natl.Acad.Sci USA83:8893-8897;Freier等人,1986,Proc.Natl.Acad.SciUSA83:9373-9377;Kierzek等人,Biochemistry25:7840-7846;Rychlik等人,1990,Nucleic Acids Res18:6409-6412(勘误,1991,Nucleic Acids Res19:698);Sambrook等人,上述);Suggs等人,1981,在DevelopmentalBiology Using Purified Genes(使用纯化基因的发育生物学)(Brown等人,编),第683-693页,Academic Press中;以及Wetmur,1991,Crit Rev BiochemMol Biol26:227-259。所有的出版物均通过引用并入本文)。在一些实施方案中,多核苷酸编码本文公开的多肽并且在限定条件下诸如在中度严格或高度严格条件下与编码本公开内容的工程化酮还原酶的序列的互补序列杂交。
“杂交严格度”涉及核酸的这种洗涤条件。一般而言,在较低严格度条件下进行杂交反应,接着是具有不同但更高的严格度的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补核酸的条件,所述互补核酸与该靶DNA具有约60%同一性、优选约75%同一性、约85%同一性;与靶多核苷酸具有大于约90%同一性。示例性中度严格条件是等同于在42℃于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中杂交,接着在42℃于0.2×SSPE、0.2%SDS中洗涤的条件。“高严格度杂交”一般是指如下条件:与对限定的多核苷酸序列在溶液条件下确定的热解链温度Tm相差约10℃或更小。在一些实施方案中,高严格度条件是指允许仅那些在65℃于0.018M NaCl中形成稳定杂交体的核酸序列杂交的条件(即,如果杂交体在65℃于0.018M NaCl中不稳定,它在本文考虑的高严格度条件下将是不稳定的)。可以例如通过在等同于在42℃于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS的条件中杂交,接着在65℃于0.1×SSPE和0.1%SDS中洗涤,而提供高严格度条件。其他高严格度杂交条件以及中度严格条件描述于以上引用的参考文献中。
“重组的”在提及例如细胞、核酸或多肽而被使用时,是指以本来在自然中不存在的方式被修饰,或者与自然中存在的物质相同但是是从合成的物质和/或通过使用重组技术的操作而产生或衍生出来的物质或对应于该物质的天然或天生形式的物质。非限制性的实例包括但不限于这样的重组细胞,其表达在天然(非重组)形式的细胞中未被发现的基因或者表达本来以不同水平表达的天然基因。
“异源”多核苷酸是指通过实验技术引入宿主细胞的任何多核苷酸,并且包括从宿主细胞中移出、经历实验室操作、然后再引入宿主细胞中的多核苷酸。
“密码子优化的”是指编码蛋白质的多核苷酸的密码子变为特定生物体中优先使用的那些密码子,以致所编码的蛋白被有效表达在感兴趣的生物体中。尽管遗传密码由于大多数氨基酸被称作“同义密码子”或“同义”密码子的几个密码子代表而为简并的,但众所周知具体生物体的密码子使用是非随机的且偏向特定的密码子三联体。就给定基因、具有共同功能或祖先起源的基因、高表达蛋白相对于低拷贝数蛋白以及生物体基因组的聚集蛋白编码区而言,这种密码子使用偏向可能更高。在一些实施方案中,可以对编码酮还原酶的多核苷酸进行密码子优化,以用于从为表达所选的宿主生物体中优化生产。
“偏爱密码子、优化的密码子、高密码子使用偏向的密码子”可互换地指在蛋白编码区中以高于编码同一氨基酸的其他密码子的频率被使用的密码子。偏爱密码子可以根据在单基因、一组具有共同功能或起源的基因、高表达基因中的密码子使用,在整个生物体的聚集蛋白编码区中的密码子频率,在相关生物体中的聚集蛋白编码区中的密码子频率或它们的组合来确定。频率随基因表达水平而提高的密码子通常是用于表达的优化密码子。多种方法已知用于确定具体生物体中的密码子频率(例如,密码子使用,相对同义的密码子使用)和密码子偏好,包括多变量分析,例如使用聚类分析或对应分析,以及用于确定基因中使用的密码子的有效数目(参见GCG CodonPreference,遗传学计算机工作组Wisconsin软件包(GeneticsComputer Group Wisconsin Package);CodonW,John Peden,诺丁汉大学;McInerney,J.O,1998,Bioinformatics14:372-73;Stenico等人,1994,NucleicAcids Res.222437-46;Wright,F.,1990,Gene87:23-29)。不断增加的生物名单的密码子使用表是可用的(参见例如,Wada等人,1992,Nucleic Acids Res.20:2111-2118;Nakamura等人,2000,Nucl.Acids Res.28:292;Duret等人,上述;Henaut和Danchin,“Escherichia coli and Salmonella(大肠杆菌和沙门氏菌),”1996,Neidhardt等人编,ASM Press,Washington D.C.,第2047-2066页)。用于获得密码子使用的数据资源可依赖于能够编码蛋白的任何可用的核苷酸序列。这些数据集包括实际上已知编码表达的蛋白的核酸序列(例如,完整的蛋白编码序列-CDS)、表达序列标签(ESTS)、或基因组序列的预测编码区(参见,例如Mount,D.,Bioinformatics:Sequence andGenome Analysis(生物信息学:序列和基因组分析),第8章,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.,2001;Uberbacher,E.C.,1996,Methods Enzymol.266:259-281;Tiwari等人,1997,Comput.Appl.Biosci.13:263-270)。
“控制序列”在本文定义为包括对本公开内容的多肽的表达必要或有利的所有组分。每个控制序列可能对编码多肽的核酸序列是天然的或外来的。这些控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子以及转录和翻译终止信号。为了引入特定的限制位点以促进控制序列与编码多肽的核酸序列的编码区连接,控制序列可与连接序列一起提供。
“可操作地连接”在本文定义为如下一种配置:在所述配置中控制序列相对于DNA序列的编码序列的位置被适当安放,以使得控制序列指导多核苷酸和/或多肽的表达。
“启动子序列”是由宿主细胞识别用于表达编码区的核酸序列。控制序列可以包括适当的启动子序列。启动子序列包含介导多肽的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码细胞外多肽或细胞内多肽的、与该宿主细胞同源或异源的基因中获得。
术语“辅因子再生***”是指参加将氧化型的辅因子还原(例如NADP+至NADPH)的反应的一组反应物。被酮还原酶催化的酮底物还原所氧化的辅因子被辅因子再生***再生为还原型。辅因子再生***包括化学计量还原剂,其为还原氢等价物的来源并且能够将辅因子的氧化型还原。辅因子再生***还可包括催化剂,例如催化还原剂对辅因子氧化型的还原的酶催化剂。用于从NAD+或NADP+分别再生NADH或NADPH的辅因子再生***是本领域已知的并且可被用于本文所述的方法。
5.2.酮还原酶多肽和其用途
本公开内容提供为能够立体特异性地还原N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)(如化合物(1),其中保护基是BOC部分)为相应的立体异构醇产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(“产物”)(如化合物(2))的酶的工程化的酮还原酶(“KRED”)多肽,如以上方案1所示)。在某些实施方案中,被转化为立体异构醇产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇产物(如化合物(2))的底物N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)在生物催化还原反应中作为外消旋混合物的部分、或作为大致上手性纯的化合物、或作为手性纯的化合物存在。本公开内容的工程化的酮还原酶(“KRED”)酶是与从Novosphingobiumaromaticivorans获得的天然存在的野生型KRED酶(SEQ ID NO:2)相比具有改进的特性的酶。期望对其改进的酶特性包括但不限于,酶促活性、热稳定性、pH活性谱、辅因子需求、对抑制剂(如,产物抑制)的不应性、立体特异性、立体选择性和溶剂稳定性。改进可以是关于单独酶特性,诸如酶促活性,或关于不同酶特性的组合,诸如酶促活性和立体特异性。
如上所述,具有改进的酶特性的工程化的酮还原酶是关于Novosphingobium aromaticivorans(SEQ ID NO:2)描述的。这些酮还原酶中的氨基酸残基位置从起始甲硫氨酸(M)残基开始确定(即,M代表残基位置1),尽管本领域技术人员将理解,这一起始的甲硫氨酸残基可能被诸如宿主细胞或体外翻译***中的生物加工机制去除以产生缺少起始甲硫氨酸残基的成熟蛋白。氨基酸序列中存在特定氨基酸或氨基酸改变的氨基酸残基位置在本文有时描述为术语“Xn”或“残基n”,其中n是指残基位置。取代突变是序列中对应于参考序列(例如天然存在的酮还原酶SEQ IDNO:2)的残基的残基被不同氨基酸残基进行氨基酸残基替换,如下标为“X(数字)Z”,其中X是见于N.aromaticivorans野生型酶(SEQ ID NO:2)位置“数字”的氨基酸,Z是见于“突变体”酶的位置“数字”的氨基酸,“突变体”酶即其中氨基酸Z已经取代氨基酸X的酶。在这种情形,单字母代码用于代表氨基酸;如G145A是指其中SEQ ID NO:2位置145的“野生型”氨基酸甘氨酸已被氨基酸丙氨酸替换的情形。
在本文,突变有时被描述为一个残基突变“为一种”类型的氨基酸。例如,SEQ ID NO:2的残基199(异亮氨酸(I))可被突变“为一种”极性残基。使用短语“为一种”不排除从一个类别的一种氨基酸突变为同一类别的另一种氨基酸。例如,残基199可从异亮氨酸被突变“为”天冬酰胺。
编码Novosphingobium aromaticivorans的天然存在的酮还原酶(还称为“ADH”或“醇脱氢酶”)的多核苷酸序列可从GenBank登录号CP000677.1中提供的Novosphingobium aromaticivorans DSM12444质粒pNL2(序列)的碱基160464至161243完整序列的780bp区获得。这一多核苷酸编码的相应的多肽序列由GenBank登录号gi|145322460|gb|ABP64403.1|[145322460提供。由于起始密码子选择不同,这一多肽比SEQ ID NO:2短四个氨基酸(即,GenBank多肽序列开始于对应于SEQ ID NO:2位置5的Met)。本公开内容预期包括其中多肽是SEQ IDNO:2的片段的酮还原酶多肽,其中该片段氨基酸序列开始于SEQ ID NO:2位置5的Met,结束于SEQ ID NO:2的位置263。因此,在本文公开的工程化的酮还原酶多肽的任何实施方案中,其中多肽包括相对于SEQ IDNO:2的氨基酸差异,本公开内容还提供工程化的酮还原酶多肽的片段,其中该片段氨基酸序列开始于SEQ ID NO:2位置5的Met,结束于SEQ IDNO:2的位置263,氨基酸差异是在如同相应的全长工程化的多肽相对于SEQ ID NO:2的相同氨基酸处。
在一些实施方案中,本文的酮还原酶多肽可具有多个相对于参考序列(SEQ ID NO:2的Novosphingobium aromaticivorans)的修饰,其中修饰导致改进的酮还原酶特性。在这种实施方案中,对氨基酸序列的修饰的数目可包括一个或多个氨基酸、2或多个氨基酸、3或多个氨基酸、4或多个氨基酸、5或多个氨基酸、6或多个氨基酸、8或多个氨基酸、9或多个氨基酸、10或多个氨基酸、15或多个氨基酸、或20或多个氨基酸、达参考酶序列氨基酸总数的10%、达氨基酸总数的10%、达氨基酸总数的20%、或达氨基酸总数的30%。在一些实施方案中,产生改进的酮还原酶特性的对天然存在的多肽或工程化的多肽的修饰数目可包括参考序列的从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个修饰。修饰可包括***、缺失、取代、或其组合。
在一些实施方案中,修饰包括对参考序列,即SEQ ID NO:2的Novosphingobium aromaticivorans KRED序列的氨基酸取代。可产生改进的酮还原酶特性的取代可以是在一个或多个氨基酸、2或多个氨基酸、3或多个氨基酸、4或多个氨基酸、5或多个氨基酸、6或多个氨基酸、7或多个氨基酸、8或多个氨基酸、9或多个氨基酸、10或多个氨基酸、15或多个氨基酸、或20或多个氨基酸、达参考酶序列氨基酸总数的10%、达氨基酸总数的15%、达氨基酸总数的20%、或达氨基酸总数的30%。在一些实施方案中,产生改进的酮还原酶特性的对天然存在的多肽或工程化的多肽的取代数目可包括参考序列的从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个氨基酸取代。
在一些实施方案中,酮还原酶多肽的改进的特性是关于其立体特异性的增加。例如,在一些实施方案中,改进的特性是酶区分N-保护的3-氨基-1-氯-4-苯基丁-2-酮的两种对映体(如,按照式(IV)的(3S)对映体和(3R)对映体的外消旋混合物),并转化大致上仅(3S)对映体为相应的立体异构式(II)产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(如化合物(2))的能力,如例如以下方案5所示。
方案5
酮还原酶多肽的立体特异性的这一改进可表示为酮还原酶反应的“E值”的改进。
在一些实施方案中,酮还原酶多肽的改进的特性是关于其转化或还原更大百分比的底物为产物的能力增加。在一些实施方案中,酮还原酶多肽的改进的特性是关于其转化底物为产物的比率增加。酶促活性的这一改进可表示为与野生型或其他参考序列相比,使用较少的改进的多肽还原或转化相同量的产物的能力。在一些实施方案中,酮还原酶多肽的改进的特性是关于其稳定性或热稳定性。在一些实施方案中,酮还原酶多肽具有多于一种改进的特性,诸如立体特异性、酶活性和热稳定性的组合。
在一些实施方案中,酮还原酶多肽能够立体特异性地转化N-保护的3-氨基-1-氯-4-苯基丁-2-酮的(3S)-对映体以获得非对映体过量百分比为至少约25%、50%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或99.99%的相应的N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇产物。
在一些实施方案中,酮还原酶多肽能够立体特异性地转化底物为大于约90%非对映体过量的产物。具有这种立体特异性的示例性的多肽包括但不限于,包含对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽能够立体特异性地转化底物为大于约95%非对映体过量的产物。具有这种立体特异性的示例性的多肽包括但不限于,包含对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽能够立体特异性地转化底物为大于约97%非对映体过量的产物。具有这种立体特异性的示例性的多肽包括但不限于,包含对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽能够立体特异性地转化底物为大于约98%非对映体过量的产物。具有这种高立体特异性的示例性的酮还原酶多肽包括但不限于,包含对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽能够立体特异性地转化底物为至少约98%、99%、99.9%或99.99%非对映体过量百分比的产物,其中多肽包括对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列。
在一些实施方案中,酮还原酶多肽与野生型(SEQ ID NO:2)相比在其酶促活性的比率,即其转化底物为产物的比率或能力方面是等价或改进的。能够以与野生型等价或比野生型改进的转化率转化底物为产物的示例性的多肽包括但不限于,包括对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽与野生型(SEQ ID NO:2)相比在其酶促活性的比率,即其转化底物为产物的比率或能力方面是改进的。能够以比野生型改进至少约1.2倍的转化率转化底物为产物的示例性的多肽包括但不限于,包括对应于SEQ ID NO:4、6、14、16、18、22、24、26、28、30、32、34、36、38、40、50、52、54和56的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽与野生型(SEQ ID NO:2)相比在其酶促活性的比率,即其转化底物为产物的比率或能力方面是改进的。能够以比野生型改进至少约1.5倍的转化率转化底物为产物的示例性的多肽包括但不限于,包括对应于SEQ ID NO:6、18、22、30、38、40、50、52、54和56的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽与野生型(SEQ ID NO:2)相比在其酶促活性的比率,即其转化底物为产物的比率或能力方面是改进的。能够以比野生型改进至少约3倍的转化率转化底物为产物的示例性的多肽包括但不限于,包括对应于SEQ ID NO:6、50、52和56的氨基酸序列的多肽。
在一些实施方案中,本公开内容的工程化的酮还原酶多肽能够转化底物为至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%、99.99%或更多非对映体过量的产物。具有这一能力的示例性的工程化的酮还原酶多肽包括但不限于,包括对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的序列的多肽。
在一些实施方案中,本公开内容的工程化的酮还原酶多肽能够以改进的转化率还原底物式(I)化合物(如,化合物(1))为产物式(II)化合物(如,化合物(2))。例如,在一些实施方案中,本公开内容的工程化的酮还原酶多肽能够在约24小时或更短时间内转化至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多底物为产物。在一些实施方案中,工程化的酮还原酶多肽能够在少于约24小时、少于约20小时、少于约16小时、少于约12小时、和甚至少于约10小时内转化至少约90%底物为产物。具有这一能力的示例性的工程化的酮还原酶多肽包括但不限于,包括对应于SEQ ID NO:6、50、52和56的序列的多肽。
在一些实施方案中,当反应混合物包括相对于底物的量的重量约1%或更少(但多于0%)、0.5%或更少(但多于0%)、0.2%或更少(但多于0%)、或甚至0.1%或更少(但多于0%)重量比的酮还原酶多肽时,本公开内容的工程化的酮还原酶多肽能够在约24小时或更短时间内转化至少约70%、80%、90%、95%、99%或更多底物式(I)化合物(如,化合物(1))为产物式(II)化合物(如,化合物(2))。具有这一能力的示例性的多肽包括但不限于,包括对应于SEQ ID NO:6、50、52和56的序列的多肽。
在一些实施方案中,当反应混合物包括酮还原酶多肽负荷为约10g/L或更少、5g/L或更少、2g/L或更少、1g/L或更少和反应混合物中底物的初始浓度(即,底物负荷)为至少约25g/L、至少约50g/L、至少约75g/L、至少约100g/L、至少约125g/L、至少约150g/L、至少约175g/L、或至少约200g/L时,本公开内容的工程化的酮还原酶多肽能够在约24小时或更短时间内转化至少约70%、80%、90%、95%、99%或更多底物式(I)化合物(如,化合物(1))为产物式(II)化合物(如,化合物(2))。具有这一能力的示例性的多肽包括但不限于,包括对应于SEQ ID NO:6、50、52和56的序列的多肽。
在一些实施方案中,酮还原酶多肽具有比野生型改进的活性和稳定性,可还原底物为大于约98%d.e.的产物。具有这种能力的示例性的多肽包括但不限于SEQ ID NO:4、6、14、16、18、22、24、26、28、30、32、34、36、38、40、50、52、54和56。以下表2以序列标识符(SEQ ID NO)列出本文公开的工程化的酮还原酶多肽(和编码多核苷酸)连同工程化的多肽的变异序列相对于其通过定向进化来自的野生型Novosphingobiumaromaticivorans酮还原酶序列的具体残基差异(SEQ ID NO:2)(参见如,Stemmer等,1994,Proc Natl Acad Sci USA91:10747-10751)。表2的每行列出两个SEQ ID NO,其中奇数是指编码偶数提供的多肽氨基酸序列的核苷酸序列。
确定每种工程化的酮还原酶多肽相对于野生型酶SEQ ID NO:2活性的活性(野生型:24小时中~30%转化、3g/L底物负荷、5g/L酶负荷)。活性确定为随着时间,化合物(1)向化合物(2)的转化,如实施例7所述。如表2中概括的,活性的改进如下定量:“相当(Control)”指示与SEQ ID NO:2的KRED的活性相比100%至120%;“+”指示与SEQ ID NO:2的KRED相比>120%至150%;“++”指示与SEQ ID NO:2的KRED相比>150%至300%;且“+++”指示与SEQ ID NO:2的KRED相比>300%。
表2
工程化的酮还原酶多肽转化仲醇即异丙醇(IPA)为其相应产物丙酮的改进的活性相对于参考多肽SEQ ID NO:2的相同活性确定。相对IPA活性利用以下反应条件的检验确定:100μl10×稀释的工程化的KRED裂解物、10%IPA(v/v)、0.5g/L NAD+、100mM TEA、pH7.5。对IPA表现相对于SEQ ID NO:2增加至少2倍的活性的示例性的工程化的酮还原酶多肽列在表3。相对于WT SEQ ID NO:2在IPA活性方面的改进倍数如下定量:“+”指示至少200%至250%改进;“++”指示>250%至500%改进;和“+++”指示>500%至1000%改进;和“++++”指示>1000%至2000%改进。
表3
在一些实施方案中,本公开内容提供改进的酮还原酶多肽,其包含与SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,且包括表2或表3中列出的至少一种氨基酸取代。
在一些实施方案中,本公开内容提供能够表现多肽SEQ ID NO:2活性的至少约3倍的相对活性的改进的酮还原酶多肽(即,基于以上表2的相对活性指定为“+++”),其中改进的酮还原酶多肽包括与SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同的氨基酸序列,且包括至少一种以下氨基酸取代或氨基酸取代组:G145A;G145A和I225V;P2L、E50K、G145A和A217T;G145A和I199L。本文公开的这种改进的酮还原酶多肽还可包括另外的修饰,包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。改进的酮还原酶在位置P2、E50、G145、I199、A217和I225的其他可用的氨基酸序列取代在以下公开。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,本公开内容提供能够表现多肽SEQ ID NO:2活性的至少约1.5倍的相对活性的改进的酮还原酶多肽(即,基于以上表2的相对活性指定为“++”),其中改进的酮还原酶多肽包括与SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,且包括与SEQ ID NO:2相比的至少一种以下氨基酸取代:N153G;N153H;G190A;F260Y;I91R;K94R;G145A;I199N;或与SEQ ID NO:2相比的以下氨基酸取代组:K94R、G145A和I199N。本文公开的这种改进的酮还原酶多肽还可包括另外的修饰,包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。改进的酮还原酶在位置I91、K94、G145、N153、G190、I199和F260的其他可用的氨基酸序列取代在以下公开。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,本公开内容提供能够表现多肽SEQ ID NO:2活性的至少约1.2倍的相对活性的改进的酮还原酶多肽(即,基于以上表2的相对活性指定为“+”),其中改进的酮还原酶多肽包括与SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,且包括与SEQ ID NO:2相比的至少一种以下氨基酸取代:I199L;A150G;I91L;I91W;I91K;和V144T;或与SEQ ID NO:2相比的以下氨基酸取代组之一:G145A;A47V和I199M;A150G和P231F。本文公开的这种改进的酮还原酶多肽还可包括另外的修饰,包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。改进的酮还原酶在位置A47、I91、V144、G145、A150、I199和P231的其他可用的氨基酸序列取代在以下公开。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,本公开内容提供能够表现多肽SEQ ID NO:2转化异丙醇为丙酮方面活性的至少约2倍的相对活性的改进的酮还原酶多肽(即,基于以上表3的相对活性指定为“+”),其中改进的酮还原酶多肽包括与SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,且包括与SEQ ID NO:2相比的至少一种以下氨基酸取代:V144C、G145A、G145V、A150S、A150I、A150W、G190P、G190Q、G190V、I199G、I199L、M200I、V204F或I225V;或与SEQ ID NO:2相比的以下氨基酸取代组之一:G145A、I199L;或G145A、I225V。本文公开的这种改进的酮还原酶多肽还可包括另外的修饰,包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。改进的酮还原酶在位置V144、G145、A150、G190、I199、M200、V204和I225的其他可用的氨基酸序列取代在以下公开。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
因此,在一些实施方案中,本公开内容提供能够以比参考多肽SEQ IDNO:2大至少2倍、2.5倍、5倍、或10倍的活性氧化异丙醇(IPA)为丙酮的工程化的酮还原酶多肽,其中该多肽包括具有与选自SEQ ID NO:6、56、60、62、64、66、68、70、72、74、76、78和80的序列至少70%、80%、85%、90%、95%、98%、99%或更大的同一性的氨基酸序列。在一些实施方案中,工程化的多肽具有与选自SEQ ID NO:6、56、60、62、64、66、68、70、72、74、76、78和80的序列具有至少95%的同一性的氨基酸序列。在一些实施方案中,工程化的多肽具有选自SEQ ID NO:6、56、60、62、64、66、68、70、72、74、76、78和80的氨基酸序列。
在一些实施方案中,能够以比参考多肽SEQ ID NO:2大至少2倍、2.5倍、5倍或10倍的活性氧化异丙醇(IPA)为丙酮的工程化的酮还原酶多肽具有包括至少一种以下特征的氨基酸序列:对应于SEQ ID NO:2的氨基酸144的残基是半胱氨酸;对应于SEQ ID NO:2的氨基酸145的残基选自丙氨酸和缬氨酸组成的组;对应于SEQ ID NO:2的氨基酸150的残基选自异亮氨酸、丝氨酸和色氨酸组成的组;对应于SEQ ID NO:2的氨基酸190的残基选自谷氨酰胺、脯氨酸和缬氨酸组成的组;对应于SEQ ID NO:2的氨基酸199的残基选自甘氨酸和亮氨酸组成的组;对应于SEQ ID NO:2的氨基酸200的残基是异亮氨酸;对应于SEQ ID NO:2的氨基酸204的残基是苯丙氨酸;且对应于SEQ ID NO:2的氨基酸225的残基是缬氨酸。在某些实施方案中,工程化的多肽的氨基酸序列包括与SEQ ID NO:2相比的至少一种以下取代:V144C、A150I、A150S、A150W、G190P、G190V、M200I和V204F。在某些实施方案中,工程化的多肽的氨基酸序列包括与SEQ ID NO:2相比的至少一种以下氨基酸取代组:G145A和I199L;G145A和I225V。
在一些实施方案中,工程化的酮还原酶多肽能够以比参考多肽SEQ IDNO:2大至少5倍的活性氧化异丙醇(IPA)为丙酮,且其中氨基酸序列包括与SEQ ID NO:2相比的至少一种以下取代:A150W、M200I和G190V。
在一些实施方案中,本公开内容的酮还原酶多肽可具有与参考氨基酸序列相比或与SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78或80任一种相比的一种或多种修饰(即,残基差异)。修饰可包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,本公开内容提供改进的酮还原酶多肽,其包括与SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,且包括与SEQ ID NO:2相比选自以下组成的组的至少一种氨基酸取代:位置2的脯氨酸残基被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替;位置28的缬氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替;位置34的丙氨酸残基被选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置47的丙氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替;位置50的谷氨酸残基被选自赖氨酸和精氨酸的碱性氨基酸代替;位置81的天冬氨酸残基被选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置90的丝氨酸残基被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替;位置91的异亮氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替,而在其他方面,位置91的异亮氨酸残基被选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸,或选自赖氨酸和精氨酸的碱性氨基酸代替;位置94的赖氨酸残基以保守改变被另一种碱性氨基酸精氨酸代替;位置112的天冬氨酸残基被选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸代替;位置117的甘氨酸残基被选自天冬氨酸和谷氨酸的酸性氨基酸代替;位置143的丝氨酸残基被选自赖氨酸和精氨酸的碱性氨基酸代替;位置144的缬氨酸残基被半胱氨酸或选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置145的甘氨酸残基以保守或非保守改变,可被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸和甲硫氨酸的非极性氨基酸或选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸的脂肪族氨基酸代替;位置148的精氨酸残基被选自脯氨酸和组氨酸的受限制的氨基酸代替;位置150的丙氨酸残基以保守或非保守改变被选自亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的另一种非极性或脂肪族氨基酸,或选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸,或选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸代替;位置152的苯丙氨酸残基被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸代替;位置153的天冬酰胺残基被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸,或选自组氨酸和脯氨酸的受限制的氨基酸代替;位置158的苏氨酸残基以保守改变被选自天冬酰胺、谷氨酰胺和丝氨酸的另一种极性氨基酸代替;位置190的甘氨酸残基以保守或非保守改变被选自丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸,或选自天冬酰胺、谷氨酰胺和丝氨酸的极性氨基酸,或脯氨酸代替;位置198的丝氨酸残基以保守改变被选自天冬酰胺、谷氨酰胺和苏氨酸的另一种极性氨基酸代替;位置199的异亮氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的另一种脂肪族或非极性氨基酸,或选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置200的甲硫氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸和甘氨酸的另一种非极性氨基酸代替;位置204的缬氨酸以非保守改变被选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸代替;位置217的丙氨酸残基被选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置225的异亮氨酸残基以保守改变被选自缬氨酸、亮氨酸、甘氨酸和甲硫氨酸的另一种非极性氨基酸代替;位置231的脯氨酸残基被选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸代替;位置232的丙氨酸残基以保守改变被选自亮氨酸、异亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的另一种非极性氨基酸代替;位置233的谷氨酸残基被选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置244的天冬氨酸残基被选自丙氨酸、亮氨酸、异亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的非极性氨基酸代替;位置260的苯丙氨酸残基以保守改变被选自酪氨酸和色氨酸的另一种芳香族氨基酸代替;且位置261的丝氨酸残基以保守改变被选自天冬酰胺、谷氨酰胺和苏氨酸的另一种极性氨基酸代替。以上改进的酮还原酶多肽还可包括另外的修饰,包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在某些实施方案中,本公开内容的改进的酮还原酶多肽包括与SEQ IDNO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,并包括与SEQ ID NO:2相比选自以下组成的组的至少一种氨基酸取代:位置2的脯氨酸残基被亮氨酸代替(P2L);位置28的缬氨酸残基被丙氨酸代替(V28A);位置34的丙氨酸残基被丝氨酸代替(A34S);位置47的丙氨酸残基被缬氨酸代替(A47V);位置50的谷氨酸残基被赖氨酸代替(E50K);位置81的天冬氨酸残基被天冬酰胺代替(D81N);位置90的丝氨酸残基被缬氨酸代替(S90V);位置91的异亮氨酸残基被选自亮氨酸(I91L)、色氨酸(I91W)、精氨酸(I91R)和赖氨酸(I91K)的氨基酸代替;位置94的赖氨酸残基被精氨酸代替(K94R);位置112的天冬氨酸残基被酪氨酸代替(D112Y);位置117的甘氨酸残基被天冬氨酸代替(G117D);位置143的丝氨酸残基被精氨酸代替(S143R);位置144的缬氨酸残基被选自半胱氨酸(V144C)和苏氨酸(V144T)的氨基酸代替;位置145的甘氨酸残基被选自丙氨酸(G145A)和缬氨酸(G145V)的氨基酸代替;位置148的精氨酸残基被组氨酸代替(R148H);位置150的丙氨酸残基被选自甘氨酸(A150G)、异亮氨酸(A150I)、丝氨酸(A150S)和色氨酸(A150W)的氨基酸代替;位置152的苯丙氨酸残基被亮氨酸代替(F152L);位置153的天冬酰胺残基被选自甘氨酸(N153G)、缬氨酸(N153V)和组氨酸(N153H)的氨基酸代替;位置158的苏氨酸残基被丝氨酸代替(T158S);位置190的甘氨酸残基被选自丙氨酸(G190A)、脯氨酸(G190P)、谷氨酰胺(G190Q)和缬氨酸(G190V)的氨基酸代替;位置198的丝氨酸残基被天冬酰胺代替(S198N);位置199的异亮氨酸残基被选自甘氨酸(I199G)、甲硫氨酸(I199M)、亮氨酸(I199L)和天冬酰胺(I199N)的氨基酸代替;位置200的甲硫氨酸残基被异亮氨酸代替(M200I);位置204的缬氨酸残基被苯丙氨酸代替(V204F);位置217的丙氨酸残基被苏氨酸代替(A217T);位置225的异亮氨酸残基被缬氨酸代替(I225V);位置231的脯氨酸残基被苯丙氨酸代替(P231F);位置232的丙氨酸残基被缬氨酸代替(A232V);位置233的谷氨酸残基被谷氨酰胺代替(E233Q);位置244的天冬氨酸残基被甘氨酸代替(D244G);位置260的苯丙氨酸残基被酪氨酸代替(F260Y);且位置261的丝氨酸残基被天冬酰胺代替(S261N)。
在某些实施方案中,本公开内容的工程化的酮还原酶多肽包括选自以下组成的组的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78和80。以上改进的酮还原酶多肽还可包括另外的修饰,包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,改进的工程化的酮还原酶可包括天然存在的酮还原酶多肽的缺失以及其他改进的酮还原酶多肽的缺失。在一些实施方案中,本文所述的每种改进的工程化的酮还原酶可包括本文所述的多肽的缺失。因此,对于本公开内容的酮还原酶多肽的每种和每个实施方案,缺失可包括一个或多个氨基酸、2或多个氨基酸、3或多个氨基酸、4或多个氨基酸、5或多个氨基酸、6或多个氨基酸、8或多个氨基酸、10或多个氨基酸、15或多个氨基酸、或20或多个氨基酸、达还原酶多肽的氨基酸总数的10%、达氨基酸总数的10%、达氨基酸总数的20%、或达酮氨基酸总数的30%,只要保留酮还原酶活性的功能活性。在一些实施方案中,缺失可包括1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个氨基酸残基。
如本文所述,本公开内容的酮还原酶多肽可以融合多肽的形式,其中酮还原酶多肽与其他多肽诸如抗体标签(如,myc表位)或纯化序列(如,His标签)融合。因此,酮还原酶多肽可以与其他多肽融合或不与其他多肽融合地使用。
在一些实施方案中,改进的工程化的酮还原酶可包括对天然存在的酮还原酶多肽添加或***氨基酸序列以及对其他改进的酮还原酶多肽添加或***氨基酸序列。在具体实施方案中,本公开内容的酮还原酶多肽可例如,在天然存在的酮还原酶多肽以及本公开内容的改进的酮还原酶多肽的氨基端或羧基端包括1-20、2-15、3-10、4-8、或5-7个另外的氨基酸。对于本公开内容的酮还原酶多肽的每种和每个实施方案,***或添加可包括一个或多个氨基酸、2或多个氨基酸、3或多个氨基酸、4或多个氨基酸、5或多个氨基酸、6或多个氨基酸、8或多个氨基酸、10或多个氨基酸、15或多个氨基酸、或20或多个氨基酸、达酮还原酶多肽的氨基酸总数的10%、达氨基酸总数的10%、达氨基酸总数的20%、或达氨基酸总数的30%,只要保留酮还原酶活性的功能活性。在一些实施方案中,***或添加可包括1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个氨基酸残基。
本文所述的多肽不受限于遗传编码的氨基酸。除了遗传编码的氨基酸以外,本文所述的多肽可以总体上或部分上由天然存在的和/或合成的非编码氨基酸组成。可组成本文所述的多肽的某些常见非编码氨基酸可以包括但不限于:遗传编码的氨基酸的D-对映异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;哌可酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu);高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文所述多肽可包含的另外的非编码氨基酸将对本领域技术人员是明显的(参见,例如,在Fasman,1989,CRC Practical Handbookof Biochemistry and Molecular Biology(CRC生物化学和分子生物学实用手册),CRC Press,Boca Raton,FL,在第3-70页及其中引用的参考文献中提供的多种氨基酸,该文献以及其中所引用的参考文献全部通过引用并入本文)。这些氨基酸可以处于L-构型或D-构型。
本领域技术人员将认识到,带有侧链保护基的氨基酸或残基也可以构成本文所述的多肽。在这种情况下属于芳香族类别的这些受保护的氨基酸的非限制性实例包括(在圆括号中列出保护基)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶亚氧硫基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可构成本文所述多肽的构型上受限制的非编码氨基酸包括但不限于N-甲基氨基酸(L-构型);1-氨基酸环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨酸(hPro);以及1-氨基环戊烷-3-羧酸。
如上所述,被引入天然存在的多肽以产生工程化酮还原酶的各种修饰可以被定向至该酶的具体特性。
5.3编码工程化酮还原酶的多核苷酸
另一方面,本公开内容提供了编码工程化的酮还原酶的多核苷酸。可以将所述多核苷酸可操作地连接至控制基因表达的一种或多种异源调节序列以产生能够表达该多肽的重组多核苷酸。可以将包含编码工程化酮还原酶的异源多核苷酸的表达构建体引入适当的宿主细胞中来表达对应的酮还原酶多肽。
由于对各种氨基酸所对应的密码子的了解,蛋白序列的可用性提供了对能够编码该主题的所有多核苷酸的描述。相同氨基酸由替代的或同义的密码子编码的遗传密码的简并性允许极大数目的核酸被制出,所有这些核酸编码本文所公开的改进的酮还原酶。因此,如果已识别了具体的氨基酸序列,本领域技术人员能够以不改变蛋白的氨基酸序列的方式通过仅仅变更序列的一个或更多个密码子来制出任意数目的不同核酸。在这点上,本公开内容明确涵盖可通过选择基于可能的密码子选择的组合制出的多核苷酸的每一种可能的改变,并且所有这些改变将被认为对本文公开的任何多肽明确地公开,所述本文公开的任何多肽包括在表2中提供的氨基酸序列。
在一些实施方案中,多核苷酸包括编码以下酮还原酶多肽的核苷酸序列,该酮还原酶多肽的氨基酸序列与本文所述的任何一种工程化的酮还原酶多肽,即,包括选自SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78和80组成的组的氨基酸序列的多肽,具有至少约80%或更大序列同一性、至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性、或更大序列同一性。
在多个实施方案中,优选地选择密码子以适合在其中产生蛋白的宿主细胞。例如,在细菌中使用的偏爱密码子用于在细菌中表达基因;在酵母中使用的偏爱密码子用于酵母中的表达;并且在哺乳动物中使用的偏爱密码子用于哺乳动物细胞中的表达。例如,多核苷酸SEQ ID NO:1可被密码子优化以在大肠杆菌中表达,但另外地编码Novosphingobiumaromaticivorans的天然存在的酮还原酶。
在一些实施方案中,不必替换所有密码子来优化酮还原酶的密码子使用,由于天然序列将包括偏爱密码子并且因为偏爱密码子的使用可能并不是所有氨基酸残基所需的。因此,编码酮还原酶的密码子优化的多核苷酸可以在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位置包含偏爱密码子。
在一些实施方案中,编码工程化的酮还原酶的多核苷酸选自SEQ IDNO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77和79。在一些实施方案中,编码工程化的酮还原酶的多核苷酸能够在高度严格条件下与包括SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77和79的多核苷酸杂交。这些多核苷酸编码由表2和表3列出的氨基酸序列代表的一些多肽。
在其他实施方案中,多核苷酸包括编码本文所述的多肽,但在核苷酸水平与编码工程化的酮还原酶的参考多核苷酸具有约80%或更大序列同一性、约85%或更大序列同一性、约90%或更大序列同一性、约95%或更大序列同一性、约98%或更大序列同一性、或99%或更大序列同一性的多核苷酸。在一些实施方案中,参考多核苷酸选自由SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77和79代表的多核苷酸序列。
可以用多种方式操作编码改进的酮还原酶多肽的分离的多核苷酸以提供该多肽的表达。取决于表达载体,所分离的多核苷酸在其***载体中之前的操作可能是令人期望的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域公知的。在Sambrook等人,2001,MolecularCloning:A Laboratory Manual(分子克隆实验室指南),第3版,Cold SpringHarbor Laboratory Press;以及Current Protocols in Molecular Biology(分子生物学最新实验方案),Ausubel.F.编,Greene Pub.Associates,1998,更新至2006中提供了指导。
对于细菌宿主细胞,用于指导本公开内容的核酸构建体转录的适宜启动子包括从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA基因和xylB基因、以及原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl Acad.Sci.USA75:3727-3731)获得的启动子以及tac启动子(DeBoer等人,1983,Proc.Natl Acad.Sci.USA80:21-25)。
对于丝状真菌宿主细胞而言,用于指导本公开内容的核酸构建体转录的适宜启动子包括从米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillusawamori)葡萄糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO96/00787)的基因获得的启动子以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和它们突变的、截短的及杂合的启动子。
在酵母宿主中,有用的启动子可以来自酿酒酵母(Saccharomycescerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)以及酿酒酵母3-磷酸甘油酸酯激酶的基因。Romanos等人,1992,Yeast8:423-488描述了酵母宿主细胞其他有用的启动子。
控制序列也可以是适宜的转录终止子序列,即由宿主细胞识别的终止转录的序列。终止子序列被可操作地连接于编码多肽的核酸序列的3'端。在本发明中可以使用在选择的宿主细胞中有功能的任何终止子。
例如,丝状真菌宿主细胞的示例性转录终止子可以从米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶的基因中获得。
酵母宿主细胞的示例性终止子可以从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因中获得。上述Romanos等人,1992对酵母宿主细胞其他有用的终止子进行了描述。
控制序列也可以是适宜的前导序列,一种对宿主细胞翻译而言重要的mRNA的非翻译区。前导序列被可操作地连接于编码多肽的核酸序列的5'端。可以使用在选择的宿主细胞中有功能的任何前导序列。丝状真菌宿主细胞的示例性前导序列是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因中获得。酵母宿主细胞适宜的前导序列是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因中获得。
控制序列也可以是聚腺苷酸化序列,即可操作地连接于核酸序列的3'端并且当转录时被宿主细胞识别为向转录的mRNA添加聚腺苷残基的信号的序列。在本发明中可以使用在选择的宿主细胞中有功能的任何聚腺苷酸化序列。丝状真菌宿主细胞的示例性聚腺苷酸化序列可以从米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基因中获得。Guo和Sherman,1995,Mol Cell Bio15:5983-5990描述了酵母宿主细胞的有用的聚腺苷酸化序列。
控制序列也可以是编码与多肽的氨基端连接的氨基酸序列并引导该编码多肽进入细胞分泌途径的信号肽编码区。核酸序列的编码序列的5'端可以固有地包含翻译阅读框中与编码分泌的多肽的编码区区段天然连接的信号肽编码区。可选地,编码序列的5'端可以包含对编码序列而言为外来的信号肽编码区。在编码序列天然不包含信号肽编码区时可能需要外来的信号肽编码区。
可选地,外来的信号肽编码区可仅仅代替天然信号肽编码区以增强多肽的分泌。然而,引导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码区可用在本发明中。
细菌宿主细胞有效的信号肽编码区是从芽孢杆菌NClB11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的基因中获得的信号肽编码区。Simonen和Palva,1993,Microbiol Rev57:109-137描述了其他的信号肽。
丝状真菌宿主细胞有效的信号肽编码区可以是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡萄糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶以及柔毛腐质酶(Humicolalanuginosa)脂肪酶的基因中获得的信号肽编码区。
酵母宿主细胞有用的信号肽可以来自酿酒酵母α-因子和酿酒酵母转化酶的基因。上述Romanos等人,1992对其他有用的信号肽编码区进行了描述。
控制序列也可以是编码位于多肽氨基端的氨基酸序列的前肽编码区。生成的多肽被称为酶原(proenzyme)或多肽原(或在某些情况下称为酶原(zymogen))。多肽原一般是无活性的,并且可以通过前肽从多肽原的催化裂解或自身催化裂解转化为成熟的活性多肽。前肽编码区可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthorathermophila)乳糖酶的基因获得(WO95/33836)。
在信号肽和前肽区都存在于多肽的氨基端时,前肽区被定位于紧挨着多肽的氨基端并且信号肽区被定位于紧挨着前肽区的氨基端。
添加调节序列可能也是令人期望的,所述调节序列允许相对于宿主细胞的生长调节多肽的表达。调节***的实例是响应于化学刺激或物理刺激(包括调节化合物的存在)而促使基因的表达被打开或关闭的那些调节***。在原核宿主细胞中,适宜的调节序列包括lac、tac以及trp操纵子***。在酵母宿主细胞中,适宜的调节***包括,例如ADH2***或GAL1***。在丝状真菌中,适宜的调节序列包括TAKAα-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子以及米曲霉葡萄糖淀粉酶启动子。
调节序列的其他实例是那些允许基因扩增的调节序列。在真核***中,这些调节序列包括在甲氨蝶呤的存在下扩增的二氢叶酸还原酶基因和用重金属扩增的金属硫蛋白基因。在这些情况下,编码本发明的KRED多肽的核酸序列将与调节序列可操作地连接。
因此,在另一个实施方案中,本公开内容也涉及重组表达载体,所述重组表达载体包含编码工程化酮还原酶多肽或其变体的多核苷酸以及一个或更多个表达调节区,诸如启动子和终止子、复制起点等等,这取决于表达调节区被引入的宿主的类型。可以将上述多种核酸和控制序列连接在一起产生重组表达载体,所述重组表达载体可以包括一个或更多个便利的限制性位点以允许在这些位点***或取代编码多肽的核酸序列。可选地,本公开内容的核酸序列可以通过将该核酸序列或包含该序列的核酸构建体***用于表达的适当载体中来表达。在表达载体的创建中,编码序列位于载体中以使得该编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是能够便利地进行重组DNA步骤并且能够导致多核苷酸序列表达的任何载体(例如质粒或病毒)。载体的选择将通常取决于载体与该载体要引入的宿主细胞的相容性。载体可以是线性质粒或闭合环状质粒。
表达载体可以是自主复制的载体,即作为染色体外的实体而存在、其复制独立于染色体复制的载体,例如质粒、染色体外的元件、微型染色体或人工染色体。载体可以包含用于确保自我复制的任何手段。可选地,载体可以是在引入宿主细胞中时被整合到基因组并与它所整合的染色体一起复制的载体。此外,可以使用单种载体或质粒,或者一起包含要引入到宿主细胞基因组中的总DNA的两种或更多种载体或质粒,或转座子。
本发明的表达载体优选地包含一种或多种选择性标记,所述选择性标记使得容易选择转化的细胞。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属的耐受性、针对营养缺陷型的原养型等。细菌的选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或是赋予抗生素抗性诸如氨苄西林、卡那霉素、氯霉素或四环素抗性的标记。酵母宿主细胞的适宜标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。
在丝状真菌宿主细胞中使用的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨基甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、cysC(硫酸腺苷酰转移酶)、以及trpC(邻氨基苯甲酸合酶)以及它们的等同物。在曲霉属细胞中使用的实施方案包括构巢曲霉或米曲霉的amdS基因和pyrG基因,以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的表达载体优选地包含允许载体整合到宿主细胞基因组中或允许该载体在细胞中独立于基因组而自主复制的元件。对于整合到宿主细胞基因组中,载体可以依赖于编码多肽的核酸序列或载体的任何其他元件通过同源重组或非同源重组将载体整合到基因组中。
可选地,表达载体可以包含用于指导通过同源重组整合到宿主细胞基因组中的另外的核酸序列。所述另外的核酸序列使载体能够在染色体中的精确位置被整合到宿主细胞基因组中。为了提高在精确位置整合的可能性,整合元件应该优选地包含与对应的靶序列高度同源的数目足够的核酸,诸如100到10,000个碱基对,优选400到10,000个碱基对,以及最优选800到10,000个碱基对,以增强同源重组的机率。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码核酸序列或编码核酸序列。另一方面,可以通过非同源重组将载体整合到宿主细胞的基因组中。
对于自主复制,载体还可以包括使该载体能在要考虑的宿主细胞中自主复制的复制起点。细菌复制起点的实例是允许在大肠杆菌中复制的P15Aori、或质粒pBR322、pUC19、pACYCl77(该质粒具有P15A ori)或质粒pACYC184的复制起点,以及允许在芽孢杆菌中复制的pUB110、pE194、pTA1060或pAMβ1的复制起点。在酵母宿主细胞中使用的复制起点的实例是2微米复制起点ARS1、ARS4,ARS1和CEN3的组合,以及ARS4和CEN6的组合。复制起点可以是具有突变的复制起点,所述突变使其在宿主细胞中以温度敏感的方式起作用(参见,例如Ehrlich,1978,Proc NatlAcad Sci.USA75:1433)。
可以将多于一个拷贝的本发明的核酸序列***宿主细胞中以提高基因产物的生产量。核酸序列拷贝数的增加可以通过如下方式获得:通过将该序列的至少一个另外拷贝整合到宿主细胞基因组中,或者通过使该核酸序列包括可扩增的选择性标记基因,其中可以通过在适当选择剂的存在下培养细胞来选择包含该选择性标记基因的扩增拷贝和由此包含该核酸序列的另外拷贝的细胞。
在本发明中使用的许多表达载体可商购获得。适宜的商业表达载体包括来自Sigma-Aldrich Chemicals,St.Louis MO.的p3xFLAGTMTM表达载体,它包括用于在哺乳动物宿主细胞中表达的CMV启动子和hGH多腺苷酸化位点以及用于在大肠杆菌中扩增的pBR322复制起点和氨苄西林抗性标记。其他适宜的表达载体是可以从Stratagene,LaJolla CA商购获得的pBluescriptII SK(-)和pBK-CMV,以及源自于pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)或pPoly(Lathe等人,1987,Gene57:193-201)的质粒。
5.4用于表达酮还原酶多肽的宿主细胞
另一方面,本公开内容提供了包含编码本公开内容的改进酮还原酶多肽的多核苷酸的宿主细胞,该多核苷酸与用于在该宿主细胞中表达酮还原酶的一个或更多个控制序列可操作地连接。在由本发明的表达载体所编码的KRED多肽的表达中使用的宿主细胞是本领域公知的并且包括但不限于:细菌细胞,诸如大肠杆菌、乳杆菌属、链霉菌属和鼠伤寒沙门氏菌(Salmonella typhimurium)的细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC获取号201178));昆虫细胞诸如果蝇S2细胞和夜蛾(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、293和Bowes黑色素瘤细胞;以及植物细胞。用于上述宿主细胞的适当培养基和生长条件是本领域公知的。因此,在一些实施方案中,本文公开的工程化的酮还原酶多肽可通过标准方法制备,包括培养包含含编码多肽的多核苷酸的适当表达载体的宿主细胞。
可以通过本领域已知的多种方法将用于表达酮还原酶的多核苷酸引入细胞中。技术包括但不限于电穿孔、生物射弹粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。用于将多核苷酸引入细胞中的多种方法将对技术人员是明显的。
示例性宿主细胞是大肠杆菌W3110。另一种示例性宿主细胞是大肠杆菌BL21。通过将编码改进的酮还原酶的多核苷酸可操作地连入质粒pCK110900(参见,美国申请公布20040137585)而产生表达载体,该多核苷酸与在lacI阻抑物的控制下的lac启动子可操作地连接。该表达载体还包含P15a复制起点和氯霉素抗性基因。通过对在大肠杆菌W3110或BL21中包含主题多核苷酸的细胞进行氯霉素选择来分离这些细胞。
5.5产生工程化的酮还原酶多肽的方法
在一些实施方案中,为了制备本公开内容的改进的KRED多核苷酸和多肽,从Novosphingobium aromaticivorans获得(或衍生)催化还原反应的天然存在的酮还原酶。在一些实施方案中,母体多核苷酸序列被密码子优化以增强酮还原酶在指定宿主细胞中的表达。作为例证,编码Novosphingobium aromaticivorans野生型KRED多肽的亲本多核苷酸序列(SEQ ID NO:1),可基于该序列从寡核苷酸组装,或从包含密码子优化的编码序列的寡核苷酸组装以在指定宿主细胞如大肠杆菌宿主细胞中表达。在一个实施方案中,多核苷酸可被克隆到表达载体中,放置酮还原酶基因的表达在lac启动子和lacI阻遏基因的控制下。可鉴定在大肠杆菌中表达活性酮还原酶的克隆,对基因测序以证实其身份。
如上所述,通过使编码天然存在的酮还原酶的多核苷酸经历诱变和/或定向进化方法,可以获得工程化酮还原酶。示例性定向进化技术是如在Stemmer,1994,Proc Natl Acad Sci USA91:10747-10751;WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;WO01/75767和美国专利6,537,746中所述的诱变和/或DNA改组。其他可以使用的定向进化方案包括但不限于:交错延伸过程(StEP)、体外重组(Zhao等人,1998,Nat.Biotechnol.16:258-261)、诱变PCR(Caldwell等人,1994,PCR Methods Appl.3:S136-S140)和盒式诱变(Black等人,1996,Proc Natl Acad Sci USA93:3525-3529)。
筛选按照诱变处理获得的克隆中具有期望的改进的酶特性的工程化的酮还原酶。测量表达文库的酶活性可利用监测NADH或NADPH浓度因为被转化为NAD+或NADP+而降低的比率(由吸光度或荧光的降低)的标准生化技术进行。在这一反应中,随着酮还原酶还原酮底物为相应的羟基,NADH或NADPH被酮还原酶消耗(氧化)。由吸光度或荧光降低测量的每单位时间NADH或NADPH浓度的降低率,指示在固定量的裂解物(或由其制成的冻干粉末)中KRED多肽的相对(酶)活性。在期望的改进酶特性是热稳定性的情况下,可以在使酶制品经历限定的温度并测量热处理后剩余的酶活性的量之后测量酶活性。然后对包含编码酮还原酶的多核苷酸的克隆进行分离,测序,以识别核苷酸序列的改变(如果有的话),并将这些克隆用于在宿主细胞中表达酶。
在工程化多肽的序列为已知的情况下,可以根据已知的合成方法通过标准固相方法制备编码酶的多核苷酸。在一些实施方案中,高达大约100个碱基的片段能够单独合成,然后连接(例如,通过酶连接或化学连接方法或聚合酶介导的方法)形成任何期望的连续序列。例如,可以使用例如由Beaucage等人,1981,Tet Lett22:1859-69所描述的经典亚磷酰胺方法或由Matthes等人,1984,EMBO J.3:801-05所描述的方法(例如,像它通常在自动化合成方法中实施的那样)通过化学合成来制备本发明的多核苷酸和寡核苷酸。根据亚磷酰胺方法,例如在自动化DNA合成器中合成寡核苷酸,纯化,退火,连接并克隆在适当载体中。此外,基本上任何核酸都可以从各种商业来源中的任何一种获得,诸如The Midland CertifiedReagent Company,Midland,TX、The Great American Gene Company,Ramona,CA、ExpressGen Inc.Chicago,IL、Operon Technologies Inc.,Alameda,CA以及许多其他来源。
在宿主细胞中表达的工程化酮还原酶可以使用任何一种或多种公知的蛋白质纯化技术从这些细胞中和或培养基中回收,所述公知的蛋白质纯化技术包括但不限于溶菌酶处理、超声处理、过滤、盐析、超离心和色谱。用于裂解和从细菌诸如大肠杆菌中高效提取蛋白的适宜溶液是从St.LouisMO的Sigma-Aldrich以商标名CelLytic BTM可商业途径获得的。因此,在一些实施方案中,本文公开的工程化的酮还原酶多肽可由标准方法制备,包括培养包括含编码多肽的多核苷酸的适当表达载体的宿主细胞,并从宿主细胞分离多肽。
用于分离酮还原酶多肽的色谱技术包括但不限于反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件将部分取决于如下因素:诸如净电荷、疏水性、亲水性、分子量、分子形状等等,并且将对本领域技术人员是明显的。
在一些实施方案中,亲和技术可以用于分离改进的酮还原酶。对于亲和色谱纯化,可以使用特异性结合酮还原酶多肽的任何抗体。对于抗体的产生,可以通过用本公开内容的多肽注射来免疫多种宿主动物,包括但不限于兔、小鼠、大鼠等等。可以将该多肽与适宜载体(诸如BSA)通过侧链官能基团或与侧链官能基团相连的连接物相连。多种佐剂可根据宿主物种用于提高免疫应答,包括但不限于弗氏(完全或不完全)佐剂,矿物凝胶诸如氢氧化铝,表面活性物质诸如溶血卵磷脂,多聚醇,聚阴离子,肽,油乳剂,匙孔血蓝蛋白,二硝基苯酚,以及可能有用的人佐剂诸如BCG(卡介苗)和短小棒状杆菌(Corynebacterium parvum)。
5.6利用工程化酮还原酶的方法和以此制备的化合物
本文所述的酮还原酶可催化式(I)化合物N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮(“底物”)(如化合物(1),其中保护基是BOC部分)对映体特异性(enantiospecific)还原为相应的式(II)化合物立体异构醇产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇(“产物”)(如化合物(2)),如方案1所示(参见以上)。
在一些实施方案中,本发明提供在N-保护的(R)-3-氨基-1-氯-4-苯基丁-2-酮化合物与N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮的混合物中立体特异性地富集N-保护的(R)-3-氨基-1-氯-4-苯基丁-2-酮化合物的方法,该方法通过在适于产生手性醇产物N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇的反应条件下将混合物与本文公开的酮还原酶多肽接触或培养,而还原混合物中N-保护的(S)-3-氨基-1-氯-4-苯基丁-2-酮化合物,如方案5的反应所示(参见以上)。因此,在一些实施方案中,具有改进的立体特异性(与SEQID NO:2相比)的本公开内容的酮还原酶多肽可用于拆分手性α-氯代酮化合物的混合物。
在该方法的一些实施方案中,当以大于或等于200g/L底物和少于或等于2g/L酮还原酶(但多于0g/L酶)进行该方法时,在少于24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8或7小时内至少约45%的外消旋底物混合物被还原为产物。
利用本文公开的酮还原酶转化式(I)化合物为手性氯代醇式(II)化合物的方法表现比已知方法的实质改进,部分是因为所得的高产率(如,在少于24小时内转化率>80%或更大)、高纯度(如,>99%d.e.)和有利的溶剂***,这允许制备式(II)化合物并利用其作为随后反应的反应物的“压缩(telescoped)”反应。
在该方法的一些实施方案中,产物具有大于约90%、95%、97%、98%、99%或甚至更大非对映体过量的N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇。
在该方法的一些实施方案中,当以大于约100g/L底物和少于约5g/L多肽进行该方法时,在少于约24小时内约95%的底物被转化为产物。
在该方法的一些实施方案中,在少于约24小时、20小时、12小时、8小时、或甚至更短时间内至少约90%、95%、97%、98%或更多式(I)化合物被转化为式(II)化合物。
在该方法的一些实施方案中,在少于约24小时内至少约95%的式(I)化合物被转化为式(II)化合物,其中式(I)化合物浓度是至少约150g/L且多肽浓度是少于约1g/L。
在某些实施方案中,本公开内容还提供制备式(III)化合物环氧化物的方法,该方法按照以上所示的方案3和4,通过利用本公开内容的酮还原酶转化式(I)化合物为式(II)化合物手性氯代醇(如,化合物(2)),然后环化式(II)化合物为式(III)化合物环氧化物(如,化合物(3))。这一转化可通过如下非常有效地进行:用适当溶剂(如,MTBE)萃取含式(II)化合物的粗制酶促反应混合物,并将这一萃取物与适当的碱(如,KOH)接触。
在本文提供的方法的某些实施方案中,碱选自氢氧化钾(KOH)、叔丁醇钾、碳酸钾和三乙胺。
在某些实施方案中,化合物(3)的制备可如下进行:通过将MTBE中的0.3M化合物(2)(如,酮还原酶反应混合物的粗制萃取物)与MTBE溶液中的0.6M KOH(或其他适当的碱)反应。这一反应在5小时内达到>99%转化为化合物(3)环氧化物,在8小时内达到99.9%转化(由HPLC确定)。
在某些实施方案中,制备本公开内容的式(III)化合物的方法包括以下步骤:用有机溶剂萃取酶反应混合物,并将有机溶剂萃取物与碱接触。在某些实施方案中,进行该方法,其中进行将式(II)化合物与碱接触的所述步骤而不首先纯化和/或分离式(II)化合物(如,“压缩(telescoped)”反应或“一锅法(one-pot)”反应)。
因此,在一些实施方案中,本公开内容提供制备式(III)化合物(如,化合物(3))的方法,包括利用本公开内容的酮还原酶转化式(I)化合物为式(II)化合物(如,化合物(2))的步骤。在制备式(III)化合物的一些实施方案中,该方法还包括将式(II)化合物与碱接触的步骤。在某些实施方案中,进行该方法,其中进行将式(II)化合物与碱接触的所述步骤而不首先纯化和/或分离式(II)化合物。
在某些实施方案中,该方法还包括用结晶溶剂交换(或更换)有机溶剂萃取物的有机溶剂,并从结晶溶剂结晶式(III)化合物。在某些实施方案中,有机溶剂萃取物是MTBE,其被交换为结晶溶剂庚烷。
根据本文提供的方法,可用于萃取和结晶的其他有机溶剂是本领域已知和本领域技术人员可获取的有机溶剂,包括公知的烃类、醚类、酯类和醇类,如,乙腈、正丁醇、甲苯、乙酸异丙酯。
如上所述,本文所述的任何酮还原酶多肽,包括表2中举例的那些,可用在该方法中。而且,在一些实施方案中,该方法可使用酮还原酶多肽,该酮还原酶多肽包括与SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同的氨基酸序列,还包括与SEQ ID NO:2相比选自以下组成的组的至少一种氨基酸取代:位置2的脯氨酸残基被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替;位置28的缬氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替;位置34的丙氨酸残基被选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置47的丙氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替;位置50的谷氨酸残基被选自赖氨酸和精氨酸的碱性氨基酸代替;位置81的天冬氨酸残基被选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置90的丝氨酸残基被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替;位置91的异亮氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的脂肪族或非极性氨基酸代替,而在其他方面,位置91的异亮氨酸残基被选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸,或选自赖氨酸和精氨酸的碱性氨基酸代替;位置94的赖氨酸残基以保守改变被另一种碱性氨基酸精氨酸代替;位置112的天冬氨酸残基被选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸代替;位置117的甘氨酸残基被选自天冬氨酸和谷氨酸的酸性氨基酸代替;位置143的丝氨酸残基被选自赖氨酸和精氨酸的碱性氨基酸代替;位置144的缬氨酸残基被半胱氨酸或选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置145的甘氨酸残基以保守或非保守改变,可被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸和甲硫氨酸的非极性氨基酸,或选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸的脂肪族氨基酸代替;位置148的精氨酸残基被选自脯氨酸和组氨酸的受限制的氨基酸代替;位置150的丙氨酸残基以保守或非保守改变被选自亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的另一种非极性或脂肪族氨基酸,或选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸,或选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸代替;位置152的苯丙氨酸残基被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸代替;位置153的天冬酰胺残基被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸,或选自组氨酸和脯氨酸的受限制的氨基酸代替;位置158的苏氨酸残基以保守改变被选自天冬酰胺、谷氨酰胺和丝氨酸的另一种极性氨基酸代替;位置190的甘氨酸残基以保守或非保守改变被选自丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甘氨酸和甲硫氨酸的非极性或脂肪族氨基酸,或选自天冬酰胺、谷氨酰胺和丝氨酸的极性氨基酸,或脯氨酸代替;位置198的丝氨酸残基以保守改变被选自天冬酰胺、谷氨酰胺和苏氨酸的另一种极性氨基酸代替;位置199的异亮氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的另一种脂肪族或非极性氨基酸,或选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置200的甲硫氨酸残基以保守改变被选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸和甘氨酸的另一种非极性氨基酸代替;位置204的缬氨酸以非保守改变被选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸代替;位置217的丙氨酸残基被选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置225的异亮氨酸残基以保守改变被选自缬氨酸、亮氨酸、甘氨酸和甲硫氨酸的另一种非极性氨基酸代替;位置231的脯氨酸残基被选自酪氨酸、色氨酸和苯丙氨酸的芳香族氨基酸代替;位置232的丙氨酸残基以保守改变被选自亮氨酸、异亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的另一种非极性氨基酸代替;位置233的谷氨酸残基被选自天冬酰胺、谷氨酰胺、丝氨酸和苏氨酸的极性氨基酸代替;位置244的天冬氨酸残基被选自丙氨酸、亮氨酸、异亮氨酸、缬氨酸、甘氨酸和甲硫氨酸的非极性氨基酸代替;位置260的苯丙氨酸残基以保守改变被选自酪氨酸和色氨酸的另一种芳香族氨基酸代替;且位置261的丝氨酸残基以保守改变被选自天冬酰胺、谷氨酰胺和苏氨酸的另一种极性氨基酸代替。以上改进的酮还原酶多肽还可包括另外的修饰,包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,该方法可使用本公开内容的改进的酮还原酶多肽,其包括与SEQ ID NO:2至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同的氨基酸序列,还包括与SEQ ID NO:2相比选自以下组成的组的至少一种氨基酸取代:位置2的脯氨酸残基被亮氨酸代替(P2L);位置28的缬氨酸残基被丙氨酸代替(V28A);位置34的丙氨酸残基被丝氨酸代替(A34S);位置47的丙氨酸残基被缬氨酸代替(A47V);位置50的谷氨酸残基被赖氨酸代替(E50K);位置81的天冬氨酸残基被天冬酰胺代替(D81N);位置90的丝氨酸残基被缬氨酸代替(S90V);位置91的异亮氨酸残基被选自亮氨酸(I91L)、色氨酸(I91W)、精氨酸(I91R)和赖氨酸(I91K)的氨基酸代替;位置94的赖氨酸残基被精氨酸代替(K94R);位置112的天冬氨酸残基被酪氨酸代替(D112Y);位置117的甘氨酸残基被天冬氨酸代替(G117D);位置143的丝氨酸残基被精氨酸代替(S143R);位置144的缬氨酸残基被选自半胱氨酸(V144C)和苏氨酸(V144T)的氨基酸代替;位置145的甘氨酸残基被选自丙氨酸(G145A)和缬氨酸(G145V)的氨基酸代替;位置148的精氨酸残基被组氨酸代替(R148H);位置150的丙氨酸残基被选自甘氨酸(A150G)、异亮氨酸(A150I)、丝氨酸(A150S)和色氨酸(A150W)的氨基酸代替;位置152的苯丙氨酸残基被亮氨酸代替(F152L);位置153的天冬酰胺残基被选自甘氨酸(N153G)、缬氨酸(N153V)和组氨酸(N153H)的氨基酸代替;位置158的苏氨酸残基被丝氨酸代替(T158S);位置190的甘氨酸残基被选自丙氨酸(G190A)、脯氨酸(G190P)、谷氨酰胺(G190Q)和缬氨酸(G190V)的氨基酸代替;位置198的丝氨酸残基被天冬酰胺代替(S198N);位置199的异亮氨酸残基被选自甘氨酸(I199G)、甲硫氨酸(I199M)、亮氨酸(I199L)和天冬酰胺(I199N)的氨基酸代替;位置200的甲硫氨酸残基被异亮氨酸代替(M200I);位置204的缬氨酸残基被苯丙氨酸代替(V204F);位置217的丙氨酸残基被苏氨酸代替(A217T);位置225的异亮氨酸残基被缬氨酸代替(I225V);位置231的脯氨酸残基被苯丙氨酸代替(P231F);位置232的丙氨酸残基被缬氨酸代替(A232V);位置233的谷氨酸残基被谷氨酰胺代替(E233Q);位置244的天冬氨酸残基被甘氨酸代替(D244G);位置260的苯丙氨酸残基被酪氨酸代替(F260Y);且位置261的丝氨酸残基被天冬酰胺代替(S261N)。在某些实施方案中,本公开内容的酮还原酶多肽包括选自以下组成的组的氨基酸序列:SEQ IDNO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、65、66、68、70、72、74、76、78和80。以上改进的酮还原酶多肽还可包括另外的修饰,包括取代、缺失、***、或其组合。取代可以是非保守取代、保守取代、或非保守取代和保守取代的组合。在一些实施方案中,这些酮还原酶多肽可在其他氨基酸残基处任选地具有从约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个突变。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,本公开内容的方法使用包括选自以下组成的组的氨基酸序列的酮还原酶:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、65、66、68、70、72、74、76、78、80和其组合。示例性的包括序列组合的组包括:SEQ ID NO4、6、14、16、18、22、24、26、28、30、32、34、36、38、40、50、52、54和56组成的组;SEQ ID NO6、18、22、30、38、40、50、52、54和56组成的组;和SEQ ID NO6、50、52和56组成的组。
在该方法的一些实施方案中,产物具有大于约90%、95%、97%、98%、99%、或甚至更大非对映体过量的N-保护的(2R,3S)-3-氨基-1-氯-4-苯基丁-2-醇,其中酮还原酶多肽包括对应于SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56和58的氨基酸序列。
在该方法的一些实施方案中,当该方法以大于或等于200g/L底物和少于或等于2g/L酮还原酶(但多于0g/L酶)进行时,在少于24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、或7小时内至少约45%的外消旋底物混合物被还原为产物,其中酮还原酶多肽包括对应于SEQ ID NO:6、50、52和56的氨基酸序列。
如本领域技术人员已知的,酮还原酶-催化的还原反应通常需要辅因子。本文所述的工程化的酮还原酶催化的还原反应通常也需要辅因子,但工程化的酮还原酶的许多实施方案比用野生型酮还原酶催化的反应需要的辅因子少得多。本文所用的术语“辅因子”是指联合酮还原酶起作用的非蛋白化合物。适于用于本文所述的工程化的酮还原酶的辅因子包括但不限于,NADP+(烟酰胺腺嘌呤二核苷酸磷酸)、NADPH(NADP+的还原形式)、NAD+(烟酰胺腺嘌呤二核苷酸)和NADH(NAD+的还原形式)。通常,将辅因子的还原形式加到反应混合物。还原的NAD(P)H形式任选地可利用辅因子再生***从氧化的NAD(P)+形式再生。
术语“辅因子再生***”是指参加将氧化型的辅因子还原(例如NADP+至NADPH)的反应的一组反应物。被酮还原酶催化的酮底物还原所氧化的辅因子被辅因子再生***再生为还原型。辅因子再生***包括化学计量还原剂,其为还原氢等价物的来源并且能够将辅因子的氧化型还原。辅因子再生***还可包括催化剂,例如催化还原剂对辅因子氧化型的还原的酶。用于从NAD+或NADP+分别再生NADH或NADPH的辅因子再生***是本领域已知的并且可被用于本文所述的方法。
可被使用的适合的示例性辅因子再生***包括但不限于葡萄糖和葡萄糖脱氢酶、甲酸和甲酸脱氢酶、葡萄糖-6-磷酸和葡萄糖-6-磷酸脱氢酶、仲醇(例如异丙醇)和仲醇脱氢酶、亚磷酸盐和亚磷酸盐脱氢酶、分子氢和氢化酶以及诸如此类。这些***可与NADP+/NADPH或NAD+/NADH辅因子共同使用。使用氢化酶的电化学再生还可被用作辅因子再生***。参见例如美国专利第5,538,867和6,495,023号,其二者都通过引用被并入本文。包括金属催化剂和还原剂(例如分子氢或甲酸盐)的化学辅因子再生***也是适合的。参见例如PCT公布WO2000/053731,其通过引用被并入本文。
术语“葡萄糖脱氢酶”和“GDH”在本文中被互换地使用以指NAD+或NADP+依赖性酶,所述酶催化D-葡萄糖和NAD+或NADP+分别向葡萄糖酸和NADH或NADPH的转化。下面的反应式(1)描述葡萄糖脱氢酶催化的葡萄糖对NAD+或NADP+的还原。
适合用于本文所述方法的实践的葡萄糖脱氢酶包括天然存在的葡萄糖脱氢酶以及非天然存在的葡萄糖脱氢酶二者。编码天然存在的葡萄糖脱氢酶的基因已在文献中报道。例如,枯草芽孢杆菌61297GDH基因被表达在大肠杆菌中,并且据报道其展示了与在其天然宿主中所产生的酶相同的物理化学性质(Vasantha等,1983,Proc.Natl.Acad.Sci.USA80:785)。对应于Genbank登录号M12276的枯草芽孢杆菌GDH基因的基因序列被报道在Lampel等,1986,J.Bacteriol.166:238-243中,而且其作为Genbank登录号D50453以修正形式被报道在Yamane等,1996,Microbiology142:3047-3056中。天然存在的GDH基因还包括编码蜡样芽孢杆菌(B.cereus)ATCC14579(Nature,2003,423:87-91;Genbank登录号AE017013)和巨大芽孢杆菌(B.megaterium)(Eur.J.Biochem.,1988,174:485-490,Genbank登录号X12370;J.Ferment.Bioeng.,1990,70:363-369,Genbank登录号GI216270)中GDH的那些。来自芽孢杆菌属的葡萄糖脱氢酶作为SEQID NO:10和12(分别由对应于该PCT公布中的SEQ ID NO:9和11的多核苷酸序列所编码)被提供在PCT公布WO2005/018579中,其公开通过引用被并入本文。
可使用已知方法例如诱变、定向进化以及诸如此类来产生非天然存在的葡萄糖脱氢酶。可使用PCT公布WO2005/018579中实施例4所描述的测定容易地鉴定具有适当活性的GDH酶,不论它是天然存在的还是非天然存在的,其公开通过引用被并入本文。示例性的非天然存在的葡萄糖脱氢酶作为SEQ ID NO:62、64、66、68、122、124和126被提供在PCT公布WO2005/018579中。编码它们的多核苷酸序列分别作为SEQ ID NO:61、63、65、67、121、123和125被提供在PCT公布WO2005/018579中。所有这些序列通过引用被并入本文。适合用于本文所公开的酮还原酶催化的还原反应的另外的非天然存在的葡萄糖脱氢酶被提供在美国申请公布第2005/0095619和2005/0153417号中,其公开通过引用被并入本文。
本文所述的酮还原酶催化的还原反应中使用的葡萄糖脱氢酶可在PCT公布WO2005/018579的实施例4中所述的测定中展示至少约10μmol/min/mg而且有时候至少约102μmol/min/mg或约103μmol/min/mg、高达约104μmol/min/mg或更高的活性。
本文所述的酮还原酶催化的还原反应通常在溶剂中进行。适合的溶剂包括水、有机溶剂(例如乙酸乙酯、乙酸丁酯、2-丙醇(异丙醇或IPA)、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯以及诸如此类)、离子液体(例如1-乙基4-甲基咪唑四氟硼酸盐、1-丁基-3-甲基咪唑四氟硼酸盐、1-丁基-3-甲基咪唑六氟磷酸盐以及诸如此类)。在一些实施方案中,使用含水溶剂,其包括水和含水共溶剂***。
示例性的含水共溶剂***具有水、pH缓冲盐和一种或多种有机溶剂。通常,选择含水共溶剂***的有机溶剂组分以便它不完全地使酮还原酶失活。可利用酶活性测定例如本文所述的那些,通过用候选溶剂***中感兴趣的确定底物来测量指定的工程化的酮还原酶的酶活性来容易地鉴定适当的共溶剂***。
含水共溶剂***的有机溶剂组分可与含水组分混溶以提供单液相,或者可与含水组分部分混溶或不可混溶以提供两个液相。通常,当使用含水共溶剂***时,它被选择为双相性的,水被分散在有机溶剂中或者相反。通常,当使用含水共溶剂***时,期望选择可从水相容易地分离的有机溶剂。通常,共溶剂***中水和有机溶剂的比例通常是在有机溶剂对水约90:10至约10:90(v/v),以及有机溶剂对水约80:20至约20:80(v/v)的范围内。可在加入反应混合物之前预先形成共溶剂***,或者可将其在反应容器中就地(in situ)形成。在某些实施方案中,含水共溶剂***包括约5%-40%(v/v)、约5%-20%(v/v)、约10-20%(v/v)、约15%(v/v)或约10%(v/v)的异丙醇(IPA)。
含水溶剂(水或含水共溶剂***)可以是pH缓冲的或未缓冲的。一般地,可在约10或以下,通常在约5至约10的范围内的pH进行还原。在一些实施方案中,在约9.5或以下,通常在约6.5至约9.5的范围内的pH进行还原。还原可在约7.0至约9.5的pH进行。在某些实施方案中,在约8.5至约9.5的pH进行还原。在具体实施方案中,在约9.0的pH进行还原。可选地,可在中性pH即约7进行还原。
在其中使用含水共溶剂的某些实施方案中,还原的反应条件可包括pH约8.5至约9.5和约5%至约40%IPA、约pH9.0至9.5和约25%至约40%IPA、约pH8.5至9.5和约5%至约15%IPA、或约pH9.0和约10%IPA。在某些实施方案中,还原的反应条件可包括pH约6.5至约7.0和约5%至约15%IPA、或约pH7.0和约5%至10%IPA。
在还原反应的过程中,反应混合物的pH(如,含水共溶剂溶液)可改变。可在反应过程中通过加入酸或碱而将反应混合物的pH维持在期望的pH或在期望的pH范围内。可选地,可使用含有缓冲液的含水溶剂来控制pH。维持期望pH范围的适合的缓冲液是本领域已知的并且包括例如磷酸盐缓冲液、三乙醇胺缓冲液(TEA)以及诸如此类。还可使用缓冲和酸或碱添加的组合。因此,在某些实施方案中,具有在以上指定的某些范围中的pH和有机溶剂(如,IPA)的含水共溶剂,还可包括缓冲液诸如TEA。
当使用葡萄糖/葡萄糖脱氢酶辅因子再生***时,如果所得的葡萄糖酸水溶液不被另外中和,那么反应式(1)中所表示的葡萄糖酸(pKa=3.6)的共同产生导致反应混合物的pH下降。可通过标准的缓冲技术(其中所述缓冲液将高达所提供的缓冲能力的葡萄糖酸中和),或者通过与转化过程同时发生的碱的加入而将反应混合物的pH维持在期望水平。还可使用缓冲和碱添加的组合。上面描述了维持期望pH范围的适合的缓冲液。用于葡萄糖酸中和的适合的碱是有机碱例如胺、醇化物和诸如此类,以及无机碱例如氢氧化物盐(例如NaOH)、碳酸盐(例如NaHCO3)、碳酸氢盐(例如K2CO3)、碱式磷酸盐(例如K2HPO4、Na3PO4)以及诸如此类。可以在监测反应混合物pH时手动地,或者更方便地通过使用被用作pH恒定器的自动滴定器来完成与转化过程同时发生的碱的加入。还可将部分缓冲能力和碱添加的组合用于过程控制。
当碱添加被用来中和在酮还原酶催化的还原反应过程中释放的葡萄糖酸时,可通过被添加以维持pH的碱的量来监测转化过程。通常,在还原过程中被加入未缓冲的或部分缓冲的反应混合物的碱以水溶液被加入。
在一些实施方案中,辅因子再生***可包括甲酸脱氢酶。术语“甲酸脱氢酶”和“FDH”在本文中被互换地使用以指NAD+或NADP+依赖性酶,所述酶催化甲酸和NAD+或NADP+分别向二氧化碳和NADH或NADPH的转化。适合在本文所述的酮还原酶催化的还原反应中用作辅因子再生***的甲酸脱氢酶包括天然存在的甲酸脱氢酶以及非天然存在的甲酸脱氢酶二者。甲酸脱氢酶包括对应于PCT公布WO2005/018579中SEQ ID NO:70(假单胞菌属)和72(博伊丁念珠菌Candida boidinii)的那些,其被分别对应于PCT公布2005/018579中SEQ ID NO:69和71的多核苷酸序列所编码,其公开通过引用被并入本文。用于本文所述方法的甲酸脱氢酶(不论是天然存在的还是非天然存在的)可展示至少约1μmol/min/mg、有时候至少约10μmol/min/mg或至少约102μmol/min/mg、高达约103μmol/min/mg或更高的活性,并且可在PCT公布WO2005/018579的实施例4中所述的测定中容易地筛选活性。
如本文所用,术语“甲酸(formate)”是指甲酸阴离子(HCO2 -)、甲酸(HCO2H)及其混合物。可以以盐(通常为碱金属的盐(alkali salt)或铵盐(例如HCO2Na、KHCO2NH4以及诸如此类))、甲酸(通常为甲酸水溶液)或其混合物的形式提供甲酸。甲酸是温和酸。在它的pKa(水中pKa=3.7)的几个pH单位以内的水溶液中,甲酸以平衡浓度的HCO2 -和HCO2H二者存在。在高于约pH4的pH值下,甲酸主要以HCO2 -存在。当以甲酸(formicacid)的形式提供甲酸(formate)时,通常通过加入碱而对反应混合物进行缓冲或使其酸性减少以提供期望的pH,其通常为约pH5或以上。适用于中和甲酸的碱包括但不限于有机碱例如胺、醇化物和诸如此类,以及无机碱例如氢氧化物盐(例如NaOH)、碳酸盐(例如NaHCO3)、碳酸氢盐(例如K2CO3)、碱式磷酸盐(例如K2HPO4、Na3PO4)以及诸如此类。
对于高于约pH5的pH值(在此条件下甲酸主要以HCO2 -存在),下面的反应式(2)描述甲酸脱氢酶催化的甲酸对NAD+或NADP+的还原。
当使用甲酸和甲酸脱氢酶作为辅因子再生***时,可通过标准的缓冲技术(其中所述缓冲液释放高达所提供的缓冲能力的质子),或者通过与转化过程同时发生的酸的加入而将反应混合物的pH维持在期望水平。在反应过程中被加入以维持pH的适合的酸包括有机酸例如羧酸、磺酸、膦酸和诸如此类,无机酸例如氢卤酸(例如盐酸)、硫酸、磷酸和诸如此类,酸式盐例如磷酸二氢盐(例如KH2PO4)、硫酸氢盐(例如NaHSO4)和诸如此类。一些实施方案利用甲酸(formic acid),从而甲酸(formate)浓度和溶液pH二者都得以维持。
当利用酸添加来维持使用甲酸/甲酸脱氢酶辅因子再生***的还原反应中的pH时,可通过被添加以维持pH的酸的量来监测转化过程。通常,在转化过程中被加入未缓冲的或部分缓冲的反应混合物的酸以水溶液被加入。
术语“仲醇脱氢酶”和“sADH”在本文中被互换地使用以指NAD+或NADP+依赖性酶,所述酶催化仲醇和NAD+或NADP+分别向酮和NADH或NADPH的转化。下面的反应式(3)描述仲醇(用异丙醇进行说明)对NAD+或NADP+的还原。
适合用作本文所述酮还原酶催化的还原反应中辅因子再生***的仲醇脱氢酶包括天然存在的仲醇脱氢酶以及非天然存在的仲醇脱氢酶二者。天然存在的仲醇脱氢酶包括来自布氏热厌氧菌(Thermoanaerobiumbrockii)、红串红球菌、高加索酸奶乳杆菌(Lactobacillus kefiri)、短乳杆菌(Lactobacillus brevis)、微小乳杆菌(Lactobacillus minor)、Novosphingobium aromaticivorans的已知的醇脱氢酶,而非天然存在的仲醇脱氢酶包括从其衍生的工程化的醇脱氢酶。用于本文所述方法的仲醇脱氢酶(不论是天然存在的还是非天然存在的)可展示至少约1μmol/min/mg、有时候至少约10μmol/min/mg或至少约102μmol/min/mg、高达约103μmol/min/mg或更高的活性。
适合的仲醇包括低级仲链烷醇和芳基-烷基甲醇。低级仲醇的实例包括异丙醇、2-丁醇、3-甲基-2-丁醇、2-戊醇、3-戊醇、3,3-二甲基-2-丁醇以及诸如此类。在一个实施方案中,仲醇是异丙醇。适合的芳基-烷基甲醇包括未取代的和取代的1-芳基乙醇。
当仲醇和仲醇脱氢酶被用作辅因子再生***时,所得的NAD+或NADP+被仲醇的偶合氧化所还原,其中所述偶合氧化是仲醇脱氢酶将仲醇氧化为酮。一些工程化的酮还原酶还具有对仲醇还原剂脱氢的活性。在一些将仲醇用作还原剂的实施方案中,工程化的酮还原酶和仲醇脱氢酶是同一种酶。因此,在某些实施方案中,本公开内容的反应如以下方案6和7描绘的:
方案6
方案7
在利用辅因子再生***进行本文所述的酮还原酶-催化的还原反应的实施方案时,如方案6和7所示的,反应可在低压和/或高温下进行以实现去除丙-2-酮产物。这种实施方案还可包括随着反应进行,添加异丙醇,如,通过持续供料或批次添加。
在进行利用辅因子再生***的本文所述酮还原酶催化的还原反应的实施方案中,可最初提供氧化或还原型的辅因子。如上所述,辅因子再生***将氧化的辅因子转化为其还原型,其然后被用于酮还原酶底物的还原中。
在一些实施方案中,辅因子再生***未被使用。对于不使用辅因子再生***而进行的还原反应,将还原型的辅因子加入反应混合物。
在一些实施方案中,当使用宿主生物体的整个细胞进行该过程时,整个细胞可天生地提供该辅因子。可选地或共同地,该细胞可天生地或重组地提供葡萄糖脱氢酶。
在进行本文所述立体特异性还原反应时,工程化的酮还原酶和包括任选的辅因子再生***的任何酶可以以纯化的酶、用编码该酶的基因转化的整个细胞和/或这种细胞的细胞提取物和/或裂解物的形式被加入反应混合物。编码工程化的酮还原酶和任选的辅因子再生***的基因可被分别转化进宿主细胞或一起转化进相同宿主细胞。例如,在一些实施方案中,可用编码工程化的酮还原酶的基因来转化一组宿主细胞,并用编码辅因子再生酶的基因来转化另一组。两组转化细胞可以完整细胞形式或从其衍生的裂解物或提取物形式一起用于反应混合物。在其他实施方案中,可用编码工程化的酮还原酶和辅因子再生酶的基因来转化宿主细胞。
用编码工程化的酮还原酶和/或任选的辅因子再生酶的基因所转化的整个细胞或者其细胞提取物和/或裂解物可以以各种不同形式被使用,所述形式包括固体(例如冻干的、喷雾干燥的以及诸如此类)或半固体(例如粗制的糊状物)。
可通过沉淀作用(硫酸铵、聚乙烯亚胺、热处理或诸如此类,接着在冻干之前进行脱盐程序(例如超滤、透析以及诸如此类))将细胞提取物或细胞裂解物部分地纯化。可通过使用已知的交联剂例如戊二醛的交联或固定于固相(例如Eupergit C以及诸如此类)来稳定任何细胞制剂。
可以以各种不同形式将固体反应物(例如酶、盐等)提供给反应,所述不同形式包括粉末(例如冻干的、喷雾干燥的以及诸如此类)、溶液、乳浊液、悬液以及诸如此类。可使用本领域普通技术人员已知的方法和设备将反应物容易地冻干或喷雾干燥。例如,可以在-80℃以小等份将蛋白溶液冷冻,然后加入预先冷却的冻干室中,接着施加真空。在从样品除去水后,在释放真空并回收冻干的样品之前,通常将温度提高到4℃保持两小时。
取决于期望产物的量并随着所使用的酮还原酶底物的量,用于还原反应的反应物的量通常将变化。可使用下述准则来确定待使用的酮还原酶、辅因子和任选的辅因子再生***的量。通常,可以使用约50mg/L至约5g/L的酮还原酶和约10mg至约150mg的辅因子来利用浓度为约20g/L至300g/L的酮底物。本领域普通技术人员将容易理解如何改变这些量以使它们达到期望的产率水平和生产规模。可基于所用辅因子和/或酮还原酶的量通过常规实验来容易地确定任选的辅因子再生***的适当的量。通常,以超过酮还原酶底物的等摩尔水平的水平来利用还原剂(例如葡萄糖、甲酸、异丙醇)以获得基本完全的或接近完全的酮还原酶底物转化。
反应物的加入顺序不重要。可同时将反应物一起加入溶剂(例如单相溶剂、双相含水共溶剂***以及诸如此类),或可选地可将一些反应物分开加入,以及将一些在不同时间点一同加入。例如,辅因子再生***、辅因子、酮还原酶和酮还原酶底物可被首先加入溶剂。
为了在使用含水共溶剂***时增加混合效率,可首先将辅因子再生***、酮还原酶和辅因子加入并混合进水相。然后可将有机相加入并混合,接着加入酮还原酶底物。可选地,在加入水相之前,可将酮还原酶底物在有机相中预先混合。
进行本文所述的酮还原酶催化的还原反应的适合条件包括各种各样的可被常规实验容易地优化的条件,所述常规实验包括但不限于在实验pH和温度下将工程化的酮还原酶和底物相接触并且使用例如本文所提供的实施例中所述的方法检测产物。
通常在约15℃至约85℃、约20℃至约80℃、约25℃至约75℃、约30℃至约70℃、约35℃至约65℃、约40℃至约60℃或约45℃至约55℃范围内的温度下进行酮还原酶催化的还原。在某些实施方案中,酮还原酶催化的还原在约45℃的温度进行。
通常允许还原反应进行到基本上完成或者接近完成,得到底物向产物的转化。可使用已知方法通过检测底物和/或产物来监测底物向产物的还原。适合的方法包括气相色谱法、HPLC以及诸如此类。反应混合物中产生的醇还原产物的转化率通常超过约50%,也可超过约60%,也可超过约70%,也可超过约80%,也可超过约90%,并且往往超过约97%、98%或甚至99%。
在下面的代表性实例中说明本公开的各种特征和实施方案,其旨在是说明性的而不是限制性的。
6.实施例
实施例1:野生型酮还原酶基因的获得和表达载体的构建
利用标准的密码子优化设计来自野生型Novosphingobiumaromaticivorans的酮还原酶(KRED)(SEQ ID NO:2)编码基因用于在大肠杆菌中表达。(标准的密码子优化软件综述在例如,“OPTIMIZER:a webserver for optimizing the codon usage of DNA sequences(OPTIMIZER:一种优化DNA序列的密码子使用的网络服务器),”Puigbò等,Nucleic Acids Res.2007Jul;35(网络服务器特刊):W126-31.Epub2007年4月16日)。利用42个核苷酸构成的寡核苷酸合成基因,克隆到表达载体pCK110900中在lac启动子控制下,该表达载体在通过引用并入本文的美国专利申请公布20060195947中描绘为图3。表达载体还包含P15a复制起点和氯霉素抗性基因。利用标准方法将所得的质粒转化到大肠杆菌W3110或大肠杆菌BL21中。
还将编码本公开内容的工程化的酮还原酶多肽的多核苷酸克隆到载体pCK110900中以在大肠杆菌W3110或大肠杆菌BL21表达。对密码子优化的KRED基因进行多轮定向进化,产生表2中所列的变异序列。
实施例2:用于产生酮还原酶多肽的摇瓶程序
含有编码感兴趣的工程化酮还原酶的质粒的大肠杆菌的一个单独微生物菌落被接种在50ml的含有30μg/ml氯霉素和1%葡萄糖的LuriaBertani肉汤中。在30℃培养箱中以250rpm摇动培养细胞过夜(至少16小时)。在1升烧瓶中的含30μg/ml氯霉素的250mlTerrific肉汤(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4ml/L甘油、65mM磷酸钾、pH7.0、1mM MgSO4)中将培养物稀释到在600nm(OD600)下0.2的光密度,并允许其在30℃下生长。当培养物的OD600是0.6至0.8时,通过添加1mM终浓度的异丙基-β-D-硫代半乳糖苷(“IPTG”)诱导酮还原酶基因的表达,然后继续培养过夜(至少16小时)。
通过离心(5000rpm、15min、4℃)收集细胞并丢弃上清液。用等体积冷的(4℃)100mM三乙醇胺(氯化物)缓冲液pH7.0(任选地包括2mMMgSO4)将细胞团块重悬浮,并如上通过离心收集。在两体积的冷的三乙醇胺(氯化物)缓冲液中将被冲洗的细胞重悬浮,并在维持在4℃时在12,000psi下将其通过弗氏压碎器(French Press)两次。通过离心(9000rpm、45min、4℃)除去细胞碎片。收集澄清的裂解物上清液并储存在-20℃。对冷冻的澄清裂解物的冻干提供了粗制酮还原酶多肽的干燥摇瓶粉末。可选地,细胞团块(洗涤前或洗涤后)可储存在4℃或-80℃。
实施例3:用于产生酮还原酶多肽的发酵步骤
在通风搅拌的15L发酵器中,利用6.0L生长培养基(0.88g/L硫酸铵、0.98g/L柠檬酸钠;12.5g/L三水合磷酸氢二钾、6.25g/L磷酸二氢钾、6.2g/L的Tastone-154酵母提取物、0.083g/L柠檬酸铁铵和8.3ml/L含2g/L二水合氯化钙、2.2g/L七水合硫酸锌、0.5g/L一水合硫酸锰、1g/L七水合硫酸亚铜、0.1g/L四水合钼酸铵和0.02g/L四硼酸钠的微量元素溶液)进行实验室规模的发酵。用(在实施例2中所述的摇瓶中生长的)含有编码感兴趣的工程化酮还原酶基因的质粒的大肠杆菌W3110或大肠杆菌BL21的晚期指数培养物在发酵器中接种,至0.5至2.0的起始OD600。以500-1500rpm搅拌发酵器,并以1.0-15.0L/分钟向发酵容器中提供空气以维持30%饱和或更高的溶氧水平。通过加入20%v/v的氢氧化铵来将培养物的pH维持在7.0。通过加入含有500g/L结晶葡萄糖(cerelose)、12g/L氯化铵和10.4g/L七水合硫酸镁的进料溶液来维持培养物的生长。在培养物达到50的OD600之后,通过将异丙基-β-D-硫代半乳糖苷(IPTG)加到1mM的终浓度来诱导酮还原酶的表达,发酵继续再14小时。然后将培养物冷却到4℃并维持在该温度直到被收集。通过在4℃以5000G离心40分钟来收集细胞。将收集的细胞直接用于接下来的下游回收过程或储存在4℃或冷冻在-80℃直到如此使用。
在4℃下以每体积的湿细胞糊状物2体积的100mM三乙醇胺(氯化物)缓冲液pH6.8将细胞团块重悬浮。通过利用12000psig的压力将悬浮液穿过装有二阶段均质阀门组件的均质器来从细胞释放细胞内的酮还原酶。破裂之后马上将细胞匀浆冷却到4℃。10%w/v的聚乙烯亚胺pH7.2的溶液被加入裂解物至终浓度0.5%w/v,并且搅拌30分钟。通过在标准的实验室离心机上以5000G离心30分钟而使所得的悬浮液变澄清。将澄清的上清液倒出并使用具有30kD的分子量截留(cut off)的纤维素超滤膜将其浓缩十倍。将最终的浓缩物分配到浅容器中,在-20℃下冷冻并冻干为粉末。将粗制酮还原酶多肽粉末储存在-80℃。
实施例4:酮还原酶催化的还原化合物(1)((S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯)为相应醇化合物(2)(叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯)的转化百分比和非对映体纯度的确定
酮还原酶催化的立体选择性还原化合物(1)((S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯)为相应的醇化合物(2)(叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯)的转化率通过以时间间隔(如,第0.5、2、4、7、9和24小时)对酶促反应混合物取样,如下确定:利用配备有AgilentXDB C18(长15cm,直径4.6mm)的Agilent1200HPLC,利用60%MeCN、40%水(等度)作为洗脱剂,流速为1.8ml/min;柱温度25℃。化合物(1)保留时间:3.119分钟;化合物(2)保留时间:2.378分钟。底物(化合物(1))和产物(化合物(2))的量基于在210nm检测的HPLC峰面积确定。
酮还原酶多肽催化的反应产物化合物(2)(叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯)的非对映体纯度如下确定:利用配备有Agilent XDB C18(长15cm,直径4.6mm)的Agilent1200HPLC,利用50%MeCN、50%水(等度)作为洗脱剂,流速为1.50mL/min,温度20℃。化合物(2)的期望非对映体的保留时间:5.083min;不希望的非对映体(和底物)的保留时间:4.050min。
实施例5:预筛选能够在NADP+存在下还原异丙醇以产生NADPH和丙酮的工程化的酮还原酶多肽
这一实施例阐述用于鉴定编码能够在NADP+存在下还原异丙醇以产生丙酮和NADPH的酮还原酶的变异基因的预筛选检验。利用自动菌落挑取器(Genetix USA,Inc.,Boston,MA)将含编码工程化的酮还原酶的质粒的大肠杆菌菌落挑取到包含180μL Terrific肉汤(TB)、1%葡萄糖和30μg/mL氯霉素(CAM)的96孔的浅孔微量滴定板。细胞在30℃生长过夜,伴随以200rpm摇动。然后将此培养物的10μL等份转移到包含390μL Terrific肉汤(TB)、1mM MgSO4和30μg/mL CAM的96-深孔板中。在30℃伴随以250rpm摇动培养深孔板2-3小时后,通过加入IPTG至终浓度1mM来诱导培养细胞中的重组基因表达。然后在30℃伴随以250rpm摇动培养板18小时。
细胞通过离心(4000RPM,10分钟,4℃)沉淀,重悬在400μL裂解缓冲液中,通过在室温摇动2小时而裂解。裂解缓冲液包含100mM三乙醇胺(氯化物)缓冲液、pH7、1mg/mL溶菌酶、500μg/mL硫酸多粘菌素B(“PMBS”)和1mM MgSO4。用铝/聚丙烯薄片热封带(Velocity11,Menlo Park,CA,目录号06643-001)密封板后,在室温剧烈摇动板2小时。细胞碎片通过离心(4000RPM,10分钟,4℃)收集,直接检验澄清上清液,或在4℃储存直到使用。
在这一检验中,将20μl样品(稀释在100mM三乙醇胺(氯化物)缓冲液中、与裂解缓冲液相同的pH、和1mM MgSO4)加至96孔黑色微量滴定板的孔中的180μl检验混合物。检验缓冲液由100mM三乙醇胺(氯化物)缓冲液、pH7、50%异丙醇(IPA)、1mM MgSO4和222μM NADP+组成。反应后,利用设备测量NADP+随着被转化为NADPH的荧光减少(Molecular Devices,Sunnyvale,CA)。在330nm激发后,在445nm测量NADPH荧光。如果需要,在添加到检验混合物之前,裂解物样品可在50%IPA存在或不存在下在25-40℃预培养。
实施例6:筛选能够立体选择性转化底物化合物(1)((S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯)为相应的产物化合物(2)(叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯)的工程化的酮还原酶多肽
利用上述定向进化方法将如实施例1构建的来源自Novosphingobiumaromaticivorans的密码子优化的酮还原酶基因(SEQ ID NO:1)进行诱变,将突变体DNA分子的群体转化到适当的大肠杆菌宿主菌株中。选择抗生素抗性转化体并处理以鉴定表达具有转化化合物(1)为化合物(2)的改进的能力的酮还原酶的转化体。
细胞选择、生长、诱导变异酮还原酶基因和收集细胞团块如实施例5所述。通过向每个孔添加400μL裂解缓冲液(1mM MgSO4、0.5mg/ml硫酸多粘菌素B(“PMBS”)、1mg/ml溶菌酶、100mM三乙醇胺(pH~6)和1mg/mL NADP+)来裂解细胞团块。密封板,在室温剧烈摇动板2小时,然后在4℃以4000rpm离心10分钟。回收上清液,在4℃储存直到使用。
酶促还原检验:利用Multidrop仪器(MTX Lab Systems,Vienna VA)将异丙醇与固体底物((S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯)的混合物的等份(450μL)加到深孔板的每个孔,随后利用MultimekTM仪器(Multimek,Inc.,Santa Clara CA)自动添加50μL回收的裂解物上清液,以提供包含10mg/ml底物(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯、0.1mg/ml NADP+、10mM三乙醇胺pH~6和10%异丙醇(v/v)的反应。在170℃用铝/聚丙烯薄片热封带(Velocity11(Menlo Park,CA),目录号06643-001)热密封板2.5秒,然后在室温摇动板过夜(至少16小时)。通过添加1ml甲基叔丁基醚(MTBE)来猝灭反应。再次密封板,摇动5分钟,然后以4000rpm离心10分钟。将250μL等份的澄清反应混合物转移到新的浅孔聚丙烯板(Costar#3365),密封,然后利用上述方法对提取物进行HPLC分析(如,参见实施例4)。
在pH~6和10%IPA(v/v)的高通量筛选检验:将含1g/L NADP+的50μl细胞裂解物转移到包含450μl检验混合物(每100ml检验混合物:5ml100mM三乙醇胺(氯化物)(pH7)、13.4g(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯和10ml异丙醇)的深孔板(Costar#3960)。密封板后,反应在室温进行至少16小时。通过添加1ml95%MTBE来猝灭反应,用铝/聚丙烯薄片热封带(Velocity11(Menlo Park,CA),目录号06643-001)密封板,摇动5-10min,以4000rpm离心10分钟。将250μL等份的澄清反应混合物转移到新的浅孔聚丙烯板(Costar#3365),然后密封。对以这种方式制备的提取物进行如上所述的HPLC分析。
利用以上公开的程序鉴定能够以高转化率(如,24小时内至少约70-95%)和高非对映体纯度(如,至少约85-99%d.e.)转化(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯为叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯的工程化的酮还原酶多肽。进行这些程序的多次迭代,其中从一轮诱变分离具有改进的特性的一种或多种工程化的酮还原酶基因,并将其用作下一轮诱变和筛选的起始材料。从这些多轮定向进化获得的一些改进的工程化的酮还原酶在本文公开,列在表2。
实施例7:利用异丙醇用于辅因子再生,来源自Novosphingobiumaromaticivorans的工程化的酮还原酶立体选择性还原(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯化合物(1)
如下检验如上所述的来源自Novosphingobium aromaticivorans的工程化的酮还原酶在制备规模地还原(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯中的使用。将100mM三乙醇胺(氯化物)缓冲液pH7中100μL待试验的工程化的酮还原酶(10mg/mL)和NADP-Na(1mg/mL)的溶液合并在装备有磁性搅拌棒的5mL反应小瓶中。随后,将85μL异丙醇(“IPA”)加到酶/NADP-Na溶液,然后加入120mg化合物(1)。在室温搅拌反应,化合物(1)向化合物(2)的转化通过利用实施例4中公开的分析方法,HPLC分析在24小时阶段定期从反应获取的样品来监测。
表2标明了酮还原酶变体(由多核苷酸和多肽SEQ ID NO)、相对于野生型酮还原酶多肽SEQ ID NO:2的氨基酸突变、和每种变体相对于具有氨基酸序列SEQ ID NO:2的野生型酶的活性的相对活性。如表2列出的结果所示的,几乎所有工程化的酮还原酶具有野生型多肽活性的至少120%(即,1.2倍或更大)活性,多种工程化的酮还原酶(如,多肽SEQ ID NO:6、50、52、56)具有导致改进的活性比SEQ ID NO:2大至少300%(即,3倍或更大)的突变。这些结果说明,本文公开的来源自酮还原酶Novosphingobium aromaticivorans的工程化的酮还原酶提供与野生型酮还原酶SEQ ID NO:2相比还原式(I)化合物诸如化合物(1)的改进的活性。
实施例8:在立体选择性制备规模转化化合物(1)为化合物(2)、和转化化合物(2)为化合物(3)中使用工程化的酮还原酶
向装备有上悬的搅拌器、导流板和内部温度计的1L加套过程反应器顺序地充入90.0g化合物(1)、400ml100mM三乙醇胺溶液(pH9.0)、60ml IPA和NAD+(300mg)。搅拌所得的浆状物10min,加入600mg工程化的酮还原酶多肽SEQ ID NO:6。加热反应混合物到45℃,以150rpm搅拌前4小时,随后以250rpm搅拌。在反应时进行工序内HPLC分析以确定化合物(1)向化合物(2)的转化(如实施例4所述)。工序内分析指示99.8%转化(在9小时时)后,将反应冷却到20℃。
将MTBE(600mL)加入反应浆状物,以250rpm搅动50min。允许各相分离,取出水层。分别收集MTBE相。重新充入水层,加入MTBE(300mL)。以250rpm搅动双相混合物45min。允许各相分离,取出水层。对水相的HPLC分析(如实施例4中为确定转化所描述的)指示>99%产物已被取出。将合并的MTBE层过滤通过硅藻土垫(30g),用90mLMTBE洗涤滤饼,在250rpm用90mL水洗涤联合的MTBE相15min。允许各相分离,取出水层。根据HPLC确定期望产物化合物(2)的纯度为98.4%。
将KOH(39.7g,85%w/w)加到含化合物(2)的有机相,在250rpm和25℃搅拌。工序内HPLC分析指示>99.9%转化(在8小时时)后加入180ml水,在250rpm搅拌双相混合物30min。允许各相分离,取出水层。用水(90mL和180mL)重复洗涤两次。将剩余MTBE相(1L)浓缩到400mL,然后加入600ml正庚烷。利用50℃的套内温度,同时逐步减少压力到105Torr再次将所得混合物浓缩到400mL。这一步骤重复一次。对剩余正庚烷层的GC分析指示≤0.7%MTBE保留,加入正庚烷以获得总体积1L。在120rpm搅拌溶液,调整溶液的温度为20℃。以20mg纯化合物(3)对溶液引晶,搅拌1小时。以0.5℃的阶梯经150min将温度逐渐降低到17.5℃。搅拌另外1小时后观察到结晶形成。在400rpm搅拌所得的更粘稠的溶液,温度降低到0℃,搅拌30min。排空反应器,在减压下过滤白色物质,用冷的正庚烷(2×180ml)洗涤,在大约20mmHg干燥24小时。这在单次收获(single crop)中提供作为白色固体的64.4g(81%产率)的化合物(3)叔丁基(S)-1-((R)-环氧乙烷-2-基)-2-苯基乙基氨基甲酸酯,化学纯度为98.9%,非对映体纯度为>99.9%de。产率的余量在母液中,并可作为二次收获(second crop)被分离以提供大约98-99%的几乎定量的总产率。合理地预计,修改的结晶方法可导致几乎定量的化合物(3)纯产物的单次收获产率。
本申请中所引用的所有出版物、专利、专利申请和其他文件为所有目的通过引用以其整体并入本文,达到如同单个出版物、专利、专利申请或其他文件单独表明为了所有目的而通过引用被并入的程度。
尽管已经阐释和描述了各种具体实施方案,但应理解可以作出各种改变而不背离本发明的精神和范围。

Claims (60)

1.一种工程化的酮还原酶多肽,所述工程化的酮还原酶多肽能够以SEQ ID NO:2活性的至少1.2倍的相对活性转化(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯为叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯,其中所述多肽由选自以下组成的组的氨基酸序列组成:SEQ ID NO:6、18、76、4、14、16、22、24、26、28、30、32、34、36、38、40、50、52、54、56、60、62、66、68、70、72、74、78和80。
2.如权利要求1所述的多肽,其中所述多肽由选自SEQ ID NO:6、18、22、30、32、38、40、50、52、54、56、62、66、68、70、72、74、78和80组成的组的氨基酸序列组成,且其中所述多肽的相对活性是SEQ ID NO:2活性的至少1.5倍。
3.如权利要求2所述的多肽,其中所述多肽由选自以下组成的组的氨基酸序列组成:SEQ ID NO:6、18、22、30、38、40、50、52、54和56。
4.如权利要求1所述的多肽,其中所述多肽由选自SEQ ID NO:6、50、52、56、70和80组成的组的氨基酸序列组成,且其中所述多肽的相对活性是SEQ ID NO:2活性的至少3倍。
5.如权利要求4所述的多肽,其中所述多肽由选自以下组成的组的氨基酸序列组成:SEQ ID NO:6、50、52和56。
6.如权利要求1所述的多肽,其中所述多肽由选自以下组成的组的氨基酸序列组成:SEQ ID NO:6、18、4、16、22、24、26、28、30、32、34、36、50、52、54和56。
7.如权利要求6所述的多肽,其中所述多肽由选自以下组成的组的氨基酸序列组成:SEQ ID NO:4、6、16、18、22、24、26、28、30、32、34、50、54、56和52。
8.如权利要求7所述的多肽,其中所述多肽由选自以下组成的组的氨基酸序列组成:SEQ ID NO:4、6、18、22、30、50、52、54和56。
9.如权利要求8所述的多肽,其中所述多肽由选自以下组成的组的氨基酸序列组成:SEQ ID NO:18、22、30和52。
10.如权利要求6所述的多肽,其中所述多肽由选自SEQ ID NO:50和52组成的组的氨基酸序列组成,其中所述多肽的相对活性是SEQ ID NO:2活性的至少3倍,且其中对应于SEQ ID NO:2的氨基酸145的残基是丙氨酸。
11.如权利要求10所述的多肽,其中所述多肽由SEQ ID NO:52的氨基酸序列组成。
12.如权利要求1所述的多肽,其中所述多肽能够在24小时内以至少70%的转化率转化包含初始浓度为至少10g/L的(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯的反应混合物为叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯。
13.如权利要求12所述的多肽,其中所述多肽能够在24小时内达到至少95%的转化率。
14.如权利要求12所述的多肽,其中所述多肽能够转化(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯为至少97%非对映体过量的叔丁基(2S,3R)-4-氯-3-羟基-1-苯基丁烷-2-基氨基甲酸酯。
15.如权利要求12所述的多肽,其中所述反应混合物包含少于5g/L的所述多肽。
16.如权利要求12所述的多肽,其中所述反应混合物包含初始浓度为至少100g/L的(S)-叔丁基4-氯-3-氧-1-苯基丁烷-2-基氨基甲酸酯。
17.一种工程化的酮还原酶多肽,所述多肽能够以比参考多肽SEQ IDNO:2大至少2倍的活性氧化异丙醇为丙酮,其中所述多肽由选自SEQ IDNO:6、56、60、62、64、66、68、70、72、74、76、78和80的氨基酸序列组成。
18.如权利要求17所述的多肽,其中所述氨基酸序列选自由SEQ IDNO:64、66、68、70、72、76、78和80组成的组。
19.如权利要求17所述的多肽,其中所述氨基酸序列选自由SEQ IDNO:6和56组成的组。
20.如权利要求17所述的多肽,其中所述活性比参考多肽SEQ ID NO:2大至少5倍,且其中所述氨基酸序列选自由SEQ ID NO:70、76和80组成的组。
21.一种组合物,所述组合物包含权利要求1-20任一项的多肽。
22.一种多核苷酸,所述多核苷酸编码权利要求1-20任一项的多肽。
23.一种表达载体,所述表达载体包含可操作地连接于能够指导编码的多肽在宿主细胞中表达的控制序列的权利要求22的多核苷酸。
24.如权利要求23所述的表达载体,其中所述控制序列包含分泌信号。
25.一种宿主细胞,所述宿主细胞包含权利要求22的多核苷酸和/或权利要求23的表达载体。
26.如权利要求25所述的宿主细胞,其中编码多肽的所述多核苷酸的密码子已被优化以在所述宿主细胞中表达。
27.一种制备权利要求1至20任一项的工程化的酮还原酶多肽的方法,所述方法包括培养权利要求25的宿主细胞,并从所述宿主细胞分离所述多肽。
28.一种制备大于95%非对映体过量的式(II)化合物的方法,所述方法包括:
在适当的反应条件下将式(I)化合物
与权利要求1至16任一项的工程化的酮还原酶多肽接触;
其中R1是选自以下组成的组的氮保护基:甲酰基、三苯甲基、甲氧基三苯甲基、甲苯磺酰基、邻苯二甲酰亚氨基、乙酰基、三氯乙酰基、氯乙酰基、溴乙酰基、碘乙酰基、苄氧羰基、9-芴基甲氧羰基、2-三甲硅烷基乙氧羰基、1-甲基-1-(4-联苯基)乙氧羰基、叔丁氧羰基、烯丙氧基羰基、三卤代乙酰基、苄基、苯甲酰基和硝基苯基乙酰基。
29.如权利要求28所述的方法,其中R1是叔丁氧羰基。
30.如权利要求28所述的方法,其中所述反应条件包括6.5至9.5的pH。
31.如权利要求28所述的方法,其中所述反应条件包括9.0的pH。
32.如权利要求28所述的方法,其中所述反应条件包括从25℃至60℃的温度。
33.如权利要求28所述的方法,其中所述反应条件包括45℃的温度。
34.如权利要求28所述的方法,其中所述反应条件包括含水共溶剂***。
35.如权利要求28所述的方法,其中所述反应条件包括包含从90:10(v/v)至10:90(v/v)的有机溶剂与水的比例的含水共溶剂***。
36.如权利要求28所述的方法,其中所述反应条件包括包含从5%至40%异丙醇的含水共溶剂***。
37.如权利要求28所述的方法,其中所述反应条件包括包含10%异丙醇的含水共溶剂***。
38.如权利要求28所述的方法,其中所述反应条件包括包含pH9.0和10%异丙醇的含水共溶剂***。
39.如权利要求28所述的方法,其中所述多肽的浓度少于5g/L。
40.如权利要求28所述的方法,其中所述多肽的浓度少于1g/L。
41.如权利要求28所述的方法,其中所述式(I)化合物的浓度是至少100g/L。
42.如权利要求28所述的方法,其中所述式(I)化合物的浓度是至少150g/L。
43.如权利要求28所述的方法,其中所述酮还原酶多肽是包含至少50%所述酮还原酶多肽的多肽组合物。
44.如权利要求28所述的方法,所述方法还包括选自以下组成的组的辅因子再生***:葡萄糖脱氢酶和葡萄糖、甲酸脱氢酶和甲酸、亚磷酸脱氢酶和亚磷酸、以及异丙醇和仲醇脱氢酶。
45.如权利要求44所述的方法,其中所述辅因子再生***是仲醇脱氢酶。
46.如权利要求45所述的方法,其中所述仲醇脱氢酶是所述工程化的酮还原酶多肽。
47.如权利要求28所述的方法,其中所述非对映体过量是大于97%。
48.如权利要求28所述的方法,其中在少于24小时内至少95%的所述式(I)化合物被转化为所述式(II)化合物。
49.如权利要求28所述的方法,其中在少于24小时内至少95%的所述式(I)化合物被转化为所述式(II)化合物,其中所述式(I)化合物的浓度是至少150g/L且所述多肽的浓度是少于1g/L。
50.一种制备大于95%非对映体过量的式(III)化合物的方法,所述方法包括:
(a)在适当的反应条件下将式(I)化合物与权利要求1至19任一项的多肽接触,
从而形成包含式(II)化合物的反应混合物
(b)用有机溶剂萃取所述反应混合物;并
(c)将有机溶剂萃取物与碱接触以获得式(III)化合物;
其中R1是选自以下组成的组的氮保护基:甲酰基、三苯甲基、甲氧基三苯甲基、甲苯磺酰基、邻苯二甲酰亚氨基、乙酰基、三氯乙酰基、氯乙酰基、溴乙酰基、碘乙酰基、苄氧羰基、9-芴基甲氧羰基、2-三甲硅烷基乙氧羰基、1-甲基-1-(4-联苯基)乙氧羰基、叔丁氧羰基、烯丙氧基羰基、三卤代乙酰基、苄基、苯甲酰基和硝基苯基乙酰基。
51.如权利要求50所述的方法,其中R1是叔丁氧羰基。
52.如权利要求50所述的方法,其中进行将式(II)化合物与碱接触的所述步骤而不纯化和/或分离所述式(II)化合物。
53.如权利要求50所述的方法,所述方法还包括从所述有机溶剂萃取物结晶所述式(III)化合物。
54.如权利要求50所述的方法,其中所述有机溶剂选自甲苯、异丙醇、MTBE、正丁醇和乙腈。
55.如权利要求54所述的方法,其中所述有机溶剂是MTBE。
56.如权利要求55所述的方法,所述方法还包括用结晶溶剂交换所述有机溶剂萃取物的有机溶剂,并从所述结晶溶剂结晶所述式(III)化合物。
57.如权利要求56所述的方法,其中所述结晶溶剂是庚烷。
58.如权利要求50所述的方法,其中所述碱选自氢氧化钾(KOH)、叔丁醇钾、碳酸钾和三乙胺。
59.如权利要求58所述的方法,其中所述碱是氢氧化钾(KOH)。
60.如权利要求50所述的方法,其中所述非对映体过量大于97%。
CN201080027481.5A 2009-06-22 2010-06-22 酮还原酶介导的产生α氯代醇的立体选择性途径 Active CN102482648B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US21916209P 2009-06-22 2009-06-22
US61/219,162 2009-06-22
US30305710P 2010-02-10 2010-02-10
US61/303,057 2010-02-10
PCT/US2010/039511 WO2011005527A2 (en) 2009-06-22 2010-06-22 Ketoreductase-mediated stereoselective route to alpha chloroalcohols

Publications (2)

Publication Number Publication Date
CN102482648A CN102482648A (zh) 2012-05-30
CN102482648B true CN102482648B (zh) 2014-12-10

Family

ID=43429767

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080027481.5A Active CN102482648B (zh) 2009-06-22 2010-06-22 酮还原酶介导的产生α氯代醇的立体选择性途径

Country Status (7)

Country Link
US (4) US8796002B2 (zh)
EP (2) EP2446025B1 (zh)
CN (1) CN102482648B (zh)
DK (2) DK3409765T3 (zh)
HU (1) HUE055413T2 (zh)
SG (1) SG177331A1 (zh)
WO (1) WO2011005527A2 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011100265A2 (en) 2010-02-10 2011-08-18 Codexis, Inc. Processes using amino acid dehydrogenases and ketoreductase-based cofactor regenerating system
CN103044361B (zh) * 2012-12-30 2014-08-06 江苏八巨药业有限公司 一种(2r,3s)-环氧化氨基苯丁烷的制备方法
CN103435525B (zh) * 2013-07-25 2015-11-18 凯莱英医药集团(天津)股份有限公司 一种制备依折麦布的方法
CN103468757A (zh) * 2013-09-18 2013-12-25 苏州汉酶生物技术有限公司 一种阿扎那韦中间体的生物制备方法
PL3080284T3 (pl) 2013-12-11 2018-05-30 F.Hoffmann-La Roche Ag Sposób wytwarzania chiralnej 2-(4-aminofenylo)morfoliny
CN107354179B (zh) * 2016-05-09 2021-02-19 上海医药工业研究院 一种制备含有羟基的手性化合物的方法
CN106011095B (zh) * 2016-07-27 2021-02-26 苏州汉酶生物技术有限公司 工程化酮还原酶多肽及使用其制备依替米贝中间体的方法
CN107674046B (zh) * 2016-08-01 2022-09-13 上海朴颐化学科技有限公司 一种阿扎那韦环氧化物中间体的纯化方法
CN106755152B (zh) * 2017-01-23 2020-06-16 苏州引航生物科技有限公司 一种制备奥格列汀中间体的方法
CN106947791B (zh) * 2017-03-14 2021-05-04 四川奇格曼药业有限公司 一种利用生物酶催化合成阿扎那韦中间体氯醇的方法
CN109439696A (zh) * 2017-09-04 2019-03-08 尚科生物医药(上海)有限公司 一种制备(r)-2-氯-1-(3,4-二氟苯基)乙醇的方法
CN109897872B (zh) * 2017-12-11 2023-12-22 湖州颐盛生物科技有限公司 酶法制备(2s,3s)-n-叔丁氧羰基-3-氨基-1-氯-2-羟基-4-苯基丁烷
CN109957584A (zh) * 2017-12-25 2019-07-02 尚科生物医药(上海)有限公司 一种用于制备(r)-(4-氯苯基)-2-吡啶甲醇的生物催化方法
WO2019140682A1 (zh) * 2018-01-22 2019-07-25 吉林凯莱英医药化学有限公司 酮还原酶突变体及其应用
CN108300743B (zh) * 2018-02-06 2021-05-14 江苏八巨药业有限公司 一种(r)-2-氯-1-(6-氟-苯并二氢吡喃-2-基)-1-乙醇的生物催化方法
CN108484361B (zh) * 2018-05-11 2022-09-30 弈柯莱生物科技(上海)股份有限公司 (s)-4-氯-1-(2,5)-二氟苯基丁-1-醇及其制备方法和应用
CN109097344B (zh) * 2018-08-07 2021-10-22 浙江海洋大学 一种海洋新鞘脂菌短链醇脱氢酶突变体及其应用
CN109022473B (zh) * 2018-08-13 2021-09-17 浙江海洋大学 一种酶法制备奥利司他中间体的方法
CN109182410B (zh) * 2018-09-29 2020-10-02 台州学院 一种(S)-N-Boc-3-羟基哌啶的酶催化制备方法
CN110079564A (zh) * 2019-04-29 2019-08-02 上海健康医学院 一种催化合成阿扎那韦中间体的方法及其应用
CN112708641A (zh) * 2019-10-24 2021-04-27 上海医药工业研究院 托莫西汀的化学-酶合成方法
CN110791483B (zh) * 2019-12-05 2022-11-29 西南交通大学 一种短链还原酶及其制备方法和应用
CN111378703B (zh) * 2020-03-27 2021-05-18 长兴制药股份有限公司 一种(2s,3s)-2-羟基-4-苯基丁烷衍生物的制备方法
CN111235123B (zh) * 2020-03-27 2020-10-27 长兴制药股份有限公司 一种醇溶液高浓度耐受的羰基还原酶及其应用
CN111378695B (zh) * 2020-04-07 2023-07-28 宁波酶赛生物工程有限公司 合成r-3-(2-氯-1-羟基乙基)苯酚的方法、去氧肾上腺素、滴眼剂
CN112322676B (zh) * 2020-11-10 2022-06-07 江苏八巨药业有限公司 一种酶催化制备氟伐二醇的方法
CN113430240B (zh) * 2021-06-29 2023-07-04 华东理工大学 一种连续流生物催化合成阿扎那韦中间体氯醇的方法
CN115537405B (zh) * 2021-06-30 2024-04-12 尚科生物医药(上海)有限公司 一种酮还原酶及其在制备(s)-1-(3-氯苯基)-1,3-丙二醇中的应用
CN113717996B (zh) * 2021-09-28 2023-05-02 江苏八巨药业有限公司 一种2-脱氧-2,2-二氟-3,5-二苯甲酰基-d-呋喃核糖的生物合成方法
CN113816836B (zh) * 2021-09-29 2024-05-03 山东睿鹰制药集团有限公司 一种(s)-1-(4-氯苯基)-1,3-丙二醇的酶法生产方法
CN113981013B (zh) * 2021-12-02 2024-02-20 上海升华医药科技有限公司 一种手性四氢萘-2-醇化合物的生物催化制备方法
CN117126823B (zh) * 2023-09-01 2024-03-29 华南理工大学 一种酮还原酶突变体及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6800477B2 (en) * 2001-03-22 2004-10-05 Bristol-Myers Squibb Co. Stereoselective reduction of substituted acetophenone
US20060286646A1 (en) * 2005-05-31 2006-12-21 Bristol-Myers Squibb Company Stereoselective reduction process for the preparation of pyrrolotriazine compounds
WO2009042984A1 (en) * 2007-09-28 2009-04-02 Codexis, Inc. Ketoreductase polypeptides and uses thereof

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5538867A (en) 1988-09-13 1996-07-23 Elf Aquitaine Process for the electrochemical regeneration of pyridine cofactors
US5570670A (en) 1991-09-23 1996-11-05 Powell; Brian L. Two stroke internal combustion engine
JP3155107B2 (ja) 1993-01-12 2001-04-09 ダイセル化学工業株式会社 光学活性4−ハロ−3−ヒドロキシ酪酸エステルの製造方法
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
WO1995033836A1 (en) 1994-06-03 1995-12-14 Novo Nordisk Biotech, Inc. Phosphonyldipeptides useful in the treatment of cardiovascular diseases
EP1559776A3 (en) 1994-06-30 2006-01-11 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein
JPH08336393A (ja) 1995-04-13 1996-12-24 Mitsubishi Chem Corp 光学活性なγ−置換−β−ヒドロキシ酪酸エステルの製造法
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
US5891685A (en) 1996-06-03 1999-04-06 Mitsubishi Chemical Corporation Method for producing ester of (S)-γ-halogenated-β-hydroxybutyric acid
KR20010032861A (ko) 1997-12-08 2001-04-25 캘리포니아 인스티튜트 오브 테크놀로지 폴리뉴클레오티드 및 폴리펩티드 서열을 형성하는 방법
US6495023B1 (en) 1998-07-09 2002-12-17 Michigan State University Electrochemical methods for generation of a biological proton motive force and pyridine nucleotide cofactor regeneration
DE19857302C2 (de) 1998-12-14 2000-10-26 Forschungszentrum Juelich Gmbh Verfahren zur enantioselektiven Reduktion von 3,5-Dioxocarbonsäuren, deren Salze und Ester
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
DE60042090D1 (de) 1999-03-11 2009-06-04 Eastman Chem Co Enzymatische Reduktion mit Hydrogen mittels metallkatalysierter Kofaktorregenerierung
WO2001007567A1 (en) 1999-07-27 2001-02-01 Food Industry Research And Development Institute Engineering of metabolic control
CA2360376C (en) 1999-12-03 2005-04-26 Noriyuki Kizaki Novel carbonyl reductase, gene thereof and method of using the same
EP1272967A2 (en) 2000-03-30 2003-01-08 Maxygen, Inc. In silico cross-over site selection
JP3843255B2 (ja) 2000-08-16 2006-11-08 ブリストル−マイヤーズ スクイブ カンパニー 置換オキソブタンの立体選択的還元
US7202070B2 (en) * 2000-10-31 2007-04-10 Biocatalytics, Inc. Method for reductive amination of a ketone using a mutated enzyme
AU2003258187A1 (en) 2002-08-09 2004-02-25 Codexis, Inc. Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives
EP1660648B1 (en) 2003-08-11 2013-10-09 Codexis, Inc. Improved glucose dehydrogenase polypeptides and related polynucleotides
MXPA06001725A (es) 2003-08-11 2006-04-27 Codexis Inc Halohidrina deshalogenasas mejoradas y polinucleotidos relacionados.
AU2004266100A1 (en) 2003-08-11 2005-03-03 Codexis, Inc. Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives and vicinal cyano, hydroxy substituted carboxylic acid esters
JP2007502124A (ja) 2003-08-11 2007-02-08 コデクシス, インコーポレイテッド 改良ケトレダクターゼポリペプチドおよび関連ポリヌクレオチド
WO2005054491A1 (ja) 2003-12-02 2005-06-16 Mercian Corporation 光学活性テトラヒドロチオフェン誘導体の製造方法、および、光学活性テトラヒドロチオフェン-3-オールの晶析方法
US7794993B2 (en) 2004-08-06 2010-09-14 Kaneka Corporation Carbonyl reductase, gene thereof and method of using the same
US7582468B2 (en) 2005-05-25 2009-09-01 Bristol-Myers Squibb Company Process for preparing (2R,3S)-1,2-epoxy-3-(protected)amino-4-substituted butane and intermediates thereof
DE102005028312B4 (de) 2005-06-18 2008-05-08 Archimica Gmbh Verfahren zur Herstellung von enantiomerenreinen Epoxiden durch ADH-Reduktion von α-Abgangsgruppen-substituierten Ketonen und Cyclisierung
GB0619240D0 (en) 2006-09-29 2006-11-08 Almac Sciences Ltd Reduction of alpha-halo ketones
EP2066788B1 (en) 2006-10-02 2014-07-23 Codexis, Inc. Compositions and methods for producing stereoisomerically pure statins and synthetic intermediates therefor
TWI601825B (zh) 2007-09-27 2017-10-11 Iep有限公司 對映異構選擇性酶催化還原中間產物之方法
WO2011100265A2 (en) * 2010-02-10 2011-08-18 Codexis, Inc. Processes using amino acid dehydrogenases and ketoreductase-based cofactor regenerating system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6800477B2 (en) * 2001-03-22 2004-10-05 Bristol-Myers Squibb Co. Stereoselective reduction of substituted acetophenone
US20060286646A1 (en) * 2005-05-31 2006-12-21 Bristol-Myers Squibb Company Stereoselective reduction process for the preparation of pyrrolotriazine compounds
WO2009042984A1 (en) * 2007-09-28 2009-04-02 Codexis, Inc. Ketoreductase polypeptides and uses thereof

Also Published As

Publication number Publication date
US9296992B2 (en) 2016-03-29
DK2446025T3 (en) 2018-10-22
EP2446025B1 (en) 2018-08-08
EP3409765A2 (en) 2018-12-05
US8796002B2 (en) 2014-08-05
US20140308732A1 (en) 2014-10-16
US20150240217A1 (en) 2015-08-27
EP2446025A4 (en) 2016-04-06
HUE055413T2 (hu) 2021-11-29
US20120190086A1 (en) 2012-07-26
EP3409765B1 (en) 2021-08-04
EP3409765A3 (en) 2019-02-27
US9404092B2 (en) 2016-08-02
US9029112B2 (en) 2015-05-12
WO2011005527A2 (en) 2011-01-13
EP2446025A2 (en) 2012-05-02
CN102482648A (zh) 2012-05-30
DK3409765T3 (da) 2021-09-27
WO2011005527A3 (en) 2011-05-12
SG177331A1 (en) 2012-02-28
US20160160187A1 (en) 2016-06-09

Similar Documents

Publication Publication Date Title
CN102482648B (zh) 酮还原酶介导的产生α氯代醇的立体选择性途径
CN102186972B (zh) 用于立体选择性生产(4s)-3-[(5s)-5-(4-氟苯基)-5-羟基戊酰基]-4-苯基-1,3-噁唑烷-2-酮的酮还原酶多肽
CN101889081B (zh) 酮还原酶多肽及其用途
CN101784669B (zh) 用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽
CN101855342B (zh) 用于还原苯乙酮的酮还原酶多肽
CN102405281B (zh) 转氨酶生物催化剂
CN102341494B (zh) 转氨酶多肽
CN102597226B (zh) 转氨酶反应
CN101883846A (zh) 用于生成氮杂环丁酮的还原酶多肽
US11634695B2 (en) Vectors for expression of biocatalysts
CN104428313A (zh) 工程化亚胺还原酶以及用于酮和胺化合物的还原胺化的方法
CN110831618B (zh) 酮还原酶多肽及多核苷酸
SG172783A1 (en) Enone reductases
US11845968B2 (en) Engineered deoxyribose-phosphate aldolases
CN105008528A (zh) 用于合成手性胺的工程化的生物催化剂和方法
CA3155659A1 (en) Ketoreductase polypeptides and polynucleotides
IL296841A (en) Transaminase transaminase polypeptides
WO2023150568A2 (en) Engineered enone reductase and ketoreductase variant enzymes
CN116731991A (zh) 单胺氧化酶及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant