CN112048485A - 一种制备西他列汀的工程化转氨酶多肽 - Google Patents

一种制备西他列汀的工程化转氨酶多肽 Download PDF

Info

Publication number
CN112048485A
CN112048485A CN201910493876.7A CN201910493876A CN112048485A CN 112048485 A CN112048485 A CN 112048485A CN 201910493876 A CN201910493876 A CN 201910493876A CN 112048485 A CN112048485 A CN 112048485A
Authority
CN
China
Prior art keywords
polypeptide
gly
seq
leu
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910493876.7A
Other languages
English (en)
Other versions
CN112048485B (zh
Inventor
陈海滨
罗霄
蔡宝琴
尚传洋
孙磊
马可·博科拉
胡东晓
王子坤
俞嘉薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enzymaster Ningbo Bio Engineering Co Ltd
Original Assignee
Enzymaster Ningbo Bio Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enzymaster Ningbo Bio Engineering Co Ltd filed Critical Enzymaster Ningbo Bio Engineering Co Ltd
Priority to CN201910493876.7A priority Critical patent/CN112048485B/zh
Publication of CN112048485A publication Critical patent/CN112048485A/zh
Application granted granted Critical
Publication of CN112048485B publication Critical patent/CN112048485B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/182Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了可用于在工业相关条件下合成西他列汀中间体的工程化转氨酶多肽。本发明还提供了编码工程化转氨酶多肽的多核苷酸、能够表达工程化转氨酶的宿主细胞和使用工程化转氨酶多肽制备西他列汀中间体的方法。本发明的工程化转氨酶多肽由来源于Aspergillus fumigatus的野生型转氨酶经过定向进化的方法所开发而来。与其他制备西他列汀中间体的转氨酶相比,本发明的工程化转氨酶多肽具有更佳的活性和/或稳定性,使得酶的制备和转氨反应的操作更加简单,因此具有很好的工业应用前景。

Description

一种制备西他列汀的工程化转氨酶多肽
技术领域
本发明属于生物工程技术领域,具体涉及一种制备西他列汀的工程化转氨酶多肽。
背景技术
糖尿病是由人体自身代谢紊乱引发的一种全身慢性进行性疾病,主要的致病因素是胰岛素绝对或相对缺乏。糖尿病还会引发各种组织,特别是眼、肾、心脏、血管、神经的慢性损害、功能障碍等多种并发症。糖尿病有四大类型:I型糖尿病、II型糖尿病、其他特殊类型糖尿病和妊娠糖尿病、继发性糖尿病。其中II型糖尿病(即非胰岛素依赖型)占90%以上,多见于30岁以上的中老年人,该类型患者其胰岛素分泌量并不低有些甚至还偏高,但机体对胰岛素不敏感,因此患者体内的胰岛素是一种相对缺乏,可以通过某些口服药物刺激体内胰岛素的分泌。在临床上治疗II型糖尿病的药物,除了注射胰岛素,主要手段是口服人工合成降血糖药物。目前用于临床的药物主要有磺酰脲类--胰岛素分泌促进剂、双胍类--胰岛素敏感性增强剂、噻唑烷二酮类--胰岛素增敏剂、α-葡萄糖苷酶抑制剂、非磺酰脲类等。虽然上述药物降糖作用较为理想,但均有一定的副作用。而新型的二肽基肽酶-4(DPP-4)抑制类药物西他列汀磷酸盐的降糖作用较为适中,其单用或与二甲双胍、吡格列酮合用都有明显的降血糖作用,且服用安全,耐受性好,不良反应少。
西他列汀磷酸盐是由美国默克公司开发的,于2006年10月被美国FDA批准治疗II型糖尿病的药物,商品名为捷诺维(Januvia)。西他列汀磷酸盐合成中的关键步骤是手性氨基中间体的构建。目前公布的合成方法大都需用到催化剂,可以分为金属催化合成和酶催化合成两大类。就金属催化合成法而言,公开的专利包括WO2004087650、WO2005003135、WO2007050485等,所使用的金属催化剂包括钌、铂、钯或铑,这些催化剂价格昂贵,从产品中去除或回收这些金属催化剂也较为困难;同时,使用金属催化剂的工艺所生成的手性氨基中间体的手性纯度不够高,需要进一步通过重结晶等方法才能达到药典的要求。就酶催化合成法而言,公开的文献有“Biocatalytic Asymmetric Synthesis of Chiral Aminesfrom Ketones Applied to Sitagliptin Manufacture,Science,2010,v329(issue5989),pp.305-309”,专利包括WO2010099501、CN105018440、CN107384887等。这些资料所公开的用来合成手性氨基中间体或西他列汀的酶催化剂均为转氨酶,且都是在不同野生型转氨酶的基础上经过人为的突变和筛选或定向进化过程得到的工程化转氨酶。公开的资料显示,由于西他列汀手性氨基中间体的特殊化学结构,自然界中存在的野生型的转氨酶,要么无法催化该手性氨基中间体的合成反应,要么催化的活性很低,无法用于工业化生产;经过定向进化后得到的工程化转氨酶,在获得催化合成该手性氨基中间体的活性的基础上,需要在稳定性和对反应溶剂的耐受性上也要有所提升(底物水溶性差,需要在酶催化反应中添加有机溶剂),才能满足工业化生产对成本和环保方面的要求。相比于金属催化剂,酶催化合成手性氨基中间体的立体选择性高,转氨产物的ee值可达到99%或以上(直接满足药典的要求),且反应条件温和,目前工业生产上采用人为改造过的转氨酶来催化西他列汀或其中间体的合成。
但目前公开的用于合成西他列汀中间体的转氨酶还是有很多不足。比如WO2010099501报道的Codexis公司开发的工程化转氨酶(野生型来源于Arthrobactersp.),对溶剂DMSO有很好的耐受性,但对醇类溶剂的耐受性不好;在酶催化反应中使用DMSO,由于DMSO沸点高,难以从反应体系中去除,使得反应产物在提纯过程中损失较大,导致成本较高。CN105018440中,南京博优康远生物医药科技有限公司对分支杆菌(Mycobacterium vanbaalenii)PYR-1来源的转氨酶进行改造得到的工程化转氨酶,用以合成一个相对简单的西他列汀中间体:R-3-氨基-4-(2,4,5-三氟苯基)-丁酸甲酯;虽然CN105018440中公开的工程化转氨酶对乙醇等醇类溶剂有很好的耐受性(所用溶剂为50%的乙醇,有利于产物的提纯),但催化活性不高,需要加入10g/L的酶蛋白,且转氨反应的产物需要经Boc保护后才能进一步转化为Boc保护的西他列汀,脱保护后得到西他列汀,整体收率不高,导致成本较高。CN107384887中,何人宝等人筛选得到了一种源于唐菖蒲伯克霍尔德氏菌(Burkholderia gladioli)的转氨酶,并对其进行了工程化改造。虽然CN107384887中公开的工程化转氨酶可直接以西他列汀前体酮为底物,但其活性不够高,需要用到50g/L的湿菌体才能达到较高的转化率,且反应体系中依然用DMSO作为溶剂;高浓度的湿菌体使得反应体系成分极为复杂,对反应后处理和产物提出非常不利,同时DMSO的去除也使得产物的分离收率受限。
发明内容
1概述
本发明要解决的技术问题是克服现有技术中用于合成西他列汀或其手性氨基中间体的工程化转氨酶的不足,提供了直接以西他列汀前体酮为底物的、活性更好、对醇类溶剂耐受性更好、且热稳定性更好的工程化转氨酶。本发明提供的工程化转氨酶允许用热处理的方式将转氨酶从工程菌裂解液中简单、快速地纯化出来,且纯化后的酶液可以直接用于以甲醇为溶剂的反应体系中,催化合成西他列汀的反应,产物ee值≥99.7%,直接满足药典的要求,能够实现成本更低、操作更简单、环境更友好的西他列汀的酶法合成工艺。
本发明提供了一种催化活性高、立体选择性强、溶剂耐受性好、且热稳定性好的工程化转氨酶多肽,能够转化3-羰基-1-[3-(三氟甲基)-5,6,7,8-四氢-1,2,4-***并[4,3-a]吡嗪-7-基]-4-(2,4,5-三氟苯基)丁-1-酮(“西他列汀前体酮”或A-1所示化合物)为(3R)-3-氨基-1-[3-(三氟甲基)-5,6,7,8-四氢-1,2,4-***并[4,3-a]吡嗪-7-基]-4-(2,4,5-三氟苯基)丁-1-酮(“西他列汀”或A-2所示化合物),该反应如图1所示。本发明提供了合成西他列汀磷酸盐的整体酶-化学合成方法。本发明还提供了该工程化转氨酶多肽的基因,含有该基因的重组表达载体、表达工程化转氨酶多肽的工程菌及其高密度发酵方法,以及该工程化转氨酶多肽在催化A-1不对称转氨合成A-2中的应用。
本发明提供的工程化转氨酶多肽包括具有图1所示活性的,且在对应以下的残基位置与SEQ ID NO:2序列相比的一个或多个残基差异的氨基酸序列:X3,X4,X9,X15,X20,X27,X36,X40,X41,X53,X60,X61,X62,X76,X78,X92,X93,X97,X98,X101,X113,X114,X115,X116,X122,X126,X128,X130,X137,X148,X153,X155,X159,X186,X187,X188,X190,X194,X209,X214,X226,X235,X244,X253,X262,X263,X266,X271,X273,X275,X279,X287,X290,X312,X323。本发明提供的工程化转氨酶多肽包括包含以下特征至少之一的氨基酸序列:S3T,M4I,S9A,Q15K,R20A,K27Q,L36F,S40Y,D41E,H53G,V60G,I61F,S62H,Q76H,I78L,A92P,L93V,K97R,N98K,A101V,A101I,F113M,V114G,E115K,E115L,V116I,L122M,R126Q,S128R,S128M,P130D,N137E,V148L,N153K,N153D,L155R,E159S,L186F,T187I,T187N,K188R,L190M,M194K,N209H,S214P,I226L,R235E,D244E,I253V,I253T,Q262A,Q262T,A263C,S266A,M271C,T273S,A275G,M279C,Q287K,N290G,P312A,P312D,G323D;或同时在这些差异的基础上,包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18、20、21、22、23、24、25或更多个氨基酸残基的***或缺失。
更具体的,在一些实施方案中,在SEQ ID NO:2基础上改进的工程化转氨酶多肽包括对应SEQ ID No:4、6、8、10、12所示氨基酸序列组成的多肽。
在一些实施方案中,改进的工程化转氨酶多肽包括与SEQ ID No:4、6、8、10、12的参考序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。
两条氨基酸序列或两条核苷酸序列之间的同一性均可通过本领域常用的算法得到,可采用NCBI Blastp和Blastn软件根据默认参数计算得到,也可采用采用Clustal W算法(Nucleic Acid Research,22(22):4673-4680,1994)。比如用采用Clustal W算法,SEQID NO:2与SEQ ID NO:12的氨基酸序列同一性为83.3%。
在另一方面,本发明提供了编码工程化转氨酶多肽的多核苷酸序列。在一些实施方案中,多核苷酸可以是具有用于表达工程化转氨酶多肽的一种或多种控制序列的表达载体的部分。在一些实施方案中,多核苷酸可包括对应SEQ ID No:3、5、7、9、11所示序列的多核苷酸序列。
如本领域技术人员所知,由于核苷酸密码子的简并性,编码SEQ ID No:4、6、8、10、12的氨基酸序列的多核苷酸序列不仅仅局限于SEQ ID No:3、5、7、9、11。编码本发明的工程化转氨酶的核酸序列也可以是编码序列表中SEQ ID No:4、6、8、10、12所示氨基酸序列的其他任何核酸序列。
在另一方面,本公开内容提供包含编码工程化转氨酶的多核苷酸或能够表达工程化转氨酶的表达载体和宿主细胞。在一些实施方案中,宿主细胞可以是细菌宿主细胞,比如大肠杆菌。宿主细胞可用于表达和分离本文所述的工程化转氨酶,或可选地直接用于反应转化底物为产物。
在一些实施方案中,以完整细胞、粗提取物、分离的多肽或纯化的多肽形式的工程化转氨酶可单独使用,或以固定化形式(比如固定在树脂上)使用。
本公开内容还提供了使用本文公开的工程化转氨酶多肽将结构式A-1所示的酮底物转化为结构式A-2所示的手性胺化合物的方法,所示结构式A-2的手性胺产物与相应的对映异构体相比过量,所述方法包括在适于转化A-1为A-2的反应条件下,将结构式A-1的酮底物和氨基供体与转氨酶多肽接触,其中所述转氨酶多肽是本文所述的工程化转氨酶多肽。在一些实施方案中,所述工程化转氨酶多肽与SEQ ID NO:2具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性并能够将结构式A-1的酮底物转化为结构式A-2的胺产物。
在一些实施方案中,结构式A-2的胺产物以至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更大的对映体过量产生。
用于该方法的工程化的转氨酶多肽的具体实施方案在详述中进一步提供。可用在以上方法中的改进的工程化转氨酶多肽可包括选自对应SEQ ID NO:4、6、8、10、12的氨基酸序列。
如本文公开的使用工程化多肽用于制备式A-2化合物的方法中的任一种可在一系列合适的反应条件下被执行,所述一系列合适的反应条件包括但不限于氨基供体、pH、温度、缓冲液、溶剂***、底物载量、多肽载量、辅因子载量、压力和反应时间的范围。例如,在一些实施方案中,制备式A-2化合物可被执行,其中合适的反应条件包括:(a)约1g/L至200g/L的底物化合物A-1的载量;(b)约0.1g/L至50g/L工程化多肽;(c)约10g/L至300g/L的氨基供体载量;(d)约0.1mM至5mM的PLP辅因子浓度;(e)约0%(v/v)至约60%(v/v)的有机溶剂,这里所述的有机溶剂包括但不限于二甲基亚砜(DMSO)、二甲基甲酰胺(DMF)、甲基叔丁基醚(MTBE)、乙酸异丙酯、甲醇、乙醇或丙醇;(f)约7.0至约11.0的pH;和(g)约10℃至60℃的温度。
2详述
2.1定义
关于本公开内容,除非另外明确定义,否则本文说明书中使用的技术术语和科学术语具有本领域普通技术人员通常理解的含义。
“蛋白”、“多肽”和“肽”在本文可互换使用,表示由酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(如,糖基化、磷酸化、脂质化、豆蔻酰化、泛素化等等)。该定义包括D-氨基酸和L-氨基酸、以及D-氨基酸和L-氨基酸的混合物。
“工程化转氨酶”、“工程化转氨酶多肽”、“改进的转氨酶多肽”和“工程化多肽”在本文可互换使用。
“菌体”或“湿菌体”指表达了多肽或工程化多肽的宿主细胞,包括实施例3和实施例7所示的制备过程所得到的湿菌体。
“多核苷酸”和“核酸”在本文可互换使用。
本文使用的“辅因子”指在催化反应中与酶联合起作用的非蛋白化合物。如本文使用的,“辅因子”意图包括维生素B6家族化合物的磷酸吡哆醛(pyridoxal-5'-phosphate,或PLP),pyridoxine(pyridoxol,或PN),pyridoxal(PL),pyridoxamine(PM),pyridoxinephosphate(PNP)和pyridoxamine phosphate(PMP),其有时也被称作辅酶。
“PLP”、“磷酸吡哆醛”、“吡哆醛5’-磷酸”、“PYP”和“P5P”在本文可互换地使用,来指在酶催化反应中用作辅因子的化合物。
“编码序列”指编码蛋白的氨基酸序列的核酸部分(例如,基因)。
“天然存在的”或“野生型”是指在自然界发现的形式。例如,天然存在的或野生型的多肽或多核苷酸序列是存在于生物体中、可分离自自然界中的来源且未通过人工操作有意地修饰的序列。
“重组”的或“工程化”的或“非天然存在”的当用于指例如细胞、核酸或多肽时,是指如下材料或与该材料的天然形式或固有形式相对应的材料:所述材料以自然界中不会存在的方式被改变,或与其相同但是从合成材料和/或通过使用重组技术操作而产生或获取。
“序列同一性”在本文用于指多核苷酸之间或多肽之间的对比(“序列同一性”通常以百分比的形式来表示),且通过在比较窗口上比较两个最佳对齐的序列来确定,其中多核苷酸或多肽序列在比较窗口中的部分与参照序列相比可包括添加或缺失(即,空位),用于两个序列的最佳对齐。百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基的位置数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中位置总数并将结果乘以100以得到序列同一性百分比。可选地,该百分比可通过以下计算:确定相同核酸碱基或氨基酸残基在两个序列中都存在的位置数或核酸碱基或氨基酸残基与空位对齐的位置数以得到匹配位置数,将该匹配位置数除以比较窗口中的位置总数,并将结果乘以100以得到序列同一性的百分比。本领域技术人员将认识到,存在许多可用于比对两个序列的建立的算法。用于比较的序列最佳比对可例如通过Smith和Waterman,1981,Adv.Appl.Math.2:482的局部同源性算法、通过Needleman和Wunsch,1970,J.Mol.Biol.48:443的同源性比对算法,通过Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA85:2444的相似性搜索方法,通过这些算法的计算机实现(GCGWisconsin软件包中的GAP、BESTFIT、FASTA或TFASTA)或通过直观检查(一般参见,Current Protocols in Molecular Biology,F.M.Ausubel等编著,Current Protocols,Greene Publishing Associates Inc.和JohnWiley&Sons,Inc.之间的合资企业,(1995年增刊)(Ausubel))。适宜于确定序列同一性和序列相似性百分比的算法的实例是BLAST和BLAST2.0算法,它们分别描述于Altschul等人,1990,J.Mol.Biol.215:403-410和Altschul等,1977,Nucleic Acids Res.3389-3402中。用于执行BLAST分析的软件是通过美国国家生物技术信息中心(National Center forBiotechnology Information)网站公开可用的。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP),所述短字与数据库序列中相同长度的字比对时匹配或满足一些正值的阀值得分T。T被称作邻近字评分阈值(Altschul等,如上述)。这些初始相邻字匹配(word hit)充当用于启始搜索的种子来寻找包含它们的更长的HSP。然后字匹配沿着每个序列在两个方向延伸到累积比对得分不能够增加的程度。对于核苷酸序列,累积得分使用参数M(对于匹配残基对的奖励得分;永远>0)和N(对于错配残基的惩罚得分;永远<0)计算。对于氨基酸序列,得分矩阵被用于计算累计得分。当以下情况时,每个方向中的字匹配字串的延伸被终止:累积比对得分从其最大达到值下降了量X;由于累积一个或多个负得分残基比对,累积得分达到0或以下;或到达任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)使用字长(W)11、期望值(E)10、M=5、N=-4以及两链的比较作为默认值。对于氨基酸序列,BLASTP程序使用以下作为缺省值:字长(W)为3,期望值(E)为10和BLOSUM62得分矩阵(见Henikoff和Henikoff,1989,Proc NatlAcad Sci USA89:10915)。序列比对和序列同一性%的示例性确定可使用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用所提供的缺省参数。
“参考序列”是指用作序列比较的基础的限定序列。参考序列可以是较大序列的子集,例如,全长基因或多肽序列的片段。一般而言,参考序列为至少20个核苷酸或氨基酸残基长,至少25个残基长,至少50个残基长,或者核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1)包括在两种序列之间相似的序列(即,完整序列的一部分),且(2)可以进一步包括在两种序列之间不同的序列,两种(或更多)多核苷酸或多肽之间的序列比较通常通过在“比较窗口”内比较两种多核苷酸或多肽的序列来进行以鉴定和比较序列相似性的局部区域。在一些实施方案中,“参照序列”不意为限于野生型序列,且可包括工程化或改变的序列。例如,“在对应于X101的残基处具有异亮氨酸的基于SEQ ID NO:2的参考序列”指其中在SEQ ID NO:2中的X101处相应的残基(是丙氨酸)已经改变成异亮氨酸的参考序列。
“比较窗口”指至少约20个相邻核苷酸位置或者氨基酸残基的概念性片段,其中序列可以与至少20个相邻核苷酸或氨基酸的参考序列相比较,并且其中比较窗口中的序列的部分可以包括与参考序列(其不包括添加或缺失)相比20%或更少的添加或缺失(即,空位),用于两序列的最佳比对。比较窗口可以长于20个相邻残基,并且包括任选地30、40、50、100或更长的窗口。
在用于指定的氨基酸或多核苷酸序列的编号的情况下,"相应于"、"参考于"或"相对于"指当指定的氨基酸或多核苷酸序列与参考序列相比较时指定的参考序列残基的编号。换言之,给定序列的残基编号或残基位置是根据参考序列指定的,而不是给定氨基酸或多核苷酸序列内的残基的实际数字位置指定的。例如,可以将给定的氨基酸序列诸如工程化多肽的氨基酸序列与参考序列进行比对,这是通过引入空位以优化这两条序列之间的残基匹配而实现的。在这些情况下,虽然存在空位,但是给定氨基酸或多核苷酸序列中的残基编号相对于已与其比对的参考序列制定。
“氨基酸差异”或“残基差异”指在多肽序列的一个位置处氨基酸残基相对于参考序列中相应位置处的氨基酸残基的差异。本文中氨基酸差异的位置一般被称为“Xn”,其中n指残基差异基于其的参考序列中的相应位置。例如,“与SEQ ID NO:2相比在位置X101处的残基差异”指在相应于SEQ ID NO:2多肽的位置101处的氨基酸残基的差异。因此,如果SEQID NO:2的参考多肽在位置101处具有丙氨酸,那么“与SEQ ID NO:2相比在位置X101处的残基差异”是指在相应于SEQ ID NO:2的位置101的多肽位置处除了丙氨酸之外的任何残基的氨基酸取代。在本文的大多数实例中,在一个位置处的特定氨基酸残基差异表示为“XnY”,其中“Xn”指如以上描述的对应位置,并且“Y”为在工程化多肽中发现的氨基酸的一字母标识符(即,与参考多肽中的不同的残基)。在一些实例中(例如,在表2中),本公开内容还提供由常规符号“AnB”表示的特定氨基酸差异,其中A为参考序列中的残基的一字母标识符,“n”为在参考序列中的残基位置的编号,并且B为工程化多肽的序列中残基取代的单字母标识符。在一些实例中,本公开内容的多肽可包含相对于参考序列的一个或更多个氨基酸残基差异,其通过相对于参考序列存在残基差异处的特定位置的列表表示。
“缺失”指通过从参考多肽去除一个或更多个氨基酸而对多肽的修饰。缺失可以包括除去1个或多个、2个或多个氨基酸,5个或多个氨基酸,10个或多个氨基酸,15个或多个氨基酸,或20个或多个氨基酸,多达组成参照酶的氨基酸总数的10%,或多达组成参照酶的氨基酸总数的20%,同时保留工程化转氨酶多肽对图1所示反应的活性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或者可以是不连续的。
"***"指通过从参考多肽添加一个或多个氨基酸的多肽的修饰。在一些实施方案中,本文公开的工程化多肽包括一个或更多个氨基酸***天然存在的转氨酶多肽,以及一个或更多个氨基酸***其他工程化多肽。可在多肽的内部部分***,或***到羧基或氨基末端。如本文所用的,***包括本领域中已知的融合蛋白。***可以是氨基酸的连续区段,或者被在天然存在的多肽中一个或更多个氨基酸分隔。
如本文所用的"片段"指具有氨基末端和/或羧基末端缺失、但是其中保留的氨基酸序列与序列中相应的位置相同的多肽。片段可以为至少10个氨基酸长、至少20个氨基酸长,至少50个氨基酸长或更长,以及高达全长工程化多肽的70%、80%、90%、95%、98%和99%。
“分离的多肽”或“纯化的多肽”是指如下多肽:所述多肽基本上与其天然伴随的其他物质例如蛋白、脂质和多核苷酸分离。该术语包括已从其天然存在的环境或表达***(例如,宿主细胞或体外合成中)移去或纯化的多肽。工程化多肽可以存在于细胞内、存在于细胞培养基中或者以各种形式制备,诸如裂解液或分离的制备物。像这样,在一些实施方案中,工程化多肽可以是分离的多肽。
“手性中心”是指连接四个不同基团的碳原子。
“立体选择性”(stereoselectivity)指在化学或酶促反应中一种立体异构体相对于另一种或多种异构体的优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于另一种异构体;或可以是完全的,其中仅形成一种立体异构体。当立体异构体是对映异构体时(enantiomers),立体选择性被称为对映异构体选择性(enantioselectivity),一种对映异构体在两种对映异构体的混合物之中的过量分数(通常被报告为百分比)通常被可选地报告为“对映异构体过量”(enantiomeric excess,简称为ee)。在本领域内该分数(典型地为百分比)通常可选择地报道为根据下式从中计算的对映异构体过量(enantiomeric excess,即ee):{主要对映异构体浓度–次要对映异构体浓度}/{主要对映异构体浓度+次要对映异构体浓度}。
“立体异构体”、“立体异构形式”和类似表述在本文可互换使用,是指分子差异仅在其原子在空间中的方位不同所造成的所有异构体。其包括对映异构体和具有多于一个手性中心、且彼此不是镜像的化合物的异构体(即“非对映异构体”)。
“改进的酶性质”指与参考序列相比,工程化多肽显示的任何酶性质的改进,所述参考序列诸如野生型转氨酶SEQ ID No:2。期望改进的酶性质包括,但不限于,酶活性(其可以底物的转化百分比的方式被表示)、热稳定性、溶剂稳定性(例如,针对醇类化合物的稳定性)、pH活性特征、辅因子需求、对抑制物的耐受性(例如,底物或产物抑制)、立体特异性和立体选择性。
“转化”指底物向相应的产物的酶促转化。“转化百分比”或“转化率”是指在指定反应条件下在指定的反应时间内,反应体系中被转化为产物的底物的百分比。因此,转氨酶或工程化多肽的“酶活性”或“活性”可以被表示为底物向产物的“转化百分比”。转化率一般通过取样来测定反应体系中的产物A-2的摩尔浓度和底物A-1的摩尔浓度来计算:{A-2的摩尔浓度}/{[A-1的摩尔浓度]+[A-2的摩尔浓度]}。
“热稳定的”指与野生型酶相比,工程化多肽在暴露于升高的温度(例如80℃或更高温度)持续一段时间(例如0.5小时或更长时间)之后维持相似活性。
“溶剂稳定的”或“溶剂耐受的”指与野生型酶相比,工程化多肽在暴露于不同浓度(例如5-99%)的溶剂(甲醇、乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)持续一段时间(例如0.5-24小时)之后维持相似的活性。
“合适的反应条件”指生物催化反应溶液中的那些条件(例如,酶载量、底物载量、氨基供体的载量、辅因子载量、温度、pH、缓冲液、共溶剂等的范围),在该条件下本公开内容的工程化多肽能将底物转化成期望的产物化合物。示例性“合适的反应条件”被提供于本公开内容并通过实施例例证。
化合物可以其化学结构和/或化学名标明。当化学结构与化学名冲突时,化学结构决定化合物的身份。
2.2定向进化过程和所开发得到的工程化转氨酶
本发明公开的工程化转氨酶多肽,是由一种野生型的转氨酶(transaminase),经过创造性的定向进化过程的改造,发生一定数量的氨基酸残基置换、***或缺失等突变而来;定向进化技术的介绍可参考“Directed Evolution:Bringing New Chemistry toLife”Frances H.Arnold,Angewandte Chemie,November 28,2017。(由于对酶定向进化技术的开创性贡献,Frances H.Arnold获得了2018年的诺贝尔化学奖。)该野生型的转氨酶来源于烟曲酶(Aspergillus fumigatus),其氨基酸序列如SEQ ID NO:2所示。经发明人检测,SEQ ID No 2所对应的野生型转氨酶对A-1没有活性,不能催化图1所示的反应,对甲醇的耐受性差,热稳定性也差。
为了开发出用于图1所示反应的、性能优异的工程化转氨酶,本发明设计并执行了5个定向进化的研发阶段,如表1所示。每个阶段研发的重点不同,且针对性地采取了不同的筛选反应条件;每个阶段所开发得到的最优的工程化转氨酶多肽如表2所示。
表1定向进化的五个阶段
Figure BDA0002087915510000071
在定向进化阶段I,目的是开发出对图1所示反应有活性的SEQ ID NO:2的突变体。根据SEQ ID NO:2所对应的蛋白的晶体结构(PDB ID:4CHI),发明人运用生物信息学的技术手段,设计并构建了针对多个残基的定点饱和突变文库或多点组合突变文库,然后采用表1所示的筛选反应条件对这些文库进行筛选,得到了首个由SEQ ID NO:2突变而来的对图1所示反应有活性的工程化转氨酶多肽,该工程化转氨酶多肽的氨基酸序列如SEQ ID NO:4所示。与SEQ ID NO:2相比,SEQ ID NO:4有10个氨基酸突变:V60G,I61F,S62H,F113M,E115K,V148L,T187I,L190M,S214P和A275G;这些氨基酸突变分布在催化活性中心附近。
构建突变文库的方法可采用本领域常见的定点突变PCR(如实施例2所示)、或多点突变PCR(参考“Mutagenesis and Synthesis of Novel Recombinant Genes Using PCR,”Chapter 32,in PCR Primer,2nd edition(eds.Dieffenbach and Dveksler).ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,USA,2003.)
在定向进化阶段II和阶段III,目的是开发出对图1所示反应活性更高的突变体,同时提升工程化转氨酶多肽在大肠杆菌宿主中的表达量。阶段II所得到的最优工程化转氨酶的氨基酸序列如SEQ ID NO:6所示。与SEQ ID NO:4相比,SEQ ID NO:6有8个新增的氨基酸突变,这些氨基酸突变也主要分布在催化活性中心附近。
阶段III所得到的最优工程化转氨酶的氨基酸序列如SEQ ID NO:8所示。与SEQ IDNO:6相比,SEQ ID NO:8有18个新增的氨基酸突变。这些氨基酸突变主要分布在催化活性中心附近,也有一些分布在整个蛋白质序列的氮端(即S3T和S9A),这些分布在氮端的突变被认为会提升工程化转氨酶多肽在大肠杆菌宿主中的表达量。
在阶段I、II和III的筛选反应体系中,DMSO被用来作为协助底物A-1(即西他列汀前体酮)溶解的溶剂。一般来说,与甲醇等醇类溶剂相比,DMSO对酶的伤害较小,在筛选反应中使用DMSO有利于筛选出特异活性有提升的突变酶。在阶段III结束后,工程化转氨酶SEQID NO:8对底物A-1的活性已经很显著了,其在以甲醇为溶剂的筛选反应体系中对A-1也有明显的转化。所以从阶段IV开始,筛选反应采用甲醇为溶剂,以进化出对甲醇耐受性好的工程化转氨酶。考虑到图1所示反应会生成丙酮,所以在阶段IV和V的筛选反应条件中,也在反应体系中加入了一定量的丙酮,以期望开发出对丙酮有一定耐受能力的工程化转氨酶。阶段IV所得到的最优工程化转氨酶的氨基酸序列如SEQ ID NO:10所示。与SEQ ID NO:8相比,SEQ ID NO:10有8个新增的氨基酸突变,这些氨基酸突变除了分布在催化活性中心附近以外(比如E115L和M279C),也分布在蛋白质四级结构中单体间的接触面(比如P130D),以及蛋白质四级结构中暴露在表面的部分(比如A101I和N290G)。
为了在提升活性和对甲醇耐受性的同时,进化出热稳定性更好的工程化转氨酶,在阶段V的筛选反应条件中,增加了对酶液进行热处理的步骤。阶段V所得到的最优工程化转氨酶的氨基酸序列如SEQ ID NO:12所示。与SEQ ID NO:10相比,SEQ ID NO:12有9个新增的氨基酸突变,这些氨基酸突变除了分布在催化活性中心附近以外(比如Q15K、R20A、K27Q),也分布在蛋白质四级结构中单体间的接触面(比如N137E和A263C),以及蛋白质四级结构中暴露在表面的部分(比如Q76H、A92P、L93V和K97R)。
从生物信息学的角度看,一般认为,蛋白质四级结构中催化活性中心及附近的氨基酸的突变,与催化活性有很强的相关性;蛋白质四级结构中单体间接触面上的氨基酸的突变,以及蛋白质四级结构中暴露在表面的氨基酸的突变,与蛋白质的溶剂耐受性和热稳定性有很强的相关性。
表2
Figure BDA0002087915510000081
Figure BDA0002087915510000091
表2中,每一行给出一个具体的工程化转氨酶多肽的核苷酸序列编号和氨基酸序列编号;也给出了每一个工程化转氨酶多肽与SEQ ID No:2相比较的残基差异,以及和SEQID No:2相比较的序列同一性。氨基酸序列同一性的计算采用Clustal W算法(NucleicAcid Research,22(22):4673-4680,1994)。
2.3可用于制备工程化转氨酶多肽的多核苷酸、控制序列、表达载体和宿主细胞
在另一方面,本公开内容提供了编码本文描述的具有转氨酶活性的工程化多肽的多核苷酸。多核苷酸可与控制基因表达的一种或多种异源调控序列可操作地连接以产生能够表达多肽的重组多核苷酸。包含编码工程化转氨酶的异源多核苷酸的表达构建体可被引入合适的宿主细胞以表达相应的工程化转氨酶多肽。
如对本领域技术人员明显的是,蛋白序列的可得性和相应于多种氨基酸的密码子的知识提供能够编码目标蛋白序列的所有多核苷酸的说明。其中相同氨基酸由可选择的或同义密码子编码的遗传密码的简并性允许产生极大数目的核酸,所有这些核酸编码本文公开的改进的转氨酶多肽。因此,确定特定的氨基酸序列后,本领域的技术人员可以以不改变蛋白质的氨基酸序列的方式通过仅仅修饰一个或多个密码子的序列来产生任何数目的不同的核酸。在这点上,本公开内容特别地构思了可通过基于可能的密码子选取而选择组合来制备的多核苷酸的各个和每个可能的改变,并且对于本文公开的任何多肽,包括在表2中提供的示例性工程化多肽的氨基酸序列,以及在通过引用并入本文的序列表中作为SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12的序列公开的任何多肽,所有这些改变被认为特别地公开。
在多种实施方案中,密码子被优选地选择以适应在其中产生蛋白的宿主细胞。例如,用于细菌的优选密码子用于表达细菌中的基因;用于酵母中的优选密码子用于在酵母中表达;且用于哺乳动物的优选密码子用于在哺乳动物细胞中表达。
在一些实施方案中,所述多核苷酸编码包含与选自SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12的参考序列至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列的转氨酶多肽,其中所述多肽具有转氨酶活性以及本文描述的改进的特性中的一种或更多种,例如以与SEQ ID NO:2的多肽相比增加的活性将化合物A-1转化成产物化合物A-2的能力。
在一些实施方案中,所述多核苷酸编码工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:2相比具有以上描述的同一性百分比并且具有一个或更多个氨基酸残基差异的氨基酸序列。在一些实施方案中,本公开内容提供了具有转氨酶活性的工程化多肽,所述工程化多肽包含与SEQ ID NO:2的参考序列具有至少80%的序列同一性以及具有选自以下位置的残基差异的组合:X3,X4,X9,X15,X20,X27,X36,X40,X41,X53,X60,X61,X62,X76,X78,X92,X93,X97,X98,X101,X113,X114,X115,X116,X122,X126,X128,X130,X137,X148,X153,X155,X159,X186,X187,X188,X190,X194,X209,X214,X226,X235,X244,X253,X262,X263,X266,X271,X273,X275,X279,X287,X290,X312,X323。
在一些实施方案中,编码工程化转氨酶多肽的多核苷酸包含选自SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11的序列。
在一些实施方案中,所述多核苷酸编码本文所述的多肽,但是在核苷酸水平上与编码工程化转氨酶的参考多核苷酸具有约50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9和SEQ ID NO:11的序列。
编码工程化转氨酶多肽的分离的多核苷酸可以多种方法***作以提供多肽的表达,所述方法包括通过密码子优化来进一步改变序列以改进表达、在合适的有或无另外的控制序列的表达元件中***、和转化入适于表达并产生多肽的宿主细胞。
取决于表达载体,在分离的多核苷酸***载体之前对分离的多核苷酸的操作可以是期望的或必需的。利用重组DNA方法修饰多核苷酸和核酸序列的技术在本领域中是公知的。在以下中提供了指导:Sambrook等人,2001,Molecular Cloning:A LaboratoryManual,第三版,Cold Spring Harbor Laboratory Press;和Current Protocols inMolecular Biology,Ausubel.F.编著,GreenePub.Associates,1998,2010年更新。
在另一个方面,本公开还涉及重组表达载体,根据它们将被导入的宿主的类型,其包括编码工程化转氨酶多肽或其变体的多核苷酸,和一个或多个表达调节区,诸如启动子和终止子、复制起点等等。可选地,本公开内容的核酸序列可以通过使核酸序列或包括该序列的核酸构建体***到适当的表达载体中来表达。在产生表达载体时,编码序列位于载体中以使编码序列被可操作地连接于用于表达的合适的控制序列上。
重组表达载体可为任何载体(例如,质粒或病毒),其可方便地应用于重组DNA步骤中并且可带来多核苷酸序列的表达。载体的选择通常将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性或闭合环状的质粒。表达载体可以是自主复制的载体,即作为染色体外的实体而存在的载体,它的复制独立于染色体的复制,如质粒、染色体外的元件、微小染色体、或人工染色体。载体可以包含用于保证自我复制的任何工具。可选地,载体可以是在被引入到宿主细胞中时整合到基因组中并且与其所整合到的染色体一起复制的载体。而且,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总DNA的两种或多种载体或质粒。
对本公开内容的实施方案有用的很多表达载体是商业上可得的。示例性表达载体可通过将编码改进的转氨酶多肽的多核苷酸可操作地连接到质粒pACYC-Duet-1(Novagen)中来制备。
在另一方面,本公开内容提供包含编码本公开内容的改进的转氨酶多肽的多核苷酸的宿主细胞,所述多核苷酸被可操作地连接至在宿主细胞中用于转氨酶的表达的一个或更多个控制序列。用于表达由本公开内容的表达载体编码的多肽的宿主细胞在本领域是公知的,并且包括但不局限于诸如大肠杆菌、节杆菌属种KNK168、链霉菌属和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞的细菌细胞;诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤氏酵母(Pichia pastoris))的真菌细胞;诸如果蝇S2以及灰翅夜蛾(Spodoptera)Sf9细胞的昆虫细胞;诸如CHO、COS、BHK、293和Bowes黑色素瘤细胞的动物细胞;以及植物细胞。示例性的宿主细胞为大肠杆菌BL21(DE3)。上述宿主细胞可以是野生型的,也可以是经过基因组编辑的工程细胞,比如把宿主细胞基因组中所携带的野生型的转氨酶基因敲除。上述宿主细胞的合适的培养基以及生长条件在本领域内是公知的。
用于表达转氨酶的多核苷酸可通过本领域已知的多种方法被引入至细胞。技术包括,除了其他以外,电穿孔、生物颗粒轰击法、脂质体介导的转染、氯化钙转染和原生质体融合。将多核苷酸引入细胞的不同方法对于本领域技术人员是明显的。
2.4产生工程化转氨酶多肽的方法
通过将编码转氨酶的多核苷酸经历诱变和/或定向进化方法,可以获得工程化转氨酶。示例性的定向进化技术可见《Biocatalysis for the Pharmaceutical Industry:Discovery,Development,and Manufacturing》(2009John Wiley&Sons Asia(Pte)Ltd.ISBN:978-0-470-82314-9)。
当工程化多肽的序列为已知时,编码多肽的多核苷酸可根据已知的合成方法通过标准的固相方法制备。在一些实施方案中,多达约100个碱基的片段可单独地合成,然后连接(例如,通过酶促或化学的连接方法或聚合酶介导的方法)以形成任何需要的连续序列。例如,本公开内容的多核苷酸和寡核苷酸可通过化学合成制备,使用,例如,描述于Beaucage等人,1981,TetLett22:1859-69的经典的亚磷酰胺方法,或描述于Matthes等人,1984,EMBOJ.3:801-05的方法,例如,如在自动化合成方法中典型地实践的。根据亚磷酰胺方法,寡核苷酸在例如,在自动化DNA合成仪中合成、纯化、退火、连接以及克隆至合适的载体中。另外,基本上任何核酸可从多种商业来源的任一个获得。
在一些实施方案中,本公开内容还提供了用于制备或制作工程化转氨酶多肽的方法,其中该方法包括在适于表达多肽的培养条件下培养能够表达编码工程化多肽的多核苷酸的宿主细胞。在一些实施方案中,制备多肽的方法还包括分离多肽。工程化多肽可在合适的细胞中表达,并利用所熟知的用于蛋白纯化的技术中的任何一种或更多种从宿主细胞和/或培养基分离(或回收),所述用于蛋白纯化的技术包括,除了其他以外,溶菌酶处理、超声、过滤、盐析、超速离心和色谱。
2.5利用工程化转氨酶的方法以及用其制备的化合物
在另一方面,本文所述的改进的工程化转氨酶多肽,在氨基供体存在下,可将A-1转化为A-2。在一些实施方案中,工程化转氨酶多肽可以用在制备对映体过量的式A-2化合物的方法中:
Figure BDA0002087915510000111
在这些实施方案中,所述方法包括在合适的反应条件下,在氨基供体存在下,将结构式A1所示化合物:
Figure BDA0002087915510000112
与本文公开的工程化转氨酶多肽接触的步骤。
在以上方法的一些实施方案中,式A-2化合物以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大对映体过量产生。
用于该方法的工程化的转氨酶多肽的具体实施方案在详述中进一步提供。可用在以上方法中的改进的工程化转氨酶多肽可包括选自对应SEQ ID NO:4、6、8、10、12的氨基酸序列,也包括与选自SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12序列中的任一个参考氨基酸序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
如本文描述并在实施例中例证的,本公开内容构思了可在本文的方法中使用的合适的反应条件的范围,包括但不限于pH、温度、缓冲液、溶剂***、底物载量、多肽载量和反应时间的范围。用于执行使用本文描述的工程化的转氨酶多肽将底物化合物生物催化地转化成产物化合物的方法的另外的合适的反应条件可容易地通过常规实验优化,所述常规实验包括但不限于在浓度、pH、温度、溶剂条件的实验反应条件下使工程化转氨酶多肽与底物化合物接触,并检测产物化合物,例如,利用在本文提供的实施例中描述的方法。
如以上描述的,用于本公开内容的方法的具有转氨酶活性的工程化多肽通常包含与选自SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12序列中的任一个参考氨基酸序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
考虑到例如期望的产物化合物的量、底物浓度对酶活性的影响、反应条件下酶的稳定性、和底物到产物的转化百分比,反应混合物中的底物化合物可以变化。在所述方法的一些实施方案中,合适的反应条件包括至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L、至少约30g/L、至少约50g/L、至少约75g/L、至少约100g/L、至少约150g/L、至少约200g/L或甚至更大的底物A-1的载量。虽然本文提供的底物载量的值是基于化合物A-1的分子量,但是还预期,也可在方法中使用相等的摩尔量的化合物A-1的多种水合物和盐。
在本文描述的方法中,工程化转氨酶多肽催化酮底物与氨基供体形成手性胺产物。在一些实施方案中,反应条件中的氨基供体包括选自丙氨酸、异丙胺(也称为2-氨基丙烷)、苯丙氨酸、谷氨酰胺、亮氨酸或3-氨基丁酸等任何合适的氨基酸,或包括选自甲基苄胺等任何合适的手性胺或非手性胺;所述氨基供体也可以以盐的形式(比如丙氨酸盐酸盐、丙氨酸醋酸盐、异丙胺盐酸盐、异丙胺醋酸盐等)应用于实施方案中。在一些实施方案中,氨基供体是异丙胺。在一些实施方案中,合适的反应条件包括以至少约1倍于底物A-1摩尔载量的载量存在的氨基供体,特别是异丙胺。在一些实施方案中,异丙胺以0.1M至约4.0M的载量存在。
转氨酶催化反应是可逆的,在一些实施方案中,本发明所公开的工程化转氨酶多肽也可以将式A-2的手性胺化合物转化为化合物A-1。
在反应的实施方案中,反应条件可包括合适的pH。如以上所述,期望的pH或期望的pH范围可通过使用酸或碱、合适的缓冲剂、或缓冲和添加酸或碱的组合来保持。反应混合物的pH可在反应过程之前和/或期间控制。在一些实施方案中,合适的反应条件包括约7至约11的溶液pH。在一些实施方案中,反应条件包括约7、7.5、8、8.5、9、9.5、10、10.5或11的溶液pH。
在本文的方法的实施方案中,例如考虑到在较高的温度下在反应速率上的增加、对于足够久的反应持续时间的酶的活性,合适的温度可被用于反应条件。相应地,在一些实施方案中,合适的反应条件包括约10℃至约60℃、约25℃至约50℃、约25℃至约40℃、或约25℃至约30℃的温度。在一些实施方案中,合适的反应温度包括约25℃、30℃、35℃、40℃、45℃、50℃、55℃或60℃的温度。在一些实施方案中,酶促反应期间的温度可以贯穿反应过程保持在一定温度。在一些实施方案中,酶促反应期间的温度可以在反应过程期间调整为温度曲线。
使用工程化转氨酶的方法通常在水或溶剂中进行。合适的溶剂包括水性缓冲溶液、有机溶剂和/或共溶剂***,共溶剂***通常包括水性溶剂和有机溶剂。水性溶液(水或水性共溶剂***)可为pH-缓冲的或非缓冲的。在一些实施方案中,使用工程化转氨酶多肽的方法通常地于包含以下的水性共溶剂***中进行:有机溶剂(例如,甲醇、乙醇、丙醇、异丙醇(IPA))、二甲基亚砜(DMSO)、二甲基甲酰胺(DMF)、乙酸异丙酯、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔-丁基醚(MTBE)、甲苯等)、离子液体(例如,四氟硼酸1-乙基4-甲基咪唑、四氟硼酸1-丁基-3-甲基咪唑、六氟磷酸1-丁基-3-甲基咪唑等)。水性共溶剂***中的有机溶剂组分可与水性组分混溶,提供单一的液相,或可与水性组分部分混溶或不混溶,提供双液相。转氨反应过程中产生的二氧化碳有可能造成泡沫的形成,可以适当添加消泡剂。示例性的水性共溶剂***包含水和一种或多种有机溶剂。通常,选择水性共溶剂***的有机溶剂组分以便其不会完全使转氨酶失活。通过用候选溶剂***中的感兴趣的确定的底物并利用诸如本文描述的酶活性测定而测量特定的工程化的转氨酶的酶活性,合适的共溶剂***可被容易地鉴定。在方法的一些实施方案中,合适的反应条件包括水性共溶剂,所述水性共溶剂包含约1%至约100%(v/v)、约1%至约60%(v/v)、约2%至约60%(v/v)、约5%至约60%(v/v)、约10%至约60%(v/v)、约10%至约50%(v/v)或约10%至约40%(v/v)的浓度的甲醇。在方法的一些实施方案中,合适的反应条件包括含有至少约1%、5%、10%、15%、20%、25%、30%、35%、40%、的浓度的甲醇。
合适的反应条件可包括提供将底物化合物生物催化转化成其相应的产物化合物的反应参数的组合。相应地,在方法的一些实施方案中,反应参数的组合包括:(a)约10g/L至200g/L底物A-1的载量;(b)约1g/L至50g/L的工程化多肽浓度;(c)约0.1M至4.0M的异丙胺的载量;(d)约7.0至11.0的pH;和(e)约10℃至60℃的温度。
在一些实施方案中,上述方法包括,在约1M至约2M的异丙胺存在下,在约10%至约40%的甲醇、约30℃至约50℃的温度和pH7.0至10.0的反应条件下,将≥10g/L的A-1底物与≥5g/L的本文所述工程化转氨酶多肽接触,在24小时内至少70%、80%、90%、95%或更多的底物A-1被转化为手性胺产物A-2,且手性胺产物A-2以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大对映体过量产生。在一些实施方案中,能够进行上述反应的转氨酶多肽包括对应SEQ ID NO:4、6、8、10、12的氨基酸序列。
示例性反应条件包括在表1以及实施例8、9、10、11、14、15中提供的条件。
在进行本文描述的酶催化反应时,工程化多肽可以部分地纯化的或纯化的酶、经热处理的酶液、用编码酶的基因转化的完整细胞、和/或此类细胞的细胞提取物和/或裂解物的形式加入至反应混合物中。用编码工程化多肽的基因转化的完整细胞,或其细胞提取物、其裂解物,以及分离的酶可以多种不同的形式使用,包括固体(例如,冻干的、喷雾干燥的等)或半固体(例如,湿菌体等粗糊状物)。细胞提取物或细胞裂解物可通过沉淀(例如,硫酸铵、聚乙烯亚胺、热处理或类似处理)部分纯化,之后在冻干前进行除盐程序(例如,超滤、透析及类似程序)。任何酶制品可通过使用已知的交联剂诸如,例如戊二醛交联或固定到固相材料(例如树脂)而被稳定化。
在本文描述的酶催化反应的一些实施方案中,反应在本文描述的合适的反应条件下进行,其中工程化多肽被固定至固体支持物上。可用于固定进行酶催化反应的工程化多肽的固体支持物包括但不限于微球或树脂,所述微球或树脂包含具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或具有十八烷基官能团的聚甲基丙烯酸酯。示例性固体支持物包括但不限于壳聚糖珠、EupergitC和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,其中工程化多肽可以分泌多肽的形式被表达,含有该分泌多肽的培养基可被用于本文的方法中。
在一些实施方案中,固体反应物(例如,酶、盐等)可以各种不同的形式提供给反应,包括粉末(例如,冻干的、喷雾干燥的等)、溶液、乳液、悬浮液等。反应物可使用为本领域普通技术人员共知的方法和仪器容易地冻干或喷雾干燥。例如,蛋白质溶液可以小量冷冻于-80℃,然后加入至预冷却的冻干室内,之后应用真空。
在一些实施方案中,加入反应物的顺序或方式有多种选择。反应物可同时一起加入至溶剂中(例如,单相溶剂、双相水性共溶剂体系等);或者可选择地,一些反应物可首先加入,其他反应物可流动加入或分批次间隔加入。
本公开内容的不同的特征和实施方案示例于以下代表性的实施例中,其意图是例证性的而不是限制性的。
附图说明
图1本发明的工程化转氨酶多肽催化的A-1转化为A-2的反应
图2热处理前后的SEQ ID No:12的酶液的电泳结果(SDS-PAGE)
具体实施方式
下面用实施例来进一步说明本发明,但本发明并不受其限制。下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。
实施例1:基因克隆和表达载体的构建
源自于Aspergillus fumigatus的野生型的转氨酶的基因序列,可从NCBI上检索得到,然后通过本领域的常见技术合成出来并克隆到表达载体pACYC-Duet-1(Novagen)上。将重组表达质粒转化到E.coli BL21(DE3)的感受态细胞中。转化条件为42℃、热击90秒,转化液涂布到含有氯霉素的LB平板上,37℃倒置培养过夜,即获得重组转化体。
实施例2:转氨酶突变文库的构建
这里所用到的都是商业试剂,较佳地选用Quikchange试剂盒(供应商:Agilent)。突变引物的序列设计按照试剂盒的说明进行。
PCR体系为:10×buffer 2.5μL,dNTP mix 1μL,引物Oligomix 2μL(5μM),质粒模板2.5μL(50ng/μl),高保真酶1μL,ddH2O 16μL。
PCR扩增步骤为:(1)95℃,预变性1min;(2)95℃,变性1min;(3)55℃退火1min;(4)65℃延伸6min;步骤(2)~(4)重复29次;(5)65℃继续延伸5min,冷却至4℃。在PCR产物中加入2μl DpnI(Kit),37℃酶切2h。转化产物到E.coli BL21(DE3)电感受态细胞,并涂布含有氯霉素的LB平板上,37℃倒置培养过夜,即获得文库菌落。
实施例3:突变酶库的表达和筛选用酶液的制备
从琼脂平板挑取突变酶库的菌落,接种至含有氯霉素的LB培养基的96孔板中,置于摇床30℃下过夜培养。当培养液的OD600达到2~3时,从96孔板取20μL接种到含有氯霉素的TB培养基的96孔深孔板中(每孔400μL TB培养基),置于摇床在30℃下培养。当培养液的OD600达到0.6~0.8时,加入终浓度为1mM的IPTG作为诱导剂,置于摇床30℃下过夜表达(18-20h)。表达结束,将含有菌液的深孔板离心,去除菌液上清,得到湿菌体。湿菌体加入细胞裂解液(1g/L lysozyme,0.5g/L PMBS,0.05mM PLP溶于TEOA-HCL缓冲液,pH9),震荡1h使细胞破碎,得到裂解液。将裂解液离心,将上清转移到新的深孔板上,即得到可用于筛选反应的酶液。
实施例4:定向进化阶段II的筛选反应
由实施例3所制得的酶液可以直接用来进行筛选反应。在96孔板上,取30μL酶液与170μL的反应母液相混合,使反应体系中各组分的终浓度为【底物A-1 15g/L,DMSO 30%(v/v),异丙胺1.0M,PLP 0.1mM,TEOA 0.1M,pH9.5】,将孔板置于40℃的摇床中振荡24小时。反应结束后,加入乙腈灭活,然后离心(4000rpm,30min),取离心后的上清,按照实施例5的方法进行HPLC分析并计算A-1到A-2的转化率。
实施例5:分析方法
用于计算转氨反应转化率的定量分析检测方法为:反应灭活后的样品,在Agilent1100 HPLC上进行检测,分析柱为Phenomenex Luna 5u C8(4.6x 150mm),流动相为10mM醋酸铵:乙腈=50:50,流速为2mL/min,柱温40℃,检测波长为268nm。产物A-2的保留时间为1.4min,底物A-1的保留时间为1.9min。
用于计算产物A-2的ee值的定量分析检测方法为:样品在Agilent1100HPLC上检测,采用CHIRALPAK AD-H手性色谱柱(4.6×250mm)进行分析,流动相为乙醇:正庚烷:二乙胺:水=60:40:0.1:0.1,流速为每分钟1mL,柱温为30℃,检测波长为224nm。(R)-构型化合物(即A-2)的保留时间为15.3min;(S)-构型化合物(即A-2的对映异构体)的保留时间为12.2min。
实施例6:工程化转氨酶多肽的表达
将包含带有目标工程化转氨酶多肽表达质粒的大肠杆菌BL21(DE3)的单个微生物菌落,接种至含有50mL LB培养基(含氯霉素30μg/mL)的250mL锥形瓶中,置于30℃的摇床振荡培养过夜。当培养液的OD600达到2时,按5%(v/v)的接种量接入装有250mL TB培养基的1000mL锥形瓶中,置于30℃的摇床振摇培养。当培养液的OD600达到0.6时,加入终浓度为1mM的IPTG来诱导转氨酶的表达。培养20h后,将培养液离心(8000rpm,10分钟),离心后弃上清液,收集细胞得到湿菌体。湿菌体直接用于制备酶液,或可在-20℃冷冻储存直到使用。
将湿菌体重新悬浮于PBS缓冲液中,在冰浴中超声破碎,离心收集上清液,得到含有工程化转氨酶多肽的酶液。
将酶液用冷冻干燥机冻干,即得到酶粉。
实施例7:定向进化阶段V的酶液预处理和筛选反应
如实施例3制得突变文库的酶液,将含有酶液的孔板封膜,置于水浴摇床80℃下震荡1h进行热处理。热处理完成后,将酶液在4000rpm下离心30分钟,每个孔取40μL上清到预先装有反应母液(160μL/孔)的96孔板中,使反应体系中各组分的终浓度为【底物A-1,50g/L,甲醇35%(v/v),丙酮1.5%(v/v),异丙胺2.0M,PLP 0.25mM,TEOA 0.1M,pH9.5】,将孔板置于45℃的摇床中振荡24小时。反应结束后,加入乙腈灭活,然后离心(4000rpm,30min),取离心后的上清,按照实施例5的方法进行HPLC分析并计算A-1到A-2的转化率。
实施例8:SEQ ID No:4的酶粉催化A-1转化为A-2的反应
按照实施例6所述的方法,制备SEQ ID No:4所对应的工程化转氨酶的酶粉。以下为一个具代表性的5mL反应体积的流程。在总容积为30mL的反应瓶中,投入酶粉与反应试剂,使反应体系中各组分的终浓度为【SEQ ID No:4的酶粉10g/L,底物A-1 5g/L,DMSO 25%(v/v),1.0M异丙胺,0.1mM PLP,0.1M TEOA,pH9.0】,向反应瓶中加入磁性转子,置于设定为400rpm、25℃的磁力搅拌器上开始反应。反应24小时后,向瓶中加入5mL的乙腈对反应进行淬灭,然后离心(8000rpm,5min),取离心后的上清,按照实施例5的方法进行HPLC分析,转化率为12.4%,产物A-2的ee值≥99.7%。
实施例9:SEQ ID No:6的酶粉催化A-1转化为A-2的反应
按照实施例6所述的方法,制备SEQ ID No:6所对应的工程化转氨酶的酶粉。以下为一个具代表性的5mL反应体积的流程。在总容积为30mL的反应瓶中,投入酶粉与反应试剂,使反应体系中各组分的终浓度为【SEQ ID No:6的酶粉5g/L,底物A-1 5g/L,DMSO 30%(v/v),1.0M异丙胺,0.1mM PLP,0.1M TEOA,pH9.5】,向反应瓶中加入磁性转子,置于设定为400rpm、30℃的磁力搅拌器上开始反应。反应24小时后,向瓶中加入5mL的乙腈对反应进行淬灭,然后离心(8000rpm,5min),取离心后的上清,按照实施例5的方法进行HPLC分析,转化率为43.0%,产物A-2的ee值≥99.7%。
实施例10:SEQ ID No:8的酶粉催化A-1转化为A-2的反应
按照实施例6所述的方法,制备SEQ ID No:8所对应的工程化转氨酶的酶粉。以下为一个具代表性的5mL反应体积的流程。在总容积为30mL的反应瓶中,投入酶粉与反应试剂,使反应体系中各组分的终浓度为【SEQ ID No:8的酶粉5g/L,底物A-1 20g/L,DMSO 45%(v/v),1.0M异丙胺,0.1mM PLP,0.1M TEOA,pH9.5】,向反应瓶中加入磁性转子,置于设定为400rpm、40℃的磁力搅拌器上开始反应。反应24小时后,向瓶中加入5mL的乙腈对反应进行淬灭,然后离心(8000rpm,5min),取离心后的上清,按照实施例5的方法进行HPLC分析,转化率为20.2%,产物A-2的ee值≥99.7%。
实施例11:SEQ ID No:10的酶液催化A-1转化为A-2的反应
按照实施例6所述的方法,制备表达了SEQ ID No:10所对应的工程化转氨酶的酶液。以下为一个具代表性的5mL反应体积的流程。在总容积为30mL的反应瓶中,投入酶液与反应试剂,使反应体系中各组分的终浓度为【SEQ ID No:10的酶液30%(v/v),底物A-150g/L,甲醇30%(v/v),1.0M异丙胺,0.1mM PLP,0.1M TEOA,pH9.5】,向反应瓶中加入磁性转子,置于设定为400rpm、40℃的磁力搅拌器上开始反应。反应24小时后,向瓶中加入5mL的乙腈对反应进行淬灭,然后离心(8000rpm,5min),取离心后的上清并稀释25倍,按照实施例5的方法进行HPLC分析,转化率为44.9%,产物A-2的ee值≥99.7%。
按照实施例13所述方式,对SEQ ID No:10的酶液进行[80℃,1h]的热处理,使用热处理后的酶液进行反应,反应条件为【经[80℃,1h]热处理的SEQ ID No:10的酶液30%(v/v),底物A-150g/L,甲醇30%(v/v),1.0M异丙胺,0.1mM PLP,0.1M TEOA,pH9.5】,反应24小时后,转化率为22.1%,产物A-2的ee值≥99.7%。
实施例12:表达工程化转氨酶多肽的高密度发酵工艺
将包含带有工程化转氨酶基因(SEQ ID No:11)的大肠杆菌BL21(DE3)的单个微生物菌落接种到含30μg/mL氯霉素50mL LB肉汤中。细胞在30℃摇床中培养过夜。当培养物的OD600达到1.6至2.2时,从培养箱取出培养液,得到种子液,以进行发酵罐接种。
将含有2.0L生长培养基的5L发酵罐在121℃高压蒸汽灭菌锅灭菌,用上述种子液对发酵罐进行接种。以夹套循环水控制发酵罐的温度保持在37℃,搅拌转速为200-800rpm,向发酵罐供应空气以保持溶解氧水平为40%饱和或更大。通过加入氢氧化铵保持培养物的pH在7.0。培养物的生长通过流加含500g/L食用葡萄糖右旋糖一水合物、12g/L氯化铵和5g/L硫酸镁七水合物的补料溶液来维持。诱导表达前,将培养物温度维持在30℃,通过加入异丙基-β-D-硫代半乳糖苷(IPTG)至终浓度为1mM来诱导工程化转氨酶的表达,并继续发酵约18h。发酵结束后,使用Thermo Multifuge X3R离心机在4℃以8000rpm离心10钟来收集湿菌体。
在4℃下将湿菌体用含250μM PLP的10mM pH7.0的磷酸钾盐缓冲液重悬浮,使用Thermo Multifuge X3R离心机在4℃以8000rpm离心10min,再次收集湿菌体,此为清洗后的湿菌体。取上述清洗后湿菌体20g,用100mL 10mM pH7.0磷酸钾盐缓冲液重悬浮,利用压力均质机破碎2次,得到均质后的菌液。将菌液在4000rpm下离心30min,收集上清液,得到含有工程化转氨酶多肽的酶液。
实施例13:酶液的热处理
由实施例12中所述的制备方法得SEQ ID No:12对应的转氨酶多肽的酶液25mL。将其装入50mL离心管并置于80℃的水浴中,搅动使酶液受热均匀,1.0小时后,将酶液离心(4000rpm,30min),收集上清液,即得热处理后的酶液。将热处理后的酶液样品进行SDS-PAGE电泳分析,图2是电泳结果:样品1为SEQ ID No:12对应的未经热处理的酶液,样品2为SEQ ID No:12对应的热处理后的酶液。图2的结果显示,经[80℃,1h]热处理后,酶液中的杂蛋白已完全被去除,而SEQ ID No:12对应的工程化转氨酶仍保留在酶液中。
使用本领域熟知的Bradford方法对热处理后的酶液的蛋白含量进行测定,上述热处理后的酶液所含的总蛋白为14.3g/L。
实施例14:经热处理后的SEQ ID No:12的酶液催化A-1转化为A-2的反应
实施例13所制得的经[80℃,1h]热处理后的SEQ ID No:12的酶液可以直接用来催化A-1转化为A-2的反应。以下为一个具代表性的5mL反应体积的流程。在总容积为30mL的反应瓶中,投入酶液与反应试剂,使反应体系中各组分的终浓度为【经[80℃,1h]热处理的SEQID No:12酶液20%(v/v),底物A-1 50g/L,甲醇35%(v/v),1.5M异丙胺,1.0mM PLP,0.1MTEOA pH9.5】,向反应瓶中加入磁性转子,置于设置为400rpm、45℃的磁力搅拌器上开始反应。反应24小时后,向瓶中加入5mL的乙腈对反应进行淬灭,然后离心(8000rpm,5min),取离心后的上清稀释25倍,按照实施例5的方法进行HPLC分析,转化率为93%,产物A-2的ee值≥99.7%。
实施例15:工程化转氨酶多肽催化A-1转化为A-2的反应工艺
Figure BDA0002087915510000171
预先配制底物母液:10.0g底物溶解于25mL甲醇中,溶解后底物母液的总体积约为33.0mL。预先配制异丙胺混合母液:称取1.49g三乙醇胺,加纯水至12.5mL,加入5.9g异丙胺,用浓盐酸将其pH调为9.5,然后用纯水将总体积补充至42.0mL。预先配制4.0M异丙胺溶液的配制:将34.0mL异丙胺用纯水配成100.0mL溶液即得。
将250mL三颈烧瓶固定在水浴锅上,水温控制为45℃。向三颈烧瓶中依次投入经[80℃,1h]热处理后的SEQ ID No:12的酶液17.5mL、磷酸吡哆醛(PLP)106mg、纯水7.5mL,再缓慢加入上述所配制的异丙胺混合溶液,搅拌均匀,然后用4.0M的异丙胺溶液调节反应体系的pH为9.5。取4.0mL底物母液加入到三颈烧瓶中开始反应,并用蠕动泵向三颈烧瓶中流加剩余的底物母液,直到将底物母液全部加入三颈烧瓶中。反应期间,持续监测反应体系的pH,并用4.0M的异丙胺溶液将反应体系的pH维持在9.5±0.5,反应时间24h。
反应结束后,用二氯甲烷将A-2从反应体系中萃取出来,将溶剂蒸干,可得约8.5g产物A-2的粗品,ee值≥99.7%。将8.0g产物A-2的粗品溶解于磷酸溶液中,加入0.3g西他列汀磷酸盐晶种,通过重结晶的方法可制备得到约9.0g西他列汀磷酸盐,纯度为100.0%,ee值为≥99.7%。
应理解,在阅读了本发明的上述内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 宁波酶赛生物工程有限公司
<120> 一种制备西他列汀的工程化转氨酶多肽
<130> EMP011
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 969
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
atggcttcga tggacaaagt cttctcaggt tactacgccc gtcaaaaact gctggaacgc 60
tcagataatc cgttctcaaa aggtattgcc tatgtcgaag gtaaactggt gctgccgagt 120
gatgcgcgca ttccgctgct ggacgaaggc tttatgcata gtgatctgac ctacgacgtt 180
atctccgtct gggacggccg tttctttcgc ctggatgacc acctgcagcg cattctggaa 240
tcatgcgata aaatgcgtct gaaatttccg ctggcactga gctctgtcaa aaatatcctg 300
gcagaaatgg tggctaaaag cggcattcgt gacgctttcg tcgaagtgat cgttacccgc 360
ggcctgacgg gtgttcgtgg ctctaaaccg gaagatctgt ataacaataa catttacctg 420
ctggtgctgc cgtatatctg ggttatggca ccggaaaatc agctgcatgg cggtgaagct 480
attatcaccc gtacggtgcg tcgcaccccg ccgggtgcct ttgatccgac gatcaaaaac 540
ctgcaatggg gtgacctgac caaaggcctg tttgaagcga tggatcgtgg tgccacctat 600
ccgttcctga cggatggcga caccaatctg acggaaggca gcggtttcaa tattgtcctg 660
gtgaaaaacg gtattatcta caccccggat cgtggtgttc tgcgcggcat tacgcgtaaa 720
tcagtgatcg atgttgcgcg cgccaactcg attgacatcc gtctggaagt ggttccggtg 780
gaacaagcgt accactccga tgaaattttc atgtgtacca cggccggcgg tattatgccg 840
atcaccctgc tggatggtca gccggttaac gacggtcaag tcggcccgat taccaagaaa 900
atttgggatg gctattggga aatgcactac aacccggctt attcgtttcc ggtggattat 960
ggcagcggt 969
<210> 2
<211> 323
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 2
Met Ala Ser Met Asp Lys Val Phe Ser Gly Tyr Tyr Ala Arg Gln Lys
1 5 10 15
Leu Leu Glu Arg Ser Asp Asn Pro Phe Ser Lys Gly Ile Ala Tyr Val
20 25 30
Glu Gly Lys Leu Val Leu Pro Ser Asp Ala Arg Ile Pro Leu Leu Asp
35 40 45
Glu Gly Phe Met His Ser Asp Leu Thr Tyr Asp Val Ile Ser Val Trp
50 55 60
Asp Gly Arg Phe Phe Arg Leu Asp Asp His Leu Gln Arg Ile Leu Glu
65 70 75 80
Ser Cys Asp Lys Met Arg Leu Lys Phe Pro Leu Ala Leu Ser Ser Val
85 90 95
Lys Asn Ile Leu Ala Glu Met Val Ala Lys Ser Gly Ile Arg Asp Ala
100 105 110
Phe Val Glu Val Ile Val Thr Arg Gly Leu Thr Gly Val Arg Gly Ser
115 120 125
Lys Pro Glu Asp Leu Tyr Asn Asn Asn Ile Tyr Leu Leu Val Leu Pro
130 135 140
Tyr Ile Trp Val Met Ala Pro Glu Asn Gln Leu His Gly Gly Glu Ala
145 150 155 160
Ile Ile Thr Arg Thr Val Arg Arg Thr Pro Pro Gly Ala Phe Asp Pro
165 170 175
Thr Ile Lys Asn Leu Gln Trp Gly Asp Leu Thr Lys Gly Leu Phe Glu
180 185 190
Ala Met Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp Thr
195 200 205
Asn Leu Thr Glu Gly Ser Gly Phe Asn Ile Val Leu Val Lys Asn Gly
210 215 220
Ile Ile Tyr Thr Pro Asp Arg Gly Val Leu Arg Gly Ile Thr Arg Lys
225 230 235 240
Ser Val Ile Asp Val Ala Arg Ala Asn Ser Ile Asp Ile Arg Leu Glu
245 250 255
Val Val Pro Val Glu Gln Ala Tyr His Ser Asp Glu Ile Phe Met Cys
260 265 270
Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Leu Leu Asp Gly Gln Pro
275 280 285
Val Asn Asp Gly Gln Val Gly Pro Ile Thr Lys Lys Ile Trp Asp Gly
290 295 300
Tyr Trp Glu Met His Tyr Asn Pro Ala Tyr Ser Phe Pro Val Asp Tyr
305 310 315 320
Gly Ser Gly
<210> 3
<211> 969
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
atggcctcta tggacaaagt cttttcggga tattatgcgc gccagaagct gcttgaacgg 60
agcgacaatc ctttctctaa gggcattgct tatgtggaag gaaagctcgt cttacctagt 120
gatgctagaa taccgctact cgacgaaggt ttcatgcaca gtgacctaac ctatgatggc 180
ttccacgttt gggatggtcg cttctttcga ttggacgatc atttgcaacg gattttggaa 240
agctgcgata agatgcggct caagttccca cttgcactga gctcagtgaa aaatattctg 300
gctgagatgg tcgccaagag tggtatccgg gatgcgatgg tgaaggttat cgtgacacgt 360
ggtctgacag gtgtacgtgg ttcgaagcct gaggatctgt ataataacaa catatacctg 420
cttgttcttc catacatttg gctgatggcg cctgagaacc agctccatgg tggcgaggct 480
atcattacaa ggacagtgcg acgaacaccc ccaggtgcat ttgatcctac tatcaaaaat 540
ctacagtggg gtgatttaat taagggaatg tttgaggcaa tggaccgtgg cgccacatac 600
ccatttctca ctgatggaga caccaacctt actgaaggac cgggtttcaa cattgttttg 660
gtgaagaacg gtattatcta tacccctgat cgaggtgtct tgcgagggat cacacgtaaa 720
agtgtgattg acgttgcccg agccaacagc atcgacatcc gccttgaggt cgtaccagtg 780
gagcaggctt atcactctga tgagatcttc atgtgcacaa ctggcggcgg cattatgcct 840
ataacattgc ttgatggtca acctgttaat gacggccagg ttggcccaat cacaaagaag 900
atatgggatg gctattggga gatgcactac aatccggcgt atagttttcc tgttgactat 960
ggcagtggc 969
<210> 4
<211> 323
<212> PRT
<213> 人工序列(artificial sequence)
<400> 4
Met Ala Ser Met Asp Lys Val Phe Ser Gly Tyr Tyr Ala Arg Gln Lys
1 5 10 15
Leu Leu Glu Arg Ser Asp Asn Pro Phe Ser Lys Gly Ile Ala Tyr Val
20 25 30
Glu Gly Lys Leu Val Leu Pro Ser Asp Ala Arg Ile Pro Leu Leu Asp
35 40 45
Glu Gly Phe Met His Ser Asp Leu Thr Tyr Asp Gly Phe His Val Trp
50 55 60
Asp Gly Arg Phe Phe Arg Leu Asp Asp His Leu Gln Arg Ile Leu Glu
65 70 75 80
Ser Cys Asp Lys Met Arg Leu Lys Phe Pro Leu Ala Leu Ser Ser Val
85 90 95
Lys Asn Ile Leu Ala Glu Met Val Ala Lys Ser Gly Ile Arg Asp Ala
100 105 110
Met Val Lys Val Ile Val Thr Arg Gly Leu Thr Gly Val Arg Gly Ser
115 120 125
Lys Pro Glu Asp Leu Tyr Asn Asn Asn Ile Tyr Leu Leu Val Leu Pro
130 135 140
Tyr Ile Trp Leu Met Ala Pro Glu Asn Gln Leu His Gly Gly Glu Ala
145 150 155 160
Ile Ile Thr Arg Thr Val Arg Arg Thr Pro Pro Gly Ala Phe Asp Pro
165 170 175
Thr Ile Lys Asn Leu Gln Trp Gly Asp Leu Ile Lys Gly Met Phe Glu
180 185 190
Ala Met Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp Thr
195 200 205
Asn Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asn Gly
210 215 220
Ile Ile Tyr Thr Pro Asp Arg Gly Val Leu Arg Gly Ile Thr Arg Lys
225 230 235 240
Ser Val Ile Asp Val Ala Arg Ala Asn Ser Ile Asp Ile Arg Leu Glu
245 250 255
Val Val Pro Val Glu Gln Ala Tyr His Ser Asp Glu Ile Phe Met Cys
260 265 270
Thr Thr Gly Gly Gly Ile Met Pro Ile Thr Leu Leu Asp Gly Gln Pro
275 280 285
Val Asn Asp Gly Gln Val Gly Pro Ile Thr Lys Lys Ile Trp Asp Gly
290 295 300
Tyr Trp Glu Met His Tyr Asn Pro Ala Tyr Ser Phe Pro Val Asp Tyr
305 310 315 320
Gly Ser Gly
<210> 5
<211> 969
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
atggcctcta tggacaaagt cttttcggga tattatgcgc gccagaagct gcttgaacgg 60
agcgacaatc ctttctctaa gggcattgct tatgtggaag gaaagctcgt cttacctagt 120
gatgctagaa taccgctatt ggacgaaggt ttcatgcaca gtgacctaac ctatgatggc 180
ttccacgttt gggatggtcg cttctttcga ttggacgatc atttgcaacg gctcttggaa 240
agctgcgata agatgcggct caagttccca cttgcactga gctcagtgaa aaatattctg 300
gctgagatgg tcgccaagag tggtatccgg gatgcgatgg tgaaggttat cgtgacacgt 360
ggtctgacag gtgtacaggg ttcgaagcct gaggatctgt ataataacaa catatacctg 420
cttgttttgc catacatttg gttgatggcg cctgagaagc agctccatgg tggcagcgct 480
atcattacaa ggacagtgcg acgaacaccc ccaggtgcat ttgatcctac tatcaaaaat 540
ctacagtggg gtgatttaat taagggaatg tttgaggcaa tggaccgtgg cgccacatac 600
ccatttctca ctgatggaga caccaacctt actgaaggac cgggtttcaa cattgttttg 660
gtgaagaacg gtattatcta tacccctgat cgaggtgtct tggaggggat cacacgtaaa 720
agtgtgattg acgttgcccg agccaacagc atcgacgtcc gccttgaggt cgtaccagtg 780
gaggcggctt atcacgcgga tgagatcttc atgtgcacaa ctggcggcgg cattatgcct 840
ataacattgc ttgatggtca acctgttaat gacggccagg ttggcccaat cacaaagaag 900
atatgggatg gctattggga gatgcactac aatccggcgt atagttttcc tgttgactat 960
ggcagtggc 969
<210> 6
<211> 323
<212> PRT
<213> 人工序列(artificial sequence)
<400> 6
Met Ala Ser Met Asp Lys Val Phe Ser Gly Tyr Tyr Ala Arg Gln Lys
1 5 10 15
Leu Leu Glu Arg Ser Asp Asn Pro Phe Ser Lys Gly Ile Ala Tyr Val
20 25 30
Glu Gly Lys Leu Val Leu Pro Ser Asp Ala Arg Ile Pro Leu Leu Asp
35 40 45
Glu Gly Phe Met His Ser Asp Leu Thr Tyr Asp Gly Phe His Val Trp
50 55 60
Asp Gly Arg Phe Phe Arg Leu Asp Asp His Leu Gln Arg Leu Leu Glu
65 70 75 80
Ser Cys Asp Lys Met Arg Leu Lys Phe Pro Leu Ala Leu Ser Ser Val
85 90 95
Lys Asn Ile Leu Ala Glu Met Val Ala Lys Ser Gly Ile Arg Asp Ala
100 105 110
Met Val Lys Val Ile Val Thr Arg Gly Leu Thr Gly Val Gln Gly Ser
115 120 125
Lys Pro Glu Asp Leu Tyr Asn Asn Asn Ile Tyr Leu Leu Val Leu Pro
130 135 140
Tyr Ile Trp Leu Met Ala Pro Glu Lys Gln Leu His Gly Gly Ser Ala
145 150 155 160
Ile Ile Thr Arg Thr Val Arg Arg Thr Pro Pro Gly Ala Phe Asp Pro
165 170 175
Thr Ile Lys Asn Leu Gln Trp Gly Asp Leu Ile Lys Gly Met Phe Glu
180 185 190
Ala Met Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp Thr
195 200 205
Asn Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asn Gly
210 215 220
Ile Ile Tyr Thr Pro Asp Arg Gly Val Leu Glu Gly Ile Thr Arg Lys
225 230 235 240
Ser Val Ile Asp Val Ala Arg Ala Asn Ser Ile Asp Val Arg Leu Glu
245 250 255
Val Val Pro Val Glu Ala Ala Tyr His Ala Asp Glu Ile Phe Met Cys
260 265 270
Thr Thr Gly Gly Gly Ile Met Pro Ile Thr Leu Leu Asp Gly Gln Pro
275 280 285
Val Asn Asp Gly Gln Val Gly Pro Ile Thr Lys Lys Ile Trp Asp Gly
290 295 300
Tyr Trp Glu Met His Tyr Asn Pro Ala Tyr Ser Phe Pro Val Asp Tyr
305 310 315 320
Gly Ser Gly
<210> 7
<211> 969
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
atggcaacca tggataaagt ttttgcaggt tattatgcac gtcagaaact gctggaacgt 60
agcgataatc cgtttagcaa aggtattgca tacgttgaag gtaaatttgt tctgccgagc 120
gaagcacgta ttccgctgct ggatgaaggt tttatgggta gcgatctgac ctatgatggt 180
tttcatgttt gggatggtcg tttttttcgt ctggatgatc atctgcagcg tctgctggaa 240
agctgtgata aaatgcgtct gaaatttccg ctggcactga gcagcgttaa aaaaattctg 300
gttgaaatgg ttgcaaaaag cggtattcgt gatgcaatgg gtaaaattat tgtgacccgt 360
ggtctgaccg gtgttcaggg tagcaaaccg gaagatctgt ataataataa tatctacctg 420
ctggttctgc cgtatatttg gctgatggca ccggaaaaac agcgtcatgg tggtagcgca 480
attattaccc gtaccgttcg tcgtaccccg ccgggtgcat ttgatccgac cattaaaaat 540
ctgcagtggg gtgatctgat tcgtggtatg tttgaagcaa aagatcgtgg tgcaacctat 600
ccgtttctga ccgatggtga tacccatctg accgaaggtc cgggttttaa tattgttctg 660
gttaaaaatg gcatcctgta taccccggat cgtggtgttc tggaaggtat tacccgtaaa 720
agcgttattg aagttgcacg tgcaaatagc attgatgttc gtctggaagt tgttccggtt 780
gaaaccgcat atcatgcaga tgaaattttt atgtgtacca ccggtggtgg tattatgccg 840
attaccctgc tggatggtaa accggttaat gatggtcagg ttggtccgat taccaaaaaa 900
atttgggatg gttattggga aatgcattat aatgcagcat atagctttcc ggttgattat 960
ggtagcgat 969
<210> 8
<211> 323
<212> PRT
<213> 人工序列(artificial sequence)
<400> 8
Met Ala Thr Met Asp Lys Val Phe Ala Gly Tyr Tyr Ala Arg Gln Lys
1 5 10 15
Leu Leu Glu Arg Ser Asp Asn Pro Phe Ser Lys Gly Ile Ala Tyr Val
20 25 30
Glu Gly Lys Phe Val Leu Pro Ser Glu Ala Arg Ile Pro Leu Leu Asp
35 40 45
Glu Gly Phe Met Gly Ser Asp Leu Thr Tyr Asp Gly Phe His Val Trp
50 55 60
Asp Gly Arg Phe Phe Arg Leu Asp Asp His Leu Gln Arg Leu Leu Glu
65 70 75 80
Ser Cys Asp Lys Met Arg Leu Lys Phe Pro Leu Ala Leu Ser Ser Val
85 90 95
Lys Lys Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg Asp Ala
100 105 110
Met Gly Lys Ile Ile Val Thr Arg Gly Leu Thr Gly Val Gln Gly Ser
115 120 125
Lys Pro Glu Asp Leu Tyr Asn Asn Asn Ile Tyr Leu Leu Val Leu Pro
130 135 140
Tyr Ile Trp Leu Met Ala Pro Glu Lys Gln Arg His Gly Gly Ser Ala
145 150 155 160
Ile Ile Thr Arg Thr Val Arg Arg Thr Pro Pro Gly Ala Phe Asp Pro
165 170 175
Thr Ile Lys Asn Leu Gln Trp Gly Asp Leu Ile Arg Gly Met Phe Glu
180 185 190
Ala Lys Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp Thr
195 200 205
His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asn Gly
210 215 220
Ile Leu Tyr Thr Pro Asp Arg Gly Val Leu Glu Gly Ile Thr Arg Lys
225 230 235 240
Ser Val Ile Glu Val Ala Arg Ala Asn Ser Ile Asp Val Arg Leu Glu
245 250 255
Val Val Pro Val Glu Thr Ala Tyr His Ala Asp Glu Ile Phe Met Cys
260 265 270
Thr Thr Gly Gly Gly Ile Met Pro Ile Thr Leu Leu Asp Gly Lys Pro
275 280 285
Val Asn Asp Gly Gln Val Gly Pro Ile Thr Lys Lys Ile Trp Asp Gly
290 295 300
Tyr Trp Glu Met His Tyr Asn Ala Ala Tyr Ser Phe Pro Val Asp Tyr
305 310 315 320
Gly Ser Asp
<210> 9
<211> 969
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
atggcaacca tagataaagt ctttgcgggc tattacgcgc gtcaaaaact gctggaacgc 60
tctgataacc cgtttagcaa aggcatcgcg tacgttgaag gcaaatttgt cctgccgtac 120
gaagcacgta ttccgctgct ggacgaaggt tttatgggca gcgacctgac ctacgacggt 180
tttcacgttt gggacggtcg ctttttccgc ctggacgatc atctgcaacg tatcctggaa 240
tcctgcgaca aaatgcgcct gaaatttccg ctggcactga gcagcgttaa aaaaatcctg 300
attgaaatgg ttgcaaaaag cggtattcgc gacgcgatgg gcctgatcat tgttacccgc 360
ggtctgaccg gcgttcaggg tcgcaaagat gaggacctgt acaacaacaa catctacctg 420
ctggttctgc cgtatatctg gctgatggca ccggaagacc aacgtcacgg cggttctgcg 480
attattaccc gtaccgttcg tcgtaccccg ccgggcgcat ttgatccgac cattaaaaac 540
ctgcagtggg gcgatttcaa ccgcggtatg tttgaagcga aggatcgcgg cgcaacctat 600
ccgtttctga ccgacggcga tacccacctg actgaaggtc cgggttttaa cattgtcctg 660
gtcaaaaacg gcatcctgta taccccggat cgtggcgttc tggaaggtat tacccgcaaa 720
agcgttattg aagttgcgcg cgcaaattcc attgatgtcc gcctggaagt tgttccggtt 780
gaaaccgcat accacgcgga cgaaatcttt tgctgttcga ccggcggcgg tatttgtccg 840
atcaccctgc tggacggtaa accggttggt gacggtcagg taggcccgat taccaaaaag 900
atttgggacg gctactggga gatgcattat aacgcggcgt acagctttcc ggtagattat 960
ggtagcgat 969
<210> 10
<211> 323
<212> PRT
<213> 人工序列(artificial sequence)
<400> 10
Met Ala Thr Ile Asp Lys Val Phe Ala Gly Tyr Tyr Ala Arg Gln Lys
1 5 10 15
Leu Leu Glu Arg Ser Asp Asn Pro Phe Ser Lys Gly Ile Ala Tyr Val
20 25 30
Glu Gly Lys Phe Val Leu Pro Tyr Glu Ala Arg Ile Pro Leu Leu Asp
35 40 45
Glu Gly Phe Met Gly Ser Asp Leu Thr Tyr Asp Gly Phe His Val Trp
50 55 60
Asp Gly Arg Phe Phe Arg Leu Asp Asp His Leu Gln Arg Ile Leu Glu
65 70 75 80
Ser Cys Asp Lys Met Arg Leu Lys Phe Pro Leu Ala Leu Ser Ser Val
85 90 95
Lys Lys Ile Leu Ile Glu Met Val Ala Lys Ser Gly Ile Arg Asp Ala
100 105 110
Met Gly Leu Ile Ile Val Thr Arg Gly Leu Thr Gly Val Gln Gly Arg
115 120 125
Lys Asp Glu Asp Leu Tyr Asn Asn Asn Ile Tyr Leu Leu Val Leu Pro
130 135 140
Tyr Ile Trp Leu Met Ala Pro Glu Asp Gln Arg His Gly Gly Ser Ala
145 150 155 160
Ile Ile Thr Arg Thr Val Arg Arg Thr Pro Pro Gly Ala Phe Asp Pro
165 170 175
Thr Ile Lys Asn Leu Gln Trp Gly Asp Phe Asn Arg Gly Met Phe Glu
180 185 190
Ala Lys Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp Thr
195 200 205
His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asn Gly
210 215 220
Ile Leu Tyr Thr Pro Asp Arg Gly Val Leu Glu Gly Ile Thr Arg Lys
225 230 235 240
Ser Val Ile Glu Val Ala Arg Ala Asn Ser Ile Asp Val Arg Leu Glu
245 250 255
Val Val Pro Val Glu Thr Ala Tyr His Ala Asp Glu Ile Phe Cys Cys
260 265 270
Ser Thr Gly Gly Gly Ile Cys Pro Ile Thr Leu Leu Asp Gly Lys Pro
275 280 285
Val Gly Asp Gly Gln Val Gly Pro Ile Thr Lys Lys Ile Trp Asp Gly
290 295 300
Tyr Trp Glu Met His Tyr Asn Ala Ala Tyr Ser Phe Pro Val Asp Tyr
305 310 315 320
Gly Ser Asp
<210> 11
<211> 969
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
atggcaacca tagataaagt ctttgcgggc tattacgcgc gtaaaaaact gctggaagcg 60
tctgataacc cgtttagcca aggcatcgcg tacgttgaag gcaaatttgt cctgccgtac 120
gaagcacgta ttccgctgct ggacgaaggt tttatgggca gcgacctgac ctacgacggt 180
tttcacgttt gggacggtcg ctttttccgc ctggacgatc atctgcatcg tatcctggaa 240
tcctgcgaca aaatgcgcct gaaatttccg ctgcccgtga gcagcgttcg taaaatcctg 300
attgaaatgg ttgcaaaaag cggtattcgc gacgcgatgg gcctgatcat tgttacccgc 360
ggtatgaccg gcgttcaggg tatgaaagat gaggacctgt acaacaacga aatctacctg 420
ctggttctgc cgtatatctg gctgatggca ccggaagacc aacgtcacgg cggtagcgcg 480
attattaccc gtaccgttcg tcgtaccccg ccgggcgcat ttgatccgac cattaaaaac 540
ctgcagtggg gcgatttcaa ccgcggtctg tttgaagcga aagatcgcgg cgcaacctat 600
ccgtttctga ccgacggcga tacccacctg actgaaggtc cgggttttaa cattgtcctg 660
gtcaaaaacg gcatcctgta taccccggat cgtggcgttc tggaaggtat tacccgcaaa 720
agcgttattg aagttgcgcg cgcaaattcc attgataccc gcctggaagt tgttccggtt 780
gaaacctgct accacgcgga cgaaatcttt tgctgttcga ccggcggcgg tatttgtccg 840
atcaccctgc tggacggtaa accggttggt gacggtcagg taggcccgat taccaaaaag 900
atttgggacg gctactggga gatgcattat aacgatgcgt acagctttcc ggtagattat 960
ggtagcgat 969
<210> 12
<211> 323
<212> PRT
<213> 人工序列(artificial sequence)
<400> 12
Met Ala Thr Ile Asp Lys Val Phe Ala Gly Tyr Tyr Ala Arg Lys Lys
1 5 10 15
Leu Leu Glu Ala Ser Asp Asn Pro Phe Ser Gln Gly Ile Ala Tyr Val
20 25 30
Glu Gly Lys Phe Val Leu Pro Tyr Glu Ala Arg Ile Pro Leu Leu Asp
35 40 45
Glu Gly Phe Met Gly Ser Asp Leu Thr Tyr Asp Gly Phe His Val Trp
50 55 60
Asp Gly Arg Phe Phe Arg Leu Asp Asp His Leu His Arg Ile Leu Glu
65 70 75 80
Ser Cys Asp Lys Met Arg Leu Lys Phe Pro Leu Pro Val Ser Ser Val
85 90 95
Arg Lys Ile Leu Ile Glu Met Val Ala Lys Ser Gly Ile Arg Asp Ala
100 105 110
Met Gly Leu Ile Ile Val Thr Arg Gly Met Thr Gly Val Gln Gly Met
115 120 125
Lys Asp Glu Asp Leu Tyr Asn Asn Glu Ile Tyr Leu Leu Val Leu Pro
130 135 140
Tyr Ile Trp Leu Met Ala Pro Glu Asp Gln Arg His Gly Gly Ser Ala
145 150 155 160
Ile Ile Thr Arg Thr Val Arg Arg Thr Pro Pro Gly Ala Phe Asp Pro
165 170 175
Thr Ile Lys Asn Leu Gln Trp Gly Asp Phe Asn Arg Gly Leu Phe Glu
180 185 190
Ala Lys Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp Thr
195 200 205
His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asn Gly
210 215 220
Ile Leu Tyr Thr Pro Asp Arg Gly Val Leu Glu Gly Ile Thr Arg Lys
225 230 235 240
Ser Val Ile Glu Val Ala Arg Ala Asn Ser Ile Asp Thr Arg Leu Glu
245 250 255
Val Val Pro Val Glu Thr Cys Tyr His Ala Asp Glu Ile Phe Cys Cys
260 265 270
Ser Thr Gly Gly Gly Ile Cys Pro Ile Thr Leu Leu Asp Gly Lys Pro
275 280 285
Val Gly Asp Gly Gln Val Gly Pro Ile Thr Lys Lys Ile Trp Asp Gly
290 295 300
Tyr Trp Glu Met His Tyr Asn Asp Ala Tyr Ser Phe Pro Val Asp Tyr
305 310 315 320
Gly Ser Asp

Claims (19)

1.一种工程化转氨酶多肽,该转氨酶多肽可在合适的反应条件下、在氨基供体存在时,能够将结构式A-1化合物:3-羰基-1-[3-(三氟甲基)-5,6,7,8-四氢-1,2,4-***并[4,3-a]吡嗪-7-基]-4-(2,4,5-三氟苯基)丁-1-酮,转化为结构式A-2化合物:(3R)-3-氨基-1-[3-(三氟甲基)-5,6,7,8-四氢-1,2,4-***并[4,3-a]吡嗪-7-基]-4-(2,4,5-三氟苯基)丁-1-酮;且所述的工程化转氨酶多肽是与SEQ ID No:2所示的氨基酸序列具有至少80%序列同一性的多肽。
Figure FDA0002087915500000011
2.如权利要求1所述的转氨酶多肽,其中所述合适的反应条件包括约2g/L-100g/L底物A-1的载量,约0.5M-2.0M异丙胺,约50μM-5mM PLP,约pH7.0-11.0,约10%-40%(v/v)甲醇,约10-60℃。
3.如权利要求1或2任一项所述的转氨酶多肽,其中所述氨基酸序列包括在SEQ ID No:2所示序列的第3、4、9、15、20、27、36、40、41、53、60、61、62、76、78、92、93、97、98、101、113、114、115、116、122、126、128、130、137、148、153、155、159、186、187、188、190、194、209、214、226、235、244、253、262、263、266、271、273、275、279、287、290、312、323位氨基酸残基中的一个或多个位点经过取代且具有转氨酶活性的多肽。
4.如权利要求3所述的转氨酶多肽,其中所述氨基酸序列另外包含选自下列的一个或多个残基位置处的氨基酸残基差异:
X3是T;
X4是I;
X9是A;
X15是K;
X20是A;
X27是Q;
X36是F;
X40是Y;
X41是E;
X53是G;
X60是G;
X61是F;
X62是H;
X76是H;
X78是L;
X92是P;
X93是V;
X97是R;
X98是K;
X101是V或I;
X113是M;
X114是G;
X115是K或L;
X116是I;
X122是M;
X126是Q;
X128是R或M;
X130是D;
X137是E;
X148是L;
X153是K或D;
X155是R;
X159是S;
X186是F;
X187是I或N;
X188是R;
X190是M;
X194是K;
X209是H;
X214是P;
X226是L;
X235是E;
X244是E;
X253是V或T;
X262是A或T;
X263是C;
X266是A;
X271是C;
X273是S;
X275是G;
X279是C;
X287是K;
X290是G;
X312是A或D;或
X323是D;
其中的数字编号是SEQ ID No:2所示序列的相应位置。
5.一种工程化多肽,所述的工程化多肽是如下(a)或(b)的多肽:
(a)SEQ ID No4、6、8、10、12所示的氨基酸序列;
(b)由(a)的氨基酸序列中经过取代、缺失或添加一个或多个氨基酸残基且具有催化A-1转化为A-2活性的由(a)衍生的并和(a)的氨基酸序列具有至少80%同一性的多肽。
6.一种通过化学键或物理吸附的方法被固定在固体材质上的多肽,所述多肽选自权利要求1-5任一项所述的转氨酶多肽。
7.一种多核苷酸,所述多核苷酸编码权利要求1-6任一项的多肽。
8.如权利要求8所述的多核苷酸,其中所述多核苷酸序列为对应SEQ ID No:3、5、7、9、11的序列。
9.一种表达载体,所述表达载体包含权利要求7-8所述的多核苷酸。
10.如权利要求9所述的表达载体,所述表达载体包括质粒、粘粒、噬菌体或病毒载体。
11.一种宿主细胞,所述宿主细胞包括权利要求9-10任一项的表达载体,所述宿主细胞优选大肠杆菌(E.coli)。
12.一种转氨酶多肽的制备方法,其包括如下步骤:培养权利要求11所述的宿主细胞,以及从培养物中获得转氨酶多肽。
13.一种转氨酶催化剂,其选自权利要求9-11任一项的培养物,通过从培养物中获得的含转氨酶多肽的宿主细胞或培养液,或者用其加工的制品;其中,所述制品是指由转化体细胞得到的提取物,通过对提取物中的转氨酶进行分离或纯化得到的分离产品,或通过固定化转化体细胞及其提取物或提取物的分离产品而得到的固定化制品。
14.一种制备结构式A-2化合物的方法:
Figure FDA0002087915500000041
所述方法包括在适于转化式A-1化合物为式A-2化合物的反应条件下,在氨基供体存在下,将结构式A-1化合物
Figure FDA0002087915500000051
与权利要求1-6任一项的工程化转氨酶多肽接触的步骤。
15.如权利要求14所述的方法,其中所述手性胺产物A-2以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的对映体过量产生。
16.如权利要求14-15任一项所述的方法,其中所述反应溶剂包括水,甲醇,乙醇,丙醇,异丙醇,乙酸异丙酯,二甲基亚砜(DMSO)或二甲基甲酰胺(DMF)。
17.如权利要求14-16任一项所述的方法,其中所述反应条件包括10℃至60℃的温度。
18.如权利要求14-17任一项所述的方法,其中所述反应条件包括pH7.0至pH11.0。
19.如权利要求14-18任一项所述的方法,其中所述A-1底物以2g/L至100g/L的载量存在。
CN201910493876.7A 2019-06-07 2019-06-07 一种制备西他列汀的工程化转氨酶多肽 Active CN112048485B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910493876.7A CN112048485B (zh) 2019-06-07 2019-06-07 一种制备西他列汀的工程化转氨酶多肽

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910493876.7A CN112048485B (zh) 2019-06-07 2019-06-07 一种制备西他列汀的工程化转氨酶多肽

Publications (2)

Publication Number Publication Date
CN112048485A true CN112048485A (zh) 2020-12-08
CN112048485B CN112048485B (zh) 2022-09-27

Family

ID=73609114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910493876.7A Active CN112048485B (zh) 2019-06-07 2019-06-07 一种制备西他列汀的工程化转氨酶多肽

Country Status (1)

Country Link
CN (1) CN112048485B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023169184A1 (en) * 2022-03-10 2023-09-14 Enzymaster (Ningbo) Bio-Engineering Co., Ltd. Biocatalyst and method for the synthesis of ubrogepant intermediates
CN118086285A (zh) * 2024-04-23 2024-05-28 天津凯莱英生物科技有限公司 蛋白定向进化的方法
WO2024121301A1 (en) 2022-12-09 2024-06-13 Krka, D.D., Novo Mesto Process for the preparation of sitagliptin

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107653233A (zh) * 2017-07-06 2018-02-02 泰州学院 一种改进的转氨酶、其编码基因及表达该酶的基因工程菌
CN109957554A (zh) * 2017-12-26 2019-07-02 宁波酶赛生物工程有限公司 工程化转氨酶多肽及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107653233A (zh) * 2017-07-06 2018-02-02 泰州学院 一种改进的转氨酶、其编码基因及表达该酶的基因工程菌
CN109957554A (zh) * 2017-12-26 2019-07-02 宁波酶赛生物工程有限公司 工程化转氨酶多肽及其应用

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023169184A1 (en) * 2022-03-10 2023-09-14 Enzymaster (Ningbo) Bio-Engineering Co., Ltd. Biocatalyst and method for the synthesis of ubrogepant intermediates
WO2024121301A1 (en) 2022-12-09 2024-06-13 Krka, D.D., Novo Mesto Process for the preparation of sitagliptin
CN118086285A (zh) * 2024-04-23 2024-05-28 天津凯莱英生物科技有限公司 蛋白定向进化的方法

Also Published As

Publication number Publication date
CN112048485B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN112048485B (zh) 一种制备西他列汀的工程化转氨酶多肽
CN109957554B (zh) 工程化转氨酶多肽及其应用
CN113061594B (zh) 转氨酶突变体、固定化转氨酶及用于制备西他列汀的用途
CN111321129B (zh) 工程化酮还原酶多肽及其应用
AU2019302422B2 (en) Engineered phosphopentomutase variant enzymes
CN112210549B (zh) 腈水解酶突变蛋白及其在催化合成(r)-3-取代-4-氰基丁酸类化合物中的应用
EP3820502A1 (en) Engineered purine nucleoside phosphorylase variant enzymes
JP7491588B2 (ja) 操作されたパントテン酸キナーゼ改変体酵素
KR20180004169A (ko) 페니실린-g 아실라아제
CN111411094B (zh) 一种(R)-ω-转氨酶突变体及其应用
CN111411095B (zh) 一种重组(R)-ω-转氨酶及其突变体和应用
CN115466756A (zh) 转氨酶、固定化转氨酶及用于制备西他列汀的用途
CN115975969A (zh) 转氨酶及用于制备西他列汀或其中间体的用途
CN109593748B (zh) 工程化脱羧酶多肽及其在制备β-丙氨酸中的应用
EP3994153A2 (en) Engineered acetate kinase variant enzymes
WO2023169184A1 (en) Biocatalyst and method for the synthesis of ubrogepant intermediates
CN111793615B (zh) 工程化多肽及其在合成酪氨酸或酪氨酸衍生物中的应用
CN109943543B (zh) 醇脱氢酶突变体及其制备方法和应用
KR102016050B1 (ko) 신규한 프로모터 및 이의 용도
CN110343690B (zh) 脱羧酶多肽及其在制备酪胺和多巴胺中的应用
US20240002817A1 (en) Engineered pantothenate kinase variant enzymes
CN112746066A (zh) 一种l-赖氨酸脱羧酶突变体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant