CN103998461B - 用于合成取代的内酰胺的生物催化剂和方法 - Google Patents

用于合成取代的内酰胺的生物催化剂和方法 Download PDF

Info

Publication number
CN103998461B
CN103998461B CN201280054745.5A CN201280054745A CN103998461B CN 103998461 B CN103998461 B CN 103998461B CN 201280054745 A CN201280054745 A CN 201280054745A CN 103998461 B CN103998461 B CN 103998461B
Authority
CN
China
Prior art keywords
compound
amino acid
seq
alkyl
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280054745.5A
Other languages
English (en)
Other versions
CN103998461A (zh
Inventor
法比安·L·卡比罗尔
陈海滨
阿努潘·苟呵尔
宝琳娜·萨利姆
德里克·史密斯
雅各布·杰恩
波吉特·科斯耶克
邓永琳
海伦·谢
范森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of CN103998461A publication Critical patent/CN103998461A/zh
Application granted granted Critical
Publication of CN103998461B publication Critical patent/CN103998461B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D211/00Heterocyclic compounds containing hydrogenated pyridine rings, not condensed with other rings
    • C07D211/04Heterocyclic compounds containing hydrogenated pyridine rings, not condensed with other rings with only hydrogen or carbon atoms directly attached to the ring nitrogen atom
    • C07D211/68Heterocyclic compounds containing hydrogenated pyridine rings, not condensed with other rings with only hydrogen or carbon atoms directly attached to the ring nitrogen atom having one double bond between ring members or between a ring member and a non-ring member
    • C07D211/72Heterocyclic compounds containing hydrogenated pyridine rings, not condensed with other rings with only hydrogen or carbon atoms directly attached to the ring nitrogen atom having one double bond between ring members or between a ring member and a non-ring member with hetero atoms or with carbon atoms having three bonds to hetero atoms, with at the most one bond to halogen, directly attached to ring carbon atoms
    • C07D211/74Oxygen atoms
    • C07D211/76Oxygen atoms attached in position 2 or 6
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/005Amino acids other than alpha- or beta amino acids, e.g. gamma amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开内容涉及能够胺化二羰基底物的转氨酶多肽,并且涉及制备和使用所述转氨酶多肽的多核苷酸、载体、宿主细胞和方法。

Description

用于合成取代的内酰胺的生物催化剂和方法
1.技术领域
本公开内容涉及生物催化剂和使用该生物催化剂来制备含环氮原子的杂环的方法。
2.参考序列表、表格或计算机程序
序列表的正式复本作为ASCII格式化文本文件与说明书经EFS-Web同时被提交,文件名为“CX2-097WO2_ST25.txt”,创建日期为2012年9月7日,且大小为1,826,728字节。经EFS-Web提交的序列表为本说明书的一部分,并且通过引用整体并入本文。
3.背景
内酰胺为环酰胺,并在许多药物化合物中形成关键结构基序。实例包括基于β-内酰胺的抗生素、口服抗凝剂利伐沙班和抗惊厥药左乙拉西坦。虽然这些化合物共享内酰胺核,但重要的差异出现在对内酰胺环的氮原子和非羰基碳原子的取代。对内酰胺碳环原子的取代针对降钙素受体拮抗剂(Paone等人,2007,J.Med.Chem.,50:5564-5567;Burgey等人,2008,Org.Lett.,10(15):3235-3238)和类阿片受体拮抗剂(美国专利号6,852,713)被描述。各种方法已被开发用于制备内酰胺。化合物可由酸介导的肟重排通过贝克曼重排(Beckman rearrangement)来形成,例如由环己酮通过环己酮肟(cyclohexanoxime)中间物形成己内酰胺。可选的方法是氨基酸的环化,例如,赖氨酸环化以形成ε-己内酰胺(美国专利公布2007/0149777A1)。用于制备内酰胺的其它方法描述于例如,美国专利号4,870,173、6,054,579、6,150,535、6,770,658、6,852,713、7,276,531和7,378,410。对于合成来说特别具有挑战性的是取代的内酰胺的立体异构形式。例如,Burgey等人, 同上,描述合成降钙素基因相关的肽拮抗剂替卡格泮。该合成部分地采用化合物(1R)-1-{[[2-(2,3-二氟苯基)丙-2-烯基](2,4-二甲氧基苄基)氨基]羰基}丁-3-烯基氨基甲酸苄酯的闭环,使用Grubbs催化剂,以形成受保护的内酰胺中间体化合物,随后是涉及Pd介导的还原,以非对映体过量形成反式内酰胺中间体(3R,6S)-6-(2,3-二氟苯基)-2-氧代氮杂环庚烷(oxoazepan)-3-基氨基甲酸叔丁酯的两个步骤。
鉴于上述情况,希望提供合成内酰胺,特别是取代的内酰胺的简易方法,其中合成方法显示起始材料到内酰胺产物的有效转化率,采用温和的条件,并且其中该方法对取代的内酰胺的特定立体异构体可以是立体选择性的。
4.概述
本公开内容提供具有转氨酶活性的工程化多肽、编码该多肽的多核苷酸、制备该多肽的方法、以及将该多肽用于二羰基底物化合物的生物催化胺化,然后可将该二羰底物化合物转化为含环氮原子的杂环尤其是取代的内酰胺的方法。
因此,在一个方面中,本公开内容提供能够将底物化合物2转化为产物化合物1的工程化转氨酶,如方案1中说明的。
方案1
易离去基团(例如,异丙氧基)的利用,允许在转氨酶的反应条件下将胺化的产物化合物1直接转化为内酰胺化合物3。本公开内容的工程化 转氨酶是基于节杆菌Arthrobacter sp.KNK168的天然存在的转氨酶(SEQ ID NO:2的多肽),并且包括与野生型序列或相应于SEQ ID NO:4的参考序列相比具有一个或多个残基差异的氨基酸序列。这些残基差异在影响酶的功能特性的残基位置出现,功能特性包括活性(例如,相对于SEQ IDNO:4的参考转氨酶)、立体选择性、底物结合、热稳定性、溶剂稳定性、表达、或其各种组合以及其他。
在一些实施方案中,工程化转氨酶包括具有与SEQ ID NO:4的参考多肽至少80%的序列同一性和与SEQ ID NO:4相比在选自以下的残基位置上的一个或多个氨基酸残基差异的氨基酸序列:X12;X13;X42;X52;X54;X56;X61;X62;X64;X68;X69;X72;X80;X84;X103;X115;X117;X122;X124;X126;X127;X128;X134;X136;X139;X140;X143;X150;X152;X155;X156;X157;X159;X160;X165;X168;X176;X192;X196;X199;X208;X209;X215;X223;X227;X231;X266;X267;X269;X273;X282;X284;X295;X296;X300;X311;X312;X320;X324;X325和X327。在一些实施方案中,与SEQ ID NO:4相比的氨基酸残基差异选自以下:X12H;X13A;X13F;X42G;X52H;X54A;X54L;X54P;X54R;X56D;X56E;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X68I;X69A,X69G,X69T;X72A;X80Q;X84T;X103G;X115R;X117V;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126I,X126T;X127T;X128A;X134S;X136F,X136K,X136L,X136M,X136Y;X139E;X140K;X143V;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155I,X155L,X155T;X156A,X156S,X156T;X157L;X159G;X160L;X165N;X168R;X176C;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X208K;X209F,X209M,X209Q,X209V;X215H;X215L;X223S,X223T,X223V;X227I;X231T;X266N;X267V;X269L;X273H;X282I;X282L,X282V;X284A,X284P,X284S,X284T,X284V;X295S;X296D;X300G;X311T;X312C;X320G;X324Q;X325P,X325V;和X327L。在其它残基位置上的其它氨基酸残 基差异被进一步描述于详述中。
在一些实施方案中,工程化转氨酶包括具有与SEQ ID NO:4的参考多肽至少80%的序列同一性和与SEQ ID NO:4相比在选自以下的残基位置上的一个或多个氨基酸残基差异的氨基酸序列:X2;X4;X5;X6;X8;X9;X10;X12;X13;X17;X18;X21;X22;X25;X27;X28;X29;X30;X31;X34;X37;X42;X43;X46;X47;X48;X49;X50;X52;X54;X55;X56;X61;X62;X64;X66、X68;X69;X72;X80;X81;X84;X85;X88;X97;X99;X101;X102;X103;X106;X107;X108;X115;X117;X120;X122;X124;X126;X127;X128;X131;X132;X134;X136;X139;X140;X141;X142;X143;X144;X146;X150;X152;X155;X156;X157;X159;X160;X161;X165;X168;X176;X179;X185;X190;X191;X192;X196;X199;X208;X209;X210;X215;X217;X223;X227;X231;X233;X234;X241;X256;X260;X263;X265;X266;X267;X269;X270;X273;X274;X282;X284;X295;X296;X297;X300;X305;X308;X309;X311;X312;X316;X319;X320;X323;X324;X325;X327;和X329。在一些实施方案中,与SEQ ID NO:4相比的氨基酸残基差异选自以下:X2M;X4F,X4L,X4Y;X5C,X5F,X5I,X5H,X5K,X5L,X5M,X5N,X5P,X5S,X5T,X5V,X5Y;X6F,X6R,X6S,X6T;X8H;X9L,X9I,X9Q,X9F;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X37S;X42G;X43S;X46R;X47R;X48A,X48G,X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X55M;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X81K;X84T;X85L,X85R;X88W;X89L;X97P,X97T;X99L;X101G,X101L,X101R;X102H,X102R;X102T,X102W;X103G,X103N,X103V;X106L,X106S,X106T,X106V;X107V;X108T;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T; X127T;X128A;X131F;X132H;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T,X140V;X141A;X142M;X143V;X144D,X144I;X146R;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X159G;X160L;X161M,X161N;X165L,X165N,X165V;X168E,X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X203M;X208K;X209F,X209M,X209Q,X209V;X210G,X210S;X215F,X215H,X215L;X217L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X256R;X260Q;X263V;X265Y,X265W;X266N;X267V;X269L,X269T;X270R,X270T;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296L,X296R,X296S,X296W;X297D;X297G;X300G,X300L;X305Q,X305T;X308A;X309L,X309T,X309W;X311Q,X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323N,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L,X327R;和X329P。在其它残基位置上的其它氨基酸残基差异被进一步描述于详述中。
如本文所提供,在一些实施方案中,公开的氨基酸差异可单独使用或以各种组合使用以产生具有改进的酶特性的工程化多肽。在一些实施方案中,工程化转氨酶多肽包括具有与参考序列SEQ ID NO:4至少80%的序列同一性和与SEQ ID NO:4相比在残基位置X192上的至少一个残基差异的氨基酸序列。在一些实施方案中,在残基位置X192上的氨基酸残基选自A、G、H、K、N、Q、R和S。
在一些实施方案中,转氨酶多肽包括具有与SEQ ID NO:4至少80%的序列同一性和与SEQ ID NO:4相比选自以下的一个或多个残基差异的 氨基酸序列:X12H;X13A;X13F;X52H;X54A;X54L;X56D;X56E;X61G;X61W;X62A;X62L;X62N;X62S;X64C;X68I;X72A;X80Q;X84T;X103G;X115R;X117V;X122F,X122W;X122Y;X124K;X124M;X124S;X124W;X126C;X126I;X127T;X128A;X134S;X136K;X136L;X136M;X139E;X140K;X143V;X150L;X152A,X152F;X152R;X152W;X155I;X155L;X159G;X168R;X176C;X192A;X192G;X192H;X192K;X192N;X192Q;X192R;X192S;X196L;X196V;X199L;X199V;X208K;X209F;X209M;X209Q;X209V;X215H;X215L;X223S;X223T;X223V;X227I;X231T;X266N;X269L;X273H;X282I;X282L,X282V;X284A;X284P;X284S;X284T;X284V;X295S;X296D;X300G;X311T;X312C;X320G;X324Q;X325P;X325V;和X327L。
在一些实施方案中,转氨酶多肽包括具有与SEQ ID NO:4至少80%的序列同一性列和与SEQ ID NO:4相比选自以下的一个或多个残基差异的氨基酸序:X2M;X4F,X4L;X5C,X5F,X5M,X5P,X5Y;X6F,X6R,X6S,X6T;X8H;X9I,X9F,X9L;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X37S;X42G;X43S;X46R;X47R;X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X55M;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X81K;X84T;X85L,X85R;X88W;X89L;X97P,X97T;X99L;X101G,X101L,X101R;X102H,X102R;X102T,X102W;X103G,X103N,X103V;X106L,X106S,X106T,X106V;X107V;X108T;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T;X127T;X128A;X131F;X132H;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T,X140V;X141A;X142M;X143V;X144D,X144I;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L, X155T;X156A,X156F,X156S,X156T;X157L;X159G;X160L;X161M,X161N;X165L,X165N,X165V;X168E,X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X203M;X208K;X209F,X209M,X209Q,X209V;X210G;X215H,X215L;X217L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X256R;X260Q;X263V;X265Y,X265W;X266N;X267V;X269L,X269T;X270R,X270T;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296L,X296R,X296S,X296W;X300G,X300L;X305Q,X305T;X308A;X309L,X309T,X309W;X311Q,X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323N,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L,X327R;和X329P。
在一些实施方案中,该转氨酶多肽包括具有与SEQ ID NO:4相比选自以下的氨基酸残基差异的组合的氨基酸序列:(a)X124W和X327L;(b)X209M和X300G;(c)X122F,X223V和X284A;(d)XI92A,X215H和X311T;(e)X62N,X124F,X126A和X136L;(f)X124W,X126A,X136L、X192A和X284A;(g)X124W,X126A,X136L,X152R/X152L/X152I和X192A;(h)X124W,X126A,X136L,X192A,X215F和X284A;(i)X124W,X126A,X136L,X192A,X215F,X273R,X284A和X323C;以及(j)X124W,X126A,X136L,X191A,X192A,X215F,X273R,X284A和X323C。
在一些实施方案中,转氨酶多肽包括具有与SEQ ID NO:4相比存在于SEQ ID NO:84中的氨基酸残基差异的组合(即,X124W、X126A、X136L、X192A和X284A),且还包括与SEQID NO:4相比在选自以下的残基位置上的氨基酸差异的氨基酸序列:X2;X4;X5;X6;X8;X9;X10;X17;X18;X21;X22;X25;X27;X28;X29;X30;X31;X34;X37;X43;X46;X47;X48;X49;X50;X55;X66;X81;X85;X88;X97;X99; X101;X102;X106;X107;X108;X120;X131;X132;X141;X142;X144;X146;X161;X179;X185;X190;X191;X210;X217;X233;X234;X241;X256;X260;X263;X265;X270;X274;X297;X305;X308;X309;X316;X319;X323;和X329。在一些实施方案中,与SEQ ID NO:4相比的更多氨基酸残基差异选自以下:X2M;X4F;X4L;X4Y;X5C;X5F;X5I;X5H;X5K;X5L;X5M;X5N;X5P;X5S;X5T;X5V;X5Y;X6F;X6S;X6T;X8H;X9L;X9I;X6R;X9Q;X9F;X10L;X17L;X18I;X21L;X22A;X22H;X25A;X27L;X27H;X27P;X28N;X29N;X29T;X30F;X30G;X31H;X31R;X34V;X37S;X43S;X46R;X47R;X48A,X48G,X48R,X48S,X48W;X49I,X49P;X50S;X54M;X55M;X56W;X66A,X66S;X81K;X85L,X85R;X88W;X89L;X97P,X97T;X99L;X101G,X101L,X101R;X102H,X102R,X102T;X102W;X103N,X103V;X106L,X106S,X106T,X106V;X107V;X108T;X120F;X126G;X131F;X132H;X134G,X134L,X134V,X134Y,X134W;X140A;X140M;X140T,X140V;X141A;X142M;X144D,X144I;X146R;X155C;X156F;X161M,X161N;X165L,X165V;X168E;X179K;X185A;X190M;X191A,X191G,X191S;X203M;X210G,X210S;X215F;X217L;X223A;X233D;X234L;X241R;X256R;X260Q;X263V;X265Y;X265W;X269T;X270R,X270T;X273D;X273M;X273R;X273V;X274F;X274L;X274R;X274T;X282T;X295N;X296L,X296R;X296S;X296W;X297D;X297G;X300L;X305Q,X305T;X308A;X309W;X309L,X309T;X311Q;X312M;X316L;X316R;X319R;X319T;X319Y;X320Q;X323C,X323E,X323N,X323R;X325M,X325Q;X327R;和X329P。
结合氨基酸差异、包括其各种组合、且具有改进特性的示例性工程化多肽被公开于表2A、2B、2C、2D、2E、2F、2G、2H和2I以及实施例中。氨基酸序列被提供在序列表中,并且包括具有SEQ ID NO:6-854中的偶数序列标识符的序列。
在一些实施方案中,工程化转氨酶展现相比于对化合物1b和化合物 1c(即,[1b+1c])的对化合物1a和化合物1d(即,[1a+1d])的立体选择性
使得在一些实施方案中,化合物1a和化合物1d以相比于化合物1b和化合物1c大于8:1的非对映体比被生产。相比于对化合物1b和化合物1c具有对化合物1a和化合物1d的立体选择性的示例性工程化转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:6、10、12、14、16、18、20、22、24、26、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、372、412、526、528、550、580、582、624、630、640、648、654、656、668、692、696、700、704、714、716、718、720、742、764、774、798、818、824和826。
在一些实施方案中,相比于对化合物1a,工程化转氨酶多肽对化合物1d是立体选择性的。相比于对化合物1a具有对化合物1d的立体选择性的示例性工程化转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:6、8、10、12、14、22、24、28、30、32、44、48、50和52。
在一些实施方案中,相比于对化合物1d,转氨酶多肽对化合物1a是立体选择性的。相比于对化合物1d具有对化合物1a的立体选择性的示例性工程化转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:16、18、20、26、34、42、46、56、58、60、62、64、68、70、72、74、76、78、80、82和84。
在一些实施方案中,转氨酶多肽被固定在固体载体上。在一些实施方案中,固体载体是包括具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯的珠或树脂。
在另一个方面中,本公开内容提供编码能够将化合物2转化为化合物1的工程化转氨酶的多核苷酸,以及包括该多核苷酸的表达载体,以及能够表达编码该多肽的多核苷酸的宿主细胞。在一些实施方案中,本公开内容还提供用于制备工程化转氨酶多肽的方法,其中该方法包括在适合该多肽的表达的条件下培养能够表达编码该工程化转氨酶多肽的多核苷酸的宿主细胞。示例性多核苷酸序列被提供在通过引用并入本文的序列表中并且包括具有SEQ ID NO:5-853中的奇数序列标识符的序列。
在另一个方面中,工程化转氨酶多肽可在用于将结构式II的底物化合物转化为结构式I的产物化合物的方法中被使用,如方案3中所示,
方案3
其中
L为离去基团;
A为任选地取代的环烷基、杂环烷基、芳基、杂芳基、稠合芳基或稠合杂芳基;
R1为H或任选地取代的(C1-C6)烷基;
Q为O或S;
M为-CRaRb-,其中每一个M独立于其它M,且Ra和Rb选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、 芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;且
n为从0至4的整数。
如方案3中所示,结构式I的产物化合物的环化允许结构式III的含有氮的杂环的合成。在转氨酶反应的反应条件下,离去基团的适当选择允许直接形成结构式III的化合物,从而提供用于合成杂环的简易方法。在结构式II的范围内的各种底物化合物可被使用以制备结构式I的相应产物化合物,然后结构式I的相应产物化合物用作用于制备结构式III的范围内的杂环的中间体。
因此,在一些实施方案中,用于制备结构式I的化合物的方法包括在适当的反应条件下在氨基供体的存在下使结构式II的化合物与本公开内容的任何工程化转氨酶接触。逻辑上,用于制备结构式III的相应化合物的方法,包括(a)制备式I的化合物,以及(b)环化结构式II的化合物。
在方法的一些实施方案中,结构式II的化合物为式2p的化合物,
其中PG为保护基团,由此产生式1p的化合物:
在一些实施方案中,式3p的化合物
通过以下容易地形成:(a)制备式1p的化合物,以及(b)环化式1p的化合物。
在一些实施方案中,方法可用于通过使用具有适当的立体选择性的工程化转氨酶以立体异构过量制备化合物1的各种立体异构体。因此,在一些实施方案中,方法可用于通过在适当的反应条件下在氨基供体存在下,
使化合物2p与相比于化合物1b1和化合物1c1对化合物1d1和化合物1a1是立体选择性的工程化转氨酶接触以化合物1b1和化合物1c1的非对映体过量制备化合物1d1和化合物1a1。
在方法的一些实施方案中,化合物1d1可以通过在适当的反应条件下,在氨基供体的存在下,使化合物2p与相比于化合物1a1对化合物1d1是 立体选择性的工程化转氨酶接触,以相比于化合物1a1的非对映体过量被制备。
在方法的一些实施方案中,化合物1a1可通过在适当的反应条件下,在氨基供体的存在下,使化合物2p与相比于化合物1d1对化合物1a1是立体选择性的工程化转氨酶接触,以相比于化合物1d1的非对映体过量被制备。
在一些实施方案中,通过环化立体选择性的转氨酶反应的产物化合物,化合物3p的各种立体异构体可以以立体异构过量被制备。因此,在一些实施方案中,化合物3d1和化合物3a1可以通过以下步骤以相比于化合物3b1和化合物3c1的非对映体过量被制备
(a)以化合物1b1和化合物1c1的非对映体过量制备化合物1d1和化合物1a1,以及(b)环化步骤(a)的产物。
在一些实施方案中,化合物3d1可以通过以下步骤以化合物3a1的非对映体过量被制备:(a)以化合物1a1的非对映体过量制备化合物1d1,以及(b)环化步骤(a)的产物。
在一些实施方案中,化合物3a1可以通过以下步骤以化合物3d1的非对映体过量被制备:(a)以化合物1d1的非对映体过量制备化合物1a1,以及(b)环化步骤(a)的产物。
用于进行氨基交换和环化方法的参数,包括:底物化合物载量、酶载量、辅助因子载量、氨基供体、溶剂条件(例如,缓冲液、DMSO等)、pH和温度以及其他,被进一步描述于下面的详述中。
5.详述
除非上下文另外清楚地指明,否则如该说明书和所附的权利要求书中使用的单数形式“一(a)”、“一(an)”和“该(the)”包括复数指示物。因此,例如,提及“一种多肽”包括多于一种多肽。
类似地,“包括(comprise)”、“包括(comprises)”、“包括(comprising)”、“包括(include)”、“包括(includes)”、“包括(including)”、“具有(have)”和“具有(having)”是可互换的,且不意图为限制性的。
还应理解的是,当各个实施方案的描述使用术语“包括(comprising)”时,本领域技术人员将理解,在一些特定情况下,一种实施方案可替代地利用措辞“基本上由…组成”或“由…组成”来描述。
应理解,包括附图的上述的一般说明,和下述的详述都只是示例性和说明性的,而不是限制本公开内容。
本文所用的章节标题仅用于组织目的,且不应当被解释为限制所描述的主题。
5.1缩写
用于基因编码的氨基酸的缩写是常规的,并如下:
当使用三个字母缩写时,除非前面明确加有“L”或“D”或从使用缩写的上下文明显,否则氨基酸可为关于α-碳(Cα)成L-构型或D-构型。例如,尽管“Ala”表示丙氨酸,而没有规定关于α-碳的构型,但“D-Ala”与“L-Ala”分别表示D-丙氨酸与L-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳成L-构型的氨基酸类,而小写字母表示关于α-碳成D-构型的氨基酸类。例如,“A”表示L-丙氨酸而“a”表示D-丙氨酸。当多肽序列被呈现为一串单个字母或三个字母缩写(或其混合)时,根据通常惯例,序列以氨基(N)至羧基(C)方向呈现。
用于基因编码的核苷的缩写是常规的,并且是如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);以及尿苷(U)。除非特别描绘,否则缩写的核苷可为核糖核苷或2’-脱氧核糖核苷。核苷可以单个计或以聚集体计被指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列被呈现为一串一个字母缩写时,根据通常惯例,序列以5’至3’方向呈现,且没有显示磷酸盐。
5.2定义
关于本公开内容,除非另外具体指明,否则本文的说明书中使用的技术术语和科学术语具有本领域普通技术人员通常理解的含义。因此,以下术语意为具有以下含义:
“蛋白”、“多肽”和“肽”在本文中可互换使用,表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如,糖基化、磷酸化、脂化、棕榈酸化(myristilation)、泛素化等等)。包括在这一定义中的是D-氨基酸和L-氨基酸,以及D-氨基酸和L-氨基酸的混合物。
“转氨酶”或“氨基转移酶”在本文可互换使用,以指具有从伯胺将氨基(-NH2)、一对电子和质子转移至受体分子的羰基(C=O)的酶促能力的多肽。如本文所用的转氨酶包括天然存在的(野生型)转氨酶以及由人工操作产生的非天然存在的工程化多肽。
“氨基受体”和“胺受体”、“酮底物”在本文可互换使用以指接受来 自供体胺的氨基基团的羰基化合物。氨基受体是如下所示的通式的分子,
氨基受体
其中,Rα与Rβ中的每一个当独立地被采用时,是氢、烷基、烷芳基基团、或未被取代的或用一个或多个酶学上可接受的基团取代的芳基基团,条件是当Rα或Rβ中的任一个为H时,另一个为烷基、烷芳基基团、或芳基基团。Rα可在结构或手性上与Rβ相同或不同。在一些实施方案中,Rα与Rβ,结合在一起可形成为未被取代的、取代的或稠合至其它环的环。氨基受体包括醛、酮基羧酸和链烷酮(酮)。典型的酮基羧酸是α-酮基羧酸诸如乙醛酸、丙酮酸、草酰乙酸和类似的酮基羧酸,以及这些酸的盐。氨基受体还包括由其它酶或全细胞进程转化为氨基受体的物质,诸如富马酸(其可被转化为草酰乙酸)、葡萄糖(其可被转化为丙酮酸盐)、乳酸盐、马来酸以及其它。可被使用的氨基受体包括,通过举例的方式而非限制,(R)-2-(3,4-二甲氧基苯乙氧基)环己酮((R)-2-(3,4-dimethoxyphenethoxy)cyclohexanone)、3,4-二氢化萘-1(2H)-酮、1-苯基丁-2酮、3,3-二甲基丁-2-酮、辛-2-酮、3-氧代丁酸乙酯、4-苯基丁-2-酮、1-(4-溴苯基)乙酮、2-甲基-环己酮、7-甲氧基-2-四氢萘酮、1-羟基丁-2-酮、丙酮酸、乙酰苯、(R)-2-(3,4-二甲氧基苯乙氧基)环己酮、2-甲氧基-5-氟苯乙酮、乙酰丙酸、1-苯基丙-1-酮、1-(4-溴苯基)丙-1-酮、1-(4-硝基苯基)丙-1-酮、1-苯基丙-2-酮、2-氧代-3-甲基丁酸、1-(3-三氟甲基苯基)丙-1-酮、羟基丙酮、甲氧基氧基丙酮(methoxyoxypropanone)、1-苯基丁-1-酮、1-(2,5-二甲氧基-4-甲基苯基)丁-2-酮、1-(4-羟基苯基)丁-3-酮、2-乙酰基萘、苯基丙酮酸、2-酮戊二酸和2-酮丁二酸,包括可能的(R)和(S)单异构体。
“氨基供体”或“胺供体”是指向氨基受体给予氨基,因此成为羰基物质的氨基化合物。氨基供体是如下所示的通式的分子,
氨基供体
其中,Rε与Rδ中的每一个当独立地被采用时,是烷基、烷芳基基团、或未被取代的或被一个或多个酶学上非抑制基团取代的芳基基团。Rε可在结构或手性上与Rδ相同或不同。在一些实施方案中,Rε与Rδ,结合在一起可形成为未被取代的、取代的或稠合至其它环的环。可与本公开内容的实施方案一起使用的典型的氨基供体包括手性与非手性氨基酸、以及手性与非手性胺。可与本文中实施方案一起使用的示例性氨基供体包括,通过举例的方式而非限制,异丙胺(也称为2-氨基丙烷,并且在本文其它地方被称为“IPM”)、α-苯乙胺(也称为1-苯乙胺)以及其对映异构体(S)-1-苯乙胺与(R)-1-苯乙胺、2-氨基-4-苯基丁烷、甘氨酸、L-谷氨酸、L-谷氨酸盐、谷氨酸一钠、L-丙氨酸、D-丙氨酸、D,L-丙氨酸、L-天冬氨酸、L-赖氨酸、D,L-鸟氨酸、β-丙氨酸、牛磺酸、正辛胺、环己胺、1,4-丁二胺(也被称为腐胺)、1,6-己二胺、6-氨基己酸、4-氨基丁酸、酪胺和苄基胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-1-苯基乙烷、1-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-1-(4-羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、1-氨基-1-(4-硝基苯基)丙烷、1-苯基-2-氨基丙烷、1-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、1-氨基-1-苯基丁烷、1-苯基-2-氨基丁烷、1-(2,5-二甲氧基-4-甲基苯基)-2-氨基丁烷、1-苯基-3-氨基丁烷、1-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、1-氨基-3-甲基环戊烷、1-氨基-2-甲基环己烷、1-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊胺、2-甲基环己胺、3-甲基环己胺,1-氨基四氢化萘、2-氨基四氢化萘、2-氨基-5-甲氧基四氢化萘和1-氨基茚满,包括可能的(R)和(S)单一异构体且包括该胺的所有可能的盐。
“手性胺”是指通式Rα-CH(NH2)-Rβ的胺并且以其最广泛的意义在本文中使用,包括多种不同和混合的官能类型的脂族和脂环族化合物,特征在于与仲碳原子结合的伯氨基的存在,该仲碳原子除了氢原子之外还携带 (i)形成手性环状结构的二价基团,或(ii)在结构或手性上彼此不同的两个取代基(除了氢)。形成手性环状结构的二价基团包括,例如,2-甲基丁烷-1、4-二基、戊烷-1,4-二基、己烷-1,4-二基、己烷-1,5-二基、2-甲基戊烷-1,5-二基。在仲碳原子上的两种不同的取代基(上述Rα和Rβ)还可广泛地变化,且包括烷基、芳基烷基、芳基、卤素、羟基、低级烷基、低级烷氧基、低级烷硫基、环烷基、羧基、碳烷氧基(carbalkyloxy)、氨基甲酰基、单(低级烷基)取代的氨基甲酰基和二(低级烷基)取代的氨基甲酰基、三氟甲基、苯基、硝基、氨基、单(低级烷基)取代的氨基和二(低级烷基)取代的氨基、烷基磺酰基、芳基磺酰基、烷基甲酰氨基、芳基甲酰氨基等,以及由前述基团取代的烷基、芳基烷基或芳基。
“吡哆醛磷酸”、“PLP”、“吡哆醛-5’-磷酸”、“PYP”和“P5P”在本文中可互换使用以指在转氨酶反应中充当辅因子的化合物。在一些实施方案中,吡哆醛磷酸通过结构1-(4’-甲酰基-3’-羟基-2’-甲基-5’-吡啶基)甲氧基膦酸、CAS号[54-47-7]定义。吡哆醛-5’-磷酸可通过吡哆醇(也被称为维生素B6)的磷酸化和氧化在体内产生。在使用转氨酶类的氨基转移反应中,氨基供体的胺基被转移到辅因子以产生酮基副产物,同时吡哆醛-5’-磷酸被转化成磷酸吡哆胺。吡哆醛-5’-磷酸通过与不同的酮基化合物(氨基受体)反应而被再生。胺基从磷酸吡哆胺转移到氨基受体产生胺并再生辅因子。在一些实施方案中,吡哆醛-5’-磷酸可以由维生素B6家族的其它成员代替,包括吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM),和它们的磷酸化的对应物;磷酸吡哆醇(PNP)和磷酸吡哆胺(PMP)。
如本文中所用的“辅因子”是指在催化反应中与酶组合起作用的非蛋白化合物。如本文中所用,“辅因子”意图涵盖有时也被称为辅酶的维生素B6家族化合物PLP、PN、PL、PM、PNP和PMP。
“编码序列”是指编码蛋白的氨基酸序列的核酸(例如,基因)的那部分。
“天然存在的”或“野生型”是指天然发现的形式。例如,天然存在的或野生型多肽或多核苷酸序列是生物体中存在的序列,其可从天然来源分离且未通过人为操纵而被有意识地修改。
当关于例如细胞、核酸或多肽使用时,“重组的”或“工程化的”或“非天然存在的”指将以天然不存在的其他方式被修饰或与其相同但由合成的材料产生或衍生和/或通过使用重组技术处理产生的材料或与该材料的自然或天然形式相应的材料。非限制性实例包括,表达在细胞的天然(非重组的)形式中未发现的基因或表达以不同的水平以其他方式被表达的天然基因的重组细胞以及其他。
“序列同一性的百分比”和“百分比同源性”在本文可互换使用以指多核苷酸和多肽之间的对比,并通过在比较窗上比较两个最佳比对序列来确定,其中多核苷酸或多肽序列在比较窗中的部分与用于两个序列的最佳比对的参考序列相比可以包括添加或缺失(即,缺口)。百分比可以如下计算,通过确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。可选地,百分比可以如下计算,通过确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与缺口对齐的位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目并将结果乘以100以得到序列同一性的百分比。本领域的技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的最佳序列比对可如下进行,例如,通过Smith和Waterman,1981,Adv.Appl.Math.2:482的局部同源性算法,通过Needleman和Wunsch,1970,J.Mol.Biol.48:443的同源性比对算法,通过Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA85:2444的相似度检索方法,通过这些算法的计算机化执行(在GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或通过目测(通常参见,CurrentProtocols in Molecular Biology,F.M.Ausubel等人编著,Current Protocols,a jointventure between Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.,(1995增刊)(Ausubel))。适合用于确定百分比序列同一性和序列相似性的算法的实例是BLAST和BLAST2.0算法,其被分别描述于Altschul等人,1990,J.Mol.Biol.215:403-410以及Altschul等人,1977,Nucleic Acids Res.3389-3402中。用于进行BLAST分析的软件为通过美国国家生物技术信息中心网站公共可获得的。这一算法涉及首先通过确定查 询序列(query sequence)中长度W的短字来确定高评分序列对(HSP),当其与数据库序列中相同长度的字比对时,所述短字匹配或满足一些正值阈值评分T。T被称为邻近字评分阈值(Altschul等人,如上述)。这些最初的邻近字击中(word hit)用作启动检索以找到更长的包括它们的HSP的种子。然后字击中沿着每个序列的两个方向延伸到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数M(用于一对匹配残基的奖励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)来计算。对于氨基酸序列,使用评分矩阵以计算累积评分。当:累积比对评分从其最大获得的值跌落量X时;由于一个或多个负评分残基比对的累积,累积评分变成零或以下时;或达到任一序列的末端时,字击中在每个方向的延伸被停止。BLAST算法参数W、T和X确定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(E)、M=5、N=-4、以及两个链的比较作为缺省参数。对于氨基酸序列,BLASTP程序使用3的字长(W)、10的期望值(E),和BLOSUM62评分矩阵作为缺省参数(参见Henikoff和Henikoff,1989,Proc Natl Acad Sci USA89:10915)。序列比对与%序列同一性的示例性确定可使用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用提供的缺省参数。
“参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段。通常,参考序列为至少20个核苷酸或氨基酸残基的长度,至少25个残基的长度,至少50个残基的长度,或核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1)包括两个序列之间相似的序列(即,完整序列的一部分),且(2)还可包括在两种序列之间不同的序列,所以两种(或更多种)多核苷酸或多肽之间的序列比较通常通过在“比较窗”内比较两种多核苷酸或多肽的序列来进行以确定和比较具有序列相似性的局部区域。在一些实施方案中,“参考序列”可基于基本氨基酸序列,其中参考序列为可在基本序列中具有一个或多个变化的序列。例如,“在相应于X9的残基处具有组氨酸的基于SEQ ID NO:2的参考序列”是指在SEQ ID NO:2中X9处相应的残基(是酪氨酸)已经改变成组氨酸的参考序列。
“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性片段,其中序列可与至少20个连续的核苷酸或氨基酸的参考序列进行比较,并且其中在比较窗中序列的一部分与用于两个序列的最佳比对的参考序列(其不包括添加或缺失)相比,可以包括20%或更少的添加或缺失(即,缺口)。比较窗可以比20个连续的残基更长,并任选地包括30、40、50、100或更长的窗。
当在给定的氨基酸或多核苷酸序列的编号的上下文中使用时,“相应于”、“参考”或“相对于”指当给定的氨基酸或多核苷酸序列与指定的参考序列相比时,指定的参考序列的残基的编号。换句话说,给定的聚合物的残基编号或残基位置是关于参考序列被指定的,而不是通过给定的氨基酸或多核苷酸序列内的残基的实际数值位置被指定的。例如,给定的氨基酸序列,诸如工程化转氨酶的氨基酸序列,可以通过引入缺口以优化两个序列之间的残基匹配而与参考序列进行比对。在这些情况中,虽然存在缺口,给定的氨基酸或多核苷酸序列中残基的编号是关于与其比对的参考序列作出的。
“氨基酸差异”或“残基差异”是指相对于参考序列中在相应位置上的氨基酸残基,在多肽序列的位置上的氨基酸残基中的差异。氨基酸差异的位置通常在本文中称为“Xn”,其中n是指残基差异是基于其的参考序列中的相应位置。例如,“与SEQ ID NO:2相比在位置X12上的残基差异”是指相应于SEQ ID NO:2的位置12的多肽位置上的氨基酸残基的差异。因此,如果SEQ ID NO:2的参考多肽在位置12上具有酪氨酸,那么“与SEQ ID NO:2相比在位置X12上的残基差异”,除相应于SEQ ID NO:2的位置12的多肽位置上的酪氨酸之外还指任何残基的氨基酸置换。在本文大多数情况下,位置上的特定氨基酸残基差异表示为“XnY”,其中“Xn”指定如上所述的相应位置,且“Y”是工程化多肽中发现的氨基酸的单字母标识符(即,与参考多肽相比的不同残基)。在一些情况下(例如,在表2A、2B、2C和2D中),本公开内容还提供了由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中残基的单字母标识符,“n”是参考序列中的残基位置的数目,且B是工程化多肽的序列中的残基置换的单字母标识符。在一些情况下,本公开内容的多肽相对于参考序列可以包括一个或多个氨基酸残基差异,这由相对于参考序列存在残基差异的一列特定位置指示。在一些实施方案中,当多于一个氨基酸可以在多肽的特定残基位置中被使用,可被使用的各种氨基酸残基由“/”隔开(例如,X192A/X192G)。本公开内容包括工程化多肽序列,该工程化多肽序列包括一个或多个氨基酸差异,该氨基酸差异包括任一种和/或两种保守和非保守的氨基酸置换。
“保守氨基酸置换”指用具有相似侧链的不同残基置换残基,并且因此,通常涉及用在相同或相似定义类别的氨基酸内的氨基酸置换多肽中的氨基酸。通过示例的方式而非限制,具有脂族侧链的氨基酸可被另一个脂族氨基酸置换,例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有羟基侧链的氨基酸被具有羟基侧链的另一个氨基酸置换,例如,丝氨酸和苏氨酸;具有芳香族侧链的氨基酸被具有芳香族侧链的另一个氨基酸置换,例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸;具有碱性侧链的氨基酸被具有碱性侧链的另一个氨基酸置换,例如,赖氨酸和精氨酸;具有酸性侧链的氨基酸被具有酸性侧链的另一个氨基酸置换,例如,天冬氨酸或谷氨酸;且疏水性氨基酸或亲水性氨基酸分别被另一个疏水性氨基酸或亲水性氨基酸置换。示例性保守置换被提供在下面的表1中:
表1
“非保守置换”是指用具有显著差异侧链性质的氨基酸置换多肽中的氨基酸。非保守置换可以利用限定组之间,而不是它们之内的氨基酸,并影响(a)置换的区域中肽骨架的结构(例如,脯氨酸置换甘氨酸)(b)电荷或疏水性,或(c)侧链的体积。通过示例的方式而非限制,示例性的非保守置 换可以是酸性氨基酸被碱性或脂族氨基酸置换;芳香族氨基酸被小氨基酸置换;以及亲水性氨基酸被疏水性氨基酸置换。
“缺失”是指通过从参考多肽去除一个或多个氨基酸而对多肽进行的修饰。缺失可以包括除去1个或多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多至组成参考酶同时保留酶活性和/或保留工程化转氨酶的改进特性的氨基酸总数的10%、多至氨基酸总数的20%。缺失可以涉及多肽的内部和/或端部。在各个实施方案中,缺失可以包括连续的区段或可以是不连续的。
“***”是指通过向参考多肽添加一个或多个氨基酸而对多肽进行的修饰。在一些实施方案中,改进的工程化转氨酶类包括一个或多个氨基酸***天然存在的转氨酶多肽,以及一个或多个氨基酸***其它改进的转氨酶多肽。***可以是在多肽的内部或到羧基或氨基末端。如本文所用的***包括如本领域已知的融合蛋白。***可以是氨基酸的连续区段或由天然存在的多肽中的一个或多个氨基酸分隔。
如本文所用的“片段”是指如下多肽:所述多肽具有氨基端和/或羧基端缺失,但剩余的氨基酸序列与该序列中相应位置相同。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长,以及多至全长转氨酶多肽的70%、80%、90%、95%、98%和99%。
“分离的多肽”是指如下多肽:所述多肽基本上与其天然伴随的其它污染物,例如,蛋白、脂质和多核苷酸分离。术语包括已从它们天然存在环境或表达***(例如,宿主细胞或体外合成)中除去或纯化的多肽。改进的转氨酶类可以存在于细胞内,存在于细胞培养基中,或以各种形式制备,诸如溶解产物或分离的制剂。因此,在一些实施方案中,改进的转氨酶类可以是分离的多肽。
“基本上纯的多肽”是指如下组合物,在所述组合物中多肽物质是存在的优势物质(即,在摩尔基础或重量基础上,它比在该组合物中的任何其它个体大分子物质更丰富),并且当目标物质构成存在的大分子物质的按摩尔或%重量计至少约50%时,一般是基本上纯化的组合物。一般而言, 基本上纯的转氨酶组合物将构成该组合物中存在的所有大分子物质的按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物质纯化至基本的均一性(即,通过常规检测方法不能在组合物中检测出污染物质),其中组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)、以及元素离子物质不被认为大分子物质。在一些实施方案中,分离的改进的转氨酶多肽是基本上纯的多肽组合物。
“立体选择性”是指在化学反应或酶促反应中一种立体异构体比另一种立体异构体优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于另一种立体异构体的形成,或立体选择性可以是完全的,其中只形成一种立体异构体。当立体异构体是对映体时,立体选择性被称为对映体选择性,即一种对映体在两种对映体的总和中的分数(通常被报告为百分比)。它在本领域通常可选择地被报告为(通常为百分比)对映体过量(e.e.),其中根据以下式计算[主要对映体-次要对映体]/[主要对映体+次要对映体]。当立体异构体是非对映异构体,立体选择性被称为非对映选择性,即一种非对映体在两种非对映体的混合物中的分数(通常被报告为百分比),通常可选择地报告为非对映体过量(d.e.)。当混合物含有两种以上非对映体时,通常报告非对映体的比率或“非对映体比率”,而不是非对映体过量。对映体过量和非对映体过量是立体异构体过量的类型。“高立体选择性”是指能够以至少约85%立体异构体过量将底物转化为相应手性胺产物的转氨酶多肽。
“改进的酶特性”是指相比于参考转氨酶,诸如野生型转氨酶或另一种改进的工程化转氨酶,表现出酶特性的改进的转氨酶多肽。期望改进的酶特性包括但不限于,酶活性(其可以根据底物的百分比转化率来表示)、热稳定性、溶剂稳定性、pH活性谱、辅因子需求、对抑制剂的耐受性(例如,底物或产物抑制)、立体专一性和立体选择性(包括对映体选择性)。
“增加的酶活性”是指工程化转氨酶多肽的改进特性,其可被表示为与参考转氨酶相比,比活性(例如,产生的产物/时间/重量蛋白)的增加,或底物至产物的百分比转化率的增加(例如,在指定的时间段使用指定量 的转氨酶,起始量的底物至产物的百分比转化率)。确定酶活性的示例性方法被提供于实施例中。可以影响与酶活性相关的任何特性,包括经典的酶特性Km、Vmax或kcat,它们的改变能够导致增加的酶活性。酶活性的改进可以是从相应的野生型转氨酶的酶活性的约1.1倍,到相比于天然存在的转氨酶或从其衍生转氨酶多肽的另一种工程化转氨酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更大的酶活性。在特别的实施方案中,工程化转氨酶展现出比母体转氨酶的酶活性大1.5至50倍、1.5至100倍或更大的范围内的改进的酶活性。转氨酶活性可通过标准测定中的任何一个来测量,诸如通过监测反应物或产物的分光光度法性质中的变化。在一些实施方案中,产生的产物的量可以通过高效液相色谱法(HPLC)分离结合o-酞二醛(OPA)衍生化后的UV吸光度或荧光检测来测量。使用确定的酶制剂、在设定条件下的确定的测定、和一种或多种确定的底物进行酶活性的比较,如本文进一步详细地描述的。通常,当比较溶解产物时,细胞的数目和测定的蛋白的量被确定,并使用相同的表达***和相同的宿主细胞以将由宿主细胞产生的和溶解产物中存在的酶的量的变化最小化。
“转化率”是指底物至相应的产物的酶促转化率。“百分比转化率”是指在指定条件下一段时间内被转化为产物的底物的百分比。因此,转氨酶多肽的“酶活性”或“活性”可以表示为底物至产物的“百分比转化率”。
“热稳定的”是指与野生型酶相比,转氨酶多肽在暴露于高温(例如,40-80℃)持续一段时间(例如,0.5-24小时)之后维持相似活性(例如,大于60%至80%)。
“溶剂稳定的”指与野生型酶相比,转氨酶多肽在暴露于不同浓度(例如5-99%)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)持续一段时间(例如0.5-24小时)之后维持相似的活性(多于例如60%至80%)。
“杂交严格度”涉及核酸杂交中的杂交条件,如洗涤条件。一般而言,在较低严格度条件下进行杂交反应,接着是具有不同但更高的严格度的洗涤。术语“中度严格杂交”是指允许靶DNA结合互补核酸的条件,所述互补核酸与该靶DNA具有约60%同一性、优选约75%同一性、约85%同一 性;与靶多核苷酸具有大于约90%同一性。示例性中度严格条件是等同于在42℃于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中杂交,接着在42℃于0.2×SSPE、0.2%SDS中洗涤的条件。“高严格度杂交”一般是指如下条件:与如在确定的多核苷酸序列的溶液条件下确定的热解链温度Tm相差约10℃或更小。在一些实施方案中,高严格度条件是指允许仅那些在65℃于0.018M NaCl中形成稳定杂交体的核酸序列杂交的条件(即,如果杂交体在65℃于0.018M NaCl中不稳定,它在本文考虑的高严格度条件下将是不稳定的)。可以例如通过在等同于在42℃于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS的条件中杂交,接着在65℃于0.1×SSPE和0.1%SDS中洗涤,而提供高严格度条件。另一种高严格度条件是在与以下等同的条件中杂交:在65℃于含0.1%(w:v)SDS的5×SSC中杂交,和在65℃于含0.1%SDS的0.1×SSC中洗涤。其他高严格度杂交条件以及中度严格条件描述于以上引用的参考文献中。
“密码子优化的”是指编码蛋白的多核苷酸的密码子变为特定生物体中优先使用的那些密码子,以致所编码的蛋白被更有效在感兴趣的生物体中表达。尽管遗传密码由于大多数氨基酸被称作“同义密码子”或“同义”密码子的几个密码子代表而为简并的,但众所周知具体生物体的密码子使用是非随机的且偏向特定的密码子三联体。就给定基因、具有共同功能或祖先起源的基因、高表达蛋白相对于低拷贝数蛋白以及生物体基因组的聚集蛋白编码区而言,这种密码子使用偏向可能更高。在一些实施方案中,可以对编码转氨酶的多核苷酸进行密码子优化,以用于从被选择用于表达的宿主生物体优化生产。
本文中“控制序列”是指包括对本公开内容的多核苷酸和/或多肽的表达是必要的或有利的所有组分。每个控制序列对编码多肽的核酸序列来说可以是天然的或外源的。此类控制序列包括但不限于,前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。在最小程度上,控制序列包括启动子和转录及翻译终止信号。控制序列可设置有连接体,用于引入特异性限制位点的目的,促进控制序列与编码多肽的核酸序列的编码区的连接。
“可操作地连接的”在本文中定义为如下一种配置:在所述配置中控制序列相对于感兴趣的多核苷酸被适当放置(即,以功能关系)在一位置中,以使得控制序列指导或调整感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”指被宿主细胞识别用于感兴趣的多核苷酸的表达的核酸序列,诸如编码序列。启动子序列包括转录控制序列,其介导感兴趣的多核苷酸的表达。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列,包括突变体、截短的和杂合启动子,并且可以获自编码与宿主细胞同源的或异源的细胞外或细胞内多肽的基因。
“烷基”是指1个至18个碳原子,直链的或支链的,特别地1个至8个碳原子,且更特别地1个至6个碳原子的基团。具有指定数目的碳原子的烷基被表示在括号中,例如,(C1-C4)烷基是指1个至4个碳原子的烷基。
“烯基”是指含有至少一个双键,但任选地含有多于一个双键的2个至12个碳原子的直链或支链的基团。
“炔基”是指含有至少一个三键,但任选地含有多于一个三键,并且任选地含有一个或多个双键部分的2个至12个碳原子的直链或支链的基团。
“芳基”是指具有单环(例如,苯基)或多个稠环(例如,萘基或蒽基)的5个至14个碳原子的不饱和芳香族碳环基团。对于多个稠环,环中的至少一个是芳香族的。代表性的芳基包括苯基、吡啶基、萘基以及类似的。
“芳基烷基”是指被芳基部分取代的烷基。代表性的芳基烷基基团包括苄基、苯乙基以及类似的。
“芳基烯基”是指被芳基基团取代的如本文所定义的烯基。
“芳基炔基”是指被芳基基团取代的如本文所定义的炔基。
“杂芳基”是指含有环内的选自氧、氮和硫的1个至4个环杂原子的5个至14个环原子的芳香族杂环基团。杂芳基基团可具有单个环(例如,吡啶基或呋喃基)或多个稠环(例如,吲哚嗪基或苯并噻吩基)。对于多个稠环,环中的至少一个是芳香族的。
“杂芳基烷基”是指被如本文所定义的杂芳基部分取代的烷基。
“杂芳基烯基”是指被如本文所定义的杂芳基基团取代的烯基。
“杂芳基炔基”是指被如本文所定义的杂芳基部分取代的炔基。
“环烷基”是指具有单环或多个稠环的3个至12个碳原子的环状烷基基团。代表性的环烷基基团包括,通过举例的方式,单环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基以及类似的,或多环结构,包括桥环***,诸如金刚烷基以及类似的。
“杂环”与“杂环烷基”可互换,是指具有单环或多个稠环,具有在环内的选自氮、硫或氧的1至4个杂原子的3-14个环原子的饱和或不饱和的基团。杂环基团可以具有单环(例如,哌啶基或四氢呋喃基)或多个稠环(例如,吲哚基、二氢苯并呋喃或奎宁环基)。代表性的杂环和杂芳基包括但不限于,呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪、异喹啉、喹啉、酞嗪、萘基吡啶、喹喔啉、喹唑啉、噌啉、蝶啶、咔唑、咔啉、菲啶、吖啶、菲咯啉、异噻唑、吩嗪、异噁唑、吩噁嗪、吩噻嗪、咪唑烷、咪唑啉、哌啶、哌嗪、吡咯烷、二氢吲哚以及类似的。
“环烷基烷基”是指被如本文所定义的环烷基部分取代的烷基。
“环烷基烯基”是指被如本文所定义的环烷基部分取代的烯基。
“环烷基炔基”是指被如本文所定义的环烷基部分取代的炔基。
“杂环烷基烷基”是指被如本文所定义的杂环烷基部分取代的烷基。
“杂环烷基烯基”是指被如本文所定义的杂环烷基部分取代的烯基。
“杂环烷基炔基”是指被如本文所定义的杂环烷基部分取代的炔基。
“烷氧基”或“烷基氧基”是指基团烷基-O-,其中烷基基团为如上文所定义的,包括也如上定义的任选取代的烷基。
“氨基”是指基团-NH2。取代的氨基是指基团-NHR’、NR’R’和NR’R’R’,其中每个R’是独立于其它R’,选自取代或未被取代的烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、烷氧基、芳基、杂芳基、 芳基烷基、杂芳烷基、酰基、烷氧基羰基、硫烷基、亚磺酰基、磺酰基以及类似的。典型的氨基基团包括但不限于,二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基(methylysulfonylamino)、呋喃基-氧基-磺氨基以及类似的。
“羧基”是指-COOH。
“羰基”是指-C(O)-,其可以具有多种取代基以形成不同的羰基基团,包括酸、酰基卤、醛、酰胺、酯和酮。
“羟基”是指-OH。
“氰基”是指-CN。
“卤素”或“卤代”是指氟、氯、溴和碘。
“磺酰基”是指-SO2-。取代的磺酰基是指-SO2R’,其中R’是如下面所述的合适的取代基。
“稠合的”或“稠合环”诸如在稠合芳基或稠合杂芳基中是指连接的两个或更多个环,使得它们共同具有至少两个环原子。稠合芳基是指其中至少一个环是芳基的稠合环。稠合杂芳基是指其中至少一个环是杂芳基的稠合环。
“内酰胺”是指以下通用结构的环酰胺:
其中k为1至7,更特别是1至5。氮原子上的氢和非羰基的碳环原子的氢可以被相容取代基取代。代表性的内酰胺包括,2-氮杂环丁酮-1-基、2-吡咯烷酮-1-基和2-哌啶酮-1-基以及其他。
“取代的”,除非另有说明,否则是指用取代基取代上述基团中被氢占据的位置,该取代基的示例为,但不限于,羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤代、甲基、乙基、丙基、丁基、烷基、烯基、炔基、取代的烷基、 三氟甲基、卤代烷基、羟烷基、烷氧基烷基、硫代、烷硫基、酰基、羧基、烷氧基羰基、甲酰氨基、取代的甲酰氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰氨基、取代的亚磺酰氨基、氰基、氨基、取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰氨基、脒基、氨基肟基(amidoximo)、羟基草氨酰基(hydroxamoyl)、苯基、芳基、取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、取代的环烷基、环烷氧基、吡咯烷基、哌啶基、吗啉代、杂环、(杂环)氧基和(杂环)烷基;且优选的杂原子是氧、氮和硫。应理解,当这些取代基上存在开放化合价时,它们可被烷基、环烷基、芳基、杂芳基和/或杂环基团进一步取代,当碳上存在这些开放化合价时,它们可被卤素和被氧键合取代基、氮键合取代基或硫键合取代基进一步取代,并且当多个这样的开放化合价存在时,这些基团可通过直接形成键或通过与新的杂原子(优选氧、氮或硫)形成键而被结合以形成环。还应理解,可以进行上述取代,只要用取代基取代氢没有向本发明的分子引入不可接受的不稳定性,并且在其他方面是化学上合理的。
“任选的”或“任选地”是指随后描述的事件或情况可能发生或可能不发生,并且该描述包括其中所述事件或情况发生的实例和其中所述事件或情况不发生的实例。本领域普通技术人员将理解,对于描述为含有一个或多个任选的取代基的任何分子,仅意在包括立体上实际的和/或合成上可行的化合物。“任选地取代的”是指在化学基团的术语或系列中的所有其后的修饰词。例如,在术语“任选地取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于系列“任选地取代的烷基、环烷基、芳基和杂芳基,”该烷基、环烷基、芳基和杂芳基基团,独立于其它,可以被取代或可以不被取代。
“保护基团”是指当连接到分子中的反应性官能团时掩蔽、减少或阻止该官能团的反应性的原子团。通常,保护基团可在合成过程中根据需要被选择性地除去。保护基团的实例可见于Wuts和Greene,“Greene’s Protective Groups in Organic Synthesis,”第4版,Wiley Interscience(2006),以及Harrison等人,Compendium of Synthetic OrganicMethods,第1-8卷,1971-1996,John Wiley&Sons,NY。可以具有保护基团的官能团包括但不限于,羟基、氨基和羧基。代表性的氨基保护基团包括但不限于,甲酰基、乙酰基、三氟乙酰基、苄基、苄氧羰基(“CBZ”)、叔丁氧羰基(“Boc”)、三甲基甲硅烷基(“TMS”)、2-三甲基甲硅烷基-乙烷磺酰基(“SES”)、三苯甲基和取代的三苯甲基、烯丙氧基羰基、9-芴基甲氧基羰基(“FMOC”)、硝基-藜芦氧基羰基(“NVOC”)以及类似的。代表性的羟基保护基团包括但不限于,其中羟基被酰化的那些(例如,甲基和乙基酯、乙酸酯或丙酸酯基团或乙二醇酯)或其中羟基被烷基化的那些诸如苄基和三苯甲基醚,以及烷基醚、四氢吡喃醚、三烷基甲硅烷基醚(例如,TMS或TIPPS基团)和烯丙基醚。其它保护基团可以见于本文引用的参考文献。
“离去基团”通常是指在化学反应中能够被另一个原子或部分替换的任何原子或部分。更具体地,离去基团是指容易被亲核体(例如,胺、硫醇、醇或氰化物)替换和取代的原子或部分。此类离去基团是众所周知的,且包括羧酸盐、N-羟基琥珀酰亚胺(“NHS”)、N-羟基苯并***、卤素(氟、氯、溴或碘)和烷氧基基团。离去基团的非限制性特征和实例可见于例如Organic Chemistry,第2版,Francis Carey(1992),328-331页;Introduction toOrganic Chemistry,第2版,Andrew Streitwieser and Clayton Heathcock(1981),169-171页;以及Organic Chemistry,第5版,John McMurry,Brooks/Cole Publishing(2000),398和408页;所有这些都通过引用并入本文。
“适当的反应条件”是指在生物催化反应溶液中的那些条件(例如,酶载量、底物载量、辅因子载量、温度、pH、缓冲液、共溶剂等的范围),在上述条件下本公开内容的转氨酶多肽能够将化合物2转化为化合物1,包括化合物1的特定非对映体。示例性的“适当的反应条件”被提供在本公开内容中,并通过实施例说明。
“载量”,如在“化合物载量”或“酶载量”中是指在反应开始时反应混合物中组分的浓度或量。
在生物催化剂介导的方法的上下文中的“底物”是指由生物催化剂作用的化合物或分子。例如,在本文中所公开的方法中的转氨酶生物催化剂的示例性底物是化合物2。
在生物催化剂介导的方法的上下文中的“产物”是指由生物催化剂的作用产生的化合物或分子。例如,在本文所公开的方法中的转氨酶生物催化剂的示例性产物是化合物1。
5.3用于内酰胺的合成的工程化转氨酶多肽
转氨酶,也称为氨基转移酶,催化氨基基团的电子对与质子从氨基供体底物的伯胺转移至氨基受体分子的羰基基团(例如,酮基基团)。转氨酶已被从各种生物体,诸如反硝化产碱菌(Alcaligenes denitrificans)、节杆菌属(Arthrobacter)、支气管败血性博德特氏杆菌(Bordetella bronchiseptica)、副百日咳博代氏杆菌(Bordetellaparapertussis)、马耳他布鲁氏菌(Brucella melitensis)、Burkholderia malle、类鼻疽杆菌(Burkholderia pseudomallei)、青紫色素杆菌(Chromobacterium violaceum)、Oceanicola granulosus HTCC2516、海洋杆Oceanobacter sp.RED65、海洋螺菌Oceanospirillum sp.MED92,恶臭假单胞菌(Pseudomonas putida)、青枯雷尔氏菌(Ralstonia solanacearum)、苜蓿根瘤菌(Rhizobium meliloti)、根瘤菌Rhizobium sp.菌株NGR234、苏云金杆菌(Bacillus thuringensis)、河流弧菌(Vibrio fluvialis)和克雷伯氏肺炎杆菌(Klebsiella pneumoniae)中确认(参见例如,Shin等人,2001,Biosci.Biotechnol.Biochem.65:1782-1788)。
转氨酶在将酮转化为相应的胺中的立体选择性,使这些酶在由相应的酮化合物不对称合成光学纯的胺中是有用的(参见,例如,等人,Biocatalytic Routes toOptically Active Amines”Chem.Cat.Chem.1(1):42-51;Zua和Hua,2009,Biotechnol J.4(10):1420-31)。转氨酶还可以通过开发转氨酶以立体特异性方式进行逆反应的能力而被应用于外消旋胺的手性拆分,即一种对映体优先转化为相应的酮,从而产生富含另一种对映体的混合物(参见,例如,Koselewski等人,2009,Org.Lett.11(21):4810-2)。
(R)-选择性的转氨酶与(S)-选择性的转氨酶均是已知的。来自节杆菌Arthrobacter sp.KNK168的野生型转氨酶是(R)-选择性的吡哆醛5’-磷酸盐 (PLP)-依赖性酶,该酶从某些底物产生(R)-胺(参见例如,Iwasaki等人,Appl.Microbiol.Biotechnol.,2006,69:499-505;以及美国专利号7,169,592)。美国专利公布号2010/0285541A1和公布的国际申请WO2010/099501,公开了源自节杆菌Arthrobacter sp.KNK168的天然存在的转氨酶的工程化转氨酶多肽,该工程化转氨酶多肽已增加对温度和/或有机溶剂的稳定性,并且已适合于对结构上不同的氨基受体分子具有酶活性(还参见例如,Savile等人,2010,“Biocatalytic asymmetric synthesis ofchiral amines from ketones applied to sitagliptin manufacture,”Science329(5989):305-9))。
在本公开内容中描述了具有可用于二羰基底物的选择性氨基转移的转氨酶活性的工程化多肽,二羰基底物的胺产物可被用于制备内酰胺,尤其是取代的内酰胺。还公开了编码该工程化多肽的多核苷酸,以及使用该工程化多肽的方法。因此,在一个方面中,本公开内容涉及工程化转氨酶多肽,其能够将底物化合物2转化为产物化合物1,如在上述方案1中所示的。
产物化合物1的环化导致相应内酰胺化合物3的形成。如本文中进一步解释的,当离去基团(例如,烷氧基基团)的选择允许在转氨酶反应的反应条件下容易环化,转氨酶多肽可以一锅法以高收率被用于直接反应以产生环化产物,特别是化合物3,包括特定立体异构体。如将对本领域技术人员明显的,化合物2具有三个手性中心,并且可以以若干不同的立体异构形式存在。因为转氨酶可以进行逆反应,以将化合物1的胺转化为化合物2的相应的酮,反应混合物可以含有化合物2的至少四个不同的非对映形式(化合物2a至2d),如下面方案2中所阐明的。
方案2
然后,通过酶的氨基转移可导致化合物1的至少8种相应的立体异构形式(化合物1a至1d和1a’至1d’)的形成。随后的胺产物的环化可进一步产生内酰胺化合物的不同立体异构体3a至3d与3a’至3d’。如本文所用,提及没有任何特定的立体异构结构的化合物2或其类似物是指为本文所公开 的工程化转氨酶的底物的化合物的立体异构形式的任何混合物或纯的制剂(例如,化合物2a、2b、2c、2d)。类似地,提及没有特定立体异构结构的任何指示的化合物1或其类似物是指在转氨酶反应中形成的产物化合物1的立体异构形式的任何混合物(例如,化合物1a、1a’、1b、1b’、1c、1c’、1d、1d’),而提及化合物3或其类似物是指通过化合物1的环化形成的化合物3(例如,化合物3a至3d与3a’至3d’)的环状产物的立体异构形式的任何混合物。
本公开内容的工程化多肽为与SEQ ID NO:2的野生型节杆菌Arthrobactersp.KNK168多肽相比已被工程化以具有改进特性,诸如增加的立体选择性的非天然存在的转氨酶。工程化转氨酶多肽适合于将化合物2有效转化至化合物1,并且与SEQ ID NO:4的参考工程化转氨酶多肽(其相对于野生型具有24个氨基酸差异)相比具有一个或多个残基差异。这些残基差异与酶性能中的改进,特别是增加的活性、增加的立体选择性、增加的稳定性、以及对底物和/或产物浓度的增加的耐受性(例如,降低的产物抑制)相关。
在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下将底物化合物2转化为化合物1,具有相对于SEQ ID NO:4的参考多肽的活性增加了至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、100倍、200倍、500倍、1000倍或更多倍的活性。在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下在约48小时、约36小时、约24小时或更短时间长度的反应时间内将化合物2的底物转化为化合物1,具有至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、或至少约90%、至少约95%、至少约98%、至少约99%的百分比转化率。
如上所述,化合物1环化形成化合物3可在反应条件下容易地发生,使得工程化酶能够作用于底物化合物2用于产生化合物3,以相对于SEQ ID NO:4的参考多肽的活性至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、100倍、200倍、500倍、1000倍或更多倍的活性。在一些实施方案中,工程化转氨酶多肽能够在适当的反应 条件下在约48小时、约36小时、约24小时或甚至更短时间长度的反应时间内作用于底物化合物2用于产生化合物3,具有至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、或至少约90%、至少约95%、至少约98%、至少约99%的百分比转化率。
在一些实施方案中,相比于对化合物1b和化合物1c,本文所描述的工程化转氨酶多肽展现对化合物1a和化合物1d的非对映选择性。在一些实施方案中,工程化转氨酶多肽能够以相比于化合物1b和化合物1c(即,[1b+1c])大于8:1的非对映体比将化合物2转化为化合物1a和化合物1d(即,[1a+1d])。
在一些实施方案中,工程化转氨酶多肽能够以相比于化合物1b与化合物1c(即,[1b+1c])大于10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1或更大的非对映体比将化合物2转化为化合物1a与化合物1d(即,[1a+1d])。
在一些实施方案中,工程化转氨酶多肽能够以相比于化合物3b和化合物3c(即,[3b+3c])大于8:1的非对映体比作用于化合物2用于制备化合物3a和化合物3d(即,[3a+3d])。在一些实施方案中,工程化转氨酶多肽能够以相比于化合物3b和化合物3c(即,[3b+3c])大于10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或更大的非对映体比作用于化合物2用于制备化合物3a与化合物3d(即,[1a+1d])。
在一些实施方案中,相比于对化合物1a,本文所描述的工程化转氨酶多肽展现对化合物1d的非对映选择性。
因此,在一些实施方案中,工程化转氨酶能够以相比于化合物1a的非对映体过量将化合物2转化为化合物1d。在一些实施方案中,工程化转氨酶能够在适当的反应条件下以相比于化合物1a大于10%、20%、30%、40%、50%、60%、70%、80%、90%或更大的非对映体过量将化合物2转化为化合物1d。
用于将化合物2转化为化合物1的与其改进特性相关的示例性工程化多肽与SEQID NO:4相比包括在以下残基位置上的一个或多个残基差异:X2、X4、X5、X6、X8、X9、X10、X12、X13、X17、X18、X21、X22、X25、X27、X28、X29、X30、X31、X34、X37、X42、X43、X46、X47、X48、X49、X50、X52、X54、X55、X56、X61、X62、X64、X66、X68、X69、X72、X80、X81、X84、X85、X88、X97、X99、X101、X102、X103、X106、X107、X108、X115、X117、X120、X122、X124、X126、X127、X128、X131、X132、X134、X136、X139、X140、X141、X142、X143、X144、X146、X150、X152、X155、X156、X157、X159、X160、X161、X165、X168、X176、X179、X185、X190、X191、X192、X196、X199、X208、X209、X210、X215、X217、X223、X227、X231、X233、X234、X241、X256、X260、X263、X265、X266、X267、X269、X270、X273、X274、X282、X284、X295、X296、X297、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、X327和X329。在与表2A、2B、2C、2D、2E、2F、2G、2H和2I的示例性多肽的改进特性相关的这些位置的每一个上的特定氨基酸差异包括:X2M;X4F,X4L,X4Y;X5C,X5F,X5I,X5H,X5K,X5L,X5M,X5N,X5P,X5S,X5T,X5V,X5Y;X6F,X6R,X6S,X6T;X8H;X9L,X9I,X9Q,X9F;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X42G;X43S;X47R;X48G,X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X56D,X56E, X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X84T;X85L;X88W;X97P;X102T,X102W;X103G,X103N;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T;X127T;X128A;X131F;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T;X142M;X143V;X146R;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X159G;X160L;X161M;X165N;X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X208K;X209F,X209M,X209Q,X209V;X210G,X210S;X215F,X215H,X215L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X265Y,X265W;X266N;X267V;X269L,X269T;X270R;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296R,X296S,X296W;X300G,X300L;X305Q;X308A;X309W,X309L;X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L;和X329P。
在一些实施方案中,工程化转氨酶能够以相比于化合物3a的非对映体过量作用于化合物2用于制备化合物3d:
在一些实施方案中,工程化转氨酶能够在适当的反应条件下以相比于化合物3a大于10%、20%、30%、40%、50%、60%、70%、80%、90%或更大的非对映体过量作用于化合物2用于制备化合物3d。
在一些实施方案中,相比于对化合物1d,本文所描述的工程化转氨酶多肽展现对化合物1a的非对映选择性。
因此,在一些实施方案中,工程化转氨酶能够以相比于化合物1d的非对映体过量将化合物2转化为化合物1a。在一些实施方案中,工程化转氨酶能够在适当的反应条件下以相比于化合物1d大于10%、20%、30%、40%、50%、60%、70%、80%、90%或更大的非对映体过量将化合物2转化为化合物1a。
在一些实施方案中,工程化转氨酶能够以相比于化合物3d的非对映体过量将化合物2转化为化合物1用于制备化合物3a。
在一些实施方案中,工程化转氨酶能够在适当的反应条件下以相比于化合物3d大于10%、20%、30%、40%、50%、60%、70%、80%、90%或更大的非对映体过量作用于化合物2用于制备化合物3a。
在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下以相对于SEQ IDNO:4的参考多肽对底物存在的增加的耐受性将化合物2转化为化合物1。因此,在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下在约72h、约48h、约36h、约24h或甚至更短的时间长度的反应时间内以至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约98%、或至少约99%的百分比转化率在以下的底物载量浓度的存在下将化合物2的底物转化为化合物1:至少约1g/L、5g/L、10g/L、20g/L、约30g/L、约40g/L、约50g/L、约70g/L、约100g/L。
可在其下确定工程化多肽的上面描述的改进特性的适当的反应条件是关于多肽、底物、胺供体、辅因子、缓冲液、助溶剂的浓度或量、pH和/或包括温度及反应时间的条件。在一些实施方案中,适当的反应条件包括 200μl总体积、5g/L的化合物2、100μl的包括多肽的细胞溶解产物、1M的异丙胺(IPM)、1g/L的PLP、20%(v/v)的DMSO、0.2M的硼酸盐、pH10.5、45℃和24h或72h的反应时间。在一些实施方案中,适当的反应条件包括5g/L的化合物2的混合物底物、5g/L多肽的摇瓶粉(SFP)、1M异丙胺、1g/L PLP、0.2M硼酸盐缓冲液、20%(v/v)DMSO、pH10.5、45℃和24h或72h的反应时间。
本公开内容的示例性非天然存在的工程化转氨酶多肽的结构与功能信息显示于下面表2A、2B、2C、2D、2E、2F、2G、2H和2I中。奇数序列标识符(即,SEQ ID NO)是指编码由偶数的SEQ ID NO提供的氨基酸序列的核苷酸序列,并且该序列被提供在伴随该公开内容的电子序列表文件中,该序列表文件在此通过引用并入本文。氨基酸残基差异是基于与SEQID NO:4的参考多肽序列比较,SEQ ID NO:4的参考多肽序列为相对于节杆菌Arthrobactersp.KNK168的天然存在的转氨酶(SEQ ID NO:2)具有以下24个氨基酸差异的工程化转氨酶多肽:S8P、Y60F、L61Y、H62T、V65A、D81G、M94I、I96L、F122I、S124I、G136W、A169L、V199I、A209L、G215C、G217N、S223P、L269P、L273Y、T282S、A284G、P297S、I306V和S321P。如本文所述,当转氨酶反应在氨基供体存在下生成以各种立体异构形式的化合物1时,在该反应条件下将化合物1简易环化成化合物3意指用于将化合物2转化为化合物1的相对于SEQ ID NO:4的活性可通过测量以其各种立体异构形式的化合物3的形成来评估。在本公开内容中,相对于SEQ ID NO:4的活性是基于在特定反应条件下每小时每g/L的所测试的转氨酶多肽形成的化合物3a与化合物3d以mg/L的量来确定的。“非对映体比”(本文中还称为“d.r.”)为两种可能的非对映体产物化合物3a和化合物3d与两种可能的非对映体产物化合物3b和化合物3c的比。非对映体比可由式[3a+3d]/[3b+3c]来计算。%d.e.是指以化合物3a的过量形成的非对映体化合物3d的百分比,并且基于以下式:([3d]–[3a])/([3d+[3a])来计算。
在转氨酶的筛选中,发现SEQ ID NO:4的工程化多肽以8的d.r.和77%的%d.e.将化合物2转化为化合物1a和化合物1d。SEQ ID NO:4的工程化 多肽被用作在将化合物2转化为化合物1a和化合物1d时具有增加的活性以及相对于SEQ ID NO:4具有较高的d.r.的工程化多肽的进一步进化的起点。各工程化多肽的活性使用高通量(HTP)测定法(作为初级筛选)来确定,并且,在某些情况下,使用次级摇瓶粉(SFP)和/或下游处理(DSP)粉测定法来确定。提供于表2A、2B、2E、2F、2G和2H中的HTP测定值,使用大肠杆菌(E.coli)澄清细胞溶解产物以96孔板格式来确定,下面是如表中标注的测定反应条件。SFP和DSP的酶制剂提供工程化多肽的更纯的粉制剂。表2C和2I中的SFP测定值使用在2ml小瓶格式中的工程化多肽的SFP使用表中标注的反应条件来确定。表2D和2I中的DSP测定值使用在2ml或5ml小瓶格式中的工程化多肽的DSP粉使用表中标注的反应条件来确定。HTP、SFP和DSP制备和测定的更多细节被描述于实施例中。
表2A
表2B
表2C
表2D
表2E
表2F
表2G
表2H
表2I
用于将化合物2转化为化合物1的与其改进特性相关的示例性工程化多肽包括与SEQ ID NO:4相比在以下残基位置上的一个或多个残基差异:X2、X4、X5、X6、X8、X9、X10、X12、X13、X17、X18、X21、X22、X25、X27、X28、X29、X30、X31、X34、X37、X42、X43、X46、X47、X48、X49、X50、X52、X54、X55、X56、X61、X62、X64、X66、X68、X69、X72、X80、X81、X84、X85、X88、X97、X99、X101、X102、X103、X106、X107、X108、X115、X117、X120、X122、X124、X126、X127、X128、X131、X132、X134、X136、X139、X140、X141、X142、X143、X144、X146、X150、X152、X155、X156、X157、X159、X160、X161、X165、X168、X176、X179、X185、X190、X191、X192、X196、X199、X208、X209、X210、X215、X217、X223、X227、X231、X233、X234、 X241、X256、X260、X263、X265、X266、X267、X269、X270、X273、X274、X282、X284、X295、X296、X297、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、X327和X329。在与表2A、2B、2C、2D、2E、2F、2G、2H和2I的示例性多肽的改进特性相关的这些位置的每一个上的特定氨基酸差异包括:X2M;X4F,X4L,X4Y;X5C,X5F,X5I,X5H,X5K,X5L,X5M,X5N,X5P,X5S,X5T,X5V,X5Y;X6F,X6R,X6S,X6T;X8H;X9L,X9I,X9Q,X9F;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X42G;X43S;X47R;X48G,X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X84T;X85L;X88W;X97P;X102T,X102W;X103G,X103N;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T;X127T;X128A;X131F;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T;X142M;X143V;X146R;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X159G;X160L;X161M;X165N;X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X208K;X209F,X209M,X209Q,X209V;X210G,X210S;X215F,X215H,X215L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X265Y,X265W;X266N;X267V;X269L,X269T;X270R;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296R,X296S,X296W;X300G,X300L;X305Q;X308A;X309W,X309L; X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L;和X329P。
基于示例性多肽的特性,增加的酶活性(即,将化合物2转化为化合物1a和化合物1d)与与SEQ ID NO:4相比在以下残基位置上的残基差异相关:X21、X37、X54、X56、X61、X62、X64、X66、X68、X69、X103、X122、X124、X126、X136、X139、X140、X143、X150、X155、X156、X157、X159、X160、X168、X176、X191、X192、X199、X209、X210,X215、X223、X227、X273、X282、X284和X323。部分地影响酶活性和非对映体比(即,化合物1a+化合物1d相比于化合物1b+化合物1c)的底物结合功能与在以下残基位置上的残基差异相关:X21;X37;X61;X62;X69;X122;X124;X126;X136;X150;X191;X192;X199;X203;X209;X215,X223;X273,X282,X284,和X323。化合物1a和化合物1d相比于化合物1b和化合物1c的非对映体比的增加与X21、X62、X124、X136、X152、X192、X215、和X284残基位置上的残基差异相关。化合物1a和化合物1d相比于化合物1b和化合物1c的非对映体比的少许减少与残基位置X69相关。酶稳定性的增加,特别是在溶剂DMSO的存在下,与以下残基位置上的残基差异以及其他相关:X152、X192、X215、X273、和X323。热稳定性的增加与残基位置X215、X273、和X323特别是残基位置X215F、X273R、和X323C上的残基差异以及其他相关。如对本领域技术人员将是明显的,前述残基位置和每个残基位置的特定氨基酸残基,可以单独或以各种组合用于合成具有所需改进特性的转氨酶多肽,所需改进特性包括酶活性、立体选择性、稳定性以及其他。
根据本文提供的指导,可进一步设想,具有SEQ ID NO:6–854中的偶数序列标识符的任何示例性工程化多肽可用作用于合成其它工程化转氨酶多肽的起始氨基酸序列,例如,通过添加来自表2A、2B、2C、2D、2E、2F、2G、2H、2I中的其它多肽以及本文描述的其它残基位置的各种氨基酸差异的新组合通过随后几轮进化。进一步的改进可以通过包括在贯穿前几轮的进化中已被保持为不变的位置上的氨基酸差异而产生。
因此,在一些实施方案中,能够进行将化合物2转化为化合物1的转氨酶多肽包括这样的氨基酸序列,该氨基酸序列具有与参考序列SEQ ID NO:2至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的同一性,以及(a)与SEQ ID NO:2相比在选自以下的残基位置上的一个或多个残基差异:X6、X10、X12、X13、X17、X21、X29、X31、X34、X43、X46、X47、X64、X66、X68、X72、X80、X84、X85、X88、X97、X99、X101、X103、X106、X107、X115、X127、X128、X131、X134、X139、X140、X143、X144、X159、X161、X168、X176、X179、X185、X190、X191、X192、X196、X208、X227、X231、X233、X234、X241、X256、X260、X263、X266、X270、X274、X295、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、和X327,或(b)与SEQ ID NO:4相比选自以下的一个或多个残基差异:X2M;X4F,X4L;X5C,X5F,X5M,X5P,X5Y;X6F,X6R,X6S,X6T;X8H;X9I,X9F,X9L;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X37S;X42G;X43S;X46R;X47R;X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X55M;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X81K;X84T;X85L,X85R;X88W;X89L;X97P,X97T;X99L;X101G,X101L,X101R;X102H,X102R;X102T,X102W;X103G,X103N,X103V;X106L,X106S,X106T,X106V;X107V;X108T;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T;X127T;X128A;X131F;X132H;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T,X140V;X141A;X142M;X143V;X144D,X144I;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X159G; X160L;X161M,X161N;X165L,X165N,X165V;X168E,X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X203M;X208K;X209F,X209M,X209Q,X209V;X210G;X215H,X215L;X217L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X256R;X260Q;X263V;X265Y,X265W;X266N;X267V;X269L,X269T;X270R,X270T;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296L,X296R,X296S,X296W;X300G,X300L;X305Q,X305T;X308A;X309L,X309T,X309W;X311Q,X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323N,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L,X327R;和X329P。
在一些实施方案中,能够将化合物2转化为化合物1的转氨酶多肽包括这样的氨基酸序列,该氨基酸序列具有与选自SEQ ID NO:4-854中的偶数序列标识符的参考序列至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的同一性,以及(a)与SEQ ID NO:4相比在选自以下的残基位置上的一个或多个残基差异:X6、X10、X12、X13、X17、X21、X22、X29、X31、X34、X43、X47、X64、X66、X68、X72、X80、X84、X85、X88、X97、X103、X115、X127、X128、X131、X134、X139、X140、X142、X143、X159、X161、X168、X176、X179、X185、X190、X191、X192、X196、X208、X210、X227、X231、X233、X234、X241、X265、X266、X270、X274、X295、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、和X327,或(b)与SEQ ID NO:4相比选自以下的一个或多个残基差异:X2M;X4F,X4L;X5C,X5F,X5M,X5P,X5Y;X6F,X6R,X6S,X6T;X8H;X9I,X9F,X9L;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X37S;X42G;X43S;X46R; X47R;X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X55M;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X81K;X84T;X85L,X85R;X88W;X89L;X97P,X97T;X99L;X101G,X101L,X101R;X102H,X102R;X102T,X102W;X103G,X103N,X103V;X106L,X106S,X106T,X106V;X107V;X108T;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T;X127T;X128A;X131F;X132H;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T,X140V;X141A;X142M;X143V;X144D,X144I;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X159G;X160L;X161M,X161N;X165L,X165N,X165V;X168E,X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X203M;X208K;X209F,X209M,X209Q,X209V;X210G;X215H,X215L;X217L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X256R;X260Q;X263V;X265Y,X265W;X266N;X267V;X269L,X269T;X270R,X270T;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296L,X296R,X296S,X296W;X300G,X300L;X305Q,X305T;X308A;X309L,X309T,X309W;X311Q,X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323N,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L,X327R;和X329P。在一些实施方案中,参考序列选自SEQ ID NO:4、6、16、34、60、84、186、298、372、582、696、764、798、818、或824。在一些实施方案中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID NO:84。在一些实施方案中,参考序列是SEQ ID NO:372。在一些实施方案中,参考序列是SEQ ID NO:582。在一些实施方案中,参考序列是SEQ ID NO:696。在一些实施方案中,参考序列是SEQ ID NO:764。在一些实施方案中,参考序列是SEQ ID NO:798。在一些实施方案中,参考序列是SEQ ID NO:818。在一些实施方案中,参考序列是SEQ ID NO:824。
在一些实施方案中,转氨酶多肽包括这样的氨基酸序列,该氨基酸序列具有与SEQID NO:4相比存在于SEQ ID NO:84中的氨基酸残基差异的组合(即,X124W、X126A、X136L、X192A和X284A),并且还包括与SEQ ID NO:4相比在选自以下的残基位置上的氨基酸差异:X2、X4、X5、X6、X8、X9、X10、X17、X18、X21、X22、X25、X27、X28、X29、X30、X31、X34、X37、X43、X46、X47、X48、X49、X50、X55、X66、X81、X85、X88、X97、X99、X101、X102、X106、X107、X108、X120、X131、X132、X141、X142、X144、X146、X161、X179、X185、X190、X191、X210、X217、X233、X234、X241、X256、X260、X263、X265、X270、X274、X297、X305、X308、X309、X316、X319、X323、和X329。在一些实施方案中,与SEQ ID NO:4相比另外的氨基酸残基差异选自以下:X2M;X4F;X4L;X4Y;X5C;X5F;X5I;X5H;X5K;X5L;X5M;X5N;X5P;X5S;X5T;X5V;X5Y;X6F;X6S;X6T;X8H;X9L;X9I;X6R;X9Q;X9F;X10L;X17L;X18I;X21L;X22A;X22H;X25A;X27L;X27H;X27P;X28N;X29N;X29T;X30F;X30G;X31H;X31R;X34V;X37S;X43S;X46R;X47R;X48A,X48G,X48R,X48S,X48W;X49I,X49P;X50S;X54M;X55M;X56W;X66A,X66S;X81K;X85L,X85R;X88W;X89L;X97P,X97T;X99L;X101G,X101L,X101R;X102H,X102R,X102T;X102W;X103N,X103V;X106L,X106S,X106T,X106V;X107V;X108T;X120F;X126G;X131F;X132H;X134G,X134L,X134V,X134Y,X134W;X140A;X140M;X140T,X140V;X141A;X142M;X144D,X144I;X146R;X155C;X156F;X161M,X161N;X165L,X165V;X168E;X179K;X185A;X190M;X191A,X191G,X191S;X203M;X210G,X210S;X215F;X217L;X223A;X233D;X234L;X241R;X256R;X260Q;X263V;X265Y;X265W;X269T;X270R, X270T;X273D;X273M;X273R;X273V;X274F;X274L;X274R;X274T;X282T;X295N;X296L,X296R;X296S;X296W;X297D;X297G;X300L;X305Q,X305T;X308A;X309W;X309L,X309T;X311Q;X312M;X316L;X316R;X319R;X319T;X319Y;X320Q;X323C,X323E,X323N,X323R;X325M,X325Q;X327R;和X329P。
在一些实施方案中,上述能够将化合物2转化为化合物1的转氨酶多肽包括具有与SEQ ID NO:4相比在选自以下的残基位置上的一个或多个残基差异的氨基酸序列:X6、X10、X12、X13、X17、X21、X29、X31、X34、X43、X46、X47、X64、X66、X68、X72、X80、X84、X85、X88、X97、X99、X101、X103、X106、X107、X115、X127、X128、X131、X134、X139、X140、X143、X144、X159、X161、X168、X176、X179、X185、X190、X191、X192、X196、X208、X227、X231、X233、X234、X241、X256、X260、X263、X266、X270、X274、X295、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、和X327。在一些实施方案中,在残基位置X6、X10、X12、X13、X17、X21、X29、X31、X34、X43、X46、X47、X64、X66、X68、X72、X80、X84、X85、X88、X97、X99、X101、X103、X106、X107、X115、X127、X128、X131、X134、X139、X140、X143、X144、X159、X161、X168、X176、X179、X185、X190、X191、X192、X196、X208、X227、X231、X233、X234、X241、X256、X260、X263、X266、X270、X274、X295、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、和X327上的残基差异选自以下:X6F,X6R,X6S,X6T;X10L;X12H;X13A,X13F;X17L;X21L;X29N,X29T;X31H,X31R;X34V;X43S;X46R;X47R;X64C;X66A,X66S;X68I;X72A;X80Q;X84T;X85L,X85R;X88W;X97P,X97T;X99L;X101G,X101L,X101R;X103G,X103N,X103V;X106L,X106S,X106T,X106V;X107V;X115R;X127T;X128A;X131F;X134G,X134L,X134S,X134V,X134Y,X134W;X139E;X140A,X140K;X140M,X140T,X140V;X143V;X144D,X144I;X159G;X161M,X161N;X168E,X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K, X192N,X192Q,X192R,X192S;X196L,X196V;X208K;X227I;X231T;X233D;X234L;X241R;X256R;X260Q;X263V;X266N;X270R,X270T;X274F,X274L,X274R,X274T;X295N,X295S;X300G,X300L;X305Q,X305T;X308A;X309L,X309T,X309W;X311Q,X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323N,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L,X327R;和X329P。
在一些实施方案中,包括具有在残基位置X6、X10、X12、X13、X17、X21、X29、X31、X34、X43、X46、X47、X64、X66、X68、X72、X80、X84、X85、X88、X97、X99、X101、X103、X106、X107、X115、X127、X128、X131、X134、X139、X140、X143、X144、X159、X161、X168、X176、X179、X185、X190、X191、X192、X196、X208、X227、X231、X233、X234、X241、X256、X260、X263、X266、X270、X274、X295、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、和X327上的一个或多个残基差异的氨基酸序列的转氨酶多肽还可包括与SEQ ID NO:4相比在选自以下的残基位置上的一个或多个残基差异:X2、X4、X5、X8、X9、X18、X22、X25、X27、X28、X30、X37、X42、X48、X49、X50、X52、X54、X55、X56、X61、X62、X69、X81、X102、X108、X117、X120、X122、X124、X126、X132、X136、X141、X142、X146、X150、X152、X155、X156、X157、X160、X165、X199、X209、X210、X215、X217、X223、X265、X267、X269、X273、X282、X284、X296、和X297。在一些实施方案中,在残基位置X2、X4、X5、X8、X9、X18、X22、X25、X27、X28、X30、X37、X42、X48、X49、X50、X52、X54、X55、X56、X61、X62、X69、X81、X102、X108、X117、X120、X122、X124、X126、X132、X136、X141、X142、X146、X150、X152、X155、X156、X157、X160、X165、X199、X209、X210、X215、X217、X223、X265、X267、X269、X273、X282、X284、X296、和X297上的残基差异选自以下:X2M;X4F,X4L,X4Y;X5C,X5F,X5I,X5H,X5K,X5L,X5M,X5N,X5P,X5S,X5T,X5V,X5Y;X8H;X9L,X9I,X9Q,X9F;X18I;X22A,X22H;X25A;X27L,X27H,X27P; X28N;X30F,X30G;X37S;X42G;X48A,X48G,X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X55M;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X69A,X69G,X69T;X81K;X102H,X102R;X102T,X102W;X108T;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T;X132H;X136F,X136K,X136L,X136M,X136Y;X139E;X141A;X142M;X146R;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X160L;X165L,X165N,X165V;X199L,X199V;X209F,X209M,X209Q,X209V;X210G,X210S;X215F,X215H,X215L;X217L;X223A,X223S,X223T,X223V;X265Y,X265W;X266N;X267V;X269L,X269T;X273D,X273H,X273M,X273R,X273V;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X296D,X296L,X296R,X296S,X296W;X297D;和X297G。
在一些实施方案中,能够将化合物2转化为化合物1的转氨酶多肽包括具有在上描述的指定氨基酸同一性和与SEQ ID NO:4相比选自以下的一个或多个残基差异的氨基酸序列:X52H、X54A、X54L、X56D、X56E、X61G、X61W、X62A、X62L、X62N、X62S、X117V、X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X126C、X126I、X136K、X136L、X136M、X150L、X152A、X152F、X152R、X152W、X155I、X155L、X199L、X199V、X209F、X209M、X209Q、X209V、X215H、X215L、X223S、X223T、X223V、X269L、X273H、X282I、X282L、X282V、X284A、X284P、X284S、X284T、X284V、和X296D。
在一些实施方案中,具有在选自X52、X54、X56、X61、X62、X69、X117、X122、X124、X126、X136、X150、X152、X155、X199、X209、X215、X223、X223、X269、X273、X282I、X284A和X296的残基位置上的上述残基差异的转氨酶多肽还可包括与SEQ ID NO:4相比在选自以下 的残基位置上的一个或多个残基差异:X12、X13、X42、X54、X64、X68、X72、X80、X84、X103、X115、X127、X128、X134、X139、X140、X143、X156、X157、X159、X160、X165、X168、X176、X192、X196、X208、X227、X231、X266、X267、X295、X300、X311、X312、X320、X324、X325、和X327。在一些实施方案中,残基位置X12、X13、X42、X54、X64、X68、X72、X80、X84、X103、X115、X127、X128、X134、X139、X140、X143、X156、X157、X159、X160、X165、X168、X176、X192、X196、X208、X227、X231、X266、X267、X295、X300、X311、X312、X320、X324、X325、和X327上的氨基酸残基差异选自以下:X12H、X13A、X13F、X42G、X54P、X54R、X64C、X68I、X72A、X80Q、X84T、X103G、X115R、X127T、X128A、X134S、X139E、X140K、X143V、X156A、X156S、X156T、X157L、X159G、X160L、X165N、X168R、X176C、X192A、X192G、X192H、X192K、X192N、X192Q、X192R、X192S、X196L、X196V、X208K、X227I、X231T、X266N、X267V、X295S、X300G、X311T、X312C、X320G、X324Q、X325P、X325V、和X327L。
在一些实施方案中,具有在选自X52、X54、X56、X61、X62、X69、X117、X122、X124、X126、X136、X150、X152、X155、X199、X209、X215、X223、X223、X269、X273、X282I、X284A和X296的残基位置上的上述一个或多个残基差异,和任选的在X12、X13、X42、X54、X64、X68、X72、X80、X84、X103、X115、X127、X128、X134、X139、X140、X143、X156、X157、X159、X160、X165、X168、X176、X192、X196、X208、X227、X231、X266、X267、X295、X300、X311、X312、X320、X324、X325、和X327残基位置中的一个或多个上的另外残基差异的转氨酶多肽还可包括与SEQ IDNO:4相比选自X124N、X124L、X124F、X126A、X126T、和X136Y的一个或多个残基差异。
在一些实施方案中,能够在适当的反应条件下将化合物2转化为化合物1的工程化转氨酶多肽,包括具有与参考序列SEQ ID NO:2至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的同一性,和与SEQ IDNO:2相比选自以下的一 个或多个残基差异的氨基酸序列:X12H、X13A、X13F、X52H、X54A、X54L、X56D、X56E、X61G、X61W、X62A、X62L、X62N、X62S、X64C、X68I、X72A、X80Q、X84T、X103G、X115R、X117V、X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X126C、X126I、X127T、X128A、X134S、X136K、X136L、X136M、X139E、X140K、X143V、X150L、X152A、X152F、X152R、X152W、X155I、X155L、X159G、X168R、X176C、X192A、X192G、X192H、X192K、X192N、X192Q、X192R、X192S、X196L、X196V、X199L、X199V、X208K、X209F、X209M、X209Q、X209V、X215H、X215L、X223S、X223T、X223V、X227I、X231T、X266N、X269L、X273H、X282I、X282L、X282V、X284A、X284P、X284S、X284T、X284V、X295S、X296D、X300G、X311T、X312C、X320G、X324Q、X325P、X325V、和X327L。
在一些实施方案中,能够在适当的反应条件下将化合物2转化为化合物1的工程化转氨酶多肽,包括具有与选自SEQ ID NO:4-854中的偶数序列标识符的参考序列至少80%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的同一性,和与SEQ ID NO:4相比选自以下的一个或多个残基差异的氨基酸序列:X2M;X4F,X4L,X4Y;X5C,X5F,X5I,X5H,X5K,X5L,X5M,X5N,X5P,X5S,X5T,X5V,X5Y;X6F,X6R,X6S,X6T;X8H;X9L,X9I,X9Q,X9F;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X37S;X42G;X43S;X46R;X47R;X48A,X48G,X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X55M;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X81K;X84T;X85L,X85R;X88W;X89L;X97P,X97T;X99L;X101G,X101L,X101R;X102H,X102R;X102T,X102W;X103G,X103N,X103V;X106L,X106S,X106T,X106V;X107V;X108T;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A, X126C,X126G,X126I,X126T;X127T;X128A;X131F;X132H;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T,X140V;X141A;X142M;X143V;X144D,X144I;X146R;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X159G;X160L;X161M,X161N;X165L,X165N,X165V;X168E,X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X203M;X208K;X209F,X209M,X209Q,X209V;X210G,X210S;X215F,X215H,X215L;X217L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X256R;X260Q;X263V;X265Y,X265W;X266N;X267V;X269L,X269T;X270R,X270T;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296L,X296R,X296S,X296W;X297D;X297G;X300G,X300L;X305Q,X305T;X308A;X309L,X309T,X309W;X311Q,X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323N,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L,X327R;和X329P。在一些实施方案中,参考序列选自SEQ ID NO:4、6、16、60、84、186、298、372、582、696、764、798、818、或824。在一些实施方案中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID NO:84。在一些实施方案中,参考序列是SEQ ID NO:372。在一些实施方案中,参考序列是SEQ ID NO:582。在一些实施方案中,参考序列是SEQ ID NO:696。在一些实施方案中,参考序列是SEQ ID NO:764。在一些实施方案中,参考序列是SEQ ID NO:798。在一些实施方案中,参考序列是SEQ IDNO:818。在一些实施方案中,参考序列是SEQ ID NO:824。
在一些实施方案中,具有在残基位置X12、X13、X52、X54、X56、X61、X62、X64、X68、X72、X80、X84、X103、X115、X117、X122、 X124、X126、X127、X128、X134、X136、X139、X140、X143、X150、X152、X155、X155、X159、X168、X176、X192、X196、X199、X208、X209、X215、X223、X227、X231、X266、X269、X273、X282、X282、X284、X284、X295、X296、X300、X311、X312、X320、X324、X325、X325、和X327上的一个或多个残基差异的前述工程化转氨酶多肽还可包括与SEQ ID NO:4相比选自以下的一个或多个残基差异:X42G、X54P、X54R、X69A、X69G、X69T、X122M、X124F、X124L、X124N、X124R、X126A、X126T、X136Y,X136F、X150S、X152C、X152G、X152I、X152L、X152S、X156A、X156S、X156T、X157L、和X165N。
在一些实施方案中,转氨酶多肽包括选自以下的一个或多个氨基酸残基差异:X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X136K、X136L、X136M、X152A、X152F、X152R、X152W、X192A、X192G、X192H、X192K、X192N、X192Q、X192R、X192S、X209F、X209M、X209Q、X209V、X284A、X284P、X284S、X284T、和X284V。
在一些实施方案中,包括具有与SEQ ID NO:4相比选自X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X136K、X136L、X136M、X152A、X152F、X152R、X152W、X192A、X192G、X192H、X192K、X192N、X192Q、X192R、X192S、X209F、X209M、X209Q、X209V、X284A、X284P、X284S、X284T、和X284V的一个或多个残基差异的氨基酸序列的转氨酶多肽还可包括在选自以下的残基位置上的一个或多个残基差异:X12、X13、X42、X52、X54、X56、X61、X62、X64、X68、X69、X72、X80、X84、X103、X115、X117、X126、X127、X128、X134、X139、X140、X143、X150、X155、X156、X157、X159、X160、X165、X168、X176、X196、X199、X208,X215、X223、X227、X231、X266、X267、X269、X273、X282、X295、X296、X300、X311、X312、X320、X324、X325、和X327。
在一些实施方案中,能够将化合物2转化为化合物1的转氨酶多肽包括具有与SEQID NO:4相比在残基位置X192上的氨基酸残基差异的氨基酸序列。如上面所提及,残基位置X192与底物结合相关联,并且在此位 置上的残基差异增加转氨酶的酶活性。在一些实施方案中,在X192上的氨基酸残基选自A、G、H、K、N、Q、R和S。
在一些实施方案中,包括具有在残基位置X192上的氨基酸残基差异的氨基酸序列的转氨酶多肽还包括选自以下的一个或多个残基差异:X5K、X5L、X21L、X66A、X122F、X122W、X122Y、X124F、X124K、X124L、X124M、X124N、X124R、X124S、X124W、X126G、X136F、X136K、X136L、X136M、X136Y、X152A、X152C、X152F、X152G、X152I、X152L、X152R、X152S、X152W、X191A、X209F、X209M、X209Q、X209V、X210S、X215F、X273R、X284A、X284P、X284S、X284T、X284V、和X323C。
在一些实施方案中,包括具有在残基位置X192上的残基差异的氨基酸序列的转氨酶多肽还包括在选自以下的残基位置上的一个或多个残基差异:X12、X13、X42、X52、X54、X56、X61、X62、X64、X68、X69、X72、X80、X84、X103、X115、X117、X126、X127、X128、X134、X139、X140、X143、X150、X155、X156、X157、X159、X160、X165、X168、X176、X196、X199、X208,X215、X223、X227、X231、X266、X267、X269、X273、X282、X295、X296、X300、X311、X312、X320、X324、X325、和X327。
在一些实施方案中,对于还包括在残基位置X12、X13、X42、X52、X54、X56、X61、X62、X64、X68、X69、X72、X80、X84、X103、X115、X117、X126、X127、X128、X134、X139、X140、X143、X150、X155、X156、X157、X159、X160、X165、X168、X176、X196、X199、X208,X215、X223、X227、X231、X266、X267、X269、X273、X282、X295、X296、X300、X311、X312、X320、X324、X325和X327上的一个或多个残基差异的上述转氨酶多肽,残基差异可以选自:X12H、X13A、X13F、X42G、X52H、X54A、X54L、X54P、X54R、X56D、X56E、X61G、X61W、X62A、X62L、X62N、X62S、X64C、X68I、X69A、X69G、X69T、X72A、X80Q、X84T、X103G、X115R、X117V、X126A、X126C、X126I、X126T、X127T、X128A、X134S、X139E、X140K、X143V、X150L、X150S、X155I,X155L、 X155T、X156A、X156S、X156T、X157L、X159G、X160L、X165N、X168R、X176C、X196L、X196V、X199L、X199V、X208K、X215H、X215L、X223S、X223T、X223V、X227I、X231T、X266N、X267V、X269L、X273H、X282I、X282L、X282V、X295S、X296D、X300G、X311T、X312C、X320G、X324Q、X325P、X325V、和X327L。
具有与SEQ ID NO:4相比在残基位置X192上的残基差异的示例性转氨酶多肽可以选自SEQ ID NO:16、18、20、26、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、136、138、140、142、144、162、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、和偶数序列标识符SEQ ID NO:306-854。
在一些实施方案中,转氨酶多肽包括与如在示例性多肽中呈现的改进的酶特性相关的残基差异的组合。这些包括与SEQ ID NO:4相比选自以下的氨基酸残基差异的组合以及其他:(a)X124W和X327L;(b)X209M和X300G;(c)X122F,X223V和X284A;(d)XI92A,X215H和X311T;(e)X62N,X124F,X126A和X136L;(f)X124W,X126A,X136L,X192A和X284A;以及(g)X124W,X126A,X136L,X152R/X152L/X152I,和X192A。
在一些实施方案中,能够将化合物2转化为化合物1的转氨酶多肽包括选自SEQ IDNO:6-854中的偶数序列标识符的氨基酸序列。在一些实施方案中,选自SEQ ID NO:8、100、112、114、116、118、和126的氨基酸序列中的一个或多个明确被排除在本文实施方案之外。
如上面所提及,本文描述的转氨酶多肽相对于SEQ ID NO:4的参考多肽可以具有增加的活性。在一些实施方案中,多肽可以被工程化以具有增加的活性用于产生化合物1的某些立体异构体。表2A、2B、2C、2D、2E、 2F、2G、2H、和2I提供用于产生非对映体化合物1d和1a(即,[1d]+[1a])的展现增加的活性的示例性多肽。因此,在一些实施方案中,本文描述的转氨酶多肽能够在适当的反应条件下,以相对于SEQ ID NO:4的参考多肽的活性至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、100倍、200倍、500倍、1000倍或更多倍的活性将化合物2转化为化合物1d和化合物1a。
如上所讨论的,残基位置X54、X56、X61、X62、X64、X68、X69、X122、X124、X126、X136、X139、X140、X143、X150、X155、X156、X157、X159、X160、X176、X192、X199、X209、X223、X227、X282、和X284与底物化合物2的酶活性和结合的增加相关联。因此,在一些实施方案中,工程化转氨酶多肽具有包括与SEQ ID NO:4相比选自以下的一个或多个残基差异的氨基酸序列:X54A;X54L;X56D;X56E;X61G;X61W;X62A;X62L;X62N;X62S;X64C;X68I;X122F,X122W;X122Y;X124K;X124M;X124S;X124W;X126C;X126I;X136K;X136L;X136M;X139E;X140K;X143V;X150L;X155I;X155L;X159G;X160L;X176C;X192A;X192G;X192H;X192K;X192N;X192Q;X192R;X192S;X199L;X199V;X209F;X209M;X209Q;X209V;X223S;X223T;X223V;X227I;X282L,X282V;X284A;X284P;X284S;X284T;和X284V。
在一些实施方案中,具有与SEQ ID NO:4相比在残基位置X54、X56、X61、X62、X64、X68、X122、X124、X126、X136、X139、X140、X143、X150、X155I、X159、X176、X192、X199、X209、X209、X223、X227、X282、X282、和X284上的一个或多个残基差异的工程化转氨酶多肽还包括选自以下的一个或多个残基差异:X54P;X54R;X69T;X69A;X69G;X122M;X124F,X124L,X124N,X124R;X126T;X126A;X136F;X136Y;X150S;X152A,X152C;X152F;X152G;X152I;X152L;X152R;X152S;X152W;X156A;X156S;X157L;和X282I。
在一些实施方案中,在将化合物2转化为上述化合物1d和化合物1a中具有增加的活性的转氨酶多肽包括具有与SEQ ID NO:4相比选自以下的 残基差异的组合的氨基酸序列:(a)X136L和X192A;(b)X124L和X192A;(c)X124W、X126A、X136L、X192A、和X284A;(d)X122W、X124F、X126A、X192A和X284V;(e)X124W、X126A、X136L、X143V、X150S、X156T、X159G、X192A、X215H、X223S、和V227I;和(f)X54P、X64C、X124W、X126A、X139E、X143V、X155I、X157L、X159G、X192A、X199V、X215H和X227I。
在一些实施方案中,能够以SEQ ID NO:4的活性的至少1.5倍的活性将化合物2转化为化合物1d和化合物1a的转氨酶多肽包括选自具有SEQ ID NO:6-854中的偶数序列标识符的序列的氨基酸序列。
在一些实施方案中,转氨酶多肽能够以SEQ ID NO:4的活性的至少10倍的活性将化合物2转化为化合物1d和化合物1a。在一些实施方案中,具有SEQ ID NO:4的活性的至少10倍的活性的转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、122、124、136、138、140、144、154、162、164、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304,和SEQID NO:306-854中的偶数序列标识符。
在一些实施方案中,转氨酶多肽能够以SEQ ID NO:4的活性的至少100倍的活性将化合物2转化为化合物1d和化合物1a。在一些实施方案中,具有SEQ ID NO:4的活性的至少100倍的活性的转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:16、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、60、62、64、66、68、70、72、74、76、78、80、82、84、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、 252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304,和SEQ ID NO:306-854中的偶数序列标识符。
在一些实施方案中,转氨酶多肽能够以SEQ ID NO:4的活性的至少1000倍的活性将化合物2转化为化合物1d和化合物1a。在一些实施方案中,具有SEQ ID NO:4的活性的至少1000倍的活性的转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:34、50、52、56、62、64、66、68、70、72、74、78、80、82、84、292、294、296、298、300、302,和SEQ ID NO:306-854中的偶数序列标识符。
此外,如上面所讨论的,转氨酶多肽可以被设计为具有对于某些立体异构体产物的立体选择性;也就是相比于另一种或另一组的立体异构体产生一种或一组立体异构体,如通过在表2C、2D、和2I中的示例性多肽呈现的。因此,在一些实施方案中,转氨酶多肽能够以相比于化合物1b和化合物1c大于8:1、大于10:1、大于20:1、大于50:1、大于100:1或更大的非对映体比将化合物2转化为化合物1a和化合物1d。
在一些实施方案中,能够以相比于化合物1b和化合物1c大于8:1的非对映体比将化合物2转化为化合物1d和化合物1a的转氨酶多肽可以具有包括与SEQ ID NO:4相比选自以下的一个或多个残基差异的氨基酸序列:X62N;X62A;X62S;X62L;X124W,X124F;X124K;X124L;X124M;X124N;X124R;X124S;X136F;X136K;X136L;X136M;X136Y;X152A;X152C;X152F;X152G;X152I;X152L;X152R;X152S;X152W;X192A;X192G;X192H;X192K;X192N;X192Q;X192R;X192S;X215H;X215L;X284V;X284A;X284P;X284S;和X284T。
在一些实施方案中,能够以相比于化合物1b和化合物1c大于8:1的非对映体比将化合物2转化为化合物1a和化合物1d的转氨酶多肽可以具有包括与SEQ ID NO:4相比选自以下的残基差异的组合的氨基酸序列:(a)X124F/X124K/X124L/X124W和X192A/X192N/X192S;(b)X136F/X136L和X192A/X192N/X192S;(c)X124F/X124K/X124L/X124W、X192A/X192N/X192S和X284A/X284T/X284V;(d) X124F/X124K/X124L/X124W、X136F/X136L和X192A/X192N/X192S;(e)X124F/X124K/X124L/X124W、X126A、X136F/X136L和X192A/X192N/X192S;以及(f)X124F/X124K/X124L/X124W、X126A、X136F/X136L、X192A/X192N/X192S、和X284A/X284T/X284V。
在一些实施方案中,能够以相比于化合物1b和化合物1c大于8:1的非对映体比将化合物2转化为化合物1a和化合物1d的转氨酶多肽包括选自以下的氨基酸序列:SEQ IDNO:6、10、12、14、16、18、20、22、24、26、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、372、412、526、528、550、580、582、624、630、640、648、654、656、668、692、696、700、704、714、716、718、720、742、764、774、798、818、824、和826。
在一些实施方案中,转氨酶多肽能够以相比于化合物1b和化合物1c大于50:1的非对映体比将化合物2转化为化合物1a和化合物1d。在一些实施方案中,能够以相比于化合物1b和化合物1c大于50:1的非对映体比将化合物2转化为化合物1a和化合物1d的转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:6、16、18、20、22、24、26、30、32、34、36、42、46、48、50、52、56、58、60、62、64、68、74、76、78、80、82、84、372、412、550、580、582、624、630、640、648、654、656、668、692、696、700、704、764、774、798、818、824、和826。
在一些实施方案中,转氨酶多肽能够以相比于化合物1b和化合物1c大于100:1的非对映体比将化合物2转化为化合物1a和化合物1d。在一些实施方案中,能够以相比于化合物1b和化合物1c大于100:1的非对映体比将化合物2转化为化合物1a和化合物1d的转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:16、18、20、26、30、34、36、42、48、50、52、58、64、68、76、78、80、82、84、582、640、648、654、668、696、700、764、774、798、和818。
在一些实施方案中,转氨酶多肽能够以化合物1a的非对映体过量将化合物2转化为化合物1d。这些多肽可以使用来自上述示例性多肽的特性的信息以类似的方法被设计为其它立体选择性的多肽。在一些实施方案 中,能够以相比于化合物1a的非对映体过量将化合物2转化为化合物1d的转氨酶多肽的氨基酸序列包括与SEQ ID NO:4相比选自以下的一个或多个氨基酸残基差异:X62N;X122F;X122W;X209M;X284V,X284T,X284A;X284P和X284S。
在一些实施方案中,能够以相比于化合物1a的非对映体过量将化合物2转化为化合物1d的转氨酶多肽包括与SEQ ID NO:4相比选自以下的氨基酸残基差异的组合:(a)X192A和G284T;(b)X62N、X124F、X126A和X136L;(c)X122W、X124F、X192A、X209M和X284V;(d)X122W、X124F、X126A、X192A和X284V;(e)X122F、X124F、X136L、X152F、X209M和X284V;(f)X124F、X126A、X136L、X152A、X192S和X284V;以及(g)X122F、I124W、X160L、X192A、X209M和X284V。
在一些实施方案中,能够以相比于化合物1a的非对映体过量将化合物2转化为化合物1d的转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:6、8、10、12、14、22、24、28、30、32、44、48、50、和52。
在一些实施方案中,转氨酶多肽能够以相比于化合物1a至少50%的非对映体过量将化合物2转化为化合物1d。在一些实施方案中,能够以相比于化合物1e至少50%的非对映体过量将化合物2转化为化合物1d的转氨酶多肽包括选自SEQ ID NO:6、14、22、24和28的氨基酸序列。
在一些实施方案中,转氨酶多肽可以具有相比于对化合物1d对化合物1a的非对映选择性。来自表2C、2D、和2I中的示例性转氨酶多肽的数据指示,具有相比于对化合物1d对化合物1a的非对映选择性的多肽,是与与SEQ ID NO:4相比以下的残基差异相关的:X54P;X54L;X64C;X140K;X143V;X150S;X155I;X156T;X215H,X223S;X227I;以及X124W和X126A的组合。因此,在一些实施方案中,能够以化合物1d的非对映体过量将化合物2转化为化合物1a的转氨酶多肽具有包括与SEQ ID NO:4相比选自以下的一个或多个残基差异的氨基酸序列:X54P;X54L;X64C;X140K;X143V;X150S;X155I;X156T;X215H,X223S;X227I;以及X124W和X126A的组合。
在一些实施方案中,能够以相比于化合物1d的非对映体过量将化合 物2转化为化合物1a的转氨酶多肽包括与SEQ ID NO:4相比选自以下的残基差异的组合:(a)X192A/X192S和X215H;(b)X124W、X126A、X136L/X136F和X192A/X192N/X192S;(c)X124W、X126A、X136L、X152L/X152W/X152I、和X192A;(d)X54L、X124W、X126A、X136L、X192A、X215H、和X223S;(e)X54L、X64C、X124W、X126A、X136L、X192A、和X215H;(f)X124W、X126A、X136L、X140K、X150S、X155I、X192A、X196L、X215H、和X227I;(g)X54L、X124W、X126A、X136L、X155I、X156T、X157L、X192A、X215H、和X223S;(h)X54P、X64C、X124W、X126A、X136L、X155I、X156T、X157L、X192A、和X215H;(i)X124W、X126A、X136L、X143V、X150S、X156T、X159G、X192A、X215H、X223S、和X227I;(j)X54P、X56E、X64C、X124W、X126A、X136L、X139E、X140K、X143V、X150S、X156T、X192A、和X215H;以及(k)X124W、X126A、X136L、X140K、X143V、X155I、X156T、X157L、X192A、X199V、X215H、X223S、X227I、和X231T。
在一些实施方案中,具有相比于对化合物1d对化合物1a的非对映选择性的转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:16、18、20、26、34、42、46、56、58、60、62、64、68、70、72、74、76、78、80、82、和84。
在一些实施方案中,能够在适当的反应条件下将化合物2转化为化合物1的非天然存在的转氨酶多肽包括具有与具有SEQ ID NO:6-854中的偶数序列标识符的序列中的一个至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性,以及与SEQ ID NO:4相比存在于具有SEQ ID NO:6-854中的偶数序列标识符的序列中的任何一个中的氨基酸残基差异的氨基酸序列。如上面所描述,在一些实施方案中,存在于选自SEQ ID NO:8、100、112、114、116、118、和126的氨基酸序列中的一个或多个中的残基差异明确被排除在实施方案之外。
除上面指定的残基位置之外,本文所公开的任何工程化转氨酶多肽还可以包括相对于SEQ ID NO:4的参考多肽序列,在其它残基位置即,除以 下残基位置外的残基位置的残基差异:X2、X4、X5、X6、X8、X9、X10、X12、X13、X17、X18、X21、X22、X25、X27、X28、X29、X30、X31、X34、X37、X42、X43、X46、X47、X48、X49、X50、X52、X54、X55、X56、X61、X62、X64、X66、X68、X69、X72、X80、X81、X84、X85、X88、X97、X99、X101、X102、X103、X106、X107、X108、X115、X117、X120、X122、X124、X126、X127、X128、X131、X132、X134、X136、X139、X140、X141、X142、X143、X144、X146、X150、X152、X155、X156、X157、X159、X160、X161、X165、X168、X176、X179、X185、X190、X191、X192、X196、X199、X208、X209、X210、X215、X217、X223、X227、X231、X233、X234、X241、X256、X260、X263、X265、X266、X267、X269、X270、X273、X274、X282、X284、X295、X296、X297、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、X327、和X329。在这些其它残基位置上的残基差异可以提供氨基酸序列中的另外变体而没有改变多肽将化合物2转化为化合物1的能力,特别是关于用于产生化合物1a和化合物1d的增加的活性;相比于对化合物1b和化合物1c对化合物1a和化合物1d的非对映选择性;相比于对化合物1a对化合物1d的非对映选择性;和/或相比于对化合物1d对化合物1a的非对映选择性。因此,在一些实施方案中,除选自具有SEQ ID NO:6-854中的偶数序列标识符的多肽的工程化转氨酶多肽中的任何一个的氨基酸残基差异之外,序列还可以包括与SEQ ID NO:4相比在其它氨基酸残基位置上的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-26个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55个、或1-60个残基差异。在一些实施方案中,与参考序列相比氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、55个、或60个残基位置。在一些实施方案中,在其它氨基酸残基位置上的残基差异可以包括与SEQ ID NO:2的野生型多肽或SEQ ID NO:4的工程化多肽的参考序列相比的保守 置换和/或非保守置换。
相对于SEQ ID NO:2的野生型序列在其它位置上的氨基酸残基差异和这些差异对酶功能的影响针对其它工程化转氨酶多肽被描述,该其它工程化转氨酶多肽公开于已公布的PCT申请WO2010/099501A2和WO2011/005477A1;以及2011年8月8日提交的PCT申请PCT/US11/46932中,所有这些申请通过引用并入本文。因此,在一些实施方案中,与SEQ ID NO:2的野生型序列相比的氨基酸差异中的一个或多个还可以在选自以下的残基位置上被引入到本公开内容的工程化转氨酶多肽:X2、X4、X5、X7、X8、X9、X10、X11、X14、X18、X22、X25、X26、X27、X28、X30、X37、X38、X41、X44、X48、X49、X50、X55、X58、X60、X65、X81、X82、X94、X96L、X102、X108、X120、X135、X137、X138、X141、X142、X146、X148、X163、X163、X164、X169、X171、X178、X181、X182、X204、X209、X210、X211、X213、X215、X217、X218、X223、X225、X230、X242、X245、X252、X265、X292、X297、X302、X306、X321、X328和X329。特别地,在前述位置上的氨基酸残基的选择可以选自以下:X2K,X2Q,X2S;X4Y,X4I;X5K,X5H,X5I,X5L,X5N,X5S,X5T,X5V;X7A;X8P,X8T;X9N,X9Q,X9S;X10V;X11K;X14R;X18C;X22I;X25Q;X26H;X27T;X28P;X30M,X30Q;X37R;X38G;X41H,X41S;X41F;X44Q,X44V;X48A;X48D,X48G,X48Q,X48V;X49T;X50L;X55V,X55L;X58L;X60F;X65A,X65T,X65C,X65G,X65S;X81G;X82S;X94I,X94L;X96L;X102L,X102K;X108V;X120Y;X135Q;X137T,X137I;X138K,X138P;X141L;X142R,X142T;X146R;X148A,X148F;X163H,X163V;X164P,X164V;X164A;X169L;X171A;X178S;X181G;X182T;X204A;X209L;X209C,X209D,X209E;X210S;X211I;X213P;X215F,X215Y,X215C;X217N,X217S;X218M;X223I,X223L,X223M,X223N,X223P;X225Y;X230V;X242T;X245S;X252F;X265T;X292T;X297S;X302A;X306L;X321P;X328I;和X329H。对在残基位置上的氨基酸残基的选择的指导可以参见所引用的参考文献。
如上述所讨论的,用作用于产生示例性工程化转氨酶多肽的起始骨架的SEQ IDNO:4的多肽序列还是相对于节杆菌Arthrobacter sp.KNK168的天然存在的转氨酶(SEQ IDNO:2)具有以下24个氨基酸差异的工程化转氨酶多肽:S8P、Y60F、L61Y、H62T、V65A、D81G、M94I、I96L、F122I、S124I、G136W、A169L、V199I、A209L、G215C、G217N、S223P、L269P、L273Y、T282S、A284G、P297S、I306V、和S321P。因此,在一些实施方案中,在适当的反应条件下能够将化合物2转化为化合物1并且包括具有与选自具有SEQ ID NO:6-854中的偶数序列标识符的序列中的任何一个的参考氨基酸序列至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性的氨基酸序列的工程化多肽,并且具有不包括与SEQ ID NO:4相比在以下位置中的一个或多个上的残基差异的氨基酸序列:X8、X60、X61、X62、X65、X81、X94、X96、X122、X124、X136、X169、X199、X209、X215、X217、X223、X269、X273、X282、X284、X297、X306、和X321。
在一些实施方案中,本公开内容还提供包括本文描述的任何工程化转氨酶多肽的片段的工程化转氨酶多肽,该片段保留了该工程化转氨酶的功能活性和/或改进特性。因此,在一些实施方案中,本公开内容提供能够在适当的反应条件下将化合物2转化为化合物1的多肽片段,其中该片段包括本公开内容的工程化转氨酶多肽,诸如具有SEQ ID NO:6-854中的偶数序列标识符的示例性工程化多肽的全长氨基酸序列的至少约80%、90%、95%、98%、或99%。
在一些实施方案中,本公开内容的工程化转氨酶多肽可以具有与本文描述的工程化转氨酶多肽序列,诸如具有SEQ ID NO:6-854中的偶数序列标识符的示例性工程化多肽序列中的任何一个相比包括缺失的氨基酸序列。因此,对于本公开内容的工程化转氨酶多肽的每一个实施方案,当保留本文描述的工程化转氨酶的相关功能活性和/或改进特性时,氨基酸序列可以包括一个或多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20 个或更多个氨基酸、多至氨基酸的总数的10%、多至氨基酸的总数的10%、多至氨基酸的总数的20%、或多至氨基酸的总数的30%的缺失。在一些实施方案中,缺失可以包括1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55个或1-60个氨基酸残基。在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、55个或60个氨基酸残基。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、25个或30个氨基酸残基的缺失。
在一些实施方案中,本公开内容提供具有与本文描述的工程化转氨酶多肽序列,诸如具有SEQ ID NO:6-854中的偶数序列标识符的示例性工程化多肽序列中的任何一个相比包括***的氨基酸序列的工程化转氨酶多肽。因此,对于本公开内容的转氨酶多肽的每一个实施方案,当保留本文描述的工程化转氨酶的相关功能活性和/或改进特性时,***可以包括一个或多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸。***可以是氨基末端或羧基末端、或转氨酶多肽的内部部分。
在一些实施方案中,本公开内容提供能够在适当的反应条件下将化合物2转化为化合物1的非天然存在的多肽,该多肽包括具有与具有SEQ ID NO:6-854中的偶数序列标识符的序列至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性的氨基酸序列,条件是,该氨基酸序列与公开于以下的示例性工程化转氨酶多肽氨基酸序列不同(也就是,该氨基酸序列不包括公开于以下的示例性工程化转氨酶多肽氨基酸序列):已公布的PCT申请 WO2010/099501A2和WO2011/005477A1;和2011年8月8日提交的PCT申请PCT/US11/46932;所有这些申请通过引用并入本文。
在上述实施方案中,用于工程化多肽的适当的反应条件是表2A、2B、2C、2D、2E、2F、2G、或2H中所描述的那些条件。因此,在一些实施方案中,适当的反应条件包括5g/L的化合物2、15g/L或更少的转氨酶多肽、20%二甲基亚砜(DMSO)、1M异丙胺(IPM)、1g/L磷酸吡哆醛(PLP),0.2M硼酸盐、pH10.5和45℃下72h。在一些实施方案中,适当的反应条件包括5g/L的化合物2、5g/L或更少的转氨酶多肽、20%二甲基亚砜(DMSO)、1M异丙胺(IPM)、1g/L磷酸吡哆醛(PLP)、0.2M硼酸盐、pH10.5和45℃下24h。在一些实施方案中,适当的反应条件包括50g/L的化合物2、25g/L或更少的转氨酶多肽、50%二甲基亚砜(DMSO)、1M异丙胺(IPM)、1g/L磷酸吡哆醛(PLP)、0.2M硼酸盐、pH10.5和45℃下24h。这些反应条件和转氨酶多肽的使用的指导提供于表2A、2B、2C、2D、2E、2F、2G、或2H和实施例以及其他中。
在一些实施方案中,本公开内容的多肽可以是融合多肽的形式,其中工程化多肽与其它多肽融合,诸如通过举例的方式而非限制,抗体标签(例如,myc表位)、纯化序列(例如,用于结合至金属的His标签)和细胞定位信号(例如,分泌信号)。因此,本文描述的工程化多肽可与其它多肽融合或不与其它多肽融合使用。
本文描述的工程化转氨酶多肽不限于基因编码的氨基酸。因此,除了基因编码的氨基酸以外,本文描述的多肽可以完全或部分由天然存在的和/或合成的非编码氨基酸组成。本文描述的多肽可由其组成的某些常见非编码氨基酸包括但不限于:基因编码的氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯 丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;哌可酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu);高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽可由其组成的另外的非编码氨基酸对本领域技术人员将是明显的(参见,例如,在Fasman,1989,CRC Practical Handbook of Biochemistry and MolecularBiology,CRC Press,Boca Raton,FL,在第3-70页及其中引用的参考文献中提供的多种氨基酸,全部参考文献通过引用并入本文)。这些氨基酸可以是以L-构型或D-构型。
本领域技术人员将认识到,带有侧链保护基的氨基酸或残基还可以构成本文所描述的多肽。在这种情况下属于芳香族类别的这些受保护的氨基 酸的非限制性实例包括(在括号中列出的保护基)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶亚磺酰基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
本文所述的多肽可由其组成的构型上受限制的非编码氨基酸包括但不限于,N-甲基氨基酸(L-构型);1-氨基酸环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨酸(hPro);以及1-氨基环戊烷-3-羧酸。
在一些实施方案中,工程化多肽可以被提供在固体载体上,诸如膜、树脂、固体载体、或其它固相材料。固相载体可以由有机聚合物如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧和聚丙烯酰胺以及其共聚物和接枝物组成。固体载体还可以是无机的,诸如玻璃、二氧化硅、可控孔度玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体载体的结构可以呈珠、球、粒子、颗粒、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固体载体可以是多孔的或非多孔的,并且可以具有溶胀的或非溶胀的性质。固体载体可以被配置成孔、凹部或其它容器、器皿(vessel)、特征(feature)或位置(location)的形式。
在一些实施方案中,转氨酶多肽结合或固定在固体载体上,使得它们保留它们的相对于SEQ ID NO:4的参考多肽的改进活性、对映选择性、立体选择性、和/或其它改进特性。在这样的实施方案中,固定的多肽可以促进化合物2的底物生物催化转化为化合物1的产物(例如,如本文描述的用于制备方案1和方案2的化合物3的方法中所示的),并且在反应完全后很容易保留(例如,通过保留在其上固定多肽的珠),并且然后在后续反应中再利用或回收。这样的固定的酶的方法允许更高的效率和成本降低。因此,进一步设想,使用本公开内容的转氨酶多肽的方法中的任一种,可以使用结合或固定在固体载体上的相同的转氨酶多肽来进行。
可以非共价地或共价地结合转氨酶多肽。用于缀合和固定酶至固体载体(例如,树脂、膜、珠、玻璃等等)的各种方法是本领域熟知的并描述于例如:Yi等人,“Covalentimmobilization ofω-transaminase from Vibrio fluvialis JS17on chitosanbeads,”Process Biochemistry42(5):895-898(2007 年五月);Martin等人,“Characterization of free and immobilized(S)-aminotransferase foracetophenone production,”Applied Microbiology and Biotechnology76(4):843-851(2007年九月);Koszelewski等人,“Immobilization ofω-transaminases byencapsulation in a sol-gel/celite matrix,”Journal of Molecular Catalysis B:Enzymatic,63:39-44(2010年四月);Truppo等人,“Development of an ImprovedImmobilized CAL-B for the Enzymatic Resolution of a Key Intermediate toOdanacatib,”Organic Process Research&Development,在线公布:dx.doi.org/10.1021/op200157c;Hermanson,G.T.,Bioconjugate Techniques,第二版,Academic Press(2008);Mateo等人,“Epoxy sepabeads:a novel epoxy support for stabilization ofindustrial enzymes via very intense multipoint covalent attachment,”Biotechnology Progress18(3):629-34(2002);以及Bioconjugation Protocols:Strategies and Methods,In Methods in Molecular Biology,C.M.Niemeyer编著,Humana Press(2004);其每个的公开内容通过引用并入本文。可用于固定本公开内容的工程化转氨酶的固体载体包括但不限于,包括以下的珠或树脂:具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯。可用于固定本公开内容的工程化转氨酶的示例性固体载体包括但不限于,壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,可以以阵列的形式提供转氨酶多肽,其中多肽被排列在定位上不同的位置中。在一些实施方案中,定位上不同的位置是在固体载体诸如96-孔板的孔中。多种载体可以配置在阵列上的不同的位置,这对于试剂的机器人递送或通过检测方法和/或仪器是可寻址的。这样的阵列可用于测试各种底物化合物通过多肽的转化。
在一些实施方案中,本文描述的工程化多肽可以试剂盒的形式被提供。试剂盒中的多肽可以单独地存在或作为多种多肽存在。试剂盒还可以包括用于进行酶促反应的试剂、用于评估多肽活性的底物、以及用于检测产物的试剂。试剂盒还可包括试剂分配器和试剂盒的使用的说明书。在一 些实施方案中,本公开内容的试剂盒包括以下的阵列,其包括在不同的可寻址的位置的多种不同的工程化转氨酶多肽,其中不同的多肽是参照序列的不同的变体,所述变体各自具有至少一种不同的改进的酶性质。包括多种工程化多肽的这样的阵列和它们的使用方法被描述在例如WO2009/008908A2中。
5.4可用于制备工程化转氨酶多肽的多核苷酸、控制序列、表达载体、和宿主细胞
在另一个方面,本公开内容提供编码本文描述的工程化转氨酶多肽的多核苷酸。多核苷酸可以与控制基因表达的一个或多个异源的调节序列可操作地连接,以产生能够表达多肽的重组的多核苷酸。包括编码工程化转氨酶的异源的多核苷酸的表达构建体可以被引入适当的宿主细胞以表达相应的转氨酶多肽。
如对本领域技术人员将是明显的,蛋白序列的可用性和相应于各种氨基酸的密码子的知识提供了对能够编码该主题蛋白序列的所有多核苷酸的描述。当相同氨基酸由替代的或同义的密码子编码时,遗传密码的简并性允许极大数目的核酸被制出,所有这些核酸编码本文所公开的改进的转氨酶。因此,如果已确定具体的氨基酸序列,本领域技术人员能够以不改变蛋白的氨基酸序列的方式通过仅仅变更序列的一个或多个密码子来制出许多的不同核酸。在这点上,本公开内容明确涵盖可通过选择基于可能的密码子选择的组合制出的多核苷酸的每一种可能的变体,并且所有这些变体将被认为针对本文公开的任何多肽被明确地公开,所述本文公开的任何多肽包括在表2A、2B、2C、2D、2E、2F、2G、2H、和2I中提供的以及作为SEQ ID NO:6-854中的偶数序列标识符的序列通过引用并入本文的序列表中所公开的示例性工程化多肽的氨基酸序列。如本文描述的,在一些实施方案中,从多核苷酸的实施方案排除的是编码选自SEQ ID NO:8、100、112、114、116、118、和126的氨基酸序列中的一个或多个的序列。
在各种实施方案中,密码子被优选地选择以适合在其中产生蛋白的宿主细胞。例如,细菌中使用的优选的密码子被用于在细菌中表达基因;酵 母中使用的优选的密码子被用于酵母中的表达;并且哺乳动物中使用的优选的密码子被用于哺乳动物细胞中的表达。在一些实施方案中,所有密码子不需要被替换以优化转氨酶的密码子使用,因为天然序列将包括优选的密码子并且因为优选的密码子的使用对于所有氨基酸残基可能不是必需的。因此,编码转氨酶的密码子优化的多核苷酸可以在全长编码区域的约40%、50%、60%、70%、80%或大于90%的密码子位置包括优选的密码子。
在一些实施方案中,多核苷酸编码包括与选自SEQ ID NO:4–854中的偶数序列标识符的参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更多相同的氨基酸序列的转氨酶多肽,其中多肽具有转氨酶活性和如本文描述的改进特性中的一个或多个:例如,与SEQ ID NO:4的多肽相比以增加的活性将化合物2转化为产物化合物1a和化合物1d的能力;以相比于化合物1b和化合物1c大于8:1的非对映体比将化合物2转化为化合物1a和化合物1d的能力;和/或以相比于化合物1a的非对映体过量将化合物2转化为化合物1d的能力,或以相比于化合物d的非对映体过量将化合物2转化为化合物1a的能力。在一些实施方案中,参考序列选自SEQ ID NO:4、6、16、34、60、84、186、298、372、582、696、764、798、818、或824。在一些实施方案中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID NO:84。在一些实施方案中,参考序列是SEQ ID NO:372。在一些实施方案中,参考序列是SEQ ID NO:582。在一些实施方案中,参考序列是SEQ ID NO:696。在一些实施方案中,参考序列是SEQ ID NO:764。在一些实施方案中,参考序列是SEQ ID NO:798。在一些实施方案中,参考序列是SEQ ID NO:818。在一些实施方案中,参考序列是SEQ ID NO:824。
在一些实施方案中,多核苷酸编码包括氨基酸序列的工程化转氨酶多肽,所述氨基酸序列具有上面描述的百分比同一性以及(a)具有与SEQ ID NO:4相比在选自以下的残基位置上的一个或多个氨基酸残基差异:X6、X10、X12、X13、X17、X21、X29、X31、X34、X43、X46、X47、X64、X66、X68、X72、X80、X84、X85、X88、X97、X99、X101、X103、X106、 X107、X115、X127、X128、X131、X134、X139、X140、X143、X144、X159、X161、X168、X176、X179、X185、X190、X191、X192、X196、X208、X227、X231、X233、X234、X241、X256、X260、X263、X266、X270、X274、X295、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、和X327,或(b)与SEQ ID NO:4相比选自以下的一个或多个氨基酸残基差异:X52H、X54A、X54L、X56D、X56E、X61G、X61W、X62A、X62L、X62N、X62S、X117V、X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X126C、X126I、X136K、X136L、X136M、X150L、X152A、X152F、X152R、X152W、X155I、X155L、X199L、X199V、X209F、X209M、X209Q、X209V、X215H、X215L、X223S、X223T、X223V、X269L、X273H、X282I、X282L、X282V、X284A、X284P、X284S、X284T、X284V、和X296D。在一些实施方案中,多核苷酸编码包括具有上面描述的百分比同一性以及与SEQ ID NO:4相比选自以下的一个或多个残基差异的氨基酸序列的工程化转氨酶多肽:X12H、X13A、X13F、X52H、X54A、X54L、X56D、X56E、X61G、X61W、X62A、X62L、X62N、X62S、X64C、X68I、X72A、X80Q、X84T、X103G、X115R、X117V、X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X126C、X126I、X127T、X128A、X134S、X136K、X136L、X136M、X139E、X140K、X143V、X150L、X152A、X152F、X152R、X152W、X155I、X155L、X159G、X168R、X176C、X192A、X192G、X192H、X192K、X192N、X192Q、X192R、X192S、X196L、X196V、X199L、X199V、X208K、X209F、X209M、X209Q、X209V、X215H、X215L、X223S、X223T、X223V、X227I、X231T、X266N、X269L、X273H、X282I、X282L、X282V、X284A、X284P、X284S、X284T、X284V、X295S、X296D、X300G、X311T、X312C、X320G、X324Q、X325P、X325V、和X327L。
在一些实施方案中,编码工程化转氨酶的多核苷酸包括选自SEQ ID NO:5-853中的奇数序列标识符的序列。在一些实施方案中,明确排除选自SEQ ID NO:7、99、111、113、115、117、和125的一个或多个多核苷酸序列。
在一些实施方案中,本公开内容提供在限定的条件下诸如中度严格或高度严格的条件下与编码本公开内容的工程化转氨酶的多核苷酸序列(或其补体)杂交的多核苷酸。在一些实施方案中,多核苷酸能够在高度严格的条件下与选自具有SEQ ID NO:5-853中的奇数序列标识符的序列或其补体的多核苷酸杂交,并且编码具有转氨酶活性和本文描述的改进特性中的一个或多个的多肽。在一些实施方案中,能够在高度严格条件下杂交的多核苷酸编码包括氨基酸序列的转氨酶多肽,所述氨基酸序列具有与SEQ ID NO:2或4的参考多肽相比在选自以下的氨基酸残基位置上的一个或多个氨基酸残基差异:X6、X10、X12、X13、X17、X21、X22、X29、X31、X34、X43、X47、X64、X66、X68、X72、X80、X84、X85、X88、X97、X103、X115、X127、X128、X131、X134、X139、X140、X142、X143、X159、X161、X168、X176、X179、X185、X190、X191、X192、X196、X208、X210、X227、X231、X233、X234、X241、X265、X266、X270、X274、X295、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、和X327,或(b)与SEQ ID NO:4相比选自以下的一个或多个氨基酸残基差异:X52H、X54A、X54L、X56D、X56E、X61G、X61W、X62A、X62L、X62N、X62S、X117V、X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X126C、X126I、X136K、X136L、X136M、X150L、X152A、X152F、X152R、X152W、X155I、X155L、X199L、X199V、X209F、X209M、X209Q、X209V、X215H、X215L、X223S、X223T、X223V、X269L、X273H、X282I、X282L、X282V、X284A、X284P、X284S、X284T、X284V、和X296D。在一些实施方案中,能够在高度严格条件下杂交的多核苷酸编码具有上面描述的百分比同一性以及与SEQ ID NO:4相比选自以下的一个或多个残基差异的转氨酶多肽:X12H、X13A、X13F、X52H、X54A、X54L、X56D、X56E、X61G、X61W、X62A、X62L、X62N、X62S、X64C、X68I、X72A、X80Q、X84T、X103G、X115R、X117V、X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X126C、X126I、X127T、X128A、X134S、X136K、X136L、X136M、X139E、X140K、X143V、X150L、X152A、X152F、X152R、X152W、X155I、X155L、X159G、X168R、X176C、X192A、X192G、X192H、 X192K、X192N、X192Q、X192R、X192S、X196L、X196V、X199L、X199V、X208K、X209F、X209M、X209Q、X209V、X215H、X215L、X223S、X223T、X223V、X227I、X231T、X266N、X269L、X273H、X282I、X282L、X282V、X284A、X284P、X284S、X284T、X284V、X295S、X296D、X300G、X311T、X312C、X320G、X324Q、X325P、X325V、和X327L。
在一些实施方案中,多核苷酸编码本文描述的多肽,但具有在核苷酸水平上与编码工程化转氨酶多肽的参考多核苷酸约50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自具有SEQ ID NO:5-853中的奇数序列标识符的序列。
编码工程化转氨酶多肽的分离的多核苷酸可以以多种方式操作以提供多肽的表达,包括通过密码子优化以改进表达的另外的序列变更、在有或没有另外的控制序列的情况下的适合表达的***、和转化入适合于该多肽的表达和生产的宿主细胞。
取决于表达载体,所分离的多核苷酸在其***载体中之前的操作可能是令人期望的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。在Sambrook等人,2001,Molecular Cloning:A Laboratory Manual,第3版,Cold SpringHarbor Laboratory Press;以及Current Protocols in Molecular Biology,Ausubel.F.编著,Greene Pub.Associates,1998,更新至2010中提供了指导。
本文公开的多核苷酸还可以包括启动子序列,这取决于所使用的特定细胞生产体系。对于细菌宿主细胞,用于指导本公开内容的核酸构建体的转录的适合的启动子包括获自以下的启动子以及其他:大肠杆菌(E.coli)的乳糖操纵子、天蓝色链霉菌(Streptomycescoelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热芽孢杆菌(Bacillus stearothermophilus)淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因 (penP)、枯草芽孢杆菌xylA和xylB基因和原核的β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.NatlAcad.Sci.USA75:3727-3731),以及tac启动子(DeBoer等人,1983,Proc.NatlAcad.Sci.USA80:21-25)。对于丝状真菌宿主细胞,用于指导本公开内容的核酸构建体的转录的适当的启动子包括获自以下的基因的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO96/00787)以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶的基因的启动子的杂合体)和其突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子可以来自以下的基因:酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其它有用的启动子由Romanos等人,1992,Yeast8:423-488描述。
控制序列还可以是适当的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸序列的3’末端。在选择的宿主细胞中有功能的任何终止子可以用于本公开内容。例如,用于丝状真菌宿主细胞的示例性转录终止子可以获自以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以获自以下的基因:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其它有用的终止子由上述Romanos等人,1992描述。
控制序列还可以是适当的前导序列,mRNA的非翻译区,其对于由宿主细胞翻译是重要的。前导序列可操作地连接到编码多肽的核酸序列的5’末端。可以使用在选择的宿主细胞中有功能的前导序列。示例性的细菌前 导序列可以使用pelB前导序列(Lei等人,1987,J Bacteriol.169(9):4379-4383)和萤光假单胞菌的dsbA、dsbC、Bce、CupA2、CupB2的前导序列(美国专利号7,618,799)。用于丝状真菌宿主细胞的示例性前导序列获自以下的基因:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的适当的前导序列获自以下的基因:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油激酶、酿酒酵母α因子和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是多腺苷酸序列,所述多腺苷酸序列是可操作地连接到核酸序列的3’末端的序列,并且当转录时,被宿主细胞识别为将聚腺苷残基加到转录的mRNA的信号。在选择的宿主细胞中有功能的任何多腺苷酸序列可以用于本公开内容。用于丝状真菌宿主细胞的示例性多腺苷酸序列可以获自以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸序列由Guo和Sherman,1995,Mol Cell Bio15:5983-5990描述。示例性的哺乳动物多腺苷酸序列可以参见Zhang等人,2005,Nucleic Acids Res.33:D116–D120。
控制序列还可以是信号肽编码区,其编码与多肽的氨基末端连接的氨基酸序列并将编码的多肽引导入细胞的分泌通路。核酸序列的编码序列的5’末端可以本身包括信号肽编码区,其与编码分泌的多肽的编码区的区段以翻译读码框天然地连接。可选地,编码序列的5’末端可以包含对于编码序列是外来的信号肽编码区。当编码序列天然不含信号肽编码区时,可能需要外来信号肽编码区。
可选地,外来信号肽编码区可以简单地替换天然信号肽编码区以增强多肽的分泌。然而,将表达的多肽引导入选择的宿主细胞的分泌通路的任何信号肽编码区可以被使用。用于细菌宿主细胞的有效的信号肽编码区是获自以下的基因的信号肽编码区:芽孢杆菌(Bacillus)NClB11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiol Rev57:109-137描述。用于丝状真菌宿主细胞的有效的信号肽编码区可以是获自以下的基因的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和柔毛腐质霉(Humicola lanuginosa)脂肪酶。用于酵母宿主细胞的有用的信号肽可以来自酿酒酵母α因子和酿酒酵母转化酶的基因。其它有用的信号肽编码区由上述Romanos等人,1992描述。
控制序列还可以是前肽编码区,其编码定位在多肽的氨基末端的氨基酸序列。产生的多肽称为前酶(pro-enzyme)或前多肽(或在一些情况中酶原(zymogen))。通过从前多肽催化或自动催化裂解前肽,前多肽可以被转化成成熟的活性多肽。前肽编码区可以获自以下的基因:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(WO95/33836)。当信号肽和前肽区均存在于多肽的氨基末端时,前肽区定位为紧邻多肽的氨基末端并且信号肽区定位为紧邻前肽区的氨基末端。
加入调节序列还可以是期望的,调节序列允许关于宿主细胞的生长调节多肽的表达。调节***的实例是引起响应化学或物理刺激物(包括调节化合物的存在)而开启或关闭基因的表达的那些调节***。在原核宿主细胞中,适当的调节序列包括lac、tac和trp操纵子***。在酵母宿主细胞中,适当的调节***包括,作为实例的ADH2***或GAL1***。在丝状真菌中,适当的调节序列包括TAKAα-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子和米曲霉葡萄糖淀粉酶启动子。调节序列的其它实例是允许基因扩增的那些。在真核***中,这些包括二氢叶酸还原酶基因,其在氨甲喋呤的存在下被扩增;和金属硫蛋白基因,其用重金属扩增。在这些情况中,编码本公开内容的多肽的核酸序列将与调节序列可操作地连接。
在另一方面,本公开内容还涉及重组表达载体,取决于它们被引入的宿主的类型,重组表达载体包括编码工程化转氨酶多肽的多核苷酸或其变体,和一种或多种表达调节区诸如启动子和终止子,复制起点等。上面描述的各种核酸和控制序列可以连接在一起以产生重组表达载体,其可以包 括一个或多个方便的限制位点以允许编码多肽的核酸序列在这些位点的***或置换。可选地,本公开内容的核酸序列可以通过将核酸序列或包括所述序列的核酸构建体***适当的表达载体来表达。在产生表达载体中,编码序列位于载体中以使编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经历重组DNA程序并且可以引起多核苷酸序列的表达。载体的选择将通常取决于载体与载体将被引入的宿主细胞的相容性。载体可以是线性的或闭合的环状质粒。表达载体可以是自主复制载体,即,作为染色体外的实体存在的载体,其复制独立于染色体复制,自主复制载体例如质粒、染色体外元件、微型染色体或人工染色体。载体可以包含用于保证自身复制的任何工具(means)。可选地,载体可以是当被引入宿主细胞时,被整合进入基因组并与其被整合进入的染色体一起复制的载体。此外,可以使用单一载体或质粒或一起包括待引入宿主细胞的基因组的总DNA的两种或更多种载体或质粒,或转座子。
本公开内容的表达载体可以包括一个或多个可选择的标记物,其使得容易选择转化细胞。可选择的标记物是基因,其产物提供杀生物剂或病毒抗性,对重金属的抗性,营养缺陷型的原养型以及类似性质。细菌的可选择的标记物的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性如氨苄西林、卡那霉素、氯霉素或四环素抗性的标记物。用于酵母宿主细胞的适当的标记物是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的可选择的标记物包括但不限于:amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草胺膦乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合成酶)以及其等同物。用于曲霉细胞的实施方案包括构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本公开内容的表达载体还可以包括以下的元件,其允许载体整合进入宿主细胞的基因组或允许载体在细胞中独立于基因组而自主复制。对于整 合进入宿主细胞基因组,载体可以依赖于编码多肽的核酸序列或用于通过同源的或非同源的重组将载体整合进入基因组的载体的任何其它元件。
可选地,表达载体可以包括用于指导通过同源重组整合进入宿主细胞的基因组的另外的核酸序列。另外的核酸序列能够使载体在染色体中精确的位置被整合进入宿主细胞基因组。为了增加在精确的位置的整合的可能性,整合元件应当优选地包括足够的数目的核酸,诸如100至10,000个碱基对,优选地400至10,000个碱基对,和最优选地800至10,000个碱基对,其与相应的靶序列高度同源以提高同源重组的可能性。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码核酸序列。在另一方面,载体可以通过非同源的重组被整合进入宿主细胞的基因组。
对于自主复制,载体还可以包括能够使载体在相关的宿主细胞中自主复制的复制起点。细菌的复制起点的实例是允许在大肠杆菌中复制的P15Aori、或质粒pBR322、pUC19、pACYCl77(该质粒具有P15A ori)或质粒pACYC184的复制起点,以及允许在芽孢杆菌中复制的pUB110、pE194、pTA1060或pAMβ1的复制起点。用于酵母宿主细胞的复制起点的实例是2微米的复制起点ARS1、ARS4、ARS1与CEN3的组合以及ARS4与CEN6的组合。复制起点可以是具有使得其在宿主细胞中以温度敏感方式起作用的突变的复制起点(参见,例如Ehrlich,1978,Proc Natl Acad Sci.USA75:1433)。
可以将多于一个拷贝的本公开内容的核酸序列***宿主细胞中以提高基因产物的生产量。核酸序列拷贝数的增加可以通过如下方式获得:通过将该序列的至少一个另外的拷贝整合到宿主细胞基因组中,或者通过使该核酸序列包括可扩增的可选择的标记基因,其中可以通过在适当选择剂的存在下培养细胞来选择包括该可选择的标记基因的扩增拷贝和由此包括该核酸序列的另外拷贝的细胞。
可与本公开内容的实施方案一起使用的许多表达载体可商购获得。适当的商业表达载体包括来自Sigma-Aldrich Chemicals的p3xFLAGTMTM表达载体,它包括用于在哺乳动物宿主细胞中表达的CMV启动子和hGH多 腺苷酸化位点以及用于在大肠杆菌中扩增的pBR322复制起点和氨苄西林抗性标记物。其它适当的表达载体是可从Stratagene,LaJollaCA商购获得的pBluescriptII SK(-)和pBK-CMV,以及源自于pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)或pPoly的质粒(Lathe等人,1987,Gene57:193-201)。
示例性表达载体可以通过将编码改进的转氨酶的多核苷酸可操作地连接入含有在lacI阻遏物的控制下的lac启动子的质粒pCK110900I来制备。表达载体还含有P15a复制起点和氯霉素抗性基因。
在另一个方面,本公开内容提供了包括编码本公开内容的改进的转氨酶多肽的多核苷酸的宿主细胞,该多核苷酸与用于在该宿主细胞中表达转氨酶的一个或多个个控制序列可操作地连接。在表达由本公开内容的表达载体编码的多肽中使用的宿主细胞是本领域熟知的并且包括但不限于:细菌细胞,诸如大肠杆菌、节杆菌Arthrobacter sp.KNK168、链霉菌属和鼠伤寒沙门氏菌(Salmonella typhimurium)的细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC保藏号201178));昆虫细胞诸如果蝇S2细胞和夜蛾(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、293和Bowes黑色素瘤细胞;以及植物细胞。示例性宿主细胞是大肠杆菌W3110(ΔfhuA)。用于上面描述的宿主细胞的适当培养基和生长条件是本领域熟知的。
可以通过本领域已知的多种方法将用于表达转氨酶的多核苷酸引入细胞中。技术包括电穿孔、生物射弹粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合以及其他。用于将多核苷酸引入细胞中的多种方法对技术人员将是明显的。
5.6产生工程化转氨酶多肽的方法
在一些实施方案中,为了制备本公开内容的改进多核苷酸和多肽,催化氨基转移反应的天然存在的转氨酶获自(或得自)节杆菌Arthrobacter sp.KNK168。在一些实施方案中,亲本多核苷酸序列是密码子优化的以增强特定的宿主细胞中转氨酶的表达。编码节杆菌Arthrobacter sp.KNK168的野生型多肽的亲本多核苷酸序列已被描述(参见例如,Iwasaki等人,Appl. Microbiol.Biotechnol.,2006,69:499-505)。基于这个亲本序列的工程化转氨酶的制剂也被描述于美国专利公布号2010/0285541A1和公布的国际申请WO2010/099501。
工程化转氨酶可以通过使编码天然存在的转氨酶的多核苷酸经历诱变和/或定向进化方法而获得,如上面所讨论的。示例性的定向进化技术是诱变和/或DNA改组,如Stemmer,1994,Proc Natl Acad Sci USA91:10747-10751;WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;WO01/75767和美国专利6,537,746中所描述。可以使用的其它定向进化程序包括交错延伸过程(StEP)、体外重组(Zhao等人,1998,Nat.Biotechnol.16:258–261)、诱变PCR(Caldwell等人,1994,PCR Methods Appl.3:S136-S140)、和盒式诱变(Black等人,1996,Proc Natl Acad Sci USA93:3525-3529)以及其他。可用于本文目的的诱变和定向进化技术也被描述在以下文献中:例如,Ling等人,1997,Anal.Biochem.254(2):157-78;Dale等人,1996,“Oligonucleotide-directed randommutagenesis using the phosphorothioate method”,于Methods Mol.Biol.57:369-74;Smith,1985,Ann.Rev.Genet.19:423-462;Botstein等人,1985,Science229:1193-1201;Carter,1986,Biochem.J.237:1-7;Kramer等人,1984,Cell,38:879-887;Wells等人,1985,Gene34:315-323;Minshull等人,1999,Curr Opin Chem Biol3:284-290;Christians等人,1999,Nature Biotech17:259-264;Crameri等人,1998,Nature391:288-291;Crameri等人,1997,Nature Biotech15:436-438;Zhang等人,1997,Proc Natl Acad Sci USA94:45-4-4509;Crameri等人,1996,Nature Biotech14:315-319;Stemmer,1994,Nature370:389-391;Stemmer,1994,Proc Natl Acad Sci USA91:10747-10751;PCT公布号WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;和WO01/75767和美国专利号6,537,746。所有出版物和专利通过引用并入本文。
诱变处理后获得的克隆可被筛选用于具有期望的改进的酶特性的工程化转氨酶。使用标准生物化学技术,诸如在产物胺的OPA衍生化之后HPLC分析,可以进行测量来自表达文库的酶活性。
当期望的改进的酶特性是热稳定性时,可以在使酶制剂经历定义的温度并测量热处理之后剩余的酶活性的量之后测量酶活性。然后包括编码转氨酶的多核苷酸的克隆被分离,测序以鉴定核苷酸序列变化(如果有的话),并且用于在宿主细胞中表达酶。
当工程化多肽的序列是已知的时,编码酶的多核苷酸可以根据已知的合成方法通过标准的固相方法被制备。在一些实施方案中,多至约100个碱基的片段可以被单独地合成,然后连接(例如,通过酶或化学连接方法(chemical litigation method)或聚合酶介导的方法)以形成任何期望的连续序列。例如,使用例如由Beaucage等人,1981,Tet Lett22:1859-69描述的经典的亚磷酰胺法或由Matthes等人,1984,EMBO J.3:801-05描述的方法,例如,如通常在自动合成方法中所实践的,本公开内容的多核苷酸和寡核苷酸可以通过化学合成被制备。根据亚磷酰胺方法,寡核苷酸被例如在自动的DNA合成器中合成,纯化,退火,连接和克隆入适当的载体。另外,基本上任何核酸可以获自多种商业来源中的任一种。
在一些实施方案中,本公开内容还提供用于制备或制造能够在适当的反应条件下将化合物2转化为化合物1的工程化转氨酶多肽的方法,其中所述方法包括在适合表达多肽的培养条件下培养能够表达编码工程化多肽的多核苷酸的宿主细胞。在一些实施方案中,用于制备多肽的方法还包括分离多肽。工程化多肽可以在适当的细胞(如上面描述的)中表达,并使用用于蛋白纯化的熟知技术中的任何一种或多种从宿主细胞和/或培养基分离(回收),用于蛋白纯化的熟知技术包括溶菌酶处理、超声处理、过滤、盐析、超离心和色谱法以及其他。用于分离多肽的色谱方法包括,反相色谱法、高效液相色谱法、离子交换色谱法、凝胶电泳和亲和色谱法以及其他。用于纯化具体的工程化多肽的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等的因素,并且对于本领域技术人员将是明显的。
5.7使用工程化转氨酶的方法和用其制备的化合物
在另一个方面中,本文公开的工程化转氨酶多肽可以在用于将底物化合物2或其结构类似物转化为化合物1或相应结构类似物的产物的方法中 被使用。随后的化合物1在转氨酶反应的反应条件下原位的环化或作为单独的步骤的环化产生相应的内酰胺、或内酰胺类似物。通常化合物1的结构类似物涵盖于结构式I中,
其中
L是离去基团;
A是任选地取代的环烷基、杂环烷基、芳基、杂芳基、稠合芳基或稠合杂芳基;
R1是H或任选地取代的烷基;
Q是O或S;
M是-CRaRb-,其中每个M独立于其它M并且Ra和Rb选自H、卤素、-ORC、-SRC、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,并且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;以及
n为从0至4的整数。
因此,在一些实施方案中,用于上述式I的化合物的制备的方法,可包括在适当的反应条件下在氨基供体的存在下使式II的化合物与本公开内容的转氨酶多肽接触,
其中,L、A、R1、Q、M和n在上面被定义。
离去基团L可以包括可以被亲核的氨基取代的任何适当的基团。在一些实施方案中,L选自Cl、Br、-ORf、-OC(O)Rf、-SRf、和-OPO3,其中每一个Rf,独立于其它Rf,选自(C1-C6)烷基或芳基。在一些实施方案中,L是-ORf,其中Rf选自任选地取代的甲基、乙基、正丙基、正丁基、异丁基、仲丁基、和叔丁基。
在一些实施方案中,A是任选地取代的芳基或杂芳基。示例性的芳基或杂芳基可以选自任选地取代的苯基、吡啶基、吲哚基和萘基以及其他。
当存在时,A上的取代基可以包括任何酶相容的基团。在一些实施方案中,A可以具有选自以下的一个或多个取代基:H、-COOH、-ORg、-SO2、-SRh、-NRiRj、-NO2、-CN、卤素、烷基、环烷基、杂环烷基、芳基和杂芳基,其中Rg、Rh、Ri和Rj选自H和(C1-C6)烷基。
在一些实施方案中,R1是任选地取代的(C1-C6)烷基。示例性的烷基可以选自任选地取代的甲基、乙基、正丙基、2-丙基、正丁基和2-丁基。
在一些实施方案中,用于M的Ra和Rb选自H和-NRdRe,其中Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团。
在上述实施方案中,当取代基包括胺保护基团时,保护基团可以选自叔丁氧羰基(Boc)、9-芴甲氧羰基(Fmoc)、三氯乙基氯甲酸酯基(Troc)、对甲氧基苄基羰基(Moz)、3,4-二甲氧基苄基(DMPM)、对甲氧基苄基(Pmb)、甲苯磺酰基(Ts)和苄氧羰基(CBZ)。其它胺保护基团描述于Wuts和Greene,“Greene’s Protective Groups in Organic Synthesis”第四版,Wiley Interscience(2006)中。
式II中的基团M的数目“n”可以被改变,特别是对于制备取代的内酰胺化合物,如下面进一步描述。n的值可以是从0到4,尤其是1、2、3或4,且更特别是2或3。
在方法的一些实施方案中,式II的化合物可包括式IIa的化合物,
其中L、A和R1如上所定义,以产生式Ia的化合物。
在方法的一些实施方案中,式II的化合物包括式IIb的化合物
其中
L、A和R1如上所定义,且
R2和R2’选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;
以产生式Ib的化合物。
在方法的一些实施方案中,式II的化合物包括式IIc的化合物,
其中,
L、A和R1如上所定义;
R2、R2’、R3和R3’选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳烷基、杂芳基烷基和保护基团;
以产生式Ic的化合物。
在方法的一些实施方案中,式II的化合物包括式IId的化合物,
其中,
L、A和R1如上所定义;
R2、R2’、R3、R3’、R4和R4’选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂 环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;
以产生式Id的化合物。
在方法的一些实施方案中,式II的化合物包括式IIc1的化合物,
其中
L和R1如上定义;
R2选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;且
R5、R6、R7、R8和R9选自H、-COOH、-ORg、-SO2、-SRh、-NRiRj、-NO2、-CN、卤素、烷基、环烷基、杂环烷基、芳基和杂芳基,其中Rg、Rh、Ri和Rj选自H和(C1-C6)烷基,
以产生式Ic1的化合物。
在方法的一些实施方案中,式II的化合物包括式2p的化合物,
其中PG是保护基团,以产生式1p的化合物。
在方法的一些实施方案中,式II的化合物包括式2q的化合物,
其中,化合物具有两个保护基团PG,以产生式1q的化合物。
在方法的一些实施方案中,式II的化合物包括式IId1的化合物,
其中,
L和R1如上定义;
R2选自H、卤素、-ORC、-SRC、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、 杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;且
R5、R6、R7、R8和R9选自H、-COOH、-ORg、-SO2、-SRH、-NRiRj、-NO2、-CN、卤素、烷基、环烷基、杂环烷基、芳基和杂芳基,其中Rg、Rh、Ri和Rj选自H和(C1-C6)烷基,
以产生式Id1的化合物。
在方法的一些实施方案中,式II的化合物包括式IId2的化合物,
其中,
R5、R6、R7、R8和R9选自H、-COOH、-ORg、-SO2、-SRh、-NRiRj、-NO2、-CN、卤素、烷基、环烷基、杂环烷基、芳基和杂芳基,其中Rg、Rh、Ri和Rj选自H和(C1-C6)烷基,且
PG是保护基团,
以产生式Id2的化合物。
如本文所提到的,转氨酶多肽的一些实施方案能够以相比于化合物1b和化合物1c大于8:1的非对映体比将化合物2转化为化合物1d和化合物1a。如将被本领域技术人员理解,这些转氨酶多肽可以以非对映体过量被用于产生结构类似物。因此,在一些实施方案中,所公开的多肽可在以相比于化合物1b1和化合物1c1大于8:1的非对映体比制备化合物1d1和化合物1a1的方法中被使用,
其中PG为保护基团,其中所述方法包括使底物化合物2p,
在适当的反应条件下在氨基供体的存在下,与具有对化合物1d1和化合物1a1的非对映体选择性的指示水平的本文描述的转氨酶多肽接触。如本文描述的,示例性多肽包括SEQ ID NO:6、10、12、14、16、18、20、22、24、26、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、和偶数序列标识符SEQ ID NO:306-854的多肽。
此外,在一些实施方案中,转氨酶多肽可在以化合物1a1的非对映体过量制备化合物1d1的方法中被使用,其中所述方法包括使式2p的化合物在适当的反应条件下在氨基供体的存在下与具有相比于对化合物1a1对化合物1d1的非对映体选择性的指示水平的本文描述的多肽接触。具有相比于对化合物1a1对化合物1d1的非对映体选择性的示例性多肽包括SEQ ID NO:6、14、22、24和28。
在一些实施方案中,转氨酶多肽可在以化合物1d1的非对映体过量制备化合物1a1的方法中被使用,其中所述方法包括使式2p的化合物在适当的反应条件下在氨基供体的存在下与具有相比于对化合物1d1对化合物1a1的非对映体选择性的本文描述的转氨酶多肽接触。具有相比于对化合物1d1对化合物1a1的非对映体选择性的示例性转氨酶多肽包括SEQ ID NO:16、18、20、26、34、42、46、56、58、60、62、64、68、70、72、74、76、78、80、82、84、和偶数序列标识符SEQ ID NO:306-854的多肽。
如本文所述,并在实施例中所示,本公开内容涵盖可以在本文方法中使用的适当的反应条件的范围,包括但不限于,pH、温度、缓冲液、溶剂***、底物载量、底物化合物立体异构体的混合物、多肽载量、辅因子载量、压力和反应时间的范围。用于使用本文所述的工程化转氨酶多肽进行用于将底物化合物生物催化转化为产物化合物的方法的另外的适当的反应条件可易于通过常规实验来优化,常规实验包括但不限于:使工程化转氨酶多肽与底物化合物在浓度、pH、温度、溶剂条件的实验反应条件下接触,并且例如使用本文提供的实施例中描述的方法检测产物化合物。
如上面描述的,在本公开内容的方法中使用的工程化转氨酶多肽通常包括以下氨基酸序列,该氨基酸序列具有与选自SEQ ID NO:6-854中的偶数序列标识符中的任何一个的参考氨基酸序列至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性,以及(a)与SEQ ID NO:4相比在选自以下的残基位置上的一个或多个氨基酸残基差异:X6、X10、X12、X13、X17、X21、X22、X29、X31、X34、X43、X47、X64、X66、X68、X72、X80、X84、X85、X88、X97、X103、X115、X127、X128、X131、X134、X139、X140、X142、X143、X159、X161、X168、X176、X179、X185、X190、X191、X192、X196、X208、X210、X227、X231、X233、X234、X241、X265、X266、X270、X274、X295、X300、X305、X308、X309、X311、X312、X316、X319、X320、X323、X324、X325、和X327,或(b)与SEQ ID NO:4相比 选自以下的一个或多个氨基酸残基差异:X52H、X54A、X54L、X56D、X56E、X61G、X61W、X62A、X62L、X62N、X62S、X117V、X122F、X122W、X122Y、X124K、X124M、X124S、X124W、X126C、X126I、X136K、X136L、X136M、X150L、X152A、X152F、X152R、X152W、X155I、X155L、X199L、X199V、X209F、X209M、X209Q、X209V、X215H、X215L、X223S、X223T、X223V、X269L、X273H、X282I、X282L、X282V、X284A、X284P、X284S、X284T、X284V、和X296D。在一些实施方案中,转氨酶多肽具有上面描述的百分比同一性以及与SEQ ID NO:4相比选自以下的一个或多个残基差异:X2M;X4F,X4L,X4Y;X5C,X5F,X5I,X5H,X5K,X5L,X5M,X5N,X5P,X5S,X5T,X5V,X5Y;X6F,X6R,X6S,X6T;X8H;X9L,X9I,X9Q,X9F;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X42G;X43S;X47R;X48G,X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X84T;X85L;X88W;X97P;X102T,X102W;X103G,X103N;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T;X127T;X128A;X131F;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T;X142M;X143V;X146R;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X159G;X160L;X161M;X165N;X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X192A,X192G,X192H,X192K,X192N,X192Q,X192R,X192S;X196L,X196V;X199L,X199V;X208K;X209F,X209M,X209Q,X209V;X210G,X210S;X215F,X215H,X215L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X265Y,X265W;X266N;X267V;X269L, X269T;X270R;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296R,X296S,X296W;X300G,X300L;X305Q;X308A;X309W,X309L;X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L;和X329P。
在将化合物2转化为化合物1(包括其各种非对映体和类似物)中本文公开的工程化转氨酶多肽的改进的活性和/或立体选择性,提供其中较高百分比转化率可以用较低浓度的工程化转氨酶实现的方法,并且还降低残留蛋白的量,该残留蛋白可能需要在用于纯化产物化合物(例如,化合物1),以及如本文中进一步描述的,用于纯化相应环状化合物的随后步骤中被除去。在方法的一些实施方案中,适当的反应条件包括以下的工程化多肽浓度:约0.1至约40g/L、约0.5至约20g/L、约1.0至约10g/L、约2至约5g/L、约40g/L或更少、约20g/L或更少、约15g/L或更少、约10g/L或更少、约5g/L或更少、约3g/L或更少、约2g/L或更少、约1.5g/L或更少、约1.0g/L或更少、约0.75g/L或更少。
考虑到例如,产物化合物的需要量、底物浓度对酶活性的影响、酶在反应条件下的稳定性、以及底物至产物的百分比转化率,在反应混合物中的底物化合物可以被改变。在方法的一些实施方案中,适当的反应条件包括以下的底物化合物载量:至少约0.5至约200g/L、1至约200g/L、5至约150g/L、约10至约100g/L、或约50至约100g/L。在一些实施方案中,适当的反应条件包括以下的底物化合物载量:至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L、至少约30g/L、至少约50g/L、至少约75g/L、至少约100g/L、至少约150g/L或至少约200g/L、或甚至更大。本文中提供的底物载量的值是基于化合物2的分子量,然而还设想,等摩尔量的化合物2的各种水合物和盐还可以在方法中被使用。此外,由式IIa、IIb、IIc、IId、IIc1、IIc2、IId1、IId2和2p涵盖的底物化合物,还可以根据针对化合物2使用的量以适当的量被使用。
在本文描述的方法中,转氨酶多肽使用氨基供体以形成产物化合物。在一些实施方案中,在反应条件中的氨基供体包括选自以下的化合物:异丙胺(在本文中还称为“IPM”)、腐胺、L-赖氨酸、α-苯乙胺、D-丙氨酸、L-丙氨酸、或D,L-丙氨酸、或D,L-鸟氨酸。在一些实施方案中,氨基供体选自由以下组成的组:IPM、腐胺、L-赖氨酸、D-丙氨酸或L-丙氨酸。在一些实施方案中,氨基供体是IPM。在一些实施方案中,适当的反应条件包括氨基供体,特别是以以下浓度存在的IPM:至少约0.1至约3.0M、0.2至约2.5M、约0.5至约2M或约1至约2M。在一些实施方案中,氨基供体以以下浓度存在:约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、1、1.5、1.5、2.5或3M。
用于方法的适当的反应条件,通常还包括辅因子在反应混合物中的存在。因为工程化转氨酶通常使用维生素B6家族的成员,反应条件可以包括选自以下的辅因子:吡哆醛-5’-磷酸(还称为吡哆醛磷酸、PLP、P5P)、吡哆素(PN)、吡哆醛(PL)、吡哆胺(PM)、和它们的磷酸化的对应物;磷酸吡哆醇(PNP)、和磷酸吡哆胺(PMP)。在一些实施方案中,适当的反应条件可以包括选自PLP、PN、PL、PM、PNP、和PMP的辅因子以以下浓度的存在:约0.1g/L至约10g/L、约0.2g/L至约5g/L、约0.5g/L至约2.5g/L。在一些实施方案中,辅因子是PLP。因此,在一些实施方案中,适当的反应条件可以包括辅因子PLP以以下浓度的存在:约0.1g/L至约10g/L、约0.2g/L至约5g/L、约0.5g/L至约2.5g/L。在一些实施方案中,反应条件包括以下的PLP浓度:约10g/L或更少、约5g/L或更少、约2.5g/L或更少、约1.0g/L或更少、约0.5g/L或更少、或约0.2g/L或更少。
在方法(例如,使用全细胞或溶解产物时)的一些实施方案中,辅因子天然存在于细胞提取物,并且不需要被补充。在方法(例如,使用部分纯化的、或纯化的转氨酶)的一些实施方案中,该方法还可以包括添加辅因子至酶反应混合物的步骤。在一些实施方案中,辅因子在反应开始时被添加和/或另外的辅因子在反应过程中被添加。
在氨基转移反应的过程中,反应混合物的pH可以变化。反应混合物 的pH可以被维持在期望的pH或在期望的pH范围内。这可以通过在反应的过程之前和/或期间加入酸或碱来实现。可选地,pH可以通过使用缓冲液来控制。因此,在一些实施方案中,反应条件包括缓冲液。用于维持期望的pH范围的适当的缓冲液是本领域已知的且包括,通过举例的方式而非限制,硼酸盐缓冲液、碳酸盐缓冲液、磷酸盐缓冲液、三乙醇胺缓冲液和类似缓冲液。在一些实施方案中,缓冲液是硼酸盐。在方法的一些实施方案中,适当的反应条件包括硼酸盐的缓冲溶液,其中硼酸盐浓度是从约0.01至约0.4M、0.05至约0.4M、0.1至约0.3M、或约0.1至约0.2M。在一些实施方案中,反应条件包括以下的硼酸盐浓度:约0.01、0.02、0.03、0.04、0.05、0.07、0.1、0.12、0.14、0.16、0.18、0.2、0.3、或0.4M。在一些实施方案中,反应条件包括作为适当的溶剂的水,没有缓冲液存在。
在方法的一些实施方案中,反应条件可以包括适当的pH。如上所提及的,期望的pH或期望的pH范围可以通过使用酸或碱、适当的缓冲液、或缓冲液和酸或碱添加的组合来维持。反应混合物的pH可以在反应的过程之前和/或期间被控制。在一些实施方案中,适当的反应条件包括约8至约12.5的溶液pH、约8至约12的pH、约9至约11.5的pH、或约9.5至约11.0的pH。在一些实施方案中,反应条件包括约8、8.5、9、9.5、10、10.5、11、11.5、12或12.5的溶液pH。
在本文方法的实施方案中,例如,考虑到:在较高的温度下反应速率的增加、对于充足的反应持续时间的酶的活性的增加、以及如下文进一步描述的,底物非对映体的差向异构化的增加速率(用于动态动力学拆分的目的),适当的温度可以用于反应条件。例如,本公开内容的工程化多肽具有相对于天然存在的转氨酶多肽例如SEQ ID NO:2的野生型多肽增加的稳定性,这允许工程化多肽以较高的温度用于反应的增加的转化率和改进的底物可溶性特性。因此,在一些实施方案中,适当的反应条件包括以下的温度:约10℃至约70℃、约10℃至约65℃、约15℃至约60℃、约20℃至约60℃、约20℃至约55℃、约30℃至约55℃、或约40℃至约50℃。在一些实施方案中,适当的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、或70℃的温度。 在一些实施方案中,酶促反应过程中的温度可以在整个反应过程中保持在一个温度。在一些实施方案中,酶促反应过程中的温度可以在反应过程中被调节超过温度分布。
在方法的一些实施方案中,适当的反应条件还可以包括还原型辅因子、烟酰胺腺嘌呤二核苷酸(NADH)的存在,其可以用来限制转氨酶的失活(参见例如,van Ophem等人,1998,Biochemistry37(9):2879-88)。在这样的实施方案中,当NADH存在时,辅因子再生***,诸如葡萄糖脱氢酶(GDH)和葡萄糖或甲酸脱氢酶和甲酸盐可以被用于再生反应介质中的NADH。
使用工程化转氨酶的方法通常在溶剂中进行。适当的溶剂包括水、缓冲水溶液、有机溶剂、和/或共溶剂***,其通常包括含水溶剂和有机溶剂。含水溶剂(水或含水的共溶剂***)可以是pH缓冲的或无缓冲的。在一些实施方案中,使用工程化转氨酶多肽的方法通常在包括有机溶剂(例如,乙醇、异丙醇(IPA)、二甲基亚砜(DMSO)、乙酸乙酯、乙酸丁酯、1-辛醇烷、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯以及类似物)、离子液体(例如,1-乙基4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓六氟磷酸盐以及类似物)的含水共溶剂***中进行。含水的共溶剂***的有机溶剂组分可以是与含水组分易混溶的,提供单一的液相,或可以是与含水组分部分地易混溶的或不易混溶的,提供两个液相。示例性的含水的共溶剂***包括水和一种或多种有机溶剂。大体上,含水的共溶剂***的有机溶剂组分被选择为使得其不使转氨酶完全失活。适当的共溶剂***可以通过使用酶活性测定,如本文描述的那些,用界定的感兴趣的底物在候选溶剂***中测量特定的工程化转氨酶的酶促活性来容易地确定。在方法的一些实施方案中,适当的反应条件包括含水的共溶剂,该含水的共溶剂包括以下浓度的DMSO:约1%至约80%(v/v)、约1%至约70%(v/v)、约2%至约60%(v/v)、约5%至约40%(v/v)、10%至约40%(v/v)、10%至约30%(v/v)、或约10%至约20%(v/v)。在方法的一些实施方案中,适当的反应条件包括含水的共溶剂,该含水的共溶剂包括至少约1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、 55%、60%、65%、70%、75%、或80%(v/v)的浓度的DMSO。
通常,使用工程化转氨酶多肽将各种底物化合物转化为它们的相应的产物化合物的方法可以进行,其中适当的反应条件包括底物化合物,该底物化合物包括底物化合物的立体异构体的各种混合物。因此,在一些实施方案中,底物化合物2可以包括一种或多种立体异构体2a、2a’、2b、2b’、2c、2c’、2d和2d’的混合物。如本文所提及的,在某些条件下,化合物2的底物能够在其各种立体异构体之间经历差向异构化反应,这在它们之间提供平衡(参见上述方案2)。因为本文公开的工程化转氨酶多肽可以展现对化合物1d、和/或化合物1d和化合物1a的高的立体选择性,在各种立体异构体之间的这种平衡提供进行立体异构体的动态动力学拆分(DKR)的能力,从而形成的产物化合物1d、和/或化合物1d和化合物1a的量大于反应开始时存在的相应的立体异构体底物,即化合物2d和化合物2a的量。因为DKR反应在至少pH9和45℃的条件下是有利的,所以方法的一些实施方案中的适当的条件还可以包括至少pH9.5、至少pH10、至少pH10.5、至少pH11.0、至少pH11.5的溶液pH,和至少45℃、至少50℃、至少55℃、至少60℃、或至少65℃的溶液温度。
适当的反应条件可以包括反应参数的组合,提供生物催化转化底物化合物为其相应的产物化合物。因此,在方法的一些实施方案中,反应参数的组合包括:(a)约10至100g/L的底物化合物的底物载量;(b)约1至40g/L的转氨酶多肽浓度;(c)约0.1至10M的IPM浓度;(d)约0.1至1g/L的PLP辅因子浓度;(e)约8.5至11的pH;以及(f)约30℃至60℃的温度。
在一些实施方案中,反应参数的组合包括:(a)约5g/L底物化合物,(b)约15g/L或更少的转氨酶多肽,(c)约20%(v/v)二甲基亚砜(DMSO),(d)约1M异丙胺(IPM),(e)约1g/L磷酸吡哆醛(PLP),(f)约0.2M硼酸盐,(g)约pH10.5,以及(h)约45℃。
在一些实施方案中,反应参数的组合包括:(a)约5g/L底物化合物,(b)约5g/L或更少的转氨酶多肽,(c)约20%(v/v)二甲基亚砜(DMSO),(d)约1M异丙胺(IPM),(e)约1g/L磷酸吡哆醛(PLP),(f)约0.2M硼酸盐,(g)约pH10.5,以及(h)约45℃。
在一些实施方案中,反应参数的组合包括:(a)约50g/L底物化合物,(b)约25g/L或更少的转氨酶多肽,(c)约50%(v/v)二甲基亚砜(DMSO),(d)约1M异丙胺(IPM),(e)约1g/L磷酸吡哆醛(PLP),(f)约0.2M硼酸盐,(g)约pH10.5,以及(h)约45℃。
另外的示例性的反应条件包括表2A、2B、2C、2D、2E、2F、2G、2H、和2I以及实施例1中提供的测定条件。
在进行本文描述的氨基转移反应中,工程化转氨酶多肽可以以部分纯化的或纯化的酶、用编码酶的基因转化的整个细胞、和/或作为细胞提取物和/或此类细胞的溶解产物被添加到反应混合物中。用编码工程化转氨酶的基因转化的整个细胞或其细胞提取物、溶解产物和分离的酶可以多种不同的形式被使用,包括固体(例如冻干的、喷雾干燥的以及类似的)或半固体(例如,未加工的糊)。细胞提取物或细胞溶解产物可以通过沉淀(例如,硫酸铵、聚乙烯亚胺、热处理或类似方法),随后脱盐程序(例如,超滤、渗析以及类似的),之后冻干来部分地纯化。任何酶制剂可以通过使用已知的交联剂,诸如例如戊二醛交联而被稳定或固定至固相材料(例如树脂、珠诸如壳聚糖、Eupergit C、SEPABEAD以及类似的)。
在本文描述的氨基转移反应的一些实施方案中,反应在本文描述的适当的反应条件下进行,其中工程化转氨酶多肽被固定至固体载体。可用于固定用于进行氨基转移反应的工程化转氨酶的固体载体包括但不限于,珠或树脂,该珠或树脂包括具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯。示例性固体载体包括但不限于,壳聚糖珠、Eupergit C、以及包括以下不同类型SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120的SEPABEAD(Mitsubishi)。
在一些实施方案中,当工程化多肽可以以分泌的多肽的形式表达时,可以在本文方法中使用含有分泌的多肽的培养基。
在一些实施方案中,可以以多种不同的形式向反应提供固体反应物(例如酶、盐等等),不同的形式包括粉末(例如冻干的、喷雾干燥的以及类似的)、溶液、乳液、悬浮液以及类似物。使用本领域普通技术人员 已知的方法和装置可以容易地冻干或喷雾干燥反应物。例如,蛋白溶液可以在-80℃以小份冷冻,然后加到预冷的冻干室中,随后应用真空。
在一些实施方案中,加入反应物的顺序不是关键的。可以在相同的时间将反应物一起加到溶剂中(例如单相溶剂、双相含水共溶剂***以及类似物),或可选地,反应物中的一些可以被单独地添加,并且一些反应物在不同的时间点一起添加。例如,辅因子、转氨酶和转氨酶底物可以被先加到溶剂中。当含水的共溶剂***被使用时,为了改进的混合效率,转氨酶和辅因子可以被首先加入并混合入水相。然后可以加入有机相并混合,随后加入转氨酶底物。可选地,在加入水相中之前,转氨酶底物可以在有机相中预混合。
在一些实施方案中,当氨基基团被转移到底物化合物,例如,IIa、IIb、IIc、IId、IIc1、IIc2、IId1、IId2、2、和2p时,方法还可以包括除去从氨基供体形成的羰基副产物的步骤。此类原位除去可以降低逆反应的速率,使得正向反应占优势,并且更多底物然后被转化为产物。羰基副产物的除去可以以许多方式进行。当氨基供体是氨基酸,诸如丙氨酸时,羰基副产物是酮酸,可通过与过氧化物反应而被除去(参见,例如,美国专利公布2008/0213845A1,通过引用并入本文)。可使用的过氧化物包括过氧化氢;过氧酸类(过酸)诸如过乙酸(CH3CO3H)、三氟过乙酸和间氯过氧苯甲酸;有机过氧化物诸如叔丁基过氧化物((CH3)3COOH)或其他选择性氧化剂诸如四丙基高钌酸铵、MnO2、KMnO4、四氧化钌和相关化合物以及其他。可选地,丙酮酸盐的去除可通过利用乳酸脱氢酶将其还原为乳酸盐,以将平衡转向产物胺来实现(参见,例如,Koszelewski等人,2008,Adv.Syn.Catal.350:2761-2766)。丙酮酸盐的去除还可通过利用丙酮酸脱羧酶将其脱羧为二氧化碳和乙醛来实现(参见,例如,等人,2008,Chem BioChem9:363-365)。
在一些实施方案中,当氨基供体的选择导致具有比水的蒸气压高的蒸气压的羰基副产物(例如,低沸点副产物诸如挥发性有机羰基化合物)时,羰基副产物可通过用非反应性气体喷射反应溶液,或通过施加真空来降低反应压力,并除去气相中存在的羰基副产物来除去。非反应性气体是不与 反应组分起反应的任何气体。各种非反应性气体包括氮气和稀有气体(例如,惰性气体)。在一些实施方案中,非反应性气体是氮气。在一些实施方案中,该方法中使用的氨基酸供体是异丙胺(IPM),其在向氨基受体转移氨基之后形成羰基副产物丙酮。丙酮可通过用氮气喷射或向反应溶液施加真空,并通过丙酮阱诸如冷凝器或其他冷阱从气相除去丙酮来除去。可选地,丙酮可通过使用酮还原酶还原为异丙醇来除去。
在除去羰基副产物的方法的一些实施方案中,在氨基转移反应期间可加入相应氨基供体以补充氨基供体和/或维持反应的pH。补充氨基供体还将平衡转移向产物形成,从而增加底物向产物的转化率。因此,在氨基供体是IPM并且丙酮产物被原位除去的一些实施方案中,方法还可以包括向反应溶液加入IPM以补充丙酮除去期间失去的氨基供体并维持反应的pH(例如,在约8.5至约pH11.5)的步骤。
可选地,在氨基酸用作氨基供体的实施方案中,酮酸羰基副产物可通过使用适当的氨基酸脱氢酶与氨和NADH反应来再循环为氨基酸,从而补充氨基供体。
如上面描述的,使用转氨酶多肽形成的产物化合物可以被环化,特别是制备取代的内酰胺化合物。在一些实施方案中,环化反应可以在转氨酶反应的适当的反应条件下且选择某些离去基团,特别是醇盐而进行。可选地,环化反应可以发生在不同于转氨酶反应的条件下,如下面进一步描述的。
因此,在一些实施方案中,用于制备式III的化合物的方法
其中,
A为任选地取代的环烷基、杂环烷基、芳基、杂芳基、稠合芳基或稠 合杂芳基;
R1是H或任选地取代的烷基;
Q为O或S;
M是-CRaRb-,其中每个M独立于其它M,且Ra和Rb都选自H、卤素、-ORC、-SRC、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re都选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;且
n是从0到4的整数,
包括(a)进行用于制备式I的化合物的上述方法中的任一种,
包括其具体的实施方案,以及(b)环化式I的化合物。
在一些实施方案中,式III的化合物包括式IIIa的化合物。
因此,本公开内容提供了用于制备式IIIa的化合物的方法,其中,
A为任选地取代的环烷基、杂环烷基、芳基、杂芳基、稠合芳基、或稠合杂芳基;以及
R1是H或任选地取代的(C1-C6)烷基,
包括:(a)进行用于产生式Ia的化合物的上述方法中的任一种,
以及(b)环化式Ia的化合物。
在一些实施方案中,式III的化合物包括式IIIb的化合物。
因此,本公开内容提供了用于制备式IIIb的化合物的方法,其中,
A为任选地取代的环烷基、杂环烷基、芳基、杂芳基、稠合芳基或稠合杂芳基;
R1是H或任选地取代的(C1-C6)烷基;且
R2和R2’选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re都选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;
包括(a)进行用于制备式Ib的化合物的方法中的任一种,
以及(b)环化式Ib的化合物。
在一些实施方案中,式III的化合物包括式IIIc的化合物。
因此,本公开内容提供了制备式IIIc的化合物的方法,其中,
A为任选地取代的环烷基、杂环烷基、芳基、杂芳基、稠合芳基或稠合杂芳基;
R1是H或任选地取代的(C1-C6)烷基;且
R2、R2’、R3和R3’选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基,杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基选择芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;
包括:(a)进行用于制备式Ic的化合物的上述方法中的任一种,
以及(b)环化式Ic的化合物。
在一些实施方案中,式III的化合物包括式IIId的化合物。
因此,本公开内容提供了用于制备式IIId的化合物的方法,其中,
A为任选地取代的环烷基、杂环烷基、芳基、杂芳基、稠合芳基或稠合杂芳基;
R1是H或任选地取代的(C1-C6)烷基;且
R2、R2’、R3、R3’、R4和R4’选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;
包括(a)进行用于制备式Id的化合物的上面描述的方法,
以及(b)环化式Id的化合物。
在方法的一些实施方案中,式III的化合物包括式IIIc1的化合物。
因此,本公开内容提供了用于制备式IIIc1的化合物的方法,其中,
R1是H或任选地取代的(C1-C6)烷基;
R2选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;且
R5、R6、R7、R8和R9选自H、-COOH、-ORg、-SO2、-SRh、-NRiRj、-NO2、-CN、卤素、烷基、环烷基、杂环烷基、芳基和杂芳基,其中Rg、Rh、Ri和Rj选自H和(C1-C6)烷基;
方法包括(a)进行用于制备式Ic1的化合物的上述方法,
以及(b)环化式Ic1的化合物。在一些实施方案中,L为烷氧基基团并且环化步骤(b)在步骤(a)的适当的反应条件下发生。
在方法的一些实施方案中,式III的化合物包括化合物3p。
因此,本公开内容提供了用于制备化合物3p的方法,其中PG是保护基团,包括(a)进行用于制备化合物1p的上述方法
以及(b)环化化合物1p。如本文所讨论的,前述方法的优势是,环化步骤(b)在步骤(a)的反应条件下发生,允许在进行步骤(a)的方法中直接形成化合物3。
在一些实施方案中,式III的化合物包括式IIId1的化合物,且用于制备式IIId1的化合物的方法,
其中
R1是H或任选地取代的(C1-C6)烷基;
R2选自H、卤素、-ORc、-SRc、-CN、-NO2、-NRdRe、烷基、烯基、炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环烷基烷基、环烷基烯基、环烷基炔基、杂环烷基烷基、杂环烷基烯基和杂环烷基炔基,其中Rc选自H、烷基、环烷基、杂环烷基、芳基和杂芳基,且Rd和Re选自H、烷基、环烷基、杂环烷基、环烷基烷基、杂环烷基烷基、芳基、杂芳基、芳基烷基、杂芳基烷基和保护基团;且
R5、R6、R7、R8和R9选自H、-COOH、-ORg、-SO2、-SRh、-NRiRj、-NO2、-CN、卤素、烷基、环烷基、杂环烷基、芳基和杂芳基,其中Rg、Rh、Ri和Rj选自H和(C1-C6)烷基;
包括(a)进行用于制备式Id1的化合物的上述方法,以及(b)环化式Id1的化合物。
在方法的一些实施方案中,式IIId1的化合物包括式化合物IIId2的化合物,
其中-PG是保护基团,
R5、R6、R7、R8和R9如上所定义;
并且方法包括(a)进行用于制备式Id2的化合物的上述方法,以及(b)环化式Id2的化合物。
在方法的一些实施方案中,式III的化合物包括化合物3d1和化合物3a1,
并且化合物3d1和化合物3a1以相比于化合物3b1和化合物3c1大于8:1的非对映体比被生产,其中,方法包括(a)进行用于以相比于化合物1b1和化合物1c1大于8:1的非对映体比制备化合物1d1和化合物1a1的上述方法,以及(b)环化步骤(a)的产物。
在方法的一些实施方案中,式III的化合物包括化合物3d1,
并且化合物3d1以化合物3a1的对映体过量被生产,其中,方法包括(a)进行用于以化合物1a1的对映体过量制备化合物1d1的本文方法,以及(b)环化步骤(a)的产物。
在方法的一些实施方案中,式III的化合物包括化合物3a1,
并且化合物3a1以化合物3d1的对映体过量被生产,其中方法包括(a)进行用于以化合物1d1的对映体过量制备化合物1a1的本文方法,以及(b)环化步骤(a)的产物。
在一些实施方案中,环化反应可以在用于转氨酶反应的适当的反应条件下发生,并且可以与转氨酶反应连续地发生,特别是当离去基团L是烷氧基基团时。可选地,在一些实施方案中,可以使用不同于氨基转移反应的反应条件。用于环化的条件描述于美国专利号6,150,535、6,770,658、和7,378,410,以及PCT公布WO2010/150261中。示例性的环化反应条件是NaOH和二甲基甲酰胺的存在。环化可以不经进一步分离或在分离胺化产物化合物之后被进行。
在一些实施方案中,还涵盖,包括使用工程化转氨酶多肽来将底物化合物生物催化转化为胺化的化合物和/或环化的产物的方法还可以包括产物处理、提取、分离、纯化、和/或结晶的化学步骤,其中的每一个可以在各种条件下进行。
用于从通过如上公开的方法产生的生物催化反应混合物中提取、分离、形成其盐、纯化、和/或结晶胺化的产物化合物或环化的化合物的方法、技术和试验方案是普通技术人员已知的和/或通过常规实验可获得的。另外,例证性的方法在下面的实施例中提供。
本公开内容的各种特征和实施方案在以下代表性实施例中被说明,代表性实施例意图是说明性的而非限制性的。
6.实施例
实施例1:工程化转氨酶多肽的合成、优化和筛选
基因合成与优化:编码具有单个氨基酸变化(I306V)的SEQ ID NO:2的来自节杆菌Arthrobacter sp.KNK168的经报道的野生型转氨酶多肽的密码子优化的多核苷酸序列被合成,如描述于WO/2010/099501(通过引用并入本文)中的,被克隆进入pCK110900载体***(参见例如,美国专利申请公布2006/0195947A1),并且随后于大肠杆菌W3110fhuA中表达。大肠杆菌W3110在lac启动子的控制下表达转氨酶多肽作为细胞内蛋白。多肽主 要累积为可溶性的细胞质中的活性酶(soluble cytosolic,active enzyme)。用于初步筛选的HTP测定使用来自这些大肠杆菌W3110细胞的表达的澄清的细胞溶解产物来进行(见下面)。针对底物化合物2的活性筛选各种进化的转氨酶鉴定了SEQ ID NO:3的合成基因,其公开于2011年8月8日提交的PCT申请号PCT/US11/46932,并且相对于节杆菌Arthrobacter sp.KNK168的天然存在的转氨酶(SEQ ID NO:2)具有以下24个氨基酸差异:S8P;Y60F;L61Y;H62T;V65A;D81G;M94I;I96L;F122I;S124I;G136W;A169L;V199I;A209L;G215C;G217N;S223P;L269P;L273Y;T282S;A284G;P297S;I306V;和S321P。
编码SEQ ID NO:4的转氨酶多肽的工程化基因(SEQ ID NO:3)被用作起始骨架用于进一步进化以产生编码SEQ ID NO:6-854中的偶数序列标识符的工程化转氨酶多肽的基因,其中的每一个能够以相对于其和/或SEQ ID NO:4的参考多肽的改进的酶特性将底物化合物2转化为产物化合物1。产生基因序列SEQ ID NO:3的工程化衍生物使用定向进化的标准方法经由通过基因合成的迭代变体文库产生,随后筛选和测序击中来进行。
HTP活性测定:表达工程化转氨酶多肽的大肠杆菌细胞通过添加pH10.5下的150μL或300μL的溶解缓冲液来溶解,然后在室温下摇动(以250rpm)持续1h,该溶解缓冲液含有0.2M硼酸盐缓冲液、0.5g/L溶菌酶、0.4g/L硫酸多粘菌素B。通常的HTP活性测定条件是:5g/L的化合物2、40μL或100μL澄清的细胞溶解产物、20%(v/v)DMSO、1M异丙胺(IPM)、1g/LPLP、0.2M硼酸盐、pH10.5、45℃和24h。具体的溶解和测定条件于表2A、2B、2E、2F、2G、和2H中提及。
SFP测定:除了用于初级筛选的HTP测定外,在某些情况下使用工程化转氨酶多肽的摇瓶粉(SFP)制剂以2mL规模进行二次筛选(见表2C和2I)。摇瓶粉(SFP)包括大约30%总蛋白并因此提供与HTP测定中使用的细胞溶解产物相比更纯化的工程化酶制剂。为了制备SFP,将含有编码感兴趣的工程化转氨酶的质粒的大肠杆菌的单个微生物菌落接种到含有30μg/ml氯霉素和1%葡萄糖的50mL Luria Bertani肉汤中。细胞在培养箱(incubator)中在30℃下以250rpm摇动生长过夜(至少16小时)。将培养 物稀释到1升烧瓶中含有30μg/ml氯霉素的250毫升的2×YT培养基(Difco)中,至600nm的光密度(OD600)为0.1,并允许在30℃生长。当培养物的OD600是0.6至0.8时,通过加入异丙基-β-D-硫代半乳糖苷(“IPTG”)至终浓度1mM来诱导转氨酶基因的表达。然后培养持续过夜(至少16小时)。通过离心(5000rpm、15min、4℃)收获细胞,并丢弃上清液。将细胞团块用10ml的冷的(4℃)含100μM吡哆醛5’-磷酸的50mM磷酸钾缓冲液pH8.5重新悬浮,并且以18-20kpsi通过一次性(one shot)破裂仪(Constant System Ltd)一次,同时保持在4℃。通过离心(9000rpm、30min、4℃)除去细胞碎片。收集澄清的溶解产物上清液,并储存在-80℃。对冷冻的澄清溶解产物的冷冻干燥提供了粗制转氨酶多肽的干摇瓶粉。可选地,细胞团块(洗涤前或洗涤后)可储存在4℃或-80℃。
一般的SFP测定反应条件(具体条件于表2C和2I中提及)如下:5g/L化合物2的底物混合物、5g/L或15g/L的工程化转氨酶多肽SFP、1g/L PLP、1M IPM、在0.2M硼酸盐缓冲液、20%(v/v)DMSO(如表2B、2C和2D中所提及的)的含水的共溶剂溶液中、pH10.5、45℃的反应温度和24h或72h的反应时间,用磁力搅拌器以1200rpm搅拌。
日常新鲜制备用于每组实验的储备溶液(预混合物)。对于一组15个以2mL规模的实验,预混合物制备如下:将3mL PLP(无菌H2O中10g/L储备溶液)加入到6ml的0.2M硼酸(未调pH)中的5M IPM,随后加入4.5ml DMSO和12mL的0.2M硼酸(未调pH)。然后使用浓HCl将预混合物溶液的pH调至10.5。
对于每一个实验,1.7mL的储备溶液加入到螺旋帽小瓶中。将小瓶紧密封闭,并在磁力搅拌(800至1200rpm)下加热至45℃。30分钟后,将200μL的pH10.5的0.2M硼酸盐中的酶粉的溶液加入到45℃的反应混合物中。酶溶液浓度为反应中所需浓度的10倍。紧接酶后,将108μL的DMSO中92g/L的底物储备溶液加入以开始反应。将小瓶紧密封闭并允许反应在45℃下在搅拌(800至1200rpm)下继续进行。
DSP测定:工程化转氨酶多肽的DSP粉作为短分批发酵,随后根据标准生物加工方法的进料分批法并向进料和发酵罐介质中加入5mM盐酸吡 哆醇来制备。简言之,通过添加IPTG至1mM的最终浓度来诱导转氨酶多肽表达。在发酵之后,收获细胞,并将其重新悬浮在pH7.5的100mM三乙醇胺-H2SO4缓冲液中,然后通过转氨酶多肽匀化而被机械破裂。细胞碎片和核酸用聚乙烯亚胺(PEI)絮凝,并通过离心使悬浮液澄清。使用切向横流超滤膜浓缩所产生的澄清上清液以除去盐和水。然后浓缩的和部分纯化的酶浓缩物在冷冻干燥器中干燥以提供DSP粉,将其包装在容器(例如,聚乙烯)中。
为了进行DSP活性测定(见表2D和2I),通过以下新鲜制备预混合物储备溶液:混合1mL的0.2M硼酸(未调pH)中的5M IPM和0.5mL的PLP(无菌H2O中的10g/L储备溶液),随后混合2.5mL DMSO和0.5mL的0.2M硼酸(未调pH)。预混合物溶液的pH使用浓HCl调至10.5。在玻璃小瓶中称量DSP粉,并加入0.5mL的0.2M硼酸pH10.5。然后预混合物储备溶液(4.5mL)被加入并将混合物在搅拌(800至1200rpm)下加热至所需的反应温度(55℃)。一旦达到所需温度,250mg的底物化合物作为粉末被加入以启动反应。将小瓶紧密封闭,并通过HPLC监测反应,如所描述的。
活性测定样品的HPLC分析:在运行如上所述的HTP、SFP或DSP测定后,使用反相HPLC分析来自淬灭测定反应溶液的样品以确定化合物2至化合物1的各种立体异构的形式(即,化合物1a、1b、1c和1d)的转化。
通过反相HPLC使用Chiralpak IA SFC柱进行96孔板中的HTP活性测定的分析。过夜反应后从培养箱中取出板,并转移到65-70℃培养箱中。加热反应板持续1小时,不振摇。然后将MeCN(200μL)加入到该板以淬灭反应。将板振摇并离心,并将100μL的澄清的上清液转移到96圆底HPLC板,该板在每孔中含有100μL的MeCN。样品通过HPLC使用下面表3中所示的参数进行分析。
表3:基于Chiralpak IA SFC柱的反相HPLC
使用基于Kromasil3-CelluCoat RP(4.6×150mm)的反相HPLC进行SFP和DSP活性测定样品的分析。通过取出反应混合物的20μL等分部分并将其添加到在浅孔板中的60μL的乙腈(ACN)中制备样品。将板以4000rpm离心持续10分钟,且上清液的等分部分用于分析。根据下表4中所示的参数进行HPLC分析。
表4:基于Phenomenex Kromasil3-Cellucoat RP柱的反相HPLC
在本申请中引用的所有出版物、专利、专利申请和其它文件据此出于所有目的均通过引用以其整体并入,其程度如同分别指出将每个单独的出版物、专利、专利申请或其它文件出于所有目的通过引用并入一样。
尽管已经阐释和描述了各种具体实施方案,但应理解可以作出各种改变而不背离本发明的精神和范围。

Claims (75)

1.一种工程化多肽,所述工程化多肽的氨基酸序列与SEQ ID NO:4相比存在选自X192A、X192G、X192H、X192K、X192N、X192Q、X192R和X192S的氨基酸残基差异,并且还存在选自以下的一个或更多个另外的残基差异:X2M;X4F,X4L,X4Y;X5C,X5F,X5I,X5H,X5K,X5L,X5M,X5N,X5P,X5S,X5T,X5V,X5Y;X6F,X6R,X6S,X6T;X8H;X9L,X9I,X9Q,X9F;X10L;X12H;X13A,X13F;X17L;X18I;X21L;X22A,X22H;X25A;X27L,X27H,X27P;X28N;X29N,X29T;X30F,X30G;X31H,X31R;X34V;X37S;X42G;X43S;X46R;X47R;X48A,X48G,X48R,X48S,X48W;X49I,X49P;X50S;X52H;X54A,X54L,X54M,X54P,X54R;X55M;X56D,X56E,X56W;X61G;X61W;X62A,X62L,X62N,X62S;X64C;X66A,X66S;X68I;X69A,X69G,X69T;X72A;X80Q;X81K;X84T;X85L,X85R;X88W;X89L;X97P,X97T;X99L;X101G,X101L,X101R;X102H,X102R;X102T,X102W;X103G,X103N,X103V;X106L,X106S,X106T,X106V;X107V;X108T;X115R;X117V;X120F;X122F,X122M,X122W,X122Y;X124F,X124K,X124L,X124M,X124N,X124R,X124S,X124W;X126A,X126C,X126G,X126I,X126T;X127T;X128A;X131F;X132H;X134G,X134L,X134S,X134V,X134Y,X134W;X136F,X136K,X136L,X136M,X136Y;X139E;X140A,X140K;X140M,X140T,X140V;X141A;X142M;X143V;X144D,X144I;X146R;X150L,X150S;X152A,X152C,X152F,X152G,X152I,X152L,X152R,X152S,X152W;X155C,X155I,X155L,X155T;X156A,X156F,X156S,X156T;X157L;X159G;X160L;X161M,X161N;X165L,X165N,X165V;X168E,X168R;X176C;X179K;X185A;X190M;X191A,X191G,X191S;X196L,X196V;X199L,X199V;X203M;X208K;X209F,X209M,X209Q,X209V;X210G,X210S;X215F,X215H,X215L;X217L;X223A,X223S,X223T,X223V;X227I;X231T;X233D;X234L;X241R;X256R;X260Q;X263V;X265Y,X265W;X266N;X267V;X269L,X269T;X270R,X270T;X273D,X273H,X273M,X273R,X273V;X274F,X274L,X274R,X274T;X282I,X282L,X282T,X282V;X284A,X284P,X284S,X284T,X284V;X295N,X295S;X296D,X296L,X296R,X296S,X296W;X297D;X297G;X300G,X300L;X305Q,X305T;X308A;X309L,X309T,X309W;X311Q,X311T;X312C,X312M;X316L,X316R;X319R,X319T,X319Y;X320G,X320Q;X323C,X323E,X323N,X323R;X324Q;X325M,X325P,X325Q,X325V;X327L,X327R;和X329P,
并且所述工程化多肽的氨基酸序列与SEQ ID NO:4具有至少95%的序列同一性。
2.如权利要求1所述的工程化多肽,其中与SEQ ID NO:4相比,所述氨基酸序列的氨基酸残基差异是选自以下的残基差异的组合:
(a)X192A/X192S和X215H;
(b)X124W、X126A、X136L/X136F和X192A/X192N/X192S;
(c)X124W、X126A、X136L、X152L/X152W/X152I和X192A;
(d)X54L、X124W、X126A、X136L、X192A、X215H和X223S;
(e)X54L、X64C、X124W、X126A、X136L、X192A和X215H;
(f)X124W、X126A、X136L、X140K、X150S、X155I、X192A、X196L、X215H和X227I;
(g)X54L、X124W、X126A、X136L、X155I、X156T、X157L、X192A、X215H和X223S;
(h)X54P、X64C、X124W、X126A、X136L、X155I、X156T、X157L、X192A和X215H;
(i)X124W、X126A、X136L、X143V、X150S、X156T、X159G、X192A、X215H、X223S和X227I;
(j)X54P、X56E、X64C、X124W、X126A、X136L、X139E、X140K、X143V、X150S、X156T、X192A和X215H;以及
(k)X124W、X126A、X136L、X140K、X143V、X155I、X156T、X157L、X192A、X199V、X215H、X223S、X227I和X231T。
3.如权利要求1所述的工程化多肽,其中与SEQ ID NO:4相比,所述氨基酸序列的氨基酸残基差异是选自以下的残基差异的组合:
(a)X136L和X192A;
(b)X124L和X192A;
(c)X124W、X126A、X136L、X192A和X284A;
(d)X122W、X124F、X126A、X192A和X284V;
(e)X124W、X126A、X136L、X143V、X150S、X156T、X159G、X192A、X215H、X223S和V227I;以及
(f)X54P、X64C、X124W、X126A、X139E、X143V、X155I、X157L、X159G、X192A、X199V、X215H和X227I。
4.如权利要求1所述的工程化多肽,其中所述氨基酸序列是选自以下的序列:SEQ IDNO:16、18、20、26、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、136、138、140、142、144、162、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304以及SEQ ID NO:306-854中的偶数序列标识符。
5.如权利要求1所述的工程化多肽,其中与SEQ ID NO:4相比,所述一个或更多个残基差异选自:X42G;X54P;X54R;X69A;X69G;X69T;X122M;X124F;X124L;X124N;X124R;X126A;X126T;X136Y,X136F;X150S;X152C;X152G;X152I;X152L;X152S;X156A;X156S;X156T;X157L;和X165N。
6.如权利要求1所述的工程化多肽,其中与SEQ ID NO:4相比,所述氨基酸序列的氨基酸残基差异是选自以下的残基差异的组合:
(a)X192A、X215H和X311T;
(b)X124W、X126A、X136L、X192A和X284A;以及
(c)X124W、X126A、X136L、X152R/X152L/X152I和X192A。
7.如权利要求1所述的工程化多肽,所述工程化多肽能够在适当的反应条件下,将化合物2的底物化合物转化为化合物1,
8.如权利要求1所述的工程化多肽,所述工程化多肽能够在适当的反应条件下以至少1.5倍的SEQ ID NO:4的活性将化合物2的底物化合物转化为化合物1d和化合物1a,
9.如权利要求8所述的工程化多肽,其中所述一个或更多个另外的残基差异选自:X54A;X54L;X56D;X56E;X61G;X61W;X62A;X62L;X62N;X62S;X64C;X68I;X122F,X122W;X122Y;X124K;X124M;X124S;X124W;X126C;X126I;X136K;X136L;X136M;X139E;X140K;X143V;X150L;X155I;X155L;X159G;X160L;X176C;X199L;X199V;X209F;X209M;X209Q;X209V;X223S;X223T;X223V;X227I;X282L,X282V;X284A;X284P;X284S;X284T;和X284V。
10.如权利要求1或2所述的工程化多肽,所述工程化多肽能够以相比于化合物1b和化合物1c大于8:1的非对映体比将化合物2的底物化合物转化为化合物1d和化合物1a,
11.如权利要求10所述的工程化多肽,其中所述一个或更多个另外的残基差异选自:X62N,X62A,X62S;X62L;X124W,X124F;X124K;X124L;X124M;X124N;X124R;X124S;X136F;X136K;X136L;X136M;X136Y;X152A;X152C;X152F;X152G;X152I;X152L;X152R;X152S;X152W;X215H;X215L;X284V;X284A;X284P;X284S和X284T。
12.一种多核苷酸,所述多核苷酸编码如权利要求1至11中任一项所述的工程化多肽。
13.如权利要求12所述的多核苷酸,所述多核苷酸是选自SEQ ID NO:15、17、19、25、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、135、137、139、141、143、161、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303和SEQ ID NO:305-853中的奇数序列标识符的核苷酸序列。
14.一种表达载体,所述表达载体包括如权利要求12或13所述的多核苷酸。
15.如权利要求14所述的表达载体,所述表达载体包括控制序列。
16.一种宿主细胞,所述宿主细胞包括如权利要求12或13所述的多核苷酸或如权利要求14或15所述的表达载体。
17.一种制备如权利要求1至6中任一项所述的工程化多肽的方法,所述方法包括在适合所述多肽的表达的条件下培养如权利要求16所述的宿主细胞。
18.如权利要求17所述的方法,所述方法还包括分离所述多肽。
19.一种制备如权利要求7至11中任一项所述的工程化多肽的方法,所述方法包括在适合所述多肽的表达的条件下培养如权利要求16所述的宿主细胞。
20.如权利要求19所述的方法,所述方法还包括分离所述多肽。
21.一种用于制备式I的化合物的方法,
其中
L选自:Cl、Br、-ORf、-OC(O)Rf、-SRf、和-OPO3,其中每个Rf独立于其他Rf,选自C1-C6烷基或C5-C14芳基;
A选自任选地取代的苯基、吡啶基、吲哚基和萘基,其中当取代基存在时,A具有选自以下的一个或更多个取代基:-ORg、-COOH、-SO2、-SRh、-NRiRj、-NO2、-CN、卤素、C1-C18烷基和C5-C14芳基,其中Rg、Rh、Ri和Rj选自H和C1-C6烷基;
R1为H或C1-C6烷基;
Q为O或S;
M为-CRaRb-,其中每一个M独立于其它M,且Ra和Rb选自H、-NRdRe,其中Rd和Re选自H、C1-C6烷基和保护基团,所述保护基团选自叔丁氧羰基(Boc)、9-芴甲氧羰基(Fmoc)、三氯乙基氯甲酸酯基(Troc)、对甲氧基苄基羰基(Moz)、3,4-二甲氧基苄基(DMPM)、对甲氧基苄基(Pmb)、甲苯磺酰基(Ts)和苄氧羰基(Cbz);且
n为从0至4的整数,
所述方法包括使式II的底物化合物,
其中L、A、R1、Q、M和n在上面定义,在适当的反应条件下在氨基供体的存在下与如权利要求1至11中任一项所述的工程化多肽接触。
22.如权利要求21所述的方法,其中L为-ORf,其中Rf选自甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基。
23.如权利要求21所述的方法,其中R1为C1-C6烷基。
24.如权利要求21所述的方法,其中Ra和Rb选自H和-NRdRe,其中Rd和Re如权利要求21中定义的。
25.如权利要求21至24中任一项所述的方法,其中n为2或3。
26.如权利要求21所述的方法,其中所述式II的底物化合物包括式2p的化合物
其中PG为保护基团,以生产式1p的化合物
27.一种用于以相比于化合物1b1和化合物1c1大于8:1的非对映体比制备化合物1d1和化合物1a1的方法,
其中PG为保护基团,所述方法包括使底物化合物2p,
在适当的反应条件下在氨基供体的存在下,与权利要求1至11中任一项的工程化多肽接触。
28.如权利要求19至24、26-27中任一项所述的方法,其中所述底物化合物是以0.5至200g/L的载量。
29.如权利要求28所述的方法,其中所述底物化合物是以1至200g/L的载量。
30.如权利要求28所述的方法,其中所述底物化合物是以5至150g/L的载量。
31.如权利要求28所述的方法,其中所述底物化合物是以10至100g/L的载量。
32.如权利要求28所述的方法,其中所述底物化合物是以50至100g/L的载量。
33.如权利要求25所述的方法,其中所述底物化合物是以0.5至200g/L的载量。
34.如权利要求33所述的方法,其中所述底物化合物是以1至200g/L的载量。
35.如权利要求33所述的方法,其中所述底物化合物是以5至150g/L的载量。
36.如权利要求33所述的方法,其中所述底物化合物是以10至100g/L的载量。
37.如权利要求33所述的方法,其中所述底物化合物是以50至100g/L的载量。
38.如权利要求28所述的方法,其中所述底物化合物是以约0.5、1、5、10、20、30、40、50、100、150或200g/L的载量。
39.如权利要求33所述的方法,其中所述底物化合物是以约0.5、1、5、10、20、30、40、50、100、150或200g/L的载量。
40.如权利要求21至24、26-27中任一项所述的方法,其中所述适当的反应条件包括1%至80%(v/v)的DMSO浓度。
41.如权利要求40所述的方法,其中所述适当的反应条件包括1%至70%(v/v)的DMSO浓度。
42.如权利要求40所述的方法,其中所述适当的反应条件包括2%至60%(v/v)的DMSO浓度。
43.如权利要求40所述的方法,其中所述适当的反应条件包括5%至40%(v/v)的DMSO浓度。
44.如权利要求40所述的方法,其中所述适当的反应条件包括10%至40%(v/v)的DMSO浓度。
45.如权利要求40所述的方法,其中所述适当的反应条件包括10%至30%(v/v)的DMSO浓度。
46.如权利要求40所述的方法,其中所述适当的反应条件包括10%至20%(v/v)的DMSO浓度。
47.如权利要求25所述的方法,其中所述适当的反应条件包括1%至80%(v/v)的DMSO浓度。
48.如权利要求47所述的方法,其中所述适当的反应条件包括1%至70%(v/v)的DMSO浓度。
49.如权利要求47所述的方法,其中所述适当的反应条件包括2%至60%(v/v)的DMSO浓度。
50.如权利要求47所述的方法,其中所述适当的反应条件包括5%至40%(v/v)的DMSO浓度。
51.如权利要求47所述的方法,其中所述适当的反应条件包括10%至40%(v/v)的DMSO浓度。
52.如权利要求47所述的方法,其中所述适当的反应条件包括10%至30%(v/v)的DMSO浓度。
53.如权利要求47所述的方法,其中所述适当的反应条件包括10%至20%(v/v)的DMSO浓度。
54.如权利要求40所述的方法,其中所述氨基供体为异丙胺。
55.如权利要求47所述的方法,其中所述氨基供体为异丙胺。
56.如权利要求41-46、48-53中任一项所述的方法,其中所述氨基供体为异丙胺。
57.如权利要求54或55所述的方法,其中所述异丙胺是以0.1至3.0M的浓度。
58.如权利要求54或55所述的方法,其中所述异丙胺是以0.2至2.5M的浓度。
59.如权利要求54或55所述的方法,其中所述异丙胺是以0.5至2M的浓度。
60.如权利要求54或55所述的方法,其中所述异丙胺是以1至2M的浓度。
61.如权利要求56所述的方法,其中所述异丙胺是以0.1至3.0M的浓度。
62.如权利要求56所述的方法,其中所述异丙胺是以0.2至2.5M的浓度。
63.如权利要求56所述的方法,其中所述异丙胺是以0.5至2M的浓度。
64.如权利要求56所述的方法,其中所述异丙胺是以1至2M的浓度。
65.如权利要求21至24、26-27、47-55中任一项所述的方法,其中所述适当的反应条件包括(a)10至100g/L的底物化合物的底物载量;(b)1至40g/L的工程化多肽浓度;(c)0.1至10M的异丙胺浓度;(d)0.1至1mM的磷酸吡哆醛辅因子浓度;(e)8.5至11的pH;以及(f)30至60℃的温度。
66.如权利要求56所述的方法,其中所述适当的反应条件包括(a)10至100g/L的底物化合物的底物载量;(b)1至40g/L的工程化多肽浓度;(c)0.1至10M的异丙胺浓度;(d)0.1至1mM的磷酸吡哆醛辅因子浓度;(e)8.5至11的pH;以及(f)30至60℃的温度。
67.如权利要求25所述的方法,其中所述适当的反应条件包括(a)10至100g/L的底物化合物的底物载量;(b)1至40g/L的工程化多肽浓度;(c)0.1至10M的异丙胺浓度;(d)0.1至1mM的磷酸吡哆醛辅因子浓度;(e)8.5至11的pH;以及(f)30至60℃的温度。
68.如权利要求40所述的方法,其中所述适当的反应条件包括(a)10至100g/L的底物化合物的底物载量;(b)1至40g/L的工程化多肽浓度;(c)0.1至10M的异丙胺浓度;(d)0.1至1mM的磷酸吡哆醛辅因子浓度;(e)8.5至11的pH;以及(f)30至60℃的温度。
69.如权利要求41-46任一项所述的方法,其中所述适当的反应条件包括(a)10至100g/L的底物化合物的底物载量;(b)1至40g/L的工程化多肽浓度;(c)0.1至10M的异丙胺浓度;(d)0.1至1mM的磷酸吡哆醛辅因子浓度;(e)8.5至11的pH;以及(f)30至60℃的温度。
70.如权利要求21至24、26-27、47、54-55中任一项所述的方法,其中所述适当的反应条件包括:50g/L底物化合物、20g/L或更少的工程化多肽、50%(v/v)二甲基亚砜(DMSO)、1M异丙胺(IPM)、1mM磷酸吡哆醛(PLP)、0.2M硼酸盐、pH 10.5以及55℃。
71.如权利要求25所述的方法,其中所述适当的反应条件包括:50g/L底物化合物、20g/L或更少的工程化多肽、50%(v/v)二甲基亚砜(DMSO)、1M异丙胺(IPM)、1mM磷酸吡哆醛(PLP)、0.2M硼酸盐、pH 10.5以及55℃。
72.如权利要求65所述的方法,其中所述适当的反应条件包括:50g/L底物化合物、20g/L或更少的工程化多肽、50%(v/v)二甲基亚砜(DMSO)、1M异丙胺(IPM)、1mM磷酸吡哆醛(PLP)、0.2M硼酸盐、pH 10.5以及55℃。
73.一种用于制备式III的化合物的方法
其中,
A选自任选地取代的苯基、吡啶基、吲哚基和萘基,其中当取代基存在时,A具有选自以下的一个或更多个取代基:-ORg、-COOH、-SO2、-SRh、-NRiRj、-NO2、-CN、卤素、C1-C18烷基和C5-C14芳基,其中Rg、Rh、Ri和Rj选自H和C1-C6烷基;
R1为H或C1-C6烷基;
Q为O或S;
M为-CRaRb-,其中每一个M独立于其它M,且Ra和Rb选自H、-NRdRe,其中Rd和Re选自H、C1-C6烷基和保护基团,所述保护基团选自叔丁氧羰基(Boc)、9-芴甲氧羰基(Fmoc)、三氯乙基氯甲酸酯基(Troc)、对甲氧基苄基羰基(Moz)、3,4-二甲氧基苄基(DMPM)、对甲氧基苄基(Pmb)、甲苯磺酰基(Ts)和苄氧羰基(Cbz);且
n为从0至4的整数,
所述方法包括:(a)进行如权利要求21-26、33-37、39、47-53、55、67和71中任一项所述的方法以制备所述式I的化合物,以及(b)环化所述式I的化合物;或(a)进行如权利要求27所述的方法以制备所述化合物1d1和所述化合物1a1,以及(b)环化所述化合物1d1和所述化合物1a1。
74.如权利要求73所述的方法,其中所述式III的化合物包括化合物3p,
其中PG为保护基团,所述方法包括(a)进行如权利要求26所述的方法用于制备化合物1p以及(b)环化所述化合物1p。
75.如权利要求73所述的方法,其中所述式III的化合物包括化合物3d1和化合物3a1
其中化合物3d1和化合物3a1以相比于化合物3b1和化合物3c1大于8:1的非对映体比被生产,
所述方法包括(a)进行如权利要求27所述的方法,以及(b)环化步骤(a)的产物。
CN201280054745.5A 2011-09-08 2012-09-07 用于合成取代的内酰胺的生物催化剂和方法 Active CN103998461B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161532259P 2011-09-08 2011-09-08
US61/532,259 2011-09-08
PCT/US2012/054300 WO2013036861A1 (en) 2011-09-08 2012-09-07 Biocatalysts and methods for the synthesis of substituted lactams

Publications (2)

Publication Number Publication Date
CN103998461A CN103998461A (zh) 2014-08-20
CN103998461B true CN103998461B (zh) 2018-02-02

Family

ID=46981082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280054745.5A Active CN103998461B (zh) 2011-09-08 2012-09-07 用于合成取代的内酰胺的生物催化剂和方法

Country Status (4)

Country Link
US (6) US9109209B2 (zh)
EP (1) EP2753640B1 (zh)
CN (1) CN103998461B (zh)
WO (1) WO2013036861A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI501968B (zh) * 2010-11-12 2015-10-01 Merck Sharp & Dohme 六氫吡啶酮甲醯胺氮雜茚滿cgrp受體拮抗劑
CN103998461B (zh) 2011-09-08 2018-02-02 科德克希思公司 用于合成取代的内酰胺的生物催化剂和方法
HUE042206T2 (hu) * 2013-02-28 2019-06-28 Codexis Inc Módosított transzamináz polipeptidek ipari biokatalízishez
AU2015214502B2 (en) 2014-02-05 2019-06-06 Merck Sharp & Dohme Llc Tablet formulation for CGRP-active compounds
CN109715817B (zh) * 2016-06-09 2022-12-09 科德克希思公司 用于化合物的羟基化的生物催化剂和方法
CN109439606B (zh) * 2018-11-14 2022-06-28 中国科学院青岛生物能源与过程研究所 一种提高间苯三酚产量的基因工程菌及其构建方法与应用
WO2020150125A1 (en) * 2019-01-15 2020-07-23 Codexis, Inc. Engineered transaminase polypeptides
WO2022140537A1 (en) 2020-12-22 2022-06-30 Allergan Pharmaceuticals International Limited Treatment of migraine
EP4347801A1 (en) * 2021-05-28 2024-04-10 Merck Sharp & Dohme LLC Transaminase enzymes for the transamination of (1s,5r)-6,8-dioxabicyclo[3.2.1]octan-4-one
WO2024044657A1 (en) * 2022-08-26 2024-02-29 Tesaro, Inc. Biocatalysts and methods thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010081053A2 (en) * 2009-01-08 2010-07-15 Codexis, Inc. Transaminase polypeptides
WO2010099501A2 (en) * 2009-02-26 2010-09-02 Codexis, Inc. Transaminase biocatalysts
CN101965397A (zh) * 2008-01-03 2011-02-02 维莱尼姆公司 转移酶和氧化还原酶、编码它们的核酸以及其制备和应用方法

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4870173A (en) 1986-04-03 1989-09-26 Nelson Research & Development Co. Lactam formation by a selective cyclization process
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
WO1995033836A1 (en) 1994-06-03 1995-12-14 Novo Nordisk Biotech, Inc. Phosphonyldipeptides useful in the treatment of cardiovascular diseases
EP1559776A3 (en) 1994-06-30 2006-01-11 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
DE69841075D1 (de) 1997-04-23 2009-10-01 Kaneka Corp Deoxynukleinsäure welche ein Polypeptid mit stereoselektiver Transaminase Aktivität kodiert, sowie die Deoxynukleinsäure enthaltende Transformanden
EP0992491B1 (en) 1997-04-24 2003-03-05 Kaneka Corporation Processes for producing azetidine-2-carboxylic acid and intermediates thereof
US6054579A (en) 1997-06-26 2000-04-25 Leukosite, Inc. Synthesis of substituted lactams
KR20010032861A (ko) 1997-12-08 2001-04-25 캘리포니아 인스티튜트 오브 테크놀로지 폴리뉴클레오티드 및 폴리펩티드 서열을 형성하는 방법
US6770658B2 (en) 1998-09-09 2004-08-03 Inflazyme Pharmaceuticals Ltd. Substituted γ-phenyl-Δ-lactams and uses related thereto
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
EP1272967A2 (en) 2000-03-30 2003-01-08 Maxygen, Inc. In silico cross-over site selection
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
ATE394372T1 (de) 2003-03-03 2008-05-15 Serono Lab G-lactamderivate als prostaglandinagonisten
US6852713B2 (en) 2003-04-16 2005-02-08 Adolor Corporation Lactam derivatives and methods of their use
US7378410B2 (en) 2003-07-25 2008-05-27 Novartis Ag Substituted lactams and their use as anti-cancer agents
JP2007502124A (ja) 2003-08-11 2007-02-08 コデクシス, インコーポレイテッド 改良ケトレダクターゼポリペプチドおよび関連ポリヌクレオチド
JP2008502728A (ja) 2004-06-10 2008-01-31 ボード、オブ、トラスティーズ、オブ、ミシガン、ステイト、ユニバーシティ リジンからのカプロラクタムの合成
US8168412B2 (en) * 2006-05-29 2012-05-01 Kaneka Corporation Method for producing optically-active amine compound, recombinant vector, and transformant containing the vector
KR101491867B1 (ko) 2007-01-31 2015-02-10 피페넥스 인크. 증가된 발현을 위한 박테리아 리더 서열
US20090118130A1 (en) 2007-02-12 2009-05-07 Codexis, Inc. Structure-activity relationships
EP2132322A4 (en) 2007-03-02 2013-02-20 Richmond Chemical Corp METHOD FOR INCREASING YIELD AND IMPROVING PURIFICATION OF PRODUCTS FROM REACTIONS WITH TRANSAMINASE
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
US8921079B2 (en) 2009-06-22 2014-12-30 Codexis, Inc. Transaminase reactions
MX2011013775A (es) 2009-06-25 2012-04-20 Alcobra Ltd Un metodo para el tratamiento, alivio de sitomas de, mitigacion, mejoramieto y prevencion de una enfermedad, desorden o condicion cognoscitiva.
WO2011159910A2 (en) * 2010-06-17 2011-12-22 Codexis, Inc. Biocatalysts and methods for the synthesis of (s)-3-(1-aminoethyl)-phenol
CA2808098C (en) * 2010-08-16 2020-03-10 Merck Sharp & Dohme Corp. Process for preparing aminocyclohexyl ether compounds
EP2606139B1 (en) 2010-08-16 2015-07-15 Codexis, Inc. Biocatalysts and methods for the synthesis of (1r,2r)-2-(3,4-dimethoxyphenethoxy)cyclohexanamine
CN103998461B (zh) 2011-09-08 2018-02-02 科德克希思公司 用于合成取代的内酰胺的生物催化剂和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101965397A (zh) * 2008-01-03 2011-02-02 维莱尼姆公司 转移酶和氧化还原酶、编码它们的核酸以及其制备和应用方法
WO2010081053A2 (en) * 2009-01-08 2010-07-15 Codexis, Inc. Transaminase polypeptides
WO2010099501A2 (en) * 2009-02-26 2010-09-02 Codexis, Inc. Transaminase biocatalysts

Also Published As

Publication number Publication date
US20210054352A1 (en) 2021-02-25
WO2013036861A1 (en) 2013-03-14
US20150307857A1 (en) 2015-10-29
EP2753640A1 (en) 2014-07-16
US20140342412A1 (en) 2014-11-20
US9109209B2 (en) 2015-08-18
US11597918B2 (en) 2023-03-07
US20200231945A1 (en) 2020-07-23
EP2753640B1 (en) 2016-03-09
US9624478B2 (en) 2017-04-18
US10858635B2 (en) 2020-12-08
US10633640B2 (en) 2020-04-28
US20170191043A1 (en) 2017-07-06
WO2013036861A8 (en) 2014-03-13
US20230313155A1 (en) 2023-10-05
CN103998461A (zh) 2014-08-20

Similar Documents

Publication Publication Date Title
CN103998461B (zh) 用于合成取代的内酰胺的生物催化剂和方法
US9963685B2 (en) Engineered transaminase polypeptides for industrial biocatalysis
CN104428313B (zh) 工程化亚胺还原酶以及用于酮和胺化合物的还原胺化的方法
CN104508126B (zh) 用于合成色胺和色胺类似物的衍生物的生物催化剂和方法
CN104428412B (zh) 用于化合物的羟基化的生物催化剂和方法
JP7212972B2 (ja) 産業上の生体触媒作用のための操作されたトランスアミナーゼポリペプチド
CN106232619A (zh) 工程化的亚胺还原酶和用于酮和胺化合物的还原胺化的方法
CN106479990A (zh) 用于制备羟基取代的氨基甲酸酯的生物催化剂
CN105008528A (zh) 用于合成手性胺的工程化的生物催化剂和方法
JP7316662B2 (ja) 操作されたイミンレダクターゼ、ならびにケトン化合物およびアミン化合物の還元的アミノ化のための方法
IL296841A (en) Transaminase transaminase polypeptides
CN111699250B (zh) 用于酰胺偶联的羧酸酯酶多肽
WO2023102499A1 (en) Engineered threonine aldolases and amino acid decarboxylases
CN116209754A (zh) 用于合成手性胺的工程化生物催化剂及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant