CN102666848B

CN102666848B - 用于从纤维素生物质产生可发酵的糖的重组嗜热子囊菌β-葡糖苷酶变体

Info

Publication number: CN102666848B
Application number: CN201080051889.6A
Authority: CN
Inventors: 蒂普纳斯·贝德亚洛伊; 路易斯·克拉克; 利萨·M·纽曼
Original assignee: Codexis Inc
Current assignee: Codexis Inc
Priority date: 2009-11-25
Filing date: 2010-11-19
Publication date: 2014-09-24
Anticipated expiration: 2030-11-19
Also published as: US20140113352A1; US8993277B2; US8652813B2; CN102666848A; CA2781399C; CA2781399A1; EP2504431A1; BR112012012192A2; EP2504431A4; WO2011066187A1; US20110124058A1

Abstract

本发明提供了用于表达重组β-葡糖苷酶变体的组合物和方法以及重组β-葡糖苷酶变体在从纤维素生物质产生可发酵的糖中的用途。

Description

用于从纤维素生物质产生可发酵的糖的重组嗜热子囊菌β-葡糖苷酶变体

本申请要求2009年11月25日提交的美国临时专利申请系列第61/264,605号的优选权。

发明领域

本发明提供了用于表达重组β-葡糖苷酶变体的组合物和方法及其在从纤维素生物质产生可发酵的糖中的用途。

发明背景

纤维素生物质是用于生成糖类的重要的可再生资源。这些糖类的发酵可产生有商业价值的终产物，包括生物燃料和目前从石油获取的化学品。虽然将单糖发酵为乙醇相对直接，但将纤维素生物质有效转化为可发酵的糖诸如葡萄糖是有挑战的(见，例如，Ladisch等人，Enz.Microb.Technol.，5：82[1983])。纤维素可以用化学方法、机械方法或用其他方法进行预处理以提高纤维素对水解的敏感性。这种预处理之后可以是使用专门打破纤维素的β-1-4糖苷键的酶进行的纤维素到纤维二糖、纤维寡糖、葡萄糖和类似物的酶促转化。这些酶总称为“纤维素酶”。

纤维素酶被分为三个亚类的酶：1，4-β-D-葡聚糖葡聚糖水解酶(“内切葡聚糖酶”或“EG”)；1，4-β-D-葡聚糖纤维二糖水解酶(“外切葡聚糖酶”、“纤维二糖水解酶”或“CBH”)；和“β-D-葡糖苷-葡糖水解酶”(“β-葡糖苷酶”、“纤维二糖酶”或“Bgl”)。内切葡聚糖酶随机地攻击内部部分并主要攻击纤维素的无定形区域，主要产生葡萄糖、纤维三糖、以及纤维二糖，纤维二糖是一种水溶性β-1，4-连接的葡萄糖二聚体。外切葡聚糖酶通过结合葡聚糖末端并从纤维素聚合物的末端主要释放纤维二糖单元而逐渐缩短葡聚糖分子。β-葡糖苷酶将纤维二糖***为两个葡萄糖单元。

用于加工纤维素生物质的纤维素酶的有效产生将会降低成本并提高生物燃料和其他有商业价值的化合物的生产效率。

发明概述

本发明提供了用于表达重组β-葡糖苷酶变体的组合物和方法，及其在从纤维素生物质产生可发酵的糖中的用途。

在一些实施方案中，本发明提供了包括如下氨基酸序列的分离或重组的嗜热子囊菌(T.aurantiacus)β-葡糖苷酶变体：所述氨基酸序列与SEQID NO：2(野生型嗜热子囊菌β-葡糖苷酶)至少约70％相同，或由在严格条件下与SEQ ID NO：1的精确互补序列(exact complement)杂交的核酸编码，并且具有至少一种相对于SEQ ID NO：2的本文所述的氨基酸残基取代，其中该变体具有比SEQ ID NO：2中给出的酶的酶活性更大的酶活性。在其他一些实施方案中，本发明提供了包括如下氨基酸序列的分离的β-葡糖苷酶多肽变体：所述氨基酸序列与SEQ ID NO：4至少约70％相同，并且具有至少一种相对于SEQ ID NO：4的本文所述的氨基酸残基取代，其中该变体具有比SEQ ID NO：4中给出的酶的酶活性更大的酶活性。还提供了编码所述β-葡糖苷酶变体的多核苷酸、包含所述多核苷酸的表达载体、以及用所述表达载体转化的宿主细胞。

本发明还提供了通过将用编码至少一种β-葡糖苷酶变体的至少一种多核苷酸转化的宿主细胞在适于表达所述β-葡糖苷酶变体的条件下培养来产生至少一种β-葡糖苷酶变体(即，多肽变体)的方法。在一些实施方案中，从培养基或从转化和培养的细胞回收β-葡糖苷酶变体。

本发明还提供包含分离或重组的嗜热子囊菌β-葡糖苷酶变体的酶组合物。在一些实施方案中，酶组合物还包括至少一种另外的纤维素酶。在另外一些实施方案中，酶组合物包括至少一种另外的纤维素酶和/或至少一种另外的酶。

在一些实施方案中，本发明提供了通过使β-葡糖苷酶变体与生物质基质(biomass substrate)在适于产生可发酵的糖的条件下接触来将该生物质基质(如纤维二糖)转化成可发酵的糖的方法。在一些实施方案中，生物质基质被保持在包含表达至少一种β-葡糖苷酶变体的细胞的介质中。在一些实施方案中，表达至少一种β-葡糖苷酶变体的重组宿主细胞还表达至少一种其他重组纤维素酶和/或至少一种其他重组或天然的酶。在一些实施方案中，在使生物质基质与β-葡糖苷酶变体或多于一种β-葡糖苷酶变体接触之前，任选地对该生物质基质进行预处理。

在一些实施方案中，本发明提供了包括如下氨基酸序列的β-葡糖苷酶变体：所述氨基酸序列具有至少一种修饰、与SEQ ID NO：2至少约70％相同或由在严格条件下与SEQ ID NO：1的互补序列杂交的核酸编码，其中该变体具有比SEQ ID NO：2更大的酶活性。在一些实施方案中，该β-葡糖苷酶变体在选自以下的位置包括至少一种氨基酸残基取代：A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、S86、T150、Y331、Y641、Y679和Y746。

在一些可选的实施方案中，本发明提供了包括如下氨基酸序列的β-葡糖苷酶变体：所述氨基酸序列与SEQ ID NO：4至少约70％相同并且具有至少一种相对于SEQ ID NO：4的本文所述的氨基酸残基的修饰，其中该变体具有比SEQ ID NO：4更大的酶活性。在一些实施方案中，该β-葡糖苷酶变体在选自以下的位置包括至少一种氨基酸残基取代：A479、D204、E345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680、和Y747。在一些实施方案中，该β-葡糖苷酶变体包括选自以下的至少一种氨基酸取代：T151S、Y642N、N651K、K101R、T151S、K343R、N356S、S409N、Y642N、N651K、K101R、T151S、K343R、N356S、S409N、Y642N、N651K、M1T、K55R、K101R、T151S、R331K、Y332C、K343R、N356S、S409N、Y642N、M1T、K101R、T151S、K292E、K343R、S409N、Y642N、P740S、M1T、T151S、K343R、S409N、A479V、Y642N、Y680F、L150V、T151S、K343R、S409N、K457R，Y642N、N651K、S87N、T151S、F288Y、Y642N、和N651K。在另外一些实施方案中，该β-葡糖苷酶变体包括选自以下的至少一种氨基酸取代：T151S、Y642N、N651K、D204G、K292I、E345V、Y747C、H685Y、和P791T。在另外一些实施方案中，编码β-葡糖苷酶变体的多核苷酸序列包括选自t1044c、t1656a、t2052c和a2520g的至少一种碱基改变。在又另外一些实施方案中，编码β-葡糖苷酶变体的多核苷酸序列包括选自a1515g、g165a、t651c和726c的至少一种碱基改变。在另外一些实施方案中，β-葡糖苷酶变体包括选自取代组合(substitution set)T151S-Y642N-N651K、D204G-K292I-E345V-Y747C和H685Y-P791T的至少一种氨基酸取代。在另外一些实施方案中，β-葡糖苷酶变体包括选自以下取代组合的至少一种氨基酸取代：T151S-Y642N-N651K、K101R-T151S-K343R-N356S-S409N-Y642N-N651K 、M1T-K55R-K101R-T151S-R331K-Y332C-K343R-N356S-S409N-Y642N 、M1T-K101R-T151S-K292E-K343R-S409N-Y642N-P740S 、M1T-T151S-K343R-S409N-A479V-Y642N-Y680F 、L150V-T151S-K343R-S409N-K457R-Y642N-N651K 、和S87N-T151S-F288Y-Y642N-N651K。

本发明还提供了编码本文提供的β-葡糖苷酶变体的多核苷酸序列。本发明还提供了包含表达至少一种β-葡糖苷酶变体的至少一种多核苷酸序列的表达载体。本发明还提供了包括包含表达至少一种β-葡糖苷酶变体的至少一种多核苷酸序列的表达载体的宿主细胞。

本发明还提供了用于产生至少一种β-葡糖苷酶变体的方法，该方法包括提供宿主细胞和包含编码至少一种β-葡糖苷酶变体的至少一种多核苷酸序列的表达载体，将该表达载体引入该宿主细胞以产生被转化的宿主细胞，并且在使得至少一种β-葡糖苷酶变体被表达的条件下培养所述被转化的宿主细胞。认为多种宿主细胞将在本发明中具有用途。在一些实施方案中，使用一种表达载体，而在其他实施方案中使用多于一种表达载体。而且，在一些实施方案中，表达载体包含单一β-葡糖苷酶变体，而在其他一些实施方案中，表达载体包括多于一种β-葡糖苷酶变体。此外，在一些实施方案中，表达载体包括编码至少一种另外的酶的至少一种多核苷酸序列，所述至少一种另外的酶包括但不限于至少一种纤维素酶。在一些实施方案中，方法还包括分离产生的β-葡糖苷酶变体的步骤。在另外一些实施方案中，方法还包括分离使用所述方法产生的至少一种另外的酶。

本发明还提供了包含至少一种β-葡糖苷酶变体的组合物。在一些实施方案中，组合物包括至少一种缓冲剂、表面活性剂、精练剂(scouring agent)和/或其他剂。在一些实施方案中，组合物还包括至少一种另外的酶。在一些实施方案中，所述至少一种另外的酶是纤维素酶。认为由本发明提供的β-葡糖苷酶变体将在众多适合的组合物中具有用途。实际上，意图在于本文提供的β-葡糖苷酶变体将在多种应用中具有用途。

本发明还提供了转化生物质基质以产生至少一种可发酵的糖的方法，该方法包括提供至少一种β-葡糖苷酶变体和生物质基质，并且在该至少一种β-葡糖苷酶变体使该生物质基质转化为至少一种可发酵的糖的条件下将该生物质基质暴露于该至少一种β-葡糖苷酶变体。在一些实施方案中，通过β-葡糖苷酶变体的作用从生物质基质产生的可发酵的糖是葡萄糖。在另外一些实施方案中，产生葡萄糖以外的糖。在其他一些实施方案中，产生糖的混合物。在一些实施方案中，产生包括葡萄糖的糖的混合物。在其他一些实施方案中，产生包含除葡萄糖之外的糖的混合物的组合。在另外一些实施方案中，在将生物质基质暴露于至少一种β-葡糖苷酶变体之前，对生物质基质进行预处理。

附图简述

图1提供了显示使用补充β-葡糖苷酶的C.lucknowense(C1)发酵培养液从纤维素产生葡萄糖的图。在该图中，“C1”和“TaB6”分别代表来自C1-真菌发酵培养液和嗜热子囊菌Bgl1衍生变体TaB6的样品。反应条件是65℃，pH 5，200g/L纤维素，100g/L木糖。添加的β-葡糖苷酶的量是基于克干重粉末，而不是活性β-葡糖苷酶的量。

发明描述

定义

提供以下定义来帮助读者。除非另外定义，否则领域内的所有技术、科学和其他术语均旨在具有分子生物学领域、发酵领域、微生物学领域和相关领域的技术人员所通常理解的含义。在一些情况下，具有通常理解含义的术语为了清晰和/或为了现成参考而在此定义，并且在此包含此类定义不应一定被认作代表与相关领域一般理解的术语定义相比有实质差异。

本文提到的所有专利和出版物，包括在这些专利和出版物中公开的所有序列均通过引用明确地并入本文。除非另外指明，否则本发明的实施涉及在分子生物学领域、发酵领域、微生物学领域和相关领域中通常使用的常规技术，这些技术是所属领域普通技术人员已知的。尽管在本发明的实施或试验中可使用与本文所述的方法和材料相似或等同的任何方法和材料，但描述了一些优选的方法和材料。实际上，意图在于本发明不限于本文所述的特定方法学、方案和试剂，因为这些可随使用它们的背景而改变。本文提供的标题不是对本发明的多个方面或实施方案的限制。

尽管如此，为了促进对本发明的理解，以下定义了若干术语。数值范围包括限定范围的数字。这样，本文公开的每个数值范围旨在包括落在这种较宽的数值范围内的每个较窄的数值范围，如同这种较窄的数值范围全部被明确写在本文一样。意图还在于本文公开的每个最大(或最小)的数值限制包括每个较低(或较高)的数值限制，如同这种较低(或较高)的数值限制被明确地写在本文一样。

如本文所用，术语“包括”及其同源词以其包含的意义使用(即，等同于术语“包含”及其对应的同源词)。

如在此处和在所附权利要求中所用，除非上下文另外清楚地表示，否则单数“一(a)”、“一(an)”和“该(the)”包括复数指代。因此，例如，提到“宿主细胞”包括多个此类宿主细胞。

除非另外指明，否则分别以5′至3′方向从左到右书写核酸；以氨基到羧基方向从左到右书写氨基酸序列。本文提供的标题不是对可通过参照作为整体的说明书而具有的本发明的多个方面或实施方案的限制。据此，通过参照作为整体的说明书更完全地定义以下所定义的术语。

如本文所用，术语“分离的”和“纯化的”用于指从与之天然缔合的至少一种另外的组分(例如，其他蛋白、核酸、细胞、合成试剂等等)中被除去(即，部分或完全分开)的分子(例如，分离的核酸、多肽等等)或其他组分。

如本文所用，术语“衍生酶(derivative enzyme)”(例如“酶衍生物”或“β-葡糖苷酶衍生物”)是指保留野生型酶、天然酶或参考酶(例如β-葡糖苷酶)的特征活性达到该衍生物可用于与野生型形式、天然形式或参考形式相似的目的的程度的酶。β-葡糖苷酶的“功能衍生物”包括具有本发明的β-葡糖苷酶的一般特征的自然存在的、合成的或重组产生的多肽或肽片段。

如本文所用，术语“过表达”旨在包括将蛋白的表达提高到大于细胞正常产生的水平。意欲使该术语包括内源蛋白以及异源蛋白的过表达。

如本文所用，术语“纤维二糖”具有其普通含义并且是指具有式C₁₂H₂₂O₁₁的二糖。

如本文所用，术语“纤维素酶”是指能够将纤维素(β-1，4-葡聚糖或β-D-葡糖苷键)水解成较短低聚糖、纤维二糖和/或葡萄糖的一类酶。

如本文所用，术语“β-葡糖苷酶”或“纤维二糖酶”被互换使用并且是指催化糖二聚体包括但不限于纤维二糖的水解同时释放对应的糖单体的β-D-葡糖苷葡糖水解酶。在一些实施方案中，β-葡糖苷酶是催化纤维二糖水解为葡萄糖的分类为E.C.3.2.1.21的β-葡糖苷酶葡糖水解酶。一些β-葡糖苷酶还具有水解β-D-半乳糖苷、β-L-***糖苷和/或β-D-岩藻糖苷的能力，并且另外一些β-葡糖苷酶可作用于α-1，4-底物如淀粉。β-葡糖苷酶活性可通过方法本领域已知的任何适宜方法来测量，包括本文以下描述的测定。

如本文所用，术语“β-葡糖苷酶多肽”是指具有β-葡糖苷酶活性的多肽。

如本文所用，术语“β-葡糖苷酶多核苷酸”是指编码具有β-葡糖苷酶活性的多肽的多核苷酸。

如本文所用，“纤维素水解活性”包括外切葡聚糖酶活性(CBH)、内切葡聚糖酶(EG)活性和/或β-葡糖苷酶活性。

如本文所用，术语“外切葡聚糖酶”、“外切纤维二糖水解酶”、或“CBH”是指分类为E.C.3.2.1.91的一组纤维素酶。这些酶从纤维素的还原末端或非还原末端水解纤维二糖。

如本文所用，术语“内切葡聚糖酶”或“EG”是指分类为E.C.3.2.1.4的一组纤维素酶。这些酶水解纤维素内部的β-1，4糖苷键。

如本文所用，术语“野生型(wildtype)”和“野生-型(wild-type)”当应用于多肽(蛋白)时是指由自然存在的微生物诸如细菌或丝状真菌表达的多肽(蛋白)。当应用于微生物时，术语“野生型”和“野生-型”是指天然的非重组微生物。

如本文所用，术语“野生型基因”和“野生型多核苷酸序列”是指宿主细胞中天然的或自然存在的多核苷酸序列。在一些实施方案中，野生型序列是指为蛋白工程项目的起点的感兴趣的序列。野生型序列可编码同源蛋白(即，细胞在没有干预的情况下产生的蛋白)或异源蛋白(即，细胞本来不产生但在干预下而产生的蛋白)。

如本文所用，术语“自然存在的酶”是指具有未修饰的氨基酸序列(即，与自然界发现的氨基酸序列相同的序列)的酶。自然存在的酶包括被自然表达的那些酶。

如本文所用，术语“修饰的多核苷酸序列”、“修饰的核苷酸序列”和“修饰的基因”是指包括感兴趣的自然存在的或起始的核酸序列的缺失、***、取代或间断(interruption)的核苷酸序列。在一些实施方案中，修饰的序列的表达产物是截短的蛋白(例如，如果修饰是起始序列的缺失或间断的话)。在一些实施方案中，截短的蛋白保留生物学活性。在一些可选实施方案中，修饰的序列的表达产物是延长的蛋白(例如，修饰包括向起始核酸序列中***)。在一些实施方案中，***导致截短的蛋白(例如，当***导致终止密码子的形成时)。因而，***可导致截短的蛋白或延长的蛋白作为表达产物。在一些实施方案中，修饰是起始序列中至少一个核酸残基的取代。

如本文所用，“修饰的多肽序列”和“修饰的蛋白”是指包括感兴趣的自然存在的或起始的多肽序列的缺失、***、取代或间断的多肽序列。在一些实施方案中，修饰的序列是截短的蛋白(例如，如果修饰是起始序列的缺失或间断的话)。在一些实施方案中，截短的蛋白保留生物学活性。在一些可选实施方案中，修饰的序列是延长的蛋白(例如，修饰包括在起始序列中***)。在一些实施方案中，修饰是起始序列中至少一个氨基酸残基的取代。

如本文所用，“感兴趣的蛋白”和“感兴趣的多肽”是指期望的和/或所评价的蛋白和/或多肽。

如本文所用，术语“感兴趣的起始序列”和“起始序列”是指充当用于比较或用于工程目的的起始点的核酸(例如，“感兴趣的起始多核苷酸”)或氨基酸序列(例如，“感兴趣的起始多肽”)。在一些实施方案中，起始序列被称为“参考序列”。在一些实施方案中，起始序列是野生型序列，而在其他实施方案中，起始序列是修饰的序列(即，重组序列)。

如本文所用，术语“β-葡糖苷酶变体”、“β-葡糖苷酶变体多肽”和“β-葡糖苷酶变体蛋白”是指在多肽或多核苷酸中包括相对于野生型β-葡糖苷酶(Bgl1)多肽或野生型多核苷酸的一个或多个特定的氨基酸残基或者一个或多个特定的核苷酸或密码子的一个或多个修饰(例如，取代、缺失、***、和/或截短)的β-葡糖苷酶多肽或编码β-葡糖苷酶的多核苷酸。在一些实施方案中，β-葡糖苷酶变体是嗜热子囊菌β-葡糖苷酶变体。

如本文所用，“参考β-葡糖苷酶序列”是指用作序列比较的基础或用作“起始序列”的限定序列，诸如SEQ ID NO：2或SEQ ID NO：4。在一些实施方案中，参考β-葡糖苷酶序列包括较大序列的子集(subset)。一般地说，参考序列为多肽的至少约25个氨基酸残基长度、至少约50个残基长度、至少约100个残基长度、至少约150个残基长度、至少约200个残基长度、至少约300个残基长度、至少约350个残基长度、至少约500个残基长度、至少约600个残基长度、至少约700个残基长度、或多肽的全长。

如本文所用，术语“重组”是指宿主细胞中非自然存在的多核苷酸或多肽。重组分子可包含以非自然存在的方式连接在一起的两个或多个自然存在的序列。重组细胞包含重组的多核苷酸或多肽。核酸(诸如多核苷酸)、多肽或细胞当是人工的或工程改造的，或衍生自或包含人工的或工程改造的蛋白或核酸时，它们是“重组的”。例如，多核苷酸被***到载体中或任何其他异源位置(例如，重组生物的基因组中)以使其不与自然界发现的正常情况下在该多核苷酸两侧的核苷酸序列相缔合，这样的多核苷酸是重组多核苷酸。从重组多核苷酸体外或体内表达的蛋白是重组多肽的实例。同样，不在自然界出现的多核苷酸序列(例如，自然存在的基因的变体) 是重组的。

如本文所用，“改进的特性”是指与野生型嗜热子囊菌β-葡糖苷酶(Bgl1)(SEQ ID NO：2)相比展示任何特性上的改进的β-葡糖苷酶多肽。改进的特性包括但不限于增加的蛋白表达、热活性、热稳定性、pH活性、pH稳定性、产物特异性、提高的比活度、底物特异性、对底物或终产物抑制的提高的抗性、改变的pH/温度曲线和/或化学稳定性。

如本文所用，“具有改进的β-葡糖苷酶活性的变体”是指显示在指定的时间在指定的反应条件下发生的底物水解的量相对于参考β-葡糖苷酶增加的变体。可使用本领域已知的多种方法测量β-葡糖苷酶活性，包括但不限于本文所述的纤维二糖测定。为了比较两个重组表达的蛋白的β-葡糖苷酶活性，可比较比活度(即，每摩尔酶的酶活性或每克酶的酶活性)。可选地，在相同条件下培养表达和分泌重组蛋白的细胞并且比较每体积培养基的β-葡糖苷酶活性。

术语“百分比同一性(percent identity)”、“％同一性”、“百分比同一(percent identical)”和“％同一”在本文被互换使用是指通过ClustalW分析(例如，可从European Bioinformatics Institute，Cambridge，UK获得的W1.8版)获得的百分比氨基酸序列同一性：计算比对中相同匹配的数目并用此相同匹配的数目除以参考序列的长度，并且使用以下缺省ClustalW参数以达到缓慢的/准确的逐对最佳比对-空位开放罚分(Gap OpenPenalty)：10；空位延伸罚分(Gap Extension Penalty)：0.10；蛋白权重矩阵(Protein weight matrix)：Gonnet系列；DNA权重矩阵：IUB；Toggle慢/快逐对比对＝SLOW或FULL比对。

两条序列当以下时候是“最佳比对的”：为相似性评分使用限定的氨基酸取代矩阵(例如，BLOSUM62)、空位存在罚分和空位延伸罚分对这两条序列进行比对以达到该序列对可能的最高分数。氨基酸取代矩阵及其在定量两条序列之间的相似性上的应用是本领域熟知的(见，例如，Dayhoff等人，Atlas Prot.Seq.Struct.，5，Suppl.3：345-352[1978]；和Henikoff等人，Proc.Natl.Acad.Sci.，89：10915-10919[1992]，二者均通过引用并入本文)。BLOSUM62矩阵在序列比对方案诸如Gapped BLAST 2.0中通常用作缺省评分取代矩阵(default scoring substitution matrix)。空位存在罚分用于在比对序列之一引入单个氨基酸空位，而空位延伸罚分用于被***到已开放的空位中的每个另外的氨基酸空位置。通过比对开始和结束所在的每条序列的氨基酸位置以及任选地通过在一条或两条序列中***一个空位或多个空位以达到最高可能评分，来限定比对。尽管最佳比对和评分可手动完成，但通过使用计算机执行的比对算法(例如，Gapped BLAST 2.0；见Altschul，等人，Nucl.Acids Res.，25：3389-3402[1997]，通过引用并入本文)促进该过程，并且该算法在美国国立生物技术中心(National Center forBiotechnology Information)网站为公众可用。可使用容易获得的程序诸如PSI-BLAST；Altschul等人，上文，准备最佳比对，包括多重比对。

如本文所用，术语“对应于”、“参考”和“相对于”在对给定的氨基酸序列或多核苷酸序列编号的背景下使用时，是指在给定的氨基酸序列或多核苷酸序列与参考序列比较时对指定的参考序列的残基编号。

氨基酸或核苷酸碱基的“位置”由根据其相对于N末端的位置顺序地辨别每个氨基酸(或核苷酸碱基)的编号表示。由于在确定最佳比对时必须被考虑的缺失、***、截短、融合等，通过简单地从N末端计数而确定的测试序列中的氨基酸残基编号不一定与其在参考序列中的对应位置的编号相同。例如，在比对的测试序列中存在缺失的情况下，在缺失位点将不存在对应于参考序列中的位置的氨基酸。在比对的参考序列中存在***的情况下，该***将不会对应于参考序列中的任何氨基酸位置。在截短或融合的情况下，在参考序列或比对序列中可存在不对应于对应序列中的任何氨基酸的氨基酸串(stretches of amino acids)。

当核酸缔合，通常在溶液中缔合时，它们“杂交”。核酸杂交是由于各种被很好表征的物理-化学力，诸如氢键键合、溶剂排斥(solvent exclusion)、碱基堆积等。如本文所用，在核酸杂交实验诸如Southern杂交或Northern杂交的背景下术语“严格的杂交洗涤条件”是序列依赖性的，并且在不同环境参数下是不同的。杂交方法是本领域熟知的并且任何适宜方法在本发明中具有用途。对于至少100个核苷酸长度的多核苷酸而言，对低严格条件到极高严格条件限定如下：在标准的DNA印迹程序后，在42℃在5×SSPE，0.3％SDS，200μg/ml剪切和变性的鲑鱼精DNA，以及对于低严格性的25％甲酰胺，对于中等和中-高严格性的35％甲酰胺，或对于高严格性和极高严格性的50％甲酰胺中预杂交和杂交。对于至少100个核苷酸长度的多核苷酸，使用2×SSC，0.2％SDS至少在50℃(低严格性)、至少在55℃(中等严格性)、至少在60℃(中-高严格性)、至少在65℃(高严格性)以及至少在70℃(极高严格性)将载体材料最终洗涤三次，每次15分钟。

如本文所用，术语“培养(culturing)”和“培养(cultivation)”指在液体、半固体或固体培养基中在适宜的条件下使微生物细胞的群体生长。在一些实施方案中，“培养”指纤维素底物发酵性地生物转化为终产物。

当用于指酶活性时，术语“接触”是指将酶放置在与相应的底物足够靠近的位置以使酶能够将底物转化成产物。本领域中的技术人员将认识到将酶的溶液与相应的底物相混合将实现“接触”。“接触”还包括在包含酶底物的介质中孵育分泌酶的细胞。

如本文所用，β-葡糖苷酶变体多肽在其具有β-葡糖苷酶活性时是“有酶活性的(enzymatically active)”。

如本文所用，当提及细胞时使用的术语“转化的(transformed)”和“转化(transformation)”表示细胞具有整合入其基因组的非天然核酸序列或具有作为经过多代被维持的游离型质粒。

术语“引入”在将核酸序列***细胞中的背景下表示该细胞已被转染、转导或转化(统称为“转化”)或该核酸以其他方式并入到细胞的基因组或作为附加体被保持在细胞内。

如本文所用，“可操作地连接”是指如下配置：在该配置中控制序列被适当安放在相对于DNA序列的编码序列的位置以使得该控制序列影响多肽的表达。

如本文所用，术语“编码序列”旨在包括直接编码其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界一般由开放阅读框确定，开放阅读框通常以ATG起始密码子开始。在一些实施方案中，编码序列包括DNA、cDNA和/或重组核苷酸序列。

启动子序列、信号肽、或其他序列当可操作地连接于在自然界与该启动子、信号肽或其他序列不相关的核酸或蛋白序列时，它们是“异源的”。

如本文所用，术语“表达”包括多肽的产生所涉及的任何步骤，包括但不限于：转录、转录后修饰、翻译、翻译后修饰和分泌。

如本文所用，术语“表达载体”在本文是指包括编码本发明的多肽的区段并且可操作地连接于提供其转录的另外区段的线型或环状的DNA分子。

如本文所用，术语“前蛋白(pre-protein)”是指包括附加的氨基末端信号肽(或前导序列)区域的蛋白。在分泌之前信号肽酶将信号肽从前蛋白上切割以产生“成熟的”或“分泌的”蛋白。

如本文所用，“起始密码子”是编码蛋白的第一个氨基酸残基(甲硫氨酸)的ATG密码子。

以下命名法在描述参考序列中相对参考序列的取代或变异的多肽或核酸序列上具有用途：“R-#-V，”，其中#是指在参考序列中的位置，R是指在参考序列中该位置处的氨基酸(或碱基)，并且V是指在变异序列中该位置处的氨基酸(或碱基)。例如，对于参考SEQ ID NO：4而描述的多肽变体而言，“A479V”表示在该多肽变体中，在该参考序列第479位的丙氨酸被缬氨酸取代，其中通过该变异序列与SEQ ID NO：4的最佳比对来确定氨基酸位置。

以下习惯用来描述Bgl1变体中的氨基酸位置。相对于参考序列SEQID NO：2或SEQ ID NO：4对氨基酸位置进行编号，SEQ ID NO：2是野生型(WT)Bgl1分泌蛋白，SEQ ID NO：4是本文描述的WT^M形式。SEQ ID NO：6提供了野生型成熟蛋白的氨基酸序列，包括信号肽。SEQ ID NO：1提供了野生型成熟蛋白的DNA序列，而SEQ ID NO：3提供了WT^M蛋白的DNA序列，并且SEQ ID NO：5提供了野生型序列的DNA序列，包括信号肽序列。

以下提供了编码野生型嗜热子囊菌β-葡糖苷酶蛋白(分泌形式)的多核苷酸：

AAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACTCGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGCAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTG GGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGGAGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCACCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCTATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCGTGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGGCACCGCTTCCCCCTTAC (SEQ ID NO：1)

以下提供了编码野生型嗜热子囊菌β-葡糖苷酶蛋白(分泌形式)的多肽序列：

KDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMPGDTAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNEGDRKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNV TAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKPNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYIYPWLNTTDPKKSSGDPDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY (SEQ ID NO：2)

以下显示了编码嗜热子囊菌β-葡糖苷酶蛋白(WT^M形式)的多核苷酸序列：

ATGAAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACTCGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGCAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTGGGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGGAGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCACCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCTATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCG TGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGGCACCGCTTCCCCCTTAC (SEQ ID NO：3)

以下显示了嗜热子囊菌β-葡糖苷酶蛋白WT^M形式的多肽序列：

MKDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMPGDTAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNEGDRKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNVTAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKTNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYIYPWLNTTDPKKSSGDPDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY (SEQ ID NO：4)

以下显示了编码嗜热子囊菌β-葡糖苷酶前蛋白的多核苷酸：

ATGAGGCTTGGGTGGCTGGAGCTGGCCGTCGCGGCGGCCGCGACCGTCGCCAGCGCCAAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACTCGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGCAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTGGGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGG AGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCACCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCTATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCGTGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGCACCGCTTCCCCCTTAC (SEQ ID NO：5)

以下显示了嗜热子囊菌β-葡糖苷酶前蛋白的多肽序列：

MRLGWLELAVAAAATVASAKDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMPGDTAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNEGDRKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNVTAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKPNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYTYPWLNTTDPKKSSGDPDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY (SEQID NO：6)

以下显示了被设计为具有在酿酒酵母(Saccharomyces cerevisiae)中表达的密码子偏倚性的编码WT^M的多核苷酸序列：

TGAAAGATGATTTGGCTTATAGTCCACCTTTCTACCCATCACCTTGGATGGACGGTAACGGAGAATGGGCTGAAGCCTATAGAAGAGCCGTCGATTTCGTATCCCAATTGACATTGGCAG AGAAGGTAAATTTGACAACCGGAGTGGGTTGGATGCAGGAAAAGTGTGTAGGCGAAACTGGTTCTATACCAAGATTAGGCTTTAGGGGTTTGTGCTTACAAGATTCTCCCTTAGGTGTAAGATTCGCCGACTACGTAAGTGCTTTTCCTGCAGGAGTTAACGTTGCAGCAACTTGGGATAAAAACCTTGCATATTTGAGAGGTAAGGCAATGGGTGAAGAACATCGTGGCAAGGGTGTCGATGTGCAGTTAGGCCCAGTTGCTGGACCATTGGGAAGACATCCCGACGGCGGAAGAAACTGGGAGGGTTTTAGTCCAGACCCCGTTTTGACTGGAGTCTTGATGGCAGAGACTATCAAAGGTATACAAGACGCTGGAGTGATTGCTTGTGCTAAACATTTCATTGGTAACGAAATGGAACATTTCAGACAAGCCTCCGAAGCAGTTGGCTATGGTTTTGATATTACTGAGTCCGTTTCATCAAACATAGATGACAAAACCCTTCACGAACTATATTTATGGCCATTCGCTGATGCCGTCAGAGCTGGTGTAGGTTCTTTCATGTGTTCATACAACCAAGTCAACAACTCTTATTCATGCTCTAATTCCTACTTGTTGAACAAATTATTAAAGTCAGAACTTGACTTTCAAGGTTTCGTAATGTCCGACTGGGGTGCTCACCATTCCGGAGTTGGTGCAGCTTTGGCCGGTTTAGACATGTCAATGCCAGGTGATACTGCATTTGGAACGGGTAAATCCTTTTGGGGTACCAATCTAACCATCGCCGTCCTTAATGGTACAGTTCCTGAATGGAGAGTAGATGATATGGCTGTTAGAATCATGGCCGCATTTTACAAAGTTGGTAGAGATAGGTACCAAGTGCCTGTCAACTTTGACTCCTGGACCAAAGATGAATATGGTTATGAACACGCATTGGTGGGCCAGAATTATGTTAAGGTCAATGATAAAGTGGATGTGAGAGCTGACCACGCTGATATTATCCGTCAGATTGGTAGTGCATCAGTTGTTTTGTTAAAAAATGACGGAGGACTTCCTTTAACTGGTTATGAGAAGTTCACAGGCGTATTCGGCGAAGATGCCGGTAGTAATCGTTGGGGTGCTGACGGATGCAGTGACA

GAGGCTGCGATAATGGTACCCTTGCCATGGGTTGGGGATCTGGAACGGCCGACTTTCCTTACTTAGTTACGCCAGAGCAGGCTATACAAAATGAGATTTTGTCTAAAGGCAAGGGATTGTCTCTGCCGTGACGGATAACGGAGCTTTAGACCAAATGGAACAGGTCGCTTCCCAAGCTTCTGTAAGTATTGTTTTTGTTAATGCCGACTCAGGAGAAGGCTATATTAACGTTGATGGAAATGAAGGTGATAGGAAAAATCTAACTCTTTGGAAGGGTGGTGAAGAGGTCATTAAGACAGTCGCAGCCAATTGTAACAATACCATCGTCGTAATGCACACCGTTGGACCTGTGTTAATAGATGAATGGTATGATAATCCTAATGTCACTGCAATTGTTTGGGCAGGCTTGCCTGGTCAGGAATCCGGTAATTCTCTTGTTGATGTCCTATATGGAAGGGTGTCCCCTGGTGGAAAAACTCCCTTTACTTGGGGCAAGACACGTGAAAGTTATGGAGCACCATTATTAACAAAACCAAACAACGGAAAGGGAGCTCCTCAAGATGATTTTACAGAGGGTGTTTTCATCGACTACAGGCGTTTCGACAAGTATAACGAGACTCCTATATATGAGTTCGGATTTGGTCTATCCTACACAACTTTTGAGTACTCAGATATCTACGTACAGCCCTTGAACGCACGTCCATACACCCCTGCTTCAGGTTCTACTAAGGCCGCCCCAACGTTTGGAAATATATCTACTGATTACGCTGATTACCTATACCCAGAGGATATTCATAAAGTTCCACTTTATATCTACCCATGGCTTAATACGACAGACCCAAAAAAGTCAAGTGGTGATCCAGATTACGGAATGAAAGCTGAAGATTACATTCCTTCAGGCGCTACGGACGGCTCTCCCCAACCAATTCTACCAGCTGGAGGTGCTCCAGGTGGTAATCCTGGCTTGTATGATGAGATGTATAGGGTTTCTGCTATAATTACAAATACAGGTAACGTTGTTGGTGATGAGGTACCTCAACTATACGTGTCTTTAGGTGGTCCCGATGACCCCAAGGTAGTTTTGCGTAACTTTGACAGAATCACTTTGCATCCAGGACAACAAACCATGTGGACTACGACTTTGACAAGAAGAGATATATCTAATTGGGACCCTGCATCTCAGAATTGGGTTGTGACAAAGTACCCAAAAACTGTCTATATCGGCTCAAGTTCCAGGAAGCTTCACTTGCAGGCCCCTCTACCCCCATACTAA (SEQ ID NO：7)

真菌嗜热子囊菌(Thermoascus aurantiacus)产生一致地起作用来催化纤维素的解晶和水解以产生可溶性糖类的多种酶。在这些酶中有嗜热子囊菌β-葡糖苷酶1(Bgl1)(Parry等人，Biochem.J.353：117[2001]，通过引用并入本文)。嗜热子囊菌β-葡糖苷酶蛋白序列被提供在Hong等人，APPl.Microbiol.Biotechnol.，73：1331[2007]中，其通过引用并入本文。Hong等人(Hong等人NCBI登录号DQ114396.1；Genbank登录号AAZ95588)报告了bgl1基因的序列。嗜热子囊菌野生型β-葡糖苷酶cDNA 序列以GenBank登录号DQ114397提供(也见，Hong等人，J.Biotechnol.，130：114-23[2007])，并且在本文作为SEQ ID NO：6在此给出。嗜热子囊菌β-葡糖苷酶前蛋白(SEQ ID NO：6)包括19-残基信号肽，MRLGWLELAVAAAATVASA，对应于SEQ ID NO：6的残基1-19(编码这种前蛋白的多核苷酸在SEQ ID NO：5中提供)。

本文描述的嗜热子囊菌β-葡糖苷酶变体对于从纤维素生物质产生可发酵的糖是极其有用的。在一些实施方案中，本发明提供了通过使包含纤维二糖的组合物与至少一种重组表达的嗜热子囊菌β-葡糖苷酶变体在其中纤维二糖被酶促转化为葡萄糖的条件下接触来产生葡萄糖的方法。在一些实施方案中，将表达至少一种β-葡糖苷酶变体的重组宿主细胞与纤维二糖在其中β-葡糖苷酶被细胞表达(和优选地分泌)的条件下组合。在一些可选实施方案中，将纯化的或部分纯化的重组β-葡糖苷酶与纤维二糖接触。在本发明的一些实施方案中，接触包括在包含从纤维素原料产生的纤维二糖的培养基中培养重组宿主细胞。例如，本文描述的嗜热子囊菌β-葡糖苷酶变体显示与其他纤维素酶联合的在糖化反应中的益处，所述其他纤维素酶诸如里氏木霉(T.reesei)纤维素酶(例如，里氏木霉CBH1、CBH2和/或EG1或其变体，和/或里氏木霉培养液)和C.lucknowense纤维素酶(美国专利第6,015,707号、5,811,381号和6,573,086号；美国专利公布第2007/0238155号、2008/0194005号、2009/0099079号；以及WO 2008/073914和WO 98/15633，其全部通过引用并入本文)。

在一些实施方案中，本发明提供了通过将包括含编码嗜热子囊菌Bgl1变体的核酸序列的载体的宿主细胞培养在其中β-葡糖苷酶蛋白或其酶活性片段被表达的条件下来表达β-葡糖苷酶的方法。在一些实施方案中，表达的蛋白包含在分泌酶时被细胞除去的信号肽。在一些实施方案中，编码嗜热子囊菌Bgl1变体的序列的转录受可操作地连接的异源启动子控制。

β-葡糖苷酶多肽变体

本发明提供了为嗜热子囊菌β-葡糖苷酶(Bgl1)变体的新颖的酶。本发明的β-葡糖苷酶多肽变体是显示β-葡糖苷酶活性、通常是比野生型嗜热子囊菌β-葡糖苷酶(SEQ ID NO：2)或WT^M嗜热子囊菌β-葡糖苷酶(SEQID NO：4)更大的β-葡糖苷酶活性的Bgl1的变体。还包括在商业化糖化工艺相关的条件下显示更大稳定性的β-葡糖苷酶多肽变体。

本发明提供了具有比野生型嗜热子囊菌Bgl1蛋白更大的活性并且具有在本文所述的显示提高的活性的变体中发现的至少一种取代的Bgl1变体。如在本文更详细讨论的，制备了编码野生型(WT)嗜热子囊菌Bgl1蛋白(SEQ ID NO：2)或通过在成熟蛋白的氨基末端增添甲硫氨酸而修饰的野生型嗜热子囊菌Bgl1蛋白(WT^M；SEQ ID NO：4)的多核苷酸。多核苷酸连同编码异源信号肽的序列被***表达载体中，如实施例所述。通过诱变和定向进化制备编码Bgl1蛋白变体的多核苷酸的文库，并且评价个体Bgl1变体的特性(例如，β-葡糖苷酶活性)，如实施例所述。在具有比野生型酶活性更大活性的变体中鉴定了许多氨基酸取代和取代的组合。还旨在本发明包括包含相比于参考序列(例如SEQ ID NO：2或4)的至少一个***和/或缺失的Bgl1变体。

更具体地说，本发明提供了具有提高的活性的分离的和/或重组的β-葡糖苷酶多肽变体，其包括与野生型嗜热子囊菌β-葡糖苷酶多肽(Bgl1)(SEQ ID NO：2)至少约70％相同且在选自以下的位置具有至少一种氨基酸残基取代的氨基酸序列：A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、S86、T150、Y331、Y641、Y679、Y746(其中通过与SEQ ID NO：2最佳比对来确定氨基酸位置)。本发明还提供了包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体：所述氨基酸序列与WT^M嗜热子囊菌β-葡糖苷酶多肽(Bgl1)(SEQ ID NO：4)至少约70％相同且在选自以下的位置具有至少一种氨基酸残基取代或缺失：A479、D204、E345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680、和Y747(其中通过与SEQID NO：4最佳比对来确定氨基酸位置)。“取代”在该背景下表示该变体蛋白中的残基是除了参考序列(例如SEQ ID NO：2或4)中此位置处的残基以外的任何残基。例如，“A479X”表示在第479位包含除了丙氨酸以外的氨基酸(即，另外19个自然存在的氨基酸之一)的变体。在一些实施方案中，蛋白变体中的氨基酸既不是野生型残基也不是为该野生型残基的保守性替代物(substitute)的残基。如以下指出的，在该背景下，残基的保守性替代物是在同一组(即，碱性氨基酸，诸如精氨酸、赖氨酸或组氨酸；酸性氨基酸，诸如谷氨酸或天冬氨酸；极性氨基酸，诸如谷氨酰胺或天冬酰胺；疏水氨基酸，诸如亮氨酸、异亮氨酸或缬氨酸；芳香族氨基酸，诸如苯丙氨酸、色氨酸或酪氨酸；或小氨基酸，诸如甘氨酸、丙氨酸、丝氨酸、苏氨酸、脯氨酸、半胱氨酸或甲硫氨酸)中的另一个残基。

在一些实施方案中，蛋白变体中的氨基酸既不是野生型残基也不是为如以下的对所限定的那样通常与该野生型残基交换的残基的残基：Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

在一些实施方案中，本发明提供了具有比野生型(WT)嗜热子囊菌Bgl1蛋白更大的活性和/或热稳定性并且包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体：该氨基酸序列与野生型嗜热子囊菌β-葡糖苷酶(Bgl1)(SEQ ID NO：2)至少约70％相同并且具有选自以下的至少一种氨基酸残基取代：A478V、D203G、E344V、F287Y、H684Y、K100R、K291E、K291I、K342R、K456R、K54R、L149V、N355S、N650K、P739S、P790T、R330K、S408N、S86N、T150S、Y331C、Y641N、Y679F、Y746C(其中通过与SEQ ID NO：2最佳比对来确定氨基酸位置)。以上列出的发明的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多个位置处的取代的任何组合。

本发明还提供了具有比野生型(WT)嗜热子囊菌Bgl1蛋白更大的活性和/或热稳定性并且包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体：该氨基酸序列与WT^M嗜热子囊菌β-葡糖苷酶(Bgl1)(SEQID NO：4)至少约70％相同并且在选自以下位置具有至少一种氨基酸残基取代：A479V、D204G、E345V、F288Y、H685Y、K101R、K292E、 K292I、K343R、K457R、K55R、L150V、M1T、N356S、N651K、P740S、P791T、R331K、S409N、S87N、T151S、Y332C、Y642N、Y680F、和Y747C(其中通过与SEQ ID NO：4最佳比对来确定氨基酸位置)。以上列出的发明的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多个位置处的取代的任何组合。

在一些实施方案中，本发明提供了具有由在严格条件下与SEQ IDNO：1的互补序列杂交(例如，在与SEQ ID NO：1精确互补的核酸的实质上整个长度上杂交)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体，其中该编码多肽在选自以下的位置具有至少一种或多种取代或缺失：A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、S86、T150、Y331、Y641、Y679、Y746(其中通过与SEQ ID NO：2最佳比对来确定氨基酸位置)。本发明还提供了具有由在严格条件下与SEQ ID NO：1的互补序列杂交(例如，在与SEQ ID NO：1精确互补的核酸的实质上整个长度上杂交)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体，其中该编码多肽在选自以下的位置具有至少一种或多种取代或缺失：A479、D204、E345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680和Y747(其中通过与SEQ ID NO：4最佳比对来确定氨基酸位置)。

本发明还提供了具有由在严格条件下与SEQ ID NO：1的互补序列杂交(例如，在与SEQ ID NO：1精确互补的核酸的实质上整个长度上杂交)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体，其中该编码多肽在选自以下的位置具有至少一种或多种取代或缺失：A478V、D203G、E344V、F287Y、H684Y、K100R、K291E、K291I、K342R、K456R、K54R、L149V、N355S、N650K、P739S、P790T、R330K、S408N、S86N、T150S、Y331C、Y641N、Y679F、Y746C和Y747C(其中通过与SEQ ID NO：2最佳比对来确定氨基酸位置)，或其在选自以下的位置具有至少一种氨基酸残基取代或缺失：A479V、D204G、E345V、F288Y、H685Y、K101R、K292E、K292I、K343R、K457R、K55R、L150V、M1T、N356S、N651K、P740S、P791T、R331K、S409N、S87N、T151S、Y332C、Y642N、Y680F(其中通过与SEQ ID NO：4最佳比对来确定氨基酸位置)。以上列出的发明的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多个位置处的取代的任何组合。

旨在本文提供的Bgl1变体包括除以上列出的氨基酸取代以外的另外的氨基酸取代(例如，另外的保守性取代)并且与野生型嗜热子囊菌Bgl1蛋白相比可小于全长。因而，在一些实施方案中，本发明的Bgl1变体包括相对于SEQ ID NO：2的***和/或缺失(例如，在氨基端和/或羧基端截短)。嗜热子囊菌Bgl1蛋白的野生型分泌形式为约842个残基长度；本发明的变体可比野生型蛋白更长或更短。为了举例说明且非限制，在一些实施方案中，变体可比野生型长度长或短达约10％、达约5％、达约4％、达约3％、达约2％、或约达1％。

根据本领域已知的方法(见WO 03/075129和美国专利申请序列第10/379,378号，以及Fox等人，Protein Eng.，16(8)：589-597[2003]；和Fox等人，J.Theor.Biol.234(2)：187-199[2005]，其全部通过引用并入本文)进行变体的序列-活性分析，以鉴定可能提供对活性的最显著影响的取代。本发明的一些β-葡糖苷酶变体具有在第287位和第86位中的任一个或两个位置包括至少一种氨基酸残基取代(例如，F287Y和S86N)的氨基酸序列。本发明的一些β-葡糖苷酶变体具有在选自以下的位置包括至少一种氨基酸残基取代的氨基酸序列：H684Y、K342R、P790T、S408N、T150S和Y641N，所述取代显示是非常有益的取代。本发明的一些β-葡糖苷酶变体具有在选自以下的位置包括至少一种氨基酸残基取代的氨基酸序列：A478V、D203G、E344V、K291E、K291I、K456R、K54R、L149V、P739S、Y679F、和Y746C。另外，一些变体包括在SEQ ID NO：2的氨基末端增添苏氨酸残基的序列。应认识到，使用SEQ ID NO：2的编号提及上述有益的取代。使用SEQ ID NO：4的编号，高度有益的取代包括F288Y和S87N，极其有益的取代包括H685Y、K343R、P791T、S409N、T151S和Y642N，并且另外的有益取代包括A479V、D204G、E345V、K292E、K292I、K457R、K55R、L150V、M1T、P740S、Y680F和Y747C。适宜的组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18或更多个位置处的取代的任何组合。在一些实施方案中，本发明的β-葡糖苷酶变体还具有其中在对应于N356(使用SEQ ID NO：2的编号)的位置没有作出取代的氨基酸序列。

在一些实施方案中，本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型嗜热子囊菌Bgl1或WT^M Bgl1至少约70％相同，并且包括选自以下的取代组合：T150S+Y641N+N650K；K100R+T150S+K291E+K342R+S408N+Y641N+P739S；T150S+K342R+S408N+A478V+Y641N+Y679F；L149V+T150S+K342R+S408N+K456R+Y641N+N650K；S86N+T150S+F287Y+Y641N+N650K；K100R+T150S+K342R+N355S+S408N+Y641N+N650K；S86N+T150S+F287Y+Y641N+N650K；K54R+K100R+T150S+R330K+Y331C+K342R+N355S+S408N+Y641N；D203G+K291I+E344V+Y746C；和H684Y+P790T(其中通过与SEQ ID NO：2最佳比对来确定氨基酸位置)，或T151S+Y642N+N651K；M1T+K101R+T151S+K292E+K343R+S409N+Y642N+P740S；M1T+T151S+K343R+S409N+A479V+Y642N+Y680F；L150V+T151S+K343R+S409N+K457R+Y642N+N651K；S87N+T151S+F288Y+Y642N+N651K；K101R+T151S+K343R+N356S+S409N+Y642N+N651K；M1T+K55R+K101R+T151S+R331K+Y332C+K343R+N356S+S409N+Y642N；K101R+T151S+K343R+N356S+S409N+Y642N+N651K；D204G+K292I+E345V+Y747C；和H685Y+P791T(其中通过与SEQ ID NO：4最佳比对来确定氨基酸位置)。

如以上指出的，本发明包括的β-葡糖苷酶多肽具有与SEQ ID NO：2或与SEQ ID NO：4至少约70％的序列同一性。在一些实施方案中，本发明包括的β-葡糖苷酶多肽包括具有与SEQ ID NO：2或与SEQ ID NO：4至少约71％相同、至少约72％相同、至少约73％相同、至少约73％相同、至少约74％相同、至少约75％相同、至少约76％相同、至少约77％相同、至少约78％相同、至少约79％相同、至少约80％相同、至少约81％相同、至少约 82％相同、至少约83％相同、至少约84％相同、至少约85％相同、至少约86％相同、至少约87％相同、至少约88％相同、至少约89％相同、至少约90％相同、至少约91％相同、至少约92％相同、至少约93％相同、至少约94％相同、至少约95％相同、至少约96％相同、至少约97％相同、至少约98％相同或至少约99％相同的氨基酸序列的β-葡糖苷酶多肽。

本文的每个“至少约70％”叙述应理解成还可选地包括以上更高值中的任何一个。

如以上所指出的，在一些实施方案中，本发明的Bgl1变体还包括除以上列出的取代之外的另外的氨基酸取代，包括，例如具有在氨基酸序列中作出的一个或多个另外的保守性取代的变体。保守性取代的实例在碱性氨基酸(精氨酸、赖氨酸或组氨酸)、酸性氨基酸(谷氨酸或天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸、脯氨酸、半胱氨酸和甲硫氨酸)的组内。一般不改变比活度(specific activity)的氨基酸取代是本领域已知的。最常出现的交换包括但不限于：Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly，以及这些对颠倒过来。

本发明的β-葡糖苷酶多肽变体的保守取代的变异包括用同一保守取代组的保守选择的氨基酸取代小百分比、通常少于约5％、更通常少于约2％、并且通常少于约1％的多肽序列的氨基酸。不改变编码的β-葡糖苷酶活性的序列的增添，诸如非功能性或非编码序列的增添被认为是β-葡糖苷酶多核苷酸的保守变异。

本发明还提供了本文描述的β-葡糖苷酶多肽变体的酶活性片段，其中该片段具有β-葡糖苷酶活性和本文描述的至少一种取代。本发明还包括含截短的氨基末端和/或羧基末端的β-葡糖苷酶变体。据此，本发明还提供了具有如下氨基酸序列的分离的和/或重组的β-葡糖苷酶变体：所述氨基酸序列具有相对于SEQ ID NO：2或4的来自羧基(C-)末端、氨基(N-)末端、或二者的约1个至约50个氨基酸残基的缺失(即，来自N末端或C末端中任一个或二者的1、2、3、4、5、6、7、8、9、10、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50个氨基酸残基的缺失)。在一些实施方案中，缺失是来自N末端的约1个至约15个氨基酸残基和/或来自C末端的约1个至约40个氨基酸残基。这些β-葡糖苷酶片段在本文还分别称为“N末端截短的”和“C末端截短的”β-葡糖苷酶多肽变体。在一些实施方案中，缺失是来自C末端、N末端或两个末端的约1个至约30个、或约1个至约20个、或约1个至约10个残基、或约1个至约5个残基。

与SEQ ID NO：2具有至少约70％序列同一性和本文公开的一个或多个取代的本发明的一些β-葡糖苷酶变体除本文具体给出的那些以外还具有一个或多个取代、缺失或***。此类取代、缺失或***对β-葡糖苷酶活性和热稳定性的作用(如果有的话)可使用本领域已知的任何适宜的测定来确定。为了举例说明，TaB2具有以下相对于SEQ ID NO：2的取代：T151S+Y642N+N651K。为了确定为了确定另外的取代(例如，SEQ ID NO：2第4位的亮氨酸被缬氨酸替代)的作用，表达了变体(在该实例中，SEQ IDNO：2，具有L4V+T151S+Y642N+N651K)并将其性质与亲本(在该实例中，TaB2)进行比较。

在一些实施方案中，产生了β-葡糖苷酶多肽变体(以及编码变体的多核苷酸)的文库并筛选(例如，使用高通量筛选)β-葡糖苷酶活性的存在。在一些实施方案中，本领域已知的诱变和定向进化方法被应用于编码本文示例的β-葡糖苷酶变体的多核苷酸来产生变体文库，使用任何适宜的方法包括本文描述的那些方法对所述变体文库进行表达、筛选和测定。诱变和定向进化方法是本领域熟知的(见，例如，Ling，等人，Anal.Biochem.，254：157-78[1999]；Dale等人，Methods Mol.Biol.，57：369-74[1996]；Smith，Ann.Rev.Genet.，19：423-462[1985]；Botstein等人，Science，229：1193-1201[1985]；Carter，Biochem.J.，237：1-7[1986]；Kramer等人，Cell，38：879-887[1984]；Wells等人，Gene，34：315-323[1985]；Minshull等人，Curr.Op.Chem.Biol.，3：284-290[1999]；Christians等人，Nat.Biotechnol.，17：259-264[1999]；Crameri等人，Nature，391：288-291[1998]；Crameri等人，Nat.Biotechnol.，15：436-438[1997]；Zhang等人，Proc.Nat.Acad.Sci.，U.S.A.，94：45-4-4509[1997]；Crameri等人，Nat. Biotechnol.，14：315-319[1996]；Stemmer，Nature，370：389-391[1994]；Stemmer，Proc.Nat.Acad.Sci.，U.S.A.，91：10747-10751[1994]；WO95/22625；WO 97/0078；WO 97/35966；WO 98/27230；WO 00/42651；和WO 01/75767，其全部通过引用并入本文)。

在产生在除上文描述的那些以外的位置包括取代、***或缺失的变体时，普通熟练的实践者将认识到β-葡糖苷酶蛋白的某些区域对取代(尤其是非保守性取代)的耐受性比其他区域更小。因而，在一些实施方案中，Bgl1蛋白变体保留来自亲本的保守性残基和功能结构域。例如，几个糖基水解酶第3家族(CH3型)的酶包括嗜热子囊菌β-葡糖苷酶1的比对在确定用于修饰的位点方面具有用途。在这些比对的一些中，确定了GH3活性位点、催化残基和该家族中保守的(相似的)或高度保守的(相同的)的残基(见，例如，Bhatia等人，Crit Rev Biotechnol.，22：375-407[2002]；和Hong等人，上文；二者均通过引用并入本文)。在本发明的一些实施方案中，蛋白变体保留了来自亲本的这些残基或残基类别中的一些或全部(即，不存在对一些或全部保守位置的取代)。

信号肽

在一些实施方案中，β-葡糖苷酶多肽自其被表达的宿主细胞(例如，酵母或其他真菌细胞)分泌，并且作为包括信号肽(即，连接于多肽的氨基末端并引导编码多肽进入细胞分泌途径的氨基酸序列)的前蛋白表达。在一些实施方案中，信号肽是具有作为SEQ ID NO：6的残基1-19给出的序列的内源性嗜热子囊菌β-葡糖苷酶信号肽。在一些其他实施方案中，使用来自其他嗜热子囊菌分泌蛋白的信号肽。

在另外一些实施方案中，取决于宿主细胞和其他因素，使用其他信号肽。用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从米曲霉(Aspergillus oryzae)TAKA淀粉酶、黑曲霉(Aspergillus niger)中性淀粉酶、黑曲霉葡萄糖淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶、柔毛腐质霉(Humicolalanuginosa)脂肪酶以及里氏木霉(T.reesei)纤维二糖水解酶II(TrCBH2)获得的信号肽编码区。

用于细菌宿主细胞的有效的信号肽编码区包括但不限于从芽孢杆菌(Bacillus)NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)α-淀粉酶、地衣芽孢杆菌(Bacillus licheniformis)枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌(Bacillus subtilis)prsA的基因中获得的信号肽编码区。另外的信号肽是本领域已知的(见，例如，Simonen和Palva，Microbiol.Rev.，57：109-137[1993]，通过引用并入本文)。

用于酵母宿主细胞的有用的信号肽还包括来自酿酒酵母(Saccharomyces cerevisiae)α-因子，酿酒酵母SUC2转化酶(见，例如，Taussig和Carlson，Nucl.Acids Res.，11：1943-54[1983]；和SwissProt登录号P00724)，以及其他(见，例如，Romanos等人，Yeast 8：423-488[1992]，其通过引用并入本文)的基因的那些。这些信号肽和其他信号肽的适宜的变体也在本发明中有用途。

融合多肽和另外的序列元件

在一些实施方案中，本发明的β-葡糖苷酶多肽变体包括不改变β-葡糖苷酶的编码活性的另外的序列。例如，在一些实施方案中，β-葡糖苷酶与表位标签或与在β-葡糖苷酶纯化中有用的其他序列连接。

本发明还提供了β-葡糖苷酶变体融合多肽。在一些实施方案中，融合多肽包括编码本发明的β-葡糖苷酶多肽变体或其片段的氨基酸序列，该β-葡糖苷酶多肽变体通过其N末端或C末端与编码至少第二(另一个)多肽的氨基酸序列直接或间接地连接。在一些实施方案中，β-葡糖苷酶变体融合多肽还包括编码第三、第四、第五或另外的多肽的氨基酸序列。通常，每个另外的多肽具有生物学活性，或可选地，为具有生物学活性的多肽的一部分，其中该部分具有改进融合多肽从期望的表达宿主表达和/或分泌的作用。在一些实施方案中，这些序列被直接或间接地融合到β-葡糖苷酶多肽变体或其片段的N末端或C末端，或可选地融合到具有生物学活性的另外的多肽的N末端或C末端。

在一些实施方案中，另外的多肽编码酶或其活性片段，和/或改进融合多肽从期望的表达宿主表达和/或分泌的多肽。在其他一些实施方案中，另外的多肽编码纤维素酶(例如，具有不同于融合多肽中的β-葡糖苷酶多肽变体的氨基酸序列的β-葡糖苷酶，例如，野生型β-葡糖苷酶或其变体，包括不同的嗜热子囊菌β-葡糖苷酶多肽变体)，或表现CBH或EG活性的多肽)，和/或改进从期望的宿主细胞表达和分泌的多肽(例如，从期望的表达宿主正常表达和分泌的多肽，如从丝状真菌正常表达的分泌多肽)。这些包括但不限于来自黑曲霉、黑曲霉泡盛变种(A.niger var.awamori)、米曲霉的葡萄糖淀粉酶、α-淀粉酶和天冬氨酰蛋白酶，纤维二糖水解酶I，和纤维二糖水解酶II，木霉属(Trichoderma)内切葡聚糖酶I和内切葡聚糖酶III，以及链孢霉属(Neurospora)和腐质霉属(Humicola)葡萄糖淀粉酶(见，例如，WO 98/31821，其通过引用并入本文)。

在一些实施方案中，融合多肽的多肽组分彼此经接头(linker)间接连接。适宜在本发明的实践中使用的接头包括但不限于在通过引用并入本文的WO 2007/075899中描述的那些。示例性接头包括约1个至约40个氨基酸残基长度的肽接头，包括约1个至约20个氨基酸残基长度的那些以及约1个至约10个氨基酸残基长度的那些。在一些实施方案中，接头由单一氨基酸残基组成，诸如，例如，Gly、Ser、Ala或Thr残基，或其组合，特别是Gly和Ser。在一些实施方案中，本发明的实践中采用的接头是可切割的。在一些实施方案中，适合的可切割的接头包括切割位点，诸如蛋白酶识别位点。示例性蛋白酶识别位点是本领域熟知的并且包括但不限于Lys-Arg(例如，KEX2蛋白酶识别位点，其可被天然曲霉属KEX2样蛋白酶)以及Lys和Arg(例如，胰蛋白酶蛋白酶识别位点)(见，例如，WO07/075899，其通过引用并入本文)。

β-葡糖苷酶活性

本发明的β-葡糖苷酶多肽变体包括在指定条件下具有相对于野生型嗜热子囊菌β-葡糖苷酶(SEQ ID NO：2)的改进(例如，更大)的β-葡糖苷酶活性的那些。改进的β-葡糖苷酶活性可如本文所述测量。在一些实施方案中，当在相同条件下测定时，本发明的β-葡糖苷酶多肽具有比野生型嗜热子囊菌β-葡糖苷酶(SEQ ID NO：2)大至少约1倍、至少约2倍、至少约2.5倍、至少约2.7倍或多于2.7倍的β-葡糖苷酶活性水平。因而，本发明提供了与野生型Bgl1蛋白相比具有至少约1.1倍至约1.5倍、至少约1.5倍至约2.5倍以及大于约2.5倍的β-葡糖苷酶活性的β-葡糖苷酶多肽变体。本文提供了相比于野生型嗜热子囊菌β-葡糖苷酶具有改进的β-葡糖苷酶活性的示例性β-葡糖苷酶多肽变体。在一些实施方案中，本发明的β-葡糖苷酶多肽变体相比于野生型嗜热子囊菌β-葡糖苷酶还具有改进的热活性、改进的热稳定性和/或在低和/或高pH下改进的稳定性。在一些实施方案中，酶变体可操作的pH范围是在约pH3至约pH8的范围内(例如，约pH5)。在一些实施方案中，酶变体可操作的温度范围是在约50℃至约80℃的范围内(例如，约70℃)。

β-葡糖苷酶可通过本领域已知的任何适宜的方法确定。在一些实施方案中，使用对硝基苯基-β-D-吡喃葡萄糖苷(pNPG)测定来确定β-葡糖苷酶活性。在其他一些实施方案中，使用纤维二糖测定来确定β-葡糖苷酶活性。

例如，基于pNPG(对硝基苯基-β-D-吡喃葡萄糖苷)的比色测定在测量β-葡糖苷酶活性上具有用途。在另一个示例性pNPG测定中，在100μL的总体积中，将20μL包含β-葡糖苷酶的澄清培养基上清添加到pH 6.5的50mM磷酸钠缓冲液中的4mM pNPG溶液中。反应在pH 6.5、45℃下孵育1小时。用100μL pH 11的1M碳酸钠溶液猝灭反应混合物。在405nm测量溶液的吸光度来确定pNPG向对硝基苯酚的转化。在405nm测量对硝基苯酚(ε＝17,700M^-1cm^-1)的释放来计算β-葡糖苷酶活性。在一些实施方案中，在高通量筛选条件(pH 7，50℃)下观察可检测的β-葡糖苷酶活性(见，例如，Breves等人，Appl.Environ.Microbiol，.63：3902[1997]，通过引用并入本文)。

可选地，可使用利用纤维二糖作为底物的测定来确定β-葡糖苷酶活性。在100μL的总体积中，将25μL包含β-葡糖苷酶的澄清培养基上清添加到在100mM磷酸钠缓冲液(pH 6-7)或乙酸钠缓冲液(pH 5-5.5)中的10g/L纤维二糖(Fluka目录号22150，Sigma-Aldrich，Inc.，St.Louis，MO)中。反应在45-70℃下孵育适当时间(取决于酶浓度，25分钟至过夜)同时摇动。使用酶促葡萄糖测定(例如K-GLUC，Megazyme，Ireland)确定葡萄糖产生。10μl的每个反应被添加到190μl GOPOD试剂(作为K-GLUC测定试剂盒的一部分提供)中。反应在45℃孵育20分钟并且在510nm测量溶液的吸光度。GOPOD试剂包含50mM磷酸钾缓冲液pH7.4，0.011M对羟基苯甲酸、0.008％w/v叠氮化钠、葡萄糖氧化酶(＞12,000U/L)、过氧化物酶(＞650U/L)和80mg/L 4-氨基安替比林。试剂中的葡萄糖氧化酶与样品中存在的任何葡萄糖反应并产生过氧化氢，过氧化氢随后与4-氨基安替比林反应产生醌亚胺染料，醌亚胺染料的数量与存在的葡萄糖的量成比例并且可用分光光度计在510nm测量。

β-葡糖苷酶多核苷酸和表达***

本发明提供了编码本发明的嗜热子囊菌β-葡糖苷酶变体的多核苷酸序列。本文提供了嗜热子囊菌基因组序列和cDNA序列。

在一些实施方案中，为了本文描述的β-葡糖苷酶变体的表达，使用野生型嗜热子囊菌cDNA序列(SEQ ID NO：1)或其包括开放阅读框的部分(根据需要，具有在对应于产生相对于野生型序列的残基改变的取代的密码子处的改变)。此外，在一些实施方案中，本文所述的“沉默”核苷酸中的一个或多个被并入。

在其他一些实施方案中，非自然存在的序列是优选的。本领域技术人员理解由于遗传密码的简并性，存在众多编码本发明的β-葡糖苷酶多肽的核苷酸序列。例如，密码子AGA、AGG、CGA、CGC、CGG和CGU均编码氨基酸精氨酸。因而，在密码子指定精氨酸的本发明核酸中的每个位置，该密码子可被改变为以上所述的对应密码子中的任何一个而不改变所编码的多肽。应理解RNA序列中的U对应于DNA序列中的T。本发明考虑并提供可通过选择基于可能的密码子选择的组合而做出的编码本发明多肽的核酸序列的每种和每个可能的变化。

还可以关于高密码子使用偏倚性密码子(即，在蛋白编码区中以高于编码同一氨基酸的其他密码子的频率被使用的密码子)来设计DNA序列。可以根据在单基因、一组具有共同功能或起源的基因、高表达基因中的密码子使用，在整个生物体的聚集蛋白编码区中的密码子频率，在相关生物体中的聚集蛋白编码区中的密码子频率或它们的组合来确定优选的密码子。频率随基因表达水平而提高的密码子通常是用于表达的优化密码子。在一些实施方案中，编码β-葡糖苷酶的DNA序列被优化以用于在特定宿主生物中表达。任何适宜的产生优化密码子的方法在本发明中有用途。通过举例说明，但非限制，SEQ ID NO：7提供了被设计具有用于在酿酒酵母中表达的密码子偏倚性的编码WT^M(SEQ ID NO：4)的多核苷酸序列。表2提供了每个氨基酸的密码子。

已知用于确定具体生物体中的密码子频率(例如，密码子使用，相关的同义密码子使用)和密码子偏爱的多种方法，包括多变量分析，例如使用聚类分析或对应性分析，以及在基因中使用的密码子的有效数目(见例如，GCG CodonPreference，Genetics Computer Group Wisconsin Package；John Peden，“Codon W，”University of Nottingham[1999]；McInerney，Bioinformatics 14：372-73 [1998]；Stenico等人，Nucl.Acids Res.，22：2437-46[1994]；Wright，Gene 87：23-29 [1990]；Wada等人，Nucl.Acids Res.，20：2111-2118 [1992]；Nakamura 等人，2000，Nucl.Acids Res.，28：292；以及Henaut和Danchin，于：Neidhardt等人(编)，Escherichia coli andSalmonella，ASM Press，Washington D.C.，[1996]，页码2047-2066，其均通过引用并入本文)。用于获得密码子使用的数据源可能依赖于任何可用的能够编码蛋白的核苷酸序列。这些数据集包括实际已知编码表达的蛋白的核酸序列(例如，完整的蛋白编码序列-CDS)、表达序列标签(EST)、或基因组序列的预测编码区(见，例如Mount，Bioinformatics：Sequence andGenome Analysis，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，N.Y.，[2001]，第8章；Uberbacher，Meth.Enzymol.266：259-281[1996]；以及Tiwari等人，Comput.Appl.Biosci.，13：263-270[1997]，其均通过引用并入本文)。

表达载体

在一些实施方案中，本发明利用包含编码如以上所述的至少一种β-葡糖苷酶的序列的重组构建体。在一些实施方案中，本发明提供了包括与异源启动子可操作地连接的至少一种β-葡糖苷酶多核苷酸的表达载体。本发明的表达载体在转化适当宿主细胞以允许宿主表达β-葡糖苷酶蛋白方面有用途。用于在真菌和其他生物体中重组表达蛋白的方法是本领域熟知的，并且许多表达载体是可用的或可使用本领域已知的常规方法来构建(见，例如，Zhu等人，Plasmid 6：128-33[2009]，其通过引用并入本文)。

在一些实施方案中，本发明的核酸构建体包括本发明的至少一种核酸序列被***其中的载体(例如，质粒、黏粒、噬菌体、病毒、细菌人工染色体[BAC]、酵母人工染色体[YAC]等等)。本发明的多核苷酸可被并入适于表达多肽的各种表达载体中的任何一种。适合的载体包括但不限于：染色体、非染色体和合成的DNA序列(例如，SV40的衍生物)，细菌质粒，噬菌体DNA，杆状病毒，酵母质粒，从质粒和噬菌体DNA的组合衍生的载体，或病毒DNA(例如，牛痘苗、腺病毒、鸡痘病毒、伪狂犬病毒、腺病毒、腺相关病毒、逆转录病毒等等)。将遗传物质转导到细胞中并且，如果复制是令人期望的，在选择宿主中可复制和可维持的任何适宜载体在本发明中具有用途。

在一些实施方案中，构建体还包括与蛋白编码序列可操作地连接的调节序列，包括例如，启动子。大量的适宜载体和启动子是本领域技术人员已知的。

启动子/基因构建体

如以上所指出的，为了在特定宿主中获得高表达水平，在异源启动子的控制下表达嗜热子囊菌β-葡糖苷酶通常是有用的。在一些实施方案中，使用常规方法将启动子序列与嗜热子囊菌β-葡糖苷酶编码序列的5’区域可操作地连接。

用于表达β-葡糖苷酶多核苷酸的有用的启动子的实例包括但不限于来自真菌的启动子。例如，驱动嗜热子囊菌中除β-葡糖苷酶1基因以外的基因的表达的启动子序列(例如，来自编码纤维二糖水解酶的基因的真菌启动子)在本发明中有用途。

其他可用于指导本发明的核苷酸构建体在丝状真菌宿主细胞中转录的适宜启动子的实例包括但不限于：从米曲霉TAKA淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillusnidulans)乙酰胺酶、以及尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(见，例如，WO 96/00787，通过引用并入本文)的基因获得的启动子，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体)，启动子诸如cbh1、cbh2、egl1、egl2、pepA、hfb1、hfb2、xyn1、amy、和glaA(见，例如，Nunberg等人，Mol.Cell Biol.，4：2306-2315 [1984]；Boel等人，EMBO J.3：1581-85 [1984]；和欧洲专利申请公布第137280号，其全部通过引用并入本文)，及其突变的、截短的和杂合的启动子。在酵母宿主细胞中，有用的启动子包括但不限于来自酿酒酵母烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)以及酿酒酵母3-磷酸甘油酸激酶的基因的那些。用于酵母宿主细胞的其他有用的启动子包括由Romanos等人，(Romanos等人，Yeast 8：423-488[1992]，其通过引用并入本文)描述的那些。与真菌(例如，白色扁丝霉(Aphanocladium album)和哈茨木霉(Trichoderma harzianum))中几丁质酶的产生有关的启动子也有用途(见，例如，Blaiseau和Lafay，Gene 120243-248[1992]；和Limon等人，Curr. Genet.，28：478-83 [1995]，二者均通过引用并入本文)。

已知在原核细胞或真核细胞或其病毒中控制基因表达且在本发明的一些实施方案中有用途的启动子包括但不限于SV40启动子、大肠杆菌lac或trp启动子、噬菌体λPL启动子、tac启动子、T7启动子等。对于在细菌宿主细胞中使用，适宜启动子包括但不限于从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacilluslicheniformis)α-淀粉酶基因(amyl)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、枯草芽孢杆菌xylA和xylB基因，和原核β-内酰胺酶基因获得的启动子。

实际上，在适宜宿主细胞中驱动表达的任何适宜的启动子序列在本发明中具有用途。适宜的启动子序列可使用熟知方法来鉴定。在一种方法中，推定的启动子序列与编码报道蛋白的序列5’连接，将该构建体转染到宿主细胞(例如，嗜热子囊菌)中并测量报道基因的表达水平。可通过测量例如报道基因序列的mRNA水平、报道蛋白的酶活性、和/或产生的报道蛋白的量来确定报道基因的表达。例如，可通过使用绿色荧光蛋白作为编码序列(见Henriksen等人，Microbiol.，145：729-34 [1999]，通过引用并入本文)或lacZ报道基因(Punt等人，Gene，197：189-93 [1997]，通过引用并入本文)来确定启动子活性。可使用任何本领域已知的适宜方法借助定向进化法从自然存在的启动子序列获取功能启动子(见例如，Wright等人，Hum.Gene Ther.，16：881-892[2005]，通过引用并入本文)。

表达载体任选地包含用于翻译起始的核糖体结合位点和转录终止子(例如PinII)。在一些实施方案中，载体还包括用于扩大表达的适当的序列(例如，增强子)。

此外，在一些实施方案中，本发明的表达载体包含一个或多个选择性标记基因来提供用于选择转化的宿主细胞的表型性状。适宜的标记基因包括但不限于编码抗微生物抗性(例如，对氨苄西林(ampR)、卡那霉素、氯霉素、四环素、链霉素、壮观霉素、新霉素、遗传霉素、潮霉素等等) 的那些标记基因，包括但不限于aada基因、链霉素磷酸转移酶(spt)基因、新霉素磷酸转移酶(nptII)基因或潮霉素磷酸转移酶(hpt)基因。另外的选择性标记基因包括但不限于用于真核细胞的二氢叶酸还原酶或新霉素抗性，以及在大肠杆菌中的四环素或氨苄西林抗性。

β-葡糖苷酶多核苷酸的合成和操作

可使用本领域已知的任何适宜方法制备编码β-葡糖苷酶的多核苷酸。在一些实施方案中，高达大约40个碱基的寡核苷酸被个体地合成，然后连接(例如，通过酶连接或化学连接方法或聚合酶介导的方法)形成基本上任何期望的连续序列。在一些实施方案中，通过使用例如经典亚磷酰胺方法(见例如，Beaucage等人，Tetrahed.Lett.，22：1859-69[1981]；和Matthes，等人，EMBO J.3：801-05[1984]，二者均通过引用并入本文)的化学合成来制备本发明的多核苷酸。这些方法通常在自动化合成方法中实践。例如，在亚磷酰胺方法中，寡核苷酸被合成(例如在自动化DNA合成器中)，纯化，退火，连接并克隆到适当载体中。

另外，基本上任何核酸都可以从各种商业来源中的任何一种定制，诸如The Midland Certified Reagent Company(Midland，TX)，The GreatAmerican Gene Company(Ramona，CA)，ExpressGen Inc.(Chicago，IL)，Operon Technologies Inc.(Alameda，CA)以及许多其他来源。因而，这些商业公司提供的核酸也在本发明中具有用途。

还旨在通过诉诸熟知技术来合成本发明的多核苷酸(见例如，Carruthers，等人，Cold Spring Harbor Symp.Quant.Biol.，47：411-18 [1982]；和Adams等人，J.Am.Chem.Soc.，105：661 [1983]，二者均通过引用并入本文)。在一些实施方案中，然后通过合成互补链并且在适当条件下使链退火在一起，或者使用DNA聚合酶与适当引物序列添加互补链来获得双链DNA片段。对于体外扩增方法，包括聚合酶链反应(PCR)和连接酶链反应(LCR)，以及许多其他的相关方法，存在许多本领域技术人员已知的教科书和参考文献。

表达宿主

本发明还提供了用编码β-葡糖苷酶的表达载体或DNA构建体转化的工程化(重组)的宿主细胞。在一些实施方案中，细胞中β-葡糖苷酶的表达在异源启动子的控制之下。在一些实施方案中，本发明的宿主细胞用于产生β-葡糖苷酶多肽。因而，本发明涉及至少一种包含被描述的本发明的任何β-葡糖苷酶多核苷酸的宿主细胞。如本文所用，遗传修饰的或重组的宿主细胞包括含编码本发明的至少一种重组多肽的至少一种β-葡糖苷酶多核苷酸的宿主细胞的后代。在一些实施方案中，遗传修饰的或重组的宿主细胞是微生物。在一些实施方案中，遗传修饰的或重组的宿主细胞是原核细胞。在一些实施方案中，遗传修饰的或重组的宿主细胞是真核细胞。在一些实施方案中，真核宿主细胞是非人类细胞。适宜的真核宿主细胞包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案中，宿主细胞被修饰以增加蛋白表达、分泌或稳定性，或赋予其他期望的特征。已被突变或选择具有低蛋白酶活性的细胞(例如真菌)对于表达是特别有用的。例如，在一些实施方案中，嗜热子囊菌的蛋白酶缺陷菌株(例如，其中碱性蛋白酶基因座已被缺失或破坏)具有用途。

适宜的真菌宿主细胞包括但不限于子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、不完全菌(Deuteromycota)、接合菌门(Zygomycota)和半知菌(Fungi imperfecti)。在一些实施方案中，真菌宿主细胞是酵母细胞或丝状真菌细胞。本发明的丝状真菌宿主细胞包括真菌亚门(Eumycotina)和卵菌门(Oomycota)的所有丝状形式。丝状真菌的特征为营养菌丝和由几丁质、纤维素及其他复杂多糖组成的细胞壁。本发明的丝状真菌宿主细胞与酵母在形态学上是不同的。在一些实施方案中，丝状真菌宿主细胞是绵霉属(Achlya)、枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内座壳属(Endothia)、镰孢菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、毛霉属(Mucor)、链孢霉属(Neurospora)、青霉属(Penicillium)、Podospora、射脉革菌属(Phlebia)、Piromyces、梨孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、节格孢属(Scytalidium)、侧孢霉属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Trametes)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)的种，或其无性型或有性型，以及同义词或分类学等同物。然而，不旨在本发明被限于任何具体物种的丝状真菌宿主细胞。

在本发明的一些实施方案中，丝状真菌宿主细胞是曲霉属物种(Aspergillus sp.)、拟蜡菌属物种(Ceriporiopsis sp.)、金孢属物种(Chrysosporium sp.)、棒囊壳菌属物种(Corynascus sp.)、镰孢菌属物种(Fusarium sp.)、腐质霉属物种(Humicola sp.)、链孢霉属物种(Neurosporasp.)、青霉属物种(Penicillium sp.)、弯颈霉属物种(Tolypocladium sp.)、栓菌属物种(Tramates sp.)或木霉属物种(Trichoderma sp.)。

在本发明的一些实施方案中，丝状真菌宿主细胞是木霉属的种(例如，长枝木霉(T.longibrachiatum)、绿色木霉(T.viride)[例如，ATCC32098和32086])，红褐肉座菌(Hypocreajecorina)或里氏木霉(NRRL15709、ATTC 13631、56764、56765、56466、56767和RL-P37及其衍生物；见Sheir-Neiss等人，Appl.Microbiol.Biotechnol.，20：46-53[1984]，其通过引用并入本文)，康氏木霉(T.koningii)或哈茨木霉。另外，术语“木霉属”是指之前分类为木霉属的任何真菌菌株以及目前分类为木霉属的那些菌株。

在本发明的一些实施方案中，丝状真菌宿主细胞是曲霉属的种(例如，泡盛曲霉、烟曲霉(A.funigatus)、日本曲霉(A.japonicus)、构巢曲霉、黑曲霉、棘孢曲霉(A.aculeatus)、臭曲霉(A.foetidus)、米曲霉、酱油曲霉(A.sojae)、或A.kawachi；见例如，Kelly和Hynes、EMBO J.4，475479[1985]；NRRL 3112、ATCC 11490、22342、44733、及14331；Yelton等人，Proc.Natl.Acad.Sci.USA，81，1470-1474[1984]；Tilburn等人，Gene 26，205-221[1982]；和Johnston等人，EMBO J.，4：1307-1311[1985]，其全部通过引用并入本文)。

在本发明的一些实施方案中，丝状真菌宿主细胞是镰孢菌属的种(例如，F.bactridioides、F.cerealis、克鲁克威尔镰孢(F.crookwellense)、大刀镰孢(F.culmorum)、禾谷镰孢(F.graminearum)、禾赤镰孢(F.graminum)、尖镰孢(F.oxysporum)、粉红镰孢(F.roseum)或F.venenatum)。在本发明的一些实施方案中，丝状真菌细胞是链孢霉属的种(例如，N.crassa；见例如Case等人，Proc.Natl.Acad.Sci.USA，76，5259-5263[1979]；美国专利第4,486,553号；以及Kinsey和Rambosek，Mol.Cell.Biol.，4：117-122[1984]，其全部通过引用并入本文)。

在本发明的一些实施方案中，丝状真菌宿主细胞是腐质霉属的种(例如，特异腐质霉、灰腐质霉(H.grisea)或柔毛腐质霉(H.lanuginosa))。在本发明的一些实施方案中，丝状真菌宿主细胞是毛霉属(例如，米黑毛霉或卷枝毛霉(M circinelloides))。在本发明的一些实施方案中，丝状真菌宿主细胞是根霉属的种(例如，米根霉(R.oryzae)或雪白根霉(R.niveus))。在本发明的一些实施方案中，丝状真菌宿主细胞是青霉属的种(例如，产紫青霉(P.purpurogenum)、产黄青霉(P.chrysogenum)或疣孢青霉(P.verruculosum))。在本发明的一些实施方案中，丝状真菌宿主细胞是梭孢壳属的种(例如，太瑞斯梭孢壳霉(T.terrestris))。在本发明的一些实施方案中，丝状真菌宿主细胞是弯颈霉属的种(例如，膨大弯颈霉(T.inflatum)或T.geodes)。在本发明的一些实施方案中，丝状真菌宿主细胞是栓菌属的种(例如，长绒毛栓菌(T.villosa)或变色栓菌(T.versicolor))。

在本发明的一些实施方案中，丝状真菌宿主细胞是金孢属的种(例如，C.lucknowense、嗜角蛋白金孢(C.keratinophilum)、热带金孢(C.tropicum)、粪状金孢(C.merdarium)、C.inops、C.pannicola或C. zonatum)。在一些实施方案中，宿主细胞是C.lucknowense。

在本发明的一些实施方案中，酵母宿主细胞具有用途，包括但不限于假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyce)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)和耶氏酵母属(Yarrowia)的种。在本发明的一些实施方案中，酵母细胞是多形汉逊酵母(Hansenulapolymorpha)、酿酒酵母(Saccharomyces cerevisiae)、卡氏酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、奇异酵母(Saccharomyces norbensis)、克氏酵母(Saccharomyceskluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichia pastoris)、芬兰毕赤酵母(Pichia finlandica)、喜海藻糖毕赤酵母(Pichia trehalophila)、Pichia kodamae、膜醭毕赤酵母(Pichiamembranaefaciens)、Pichia opuntiae、耐热毕赤酵母(Pichiathermotolerans)、柳毕赤酵母(Pichia salictaria)、Pichia quercuum、皮杰普毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色念珠菌(Candida albicans)或解脂耶氏酵母(Yarrowia lipolytica)。

在本发明的一些实施方案中，宿主细胞是藻类细胞诸如衣藻属(Chlamydomonas)(例如，莱茵衣藻(C.Reinhardtii))或席藻属(Phormidium)(席藻属物种(P.sp.)ATCC29409)。

在其他一些实施方案中，宿主细胞是原核细胞。适宜的原核细胞包括革兰氏阳性、革兰氏阴性和革兰氏染色不定(Gram-variable)的细菌细胞。在一些实施方案中，宿主细胞是土壤杆菌属(Agrobacterium)、脂环酸杆菌属(Alicyclobacillus)、鱼腥蓝细菌属(Anabaena)、组囊蓝细菌属(Anacystis)、不动杆菌属(Acinetobacter)、热酸菌属(Acidothermus)、Arthrobacter(节杆菌属)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、巴克纳氏菌属(Buchnera)、Campestris、弯曲菌属 (Camplyobacter)、梭菌属(Clostridium)、棒杆菌属(Corynebacterium)、着色菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、梭杆菌属(Fusobacterium)、Faecalibacterium、弗朗西丝氏菌属(Francisella)、黄杆菌属(Flavobacterium)、土芽孢杆菌属(Geobacillus)、嗜血菌属(Haemophilus)、螺杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中慢生根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟氏球菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属、罗氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、集球藻属(Synechococcus)、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、热厌氧杆菌属(Thermoanaerobacterium)、Tropheryma、Tularensis、Temecula、嗜热聚球蓝细菌属(Thermosynechococcus)、热球菌属(Thermococcus)、尿枝原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)或发酵单胞菌属(Zymomonas)的种。然而，不旨在宿主细胞被限于任何具体的属或种的细菌，因为任何适宜的细菌在本发明中具有用途。

在一些实施方案中，宿主细胞是土壤杆菌属、不动杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、巴克纳氏菌属、土芽孢杆菌属、弯曲菌属、梭菌属、棒杆菌属、埃希氏菌属、肠球菌属、欧文氏菌属、黄杆菌属、乳杆菌属、乳球菌属、泛菌属、假单胞菌属、葡萄球菌属、沙门氏菌属、链球菌属、链霉菌属、或发酵单胞菌属的种。

在其他一些实施方案中，细菌宿主菌株是对人非致病的。在一些实施方案中，细菌宿主菌株是工业菌株。众多细菌工业菌株是已知的且适合用于本发明。实际上，旨在任何适宜菌株在本发明中具有用途。

在本发明的一些实施方案中，细菌宿主细胞是土壤杆菌属的种(例如，放射形土壤杆菌(A.radiobacter)、发根土壤杆菌(A.rhizogenes)或钩子土壤杆菌(A.rubi))。在本发明的一些实施方案中，细菌宿主细胞是节杆菌属的种(例如，金黄节杆菌(A.aurescens)、柠檬节杆菌(A.citreus)、球形节杆菌(A.globformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、原玻璃蝇短杆菌(A.protophonniae)、玫瑰色石蜡节杆菌(A.roseoparqffinus)、硫磺节杆菌(A.sulfureus)、或产脲节杆菌(A.ureafaciens))。在本发明的另外一些实施方案中，细菌宿主细胞是芽孢杆菌属的种(例如，苏云金芽孢杆菌(B.thuringiensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草芽孢杆菌(B.subtilis)、迟缓芽孢杆菌(B.lentus)、环状芽孢杆菌(B.circulans)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短芽孢杆菌(B.brevis)、坚强芽孢杆菌(B.firmus)、B.alkaophius、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、耐盐嗜碱芽孢杆菌(B.halodurans)、或解淀粉芽孢杆菌(B.amyloliquefaciens)。在特定实施方案中，宿主细胞将是工业芽孢杆菌菌株，包括但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌、或解淀粉芽孢杆菌)。在一些实施方案中，芽孢杆菌属宿主细胞是枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、或解淀粉芽孢杆菌。在一些实施方案中，细菌宿主细胞是梭菌属的种(例如，丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌(C.tetani)E88、象牙海岸梭菌(C.lituseburense)、糖丁酸梭菌(C.saccharobutylicum)、产气荚膜梭菌(C.perfringens)、热纤梭菌(C.thermocellum)或拜氏梭菌(C.beijerinckii))。在一些实施方案中，细菌宿主细胞是棒杆菌属的种(例如，谷氨酸棒杆菌(C.glutamicum)或嗜乙酰乙酸棒杆菌(C.acetoacidophilum))。在一些实施方案中，细菌宿主细胞是埃希氏菌属的种(例如大肠杆菌)。在一些实施方案中，细菌宿主细胞是欧文氏菌属的种(例如，噬夏孢欧文氏菌(E.uredovora)、胡萝卜软腐欧文氏菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文氏菌(E.herbicola)、点状欧文氏菌(E.punctata)或土欧文氏菌(E.terreus))。在一些实施方案中，细菌宿主细胞是泛菌属的种(例如柠檬泛菌(P.citrea)或成团泛菌(P.agglomerans))。在一些实施方案中，细菌宿主细胞是假单胞菌属的种(例如，恶臭假单胞菌(P.putida)、荧光假单胞菌(P.fluorescens)、铜绿假单胞菌(P.aeruginosa)、P.mevalonii或假单胞菌D-0l10)。在一些实施方案中，细菌宿主细胞是链球菌属的种(例如，似马链球菌(S.equisimiles)、酿脓链球菌(S.pyogenes)或***链球菌(S.uberis))。在一些实施方案中，细菌宿主细胞是链霉菌属的种(例如，产二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌(S.avermitilis)、天蓝色链霉菌(S.coelicolor)、生金色链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)或浅青紫链霉菌(S.lividans))。在一些实施方案中，细菌宿主细胞是发酵单胞菌属的种(例如，运动发酵单胞菌(Z.mobilis)或解脂发酵单胞菌(Z.lipolytica))。

在本发明中具有用途的菌株包括原核和真核菌株，对于公众来说是容易从许多培养物保藏中心获得，诸如美国模式培养物保藏中心(American Type Culture Collection，ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH，DSM)、皇家荷兰生物科技研究所培养物保藏中心(Centraalbureau VoorSchimmelcultures，CBS)和美国北部区域研究中心农业研究服务专利培养物保藏中心(Agricultural Research Service Patent Culture Collection，Northern Regional Research Center，NRRL)。

在本发明的一些实施方案中，宿主细胞被遗传修饰以具有改进蛋白分泌、蛋白稳定性或其他蛋白表达和/或分泌所期望的特性的特征。旨在通过使用任何本领域已知的适宜方法实现遗传修饰，包括但不限于基因工程技术、经典微生物学技术(例如，化学诱变或紫外线诱变以及随后的选择)。在一些实施方案中，重组修饰和经典选择技术的组合用于产生感兴趣的生物体。使用重组技术，以导致生物体或培养物内β-葡糖苷酶产量增加的方式将核酸分子引入、缺失、抑制或修饰。例如，Alp1功能的敲除得到不表达大部分或全部纤维素酶的细胞。pyr5功能的敲除得到具有嘧啶缺陷表型的细胞。这些修饰和其他修饰在本发明中具有用途。

转化和培养

用于将载体或DNA构建体引入宿主细胞的任何适宜方法在本发明中具有用途，包括但不限于磷酸钙转染、DEAE-葡聚糖介导的转染、电穿孔或其他本领域已知的常见技术。

在本发明的一些实施方案中，工程化宿主细胞被培养在改良为适合激活启动子、选择转化子和/或扩增β-葡糖苷酶多核苷酸的常规营养培养基中。培养条件诸如温度、pH等是之前被选择用于表达的宿主细胞所用的培养条件，并且将对本领域技术人员是明显的。许多参考文献对本领域技术人员已知的并且对于许多细胞的培养和产生是可用的，所述细胞包括细菌、植物、动物(尤其是哺乳动物)和古细菌来源的细胞。

在本发明的一些实施方案中，表达本发明的β-葡糖苷酶多肽的宿主细胞生长在分批发酵或连续发酵条件下。经典的“分批发酵”是封闭***，其中培养基的组成在发酵开始时设定并且在发酵期间不经历人为改变。批次***的改变是“分批补料发酵(fed-batch fermentation)”，其也在本发明中具有用途。在分批补料***中，基质随着发酵进行被增量加入。当分解代谢物阻遏(catabolite repression)可能抑制细胞的代谢时和在期望培养基中具有有限量的基质的情况下，分批补料***是有用的。分批发酵和分批补料发酵在本领域中是常见的和熟知的。“连续发酵”是确定成分的发酵培养基被连续添加到生物反应器并且等量的条件培养基被同时移出用于加工的开放***。连续发酵一般保持培养物在恒定的高密度，其中细胞主要处于对数期生长。连续发酵***努力保持稳定态生长条件。用于调整营养和生长因子用于连续发酵过程的方法以及使产物形成速率最大化的技术是工业微生物学领域熟知的。

在本发明的一些实施方案中，使用本发明的多核苷酸采用无细胞的转录/翻译***来产生β-葡糖苷酶多肽。几种此类***是市售的并且是本领域技术人员熟知的。

β-葡糖苷酶多肽的产生和回收

本发明提供了制备具有β-葡糖苷酶活性的多肽的方法。在一些实施方案中，方法包括提供用本发明的任何一种(或多种)描述的β-葡糖苷酶多核苷酸转化的宿主细胞；在宿主细胞表达编码的β-葡糖苷酶多肽的条件下将该转化的宿主细胞培养在培养基中；和任选地回收或分离表达的β-葡糖苷酶多肽，或回收或分离含表达的β-葡糖苷酶多肽的培养基。在本发明的一些实施方案中，方法还提供在表达编码的β-葡糖苷酶多肽后裂解转化的宿主细胞的步骤。在一些实施方案中，在转化的细胞被裂解后，表达的β-葡糖苷酶多肽从细胞裂解物中被回收或分离。本发明还提供了制备至少一种β-葡糖苷酶多肽的方法，包括在适于产生至少一种β-葡糖苷酶多肽的条件下培养用至少一种β-葡糖苷酶多核苷酸转化的宿主细胞并且回收至少一种产生的β-葡糖苷酶多肽。

在一些实施方案中，使用本领域熟知的蛋白回收技术包括本文描述的那些技术，从宿主细胞培养基、宿主细胞或二者中回收或分离β-葡糖苷酶多肽。在一些实施方案中，通过离心收集细胞，通过物理或化学手段破坏细胞，且保留所得粗提取物用于进一步纯化。考虑任何适于破坏表达β-葡糖苷酶多肽的细胞的任何方法在本发明中具有用途，这些方法包括但不限于冻-融循环、声处理、机械破坏或使用细胞裂解剂，或本领域技术人员熟知的其他方法。

在本发明的一些实施方案中，所得多肽被回收/分离并任选地通过许多本领域已知方法中的任一种被纯化。例如，在一些实施方案中，多肽通过常规程序从营养培养基中分离，所述常规程序包括但不限于离心、过滤、提取、喷雾干燥、蒸发、色谱(例如，离子交换色谱、亲和色谱、疏水相互作用色谱、色谱聚焦、和/或尺寸排阻色谱)和/或沉淀。在一些实施方案中，根据期望/需要使用蛋白重折叠步骤，以获得多肽的正确构象。另外，在一些实施方案中，在最后的纯化步骤中利用高效液相色谱(HPLC)(见例如，Parry等人，Biochem.J.，353：117[2001]；和Hong等人，Appl.Microbiol.Biotechnol.73：1331[2007]，二者均通过引用并入本文)。存在本领域已知的多种纯化方法并且任何适宜方法在本发明中具有用途。

在一些实施方案中，使用免疫学方法来纯化β-葡糖苷酶多肽。在一些实施方案中，使用常规方法针对至少β-葡糖苷酶多肽(例如针对包含SEQID NO：2的多肽或其免疫原性片段)产生的抗体被固定在珠上，在β-葡糖苷酶被结合的条件下与细胞培养基混合，并沉淀。在其他一些实施方案中，免疫色谱具有用途。

在本发明的一些实施方案中，β-葡糖苷酶作为包含非酶部分的融合蛋白表达。在一些实施方案中，β-葡糖苷酶序列与促进纯化的结构域(purification facilitating domain)融合。如本文所用，术语“促进纯化的结构域”是指介导与之融合的多肽的纯化的结构域。适宜的纯化结构域包括但不限于金属螯合肽，允许在固定化金属上纯化的组氨酸-色氨酸模块，结合谷胱甘肽的序列(例如GST)，血凝素(HA)标签(即，对应于从流感血凝素蛋白获取的表位；Wilson等人，Cell 37：767 [1984])，麦芽糖结合蛋白序列，在FLAGS延伸/亲和纯化***(Immunex Corp，Seattle，Wash)中利用的FLAG表位，以及类似的纯化结构域。在纯化结构域和HHDH多肽之间包含蛋白酶可切割的多肽连接体序列可用于促进纯化。考虑在本文所述的组合物和方法中使用的一种表达载体提供包含由肠激酶切割位点分隔的融合于聚组氨酸区域的本发明多肽的融合蛋白的表达。组氨酸残基促进IMIAC(固定化金属离子纯化色谱；见例如，Porath等人，Prot.Express.Purific.，3：263-281[1992])纯化，而肠激酶切割位点提供将HHDH多肽从融合蛋白分离的手段。pGEX载体(Promega；Madison，Wis.)在表达具有谷胱甘肽S转移酶(GST)的本发明的融合多肽方面也具有用途。一般地说，这些融合蛋白是可溶的，并且通过吸附于配体-琼脂糖珠(例如，在GST-融合物情况下的谷胱甘肽-琼脂糖)，接着在游离配体的存在下洗脱，可容易地从裂解细胞中纯化。

使用β-葡糖苷酶多肽和表达β-葡糖苷酶多肽的细胞的方法

如本文所述，本发明的β-葡糖苷酶多肽在催化糖二聚体的水解同时释放相应的糖单体(例如，纤维二糖的转化同时释放葡萄糖)方面具有用途。因而，本发明提供了通过以下方式产生葡萄糖的方法：(a)提供纤维二糖；和(b)使纤维二糖与本发明的至少一种β-葡糖苷酶多肽在足以形成将纤维二糖转化为葡萄糖的反应混合物的条件下接触。在一些实施方案中，在此类方法中以分离形式利用β-葡糖苷酶多肽，而在其他实施方案中，至少一种β-葡糖苷酶多肽被用作组合物的一部分。在一些实施方案中，β-葡糖苷酶多肽在细胞培养基或在细胞裂解物中提供。在一些实施方案中，在通过培养用本发明的β-葡糖苷酶多核苷酸或载体转化的宿主细胞产生β-葡糖苷酶多肽以后，β-葡糖苷酶不必从培养基(即，如果β-葡糖苷酶被分泌到培养基中的话)或细胞裂解物(即，如果β-葡糖苷酶没有被分泌到培养基中的话)中分离或不必以可用于使用β-葡糖苷酶多肽的另外的方法的纯化形式使用。旨在包含本发明的至少一种β-葡糖苷酶多肽的任何组合物、细胞培养基或细胞裂解物适于在利用β-葡糖苷酶的方法中使用。因此，本发明还提供了通过以下方式产生葡萄糖的方法：(a)提供纤维二糖；和(b)使纤维二糖与包含本发明的至少一种β-葡糖苷酶多肽的培养基或细胞裂解物或组合物在足以形成将纤维二糖转化为葡萄糖的反应混合物的条件下接触。

本发明还提供了可用于将纤维二糖酶促转化为葡萄糖的组合物。例如，在本发明的一些实施方案中，将一种或多种β-葡糖苷酶多肽与如本文所述的至少一种另外的酶和/或改变块体材料处理特性或β-葡糖苷酶另外的加工性的剂(例如，助流剂、水、缓冲剂、表面活性剂等)或改进纤维二糖转化成葡萄糖的效率的剂组合。在一些实施方案中，另外的酶是不同的β-葡糖苷酶，而在其他实施方案中，是另一种纤维素酶或来自不同类别的酶(例如，淀粉酶等等)。

纤维素酶混合物

在本发明的一些实施方案中，将本文提供的至少一种β-葡糖苷酶与其他纤维素酶组合形成纤维素酶混合物。在一些实施方案中，纤维素酶混合物包括选自CBH、EG和BG纤维素酶的纤维素酶(例如，来自里氏木霉(例如，可购自Sigma-Aldrich，Inc.的来自里氏木霉ATCC编号25921的C2730纤维素酶；和可购自Genencor的C9870 ACCELLERASE^TM 1500)，解纤维热酸菌(Acidothermus cellulolyticus)、褐色嗜热裂孢菌(Thermobifidafusca)、灰腐质霉和金孢菌的纤维素酶)。纤维素酶混合物的酶一起作用来解晶并水解生物质基质中的纤维素以产生可溶性糖，包括但不限于葡萄糖。

用于有效酶促水解纤维素的纤维素酶混合物是已知的(见例如，Viikari等人，Adv.Biochem.Eng.Biotechnol.，108：121-45，[2007]；和美国专利申请公布US 2009/0061484；US 2008/0057541；和US 2009/0209009；每一篇均通过引用并入本文)。在一些实施方案中，将纯化的自然存在或重组的酶的混合物与纤维素原料或纤维素水解产物组合。可选地或另外地，可将各自产生一种或多种自然存在或重组的纤维素酶的一个或多个细胞群体与纤维素原料或纤维素水解产物组合。

β-葡糖苷酶组合物的其他组分

在一些实施方案中，本发明的β-葡糖苷酶多肽在包含多肽与其他任选成分诸如缓冲剂、表面活性剂和/或精练剂的组合的组合物中使用。在一些实施方案中，至少一种缓冲剂用于本发明的β-葡糖苷酶多肽(任选地与其他纤维素酶组合，包括另一种β-葡糖苷酶和/或其他酶)以保持采用β-葡糖苷酶的溶液中期望的pH。采用的缓冲液的精确浓度将取决于本领域技术人员可确定的若干因素。适宜的缓冲剂是本领域熟知的。在一些实施方案中，至少一种表面活性剂与本发明的β-葡糖苷酶组合使用。适宜的表面活性剂包括与β-葡糖苷酶以及任选地使用的任何其他纤维素酶和/或酶相容的任何表面活性剂。示例性表面活性剂包括但不限于阴离子表面活性剂、非离子表面活性剂和两性表面活性剂。

适合的阴离子表面活性剂包括但不限于直链或支链的烷基苯磺酸盐；具有直链或支链的烷基或烯基的烷基或烯基醚硫酸盐；烷基或烯基硫酸盐；烯基磺酸盐；烷基磺酸盐等等。适合的阴离子表面活性剂的反离子包括但不限于碱金属离子(例如，钠和钾)；碱土金属离子(例如，钙和镁)；铵离子；和具有1到3个碳数目2或3的链烷醇基团的链烷醇胺。适于在本发明的实践中使用的两性表面活性剂包括但不限于季铵盐磺酸盐、甜菜碱型两性表面活性剂等等。适合的非离子表面活性剂包括但不限于聚氧化烯醚以及高级脂肪酸烷醇酰胺或其烯化氧加合物，脂肪酸甘油单酯等等。在一些实施方案中，表面活性剂的混合物(例如，本领域熟知的那些)在本发明中具有用途。

从纤维素生物质产生可发酵的糖

在本发明的一些实施方案中，本发明的β-葡糖苷酶多肽以及包含此类β-葡糖苷酶多肽的任何组合物、培养基或细胞裂解物用于从生物质产生作为化学原料或发酵原料的单糖、二糖或单糖或二糖的寡聚物。如本文所用，术语“生物质”是指包含多糖基质(例如，纤维素、淀粉等等)的活的或死的生物材料。因此，本发明提供了用于将生物质基质转化为可发酵的糖的方法，所述方法包括使包含本发明的至少一种β-葡糖苷酶多肽的培养基或细胞裂解物与生物质基质在适于产生可发酵的糖的条件下接触。本发明还提供了通过以下方式将生物质基质转化为可发酵的糖的方法：(a)预处理纤维素基质以提高其对水解的敏感性；(b)将步骤(a)的预处理的纤维素基质与包含本发明的至少一种β-葡糖苷酶多肽(和任选的其他纤维素酶和/或其他酶)的组合物、培养基或细胞裂解物在适于产生可发酵的糖的条件下接触。

在本发明的一些实施方案中，生物质包括但不限于纤维素基质，纤维素基质包括但不限于木材、木浆、纸浆、玉米秸秆、玉米纤维、稻、纸和浆加工废物(paper and pulp processing waste)、木本植物或草本植物、水果或蔬菜浆(fruit or vegetable pulp)、酒糟(distillers grain)、草、稻壳、麦秸、棉花、***、亚麻、剑麻、玉米芯、甘蔗渣、柳枝稷及其混合物。在一些实施方案中，使用本领域已知的方法诸如化学、物理和生物学预处理(例如，蒸汽***、制浆、研磨、酸水解、溶剂暴露等等以及其组合) 对生物质进行预处理以提高纤维素对水解的敏感性。在一些实施方案中，生物质包括表达降解木质素和纤维素的木质素酶和/或纤维素酶的转基因植物(见例如，美国专利申请公布第2008/0104724号，其通过引用并入本文)。

在一些实施方案中，β-葡糖苷酶多肽、包含β-葡糖苷酶多肽的组合物、细胞培养基和/或细胞裂解物与生物质或预处理的生物质在以下范围内的温度反应：约25℃至约100℃、约30℃至约90℃、约30℃至约80℃、约40℃至约80℃以及约35℃至约75℃。而且，生物质可与β-葡糖苷酶多肽、包含β-葡糖苷酶多肽的组合物、细胞培养基和/或细胞裂解物在约25℃、在约30℃、在约35℃、在约40℃、在约45℃、在约50℃、在约55℃、在约60℃、在约65℃、在约70℃、在约75℃、在约80℃、在约85℃、在约90℃、在约95℃、或在约100℃的温度反应。除了以上所述的温度以外，适于采用本发明的至少一种β-葡糖苷酶多肽(任选地在组合物、细胞培养基或细胞裂解物中)将生物质基质转化为可发酵的糖的条件包括在以下范围内的pH进行该过程：约pH 3.0至约8.5、约pH 3.5至约8.5、约pH 4.0至约7.5、约pH 4.0至约7.0以及约pH 4.0至约6.5。本领域技术人员理解用于将具体生物质基质转化为可发酵的糖的反应时间可改变，但最佳反应时间可容易地确定。示例性反应时间包括但不限于以下范围内的时间：约1至约240小时、约5至约180小时以及约10至约150小时。例如，孵育时间可以是至少1小时、至少5小时、至少10小时、至少15小时、至少25小时、至少50hr、至少100小时、至少180小时等等(即，用于使用的特定***的任何适宜的孵育时间)。

在一些实施方案中，β-葡糖苷酶与生物质基质或预处理的生物质基质在这些条件下的反应导致大量可溶性糖从基质中释放。例如，在一些实施方案中，与野生型嗜热子囊菌释放的糖相比，至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％或更多的可溶性糖是可用的。在一些实施方案中，制得的可用的可溶性糖的量比相同条件下野生型嗜热子囊菌制得的可用的量大至少2倍、至少3倍、至少4倍、或至少5倍。在一些实施方案中，可溶性糖包括葡萄糖。

在一些实施方案中，由本发明的方法产生的可溶性糖用于产生至少一种醇(例如，乙醇、丁醇等等)。本发明因此提供了产生至少一种醇的方法，其中该方法包括：(a)提供使用本发明的至少一种β-葡糖苷酶多肽在本文所述的方法中产生的可发酵的糖；(b)使该可发酵的糖与发酵微生物接触以产生至少一种醇和/或其他代谢产物；和(c)回收至少一种醇和/或其他代谢产物。

在一些实施方案中，本发明的至少一种β-葡糖苷酶多肽、包含β-葡糖苷酶多肽的组合物、包含β-葡糖苷酶多肽的细胞培养基和/或细胞裂解物用于在存在发酵微生物诸如酵母(例如酵母菌，诸如酿酒酵母；毕赤酵母；等等)或其他本领域熟知的C5或C6发酵微生物(例如，发酵单胞菌、大肠杆菌)来催化生物质基质水解成可发酵的糖，以产生终产物诸如乙醇。在涉及同步糖化和发酵(SSF)工艺的方法中，通过发酵工艺从***中除去可发酵的糖(例如，葡萄糖和/或木糖)。

通过利用本发明的β-葡糖苷酶多肽产生的可溶性糖也在产生其他终产物(例如，丙酮、氨基酸[例如，甘氨酸、赖氨酸等等]，有机酸[例如，乳酸等等]，甘油，二醇[例如，1，3丙二醇、丁二醇等等]，和动物饲料)中具有用途。

本领域技术人员将容易地理解本发明的β-葡糖苷酶多肽组合物也以水溶液或固体浓缩物的形式应用。在一些实施方案中，当采用水溶液时，β-葡糖苷酶浓缩物溶液被稀释以提供预定使用的准确浓度。浓缩物以任何适宜形式提供(例如，本领域公认的形式，包括但不限于液体、乳液、悬浮液、凝胶、糊、颗粒、粉末、附聚物、固体圆盘(solid disk)等等)。在一些实施方案中，取决于组合物的预定用途，如果期望的话另外的材料也与本发明的β-葡糖苷酶组合物一起使用或被包括在本发明的β-葡糖苷酶组合物中，另外的材料包括但不限于石头、浮石、填充剂、溶剂、酶激活物、以及抗再沉积剂等等。

由本发明提供的β-葡糖苷酶多肽和组合物还在食品和饮料工业例如在有效释放单萜烯醇的制酒工艺(见例如，Yanai和Sato，Am.J.Enol.Eitic.，50：231-235[1999]，其通过引用并入本文)和用于制备富含糖基异黄酮的豆腐的工艺(见例如，Mase等人，J.Appl.Glycosci.，51：211-216[2004]，其通过引用并入本文)中具有用途。本发明的β-葡糖苷酶多肽还在改进清洁性能的去污剂组合物中具有用途(见例如，美国专利第7,244,605号和5,648,263号；以及WO 2004/048592，其全部通过引用并入本文)。

结合以下非限制性实例可更好地理解本发明的前述方面和其他方面。在以下实施例中更详细的描述本发明，实施例不旨在以任何方式限定要求专利保护的本发明的范围。

实验

在下面的实验性公开内容中，应用以下缩写：WT和wt(野生型)；ppm(百万分率)；M(摩尔/升)；mM(毫摩尔/升)；μM(微摩尔/升)；nM(纳摩尔/升)；mol(摩尔)；mmol(毫摩尔)；μmol和umol(微摩尔)；nmol(纳摩尔)；gm(克)；mg(毫克)；μg(微克)；pg(皮克)；L(升)；ml和mL(毫升)；μl和uL(微升)；cm(厘米)；mm(毫米)；μm和um(微米)；nm(纳米)；U(单位)；V(伏特)；MW(分子量)；sec(秒)；min(分)；h和hr(小时)；℃(摄氏度)；QS(足量)；ND(未做)；rpm(每分钟转数)；H₂O(水)；dH₂O(去离子水)；(HCl(盐酸)；aa(氨基酸)；bp(碱基对)；kb(千碱基)；kbp(千碱基对)；kD(千道尔顿)；cDNA(拷贝或互补的DNA)；DNA(脱氧核糖核酸)；ssDNA(单链DNA)；dsDNA(双链DNA)；dNTP(脱氧核糖核苷三磷酸)；RNA(核糖核酸)；MgCl₂(氯化镁)；NaCl(氯化钠)；w/v(重量比体积)；v/v(体积比体积)；g(重力)；xg(乘以重力)；OD(光密度)；Vmax(酶催化的反应的最大初始速率)；PAGE(聚丙烯酰胺凝胶电泳)；PBS(磷酸盐缓冲盐水[150mM NaCl，10mM磷酸钠缓冲液，pH 7.2])；PCR(聚合酶链反应)；SDS(十二烷基硫酸钠)；Tris(三(羟甲基)氨基甲烷)；HPLC(高压液相色谱)；RP-HPLC(反相高压液相色谱)；ATCC(美国模式培养物保藏中心，Rockville，Md.)；Gibco/BRL(Gibco/BRL，Grand Island，N.Y.)；Sigma(Sigma Chemical Co.，St.Louis，Mo.)；Gene Oracle(Gene Oracle，Inc.， Mountain View，Calif.)；USBio(United States Biological，Swampscott，MA)；Sartorius(Sartorius Stedim Biotech，Division of Sartorius AG，Goettingen，Germany)；Eppendorf(Eppendorf North America，Westbury，NY)；Phenomenex(Phenomenex，Inc.，Torrance，Calif)；FMC(FMCCorporation，Philadelphia，PA)；Difco(Difco Laboratories，Detroit，Mich.)；Molecular Devices(Molecular Devices，Corp.，Sunnyvale，Calif)；Fluka(Fluka Chemie AG，Buchs，Switzerland)。

实施例1

野生型嗜热子囊菌Bgl1基因获取和表达载体的构建

基于来自合并的酿酒酵母和巴斯德毕赤酵母密码子偏倚性表的密码子选择并排除BamHI、SalI、SfiI、BglI、NgoMIV和SpeI限制酶切位点，使用嗜热子囊菌Bgl1蛋白(“Bgl1 WT”；SEQ ID NO：2)的分泌形式设计合成的核苷酸序列。另外，添加氨基末端的甲硫氨酸残基(“Bgl1 WT^M”；SEQ ID NO：4)。由Gene Oracle合成Bgl1 WT^M编码序列，并且制备了其中Bgl1 WT^M序列与适于在酿酒酵母中分泌的酵母或真菌信号肽连接的表达构建体。通过PCR引物重叠延伸来添加信号肽序列。将Bgl1构建体克隆到pYT72穿梭载体(即，被修饰以使得在酿酒酵母adh2启动子的控制下转录的pBS24Ub；见例如，Sabin等人，BioTechnol.，7：705[1989])。

用表达载体转化酿酒酵母细胞。在包含50μg/ml X-葡糖糖苷(5-溴-4-氯-3-吲哚基-β-D-吡喃葡萄糖苷；Sigma)的琼脂平板上鉴定具有β-葡糖苷酶活性的克隆并且证实来自转化子的序列。

实施例2

β-葡糖苷酶粉末的产生-摇瓶程序

将包含编码Bgl1WT^M的质粒的酿酒酵母的一个菌落接种到包含60g/L葡萄糖、6.7g/L酵母氮源(yeast nitrogen base)、5g/L硫酸铵和2g/L减去尿嘧啶的氨基酸漏失混合物(amino acid drop-out mix)(USBio #D9535)的3ml合成的确定成分培养基中。在250rpm摇动下，使细胞在30℃培养箱中生长过夜(至少16小时)。然后，将1ml的这种培养物稀释到250ml烧瓶中的包含20g/L葡萄糖、6.7g/L酵母氮源、5g/L硫酸铵和2g/L减去尿嘧啶的氨基酸漏失混合物(USBio#D9535)的25ml合成的确定成分培养基中。将这种培养物在30℃孵育72小时，同时以250rpm摇动。通过离心(3000×g，15分钟，5℃)收集细胞。将上清液滗入新试管并使用离心浓缩机(VIVASPIN20；Sartorius)浓缩10倍。用Hong等人描述的方法(Hong等人，Appl.Environ.Microbiol.，73：1331[2007]，其通过引用并入本文)使用pNPG(对硝基苯基-β-D-吡喃葡萄糖苷)作为底物证实WT^M Bgl1的活性。

实施例3：

确定β-葡糖苷酶活性的测定

这个实施例描述了用于确定β-葡糖苷酶的存在或活性的三个测定。

A.5-溴-4-氯-3-吲哚基-β-d-吡喃葡萄糖苷(X-glu)测定

制备了包含合成的确定成分培养基(SD-ura；包括20g/L葡萄糖、6.7g/L酵母氮源、5g/L硫酸铵、2g/L减去尿嘧啶的氨基酸漏失混合物(USBio D9535)、15g/L琼脂和40mg/L 5-溴-4-氯-3-吲哚基-β-d-吡喃葡萄糖苷)的陪替氏平板(petri plate)。将包含具有bgl1基因的质粒的酿酒酵母铺板到这些平板上并且在30℃孵育3天。在平板中观察到的所有菌落变蓝色，指示这些生物体正在产生水解X-glu以释放生色团的活性β-葡糖苷酶。由以空载体转化的酿酒酵母组成的阴性对照产生白色菌落。

B.对硝基苯基葡萄糖苷(pNPG)测定

在100μl的总体积中，将30μl来自实施例2的浓缩上清液添加至在包含25mM乙酸钠的pH 5的溶液中的4mM pNPG(Fluka)。反应在50℃ 摇动30min并且随后添加100μl的2M KCO3以终止反应。用Spectramax190(Molecular Devices)以分光光度法在405nm测量释放的对硝基苯酚，并且使用本领域已知的方法从405nm的吸光度计算释放的对硝基苯酚的量(见例如，Hong等人，Appl.Environ.Microbiol.，73：1331[2007])。

当如实施例2所述产生的野生型(WT^M)酶与pNPG反应时，所得混合物产生的吸光度为4。这是饱和的活性水平的指示。由以空载体转化的酿酒酵母组成的阴性对照在相同反应条件下产生0-0.1的吸光度。

C.纤维二糖测定

使用包含20μl培养物上清液、10g/L纤维二糖(Fluka目录号22150)和25mM乙酸钠的pH 5的100μl体积的反应混合物来确定对底物纤维二糖的活性。反应在60℃孵育适当的时间(1小时到过夜，取决于酶浓度和活性)同时摇动，用等体积的10mM猝灭并充分混合。然后，150μl的反应通过0.4μm滤器(使用滤板)过滤，通过以2000rpm(Eppendorf，离心机型号5810R(15amps))离心2min。通过使用具有保护柱的 Rezex RHM-单糖150*7.8mm(005-0132-KO)HPLC(Phenomenex)的HPLC分析追踪葡萄糖产生和/或纤维二糖消耗。流动相是流速1ml/min的水。柱在50℃的温度下使用，通常的样品注入体积是20μl，并且运行时间是3.8-4min。根据用葡萄糖和纤维二糖作为标准品的在1-73mM范围内的校准曲线定量峰面积。对纤维二糖和葡萄糖观察到的通常的保留时间分别是2.85和3.5min。

实施例4

重组嗜热子囊菌Bgl1的表征

通过在pH 2、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5和8的纤维二糖测定中测量酿酒酵母产生的嗜热子囊菌Bgl1的活性来确定其pH依赖性。用25mM缓冲液(pH 2的磷酸盐、pH范围3-3.5的柠檬酸钠、pH范围4-5.5的乙酸钠、和pH范围6-8的磷酸盐)在50℃用10g/L的纤维二糖进行实验。发现对酶起作用的pH范围在pH 3-8之间。在pH 5测量到最佳活性，与之前的研究一致(见例如，Hong等人，Appl.Microbiol.Biotechnol.，73：1331[2007])。

通过在30℃和95℃之间的温度的纤维二糖测定中测量酿酒酵母产生的嗜热子囊菌Bgl1的活性来确定其温度依赖性。实验在pH 5乙酸盐缓冲液中在10g/L纤维二糖的存在下进行60分钟。酶促活性被测定为被转化为产物的初始纤维二糖的比例。测定对Bgl1野生型酶起作用的温度范围在50-80℃之间。酿酒酵母产生的嗜热子囊菌Bgl1的最适温度是70℃，与之前的研究一致(见例如，Hong等人，Appl.Microbiol.Biotechnol.，73：1331[2007])。

实施例5

鉴定具有改进特性的嗜热子囊菌β-葡糖苷酶多肽变体的高通量测定

使用诱变和定向进化方法获得了产生嗜热子囊菌β-葡糖苷酶多肽变体的细胞的库。如实施例2中所述将个体酵母细胞克隆并使之生长在X-glu平板上。挑出蓝色菌落并如实施例2所述进行培养，但有以下例外。初始生长在250μl体积中进行，并且表达在350μl体积中进行。在表达后，细胞上清液用于测定酶活性。

使用实施例3的纤维二糖测定，筛选并评估上清液相比于野生型嗜热子囊菌Bgl1的改进。如实施例3所述进行这些测定，但有以下例外。用3.3g/L纤维二糖在60℃用20μl酶进行纤维二糖反应。葡萄糖以50g/L终浓度添加到反应中。在使用包含0.125mg/ml牛血清白蛋白(BSA)的pH 5的25mM乙酸钠稀释酶来筛选之前，优化每个测定的反应时间。稀释水平通常在1-4倍之间。

实施例6

工程化嗜热子囊菌β-葡糖苷酶多肽变体的改进的β-葡糖苷酶活性

表6-1和6-2显示了使用实施例3所述的纤维二糖测定，本发明包括的示例性嗜热子囊菌β-葡糖苷酶多肽变体的活性及其将纤维二糖转化为葡萄糖的活性的改进(作为相比于在相似条件下测量的WT^M酶活性的改进倍数(fold improvement))。在这些表中，活性被描述为相比于酶(WT^M；SEQ ID NO：4)的改进倍数(“FI”)。

表6-1和6-2的注释：

“+”表示1.0到1.5的改进倍数(FI)。

“++”表示大于1.5到2.5的FI。

“+++”表示大于2.5的FI。

*残基编号是指SEQ ID NO：4。

**残基编号是指SEQ ID NO：3。

***在再次转化(retransformation)后变体相比于WT^M没有改进。

实施例7

TaB6变体的葡萄糖产生

当以1g/L C1纤维素酶和5g/L TaB6Bgl1变体测试时，TaB6变体显示从纤维素产生葡萄糖(见图1)。用20％纤维素在pH 5在65℃下进行实验48小时，同时以200rpm摇动。通过使用具有保护柱的Rezex RHM-单糖150*7.8mm(005-0132-KO)HPLC(Phenomenex，Inc.，Torrance，CA)的HPLC分析追踪葡萄糖产生和/或纤维二糖消耗。使用的流动相是流速1ml/min的水。柱在50℃的温度下使用，通常的样品注入体积是20μl，并且运行时间是3.8-4min。根据用葡萄糖和纤维二糖作为标准品的在1-73mM范围内的校准曲线定量峰面积。对纤维二糖和葡萄糖观察到的通常的保留时间分别是2.85和3.5min。

尽管已参考本发明的具体实施方案对本发明进行了描述，但本领域技术人员应理解可以做出各种改变并且可以替换等同物而不背离本发明的范围。另外，可以做出许多改变以适应具体情况、材料、物质组成、工艺、一个或多个工艺步骤，以达到由本发明所提供的益处而不背离本发明的范围。所有这些改变旨在处于本文所附权利要求的范围之内。

本文引用的所有出版物和专利文件均通过引用并入本文，如同每篇此类出版物或文件被具体地和单独地指出通过引用并入本文。出版物和专利文件的引用并非旨在指示任何此类文件是相关现有技术，并且其不构成对任何此类文件的内容或日期的任何承认。

Claims

1.一种β-葡糖苷酶变体，其中与SEQIDNO:4相比，所述变体的氨基酸取代组合如下：T151S-Y642N-N651K、M1T-K55R-K101R-T151S-R331K-Y332C-K343R-N356S-S409N-Y642N、M1T-K101R-T151S-K292E-K343R-S409N-Y642N-P740S、M1T-T151S-K343R-S409N-A479V-Y642N-Y680F、L150V-T151S-K343R-S409N-K457R-Y642N-N651K或S87N-T151S-F288Y-Y642N-N651K，并且所述变体具有比氨基酸序列为SEQIDNO:4的β-葡糖苷酶更大的酶活性。

2.一种多核苷酸序列，编码权利要求1给出的所述β-葡糖苷酶变体。

3.一种表达载体，包括至少一种权利要求2所述的多核苷酸序列。

4.一种宿主细胞，包含权利要求3所述的表达载体。

5.一种用于产生至少一种β-葡糖苷酶变体的方法，所述方法包括提供包含权利要求3所述的表达载体的权利要求4所述的宿主细胞，并且在使得所述β-葡糖苷酶变体被表达的条件下培养所述转化的宿主细胞。

6.如权利要求5所述的方法，还包括分离所述β-葡糖苷酶变体的步骤。

7.一种组合物，其包括至少一种权利要求1所述的β-葡糖苷酶变体。

8.如权利要求7所述的组合物，还包括至少一种另外的酶。

9.如权利要求8所述的组合物，其中所述至少一种另外的酶是纤维素酶。

10.一种转化生物质基质以产生至少一种可发酵的糖的方法，所述方法包括提供权利要求1所述的至少一种β-葡糖苷酶变体和生物质基质，并且在使得所述至少一种β-葡糖苷酶变体将所述生物质基质转化为至少一种可发酵的糖的条件下将所述生物质基质暴露于所述至少一种β-葡糖苷酶变体。

11.如权利要求10所述的方法，其中所述至少一种可发酵的糖是葡萄糖。

12.如权利要求10或权利要求11所述的方法，其中在所述生物质基质暴露于所述至少一种β-葡糖苷酶变体之前，所述生物质基质被预处理。